노트북에서 1시간 안에 GPT를 처음부터 학습해보는 워크숍
이 저장소는 파이토치로 GPT 학습 파이프라인을 직접 구현하는 실습형 워크숍이다. 나노지피티보다 작게 줄인 약 1천만 파라미터 모델을 셰익스피어 데이터로 학습해, 맥북 같은 개인 노트북에서도 1시간 안에 돌아가도록 설계했다. 토크나이저, 트랜스포머, 학습 루프, 텍스트 생성까지 전부 직접 작성하는 게 핵심이다.
- 1
약 1천만 파라미터 GPT 모델을 노트북에서 45분 안팎으로 학습하는 구성
- 2
문자 단위 토크나이저부터 셀프 어텐션, 학습 루프, 샘플링까지 직접 구현
- 3
애플 실리콘, 엔비디아 그래픽카드, 중앙처리장치, 구글 코랩에서 실행 가능
- 4
셰익스피어 약 1메가바이트 데이터에는 5만 개 어휘의 바이트 페어 인코딩보다 문자 단위 토큰화가 더 적합하다고 설명
- 5
작은 모델은 50만 파라미터 5분, 기본 모델은 1천만 파라미터 45분 수준으로 제시
대규모 언어 모델을 제품에서만 만지면 구조가 계속 블랙박스로 남는다. 1천만 파라미터짜리 장난감 모델이라도 토크나이저부터 샘플링까지 직접 써보면, 추론 최적화나 프롬프트 엔지니어링을 볼 때 감이 훨씬 좋아진다.
관련 기사
ERP 갈아엎지 않고 재고 정확도 올리는 AI 재고 관리 플랫폼 출시
클라우드 인벤토리가 기존 ERP와 창고 현장 사이를 연결하는 AI 네이티브 재고 관리 플랫폼을 출시했어. 전체 WMS를 새로 도입하지 않고도 실시간 검증, 모바일 작업, 바코드 기반 피킹·패킹·배송, AI 웨이브 관리와 이미지 분석을 붙이는 게 핵심이야.
솔라나 재단·구글클라우드, AI 봇용 결제 시스템 ‘Pay.sh’ 개발
솔라나 재단이 구글클라우드와 함께 AI 에이전트가 API를 찾고, 접근하고, 결제까지 처리할 수 있는 결제 시스템 ‘Pay.sh’를 개발했어. 계정 생성이나 구독 없이 솔라나 기반 스테이블코인으로 결제하는 구조고, 코인베이스의 개방형 AI 결제 표준 x402 프로토콜을 게이트웨이로 쓴다는 점이 핵심이야.
AI 슈퍼사이클론 확산, 80조 달러 시장 얘기까지 나왔다
AI 산업이 모델 개발 단계를 넘어 데이터센터, 반도체, 네트워크까지 깔리는 거대한 인프라 구축 국면으로 들어갔다는 투자 관점의 분석이 나왔다. 일부에서는 2030년 시장 규모가 80조 달러까지 갈 수 있다는 과감한 전망도 나오지만, 이미 주가에 기대가 많이 반영됐고 마케팅성 과장이 섞였을 가능성도 크다.
오픈AI 공동창업자 지분 44조 원 공개, 머스크 소송이 지배구조 싸움으로 번짐
일론 머스크와 오픈AI의 소송에서 그레그 브록먼 사장이 약 300억 달러, 우리 돈 44조 원대 지분 가치를 보유했다는 사실이 공개됐다. 머스크 측은 비영리로 출발한 오픈AI가 사적 이익을 추구했다며 지분 환원을 압박했고, 오픈AI 측은 머스크의 소송이 경쟁사와 경영진을 공격하려는 의도라고 맞섰다.
제약사 AI, 신약 개발에서 병원 기록·광고 제작까지 번지는 중
국내 제약사들이 AI를 후보물질 발굴뿐 아니라 병원 업무 자동화, 스마트병원 솔루션, 일반의약품 광고 제작까지 확장하고 있다. 대웅제약은 AI 의무기록 솔루션을 병·의원에 공급하고, HK이노엔은 AI 기반 신약 설계로 비만치료제 후보물질을 찾으며, 동아제약은 생성형 AI 광고를 공개했다.
댓글
댓글
댓글을 불러오는 중...