본문으로 건너뛰기
피드

딥러닝용 미친 사양 컴퓨터 'Tinybox' - 최대 1 엑사플롭 지원에 가격은 100억?

ai-ml 약 6분
vote
0
댓글
북마크

tinygrad 팀이 만든 딥러닝 전용 컴퓨터 'Tinybox'가 이제 실제로 판매 중임. red($12,000)부터 green($65,000), 그리고 2027년 출시 예정인 초고사양 'exabox'(~$10M)까지 라인업 구성. 근데 exabox 스펙이 진짜 레전드 수준ㅋㅋ

  • 1

    tinygrad는 3가지 OpType(ElementwiseOps, ReduceOps, MovementOps)으로 모든 신경망을 단순화하는 프레임워크

  • 2

    Tinybox 라인업: red($12K), green($65K), exabox(~$10M/2027), red·green은 현재 재고 있음

  • 3

    exabox = GPU 720개 + ~1 EXAFLOP + 9톤 무게 + 600kW 전력 소비, 단일 GPU처럼 동작하는 괴물 머신

  • tinygrad: 세상에서 제일 빠르게 성장 중인 신경망 프레임워크, 복잡한 네트워크를 단 3가지 OpType으로 분해
  • Tinybox 라인업: red v2($12,000) / green v2 Blackwell($65,000) / exabox(~$10M, 2027년 출시 예정)
  • exabox 스펙이 개미쳤음: GPU 720개, ~1 엑사플롭(EXAFLOP), GPU RAM 25,920 GB, 무게 20,000 파운드(약 9톤)ㄷㄷ
  • tinygrad 팀 채용 중: 풀타임 소프트웨어 엔지니어 + 운영/하드웨어 직군, 단 tinygrad 기여 없으면 지원 불가
  • 모든 제품은 Ubuntu 24.04 기반, GPU들 풀 패브릭 연결로 단일 GPU처럼 동작

tinygrad 프레임워크 소개

tinygrad는 tiny corp이 개발·유지보수하는 신경망 프레임워크로, 현재 가장 빠르게 성장 중인 프레임워크임. 핵심 철학은 극단적인 단순함으로, 아무리 복잡한 네트워크도 딱 3가지 연산 타입으로 분해함.

  • ElementwiseOps: UnaryOps, BinaryOps, TernaryOps — 1~3개 텐서에 원소별 연산 적용 (예: SQRT, LOG2, ADD, MUL, WHERE)
  • ReduceOps: 텐서 하나를 받아서 더 작은 텐서를 반환 (예: SUM, MAX)
  • MovementOps: 데이터를 복사 없이 가상으로 이동시키는 연산 (예: RESHAPE, PERMUTE, EXPAND)

"CONV이나 MATMUL은 어디 있냐고?" → 코드 읽으면 알 수 있다고 함ㅋㅋ 직접 찾아보는 맛이 있는 프레임워크

Tinybox 제품 라인업

🔴 tinybox red v2 — $12,000 (재고 있음)

항목 스펙
FP16 성능 778 TFLOPS
GPU 4x AMD 9070XT
GPU RAM 64 GB / 2560 GB/s
CPU 32코어 AMD EPYC
시스템 RAM 128 GB
스토리지 2 TB NVMe
소비전력 1600W (100~240V)
소음 < 50 dB (조용한 편)
크기 12U 랙 or 스탠드얼론

🟢 tinybox green v2 Blackwell — $65,000 (재고 있음)

항목 스펙
FP16 성능 3086 TFLOPS
GPU 4x RTX PRO 6000 Blackwell
GPU RAM 384 GB / 7168 GB/s
CPU 32코어 AMD GENOA
시스템 RAM 192 GB
스토리지 4 TB RAID + 1 TB 부트
소비전력 2x 1600W
연결성 PCIe 5.0 x16 풀 패브릭

⚡ exabox — ~$10,000,000 (2027년 출시 예정)

진짜 이건 스펙이 레전드임:

항목 스펙
FP16 성능 ~1 EXAFLOP
GPU 720x RDNA5 AT0 XL
GPU RAM 25,920 GB / 1244 TB/s
CPU 120x 32코어 AMD GENOA
시스템 RAM 23,040 GB / 55.2 TB/s
스토리지 480 TB RAID / 7.1 TB/s
네트워킹 53.2 TB/s 스케일아웃 (400 GbE)
전력 600 kW (200~240V)
크기 20x8x8.5 ft, 20,000 lbs (약 9톤)
설치 방식 콘크리트 슬래브 위에 놓는 거임

exabox는 단일 GPU처럼 동작하는 게 포인트. 드라이버 수준에서 720개 GPU가 하나처럼 보임.

채용 중

  • 풀타임 소프트웨어 엔지니어 + 매우 뛰어난 인턴
  • 운영 및 하드웨어 직군
  • ⚠️ 단, tinygrad에 기여 이력 없으면 지원 자체가 안 됨
  • 바운티 페이지에서 내 적합도를 미리 검증할 수 있고, 바운티 수행하면 돈도 줌

tinygrad가 프레임워크에서 하드웨어까지 수직 통합을 시도하는 게 ㄹㅇ 흥미로움. exabox가 '단일 GPU처럼 동작'한다는 추상화 철학이 tinygrad의 단순함 철학이랑 딱 맞아떨어지는 느낌이라 갓갓이긴 한데... $10M짜리 제품을 2027년에 제대로 내놓을 수 있을지가 관건임.

댓글

댓글

댓글을 불러오는 중...

ai-ml

GLM-5.2, 744B 오픈 모델을 로컬에서 돌리는 법

Z.ai의 새 오픈 모델 GLM-5.2를 Unsloth Dynamic GGUF로 로컬 실행할 수 있게 됐다는 가이드다. 744B 파라미터, 40B 활성 파라미터, 100만 토큰 컨텍스트를 가진 모델을 1비트·2비트 양자화로 줄여 Mac이나 대용량 RAM 장비에서 돌리는 방법과 성능 손실 해석을 다룬다.

ai-ml

삼성SDS, 공공 AI 박람회서 패브릭스·브리티웍스·AI 데이터센터 전면 배치

삼성SDS가 2026 공공 AI 박람회에서 공공 행정용 AI 에이전트, 모바일 협업 솔루션, AI 클라우드 인프라를 함께 선보였다. 국민 민원 요약·분류, 조달법령 해석, 정부24 AI 검색 같은 사례를 통해 공공 부문 AI 전환 시장을 정조준했다.

ai-ml

카페24는 120개 모델 라우터, 델은 랙당 GPU 144개 서버…국내 AI 인프라 뉴스 몰아보기

카페24가 120여 개 AI 모델을 단일 API로 묶는 LLM 라우터를 내놨고, 델은 엔비디아 베라 루빈 NVL4 기반 슈퍼컴 서버 XE8812를 공개했다. 오픈AI의 기업용 AI는 삼성전자와 서울대 도입 사례로 국내 확산 흐름이 뚜렷해졌고, 신세계I&C는 게임 IP 콘솔 패키지 출시를 예고했다.

ai-ml

브릭섬, 1MW급 NPU 추론 클라우드 ‘네오클라우드’ 하반기 오픈 추진

브릭섬이 NPU 기반 LLM 추론 전용 클라우드 ‘네오클라우드’를 올해 하반기 공식 오픈하겠다고 밝혔다. 1MW 규모로 시작해 6MW, 20MW까지 키우고, 토큰 API와 베어메탈 임대 두 가지 방식으로 제공한다.

ai-ml

스페이스X, 리플렉션 AI에 9.7조원 규모 AI 연산 자원 판다

스페이스X가 오픈소스 AI 스타트업 리플렉션 AI와 최대 63억달러 규모의 GPU 연산 계약을 맺었다. 리플렉션 AI는 2026년 7월부터 2029년까지 매달 1억5000만달러를 내고 엔비디아 GB300 기반 연산 자원을 쓰게 된다. AI 경쟁에서 모델만큼이나 GPU 접근권과 데이터센터 인프라가 전략 자산이 됐다는 신호다.