---
title: "OpenAI, Nvidia 대신 Cerebras 칩으로 초고속 코딩 모델 GPT-5.3-Codex-Spark 출시"
published: 2026-02-12T23:37:31.000Z
canonical: https://jeff.news/article/722
---
# OpenAI, Nvidia 대신 Cerebras 칩으로 초고속 코딩 모델 GPT-5.3-Codex-Spark 출시

OpenAI가 Cerebras Wafer Scale Engine 3 위에서 구동되는 GPT-5.3-Codex-Spark를 출시, 초당 1,000+ 토큰으로 전작 대비 15배 빠른 코딩 특화 모델이며 Nvidia 의존도 탈피 전략의 첫 결실임

- OpenAI가 비Nvidia 하드웨어에서 돌아가는 최초의 프로덕션 모델 GPT-5.3-Codex-Spark를 출시함. Cerebras의 Wafer Scale Engine 3(저녁 접시 크기 칩) 위에서 구동됨
- **초당 1,000+ 토큰** 생성으로 전작 대비 약 15배 빠름. 참고로 Anthropic Claude Opus 4.6 fast 모드는 ~170 tok/s(일반 모드 68.2 tok/s의 2.5배)이지만 더 크고 범용적인 모델임
- ChatGPT Pro($200/월) 구독자 대상으로 Codex 앱, CLI, VS Code 확장을 통해 제공. 128K 토큰 컨텍스트 윈도우, 텍스트 전용

## 속도 vs 정확도 트레이드오프

- Spark는 속도에 최적화된 코딩 특화 모델로, 풀 GPT-5.3의 범용 능력과는 다른 포지셔닝
- SWE-Bench Pro와 Terminal-Bench 2.0에서 이전 GPT-5.1-Codex-mini를 능가한다고 주장하나 독립 검증은 없음
- 이전 Codex는 속도가 약점이었음 — Ars Technica 테스트에서 지뢰찾기 만들 때 Claude Code 대비 2배 오래 걸렸음

## Cerebras 칩의 맥락

- Nvidia 기반 OpenAI 최고 속도: GPT-4o ~147 tok/s, o3-mini ~167 tok/s
- Cerebras는 Llama 3.1 70B에서 2,100 tok/s, gpt-oss-120B에서 3,000 tok/s를 기록한 바 있음
- Codex-Spark가 1,000 tok/s에 "그친" 것은 모델 크기와 복잡도 때문으로 추정됨

## Nvidia 탈피 전략

- OpenAI는 지난 1년간 체계적으로 Nvidia 의존도를 낮춰옴: AMD 딜(2025.10), Amazon $38B 클라우드 계약(2025.11), TSMC 통한 자체 칩 설계
- 당초 Nvidia와의 $100B 인프라 딜이 무산되고 $20B로 축소됨 — Reuters에 따르면 OpenAI가 Nvidia 칩의 추론 속도에 불만을 가졌다고 함
- 코딩 에이전트 경쟁 과열: Sam Altman이 Google/Anthropic 경쟁 압박에 대한 "code red" 메모를 발행한 후 GPT-5.2(12월) → GPT-5.3-Codex(며칠 전) → Spark(지금)까지 빠르게 이터레이션 중

## 핵심 포인트

- GPT-5.3-Codex-Spark: 비Nvidia 하드웨어(Cerebras) 최초 프로덕션 모델, 1,000+ tok/s
- 속도 특화 코딩 모델로 SWE-Bench Pro에서 GPT-5.1-Codex-mini 능가 (독립 검증 없음)
- OpenAI의 Nvidia 탈피: AMD 딜, Amazon $38B 계약, TSMC 자체 칩, Nvidia $100B→$20B 축소
- 코딩 에이전트 경쟁 과열로 GPT-5.2→5.3-Codex→Spark까지 수주 간격으로 빠른 이터레이션

## 인사이트

OpenAI가 추론 속도를 위해 Nvidia를 우회한 것은 단순 하드웨어 다변화가 아니라, 코딩 에이전트 경쟁에서 레이턴시가 핵심 차별점이 되었다는 시장 인식의 반영임