---
title: "오픈AI, 브로드컴과 만든 추론용 AI 칩 ‘할라페뇨’ 공개"
published: 2026-06-24T18:05:01.666Z
canonical: https://jeff.news/article/4328
---
# 오픈AI, 브로드컴과 만든 추론용 AI 칩 ‘할라페뇨’ 공개

오픈AI와 브로드컴이 공동 개발한 AI 추론 특화 반도체 ‘할라페뇨’를 공개했고, 올해 말부터 데이터센터에 배치할 계획이다. 초기 시험에서는 단위 전력당 성능이 최첨단 AI 칩보다 우수하다고 설명했고, 엔비디아 블랙웰·구글 TPU와 대등한 성능이라는 주장도 나왔다.

- 오픈AI가 드디어 자체 AI 반도체를 공개했음. 이름은 ‘할라페뇨’고, 브로드컴과 공동 개발한 추론 특화 칩임
  - 올해 말부터 실제 데이터센터 등에 배치할 계획이라고 밝힘
  - 브로드컴의 호크 탄 CEO와 찰리 카와스 사장이 시제품을 샘 올트먼과 그레그 브록먼에게 직접 전달하는 장면도 공개됨

- 이 칩의 포인트는 “범용 GPU를 조금 손본 것”이 아니라, 챗GPT·코덱스 운영 경험을 바탕으로 처음부터 다시 설계했다는 점임
  - 오픈AI는 자사 모델뿐 아니라 모든 대형언어모델(LLM)과 호환될 수 있는 유연성을 갖췄다고 설명함
  - 기존 AI 칩에서 병목으로 꼽히던 데이터 이동을 줄이고, 연산·메모리·네트워킹 자원을 균형 있게 맞췄다고 함
  - 목표는 이론상 최대 성능에 최대한 가까운 활용도를 내는 것임

> [!IMPORTANT]
> 초기 시험 결과만 놓고 보면 단위 전력(W)당 성능이 현재 최첨단 기술보다 더 좋았다고 양사가 주장함. 브로드컴 CEO는 엔비디아 블랙웰, 구글 TPU와 대등한 성능이라고까지 말했음.

- 개발 속도도 꽤 공격적으로 포장하고 있음
  - 초기 설계부터 파운드리에 넘기는 테이프아웃까지 9개월밖에 걸리지 않았다고 함
  - 양사는 이를 사상 가장 빠른 주문형반도체(ASIC) 개발 주기라고 강조함
  - 설계와 최적화 과정에 오픈AI의 AI 모델을 활용한 덕분이라는 설명도 붙었음

- 생산과 공급망 쪽도 한국 개발자 입장에선 눈에 들어오는 대목이 있음
  - 칩 양산은 대만 TSMC가 맡음
  - 삼성전자와 SK하이닉스는 브로드컴에 메모리 칩을 공급하고 있다고 호크 탄 CEO가 언급함
  - AI 반도체 경쟁이 모델 회사, 파운드리, 메모리 업체까지 한 덩어리로 묶이는 그림임

- 로드맵도 이미 잡혀 있음
  - 다음 버전 칩은 2028년에 내놓고, 이후에는 매년 새 칩을 선보일 계획이라고 함
  - 이번 할라페뇨는 추론에 초점을 맞췄지만, 향후 칩은 다른 AI 영역을 겨냥할 수도 있다고 브로드컴이 설명함

- 이 뉴스가 중요한 이유는 오픈AI가 엔비디아의 최대 단일 고객으로 알려져 있기 때문임
  - 지금까지 AI 서비스 회사들은 엔비디아 GPU를 대량 구매해서 모델을 돌리는 구조였음
  - 그런데 구글은 TPU가 있고, 오픈AI도 자체 칩을 냈고, 앤트로픽도 칩 개발을 타진 중이라는 흐름이 나옴
  - 결국 모델 회사들이 “남이 만든 가속기에 맞춰 모델을 돌리는 단계”에서 “내 모델과 서비스 비용에 맞춰 하드웨어까지 설계하는 단계”로 넘어가는 중임

- 시장도 바로 반응했음
  - 보도 시점 기준 엔비디아 주가는 미 동부시간 오후 1시 50분쯤 전일 종가 대비 1% 이상 하락해 장중 197달러대를 기록함
  - 단기 주가보다 더 중요한 건, AI 인프라 경쟁의 중심이 GPU 구매량에서 전력 효율·메모리·네트워크 설계까지 확장되고 있다는 점임

---

## 기술 맥락

- 오픈AI가 추론용 칩을 직접 만든 이유는 모델 성능보다 운영 비용이 점점 더 큰 문제가 되기 때문이에요. 챗GPT 같은 서비스는 사용자가 질문할 때마다 추론 연산이 발생하고, 이 비용은 전력·메모리 대역폭·네트워크 병목에 그대로 묶이거든요.

- 할라페뇨가 ASIC이라는 점도 중요해요. 범용 GPU는 다양한 워크로드를 처리할 수 있지만, 특정 대형언어모델 추론 패턴만 놓고 보면 불필요한 범용성이 비용으로 남을 수 있어요. 그래서 오픈AI는 자기 서비스에서 실제로 많이 나오는 연산 흐름에 맞춰 칩을 설계하려는 거예요.

- 기사에서 데이터 이동을 줄였다는 말은 꽤 큰 의미가 있어요. AI 추론은 계산만 빠르다고 끝나는 게 아니라, 메모리에서 데이터를 가져오고 여러 칩 사이에서 주고받는 시간이 전체 성능을 잡아먹는 경우가 많거든요. 연산·메모리·네트워킹 균형을 맞췄다는 건 이 병목을 시스템 레벨에서 보겠다는 뜻이에요.

- 한국 기업 이름이 등장하는 이유도 여기 있어요. TSMC가 제조를 맡고 삼성전자와 SK하이닉스가 메모리를 공급한다는 건, AI 칩 경쟁이 모델 회사 혼자만의 싸움이 아니라 반도체 공급망 전체의 경쟁이라는 얘기예요.

## 핵심 포인트

- 오픈AI가 챗GPT·코덱스 운영 경험을 바탕으로 자체 추론용 ASIC을 설계함
- 초기 설계부터 테이프아웃까지 9개월이 걸렸고, 양사는 매우 빠른 개발 주기라고 강조함
- TSMC가 양산하고 삼성전자·SK하이닉스가 브로드컴에 메모리 칩을 공급 중임
- 오픈AI, 구글, 앤트로픽 모두 엔비디아 의존도를 줄이는 흐름에 올라타고 있음

## 인사이트

AI 모델 회사들이 이제 모델만 만드는 게 아니라 전력, 메모리, 네트워크 병목까지 자기 워크로드에 맞춰 직접 최적화하려는 단계로 들어갔음. 추론 비용이 서비스 마진을 좌우하는 시대라 자체 칩은 그냥 멋진 실험이 아니라 생존 전략에 가까움.