본문으로 건너뛰기
피드

오픈AI, 브로드컴과 만든 추론용 AI 칩 ‘할라페뇨’ 공개

ai-ml 약 5분
vote
0
댓글
북마크

오픈AI와 브로드컴이 공동 개발한 AI 추론 특화 반도체 ‘할라페뇨’를 공개했고, 올해 말부터 데이터센터에 배치할 계획이다. 초기 시험에서는 단위 전력당 성능이 최첨단 AI 칩보다 우수하다고 설명했고, 엔비디아 블랙웰·구글 TPU와 대등한 성능이라는 주장도 나왔다.

  • 1

    오픈AI가 챗GPT·코덱스 운영 경험을 바탕으로 자체 추론용 ASIC을 설계함

  • 2

    초기 설계부터 테이프아웃까지 9개월이 걸렸고, 양사는 매우 빠른 개발 주기라고 강조함

  • 3

    TSMC가 양산하고 삼성전자·SK하이닉스가 브로드컴에 메모리 칩을 공급 중임

  • 4

    오픈AI, 구글, 앤트로픽 모두 엔비디아 의존도를 줄이는 흐름에 올라타고 있음

  • 오픈AI가 드디어 자체 AI 반도체를 공개했음. 이름은 ‘할라페뇨’고, 브로드컴과 공동 개발한 추론 특화 칩임

    • 올해 말부터 실제 데이터센터 등에 배치할 계획이라고 밝힘
    • 브로드컴의 호크 탄 CEO와 찰리 카와스 사장이 시제품을 샘 올트먼과 그레그 브록먼에게 직접 전달하는 장면도 공개됨
  • 이 칩의 포인트는 “범용 GPU를 조금 손본 것”이 아니라, 챗GPT·코덱스 운영 경험을 바탕으로 처음부터 다시 설계했다는 점임

    • 오픈AI는 자사 모델뿐 아니라 모든 대형언어모델(LLM)과 호환될 수 있는 유연성을 갖췄다고 설명함
    • 기존 AI 칩에서 병목으로 꼽히던 데이터 이동을 줄이고, 연산·메모리·네트워킹 자원을 균형 있게 맞췄다고 함
    • 목표는 이론상 최대 성능에 최대한 가까운 활용도를 내는 것임

중요

> 초기 시험 결과만 놓고 보면 단위 전력(W)당 성능이 현재 최첨단 기술보다 더 좋았다고 양사가 주장함. 브로드컴 CEO는 엔비디아 블랙웰, 구글 TPU와 대등한 성능이라고까지 말했음.

  • 개발 속도도 꽤 공격적으로 포장하고 있음

    • 초기 설계부터 파운드리에 넘기는 테이프아웃까지 9개월밖에 걸리지 않았다고 함
    • 양사는 이를 사상 가장 빠른 주문형반도체(ASIC) 개발 주기라고 강조함
    • 설계와 최적화 과정에 오픈AI의 AI 모델을 활용한 덕분이라는 설명도 붙었음
  • 생산과 공급망 쪽도 한국 개발자 입장에선 눈에 들어오는 대목이 있음

    • 칩 양산은 대만 TSMC가 맡음
    • 삼성전자와 SK하이닉스는 브로드컴에 메모리 칩을 공급하고 있다고 호크 탄 CEO가 언급함
    • AI 반도체 경쟁이 모델 회사, 파운드리, 메모리 업체까지 한 덩어리로 묶이는 그림임
  • 로드맵도 이미 잡혀 있음

    • 다음 버전 칩은 2028년에 내놓고, 이후에는 매년 새 칩을 선보일 계획이라고 함
    • 이번 할라페뇨는 추론에 초점을 맞췄지만, 향후 칩은 다른 AI 영역을 겨냥할 수도 있다고 브로드컴이 설명함
  • 이 뉴스가 중요한 이유는 오픈AI가 엔비디아의 최대 단일 고객으로 알려져 있기 때문임

    • 지금까지 AI 서비스 회사들은 엔비디아 GPU를 대량 구매해서 모델을 돌리는 구조였음
    • 그런데 구글은 TPU가 있고, 오픈AI도 자체 칩을 냈고, 앤트로픽도 칩 개발을 타진 중이라는 흐름이 나옴
    • 결국 모델 회사들이 “남이 만든 가속기에 맞춰 모델을 돌리는 단계”에서 “내 모델과 서비스 비용에 맞춰 하드웨어까지 설계하는 단계”로 넘어가는 중임
  • 시장도 바로 반응했음

    • 보도 시점 기준 엔비디아 주가는 미 동부시간 오후 1시 50분쯤 전일 종가 대비 1% 이상 하락해 장중 197달러대를 기록함
    • 단기 주가보다 더 중요한 건, AI 인프라 경쟁의 중심이 GPU 구매량에서 전력 효율·메모리·네트워크 설계까지 확장되고 있다는 점임

기술 맥락

  • 오픈AI가 추론용 칩을 직접 만든 이유는 모델 성능보다 운영 비용이 점점 더 큰 문제가 되기 때문이에요. 챗GPT 같은 서비스는 사용자가 질문할 때마다 추론 연산이 발생하고, 이 비용은 전력·메모리 대역폭·네트워크 병목에 그대로 묶이거든요.

  • 할라페뇨가 ASIC이라는 점도 중요해요. 범용 GPU는 다양한 워크로드를 처리할 수 있지만, 특정 대형언어모델 추론 패턴만 놓고 보면 불필요한 범용성이 비용으로 남을 수 있어요. 그래서 오픈AI는 자기 서비스에서 실제로 많이 나오는 연산 흐름에 맞춰 칩을 설계하려는 거예요.

  • 기사에서 데이터 이동을 줄였다는 말은 꽤 큰 의미가 있어요. AI 추론은 계산만 빠르다고 끝나는 게 아니라, 메모리에서 데이터를 가져오고 여러 칩 사이에서 주고받는 시간이 전체 성능을 잡아먹는 경우가 많거든요. 연산·메모리·네트워킹 균형을 맞췄다는 건 이 병목을 시스템 레벨에서 보겠다는 뜻이에요.

  • 한국 기업 이름이 등장하는 이유도 여기 있어요. TSMC가 제조를 맡고 삼성전자와 SK하이닉스가 메모리를 공급한다는 건, AI 칩 경쟁이 모델 회사 혼자만의 싸움이 아니라 반도체 공급망 전체의 경쟁이라는 얘기예요.

AI 모델 회사들이 이제 모델만 만드는 게 아니라 전력, 메모리, 네트워크 병목까지 자기 워크로드에 맞춰 직접 최적화하려는 단계로 들어갔음. 추론 비용이 서비스 마진을 좌우하는 시대라 자체 칩은 그냥 멋진 실험이 아니라 생존 전략에 가까움.

댓글

댓글

댓글을 불러오는 중...

ai-ml

가트너 “네오클라우드, 2030년 AI 클라우드 시장 20% 먹는다”

생성형 AI 확산으로 GPU 기반 고성능 컴퓨팅 수요가 폭증하면서 AI 전용 클라우드 사업자인 네오클라우드가 커지고 있다는 분석이 나왔어. 가트너는 2030년 약 2,670억 달러 규모 AI 클라우드 시장에서 네오클라우드가 20%를 차지할 수 있다고 봤어. GPU 확보, 가격 경쟁력, 데이터 주권 대응이 핵심 포인트야.

ai-ml

스페이스X, 오픈소스 AI 스타트업에 초대형 컴퓨팅 파워 판다

리플렉션 AI가 스페이스X의 대형 데이터센터 인프라를 쓰기 위해 2029년까지 최대 63억달러 규모 계약을 맺었다는 내용이다. 월 1억5000만달러를 내고 엔비디아 GB300 기반 컴퓨팅 자원을 확보하는 구조이며, 스페이스X는 남는 AI 인프라를 외부 고객에게 파는 플랫폼 사업으로 확장하려는 흐름을 보인다. 오픈소스 AI 모델을 내세우는 리플렉션 AI가 정부·안보 시장에서 빠르게 커지고 있다는 점도 포인트다.

ai-ml

AI가 청소년의 ‘생각 훈련’을 건너뛰게 만든다는 경고

이 글은 생성형 AI가 청소년과 주니어에게 편리한 도구를 넘어 사고력 발달을 약화시킬 수 있다는 우려를 다뤄. 핵심은 AI 사용 자체가 문제라기보다, AI가 단일한 관계와 정보 통로가 되고 글쓰기·판단·고민의 과정을 대신해버릴 때 인지 훈련 기회가 사라진다는 점이야.

ai-ml

성남시, AI로 고독사 위험과 고령자 주차 문제를 같이 실증한다

성남시니어산업혁신센터가 AI 돌봄 자동화 플랫폼과 AI 스마트 주차관리 시스템의 실증기관으로 선정됐어. 각각 14억2500만 원, 30억 원 규모 사업이고, 고령자 돌봄과 교통약자 주차 편의라는 생활밀착형 문제를 AI로 풀어보겠다는 내용이야.

ai-ml

S&P500 낙관론 뒤에 숨어 있는 AI 쏠림 리스크

월가 일부 투자은행이 S&P500 연말 목표치를 7800선까지 올렸지만, 기사 핵심은 ‘AI가 시장 전체를 끌어올리는 것처럼 보이는 착시’야. 실제로는 단 41개 종목이 S&P500 시가총액의 절반가량을 차지하고 있고, 빅테크의 설비투자가 실제 수익으로 이어지는지가 하반기 관전 포인트로 제시돼.