본문으로 건너뛰기
피드

그록, 6억5천만 달러 조달하고 ‘AI 추론 클라우드’ 운영사로 피벗

ai-ml 약 7분
vote
0
댓글
북마크

그록이 6억5천만 달러 규모의 신규 성장 자본을 유치하고 AI 추론 클라우드 운영에 회사를 집중하겠다고 밝혔음. 자체 칩 기술은 엔비디아에 넘어가고, 그록은 엔비디아 LPX 시스템까지 활용해 13개 데이터센터를 2027년 말까지 200MW 규모로 확장할 계획임.

  • 1

    그록은 학습보다 추론 시장이 더 커질 것으로 보고 추론 전용 클라우드에 집중함

  • 2

    현재 13개 데이터센터에서 500만 명 넘는 개발자에게 매주 수조 개 토큰을 처리해주고 있음

  • 3

    확보한 6억5천만 달러는 최신 추론 기술과 엔비디아 LPX 시스템으로 데이터센터를 확장하는 데 쓰임

AI 인프라의 전장이 학습에서 추론으로 이동 중

  • 그록은 AI 시장의 무게중심이 학습(training)에서 추론(inference)으로 빠르게 옮겨가고 있다고 봄

    • 모델을 만드는 학습보다, 이미 만들어진 모델을 실제 서비스에서 계속 돌리는 추론이 훨씬 큰 시장이라는 판단임
    • 업계에서는 추론이 학습보다 15~20배 많은 컴퓨팅을 필요로 할 것으로 본다고 기사에서 설명함
  • 문제는 지금의 AI 클라우드 대부분이 학습 중심으로 설계됐다는 점임

    • 대규모 학습 클러스터와 실시간 추론 서비스는 요구사항이 다름
    • 추론은 지연 시간, 비용, 토큰 처리량, 지역별 배치 같은 운영 요소가 훨씬 민감함
    • 그래서 ‘추론 전용 클라우드’ 시장에 아직 확실한 1등이 없다는 게 그록의 기회임

중요

> 기사에서 가장 중요한 숫자는 추론 컴퓨팅 수요가 학습보다 15~20배 커질 수 있다는 전망임. 이게 맞다면 AI 인프라 경쟁의 중심은 모델 학습 클러스터가 아니라 상시 추론 운영으로 옮겨감.

그록은 칩 회사에서 추론 클라우드 회사로 방향을 틀었음

  • 그록은 2016년 구글의 AI 칩 TPU 개발에 참여한 엔지니어가 세운 회사임

    • 추론에 특화한 전용 칩 LPU(Language Processing Unit)를 선보였음
    • 이를 클라우드로 제공하는 그록클라우드(GroqCloud)를 운영해왔음
  • 현재 운영 규모도 꽤 큼

    • 북미, 유럽, 중동, 아시아태평양에 13개 데이터센터를 두고 있음
    • 500만 명이 넘는 개발자에게 매주 수조 개의 토큰을 처리해준다고 밝힘
  • 진짜 반전은 엔비디아와의 거래임

    • 기사에 따르면 2025년 12월 엔비디아가 그록의 자산을 약 200억 달러에 사들이고 기술을 비독점으로 라이선스하기로 했음
    • 엔비디아 역사상 최대 규모의 거래였다고 소개됨
    • 엔비디아는 올해 GTC에서 그록의 추론 기술을 담은 차세대 LPX 플랫폼을 공개함
  • 이 거래 이후 그록의 정체성은 더 선명해짐

    • 칩 기술을 사실상 엔비디아에 넘긴 뒤, 그록은 엔비디아 LPX까지 활용해 추론 클라우드 운영에 집중하기로 함
    • 하드웨어를 직접 파는 회사라기보다, 추론 인프라를 굴리는 클라우드 사업자로 재정렬한 셈임

6억5천만 달러는 데이터센터 확장에 들어감

  • 그록은 신규 성장 자본 6억5천만 달러를 유치했다고 발표함

    • 라운드는 기존 투자자이자 이사회에 참여한 디스럽티브와 인피니텀이 주도함
    • 재투자를 선택한 기존 투자자들도 참여함
    • 이번 라운드의 기업가치는 공개하지 않았음
  • 직전 라운드와 비교하면 덩치가 이미 꽤 컸음

    • 지난해 9월에는 7억5천만 달러를 유치했음
    • 당시 기업가치는 69억 달러였음
  • 새로 확보한 자금의 용도는 명확함

    • 기존 13개 데이터센터를 그록의 최신 추론 기술과 엔비디아 LPX 시스템으로 채우는 데 투입함
    • 2027년 말까지 용량을 200MW 규모로 키울 계획임

ℹ️참고

> 200MW는 단순 서버 증설 수준이 아니라 전력 확보와 데이터센터 운영 능력이 같이 필요한 규모임. 추론 클라우드 경쟁이 결국 전력·입지·칩 공급망 싸움으로 이어지는 이유임.

경쟁자도 이미 줄 서 있음

  • 추론 전용 클라우드 시장을 노리는 회사는 빠르게 늘고 있음

    • 베이스텐은 요청을 가장 적합한 모델로 라우팅해 추론 비용을 낮추는 플랫폼을 내세움
    • 최근 130억 달러 가치에 15억 달러 조달을 추진 중이라고 기사에서 언급됨
  • 서버리스 추론 쪽도 커지고 있음

    • 모달랩스는 서버리스 방식으로 46억5천만 달러 가치에 3억5천5백만 달러를 유치함
    • ARR은 3억 달러를 넘겼다고 함
  • 칩 기반 경쟁도 계속됨

    • 세레브라스는 그록처럼 추론 전용 칩을 만드는 회사로 언급됨
    • 상장으로 55억 달러를 조달했고, 상장 첫날 주가가 두 배로 뛰었다고 함
    • AMD 칩을 앞세운 텐서웨이브도 3억5천만 달러 시리즈B로 유니콘이 됨
  • 신생 주자도 들어오는 중임

    • 제너럴 컴퓨트는 ‘추론 특화 네오클라우드’를 표방하며 시장에 뛰어들었음
    • 결국 추론 클라우드는 칩, 라우팅, 서버리스, 데이터센터 운영이 한꺼번에 붙는 복합 경쟁장이 되고 있음

기술 맥락

  • 그록이 추론에 집중하는 이유는 AI 서비스의 비용 구조가 바뀌고 있기 때문이에요. 모델을 한 번 학습시키는 것도 비싸지만, 실제 서비스에서는 사용자 요청이 들어올 때마다 계속 추론 비용이 발생하거든요.

  • 학습용 클러스터와 추론용 클라우드는 최적화 포인트가 달라요. 학습은 대규모 배치 처리와 긴 실행 시간이 중요하지만, 추론은 지연 시간, 토큰 처리량, 요청 라우팅, 지역별 응답성이 더 중요해요.

  • 그록이 칩 기술을 엔비디아에 넘기고 클라우드 운영으로 방향을 튼 것도 이 맥락이에요. 자체 칩만으로 시장을 키우기보다, 엔비디아 LPX 같은 더 넓은 공급망을 활용해 데이터센터 용량과 서비스 운영에 집중하는 쪽이 확장성이 크다고 본 거예요.

  • 2027년 말 200MW 목표는 기술 선택이 전력과 인프라 선택으로 이어진다는 뜻이에요. 추론 클라우드는 API만 잘 만든다고 되는 게 아니라, 데이터센터 전력, 가속기 배치, 네트워크, 비용 제어가 같이 맞아야 해요.

  • 경쟁사들이 라우팅, 서버리스, 전용 칩, 네오클라우드처럼 서로 다른 각도에서 들어오는 것도 자연스러워요. 추론 비용을 낮추는 방법이 하나가 아니라, 모델 선택부터 하드웨어 효율, 배포 방식까지 여러 층에 걸쳐 있기 때문이에요.

AI 인프라 시장의 무게중심이 ‘모델을 학습시키는 컴퓨팅’에서 ‘모델을 매일 돌리는 컴퓨팅’으로 이동하는 장면임. 그록은 칩 회사 정체성을 내려놓고, 추론 전용 클라우드 운영사로 살아남겠다는 쪽에 베팅했음.

댓글

댓글

댓글을 불러오는 중...

ai-ml

기업 AI 투자, 이제 비용절감보다 성장과 새 사업모델로 간다

아코디스 보고서에 따르면 기업의 AI 투자는 효율화 중심에서 성장, 혁신, 신규 비즈니스 모델 쪽으로 무게가 옮겨가고 있다. 다만 AI 도입 속도와 별개로, CTO들이 기업 전체에 AI를 확장할 수 있다는 자신감은 3년 연속 떨어졌다. 핵심 병목은 모델 성능보다 운영 모델, 거버넌스, 책임 구분 같은 조직 문제에 가깝다.

ai-ml

제타, 팔란티어 파운드리 기반으로 AI 데이터 클라우드 재구축한다

AI 마케팅 플랫폼 기업 제타 글로벌이 팔란티어와 전략적 제휴를 맺고 자체 데이터 클라우드를 재구축하기로 했음. 팔란티어의 파운드리를 기반으로 빅데이터 처리 속도와 예측 정확도를 높이겠다는 기대가 나오면서 제타 주가는 장중 5.66% 상승했음.

ai-ml

심평원, 전 국민 진료정보 기반 의료 AI 만든다

심평원이 전 국민 건강보험 진료정보와 공통데이터모델(CDM)을 기반으로 보건의료 특화 생성형 AI를 만들겠다고 밝혔다. 목표는 단순 질의응답이 아니라 연구 설계, SQL 생성, 통계분석, 결과 산출까지 돕는 연구지원 플랫폼으로 가는 것이다.

ai-ml

일본, 미국·중국 AI 의존 줄이려 프랑스·인도와 'AI 주권' 전선 만든다

일본이 프랑스, 인도, 브라질, 말레이시아, 영국 등과 AI 주권 협의체를 만들며 미국·중국 중심 AI 질서에서 빠져나오려는 움직임을 보이고 있다. 핵심은 자국 데이터, 인프라, 모델을 외부 플랫폼에 종속시키지 않고 관리하자는 것이며, 방위·스마트시티·광물 탐사·농업까지 경제 안보 영역으로 확장되고 있다.

ai-ml

코어라인소프트, 독일 폐암검진 급여화 타고 의료 AI 워크플로우 확장

코어라인소프트가 독일의 저선량 CT 기반 폐암 조기 검진 급여화에 맞춰 의료영상 AI 사업을 확대하고 있다. 독일 민트메디컬과 협력해 흉부 CT 분석 결과를 구조화 리포팅과 결절 관리 워크플로우에 연결하고, 올해 독일 누적 계약 44건을 확보했다.