---
title: "투게더 AI, 8억 달러 투자 유치…오픈소스 AI 인프라가 진짜 돈 되는 시장으로"
published: 2026-07-02T10:05:03.441Z
canonical: https://jeff.news/article/4532
---
# 투게더 AI, 8억 달러 투자 유치…오픈소스 AI 인프라가 진짜 돈 되는 시장으로

오픈소스 AI 모델을 엔터프라이즈 규모로 돌리는 인프라 수요가 커지면서 투게더 AI가 8억 달러 규모 시리즈 C 투자를 유치했다. 기업가치는 83억 달러로 뛰었고, 회사는 독점 모델 대비 비용을 6~20배 줄일 수 있다는 점을 전면에 내세우고 있다.

## 오픈소스 AI가 뜨니, 모델보다 ‘굴리는 인프라’가 돈을 빨아들이는 중

- 투게더 AI가 시리즈 C에서 8억 달러, 약 1조 1,000억 원을 유치함
  - 투자 후 기업가치는 83억 달러, 약 12조 원으로 평가됨
  - 16개월 전 시리즈 B 당시 33억 달러였던 몸값이 2.5배 이상 뛴 셈
  - 이번 라운드는 아람코 벤처스가 주도했고, 엔비디아, 세일즈포스 벤처스, 비스타 에쿼티 파트너스, 제너럴 캐털리스트 등이 참여함

- 이 투자의 배경은 꽤 단순함. 기업들이 폐쇄형 대형 언어 모델(LLM)을 실서비스에 올리다가 토큰 비용에 맞고 있음
  - 프로토타입 단계에서는 오픈AI나 앤트로픽 모델을 쓰는 게 편함
  - 그런데 실제 사용자 트래픽이 붙는 생산 환경으로 가면 추론 비용이 운영비의 핵심이 됨
  - 그래서 딥시크(DeepSeek), 네모트론(Nemotron), 미니맥스(MiniMax), 키미(Kimi) 같은 오픈소스 가중치 모델로 관심이 이동 중

> [!IMPORTANT]
> 투게더 AI는 개방형 모델을 파인튜닝해 배포하면 독점 모델 대비 비용을 최소 6배에서 최대 20배까지 줄일 수 있다고 주장함. AI 서비스가 커질수록 이 숫자는 그냥 최적화가 아니라 생존 문제가 됨.

## “성능은 비슷한데 비용은 6~20배 싸다”가 핵심 메시지

- 투게더 AI의 포지셔닝은 ‘생산용 AI의 경제학’에 가까움
  - 모델을 잘 만드는 회사라기보다, 모델을 대규모로 싸게 돌리는 플랫폼에 가까움
  - 개방형 모델을 커스텀 파인튜닝하고, 기업 서비스에 맞게 배포하는 쪽을 잡고 있음

- 실제 사례로 AI 고객지원 스타트업 데카곤은 투게더 AI 인프라로 이전한 뒤 추론 비용을 6배 절감했다고 함
  - 이런 사례가 중요한 이유는 비용 절감이 벤치마크 숫자가 아니라 곧바로 매출총이익률에 연결되기 때문
  - 고객지원, 코딩 에이전트, 음성·음악 생성 같은 서비스는 요청량이 많아질수록 토큰 비용이 빠르게 커짐

- 투게더 AI의 지난 분기 기준 연간 예약 매출은 11억 5,000만 달러, 약 1조 6,700억 원을 넘김
  - 고객 명단도 꽤 화려함
  - 커서(Cursor), 코그니션(Cognition), 일레븐랩스(Eleven Labs), 수노(Suno) 같은 요즘 핫한 AI 서비스들이 유료 고객으로 언급됨

## 네오클라우드 경쟁은 단순 GPU 임대업이 아님

- 실리콘밸리 벤처캐피털 업계에서 네오클라우드는 이미 뜨거운 키워드가 됨
  - 업스케일 AI는 20억 달러 가치로 5억 달러를 유치함
  - AMD GPU 클러스터를 다루는 텐서웨이브는 15억 5,000만 달러 가치로 3억 5,000만 달러를 유치함
  - AI 인프라 확보 경쟁이 클라우드 바깥에서도 벌어지고 있다는 뜻

- 투게더 AI가 더 높은 평가를 받는 이유는 GPU를 빌려주는 데서 멈추지 않는다는 점임
  - 엔비디아 블랙웰(Blackwell)에 최적화된 플래시어텐션-4(FlashAttention-4)를 발표함
  - 커널 수준 최적화 솔루션인 투게더 메가커널(Together Megakernel)도 내놨음
  - 전력과 연산 효율을 높이면 같은 GPU에서도 더 많은 토큰을 처리할 수 있고, 토큰당 마진도 좋아짐

## 앞으로 5년간 인프라 용량을 50배 키우겠다는 계획

- 투게더 AI는 이번 8억 달러 자금을 추론 엔진 제품군 확장과 인프라 증설에 쓸 예정임
  - 향후 5년간 인프라 용량을 현재의 약 50배로 늘리겠다고 밝힘
  - 미국과 유럽, 특히 영국·스페인·프랑스 등에 단기 가동 가능한 기가와트급 AI 데이터센터 용량을 확보했다고 함

- 아람코 벤처스 쪽 발언도 스케일이 큼
  - 향후 10년간 AI 인프라 구축이 인류 역사상 가장 큰 인프라 프로젝트가 될 수 있다고 봄
  - 투게더 AI가 오픈소스 모델을 엔터프라이즈 규모에서 실제로 쓸 수 있게 만드는 플랫폼이라는 점을 투자 이유로 들었음

---

## 기술 맥락

- 이 기사에서 기술적 선택은 “폐쇄형 모델 API를 계속 쓸 것인가, 오픈소스 가중치 모델을 직접 튜닝해서 운영할 것인가”예요. 프로토타입에서는 전자가 빠르지만, 트래픽이 붙으면 토큰 비용이 바로 운영비가 되거든요.

- 투게더 AI가 강조하는 파인튜닝과 추론 최적화는 같은 문제를 다른 층위에서 푸는 방식이에요. 모델을 업무에 맞게 줄이고, 커널과 어텐션 연산을 최적화해서 같은 하드웨어로 더 많은 요청을 처리하려는 거죠.

- 네오클라우드가 단순 GPU 대여와 다른 이유도 여기에 있어요. GPU 가격은 시간이 지나면 내려갈 수 있지만, 토큰당 처리량을 높이는 소프트웨어 스택은 서비스 마진을 계속 좌우해요.

- 한국 팀이 볼 포인트는 “어느 모델이 제일 좋냐”만이 아니에요. 실제 제품에서는 지연시간, 토큰 단가, 파인튜닝 편의성, 데이터 통제, 장애 대응까지 같이 봐야 해서 인프라 선택이 곧 제품 전략이 돼요.

## 핵심 포인트

- 투게더 AI가 아람코 벤처스 주도 시리즈 C에서 8억 달러를 유치했고 기업가치는 83억 달러로 평가됨
- 딥시크, 네모트론, 미니맥스, 키미 같은 오픈소스 가중치 모델 수요가 생산 환경에서 커지고 있음
- 투게더 AI는 파인튜닝과 배포를 통해 독점 모델 대비 비용을 6~20배 절감할 수 있다고 주장
- 플래시어텐션-4와 투게더 메가커널 같은 최적화 스택이 단순 GPU 대여와의 차별점으로 제시됨

## 인사이트

이 뉴스는 ‘모델을 누가 만들었나’보다 ‘그 모델을 싸고 빠르게 굴릴 수 있나’가 시장의 다음 전장이 되고 있다는 신호다. 한국 스타트업도 추론 비용이 커지는 순간부터는 모델 성능보다 토큰당 원가와 인프라 최적화가 훨씬 현실적인 문제가 된다.