---
title: "메이투안, 1.6조 파라미터 롱캣-2.0 공개…엔비디아 없이 중국산 ASIC 5만 개로 학습"
published: 2026-06-30T07:05:02.547Z
canonical: https://jeff.news/article/4412
---
# 메이투안, 1.6조 파라미터 롱캣-2.0 공개…엔비디아 없이 중국산 ASIC 5만 개로 학습

메이투안이 코드명 ‘아울 알파’로 알려졌던 롱캣-2.0을 오픈소스로 공개했다. 1조6000억 파라미터 규모의 전문가혼합 구조, 100만 토큰 컨텍스트, MIT 라이선스, 공격적인 API 가격이 핵심이다. 특히 엔비디아 GPU 없이 중국산 ASIC 5만 개 이상으로 학습했다는 점이 꽤 큰 신호다.

- 메이투안이 코드명 ‘아울 알파’로 돌던 AI 모델을 롱캣-2.0(LongCat-2.0)이라는 이름으로 공개함
  - 지난 두 달 동안 오픈라우터(OpenRouter)에서 익명 모델로 운영되며 개발자 차트 상위권에 있었다고 함
  - 공개 채널도 꽤 세게 잡았음. 깃허브, 허깅페이스, 자체 플랫폼에 동시에 올림
  - 라이선스는 MIT라서 상업적 활용까지 열어둔 쪽임

- 스펙만 보면 ‘중국산 오픈소스 모델도 이제 진짜 대형화 구간에 들어갔네’라는 느낌이 강함
  - 롱캣-2.0은 1조6000억 개 파라미터 규모의 전문가혼합(MoE) 구조임
  - 컨텍스트 윈도는 100만 토큰을 지원한다고 밝힘
  - 긴 코드베이스, 대형 문서, 로그 묶음 같은 걸 한 번에 넣고 다루려는 수요를 정면으로 겨냥한 스펙임

> [!IMPORTANT]
> 롱캣-2.0의 포인트는 단순히 “큰 모델”이 아니라, 1.6조 파라미터와 100만 토큰 컨텍스트를 MIT 라이선스로 풀었다는 조합임.

- 벤치마크 숫자도 공격적으로 제시함
  - SWE-벤치 프로에서 59.5점을 기록해 GPT-5.5의 58.6점을 앞섰다고 주장함
  - 터미널-벤치 2.1에서는 70.8점, SWE-벤치 멀티링구얼에서는 77.3점을 받았다고 함
  - 개발자 입장에서는 일반 챗봇 성능보다 코딩, 터미널 작업, 다국어 코드 이슈 대응 성능이 더 눈에 들어오는 대목임

- 가격 정책도 ‘프리미엄 모델 계속 이렇게 비싸게 받을 수 있나?’ 쪽으로 압박을 주는 구성임
  - 일반 API 요금은 입력 100만 토큰당 0.75달러, 출력 100만 토큰당 2.95달러임
  - 프로모션 기간에는 입력 0.30달러, 출력 1.20달러까지 내려감
  - 한 번 읽은 내용을 다시 불러올 때는 요금을 부과하지 않는다고 밝혀, 캐시 재사용 비용까지 가격 경쟁 포인트로 건드림

- 제일 흥미로운 건 학습 인프라임. 메이투안은 엔비디아 GPU 없이 중국산 ASIC 5만 개 이상으로 학습했다고 밝힘
  - 중국 AI 기업들이 모델 성능만이 아니라 반도체 공급망 독립까지 같이 밀고 있다는 신호로 읽힘
  - 엔비디아 GPU 접근이 제한되는 상황에서 대체 학습 클러스터가 실제 대형 모델 공개까지 이어졌다는 점이 중요함
  - 물론 벤치마크와 실제 운영 품질은 별개라서, 개발자들이 직접 써보면서 지연시간, 안정성, 도구 호출 품질을 확인해야 하는 구간임

- 메이투안이라는 회사 배경도 좀 특이함
  - 메이투안은 중국 배달 슈퍼앱 시장을 주도해온 회사고, 2010년 왕싱이 세웠음
  - 최근 수익성 둔화에 대응해 AI와 반도체 기술에 수십억 달러를 투자하겠다고 밝힌 상태임
  - 그러니까 이건 연구소 데모라기보다는, 거대 플랫폼 기업이 비용 구조와 인프라 주도권을 바꾸려는 움직임에 가까움

---
## 기술 맥락

- 롱캣-2.0에서 가장 먼저 봐야 할 선택은 전문가혼합(MoE) 구조예요. 1조6000억 파라미터를 매 요청마다 전부 쓰면 비용이 너무 커지니까, 입력에 맞는 일부 전문가만 활성화해서 대형 모델의 표현력과 추론 비용 사이를 맞추려는 거예요.

- 100만 토큰 컨텍스트도 그냥 숫자 자랑은 아니에요. 개발자 워크플로에서는 저장소 전체, 긴 이슈 스레드, 대형 로그를 한 번에 넣고 물어보고 싶을 때가 많거든요. 이 구간에서 컨텍스트가 짧으면 모델 성능이 좋아도 실제 업무에는 답답해져요.

- 엔비디아 GPU 없이 중국산 ASIC 5만 개 이상으로 학습했다는 대목은 인프라 선택의 문제예요. 미국산 GPU 공급 제약이 커진 상황에서, 중국 기업들은 모델만 만드는 게 아니라 학습 클러스터 자체를 대체하려고 해요.

- API 가격을 낮게 잡고 MIT 라이선스로 푼 것도 전략적이에요. 개발자 생태계에 먼저 깔리면 모델 자체의 성능뿐 아니라 도구, 라우터, 파인튜닝, 호스팅 수요가 따라오거든요. 결국 오픈소스 모델 경쟁은 모델 파일 하나가 아니라 배포와 운영 비용까지 포함한 싸움이에요.

## 핵심 포인트

- 롱캣-2.0은 1조6000억 파라미터 규모 전문가혼합 구조 모델이다
- 100만 토큰 컨텍스트 윈도와 MIT 라이선스를 제공한다
- SWE-벤치 프로에서 59.5점으로 GPT-5.5의 58.6점을 앞섰다고 밝혔다
- 일반 API 가격은 입력 100만 토큰당 0.75달러, 출력 100만 토큰당 2.95달러다
- 중국산 ASIC 5만 개 이상으로 구성한 클러스터에서 학습했다

## 인사이트

이 뉴스의 핵심은 ‘또 중국 오픈소스 모델이 나왔다’가 아니라, 대형 모델 학습 인프라에서 엔비디아 의존도를 줄이려는 시도가 실제 성과물로 포장돼 나왔다는 점이다. 가격, 라이선스, 벤치마크까지 한 번에 밀어붙이는 구성이어서 기업용 모델 시장 압박이 더 세질 수밖에 없다.
