본문으로 건너뛰기
피드

메이투안, 1.6조 파라미터 롱캣-2.0 공개…엔비디아 없이 중국산 ASIC 5만 개로 학습

ai-ml 약 5분
vote
0
댓글
북마크

메이투안이 코드명 ‘아울 알파’로 알려졌던 롱캣-2.0을 오픈소스로 공개했다. 1조6000억 파라미터 규모의 전문가혼합 구조, 100만 토큰 컨텍스트, MIT 라이선스, 공격적인 API 가격이 핵심이다. 특히 엔비디아 GPU 없이 중국산 ASIC 5만 개 이상으로 학습했다는 점이 꽤 큰 신호다.

  • 1

    롱캣-2.0은 1조6000억 파라미터 규모 전문가혼합 구조 모델이다

  • 2

    100만 토큰 컨텍스트 윈도와 MIT 라이선스를 제공한다

  • 3

    SWE-벤치 프로에서 59.5점으로 GPT-5.5의 58.6점을 앞섰다고 밝혔다

  • 4

    일반 API 가격은 입력 100만 토큰당 0.75달러, 출력 100만 토큰당 2.95달러다

  • 5

    중국산 ASIC 5만 개 이상으로 구성한 클러스터에서 학습했다

  • 메이투안이 코드명 ‘아울 알파’로 돌던 AI 모델을 롱캣-2.0(LongCat-2.0)이라는 이름으로 공개함

    • 지난 두 달 동안 오픈라우터(OpenRouter)에서 익명 모델로 운영되며 개발자 차트 상위권에 있었다고 함
    • 공개 채널도 꽤 세게 잡았음. 깃허브, 허깅페이스, 자체 플랫폼에 동시에 올림
    • 라이선스는 MIT라서 상업적 활용까지 열어둔 쪽임
  • 스펙만 보면 ‘중국산 오픈소스 모델도 이제 진짜 대형화 구간에 들어갔네’라는 느낌이 강함

    • 롱캣-2.0은 1조6000억 개 파라미터 규모의 전문가혼합(MoE) 구조임
    • 컨텍스트 윈도는 100만 토큰을 지원한다고 밝힘
    • 긴 코드베이스, 대형 문서, 로그 묶음 같은 걸 한 번에 넣고 다루려는 수요를 정면으로 겨냥한 스펙임

중요

> 롱캣-2.0의 포인트는 단순히 “큰 모델”이 아니라, 1.6조 파라미터와 100만 토큰 컨텍스트를 MIT 라이선스로 풀었다는 조합임.

  • 벤치마크 숫자도 공격적으로 제시함

    • SWE-벤치 프로에서 59.5점을 기록해 GPT-5.5의 58.6점을 앞섰다고 주장함
    • 터미널-벤치 2.1에서는 70.8점, SWE-벤치 멀티링구얼에서는 77.3점을 받았다고 함
    • 개발자 입장에서는 일반 챗봇 성능보다 코딩, 터미널 작업, 다국어 코드 이슈 대응 성능이 더 눈에 들어오는 대목임
  • 가격 정책도 ‘프리미엄 모델 계속 이렇게 비싸게 받을 수 있나?’ 쪽으로 압박을 주는 구성임

    • 일반 API 요금은 입력 100만 토큰당 0.75달러, 출력 100만 토큰당 2.95달러임
    • 프로모션 기간에는 입력 0.30달러, 출력 1.20달러까지 내려감
    • 한 번 읽은 내용을 다시 불러올 때는 요금을 부과하지 않는다고 밝혀, 캐시 재사용 비용까지 가격 경쟁 포인트로 건드림
  • 제일 흥미로운 건 학습 인프라임. 메이투안은 엔비디아 GPU 없이 중국산 ASIC 5만 개 이상으로 학습했다고 밝힘

    • 중국 AI 기업들이 모델 성능만이 아니라 반도체 공급망 독립까지 같이 밀고 있다는 신호로 읽힘
    • 엔비디아 GPU 접근이 제한되는 상황에서 대체 학습 클러스터가 실제 대형 모델 공개까지 이어졌다는 점이 중요함
    • 물론 벤치마크와 실제 운영 품질은 별개라서, 개발자들이 직접 써보면서 지연시간, 안정성, 도구 호출 품질을 확인해야 하는 구간임
  • 메이투안이라는 회사 배경도 좀 특이함

    • 메이투안은 중국 배달 슈퍼앱 시장을 주도해온 회사고, 2010년 왕싱이 세웠음
    • 최근 수익성 둔화에 대응해 AI와 반도체 기술에 수십억 달러를 투자하겠다고 밝힌 상태임
    • 그러니까 이건 연구소 데모라기보다는, 거대 플랫폼 기업이 비용 구조와 인프라 주도권을 바꾸려는 움직임에 가까움

기술 맥락

  • 롱캣-2.0에서 가장 먼저 봐야 할 선택은 전문가혼합(MoE) 구조예요. 1조6000억 파라미터를 매 요청마다 전부 쓰면 비용이 너무 커지니까, 입력에 맞는 일부 전문가만 활성화해서 대형 모델의 표현력과 추론 비용 사이를 맞추려는 거예요.

  • 100만 토큰 컨텍스트도 그냥 숫자 자랑은 아니에요. 개발자 워크플로에서는 저장소 전체, 긴 이슈 스레드, 대형 로그를 한 번에 넣고 물어보고 싶을 때가 많거든요. 이 구간에서 컨텍스트가 짧으면 모델 성능이 좋아도 실제 업무에는 답답해져요.

  • 엔비디아 GPU 없이 중국산 ASIC 5만 개 이상으로 학습했다는 대목은 인프라 선택의 문제예요. 미국산 GPU 공급 제약이 커진 상황에서, 중국 기업들은 모델만 만드는 게 아니라 학습 클러스터 자체를 대체하려고 해요.

  • API 가격을 낮게 잡고 MIT 라이선스로 푼 것도 전략적이에요. 개발자 생태계에 먼저 깔리면 모델 자체의 성능뿐 아니라 도구, 라우터, 파인튜닝, 호스팅 수요가 따라오거든요. 결국 오픈소스 모델 경쟁은 모델 파일 하나가 아니라 배포와 운영 비용까지 포함한 싸움이에요.

이 뉴스의 핵심은 ‘또 중국 오픈소스 모델이 나왔다’가 아니라, 대형 모델 학습 인프라에서 엔비디아 의존도를 줄이려는 시도가 실제 성과물로 포장돼 나왔다는 점이다. 가격, 라이선스, 벤치마크까지 한 번에 밀어붙이는 구성이어서 기업용 모델 시장 압박이 더 세질 수밖에 없다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

그로크, 1조 원 투자 유치로 AI 추론 클라우드 확장 속도 낸다

AI 추론 전용 클라우드 기업 그로크가 6억 5,000만 달러 규모의 신규 투자를 유치했다. 엔비디아와의 비독점 라이선스 거래 이후 독립 회사로 남은 그로크는 자체 LPU와 13개 데이터센터를 앞세워 빠르고 저렴한 추론 클라우드 시장을 키우려 한다.

ai-ml

구글 클라우드에 신약·신소재용 AI 모델이 올라온다

구글 클라우드 마켓플레이스에 샌드박스AQ의 과학 연구 특화 AI 모델이 추가된다. 텍스트를 잘 쓰는 대규모 언어 모델(LLM)이 아니라 화학·생물학·물리학 문제를 수치 데이터로 푸는 거대정량모델(LQM) 쪽이라, 신약 후보와 반도체·배터리 소재 탐색에 초점이 맞춰져 있다.

ai-ml

프로수스, AI 쇼핑 비서로 커머스 수익성 끌어올리는 중

프로수스가 연간 조정 핵심이익 84% 증가를 발표하면서, 거래 데이터 기반 AI 쇼핑 비서 전략을 내세웠어. 마켓플레이스, 배달, 중고거래, 결제 데이터를 가진 플랫폼이 범용 챗봇보다 강한 AI 커머스 서비스를 만들 수 있다는 흐름이야.

ai-ml

정부, 3년 안에 로봇 두뇌용 피지컬 AI 파운데이션 모델 만든다

정부가 독자 AI 파운데이션 모델과 별도로 로봇의 두뇌 역할을 할 피지컬 AI 범용 파운데이션 모델 개발에 나서. 핵심은 대규모 언어 모델(LLM)이 아니라 시각·언어·행동(VLA), 월드모델(World Model), 로봇 제어를 묶는 풀스택 국산화야.

ai-ml

오픈클로, 모바일 앱 출시…AI 에이전트가 스마트폰 권한까지 잡기 시작함

오픈소스 AI 에이전트 프로젝트 오픈클로가 iOS와 Android용 독립 앱을 내놨어. 이제 에이전트가 카메라, 화면, 위치, 사진, 연락처, 캘린더 같은 스마트폰 기능과 연결될 수 있어서 개인 비서에 가까워지는 동시에 권한 관리 리스크도 커졌어.