미스트랄, 수학 증명·코드 검증용 오픈소스 모델 ‘린스트랄 1.5’ 공개
미스트랄이 Lean 4 기반 수학 증명과 코드 검증에 특화한 오픈소스 모델 린스트랄 1.5를 공개했다. 1190억 파라미터 MoE 구조지만 실제 추론에는 약 65억 파라미터만 쓰고, 퍼트넘벤치 672문제 중 587개를 해결했다.
- 1
린스트랄 1.5는 Lean 4 증명 보조 시스템에 최적화된 AI 코드 에이전트다
- 2
miniF2F 검증셋과 테스트셋에서 모두 100%를 기록했고 퍼트넘벤치에서는 587문제를 풀었다
- 3
Rust 코드를 Lean으로 변환해 57개 오픈소스 저장소에서 47개 속성 위반을 찾았고, 11건은 실제 버그로 확인됐다
LLM 경쟁이 ‘말 잘하는 모델’에서 ‘검증 가능한 정답을 만드는 모델’로 넘어가는 장면임. 특히 비용까지 낮췄다는 점 때문에 연구용 장난감이 아니라 실제 코드 검증 파이프라인 후보로 볼 만하다.
관련 기사
바이트댄스, AI 에이전트가 배포 뒤에도 똑똑해지는 ‘확장 법칙’ 주장
바이트댄스 시드 AI 팀이 AI 에이전트가 실제 업무 환경에서 장기간 상호작용할수록 성능이 예측 가능한 곡선으로 좋아진다는 연구를 내놨다. 연구진은 134개 장기 과제와 3만8000시간 규모의 상호작용 데이터를 분석했고, 배포 후 학습이 사전 학습 이후의 새 스케일링 축이 될 수 있다고 주장했다.
중국에서 ‘1인 창업자+AI’ 모델 급증…1인 기업 1600만개 돌파
중국에서 AI를 디지털 직원처럼 활용하는 1인 기업이 빠르게 늘고 있다. 코트라에 따르면 지난해 6월 기준 중국 1인 유한책임회사는 1600만개를 넘었고, 지난해 상반기 신규 등록 1인 기업은 약 290만개로 전년 대비 47% 증가했다.
구글 agents-cli로 AI 에이전트 제작·평가·배포 흐름 가져다 쓰기
구글의 agents-cli는 코딩 에이전트 자체가 아니라, 기존 코딩 도구에 에이전트 제작·평가·배포 절차를 붙여주는 CLI다. 같은 글에서는 Anthropic Fable 5 재개, 구글 DESIGN.md를 활용한 AI 디자인 맥락 주입 방식도 함께 다뤘고, 특히 프로덕션에서는 맥락을 통째로 넣는 방식보다 필요한 부분만 불러오는 방식이 더 유리할 수 있다는 점이 핵심이다.
메타가 AI 인프라를 팔기 시작하면, 국내 클라우드 기업 가치도 다시 보일까
메타가 자체 구축한 GPU와 데이터센터를 외부에 판매하는 클라우드 사업을 검토하면서, AI 설비투자가 단순 비용이 아니라 수익 자산이 될 수 있다는 분석이 나왔어. 국내에서는 네이버와 삼성SDS 같은 클라우드 관련 기업의 가치가 재평가될 수 있다는 전망이 붙었지만, 글로벌 CSP와 같은 논리를 그대로 적용하긴 어렵다는 지적도 같이 나왔어.
메타가 클로드까지 팔 수 있다? AI 인프라 전쟁이 모델 유통전으로 번지는 중
세미애널리시스는 메타가 앤트로픽의 클로드 프라이빗 인스턴스 접근 권한을 확보하기 위한 최종 협상 단계에 있는 것으로 봤다. 메타가 자체 데이터센터에 타사 최고급 모델을 올려 내부 사용과 기업 고객 판매에 활용하려는 전략이라는 분석이다.
댓글
댓글
댓글을 불러오는 중...