마이크로소프트, 자체 추론 모델 7종 공개하며 오픈AI 의존 줄이기 가속

ai-ml 2026-06-02 약 6분

 tags

#reasoning-model #copilot #ai-chip #coding-model #speech

vote

북마크

마이크로소프트가 빌드 행사에서 자체 개발 인공지능 모델 7종을 공개했어. 핵심은 350억 활성 매개변수 규모의 추론 모델, 코딩 모델, 이미지·음성 모델이고, 오픈AI 의존도를 낮추려는 전략이 더 노골적으로 드러났어.

1
자체 추론 모델은 증류 없이 마이크로소프트 데이터로 처음부터 학습됨
2
지피티-5.5 대비 최대 10배 비용 효율성을 주장함
3
자체 칩 마이아 200에서 엔비디아 최신 칩보다 효율이 높다고 설명함
4
코딩 모델은 깃허브에 최적화됐고 코파일럿 제품군은 슈퍼앱으로 묶임

마이크로소프트가 자체 인공지능 모델 7종을 한꺼번에 공개함. 포인트는 명확함. 이제 오픈AI 모델만 빌려 쓰는 회사로 남지 않겠다는 얘기임.
- 발표 무대는 연례 개발자회의 빌드였고, 무스타파 술레이만 마이크로소프트 인공지능 최고경영자가 직접 소개함.
- 공개된 모델군에는 추론, 이미지 생성, 음성 전사, 음성 생성, 코딩 모델이 포함됨.
가장 눈에 띄는 건 첫 자체 추론 모델인 MAI-싱킹-1임.
- 활성 매개변수 350억 개 규모의 중형 모델이고, 다른 모델 결과를 따라 배우는 증류 없이 마이크로소프트가 확보한 데이터로 처음부터 학습했다고 밝힘.
- 회사 설명대로라면 성능만 미는 초대형 모델이 아니라, 토큰 소모를 줄인 고효율 모델 쪽에 가까움.
- 마이크로소프트는 이 모델이 지피티-5.5와 비교해 비용 효율성이 최대 10배라고 주장함. 이 숫자가 맞으면 대규모 서비스 운영 비용에서 꽤 큰 차이가 남.

❗중요

> 이번 발표의 핵심은 “오픈AI보다 더 센 모델을 만들었다”가 아니라 “마이크로소프트 제품 안에서 충분히 싸고 빠르게 돌릴 자체 모델을 확보했다”에 가까움.

자체 칩 마이아 200 얘기도 같이 나옴. 모델 발표인데 칩 효율을 같이 꺼낸 게 중요함.
- 마이크로소프트는 마이아 200으로 구동하면 엔비디아 그레이스블랙웰 200보다 더 높은 효율을 얻을 수 있다고 설명함.
- 클라우드 사업자 입장에선 모델 품질만큼이나 추론 단가가 중요함. 코파일럿 같은 제품은 사용자가 많아질수록 토큰 비용이 바로 원가로 꽂히니까.
벤치마크 주장도 꽤 공격적임.
- 블라인드 평가에서는 앤트로픽 클로드 소넷 4.6보다 높은 평가를 받았다고 함.
- 코딩 능력 평가인 SWE 벤치 프로에서는 클로드 오퍼스 4.6과 비슷한 점수를 얻었다고 밝힘.
- 특히 복잡한 다단계 업무, 장문 맥락 추론, 코드 생성에 강점을 두고 설계됐다고 함.
이미지·음성 모델도 같이 업데이트됨.
- MAI-이미지-2.5는 지난 4월 공개한 이미지 생성 모델의 개선판이고, 구글의 나노 바나나 프로보다 높은 평가 점수를 받았다고 주장함.
- 음성 전사 모델 MAI-트랜스크라이브-1.5는 기존 25개 언어에서 43개 언어로 정확도 높은 받아쓰기를 확장함.
- 음성 생성 모델 MAI-보이스-2도 15개 이상 언어를 추가함.
개발자에게 직접 닿는 모델은 MAI-코드-1임.
- 마이크로소프트는 이 코딩 모델을 깃허브에 최적화했다고 설명함.
- 깃허브, 코파일럿, 애저, 비주얼 스튜디오 생태계를 가진 회사가 자체 코딩 모델을 붙이면 배포 경로 자체가 엄청 강함.
- 다만 당장 클로드 코드나 오픈AI 코덱스를 완전히 밀어내긴 어렵다는 평가도 있음. 코딩 도구 시장은 이미 경쟁 제품의 존재감이 꽤 큼.
코파일럿 제품군은 하나의 슈퍼앱처럼 묶인다고 함.
- 코파일럿 챗봇, 코파일럿 코워크, 코파일럿 코드 등을 통합하는 방향임.
- 개발자 도구, 업무 자동화, 채팅형 인공지능을 따로 파는 게 아니라 마이크로소프트 업무 환경 안에 한 덩어리로 넣겠다는 전략으로 보임.
배경에는 오픈AI와의 관계 변화가 있음.
- 마이크로소프트는 2019년 오픈AI와 맺은 계약 때문에 독자 모델 개발에서 한동안 한발 물러나 있었음.
- 지난해 10월 오픈AI가 공익영리법인 구조로 개편하는 과정에서 계약이 수정됐고, 마이크로소프트가 독자 모델 개발에 나설 수 있게 됨.
- 그래서 이번 발표는 단순 신제품 공개라기보다 “우리도 자체 모델 스택을 갖는다”는 선언에 가까움.

기술 맥락

마이크로소프트가 중형 추론 모델을 고른 이유는 비용 때문이에요. 코파일럿처럼 매일 엄청난 요청을 처리하는 서비스에서는 최고 성능 모델만 붙이면 추론비가 감당 안 되거든요.
증류 없이 자체 데이터로 학습했다고 강조한 건 모델 독립성을 보여주려는 신호예요. 오픈AI 모델을 계속 쓰더라도, 핵심 제품에 붙일 대체 모델을 직접 갖고 있어야 협상력도 생기고 제품 로드맵도 덜 흔들려요.
마이아 200 같은 자체 칩을 같이 언급한 것도 같은 맥락이에요. 모델, 칩, 클라우드 런타임, 코파일럿 제품을 한 회사가 묶으면 성능보다 중요한 운영 단가를 직접 최적화할 수 있어요.
개발자 입장에서는 코딩 모델 자체보다 깃허브 최적화가 더 중요할 수 있어요. 코드 검색, 이슈, 풀 리퀘스트, 저장소 맥락까지 붙으면 모델 성능이 조금 낮아도 실제 작업 흐름에서는 더 유용하게 느껴질 수 있거든요.

모델 성능 1등 경쟁이라기보다, 마이크로소프트가 클라우드·칩·개발자 도구·업무용 코파일럿을 한 묶음으로 통제하려는 움직임에 가깝다. 개발자 입장에선 코파일럿 뒤에 어떤 모델이 붙는지가 점점 더 유동적인 시대가 된 셈.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-13

애플 새 음성 인식 API, 온디바이스 영어 전사에서 위스퍼 스몰까지 이겼다

애플의 새 음성 인식 API인 스피치애널라이저가 리브리스피치 벤치마크에서 기존 SFSpeechRecognizer는 물론 위스퍼 스몰보다도 낮은 단어 오류율을 기록했어. 깨끗한 음성에서는 2.12%, noisy 음성에서는 4.56%로, 기존 애플 API 대비 오류율을 3.5~4배 줄였고 위스퍼 스몰보다 약 3배 빠르게 돌았어. 다만 영어·애플 플랫폼·OS 26 조건의 결과라, 다국어와 크로스플랫폼에서는 여전히 위스퍼의 장점이 남아 있어.

ai-ml 2026-07-13

AI를 진짜 잘 쓰는 기업, 미국 증시에서 연 30% 프리미엄 받는다는 연구

예일대와 로체스터대 연구진이 기업의 실제 대형 언어 모델 사용 데이터를 분석했더니, AI 활용도가 높은 상위 20% 기업이 하위 20%보다 주당 평균 0.64% 높은 초과수익률을 냈다. 단순히 AI 기업이냐가 아니라, 업무에 AI를 얼마나 깊게 쓰는지가 시장 가치에 반영되고 있다는 얘기다.

ai-ml 2026-07-13

ZTE, AI 에이전트폰으로 스마트폰 재도전…진짜 승부처는 앱 생태계

ZTE가 바이트댄스의 더우바오를 탑재한 AI 에이전트 스마트폰으로 시장 재진입을 노린다. 핵심은 사용자가 명령하면 AI가 여러 앱을 직접 열고 조작하는 방식인데, 위챗·타오바오·알리페이 같은 플랫폼과 충돌하면서 생태계 문제가 가장 큰 변수로 떠올랐다.

ai-ml 2026-07-13

노벨상 학자들까지 “AI 경제 충격, 지금 제도 안 만들면 늦다”

노벨 경제학상 수상자 15명을 포함한 학자와 기술 업계 인사 약 200명이 AI가 향후 10년 안에 경제를 급격히 바꿀 수 있다며 정책 대응을 촉구했다. 이들은 산업혁명보다 큰 변화가 훨씬 짧은 시간에 올 수 있고, 대규모 일자리 대체와 생활 수준 향상이라는 양면성이 동시에 존재한다고 봤다.

ai-ml 2026-07-13

NHN, AI 데이터센터 매출 기대감에 목표주가 5만6000원으로 상향

한국투자증권이 NHN의 목표주가를 4만5000원에서 5만6000원으로 올리고 투자의견 매수를 유지했다. 핵심 근거는 양평 AI 데이터센터 가동, 공공·민간 GPU 클러스터 수주 확대, 클라우드 사업부 신규 매출 반영이다.

마이크로소프트, 자체 추론 모델 7종 공개하며 오픈AI 의존 줄이기 가속

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

마이크로소프트, 자체 추론 모델 7종 공개하며 오픈AI 의존 줄이기 가속

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사