---
title: "마이크로소프트, 자체 추론 모델 7종 공개하며 오픈AI 의존 줄이기 가속"
published: 2026-06-02T19:05:02.539Z
canonical: https://jeff.news/article/3618
---
# 마이크로소프트, 자체 추론 모델 7종 공개하며 오픈AI 의존 줄이기 가속

마이크로소프트가 빌드 행사에서 자체 개발 인공지능 모델 7종을 공개했어. 핵심은 350억 활성 매개변수 규모의 추론 모델, 코딩 모델, 이미지·음성 모델이고, 오픈AI 의존도를 낮추려는 전략이 더 노골적으로 드러났어.

- 마이크로소프트가 자체 인공지능 모델 7종을 한꺼번에 공개함. 포인트는 명확함. 이제 오픈AI 모델만 빌려 쓰는 회사로 남지 않겠다는 얘기임.
  - 발표 무대는 연례 개발자회의 빌드였고, 무스타파 술레이만 마이크로소프트 인공지능 최고경영자가 직접 소개함.
  - 공개된 모델군에는 추론, 이미지 생성, 음성 전사, 음성 생성, 코딩 모델이 포함됨.

- 가장 눈에 띄는 건 첫 자체 추론 모델인 `MAI-싱킹-1`임.
  - 활성 매개변수 350억 개 규모의 중형 모델이고, 다른 모델 결과를 따라 배우는 증류 없이 마이크로소프트가 확보한 데이터로 처음부터 학습했다고 밝힘.
  - 회사 설명대로라면 성능만 미는 초대형 모델이 아니라, 토큰 소모를 줄인 고효율 모델 쪽에 가까움.
  - 마이크로소프트는 이 모델이 지피티-5.5와 비교해 비용 효율성이 최대 10배라고 주장함. 이 숫자가 맞으면 대규모 서비스 운영 비용에서 꽤 큰 차이가 남.

> [!IMPORTANT]
> 이번 발표의 핵심은 “오픈AI보다 더 센 모델을 만들었다”가 아니라 “마이크로소프트 제품 안에서 충분히 싸고 빠르게 돌릴 자체 모델을 확보했다”에 가까움.

- 자체 칩 `마이아 200` 얘기도 같이 나옴. 모델 발표인데 칩 효율을 같이 꺼낸 게 중요함.
  - 마이크로소프트는 마이아 200으로 구동하면 엔비디아 그레이스블랙웰 200보다 더 높은 효율을 얻을 수 있다고 설명함.
  - 클라우드 사업자 입장에선 모델 품질만큼이나 추론 단가가 중요함. 코파일럿 같은 제품은 사용자가 많아질수록 토큰 비용이 바로 원가로 꽂히니까.

- 벤치마크 주장도 꽤 공격적임.
  - 블라인드 평가에서는 앤트로픽 `클로드 소넷 4.6`보다 높은 평가를 받았다고 함.
  - 코딩 능력 평가인 `SWE 벤치 프로`에서는 `클로드 오퍼스 4.6`과 비슷한 점수를 얻었다고 밝힘.
  - 특히 복잡한 다단계 업무, 장문 맥락 추론, 코드 생성에 강점을 두고 설계됐다고 함.

- 이미지·음성 모델도 같이 업데이트됨.
  - `MAI-이미지-2.5`는 지난 4월 공개한 이미지 생성 모델의 개선판이고, 구글의 `나노 바나나 프로`보다 높은 평가 점수를 받았다고 주장함.
  - 음성 전사 모델 `MAI-트랜스크라이브-1.5`는 기존 25개 언어에서 43개 언어로 정확도 높은 받아쓰기를 확장함.
  - 음성 생성 모델 `MAI-보이스-2`도 15개 이상 언어를 추가함.

- 개발자에게 직접 닿는 모델은 `MAI-코드-1`임.
  - 마이크로소프트는 이 코딩 모델을 깃허브에 최적화했다고 설명함.
  - 깃허브, 코파일럿, 애저, 비주얼 스튜디오 생태계를 가진 회사가 자체 코딩 모델을 붙이면 배포 경로 자체가 엄청 강함.
  - 다만 당장 클로드 코드나 오픈AI 코덱스를 완전히 밀어내긴 어렵다는 평가도 있음. 코딩 도구 시장은 이미 경쟁 제품의 존재감이 꽤 큼.

- 코파일럿 제품군은 하나의 슈퍼앱처럼 묶인다고 함.
  - 코파일럿 챗봇, 코파일럿 코워크, 코파일럿 코드 등을 통합하는 방향임.
  - 개발자 도구, 업무 자동화, 채팅형 인공지능을 따로 파는 게 아니라 마이크로소프트 업무 환경 안에 한 덩어리로 넣겠다는 전략으로 보임.

- 배경에는 오픈AI와의 관계 변화가 있음.
  - 마이크로소프트는 2019년 오픈AI와 맺은 계약 때문에 독자 모델 개발에서 한동안 한발 물러나 있었음.
  - 지난해 10월 오픈AI가 공익영리법인 구조로 개편하는 과정에서 계약이 수정됐고, 마이크로소프트가 독자 모델 개발에 나설 수 있게 됨.
  - 그래서 이번 발표는 단순 신제품 공개라기보다 “우리도 자체 모델 스택을 갖는다”는 선언에 가까움.

---
## 기술 맥락

- 마이크로소프트가 중형 추론 모델을 고른 이유는 비용 때문이에요. 코파일럿처럼 매일 엄청난 요청을 처리하는 서비스에서는 최고 성능 모델만 붙이면 추론비가 감당 안 되거든요.

- 증류 없이 자체 데이터로 학습했다고 강조한 건 모델 독립성을 보여주려는 신호예요. 오픈AI 모델을 계속 쓰더라도, 핵심 제품에 붙일 대체 모델을 직접 갖고 있어야 협상력도 생기고 제품 로드맵도 덜 흔들려요.

- 마이아 200 같은 자체 칩을 같이 언급한 것도 같은 맥락이에요. 모델, 칩, 클라우드 런타임, 코파일럿 제품을 한 회사가 묶으면 성능보다 중요한 운영 단가를 직접 최적화할 수 있어요.

- 개발자 입장에서는 코딩 모델 자체보다 깃허브 최적화가 더 중요할 수 있어요. 코드 검색, 이슈, 풀 리퀘스트, 저장소 맥락까지 붙으면 모델 성능이 조금 낮아도 실제 작업 흐름에서는 더 유용하게 느껴질 수 있거든요.

## 핵심 포인트

- 자체 추론 모델은 증류 없이 마이크로소프트 데이터로 처음부터 학습됨
- 지피티-5.5 대비 최대 10배 비용 효율성을 주장함
- 자체 칩 마이아 200에서 엔비디아 최신 칩보다 효율이 높다고 설명함
- 코딩 모델은 깃허브에 최적화됐고 코파일럿 제품군은 슈퍼앱으로 묶임

## 인사이트

모델 성능 1등 경쟁이라기보다, 마이크로소프트가 클라우드·칩·개발자 도구·업무용 코파일럿을 한 묶음으로 통제하려는 움직임에 가깝다. 개발자 입장에선 코파일럿 뒤에 어떤 모델이 붙는지가 점점 더 유동적인 시대가 된 셈.