본문으로 건너뛰기
피드

마이크로소프트, 자체 추론 모델 7종 공개하며 오픈AI 의존 줄이기 가속

ai-ml 약 6분
vote
0
댓글
북마크

마이크로소프트가 빌드 행사에서 자체 개발 인공지능 모델 7종을 공개했어. 핵심은 350억 활성 매개변수 규모의 추론 모델, 코딩 모델, 이미지·음성 모델이고, 오픈AI 의존도를 낮추려는 전략이 더 노골적으로 드러났어.

  • 1

    자체 추론 모델은 증류 없이 마이크로소프트 데이터로 처음부터 학습됨

  • 2

    지피티-5.5 대비 최대 10배 비용 효율성을 주장함

  • 3

    자체 칩 마이아 200에서 엔비디아 최신 칩보다 효율이 높다고 설명함

  • 4

    코딩 모델은 깃허브에 최적화됐고 코파일럿 제품군은 슈퍼앱으로 묶임

  • 마이크로소프트가 자체 인공지능 모델 7종을 한꺼번에 공개함. 포인트는 명확함. 이제 오픈AI 모델만 빌려 쓰는 회사로 남지 않겠다는 얘기임.

    • 발표 무대는 연례 개발자회의 빌드였고, 무스타파 술레이만 마이크로소프트 인공지능 최고경영자가 직접 소개함.
    • 공개된 모델군에는 추론, 이미지 생성, 음성 전사, 음성 생성, 코딩 모델이 포함됨.
  • 가장 눈에 띄는 건 첫 자체 추론 모델인 MAI-싱킹-1임.

    • 활성 매개변수 350억 개 규모의 중형 모델이고, 다른 모델 결과를 따라 배우는 증류 없이 마이크로소프트가 확보한 데이터로 처음부터 학습했다고 밝힘.
    • 회사 설명대로라면 성능만 미는 초대형 모델이 아니라, 토큰 소모를 줄인 고효율 모델 쪽에 가까움.
    • 마이크로소프트는 이 모델이 지피티-5.5와 비교해 비용 효율성이 최대 10배라고 주장함. 이 숫자가 맞으면 대규모 서비스 운영 비용에서 꽤 큰 차이가 남.

중요

> 이번 발표의 핵심은 “오픈AI보다 더 센 모델을 만들었다”가 아니라 “마이크로소프트 제품 안에서 충분히 싸고 빠르게 돌릴 자체 모델을 확보했다”에 가까움.

  • 자체 칩 마이아 200 얘기도 같이 나옴. 모델 발표인데 칩 효율을 같이 꺼낸 게 중요함.

    • 마이크로소프트는 마이아 200으로 구동하면 엔비디아 그레이스블랙웰 200보다 더 높은 효율을 얻을 수 있다고 설명함.
    • 클라우드 사업자 입장에선 모델 품질만큼이나 추론 단가가 중요함. 코파일럿 같은 제품은 사용자가 많아질수록 토큰 비용이 바로 원가로 꽂히니까.
  • 벤치마크 주장도 꽤 공격적임.

    • 블라인드 평가에서는 앤트로픽 클로드 소넷 4.6보다 높은 평가를 받았다고 함.
    • 코딩 능력 평가인 SWE 벤치 프로에서는 클로드 오퍼스 4.6과 비슷한 점수를 얻었다고 밝힘.
    • 특히 복잡한 다단계 업무, 장문 맥락 추론, 코드 생성에 강점을 두고 설계됐다고 함.
  • 이미지·음성 모델도 같이 업데이트됨.

    • MAI-이미지-2.5는 지난 4월 공개한 이미지 생성 모델의 개선판이고, 구글의 나노 바나나 프로보다 높은 평가 점수를 받았다고 주장함.
    • 음성 전사 모델 MAI-트랜스크라이브-1.5는 기존 25개 언어에서 43개 언어로 정확도 높은 받아쓰기를 확장함.
    • 음성 생성 모델 MAI-보이스-2도 15개 이상 언어를 추가함.
  • 개발자에게 직접 닿는 모델은 MAI-코드-1임.

    • 마이크로소프트는 이 코딩 모델을 깃허브에 최적화했다고 설명함.
    • 깃허브, 코파일럿, 애저, 비주얼 스튜디오 생태계를 가진 회사가 자체 코딩 모델을 붙이면 배포 경로 자체가 엄청 강함.
    • 다만 당장 클로드 코드나 오픈AI 코덱스를 완전히 밀어내긴 어렵다는 평가도 있음. 코딩 도구 시장은 이미 경쟁 제품의 존재감이 꽤 큼.
  • 코파일럿 제품군은 하나의 슈퍼앱처럼 묶인다고 함.

    • 코파일럿 챗봇, 코파일럿 코워크, 코파일럿 코드 등을 통합하는 방향임.
    • 개발자 도구, 업무 자동화, 채팅형 인공지능을 따로 파는 게 아니라 마이크로소프트 업무 환경 안에 한 덩어리로 넣겠다는 전략으로 보임.
  • 배경에는 오픈AI와의 관계 변화가 있음.

    • 마이크로소프트는 2019년 오픈AI와 맺은 계약 때문에 독자 모델 개발에서 한동안 한발 물러나 있었음.
    • 지난해 10월 오픈AI가 공익영리법인 구조로 개편하는 과정에서 계약이 수정됐고, 마이크로소프트가 독자 모델 개발에 나설 수 있게 됨.
    • 그래서 이번 발표는 단순 신제품 공개라기보다 “우리도 자체 모델 스택을 갖는다”는 선언에 가까움.

기술 맥락

  • 마이크로소프트가 중형 추론 모델을 고른 이유는 비용 때문이에요. 코파일럿처럼 매일 엄청난 요청을 처리하는 서비스에서는 최고 성능 모델만 붙이면 추론비가 감당 안 되거든요.

  • 증류 없이 자체 데이터로 학습했다고 강조한 건 모델 독립성을 보여주려는 신호예요. 오픈AI 모델을 계속 쓰더라도, 핵심 제품에 붙일 대체 모델을 직접 갖고 있어야 협상력도 생기고 제품 로드맵도 덜 흔들려요.

  • 마이아 200 같은 자체 칩을 같이 언급한 것도 같은 맥락이에요. 모델, 칩, 클라우드 런타임, 코파일럿 제품을 한 회사가 묶으면 성능보다 중요한 운영 단가를 직접 최적화할 수 있어요.

  • 개발자 입장에서는 코딩 모델 자체보다 깃허브 최적화가 더 중요할 수 있어요. 코드 검색, 이슈, 풀 리퀘스트, 저장소 맥락까지 붙으면 모델 성능이 조금 낮아도 실제 작업 흐름에서는 더 유용하게 느껴질 수 있거든요.

모델 성능 1등 경쟁이라기보다, 마이크로소프트가 클라우드·칩·개발자 도구·업무용 코파일럿을 한 묶음으로 통제하려는 움직임에 가깝다. 개발자 입장에선 코파일럿 뒤에 어떤 모델이 붙는지가 점점 더 유동적인 시대가 된 셈.

댓글

댓글

댓글을 불러오는 중...

ai-ml

컴퓨텍스 2026, AI 경쟁 무대가 클라우드 밖 현실 세계로 옮겨간다

컴퓨텍스 2026은 'AI 투게더'를 내세우며 AI가 모델·연산 경쟁을 넘어 로봇, 제조 자동화, 돌봄, 엣지 디바이스 같은 현실 세계 적용 단계로 이동하고 있다는 메시지를 던졌다. 33개 국가·지역에서 1,500개 기업이 참가하고 6,000개 부스를 운영하는 역대 최대 규모 행사로, 퀄컴·마벨·인텔·NXP 등 주요 기업 CEO들이 기조연설에 나선다. 특히 로봇용 대규모 언어 모델 시장이 2028년 1,000억 달러를 넘고 연평균 48.2% 성장할 것이라는 전망이 핵심 숫자로 제시됐다.

ai-ml

엔비디아, 전 세계 AI 클라우드 생태계 넓히며 AI 팩토리 판 키운다

엔비디아가 지티시 타이베이에서 전 세계 AI 클라우드 파트너 생태계를 6개 대륙으로 확장하고 있다고 밝혔다. 핵심은 단순 GPU 공급이 아니라, 토큰 비용과 전력 효율까지 최적화한 풀스택 AI 팩토리 인프라를 지역별로 깔겠다는 전략이다.

ai-ml

MS, 클라우드 없이 도는 윈도 온디바이스 AI와 개발자용 RTX 데브박스 공개

마이크로소프트가 빌드 2026에서 클라우드를 거치지 않고 기기 안에서 AI 에이전트를 돌리는 온디바이스 AI 전략을 공개했어. 소형언어모델 아이언 1.0 두 종, 엔비디아 RTX 스파크 기반 서피스 하드웨어, WSL·터미널·파일 탐색기 개선까지 묶어 윈도를 AI 개발 플랫폼으로 다시 밀어붙이는 그림이야.

ai-ml

MS, 오픈AI·앤스로픽 겨냥한 자체 추론 모델 7종 공개

마이크로소프트가 빌드 행사에서 자체 학습한 추론 모델 MAI-싱킹-1과 코딩 모델 MAI-코드-1 등 7종을 공개했어. 오픈AI와 앤스로픽의 투자자이자 파트너였던 MS가 이제는 자체 모델, 에이전트, 개발자용 AI 하드웨어까지 묶어 직접 경쟁하는 쪽으로 방향을 튼 셈이야.

ai-ml

알파벳 120조원 증자, 악재가 아니라 AI 수요 신호라는 해석

미래에셋증권은 알파벳의 800억달러 규모 유상증자를 AI 인프라 투자 확대 신호로 해석했다. 단기 주가 하락은 부담이 아니라 매수 기회이며, 알파벳을 글로벌 AI 최선호주로 유지한다는 내용이다.