본문으로 건너뛰기
피드

MS, 클라우드 없이 도는 윈도 온디바이스 AI와 개발자용 RTX 데브박스 공개

ai-ml 약 7분
vote
0
댓글
북마크

마이크로소프트가 빌드 2026에서 클라우드를 거치지 않고 기기 안에서 AI 에이전트를 돌리는 온디바이스 AI 전략을 공개했어. 소형언어모델 아이언 1.0 두 종, 엔비디아 RTX 스파크 기반 서피스 하드웨어, WSL·터미널·파일 탐색기 개선까지 묶어 윈도를 AI 개발 플랫폼으로 다시 밀어붙이는 그림이야.

  • 1

    MS가 윈도 내장 온디바이스 AI 모델 아이언 1.0 인스트럭트와 아이언 1.0 플랜을 공개함

  • 2

    두 모델을 결합하면 클라우드 없이 기기 내부에서 로컬 에이전틱 루프를 구성할 수 있다고 설명함

  • 3

    서피스 RTX 스파크 데브 박스는 1페타플롭 처리 성능과 128GB 통합 메모리를 갖춘 개발자용 장비임

  • 4

    데모에서는 1200억 파라미터 모델 포함 로컬 모델 3개를 동시에 구동함

  • 5

    WSL 컨테이너 GPU 지원, 인텔리전트 터미널, 파일 탐색기 Git 연동 등 개발 환경도 개편됨

  • MS가 빌드 2026에서 온디바이스 AI를 본격 선언함. 핵심은 클라우드에 매번 요청하지 않고, 윈도 기기 안에서 AI 모델과 에이전트를 돌리겠다는 것임

    • 사티아 나델라 CEO는 “모든 책상과 가정에 무제한 인텔리전스”를 제공하는 게 목표라고 말함
    • 기존 클라우드 AI 중심 구조에서 PC 자체가 AI 실행 환경이 되는 방향으로 가겠다는 신호임
  • 새로 공개된 모델은 윈도에 내장되는 온디바이스 전용 AI 모델 2종임

    • 아이언 1.0 인스트럭트는 추론에 특화된 소형언어모델(SLM)임
    • 아이언 1.0 플랜은 에이전트 작업의 계획과 실행을 담당함
    • MS는 두 모델을 결합하면 클라우드를 거치지 않고 기기 안에서 완전한 로컬 에이전틱 루프를 만들 수 있다고 설명함

중요

> 로컬 에이전틱 루프가 핵심임. 단순히 모델을 PC에서 실행하는 수준이 아니라, 계획 수립과 실행 흐름까지 기기 안에서 끝내겠다는 얘기라 프라이버시·지연 시간·비용에 직접 영향을 줌.

  • 온디바이스 AI의 장점은 꽤 현실적임

    • 사용자 요청을 인터넷으로 클라우드 서버에 보내지 않아도 되니 응답 지연이 줄어듦
    • 토큰 사용량과 서버 비용 부담도 낮출 수 있음
    • 민감한 데이터가 외부 서버로 나가지 않는다는 점에서 프라이버시 이점도 있음
  • MS 제품 안에서도 이미 로컬 AI 활용이 늘고 있음

    • 아웃룩 이메일 요약, 파워포인트 대체 텍스트, 팀즈 해상도 향상이 예시로 나옴
    • 어도비 애프터 이펙츠와 프리미어 같은 서드파티 앱도 윈도 ML을 통해 NPU·GPU 기반 온디바이스 처리를 활용 중임
  • 하드웨어 쪽에서는 엔비디아 RTX 스파크 기반 신규 제품 2종이 공개됨

    • RTX 스파크는 20개 ARM CPU 코어, 블랙웰 아키텍처 기반 GPU, 128GB 통합 메모리를 단일 칩으로 묶은 엔비디아 PC용 차세대 SoC임
    • CPU와 GPU는 NVLink C2C 고속 인터페이스로 연결됨
    • MS는 이를 탑재한 서피스 랩탑 울트라와 서피스 RTX 스파크 데브 박스를 올가을 출시할 예정임
  • 서피스 랩탑 울트라는 개발자와 파워유저를 겨냥한 고성능 노트북임

    • 15인치 미니LED 터치스크린을 탑재함
    • 최대 2000니트 밝기와 128GB 통합 메모리를 제공함
  • 더 개발자 냄새가 나는 제품은 서피스 RTX 스파크 데브 박스임

    • AI 연산에 특화된 개발자용 워크스테이션임
    • 처리 성능은 1페타플롭, 즉 초당 1000조 번 연산 수준으로 제시됨
    • 기사 표현대로라면 예전에는 데이터센터 서버급으로 보던 성능을 책상 위 장비로 가져오는 그림임
  • 데모 수치도 꽤 세게 나옴

    • 데브 박스에서 1200억 파라미터 모델을 포함해 로컬 모델 3개를 동시에 구동하는 장면이 시연됨
    • GPU 메모리 90GB를 활용해 약 340만 토큰을 로컬에서 처리한 사례도 공유됨
    • 로컬 AI가 장난감 모델 수준을 넘어서 대형 모델 실험 장비로 가고 있다는 메시지임
  • MS는 윈도 개발 환경도 같이 손보고 있음

    • AMD 라이젠, 인텔 팬서레이크, 퀄컴 스냅드래곤 X 엘리트와 스냅드래곤 C까지 다양한 칩셋이 윈도 AI 플랫폼을 지원함
    • 깃허브 코파일럿을 내장한 인텔리전트 터미널은 터미널 오류를 실시간 감지하고 수정안을 제안함
    • 에이전트 창과 일반 터미널 창을 동시에 운용할 수 있음
  • 리눅스 개발자까지 윈도로 끌어오려는 기능도 보임

    • WSL 컨테이너 정식 지원으로 리눅스 기반 개발 환경에서도 GPU를 직접 활용할 수 있게 됨
    • 파일 탐색기에는 Git 연동 기능이 추가됨
    • 스타십, Z셸, 홈브루도 윈도 네이티브로 지원한다고 밝힘
  • 전체적으로 MS의 메시지는 명확함. 윈도를 다시 개발자가 가장 먼저 선택하는 AI 플랫폼으로 만들겠다는 것임

    • 클라우드와 온디바이스가 함께 작동하는 플랫폼을 개발자 가치의 토대로 보겠다는 설명임
    • 노트북, 데스크톱, 클라우드 어디서든 윈도 기반 AI 개발 흐름을 이어가게 만들려는 전략임

기술 맥락

  • MS가 온디바이스 AI를 밀어붙이는 이유는 클라우드 AI만으로는 비용과 지연 시간, 프라이버시 문제를 다 해결하기 어렵기 때문이에요. 이메일 요약이나 영상 처리처럼 개인 데이터가 많이 들어가는 작업은 로컬에서 처리하는 편이 사용자와 기업 모두에게 부담이 적어요.

  • 아이언 1.0 모델 두 종을 나눈 것도 역할 분리 때문이에요. 하나는 사용자의 요청을 이해하고 추론하고, 다른 하나는 에이전트가 어떤 순서로 작업할지 계획하는 식이에요. 로컬에서 이런 루프가 돌면 네트워크가 느리거나 끊겨도 일정 수준의 자동화가 가능해져요.

  • RTX 스파크 데브 박스가 중요한 건 개발자가 대형 모델 실험을 꼭 클라우드에서만 하지 않아도 되는 방향을 보여주기 때문이에요. 1200억 파라미터 모델 포함 3개 모델을 로컬에서 동시에 돌렸다는 데모는, 로컬 개발 장비의 기준이 바뀔 수 있다는 신호예요.

  • WSL 컨테이너 GPU 지원은 AI 개발자에게 꽤 실용적인 변화예요. 많은 AI 툴체인이 리눅스 기준으로 돌아가는데, 윈도에서 GPU까지 제대로 붙이면 듀얼부팅이나 별도 리눅스 장비 없이 실험 환경을 구성하기 쉬워지거든요.

  • 결국 MS의 선택은 모델, 하드웨어, 개발 도구를 한 번에 묶는 쪽이에요. 온디바이스 AI 모델만 내놓으면 앱이 부족하고, 하드웨어만 내놓으면 개발 흐름이 약해요. 그래서 윈도 ML, WSL, 터미널, 코파일럿, 서피스 장비를 같이 밀어 윈도 안에서 개발과 실행을 끝내려는 거예요.

MS가 말하는 온디바이스 AI는 단순히 인터넷 안 될 때도 챗봇 쓰자는 얘기가 아니야. 프라이버시, 지연 시간, 비용, 개발자 경험을 묶어서 윈도 PC를 다시 AI 개발의 기본 장비로 만들겠다는 시도에 가깝다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

컴퓨텍스 2026, AI 경쟁 무대가 클라우드 밖 현실 세계로 옮겨간다

컴퓨텍스 2026은 'AI 투게더'를 내세우며 AI가 모델·연산 경쟁을 넘어 로봇, 제조 자동화, 돌봄, 엣지 디바이스 같은 현실 세계 적용 단계로 이동하고 있다는 메시지를 던졌다. 33개 국가·지역에서 1,500개 기업이 참가하고 6,000개 부스를 운영하는 역대 최대 규모 행사로, 퀄컴·마벨·인텔·NXP 등 주요 기업 CEO들이 기조연설에 나선다. 특히 로봇용 대규모 언어 모델 시장이 2028년 1,000억 달러를 넘고 연평균 48.2% 성장할 것이라는 전망이 핵심 숫자로 제시됐다.

ai-ml

엔비디아, 전 세계 AI 클라우드 생태계 넓히며 AI 팩토리 판 키운다

엔비디아가 지티시 타이베이에서 전 세계 AI 클라우드 파트너 생태계를 6개 대륙으로 확장하고 있다고 밝혔다. 핵심은 단순 GPU 공급이 아니라, 토큰 비용과 전력 효율까지 최적화한 풀스택 AI 팩토리 인프라를 지역별로 깔겠다는 전략이다.

ai-ml

MS, 오픈AI·앤스로픽 겨냥한 자체 추론 모델 7종 공개

마이크로소프트가 빌드 행사에서 자체 학습한 추론 모델 MAI-싱킹-1과 코딩 모델 MAI-코드-1 등 7종을 공개했어. 오픈AI와 앤스로픽의 투자자이자 파트너였던 MS가 이제는 자체 모델, 에이전트, 개발자용 AI 하드웨어까지 묶어 직접 경쟁하는 쪽으로 방향을 튼 셈이야.

ai-ml

알파벳 120조원 증자, 악재가 아니라 AI 수요 신호라는 해석

미래에셋증권은 알파벳의 800억달러 규모 유상증자를 AI 인프라 투자 확대 신호로 해석했다. 단기 주가 하락은 부담이 아니라 매수 기회이며, 알파벳을 글로벌 AI 최선호주로 유지한다는 내용이다.

ai-ml

오픈AI·앤스로픽 IPO, AI 열풍의 진짜 시험대가 온다

오픈AI와 앤스로픽이 올가을 상장을 추진하면서, 사모시장에서 치솟은 AI 기업 가치가 공개시장에서도 통할지가 관전 포인트가 됐음. 투자자들은 AI 시대의 핵심 플랫폼 지분을 살 기회로 보지만, 모델 학습·운영에 들어가는 반도체, 데이터센터, 전력 비용이 수익성의 발목을 잡을 수 있음.