---
title: "MS, 클라우드 없이 도는 윈도 온디바이스 AI와 개발자용 RTX 데브박스 공개"
published: 2026-06-02T20:35:05.241Z
canonical: https://jeff.news/article/3628
---
# MS, 클라우드 없이 도는 윈도 온디바이스 AI와 개발자용 RTX 데브박스 공개

마이크로소프트가 빌드 2026에서 클라우드를 거치지 않고 기기 안에서 AI 에이전트를 돌리는 온디바이스 AI 전략을 공개했어. 소형언어모델 아이언 1.0 두 종, 엔비디아 RTX 스파크 기반 서피스 하드웨어, WSL·터미널·파일 탐색기 개선까지 묶어 윈도를 AI 개발 플랫폼으로 다시 밀어붙이는 그림이야.

- MS가 빌드 2026에서 온디바이스 AI를 본격 선언함. 핵심은 클라우드에 매번 요청하지 않고, 윈도 기기 안에서 AI 모델과 에이전트를 돌리겠다는 것임
  - 사티아 나델라 CEO는 “모든 책상과 가정에 무제한 인텔리전스”를 제공하는 게 목표라고 말함
  - 기존 클라우드 AI 중심 구조에서 PC 자체가 AI 실행 환경이 되는 방향으로 가겠다는 신호임

- 새로 공개된 모델은 윈도에 내장되는 온디바이스 전용 AI 모델 2종임
  - 아이언 1.0 인스트럭트는 추론에 특화된 소형언어모델(SLM)임
  - 아이언 1.0 플랜은 에이전트 작업의 계획과 실행을 담당함
  - MS는 두 모델을 결합하면 클라우드를 거치지 않고 기기 안에서 완전한 로컬 에이전틱 루프를 만들 수 있다고 설명함

> [!IMPORTANT]
> 로컬 에이전틱 루프가 핵심임. 단순히 모델을 PC에서 실행하는 수준이 아니라, 계획 수립과 실행 흐름까지 기기 안에서 끝내겠다는 얘기라 프라이버시·지연 시간·비용에 직접 영향을 줌.

- 온디바이스 AI의 장점은 꽤 현실적임
  - 사용자 요청을 인터넷으로 클라우드 서버에 보내지 않아도 되니 응답 지연이 줄어듦
  - 토큰 사용량과 서버 비용 부담도 낮출 수 있음
  - 민감한 데이터가 외부 서버로 나가지 않는다는 점에서 프라이버시 이점도 있음

- MS 제품 안에서도 이미 로컬 AI 활용이 늘고 있음
  - 아웃룩 이메일 요약, 파워포인트 대체 텍스트, 팀즈 해상도 향상이 예시로 나옴
  - 어도비 애프터 이펙츠와 프리미어 같은 서드파티 앱도 윈도 ML을 통해 NPU·GPU 기반 온디바이스 처리를 활용 중임

- 하드웨어 쪽에서는 엔비디아 RTX 스파크 기반 신규 제품 2종이 공개됨
  - RTX 스파크는 20개 ARM CPU 코어, 블랙웰 아키텍처 기반 GPU, 128GB 통합 메모리를 단일 칩으로 묶은 엔비디아 PC용 차세대 SoC임
  - CPU와 GPU는 NVLink C2C 고속 인터페이스로 연결됨
  - MS는 이를 탑재한 서피스 랩탑 울트라와 서피스 RTX 스파크 데브 박스를 올가을 출시할 예정임

- 서피스 랩탑 울트라는 개발자와 파워유저를 겨냥한 고성능 노트북임
  - 15인치 미니LED 터치스크린을 탑재함
  - 최대 2000니트 밝기와 128GB 통합 메모리를 제공함

- 더 개발자 냄새가 나는 제품은 서피스 RTX 스파크 데브 박스임
  - AI 연산에 특화된 개발자용 워크스테이션임
  - 처리 성능은 1페타플롭, 즉 초당 1000조 번 연산 수준으로 제시됨
  - 기사 표현대로라면 예전에는 데이터센터 서버급으로 보던 성능을 책상 위 장비로 가져오는 그림임

- 데모 수치도 꽤 세게 나옴
  - 데브 박스에서 1200억 파라미터 모델을 포함해 로컬 모델 3개를 동시에 구동하는 장면이 시연됨
  - GPU 메모리 90GB를 활용해 약 340만 토큰을 로컬에서 처리한 사례도 공유됨
  - 로컬 AI가 장난감 모델 수준을 넘어서 대형 모델 실험 장비로 가고 있다는 메시지임

- MS는 윈도 개발 환경도 같이 손보고 있음
  - AMD 라이젠, 인텔 팬서레이크, 퀄컴 스냅드래곤 X 엘리트와 스냅드래곤 C까지 다양한 칩셋이 윈도 AI 플랫폼을 지원함
  - 깃허브 코파일럿을 내장한 인텔리전트 터미널은 터미널 오류를 실시간 감지하고 수정안을 제안함
  - 에이전트 창과 일반 터미널 창을 동시에 운용할 수 있음

- 리눅스 개발자까지 윈도로 끌어오려는 기능도 보임
  - WSL 컨테이너 정식 지원으로 리눅스 기반 개발 환경에서도 GPU를 직접 활용할 수 있게 됨
  - 파일 탐색기에는 Git 연동 기능이 추가됨
  - 스타십, Z셸, 홈브루도 윈도 네이티브로 지원한다고 밝힘

- 전체적으로 MS의 메시지는 명확함. 윈도를 다시 개발자가 가장 먼저 선택하는 AI 플랫폼으로 만들겠다는 것임
  - 클라우드와 온디바이스가 함께 작동하는 플랫폼을 개발자 가치의 토대로 보겠다는 설명임
  - 노트북, 데스크톱, 클라우드 어디서든 윈도 기반 AI 개발 흐름을 이어가게 만들려는 전략임

---

## 기술 맥락

- MS가 온디바이스 AI를 밀어붙이는 이유는 클라우드 AI만으로는 비용과 지연 시간, 프라이버시 문제를 다 해결하기 어렵기 때문이에요. 이메일 요약이나 영상 처리처럼 개인 데이터가 많이 들어가는 작업은 로컬에서 처리하는 편이 사용자와 기업 모두에게 부담이 적어요.

- 아이언 1.0 모델 두 종을 나눈 것도 역할 분리 때문이에요. 하나는 사용자의 요청을 이해하고 추론하고, 다른 하나는 에이전트가 어떤 순서로 작업할지 계획하는 식이에요. 로컬에서 이런 루프가 돌면 네트워크가 느리거나 끊겨도 일정 수준의 자동화가 가능해져요.

- RTX 스파크 데브 박스가 중요한 건 개발자가 대형 모델 실험을 꼭 클라우드에서만 하지 않아도 되는 방향을 보여주기 때문이에요. 1200억 파라미터 모델 포함 3개 모델을 로컬에서 동시에 돌렸다는 데모는, 로컬 개발 장비의 기준이 바뀔 수 있다는 신호예요.

- WSL 컨테이너 GPU 지원은 AI 개발자에게 꽤 실용적인 변화예요. 많은 AI 툴체인이 리눅스 기준으로 돌아가는데, 윈도에서 GPU까지 제대로 붙이면 듀얼부팅이나 별도 리눅스 장비 없이 실험 환경을 구성하기 쉬워지거든요.

- 결국 MS의 선택은 모델, 하드웨어, 개발 도구를 한 번에 묶는 쪽이에요. 온디바이스 AI 모델만 내놓으면 앱이 부족하고, 하드웨어만 내놓으면 개발 흐름이 약해요. 그래서 윈도 ML, WSL, 터미널, 코파일럿, 서피스 장비를 같이 밀어 윈도 안에서 개발과 실행을 끝내려는 거예요.

## 핵심 포인트

- MS가 윈도 내장 온디바이스 AI 모델 아이언 1.0 인스트럭트와 아이언 1.0 플랜을 공개함
- 두 모델을 결합하면 클라우드 없이 기기 내부에서 로컬 에이전틱 루프를 구성할 수 있다고 설명함
- 서피스 RTX 스파크 데브 박스는 1페타플롭 처리 성능과 128GB 통합 메모리를 갖춘 개발자용 장비임
- 데모에서는 1200억 파라미터 모델 포함 로컬 모델 3개를 동시에 구동함
- WSL 컨테이너 GPU 지원, 인텔리전트 터미널, 파일 탐색기 Git 연동 등 개발 환경도 개편됨

## 인사이트

MS가 말하는 온디바이스 AI는 단순히 인터넷 안 될 때도 챗봇 쓰자는 얘기가 아니야. 프라이버시, 지연 시간, 비용, 개발자 경험을 묶어서 윈도 PC를 다시 AI 개발의 기본 장비로 만들겠다는 시도에 가깝다.