---
title: "엔비디아가 엔터프라이즈 AI 에이전트 풀스택을 밀어붙이는 중"
published: 2026-06-04T02:05:03.392Z
canonical: https://jeff.news/article/3678
---
# 엔비디아가 엔터프라이즈 AI 에이전트 풀스택을 밀어붙이는 중

엔비디아가 NemoClaw, Nemotron 3 Ultra, OpenShell, CUDA-X를 묶어 기업용 자율 AI 에이전트 생태계를 키우겠다고 공개했어. 핵심은 모델만 던지는 게 아니라 오케스트레이션, 보안 런타임, 도메인별 라이브러리까지 한 번에 제공해서 장기 실행형 에이전트를 업무 시스템 안에 넣겠다는 흐름이야.

## 엔비디아가 말하는 에이전트는 그냥 챗봇이 아님

- 엔비디아가 기업용 AI 에이전트를 위한 스택을 한꺼번에 공개했음
  - NemoClaw 블루프린트, Nemotron 모델, OpenShell 보안 런타임, CUDA-X 라이브러리가 핵심 축임
  - 모델만 제공하는 게 아니라 모델을 실제 업무 시스템에서 굴리기 위한 하네스, 보안, 도구 계층까지 묶은 패키지에 가까움

- 젠슨 황의 메시지는 꽤 노골적임. AI 에이전트를 “디지털 동료”로 업무 시스템 안에 넣겠다는 것
  - 엔지니어링, 헬스케어, 소프트웨어 개발, 비즈니스 운영 같은 장시간 작업을 에이전트가 맡는 그림임
  - 사람은 반복 워크플로우에서 빠지고, 더 큰 문제 정의와 판단 쪽으로 옮겨가라는 얘기임

> [!IMPORTANT]
> Nemotron 3 Ultra는 5,500억 파라미터 전문가 혼합 모델이고, 동급 오픈 프런티어 모델 대비 최대 5배 빠른 추론과 최대 30% 낮은 비용을 주장함.

## 칩 설계와 시뮬레이션 쪽이 먼저 움직이는 중

- 반도체와 산업 엔지니어링에서 에이전트 도입 명분은 확실함. 시뮬레이션과 검증이 너무 오래 걸리기 때문임
  - 원문은 며칠에서 몇 주 걸리는 반복 워크플로우를 에이전트에 맡기면 몇 시간 단위로 줄일 수 있다고 설명함
  - Cadence, Dassault Systèmes, Siemens, Synopsys, Flexcompute, PhysicsX 같은 기업들이 NemoClaw 기반 자율 AI 엔지니어를 만들고 있음

- Cadence의 ChipStack AI Super Agent는 칩 설계와 검증을 자율 수행하는 쪽으로 가고 있음
  - 보안 강화를 위해 NVIDIA OpenShell을 사용함
  - 첫 고객 사례로 NVIDIA가 직접 칩 설계 검증에 활용한다는 점이 재밌는 포인트임

- Siemens는 Fuse EDA AI Agent에 NemoClaw와 OpenShell을 통합 중임
  - 반도체, 3D 집적 회로, 인쇄 회로 기판 시스템 설계에서 멀티 툴 워크플로우를 계획하고 조정하는 역할임
  - EDA는 원래도 툴 체인이 복잡해서, 여기서 에이전트가 먹히면 파급력이 꽤 큼

## 보안 런타임이 없으면 기업 에이전트는 못 굴림

- 자율 에이전트가 강력해질수록 보안 리스크도 같이 커짐
  - 코드를 작성하고, 하위 에이전트를 만들고, 세션 간 컨텍스트를 기억하고, 로컬 파일에 접근할 수 있기 때문임
  - 이 정도 권한이면 “똑똑한 자동화”가 아니라 사실상 업무망 안의 실행 주체임

- OpenShell은 이 지점에서 정책과 개인정보 보호를 담당하는 런타임으로 등장함
  - Microsoft는 Windows 보안 프리미티브와 OpenShell을 엮어 사용자 인증, 격리, 정책, 엔드투엔드 보안을 제공하려고 함
  - Canonical은 Ubuntu 서버 환경에, Red Hat은 풀스택 Red Hat AI 플랫폼에 OpenShell을 통합하는 흐름임

> [!WARNING]
> 에이전트가 파일 접근, 도구 호출, 코드 실행까지 하게 되면 모델 품질보다 권한 제어가 먼저 터질 수 있음. 기업 도입에서 보안 런타임이 본체라는 얘기가 괜히 나오는 게 아님.

## CUDA-X까지 에이전트 도구로 붙인다

- 엔비디아는 에이전트가 CUDA-X 라이브러리를 도메인별 기술로 쓰게 만들겠다고 함
  - cuDF는 대규모 정형 데이터 처리와 분석을 가속함
  - cuOpt는 라우팅, 스케줄링, 리소스 할당, 공급망 최적화 문제를 실시간으로 풀게 해줌
  - PhysicsNeMo는 과학과 엔지니어링 시뮬레이션용 AI 물리 모델 구축과 벤치마킹을 지원함

- 이 방향은 “말 잘하는 에이전트”에서 “전문 계산 도구를 다루는 에이전트”로 넘어가겠다는 의미임
  - 기업 입장에서는 보고서 작성보다 최적화, 분석, 시뮬레이션 같은 실제 비용 절감 영역이 훨씬 매력적임
  - 엔비디아 입장에서는 에이전트가 많아질수록 GPU, 라이브러리, 추론 인프라 수요가 같이 커지는 구조임

## 출시 일정도 이미 잡혀 있음

- NemoClaw는 현재 이용 가능하고, OpenShell은 초기 프리뷰로 제공됨
  - Nemotron 3 Ultra는 6월 4일부터 Hugging Face, ModelScope, OpenRouter, build.nvidia.com에서 NVIDIA NIM 마이크로서비스 형태로 제공될 예정임
  - 인증된 NVIDIA 에이전트 스킬은 Claude Code 플러그인 마켓플레이스와 Hermes Skills Hub에서 제공됨

---

## 기술 맥락

- 엔비디아가 여기서 고른 선택은 “모델 하나 더 공개”가 아니라 에이전트 실행 스택 전체를 잡는 쪽이에요. 기업 업무에서는 모델이 답을 잘하는 것만으로 부족하고, 어떤 도구를 언제 호출할지, 어디까지 권한을 줄지, 비용을 어떻게 제어할지가 실제 병목이거든요.

- NemoClaw는 에이전트를 만들기 위한 블루프린트 역할을 하고, Nemotron은 그 안에서 판단과 생성을 맡는 모델 계층이에요. 여기에 OpenShell을 붙이는 이유는 에이전트가 로컬 파일이나 클라우드 모델을 오갈 때 개인정보와 정책을 제어해야 하기 때문이에요.

- CUDA-X를 에이전트 도구로 제공하는 것도 중요한 선택이에요. 에이전트가 단순히 텍스트를 생성하는 데서 끝나면 업무 임팩트가 제한되지만, cuDF나 cuOpt 같은 라이브러리를 쓰면 데이터 분석, 스케줄링, 최적화 같은 실제 산업 문제로 들어갈 수 있거든요.

- Microsoft, Canonical, Red Hat 같은 플랫폼 사업자와 같이 움직이는 건 배포 레이어를 의식한 전략이에요. 기업은 에이전트를 실험실이 아니라 Windows, Ubuntu, Red Hat AI, 온프레미스, 하이브리드 클라우드 안에서 굴려야 하니까요.

## 핵심 포인트

- Nemotron 3 Ultra는 5,500억 파라미터 전문가 혼합 모델이며 동급 오픈 프런티어 모델 대비 최대 5배 빠른 추론과 최대 30% 낮은 비용을 내세움
- OpenShell은 에이전트가 로컬 파일, 도구, 컨텍스트에 접근할 때 정책과 개인정보 보호를 적용하는 보안 런타임 역할을 함
- Cadence, Siemens, Synopsys, CrowdStrike, Palantir, Microsoft, Canonical, Red Hat 같은 기업들이 각자 에이전트 워크플로우에 엔비디아 스택을 붙이고 있음

## 인사이트

이건 단순한 모델 발표라기보다 엔비디아가 기업용 에이전트 운영체제 자리를 노리는 그림에 가까워. 한국 기업 입장에서도 에이전트를 실제 업무망에 넣으려면 모델 성능보다 권한, 정책, 비용, 도구 통합이 더 큰 병목이 된다는 점을 봐야 해.