본문으로 건너뛰기
피드

엔비디아가 엔터프라이즈 AI 에이전트 풀스택을 밀어붙이는 중

ai-ml 약 7분
vote
0
댓글
북마크

엔비디아가 NemoClaw, Nemotron 3 Ultra, OpenShell, CUDA-X를 묶어 기업용 자율 AI 에이전트 생태계를 키우겠다고 공개했어. 핵심은 모델만 던지는 게 아니라 오케스트레이션, 보안 런타임, 도메인별 라이브러리까지 한 번에 제공해서 장기 실행형 에이전트를 업무 시스템 안에 넣겠다는 흐름이야.

  • 1

    Nemotron 3 Ultra는 5,500억 파라미터 전문가 혼합 모델이며 동급 오픈 프런티어 모델 대비 최대 5배 빠른 추론과 최대 30% 낮은 비용을 내세움

  • 2

    OpenShell은 에이전트가 로컬 파일, 도구, 컨텍스트에 접근할 때 정책과 개인정보 보호를 적용하는 보안 런타임 역할을 함

  • 3

    Cadence, Siemens, Synopsys, CrowdStrike, Palantir, Microsoft, Canonical, Red Hat 같은 기업들이 각자 에이전트 워크플로우에 엔비디아 스택을 붙이고 있음

엔비디아가 말하는 에이전트는 그냥 챗봇이 아님

  • 엔비디아가 기업용 AI 에이전트를 위한 스택을 한꺼번에 공개했음

    • NemoClaw 블루프린트, Nemotron 모델, OpenShell 보안 런타임, CUDA-X 라이브러리가 핵심 축임
    • 모델만 제공하는 게 아니라 모델을 실제 업무 시스템에서 굴리기 위한 하네스, 보안, 도구 계층까지 묶은 패키지에 가까움
  • 젠슨 황의 메시지는 꽤 노골적임. AI 에이전트를 “디지털 동료”로 업무 시스템 안에 넣겠다는 것

    • 엔지니어링, 헬스케어, 소프트웨어 개발, 비즈니스 운영 같은 장시간 작업을 에이전트가 맡는 그림임
    • 사람은 반복 워크플로우에서 빠지고, 더 큰 문제 정의와 판단 쪽으로 옮겨가라는 얘기임

중요

> Nemotron 3 Ultra는 5,500억 파라미터 전문가 혼합 모델이고, 동급 오픈 프런티어 모델 대비 최대 5배 빠른 추론과 최대 30% 낮은 비용을 주장함.

칩 설계와 시뮬레이션 쪽이 먼저 움직이는 중

  • 반도체와 산업 엔지니어링에서 에이전트 도입 명분은 확실함. 시뮬레이션과 검증이 너무 오래 걸리기 때문임

    • 원문은 며칠에서 몇 주 걸리는 반복 워크플로우를 에이전트에 맡기면 몇 시간 단위로 줄일 수 있다고 설명함
    • Cadence, Dassault Systèmes, Siemens, Synopsys, Flexcompute, PhysicsX 같은 기업들이 NemoClaw 기반 자율 AI 엔지니어를 만들고 있음
  • Cadence의 ChipStack AI Super Agent는 칩 설계와 검증을 자율 수행하는 쪽으로 가고 있음

    • 보안 강화를 위해 NVIDIA OpenShell을 사용함
    • 첫 고객 사례로 NVIDIA가 직접 칩 설계 검증에 활용한다는 점이 재밌는 포인트임
  • Siemens는 Fuse EDA AI Agent에 NemoClaw와 OpenShell을 통합 중임

    • 반도체, 3D 집적 회로, 인쇄 회로 기판 시스템 설계에서 멀티 툴 워크플로우를 계획하고 조정하는 역할임
    • EDA는 원래도 툴 체인이 복잡해서, 여기서 에이전트가 먹히면 파급력이 꽤 큼

보안 런타임이 없으면 기업 에이전트는 못 굴림

  • 자율 에이전트가 강력해질수록 보안 리스크도 같이 커짐

    • 코드를 작성하고, 하위 에이전트를 만들고, 세션 간 컨텍스트를 기억하고, 로컬 파일에 접근할 수 있기 때문임
    • 이 정도 권한이면 “똑똑한 자동화”가 아니라 사실상 업무망 안의 실행 주체임
  • OpenShell은 이 지점에서 정책과 개인정보 보호를 담당하는 런타임으로 등장함

    • Microsoft는 Windows 보안 프리미티브와 OpenShell을 엮어 사용자 인증, 격리, 정책, 엔드투엔드 보안을 제공하려고 함
    • Canonical은 Ubuntu 서버 환경에, Red Hat은 풀스택 Red Hat AI 플랫폼에 OpenShell을 통합하는 흐름임

⚠️주의

> 에이전트가 파일 접근, 도구 호출, 코드 실행까지 하게 되면 모델 품질보다 권한 제어가 먼저 터질 수 있음. 기업 도입에서 보안 런타임이 본체라는 얘기가 괜히 나오는 게 아님.

CUDA-X까지 에이전트 도구로 붙인다

  • 엔비디아는 에이전트가 CUDA-X 라이브러리를 도메인별 기술로 쓰게 만들겠다고 함

    • cuDF는 대규모 정형 데이터 처리와 분석을 가속함
    • cuOpt는 라우팅, 스케줄링, 리소스 할당, 공급망 최적화 문제를 실시간으로 풀게 해줌
    • PhysicsNeMo는 과학과 엔지니어링 시뮬레이션용 AI 물리 모델 구축과 벤치마킹을 지원함
  • 이 방향은 “말 잘하는 에이전트”에서 “전문 계산 도구를 다루는 에이전트”로 넘어가겠다는 의미임

    • 기업 입장에서는 보고서 작성보다 최적화, 분석, 시뮬레이션 같은 실제 비용 절감 영역이 훨씬 매력적임
    • 엔비디아 입장에서는 에이전트가 많아질수록 GPU, 라이브러리, 추론 인프라 수요가 같이 커지는 구조임

출시 일정도 이미 잡혀 있음

  • NemoClaw는 현재 이용 가능하고, OpenShell은 초기 프리뷰로 제공됨
    • Nemotron 3 Ultra는 6월 4일부터 Hugging Face, ModelScope, OpenRouter, build.nvidia.com에서 NVIDIA NIM 마이크로서비스 형태로 제공될 예정임
    • 인증된 NVIDIA 에이전트 스킬은 Claude Code 플러그인 마켓플레이스와 Hermes Skills Hub에서 제공됨

기술 맥락

  • 엔비디아가 여기서 고른 선택은 “모델 하나 더 공개”가 아니라 에이전트 실행 스택 전체를 잡는 쪽이에요. 기업 업무에서는 모델이 답을 잘하는 것만으로 부족하고, 어떤 도구를 언제 호출할지, 어디까지 권한을 줄지, 비용을 어떻게 제어할지가 실제 병목이거든요.

  • NemoClaw는 에이전트를 만들기 위한 블루프린트 역할을 하고, Nemotron은 그 안에서 판단과 생성을 맡는 모델 계층이에요. 여기에 OpenShell을 붙이는 이유는 에이전트가 로컬 파일이나 클라우드 모델을 오갈 때 개인정보와 정책을 제어해야 하기 때문이에요.

  • CUDA-X를 에이전트 도구로 제공하는 것도 중요한 선택이에요. 에이전트가 단순히 텍스트를 생성하는 데서 끝나면 업무 임팩트가 제한되지만, cuDF나 cuOpt 같은 라이브러리를 쓰면 데이터 분석, 스케줄링, 최적화 같은 실제 산업 문제로 들어갈 수 있거든요.

  • Microsoft, Canonical, Red Hat 같은 플랫폼 사업자와 같이 움직이는 건 배포 레이어를 의식한 전략이에요. 기업은 에이전트를 실험실이 아니라 Windows, Ubuntu, Red Hat AI, 온프레미스, 하이브리드 클라우드 안에서 굴려야 하니까요.

이건 단순한 모델 발표라기보다 엔비디아가 기업용 에이전트 운영체제 자리를 노리는 그림에 가까워. 한국 기업 입장에서도 에이전트를 실제 업무망에 넣으려면 모델 성능보다 권한, 정책, 비용, 도구 통합이 더 큰 병목이 된다는 점을 봐야 해.

댓글

댓글

댓글을 불러오는 중...

ai-ml

동아대와 메가존클라우드, 양자컴퓨팅·양자 머신러닝 단기 특강 연다

동아대 G-LAMP 연구소가 메가존클라우드와 함께 6월 29일부터 30일까지 양자컴퓨팅 단기 특강을 연다. 큐비트와 게이트 기초부터 AWS 브래킷 실습, 그로버·쇼어 알고리즘, 양자 머신러닝까지 이틀 안에 다루는 집중 과정이다.

ai-ml

기업 AI 에이전트가 너무 많아질 때, 답은 ‘오케스트레이션 레이어’라는 주장

엠클라우드브리지는 기업 내 AI 도구가 부서별로 따로 도입되며 생기는 ‘AI 사일로’를 문제로 짚고, 이를 묶는 중간 오케스트레이션 레이어를 제안한다. Ai 365는 MS 365·애저·패브릭 위에서 지식·데이터·업무·보안 에이전트를 통합 운영하는 엔터프라이즈 AI 플랫폼이다.

ai-ml

요기요, 제미나이 엔터프라이즈로 사내 AI 해커톤 열고 실제 서비스 적용 추진

메가존소프트와 구글클라우드가 요기요의 첫 사내 AI 해커톤을 기술 지원했다. 43개 팀이 57개 아이디어를 냈고, 대상은 메뉴 개선과 이미지 최적화를 제안한 ‘AI 메뉴 비서’가 받았다.

ai-ml

구글, 노트북에서 돌리는 멀티모달 오픈 모델 ‘젬마 4 12B’ 공개

구글이 개인 노트북과 온디바이스 환경에서 멀티모달 AI 에이전트를 돌릴 수 있는 오픈 모델 ‘젬마 4 12B’를 공개했다. 별도 이미지·오디오 인코더를 덜어낸 구조, 16GB급 메모리 환경 지원, 아파치 2.0 라이선스 배포가 핵심이다.

ai-ml

엔비디아와 델 무대에 오른 네이버클라우드, 무기는 풀스택 AI

네이버클라우드가 엔비디아와 델 행사에서 동시에 주요 AI 파트너로 언급됐어. 자체 대규모 언어 모델, 클라우드 인프라, 데이터센터, 서비스 운영까지 가진 풀스택 구조를 앞세워 추론 수요와 소버린 AI 시장을 노리고 있어.