본문으로 건너뛰기
피드

엔비디아, 기업용 자율 AI 에이전트 생태계 확장…네모트론·오픈쉘까지 공개

ai-ml 약 7분
vote
0
댓글
북마크

엔비디아가 GTC 타이베이에서 자율 AI 에이전트를 위한 소프트웨어, 오픈 모델, 보안 런타임, 파트너십을 대거 발표했다. 엔지니어링, 헬스케어, 제조, 사이버보안, 데이터 분석까지 기업 업무 시스템 안에서 장시간 실행되는 AI 에이전트를 만들겠다는 전략이다.

  • 1

    엔비디아는 네모클로, 네모트론, 오픈쉘을 중심으로 기업용 AI 에이전트 구축 도구를 공개

  • 2

    케이던스, 다쏘시스템, 지멘스, 시높시스 등 엔지니어링 소프트웨어 기업들이 자율 AI 엔지니어 구축에 참여

  • 3

    네모트론 3 울트라는 5500억 파라미터 전문가 혼합 모델로, 오픈 프론티어 모델 대비 추론 속도 최대 5배와 비용 최대 30% 절감을 내세움

  • 4

    마이크로소프트, 캐노니컬, 레드햇, SAP, 서비스나우 등이 오픈쉘 기반 보안 런타임 통합에 참여

엔비디아가 말하는 다음 단계는 ‘자율 AI 동료’임

  • 엔비디아가 GTC 타이베이에서 기업용 자율 AI 에이전트 생태계를 발표함

    • 엔지니어링, 헬스케어, 소프트웨어 개발, 비즈니스 운영 등 여러 분야가 대상
    • 단순 챗봇이 아니라 직원들과 협업하고 장시간 실행되는 ‘디지털 동료’에 가까운 포지션임
  • 엔비디아가 강조한 건 모델 하나가 아니라 에이전트를 둘러싼 소프트웨어 레이어임

    • 자율 에이전트를 만들려면 기본 모델만으로는 부족함
    • 오케스트레이션, 컨텍스트, 메모리, 도구 사용, 보안 같은 하네스 소프트웨어가 필요하다는 설명
  • 이번 발표의 핵심 구성요소는 네모트론, 네모클로, 오픈쉘임

    • 네모트론(Nemotron)은 에이전트 인텔리전스를 맡는 오픈 모델 계열
    • 네모클로(NeMo-Clo) 블루프린트는 여러 하네스를 연결하는 역할
    • 오픈쉘(OpenShell)은 정책과 개인정보 보호 제어를 설정하는 보안 런타임
    • 에이전트는 CUDA-X 라이브러리도 기술 기반으로 활용할 수 있다고 함

엔지니어링 쪽에서는 ‘몇 주 걸리던 일을 몇 시간’으로 줄이겠다는 그림

  • 반도체와 산업 엔지니어링 분야가 가장 강하게 언급됨

    • 시뮬레이션과 검증은 설계를 진행하려면 복잡하고 반복적인 워크플로를 계속 돌려야 해서 시간이 오래 걸리는 작업
    • 엔비디아는 상시 실행되는 자율 AI 엔지니어에게 이런 작업을 위임하면 몇 주 걸리던 엔지니어링 주기를 몇 시간으로 줄일 수 있다고 설명함
  • 참여 기업 라인업도 꽤 무거움

    • 케이던스, 다쏘시스템, 지멘스, 시높시스, 플렉스컴퓨트, 루미너리, 뉴럴컨셉, 엔탑, P-1 AI, 피직스엑스, 시네라 등이 언급됨
    • 이들은 네모클로를 활용해 직원과 함께 일하는 자율 AI 엔지니어를 구축했다고 소개됨
  • 반도체 설계 툴 회사들의 사례가 특히 눈에 띔

    • 케이던스는 오픈쉘을 활용해 칩 설계와 검증을 수행하는 칩스택 AI 슈퍼 에이전트의 보안을 강화함
    • 지멘스는 반도체, 3D 집적 회로, 인쇄 회로 기판 시스템 설계 전반의 멀티 툴 워크플로를 조정하는 퓨즈 EDA AI 에이전트에 통합 중
    • 시높시스는 칩 설계를 위한 상시 자율 AI 엔지니어를 구축하며 워크플로 완전 자율화를 목표로 한다고 함

중요

> 엔비디아가 제시한 숫자는 “몇 주 걸리던 엔지니어링 주기를 몇 시간으로 단축”임. 실제 적용 범위와 검증은 봐야겠지만, 겨냥하는 생산성 격차는 상당히 큼.

모델 발표도 있음. 네모트론 3 울트라는 5500억 파라미터 MoE

  • 엔비디아는 장기 실행형 에이전트를 위한 새로운 오픈 모델과 데이터셋도 공개함

    • 네모트론 연합을 기반으로 개발됐다고 설명됨
    • 항상 실행되는 에이전트에 필요한 지능을 강화하는 목적임
  • 네모트론 3 울트라(Nemotron 3 Ultra)는 5500억 개 파라미터를 가진 전문가 혼합(MoE) 모델임

    • 코딩, 연구, 기업 워크플로 전반에서 장기 실행되는 에이전트를 겨냥함
    • 동급 오픈 프론티어 모델 대비 추론 속도는 최대 5배 빠르고, 비용은 최대 30% 줄었다고 소개됨
  • 적용 분야도 엔터프라이즈 쪽으로 잡혀 있음

    • 크라우드스트라이크와 팔란티어를 포함한 기업 플랫폼에서 장기 실행형 AI 에이전트를 구현하는 데 쓰인다고 함
    • 사이버 보안과 복잡한 데이터 분석 같은 영역이 언급됨

안전장치 없이는 기업 에이전트가 못 들어간다는 판단

  • 에이전트가 강해질수록 보안 런타임의 중요성도 같이 커짐

    • 엔비디아와 마이크로소프트는 윈도우 보안 프리미티브와 오픈쉘 런타임을 기반으로 협력함
    • 목표는 에이전트가 사용자의 완전한 제어 아래 안전하게 작동하게 만드는 것
  • 오픈쉘 통합 파트너도 확장 중임

    • 캐노니컬은 오픈쉘을 우분투에 통합
    • 레드햇은 풀스택 레드햇 AI 플랫폼에 통합
    • SAP와 서비스나우도 각각 쥴 스튜디오 런타임과 프로젝트 아크를 오픈쉘로 보호하는 사례가 언급됨
  • 폭스콘 사례는 제조와 헬스케어 쪽 확장성을 보여줌

    • 뉴라봇과 코닥터 플랫폼에 네모클로를 시범 도입해 임상 추론, 문서화, 치료 조정을 지원함
    • MOM클로는 센서와 기계 데이터를 AI 에이전트와 연결해 스마트 공장 운영 인사이트와 실행 계획을 제공하는 에이전트로 소개됨
  • 젠슨 황은 AI 에이전트가 직원들이 더 빠르게 사고하고 복잡한 작업을 수행하게 돕는다고 말함

    • 엔비디아의 메시지는 명확함. 기업 업무 시스템 안에 AI 에이전트를 꽂고, 그 에이전트를 돌리는 모델·런타임·보안·가속 라이브러리까지 엔비디아 스택으로 묶겠다는 것임

기술 맥락

  • 이번 발표는 “좋은 모델 하나 공개”보다 “기업용 에이전트를 돌리는 전체 스택”에 가까워요. 에이전트가 실제 업무를 맡으려면 모델, 메모리, 도구 호출, 권한 제어, 실행 환경이 다 필요하거든요. 엔비디아는 이 레이어들을 네모트론, 네모클로, 오픈쉘로 묶으려는 거예요.

  • 네모트론 3 울트라가 중요한 이유는 장기 실행형 에이전트를 겨냥한다는 점이에요. 코딩이나 연구, 기업 워크플로는 한 번 답하고 끝나는 일이 아니라 여러 단계로 계획하고 확인하고 수정해야 해요. 그래서 모델의 추론 성능뿐 아니라 비용과 속도 수치가 같이 중요해져요.

  • 오픈쉘을 앞세우는 건 기업 도입에서 보안이 병목이기 때문이에요. 에이전트가 파일, 설계 도구, 제조 데이터, 임상 문서에 접근하려면 권한과 개인정보 보호 제어가 없으면 바로 막혀요. 그래서 런타임 레벨에서 정책을 걸 수 있다는 점을 강조하는 거예요.

  • 반도체 설계나 산업 시뮬레이션 사례가 많은 것도 우연이 아니에요. 이런 분야는 워크플로가 길고 반복적이며 도구가 많아서, 에이전트가 시간을 줄였을 때 체감 효과가 커요. 몇 주짜리 검증 루프를 몇 시간으로 줄인다는 메시지가 나오는 이유도 여기에 있어요.

엔비디아가 GPU 회사에서 ‘기업용 AI 에이전트 운영체제’ 쪽으로 계속 올라가고 있음. 모델, 런타임, 보안, 파트너 생태계를 한 번에 묶는 전략이라 단순 모델 발표보다 훨씬 플랫폼 냄새가 진함.

댓글

댓글

댓글을 불러오는 중...

ai-ml

앤트로픽, 미국 증권거래위원회에 기업공개 초안 비공개 제출

클로드를 만드는 앤트로픽이 미국 증권거래위원회에 기업공개를 위한 S-1 등록신고서 초안을 비공개로 냈다. 아직 상장 시점, 공모 주식 수, 가격은 정해지지 않았고, 시장 상황과 심사 결과에 따라 실제 기업공개 여부가 갈릴 수 있다.

ai-ml

비트코인 채굴업체 아이렌, GPU 확보에 36억5000만달러 조달

비트코인 채굴업체 아이렌이 AI 클라우드 사업 확대를 위해 36억5000만달러 규모의 GPU 도입 자금을 마련했다. 이 자금은 마이크로소프트 AI 클라우드 계약을 뒷받침하는 데 쓰일 예정이며, 채굴 인프라를 AI 컴퓨팅 인프라로 전환하려는 흐름을 보여준다.

ai-ml

네이버클라우드, 젠슨 황 방한 맞춰 엔비디아 협력안 공개 예고

김유원 네이버클라우드 대표가 엔비디아와의 구체적 협력안이 6월 8일쯤 3개 정도 발표될 것 같다고 밝혔다. 젠슨 황 엔비디아 최고경영자의 방한과 네이버 사옥 방문 가능성이 거론되며, 인공지능·클라우드·로보틱스 협력 기대가 커지고 있다.

ai-ml

젠슨 황 방한, 한국 인공지능 동맹이 반도체에서 로봇으로 넓어질까

젠슨 황 엔비디아 최고경영자가 컴퓨텍스 이후 한국을 찾아 네이버, 엘지, 현대차, 두산 등과 피지컬 인공지능 협력을 논의할 가능성이 커졌다는 내용임. 지난해 협력이 고대역폭 메모리와 인공지능 팩토리 중심이었다면, 이번에는 가정용 로봇·산업용 휴머노이드·스마트팩토리 같은 실제 물리 세계 애플리케이션으로 전선이 이동하는 분위기임.

ai-ml

수술로봇 10년, 다빈치 독주 속 피지컬 인공지능 경쟁이 본격화됨

수술로봇 개발자의 시각에서 2016년 알파고 이후 10년 동안 수술로봇과 의료 인공지능이 어떻게 바뀌었는지 짚은 글임. 다빈치 5는 이전 모델보다 1만 배 이상의 컴퓨팅 파워와 포스 피드백을 앞세웠고, 메드트로닉·존슨앤존슨·중국·인도 업체까지 경쟁 구도가 넓어지고 있음.