본문으로 건너뛰기
피드

레드햇·엔비디아, 에이전틱 AI 운영 보안 강화한 AI 팩토리 업데이트 공개

ai-ml 약 8분
vote
0
댓글
북마크

레드햇이 엔비디아와 공동 개발한 ‘레드햇 AI 팩토리 위드 엔비디아’의 신규 기능을 공개했어. 핵심은 계속 실행되는 AI 에이전트를 기업 환경에서 안전하게 운영하기 위한 샌드박스 런타임, 컨피덴셜 컨테이너, 추적·감사 기능 강화야.

  • 1

    레드햇과 엔비디아가 에이전틱 AI 보안을 강화한 AI 팩토리 신규 기능을 발표함

  • 2

    오픈셸을 통해 자율 AI 에이전트의 실행, 접근 권한, 추론 경로를 정책 레이어에서 제어하려 함

  • 3

    컨피덴셜 컨테이너와 엔비디아 컨피덴셜 컴퓨팅으로 신뢰 경계를 하드웨어 수준까지 확장함

  • 4

    레드햇 AI 3.4에는 MaaS, 오픈AI 호환 인터페이스, MLflow 기반 추적 기능이 통합됨

  • 5

    블랙웰 지원과 베라 루빈 플랫폼 지원 개발까지 포함해 AI 인프라 스택을 넓히는 흐름임

에이전트를 프로덕션에 올릴 때 필요한 건 성능만이 아님

  • 레드햇이 엔비디아와 공동 개발한 ‘레드햇 AI 팩토리 위드 엔비디아’ 신규 기능을 공개함

    • 이번 업데이트의 핵심은 계속 운영되는 AI 에이전트의 보안 강화
    • 기업이 실험 단계를 넘어 프로덕션 환경으로 에이전틱 AI를 옮길 수 있게 하는 데 초점을 둠
    • 레드햇 AI 엔터프라이즈와 엔비디아 AI 엔터프라이즈의 모델, 툴, 프레임워크를 묶은 플랫폼임
  • 제일 눈에 띄는 건 오픈셸 통합 추진임

    • 오픈셸은 엔비디아가 설립한 오픈소스 프로젝트
    • 자율 AI 에이전트를 위한 샌드박스 런타임을 제공함
    • 에이전트의 실행 방식, 접근 권한, 추론 처리 경로를 정책 레이어에서 제어하고 모니터링하는 게 목표임

중요

> 에이전트가 실제 업무 시스템에 붙으면 “답변이 맞나”보다 “무슨 권한으로 뭘 실행했나”가 더 큰 문제가 됨. 이번 업데이트는 그 지점을 정면으로 다룸.

sequenceDiagram
    participant 개발자
    participant 에이전트
    participant 오픈셸
    participant 정책레이어
    participant 업무시스템
    개발자->>에이전트: 업무 목표 전달
    에이전트->>오픈셸: 도구 실행 요청
    오픈셸->>정책레이어: 권한과 실행 조건 확인
    정책레이어-->>오픈셸: 허용 범위 반환
    오픈셸->>업무시스템: 제한된 권한으로 작업 수행
    업무시스템-->>오픈셸: 결과 반환
    오픈셸-->>에이전트: 감사 가능한 실행 결과 전달

신뢰 경계를 소프트웨어에서 하드웨어까지 확장

  • 레드햇은 컨피덴셜 컴퓨팅으로 신뢰 경계를 하드웨어 수준까지 넓히겠다고 설명함

    • 컨피덴셜 컨테이너를 통해 런타임 단계의 에이전트 손상을 막는 방향
    • 한 에이전트가 침해돼도 다른 에이전트나 전체 런타임으로 피해가 번지는 걸 줄이려는 설계
    • 이 기능은 현재 기술 프리뷰로 제공됨
  • 보안 스택은 꽤 기업형으로 묶여 있음

    • 레드햇 오픈시프트 샌드박스 컨테이너와 엔비디아 컨피덴셜 컴퓨팅을 활용함
    • SELinux, FIPS 컴플라이언스, 엔비디아 도카 기반 런타임 보호 기능과 결합됨
    • 핵심 데이터센터부터 엣지까지 적용하는 제로 트러스트 아키텍처를 겨냥함
  • 규제 대응도 중요한 배경임

    • 레드햇은 EU AI 법 같은 보안·거버넌스 규정 대응을 언급함
    • 에이전트가 분산 환경에서 데이터를 다루는 만큼, 어디서 어떤 통제가 걸렸는지 증명하는 일이 중요해짐

모델 호출, 추적, 배포까지 같이 묶음

  • 레드햇 AI 3.4의 기능도 AI 팩토리에 통합됨

    • 레드햇 AI 게이트웨이를 통한 거버넌스 기반 서비스형 모델(MaaS) 환경이 포함됨
    • 개발자는 표준 오픈AI 호환 인터페이스로 엔비디아 네모트론 같은 선별 모델에 접근할 수 있음
    • 모델 접근을 플랫폼 안에서 통제하면서도 개발자 경험은 익숙한 API 형태로 맞추려는 그림임
  • 운영 추적은 MLflow 기반으로 강화됨

    • LLM 호출, 도구 실행, 추론 단계 전반을 엔드투엔드로 추적함
    • 기업은 에이전트가 특정 결과에 도달한 과정을 감사할 수 있음
    • 개발 속도와 운영 안정성 사이의 간극을 줄이겠다는 의도임

⚠️주의

> 에이전트가 툴을 실행하고 사내 데이터에 접근하는 순간, 로그와 추적이 없으면 장애 분석도 보안 감사도 거의 불가능해짐. 프로덕션 에이전트에서 관측성은 선택 기능이 아니라 기본 체력에 가까움.

엔비디아 인프라 세대교체까지 따라감

  • 레드햇은 ‘레드햇 엔터프라이즈 리눅스 포 엔비디아’ 26.01도 정식 출시함

    • 이번 버전은 엔비디아 블랙웰을 지원함
    • 레드햇이 엔비디아 아키텍처에 대한 0일 차 지원을 넓히는 흐름으로 볼 수 있음
  • 다음 세대 플랫폼 지원도 이미 같이 개발 중임

    • 양사는 엔비디아 베라 루빈 플랫폼 지원을 위한 차세대 릴리스를 공동 개발 중
    • 엔비디아 AI 엔터프라이즈에 포함된 엔비디아 런:ai도 레드햇 AI 팩토리 고객에게 제공됨
    • 하이브리드 클라우드 전반에서 최신 AI 인프라를 빠르게 쓰게 하려는 전략임
  • 배포 간소화를 위한 블루프린트와 퀵스타트도 제공됨

    • MaaS, 엔터프라이즈 리서치, 엔터프라이즈 RAG와 RAFT 같은 사용 사례가 포함됨
    • 엔비디아 네모 리트리버와 레드햇 거버넌스 통제를 결합해 에이전트를 독점 데이터에 기반하도록 하는 구성이 언급됨
    • 추가 블루프린트도 플랫폼 로드맵에 포함돼 있음
  • 업데이트는 이달 중 출시될 예정임

    • 레드햇 AI 팩토리 위드 엔비디아 업데이트와 레드햇 AI 3.4가 대상
    • 최신 레드햇 엔터프라이즈 리눅스 포 엔비디아 드라이버와 전용 빌드는 레드햇 고객 포털에서 제공됨
    • 기존 레드햇 AI 팩토리 위드 엔비디아 소프트웨어는 현재 이용 가능함

기술 맥락

  • 이번 발표의 핵심은 “에이전트를 어떻게 안전하게 굴릴 것인가”예요. 에이전틱 AI는 스스로 도구를 실행하고 시스템에 접근하기 때문에, 일반 챗봇보다 운영 리스크가 훨씬 커요.

  • 오픈셸을 샌드박스 런타임으로 넣으려는 이유는 실행 경계를 만들기 위해서예요. 에이전트가 어떤 명령을 실행할 수 있는지, 어떤 데이터에 접근할 수 있는지, 추론 경로를 어떻게 남길지 한 레이어에서 통제해야 기업 환경에 올릴 수 있거든요.

  • 컨피덴셜 컨테이너는 그 경계를 하드웨어 쪽까지 확장하는 선택이에요. 소프트웨어 정책만으로는 부족할 수 있으니, 실행 중인 워크로드 자체를 보호해서 침해가 생겼을 때 피해 범위를 줄이려는 거예요.

  • MLflow 기반 추적과 MaaS 통합은 운영 현실을 반영한 부분이에요. 기업은 여러 모델을 표준 API로 쓰고 싶어 하지만, 동시에 누가 어떤 모델을 호출했고 어떤 도구 실행을 거쳐 결과가 나왔는지 감사할 수 있어야 해요.

  • 그래서 이 업데이트는 모델 성능 발표라기보다 AI 운영 플랫폼 발표에 가까워요. 레드햇과 엔비디아는 하이브리드 클라우드, GPU 인프라, 보안 정책, 감사 로그를 한 덩어리로 묶어 에이전트 운영의 기본판을 만들려는 셈이에요.

기업형 에이전트가 프로덕션으로 가면 제일 먼저 터지는 질문은 “이 에이전트가 뭘 했고, 어디까지 접근했고, 왜 그런 판단을 했나”임. 레드햇과 엔비디아의 업데이트는 성능보다 운영 통제, 감사, 보안 경계를 전면에 놓은 점이 핵심이야.

댓글

댓글

댓글을 불러오는 중...

ai-ml

유튜브, AI 생성 영상에 자동 라벨 붙인다

유튜브가 사실적으로 보이거나 의미 있게 AI로 변경·생성된 콘텐츠에 더 눈에 띄는 라벨을 적용하고, 제작자가 AI 사용 여부를 밝히지 않아도 내부 신호로 감지되면 자동 라벨을 붙이겠다고 밝혔다. 다만 라벨만으로 추천 노출이나 수익화 자격이 바뀌지는 않으며, 제작자는 YouTube Studio에서 잘못된 판정을 수정할 수 있다.

ai-ml

테크 CEO들의 'AI 만능론', 숫자는 아직 그렇게 말하지 않는다

테크 업계에서 AI를 이유로 한 대규모 감원과 조직 재편이 이어지는 가운데, Box 창업자 애런 레비는 CEO들이 실제 업무의 마지막 1마일을 모른 채 AI 에이전트의 능력을 과대평가하고 있다고 지적했다. 2026년 첫 5개월 동안 이미 11만5430명이 해고됐고, 여러 연구는 AI 도입이 체감 생산성만큼 실제 생산성을 끌어올렸다는 근거가 아직 약하다고 말한다.

ai-ml

오픈AI와 앤트로픽, 코딩 에이전트로 드디어 돈 되는 시장을 찾은 듯

사이먼 윌리슨은 오픈AI와 앤트로픽이 코딩 에이전트와 기업용 과금으로 진짜 제품-시장 적합성을 찾았다고 봐. 개인 구독자에게는 월 100달러 플랜이 싸게 느껴지지만, 기업 고객은 이제 사용량 기준 토큰 가격을 그대로 내기 시작했고 이게 대형 고객 예산을 빠르게 흔들고 있다는 얘기야.

ai-ml

컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력

컴팔이 실리콘밸리 기반 AI 인프라 기업 GMI 클라우드와 협력해 대규모 추론과 에이전틱 AI 워크로드에 맞춘 GPU 서버 인프라를 구축한다고 발표했어. COMPUTEX 2026에서는 NVIDIA HGX B300을 지원하는 Compal SGX30-2 같은 고성능 AI 서버 플랫폼도 선보일 예정이야.

ai-ml

AI 쓰면 편해진다더니, 직장인들은 ‘AI 과부하’에 지쳐가는 중

국내 직장인들이 AI 전환 압박, AI 답변 검증 부담, 대체 불안 때문에 피로감을 호소하고 있어. 중앙일보 설문에서는 5284명 중 31.6%가 ‘AI 답변 검증에 시간이 더 걸릴 때’를 가장 지치는 순간으로 꼽았고, 기업들은 무작정 AI 사용량을 밀어붙이는 방식에서 업무 방식 재설계로 넘어가야 한다는 지적이 나와.