화웨이 클라우드, 에이전틱 AI용 인프라와 플랫폼을 한꺼번에 공개

ai-ml 2026-06-09 약 8분

 tags

#agentic-ai #cloud #inference #rl #security

vote

북마크

화웨이 클라우드가 상하이에서 열린 INSPIRE 2026 행사에서 에이전틱 인프라, 모델 개발 플랫폼, 기업용 에이전트 플랫폼, 보안 솔루션을 대거 공개했다. 10만 장 이상 AI 가속기, 최대 200엑사플롭스, 10밀리초 이하 토큰 지연, 1,000개 가속기 기준 초당 500만 토큰 같은 공격적인 수치로 기업용 AI 인프라 시장을 겨냥했다.

1
화웨이 클라우드가 에이전틱 AI 시대를 위한 에이전틱 인프라 전략을 발표함
2
AI 클러스터 서비스는 10만 장 이상 AI 가속기와 최대 200엑사플롭스를 지원한다고 밝힘
3
모델아츠넥스트는 강화학습 서비스, 기밀 추론, 모델 라우팅, 모델 매트릭스를 제공함
4
에이전트아츠와 오픈지우원은 기업용 AI 에이전트 구축을 겨냥함
5
데이터 보안 존, HYOK, 기밀 컴퓨팅으로 기업 데이터 주권과 보안을 강조함

에이전트 시대용 클라우드를 선언한 화웨이

화웨이 클라우드가 INSPIRE 2026에서 ‘에이전틱 인프라(Agentic Infra)’를 전면에 내세움
- 행사는 6월 5~6일 중국 상하이 웨스트번드 국제컨벤션전시센터에서 열림
- 화웨이 클라우드 CEO 저우 페이는 AI 에이전트가 자율적으로 학습하고 실행하는 시대에는 컴퓨팅 패러다임이 바뀐다고 설명함
화웨이가 보는 핵심 병목은 토큰 생산, 지속 학습, 스케줄링, 보안임
- 에이전트는 한 번 답하고 끝나는 챗봇이 아니라 오래 실행되고, 도구를 호출하고, 상태를 유지해야 함
- 그래서 GPU만 많이 쌓는 게 아니라 캐시, 메모리, 실행 환경, 보안 격리까지 같이 봐야 한다는 주장임

숫자로 밀어붙인 AI 인프라

AI 클러스터 서비스(AICS)는 초대형 AI 클러스터를 겨냥함
- 유니파이드버스(UnifiedBus) 기반으로 10만 장 이상의 AI 가속기를 지원한다고 밝힘
- 최대 200엑사플롭스(EFLOPS), 토큰 생성 지연시간 10밀리초 이하를 제시함
- 1,000개 가속기 기준 초당 500만 개 토큰 처리와 99.95% 가용성도 내세움

❗중요

> 화웨이가 제시한 수치 중 제일 눈에 띄는 건 10만 장 이상 AI 가속기, 최대 200엑사플롭스, 10밀리초 이하 토큰 지연시간임. 에이전트가 대량으로 돌아가는 환경에서는 지연과 처리량이 곧 제품 경험이 됨.

에이전틱 메모리 스토리지(AMS)는 장시간 실행되는 에이전트용 메모리 계층을 담당함
- PB급 메모리 공간을 제공한다고 설명함
- 계층형 KV 캐시 풀링으로 추론 비용을 줄이고, 에이전트가 오래 작업을 이어갈 수 있게 만드는 구조임
CCE 볼케이노넥스트(VolcanoNext)는 AI와 일반 워크로드를 같이 스케줄링하는 엔진임
- 범용 워크로드와 AI 워크로드를 통합 배치해 자원 활용률을 30% 이상 높였다고 밝힘
- AI 인프라에서 놀고 있는 자원을 줄이는 게 곧 비용 절감으로 이어지는 대목임
에이전트스피어(AgentSphere)는 에이전트용 보안 실행 환경임
- 100밀리초 이내 기동을 지원함
- 분당 수십만 개 인스턴스 생성이 가능하다고 설명해 대규모 에이전트 운영을 겨냥함

모델 개발과 에이전트 플랫폼도 같이 공개

모델아츠넥스트(ModelArtsNext)는 차세대 모델 개발 플랫폼으로 소개됨
- 강화학습 서비스(RLaaS), 기밀 추론(Confidential Inference), 모델 라우팅, 모델 매트릭스를 제공함
- 기업은 1분 이내에 학습 작업을 만들고 학습·추론 과정을 시각적으로 관리할 수 있다고 함
모델 라우팅은 요청별로 적합한 AI 모델을 자동 선택하는 기능임
- 현재 15개 이상의 최신 AI 모델 서비스를 지원한다고 밝힘
- 화웨이는 모델 선택 정확도 95% 이상, 평균 호출 비용 20% 절감을 달성했다고 설명함
에이전트아츠(AgentArts)는 기업용 AI 에이전트 구축 플랫폼임
- 장기 실행 작업, 엔터프라이즈 보안, 산업 특화 지식, 전체 프로세스 가시성을 제공함
- 오픈소스 버전인 오픈지우원(OpenJiuwen)은 상용 버전과 90% 이상 동일한 커널을 공유한다고 함

sequenceDiagram
    participant 사용자 as 기업 사용자
    participant 포털 as 에이전트아츠 오차드
    participant 라우터 as 모델 라우팅
    participant 모델 as AI 모델 서비스
    participant 실행환경 as 에이전트스피어
    사용자->>포털: 에이전트 작업 생성
    포털->>라우터: 요청 특성 전달
    라우터->>모델: 최적 모델 선택 및 호출
    모델-->>실행환경: 추론 결과와 실행 계획 전달
    실행환경-->>사용자: 보안 격리된 작업 결과 반환

보안과 산업별 확장까지 묶은 전략

화웨이는 AI 시대의 핵심 경쟁력으로 보안을 강하게 밀고 있음
- 데이터 보안 존(Data Security Zone), HYOK 기반 암호화, 데이터 캡슐, 다중 격리 기술을 공개함
- 기밀 가상머신(VM), 원격 검증, 키 관리, 기밀 추론 게이트웨이도 함께 제시함

ℹ️참고

> 화웨이는 현재까지 1,037일 동안 중대한 서비스 장애 없이 운영됐다고 밝힘. 기업용 AI 클라우드에서는 모델 성능만큼 가용성과 장애 이력이 영업 포인트가 됨.

산업 AI 파운드리도 4개 영역으로 확장함
- 스마트 헬스케어, 구현형 AI, 스마트 제조, 과학 컴퓨팅 영역을 공개함
- 의료 분야에서는 상하이교통대 의대 부속 루이진병원을 포함한 20여 개 병원이 스마트 병리학 솔루션에 참여했다고 함
구현형 AI 쪽에서는 클라우드로보(CloudRobo)가 눈에 띔
- 로봇 모델 개발, 시뮬레이션 검증, 데이터 생성을 통합한 클라우드 기반 로봇 개발 플랫폼임
- 로봇을 수 시간 내 클라우드 환경으로 이전하고 수 분 내 배포할 수 있다고 설명함
생태계 전략도 같이 깔림
- 지푸 AI, 딥시크, 미니맥스, 키미, 바이두, 아이플라이텍 스파크 등 20개 이상의 AI 기업과 AI 모델 파트너 프로그램을 발표함
- 결국 화웨이 클라우드 위에서 여러 모델이 공존하고, 산업별 에이전트 서비스로 이어지는 구조를 만들겠다는 얘기임

기술 맥락

화웨이가 말하는 에이전틱 인프라는 GPU 클러스터 이름만 바꾼 게 아니에요. 에이전트는 대화 한 번으로 끝나지 않고 여러 도구를 호출하고 상태를 유지하면서 오래 실행되기 때문에, 추론 지연·캐시·스케줄링·격리가 전부 병목이 되거든요.
AICS와 AMS가 같이 나온 이유도 여기에 있어요. AICS는 대량의 토큰을 빠르게 뽑는 계산 쪽을 맡고, AMS는 장시간 작업에서 KV 캐시와 메모리를 효율적으로 다루는 쪽에 가까워요. 에이전트가 많아질수록 같은 문맥을 계속 다시 계산하면 비용이 터지니까요.
모델 라우팅은 기업 입장에서 꽤 실용적인 기능이에요. 모든 요청을 가장 비싼 모델에 보내면 품질은 괜찮아도 비용이 무섭고, 싼 모델만 쓰면 실패율이 올라갈 수 있어요. 그래서 요청 특성에 따라 모델을 골라 평균 호출 비용을 20% 줄였다는 주장이 나오는 거예요.
보안 기능이 크게 강조된 것도 자연스러워요. 에이전트가 기업 문서, 고객 데이터, 내부 시스템을 직접 다루기 시작하면 추론 과정 자체가 민감 정보 처리 흐름이 되거든요. HYOK, 기밀 추론, 원격 검증 같은 기능은 클라우드를 쓰면서도 통제권을 잃지 않으려는 기업을 겨냥한 장치예요.

화웨이의 메시지는 명확하다. 에이전트가 많아질수록 모델보다 인프라, 캐시, 스케줄링, 보안 실행 환경이 병목이 된다는 얘기다. 숫자는 공격적이고, 지정학적 변수는 별개로, AI 클라우드가 ‘GPU 빌려주는 서비스’에서 에이전트 운영체제에 가까운 형태로 가고 있다는 점은 한국 개발자에게도 꽤 중요한 신호다.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-23

알파벳, 클라우드 82% 성장했지만 AI 인프라 투자로 현금흐름 첫 적자

알파벳이 2분기 매출 1198억 달러를 기록하며 시장 전망을 넘겼고, 클라우드 매출은 82% 급증한 248억 달러까지 뛰었다. 하지만 AI 인프라에 분기 449억 달러를 투입하면서 잉여현금흐름은 2004년 상장 이후 처음으로 분기 적자를 냈다.

ai-ml 2026-07-23

알파벳 클라우드 매출 82% 폭증했는데, 클라우드 ETF는 왜 빠졌나

알파벳의 2분기 클라우드 매출이 전년 대비 82% 늘며 월가 예상치를 크게 넘었지만, 클라우드 관련 ETF는 오히려 하락했다. 시장은 이제 클라우드 매출 성장률만 보는 게 아니라, 그 매출을 만들기 위해 데이터센터와 칩에 얼마나 많은 자본지출이 들어갔는지를 따지고 있다.

ai-ml 2026-07-23

젠슨 황 “중국산 오픈소스 AI, 좋으면 써야 한다”

젠슨 황 엔비디아 CEO가 미국 정부의 중국산 오픈소스 AI 모델 규제 움직임에 반대했다. 딥시크, 알리바바, 문샷 AI 같은 중국 모델이 백도어라는 우려는 오해에 가깝고, 좋은 오픈소스 모델은 기업들이 활용할 수 있어야 한다는 주장이다.

ai-ml 2026-07-23

업스테이지 ‘솔라 오픈 2’ 공개, 한국어·에이전트 성능으로 독파모 2라운드 승부

업스테이지가 오픈웨이트 LLM ‘솔라 오픈 2’를 공개했다. 2500억 매개변수 중 150억 개만 활성화하는 MoE 구조, 100만 토큰 컨텍스트, H200 2장 구동 가능성을 앞세워 한국어·에이전트·기업 도입성을 동시에 노린 모델이다.

ai-ml 2026-07-23

아이벡스, 오픈소스 로봇·비전으로 볼트 검사 투입 자동화한다

아이벡스가 정보통신산업진흥원의 오픈소스 사업화 과제에 선정돼 케이피에프의 자분탐상 검사라인 자동화에 들어간다. 벌크 상태로 쏟아지는 볼트류를 AI 비전으로 인식하고, 6D 자세 추정과 로봇 제어로 집어서 검사장비에 넣는 흐름까지 구현하는 게 핵심이다.

화웨이 클라우드, 에이전틱 AI용 인프라와 플랫폼을 한꺼번에 공개

요약

핵심 포인트

핵심 개념

분석

에이전트 시대용 클라우드를 선언한 화웨이

숫자로 밀어붙인 AI 인프라

모델 개발과 에이전트 플랫폼도 같이 공개

보안과 산업별 확장까지 묶은 전략

기술 맥락

인사이트

댓글

댓글

화웨이 클라우드, 에이전틱 AI용 인프라와 플랫폼을 한꺼번에 공개

요약

핵심 포인트

핵심 개념

분석

에이전트 시대용 클라우드를 선언한 화웨이

숫자로 밀어붙인 AI 인프라

모델 개발과 에이전트 플랫폼도 같이 공개

보안과 산업별 확장까지 묶은 전략

기술 맥락

인사이트

댓글

댓글

관련 기사