AMD ROCm 7.0, CUDA 락인 정면 돌파 — 추론 3.5배·오픈소스 100%·개발자 10만 명 돌파
AMD가 ROCm 7.0과 개발자 생태계 공세로 엔비디아 CUDA 아성에 도전한다. 전작 대비 추론 3.5배, 훈련 3배 성능 향상을 주장하며 파이토치·vLLM 등 주요 프레임워크에서 코드 수정 없이 구동 가능하다는 호환성을 강조했다. 개발자 클라우드는 10개월 만에 주간 활성 사용자 3.2만 명을 확보했다.
- 1
ROCm 7.0이 ROCm 6 대비 추론 3.5배·훈련 3배 성능 향상 (MI300X 자체 측정)
- 2
HIP는 CUDA와 구문 호환, 기존 CUDA 코드를 거의 그대로 AMD GPU에서 실행 가능
- 3
AITER 커널로 MoE 연산 3배·MLA 디코딩 17배 향상, vLLM·SGLang에 이미 통합
- 4
MI355X가 SGLang DeepSeek R1 추론에서 엔비디아 B200 대비 1.3배 처리량 (AMD 테스트)
- 5
개발자 클라우드 주간 활성 사용자 3.2만 명·누적 GPU 사용 100만 시간, 아시아가 절반 이상
- 6
엔비디아 NIM 대응 상품 AIMs는 vLLM/SGLang 오픈소스 기반에 OpenAI 호환 API 제공
AMD가 스펙 싸움 대신 '이식성'에 베팅한 전략이 본격적으로 먹히기 시작한 분위기. MoE 모델 확산으로 메모리 대역폭이 병목이 되면서 MI300X 계열의 HBM 강점이 현실적 설득력을 얻고 있다.
관련 기사
엔비디아와 네이버, 기가와트급 AI 클라우드 동맹 띄운다
젠슨 황 엔비디아 최고경영자가 네이버 1784를 찾아 네이버와 함께 한국을 시작으로 전 세계에 거대한 AI 클라우드를 구축하겠다고 말했다. 네이버는 엔비디아와 국내 최대 하이퍼스케일 데이터센터 ‘각 세종’의 4배 규모에 해당하는 기가와트급 AI 팩토리 구축에 합의했다고 밝혔다.
젠슨 황이 네이버 1784에 온 이유, GPU 공급을 넘어 AI 클라우드 판 키우기
젠슨 황 엔비디아 CEO가 네이버 1784를 방문해 이해진 의장과 AI 인프라 협력 확대를 공식화함. 네이버는 엔비디아와 글로벌 AI 팩토리 사업을 추진하고, 2027년 55MW를 시작으로 2028년 200MW, 장기적으로 GW급 인프라까지 보겠다는 계획을 내놨음.
정부 2조 GPU 사업, 네이버클라우드·삼성SDS·엘리스그룹이 가져감
과기정통부가 2조800억원 규모의 첨단 GPU 확보 사업자로 네이버클라우드, 삼성SDS, 엘리스그룹을 선정함. 엔비디아 베라루빈 2천16장과 B300 7천688장, 총 9천704장을 확보해 공공·민간 AI 개발에 투입할 계획임.
LG CNS, 바이브 코딩을 넘어 기업 시스템까지 이해하는 AI 개발자 공개
LG CNS가 대규모 IT 시스템 구축·운영 전 과정을 자동화하는 에이전틱 AI 개발 플랫폼 AIND를 출시했다. 자연어 요구사항 입력부터 분석·설계, 코딩, 테스트·품질 검증까지 여러 AI 에이전트가 협업하고, 기업별 개발 표준·보안 규정·소스코드를 구조화한 지식 파운데이션으로 기존 시스템과의 충돌을 줄이는 방식이다.
서울대에 뜬 젠슨 황, AI 에이전트 체험장에 학생들 몰렸다
엔비디아가 서울대에서 학생, 빌더, 엔지니어를 대상으로 AI 에이전트 체험 행사를 열었다. 참가자들은 OpenClaw, NemoClaw, Nemotron을 활용해 로컬, 클라우드 VM, 엣지 디바이스 환경에서 자율 AI 에이전트가 동작하는 방식을 살펴봤고, 젠슨 황 CEO 등장으로 현장 열기가 크게 올라갔다.
댓글
댓글
댓글을 불러오는 중...