본문으로 건너뛰기
피드

Arm, 35년 만에 첫 자체 실리콘 제품 'AGI CPU' 발표

backend 약 4분
vote
0
댓글
북마크

Arm이 35년 역사상 처음으로 자체 설계 실리콘 제품인 AGI CPU를 발표함. Neoverse V3 기반 AI 데이터센터용 프로세서로, Meta가 리드 파트너이며 랙당 x86 대비 2배 이상 성능을 주장함.

  • 1

    Arm 최초의 자체 실리콘 제품으로 IP 라이선싱을 넘어선 전략적 전환

  • 2

    1OU 2노드 설계 기준 블레이드당 272코어, 랙당 8,160코어, Supermicro 수냉 구성 시 45,000코어 이상

  • 3

    x86 대비 랙당 2배 이상 성능 주장, 클래스 최고 메모리 대역폭이 핵심 장점

  • 4

    Meta가 리드 파트너로 MTIA 가속기 연동 공동 개발, OpenAI/Cerebras/Cloudflare 등 참여

  • 5

    OCP 레퍼런스 서버 설계 기여 예정, ASRockRack/Lenovo/Supermicro에서 즉시 주문 가능

  • Arm이 IP 라이선싱만 하던 회사에서 처음으로 직접 설계한 실리콘 제품을 내놓음. 이름은 Arm AGI CPU이고, AI 데이터센터용 프로덕션 레디 칩임
  • Arm Neoverse V3 플랫폼 기반으로 만들어졌고, 에이전틱 AI 인프라(연속적이고 분산된 워크로드)를 타겟으로 함
  • 에이전틱 AI 시대에는 CPU가 분산 AI 시스템의 페이싱 요소가 됨. 가속기 조율, 메모리 관리, 워크로드 스케줄링, 에이전트 간 팬아웃 조정 등을 CPU가 담당하게 되는 거임

스펙과 성능

  • 레퍼런스 서버: 1OU 2노드 설계, 블레이드당 272코어. 표준 공랭 36kW 랙에 30블레이드 = 총 8,160코어
  • Supermicro 수냉 구성: 200kW 설계, 336개 AGI CPU 탑재, 45,000코어 이상
  • x86 대비 2배 이상 랙당 성능을 주장함
  • 핵심 장점은 클래스 최고 수준의 메모리 대역폭이라는 거임. x86 CPU는 지속 부하에서 코어 경합으로 성능이 저하되는데, Arm은 유효 실행 스레드가 더 많음
  • 고성능 단일 스레드 Neoverse V3 코어가 레거시 아키텍처를 능가한다고 함. 사용 가능한 스레드가 더 많고, 스레드당 작업량도 더 많으니 랙 단위에서 복합 성능 이득이 발생함

파트너 생태계

  • 리드 파트너는 Meta. 기가와트급 인프라 최적화와 자체 MTIA 가속기와의 연동을 위해 공동 개발함
  • OpenAI의 Sachin Katti(산업 컴퓨팅 총괄): "대규모 AI 워크로드 조율 레이어에서 중요한 역할을 할 것"이라고 함
  • 그 외 런치 파트너: Cerebras, Cloudflare, F5, Positron, Rebellions, SAP, SK Telecom
  • SK텔레콤은 Rebellions AI 가속기 칩과 함께 Arm AGI CPU를 활용한 대규모 풀스택 AI 추론 데이터센터 인프라를 확장한다는 거임
  • 상용 시스템은 ASRockRack, Lenovo, Supermicro에서 지금 바로 주문 가능

오픈 생태계 전략

  • OCP(Open Compute Project) DC-MHS 표준 폼팩터의 1OU 듀얼 노드 레퍼런스 서버를 공개함
  • 레퍼런스 서버 설계와 펌웨어를 OCP에 기여할 예정이고, 시스템 아키텍처 스펙, 디버그 프레임워크, 검증 도구도 함께 공개함
  • 후속 제품도 이미 커밋된 상태이고, 기존 Neoverse CSS 제품 로드맵과 병행해서 소프트웨어 호환성을 유지한다는 방침임
  • 50개 이상 기업이 Arm 컴퓨트 플랫폼의 실리콘 확장을 지원하고 있음

Arm이 IP 라이선싱 모델에서 직접 실리콘 판매로 확장하는 건 비즈니스 모델의 근본적 변화임. AI 데이터센터 CPU 시장에서 x86과의 직접 경쟁이 본격화되는 신호.

댓글

댓글

댓글을 불러오는 중...

backend

잘못된 추상화보다 중복이 낫다는 샌디 메츠의 고전 조언

샌디 메츠는 중복을 없애려다 잘못된 추상화를 만들면 코드가 조건문과 파라미터로 부풀어 더 위험해진다고 말한다. 이미 틀어진 추상화는 억지로 보존하지 말고, 다시 호출부에 인라인해서 중복을 되살린 뒤 현재 요구사항에 맞는 새 구조를 찾는 편이 빠르다는 주장이다.

backend

리눅스 커널, 6년·360개 넘는 패치 끝에 strncpy 제거

리눅스 커널이 오랫동안 버그의 원인이던 strncpy API 사용을 Linux 7.2에서 제거했어. NUL 종료 동작이 직관적이지 않고 불필요한 zero-fill로 성능 문제도 있던 API를 6년 동안 약 362개 커밋으로 걷어낸 작업임.

backend

덕디비는 왜 빠를까: 서버 없는 분석 엔진의 내부 구조 뜯어보기

DuckDB가 단일 바이너리, 인프로세스 실행, 컬럼형 저장, 최적화 패스, Parquet 푸시다운으로 빠른 분석 쿼리를 처리하는 방식을 깊게 설명한 글이다. 6GB Parquet 파일을 노트북에서 바로 SQL로 읽는 경험 뒤에 어떤 설계가 깔려 있는지 따라간다.

backend

피지독, 포스트그레스를 수평 확장시키겠다고 550만 달러 투자 유치

피지독은 포스트그레스 앞단에 프록시를 두고 샤딩과 라우팅을 처리해 수평 확장을 가능하게 하겠다는 오픈소스 프로젝트다. 이미 프로덕션에서 초당 200만 건이 넘는 쿼리를 처리하고, 확인된 규모만 20테라바이트 이상을 샤딩했다고 밝히며 550만 달러 투자를 공개했다.

backend

펜타시스템, EDB 포스트그레SQL로 국내 엔터프라이즈 DB 전환 시장 공략

펜타시스템테크놀러지가 EDB와 파트너 계약을 맺고 국내에 EDB 포스트그레SQL 기반 데이터 플랫폼을 공급한다. 기존 상용 DBMS 정책 변화로 비용 부담이 커진 기업들을 겨냥해, 오픈소스 기반 엔터프라이즈 데이터 플랫폼 전환 수요를 잡겠다는 전략이다. 금융, 공공, 제조, 유통, 클라우드, AI 데이터 분석 환경까지 적용 범위를 넓히려는 움직임이다.