본문으로 건너뛰기
피드

한국 스타트업 아크릴, 글로벌 클라우드 1·2위와 GPU 클러스터 최적화 검증 착수

devops 약 3분
vote
0
댓글
북마크

아크릴이 자체 개발한 GPUBASE를 글로벌 클라우드 기업과 248장 GPU 환경에서 성능 검증 시작. InfiniBand→이더넷 RDMA 전환 시대에 소프트웨어 기반 성능 간극 해소를 목표.

  • 1

    글로벌 1·2위 클라우드 기업과 GPU 248장 규모 성능 검증

  • 2

    GPUBASE 4대 핵심 기술: 다중경로 전송, PeRF, GPU 동적 할당, 멀티벤더 통합

  • 3

    호라이즌탈(멀티 클라우드) + 버티컬(단일 1000장+) 2축 검증

  • 4

    상반기 1000장 → 연내 3000장 확대 계획

AX 인프라 스타트업 아크릴이 미국 소재 글로벌 1·2위 클라우드 서비스 기업과 협력해 자체 개발 GPU 클러스터 최적화 소프트웨어 'GPUBASE'의 대규모 성능 검증 프로젝트 'K-스케일 이밸류에이션'에 착수함.

현재 GPU 248장 규모 글로벌 클라우드 환경에서 7개 항목을 정량 검증 중이며, AI 모델 학습·추론 워크로드를 활용함. 한국어 특화 LLM과 의료 AI 모델 '아름.H(ALLM.H)'가 테스트 워크로드로 활용됨.

GPUBASE 4대 핵심 기술:

  • 다중경로 전송
  • PeRF (트래픽 차등화)
  • GPU 동적 할당
  • 멀티벤더 GPU 통합 관리

프로젝트는 두 축으로 설계됨:

  • 호라이즌탈 K-스케일
    • 복수 클라우드에 각각 수백 대 규모로 배치
    • 누적 1000장 이상 GPU에서 환경 호환성·운영 안정성 검증
    • InfiniBand, Ethernet/RoCEv2 등 서로 다른 네트워크 환경 적용
    • NVIDIA, AMD 등 다양한 GPU 대상
  • 버티컬 K-스케일
    • 단일 클라우드에서 1000장 이상 GPU를 하나의 클러스터로 구성
    • 극한 성능·확장성 검증
    • 다중경로 전송 기술의 효율성을 1000장 규모에서 공식 검증 예정

확대 계획:

  • 상반기 Phase 1: GPU 1000장 규모 단일 클러스터
  • 연내 Phase 2: GPU 3000장 이상으로 확대

현재 GPU 클러스터 네트워크 시장이 InfiniBand에서 이더넷 기반 RDMA로 빠르게 전환되고 있으며, 아크릴은 이 과정에서 발생하는 성능 간극을 소프트웨어로 해소하겠다는 목표임.

InfiniBand에서 이더넷 RDMA로의 전환 과정에서 성능 gap을 소프트웨어로 메우겠다는 접근. 한국 스타트업이 글로벌 빅 클라우드와 직접 검증한다는 점이 눈에 띔.

댓글

댓글

댓글을 불러오는 중...

devops

포드가 AI 데이터센터 붐 수혜주로 뜬 이유는 자동차가 아니라 ESS였다

포드의 에너지 저장 사업이 AI 데이터센터 건설 붐을 타고 새 성장축으로 주목받고 있어. 전기차 수요 둔화로 남는 배터리 생산능력을 데이터센터·전력망용 ESS로 돌리는 전략이고, EDF 북미 사업체에 2028년부터 연간 4기가와트시 규모 공급 계약까지 체결했어.

devops

클라우드 빅3 차별화 논쟁, 정작 컴퓨트·스토리지는 거의 범용재가 됐다는 얘기

클라우드 업체들은 인공지능, 데이터베이스, 전용 서비스로 차별화를 강조하지만, 대부분의 기업 워크로드는 여전히 컴퓨트와 스토리지 위에서 돌아간다는 주장이다. AWS, 애저, 구글 클라우드의 핵심 인프라는 성숙도가 높아져 실질 역량 차이가 줄었고, 아키텍트는 브랜드보다 워크로드 적합성·비용·거버넌스·운영 정합성을 봐야 한다는 내용이다.

devops

DynIP, RFC 2136·IPv6·DNSSEC 지원하는 동적 DNS 서비스 공개

DynIP는 홈랩, 엣지 라우터, 인프라 팀을 겨냥한 동적 DNS(DDNS) 서비스다. 60초 안팎의 전파, RFC 2136 TSIG 기반 라우터 업데이트, 개인 도메인 연결, IPv6와 DNSSEC 지원을 핵심 기능으로 내세운다.

devops

깃허브 액션, 내부 데이터베이스 마이그레이션 여파로 4시간 지연

깃허브에서 2026년 5월 12일 13:41부터 17:43 협정세계시까지 일부 서비스 처리 지연이 발생했음. 내부 데이터베이스 마이그레이션으로 복제 지연이 생겼고, 작업 큐에 쌓이는 요청을 처리할 워커가 부족해진 게 원인이었음.

devops

AI 강국 경쟁, 결국 전기와 데이터센터 싸움으로 간다

AI 경쟁의 핵심이 모델과 반도체만이 아니라 안정적인 전력 확보로 이동하고 있다는 분석이야. 글로벌 데이터센터 전력 사용량은 2024년 400TWh에서 2030년 800TWh, 2050년 3500TWh 이상으로 커질 전망이고, 한국도 AI 데이터센터와 에너지 전략을 같이 설계해야 하는 상황이야.