본문으로 건너뛰기
피드

엔비디아, 슈퍼컴퓨터 60%가 쓰는 오픈소스 스케줄러 '슬럼' 인수 — 독점 우려 확산

devops 약 4분
vote
0
댓글
북마크

엔비디아가 오픈소스 작업 스케줄러 슬럼(Slurm)의 개발사 스케드MD를 인수한 건에 대해 독점 우려가 제기되고 있다. 전 세계 슈퍼컴퓨터 60%가 사용하는 핵심 인프라를 GPU 독점 기업이 소유하면서, AMD 등 경쟁사 칩 지원이 후순위로 밀릴 수 있다는 지적.

  • 1

    슬럼은 전 세계 슈퍼컴퓨터 60%가 사용하는 HPC 작업 스케줄러

  • 2

    메타·앤트로픽·미스트랄 등 주요 AI 기업들도 슬럼 사용 중

  • 3

    핵심 우려: 엔비디아가 자사 GPU에 유리한 업데이트 우선 적용 가능성

  • 4

    2022년 브라이트컴퓨팅 인수 때도 유사한 독점 우려 제기된 전례

슬럼(Slurm), AI 인프라의 숨은 핵심

  • 엔비디아가 지난해 12월 오픈소스 기업 스케드MD(SchedMD)를 인수함 — 핵심은 슬럼(Slurm) 확보
    • 슬럼은 슈퍼컴퓨터와 AI 데이터센터에서 컴퓨팅 작업을 스케줄링하는 오픈소스 소프트웨어
    • 전 세계 슈퍼컴퓨터의 약 60%가 슬럼을 사용 중
    • LLM 학습은 물론 기상 예측, 핵무기 개발 등 정부 슈퍼컴퓨터에서도 핵심 인프라
  • 메타, 미스트랄, 앤트로픽 등 주요 AI 기업들이 슬럼 사용 중
    • 오픈AI는 예외 — 구글 기술 기반의 다른 시스템을 씀
  • 인수 가격은 비공개, 규모가 크지 않은 것으로 추정됨

독점 우려: "자사 칩에만 유리하게 업데이트할 수 있다"

  • 업계의 핵심 우려: 엔비디아가 슬럼 업데이트를 자사 GPU에 맞춰 우선 제공할 가능성
    • AMD나 인텔 같은 경쟁사 칩 지원이 후순위로 밀릴 수 있음
    • 반도체 컨설팅 업체 인터섹트360리서치 CEO: "오픈소스 도구를 자사 부품에서만 더 잘 작동하게 만들 가능성"이 우려됨
  • 리트머스 테스트: 올해 말 출시될 AMD 신규 칩이 슬럼에 얼마나 빨리 통합되는지가 관건
  • 2022년 브라이트컴퓨팅 인수 때도 비슷한 우려가 있었음
    • 브라이트컴퓨팅 소프트웨어가 엔비디아 장비에 최적화되면서 타 칩에서 성능 저하 지적

엔비디아 입장: "오픈소스 계속 유지한다"

  • 엔비디아는 "슬럼은 오픈소스이며 모두를 위한 개선을 계속하겠다"고 강조
    • "특정 업체에 종속되지 않는 소프트웨어를 계속 개발하고 배포하겠다"
    • AI 개발 지원을 위한 오픈소스 기술 투자 확대 차원이라는 설명
  • 긍정적 시각도 있음: 엔비디아의 대규모 자원 투입으로 슬럼이 더 활성화될 수 있다는 기대
    • 원래 정부 슈퍼컴퓨터용이었던 슬럼이 최근 AI 기업들로 급확산 중
    • 정부 연구소들이 기존 HPC 작업과 AI 기술을 함께 도입하는 데 도움될 수 있음

⚠️주의

> 전 세계 슈퍼컴퓨터 60%가 쓰는 오픈소스 스케줄러를 GPU 독점 기업이 소유하게 됨. 오픈소스 유지 약속과 별개로, 업데이트 우선순위에서의 미묘한 차별만으로도 경쟁 환경에 큰 영향을 줄 수 있음.


기술 맥락

  • 슬럼(Slurm)이 뭐냐면, HPC(고성능 컴퓨팅) 클러스터에서 "누가 언제 어떤 GPU를 쓸지"를 관리하는 스케줄러예요. 수천 장의 GPU가 있는 데이터센터에서 여러 팀이 동시에 학습 작업을 돌릴 때, 자원 배분을 자동으로 해주는 거죠
  • 이게 왜 중요하냐면, LLM 학습 같은 대규모 작업은 수백~수천 개의 GPU를 며칠씩 점유하거든요. 스케줄러가 비효율적이면 비싼 GPU가 놀게 되고, 최적화가 잘 되면 같은 장비로 더 많은 작업을 돌릴 수 있어요
  • 엔비디아의 우려 포인트는 CUDA와 비슷한 패턴이에요. CUDA도 오픈은 아니지만 사실상 표준이 되면서 엔비디아 생태계 종속을 만들었거든요. 슬럼이 엔비디아 GPU에 최적화되면, AMD로 전환하려는 기업 입장에서 또 하나의 장벽이 생기는 셈이에요

엔비디아의 AI 인프라 수직 통합 전략이 하드웨어를 넘어 소프트웨어 생태계까지 확장되고 있음. CUDA처럼 슬럼도 사실상 엔비디아 전용 도구가 될 수 있다는 우려는 합리적.

댓글

댓글

댓글을 불러오는 중...

devops

포드가 AI 데이터센터 붐 수혜주로 뜬 이유는 자동차가 아니라 ESS였다

포드의 에너지 저장 사업이 AI 데이터센터 건설 붐을 타고 새 성장축으로 주목받고 있어. 전기차 수요 둔화로 남는 배터리 생산능력을 데이터센터·전력망용 ESS로 돌리는 전략이고, EDF 북미 사업체에 2028년부터 연간 4기가와트시 규모 공급 계약까지 체결했어.

devops

클라우드 빅3 차별화 논쟁, 정작 컴퓨트·스토리지는 거의 범용재가 됐다는 얘기

클라우드 업체들은 인공지능, 데이터베이스, 전용 서비스로 차별화를 강조하지만, 대부분의 기업 워크로드는 여전히 컴퓨트와 스토리지 위에서 돌아간다는 주장이다. AWS, 애저, 구글 클라우드의 핵심 인프라는 성숙도가 높아져 실질 역량 차이가 줄었고, 아키텍트는 브랜드보다 워크로드 적합성·비용·거버넌스·운영 정합성을 봐야 한다는 내용이다.

devops

DynIP, RFC 2136·IPv6·DNSSEC 지원하는 동적 DNS 서비스 공개

DynIP는 홈랩, 엣지 라우터, 인프라 팀을 겨냥한 동적 DNS(DDNS) 서비스다. 60초 안팎의 전파, RFC 2136 TSIG 기반 라우터 업데이트, 개인 도메인 연결, IPv6와 DNSSEC 지원을 핵심 기능으로 내세운다.

devops

깃허브 액션, 내부 데이터베이스 마이그레이션 여파로 4시간 지연

깃허브에서 2026년 5월 12일 13:41부터 17:43 협정세계시까지 일부 서비스 처리 지연이 발생했음. 내부 데이터베이스 마이그레이션으로 복제 지연이 생겼고, 작업 큐에 쌓이는 요청을 처리할 워커가 부족해진 게 원인이었음.

devops

AI 강국 경쟁, 결국 전기와 데이터센터 싸움으로 간다

AI 경쟁의 핵심이 모델과 반도체만이 아니라 안정적인 전력 확보로 이동하고 있다는 분석이야. 글로벌 데이터센터 전력 사용량은 2024년 400TWh에서 2030년 800TWh, 2050년 3500TWh 이상으로 커질 전망이고, 한국도 AI 데이터센터와 에너지 전략을 같이 설계해야 하는 상황이야.