본문으로 건너뛰기
피드

NHN클라우드는 고밀도 GPU, 네이버클라우드는 초대형 데이터센터로 AI 인프라 승부

devops 약 6분
vote
0
댓글
북마크

NHN클라우드와 네이버클라우드가 AI 전용 데이터센터 전략을 서로 다른 방향으로 밀고 있다. NHN클라우드는 양평데이터센터에서 수랭식 냉각과 고밀도 GPU 클러스터를 앞세우고, 네이버클라우드는 각 세종의 초대형 서버·전력·저장 인프라로 대규모 AI 수요를 받겠다는 그림이다.

  • 1

    NHN클라우드는 양평데이터센터에 총 7656장 GPU 기반 AI 인프라를 구축했다

  • 2

    약 4000장 GPU를 하나의 클러스터로 묶고 수랭식 냉각으로 발열 문제를 잡는 전략이다

  • 3

    네이버클라우드 각 세종은 축구장 41개 규모 부지에 60만 유닛 서버와 최대 270메가와트 전력 설비를 갖췄다

  • 4

    두 회사 모두 AI 연산 수요를 겨냥하지만 NHN은 고밀도, 네이버는 하이퍼스케일에 방점이 찍혀 있다

  • NHN클라우드와 네이버클라우드가 AI 데이터센터를 서로 다른 캐릭터로 밀고 있음

    • NHN클라우드는 고밀도 AI 인프라 쪽임. 좁은 공간에 GPU를 빽빽하게 넣고, 발열과 전력 문제를 냉각 설계로 해결하는 방향
    • 네이버클라우드는 하이퍼스케일 쪽임. 데이터센터 자체를 엄청 크게 짓고, 서버 수용량·저장 용량·전력 설비를 대규모로 가져가는 방향
  • NHN클라우드는 서울 양평동 AI 전용 데이터센터에 총 7656장 GPU 인프라를 구축했다고 밝힘

    • 이 중 약 4000장 규모 GPU를 하나의 클러스터로 묶어 초대형 고성능 연산 환경을 만들었다고 함
    • 대규모 GPU를 돌릴 때 제일 골치 아픈 게 발열인데, NHN클라우드는 여기에 수랭식 냉각을 넣었음
    • GPU는 전력도 많이 먹고 열도 많이 내서, 많이 넣는 순간부터 서버 문제가 아니라 전기·냉각·공간 설계 문제가 됨

중요

> NHN클라우드의 포인트는 GPU 숫자만이 아니라 고밀도 운영임. 4000장급 GPU 클러스터를 안정적으로 돌리려면 냉각과 전력 설계가 사실상 제품 경쟁력임.

  • NHN클라우드는 예전부터 데이터센터 효율을 꽤 신경 써온 쪽임

    • 2015년 판교 NCC1 데이터센터에서 랙당 8킬로와트(kW) 수준의 고밀도 설계를 적용한 경험이 있음
    • 8킬로와트는 서버 선반 한 칸에 일반 가정집 2채 수준의 전력을 동시에 넣는 정도로 설명됨
    • 당시에는 외부의 찬 공기를 끌어와 내부를 식히는 외기 냉방 방식으로 전력효율지수(PUE)를 개선했다는 설명이 붙음
  • 양평데이터센터는 광주 국가 AI 데이터센터 운영 경험까지 설계에 반영했다는 게 핵심임

    • NHN클라우드는 지난 3년간 광주 국가 AI 데이터센터를 운영하면서 쌓은 실전 데이터를 설계 단계부터 활용했다고 함
    • 대규모 GPU 환경에서 생길 수 있는 전력 과부하, 발열, 운영 오류 같은 변수를 미리 반영했다는 이야기
    • 그러니까 이번 발표는 “GPU 많이 샀다”보다 “GPU를 계속 안정적으로 돌릴 데이터센터 운영 레시피를 갖췄다”에 가까움
  • 네이버클라우드의 각 세종은 스케일로 찍어누르는 타입임

    • 2023년부터 가동된 데이터센터고, 부지 규모가 29만4000제곱미터로 축구장 41개 크기라고 함
    • 단일 기업 데이터센터 기준 국내 최대 수준인 60만 유닛 서버 수용량을 갖췄다고 소개됨
    • 저장 용량은 국립중앙도서관 전체 데이터의 약 100만배에 달하는 65엑사바이트(EB) 수준으로 설명됨
  • 전력 설비도 네이버클라우드가 크게 가져감

    • 각 세종의 최대 전력 공급량은 270메가와트(MW)로 설계됐고, 이는 각 춘천의 6.75배라고 함
    • 초대규모 AI 연산에 최적화된 GPU를 국내 최대 규모로 운영하고, 슈퍼컴퓨터를 클러스터 형태로 구축해 운영 중이라는 설명도 있음
    • AI 데이터센터에서 전력은 그냥 부대비용이 아니라 “얼마나 큰 모델과 서비스를 받을 수 있느냐”를 결정하는 상한선에 가까움
  • 각 세종도 냉각을 중요한 차별점으로 내세움

    • 네이버가 자체 개발한 3세대 공조 시스템 NAMU(NAVER Air Membrane Unit)를 활용함
    • 맑고 추운 날에는 외부 공기를 필터로 걸러 서버실에 바로 넣는 직접 외기 냉방을 사용함
    • 미세먼지가 심하거나 습한 날에는 외부 찬 공기로 벽면을 먼저 식힌 뒤 내부 공기를 통과시키는 간접 외기 냉방을 섞어 씀
  • 정리하면 NHN클라우드는 GPU 밀도와 운영 효율, 네이버클라우드는 초대형 수용력과 전력 규모를 전면에 세운 셈임

    • AI 인프라 경쟁이 모델 API 가격표만 보고 끝나는 게임이 아니라는 게 여기서 드러남
    • 결국 누가 더 많은 GPU를 안정적으로, 싸게, 오래 돌릴 수 있느냐가 클라우드 AI 사업의 바닥 체력임

기술 맥락

  • AI 데이터센터에서 GPU를 많이 넣는 건 생각보다 단순한 증설이 아니에요. GPU는 전력 소비와 발열이 크기 때문에, 랙 밀도를 높이면 냉각 방식과 전력 배분 설계가 같이 바뀌어야 하거든요.

  • NHN클라우드가 수랭식 냉각을 강조하는 이유도 여기에 있어요. 공기만으로 열을 빼기 어려운 고밀도 GPU 환경에서는 냉각 효율이 곧 GPU 가동률과 장애율에 영향을 줘요.

  • 네이버클라우드의 각 세종은 다른 방향의 선택이에요. 60만 유닛 서버, 65엑사바이트 저장 용량, 최대 270메가와트 전력 설비처럼 전체 수용 능력을 키워서 AI·클라우드 워크로드를 대규모로 받는 구조예요.

  • 두 전략은 우열이라기보다 타깃이 달라요. 특정 GPU 클러스터의 밀도와 효율을 극대화하려면 NHN클라우드식 설계가 중요하고, 다양한 AI·클라우드 서비스를 장기간 대량으로 운영하려면 네이버클라우드식 하이퍼스케일 설계가 힘을 발휘해요.

AI 경쟁이 모델 성능만의 싸움이 아니라 전력, 냉각, 랙 밀도, 운영 노하우 싸움으로 내려왔다는 걸 보여주는 기사다. 한국 클라우드 사업자들이 GPU 인프라를 직접 설계·운영하는 단계로 가고 있다는 점에서 꽤 실무적인 신호다.

댓글

댓글

댓글을 불러오는 중...

devops

포드가 AI 데이터센터 붐 수혜주로 뜬 이유는 자동차가 아니라 ESS였다

포드의 에너지 저장 사업이 AI 데이터센터 건설 붐을 타고 새 성장축으로 주목받고 있어. 전기차 수요 둔화로 남는 배터리 생산능력을 데이터센터·전력망용 ESS로 돌리는 전략이고, EDF 북미 사업체에 2028년부터 연간 4기가와트시 규모 공급 계약까지 체결했어.

devops

클라우드 빅3 차별화 논쟁, 정작 컴퓨트·스토리지는 거의 범용재가 됐다는 얘기

클라우드 업체들은 인공지능, 데이터베이스, 전용 서비스로 차별화를 강조하지만, 대부분의 기업 워크로드는 여전히 컴퓨트와 스토리지 위에서 돌아간다는 주장이다. AWS, 애저, 구글 클라우드의 핵심 인프라는 성숙도가 높아져 실질 역량 차이가 줄었고, 아키텍트는 브랜드보다 워크로드 적합성·비용·거버넌스·운영 정합성을 봐야 한다는 내용이다.

devops

DynIP, RFC 2136·IPv6·DNSSEC 지원하는 동적 DNS 서비스 공개

DynIP는 홈랩, 엣지 라우터, 인프라 팀을 겨냥한 동적 DNS(DDNS) 서비스다. 60초 안팎의 전파, RFC 2136 TSIG 기반 라우터 업데이트, 개인 도메인 연결, IPv6와 DNSSEC 지원을 핵심 기능으로 내세운다.

devops

깃허브 액션, 내부 데이터베이스 마이그레이션 여파로 4시간 지연

깃허브에서 2026년 5월 12일 13:41부터 17:43 협정세계시까지 일부 서비스 처리 지연이 발생했음. 내부 데이터베이스 마이그레이션으로 복제 지연이 생겼고, 작업 큐에 쌓이는 요청을 처리할 워커가 부족해진 게 원인이었음.

devops

AI 강국 경쟁, 결국 전기와 데이터센터 싸움으로 간다

AI 경쟁의 핵심이 모델과 반도체만이 아니라 안정적인 전력 확보로 이동하고 있다는 분석이야. 글로벌 데이터센터 전력 사용량은 2024년 400TWh에서 2030년 800TWh, 2050년 3500TWh 이상으로 커질 전망이고, 한국도 AI 데이터센터와 에너지 전략을 같이 설계해야 하는 상황이야.