본문으로 건너뛰기
피드

NHN클라우드, AI 풀스택 브랜드 ‘팩토리X’로 GPU 공장 승부수

ai-ml 약 8분
vote
0
댓글
북마크

NHN클라우드가 AI 인프라, GPU 운영 플랫폼, AI 에이전트 실행 환경을 묶은 통합 브랜드 ‘FactoryX’를 공개했다. 핵심은 모델 자체보다 수천 장 GPU를 안정적으로 굴리고, 활용률을 끌어올리고, 기업 내부 데이터와 연결해 실제 업무 자동화까지 가겠다는 전략이다.

  • 1

    팩토리X는 AI 인프라부터 GPU 운영, AI 에이전트 실행까지 묶은 NHN클라우드의 풀스택 AI 브랜드다.

  • 2

    FactoryX 서울에는 B200 GPU 7656장이 구축됐고, 4080장 단일 GPU 클러스터링은 국내 최대 규모로 소개됐다.

  • 3

    자체 플랫폼 GPU Live는 GPU 평균 활용률을 28%에서 73%까지 올리고, 콜드 스타트 지연을 75초에서 1.2초로 줄였다고 밝혔다.

  • 4

    하반기 출시 예정인 Project X는 비개발자도 자연어로 업무용 AI 에이전트를 설계하게 해주는 실행 서비스다.

AI 모델보다 ‘돌아가는 공장’이 중요해졌다는 얘기

  • NHN클라우드가 새 AI 풀스택 브랜드 ‘FactoryX’를 공개함

    • 2026년 5월 26일 서울 더플라자호텔에서 기자간담회를 열고 AI 인프라, 플랫폼, 서비스까지 묶은 통합 실행 환경을 발표함
    • 이름은 공장(Factory), 2019년 이후 쌓은 경험(eXperience), 고객의 AI 전환 여정(X)을 합친 컨셉임
  • 김동훈 대표가 던진 메시지는 꽤 직설적임. 이제 AI 패권은 거대 모델 자체보다 “그걸 실제 비즈니스에서 안정적으로 굴리는 실행 환경”으로 옮겨갔다는 것

    • 기업들이 멋진 시제품(PoC)은 만들지만 실제 돈 버는 서비스로 못 넘기는 문제가 크다는 판단임
    • 그래서 발표도 모델 자랑보다 인프라 구축, GPU 운영 효율, 업무용 에이전트 실행 쪽에 집중됨

중요

> NHN클라우드의 핵심 주장은 “AI는 모델만 있으면 끝”이 아니라는 거임. 전력, 냉각, GPU 수급, 활용률, 보안, 사내 시스템 연동까지 다 버텨야 실제 업무에 들어간다는 얘기임.

수천 장 GPU를 사는 것보다, 제때 깔고 안 터뜨리는 게 더 빡셈

  • 강민수 CIO는 AI 인프라 구축을 “물리적 전쟁”이라고 표현함

    • 고성능 GPU 서버 확보에만 26주 이상 걸림
    • 핵심 스위치와 케이블 조달은 48주 이상 걸릴 수 있음
    • 설치 기간까지 합치면 프로젝트 하나가 최소 52주짜리 일이 됨
  • 글로벌 기업의 40~60%가 AI 배포를 제때 못 하는 이유도 여기서 나옴

    • 도면에는 클러스터가 멋지게 그려져도, 실제 현장에서는 전력 끌어오고 냉각 설계하고 GPU 수천 장을 물리적으로 연결해야 함
    • 이건 클라우드 콘솔에서 버튼 누르는 문제가 아니라 데이터센터 공사와 공급망 싸움에 가까움
  • NHN클라우드는 차별점으로 수랭식 데이터센터를 내세움

    • 엔비디아 호퍼는 700와트, 블랙웰은 1200와트, 루빈은 1500와트에 육박함
    • 기존 공랭식으로는 열밀도가 감당 안 되는 방향으로 가고 있음
    • 수랭 적용 시 GPU 연간 장애율은 공랭 대비 약 3배 낮아지고, 평균 무고장 시간은 약 2.6배 길어진다고 설명함
  • 현재 ‘FactoryX 서울’에는 B200 GPU 7656장이 구축돼 있음

    • 4080장 단일 GPU 클러스터링은 국내 최대 규모로 소개됨
    • 정부 사업을 통해 총 27.4EF 규모의 국내 최초 엑사스케일 AI 클러스터도 운영 중이라고 밝힘

GPU는 비싸고, 놀리면 바로 돈이 샘

  • 김태훈 CTO는 “GPU를 보유하는 것과 GPU를 잘 쓰는 것은 완전히 다른 문제”라고 짚음

    • 엔비디아 H100 한 장이 유휴 상태면 시간당 2.10달러가 사라짐
    • 1000장짜리 클러스터에서 활용률이 50%에 그치면 연간 약 920만 달러를 낭비하는 셈이라고 계산함
    • 더 웃픈 건, 현장 고객 상당수가 이 비용 누수를 제대로 인지하지 못한다는 점임
  • NHN클라우드가 공개한 해법은 자체 GPU 통합 관리 플랫폼 ‘GPU Live’임

    • 학습과 추론 워크로드를 자동으로 분리함
    • 자원을 동적으로 할당해 GPU 평균 활용률을 28%에서 73%까지 끌어올린 외부 공개 사례를 제시함
    • 콜드 스타트 지연 시간도 75초에서 1.2초로 줄였다고 밝힘. 최대 61배 단축임
  • 개발자 입장에서는 ‘AI EasyMaker’가 눈에 들어오는 부분임

    • 인프라가 어느 물리 위치에 있는지 신경 쓰지 않고 코드와 데이터에 집중하는 환경을 만들겠다는 방향임
    • 대규모 GPU 클러스터를 직접 만지는 팀이 아니어도, 내부 플랫폼 형태로 AI 개발 경험을 단순화하겠다는 얘기임

마지막 퍼즐은 기업용 AI 에이전트

  • 안성민 NHN엔터프라이즈 대표는 생성형 AI 도입 기업 중 실제 비즈니스 가치까지 만든 곳이 한 자릿수 퍼센트, 대략 4~5% 수준이라는 통계를 꺼냄

    • 연구 단계에서는 가능성이 보여도 실제 업무 자동화로 넘어가면 보안, 비용, 내부 데이터 접근 문제가 바로 막힘
    • AI 에이전트가 진짜 직원처럼 일하려면 사내 정보에 접근해야 하는데, 그 순간 기업은 정보 유출 리스크를 걱정할 수밖에 없음
  • 하반기 출시 예정인 ‘Project X’는 이 문제를 겨냥한 AI 에이전트 실행 서비스임

    • 비개발자도 자연어 기반으로 기업 업무 환경에 맞춘 AI 에이전트를 설계할 수 있게 하는 솔루션임
    • 사내 시스템과 데이터를 연동하되 보안과 비용 부담을 낮추는 쪽에 초점을 둠
    • 퍼블릭 환경뿐 아니라 기업용 프라이빗 환경도 지원한다고 설명함
  • NHN클라우드의 큰 그림은 꽤 명확함

    • 아래는 GPU 인프라와 수랭 데이터센터
    • 가운데는 GPU Live 같은 운영 최적화 플랫폼
    • 위에는 Project X 같은 업무용 AI 에이전트 실행 환경
    • 이 세 층을 묶어서 “국내 기업이 글로벌 빅테크에 종속되지 않고 AI 비즈니스를 굴리는 생태계”를 만들겠다는 전략임

기술 맥락

  • 이번 발표의 핵심은 모델 개발이 아니라 AI 실행 환경이에요. 기업이 대규모 언어 모델(LLM)을 실제 서비스에 붙이려면 GPU 수급, 전력, 냉각, 네트워크, 스케줄링이 같이 맞아야 하거든요.

  • NHN클라우드가 수랭을 강조한 이유는 GPU 세대가 올라갈수록 전력과 발열이 너무 커지기 때문이에요. 블랙웰 1200와트, 루빈 1500와트급으로 가면 냉각은 부가 기능이 아니라 장애율과 운영비를 결정하는 핵심 설계가 돼요.

  • GPU Live가 중요한 건 활용률 문제를 정면으로 건드리기 때문이에요. H100 1000장을 들고 있어도 절반만 쓰면 연간 920만 달러가 새는 구조라서, 학습과 추론 워크로드를 자동으로 나누고 재배치하는 운영 계층이 비용 절감의 본게임이 돼요.

  • Project X는 AI 에이전트를 기업 내부 시스템에 붙이는 레이어예요. 여기서는 모델 성능보다 권한, 데이터 접근, 비용 통제, 프라이빗 환경 지원이 더 중요해져요.

AI 경쟁이 ‘누가 더 큰 모델을 만들었나’에서 ‘누가 GPU를 덜 태우고 실제 업무에 붙이나’로 옮겨가는 흐름을 잘 보여주는 발표다. 국내 기업 입장에선 데이터 주권, 비용, 운영 안정성을 한 번에 묶은 선택지가 생기는 게 포인트다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

유튜브, AI 생성 영상에 자동 라벨 붙인다

유튜브가 사실적으로 보이거나 의미 있게 AI로 변경·생성된 콘텐츠에 더 눈에 띄는 라벨을 적용하고, 제작자가 AI 사용 여부를 밝히지 않아도 내부 신호로 감지되면 자동 라벨을 붙이겠다고 밝혔다. 다만 라벨만으로 추천 노출이나 수익화 자격이 바뀌지는 않으며, 제작자는 YouTube Studio에서 잘못된 판정을 수정할 수 있다.

ai-ml

테크 CEO들의 'AI 만능론', 숫자는 아직 그렇게 말하지 않는다

테크 업계에서 AI를 이유로 한 대규모 감원과 조직 재편이 이어지는 가운데, Box 창업자 애런 레비는 CEO들이 실제 업무의 마지막 1마일을 모른 채 AI 에이전트의 능력을 과대평가하고 있다고 지적했다. 2026년 첫 5개월 동안 이미 11만5430명이 해고됐고, 여러 연구는 AI 도입이 체감 생산성만큼 실제 생산성을 끌어올렸다는 근거가 아직 약하다고 말한다.

ai-ml

오픈AI와 앤트로픽, 코딩 에이전트로 드디어 돈 되는 시장을 찾은 듯

사이먼 윌리슨은 오픈AI와 앤트로픽이 코딩 에이전트와 기업용 과금으로 진짜 제품-시장 적합성을 찾았다고 봐. 개인 구독자에게는 월 100달러 플랜이 싸게 느껴지지만, 기업 고객은 이제 사용량 기준 토큰 가격을 그대로 내기 시작했고 이게 대형 고객 예산을 빠르게 흔들고 있다는 얘기야.

ai-ml

컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력

컴팔이 실리콘밸리 기반 AI 인프라 기업 GMI 클라우드와 협력해 대규모 추론과 에이전틱 AI 워크로드에 맞춘 GPU 서버 인프라를 구축한다고 발표했어. COMPUTEX 2026에서는 NVIDIA HGX B300을 지원하는 Compal SGX30-2 같은 고성능 AI 서버 플랫폼도 선보일 예정이야.

ai-ml

AI 쓰면 편해진다더니, 직장인들은 ‘AI 과부하’에 지쳐가는 중

국내 직장인들이 AI 전환 압박, AI 답변 검증 부담, 대체 불안 때문에 피로감을 호소하고 있어. 중앙일보 설문에서는 5284명 중 31.6%가 ‘AI 답변 검증에 시간이 더 걸릴 때’를 가장 지치는 순간으로 꼽았고, 기업들은 무작정 AI 사용량을 밀어붙이는 방식에서 업무 방식 재설계로 넘어가야 한다는 지적이 나와.