---
title: "브릭섬, 1MW급 NPU 추론 클라우드 ‘네오클라우드’ 하반기 오픈 추진"
published: 2026-06-23T07:05:04.412Z
canonical: https://jeff.news/article/4258
---
# 브릭섬, 1MW급 NPU 추론 클라우드 ‘네오클라우드’ 하반기 오픈 추진

브릭섬이 NPU 기반 LLM 추론 전용 클라우드 ‘네오클라우드’를 올해 하반기 공식 오픈하겠다고 밝혔다. 1MW 규모로 시작해 6MW, 20MW까지 키우고, 토큰 API와 베어메탈 임대 두 가지 방식으로 제공한다.

- 브릭섬이 NPU 기반 LLM 추론 전용 클라우드 ‘네오클라우드’를 추진함
  - 시작 규모는 1MW이고, 올해 하반기 공식 오픈 예정
  - 이후 6MW, 20MW까지 단계적으로 인프라를 키우겠다는 계획

- 핵심은 학습용이 아니라 ‘추론 전용’ 클라우드라는 점임
  - 엑사원, 솔라, GLM, 미니맥스 같은 오픈소스 모델을 토큰 단위 API로 제공
  - AI 반도체가 들어간 고성능 서버를 통째로 빌리는 베어메탈 서비스도 같이 제공

- 브릭섬은 엔비디아 GPU 일변도에서 벗어난 벤더 중립 설계를 내세움
  - 추론 효율이 높은 NPU를 중심에 두고, 여러 종류의 가속기를 함께 운영하는 구조
  - 자체 개발한 클루마가 모델 배치, 장애 대응, 자원 스케줄링을 통합 관리

> [!IMPORTANT]
> 브릭섬이 보는 다음 AI 인프라 경쟁은 ‘누가 더 큰 모델을 갖고 있나’가 아니라 ‘누가 토큰을 더 싸고 안정적으로 공급하나’임.

- 회사의 문제의식은 꽤 명확함. 오픈소스 모델 성능이 올라오면, 남는 병목은 추론 비용과 안정성임
  - 박종찬 대표는 “AI 경쟁의 다음 무대는 누가 더 싸고 안정적으로 토큰을 공급하느냐”라고 봄
  - 국내에서 NPU와 운영 자동화 소프트웨어를 묶어 추론 시대 인프라를 만들겠다는 포지션

- 브릭섬은 2025년 4월 설립된 광주 소재 딥테크 스타트업임
  - 대규모 AI 인프라 운영 경험을 바탕으로 AI 인프라 구축·운영 사업을 전개
  - 이종 NPU·GPU 환경을 위한 운영 소프트웨어도 개발·공급 중

---
## 기술 맥락

- 이번 선택의 핵심은 GPU 범용 클라우드가 아니라 NPU 추론 전용 클라우드예요. 학습보다 추론 호출이 많아지는 서비스 단계에서는 토큰당 비용과 전력 효율이 바로 경쟁력이 되거든요.

- 브릭섬이 벤더 중립을 강조하는 이유는 특정 칩 수급이나 가격에 묶이면 인프라 사업자가 너무 취약해지기 때문이에요. 여러 NPU와 GPU를 섞어 쓰려면 모델 배치, 장애 대응, 스케줄링을 한 레이어에서 잡아주는 운영 플랫폼이 필요해요.

- 토큰 API와 베어메탈을 같이 내놓는 것도 고객층을 나누려는 선택으로 보여요. 빠르게 모델을 호출하고 싶은 팀은 API를 쓰고, 성능·보안·환경 제어가 중요한 팀은 서버 단위 임대를 고를 수 있거든요.

## 핵심 포인트

- 1MW 규모 NPU 추론 클라우드로 시작해 20MW까지 단계 확장 계획
- 엑사원, 솔라, GLM, 미니맥스 같은 오픈소스 모델을 토큰 API로 제공
- 특정 칩 제조사에 묶이지 않는 벤더 중립 구조와 자체 운영 플랫폼 클루마가 핵심

## 인사이트

국내에서도 ‘GPU를 얼마나 확보했나’에서 ‘토큰을 얼마나 싸고 안정적으로 뽑나’로 인프라 경쟁의 프레임이 바뀌는 분위기다. 실제 성능과 가격이 공개돼야 판단 가능하지만, NPU 중심 추론 클라우드라는 방향성 자체는 꽤 직접적인 시장 신호임.
