본문으로 건너뛰기
피드

ETRI, 국내외 AI 반도체 클라우드 100개를 단일 API로 묶는 플랫폼 추진

devops 약 8분
vote
0
댓글
북마크

ETRI가 K클라우드 프로젝트와 연계해 GPU·NPU 기반 AI 반도체 클라우드 50~100개를 단일 API로 통합 관리하는 클라우드 관리 플랫폼을 개발한다. CSP마다 API와 사용 방식이 달라 생기는 장벽을 줄이고, 국산 AI 반도체와 여러 클라우드를 하나의 자원처럼 쓰게 만드는 게 목표야.

  • 1

    ETRI가 AI 반도체 클라우드 50~100개를 단일 API로 통합 관리하는 CMP 개발 추진

  • 2

    과제는 총사업비 4031억원 규모 K클라우드 기술개발사업의 세부 과제

  • 3

    5개 계층은 API 추상화, 멀티 CSP 관리, AI 모델 배포, HA·DR, AI 에이전트 자동화로 구성

  • 4

    최상위 계층에 모델 컨텍스트 프로토콜(MCP) 서버 API를 제공해 외부 AI 에이전트 연동을 지원

  • 5

    2028년까지 상용 GPU·NPU 클라우드 대상 기술 개발, 2029년부터 K클라우드 결과물 연동 계획

  • 6

    ITU·ISO 국제 표준 제안까지 노려 AI 반도체 클라우드 표준 리더십 확보를 추진

목표는 ‘AI 반도체 클라우드 원 클라우드’임

  • ETRI가 국내외 AI 반도체 클라우드 50~100개를 단일 API로 통합 관리하는 클라우드 관리 플랫폼(CMP) 개발에 나섬

    • 대상은 GPU·NPU 기반 클라우드
    • K클라우드 프로젝트와 연계된 과제
    • 클라우드 서비스 제공자(CSP)마다 API와 사용 방식이 달라 통합 활용이 어려운 문제를 해결하려는 게 핵심임
  • 최종 목표는 사용자가 CSP 장벽 없이 어느 클라우드에서나 AI 반도체를 쓸 수 있는 환경임

    • 지금은 사업자별 API, 자원 모델, 운영 방식이 제각각이라 여러 클라우드를 하나처럼 쓰기 어려움
    • 플랫폼이 잘 되면 국가 차원에서 AI 반도체 자원을 단일 풀처럼 다루는 ‘원 클라우드’ 체계가 가능해짐

중요

> 이 과제는 단순 관리 화면을 만드는 수준이 아님. GPU·NPU 클라우드 50~100개를 단일 API로 묶고, AI 모델 배포와 장애 대응, 에이전트 자동화까지 한 플랫폼에 넣겠다는 구상임.

4031억원짜리 K클라우드 사업 안의 세부 과제

  • 이 CMP 개발은 총사업비 4031억원 규모의 K클라우드 기술개발사업 안에서 진행됨

    • K클라우드 기술개발사업은 2025년부터 2030년까지 추진됨
    • 목표는 국산 AI 반도체 기반 데이터센터 하드웨어(HW)·소프트웨어(SW) 핵심 기술 확보
    • 이번 CMP 과제는 올해 착수됨
  • 배경에는 정부의 AI 고속도로 정책이 있음

    • 권역별 사업자들이 데이터센터를 구축하는 구조라, 운영 주체와 클라우드 환경이 여러 개로 나뉠 수밖에 없음
    • 그대로 두면 사용자는 클라우드마다 다른 API와 절차를 익혀야 하고, AI 반도체 자원도 파편화됨
    • ETRI는 이 단절을 CMP로 감싸서 하나의 접근 경로를 만들려는 중임

플랫폼은 5개 계층으로 설계됨

  • 첫 번째 계층은 AI 반도체 클라우드 연동 및 API 추상화 계층임

    • CSP마다 다른 API를 직접 노출하지 않고, 공통 인터페이스로 감싸는 역할
    • 사용자는 특정 사업자의 API 차이를 덜 신경 쓰고 GPU·NPU 자원에 접근할 수 있음
  • 두 번째와 세 번째 계층은 멀티 CSP 통합 관리와 AI 모델 자유 배포임

    • 여러 CSP의 자원을 한 플랫폼에서 관리하는 구조
    • 국산 AI 파운데이션 모델 같은 AI 모델을 특정 데이터센터에 묶지 않고 여러 AI 데이터센터에 배포하는 그림을 염두에 둠
  • 네 번째와 다섯 번째 계층은 멀티 클라우드 가용성(HA·DR)과 AI 에이전트 자동화임

    • 특정 클라우드나 데이터센터 장애에도 서비스를 이어가기 위한 고가용성·재해복구 계층이 포함됨
    • 최상위에는 모델 컨텍스트 프로토콜(MCP) 서버 API를 제공해 외부 AI 에이전트가 플랫폼에 직접 연결될 수 있게 설계함
    • 자동화 에이전트는 프레임워크별 에이전트를 통합한 멀티 에이전트 구조로 운영됨
sequenceDiagram
    participant 사용자
    participant 통합API
    participant CMP
    participant CSP
    participant AI에이전트
    사용자->>통합API: AI 반도체 자원 요청
    통합API->>CMP: 공통 명령으로 변환
    CMP->>CSP: GPU·NPU 클라우드 배포 요청
    CSP-->>CMP: 자원 상태와 배포 결과 반환
    AI에이전트->>CMP: MCP 서버 API로 자동화 작업 요청
    CMP-->>사용자: 모델 배포와 운영 상태 제공

일정은 2028년 개발, 2029년 K클라우드 연동

  • ETRI는 2028년까지 국내외 상용 GPU·NPU 클라우드를 대상으로 기술을 개발할 계획임

    • 먼저 실제 상용 클라우드와 붙여 API 추상화와 통합 관리 기술을 다듬는 흐름
    • 2029년부터는 K클라우드 결과물이 출시되는 시점에 맞춰 연동을 시작함
  • 활용처도 이미 몇 가지가 언급됨

    • 이노그리드가 개발하는 AI 특화 CMP 탑재
    • 국가 AI 고속도로 연계 실증
    • 첨단 GPU 활용 지원 사업 통합 포털 구축
    • ITU·ISO에 관련 플랫폼 국제 표준 제안

ℹ️참고

> 표준화까지 노리는 이유는 명확함. 클라우드별 API가 갈라진 상태에서는 국산 AI 반도체가 좋아져도 실제 운영 경험이 파편화될 수밖에 없고, 그러면 생태계 주도권을 잡기 어려움.

잘 되면 개발자와 기업 입장에서는 꽤 편해짐

  • 플랫폼이 완성되면 AI 인프라 접근성이 높아질 가능성이 큼

    • 내년 출시가 예상되는 국산 AI 파운데이션 모델을 국내 어느 AI 데이터센터에도 자유롭게 배포하는 기반이 생길 수 있음
    • 개인이나 기업이 특정 CSP에 묶이지 않고 여러 AI 반도체 클라우드를 조합해 쓰는 시나리오도 가능해짐
  • 다만 난이도는 만만치 않음

    • CSP별 API 차이를 추상화하는 것만 해도 어렵고, 여기에 모델 배포, HA·DR, 에이전트 자동화까지 들어감
    • 여러 사업자와 정부 과제 결과물을 동시에 연결해야 하므로 기술뿐 아니라 운영·표준·거버넌스도 같이 맞아야 함
    • 그래도 성공하면 한국 AI 인프라를 ‘분산된 데이터센터 묶음’이 아니라 ‘하나의 프로그래밍 가능한 자원’처럼 다루는 기반이 생김

기술 맥락

  • 이번 과제의 핵심 선택은 CSP별 API를 그대로 쓰게 두지 않고, CMP가 공통 API로 추상화하는 거예요. 클라우드마다 자원 생성, 배포, 상태 조회 방식이 다르면 AI 모델을 여러 곳에 배포하는 순간 운영 복잡도가 폭발하거든요.

  • 5개 계층 구조를 둔 이유도 역할을 나누기 위해서예요. 아래쪽에서는 GPU·NPU 클라우드 연결과 API 추상화를 처리하고, 중간에서는 여러 CSP를 관리하고 모델을 배포해요. 위쪽에서는 HA·DR과 AI 에이전트 자동화가 붙어서 운영 단계까지 커버해요.

  • MCP 서버 API를 최상위에 넣은 점도 흥미로워요. 단순히 사람이 포털에서 클릭하는 플랫폼이 아니라, 외부 AI 에이전트가 클라우드 자원과 배포 작업을 직접 호출할 수 있는 구조를 염두에 둔 거예요.

  • K클라우드 결과물이 2029년부터 붙는 일정도 의미가 있어요. 먼저 상용 GPU·NPU 클라우드로 통합 관리 기술을 검증하고, 이후 국산 AI 반도체 기반 데이터센터와 연결하겠다는 순서예요. 처음부터 모든 걸 국산 환경에만 맞추면 범용성이 떨어질 수 있으니까요.

  • 개발자 입장에서는 이게 잘 되면 특정 CSP의 콘솔이나 API에 덜 묶이게 돼요. 모델 배포 위치와 자원 종류를 더 유연하게 고를 수 있고, 장애 대응이나 재해복구도 플랫폼 레벨에서 다룰 여지가 생겨요.

이건 단순한 관리 포털 개발이 아니라, 한국형 AI 인프라를 ‘여러 사업자 묶음’이 아니라 ‘하나의 클라우드 자원’처럼 보이게 만들려는 시도야. API 추상화와 모델 배포, HA·DR, 에이전트 자동화까지 들어가서 성공하면 공공 AI 인프라 운영 방식에 꽤 큰 영향을 줄 수 있어.

댓글

댓글

댓글을 불러오는 중...

devops

베스핀글로벌, AI 서비스 운영용 클라우드 데이터 엔지니어 과정 5기 모집

베스핀글로벌이 서울시 청년취업사관학교 새싹과 함께 AI·클라우드 인재 양성 과정을 다시 연다. 파이썬·리눅스부터 AWS 인프라, 데이터 파이프라인, 머신러닝 운영까지 이어지는 과정이고, 우수 수료자에게는 베스핀글로벌 인턴십 기회도 제공돼.

devops

이노그리드, 2030년 국내 클라우드 솔루션 1위 노린다

이노그리드가 2030년까지 국내 클라우드 솔루션 1위 기업이 되겠다는 ‘비전 플러스 2030’을 공개했어. 핵심은 솔루션을 15종으로 늘리고, 고객사를 500개에서 1000개로 확대하며, GPU·NPU·CPU·QPU 같은 연산 자원을 하나의 AI 클라우드 플랫폼으로 묶는 전략이야.

devops

이노그리드, xPU 묶는 AI 클라우드 플랫폼으로 2030년 국내 1위 노린다

이노그리드가 2030년까지 국내 클라우드 솔루션 1위를 목표로 AI 클라우드 플랫폼 전략을 공개했다. GPU, NPU, CPU, QPU 같은 다양한 연산 자원을 하나의 컨트롤 플레인으로 묶고, NHN클라우드 계열 편입과 합병 법인을 기반으로 내년 매출 1000억 원과 턴어라운드를 노린다는 구상이다.

devops

SaaS 클라우드 비용, 이제 ‘전용 서버 섞기’가 다시 진지해지는 중

SaaS 기업에서 데이터베이스, 검색, 캐시, 백그라운드 워커처럼 계속 켜져 있는 워크로드는 클라우드 과금 구조와 잘 안 맞을 수 있다는 얘기다. 하이벨로시티는 이런 지속 부하 계층을 베어메탈·전용 서버로 옮겨 비용 예측성과 데이터베이스 성능을 동시에 잡는 SaaS 번들을 내놨다. 핵심은 클라우드를 버리자는 게 아니라, 워크로드 성격별로 인프라를 다시 나누자는 쪽에 가깝다.

devops

나무기술, 기업용 AI·클라우드 운영 웨비나 연다

나무기술이 6월 9일 기업 AI 도입을 주제로 풀스택 AI·클라우드 플랫폼 웨비나를 연다. AI 에이전트, 멀티클라우드 관리, 쿠버네티스 기반 PaaS 운영 모델을 한 번에 다루는 구성이다.