카페24는 120개 모델 라우터, 델은 랙당 GPU 144개 서버…국내 AI 인프라 뉴스 몰아보기

ai-ml 2026-06-23 약 6분

 tags

#llm #gpu #hpc #enterprise-ai #cloud

vote

북마크

카페24가 120여 개 AI 모델을 단일 API로 묶는 LLM 라우터를 내놨고, 델은 엔비디아 베라 루빈 NVL4 기반 슈퍼컴 서버 XE8812를 공개했다. 오픈AI의 기업용 AI는 삼성전자와 서울대 도입 사례로 국내 확산 흐름이 뚜렷해졌고, 신세계I&C는 게임 IP 콘솔 패키지 출시를 예고했다.

1
카페24 LLM 라우터는 챗GPT, 클로드, 제미나이, 딥시크, 큐원, 라마 등 120여 개 모델을 단일 API로 연결
2
델 파워엣지 XE8812는 랙당 최대 144개 GPU와 300킬로와트 이상 전력, CPU·GPU 100% 직접 액체 냉각을 지원
3
삼성전자는 챗GPT 엔터프라이즈와 코덱스를 업무에 도입하고, 서울대는 약 4만7000명에게 챗GPT 에듀를 제공
4
신세계I&C는 마이 리틀 퍼피와 솔라테리아 콘솔 패키지를 글로벌 독점 출시

오늘 클라우드·AI 업계 뉴스는 한 줄로 요약하면 “모델도 많고, GPU도 더 빽빽해지고, 기업 도입도 커지고 있음”임
- 카페24는 LLM 라우터를 출시했고, 델은 차세대 슈퍼컴 서버를 공개함
- 오픈AI는 삼성전자·서울대 같은 대형 조직 도입 사례를 확보했고, 신세계I&C는 게임 IP 콘솔 패키지 출시 소식을 냄
카페24의 LLM 라우터는 120여 개 AI 모델을 하나의 API로 묶는 제품임
- 연결 대상에는 챗GPT, 클로드, 제미나이, 딥시크, 큐원, 라마 등이 들어감
- 사용자가 요청을 보내면 라우팅 엔진이 코딩, 추론, 번역, 창작 같은 작업 유형을 보고 적합한 모델로 넘기는 구조임
- 미리 사용할 모델 범위를 정해두면 그 안에서만 자동 연결돼서, 매번 모델별 성능과 비용을 사람이 비교하지 않아도 됨
이 라우터의 포인트는 “모델 선택”보다 “운영 자동화”에 가까움
- 같은 모델을 여러 AI 서비스 제공사가 제공할 때 비용, 속도, 처리량 기준으로 제공사를 자동 선택할 수 있음
- 특정 제공사를 허용하거나 막는 화이트리스트·블랙리스트도 지원함
- 특정 모델이 응답하지 않으면 미리 지정한 대체 모델이 이어받는 자동 전환 기능도 있음

❗중요

> AI 서비스를 실제 프로덕션에 붙이면 모델 성능만큼 중요한 게 비용, 장애 전환, 제공사 정책임. LLM 라우터는 그 골치 아픈 운영 문제를 API 계층에서 처리하겠다는 방향에 가까움.

델은 고성능컴퓨팅과 AI용 서버인 파워엣지 XE8812를 공개함
- 엔비디아 베라 루빈 NVL4 아키텍처를 채용했고, 델 파워랙 9100에서 랙당 최대 144개 GPU를 탑재할 수 있음
- 전력은 300킬로와트 이상을 지원하고, CPU와 GPU 모두 100% 다이렉트 리퀴드 쿨링 기반으로 설계됨
- 팬리스 방식의 직접 액체 냉각이라 분자 역학, 다중 물리 시뮬레이션 같은 빡센 연구 워크로드가 주요 타깃임
이전 세대인 엔비디아 GB200 NVL4 대비 스펙도 꽤 공격적으로 올라감
- 베라 루빈 NVL4 전환으로 호스트 메모리가 확장되고 코어 수는 144개에서 176개로 늘어남
- 소켓당 메모리와 GPU 메모리는 이전 세대 대비 50% 증가했다고 밝힘
- 델은 이 서버를 기반으로 소버린 AI, 엔지니어링·디자인 워크플로우, 유전체 과학 같은 분야의 AI 팩토리를 확장하겠다는 그림임
오픈AI의 기업용 AI는 국내에서도 조직 단위 도입으로 넘어가는 중임
- 삼성전자는 임직원 업무에 챗GPT 엔터프라이즈와 코덱스를 도입하기 시작함
- 서울대는 전 구성원 약 4만7000명에게 챗GPT 에듀를 제공하기로 함
- 이제 생성형 AI가 개인 생산성 도구가 아니라, 데이터·권한·보안·업무 절차 안에 들어가는 조직 운영 도구가 되고 있다는 얘기임
오픈AI가 인용한 업무 시간 수치도 꽤 현실적임
- 맥킨지 글로벌 인스티튜트 연구에 따르면 평균 지식 근로자는 업무 주간의 약 28%를 이메일 관리에 씀
- 내부 정보 검색이나 도와줄 동료를 찾는 데도 약 20%를 쓴다고 함
- 기업용 AI가 노리는 지점은 결국 “사람이 하루 종일 뒤지는 업무 맥락”을 줄이는 쪽임
신세계I&C는 게임 IP 2종의 콘솔 패키지를 글로벌 독점 출시함
- 대상은 드림모션의 마이 리틀 퍼피와 스튜디오 두달의 솔라테리아임
- 두 게임은 스팀에서 각각 압도적으로 긍정적, 매우 긍정적 평가를 받은 타이틀임
- 마이 리틀 퍼피는 닌텐도와 PS5용으로 6월 25일 출시되고, 솔라테리아는 닌텐도용으로 7월 23일 발매됨
- 가격은 마이 리틀 퍼피 초회판 3만9800원·한정판 8만4800원, 솔라테리아 초회판 3만4800원·한정판 6만9800원임

기술 맥락

LLM 라우터가 중요한 이유는 모델이 너무 많아졌기 때문이에요. 팀마다 챗GPT, 클로드, 제미나이, 라마를 직접 비교해서 붙이면 처음엔 빠른데, 비용 정책과 장애 대응이 쌓이는 순간 운영 부담이 확 커지거든요.
카페24 방식은 모델 선택을 애플리케이션 코드에서 빼서 라우팅 계층으로 옮기는 선택이에요. 요청 유형을 보고 코딩, 추론, 번역, 창작에 맞는 모델을 고르고, 제공사별 비용·속도·처리량까지 반영하겠다는 거라서 일종의 LLM 오케스트레이션에 가까워요.
델 XE8812 쪽은 완전히 다른 레이어의 이야기지만, 같은 AI 인프라 문제를 다뤄요. 모델을 잘 고르는 것도 중요하지만, 랙당 GPU 144개와 300킬로와트 이상 전력 같은 숫자가 말해주듯 대규모 AI는 결국 전력, 냉각, 메모리 밀도의 싸움이거든요.
삼성전자와 서울대 사례는 도입 단위가 개인에서 조직으로 커졌다는 점이 핵심이에요. 기업용 AI는 계정만 뿌리는 게 아니라 권한, 보안, 데이터 접근, 업무 절차를 같이 설계해야 해서 개발 조직도 사내 AI 플랫폼 관점으로 접근할 필요가 있어요.

국내 AI 도입 뉴스가 이제 모델 사용기 수준을 넘어 라우팅, 서버 밀도, 조직 배포, 교육기관 도입까지 한 번에 움직이는 단계로 넘어간 느낌이 강해. 개발자 입장에선 어떤 모델을 쓰느냐보다 어떻게 비용·성능·권한·장애 전환을 운영 체계 안에 넣느냐가 더 중요해지고 있음.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-06-23

삼성SDS, 공공 AI 박람회서 패브릭스·브리티웍스·AI 데이터센터 전면 배치

삼성SDS가 2026 공공 AI 박람회에서 공공 행정용 AI 에이전트, 모바일 협업 솔루션, AI 클라우드 인프라를 함께 선보였다. 국민 민원 요약·분류, 조달법령 해석, 정부24 AI 검색 같은 사례를 통해 공공 부문 AI 전환 시장을 정조준했다.

ai-ml 2026-06-23

브릭섬, 1MW급 NPU 추론 클라우드 ‘네오클라우드’ 하반기 오픈 추진

브릭섬이 NPU 기반 LLM 추론 전용 클라우드 ‘네오클라우드’를 올해 하반기 공식 오픈하겠다고 밝혔다. 1MW 규모로 시작해 6MW, 20MW까지 키우고, 토큰 API와 베어메탈 임대 두 가지 방식으로 제공한다.

ai-ml 2026-06-23

스페이스X, 리플렉션 AI에 9.7조원 규모 AI 연산 자원 판다

스페이스X가 오픈소스 AI 스타트업 리플렉션 AI와 최대 63억달러 규모의 GPU 연산 계약을 맺었다. 리플렉션 AI는 2026년 7월부터 2029년까지 매달 1억5000만달러를 내고 엔비디아 GB300 기반 연산 자원을 쓰게 된다. AI 경쟁에서 모델만큼이나 GPU 접근권과 데이터센터 인프라가 전략 자산이 됐다는 신호다.

ai-ml 2026-06-23

스페이스X, 오픈소스 AI 스타트업에 최대 63억달러 규모 컴퓨팅 파워 제공

스페이스X가 오픈소스 AI 스타트업 리플렉션 AI와 대규모 컴퓨팅 파워 공급 계약을 맺었다는 보도다. 리플렉션 AI는 엔비디아 GB300 기반 인프라를 확보하기 위해 2029년까지 최대 63억달러 규모로 스페이스X의 콜로서스를 이용할 예정이다.

ai-ml 2026-06-23

농협은행·서울신보, AI 빅데이터로 서울 소상공인 상권 분석한다

농협은행과 서울신용보증재단이 AI·빅데이터 기반 소상공인 지원을 위한 업무협약을 맺었다. 카드 소비, 은행 여수신, 하나로마트 유통 소비 데이터와 상권분석 역량을 결합해 서울시 행정구역별 소비 패턴과 상권 변화를 분석하고 맞춤형 경영진단 모델을 개발한다는 계획이다.

카페24는 120개 모델 라우터, 델은 랙당 GPU 144개 서버…국내 AI 인프라 뉴스 몰아보기

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

카페24는 120개 모델 라우터, 델은 랙당 GPU 144개 서버…국내 AI 인프라 뉴스 몰아보기

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사