BC카드가 GPU 더 안 사고 vLLM·양자화·SLM 스웜으로 금융 AI를 굴린 방식
BC카드는 자체 대형 모델 개발보다 오픈소스 모델을 자사 환경에 최적화하는 전략으로 방향을 틀었다. vLLM, FP8 양자화, 스펙큘레이티브 디코딩, SLM 스웜을 조합해 추론 성능과 비용을 개선했고, 금융권 업무 자동화와 거버넌스까지 연결했다.
- 1
BC카드는 라마3 8B 기반 금융 LLM에서 출발했지만 빠르게 쏟아지는 글로벌 모델 때문에 오픈소스 최적화 전략으로 전환함
- 2
vLLM과 양자화로 모델 크기를 50% 줄이고 성능을 최대 3배 높였으며, 스펙큘레이티브 디코딩으로 처리량을 56% 개선함
- 3
가맹점 심사, RPA, 고객센터 자동화에서 총 10만2000시간의 업무 효율화 성과를 냄
- 4
GPT-4o 기반 해외 결제 가맹점명 추론을 오픈소스 모델로 바꿔 월 500만~1000만원 비용을 0원으로 낮추고 정확도 90%를 유지함
이 사례가 재밌는 이유는 ‘우리도 LLM 만들었다’에서 끝나지 않고, 실제 금융사 온프레미스 제약 안에서 어떻게 싸게, 빠르게, 통제 가능하게 굴릴지까지 내려갔다는 점임. 한국 기업 AI 도입에서 제일 현실적인 고민이 GPU 예산, 보안, 운영 인력인데 이 세 가지를 정면으로 다룬 사례다.
관련 기사
NHN클라우드, GPU 기반 MLOps 실무 교육 과정 연다
NHN클라우드가 구디아카데미와 함께 K-디지털 트레이닝 AI 캠퍼스 사업의 일환으로 ‘AI 팩토리 GPU 가속 MLOps 스쿨’을 운영한다. 교육생은 도커, 쿠버네티스, MLOps 파이프라인, AI 모델 학습·배포 자동화, 클라우드 기반 AI 서비스 운영을 프로젝트 중심으로 배우게 된다.
베슬AI, 세계경제포럼이 찍은 AI GPU 클라우드 스타트업 됐다
베슬AI가 세계경제포럼의 2026년 테크놀로지 파이오니어 100개사에 선정됐다. 핵심은 네오클라우드와 베슬 클라우드로, 여러 국가 데이터센터와 협력해 AI 워크로드용 GPU 인프라를 제공한다는 점이다.
270억 공공의료원 AI 클라우드 HIS 사업, 이지케어텍과 휴니버스 맞대결로 간다
공공의료원 병원정보시스템을 AI 클라우드 기반으로 전환하는 270억 원 규모 정부 사업이 이지케어텍 컨소시엄과 휴니버스글로벌 컨소시엄의 경쟁 구도로 확정됐다. 국립중앙의료원과 서울의료원에서 먼저 개발·실증한 뒤 전국 35개 지방 공공의료원으로 확산하는 것이 목표다.
NHN클라우드, GPU 기반 MLOps 실무 인재 키운다
NHN클라우드가 구디아카데미와 함께 ‘AI 팩토리 GPU 가속 MLOps 스쿨’을 운영한다. 도커, 쿠버네티스, MLOps 파이프라인, AI 모델 학습·배포 자동화 등 실제 서비스 운영에 필요한 기술을 프로젝트 중심으로 가르치는 과정이다.
레드햇이 말하는 금융권 AI 전략, 모델보다 중요한 건 ‘하네스’다
한국레드햇이 금융권 AI 에이전트 운영의 핵심으로 하네스 구축과 추론 비용 최적화를 제시했다. MCP, 컨텍스트 허브, 컨테이너 샌드박스, 토큰 쿼터, vLLM, 양자화 같은 요소를 묶어 폐쇄망·규제 환경에서도 AI를 통제 가능한 운영 체계로 만들자는 얘기다.
댓글
댓글
댓글을 불러오는 중...