---
title: "BC카드, 금융 특화 임베딩 모델 공개…한국어 금융 검색 성능 최대 15% 끌어올림"
published: 2026-07-03T02:05:03.284Z
canonical: https://jeff.news/article/4552
---
# BC카드, 금융 특화 임베딩 모델 공개…한국어 금융 검색 성능 최대 15% 끌어올림

BC카드가 한국어 금융 데이터 182만건으로 학습한 금융 특화 임베딩 모델을 공개했다. 경량형은 6억 파라미터로 일반 중앙처리장치에서 돌릴 수 있고, 고품질형은 40억 파라미터로 정밀 검색 업무를 겨냥한다.

- BC카드가 금융 특화 생성형 인공지능 서비스용 임베딩 모델을 자체 개발해서 공개함
  - 핵심은 챗봇 그 자체가 아니라, 챗봇이 답하기 전에 관련 문서를 얼마나 정확히 찾아오느냐임
  - 금융권에서는 상담, 사내 업무지원, 문서 검색에 생성형 인공지능을 붙이는 흐름이 커지고 있어서 검색 품질이 바로 서비스 품질로 이어짐

- 이번 모델은 한국어 금융 데이터 182만건을 학습한 게 포인트임
  - 범용 임베딩 모델은 ‘가맹점’, ‘카드 결제’ 같은 국내 금융권 표현과 문맥을 충분히 이해하지 못하는 문제가 있었음
  - BC카드는 이 한계를 줄이려고 예전에 오픈소스 플랫폼에 공개했던 금융 데이터셋을 활용함
  - 그 결과 한국어 금융 전문 용어 검색 성능이 기존 대비 최대 15% 좋아졌다고 밝힘

- 모델 라인업은 경량형과 고품질형 두 가지로 나뉨
  - 경량형은 약 6억 파라미터 규모고, 일반 중앙처리장치 환경에서도 사용할 수 있음
  - 이 경량형 모델은 글로벌 벤치마크 평가 항목에서 전 세계 1위를 기록했다고 함
  - 고품질형은 약 40억 파라미터 규모로 그래픽처리장치 환경을 전제로 하며, 경량형보다 약 10% 높은 성능을 낸다고 설명함

> [!IMPORTANT]
> 숫자로 보면 꽤 선명함. 182만건 금융 데이터셋, 6억 파라미터 경량형, 40억 파라미터 고품질형, 검색 성능 최대 15% 향상이 이번 발표의 핵심 수치임.

- 금융사 입장에서 자체 임베딩 모델은 보안 이슈와도 바로 연결됨
  - 외부 인공지능 서비스에 금융 데이터를 넘기지 않고도 내부 검색 기반 인공지능 서비스를 운영할 수 있기 때문임
  - 특히 금융 데이터는 고객 정보, 거래 맥락, 내부 문서가 얽혀 있어서 외부 의존도를 낮추는 게 꽤 큰 전략적 의미를 가짐

- BC카드는 이 모델을 허깅페이스에도 공개할 예정임
  - 먼저 케이티 그룹사 인공지능 서비스 적용을 시작으로 활용 범위를 넓힐 계획임
  - 이후 정부와 금융기관 대상으로 금융 인공지능 검색 플랫폼 사업까지 확대하겠다는 그림을 제시함
  - 정부의 소버린 인공지능 기조와 금융권 디지털 전환 정책에 맞춘 발표라는 메시지도 같이 깔려 있음

---

## 기술 맥락

- 이번 선택의 핵심은 범용 임베딩 모델을 그대로 쓰지 않고 금융 도메인에 맞춘 모델을 따로 만들었다는 점이에요. 금융권 검색은 일반 문서 검색보다 용어 의존도가 높아서, 같은 단어라도 업무 맥락을 모르면 엉뚱한 문서를 가져오기 쉽거든요.

- 경량형과 고품질형을 나눈 것도 현실적인 선택이에요. 모든 업무가 최고 성능을 요구하는 건 아니라서, 일반 중앙처리장치에서 돌릴 수 있는 6억 파라미터 모델은 비용과 배포 편의성이 좋고, 40억 파라미터 모델은 정밀 검색이 필요한 업무에 쓰기 좋아요.

- 금융사 입장에서는 검색 모델을 자체 보유하는 이유가 성능만은 아니에요. 내부 문서와 금융 데이터를 외부 서비스에 넘기지 않아도 된다는 점이 크고, 이건 보안 심사나 규제 대응에서도 꽤 중요한 차이를 만들어요.

- 허깅페이스 공개 계획은 생태계 전략에 가까워요. 모델을 열어두면 외부 검증과 활용 사례가 쌓이고, 금융권 전반에서 한국어 금융 데이터에 맞춘 검색 기반 생성형 인공지능을 만들기 쉬워지거든요.

## 핵심 포인트

- 한국어 금융 전문 용어 검색 성능이 기존 대비 최대 15% 향상됨
- 6억 파라미터 경량형 모델은 일반 중앙처리장치 환경에서 사용 가능함
- 40억 파라미터 고품질형 모델은 그래픽처리장치 환경에서 경량형보다 약 10% 높은 성능을 냄
- 허깅페이스 공개와 케이티 그룹사 적용, 정부·금융기관 대상 검색 플랫폼 사업 확대를 계획 중임

## 인사이트

금융권 생성형 인공지능의 병목은 모델 자체보다 내부 문서를 얼마나 정확히 찾아오느냐인 경우가 많다. BC카드가 임베딩 모델을 자체 확보했다는 건 성능보다도 데이터 외부 반출 리스크를 줄이는 쪽에서 의미가 큼.
