본문으로 건너뛰기
피드

BC카드, 금융 문맥 잘 찾는 자체 임베딩 모델 공개

ai-ml 약 6분
vote
0
댓글
북마크

BC카드가 국내 금융 문맥에 특화된 생성형 AI 임베딩 모델을 자체 개발해 공개했음. 182만건 규모 데이터셋을 활용했고, 경량형 6억 파라미터 모델과 고품질형 40억 파라미터 모델 두 가지로 나뉨. 금융 데이터를 외부 AI 서비스에 넘기지 않고도 검색 기반 AI 서비스를 운영할 수 있는 기반을 확보했다는 점이 핵심임.

  • 1

    BC카드가 금융 특화 임베딩 모델을 자체 개발해 생성형 AI 검색 정확도 향상을 노림

  • 2

    182만건 규모 금융 데이터셋을 활용해 국내 금융 용어와 문맥 이해 한계를 보완함

  • 3

    경량형 모델은 6억 파라미터로 CPU에서 구동 가능하고, 일부 글로벌 벤치마크에서 최대 15% 향상된 성능을 냈다고 밝힘

  • 4

    고품질형 모델은 40억 파라미터로 GPU 환경에서 동작하며 경량형보다 약 10% 높은 성능을 목표로 함

BC카드가 만든 건 ‘답변 모델’보다 앞단의 검색 모델

  • BC카드가 금융 특화 생성형 AI용 임베딩 모델을 자체 개발해 공개함

    • 임베딩 모델은 질문과 문서를 AI가 이해할 수 있는 숫자 좌표로 바꿔주는 역할을 함
    • 의미가 비슷한 문서를 가까운 위치에 놓고, 질문과 가장 관련 있는 정보를 찾아 생성형 AI에 넘기는 구조임
  • 예를 들어 사용자가 “해외결제 수수료는 얼마인가요?”라고 물으면, 모델은 표현이 다른 관련 문서까지 찾아야 함

    • ‘해외 이용 수수료’, ‘국제 브랜드 수수료’처럼 단어는 달라도 의미가 같은 문서를 잡아내야 함
    • 금융 AI에서 이 검색 단계가 삐끗하면 답변 모델이 아무리 좋아도 헛소리를 하기 쉬움

중요

> 금융 생성형 AI의 품질은 “말을 얼마나 자연스럽게 하냐”보다 “맞는 약관과 문서를 먼저 찾느냐”에서 갈리는 경우가 많음.

왜 범용 임베딩 모델로는 부족했나

  • 기존 임베딩 모델은 국내 금융 문맥을 충분히 이해하지 못하는 한계가 있었다고 BC카드는 설명함

    • 가맹점, 카드 결제, 수수료, 약관처럼 금융권에서 자주 쓰는 표현은 일반 문서 검색과 결이 다름
    • 같은 의미라도 실제 고객 질문과 내부 문서 표현이 다를 수 있어서, 도메인 특화 학습이 중요함
  • BC카드는 오픈소스 플랫폼에 공개했던 182만건 규모 데이터셋을 활용해 모델을 개발함

    • 금융 데이터와 문맥을 반영해 검색 정확도를 높이는 쪽에 초점을 맞춘 것임
    • 외부 AI 서비스에 금융 데이터를 넘기지 않고 자체 AI 서비스를 운영할 수 있는 기반을 마련했다는 점도 강조됨

모델은 경량형과 고품질형 두 가지

  • 경량형 모델은 약 6억 파라미터 규모로 일반 CPU에서도 사용할 수 있음

    • 공개 직후 글로벌 벤치마크 SOTA 평가 항목에서 타 모델 대비 최대 15% 향상된 성능을 보이며 전 세계 1위를 기록했다고 밝힘
    • 빠른 응답이 필요한 서비스나 비용을 줄여야 하는 환경에 맞는 선택지임
  • 고품질형 모델은 약 40억 파라미터 규모로 GPU 환경에서만 활용 가능함

    • 경량형보다 약 10%가량 성능이 뛰어나다고 설명됨
    • 정밀한 검색이 필요한 업무에는 고품질형을 쓰고, 응답 속도와 비용이 중요한 곳에는 경량형을 쓰는 식으로 나눌 수 있음

💡

> 운영 관점에선 모델 하나로 다 밀어붙이는 것보다, CPU용 경량 모델과 GPU용 고품질 모델을 나눠두는 편이 서비스 비용과 정확도를 조절하기 좋음.

금융권 소버린 AI와 AX 흐름에도 걸려 있음

  • BC카드는 이번 모델을 통해 금융 AI 서비스의 핵심 검색 기술을 자체 확보했다고 봄

    • 금융 데이터는 민감도가 높아서 외부 AI 서비스로 그대로 보내기 어려움
    • 자체 임베딩 모델이 있으면 내부 문서 검색과 생성형 AI 서비스를 더 통제된 환경에서 운영할 수 있음
  • 모델은 허깅페이스를 통해 공개될 예정임

    • BC카드는 KT 그룹사 AI 서비스 적용을 시작으로 정부와 금융기관 대상 금융 AI 검색 플랫폼 사업도 확대할 계획임
    • 회사 측은 정부의 소버린 AI 기조, 금융위원회의 금융권 AX 가속화 정책과도 맞는다고 설명함

기술 맥락

  • BC카드가 임베딩 모델에 투자한 이유는 생성형 AI 답변의 근거 문서를 제대로 찾기 위해서예요. 금융 서비스에서는 약관, 수수료, 가맹점 정책처럼 정확한 문서 매칭이 중요해서 검색 품질이 곧 신뢰도와 연결돼요.

  • 범용 임베딩 모델이 부족한 이유는 도메인 언어 때문이에요. 고객은 “해외결제 수수료”라고 묻지만 내부 문서에는 “국제 브랜드 수수료”처럼 다른 표현이 들어갈 수 있거든요. 이 둘을 같은 의미로 묶어야 실제 서비스가 쓸 만해져요.

  • 경량형과 고품질형을 나눈 건 운영상 꽤 현실적인 선택이에요. 모든 요청을 40억 파라미터 GPU 모델로 처리하면 비용이 커지니, 빠른 응답이 필요한 곳은 6억 파라미터 CPU 모델로 보내고 정밀 검색이 필요한 업무만 큰 모델을 쓰는 식으로 설계할 수 있어요.

  • 자체 모델 확보는 데이터 거버넌스 측면에서도 의미가 있어요. 금융 데이터는 외부 API로 보내기 부담이 크기 때문에, 내부 통제 가능한 검색 모델을 갖추면 생성형 AI 도입 범위를 넓히기 쉬워져요.

금융권 생성형 AI에서 진짜 병목은 답변 모델보다 ‘정확한 문서를 찾아오는 검색’인 경우가 많음. BC카드 사례는 한국어 금융 도메인에서 범용 임베딩 모델을 그대로 쓰기보다, 자체 데이터와 경량·고품질 라인업으로 운영 선택지를 나누는 흐름을 보여줌.

댓글

댓글

댓글을 불러오는 중...

ai-ml

메타도 AI 클라우드 장사판에 뛰어드나

메타가 AI 모델 접근권과 컴퓨팅 파워를 외부에 판매하는 클라우드 인프라 사업을 검토 중이라는 보도다. AWS, 애저, 구글 클라우드처럼 데이터센터 투자금을 클라우드 매출로 회수하는 구조를 만들 수 있지만, 정작 메타가 팔 만큼 남는 GPU가 있느냐는 의문도 같이 나온다.

ai-ml

메타의 AI 클라우드 진출설, 반도체 폭락이 진짜 수요 둔화 신호일까

메타가 남는 AI 컴퓨팅 자원을 외부에 팔 수 있다는 보도 하나로 네오클라우드와 반도체주가 크게 흔들렸다. 다만 메타가 최근까지 컴퓨팅 부족을 겪었고 올해 1250억~1450억달러 규모의 투자를 예고했다는 점을 보면, 단순한 공급 과잉으로 보기엔 논리가 꽤 빡빡하다.

ai-ml

메타가 클라우드 사업을 검토하자 AI 반도체 피크아웃 논쟁이 다시 붙었다

메타가 자사 컴퓨팅 자원을 외부에 판매하는 클라우드 인프라 사업을 검토 중인 것으로 알려졌다. 올해 설비투자 전망치가 1250억~1450억달러에 달하는 메타가 수요자에서 공급자로 바뀔 수 있다는 해석이 나오면서, AI 인프라 병목 완화와 반도체 수요 둔화 우려가 동시에 제기됐다.

ai-ml

국방부, 지휘관 의사결정 돕는 국방 AI 아이디어 6건 선정

국방부가 2026 제2차 국방 AI 활용 아이디어 경연대회 시상식을 열고, 전 군에서 접수된 253건 중 6개 수상작을 선정했다. 최우수상은 폐쇄망 안에서 공격 AI와 방어 AI가 사이버 교전을 벌이고, 지휘관에게 실시간 상황과 대응 근거를 제시하는 Local AI 기반 시스템이 받았다.

ai-ml

스탠퍼드 HAI 소장 “미국 AI의 최대 리스크는 중국보다 폐쇄성”

제임스 랜데이 스탠퍼드 인간중심AI연구소 소장이 미국 기술 패권의 핵심 동력은 개방성이었고, 지금의 폐쇄적 AI 흐름은 생태계 전체를 해칠 수 있다고 경고했음. 그는 정부 연구 투자, 이민, 벤처자본, 오픈소스를 미국 혁신의 네 축으로 꼽고, 한국의 소버린 AI 논의에도 ‘무엇을 자립하려는지’부터 구분해야 한다고 말함. AI는 1~2년짜리 유행이 아니라 10~20년에 걸친 경제 전환이며, 다음 큰 흐름으로 피지컬 AI와 월드 모델을 지목함.