구글, 표 데이터도 재학습 없이 예측하는 오픈소스 모델 ‘탭FM’ 공개
구글이 표 형식 데이터를 별도 재학습 없이 분석하는 파운데이션 모델 탭FM을 허깅페이스와 깃허브에 오픈소스로 공개했음. 기존 XGBoost, 랜덤 포레스트 같은 모델은 데이터셋마다 학습과 튜닝이 필요했지만, 탭FM은 학습 데이터와 예측 데이터를 한 번에 넣고 제로샷으로 분류·회귀를 수행하는 방식임. 구글은 빅쿼리에도 통합해 SQL 명령어만으로 예측 기능을 쓰게 만들 계획임.
- 1
탭FM은 표 데이터용 파운데이션 모델로, 새 데이터셋마다 재학습하지 않고 한 번의 추론으로 분류와 회귀를 수행함
- 2
행·열 교차 어텐션, 행 압축, 인컨텍스트 학습을 결합해 표 데이터의 2차원 구조를 다룸
- 3
수억개의 합성 데이터셋으로 사전학습해 민감한 기업 데이터를 직접 쓰지 않고 일반화 성능을 노림
- 4
탭아레나 벤치마크에서 38개 분류 데이터셋과 13개 회귀 데이터셋으로 평가됐고, 빅쿼리 AI.PREDICT 통합도 예고됨
기업 데이터의 대부분은 예쁜 자연어가 아니라 지저분한 표 데이터임. 탭FM이 약속한 대로 튜닝과 피처 엔지니어링 부담을 줄인다면, 데이터 과학자보다 SQL 사용자에게 먼저 체감되는 AI 기능이 될 가능성이 큼.
관련 기사
메타도 AI 클라우드 장사판에 뛰어드나
메타가 AI 모델 접근권과 컴퓨팅 파워를 외부에 판매하는 클라우드 인프라 사업을 검토 중이라는 보도다. AWS, 애저, 구글 클라우드처럼 데이터센터 투자금을 클라우드 매출로 회수하는 구조를 만들 수 있지만, 정작 메타가 팔 만큼 남는 GPU가 있느냐는 의문도 같이 나온다.
메타의 AI 클라우드 진출설, 반도체 폭락이 진짜 수요 둔화 신호일까
메타가 남는 AI 컴퓨팅 자원을 외부에 팔 수 있다는 보도 하나로 네오클라우드와 반도체주가 크게 흔들렸다. 다만 메타가 최근까지 컴퓨팅 부족을 겪었고 올해 1250억~1450억달러 규모의 투자를 예고했다는 점을 보면, 단순한 공급 과잉으로 보기엔 논리가 꽤 빡빡하다.
메타가 클라우드 사업을 검토하자 AI 반도체 피크아웃 논쟁이 다시 붙었다
메타가 자사 컴퓨팅 자원을 외부에 판매하는 클라우드 인프라 사업을 검토 중인 것으로 알려졌다. 올해 설비투자 전망치가 1250억~1450억달러에 달하는 메타가 수요자에서 공급자로 바뀔 수 있다는 해석이 나오면서, AI 인프라 병목 완화와 반도체 수요 둔화 우려가 동시에 제기됐다.
국방부, 지휘관 의사결정 돕는 국방 AI 아이디어 6건 선정
국방부가 2026 제2차 국방 AI 활용 아이디어 경연대회 시상식을 열고, 전 군에서 접수된 253건 중 6개 수상작을 선정했다. 최우수상은 폐쇄망 안에서 공격 AI와 방어 AI가 사이버 교전을 벌이고, 지휘관에게 실시간 상황과 대응 근거를 제시하는 Local AI 기반 시스템이 받았다.
BC카드, 금융 문맥 잘 찾는 자체 임베딩 모델 공개
BC카드가 국내 금융 문맥에 특화된 생성형 AI 임베딩 모델을 자체 개발해 공개했음. 182만건 규모 데이터셋을 활용했고, 경량형 6억 파라미터 모델과 고품질형 40억 파라미터 모델 두 가지로 나뉨. 금융 데이터를 외부 AI 서비스에 넘기지 않고도 검색 기반 AI 서비스를 운영할 수 있는 기반을 확보했다는 점이 핵심임.
댓글
댓글
댓글을 불러오는 중...