AI허브 데이터 691종 중 30종, 추론형·피지컬 AI 학습 데이터로 재가공
과기정통부와 NIA가 기존 AI허브 데이터를 생성형 AI 시대에 맞게 다시 가공하는 사업을 시작한다. 2022년까지 구축된 691종을 분석해 30종을 골랐고, 총 30억 원 규모로 대규모 언어 모델(LLM)과 피지컬 AI용 데이터셋을 만든다.
- 1
기존 판별형 AI 라벨링 데이터를 추론 과정과 행동 정보를 담은 데이터로 업사이클링
- 2
LLM 데이터는 질문, 근거 검토, 오류 검증, 답변 확정 과정을 포함하도록 재구성
- 3
피지컬 AI 데이터는 시각, 언어명령, 행동·제어 정보를 통합하는 방향으로 고도화
새 데이터를 무작정 더 만드는 대신 기존 공공 데이터 자산을 생성형 AI 학습 구조로 바꾸겠다는 접근임. 국내 스타트업이나 연구팀 입장에서는 공개 이후 실제 품질이 관건이 될 듯함.
관련 기사
앤트로픽이 스페이스X 데이터센터를 쓰는 이유, AI 권력이 컴퓨팅으로 이동 중
앤트로픽이 스페이스X의 멤피스 콜로서스 I 데이터센터를 쓰는 계약을 맺었다는 보도다. 300MW 이상, 엔비디아 GPU 22만 개 이상 규모의 컴퓨팅 용량이 언급됐고, 폭증하는 AI 수요와 낮은 칩 가동률을 맞교환하는 거래로 해석된다.
AI 생산성 2.5%가 미국 39조 달러 부채를 구할 수 있을까
예일대 예산연구소 모델링에 따르면 AI가 향후 5년간 생산성을 매년 2.5% 끌어올리고 고용이 유지되면 미국의 2035년 재정 적자와 부채 비율이 크게 안정될 수 있다. 하지만 AI가 노동자를 대체해 실업 지원 비용이 커지면 생산성 이득 상당 부분이 상쇄될 수 있다는 경고도 함께 나온다.
AI 도입보다 어려운 건 IP 워크플로우 다시 짜기
IP와 R&D 업무에 AI를 붙였더니 초기 효율은 좋아졌지만, 시간이 지나자 모델별 품질 편차와 검증 부담이 새 병목으로 떠올랐다는 얘기다. 핵심은 특정 AI 도구를 더 사는 게 아니라, AI가 후보를 만들고 전문가가 검증하는 식으로 업무 흐름 자체를 재설계하는 데 있다.
클로드 코워크, 복붙 대신 PC를 직접 만지는 AI 에이전트로 가는 길
앤스로픽의 ‘클로드 코워크’는 챗봇처럼 답만 주는 도구가 아니라, PC 폴더와 파일을 직접 열고 정리하며 엑셀 결과물까지 만드는 에이전트형 업무 도구로 소개됐다. 영수증 사진 30장을 읽어 매장명·날짜·항목·금액을 표로 만들고 합계 수식이 들어간 엑셀 파일까지 생성하는 사례가 핵심이다.
국내 의료 AI, 전시용 기술에서 임상 현장 도구로 이동 중
AI 엑스포 코리아 2026에서 국내 의료 AI 기업들이 병원 문서 구조화, 안저 질환 진단 보조, 정신건강 관리 솔루션을 선보였다. 특히 녹내장 93%, 당뇨병성 망막병증 민감도 90% 같은 임상 성적을 내세우며 ‘기술 시연’보다 실제 현장 가치 증명에 초점을 맞췄다.
댓글
댓글
댓글을 불러오는 중...