코넬대 "시각장애인용 AI, 후속 질문 정확도 56.6%에 그쳤다"
코넬 공대 연구진이 GPT-4o 기반 시각 보조 앱 VisionPal로 시각장애인 20명 대상 2주간 실사용 테스트를 진행한 결과, 기본 사물 인식은 잘 하지만 약 복용량·요리법 같은 맥락 질문에서는 무너졌다. 후속 질문 정확도는 56.6%, 그중 22.2%는 잘못된 정보를 담고 있어 안전 문제로 직결될 수 있다고 지적했다. 연구팀은 멀티모달 LLM이 갖춰야 할 9가지 핵심 역량을 제시했다.
- 1
GPT-4o 기반 아이폰 앱 VisionPal로 시각장애인 20명을 2주간 실사용 추적
- 2
단순 인식은 잘 되지만 맥락이 필요한 후속 질문 정확도는 56.6%에 그침
- 3
응답 중 22.2%가 잘못된 정보를 포함해 안전 리스크로 이어짐
- 4
연구팀이 시각 보조 AI를 위한 9가지 핵심 역량(투명한 불확실성 처리, 적절한 핸드오프 등) 제시
벤치마크 점수로 잘 잡히지 않는 '맥락 실패'가 접근성 AI에서는 곧 안전 사고가 된다는 점이 핵심. 9가지 역량 루브릭은 일반 에이전틱 UX 설계에도 참고할 만한 프레임이다.
관련 기사
Godot 관리자 비명 "AI가 생성한 쓰레기 PR 리뷰에 기진맥진"
생성형 AI 코드가 쏟아지면서 고도 엔진 수석 관리자는 '검토·거절 과정이 소모적'이라 토로했고, 2026 상반기 Game Developer 설문에선 생성형 AI 도입률이 36%에서 29%로 반전, 개발자 47%가 AI가 게임 품질을 저하시킬 것이라 응답했다. 감지가 어려운 '조용한 실패'가 장기 프로젝트 안정성을 위협한다는 지적이 핵심이다.
칼텍, 세포 분할 파운데이션 모델 'CellSAM' 오픈소스 공개
칼텍 연구진이 다양한 생물학 이미지에서 세포를 자동 식별하는 범용 파운데이션 모델 CellSAM을 네이처 메서즈에 공개했다. 단일 모델로 종양세포·박테리아·면역세포를 모두 커버하고 세포 간 상호작용과 공간 구조까지 분석 가능하다. 연구자 누구나 무료로 쓸 수 있게 오픈소스로 풀었다.
크래프톤, AI 브랜드 'Raon' 론칭…음성·TTS·비전 모델 4종 허깅페이스에 오픈소스 공개
크래프톤이 AI 모델 브랜드 Raon(라온)을 론칭하고 음성 언어모델·실시간 양방향 음성모델·TTS·비전 인코더 4종을 허깅페이스에 오픈소스로 공개했다. 9B 규모의 Raon-Speech는 10B 이하급에서 영어·한국어 모두 글로벌 1위, Raon-SpeechChat은 국내 최초 실시간 Full-duplex 음성모델이다.
오픈클로(OpenClaw)로 슬랙 AI 비서 만들기 — 설치부터 봇 연동까지 실전 가이드
오픈소스 AI 에이전트 런타임 OpenClaw를 활용해 슬랙 AI 비서를 직접 세팅하는 과정을 단계별로 정리한 실전 튜토리얼이다. 터미널과 Claude Code 설치, OpenClaw 설치, 슬랙 봇 토큰 발급, 매니페스트 구성, 웹 UI에서 에이전트 관리까지 필요한 모든 절차를 다룬다.
MIT 출신 창업팀이 만든 오픈프로틴AI, 단백질 설계 노코드 플랫폼 오픈소스 공개
MIT 출신이 창업한 OpenProtein.AI가 단백질 언어모델 PoET을 비롯한 단백질 설계 도구들을 오픈소스로 공개했다. 머신러닝 전문 지식 없이도 웹 인터페이스로 단백질 서열 라이브러리를 생성·검증할 수 있어 신약 개발 파이프라인 단축이 기대된다. 베링거인겔하임 같은 제약사가 이미 실제 신약 설계에 도입했다.
댓글
댓글
댓글을 불러오는 중...