오픈AI o1, 응급실 진단 실험에서 의사보다 높은 정확도 기록
하버드 연구에서 오픈AI의 o1 추론 모델이 응급실 초기 진단 실험에서 67% 정확도를 보여, 인간 의사들의 50-55%를 앞섰다. 더 많은 정보가 주어진 상황에서는 AI가 82%, 전문가가 70-79%였지만 이 차이는 통계적으로 유의하지 않았다. 연구진은 의사를 대체한다기보다 의사, 환자, AI가 함께 판단하는 새 진료 모델로 봐야 한다고 선을 그었다.
- 1
응급실 환자 76명 기록 기반 실험에서 o1은 67%, 의사들은 50-55% 정확도를 기록
- 2
더 많은 정보가 주어지면 o1은 82%, 전문가들은 70-79% 정확도를 보였으나 통계적 유의성은 없었음
- 3
치료 계획 작성 실험에서는 AI가 89%, 일반 자료를 쓴 의사 46명이 34%를 기록
- 4
연구는 텍스트 기반 환자 기록만 다뤘고, 환자의 외형이나 고통 정도 같은 현장 신호는 평가하지 않았음
- 5
책임 소재, 오류 위험, 의사의 AI 답변 의존 문제가 주요 리스크로 남음
의료 AI가 시험 문제를 잘 푸는 단계를 넘어 실제 진료 기록에서 두 번째 의견을 줄 수 있는 수준으로 이동 중이라는 신호다. 다만 정확도 숫자만 보고 환자-facing 자동 진단으로 바로 연결하면 위험하고, 책임 구조와 편향 검증이 같이 따라와야 한다.
관련 기사
딥클로드, 클로드 코드 실행 루프는 그대로 두고 모델만 딥시크로 바꾸는 우회로 공개
딥클로드는 클로드 코드의 파일 편집, 셸 실행, 깃 작업, 에이전트 루프는 그대로 쓰면서 모델 호출만 딥시크 V4 프로나 오픈라우터 같은 앤트로픽 호환 백엔드로 돌리는 도구다. 핵심 주장은 같은 개발자 경험을 유지하면서 출력 토큰 가격을 100만 토큰당 15달러에서 0.87달러 수준으로 낮출 수 있다는 것. 다만 이미지 입력, 일부 호환 계층 기능, 모델별 추론 품질 차이는 그대로 감수해야 한다.
메가존클라우드, AWS 에이전틱 AI 실습 행사 국내 운영 맡는다
메가존클라우드가 AWS 에이전틱 AI 게임데이의 공식 운영 파트너로 선정돼 5월 중 국내 기업 대상 실습형 프로그램을 연다. 참가 기업은 실제 업무와 비슷한 시나리오에서 아마존 베드록, 베드록 에이전트코어, 스트랜드 에이전트 등을 비용 부담 없이 검증하게 된다.
LG CNS, 1분기 매출 1.3조 원…AI·클라우드가 절반 넘게 끌었다
LG CNS가 1분기 매출 1조3150억 원, 영업이익 942억 원을 기록하며 전년 대비 각각 8.6%, 19.4% 성장했다. AI·클라우드 사업만 7654억 원으로 전체 매출의 약 58%를 차지했고, 오픈AI·팔란티어 협력, 데이터센터 DBO, 피지컬 AI까지 전선을 넓히는 중이다.
메가존클라우드, 국내 기업 대상 AWS 에이전틱 AI 게임데이 운영
메가존클라우드가 AWS의 ‘에이전틱 AI 게임데이’ 공식 운영 파트너로 선정돼 국내 기업 대상 실습형 AI 교육을 맡는다. 참가자들은 단순 강의가 아니라 팀 단위로 실제 기술 문제를 정의하고 해결책을 설계하는 방식으로 에이전트 기반 AI 활용을 경험하게 된다.
카카오 플레이MCP, 오픈클로 연동으로 AI 에이전트 도구 생태계 넓힘
카카오가 MCP 기반 플랫폼 ‘플레이MCP’를 오픈소스 AI 에이전트 ‘오픈클로’와 연동했다. 카카오톡, 톡캘린더, 카카오맵, 멜론 등 약 200개 MCP 서버를 클로드와 챗GPT뿐 아니라 로컬 에이전트 환경에서도 쓸 수 있게 됐다.
댓글
댓글
댓글을 불러오는 중...