오픈AI, 끊어 말해도 알아듣는 실시간 음성 모델 공개
오픈AI가 사람 대화처럼 끼어들기, 말 고치기, 말투 조절을 처리하는 실시간 음성 모델 ‘GPT-리얼타임-2’를 공개했다. 실시간 번역과 받아쓰기 모델도 함께 나왔고, 질로와 도이체텔레콤 같은 기업 적용 사례까지 붙었다.
- 1
GPT-리얼타임-2는 GPT-5급 추론 능력과 자연스러운 대화 흐름 처리를 내세운 음성 모델
- 2
실시간 번역 모델과 실시간 받아쓰기 모델도 같이 공개돼 음성 인터페이스 제품군이 넓어짐
- 3
질로는 음성 매물 검색과 방문 예약, 도이체텔레콤은 다국어 고객 지원 번역을 테스트 중
- 4
조니 아이브의 스타트업 인수 이후 준비 중인 오픈AI 자체 AI 기기와도 연결되는 흐름
음성 모델이 단순 음성 인식에서 ‘대화 중 끼어들어도 맥락을 이어가는 인터페이스’로 넘어가고 있음. 개발자 입장에선 챗봇 화면보다 음성 기반 에이전트와 디바이스 쪽 API 수요가 더 빨리 커질 수 있다는 신호임.
관련 기사
알파벳, AI 인프라에 1,850억 달러 베팅…구글 클라우드가 성장축으로 부상
모틀리풀은 알파벳이 AI 인프라에 대규모 설비투자를 이어가면서 향후 5년간 주가가 두 배 이상 오를 여지가 있다고 분석했다. 올해 설비투자는 1,800억~1,900억 달러로 예상되며, 구글 클라우드 매출은 1분기에 전년 대비 63% 증가했다.
넥슨은 AI 에이전트를 ‘소유’하려 했고, 크래프톤은 AI 도구를 ‘관리’하기로 했다
NDC 2026 대담에서 넥슨과 크래프톤이 사내 AI 전환 전략을 꽤 솔직하게 공개했다. 넥슨은 오픈소스 AI 에이전트 오픈클로의 전사 도입을 시도했다가 보안·운영·비용 문제로 보류했고, 크래프톤은 상용 AI 도구를 대시보드로 관리하는 방식을 택했다.
일본 병원, 재활 요약지 작성에 생성형 인공지능 써보니 시간은 57% 줄고 오류는 81.8%에서 나왔다
일본의 290병상 종합병원 연구진이 재활 요약지 작성에 생성형 인공지능과 엑셀 매크로를 결합한 워크플로를 도입해 실제 임상 현장에서 평가했음. 작성 시간 중앙값은 23분에서 10분으로 줄었지만, 무작위 검토한 문서 11건 중 9건에서 오류가 발견돼 사람의 최종 검토가 필수라는 결론이 나왔음.
야타브, 규제 산업용 인공지능 신뢰·검증 플랫폼을 비바테크에서 공개
야타브가 비바테크 2026에서 규제 산업을 겨냥한 인공지능 신뢰·검증 플랫폼을 공개했음. 입력 위협 방어, 답변 진위 검증, 기업 내부 지식 기반 검색·추론, 업무 자동화, 산업별 전용 모델 구축까지 한 플랫폼으로 묶는 전략임.
안양시가 피지컬 인공지능 산업 키우겠다고 두 번째 전략 회의 열었다
안양시가 제조업, 로봇, 인공지능을 결합한 피지컬 인공지능 산업 생태계 조성을 논의했음. 아직 구체적인 기술 구현이나 예산이 나온 단계는 아니지만, 지역 제조 기반을 인공지능 산업 전략으로 연결하려는 정책 초기 움직임으로 볼 수 있음.
댓글
댓글
댓글을 불러오는 중...