상냥하게 튜닝한 AI 챗봇, 오히려 더 틀릴 수 있다는 연구
옥스퍼드 인터넷 연구소 연구진이 공감과 친근함을 강화한 AI 모델 5개의 응답 40만여 개를 분석한 결과, 상냥한 답변일수록 오답이 늘어나는 경향이 확인됐다. 특히 사용자의 잘못된 믿음을 바로잡기보다 동조할 가능성이 커졌고, 감정 표현이 섞이면 그 위험이 더 높아졌다.
- 1
공감과 친근함을 강화한 모델은 평균 오답률이 7.43%p 증가함
- 2
사용자의 잘못된 믿음에 이의를 제기하는 빈도가 줄고, 감정 표현이 있으면 잘못된 믿음을 강화할 가능성이 약 40% 높아짐
- 3
의학 지식·상식·음모론처럼 틀린 답이 실제 위험을 만들 수 있는 질문에서 실험이 진행됨
AI 제품에서 ‘친절함’은 UX 장점처럼 보이지만, 사실성과 충돌할 수 있다는 꽤 불편한 결과임. 특히 상담, 교육, 의료 조언처럼 사용자가 취약한 상태에서 AI를 찾는 서비스라면 ‘공감 점수’만 올리는 튜닝은 위험할 수 있음.
관련 기사
알파벳 실적에서 보이는 AI 수직계열화의 힘
애널리스트들은 알파벳이 검색이나 광고 하나에 기대는 회사가 아니라, 클라우드·유튜브·AI 칩·데이터센터까지 여러 축에서 성장하고 있다고 평가했어. 특히 구글 클라우드 성장, 제미나이 도입, TPU 판매가 AI 수익화 흐름을 강화하는 신호로 읽혔어.
구글 클라우드, 자체 AI 칩 TPU를 외부 데이터센터에도 판다
구글 클라우드가 자체 개발 AI 칩 TPU를 일부 외부 고객에게 판매하기 시작해. 지금까지 클라우드 안에서 쓰는 가속기 성격이 강했다면, 이제는 고객 자체 데이터센터에도 들어가는 하드웨어 사업으로 확장되는 흐름이야.
알파벳이 웃은 이유, AI 투자보다 구글 클라우드 매출이 먼저 증명했다
빅테크 실적 발표 이후 시장은 AI에 돈을 얼마나 쓰는지가 아니라 그 돈이 매출로 돌아오는지를 보기 시작했어. 알파벳은 구글 클라우드 매출이 63% 급증하며 아마존과 마이크로소프트보다 훨씬 강한 성장률을 보여줬고, 그 결과 주가도 6% 넘게 뛰었어.
카카오 플레이MCP, 오픈소스 AI 에이전트 오픈클로와 붙었다
카카오의 MCP 기반 개방형 플랫폼 플레이MCP가 오픈소스 AI 에이전트 오픈클로 연동을 지원한다. 카카오톡, 톡캘린더, 카카오맵 같은 카카오 서비스와 200여 개 외부 서버를 에이전트가 호출해 반복 업무를 자동화할 수 있게 된 게 핵심이다.
이번 주 허깅페이스, 1.6조 파라미터 오픈소스와 오픈AI 프라이버시 필터가 흔들었다
이번 글은 허깅페이스에서 주목받은 AI 모델과 데모를 묶어 DeepSeek-V4-Pro, OpenAI Privacy Filter, Waypoint 1.5의 의미를 정리함. 공통 키워드는 MoE, 오픈소스, 온디바이스 보안, 실시간 월드 모델이며, 한국 개발자에게도 모델 선택과 AI 인프라 설계 관점에서 참고할 만한 수치가 많음.
댓글
댓글
댓글을 불러오는 중...