오픈AI 모델이 자꾸 이상한 생물 비유를 쓰게 된 이유
오픈AI가 GPT-5.1 이후 모델 답변에 특정 생물 비유가 과하게 늘어난 원인을 추적한 글이다. 결론은 성격 커스터마이징 기능, 특히 Nerdy 성격을 학습시키는 보상 신호가 특정 표현을 과하게 밀어줬고, 그 버릇이 다른 조건의 답변까지 번졌다는 것.
- 1
GPT-5.1 출시 뒤 ChatGPT의 특정 생물 표현 사용량이 크게 늘었고, 내부 조사로 언어적 버릇을 추적했다.
- 2
Nerdy 성격은 전체 ChatGPT 응답의 2.5%뿐이었지만 특정 표현 언급의 66.7%를 차지했다.
- 3
감사 결과 Nerdy 보상 모델은 같은 문제에 대해 해당 표현이 들어간 답변을 더 좋게 평가하는 경향을 보였고, 76.2% 데이터셋에서 양의 상승폭이 나왔다.
- 4
오픈AI는 보상 신호 제거, 학습 데이터 필터링, 개발자 프롬프트 완화 지시로 문제를 줄였고, 이 과정에서 모델 행동 감사 도구도 만들었다.
겉으로 보면 웃긴 말버릇 하나지만, 실제로는 강화학습 보상 설계가 모델 성격과 어휘 습관을 어떻게 새게 만드는지 보여주는 꽤 중요한 사례다. LLM 제품에서 ‘톤 조절’은 그냥 프롬프트 문제가 아니라 학습 데이터와 보상 함수 문제까지 이어진다.
관련 기사
알파고 핵심 연구자의 새 AI 회사, 제품 없이 1.6조 원 시드 투자 유치
알파고와 알파제로를 설계한 데이비드 실버의 새 AI 스타트업이 매출과 제품 없이 11억 달러 시드 투자를 받았다. 기사에는 홈서비스 전화를 받는 AI 에이전트 스타트업 아보카, AI 데이터센터 전력 수요로 주목받은 소형모듈원전 기업 X-에너지 사례도 함께 담겼다.
아카데미상, AI 배우와 AI 작가의 수상 자격을 못 박아 배제
미국 아카데미가 AI로 만든 출연자나 챗봇이 쓴 시나리오는 오스카 수상 후보가 될 수 없다는 규정을 명문화했다. 다만 영화 제작 과정에서 생성 AI나 디지털 도구를 쓰는 것 자체는 금지하지 않고, 인간의 창작 기여도를 따져보겠다는 쪽으로 선을 그었다.
AI를 욕하면서도 진짜 많이 쓰는 PM의 현실적인 사용기
글쓴이는 개인 에이전트, 클로드 코드, MCP, KPI 대시보드 등을 실제 업무에 붙이면서 ‘AI가 다 해준다’보다 ‘시작하고 반복하는 사이클이 생겼다’는 변화를 강조한다. 특히 10년 묵은 정책서 정리, 팀 대시보드 구축, 글쓰기 루틴처럼 미뤄온 일을 실제 구조로 바꾼 사례가 핵심이다.
AI가 설계한 ‘7일 전쟁’은 왜 64일짜리 수렁이 됐나
미국과 이스라엘의 이란 작전은 AI 기반 표적 선정과 빠른 살상연쇄를 앞세웠지만, 전쟁은 64일째 끝나지 않고 있다. 메이븐의 표적 분류 정확도 60%, 여학교 공습 사망자 168명, 브렌트유 126달러 같은 숫자가 AI 전쟁의 한계를 꽤 적나라하게 보여준다.
카카오 플레이MCP, 로컬 AI 에이전트 오픈클로와 연결된다
카카오가 개방형 플랫폼 플레이MCP에서 오픈소스 AI 에이전트 오픈클로 연동을 지원한다. 개발자는 카카오톡 나와의 채팅방, 톡캘린더, 카카오맵, 선물하기 같은 카카오 도구와 200여 개 외부 MCP 서버를 로컬 AI 에이전트에서 직접 붙여 쓸 수 있게 됐다.
댓글
댓글
댓글을 불러오는 중...