GPT-5.5 Codex, 추론 토큰이 516에 몰리는 이상 패턴 논란
한 사용자가 Codex 토큰 사용 메타데이터 39만 건을 분석해 GPT-5.5 응답이 reasoning_output_tokens=516에 비정상적으로 몰린다고 제기했음. 특히 GPT-5.5는 전체 응답의 19.3%뿐인데, 정확히 516 토큰에서 끝난 이벤트의 82.0%를 차지해 단순 우연으로 보기 어렵다는 주장임. 작성자는 숨겨진 추론이 잘렸다고 단정하진 않지만, 예산 제한이나 라우팅, 스케줄러 동작 같은 내부 임계값 가능성을 조사해달라고 요청함.
- 1
Codex 토큰 기록 390,195건에서 GPT-5.5의 reasoning_output_tokens=516 집중 현상이 관찰됨
- 2
GPT-5.5는 전체 응답의 19.3%지만 정확히 516 토큰 이벤트의 82.0%를 차지함
- 3
5월에는 516 이상 응답 중 정확히 516에서 끝난 비율이 53.30%까지 튀었음
- 4
평균 추론 토큰과 90퍼센타일은 오히려 줄어들어, 단순히 더 오래 생각한 결과가 아니라는 점이 핵심임
- 5
작성자는 516, 1034, 1552 같은 고정값이 자연스러운 분포보다 내부 임계값처럼 보인다고 주장함
개발자 입장에선 모델 품질 저하를 체감으로만 말하기 쉬운데, 이 이슈는 토큰 메타데이터로 이상 패턴을 잡아낸 케이스라 꽤 흥미로움. Codex 같은 코딩 에이전트는 복잡한 작업에서 중간에 생각을 멈추는 듯한 동작이 바로 오답으로 이어질 수 있어서, 이런 관측값은 그냥 숫자놀이로 넘기기 어렵다.
관련 기사
비트코인 채굴사가 AI 데이터센터로 갈아타자 주가가 150% 뛰었다
비트코인 채굴업체였던 아이렌이 AI 인프라 기업으로 전환하면서 최근 12개월간 주가가 150% 가까이 올랐다. 마이크로소프트, 엔비디아와 총 131억 달러 규모의 AI 클라우드 계약을 맺으며 ‘AI 네오클라우드’ 종목으로 주목받고 있다.
네이버, AI탭을 ‘이미지까지 이해하는 검색 에이전트’로 키운다
네이버가 AI탭 정식 출시 이후 처음으로 AI 검색 전략을 꽤 구체적으로 풀었다. 핵심은 범용 챗봇 경쟁이 아니라, 검색·쇼핑·예약·플레이스 같은 네이버 서비스 안에서 실제로 일을 끝내는 ‘프로덕트 네이티브 LLM’과 멀티모달 검색이다.
메타, 클로드까지 품고 AI 클라우드 사업자로 가나
세미애널리시스는 메타의 데이터센터와 AI 컴퓨팅 투자가 둔화가 아니라 더 가속될 것으로 전망했다. 특히 메타가 앤스로픽의 클로드 프라이빗 인스턴스 도입을 협상 중이라는 점을 들어, 단순 AI 사용자를 넘어 AI 모델 플랫폼 사업자로 확장할 가능성을 제기했다.
기업 AI, 모델 다변화는 했는데 통제는 아직 구멍투성이다
벤처비트 펄스 리서치 조사에 따르면 글로벌 기업 다수는 이미 특정 AI 모델에만 의존하지 않는 멀티 모델 전략으로 이동하고 있다. 하지만 자동화된 모니터링과 거버넌스는 크게 부족해, 자율 에이전트와 섀도우 AI로 인한 손실이 본격적으로 드러나고 있다.
리플렉션 AI, 제품도 없는데 250억 달러 평가설…엔비디아와 스페이스X가 보는 건 인프라 잠재력
리플렉션 AI는 2025년 3월 5억 4,500만 달러 평가에서 2026년 3월 250억 달러 평가 협상설까지, 1년 만에 거의 46배 가치 상승을 노리고 있다. 핵심 모델은 아직 출시되지 않았지만, 엔비디아 주도 투자와 스페이스X 콜로서스 2 데이터센터의 GB300 사용 계약으로 프론티어 모델 인프라 기업으로 평가받고 있다.
댓글
댓글
댓글을 불러오는 중...