본문으로 건너뛰기
피드

클로드 코드의 ‘확장 사고’ 로그, 실제 추론 원문이 아니었다는 지적

ai-ml 약 5분
vote
0
댓글
북마크

한 개발자가 Claude Code 세션 로그를 확인하다가 ‘thinking block’에 실제 추론 텍스트가 아니라 긴 서명(signature)만 남아 있다는 점을 지적했다. Anthropic 문서상 API가 반환하는 것은 전체 추론 원문이 아니라 요약이며, 실제 reasoning은 암호화되어 Anthropic이 키를 보유하는 구조다.

  • 1

    Claude Code 로컬 로그의 thinking block은 사용자가 읽을 수 있는 실제 추론 원문이 아니다.

  • 2

    Anthropic API의 extended thinking 출력은 전체 사고 과정의 요약이지, 모델 행동을 직접 만든 내부 추론 그 자체가 아니다.

  • 3

    에이전트 감사 추적(audit trail)을 약속해야 하는 팀이라면 입력, 출력, 실행 액션 로그와 reasoning 요약의 차이를 명확히 알아야 한다.

  • Claude Code가 세션을 디스크에 기록하긴 하는데, 그 안의 “thinking block”이 실제 추론 텍스트는 아니라는 지적이 나옴

    • 글쓴이가 주말에 로그를 열어봤더니 모델의 reasoning 대신 600자짜리 signature만 있었다고 함
    • 문서를 확인해보니 Claude의 reasoning은 암호화되어 있고, 키는 Anthropic이 갖고 있음
    • 사용자의 로컬 머신에는 실제 추론 원문을 복호화할 수 있는 키가 오지 않는 구조임
  • 핵심은 API나 도구가 보여주는 extended thinking이 “원본 사고 과정”이 아니라 “요약”이라는 점임

    • Anthropic 문서 표현도 “Claude의 전체 thinking process 요약을 반환한다”는 쪽임
    • 즉 세션에서 실제로 모델 행동을 이끈 내부 추론과, 나중에 사용자가 보는 텍스트는 같은 물건이 아님
    • 글쓴이는 이걸 손실 변환에 비유함. 원본을 다른 형식으로 저장했다가 다시 원본처럼 취급하면 정보가 빠진다는 얘기임

중요

> Claude Code의 extended thinking 로그를 “에이전트가 실제로 이렇게 생각했다”는 감사 기록으로 약속하면 위험하다. 사용자가 보는 건 실제 추론 원문이 아니라 요약이다.

  • 그래서 AI 에이전트 감사 추적(audit trail)을 설계하는 팀은 로그의 범위를 다시 봐야 함

    • 입력, 출력, 도구 호출, 파일 변경, 실행 액션은 따로 수집할 수 있음
    • 하지만 그것들을 모아도 “모델 내부에서 실제로 어떤 추론이 행동을 만들었는가”를 완전히 복원하는 건 아님
    • 특히 보안 리뷰, 규제 대응, 고객 감사에서 reasoning 로그를 근거로 내세우려면 표현을 아주 조심해야 함
  • 글쓴이가 불만을 갖는 지점은 기능 자체보다 제품 설명의 애매함임

    • 커피 덜 마신 상태면 “extended thinking이 전체 사고 과정의 요약을 반환한다”는 문구를 실제 thinking 공개처럼 오해할 수 있다는 것
    • 로컬 파일에 thinking block이라는 이름으로 뭔가 남아 있으면 더더욱 감사 가능한 원문처럼 보일 수 있음
    • 하지만 실제로는 Anthropic이 키를 가진 암호화된 서명과 요약 출력 사이에 선이 그어져 있음
  • 이 이슈는 Claude Code만의 UX 논쟁이 아니라 에이전트 도구 전반의 신뢰 문제로 이어짐

    • 개발자 도구 안에서 AI가 코드를 고치고 명령을 실행할수록, “왜 그랬는지”를 설명하는 로그의 법적·운영적 가치가 커짐
    • 그런데 reasoning 원문이 제공되지 않는다면, 제품 문서와 조직 내부 정책은 “추론 요약”과 “행동 로그”를 분리해서 써야 함

기술 맥락

  • 여기서 중요한 선택은 Anthropic이 실제 reasoning을 사용자 로컬에 평문으로 주지 않는다는 점이에요. 왜냐하면 모델의 내부 추론 공개는 안전, 정책, 제품 통제 측면에서 민감한 영역이기 때문이에요.

  • 대신 사용자는 요약된 extended thinking을 받아요. 이건 디버깅에는 도움이 될 수 있지만, 실제 행동을 만든 원본 추론과 동일하다고 보면 안 돼요.

  • 에이전트 감사 로그를 만들 때는 그래서 레이어를 나눠야 해요. 입력 프롬프트, 모델 출력, 도구 호출, 파일 변경 내역은 검증 가능한 기록이고, reasoning summary는 참고 설명에 가까운 기록이에요.

  • 기업 환경에서 이 차이가 중요한 이유는 책임 소재 때문이에요. 고객이나 보안팀에게 “추론 로그가 남는다”고 말했는데 실제로는 요약만 있다면, 나중에 사고 분석이나 규제 대응에서 기대한 증거력을 못 낼 수 있어요.

AI 에이전트를 업무 도구로 넣을 때 “로그가 있으니 감사 가능하다”는 말이 쉽게 나오는데, 이 글은 그 전제를 찌른다. 실제 추론 원문과 사후 요약은 다르고, 규제나 보안 리뷰에서는 그 차이가 꽤 크게 터질 수 있다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

기업 AI 투자, 이제 비용절감보다 성장과 새 사업모델로 간다

아코디스 보고서에 따르면 기업의 AI 투자는 효율화 중심에서 성장, 혁신, 신규 비즈니스 모델 쪽으로 무게가 옮겨가고 있다. 다만 AI 도입 속도와 별개로, CTO들이 기업 전체에 AI를 확장할 수 있다는 자신감은 3년 연속 떨어졌다. 핵심 병목은 모델 성능보다 운영 모델, 거버넌스, 책임 구분 같은 조직 문제에 가깝다.

ai-ml

그록, 6억5천만 달러 조달하고 ‘AI 추론 클라우드’ 운영사로 피벗

그록이 6억5천만 달러 규모의 신규 성장 자본을 유치하고 AI 추론 클라우드 운영에 회사를 집중하겠다고 밝혔음. 자체 칩 기술은 엔비디아에 넘어가고, 그록은 엔비디아 LPX 시스템까지 활용해 13개 데이터센터를 2027년 말까지 200MW 규모로 확장할 계획임.

ai-ml

제타, 팔란티어 파운드리 기반으로 AI 데이터 클라우드 재구축한다

AI 마케팅 플랫폼 기업 제타 글로벌이 팔란티어와 전략적 제휴를 맺고 자체 데이터 클라우드를 재구축하기로 했음. 팔란티어의 파운드리를 기반으로 빅데이터 처리 속도와 예측 정확도를 높이겠다는 기대가 나오면서 제타 주가는 장중 5.66% 상승했음.

ai-ml

심평원, 전 국민 진료정보 기반 의료 AI 만든다

심평원이 전 국민 건강보험 진료정보와 공통데이터모델(CDM)을 기반으로 보건의료 특화 생성형 AI를 만들겠다고 밝혔다. 목표는 단순 질의응답이 아니라 연구 설계, SQL 생성, 통계분석, 결과 산출까지 돕는 연구지원 플랫폼으로 가는 것이다.

ai-ml

일본, 미국·중국 AI 의존 줄이려 프랑스·인도와 'AI 주권' 전선 만든다

일본이 프랑스, 인도, 브라질, 말레이시아, 영국 등과 AI 주권 협의체를 만들며 미국·중국 중심 AI 질서에서 빠져나오려는 움직임을 보이고 있다. 핵심은 자국 데이터, 인프라, 모델을 외부 플랫폼에 종속시키지 않고 관리하자는 것이며, 방위·스마트시티·광물 탐사·농업까지 경제 안보 영역으로 확장되고 있다.