---
title: "클로드 코드의 ‘확장 사고’ 로그, 실제 추론 원문이 아니었다는 지적"
published: 2026-06-22T14:22:46.000Z
canonical: https://jeff.news/article/4297
---
# 클로드 코드의 ‘확장 사고’ 로그, 실제 추론 원문이 아니었다는 지적

한 개발자가 Claude Code 세션 로그를 확인하다가 ‘thinking block’에 실제 추론 텍스트가 아니라 긴 서명(signature)만 남아 있다는 점을 지적했다. Anthropic 문서상 API가 반환하는 것은 전체 추론 원문이 아니라 요약이며, 실제 reasoning은 암호화되어 Anthropic이 키를 보유하는 구조다.

- Claude Code가 세션을 디스크에 기록하긴 하는데, 그 안의 “thinking block”이 실제 추론 텍스트는 아니라는 지적이 나옴
  - 글쓴이가 주말에 로그를 열어봤더니 모델의 reasoning 대신 600자짜리 signature만 있었다고 함
  - 문서를 확인해보니 Claude의 reasoning은 암호화되어 있고, 키는 Anthropic이 갖고 있음
  - 사용자의 로컬 머신에는 실제 추론 원문을 복호화할 수 있는 키가 오지 않는 구조임

- 핵심은 API나 도구가 보여주는 extended thinking이 “원본 사고 과정”이 아니라 “요약”이라는 점임
  - Anthropic 문서 표현도 “Claude의 전체 thinking process 요약을 반환한다”는 쪽임
  - 즉 세션에서 실제로 모델 행동을 이끈 내부 추론과, 나중에 사용자가 보는 텍스트는 같은 물건이 아님
  - 글쓴이는 이걸 손실 변환에 비유함. 원본을 다른 형식으로 저장했다가 다시 원본처럼 취급하면 정보가 빠진다는 얘기임

> [!IMPORTANT]
> Claude Code의 extended thinking 로그를 “에이전트가 실제로 이렇게 생각했다”는 감사 기록으로 약속하면 위험하다. 사용자가 보는 건 실제 추론 원문이 아니라 요약이다.

- 그래서 AI 에이전트 감사 추적(audit trail)을 설계하는 팀은 로그의 범위를 다시 봐야 함
  - 입력, 출력, 도구 호출, 파일 변경, 실행 액션은 따로 수집할 수 있음
  - 하지만 그것들을 모아도 “모델 내부에서 실제로 어떤 추론이 행동을 만들었는가”를 완전히 복원하는 건 아님
  - 특히 보안 리뷰, 규제 대응, 고객 감사에서 reasoning 로그를 근거로 내세우려면 표현을 아주 조심해야 함

- 글쓴이가 불만을 갖는 지점은 기능 자체보다 제품 설명의 애매함임
  - 커피 덜 마신 상태면 “extended thinking이 전체 사고 과정의 요약을 반환한다”는 문구를 실제 thinking 공개처럼 오해할 수 있다는 것
  - 로컬 파일에 thinking block이라는 이름으로 뭔가 남아 있으면 더더욱 감사 가능한 원문처럼 보일 수 있음
  - 하지만 실제로는 Anthropic이 키를 가진 암호화된 서명과 요약 출력 사이에 선이 그어져 있음

- 이 이슈는 Claude Code만의 UX 논쟁이 아니라 에이전트 도구 전반의 신뢰 문제로 이어짐
  - 개발자 도구 안에서 AI가 코드를 고치고 명령을 실행할수록, “왜 그랬는지”를 설명하는 로그의 법적·운영적 가치가 커짐
  - 그런데 reasoning 원문이 제공되지 않는다면, 제품 문서와 조직 내부 정책은 “추론 요약”과 “행동 로그”를 분리해서 써야 함

---

## 기술 맥락

- 여기서 중요한 선택은 Anthropic이 실제 reasoning을 사용자 로컬에 평문으로 주지 않는다는 점이에요. 왜냐하면 모델의 내부 추론 공개는 안전, 정책, 제품 통제 측면에서 민감한 영역이기 때문이에요.

- 대신 사용자는 요약된 extended thinking을 받아요. 이건 디버깅에는 도움이 될 수 있지만, 실제 행동을 만든 원본 추론과 동일하다고 보면 안 돼요.

- 에이전트 감사 로그를 만들 때는 그래서 레이어를 나눠야 해요. 입력 프롬프트, 모델 출력, 도구 호출, 파일 변경 내역은 검증 가능한 기록이고, reasoning summary는 참고 설명에 가까운 기록이에요.

- 기업 환경에서 이 차이가 중요한 이유는 책임 소재 때문이에요. 고객이나 보안팀에게 “추론 로그가 남는다”고 말했는데 실제로는 요약만 있다면, 나중에 사고 분석이나 규제 대응에서 기대한 증거력을 못 낼 수 있어요.

## 핵심 포인트

- Claude Code 로컬 로그의 thinking block은 사용자가 읽을 수 있는 실제 추론 원문이 아니다.
- Anthropic API의 extended thinking 출력은 전체 사고 과정의 요약이지, 모델 행동을 직접 만든 내부 추론 그 자체가 아니다.
- 에이전트 감사 추적(audit trail)을 약속해야 하는 팀이라면 입력, 출력, 실행 액션 로그와 reasoning 요약의 차이를 명확히 알아야 한다.

## 인사이트

AI 에이전트를 업무 도구로 넣을 때 “로그가 있으니 감사 가능하다”는 말이 쉽게 나오는데, 이 글은 그 전제를 찌른다. 실제 추론 원문과 사후 요약은 다르고, 규제나 보안 리뷰에서는 그 차이가 꽤 크게 터질 수 있다.
