---
title: "ISON – JSON보다 토큰을 30-70% 절약하는 LLM용 데이터 포맷"
published: 2025-12-26T23:38:28.000Z
canonical: https://jeff.news/article/1245
---
# ISON – JSON보다 토큰을 30-70% 절약하는 LLM용 데이터 포맷

LLM 워크플로우에서 JSON의 토큰 비효율을 해결하기 위해 만든 새 데이터 포맷 ISON이 Show HN에 공개됨. GPT-4o 기준 벤치마크에서 JSON 대비 72% 토큰 절감, 같은 컨텍스트 윈도우에 3.6배 데이터를 넣을 수 있다고 주장.

- JSON이 LLM 워크플로우에서 토큰을 너무 많이 먹는다는 문제의식에서 출발한 새 데이터 포맷 ISON이 Show HN에 올라옴. "Interchange Simple Object Notation"이라는 이름 그대로, 테이블/관계형 패턴 기반으로 LLM이 학습 데이터에서 수억 번 봤을 구조를 활용해서 토큰 효율을 극대화하겠다는 컨셉임

- GPT-4o 토크나이저(o200k_base) 기준 300문항 벤치마크 결과가 인상적임:
  - ISON: 3,550 토큰 (JSON 대비 **-72%**), 정확도 88.3%
  - JSON: 12,668 토큰 (기준선), 정확도 84.7%
  - 1K 토큰당 정확도로 환산하면 ISON이 JSON보다 **272% 효율적**
  - 같은 컨텍스트 윈도우에 **3.6배 더 많은 데이터**를 넣을 수 있다는 얘기

- 포맷 자체는 테이블 구조(타입이 지정된 컬럼), 오브젝트 블록(키-밸류), 레퍼런스(`:id`, `:type:id`), 타입 어노테이션(`field:int`, `field:string` 등), 스트리밍용 라인 기반 포맷(ISONL)을 지원함

- 에코시스템은 이미 5개 언어에 11개 패키지가 나와 있음: JavaScript/TypeScript, Python, Rust, C++(헤더 온리), Go. 총 303개 이상 테스트 통과. 각 언어별로 파서와 밸리데이션(isonantic) 라이브러리가 분리되어 있어서 스키마 검증도 가능함

- 타겟 유즈케이스로 멀티 에이전트 시스템, RAG 파이프라인, 그래프 DB, LLM 함수 호출 등을 내세우고 있음. 토큰 제약이 빡빡한 에이전틱 AI 워크플로우에서 JSON 대신 쓰면 비용 절감 효과가 클 수 있다는 주장

> [!NOTE]
> 아직 커뮤니티 채택 초기 단계이고, 기존 JSON 생태계와의 호환성(JSON Export, Roundtrip 지원)을 강조하고 있긴 하지만, 실제 프로덕션에서 LLM이 ISON을 얼마나 안정적으로 생성하는지는 별도 검증이 필요함

## 핵심 포인트

- JSON 대비 72% 토큰 절감, 1K 토큰당 정확도 272% 효율적
- 5개 언어 11개 패키지, 303개 이상 테스트 통과
- 테이블 구조, 타입 어노테이션, 레퍼런스, ISONL 스트리밍 포맷 지원

## 인사이트

토큰 비용이 곧 돈인 LLM 시대에 데이터 직렬화 포맷도 토큰 효율을 기준으로 재설계되기 시작했다는 점이 흥미로움. 다만 LLM이 ISON을 안정적으로 생성할 수 있는지가 실제 채택의 핵심 변수.
