---
title: "왜 다들 AI 에이전트 샌드박싱을 직접 만들고 있나 — HN 토론 정리"
published: 2026-01-20T23:52:32.000Z
canonical: https://jeff.news/article/1039
---
# 왜 다들 AI 에이전트 샌드박싱을 직접 만들고 있나 — HN 토론 정리

AI 에이전트 샌드박싱이 단순 격리가 아니라 장기 실행 에이전트의 수렴성을 보장하는 문제라는 HN 토론. 환경 불안정성이 모델 오류보다 에이전트 실패의 큰 원인이며, OCI 기반 솔루션이 합리적이지만 벤더 락인 우려도 있다.

- HN에서 "왜 다들 AI 에이전트 샌드박싱 솔루션을 직접 만들고 있는 거냐"라는 질문이 올라왔는데, 답변들이 꽤 실질적임

- 한 개발자는 Copilot이 instruction 파일을 제대로 안 읽어서 직접 에이전트를 만들기 시작했는데, 코드를 열어보니 **LLM이 instruction 파일을 읽을지 말지를 스스로 결정**하게 해놨더라는 거임. 그래서 Dagger 위에 직접 격리 실행 환경을 구축함 — 컨테이너 없이 컨테이너처럼 돌리고, diff 보기, 히스토리 되감기, OCI 레지스트리로 공유까지 가능하게 만듦

- 핵심 인사이트: "에이전트 샌드박싱"은 단순 격리가 아니라 **장기 실행 에이전트가 실제로 수렴하게 만드는 것**이라는 점. 에이전트가 실패하는 이유가 모델이 틀려서만이 아니라 환경이 불안정해서인 경우가 많음 — 의존성 누락, 느린 셋업, 이상한 상태, 불명확한 피드백 루프

- 이미 레포에 맞게 세팅된 격리 환경을 에이전트에게 주면 마찰이 확 줄고 반복 작업의 신뢰성이 올라감. 테스트, 린터, CI 규칙 같은 피드백을 중앙화해서 에이전트(와 사람)의 컴플라이언스를 결정론적으로 만드는 게 두 번째 포인트

- 실질적으로 부딪히는 두 가지 문제:
  - **권한과 샌드박스 제한**: 클라우드나 잠긴 샌드박스에서 돌리면 sudo도 못 쓰고 파일시스템·네트워크도 제한됨. "그냥 설치해"가 안 되는 경우가 많음
  - **토큰과 시간 낭비**: 의존성 에러는 노이즈가 심해서 에이전트가 엉뚱한 수정에 반복을 낭비하거나, 새로운 불일치를 만들어냄

- Anthropic이 Bun을 인수한 것도 언급되는데, 아마 격리 환경이나 캔버스 관련 제품이 나올 거라는 추측이 있음. AI 제공업체들이 이 영역에서 벤더 락인을 시도할 가능성이 높다는 게 공통된 전망

> [!NOTE]
> OCI(Open Container Initiative)가 이미 널리 채택된 표준이라 이 위에 구축하는 게 합리적이지만, 결국 "다른 이름으로 재구현"이 난무할 거라는 현실적 예측도 있음

## 핵심 포인트

- Copilot이 instruction 파일 읽기를 LLM에게 위임하는 문제 지적
- Dagger 기반 격리 환경 직접 구축 사례
- 에이전트 실패 원인: 모델보다 환경 불안정성
- 권한 제한과 토큰 낭비가 실질적 장벽
- Anthropic의 Bun 인수와 벤더 락인 전망

## 인사이트

에이전트 시대에 '환경'의 중요성이 재조명되고 있음. DevOps와 AI가 만나는 지점에서 새로운 인프라 계층이 형성되는 중.
