---
title: "AI 에이전트 고르기 전에 봐야 할 기준, 컨텍스트·도구·권한·트리거"
published: 2026-06-06T18:05:01.419Z
canonical: https://jeff.news/article/3784
---
# AI 에이전트 고르기 전에 봐야 할 기준, 컨텍스트·도구·권한·트리거

요즘 쏟아지는 AI 에이전트 도구를 웹 에이전트와 코딩 에이전트 중심으로 정리한 글이다. Manus, Genspark, Claude Code, Codex, Antigravity, Claude Cowork를 비교하면서 에이전트를 구분하는 핵심 기준은 겉모습이 아니라 컨텍스트·도구·권한·트리거라고 설명한다.

## 에이전트라는 말이 너무 넓어져서 생긴 혼란

- 요즘은 AI와 자동화가 조금만 붙어도 다들 “에이전트”라고 부름
  - 그래서 Claude Code, Codex, Manus, Genspark, OpenClaw 같은 이름은 많이 들리는데 정작 뭐가 어떻게 다른지 헷갈림
  - 원문은 이 혼란을 “컨텍스트, 도구, 권한, 트리거”라는 4개 축으로 정리함

- 기사에서 잡은 에이전트의 한 줄 정의는 꽤 명확함
  - “대규모 언어 모델(LLM)이 도구를 루프로 돌려 목표를 달성한다”는 것
  - 챗봇은 답을 말해주지만, 에이전트는 파일을 열고, 코드를 쓰고, 웹을 뒤지고, 결과물을 만들어냄
  - 즉 답변 생성이 아니라 작업 수행이 핵심임

> [!IMPORTANT]
> 에이전트 도구를 고를 때 이름보다 먼저 봐야 할 건 권한임. “어디까지 알아서 하게 둘 것인가”가 생산성과 사고 가능성을 동시에 결정함.

## 에이전트를 가르는 4가지 축

- 컨텍스트는 에이전트가 무엇을 알고 시작하는지임
  - 프롬프트, 코드베이스, 문서, 업무 파일, 기존 대화 같은 맥락이 여기에 들어감
  - 컨텍스트가 충분해야 에이전트가 내 상황에 맞는 결정을 함

- 도구는 에이전트가 실제로 쓸 수 있는 손발임
  - 웹 브라우저, 터미널, 파일 시스템, 코드 편집기, 메일, 드라이브 커넥터 등이 도구가 됨
  - 도구가 많을수록 할 수 있는 일은 넓어지지만, 그만큼 권한 설계가 중요해짐

- 권한은 “어디까지 허용할 것인가”의 문제임
  - 웹 에이전트는 서비스가 정해둔 도구 안에서 움직여 상대적으로 가벼움
  - 코딩 에이전트는 내 파일과 개발 환경에 접근하므로 훨씬 강력함
  - 자율 에이전트는 한 번 허용한 범위 안에서 24시간 혼자 돌 수 있어 가장 강하지만 제일 위험함

- 트리거는 언제 에이전트가 시작되는지임
  - 코딩 에이전트는 보통 사람이 호출할 때 움직임
  - 자율 에이전트는 조건이 맞으면 내가 자는 동안에도 실행될 수 있음

## 웹 에이전트는 가볍게 체험하기 좋음

- Manus는 에이전트가 어떻게 계획하고 움직이는지 보기 좋은 웹 기반 도구로 소개됨
  - 2025년 3월 6일 초대 전용 베타로 론칭함
  - 중국 출신으로 현재 싱가포르에 본사를 둔 버터플라이 이펙트가 만들었음
  - 브라우저에서 돌아가고, 가상 환경 안에서 브라우저·터미널·파일을 자율로 굴림

- Manus의 장점은 작업 과정을 보여준다는 점임
  - AI가 계획을 세우고 도구를 골라 쓰고 결과물을 개선하는 과정을 옆에서 볼 수 있음
  - 리서치나 보고서처럼 긴 호흡의 웹 작업을 맡겨보기에 좋음
  - 다만 내 상황에 맞춘 세밀한 수정으로 들어가면 제약과 토큰 소모가 느껴진다고 함

- Genspark는 프롬프트 하나로 콘텐츠 작업을 맡겨보기 쉬운 쪽임
  - 바이두 출신 에릭 징과 케이 주가 2023년 창업한 MainFunc가 만듦
  - 2026년 3월 자율 에이전트 Claw를 도입하며 AI 직원 방향으로 확장함
  - 대규모 언어 모델 9개와 통합 도구 80개를 골라 웹을 탐색하고 결과를 모아줌

- Genspark는 특히 조사와 시각 결과물 쪽이 강점으로 소개됨
  - 자료 조사, 여러 사이트 비교, 가격·기능 수집, 신규 조사를 붙인 PPT 제작에 잘 맞음
  - 세팅 부담이 낮아서 “일단 에이전트가 뭔지 써보자”는 목적에 적합함

## 코딩 에이전트는 사실 컴퓨터 유즈 에이전트에 가까움

- Claude Code, Codex 같은 도구는 이름 때문에 개발자 전용처럼 보이지만, 이제는 코드만 만지지 않음
  - 파일, 앱, 데스크톱, 문서까지 컴퓨터에서 하는 거의 모든 일을 다루는 방향으로 확장됨
  - 원문은 이걸 컴퓨터 유즈(computer use)로 봐도 된다고 설명함

- Claude Code는 현재 기준점 같은 도구로 소개됨
  - 앤트로픽이 2025년부터 운영
  - Sonnet 4.6과 Opus 4.8을 사용하고, 터미널·IDE·데스크톱 앱·모바일을 지원함
  - 큰 코드베이스 기반 작업, 리팩터링, 바이브 코딩, 문서·파일 자동화에 강점이 있음
  - 명시적 승인 없이는 파일을 수정하지 않는 방식이라 통제권을 쥐고 가기 좋음

- Codex는 OpenAI 쪽 코딩 에이전트로, ChatGPT 생태계에 익숙하면 선택지가 됨
  - 오픈소스 CLI이고 ChatGPT Plus·Pro·Business·Edu·Enterprise 플랜에서 한도 내 사용 가능
  - Claude Code와 비슷하게 코드 작업, 파일 수정, 컴퓨터 활용 작업을 수행함
  - 상대적으로 목적 지향적으로 움직이고 권한 질문을 덜 하는 특징이 언급됨

- Antigravity는 구글 생태계에 붙어 있는 선택지임
  - Antigravity 2.0은 2026년 5월 Google I/O에서 공개됨
  - 전용 데스크톱 앱과 CLI에서 에이전트 채팅으로 코드를 읽고, 파일을 고치고, 결과를 보고함
  - 구글 워크스페이스를 많이 쓰는 환경이라면 붙여볼 만한 도구로 소개됨

- Claude Cowork는 비개발자용 GUI 변형에 가까움
  - 2026년 1월 12일 연구 프리뷰로 공개됐고 Claude Pro·Max에서 사용 가능
  - 데스크톱 앱에서 폴더와 Google Drive, Gmail, DocuSign, FactSet 같은 커넥터를 지정하면 Claude가 파일과 앱을 읽고 편집함
  - 실행 전에 계획을 보여주고 승인을 기다리는 Ask before acting 방식이라 비개발자 업무 자동화에 맞음

## 그래서 뭘 먼저 써야 하나

- 에이전트가 어떻게 움직이는지 감 잡고 싶으면 웹 에이전트가 제일 가벼움
  - 리서치, 비교 조사, PPT 같은 단발 작업을 Manus나 Genspark에 던져보면 구조가 보임
  - 설치와 세팅 부담이 적고 실패해도 피해가 작음

- 실제 업무 환경에 붙이고 싶으면 코딩 에이전트 쪽으로 가야 함
  - 코드를 만지면 Claude Code, Codex, Antigravity 중 내 생태계에 맞춰 고르면 됨
  - 코드를 안 만져도 파일 정리, 보고서 작성, 메일 처리 같은 컴퓨터 유즈 작업에는 Claude Cowork 같은 GUI형 도구가 맞을 수 있음

- 핵심은 제품 이름을 외우는 게 아니라 직접 작게 돌려보는 것임
  - 에이전트는 글로 이해하는 것과 실제 파일 하나 맡겨보는 경험이 꽤 다름
  - 다만 권한을 넓히기 전에는 “무엇을 알고, 무엇을 실행하고, 언제 묻는지”부터 확인해야 함

---

## 기술 맥락

- 이 글의 좋은 점은 에이전트를 제품 목록이 아니라 실행 구조로 나눈다는 거예요. 컨텍스트, 도구, 권한, 트리거를 보면 새 도구가 나와도 대충 어디에 놓이는지 판단할 수 있거든요.

- 특히 권한이 핵심이에요. 같은 대규모 언어 모델을 써도 웹 검색만 가능한 에이전트와 로컬 파일을 수정하는 에이전트는 완전히 다른 리스크를 가져요. 생산성이 올라가는 만큼 승인, 로그, 되돌리기 전략도 같이 필요해져요.

- 코딩 에이전트를 컴퓨터 유즈로 보는 관점도 중요해요. 이제 이 도구들은 코드 작성뿐 아니라 문서 수정, 파일 정리, 앱 조작까지 하니까 개발자 생산성 도구에서 지식 노동 자동화 도구로 넓어지고 있어요.

- 팀에서 도입한다면 “어떤 제품이 제일 똑똑한가”보다 “어떤 자료를 읽게 할지, 어떤 명령을 실행하게 할지, 파일 수정 전에 반드시 물어보게 할지”를 먼저 정해야 해요. 에이전트 운영은 모델 선택보다 권한 설계가 먼저예요.

## 핵심 포인트

- 에이전트는 대규모 언어 모델이 도구를 루프로 실행해 목표를 달성하는 구조로 정의됨
- 서비스를 가르는 기준은 컨텍스트, 도구, 권한, 트리거 4가지임
- 웹 에이전트는 세팅이 가볍고 리서치·PPT 같은 단발 작업에 적합함
- 코딩 에이전트는 코드뿐 아니라 파일·앱·문서까지 다루는 컴퓨터 유즈 에이전트로 확장됨
- Claude Code, Codex, Antigravity, Claude Cowork는 생태계와 권한 처리 방식에 따라 선택 포인트가 다름

## 인사이트

에이전트 시장이 헷갈리는 이유는 다들 같은 단어를 쓰지만 실제 권한 모델이 완전히 다르기 때문이다. 개발자라면 제품 이름보다 “얘가 뭘 알고, 뭘 실행할 수 있고, 언제 묻는가”를 먼저 봐야 한다.
