AI 에이전트 고르기 전에 봐야 할 기준, 컨텍스트·도구·권한·트리거

ai-ml 2026-06-06 약 9분

 tags

#ai-agent #claude-code #codex #manus #genspark

vote

북마크

요즘 쏟아지는 AI 에이전트 도구를 웹 에이전트와 코딩 에이전트 중심으로 정리한 글이다. Manus, Genspark, Claude Code, Codex, Antigravity, Claude Cowork를 비교하면서 에이전트를 구분하는 핵심 기준은 겉모습이 아니라 컨텍스트·도구·권한·트리거라고 설명한다.

1
에이전트는 대규모 언어 모델이 도구를 루프로 실행해 목표를 달성하는 구조로 정의됨
2
서비스를 가르는 기준은 컨텍스트, 도구, 권한, 트리거 4가지임
3
웹 에이전트는 세팅이 가볍고 리서치·PPT 같은 단발 작업에 적합함
4
코딩 에이전트는 코드뿐 아니라 파일·앱·문서까지 다루는 컴퓨터 유즈 에이전트로 확장됨
5
Claude Code, Codex, Antigravity, Claude Cowork는 생태계와 권한 처리 방식에 따라 선택 포인트가 다름

에이전트라는 말이 너무 넓어져서 생긴 혼란

요즘은 AI와 자동화가 조금만 붙어도 다들 “에이전트”라고 부름
- 그래서 Claude Code, Codex, Manus, Genspark, OpenClaw 같은 이름은 많이 들리는데 정작 뭐가 어떻게 다른지 헷갈림
- 원문은 이 혼란을 “컨텍스트, 도구, 권한, 트리거”라는 4개 축으로 정리함
기사에서 잡은 에이전트의 한 줄 정의는 꽤 명확함
- “대규모 언어 모델(LLM)이 도구를 루프로 돌려 목표를 달성한다”는 것
- 챗봇은 답을 말해주지만, 에이전트는 파일을 열고, 코드를 쓰고, 웹을 뒤지고, 결과물을 만들어냄
- 즉 답변 생성이 아니라 작업 수행이 핵심임

❗중요

> 에이전트 도구를 고를 때 이름보다 먼저 봐야 할 건 권한임. “어디까지 알아서 하게 둘 것인가”가 생산성과 사고 가능성을 동시에 결정함.

에이전트를 가르는 4가지 축

컨텍스트는 에이전트가 무엇을 알고 시작하는지임
- 프롬프트, 코드베이스, 문서, 업무 파일, 기존 대화 같은 맥락이 여기에 들어감
- 컨텍스트가 충분해야 에이전트가 내 상황에 맞는 결정을 함
도구는 에이전트가 실제로 쓸 수 있는 손발임
- 웹 브라우저, 터미널, 파일 시스템, 코드 편집기, 메일, 드라이브 커넥터 등이 도구가 됨
- 도구가 많을수록 할 수 있는 일은 넓어지지만, 그만큼 권한 설계가 중요해짐
권한은 “어디까지 허용할 것인가”의 문제임
- 웹 에이전트는 서비스가 정해둔 도구 안에서 움직여 상대적으로 가벼움
- 코딩 에이전트는 내 파일과 개발 환경에 접근하므로 훨씬 강력함
- 자율 에이전트는 한 번 허용한 범위 안에서 24시간 혼자 돌 수 있어 가장 강하지만 제일 위험함
트리거는 언제 에이전트가 시작되는지임
- 코딩 에이전트는 보통 사람이 호출할 때 움직임
- 자율 에이전트는 조건이 맞으면 내가 자는 동안에도 실행될 수 있음

웹 에이전트는 가볍게 체험하기 좋음

Manus는 에이전트가 어떻게 계획하고 움직이는지 보기 좋은 웹 기반 도구로 소개됨
- 2025년 3월 6일 초대 전용 베타로 론칭함
- 중국 출신으로 현재 싱가포르에 본사를 둔 버터플라이 이펙트가 만들었음
- 브라우저에서 돌아가고, 가상 환경 안에서 브라우저·터미널·파일을 자율로 굴림
Manus의 장점은 작업 과정을 보여준다는 점임
- AI가 계획을 세우고 도구를 골라 쓰고 결과물을 개선하는 과정을 옆에서 볼 수 있음
- 리서치나 보고서처럼 긴 호흡의 웹 작업을 맡겨보기에 좋음
- 다만 내 상황에 맞춘 세밀한 수정으로 들어가면 제약과 토큰 소모가 느껴진다고 함
Genspark는 프롬프트 하나로 콘텐츠 작업을 맡겨보기 쉬운 쪽임
- 바이두 출신 에릭 징과 케이 주가 2023년 창업한 MainFunc가 만듦
- 2026년 3월 자율 에이전트 Claw를 도입하며 AI 직원 방향으로 확장함
- 대규모 언어 모델 9개와 통합 도구 80개를 골라 웹을 탐색하고 결과를 모아줌
Genspark는 특히 조사와 시각 결과물 쪽이 강점으로 소개됨
- 자료 조사, 여러 사이트 비교, 가격·기능 수집, 신규 조사를 붙인 PPT 제작에 잘 맞음
- 세팅 부담이 낮아서 “일단 에이전트가 뭔지 써보자”는 목적에 적합함

코딩 에이전트는 사실 컴퓨터 유즈 에이전트에 가까움

Claude Code, Codex 같은 도구는 이름 때문에 개발자 전용처럼 보이지만, 이제는 코드만 만지지 않음
- 파일, 앱, 데스크톱, 문서까지 컴퓨터에서 하는 거의 모든 일을 다루는 방향으로 확장됨
- 원문은 이걸 컴퓨터 유즈(computer use)로 봐도 된다고 설명함
Claude Code는 현재 기준점 같은 도구로 소개됨
- 앤트로픽이 2025년부터 운영
- Sonnet 4.6과 Opus 4.8을 사용하고, 터미널·IDE·데스크톱 앱·모바일을 지원함
- 큰 코드베이스 기반 작업, 리팩터링, 바이브 코딩, 문서·파일 자동화에 강점이 있음
- 명시적 승인 없이는 파일을 수정하지 않는 방식이라 통제권을 쥐고 가기 좋음
Codex는 OpenAI 쪽 코딩 에이전트로, ChatGPT 생태계에 익숙하면 선택지가 됨
- 오픈소스 CLI이고 ChatGPT Plus·Pro·Business·Edu·Enterprise 플랜에서 한도 내 사용 가능
- Claude Code와 비슷하게 코드 작업, 파일 수정, 컴퓨터 활용 작업을 수행함
- 상대적으로 목적 지향적으로 움직이고 권한 질문을 덜 하는 특징이 언급됨
Antigravity는 구글 생태계에 붙어 있는 선택지임
- Antigravity 2.0은 2026년 5월 Google I/O에서 공개됨
- 전용 데스크톱 앱과 CLI에서 에이전트 채팅으로 코드를 읽고, 파일을 고치고, 결과를 보고함
- 구글 워크스페이스를 많이 쓰는 환경이라면 붙여볼 만한 도구로 소개됨
Claude Cowork는 비개발자용 GUI 변형에 가까움
- 2026년 1월 12일 연구 프리뷰로 공개됐고 Claude Pro·Max에서 사용 가능
- 데스크톱 앱에서 폴더와 Google Drive, Gmail, DocuSign, FactSet 같은 커넥터를 지정하면 Claude가 파일과 앱을 읽고 편집함
- 실행 전에 계획을 보여주고 승인을 기다리는 Ask before acting 방식이라 비개발자 업무 자동화에 맞음

그래서 뭘 먼저 써야 하나

에이전트가 어떻게 움직이는지 감 잡고 싶으면 웹 에이전트가 제일 가벼움
- 리서치, 비교 조사, PPT 같은 단발 작업을 Manus나 Genspark에 던져보면 구조가 보임
- 설치와 세팅 부담이 적고 실패해도 피해가 작음
실제 업무 환경에 붙이고 싶으면 코딩 에이전트 쪽으로 가야 함
- 코드를 만지면 Claude Code, Codex, Antigravity 중 내 생태계에 맞춰 고르면 됨
- 코드를 안 만져도 파일 정리, 보고서 작성, 메일 처리 같은 컴퓨터 유즈 작업에는 Claude Cowork 같은 GUI형 도구가 맞을 수 있음
핵심은 제품 이름을 외우는 게 아니라 직접 작게 돌려보는 것임
- 에이전트는 글로 이해하는 것과 실제 파일 하나 맡겨보는 경험이 꽤 다름
- 다만 권한을 넓히기 전에는 “무엇을 알고, 무엇을 실행하고, 언제 묻는지”부터 확인해야 함

기술 맥락

이 글의 좋은 점은 에이전트를 제품 목록이 아니라 실행 구조로 나눈다는 거예요. 컨텍스트, 도구, 권한, 트리거를 보면 새 도구가 나와도 대충 어디에 놓이는지 판단할 수 있거든요.
특히 권한이 핵심이에요. 같은 대규모 언어 모델을 써도 웹 검색만 가능한 에이전트와 로컬 파일을 수정하는 에이전트는 완전히 다른 리스크를 가져요. 생산성이 올라가는 만큼 승인, 로그, 되돌리기 전략도 같이 필요해져요.
코딩 에이전트를 컴퓨터 유즈로 보는 관점도 중요해요. 이제 이 도구들은 코드 작성뿐 아니라 문서 수정, 파일 정리, 앱 조작까지 하니까 개발자 생산성 도구에서 지식 노동 자동화 도구로 넓어지고 있어요.
팀에서 도입한다면 “어떤 제품이 제일 똑똑한가”보다 “어떤 자료를 읽게 할지, 어떤 명령을 실행하게 할지, 파일 수정 전에 반드시 물어보게 할지”를 먼저 정해야 해요. 에이전트 운영은 모델 선택보다 권한 설계가 먼저예요.

에이전트 시장이 헷갈리는 이유는 다들 같은 단어를 쓰지만 실제 권한 모델이 완전히 다르기 때문이다. 개발자라면 제품 이름보다 “얘가 뭘 알고, 뭘 실행할 수 있고, 언제 묻는가”를 먼저 봐야 한다.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-13

애플 새 음성 인식 API, 온디바이스 영어 전사에서 위스퍼 스몰까지 이겼다

애플의 새 음성 인식 API인 스피치애널라이저가 리브리스피치 벤치마크에서 기존 SFSpeechRecognizer는 물론 위스퍼 스몰보다도 낮은 단어 오류율을 기록했어. 깨끗한 음성에서는 2.12%, noisy 음성에서는 4.56%로, 기존 애플 API 대비 오류율을 3.5~4배 줄였고 위스퍼 스몰보다 약 3배 빠르게 돌았어. 다만 영어·애플 플랫폼·OS 26 조건의 결과라, 다국어와 크로스플랫폼에서는 여전히 위스퍼의 장점이 남아 있어.

ai-ml 2026-07-13

AI를 진짜 잘 쓰는 기업, 미국 증시에서 연 30% 프리미엄 받는다는 연구

예일대와 로체스터대 연구진이 기업의 실제 대형 언어 모델 사용 데이터를 분석했더니, AI 활용도가 높은 상위 20% 기업이 하위 20%보다 주당 평균 0.64% 높은 초과수익률을 냈다. 단순히 AI 기업이냐가 아니라, 업무에 AI를 얼마나 깊게 쓰는지가 시장 가치에 반영되고 있다는 얘기다.

ai-ml 2026-07-13

ZTE, AI 에이전트폰으로 스마트폰 재도전…진짜 승부처는 앱 생태계

ZTE가 바이트댄스의 더우바오를 탑재한 AI 에이전트 스마트폰으로 시장 재진입을 노린다. 핵심은 사용자가 명령하면 AI가 여러 앱을 직접 열고 조작하는 방식인데, 위챗·타오바오·알리페이 같은 플랫폼과 충돌하면서 생태계 문제가 가장 큰 변수로 떠올랐다.

ai-ml 2026-07-13

노벨상 학자들까지 “AI 경제 충격, 지금 제도 안 만들면 늦다”

노벨 경제학상 수상자 15명을 포함한 학자와 기술 업계 인사 약 200명이 AI가 향후 10년 안에 경제를 급격히 바꿀 수 있다며 정책 대응을 촉구했다. 이들은 산업혁명보다 큰 변화가 훨씬 짧은 시간에 올 수 있고, 대규모 일자리 대체와 생활 수준 향상이라는 양면성이 동시에 존재한다고 봤다.

ai-ml 2026-07-13

NHN, AI 데이터센터 매출 기대감에 목표주가 5만6000원으로 상향

한국투자증권이 NHN의 목표주가를 4만5000원에서 5만6000원으로 올리고 투자의견 매수를 유지했다. 핵심 근거는 양평 AI 데이터센터 가동, 공공·민간 GPU 클러스터 수주 확대, 클라우드 사업부 신규 매출 반영이다.

AI 에이전트 고르기 전에 봐야 할 기준, 컨텍스트·도구·권한·트리거

요약

핵심 포인트

핵심 개념

분석

에이전트라는 말이 너무 넓어져서 생긴 혼란

에이전트를 가르는 4가지 축

웹 에이전트는 가볍게 체험하기 좋음

코딩 에이전트는 사실 컴퓨터 유즈 에이전트에 가까움

그래서 뭘 먼저 써야 하나

기술 맥락

인사이트

댓글

댓글

AI 에이전트 고르기 전에 봐야 할 기준, 컨텍스트·도구·권한·트리거

요약

핵심 포인트

핵심 개념

분석

에이전트라는 말이 너무 넓어져서 생긴 혼란

에이전트를 가르는 4가지 축

웹 에이전트는 가볍게 체험하기 좋음

코딩 에이전트는 사실 컴퓨터 유즈 에이전트에 가까움

그래서 뭘 먼저 써야 하나

기술 맥락

인사이트

댓글

댓글

관련 기사