본문으로 건너뛰기
피드

AI 에이전트 고르기 전에 봐야 할 기준, 컨텍스트·도구·권한·트리거

ai-ml 약 9분
vote
0
댓글
북마크

요즘 쏟아지는 AI 에이전트 도구를 웹 에이전트와 코딩 에이전트 중심으로 정리한 글이다. Manus, Genspark, Claude Code, Codex, Antigravity, Claude Cowork를 비교하면서 에이전트를 구분하는 핵심 기준은 겉모습이 아니라 컨텍스트·도구·권한·트리거라고 설명한다.

  • 1

    에이전트는 대규모 언어 모델이 도구를 루프로 실행해 목표를 달성하는 구조로 정의됨

  • 2

    서비스를 가르는 기준은 컨텍스트, 도구, 권한, 트리거 4가지임

  • 3

    웹 에이전트는 세팅이 가볍고 리서치·PPT 같은 단발 작업에 적합함

  • 4

    코딩 에이전트는 코드뿐 아니라 파일·앱·문서까지 다루는 컴퓨터 유즈 에이전트로 확장됨

  • 5

    Claude Code, Codex, Antigravity, Claude Cowork는 생태계와 권한 처리 방식에 따라 선택 포인트가 다름

에이전트라는 말이 너무 넓어져서 생긴 혼란

  • 요즘은 AI와 자동화가 조금만 붙어도 다들 “에이전트”라고 부름

    • 그래서 Claude Code, Codex, Manus, Genspark, OpenClaw 같은 이름은 많이 들리는데 정작 뭐가 어떻게 다른지 헷갈림
    • 원문은 이 혼란을 “컨텍스트, 도구, 권한, 트리거”라는 4개 축으로 정리함
  • 기사에서 잡은 에이전트의 한 줄 정의는 꽤 명확함

    • “대규모 언어 모델(LLM)이 도구를 루프로 돌려 목표를 달성한다”는 것
    • 챗봇은 답을 말해주지만, 에이전트는 파일을 열고, 코드를 쓰고, 웹을 뒤지고, 결과물을 만들어냄
    • 즉 답변 생성이 아니라 작업 수행이 핵심임

중요

> 에이전트 도구를 고를 때 이름보다 먼저 봐야 할 건 권한임. “어디까지 알아서 하게 둘 것인가”가 생산성과 사고 가능성을 동시에 결정함.

에이전트를 가르는 4가지 축

  • 컨텍스트는 에이전트가 무엇을 알고 시작하는지임

    • 프롬프트, 코드베이스, 문서, 업무 파일, 기존 대화 같은 맥락이 여기에 들어감
    • 컨텍스트가 충분해야 에이전트가 내 상황에 맞는 결정을 함
  • 도구는 에이전트가 실제로 쓸 수 있는 손발임

    • 웹 브라우저, 터미널, 파일 시스템, 코드 편집기, 메일, 드라이브 커넥터 등이 도구가 됨
    • 도구가 많을수록 할 수 있는 일은 넓어지지만, 그만큼 권한 설계가 중요해짐
  • 권한은 “어디까지 허용할 것인가”의 문제임

    • 웹 에이전트는 서비스가 정해둔 도구 안에서 움직여 상대적으로 가벼움
    • 코딩 에이전트는 내 파일과 개발 환경에 접근하므로 훨씬 강력함
    • 자율 에이전트는 한 번 허용한 범위 안에서 24시간 혼자 돌 수 있어 가장 강하지만 제일 위험함
  • 트리거는 언제 에이전트가 시작되는지임

    • 코딩 에이전트는 보통 사람이 호출할 때 움직임
    • 자율 에이전트는 조건이 맞으면 내가 자는 동안에도 실행될 수 있음

웹 에이전트는 가볍게 체험하기 좋음

  • Manus는 에이전트가 어떻게 계획하고 움직이는지 보기 좋은 웹 기반 도구로 소개됨

    • 2025년 3월 6일 초대 전용 베타로 론칭함
    • 중국 출신으로 현재 싱가포르에 본사를 둔 버터플라이 이펙트가 만들었음
    • 브라우저에서 돌아가고, 가상 환경 안에서 브라우저·터미널·파일을 자율로 굴림
  • Manus의 장점은 작업 과정을 보여준다는 점임

    • AI가 계획을 세우고 도구를 골라 쓰고 결과물을 개선하는 과정을 옆에서 볼 수 있음
    • 리서치나 보고서처럼 긴 호흡의 웹 작업을 맡겨보기에 좋음
    • 다만 내 상황에 맞춘 세밀한 수정으로 들어가면 제약과 토큰 소모가 느껴진다고 함
  • Genspark는 프롬프트 하나로 콘텐츠 작업을 맡겨보기 쉬운 쪽임

    • 바이두 출신 에릭 징과 케이 주가 2023년 창업한 MainFunc가 만듦
    • 2026년 3월 자율 에이전트 Claw를 도입하며 AI 직원 방향으로 확장함
    • 대규모 언어 모델 9개와 통합 도구 80개를 골라 웹을 탐색하고 결과를 모아줌
  • Genspark는 특히 조사와 시각 결과물 쪽이 강점으로 소개됨

    • 자료 조사, 여러 사이트 비교, 가격·기능 수집, 신규 조사를 붙인 PPT 제작에 잘 맞음
    • 세팅 부담이 낮아서 “일단 에이전트가 뭔지 써보자”는 목적에 적합함

코딩 에이전트는 사실 컴퓨터 유즈 에이전트에 가까움

  • Claude Code, Codex 같은 도구는 이름 때문에 개발자 전용처럼 보이지만, 이제는 코드만 만지지 않음

    • 파일, 앱, 데스크톱, 문서까지 컴퓨터에서 하는 거의 모든 일을 다루는 방향으로 확장됨
    • 원문은 이걸 컴퓨터 유즈(computer use)로 봐도 된다고 설명함
  • Claude Code는 현재 기준점 같은 도구로 소개됨

    • 앤트로픽이 2025년부터 운영
    • Sonnet 4.6과 Opus 4.8을 사용하고, 터미널·IDE·데스크톱 앱·모바일을 지원함
    • 큰 코드베이스 기반 작업, 리팩터링, 바이브 코딩, 문서·파일 자동화에 강점이 있음
    • 명시적 승인 없이는 파일을 수정하지 않는 방식이라 통제권을 쥐고 가기 좋음
  • Codex는 OpenAI 쪽 코딩 에이전트로, ChatGPT 생태계에 익숙하면 선택지가 됨

    • 오픈소스 CLI이고 ChatGPT Plus·Pro·Business·Edu·Enterprise 플랜에서 한도 내 사용 가능
    • Claude Code와 비슷하게 코드 작업, 파일 수정, 컴퓨터 활용 작업을 수행함
    • 상대적으로 목적 지향적으로 움직이고 권한 질문을 덜 하는 특징이 언급됨
  • Antigravity는 구글 생태계에 붙어 있는 선택지임

    • Antigravity 2.0은 2026년 5월 Google I/O에서 공개됨
    • 전용 데스크톱 앱과 CLI에서 에이전트 채팅으로 코드를 읽고, 파일을 고치고, 결과를 보고함
    • 구글 워크스페이스를 많이 쓰는 환경이라면 붙여볼 만한 도구로 소개됨
  • Claude Cowork는 비개발자용 GUI 변형에 가까움

    • 2026년 1월 12일 연구 프리뷰로 공개됐고 Claude Pro·Max에서 사용 가능
    • 데스크톱 앱에서 폴더와 Google Drive, Gmail, DocuSign, FactSet 같은 커넥터를 지정하면 Claude가 파일과 앱을 읽고 편집함
    • 실행 전에 계획을 보여주고 승인을 기다리는 Ask before acting 방식이라 비개발자 업무 자동화에 맞음

그래서 뭘 먼저 써야 하나

  • 에이전트가 어떻게 움직이는지 감 잡고 싶으면 웹 에이전트가 제일 가벼움

    • 리서치, 비교 조사, PPT 같은 단발 작업을 Manus나 Genspark에 던져보면 구조가 보임
    • 설치와 세팅 부담이 적고 실패해도 피해가 작음
  • 실제 업무 환경에 붙이고 싶으면 코딩 에이전트 쪽으로 가야 함

    • 코드를 만지면 Claude Code, Codex, Antigravity 중 내 생태계에 맞춰 고르면 됨
    • 코드를 안 만져도 파일 정리, 보고서 작성, 메일 처리 같은 컴퓨터 유즈 작업에는 Claude Cowork 같은 GUI형 도구가 맞을 수 있음
  • 핵심은 제품 이름을 외우는 게 아니라 직접 작게 돌려보는 것임

    • 에이전트는 글로 이해하는 것과 실제 파일 하나 맡겨보는 경험이 꽤 다름
    • 다만 권한을 넓히기 전에는 “무엇을 알고, 무엇을 실행하고, 언제 묻는지”부터 확인해야 함

기술 맥락

  • 이 글의 좋은 점은 에이전트를 제품 목록이 아니라 실행 구조로 나눈다는 거예요. 컨텍스트, 도구, 권한, 트리거를 보면 새 도구가 나와도 대충 어디에 놓이는지 판단할 수 있거든요.

  • 특히 권한이 핵심이에요. 같은 대규모 언어 모델을 써도 웹 검색만 가능한 에이전트와 로컬 파일을 수정하는 에이전트는 완전히 다른 리스크를 가져요. 생산성이 올라가는 만큼 승인, 로그, 되돌리기 전략도 같이 필요해져요.

  • 코딩 에이전트를 컴퓨터 유즈로 보는 관점도 중요해요. 이제 이 도구들은 코드 작성뿐 아니라 문서 수정, 파일 정리, 앱 조작까지 하니까 개발자 생산성 도구에서 지식 노동 자동화 도구로 넓어지고 있어요.

  • 팀에서 도입한다면 “어떤 제품이 제일 똑똑한가”보다 “어떤 자료를 읽게 할지, 어떤 명령을 실행하게 할지, 파일 수정 전에 반드시 물어보게 할지”를 먼저 정해야 해요. 에이전트 운영은 모델 선택보다 권한 설계가 먼저예요.

에이전트 시장이 헷갈리는 이유는 다들 같은 단어를 쓰지만 실제 권한 모델이 완전히 다르기 때문이다. 개발자라면 제품 이름보다 “얘가 뭘 알고, 뭘 실행할 수 있고, 언제 묻는가”를 먼저 봐야 한다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

생성형 AI는 학생을 똑똑하게도, 게으르게도 만든다

생성형 인공지능이 고등교육에서 비판적 사고와 창의적 사고를 키울 수도 있지만, 수업 설계가 없으면 학생이 생각을 도구에 떠넘기는 결과로 이어질 수 있다는 체계적 문헌고찰이 나왔다. 연구진은 2022년부터 2025년 4월까지의 실증 연구 67편을 분석해, 생성형 인공지능의 효과가 도구 자체보다 과제 설계·학습 지원·인공지능 리터러시에 달려 있다고 봤다. 국내 대학과 교육 현장에도 ‘사용 금지냐 허용이냐’보다 ‘어떻게 쓰게 만들 것인가’가 더 중요한 질문이 됐다.

ai-ml

중국 스피릿 AI, 로봇 AI 평가에서 엔비디아를 밀어냈다

중국 스타트업 스피릿 AI의 피지컬 인공지능 모델이 로보아레나 순위에서 엔비디아 코스모스3를 제치고 1위에 올랐다. 로봇의 ‘두뇌’를 만드는 경쟁이 반도체나 대규모 언어 모델을 넘어 실제 물리 세계를 다루는 모델 경쟁으로 옮겨가고 있다는 신호다. 한국 로봇 기업 입장에선 하드웨어뿐 아니라 데이터와 소프트웨어 모델 경쟁력을 같이 봐야 하는 상황이 됐다.

ai-ml

중국 AI의 다음 전장, 챗봇이 아니라 공장·병원·도시 인프라

중국의 세계지능산업박람회는 AI 경쟁의 중심이 범용 대형언어모델에서 산업 AI로 이동하고 있음을 보여줬다. 의료, 제조, 에너지, 도시관리, 로봇, 데이터 플랫폼이 전면에 등장했고, 중국 정부의 인공지능+ 전략도 이 흐름을 밀고 있다.

ai-ml

젠슨 황이 또 한국 온 이유, 이번 키워드는 피지컬 AI

젠슨 황 엔비디아 CEO가 7개월 만에 다시 한국을 찾아 SK, LG, 네이버, 현대차 등과 피지컬 AI 협력을 확대하려는 행보를 보였다. 반도체 공급망을 넘어 로봇, 자율주행, AI 팩토리, 소버린 AI까지 한국을 테스트베드이자 전략 거점으로 보려는 흐름이다.

ai-ml

스페이스X, 구글에 GPU 11만 개 빌려주고 월 1.4조 원 받는다

스페이스X가 구글에 엔비디아 GPU 11만 개를 포함한 연산 자원을 제공하는 클라우드 서비스 계약을 SEC에 공시했다. 구글은 2026년 10월부터 2029년 6월까지 매월 9억2000만 달러, 약 1조4000억 원을 지급하며 전체 계약 규모는 약 300억 달러, 약 47조 원에 이를 전망이다.