본문으로 건너뛰기
피드

브라우저 에이전트가 매번 사이트를 새로 배우는 삽질, Browse.sh가 줄이겠다는 얘기

ai-ml 약 9분
vote
0
댓글
북마크

Browserbase가 100개 이상 브라우저 자동화 스킬을 모은 오픈 카탈로그 Browse.sh를 공개했다. 핵심은 에이전트가 웹사이트를 매번 처음부터 탐색하지 않게, 사이트별 셀렉터·숨은 API·예외 처리 같은 노하우를 SKILL.md로 저장해 재사용하자는 거다.

  • 1

    Browse.sh는 브라우저 에이전트용 스킬 카탈로그와 npm 기반 Browse CLI로 구성된다.

  • 2

    스킬은 특정 사이트 작업을 반복하기 위한 SKILL.md와 보조 스크립트 묶음이다.

  • 3

    Craigslist 벤치마크에서 일반 에이전트 루프는 실행당 약 0.22달러, Browse.sh 스킬 사용 후에는 약 0.12달러로 45% 비용이 줄었다.

  • 4

    출시 시점에는 Craigslist, Zillow, Amazon, eBay, GitHub, npm, 정부 포털 등 100개 스킬을 제공한다.

  • 5

    Browserbase는 브라우저 에이전트의 병목이 추론 능력보다 재사용 가능한 메모리라고 주장한다.

  • Browserbase가 Browse.sh를 공개함 — 한 줄로 말하면 브라우저 에이전트용 공용 치트시트 카탈로그임

    • 출시 시점 기준으로 100개 이상 스킬이 있고, 에이전트는 CLI 한 줄로 설치해서 쓸 수 있음
    • 대상은 Claude Code, Cursor, Codex처럼 “모델이 브라우저를 직접 조작하는” 개발 환경임
  • 문제의식은 꽤 단순함: 브라우저 에이전트가 매번 같은 사이트를 처음 보는 사람처럼 군다는 것

    • 브라우저 열고, 버튼 찾고, 클릭하고, 응답 파싱하고, 세션 닫으면 끝
    • 다음 실행 때는 지난번에 알아낸 셀렉터, 숨은 API, 페이지 로딩 특성, 우회법을 거의 다시 배움
    • Browserbase는 이걸 “discovery tax”, 즉 탐색세라고 부름. 말이 좀 과하지만, 운영 비용 관점에선 진짜 세금 맞음
  • Browse.sh의 스킬은 벡터 DB나 스크린샷 더미가 아니라 그냥 읽을 수 있는 파일임

    • 기본 단위는 SKILL.md와 필요할 경우 보조 스크립트
    • 파일 안에는 특정 사이트를 다루는 절차, 주의할 점, API 엔드포인트, 셀렉터, 실패 시 fallback 전략이 들어감
    • 예를 들어 Craigslist 스킬은 검색 페이지가 자바스크립트로 렌더링된다는 점, sapi.craigslist.org라는 숨은 JSON API, 배열 디코딩 규칙, IP 기반 지역 제한 우회 같은 정보를 담는 식임

중요

> Browserbase가 공개한 Craigslist 벤치마크에서는 일반 에이전트 루프가 실행당 약 0.22달러였고, Browse.sh 스킬을 쓴 뒤 약 0.12달러로 내려갔다고 함. 비용 절감률은 45%.

  • 핵심 주장은 “브라우저 에이전트의 병목은 추론이 아니라 메모리”라는 쪽임

    • 모델이 아무리 똑똑해져도, 특정 사이트의 가장 빠른 경로를 매번 새로 찾아야 한다면 비용은 계속 샘
    • 반대로 한 번 알아낸 숨은 엔드포인트, 디코딩 테이블, 기다려야 하는 타이밍을 스킬에 넣으면 다음 실행부터는 바로 써먹을 수 있음
    • 이건 사람 개발자가 위키나 runbook에 운영 지식을 남기는 방식과 꽤 닮아 있음
  • Browse.sh는 두 덩어리로 구성됨

    • 하나는 browse.sh 웹 카탈로그. 사이트나 작업을 검색하고, 스킬 설명과 설치 명령을 확인하는 곳임
    • 다른 하나는 Browse CLI. npm i -g browse로 설치해서 브라우저 실행, 페이지 가져오기, 웹 검색, 스킬 로딩을 담당함
    • 에이전트는 필요한 스킬을 읽고, 거기에 적힌 워크플로와 예외 처리를 따라가며 결과를 구조화함
sequenceDiagram
    participant 개발자
    participant 에이전트
    participant 스킬
    participant 웹사이트
    participant Browse CLI
    개발자->>에이전트: 특정 사이트 작업 요청
    에이전트->>스킬: SKILL.md 로드
    에이전트->>Browse CLI: 브라우저 작업 실행
    Browse CLI->>웹사이트: 검색, 클릭, 데이터 요청
    웹사이트-->>Browse CLI: 페이지와 응답 반환
    Browse CLI-->>에이전트: 구조화된 결과 전달
    에이전트-->>개발자: 최종 결과 반환
  • 스킬은 Autobrowse라는 시스템을 거쳐 만들어진다고 함

    • 실제 사이트에서 실제 작업을 실행하고, 실행 trace를 분석하고, 전략을 반복 개선함
    • 운 좋게 한 번 성공한 흐름이 아니라, 여러 번 돌려도 통하는 경로로 수렴할 때까지 반복한다는 설명임
    • 수렴한 뒤에는 그 지식을 오래 쓸 수 있는 스킬 파일로 뽑아냄
  • 출시 범위는 꽤 넓음

    • 마켓플레이스: Craigslist, Zillow, Amazon, eBay
    • 음식·외식: OpenTable, DoorDash, McDonald's 온라인 주문
    • 여행: 항공권 검색, 호텔 예약, Airbnb
    • 정부: 연방 보조금 포털, 주 정부 프로그램 카탈로그
    • 개발 도구: GitHub, npm, 문서 사이트
    • 일부 파트너 스킬은 verified 배지도 붙음. Ramp, Lovable, Poke, Reducto 같은 이름이 언급됨
  • 직접 필요한 스킬이 없으면 생성도 가능하다고 함

    • 도메인과 작업을 입력하면 Autobrowse가 라이브 사이트에서 작업을 돌려보고 스킬을 생성함
    • 생성된 결과는 공개 카탈로그에 올라가 다른 사용자도 쓸 수 있는 구조
    • 많이 쓰일수록 스킬이 늘고, 스킬이 늘수록 카탈로그 가치가 커지는 네트워크 효과를 노리는 그림임
  • 이게 특히 꽂히는 팀은 명확함

    • 웹 기반 QA, 데이터 추출, 폼 입력, 모니터링을 에이전트로 자동화하는 AI 엔지니어
    • 블랙박스 에이전트 실행보다 감사 가능한 절차 파일이 필요한 제품팀
    • 토큰 비용과 지연시간을 줄여야 하는 플랫폼팀
    • Codex나 Claude Code 같은 도구에 웹 탐색 능력을 안정적으로 붙이고 싶은 개발자

ℹ️참고

> 여기서 말하는 “스킬”은 모델의 파라미터 안에 지식을 넣는 게 아니라, 사람이 읽고 고칠 수 있는 작업 지침을 외부 파일로 두는 방식임. 그래서 디버깅과 리뷰가 가능하다는 게 포인트임.

  • 물론 리스크도 있음. 웹사이트는 계속 바뀜
    • 셀렉터가 바뀌거나, 숨은 API가 막히거나, CAPTCHA 정책이 바뀌면 스킬도 낡음
    • 그래서 Browse.sh가 진짜 유용하려면 스킬 검증, 버전 관리, 실패 감지, 업데이트 흐름이 같이 중요해짐
    • 그래도 “에이전트가 매번 삽질한다”는 문제를 정면으로 잡은 건 꽤 실용적임

기술 맥락

  • 여기서 Browse.sh가 고른 선택은 “모델을 더 똑똑하게 만들자”가 아니라 “모델이 배운 실행 지식을 파일로 남기자”에 가까워요. 브라우저 자동화는 사이트별 예외가 너무 많아서, 추론 능력만으로 매번 해결하게 두면 비용과 시간이 계속 새거든요.

  • SKILL.md를 쓰는 이유도 그래서예요. 셀렉터, 숨은 API, 대기 시간, 실패 시 우회법 같은 지식은 코드로 박아도 되지만, 에이전트가 읽고 판단하려면 자연어와 스크립트가 섞인 플레이북이 더 다루기 쉬워요.

  • Craigslist 사례가 이 선택을 잘 보여줘요. 일반 에이전트는 실행할 때마다 자바스크립트 렌더링 페이지, 숨은 JSON API, 배열 디코딩 규칙을 다시 찾아야 했고 실행당 약 0.22달러가 들었어요. 스킬로 경로를 저장한 뒤에는 약 0.12달러로 줄었다는 게 핵심 수치예요.

  • 이 접근은 에이전트 운영을 “한 번 성공하면 끝”에서 “성공한 경로를 자산화”하는 쪽으로 바꿔요. QA, 데이터 수집, 폼 자동화처럼 같은 사이트를 반복해서 건드리는 팀일수록 효과가 커지는 이유가 여기에 있어요.

브라우저 에이전트가 실무에서 비싼 이유는 모델이 멍청해서만이 아니라, 매번 같은 웹사이트를 다시 학습하기 때문이다. Browse.sh는 그 반복 탐색 비용을 문서화된 실행 지식으로 바꾸려는 시도라서, 에이전트 자동화를 운영해본 팀이면 꽤 현실적인 문제의식으로 읽힌다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

유튜브, AI 생성 영상에 자동 라벨 붙인다

유튜브가 사실적으로 보이거나 의미 있게 AI로 변경·생성된 콘텐츠에 더 눈에 띄는 라벨을 적용하고, 제작자가 AI 사용 여부를 밝히지 않아도 내부 신호로 감지되면 자동 라벨을 붙이겠다고 밝혔다. 다만 라벨만으로 추천 노출이나 수익화 자격이 바뀌지는 않으며, 제작자는 YouTube Studio에서 잘못된 판정을 수정할 수 있다.

ai-ml

테크 CEO들의 'AI 만능론', 숫자는 아직 그렇게 말하지 않는다

테크 업계에서 AI를 이유로 한 대규모 감원과 조직 재편이 이어지는 가운데, Box 창업자 애런 레비는 CEO들이 실제 업무의 마지막 1마일을 모른 채 AI 에이전트의 능력을 과대평가하고 있다고 지적했다. 2026년 첫 5개월 동안 이미 11만5430명이 해고됐고, 여러 연구는 AI 도입이 체감 생산성만큼 실제 생산성을 끌어올렸다는 근거가 아직 약하다고 말한다.

ai-ml

오픈AI와 앤트로픽, 코딩 에이전트로 드디어 돈 되는 시장을 찾은 듯

사이먼 윌리슨은 오픈AI와 앤트로픽이 코딩 에이전트와 기업용 과금으로 진짜 제품-시장 적합성을 찾았다고 봐. 개인 구독자에게는 월 100달러 플랜이 싸게 느껴지지만, 기업 고객은 이제 사용량 기준 토큰 가격을 그대로 내기 시작했고 이게 대형 고객 예산을 빠르게 흔들고 있다는 얘기야.

ai-ml

컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력

컴팔이 실리콘밸리 기반 AI 인프라 기업 GMI 클라우드와 협력해 대규모 추론과 에이전틱 AI 워크로드에 맞춘 GPU 서버 인프라를 구축한다고 발표했어. COMPUTEX 2026에서는 NVIDIA HGX B300을 지원하는 Compal SGX30-2 같은 고성능 AI 서버 플랫폼도 선보일 예정이야.

ai-ml

AI 쓰면 편해진다더니, 직장인들은 ‘AI 과부하’에 지쳐가는 중

국내 직장인들이 AI 전환 압박, AI 답변 검증 부담, 대체 불안 때문에 피로감을 호소하고 있어. 중앙일보 설문에서는 5284명 중 31.6%가 ‘AI 답변 검증에 시간이 더 걸릴 때’를 가장 지치는 순간으로 꼽았고, 기업들은 무작정 AI 사용량을 밀어붙이는 방식에서 업무 방식 재설계로 넘어가야 한다는 지적이 나와.