---
title: "브라우저 에이전트가 매번 사이트를 새로 배우는 삽질, Browse.sh가 줄이겠다는 얘기"
published: 2026-05-18T21:51:53.000Z
canonical: https://jeff.news/article/2999
---
# 브라우저 에이전트가 매번 사이트를 새로 배우는 삽질, Browse.sh가 줄이겠다는 얘기

Browserbase가 100개 이상 브라우저 자동화 스킬을 모은 오픈 카탈로그 Browse.sh를 공개했다. 핵심은 에이전트가 웹사이트를 매번 처음부터 탐색하지 않게, 사이트별 셀렉터·숨은 API·예외 처리 같은 노하우를 SKILL.md로 저장해 재사용하자는 거다.

- Browserbase가 Browse.sh를 공개함 — 한 줄로 말하면 브라우저 에이전트용 공용 치트시트 카탈로그임
  - 출시 시점 기준으로 100개 이상 스킬이 있고, 에이전트는 CLI 한 줄로 설치해서 쓸 수 있음
  - 대상은 Claude Code, Cursor, Codex처럼 “모델이 브라우저를 직접 조작하는” 개발 환경임

- 문제의식은 꽤 단순함: 브라우저 에이전트가 매번 같은 사이트를 처음 보는 사람처럼 군다는 것
  - 브라우저 열고, 버튼 찾고, 클릭하고, 응답 파싱하고, 세션 닫으면 끝
  - 다음 실행 때는 지난번에 알아낸 셀렉터, 숨은 API, 페이지 로딩 특성, 우회법을 거의 다시 배움
  - Browserbase는 이걸 “discovery tax”, 즉 탐색세라고 부름. 말이 좀 과하지만, 운영 비용 관점에선 진짜 세금 맞음

- Browse.sh의 스킬은 벡터 DB나 스크린샷 더미가 아니라 그냥 읽을 수 있는 파일임
  - 기본 단위는 `SKILL.md`와 필요할 경우 보조 스크립트
  - 파일 안에는 특정 사이트를 다루는 절차, 주의할 점, API 엔드포인트, 셀렉터, 실패 시 fallback 전략이 들어감
  - 예를 들어 Craigslist 스킬은 검색 페이지가 자바스크립트로 렌더링된다는 점, `sapi.craigslist.org`라는 숨은 JSON API, 배열 디코딩 규칙, IP 기반 지역 제한 우회 같은 정보를 담는 식임

> [!IMPORTANT]
> Browserbase가 공개한 Craigslist 벤치마크에서는 일반 에이전트 루프가 실행당 약 0.22달러였고, Browse.sh 스킬을 쓴 뒤 약 0.12달러로 내려갔다고 함. 비용 절감률은 45%.

- 핵심 주장은 “브라우저 에이전트의 병목은 추론이 아니라 메모리”라는 쪽임
  - 모델이 아무리 똑똑해져도, 특정 사이트의 가장 빠른 경로를 매번 새로 찾아야 한다면 비용은 계속 샘
  - 반대로 한 번 알아낸 숨은 엔드포인트, 디코딩 테이블, 기다려야 하는 타이밍을 스킬에 넣으면 다음 실행부터는 바로 써먹을 수 있음
  - 이건 사람 개발자가 위키나 runbook에 운영 지식을 남기는 방식과 꽤 닮아 있음

- Browse.sh는 두 덩어리로 구성됨
  - 하나는 `browse.sh` 웹 카탈로그. 사이트나 작업을 검색하고, 스킬 설명과 설치 명령을 확인하는 곳임
  - 다른 하나는 Browse CLI. `npm i -g browse`로 설치해서 브라우저 실행, 페이지 가져오기, 웹 검색, 스킬 로딩을 담당함
  - 에이전트는 필요한 스킬을 읽고, 거기에 적힌 워크플로와 예외 처리를 따라가며 결과를 구조화함

```mermaid
sequenceDiagram
    participant 개발자
    participant 에이전트
    participant 스킬
    participant 웹사이트
    participant Browse CLI
    개발자->>에이전트: 특정 사이트 작업 요청
    에이전트->>스킬: SKILL.md 로드
    에이전트->>Browse CLI: 브라우저 작업 실행
    Browse CLI->>웹사이트: 검색, 클릭, 데이터 요청
    웹사이트-->>Browse CLI: 페이지와 응답 반환
    Browse CLI-->>에이전트: 구조화된 결과 전달
    에이전트-->>개발자: 최종 결과 반환
```

- 스킬은 Autobrowse라는 시스템을 거쳐 만들어진다고 함
  - 실제 사이트에서 실제 작업을 실행하고, 실행 trace를 분석하고, 전략을 반복 개선함
  - 운 좋게 한 번 성공한 흐름이 아니라, 여러 번 돌려도 통하는 경로로 수렴할 때까지 반복한다는 설명임
  - 수렴한 뒤에는 그 지식을 오래 쓸 수 있는 스킬 파일로 뽑아냄

- 출시 범위는 꽤 넓음
  - 마켓플레이스: Craigslist, Zillow, Amazon, eBay
  - 음식·외식: OpenTable, DoorDash, McDonald's 온라인 주문
  - 여행: 항공권 검색, 호텔 예약, Airbnb
  - 정부: 연방 보조금 포털, 주 정부 프로그램 카탈로그
  - 개발 도구: GitHub, npm, 문서 사이트
  - 일부 파트너 스킬은 verified 배지도 붙음. Ramp, Lovable, Poke, Reducto 같은 이름이 언급됨

- 직접 필요한 스킬이 없으면 생성도 가능하다고 함
  - 도메인과 작업을 입력하면 Autobrowse가 라이브 사이트에서 작업을 돌려보고 스킬을 생성함
  - 생성된 결과는 공개 카탈로그에 올라가 다른 사용자도 쓸 수 있는 구조
  - 많이 쓰일수록 스킬이 늘고, 스킬이 늘수록 카탈로그 가치가 커지는 네트워크 효과를 노리는 그림임

- 이게 특히 꽂히는 팀은 명확함
  - 웹 기반 QA, 데이터 추출, 폼 입력, 모니터링을 에이전트로 자동화하는 AI 엔지니어
  - 블랙박스 에이전트 실행보다 감사 가능한 절차 파일이 필요한 제품팀
  - 토큰 비용과 지연시간을 줄여야 하는 플랫폼팀
  - Codex나 Claude Code 같은 도구에 웹 탐색 능력을 안정적으로 붙이고 싶은 개발자

> [!NOTE]
> 여기서 말하는 “스킬”은 모델의 파라미터 안에 지식을 넣는 게 아니라, 사람이 읽고 고칠 수 있는 작업 지침을 외부 파일로 두는 방식임. 그래서 디버깅과 리뷰가 가능하다는 게 포인트임.

- 물론 리스크도 있음. 웹사이트는 계속 바뀜
  - 셀렉터가 바뀌거나, 숨은 API가 막히거나, CAPTCHA 정책이 바뀌면 스킬도 낡음
  - 그래서 Browse.sh가 진짜 유용하려면 스킬 검증, 버전 관리, 실패 감지, 업데이트 흐름이 같이 중요해짐
  - 그래도 “에이전트가 매번 삽질한다”는 문제를 정면으로 잡은 건 꽤 실용적임

---

## 기술 맥락

- 여기서 Browse.sh가 고른 선택은 “모델을 더 똑똑하게 만들자”가 아니라 “모델이 배운 실행 지식을 파일로 남기자”에 가까워요. 브라우저 자동화는 사이트별 예외가 너무 많아서, 추론 능력만으로 매번 해결하게 두면 비용과 시간이 계속 새거든요.

- SKILL.md를 쓰는 이유도 그래서예요. 셀렉터, 숨은 API, 대기 시간, 실패 시 우회법 같은 지식은 코드로 박아도 되지만, 에이전트가 읽고 판단하려면 자연어와 스크립트가 섞인 플레이북이 더 다루기 쉬워요.

- Craigslist 사례가 이 선택을 잘 보여줘요. 일반 에이전트는 실행할 때마다 자바스크립트 렌더링 페이지, 숨은 JSON API, 배열 디코딩 규칙을 다시 찾아야 했고 실행당 약 0.22달러가 들었어요. 스킬로 경로를 저장한 뒤에는 약 0.12달러로 줄었다는 게 핵심 수치예요.

- 이 접근은 에이전트 운영을 “한 번 성공하면 끝”에서 “성공한 경로를 자산화”하는 쪽으로 바꿔요. QA, 데이터 수집, 폼 자동화처럼 같은 사이트를 반복해서 건드리는 팀일수록 효과가 커지는 이유가 여기에 있어요.

## 핵심 포인트

- Browse.sh는 브라우저 에이전트용 스킬 카탈로그와 npm 기반 Browse CLI로 구성된다.
- 스킬은 특정 사이트 작업을 반복하기 위한 SKILL.md와 보조 스크립트 묶음이다.
- Craigslist 벤치마크에서 일반 에이전트 루프는 실행당 약 0.22달러, Browse.sh 스킬 사용 후에는 약 0.12달러로 45% 비용이 줄었다.
- 출시 시점에는 Craigslist, Zillow, Amazon, eBay, GitHub, npm, 정부 포털 등 100개 스킬을 제공한다.
- Browserbase는 브라우저 에이전트의 병목이 추론 능력보다 재사용 가능한 메모리라고 주장한다.

## 인사이트

브라우저 에이전트가 실무에서 비싼 이유는 모델이 멍청해서만이 아니라, 매번 같은 웹사이트를 다시 학습하기 때문이다. Browse.sh는 그 반복 탐색 비용을 문서화된 실행 지식으로 바꾸려는 시도라서, 에이전트 자동화를 운영해본 팀이면 꽤 현실적인 문제의식으로 읽힌다.