브라우저 에이전트가 매번 사이트를 새로 배우는 삽질, Browse.sh가 줄이겠다는 얘기

ai-ml 2026-05-18 약 9분

 tags

#agents #browser #cli #playwright #automation

vote

북마크

Browserbase가 100개 이상 브라우저 자동화 스킬을 모은 오픈 카탈로그 Browse.sh를 공개했다. 핵심은 에이전트가 웹사이트를 매번 처음부터 탐색하지 않게, 사이트별 셀렉터·숨은 API·예외 처리 같은 노하우를 SKILL.md로 저장해 재사용하자는 거다.

1
Browse.sh는 브라우저 에이전트용 스킬 카탈로그와 npm 기반 Browse CLI로 구성된다.
2
스킬은 특정 사이트 작업을 반복하기 위한 SKILL.md와 보조 스크립트 묶음이다.
3
Craigslist 벤치마크에서 일반 에이전트 루프는 실행당 약 0.22달러, Browse.sh 스킬 사용 후에는 약 0.12달러로 45% 비용이 줄었다.
4
출시 시점에는 Craigslist, Zillow, Amazon, eBay, GitHub, npm, 정부 포털 등 100개 스킬을 제공한다.
5
Browserbase는 브라우저 에이전트의 병목이 추론 능력보다 재사용 가능한 메모리라고 주장한다.

Browserbase가 Browse.sh를 공개함 — 한 줄로 말하면 브라우저 에이전트용 공용 치트시트 카탈로그임
- 출시 시점 기준으로 100개 이상 스킬이 있고, 에이전트는 CLI 한 줄로 설치해서 쓸 수 있음
- 대상은 Claude Code, Cursor, Codex처럼 “모델이 브라우저를 직접 조작하는” 개발 환경임
문제의식은 꽤 단순함: 브라우저 에이전트가 매번 같은 사이트를 처음 보는 사람처럼 군다는 것
- 브라우저 열고, 버튼 찾고, 클릭하고, 응답 파싱하고, 세션 닫으면 끝
- 다음 실행 때는 지난번에 알아낸 셀렉터, 숨은 API, 페이지 로딩 특성, 우회법을 거의 다시 배움
- Browserbase는 이걸 “discovery tax”, 즉 탐색세라고 부름. 말이 좀 과하지만, 운영 비용 관점에선 진짜 세금 맞음
Browse.sh의 스킬은 벡터 DB나 스크린샷 더미가 아니라 그냥 읽을 수 있는 파일임
- 기본 단위는 SKILL.md와 필요할 경우 보조 스크립트
- 파일 안에는 특정 사이트를 다루는 절차, 주의할 점, API 엔드포인트, 셀렉터, 실패 시 fallback 전략이 들어감
- 예를 들어 Craigslist 스킬은 검색 페이지가 자바스크립트로 렌더링된다는 점, sapi.craigslist.org라는 숨은 JSON API, 배열 디코딩 규칙, IP 기반 지역 제한 우회 같은 정보를 담는 식임

❗중요

> Browserbase가 공개한 Craigslist 벤치마크에서는 일반 에이전트 루프가 실행당 약 0.22달러였고, Browse.sh 스킬을 쓴 뒤 약 0.12달러로 내려갔다고 함. 비용 절감률은 45%.

핵심 주장은 “브라우저 에이전트의 병목은 추론이 아니라 메모리”라는 쪽임
- 모델이 아무리 똑똑해져도, 특정 사이트의 가장 빠른 경로를 매번 새로 찾아야 한다면 비용은 계속 샘
- 반대로 한 번 알아낸 숨은 엔드포인트, 디코딩 테이블, 기다려야 하는 타이밍을 스킬에 넣으면 다음 실행부터는 바로 써먹을 수 있음
- 이건 사람 개발자가 위키나 runbook에 운영 지식을 남기는 방식과 꽤 닮아 있음
Browse.sh는 두 덩어리로 구성됨
- 하나는 browse.sh 웹 카탈로그. 사이트나 작업을 검색하고, 스킬 설명과 설치 명령을 확인하는 곳임
- 다른 하나는 Browse CLI. npm i -g browse로 설치해서 브라우저 실행, 페이지 가져오기, 웹 검색, 스킬 로딩을 담당함
- 에이전트는 필요한 스킬을 읽고, 거기에 적힌 워크플로와 예외 처리를 따라가며 결과를 구조화함

sequenceDiagram
    participant 개발자
    participant 에이전트
    participant 스킬
    participant 웹사이트
    participant Browse CLI
    개발자->>에이전트: 특정 사이트 작업 요청
    에이전트->>스킬: SKILL.md 로드
    에이전트->>Browse CLI: 브라우저 작업 실행
    Browse CLI->>웹사이트: 검색, 클릭, 데이터 요청
    웹사이트-->>Browse CLI: 페이지와 응답 반환
    Browse CLI-->>에이전트: 구조화된 결과 전달
    에이전트-->>개발자: 최종 결과 반환

스킬은 Autobrowse라는 시스템을 거쳐 만들어진다고 함
- 실제 사이트에서 실제 작업을 실행하고, 실행 trace를 분석하고, 전략을 반복 개선함
- 운 좋게 한 번 성공한 흐름이 아니라, 여러 번 돌려도 통하는 경로로 수렴할 때까지 반복한다는 설명임
- 수렴한 뒤에는 그 지식을 오래 쓸 수 있는 스킬 파일로 뽑아냄
출시 범위는 꽤 넓음
- 마켓플레이스: Craigslist, Zillow, Amazon, eBay
- 음식·외식: OpenTable, DoorDash, McDonald's 온라인 주문
- 여행: 항공권 검색, 호텔 예약, Airbnb
- 정부: 연방 보조금 포털, 주 정부 프로그램 카탈로그
- 개발 도구: GitHub, npm, 문서 사이트
- 일부 파트너 스킬은 verified 배지도 붙음. Ramp, Lovable, Poke, Reducto 같은 이름이 언급됨
직접 필요한 스킬이 없으면 생성도 가능하다고 함
- 도메인과 작업을 입력하면 Autobrowse가 라이브 사이트에서 작업을 돌려보고 스킬을 생성함
- 생성된 결과는 공개 카탈로그에 올라가 다른 사용자도 쓸 수 있는 구조
- 많이 쓰일수록 스킬이 늘고, 스킬이 늘수록 카탈로그 가치가 커지는 네트워크 효과를 노리는 그림임
이게 특히 꽂히는 팀은 명확함
- 웹 기반 QA, 데이터 추출, 폼 입력, 모니터링을 에이전트로 자동화하는 AI 엔지니어
- 블랙박스 에이전트 실행보다 감사 가능한 절차 파일이 필요한 제품팀
- 토큰 비용과 지연시간을 줄여야 하는 플랫폼팀
- Codex나 Claude Code 같은 도구에 웹 탐색 능력을 안정적으로 붙이고 싶은 개발자

ℹ️참고

> 여기서 말하는 “스킬”은 모델의 파라미터 안에 지식을 넣는 게 아니라, 사람이 읽고 고칠 수 있는 작업 지침을 외부 파일로 두는 방식임. 그래서 디버깅과 리뷰가 가능하다는 게 포인트임.

물론 리스크도 있음. 웹사이트는 계속 바뀜
- 셀렉터가 바뀌거나, 숨은 API가 막히거나, CAPTCHA 정책이 바뀌면 스킬도 낡음
- 그래서 Browse.sh가 진짜 유용하려면 스킬 검증, 버전 관리, 실패 감지, 업데이트 흐름이 같이 중요해짐
- 그래도 “에이전트가 매번 삽질한다”는 문제를 정면으로 잡은 건 꽤 실용적임

기술 맥락

여기서 Browse.sh가 고른 선택은 “모델을 더 똑똑하게 만들자”가 아니라 “모델이 배운 실행 지식을 파일로 남기자”에 가까워요. 브라우저 자동화는 사이트별 예외가 너무 많아서, 추론 능력만으로 매번 해결하게 두면 비용과 시간이 계속 새거든요.
SKILL.md를 쓰는 이유도 그래서예요. 셀렉터, 숨은 API, 대기 시간, 실패 시 우회법 같은 지식은 코드로 박아도 되지만, 에이전트가 읽고 판단하려면 자연어와 스크립트가 섞인 플레이북이 더 다루기 쉬워요.
Craigslist 사례가 이 선택을 잘 보여줘요. 일반 에이전트는 실행할 때마다 자바스크립트 렌더링 페이지, 숨은 JSON API, 배열 디코딩 규칙을 다시 찾아야 했고 실행당 약 0.22달러가 들었어요. 스킬로 경로를 저장한 뒤에는 약 0.12달러로 줄었다는 게 핵심 수치예요.
이 접근은 에이전트 운영을 “한 번 성공하면 끝”에서 “성공한 경로를 자산화”하는 쪽으로 바꿔요. QA, 데이터 수집, 폼 자동화처럼 같은 사이트를 반복해서 건드리는 팀일수록 효과가 커지는 이유가 여기에 있어요.

브라우저 에이전트가 실무에서 비싼 이유는 모델이 멍청해서만이 아니라, 매번 같은 웹사이트를 다시 학습하기 때문이다. Browse.sh는 그 반복 탐색 비용을 문서화된 실행 지식으로 바꾸려는 시도라서, 에이전트 자동화를 운영해본 팀이면 꽤 현실적인 문제의식으로 읽힌다.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-13

애플 새 음성 인식 API, 온디바이스 영어 전사에서 위스퍼 스몰까지 이겼다

애플의 새 음성 인식 API인 스피치애널라이저가 리브리스피치 벤치마크에서 기존 SFSpeechRecognizer는 물론 위스퍼 스몰보다도 낮은 단어 오류율을 기록했어. 깨끗한 음성에서는 2.12%, noisy 음성에서는 4.56%로, 기존 애플 API 대비 오류율을 3.5~4배 줄였고 위스퍼 스몰보다 약 3배 빠르게 돌았어. 다만 영어·애플 플랫폼·OS 26 조건의 결과라, 다국어와 크로스플랫폼에서는 여전히 위스퍼의 장점이 남아 있어.

ai-ml 2026-07-13

AI를 진짜 잘 쓰는 기업, 미국 증시에서 연 30% 프리미엄 받는다는 연구

예일대와 로체스터대 연구진이 기업의 실제 대형 언어 모델 사용 데이터를 분석했더니, AI 활용도가 높은 상위 20% 기업이 하위 20%보다 주당 평균 0.64% 높은 초과수익률을 냈다. 단순히 AI 기업이냐가 아니라, 업무에 AI를 얼마나 깊게 쓰는지가 시장 가치에 반영되고 있다는 얘기다.

ai-ml 2026-07-13

ZTE, AI 에이전트폰으로 스마트폰 재도전…진짜 승부처는 앱 생태계

ZTE가 바이트댄스의 더우바오를 탑재한 AI 에이전트 스마트폰으로 시장 재진입을 노린다. 핵심은 사용자가 명령하면 AI가 여러 앱을 직접 열고 조작하는 방식인데, 위챗·타오바오·알리페이 같은 플랫폼과 충돌하면서 생태계 문제가 가장 큰 변수로 떠올랐다.

ai-ml 2026-07-13

노벨상 학자들까지 “AI 경제 충격, 지금 제도 안 만들면 늦다”

노벨 경제학상 수상자 15명을 포함한 학자와 기술 업계 인사 약 200명이 AI가 향후 10년 안에 경제를 급격히 바꿀 수 있다며 정책 대응을 촉구했다. 이들은 산업혁명보다 큰 변화가 훨씬 짧은 시간에 올 수 있고, 대규모 일자리 대체와 생활 수준 향상이라는 양면성이 동시에 존재한다고 봤다.

ai-ml 2026-07-13

NHN, AI 데이터센터 매출 기대감에 목표주가 5만6000원으로 상향

한국투자증권이 NHN의 목표주가를 4만5000원에서 5만6000원으로 올리고 투자의견 매수를 유지했다. 핵심 근거는 양평 AI 데이터센터 가동, 공공·민간 GPU 클러스터 수주 확대, 클라우드 사업부 신규 매출 반영이다.

브라우저 에이전트가 매번 사이트를 새로 배우는 삽질, Browse.sh가 줄이겠다는 얘기

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

브라우저 에이전트가 매번 사이트를 새로 배우는 삽질, Browse.sh가 줄이겠다는 얘기

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사