본문으로 건너뛰기
피드

Rover — 스크립트 태그 한 줄로 사이트에 AI 에이전트를 심는 DOM 네이티브 접근

ai-ml 약 4분
vote
0
댓글
북마크

아마존 Rufus가 2.5억 사용자·$120억 추가 매출을 증명했지만 일반 사이트는 따라하기 어려움. Rover는 DOM을 시맨틱하게 읽어 스크린샷 없이 UI 조작하는 임베디드 AI 에이전트. WebBench 81.39% 달성, Google WebMCP와 대비되는 접근.

  • 1

    아마존 Rufus: 2.5억 사용자, 전환율 3.5x, $120억 추가 매출

  • 2

    Rover: DOM 네이티브, 스크린샷·RAG·API 노출 없이 작동

  • 3

    WebBench 81.39%로 스크린샷 기반 에이전트 대비 우위 주장

  • 4

    Google WebMCP와 대비: 사이트 에이전트 vs 구글 에이전트

  • 5

    21,000+ 사용자, 150만+ 워크플로우 실행

  • 아마존의 AI 쇼핑 어시스턴트 Rufus가 2년 만에 활성 사용자 2.5억 명 돌파. Rufus 사용 고객은 구매 완료 확률이 60% 높고, 2024년 블랙프라이데이에 Rufus 세션의 전환율은 기본 대비 3.5배. 2025년 기준 약 $120억 추가 매출 발생

  • 문제는 Rufus가 수천 명의 엔지니어, 수십 년 축적 카탈로그 데이터, 약 $2.85억의 운영비가 들었다는 것. 나머지 10억 개 이상의 웹사이트가 이걸 어떻게 따라하냐는 게 핵심 질문

기존 선택지의 한계

  • 직접 구축: RAG 파이프라인, 커스텀 코드 훅, 스택 전반 통합 + 지속적 유지보수. 소규모 비즈니스에는 비현실적
  • Intercom, Drift 등 서포트 챗봇: 티켓 50% 감소 효과는 있지만, 질문 답변이나 서포트 API 호출만 가능. 체크아웃 안내, 버튼 클릭, 폼 작성, 제품 데모는 못 함. 해상도당 $0.99 과금
  • Google WebMCP: 사이트의 내부 API를 구조화된 도구로 노출하면 Chrome AI 에이전트가 직접 호출하는 프로토콜. 하지만 통합 작업과 스키마 유지는 사이트 측이 하고, 사용자가 실제로 대화하는 건 Chrome 내 Google 에이전트. 즉 구글이 사이트와 유저 사이를 더 벌리는 구조

Rover의 접근: DOM 네이티브

  • Rover는 스크립트 태그 한 줄을 사이트에 삽입하면 작동하는 임베디드 AI 에이전트. RAG 파이프라인 없음, API 노출 없음, 스키마 유지보수 없음

  • 스크린샷 기반 에이전트(Operator, Computer Use 등)와 다르게, 라이브 DOM을 시맨틱하게 읽음. "장바구니 담기"가 구매 액션이고, 사이드바가 네비게이션이고, 모달이 폼이라는 걸 이해함. 비전 모델로 픽셀 좌표 추측하는 방식이 아님

  • WebBench에서 81.39% 달성, 테스트한 모든 스크린샷 기반 접근보다 높다고 주장

  • 실제 동작 예시: 사용자가 "체크아웃 도와줘" → Rover가 장바구니 추가, 체크아웃 이동, 정보 입력, 확인까지 UI 상에서 직접 수행. 사용자가 화면에서 진행 과정을 볼 수 있음

  • 2년간 DOM 네이티브 아키텍처와 Smart DOM Trees를 개발했고, 21,000+ 사용자, 150만+ 워크플로우 실행 실적이 있다고 함

ℹ️참고

> Show HN 글이라 셀프 프로모션이 강하지만, Google WebMCP가 "구글의 에이전트가 사용자와 대화"하는 구조 vs Rover가 "사이트의 에이전트가 사이트 UI에서 직접 행동"하는 구조라는 대비는 꽤 흥미로운 관점

Google WebMCP가 '구글의 에이전트'를 만드는 반면 Rover는 '사이트의 에이전트'를 만든다는 프레이밍이 흥미로움. Show HN이라 셀프 프로모션은 감안해야 함.

댓글

댓글

댓글을 불러오는 중...

ai-ml

유튜브, AI 생성 영상에 자동 라벨 붙인다

유튜브가 사실적으로 보이거나 의미 있게 AI로 변경·생성된 콘텐츠에 더 눈에 띄는 라벨을 적용하고, 제작자가 AI 사용 여부를 밝히지 않아도 내부 신호로 감지되면 자동 라벨을 붙이겠다고 밝혔다. 다만 라벨만으로 추천 노출이나 수익화 자격이 바뀌지는 않으며, 제작자는 YouTube Studio에서 잘못된 판정을 수정할 수 있다.

ai-ml

테크 CEO들의 'AI 만능론', 숫자는 아직 그렇게 말하지 않는다

테크 업계에서 AI를 이유로 한 대규모 감원과 조직 재편이 이어지는 가운데, Box 창업자 애런 레비는 CEO들이 실제 업무의 마지막 1마일을 모른 채 AI 에이전트의 능력을 과대평가하고 있다고 지적했다. 2026년 첫 5개월 동안 이미 11만5430명이 해고됐고, 여러 연구는 AI 도입이 체감 생산성만큼 실제 생산성을 끌어올렸다는 근거가 아직 약하다고 말한다.

ai-ml

오픈AI와 앤트로픽, 코딩 에이전트로 드디어 돈 되는 시장을 찾은 듯

사이먼 윌리슨은 오픈AI와 앤트로픽이 코딩 에이전트와 기업용 과금으로 진짜 제품-시장 적합성을 찾았다고 봐. 개인 구독자에게는 월 100달러 플랜이 싸게 느껴지지만, 기업 고객은 이제 사용량 기준 토큰 가격을 그대로 내기 시작했고 이게 대형 고객 예산을 빠르게 흔들고 있다는 얘기야.

ai-ml

컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력

컴팔이 실리콘밸리 기반 AI 인프라 기업 GMI 클라우드와 협력해 대규모 추론과 에이전틱 AI 워크로드에 맞춘 GPU 서버 인프라를 구축한다고 발표했어. COMPUTEX 2026에서는 NVIDIA HGX B300을 지원하는 Compal SGX30-2 같은 고성능 AI 서버 플랫폼도 선보일 예정이야.

ai-ml

AI 쓰면 편해진다더니, 직장인들은 ‘AI 과부하’에 지쳐가는 중

국내 직장인들이 AI 전환 압박, AI 답변 검증 부담, 대체 불안 때문에 피로감을 호소하고 있어. 중앙일보 설문에서는 5284명 중 31.6%가 ‘AI 답변 검증에 시간이 더 걸릴 때’를 가장 지치는 순간으로 꼽았고, 기업들은 무작정 AI 사용량을 밀어붙이는 방식에서 업무 방식 재설계로 넘어가야 한다는 지적이 나와.