---
title: "개인정보 삭제 요청을 500개 데이터 브로커에 자동으로 돌리는 오픈소스 도구 등장"
published: 2026-05-18T11:32:42.000Z
canonical: https://jeff.news/article/2840
---
# 개인정보 삭제 요청을 500개 데이터 브로커에 자동으로 돌리는 오픈소스 도구 등장

auto-identity-remove는 사람 검색 사이트와 데이터 브로커 500곳 이상에 개인정보 삭제 요청을 자동 제출하는 오픈소스 도구다. Playwright로 브라우저를 돌리고, 캡차는 CapSolver로 풀며, 이미 처리한 브로커는 state.json으로 추적해 매달 재시도 주기를 관리한다.

- HN에 올라온 auto-identity-remove는 데이터 브로커 개인정보 삭제 요청을 자동으로 돌리는 오픈소스 도구임
  - 대상은 사람 검색 사이트와 데이터 브로커 데이터베이스 500곳 이상
  - 매달 이름과 주(State)를 기준으로 검색하고, 내 프로필을 찾고, 옵트아웃 폼을 채워 제출함
  - 지원 환경은 macOS, 리눅스, 윈도우이고 Node.js 18 이상과 Playwright 브라우저가 필요함

- 자동화 흐름이 꽤 현실적으로 짜여 있음
  - 이미 삭제 요청을 보낸 브로커는 state.json에 기록해서 매번 중복 제출하지 않음
  - 기본 재확인 주기는 90일임. 브로커들이 상위 소스에서 데이터를 다시 가져와 재등록하는 일이 흔하다는 전제임
  - 실행이 끝나면 iMessage나 웹훅으로 결과 요약을 보낼 수 있음

- 캡차는 CapSolver로 풀 수 있게 해놨음
  - 비용은 풀이 1회당 약 0.001달러 수준이라고 설명함
  - CapSolver를 쓰지 않으면 캡차가 걸린 사이트는 수동 목록으로 넘기거나 브라우저에서 열어 사용자가 직접 처리하게 함
  - 도커 실행도 지원해서 맥이 없어도 공식 Playwright 이미지 기반으로 돌릴 수 있음

> [!WARNING]
> 이 도구에서 ‘제출 성공’은 ‘삭제 완료’가 아님. 브로커가 폼을 받았다는 뜻일 뿐이라, 이메일 확인 링크나 재검색 검증이 따로 필요함

- 브로커 지원은 두 단계로 나뉨
  - 명시 매핑된 브로커는 42개임. Spokeo, WhitePages, FastPeopleSearch, BeenVerified, Acxiom, LexisNexis, ZoomInfo, Clearbit 등이 포함됨
  - 추가로 약 490개 브로커는 일반 러너가 휴리스틱으로 처리함
  - 일반 러너는 ‘Do Not Sell My Personal Information’ 클릭, OneTrust·TrustArc·Osano 프라이버시 매니저, 일반 옵트아웃 폼, DSAR 링크 탐색을 순서대로 시도함

- 상태 출력도 꽤 세분화돼 있음
  - 제출됨, 이메일 확인 대기, 최근 처리되어 건너뜀, 검색 결과 없음, 수동 처리 필요, 오류, 죽은 URL 같은 상태를 구분함
  - 검증 모드인 `node watcher.js --verify`는 이전에 성공 기록이 있는 브로커를 다시 검색해서 아직 이름이 보이는지 확인함
  - 단, 검색 폼이 있는 브로커만 자동 검증 가능하고 직접 폼·이메일 방식은 검증 불가로 남음

- 흥미로운데 위험한 실험 기능도 있음. `--pollute N` 모드는 가짜 인물 정보를 일부 브로커에 제출하는 기능임
  - 기본값은 꺼져 있고, 문서에서도 약관 위반·윤리 문제·법적 리스크가 있다고 경고함
  - 현재 ThatsThem, SearchPeopleFree, PeopleSearchNow, InfoTracer, SocialCatfish 같은 일부 직접 폼 브로커만 대상으로 잡혀 있음
  - 개인정보 삭제 자동화와 데이터 오염 실험을 한 프로젝트 안에 둔 셈이라, 실사용자는 이 기능을 건드리지 않는 게 맞아 보임

- 한국 개발자에게도 의미가 있는 건 ‘개인정보 삭제 자동화’ 자체보다 구현 패턴임
  - 웹 자동화, 캡차 처리, 상태 추적, 재시도 윈도우, 검증 리포트, 도커 실행, 웹훅 알림까지 운영 자동화 요소가 한 세트로 들어 있음
  - 데이터 브로커 생태계는 미국 중심이지만, 브로커별로 깨지는 폼 자동화를 어떻게 관리할지 보는 재미가 있음

---

## 기술 맥락

- 이 프로젝트가 Playwright를 고른 이유는 데이터 브로커 사이트들이 정형 API를 주지 않기 때문이에요. 검색하고, 목록에서 내 프로필을 찾고, 폼을 채우고, 버튼을 누르는 흐름이 전부 웹 UI에 묶여 있어서 실제 브라우저 자동화가 제일 덜 깨지는 선택이에요.

- state.json이 중요한 이유는 삭제 요청이 한 번으로 끝나지 않기 때문이에요. 브로커가 데이터를 다시 수집할 수 있고, 어떤 요청은 이메일 확인 전까지 반쯤 끝난 상태로 남거든요. 그래서 성공 시점, 재확인 주기, 보류 상태를 계속 들고 가야 해요.

- 명시 매핑 42개와 휴리스틱 490개를 나눈 것도 현실적인 설계예요. 자주 쓰는 브로커는 셀렉터를 직접 관리하고, 나머지는 ‘Do Not Sell’ 버튼이나 프라이버시 매니저 같은 패턴을 찾아 best-effort로 처리하는 거죠.

- 다만 자동화가 곧 신뢰성은 아니에요. 사이트 UI가 바뀌면 셀렉터가 깨지고, 제출 성공이 삭제 완료를 보장하지도 않아요. 그래서 verify 모드와 STATUS.md처럼 신뢰도 레이어를 따로 둔 게 이 프로젝트의 실무적인 포인트예요.

## 핵심 포인트

- 500개 이상 데이터 브로커와 사람 검색 사이트에 개인정보 삭제 요청을 자동화함
- 명시적으로 매핑된 브로커 42개와 휴리스틱 기반 일반 러너 약 490개를 함께 처리함
- CapSolver를 쓰면 캡차 1회당 약 0.001달러 비용으로 자동 풀이가 가능함
- 제출 성공이 삭제 보장을 뜻하지는 않으며 별도 검증 모드가 제공됨
- 실험적 노이즈 모드는 약관·윤리·법적 리스크가 있어 기본 비활성화됨

## 인사이트

개인정보 삭제 대행 서비스를 직접 돌려보겠다는 개발자스러운 접근이다. 다만 ‘자동 제출됨’과 ‘실제로 삭제됨’ 사이에 큰 간극이 있어서, 자동화보다 상태 추적과 검증 로직이 더 중요한 프로젝트로 보임.
