개인정보 삭제 요청을 500개 데이터 브로커에 자동으로 돌리는 오픈소스 도구 등장

security 2026-05-18 약 6분

 tags

#privacy #playwright #automation #captcha #nodejs

vote

북마크

auto-identity-remove는 사람 검색 사이트와 데이터 브로커 500곳 이상에 개인정보 삭제 요청을 자동 제출하는 오픈소스 도구다. Playwright로 브라우저를 돌리고, 캡차는 CapSolver로 풀며, 이미 처리한 브로커는 state.json으로 추적해 매달 재시도 주기를 관리한다.

1
500개 이상 데이터 브로커와 사람 검색 사이트에 개인정보 삭제 요청을 자동화함
2
명시적으로 매핑된 브로커 42개와 휴리스틱 기반 일반 러너 약 490개를 함께 처리함
3
CapSolver를 쓰면 캡차 1회당 약 0.001달러 비용으로 자동 풀이가 가능함
4
제출 성공이 삭제 보장을 뜻하지는 않으며 별도 검증 모드가 제공됨
5
실험적 노이즈 모드는 약관·윤리·법적 리스크가 있어 기본 비활성화됨

HN에 올라온 auto-identity-remove는 데이터 브로커 개인정보 삭제 요청을 자동으로 돌리는 오픈소스 도구임
- 대상은 사람 검색 사이트와 데이터 브로커 데이터베이스 500곳 이상
- 매달 이름과 주(State)를 기준으로 검색하고, 내 프로필을 찾고, 옵트아웃 폼을 채워 제출함
- 지원 환경은 macOS, 리눅스, 윈도우이고 Node.js 18 이상과 Playwright 브라우저가 필요함
자동화 흐름이 꽤 현실적으로 짜여 있음
- 이미 삭제 요청을 보낸 브로커는 state.json에 기록해서 매번 중복 제출하지 않음
- 기본 재확인 주기는 90일임. 브로커들이 상위 소스에서 데이터를 다시 가져와 재등록하는 일이 흔하다는 전제임
- 실행이 끝나면 iMessage나 웹훅으로 결과 요약을 보낼 수 있음
캡차는 CapSolver로 풀 수 있게 해놨음
- 비용은 풀이 1회당 약 0.001달러 수준이라고 설명함
- CapSolver를 쓰지 않으면 캡차가 걸린 사이트는 수동 목록으로 넘기거나 브라우저에서 열어 사용자가 직접 처리하게 함
- 도커 실행도 지원해서 맥이 없어도 공식 Playwright 이미지 기반으로 돌릴 수 있음

⚠️주의

> 이 도구에서 ‘제출 성공’은 ‘삭제 완료’가 아님. 브로커가 폼을 받았다는 뜻일 뿐이라, 이메일 확인 링크나 재검색 검증이 따로 필요함

브로커 지원은 두 단계로 나뉨
- 명시 매핑된 브로커는 42개임. Spokeo, WhitePages, FastPeopleSearch, BeenVerified, Acxiom, LexisNexis, ZoomInfo, Clearbit 등이 포함됨
- 추가로 약 490개 브로커는 일반 러너가 휴리스틱으로 처리함
- 일반 러너는 ‘Do Not Sell My Personal Information’ 클릭, OneTrust·TrustArc·Osano 프라이버시 매니저, 일반 옵트아웃 폼, DSAR 링크 탐색을 순서대로 시도함
상태 출력도 꽤 세분화돼 있음
- 제출됨, 이메일 확인 대기, 최근 처리되어 건너뜀, 검색 결과 없음, 수동 처리 필요, 오류, 죽은 URL 같은 상태를 구분함
- 검증 모드인 node watcher.js --verify는 이전에 성공 기록이 있는 브로커를 다시 검색해서 아직 이름이 보이는지 확인함
- 단, 검색 폼이 있는 브로커만 자동 검증 가능하고 직접 폼·이메일 방식은 검증 불가로 남음
흥미로운데 위험한 실험 기능도 있음. --pollute N 모드는 가짜 인물 정보를 일부 브로커에 제출하는 기능임
- 기본값은 꺼져 있고, 문서에서도 약관 위반·윤리 문제·법적 리스크가 있다고 경고함
- 현재 ThatsThem, SearchPeopleFree, PeopleSearchNow, InfoTracer, SocialCatfish 같은 일부 직접 폼 브로커만 대상으로 잡혀 있음
- 개인정보 삭제 자동화와 데이터 오염 실험을 한 프로젝트 안에 둔 셈이라, 실사용자는 이 기능을 건드리지 않는 게 맞아 보임
한국 개발자에게도 의미가 있는 건 ‘개인정보 삭제 자동화’ 자체보다 구현 패턴임
- 웹 자동화, 캡차 처리, 상태 추적, 재시도 윈도우, 검증 리포트, 도커 실행, 웹훅 알림까지 운영 자동화 요소가 한 세트로 들어 있음
- 데이터 브로커 생태계는 미국 중심이지만, 브로커별로 깨지는 폼 자동화를 어떻게 관리할지 보는 재미가 있음

기술 맥락

이 프로젝트가 Playwright를 고른 이유는 데이터 브로커 사이트들이 정형 API를 주지 않기 때문이에요. 검색하고, 목록에서 내 프로필을 찾고, 폼을 채우고, 버튼을 누르는 흐름이 전부 웹 UI에 묶여 있어서 실제 브라우저 자동화가 제일 덜 깨지는 선택이에요.
state.json이 중요한 이유는 삭제 요청이 한 번으로 끝나지 않기 때문이에요. 브로커가 데이터를 다시 수집할 수 있고, 어떤 요청은 이메일 확인 전까지 반쯤 끝난 상태로 남거든요. 그래서 성공 시점, 재확인 주기, 보류 상태를 계속 들고 가야 해요.
명시 매핑 42개와 휴리스틱 490개를 나눈 것도 현실적인 설계예요. 자주 쓰는 브로커는 셀렉터를 직접 관리하고, 나머지는 ‘Do Not Sell’ 버튼이나 프라이버시 매니저 같은 패턴을 찾아 best-effort로 처리하는 거죠.
다만 자동화가 곧 신뢰성은 아니에요. 사이트 UI가 바뀌면 셀렉터가 깨지고, 제출 성공이 삭제 완료를 보장하지도 않아요. 그래서 verify 모드와 STATUS.md처럼 신뢰도 레이어를 따로 둔 게 이 프로젝트의 실무적인 포인트예요.

개인정보 삭제 대행 서비스를 직접 돌려보겠다는 개발자스러운 접근이다. 다만 ‘자동 제출됨’과 ‘실제로 삭제됨’ 사이에 큰 간극이 있어서, 자동화보다 상태 추적과 검증 로직이 더 중요한 프로젝트로 보임.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

security 2026-07-13

엘에이 경찰, 사생활 침해 논란 끝에 플록 번호판 감시 계약 종료

엘에이 경찰이 번호판 인식 카메라 업체 플록 세이프티와의 3년 계약을 연장하지 않기로 했어. 시민권, 프라이버시, 데이터 보관과 공유 문제를 해결하지 못했다는 게 핵심 이유야. 플록은 미국 전역에 최소 8만 대 카메라망을 깔아 경찰과 연방기관이 차량을 추적할 수 있게 해왔고, 오탐·보안 사고·이민 단속 악용 의혹까지 겹치며 압박이 커졌어.

security 2026-07-12

크로미움 148부터 Math.tanh 한 번으로 운영체제 지문이 새는 문제

크로미움 148 이후 V8이 Math.tanh 계산을 자체 구현 대신 운영체제의 수학 라이브러리에 맡기면서, 같은 입력값도 리눅스·맥·윈도우에서 마지막 비트가 달라지는 지문 신호가 생겼다. 이 차이는 User-Agent로 맥이라고 주장하면서 리눅스 수학 결과를 내는 식의 위장을 바로 들키게 만든다. CSS 삼각함수와 웹 오디오까지 보면 브라우저 수학 경로가 꽤 복잡하게 갈라지고, 제대로 흉내 내려면 실제 운영체제 라이브러리의 비트 단위 동작까지 맞춰야 한다.

security 2026-07-12

출입통제도 클라우드 구독제로 간다…제로트러스트·AI 분석이 승부처

기업 출입보안이 사업장별 서버를 두는 방식에서 클라우드 기반 서비스형 출입통제(ACaaS)로 옮겨가고 있다. 시장은 2026년 17억8000만 달러에서 2030년 31억9000만 달러로 커질 전망이고, 제로트러스트·모바일 인증·AI 출입 분석·스마트빌딩 통합이 핵심 경쟁 포인트로 꼽힌다.

security 2026-07-12

AWS·구글 클라우드, 양자컴퓨터 대비해 암호 체계 갈아엎는 중

AWS와 구글 클라우드가 양자컴퓨터 시대를 대비해 기존 공개키 암호와 양자내성암호를 함께 쓰는 하이브리드 전환을 시작했다. 핵심 배경은 지금 훔친 암호문을 나중에 양자컴퓨터로 푸는 ‘선수집·후해독’ 공격이고, 국내도 통신·금융·국방 등 5개 분야에 45억원을 투입해 실증에 들어간다.

security 2026-07-12

보안 점검 맡긴 AI 에이전트가 악성코드를 직접 실행할 수 있다는 경고

AI 보안 에이전트가 저장소를 검사하다가 README 같은 문서에 숨은 프롬프트 인젝션에 속아 악성 바이너리를 실행할 수 있다는 연구가 나왔다. 클로드 코드와 코덱스의 자동 모드처럼 승인 없이 명령을 수행하는 구성에서 문제가 재현됐고, 여러 모델과 공급업체를 가로질러 같은 패턴이 통했다는 점이 핵심이다.

개인정보 삭제 요청을 500개 데이터 브로커에 자동으로 돌리는 오픈소스 도구 등장

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

개인정보 삭제 요청을 500개 데이터 브로커에 자동으로 돌리는 오픈소스 도구 등장

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사