본문으로 건너뛰기
피드

개인정보 삭제 요청을 500개 데이터 브로커에 자동으로 돌리는 오픈소스 도구 등장

security 약 6분
vote
0
댓글
북마크

auto-identity-remove는 사람 검색 사이트와 데이터 브로커 500곳 이상에 개인정보 삭제 요청을 자동 제출하는 오픈소스 도구다. Playwright로 브라우저를 돌리고, 캡차는 CapSolver로 풀며, 이미 처리한 브로커는 state.json으로 추적해 매달 재시도 주기를 관리한다.

  • 1

    500개 이상 데이터 브로커와 사람 검색 사이트에 개인정보 삭제 요청을 자동화함

  • 2

    명시적으로 매핑된 브로커 42개와 휴리스틱 기반 일반 러너 약 490개를 함께 처리함

  • 3

    CapSolver를 쓰면 캡차 1회당 약 0.001달러 비용으로 자동 풀이가 가능함

  • 4

    제출 성공이 삭제 보장을 뜻하지는 않으며 별도 검증 모드가 제공됨

  • 5

    실험적 노이즈 모드는 약관·윤리·법적 리스크가 있어 기본 비활성화됨

  • HN에 올라온 auto-identity-remove는 데이터 브로커 개인정보 삭제 요청을 자동으로 돌리는 오픈소스 도구임

    • 대상은 사람 검색 사이트와 데이터 브로커 데이터베이스 500곳 이상
    • 매달 이름과 주(State)를 기준으로 검색하고, 내 프로필을 찾고, 옵트아웃 폼을 채워 제출함
    • 지원 환경은 macOS, 리눅스, 윈도우이고 Node.js 18 이상과 Playwright 브라우저가 필요함
  • 자동화 흐름이 꽤 현실적으로 짜여 있음

    • 이미 삭제 요청을 보낸 브로커는 state.json에 기록해서 매번 중복 제출하지 않음
    • 기본 재확인 주기는 90일임. 브로커들이 상위 소스에서 데이터를 다시 가져와 재등록하는 일이 흔하다는 전제임
    • 실행이 끝나면 iMessage나 웹훅으로 결과 요약을 보낼 수 있음
  • 캡차는 CapSolver로 풀 수 있게 해놨음

    • 비용은 풀이 1회당 약 0.001달러 수준이라고 설명함
    • CapSolver를 쓰지 않으면 캡차가 걸린 사이트는 수동 목록으로 넘기거나 브라우저에서 열어 사용자가 직접 처리하게 함
    • 도커 실행도 지원해서 맥이 없어도 공식 Playwright 이미지 기반으로 돌릴 수 있음

⚠️주의

> 이 도구에서 ‘제출 성공’은 ‘삭제 완료’가 아님. 브로커가 폼을 받았다는 뜻일 뿐이라, 이메일 확인 링크나 재검색 검증이 따로 필요함

  • 브로커 지원은 두 단계로 나뉨

    • 명시 매핑된 브로커는 42개임. Spokeo, WhitePages, FastPeopleSearch, BeenVerified, Acxiom, LexisNexis, ZoomInfo, Clearbit 등이 포함됨
    • 추가로 약 490개 브로커는 일반 러너가 휴리스틱으로 처리함
    • 일반 러너는 ‘Do Not Sell My Personal Information’ 클릭, OneTrust·TrustArc·Osano 프라이버시 매니저, 일반 옵트아웃 폼, DSAR 링크 탐색을 순서대로 시도함
  • 상태 출력도 꽤 세분화돼 있음

    • 제출됨, 이메일 확인 대기, 최근 처리되어 건너뜀, 검색 결과 없음, 수동 처리 필요, 오류, 죽은 URL 같은 상태를 구분함
    • 검증 모드인 node watcher.js --verify는 이전에 성공 기록이 있는 브로커를 다시 검색해서 아직 이름이 보이는지 확인함
    • 단, 검색 폼이 있는 브로커만 자동 검증 가능하고 직접 폼·이메일 방식은 검증 불가로 남음
  • 흥미로운데 위험한 실험 기능도 있음. --pollute N 모드는 가짜 인물 정보를 일부 브로커에 제출하는 기능임

    • 기본값은 꺼져 있고, 문서에서도 약관 위반·윤리 문제·법적 리스크가 있다고 경고함
    • 현재 ThatsThem, SearchPeopleFree, PeopleSearchNow, InfoTracer, SocialCatfish 같은 일부 직접 폼 브로커만 대상으로 잡혀 있음
    • 개인정보 삭제 자동화와 데이터 오염 실험을 한 프로젝트 안에 둔 셈이라, 실사용자는 이 기능을 건드리지 않는 게 맞아 보임
  • 한국 개발자에게도 의미가 있는 건 ‘개인정보 삭제 자동화’ 자체보다 구현 패턴임

    • 웹 자동화, 캡차 처리, 상태 추적, 재시도 윈도우, 검증 리포트, 도커 실행, 웹훅 알림까지 운영 자동화 요소가 한 세트로 들어 있음
    • 데이터 브로커 생태계는 미국 중심이지만, 브로커별로 깨지는 폼 자동화를 어떻게 관리할지 보는 재미가 있음

기술 맥락

  • 이 프로젝트가 Playwright를 고른 이유는 데이터 브로커 사이트들이 정형 API를 주지 않기 때문이에요. 검색하고, 목록에서 내 프로필을 찾고, 폼을 채우고, 버튼을 누르는 흐름이 전부 웹 UI에 묶여 있어서 실제 브라우저 자동화가 제일 덜 깨지는 선택이에요.

  • state.json이 중요한 이유는 삭제 요청이 한 번으로 끝나지 않기 때문이에요. 브로커가 데이터를 다시 수집할 수 있고, 어떤 요청은 이메일 확인 전까지 반쯤 끝난 상태로 남거든요. 그래서 성공 시점, 재확인 주기, 보류 상태를 계속 들고 가야 해요.

  • 명시 매핑 42개와 휴리스틱 490개를 나눈 것도 현실적인 설계예요. 자주 쓰는 브로커는 셀렉터를 직접 관리하고, 나머지는 ‘Do Not Sell’ 버튼이나 프라이버시 매니저 같은 패턴을 찾아 best-effort로 처리하는 거죠.

  • 다만 자동화가 곧 신뢰성은 아니에요. 사이트 UI가 바뀌면 셀렉터가 깨지고, 제출 성공이 삭제 완료를 보장하지도 않아요. 그래서 verify 모드와 STATUS.md처럼 신뢰도 레이어를 따로 둔 게 이 프로젝트의 실무적인 포인트예요.

개인정보 삭제 대행 서비스를 직접 돌려보겠다는 개발자스러운 접근이다. 다만 ‘자동 제출됨’과 ‘실제로 삭제됨’ 사이에 큰 간극이 있어서, 자동화보다 상태 추적과 검증 로직이 더 중요한 프로젝트로 보임.

댓글

댓글

댓글을 불러오는 중...

security

한양대 에리카와 네이버클라우드, 클라우드·보안·AI 인재 키우는 산학협력 체결

한양대 에리카가 네이버클라우드와 첨단 분야 지역인재 양성과 글로벌 산학협력을 위한 업무협약을 맺었다. 협력 범위는 클라우드, 사이버보안, 블록체인, 개인정보보호, 인공지능(AI), 디지털 전환(DX) 교육·연구 기반 구축까지 포함된다.

security

악성 npm 패키지가 AI 개발도구의 지침 파일과 MCP까지 노리기 시작함

이스트시큐리티가 웹과 탈중앙화금융 개발자를 겨냥한 악성 npm 패키지 캠페인을 포착했어. 공격자는 유명 웹3 도구를 사칭하는 데서 그치지 않고, AI 에이전트가 읽는 프로젝트 지침 파일과 MCP 기반 외부 도구 호출까지 공격 경로로 삼으려 했어.

security

금융권, 앤트로픽 미토스가 찾은 오픈소스 취약점에 긴급 점검 들어감

앤트로픽의 AI 모델 클로드 미토스가 1000개 넘는 오픈소스에서 대량의 취약점 후보를 찾아냈고, 그중 일부가 실제 취약점으로 검증돼 공개됐어. 금융당국은 nginx, wolfSSL, FreeRDP, Ghost 같은 널리 쓰이는 구성요소를 중심으로 금융권에 긴급 자산 점검과 패치 적용을 권고했어.

security

애플이 양자 내성 암호화 검증 코드를 공개했다, 핵심은 수학적 증명

애플이 corecrypto 라이브러리의 포스트 양자 암호화 구현과 검증 코드를 GitHub에 공개했다. ML-KEM, ML-DSA 구현과 형식 검증 접근을 공개해 보안 연구자들이 직접 검토할 수 있게 했고, 이 기술은 25억 대 이상 활성 기기에서 쓰이는 암호화 기반과 연결된다.

security

라라벨 번역 패키지 태그가 통째로 바뀌었다, 개발자 비밀값 털리는 공급망 공격

전 세계 라라벨 개발자가 쓰는 Laravel-Lang 패키지가 공격을 받아 Git 태그가 악성 버전을 가리키도록 바뀌었다. 5월 22일 약 90분 동안 4개 저장소의 태그가 교체됐고, 감염된 패키지는 AWS 키, GitHub 토큰, Stripe 시크릿, 암호화폐 지갑 복구 구문, SSH 개인키 등을 노렸다.