---
title: "공짜 청소의 진짜 가격, 집 안 데이터를 로봇 학습용으로 파는 인공지능 회사"
published: 2026-06-21T07:05:01.842Z
canonical: https://jeff.news/article/4147
---
# 공짜 청소의 진짜 가격, 집 안 데이터를 로봇 학습용으로 파는 인공지능 회사

뉴욕에서 일부 인공지능 기업들이 무료 청소·요리 서비스를 제공하며 가정 내부 영상 데이터를 수집하고 있다. 시프트는 사람이 청소하는 손동작과 환경 데이터를 익명화해 로봇 기업에 판매하려 하지만, 개인정보 전문가들은 집 안 데이터가 예상치 못한 방식으로 악용될 수 있다고 경고한다.

## 공짜 청소 서비스의 목적은 청소가 아님

- 뉴욕에서 인공지능 회사들이 무료 청소·요리 서비스를 제공하면서 집 안 데이터를 모으고 있음
  - BBC 기자의 맨해튼 어퍼이스트사이드 아파트에도 20대 중반 직원 2명이 찾아와 청소를 함
  - 이들이 일반 청소부와 다른 점은 모자에 카메라가 달려 있고, 그 카메라가 휴대전화와 연결돼 있다는 것임

- 마이크로 AGI가 운영하는 시프트의 목표는 차세대 자율형 로봇을 훈련시키는 데이터 확보임
  - 설거지, 요리, 청소, 돌봄 같은 작업을 로봇이 하려면 사람 손동작과 다양한 집 안 환경을 배워야 함
  - 그래서 청소부들은 일하는 내내 손동작에 특히 신경 쓰는 모습을 보였다고 함

- 수요도 꽤 많음. 직원들은 사실상 뉴욕에 상주하며 주 5일, 하루 평균 5가구를 청소하고 있음
  - 사용자 입장에서는 공짜 청소지만, 회사 입장에서는 집 안에서 보기 어려운 로봇 학습 데이터를 얻는 구조임
  - 시프트 창업자 베르잔 킬리치는 이 데이터 수집의 목표를 '인류의 발전'이라고 표현함

## 로봇에게는 인터넷 텍스트보다 부엌 서랍이 더 어렵다

- 킬리치의 설명은 단순함. 챗지피티는 인터넷 텍스트를 학습했지만, 로봇은 현실 세계의 지저분한 변수를 배워야 함
  - 집마다 주방 구조, 조명, 식기 위치, 도구 모양이 다름
  - 몇 시간 전과 완전히 같은 환경도 없어서, 손과 카메라와 주변 환경이 어떻게 같이 움직이는지 배워야 한다는 주장임

- 시프트의 사업 모델은 가정 내부 데이터를 익명화한 뒤 로봇 회사와 다른 인공지능 회사에 판매하는 것임
  - 현재는 뉴욕 아파트 청소 데이터를 모으고 있음
  - 튀르키예에서는 정비사들이 자동차를 수리하는 장면도 데이터로 수집 중이라고 함

> [!IMPORTANT]
> 이건 '청소 앱' 이야기가 아니라, 현실 세계 로봇 학습 데이터 시장 이야기임. 생성형 인공지능의 원유가 텍스트였다면, 가정용 로봇의 원유는 사람 손과 집 안 영상일 수 있음.

## 문제는 그 데이터가 집 안이라는 것

- 개인정보 전문가들은 무료 서비스와 맞바꿔 집 안 데이터를 넘기는 거래를 조심해야 한다고 경고함
  - 전자프런티어재단의 로리 미어는 '사생활 대가 거래'와 '데이터 미끼 제공' 관행이 늘고 있다고 지적함
  - 당장은 돈이나 서비스를 받는 것처럼 보여도, 한 번 제공한 데이터가 나중에 예상치 못한 방식으로 불이익이 될 수 있다는 얘기임

- 집 안 영상은 생각보다 훨씬 민감함
  - 가구, 약, 서류, 아이 물건, 생활 패턴, 방문자 흔적 같은 정보가 화면에 잡힐 수 있음
  - 데이터를 수집한 회사를 신뢰해도, 그 정보가 다른 기업이나 정부 기관에 공유될 위험은 남는다는 지적이 나옴

> [!WARNING]
> '익명화했다'는 말만으로 집 안 영상 데이터의 위험이 사라지는 건 아님. 집은 개인의 생활 패턴이 압축된 공간이라 재식별과 2차 사용 리스크가 큼.

- 전자개인정보정보센터의 캘리 슈로더는 더 세게 비판함
  - 시프트 모델을 '사생활 침해를 판매하는 악마적으로 창의적인 방식'이라고 표현함
  - 지금 데이터를 제공하는 청소 노동자들의 일이, 언젠가 이 데이터로 훈련된 로봇에 의해 대체될 수 있다는 점도 짚음
  - 무료 청소의 혜택은 기업이 가치 있는 데이터셋을 만들어 팔 수 있는 잠재 수익에 비하면 매우 작다고 봄

## 회사는 '그래도 솔직한 거래'라고 주장함

- 킬리치는 시프트가 데이터 활용 방식을 가장 솔직하게 공개하는 플랫폼이라고 반박함
  - 웹사이트와 소셜미디어 기업도 매일 사용자 데이터를 쓰지만, 사용자는 어디에 어떻게 쓰이는지 모르고 대가도 받지 못한다는 논리임
  - 반면 무료 서비스는 사용자가 데이터 제공의 대가를 직접 받는 것이어서 더 명확한 거래라고 주장함

- 참여는 선택이라는 입장도 덧붙임
  - 원하지 않으면 참여하지 않아도 되고, 모두가 반길 것이라고 기대하지 않는다고 말함
  - 회사는 청소 인력에게 뉴욕 지역 평균보다 높은 수준의 급여를 지급하고 있다고 설명함

- 현장에서 일하는 젠지 직원들은 단순히 임금만 보고 하는 일은 아닌 듯함
  - 이들은 스타트업 업계를 거치다 일자리를 찾던 사람들이고, 인공지능 산업의 성장 과정에 참여한다는 의미를 크게 보는 분위기임
  - 다만 그 참여가 매일 여러 가정을 돌며 손에 물 묻히고, 동시에 미래 자동화의 학습 데이터를 만드는 일이라는 점이 묘하게 씁쓸함

---

## 기술 맥락

- 이 회사가 모으는 건 단순 청소 영상이 아니라 로봇 조작 데이터예요. 로봇이 컵을 집고, 싱크대를 닦고, 서랍을 여는 동작을 배우려면 사람 손이 실제 집에서 어떻게 움직이는지 봐야 하거든요.

- 텍스트 모델과 달리 가정용 로봇은 환경 변화가 너무 커요. 집마다 조명, 가구, 물건 위치, 도구 모양이 다르기 때문에 깔끔한 실험실 데이터만으로는 현실에서 잘 움직이기 어려워요.

- 시프트가 무료 서비스를 택한 이유도 여기에 있어요. 사용자는 청소라는 즉각적인 보상을 받고, 회사는 일반적으로 접근하기 어려운 사적 공간의 고품질 작업 데이터를 얻는 구조예요.

- 하지만 집 안 영상은 익명화가 까다로워요. 얼굴이나 이름을 지워도 생활 패턴, 소유물, 가족 구성, 건강 정보가 간접적으로 드러날 수 있어서, 나중에 다른 데이터와 결합되면 위험이 커질 수 있어요.

- 개발자 입장에서는 이 사례가 로봇 인공지능의 데이터 병목과 개인정보 리스크를 동시에 보여줘요. 모델 성능을 올리려는 데이터 수집이 사용자 동의, 2차 사용, 노동 대체 문제와 바로 붙어 있다는 게 핵심이에요.

## 핵심 포인트

- 마이크로 AGI의 시프트는 뉴욕 가정에 무료 청소 서비스를 제공하며 카메라로 작업 데이터를 수집
- 목적은 차세대 요리·청소 로봇이 손동작과 다양한 실내 환경에 적응하도록 훈련시키는 것
- 청소 인력은 모자에 카메라를 달고 주 5일, 하루 평균 5가구를 청소
- 수집 데이터는 익명화 후 로봇 기업과 다른 인공지능 기업에 판매되는 사업 모델
- 전자프런티어재단과 전자개인정보정보센터는 사생활 침해와 노동 대체 위험을 강하게 비판

## 인사이트

로봇 인공지능의 다음 병목은 모델보다 현실 세계 데이터다. 그런데 그 데이터를 모으는 방식이 '공짜 서비스'라면, 개발자도 데이터 동의와 익명화가 실제로 어디까지 유효한지 더 깐깐하게 봐야 한다.
