본문으로 건너뛰기
피드

공짜 청소의 진짜 가격, 집 안 데이터를 로봇 학습용으로 파는 인공지능 회사

ai-ml 약 7분
vote
0
댓글
북마크

뉴욕에서 일부 인공지능 기업들이 무료 청소·요리 서비스를 제공하며 가정 내부 영상 데이터를 수집하고 있다. 시프트는 사람이 청소하는 손동작과 환경 데이터를 익명화해 로봇 기업에 판매하려 하지만, 개인정보 전문가들은 집 안 데이터가 예상치 못한 방식으로 악용될 수 있다고 경고한다.

  • 1

    마이크로 AGI의 시프트는 뉴욕 가정에 무료 청소 서비스를 제공하며 카메라로 작업 데이터를 수집

  • 2

    목적은 차세대 요리·청소 로봇이 손동작과 다양한 실내 환경에 적응하도록 훈련시키는 것

  • 3

    청소 인력은 모자에 카메라를 달고 주 5일, 하루 평균 5가구를 청소

  • 4

    수집 데이터는 익명화 후 로봇 기업과 다른 인공지능 기업에 판매되는 사업 모델

  • 5

    전자프런티어재단과 전자개인정보정보센터는 사생활 침해와 노동 대체 위험을 강하게 비판

공짜 청소 서비스의 목적은 청소가 아님

  • 뉴욕에서 인공지능 회사들이 무료 청소·요리 서비스를 제공하면서 집 안 데이터를 모으고 있음

    • BBC 기자의 맨해튼 어퍼이스트사이드 아파트에도 20대 중반 직원 2명이 찾아와 청소를 함
    • 이들이 일반 청소부와 다른 점은 모자에 카메라가 달려 있고, 그 카메라가 휴대전화와 연결돼 있다는 것임
  • 마이크로 AGI가 운영하는 시프트의 목표는 차세대 자율형 로봇을 훈련시키는 데이터 확보임

    • 설거지, 요리, 청소, 돌봄 같은 작업을 로봇이 하려면 사람 손동작과 다양한 집 안 환경을 배워야 함
    • 그래서 청소부들은 일하는 내내 손동작에 특히 신경 쓰는 모습을 보였다고 함
  • 수요도 꽤 많음. 직원들은 사실상 뉴욕에 상주하며 주 5일, 하루 평균 5가구를 청소하고 있음

    • 사용자 입장에서는 공짜 청소지만, 회사 입장에서는 집 안에서 보기 어려운 로봇 학습 데이터를 얻는 구조임
    • 시프트 창업자 베르잔 킬리치는 이 데이터 수집의 목표를 '인류의 발전'이라고 표현함

로봇에게는 인터넷 텍스트보다 부엌 서랍이 더 어렵다

  • 킬리치의 설명은 단순함. 챗지피티는 인터넷 텍스트를 학습했지만, 로봇은 현실 세계의 지저분한 변수를 배워야 함

    • 집마다 주방 구조, 조명, 식기 위치, 도구 모양이 다름
    • 몇 시간 전과 완전히 같은 환경도 없어서, 손과 카메라와 주변 환경이 어떻게 같이 움직이는지 배워야 한다는 주장임
  • 시프트의 사업 모델은 가정 내부 데이터를 익명화한 뒤 로봇 회사와 다른 인공지능 회사에 판매하는 것임

    • 현재는 뉴욕 아파트 청소 데이터를 모으고 있음
    • 튀르키예에서는 정비사들이 자동차를 수리하는 장면도 데이터로 수집 중이라고 함

중요

> 이건 '청소 앱' 이야기가 아니라, 현실 세계 로봇 학습 데이터 시장 이야기임. 생성형 인공지능의 원유가 텍스트였다면, 가정용 로봇의 원유는 사람 손과 집 안 영상일 수 있음.

문제는 그 데이터가 집 안이라는 것

  • 개인정보 전문가들은 무료 서비스와 맞바꿔 집 안 데이터를 넘기는 거래를 조심해야 한다고 경고함

    • 전자프런티어재단의 로리 미어는 '사생활 대가 거래'와 '데이터 미끼 제공' 관행이 늘고 있다고 지적함
    • 당장은 돈이나 서비스를 받는 것처럼 보여도, 한 번 제공한 데이터가 나중에 예상치 못한 방식으로 불이익이 될 수 있다는 얘기임
  • 집 안 영상은 생각보다 훨씬 민감함

    • 가구, 약, 서류, 아이 물건, 생활 패턴, 방문자 흔적 같은 정보가 화면에 잡힐 수 있음
    • 데이터를 수집한 회사를 신뢰해도, 그 정보가 다른 기업이나 정부 기관에 공유될 위험은 남는다는 지적이 나옴

⚠️주의

> '익명화했다'는 말만으로 집 안 영상 데이터의 위험이 사라지는 건 아님. 집은 개인의 생활 패턴이 압축된 공간이라 재식별과 2차 사용 리스크가 큼.

  • 전자개인정보정보센터의 캘리 슈로더는 더 세게 비판함
    • 시프트 모델을 '사생활 침해를 판매하는 악마적으로 창의적인 방식'이라고 표현함
    • 지금 데이터를 제공하는 청소 노동자들의 일이, 언젠가 이 데이터로 훈련된 로봇에 의해 대체될 수 있다는 점도 짚음
    • 무료 청소의 혜택은 기업이 가치 있는 데이터셋을 만들어 팔 수 있는 잠재 수익에 비하면 매우 작다고 봄

회사는 '그래도 솔직한 거래'라고 주장함

  • 킬리치는 시프트가 데이터 활용 방식을 가장 솔직하게 공개하는 플랫폼이라고 반박함

    • 웹사이트와 소셜미디어 기업도 매일 사용자 데이터를 쓰지만, 사용자는 어디에 어떻게 쓰이는지 모르고 대가도 받지 못한다는 논리임
    • 반면 무료 서비스는 사용자가 데이터 제공의 대가를 직접 받는 것이어서 더 명확한 거래라고 주장함
  • 참여는 선택이라는 입장도 덧붙임

    • 원하지 않으면 참여하지 않아도 되고, 모두가 반길 것이라고 기대하지 않는다고 말함
    • 회사는 청소 인력에게 뉴욕 지역 평균보다 높은 수준의 급여를 지급하고 있다고 설명함
  • 현장에서 일하는 젠지 직원들은 단순히 임금만 보고 하는 일은 아닌 듯함

    • 이들은 스타트업 업계를 거치다 일자리를 찾던 사람들이고, 인공지능 산업의 성장 과정에 참여한다는 의미를 크게 보는 분위기임
    • 다만 그 참여가 매일 여러 가정을 돌며 손에 물 묻히고, 동시에 미래 자동화의 학습 데이터를 만드는 일이라는 점이 묘하게 씁쓸함

기술 맥락

  • 이 회사가 모으는 건 단순 청소 영상이 아니라 로봇 조작 데이터예요. 로봇이 컵을 집고, 싱크대를 닦고, 서랍을 여는 동작을 배우려면 사람 손이 실제 집에서 어떻게 움직이는지 봐야 하거든요.

  • 텍스트 모델과 달리 가정용 로봇은 환경 변화가 너무 커요. 집마다 조명, 가구, 물건 위치, 도구 모양이 다르기 때문에 깔끔한 실험실 데이터만으로는 현실에서 잘 움직이기 어려워요.

  • 시프트가 무료 서비스를 택한 이유도 여기에 있어요. 사용자는 청소라는 즉각적인 보상을 받고, 회사는 일반적으로 접근하기 어려운 사적 공간의 고품질 작업 데이터를 얻는 구조예요.

  • 하지만 집 안 영상은 익명화가 까다로워요. 얼굴이나 이름을 지워도 생활 패턴, 소유물, 가족 구성, 건강 정보가 간접적으로 드러날 수 있어서, 나중에 다른 데이터와 결합되면 위험이 커질 수 있어요.

  • 개발자 입장에서는 이 사례가 로봇 인공지능의 데이터 병목과 개인정보 리스크를 동시에 보여줘요. 모델 성능을 올리려는 데이터 수집이 사용자 동의, 2차 사용, 노동 대체 문제와 바로 붙어 있다는 게 핵심이에요.

로봇 인공지능의 다음 병목은 모델보다 현실 세계 데이터다. 그런데 그 데이터를 모으는 방식이 '공짜 서비스'라면, 개발자도 데이터 동의와 익명화가 실제로 어디까지 유효한지 더 깐깐하게 봐야 한다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

스노우플레이크, 한국 행사서 기업용 AI 데이터 클라우드와 업무 에이전트 공개

스노우플레이크가 서울에서 열리는 딜로이트 커넥트 코리아 2026에 참여해 기업용 AI 데이터 클라우드 전략을 소개함. 핵심 메시지는 AI 도입의 병목이 모델 자체보다 데이터 품질, 거버넌스, 보안, 비용을 한 플랫폼에서 다루는 준비도에 있다는 쪽임.

ai-ml

LG CNS·두산, AI·로봇·데이터센터까지 묶어 신사업 협력

LG CNS와 두산이 AX, RX, 데이터센터, 클라우드 분야에서 전방위 협력에 나선다. LG CNS의 에이전틱AI 플랫폼과 클라우드·데이터센터 역량, 두산의 에너지·첨단소재·제조 기반을 결합해 제조AX와 로봇, 수소연료전지 데이터센터 활용까지 검토한다는 내용이다.

ai-ml

LG CNS, 오픈AI·앤트로픽·팔란티어 묶고 기업 AI 전환 시장 정조준

LG CNS가 오픈AI, 앤트로픽, 팔란티어와 잇따라 파트너십을 맺으며 국내 기업용 AI 전환 시장을 공략하고 있다. 단순 SI 기업 이미지에서 벗어나 클라우드와 AI 중심 사업자로 체질을 바꾸고 있으며, 클라우드&AI 부문 매출 비중도 58.2%까지 올라왔다.

ai-ml

유클릭스, 기업용 제미나이 체험센터 열고 PoC 이후 공백 노린다

유클릭스가 과천 사옥에 ‘구글 제미나이 엔터프라이즈 익스피리언스 센터’를 열었다. 기업들이 생성형 AI에 관심은 많지만 실제 운영으로 못 넘어가는 문제를 겨냥해, 체험·워크숍·PoC·업무 적용까지 이어지는 모델을 제공하겠다는 내용이다.

ai-ml

구글·AWS, 엔비디아식으로 AI 칩 팔기 시작했다

구글과 AWS가 자체 클라우드 안에서만 쓰던 AI 칩을 외부 데이터센터와 기업 고객에게 팔려는 움직임을 키우고 있다. 구글은 TPU 판매에 금융 보증까지 붙이고, AWS는 트레이니움 칩 외부 판매 가능성을 공개적으로 언급했다. 엔비디아 GPU 독점 구도에 균열이 날지 보는 포인트다.