본문으로 건너뛰기
피드

애플, WWDC에서 온디바이스 AI로 클라우드 AI 비용 문제를 정면 돌파할까

ai-ml 약 6분
vote
0
댓글
북마크

애플이 WWDC에서 차세대 시리뿐 아니라 온디바이스 AI 전략을 강하게 밀 가능성이 커졌어. 클라우드 AI는 성능은 좋지만 비용과 프라이버시 부담이 크고, 애플은 이미 아이폰·맥·애플워치에 깔린 자체 칩 생태계를 AI 인프라처럼 활용할 수 있다는 점을 앞세우는 분위기야.

  • 1

    애플은 자체 칩 개발 경험을 바탕으로 온디바이스 AI 경쟁력을 강조할 전망

  • 2

    기술 분석가는 애플 기기에 깔린 연산 능력 가치를 약 500억 달러로 추정

  • 3

    M5 칩은 300억 개 매개변수 모델을 3초 안에 구동할 수 있다고 애플이 주장

  • 4

    애플은 구글 제미나이 모델을 소형 모델 학습에 활용하고 관련 스타트업 인수도 검토 중

  • 애플이 이번 WWDC에서 꺼낼 AI 메시지는 “시리가 얼마나 똑똑해졌나”만이 아닐 가능성이 큼

    • 관전 포인트는 차세대 시리와 아이폰 AI 기능이지만, 애플은 온디바이스 AI 경쟁력도 꽤 비중 있게 다룰 것으로 보임
    • 디인포메이션은 애플이 지난 15년간 아이폰·애플워치·맥용 자체 칩을 만든 경험을 AI 전략의 핵심 근거로 내세울 거라고 전함
  • 지금 AI 서비스 대부분은 데이터센터에서 돌아가는 클라우드 AI에 기대고 있음

    • 애플 기기도 예외는 아니라서, 차세대 시리의 일부 질의는 애플과 구글의 계약에 따라 구글 클라우드에서 처리될 전망임
    • 클라우드 방식은 성능은 좋지만, 비용과 프라이버시가 계속 발목을 잡음

중요

> 기업들이 AI 토큰 비용에 민감해지는 상황에서, 온디바이스 AI는 단순한 기능 차별화가 아니라 비용 구조를 바꾸는 카드가 될 수 있음.

  • 애플 입장에선 온디바이스 AI가 꽤 맛있는 전략임

    • 다른 빅테크처럼 AI 데이터센터에 천문학적인 돈을 계속 쏟아붓지 않아도 됨
    • 기술 분석가 리차드 크라머는 애플 기기에 이미 깔린 온디바이스 연산 능력 가치를 약 500억 달러로 추정함
    • 더 재밌는 포인트는 이 연산 능력이 사실상 사용자들이 기기값을 내면서 구축한 인프라라는 해석임
  • 애플은 칩 쪽에서도 온디바이스 AI를 노골적으로 밀고 있음

    • 지난해 10월 공개한 M5 칩은 모든 GPU 코어에 신경망 가속기를 내장함
    • 애플 자체 측정 기준으로 M5는 300억 개 매개변수 모델을 3초 안에 구동할 수 있음
    • 이 정도면 “기기에서 작은 보조 기능 몇 개 돌림” 수준을 넘어, 꽤 본격적인 로컬 AI 실행을 염두에 둔 설계로 볼 수 있음
  • 모델과 소프트웨어 쪽 준비도 같이 가는 중임

    • 애플은 구글과의 계약을 통해 자사 기기에서 돌아갈 소형 모델 학습에 구글 제미나이 모델을 활용할 수 있게 됨
    • 또 AI 모델을 기기에서 돌릴 수 있도록 축소하는 기술을 가진 작은 회사 인수도 검토 중임
    • 후보로 거론된 곳 중 하나가 온디바이스 AI에 특화된 스타트업 리퀴드AI임
  • 이미 온디바이스 AI 앱을 만드는 스타트업 사례도 나오고 있음

    • 웹AI는 애플 칩에서 돌아가는 엔터프라이즈 AI 애플리케이션을 만드는 회사임
    • 항공업계 고객을 대상으로, 아이패드나 맥에서 보잉 엔진 구조와 작동 원리를 설명하는 매뉴얼 기반 AI 도구를 제공함
    • 클라우드에 민감한 현장 업무에서 “기기 안에서 돌아가는 AI”가 왜 유용한지 보여주는 사례임
  • 결론적으로 애플의 승부수는 “더 큰 클라우드”가 아니라 “이미 깔린 기기”일 수 있음

    • 아이폰, 맥, 아이패드가 전 세계에 깔려 있고, 애플은 그 위에 자체 칩과 OS를 모두 통제함
    • 그래서 애플의 AI 경쟁력은 모델 크기 경쟁보다 기기 최적화, 전력 효율, 프라이버시, 개발자 생태계 쪽에서 갈릴 가능성이 큼

기술 맥락

  • 애플이 온디바이스 AI를 강조하는 이유는 단순히 개인정보 보호 이미지를 챙기려는 게 아니에요. 클라우드 AI는 요청이 늘어날수록 GPU 서버 비용과 토큰 비용이 같이 커지거든요. 이미 팔린 아이폰과 맥의 칩을 활용하면, 일부 추론 비용을 사용자 기기 쪽으로 넘길 수 있어요.

  • 여기서 중요한 선택은 큰 모델을 무조건 클라우드에서 돌릴지, 작은 모델을 기기에 맞게 줄여서 돌릴지예요. 애플이 구글 제미나이를 소형 모델 학습에 활용할 수 있다는 대목은, 거대한 모델의 지식을 더 작은 로컬 모델로 옮기는 방향을 염두에 둔 움직임으로 볼 수 있어요.

  • 개발자 입장에서는 앱 설계 기준이 바뀔 수 있어요. 네트워크가 불안정하거나 민감한 데이터를 다루는 앱은 클라우드 호출보다 기기 내 추론이 더 매력적일 수 있거든요. 대신 모델 크기, 배터리, 지연 시간, 칩별 성능 차이를 더 꼼꼼히 봐야 해요.

  • 애플이 강한 이유는 하드웨어, 운영체제, 앱 배포 경로를 한 번에 잡고 있다는 점이에요. 온디바이스 AI가 커질수록 단순 모델 성능보다 어떤 기기에서 얼마나 부드럽게 돌아가느냐가 더 중요한 경쟁력이 될 수 있어요.

애플의 AI 전략은 단순히 시리를 똑똑하게 만드는 얘기가 아니라, 이미 팔린 기기들을 거대한 분산 AI 인프라처럼 쓰겠다는 쪽에 가까워 보여. 클라우드 AI 비용이 계속 부담으로 커지는 상황이라 개발자 입장에서도 온디바이스 모델 최적화 흐름은 꽤 중요해질 수 있어.

댓글

댓글

댓글을 불러오는 중...

ai-ml

대학생들은 이미 챗지피티와 제미나이를 쪼개 쓰는 ‘AI 네이티브’가 됐다

이화여대 학생 설문과 인터뷰를 보면 생성형 AI는 과제 보조 도구를 넘어 학습, 글쓰기, 자료조사, 감정 상담까지 들어온 일상 인프라가 됐다. 학생들은 챗지피티, 제미나이, 클로드, 퍼플렉시티를 용도별로 나눠 쓰면서도 환각과 오류 때문에 교차검증이 필요하다고 보고 있다. 대학의 윤리 지침은 존재하지만 학생 체감은 낮고, 이제는 금지보다 활용 교육과 평가 방식 재설계가 핵심 이슈로 떠올랐다.

ai-ml

AI 에이전트 시대, 진짜 해자는 코딩 실력이 아니라 도메인 지식이다

이 글은 에이전트형 AI가 소프트웨어 개발의 병목을 “만들 수 있나”에서 “맞는지 판단할 수 있나”로 옮겼다고 주장한다. 일반ist 엔지니어의 코드 생산 능력보다, 특정 도메인의 정답을 알아보고 검증할 수 있는 사람이 더 큰 가치를 갖게 된다는 얘기다.

ai-ml

OpenRouter, 시리즈 B에서 1억1300만 달러 조달…멀티 모델 AI 인프라 판 커진다

OpenRouter가 알파벳 성장펀드 CapitalG 주도로 1억1300만 달러 규모 시리즈 B 투자를 받았다. 최근 6개월간 주간 처리량이 5조 토큰에서 25조 토큰으로 5배 늘었고, 올해 1천조 토큰 이상을 처리하는 속도로 성장 중이라고 밝혔다.

ai-ml

테슬라 FSD, 중국서 첫 집단 사기 소송 심리 시작

중국 베이징 법원이 테슬라의 풀 셀프 드라이빙 판매 약속을 둘러싼 소비자 사기 소송 첫 심리를 열었다. 원고 10명은 2019~2021년에 약 5만6천 위안을 내고 FSD를 샀지만, 실제 중국 출시 기능은 구형 하드웨어 차량을 배제했고 완전 자율주행도 제공하지 못했다고 주장한다. 중국 소비자보호법상 사기로 인정되면 환불뿐 아니라 3배 배상까지 이어질 수 있어 파장이 크다.

ai-ml

안도르 제작자, 1,500쪽 대본 공개 접은 이유는 “AI 학습 데이터 되기 싫어서”

스타워즈 드라마 안도르의 쇼러너 토니 길로이가 준비해둔 1,500쪽짜리 대본·콘셉트 아트 공개 계획을 접었다. 이유는 단순하다. 공개하는 순간 AI 모델 학습 데이터로 빨려 들어갈 수 있다는 우려 때문이다. 헐리우드 창작자와 스튜디오, AI 기업 사이의 저작권·학습 데이터 갈등이 다시 선명하게 드러난 사례다.