엔비디아, ‘알파고 아버지’ 스타트업과 대규모 강화학습 인프라 만든다

ai-ml 2026-05-16 약 7분

 tags

#nvidia #reinforcement-learning #infrastructure #startup #gpu

vote

북마크

엔비디아가 딥마인드 강화학습 팀을 이끌었던 데이비드 실버의 스타트업 인에퍼블인텔리전스와 대규모 강화학습 시스템 구축에 협력한다. 이 회사는 인간 데이터로 학습하는 기존 모델과 달리 시행착오와 경험 데이터로 스스로 지식을 발견하는 AI를 목표로 하며, 엔비디아의 그레이스블랙웰 칩과 베라루빈 플랫폼을 활용할 예정이다.

1
엔비디아가 인에퍼블인텔리전스와 대규모 강화학습 인프라를 공동 설계
2
인에퍼블은 딥마인드 출신 데이비드 실버가 2025년 말 런던에 설립한 스타트업
3
2026년 4월 11억달러 규모 시드 투자를 유치했고 엔비디아와 구글도 투자자로 참여
4
목표는 인간 데이터가 아니라 경험 데이터로 학습하는 AI 시스템
5
엔비디아 그레이스블랙웰 칩과 베라루빈 플랫폼이 프로젝트에 사용될 예정

엔비디아가 ‘알파고 아버지’로 불리는 데이비드 실버의 스타트업 인에퍼블인텔리전스와 손잡음
- 인에퍼블은 구글 딥마인드 강화학습 팀 리더 출신인 데이비드 실버가 2025년 말 영국 런던에 세운 회사임
- 엔비디아와 인에퍼블은 “시행착오를 통해 학습하는 AI 시스템” 구축을 위한 엔지니어링 협력을 시작한다고 밝힘
- 젠슨 황 엔비디아 최고경영자는 AI의 다음 프런티어를 “경험으로부터 지속적으로 학습하는 슈퍼러너 시스템”이라고 표현함
이 협력의 핵심은 대규모 강화학습 인프라임
- 강화학습은 AI가 행동하고, 결과를 보고, 보상을 통해 더 나은 전략을 배우는 방식임
- 알파고가 대표적인 강화학습 성공 사례였고, 데이비드 실버는 그 계보의 핵심 인물임
- 이번에는 게임 하나를 잘하는 모델이 아니라, 경험을 통해 새로운 지식을 발견하는 범용 시스템을 겨냥하는 분위기임

❗중요

> 포인트는 “인터넷에 있는 인간 지식을 더 긁어모으자”가 아니라, AI가 경험 데이터로 스스로 배울 수 있는 인프라를 만들자는 쪽임.

인에퍼블은 기존 주요 AI 모델과 다른 학습 재료를 노림
- 지금의 대형 AI 모델은 대체로 인간 언어와 인간이 만든 데이터를 많이 먹고 자람
- 인에퍼블은 인간 데이터와 상당히 다른 형태의 풍부한 경험 데이터를 기반으로 학습하는 시스템을 만들겠다고 설명함
- 회사는 이를 위해 새로운 모델 구조와 학습 알고리즘이 필요할 수 있다고 봄
엔비디아는 이 시스템에 필요한 데이터 파이프라인과 하드웨어를 같이 설계하려 함
- 양사 엔지니어들이 대규모 강화학습 시스템에 데이터를 공급할 수 있는 파이프라인 구축에 집중할 예정임
- 프로젝트에는 엔비디아의 그레이스블랙웰 칩과 베라루빈 플랫폼이 사용됨
- 결국 엔비디아는 그래픽처리장치 공급자를 넘어, 차세대 AI 학습 방식의 인프라 기준까지 잡으려는 셈임

sequenceDiagram
    participant 인에퍼블
    participant 경험환경
    participant 데이터파이프라인
    participant 엔비디아인프라
    participant 학습모델
    인에퍼블->>경험환경: 시행착오 기반 경험 생성
    경험환경->>데이터파이프라인: 행동 결과와 보상 데이터 전달
    데이터파이프라인->>엔비디아인프라: 대규모 학습용 데이터 공급
    엔비디아인프라->>학습모델: 강화학습 연산 실행
    학습모델->>경험환경: 개선된 행동 전략 적용

돈도 이미 엄청나게 몰리고 있음
- 인에퍼블은 2026년 4월 세쿼이아캐피털과 라이트스피드벤처파트너스가 공동 주도한 11억달러 규모 시드 투자를 유치함
- 투자자로는 엔비디아, DST글로벌, 인덱스벤처스, 구글, 영국 소버린AI펀드 등이 참여함
- 시드 투자 규모가 11억달러라는 것부터 이 시장의 기대치가 얼마나 과열됐는지 보여줌
빅테크 출신 연구자들이 새 AI 연구소를 차리고 거액을 끌어오는 흐름도 같이 이어지고 있음
- 전 구글 딥마인드 엔지니어 팀 로크태셸이 세운 리커시브 슈퍼인텔리전스는 6억5000만달러 투자 유치를 발표함
- 메타AI 총괄을 맡았던 얀 르쿤의 AMI랩스는 출범 수개월 만인 2026년 3월 10억달러를 유치했다고 밝힘
- 그 밖에도 오픈AI, 구글 딥마인드, 앤트로픽, xAI 출신 인력들이 만든 스타트업들이 수억달러 단위 자금을 조달 중임
데이비드 실버의 문제의식은 꽤 명확함
- 그는 AI의 비교적 쉬운 문제, 즉 인간이 이미 알고 있는 것을 이해하는 시스템 구축은 상당 부분 해결됐다고 봄
- 이제는 스스로 새로운 지식을 발견하는 시스템을 만들어야 하고, 이를 위해 경험으로부터 학습하는 완전히 다른 접근이 필요하다는 주장임
- 이 말이 맞다면 다음 AI 경쟁은 모델 크기 경쟁만이 아니라 ‘학습할 경험을 어떻게 만들고 공급하느냐’의 싸움이 됨

기술 맥락

여기서 엔비디아와 인에퍼블이 고른 길은 강화학습을 훨씬 큰 규모로 밀어붙이는 거예요. 지금까지의 대형 언어 모델은 인간이 만든 텍스트와 데이터를 학습하는 방식이 강했는데, 이 접근은 모델이 환경과 상호작용하면서 경험을 쌓는 쪽에 무게를 둬요.
왜 이게 중요하냐면, 인터넷에 있는 인간 지식만으로는 새로운 발견을 계속 만들기 어렵다는 문제의식이 있기 때문이에요. 데이비드 실버는 인간이 이미 아는 것을 이해하는 문제는 많이 풀렸고, 이제는 AI가 스스로 새로운 지식을 찾아야 한다고 봐요.
그래서 인프라가 핵심이 됩니다. 강화학습은 단순히 데이터셋 하나 넣고 학습시키는 구조가 아니라, 행동을 만들고 결과를 수집하고 보상을 계산하고 다시 학습시키는 루프가 필요해요. 이 루프가 커지면 데이터 파이프라인과 연산 플랫폼이 병목이 돼요.
엔비디아가 그레이스블랙웰과 베라루빈을 내세우는 이유도 여기에 있어요. 칩 성능만 파는 게 아니라, 차세대 AI가 경험 데이터를 먹고 자라는 전체 학습 시스템의 표준 자리를 잡으려는 움직임으로 볼 수 있어요.

생성형 AI의 다음 경쟁축이 ‘더 많은 인터넷 텍스트’에서 ‘스스로 경험을 만들고 학습하는 시스템’으로 이동하는 분위기야. 엔비디아는 칩만 파는 게 아니라, 그 학습 방식을 가능하게 하는 인프라 레이어까지 선점하려는 움직임으로 보임.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-13

애플 새 음성 인식 API, 온디바이스 영어 전사에서 위스퍼 스몰까지 이겼다

애플의 새 음성 인식 API인 스피치애널라이저가 리브리스피치 벤치마크에서 기존 SFSpeechRecognizer는 물론 위스퍼 스몰보다도 낮은 단어 오류율을 기록했어. 깨끗한 음성에서는 2.12%, noisy 음성에서는 4.56%로, 기존 애플 API 대비 오류율을 3.5~4배 줄였고 위스퍼 스몰보다 약 3배 빠르게 돌았어. 다만 영어·애플 플랫폼·OS 26 조건의 결과라, 다국어와 크로스플랫폼에서는 여전히 위스퍼의 장점이 남아 있어.

ai-ml 2026-07-13

AI를 진짜 잘 쓰는 기업, 미국 증시에서 연 30% 프리미엄 받는다는 연구

예일대와 로체스터대 연구진이 기업의 실제 대형 언어 모델 사용 데이터를 분석했더니, AI 활용도가 높은 상위 20% 기업이 하위 20%보다 주당 평균 0.64% 높은 초과수익률을 냈다. 단순히 AI 기업이냐가 아니라, 업무에 AI를 얼마나 깊게 쓰는지가 시장 가치에 반영되고 있다는 얘기다.

ai-ml 2026-07-13

ZTE, AI 에이전트폰으로 스마트폰 재도전…진짜 승부처는 앱 생태계

ZTE가 바이트댄스의 더우바오를 탑재한 AI 에이전트 스마트폰으로 시장 재진입을 노린다. 핵심은 사용자가 명령하면 AI가 여러 앱을 직접 열고 조작하는 방식인데, 위챗·타오바오·알리페이 같은 플랫폼과 충돌하면서 생태계 문제가 가장 큰 변수로 떠올랐다.

ai-ml 2026-07-13

노벨상 학자들까지 “AI 경제 충격, 지금 제도 안 만들면 늦다”

노벨 경제학상 수상자 15명을 포함한 학자와 기술 업계 인사 약 200명이 AI가 향후 10년 안에 경제를 급격히 바꿀 수 있다며 정책 대응을 촉구했다. 이들은 산업혁명보다 큰 변화가 훨씬 짧은 시간에 올 수 있고, 대규모 일자리 대체와 생활 수준 향상이라는 양면성이 동시에 존재한다고 봤다.

ai-ml 2026-07-13

NHN, AI 데이터센터 매출 기대감에 목표주가 5만6000원으로 상향

한국투자증권이 NHN의 목표주가를 4만5000원에서 5만6000원으로 올리고 투자의견 매수를 유지했다. 핵심 근거는 양평 AI 데이터센터 가동, 공공·민간 GPU 클러스터 수주 확대, 클라우드 사업부 신규 매출 반영이다.

엔비디아, ‘알파고 아버지’ 스타트업과 대규모 강화학습 인프라 만든다

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

엔비디아, ‘알파고 아버지’ 스타트업과 대규모 강화학습 인프라 만든다

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사