AI 도입의 병목은 모델이 아니라 데이터라는 디노도의 주장

ai-ml 2026-05-14 약 6분

 tags

#data-virtualization #lakehouse #agentic-ai #data-platform #analytics

vote

북마크

디노도코리아는 기업 AI 도입의 핵심 병목이 모델 선택보다 데이터 접근 구조에 있다고 봤다. 데이터를 한곳에 물리적으로 모으는 방식이나 업무별로 흩어 연결하는 방식 모두 비용과 보안 부담이 커서, 데이터 가상화를 게이트키퍼로 두는 전략을 제안했다.

1
허깅페이스 등록 AI 모델이 282만8727개까지 늘면서 기업의 모델 선택 난도가 높아짐
2
데이터 중앙집중화는 성능상 장점이 있지만 구축 시간, 운영 비용, 완전 마이그레이션 부담이 큼
3
데이터 가상화는 데이터를 옮기지 않고 논리적으로 연결해 AI와 애플리케이션에 제공하는 접근법
4
인텔은 디노도에서 4000개 이상 데이터 모델을 운영하며 2014년부터 다운타임 없이 서비스 중

디노도코리아가 AI WAVE 2026에서 던진 메시지는 꽤 단순함. “AI 성공은 결국 데이터가 AI와 얼마나 잘 말이 통하느냐”에 달렸다는 얘기임
- 좋은 모델, GPU, 클라우드, 인력도 중요하지만 기업 현장에서는 데이터가 여기저기 흩어져 있는 순간 AI 프로젝트가 바로 느려짐
- 발표자는 로마가 길을 잘 깔아서 제국을 운영했듯이, 기업 데이터도 AI로 가는 길을 제대로 만들어야 한다고 비유함
지금 기업들이 힘든 이유는 모델이 없어서가 아니라, 모델이 너무 많아서임
- 발표 기준 3주 전 허깅페이스에 등록된 AI 모델 수가 282만8727개라고 언급됨
- 그런데 실제 PoC나 프로젝트에서 평가해볼 수 있는 모델은 적게는 3개, 많아야 6개 정도라서 “우리 업무에 뭐가 최선인가”를 판단하기가 빡셈
- 오픈소스 기반 AI 모델은 계속 늘어날 전망이라, 모델 선택 문제는 더 복잡해질 가능성이 큼
기존 해법 중 하나는 데이터를 중앙에 다 모아 AI에게 먹이는 방식이었음
- 데이터 중앙집중화는 성능 좋은 단일 환경에서 연산 속도를 끌어올릴 수 있다는 장점이 있음
- 대신 구축 시간이 길고 운영 비용이 높으며, 완전한 마이그레이션을 끝까지 밀어붙이기도 쉽지 않음
- 레거시 시스템이 많은 기업이면 “다 옮기자”는 말이 곧 프로젝트 지옥문이 될 수 있음
반대로 업무별 AI를 고르고 필요한 데이터만 분산 통합하는 방식도 만능은 아님
- 필요한 데이터만 골라 물리적으로 옮기는 데 시간이 들고, 반복 가공이 늘어나며, 클라우드 사용량도 증가할 수 있음
- 관리 채널이 늘어날수록 보안 취약점도 같이 늘고, 운영 난도도 올라감
- AI 프로젝트가 몇 개일 때는 버틸 만해도, 조직 전체로 퍼지는 순간 관리 비용이 기하급수적으로 커지는 구조임

❗중요

> 디노도가 제안한 핵심은 데이터를 한곳에 복사해 모으는 게 아니라, 데이터 가상화를 게이트키퍼로 둬서 AI와 애플리케이션이 논리적으로 접근하게 만드는 방식임.

디노도의 답은 데이터 가상화임. 물리적 이동 대신 논리적 연결을 중심에 둔 접근법임
- 레이크하우스나 SAP 애플리케이션 데이터, 오라클 데이터베이스 같은 소스가 AI와 직접 붙는 게 아니라 디노도를 통해 소통하는 구조를 제안함
- 이렇게 하면 개발계로 불필요한 데이터를 옮기는 시간이 줄고, 접근 정책과 의미 체계도 한 계층에서 다루기 쉬워짐
- 데이터가 어디 있든 AI 입장에서는 단일한 논리 공간처럼 보이게 만드는 게 목표임
디노도는 특히 레이크하우스의 현실적 한계를 겨냥하고 있음
- 기업들이 겪는 문제로 분산된 데이터 환경, 파편화된 접근 권한과 시맨틱스, 보안, 데이터 탐색 복잡성, 최신성 제한을 꼽음
- 디노도 액셀러레이터는 오픈소스 실행 엔진을 내장해 빠른 쿼리 성능과 CPU·메모리 효율을 제공한다고 설명됨
- 고급 분석과 AI 워크로드를 확장하는 쪽에 초점이 맞춰져 있음
사례로는 인텔이 나옴. 숫자가 꽤 세다
- 인텔은 디노도에서 4000개 이상 데이터 모델을 운영·관리 중이라고 함
- 2014년부터 현재까지 단 한 차례의 다운타임 없이 서비스를 운영 중이라는 설명도 붙음
- 단순 데모가 아니라 장기 운영 사례를 강조한 셈임

기술 맥락

여기서 중요한 선택은 데이터를 AI 쪽으로 복사해 모으는 대신, 데이터 접근 계층을 따로 두는 거예요. 기업 데이터는 SAP, 오라클 데이터베이스, 레이크하우스처럼 여러 시스템에 흩어져 있거든요. 이걸 전부 옮기면 비용도 크고, 권한 관리도 다시 짜야 해서 일이 커져요.
데이터 가상화가 게이트키퍼 역할을 하는 이유는 AI가 직접 원천 시스템을 찌르지 않게 만들기 위해서예요. 중간 계층에서 어떤 데이터에 접근할 수 있는지, 어떤 의미로 해석해야 하는지, 최신 데이터는 어디서 가져와야 하는지를 관리하면 운영 리스크를 줄일 수 있어요.
중앙집중형 데이터 플랫폼이 나쁜 선택이라는 얘기는 아니에요. 다만 완전 마이그레이션이 어려운 기업, 특히 레거시와 클라우드가 섞인 조직에서는 논리적 통합이 더 현실적인 출발점이 될 수 있어요. AI 프로젝트가 PoC를 넘어 운영으로 가면 데이터 이동 비용보다 접근 통제와 일관성이 더 크게 터지거든요.
인텔의 4000개 이상 데이터 모델 운영 사례가 의미 있는 건 규모 때문이에요. 데이터 모델이 몇십 개일 때는 수작업 관리도 가능하지만, 수천 개 단위가 되면 중앙 정책, 쿼리 성능, 다운타임 관리가 플랫폼 선택의 핵심 기준이 돼요.

기업 AI 얘기에서 GPU나 모델만 보다가 데이터 연결 방식을 놓치면 실제 PoC 이후 운영 단계에서 바로 막힘. 레거시 데이터, 레이크하우스, 보안 정책을 한꺼번에 다뤄야 하는 조직일수록 데이터 가상화가 꽤 현실적인 카드가 될 수 있음.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-13

애플 새 음성 인식 API, 온디바이스 영어 전사에서 위스퍼 스몰까지 이겼다

애플의 새 음성 인식 API인 스피치애널라이저가 리브리스피치 벤치마크에서 기존 SFSpeechRecognizer는 물론 위스퍼 스몰보다도 낮은 단어 오류율을 기록했어. 깨끗한 음성에서는 2.12%, noisy 음성에서는 4.56%로, 기존 애플 API 대비 오류율을 3.5~4배 줄였고 위스퍼 스몰보다 약 3배 빠르게 돌았어. 다만 영어·애플 플랫폼·OS 26 조건의 결과라, 다국어와 크로스플랫폼에서는 여전히 위스퍼의 장점이 남아 있어.

ai-ml 2026-07-13

AI를 진짜 잘 쓰는 기업, 미국 증시에서 연 30% 프리미엄 받는다는 연구

예일대와 로체스터대 연구진이 기업의 실제 대형 언어 모델 사용 데이터를 분석했더니, AI 활용도가 높은 상위 20% 기업이 하위 20%보다 주당 평균 0.64% 높은 초과수익률을 냈다. 단순히 AI 기업이냐가 아니라, 업무에 AI를 얼마나 깊게 쓰는지가 시장 가치에 반영되고 있다는 얘기다.

ai-ml 2026-07-13

ZTE, AI 에이전트폰으로 스마트폰 재도전…진짜 승부처는 앱 생태계

ZTE가 바이트댄스의 더우바오를 탑재한 AI 에이전트 스마트폰으로 시장 재진입을 노린다. 핵심은 사용자가 명령하면 AI가 여러 앱을 직접 열고 조작하는 방식인데, 위챗·타오바오·알리페이 같은 플랫폼과 충돌하면서 생태계 문제가 가장 큰 변수로 떠올랐다.

ai-ml 2026-07-13

노벨상 학자들까지 “AI 경제 충격, 지금 제도 안 만들면 늦다”

노벨 경제학상 수상자 15명을 포함한 학자와 기술 업계 인사 약 200명이 AI가 향후 10년 안에 경제를 급격히 바꿀 수 있다며 정책 대응을 촉구했다. 이들은 산업혁명보다 큰 변화가 훨씬 짧은 시간에 올 수 있고, 대규모 일자리 대체와 생활 수준 향상이라는 양면성이 동시에 존재한다고 봤다.

ai-ml 2026-07-13

NHN, AI 데이터센터 매출 기대감에 목표주가 5만6000원으로 상향

한국투자증권이 NHN의 목표주가를 4만5000원에서 5만6000원으로 올리고 투자의견 매수를 유지했다. 핵심 근거는 양평 AI 데이터센터 가동, 공공·민간 GPU 클러스터 수주 확대, 클라우드 사업부 신규 매출 반영이다.

AI 도입의 병목은 모델이 아니라 데이터라는 디노도의 주장

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

AI 도입의 병목은 모델이 아니라 데이터라는 디노도의 주장

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사