JEFF NEWS에 참여하세요
북마크, 댓글, 투표 기능을 사용할 수 있습니다
© 2026 Jeff Yim
중국 문샷AI가 1조 파라미터 Kimi K2.6을 오픈소스로 공개했다. SWE-Bench Pro에서 Claude Opus 4.6을 앞서고 API 가격은 1/4 수준이다. 댄 왕의 <Breakneck>를 빌려 '짓는 나라(중국) vs 막는 나라(미국)' 구도를 제시하며, 미국 B2C의 구조적 적자와 한국의 세 가지 전략적 선택(A·B·C)을 짚는 칼럼.
엔비디아가 자율형 AI 에이전트 시장의 첫 글로벌 거점으로 한국을 택해 서울에서 '네모트론 디벨로퍼 데이즈 2026'을 열었다. 오픈소스 프레임워크 OpenClaw, 보안 런타임 OpenShell, 엔터프라이즈 서비스 NemoClaw로 이어지는 3층 스택과 1200억 파라미터 모델을 API 비용 없이 돌리는 DGX 스파크를 풀스택으로 엮어 수요를 흡수한다.
삼성SDS가 2031년까지 총 10조원을 투입해 AI 풀스택 기업으로 전환한다. AI 인프라 5조, 서비스·플랫폼 1조, M&A 4조로 나뉘며 이미 구미 60MW 데이터센터에 2.1조가 집행 중이다. 구글과 GDC·제미나이 엔터프라이즈 기반 소버린 AI 파트너십도 체결했다.
스탠퍼드대 HAI의 'AI 인덱스 2026' 보고서에서 한국의 주목할 만한 AI 모델 수가 5개에서 8개로 정정된다. 과기정통부가 근거 DB인 에포크 AI에 8개로 등재된 점을 들어 이의를 제기한 결과다. 추가된 3개는 SKT A.X K1, NC AI 배키, 네이버 하이퍼클로바 X 시드 32B 싱크다.
국가AI전략위원회가 AI 확산에 따른 인재 양성·교육체계 개편 방향을 논의하는 포럼을 개최했다. 전문가들은 AI로 인해 청년 노동시장에서 진입 차단과 경력 사다리 약화가 발생한다고 진단하며, 취업 지원 조기화와 AI 협업 중심 훈련 전환을 대안으로 제시했다.
구글이 Cloud Next에서 8세대 TPU 두 종을 공개했다. 훈련 특화 TPU 8t는 슈퍼팟당 9,600칩·121 ExaFlops, 추론 특화 TPU 8i는 KV 캐시 풋프린트 기준으로 SRAM을 사이징했다. 두 칩 모두 Axion ARM 호스트와 4세대 액체냉각을 쓰며 와트당 성능이 전세대 대비 2배다.
구글 클라우드 CEO 토마스 쿠리안이 Next 2026에서 애플의 차세대 AI 파운데이션 모델이 제미나이 기반으로 올해 말 공개된다고 밝혔다. 이 모델이 시리와 애플 인텔리전스 전반을 구동하며, 구글은 칩-모델-에이전트까지 통합된 풀스택 인프라를 애플에 공급한다.
구글 클라우드가 Cloud Next 2026에서 8세대 TPU(훈련용 8t, 추론용 8i), 제미나이 엔터프라이즈 에이전트 플랫폼, 버고 네트워크를 공개했다. 분당 160억 토큰을 처리하고 내부 신규 코드의 75%가 AI로 생성되는 등 구글 내부 생산성 지표도 공개했다.
카카오가 카카오톡에 온디바이스 에이전틱 AI '카나나'를 정식 출시했다. 대화 맥락을 실시간 감지해 먼저 제안하는 '선톡' 기능이 핵심이고, 외부 서비스 연동에는 MCP 방식의 '카카오툴즈'를 연결해 예약·구매·일정 등록까지 완결시킨다.
구글 클라우드가 Next 2026에서 기업용 에이전트 플랫폼과 8세대 TPU(훈련용 8t, 추론용 8i)를 동시 공개하며 오픈AI와 엔비디아를 동시에 타깃했다. 칩부터 에이전트까지 풀스택 수직계열화를 완성했고, 앤트로픽 클로드까지 플랫폼에서 돌릴 수 있게 열어놨다.
임상 데이터가 풍부한 아주대의료원과 콰트로 정밀의약 연구원, AI 연구 역량을 가진 목암생명과학연구소가 AI 기반 신약개발 협력 MOU를 체결함. 기초연구부터 임상·사업화·인허가까지 전주기 기술사업화를 목표로 다기관 협력 체계를 구축하려는 움직임임.
5월 6일 코엑스에서 열리는 AI TECH 2026에서 바이브컴퍼니·슈퍼브에이아이·엠아이큐브·디플리 등이 제조·물류·건설 현장에서의 실질적 AX 사례를 공유함. Deep Agent 진화, Vision AI MLOps 선순환, 폐쇄 루프 디지털 트윈, Sound AI 기반 이상음 탐지 등 다양한 적용 방식이 다뤄짐.
세계경제연구원·포스코 콘퍼런스에서 전문가들은 잠재성장률 2% 수렁의 한국 제조업 돌파구로 AI 접목을 제안함. 관건은 에너지 경쟁력과 규제 완화이며, SMR 도입·AI 전담 장관 등 구체적 사례가 제시됨. 국내 제조기업 90% 이상이 AI를 활용하지 않는 현실도 드러남.
GitHub이 Copilot 개인 요금제(Pro/Pro+/Student) 신규 가입을 일시 중단하고 사용량 한도를 조이는 조치를 발표함. 에이전틱 워크플로우가 토큰 소비를 감당 못 할 수준으로 끌어올리면서 '요청 몇 개가 플랜 가격을 초과하는' 상황이 흔해졌기 때문. Pro 플랜에서는 Opus 모델이 제거되고, Pro+에만 Opus 4.7이 남음.
Kimi가 K2.6 모델 공개와 함께 오픈소스 모델을 돌리는 추론 프로바이더들의 구현 정확도를 검증하는 KVV(Kimi Vendor Verifier)를 공개함. Pre-Verification, OCRBench, MMMU Pro, AIME2025, K2VV ToolCall, SWE-Bench 등 6개 벤치로 KV cache 버그, 양자화 degradation, ToolCall JSON Schema 오류 등을 잡아내고, vLLM/SGLang/KTransformers 업스트림에 직접 패치를 기여함.
엔비디아가 서울 네모트론 개발자 데이에서 로컬 AI '네모트론'과 에이전트 실행 환경 '네모클로'를 공개했다. 블랙웰 아키텍처로 효율 55배 개선, 1200억 파라미터 LLM '네모트론 3 울트라' 출시 예정, 한국어 데이터셋 '네모트론-페르소나-코리아'를 오픈소스로 공개했다. 클라우드 API 비용 부담 없이 기기 내부에서 AI를 돌리는 구조가 핵심이다.
중국 문샷AI가 오픈소스 LLM Kimi-K2.6을 공개했다. SwiGLU 활성화 함수, 384개 전문가 MoE 구조(프롬프트당 8개 활성), 멀티헤드 레이턴트 어텐션(MLA)을 채택해 하드웨어 효율을 극대화했다. 4억 파라미터 비전 인코더로 멀티모달 입력을 처리하고 최대 300개 에이전트 병렬 실행을 지원한다.
오픈AI가 LM아레나에서 '덕테이프'로 불리던 신모델을 '챗GPT 이미지 2.0'으로 공개했다. 자기회귀 방식으로 텍스트 깨짐 문제를 개선하고 추론 기반 인포그래픽 생성까지 지원한다. 같은 날 어도비는 오픈AI/앤스로픽/구글 모델을 오케스트레이션하는 CX엔터프라이즈로 브랜드 일관성 차별화 전략을 내놓으며 맞불을 놨다.
미국에서 10대 소녀들이 X를 상대로 Grok 기반 딥페이크 CSAM 소송을 제기하면서 AI 생성물과 아동보호법의 간극이 드러났다. 한국 대법원은 아동 얼굴 합성 딥페이크에 대해 '실제 아동 등장'이 아니라는 이유로 아동성착취물 제작죄를 적용하지 않았고, 2026년 2월 개정안이 이 공백을 메우려 하고 있지만 일률적 하한형 적용의 형벌 비례성 문제가 남아있다.
음악 스트리밍 서비스 Deezer가 플랫폼에 매일 업로드되는 신곡의 44%가 AI로 생성된 트랙이라고 공개했다. 하루 75,000곡 수준으로 1년 만에 7.5배 증가했지만, 실제 재생 비중은 1-3%에 불과하고 그중 85%는 부정 스트리밍으로 판정돼 수익에서 제외된다. 설문에서는 응답자의 97%가 AI 곡과 사람 곡을 구분하지 못했다.