JEFF NEWS에 참여하세요
북마크, 댓글, 투표 기능을 사용할 수 있습니다
© 2026 Jeff Yim
Raspberry Pi 5/500+에서 양자화된 1~4B 파라미터 모델을 Ollama로 설치하고 실행하는 과정을 다룸. 여러 소형 모델을 검토한 끝에 qwen2.5를 선택했으며, GPU나 클라우드 없이도 텍스트 생성, 추론, 코딩이 가능함.
Microsoft, Amazon, OpenAI, Anthropic 등 빅테크의 AI 헬스 도구가 동시다발적으로 출시되고 있지만, 독립적 제3자 평가 없이 시장에 나오고 있다는 우려가 커지고 있음. Oxford 연구에서 LLM 자체 성능과 비전문가 사용자의 실제 활용 성능 사이의 큰 간극이 확인됨.
Google의 오픈소스 Agent Development Kit(ADK)가 Java 1.0.0을 정식 출시함. 플러그인 아키텍처, 이벤트 컴팩션, Human-in-the-Loop, A2A 프로토콜 등 프로덕션급 에이전트 운영에 필요한 핵심 기능을 체계적으로 갖추고 있음.
Salesforce AI Research가 음성 에이전트의 RAG 검색 지연 문제를 해결하는 듀얼 에이전트 아키텍처 VoiceAgentRAG를 오픈소스로 공개함. Fast Talker(포그라운드)와 Slow Thinker(백그라운드)가 비동기로 협업해 캐시 히트 시 316배 속도 향상(110ms→0.35ms)을 달성하며, 전체 75% 캐시 히트율을 기록함.
Microsoft가 Copilot Cowork를 Frontier 프로그램으로 확대하고, Researcher 에이전트에 GPT 초안 작성 + Claude 검증의 멀티모델 Critique 기능을 추가함. Deep Research 벤치마크에서 경쟁 제품을 상회하는 성능을 보이며, 향후 양방향 검증으로 확장 예정임.
Anthropic의 차세대 AI 모델 Mythos가 CMS 설정 오류로 인해 유출됨. 재귀적 자기 수정 등 강력한 사이버보안 관련 기능을 갖추고 있으며, 엔터프라이즈 보안 팀 대상 단계적 출시를 계획 중임. CrowdStrike 등 사이버보안 기업 주가가 하락하는 등 시장에도 즉각적 영향을 미침.
Deloitte의 엔터프라이즈 AI 인프라 서베이 결과. 2028년까지 AI 인프라 예산 3배+ 성장, 토큰 소비량 2배 증가, AI 팩토리 배포 88% 도달이 예상됨. HBM 비용 상승, 인재 부족, 전력 공급 등이 주요 과제로 부상함.
2026 중관촌 포럼 폐막식에서 AI, 우주항공, 반도체, 헬스케어 등 21개 주요 과학기술 성과가 발표됨. 아시아 최초 4세대 고에너지 싱크로트론 HEPS와 20종+ AI 칩을 지원하는 오픈소스 FlagOS 2.0이 주요 하이라이트임.
중국에서 오픈소스 AI 에이전트 OpenClaw이 폭발적으로 확산되며 데이터 유출, 파일 삭제, 과금 등 문제가 속출하고 있음. 중국 정부는 2027년까지 AI 에이전트 보급률 70% 목표를 유지하면서도, 국유기업 사용 금지, 가이드라인 발표, 에이전트 ID 발급 검토 등 규제를 병행 중임.
Anthropic의 MCP(Model Context Protocol)를 중심으로 Shopify, Shippo, Beehiiv 등 이커머스/SaaS 기업들이 AI 시스템에 비즈니스 도구를 직접 노출하는 통합을 도입하고 있음. MCP는 API를 대체하는 게 아니라 보완하며, AI를 대화 도구에서 비즈니스 오퍼레이터로 전환시키는 흐름을 보여줌.
Gartner가 2030년까지 LLM 추론 비용이 90% 이상 하락할 것으로 예측했으나, AI Agent의 토큰 소비량(5~30배)으로 기업 전체 비용은 오히려 증가할 수 있다고 경고함. 핵심 전략은 멀티모델 오케스트레이션.
헤지펀드 매니저 86%가 GenAI를 사용하고 있으며, Point72 Turion 펀드(14.2% 수익), Minotaur Capital(인간 애널리스트 0명, 13.7% 수익) 등 AI 전용 펀드가 실제 성과를 내고 있음. Balyasny는 자체 금융 특화 AI로 OpenAI 범용 모델 대비 20%p 높은 정확도를 달성함.
Anthropic 데이터베이스 보안 사고로 Claude Mythos 모델 정보가 유출됨. Claude 4 Opus 대비 추론·코딩·사이버보안에서 큰 성능 향상을 보이며, Polymarket에서 6월까지 공개 출시 확률 72%로 거래 중.
MIT 연구진이 여러 LLM 간 응답 불일치(epistemic uncertainty)를 측정해 자기 일관성(aleatoric uncertainty)과 합산하는 Total Uncertainty 메트릭을 제안함. 10개 태스크에서 기존 방법을 일관되게 능가하며, 더 적은 쿼리로도 동작함.
케이맨 제도 기반 펀드 플랫폼 CV5 Capital이 헤지펀드 및 디지털 자산 펀드의 문서 워크플로우 자동화를 위한 자체 LLM을 배포했다고 발표. 실질적으로는 기업 보도자료이며 기술적 세부사항은 거의 공개되지 않음.
Nvidia가 GTC 2026에서 발표한 CMX 플랫폼과 STX 레퍼런스 아키텍처를 중심으로 KV Cache 확장 생태계를 상세히 분석. GPU HBM → CPU DRAM → 로컬 SSD → 네트워크 스토리지의 4-tier 계층 구조에 BlueField-4 DPU를 핵심으로 하는 새로운 G3.5 tier가 추가됨. 15개 이상의 스토리지 파트너와 8개 얼리 어답터가 참여하며 2026년 하반기 출시 예정.
CERN이 LHC의 연간 4만 엑사바이트 데이터를 실시간 필터링하기 위해 GPU/TPU 대신 초소형 AI 모델을 FPGA/ASIC에 물리적으로 구현하는 접근법을 쓰고 있음. 50나노초 이내에 충돌 이벤트의 99.98%를 버리고 0.02%만 남기는 극한의 엣지 AI.
테네시 거주 50세 할머니가 Clearview AI 안면인식으로 한 번도 가본 적 없는 노스다코타의 은행 사기 용의자로 지목되어 5개월간 수감됨. 은행 기록으로 무죄가 밝혀진 후 크리스마스 이브에 석방.
이란 초등학교 폭격 후 여론은 Claude AI를 탓했지만, 실제 타겟팅은 Palantir의 Maven 시스템이 수행함. DIA 데이터베이스가 학교 전환 사실을 반영하지 않은 것이 직접적 원인이며, 시간당 1,000건 타겟팅이라는 킬 체인 압축이 판단의 여지를 제거한 구조적 문제를 심층 분석한 기사.
연방 판사가 펜타곤이 Anthropic에 공급망 위험 딱지를 붙인 조치를 무기한 차단. 자율 무기·대규모 감시 거부한 Anthropic에 대한 보복이 수정헌법 제1조 위반이라고 판결. 수억 달러 규모 계약이 걸린 사안으로 국방부는 항소 예정.