AI/ML

b/ai-ml • 2026. 3. 30.

Raspberry Pi에서 Ollama로 로컬 LLM 5분 만에 돌리기

Raspberry Pi 5/500+에서 양자화된 1~4B 파라미터 모델을 Ollama로 설치하고 실행하는 과정을 다룸. 여러 소형 모델을 검토한 끝에 qwen2.5를 선택했으며, GPU나 클라우드 없이도 텍스트 생성, 추론, 코딩이 가능함.

raspberry-pi ollama llm

댓글 공유 약 3분

b/ai-ml • 2026. 3. 30.

AI 헬스 도구 쏟아지는데 독립적 검증은 어디에? — 벤치마크와 실사용 간극 문제

Microsoft, Amazon, OpenAI, Anthropic 등 빅테크의 AI 헬스 도구가 동시다발적으로 출시되고 있지만, 독립적 제3자 평가 없이 시장에 나오고 있다는 우려가 커지고 있음. Oxford 연구에서 LLM 자체 성능과 비전문가 사용자의 실제 활용 성능 사이의 큰 간극이 확인됨.

llm healthcare openai

댓글 공유 약 6분

b/ai-ml • 2026. 3. 30.

Google ADK for Java 1.0.0 출시 — 플러그인, 컨텍스트 엔지니어링, A2A까지 갖춘 에이전트 프레임워크

Google의 오픈소스 Agent Development Kit(ADK)가 Java 1.0.0을 정식 출시함. 플러그인 아키텍처, 이벤트 컴팩션, Human-in-the-Loop, A2A 프로토콜 등 프로덕션급 에이전트 운영에 필요한 핵심 기능을 체계적으로 갖추고 있음.

google adk java

댓글 공유 약 6분

b/ai-ml • 2026. 3. 30.

Salesforce, 음성 RAG 검색 지연을 316배 줄이는 VoiceAgentRAG 오픈소스 공개

Salesforce AI Research가 음성 에이전트의 RAG 검색 지연 문제를 해결하는 듀얼 에이전트 아키텍처 VoiceAgentRAG를 오픈소스로 공개함. Fast Talker(포그라운드)와 Slow Thinker(백그라운드)가 비동기로 협업해 캐시 히트 시 316배 속도 향상(110ms→0.35ms)을 달성하며, 전체 75% 캐시 히트율을 기록함.

salesforce rag voice-ai

댓글 공유 약 7분

b/ai-ml • 2026. 3. 30.

Microsoft 365 Copilot, GPT가 작성하고 Claude가 검증하는 멀티모델 체제 도입

Microsoft가 Copilot Cowork를 Frontier 프로그램으로 확대하고, Researcher 에이전트에 GPT 초안 작성 + Claude 검증의 멀티모델 Critique 기능을 추가함. Deep Research 벤치마크에서 경쟁 제품을 상회하는 성능을 보이며, 향후 양방향 검증으로 확장 예정임.

microsoft copilot claude

댓글 공유 약 5분

b/ai-ml • 2026. 3. 30.

Anthropic의 최강 AI 모델 'Mythos', CMS 데이터 유출로 존재 드러남

Anthropic의 차세대 AI 모델 Mythos가 CMS 설정 오류로 인해 유출됨. 재귀적 자기 수정 등 강력한 사이버보안 관련 기능을 갖추고 있으며, 엔터프라이즈 보안 팀 대상 단계적 출시를 계획 중임. CrowdStrike 등 사이버보안 기업 주가가 하락하는 등 시장에도 즉각적 영향을 미침.

anthropic cybersecurity llm

댓글 공유 약 5분

b/ai-ml • 2026. 3. 30.

Deloitte AI 인프라 서베이 - 2028년까지 예산 3배, 토큰 소비 2배, AI 팩토리 88% 도입 전망

Deloitte의 엔터프라이즈 AI 인프라 서베이 결과. 2028년까지 AI 인프라 예산 3배+ 성장, 토큰 소비량 2배 증가, AI 팩토리 배포 88% 도달이 예상됨. HBM 비용 상승, 인재 부족, 전력 공급 등이 주요 과제로 부상함.

ai-infrastructure deloitte enterprise

댓글 공유 약 4분

b/ai-ml • 2026. 3. 30.

2026 중관촌 포럼 - 아시아 최초 4세대 싱크로트론, AI칩 20종 지원 FlagOS 2.0 등 21개 성과 공개

2026 중관촌 포럼 폐막식에서 AI, 우주항공, 반도체, 헬스케어 등 21개 주요 과학기술 성과가 발표됨. 아시아 최초 4세대 고에너지 싱크로트론 HEPS와 20종+ AI 칩을 지원하는 오픈소스 FlagOS 2.0이 주요 하이라이트임.

china synchrotron open-source

댓글 공유 약 2분

b/ai-ml • 2026. 3. 29.

OpenClaw 열풍이 드러낸 중국 AI 에이전트의 보안 위기와 규제 딜레마

중국에서 오픈소스 AI 에이전트 OpenClaw이 폭발적으로 확산되며 데이터 유출, 파일 삭제, 과금 등 문제가 속출하고 있음. 중국 정부는 2027년까지 AI 에이전트 보급률 70% 목표를 유지하면서도, 국유기업 사용 금지, 가이드라인 발표, 에이전트 ID 발급 검토 등 규제를 병행 중임.

ai-agent openclaw china

댓글 공유 약 4분

b/ai-ml • 2026. 3. 29.

MCP가 AI를 '채팅 도구'에서 '업무 실행자'로 전환시키고 있다

Anthropic의 MCP(Model Context Protocol)를 중심으로 Shopify, Shippo, Beehiiv 등 이커머스/SaaS 기업들이 AI 시스템에 비즈니스 도구를 직접 노출하는 통합을 도입하고 있음. MCP는 API를 대체하는 게 아니라 보완하며, AI를 대화 도구에서 비즈니스 오퍼레이터로 전환시키는 흐름을 보여줌.

mcp anthropic ai-agent

댓글 공유 약 3분

b/ai-ml • 2026. 3. 30.

Gartner: 2030년 토큰 단가 90% 이상 하락하지만, AI Agent 시대엔 기업 비용은 오히려 증가

Gartner가 2030년까지 LLM 추론 비용이 90% 이상 하락할 것으로 예측했으나, AI Agent의 토큰 소비량(5~30배)으로 기업 전체 비용은 오히려 증가할 수 있다고 경고함. 핵심 전략은 멀티모델 오케스트레이션.

llm inference-cost gartner

댓글 공유 약 3분

b/ai-ml • 2026. 3. 30.

AI가 펀드매니저가 된 시대 — 헤지펀드 업계 AI 도입 현황 총정리

헤지펀드 매니저 86%가 GenAI를 사용하고 있으며, Point72 Turion 펀드(14.2% 수익), Minotaur Capital(인간 애널리스트 0명, 13.7% 수익) 등 AI 전용 펀드가 실제 성과를 내고 있음. Balyasny는 자체 금융 특화 AI로 OpenAI 범용 모델 대비 20%p 높은 정확도를 달성함.

hedge-fund agentic-ai fintech

댓글 공유 약 4분

b/ai-ml • 2026. 3. 30.

Anthropic Claude Mythos 모델 유출 — 예측 시장에서 출시 확률 72%

Anthropic 데이터베이스 보안 사고로 Claude Mythos 모델 정보가 유출됨. Claude 4 Opus 대비 추론·코딩·사이버보안에서 큰 성능 향상을 보이며, Polymarket에서 6월까지 공개 출시 확률 72%로 거래 중.

anthropic claude llm

댓글 공유 약 3분

b/ai-ml • 2026. 3. 30.

MIT, LLM의 과신을 잡아내는 새로운 불확실성 측정법 제안

MIT 연구진이 여러 LLM 간 응답 불일치(epistemic uncertainty)를 측정해 자기 일관성(aleatoric uncertainty)과 합산하는 Total Uncertainty 메트릭을 제안함. 10개 태스크에서 기존 방법을 일관되게 능가하며, 더 적은 쿼리로도 동작함.

llm uncertainty-quantification hallucination

댓글 공유 약 4분

b/ai-ml • 2026. 3. 30.

케이맨 펀드 플랫폼 CV5 Capital, 펀드 문서 자동화용 자체 LLM 도입

케이맨 제도 기반 펀드 플랫폼 CV5 Capital이 헤지펀드 및 디지털 자산 펀드의 문서 워크플로우 자동화를 위한 자체 LLM을 배포했다고 발표. 실질적으로는 기업 보도자료이며 기술적 세부사항은 거의 공개되지 않음.

llm fintech fund-management

댓글 공유 약 2분

b/ai-ml • 2026. 3. 30.

Nvidia CMX/STX로 본 KV Cache 확장 생태계 총정리

Nvidia가 GTC 2026에서 발표한 CMX 플랫폼과 STX 레퍼런스 아키텍처를 중심으로 KV Cache 확장 생태계를 상세히 분석. GPU HBM → CPU DRAM → 로컬 SSD → 네트워크 스토리지의 4-tier 계층 구조에 BlueField-4 DPU를 핵심으로 하는 새로운 G3.5 tier가 추가됨. 15개 이상의 스토리지 파트너와 8개 얼리 어답터가 참여하며 2026년 하반기 출시 예정.

nvidia kv-cache llm-inference

댓글 공유 약 7분

b/ai-ml • 2026. 3. 28.

CERN, 업계와 정반대로 간다 — 나노초 추론을 위해 초소형 AI를 FPGA에 직접 태움

CERN이 LHC의 연간 4만 엑사바이트 데이터를 실시간 필터링하기 위해 GPU/TPU 대신 초소형 AI 모델을 FPGA/ASIC에 물리적으로 구현하는 접근법을 쓰고 있음. 50나노초 이내에 충돌 이벤트의 99.98%를 버리고 0.02%만 남기는 극한의 엣지 AI.

fpga ai cern

댓글 공유 약 4분

b/ai-ml • 2026. 3. 29.

AI 안면인식으로 1,000마일 밖 무고한 할머니가 5개월 수감 — Clearview AI 오인 사건

테네시 거주 50세 할머니가 Clearview AI 안면인식으로 한 번도 가본 적 없는 노스다코타의 은행 사기 용의자로 지목되어 5개월간 수감됨. 은행 기록으로 무죄가 밝혀진 후 크리스마스 이브에 석방.

ai facial-recognition clearview-ai

댓글 공유 약 4분

b/ai-ml • 2026. 3. 27.

이란 학교 폭격의 범인은 AI가 아니라 업데이트 안 된 데이터베이스와 시간당 1,000건의 킬 체인이었음

이란 초등학교 폭격 후 여론은 Claude AI를 탓했지만, 실제 타겟팅은 Palantir의 Maven 시스템이 수행함. DIA 데이터베이스가 학교 전환 사실을 반영하지 않은 것이 직접적 원인이며, 시간당 1,000건 타겟팅이라는 킬 체인 압축이 판단의 여지를 제거한 구조적 문제를 심층 분석한 기사.

ai military palantir

댓글 공유 약 9분

b/ai-ml • 2026. 3. 26.

연방 판사, 펜타곤의 Anthropic 공급망 위험 지정 차단함

연방 판사가 펜타곤이 Anthropic에 공급망 위험 딱지를 붙인 조치를 무기한 차단. 자율 무기·대규모 감시 거부한 Anthropic에 대한 보복이 수정헌법 제1조 위반이라고 판결. 수억 달러 규모 계약이 걸린 사안으로 국방부는 항소 예정.

anthropic pentagon ai-policy

댓글 공유 약 4분