AI/ML

b/ai-ml • 2025. 12. 24.

Groq, Nvidia와 추론 기술 비독점 라이선스 계약 체결

Groq가 자사 추론 기술을 Nvidia에 비독점 라이선스하고, 창업자 포함 핵심 인력이 Nvidia로 이동함. Groq는 독립 회사로 유지되며 GroqCloud도 계속 운영됨.

댓글 공유 약 2분

b/ai-ml • 2026. 1. 26.

Mirascope – LLM 안티프레임워크

raw API의 세밀한 제어력과 고수준 프레임워크의 편의성을 동시에 제공하는 Python LLM 라이브러리. React가 HTML/CSS와 Angular 사이의 적절한 추상화인 것처럼, LLM 개발에서 같은 포지션을 노림.

llm python anti-framework

댓글 공유 약 3분

b/ai-ml • 2026. 1. 26.

AI가 직장을 '혁신'한다더니, 실제로는 사무실을 카오스로 만들고 있음

Ask a Manager의 Alison Green이 독자들에게 수집한 직장 내 AI 재난 실화 모음. CDC 공동연구 날조 LinkedIn 글, AI가 없는 프로그램을 론칭시킨 이메일, 지원자 평가를 본인에게 발송한 회의록 도구, 노조 기밀회의 유출, 면접에서 AI 답변 사용, NLP 전문가에게 ChatGPT 메시지 보내기, ChatGPT 복붙 경영자, AI 탐지기 오판 등 8가지 사례를 다룸.

ai workplace chatgpt

댓글 공유 약 6분

b/ai-ml • 2025. 12. 26.

Square Minus Square - 코딩 에이전트 벤치마크

2D 정사각형 교차 영역 삼각분할이라는 기하학 과제로 여러 코딩 에이전트를 테스트한 결과, 현재까지 완벽하게 해결한 LLM은 없으며 Opus, Gemini 3 Pro, GPT 5.2가 번갈아 상위권을 차지함.

coding-agent benchmark llm

댓글 공유 약 2분

b/ai-ml • 2026. 1. 25.

ChatGPT가 에로티카 기능을 출시하려 하는데, 안전성 우려가 쏟아지고 있음

OpenAI가 ChatGPT에 에로티카 기능을 이번 분기 출시 예정. 연령 추정 시스템을 먼저 도입했지만, 이미 감정적 의존과 정신건강 위기를 유발하는 시스템에 성적 콘텐츠를 추가하는 것에 대해 전문가들의 우려가 거셈. 2025년 90억 달러 적자 속 수익화 압박이 배경.

openai chatgpt safety

댓글 공유 약 5분

b/ai-ml • 2026. 1. 24.

나는 더 이상 코드를 짜지 않는다 – 조각한다

2026년 AI 코딩 도구 시대에 개발자의 역할이 어떻게 변했는지 다룬 글임. claude-code가 코드를 생성하면 저자는 불필요한 부분을 깎아내는 '조각가' 역할을 함. 에이전트는 검증된 추상화를 잘 재현하지만 창의적 판단이나 코드 삭제는 못 한다는 게 핵심임.

ai-coding claude-code developer-experience

댓글 공유 약 2분

b/ai-ml • 2026. 2. 24.

CLAUDE.md 시스템 프롬프트, 60-70% 압축하는 방법

CLAUDE.md 파일의 마크다운 장식과 장황한 산문을 compact notation으로 바꾸면 60-70% 압축이 가능함. 인간 가독성은 떨어지지만 Claude가 주 독자인 이상 기계 가독성 최적화가 합리적이라는 주장임.

claude-code prompt-engineering context-window

댓글 공유 약 5분

b/ai-ml • 2026. 1. 24.

AI가 만들 수 없는 것: 유용성과 의미에 대하여 (Crafting Interpreters 저자)

Crafting Interpreters 저자 Robert Nystrom이 사물의 가치를 '유용성'과 '의미' 두 축으로 나누고, AI가 생산성을 높여 유용성은 극대화하지만 의미는 제거한다고 주장함. 정부 소프트웨어처럼 유용성이 중요한 곳에선 AI를 쓰고, 창작과 인간적 연결이 중요한 곳에선 자기 자신을 넣어야 한다는 결론.

ai creativity philosophy

댓글 공유 약 5분

b/ai-ml • 2026. 1. 23.

에이전트 2,000개를 동시에 돌려서 브라우저를 만들어버린 Cursor의 FastRender 프로젝트

Cursor의 엔지니어 Wilson Lin이 AI 에이전트 수천 개를 병렬로 돌려 3주 만에 Rust 100만 줄 이상의 웹 브라우저를 만든 실험 프로젝트. 플래닝 에이전트가 작업을 겹치지 않게 분할하는 것이 핵심이며, 간헐적 에러를 허용하고 처리량을 최적화하는 전략을 채택함. 생산용이 아닌 멀티 에이전트 코디네이션의 가능성을 보여주는 연구 사례임.

multi-agent cursor browser

댓글 공유 약 6분

b/ai-ml • 2026. 1. 23.

AI 코딩 자동화 5단계 — 매운맛 자동완성에서 암흑 공장까지

Dan Shapiro가 NHTSA 자율주행 등급에 빗대어 AI 코딩 자동화를 5단계로 분류함. Level 0(수동)부터 Level 5(스펙→소프트웨어 블랙박스)까지 정리했고, 대부분의 개발자가 Level 2~3에 머무르지만 저자 본인은 Level 4에 도달했다고 밝힘.

ai-coding automation llm

댓글 공유 약 3분

b/ai-ml • 2026. 1. 23.

Voyage AI, 비디오 임베딩 지원하는 차세대 멀티모달 검색 모델 voyage-multimodal-3.5 발표

Voyage AI가 텍스트·이미지에 이어 비디오 프레임 임베딩을 지원하는 voyage-multimodal-3.5를 발표. Cohere Embed v4 대비 비주얼 문서 검색 +4.56%, Google 대비 비디오 검색 +4.65%(~6배 저렴). 마트료시카 임베딩과 다양한 양자화 옵션도 지원.

embedding multimodal video-retrieval

댓글 공유 약 3분

b/ai-ml • 2026. 1. 23.

OpenAI, 고객의 AI 활용 연구 성과에서 수익 일부를 가져가는 모델 검토 중

OpenAI가 고객이 AI를 활용해 달성한 연구 성과(신약 발견, 새 소재 등)의 상용화 매출에서 일정 비율을 가져가는 '기술 역량 수수료' 모델을 내부 검토 중. API 사용량 과금에서 가치 창출 기반 과금으로의 전환 시도.

openai business-model ai

댓글 공유 약 3분

b/ai-ml • 2026. 2. 23.

바이트댄스 Seedance 2.0, 할리우드를 패닉에 빠뜨린 중국 AI 영상 생성 모델

틱톡 모회사 바이트댄스가 만든 AI 영상 생성 모델 Seedance 2.0이 텍스트 프롬프트만으로 극장급 영상을 만들어내며 할리우드에 충격을 줌. 디즈니·파라마운트가 저작권 침해로 대응하는 가운데, 소규모 스튜디오에겐 장르 확장의 기회가 되고 있음.

ai video-generation bytedance

댓글 공유 약 4분

b/ai-ml • 2025. 12. 22.

랜덤 노이즈 2개로 LLM 추론 능력이 올라감 — 학습 없이, 파인튜닝 없이

Qwen3-4B 입력에 랜덤 임베딩 스케일 토큰 2개를 붙이면 산술 정확도가 32%에서 51.6%로 향상됨. 학습이나 파인튜닝 없이 노이즈만으로 attention sink 회피와 latent 지식 접근이라는 두 가지 메커니즘을 통해 추론 성능을 개선하는 연구임.

llm reasoning prompt-engineering

댓글 공유 약 7분

b/ai-ml • 2026. 2. 23.

Claude란 무엇인가? Anthropic도 모른다 — 자판기 운영부터 협박 실험까지, The New Yorker 장편 해부

The New Yorker가 Anthropic과 Claude를 62,000자 분량으로 해부한 장편 프로필. $350B 기업가치의 비밀주의 회사 문화, Claude 인스턴스가 자판기를 운영하며 환각 결제·가격 협상·거래처 갑질을 벌인 Project Vend, 뉴런에 "치즈"를 주입하면 스스로를 치즈로 인식하는 해석가능성 실험, 96% 확률로 협박을 선택하는 페르소나 실험, 그리고 시니어 개발자의 자체 코딩 비율이 100%에서 0%로 떨어진 현실까지 다룸.

anthropic claude ai-safety

댓글 공유 약 6분

b/ai-ml • 2026. 2. 23.

Bareclaw: Claude Code만 있으면 된다 — 에이전트 프레임워크 불필요론

주말 동안 TypeScript 1,300줄(코어 400줄)로 Telegram-Claude Code 브릿지를 만든 개발자가, 에이전트 프레임워크 생태계가 Claude Code에 이미 있는 기능을 재구현하고 있다고 주장함. Rich Sutton의 'The Bitter Lesson'을 에이전트에 적용하며, 범용 도구 위에 얇은 인터페이스만 올리는 접근이 더 낫다는 논지를 펼침.

claude-code ai-agent telegram

댓글 공유 약 7분

b/ai-ml • 2026. 2. 23.

캐나다, 총기 난사범 계정 차단하고도 경찰에 안 알린 OpenAI 조사 착수

OpenAI가 2025년 6월 ChatGPT에서 폭력 시나리오를 묘사한 사용자의 계정을 차단하고도 캐나다 경찰에 통보하지 않았는데, 해당 사용자가 2026년 2월 Tumbler Ridge에서 8명을 살해하는 총기 난사를 저질렀음. 캐나다 AI 장관이 OpenAI를 소환해 안전 프로토콜과 법 집행기관 에스컬레이션 기준에 대한 해명을 요구하고 있음.

openai ai-safety regulation

댓글 공유 약 4분

b/ai-ml • 2026. 1. 22.

Claude 서비스 장애 발생 — API 500 에러, 웹도 먹통

Claude Code와 claude.ai 웹 모두에서 동시에 장애가 발생함. API는 500 에러를 반환하고 웹은 접속 불가 상태이나, 공식 상태 페이지에는 아직 반영되지 않고 있음.

claude api-outage anthropic

댓글 공유 약 2분

b/ai-ml • 2026. 1. 22.

"Bash면 다 된다"를 실제로 벤치마크해봤더니 — SQL 압승, 하이브리드가 최적

Vercel과 Braintrust가 AI 에이전트에게 SQL/Bash/파일시스템 도구를 주고 성능을 비교. 초기 SQL 압승(100% vs 53%)이었지만, 디버깅 후 하이브리드(SQL+Bash) 접근이 자기 검증을 통해 가장 신뢰할 수 있는 결과를 보여줌.

ai-agent bash sql

댓글 공유 약 4분

b/ai-ml • 2026. 1. 22.

생성형 AI는 비싼 에징 머신 — 만드는 '느낌'만 팔고 결과물은 쓰레기

Garbage Day 저자가 수년간 AI를 직접 써본 결론. 생성형 AI는 진행의 '느낌'에 과금하는 카지노와 같은 구조이며, AI 혁명은 컴퓨팅 혁명이 아니라 '낮은 기준의 수용'이라는 비판.

ai-critique generative-ai openai

댓글 공유 약 4분