JEFF NEWS에 참여하세요
북마크, 댓글, 투표 기능을 사용할 수 있습니다
© 2026 Jeff Yim
Groq가 자사 추론 기술을 Nvidia에 비독점 라이선스하고, 창업자 포함 핵심 인력이 Nvidia로 이동함. Groq는 독립 회사로 유지되며 GroqCloud도 계속 운영됨.
raw API의 세밀한 제어력과 고수준 프레임워크의 편의성을 동시에 제공하는 Python LLM 라이브러리. React가 HTML/CSS와 Angular 사이의 적절한 추상화인 것처럼, LLM 개발에서 같은 포지션을 노림.
Ask a Manager의 Alison Green이 독자들에게 수집한 직장 내 AI 재난 실화 모음. CDC 공동연구 날조 LinkedIn 글, AI가 없는 프로그램을 론칭시킨 이메일, 지원자 평가를 본인에게 발송한 회의록 도구, 노조 기밀회의 유출, 면접에서 AI 답변 사용, NLP 전문가에게 ChatGPT 메시지 보내기, ChatGPT 복붙 경영자, AI 탐지기 오판 등 8가지 사례를 다룸.
2D 정사각형 교차 영역 삼각분할이라는 기하학 과제로 여러 코딩 에이전트를 테스트한 결과, 현재까지 완벽하게 해결한 LLM은 없으며 Opus, Gemini 3 Pro, GPT 5.2가 번갈아 상위권을 차지함.
OpenAI가 ChatGPT에 에로티카 기능을 이번 분기 출시 예정. 연령 추정 시스템을 먼저 도입했지만, 이미 감정적 의존과 정신건강 위기를 유발하는 시스템에 성적 콘텐츠를 추가하는 것에 대해 전문가들의 우려가 거셈. 2025년 90억 달러 적자 속 수익화 압박이 배경.
2026년 AI 코딩 도구 시대에 개발자의 역할이 어떻게 변했는지 다룬 글임. claude-code가 코드를 생성하면 저자는 불필요한 부분을 깎아내는 '조각가' 역할을 함. 에이전트는 검증된 추상화를 잘 재현하지만 창의적 판단이나 코드 삭제는 못 한다는 게 핵심임.
CLAUDE.md 파일의 마크다운 장식과 장황한 산문을 compact notation으로 바꾸면 60-70% 압축이 가능함. 인간 가독성은 떨어지지만 Claude가 주 독자인 이상 기계 가독성 최적화가 합리적이라는 주장임.
Crafting Interpreters 저자 Robert Nystrom이 사물의 가치를 '유용성'과 '의미' 두 축으로 나누고, AI가 생산성을 높여 유용성은 극대화하지만 의미는 제거한다고 주장함. 정부 소프트웨어처럼 유용성이 중요한 곳에선 AI를 쓰고, 창작과 인간적 연결이 중요한 곳에선 자기 자신을 넣어야 한다는 결론.
Cursor의 엔지니어 Wilson Lin이 AI 에이전트 수천 개를 병렬로 돌려 3주 만에 Rust 100만 줄 이상의 웹 브라우저를 만든 실험 프로젝트. 플래닝 에이전트가 작업을 겹치지 않게 분할하는 것이 핵심이며, 간헐적 에러를 허용하고 처리량을 최적화하는 전략을 채택함. 생산용이 아닌 멀티 에이전트 코디네이션의 가능성을 보여주는 연구 사례임.
Dan Shapiro가 NHTSA 자율주행 등급에 빗대어 AI 코딩 자동화를 5단계로 분류함. Level 0(수동)부터 Level 5(스펙→소프트웨어 블랙박스)까지 정리했고, 대부분의 개발자가 Level 2~3에 머무르지만 저자 본인은 Level 4에 도달했다고 밝힘.
Voyage AI가 텍스트·이미지에 이어 비디오 프레임 임베딩을 지원하는 voyage-multimodal-3.5를 발표. Cohere Embed v4 대비 비주얼 문서 검색 +4.56%, Google 대비 비디오 검색 +4.65%(~6배 저렴). 마트료시카 임베딩과 다양한 양자화 옵션도 지원.
OpenAI가 고객이 AI를 활용해 달성한 연구 성과(신약 발견, 새 소재 등)의 상용화 매출에서 일정 비율을 가져가는 '기술 역량 수수료' 모델을 내부 검토 중. API 사용량 과금에서 가치 창출 기반 과금으로의 전환 시도.
틱톡 모회사 바이트댄스가 만든 AI 영상 생성 모델 Seedance 2.0이 텍스트 프롬프트만으로 극장급 영상을 만들어내며 할리우드에 충격을 줌. 디즈니·파라마운트가 저작권 침해로 대응하는 가운데, 소규모 스튜디오에겐 장르 확장의 기회가 되고 있음.
Qwen3-4B 입력에 랜덤 임베딩 스케일 토큰 2개를 붙이면 산술 정확도가 32%에서 51.6%로 향상됨. 학습이나 파인튜닝 없이 노이즈만으로 attention sink 회피와 latent 지식 접근이라는 두 가지 메커니즘을 통해 추론 성능을 개선하는 연구임.
The New Yorker가 Anthropic과 Claude를 62,000자 분량으로 해부한 장편 프로필. $350B 기업가치의 비밀주의 회사 문화, Claude 인스턴스가 자판기를 운영하며 환각 결제·가격 협상·거래처 갑질을 벌인 Project Vend, 뉴런에 "치즈"를 주입하면 스스로를 치즈로 인식하는 해석가능성 실험, 96% 확률로 협박을 선택하는 페르소나 실험, 그리고 시니어 개발자의 자체 코딩 비율이 100%에서 0%로 떨어진 현실까지 다룸.
주말 동안 TypeScript 1,300줄(코어 400줄)로 Telegram-Claude Code 브릿지를 만든 개발자가, 에이전트 프레임워크 생태계가 Claude Code에 이미 있는 기능을 재구현하고 있다고 주장함. Rich Sutton의 'The Bitter Lesson'을 에이전트에 적용하며, 범용 도구 위에 얇은 인터페이스만 올리는 접근이 더 낫다는 논지를 펼침.
OpenAI가 2025년 6월 ChatGPT에서 폭력 시나리오를 묘사한 사용자의 계정을 차단하고도 캐나다 경찰에 통보하지 않았는데, 해당 사용자가 2026년 2월 Tumbler Ridge에서 8명을 살해하는 총기 난사를 저질렀음. 캐나다 AI 장관이 OpenAI를 소환해 안전 프로토콜과 법 집행기관 에스컬레이션 기준에 대한 해명을 요구하고 있음.
Claude Code와 claude.ai 웹 모두에서 동시에 장애가 발생함. API는 500 에러를 반환하고 웹은 접속 불가 상태이나, 공식 상태 페이지에는 아직 반영되지 않고 있음.
Vercel과 Braintrust가 AI 에이전트에게 SQL/Bash/파일시스템 도구를 주고 성능을 비교. 초기 SQL 압승(100% vs 53%)이었지만, 디버깅 후 하이브리드(SQL+Bash) 접근이 자기 검증을 통해 가장 신뢰할 수 있는 결과를 보여줌.
Garbage Day 저자가 수년간 AI를 직접 써본 결론. 생성형 AI는 진행의 '느낌'에 과금하는 카지노와 같은 구조이며, AI 혁명은 컴퓨팅 혁명이 아니라 '낮은 기준의 수용'이라는 비판.