JEFF NEWS에 참여하세요
북마크, 댓글, 투표 기능을 사용할 수 있습니다
© 2026 Jeff Yim
Node.js/Fastify/Undici 메인테이너가 AI 시대에도 인간의 리뷰와 판단력이 핵심이라고 주장하는 반론
여러 소형 AI 모델이 병렬로 작업하고 교차 평가하는 NSED 프로토콜이 오픈소스로 공개됨. 20B+8B+12B 모델 3개로 소비자 하드웨어에서 AIME 2025 84%를 달성해 DeepSeek-R1 동급, GPT-5와 1점 차 성능을 보여줌.
AI 모델 정보를 통합 조회할 수 있는 오픈소스 데이터베이스. API를 통해 프로그래밍 방식으로 접근 가능하고, GitHub에 TOML 파일로 데이터가 관리되어 커뮤니티 기여가 가능함.
트랜스포머 아키텍처, 추론 최적화, 디코딩 전략, 프롬프트 엔지니어링, 파인튜닝까지 LLM 전 범위를 커버하는 면접 질문 모음집. 각 질문에 답변 링크가 달려있어 체계적 복습용으로도 유용함.
OpenAI가 분기당 120억 달러 손실을 내면서 CFO가 정부 대출 보증을 언급했다. 필자는 ChatGPT의 비즈니스 모델이 기존 빅테크와 달리 높은 자본/한계 비용과 모방 취약성을 갖고 있어 메가 수익이 구조적으로 어렵다고 분석한다.
Ruby 커미터가 Claude Code로 간이 Git 구현을 15개 언어로 시켜본 벤치마크. Ruby, Python, JavaScript가 가장 빠르고 저렴하며 안정적이었고, 정적 타입 언어는 1.4~2.6배 느리고 비쌌다. 600회 실행 중 실패는 Rust 2건, Haskell 1건뿐.
OpenAI가 ChatGPT 앱 생태계를 정식 오픈함. 개발자가 Apps SDK(베타)로 앱을 만들어 제출할 수 있고, ChatGPT 내 앱 디렉토리에서 브라우징/검색 가능. MCP 연결, 수익화, 프라이버시 정책 등 생태계 기반을 갖춤.
AI 에이전트를 LOOP_COMPLETE까지 반복 실행하는 오케스트레이션 프레임워크. Claude Code, Gemini CLI 등 다중 백엔드 지원, Hat 기반 페르소나 시스템, Telegram 연동 인간 개입, MCP 서버 모드를 제공한다.
AI 에이전트와 RAG 앱의 프롬프트를 자동 최적화하는 Python 라이브러리. 함수 호출 스키마 평균 57% 토큰 감소, RAG 컨텍스트 5~15% 감소를 달성하며 레이턴시 오버헤드는 0.5% 미만.
Roblox가 AI 에이전트의 게임 개발 능력을 평가하는 OpenGameEval 벤치마크를 공개했다. 47개 수작업 큐레이션 테스트 케이스로 구성되며, 단순 조작은 잘 하지만 다단계 문맥 추론에서는 모든 모델이 고전하는 결과를 보였다.
llama.cpp가 리눅스 커널 업데이트, NVIDIA 오픈 드라이버, CUDA 13의 조합으로 리눅스에서도 macOS 수준의 통합 메모리 관리를 지원하게 됐다. 게이밍 PC급 하드웨어로 로컬 AI 추론이 가능해진 셈.
PyTorch 2.11이 2,723개 커밋, 432명 기여자 규모로 릴리스됨. FlashAttention-4 백엔드로 Hopper/Blackwell GPU에서 최대 3.2배 속도 향상, 분산 학습용 Differentiable Collectives, CUDA 13 기본 전환, TorchScript 공식 deprecated 등이 주요 변경사항임.
Chen et al.(2026)의 Nature AGI 달성 주장에 대한 Gary Marcus 등의 반박. 벤치마크 성능을 범용 지능과 혼동하고 있으며, AGI 정의가 점점 약해지고 있고, 경제적 증거(10년간 TFP 0.66% 증가)도 AGI 주장을 뒷받침하지 않는다고 주장함.
Microsoft가 이미지 한 장으로 고품질 텍스처 3D 에셋을 생성하는 40억 파라미터 모델 TRELLIS.2를 MIT 라이선스로 공개함. O-Voxel이라는 새로운 희소 복셀 표현을 도입해 열린 표면, 비다양체 등 복잡한 토폴로지를 처리하며, H100에서 512³ 해상도 기준 약 3초 만에 PBR 재질이 포함된 3D 에셋을 생성함.
필리핀 콜센터 직원들이 사전 고지 없이 AI 기반 성과 평가 시스템에 놓이게 된 현실을 다룸. AI가 통화 톤·키워드를 분석해 점수를 매기지만 문맥을 이해하지 못해 불공정하다는 반발이 나오고 있으며, 최대 1,270만 일자리가 영향권에 있음.
Replit이 Agent 3를 위해 개발한 REPL 기반 하이브리드 테스팅 시스템. AI가 만든 '예쁘지만 작동 안 하는' 인터페이스를 잡아내기 위해 Playwright 코드 실행 + 노트북 환경을 결합, 자율 작업 시간을 20분에서 200분으로 늘림.
통계학습이론이 ChatGPT의 일반화 능력을 얼마나 설명하는지 분석한 글. 모델이 훈련 데이터의 통계적 패턴을 정확히 재현한다는 점에서 이론이 맞아떨어지는 사례들을 소개함.
Simon Willison이 HTML5 파서 JustHTML을 Codex CLI + GPT-5.2로 Python에서 JS로 포팅. 프롬프트 2개로 시작해 4시간 만에 9,000줄 JS, 9,200개 테스트 통과, 비용 $29.41(Plus 구독으로 무료)
LLM 기반 AI가 생산성을 오히려 떨어뜨리고, AI 버블이 닷컴의 17배 규모로 경제를 붕괴시킬 것이라는 강경한 주장. MIT, METR, Gartner 등의 연구 데이터를 인용하며 진짜 AI는 모델 구축 경로를 따라야 한다고 주장함.
영상 코덱의 키프레임+델타 방식을 LLM KV 캐시 양자화에 적용. 절대값 대신 토큰 간 차이를 4비트로 압축해 Q4_0 대비 22배 낮은 품질 열화(+0.26%)를 달성. llama.cpp 포크로 ~195줄 추가만으로 구현됨.