AI/ML

b/ai-ml • 2026. 1. 18.

휴먼 인 더 루프는 버그가 아니라 기능임

Node.js/Fastify/Undici 메인테이너가 AI 시대에도 인간의 리뷰와 판단력이 핵심이라고 주장하는 반론

댓글 공유 약 3분

b/ai-ml • 2026. 2. 18.

소규모 모델 3개로 GPT-5급 성능을 뽑아내는 NSED 프로토콜, 오픈소스로 공개됨

여러 소형 AI 모델이 병렬로 작업하고 교차 평가하는 NSED 프로토콜이 오픈소스로 공개됨. 20B+8B+12B 모델 3개로 소비자 하드웨어에서 AIME 2025 84%를 달성해 DeepSeek-R1 동급, GPT-5와 1점 차 성능을 보여줌.

ai llm mixture-of-models

댓글 공유 약 3분

b/ai-ml • 2026. 2. 18.

Models.dev — AI 모델 스펙·가격·기능을 한곳에 모은 오픈소스 DB

AI 모델 정보를 통합 조회할 수 있는 오픈소스 데이터베이스. API를 통해 프로그래밍 방식으로 접근 가능하고, GitHub에 TOML 파일로 데이터가 관리되어 커뮤니티 기여가 가능함.

ai-models open-source database

댓글 공유 약 2분

b/ai-ml • 2025. 12. 18.

LLM 면접 질문 100개+ 모음 — 트랜스포머 기초부터 파인튜닝까지

트랜스포머 아키텍처, 추론 최적화, 디코딩 전략, 프롬프트 엔지니어링, 파인튜닝까지 LLM 전 범위를 커버하는 면접 질문 모음집. 각 질문에 답변 링크가 달려있어 체계적 복습용으로도 유용함.

llm interview transformer

댓글 공유 약 3분

b/ai-ml • 2025. 12. 17.

OpenAI가 정부 구제금융을 노리고 있다는 분석

OpenAI가 분기당 120억 달러 손실을 내면서 CFO가 정부 대출 보증을 언급했다. 필자는 ChatGPT의 비즈니스 모델이 기존 빅테크와 달리 높은 자본/한계 비용과 모방 취약성을 갖고 있어 메가 수익이 구조적으로 어렵다고 분석한다.

openai ai-business startup

댓글 공유 약 4분

b/ai-ml • 2026. 3. 24.

Claude Code에 가장 잘 맞는 프로그래밍 언어는? — 15개 언어 벤치마크 실험

Ruby 커미터가 Claude Code로 간이 Git 구현을 15개 언어로 시켜본 벤치마크. Ruby, Python, JavaScript가 가장 빠르고 저렴하며 안정적이었고, 정적 타입 언어는 1.4~2.6배 느리고 비쌌다. 600회 실행 중 실패는 Rust 2건, Haskell 1건뿐.

claude-code llm programming-languages

댓글 공유 약 4분

b/ai-ml • 2025. 12. 17.

OpenAI, ChatGPT 앱 스토어 정식 오픈 — 개발자 제출 시작

OpenAI가 ChatGPT 앱 생태계를 정식 오픈함. 개발자가 Apps SDK(베타)로 앱을 만들어 제출할 수 있고, ChatGPT 내 앱 디렉토리에서 브라우징/검색 가능. MCP 연결, 수익화, 프라이버시 정책 등 생태계 기반을 갖춤.

openai chatgpt sdk

댓글 공유 약 3분

b/ai-ml • 2025. 12. 17.

Ralph Orchestrator: AI 에이전트를 루프에 가둬서 작업 끝날 때까지 돌리는 프레임워크

AI 에이전트를 LOOP_COMPLETE까지 반복 실행하는 오케스트레이션 프레임워크. Claude Code, Gemini CLI 등 다중 백엔드 지원, Hat 기반 페르소나 시스템, Telegram 연동 인간 개입, MCP 서버 모드를 제공한다.

ai-agent orchestration claude-code

댓글 공유 약 3분

b/ai-ml • 2025. 12. 17.

prompt-refiner: LLM 프롬프트 토큰을 자동으로 줄여주는 경량 라이브러리

AI 에이전트와 RAG 앱의 프롬프트를 자동 최적화하는 Python 라이브러리. 함수 호출 스키마 평균 57% 토큰 감소, RAG 컨텍스트 5~15% 감소를 달성하며 레이턴시 오버헤드는 0.5% 미만.

llm prompt-engineering token-optimization

댓글 공유 약 3분

b/ai-ml • 2025. 12. 17.

Roblox, AI 코딩 어시스턴트 벤치마크 'OpenGameEval' 오픈소스로 공개

Roblox가 AI 에이전트의 게임 개발 능력을 평가하는 OpenGameEval 벤치마크를 공개했다. 47개 수작업 큐레이션 테스트 케이스로 구성되며, 단순 조작은 잘 하지만 다단계 문맥 추론에서는 모든 모델이 고전하는 결과를 보였다.

roblox benchmark ai-agent

댓글 공유 약 3분

b/ai-ml • 2026. 3. 24.

llama.cpp, 드디어 리눅스에서도 시스템 RAM 통합 오프로딩 지원

llama.cpp가 리눅스 커널 업데이트, NVIDIA 오픈 드라이버, CUDA 13의 조합으로 리눅스에서도 macOS 수준의 통합 메모리 관리를 지원하게 됐다. 게이밍 PC급 하드웨어로 로컬 AI 추론이 가능해진 셈.

llama-cpp linux nvidia

댓글 공유 약 3분

b/ai-ml • 2026. 3. 23.

PyTorch 2.11 릴리스

PyTorch 2.11이 2,723개 커밋, 432명 기여자 규모로 릴리스됨. FlashAttention-4 백엔드로 Hopper/Blackwell GPU에서 최대 3.2배 속도 향상, 분산 학습용 Differentiable Collectives, CUDA 13 기본 전환, TorchScript 공식 deprecated 등이 주요 변경사항임.

pytorch deep-learning gpu

댓글 공유 약 4분

b/ai-ml • 2026. 2. 17.

AGI 달성 주장은 과장됐다 — Gary Marcus 등 Nature 반박 기고

Chen et al.(2026)의 Nature AGI 달성 주장에 대한 Gary Marcus 등의 반박. 벤치마크 성능을 범용 지능과 혼동하고 있으며, AGI 정의가 점점 약해지고 있고, 경제적 증거(10년간 TFP 0.66% 증가)도 AGI 주장을 뒷받침하지 않는다고 주장함.

agi llm ai-safety

댓글 공유 약 5분

b/ai-ml • 2025. 12. 16.

TRELLIS.2: Microsoft의 최신 40억 파라미터 3D 생성 모델

Microsoft가 이미지 한 장으로 고품질 텍스처 3D 에셋을 생성하는 40억 파라미터 모델 TRELLIS.2를 MIT 라이선스로 공개함. O-Voxel이라는 새로운 희소 복셀 표현을 도입해 열린 표면, 비다양체 등 복잡한 토폴로지를 처리하며, H100에서 512³ 해상도 기준 약 3초 만에 PBR 재질이 포함된 3D 에셋을 생성함.

3d-generation microsoft open-source

댓글 공유 약 3분

b/ai-ml • 2026. 2. 16.

필리핀 AI 성과 평가 도입, 1,300만 일자리 위기

필리핀 콜센터 직원들이 사전 고지 없이 AI 기반 성과 평가 시스템에 놓이게 된 현실을 다룸. AI가 통화 톤·키워드를 분석해 점수를 매기지만 문맥을 이해하지 못해 불공정하다는 반발이 나오고 있으며, 최대 1,270만 일자리가 영향권에 있음.

ai bpo philippines

댓글 공유 약 2분

b/ai-ml • 2025. 12. 15.

Replit Agent 3의 자가 테스트 시스템: '포템킨 인터페이스'를 잡아내는 방법

Replit이 Agent 3를 위해 개발한 REPL 기반 하이브리드 테스팅 시스템. AI가 만든 '예쁘지만 작동 안 하는' 인터페이스를 잡아내기 위해 Playwright 코드 실행 + 노트북 환경을 결합, 자율 작업 시간을 20분에서 200분으로 늘림.

ai-agent testing playwright

댓글 공유 약 5분

b/ai-ml • 2025. 12. 15.

통계학습이론으로 ChatGPT를 설명할 수 있을까

통계학습이론이 ChatGPT의 일반화 능력을 얼마나 설명하는지 분석한 글. 모델이 훈련 데이터의 통계적 패턴을 정확히 재현한다는 점에서 이론이 맞아떨어지는 사례들을 소개함.

llm machine-learning generalization

댓글 공유 약 3분

b/ai-ml • 2025. 12. 16.

JustHTML을 Python에서 JS로 포팅하는 데 Codex CLI + GPT-5.2로 4시간 걸림

Simon Willison이 HTML5 파서 JustHTML을 Codex CLI + GPT-5.2로 Python에서 JS로 포팅. 프롬프트 2개로 시작해 4시간 만에 9,000줄 JS, 9,200개 테스트 통과, 비용 $29.41(Plus 구독으로 무료)

llm codex gpt

댓글 공유 약 4분

b/ai-ml • 2026. 3. 22.

AI는 쓰레기이고, 거품임 (2025)

LLM 기반 AI가 생산성을 오히려 떨어뜨리고, AI 버블이 닷컴의 17배 규모로 경제를 붕괴시킬 것이라는 강경한 주장. MIT, METR, Gartner 등의 연구 데이터를 인용하며 진짜 AI는 모델 구축 경로를 따라야 한다고 주장함.

llm ai-bubble productivity

댓글 공유 약 6분

b/ai-ml • 2026. 3. 22.

영상 압축 기법을 KV 캐시에 적용해 Q4 양자화 오차를 10,000배 줄인 Delta-KV

영상 코덱의 키프레임+델타 방식을 LLM KV 캐시 양자화에 적용. 절대값 대신 토큰 간 차이를 4비트로 압축해 Q4_0 대비 22배 낮은 품질 열화(+0.26%)를 달성. llama.cpp 포크로 ~195줄 추가만으로 구현됨.

llm quantization kv-cache

댓글 공유 약 5분