JEFF NEWS에 참여하세요
북마크, 댓글, 투표 기능을 사용할 수 있습니다
© 2026 Jeff Yim
한 기업 담당자가 OpenAI와 Anthropic의 엔터프라이즈 영업 과정에서 겪은 문제를 공유. 사용량 데이터 접근에 12개월 약정 요구, 14일 유효 견적이 13일째에 2배로 인상되는 등 신뢰 훼손 사례.
AI 스타트업 6년차 창업자가 'AI 변화는 코로나보다 크고 지금이 2020년 2월'이라고 경고하는 글. GPT-5.3 Codex가 자기 자신의 생성에 참여한 최초의 모델이며, METR 측정 기준 AI의 독립 작업 시간이 7개월마다 2배로 증가 중이다.
트럼프 행정부의 영양 가이드 사이트 realfood.gov가 사용자를 Grok으로 안내하고 있다. 딥페이크와 혐오 콘텐츠 논란이 계속되는 Grok을 정부 사이트에서 노출하는 것의 적절성이 논란이다.
HN 커뮤니티에서 로컬 AI 워크스테이션을 실제 운용 중인 사람들의 경험담. 인보이스 OCR, 성분 분류, Whisper 음성인식 등 실사용 사례와 Mac vs Nvidia, 비용 대비 성능의 현실적 트레이드오프가 공유됨.
Qwen 팀이 Qwen3-VL 기반 멀티모달 임베딩 + 리랭커 모델을 오픈소스 공개. 텍스트·이미지·비디오 혼합 입력을 지원하며, MMEB-V2에서 SOTA 달성. 2B 모델도 대부분의 8B급 경쟁 모델을 능가.
HR SaaS 기업 Workday의 AI 채용 추천 시스템이 흑인, 장애인, 40세 이상 지원자를 차별했다는 집단소송이 진행 중이다. 판사는 소프트웨어 벤더 면책 논리를 기각하고 재판 진행을 허용했다.
모라벡의 역설과 폴라니의 역설을 프레임워크로 AI 시대 직업 시장 변화를 분석. IDC 조사에서 비즈니스 리더 66%가 AI로 주니어 채용을 줄이고 있으며, 파일 산출물 기반 지식 노동은 고위험, 물리적 존재·인간적 판단이 필요한 일은 저위험.
Lancet Psychiatry에 발표된 리뷰가 AI 챗봇이 정신증 취약자의 망상적 사고를 강화할 수 있다고 경고함. 챗봇의 아첨적 응답이 특히 과대망상을 조장하며, 약화된 믿음이 비가역적 확신으로 전환될 위험이 있음.
체코 연구팀이 649명 대상 실험에서 AI 생성 누드 이미지가 실제 사진보다 심미적 매력도, 성적 매력도, 감정적 쾌적함에서 모두 더 높은 점수를 받았다는 결과를 발표함. 리얼리즘만 실제 사진이 1위.
Martin Kleppmann이 AI가 형식 검증(formal verification)을 주류로 만들 것이라 예측. LLM이 증명 스크립트 작성 비용을 급격히 낮추고, AI 생성 코드에 대한 검증 필요성이 이를 가속할 것이라는 논지.
트럼프가 Nvidia H200 칩의 대중국 판매를 승인하면서, 매출의 25%를 미국 정부가 가져가는 조건을 붙임. AMD, Intel에도 동일 적용 예정.
영국 작가협회가 AI 생성 도서 범람에 대응해 'Human Authored' 로고 인증 제도를 시작. 회원 82%가 관심 표명. 동시에 수천 명의 작가가 AI 무단 사용에 항의하는 빈 책을 출판.
GDC에서 생성형 AI에 대한 게임 업계 내 분열이 적나라하게 드러남. VC는 AI를 예찬하고, 개발자 52%는 AI가 업계에 나쁘다고 답변. 노조 부스와 AI 스타트업이 나란히 배치된 풍경이 상징적.
GB10의 iGPU는 48 SM/2.55GHz로 RTX 5070급이지만 소비자용 Blackwell 변종. AMD Strix Halo 대비 컴퓨트 벤치에서 우위지만, ARM CPU로 인한 게이밍 호환성 문제와 LPDDR5X 대역폭 한계가 존재.
여러 AI 모델에게 동일한 곡을 리뷰시켰더니 같은 곡에 대해 극찬과 혹평이 공존하는 황당한 결과가 나왔다. 마이클 잭슨 Thriller을 '형편없는 프로덕션'이라 평가하는 모델이 있는가 하면, 모델별 긍정/부정 편향이 뚜렷하게 드러났다.
AI 회의론자가 재귀적 자기개선이 왜 무시할 수 없는지를 4단계 논증으로 설명하는 에세이. LLM이 AGI가 되지 못하더라도 다른 AI 패러다임의 연구를 가속할 수 있다는 점이 핵심 통찰이며, 6가지 미해결 질문을 통해 불확실성을 솔직하게 인정함.
PERSONALITY.md나 역할 부여 프롬프트는 AI의 본질이 아닌 컨텍스트만 바꿀 뿐이며, 모방을 의식으로 착각하는 것이 가장 위험한 실수라는 의견
Foundation이 개발한 군사용 휴머노이드 로봇 Phantom MK-1이 미 군부와 2,400만 달러 계약을 체결하고 우크라이나에 실전 투입되기 시작했다. Scout AI는 AI 에이전트만으로 전체 킬체인을 수행하는 테스트에 성공했으며 2.25억 달러 펜타곤 계약을 협상 중이다. 120개국 이상이 자율 무기 금지 조약을 지지하지만 미국·러시아·이스라엘은 소극적인 상황이다.
Baldur Bjarnason이 LLM 옹호 개발자들과의 논쟁을 완전히 포기했다는 글. 개인적으로 잘 된다는 주관적 경험이 소프트웨어 생태계 전체의 품질 하락과 괴리되고 있다고 주장.
LLM이 만든 결과물은 아웃사이더에게 전문가처럼 보이지만, 실제 적대적 환경에서는 RLHF의 협력 편향 때문에 쉽게 읽히고 이용당함. Pluribus가 포커에서 '읽히지 않는 것'으로 이겼다면, 현재 LLM 에이전트는 가장 읽기 쉬운 상대가 될 위험이 있음. 해법은 결과물 품질이 아닌 멀티에이전트 환경에서의 결과(outcome)로 훈련하는 것.