Claude Code한테 내 옛날 연구 코드 맡겨봤는데 하루만에 54% 성능 향상시킴 ㄷㄷ
Karpathy의 Autoresearch 방법론에서 영감 받아서, 저자가 자기 옛날 연구 코드(eCLIP)를 Claude Code한테 던져주고 빨래/장보기 하러 갔음. 돌아왔더니 42번 실험 돌리고 Mean Rank를 344→157로 54% 줄여놨다는 레전드 썰. 근데 버그 하나 고친 게 모든 아키텍처 개선 합친 것보다 효과가 컸다는 게 포인트 ㅋㅋ
- 1
버그 수정 한 줄이 모든 아키텍처 개선보다 효과 컸음 (-113 Mean Rank)
- 2
탐색 공간 명확 = 에이전트 최강, unknown unknowns 구간 = 스파게티
- 3
샌드박스 없이 풀 자율권은 아직 무리 - 이상한 bash 치거나 그냥 대화 종료함
결국 AI 에이전트도 '버그 있는 코드 위에서 아무리 열심히 해봤자 한계 있다'는 교훈을 몸소 보여줌 ㅋㅋ 근데 반대로 생각하면, 버그 찾는 능력 자체가 이미 개쩔었다는 거 아님? 사람이었으면 temperature clamp 버그 그냥 지나쳤을 수도 있는데.
관련 기사
삼성SDS, 공공 AI 박람회서 패브릭스·브리티웍스·AI 데이터센터 전면 배치
삼성SDS가 2026 공공 AI 박람회에서 공공 행정용 AI 에이전트, 모바일 협업 솔루션, AI 클라우드 인프라를 함께 선보였다. 국민 민원 요약·분류, 조달법령 해석, 정부24 AI 검색 같은 사례를 통해 공공 부문 AI 전환 시장을 정조준했다.
카페24는 120개 모델 라우터, 델은 랙당 GPU 144개 서버…국내 AI 인프라 뉴스 몰아보기
카페24가 120여 개 AI 모델을 단일 API로 묶는 LLM 라우터를 내놨고, 델은 엔비디아 베라 루빈 NVL4 기반 슈퍼컴 서버 XE8812를 공개했다. 오픈AI의 기업용 AI는 삼성전자와 서울대 도입 사례로 국내 확산 흐름이 뚜렷해졌고, 신세계I&C는 게임 IP 콘솔 패키지 출시를 예고했다.
브릭섬, 1MW급 NPU 추론 클라우드 ‘네오클라우드’ 하반기 오픈 추진
브릭섬이 NPU 기반 LLM 추론 전용 클라우드 ‘네오클라우드’를 올해 하반기 공식 오픈하겠다고 밝혔다. 1MW 규모로 시작해 6MW, 20MW까지 키우고, 토큰 API와 베어메탈 임대 두 가지 방식으로 제공한다.
스페이스X, 리플렉션 AI에 9.7조원 규모 AI 연산 자원 판다
스페이스X가 오픈소스 AI 스타트업 리플렉션 AI와 최대 63억달러 규모의 GPU 연산 계약을 맺었다. 리플렉션 AI는 2026년 7월부터 2029년까지 매달 1억5000만달러를 내고 엔비디아 GB300 기반 연산 자원을 쓰게 된다. AI 경쟁에서 모델만큼이나 GPU 접근권과 데이터센터 인프라가 전략 자산이 됐다는 신호다.
스페이스X, 오픈소스 AI 스타트업에 최대 63억달러 규모 컴퓨팅 파워 제공
스페이스X가 오픈소스 AI 스타트업 리플렉션 AI와 대규모 컴퓨팅 파워 공급 계약을 맺었다는 보도다. 리플렉션 AI는 엔비디아 GB300 기반 인프라를 확보하기 위해 2029년까지 최대 63억달러 규모로 스페이스X의 콜로서스를 이용할 예정이다.
댓글
댓글
댓글을 불러오는 중...