Claude Code한테 내 옛날 연구 코드 맡겨봤는데 하루만에 54% 성능 향상시킴 ㄷㄷ
Karpathy의 Autoresearch 방법론에서 영감 받아서, 저자가 자기 옛날 연구 코드(eCLIP)를 Claude Code한테 던져주고 빨래/장보기 하러 갔음. 돌아왔더니 42번 실험 돌리고 Mean Rank를 344→157로 54% 줄여놨다는 레전드 썰. 근데 버그 하나 고친 게 모든 아키텍처 개선 합친 것보다 효과가 컸다는 게 포인트 ㅋㅋ
- 1
버그 수정 한 줄이 모든 아키텍처 개선보다 효과 컸음 (-113 Mean Rank)
- 2
탐색 공간 명확 = 에이전트 최강, unknown unknowns 구간 = 스파게티
- 3
샌드박스 없이 풀 자율권은 아직 무리 - 이상한 bash 치거나 그냥 대화 종료함
결국 AI 에이전트도 '버그 있는 코드 위에서 아무리 열심히 해봤자 한계 있다'는 교훈을 몸소 보여줌 ㅋㅋ 근데 반대로 생각하면, 버그 찾는 능력 자체가 이미 개쩔었다는 거 아님? 사람이었으면 temperature clamp 버그 그냥 지나쳤을 수도 있는데.
관련 기사
스페이스X가 리플렉션AI에 63억달러짜리 GPU 컴퓨팅을 판다
스페이스X가 오픈소스 AI 스타트업 리플렉션AI와 최대 63억달러 규모의 컴퓨팅 공급 계약을 맺었다. 리플렉션AI는 스페이스X의 콜로서스 인프라와 엔비디아 GB300 칩을 쓰게 되고, 스페이스X는 로켓·스타링크를 넘어 AI 인프라 사업자로 몸집을 키우는 그림이다.
게티이미지, 오픈AI와 손잡자 주가 200% 뛰었다
게티이미지가 오픈AI와 다년간 콘텐츠 표시 계약을 맺으며 챗GPT 검색·탐색 기능 안에 라이선스 사진을 제공하게 됐다. 생성형 AI에 위협받던 콘텐츠 라이선스 업체가 소송과 대립을 넘어 AI 생태계 안에서 새 유통 채널을 찾는 사례로 읽힌다.
크래프톤, AI 반도체 스타트업 하이퍼엑셀에 500억 원 베팅
크래프톤이 국내 AI 반도체 스타트업 하이퍼엑셀의 시리즈B 라운드에 전략적투자자로 참여해 약 500억 원을 투자한다. 게임 속 AI 캐릭터와 개발 자동화를 넘어 로봇, 자율주행 같은 피지컬 AI까지 염두에 둔 인프라 통제 전략으로 읽힌다.
젠슨 황이 KAIST·서울대를 콕 집은 이유, 한국 AI 인재 전쟁이 시작됐다
젠슨 황 엔비디아 CEO가 방한 때 KAIST와 서울대를 직접 언급하며 한국 AI 인재에 대한 관심을 드러냈다. 기사에서는 두 대학 출신 차세대 AI 리더들과 연구자, 창업가, 투자자들을 통해 한국 AI 인재 풀이 왜 글로벌 빅테크의 타깃이 됐는지 짚는다.
스페이스X, 리플렉션AI에 최대 63억 달러 규모 AI 컴퓨팅 빌려준다
스페이스X가 오픈소스 AI 스타트업 리플렉션AI에 2029년까지 대규모 GPU 컴퓨팅을 제공하는 계약을 맺었다. 리플렉션AI는 매달 1억5000만 달러를 내고 멤피스의 콜로서스 데이터센터에 깔린 엔비디아 GB300급 인프라를 쓰게 된다.
댓글
댓글
댓글을 불러오는 중...