본문으로 건너뛰기
피드

Pi-Autoresearch: AI 에이전트용 자율 최적화 루프 확장

open-source 약 4분

터미널 AI 코딩 에이전트 pi용 확장으로, 아이디어 시도-벤치마크-유지/리버트를 자율적으로 반복하는 최적화 루프를 제공함. MAD 기반 신뢰도 평가, 세션 영속성, 클린 브랜치 분리 기능 포함.

  • 1

    init_experiment, run_experiment, log_experiment 세 가지 핵심 도구 제공

  • 2

    MAD로 노이즈 추정 후 confidence = |최고개선폭|/MAD로 신뢰도 평가 (2.0x 이상이면 실제 개선)

  • 3

    autoresearch.md와 autoresearch.jsonl로 세션 상태 영속화, 컨텍스트 리셋 후에도 재개 가능

  • 4

    autoresearch-finalize로 실험 브랜치를 논리적 변경 단위의 클린 브랜치로 분리

  • 5

    도메인 비의존적 인프라(extension)와 도메인 지식(skill) 분리 구조

pi(터미널 AI 코딩 에이전트)용 확장으로, 자율 최적화 루프를 돌려주는 도구임. karpathy/autoresearch에서 영감을 받았고, 아이디어 시도 -> 벤치마크 -> 개선이면 유지, 퇴보면 리버트 -> 반복 사이클을 자동으로 수행함.

테스트 속도, 번들 사이즈, LLM 학습, 빌드 시간, Lighthouse 점수 등 어떤 최적화 대상이든 적용 가능함. 도메인 지식은 skill에, 인프라는 extension에 분리되어 있어서 하나의 확장으로 무한한 도메인을 커버하는 구조임.

핵심 도구는 세 가지: init_experiment(세션 설정), run_experiment(커맨드 실행 및 측정), log_experiment(결과 기록 및 자동 커밋). /autoresearch 명령으로 세션을 시작하면 에이전트가 편집 -> 커밋 -> 실험 실행 -> 로그 -> 유지 또는 리버트를 자율적으로 반복함.

신뢰도 평가가 꽤 괜찮음. 3회 이상 실험 후 MAD(Median Absolute Deviation)로 노이즈를 추정하고, |최고 개선폭| / MAD로 confidence를 계산함. 2.0x 이상이면 실제 개선일 가능성 높음, 1.0~2.0x는 애매, 1.0x 미만은 노이즈 범위 내임.

세션 상태는 autoresearch.md(목표, 시도 내역 등 세션 문서)와 autoresearch.jsonl(실행별 로그)에 기록되어, 컨텍스트가 리셋되거나 재시작해도 새 에이전트가 그대로 이어받을 수 있음. 선택적으로 autoresearch.checks.sh를 만들면 벤치마크 통과 후 테스트/타입체크/린트를 돌려서 최적화가 기존 코드를 깨뜨리지 않는지 확인함.

autoresearch-finalize도 유용함. 실험 브랜치의 지저분한 커밋들을 논리적 변경 단위로 분리해서 독립적인 클린 브랜치로 만들어 줌. 파일이 겹치지 않게 그룹핑하므로 각 브랜치를 독립적으로 리뷰하고 머지할 수 있음.

설정은 autoresearch.config.json으로 workingDir이나 maxIterations(토큰 비용 관리용) 지정 가능. MIT 라이선스임.

AI 코딩 에이전트에 자율 실험 루프를 붙이는 접근이 흥미로움. 토큰 비용이 빠르게 쌓일 수 있어 maxIterations 설정이 중요함.

댓글

댓글

댓글을 불러오는 중...

open-source

뱀부랩, 오픈소스 슬라이서 개발자에게 법적 압박 걸었다가 역풍 맞음

3D 프린터 제조사 뱀부랩이 OrcaSlicer-BambuLab 개발자에게 중단 요구서를 보내면서 오픈소스와 수리권 커뮤니티의 반발을 샀다. GamersNexus와 Louis Rossmann은 개발자의 허락을 받아 소프트웨어를 다시 호스팅하고, 소송이 걸리면 각각 1만 달러씩 법률 지원을 하겠다고 나섰다.

open-source

OrcaSlicer 포크, Bambu Lab 프린터의 인터넷 연결 기능 되살림

FULU Foundation의 OrcaSlicer-bambulab 포크가 Bambu Lab 프린터에서 LAN 전용 제한 없이 BambuNetwork 기반 인터넷 연결을 다시 지원한다고 밝힘. Windows에서는 WSL 2 설정이 필요하고, Linux에서는 일반 설치만으로 충분하다고 안내함.

open-source

코넬대가 공개한 정확히 2,000줄짜리 교육용 운영체제

코넬대 기반 프로젝트인 egos-2000은 학생이 교육용 운영체제 전체 코드를 직접 읽을 수 있게 만드는 걸 목표로 한다. C, 헤더, 어셈블리, make 파일을 합쳐 정확히 2,000줄이며, QEMU와 RISC-V 보드에서 동작하고 9개 코스 프로젝트가 붙어 있다. 운영체제 수업에서 ‘작지만 전체 구조가 보이는 코드베이스’가 필요했던 사람에게 꽤 반가운 자료다.

open-source

이맥스가 Git 대신 Bazaar를 붙잡았던 6년짜리 오픈소스 드라마

이맥스는 2008년 CVS에서 벗어나면서 Git 대신 GNU 프로젝트인 Bazaar를 선택했고, 이 결정은 성능 벤치마크와 개발자 반발을 압도한 정치적 판단에 가까웠다. Bazaar는 느리고 유지보수도 흔들렸지만, GNU 패키지는 GNU 도구를 써야 한다는 원칙 때문에 전환은 2014년까지 미뤄졌다. 결국 ELPA 브랜치 문제와 Bazaar 개발 중단, 변환 스크립트 준비 끝에 이맥스는 Git으로 옮겨갔다.

open-source

현대차·기아, 오픈소스 특허 방어망 넓혀 소프트웨어 중심 차량 전환 준비

현대차·기아가 오픈소스 소프트웨어 특허 분쟁을 줄이기 위해 글로벌 특허 네트워크 OIN 2.0에 가입했다. 소프트웨어 중심 차량, 클라우드, 커넥티드 서비스처럼 오픈소스 의존도가 큰 영역에서 법적 리스크를 미리 관리하려는 움직임이다.