하드웨어 초보가 2.5주 만에 자작 옥토콥터를 띄우고, 모터 고장까지 버티는 강화학습 컨트롤러를 만든 이야기
하드웨어 경험이 거의 없던 개발자가 Fusion 360, CNC 가공, Betaflight, MuJoCo, PPO를 써서 커스텀 옥토콥터를 만들고 실제 비행까지 성공한 기록이다. 목표는 단순 드론 제작이 아니라, 모터 1개나 2개가 죽어도 강화학습 정책이 추력을 재분배해서 버티는 컨트롤러를 실제 하드웨어에 올리는 것. 시뮬레이션에서는 단일·이중 모터 고장뿐 아니라 일부 3개 모터 고장까지 버텼고, 이제 관건은 시뮬레이션에서 배운 정책이 현실에서도 통하느냐다.
- 1
0년 하드웨어 경험에서 출발해 2.5주 만에 직접 설계·가공·조립한 옥토콥터를 띄움
- 2
최종 목표는 모터 고장 상황에서도 살아남는 강화학습 기반 비행 제어 정책을 실제 드론에 올리는 것
- 3
시뮬레이션 정책은 4만3400개 파라미터짜리 MLP이며 2000만 스텝 학습 뒤 일부 3모터 고장까지 일반화함
- 4
PPO, MuJoCo, 도메인 랜덤화, 비대칭 액터-크리틱 같은 시뮬레이션-현실 전이 기법이 핵심으로 쓰임
- 5
별도 라즈베리파이나 마이크로컨트롤러 대신 STM32H743 비행 컨트롤러 펌웨어에 정책을 직접 넣는 방향으로 아키텍처를 바꿈
재밌는 포인트는 ‘드론을 만들었다’가 아니라 제어 문제를 일부러 어렵게 만든 다음, 강화학습이 기존 PID·믹서가 깨지는 구간을 넘을 수 있는지 실험한다는 점임. 실무 개발자 입장에서도 시뮬레이션 버그, 보상 설계, 배포 아키텍처, 지연 시간 같은 ML 시스템의 지저분한 현실이 한 글에 꽤 잘 드러난다.
관련 기사
앤트로픽, 과학 연구용 클로드 앱 '클로드 사이언스' 공개
앤트로픽이 과학 연구 워크플로우에 맞춘 공개 베타 앱 '클로드 사이언스'를 내놨다. 새 모델이 아니라 기존 Claude 모델 위에 과학 데이터베이스, 분석 환경, 재현성 추적, HPC 실행, 생명과학 도구 연결을 얹은 연구용 워크벤치에 가깝다.
앤트로픽, 클로드 일부 모델 수출 통제 해제로 접근 복구 예고
미국 상무부가 앤트로픽의 클로드 페이블 5와 미토스 5에 걸려 있던 수출 통제를 해제했다. 앤트로픽은 내일부터 접근 권한을 복구하기 시작하고, 곧 추가 업데이트를 공유하겠다고 밝혔다.
앤트로픽, 더 싸게 굴리는 에이전트 모델 ‘Claude Sonnet 5’ 공개
앤트로픽이 Claude Sonnet 5를 공개했어. Opus 4.8에 가까운 에이전트 성능을 더 낮은 가격으로 제공하고, 코딩·도구 사용·장기 작업 수행 능력을 크게 끌어올렸다는 게 핵심이야. 다만 새 토크나이저 때문에 같은 입력이 1.0~1.35배 더 많은 토큰으로 잡힐 수 있어 비용 계산은 다시 해봐야 해.
AI 신약개발, 이제 모델보다 ‘스스로 실험하는 연구실’이 병목을 푸는 핵심이라는 얘기
AI가 후보물질을 빠르게 뽑아내도 기존 습식 실험실 방식으로는 검증 속도를 따라가기 어렵다는 문제가 제기됐다. 보고서는 AI 예측, 로봇 실험, 데이터 분석, 모델 재학습이 반복되는 자율실험실 기반 폐루프 운영체계가 신약 연구개발 경쟁력의 핵심 인프라가 될 수 있다고 본다.
성인 10명 중 4명은 매일 AI 사용, 그런데 오래 쓸수록 우울·불안 위험도 같이 올라감
생성형 AI를 최근 한 달 안에 써본 성인 500명을 조사했더니 41.4%가 거의 매일 쓰고 있었고, 정보검색·학습뿐 아니라 정서적 위안이나 고민상담에도 활용되고 있었다. 특히 하루 2시간 이상 쓰는 집단에서 우울 위험군 41.2%, 불안 위험군 35.3%가 나와, AI가 생산성 도구를 넘어 심리적 의존의 대상이 되고 있다는 신호가 잡혔다.
댓글
댓글
댓글을 불러오는 중...