0
GPT-5.4 Pro가 하이퍼그래프 램지 이론 미해결 문제를 풀었다 - Epoch 확인
ai-ml
요약
기사 전체 정리
GPT-5.4 Pro가 램지 이론 미해결 문제를 풀어버림 - Epoch 확인
무슨 일이 있었나
- Kevin Barreto와 Liam Price가 GPT-5.4 Pro를 사용해서 FrontierMath의 미해결 문제를 풀었고, Epoch이 이를 공식 확인함
- 문제 출제자인 Will Brian이 직접 솔루션을 검증했고, 논문으로 출판될 예정임
- 해당 문제는 하이퍼그래프 램지 이론에서 H(n) 수열의 하한을 개선하는 문제임. 무한 급수의 동시 수렴과 관련된 수학 분야임
Will Brian의 평가
- "이전에 AI의 접근 방식이 가능할지 궁금했지만, 실제로 계산하기가 어려워 보였음. 이제 보니 완벽하게 작동한다는 거임"
- 핵심 성과: 기존 하한 구성의 비효율성을 제거해서 상한과 하한이 정확히 일치하게 만듦. 램지 이론에서 이런 경우는 상당히 좋은 결과임
- Brian은 AI의 아이디어에서 촉발된 후속 연구와 함께 논문을 작성할 계획이고, Barreto와 Price는 공저자로 참여할 수 있는 옵션이 있음
다른 모델들의 성적표
- 풀은 모델들: Opus 4.6 (max), Gemini 3.1 Pro, GPT-5.4 (xhigh). 각각 4번씩 시도한 결과 Opus 4.6은 1회, Gemini 3.1 Pro와 GPT-5.4는 각 2회 성공
- 못 푼 모델들: GPT-5.2 (xhigh), Opus 4.5 (max), Kimi K2.5 Thinking. 동일 조건에서 4번씩 시도했지만 전부 실패
중요
> 단순히 답을 맞힌 게 아니라 수학자가 검증한 새로운 증명을 AI가 생성한 사례임. 출판 가능한 수준의 수학적 발견을 AI가 해낸 건 주목할 만한 이정표임
- 다만 후속 모델들이 자체적으로 완전한 증명(self-contained proof)을 작성할 수 있는지는 아직 확인하지 않았다는 점은 참고해야 함
댓글
댓글
댓글을 불러오는 중...