본문으로 건너뛰기
피드

헤르메스 에이전트, 오픈클로 제치고 오픈소스 AI 에이전트 1위로 올라섬

ai-ml 약 8분

누스 리서치의 헤르메스 에이전트가 오픈라우터 글로벌 일일 앱 및 에이전트 순위에서 오픈클로를 제치고 1위에 올랐다. 헤르메스는 하루 약 2,240억 토큰을 처리하며, 실행-학습-개선 루프와 누적형 메모리 구조를 앞세워 오픈소스 AI 에이전트 시장에서 존재감을 키우고 있다.

  • 1

    헤르메스 에이전트는 하루 약 2,240억 토큰을 처리해 오픈클로의 1,860억 토큰을 앞섬

  • 2

    오픈클로는 50개 이상 메시징 채널 연결에 강하고, 헤르메스는 반복 실행과 학습 루프에 초점

  • 3

    헤르메스 v0.13.0은 칸반, 하트비트 모니터링, 좀비 탐지, 환각 복구, 구글 챗 지원을 추가

오픈소스 AI 에이전트 1위가 바뀜

  • 누스 리서치의 ‘헤르메스 에이전트(Hermes Agent)’가 오픈라우터(OpenRouter) 글로벌 일일 앱 및 에이전트 순위에서 1위에 오름

    • 기존 강자는 ‘오픈클로(OpenClaw)’였음
    • 헤르메스는 하루 약 2,240억 토큰을 처리하고, 오픈클로는 약 1,860억 토큰 수준으로 집계됨
  • 이 변화는 단순 트래픽 순위 이상의 의미가 있음

    • 오픈클로 창립자 피터 스타인버거가 올해 2월 오픈AI에 합류함
    • 이후 오픈클로는 독립 오픈소스 재단 체제로 전환됐고, 오픈AI는 후원사로 참여하는 구조가 됨
    • 시장에서는 오픈소스 에이전트 생태계의 주도권이 다시 열렸다는 평가가 나옴

중요

> 숫자만 보면 헤르메스가 하루 처리량에서 오픈클로보다 약 380억 토큰 앞섬. 오픈소스 에이전트 경쟁이 실제 사용량 지표로도 움직이기 시작한 셈임.

둘의 철학이 꽤 다름

  • 오픈클로는 “많은 플랫폼에 동시에 붙는 에이전트”에 가깝음

    • 중앙 웹소켓 게이트웨이(WebSocket Gateway) 기반 구조를 사용함
    • 텔레그램, 디스코드, 슬랙, 왓츠앱, 시그널 등 50개 이상의 메시징 채널 연결에 초점을 둠
    • 즉, 핵심 질문은 “어디서든 같은 에이전트를 쓸 수 있나”임
  • 헤르메스는 “일을 하면서 점점 익숙해지는 에이전트” 쪽임

    • 핵심 구조는 실행(do)-학습(learn)-개선(improve) 루프임
    • 작업을 끝낸 뒤 자신의 수행 과정을 분석하고, 나중에 다시 쓸 수 있는 스킬 파일을 자동 생성함
    • 오래 쓸수록 특정 워크플로우에 맞춰지는 누적형 에이전트를 지향함
  • 메모리 구조도 꽤 노골적으로 장기 사용을 겨냥함

    • 사용자와 에이전트 상태는 영속 스냅샷으로 저장함
    • 모든 세션 기록은 SQLite 기반 전문 검색 데이터베이스에 넣음
    • 반복 작업 로직은 스킬 파일로 분리해 다시 쓸 수 있게 만듦
sequenceDiagram
    participant 사용자
    participant 헤르메스
    participant 메모리
    participant 스킬파일
    사용자->>헤르메스: 목표와 작업 요청
    헤르메스->>메모리: 과거 세션과 상태 조회
    헤르메스->>사용자: 작업 실행 결과 반환
    헤르메스->>헤르메스: 수행 과정 분석
    헤르메스->>스킬파일: 재사용 가능한 작업 로직 저장
    사용자->>헤르메스: 유사 작업 재요청
    헤르메스->>스킬파일: 저장된 스킬 재사용

기능 확장 속도도 빠름

  • 헤르메스는 올해 2월 출시 이후 버전업마다 연결 범위와 실행 환경을 넓혀 옴

    • v0.9.0 ‘에브리웨어(Everywhere)’에서는 안드로이드 터먹스(Termux), 아이메시지, 위챗, 위컴, 로컬 웹 대시보드를 추가함
    • 이 시점에 지원 플랫폼 수는 16개로 늘어남
  • v0.11.0 ‘인터페이스(Interface)’에서는 개발자 경험과 추론 경로를 손봄

    • 리액트와 잉크 기반 터미널 UI를 재구성함
    • AWS 베드록, 엔비디아 NIM, 버셀 AI 게이트웨이 같은 추론 경로를 추가함
    • GPT-5.5 코덱스 오스(OAuth) 연동도 들어감
  • 최신 v0.13.0 ‘테너시티(Tenacity)’는 멀티 에이전트 운영에 가까워짐

    • 칸반(Kanban) 기반 멀티 에이전트 작업 보드를 도입함
    • 하트비트 모니터링, 좀비 탐지, 환각 복구 기능을 추가함
    • ‘/goal’ 명령으로 에이전트가 여러 턴에 걸쳐 목표를 유지하도록 했고, 구글 챗까지 지원해 총 20개 플랫폼과 연결됨

보안은 양쪽 다 숙제임

  • 오픈클로는 이미 심각한 취약점이 여러 번 나왔음

    • CVE-2026-25253 등 일부 취약점은 CVSS 9.9 수준으로 평가됨
    • 클로허브에 등록된 2,857개 스킬 가운데 341개가 악성 코드로 판정됨
    • 인터넷에 노출된 오픈클로 인스턴스도 수만 건 확인된 바 있음
  • 헤르메스도 안전지대는 아님

    • 4월 말 공개된 CVE 중 CVE-2026-7113은 웹훅 인증 누락 문제를 포함함
    • 다만 v0.13.0에서 기본 데이터 마스킹, 디스코드 역할 기반 허용 목록, 왓츠앱 외부 사용자 차단, 오스 흐름 패치 등 8개 최고 우선순위(P0) 보안 문제를 수정함

⚠️주의

> 에이전트는 채팅봇보다 권한이 세고 연결 지점도 많음. 메시징, API 키, 스킬 실행, 웹훅이 엮이면 취약점 하나가 운영 자동화 전체로 번질 수 있음.

실제 운영에서는 섞어 쓰는 흐름도 나옴

  • 헤르메스는 오픈클로 사용자의 전환 장벽을 낮추는 기능을 넣음

    • 설치 과정에서 기존 ‘~/.openclaw’ 디렉터리를 자동 감지함
    • 설정, 메모리, 스킬, API 키를 가져올 수 있음
    • ‘hermes claw migrate’ 명령으로 선택적 마이그레이션과 충돌 관리도 지원함
  • 개발자 커뮤니티에서는 두 프레임워크를 병행하는 사례도 늘고 있음

    • 오픈클로는 다중 채널 라우팅과 오케스트레이션에 사용함
    • 헤르메스는 반복 실행과 학습 루프 엔진으로 사용함
    • 둘은 에이전트 통신 프로토콜(ACP)을 통해 연동됨

기술 맥락

  • 오픈클로와 헤르메스의 차이는 “연결성”과 “누적성”의 차이에 가까워요. 오픈클로는 50개 이상 메시징 채널을 묶는 게 강점이라 여러 플랫폼에서 같은 에이전트를 호출해야 할 때 유리해요.

  • 헤르메스가 실행-학습-개선 루프를 강조하는 이유는 반복 업무 때문이에요. 에이전트가 매번 처음부터 추론하면 비싸고 느리거든요. 과거 세션과 스킬 파일을 남기면 비슷한 작업을 더 안정적으로 처리할 수 있어요.

  • SQLite 기반 전문 검색 데이터베이스를 둔 것도 같은 맥락이에요. 에이전트가 “전에 했던 방식”을 찾으려면 기억이 단순 로그 파일이면 부족해요. 검색 가능한 세션 기록이 있어야 반복 작업에서 성능 개선이 가능해져요.

  • v0.13.0의 칸반, 하트비트, 좀비 탐지는 멀티 에이전트 운영에서 필요한 장치예요. 여러 에이전트가 동시에 돌면 작업 상태가 사라지거나 멈춘 에이전트가 방치될 수 있거든요. 그래서 기능 추가라기보다 운영 제어면에 가까워요.

  • 보안 이슈가 계속 나오는 건 에이전트가 많은 권한을 모으기 때문이에요. 메시징 채널, 웹훅, API 키, 스킬 실행이 한 프로세스 안에 엮이면 편해지는 만큼 공격 표면도 커져요.

AI 에이전트 경쟁이 ‘어디에 연결되냐’에서 ‘작업을 얼마나 오래 기억하고 개선하냐’로 넘어가는 분위기임. 다만 양쪽 모두 보안 이슈가 있어, 에이전트를 운영 자동화에 붙이려면 기능보다 권한 경계부터 봐야 함.

댓글

댓글

댓글을 불러오는 중...

ai-ml

제미나이 도구 호출 능력을 2,600만 파라미터 모델로 증류한 니들 공개

Cactus Compute가 Gemini 3.1의 도구 호출 능력을 2,600만 파라미터짜리 초소형 모델 Needle로 증류해 공개했다. 맥이나 PC에서 로컬 파인튜닝까지 가능하고, 프로덕션 환경에서는 프리필 6,000 토큰/초, 디코드 1,200 토큰/초를 낸다고 주장한다. 개인용 AI 기기에서 함수 호출만 빠르게 처리하는 작은 모델 실험으로 보면 꽤 흥미로운 공개다.

ai-ml

딥시크 V4 인덱서, 6기가바이트 메모리로 백만 토큰까지 밀어붙인 논문

딥시크 V3.2와 V4의 압축 희소 어텐션에서 병목이 되는 인덱서 단계를 스트리밍 방식으로 바꿔, 기존 구현이 6만5536 토큰에서 메모리 부족으로 죽던 문제를 104만8576 토큰까지 확장했다. 핵심은 전체 점수 텐서를 만들지 않고 청크 단위로 top-k를 나눠 계산한 뒤 병합하는 방식이며, 단일 엔비디아 H200에서 피크 메모리 6.21기가바이트를 기록했다. 다만 논문은 인덱서 단계만 다루며, 실제 체크포인트 기반 종단간 성능이나 더 빠른 어텐션 커널을 주장하진 않는다.

ai-ml

챗지피티가 학습에 좋다던 유명 논문, 결국 철회됨

챗지피티가 학생 학습 성과에 큰 도움이 된다고 주장했던 논문이 출판 약 1년 만에 철회됐어. 스프링거 네이처는 분석의 불일치와 결론 신뢰 부족을 이유로 들었고, 문제의 논문은 이미 500회 넘게 인용된 뒤였어.

ai-ml

샘 올트먼, 법정에서 “머스크가 오픈AI 지배권을 자녀에게 넘기려 했다”고 증언

샘 올트먼이 캘리포니아 오클랜드 연방법원 배심원 앞에서 일론 머스크가 오픈AI의 장기 지배권을 원했고, 사망 후엔 자녀에게 넘기는 방안까지 언급했다고 증언했다. 머스크는 오픈AI가 비영리로 출발했는데도 영리화됐다고 소송을 제기했지만, 올트먼은 오히려 머스크가 영리 전환과 테슬라 편입을 밀었다는 취지로 반박했다.

ai-ml

혜전대, AI로 스마트팜 생산·가공·유통 교육 모델 만든다

혜전대가 2026년 교육부·한국연구재단의 AID 전환 중점 전문대학 지원사업에 충남 지역 연합형 사업단으로 선정됐다. 연암대와 역할을 나눠 스마트팜 생산부터 가공·유통까지 전주기를 디지털화하는 교육 모델을 만들겠다는 내용이다.