헤르메스 에이전트 해부: ‘쓸수록 나아진다’는 말이 코드에 박혀 있나

ai-ml 2026-05-17 약 10분

 tags

#ai-agent #memory #sqlite #rl #mcp

vote

북마크

헤르메스 에이전트는 출시 약 11주 만에 깃허브 스타 14만 5천 개, 누적 토큰 1조 200억 개를 기록하며 OpenRouter 사용량 1위에 오른 오픈소스 AI 에이전트다. 핵심은 작업 절차를 스킬로 저장하고, SQLite FTS5로 검색하며, 메모리 파일과 외부 백엔드로 사용자 맥락을 유지하는 self-improving 구조다.

1
헤르메스 에이전트는 Nous Research가 MIT 라이선스로 공개한 오픈소스 에이전트이며 출시 두 달 반 만에 OpenRouter 사용량 1위에 오름
2
도구 호출 5번 이상의 작업 절차를 ~/.hermes/skills/에 마크다운 스킬로 저장하고 재사용함
3
SQLite FTS5로 1만 개 이상 문서를 약 10밀리초 안에 검색하며, 5달러짜리 가상 서버에서도 돌릴 수 있는 가벼운 구조를 내세움
4
스킬 포이즈닝, MCP 서버 샌드박스 부재, 자격 증명 노출, GDPR 미해결 같은 리스크도 지적됨

헤르메스가 왜 갑자기 떴나

OpenRouter 사용량 랭킹에서 헤르메스 에이전트가 오픈클로를 제치고 1위에 올랐음
- OpenRouter는 GPT, Claude, Gemini 등 200개 넘는 AI 모델을 골라 쓰는 통합 API 플랫폼임
- 이 플랫폼의 일간 랭킹은 어떤 AI 앱과 에이전트가 실제로 토큰을 많이 쓰는지 보여주는 지표에 가까움
- 5월 10일 기준으로 올해 내내 강하던 Openclaw 대신 Hermes Agent가 왕좌를 차지함
헤르메스 에이전트는 Nous Research가 MIT 라이선스로 공개한 오픈소스 에이전트임
- 공식 문구는 “The Agent that grows with you”, 즉 사용자와 함께 자라는 에이전트임
- 출시 두 달 반 만에 사용량 1위에 올랐고, 누적 토큰은 1조 200억 개에 달한다고 소개됨
- 깃허브 스타도 출시 11주 차에 14만 5천 개를 찍었음
여기서 말하는 에이전트 서비스는 ChatGPT나 Claude 데스크톱 앱과 다름
- 일반 챗봇은 사용자가 창을 열어 말을 걸어야 움직이고, 창을 닫으면 멈춤
- 에이전트 서비스는 서버에서 계속 도는 상주 작업자에 가까움
- 노트북을 닫아도 작업이 이어지고, 디스코드나 텔레그램으로 말을 걸면 바로 반응하는 구조임

self-improving은 어떻게 구현됐나

헤르메스의 자가 개선 구조는 저장소 안에서 꽤 명확한 디렉토리로 나뉨
- agent/는 에이전트 루프 본체이며 학습 루프가 매 작업마다 도는 곳임
- skills/는 절차적 기억(procedural memory)이 쌓이는 디렉토리임
- environments/는 강화학습(RL) 환경으로, 사용 흔적을 다음 세대 모델 학습 데이터로 바꾸는 영역임
첫 번째 핵심은 작업 절차를 스킬로 자동 저장하는 구조임
- 공식 문서 기준으로 도구 호출(tool call) 5번 이상의 작업을 마치면 그 절차를 마크다운 문서로 저장함
- 저장 위치는 ~/.hermes/skills/임
- 모든 작업을 무작정 저장하는 게 아니라 다시 쓸 만한 절차를 골라 남기는 방식임
저장된 스킬은 슬래시 명령이나 자동 검색으로 다시 호출됨
- 사용자는 / 형태로 직접 부를 수 있음
- 비슷한 상황이 오면 사용자가 호출하지 않아도 에이전트가 알아서 검색함
- 시간이 지날수록 개인 업무에 맞는 절차 라이브러리가 쌓이는 구조임
메모리 검색에는 SQLite FTS5를 씀
- 별도 벡터 데이터베이스를 외부에 두는 대신, 거의 모든 운영체제에 있는 SQLite의 내장 전문 검색 기능을 활용함
- 1만 개 넘는 문서를 약 10밀리초 안에 검색한다고 소개됨
- 5달러짜리 가상 서버에서도 돌아갈 만큼 인프라 부담이 낮다는 점을 내세움

❗중요

> 헤르메스의 “쓸수록 나아진다”는 말은 모델이 알아서 천재가 된다는 뜻이 아님. 사용자의 반복 절차와 선호, 작업 패턴을 스킬과 메모리로 축적해 점점 덜 설명해도 되는 도구가 된다는 뜻에 가까움.

사용 흔적은 Atropos RL 환경을 거쳐 다음 세대 도구 사용 모델 학습 데이터로도 변환됨
- environments/ 디렉토리 쪽에서 사용 trajectory를 압축·변환하는 구조가 보임
- 일반 사용자가 매일 만지는 기능은 아니지만, 내 사용 방식이 다음 모델 학습에 연결될 수 있다는 점은 중요함
- 작업 구조 노출이 꺼림칙하다면 해당 기능을 끄는 것도 방법으로 언급됨
메모리는 에이전트가 직접 고칠 수도 있음
- 내장 메모리 도구로 add, replace, remove를 수행함
- 처음 만든 절차가 틀렸거나, 환경이 바뀌었거나, 더 나은 방법을 찾으면 기록을 수정하는 흐름임
- 핵심 파일은 ~/.hermes/memories/MEMORY.md와 USER.md임
외부 메모리 백엔드도 붙음
- Honcho 기반 메모리는 사용자의 발화, 선호, 작업 패턴을 누적해 세션 너머에서 사용자 모델을 유지함
- 다음 세션에서 처음부터 다시 설명하지 않아도 에이전트가 사용자를 기억하는 식임
- 편한 만큼 민감한 사용자 맥락이 쌓인다는 점도 같이 봐야 함

설치와 운영 조건

공식 quickstart 기준 설치는 curl이나 PowerShell 명령으로 시작함
- macOS, Linux, WSL2, Termux는 install.sh를 실행하는 흐름임
- Windows 네이티브는 얼리 베타라 공식 문서에서도 WSL2를 권장함
- 설치 후 hermes setup, hermes model, hermes tools, hermes gateway 순서로 설정을 진행함
모델 선택지는 넓지만 컨텍스트 창 조건이 있음
- Claude, OpenAI, OpenRouter, Nous Portal, DeepSeek, Kimi, Alibaba Qwen, NVIDIA Nemotron, AWS Bedrock 등을 지원함
- vLLM, Ollama 같은 로컬 모델 엔드포인트도 받을 수 있음
- 다만 모델 컨텍스트 창이 최소 6만 4천 토큰 이상이어야 함
오픈클로에서 넘어오는 마이그레이션도 지원함
- hermes claw migrate로 대화형 전체 자동 마이그레이션을 할 수 있음
- hermes claw migrate --dry-run으로 미리보기도 가능함
- hermes claw migrate --preset user-data를 쓰면 API 키 같은 시크릿은 제외할 수 있음

커뮤니티 반응과 리스크

긍정적인 평은 안정성과 온보딩에 모임
- OpenClaw가 업데이트 때마다 깨져 디버깅에 시간을 많이 썼는데, Hermes로 옮긴 뒤 후회 없다는 마이그레이션 후기가 있음
- 누적해서 성장하려면 일단 깨지지 않는 안정성이 중요하다는 평가가 나옴
- 온보딩과 마이그레이션 설계도 좋게 보는 반응이 있음
하지만 무지성 추천하기엔 보안 리스크가 꽤 큼
- 스킬 포이즈닝 가능성이 지적됨
- MCP 서버 샌드박스 부재가 문제로 언급됨
- 자격 증명 노출과 GDPR 미해결도 우려 사항임
- 1인 개발자에게는 적합할 수 있지만, 규제·결제·감사가 필요한 팀 워크플로에는 아직 부담이 있다는 평도 있음

⚠️주의

> 에이전트 서비스는 내 컴퓨터와 계정의 권한을 꽤 많이 넘겨받음. 스킬 설치, MCP 연결, API 키 관리가 느슨하면 “편한 자동화”가 바로 공격면이 됨.

결론적으로 헤르메스는 “갑자기 똑똑해지는 AI”보다 “쓸수록 내 워크플로에 맞춰지는 AI”에 가까움
- 데모에서 브라우저를 켜고 멀티스텝 작업을 하는 신기함을 넘어, 반복 업무가 쌓인 뒤 진짜 가치가 드러나는 도구임
- 출시 직후 hype보다 두어 달 뒤 사용량 1위에 오른 흐름이 오히려 이 특징을 잘 보여줌
- 다음 에이전트 경쟁은 단순한 모델 성능보다 기억, 절차, 권한, 안정성 설계에서 갈릴 가능성이 큼

기술 맥락

헤르메스의 핵심 선택은 “모델을 계속 학습시킨다”보다 “사용자의 절차를 구조화해서 재사용한다”에 가까워요. 그래서 self-improving이라는 말도 마법 같은 지능 상승이 아니라, 반복 업무를 스킬과 메모리로 저장해 덜 설명해도 되는 방향으로 이해하는 게 정확해요.
SQLite FTS5를 쓴 건 꽤 실용적인 선택이에요. 벡터 데이터베이스를 따로 띄우면 운영 복잡도가 올라가는데, 헤르메스는 로컬에 가까운 가벼운 검색으로 스킬을 찾게 해서 5달러 VPS 같은 낮은 사양에서도 굴릴 수 있게 만들었어요.
스킬 저장 기준에 도구 호출 5번 이상 같은 조건이 있는 이유는 모든 대화를 기억하면 오히려 노이즈가 쌓이기 때문이에요. 반복 가치가 있는 작업 절차만 남겨야 다음에 검색했을 때 진짜 도움이 돼요.
Atropos RL과 trajectory 변환은 사용 흔적을 다음 모델 개선에 연결하는 레이어예요. 이건 기술적으로 흥미롭지만, 사용자의 업무 구조가 학습 데이터로 갈 수 있다는 뜻이라 프라이버시 설정을 같이 봐야 해요.
MCP 샌드박스와 자격 증명 이슈가 나오는 이유도 명확해요. 에이전트가 외부 도구를 많이 호출할수록 편해지지만, 그만큼 파일, 계정, API 키에 닿는 경로도 늘어나거든요. 개인 실험과 팀 운영의 기준을 다르게 봐야 하는 지점이에요.

헤르메스의 self-improving은 마법처럼 모델이 갑자기 똑똑해진다는 뜻이 아니라, 반복 업무 절차와 사용자 맥락을 계속 축적해 워크플로에 맞춰진다는 쪽에 가깝다. 개발자가 봐야 할 포인트는 hype보다 메모리, 스킬, 권한, 샌드박스 설계임.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-13

애플 새 음성 인식 API, 온디바이스 영어 전사에서 위스퍼 스몰까지 이겼다

애플의 새 음성 인식 API인 스피치애널라이저가 리브리스피치 벤치마크에서 기존 SFSpeechRecognizer는 물론 위스퍼 스몰보다도 낮은 단어 오류율을 기록했어. 깨끗한 음성에서는 2.12%, noisy 음성에서는 4.56%로, 기존 애플 API 대비 오류율을 3.5~4배 줄였고 위스퍼 스몰보다 약 3배 빠르게 돌았어. 다만 영어·애플 플랫폼·OS 26 조건의 결과라, 다국어와 크로스플랫폼에서는 여전히 위스퍼의 장점이 남아 있어.

ai-ml 2026-07-13

AI를 진짜 잘 쓰는 기업, 미국 증시에서 연 30% 프리미엄 받는다는 연구

예일대와 로체스터대 연구진이 기업의 실제 대형 언어 모델 사용 데이터를 분석했더니, AI 활용도가 높은 상위 20% 기업이 하위 20%보다 주당 평균 0.64% 높은 초과수익률을 냈다. 단순히 AI 기업이냐가 아니라, 업무에 AI를 얼마나 깊게 쓰는지가 시장 가치에 반영되고 있다는 얘기다.

ai-ml 2026-07-13

ZTE, AI 에이전트폰으로 스마트폰 재도전…진짜 승부처는 앱 생태계

ZTE가 바이트댄스의 더우바오를 탑재한 AI 에이전트 스마트폰으로 시장 재진입을 노린다. 핵심은 사용자가 명령하면 AI가 여러 앱을 직접 열고 조작하는 방식인데, 위챗·타오바오·알리페이 같은 플랫폼과 충돌하면서 생태계 문제가 가장 큰 변수로 떠올랐다.

ai-ml 2026-07-13

노벨상 학자들까지 “AI 경제 충격, 지금 제도 안 만들면 늦다”

노벨 경제학상 수상자 15명을 포함한 학자와 기술 업계 인사 약 200명이 AI가 향후 10년 안에 경제를 급격히 바꿀 수 있다며 정책 대응을 촉구했다. 이들은 산업혁명보다 큰 변화가 훨씬 짧은 시간에 올 수 있고, 대규모 일자리 대체와 생활 수준 향상이라는 양면성이 동시에 존재한다고 봤다.

ai-ml 2026-07-13

NHN, AI 데이터센터 매출 기대감에 목표주가 5만6000원으로 상향

한국투자증권이 NHN의 목표주가를 4만5000원에서 5만6000원으로 올리고 투자의견 매수를 유지했다. 핵심 근거는 양평 AI 데이터센터 가동, 공공·민간 GPU 클러스터 수주 확대, 클라우드 사업부 신규 매출 반영이다.

헤르메스 에이전트 해부: ‘쓸수록 나아진다’는 말이 코드에 박혀 있나

요약

핵심 포인트

핵심 개념

분석

헤르메스가 왜 갑자기 떴나

self-improving은 어떻게 구현됐나

설치와 운영 조건

커뮤니티 반응과 리스크

기술 맥락

인사이트

댓글

댓글

헤르메스 에이전트 해부: ‘쓸수록 나아진다’는 말이 코드에 박혀 있나

요약

핵심 포인트

핵심 개념

분석

헤르메스가 왜 갑자기 떴나

self-improving은 어떻게 구현됐나

설치와 운영 조건

커뮤니티 반응과 리스크

기술 맥락

인사이트

댓글

댓글

관련 기사