---
title: "카페24, 개인 AI 비서용 VPS로 오픈소스 에이전트 시장 대응"
published: 2026-05-17T03:05:01.851Z
canonical: https://jeff.news/article/2780
---
# 카페24, 개인 AI 비서용 VPS로 오픈소스 에이전트 시장 대응

생성형 AI 경쟁이 답변형 챗봇에서 실제 업무를 수행하는 AI 에이전트로 이동하면서, 카페24가 오픈클로와 헤르메스 에이전트 기반 VPS 서비스를 내놨다. 메신저 연결형 에이전트와 장기 기억·반복 업무 자동화형 에이전트를 서버 구축 부담 없이 쓰게 하려는 흐름이다.

- 생성형 AI 경쟁의 무게중심이 “말 잘하는 챗봇”에서 “일을 대신 처리하는 개인 AI 비서”로 옮겨가는 중임
  - 기사에서 말하는 핵심 키워드는 AI 에이전트임
  - 답변만 자연스럽게 하는 게 아니라, 메신저에서 요청을 받고 일정 등록, 링크 요약, 회의 내용 정리, 반복 업무 자동화까지 수행하는 쪽으로 기대가 이동함

- 카페24는 이 흐름에 맞춰 오픈클로와 헤르메스 에이전트 기반 VPS 서비스를 내놓음
  - 배경은 명확함. 기업 플랫폼 안에서 돌아가는 AI 에이전트는 플랫폼 정책과 제한에 영향을 받을 수밖에 없음
  - 그래서 특정 플랫폼에 종속되지 않고, 사용자가 직접 설치·운영하는 개인 운영형 AI 에이전트에 관심이 커지고 있음
  - 기사에 따르면 오픈클로와 헤르메스 에이전트는 깃허브에서 합산 수십만 개 이상의 스타를 기록하며 주목받는 사례로 언급됨

> [!IMPORTANT]
> AI 에이전트는 단순 챗봇처럼 “질문하면 답하는 기능”이 아니라 계속 켜져 있어야 하는 소프트웨어에 가까움. 그래서 모델 성능만큼이나 서버, 세션 유지, 토큰 관리, 격리 실행 환경이 중요해짐.

- 오픈클로는 연결형 AI 에이전트 쪽에 가까움
  - 슬랙, 텔레그램, 디스코드, 왓츠앱 같은 메신저 채널을 연결함
  - 여기에 브라우저 자동화와 작업 흐름 기능까지 묶어서 하나의 운영 체계처럼 쓰게 하는 방향임
  - 사용자는 새 앱을 따로 배우기보다 평소 쓰던 메신저에서 “회의 내용 정리해줘”, “이 링크 요약해줘”, “내일 일정 등록해줘” 같은 요청을 날리는 식임

- 헤르메스 에이전트는 학습형 AI 에이전트에 가까움
  - 사용자의 반복 작업을 기억하고, 그 과정을 스킬 형태로 축적하는 구조를 강조함
  - 단순 대화 저장이 아니라 보고서 정리 방식, 콘텐츠 초안 작성 패턴, 반복 업무 흐름 자체를 재활용하는 쪽임
  - 최근에는 장기 작업 유지, 자동 재시작, 여러 보조 에이전트 동시 실행 기능까지 확대되고 있다고 설명됨

```mermaid
sequenceDiagram
    participant 사용자
    participant 메신저
    participant 에이전트
    participant 브라우저
    participant 서버
    사용자->>메신저: 업무 요청 입력
    메신저->>에이전트: 토큰 기반 요청 전달
    에이전트->>브라우저: 웹 작업 자동 실행
    브라우저-->>에이전트: 작업 결과 반환
    에이전트->>서버: 상태와 기억 저장
    에이전트-->>메신저: 결과 메시지 전송
    메신저-->>사용자: 완료 결과 표시
```

- 문제는 실행 환경이 생각보다 무겁다는 점임
  - AI 에이전트는 메신저 메시지를 실시간으로 받아야 함
  - 예약된 자동화 작업을 정해진 시간에 수행해야 함
  - 세션이 종료돼도 작업 상태와 기억을 유지해야 함
  - 브라우저 자동화나 여러 에이전트 동시 실행을 하려면 서로 분리된 격리 실행 환경과 안정적인 컴퓨팅 자원도 필요함

- 그래서 업계에서는 AI 에이전트를 기능 하나가 아니라 “계속 켜져 있는 개인용 업무 런타임”처럼 보기 시작함
  - 많은 사용자가 AI 자체보다 서버 환경 구축 단계에서 막힌다는 게 기사에서 짚은 병목임
  - API 키, 메신저 토큰, 승인 절차, 서버 설정이 다 엮이니 일반 사용자에게는 꽤 높은 진입장벽임

- 카페24는 이 장벽을 웹 기반 온보딩으로 낮추려 함
  - 사용자가 서버를 신청한 뒤 AI 모델 API 키와 메신저 토큰을 입력함
  - 이후 메신저에서 연결 승인만 하면 에이전트를 실행할 수 있게 구성했다는 설명임
  - 카페24는 이 과정을 클릭 몇 번으로 끝나는 3단계로 압축했다고 밝힘

> [!TIP]
> 팀에서 AI 에이전트를 검토한다면 “어떤 모델을 쓸까”보다 먼저 “이 에이전트가 어디서 계속 실행되고, 실패하면 어떻게 재시작하며, 어떤 권한으로 외부 서비스를 건드리는가”를 봐야 함.

- 기사에서 제시하는 선택지는 크게 두 갈래임
  - 메신저 기반 자동화나 간단한 업무 연결부터 시작하고 싶다면 오픈클로 같은 연결 중심 에이전트가 맞을 수 있음
  - 장기 기억, 반복 업무 자동화, 개인 비서형 활용을 원한다면 헤르메스 에이전트 같은 학습형 흐름이 더 어울림

- 결국 AI 경쟁의 질문이 바뀌고 있음
  - 예전 질문이 “누가 더 똑똑한 모델을 만들까”였다면, 이제는 “누가 사용자의 일상 업무 안에서 자연스럽게 같이 일하게 만들까”에 가까워짐
  - 개발자 입장에선 에이전트가 호출할 도구, 권한 범위, 상태 저장, 장애 복구, 사용자 인터페이스까지 같이 설계해야 하는 단계로 들어가는 중임

---

## 기술 맥락

- 이번 선택의 핵심은 AI 에이전트를 로컬 앱이나 특정 플랫폼 기능이 아니라 VPS 위에서 계속 실행되는 서비스로 본다는 점이에요. 에이전트는 메신저 이벤트를 기다리고, 예약 작업을 수행하고, 작업 상태를 유지해야 하니까 꺼지면 안 되거든요.

- 오픈클로와 헤르메스 에이전트를 나눠 제공하는 이유도 사용 패턴이 다르기 때문이에요. 오픈클로는 여러 메신저와 브라우저 자동화를 연결해 “지금 이 작업 해줘”에 강하고, 헤르메스는 반복 작업을 스킬처럼 쌓아 “늘 하던 방식으로 해줘”에 가까워요.

- 카페24가 온보딩을 3단계로 줄였다는 건 서버 운영의 복잡도를 상품 쪽에서 흡수하겠다는 뜻이에요. 사용자는 모델 API 키와 메신저 토큰만 넣고 승인하면 되지만, 뒤에서는 런타임 유지, 토큰 연결, 프로세스 실행, 상태 보존 같은 일이 계속 돌아가야 해요.

- 개발팀 관점에서는 이게 꽤 큰 아키텍처 변화예요. 챗봇은 요청이 들어올 때 답하면 끝이지만, 에이전트는 외부 서비스 권한을 들고 장기 실행되기 때문에 격리 환경, 재시작 정책, 로그, 권한 관리가 제품 안정성의 일부가 돼요.

## 핵심 포인트

- 오픈클로는 슬랙·텔레그램·디스코드·왓츠앱과 브라우저 자동화를 연결하는 에이전트 흐름
- 헤르메스 에이전트는 반복 업무를 스킬로 축적하고 장기 작업 유지와 다중 보조 에이전트 실행을 강조
- AI 에이전트는 계속 켜져 있는 소프트웨어에 가까워 VPS, 토큰 설정, 격리 실행 환경이 중요해짐

## 인사이트

AI 에이전트의 병목이 모델 성능만이 아니라 운영 환경으로 옮겨가고 있다는 점이 핵심이다. 개발자 입장에선 ‘좋은 프롬프트’보다 서버, 세션, 권한, 토큰, 자동화 런타임을 어떻게 안정적으로 굴릴지가 더 현실적인 문제가 되고 있다.