본문으로 건너뛰기
피드

MCP는 죽었나? 개발자 워크플로에선 CLI와 스킬이 더 가볍다는 주장

ai-ml 약 9분
vote
0
댓글
북마크

Quandri 팀이 실제 스택에서 MCP 서버의 컨텍스트 사용량, 성능, 디버깅 경험을 재봤더니 꽤 뼈아픈 결과가 나왔다. MCP는 편하지만 도구 정의만으로 컨텍스트를 크게 먹고, 기존 CLI나 API로 충분한 작업까지 과하게 감싸는 경우가 많다는 얘기다. 다만 Claude Code의 지연 로딩 같은 개선도 나오고 있어서, 결론은 'MCP 폐기'보다는 '맞는 자리에만 쓰자'에 가깝다.

  • 1

    MCP 서버 4개를 붙였을 때 도구 정의만으로 컨텍스트 창의 10.5%를 사용했다

  • 2

    Linear MCP는 42개 도구 정의가 항상 로드되며 약 1만2807토큰을 차지했다

  • 3

    같은 Linear 이슈 조회에서 MCP 방식은 CLI 방식보다 약 65배 많은 토큰을 썼다

  • 4

    Jira MCP 벤치마크에서는 REST API 직접 호출보다 호출당 3배, 초기화 포함 첫 호출은 9.4배 느렸다

  • 5

    Quandri는 CLI, 스킬, MCP를 섞어 쓰며 CLI가 있는 도구는 보통 CLI를 우선한다

  • MCP(Model Context Protocol)를 실제 개발 워크플로에 붙여보니, Quandri 팀의 결론은 꽤 차가움 — '연결은 되는데 너무 비싸다'는 것
    • MCP는 대규모 언어 모델(LLM)이 GitHub, Linear, Notion, Slack 같은 외부 도구를 호출하게 해주는 프로토콜임
    • 출시 이후 'AI 생태계의 유에스비-C' 같은 표현까지 붙었지만, 매일 쓰는 개발자 입장에선 컨텍스트 비용과 안정성이 더 크게 보였다는 얘기
    • 글 첫머리에서도 업데이트를 덧붙임: Claude Code가 Tool Search와 지연 로딩(Deferred Loading)을 도입하면서 컨텍스트 부풀림 문제는 최신 버전에선 많이 줄었다고 함

중요

> Quandri 측정에선 MCP 서버 4개를 붙였을 때 도구 정의만으로 컨텍스트 창의 10.5%가 날아갔음. Linear 서버 하나만 해도 42개 도구 정의가 약 1만2807토큰을 먹었다는 게 포인트임.

  • 첫 번째 불만은 컨텍스트 창을 너무 많이 잡아먹는다는 점임

    • 글에서는 컨텍스트 창을 '모델의 책상'에 비유함. MCP 서버를 붙이면 실제 작업 자료를 올리기도 전에 메뉴판이 책상 위를 차지하는 꼴이라는 것
    • Quandri 환경에서 연결된 MCP 서버들의 실제 도구 정의를 추출해 측정했더니, 서버 4개 합산으로 컨텍스트의 10.5%가 도구 설명에 쓰였음
    • 특히 Linear는 42개 도구 정의가 항상 로드됐고, 실제로는 get_issue나 save_issue 정도만 써도 전체 도구 설명을 계속 들고 다니는 구조였음
  • 두 번째는 성능과 안정성 문제임

    • 원 글 작성자가 Jira MCP와 Jira REST API 직접 호출을 비교했을 때 MCP는 호출당 3배 느렸고, 초기화까지 포함한 첫 호출은 9.4배 느렸다고 함
    • Quandri는 이게 Jira만의 문제가 아니라 구조적 오버헤드라고 봄. LLM과 실제 API 사이에 MCP 서버 프로세스 레이어가 하나 더 끼기 때문임
    • Linear, Notion, Slack MCP 서버도 같은 구조라 초기화 실패, 중간 세션 크래시, 느린 응답 같은 운영 이슈가 생길 수 있다는 주장
  • 세 번째는 '이미 CLI나 API가 있는데 굳이 MCP가 필요한가?'라는 질문임

    • 같은 Linear 이슈 하나를 조회하는 작업에서 CLI 방식은 curl 명령과 응답을 합쳐 약 200토큰이면 됐음
    • MCP 방식은 Linear 도구 정의 1만2807토큰에 호출과 응답 150토큰을 더해 약 1만2957토큰이 들었음
    • 단순 비교로 MCP가 약 65배 많은 토큰을 쓴 셈이라, 이 정도면 편의성 비용이 아니라 구조적 낭비에 가깝다는 뉘앙스임
sequenceDiagram
    participant 개발자
    participant 대규모언어모델
    participant MCP서버
    participant 외부서비스
    개발자->>대규모언어모델: Linear 이슈 조회 요청
    대규모언어모델->>MCP서버: 로드된 도구 정의 기반 호출
    MCP서버->>외부서비스: 실제 API 요청 전달
    외부서비스-->>MCP서버: 이슈 데이터 반환
    MCP서버-->>대규모언어모델: 응답 전달
    대규모언어모델-->>개발자: 결과 정리
  • 대안으로 제시하는 건 CLI 우선 전략임

    • 이미 개발자들이 쓰는 gh, psql, aws, curl 같은 명령을 LLM에게 알려주면 별도 도구 정의를 상시 로드할 필요가 없음
    • 사람과 AI가 같은 인터페이스를 쓰니 디버깅도 터미널에서 바로 가능함
    • 파이프라인으로 조합하기도 쉽고, LLM도 man page와 StackOverflow 패턴을 학습해 CLI 사용법을 꽤 잘 다룬다는 전제임
  • 두 번째 대안은 Skills 패턴임 — 필요한 지침만 그때그때 로드하는 방식

    • MCP가 '식탁 위에 메뉴판 10개를 한 번에 펼치는 방식'이라면, Skills는 '필요한 책만 사서에게 요청하는 방식'에 가깝다고 설명함
    • 예를 들어 Linear 스킬 안에 GraphQL 엔드포인트, 인증 방식, curl 예시, jq 파싱 지침을 넣어두면 됨
    • 그러면 LLM은 Linear 작업이 필요할 때만 이 지침을 읽고, 평소에는 42개 도구 정의를 계속 끌고 다니지 않아도 됨

⚠️주의

> 데이터베이스 작업에선 CLI 방식이 항상 이기는 건 아님. MCP 서버는 읽기 전용 모드나 위험 쿼리 차단, 자격 증명 은닉 같은 안전장치를 서버 레벨에서 강제할 수 있음.

  • 그렇다고 MCP가 완전히 쓸모없다는 결론은 아님

    • CLI가 없는 웹 전용 서비스라면 MCP가 사실상 유일한 연결 방식일 수 있음
    • 터미널을 쓰지 않는 비개발자에게는 MCP가 훨씬 접근성 좋은 인터페이스가 될 수 있음
    • 단순 요청-응답을 넘어 실시간 양방향 통신이 필요한 경우에도 MCP 쪽이 더 맞을 수 있음
  • Quandri는 결국 세 가지를 섞어 쓴다고 함

    • Bash와 CLI는 gh, psql, aws처럼 이미 팀이 매일 쓰는 도구에 사용함. 컨텍스트 비용이 없고 터미널에서 바로 디버깅 가능하기 때문임
    • Skills는 커밋 초안 작성, PR 리뷰처럼 반복되는 다단계 워크플로에 사용함. 필요할 때만 로드되니까 가벼움
    • MCP는 강한 CLI가 없거나, 팀 단위 인증과 권한 범위 제어가 중요한 서비스에 남겨둠. 예로 Slack, Linear, Notion, 프로덕션 DB 접근 같은 케이스를 듦
  • 결론은 '무조건 MCP'가 아니라 '도구를 잘 가르치는 게 더 중요하다'는 쪽임

    • Quandri는 MCP 서버를 기존 CLI를 감싼 Skills로 바꾸면서 약 2만1000토큰의 컨텍스트를 아꼈다고 함
    • 일상 워크플로에서 초기화 실패도 줄었고, 디버깅도 터미널이라는 익숙한 장소로 돌아왔다는 설명
    • 요즘 SaaS 랜딩 페이지마다 'MCP 지원' 배지가 붙지만, 실제로는 안정성이나 컨텍스트 비용보다 마케팅 체크박스에 가까운 경우도 있다는 비꼼이 들어감

기술 맥락

  • 이 글의 핵심 선택은 MCP를 기본값으로 두지 않고, CLI와 Skills를 먼저 검토하자는 거예요. 이유는 단순해요. 개발자용 도구는 이미 인증, 디버깅, 자동화 흐름이 CLI 중심으로 잘 깔려 있는 경우가 많거든요.

  • MCP가 문제 되는 지점은 도구 호출 자체보다 '호출하기 전부터 드는 비용'이에요. Linear 이슈 하나를 읽는 데 실제 응답은 150토큰 정도인데, 도구 정의가 1만2807토큰 붙으면 모델 입장에선 작은 작업을 하려고 큰 매뉴얼을 통째로 들고 다니는 셈이에요.

  • Skills 패턴은 이 비용을 늦게 지불하는 방식이에요. Linear 작업이 필요할 때만 GraphQL 예시와 인증 방식을 로드하고, 평소에는 컨텍스트를 비워두는 거죠. 그래서 반복 업무에는 MCP보다 스킬 문서와 CLI 조합이 더 경제적으로 보일 수 있어요.

  • 다만 데이터베이스나 권한이 민감한 서비스에서는 얘기가 달라져요. CLI는 모델이 위험한 명령을 실행하지 않도록 구조적으로 막기 어렵지만, MCP 서버는 읽기 전용 정책이나 자격 증명 보호를 서버에서 강제할 수 있거든요. 그래서 이 글의 결론도 MCP 삭제가 아니라, 비용과 안전 요구를 보고 위치를 정하자는 쪽에 가까워요.

MCP를 'AI 생태계의 유에스비-C'로만 보면 놓치는 게 있다. 개발자 워크플로에서는 연결성보다 컨텍스트 비용, 디버깅 가능성, 권한 제어가 더 현실적인 기준이 된다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

대학생들은 이미 챗지피티와 제미나이를 쪼개 쓰는 ‘AI 네이티브’가 됐다

이화여대 학생 설문과 인터뷰를 보면 생성형 AI는 과제 보조 도구를 넘어 학습, 글쓰기, 자료조사, 감정 상담까지 들어온 일상 인프라가 됐다. 학생들은 챗지피티, 제미나이, 클로드, 퍼플렉시티를 용도별로 나눠 쓰면서도 환각과 오류 때문에 교차검증이 필요하다고 보고 있다. 대학의 윤리 지침은 존재하지만 학생 체감은 낮고, 이제는 금지보다 활용 교육과 평가 방식 재설계가 핵심 이슈로 떠올랐다.

ai-ml

AI 에이전트 시대, 진짜 해자는 코딩 실력이 아니라 도메인 지식이다

이 글은 에이전트형 AI가 소프트웨어 개발의 병목을 “만들 수 있나”에서 “맞는지 판단할 수 있나”로 옮겼다고 주장한다. 일반ist 엔지니어의 코드 생산 능력보다, 특정 도메인의 정답을 알아보고 검증할 수 있는 사람이 더 큰 가치를 갖게 된다는 얘기다.

ai-ml

OpenRouter, 시리즈 B에서 1억1300만 달러 조달…멀티 모델 AI 인프라 판 커진다

OpenRouter가 알파벳 성장펀드 CapitalG 주도로 1억1300만 달러 규모 시리즈 B 투자를 받았다. 최근 6개월간 주간 처리량이 5조 토큰에서 25조 토큰으로 5배 늘었고, 올해 1천조 토큰 이상을 처리하는 속도로 성장 중이라고 밝혔다.

ai-ml

테슬라 FSD, 중국서 첫 집단 사기 소송 심리 시작

중국 베이징 법원이 테슬라의 풀 셀프 드라이빙 판매 약속을 둘러싼 소비자 사기 소송 첫 심리를 열었다. 원고 10명은 2019~2021년에 약 5만6천 위안을 내고 FSD를 샀지만, 실제 중국 출시 기능은 구형 하드웨어 차량을 배제했고 완전 자율주행도 제공하지 못했다고 주장한다. 중국 소비자보호법상 사기로 인정되면 환불뿐 아니라 3배 배상까지 이어질 수 있어 파장이 크다.

ai-ml

안도르 제작자, 1,500쪽 대본 공개 접은 이유는 “AI 학습 데이터 되기 싫어서”

스타워즈 드라마 안도르의 쇼러너 토니 길로이가 준비해둔 1,500쪽짜리 대본·콘셉트 아트 공개 계획을 접었다. 이유는 단순하다. 공개하는 순간 AI 모델 학습 데이터로 빨려 들어갈 수 있다는 우려 때문이다. 헐리우드 창작자와 스튜디오, AI 기업 사이의 저작권·학습 데이터 갈등이 다시 선명하게 드러난 사례다.