MS, AI 에이전트 보안용 오픈소스 도구 램파트·클래리티 공개

security 2026-05-26 약 5분

 tags

#ai-agent #security #red-team #ci-cd #open-source

vote

북마크

마이크로소프트가 AI 에이전트 개발 과정에 보안 검증을 계속 끼워 넣기 위한 오픈소스 도구 램파트와 클래리티를 공개했다. 램파트는 레드팀 결과를 반복 가능한 테스트로 바꿔 CI/CD에 넣는 쪽이고, 클래리티는 코드 작성 전 설계 가정과 권한, 신뢰 경계를 점검하는 쪽이다.

1
램파트는 PyRIT 기반으로 AI 에이전트 공격 시나리오와 정상 시나리오를 자동 실행한다
2
클래리티는 에이전트 설계 단계에서 권한, 외부 도구 연동, 신뢰 경계 같은 가정을 기록하고 검토하게 해준다
3
MS는 AI 안전을 일회성 점검이 아니라 지속적인 엔지니어링 체계로 가져가야 한다고 본다

마이크로소프트가 AI 에이전트 보안용 오픈소스 도구 2개를 공개함
- 이름은 램파트(Rampart)와 클래리티(Clarity)
- 둘 다 “에이전트 안전을 출시 직전 체크리스트가 아니라 개발 프로세스 안에 넣자”는 방향임
MS가 보는 문제는 명확함. AI 에이전트는 이제 그냥 챗봇이 아니라 실제 권한을 가진 시스템으로 가고 있음
- 프롬프트 인젝션, 안전하지 않은 도구 호출, 권한 상승, 의도치 않은 자율 행동 같은 문제가 생김
- 기존 웹앱 보안 점검만으로는 이런 흐름을 다 막기 어렵다는 판단임

❗중요

> MS의 핵심 메시지는 “AI 안전은 주기적인 점검이 아니라 지속적인 엔지니어링 체계가 돼야 한다”는 것임. 에이전트가 운영 권한을 갖는 순간, 보안 테스트도 코드처럼 계속 돌아야 함.

램파트는 개발 중인 AI 에이전트를 반복해서 때려보는 쪽에 가까움
- MS의 생성형 AI 레드팀 프레임워크 PyRIT을 기반으로 만들어짐
- 공격 시나리오와 정상 시나리오를 구조화해서 자동 실행할 수 있음
- 교차 프롬프트 인젝션, 안전하지 않은 데이터 처리, 취약한 도구 실행 같은 에이전트 특화 공격 경로를 배포 전에 잡는 게 목적임
중요한 건 레드팀 결과를 “보고서”로 끝내지 않는다는 점임
- 한 번 발견한 취약 시나리오를 반복 가능한 자동화 테스트로 바꿈
- CI/CD 워크플로우에 붙이면 에이전트가 바뀔 때마다 회귀 문제가 생겼는지 확인 가능함
- MS 설명대로 PyRIT이 배포 후 블랙박스 탐지에 강하다면, 램파트는 만드는 중인 엔지니어를 돕는 도구에 가까움
클래리티는 코드 짜기 전 단계에서 설계 가정을 털어보는 도구임
- 에이전트가 어떤 행동을 할 것으로 기대하는지, 어떤 권한을 갖는지, 외부 시스템과 어디까지 연결되는지 점검함
- 신뢰 경계, 실패 가능성, 의사결정 기록 같은 걸 구조화된 대화로 남김
- 데스크톱 앱, 웹 UI, 코딩 에이전트에 통합해서 쓸 수 있다고 MS가 설명함
클래리티가 만든 기록은 저장소 안에 남길 수 있음
- .clarity-protocol/ 디렉터리에 마크다운 파일 형태로 저장됨
- 코드처럼 커밋하고 풀 리퀘스트에서 리뷰할 수 있음
- 변경 diff도 볼 수 있으니, “이 에이전트가 왜 이런 권한을 갖게 됐는지”를 나중에 추적하기 쉬워짐
MS는 최근 에이전트 거버넌스와 안전성 스택을 계속 쌓는 중임
- 지난달에는 정책 적용, 상시 통제, OWASP 기준 보안을 지원하는 에이전트 거버넌스 툴킷을 공개했음
- 램파트와 클래리티도 단일 도구라기보다는 그 전략의 일부로 보면 됨

기술 맥락

이번 선택의 핵심은 보안 검증을 개발 흐름 밖에 두지 않는 거예요. AI 에이전트는 프롬프트와 코드, 도구 권한, 외부 시스템 연결이 같이 움직이기 때문에 출시 직전 점검만으로는 놓치는 구간이 많거든요.
램파트가 CI/CD와 맞물리는 이유도 여기에 있어요. 레드팀이 한 번 찾아낸 공격 패턴을 자동 테스트로 바꿔두면, 모델 프롬프트나 도구 호출 로직이 바뀔 때 같은 문제가 다시 생기는지 계속 확인할 수 있어요.
클래리티는 더 앞단을 건드려요. 코드를 쓰기 전에 에이전트가 어떤 권한을 가져야 하는지, 어디까지 자동으로 행동해도 되는지, 어떤 시스템을 신뢰하면 안 되는지를 기록하게 만드는 거죠. 이 기록을 저장소에 남기면 보안 판단이 회의실 안에서 사라지지 않고 코드 리뷰 흐름으로 들어와요.
결국 MS가 말하는 방향은 AI 에이전트 보안을 별도 이벤트가 아니라 소프트웨어 엔지니어링 산출물로 다루자는 거예요. 테스트, 설계 문서, 리뷰, 배포 파이프라인이 같이 움직여야 에이전트가 커져도 통제력을 잃지 않기 때문이에요.

AI 에이전트가 실제 시스템 권한을 잡기 시작하면 보안 리뷰를 출시 직전에 한 번 하는 방식은 너무 늦다. MS가 내놓은 메시지는 꽤 분명하다. 에이전트 보안도 테스트 코드처럼 저장소와 파이프라인 안으로 들어와야 한다는 거다.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

security 2026-07-13

엘에이 경찰, 사생활 침해 논란 끝에 플록 번호판 감시 계약 종료

엘에이 경찰이 번호판 인식 카메라 업체 플록 세이프티와의 3년 계약을 연장하지 않기로 했어. 시민권, 프라이버시, 데이터 보관과 공유 문제를 해결하지 못했다는 게 핵심 이유야. 플록은 미국 전역에 최소 8만 대 카메라망을 깔아 경찰과 연방기관이 차량을 추적할 수 있게 해왔고, 오탐·보안 사고·이민 단속 악용 의혹까지 겹치며 압박이 커졌어.

security 2026-07-12

크로미움 148부터 Math.tanh 한 번으로 운영체제 지문이 새는 문제

크로미움 148 이후 V8이 Math.tanh 계산을 자체 구현 대신 운영체제의 수학 라이브러리에 맡기면서, 같은 입력값도 리눅스·맥·윈도우에서 마지막 비트가 달라지는 지문 신호가 생겼다. 이 차이는 User-Agent로 맥이라고 주장하면서 리눅스 수학 결과를 내는 식의 위장을 바로 들키게 만든다. CSS 삼각함수와 웹 오디오까지 보면 브라우저 수학 경로가 꽤 복잡하게 갈라지고, 제대로 흉내 내려면 실제 운영체제 라이브러리의 비트 단위 동작까지 맞춰야 한다.

security 2026-07-12

출입통제도 클라우드 구독제로 간다…제로트러스트·AI 분석이 승부처

기업 출입보안이 사업장별 서버를 두는 방식에서 클라우드 기반 서비스형 출입통제(ACaaS)로 옮겨가고 있다. 시장은 2026년 17억8000만 달러에서 2030년 31억9000만 달러로 커질 전망이고, 제로트러스트·모바일 인증·AI 출입 분석·스마트빌딩 통합이 핵심 경쟁 포인트로 꼽힌다.

security 2026-07-12

AWS·구글 클라우드, 양자컴퓨터 대비해 암호 체계 갈아엎는 중

AWS와 구글 클라우드가 양자컴퓨터 시대를 대비해 기존 공개키 암호와 양자내성암호를 함께 쓰는 하이브리드 전환을 시작했다. 핵심 배경은 지금 훔친 암호문을 나중에 양자컴퓨터로 푸는 ‘선수집·후해독’ 공격이고, 국내도 통신·금융·국방 등 5개 분야에 45억원을 투입해 실증에 들어간다.

security 2026-07-12

보안 점검 맡긴 AI 에이전트가 악성코드를 직접 실행할 수 있다는 경고

AI 보안 에이전트가 저장소를 검사하다가 README 같은 문서에 숨은 프롬프트 인젝션에 속아 악성 바이너리를 실행할 수 있다는 연구가 나왔다. 클로드 코드와 코덱스의 자동 모드처럼 승인 없이 명령을 수행하는 구성에서 문제가 재현됐고, 여러 모델과 공급업체를 가로질러 같은 패턴이 통했다는 점이 핵심이다.

MS, AI 에이전트 보안용 오픈소스 도구 램파트·클래리티 공개

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

MS, AI 에이전트 보안용 오픈소스 도구 램파트·클래리티 공개

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사