본문으로 건너뛰기
피드

MS, AI 에이전트 보안용 오픈소스 도구 램파트·클래리티 공개

security 약 5분
vote
0
댓글
북마크

마이크로소프트가 AI 에이전트 개발 과정에 보안 검증을 계속 끼워 넣기 위한 오픈소스 도구 램파트와 클래리티를 공개했다. 램파트는 레드팀 결과를 반복 가능한 테스트로 바꿔 CI/CD에 넣는 쪽이고, 클래리티는 코드 작성 전 설계 가정과 권한, 신뢰 경계를 점검하는 쪽이다.

  • 1

    램파트는 PyRIT 기반으로 AI 에이전트 공격 시나리오와 정상 시나리오를 자동 실행한다

  • 2

    클래리티는 에이전트 설계 단계에서 권한, 외부 도구 연동, 신뢰 경계 같은 가정을 기록하고 검토하게 해준다

  • 3

    MS는 AI 안전을 일회성 점검이 아니라 지속적인 엔지니어링 체계로 가져가야 한다고 본다

  • 마이크로소프트가 AI 에이전트 보안용 오픈소스 도구 2개를 공개함

    • 이름은 램파트(Rampart)와 클래리티(Clarity)
    • 둘 다 “에이전트 안전을 출시 직전 체크리스트가 아니라 개발 프로세스 안에 넣자”는 방향임
  • MS가 보는 문제는 명확함. AI 에이전트는 이제 그냥 챗봇이 아니라 실제 권한을 가진 시스템으로 가고 있음

    • 프롬프트 인젝션, 안전하지 않은 도구 호출, 권한 상승, 의도치 않은 자율 행동 같은 문제가 생김
    • 기존 웹앱 보안 점검만으로는 이런 흐름을 다 막기 어렵다는 판단임

중요

> MS의 핵심 메시지는 “AI 안전은 주기적인 점검이 아니라 지속적인 엔지니어링 체계가 돼야 한다”는 것임. 에이전트가 운영 권한을 갖는 순간, 보안 테스트도 코드처럼 계속 돌아야 함.

  • 램파트는 개발 중인 AI 에이전트를 반복해서 때려보는 쪽에 가까움

    • MS의 생성형 AI 레드팀 프레임워크 PyRIT을 기반으로 만들어짐
    • 공격 시나리오와 정상 시나리오를 구조화해서 자동 실행할 수 있음
    • 교차 프롬프트 인젝션, 안전하지 않은 데이터 처리, 취약한 도구 실행 같은 에이전트 특화 공격 경로를 배포 전에 잡는 게 목적임
  • 중요한 건 레드팀 결과를 “보고서”로 끝내지 않는다는 점임

    • 한 번 발견한 취약 시나리오를 반복 가능한 자동화 테스트로 바꿈
    • CI/CD 워크플로우에 붙이면 에이전트가 바뀔 때마다 회귀 문제가 생겼는지 확인 가능함
    • MS 설명대로 PyRIT이 배포 후 블랙박스 탐지에 강하다면, 램파트는 만드는 중인 엔지니어를 돕는 도구에 가까움
  • 클래리티는 코드 짜기 전 단계에서 설계 가정을 털어보는 도구임

    • 에이전트가 어떤 행동을 할 것으로 기대하는지, 어떤 권한을 갖는지, 외부 시스템과 어디까지 연결되는지 점검함
    • 신뢰 경계, 실패 가능성, 의사결정 기록 같은 걸 구조화된 대화로 남김
    • 데스크톱 앱, 웹 UI, 코딩 에이전트에 통합해서 쓸 수 있다고 MS가 설명함
  • 클래리티가 만든 기록은 저장소 안에 남길 수 있음

    • .clarity-protocol/ 디렉터리에 마크다운 파일 형태로 저장됨
    • 코드처럼 커밋하고 풀 리퀘스트에서 리뷰할 수 있음
    • 변경 diff도 볼 수 있으니, “이 에이전트가 왜 이런 권한을 갖게 됐는지”를 나중에 추적하기 쉬워짐
  • MS는 최근 에이전트 거버넌스와 안전성 스택을 계속 쌓는 중임

    • 지난달에는 정책 적용, 상시 통제, OWASP 기준 보안을 지원하는 에이전트 거버넌스 툴킷을 공개했음
    • 램파트와 클래리티도 단일 도구라기보다는 그 전략의 일부로 보면 됨

기술 맥락

  • 이번 선택의 핵심은 보안 검증을 개발 흐름 밖에 두지 않는 거예요. AI 에이전트는 프롬프트와 코드, 도구 권한, 외부 시스템 연결이 같이 움직이기 때문에 출시 직전 점검만으로는 놓치는 구간이 많거든요.

  • 램파트가 CI/CD와 맞물리는 이유도 여기에 있어요. 레드팀이 한 번 찾아낸 공격 패턴을 자동 테스트로 바꿔두면, 모델 프롬프트나 도구 호출 로직이 바뀔 때 같은 문제가 다시 생기는지 계속 확인할 수 있어요.

  • 클래리티는 더 앞단을 건드려요. 코드를 쓰기 전에 에이전트가 어떤 권한을 가져야 하는지, 어디까지 자동으로 행동해도 되는지, 어떤 시스템을 신뢰하면 안 되는지를 기록하게 만드는 거죠. 이 기록을 저장소에 남기면 보안 판단이 회의실 안에서 사라지지 않고 코드 리뷰 흐름으로 들어와요.

  • 결국 MS가 말하는 방향은 AI 에이전트 보안을 별도 이벤트가 아니라 소프트웨어 엔지니어링 산출물로 다루자는 거예요. 테스트, 설계 문서, 리뷰, 배포 파이프라인이 같이 움직여야 에이전트가 커져도 통제력을 잃지 않기 때문이에요.

AI 에이전트가 실제 시스템 권한을 잡기 시작하면 보안 리뷰를 출시 직전에 한 번 하는 방식은 너무 늦다. MS가 내놓은 메시지는 꽤 분명하다. 에이전트 보안도 테스트 코드처럼 저장소와 파이프라인 안으로 들어와야 한다는 거다.

댓글

댓글

댓글을 불러오는 중...

security

한양대 에리카와 네이버클라우드, 클라우드·보안·AI 인재 키우는 산학협력 체결

한양대 에리카가 네이버클라우드와 첨단 분야 지역인재 양성과 글로벌 산학협력을 위한 업무협약을 맺었다. 협력 범위는 클라우드, 사이버보안, 블록체인, 개인정보보호, 인공지능(AI), 디지털 전환(DX) 교육·연구 기반 구축까지 포함된다.

security

악성 npm 패키지가 AI 개발도구의 지침 파일과 MCP까지 노리기 시작함

이스트시큐리티가 웹과 탈중앙화금융 개발자를 겨냥한 악성 npm 패키지 캠페인을 포착했어. 공격자는 유명 웹3 도구를 사칭하는 데서 그치지 않고, AI 에이전트가 읽는 프로젝트 지침 파일과 MCP 기반 외부 도구 호출까지 공격 경로로 삼으려 했어.

security

금융권, 앤트로픽 미토스가 찾은 오픈소스 취약점에 긴급 점검 들어감

앤트로픽의 AI 모델 클로드 미토스가 1000개 넘는 오픈소스에서 대량의 취약점 후보를 찾아냈고, 그중 일부가 실제 취약점으로 검증돼 공개됐어. 금융당국은 nginx, wolfSSL, FreeRDP, Ghost 같은 널리 쓰이는 구성요소를 중심으로 금융권에 긴급 자산 점검과 패치 적용을 권고했어.

security

애플이 양자 내성 암호화 검증 코드를 공개했다, 핵심은 수학적 증명

애플이 corecrypto 라이브러리의 포스트 양자 암호화 구현과 검증 코드를 GitHub에 공개했다. ML-KEM, ML-DSA 구현과 형식 검증 접근을 공개해 보안 연구자들이 직접 검토할 수 있게 했고, 이 기술은 25억 대 이상 활성 기기에서 쓰이는 암호화 기반과 연결된다.

security

라라벨 번역 패키지 태그가 통째로 바뀌었다, 개발자 비밀값 털리는 공급망 공격

전 세계 라라벨 개발자가 쓰는 Laravel-Lang 패키지가 공격을 받아 Git 태그가 악성 버전을 가리키도록 바뀌었다. 5월 22일 약 90분 동안 4개 저장소의 태그가 교체됐고, 감염된 패키지는 AWS 키, GitHub 토큰, Stripe 시크릿, 암호화폐 지갑 복구 구문, SSH 개인키 등을 노렸다.