---
title: "F5, 멀티클라우드 보안 플랫폼을 AI 에이전트와 추론 인프라까지 확장"
published: 2026-06-23T08:11:04.412Z
canonical: https://jeff.news/article/4259
---
# F5, 멀티클라우드 보안 플랫폼을 AI 에이전트와 추론 인프라까지 확장

F5가 애플리케이션 전송·보안 플랫폼을 하이브리드 멀티클라우드뿐 아니라 AI 모델, 에이전트, 추론 인프라까지 관리하는 방향으로 확장한다. 핵심은 프런트 도어, 오케스트레이션, 추론 단계마다 보안과 전송 정책을 일관되게 적용하는 것이다.

## 멀티클라우드가 기본값이 된 뒤의 보안 문제

- F5가 애플리케이션 전송·보안 플랫폼 ADSP를 AI 모델, 에이전트, 추론 인프라까지 확장하겠다고 발표함
  - 기존에는 웹 애플리케이션, API, 네트워크 트래픽 관리가 중심
  - 이제는 AI 요청 경로 전체에 전송·보안 정책을 얹겠다는 전략

- 배경은 기업 인프라가 너무 많이 쪼개졌다는 데 있음
  - F5 조사 기준 기업의 94%가 하이브리드 멀티클라우드를 운영
  - 기업 한 곳이 애플리케이션을 운영하는 위치는 평균 19곳
  - 데이터센터, 퍼블릭 클라우드, 프라이빗 클라우드, 에지, 쿠버네티스, 폐쇄망까지 다 흩어져 있음

- F5의 주장은 “하나의 클라우드를 고르는 게 답이 아니라, 모든 환경에 같은 통제를 거는 게 답”이라는 쪽임
  - WAF, API 보안, 봇 방어, DDoS 대응, 부하 분산, 트래픽 관리를 하나의 체계로 묶겠다는 이야기
  - 여기에 AI 모델과 에이전트의 사용 현황 파악, 취약점 점검, 공격 차단까지 붙임

## AI 요청 경로를 세 구간으로 나눠 본다

- F5는 사용자가 프롬프트를 넣고 답을 받기까지의 경로를 세 단계로 쪼갬
  - 프런트 도어: 외부 요청, 프롬프트, API 요청, 신원을 검사하는 첫 관문
  - 오케스트레이션: 모델, 에이전트, 내부·외부 API, 데이터베이스 호출이 얽히는 구간
  - 추론: 실제 AI 모델이 돌고 토큰을 생성하는 인프라 구간

```mermaid
sequenceDiagram
    participant 사용자
    participant 프런트도어
    participant 오케스트레이션
    participant 에이전트
    participant 추론인프라
    사용자->>프런트도어: 프롬프트와 API 요청
    프런트도어->>프런트도어: 신원·공격 행위 검사
    프런트도어->>오케스트레이션: 허용된 요청 전달
    오케스트레이션->>에이전트: 도구·데이터 접근 지시
    에이전트->>오케스트레이션: 실행 결과 반환
    오케스트레이션->>추론인프라: 모델 추론 요청
    추론인프라->>사용자: 응답 토큰 반환
```

- 이 관점이 중요한 이유는, 이제 애플리케이션 사용자가 꼭 사람만은 아니기 때문임
  - AI 에이전트가 API에 접속해 데이터를 가져오고 외부 도구를 호출함
  - 그래서 보안 대상도 사람 계정에서 에이전트 신원, 접근 권한, 데이터 호출 경로까지 넓어짐

## 프런트 도어: AI로 바뀌는 웹 공격을 AI로 본다

- F5는 WAF에 AI 기반 행위 분석을 적용했다고 설명함
  - 기존 WAF는 알려진 공격 패턴을 담은 시그니처 중심
  - 생성형 AI가 공격 입력값을 계속 바꿔 만들면 정적인 규칙만으로는 따라가기 어렵다는 문제의식

- F5는 자사 트래픽 데이터로 신경망을 학습해 요청 행위를 실시간 분석한다고 밝힘
  - 이 기능은 GPU 없이 CPU에서 수행
  - 애플리케이션으로 들어오는 트래픽 경로에서 공격 여부를 판단하는 구조

> [!IMPORTANT]
> F5는 분산 클라우드 WAF가 시그니처 갱신 없이 제로데이 공격 10건을 탐지했고, 별도 설정 없는 탐지 정확도가 64%에서 98%로 올라갔다고 주장함.

- 오탐률 개선 수치도 꽤 큼
  - 새 시그니처의 오탐률이 약 28%에서 1%로 낮아졌다고 설명
  - 향후 이 AI 탐지 기능을 분산 클라우드뿐 아니라 BIG-IP와 NGINX를 포함한 ADSP 전반으로 확대할 계획

## 오케스트레이션: 섀도우AI와 에이전트 권한을 잡는다

- 기업 AI는 모델 하나에 프롬프트 넣고 끝나는 구조가 아닌 경우가 많음
  - 내부 문서를 찾고, 외부 API를 부르고, 데이터베이스를 조회함
  - 여러 에이전트와 하위 에이전트가 일을 나눠 처리하기도 함

- 이 구간에서 문제는 “누가 뭘 호출했는지”가 흐려진다는 점임
  - AI가 허용되지 않은 데이터에 접근할 수 있음
  - 에이전트가 권한을 넘어 외부 도구를 실행할 수도 있음
  - 멀티클라우드에서는 모델, API, 데이터가 서로 다른 위치에 있어 추적이 더 어려움

- F5는 이를 발견, 검증, 차단, 보완의 순환형 보안 체계로 풀겠다고 함
  - 슈어패스AI: 승인되지 않은 생성형 AI와 AI 에이전트, 즉 섀도우AI 탐지
  - AI 레드팀: 실제 공격을 모의 실행해 취약점과 공격 경로 확인
  - AI 가드레일: 프롬프트 삽입, 민감정보 유출, 정책 위반, 권한 밖 접근 차단
  - AI 리메디에이트: 발견된 공격 경로를 방어 정책으로 바꾸고 검증 후 적용

## 추론 인프라: DPU로 토큰 경제를 건드린다

- F5가 말하는 AI 성능은 결국 토큰 경제성임
  - 초당 토큰 수가 높을수록 같은 시간에 더 많은 요청 처리
  - 첫 토큰 생성 시간은 사용자가 느끼는 응답 속도를 좌우
  - 토큰당 전력과 연산 자원은 운영비로 직결

- F5는 엔비디아 블루필드-3 DPU에서 BIG-IP Next for Kubernetes를 돌리는 구조를 제시함
  - DPU가 네트워크 처리, 암호화, 보안 검사, 부하 분산을 CPU나 GPU 대신 수행
  - 트래픽이 GPU에 닿기 전에 보안과 라우팅을 처리하고, 여유 있는 GPU와 모델로 요청을 분산

> [!IMPORTANT]
> 톨리그룹 검증 시험에서 기존 부하 분산 방식 대비 토큰 처리량은 최대 40% 증가, 첫 토큰 생성 시간은 61% 단축, 전체 요청 지연시간은 34% 감소했다고 F5는 밝힘.

- 이 결과의 포인트는 AI 모델을 수정한 게 아니라는 점임
  - 네트워크 처리, 암호화, 부하 분산을 DPU에 맡겨 GPU가 추론에 더 집중하게 만든 구조
  - 향후 DPU에 토큰 사용량 집계와 AI 가드레일 기능도 추가할 계획

## 한국 시장에서는 금융권이 먼저 움직임

- F5는 국내에서 금융권을 중심으로 AI 보안 사업을 확대하려 함
  - 국내 금융 고객 20곳 이상이 AI 레드팀과 AI 가드레일 문의를 했고, 제품 소개와 PoC가 이어지는 중
  - 금융사는 데이터 저장 위치, 외부 AI 사용, 개인정보 처리 규제가 강해서 이런 요구가 먼저 나오는 편

- 분산 클라우드 서비스의 국내 접속 거점도 개설할 예정임
  - 이용자와 가까운 지역에서 트래픽을 받아 지연시간을 줄이는 시설
  - 국내에서 애플리케이션과 API 보안 서비스를 제공하는 기반이 됨

---
## 기술 맥락

- F5가 ADSP를 AI까지 넓히는 이유는 보안 경계가 웹 애플리케이션 앞단에서 끝나지 않게 됐기 때문이에요. AI 에이전트가 API를 호출하고 데이터를 가져오면, 사용자의 클릭만 보던 기존 관점으로는 흐름을 놓치기 쉽거든요.

- 프런트 도어, 오케스트레이션, 추론으로 나누는 방식은 꽤 실무적인 구분이에요. 공격 요청을 막는 문제, 에이전트 권한을 제한하는 문제, GPU 앞단에서 병목을 줄이는 문제는 서로 다른 레이어에서 벌어지기 때문이에요.

- DPU를 쓰는 선택도 단순 성능 튜닝이 아니에요. GPU는 비싼 자원이라 네트워크 처리와 보안 검사까지 떠안기보다 모델 추론에 집중시키는 게 비용 면에서 유리하거든요.

- 국내 금융권 이야기가 붙는 이유는 배포 제약 때문이에요. SaaS만 가능한 보안 제품이면 폐쇄망이나 데이터 반출 제한이 있는 환경에서 쓰기 어렵지만, 온프레미스와 프라이빗 클라우드까지 지원하면 검토 여지가 커져요.

## 핵심 포인트

- 기업 94%가 하이브리드 멀티클라우드를 운영하고, 평균 19곳에서 애플리케이션을 돌린다는 조사 결과 제시
- AI 기반 WAF 탐지로 제로데이 10건을 시그니처 갱신 없이 탐지하고 탐지 정확도를 64%에서 98%로 높였다고 주장
- 엔비디아 블루필드-3 DPU 기반 처리로 토큰 처리량 최대 40% 증가, 첫 토큰 생성 시간 61% 단축 결과 제시
- 국내 금융권 20곳 이상이 AI 레드팀과 AI 가드레일 검증을 논의 중

## 인사이트

F5의 메시지는 단순히 WAF에 AI 기능을 붙였다는 얘기가 아니라, ‘AI 에이전트가 애플리케이션 사용자가 되는 시대’에 기존 네트워크·보안 장비의 역할을 다시 정의하겠다는 쪽에 가깝다. 특히 금융권처럼 폐쇄망, 데이터 위치, 규제가 빡센 환경에서는 꽤 현실적인 고민임.