---
title: "중국 오픈소스 AI가 취약점 탐지에서 미소스급으로 올라왔다는 얘기"
published: 2026-06-29T03:05:02.843Z
canonical: https://jeff.news/article/4373
---
# 중국 오픈소스 AI가 취약점 탐지에서 미소스급으로 올라왔다는 얘기

지푸AI의 GLM-5.2가 사이버보안 벤치마크에서 앤트로픽의 보안 특화 모델 미소스에 근접했다는 보도가 나왔다. 문제는 이 모델이 오픈소스라 누구나 내려받아 자체 환경에서 돌릴 수 있고, 방어자뿐 아니라 공격자도 같은 속도로 취약점을 찾을 수 있다는 점이다. 미국의 AI 접근 제한이 오히려 중국 오픈웨이트 모델 확산을 밀어준다는 비판도 같이 커지고 있다.

- 중국 지푸AI의 `GLM-5.2`가 사이버보안 영역에서 앤트로픽의 보안 특화 모델 `미소스`에 근접했다는 평가가 나옴
  - 월스트리트저널은 보안 연구자들을 인용해 GLM-5.2가 소프트웨어 버그와 보안 취약점 탐지 능력에서 미소스와 비슷한 수준에 도달했다고 보도함
  - 범용 추론이나 일반 작업에서는 여전히 앤트로픽, 오픈AI 최신 모델보다 뒤처진다는 평가가 있지만, 특정 분야인 사이버보안에서는 격차가 거의 사라졌다는 얘기임

- 벤치마크 결과가 꽤 세다. 셈그렙 테스트에서 GLM-5.2는 앤트로픽 `클로드 오퍼스 4.8`을 일부 항목에서 앞섬
  - 연구진은 추가 프롬프트를 넣으면 클로드 오퍼스 4.8과 GLM-5.2 모두 미소스 수준의 버그 탐지 능력을 낼 수 있다고 설명함
  - 중국 360 시큐리티도 `툴롱펑`이라는 취약점 탐지 AI를 공개하며 미소스급 성능을 주장하고 있음

> [!IMPORTANT]
> 핵심은 “중국 모델이 좋아졌다”가 아니라 “오픈소스 모델이 미소스급 취약점 탐지 성능에 가까워졌다”는 점임. 방어자만 쓰는 도구가 아니라 공격자도 그대로 쓸 수 있음.

- 보안 전문가들이 가장 걱정하는 지점은 GLM-5.2가 오픈소스라는 점임
  - 기업과 연구자는 자체 하드웨어에서 모델을 돌리고 수정할 수 있어서 활용성이 높음
  - 반대로 해커도 외부 API 감시 없이 같은 모델을 악성 목적에 쓸 수 있음
  - 취약점 탐지가 빨라지면 패치 속도가 느린 조직은 그대로 노출됨

- 그래서 나온 표현이 `버그 대재앙(Bugmageddon)`임. AI가 취약점을 너무 빨리 찾아내면 방어 쪽이 못 따라갈 수 있다는 우려임
  - 예전에는 취약점 발굴에 숙련된 인력과 시간이 필요했지만, 고성능 모델이 그 병목을 크게 줄일 수 있음
  - 공격자가 대량의 코드베이스와 공개 소프트웨어를 훑고, 방어팀보다 먼저 악용 가능한 버그를 찾는 시나리오가 현실적인 위협으로 올라옴

- 미국의 AI 규제도 논란거리임. 첨단 모델 접근을 제한했는데, 결과적으로 중국 오픈웨이트 모델의 매력을 키웠다는 비판이 나옴
  - 트럼프 행정부는 국가안보를 이유로 앤트로픽의 일반 대상 `페이블 5`와 보안 특화 `미소스 5` 사용을 제한함
  - 오픈AI도 `GPT-5.6` 공개 범위를 제한한 상태임
  - 일부 신뢰 기관에는 미소스 5 사용이 다시 허용됐지만, 업계에서는 “방어 역량까지 묶어버린다”는 불만이 나옴

- 비용과 접근성 때문에 미국 기업들도 중국 모델을 쓰기 시작했다는 점이 아이러니함
  - 오픈라우터 집계에서 GLM-5.2는 출시 직후 가장 많이 쓰이는 AI 모델 상위 10위권에 들어감
  - 마이크로소프트를 포함한 여러 플랫폼 사업자도 중국 AI 모델 제공을 검토 중인 것으로 전해짐
  - 닐스 프로보스는 미국 정책이 더 싸고 충분히 강력한 중국 오픈웨이트 모델 선택을 유도한다고 비판함

- 미국 정부도 이 흐름을 그냥 두고 보진 않는 중임
  - 미 국무부는 중국 오픈소스 AI 모델 확산을 면밀히 추적하고 있다고 밝힘
  - 국방부는 미국 오픈소스 AI 개발사 리플렉션 AI와 기밀 환경용 AI 모델 개발 계약을 맺는 식으로 대응에 나섬

---

## 기술 맥락

- 이번 이슈의 핵심은 취약점 탐지 모델이 API 서비스 안에 갇혀 있느냐, 아니면 오픈웨이트로 풀려 있느냐예요. API 모델은 제공사가 사용 패턴을 어느 정도 감시할 수 있지만, 오픈웨이트 모델은 내려받은 뒤 자체 장비에서 돌리면 외부 통제가 거의 안 먹히거든요.

- 보안팀에게는 이런 모델이 코드 리뷰, 취약점 분석, 패치 우선순위 판단에 바로 도움이 돼요. 문제는 공격자도 똑같이 공개 저장소, 펌웨어, 웹 애플리케이션 코드를 훑는 데 쓸 수 있어서 방어 쪽의 시간 여유가 줄어든다는 점이에요.

- 그래서 기사에서 말하는 Bugmageddon은 과장된 표현만은 아니에요. 취약점 발견 비용이 떨어지면 실제 병목은 ‘찾는 능력’이 아니라 ‘얼마나 빨리 영향 범위를 파악하고 패치하느냐’로 이동하거든요.

- 한국 개발자와 보안팀도 이 흐름을 남의 일로 보기 어렵습니다. 오픈소스 의존성이 많은 서비스일수록 새 취약점이 공개되기 전부터 자동화된 탐색 대상이 될 수 있어서, 자산 목록과 패치 프로세스가 모델 성능만큼 중요해져요.

## 핵심 포인트

- GLM-5.2는 일부 보안 테스트에서 클로드 오퍼스 4.8을 앞섰고, 추가 프롬프트를 쓰면 미소스급 버그 탐지 성능에 도달할 수 있다는 평가가 나왔다.
- 오픈소스 모델이라 기업과 연구자에게는 유용하지만, 해커도 감시 없이 자체 하드웨어에서 취약점 탐지에 활용할 수 있다는 점이 핵심 리스크다.
- 미국이 첨단 모델 사용은 제한하면서 중국 모델과 AI 칩 흐름은 막지 못해 자국 기업 경쟁력만 약화시킨다는 비판이 나온다.

## 인사이트

보안팀 입장에선 이제 AI 취약점 탐지가 ‘있으면 좋은 도구’가 아니라 공격자도 당연히 쓰는 기본 장비가 되는 쪽으로 가고 있다. 패치 속도와 자산 가시성이 부족한 조직은 모델 성능 경쟁의 피해자가 될 가능성이 크다.