실제 공격 트래픽 1억 건 공개 — 위트푸, 아파치 2.0 사이버보안 데이터셋 'Precinct 6' 오픈소스로 풀었다
위트푸가 2024년 실제 공격 트래픽에서 파생한 1억 건 규모의 구조화·라벨링 사이버보안 데이터셋 'Precinct 6'을 허깅페이스에 아파치 2.0으로 공개했다. 시스로그·윈도우 보안 감사·VPC 플로 로그·엔드포인트 원격측정 같은 다중 로그 소스와 출처 그래프, MITRE ATT&CK 매핑 인시던트가 하나로 묶여 있다. 캔터베리대학교와 공동 제작했고 정제 코드까지 오픈소스로 공개됐다.
- 1
실제 공격 트래픽 기반 1억 건 구조화·라벨링 데이터셋 — 기존 공개 데이터셋의 '합성/실험실' 한계를 보완
- 2
시그널(로그)·그래프 노드·그래프 에지·인시던트 4개 하위 데이터로 구성, 다중 로그 소스 통합 분석 가능
- 3
인시던트에 MITRE ATT&CK 기법·전술 매핑 + SOAR 수명주기 메타데이터까지 포함돼 표준 벤치마크 가능
- 4
아파치 2.0 라이선스로 학술·상업·정부 용도 무료 활용 가능, 정제 코드도 오픈소스로 검증 가능
- 5
국내 보안 업계의 AI 탐지·보안관제 자동화·SOAR 고도화 모델 검증에 동일 기준 벤치마크로 활용 가능
이 데이터셋의 진짜 가치는 규모가 아니라 '시간 구조'를 살린 연속 관찰 공격 트래픽이라는 점이다. 합성 데이터로는 재현할 수 없는 APT 공격의 리듬이 담겨 있고, 특히 출처 그래프가 함께 제공돼 GNN 기반 위협 탐지 연구가 가속될 가능성이 크다.
관련 기사
오픈소스 AI 모델로 자율형 AI 웜이 현실화될 수 있다는 연구 공개
토론토대, 벡터 연구소, 케임브리지대 연구진이 오픈웨이트 AI 모델만으로 자율형 AI 웜 프로토타입을 구현했다고 공개했음. 실험 환경에서 웜은 인간 개입 없이 취약점을 찾고, 공격 전략을 바꾸고, 침해한 GPU 자원을 이용해 네트워크로 확산했음.
IBM의 AI 개발 파트너 ‘밥’, 생산성 45% 올리고 보안까지 끼워 넣겠다는 얘기
IBM이 소프트웨어 배포 라이프사이클 파트너 ‘Bob’을 소개하면서 개발 생산성 45% 향상, 앱 현대화 최대 93% 개선을 내세웠어. 기사 전반은 AI 코딩 도구가 생산성을 올리는 동시에 공급망 공격과 보안 검증 부담을 키우는 현실을 짚고, Bob이 사람 승인과 시프트 레프트 보안으로 이 문제를 풀겠다는 내용이야.
한국형 AI 취약점 대응 허브 ‘K-글래스윙’ 추진
한국정보보호산업협회가 AI 기반 취약점 대응 체계인 K-글래스윙 출범을 추진한다. 해외 보안 특화 AI 프로젝트에만 기대기 어렵기 때문에, 국내 보안기업·AI 기업·공공기관이 함께 취약점 진단과 한국형 보안 AI 모델 개발을 맡는 구조다.
샘 올트먼·다리오 아모데이까지, ‘AI 생물학무기’ 막자고 미국 의회에 규제 촉구
오픈AI, 앤트로픽, 구글 딥마인드 등 주요 AI 기업 리더들이 미국 의회에 합성 핵산 판매 규제를 요구했다. AI가 바이러스학 같은 전문 영역의 지식 장벽을 낮추면서, 악의적 세력이 생물학무기 개발에 활용할 수 있다는 우려가 핵심임.
환자 의료기록 133GB가 공개 서버에 노출됐고, 병원은 답이 없었다
캘리포니아 백 앤 페인 스페셜리스트의 서버에서 환자 의료기록 133GB가 공개된 정황이 보고됐다. 제보자는 2026년 3월 31일 병원 측에 알렸지만 응답을 받지 못했고, 5월 20일 AWS에 신고한 뒤 6일 만에 서버가 조치됐다고 밝혔다. 이후 환자와 규제기관에 통지할 계획이 있는지 물었지만 답변은 없었다.
댓글
댓글
댓글을 불러오는 중...