해커랭크가 공개한 AI 채용 필터, 같은 이력서가 66점부터 99점까지 흔들림
HackerRank가 공개한 오픈소스 ATS를 직접 돌려본 결과, 같은 이력서가 실행할 때마다 66점에서 99점까지 크게 흔들렸다는 실험 글이다. 글쓴이는 LLM을 이력서 파싱이나 기술 체크리스트 확인에 쓰는 건 괜찮지만, 후보자의 프로젝트와 경력을 점수화하는 순간 운빨 필터가 된다고 비판한다.
- 1
같은 이력서를 100번 평가했더니 점수가 66점부터 99점까지 넓게 분포함
- 2
커트라인이 85점이면 동일 후보가 65% 확률로 탈락하는 결과가 나옴
- 3
기술 스킬 항목은 100회 중 98회가 8/10으로 안정적이었지만, 프로젝트 평가는 크게 흔들림
- 4
Gemini로 바꿔도 48점부터 64점 사이로만 좁아졌을 뿐, 커트라인 60점 기준 28%는 운 없이 탈락함
- 5
경력 항목은 인턴 1개짜리 옛 이력서도 25/25를 받아 일관적이지만 구분력이 없었음
이 글의 포인트는 “AI 채용이 나쁘다”가 아니라 “어떤 판단을 LLM에게 맡기면 안 되는가”에 더 가까움. 구조화 추출은 잘하지만, 후보자의 프로젝트 가치를 18점인지 24점인지 매기는 순간 시스템은 평가기가 아니라 분위기 점수 생성기가 됨.
관련 기사
1960년부터 2026년까지 메모리 가격을 한눈에 보는 데이터셋 공개
스탠퍼드 DAM 프로젝트가 1960년부터 2026년까지 DRAM, NAND 플래시, HBM 가격 흐름을 볼 수 있는 인터랙티브 데이터셋을 공개했다. 단순 차트가 아니라 원본 CSV 다운로드, 세대별 DRAM 가격, AI 가속기 비용에서 HBM이 차지하는 비중까지 함께 제공한다.
바이두, 수십 페이지 문서를 한 번에 읽는 오픈소스 OCR 모델 공개
바이두가 긴 PDF와 이미지 문서를 한 번에 판독하는 오픈소스 모델 언리미티드 OCR을 공개했다. 핵심은 R-SWA라는 어텐션 구조로 장문 출력 때 KV 캐시가 계속 커지는 문제를 억제하는 것이다. 최대 32K 컨텍스트에서 수십 페이지 문서를 1회 추론으로 전사할 수 있다고 설명한다.
딥시크, LLM 추론 가속용 DSpark와 DeepSpec을 오픈소스로 공개
딥시크가 기존 딥시크 V4 Pro에 추측적 디코딩 프레임워크 DSpark를 적용해 추론 속도와 서비스 효율을 끌어올렸다. 함께 공개한 DeepSpec은 드래프트 모델 학습, 평가, 데이터 준비까지 묶은 풀스택 오픈소스 프레임워크다. Qwen3 실험에서는 Eagle3 대비 평균 수용 길이가 26.7~30.9%, DFlash 대비 16.3~18.4% 높았다고 밝혔다.
지자체들이 예산 0원·로컬 AI로 행정 자동화 굴리기 시작함
국내 지방자치단체들이 외부 클라우드 API 대신 온프레미스, 오픈소스 언어모델, 검색증강생성(RAG)을 조합해 행정 AI를 자체 구축하는 사례를 내고 있다. 양산시, 광주시, 남양주시, 서울 광진구 사례를 보면 핵심은 비용 절감뿐 아니라 망분리·보안·환각 제어까지 현장 제약에 맞춘 구조를 만드는 쪽이다.
AI 에이전트가 SaaS를 없애는 게 아니라, SaaS를 ‘기능 API’로 바꾸고 있다
공공 AI-SaaS 컨퍼런스에서 AI 에이전트 시대의 SaaS 변화가 주요 화두로 다뤄졌어. 발표 핵심은 AI와 SaaS가 경쟁하는 게 아니라, AI는 추론과 생성 업무를 맡고 SaaS는 정확한 계산과 규칙 기반 업무를 맡으며 API 중심 구조로 재편된다는 거야.
댓글
댓글
댓글을 불러오는 중...