---
title: "AI의 음악 취향 — 같은 노래, 완전히 다른 리뷰"
published: 2026-03-14T23:57:07.000Z
canonical: https://jeff.news/article/568
---
# AI의 음악 취향 — 같은 노래, 완전히 다른 리뷰

여러 AI 모델에게 동일한 곡을 리뷰시켰더니 같은 곡에 대해 극찬과 혹평이 공존하는 황당한 결과가 나왔다. 마이클 잭슨 Thriller을 '형편없는 프로덕션'이라 평가하는 모델이 있는가 하면, 모델별 긍정/부정 편향이 뚜렷하게 드러났다.

- AI 모델 4개에게 동일한 노래를 리뷰시켰더니, 같은 곡에 대해 완전히 상반된 평가가 나옴
- 마이클 잭슨의 Thriller이 한 모델에서는 "poorly produced and lackluster(형편없는 프로덕션)"으로, 다른 모델에서는 "thrilling and atmospheric(스릴 넘치는 명곡)"으로 평가됨 — 역대급 명반을 두고 이런 의견 차이가 나온다는 게 황당함
- Darude의 Sandstorm도 "lacks depth(깊이가 없다)"에서 "captivating blend(매혹적인 조합)"까지, Rebecca Black의 Friday는 "aggressively autotuned... exceptionally banal(극도로 진부함)"과 "catchy and upbeat pop song(캐치한 팝송)" 평가가 공존함
- Rick Astley의 Never Gonna Give You Up은 한 모델이 "timeless classic... pop masterpiece(시대를 초월한 팝 명곡)"이라 극찬한 반면, 다른 모델은 "repetitive lyrics and slightly generic(반복적이고 평범함)"이라 혹평함
- 일부 모델은 거의 모든 곡에 긍정적 리뷰를 남기는 반면, 다른 모델은 무조건 까는 경향이 있어서, AI의 "음악 취향"이라기보다 모델별 긍정/부정 편향에 가까운 것으로 보임
- 특정 곡에 대해 "NA"로 리뷰를 거부한 모델도 있었는데, 어떤 기준으로 거부하는지는 불명확함
- EDM, 힙합, 록, 팝, 메탈 등 수십 곡을 대상으로 테스트한 결과, 장르와 무관하게 AI 모델 간 평가 일관성이 전혀 없다는 점이 확인됨

## 핵심 포인트

- AI 모델 4개가 동일 곡에 대해 완전히 상반된 음악 리뷰를 생성함
- Thriller, Sandstorm, Friday 등 유명곡에서 극찬과 혹평이 동시에 나옴
- 모델별로 긍정 편향 또는 부정 편향이 뚜렷하게 존재함
- 일부 모델은 특정 곡의 리뷰를 아예 거부(NA)하기도 함

## 인사이트

AI 모델의 주관적 평가 능력은 아직 신뢰할 수 없으며, 리뷰 결과는 곡 자체보다 모델의 내재된 편향을 반영하는 것에 가까움
