---
title: "텐센트 클라우드, 확산 트랜스포머 기반 영상 화질 향상 기술로 방송 기술상 수상"
published: 2026-05-07T08:36:04.949Z
canonical: https://jeff.news/article/2274
---
# 텐센트 클라우드, 확산 트랜스포머 기반 영상 화질 향상 기술로 방송 기술상 수상

텐센트 클라우드의 영상 화질 향상 기술과 스마트 지우기 기능이 2026년 NAB 쇼 올해의 제품상에 선정됐다. 핵심은 확산 트랜스포머 기반 실시간 4K 초해상도, 최대 120프레임 보간, 영상 내 로고·자막·얼굴·번호판 제거 자동화다. 스트리밍, 숏폼, 이커머스, 게임 영상 현지화에 바로 걸리는 기술이라 미디어 개발자에게는 꽤 실무적인 신호다.

- 텐센트 클라우드의 미디어 솔루션 2개가 2026년 NAB 쇼 올해의 제품상을 받음
  - 영상 화질 향상 기술은 스트리밍 부문 수상작으로 선정됨
  - 스마트 지우기 기능은 지능형 기술 부문 수상작으로 선정됨
  - NAB 쇼 수상작은 16개 부문에서 업계 전문가 심사단이 선정했고, 4월 22일 라이브 시상식에서 발표됨

- 영상 화질 향상 쪽 핵심은 확산 트랜스포머 기반 실시간 처리임
  - 텐센트 클라우드는 기존 합성곱 신경망이나 생성적 적대 신경망 기반 방식보다 자연스러운 텍스처 디테일과 실시간 처리 성능을 강조함
  - 적용 범위는 라이브 스트리밍뿐 아니라 온라인 동영상 서비스, 라이브 커머스, 게임, 숏폼, 인공지능 생성 콘텐츠, 전문 영상 제작까지 넓게 잡음

> [!IMPORTANT]
> 스펙만 보면 꽤 빡셈. 실시간 4K 초해상도, 압축 아티팩트 제거, 최대 120프레임 보간, 관심 영역 화질 향상, 표준 동적 범위에서 고동적 범위 변환까지 한 묶음으로 제시함.

- 이 기술이 노리는 건 단순히 예쁜 영상이 아니라 운영 지표임
  - 사용자 경험 품질, 플랫폼 시청 시간, 광고 성과 같은 지표 개선에 기여한다고 설명함
  - 라이브 환경의 저지연 요구를 고려했다고 밝힌 점도 중요함. 화질은 좋아졌는데 지연이 늘면 스트리밍 서비스에서는 바로 문제라서임

- 스마트 지우기는 영상 현지화와 개인정보 보호를 자동화하는 도구에 가까움
  - 로고, 자막, 얼굴, 번호판을 흐림 처리하거나 모자이크 처리하거나 제거할 수 있음
  - 숏폼 드라마 플랫폼, 크로스보더 이커머스 브랜드, 독립 미디어 스튜디오 같은 곳을 주요 사용처로 제시함
  - 국가별 배포를 위해 자막·로고·민감 정보를 다시 손보는 작업을 줄이려는 목적이 큼

- 구현 쪽에서는 잠재 공간 트랜스포머 기반 엔드투엔드 생성형 아키텍처를 내세움
  - 자동 처리, 지정 영역 처리, 하이브리드 처리 모드를 제공함
  - 배치 처리를 지원해 대량 영상 작업에 맞췄고, 문자 인식·번역·인공지능 더빙과도 연계할 수 있다고 함

- 텐센트 클라우드는 이걸 미디어 워크플로 전체로 확장하려는 그림을 보여줌
  - 20년 이상의 오디오·비디오 기술 경험을 바탕으로 제작, 처리, 스트리밍, 보안 전송까지 묶은 통합 미디어 솔루션을 제공한다고 설명함
  - 프레임 보간, 초해상도, 표준 동적 범위에서 고동적 범위 변환, 색상 향상뿐 아니라 텍스트-이미지, 이미지-이미지, 텍스트-비디오 생성 기능도 언급함
  - 객체 제거, 번역, 음성 복제와 더빙, 대규모 모델 기반 콘텐츠 이해, 하이라이트 자동 클리핑까지 포함됨

---

## 기술 맥락

- 이 기사에서 흥미로운 선택은 영상 품질 개선을 단일 필터가 아니라 미디어 파이프라인의 일부로 본다는 점이에요. 실시간 4K 초해상도와 120프레임 보간은 시청 품질을 올리지만, 동시에 지연 시간이 늘면 서비스 품질이 떨어지거든요.

- 확산 트랜스포머를 쓰는 이유는 자연스러운 복원 품질 때문이에요. 영상 압축으로 깨진 질감이나 낮은 해상도에서 사라진 디테일을 복원할 때, 단순 선명화보다 생성형 모델의 추정 능력이 더 유리한 경우가 있어요.

- 스마트 지우기는 기술적으로는 객체 제거지만, 실제 문제는 글로벌 배포예요. 국가별로 로고, 자막, 개인정보 기준이 다르고 숏폼 물량은 많으니 사람이 하나씩 편집하면 비용과 시간이 터져요.

- 그래서 배치 처리, 문자 인식, 번역, 더빙 연계가 중요해져요. 영상 한 편을 예쁘게 고치는 데서 끝나는 게 아니라, 수천 개 콘텐츠를 여러 시장에 맞춰 빠르게 내보내는 운영 문제를 풀려는 거예요.

## 핵심 포인트

- 확산 트랜스포머 기반 영상 화질 향상 기술이 스트리밍 부문 수상작으로 선정됨
- 실시간 4K 초해상도, 압축 아티팩트 제거, 최대 120프레임 보간, 관심 영역 화질 향상, 표준 동적 범위에서 고동적 범위 변환을 지원함
- 스마트 지우기는 로고, 자막, 얼굴, 번호판을 자동으로 흐림 처리하거나 제거해 콘텐츠 현지화를 돕는 기능임
- 배치 처리, 문자 인식, 번역, 인공지능 더빙과 연계해 대규모 영상 운영 비용을 줄이는 쪽에 초점이 맞춰짐

## 인사이트

상 받은 사실보다 더 볼 만한 건 영상 운영 자동화의 범위가 넓어졌다는 점임. 화질 개선, 개인정보 마스킹, 자막 제거, 더빙까지 붙으면 숏폼·커머스·게임 영상 파이프라인이 꽤 많이 바뀔 수 있다.
