본문으로 건너뛰기
피드

텐센트 클라우드, 확산 트랜스포머 기반 영상 화질 향상 기술로 방송 기술상 수상

ai-ml 약 5분

텐센트 클라우드의 영상 화질 향상 기술과 스마트 지우기 기능이 2026년 NAB 쇼 올해의 제품상에 선정됐다. 핵심은 확산 트랜스포머 기반 실시간 4K 초해상도, 최대 120프레임 보간, 영상 내 로고·자막·얼굴·번호판 제거 자동화다. 스트리밍, 숏폼, 이커머스, 게임 영상 현지화에 바로 걸리는 기술이라 미디어 개발자에게는 꽤 실무적인 신호다.

  • 1

    확산 트랜스포머 기반 영상 화질 향상 기술이 스트리밍 부문 수상작으로 선정됨

  • 2

    실시간 4K 초해상도, 압축 아티팩트 제거, 최대 120프레임 보간, 관심 영역 화질 향상, 표준 동적 범위에서 고동적 범위 변환을 지원함

  • 3

    스마트 지우기는 로고, 자막, 얼굴, 번호판을 자동으로 흐림 처리하거나 제거해 콘텐츠 현지화를 돕는 기능임

  • 4

    배치 처리, 문자 인식, 번역, 인공지능 더빙과 연계해 대규모 영상 운영 비용을 줄이는 쪽에 초점이 맞춰짐

  • 텐센트 클라우드의 미디어 솔루션 2개가 2026년 NAB 쇼 올해의 제품상을 받음

    • 영상 화질 향상 기술은 스트리밍 부문 수상작으로 선정됨
    • 스마트 지우기 기능은 지능형 기술 부문 수상작으로 선정됨
    • NAB 쇼 수상작은 16개 부문에서 업계 전문가 심사단이 선정했고, 4월 22일 라이브 시상식에서 발표됨
  • 영상 화질 향상 쪽 핵심은 확산 트랜스포머 기반 실시간 처리임

    • 텐센트 클라우드는 기존 합성곱 신경망이나 생성적 적대 신경망 기반 방식보다 자연스러운 텍스처 디테일과 실시간 처리 성능을 강조함
    • 적용 범위는 라이브 스트리밍뿐 아니라 온라인 동영상 서비스, 라이브 커머스, 게임, 숏폼, 인공지능 생성 콘텐츠, 전문 영상 제작까지 넓게 잡음

중요

> 스펙만 보면 꽤 빡셈. 실시간 4K 초해상도, 압축 아티팩트 제거, 최대 120프레임 보간, 관심 영역 화질 향상, 표준 동적 범위에서 고동적 범위 변환까지 한 묶음으로 제시함.

  • 이 기술이 노리는 건 단순히 예쁜 영상이 아니라 운영 지표임

    • 사용자 경험 품질, 플랫폼 시청 시간, 광고 성과 같은 지표 개선에 기여한다고 설명함
    • 라이브 환경의 저지연 요구를 고려했다고 밝힌 점도 중요함. 화질은 좋아졌는데 지연이 늘면 스트리밍 서비스에서는 바로 문제라서임
  • 스마트 지우기는 영상 현지화와 개인정보 보호를 자동화하는 도구에 가까움

    • 로고, 자막, 얼굴, 번호판을 흐림 처리하거나 모자이크 처리하거나 제거할 수 있음
    • 숏폼 드라마 플랫폼, 크로스보더 이커머스 브랜드, 독립 미디어 스튜디오 같은 곳을 주요 사용처로 제시함
    • 국가별 배포를 위해 자막·로고·민감 정보를 다시 손보는 작업을 줄이려는 목적이 큼
  • 구현 쪽에서는 잠재 공간 트랜스포머 기반 엔드투엔드 생성형 아키텍처를 내세움

    • 자동 처리, 지정 영역 처리, 하이브리드 처리 모드를 제공함
    • 배치 처리를 지원해 대량 영상 작업에 맞췄고, 문자 인식·번역·인공지능 더빙과도 연계할 수 있다고 함
  • 텐센트 클라우드는 이걸 미디어 워크플로 전체로 확장하려는 그림을 보여줌

    • 20년 이상의 오디오·비디오 기술 경험을 바탕으로 제작, 처리, 스트리밍, 보안 전송까지 묶은 통합 미디어 솔루션을 제공한다고 설명함
    • 프레임 보간, 초해상도, 표준 동적 범위에서 고동적 범위 변환, 색상 향상뿐 아니라 텍스트-이미지, 이미지-이미지, 텍스트-비디오 생성 기능도 언급함
    • 객체 제거, 번역, 음성 복제와 더빙, 대규모 모델 기반 콘텐츠 이해, 하이라이트 자동 클리핑까지 포함됨

기술 맥락

  • 이 기사에서 흥미로운 선택은 영상 품질 개선을 단일 필터가 아니라 미디어 파이프라인의 일부로 본다는 점이에요. 실시간 4K 초해상도와 120프레임 보간은 시청 품질을 올리지만, 동시에 지연 시간이 늘면 서비스 품질이 떨어지거든요.

  • 확산 트랜스포머를 쓰는 이유는 자연스러운 복원 품질 때문이에요. 영상 압축으로 깨진 질감이나 낮은 해상도에서 사라진 디테일을 복원할 때, 단순 선명화보다 생성형 모델의 추정 능력이 더 유리한 경우가 있어요.

  • 스마트 지우기는 기술적으로는 객체 제거지만, 실제 문제는 글로벌 배포예요. 국가별로 로고, 자막, 개인정보 기준이 다르고 숏폼 물량은 많으니 사람이 하나씩 편집하면 비용과 시간이 터져요.

  • 그래서 배치 처리, 문자 인식, 번역, 더빙 연계가 중요해져요. 영상 한 편을 예쁘게 고치는 데서 끝나는 게 아니라, 수천 개 콘텐츠를 여러 시장에 맞춰 빠르게 내보내는 운영 문제를 풀려는 거예요.

상 받은 사실보다 더 볼 만한 건 영상 운영 자동화의 범위가 넓어졌다는 점임. 화질 개선, 개인정보 마스킹, 자막 제거, 더빙까지 붙으면 숏폼·커머스·게임 영상 파이프라인이 꽤 많이 바뀔 수 있다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

앤트로픽이 스페이스X 데이터센터를 쓰는 이유, AI 권력이 컴퓨팅으로 이동 중

앤트로픽이 스페이스X의 멤피스 콜로서스 I 데이터센터를 쓰는 계약을 맺었다는 보도다. 300MW 이상, 엔비디아 GPU 22만 개 이상 규모의 컴퓨팅 용량이 언급됐고, 폭증하는 AI 수요와 낮은 칩 가동률을 맞교환하는 거래로 해석된다.

ai-ml

AI 생산성 2.5%가 미국 39조 달러 부채를 구할 수 있을까

예일대 예산연구소 모델링에 따르면 AI가 향후 5년간 생산성을 매년 2.5% 끌어올리고 고용이 유지되면 미국의 2035년 재정 적자와 부채 비율이 크게 안정될 수 있다. 하지만 AI가 노동자를 대체해 실업 지원 비용이 커지면 생산성 이득 상당 부분이 상쇄될 수 있다는 경고도 함께 나온다.

ai-ml

AI 도입보다 어려운 건 IP 워크플로우 다시 짜기

IP와 R&D 업무에 AI를 붙였더니 초기 효율은 좋아졌지만, 시간이 지나자 모델별 품질 편차와 검증 부담이 새 병목으로 떠올랐다는 얘기다. 핵심은 특정 AI 도구를 더 사는 게 아니라, AI가 후보를 만들고 전문가가 검증하는 식으로 업무 흐름 자체를 재설계하는 데 있다.

ai-ml

클로드 코워크, 복붙 대신 PC를 직접 만지는 AI 에이전트로 가는 길

앤스로픽의 ‘클로드 코워크’는 챗봇처럼 답만 주는 도구가 아니라, PC 폴더와 파일을 직접 열고 정리하며 엑셀 결과물까지 만드는 에이전트형 업무 도구로 소개됐다. 영수증 사진 30장을 읽어 매장명·날짜·항목·금액을 표로 만들고 합계 수식이 들어간 엑셀 파일까지 생성하는 사례가 핵심이다.

ai-ml

국내 의료 AI, 전시용 기술에서 임상 현장 도구로 이동 중

AI 엑스포 코리아 2026에서 국내 의료 AI 기업들이 병원 문서 구조화, 안저 질환 진단 보조, 정신건강 관리 솔루션을 선보였다. 특히 녹내장 93%, 당뇨병성 망막병증 민감도 90% 같은 임상 성적을 내세우며 ‘기술 시연’보다 실제 현장 가치 증명에 초점을 맞췄다.