본문으로 건너뛰기
피드

텐센트 클라우드, 확산 트랜스포머 기반 영상 화질 향상 기술로 방송 기술상 수상

ai-ml 약 5분
vote
0
댓글
북마크

텐센트 클라우드의 영상 화질 향상 기술과 스마트 지우기 기능이 2026년 NAB 쇼 올해의 제품상에 선정됐다. 핵심은 확산 트랜스포머 기반 실시간 4K 초해상도, 최대 120프레임 보간, 영상 내 로고·자막·얼굴·번호판 제거 자동화다. 스트리밍, 숏폼, 이커머스, 게임 영상 현지화에 바로 걸리는 기술이라 미디어 개발자에게는 꽤 실무적인 신호다.

  • 1

    확산 트랜스포머 기반 영상 화질 향상 기술이 스트리밍 부문 수상작으로 선정됨

  • 2

    실시간 4K 초해상도, 압축 아티팩트 제거, 최대 120프레임 보간, 관심 영역 화질 향상, 표준 동적 범위에서 고동적 범위 변환을 지원함

  • 3

    스마트 지우기는 로고, 자막, 얼굴, 번호판을 자동으로 흐림 처리하거나 제거해 콘텐츠 현지화를 돕는 기능임

  • 4

    배치 처리, 문자 인식, 번역, 인공지능 더빙과 연계해 대규모 영상 운영 비용을 줄이는 쪽에 초점이 맞춰짐

  • 텐센트 클라우드의 미디어 솔루션 2개가 2026년 NAB 쇼 올해의 제품상을 받음

    • 영상 화질 향상 기술은 스트리밍 부문 수상작으로 선정됨
    • 스마트 지우기 기능은 지능형 기술 부문 수상작으로 선정됨
    • NAB 쇼 수상작은 16개 부문에서 업계 전문가 심사단이 선정했고, 4월 22일 라이브 시상식에서 발표됨
  • 영상 화질 향상 쪽 핵심은 확산 트랜스포머 기반 실시간 처리임

    • 텐센트 클라우드는 기존 합성곱 신경망이나 생성적 적대 신경망 기반 방식보다 자연스러운 텍스처 디테일과 실시간 처리 성능을 강조함
    • 적용 범위는 라이브 스트리밍뿐 아니라 온라인 동영상 서비스, 라이브 커머스, 게임, 숏폼, 인공지능 생성 콘텐츠, 전문 영상 제작까지 넓게 잡음

중요

> 스펙만 보면 꽤 빡셈. 실시간 4K 초해상도, 압축 아티팩트 제거, 최대 120프레임 보간, 관심 영역 화질 향상, 표준 동적 범위에서 고동적 범위 변환까지 한 묶음으로 제시함.

  • 이 기술이 노리는 건 단순히 예쁜 영상이 아니라 운영 지표임

    • 사용자 경험 품질, 플랫폼 시청 시간, 광고 성과 같은 지표 개선에 기여한다고 설명함
    • 라이브 환경의 저지연 요구를 고려했다고 밝힌 점도 중요함. 화질은 좋아졌는데 지연이 늘면 스트리밍 서비스에서는 바로 문제라서임
  • 스마트 지우기는 영상 현지화와 개인정보 보호를 자동화하는 도구에 가까움

    • 로고, 자막, 얼굴, 번호판을 흐림 처리하거나 모자이크 처리하거나 제거할 수 있음
    • 숏폼 드라마 플랫폼, 크로스보더 이커머스 브랜드, 독립 미디어 스튜디오 같은 곳을 주요 사용처로 제시함
    • 국가별 배포를 위해 자막·로고·민감 정보를 다시 손보는 작업을 줄이려는 목적이 큼
  • 구현 쪽에서는 잠재 공간 트랜스포머 기반 엔드투엔드 생성형 아키텍처를 내세움

    • 자동 처리, 지정 영역 처리, 하이브리드 처리 모드를 제공함
    • 배치 처리를 지원해 대량 영상 작업에 맞췄고, 문자 인식·번역·인공지능 더빙과도 연계할 수 있다고 함
  • 텐센트 클라우드는 이걸 미디어 워크플로 전체로 확장하려는 그림을 보여줌

    • 20년 이상의 오디오·비디오 기술 경험을 바탕으로 제작, 처리, 스트리밍, 보안 전송까지 묶은 통합 미디어 솔루션을 제공한다고 설명함
    • 프레임 보간, 초해상도, 표준 동적 범위에서 고동적 범위 변환, 색상 향상뿐 아니라 텍스트-이미지, 이미지-이미지, 텍스트-비디오 생성 기능도 언급함
    • 객체 제거, 번역, 음성 복제와 더빙, 대규모 모델 기반 콘텐츠 이해, 하이라이트 자동 클리핑까지 포함됨

기술 맥락

  • 이 기사에서 흥미로운 선택은 영상 품질 개선을 단일 필터가 아니라 미디어 파이프라인의 일부로 본다는 점이에요. 실시간 4K 초해상도와 120프레임 보간은 시청 품질을 올리지만, 동시에 지연 시간이 늘면 서비스 품질이 떨어지거든요.

  • 확산 트랜스포머를 쓰는 이유는 자연스러운 복원 품질 때문이에요. 영상 압축으로 깨진 질감이나 낮은 해상도에서 사라진 디테일을 복원할 때, 단순 선명화보다 생성형 모델의 추정 능력이 더 유리한 경우가 있어요.

  • 스마트 지우기는 기술적으로는 객체 제거지만, 실제 문제는 글로벌 배포예요. 국가별로 로고, 자막, 개인정보 기준이 다르고 숏폼 물량은 많으니 사람이 하나씩 편집하면 비용과 시간이 터져요.

  • 그래서 배치 처리, 문자 인식, 번역, 더빙 연계가 중요해져요. 영상 한 편을 예쁘게 고치는 데서 끝나는 게 아니라, 수천 개 콘텐츠를 여러 시장에 맞춰 빠르게 내보내는 운영 문제를 풀려는 거예요.

상 받은 사실보다 더 볼 만한 건 영상 운영 자동화의 범위가 넓어졌다는 점임. 화질 개선, 개인정보 마스킹, 자막 제거, 더빙까지 붙으면 숏폼·커머스·게임 영상 파이프라인이 꽤 많이 바뀔 수 있다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

GLM-5.2, 744B 오픈 모델을 로컬에서 돌리는 법

Z.ai의 새 오픈 모델 GLM-5.2를 Unsloth Dynamic GGUF로 로컬 실행할 수 있게 됐다는 가이드다. 744B 파라미터, 40B 활성 파라미터, 100만 토큰 컨텍스트를 가진 모델을 1비트·2비트 양자화로 줄여 Mac이나 대용량 RAM 장비에서 돌리는 방법과 성능 손실 해석을 다룬다.

ai-ml

삼성SDS, 공공 AI 박람회서 패브릭스·브리티웍스·AI 데이터센터 전면 배치

삼성SDS가 2026 공공 AI 박람회에서 공공 행정용 AI 에이전트, 모바일 협업 솔루션, AI 클라우드 인프라를 함께 선보였다. 국민 민원 요약·분류, 조달법령 해석, 정부24 AI 검색 같은 사례를 통해 공공 부문 AI 전환 시장을 정조준했다.

ai-ml

카페24는 120개 모델 라우터, 델은 랙당 GPU 144개 서버…국내 AI 인프라 뉴스 몰아보기

카페24가 120여 개 AI 모델을 단일 API로 묶는 LLM 라우터를 내놨고, 델은 엔비디아 베라 루빈 NVL4 기반 슈퍼컴 서버 XE8812를 공개했다. 오픈AI의 기업용 AI는 삼성전자와 서울대 도입 사례로 국내 확산 흐름이 뚜렷해졌고, 신세계I&C는 게임 IP 콘솔 패키지 출시를 예고했다.

ai-ml

브릭섬, 1MW급 NPU 추론 클라우드 ‘네오클라우드’ 하반기 오픈 추진

브릭섬이 NPU 기반 LLM 추론 전용 클라우드 ‘네오클라우드’를 올해 하반기 공식 오픈하겠다고 밝혔다. 1MW 규모로 시작해 6MW, 20MW까지 키우고, 토큰 API와 베어메탈 임대 두 가지 방식으로 제공한다.

ai-ml

스페이스X, 리플렉션 AI에 9.7조원 규모 AI 연산 자원 판다

스페이스X가 오픈소스 AI 스타트업 리플렉션 AI와 최대 63억달러 규모의 GPU 연산 계약을 맺었다. 리플렉션 AI는 2026년 7월부터 2029년까지 매달 1억5000만달러를 내고 엔비디아 GB300 기반 연산 자원을 쓰게 된다. AI 경쟁에서 모델만큼이나 GPU 접근권과 데이터센터 인프라가 전략 자산이 됐다는 신호다.