본문으로 건너뛰기
피드

차세대 영상 코덱 AV2, 최종 1.0 명세 공개

frontend 약 4분
vote
0
댓글
북마크

오픈미디어연합이 AV1의 후속 영상 코덱인 AV2 최종 1.0 명세를 공개했다. 더 낮은 비트레이트로 고화질 영상을 전달하는 압축 효율, AR/VR, 화면 콘텐츠, 다중 프로그램 분할 화면, 실시간 화상회의 같은 현대 영상 워크로드를 겨냥한다.

  • 1

    AV2는 AV1 기반의 차세대 영상 코딩 명세로, 최종 1.0.0 규격 문서와 참조 소프트웨어가 함께 공개됐다.

  • 2

    명세에는 비트스트림 문법, 의미, 디코딩 절차가 포함돼 구현체 간 호환성을 맞추는 기준 역할을 한다.

  • 3

    공식 참조 소프트웨어는 AOMedia Video Model이며, 이번 명세에 대응하는 태그는 v1.0.0이다.

  • AV1의 후속 코덱인 AV2가 최종 1.0 명세로 공개됨

    • 만든 곳은 오픈미디어연합(AOMedia)이고, 목표는 더 낮은 비트레이트에서 더 높은 화질을 내는 것
    • 스트리밍, 방송, 실시간 화상회의처럼 대역폭과 지연 시간이 돈으로 직결되는 영역을 정조준함
  • 이번 공개의 핵심은 “이제 구현 기준이 고정됐다”는 점임

    • 명세 문서는 비트스트림 문법, 각 필드의 의미, 디코딩 절차를 정의함
    • 즉 AV2 인코더와 디코더를 만들 때 “이게 맞는 구현인가?”를 판정할 기준 문서가 나온 셈
  • AV2는 그냥 압축률만 올린 코덱이 아니라, 최근 영상 사용 패턴을 꽤 의식하고 있음

    • AR/VR 애플리케이션 지원 강화
    • 여러 프로그램을 한 화면에 나눠 보내는 분할 화면 전달 지원
    • 화면 공유나 UI 녹화 같은 스크린 콘텐츠 처리 개선
    • 더 넓은 시각 품질 범위에서 동작할 수 있도록 설계

중요

> AV2 1.0은 “새 코덱 발표”보다 “구현자들이 맞출 최종 규격선 공개”에 가깝다. 브라우저, 칩셋, 스트리밍 인프라가 이 규격을 얼마나 빨리 받아들이는지가 다음 싸움임.

  • 구현자를 위한 보조 자료도 같이 정리돼 있음

    • 전체 명세 PDF가 제공돼 오프라인 레퍼런스로 볼 수 있음
    • 섹션 9의 룩업 테이블은 C 헤더 파일 형태로 따로 제공됨
    • 문법 브라우저는 구문 구조와 의미를 좌우 분할 화면으로 보여주고, 검색과 복사도 지원함
  • 공식 참조 소프트웨어는 AVM임

    • AVM은 AOMedia Video Model의 약자
    • 이번 AV2 명세와 대응되는 참조 구현 태그는 v1.0.0
    • 실제 상용 구현체가 AVM 그대로 갈 가능성은 낮지만, 규격 해석을 맞추는 기준으로는 중요함

기술 맥락

  • AV2에서 중요한 건 “코덱 하나 더 나왔다”가 아니라, 영상 전송 비용을 줄이기 위한 선택지가 하나 늘었다는 점이에요. 스트리밍 서비스는 같은 영상을 더 낮은 비트레이트로 보낼 수 있으면 CDN 비용과 사용자 체감 품질을 동시에 건드릴 수 있거든요.

  • 명세가 비트스트림 문법과 디코딩 절차를 자세히 박아두는 이유는 구현체가 많아질수록 호환성 문제가 커지기 때문이에요. 인코더는 A사, 디코더는 B사, 실행 환경은 브라우저나 셋톱박스일 수 있으니, 같은 입력에 대해 같은 식으로 해석되는 기준이 필요해요.

  • AVM 같은 참조 소프트웨어는 제품용 최적화 코드라기보다 “이 규격은 이렇게 동작해야 한다”를 보여주는 기준점에 가까워요. 성능 좋은 상용 구현은 따로 나오겠지만, 애매한 디코딩 결과를 비교할 때는 이런 참조 구현이 꽤 중요해요.

  • AR/VR, 화면 공유, 분할 화면 같은 항목이 명세에 들어간 것도 요즘 영상이 영화나 드라마만 뜻하지 않기 때문이에요. 회의 화면, 게임 스트리밍, 가상현실 콘텐츠처럼 서로 다른 패턴의 픽셀을 다뤄야 해서 코덱 쪽에서도 그 현실을 반영한 거예요.

영상 코덱은 발표 직후보다 브라우저, 하드웨어 디코더, 스트리밍 플랫폼이 얼마나 빨리 따라오느냐가 진짜 관전 포인트다. 그래도 최종 명세가 나왔다는 건 구현자들이 이제 움직일 기준선이 생겼다는 뜻이라 꽤 큰 이벤트다.

댓글

댓글

댓글을 불러오는 중...

frontend

샨텔 산스 제작기, 손글씨와 코믹 산스에서 출발한 오픈소스 가변 폰트

샨텔 산스는 아티스트 샨텔 마틴의 손글씨를 바탕으로 만든 오픈소스 폰트로, 굵기·기울임·비격식성·튀는 움직임 같은 가변 축을 제공한다. 코믹 산스의 친근함과 접근성을 현대적으로 다시 해석하면서도, 380개 이상 언어 지원과 키릴 문자 확장, 오픈타입 기능까지 챙긴 꽤 진지한 타입 디자인 프로젝트다.

frontend

Ember.js 7.0 공개, 새 기능보다 ‘예고된 정리’에 집중한 메이저 릴리스

Ember.js 7.0은 새 공개 API를 추가하지 않고, 6.x 주기에서 이미 폐기 예정이던 기능을 제거하는 데 집중한 메이저 릴리스다. Ember 6.12는 장기 지원 버전이 됐고, 7.0으로 가려면 6.12에서 경고를 모두 없앤 뒤 올리는 흐름이 권장된다. 6.x 동안 기본 빌드 시스템이 Embroider와 Vite 기반으로 바뀌고, 템플릿 태그 기반 작성 방식이 기본값이 된 점도 중요하다.

frontend

콘텐츠를 가리는 짜증나는 모달, 이제 ‘딕오버’라고 부르자는 글

웹사이트와 앱이 콘텐츠를 보여주기도 전에 쿠키 동의, 뉴스레터 가입, 앱 설치 같은 불필요한 모달로 사용자를 막는 디자인 패턴을 강하게 비판한 글이다. 저자는 이런 방해형 모달을 ‘딕오버’라고 부르며, 사용자가 보러 온 페이지를 먼저 보여주는 게 웹의 기본이라고 주장한다.

frontend

AI 코딩은 프론트엔드의 ‘잃어버린 10년’을 반복하고 있나

이 글은 AI 코딩이 프로그래머의 숙련을 약화시키는 흐름을, 지난 10년간 프론트엔드가 자바스크립트 프레임워크 중심으로 겪은 변화와 연결한다. 저자는 도구와 추상화가 생산성을 높이는 건 맞지만, 품질·성능·접근성·사용자 이해 같은 디테일이 새어나올 때 결국 깊이 아는 사람이 필요하다고 본다.

frontend

요즘 픽셀 폰트가 그냥 복고 감성이 아닌 이유

1990년대 기기 화면 느낌을 현대 폰트 시스템으로 재해석한 픽셀 폰트 몇 가지를 소개한 글이다. 핵심은 예쁜 복고풍 글자 모양만이 아니라, 실제 제품에서 쓸 수 있게 기준선, 자간, 메타데이터, 세로 메트릭까지 챙기는지가 중요하다는 점이다.