KR20160072255A

KR20160072255A - 오디오 장치에 대한 조합된 동적 범위 압축 및 안내 클리핑 방지를 위한 개념

Info

Publication number: KR20160072255A
Application number: KR1020167013335A
Authority: KR
Inventors: 파비앙 쿠치; 크리스티앙 울레; 미하엘 크래슈머; 베른하르트 노이게바우어; 미하엘 마이어; 아르네 보르섬
Original assignee: 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date: 2013-10-22
Filing date: 2014-10-20
Publication date: 2016-06-22
Also published as: US11551703B2; CN105814630B; AU2014339086B2; PT3522157T; MY181977A; US20160240204A1; EP3061090B1; JP6768735B2; EP3522157A1; PT3061090T; MX2016004921A; JP2016538587A; JP6588899B2; EP3522157B1; RU2659490C2; AU2014339086A1; AR098153A1; PL3061090T3; ES2900065T3; EP3061090A1

Abstract

오디오 장치에 대한 조합된 동적 범위 압축 및 안내 클리핑 방지를 위한 개념이 제공된다. 본 발명은 오디오 장치에 대한 조합된 동적 범위 압축 및 안내 클리핑 방지를 위한 개념을 제공한다. 개념에 따라 오디오 비트스트림과 오디오 비트스트림에 관련된 메타데이터 비트스트림을 디코딩하기 위한 오디오 디코더는 오디오 비트스트림으로부터 도출되는 디코딩된 오디오 신호를 수신하고, 오디오 출력 신호를 생성하기 위해 오디오 신호의 특성을 조절하도록 구성되며, 오디오 출력 신호의 동적 범위를 조절하기 위한 동적 범위 제어 스테이지와, 오디오 출력 신호의 클리핑의 방지를 위한 안내 클리핑 방지 스테이지를 포함하는 복수의 조절 스테이지를 포함하는 오디오 처리 체인; 및 메타데이터 비트스트림을 수신하고, 메타데이터 비트스트림으로부터 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스를 추출하도록 구성되는 메타데이터 디코더를 포함한다.

Description

오디오 장치에 대한 조합된 동적 범위 압축 및 안내 클리핑 방지를 위한 개념{CONCEPT FOR COMBINED DYNAMIC RANGE COMPRESSION AND GUIDED CLIPPING PREVENTION FOR AUDIO DEVICES}

본 발명은 오디오 장치에 대한 조합된 동적 범위 압축 및 안내 클리핑 방지를 위한 개념에 관한 것이다. 특히, 본 발명은 오디오 인코더, 오디오 인코더를 동작하기 위한 방법, 오디오 인코더를 동작하기 위한 방법을 실행하기 위한 컴퓨터 프로그램, 오디오 디코더, 오디오 디코더를 동작하기 위한 방법, 및 오디오 디코더를 동작하기 위한 방법을 실행하기 위한 컴퓨터 프로그램에 관한 것이다.

본 발명의 개념은 동적 범위 압축(DRC) 및 안내 클리핑 방지(GCP)에 대한 공동 솔루션의 필요한 기능을 함께 제공하는 여러 처리 블록의 조합에 기초한다.

본 발명의 개념은 특히 예를 들어 [M30100, M30101]에서 정의된 바와 같은 관련된 구성 정보가 인코더 및 디코더에서 이미 이용 가능한 오디오 시스템에 적합하다. 이러한 정보는 예를 들어 파일 기반 전송을 위한 헤더 또는 통합된 음성 및 오디오 코딩(USAC) 구성 확장에 포함될 수 있다. 구성 정보는 채널 레이아웃, 다운믹스 명령어(예를 들어, 다운믹스 계수), 동적 범위 제어 명령어(예를 들어, 적용된 동적 범위 제어 특성, 트랙에 대한 동적 범위 제어 이득 시퀀스의 번호, 및 라우드니스(loudness) 정보(예를 들어 프로그램 라우드니스, 앵커(anchor) 라우드니스, 진정한 피크 값)를 포함할 수 있다. 더 많은 상세 사항은 [M30100, M30101]에서 발견될 수 있다. 이는 동적 범위 제어 명령어 박스의 정보와 동일한 방식으로 처리될 수 있는 대응하는 안내 클리핑 방지 명령어에 적용한다.

본 발명에 따른 오디오 인코더는 오디오 디코더의 동적 범위 제어 스테이지에 대한 동적 범위 제어 이득 시퀀스 뿐만 아니라 오디오 디코더의 안내 클리핑 방지 스테이지에 대한 안내 클리핑 방지 이득 시퀀스를 포함하는 메타데이터 비트스트림을 생성할 수 있으며, 동적 범위 제어 이득 시퀀스는 안내 클리핑 방지 이득 시퀀스와 별도로 송신될 수 있다.

메타데이터 인코더는 외부에서, 예를 들어 콘텐츠 제공자에 의해 운영되는 외부 도구에 의해 제공되는 동적 범위 제어 이득 시퀀스를 입력으로서 사용한다.

동적 범위 제어 이득의 가능한 시간적 해상도는 몇몇 샘플의 범위 내에 있을 수 있다. 동적 범위 제어 이득 값은 일반적으로 최대 0.125 dB의 충분한 해상도로 표현될 수 있다.

추가적으로, 메타데이터 인코더는 안내 클리핑 방지 이득 시퀀스를 입력으로서 취한다.

압축된 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스는 통합된 음성 및 오디오 코딩 확장 페이로드에 포함된 보조(side) 정보로서 수신기로 전송될 수 있다.

동적 범위 제어 이득 시퀀스는 동적 범위 압축을 수행하기 위해 동적 범위 제어 이득만을 포함하는 반면에, 클리핑 방지를 위한 안내 클리핑 방지 이득은 안내 클리핑 방지 이득 시퀀스에 의해 수용된다는 것이 주목되어야한다.

안내 클리핑 방지 이득의 시간적 해상도는 동적 범위 제어 이득의 경우와 동일할 수 있다.

디코더 측에서의 신호 클리핑은 예를 들어 라우드니스 정규화, 다운믹싱, 파라메트릭(parametric) 코딩 도구 등으로 인해 발생할 수 있다.

종래 기술에 따르면, 클리핑 방지는 디코더 처리 체인의 최종 단부(final end)에 피크 리미터를 배치함으로써 달성될 수 있다. 피크 리미터는 정의된 최대 값을 초과하는 입력 신호의 오디오 샘플을 검출하고, 출력 신호의 샘플이 항상 정의된 최대 값 아래로 유지되도록 각각의 신호 부분에 레벨 감소를 적용한다. 가청 왜곡을 방지하기 위해, 레벨 감소는 점진적으로 수행되어야 하며, 신호에 적용된 이득 인자는 단지 시간이 지남에 따라 서서히 변화할 수 있으며, 이는 이득 평활 필터에 의해 보장된다. 이득 인자를 적용하기 전에 입력 신호의 예견(look-ahead) 지연은 또한 급격한 신호 피크 전에 이미 시작하는 이득의 평활한 감소(smooth reduction)를 허용하는데 사용된다. 디코더 측 피크 리미터가 일반적으로 인코더 측에서 제어되지 않기 때문에(콘텐츠 제작자가 피크 리미터 처리에 영향을 미치지 않기 때문에), 이것은 오디오 신호에 직접 적용되는 안내되지 않은 클리핑 방지 이득 시퀀스를 생성한다. 디코더 측 피크 리미터는 항상 디코더 측에서 추가적인 예견 지연(약 5ms 이상) 및 계산 복잡성을 야기한다.

본 발명은 하나 이상의 오디오 채널 및/또는 하나 이상의 오디오 객체를 포함하는 오디오 비트스트림을 생성하기 위한 오디오 인코더를 제공하고, 오디오 인코더는 메타데이터 비트스트림을 생성하기 위한 메타데이터 인코더를 포함하며, 오디오 인코더는

오디오 프레임에 대한 적어도 하나의 동적 범위 제어 이득 시퀀스를 수신하고, 동적 범위 제어 이득 시퀀스는 오디오 디코더의 동적 범위 제어 스테이지에 대한 하나 이상의 동적 범위 제어 이득을 포함하고;

오디오 프레임에 대한 적어도 하나의 안내 클리핑 방지 이득 시퀀스를 수신하고, 안내 클리핑 방지 이득 시퀀스는 오디오 디코더의 안내 클리핑 방지 스테이지에 대한 하나 이상의 안내 클리핑 방지 이득을 포함하며;

상기 동적 범위 제어 이득 시퀀스 중 적어도 하나와 상기 안내 클리핑 방지 이득 시퀀스 중 적어도 하나를 메타데이터의 비트스트림 내에 포함하도록 구성된다.

이와는 대조적으로, 본 발명에 따라 사용되는 바와 같은 안내 클리핑 방지 이득 시퀀스는 인코더 측에서 클리핑 방지 이득의 생성을 완전히 제어하도록 허용한다(원한다면, 콘텐츠 제작자는 이득 특성에 영향을 미칠 수 있다). 생성 후, 클리핑 방지 이득 시퀀스는 디코더 측으로 전송된다. 현재 디코더 구성에 적합한 안내 클리핑 방지 이득 시퀀스는 메타데이터 비트스트림에서 이용 가능하면, 디코더 측 피크 리미터는 대부분의 경우에 회피될 수 있다. 따라서, 디코더 측에서 추가적인 예견 지연 및 계산 복잡성은 회피될 수 있다.

안내 클리핑 방지 이득 시퀀스는 특정 타겟 레벨 또는 다운믹스/포맷 변환기 구성에 대한 오디오 디코더의 출력에서 샘플 클리핑이 발생하지 않는다는 것을 보장하는데 사용된다. 각 안내 클리핑 방지 이득 시퀀스는 특정 다운믹스/포맷 변환기 구성, 특정 타겟 레벨, 및 객체에 대한 특정 동적 범위 제어 이득 시퀀스와 함께 채널에 대한 특정 동적 범위 제어 이득 시퀀스의 조합을 위해 최적화될 수 있다. 어떤 안내 클리핑 방지 이득 시퀀스가 어떤 동적 범위 제어 이득 시퀀스와 관련되는 것에 대한 정보는 통합된 음성 및 오디오 코딩 구성 확장의 파일 헤더에 포함된 안내 클리핑 방지 명령어에 포함될 수 있다. 그것은 또한 안내 클리핑 방지 이득이 인코더에서 결정된 타겟 레벨에 관계된 정보를 포함할 수 있다.

상술한 동적 범위 처리를 위한 본 발명의 개념은 전체 처리 체인의 인코더 측 제어에 대한 접근을 나타낸다. 동적 범위 제어 및 안내 클리핑 방지를 위해 사용되는 메타데이터의 분리는 각각의 이득의 별도의 수정(스케일링 또는 매핑)을 허용하고, 상기 수정은 디코더 구성 및 재생 시나리오에 의존한다.

본 발명의 개념에 의하면, 동적 범위 제어 이득이 안내 클리핑 방지 이득과 별도로 송신되는 경우에 동적 범위 제어 이득 시퀀스의 기본 동적 범위 제어 특성을 무거운 압축(heavy compression)에서 가벼운(light) 압축으로 변화시킬 수 있다. 이것은 동적 범위 제어 이득 시퀀스의 값의 적절한 스케일링 또는 매핑에 의해 달성될 수 있다.

본 발명의 개념은 소정의 품질 요구 사항을 충족하기 위해 오디오 디코더의 최종 출력의 전체 제어를 콘텐츠 제공자에게 제공한다. 이 경우, 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스는 모두 가장 중요한 것으로 간주되는 특정 디코더 구성에 포함될 수 있다. 피크 리미터는 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스의 조합된 사용으로 인해 많은 경우에 폐기될 수 있다. 안내 클리핑 방지 이득을 간단히 적용함으로써 달성되는 오디오 디코더 측에서의 안내 클리핑 방지는 피크 리미터를 사용하는 것보다 계산적으로 더욱 효율적인 것이 주목되어야 한다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 상이한 동적 범위 제어 이득을 포함하는 동일한 오디오 프레임에 대한 적어도 2개의 동적 범위 제어 이득 시퀀스를 수신하고, 상이한 동적 범위 제어 이득을 포함하는 적어도 2개의 동적 범위 제어 이득 시퀀스를 메타데이터 비트스트림 내에 포함하도록 구성된다.

어떤 동적 범위 제어 특성이 상이한 동적 범위 제어 이득 시퀀스와 관련되는 것에 대한 정보는 파일 기반 전송의 경우 또는 통합된 음성 및 오디오 코딩 구성 확장에서의 파일 헤더에 포함된 동적 범위 제어 명령어에 포함될 수 있다.

이러한 특징에 의해 상이한 압축 특성을 가진 디코더에서 출력 신호를 활성화하기 위해 오디오 트랙의 채널에 대한 다수의 동적 범위 제어 이득 시퀀스를 제공할 수 있다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스를 수신하도록 구성되며, 메타데이터 인코더는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하고, 선택적으로, 오디오 채널 및/또는 오디오 객체에 대한 동적 범위 제어 이득의 관계를 메타데이터 비트스트림 내에 포함하도록 구성된다.

각 동적 범위 제어 시퀀스 내에서 상이한 채널 또는 채널의 그룹에 대해 상이한 동적 범위 제어 이득의 세트를 정의할 수 있으며, 각 채널은 일반적으로 단 하나의 채널 그룹과 연관된다. 예를 들어, 멀티채널 영화 사운드에서는 종종 특정 동적 범위 제어 이득을 대화 채널에 적용하는 것이 바람직하다. 예를 들어 전방 좌측, 전방 우측, 후방 좌측, 후방 우측과 같은 나머지 채널은 상이한 동적 범위 제어 이득을 이용하여 처리될 수 있다.

채널의 경우에서 유추하여, 오디오 객체 또는 객체의 그룹과 관련된 다수의 동적 범위 제어 시퀀스는 지원될 수 있다. 이러한 객체 관련 동적 범위 제어 시퀀스는 또한 동적 범위 제어 이득의 채널 관련된 세트 내의 특정 채널 그룹과 연관되는 것으로 간주될 수 있다. 본 명세서에서 용어 오디오 객체는 초인종(door bell)과 같은 단일 소스 사운드에 관계한다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 오디오 디코더의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스를 수신하도록 구성되며, 메타데이터 인코더는 디코더의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하고, 선택적으로, 디코더의 주파수 대역에 대한 동적 범위 제어 이득의 관계를 메타데이터 비트스트림 내에 포함하도록 구성된다.

다중 대역 동적 범위 제어를 지원하는 임의의 확장에서, 메타데이터 인코더는 또한 상이한 주파수 대역에 대해 상이한 동적 범위 제어 이득을 갖는 동적 범위 제어 이득 시퀀스를 입력으로서 수용하도록 확장될 수 있다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스를 수신하고, 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스를 메타데이터 비트스트림 내에 포함하도록 구성된다. 본 발명의 바람직한 실시예에 따르면, 각 동적 범위 제어 시퀀스는 안내 클리핑 방지 이득 시퀀스 중 하나에 관련되고, 메타데이터 인코더는 동적 범위 제어 시퀀스와 안내 클리핑 방지 이득 시퀀스 사이의 관계를 메타데이터 비트스트림 내에 포함하도록 구성된다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 이득 시퀀스를 수신하도록 구성되며, 메타데이터 인코더는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 시퀀스를 포함하도록 구성되고, 선택적으로, 오디오 채널 및/또는 오디오 객체에 대한 안내 클리핑 방지 이득의 관계를 메타데이터 비트스트림 내에 포함하도록 구성된다.

동적 범위 제어 이득과 같이, 각각의 안내 클리핑 방지 시퀀스 내에서 상이한 채널 또는 채널의 그룹에 대해 상이한 안내 클리핑 방지 이득의 세트를 정의할 수 있으며, 각 채널은 일반적으로 단 하나의 채널 그룹과 연관된다. 전형적인 동작 모드에서, 동일한 안내 클리핑 방지 이득은 모든 채널에 적용된다.

객체에 대한 안내 클리핑 방지 이득 시퀀스의 정의는 동적 범위 제어의 경우와 유사하다.

다른 양태에서, 본 발명은 하나 이상의 오디오 채널 및/또는 하나 이상의 오디오 객체를 포함하는 오디오 비트스트림을 생성하기 위한 오디오 인코더를 동작하기 위한 방법을 제공하고, 오디오 인코더는 메타데이터 비트스트림을 생성하기 위한 메타데이터 인코더를 포함하며, 방법은

메타데이터 인코더의 부분 상에서, 오디오 디코더의 동적 범위 제어 스테이지에 대한 하나 이상의 동적 범위 제어 이득을 포함하는 적어도 하나의 동적 범위 제어 이득 시퀀스를 수신하는 단계;

메타데이터 인코더의 부분 상에서, 오디오 디코더의 안내 클리핑 방지 스테이지에 대한 하나 이상의 안내 클리핑 방지 이득을 포함하는 적어도 하나의 안내 클리핑 방지 이득 시퀀스를 수신하는 단계; 및

메타데이터 인코더의 부분 상에서, 상기 동적 범위 제어 이득 시퀀스 중 적어도 하나와 상기 안내 클리핑 방지 이득 시퀀스 중 적어도 하나를 메타데이터 비트스트림 내에 포함시키는 단계를 포함한다.

추가의 양태에서, 본 발명은 컴퓨터 또는 프로세서상에서 실행될 때 상술한 방법을 수행하기 위한 컴퓨터 프로그램을 제공한다.

추가의 양태에서, 본 발명은 특히 본 발명에 따른 오디오 인코더에 의해 생성되는 오디오 비트스트림과, 오디오 비트스트림에 관련된 메타데이터 비트스트림을 디코딩하기 위한 오디오 디코더를 제공하며, 오디오 디코더는

오디오 비트스트림으로부터 도출되는 디코딩된 오디오 신호를 수신하고, 오디오 처리 체인의 오디오 출력 신호의 특성을 조절하도록 구성되며, 오디오 출력 신호의 동적 범위를 조절하기 위한 동적 범위 제어 스테이지와, 오디오 출력 신호의 클리핑의 방지를 위한 안내 클리핑 방지 스테이지를 포함하는 복수의 조절 스테이지를 포함하는 오디오 처리 체인; 및

메타데이터 비트스트림을 수신하고, 메타데이터 비트스트림으로부터 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스를 추출하도록 구성되는 메타데이터 디코더로서, 동적 범위 제어 이득 시퀀스의 적어도 부분은 동적 범위 제어 스테이지에 공급되고, 안내 클리핑 방지 이득 시퀀스의 적어도 부분은 안내 클리핑 방지 스테이지에 공급되는 메타데이터 디코더를 포함한다.

메타데이터 디코더는 예를 들어 통합된 음성 및 오디오 코딩 디코더로부터 압축된 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스를 포함하는 메타데이터 비트스트림을 수신한다.

메타데이터 디코더는 압축된 메타데이터 비트스트림으로부터 원하는 동적 범위 제어 이득 시퀀스를 생성한다. 추가적으로, 생성된 동적 범위 제어 이득의 스케일링 또는 매핑이 적용될 수 있다.

메타데이터 디코더는 추가적으로 압축된 안내 클리핑 방지 메타데이터를 포함하는 비트스트림으로부터 원하는 안내 클리핑 방지 이득 시퀀스를 생성한다. 안내 클리핑 방지 이득의 스케일링 또는 매핑이 적용될 수 있다. 이것은 오디오 디코더 타겟 레벨이 오디오 인코더에서 안내 클리핑 방지 이득 시퀀스를 결정하는데 사용된 타겟 레벨보다 낮은 경우에 특히 유용하다. 그 다음, 안내 클리핑 방지 이득의 매핑이 가능하고, 클리핑이 오디오 디코더 출력 신호에서 발생하지 않는 것을 여전히 보장하면서 신호 헤드룸(headroom)을 최적으로 복원한다.

동적 범위 제어 스테이지는 메타데이터 디코더로부터 각각의 오디오 프레임에 대해 압축되지 않고 임의로 스케일링되거나 매핑된 동적 범위 제어 이득 시퀀스를 직간접적으로 수신한다. 메타데이터 디코더는 또한 최종 시간 도메인의 동적 범위 제어 이득 값이 오디오 샘플의 시간적 해상도에 대응하는 시간적 해상도로 보간되는 것을 보장할 수 있다. 이러한 최종 동적 범위 제어 이득은 그 후 디코딩된 오디오 신호에 적용되고, 여기서 정확한 채널 또는 객체 그룹으로의 특정 동적 범위 제어 시퀀스의 할당은 관찰된다.

안내 클리핑 방지 스테이지는 메타데이터 디코더로부터 각각의 오디오 프레임에 대해 압축되지 않고 임의로 스케일링되거나 매핑된 안내 클리핑 방지 이득 시퀀스를 직간접적으로 수신한다. 메타데이터 디코더는 또한 최종 시간 도메인의 안내 클리핑 방지 이득 값이 오디오 샘플의 시간적 해상도에 대응하는 시간적 해상도로 보간되는 것을 보장할 수 있다. 이러한 최종 안내 클리핑 방지 이득은 그 후 디코딩된 오디오 신호에 적용되고, 여기서 정확한 채널 그룹으로의 특정 안내 클리핑 방지 시퀀스의 할당은 관찰된다.

본 발명은 인코더 측에서 전체 처리 체인의 제어를 그만두면서 오디오 디코더 측에서 유연성을 제공한다. 동적 범위 제어 및 안내 클리핑 방지를 위해 사용되는 메타데이터의 분리는 각각의 이득의 별도의 수정(스케일링 또는 매핑)을 허용하고, 상기 수정은 오디오 디코더 구성 및 재생 시나리오에 의존한다.

동적 범위 제어 이득이 안내 클리핑 방지 이득과 별도로 송신되는 경우에 본 발명은 동적 범위 제어 이득 시퀀스의 기본 동적 범위 제어 특성을 무거운 압축에서 가벼운 압축으로 변화시키는 것을 허용한다. 이것은 동적 범위 제어 이득 시퀀스의 값의 적절한 스케일링 또는 매핑에 의해 달성될 수 있다.

디코더 타겟 레벨이 인코더에서 안내 클리핑 방지를 위한 이득을 계산하기 위해 사용되는 타겟 레벨보다 낮은 경우에, 신호 피크의 감소된 감쇠는 안내 클리핑 방지 이득을 적절히 스케일링함으로써 디코더에서 허용될 수 있다. 그 다음, 강한 신호 피크의 레벨이 유지될 수 있거나, 수정되지 않은 방식으로 안내 클리핑 방지 이득을 적용하는 경우에 비해 적어도 증가될 수 있으며, 이것은 이용 가능한 헤드룸(headroom)이 보존될 수 있다는 것을 의미한다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더는 상이한 동적 범위 제어 이득을 포함하는 동일한 오디오 프레임에 대한 적어도 2개의 동적 범위 제어 이득 시퀀스를 메타데이터 비트스트림으로부터 추출하도록 구성된다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스를 메타데이터 비트스트림으로부터 수신하도록 구성된다.

채널의 경우에서 유추하여, 오디오 객체 또는 객체의 그룹과 관련되는 다수의 동적 범위 제어 시퀀스는 지원될 수 있다. 이러한 객체 관련 동적 범위 제어 시퀀스는 또한 동적 범위 제어 이득의 채널 관련된 세트 내의 특정 채널 그룹과 연관되는 것으로 간주될 수 있다. 본 명세서에서 용어 오디오 객체는 초인종과 같은 단일 소스 사운드에 관계한다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더는 오디오 디코더의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스를 메타데이터 비트스트림으로부터 추출하도록 구성된다.

다중 대역 동적 범위 제어를 지원하는 임의의 확장에서, 메타데이터 디코더는 또한 상이한 주파수 대역에 대해 상이한 동적 범위 제어 이득을 갖는 동적 범위 제어 이득 시퀀스를 입력으로서 수용하도록 확장될 수 있다.

다중 대역 동적 범위 제어 확장의 경우, 시간 도메인의 오디오 신호는 다중 대역 동적 범위 제어 이득을 적용하기 전에 적절한 주파수 도메인의 표현(resentation)으로 변환되어야 한다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더는 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스를 메타데이터 비트스트림으로부터 추출하도록 구성된다.

이러한 특징에 의해 대응하는 동적 범위 제어 이득 시퀀스와 일치하기 위해 오디오 트랙에 대한 다수의 안내 클리핑 방지 이득 시퀀스를 제공할 수 있다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 이득 시퀀스를 메타데이터 비트스트림으로부터 추출하도록 구성된다.

본 발명의 바람직한 실시예에 따르면, 오디오 디코더는 구성 제공 스테이지로부터 수신된 구성 정보에 기초하여 메타데이터 및 파라미터들을 조절 스테이지들 중 적어도 하나에 제공하도록 구성된 메타데이터 및 파라미터 제어 스테이지를 더 포함한다.

오디오 디코더에서의 메타데이터 및 파라미터 제어 스테이지는 원하는 동적 범위 제어 이득 시퀀스에 따라 메타데이터 비트스트림의 정확한 부분을 선택할 수 있다. 스케일링 및 매핑 정보는 또한 디코더 구성 정보의 부분이거나 디코더 구성 정보로부터 도출될 수 있다.

유추에 의해, 오디오 디코더에서의 메타데이터 및 파라미터 제어 스테이지는 원하는 안내 클리핑 방지 이득 시퀀스에 따라 비트스트림의 정확한 부분을 선택한다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 및 파라미터 제어 스테이지는, 복수의 동적 범위 제어 이득 시퀀스가 수신되는 경우에, 복수의 동적 범위 제어 이득 시퀀스 중 어떤 것이 동적 범위 제어 스테이지에 공급되는지를 선택하도록 구성된다. 메타데이터 및 파라미터 제어 스테이지의 부분 상에서의 동적 범위 제어 시퀀스의 선택은 채널 레이아웃, 다운믹스 명령어, 객체 메타데이터, 동적 범위 제어 명령어, 라우드니스 정보, 및 디코더 타겟 레벨과 같은 디코더 구성 정보에 기초할 수 있다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 및 파라미터 제어 스테이지는, 복수의 안내 클리핑 방지 이득 시퀀스가 수신되는 경우에, 복수의 안내 클리핑 방지 이득 시퀀스 중 어떤 것이 안내 클리핑 방지 스테이지에 공급되는지를 선택하도록 구성된다.

메타데이터 및 파라미터 제어 블록의 부분 상에서의 안내 클리핑 방지 이득 시퀀스의 선택은 일반적으로 상술한 오디오 디코더 구성 정보에 기초한다.

본 발명의 바람직한 실시예에 따르면, 신호 흐름의 방향으로의 동적 범위 제어 스테이지는 오디오 조절 체인의 제 1 조절 스테이지이다.

채널에 대한 동적 범위 제어 처리는 채널 그룹에 대한 상이한 이득을 가능하게 하기 위해 디코딩된 오디오 채널의 잠재적 다운믹싱 또는 포맷 변환 전에 수행될 수 있다. 따라서, 동적 범위 제어 이득은 렌더링 전에 객체에 적용된다. 채널 및 객체 모두가 존재하는 경우에, 동적 범위 제어 처리의 위치는 그대로 두고: 채널 관련된 동적 범위 제어는 포맷 변환기 스테이지 바로 전에 수행되어야 하는 반면에, 객체 관련된 동적 범위 제어는 객체 렌더러(renderer) 전에 수행된다.

본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인은 오디오 출력 신호의 채널 구성을 조절하도록 구성되는 포맷 변환기 스테이지를 포함한다. 또한 다운믹서(DMX)로 지칭되는 포맷 변환기 스테이지는 오디오 출력 신호의 채널 구성을 재생을 위해 사용되는 변환기에 적응하도록 구성된다. 예를 들어, 포맷 변환기 스테이지는 5.1 서라운드 신호를 스테레오 신호로 변환할 수 있다.

본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인은 오디오 출력 신호의 라우드니스를 정규화하도록 구성되는 라우드니스 정규화 스테이지를 포함한다.

라우드니스 정규화 스테이지는 출력 신호가 올바른 타겟 라우드니스 레벨을 갖도록 오디오 입력 신호를 스케일링할 수 있다. 스케일링 인자는 프로그램 기준 레벨(PRL)과 디코더 타겟 레벨(DTL) 사이의 차로부터 도출되고, 디코더의 메타데이터 및 파라미터 제어에 의해 라우드니스 정규화 블록에 제공된다. 프로그램 기준 레벨은 예를 들어 파일 헤더 내에 포함되는 라우드니스 정보로부터 얻을 수 있는 반면에, 디코더 타겟 레벨은 디코더 구성 파라미터이다. 다수의 프로그램 기준 레벨 값은 각각 적용된 동적 범위 제어 시퀀스 및/또는 적용된 다운믹스의 특정 구성에 대응하는 라우드니스 정보 내에 제공되는 것이 가능하다. 이 경우에, 메타데이터 및 파라미터 제어 스테이지는 주어진 오디오 디코더의 구성을 고려하면서 올바른 프로그램 기준 레벨의 값을 선택한다. 라우드니스 처리 단계의 위치는 오디오 디코더의 실제 출력 구성에 따라 달라진다. 일반적으로, 라우드니스 정규화는 적용 가능하다면 예를 들어 믹서 후 또는 포맷 변환 후에 오디오 디코더의 출력 채널에서 수행되어야 한다.

본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인은 임계 값을 초과하는 경우에 오디오 출력 신호의 피크를 제한하도록 구성된 피크 리미터 스테이지를 포함한다.

본 발명의 바람직한 실시예에 따르면, 신호 흐름의 방향의 피크 리미터 스테이지는 오디오 조절 체인의 최종 조절 스테이지이다.

전형적인 오디오 디코더의 오디오 처리 체인에 피할 수 없는 샘플 클리핑의 다수의 잠재적 소스가 있으며, 이러한 소스는 다음과 같은 것을 포함한다:

파라메트릭 코딩 도구

바이노럴(binaural) 처리

다운믹싱, 포맷 변환, 렌더링

라우드니스 정규화(특히 높은 타겟 레벨에 대해)

디코더 출력에서의 양자화

따라서, 예를 들어 시간 도메인 출력 신호가 부동 소수점에서 고정 소수점 펄스 코드 변조 포맷(PCM 포맷)으로 변환되기 직전에 피크 리미터 스테이지는 오디오 샘플의 어떤 원하지 않는 클리핑을 방지하기 위해 오디오 디코더의 처리 체인의 맨 끝에 배치된다. 이것은 또한 이전의 섹션에서 설명된 임의의 동적 범위 제어 스테이지 및 라우드니스 정규화 스테이지는 피크 리미터 스테이지 앞에 위치되는 것을 의미한다. MPEG-H 3D Audio [M30324]의 맥락에서, 피크 리미터 스테이지는 실제 재생 구성에 따라 입력으로서 상이한 신호를 수신한다. 바이노럴 렌더링의 경우에, 헤드폰에 대한 2개의 출력 채널은 피크 리미터 스테이지에 의해 처리될 수 있다. 믹서의 출력 채널이 직접 재생되는 경우, 피크 리미터 스테이지는 대응하는 스피커 채널을 처리할 수 있다. 이는 믹서 출력 채널이 먼저 포맷 변환기에 의해 (예를 들어, 다운믹스되는) 상이한 스피커 구성으로 변환되는 경우에 적용한다.

피크 리미터 스테이지는 제한 임계 값을 초과하는 시간 도메인의 신호에서의 오디오 샘플을 검출할 수 있고, 오디오 출력 신호의 샘플이 항상 제한 임계 값 아래로 유지되도록 각각의 신호 부분에 레벨 감소를 적용할 수 있다. 가청 왜곡을 방지하기 위해, 레벨 감소는 점진적으로 수행되어야 하며, 즉 신호에 적용된 이득 인자는 단지 시간이 지남에 따라 천천히 변경될 수 있으며, 이는 이득 평활 필터에 의해 확실하게 수행된다. 리미터 이득 인자를 적용하기 전에 피크 리미터 스테이지의 입력 신호의 예견(look-ahead) 지연은 또한 급격한 신호 피크 전에 이미 시작하는 이득의 평활한 감소를 허용하기 위해서도 사용된다. 지연은 주어진 요구 사항으로 조절될 수 있으며, 실제적인 선택은 5ms이다. 멀티채널 오디오의 경우에, 공통 이득 인자는 계산 복잡성을 줄이기 위해 모든 오디오 채널에 적용될 수 있다.

파일 헤더의 라우드니스 정보에 포함될 수 있는 오디오 신호의 최대 피크에 관한 정보는 디코더 구성이 오디오 처리 체인에서 클리핑이 발생하지 않는 것을 의미하는 경우에 피크 리미터 스테이지를 폐기하는데 이용될 수 있다. 예를 들어, 오디오 디코더가 부동 소수점 정밀도를 가진 오디오 샘플을 출력하고, 클리핑 방지가 나중에 재생 장치의 오디오 체인에서 수행되는 경우 피크 리미터 스테이지가 또한 폐기될 수 있다. 확실히, 주어진 재생 시나리오에 대한 디코더 구성이 올바른 안내 클리핑 방지 이득의 적용을 허용하는 경우, 피크 리미터 스테이지는 또한 추가적인 코덱 클리핑이 발생하지 않는 경우에 작동되지 않을 수 있다.

피크 리미터는 사실상 필수 구성 요소인 것으로 간주될 수 있다. 디코더의 오디오 처리 체인 내에는 클리핑의 많은 소스가 있다. 안내 클리핑 방지 이득 시퀀스를 제공함으로써 특정 구성이 커버될 수 있다. 그러나, 디코더의 유연한 동작을 위해, 피크 리미터는클리핑이 발생하지 않도록 보장하기 위해 제공될 수 있다.

본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인은 오디오 객체를 오디오 출력 신호의 채널로 믹싱하도록 구성된 객체 렌더러(object renderer) 스테이지를 포함한다.

본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인은 오디오 출력 신호를 재생하기 위해 사용되는 변환기 시스템으로의 오디오 출력 신호의 특성을 조절하도록 구성되는 변환기 적응 스테이지를 포함한다.

피크 리미터 스테이지의 필요한 제한 강도를 감소시키기 위하여, 예를 들어 등화 필터에 의해 구현되는 주파수 의존 변환기 적응 처리는 처리 체인에 포함될 수 있다.

변환기 적응 스테이지는 재생(스피커 또는 헤드폰)에 사용되는 변환기의 특성에 대한 오디오 입력 신호 및 정보를 수신한다.

특히 변환기가 제한된 주파수 범위를 가지며, 이에 의해 오디오 출력 신호의 주파수 범위를 제한하는 경우, 변환기 적응 스테이지의 태스크는 변환기의 특성에 오디오 출력 신호를 적응시키기 위한 것이다. 피크 제한 스테이지에 앞서 변환기의 전달 함수를 모방하는(mimicking) 적절한 필터를 사용하여 주파수 범위를 제한함으로써, 피크 리미터 스테이지의 입력 신호는 레벨이 감소된다. 결과적으로, 제한 임계 값을 초과하는 신호 피크는 레벨이 감소된다. 결과적으로, 피크 제한 스테이지의 효과는 덜 심각하다. 이것은

- 피크 제한은 신호를 가청 변경할 수 있는 반면에, 변환기 적응은 신호에 가청 변경을 일으키지 않고,

- 최대 피크 레벨이 제한 임계값보다 낮도록 신호가 수정되면, 피크 리미터는 덜 계산적 부하(less computational load)를 도입하기 때문에 유리하다.

필터링 외에, 변환기 적응 스테이지는 또한 변환기의 대역 제한이 보상되도록 신호 적응 처리를 포함할 수 있다. 특히, 매우 작은 변환기는 저주파 신호를 재생할 수 없다.

이것은 변환기의 감지된 저음 응답을 증가시킴으로써, 예를 들어 저주파 음색(low-frequency notes)의 고조파를 인위적으로 생성시켜 신호에 추가함으로써 보상될 수 있다.

추가의 양태에서, 본 발명은 제 1 항 내지 제 9 항 중 어느 한 항에 따른 오디오 인코더에 의해 생성되는 오디오 비트스트림과 오디오 비트스트림에 관련된 메타데이터 비트스트림을 디코딩하기 위한 오디오 디코더, 특히 청구항들에 따른 오디오 디코더를 동작하기 위한 방법을 제공하며, 방법은

오디오 비트스트림으로부터 디코딩된 오디오 신호를 도출하는 단계;

오디오 처리 체인의 오디오 출력 신호의 특성을 조절하기 위한 복수의 조절 스테이지를 가진 오디오 처리 체인을 이용하는 단계로서, 조절 체인의 조절 스테이지인 동적 범위 제어 스테이지에 의해 오디오 출력 신호의 동적 범위를 조절하는 단계와, 조절 체인의 조절 스테이지인 안내 클리핑 방지 스테이지에 의해 오디오 출력 신호의 클리핑을 방지하는 단계를 포함하는 상기 이용하는 단계;

메타데이터 디코더의 부분 상에서, 메타데이터 비트스트림을 수신하여, 메타데이터 비트스트림으로부터 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스를 추출하는 단계;

동적 범위 제어 이득 시퀀스의 적어도 부분을 동적 범위 제어 스테이지에 공급하는 단계; 및

안내 클리핑 방지 이득 시퀀스의 적어도 부분을 안내 클리핑 방지 스테이지에 공급하는 단계를 포함한다.

다른 양태에서, 본 발명은 컴퓨터 또는 프로세서 상에서 실행할 때 상술한 방법을 수행하기 위한 컴퓨터 프로그램을 제공한다.

본 발명의 바람직한 실시예는 후속하여 첨부한 도면에 관련하여 설명될 것이다.

도 1은 본 발명에 따른 오디오 인코더의 실시예를 개략도로 도시한다.
도 2는 본 발명에 따른 오디오 디코더의 제 1 실시예를 개략도로 도시한다.
도 3은 본 발명에 따른 오디오 디코더의 제 2 실시예를 개략도로 도시한다.
도 4는 본 발명에 따른 오디오 디코더의 제 3 실시예를 개략도로 도시한다.
도 5는 본 발명에 따른 오디오 디코더의 제 4 실시예를 개략도로 도시한다.

도 1은 본 발명에 따른 오디오 인코더(1)의 실시예를 개략도로 도시한다. 도 1은 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스의 인코딩을 도시한다.

오디오 인코더(1)는 하나 이상의 오디오 채널 AC 및/또는 하나 이상의 오디오 객체 AO를 포함하는 오디오 비트스트림을 생성하도록 구성되고, 오디오 인코더(1)는

오디오 디코더(3)(도 2 참조)의 동적 범위 제어 스테이지(5)(도 2 참조)에 대한 하나 이상의 동적 범위 제어 이득을 포함하는 오디오 프레임에 대한 적어도 하나의 동적 범위 제어 이득 시퀀스(DS)를 수신하고;

오디오 프레임에 대한 적어도 하나의 안내 클리핑 방지 이득 시퀀스(GS)를 수신하고, 상기 안내 클리핑 방지 이득 시퀀스(GS)는 오디오 디코더(3)의 안내 클리핑 방지 스테이지(6)(도 2 참조)에 대한 하나 이상의 안내 클리핑 방지 이득을 포함하며;

상기 동적 범위 제어 이득 시퀀스(DS) 중 적어도 하나와 상기 안내 클리핑 방지 이득 시퀀스(GS) 중 적어도 하나를 메타데이터 비트스트림(MBS) 내에 포함시키도록

구성된 메타데이터 비트스트림(MBS)을 생성하기 위한 메타데이터 인코더(2)를 포함한다.

본 발명의 개념은 동적 범위 압축(DRC) 및 안내 클리핑 방지(GCP)에 대한 공동 솔루션의 필요한 기능을 함께 제공하는 다수의 처리 블록의 조합에 기초한다.

본 발명의 개념은 특히 예를 들어 [M30100, M30101]에 정의된 바와 같은 관련된 구성 정보가 이미 오디오 인코더(1) 및 오디오 디코더(3)에서 이용 가능한 오디오 시스템에 적합하다. 이러한 정보는 예를 들어 파일 기반 전송을 위한 헤더 또는 통합 음성 및 오디오 코딩(USAC) 구성 확장에 포함될 수 있다. 구성 정보는 채널 레이아웃, 다운믹스 명령어(예를 들어, 다운믹스 계수), 동적 범위 제어 명령어(예를 들어, 적용된 동적 범위 제어 특성, 트랙을 위한 동적 범위 제어 이득 시퀀스의 번호), 및 라우드니스 정보(예를 들어 프로그램 라우드니스, 앵커 라우드니스, 실제 피크 값)를 포함할 수 있다. 더 많은 상세 사항은 [M30100, M30101]에서 발견될 수 있다. 이는 동적 범위 제어 명령어 박스의 정보와 동일한 방식으로 처리될 수 있는 대응하는 안내 클리핑 방지 명령어에 적용한다.

본 발명에 따른 오디오 인코더(1)는 오디오 디코더(3)의 동적 범위 제어 스테이지(5)에 대한 동적 범위 제어 이득 시퀀스(DS) 뿐만 아니라 오디오 디코더(3)의 안내 클리핑 방지 스테이지(6)에 대한 안내 클리핑 방지 이득 시퀀스(GS)를 포함하는 메타데이터 비트스트림(MBS)을 생성할 수 있으며, 동적 범위 제어 이득 시퀀스(DS)는 안내 클리핑 방지 이득 시퀀스(GS)와 별도로 송신될 수 있다.

메타데이터 인코더는 외부에서, 예를 들어 콘텐츠 제공자에 의해 운영되는 외부 도구에 의해 제공되는 동적 범위 제어 이득 시퀀스(DS)를 입력으로서 사용한다.

추가적으로, 메타데이터 인코더는 안내 클리핑 방지 이득 시퀀스(GS)를 입력으로서 취한다.

압축된 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)는 통합된 음성 및 오디오 코딩 확장 페이로드에 포함된 보조 정보로서 수신기로 전송될 수 있다.

동적 범위 제어 이득 시퀀스(DS)는 동적 범위 압축을 수행하기 위해 동적 범위 제어 이득만을 포함하는 반면에, 클리핑 방지를 위한 안내 클리핑 방지 이득은 안내 클리핑 방지 이득 시퀀스(GS)에 의해 수용된다는 것이 주목되어야 한다.

안내 클리핑 방지 이득 시퀀스(GS)는 특정 타겟 레벨 및 다운믹스/포맷 변환기 구성에 대한 오디오 디코더(3)의 오디오 출력 신호(AOS)(도 2 참조)에서 샘플 클리핑이 발생하지 않는다는 것을 보장하는데 사용된다. 각 안내 클리핑 방지 이득 시퀀스(GS)는 특정 다운믹스/포맷 변환기 구성, 특정 타겟 레벨, 및 객체에 대한 특정 동적 범위 제어 이득 시퀀스와 함께 채널에 대한 특정 동적 범위 제어 이득 시퀀스의 조합을 위해 최적화될 수 있다. 어떤 안내 클리핑 방지 이득 시퀀스(GS)가 어떤 동적 범위 제어 이득 시퀀스(DS) 와 관련되는 것에 대한 정보는 통합된 음성 및 오디오 코딩 구성 확장의 파일 헤더에 포함된 안내 클리핑 방지 명령어에 포함될 수 있다. 그것은 또한 안내 클리핑 방지 이득이 오디오 인코더(1)에서 결정된 타겟 레벨에 관계된 정보를 포함할 수 있다.

상술한 동적 범위 처리를 위한 본 발명의 개념은 전체 오디오 처리 체인(4)(도 2 참조)의 인코더 측 제어에 대한 접근을 나타낸다. 동적 범위 제어 및 안내 클리핑 방지를 위해 사용되는 메타데이터의 분리는 각각의 이득의 별도의 수정(스케일링 또는 매핑)을 허용하고, 상기 수정은 오디오 디코더 구성 및 재생 시나리오에 의존한다.

본 발명의 개념에 의하면, 동적 범위 제어 이득이 안내 클리핑 방지 이득 GS과 별도로 송신되는 경우에 동적 범위 제어 이득 시퀀스(DS)의 기본 동적 범위 제어 특성을 무거운 압축에서 가벼운 압축으로 변화시킬 수 있다. 이것은 동적 범위 제어 이득 시퀀스(DS)의 값의 적절한 스케일링 또는 매핑에 의해 달성될 수 있다.

본 발명의 개념은 소정의 품질 요구 사항을 충족하기 위해 오디오 디코더(3)의 최종 오디오 출력 신호(AOS)의 전체 제어를 콘텐츠 제공자에게 제공한다. 이 경우, 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)는 모두 가장 중요한 것으로 간주되는 특정 오디오 디코더 구성에 포함될 수 있다. 피크 리미터 스테이지(12)는 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)의 조합된 사용으로 인해 많은 경우에 폐기될 수 있다. 안내 클리핑 방지 이득을 간단히 적용함으로써 달성되는 오디오 디코더 측에서의 안내 클리핑 방지는 피크 리미터(12)를 사용하는 것보다 계산적으로 더욱 효율적이다는 것이 주목되어야 한다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더(2)는 상이한 동적 범위 제어 이득을 포함하는 동일한 오디오 프레임에 대한 적어도 2개의 동적 범위 제어 이득 시퀀스를 수신하고, 상이한 동적 범위 제어 이득을 포함하는 적어도 2개의 동적 범위 제어 이득 시퀀스(DS)를 메타데이터 비트스트림(MBS) 내에 포함하도록 구성된다.

어떤 동적 범위 제어 특성이 상이한 동적 범위 제어 이득 시퀀스(DS)와 관련되는 것에 대한 정보는 파일 기반 전송의 경우 또는 통합된 음성 및 오디오 코딩 구성 확장에서의 파일 헤더에 포함된 동적 범위 제어 명령어에 포함될 수 있다.

이러한 특징에 의해 상이한 압축 특성을 가진 오디오 디코더(3)에서 출력 신호를 활성화하기 위해 오디오 트랙의 채널에 대한 다수의 동적 범위 제어 이득 시퀀스(DS)를 제공할 수 있다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 상이한 오디오 채널 AC 및/또는 상이한 오디오 객체 AO에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 수신하도록 구성되며, 메타데이터 인코더(2)는 상이한 오디오 채널 AC 및/또는 상이한 오디오 객체 AO에 관련된 적어도 2개의 동적 범위 제어 이득 DS를 포함하고, 선택적으로, 오디오 채널 AC 및/또는 오디오 객체 AO에 대한 동적 범위 제어 이득의 관계를 메타데이터 비트스트림(MBS) 내에 포함하도록 구성된다.

각 동적 범위 제어 시퀀스(DS) 내에서 상이한 오디오 채널 AC 또는 채널 AC의 그룹에 대해 상이한 동적 범위 제어 이득의 세트를 정의할 수 있으며, 각 오디오 채널 AC는 일반적으로 단 하나의 채널 그룹과 연관된다. 예를 들어, 멀티채널 영화 사운드에서는 종종 특정 동적 범위 제어 이득을 대화 채널에 적용하는 것이 바람직하다. 예를 들어 전방 좌측, 전방 우측, 후방 좌측, 후방 우측과 같은 나머지 채널은 상이한 동적 범위 제어 이득을 이용하여 처리될 수 있다.

채널의 경우에서 유추하여, 오디오 객체 AO 또는 객체 AO의 그룹과 관련된 다수의 동적 범위 제어 시퀀스(DS)는 지원될 수 있다. 이러한 객체 관련 동적 범위 제어 시퀀스(DS)는 또한 동적 범위 제어 이득의 채널 관련된 세트 내의 특정 채널 그룹과 연관되는 것으로 간주될 수 있다. 본 명세서에서 용어 오디오 객체는 초인종과 같은 단일 소스 사운드에 관계한다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더(2)는 오디오 디코더의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 수신하도록 구성되며, 메타데이터 인코더(2)는 오디오 디코더(3)의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득 DS를 포함하고, 선택적으로, 오디오 디코더(3)의 주파수 대역에 대한 동적 범위 제어 이득의 관계를 메타데이터 비트스트림(MBS) 내에 포함하도록 구성된다.

다중 대역 동적 범위 제어를 지원하는 임의의 확장에서, 메타데이터 인코더(2)는 또한 상이한 주파수 대역에 대해 상이한 동적 범위 제어 이득을 갖는 동적 범위 제어 이득 시퀀스(DS)를 입력으로서 수용하도록 확장될 수 있다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스(GS)를 수신하고, 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스(GS)를 메타데이터 비트스트림(MBS) 내에 포함하도록 구성된다.

본 발명의 바람직한 실시예에 따르면, 각 동적 범위 제어 시퀀스(DS)는 안내 클리핑 방지 이득 시퀀스(GS) 중 하나에 관련되고, 메타데이터 인코더(2)는 동적 범위 제어 시퀀스(DS)와 안내 클리핑 방지 이득 시퀀스(GS) 사이의 관계를 메타데이터 비트스트림(MBS) 내에 포함하도록 구성된다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 상이한 오디오 채널 AC 및/또는 상이한 오디오 객체 AO에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 이득 시퀀스(GS)를 수신하도록 구성되며, 메타데이터 인코더(2)는 상이한 오디오 채널 AC 및/또는 상이한 오디오 객체 AO에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 시퀀스(GS)를 포함하도록 구성되고, 선택적으로, 오디오 채널 AC 및/또는 오디오 객체 AO에 대한 안내 클리핑 방지 이득의 관계를 메타데이터 비트스트림(MBS) 내에 포함하도록 구성된다.

동적 범위 제어 이득과 같이, 각각의 안내 클리핑 방지 시퀀스(GS) 내에서 상이한 오디오 채널 AC 또는 오디오 채널 AC의 그룹에 대해 상이한 안내 클리핑 방지 이득의 세트를 정의할 수 있으며, 각 오디오 채널 AC는 일반적으로 단 하나의 오디오 채널 그룹과 연관된다. 전형적인 동작 모드에서, 동일한 안내 클리핑 방지 이득은 모든 오디오 채널 AC에 적용된다.

오디오 객체 AO에 대한 안내 클리핑 방지 이득 시퀀스의 정의는 동적 범위 제어의 경우와 유사하다.

다른 양태에서, 본 발명은 하나 이상의 오디오 채널 및/또는 하나 이상의 오디오 객체를 포함하는 오디오 비트스트림을 생성하기 위한 오디오 인코더(1)를 동작하기 위한 방법을 제공하고, 오디오 인코더는 메타데이터 비트스트림을 생성하기 위한 메타데이터 인코더(2)를 포함하며, 방법은

메타데이터 인코더(2)의 부분 상에서, 오디오 디코더(3)의 동적 범위 제어 스테이지(5)에 대한 하나 이상의 동적 범위 제어 이득을 포함하는 적어도 하나의 동적 범위 제어 이득 시퀀스(DS)를 수신하는 단계;

메타데이터 인코더(2)의 부분 상에서, 오디오 디코더(3)의 안내 클리핑 방지 스테이지(6)에 대한 하나 이상의 안내 클리핑 방지 이득을 포함하는 적어도 하나의 안내 클리핑 방지 이득 시퀀스(GS)를 수신하는 단계; 및

메타데이터 인코더(2)의 부분 상에서, 상기 동적 범위 제어 이득 시퀀스(DS) 중 적어도 하나와 상기 안내 클리핑 방지 이득 시퀀스(GS) 중 적어도 하나를 메타데이터 비트스트림(MBS) 내에 포함시키는 단계를 포함한다.

디코더 측 처리를 위한 다음의 도면은 [M30324]에 제시된 바와 같이 3D 오디오 코딩 접근 방식에 대한 제안에 기초한다.

도 2는 본 발명에 따른 오디오 디코더(3)의 제 1 실시예를 개략도로 도시한다.

특히 본 발명에 따른 오디오 인코더(1)에 의해 생성되는 오디오 비트스트림과, 오디오 비트스트림에 관련된 메타데이터 비트스트림(MBS)을 디코딩하기 위한 오디오 디코더(3)는

오디오 비트스트림으로부터 도출되는 디코딩된 오디오 신호(DAS)를 수신하고, 오디오 처리 체인(4)의 오디오 출력 신호(AOS)의 특성을 조절하도록 구성되며, 오디오 출력 신호(AOS)의 동적 범위를 조절하기 위한 동적 범위 제어 스테이지(5)와, 오디오 출력 신호(AOS)의 클리핑의 방지를 위한 안내 클리핑 방지 스테이지(6)를 포함하는 복수의 조절 스테이지(5,6,10,11,12,13,14)(또한 도 3,4,5 참조)를 포함하는 오디오 처리 체인(4); 및

메타데이터 비트스트림(MBS)을 수신하고, 메타데이터 비트스트림(MBS)으로부터 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)를 추출하도록 구성되는 메타데이터 디코더(7)로서, 동적 범위 제어 이득 시퀀스(DS)의 적어도 부분은 동적 범위 제어 스테이지(5)에 공급되고, 안내 클리핑 방지 이득 시퀀스(GS)의 적어도 부분은 안내 클리핑 방지 스테이지(6)에 공급되는 메타데이터 디코더(7)를 포함한다.

메타데이터 디코더(7)는 예를 들어 통합된 음성 및 오디오 코딩 디코더로부터 압축된 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)를 포함하는 메타데이터 비트스트림(MBS)을 수신한다.

메타데이터 디코더(7)는 압축된 메타데이터 비트스트림(MBS)으로부터 압축되지 않은 동적 범위 제어 이득 시퀀스(DS)를 생성한다. 추가적으로, 생성된 동적 범위 제어 이득의 스케일링 또는 매핑이 적용될 수 있다.

메타데이터 디코더(7)는 추가적으로 압축된 안내 클리핑 방지 메타데이터를 포함하는 비트스트림(MBS)으로부터 압축되지 않은 안내 클리핑 방지 이득 시퀀스(GS)를 생성한다. 안내 클리핑 방지 이득의 스케일링 또는 매핑이 적용될 수 있다. 이것은 오디오 디코더의 타겟 레벨이 오디오 인코더(1)에서 안내 클리핑 방지 이득 시퀀스(GS)를 결정하는데 사용된 타겟 레벨보다 낮은 경우에 특히 유용하다. 그 다음, 안내 클리핑 방지 이득의 매핑이 가능하고, 클리핑이 오디오 디코더 출력 신호(AOS)에서 발생하지 않는 것을 여전히 보장하면서 신호 헤드룸을 최적으로 복원한다.

동적 범위 제어 스테이지(5)는 메타데이터 디코더(7)로부터 직간접적으로 각각의 오디오 프레임에 대해 압축되지 않고 임의로 스케일링되거나 매핑된 동적 범위 제어 이득 시퀀스(DS)를 수신한다. 메타데이터 디코더(7)는 또한 최종 시간 도메인의 동적 범위 제어 이득 값이 오디오 샘플의 시간적 해상도에 대응하는 시간적 해상도로 보간되는 것을 보장할 수 있다. 이러한 최종 동적 범위 제어 이득은 그 후 디코딩된 오디오 신호(DAS)에 적용될 수 있고, 여기서 채널 및/또는 객체로의 어떤 동적 범위 제어 시퀀스의 할당이 관찰된다.

안내 클리핑 방지 스테이지(6)는 메타데이터 디코더(7)로부터 직간접적으로 각각의 오디오 프레임에 대해 압축되지 않고 임의로 스케일링되거나 매핑된 안내 클리핑 방지 이득 시퀀스(GS)를 수신한다. 메타데이터 디코더(7)는 또한 최종 시간 도메인의 안내 클리핑 방지 이득 값이 오디오 샘플의 시간적 해상도에 대응하는 시간적 해상도로 보간되는 것을 보장할 수 있다. 이러한 최종 안내 클리핑 방지 이득은 그 후 디코딩된 오디오 신호 또는 디코딩된 오디오 신호(DAS)로부터 도출되는 신호 ISG(또는 도 3, 도 4 및 도 5의 IGS)에 적용될 수 있으며, 여기서 채널 및/또는 객체로의 어떤 안내 클리핑 방지 시퀀스의 할당이 관찰된다.

동적 범위 제어 이득이 안내 클리핑 방지 이득과 별도로 송신되는 경우에 본 발명은 동적 범위 제어 이득 시퀀스의 기본 동적 범위 제어 특성을 무거운 압축에서 가벼운 압축으로 변화시키는 것을 허용한다. 이것은 동적 범위 제어 이득 시퀀스(DS)의 값의 적절한 스케일링 또는 매핑에 의해 달성될 수 있다.

디코더 타겟 레벨이 오디오 인코더(1)에서 안내 클리핑 방지를 위한 이득을 계산하기 위해 사용되는 타겟 레벨보다 낮은 경우에, 신호 피크의 감소된 감쇠는 안내 클리핑 방지 이득을 적절히 스케일링함으로써 오디오 디코더(3)에서 허용될 수 있다. 그 다음, 강한 신호 피크의 레벨이 유지될 수 있거나, 수정되지 않은 방식으로 안내 클리핑 방지 이득을 적용하는 경우에 비해 적어도 증가될 수 있으며, 이것은 이용 가능한 헤드룸이 보존될 수 있다는 것을 의미한다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더(7)는 상이한 동적 범위 제어 이득을 포함하는 동일한 오디오 프레임에 대한 적어도 2개의 동적 범위 제어 이득 시퀀스(DS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성된다.

이러한 특징에 의해 상이한 압축 특성을 가진 디코더(1)에서 오디오 출력 신호(AOS)를 활성화하기 위해 오디오 트랙의 채널에 대한 다수의 동적 범위 제어 이득 시퀀스(DS)를 제공할 수 있다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더(7)는 오디오 디코더(3)의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성된다.

다중 대역 동적 범위 제어를 지원하는 임의의 확장에서, 메타데이터 디코더(7)는 또한 상이한 주파수 대역에 대해 상이한 동적 범위 제어 이득을 갖는 동적 범위 제어 이득 시퀀스(DS)를 입력으로서 수용하도록 확장될 수 있다.

다중 대역 동적 범위 제어 확장의 경우, 시간 도메인의 오디오 신호는 다중 대역 동적 범위 제어 이득을 적용하기 전에 적절한 주파수 도메인의 표현으로 변환되어야 한다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더(7)는 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스(GS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성된다.

이러한 특징에 의해 대응하는 동적 범위 제어 이득 시퀀스(DS)와 일치하기 위해 오디오 트랙에 대한 다수의 안내 클리핑 방지 이득 시퀀스(GS)를 제공할 수 있다.

추가의 양태에서, 본 발명은 특히 본 발명에 따른 오디오 인코더에 의해 생성되는 오디오 비트스트림과 오디오 비트스트림에 관련된 메타데이터 비트스트림(MBS)을 디코딩하기 위한 오디오 디코더(3), 특히 본 발명에 따른 오디오 디코더(3)를 동작하기 위한 방법을 제공하며, 방법은

오디오 비트스트림으로부터 디코딩된 오디오 신호(DAS)를 도출하는 단계;

오디오 처리 체인의 오디오 출력 신호(AOS)의 특성을 조절하기 위한 복수의 조절 스테이지(5,6,10,11,12,13,14)를 가진 오디오 처리 체인을 이용하는 단계로서, 조절 체인(4)의 조절 스테이지(5)인 동적 범위 제어 스테이지(5)에 의해 오디오 출력 신호(AOS)의 동적 범위를 조절하는 단계와, 조절 체인(4)의 조절 스테이지(6)인 안내 클리핑 방지 스테이지(6)에 의해 오디오 출력 신호(AOS)의 클리핑을 방지하는 단계를 포함하는 상기 이용하는 단계;

메타데이터 디코더(7)의 부분 상에서, 메타데이터 비트스트림(MBS)을 수신하여, 메타데이터 비트스트림(MBS)으로부터 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)를 추출하는 단계;

동적 범위 제어 이득 시퀀스(DS)의 적어도 부분을 동적 범위 제어 스테이지(5)에 공급하는 단계; 및

안내 클리핑 방지 이득 시퀀스(GS)의 적어도 부분을 안내 클리핑 방지 스테이지(6)에 공급하는 단계를 포함한다.

도 3은 본 발명에 따른 오디오 디코더(3)의 제 2 실시예를 개략도로 도시한다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더(7)는 상이한 오디오 채널에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성된다.

각 동적 범위 제어 시퀀스(DS)내에서 상이한 채널 또는 채널의 그룹에 대해 상이한 동적 범위 제어 이득의 세트를 정의할 수 있으며, 각 채널은 일반적으로 단 하나의 채널 그룹과 연관된다. 예를 들어, 멀티채널 영화 사운드에서는 종종 특정 동적 범위 제어 이득을 대화 채널에 적용하는 것이 바람직하다. 예를 들어 전방 좌측, 전방 우측, 후방 좌측, 후방 우측과 같은 나머지 채널은 상이한 동적 범위 제어 이득을 이용하여 처리될 수 있다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더(7)는 상이한 오디오 채널에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 이득 시퀀스(GS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성된다.

본 발명의 바람직한 실시예에 따르면, 오디오 디코더(3)는 구성 제공 스테이지(9)로부터 수신된 구성 정보에 기초하여(또한 도 4 및 도 5 참조) 메타데이터 및 파라미터 DS, GS, CLA, DI, DTL, PRL, IS, OMD, ICT를 조절 스테이지(5,6,10,11,12,13,14)에 제공하도록 구성된 메타데이터 및 파라미터 제어 스테이지(8)를 더 포함한다.

오디오 디코더에서의 메타데이터 및 파라미터 제어 스테이지(8)는 이득 시퀀스 선택 신호 GSS를 메타데이터 디코더(7)로 송신함으로써 원하는 동적 범위 제어 이득 시퀀스(DS)에 따라 메타데이터 비트스트림(MBS)의 정확한 부분을 선택할 수 있다. 스케일링 및 매핑 정보는 또한 디코더 구성 정보 CI의 부분이거나 디코더 구성 정보 CI로부터 도출될 수 있다.

유추에 의해, 오디오 디코더(3)에서의 메타데이터 및 파라미터 제어 스테이지(8)는 원하는 안내 클리핑 방지 이득 시퀀스(GS)에 따라 비트스트림(MBS)의 정확한 부분을 선택한다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 및 파라미터 제어 스테이지(8)는, 복수의 동적 범위 제어 이득 시퀀스(DS)가 수신되는 경우에, 복수의 동적 범위 제어 이득 시퀀스(DS) 중 어떤 것이 동적 범위 제어 스테이지(5)에 공급되는지를 선택하도록 구성된다. 메타데이터 및 파라미터 제어 스테이지(8)의 부분 상에서의 동적 범위 제어 시퀀스(DS)의 선택은 채널 레이아웃 CLA, 다운믹스 명령어 DI, 객체 메타데이터 OMD(도 4 참조), 동적 범위 제어 명령어, 라우드니스 정보 PRL, 및 디코더 타겟 레벨 DTL과 같은 디코더 구성 정보 CI에 기초할 수 있고, 이득 시퀀스 선택 신호 GSS를 메타데이터 디코더(7)로 송신함으로써 실행될 수 있다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 및 파라미터 제어 스테이지(8)는, 복수의 안내 클리핑 방지 이득 시퀀스(GS)가 수신되는 경우에, 복수의 안내 클리핑 방지 이득 시퀀스(GS) 중 어떤 것이 안내 클리핑 방지 스테이지(6)에 공급되는지를 선택하도록 구성된다.

메타데이터 및 파라미터 제어 블록(8)의 부분 상에서의 안내 클리핑 방지 이득 시퀀스(GS)의 선택은 일반적으로 상술한 오디오 디코더 구성 정보 CI에 기초한다.

본 발명의 바람직한 실시예에 따르면, 신호 흐름의 방향으로의 동적 범위 제어 스테이지(5)는 오디오 조절 체인(4)의 제 1 조절 스테이지이다.

채널에 대한 동적 범위 제어 처리는 채널 그룹에 대한 상이한 이득을 가능하게 하기 위해 디코딩된 오디오 채널 AC의 잠재적 다운믹싱 또는 포맷 변환 전에 수행될 수 있다. 따라서, 동적 범위 제어 이득은 렌더링 전에 객체 AO에 적용된다(도 4 참조). 채널 AC 및 객체 AO 모두가 존재하는 경우에, 동적 범위 제어 처리의 위치는 그대로 두고: 채널 관련된 동적 범위 제어는 포맷 변환기 스테이지(10) 바로 전에 수행되어야 하는(도 4 참조) 반면에, 객체 관련된 동적 범위 제어는 객체 렌더러(13) 전에 수행된다(도 4 참조).

본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인(4)은 오디오 출력 신호(AOS)의 채널 구성을 조절하도록 구성되는 포맷 변환기 스테이지(10)를 포함한다. 또한 다운믹서(DMX)로 지칭되는 포맷 변환기 스테이지(10)는 오디오 출력 AOS의 채널 구성을 재생을 위해 사용되는 변환기에 적응하도록 구성된다. 예를 들어, 포맷 변환기 스테이지는 5.1 서라운드 신호를 스테레오 신호로 변환할 수 있다.

본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인(4)은 오디오 출력 신호(AOS)의 라우드니스를 정규화하도록 구성되는 라우드니스 정규화 스테이지(11)를 포함한다.

라우드니스 정규화 스테이지(11)는 출력 신호 IGS가 올바른 타겟 라우드니스 레벨을 갖도록 오디오 입력 신호 OCF를 스케일링할 수 있다. 스케일링 인자는 프로그램 기준 레벨 PRL과 디코더 타겟 레벨 DTL 사이의 차로부터 도출되고, 디코더의 메타데이터 및 파라미터 제어 스테이지(8)에 의해 라우드니스 정규화 스테이지(11)에 제공된다. 프로그램 기준 레벨 PRL은 예를 들어 파일 헤더 내에 포함되는 라우드니스 정보로부터 얻을 수 있는 반면에, 디코더 타겟 레벨은 디코더 구성 파라미터이다. 다수의 프로그램 기준 레벨(PRL) 값은 각각 적용된 동적 범위 제어 시퀀스(DS) 및/또는 적용된 다운믹스의 특정 구성에 대응하는 라우드니스 정보 내에 제공되는 것이 가능하다. 이 경우에, 메타데이터 및 파라미터 제어 스테이지(8)는 주어진 오디오 디코더의 구성을 고려하면서 올바른 프로그램 기준 레벨(PRL) 값을 선택한다. 라우드니스 처리 단계의 위치는 오디오 디코더(3)의 실제 출력 구성에 따라 달라진다. 일반적으로, 라우드니스 정규화는 적용 가능하다면 예를 들어 믹서 후 또는 포맷 변환 스테이지(10) 후에 오디오 디코더(3)의 출력 채널 상에서 수행되어야 한다.

본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인(4)은 임계 값을 초과하는 경우에 오디오 출력 신호(AOS)의 피크를 제한하도록 구성된 피크 리미터 스테이지(12)를 포함한다.

본 발명의 바람직한 실시예에 따르면, 신호 흐름의 방향의 피크 리미터 스테이지(12)는 오디오 조절 체인(4)의 최종 조절 스테이지이다.

전형적인 오디오 디코더의 오디오 처리 체인(4)에 피할 수 없는 샘플 클리핑의 다수의 잠재적 소스가 있으며, 이러한 소스는 다음과 같은 것을 포함한다:

파라메트릭 코딩 도구

바이노럴 처리

다운믹싱, 포맷 변환, 렌더링

라우드니스 정규화(특히 높은 타겟 레벨에 대해)

디코더 출력에서의 양자화

따라서, 예를 들어 시간 도메인 출력 신호가 부동 소수점에서 고정 소수점 펄스 코드 변조 포맷(PCM 포맷)으로 변환되기 직전에 피크 리미터 스테이지(12)는 오디오 샘플의 어떤 원하지 않는 클리핑을 방지하기 위해 오디오 디코더(3)의 처리 체인(4)의 맨 끝에 배치된다. 이것은 또한 이전의 섹션에서 설명된 임의의 동적 범위 제어 스테이지(5) 및 라우드니스 정규화 스테이지(11)가 피크 리미터 스테이지(12) 앞에 위치된다는 것을 의미한다. MPEG-H 3D Audio [M30324]의 맥락에서, 피크 리미터 스테이지는 실제 재생 구성에 따라 입력으로서 상이한 신호를 수신한다. 바이노럴 렌더링의 경우에, 헤드폰에 대한 2개의 출력 채널은 피크 리미터 스테이지(12)에 의해 처리될 수 있다. 믹서의 출력 채널이 직접 재생되는 경우, 피크 리미터 스테이지(12)는 대응하는 스피커 채널을 처리할 수 있다. 이는 믹서 출력 채널이 먼저 포맷 변환기(10)에 의해 (예를 들어, 다운믹스되는) 상이한 스피커 구성으로 변환되는 경우에 적용한다.

피크 리미터 스테이지(12)는 제한 임계 값을 초과하는 시간 도메인의 신호에서의 오디오 샘플을 검출할 수 있고, 오디오 출력 신호(AOS)의 샘플이 항상 제한 임계 값 아래로 유지되도록 각각의 신호 부분에 레벨 감소를 적용할 수 있다. 가청 왜곡을 방지하기 위해, 레벨 감소는 점진적으로 수행되어야 하며, 즉 신호에 적용된 이득 인자는 단지 시간이 지남에 따라 천천히 변경될 수 있으며, 이는 이득 평활 필터에 의해 확실하게 수행된다. 리미터 이득 인자를 적용하기 전에 피크 리미터 스테이지의 입력 신호의 예견 지연은 또한 급격한 신호 피크 전에 이미 시작하는 이득의 평활한 감소를 허용하기 위해 사용된다. 지연은 주어진 요구 사항으로 조절될 수 있으며, 실제적인 선택은 5ms이다. 멀티채널 오디오의 경우에, 공통 이득 인자는 계산 복잡성을 줄이기 위해 모든 오디오 채널에 적용될 수 있다.

파일 헤더의 라우드니스 정보에 포함될 수 있는 오디오 신호(DAS)의 최대 피크 IS에 관한 정보는 디코더 구성이 오디오 처리 체인에서 클리핑이 발생하지 않는 것을 의미하는 경우에 피크 리미터 스테이지(12)를 폐기하는데 이용될 수 있다. 예를 들어, 오디오 디코더(3)가 부동 소수점 정밀도를 가진 오디오 샘플을 출력하고, 클리핑 방지가 나중에 재생 장치의 오디오 체인에서 수행되는 경우 피크 리미터 스테이지(12)가 또한 폐기될 수 있다. 확실히, 주어진 재생 시나리오에 대한 디코더 구성이 올바른 안내 클리핑 방지 이득의 적용을 허용하는 경우, 피크 리미터 스테이지는 또한 추가적인 코덱 클리핑이 발생하지 않는 경우에 작동되지 않을 수 있다.

피크 리미터(12)는 사실상 필수 구성 요소인 것으로 간주될 수 있다. 오디오 디코더(3)의 오디오 처리 체인 내에는 클리핑의 많은 소스가 있다. 안내 클리핑 방지 이득 시퀀스를 제공함으로써 특정 구성이 커버될 수 있다. 그러나, 디코더의 유연한 동작을 위해, 피크 리미터는 클리핑이 발생하지 않도록 보장하기 위해 제공될 수 있다.

도 3에 도시된 바와 같이, 안내 클리핑 방지 처리는 오디오 채널의 포맷 변환 및 라우드니스 정규화 후에 수행될 수 있다. 포맷 변환이 적용되지 않는 경우, 안내 클리핑 방지 이득은 동적 범위 제어 스테이지(5)의 출력 ISG에 직접 적용될 수 있다.

도 4는 본 발명에 따른 오디오 디코더의 제 3 실시예를 개략도로 도시한다. 도 4는 오디오 객체 AO에 대한 동적 범위 제어 처리의 구성을 도시한다. 동적 범위 제어 처리는 렌더링 전에 오디오 객체 신호에서 수행된다. 라우드니스 정규화 및 클리핑 방지는 채널에 대한 객체 렌더링 후에 수행된다.

본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인(4)은 오디오 객체 AO를 오디오 출력 신호(AOS)의 채널로 믹싱하도록 구성된 객체 렌더러 스테이지(13)를 포함한다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더(7)는 상이한 오디오 객체 AO에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성된다.

채널의 경우에서 유추하여, 오디오 객체 또는 객체의 그룹과 관련된 다수의 동적 범위 제어 시퀀스(DS)가 지원될 수 있다. 이러한 객체 관련 동적 범위 제어 시퀀스는 또한 동적 범위 제어 이득의 채널 관련된 세트 내의 특정 채널 그룹과 연관되는 것으로 간주될 수 있다. 본 명세서에서 용어 오디오 객체 AO는 초인종과 같은 단일 소스 사운드에 관계한다.

본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더(7)는 상이한 오디오 객체에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 이득 시퀀스(GS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성된다.

동적 범위 제어 이득과 같이, 각각의 안내 클리핑 방지 시퀀스 내에서 상이한 오디오 채널 또는 오디오 채널의 그룹에 대해 상이한 안내 클리핑 방지 이득의 세트를 정의할 수 있으며, 각 채널은 일반적으로 단 하나의 오디오 객체와 연관된다. 전형적인 동작 모드에서, 동일한 안내 클리핑 방지 이득은 모든 오디오 객체에 적용된다.

도 5는 본 발명에 따른 오디오 디코더의 제 4 실시예를 개략도로 도시한다.

개념의 다른 실현은 추가적인 변환기 적응 블록(14)이 피크 리미터(12) 앞에 포함되는 도 5에 도시된다. 포맷 변환기 스테이지(10)는 다운믹싱 처리 단계 또는 상이한 입력/출력 채널 구성 사이의 포맷 변환을 나타낸다. 유추에 의해, 변환기 적응 블록은 도 4에 따른 객체 관련 처리 체인에 포함될 수 있다.

본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인(4)은 오디오 출력 신호를 재생하기 위해 사용되는 변환기 시스템으로의 오디오 출력 신호(AOS)의 특성을 조절하도록 구성되는 변환기 적응 스테이지(14)를 포함한다.

피크 리미터 스테이지(12)의 필요한 제한 강도를 감소시키기 위하여, 예를 들어 등화 필터에 의해 구현되는 주파수 의존 변환기 적응 처리는 처리 체인(4)에 포함될 수 있다.

변환기 적응 스테이지(14)는 재생(스피커 또는 헤드폰)에 사용되는 변환기의 특성에 대한 오디오 입력 신호 ITA 및 정보 ICT를 수신한다.

특히 변환기가 제한된 주파수 범위를 가지며, 이에 의해 오디오 출력 신호의 주파수 범위를 제한하는 경우, 변환기 적응 스테이지(14)의 태스크는 변환기의 특성에 오디오 출력 신호(AOS)를 적응시키기 위한 것이다. 피크 제한 스테이지(12)에 앞서 변환기의 전달 함수를 모방하는 적절한 필터를 사용하여 주파수 범위를 제한함으로써, 피크 리미터 스테이지의 입력 신호 IPL은 레벨이 감소된다. 결과적으로, 제한 임계 값을 초과하는 신호 피크는 레벨이 감소된다. 결과적으로, 피크 제한 스테이지(12)의 효과는 덜 심각하다. 이것은

- 최대 피크 레벨이 제한 임계값보다 낮도록 신호가 수정되면, 피크 리미터는 덜 계산적 부하를 도입하기 때문에 유리하다.

필터링 외에, 변환기 적응 스테이지(14)는 또한 변환기의 대역 제한이 보상되도록 신호 적응 처리를 포함할 수 있다. 특히, 매우 작은 변환기는 저주파 신호를 재생할 수 없다.

이것은 변환기의 감지된 저음 응답을 증가시킴으로써, 예를 들어 저주파 음색의 고조파를 인위적으로 생성시켜 신호에 추가함으로써 보상될 수 있다.

디코더, 인코더, 및 설명된 실시예의 방법에 대해, 다음의 것이 주목되어야 한다:

몇몇 양태는 장치와 관련하여 설명되었지만, 이들 양태는 또한 대응하는 방법의 설명을 나타내는 것이 분명하며, 여기서 블록 또는 장치는 방법 단계 또는 방법 단계의 기능에 대응한다. 유사하게, 방법 단계와 관련하여 설명된 양태는 또한 대응하는 장치의 대응하는 블록 또는 항목 또는 기능에 대한 설명을 나타낸다.

어떤 구현 요구 사항에 따라, 본 발명의 실시예는 하드웨어 또는 소프트웨어로 구현될 수 있다. 이러한 구현은 디지털 저장 매체, 예를 들어 플로피 디스크, DVD, CD, ROM, PROM, EPROM, EEPROM 또는 FLASH 메모리를 이용하여 수행될 수 있으며, 이러한 매체는 각각의 방법이 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력하는(또는 협력할 수 있는) 전자적으로 판독 가능한 제어 신호를 저장한다.

본 발명에 따른 일부 실시예는 본 명세서에서 설명된 방법 중 하나가 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력할 수 있는 전자적으로 판독 가능한 제어 신호를 갖는 데이터 반송파를 포함한다.

일반적으로, 본 발명의 실시예는 프로그램 코드를 가진 컴퓨터 프로그램 제품으로 구현될 수 있으며, 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터 상에서 실행될 때 방법 중 하나를 수행하기 위해 동작한다. 프로그램 코드는 예를 들어 기계 판독 가능한 반송파 상에 저장될 수 있다.

다른 실시예는 본 명세서에서 설명되고, 기계 판독 가능 캐리어 상에 저장된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함한다.

그래서, 다시 말하면, 본 발명의 방법의 실시예는 컴퓨터 프로그램이 컴퓨터 상에서 실행될 때 본 명세서에 설명된 방법 중 하나를 수행하기 위해 프로그램 코드를 갖는 컴퓨터 프로그램이다.

그래서, 본 발명의 방법의 추가의 실시예는 데이터 캐리어(또는 디지털 저장 매체, 또는 컴퓨터 판독 가능한 매체)이며, 이러한 데이터 캐리어는 본 명세서에서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 기록하고 포함한다.

그래서, 본 발명의 방법의 추가의 실시예는 본 명세서에서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 나타내는 데이터 스트림 또는 신호의 시퀀스이다. 데이터 스트림 또는 신호의 시퀀스는 예를 들어 데이터 통신 접속, 예를 들어 인터넷을 통해 전송되도록 구성될 수 있다.

추가의 실시예는 본 명세서에서 설명된 방법 중 하나를 수행하도록 구성되거나 적응되는 처리 수단, 예를 들어 컴퓨터 또는 프로그램 가능한 논리 장치를 포함한다.

추가의 실시예는 본 명세서에서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 설치한 컴퓨터를 포함한다.

일부 실시예에서, 프로그램 가능한 논리 장치(예를 들어, 필드 프로그램 가능한 게이트 어레이)는 본 명세서에서 설명된 방법의 기능의일부 또는 모두를 수행하기 위해 이용될 수 있다. 일부 실시예에서, 필드 프로그램 가능한 게이트 어레이는 본 명세서에서 설명된 방법 중 하나를 수행하기 위해 마이크로 프로세서와 협력할 수 있다. 일반적으로, 이러한 방법은 바람직하게는 임의의 하드웨어 장치에 의해 수행된다.

본 발명이 몇몇 실시예에 관하여 설명되었지만, 본 발명의 범위 내에서 변경, 치환 및 등가물이 있다. 또한, 본 발명의 방법 및 조성물을 구현하는 많은 대안적인 방법이 있다는 것이 주목되어야 한다. 따라서, 다음의 첨부된 청구 범위는 본 발명의 진정한 사상 및 범위 내에서 이러한 모든 변경, 치환 및 등가물을 포함하는 것으로 이해되도록 의도된다.

참조 부호:

1 오디오 인코더

2 메타데이터 인코더

3 오디오 디코더

4 오디오 처리 체인

5 동적 범위 제어 스테이지

6 안내 클리핑 방지 스테이지

7 메타데이터 디코더

8 메타데이터 및 파라미터 제어 스테이지

9 구성 제공 스테이지

10 포맷 변환기 스테이지

11 라우드니스 정규화 스테이지

12 피크 리미터 스테이지

13 객체 렌더러 스테이지

14 변환기 적응 스테이지

MBS 메타데이터 비트스트림

DS 동적 범위 제어 이득 시퀀스

GS 안내 클리핑 방지 이득 시퀀스

DAS 디코딩된 오디오 신호

AOS 오디오 출력 신호

ISG 디코딩된 오디오 신호로부터 도출된 신호

CI 구성 정보

AC 오디오 채널

AO 오디오 객체

IPL 피크 리미터 스테이지의 입력 신호

ITA 변환기 적응 스테이지의 입력 신호

ICT 변환기의 특성에 관한 정보

IGS 라우드니스 정규화 스테이지의 출력 신호

OCF 포맷 변환기 스테이지 또는 객체 렌더러 스테이지의 출력

GSS 이득 시퀀스 선택 신호

CLA 채널 레이아웃

DI 다운믹스 명령어

PRL 프로그램 기준 레벨

IS 피크 리미터 스테이지에 대한 최대 피크 값

DTL 디코더 타겟 레벨

OMD 객체 메타데이터

참고 문헌:

[M30100] ISO/IEC JTC1/SC29/WG11 M30100, " Proposed Revision of Audio aspects of WD: Addition of Sample aspect ratio and further audio code-points ", July 2013, Vienna

[M30101] ISO/IEC JTC1/SC29/WG11 M30101, "Editors draft of 14496-12 PDAM 3 - Enhanced audio and other improvements", July 2013, Vienna

[M30324] ISO/IEC JTC1/SC29/WG11 M30324, "Description of the Fraunhofer IIS Submission for the 3D-Audio CfP ", July 2013, Vienna

[M28901] ISO/IEC JTC1/SC29/WG11 M28901, "Enhanced Metadata for Dynamic Range Compression", April 2013, Incheon, Korea

Claims

하나 이상의 오디오 채널(AC) 및/또는 하나 이상의 오디오 객체(AO)를 포함하는 오디오 비트스트림을 생성하기 위한 오디오 인코더(1)로서,
상기 오디오 인코더(1)는 메타데이터 비트스트림(MBS)을 생성하기 위한 메타데이터 인코더(2)를 포함하고, 상기 오디오 인코더는
오디오 디코더(3)의 동적 범위 제어 스테이지(5)에 대한 하나 이상의 동적 범위 제어 이득을 포함하는 오디오 프레임에 대한 적어도 하나의 동적 범위 제어 이득 시퀀스(DS)를 수신하고;
상기 오디오 디코더(3)의 안내 클리핑 방지 스테이지(6)에 대한 하나 이상의 안내 클리핑 방지 이득을 포함하는 상기 오디오 프레임에 대한 적어도 하나의 안내 클리핑 방지 이득 시퀀스(GS)를 수신하며;
상기 동적 범위 제어 이득 시퀀스(DS) 중 적어도 하나와 상기 안내 클리핑 방지 이득 시퀀스(GS) 중 적어도 하나를 상기 메타데이터 비트스트림(MBS) 내에 포함하도록 구성되는 오디오 인코더.
제 1 항에 있어서,
상기 메타데이터 인코더(2)는 상이한 동적 범위 제어 이득을 포함하는 동일한 오디오 프레임에 대한 적어도 2개의 동적 범위 제어 이득 시퀀스를 수신하고, 상이한 동적 범위 제어 이득을 포함하는 적어도 2개의 동적 범위 제어 이득 시퀀스(DS)를 상기 메타데이터 비트스트림(MBS) 내에 포함하도록 구성되는 오디오 인코더.
제 1 항 또는 제 2 항에 있어서,
상기 메타데이터 인코더(2)는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 수신하고, 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)와, 선택적으로, 오디오 채널 및/또는 오디오 객체에 대한 동적 범위 제어 이득의 관계를 상기 메타데이터 비트스트림(MBS) 내에 포함하도록 구성되는 오디오 인코더.
제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
상기 메타데이터 인코더(2)는 상기 오디오 디코더의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 수신하고, 상기 디코더의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 상기 동적 범위 제어 이득 시퀀스(DS)와, 선택적으로, 상기 디코더의 주파수 대역에 대한 상기 동적 범위 제어 이득의 관계를 상기 메타데이터 비트스트림(MBS) 내에 포함하도록 구성되는 오디오 인코더.
제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
상기 메타데이터 인코더(2)는 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스(GS)를 수신하고, 상기 상이한 안내 클리핑 방지 이득을 포함하는 상기 적어도 2개의 안내 클리핑 방지 이득 시퀀스(GS)를 상기 메타데이터 비트스트림(MBS) 내에 포함하도록 구성되는 오디오 인코더.
제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
각 동적 범위 제어 시퀀스(DS)는 상기 안내 클리핑 방지 이득 시퀀스(GS) 중 하나에 관련되고, 상기 메타데이터 인코더(2)는 상기 동적 범위 제어 시퀀스(DS)와 상기 안내 클리핑 방지 이득 시퀀스(GS) 사이의 관계를 상기 메타데이터 비트스트림(MBS) 내에 포함하도록 구성되는 오디오 인코더.
제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
상기 메타데이터 인코더(2)는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 이득 시퀀스(GS)를 수신하고, 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 상기 안내 클리핑 방지 시퀀스(GS)와, 선택적으로, 상기 오디오 채널 및/또는 상기 오디오 객체에 대한 상기 안내 클리핑 방지 이득의 관계를 상기 메타데이터 비트스트림(MBS) 내에 포함하도록 구성되는 오디오 인코더.
하나 이상의 오디오 채널 및/또는 하나 이상의 오디오 객체를 포함하는 오디오 비트스트림을 생성하기 위한 오디오 인코더(1)의 동작 방법으로서,
상기 오디오 인코더(1)는 메타데이터 비트스트림(MBS)을 생성하기 위한 메타데이터 인코더(2)를 포함하며, 상기 방법은
상기 메타데이터 인코더(2)의 부분 상에서, 오디오 디코더(3)의 동적 범위 제어 스테이지(5)에 대한 하나 이상의 동적 범위 제어 이득을 포함하는 적어도 하나의 동적 범위 제어 이득 시퀀스(DS)를 수신하는 단계;
상기 메타데이터 인코더(2)의 부분 상에서, 상기 오디오 디코더(3)의 안내 클리핑 방지 스테이지(6)에 대한 하나 이상의 안내 클리핑 방지 이득을 포함하는 적어도 하나의 안내 클리핑 방지 이득 시퀀스(GS)를 수신하는 단계; 및
상기 메타데이터 인코더(2)의 부분 상에서, 상기 동적 범위 제어 이득 시퀀스(DS) 중 적어도 하나와 상기 안내 클리핑 방지 이득 시퀀스(GS) 중 적어도 하나를 상기 메타데이터 비트스트림(MBS) 내에 포함시키는 단계를 포함하는 오디오 인코더의 동작 방법.
컴퓨터 또는 프로세서상에서 실행될 때 제 1 항 내지 제 8 항의 방법을 수행하기 위한 컴퓨터 프로그램.
특히 제 1 항 내지 제 8 항 중 한 항에 따른 오디오 인코더(1)에 의해 생성되는 오디오 비트스트림과 상기 오디오 비트스트림에 관련된 메타데이터 비트스트림(MBS)을 디코딩하기 위한 오디오 디코더로서,
상기 오디오 비트스트림으로부터 도출되는 디코딩된 오디오 신호(DAS)를 수신하고, 오디오 처리 체인(4)의 오디오 출력 신호(AOS)의 특성을 조절하도록 구성되며, 상기 오디오 출력 신호(AOS)의 동적 범위를 조절하기 위한 동적 범위 제어 스테이지(5)와, 상기 오디오 출력 신호(AOS)의 클리핑의 방지를 위한 안내 클리핑 방지 스테이지(6)를 포함하는 복수의 조절 스테이지(5,6,10,11,12,13,14)를 포함하는 오디오 처리 체인(4); 및
상기 메타데이터 비트스트림(MBS)을 수신하고, 상기 메타데이터 비트스트림(MBS)으로부터 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)를 추출하도록 구성되는 메타데이터 디코더(7)로서, 상기 동적 범위 제어 이득 시퀀스(DS)의 적어도 부분은 상기 동적 범위 제어 스테이지(5)에 공급되고, 상기 안내 클리핑 방지 이득 시퀀스(GS)의 적어도 부분은 상기 안내 클리핑 방지 스테이지(6)에 공급되는 메타데이터 디코더(7)를 포함하는 오디오 디코더.
제 10 항에 있어서,
상기 메타데이터 디코더(7)는 상이한 동적 범위 제어 이득을 포함하는 동일한 오디오 프레임에 대한 적어도 2개의 동적 범위 제어 이득 시퀀스(DS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성되는 오디오 디코더.
제 10 항 또는 제 11 항에 있어서,
상기 메타데이터 디코더(7)는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 상기 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성되는 오디오 디코더.
제 10 항 내지 제 12 항 중 어느 한 항에 있어서,
상기 메타데이터 디코더(7)는 상기 오디오 디코더(3)의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 ㅅ상기 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성되는 오디오 디코더.
제 10 항 내지 제 13 항 중 어느 한 항에 있어서,
상기 메타데이터 디코더(7)는 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스(GS)를 상기 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성되는 오디오 디코더.
제 10 항 내지 제 14 항 중 어느 한 항에 있어서,
상기 메타데이터 디코더(7)는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 이득 시퀀스(GS)를 상기 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성되는 오디오 디코더.
제 10 항 내지 제 15 항 중 어느 한 항에 있어서,
상기 오디오 디코더(3)는 구성 제공 스테이지(9)로부터 수신된 구성 정보(CI)에 기초하여 메타데이터 및 파라미터(DS, GS, CLA, DI, DTL, PRL, IS, OMD, ICT)를 조절 스테이지(5,6,10,11,12,13,14) 중 적어도 하나에 제공하도록 구성된 메타데이터 및 파라미터 제어 스테이지(8)를 더 포함하는 오디오 디코더.
제 10 항 내지 제 16 항 중 어느 한 항에 있어서,
상기 메타데이터 및 파라미터 제어 스테이지(8)는, 복수의 동적 범위 제어 이득 시퀀스(DS)가 수신되는 경우에, 상기 복수의 동적 범위 제어 이득 시퀀스(DS) 중 어떤 것이 상기 동적 범위 제어 스테이지(5)에 공급되는지를 선택하도록 구성되는 오디오 디코더.
제 10 항 내지 제 17 항 중 어느 한 항에 있어서,
상기 메타데이터 및 파라미터 제어 스테이지(8)는, 복수의 안내 클리핑 방지 이득 시퀀스(GS)가 수신되는 경우에, 상기 복수의 안내 클리핑 방지 이득 시퀀스(GS) 중 어떤 것이 상기 안내 클리핑 방지 스테이지(6)에 공급되는지를 선택하도록 구성되는 오디오 디코더.
제 10 항 내지 제 18 항 중 어느 한 항에 있어서,
신호 흐름의 방향으로의 상기 동적 범위 제어 스테이지(5)는 상기 오디오 조절 체인(4)의 제 1 조절 스테이지인 오디오 디코더.
제 10 항 내지 제 19 항 중 어느 한 항에 있어서,
상기 오디오 조절 체인(4)은 상기 오디오 출력 신호(AOS)의 채널 구성을 조절하도록 구성되는 포맷 변환기 스테이지(10)를 포함하는 오디오 디코더.
제 10 항 내지 제 20 항 중 어느 한 항에 있어서,
상기 오디오 조절 체인(4)은 상기 오디오 출력 신호(AOS)의 라우드니스를 정규화하도록 구성되는 라우드니스 정규화 스테이지(11)를 포함하는 오디오 디코더.
제 10 항 내지 제 21 항 중 어느 한 항에 있어서,
상기 오디오 조절 체인(4)은 임계 값을 초과하는 경우에 상기 오디오 출력 신호(AOS)의 피크를 제한하도록 구성된 피크 리미터 스테이지(12)를 포함하는 오디오 디코더.
제 10 항 내지 제 22 항 중 어느 한 항에 있어서,
상기 오디오 조절 체인(4)은 오디오 객체를 상기 오디오 출력 신호(AOS)의 채널로 믹싱하도록 구성된 객체 렌더러 스테이지(13)를 포함하는 오디오 디코더.
제 10 항 내지 제 23 항 중 어느 한 항에 있어서,
상기 오디오 조절 체인(4)은 상기 오디오 출력 신호(AOS)를 재생하기 위해 사용되는 변환기 시스템으로의 상기 오디오 출력 신호(AOS)의 특성을 조절하도록 구성되는 변환기 적응 스테이지(14)를 포함하는 오디오 디코더.
제 10 항 내지 제 24 항 중 어느 한 항에 있어서,
상기 신호 흐름의 방향의 상기 피크 리미터 스테이지(12)는 상기 오디오 조절 체인(4)의 최종 조절 스테이지인 오디오 디코더.
특히 제 1 항 내지 제 8 항 중 한 항에 따른 오디오 인코더(1)에 의해 생성되는 오디오 비트스트림과 상기 오디오 비트스트림에 관련된 메타데이터 비트스트림(MBS)을 디코딩하기 위한 오디오 디코더(3), 특히 제 10 항 내지 제 25 항 중 한 항에 따른 오디오 디코더(3)의 동작 방법으로서,
상기 오디오 비트스트림으로부터 디코딩된 오디오 신호(DAS)를 도출하는 단계;
오디오 처리 체인(4)의 오디오 출력 신호(AOS)의 특성을 조절하기 위한 복수의 조절 스테이지를 가진 오디오 처리 체인(4)을 이용하는 단계로서, 조절 체인(4)의 조절 스테이지(5,6,10,11,12,13,14)인 동적 범위 제어 스테이지(5)에 의해 오디오 출력 신호(AOS)의 동적 범위를 조절하는 단계와, 조절 체인(4)의 조절 스테이지(5,6,10,11,12,13,14)인 안내 클리핑 방지 스테이지(6)에 의해 상기 오디오 출력 신호(AOS)의 클리핑을 방지하는 단계를 포함하는 상기 이용하는 단계;
메타데이터 디코더(7)의 부분 상에서, 상기 메타데이터 비트스트림(MBS)을 수신하여, 상기 메타데이터 비트스트림(MBS)으로부터 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)를 추출하는 단계;
상기 동적 범위 제어 이득 시퀀스(DS)의 적어도 부분을 상기 동적 범위 제어 스테이지(5)에 공급하는 단계; 및
상기 안내 클리핑 방지 이득 시퀀스(GS)의 적어도 부분을 상기 안내 클리핑 방지 스테이지(6)에 공급하는 단계를 포함하는 오디오 디코더의 동작 방법
컴퓨터 또는 프로세서 상에서 실행할 때 전술한 항의 방법을 수행하기 위한 컴퓨터 프로그램.