KR20160136390A - 동적 범위 제어에서 효율적인 이득 코딩을 갖는 오디오 인코더 디바이스 및 오디오 디코더 디바이스 - Google Patents

동적 범위 제어에서 효율적인 이득 코딩을 갖는 오디오 인코더 디바이스 및 오디오 디코더 디바이스 Download PDF

Info

Publication number
KR20160136390A
KR20160136390A KR1020167029370A KR20167029370A KR20160136390A KR 20160136390 A KR20160136390 A KR 20160136390A KR 1020167029370 A KR1020167029370 A KR 1020167029370A KR 20167029370 A KR20167029370 A KR 20167029370A KR 20160136390 A KR20160136390 A KR 20160136390A
Authority
KR
South Korea
Prior art keywords
dynamic range
range control
dfr
nodes
control frame
Prior art date
Application number
KR1020167029370A
Other languages
English (en)
Other versions
KR101890216B1 (ko
Inventor
파비앙 쿠치
크리스티안 율레
미하엘 크래슈머
베른하르트 뉘게바우어
미하엘 마이어
스테판 슈레이너
Original Assignee
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. filed Critical 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Publication of KR20160136390A publication Critical patent/KR20160136390A/ko
Application granted granted Critical
Publication of KR101890216B1 publication Critical patent/KR101890216B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

본 발명은 오디오 인코더 디바이스를 제공하며, 이 오디오 인코더 디바이스는:
연속적인 오디오 프레임들을 포함하는 오디오 신호로부터 인코딩된 오디오 비트스트림을 생성하기 위해 구성되는 오디오 인코더;
오디오 신호에 대응하고 연속적인 동적 범위 제어 프레임들을 포함하는 동적 범위 제어 시퀀스로부터 인코딩된 동적 범위 제어 비트스트림을 생성하기 위해 구성되는 동적 범위 제어 인코더를 포함하고,
동적 범위 제어 프레임들의 각각의 동적 범위 제어 프레임은 하나 이상의 노드들을 포함하고, 하나 이상의 노드들의 각각의 노드는, 오디오 신호에 대한 이득 정보 및 이득 정보가 어느 시점에 대응하는지 표시하는 시간 정보를 포함하고;
동적 범위 제어 인코더는, 인코딩된 동적 범위 제어 비트스트림이 동적 범위 제어 프레임들의 각각의 동적 범위 제어 프레임에 대해 대응하는 비트스트림 부분을 포함하는 방식으로 구성되고;
동적 범위 제어 인코더는 시프트 절차를 실행하기 위해 구성되고, 동적 범위 제어 프레임들의 하나의 기준 동적 범위 제어 프레임의 노드들 중 하나 이상의 노드들은 시프트된 노드들로서 선택되고, 하나의 기준 동적 범위 제어 프레임의 하나 이상의 시프트된 노드들 각각의 비트 표현은 하나의 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임에 대응하는 비트스트림 부분에 임베딩되고, 동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 노드들 중 각각의 나머지 노드의 비트 표현은 하나의 기준 동적 범위 제어 프레임에 대응하는 비트스트림 부분에 임베딩된다.

Description

동적 범위 제어에서 효율적인 이득 코딩을 갖는 오디오 인코더 디바이스 및 오디오 디코더 디바이스{AUDIO ENCODER DEVICE AND AN AUDIO DECODER DEVICE HAVING EFFICIENT GAIN CODING IN DYNAMIC RANGE CONTROL}
본 문헌의 상황에서 동적 범위 제어(DRC)는, 제어된 방식 [1]으로 오디오 신호들의 동적 범위를 감소시키기 위한 디지털 신호 프로세싱 기술에 관한 것이다. 동적 범위의 원하는 감소는, 시끄러운 음향 성분들의 레벨을 감소시키는 것 및/또는 오디오 신호들의 소프트 부분들을 증폭시키는 것에 의해 달성된다.
DRC에 대한 통상적인 애플리케이션은 오디오 신호의 동적 특성들을 청취 환경에 적응시키는 것이다. 예를 들어, 잡음있는 환경에서 음악을 청취하는 경우, 얻어진 증폭된 신호가 클리핑(clipping)되게 함이 없이 전반적인 신호 증폭을 허용하기 위해, 동적 범위는 감소되어야 한다. 이러한 경우, 높은 신호 피크들이, 예를 들어, 리미터(limiter)를 이용하여 감쇠되어야 한다. 추가적으로, 잡음있는 청취 환경에서 소프트 신호 성분들의 양해도(intelligibility)를 개선하기 위해, 소프트 신호 성분들은 시끄러운 부분들에 비해 증폭되어야 한다.
오디오 송신의 상황에서 동적 범위 제어를 위한 향상된 개념을 제공하는 것이 본 발명의 목적이다.
이러한 목적은 오디오 인코더 디바이스에 의해 달성되며, 오디오 인코더 디바이스는,
연속적인 오디오 프레임들을 포함하는 오디오 신호로부터 인코딩된 오디오 비트스트림을 생성하기 위해 구성되는 오디오 인코더;
오디오 신호에 대응하고 연속적인 동적 범위 제어 프레임들을 포함하는 동적 범위 제어 시퀀스로부터 인코딩된 동적 범위 제어 비트스트림을 생성하기 위해 구성되는 동적 범위 제어 인코더를 포함하고,
동적 범위 제어 프레임들의 각각의 동적 범위 제어 프레임은 하나 이상의 노드들을 포함하고, 하나 이상의 노드들의 각각의 노드는, 오디오 신호에 대한 이득 정보 및 이득 정보가 어느 시점에 대응하는지 표시하는 시간 정보를 포함하고;
동적 범위 제어 인코더는, 인코딩된 동적 범위 제어 비트스트림이 동적 범위 제어 프레임들의 각각의 동적 범위 제어 프레임에 대해 대응하는 비트스트림 부분을 포함하는 방식으로 구성되고;
동적 범위 제어 인코더는 시프트 절차를 실행하기 위해 구성되고, 동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 노드들 중 하나 이상의 노드들은 시프트된 노드들로서 선택되고, 하나의 기준 동적 범위 제어 프레임의 하나 이상의 시프트된 노드들 각각의 비트 표현은 하나의 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임에 대응하는 비트스트림 부분에 임베딩되고, 동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 노드들 중 각각의 나머지 노드의 비트 표현은 하나의 기준 동적 범위 제어 프레임에 대응하는 비트스트림 부분에 임베딩된다.
본 발명은, 오디오 신호의 코딩을 이용한 오디오 송신의 상황을 처리하고, 이득 정보는 오디오 신호에 직접 적용될 뿐만 아니라 인코딩된 오디오 신호와 함께 인코딩 및 송신된다. 디코더에서, 오디오 신호 및 이득 정보 둘 모두가 디코딩될 수 있고, 이득 정보는 대응하는 오디오 신호에 적용될 수 있다. 아래에서 더 상세히 설명되는 바와 같이, 본 발명은 이득 정보의 효율적인 코딩을 달성한다. 더 정확하게는, 본 발명은 인코딩된 동적 범위 제어 비트스트림에서 비트레이트 피크들을 회피한다.
오디오 신호에 동적 범위 제어를 적용하는 프로세스는, 오디오 신호 x(k)와 시변 이득 값 g(k)의 단순한 곱셈으로 표현될 수 있고:
y(k)= g(k)x(k) (1)
여기서 k는 샘플 시간 인덱스를 표현한다. 이득 g(k)의 값은, 예를 들어, 오디오 신호 x(k)의 제곱 평균 제곱근의 단기 추정에 기초하여 컴퓨팅될 수 있다. 적절한 이득 값들을 결정하기 위한 전략들에 대한 더 상세한 내용들은 [1]에서 논의된다. 아래에서, 시변 이득들 g(k)을 이득 시퀀스로 참조한다.
아래에서, 동적 범위 제어 이득 시퀀스들의 코딩이 설명된다. 먼저, 동적 범위 제어 이득 시퀀스는, 고정된 수의 이득 샘플들을 포함하는 이득 샘플들의 소위 동적 범위 제어 프레임들로 분할된다. 통상적으로, 동적 범위 제어 프레임들에 대한 일시적 프레임 크기는 대응하는 오디오 인코더의 오디오 프레임의 일시적 크기와 동일하도록 선택된다. 각각의 동적 범위 제어 프레임 내에서, 소위 노드들이, 바람직하게는 균일한 시간 그리드 상에서 선택된다.
이러한 그리드의 간격은 최고 이용가능한 시간 분해능을 정의하여, 즉, 2개의 노드들 사이의 샘플들의 최소 거리는, 최고 이용가능한 시간 분해능을 갖는 샘플들과 동일하다. 각각의 노드는, 동적 범위 제어 프레임 내의 샘플 위치, 그 위치에 대한 이득 값으로서 표현될 수 있는 이득 정보, 및 선택적으로는 노드 위치들에서 이득 값들의 기울기에 대한 정보에 의해 표현된다. 하기 논의에 대해, 일 프레임 내에서 선택될 수 있는 노드들의 최대 수를 정의하는 것이 유용할 것이다.
동적 범위 제어 인코더는, 예를 들어, 연속적 이득 노드들의 쌍들의 양자화된 차동 값들을 이용함으로써, 노드들로부터의 이득 정보를 인코딩한다. 디코더에서, 원래의 이득 시퀀스는, 노드들의 송신된 정보(이득 값, 동적 범위 제어 프레임 내의 샘플 위치 및 가능한 경우 기울기 정보)에 기초한 스플라인 보간(spline interpolation) 또는 선형 보간을 이용함으로써 가능한 한 양호하게 재구성된다.
동적 범위 제어 이득 시퀀스를 인코딩하기 위한 효율적인 접근법은, 연속적인 노드들의 쌍들의 양자화된 이득 차이 값(통상적으로 dB 단위) 뿐만 아니라 고려되는 동적 범위 제어 프레임 내에서 이러한 노드들의 샘플 위치들의 시간 차이를 이용하는 것이다. 기울기 정보는 통상적으로 2개의 노드들 사이의 차이로서 표현되지 않는다. 프레임 내의 제 1 노드에 대해서는 어떠한 선행 노드도 존재하지 않기 때문에, 그 이득 값은 차동 방식으로 인코딩되는 것이 아니라, 이 값들은 명시적으로 인코딩된다. 제 1 노드의 시간 차이는 통상적으로, 동적 범위 제어 프레임의 시작에 대한 오프셋으로서 결정된다.
그 다음, 인코더는, 예를 들어, 미리 정의된 허프만(Huffman) 테이블(코드 북)의 고정된 코드 워드를, 노드들의 쌍들의 이득 및 시간 차이들 각각에 할당할 수 있다.
동적 범위 제어 디코더에서, 동적 범위 제어 비트스트림이 디코딩되고, 송신된 노드들의 위치들에서의 관련 정보(이득 값, 동적 범위 제어 프레임 내의 샘플 위치 및 가능한 경우 기울기 정보)가 재구성된다. 프레임 내의 나머지 이득 샘플들에 대한 이득 값들은, 송신된 및 디코딩된 노드들의 쌍들 사이에서 보간에 의해 획득된다. 보간은, 이득 노드들의 기울기 정보가 송신된 경우 스플라인에 기초할 수 있거나, 또는 대안적으로, 오직 노드들의 쌍들 사이의 이득 차이들만이 이용가능하면 선형 보간을 이용하고 기울기 정보는 폐기된다.
원칙적으로, 동적 범위 제어 인코더/디코더 체인들은 2개의 모드들에서 동작될 수 있다. 소위 풀-프레임(full-frame) 모드는, 기준 동적 범위 제어 프레임에 대응하는 수신된 동적 범위 제어 비트스트림의 디코딩 후, 기준 동적 범위 제어 프레임의 각각의 샘플 위치에서의 이득들이, 디코딩된 노드들에 기초한 보간 이후 즉시 결정될 수 있는 경우를 지칭한다. 이것은, 노드가 각각의 프레임 경계에서, 즉, 기준 동적 범위 제어 프레임의 마지막 샘플에 대응하는 샘플 위치에서 송신되어야 함을 의미한다. 동적 범위 제어 프레임 길이가 N이면, 이것은, 마지막으로 송신된 노드가 기준 동적 범위 제어 프레임 내의 샘플 위치 N에 위치되어야 함을 의미한다.
본 발명은, "지연 모드"로 지칭되는 제 2 모드에 기초하기 때문에 이러한 단점들을 회피한다. 이러한 경우, 기준 동적 범위 제어 프레임 내의 마지막 샘플 위치에 대한 노드를 송신할 필요가 없다. 따라서, 동적 범위 제어 디코더는, 기준 동적 범위 제어 프레임 내의 마지막 노드에 따른 모든 이득 값들의 요구된 보간을 수행하기 위해, 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임을 디코딩하기 위해 대기해야 한다. 이것은, 보간을 통해 이득 값을 결정하기 위해, 기준 동적 범위 제어 프레임의 마지막 노드와 후속 동적 범위 제어 프레임의 제 1 노드 사이의 보간을 수행하도록 후속 동적 범위 제어 프레임의 제 1 노드의 정보가 알려져야 하기 때문이다.
실제로, 동적 범위 제어 정보의 코딩을 위해 지연 모드를 이용함으로써 초래되는 지연은 문제가 되지 않는다. 이것은, 통상적으로 동적 범위 제어 코딩 방식을 수반하는 오디오 코덱들이 또한 인코딩 및 디코딩 단계들을 순차적으로 적용하는 경우 하나의 오디오 프레임의 고유한 지연을 도입시키기 때문이다. 이러한 오디오 코덱들의 중요한 예들은, ISO/IEC 13818-7, Advanced Audio Coding (MPEG-2 AAC), ISO/IEC 14496-3, 하위파트 4 (MPEG-4 AAC), 또는 ISO/IEC 23003-3, 파트 3, USAC(Unified Speech and Audio Coding)이다. 이러한 오디오 코딩 방식들은, 기준 동적 범위 제어 오디오 프레임에 대응하는 정확한 오디오 샘플들을 (중첩-추가 구조를 이용하여) 컴퓨팅하기 위해, 기준 오디오 프레임 및 기준 오디오 프레임에 후속하는 오디오 프레임을 요구한다.
원래의 동적 범위 제어 이득 시퀀스에 충분히 근사화하기 위해 요구되는 노드들의 수는 동적 범위 제어 프레임마다 상당히 변하는 것을 주목하는 것이 중요하다. 이것은, 단지 느리게 변하는 이득 값들이 인코딩되어야 하는 경우에 비해, 매우 빠른 시변 이득들을 표현하기 위해 더 많은 노드들이 요구된다는 사실로부터 기인한다. 이러한 관측은, 이득 시퀀스들을 송신하기 위해 요구되는 비트레이트가 프레임마다 상당히 변할 수 있음을 의미한다. 일부 프레임들은, 많은 수의 노드들이 인코딩되도록 요구하여, 높은 비트레이트 피크들을 초래할 수 있다. 이것은 특히, 오디오 신호 및 동적 범위 제어 이득 시퀀스가, 거의 일정한 비트레이트를 가져야 하는, 인코딩된 동적 범위 제어 비트스트림 및 인코딩된 오디오 비트스트림을 포함하는 조인트(joint) 비트스트림에서 송신되는 경우 바람직하지 않다. 그 다음, 동적 범위 제어 관련 비트레이트의 피크는 오디오 인코더에 대한 이용가능한 비트레이트를 감소시키고, 이것은 종종 디코딩 이후 오디오 품질의 악화를 초래한다. 그러나, 동적 범위 제어 이득 시퀀스들의 코딩을 위한 현재의 최신 방법들에 있어서, 특정 프레임에서 동적 범위 제어 관련 비트레이트의 감소는 오직, 그 프레임 내의 이득 시퀀스를 표현하기 위해 선택되는 노드들의 수를 감소시킴으로써 달성된다. 이것은 또한, 원래의 이득 시퀀스와, 동적 범위 제어 디코딩 프로세스 이후 재구성되는 시퀀스 사이에 큰 에러들을 초래할 수 있다. 본 발명은, 원래의 동적 범위 제어 시퀀스와 재구성된 동적 범위 제어 시퀀스 사이의 에러를 증가시키지 않으면서, 인코딩된 동적 범위 제어 비트스트림의 피크 비트레이트들을 감소시킴으로써, 이러한 단점들을 극복한다.
이 섹션에서는, 본 발명에 따른 동적 범위 제어 이득 시퀀스들의 코딩이 제시된다. 본 발명은, 제안된 방법이 이용되는 않는 경우에 비해 결과적 비트스트림 시퀀스를 변경하지 않으면서 기준 동적 범위 제어 프레임에 대해 요구되는 피크 비트레이트를 제어하는 것을 허용한다. 제안된 접근법은, 노드들 중 일부의 송신을 다음 후속 동적 범위 제어 프레임에 분산시킴으로써, 일 프레임 내의 노드들의 수의 피크들을 감소시키기 위해, 최신 오디오 코더들에 의해 도입되는 일 프레임의 고유한 지연을 활용한다. 제안된 방법의 세부사항들은 아래에서 제시된다.
앞서 설명된 바와 같이, 동적 범위 제어 이득들에 비해 프레임 지연을 도입시키는 오디오 코딩 방식과 결합되는 경우, 디코딩된 동적 범위 제어 이득들은 오디오 신호에 적용되기 전에 일 프레임만큼 지연된다. 이것은, 기준 동적 범위 제어 프레임의 노드들이, 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임에서 유효 오디오 디코더 출력에 적용됨을 의미한다. 이것은, 디폴트 지연 모드에서, 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임의 노드들과 함께 기준 동적 범위 제어 프레임의 노드들을 송신하고, 대응하는 동적 범위 제어 이득들을 지연 없이 디코더에서 대응하는 오디오 출력 신호에 적용하는 것으로 충분함을 의미한다.
이러한 사실은, 하나의 동적 범위 제어 프레임 내에서 송신되는 노드들의 최대 수를 감소시키기 위해 본 발명에서 활용된다. 본 발명에 따르면, 기준 동적 범위 제어 프레임의 노드들 중 일부는 후속 동적 범위 제어 프레임으로 시프트되고, 이는, 인코딩 전에 행해질 수 있다. 아래에서 논의될 바와 같이, 시프트된 노드들은, 오직 이득 차이들의 인코딩 및 기울기 정보에 대해서만 후속 동적 범위 제어 프레임에서 제 1 노드에 "선행"할 수 있다. 시간 차이 정보의 코딩의 경우, 상이한 방법이 적용될 수 있다.
본 발명의 선호되는 실시예에 따르면, 기준 동적 범위 제어 프레임의 노드들의 수가 미리 정의된 임계 값보다 큰 경우 시프트 절차가 개시된다.
본 발명의 선호되는 실시예에 따르면, 기준 동적 범위 제어 프레임의 노드들의 수와, 기준 동적 범위 제어 프레임에 대응하는 비트스트림 부분에 임베딩되는, 기준 동적 범위 제어 프레임에 선행하는 동적 범위 제어 프레임으로부터 시프트된 노드들의 수의 합이 미리 정의된 임계 값보다 큰 경우 시프트 절차가 개시된다.
본 발명의 선호되는 실시예에 따르면, 기준 동적 범위 제어 프레임의 노드들의 수와, 기준 동적 범위 제어 프레임에 대응하는 비트스트림 부분에 임베딩되는, 기준 동적 범위 제어 프레임에 선행하는 동적 범위 제어 프레임으로부터 시프트된 노드들의 수의 합이, 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임의 노드들의 수보다 큰 경우 시프트 절차가 개시된다.
시프트 절차가 개시되는 것에 대해 정의된 조건들과는 독립적으로, 기준 동적 범위 제어 프레임의 제 1 노드는 후속 동적 범위 제어 프레임으로 시프트되지 않아야 하는데, 이는, 그 값이 기준 동적 범위 제어 프레임의 시작 시에 이득 제어 값들의 보간을 위해 필요하기 때문이다. 또한, 비트스트림을 디코딩하는 경우 지연을 회피하기 위해, 노드는 오직 한번만 시프트되어야 한다.
본 발명의 선호되는 실시예에 따르면, 하나 이상의 노드들의 시간 정보는, 하나 이상의 시프트된 노드들이 그 시간 정보를 이용함으로써 식별될 수 있는 방식으로 표현된다.
본 발명의 선호되는 실시예에 따르면, 하나 이상의 시프트된 노드들의 시간 정보는, 각각의 노드가 속하는 동적 범위 제어 프레임의 시작부터, 각각의 노드가 속하는 동적 범위 제어 프레임 내의 각각의 노드의 일시적 위치까지의 시간 차이와, 각각의 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임의 일시적 크기보다 크거나 그와 동일한 오프셋 값과의 합에 의해 표현된다.
본 발명의 선호되는 실시예에 따르면, 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임에 대응하는 비트스트림 부분의 제 1 위치에 있는 시프트된 노드의 비트 표현의 이득 정보는 절대적 이득 값에 의해 표현되고, 여기서 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임에 대응하는 비트 스트림 부분의 제 1 위치에 있는 노드의 비트 표현 이후의 위치에 있는 시프트된 노드들의 각각의 비트 표현의 이득 정보는, 각각의 시프트된 노드의 비트 표현의 이득 값과 각각의 노드의 비트 표현에 선행하는 노드의 비트 표현의 이득 값과의 차이와 동일한 상대적 이득 값에 의해 표현된다.
본 발명의 선호되는 실시예에 따르면, 기준 동적 범위 제어 프레임의 하나 이상의 시프트된 노드들의 비트 표현들이, 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임에 대응하는 비트스트림 부분에서 임베딩되는 경우, 하나 이상의 시프트된 노드들의 비트 표현들의 하나 이상의 위치들 이후 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임에 대응하는 비트스트림 부분의 제 1 위치에 있는 후속하는 동적 범위 제어 프레임의 노드의 비트 표현의 이득 정보는, 각각의 노드의 비트 표현의 이득 값과 각각의 노드의 비트 표현에 선행하는 시프트된 노드의 비트 표현의 이득 값과의 차이와 동일한 상대적 이득 값에 의해 표현된다.
본 발명의 선호되는 실시예에 따르면, 오디오 프레임들의 일시적 크기는 동적 범위 제어 프레임들의 일시적 크기와 동일하다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 프레임 중 하나의 하나 이상의 노드들은 균일한 시간 그리드로부터 선택된다.
본 발명의 선호되는 실시예에 따르면, 하나 이상의 노드들의 각각의 노드는 기울기 정보를 포함한다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 인코더는, 허프만 코딩 또는 산술 코딩과 같은 엔트로피 인코딩 기술을 이용하여 노드들을 인코딩하기 위해 구성된다.
인코더는, 예를 들어, 미리 정의된 허프만 테이블(코드 북)의 고정된 코드 워드를, 노드들의 쌍들의 이득 및 시간 차이들 각각에 할당할 수 있다. 연속적인 노드들의 쌍들의 시간 차이들을 인코딩하기 위한 적절한 허프만 테이블들의 예들은, 각각 표 1 및 표 2에 주어진다.
코드워드 크기 [비트] 시간 차이 2진 인코딩 deltaTmin 의 배수들에서 시간 차이 tDrcDelta
1 0x000 nNodesMax
3 0x004 1
5 0x014+(a-2) a=[2..5]
6 0x030+(a-6) a=[6..13]
12 0xE00+(a-14) a=[14..2*nNodesMax-1]
표 1: DRC 이득 노드들의 시간 차이들의 코딩을 위한 허프만 테이블의 예
인코딩 크기 deltaTmin 의 배수들에서 시간 차이 범위
00 2 비트 tDrcDelta = 1 1
{01,μ} {2 비트, 2 비트} tDrcDelta = ?+2 2...5
{10,μ} {2 비트, 3 비트} tDrcDelta = ?+6 6?13
{11,μ} {2 비트, Z 비트} tDrcDelta = ?+14 14...2*nNodesMax
표 2: DRC 이득 노드들의 시간 차이들의 코딩을 위한 허프만 테이블의 예, 여기서, Z=ceil(log2(2*nNodesMax))
본 발명의 추가적인 양상에서, 목적은 오디오 디코더 디바이스에 의해 달성되고, 이 디바이스는,
연속적인 오디오 프레임들을 포함하는 오디오 신호를 재생성하기 위해, 인코딩된 오디오 비트스트림을 디코딩하기 위해 구성되는 오디오 디코더;
오디오 신호에 대응하고 연속적인 동적 범위 제어 프레임들을 포함하는 동적 범위 제어 시퀀스를 재생성하기 위해, 인코딩된 동적 범위 제어 비트스트림을 디코딩하기 위해 구성되는 동적 범위 제어 디코더를 포함하고;
인코딩된 동적 범위 제어 비트스트림은 동적 범위 제어 프레임들의 각각의 동적 범위 제어 프레임에 대해 대응하는 비트스트림 부분을 포함하고;
인코딩된 동적 범위 제어 비트스트림은 노드들의 비트 표현들을 포함하고, 노드들 중 하나의 노드의 각각의 비트 표현은, 오디오 신호 AS에 대한 이득 정보 및 이득 정보가 어느 시점에 대응하는지를 표시하는 시간 정보를 포함하고;
인코딩된 동적 범위 제어 비트 스트림은, 하나의 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임에 대응하는 비트스트림 부분에 임베딩되는 동적 범위 제어 프레임들의 하나의 기준 동적 범위 제어 프레임의 노드들로부터 선택되는 시프트된 노드들의 비트 표현들을 포함하고, 동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 노드들 중 각각의 나머지 노드의 비트 표현은 하나의 기준 동적 범위 제어 프레임에 대응하는 비트스트림 부분에 임베딩되고;
동적 범위 제어 디코더는, 동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 각각의 나머지 노드를 재생성하기 위해, 동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 나머지 노드들의 각각의 나머지 노드의 비트 표현을 디코딩하고, 동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 노드들로부터 선택된 시프트된 노드들의 각각의 시프트된 노드를 재생성하기 위해, 동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 노드들로부터 선택된 시프트된 노드들의 각각의 시프트된 노드의 비트 표현을 디코딩하고, 기준 동적 범위 제어 프레임을 재생성하기 위해, 재생성된 나머지 노드들 및 재생성된 시프트된 노드들을 결합하기 위해 구성된다.
동적 범위 제어 디코더는 동적 범위 제어 비트스트림을 수신한다. 노드 정보(샘플 위치, 이득 값 및 가능한 경우 기울기 정보)에 대응하는 동적 범위 제어 비트스트림은 다음 방식으로 디코딩될 수 있다:
2개의 노드들 사이의 시간 차이에 대한 값(예를 들어, 2개의 노드들 사이의 최소 거리의 정수배)은, 예를 들어, 허프만 코드 북에 제시된 규칙들에 기초하여 수신된 코드 워드로부터 결정된다. 현재의 디코딩된 노드의 대응하는 샘플 위치는, 이전 노드에 대해 컴퓨팅된 샘플 위치 값에 시간 차이 값을 추가함으로써 획득된다.
기준 동적 범위 제어 프레임의 노드들을 디코딩한 후, 후속 동적 범위 제어 프레임의 노드들이 디코딩된다.
후속 동적 범위 제어 프레임 내에서 결정된 샘플 위치가, 후속 동적 범위 제어 프레임의 길이보다 큰 값에 대응하면, 동적 범위 제어 디코더는, 현재의 일시적 노드 정보가 기준 동적 범위 제어 프레임에 원래 위치된 노드를 참조함을 인식한다.
기준 동적 범위 제어 프레임 내의 정확한 샘플 위치를 획득하기 위해, 컴퓨팅된 샘플 위치로부터 오프셋이 감산된다. 실례는, 동적 범위 제어 프레임의 길이에 대응하는 값을 감산하는 것이다(이것은, 인코더가 원래의 샘플 위치에 그 값을 가산했음을 의미한다). 오프셋 값에 대한 통상적인 예는 동적 범위 제어 프레임의 일시적 크기이다.
디코딩 이후, 그리고 적용가능하면, 후속 동적 범위 제어 프레임 전체에서 모든 노드들의 시간 정보를 정정한 후, 디코더는, 얼마나 많은 노드들이 기준 동적 범위 제어 프레임에 대해 뒤로 시프트되었는지, 및 이들이 기준 동적 범위 제어 프레임 내에서 어느 샘플 위치 상에 위치되는지를 (이러한 정보를 인코더에서 명시적으로 제공함이 없이도) 인식한다.
동적 범위 제어 디코더는, 비트스트림에서 차동 이득 정보를 디코딩함으로써 수신된 프레임의 모든 노드들의 이득 값 정보를 추가로 결정한다.
시간 정보의 디코딩 단계로부터, 디코더는, 디코딩된 이득 값들 중 얼마나 많은 값이 기준 동적 범위 제어 프레임의 노드들에 (그리고 어느 샘플 위치에) 할당되어야 하는지, 및 어느 이득 값들이 기준 동적 범위 제어 프레임의 노드들에 할당되는지를 인식한다.
기울기 정보의 디코딩 및 정확한 노드들에의 할당은 이득 값들의 디코딩 프로세스와 유사하게 수행된다.
후속 동적 범위 제어 프레임의 모든 노드들을 디코딩한 후, 보간을 통해 기준 동적 범위 제어 프레임의 각각의 샘플에 대한 이득 값들의 컴퓨팅을 위해 요구되는 모든 노드들이 이용가능한 것이 보장될 수 있다. 보간 단계 이후, 각각의 샘플에 대한 동적 범위 제어 이득 값들은 대응하는 정확한 오디오 샘플들에 적용될 수 있다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 디코더는 시간 정보를 이용함으로써 하나 이상의 시프트된 노드들을 식별하기 위해 구성된다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 디코더는, 각각의 노드가 속하는 동적 범위 제어 프레임의 시작부터, 각각의 노드가 속하는 동적 범위 제어 프레임 내의 각각의 노드의 일시적 위치까지의 시간과, 각각의 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임의 일시적 크기보다 크거나 그와 동일한 오프셋 값과의 합에 의해 표현되는 하나 이상의 시프트된 노드들의 시간 정보를 디코딩하기 위해 구성된다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 디코더는, 절대적 이득 값에 의해 표현되는 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임에 대응하는 비트스트림 부분의 제 1 위치에 있는 시프트된 노드의 비트 표현의 이득 정보를 디코딩하기 위해 구성되고, 여기서 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임에 대응하는 비트 스트림 부분의 제 1 위치에 있는 노드의 비트 표현 이후의 위치에 있는 시프트된 노드들의 각각의 비트 표현의 이득 정보는, 각각의 시프트된 노드의 비트 표현의 이득 값과 각각의 노드의 비트 표현에 선행하는 노드의 비트 표현의 이득 값과의 차이와 동일한 상대적 이득 값에 의해 표현된다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 디코더는, 하나 이상의 시프트된 노드들의 비트 표현들의 하나 이상의 위치들이, 각각의 노드의 비트 표현의 이득 값과, 각각의 노드의 비트 표현에 선행하는 시프트된 노드의 비트 표현의 이득 값과의 차이와 동일한 상대적 이득 값에 의해 표현된 후, 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임에 대응하는 비트스트림 부분의 제 1 위치에 있는 후속하는 동적 범위 제어 프레임의 노드의 비트 표현의 이득 정보를 디코딩하기 위해 구성된다.
본 발명의 선호되는 실시예에 따르면, 오디오 프레임들의 일시적 크기는 동적 범위 제어 프레임들의 일시적 크기와 동일하다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 프레임들 중 하나의 하나 이상의 노드들은 균일한 시간 그리드로부터 선택된다.
본 발명의 선호되는 실시예에 따르면, 하나 이상의 노드들의 각각의 노드는 기울기 정보를 포함한다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 디코더는 엔트로피 디코딩 기술을 이용하여 노드들의 비트 표현들을 디코딩하기 위해 구성된다.
목적은, 본 발명에 따른 오디오 인코더 디바이스 및 본 발명에 따른 오디오 디코더 디바이스를 포함하는 시스템에 의해 추가로 획득된다.
본 발명은, 오디오 인코더를 동작시키기 위한 방법을 추가로 제공하고, 이 방법은,
연속적인 오디오 프레임들을 포함하는 오디오 신호로부터 인코딩된 오디오 비트스트림을 생성하는 단계;
오디오 신호에 대응하고 연속적인 동적 범위 제어 프레임들을 포함하는 동적 범위 제어 시퀀스로부터 인코딩된 동적 범위 제어 비트스트림을 생성하는 단계 ―
동적 범위 제어 프레임들의 각각의 동적 범위 제어 프레임은 하나 이상의 노드들을 포함하고, 하나 이상의 노드들의 각각의 노드는, 오디오 신호에 대한 이득 정보 및 이득 정보가 어느 시점에 대응하는지 표시하는 시간 정보를 포함하고;
인코딩된 동적 범위 제어 비트스트림은 동적 범위 제어 프레임들의 각각의 동적 범위 제어 프레임에 대해 대응하는 비트스트림 부분을 포함하고―;
시프트 절차를 실행하는 단계를 포함하고, 동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 노드들 중 하나 이상의 노드들은 시프트된 노드들로서 선택되고, 하나의 기준 동적 범위 제어 프레임의 하나 이상의 시프트된 노드들 각각의 비트 표현은 하나의 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임에 대응하는 비트스트림 부분에 임베딩되고, 동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 노드들 중 각각의 나머지 노드의 비트 표현은 하나의 기준 동적 범위 제어 프레임에 대응하는 비트스트림 부분에 임베딩된다.
본 발명은, 오디오 디코더를 동작시키기 위한 방법을 추가로 제공하고, 이 방법은,
연속적인 오디오 프레임들을 포함하는 오디오 신호를 재생성하기 위해, 인코딩된 오디오 비트스트림을 디코딩하는 단계;
오디오 신호에 대응하고 연속적인 동적 범위 제어 프레임들을 포함하는 동적 범위 제어 시퀀스를 재생성하기 위해, 인코딩된 동적 범위 제어 비트스트림을 디코딩하는 단계를 포함하고;
인코딩된 동적 범위 제어 비트스트림은 동적 범위 제어 프레임들의 각각의 동적 범위 제어 프레임에 대해 대응하는 비트스트림 부분을 포함하고;
인코딩된 동적 범위 제어 비트스트림은 노드들의 비트 표현들을 포함하고, 노드들 중 하나의 노드의 각각의 비트 표현은, 오디오 신호 AS에 대한 이득 정보 및 이득 정보가 어느 시점에 대응하는지를 표시하는 시간 정보를 포함하고;
인코딩된 동적 범위 제어 비트 스트림은, 하나의 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임에 대응하는 비트스트림 부분에 임베딩되는 동적 범위 제어 프레임들의 하나의 기준 동적 범위 제어 프레임의 노드들로부터 선택되는 시프트된 노드들의 비트 표현들을 포함하고, 동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 노드들 중 각각의 나머지 노드의 비트 표현은 하나의 기준 동적 범위 제어 프레임에 대응하는 비트스트림 부분에 임베딩되고;
동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 나머지 노드들의 각각의 나머지 노드의 비트 표현은, 동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 각각의 나머지 노드를 재생성하기 위해, 디코딩되고;
동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 노드들로부터 선택된 시프트된 노드들의 각각의 시프트된 노드의 비트 표현은, 동적 범위 제어 프레임들 중 하나의 기준 동적 범위 제어 프레임의 노드들로부터 선택된 시프트된 노드들의 각각의 시프트된 노드를 재생성하기 위해 디코딩되고;
재생성된 나머지 노드들 및 재생성된 시프트된 노드들은, 기준 동적 범위 제어 프레임을 재생성하기 위해 결합된다.
다른 양상에서 본 발명은, 프로세서 상에서 실행되는 경우 본 발명에 따른 방법을 실행하기 위한 프로그램을 제공한다.
본 발명의 선호되는 실시예들은 후속적으로, 첨부된 도면들에 대해 논의된다.
도 1은, 본 발명에 따른 오디오 인코더 디바이스의 실시예를 개략도에서 예시한다.
도 2는, 오디오 코딩의 상황에서 적용되는 동적 범위 제어의 원리를 개략도에서 예시한다.
도 3은 동적 범위 제어 이득 시퀀스들의 코딩에 대한 상이한 모드들을 개략도에서 예시한다.
도 4는, 오디오 코딩의 상황에서 동적 범위 제어의 적용을 개략도에서 예시한다.
도 5는, 본 발명에 따른 노드들에 대한 시프트 절차를 개략도에서 예시한다.
도 6은, 본 발명에 따른 시간 정보의 코딩을 개략도에서 예시한다.
도 7은, 본 발명에 따른 이득 정보의 코딩을 개략도에서 예시한다.
도 8은, 본 발명에 따른 기울기 정보의 코딩을 개략도에서 예시한다.
도 9은, 본 발명에 따른 오디오 디코더 디바이스의 실시예를 개략도에서 예시한다.
도 1은, 본 발명에 따른 오디오 인코더 디바이스(1)의 실시예를 개략도에서 예시한다. 오디오 인코더 디바이스(1)는,
연속적인 오디오 프레임들 AFP, AFR, AFS를 포함하는 오디오 신호 AS로부터 인코딩된 오디오 비트스트림 ABS를 생성하기 위해 구성되는 오디오 인코더(2);
오디오 신호 AS에 대응하고 연속적인 동적 범위 제어 프레임들 DFP, DFR, DFS를 포함하는 동적 범위 제어 시퀀스 DS로부터 인코딩된 동적 범위 제어 비트스트림 DBS를 생성하기 위해 구성되는 동적 범위 제어 인코더(3)를 포함하고, 동적 범위 제어 프레임들 DFP, DFR, DFS의 각각의 동적 범위 제어 프레임 DFP, DFR, DFS는 하나 이상의 노드들 A0 ... A5; B0 ... B2; C0을 포함하고, 하나 이상의 노드들 A0 ... A5; B0 ... B2; C0의 각각의 노드는, 오디오 신호 AS에 대한 이득 정보 GA0 ... GA5; GB0 ... GB2; GC0 및 이득 정보 GA0 ... GA5; GB0 ... GB2; GC0이 어느 시점에 대응하는지 표시하는 시간 정보 TA0 ... TA5; TB0 ... TB2; TC0을 포함하고;
동적 범위 제어 인코더(3)는, 인코딩된 동적 범위 제어 비트스트림 DBS가 동적 범위 제어 프레임들 DFP, DFR, DFS의 각각의 동적 범위 제어 프레임 DFP, DFR, DFS에 대해 대응하는 비트스트림 부분 DFP', DFR', DFS'을 포함하는 방식으로 구성되고;
동적 범위 제어 인코더(2)는 시프트 절차를 실행하기 위해 구성되고, 동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 기준 동적 범위 제어 프레임 DFR의 노드들 B0 ... B2 중 하나 이상의 노드들 B1, B2는 시프트된 노드들 B1, B2로서 선택되고, 하나의 기준 동적 범위 제어 프레임 DFR의 하나 이상의 시프트된 노드들 B1, B2 각각의 비트 표현 B'1, B'2는 하나의 기준 동적 범위 제어 프레임 DFR에 후속하는 동적 범위 제어 프레임 DFS에 대응하는 비트스트림 부분 DFS'에 임베딩되고, 동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 기준 동적 범위 제어 프레임 DFR의 노드들 B0 ... B2 중 각각의 나머지 노드 B0의 비트 표현 B'0은 하나의 기준 동적 범위 제어 프레임 DFR에 대응하는 비트스트림 부분 DFR'에 임베딩된다.
본 발명은, 제안된 방법이 이용되는 않는 경우에 비해 결과적 비트스트림 시퀀스 DBS를 변경하지 않으면서 기준 동적 범위 제어 프레임 DFR에 대해 요구되는 피크 비트레이트를 제어하는 것을 허용한다. 제안된 접근법은, 노드들 중 일부의 송신을 다음 후속 동적 범위 제어 프레임에 분산시킴으로써, 일 프레임 내의 노드들의 수의 피크들을 감소시키기 위해, 최신 오디오 코더들에 의해 도입되는 일 프레임의 고유한 지연을 활용한다. 제안된 방법의 세부사항들은 아래에서 제시된다.
앞서 설명된 바와 같이, 동적 범위 제어 이득들에 비해 프레임 지연을 도입시키는 오디오 코딩 방식과 결합되는 경우, 디코딩된 동적 범위 제어 이득들은 오디오 신호에 적용되기 전에 일 프레임만큼 지연된다. 이것은, 기준 동적 범위 제어 프레임의 노드들이, 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임에서 유효 오디오 디코더 출력에 적용됨을 의미한다. 이것은, 디폴트 지연 모드에서, 기준 동적 범위 제어 프레임에 후속하는 동적 범위 제어 프레임의 노드들과 함께 기준 동적 범위 제어 프레임의 노드들을 송신하고, 대응하는 동적 범위 제어 이득들을 지연 없이 디코더에서 대응하는 오디오 출력 신호에 적용하는 것으로 충분함을 의미한다.
이러한 사실은, 하나의 동적 범위 제어 프레임 내에서 송신되는 노드들의 최대 수를 감소시키기 위해 본 발명에서 활용된다. 본 발명에 따르면, 기준 동적 범위 제어 프레임의 노드들 중 일부는 후속 동적 범위 제어 프레임으로 시프트되고, 이는, 인코딩 전에 행해질 수 있다. 아래에서 논의될 바와 같이, 시프트된 노드들은, 오직 이득 차이들의 인코딩 및 기울기 정보에 대해서만 후속 동적 범위 제어 프레임에서 제 1 노드에 "선행"할 수 있다. 시간 차이 정보의 코딩의 경우, 상이한 방법이 적용될 수 있다.
도 1에 도시된 예에서, 선행 동적 범위 제어 프레임 DFP는 6개의 노드들 A0 ... A5를 포함하고, 이들 중 노드들 A4, A5는 비트스트림 부분 DFR'으로 시프트된다. 또한, 기준 동적 범위 제어 프레임 DFR은 3개의 노드들 B0 ... B2를 포함한다. 시프트된 노드들 A4, A5와 기준 동적 범위 제어 프레임 DFR의 노드들 B0 ... B2의 수의 합은, 후속 동적 범위 제어 프레임 DFS의 노드들 Co의 수보다 커서, 노드들 B1, B2가 비트스트림 부분 DFS'로 시프트되는 방식으로 시프트 절차가 개시된다. 동적 범위 제어 프레임들 DFS, DFR, DFP 내의 노드들의 최대 수는 6과 동일하지만, 비트스트림 부분들 DFS', DFR', DFP' 내의 노드들 자체의 최대 수는 4와 동일하여, 비트스트림 피크가 회피된다.
본 발명의 선호되는 실시예에 따르면, 오디오 프레임들 AFP, AFR, AFS의 일시적 크기는 동적 범위 제어 프레임들 DFP, DFR, DFS의 일시적 크기와 동일하다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 프레임 DFP, DFR, DFS 중 하나의 하나 이상의 노드들 A0 ... A5; B0 ... B2; C0은 균일한 시간 그리드로부터 선택된다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 인코더(3)는 엔트로피 인코딩 기술을 이용하여 노드들 A0 ... A5; B0 ... B2; C0을 인코딩하기 위해 구성된다.
추가적인 양상에서, 본 발명은, 오디오 인코더(1)를 동작시키기 위한 방법을 추가로 제공하고, 이 방법은,
연속적인 오디오 프레임들 AFP, AFR, AFS를 포함하는 오디오 신호 AS로부터 인코딩된 오디오 비트스트림 ABS를 생성하는 단계;
오디오 신호 AS에 대응하고 연속적인 동적 범위 제어 프레임들 DFP, DFR, DFS를 포함하는 동적 범위 제어 시퀀스 DS로부터 인코딩된 동적 범위 제어 비트스트림 DBS를 생성하는 단계 ―동적 범위 제어 프레임들 DFP, DFR, DFS의 각각의 동적 범위 제어 프레임 DFP, DFR, DFS는 하나 이상의 노드들 A0 ... A5; B0 ... B2; C0을 포함하고, 하나 이상의 노드들 A0 ... A5; B0 ... B2; C0의 각각의 노드는, 오디오 신호 AS에 대한 이득 정보 GA0 ... GA5; GB0 ... GB2; GC0 및 이득 정보가 어느 시점에 대응하는지 표시하는 시간 정보 TA0 ... TA5; TB0 ... TB2; TC0을 포함하고;
인코딩된 동적 범위 제어 비트스트림 DBS는 동적 범위 제어 프레임들 DFP, DFR, DFS의 각각의 동적 범위 제어 프레임 DFP, DFR, DFS에 대해 대응하는 비트스트림 부분 DFP', DFR', DFS'을 포함함―;
시프트 절차를 실행하는 단계를 포함하고, 동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 기준 동적 범위 제어 프레임 DFR의 노드들 B0 ... B2 중 하나 이상의 노드들 B1, B2는 시프트된 노드들 B1, B2로서 선택되고, 하나의 기준 동적 범위 제어 프레임 DFR의 하나 이상의 시프트된 노드들 B1, B2 각각의 비트 표현 B'1, B'2는 하나의 기준 동적 범위 제어 프레임 DFR에 후속하는 동적 범위 제어 프레임 DFS에 대응하는 비트스트림 부분 DFS'에 임베딩되고, 동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 기준 동적 범위 제어 프레임 DFR의 노드들 B0 ... B2 중 각각의 나머지 노드 B0의 비트 표현 B'0은 하나의 기준 동적 범위 제어 프레임 DFR에 대응하는 비트스트림 부분 DFR'에 임베딩된다.
도 2는, 오디오 코딩의 상황에서 적용되는 동적 범위 제어의 원리를 개략도에서 예시한다.
오디오 신호에 DRC를 적용하는 프로세스는, 오디오 신호 x(k)와 시변 이득 값 g(k)의 단순한 곱셈으로 표현될 수 있고:
y(k)= g(k)x(k) (1)
여기서 k는 샘플 시간 인덱스를 표현한다. 이득 g(k)의 값은, 예를 들어, 입력 신호 x(k)의 제곱 평균 제곱근의 단기 추정에 기초하여 컴퓨팅된다. 적절한 이득 값들을 결정하기 위한 전략들에 대한 더 상세한 내용들은 [1]에서 논의된다. 아래에서, 시변 이득들 g(k)을 이득 시퀀스로 참조한다.
본 발명은 애플리케이션 시나리오를 참조하며, 여기서 오디오 신호 AS 및 동적 범위 제어 시퀀스 DS 둘 모두가 코딩 및 송신된다. 이러한 경우, 동적 범위 제어 이득들은 오디오 신호 AS에 직접 적용되는 것이 아니라, 인코딩된 오디오 신호 ABS와 함께 인코딩 및 송신된다. 디코더(4)에서, 오디오 신호 AS 및 동적 범위 제어 시퀀스 DS 둘 모두가 디코딩되고, 동적 범위 제어 정보는 대응하는 오디오 신호 AS에 적용된다.
일 양상에서, 본 발명에 따른 오디오 인코더 디바이스(1) 및 본 발명에 따른 오디오 디코더 디바이스(4)를 포함하는 시스템을 제공한다.
도 3은 동적 범위 제어 이득 시퀀스들의 코딩에 대한 상이한 모드들, 즉, 풀-프레임 모드(A) 및 지연 모드(B)를 개략도에서 예시한다. 프레임 n에서 수신되는 이득 노드들은 원들로 도시되고, 프레임 n+1에서 수신되는 이득 노드들은 사각형들로 도시된다. 실선은 DRC 프레임 n+1까지 보간된 DRC 이득을 예시한다.
원칙적으로, 동적 범위 제어 인코더/디코더 체인은 2개의 모드들에서 동작될 수 있다. 소위 풀-프레임 모드는, 특정한 동적 범위 제어 프레임에 대응하는 수신된 동적 범위 제어 비트스트림의 디코딩 후, 동적 범위 제어 프레임의 각각의 샘플 위치에서의 이득들이, 디코딩된 노드들에 기초한 보간 이후 즉시 결정될 수 있는 경우를 지칭한다. 이것은, 노드가 각각의 프레임 경계에서, 즉, 동적 범위 제어 프레임의 마지막 샘플에 대응하는 샘플 위치에서 송신되어야 함을 의미한다. 동적 범위 제어 프레임 길이가 N이면, 이것은, 마지막으로 송신된 노드가 그 프레임 내의 샘플 위치 N에 위치되어야 함을 의미한다. 이것은 도 3의 최상부에서 "A"로 표기되어 예시된다. 도시된 바와 같이, n번째 프레임의 동적 범위 제어 이득들은 대응하는 오디오 프레임에 즉시 적용될 수 있다.
제 2 모드는 "지연 모드"로 지칭되고, 이는 도 3의 하부 부분에서 "B"로 예시된다. 이러한 경우, 프레임 n 내의 마지막 샘플 위치에 대해 송신되는 어떠한 노드도 존재하지 않는다. 따라서, DRC 디코더는, 프레임 n 내의 마지막 노드에 따른 모든 이득 값들의 요구되는 보간을 수행하기 위해, DRC 프레임 n+1을 디코딩하기 위해 대기해야 한다. 이것은, 보간을 통해 이득 값을 결정하기 위해, 프레임 n의 마지막 노드와 프레임 n+1의 제 1 노드 사이의 보간을 수행하도록 프레임 n+1의 제 1 노드의 정보가 알려져야 하기 때문이다.
도 4는, 오디오 코딩의 상황에서 동적 범위 제어의 적용을 개략도에서 예시하며, 여기서 오디오 코더는 동적 범위 코딩 방식에 비해 1 프레임 지연을 도입시킨다.
도 5는, 본 발명에 따른 노드들에 대한 시프트 절차를 개략도에서 예시한다. 좌측은, 최신 접근법을 이용하는 경우의 상황을 도시하는 한편, 우측은 제안된 방법을 도시하고, 여기서 각각의 사각형은 노드 A0 ... A5; B0 ... B2; C0에 대응한다.
본 발명의 선호되는 실시예에 따르면, 기준 동적 범위 제어 프레임 DFR의 노드들 B0 ... B2의 수가 미리 정의된 임계 값보다 큰 경우 시프트 절차가 개시된다.
본 발명의 선호되는 실시예에 따르면, 기준 동적 범위 제어 프레임 DFR의 노드들 B0 ... B2의 수와, 기준 동적 범위 제어 프레임 DFR에 대응하는 비트스트림 부분 DFR'에 임베딩되는, 기준 동적 범위 제어 프레임 DFR에 선행하는 동적 범위 제어 프레임 DFP로부터 시프트된 노드들 A4, A5의 수의 합이 미리 정의된 임계 값보다 큰 경우 시프트 절차가 개시된다.
본 발명의 선호되는 실시예에 따르면, 기준 동적 범위 제어 프레임 DFR의 노드들 B0 ... B2의 수와, 기준 동적 범위 제어 프레임 DFR에 대응하는 비트스트림 부분 DFR'에 임베딩되는, 기준 동적 범위 제어 프레임 DFR에 선행하는 동적 범위 제어 프레임 DFP로부터 시프트된 노드들의 수 A4, A5의 합이, 기준 동적 범위 제어 프레임 DFR에 후속하는 동적 범위 제어 프레임 DFS의 노드들 C0의 수보다 큰 경우 시프트 절차가 개시된다.
앞서 설명된 바와 같이, 동적 범위 제어 프레임들에 비해 프레임 지연을 도입시키는 오디오 코딩 방식과 결합되는 경우, 디코딩된 동적 범위 제어 이득들은 오디오 신호에 적용되기 전에 일 프레임만큼 지연된다. 도 5의 좌측을 고려하면, 이것은, n번째 프레임의 노드들 Ai가 프레임 n+1에서 유효 오디오 디코더 출력에 적용됨을 의미한다. 이것은, 디폴트 지연 모드에서, 노드들 Ai를 프레임 n+1에서 노드 B0과 함께 송신하고, 대응하는 DRC 이득들을, 지연 없이, 디코더에서 대응하는 오디오 출력 신호에 직접 적용하는 것으로 충분할 것임을 의미한다.
이러한 사실은, 제안된 방법에서, 하나의 프레임 내에서 송신되는 노드들의 최대 수를 감소시키기 위해 활용된다. 이것은 도 4의 우측에 예시된다. 노드들 A4 및 A5는 인코딩 전에 프레임 n+1로 시프트되어, 즉, 프레임 n의 노드들의 최대 수는, 주어진 예에서 6으로부터 4로 감소된다. 아래에서 논의될 바와 같이, 노드들 A4 및 A5는, 오직 이득 차이들의 인코딩 및 기울기 정보에 대해서만 프레임 n+1, 즉, B0에서 제 1 노드에 "선행"할 수 있다. 시간 차이 정보의 코딩의 경우, 상이한 방법이 적용되어야 한다.
도 6은, 본 발명에 따른 시간 정보의 코딩을 개략도에서 예시한다.
본 발명의 선호되는 실시예에 따르면, 하나 이상의 노드들 A0 ... A5; B0 ... B2; C0의 시간 정보 TA0 ... TA5; TB0 ... TB2; TC0은, 하나 이상의 시프트된 노드들 A4, A5; B1, B2가 시간 정보 TA4, TA5; TB1, TB2를 이용함으로써 식별될 수 있는 방식으로 표현된다.
본 발명의 선호되는 실시예에 따르면, 하나 이상의 시프트된 노드들 A4, A5; B1, B2의 시간 정보 TA4, TA5; TB1, TB2는, 각각의 노드 A4, A5; B1, B2가 속하는 동적 범위 제어 프레임 DFP; DFR의 시작부터, 각각의 노드 A4, A5; B1, B2가 속하는 동적 범위 제어 프레임 DFP; DFR 내의 각각의 노드 A4, A5; B1, B2의 일시적 위치까지의 시간 차이 t_A4, t_A5; t_B1, t_B2와, 각각의 동적 범위 제어 프레임 DFP; DFR에 후속하는 동적 범위 제어 프레임 DFR; DFS의 일시적 크기보다 크거나 그와 동일한 오프셋 값 drcFrameSize와의 합에 의해 표현된다.
먼저, 노드들의 쌍들 사이의 시간 차이들의 인코딩을 고려한다. 도 6에서, 노드들의 상들에 대한 시간 차이들을 결정하기 위한 상황은 도 4에 따른 예에 대해 도시되고, 여기서 t_Ai는 프레임 내에서 가능한 노드 위치들의 그리드 상에서 노드 Ai의 샘플 위치를 표시한다. 더 먼저 논의된 바와 같이, 노드들은 균일한 시간 그리드 상에서 선택될 수 있고, 여기서 이러한 그리드의 간격은 최고 이용가능한 시간 분해능 deltaTmin을 정의한다. 따라서, 샘플들에서 시간 정보 t_Ai가 주어지고, 여기서 2개의 노드들 사이의 시간 차이들은 항상 deltaTmin의 정수배들이다.
노드의 일시적 위치 정보는 차동 방식으로, 즉, 이전 노드의 위치에 대해 인코딩된다. 노드가 프레임 내의 제 1 노드이면, 시간 차이는 프레임의 시작에 대해 결정된다. 도 6의 좌측은, 어떠한 노드 시프팅도 적용되지 않는 상황을 도시한다. 이러한 경우, 노드 A4의 차동 시간 정보 tDrcDelta_A4는 tDrcDelta_A4 = t_A4 - t_A3으로서 컴퓨팅된다. 그 다음, 이러한 차동 시간 값은, 예를 들어, 표 1 또는 표 2에 따른 적절한 허프만 테이블의 대응하는 엔트리를 이용하여 인코딩된다. 다른 예로, 노드 B0의 인코딩된 시간 차이를 고려한다. B0은 프레임 n+1의 제 1 노드이기 때문에, 대응하는 시간 차이는 프레임의 시작에 대해 결정되며, 즉, tDrcDelta_B0 = t_B0이다.
이제, 노드 시프팅을 이용하는 제안된 노드 저장 기술을 위한 노드 위치의 인코딩을 고려한다. 도 6의 우측에 도시된 예의 경우, 노드들 A4 및 A5는 인코딩을 위해 다음 프레임으로 시프트된다. 노드들 A0 내지 A3의 표현은 변경되지 않고, 따라서 인코딩된 시간 차이들 또한 변경되지 않는다. 이것은, 노드 B0의 인코딩된 위치 정보에 대해서도 동일하다. 그러나, 노드 A4 및 노드 A5의 시간 정보는 이제 상이하게 프로세싱된다. 도 6에 도시된 바와 같이, 노드 A4의 샘플 위치를 표시하는 원래의 값 t_A4는 오프셋 drcFrameSize를 추가함으로써 인코더에서 변형된다. 결과적 위치 정보가, 정규의 인코딩의 경우 가능할 최대 값을 초과하기 때문에, 오프셋은, 대응하는 노드가 이전 프레임의 콘텍스트 내에서 추가로 프로세싱되어야 함을 디코더에 표시한다. 또한, 디코더는, 디코딩된 값으로부터 오프셋 drcFrameSize를 감산함으로써 원래의 샘플 위치 t_A4가 획득됨을 인식한다.
다음으로, 도 6의 우측에 도시된 상황에 대해 실제로 인코딩되는 시간 차이 정보의 계산을 고려한다. 코딩 효율 때문에, 노드 A4에 대한 차동 위치 정보는 노드 B0에 대해 컴퓨팅된다. 도 6의 좌측에 대해 이전에 논의된 상황과는 반대로, 이제 차동 시간 정보는 tDrcDelta_A4 = t_A4 + drcFrameSize - t_B0에 따라, 즉, 오프셋을 포함하여 컴퓨팅된다. 유사하게, 노드 의 경우, tDrcDelta_A5 = t_A5 + drcFrameSize - t_A4 - drcFrameSize를 획득하고, 이는 명백하게 tDrcDelta_A5 = t_A5 - t_A4와 동일하다. 이러한 차동 시간 값들은, 예를 들어, 표 1 또는 표 2에 따른 정확한 허프만 테이블의 대응하는 코드 워드 엔트리를 이용하여 인코딩된다.
일시적 위치 정보를 디코딩하기 위한 방법은 다음과 같이 요약될 수 있다. 디코더는, 비트스트림으로부터의 대응하는 코드 워드에 기초하여 노드의 시간 차이 정보를 추출한다. 시간 정보는, 시간 차이 정보를 이전 노드의 시간 정보에 추가함으로써 획득된다. 결과적 샘플 위치가 보다 크면, 디코더는, 현재의 노드가 이전 프레임의 마지막 노드인 것처럼 프로세싱되어야 하는 것, 즉, 이전 프레임에서 디코딩되는 노드들에 첨부되어야 하는 것을 인식한다. 정확한 샘플 위치는, 오프셋 값 drcFrameSize를 디코딩된 시간 값으로부터 감산함으로써 결정된다. 디코딩된 프레임에서 더 많은 시프트된 노드들이 발생하면, 동일한 프로세싱 단계들이 유사한 방식으로 적용된다.
프레임 전체의 시간 정보를 디코딩 및 정정한 후, 디코더는, 얼마나 많은 노드들이 이전 프레임에 대해 뒤로 시프트되었는지, 및 이들이 이전 프레임 내에서 어느 샘플 위치 상에 위치되는지를 (이러한 정보를 인코더에서 명시적으로 제공함이 없이도) 인식한다. 시프트된 노드들의 수에 대한 정보는, 아래에서 설명되는 디코딩 이득 및 기울기 정보의 상황에서 추가로 활용될 것이다.
도 7은, 본 발명에 따른 이득 정보의 코딩을 개략도에서 예시한다.
본 발명의 선호되는 실시예에 따르면, 기준 동적 범위 제어 프레임 DFR에 후속하는 동적 범위 제어 프레임 DFS에 대응하는 비트스트림 부분 DFS'의 제 1 위치에 있는 시프트된 노드 B1의 비트 표현 B'1의 이득 정보 GB1은 절대적 이득 값 g_B1에 의해 표현되고, 여기서 기준 동적 범위 제어 프레임 DFR에 후속하는 동적 범위 제어 프레임 DFS에 대응하는 비트 스트림 부분 DFS'의 제 1 위치에 있는 노드 B1의 비트 표현 B'1 이후의 위치에 있는 시프트된 노드들 B2의 각각의 비트 표현 B'2의 이득 정보 GB2는, 각각의 시프트된 노드 B2의 비트 표현 B'2의 이득 값 g_B2와 각각의 노드 B2의 비트 표현 B'2에 선행하는 노드 B1의 비트 표현 B'1의 이득 값 g_B1과의 차이와 동일한 상대적 이득 값에 의해 표현된다.
본 발명의 선호되는 실시예에 따르면, 기준 동적 범위 제어 프레임 DFR의 하나 이상의 시프트된 노드들 B1, B2의 비트 표현들 B'1, B'2가, 기준 동적 범위 제어 프레임 DFR에 후속하는 동적 범위 제어 프레임 DFS에 대응하는 비트스트림 부분 DFS'에서 임베딩되는 경우, 하나 이상의 시프트된 노드들 B1, B2의 비트 표현들 B'1, B'2의 하나 이상의 위치들 이후 기준 동적 범위 제어 프레임 DFR에 후속하는 동적 범위 제어 프레임 DFS에 대응하는 비트스트림 부분 DFS'의 제 1 위치에 있는 후속하는 동적 범위 제어 프레임 DFS의 노드 C0의 비트 표현 C'0의 이득 정보 GC0은, 각각의 노드 C0의 비트 표현 C'0의 이득 값 g_C0과 각각의 노드 C0의 비트 표현 C'0에 선행하는 시프트된 노드 B2의 비트 표현 B'2의 이득 값 g_B2와의 차이와 동일한 상대적 이득 값에 의해 표현된다.
도 7에서, 노드들의 상들에 대한 이득 차이들을 결정하기 위한 상황은 도 5에 따른 예에 대해 도시되고, 여기서 g_Ai는 노드 Ai의 이득 값을 표시한다.
먼저, 노드 A4에 대한 차동 이득 값들이 고려된다. 도 7의 좌측에 도시된 노드 저장이 없는 접근법의 경우, 차동 이득 값 이득 Delta_A4는 선행 노드 A3과 노드 A4의 이득 값의 차이(dB 단위)로부터 컴퓨팅되어, 즉, gainDelta_A4 = g_A4 - g_A3이다. 그 다음, 이러한 차동 이득 값은, 적절한 허프만 테이블의 대응하는 엔트리를 이용하여 인코딩된다. 또한, 도 7의 좌측의 프레임 n+1의 제 1 노드를 고려한다. B0이 그 프레임의 제 1 노드이기 때문에, 그 이득 값은 차동 방식으로 인코딩되는 것이 아니라 초기 이득 값들 gainInitial의 특정 코딩에 따라 인코딩되어, 즉, 이득 값은 그의 실제 값으로서 인코딩된다: gainDelta_B0 = g_B0.
노드 A4가 다음 프레임 n+1로 시프트된 우측에 도시된 상황의 경우, 인코딩된 이득 정보의 값들은 상이하다. 볼 수 있는 바와 같이, 시프트된 후 노드 A4는 이득 차이들을 인코딩하는 것에 대해 프레임 n+1의 제 1 노드가 된다. 따라서, 그 이득 값은 차동 방식으로 인코딩되는 것이 아니라, 초기 이득 값들의 특정 코딩이 앞서 설명된 바와 같이 적용된다. A5의 차동 이득 값은 좌측 및 우측에 도시된 상황들 둘 모두에 대해 동일하게 유지될 것이다. 이제, 노드 저장소가 이용되면 노드 B0이 노드 A5에 후속하기 때문에, 그 이득 정보는 노드 B0 및 A5의 이득들의 차이로부터 결정될 것이어서, 즉, gainDelta_B0 = g_B0 - g_A5이다. 노드 저장소 기술을 적용하는 경우 오직 이득 차이들이 결정되는 방법만이 변경되는 한편, 이득들의 재구성된 값들은 각각의 노드에 대해 동일하게 유지됨을 주목한다. 분명하게, 프레임들 nn+1의 전체 이득 관련 정보를 디코딩한 후, 노드들 A0 내지 B0에 대해 획득된 이득 값들은 좌측에서 획득된 값과 동일하고, 노드들은 대응하는 오디오 프레임에의 DRC 이득들의 적용에 대해 "적절히" 컴퓨팅될 수 있다.
이전 문단에서 논의된 바와 같이, 시프트된 노드들의 수 및 이전 프레임 내에서 이들의 샘플 위치는, 시간 차이 정보를 디코딩한 후 인식된다 도 6의 우측에 예시된 바와 같이, 프레임 n으로부터 시프트된 노드들의 이득 값들은 프레임 n+1의 수신된 이득 정보의 시작으로부터 즉시 시작한다. 따라서, 시프트된 노드들의 수에 대한 정보는, 디코더가 각각의 이득 값을 정확한 프레임 내의 정확한 샘플 위치에 할당하기에 충분하다. 도 6의 우측에 도시된 예를 고려하면, 디코더는, 프레임 의 처음 2개의 디코딩된 이득 값들이 이전 프레임의 마지막 이득 값들에 첨부되어야 하는 한편, 제 3 이득 값이 현재 프레임의 제 1 노드의 정확한 이득 값에 대응하는 것임을 인식한다.
도 8은, 본 발명에 따른 기울기 정보의 코딩을 개략도에서 예시한다.
본 발명의 선호되는 실시예에 따르면, 하나 이상의 노드들의 각각의 노드 A0 ... A5; B0 ... B2; C0은 A0 ... A5; B0 ... B2; C0의 기울기 정보 SA0 ... SA5; SB0 ... SB2; SC0을 포함한다.
다음으로, 도 8에 예시되는 기울기 정보의 코딩이 고려된다. 노드들의 기울기 정보는 노드들의 쌍들 사이에서 차동 방식으로 인코딩되는 것이 아니라 각각의 노드에 대해 독립적으로 인코딩된다. 따라서, 기울기 관련 정보는, 노드 저장소를 이용하는 경우 및 이용하지 않는 경우 둘 모두에서 불변으로 유지된다. 이득 값들의 코딩의 경우에서와 같이, 기울기 정보에 대한 코드 워드들을 생성하기 위한 허프만 테이블들은, 제안된 노드 시프팅을 이용하는 경우 및 이용하지 않는 경우 둘 모두에서 동일하게 유지된다. 기울기 정보의, 정확한 프레임 내의 정확한 샘플 위치에의 할당은, 이득 값들의 디코딩의 경우와 유사하게 수행된다.
프레임 n+1에 대해 수신된 모든 노드들의 정보가 디코딩된 후 그리고 가능한 경우 선행 프레임 n으로 다시 시프트된 후, 스플라인 또는 선형 보간을 이용하는 프레임 n에 대한 이득 보간은 통상적인 방식으로 이용될 수 있고, 이득 값들은 대응하는 오디오 프레임에 적용된다.
도 9는, 본 발명에 따른 오디오 디코더 디바이스의 실시예를 개략도에서 예시한다. 오디오 디코더 디바이스(4)는,
연속적인 오디오 프레임들 AFP, AFR, AFS를 포함하는 오디오 신호 AS를 재생성하기 위해, 인코딩된 오디오 비트스트림 ABS를 디코딩하기 위해 구성되는 오디오 디코더(5);
오디오 신호 AS에 대응하고 연속적인 동적 범위 제어 프레임들 DFP, DFR, DFS을 포함하는 동적 범위 제어 시퀀스 DS를 재생성하기 위해, 인코딩된 동적 범위 제어 비트스트림 DBS를 디코딩하기 위해 구성되는 동적 범위 제어 디코더(6)를 포함하고;
인코딩된 동적 범위 제어 비트스트림 DBS는 동적 범위 제어 프레임들의 각각의 동적 범위 제어 프레임 DFP, DFR, DFS에 대해 대응하는 비트스트림 부분 DFP', DFR', DFS'을 포함하고;
인코딩된 동적 범위 제어 비트스트림 DBS는 노드들 A0 ... A5; B0 ... B2; C0의 비트 표현들 A'0 ... A'5; B'0 ... B'2; C'0을 포함하고, 노드들 중 하나의 노드의 각각의 비트 표현은, 오디오 신호 AS에 대한 이득 정보 GA0 ... GA5; GB0 ... GB2; GC0 및 이득 정보 GA0 ... GA5; GB0 ... GB2; GC0이 어느 시점에 대응하는지를 표시하는 시간 정보 TA0 ... TA5; TB0 ... TB2; TC0을 포함하고;
인코딩된 동적 범위 제어 비트 스트림 DBS는, 하나의 기준 동적 범위 제어 프레임 DFR에 후속하는 동적 범위 제어 프레임 DFS에 대응하는 비트스트림 부분에 임베딩되는 동적 범위 제어 프레임들 DFP, DFR, DFS의 하나의 기준 동적 범위 제어 프레임 DFR의 노드들 B0 ... B2로부터 선택되는 시프트된 노드들 B1, B2의 비트 표현들 B'1, B'2를 포함하고, 동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 기준 동적 범위 제어 프레임 DFR의 노드들 B0 ... B2 중 각각의 나머지 노드 B0의 비트 표현 B'0은 하나의 기준 동적 범위 제어 프레임 DFR에 대응하는 비트스트림 부분 DFR'에 임베딩되고;
동적 범위 제어 디코더(6)는, 동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 기준 동적 범위 제어 프레임 DFR의 각각의 나머지 노드 B0을 재생성하기 위해, 동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 기준 동적 범위 제어 프레임 DFR의 나머지 노드들 B'0의 각각의 나머지 노드 B0의 비트 표현 B'0을 디코딩하고, 동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 기준 동적 범위 제어 프레임 DFR의 노드들로부터 선택된 시프트된 노드들 B1, B2의 각각의 시프트된 노드 B1, B2를 재생성하기 위해, 동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 기준 동적 범위 제어 프레임 DFR의 노드들 B0 ... B2로부터 선택된 시프트된 노드들 B1, B2의 각각의 시프트된 노드 B1, B2의 비트 표현 B'1, B'2를 디코딩하고, 기준 동적 범위 제어 프레임 DFR을 재생성하기 위해, 재생성된 나머지 노드들 B0 및 재생성된 시프트된 노드들 B1, B2를 결합하기 위해 구성된다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 디코더(6)는 시간 정보 TA4, TA5; TB1, TB2를 이용함으로써 하나 이상의 시프트된 노드들 A4, A5; B1, B2를 식별하기 위해 구성된다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 디코더(6)는, 각각의 노드 A4, A5; B1, B2가 속하는 동적 범위 제어 프레임 DFP; DFR의 시작부터, 각각의 노드 A4, A5; B1, B2가 속하는 동적 범위 제어 프레임 DFP; DFR 내의 각각의 노드 A4, A5; B1, B2의 일시적 위치까지의 시간 차이 t_A4, t_A5; t_B1, t_B2와, 각각의 동적 범위 제어 프레임 DFP; DFR에 후속하는 동적 범위 제어 프레임 DFR; DFS의 일시적 크기보다 크거나 그와 동일한 오프셋 값 drcFrameSize와의 합에 의해 표현되는 하나 이상의 시프트된 노드들 A4, A5; B1, B2의 시간 정보 TA4, TA5; TB1, TB2를 디코딩하기 위해 구성된다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 디코더(6)는, 시프트된 노드 B1의 비트 표현 B'1의 이득 정보 GB1을 디코딩하기 위해 구성되고, 기준 동적 범위 제어 프레임 DFR에 후속하는 동적 범위 제어 프레임 DFS에 대응하는 비트스트림 부분 DFS'의 제 1 위치에 있는 시프트된 노드 B1의 비트 표현 B'1의 이득 정보 GB1은 절대적 이득 값 g_B1에 의해 표현되고, 여기서 기준 동적 범위 제어 프레임 DFR에 후속하는 동적 범위 제어 프레임 DFS에 대응하는 비트 스트림 부분 DFS'의 제 1 위치에 있는 노드 B1의 비트 표현 B'1 이후의 위치에 있는 시프트된 노드들 B2의 각각의 비트 표현 B'2의 이득 정보 GB2는, 각각의 시프트된 노드 B2의 비트 표현 B'2의 이득 값 g_B2와 각각의 노드 B2의 비트 표현 B'2에 선행하는 노드 B1의 비트 표현 B'1의 이득 값 g_B1과의 차이와 동일한 상대적 이득 값에 의해 표현된다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 디코더(6)는, 하나 이상의 시프트된 노드들 B1, B2의 비트 표현들 B'1, B'2의 하나 이상의 위치들이, 각각의 노드 C0의 비트 표현 C'0의 이득 값 g_C0과, 각각의 노드 C0의 비트 표현 C'0에 선행하는 시프트된 노드 B2의 비트 표현 B'2의 이득 값 g_B2와의 차이와 동일한 상대적 이득 값에 의해 표현된 후, 기준 동적 범위 제어 프레임 DFR에 후속하는 동적 범위 제어 프레임 DFS에 대응하는 비트스트림 부분 DFS'의 제 1 위치에 있는 후속하는 동적 범위 제어 프레임 DFS의 노드 C0의 비트 표현 C'0의 이득 정보 GC0을 디코딩하기 위해 구성된다.
본 발명의 선호되는 실시예에 따르면, 오디오 프레임들 AFP, AFR, AFS의 일시적 크기는 동적 범위 제어 프레임들 AFP, AFR, AFS의 일시적 크기와 동일하다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 하나 이상의 노드들 A0 ... A5; B0 ... B2; C0은 균일한 시간 그리드로부터 선택된다.
본 발명의 선호되는 실시예에 따르면, 하나 이상의 노드들 A0 ... A5; B0 ... B2; C0의 각각의 노드 A0 ... A5; B0 ... B2; C0은 기울기 정보 SA0 ... SA5; SB0 ... SB2; SC0을 포함한다.
본 발명의 선호되는 실시예에 따르면, 동적 범위 제어 인코더(6)는 엔트로피 인코딩 기술을 이용하여 노드들 A'0 ... A'5; B'0 ... B'2; C'0의 비트 표현들을 디코딩하기 위해 구성된다.
다른 양상에서, 본 발명은, 오디오 디코더를 동작시키기 위한 방법을 추가로 제공하고, 이 방법은,
연속적인 오디오 프레임들 AFP, AFR, AFS를 포함하는 오디오 신호 AS를 재생성하기 위해, 인코딩된 오디오 비트스트림 ABS를 디코딩하는 단계;
오디오 신호 AS에 대응하고 연속적인 동적 범위 제어 프레임들 DFP, DFR, DFS을 포함하는 동적 범위 제어 시퀀스 DS를 재생성하기 위해, 인코딩된 동적 범위 제어 비트스트림 DBS를 디코딩하는 단계를 포함하고;
인코딩된 동적 범위 제어 비트스트림 DBS는 동적 범위 제어 프레임들의 각각의 동적 범위 제어 프레임 DFP, DFR, DFS에 대해 대응하는 비트스트림 부분 DFP', DFR', DFS'을 포함하고;
인코딩된 동적 범위 제어 비트스트림 DBS는 노드들 A0 ... A5; B0 ... B2; C0의 비트 표현들 A'0 ... A'5; B'0 ... B'2; C'0을 포함하고, 노드들 중 하나의 노드의 각각의 비트 표현은, 오디오 신호 AS에 대한 이득 정보 GA0 ... GA5; GB0 ... GB2; GC0 및 이득 정보 GA0 ... GA5; GB0 ... GB2; GC0이 어느 시점에 대응하는지를 표시하는 시간 정보 TA0 ... TA5; TB0 ... TB2; TC0을 포함하고;
인코딩된 동적 범위 제어 비트 스트림 DBS는, 하나의 기준 동적 범위 제어 프레임 DFR에 후속하는 동적 범위 제어 프레임 DFS에 대응하는 비트스트림 부분에 임베딩되는 동적 범위 제어 프레임들 DFP, DFR, DFS의 하나의 기준 동적 범위 제어 프레임 DFR의 노드들 B0 ... B2로부터 선택되는 시프트된 노드들 B1, B2의 비트 표현들 B'1, B'2를 포함하고, 동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 기준 동적 범위 제어 프레임 DFR의 노드들 B0 ... B2 중 각각의 나머지 노드 B0의 비트 표현 B'0은 하나의 기준 동적 범위 제어 프레임 DFR에 대응하는 비트스트림 부분 DFR'에 임베딩되고;
동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 기준 동적 범위 제어 프레임 DFR의 나머지 노드들 B'0의 각각의 나머지 노드 B0의 비트 표현 B'0은, 동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 기준 동적 범위 제어 프레임 DFR의 각각의 나머지 노드 B0을 재생성하기 위해, 디코딩되고;
동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 기준 동적 범위 제어 프레임 DFR의 노드들 B0 ... B2로부터 선택된 시프트된 노드들 B1, B2의 각각의 시프트된 노드 B1, B2의 비트 표현 B'1, B'2는, 동적 범위 제어 프레임들 DFP, DFR, DFS 중 하나의 기준 동적 범위 제어 프레임 DFR의 노드들로부터 선택된 시프트된 노드들 B1, B2의 각각의 시프트된 노드 B1, B2를 재생성하기 위해 디코딩되고;
재생성된 나머지 노드들 B0 및 재생성된 시프트된 노드들 B1, B2는, 기준 동적 범위 제어 프레임 DFR을 재생성하기 위해 결합된다.
설명된 실시예들의 디코더, 인코더 및 방법들에 있어서, 다음 내용이 언급될 것이다.
일부 양상들은 장치의 상황에서 설명되었지만, 이러한 양상들은 또한 대응하는 방법의 설명을 표현하는 것이 명백하며, 여기서 블록 또는 디바이스는 방법 단계 또는 방법 단계의 특징에 대응한다. 유사하게, 방법의 상황에서 설명되는 양상들은 또한 대응하는 장치의 블록 또는 아이템 또는 특징의 설명을 표현한다.
특정한 구현 요건들에 따라, 본 발명의 실시예들은 하드웨어 또는 소프트웨어로 구현될 수 있다. 구현은, 각각의 방법이 수행되도록 프로그래밍가능 컴퓨터 시스템과 협력하는(또는 협력할 수 있는), 전자적으로 판독가능한 제어 신호들을 저장하는 디지털 저장 매체, 예를 들어, 플로피 디스크, DVD, CD, ROM, PROM, EPROM, EEPROM 또는 FLASH 메모리를 이용하여 수행될 수 있다.
본 발명에 따른 일부 실시예들은, 본원에서 설명되는 방법들 중 하나가 수행되도록 프로그래밍가능 컴퓨터 시스템과 협력할 수 있는, 전자적으로 판독가능한 제어 신호들을 갖는 데이터 캐리어를 포함한다.
일반적으로, 본 발명의 실시예들은 프로그램 코드를 갖는 컴퓨터 프로그램 물건으로서 구현될 수 있고, 프로그램 코드는, 컴퓨터 프로그램 물건이 컴퓨터 상에서 실행되는 경우 본 방법들 중 하나를 수행하도록 동작한다. 프로그램 코드는 예를 들어, 머신-판독가능 캐리어 상에 저장될 수 있다.
다른 실시예들은, 본원에서 설명되는 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함하고, 컴퓨터 프로그램은 머신 판독가능 캐리어 또는 비일시적 저장 매체 상에 저장된다.
따라서, 달리 말하면, 창작적 방법의 일 실시예는, 컴퓨터 프로그램이 컴퓨터 상에서 실행되는 경우, 본원에서 설명되는 방법들 중 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.
따라서, 창작적 방법들의 추가적인 실시예는, 본원에서 설명되는 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램이 포함되고 기록되는 데이터 캐리어(예를 들어, 디지털 저장 매체 또는 컴퓨터 판독가능 매체)이다.
따라서, 창작적 방법의 추가적인 실시예는, 본원에서 설명되는 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 표현하는 신호들의 시퀀스 또는 데이터 스트림이다. 예를 들어, 신호들의 시퀀스 또는 데이터 스트림은, 예를 들어, 인터넷을 통해, 데이터 통신 접속을 통해 전송되도록 구성될 수 있다.
추가적인 실시예는, 본원에서 설명되는 방법들 중 하나를 수행하도록 구성 또는 적응되는 프로세싱 수단, 예를 들어, 컴퓨터 또는 프로그래밍가능 로직 디바이스를 포함한다.
추가적인 실시예는, 본원에서 설명되는 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램이 설치된 컴퓨터를 포함한다.
일부 실시예들에서, 프로그래밍가능 로직 디바이스(예를 들어, 필드 프로그래밍가능 게이트 어레이)는 본원에서 설명되는 방법들의 기능들 중 일부 또는 전부를 수행하기 위해 이용될 수 있다. 일부 실시예들에서, 필드 프로그래밍가능 게이트 어레이는, 본원에서 정의되는 방법들 중 하나를 수행하기 위해 마이크로프로세서와 협력할 수 있다. 일반적으로, 방법들은 임의의 하드웨어 장치에 의해 유리하게 수행된다.
본 발명은 몇몇 실시예들의 관점에서 설명되었지만, 본 발명의 범주에 속하는 변화들, 치환들 및 균등물들이 존재한다. 본 발명의 방법들 및 조성들을 구현하는 많은 대안적 방식들이 존재함을 또한 주목해야 한다. 따라서, 하기 첨부된 청구항들은 모든 이러한 변화들, 치환들 및 균등물들을 포함하는 것으로 그리고 본 발명의 진정한 사상 및 범주 내에 속하는 것으로 해석되어야 하는 것으로 의도된다.
참조 부호들:
1 오디오 인코더 디바이스
2 오디오 인코더
3 동적 범위 제어 인코더
4 오디오 디코더 디바이스
5 오디오 디코더
6 동적 범위 제어 디코더
ABS 인코딩된 오디오 비트스트림
AS 오디오 신호
AFP 선행 오디오 프레임
AFR 기준 오디오 프레임
AFS 후속 오디오 프레임
DBS 인코딩된 동적 범위 제어 비트스트림
DS 동적 범위 제어 시퀀스
DFP 선행 동적 범위 제어 프레임
DFR 기준 동적 범위 제어 프레임
DFS 후속 동적 범위 제어 프레임
A0 ... A5 선행 동적 범위 제어 프레임의 노드들
B0 ... B2 기준 동적 범위 제어 프레임의 노드들
C0 후속 동적 범위 제어 프레임의 노드
DFP' 선행 동적 범위 제어 프레임에 대응하는 비트 스트림 부분
DFR' 기준 동적 범위 제어 프레임에 대응하는 비트 스트림 부분
DFS' 후속 동적 범위 제어 프레임에 대응하는 비트 스트림 부분
TA0 ... TA5 선행 동적 범위 제어 프레임의 노드들의 시간 정보
TB0 ... TB2 기준 동적 범위 제어 프레임의 노드들의 시간 정보
TC0 후속 동적 범위 제어 프레임의 노드의 시간 정보
t_A0 ... t_A5 선행 동적 범위 제어 프레임의 노드들의 시간 차이
t_B0 ... t_B2 기준 동적 범위 제어 프레임의 노드들의 시간 차이
t_C0 후속 동적 범위 제어 프레임의 노드의 시간 차이
GA0 ... GA5 선행 동적 범위 제어 프레임의 노드들의 이득 정보
GB0 ... GB2 기준 동적 범위 제어 프레임의 노드들의 이득 정보
GC0 후속 동적 범위 제어 프레임의 노드의 이득
g_A0 ... g_A5 선행 동적 범위 제어 프레임의 노드들의 이득 값
g_B0 ... g_B2 기준 동적 범위 제어 프레임의 노드들의 이득 값
g_C0 후속 동적 범위 제어 프레임의 노드의 이득 값
SA0 ... SA5 선행 동적 범위 제어 프레임의 노드들의 기울기 정보
SB0 ... SB2 기준 동적 범위 제어 프레임의 노드들의 기울기 정보
SC0 후속 동적 범위 제어 프레임의 노드의 기울기 정보
참조문헌들:
[1] D. Giannoulis, M. Massberg, J. D. Reiss, "Digital Dynamic Range Compressor Design - A Tutorial and Analysis" J. Audio Engineering Society, Vol. 60, No. 6, June 2012. in

Claims (25)

  1. 오디오 인코더 디바이스로서,
    연속적인 오디오 프레임들(AFP, AFR, AFS)을 포함하는 오디오 신호(AS)로부터 인코딩된 오디오 비트스트림(ABS)을 생성하기 위해 구성되는 오디오 인코더(2);
    상기 오디오 신호(AS)에 대응하고 연속적인 동적 범위 제어 프레임들(DFP, DFR, DFS)을 포함하는 동적 범위 제어 시퀀스(DS)로부터 인코딩된 동적 범위 제어 비트스트림(DBS)을 생성하기 위해 구성되는 동적 범위 제어 인코더(3)를 포함하고,
    상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 각각의 동적 범위 제어 프레임(DFP, DFR, DFS)은 하나 이상의 노드들(A0 ... A5; B0 ... B2; C0)을 포함하고, 상기 하나 이상의 노드들(A0 ... A5; B0 ... B2; C0)의 각각의 노드는, 상기 오디오 신호 AS에 대한 이득 정보(GA0 ... GA5; GB0 ... GB2; GC0) 및 상기 이득 정보(GA0 ... GA5; GB0 ... GB2; GC0)가 어느 시점에 대응하는지 표시하는 시간 정보(TA0 ... TA5; TB0 ... TB2; TC0)를 포함하고;
    상기 동적 범위 제어 인코더(3)는, 상기 인코딩된 동적 범위 제어 비트스트림(DBS)이 상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 각각의 동적 범위 제어 프레임(DFP, DFR, DFS)에 대해 대응하는 비트스트림 부분(DFP', DFR', DFS')을 포함하는 방식으로 구성되고;
    상기 동적 범위 제어 인코더(2)는 시프트 절차를 실행하기 위해 구성되고, 상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 하나의 기준 동적 범위 제어 프레임(DFR)의 노드들(B0 ... B2) 중 하나 이상의 노드들(B1, B2)은 시프트된 노드들(B1, B2)로서 선택되고, 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 하나 이상의 시프트된 노드들 (B1, B2) 각각의 비트 표현(B'1, B'2)은 상기 하나의 기준 동적 범위 제어 프레임(DFR)에 후속하는 상기 동적 범위 제어 프레임(DFS)에 대응하는 비트스트림 부분(DFS')에 임베딩되고, 상기 동적 범위 제어 프레임들(DFP, DFR, DFS) 중 상기 하나의 기준 동적 범위 제어 프레임 (DFR)의 노드들(B0 ... B2) 중 각각의 나머지 노드(B0)의 비트 표현(B'0)은 상기 하나의 기준 동적 범위 제어 프레임(DFR)에 대응하는 비트스트림 부분(DFR')에 임베딩되는,
    오디오 인코더 디바이스.
  2. 제 1 항에 있어서,
    상기 기준 동적 범위 제어 프레임의 노드들의 수가 미리 정의된 임계 값보다 큰 경우 시프트 절차가 개시되는,
    오디오 인코더 디바이스.
  3. 제 1 항에 있어서,
    상기 기준 동적 범위 제어 프레임의 노드들의 수와, 상기 기준 동적 범위 제어 프레임에 대응하는 비트스트림 부분에 임베딩되는, 상기 기준 동적 범위 제어 프레임에 선행하는 상기 동적 범위 제어 프레임으로부터 시프트된 노드들의 수의 합이 미리 정의된 임계 값보다 큰 경우 상기 시프트 절차가 개시되는,
    오디오 인코더 디바이스.
  4. 제 1 항에 있어서,
    상기 기준 동적 범위 제어 프레임(DFR)의 노드들(B0 ... B2)의 수와, 상기 기준 동적 범위 제어 프레임(DFR)에 대응하는 비트스트림 부분(DFR')에 임베딩되는, 상기 기준 동적 범위 제어 프레임(DFR)에 선행하는 상기 동적 범위 제어 프레임(DFP)으로부터 시프트된 노드들의 수(A4, A5)의 합이, 상기 기준 동적 범위 제어 프레임(DFR)에 후속하는 상기 동적 범위 제어 프레임(DFS)의 노드들(C0)의 수보다 큰 경우 상기 시프트 절차가 개시되는,
    오디오 인코더 디바이스.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    상기 하나 이상의 노드들(A0 ... A5; B0 ... B2; C0)의 시간 정보(TA0 ... TA5; TB0 ... TB2; TC0)는, 상기 하나 이상의 시프트된 노드들(A4, A5; B1, B2)이 상기 시간 정보(TA4, TA5; TB1, TB2)를 이용함으로써 식별될 수 있는 방식으로 표현되는,
    오디오 인코더 디바이스.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
    상기 하나 이상의 시프트된 노드들(A4, A5; B1, B2)의 상기 시간 정보(TA4, TA5; TB1, TB2)는, 각각의 노드(A4, A5; B1, B2)가 속하는 상기 동적 범위 제어 프레임(DFP; DFR)의 시작부터, 상기 각각의 노드(A4, A5; B1, B2)가 속하는 상기 동적 범위 제어 프레임(DFP; DFR) 내의 각각의 노드(A4, A5; B1, B2)의 일시적 위치까지의 시간 차이(t_A4, t_A5; t_B1, t_B2)와, 상기 각각의 동적 범위 제어 프레임(DFP; DFR)에 후속하는 상기 동적 범위 제어 프레임(DFR; DFS)의 일시적 크기보다 크거나 그와 동일한 오프셋 값(drcFrameSize)과의 합에 의해 표현되는,
    오디오 인코더 디바이스.
  7. 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
    상기 기준 동적 범위 제어 프레임(DFR)에 후속하는 상기 동적 범위 제어 프레임(DFS)에 대응하는 비트스트림 부분(DFS')의 제 1 위치에 있는 상기 시프트된 노드(B1)의 비트 표현(B'1)의 이득 정보(GB1)는 절대적 이득 값(g_B1)에 의해 표현되고, 상기 기준 동적 범위 제어 프레임(DFR)에 후속하는 상기 동적 범위 제어 프레임(DFS)에 대응하는 비트 스트림 부분(DFS')의 제 1 위치에 있는 상기 노드(B1)의 비트 표현(B'1) 이후의 위치에 있는 시프트된 노드들(B2)의 각각의 비트 표현(B'2)의 이득 정보(GB2)는, 각각의 시프트된 노드(B2)의 비트 표현(B'2)의 이득 값(g_B2)과 각각의 노드(B2)의 비트 표현(B'2)에 선행하는 상기 노드(B1)의 비트 표현(B'1)의 이득 값(g_B1)과의 차이와 동일한 상대적 이득 값에 의해 표현되는,
    오디오 인코더 디바이스.
  8. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
    상기 기준 동적 범위 제어 프레임(DFR)의 하나 이상의 시프트된 노드들(B1, B2)의 비트 표현들(B'1, B'2)이, 상기 기준 동적 범위 제어 프레임(DFR)에 후속하는 상기 동적 범위 제어 프레임(DFS)에 대응하는 비트스트림 부분(DFS')에서 임베딩되는 경우, 상기 하나 이상의 시프트된 노드들(B1, B2)의 비트 표현들(B'1, B'2)의 하나 이상의 위치들 이후 상기 기준 동적 범위 제어 프레임(DFR)에 후속하는 상기 동적 범위 제어 프레임(DFS)에 대응하는 비트스트림 부분(DFS')의 제 1 위치에 있는 상기 후속하는 동적 범위 제어 프레임(DFS)의 노드(C0)의 비트 표현(C'0)의 이득 정보(GC0)는, 각각의 노드(C0)의 비트 표현(C'0)의 이득 값(g_C0)과 상기 각각의 노드(C0)의 비트 표현(C'0)에 선행하는 시프트된 노드(B2)의 비트 표현(B'2)의 이득 값(g_B2)과의 차이와 동일한 상대적 이득 값에 의해 표현되는,
    오디오 인코더 디바이스.
  9. 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 오디오 프레임들(AFP, AFR, AFS)의 일시적 크기는 동적 범위 제어 프레임들(DFP, DFR, DFS)의 일시적 크기와 동일한,
    오디오 인코더 디바이스.
  10. 제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
    상기 동적 범위 제어 프레임(DFP, DFR, DFS) 중 하나의 하나 이상의 노드들(A0 ... A5; B0 ... B2; C0)은 균일한 시간 그리드로부터 선택되는,
    오디오 인코더 디바이스.
  11. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 하나 이상의 노드들의 각각의 노드(A0 ... A5; B0 ... B2; C0)는 (A0 ... A5; B0 ... B2; C0)의 기울기 정보(SA0 ... SA5; SB0 ... SB2; SC0)를 포함하는,
    오디오 인코더 디바이스.
  12. 제 1 항 내지 제 11 항 중 어느 한 항에 있어서,
    상기 동적 범위 제어 인코더(3)는 엔트로피 인코딩 기술을 이용하여 상기 노드들(A0 ... A5; B0 ... B2; C0)을 인코딩하기 위해 구성되는
    오디오 인코더 디바이스.
  13. 오디오 디코더 디바이스로서,
    연속적인 오디오 프레임들(AFP, AFR, AFS)을 포함하는 오디오 신호(AS)를 재생성하기 위해, 인코딩된 오디오 비트스트림(ABS)을 디코딩하기 위해 구성되는 오디오 디코더(5);
    상기 오디오 신호(AS)에 대응하고 연속적인 동적 범위 제어 프레임들(DFP, DFR, DFS)을 포함하는 동적 범위 제어 시퀀스(DS)를 재생성하기 위해, 인코딩된 동적 범위 제어 비트스트림(DBS)을 디코딩하기 위해 구성되는 동적 범위 제어 디코더(6)를 포함하고;
    상기 인코딩된 동적 범위 제어 비트스트림(DBS)은 상기 동적 범위 제어 프레임들의 각각의 동적 범위 제어 프레임(DFP, DFR, DFS)에 대해 대응하는 비트스트림 부분(DFP', DFR', DFS')을 포함하고;
    상기 인코딩된 동적 범위 제어 비트스트림(DBS)은 노드들(A0 ... A5; B0 ... B2; C0)의 비트 표현들(A'0 ... A'5; B'0 ... B'2; C'0)을 포함하고, 상기 노드들 중 하나의 노드의 각각의 비트 표현은, 상기 오디오 신호(AS)에 대한 이득 정보(GA0 ... GA5; GB0 ... GB2; GC0) 및 상기 이득 정보(GA0 ... GA5; GB0 ... GB2; GC0)가 어느 시점에 대응하는지를 표시하는 시간 정보(TA0 ... TA5; TB0 ... TB2; TC0)를 포함하고;
    상기 인코딩된 동적 범위 제어 비트 스트림(DBS)은, 상기 하나의 기준 동적 범위 제어 프레임(DFR)에 후속하는 상기 동적 범위 제어 프레임(DFS)에 대응하는 비트스트림 부분에 임베딩되는 상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 노드들(B0 ... B2)로부터 선택되는 시프트된 노드들(B1, B2)의 비트 표현들(B'1 , B'2)을 포함하고, 상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 노드들(B0 ... B2) 중 각각의 나머지 노드(B0)의 비트 표현(B'0)은 상기 하나의 기준 동적 범위 제어 프레임(DFR)에 대응하는 비트스트림 부분(DFR')에 임베딩되고;
    상기 동적 범위 제어 디코더(6)는, 상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 각각의 나머지 노드(B0)를 재생성하기 위해, 상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 나머지 노드들(B'0)의 각각의 나머지 노드(B0)의 비트 표현(B'0)을 디코딩하고, 상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 노드들로부터 선택된 시프트된 노드들(B1, B2)의 각각의 시프트된 노드(B1, B2)를 재생성하기 위해, 상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 노드들(B0 ... B2)로부터 선택된 시프트된 노드들(B1, B2)의 각각의 시프트된 노드(B1, B2)의 비트 표현(B'1, B'2)을 디코딩하고, 상기 기준 동적 범위 제어 프레임(DFR)을 재생성하기 위해, 상기 재생성된 나머지 노드들(B0) 및 상기 재생성된 시프트된 노드들(B1, B2)을 결합하기 위해 구성되는,
    오디오 디코더 디바이스.
  14. 제 13 항에 있어서,
    상기 동적 범위 제어 디코더(6)는 상기 시간 정보(TA4, TA5; TB1, TB2)를 이용함으로써 하나 이상의 시프트된 노드들(A4, A5; B1, B2)을 식별하기 위해 구성되는
    오디오 디코더 디바이스.
  15. 제 13 항 또는 제 14 항에 있어서,
    상기 동적 범위 제어 디코더(6)는, 각각의 노드(A4, A5; B1, B2)가 속하는 상기 동적 범위 제어 프레임(DFP; DFR)의 시작부터, 상기 각각의 노드(A4, A5; B1, B2)가 속하는 상기 동적 범위 제어 프레임(DFP; DFR) 내의 각각의 노드(A4, A5; B1, B2)의 일시적 위치까지의 시간 차이(t_A4, t_A5; t_B1, t_B2)와, 상기 각각의 동적 범위 제어 프레임(DFP; DFR)에 후속하는 동적 범위 제어 프레임(DFR; DFS)의 일시적 크기보다 크거나 그와 동일한 오프셋 값(drcFrameSize)과의 합에 의해 표현되는, 상기 하나 이상의 시프트된 노드들(A4, A5; B1, B2)의 시간 정보(TA4, TA5; TB1, TB2)를 디코딩하기 위해 구성되는,
    오디오 디코더 디바이스.
  16. 제 13 항 내지 제 15 항 중 어느 한 항에 있어서,
    상기 동적 범위 제어 디코더(6)는 상기 시프트된 노드(B1)의 비트 표현(B'1)의 이득 정보(GB1)를 디코딩하기 위해 구성되고, 상기 기준 동적 범위 제어 프레임(DFR)에 후속하는 상기 동적 범위 제어 프레임(DFS)에 대응하는 비트스트림 부분(DFS')의 제 1 위치에 있는 상기 시프트된 노드(B1)의 비트 표현(B'1)의 이득 정보(GB1)는 절대적 이득 값(g_B1)에 의해 표현되고, 상기 기준 동적 범위 제어 프레임(DFR)에 후속하는 상기 동적 범위 제어 프레임(DFS)에 대응하는 비트 스트림 부분(DFS')의 제 1 위치에 있는 노드(B1)의 비트 표현(B'1) 이후의 위치에 있는 시프트된 노드들(B2)의 각각의 비트 표현(B'2)의 이득 정보(GB2)는, 각각의 시프트된 노드(B2)의 비트 표현(B'2)의 이득 값(g_B2)과 상기 각각의 노드(B2)의 비트 표현(B'2)에 선행하는 노드(B1)의 비트 표현(B'1)의 이득 값(g_B1)과의 차이와 동일한 상대적 이득 값에 의해 표현되는,
    오디오 디코더 디바이스.
  17. 제 13 항 내지 제 16 항 중 어느 한 항에 있어서,
    상기 동적 범위 제어 디코더(6)는, 상기 하나 이상의 시프트된 노드들(B1, B2)의 비트 표현들(B'1, B'2)의 하나 이상의 위치들이, 각각의 노드(C0)의 비트 표현(C'0)의 이득 값(g_C0)과, 상기 각각의 노드(C0)의 비트 표현(C'0)에 선행하는 시프트된 노드(B2)의 비트 표현(B'2)의 이득 값(g_B2)과의 차이와 동일한 상대적 이득 값에 의해 표현된 후, 상기 기준 동적 범위 제어 프레임(DFR)에 후속하는 상기 동적 범위 제어 프레임(DFS)에 대응하는 비트스트림 부분(DFS')의 제 1 위치에 있는 후속하는 상기 동적 범위 제어 프레임(DFS)의 노드(C0)의 비트 표현(C'0)의 이득 정보(GC0)를 디코딩하기 위해 구성되는,
    오디오 디코더 디바이스.
  18. 제 13 항 내지 제 17 항 중 어느 한 항에 있어서,
    상기 오디오 프레임들(AFP, AFR, AFS)의 일시적 크기는 동적 범위 제어 프레임들(AFP, AFR, AFS)의 일시적 크기와 동일한,
    오디오 디코더 디바이스.
  19. 제 13 항 내지 제 18 항 중 어느 한 항에 있어서,
    상기 동적 범위 제어 프레임들(DFP, DFR, DFS) 중 하나의 상기 하나 이상의 노드들(A0 ... A5; B0 ... B2; C0)은 균일한 시간 그리드로부터 선택되는,
    오디오 디코더 디바이스.
  20. 제 13 항 내지 제 19 항 중 어느 한 항에 있어서,
    상기 하나 이상의 노드들(A0 ... A5; B0 ... B2; C0)의 각각의 노드(A0 ... A5; B0 ... B2; C0)는 기울기 정보(SA0 ... SA5; SB0 ... SB2; SC0)를 포함하는,
    오디오 디코더 디바이스.
  21. 제 13 항 내지 제 20 항 중 어느 한 항에 있어서,
    상기 동적 범위 제어 디코더(6)는 엔트로피 디코딩 기술을 이용하여 노드들(A'0 ... A'5; B'0 ... B'2; C'0)의 비트 표현들을 디코딩하기 위해 구성되는,
    오디오 디코더 디바이스.
  22. 청구항 제 1 항 내지 제 12 항 중 어느 하나에 따른 오디오 인코더 디바이스(1) 및 제 13 항 내지 제 21 항 중 어느 한 항에 따른 오디오 디코더 디바이스(4)를 포함하는 시스템.
  23. 오디오 인코더를 동작시키기 위한 방법으로서,
    연속적인 오디오 프레임들(AFP, AFR, AFS)을 포함하는 오디오 신호(AS)로부터 인코딩된 오디오 비트스트림(ABS)을 생성하는 단계;
    상기 오디오 신호(AS)에 대응하고 연속적인 동적 범위 제어 프레임들(DFP, DFR, DFS)을 포함하는 동적 범위 제어 시퀀스(DS)로부터 인코딩된 동적 범위 제어 비트스트림(DBS)을 생성하는 단계;
    시프트 절차를 실행하는 단계를 포함하고,
    상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 각각의 동적 범위 제어 프레임(DFP, DFR, DFS)은 하나 이상의 노드들(A0 ... A5; B0 ... B2; C0)을 포함하고, 상기 하나 이상의 노드들(A0 ... A5; B0 ... B2; C0)의 각각의 노드는, 상기 오디오 신호(AS)에 대한 이득 정보(GA0 ... GA5; GB0 ... GB2; GC0) 및 상기 이득 정보가 어느 시점에 대응하는지 표시하는 시간 정보(TA0 ... TA5; TB0 ... TB2; TC0)를 포함하고;
    상기 인코딩된 동적 범위 제어 비트스트림(DBS)은 상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 각각의 동적 범위 제어 프레임(DFP, DFR, DFS)에 대해 대응하는 비트스트림 부분(DFP', DFR', DFS')을 포함하고;
    상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 노드들(B0 ... B2) 중 하나 이상의 노드들(B1, B2)은 시프트된 노드들(B1, B2)로서 선택되고, 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 하나 이상의 시프트된 노드들(B1, B2) 각각의 비트 표현(B'1, B'2)은 상기 하나의 기준 동적 범위 제어 프레임(DFR)에 후속하는 상기 동적 범위 제어 프레임(DFS)에 대응하는 비트스트림 부분(DFS')에 임베딩되고, 상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 노드들(B0 ... B2) 중 각각의 나머지 노드(B0)의 비트 표현(B'0)은 상기 하나의 기준 동적 범위 제어 프레임(DFR)에 대응하는 비트스트림 부분(DFR')에 임베딩되는,
    오디오 인코더를 동작시키기 위한 방법.
  24. 오디오 디코더를 동작시키기 위한 방법으로서,
    연속적인 오디오 프레임들(AFP, AFR, AFS)을 포함하는 오디오 신호(AS)를 재생성하기 위해, 인코딩된 오디오 비트스트림(ABS)을 디코딩하는 단계;
    상기 오디오 신호(AS)에 대응하고 연속적인 동적 범위 제어 프레임들(DFP, DFR, DFS)을 포함하는 동적 범위 제어 시퀀스(DS)를 재생성하기 위해, 인코딩된 동적 범위 제어 비트스트림(DBS)을 디코딩하는 단계를 포함하고;
    상기 인코딩된 동적 범위 제어 비트스트림(DBS)은 상기 동적 범위 제어 프레임들의 각각의 동적 범위 제어 프레임(DFP, DFR, DFS)에 대해 대응하는 비트스트림 부분(DFP', DFR', DFS')을 포함하고;
    상기 인코딩된 동적 범위 제어 비트스트림(DBS)은 노드들(A0 ... A5; B0 ... B2; C0)의 비트 표현들(A'0 ... A'5; B'0 ... B'2; C'0)을 포함하고, 상기 노드들 중 하나의 노드의 각각의 비트 표현은, 상기 오디오 신호(AS)에 대한 이득 정보(GA0 ... GA5; GB0 ... GB2; GC0) 및 상기 이득 정보(GA0 ... GA5; GB0 ... GB2; GC0)가 어느 시점에 대응하는지를 표시하는 시간 정보(TA0 ... TA5; TB0 ... TB2; TC0)를 포함하고;
    상기 인코딩된 동적 범위 제어 비트 스트림(DBS)은, 상기 하나의 기준 동적 범위 제어 프레임(DFR)에 후속하는 동적 범위 제어 프레임(DFS)에 대응하는 비트스트림 부분에 임베딩되는 동적 범위 제어 프레임들(DFP, DFR, DFS)의 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 노드들(B0 ... B2)로부터 선택되는 시프트된 노드들(B1, B2)의 비트 표현들(B'1, B'2)를 포함하고, 상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 노드들(B0 ... B2) 중 각각의 나머지 노드(B0)의 비트 표현(B'0)은 상기 하나의 기준 동적 범위 제어 프레임(DFR)에 대응하는 비트스트림 부분(DFR')에 임베딩되고;
    상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 하나의 기준 동적 범위 제어 프레임(DFR)의 나머지 노드들(B'0)의 각각의 나머지 노드(B0)의 비트 표현(B'0)은, 상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 각각의 나머지 노드(B0)를 재생성하기 위해 디코딩되고;
    상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 노드들(B0 ... B2)로부터 선택된 시프트된 노드들(B1, B2)의 각각의 시프트된 노드(B1, B2)의 비트 표현(B'1, B'2)은, 상기 동적 범위 제어 프레임들(DFP, DFR, DFS)의 상기 하나의 기준 동적 범위 제어 프레임(DFR)의 노드들로부터 선택된 시프트된 노드들(B1, B2)의 각각의 시프트된 노드(B1, B2)를 재생성하기 위해 디코딩되고;
    상기 재생성된 나머지 노드들(B0) 및 상기 재생성된 시프트된 노드들(B1, B2)은, 기준 동적 범위 제어 프레임(DFR)을 재생성하기 위해 결합되는,
    오디오 디코더를 동작시키기 위한 방법.
  25. 프로세서 상에서 실행되는 경우, 청구항 제 23 항 또는 제 24 항 중 어느 한 항에 따른 방법을 실행하기 위한 컴퓨터 프로그램.
KR1020167029370A 2014-03-25 2015-03-20 동적 범위 제어에서 효율적인 이득 코딩을 갖는 오디오 인코더 디바이스 및 오디오 디코더 디바이스 KR101890216B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14161605 2014-03-25
EP14161605.2 2014-03-25
PCT/EP2015/055945 WO2015144587A1 (en) 2014-03-25 2015-03-20 Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control

Publications (2)

Publication Number Publication Date
KR20160136390A true KR20160136390A (ko) 2016-11-29
KR101890216B1 KR101890216B1 (ko) 2018-08-22

Family

ID=52727126

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167029370A KR101890216B1 (ko) 2014-03-25 2015-03-20 동적 범위 제어에서 효율적인 이득 코딩을 갖는 오디오 인코더 디바이스 및 오디오 디코더 디바이스

Country Status (20)

Country Link
US (3) US10074377B2 (ko)
EP (1) EP3123469B1 (ko)
JP (1) JP6259930B2 (ko)
KR (1) KR101890216B1 (ko)
CN (2) CN111326165B (ko)
AR (1) AR099836A1 (ko)
AU (1) AU2015238519B2 (ko)
BR (1) BR112016021382B1 (ko)
CA (1) CA2942743C (ko)
ES (1) ES2678068T3 (ko)
MX (1) MX355089B (ko)
MY (1) MY186155A (ko)
PL (1) PL3123469T3 (ko)
PT (1) PT3123469T (ko)
RU (1) RU2678487C2 (ko)
SG (1) SG11201607940WA (ko)
TR (1) TR201809427T4 (ko)
TW (1) TWI585751B (ko)
WO (1) WO2015144587A1 (ko)
ZA (1) ZA201607193B (ko)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2005299410B2 (en) 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI447709B (zh) 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
CN112185399A (zh) 2012-05-18 2021-01-05 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
MX339611B (es) 2013-01-21 2016-05-31 Dolby Laboratories Licensing Corp Codificador y decodificador de audio con metadatos de limite y sonoridad de programa.
US9841941B2 (en) 2013-01-21 2017-12-12 Dolby Laboratories Licensing Corporation System and method for optimizing loudness and dynamic range across different playback devices
US9715880B2 (en) 2013-02-21 2017-07-25 Dolby International Ab Methods for parametric multi-channel encoding
CN104080024B (zh) 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
CN105190618B (zh) 2013-04-05 2019-01-25 杜比实验室特许公司 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CN105556837B (zh) 2013-09-12 2019-04-19 杜比实验室特许公司 用于各种回放环境的动态范围控制
EP4379714A2 (en) 2013-09-12 2024-06-05 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
CA3162763A1 (en) * 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
WO2015144587A1 (en) * 2014-03-25 2015-10-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
CN105142067B (zh) 2014-05-26 2020-01-07 杜比实验室特许公司 音频信号响度控制
EP4060661B1 (en) 2014-10-10 2024-04-24 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
RU2144222C1 (ru) * 1998-12-30 2000-01-10 Гусихин Артур Владимирович Способ сжатия звуковой информации и система для его реализации
US6785655B1 (en) * 2000-05-15 2004-08-31 Lsi Logic Corporation Method for independent dynamic range control
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP4575609B2 (ja) * 2001-03-13 2010-11-04 旭化成エレクトロニクス株式会社 データ変換装置
KR100754439B1 (ko) * 2003-01-09 2007-08-31 와이더댄 주식회사 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
AU2005270105B2 (en) * 2004-07-02 2011-03-31 Nielsen Media Research, Inc. Methods and apparatus for mixing compressed digital bit streams
CN101246689B (zh) * 2004-09-17 2011-09-14 广州广晟数码技术有限公司 音频编码系统
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US8521314B2 (en) * 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
CN101587711B (zh) * 2008-05-23 2012-07-04 华为技术有限公司 基音后处理方法、滤波器以及基音后处理系统
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
WO2010053728A1 (en) * 2008-10-29 2010-05-14 Dolby Laboratories Licensing Corporation Signal clipping protection using pre-existing audio gain metadata
KR101336891B1 (ko) * 2008-12-19 2013-12-04 한국전자통신연구원 G.711 코덱의 음질 향상을 위한 부호화 장치 및 복호화 장치
US8861879B2 (en) * 2009-09-17 2014-10-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding image based on skip mode
TWI447709B (zh) * 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
US9443534B2 (en) * 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
WO2012026092A1 (ja) * 2010-08-23 2012-03-01 パナソニック株式会社 音声信号処理装置及び音声信号処理方法
EP2737479B1 (en) * 2011-07-29 2017-01-18 Dts Llc Adaptive voice intelligibility enhancement
EP2759057A2 (en) * 2011-09-22 2014-07-30 Earsoft Limited Dynamic range control
CN112185399A (zh) * 2012-05-18 2021-01-05 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
US9332373B2 (en) * 2012-05-31 2016-05-03 Dts, Inc. Audio depth dynamic range enhancement
EP2898506B1 (en) * 2012-09-21 2018-01-17 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
US9607624B2 (en) * 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
WO2015144587A1 (en) 2014-03-25 2015-10-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ATSC Standard: Digital Audio Compression (AC-3). Advanced Television Systems Committee. Doc.A/52:2012. 2012.12.17. *
Frank Baumgarte. Enhanced Metadata for Dynamic Range Compression. ISO/IEC JTC1/SC29/WG11 MPEG2013/M28901. 2013.04.17. *
Text of ISO/IEC13818-7:2004 (MPEG-2 AAC 3rd edition). ISO/IEC JTC1/SC29/WG11 N6428. 2004.03. *

Also Published As

Publication number Publication date
EP3123469A1 (en) 2017-02-01
KR101890216B1 (ko) 2018-08-22
MX2016012421A (es) 2016-12-16
RU2016141556A (ru) 2018-04-25
EP3123469B1 (en) 2018-04-18
TWI585751B (zh) 2017-06-01
ES2678068T3 (es) 2018-08-08
JP6259930B2 (ja) 2018-01-10
US10074377B2 (en) 2018-09-11
US20220277756A1 (en) 2022-09-01
JP2017517020A (ja) 2017-06-22
CA2942743A1 (en) 2015-10-01
PL3123469T3 (pl) 2018-09-28
US20170011749A1 (en) 2017-01-12
AU2015238519B2 (en) 2017-11-23
CN106165014A (zh) 2016-11-23
ZA201607193B (en) 2018-08-30
BR112016021382B1 (pt) 2021-02-09
CN111326165B (zh) 2023-12-12
RU2678487C2 (ru) 2019-01-29
TR201809427T4 (tr) 2018-07-23
WO2015144587A1 (en) 2015-10-01
CN111326165A (zh) 2020-06-23
AR099836A1 (es) 2016-08-24
TW201543470A (zh) 2015-11-16
RU2016141556A3 (ko) 2018-04-25
SG11201607940WA (en) 2016-10-28
PT3123469T (pt) 2018-07-06
AU2015238519A1 (en) 2016-11-10
MX355089B (es) 2018-04-04
USRE49107E1 (en) 2022-06-14
CA2942743C (en) 2018-11-13
CN106165014B (zh) 2020-01-24
MY186155A (en) 2021-06-28

Similar Documents

Publication Publication Date Title
KR101890216B1 (ko) 동적 범위 제어에서 효율적인 이득 코딩을 갖는 오디오 인코더 디바이스 및 오디오 디코더 디바이스
JP6753499B2 (ja) 復号化装置および方法、並びにプログラム
KR101091593B1 (ko) 음성 신호의 스펙트럼 재구성 방법 및 디바이스
JP6868791B2 (ja) テレビジョン受像機および信号処理方法、並びにプログラム
JP2018151639A (ja) オーディオ装置のための組合せダイナミックレンジ圧縮および誘導クリッピング防止のための概念
KR20100105496A (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법
JP6105159B2 (ja) オーディオ・エンコーダおよびデコーダ
JP4800379B2 (ja) 最大ビットレートを保証する情報の無損失符号化
KR101112557B1 (ko) 평활한 크로스페이딩을 용이화하기 위한 오버랩을 갖는프레임 기반의 오디오 전송/저장장치
JP6700506B2 (ja) 透明な無損失オーディオ電子透かし
KR102380642B1 (ko) 스테레오 신호 인코딩 방법 및 인코딩 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant