KR20160072255A - 오디오 장치에 대한 조합된 동적 범위 압축 및 안내 클리핑 방지를 위한 개념 - Google Patents

오디오 장치에 대한 조합된 동적 범위 압축 및 안내 클리핑 방지를 위한 개념 Download PDF

Info

Publication number
KR20160072255A
KR20160072255A KR1020167013335A KR20167013335A KR20160072255A KR 20160072255 A KR20160072255 A KR 20160072255A KR 1020167013335 A KR1020167013335 A KR 1020167013335A KR 20167013335 A KR20167013335 A KR 20167013335A KR 20160072255 A KR20160072255 A KR 20160072255A
Authority
KR
South Korea
Prior art keywords
audio
dynamic range
range control
metadata
stage
Prior art date
Application number
KR1020167013335A
Other languages
English (en)
Other versions
KR101882898B1 (ko
Inventor
파비앙 쿠치
크리스티앙 울레
미하엘 크래슈머
베른하르트 노이게바우어
미하엘 마이어
아르네 보르섬
Original Assignee
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. filed Critical 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Publication of KR20160072255A publication Critical patent/KR20160072255A/ko
Application granted granted Critical
Publication of KR101882898B1 publication Critical patent/KR101882898B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G11/00Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general
    • H03G11/008Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

오디오 장치에 대한 조합된 동적 범위 압축 및 안내 클리핑 방지를 위한 개념이 제공된다. 본 발명은 오디오 장치에 대한 조합된 동적 범위 압축 및 안내 클리핑 방지를 위한 개념을 제공한다. 개념에 따라 오디오 비트스트림과 오디오 비트스트림에 관련된 메타데이터 비트스트림을 디코딩하기 위한 오디오 디코더는 오디오 비트스트림으로부터 도출되는 디코딩된 오디오 신호를 수신하고, 오디오 출력 신호를 생성하기 위해 오디오 신호의 특성을 조절하도록 구성되며, 오디오 출력 신호의 동적 범위를 조절하기 위한 동적 범위 제어 스테이지와, 오디오 출력 신호의 클리핑의 방지를 위한 안내 클리핑 방지 스테이지를 포함하는 복수의 조절 스테이지를 포함하는 오디오 처리 체인; 및 메타데이터 비트스트림을 수신하고, 메타데이터 비트스트림으로부터 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스를 추출하도록 구성되는 메타데이터 디코더를 포함한다.

Description

오디오 장치에 대한 조합된 동적 범위 압축 및 안내 클리핑 방지를 위한 개념{CONCEPT FOR COMBINED DYNAMIC RANGE COMPRESSION AND GUIDED CLIPPING PREVENTION FOR AUDIO DEVICES}
본 발명은 오디오 장치에 대한 조합된 동적 범위 압축 및 안내 클리핑 방지를 위한 개념에 관한 것이다. 특히, 본 발명은 오디오 인코더, 오디오 인코더를 동작하기 위한 방법, 오디오 인코더를 동작하기 위한 방법을 실행하기 위한 컴퓨터 프로그램, 오디오 디코더, 오디오 디코더를 동작하기 위한 방법, 및 오디오 디코더를 동작하기 위한 방법을 실행하기 위한 컴퓨터 프로그램에 관한 것이다.
본 발명의 개념은 동적 범위 압축(DRC) 및 안내 클리핑 방지(GCP)에 대한 공동 솔루션의 필요한 기능을 함께 제공하는 여러 처리 블록의 조합에 기초한다.
본 발명의 개념은 특히 예를 들어 [M30100, M30101]에서 정의된 바와 같은 관련된 구성 정보가 인코더 및 디코더에서 이미 이용 가능한 오디오 시스템에 적합하다. 이러한 정보는 예를 들어 파일 기반 전송을 위한 헤더 또는 통합된 음성 및 오디오 코딩(USAC) 구성 확장에 포함될 수 있다. 구성 정보는 채널 레이아웃, 다운믹스 명령어(예를 들어, 다운믹스 계수), 동적 범위 제어 명령어(예를 들어, 적용된 동적 범위 제어 특성, 트랙에 대한 동적 범위 제어 이득 시퀀스의 번호, 및 라우드니스(loudness) 정보(예를 들어 프로그램 라우드니스, 앵커(anchor) 라우드니스, 진정한 피크 값)를 포함할 수 있다. 더 많은 상세 사항은 [M30100, M30101]에서 발견될 수 있다. 이는 동적 범위 제어 명령어 박스의 정보와 동일한 방식으로 처리될 수 있는 대응하는 안내 클리핑 방지 명령어에 적용한다.
본 발명에 따른 오디오 인코더는 오디오 디코더의 동적 범위 제어 스테이지에 대한 동적 범위 제어 이득 시퀀스 뿐만 아니라 오디오 디코더의 안내 클리핑 방지 스테이지에 대한 안내 클리핑 방지 이득 시퀀스를 포함하는 메타데이터 비트스트림을 생성할 수 있으며, 동적 범위 제어 이득 시퀀스는 안내 클리핑 방지 이득 시퀀스와 별도로 송신될 수 있다.
메타데이터 인코더는 외부에서, 예를 들어 콘텐츠 제공자에 의해 운영되는 외부 도구에 의해 제공되는 동적 범위 제어 이득 시퀀스를 입력으로서 사용한다.
동적 범위 제어 이득의 가능한 시간적 해상도는 몇몇 샘플의 범위 내에 있을 수 있다. 동적 범위 제어 이득 값은 일반적으로 최대 0.125 dB의 충분한 해상도로 표현될 수 있다.
추가적으로, 메타데이터 인코더는 안내 클리핑 방지 이득 시퀀스를 입력으로서 취한다.
압축된 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스는 통합된 음성 및 오디오 코딩 확장 페이로드에 포함된 보조(side) 정보로서 수신기로 전송될 수 있다.
동적 범위 제어 이득 시퀀스는 동적 범위 압축을 수행하기 위해 동적 범위 제어 이득만을 포함하는 반면에, 클리핑 방지를 위한 안내 클리핑 방지 이득은 안내 클리핑 방지 이득 시퀀스에 의해 수용된다는 것이 주목되어야한다.
안내 클리핑 방지 이득의 시간적 해상도는 동적 범위 제어 이득의 경우와 동일할 수 있다.
디코더 측에서의 신호 클리핑은 예를 들어 라우드니스 정규화, 다운믹싱, 파라메트릭(parametric) 코딩 도구 등으로 인해 발생할 수 있다.
종래 기술에 따르면, 클리핑 방지는 디코더 처리 체인의 최종 단부(final end)에 피크 리미터를 배치함으로써 달성될 수 있다. 피크 리미터는 정의된 최대 값을 초과하는 입력 신호의 오디오 샘플을 검출하고, 출력 신호의 샘플이 항상 정의된 최대 값 아래로 유지되도록 각각의 신호 부분에 레벨 감소를 적용한다. 가청 왜곡을 방지하기 위해, 레벨 감소는 점진적으로 수행되어야 하며, 신호에 적용된 이득 인자는 단지 시간이 지남에 따라 서서히 변화할 수 있으며, 이는 이득 평활 필터에 의해 보장된다. 이득 인자를 적용하기 전에 입력 신호의 예견(look-ahead) 지연은 또한 급격한 신호 피크 전에 이미 시작하는 이득의 평활한 감소(smooth reduction)를 허용하는데 사용된다. 디코더 측 피크 리미터가 일반적으로 인코더 측에서 제어되지 않기 때문에(콘텐츠 제작자가 피크 리미터 처리에 영향을 미치지 않기 때문에), 이것은 오디오 신호에 직접 적용되는 안내되지 않은 클리핑 방지 이득 시퀀스를 생성한다. 디코더 측 피크 리미터는 항상 디코더 측에서 추가적인 예견 지연(약 5ms 이상) 및 계산 복잡성을 야기한다.
본 발명은 하나 이상의 오디오 채널 및/또는 하나 이상의 오디오 객체를 포함하는 오디오 비트스트림을 생성하기 위한 오디오 인코더를 제공하고, 오디오 인코더는 메타데이터 비트스트림을 생성하기 위한 메타데이터 인코더를 포함하며, 오디오 인코더는
오디오 프레임에 대한 적어도 하나의 동적 범위 제어 이득 시퀀스를 수신하고, 동적 범위 제어 이득 시퀀스는 오디오 디코더의 동적 범위 제어 스테이지에 대한 하나 이상의 동적 범위 제어 이득을 포함하고;
오디오 프레임에 대한 적어도 하나의 안내 클리핑 방지 이득 시퀀스를 수신하고, 안내 클리핑 방지 이득 시퀀스는 오디오 디코더의 안내 클리핑 방지 스테이지에 대한 하나 이상의 안내 클리핑 방지 이득을 포함하며;
상기 동적 범위 제어 이득 시퀀스 중 적어도 하나와 상기 안내 클리핑 방지 이득 시퀀스 중 적어도 하나를 메타데이터의 비트스트림 내에 포함하도록 구성된다.
이와는 대조적으로, 본 발명에 따라 사용되는 바와 같은 안내 클리핑 방지 이득 시퀀스는 인코더 측에서 클리핑 방지 이득의 생성을 완전히 제어하도록 허용한다(원한다면, 콘텐츠 제작자는 이득 특성에 영향을 미칠 수 있다). 생성 후, 클리핑 방지 이득 시퀀스는 디코더 측으로 전송된다. 현재 디코더 구성에 적합한 안내 클리핑 방지 이득 시퀀스는 메타데이터 비트스트림에서 이용 가능하면, 디코더 측 피크 리미터는 대부분의 경우에 회피될 수 있다. 따라서, 디코더 측에서 추가적인 예견 지연 및 계산 복잡성은 회피될 수 있다.
안내 클리핑 방지 이득 시퀀스는 특정 타겟 레벨 또는 다운믹스/포맷 변환기 구성에 대한 오디오 디코더의 출력에서 샘플 클리핑이 발생하지 않는다는 것을 보장하는데 사용된다. 각 안내 클리핑 방지 이득 시퀀스는 특정 다운믹스/포맷 변환기 구성, 특정 타겟 레벨, 및 객체에 대한 특정 동적 범위 제어 이득 시퀀스와 함께 채널에 대한 특정 동적 범위 제어 이득 시퀀스의 조합을 위해 최적화될 수 있다. 어떤 안내 클리핑 방지 이득 시퀀스가 어떤 동적 범위 제어 이득 시퀀스와 관련되는 것에 대한 정보는 통합된 음성 및 오디오 코딩 구성 확장의 파일 헤더에 포함된 안내 클리핑 방지 명령어에 포함될 수 있다. 그것은 또한 안내 클리핑 방지 이득이 인코더에서 결정된 타겟 레벨에 관계된 정보를 포함할 수 있다.
상술한 동적 범위 처리를 위한 본 발명의 개념은 전체 처리 체인의 인코더 측 제어에 대한 접근을 나타낸다. 동적 범위 제어 및 안내 클리핑 방지를 위해 사용되는 메타데이터의 분리는 각각의 이득의 별도의 수정(스케일링 또는 매핑)을 허용하고, 상기 수정은 디코더 구성 및 재생 시나리오에 의존한다.
본 발명의 개념에 의하면, 동적 범위 제어 이득이 안내 클리핑 방지 이득과 별도로 송신되는 경우에 동적 범위 제어 이득 시퀀스의 기본 동적 범위 제어 특성을 무거운 압축(heavy compression)에서 가벼운(light) 압축으로 변화시킬 수 있다. 이것은 동적 범위 제어 이득 시퀀스의 값의 적절한 스케일링 또는 매핑에 의해 달성될 수 있다.
본 발명의 개념은 소정의 품질 요구 사항을 충족하기 위해 오디오 디코더의 최종 출력의 전체 제어를 콘텐츠 제공자에게 제공한다. 이 경우, 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스는 모두 가장 중요한 것으로 간주되는 특정 디코더 구성에 포함될 수 있다. 피크 리미터는 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스의 조합된 사용으로 인해 많은 경우에 폐기될 수 있다. 안내 클리핑 방지 이득을 간단히 적용함으로써 달성되는 오디오 디코더 측에서의 안내 클리핑 방지는 피크 리미터를 사용하는 것보다 계산적으로 더욱 효율적인 것이 주목되어야 한다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 상이한 동적 범위 제어 이득을 포함하는 동일한 오디오 프레임에 대한 적어도 2개의 동적 범위 제어 이득 시퀀스를 수신하고, 상이한 동적 범위 제어 이득을 포함하는 적어도 2개의 동적 범위 제어 이득 시퀀스를 메타데이터 비트스트림 내에 포함하도록 구성된다.
어떤 동적 범위 제어 특성이 상이한 동적 범위 제어 이득 시퀀스와 관련되는 것에 대한 정보는 파일 기반 전송의 경우 또는 통합된 음성 및 오디오 코딩 구성 확장에서의 파일 헤더에 포함된 동적 범위 제어 명령어에 포함될 수 있다.
이러한 특징에 의해 상이한 압축 특성을 가진 디코더에서 출력 신호를 활성화하기 위해 오디오 트랙의 채널에 대한 다수의 동적 범위 제어 이득 시퀀스를 제공할 수 있다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스를 수신하도록 구성되며, 메타데이터 인코더는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하고, 선택적으로, 오디오 채널 및/또는 오디오 객체에 대한 동적 범위 제어 이득의 관계를 메타데이터 비트스트림 내에 포함하도록 구성된다.
각 동적 범위 제어 시퀀스 내에서 상이한 채널 또는 채널의 그룹에 대해 상이한 동적 범위 제어 이득의 세트를 정의할 수 있으며, 각 채널은 일반적으로 단 하나의 채널 그룹과 연관된다. 예를 들어, 멀티채널 영화 사운드에서는 종종 특정 동적 범위 제어 이득을 대화 채널에 적용하는 것이 바람직하다. 예를 들어 전방 좌측, 전방 우측, 후방 좌측, 후방 우측과 같은 나머지 채널은 상이한 동적 범위 제어 이득을 이용하여 처리될 수 있다.
채널의 경우에서 유추하여, 오디오 객체 또는 객체의 그룹과 관련된 다수의 동적 범위 제어 시퀀스는 지원될 수 있다. 이러한 객체 관련 동적 범위 제어 시퀀스는 또한 동적 범위 제어 이득의 채널 관련된 세트 내의 특정 채널 그룹과 연관되는 것으로 간주될 수 있다. 본 명세서에서 용어 오디오 객체는 초인종(door bell)과 같은 단일 소스 사운드에 관계한다.
어떤 동적 범위 제어 특성이 상이한 동적 범위 제어 이득 시퀀스와 관련되는 것에 대한 정보는 파일 기반 전송의 경우 또는 통합된 음성 및 오디오 코딩 구성 확장에서의 파일 헤더에 포함된 동적 범위 제어 명령어에 포함될 수 있다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 오디오 디코더의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스를 수신하도록 구성되며, 메타데이터 인코더는 디코더의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하고, 선택적으로, 디코더의 주파수 대역에 대한 동적 범위 제어 이득의 관계를 메타데이터 비트스트림 내에 포함하도록 구성된다.
다중 대역 동적 범위 제어를 지원하는 임의의 확장에서, 메타데이터 인코더는 또한 상이한 주파수 대역에 대해 상이한 동적 범위 제어 이득을 갖는 동적 범위 제어 이득 시퀀스를 입력으로서 수용하도록 확장될 수 있다.
어떤 동적 범위 제어 특성이 상이한 동적 범위 제어 이득 시퀀스와 관련되는 것에 대한 정보는 파일 기반 전송의 경우 또는 통합된 음성 및 오디오 코딩 구성 확장에서의 파일 헤더에 포함된 동적 범위 제어 명령어에 포함될 수 있다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스를 수신하고, 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스를 메타데이터 비트스트림 내에 포함하도록 구성된다. 본 발명의 바람직한 실시예에 따르면, 각 동적 범위 제어 시퀀스는 안내 클리핑 방지 이득 시퀀스 중 하나에 관련되고, 메타데이터 인코더는 동적 범위 제어 시퀀스와 안내 클리핑 방지 이득 시퀀스 사이의 관계를 메타데이터 비트스트림 내에 포함하도록 구성된다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 이득 시퀀스를 수신하도록 구성되며, 메타데이터 인코더는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 시퀀스를 포함하도록 구성되고, 선택적으로, 오디오 채널 및/또는 오디오 객체에 대한 안내 클리핑 방지 이득의 관계를 메타데이터 비트스트림 내에 포함하도록 구성된다.
동적 범위 제어 이득과 같이, 각각의 안내 클리핑 방지 시퀀스 내에서 상이한 채널 또는 채널의 그룹에 대해 상이한 안내 클리핑 방지 이득의 세트를 정의할 수 있으며, 각 채널은 일반적으로 단 하나의 채널 그룹과 연관된다. 전형적인 동작 모드에서, 동일한 안내 클리핑 방지 이득은 모든 채널에 적용된다.
객체에 대한 안내 클리핑 방지 이득 시퀀스의 정의는 동적 범위 제어의 경우와 유사하다.
다른 양태에서, 본 발명은 하나 이상의 오디오 채널 및/또는 하나 이상의 오디오 객체를 포함하는 오디오 비트스트림을 생성하기 위한 오디오 인코더를 동작하기 위한 방법을 제공하고, 오디오 인코더는 메타데이터 비트스트림을 생성하기 위한 메타데이터 인코더를 포함하며, 방법은
메타데이터 인코더의 부분 상에서, 오디오 디코더의 동적 범위 제어 스테이지에 대한 하나 이상의 동적 범위 제어 이득을 포함하는 적어도 하나의 동적 범위 제어 이득 시퀀스를 수신하는 단계;
메타데이터 인코더의 부분 상에서, 오디오 디코더의 안내 클리핑 방지 스테이지에 대한 하나 이상의 안내 클리핑 방지 이득을 포함하는 적어도 하나의 안내 클리핑 방지 이득 시퀀스를 수신하는 단계; 및
메타데이터 인코더의 부분 상에서, 상기 동적 범위 제어 이득 시퀀스 중 적어도 하나와 상기 안내 클리핑 방지 이득 시퀀스 중 적어도 하나를 메타데이터 비트스트림 내에 포함시키는 단계를 포함한다.
추가의 양태에서, 본 발명은 컴퓨터 또는 프로세서상에서 실행될 때 상술한 방법을 수행하기 위한 컴퓨터 프로그램을 제공한다.
추가의 양태에서, 본 발명은 특히 본 발명에 따른 오디오 인코더에 의해 생성되는 오디오 비트스트림과, 오디오 비트스트림에 관련된 메타데이터 비트스트림을 디코딩하기 위한 오디오 디코더를 제공하며, 오디오 디코더는
오디오 비트스트림으로부터 도출되는 디코딩된 오디오 신호를 수신하고, 오디오 처리 체인의 오디오 출력 신호의 특성을 조절하도록 구성되며, 오디오 출력 신호의 동적 범위를 조절하기 위한 동적 범위 제어 스테이지와, 오디오 출력 신호의 클리핑의 방지를 위한 안내 클리핑 방지 스테이지를 포함하는 복수의 조절 스테이지를 포함하는 오디오 처리 체인; 및
메타데이터 비트스트림을 수신하고, 메타데이터 비트스트림으로부터 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스를 추출하도록 구성되는 메타데이터 디코더로서, 동적 범위 제어 이득 시퀀스의 적어도 부분은 동적 범위 제어 스테이지에 공급되고, 안내 클리핑 방지 이득 시퀀스의 적어도 부분은 안내 클리핑 방지 스테이지에 공급되는 메타데이터 디코더를 포함한다.
메타데이터 디코더는 예를 들어 통합된 음성 및 오디오 코딩 디코더로부터 압축된 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스를 포함하는 메타데이터 비트스트림을 수신한다.
메타데이터 디코더는 압축된 메타데이터 비트스트림으로부터 원하는 동적 범위 제어 이득 시퀀스를 생성한다. 추가적으로, 생성된 동적 범위 제어 이득의 스케일링 또는 매핑이 적용될 수 있다.
메타데이터 디코더는 추가적으로 압축된 안내 클리핑 방지 메타데이터를 포함하는 비트스트림으로부터 원하는 안내 클리핑 방지 이득 시퀀스를 생성한다. 안내 클리핑 방지 이득의 스케일링 또는 매핑이 적용될 수 있다. 이것은 오디오 디코더 타겟 레벨이 오디오 인코더에서 안내 클리핑 방지 이득 시퀀스를 결정하는데 사용된 타겟 레벨보다 낮은 경우에 특히 유용하다. 그 다음, 안내 클리핑 방지 이득의 매핑이 가능하고, 클리핑이 오디오 디코더 출력 신호에서 발생하지 않는 것을 여전히 보장하면서 신호 헤드룸(headroom)을 최적으로 복원한다.
동적 범위 제어 스테이지는 메타데이터 디코더로부터 각각의 오디오 프레임에 대해 압축되지 않고 임의로 스케일링되거나 매핑된 동적 범위 제어 이득 시퀀스를 직간접적으로 수신한다. 메타데이터 디코더는 또한 최종 시간 도메인의 동적 범위 제어 이득 값이 오디오 샘플의 시간적 해상도에 대응하는 시간적 해상도로 보간되는 것을 보장할 수 있다. 이러한 최종 동적 범위 제어 이득은 그 후 디코딩된 오디오 신호에 적용되고, 여기서 정확한 채널 또는 객체 그룹으로의 특정 동적 범위 제어 시퀀스의 할당은 관찰된다.
안내 클리핑 방지 스테이지는 메타데이터 디코더로부터 각각의 오디오 프레임에 대해 압축되지 않고 임의로 스케일링되거나 매핑된 안내 클리핑 방지 이득 시퀀스를 직간접적으로 수신한다. 메타데이터 디코더는 또한 최종 시간 도메인의 안내 클리핑 방지 이득 값이 오디오 샘플의 시간적 해상도에 대응하는 시간적 해상도로 보간되는 것을 보장할 수 있다. 이러한 최종 안내 클리핑 방지 이득은 그 후 디코딩된 오디오 신호에 적용되고, 여기서 정확한 채널 그룹으로의 특정 안내 클리핑 방지 시퀀스의 할당은 관찰된다.
본 발명은 인코더 측에서 전체 처리 체인의 제어를 그만두면서 오디오 디코더 측에서 유연성을 제공한다. 동적 범위 제어 및 안내 클리핑 방지를 위해 사용되는 메타데이터의 분리는 각각의 이득의 별도의 수정(스케일링 또는 매핑)을 허용하고, 상기 수정은 오디오 디코더 구성 및 재생 시나리오에 의존한다.
동적 범위 제어 이득이 안내 클리핑 방지 이득과 별도로 송신되는 경우에 본 발명은 동적 범위 제어 이득 시퀀스의 기본 동적 범위 제어 특성을 무거운 압축에서 가벼운 압축으로 변화시키는 것을 허용한다. 이것은 동적 범위 제어 이득 시퀀스의 값의 적절한 스케일링 또는 매핑에 의해 달성될 수 있다.
디코더 타겟 레벨이 인코더에서 안내 클리핑 방지를 위한 이득을 계산하기 위해 사용되는 타겟 레벨보다 낮은 경우에, 신호 피크의 감소된 감쇠는 안내 클리핑 방지 이득을 적절히 스케일링함으로써 디코더에서 허용될 수 있다. 그 다음, 강한 신호 피크의 레벨이 유지될 수 있거나, 수정되지 않은 방식으로 안내 클리핑 방지 이득을 적용하는 경우에 비해 적어도 증가될 수 있으며, 이것은 이용 가능한 헤드룸(headroom)이 보존될 수 있다는 것을 의미한다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더는 상이한 동적 범위 제어 이득을 포함하는 동일한 오디오 프레임에 대한 적어도 2개의 동적 범위 제어 이득 시퀀스를 메타데이터 비트스트림으로부터 추출하도록 구성된다.
어떤 동적 범위 제어 특성이 상이한 동적 범위 제어 이득 시퀀스와 관련되는 것에 대한 정보는 파일 기반 전송의 경우 또는 통합된 음성 및 오디오 코딩 구성 확장에서의 파일 헤더에 포함된 동적 범위 제어 명령어에 포함될 수 있다.
이러한 특징에 의해 상이한 압축 특성을 가진 디코더에서 출력 신호를 활성화하기 위해 오디오 트랙의 채널에 대한 다수의 동적 범위 제어 이득 시퀀스를 제공할 수 있다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스를 메타데이터 비트스트림으로부터 수신하도록 구성된다.
각 동적 범위 제어 시퀀스 내에서 상이한 채널 또는 채널의 그룹에 대해 상이한 동적 범위 제어 이득의 세트를 정의할 수 있으며, 각 채널은 일반적으로 단 하나의 채널 그룹과 연관된다. 예를 들어, 멀티채널 영화 사운드에서는 종종 특정 동적 범위 제어 이득을 대화 채널에 적용하는 것이 바람직하다. 예를 들어 전방 좌측, 전방 우측, 후방 좌측, 후방 우측과 같은 나머지 채널은 상이한 동적 범위 제어 이득을 이용하여 처리될 수 있다.
채널의 경우에서 유추하여, 오디오 객체 또는 객체의 그룹과 관련되는 다수의 동적 범위 제어 시퀀스는 지원될 수 있다. 이러한 객체 관련 동적 범위 제어 시퀀스는 또한 동적 범위 제어 이득의 채널 관련된 세트 내의 특정 채널 그룹과 연관되는 것으로 간주될 수 있다. 본 명세서에서 용어 오디오 객체는 초인종과 같은 단일 소스 사운드에 관계한다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더는 오디오 디코더의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스를 메타데이터 비트스트림으로부터 추출하도록 구성된다.
다중 대역 동적 범위 제어를 지원하는 임의의 확장에서, 메타데이터 디코더는 또한 상이한 주파수 대역에 대해 상이한 동적 범위 제어 이득을 갖는 동적 범위 제어 이득 시퀀스를 입력으로서 수용하도록 확장될 수 있다.
다중 대역 동적 범위 제어 확장의 경우, 시간 도메인의 오디오 신호는 다중 대역 동적 범위 제어 이득을 적용하기 전에 적절한 주파수 도메인의 표현(resentation)으로 변환되어야 한다.
어떤 동적 범위 제어 특성이 상이한 동적 범위 제어 이득 시퀀스와 관련되는 것에 대한 정보는 파일 기반 전송의 경우 또는 통합된 음성 및 오디오 코딩 구성 확장에서의 파일 헤더에 포함된 동적 범위 제어 명령어에 포함될 수 있다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더는 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스를 메타데이터 비트스트림으로부터 추출하도록 구성된다.
이러한 특징에 의해 대응하는 동적 범위 제어 이득 시퀀스와 일치하기 위해 오디오 트랙에 대한 다수의 안내 클리핑 방지 이득 시퀀스를 제공할 수 있다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 이득 시퀀스를 메타데이터 비트스트림으로부터 추출하도록 구성된다.
동적 범위 제어 이득과 같이, 각각의 안내 클리핑 방지 시퀀스 내에서 상이한 채널 또는 채널의 그룹에 대해 상이한 안내 클리핑 방지 이득의 세트를 정의할 수 있으며, 각 채널은 일반적으로 단 하나의 채널 그룹과 연관된다. 전형적인 동작 모드에서, 동일한 안내 클리핑 방지 이득은 모든 채널에 적용된다.
객체에 대한 안내 클리핑 방지 이득 시퀀스의 정의는 동적 범위 제어의 경우와 유사하다.
본 발명의 바람직한 실시예에 따르면, 오디오 디코더는 구성 제공 스테이지로부터 수신된 구성 정보에 기초하여 메타데이터 및 파라미터들을 조절 스테이지들 중 적어도 하나에 제공하도록 구성된 메타데이터 및 파라미터 제어 스테이지를 더 포함한다.
오디오 디코더에서의 메타데이터 및 파라미터 제어 스테이지는 원하는 동적 범위 제어 이득 시퀀스에 따라 메타데이터 비트스트림의 정확한 부분을 선택할 수 있다. 스케일링 및 매핑 정보는 또한 디코더 구성 정보의 부분이거나 디코더 구성 정보로부터 도출될 수 있다.
유추에 의해, 오디오 디코더에서의 메타데이터 및 파라미터 제어 스테이지는 원하는 안내 클리핑 방지 이득 시퀀스에 따라 비트스트림의 정확한 부분을 선택한다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 및 파라미터 제어 스테이지는, 복수의 동적 범위 제어 이득 시퀀스가 수신되는 경우에, 복수의 동적 범위 제어 이득 시퀀스 중 어떤 것이 동적 범위 제어 스테이지에 공급되는지를 선택하도록 구성된다. 메타데이터 및 파라미터 제어 스테이지의 부분 상에서의 동적 범위 제어 시퀀스의 선택은 채널 레이아웃, 다운믹스 명령어, 객체 메타데이터, 동적 범위 제어 명령어, 라우드니스 정보, 및 디코더 타겟 레벨과 같은 디코더 구성 정보에 기초할 수 있다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 및 파라미터 제어 스테이지는, 복수의 안내 클리핑 방지 이득 시퀀스가 수신되는 경우에, 복수의 안내 클리핑 방지 이득 시퀀스 중 어떤 것이 안내 클리핑 방지 스테이지에 공급되는지를 선택하도록 구성된다.
메타데이터 및 파라미터 제어 블록의 부분 상에서의 안내 클리핑 방지 이득 시퀀스의 선택은 일반적으로 상술한 오디오 디코더 구성 정보에 기초한다.
본 발명의 바람직한 실시예에 따르면, 신호 흐름의 방향으로의 동적 범위 제어 스테이지는 오디오 조절 체인의 제 1 조절 스테이지이다.
채널에 대한 동적 범위 제어 처리는 채널 그룹에 대한 상이한 이득을 가능하게 하기 위해 디코딩된 오디오 채널의 잠재적 다운믹싱 또는 포맷 변환 전에 수행될 수 있다. 따라서, 동적 범위 제어 이득은 렌더링 전에 객체에 적용된다. 채널 및 객체 모두가 존재하는 경우에, 동적 범위 제어 처리의 위치는 그대로 두고: 채널 관련된 동적 범위 제어는 포맷 변환기 스테이지 바로 전에 수행되어야 하는 반면에, 객체 관련된 동적 범위 제어는 객체 렌더러(renderer) 전에 수행된다.
본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인은 오디오 출력 신호의 채널 구성을 조절하도록 구성되는 포맷 변환기 스테이지를 포함한다. 또한 다운믹서(DMX)로 지칭되는 포맷 변환기 스테이지는 오디오 출력 신호의 채널 구성을 재생을 위해 사용되는 변환기에 적응하도록 구성된다. 예를 들어, 포맷 변환기 스테이지는 5.1 서라운드 신호를 스테레오 신호로 변환할 수 있다.
본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인은 오디오 출력 신호의 라우드니스를 정규화하도록 구성되는 라우드니스 정규화 스테이지를 포함한다.
라우드니스 정규화 스테이지는 출력 신호가 올바른 타겟 라우드니스 레벨을 갖도록 오디오 입력 신호를 스케일링할 수 있다. 스케일링 인자는 프로그램 기준 레벨(PRL)과 디코더 타겟 레벨(DTL) 사이의 차로부터 도출되고, 디코더의 메타데이터 및 파라미터 제어에 의해 라우드니스 정규화 블록에 제공된다. 프로그램 기준 레벨은 예를 들어 파일 헤더 내에 포함되는 라우드니스 정보로부터 얻을 수 있는 반면에, 디코더 타겟 레벨은 디코더 구성 파라미터이다. 다수의 프로그램 기준 레벨 값은 각각 적용된 동적 범위 제어 시퀀스 및/또는 적용된 다운믹스의 특정 구성에 대응하는 라우드니스 정보 내에 제공되는 것이 가능하다. 이 경우에, 메타데이터 및 파라미터 제어 스테이지는 주어진 오디오 디코더의 구성을 고려하면서 올바른 프로그램 기준 레벨의 값을 선택한다. 라우드니스 처리 단계의 위치는 오디오 디코더의 실제 출력 구성에 따라 달라진다. 일반적으로, 라우드니스 정규화는 적용 가능하다면 예를 들어 믹서 후 또는 포맷 변환 후에 오디오 디코더의 출력 채널에서 수행되어야 한다.
본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인은 임계 값을 초과하는 경우에 오디오 출력 신호의 피크를 제한하도록 구성된 피크 리미터 스테이지를 포함한다.
본 발명의 바람직한 실시예에 따르면, 신호 흐름의 방향의 피크 리미터 스테이지는 오디오 조절 체인의 최종 조절 스테이지이다.
전형적인 오디오 디코더의 오디오 처리 체인에 피할 수 없는 샘플 클리핑의 다수의 잠재적 소스가 있으며, 이러한 소스는 다음과 같은 것을 포함한다:
Figure pct00001
파라메트릭 코딩 도구
Figure pct00002
바이노럴(binaural) 처리
Figure pct00003
다운믹싱, 포맷 변환, 렌더링
Figure pct00004
라우드니스 정규화(특히 높은 타겟 레벨에 대해)
Figure pct00005
디코더 출력에서의 양자화
따라서, 예를 들어 시간 도메인 출력 신호가 부동 소수점에서 고정 소수점 펄스 코드 변조 포맷(PCM 포맷)으로 변환되기 직전에 피크 리미터 스테이지는 오디오 샘플의 어떤 원하지 않는 클리핑을 방지하기 위해 오디오 디코더의 처리 체인의 맨 끝에 배치된다. 이것은 또한 이전의 섹션에서 설명된 임의의 동적 범위 제어 스테이지 및 라우드니스 정규화 스테이지는 피크 리미터 스테이지 앞에 위치되는 것을 의미한다. MPEG-H 3D Audio [M30324]의 맥락에서, 피크 리미터 스테이지는 실제 재생 구성에 따라 입력으로서 상이한 신호를 수신한다. 바이노럴 렌더링의 경우에, 헤드폰에 대한 2개의 출력 채널은 피크 리미터 스테이지에 의해 처리될 수 있다. 믹서의 출력 채널이 직접 재생되는 경우, 피크 리미터 스테이지는 대응하는 스피커 채널을 처리할 수 있다. 이는 믹서 출력 채널이 먼저 포맷 변환기에 의해 (예를 들어, 다운믹스되는) 상이한 스피커 구성으로 변환되는 경우에 적용한다.
피크 리미터 스테이지는 제한 임계 값을 초과하는 시간 도메인의 신호에서의 오디오 샘플을 검출할 수 있고, 오디오 출력 신호의 샘플이 항상 제한 임계 값 아래로 유지되도록 각각의 신호 부분에 레벨 감소를 적용할 수 있다. 가청 왜곡을 방지하기 위해, 레벨 감소는 점진적으로 수행되어야 하며, 즉 신호에 적용된 이득 인자는 단지 시간이 지남에 따라 천천히 변경될 수 있으며, 이는 이득 평활 필터에 의해 확실하게 수행된다. 리미터 이득 인자를 적용하기 전에 피크 리미터 스테이지의 입력 신호의 예견(look-ahead) 지연은 또한 급격한 신호 피크 전에 이미 시작하는 이득의 평활한 감소를 허용하기 위해서도 사용된다. 지연은 주어진 요구 사항으로 조절될 수 있으며, 실제적인 선택은 5ms이다. 멀티채널 오디오의 경우에, 공통 이득 인자는 계산 복잡성을 줄이기 위해 모든 오디오 채널에 적용될 수 있다.
파일 헤더의 라우드니스 정보에 포함될 수 있는 오디오 신호의 최대 피크에 관한 정보는 디코더 구성이 오디오 처리 체인에서 클리핑이 발생하지 않는 것을 의미하는 경우에 피크 리미터 스테이지를 폐기하는데 이용될 수 있다. 예를 들어, 오디오 디코더가 부동 소수점 정밀도를 가진 오디오 샘플을 출력하고, 클리핑 방지가 나중에 재생 장치의 오디오 체인에서 수행되는 경우 피크 리미터 스테이지가 또한 폐기될 수 있다. 확실히, 주어진 재생 시나리오에 대한 디코더 구성이 올바른 안내 클리핑 방지 이득의 적용을 허용하는 경우, 피크 리미터 스테이지는 또한 추가적인 코덱 클리핑이 발생하지 않는 경우에 작동되지 않을 수 있다.
피크 리미터는 사실상 필수 구성 요소인 것으로 간주될 수 있다. 디코더의 오디오 처리 체인 내에는 클리핑의 많은 소스가 있다. 안내 클리핑 방지 이득 시퀀스를 제공함으로써 특정 구성이 커버될 수 있다. 그러나, 디코더의 유연한 동작을 위해, 피크 리미터는클리핑이 발생하지 않도록 보장하기 위해 제공될 수 있다.
본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인은 오디오 객체를 오디오 출력 신호의 채널로 믹싱하도록 구성된 객체 렌더러(object renderer) 스테이지를 포함한다.
본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인은 오디오 출력 신호를 재생하기 위해 사용되는 변환기 시스템으로의 오디오 출력 신호의 특성을 조절하도록 구성되는 변환기 적응 스테이지를 포함한다.
피크 리미터 스테이지의 필요한 제한 강도를 감소시키기 위하여, 예를 들어 등화 필터에 의해 구현되는 주파수 의존 변환기 적응 처리는 처리 체인에 포함될 수 있다.
변환기 적응 스테이지는 재생(스피커 또는 헤드폰)에 사용되는 변환기의 특성에 대한 오디오 입력 신호 및 정보를 수신한다.
특히 변환기가 제한된 주파수 범위를 가지며, 이에 의해 오디오 출력 신호의 주파수 범위를 제한하는 경우, 변환기 적응 스테이지의 태스크는 변환기의 특성에 오디오 출력 신호를 적응시키기 위한 것이다. 피크 제한 스테이지에 앞서 변환기의 전달 함수를 모방하는(mimicking) 적절한 필터를 사용하여 주파수 범위를 제한함으로써, 피크 리미터 스테이지의 입력 신호는 레벨이 감소된다. 결과적으로, 제한 임계 값을 초과하는 신호 피크는 레벨이 감소된다. 결과적으로, 피크 제한 스테이지의 효과는 덜 심각하다. 이것은
- 피크 제한은 신호를 가청 변경할 수 있는 반면에, 변환기 적응은 신호에 가청 변경을 일으키지 않고,
- 최대 피크 레벨이 제한 임계값보다 낮도록 신호가 수정되면, 피크 리미터는 덜 계산적 부하(less computational load)를 도입하기 때문에 유리하다.
필터링 외에, 변환기 적응 스테이지는 또한 변환기의 대역 제한이 보상되도록 신호 적응 처리를 포함할 수 있다. 특히, 매우 작은 변환기는 저주파 신호를 재생할 수 없다.
이것은 변환기의 감지된 저음 응답을 증가시킴으로써, 예를 들어 저주파 음색(low-frequency notes)의 고조파를 인위적으로 생성시켜 신호에 추가함으로써 보상될 수 있다.
추가의 양태에서, 본 발명은 제 1 항 내지 제 9 항 중 어느 한 항에 따른 오디오 인코더에 의해 생성되는 오디오 비트스트림과 오디오 비트스트림에 관련된 메타데이터 비트스트림을 디코딩하기 위한 오디오 디코더, 특히 청구항들에 따른 오디오 디코더를 동작하기 위한 방법을 제공하며, 방법은
오디오 비트스트림으로부터 디코딩된 오디오 신호를 도출하는 단계;
오디오 처리 체인의 오디오 출력 신호의 특성을 조절하기 위한 복수의 조절 스테이지를 가진 오디오 처리 체인을 이용하는 단계로서, 조절 체인의 조절 스테이지인 동적 범위 제어 스테이지에 의해 오디오 출력 신호의 동적 범위를 조절하는 단계와, 조절 체인의 조절 스테이지인 안내 클리핑 방지 스테이지에 의해 오디오 출력 신호의 클리핑을 방지하는 단계를 포함하는 상기 이용하는 단계;
메타데이터 디코더의 부분 상에서, 메타데이터 비트스트림을 수신하여, 메타데이터 비트스트림으로부터 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스를 추출하는 단계;
동적 범위 제어 이득 시퀀스의 적어도 부분을 동적 범위 제어 스테이지에 공급하는 단계; 및
안내 클리핑 방지 이득 시퀀스의 적어도 부분을 안내 클리핑 방지 스테이지에 공급하는 단계를 포함한다.
다른 양태에서, 본 발명은 컴퓨터 또는 프로세서 상에서 실행할 때 상술한 방법을 수행하기 위한 컴퓨터 프로그램을 제공한다.
본 발명의 바람직한 실시예는 후속하여 첨부한 도면에 관련하여 설명될 것이다.
도 1은 본 발명에 따른 오디오 인코더의 실시예를 개략도로 도시한다.
도 2는 본 발명에 따른 오디오 디코더의 제 1 실시예를 개략도로 도시한다.
도 3은 본 발명에 따른 오디오 디코더의 제 2 실시예를 개략도로 도시한다.
도 4는 본 발명에 따른 오디오 디코더의 제 3 실시예를 개략도로 도시한다.
도 5는 본 발명에 따른 오디오 디코더의 제 4 실시예를 개략도로 도시한다.
도 1은 본 발명에 따른 오디오 인코더(1)의 실시예를 개략도로 도시한다. 도 1은 동적 범위 제어 이득 시퀀스 및 안내 클리핑 방지 이득 시퀀스의 인코딩을 도시한다.
오디오 인코더(1)는 하나 이상의 오디오 채널 AC 및/또는 하나 이상의 오디오 객체 AO를 포함하는 오디오 비트스트림을 생성하도록 구성되고, 오디오 인코더(1)는
오디오 디코더(3)(도 2 참조)의 동적 범위 제어 스테이지(5)(도 2 참조)에 대한 하나 이상의 동적 범위 제어 이득을 포함하는 오디오 프레임에 대한 적어도 하나의 동적 범위 제어 이득 시퀀스(DS)를 수신하고;
오디오 프레임에 대한 적어도 하나의 안내 클리핑 방지 이득 시퀀스(GS)를 수신하고, 상기 안내 클리핑 방지 이득 시퀀스(GS)는 오디오 디코더(3)의 안내 클리핑 방지 스테이지(6)(도 2 참조)에 대한 하나 이상의 안내 클리핑 방지 이득을 포함하며;
상기 동적 범위 제어 이득 시퀀스(DS) 중 적어도 하나와 상기 안내 클리핑 방지 이득 시퀀스(GS) 중 적어도 하나를 메타데이터 비트스트림(MBS) 내에 포함시키도록
구성된 메타데이터 비트스트림(MBS)을 생성하기 위한 메타데이터 인코더(2)를 포함한다.
본 발명의 개념은 동적 범위 압축(DRC) 및 안내 클리핑 방지(GCP)에 대한 공동 솔루션의 필요한 기능을 함께 제공하는 다수의 처리 블록의 조합에 기초한다.
본 발명의 개념은 특히 예를 들어 [M30100, M30101]에 정의된 바와 같은 관련된 구성 정보가 이미 오디오 인코더(1) 및 오디오 디코더(3)에서 이용 가능한 오디오 시스템에 적합하다. 이러한 정보는 예를 들어 파일 기반 전송을 위한 헤더 또는 통합 음성 및 오디오 코딩(USAC) 구성 확장에 포함될 수 있다. 구성 정보는 채널 레이아웃, 다운믹스 명령어(예를 들어, 다운믹스 계수), 동적 범위 제어 명령어(예를 들어, 적용된 동적 범위 제어 특성, 트랙을 위한 동적 범위 제어 이득 시퀀스의 번호), 및 라우드니스 정보(예를 들어 프로그램 라우드니스, 앵커 라우드니스, 실제 피크 값)를 포함할 수 있다. 더 많은 상세 사항은 [M30100, M30101]에서 발견될 수 있다. 이는 동적 범위 제어 명령어 박스의 정보와 동일한 방식으로 처리될 수 있는 대응하는 안내 클리핑 방지 명령어에 적용한다.
본 발명에 따른 오디오 인코더(1)는 오디오 디코더(3)의 동적 범위 제어 스테이지(5)에 대한 동적 범위 제어 이득 시퀀스(DS) 뿐만 아니라 오디오 디코더(3)의 안내 클리핑 방지 스테이지(6)에 대한 안내 클리핑 방지 이득 시퀀스(GS)를 포함하는 메타데이터 비트스트림(MBS)을 생성할 수 있으며, 동적 범위 제어 이득 시퀀스(DS)는 안내 클리핑 방지 이득 시퀀스(GS)와 별도로 송신될 수 있다.
메타데이터 인코더는 외부에서, 예를 들어 콘텐츠 제공자에 의해 운영되는 외부 도구에 의해 제공되는 동적 범위 제어 이득 시퀀스(DS)를 입력으로서 사용한다.
동적 범위 제어 이득의 가능한 시간적 해상도는 몇몇 샘플의 범위 내에 있을 수 있다. 동적 범위 제어 이득 값은 일반적으로 최대 0.125 dB의 충분한 해상도로 표현될 수 있다.
추가적으로, 메타데이터 인코더는 안내 클리핑 방지 이득 시퀀스(GS)를 입력으로서 취한다.
압축된 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)는 통합된 음성 및 오디오 코딩 확장 페이로드에 포함된 보조 정보로서 수신기로 전송될 수 있다.
동적 범위 제어 이득 시퀀스(DS)는 동적 범위 압축을 수행하기 위해 동적 범위 제어 이득만을 포함하는 반면에, 클리핑 방지를 위한 안내 클리핑 방지 이득은 안내 클리핑 방지 이득 시퀀스(GS)에 의해 수용된다는 것이 주목되어야 한다.
안내 클리핑 방지 이득의 시간적 해상도는 동적 범위 제어 이득의 경우와 동일할 수 있다.
안내 클리핑 방지 이득 시퀀스(GS)는 특정 타겟 레벨 및 다운믹스/포맷 변환기 구성에 대한 오디오 디코더(3)의 오디오 출력 신호(AOS)(도 2 참조)에서 샘플 클리핑이 발생하지 않는다는 것을 보장하는데 사용된다. 각 안내 클리핑 방지 이득 시퀀스(GS)는 특정 다운믹스/포맷 변환기 구성, 특정 타겟 레벨, 및 객체에 대한 특정 동적 범위 제어 이득 시퀀스와 함께 채널에 대한 특정 동적 범위 제어 이득 시퀀스의 조합을 위해 최적화될 수 있다. 어떤 안내 클리핑 방지 이득 시퀀스(GS)가 어떤 동적 범위 제어 이득 시퀀스(DS) 와 관련되는 것에 대한 정보는 통합된 음성 및 오디오 코딩 구성 확장의 파일 헤더에 포함된 안내 클리핑 방지 명령어에 포함될 수 있다. 그것은 또한 안내 클리핑 방지 이득이 오디오 인코더(1)에서 결정된 타겟 레벨에 관계된 정보를 포함할 수 있다.
상술한 동적 범위 처리를 위한 본 발명의 개념은 전체 오디오 처리 체인(4)(도 2 참조)의 인코더 측 제어에 대한 접근을 나타낸다. 동적 범위 제어 및 안내 클리핑 방지를 위해 사용되는 메타데이터의 분리는 각각의 이득의 별도의 수정(스케일링 또는 매핑)을 허용하고, 상기 수정은 오디오 디코더 구성 및 재생 시나리오에 의존한다.
본 발명의 개념에 의하면, 동적 범위 제어 이득이 안내 클리핑 방지 이득 GS과 별도로 송신되는 경우에 동적 범위 제어 이득 시퀀스(DS)의 기본 동적 범위 제어 특성을 무거운 압축에서 가벼운 압축으로 변화시킬 수 있다. 이것은 동적 범위 제어 이득 시퀀스(DS)의 값의 적절한 스케일링 또는 매핑에 의해 달성될 수 있다.
본 발명의 개념은 소정의 품질 요구 사항을 충족하기 위해 오디오 디코더(3)의 최종 오디오 출력 신호(AOS)의 전체 제어를 콘텐츠 제공자에게 제공한다. 이 경우, 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)는 모두 가장 중요한 것으로 간주되는 특정 오디오 디코더 구성에 포함될 수 있다. 피크 리미터 스테이지(12)는 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)의 조합된 사용으로 인해 많은 경우에 폐기될 수 있다. 안내 클리핑 방지 이득을 간단히 적용함으로써 달성되는 오디오 디코더 측에서의 안내 클리핑 방지는 피크 리미터(12)를 사용하는 것보다 계산적으로 더욱 효율적이다는 것이 주목되어야 한다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더(2)는 상이한 동적 범위 제어 이득을 포함하는 동일한 오디오 프레임에 대한 적어도 2개의 동적 범위 제어 이득 시퀀스를 수신하고, 상이한 동적 범위 제어 이득을 포함하는 적어도 2개의 동적 범위 제어 이득 시퀀스(DS)를 메타데이터 비트스트림(MBS) 내에 포함하도록 구성된다.
어떤 동적 범위 제어 특성이 상이한 동적 범위 제어 이득 시퀀스(DS)와 관련되는 것에 대한 정보는 파일 기반 전송의 경우 또는 통합된 음성 및 오디오 코딩 구성 확장에서의 파일 헤더에 포함된 동적 범위 제어 명령어에 포함될 수 있다.
이러한 특징에 의해 상이한 압축 특성을 가진 오디오 디코더(3)에서 출력 신호를 활성화하기 위해 오디오 트랙의 채널에 대한 다수의 동적 범위 제어 이득 시퀀스(DS)를 제공할 수 있다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 상이한 오디오 채널 AC 및/또는 상이한 오디오 객체 AO에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 수신하도록 구성되며, 메타데이터 인코더(2)는 상이한 오디오 채널 AC 및/또는 상이한 오디오 객체 AO에 관련된 적어도 2개의 동적 범위 제어 이득 DS를 포함하고, 선택적으로, 오디오 채널 AC 및/또는 오디오 객체 AO에 대한 동적 범위 제어 이득의 관계를 메타데이터 비트스트림(MBS) 내에 포함하도록 구성된다.
각 동적 범위 제어 시퀀스(DS) 내에서 상이한 오디오 채널 AC 또는 채널 AC의 그룹에 대해 상이한 동적 범위 제어 이득의 세트를 정의할 수 있으며, 각 오디오 채널 AC는 일반적으로 단 하나의 채널 그룹과 연관된다. 예를 들어, 멀티채널 영화 사운드에서는 종종 특정 동적 범위 제어 이득을 대화 채널에 적용하는 것이 바람직하다. 예를 들어 전방 좌측, 전방 우측, 후방 좌측, 후방 우측과 같은 나머지 채널은 상이한 동적 범위 제어 이득을 이용하여 처리될 수 있다.
채널의 경우에서 유추하여, 오디오 객체 AO 또는 객체 AO의 그룹과 관련된 다수의 동적 범위 제어 시퀀스(DS)는 지원될 수 있다. 이러한 객체 관련 동적 범위 제어 시퀀스(DS)는 또한 동적 범위 제어 이득의 채널 관련된 세트 내의 특정 채널 그룹과 연관되는 것으로 간주될 수 있다. 본 명세서에서 용어 오디오 객체는 초인종과 같은 단일 소스 사운드에 관계한다.
어떤 동적 범위 제어 특성이 상이한 동적 범위 제어 이득 시퀀스(DS)와 관련되는 것에 대한 정보는 파일 기반 전송의 경우 또는 통합된 음성 및 오디오 코딩 구성 확장에서의 파일 헤더에 포함된 동적 범위 제어 명령어에 포함될 수 있다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더(2)는 오디오 디코더의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 수신하도록 구성되며, 메타데이터 인코더(2)는 오디오 디코더(3)의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득 DS를 포함하고, 선택적으로, 오디오 디코더(3)의 주파수 대역에 대한 동적 범위 제어 이득의 관계를 메타데이터 비트스트림(MBS) 내에 포함하도록 구성된다.
다중 대역 동적 범위 제어를 지원하는 임의의 확장에서, 메타데이터 인코더(2)는 또한 상이한 주파수 대역에 대해 상이한 동적 범위 제어 이득을 갖는 동적 범위 제어 이득 시퀀스(DS)를 입력으로서 수용하도록 확장될 수 있다.
어떤 동적 범위 제어 특성이 상이한 동적 범위 제어 이득 시퀀스(DS)와 관련되는 것에 대한 정보는 파일 기반 전송의 경우 또는 통합된 음성 및 오디오 코딩 구성 확장에서의 파일 헤더에 포함된 동적 범위 제어 명령어에 포함될 수 있다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스(GS)를 수신하고, 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스(GS)를 메타데이터 비트스트림(MBS) 내에 포함하도록 구성된다.
본 발명의 바람직한 실시예에 따르면, 각 동적 범위 제어 시퀀스(DS)는 안내 클리핑 방지 이득 시퀀스(GS) 중 하나에 관련되고, 메타데이터 인코더(2)는 동적 범위 제어 시퀀스(DS)와 안내 클리핑 방지 이득 시퀀스(GS) 사이의 관계를 메타데이터 비트스트림(MBS) 내에 포함하도록 구성된다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 인코더는 상이한 오디오 채널 AC 및/또는 상이한 오디오 객체 AO에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 이득 시퀀스(GS)를 수신하도록 구성되며, 메타데이터 인코더(2)는 상이한 오디오 채널 AC 및/또는 상이한 오디오 객체 AO에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 시퀀스(GS)를 포함하도록 구성되고, 선택적으로, 오디오 채널 AC 및/또는 오디오 객체 AO에 대한 안내 클리핑 방지 이득의 관계를 메타데이터 비트스트림(MBS) 내에 포함하도록 구성된다.
동적 범위 제어 이득과 같이, 각각의 안내 클리핑 방지 시퀀스(GS) 내에서 상이한 오디오 채널 AC 또는 오디오 채널 AC의 그룹에 대해 상이한 안내 클리핑 방지 이득의 세트를 정의할 수 있으며, 각 오디오 채널 AC는 일반적으로 단 하나의 오디오 채널 그룹과 연관된다. 전형적인 동작 모드에서, 동일한 안내 클리핑 방지 이득은 모든 오디오 채널 AC에 적용된다.
오디오 객체 AO에 대한 안내 클리핑 방지 이득 시퀀스의 정의는 동적 범위 제어의 경우와 유사하다.
다른 양태에서, 본 발명은 하나 이상의 오디오 채널 및/또는 하나 이상의 오디오 객체를 포함하는 오디오 비트스트림을 생성하기 위한 오디오 인코더(1)를 동작하기 위한 방법을 제공하고, 오디오 인코더는 메타데이터 비트스트림을 생성하기 위한 메타데이터 인코더(2)를 포함하며, 방법은
메타데이터 인코더(2)의 부분 상에서, 오디오 디코더(3)의 동적 범위 제어 스테이지(5)에 대한 하나 이상의 동적 범위 제어 이득을 포함하는 적어도 하나의 동적 범위 제어 이득 시퀀스(DS)를 수신하는 단계;
메타데이터 인코더(2)의 부분 상에서, 오디오 디코더(3)의 안내 클리핑 방지 스테이지(6)에 대한 하나 이상의 안내 클리핑 방지 이득을 포함하는 적어도 하나의 안내 클리핑 방지 이득 시퀀스(GS)를 수신하는 단계; 및
메타데이터 인코더(2)의 부분 상에서, 상기 동적 범위 제어 이득 시퀀스(DS) 중 적어도 하나와 상기 안내 클리핑 방지 이득 시퀀스(GS) 중 적어도 하나를 메타데이터 비트스트림(MBS) 내에 포함시키는 단계를 포함한다.
추가의 양태에서, 본 발명은 컴퓨터 또는 프로세서상에서 실행될 때 상술한 방법을 수행하기 위한 컴퓨터 프로그램을 제공한다.
디코더 측 처리를 위한 다음의 도면은 [M30324]에 제시된 바와 같이 3D 오디오 코딩 접근 방식에 대한 제안에 기초한다.
도 2는 본 발명에 따른 오디오 디코더(3)의 제 1 실시예를 개략도로 도시한다.
특히 본 발명에 따른 오디오 인코더(1)에 의해 생성되는 오디오 비트스트림과, 오디오 비트스트림에 관련된 메타데이터 비트스트림(MBS)을 디코딩하기 위한 오디오 디코더(3)는
오디오 비트스트림으로부터 도출되는 디코딩된 오디오 신호(DAS)를 수신하고, 오디오 처리 체인(4)의 오디오 출력 신호(AOS)의 특성을 조절하도록 구성되며, 오디오 출력 신호(AOS)의 동적 범위를 조절하기 위한 동적 범위 제어 스테이지(5)와, 오디오 출력 신호(AOS)의 클리핑의 방지를 위한 안내 클리핑 방지 스테이지(6)를 포함하는 복수의 조절 스테이지(5,6,10,11,12,13,14)(또한 도 3,4,5 참조)를 포함하는 오디오 처리 체인(4); 및
메타데이터 비트스트림(MBS)을 수신하고, 메타데이터 비트스트림(MBS)으로부터 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)를 추출하도록 구성되는 메타데이터 디코더(7)로서, 동적 범위 제어 이득 시퀀스(DS)의 적어도 부분은 동적 범위 제어 스테이지(5)에 공급되고, 안내 클리핑 방지 이득 시퀀스(GS)의 적어도 부분은 안내 클리핑 방지 스테이지(6)에 공급되는 메타데이터 디코더(7)를 포함한다.
메타데이터 디코더(7)는 예를 들어 통합된 음성 및 오디오 코딩 디코더로부터 압축된 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)를 포함하는 메타데이터 비트스트림(MBS)을 수신한다.
메타데이터 디코더(7)는 압축된 메타데이터 비트스트림(MBS)으로부터 압축되지 않은 동적 범위 제어 이득 시퀀스(DS)를 생성한다. 추가적으로, 생성된 동적 범위 제어 이득의 스케일링 또는 매핑이 적용될 수 있다.
메타데이터 디코더(7)는 추가적으로 압축된 안내 클리핑 방지 메타데이터를 포함하는 비트스트림(MBS)으로부터 압축되지 않은 안내 클리핑 방지 이득 시퀀스(GS)를 생성한다. 안내 클리핑 방지 이득의 스케일링 또는 매핑이 적용될 수 있다. 이것은 오디오 디코더의 타겟 레벨이 오디오 인코더(1)에서 안내 클리핑 방지 이득 시퀀스(GS)를 결정하는데 사용된 타겟 레벨보다 낮은 경우에 특히 유용하다. 그 다음, 안내 클리핑 방지 이득의 매핑이 가능하고, 클리핑이 오디오 디코더 출력 신호(AOS)에서 발생하지 않는 것을 여전히 보장하면서 신호 헤드룸을 최적으로 복원한다.
동적 범위 제어 스테이지(5)는 메타데이터 디코더(7)로부터 직간접적으로 각각의 오디오 프레임에 대해 압축되지 않고 임의로 스케일링되거나 매핑된 동적 범위 제어 이득 시퀀스(DS)를 수신한다. 메타데이터 디코더(7)는 또한 최종 시간 도메인의 동적 범위 제어 이득 값이 오디오 샘플의 시간적 해상도에 대응하는 시간적 해상도로 보간되는 것을 보장할 수 있다. 이러한 최종 동적 범위 제어 이득은 그 후 디코딩된 오디오 신호(DAS)에 적용될 수 있고, 여기서 채널 및/또는 객체로의 어떤 동적 범위 제어 시퀀스의 할당이 관찰된다.
안내 클리핑 방지 스테이지(6)는 메타데이터 디코더(7)로부터 직간접적으로 각각의 오디오 프레임에 대해 압축되지 않고 임의로 스케일링되거나 매핑된 안내 클리핑 방지 이득 시퀀스(GS)를 수신한다. 메타데이터 디코더(7)는 또한 최종 시간 도메인의 안내 클리핑 방지 이득 값이 오디오 샘플의 시간적 해상도에 대응하는 시간적 해상도로 보간되는 것을 보장할 수 있다. 이러한 최종 안내 클리핑 방지 이득은 그 후 디코딩된 오디오 신호 또는 디코딩된 오디오 신호(DAS)로부터 도출되는 신호 ISG(또는 도 3, 도 4 및 도 5의 IGS)에 적용될 수 있으며, 여기서 채널 및/또는 객체로의 어떤 안내 클리핑 방지 시퀀스의 할당이 관찰된다.
본 발명은 인코더 측에서 전체 처리 체인의 제어를 그만두면서 오디오 디코더 측에서 유연성을 제공한다. 동적 범위 제어 및 안내 클리핑 방지를 위해 사용되는 메타데이터의 분리는 각각의 이득의 별도의 수정(스케일링 또는 매핑)을 허용하고, 상기 수정은 오디오 디코더 구성 및 재생 시나리오에 의존한다.
동적 범위 제어 이득이 안내 클리핑 방지 이득과 별도로 송신되는 경우에 본 발명은 동적 범위 제어 이득 시퀀스의 기본 동적 범위 제어 특성을 무거운 압축에서 가벼운 압축으로 변화시키는 것을 허용한다. 이것은 동적 범위 제어 이득 시퀀스(DS)의 값의 적절한 스케일링 또는 매핑에 의해 달성될 수 있다.
디코더 타겟 레벨이 오디오 인코더(1)에서 안내 클리핑 방지를 위한 이득을 계산하기 위해 사용되는 타겟 레벨보다 낮은 경우에, 신호 피크의 감소된 감쇠는 안내 클리핑 방지 이득을 적절히 스케일링함으로써 오디오 디코더(3)에서 허용될 수 있다. 그 다음, 강한 신호 피크의 레벨이 유지될 수 있거나, 수정되지 않은 방식으로 안내 클리핑 방지 이득을 적용하는 경우에 비해 적어도 증가될 수 있으며, 이것은 이용 가능한 헤드룸이 보존될 수 있다는 것을 의미한다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더(7)는 상이한 동적 범위 제어 이득을 포함하는 동일한 오디오 프레임에 대한 적어도 2개의 동적 범위 제어 이득 시퀀스(DS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성된다.
어떤 동적 범위 제어 특성이 상이한 동적 범위 제어 이득 시퀀스(DS)와 관련되는 것에 대한 정보는 파일 기반 전송의 경우 또는 통합된 음성 및 오디오 코딩 구성 확장에서의 파일 헤더에 포함된 동적 범위 제어 명령어에 포함될 수 있다.
이러한 특징에 의해 상이한 압축 특성을 가진 디코더(1)에서 오디오 출력 신호(AOS)를 활성화하기 위해 오디오 트랙의 채널에 대한 다수의 동적 범위 제어 이득 시퀀스(DS)를 제공할 수 있다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더(7)는 오디오 디코더(3)의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성된다.
다중 대역 동적 범위 제어를 지원하는 임의의 확장에서, 메타데이터 디코더(7)는 또한 상이한 주파수 대역에 대해 상이한 동적 범위 제어 이득을 갖는 동적 범위 제어 이득 시퀀스(DS)를 입력으로서 수용하도록 확장될 수 있다.
다중 대역 동적 범위 제어 확장의 경우, 시간 도메인의 오디오 신호는 다중 대역 동적 범위 제어 이득을 적용하기 전에 적절한 주파수 도메인의 표현으로 변환되어야 한다.
어떤 동적 범위 제어 특성이 상이한 동적 범위 제어 이득 시퀀스(DS)와 관련되는 것에 대한 정보는 파일 기반 전송의 경우 또는 통합된 음성 및 오디오 코딩 구성 확장에서의 파일 헤더에 포함된 동적 범위 제어 명령어에 포함될 수 있다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더(7)는 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스(GS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성된다.
이러한 특징에 의해 대응하는 동적 범위 제어 이득 시퀀스(DS)와 일치하기 위해 오디오 트랙에 대한 다수의 안내 클리핑 방지 이득 시퀀스(GS)를 제공할 수 있다.
추가의 양태에서, 본 발명은 특히 본 발명에 따른 오디오 인코더에 의해 생성되는 오디오 비트스트림과 오디오 비트스트림에 관련된 메타데이터 비트스트림(MBS)을 디코딩하기 위한 오디오 디코더(3), 특히 본 발명에 따른 오디오 디코더(3)를 동작하기 위한 방법을 제공하며, 방법은
오디오 비트스트림으로부터 디코딩된 오디오 신호(DAS)를 도출하는 단계;
오디오 처리 체인의 오디오 출력 신호(AOS)의 특성을 조절하기 위한 복수의 조절 스테이지(5,6,10,11,12,13,14)를 가진 오디오 처리 체인을 이용하는 단계로서, 조절 체인(4)의 조절 스테이지(5)인 동적 범위 제어 스테이지(5)에 의해 오디오 출력 신호(AOS)의 동적 범위를 조절하는 단계와, 조절 체인(4)의 조절 스테이지(6)인 안내 클리핑 방지 스테이지(6)에 의해 오디오 출력 신호(AOS)의 클리핑을 방지하는 단계를 포함하는 상기 이용하는 단계;
메타데이터 디코더(7)의 부분 상에서, 메타데이터 비트스트림(MBS)을 수신하여, 메타데이터 비트스트림(MBS)으로부터 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)를 추출하는 단계;
동적 범위 제어 이득 시퀀스(DS)의 적어도 부분을 동적 범위 제어 스테이지(5)에 공급하는 단계; 및
안내 클리핑 방지 이득 시퀀스(GS)의 적어도 부분을 안내 클리핑 방지 스테이지(6)에 공급하는 단계를 포함한다.
다른 양태에서, 본 발명은 컴퓨터 또는 프로세서 상에서 실행할 때 상술한 방법을 수행하기 위한 컴퓨터 프로그램을 제공한다.
도 3은 본 발명에 따른 오디오 디코더(3)의 제 2 실시예를 개략도로 도시한다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더(7)는 상이한 오디오 채널에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성된다.
각 동적 범위 제어 시퀀스(DS)내에서 상이한 채널 또는 채널의 그룹에 대해 상이한 동적 범위 제어 이득의 세트를 정의할 수 있으며, 각 채널은 일반적으로 단 하나의 채널 그룹과 연관된다. 예를 들어, 멀티채널 영화 사운드에서는 종종 특정 동적 범위 제어 이득을 대화 채널에 적용하는 것이 바람직하다. 예를 들어 전방 좌측, 전방 우측, 후방 좌측, 후방 우측과 같은 나머지 채널은 상이한 동적 범위 제어 이득을 이용하여 처리될 수 있다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더(7)는 상이한 오디오 채널에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 이득 시퀀스(GS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성된다.
동적 범위 제어 이득과 같이, 각각의 안내 클리핑 방지 시퀀스 내에서 상이한 채널 또는 채널의 그룹에 대해 상이한 안내 클리핑 방지 이득의 세트를 정의할 수 있으며, 각 채널은 일반적으로 단 하나의 채널 그룹과 연관된다. 전형적인 동작 모드에서, 동일한 안내 클리핑 방지 이득은 모든 채널에 적용된다.
본 발명의 바람직한 실시예에 따르면, 오디오 디코더(3)는 구성 제공 스테이지(9)로부터 수신된 구성 정보에 기초하여(또한 도 4 및 도 5 참조) 메타데이터 및 파라미터 DS, GS, CLA, DI, DTL, PRL, IS, OMD, ICT를 조절 스테이지(5,6,10,11,12,13,14)에 제공하도록 구성된 메타데이터 및 파라미터 제어 스테이지(8)를 더 포함한다.
오디오 디코더에서의 메타데이터 및 파라미터 제어 스테이지(8)는 이득 시퀀스 선택 신호 GSS를 메타데이터 디코더(7)로 송신함으로써 원하는 동적 범위 제어 이득 시퀀스(DS)에 따라 메타데이터 비트스트림(MBS)의 정확한 부분을 선택할 수 있다. 스케일링 및 매핑 정보는 또한 디코더 구성 정보 CI의 부분이거나 디코더 구성 정보 CI로부터 도출될 수 있다.
유추에 의해, 오디오 디코더(3)에서의 메타데이터 및 파라미터 제어 스테이지(8)는 원하는 안내 클리핑 방지 이득 시퀀스(GS)에 따라 비트스트림(MBS)의 정확한 부분을 선택한다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 및 파라미터 제어 스테이지(8)는, 복수의 동적 범위 제어 이득 시퀀스(DS)가 수신되는 경우에, 복수의 동적 범위 제어 이득 시퀀스(DS) 중 어떤 것이 동적 범위 제어 스테이지(5)에 공급되는지를 선택하도록 구성된다. 메타데이터 및 파라미터 제어 스테이지(8)의 부분 상에서의 동적 범위 제어 시퀀스(DS)의 선택은 채널 레이아웃 CLA, 다운믹스 명령어 DI, 객체 메타데이터 OMD(도 4 참조), 동적 범위 제어 명령어, 라우드니스 정보 PRL, 및 디코더 타겟 레벨 DTL과 같은 디코더 구성 정보 CI에 기초할 수 있고, 이득 시퀀스 선택 신호 GSS를 메타데이터 디코더(7)로 송신함으로써 실행될 수 있다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 및 파라미터 제어 스테이지(8)는, 복수의 안내 클리핑 방지 이득 시퀀스(GS)가 수신되는 경우에, 복수의 안내 클리핑 방지 이득 시퀀스(GS) 중 어떤 것이 안내 클리핑 방지 스테이지(6)에 공급되는지를 선택하도록 구성된다.
메타데이터 및 파라미터 제어 블록(8)의 부분 상에서의 안내 클리핑 방지 이득 시퀀스(GS)의 선택은 일반적으로 상술한 오디오 디코더 구성 정보 CI에 기초한다.
본 발명의 바람직한 실시예에 따르면, 신호 흐름의 방향으로의 동적 범위 제어 스테이지(5)는 오디오 조절 체인(4)의 제 1 조절 스테이지이다.
채널에 대한 동적 범위 제어 처리는 채널 그룹에 대한 상이한 이득을 가능하게 하기 위해 디코딩된 오디오 채널 AC의 잠재적 다운믹싱 또는 포맷 변환 전에 수행될 수 있다. 따라서, 동적 범위 제어 이득은 렌더링 전에 객체 AO에 적용된다(도 4 참조). 채널 AC 및 객체 AO 모두가 존재하는 경우에, 동적 범위 제어 처리의 위치는 그대로 두고: 채널 관련된 동적 범위 제어는 포맷 변환기 스테이지(10) 바로 전에 수행되어야 하는(도 4 참조) 반면에, 객체 관련된 동적 범위 제어는 객체 렌더러(13) 전에 수행된다(도 4 참조).
본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인(4)은 오디오 출력 신호(AOS)의 채널 구성을 조절하도록 구성되는 포맷 변환기 스테이지(10)를 포함한다. 또한 다운믹서(DMX)로 지칭되는 포맷 변환기 스테이지(10)는 오디오 출력 AOS의 채널 구성을 재생을 위해 사용되는 변환기에 적응하도록 구성된다. 예를 들어, 포맷 변환기 스테이지는 5.1 서라운드 신호를 스테레오 신호로 변환할 수 있다.
본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인(4)은 오디오 출력 신호(AOS)의 라우드니스를 정규화하도록 구성되는 라우드니스 정규화 스테이지(11)를 포함한다.
라우드니스 정규화 스테이지(11)는 출력 신호 IGS가 올바른 타겟 라우드니스 레벨을 갖도록 오디오 입력 신호 OCF를 스케일링할 수 있다. 스케일링 인자는 프로그램 기준 레벨 PRL과 디코더 타겟 레벨 DTL 사이의 차로부터 도출되고, 디코더의 메타데이터 및 파라미터 제어 스테이지(8)에 의해 라우드니스 정규화 스테이지(11)에 제공된다. 프로그램 기준 레벨 PRL은 예를 들어 파일 헤더 내에 포함되는 라우드니스 정보로부터 얻을 수 있는 반면에, 디코더 타겟 레벨은 디코더 구성 파라미터이다. 다수의 프로그램 기준 레벨(PRL) 값은 각각 적용된 동적 범위 제어 시퀀스(DS) 및/또는 적용된 다운믹스의 특정 구성에 대응하는 라우드니스 정보 내에 제공되는 것이 가능하다. 이 경우에, 메타데이터 및 파라미터 제어 스테이지(8)는 주어진 오디오 디코더의 구성을 고려하면서 올바른 프로그램 기준 레벨(PRL) 값을 선택한다. 라우드니스 처리 단계의 위치는 오디오 디코더(3)의 실제 출력 구성에 따라 달라진다. 일반적으로, 라우드니스 정규화는 적용 가능하다면 예를 들어 믹서 후 또는 포맷 변환 스테이지(10) 후에 오디오 디코더(3)의 출력 채널 상에서 수행되어야 한다.
본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인(4)은 임계 값을 초과하는 경우에 오디오 출력 신호(AOS)의 피크를 제한하도록 구성된 피크 리미터 스테이지(12)를 포함한다.
본 발명의 바람직한 실시예에 따르면, 신호 흐름의 방향의 피크 리미터 스테이지(12)는 오디오 조절 체인(4)의 최종 조절 스테이지이다.
전형적인 오디오 디코더의 오디오 처리 체인(4)에 피할 수 없는 샘플 클리핑의 다수의 잠재적 소스가 있으며, 이러한 소스는 다음과 같은 것을 포함한다:
Figure pct00006
파라메트릭 코딩 도구
Figure pct00007
바이노럴 처리
Figure pct00008
다운믹싱, 포맷 변환, 렌더링
Figure pct00009
라우드니스 정규화(특히 높은 타겟 레벨에 대해)
Figure pct00010
디코더 출력에서의 양자화
따라서, 예를 들어 시간 도메인 출력 신호가 부동 소수점에서 고정 소수점 펄스 코드 변조 포맷(PCM 포맷)으로 변환되기 직전에 피크 리미터 스테이지(12)는 오디오 샘플의 어떤 원하지 않는 클리핑을 방지하기 위해 오디오 디코더(3)의 처리 체인(4)의 맨 끝에 배치된다. 이것은 또한 이전의 섹션에서 설명된 임의의 동적 범위 제어 스테이지(5) 및 라우드니스 정규화 스테이지(11)가 피크 리미터 스테이지(12) 앞에 위치된다는 것을 의미한다. MPEG-H 3D Audio [M30324]의 맥락에서, 피크 리미터 스테이지는 실제 재생 구성에 따라 입력으로서 상이한 신호를 수신한다. 바이노럴 렌더링의 경우에, 헤드폰에 대한 2개의 출력 채널은 피크 리미터 스테이지(12)에 의해 처리될 수 있다. 믹서의 출력 채널이 직접 재생되는 경우, 피크 리미터 스테이지(12)는 대응하는 스피커 채널을 처리할 수 있다. 이는 믹서 출력 채널이 먼저 포맷 변환기(10)에 의해 (예를 들어, 다운믹스되는) 상이한 스피커 구성으로 변환되는 경우에 적용한다.
피크 리미터 스테이지(12)는 제한 임계 값을 초과하는 시간 도메인의 신호에서의 오디오 샘플을 검출할 수 있고, 오디오 출력 신호(AOS)의 샘플이 항상 제한 임계 값 아래로 유지되도록 각각의 신호 부분에 레벨 감소를 적용할 수 있다. 가청 왜곡을 방지하기 위해, 레벨 감소는 점진적으로 수행되어야 하며, 즉 신호에 적용된 이득 인자는 단지 시간이 지남에 따라 천천히 변경될 수 있으며, 이는 이득 평활 필터에 의해 확실하게 수행된다. 리미터 이득 인자를 적용하기 전에 피크 리미터 스테이지의 입력 신호의 예견 지연은 또한 급격한 신호 피크 전에 이미 시작하는 이득의 평활한 감소를 허용하기 위해 사용된다. 지연은 주어진 요구 사항으로 조절될 수 있으며, 실제적인 선택은 5ms이다. 멀티채널 오디오의 경우에, 공통 이득 인자는 계산 복잡성을 줄이기 위해 모든 오디오 채널에 적용될 수 있다.
파일 헤더의 라우드니스 정보에 포함될 수 있는 오디오 신호(DAS)의 최대 피크 IS에 관한 정보는 디코더 구성이 오디오 처리 체인에서 클리핑이 발생하지 않는 것을 의미하는 경우에 피크 리미터 스테이지(12)를 폐기하는데 이용될 수 있다. 예를 들어, 오디오 디코더(3)가 부동 소수점 정밀도를 가진 오디오 샘플을 출력하고, 클리핑 방지가 나중에 재생 장치의 오디오 체인에서 수행되는 경우 피크 리미터 스테이지(12)가 또한 폐기될 수 있다. 확실히, 주어진 재생 시나리오에 대한 디코더 구성이 올바른 안내 클리핑 방지 이득의 적용을 허용하는 경우, 피크 리미터 스테이지는 또한 추가적인 코덱 클리핑이 발생하지 않는 경우에 작동되지 않을 수 있다.
피크 리미터(12)는 사실상 필수 구성 요소인 것으로 간주될 수 있다. 오디오 디코더(3)의 오디오 처리 체인 내에는 클리핑의 많은 소스가 있다. 안내 클리핑 방지 이득 시퀀스를 제공함으로써 특정 구성이 커버될 수 있다. 그러나, 디코더의 유연한 동작을 위해, 피크 리미터는 클리핑이 발생하지 않도록 보장하기 위해 제공될 수 있다.
도 3에 도시된 바와 같이, 안내 클리핑 방지 처리는 오디오 채널의 포맷 변환 및 라우드니스 정규화 후에 수행될 수 있다. 포맷 변환이 적용되지 않는 경우, 안내 클리핑 방지 이득은 동적 범위 제어 스테이지(5)의 출력 ISG에 직접 적용될 수 있다.
도 4는 본 발명에 따른 오디오 디코더의 제 3 실시예를 개략도로 도시한다. 도 4는 오디오 객체 AO에 대한 동적 범위 제어 처리의 구성을 도시한다. 동적 범위 제어 처리는 렌더링 전에 오디오 객체 신호에서 수행된다. 라우드니스 정규화 및 클리핑 방지는 채널에 대한 객체 렌더링 후에 수행된다.
본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인(4)은 오디오 객체 AO를 오디오 출력 신호(AOS)의 채널로 믹싱하도록 구성된 객체 렌더러 스테이지(13)를 포함한다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더(7)는 상이한 오디오 객체 AO에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성된다.
채널의 경우에서 유추하여, 오디오 객체 또는 객체의 그룹과 관련된 다수의 동적 범위 제어 시퀀스(DS)가 지원될 수 있다. 이러한 객체 관련 동적 범위 제어 시퀀스는 또한 동적 범위 제어 이득의 채널 관련된 세트 내의 특정 채널 그룹과 연관되는 것으로 간주될 수 있다. 본 명세서에서 용어 오디오 객체 AO는 초인종과 같은 단일 소스 사운드에 관계한다.
본 발명의 바람직한 실시예에 따르면, 메타데이터 디코더(7)는 상이한 오디오 객체에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 이득 시퀀스(GS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성된다.
동적 범위 제어 이득과 같이, 각각의 안내 클리핑 방지 시퀀스 내에서 상이한 오디오 채널 또는 오디오 채널의 그룹에 대해 상이한 안내 클리핑 방지 이득의 세트를 정의할 수 있으며, 각 채널은 일반적으로 단 하나의 오디오 객체와 연관된다. 전형적인 동작 모드에서, 동일한 안내 클리핑 방지 이득은 모든 오디오 객체에 적용된다.
객체에 대한 안내 클리핑 방지 이득 시퀀스의 정의는 동적 범위 제어의 경우와 유사하다.
도 5는 본 발명에 따른 오디오 디코더의 제 4 실시예를 개략도로 도시한다.
개념의 다른 실현은 추가적인 변환기 적응 블록(14)이 피크 리미터(12) 앞에 포함되는 도 5에 도시된다. 포맷 변환기 스테이지(10)는 다운믹싱 처리 단계 또는 상이한 입력/출력 채널 구성 사이의 포맷 변환을 나타낸다. 유추에 의해, 변환기 적응 블록은 도 4에 따른 객체 관련 처리 체인에 포함될 수 있다.
본 발명의 바람직한 실시예에 따르면, 오디오 조절 체인(4)은 오디오 출력 신호를 재생하기 위해 사용되는 변환기 시스템으로의 오디오 출력 신호(AOS)의 특성을 조절하도록 구성되는 변환기 적응 스테이지(14)를 포함한다.
피크 리미터 스테이지(12)의 필요한 제한 강도를 감소시키기 위하여, 예를 들어 등화 필터에 의해 구현되는 주파수 의존 변환기 적응 처리는 처리 체인(4)에 포함될 수 있다.
변환기 적응 스테이지(14)는 재생(스피커 또는 헤드폰)에 사용되는 변환기의 특성에 대한 오디오 입력 신호 ITA 및 정보 ICT를 수신한다.
특히 변환기가 제한된 주파수 범위를 가지며, 이에 의해 오디오 출력 신호의 주파수 범위를 제한하는 경우, 변환기 적응 스테이지(14)의 태스크는 변환기의 특성에 오디오 출력 신호(AOS)를 적응시키기 위한 것이다. 피크 제한 스테이지(12)에 앞서 변환기의 전달 함수를 모방하는 적절한 필터를 사용하여 주파수 범위를 제한함으로써, 피크 리미터 스테이지의 입력 신호 IPL은 레벨이 감소된다. 결과적으로, 제한 임계 값을 초과하는 신호 피크는 레벨이 감소된다. 결과적으로, 피크 제한 스테이지(12)의 효과는 덜 심각하다. 이것은
- 피크 제한은 신호를 가청 변경할 수 있는 반면에, 변환기 적응은 신호에 가청 변경을 일으키지 않고,
- 최대 피크 레벨이 제한 임계값보다 낮도록 신호가 수정되면, 피크 리미터는 덜 계산적 부하를 도입하기 때문에 유리하다.
필터링 외에, 변환기 적응 스테이지(14)는 또한 변환기의 대역 제한이 보상되도록 신호 적응 처리를 포함할 수 있다. 특히, 매우 작은 변환기는 저주파 신호를 재생할 수 없다.
이것은 변환기의 감지된 저음 응답을 증가시킴으로써, 예를 들어 저주파 음색의 고조파를 인위적으로 생성시켜 신호에 추가함으로써 보상될 수 있다.
디코더, 인코더, 및 설명된 실시예의 방법에 대해, 다음의 것이 주목되어야 한다:
몇몇 양태는 장치와 관련하여 설명되었지만, 이들 양태는 또한 대응하는 방법의 설명을 나타내는 것이 분명하며, 여기서 블록 또는 장치는 방법 단계 또는 방법 단계의 기능에 대응한다. 유사하게, 방법 단계와 관련하여 설명된 양태는 또한 대응하는 장치의 대응하는 블록 또는 항목 또는 기능에 대한 설명을 나타낸다.
어떤 구현 요구 사항에 따라, 본 발명의 실시예는 하드웨어 또는 소프트웨어로 구현될 수 있다. 이러한 구현은 디지털 저장 매체, 예를 들어 플로피 디스크, DVD, CD, ROM, PROM, EPROM, EEPROM 또는 FLASH 메모리를 이용하여 수행될 수 있으며, 이러한 매체는 각각의 방법이 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력하는(또는 협력할 수 있는) 전자적으로 판독 가능한 제어 신호를 저장한다.
본 발명에 따른 일부 실시예는 본 명세서에서 설명된 방법 중 하나가 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력할 수 있는 전자적으로 판독 가능한 제어 신호를 갖는 데이터 반송파를 포함한다.
일반적으로, 본 발명의 실시예는 프로그램 코드를 가진 컴퓨터 프로그램 제품으로 구현될 수 있으며, 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터 상에서 실행될 때 방법 중 하나를 수행하기 위해 동작한다. 프로그램 코드는 예를 들어 기계 판독 가능한 반송파 상에 저장될 수 있다.
다른 실시예는 본 명세서에서 설명되고, 기계 판독 가능 캐리어 상에 저장된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함한다.
그래서, 다시 말하면, 본 발명의 방법의 실시예는 컴퓨터 프로그램이 컴퓨터 상에서 실행될 때 본 명세서에 설명된 방법 중 하나를 수행하기 위해 프로그램 코드를 갖는 컴퓨터 프로그램이다.
그래서, 본 발명의 방법의 추가의 실시예는 데이터 캐리어(또는 디지털 저장 매체, 또는 컴퓨터 판독 가능한 매체)이며, 이러한 데이터 캐리어는 본 명세서에서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 기록하고 포함한다.
그래서, 본 발명의 방법의 추가의 실시예는 본 명세서에서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 나타내는 데이터 스트림 또는 신호의 시퀀스이다. 데이터 스트림 또는 신호의 시퀀스는 예를 들어 데이터 통신 접속, 예를 들어 인터넷을 통해 전송되도록 구성될 수 있다.
추가의 실시예는 본 명세서에서 설명된 방법 중 하나를 수행하도록 구성되거나 적응되는 처리 수단, 예를 들어 컴퓨터 또는 프로그램 가능한 논리 장치를 포함한다.
추가의 실시예는 본 명세서에서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 설치한 컴퓨터를 포함한다.
일부 실시예에서, 프로그램 가능한 논리 장치(예를 들어, 필드 프로그램 가능한 게이트 어레이)는 본 명세서에서 설명된 방법의 기능의일부 또는 모두를 수행하기 위해 이용될 수 있다. 일부 실시예에서, 필드 프로그램 가능한 게이트 어레이는 본 명세서에서 설명된 방법 중 하나를 수행하기 위해 마이크로 프로세서와 협력할 수 있다. 일반적으로, 이러한 방법은 바람직하게는 임의의 하드웨어 장치에 의해 수행된다.
본 발명이 몇몇 실시예에 관하여 설명되었지만, 본 발명의 범위 내에서 변경, 치환 및 등가물이 있다. 또한, 본 발명의 방법 및 조성물을 구현하는 많은 대안적인 방법이 있다는 것이 주목되어야 한다. 따라서, 다음의 첨부된 청구 범위는 본 발명의 진정한 사상 및 범위 내에서 이러한 모든 변경, 치환 및 등가물을 포함하는 것으로 이해되도록 의도된다.
참조 부호:
1 오디오 인코더
2 메타데이터 인코더
3 오디오 디코더
4 오디오 처리 체인
5 동적 범위 제어 스테이지
6 안내 클리핑 방지 스테이지
7 메타데이터 디코더
8 메타데이터 및 파라미터 제어 스테이지
9 구성 제공 스테이지
10 포맷 변환기 스테이지
11 라우드니스 정규화 스테이지
12 피크 리미터 스테이지
13 객체 렌더러 스테이지
14 변환기 적응 스테이지
MBS 메타데이터 비트스트림
DS 동적 범위 제어 이득 시퀀스
GS 안내 클리핑 방지 이득 시퀀스
DAS 디코딩된 오디오 신호
AOS 오디오 출력 신호
ISG 디코딩된 오디오 신호로부터 도출된 신호
CI 구성 정보
AC 오디오 채널
AO 오디오 객체
IPL 피크 리미터 스테이지의 입력 신호
ITA 변환기 적응 스테이지의 입력 신호
ICT 변환기의 특성에 관한 정보
IGS 라우드니스 정규화 스테이지의 출력 신호
OCF 포맷 변환기 스테이지 또는 객체 렌더러 스테이지의 출력
GSS 이득 시퀀스 선택 신호
CLA 채널 레이아웃
DI 다운믹스 명령어
PRL 프로그램 기준 레벨
IS 피크 리미터 스테이지에 대한 최대 피크 값
DTL 디코더 타겟 레벨
OMD 객체 메타데이터
참고 문헌:
[M30100] ISO/IEC JTC1/SC29/WG11 M30100, " Proposed Revision of Audio aspects of WD: Addition of Sample aspect ratio and further audio code-points ", July 2013, Vienna
[M30101] ISO/IEC JTC1/SC29/WG11 M30101, "Editors draft of 14496-12 PDAM 3 - Enhanced audio and other improvements", July 2013, Vienna
[M30324] ISO/IEC JTC1/SC29/WG11 M30324, "Description of the Fraunhofer IIS Submission for the 3D-Audio CfP ", July 2013, Vienna
[M28901] ISO/IEC JTC1/SC29/WG11 M28901, "Enhanced Metadata for Dynamic Range Compression", April 2013, Incheon, Korea

Claims (27)

  1. 하나 이상의 오디오 채널(AC) 및/또는 하나 이상의 오디오 객체(AO)를 포함하는 오디오 비트스트림을 생성하기 위한 오디오 인코더(1)로서,
    상기 오디오 인코더(1)는 메타데이터 비트스트림(MBS)을 생성하기 위한 메타데이터 인코더(2)를 포함하고, 상기 오디오 인코더는
    오디오 디코더(3)의 동적 범위 제어 스테이지(5)에 대한 하나 이상의 동적 범위 제어 이득을 포함하는 오디오 프레임에 대한 적어도 하나의 동적 범위 제어 이득 시퀀스(DS)를 수신하고;
    상기 오디오 디코더(3)의 안내 클리핑 방지 스테이지(6)에 대한 하나 이상의 안내 클리핑 방지 이득을 포함하는 상기 오디오 프레임에 대한 적어도 하나의 안내 클리핑 방지 이득 시퀀스(GS)를 수신하며;
    상기 동적 범위 제어 이득 시퀀스(DS) 중 적어도 하나와 상기 안내 클리핑 방지 이득 시퀀스(GS) 중 적어도 하나를 상기 메타데이터 비트스트림(MBS) 내에 포함하도록 구성되는 오디오 인코더.
  2. 제 1 항에 있어서,
    상기 메타데이터 인코더(2)는 상이한 동적 범위 제어 이득을 포함하는 동일한 오디오 프레임에 대한 적어도 2개의 동적 범위 제어 이득 시퀀스를 수신하고, 상이한 동적 범위 제어 이득을 포함하는 적어도 2개의 동적 범위 제어 이득 시퀀스(DS)를 상기 메타데이터 비트스트림(MBS) 내에 포함하도록 구성되는 오디오 인코더.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 메타데이터 인코더(2)는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 수신하고, 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)와, 선택적으로, 오디오 채널 및/또는 오디오 객체에 대한 동적 범위 제어 이득의 관계를 상기 메타데이터 비트스트림(MBS) 내에 포함하도록 구성되는 오디오 인코더.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 메타데이터 인코더(2)는 상기 오디오 디코더의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 수신하고, 상기 디코더의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 상기 동적 범위 제어 이득 시퀀스(DS)와, 선택적으로, 상기 디코더의 주파수 대역에 대한 상기 동적 범위 제어 이득의 관계를 상기 메타데이터 비트스트림(MBS) 내에 포함하도록 구성되는 오디오 인코더.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    상기 메타데이터 인코더(2)는 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스(GS)를 수신하고, 상기 상이한 안내 클리핑 방지 이득을 포함하는 상기 적어도 2개의 안내 클리핑 방지 이득 시퀀스(GS)를 상기 메타데이터 비트스트림(MBS) 내에 포함하도록 구성되는 오디오 인코더.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
    각 동적 범위 제어 시퀀스(DS)는 상기 안내 클리핑 방지 이득 시퀀스(GS) 중 하나에 관련되고, 상기 메타데이터 인코더(2)는 상기 동적 범위 제어 시퀀스(DS)와 상기 안내 클리핑 방지 이득 시퀀스(GS) 사이의 관계를 상기 메타데이터 비트스트림(MBS) 내에 포함하도록 구성되는 오디오 인코더.
  7. 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
    상기 메타데이터 인코더(2)는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 이득 시퀀스(GS)를 수신하고, 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 상기 안내 클리핑 방지 시퀀스(GS)와, 선택적으로, 상기 오디오 채널 및/또는 상기 오디오 객체에 대한 상기 안내 클리핑 방지 이득의 관계를 상기 메타데이터 비트스트림(MBS) 내에 포함하도록 구성되는 오디오 인코더.
  8. 하나 이상의 오디오 채널 및/또는 하나 이상의 오디오 객체를 포함하는 오디오 비트스트림을 생성하기 위한 오디오 인코더(1)의 동작 방법으로서,
    상기 오디오 인코더(1)는 메타데이터 비트스트림(MBS)을 생성하기 위한 메타데이터 인코더(2)를 포함하며, 상기 방법은
    상기 메타데이터 인코더(2)의 부분 상에서, 오디오 디코더(3)의 동적 범위 제어 스테이지(5)에 대한 하나 이상의 동적 범위 제어 이득을 포함하는 적어도 하나의 동적 범위 제어 이득 시퀀스(DS)를 수신하는 단계;
    상기 메타데이터 인코더(2)의 부분 상에서, 상기 오디오 디코더(3)의 안내 클리핑 방지 스테이지(6)에 대한 하나 이상의 안내 클리핑 방지 이득을 포함하는 적어도 하나의 안내 클리핑 방지 이득 시퀀스(GS)를 수신하는 단계; 및
    상기 메타데이터 인코더(2)의 부분 상에서, 상기 동적 범위 제어 이득 시퀀스(DS) 중 적어도 하나와 상기 안내 클리핑 방지 이득 시퀀스(GS) 중 적어도 하나를 상기 메타데이터 비트스트림(MBS) 내에 포함시키는 단계를 포함하는 오디오 인코더의 동작 방법.
  9. 컴퓨터 또는 프로세서상에서 실행될 때 제 1 항 내지 제 8 항의 방법을 수행하기 위한 컴퓨터 프로그램.
  10. 특히 제 1 항 내지 제 8 항 중 한 항에 따른 오디오 인코더(1)에 의해 생성되는 오디오 비트스트림과 상기 오디오 비트스트림에 관련된 메타데이터 비트스트림(MBS)을 디코딩하기 위한 오디오 디코더로서,
    상기 오디오 비트스트림으로부터 도출되는 디코딩된 오디오 신호(DAS)를 수신하고, 오디오 처리 체인(4)의 오디오 출력 신호(AOS)의 특성을 조절하도록 구성되며, 상기 오디오 출력 신호(AOS)의 동적 범위를 조절하기 위한 동적 범위 제어 스테이지(5)와, 상기 오디오 출력 신호(AOS)의 클리핑의 방지를 위한 안내 클리핑 방지 스테이지(6)를 포함하는 복수의 조절 스테이지(5,6,10,11,12,13,14)를 포함하는 오디오 처리 체인(4); 및
    상기 메타데이터 비트스트림(MBS)을 수신하고, 상기 메타데이터 비트스트림(MBS)으로부터 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)를 추출하도록 구성되는 메타데이터 디코더(7)로서, 상기 동적 범위 제어 이득 시퀀스(DS)의 적어도 부분은 상기 동적 범위 제어 스테이지(5)에 공급되고, 상기 안내 클리핑 방지 이득 시퀀스(GS)의 적어도 부분은 상기 안내 클리핑 방지 스테이지(6)에 공급되는 메타데이터 디코더(7)를 포함하는 오디오 디코더.
  11. 제 10 항에 있어서,
    상기 메타데이터 디코더(7)는 상이한 동적 범위 제어 이득을 포함하는 동일한 오디오 프레임에 대한 적어도 2개의 동적 범위 제어 이득 시퀀스(DS)를 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성되는 오디오 디코더.
  12. 제 10 항 또는 제 11 항에 있어서,
    상기 메타데이터 디코더(7)는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 상기 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성되는 오디오 디코더.
  13. 제 10 항 내지 제 12 항 중 어느 한 항에 있어서,
    상기 메타데이터 디코더(7)는 상기 오디오 디코더(3)의 상이한 주파수 대역에 관련된 적어도 2개의 동적 범위 제어 이득을 포함하는 동적 범위 제어 이득 시퀀스(DS)를 ㅅ상기 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성되는 오디오 디코더.
  14. 제 10 항 내지 제 13 항 중 어느 한 항에 있어서,
    상기 메타데이터 디코더(7)는 상이한 안내 클리핑 방지 이득을 포함하는 적어도 2개의 안내 클리핑 방지 이득 시퀀스(GS)를 상기 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성되는 오디오 디코더.
  15. 제 10 항 내지 제 14 항 중 어느 한 항에 있어서,
    상기 메타데이터 디코더(7)는 상이한 오디오 채널 및/또는 상이한 오디오 객체에 관련된 적어도 2개의 안내 클리핑 방지 이득을 포함하는 안내 클리핑 방지 이득 시퀀스(GS)를 상기 메타데이터 비트스트림(MBS)으로부터 추출하도록 구성되는 오디오 디코더.
  16. 제 10 항 내지 제 15 항 중 어느 한 항에 있어서,
    상기 오디오 디코더(3)는 구성 제공 스테이지(9)로부터 수신된 구성 정보(CI)에 기초하여 메타데이터 및 파라미터(DS, GS, CLA, DI, DTL, PRL, IS, OMD, ICT)를 조절 스테이지(5,6,10,11,12,13,14) 중 적어도 하나에 제공하도록 구성된 메타데이터 및 파라미터 제어 스테이지(8)를 더 포함하는 오디오 디코더.
  17. 제 10 항 내지 제 16 항 중 어느 한 항에 있어서,
    상기 메타데이터 및 파라미터 제어 스테이지(8)는, 복수의 동적 범위 제어 이득 시퀀스(DS)가 수신되는 경우에, 상기 복수의 동적 범위 제어 이득 시퀀스(DS) 중 어떤 것이 상기 동적 범위 제어 스테이지(5)에 공급되는지를 선택하도록 구성되는 오디오 디코더.
  18. 제 10 항 내지 제 17 항 중 어느 한 항에 있어서,
    상기 메타데이터 및 파라미터 제어 스테이지(8)는, 복수의 안내 클리핑 방지 이득 시퀀스(GS)가 수신되는 경우에, 상기 복수의 안내 클리핑 방지 이득 시퀀스(GS) 중 어떤 것이 상기 안내 클리핑 방지 스테이지(6)에 공급되는지를 선택하도록 구성되는 오디오 디코더.
  19. 제 10 항 내지 제 18 항 중 어느 한 항에 있어서,
    신호 흐름의 방향으로의 상기 동적 범위 제어 스테이지(5)는 상기 오디오 조절 체인(4)의 제 1 조절 스테이지인 오디오 디코더.
  20. 제 10 항 내지 제 19 항 중 어느 한 항에 있어서,
    상기 오디오 조절 체인(4)은 상기 오디오 출력 신호(AOS)의 채널 구성을 조절하도록 구성되는 포맷 변환기 스테이지(10)를 포함하는 오디오 디코더.
  21. 제 10 항 내지 제 20 항 중 어느 한 항에 있어서,
    상기 오디오 조절 체인(4)은 상기 오디오 출력 신호(AOS)의 라우드니스를 정규화하도록 구성되는 라우드니스 정규화 스테이지(11)를 포함하는 오디오 디코더.
  22. 제 10 항 내지 제 21 항 중 어느 한 항에 있어서,
    상기 오디오 조절 체인(4)은 임계 값을 초과하는 경우에 상기 오디오 출력 신호(AOS)의 피크를 제한하도록 구성된 피크 리미터 스테이지(12)를 포함하는 오디오 디코더.
  23. 제 10 항 내지 제 22 항 중 어느 한 항에 있어서,
    상기 오디오 조절 체인(4)은 오디오 객체를 상기 오디오 출력 신호(AOS)의 채널로 믹싱하도록 구성된 객체 렌더러 스테이지(13)를 포함하는 오디오 디코더.
  24. 제 10 항 내지 제 23 항 중 어느 한 항에 있어서,
    상기 오디오 조절 체인(4)은 상기 오디오 출력 신호(AOS)를 재생하기 위해 사용되는 변환기 시스템으로의 상기 오디오 출력 신호(AOS)의 특성을 조절하도록 구성되는 변환기 적응 스테이지(14)를 포함하는 오디오 디코더.
  25. 제 10 항 내지 제 24 항 중 어느 한 항에 있어서,
    상기 신호 흐름의 방향의 상기 피크 리미터 스테이지(12)는 상기 오디오 조절 체인(4)의 최종 조절 스테이지인 오디오 디코더.
  26. 특히 제 1 항 내지 제 8 항 중 한 항에 따른 오디오 인코더(1)에 의해 생성되는 오디오 비트스트림과 상기 오디오 비트스트림에 관련된 메타데이터 비트스트림(MBS)을 디코딩하기 위한 오디오 디코더(3), 특히 제 10 항 내지 제 25 항 중 한 항에 따른 오디오 디코더(3)의 동작 방법으로서,
    상기 오디오 비트스트림으로부터 디코딩된 오디오 신호(DAS)를 도출하는 단계;
    오디오 처리 체인(4)의 오디오 출력 신호(AOS)의 특성을 조절하기 위한 복수의 조절 스테이지를 가진 오디오 처리 체인(4)을 이용하는 단계로서, 조절 체인(4)의 조절 스테이지(5,6,10,11,12,13,14)인 동적 범위 제어 스테이지(5)에 의해 오디오 출력 신호(AOS)의 동적 범위를 조절하는 단계와, 조절 체인(4)의 조절 스테이지(5,6,10,11,12,13,14)인 안내 클리핑 방지 스테이지(6)에 의해 상기 오디오 출력 신호(AOS)의 클리핑을 방지하는 단계를 포함하는 상기 이용하는 단계;
    메타데이터 디코더(7)의 부분 상에서, 상기 메타데이터 비트스트림(MBS)을 수신하여, 상기 메타데이터 비트스트림(MBS)으로부터 동적 범위 제어 이득 시퀀스(DS) 및 안내 클리핑 방지 이득 시퀀스(GS)를 추출하는 단계;
    상기 동적 범위 제어 이득 시퀀스(DS)의 적어도 부분을 상기 동적 범위 제어 스테이지(5)에 공급하는 단계; 및
    상기 안내 클리핑 방지 이득 시퀀스(GS)의 적어도 부분을 상기 안내 클리핑 방지 스테이지(6)에 공급하는 단계를 포함하는 오디오 디코더의 동작 방법
  27. 컴퓨터 또는 프로세서 상에서 실행할 때 전술한 항의 방법을 수행하기 위한 컴퓨터 프로그램.

KR1020167013335A 2013-10-22 2014-10-20 오디오 장치에 대한 조합된 동적 범위 압축 및 안내 클리핑 방지를 위한 개념 KR101882898B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP13189754 2013-10-22
EP13189754.8 2013-10-22
PCT/EP2014/072431 WO2015059087A1 (en) 2013-10-22 2014-10-20 Concept for combined dynamic range compression and guided clipping prevention for audio devices

Publications (2)

Publication Number Publication Date
KR20160072255A true KR20160072255A (ko) 2016-06-22
KR101882898B1 KR101882898B1 (ko) 2018-07-27

Family

ID=49447470

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167013335A KR101882898B1 (ko) 2013-10-22 2014-10-20 오디오 장치에 대한 조합된 동적 범위 압축 및 안내 클리핑 방지를 위한 개념

Country Status (20)

Country Link
US (3) US11170795B2 (ko)
EP (3) EP3061090B1 (ko)
JP (2) JP6588899B2 (ko)
KR (1) KR101882898B1 (ko)
CN (2) CN111580772B (ko)
AR (2) AR098153A1 (ko)
AU (1) AU2014339086B2 (ko)
BR (1) BR112016008933B1 (ko)
CA (1) CA2927664A1 (ko)
ES (2) ES2732304T3 (ko)
MX (1) MX358483B (ko)
MY (1) MY181977A (ko)
PL (2) PL3522157T3 (ko)
PT (2) PT3522157T (ko)
RU (1) RU2659490C2 (ko)
SG (1) SG11201603116XA (ko)
TR (1) TR201908748T4 (ko)
TW (1) TWI571865B (ko)
WO (1) WO2015059087A1 (ko)
ZA (1) ZA201603299B (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190025816A (ko) * 2016-07-04 2019-03-12 하만 베커 오토모티브 시스템즈 게엠베하 음성 신호를 포함하는 오디오 신호의 라우드니스 레벨의 자동 교정
WO2020185025A1 (ko) * 2019-03-14 2020-09-17 가우디오랩 주식회사 라우드니스 레벨을 제어하는 오디오 신호 처리 방법 및 장치
WO2022114787A1 (ko) * 2020-11-24 2022-06-02 가우디오랩 주식회사 오디오 신호의 정규화를 수행하는 방법 및 이를 위한 장치

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8090120B2 (en) 2004-10-26 2012-01-03 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI529703B (zh) 2010-02-11 2016-04-11 杜比實驗室特許公司 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
JP6174129B2 (ja) 2012-05-18 2017-08-02 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム
UA122050C2 (uk) 2013-01-21 2020-09-10 Долбі Лабораторіс Лайсензін Корпорейшн Аудіокодер і аудіодекодер з метаданими гучності та границі програми
KR102660144B1 (ko) 2013-01-21 2024-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화
CN105074818B (zh) 2013-02-21 2019-08-13 杜比国际公司 音频编码系统、用于产生比特流的方法以及音频解码器
CN104080024B (zh) 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
US9607624B2 (en) * 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
CN110083714B (zh) 2013-04-05 2024-02-13 杜比实验室特许公司 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CN109785851B (zh) 2013-09-12 2023-12-01 杜比实验室特许公司 用于各种回放环境的动态范围控制
US9521501B2 (en) 2013-09-12 2016-12-13 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
CN110808723A (zh) 2014-05-26 2020-02-18 杜比实验室特许公司 音频信号响度控制
WO2016057530A1 (en) 2014-10-10 2016-04-14 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
BR112017002758B1 (pt) * 2015-06-17 2022-12-20 Sony Corporation Dispositivo e método de transmissão, e, dispositivo e método de recepção
US9934790B2 (en) * 2015-07-31 2018-04-03 Apple Inc. Encoded audio metadata-based equalization
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US10341770B2 (en) 2015-09-30 2019-07-02 Apple Inc. Encoded audio metadata-based loudness equalization and dynamic equalization during DRC
FR3044814A1 (fr) * 2016-04-21 2017-06-09 Continental Automotive France Systeme et procede de controle du volume sonore dans un systeme multimedia
CN106504766B (zh) * 2016-11-28 2019-11-26 湖南国科微电子股份有限公司 一种数字音频信号的动态范围压缩方法
KR20210090096A (ko) 2018-11-13 2021-07-19 돌비 레버러토리즈 라이쎈싱 코오포레이션 오디오 신호 및 연관된 메타데이터에 의해 공간 오디오를 표현하는 것
CN109889170B (zh) * 2019-02-25 2021-06-04 珠海格力电器股份有限公司 音频信号的控制方法和装置
EP3761672B1 (en) * 2019-07-02 2023-04-05 Dolby International AB Using metadata to aggregate signal processing operations
US20220360899A1 (en) * 2019-07-30 2022-11-10 Dolby Laboratories Licensing Corporation Dynamics processing across devices with differing playback capabilities
WO2023014738A1 (en) * 2021-08-03 2023-02-09 Zoom Video Communications, Inc. Frontend capture
US11837254B2 (en) 2021-08-03 2023-12-05 Zoom Video Communications, Inc. Frontend capture with input stage, suppression module, and output stage

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090063159A1 (en) * 2005-04-13 2009-03-05 Dolby Laboratories Corporation Audio Metadata Verification
US20110208528A1 (en) * 2008-10-29 2011-08-25 Dolby International Ab Signal clipping protection using pre-existing audio gain metadata
US20120310654A1 (en) * 2010-02-11 2012-12-06 Dolby Laboratories Licensing Corporation System and Method for Non-destructively Normalizing Loudness of Audio Signals Within Portable Devices

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007523365A (ja) * 2004-01-16 2007-08-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビットストリーム処理方法
US7392195B2 (en) 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
CN101288309B (zh) * 2005-10-12 2011-09-21 三星电子株式会社 处理/发送以及接收/处理比特流的方法和设备
CN101098201A (zh) * 2006-06-29 2008-01-02 乐金电子(昆山)电脑有限公司 广播接收用移动装置的音频输出装置及其控制方法
EP2115739A4 (en) * 2007-02-14 2010-01-20 Lg Electronics Inc METHODS AND APPARATUSES FOR ENCODING AND DECODING AUDIO SIGNALS BASED ON OBJECTS
JP5530720B2 (ja) * 2007-02-26 2014-06-25 ドルビー ラボラトリーズ ライセンシング コーポレイション エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体
CN101221766B (zh) * 2008-01-23 2011-01-05 清华大学 音频编码器切换的方法
KR101518532B1 (ko) * 2008-07-11 2015-05-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램
EP2146522A1 (en) * 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
US8600076B2 (en) * 2009-11-09 2013-12-03 Neofidelity, Inc. Multiband DRC system and method for controlling the same
CN101944362B (zh) * 2010-09-14 2012-05-30 北京大学 一种基于整形小波变换的音频无损压缩编码、解码方法
JP5821431B2 (ja) * 2011-09-02 2015-11-24 株式会社Jvcケンウッド 音声信号加工装置、音声信号加工方法及びプログラム
US9064497B2 (en) * 2012-02-22 2015-06-23 Htc Corporation Method and apparatus for audio intelligibility enhancement and computing apparatus
CN102768834B (zh) * 2012-03-21 2018-06-26 新奥特(北京)视频技术有限公司 一种实现音频帧解码的方法
JP6174129B2 (ja) * 2012-05-18 2017-08-02 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム
CN104885151B (zh) * 2012-12-21 2017-12-22 杜比实验室特许公司 用于基于感知准则呈现基于对象的音频内容的对象群集
CN105074818B (zh) * 2013-02-21 2019-08-13 杜比国际公司 音频编码系统、用于产生比特流的方法以及音频解码器
US9173021B2 (en) * 2013-03-12 2015-10-27 Google Technology Holdings LLC Method and device for adjusting an audio beam orientation based on device location
US9559651B2 (en) * 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
CN103280221B (zh) * 2013-05-09 2015-07-29 北京大学 一种基于基追踪的音频无损压缩编码、解码方法及系统
FR3006622B1 (fr) 2013-06-07 2015-07-17 Essilor Int Procede de fabrication d'une lentille ophtalmique
US9521501B2 (en) 2013-09-12 2016-12-13 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090063159A1 (en) * 2005-04-13 2009-03-05 Dolby Laboratories Corporation Audio Metadata Verification
US20110208528A1 (en) * 2008-10-29 2011-08-25 Dolby International Ab Signal clipping protection using pre-existing audio gain metadata
JP2012507059A (ja) * 2008-10-29 2012-03-22 ドルビー インターナショナル アーベー 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護
US20120310654A1 (en) * 2010-02-11 2012-12-06 Dolby Laboratories Licensing Corporation System and Method for Non-destructively Normalizing Loudness of Audio Signals Within Portable Devices

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ATSC Standard: Digital Audio Compression (AC-3). Advanced Television Systems Committee. Doc.A/52:2012. 2012.12.17.* *
Charles Q Robinson, et al. Dynamic Range Control via Metadata. Audio Engineering Society Convention 107. Audio Engineering Society, 1999. *
Jonas Engdegard, et al. Spatial audio object coding (SAOC) - The upcoming MPEG standard on parametric object based audio coding. Audio Engineering Society Convention 124. 2008.05.20.* *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190025816A (ko) * 2016-07-04 2019-03-12 하만 베커 오토모티브 시스템즈 게엠베하 음성 신호를 포함하는 오디오 신호의 라우드니스 레벨의 자동 교정
WO2020185025A1 (ko) * 2019-03-14 2020-09-17 가우디오랩 주식회사 라우드니스 레벨을 제어하는 오디오 신호 처리 방법 및 장치
US11316490B2 (en) 2019-03-14 2022-04-26 Gaudio Lab, Inc. Audio signal processing method and device for controlling loudness level
US11791789B2 (en) 2019-03-14 2023-10-17 Gaudio Lab, Inc. Audio signal processing method and device for controlling loudness level
WO2022114787A1 (ko) * 2020-11-24 2022-06-02 가우디오랩 주식회사 오디오 신호의 정규화를 수행하는 방법 및 이를 위한 장치

Also Published As

Publication number Publication date
US11551703B2 (en) 2023-01-10
CN105814630B (zh) 2020-04-28
AU2014339086B2 (en) 2017-12-21
PT3522157T (pt) 2021-12-03
MY181977A (en) 2021-01-18
US20160240204A1 (en) 2016-08-18
EP3061090B1 (en) 2019-04-17
JP6768735B2 (ja) 2020-10-14
EP3522157A1 (en) 2019-08-07
PT3061090T (pt) 2019-07-11
MX2016004921A (es) 2016-07-11
JP2016538587A (ja) 2016-12-08
JP6588899B2 (ja) 2019-10-09
EP3522157B1 (en) 2021-09-22
RU2659490C2 (ru) 2018-07-02
AU2014339086A1 (en) 2016-06-02
AR098153A1 (es) 2016-05-04
PL3061090T3 (pl) 2019-09-30
ES2900065T3 (es) 2022-03-15
EP3061090A1 (en) 2016-08-31
TR201908748T4 (tr) 2019-07-22
BR112016008933A2 (ko) 2017-08-01
US20230134916A1 (en) 2023-05-04
CA2927664A1 (en) 2015-04-30
AR115941A2 (es) 2021-03-17
CN111580772B (zh) 2023-09-26
PL3522157T3 (pl) 2022-02-07
SG11201603116XA (en) 2016-05-30
EP3951778A1 (en) 2022-02-09
ES2732304T3 (es) 2019-11-21
ZA201603299B (en) 2017-11-29
US11170795B2 (en) 2021-11-09
CN105814630A (zh) 2016-07-27
KR101882898B1 (ko) 2018-07-27
TWI571865B (zh) 2017-02-21
BR112016008933B1 (pt) 2023-01-31
RU2016119525A (ru) 2017-11-28
WO2015059087A1 (en) 2015-04-30
CN111580772A (zh) 2020-08-25
JP2018151639A (ja) 2018-09-27
US20210166707A1 (en) 2021-06-03
TW201521012A (zh) 2015-06-01
MX358483B (es) 2018-08-22

Similar Documents

Publication Publication Date Title
US11551703B2 (en) Concept for combined dynamic range compression and guided clipping prevention for audio devices
JP6778781B2 (ja) エンコードされたオーディオ拡張メタデータベースのダイナミックレンジ制御
JP5719372B2 (ja) アップミックス信号表現を生成する装置及び方法、ビットストリームを生成する装置及び方法、並びにコンピュータプログラム
KR101414737B1 (ko) 다운믹스 신호 표현에 기초하여 업믹스 신호 표현을 제공하기 위한 장치, 다중 채널 오디오 신호를 표현하는 비트스트림을 제공하기 위한 장치, 선형 결합 파라미터를 이용하여 다중 채널 오디오 신호를 표현하는 방법, 컴퓨터 프로그램 및 비트스트림
EP2941771B1 (en) Decoder, encoder and method for informed loudness estimation employing by-pass audio object signals in object-based audio coding systems
TWI521502B (zh) 多聲道音訊的較高頻率和降混低頻率內容的混合編碼
KR20160102403A (ko) 복호화 장치 및 방법, 및 프로그램
EP2896221A1 (en) Apparatus and method for providing enhanced guided downmix capabilities for 3d audio
WO2008100067A1 (en) A method and an apparatus for processing an audio signal
US10621994B2 (en) Audio signal processing device and method, encoding device and method, and program
WO2024076810A1 (en) Methods, apparatus and systems for performing perceptually motivated gain control

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant