KR20120124484A - 휴대용 장치 내의 오디오 신호들의 라우드니스를 비파괴적으로 노말라이즈하기 위한 시스템 및 방법 - Google Patents

휴대용 장치 내의 오디오 신호들의 라우드니스를 비파괴적으로 노말라이즈하기 위한 시스템 및 방법 Download PDF

Info

Publication number
KR20120124484A
KR20120124484A KR1020127023274A KR20127023274A KR20120124484A KR 20120124484 A KR20120124484 A KR 20120124484A KR 1020127023274 A KR1020127023274 A KR 1020127023274A KR 20127023274 A KR20127023274 A KR 20127023274A KR 20120124484 A KR20120124484 A KR 20120124484A
Authority
KR
South Korea
Prior art keywords
encoded
parameters
input signal
dynamic range
audio
Prior art date
Application number
KR1020127023274A
Other languages
English (en)
Other versions
KR101381588B1 (ko
Inventor
제프리 씨. 리드밀러
하랄트 하. 문트
미카엘 슈그
마틴 볼테르스
Original Assignee
돌비 인터네셔널 에이비
돌비 레버러토리즈 라이쎈싱 코오포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 인터네셔널 에이비, 돌비 레버러토리즈 라이쎈싱 코오포레이션 filed Critical 돌비 인터네셔널 에이비
Publication of KR20120124484A publication Critical patent/KR20120124484A/ko
Application granted granted Critical
Publication of KR101381588B1 publication Critical patent/KR101381588B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3089Control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Stereophonic System (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

많은 휴대용 재생 장치들은 인코딩된 오디오 콘텐츠가 이러한 장치들을 위해 특별히 준비되지 않으면, 일관된 라우드니스를 가지는 광대역폭 광 동적 범위를 가지는 인코딩된 오디오 콘텐츠를 디코딩 및 재생할 수 없다. 이 문제는 다른 알려진 압축 프로파일과 관련된 디퍼런셜 값들 또는 절대값들에 의해 적합한 동적 범위 압축 프로파일을 특정하는 어떤 메타데이터를 인코딩된 콘텐츠에 포함시키는 것에 의해 극복될 수 있다. 재생 장치는 또한 재생 오디오에 이득 및 제한을 적응적으로 적용한다. 인코더들, 트랜스코더들 및 디코더들에서의 구현이 공개된다.

Description

휴대용 장치 내의 오디오 신호들의 라우드니스를 비파괴적으로 노말라이즈하기 위한 시스템 및 방법{SYSTEM AND METHOD FOR NON-DESTRUCTIVELY NORMALIZING LOUDNESS OF AUDIO SIGNALS WITHIN PORTABLE DEVICES}
이 출원은 그 전체가 참조로서 본 문헌에 포함된 2010년 2월 11일 출원된 미국 가출원, 출원 번호 61/303,643에 대한 우선권을 청구한다.
본 발명은 일반적으로 오디오 신호들을 인코딩 및 디코딩하는 것에 적용되는 것으로, 보다 상세하게는, 넓은 범위의 재생 장치들 및 청취 환경을 위해 오디오 신호들을 인코딩 및 디코딩하는 데에 사용될 수 있는 기술에 적용되는 것이다.
휴대용 및 다른 형식의 이동형 장치들의 증가되는 인기는, 그 장치들의 디자이너들 및 제조자들에 대해서 뿐만 아니라, 이러한 장치들 상에 재생을 위한 미디어 콘텐츠의 창작자 및 배포자들에 대해 새로운 기회들 및 도전들을 되어 왔다.
많은 휴대형 장치들은 HDTV, 블루레이 또는 DVD를 위한 고품질, 광대역 및 광 동적 범위 오디오 콘텐츠와 종종 관련된 것들을 포함하는 광 범위의 미디어 콘텐츠 타입들 및 포맷들을 재생할 수 있다. 휴대형 장치들은 그들 자신의 내부 오디오 변환기(transducer) 또는 헤드폰과 같은 외부의 변환기 상에서 이러한 타입의 오디오 콘텐츠를 재생하는데에 사용될 수 있다; 하지만, 그들은 일반적으로 다양한 미디어 포맷 및 콘텐츠 타입들에 따라 지능적으로, 그리고, 일관된 라우드니스(loudness)를 가지고 이러한 콘텐츠를 재생성할 수 없다.
본 발명은 넓은 범위의 재생 장치들 및 청취 환경을 위해 오디오 신호들을 인코딩 및 디코딩하는 방법을 제공함에 있다.
본 발명은 휴대형 및 다른 형식들의 이동 가능한 장치들을 포함하는 다양한 장치들 상에서 재생을 위해 오디오 신호들을 인코딩 및 디코딩하기 위한 향상된 방법을 제공하는 것에 대해 다룬다.
본 발명의 다양한 측면들이 아래에서 보이는 독립항에서 진술된다.
본 발명의 다양한 측면들 및 이의 바람직한 실시예들은 다음의 논의 및 첨부된 도면들을 참조하는 것에 의해 보다 명확하게 이해도리 것이다. 여기서, 도면들에서 동일한 참조 번호는 동일한 요소들을 나타낸다. 다음의 논의 및 도면들의 콘텐츠는 단지 예로서 진술되며, 본 발명의 범위를 한정하는 표현으로 이해되어서는 안된다.
본 발명에 따른 오디오 신호들을 인코딩 및 디코딩하는 방법은 넓은 범위의 재생 장치들 및 청취 환경을 제공할 수 있다.
도 1은 재생 장치의 개략적인 블록도이다.
도 2는 인코딩 장치의 개략적인 블록도이다.
도 3 내지 도 5는 트랜스코딩 장치들의 개략적인 블록도들이다.
도 6은 본 발명의 다양한 측면들을 구현하기 위해 사용될 수 있는 장치의 개략적인 블록도이다.
A. 서론
본 발명은 휴대형 및 다른 형식의 이동형 장치들의 사용자들에 의해 접하게 되는 환경들과 같은, 도전되는 청취 환경들에 있어서 재생을 위한 오디오 정보의 인코딩 및 디코딩에 관한 것이다. 오디오 인코딩 및 디코딩의 몇몇 예들은, ATSC(Advanced Television Systems Committee, Inc)에 의해 공개된, 2005년 6월 14일, 리비전 B(Revision B), 문헌(Document) A/52B, "Digital Audio Compression Standard (AC-3, E-AC-3)"(이하, "ATSC 표준"이라고 칭함)에서, ISO(International Standards Organization)에 의해 공개된 AAC(Advanced Audio Coding), ISO/IEC 13818-7(이하, MPEG-2 AAC 표준"이라고 칭함)에서, 그리고, ISO/IEC 14496-3, 서브파트 4(이하, "MPEG-4 오디오 표준"이라고 칭함)에서 설명된 바와 같이, 공개된 표준들에 의해 설명된다. 이러한 표준들을 따르는 인코딩 및 디코딩 프로세스들은 오직 예들로서 언급된다. 본 발명의 원리는 다른 표준들도 따르는 코딩 시스템들에도 사용될 수도 있다.
발명자는 몇몇 코딩 표준들을 따르는 장치들의 이용 가능한 특징들이 종종 전형적인 휴대형 및 다른 타입들의 이동형 장치들인 청취 환경 및 어플리케이션들에 대해 충분하지 않다는 것을 발견했다. 이러한 형식들의 장치들이 이러한 표준들을 따르는 인코딩된 입력 신호들의 오디오 콘텐츠를 디코딩하도록 하기 위해 사용될 때, 디코딩된 오디오 콘텐츠는 이러한 장치들 상에서 재생을 위해 특별히 준비된 인코딩된 입력 신호들을 디코딩하는 것에 의해 얻어지는 오디오 콘텐츠를 위한 라우드니스 레벨들 보다 상당히 낮은 라우드니스 레벨들에서 종종 재생성된다.
ATSC 표준을 따르는 인코딩된 입력 신호들(이하, "ATSC 적용 인코딩 신호"로 칭함)은, 예를 들면, 어떻게 이 정보가 디코딩될 수 있는지를 설명하는 메타데이터 및 인코딩 오디오 정보를 포함한다. 일부 메타데이터 파라미터들은 인코딩된 오디오 정보가 디코딩될 때 어떻게 오디오 정보의 동적 범위가 압축될 수 있는지 특정 하는 동적 범위 압축 프로파일을 식별한다. 디코딩된 신호의 전체 동적 범위는 보유될 수 있거나, 또는, 이는 청취 환경들 및 다른 어플리케이션들의 요구를 만족하기 위한 디코딩의 시간에서 정도(degree)들을 다양화하는 것에 의해 압축될 수 있다. 다른 메타데이터는 인코딩된 신호에서 다이얼로그의 레벨 또는 평균 프로그램 레벨과 같은, 인코딩된 오디오 정보의 몇몇 라우드니스의 측정을 식별한다. 이 메타데이터는 재생하는 동안 레퍼런스 재생산 레벨 또는 특정된 라우드니스를 성취하기 위한 디코딩된 신호의 진폭을 조절하기 위한 디코더에 의해 사용될 수 있다. 몇몇 어플리케이션들에 있어서, 하나 이상의 레퍼런스 재생산 레벨들은, 사용자에게 다른 어플리케이션들에서, 레퍼런스 재생산 레벨을 설정하는 것에 걸쳐 제어하는 것이 주어지는 동안, 특정되거나, 또는, 추정된다. 예를 들면, 코딩 프로세스들은 ATSC 적용 인코딩된 신호들이 다이얼로그가 2개의 레퍼런스 재생성 레벨들 중 하나에서 재생되는 것으로 추정하는 것을 인코딩 및 디코딩하기 위해 사용된다. 하나의 레벨이 클리핑 레벨의 31 dB 이하이고, 이는 최대 가능한 디지털 값 또는 전체 스케일(FS, full scale) 값이며, 이 문헌에서 -31 dBFS로 나타낸다. 이 레벨을 사용하는 디코딩의 모드(mode)는 때론 "라인 모드(Line Mode")로 나타내어지고, 어플리케이션 및 주변 환경에 사용되도록 한다. 여기서, 광범위한 동적 범위들이 적합하다. 다른 레벨은 -20 dBps에서 설정되며, 이 제2 레벨에서 사용되는 디코딩의 모드는 종종 RF 모드로 칭해지고, 이는 무선 주파수(RF)의 변조에 의해 브도캐스팅에서 접하게되는 것과 같은 어플리케이션 및 주변 환경에서 사용되도록 의도된다. 여기서, 좁은 동적 범위가 과도한 변조를 피하기 위해 요구된다.
다른 실시예에 대해, 메타데이터를 포함하는 MPEG 오디오 표준 및 MPEG-2 AAC 적용 인코딩 신호들은 인코딩된 오디오 정보에 대한 평균 라우드니스 레벨을 식별한다. MPEG-2 AAC 및 MPEG-4 따라 인코딩된 신호들을 디코딩하는 프로세스는 청취자가 원하는 재생 레벨을 특정하도록 할 수 있다. 디코더는 디코딩된 신호의 진폭을 조절하기 위해 원하는 재생 레벨 및 평균 라우드니스 메타데이터를 사용하여, 원하는 재생 레벨이 얻어진다.
핸드핼드(handheld) 및 다른 형식들의 휴대용 장치들이 이러한 메타데이터 파라미터들에 따른 ATSC-적용, MPEG-2 AAC-적용 및 MPEG-4 오디오-적용 인코딩 신호들의 오디오 콘텐츠를 디코딩 및 재생하기 위해 사용될 때, 동적 범위 및 라우드니스 레벨은 대개, 이러한 형식들의 장치들가 접하게되는 불리한 청취 환경 때문에, 또는, 이러한 장치들에서 사용되는 낮은 동작 전압에 기인한 전자 제한들에 때문에, 적합하지 않다.
다른 표준들에 따르는 인코딩된 신호들은 유사한 형식들의 메타데이터를 이용하고, 의도된 재생 라우드니스 레벨을 특정하기 위한 프로비전(provision)을 포함할 수 있다. 동일한 문제들이 종종 이러한 신호들을 디코딩하는 휴대용 장치들에서 접하게 된다.
본 발명은 이러한 장치들을 위해 특별히 준비된 콘텐츠를 요구함이 없이 핸드헬드 및 휴대용 장치들의 사용자들을 위한 청취 경험을 향상시키도록 사용될 수 있다.
B. 장치 개요
도 1은 본 발명의 다양한 측면에 포함되는 수신기/디코더 장치(10)의 일 형식의 개략적인 블록도이다. 장치(10)는 신호 경로(11)로부터 인코딩된 입력 신호를 수신하고, 입력 신호로부터 인코딩된 오디오 정보 및 관련된 메타데이터를 추출하기 위해 디포맷터(12)에서 적합한 프로세서를 적용하며, 인코딩된 오디오 정보를 디코더(14)에 전달하고, 그리고, 신호 경로(13)를 따라 메타데이터를 전달한다. 인코딩된 오디오 정보는 동적 범위 압축 프로파일에 따른 동적 범위 압축을 특정하는 하나 이상의 파라미터들 및 하나 이상의 디코딩-제어 파라미터들을 포함하는 다양한 파라미터들을 위한 메타데이터 특정 값들과 청각 자극의 스펙트럼 콘텐츠를 표현하는 인코딩된 서브밴드 신호들을 포함한다. 용어 "동적 범위 압축 프로파일"은 동적 범위 압축기의 동작 특성을 정의하는 이득 팩터들, 압축 공격 시간들 및 압축 릴리즈 시간들과 같은 특징들을 나타낸다.
디코더(14)는 디코딩 프로세서를 인코딩된 오디오 정보에 적용하여, 디코딩된 서브밴드 신호들을 얻으며, 이는 동적 범위 제어기(16)에 전달된다. 디코딩 프로세서의 동작 및 기능들은 신호 경로(13)로부터 수신된 디코딩 제어 파라미터들에 대응하여 적용될 수 있다. 디코딩 프로세스의 동작 및 기능들을 적용하는데에 사용될 수 있는 디코딩-제어 파라미터들의 실시예들은 인코딩된 오디오 정보에 의해 표현되는 오디오 채널들의 구성 및 번호를 식별하는 파라미터들이다.
동적 범위 제어기(16)는 선택적으로 디코딩된 오디오 정보의 동적 범위를 조절한다. 이 조절은 턴 온되거나, 또는, 턴 오프되고, 청취자로부터 입력에 대응하여 제공될 수 있는 제어 신호들 및/또는 신호 경로(13)로부터 수신된 메타데이에 대응하여 적용될 수 있다. 예를 들면, 제어 신호는 장치(10)를 위한 동작 옵션을 선택하거나, 또는 스위치를 동작시키는 청취자에 대응하여 제공될 수 있다.
ATSC 표준, MPEG-2 AAC 표준 또는 MPEG-4 오디오 표준에 따르는 구현들에 있어서, 예컨대, 인코딩된 입력 신호는 세그먼트들 또는 프레임들의 시퀀스에 정렬된 인코딩된 오디오 정보를 포함한다. 각 프레임은 이의 전체 동적 범위를 가지는 오디오 신호의 스펙트럼 컴포넌트를 표현하는 인코딩된 서브밴드 신호들을 포함한다. 동적 범위 제어기(16)는 어떤 동작도 취하지 않으며, 이는 오디오 신호가 동적 범위의 최대 양으로 재생되도록 하거나, 또는 이는 다양한 정도들에 의해 동적 범위를 압축하도록 하는 디코딩된 서브밴드 신호들을 수정할 수 있다.
합성 필터 뱅크(18)는 합성 필터들의 뱅크를 디코딩된 서브밴드 신호들에 적용하며, 이는 동적 범위 제어기(16)에 의해 조절될 수 있고, 이의 출력에서 디지털 또는 아날로그 신호가 될 수 있는 시간 도메인 오디오 신호를 제공한다.
이득 제한기(20)는 시간 도메인 오디오 신호의 진폭을 조절하기 위해 본 발명의 몇몇 구현들에 사용된다. 게인 제한기(20)의 출력은 음향 변환기(acoustic transducer)에 의한 이후의 표현을 위해 경로(21)를 따라 전달된다.
도 2는 본 발명의 다양한 측면들을 포함하는 인코더/송신기 장치(30)의 개략적인 블록도이다. 장치(30)는 신호 경로(31)로부터 청각 자극을 표현하는 오디오 입력 신호를 수신한다. 장치(30)는 입력 오디오 신호 또는 입력 오디오 신호를 표현하는 대역폭 제한 신호들의 세트의 주파수 도메인 표현에서 서브밴드 신호드을 얻기 위해 분석 필터들의 뱅크를 오디오 신호에 적용한다. 메타데이터 연산기(34)는 동적 범위 압축 프로파일에 따라 동적 범위 압축을 특정하는 하나 이상의 파라미터들 및 하나 이상의 디코딩 제어 파라미터들 및 인코딩 제어 파마리티더들을 포함하는 다양한 파라미터들을 위한 값들을 특정하는 메타데이터를 연산하기 위해, 오디오 입력 신호 및/또는 분석 필터 뱅크(32)로부터 서브밴드 신호들 또는 오디오 입력 신호의 수정된 버전과 같은 오디오 입력 신호로부터 유도된 하나 이상의 신호들을 분석한다. 메타데이터 연산기(34)는 시간 도메인 신호들, 주파수 도메인 신호들, 또는, 시간 도메인 및 주파수 도메인 신호들의 조합을 분석할 수 있다. 메타데이터 연산기(34)에 의해 수행되는 연산들은 또한 경로(33)로부터 수신된 하나 이상의 메타데이터 파라미터들에 대응하여 적용될 수 있다. 인코더(36)는 인코딩된 서브밴드 신호들을 포함하는 인코딩된 오디오 정보를 얻기 위해 인코딩된 프로세서를 분석 필터 뱅크(32)의 출력에 적용하고, 인코딩된 서브밴드 신호들은 포맷터(38)로 전달된다. 인코딩 프로세스는 경로(33)로부터 수신된 인코딩 제어 파라미터들에 대응하여 적용될 수 있다. 인코딩 프로세스는 또한 인코딩된 오디오 정보를 디코딩하기 위해 장치(10)에서 수행되는 프로세스들에 의해 사용되는 경로(33)를 따라 다른 디코딩 제어 파라미터들을 생성할 수 있다. 포맷터(38)는 동적 범위 압축을 전송 또는 저장에 적합한 포맷을 가지는 인코딩된 출력 신호로 특정하는 하나 이상의 파라미터 및 하나 이상의 디코딩 제어 파라미터들을 포함하는 메타데이터의 적어도 일부 및 인코딩된 오디오 정보를 결합한다.
ASTSC 표준, MPEG-2 AAC 표준 또는 MPEG-4 오디오 표준을 적용하는 구현에 있어서, 예를 들면, 인코딩된 출력 신호는 프레임 또는 세그먼트들의 시퀀스에 정렬되는 인코딩된 오디오 정보를 포함한다. 각 프레임은 이의 전체 동적 범위를 가지는 오디오 신호의 스펙트럼 성분을 표현하는 인코딩된 서브밴드 신호들을 포함하며, 그리고, 레퍼런스 재생 레벨에서 재생을 위한 진폭들을 가진다.
디포맷터(12), 디코더(14), 합성 필터 뱅크(18), 분석 필터 뱅크(32), 인코더(36) 및 포맷터(38)는 설계 및 동작에서 종래의 것이 될 수 있다. 몇몇 실시예들은 앞서 언급된 공개된 표준에 적용되는 대응하는 컴포넌트들을 포함한다. 이러한 표준들에서 특정되거나, 또는 제안된 컴포넌트들의 구현들은 본 발명과 함께 사용하기에 적합하지만 요구되는 것은 아니다. 이러한 컴포넌트들의 어떠한 개별 구현도 크리티컬(critical)하지 않다.
도 3 내지 도 5는 앞서 설명된 장치(10) 및 장치(30)에서 컴포넌트들의 일부를 포함하는 트랜스코더 장치(40)의 다른 구현의 개략적인 블록도이다. 이러한 컴포넌트들은 그들의 대응하는 부분들과 실질적으로 동일하게 동작한다. 도 3에 보인 장치(40)는 동일한 코딩 표준에 적용되는 수정된 버전으로 경로(11)로부터 수시된 인코딩된 입력 신호를 트랜스코딩(transcoding)할 수 있다. 이 구현에서, 장치(40)는 인코딩된 입력 신호를 신호 경로(11)로부터 수신하고, 인코딩된 입력 신호로부터 제1 인코딩 오디오 정보 및 관련된 메타데이터를 추출하기 위해 디포맷터(12)에서 적합한 프로세스를 적용하며, 디코더(14) 및 포맷터(38)로 제1 인코딩 오디오 정보를 전달하고, 그리고, 신호 경로(43)를 따라 메타데이터를 전달한다. 제1 인코딩된 오디오 정보는 제1 동적 범위 압축 프로파일에 따라 동적 범위 압축을 특정하는 하나 이상의 파라미터들 및 하나 이상의 디코딩 제어 파라미터들을 포함하는 다양한 파라미터들을 위한 값들을 특정하는 메타데이터 및 청각 자극의 스펙트럼 콘텐츠를 표현하는 인코딩된 서브밴드 신호들을 포함한다. 디코더(14)는 디코딩된 서브밴드 신호들을 얻기 위해 제1 인코딩 오디오 정보에 디코딩 프로세스를 적용한다. 디코딩 프로세스의 동작 및 기능들은 상기 신호 경로(43)로부터 수신된 하나 이상의 디코딩 제어 파라미터들에 대응하여 적용될 수 있다. 서브밴드 신호들은 청각 자극의 주파수 도메인 표현 또는 청각 자극을 표현하는 대역폭 제한 신호들의 세트가 될 수 있다.
메타데이터 연산기(44)는 제2 동적 범위 압축 프로파일에 따라 동적 범위 압축을 특정하는 하나 이상의 파라미터 값들을 연산하기 위하여, 디코딩된 서브밴드 신호들 및/또는 디코딩된 서브밴드 신호들로부터 유도된 하나 이상의 신호들을 분석한다. 예를 들면, 하나 이상의 신호들은 합성 필터 뱅크(18)을 디코딩된 서브밴드 신호들에 적용하는 것에 의해 유도될 수 있다. 메타데이터 연산기(44)에 의해 수행되는 연산은 경로(43)으로부터 수신된 메타데이터에 대응하여 적용될 수 있다. 합성 필터 뱅크(18)는 이의 출력이 메타데이터 연산에 대해 필요하지 않다면, 이의 구현으로부터 생략될 수 있다.
장치(40)의 다른 구현이 도 4에 도시되었다. 이 구현은 도 3에 보인 것과 유사하지만, 인코더(36)를 포함한다. 인코더(36)가 포함된 것은 장치(40)가 제1 코딩 표준에 따르는, 경로(11)로부터 수신된 인코딩된 입력 신호를 호환되는 2개의 코딩 표준들의 서브밴드 신호들이 제공되는 제1 코딩 표준과 다를 수 있는 또는 제1 코딩 표준과 같을 수 있는 제2 코딩 표준에 따르는 인코딩된 출력 신호로 트랜스코드(transcode)하도록 허용한다. 이는 제2 코딩 표준에 따르는 제2 인코딩 오디오 정보를 얻기 위해 인코더(36)가 서브밴드 신호들에 인코딩 프로세스를 적용하도록 하는 것에 의해 이 구현에서 수행될 수 있다. 제2 인코딩 오디오 정보는 포맷터(38)로 전달된다. 인코딩 프로세스는 경로(43)로부터 수신된 메타데이터에 대응하여 적용될 수 있다. 인코딩 프로세스는 또한 인코딩된 오디오 정보를 디코딩하기 위해 장치(10)에서 수행되는 프로세서에 의한 사용을 위해 경로(43)를 따라 다른 메타데이터를 생성할 수도 있다. 포맷터(38)는 전송 또는 저장에 적합한 포맷을 가지는 인코딩된 출력 신호로 수신된 인코딩된 오디오 정보 및 경로(43)로부터 수신된 메타데이터를 조합한다.
장치(40)의 또 다른 구현이 도 5에 도시되었다. 이 구현은 합성 필터 뱅크(18)를 포함하며, 이는 인코딩된 오디오 정보의 광대역 표현 또는 시간-도메인을 얻기 위해 디코딩된 서브밴드 신호들을 적용한다. 분석 필터 뱅크(32) 및 합성 필터 뱅크(18)가 포함되는 것은 장치(40)가 코딩 표준들의 근본적인 어떤 선택 간을 트랜스코딩하도록 한다. 합성 필터 뱅크(18)의 출력은 분석 필터 뱅크(32)로 전달된다. 이 분석 필터 뱅크(32)는 인코더(36)에 의한 인코딩을 위해 서브밴드 신호들을 생성한다. 인코더(36)는 포맷터(38)로 전달되는 제2 인코딩 오디오 정보를 얻기 위해, 분석 필터 뱅크(32)의 출력에 인코딩 프로세스를 적용한다. 인코딩 프로세스는 또한 인코딩 오디오 정보를 디코딩하기 위해 장치(10)에서 수행되는 프로세스들에 의한 사용을 위해 경로(43)을 따라 다른 메타데이터를 생성할 수 있다. 메타데이터 연산기(44)는 디코더(14)로부터 수신된 서브밴드 신호들 합성 필터 뱅크(18)의 출력 및 분석 필터 뱅크(32)의 출력의 모두 또는 일부의 분석으로부터 메타데이터 값들을 연산할 수 있다.
장치(10) 및 장치(30)의 일부 측면들이 더 상세하게 아래에서 설명된다. 이러한 설명들은 장치(40)의 대응하는 특징들에 대해 적용된다. 이러한 측면들은 앞서 언급된 ATSC 표준에 따르는 방법들 및 장치들의 특징 및 특성들의 측면에서 설명된다. 이러한 특정 특성들 및 특징들은 단지 예시적인 방법에 의해 논의된다. 이러한 구성들에 기초하는 이러한 원리들은 다른 표준에 따르는 방법들 및 장치들에 직접 적용할 수 있다.
C. 수신기/디코더
앞서 언급한 재생 문제는 아래에서 설명될 3가지 다른 기술들 중 하나 이상의 사용에 의해 다루어 질 수 있다. 제1 기술은 이득-한정(gain-limiting)을 이용하며, 오직 장치(10)에서 특징들에 의해 구형될 수 있다. 제2 및 제3 기술들은 동적 범위 압축을 이용하며, 그들의 구현들은 장치(10) 및 장치(30) 양자 모두의 특징을 요구한다.
1. 이득 한정기
제1 기술은 라이 모드(Line Mode) 보다는 RF 모드에서 장치(10)를 동작시키며, 따라서, 이는 동적 범위 압축의 상위 레벨들 및 상위 레퍼런스 재생 레벨을 제공하는 동적 범위 제어기(16)로 ATSC-적용 인코딩 입력 신호를 디코딩한다. 이득 한정기(20)는 추가 이득을 제공하고, -14 dBps부터 -8 dBps까지의 값으로 유효 레퍼런스 재생 레벨을 높이며, 실증적인 결과들은 -11 dBps과 동일한 레퍼런스 레벨을 나타내고, 이는 많은 어플리케이션들을 위한 좋은 결과를 제공한다.
이득 한정기(20)는 또한 0 dBps를 초과하지 않도록 증폭된 디지털 신호를 제한하기 위해 제한 동작을 적용한다. 제한기의 동작 특징은 재생되는 오디오의 인지된 품질에 영향을 미칠 수 있지만, 어떠한 특정 제한기도 본 발명에 대해 임계적(critical)이지는 않다. 제한기는 요구될 수 있는 본질적인 어떤 방법으로 구현될 수 있다. 바람직하게, 제한기는 "하드" 클립핑(clipping) 기능 보다는 "소프트" 제한(limiting) 기능을 제공하도록 설계된다.
2. 디퍼런셜 압축 값들
제2 기술은 장치(10)가 동적 범위 제어기(16)에서 하나 이상의 수정된 동적 범위 압축 파라미터들을 적용하도록 허용한다. 디포맷터(12)는 인코딩된 입력 신호로부터 디퍼런셜(differential) 동적 범위 압축(DRC, dynamic range compression) 값들을 얻고, 동적 범위 제어기(16)로 경로(13)를 따라 종래의 DRC 파라미터 값들과 함께 디퍼런셜 파라미터 값들을 전달한다. 동적 범위 제어기(16)는 하나 이상의 DRC 파라미터 값들을 연산한다. 이는 대응하는 디퍼런셜 DRC 파라미터 값들과 종래의 DRC 파라미터를 산술적으로 조합하는 것이 요구된다. 이득 제한기(20)는 이러한 상황에서 사용될 필요는 없다.
디퍼런셜 DRC 파라미터 값들은 인코딩된 입력 신호로 생성된 인코더/송신기 장치(30)에 의해 인코딩된 입력 신호에서 제공된다. 이는 아래에서 설명된다.
인코딩된 입력 신호가 3개의 디퍼런셜 DRC 값들을 포함하지 않는다면, 장치(10)는 앞서 설명된 제1 기술에 따라 이득 제한기(20)를 사용할 수 있다.
3. 개별의 압축 프로파일
제3 기술은 장치(10)가 동적 범위 제어기(16)에서 새로운 동적 범위 압축 프로파일에 따라 동적 범위 압축을 적용하도록 한다. 디포맷터(12)는 인코딩된 입력 신호로부터 새로운 프로파일을 위한 하나 이상의 DRC 파라미터 값을 얻고, 그들을 경로(13)을 따라 동적 범위 제어기(16)에 전달한다. 이득 한정기(2)는 이러한 상황에서 사용될 필요는 없다.
새로운 동적 범위 압축 프로파일을 대한 DRC 파라미터 값들은 인코딩된 입력 신호로 생성된 인코더/전송기 장치(30)에 의한 인코딩된 입력 신호에서 제공된다. 이는 아래에서 설명된다.
만약, 인코딩된 입력 신호가 새로운 DRC 프로파일을 위한 하나 이상의 DRC 파라미터 값들을 포함하지 않으면, 장치(10)는 앞서 설명된 제1 기술에 따라 이득 제한기(2)를 사용할 수 있다.
D. 인코더/전송기
1. 디퍼런셜 압축 값들
앞서 논의된 제2 기술을 위한 프로세스들은 인코딩된 입력 신호로부터 추출된 디퍼런셜 DRC 파라미터 값들을 이용하는 것에 의해 장치(10)에서 구현된다. 이러한 디퍼런셜 파라미터 값들은 인코딩된 신호를 생성한 장치(30)에 의해 제공된다.
장치(30)는 인코딩된 신호에서 제공될 수 있는 DRC 파라미터 값들의 세트, 및 상위 레퍼런스 재생 레벨에 대해 디코딩된 오디오 신호 샘플들이 0 dBps를 초과하지 않도록 제한하는 것이 요구되는 새로운 DRC 프로파일을 위한 대응하는 베이스 파라미터의 세트 간에 디퍼런셜 DRC 파라미터 값들의 세트를 제공한다. DRC 파라미터 값들을 연산하기 위한 어떤 개별 방법도 본 발명에 대해 임계적이지 않다. ATSC 표준에 적용되는 파라미터 값들을 연산하기 위한 알려진 방법은, 2009년 11월 4일, ATSC(Advanced Television Systems Committee) 사에 의해 발간된, 문헌 A/85, "ATSC Recommended Practice: Techniques for Estalishing an Maintaining Audio Loudness for Digital Television", 특히, 1999년 12월, 뉴욕, 107번째 AES 컨벤션에서, 프리프린트(preprint) 번호.5028, "Dynamic Range Control via Metadata,", 로빈스 외, 섹션 9 및 첨부 F에서 공개되었다.
인코딩된 출력 신호가 ATSC 표준, MPEG-2 AAC 표준 또는 MPEG-4 오디오 표준을 따르면, 레퍼런스 재생 레벨이 -14 dBps에서 -8 dBps로 증가된다. - 실증적인 결과들은 -11 dBps과 동일한 레퍼런스 레벨을 나타내고, 이는 많은 어플리케이션들을 위한 좋은 결과를 제공한다.
ATSC-적용 인코딩 출력 신호들을 위해, 메타데이터 연산기(34)는 표준에서 특정된 대응하는 베이스 파라미터 "compr"를 위한 디퍼런셜 파라미터 값을 연산한다. 포맷터(38)는 디퍼런셜 파라미터 값을 "addbsi"(additional bit stream information) 및/또는 "auxdata"(auxiliary data)로 나타내어지는 각 인코딩된 신호 프레임의 부분들로 결합할 수 있다. 만약, 디퍼런셜 파라미터 값들이 "addbsi" 또는 "auxdata"으로 결합되면, 인코딩된 신호는 모든 ATSC 적용 디코더들에 호환될 것이다. 디퍼런셜 파라미터 값들을 인식하지 않는 이러한 디코더들은 여전히 "addbsi" and "auxdata" 부분들을 무시하는 것에 의해 인코딩된 신호 프레임을 정확하게 프로세싱하고 디코딩할 수 있다. 더 상세한 것은 앞서 언급된 A/52b 문서를 참조하라.
MPEG-2 AAC 또는 MPEG-4 오디오 표준들에 적용되는 인코딩된 출력 신호들을 위해, 포맷터(38)는 2개의 표준들에서 "Fill_Element" 또는 "Data_Stream_Element"로 나타내어지는 각 인코딩된 신호 프레임의 부분들에 디퍼런셜 파라미터 값들을 결합할 수 있다. 디퍼런셜 파라미터 값은 이러한 부분들 모두로 결합된다면, 인코딩된 신호는 모든 MPEG-2 AAC 및 MPEG-4 오디오 표준 적용 디코더들과 호환될 것이다. 더 상세한 것은 앞서 언급된 ISO/IEC 13818-7 및 ISO/IEC 14496-3 문헌들을 참조하라.
디퍼런셜 파라미터 값들은 연산되고, 대응하는 베이스 파라미터 값들이 인코딩된 신호에 내에 있는 레이트(rate) 보다 크거나, 동일하거나, 또는, 작은 레이트에서 인코딩된 신호로 삽입될 수 있다. 디퍼런셜 값들에 대한 레이트는 다양할 수 있다. 앞선 디퍼런셜 값이 재사용되야만 하는지 여부를 나타내는 플래그(Flag)들 또는 비트들은 또한 인코딩된 신호에 포함될 수도 있다.
2. 개별 압축 프로파일
앞서 논의된 제3 기술을 위한 프로세서는 인코딩된 입력 신호로부터 추출되는 새로운 동적 범위 압축 프로파일을 위한 DRC 파라미터 값들을 이용하는 것에 의해 장치(10)에서 구현된다. 이러한 파라미터 값들은 인코딩된 신호를 생성한 장치(30)에 의해 제공된다.
장치(30)는 상위 레퍼런스 재생 레벨을 위해 디코딩된 오디오 신호 샘플들이 0 dBps를 초과하는 것을 방지하기 위해 필요한 파라미터 값들을 연산하는 것에 의해 새로운 DRC 프로파일을 위한 DRC 파라미터 값들을 유도한다.
인코딩된 출력 신호가 ATSC 표준, MPEG-2 AAC 표준 또는 MPEG-4 오디오 표준을 따르면, 메타데이터 연산기(34)는 레퍼런스 재생 레벨이 -14 dBps에서 -8 dBps 까지 증가되는 것으로 추정하는 것에 기초하여 DRC 압축 값을 연산한다. - 실증적인 결과들은 -11 dBps과 동일한 레퍼런스 레벨을 나타내고, 이는 많은 어플리케이션들을 위한 좋은 결과를 제공한다. 포맷터(38)는 디퍼런셜 파라미터들에 대해 앞서 설명된 바와 같은 각 인코딩된 신호 프레임의 부분으로 DRC 프로파일을 위한 파라미터 값을 결합할 수 있다. 프레임들의 이러한 부분들의 사용은 인코딩된 신호가 개별 표준을 따르는 모든 디코더들과 호환되도록 한다.
E. 구현
본 발명의 다양한 측면들이 포함된 장치들은 범용 컴퓨터에서 발견될 수 있는 것들과 유사한 컴포넌트들과 결합되는 DSP(digital signal processor) 회로와 같은 보다 특별한 컴포넌트들을 포함하는 몇몇 다른 장치 또는 컴퓨터에 의해 실행되는 소프트웨어를 포함하는 다양한 방법들로 구현될 수 있다. 도 6은 본 발명의 측면들을 구현하기 위해 사용될 수 있는 장치(70)의 개략적인 블록도이다. 프로세서(72)는 컴퓨팅 리소스들을 제공한다. RAM(73)은 프로세싱을 위해 프로세서(72)에 의해 사용되는 시스템 RAM(random access memory)이다. ROM(74)은 장치(70)를 동작시키기 위해 필요한 프로그램들을 저장하고, 그리고, 가능한 본 발명의 다양한 측면들을 수행하기 위한 ROM(read only memory)와 같은 영구 저장의 형식을 나타낸다. I/O 제어기(75)는 통신 채널들(76, 77)을 통해 출력 신호들을 전송하고 입력 신호들을 수신하기 위한 인터페이스 회로를 나타낸다. 보여진 실시예에서, 모든 메이저 시스템 컴포넌트들은 버스(71)에 연결되며, 하나의 물리 또는 논리 버스 이상을 표현할 수 있다. 하지만, 버스 아키텍처는 본 발명을 구현하기 위해 요구되지 않는다.
범용 컴퓨터 시스템에 의해 구현된 실시예에 있어서, 추가 컴포넌트들은 자기 테이프 또는 디스크, 또는 광학 매체와 같은 저장 매체를 가지는 저장 장치(78)를 제어하기 위해, 그리고, 키보드 또는 마우스 및 디스플레이와 같은 장치들에 대한 인터페이싱을 위해 포함될 수 있다. 저장 매체는 운영 체제, 유틸리티들 및 어플리케이션들을 위한 명령들의 기록 프로그램들로 사용될 수 있고, 그리고, 본 발명의 다양한 측면들을 구현하는 프로그램들을 포함할 수 있다.
본 발명의 다양한 측면들을 실행하기 위해 요구되는 기능들은 분산 논리 컴포넌트들, 집적 회로들, 하나 이상의 ASIC들 및/또는 프로그램 제어 프로세서들을 포함하는 매우 다양한 방법으로 구현될 수 있는 컴포넌트들에 의해 수행될 수 있다. 이러한 컴포넌트들이 구현될 수 있는 방식은 본 발명에 있어서 중요한 것이 아니다.
본 발명의 소프트웨어 구현들은 슈퍼소닉(supersonic)에서 자외선(ultraviolet) 주파수들까지를 포함하는 스펙트럼을 통해 기저 또는 변조 통신 경로들과 같은 다양한 머신 판독 가능한 매체, 또는, 페이퍼를 포함하는 매체 상에 자기 테이프, 카드들 또는 디스크, 광학 카드들 또는 디스크, 및 검출 가능한 메이킹들을 포함하는 어떤 기록 기술을 근본적으로 사용하는 정보를 전달하는 저장 매체에 의해 전달될 수 있다.
10: 수신기/디코더 장치 12: 디포맷터
14: 디코더 16: 동적 범위 제어기
18: 합성 필터 뱅크 20: 이득 제한기
32: 분석 필터 뱅크 34: 메타데이터 연산기
36: 인코더 38: 포맷터
44: 메타데이터 연산기 72: DSP
73: RAM 74: ROM
75: I/O 제어기

Claims (14)

  1. 오디오 출력 신호를 생성하기 위해 인코딩된 입력 신호를 디코딩하기 위한 방법에 있어서,
    인코딩 오디오 정보 및 하나 이상의 디코딩 제어 파라미터들과 제1 동적 범위 압축 프로파일에 따라 동적 범위 압축을 특정하는 하나 이상의 제1 파라미터들을 포함하는 관련된 메타데이터를 포함하며, 제2 동적 범위 압축 프로파일에 따라 동적 범위 압축을 특정하는 하나 이상의 제2 파라미터들을 선택적으로 포함하는 인코딩된 입력 신호를 수신하는 단계로서, 상기 하나 이상의 제1 파라미터들은 제1 레퍼런스 재생 레벨에서 재생을 위한 클리핑 레벨을 초과하지 않는 진폭을 가지는 청각 자극을 표현하기 위한 인코딩 오디오 정보를 생성한 인코딩 프로세스에 따라 설정된 값들을 가지며, 상기 하나 이상의 제2 파라미터들은 상기 제1 레퍼런스 재생 레벨 보다 높은 제2 레퍼런스 재생 레벨에서 재생을 위한 클리핑 레벨을 초과하지 않는 진폭을 가지는 상기 청각 자극을 표현하기 위한 상기 인코딩 오디오 정보를 생성한 상기 인코딩 프로세스에 따라 설정되는 값을 가지는 것을 특징으로 하는, 인코딩된 입력 신호를 수신하는 단계;
    상기 청각 자극의 스펙트럼 콘텐츠를 표현하는 서브밴드 신호들을 얻기 위해 인코딩 오디오 정보에 대해 디코딩 프로세스를 적용하는 단계로서, 상기 디코딩 프로세스는 하나 이상의 디코딩 제어 파라미터들에 대응하여 적용되는, 디코딩 프로세스를 적용하는 단계;
    변경된 동적 범위 특성들을 가지는 수정된 서브밴드 신호들을 얻기 위해 서브밴드 신호들을 수정하는 단계로서, 상기 수정은 상기 메타데이터가 상기 하나 이상의 제2 파라미터들을 포함하면 상기 하나 이상의 제2 파라미터들에 대응하여 적용되며, 상기 메타데이터가 상기 하나 이상의 제2 파라미터들을 포함하지 않으면 상기 하나 이상의 제1 파라미터들에 대응하여 적용되는 것을 특징으로 하는, 서브밴드 신호들을 수정하는 단계;
    시간 도메인 오디오 신호를 얻기 위해 상기 수정된 서브밴드 신호들에 대해 합성 필터 뱅크를 적용하는 단계; 및
    상기 메타데이터가 상기 하나 이상의 제2 파라미터들을 포함하지 않으면, 상기 메타데이터에 대응하는 상기 시간 도메인 오디오 신호에 이득 및 제한기를 적용하는 단계로서, 상기 이득을 적용하는 것은 제2 레퍼런스 재생 레벨에서 재생을 위한 진폭을 가지는 오디오 출력 신호를 얻기 위해 시간 도메인 오디오 신호를 수정하고, 상기 제한기를 적용하는 것은 상기 오디오 출력 신호의 진폭들이 클리핑 레벨을 초과하는 것을 방지하는 것을 특징으로 하는, 이득 및 제한기를 적용하는 단계;를 포함하는 것을 특징으로 하는
    인코딩된 입력 신호를 디코딩하기 위한 방법.
  2. 제1항에 있어서,
    상기 하나 이상의 제2 파라미터들은
    상기 제1 동적 범위 압축 프로파일을 위한 대응하는 파라미터들 및
    상기 제2 동적 범위 압축 프로파일 사이의 차이들을 표현하는 것을 특징으로 하는 인코딩된 입력 신호를 디코딩하기 위한 방법.
  3. 제1항 또는 제2항에 있어서,
    상기 인코딩된 입력 신호는 ATSC 표준, MPEG-2 AAC 표준, 또는, MPEG-4 오디오 표준이 적용되며,
    상기 제1 레퍼런스 재생 레벨은 진폭 20 dB 이하의 클리핑 레벨에 대응하고,
    상기 제2 레퍼런스 재생 레벨은 지폭 11 dB 이하의 클리핑 레벨에 대응하는 것을 특징으로 하는
    인코딩된 입력 신호를 디코딩하기 위한 방법.
  4. 청각 자극을 표현하는 오디오 입력 신호를 인코딩하기 위한 방법에 있어서,
    상기 오디오 입력 신호를 수신하는 단계;
    상기 오디오 입력 신호의 스펙트럼 콘텐츠를 표현하는 서브밴드 신호들을 생성하기 위해 상기 오디오 입력 신호에 분석 필터 뱅크를 적용하는 단계;
    제2 동적 범위 압축 프로파일에 따라 동적 압축을 특정하는 하나 이상의 제2 파라미터들 및 제1 동적 범위 압축 프로파일에 따라 동적 범위 압축을 특정하는 하나 이상의 제1 파라미터들 포함하는 메타데이터를 연산하기 위해 상기 오디오 입력 신호로부터 유도된 하나 이상의 신호들을 분석하는 단계로서, 상기 하나 이상의 제1 파라미터들은 상기 제1 레퍼런스 재생 레벨에서 재생을 위한 클리핑 레벨을 초과하지 않는 진폭을 가지는 청각 자극을 표현하도록 설정되며, 상기 하나 이상의 제2 파라미터들은 제2 레퍼런스 재생 레벨에서 재생을 위한 클리핑 레벨을 초과하지 않는 진폭을 가지는 상기 청각 자극을 표현하기 위해 설정되는 값을 가지는 것을 특징으로 하는, 하나 이상의 신호들을 분석하는 단계;
    인코딩 오디오 정보를 얻기 위해 상기 서브밴드 신호들에 인코딩 프로세스를 적용하는 단계; 및
    인코딩 오디오 정보 및 메타데이터를 전송 또는 저장에 적합한 포맷을 가지는 인코딩된 출력 신호와 결합하는 단계로서, 상기 하나 이상의 제2 파라미터들은 상기 제1 동적 범위 압축 프로파일을 위한 대응하는 파라미터들 및 상기 제2 동적 범위 압축 프로파일 사이의 차이를 표현하는 것을 특징으로 하는, 결합하는 단계;를 포함하는 것을 특징으로 하는
    오디오 입력 신호를 인코딩하기 위한 방법.
  5. 제4항에 있어서,
    상기 인코딩된 입력 신호는 ATSC 표준, MPEG-2 AAC 표준, 또는, MPEG-4 오디오 표준이 적용되며,
    상기 제1 레퍼런스 재생 레벨은 진폭 20 dB 이하의 클리핑 레벨에 대응하고,
    상기 제2 레퍼런스 재생 레벨은 지폭 11 dB 이하의 클리핑 레벨에 대응하는 것을 특징으로 하는
    오디오 입력 신호를 인코딩하기 위한 방법.
  6. 인코딩된 출력 신호를 생성하도록 인코딩된 입력 신호를 트랜스코딩하기 위한 방법에 있어서,
    제1 동적 범위 압축 프로파일에 따라 동적 범위 압축을 특정하는 하나 이상의 제1 파라미터들 및 하나 이상의 디코딩 제어 파라미터들을 포함하는 연관된 메타데이터 및 제1 인코딩 오디오 정보를 포함하는 상기 인코딩된 입력 신호를 수신하는 단계로서, 상기 하나 이상의 제1 파라미터들은 제1 레퍼런스 재생 레벨에서 재생을 위한 클리핑 레벨을 초과하지 않는 진폭들을 가지는 청각 자극을 표현하기 위해 상기 제1 인코딩 오디오 정보를 생성한 제1 인코딩 프로세스에 따라 설정되는 값들을 가지는 것을 특징으로 하는, 상기 인코딩된 입력 신호를 수신하는 단계;
    상기 청각 자극의 스펙트럼 콘텐츠를 표현하는 서브밴드 신호들을 얻기 위해 상기 제1 인코딩 오디오 정보에 디코딩 프로세스를 적용하는 단계로서, 상기 디코딩 프로세스는 상기 하나 이상의 디코딩 제어 파라미터에 대응하여 적용되는 것을 특징으로 하는, 디코딩 프로세스를 적용하는 단계;
    제2 동적 범위 압축 프로파일에 따라 동적 범위 압축을 특정하는 하나 이상의 파라미터들을 연산하기 위하여 상기 서브밴드 신호들로부터 얻어진 하나 이상의 신호들을 분석하는 단계로서, 상기 하나 이상의 제2 파라미터들은 제2 레퍼런스 재생 레벨에서 재생을 위한 클리핑 레벨을 초과하지 않는 진폭들을 가지는 상기 청각 자극을 표현하기 위해 설정되는 값을 가지는 것을 특징으로 하는, 하나 이상의 신호들을 분석하는 단계; 및
    제2 인코딩 오디오 정보, 상기 하나 이상의 제1 파라미터들 및 상기 하나 이상의 제2 파라미터들을 전송 또는 저장에 적합한 포맷을 가지는 인코딩된 출력 신호로 결합하는 단계로서, 상기 제2 인코딩 오디오 정보는 상기 서브밴드 신호들의 인코딩된 표현인 것을 특징으로 하는, 인코딩된 출력 신호로 결합하는 단계;를 포함하는 것을 특징으로 하는
    인코딩된 입력 신호를 트랜스코딩하기 위한 방법.
  7. 제6항에 있어서,
    상기 하나 이상의 제2 파라미터들은
    상기 제1 동적 범위 압축 프로파일을 위한 대응하는 파라미터들 및
    상기 제2 동적 범위 압축 프로파일 사이의 차이들을 표현하는 것을 특징으로 하는
    인코딩된 입력 신호를 트랜스코딩하기 위한 방법.
  8. 제6항 또는 제7항에 있어서,
    동적 범위 압축을 특정하는 상기 하나 이상의 제2 파라미터들을 연산하기 위해 분석된 상기 하나 이상의 신호들을 얻기 위해
    상기 서브밴드 신호들에 합성 필터 뱅크를 적용하는 단계;를 포함하는 것을 특징으로 하는
    인코딩된 입력 신호를 트랜스코딩하기 위한 방법.
  9. 제6항 내지 제8항 중 어느 한 항에 있어서,
    상기 제2 인코딩 오디오 정보를 생성하기 위해
    상기 서브밴드 신호들에 제2 인코딩 프로세스를 적용하는 단계를 포함하는 것을 특징으로 하는
    인코딩된 입력 신호를 트랜스코딩하기 위한 방법.
  10. 제6항 내지 제8항 중 어느 한 항에 있어서,
    상기 제2 인코딩 오디오 정보는
    상기 제2 인코딩 오디오 정보인 것을 특징으로 하는
    인코딩된 입력 신호를 트랜스코딩하기 위한 방법.
  11. 제6항 내지 제10항 중 어느 한 항에 있어서,
    상기 인코딩된 입력 신호는 ATSC 표준, MPEG-2 AAC 표준, 또는, MPEG-4 오디오 표준이 적용되며,
    상기 제1 레퍼런스 재생 레벨은 진폭 20 dB 이하의 클리핑 레벨에 대응하는 것을 특징으로 하는
    인코딩된 입력 신호를 트랜스코딩하기 위한 방법.
  12. 제6항 내지 제10항 중 어느 한 항에 있어서,
    상기 인코딩된 출력 신호는 ATSC 표준, MPEG-2 AAC 표준, 또는, MPEG-4 오디오 표준이 적용되며,
    상기 제2 레퍼런스 재생 레벨은 지폭 11 dB 이하의 클리핑 레벨에 대응하는 것을 특징으로 하는
    인코딩된 입력 신호를 트랜스코딩하기 위한 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 따른 방법의 단계들을 수행하기 위한 수단들을 포함하는 장치.
  14. 제1항 내지 제12항 중 어느 한 항에 따른 방법의 단계들을 수행하기 위한 장치에 의해 실행 가능한 명령의 프로그램을 기록한 저장 매체.
KR1020127023274A 2010-02-11 2011-02-03 휴대용 장치 내의 오디오 신호들의 라우드니스를 비파괴적으로 노말라이즈하기 위한 시스템 및 방법 KR101381588B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US30364310P 2010-02-11 2010-02-11
US61/303,643 2010-02-11
PCT/US2011/023531 WO2011100155A1 (en) 2010-02-11 2011-02-03 System and method for non-destructively normalizing loudness of audio signals within portable devices

Publications (2)

Publication Number Publication Date
KR20120124484A true KR20120124484A (ko) 2012-11-13
KR101381588B1 KR101381588B1 (ko) 2014-04-17

Family

ID=43881135

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127023274A KR101381588B1 (ko) 2010-02-11 2011-02-03 휴대용 장치 내의 오디오 신호들의 라우드니스를 비파괴적으로 노말라이즈하기 위한 시스템 및 방법

Country Status (18)

Country Link
US (7) US8903729B2 (ko)
EP (3) EP3444816B8 (ko)
JP (2) JP5666625B2 (ko)
KR (1) KR101381588B1 (ko)
CN (2) CN103795364B (ko)
AR (1) AR080156A1 (ko)
BR (2) BR122019025627B1 (ko)
CA (6) CA2787466C (ko)
CL (1) CL2012002213A1 (ko)
CO (1) CO6511277A2 (ko)
EA (1) EA023730B9 (ko)
ES (1) ES2916403T3 (ko)
MX (1) MX2012008954A (ko)
MY (1) MY169981A (ko)
SG (1) SG182632A1 (ko)
TW (2) TWI447709B (ko)
UA (1) UA105277C2 (ko)
WO (1) WO2011100155A1 (ko)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10848118B2 (en) 2004-08-10 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US10158337B2 (en) 2004-08-10 2018-12-18 Bongiovi Acoustics Llc System and method for digital signal processing
US11431312B2 (en) 2004-08-10 2022-08-30 Bongiovi Acoustics Llc System and method for digital signal processing
US10701505B2 (en) 2006-02-07 2020-06-30 Bongiovi Acoustics Llc. System, method, and apparatus for generating and digitally processing a head related audio transfer function
US10848867B2 (en) 2006-02-07 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
TWI501580B (zh) 2009-08-07 2015-09-21 Dolby Int Ab 資料串流的鑑別
TWI413110B (zh) 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
CN102754159B (zh) 2009-10-19 2016-08-24 杜比国际公司 指示音频对象的部分的元数据时间标记信息
TWI447709B (zh) * 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
TWI525987B (zh) 2010-03-10 2016-03-11 杜比實驗室特許公司 在單一播放模式中組合響度量測的系統
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9171549B2 (en) * 2011-04-08 2015-10-27 Dolby Laboratories Licensing Corporation Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams
JP6174129B2 (ja) * 2012-05-18 2017-08-02 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
US9378748B2 (en) * 2012-11-07 2016-06-28 Dolby Laboratories Licensing Corp. Reduced complexity converter SNR calculation
US9411881B2 (en) 2012-11-13 2016-08-09 Dolby International Ab System and method for high dynamic range audio distribution
RU2631139C2 (ru) * 2013-01-21 2017-09-19 Долби Лэборетериз Лайсенсинг Корпорейшн Оптимизация громкости и динамического диапазона через различные устройства воспроизведения
AU2014207590B2 (en) 2013-01-21 2015-08-13 Dolby Laboratories Licensing Corporation Audio encoder and decoder with program loudness and boundary metadata
CN203134365U (zh) * 2013-01-21 2013-08-14 杜比实验室特许公司 用于利用响度处理状态元数据处理音频的音频解码器
RU2639663C2 (ru) * 2013-01-28 2017-12-21 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах
CN110379434B (zh) * 2013-02-21 2023-07-04 杜比国际公司 用于参数化多声道编码的方法
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
US9607624B2 (en) 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
US9883318B2 (en) 2013-06-12 2018-01-30 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CN117767898A (zh) * 2013-09-12 2024-03-26 杜比实验室特许公司 用于各种回放环境的动态范围控制
JP6506764B2 (ja) * 2013-09-12 2019-04-24 ドルビー ラボラトリーズ ライセンシング コーポレイション ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整
CN105531762B (zh) * 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
US20150095320A1 (en) * 2013-09-27 2015-04-02 Trooclick France Apparatus, systems and methods for scoring the reliability of online information
PL3522157T3 (pl) 2013-10-22 2022-02-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koncepcja połączonej kompresji zakresu dynamiki i sterowanego zapobiegania obcinaniu dla urządzeń audio
US9906858B2 (en) 2013-10-22 2018-02-27 Bongiovi Acoustics Llc System and method for digital signal processing
US20150146099A1 (en) * 2013-11-25 2015-05-28 Anthony Bongiovi In-line signal processor
US9276544B2 (en) 2013-12-10 2016-03-01 Apple Inc. Dynamic range control gain encoding
KR102513009B1 (ko) 2013-12-27 2023-03-22 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
US9608588B2 (en) 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
EP3111670B1 (en) * 2014-02-27 2023-11-22 Sonarworks SIA Method of and apparatus for determining an equalization filter
US10063207B2 (en) * 2014-02-27 2018-08-28 Dts, Inc. Object-based audio loudness management
RU2658888C2 (ru) * 2014-03-24 2018-06-25 Долби Интернэшнл Аб Способ и устройство для применения сжатия динамического диапазона к сигналу амбиофонии высшего порядка
TR201809427T4 (tr) 2014-03-25 2018-07-23 Fraunhofer Ges Forschung Di̇nami̇k aralik kontrolünde etki̇n edi̇ni̇m koduna sahi̇p olan ses kodlama ci̇hazi ve bi̇r ses dekoderi̇
US10820883B2 (en) 2014-04-16 2020-11-03 Bongiovi Acoustics Llc Noise reduction assembly for auscultation of a body
CN106663434B (zh) * 2014-06-27 2021-09-28 杜比国际公司 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法
EP3148200B1 (en) * 2014-06-30 2020-06-17 Sony Corporation Information processing device and method selecting content files based on encoding parallelism type
EP2963948A1 (en) * 2014-07-02 2016-01-06 Thomson Licensing Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation
EP4044180A1 (en) 2014-10-01 2022-08-17 Dolby International AB Decoding an encoded audio signal using drc profiles
CN107112023B (zh) 2014-10-10 2020-10-30 杜比实验室特许公司 基于发送无关的表示的节目响度
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10109288B2 (en) 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US9590580B1 (en) 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
TWI594231B (zh) * 2016-12-23 2017-08-01 瑞軒科技股份有限公司 分頻壓縮電路,音訊處理方法以及音訊處理系統
US11089349B2 (en) * 2017-01-20 2021-08-10 Hanwha Techwin Co., Ltd. Apparatus and method for playing back and seeking media in web browser
EP3574583B1 (en) * 2017-03-31 2020-12-09 Dolby International AB Inversion of dynamic range control
CN110033781B (zh) * 2018-01-10 2021-06-01 盛微先进科技股份有限公司 音频处理方法、装置及非暂时性电脑可读媒体
CA3168579A1 (en) 2018-04-09 2019-10-17 Dolby International Ab Methods, apparatus and systems for three degrees of freedom (3dof+) extension of mpeg-h 3d audio
WO2019200119A1 (en) 2018-04-11 2019-10-17 Bongiovi Acoustics Llc Audio enhanced hearing protection system
WO2020028833A1 (en) 2018-08-02 2020-02-06 Bongiovi Acoustics Llc System, method, and apparatus for generating and digitally processing a head related audio transfer function
EP3809709A1 (en) * 2019-10-14 2021-04-21 Koninklijke Philips N.V. Apparatus and method for audio encoding
CN112732069A (zh) * 2021-02-20 2021-04-30 上海创感传感技术有限公司 一种电子设备状态修改方法和装置
CN112992159B (zh) * 2021-05-17 2021-08-06 北京百瑞互联技术有限公司 一种lc3音频编解码方法、装置、设备及存储介质

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2373975B (en) 2001-03-30 2005-04-13 Sony Uk Ltd Digital audio signal processing
US7328151B2 (en) * 2002-03-22 2008-02-05 Sound Id Audio decoder with dynamic adjustment of signal modification
US7072477B1 (en) 2002-07-09 2006-07-04 Apple Computer, Inc. Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US7398207B2 (en) * 2003-08-25 2008-07-08 Time Warner Interactive Video Group, Inc. Methods and systems for determining audio loudness levels in programming
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7729673B2 (en) 2004-12-30 2010-06-01 Sony Ericsson Mobile Communications Ab Method and apparatus for multichannel signal limiting
JP2007109328A (ja) 2005-10-14 2007-04-26 Kenwood Corp 再生装置
US20080025530A1 (en) 2006-07-26 2008-01-31 Sony Ericsson Mobile Communications Ab Method and apparatus for normalizing sound playback loudness
EP2063418A4 (en) * 2006-09-15 2010-12-15 Panasonic Corp AUDIO CODING DEVICE AND AUDIO CODING METHOD
DE102006048685A1 (de) * 2006-10-14 2008-04-17 Mtu Aero Engines Gmbh Turbinenschaufel einer Gasturbine
US20090253457A1 (en) 2008-04-04 2009-10-08 Apple Inc. Audio signal processing for certification enhancement in a handheld wireless communications device
US8645129B2 (en) * 2008-05-12 2014-02-04 Broadcom Corporation Integrated speech intelligibility enhancement system and acoustic echo canceller
US9197181B2 (en) * 2008-05-12 2015-11-24 Broadcom Corporation Loudness enhancement system and method
US8315396B2 (en) 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
TWI416868B (zh) * 2008-07-29 2013-11-21 Lg Electronics Inc 音頻訊號之處理方法及其裝置
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
JP2010135906A (ja) 2008-12-02 2010-06-17 Sony Corp クリップ防止装置及びクリップ防止方法
TWI447709B (zh) * 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
PL2381574T3 (pl) 2010-04-22 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób do modyfikacji wejściowego sygnału audio
JP5903758B2 (ja) 2010-09-08 2016-04-13 ソニー株式会社 信号処理装置および方法、プログラム、並びにデータ記録媒体
US8989884B2 (en) 2011-01-11 2015-03-24 Apple Inc. Automatic audio configuration based on an audio output device
JP2012235310A (ja) 2011-04-28 2012-11-29 Sony Corp 信号処理装置および方法、プログラム、並びにデータ記録媒体
US8965774B2 (en) 2011-08-23 2015-02-24 Apple Inc. Automatic detection of audio compression parameters
JP5845760B2 (ja) 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
JP2013102411A (ja) 2011-10-14 2013-05-23 Sony Corp 音声信号処理装置、および音声信号処理方法、並びにプログラム
BR112014015629B1 (pt) 2011-12-15 2022-03-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Aparelho e método para evitar perturbações de clipagem.
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
EP2757558A1 (en) 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
RU2639663C2 (ru) 2013-01-28 2017-12-21 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
US9607624B2 (en) 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
JP2015050685A (ja) 2013-09-03 2015-03-16 ソニー株式会社 オーディオ信号処理装置および方法、並びにプログラム
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
US9300268B2 (en) 2013-10-18 2016-03-29 Apple Inc. Content aware audio ducking
PL3522157T3 (pl) 2013-10-22 2022-02-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koncepcja połączonej kompresji zakresu dynamiki i sterowanego zapobiegania obcinaniu dla urządzeń audio
US9240763B2 (en) 2013-11-25 2016-01-19 Apple Inc. Loudness normalization based on user feedback
US9276544B2 (en) 2013-12-10 2016-03-01 Apple Inc. Dynamic range control gain encoding
KR102513009B1 (ko) 2013-12-27 2023-03-22 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
US9608588B2 (en) 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
TR201809427T4 (tr) 2014-03-25 2018-07-23 Fraunhofer Ges Forschung Di̇nami̇k aralik kontrolünde etki̇n edi̇ni̇m koduna sahi̇p olan ses kodlama ci̇hazi ve bi̇r ses dekoderi̇
US9654076B2 (en) 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
RU2653858C1 (ru) 2014-05-28 2018-05-15 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Процессор данных и транспорт данных пользовательского управления на устройства декодирования и воспроизведения аудио
SG11201609855WA (en) 2014-05-30 2016-12-29 Sony Corp Information processing apparatus and information processing method
EP3163570A4 (en) 2014-06-30 2018-02-14 Sony Corporation Information processor and information-processing method
TWI631835B (zh) 2014-11-12 2018-08-01 弗勞恩霍夫爾協會 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器
US20160315722A1 (en) 2015-04-22 2016-10-27 Apple Inc. Audio stem delivery and control
US10109288B2 (en) 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
BR112017025552B1 (pt) 2015-05-29 2023-01-24 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Dispositivo e método para controle de volume e sintonizador de rádio
MX2017016333A (es) 2015-06-17 2018-04-24 Fraunhofer Ges Forschung Control de intensidad subjetiva para interaccion del usuario en sistemas de codificacion de audio.
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US9934790B2 (en) 2015-07-31 2018-04-03 Apple Inc. Encoded audio metadata-based equalization
US10341770B2 (en) 2015-09-30 2019-07-02 Apple Inc. Encoded audio metadata-based loudness equalization and dynamic equalization during DRC

Also Published As

Publication number Publication date
AR080156A1 (es) 2012-03-14
EP2534656B1 (en) 2018-09-05
MY169981A (en) 2019-06-19
EA023730B1 (ru) 2016-07-29
JP5666625B2 (ja) 2015-02-12
CA2787466C (en) 2016-04-05
CA2787466A1 (en) 2011-08-18
EP2534656A1 (en) 2012-12-19
CL2012002213A1 (es) 2012-11-30
EP3444816B1 (en) 2022-04-13
TW201205559A (en) 2012-02-01
BR122019025627B1 (pt) 2021-01-19
CA3075793A1 (en) 2011-08-18
WO2011100155A1 (en) 2011-08-18
SG182632A1 (en) 2012-08-30
US20190325886A1 (en) 2019-10-24
EP4047602A1 (en) 2022-08-24
US11670315B2 (en) 2023-06-06
CA2995461C (en) 2020-04-28
US10566006B2 (en) 2020-02-18
BR112012019880A2 (pt) 2016-04-26
EP3444816B8 (en) 2022-05-25
JP6133263B2 (ja) 2017-05-24
US20170213566A1 (en) 2017-07-27
CA3201814A1 (en) 2011-08-18
UA105277C2 (ru) 2014-04-25
EA023730B9 (ru) 2016-11-30
US8903729B2 (en) 2014-12-02
CA3075793C (en) 2021-05-18
MX2012008954A (es) 2012-08-23
CA2995461A1 (en) 2011-08-18
ES2916403T3 (es) 2022-06-30
CN102754151A (zh) 2012-10-24
BR112012019880B1 (pt) 2020-10-13
CN103795364B (zh) 2016-08-24
CA2918302A1 (en) 2011-08-18
KR101381588B1 (ko) 2014-04-17
TWI529703B (zh) 2016-04-11
JP2013519918A (ja) 2013-05-30
CA3114177C (en) 2023-08-01
EP3444816A1 (en) 2019-02-20
CA2918302C (en) 2018-04-03
US20120310654A1 (en) 2012-12-06
US11341982B2 (en) 2022-05-24
EA201270712A1 (ru) 2013-01-30
US20150043754A1 (en) 2015-02-12
CA3114177A1 (en) 2011-08-18
US20220358944A1 (en) 2022-11-10
US20200176008A1 (en) 2020-06-04
US11948592B2 (en) 2024-04-02
US10418045B2 (en) 2019-09-17
US9646622B2 (en) 2017-05-09
CO6511277A2 (es) 2012-08-31
TW201506912A (zh) 2015-02-16
TWI447709B (zh) 2014-08-01
CN102754151B (zh) 2014-03-05
US20230343347A1 (en) 2023-10-26
CN103795364A (zh) 2014-05-14
JP2015045886A (ja) 2015-03-12

Similar Documents

Publication Publication Date Title
US11670315B2 (en) System and method for non-destructively normalizing loudness of audio signals within portable devices

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170320

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180312

Year of fee payment: 5