JP2015045886A - 携帯機器内でオーディオ信号のラウドネスを非破壊的に正規化するシステムおよび方法 - Google Patents
携帯機器内でオーディオ信号のラウドネスを非破壊的に正規化するシステムおよび方法 Download PDFInfo
- Publication number
- JP2015045886A JP2015045886A JP2014249460A JP2014249460A JP2015045886A JP 2015045886 A JP2015045886 A JP 2015045886A JP 2014249460 A JP2014249460 A JP 2014249460A JP 2014249460 A JP2014249460 A JP 2014249460A JP 2015045886 A JP2015045886 A JP 2015045886A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- encoded
- level
- dynamic range
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 30
- 230000006835 compression Effects 0.000 claims abstract description 77
- 238000007906 compression Methods 0.000 claims abstract description 77
- 238000000034 method Methods 0.000 claims description 94
- 230000008569 process Effects 0.000 claims description 53
- 230000004044 response Effects 0.000 claims description 28
- 230000015572 biosynthetic process Effects 0.000 claims description 15
- 238000003786 synthesis reaction Methods 0.000 claims description 15
- 230000004048 modification Effects 0.000 claims description 5
- 238000012986 modification Methods 0.000 claims description 5
- 230000003595 spectral effect Effects 0.000 description 13
- 238000000354 decomposition reaction Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3089—Control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/32—Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
本願は、ここに参照によってその全体において組み込まれる2010年2月11日に出願された米国特許仮出願第61/303,643号の優先権を主張する。
本発明は、概括的にはオーディオ信号のエンコードおよびデコードに関し、より詳細には、より幅広い範囲の再生装置および聴取環境のためにオーディオ信号をエンコードおよびデコードするために使用されうる技法に関する。
本発明は、ハンドヘルドおよび他の型のポータブル装置のユーザーが遭遇するようなチャレンジングな聴取環境における再生のためにオーディオ情報をエンコードおよびデコードすることに向けられる。オーディオ・エンコードおよびデコードの若干の例は、非特許文献1(本稿では「ATSC規格」と称する)、非特許文献2(本稿では「MPEG-2 AAC規格」と称する)および非特許文献3(本稿では「MPEG-4オーディオ規格」と称する)に記載されるような公開された規格によって記述されている。これらの規格に準拠するエンコードおよびデコード・プロセスは単に例として言及されている。本発明の原理は、他の規格に準拠する符号化システムと一緒に使われてもよい。
図1は、本発明のさまざまな側面を組み込む受信側/デコーダ装置10の一つの型の概略的なブロック図である。装置10は信号経路11からエンコードされた入力信号を受領し、フォーマット解除器12において好適なプロセスを適用して前記入力信号からエンコードされたオーディオ情報および関連するメタデータを抽出し、該メタデータを信号経路13に沿って渡す。エンコードされたオーディオ情報は、聴覚的な刺激のスペクトル内容を表すエンコードされたサブバンド信号を含み、メタデータは、一つまたは複数のデコード制御パラメータおよびダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数のパラメータを含む多様なパラメータについての値を指定する。「ダイナミックレンジ圧縮プロファイル」という用語は、利得因子、圧縮アタック時(compression attack times)および圧縮リリース時(compression release times)といった、ダイナミックレンジ圧縮器の動作特性を定義する特徴を指す。
上記の再生の問題は、以下に述べる三つの異なる技法の一つまたは複数を使うことによって対処されうる。第一の技法は、利得制限を使い、装置10のみの機能によって実装されうる。第二および第三の技法はダイナミックレンジ圧縮を使い、その実装は装置10と装置30の両方の機能を必要とする。
第一の技法はライン・モードではなくRFモードで装置10を動作させる。それにより、装置10はATSC準拠のエンコードされた入力信号をデコードし、ダイナミックレンジ・コントロール16はより高いレベルのダイナミックレンジ圧縮およびより高い基準再生レベルを提供する。利得制限器20は追加的な利得を提供し、有効基準再生レベルを−14dBFSから−8dBFSの値に上昇させる。経験的な結果は、−11dBFSに等しい基準レベルが多くの応用にとって良好な結果を与えることを示している。
第二の技法は、装置10が、ダイナミックレンジ・コントロール16において一つまたは複数の修正されたダイナミックレンジ圧縮パラメータを適用することを許容する。フォーマット解除器12は、エンコードされた入力信号から差分ダイナミックレンジ圧縮(DRC: dynamic range compression)パラメータ値を得て、該差分パラメータ値を、通常のDRCパラメータ値と一緒に経路13に沿ってダイナミックレンジ・コントロール16に渡す。ダイナミックレンジ・コントロール16は、通常のDRCパラメータ値を対応する差分DRCパラメータ値と算術的に組み合わせることによって、必要とする前記一つまたは複数のDRCパラメータ値を計算する。この状況では利得制限器20は使われる必要はない。
第三の技法は、装置10が、ダイナミックレンジ・コントロール16において新しいダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を適用することを許容する。フォーマット解除器12は、エンコードされた入力信号から新しいプロファイルについての一つまたは複数のDRCパラメータ値を得て、それらのパラメータ値を経路13に沿ってダイナミックレンジ・コントロール16に渡す。この状況では利得制限器20は使われる必要はない。
1.差分圧縮値
上で論じた第二の技法についてのプロセスは、エンコードされた入力信号から抽出される差分DRCパラメータ値を使うことによって、装置10において実装される。これらの差分パラメータ値は、エンコードされた信号を生成した装置30によって与えられる。
上記で論じた第三の技法についてのプロセスは、装置10によって、エンコードされた入力信号から抽出される新しいダイナミックレンジ圧縮プロファイルについてのDRCパラメータ値を使って実装される。これらのパラメータ値は、エンコードされた信号を生成した装置30によって与えられる。
本発明のさまざまな側面を組み込む装置は、コンピュータ、または、より特化したコンポーネントを含む、汎用コンピュータに見出されるのと同様のコンポーネントに結合されたデジタル信号プロセッサ(DSP)回路のような他の何らかの装置による実行のためのソフトウェアを含む多様な仕方で実装されうる。図6は、本発明の諸側面を実装するために使用されうる装置70の概略的なブロック図である。プロセッサ72はコンピューティング資源を提供する。RAM 73は処理のためにプロセッサ72によって使用されるシステム・ランダム・アクセス・メモリ(RAM)である。ROM 74は、装置70を動作させるためにおよび可能性としては本発明のさまざまな側面を実行するために必要とされるプログラムを記憶する、読み出し専用メモリ(ROM)のような何らかの形の持続性記憶を表す。I/Oコントロール75は、通信チャネル76、77によって入力信号を受領し、出力信号を送出するためのインターフェース回路を表す。図示した実施形態では、すべての主要なシステム・コンポーネントはバス71に接続される。バス71は二つ以上の物理的または論理的なバスを表していてもよい。しかしながら、バス・アーキテクチャは本発明を実装するために必須ではない。
〔態様1〕
エンコードされた入力信号をデコードしてオーディオ出力信号を生成する方法であって:
エンコードされたオーディオ情報および関連するメタデータを含むエンコードされた入力信号を受領する段階であって、前記メタデータは、一つまたは複数のデコード制御パラメータおよび第一のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第一のパラメータを含み、任意的に第二のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第二のパラメータを含み、前記一つまたは複数の第一のパラメータは、第一の基準再生レベルでの再生についてクリッピング・レベルを超えない振幅をもつ聴覚的刺激を表すよう前記エンコードされたオーディオ情報を生成したエンコード・プロセスに従って設定された値をもち、前記一つまたは複数の第二のパラメータは、前記第一の基準再生レベルより高い第二の基準再生レベルでの再生について前記クリッピング・レベルを超えない振幅をもつ前記聴覚的刺激を表すよう前記エンコードされたオーディオ情報を生成した前記エンコード・プロセスに従って設定された値をもつ、段階と;
前記エンコードされたオーディオ情報にデコード・プロセスを適用して、前記聴覚的刺激のスペクトル内容を表すサブバンド信号を得る段階であって、前記デコード・プロセスは、前記一つまたは複数のデコード制御パラメータに応答して適応される、段階と;
前記サブバンド信号を修正して、変化したダイナミックレンジ特性をもつ修正されたサブバンド信号を得る段階であって、前記修正は、前記メタデータが前記一つまたは複数の第二のパラメータを含む場合には前記一つまたは複数の第二のパラメータに応答して適応され、前記メタデータが前記一つまたは複数の第二のパラメータを含まない場合には前記一つまたは複数の第一のパラメータに応答して適応される、段階と;
前記修正されたサブバンド信号に合成フィルタバンクを適用して時間領域オーディオ信号を得る段階と;
前記メタデータが前記一つまたは複数の第二のパラメータを含まない場合、前記メタデータに応答して前記時間領域オーディオ信号に利得および制限器を適用し、前記利得の適用は前記時間領域オーディオ信号を、前記第二の基準再生レベルでの再生のための振幅をもつ前記オーディオ出力信号を得るよう修正し、前記制限器の適用は前記オーディオ出力信号の前記振幅が前記クリッピング・レベルを超えることを防止する、段階とを含む、
方法。
〔態様2〕
前記一つまたは複数の第二のパラメータが、前記第一のダイナミックレンジ圧縮プロファイルと前記第二のダイナミックレンジ圧縮プロファイルについての対応するパラメータ間の差分を表す、態様1記載の方法。
〔態様3〕
前記エンコードされた入力信号がATSC規格、MPEG-2 AAC規格またはMPEG-4オーディオ規格に準拠し、前記第一の基準再生レベルは前記クリッピング・レベルより20dB低い振幅に対応し、前記第二の基準再生レベルは前記クリッピング・レベルより11dB低い振幅に対応する、態様1または2記載の方法。
〔態様4〕
聴覚的刺激を表すオーディオ入力信号をエンコードする方法であって:
前記オーディオ入力信号を受領する段階と;
前記オーディオ入力信号に分解フィルタバンクを適用して前記オーディオ入力信号のスペクトル内容を表すサブバンド信号を生成する段階と;
前記オーディオ入力信号から導出された一つまたは複数の信号を解析してメタデータを計算する段階であって、前記メタデータは、第一のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第一のパラメータおよび第二のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第二のパラメータを含み、前記一つまたは複数の第一のパラメータは、第一の基準再生レベルでの再生についてクリッピング・レベルを超えない振幅をもつ前記聴覚的刺激を表すよう設定された値をもち、前記一つまたは複数の第二のパラメータは、第二の基準再生レベルでの再生について前記クリッピング・レベルを超えない振幅をもつ前記聴覚的刺激を表すよう設定された値をもつ、段階と;
前記サブバンド信号にエンコード・プロセスを適用して、エンコードされたオーディオ情報を得る段階と;
前記エンコードされたオーディオ情報および前記メタデータを集めて、伝送または記憶に好適なフォーマットを有するエンコードされた出力信号にする段階とを含み、
前記一つまたは複数の第二のパラメータが、前記第一のダイナミックレンジ圧縮プロファイルと前記第二のダイナミックレンジ圧縮プロファイルについての対応するパラメータ間の差分を表す、
方法。
〔態様5〕
前記エンコードされた出力信号がATSC規格、MPEG-2 AAC規格またはMPEG-4オーディオ規格に準拠し、前記第一の基準再生レベルは前記クリッピング・レベルより20dB低い振幅に対応し、前記第二の基準再生レベルは前記クリッピング・レベルより11dB低い振幅に対応する、態様4記載の方法。
〔態様6〕
エンコードされた入力信号をトランスコードしてエンコードされた出力信号を生成する方法であって:
第一のエンコードされたオーディオ情報および関連するメタデータを含むエンコードされた入力信号を受領する段階であって、前記メタデータは、一つまたは複数のデコード制御パラメータおよび第一のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第一のパラメータを含み、前記一つまたは複数の第一のパラメータは、第一の基準再生レベルでの再生についてクリッピング・レベルを超えない振幅をもつ聴覚的刺激を表すよう前記第一のエンコードされたオーディオ情報を生成した第一のエンコード・プロセスに従って設定された値をもつ、段階と;
前記第一のエンコードされたオーディオ情報にデコード・プロセスを適用して、前記聴覚的刺激のスペクトル内容を表すサブバンド信号を得る段階であって、前記デコード・プロセスは、前記一つまたは複数のデコード制御パラメータに応答して適応される、段階と;
前記サブバンド信号から得られる一つまたは複数の信号を解析して、第二のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第二のパラメータを計算する段階であって、前記一つまたは複数の第二のパラメータは、第二の基準再生レベルでの再生について前記クリッピング・レベルを超えない振幅をもつ前記聴覚的刺激を表すよう設定された値をもつ、段階と;
第二のエンコードされたオーディオ情報、前記一つまたは複数の第一のパラメータおよび前記一つまたは複数の第二のパラメータを集めて、伝送または記憶に好適なフォーマットを有するエンコードされた出力信号にする段階とを含み、
前記第二のエンコードされたオーディオ情報は前記サブバンド信号のエンコードされた表現である、
方法。
〔態様7〕
前記一つまたは複数の第二のパラメータが、前記第一のダイナミックレンジ圧縮プロファイルと前記第二のダイナミックレンジ圧縮プロファイルについての対応するパラメータ間の差分を表す、態様6記載の方法。
〔態様8〕
前記サブバンド信号に合成フィルタバンクを適用して、ダイナミックレンジ圧縮を指定する前記一つまたは複数の第二のパラメータを計算するために解析される前記一つまたは複数の信号を得る段階を含む、態様6または7記載の方法。
〔態様9〕
前記サブバンド信号に第二のエンコード・プロセスを適用して前記第二のエンコードされたオーディオ情報を生成する段階を含む、態様6ないし8のうちいずれか一項記載の方法。
〔態様10〕
前記第二のエンコードされたオーディオ情報が前記第一のエンコードされたオーディオ情報である、態様6ないし8のうちいずれか一項記載の方法。
〔態様11〕
前記エンコードされた入力信号がATSC規格、MPEG-2 AAC規格またはMPEG-4オーディオ規格に準拠し、前記第一の基準再生レベルは前記クリッピング・レベルより20dB低い振幅に対応する、態様6ないし10のうちいずれか一項記載の方法。
〔態様12〕
前記エンコードされた出力信号がATSC規格、MPEG-2 AAC規格またはMPEG-4オーディオ規格に準拠し、前記第二の基準再生レベルは前記クリッピング・レベルより11dB低い振幅に対応する、態様6ないし10のうちいずれか一項記載の方法。
〔態様13〕
エンコードされた入力信号をデコードしてオーディオ出力信号を生成する装置であって:
エンコードされたオーディオ情報および関連するメタデータを含むエンコードされた入力信号を受領する手段であって、前記メタデータは、一つまたは複数のデコード制御パラメータおよび第一のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第一のパラメータを含み、任意的に第二のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第二のパラメータを含み、前記一つまたは複数の第一のパラメータは、第一の基準再生レベルでの再生についてクリッピング・レベルを超えない振幅をもつ聴覚的刺激を表すよう前記エンコードされたオーディオ情報を生成したエンコード・プロセスに従って設定された値をもち、前記一つまたは複数の第二のパラメータは、前記第一の基準再生レベルより高い第二の基準再生レベルでの再生について前記クリッピング・レベルを超えない振幅をもつ前記聴覚的刺激を表すよう前記エンコードされたオーディオ情報を生成した前記エンコード・プロセスに従って設定された値をもつ、手段と;
前記エンコードされたオーディオ情報にデコード・プロセスを適用して、前記聴覚的刺激のスペクトル内容を表すサブバンド信号を得る手段であって、前記デコード・プロセスは、前記一つまたは複数のデコード制御パラメータに応答して適応される、手段と;
前記サブバンド信号を修正して、変化したダイナミックレンジ特性をもつ修正されたサブバンド信号を得る手段であって、前記修正は、前記メタデータが前記一つまたは複数の第二のパラメータを含む場合には前記一つまたは複数の第二のパラメータに応答して適応され、前記メタデータが前記一つまたは複数の第二のパラメータを含まない場合には前記一つまたは複数の第一のパラメータに応答して適応される、手段と;
前記修正されたサブバンド信号に合成フィルタバンクを適用して時間領域オーディオ信号を得る手段と;
前記メタデータが前記一つまたは複数の第二のパラメータを含まない場合、前記メタデータに応答して前記時間領域オーディオ信号に利得および制限器を適用し、前記利得の適用は前記時間領域オーディオ信号を、前記第二の基準再生レベルでの再生のための振幅をもつ前記オーディオ出力信号を得るよう修正し、前記制限器の適用は前記オーディオ出力信号の前記振幅が前記クリッピング・レベルを超えることを防止する、手段とを含む、
装置。
〔態様14〕
聴覚的刺激を表すオーディオ入力信号をエンコードする装置であって:
前記オーディオ入力信号を受領する手段と;
前記オーディオ入力信号に分解フィルタバンクを適用して前記オーディオ入力信号のスペクトル内容を表すサブバンド信号を生成する手段と;
前記オーディオ入力信号から導出された一つまたは複数の信号を解析してメタデータを計算する手段であって、前記メタデータは、第一のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第一のパラメータおよび第二のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第二のパラメータを含み、前記一つまたは複数の第一のパラメータは、第一の基準再生レベルでの再生についてクリッピング・レベルを超えない振幅をもつ前記聴覚的刺激を表すよう設定された値をもち、前記一つまたは複数の第二のパラメータは、第二の基準再生レベルでの再生について前記クリッピング・レベルを超えない振幅をもつ前記聴覚的刺激を表すよう設定された値をもつ、手段と;
前記サブバンド信号にエンコード・プロセスを適用して、エンコードされたオーディオ情報を得る手段と;
前記エンコードされたオーディオ情報および前記メタデータを集めて、伝送または記憶に好適なフォーマットを有するエンコードされた出力信号にする手段とを含み、
前記一つまたは複数の第二のパラメータが、前記第一のダイナミックレンジ圧縮プロファイルと前記第二のダイナミックレンジ圧縮プロファイルについての対応するパラメータ間の差分を表す、
装置。
〔態様15〕
エンコードされた入力信号をトランスコードしてエンコードされた出力信号を生成する装置であって:
第一のエンコードされたオーディオ情報および関連するメタデータを含むエンコードされた入力信号を受領する手段であって、前記メタデータは、一つまたは複数のデコード制御パラメータおよび第一のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第一のパラメータを含み、前記一つまたは複数の第一のパラメータは、第一の基準再生レベルでの再生についてクリッピング・レベルを超えない振幅をもつ聴覚的刺激を表すよう前記第一のエンコードされたオーディオ情報を生成した第一のエンコード・プロセスに従って設定された値をもつ、手段と;
前記第一のエンコードされたオーディオ情報にデコード・プロセスを適用して、前記聴覚的刺激のスペクトル内容を表すサブバンド信号を得る手段であって、前記デコード・プロセスは、前記一つまたは複数のデコード制御パラメータに応答して適応される、手段と;
前記サブバンド信号から得られる一つまたは複数の信号を解析して、第二のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第二のパラメータを計算する手段であって、前記一つまたは複数の第二のパラメータは、第二の基準再生レベルでの再生について前記クリッピング・レベルを超えない振幅をもつ前記聴覚的刺激を表すよう設定された値をもつ、手段と;
第二のエンコードされたオーディオ情報、前記一つまたは複数の第一のパラメータおよび前記一つまたは複数の第二のパラメータを集めて、伝送または記憶に好適なフォーマットを有するエンコードされた出力信号にする手段とを含み、
前記第二のエンコードされたオーディオ情報は前記サブバンド信号のエンコードされた表現である、
装置。
〔態様16〕
エンコードされた入力信号をデコードしてオーディオ出力信号を生成する方法の下記の段階、すなわち:
エンコードされたオーディオ情報および関連するメタデータを含むエンコードされた入力信号を受領する段階であって、前記メタデータは、一つまたは複数のデコード制御パラメータおよび第一のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第一のパラメータを含み、任意的に第二のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第二のパラメータを含み、前記一つまたは複数の第一のパラメータは、第一の基準再生レベルでの再生についてクリッピング・レベルを超えない振幅をもつ聴覚的刺激を表すよう前記エンコードされたオーディオ情報を生成したエンコード・プロセスに従って設定された値をもち、前記一つまたは複数の第二のパラメータは、前記第一の基準再生レベルより高い第二の基準再生レベルでの再生について前記クリッピング・レベルを超えない振幅をもつ前記聴覚的刺激を表すよう前記エンコードされたオーディオ情報を生成した前記エンコード・プロセスに従って設定された値をもつ、段階と;
前記エンコードされたオーディオ情報にデコード・プロセスを適用して、前記聴覚的刺激のスペクトル内容を表すサブバンド信号を得る段階であって、前記デコード・プロセスは、前記一つまたは複数のデコード制御パラメータに応答して適応される、段階と;
前記サブバンド信号を修正して、変化したダイナミックレンジ特性をもつ修正されたサブバンド信号を得る段階であって、前記修正は、前記メタデータが前記一つまたは複数の第二のパラメータを含む場合には前記一つまたは複数の第二のパラメータに応答して適応され、前記メタデータが前記一つまたは複数の第二のパラメータを含まない場合には前記一つまたは複数の第一のパラメータに応答して適応される、段階と;
前記修正されたサブバンド信号に合成フィルタバンクを適用して時間領域オーディオ信号を得る段階と;
前記メタデータが前記一つまたは複数の第二のパラメータを含まない場合、前記メタデータに応答して前記時間領域オーディオ信号に利得および制限器を適用し、前記利得の適用は前記時間領域オーディオ信号を、前記第二の基準再生レベルでの再生のための振幅をもつ前記オーディオ出力信号を得るよう修正し、前記制限器の適用は前記オーディオ出力信号の前記振幅が前記クリッピング・レベルを超えることを防止する、段階とを実行するよう、装置によって実行されることのできる命令のプログラムを記録した記憶媒体。
〔態様17〕
聴覚的刺激を表すオーディオ入力信号をエンコードする方法の下記の段階、すなわち:
前記オーディオ入力信号を受領する段階と;
前記オーディオ入力信号に分解フィルタバンクを適用して前記オーディオ入力信号のスペクトル内容を表すサブバンド信号を生成する段階と;
前記オーディオ入力信号から導出された一つまたは複数の信号を解析してメタデータを計算する段階であって、前記メタデータは、第一のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第一のパラメータおよび第二のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第二のパラメータを含み、前記一つまたは複数の第一のパラメータは、第一の基準再生レベルでの再生についてクリッピング・レベルを超えない振幅をもつ前記聴覚的刺激を表すよう設定された値をもち、前記一つまたは複数の第二のパラメータは、第二の基準再生レベルでの再生について前記クリッピング・レベルを超えない振幅をもつ前記聴覚的刺激を表すよう設定された値をもつ、段階と;
前記サブバンド信号にエンコード・プロセスを適用して、エンコードされたオーディオ情報を得る段階と;
前記エンコードされたオーディオ情報および前記メタデータを集めて、伝送または記憶に好適なフォーマットを有するエンコードされた出力信号にする段階とを実行するよう、装置によって実行されることのできる命令のプログラムを記録した記憶媒体であって、
前記一つまたは複数の第二のパラメータが、前記第一のダイナミックレンジ圧縮プロファイルと前記第二のダイナミックレンジ圧縮プロファイルについての対応するパラメータ間の差分を表す、
記憶媒体。
〔態様18〕
エンコードされた入力信号をトランスコードしてエンコードされた出力信号を生成する方法の下記の段階、すなわち:
第一のエンコードされたオーディオ情報および関連するメタデータを含むエンコードされた入力信号を受領する段階であって、前記メタデータは、一つまたは複数のデコード制御パラメータおよび第一のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第一のパラメータを含み、前記一つまたは複数の第一のパラメータは、第一の基準再生レベルでの再生についてクリッピング・レベルを超えない振幅をもつ聴覚的刺激を表すよう前記第一のエンコードされたオーディオ情報を生成した第一のエンコード・プロセスに従って設定された値をもつ、段階と;
前記第一のエンコードされたオーディオ情報にデコード・プロセスを適用して、前記聴覚的刺激のスペクトル内容を表すサブバンド信号を得る段階であって、前記デコード・プロセスは、前記一つまたは複数のデコード制御パラメータに応答して適応される、段階と;
前記サブバンド信号から得られる一つまたは複数の信号を解析して、第二のダイナミックレンジ圧縮プロファイルに従ってダイナミックレンジ圧縮を指定する一つまたは複数の第二のパラメータを計算する段階であって、前記一つまたは複数の第二のパラメータは、第二の基準再生レベルでの再生について前記クリッピング・レベルを超えない振幅をもつ前記聴覚的刺激を表すよう設定された値をもつ、段階と;
第二のエンコードされたオーディオ情報、前記一つまたは複数の第一のパラメータおよび前記一つまたは複数の第二のパラメータを集めて、伝送または記憶に好適なフォーマットを有するエンコードされた出力信号にする段階とを実行するよう、装置によって実行されることのできる命令のプログラムを記録した記憶媒体であって、
前記第二のエンコードされたオーディオ情報は前記サブバンド信号のエンコードされた表現である、
記憶媒体。
Claims (6)
- エンコードされた入力信号をデコードしてオーディオ出力信号を生成する方法であって:
エンコードされたオーディオ情報および関連するメタデータを含むエンコードされた入力信号を受領する段階であって、前記メタデータは、一つまたは複数のデコード制御パラメータと、第一の再生レベルを使う第一のデコード・モードによって使うのに好適なダイナミックレンジ圧縮を指定する一つまたは複数の第一のパラメータと、第二の基準再生レベルを使う第二のデコード・モードによって使うのに好適なダイナミックレンジ圧縮を指定する一つまたは複数の第二のパラメータとを含む、段階と;
前記エンコードされたオーディオ情報にデコード・プロセスを適用してサブバンド信号を得る段階であって、前記デコード・プロセスは、前記一つまたは複数のデコード制御パラメータに応答して適応される、段階と;
前記サブバンド信号を修正して、変化したダイナミックレンジ特性をもつ修正されたサブバンド信号を得る段階であって、前記修正は、前記一つまたは複数の第二のパラメータに応答して適応される、段階と;
前記修正されたサブバンド信号に合成フィルタバンクを適用して時間領域オーディオ信号を得る段階と;
前記時間領域オーディオ信号に利得および制限器を適用する段階であって、前記利得の適用は前記オーディオ出力信号の有効基準再生レベルを上昇させ、前記制限器の適用は前記オーディオ出力信号の振幅がクリッピング・レベルを超えることを防止する、段階とを含む、
方法。 - 前記第一の基準再生レベルは前記クリッピング・レベルより31dB低い振幅に対応し、前記第二の基準再生レベルは前記クリッピング・レベルより20dB低い振幅に対応し、前記有効基準再生レベルはクリッピング・レベルより14dBないし8dB低い振幅に対応する、請求項1記載の方法。
- 前記有効基準再生レベルはクリッピング・レベルより11dB低い振幅に対応する、請求項2記載の方法。
- エンコードされた入力信号をデコードしてオーディオ出力信号を生成する装置であって:
エンコードされたオーディオ情報および関連するメタデータを含むエンコードされた入力信号を受領する手段であって、前記メタデータは、一つまたは複数のデコード制御パラメータと、第一の再生レベルを使う第一のデコード・モードによって使うのに好適なダイナミックレンジ圧縮を指定する一つまたは複数の第一のパラメータと、第二の基準再生レベルを使う第二のデコード・モードによって使うのに好適なダイナミックレンジ圧縮を指定する一つまたは複数の第二のパラメータとを含む、手段と;
前記エンコードされたオーディオ情報にデコード・プロセスを適用してサブバンド信号を得る手段であって、前記デコード・プロセスは、前記一つまたは複数のデコード制御パラメータに応答して適応される、手段と;
前記サブバンド信号を修正して、変化したダイナミックレンジ特性をもつ修正されたサブバンド信号を得る手段であって、前記修正は、前記一つまたは複数の第二のパラメータに応答して適応される、手段と;
前記修正されたサブバンド信号に合成フィルタバンクを適用して時間領域オーディオ信号を得る手段と;
前記時間領域オーディオ信号に利得および制限器を適用する手段であって、前記利得の適用は前記オーディオ出力信号の有効基準再生レベルを上昇させ、前記制限器の適用は前記オーディオ出力信号の振幅がクリッピング・レベルを超えることを防止する、手段とを有する、
装置。 - 前記第一の基準再生レベルは前記クリッピング・レベルより31dB低い振幅に対応し、前記第二の基準再生レベルは前記クリッピング・レベルより20dB低い振幅に対応し、前記有効基準再生レベルはクリッピング・レベルより14dBないし8dB低い振幅に対応する、請求項4記載の装置。
- 前記有効基準再生レベルはクリッピング・レベルより11dB低い振幅に対応する、請求項5記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US30364310P | 2010-02-11 | 2010-02-11 | |
US61/303,643 | 2010-02-11 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012552907A Division JP5666625B2 (ja) | 2010-02-11 | 2011-02-03 | 携帯機器内でオーディオ信号のラウドネスを非破壊的に正規化するシステムおよび方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015045886A true JP2015045886A (ja) | 2015-03-12 |
JP6133263B2 JP6133263B2 (ja) | 2017-05-24 |
Family
ID=43881135
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012552907A Active JP5666625B2 (ja) | 2010-02-11 | 2011-02-03 | 携帯機器内でオーディオ信号のラウドネスを非破壊的に正規化するシステムおよび方法 |
JP2014249460A Active JP6133263B2 (ja) | 2010-02-11 | 2014-12-10 | 携帯機器内でオーディオ信号のラウドネスを非破壊的に正規化するシステムおよび方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012552907A Active JP5666625B2 (ja) | 2010-02-11 | 2011-02-03 | 携帯機器内でオーディオ信号のラウドネスを非破壊的に正規化するシステムおよび方法 |
Country Status (18)
Country | Link |
---|---|
US (7) | US8903729B2 (ja) |
EP (3) | EP3444816B8 (ja) |
JP (2) | JP5666625B2 (ja) |
KR (1) | KR101381588B1 (ja) |
CN (2) | CN103795364B (ja) |
AR (1) | AR080156A1 (ja) |
BR (2) | BR122019025627B1 (ja) |
CA (6) | CA2787466C (ja) |
CL (1) | CL2012002213A1 (ja) |
CO (1) | CO6511277A2 (ja) |
EA (1) | EA023730B9 (ja) |
ES (1) | ES2916403T3 (ja) |
MX (1) | MX2012008954A (ja) |
MY (1) | MY169981A (ja) |
SG (1) | SG182632A1 (ja) |
TW (2) | TWI447709B (ja) |
UA (1) | UA105277C2 (ja) |
WO (1) | WO2011100155A1 (ja) |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10848118B2 (en) | 2004-08-10 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10158337B2 (en) | 2004-08-10 | 2018-12-18 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US11431312B2 (en) | 2004-08-10 | 2022-08-30 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10701505B2 (en) | 2006-02-07 | 2020-06-30 | Bongiovi Acoustics Llc. | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
US10848867B2 (en) | 2006-02-07 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
TWI501580B (zh) | 2009-08-07 | 2015-09-21 | Dolby Int Ab | 資料串流的鑑別 |
TWI413110B (zh) | 2009-10-06 | 2013-10-21 | Dolby Int Ab | 以選擇性通道解碼的有效多通道信號處理 |
CN102754159B (zh) | 2009-10-19 | 2016-08-24 | 杜比国际公司 | 指示音频对象的部分的元数据时间标记信息 |
TWI447709B (zh) * | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
TWI525987B (zh) | 2010-03-10 | 2016-03-11 | 杜比實驗室特許公司 | 在單一播放模式中組合響度量測的系統 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
US9171549B2 (en) * | 2011-04-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams |
JP6174129B2 (ja) * | 2012-05-18 | 2017-08-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
US9378748B2 (en) * | 2012-11-07 | 2016-06-28 | Dolby Laboratories Licensing Corp. | Reduced complexity converter SNR calculation |
US9411881B2 (en) | 2012-11-13 | 2016-08-09 | Dolby International Ab | System and method for high dynamic range audio distribution |
RU2631139C2 (ru) * | 2013-01-21 | 2017-09-19 | Долби Лэборетериз Лайсенсинг Корпорейшн | Оптимизация громкости и динамического диапазона через различные устройства воспроизведения |
AU2014207590B2 (en) | 2013-01-21 | 2015-08-13 | Dolby Laboratories Licensing Corporation | Audio encoder and decoder with program loudness and boundary metadata |
CN203134365U (zh) * | 2013-01-21 | 2013-08-14 | 杜比实验室特许公司 | 用于利用响度处理状态元数据处理音频的音频解码器 |
RU2639663C2 (ru) * | 2013-01-28 | 2017-12-21 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах |
CN110379434B (zh) * | 2013-02-21 | 2023-07-04 | 杜比国际公司 | 用于参数化多声道编码的方法 |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
US9883318B2 (en) | 2013-06-12 | 2018-01-30 | Bongiovi Acoustics Llc | System and method for stereo field enhancement in two-channel audio systems |
TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
CN117767898A (zh) * | 2013-09-12 | 2024-03-26 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
JP6506764B2 (ja) * | 2013-09-12 | 2019-04-24 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
CN105531762B (zh) * | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
US20150095320A1 (en) * | 2013-09-27 | 2015-04-02 | Trooclick France | Apparatus, systems and methods for scoring the reliability of online information |
PL3522157T3 (pl) | 2013-10-22 | 2022-02-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koncepcja połączonej kompresji zakresu dynamiki i sterowanego zapobiegania obcinaniu dla urządzeń audio |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US20150146099A1 (en) * | 2013-11-25 | 2015-05-28 | Anthony Bongiovi | In-line signal processor |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
KR102513009B1 (ko) | 2013-12-27 | 2023-03-22 | 소니그룹주식회사 | 복호화 장치 및 방법, 및 프로그램 |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
EP3111670B1 (en) * | 2014-02-27 | 2023-11-22 | Sonarworks SIA | Method of and apparatus for determining an equalization filter |
US10063207B2 (en) * | 2014-02-27 | 2018-08-28 | Dts, Inc. | Object-based audio loudness management |
RU2658888C2 (ru) * | 2014-03-24 | 2018-06-25 | Долби Интернэшнл Аб | Способ и устройство для применения сжатия динамического диапазона к сигналу амбиофонии высшего порядка |
TR201809427T4 (tr) | 2014-03-25 | 2018-07-23 | Fraunhofer Ges Forschung | Di̇nami̇k aralik kontrolünde etki̇n edi̇ni̇m koduna sahi̇p olan ses kodlama ci̇hazi ve bi̇r ses dekoderi̇ |
US10820883B2 (en) | 2014-04-16 | 2020-11-03 | Bongiovi Acoustics Llc | Noise reduction assembly for auscultation of a body |
CN106663434B (zh) * | 2014-06-27 | 2021-09-28 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
EP3148200B1 (en) * | 2014-06-30 | 2020-06-17 | Sony Corporation | Information processing device and method selecting content files based on encoding parallelism type |
EP2963948A1 (en) * | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation |
EP4044180A1 (en) | 2014-10-01 | 2022-08-17 | Dolby International AB | Decoding an encoded audio signal using drc profiles |
CN107112023B (zh) | 2014-10-10 | 2020-10-30 | 杜比实验室特许公司 | 基于发送无关的表示的节目响度 |
TWI758146B (zh) | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US9590580B1 (en) | 2015-09-13 | 2017-03-07 | Guoguang Electric Company Limited | Loudness-based audio-signal compensation |
TWI594231B (zh) * | 2016-12-23 | 2017-08-01 | 瑞軒科技股份有限公司 | 分頻壓縮電路,音訊處理方法以及音訊處理系統 |
US11089349B2 (en) * | 2017-01-20 | 2021-08-10 | Hanwha Techwin Co., Ltd. | Apparatus and method for playing back and seeking media in web browser |
EP3574583B1 (en) * | 2017-03-31 | 2020-12-09 | Dolby International AB | Inversion of dynamic range control |
CN110033781B (zh) * | 2018-01-10 | 2021-06-01 | 盛微先进科技股份有限公司 | 音频处理方法、装置及非暂时性电脑可读媒体 |
CA3168579A1 (en) | 2018-04-09 | 2019-10-17 | Dolby International Ab | Methods, apparatus and systems for three degrees of freedom (3dof+) extension of mpeg-h 3d audio |
WO2019200119A1 (en) | 2018-04-11 | 2019-10-17 | Bongiovi Acoustics Llc | Audio enhanced hearing protection system |
WO2020028833A1 (en) | 2018-08-02 | 2020-02-06 | Bongiovi Acoustics Llc | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
EP3809709A1 (en) * | 2019-10-14 | 2021-04-21 | Koninklijke Philips N.V. | Apparatus and method for audio encoding |
CN112732069A (zh) * | 2021-02-20 | 2021-04-30 | 上海创感传感技术有限公司 | 一种电子设备状态修改方法和装置 |
CN112992159B (zh) * | 2021-05-17 | 2021-08-06 | 北京百瑞互联技术有限公司 | 一种lc3音频编解码方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007109328A (ja) * | 2005-10-14 | 2007-04-26 | Kenwood Corp | 再生装置 |
JP2008505586A (ja) * | 2004-07-01 | 2008-02-21 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | オーディオ情報の再生音量とダイナミックレンジに影響を与えるメタデータを修正する方法 |
Family Cites Families (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2373975B (en) | 2001-03-30 | 2005-04-13 | Sony Uk Ltd | Digital audio signal processing |
US7328151B2 (en) * | 2002-03-22 | 2008-02-05 | Sound Id | Audio decoder with dynamic adjustment of signal modification |
US7072477B1 (en) | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US7398207B2 (en) * | 2003-08-25 | 2008-07-08 | Time Warner Interactive Video Group, Inc. | Methods and systems for determining audio loudness levels in programming |
US7729673B2 (en) | 2004-12-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Method and apparatus for multichannel signal limiting |
US20080025530A1 (en) | 2006-07-26 | 2008-01-31 | Sony Ericsson Mobile Communications Ab | Method and apparatus for normalizing sound playback loudness |
EP2063418A4 (en) * | 2006-09-15 | 2010-12-15 | Panasonic Corp | AUDIO CODING DEVICE AND AUDIO CODING METHOD |
DE102006048685A1 (de) * | 2006-10-14 | 2008-04-17 | Mtu Aero Engines Gmbh | Turbinenschaufel einer Gasturbine |
US20090253457A1 (en) | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
US8645129B2 (en) * | 2008-05-12 | 2014-02-04 | Broadcom Corporation | Integrated speech intelligibility enhancement system and acoustic echo canceller |
US9197181B2 (en) * | 2008-05-12 | 2015-11-24 | Broadcom Corporation | Loudness enhancement system and method |
US8315396B2 (en) | 2008-07-17 | 2012-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
TWI416868B (zh) * | 2008-07-29 | 2013-11-21 | Lg Electronics Inc | 音頻訊號之處理方法及其裝置 |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
JP2010135906A (ja) | 2008-12-02 | 2010-06-17 | Sony Corp | クリップ防止装置及びクリップ防止方法 |
TWI447709B (zh) * | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
PL2381574T3 (pl) | 2010-04-22 | 2015-05-29 | Fraunhofer Ges Forschung | Urządzenie i sposób do modyfikacji wejściowego sygnału audio |
JP5903758B2 (ja) | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8989884B2 (en) | 2011-01-11 | 2015-03-24 | Apple Inc. | Automatic audio configuration based on an audio output device |
JP2012235310A (ja) | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8965774B2 (en) | 2011-08-23 | 2015-02-24 | Apple Inc. | Automatic detection of audio compression parameters |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
JP2013102411A (ja) | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
BR112014015629B1 (pt) | 2011-12-15 | 2022-03-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Aparelho e método para evitar perturbações de clipagem. |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
RU2639663C2 (ru) | 2013-01-28 | 2017-12-21 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
JP2015050685A (ja) | 2013-09-03 | 2015-03-16 | ソニー株式会社 | オーディオ信号処理装置および方法、並びにプログラム |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
PL3522157T3 (pl) | 2013-10-22 | 2022-02-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koncepcja połączonej kompresji zakresu dynamiki i sterowanego zapobiegania obcinaniu dla urządzeń audio |
US9240763B2 (en) | 2013-11-25 | 2016-01-19 | Apple Inc. | Loudness normalization based on user feedback |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
KR102513009B1 (ko) | 2013-12-27 | 2023-03-22 | 소니그룹주식회사 | 복호화 장치 및 방법, 및 프로그램 |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
TR201809427T4 (tr) | 2014-03-25 | 2018-07-23 | Fraunhofer Ges Forschung | Di̇nami̇k aralik kontrolünde etki̇n edi̇ni̇m koduna sahi̇p olan ses kodlama ci̇hazi ve bi̇r ses dekoderi̇ |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
RU2653858C1 (ru) | 2014-05-28 | 2018-05-15 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Процессор данных и транспорт данных пользовательского управления на устройства декодирования и воспроизведения аудио |
SG11201609855WA (en) | 2014-05-30 | 2016-12-29 | Sony Corp | Information processing apparatus and information processing method |
EP3163570A4 (en) | 2014-06-30 | 2018-02-14 | Sony Corporation | Information processor and information-processing method |
TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
US20160315722A1 (en) | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
BR112017025552B1 (pt) | 2015-05-29 | 2023-01-24 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V | Dispositivo e método para controle de volume e sintonizador de rádio |
MX2017016333A (es) | 2015-06-17 | 2018-04-24 | Fraunhofer Ges Forschung | Control de intensidad subjetiva para interaccion del usuario en sistemas de codificacion de audio. |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US9934790B2 (en) | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
-
2011
- 2011-02-01 TW TW100103980A patent/TWI447709B/zh active
- 2011-02-01 TW TW103122263A patent/TWI529703B/zh active
- 2011-02-03 BR BR122019025627-6A patent/BR122019025627B1/pt active IP Right Grant
- 2011-02-03 CA CA2787466A patent/CA2787466C/en active Active
- 2011-02-03 EP EP18191911.9A patent/EP3444816B8/en active Active
- 2011-02-03 UA UAA201210385A patent/UA105277C2/ru unknown
- 2011-02-03 CN CN201410039751.4A patent/CN103795364B/zh active Active
- 2011-02-03 ES ES18191911T patent/ES2916403T3/es active Active
- 2011-02-03 EP EP11706975.7A patent/EP2534656B1/en active Active
- 2011-02-03 MX MX2012008954A patent/MX2012008954A/es active IP Right Grant
- 2011-02-03 CA CA3201814A patent/CA3201814A1/en active Pending
- 2011-02-03 WO PCT/US2011/023531 patent/WO2011100155A1/en active Application Filing
- 2011-02-03 SG SG2012053765A patent/SG182632A1/en unknown
- 2011-02-03 KR KR1020127023274A patent/KR101381588B1/ko active IP Right Grant
- 2011-02-03 CA CA3075793A patent/CA3075793C/en active Active
- 2011-02-03 US US13/576,386 patent/US8903729B2/en active Active
- 2011-02-03 EP EP22160243.6A patent/EP4047602A1/en active Pending
- 2011-02-03 CA CA2995461A patent/CA2995461C/en active Active
- 2011-02-03 MY MYPI2012003595A patent/MY169981A/en unknown
- 2011-02-03 CA CA3114177A patent/CA3114177C/en active Active
- 2011-02-03 BR BR112012019880-7A patent/BR112012019880B1/pt active IP Right Grant
- 2011-02-03 EA EA201270712A patent/EA023730B9/ru not_active IP Right Cessation
- 2011-02-03 JP JP2012552907A patent/JP5666625B2/ja active Active
- 2011-02-03 CA CA2918302A patent/CA2918302C/en active Active
- 2011-02-03 CN CN201180009098.1A patent/CN102754151B/zh active Active
- 2011-02-10 AR ARP110100414A patent/AR080156A1/es active IP Right Grant
-
2012
- 2012-07-30 CO CO12127728A patent/CO6511277A2/es active IP Right Grant
- 2012-08-09 CL CL2012002213A patent/CL2012002213A1/es unknown
-
2014
- 2014-10-28 US US14/525,536 patent/US9646622B2/en active Active
- 2014-12-10 JP JP2014249460A patent/JP6133263B2/ja active Active
-
2017
- 2017-04-07 US US15/482,328 patent/US10418045B2/en active Active
-
2019
- 2019-07-05 US US16/504,076 patent/US10566006B2/en active Active
-
2020
- 2020-02-11 US US16/787,502 patent/US11341982B2/en active Active
-
2022
- 2022-05-23 US US17/750,803 patent/US11670315B2/en active Active
-
2023
- 2023-04-20 US US18/303,919 patent/US11948592B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008505586A (ja) * | 2004-07-01 | 2008-02-21 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | オーディオ情報の再生音量とダイナミックレンジに影響を与えるメタデータを修正する方法 |
JP2007109328A (ja) * | 2005-10-14 | 2007-04-26 | Kenwood Corp | 再生装置 |
Non-Patent Citations (1)
Title |
---|
伏木雅昭: "身近になったオーディオ符号化 映画,DVDにおける符号化−Dolby Digital−", 日本音響学会誌, vol. 第60巻 第1号, JPN6016001263, 25 December 2003 (2003-12-25), JP, pages 41 - 46, ISSN: 0003236783 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6133263B2 (ja) | 携帯機器内でオーディオ信号のラウドネスを非破壊的に正規化するシステムおよび方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160119 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20161004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170126 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20170203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170404 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170419 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6133263 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |