JP2012513729A - 周波数領域におけるオーディオ信号ラウドネス決定と修正 - Google Patents
周波数領域におけるオーディオ信号ラウドネス決定と修正 Download PDFInfo
- Publication number
- JP2012513729A JP2012513729A JP2011543637A JP2011543637A JP2012513729A JP 2012513729 A JP2012513729 A JP 2012513729A JP 2011543637 A JP2011543637 A JP 2011543637A JP 2011543637 A JP2011543637 A JP 2011543637A JP 2012513729 A JP2012513729 A JP 2012513729A
- Authority
- JP
- Japan
- Prior art keywords
- frequency domain
- loudness
- block size
- block
- domain data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012937 correction Methods 0.000 title claims abstract description 161
- 230000005236 sound signal Effects 0.000 title abstract description 38
- 238000000034 method Methods 0.000 claims abstract description 143
- 238000012545 processing Methods 0.000 claims abstract description 76
- 230000008569 process Effects 0.000 claims description 26
- 230000005284 excitation Effects 0.000 claims description 23
- 230000003111 delayed effect Effects 0.000 claims description 22
- 230000009466 transformation Effects 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000000295 complement effect Effects 0.000 claims description 8
- 230000002123 temporal effect Effects 0.000 abstract description 6
- 238000001228 spectrum Methods 0.000 description 60
- 238000010586 diagram Methods 0.000 description 15
- 230000015654 memory Effects 0.000 description 13
- 230000003595 spectral effect Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 230000001052 transient effect Effects 0.000 description 10
- 230000004044 response Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 210000002469 basement membrane Anatomy 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000009499 grossing Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000000844 transformation Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical group O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000008825 perceptual sensitivity Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 210000003027 ear inner Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- CNQCVBJFEGMYDW-UHFFFAOYSA-N lawrencium atom Chemical compound [Lr] CNQCVBJFEGMYDW-UHFFFAOYSA-N 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/025—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
Description
(関連出願との相互参照)
この出願は、2008年12月24日に出願した米国仮特許出願第61/140,791号の優先権を主張するものである。この文献はここにその全体を参照援用する。
本発明は、周波数解像度及びこれに対応する周波数領域情報の時間的カバレッジが一定でない周波数領域オーディオ信号の知覚されるラウドネスを決定及び修正する方法と、装置と、実行されると前記方法を実行させる命令を有するコンピュータ読み取り可能記憶媒体とに関する。これは、可変ブロックサイズを用いる知覚オーディオコーダに直接適用可能である。かかる可変ブロックサイズは過渡的オーディオ信号の音質に貢献する。
オーディオ信号の知覚されるラウドネスを客観的に決定する多くの方法がある。方法例としては、知覚的に感度が高い周波数を強くする所定フィルタと、知覚的に感度が低い周波数を弱くする所定フィルタ、及びISO532(タイトル「音響−ラウドネスレベルの計算方法」(1975年))(非特許文献1)に記載されたようなラウドネスの音響心理モデルの適用を含む、A重み付けラウドネスパワー尺度と、B重み付けラウドネスパワー尺度と、C重み付けラウドネスパワー尺度を含む。この音響心理モデルは、周波数マスキングと時間的マスキングなどの音響心理現象、及びラウドネス知覚の非線形性を信号強度の関数として考慮しつつ、信号を周波数帯域に分割して、これらの帯域を操作・統合することにより、耳の内部構造をモデル化しようとするものである。
ここで、ブロックサイズが変化し得る周波数領域オーディオ信号のラウドネスを決定・修正する方法、装置、及びソフトウェア(例えば、コンピュータ読み取り可能媒体に化体されたプロセッサ実行可能命令)を説明する。
ブロック結合器403は、ブロック結合を行い、最大のブロックサイズに対して必ずしも同じ短さのブロックサイズではない、複数の小さいブロックサイズスペクトルから、大きいブロックサイズスペクトルの大きいブロックサイズMDCTスペクトルを構成するように構成されている。
WO2004111994は、心理音響モデルに基づく、知覚されるラウドネスの客観的な測定を記載している。WO2004111994は、例えば短期DFTを用いて求めたログパワースペクトルの利用を記載しているが、MDCTスペクトルのセットによるパワー決定も知られている。時間サンプルx[n,t]の時間変化窓ブロックのSTDFTを考える。ここで、nはブロック内での時間インデックス、tは時間を参照するインデックスである。長さがTサンプルのブロックの場合、STDFTを用いてパワースペクトルの時間変化する推定の計算が一般的には用いられた。
ラウドネスパラメータ決定器406とラウドネス修正決定器407とラウドネス修正器413の組み合わせにより実行できる典型的なラウドネス修正を、ここで簡単に説明するが、詳細はWO2004111994とWO2006047600に記載されている。知覚ラウドネス領域で実行される上記の処理は、ラウドネスレベリング、ゲインコントロール、ノイズ補正、及び/またはダイナミックイコライゼーション、またはこれらの処理の組み合わせを含む。各々は、励起と個別ラウドネス値から、場合によっては、ノイズ補正の場合のノイズ励起などの寄り多くの情報から、一組の周波数帯域(例えば、周波数領域の信号に適用する周波数インデックスk)に適用できる一組の時間可変なゲインの決定を含む。図8は、一組のゲインを決定するゲインソルバで、個別ラウドネスが目標個別ラウドネスに近くなるように、オーディオ励起値と個別ラウドネス値を決定する、ラウドネス決定の組み合わせの一例を示す。かかる処理はレベリングと呼ばれ、市場ではドルビーボリュームとして知られている。これはドルビーラボラトリーズライセンシング社の商標である。MDCTデータから始まり、要素803により、パワースペクトルを決定し、要素805により、フィルタバンク603と音響フィルタバンク605のトランスミッションフィルタリングを結合する。励起決定器607は図6に示したものと同様である。図8はスムージング809を含む。個別ラウドネス決定器811は、オーディオ個別ラウドネス(オーディオSL)を決定する。修正機能813は、レベリングに用いる目標個別ラウドネス(Target SL)を決定する。ゲインソルバ815は、一組の時間可変なゲインを計算し、各周波数インデックスkに(または、ある実施形態では各臨界帯域bに)適用するように構成され、目標後別ラウドネスとオーディオ励起値を用いる。一般的に、ゲインソルバ815は反復法を用いてゲインを決定する。詳細は、WO2004111994とWO2006047600に記載され、MDCTデータを用いる場合はWO2007120452に記載されている。
ラウドネス修正補間器409は、例えば修正が一組のゲインとして計算される場合にはゲイン補間器であり、以下に詳しく説明する。知覚ラウドネス処理は、長いMDCTサイズを仮定するので、長いMDCTスペクトル値ごとに1つのゲインである一組のゲインを出力する。短いMDCTスペクトルへ適用する場合、この長いブロックスペクトルのゲインは長すぎ、短いMDCT値ごとに1つの値に減らす必要がある。
transform)することにより決定した周波数領域データを含む、オーディオデータの処理方法を実行させる。本方法は、ここに説明したように、複数のブロックサイズで周波数領域オーディオデータブロックを受け取ることを含む。本方法は、最も長いブロックサイズより短いブロックサイズの受け取ったデータブロックに対して、前記短いブロックサイズの複数の周波数領域データを結合して最も長いブロックサイズの周波数領域データブロックを形成する段階を含む。本方法は、最も長いブロックサイズの受け取ったブロックの知覚されるラウドネス処理を実行する段階も含む。前記知覚されるラウドネス処理の実行は知覚されるラウドネスパラメータの決定を含む。
Claims (72)
- 複数のブロックサイズでの変換により決まる周波数領域データを有するオーディオデータの知覚されるラウドネス処理の方法であって、
複数のブロックサイズで周波数領域オーディオデータのブロックを受け取る段階と、
最も長いブロックサイズより短いブロックサイズの受け取ったデータブロックに対して、前記短いブロックサイズの複数の周波数領域データを結合して最も長いブロックサイズの周波数領域データブロックを形成する段階と、
最も長いブロックサイズの受け取ったブロックの知覚されるラウドネス処理を実行する段階と、を有し、
前記知覚されるラウドネス処理の実行は知覚されるラウドネスパラメータの決定を含む、方法。 - 前記ラウドネス処理は、さらに、
前記決定した知覚されるラウドネスパラメータを用いて、少なくとも1つのラウドネス修正を決定して、受け取った周波数領域データのブロックに、またはそれを遅延したものに適用する段階を含み、
前記方法はさらに、
前記形成した最も長いブロックサイズで決定した少なくとも1つのラウドネス修正について、前記決定された少なくとも1つのラウドネス修正を形成するために用いる前記短いブロックサイズで前記受け取ったデータブロックに適用するため、前記決定した少なくとも1つのラウドネス修正を補間する段階と、
前記決定した少なくとも1つのラウドネス修正または少なくとも1つの補間したラウドネス修正を、前記受け取った周波数領域データブロックまたはそれを遅延させたものに適用する段階とを有する、
請求項1に記載の方法。 - 前記少なくとも1つのラウドネス修正または補間した修正を、前記周波数領域データブロックを遅延させたものに適用するように、前記周波数領域オーディオデータブロックを遅延させる段階をさらに有する、
請求項2に記載の方法。 - 前記少なくとも1つのラウドネス修正は、一組のゲインを含み、前記補間する段階において補間されたゲインを決定し、前記決定した少なくとも1つのラウドネス修正または補完したラウドネス修正を適用する段階は、前記一組のゲインまたは一組の補間したゲインを適用する段階を含む、
請求項2または3に記載の方法。 - 最も長いブロックサイズの周波数領域データを形成するために前記短いブロックサイズで前記複数の周波数領域データブロックを結合する段階は、前記短いブロックサイズで周波数領域データをインターリーブする段階を含む、
請求項1ないし4いずれか一項に記載の方法。 - 最も長いブロックサイズの周波数領域データを形成するために前記短いブロックサイズで前記複数の周波数領域データブロックを結合する段階は、前記短いブロックサイズで周波数領域データの値を反復して、前記最も長いブロックサイズ周波数領域データを生成する段階を含む、
請求項1ないし4いずれか一項に記載の方法。 - 最新の短いブロックサイズのブロックの短いブロックサイズの周波数領域データを用いて、前記最も長いブロックサイズの周波数領域データを生成する、
請求項1ないし4いずれか一項に記載の方法。 - 最も長いブロックサイズの周波数領域データを形成するために前記短いブロックサイズで前記複数の周波数領域データブロックを結合する段階は、前記短いブロックサイズで周波数領域データの値の間を補間して、前記最も長いブロックサイズ周波数領域データを生成する段階を含む、
請求項1ないし4いずれか一項に記載の方法。 - 最も長いブロックサイズは短いブロックサイズの長さの3倍以上の長さであり、複数の周波数領域データブロックを結合する段階は、複数のブロックの終わりに向けて現れる、所定閾値より高い総エネルギーを有する連続する周波数領域データブロックのサブグループを、インターリーブして結合し、中間サイズブロックの周波数領域データを形成する段階と、中間サイズブロックの周波数領域データを、前記所定閾値より高いエネルギーを持たない複数の周波数領域データブロックと、反復またはインターリーブして結合して、最も長いブロックサイズの周波数領域データを生成する段階とを有する、
請求項1ないし4いずれか一項に記載の方法。 - 前記ラウドネス修正は一組のゲインを含み、前記補間は補間したゲインを決定し、決定した少なくとも1つのラウドネス修正または補完したラウドネス修正を適用する段階は、前記一組のゲインまたは一組の補間したゲインを適用する段階を含み、決定したゲインを補間する段階は、決定したゲイン値の線形補間を用いる、
請求項2ないし9いずれか一項に記載の方法。 - 前記ラウドネス修正は一組のゲインを含み、前記補間は補間したゲインを決定し、決定した少なくとも1つのラウドネス修正または補完したラウドネス修正を適用する段階は、前記一組のゲインまたは一組の補間したゲインを適用する段階を含み、前記決定したゲインを補間する段階は、2次以上の多項式補間を用いる、
請求項2ないし9いずれか一項に記載の方法。 - 前記ラウドネス修正は一組のゲインを含み、前記補間は補間したゲインを決定し、決定した少なくとも1つのラウドネス修正または補完したラウドネス修正を適用する段階は、前記一組のゲインまたは一組の補間したゲインを適用する段階を含み、決定したゲインを補間する段階は、スプライン補間を用いる、
請求項2ないし9いずれか一項に記載の方法。 - 前記1つ以上の知覚されるラウドネスパラメータは、オーディオデータの励起と、オーディオデータの個別ラウドネスとを含む、
請求項2ないし12いずれか一項に記載の方法。 - 前記1つ以上の知覚されるラウドネスパラメータは、オーディオデータの励起と、オーディオデータの個別ラウドネスとを含み、
知覚されるラウドネス処理を実行する段階は、ラウドネスレベリング、ゲインコントロール、ノイズ補正、及び/またはダイナミックイコライゼーションのうち1つ以上を含む、
請求項2ないし12いずれか一項に記載の方法。 - 変換はラップド変換である、
請求項1ないし14いずれか一項に記載の方法。 - ラップド変換は短時間離散フーリエ変換(STDFT)である、
請求項15に記載の方法であって、 - ラップド変換は修正離散余弦変換(MDCT)である、
請求項15に記載の方法であって、 - ラップド変換は短時間離散正弦変換である、
請求項1ないし14いずれか一項に記載の方法。 - 前記データは、2つ以上のブロックサイズを用いる知覚符号化器により符号化された符号化オーディオデータからのものである、
請求項1ないし18いずれか一項に記載の方法。 - 前記データは、256時間領域サンプルの短いブロックサイズと、512時間領域サンプルの長いブロックサイズとを用いる知覚符号化器により符号化された符号化オーディオデータからのものである、
請求項19に記載の方法であって、 - 前記データは、AC−3により符号化された符号化オーディオデータからのものである、請求項20に記載の方法であって、
- 前記受け取った周波数領域データは、256時間領域サンプルの短いブロックサイズと、2048時間領域サンプルの長いブロックサイズとを用いる知覚符号化器により符号化された符号化オーディオデータからのものである、
請求項19に記載の方法であって、 - 前記データは、AAC符号化器により符号化された符号化オーディオデータからのものである、
請求項19に記載の方法。 - 少なくとも1つのプロセッサにより実行されると、複数のブロックサイズでラップド変換により決定された周波数領域データを含むオーディオデータの知覚ラウドネス処理を行う、請求項1ないし23いずれか一項に記載の方法を実行する命令を有するコンピュータ読み出し可能媒体。
- 少なくとも1つのプロセッサにより実行されると、複数のブロックサイズでラップド変換により決定された周波数領域データを含むオーディオデータの知覚ラウドネス処理を行う、請求項1ないし23いずれか一項に記載の方法を実行するプログラムロジック。
- 複数のブロックサイズでの変換により決まる周波数領域データを有するオーディオデータの知覚されるラウドネス処理をする装置であって、
複数のブロックサイズで周波数領域オーディオデータのブロックを受け取る手段と、
短いブロックサイズの複数の受け取った周波数領域データブロックを結合して、最も長いブロックサイズの周波数領域データブロックを形成する手段と、
最も長いブロックサイズの受け取ったブロックの知覚されるラウドネス処理を実行するように構成された処理手段と、を有し、
前記処理手段による前記知覚されるラウドネス処理の実行は、知覚されるラウドネスパラメータの決定を含む、装置。 - 前記ラウドネス処理は、さらに、
前記1つ以上の決定された知覚されるラウドネスパラメータを用いて少なくとも1つのラウドネス修正を決定する手段であって、前記少なくとも1つのラウドネス修正は、受け取った周波数領域データブロックまたはそれを遅延させたものに適用するものである段階を有し、
前記装置はさらに、
前記少なくとも1つのラウドネス修正を決定する手段に結合した、ラウドネス修正を補間する手段であって、前記形成された最も長いブロックサイズで決定する少なくとも1つのラウドネス修正のいずれについても、決定した少なくとも1つのラウドネス修正が、決定された少なくとも1つのラウドネス修正を形成するために用いられた短いブロックサイズで受け取られたデータブロックに適用するために補間される手段と、
前記決定した少なくとも1つのラウドネス修正または補間した修正を、前記受け取った周波数領域データブロックまたはそれを遅延させたものに適用する手段とを有する、
請求項26に記載の装置。 - 前記少なくとも1つのラウドネス修正または補間した修正を、前記周波数領域データブロックを遅延させたものに適用するように、前記周波数領域オーディオデータブロックを遅延させる手段をさらに有する、
請求項27に記載の装置。 - 前記ラウドネス修正は一組のゲインを含み、前記補間する手段は補間したゲインを決定し、決定した少なくとも1つのラウドネス修正または補完したラウドネス修正を適用する手段は、前記一組のゲインまたは一組の補間したゲインを適用する手段を含む、
請求項27または28に記載の装置。 - 結合する手段は、最も長いブロックサイズの周波数領域データを形成するために前記短いブロックサイズで前記複数の周波数領域データブロックを結合し、前記短いブロックサイズで周波数領域データをインターリーブするように構成されている、
請求項26ないし29いずれか一項に記載の装置。 - 結合する手段は、最も長いブロックサイズの周波数領域データを形成するために前記短いブロックサイズで前記複数の周波数領域データブロックを結合し、前記短いブロックサイズで周波数領域データの値を反復して、前記最も長いブロックサイズ周波数領域データを生成するように構成されている、
請求項26ないし29いずれか一項に記載の装置。 - 最新の短いブロックサイズのブロックの短いブロックサイズの周波数領域データを用いて、前記最も長いブロックサイズの周波数領域データを生成する、
請求項30に記載の装置。 - 結合する手段は、最も長いブロックサイズの周波数領域データを形成するために前記短いブロックサイズで前記複数の周波数領域データブロックを結合し、前記短いブロックサイズで周波数領域データの値を補間して、前記最も長いブロックサイズ周波数領域データを生成するように構成されている、
請求項26ないし29いずれか一項に記載の装置。 - 最も長いブロックサイズは短いブロックサイズの長さの3倍以上の長さであり、
結合する手段は、複数の周波数領域データブロックの結合が次を含むように構成されている、請求項26ないし29いずれか一項に記載の装置:
複数のブロックの終わりに向けて現れる、所定閾値より高い総エネルギーを有する連続する周波数領域データブロックのサブグループを、インターリーブして結合し、中間サイズブロックの周波数領域データを形成する段階と、
中間サイズブロックの周波数領域データを、前記所定閾値より高いエネルギーを持たない複数の周波数領域データブロックと、反復またはインターリーブして結合して、最も長いブロックサイズの周波数領域データを生成する段階。 - 前記ラウドネス修正は一組のゲインを含み、前記補間する手段は補間したゲインを決定し、決定した少なくとも1つのラウドネス修正または補完したラウドネス修正を適用する手段は、前記一組のゲインまたは一組の補間したゲインを適用する手段を含み、補間する手段は、決定したゲインの補間に線形補間を用いるように構成された、
請求項27ないし34いずれか一項に記載の装置。 - 前記ラウドネス修正は一組のゲインを含み、前記補間する手段は補間したゲインを決定し、決定した少なくとも1つのラウドネス修正または補完したラウドネス修正を適用する手段は、前記一組のゲインまたは一組の補間したゲインを適用する手段を含み、補間する手段は、決定したゲインの補間に2次以上の多項式補間を用いるように構成された、
請求項27ないし34いずれか一項に記載の装置。 - 前記ラウドネス修正は一組のゲインを含み、前記補間する手段は補間したゲインを決定し、決定した少なくとも1つのラウドネス修正または補完したラウドネス修正を適用する手段は、前記一組のゲインまたは一組の補間したゲインを適用する手段を含み、補間する手段は、決定したゲインの補間にスプライン補間を用いるように構成された、
請求項27ないし34いずれか一項に記載の装置。 - 前記1つ以上の知覚されるラウドネスパラメータは、オーディオデータの励起と、オーディオデータの個別ラウドネスとを含む、
請求項27ないし37いずれか一項に記載の装置。 - 前記1つ以上の知覚されるラウドネスパラメータは、オーディオデータの励起と、オーディオデータの個別ラウドネスとを含み、
処理手段は、知覚されるラウドネス処理の実行が、ラウドネスレベリング、ゲインコントロール、ノイズ補正、及び/またはダイナミックイコライゼーションのうち1つ以上を含むように構成されている、
請求項27ないし37いずれか一項に記載の装置。 - 前記変換はラップド変換である、
請求項26ないし39いずれか一項に記載の装置。 - ラップド変換は短時間離散フーリエ変換(STDFT)である、
請求項40に記載の装置。 - ラップド変換は修正離散余弦変換(MDCT)である、
請求項40に記載の装置。 - ラップド変換は短時間離散正弦変換である、
請求項40に記載の装置。 - 前記データは、2つ以上のブロックサイズを用いる知覚符号化器により符号化された符号化オーディオデータからのものである、
請求項26ないし43いずれか一項に記載の装置。 - 前記データは、256時間領域サンプルの短いブロックサイズと、512時間領域サンプルの長いブロックサイズとを用いる知覚符号化器により符号化された符号化オーディオデータからのものである、
請求項44に記載の装置。 - 前記データは、AC−3により符号化された符号化オーディオデータからのものである、
請求項45に記載の装置。 - 前記受け取った周波数領域データは、256時間領域サンプルの短いブロックサイズと、2048時間領域サンプルの長いブロックサイズとを用いる知覚符号化器により符号化された符号化オーディオデータからのものである、
請求項44に記載の装置。 - 前記データは、AAC符号化器により符号化された符号化オーディオデータからのものである、
請求項44に記載の装置。 - 複数のブロックサイズでの変換により決まる周波数領域データを有するオーディオデータの知覚されるラウドネス処理をする装置であって、
周波数領域オーディオデータブロックを受け取るように構成されたブロック結合器であって、各ブロックは複数のブロックサイズのうちの1つであり、最も長いブロックサイズより短い1つ以上のブロックサイズの短いブロックサイズであるデータブロックを受け取り、前記短いブロックサイズで受け取った複数の周波数領域データブロックを結合して、最も長いブロックサイズの周波数領域データブロックを形成する結合器と、
最も長いブロックサイズの受け取ったブロックの知覚されるラウドネス処理を実行するように構成された周波数領域信号プロセッサと、を有し、
前記周波数領域信号プロセッサによる前記知覚されるラウドネス処理の実行は、知覚されるラウドネスパラメータの決定を含む、 - 前記周波数領域信号プロセッサは、さらに、少なくとも1つのラウドネス修正を決定して、前記ブロック結合器が受け取った周波数領域データブロックまたはそれを遅延させたものに適用するように構成された、前記1つ以上の決定された知覚されるラウドネスパラメータを用いるラウドネス修正決定器を含み、
前記装置はさらに、
前記周波数領域信号プロセッサに結合し、形成された最も長いブロックサイズで決定した1つ以上のラウドネス修正について、決定された少なくとも1つのラウドネス修正を形成するために用いる短いブロックサイズの受け取ったデータブロックに適用するため、決定した少なくとも1つのラウドネス修正を補間するラウドネス修正補間器と、
前記ラウドネス修正補間器と、前記ブロック結合器の入力と、または前記ブロック結合器の入力に結合した遅延素子に結合し、決定された少なくとも1つのラウドネス修正または補間した修正を、受け取った周波数領域データブロックまたはそれを遅延させたものに適用するように構成されたラウドネス修正器とを有する、
請求項49に記載の装置。 - 前記ブロック結合器の入力に結合し、周波数領域オーディオデータブロックを遅延させるように構成された遅延要素であって、前記遅延要素の出力は前記ラウドネス修正器に結合し、少なくとも1つのラウドネス修正または補間した修正を前記周波数領域データブロックを遅延したものに適用する遅延要素をさらに有する、
請求項50に記載の装置。 - 前記ラウドネス修正は一組のゲインを含み、前記ラウドネス修正補間器は補間したゲインを決定し、前記ラウドネス修正器は、一組のゲインまたは補間したゲインを適用するように構成された、
請求項50ないし51いずれか一項に記載の装置。 - 前記ブロック結合器は、最も長いブロックサイズの周波数領域データを形成するために前記短いブロックサイズで前記複数の周波数領域データブロックを結合し、前記短いブロックサイズで周波数領域データをインターリーブする、インターリーバを含む、
請求項49ないし52いずれか一項に記載の装置。 - 前記ブロック結合器は、最も長いブロックサイズの周波数領域データを形成するために前記短いブロックサイズで前記複数の周波数領域データブロックを結合し、前記短いブロックサイズで周波数領域データの値を反復して、前記最も長いブロックサイズ周波数領域データを生成する、データ複製器を含む、
請求項50ないし52いずれか一項に記載の装置。 - 最新の短いブロックサイズのブロックの短いブロックサイズの周波数領域データを用いて、前記最も長いブロックサイズの周波数領域データを生成する、
請求項54に記載の装置。 - 前記ブロック結合器は、最も長いブロックサイズの周波数領域データを形成するために前記短いブロックサイズで前記複数の周波数領域データブロックを結合し、前記短いブロックサイズで周波数領域データの値を補間して、前記最も長いブロックサイズ周波数領域データを生成する、補間器を含む、
請求項50ないし52いずれか一項に記載の装置。 - 最も長いブロックサイズは短いブロックサイズの長さの3倍以上の長さであり、前記ブロック結合器は、エネルギー決定器と、複数の周波数領域データブロックの結合が次を含むように構成された処理回路とを含む、請求項50ないし52いずれか一項に記載の装置:
複数のブロックの終わりに向けて現れる、所定閾値より高い総エネルギーを有する連続する周波数領域データブロックのサブグループを、インターリーブして結合し、中間サイズブロックの周波数領域データを形成する段階と、
中間サイズブロックの周波数領域データを、前記所定閾値より高いエネルギーを持たない複数の周波数領域データブロックと、反復またはインターリーブして結合して、最も長いブロックサイズの周波数領域データを生成する段階。 - 前記ラウドネス修正は一組のゲインを含み、前記ラウドネス修正補間器は補間したゲインを決定し、前記ラウドネス修正器は、一組のゲインまたは補間したゲインを適用するように構成された、前記ラウドネス修正補間器は、決定されたゲイン値を補間する線形補間を用いるように構成された、
請求項50ないし57いずれか一項に記載の装置。 - 前記ラウドネス修正は一組のゲインを含み、前記ラウドネス修正補間器は補間したゲインを決定し、前記ラウドネス修正器は、一組のゲインまたは補間したゲインを適用するように構成された、前記ラウドネス修正補間器は、2次以上の多項式補間を用いるように構成された、
請求項50ないし57いずれか一項に記載の装置。 - 前記ラウドネス修正は一組のゲインを含み、前記ラウドネス修正補間器は補間したゲインを決定し、前記ラウドネス修正器は、一組のゲインまたは補間したゲインを適用するように構成された、前記ラウドネス修正補間器はスプライン補間を用いるように構成された、
請求項50ないし57いずれか一項に記載の装置。 - 前記1つ以上の知覚されるラウドネスパラメータは、オーディオデータの励起と、オーディオデータの個別ラウドネスとを含む、
請求項50ないし60いずれか一項に記載の装置。 - 前記1つ以上の知覚されるラウドネスパラメータは、オーディオデータの励起と、オーディオデータの個別ラウドネスとを含み、
前記周波数領域信号プロセッサは、ラウドネスレベリング、ゲインコントロール、ノイズ補正、及び/またはダイナミックイコライゼーションのうち1つ以上を含む知覚されるラウドネス処理を実行する、
請求項50ないし60いずれか一項に記載の装置。 - 前記変換はラップド変換である、
請求項49ないし62いずれか一項に記載の装置。 - ラップド変換は短時間離散フーリエ変換(STDFT)である、
請求項63に記載の装置。 - ラップド変換は修正離散余弦変換(MDCT)である、
請求項63に記載の装置。 - ラップド変換は短時間離散正弦変換である、
請求項63に記載の装置。 - 前記データは、2つ以上のブロックサイズを用いる知覚符号化器により符号化された符号化オーディオデータからのものである、
請求項50ないし66いずれか一項に記載の装置。 - 前記データは、256時間領域サンプルの短いブロックサイズと、512時間領域サンプルの長いブロックサイズとを用いる知覚符号化器により符号化された符号化オーディオデータからのものである、
請求項67に記載の装置。 - 前記データは、AC−3により符号化された符号化オーディオデータからのものである、
請求項68に記載の装置。 - 前記受け取った周波数領域データは、256時間領域サンプルの短いブロックサイズと、2048時間領域サンプルの長いブロックサイズとを用いる知覚符号化器により符号化された符号化オーディオデータからのものである、
請求項67に記載の装置。 - 前記データは、AAC符号化器により符号化された符号化オーディオデータからのものである、
請求項67に記載の装置。 - 処理システムを含む装置であって、前記処理装置は、少なくとも1つのプロセッサと、コンピュータ読み取り可能媒体とを含み、前記処理システムは、複数のブロックサイズでラップド変換により決定された周波数領域データを含むオーディオデータの知覚ラウドネス処理を行う、請求項1ないし23、いずれか一項に記載の方法を実行する装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14079108P | 2008-12-24 | 2008-12-24 | |
US61/140,791 | 2008-12-24 | ||
PCT/US2009/069178 WO2010075377A1 (en) | 2008-12-24 | 2009-12-22 | Audio signal loudness determination and modification in the frequency domain |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012513729A true JP2012513729A (ja) | 2012-06-14 |
JP5270006B2 JP5270006B2 (ja) | 2013-08-21 |
Family
ID=41693219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011543637A Active JP5270006B2 (ja) | 2008-12-24 | 2009-12-22 | 周波数領域におけるオーディオ信号ラウドネス決定と修正 |
Country Status (7)
Country | Link |
---|---|
US (2) | US8892426B2 (ja) |
EP (1) | EP2374211B1 (ja) |
JP (1) | JP5270006B2 (ja) |
CN (2) | CN102265513B (ja) |
AT (1) | ATE552651T1 (ja) |
HK (1) | HK1205372A1 (ja) |
WO (1) | WO2010075377A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021029054A (ja) * | 2013-03-26 | 2021-02-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ボリューム平準化器コントローラおよび制御方法 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8700410B2 (en) * | 2009-06-18 | 2014-04-15 | Texas Instruments Incorporated | Method and system for lossless value-location encoding |
US8437480B2 (en) * | 2009-12-17 | 2013-05-07 | Stmicroelectronics Asia Pacific Pte Ltd. | Adaptive loudness levelling for digital audio signals |
WO2012146757A1 (en) | 2011-04-28 | 2012-11-01 | Dolby International Ab | Efficient content classification and loudness estimation |
US20140278911A1 (en) * | 2013-03-15 | 2014-09-18 | Telemetry Limited | Method and apparatus for determining digital media audibility |
ES2617314T3 (es) * | 2013-04-05 | 2017-06-16 | Dolby Laboratories Licensing Corporation | Aparato de compresión y método para reducir un ruido de cuantización utilizando una expansión espectral avanzada |
EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
US9608588B2 (en) * | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
CN109036441B (zh) | 2014-03-24 | 2023-06-06 | 杜比国际公司 | 对高阶高保真立体声信号应用动态范围压缩的方法和设备 |
US9462381B2 (en) * | 2014-05-28 | 2016-10-04 | Apple Inc. | Intelligent dynamics processing |
WO2016007947A1 (en) * | 2014-07-11 | 2016-01-14 | Arizona Board Of Regents On Behalf Of Arizona State University | Fast computation of excitation pattern, auditory pattern and loudness |
CN106157978B (zh) * | 2015-04-15 | 2020-04-07 | 宏碁股份有限公司 | 语音信号处理装置及语音信号处理方法 |
US10374564B2 (en) * | 2017-04-20 | 2019-08-06 | Dts, Inc. | Loudness control with noise detection and loudness drop detection |
US11856385B2 (en) * | 2019-02-13 | 2023-12-26 | MOZZAIK IO d.o.o. | Audio signal processing method and device |
CN112040373B (zh) * | 2020-11-02 | 2021-04-23 | 统信软件技术有限公司 | 一种音频数据处理方法、计算设备及可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0738443A (ja) * | 1993-03-09 | 1995-02-07 | Sony Corp | 圧縮データ記録及び/又は再生若しくは伝送及び/又は受信装置、圧縮データ記録及び/又は再生若しくは伝送及び/又は受信方法、及び記録媒体 |
US5434922A (en) * | 1993-04-08 | 1995-07-18 | Miller; Thomas E. | Method and apparatus for dynamic sound optimization |
JP2002543703A (ja) * | 1999-04-26 | 2002-12-17 | ディーエスピーファクトリー・リミテッド | デジタル補聴器用のラウドネス正常化制御 |
JP2009532728A (ja) * | 2006-04-03 | 2009-09-10 | トムソン ライセンシング | プラズマディスプレイパネル内でビデオレベルを符号化するための方法および装置 |
Family Cites Families (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4460871A (en) * | 1979-08-06 | 1984-07-17 | Orban Associates, Inc. | Multiband cross-coupled compressor with overshoot protection circuit |
DE3943879B4 (de) * | 1989-04-17 | 2008-07-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Digitales Codierverfahren |
US5235623A (en) * | 1989-11-14 | 1993-08-10 | Nec Corporation | Adaptive transform coding by selecting optimum block lengths according to variatons between successive blocks |
US5247579A (en) * | 1990-12-05 | 1993-09-21 | Digital Voice Systems, Inc. | Methods for speech transmission |
US5291557A (en) | 1992-10-13 | 1994-03-01 | Dolby Laboratories Licensing Corporation | Adaptive rematrixing of matrixed audio signals |
US5699479A (en) | 1995-02-06 | 1997-12-16 | Lucent Technologies Inc. | Tonality for perceptual audio compression based on loudness uncertainty |
US5682463A (en) | 1995-02-06 | 1997-10-28 | Lucent Technologies Inc. | Perceptual audio compression based on loudness uncertainty |
JPH08223049A (ja) | 1995-02-14 | 1996-08-30 | Sony Corp | 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法 |
FI950917A (fi) * | 1995-02-28 | 1996-08-29 | Nokia Telecommunications Oy | Puhekoodausparametrien käsittely tietoliikennejärjestelmässä |
ATE192259T1 (de) * | 1995-11-09 | 2000-05-15 | Nokia Mobile Phones Ltd | Verfahren zur synthetisierung eines sprachsignalblocks in einem celp-kodierer |
SG54379A1 (en) * | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
US6092040A (en) | 1997-11-21 | 2000-07-18 | Voran; Stephen | Audio signal time offset estimation algorithm and measuring normalizing block algorithms for the perceptually-consistent comparison of speech signals |
US6029126A (en) * | 1998-06-30 | 2000-02-22 | Microsoft Corporation | Scalable audio coder and decoder |
US6122619A (en) * | 1998-06-17 | 2000-09-19 | Lsi Logic Corporation | Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor |
JP3739959B2 (ja) * | 1999-03-23 | 2006-01-25 | 株式会社リコー | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7027982B2 (en) * | 2001-12-14 | 2006-04-11 | Microsoft Corporation | Quality and rate control strategy for digital audio |
US7146313B2 (en) * | 2001-12-14 | 2006-12-05 | Microsoft Corporation | Techniques for measurement of perceptual audio quality |
DE60323331D1 (de) * | 2002-01-30 | 2008-10-16 | Matsushita Electric Ind Co Ltd | Verfahren und vorrichtung zur audio-kodierung und -dekodierung |
US20030223597A1 (en) | 2002-05-29 | 2003-12-04 | Sunil Puria | Adapative noise compensation for dynamic signal enhancement |
US7039204B2 (en) * | 2002-06-24 | 2006-05-02 | Agere Systems Inc. | Equalization for audio mixing |
DE10234130B3 (de) * | 2002-07-26 | 2004-02-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals |
KR100467020B1 (ko) | 2002-07-26 | 2005-01-24 | 삼성전자주식회사 | 자기 정렬된 접합영역 콘택홀을 갖는 반도체 장치 및 그제조 방법 |
US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
SG185134A1 (en) | 2003-05-28 | 2012-11-29 | Dolby Lab Licensing Corp | Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal |
US7471726B2 (en) * | 2003-07-15 | 2008-12-30 | Microsoft Corporation | Spatial-domain lapped transform in digital media compression |
US20050038579A1 (en) | 2003-08-15 | 2005-02-17 | Lewis Michael W. | Interactive maintenance management alarm handling |
US7912226B1 (en) * | 2003-09-12 | 2011-03-22 | The Directv Group, Inc. | Automatic measurement of audio presence and level by direct processing of an MPEG data stream |
US7639823B2 (en) | 2004-03-03 | 2009-12-29 | Agere Systems Inc. | Audio mixing using magnitude equalization |
US20080095385A1 (en) * | 2004-06-30 | 2008-04-24 | Koninklijke Philips Electronics, N.V. | Method of and System for Automatically Adjusting the Loudness of an Audio Signal |
US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
EP1833163B1 (en) | 2004-07-20 | 2019-12-18 | Harman Becker Automotive Systems GmbH | Audio enhancement system and method |
JP4594681B2 (ja) | 2004-09-08 | 2010-12-08 | ソニー株式会社 | 音声信号処理装置および音声信号処理方法 |
DE102004047069A1 (de) * | 2004-09-28 | 2006-04-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ändern einer Segmentierung eines Audiostücks |
US7924711B2 (en) * | 2004-10-20 | 2011-04-12 | Qualcomm Incorporated | Method and apparatus to adaptively manage end-to-end voice over internet protocol (VolP) media latency |
CA2581810C (en) | 2004-10-26 | 2013-12-17 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US20070291960A1 (en) * | 2004-11-10 | 2007-12-20 | Adc Technology Inc. | Sound Electronic Circuit and Method for Adjusting Sound Level Thereof |
US7386445B2 (en) * | 2005-01-18 | 2008-06-10 | Nokia Corporation | Compensation of transient effects in transform coding |
FR2882458A1 (fr) * | 2005-02-18 | 2006-08-25 | France Telecom | Procede de mesure de la gene due au bruit dans un signal audio |
US8290181B2 (en) | 2005-03-19 | 2012-10-16 | Microsoft Corporation | Automatic audio gain control for concurrent capture applications |
TWI397903B (zh) * | 2005-04-13 | 2013-06-01 | Dolby Lab Licensing Corp | 編碼音訊之節約音量測量技術 |
DE602005015426D1 (de) | 2005-05-04 | 2009-08-27 | Harman Becker Automotive Sys | System und Verfahren zur Intensivierung von Audiosignalen |
US20070007942A1 (en) | 2005-07-08 | 2007-01-11 | Microchip Technology Incorporated | Automatic non-linear phase response calibration and compensation for a power measurement device |
US7546240B2 (en) * | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
US20070121966A1 (en) * | 2005-11-30 | 2007-05-31 | Microsoft Corporation | Volume normalization device |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7715571B2 (en) * | 2006-03-23 | 2010-05-11 | Phonak Ag | Method for individually fitting a hearing instrument |
TWI517562B (zh) * | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
WO2007120452A1 (en) | 2006-04-04 | 2007-10-25 | Dolby Laboratories Licensing Corporation | Audio signal loudness measurement and modification in the mdct domain |
CN101421781A (zh) | 2006-04-04 | 2009-04-29 | 杜比实验室特许公司 | 音频信号的感知响度和/或感知频谱平衡的计算和调整 |
CA2648237C (en) | 2006-04-27 | 2013-02-05 | Dolby Laboratories Licensing Corporation | Audio gain control using specific-loudness-based auditory event detection |
TWI312982B (en) * | 2006-05-22 | 2009-08-01 | Nat Cheng Kung Universit | Audio signal segmentation algorithm |
CN101155438B (zh) | 2006-09-26 | 2011-12-28 | 张秀丽 | 音频设备的频率响应自适应均衡方法 |
JP4590389B2 (ja) | 2006-11-30 | 2010-12-01 | 本田技研工業株式会社 | 能動型振動騒音制御装置 |
EP1986466B1 (en) * | 2007-04-25 | 2018-08-08 | Harman Becker Automotive Systems GmbH | Sound tuning method and apparatus |
US8103008B2 (en) * | 2007-04-26 | 2012-01-24 | Microsoft Corporation | Loudness-based compensation for background noise |
EP2048657B1 (en) * | 2007-10-11 | 2010-06-09 | Koninklijke KPN N.V. | Method and system for speech intelligibility measurement of an audio transmission system |
WO2009086174A1 (en) * | 2007-12-21 | 2009-07-09 | Srs Labs, Inc. | System for adjusting perceived loudness of audio signals |
US8447591B2 (en) * | 2008-05-30 | 2013-05-21 | Microsoft Corporation | Factorization of overlapping tranforms into two block transforms |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
US9055374B2 (en) * | 2009-06-24 | 2015-06-09 | Arizona Board Of Regents For And On Behalf Of Arizona State University | Method and system for determining an auditory pattern of an audio segment |
EP2372705A1 (en) * | 2010-03-24 | 2011-10-05 | Thomson Licensing | Method and apparatus for encoding and decoding excitation patterns from which the masking levels for an audio signal encoding and decoding are determined |
-
2009
- 2009-12-22 JP JP2011543637A patent/JP5270006B2/ja active Active
- 2009-12-22 CN CN200980151996.3A patent/CN102265513B/zh active Active
- 2009-12-22 CN CN201410743139.5A patent/CN104378075B/zh active Active
- 2009-12-22 EP EP09802082A patent/EP2374211B1/en active Active
- 2009-12-22 WO PCT/US2009/069178 patent/WO2010075377A1/en active Application Filing
- 2009-12-22 AT AT09802082T patent/ATE552651T1/de active
-
2011
- 2011-06-23 US US13/167,593 patent/US8892426B2/en active Active
-
2014
- 2014-10-19 US US14/517,875 patent/US9306524B2/en active Active
-
2015
- 2015-06-16 HK HK15105731.6A patent/HK1205372A1/xx unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0738443A (ja) * | 1993-03-09 | 1995-02-07 | Sony Corp | 圧縮データ記録及び/又は再生若しくは伝送及び/又は受信装置、圧縮データ記録及び/又は再生若しくは伝送及び/又は受信方法、及び記録媒体 |
US5434922A (en) * | 1993-04-08 | 1995-07-18 | Miller; Thomas E. | Method and apparatus for dynamic sound optimization |
JP2002543703A (ja) * | 1999-04-26 | 2002-12-17 | ディーエスピーファクトリー・リミテッド | デジタル補聴器用のラウドネス正常化制御 |
JP2009532728A (ja) * | 2006-04-03 | 2009-09-10 | トムソン ライセンシング | プラズマディスプレイパネル内でビデオレベルを符号化するための方法および装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021029054A (ja) * | 2013-03-26 | 2021-02-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ボリューム平準化器コントローラおよび制御方法 |
JP2021145376A (ja) * | 2013-03-26 | 2021-09-24 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ボリューム平準化器コントローラおよび制御方法 |
US11218126B2 (en) | 2013-03-26 | 2022-01-04 | Dolby Laboratories Licensing Corporation | Volume leveler controller and controlling method |
JP7150939B2 (ja) | 2013-03-26 | 2022-10-11 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ボリューム平準化器コントローラおよび制御方法 |
US11711062B2 (en) | 2013-03-26 | 2023-07-25 | Dolby Laboratories Licensing Corporation | Volume leveler controller and controlling method |
JP7566835B2 (ja) | 2013-03-26 | 2024-10-15 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ボリューム平準化器コントローラおよび制御方法 |
Also Published As
Publication number | Publication date |
---|---|
ATE552651T1 (de) | 2012-04-15 |
US20110257982A1 (en) | 2011-10-20 |
EP2374211B1 (en) | 2012-04-04 |
WO2010075377A1 (en) | 2010-07-01 |
JP5270006B2 (ja) | 2013-08-21 |
US9306524B2 (en) | 2016-04-05 |
CN102265513B (zh) | 2014-12-31 |
US8892426B2 (en) | 2014-11-18 |
CN104378075B (zh) | 2017-05-31 |
CN104378075A (zh) | 2015-02-25 |
US20150106083A1 (en) | 2015-04-16 |
CN102265513A (zh) | 2011-11-30 |
HK1205372A1 (en) | 2015-12-11 |
EP2374211A1 (en) | 2011-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5270006B2 (ja) | 周波数領域におけるオーディオ信号ラウドネス決定と修正 | |
JP6728416B2 (ja) | パラメトリック・マルチチャネル・エンコードのための方法 | |
TWI417872B (zh) | 修改型離散餘弦轉換領域之音訊信號響度測量及修改技術 | |
RU2611986C2 (ru) | Сигнальный процессор, формирователь окон, кодированный медиасигнал, способ обработки сигнала и способ формирования окон | |
JP6147337B2 (ja) | サブバンド領域内での自由選択可能な周波数偏移のための装置、方法およびコンピュータプログラム | |
JP2010515106A (ja) | 重み付けウィンドウを用いた低遅延変換符号化 | |
US20240005931A1 (en) | Downscaled decoding | |
US10332527B2 (en) | Method and apparatus for encoding and decoding audio signal | |
TW202334938A (zh) | 正交鏡像濾波器域中之沉浸式音訊及視訊服務空間重建濾波器庫 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121204 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130227 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130402 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130423 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130508 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5270006 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |