JP2010504008A - ダイアログ増幅技術 - Google Patents

ダイアログ増幅技術 Download PDF

Info

Publication number
JP2010504008A
JP2010504008A JP2009527747A JP2009527747A JP2010504008A JP 2010504008 A JP2010504008 A JP 2010504008A JP 2009527747 A JP2009527747 A JP 2009527747A JP 2009527747 A JP2009527747 A JP 2009527747A JP 2010504008 A JP2010504008 A JP 2010504008A
Authority
JP
Japan
Prior art keywords
signal
audio
component signal
component
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009527747A
Other languages
English (en)
Inventor
オー,ヒェン−オ
ウォン ジュン,ヤン
ファレ,クリストフ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2010504008A publication Critical patent/JP2010504008A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/05Generation or adaptation of centre channel in multi-channel audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Separation By Low-Temperature Treatments (AREA)
  • Electrotherapy Devices (AREA)
  • Manufacture, Treatment Of Glass Fibers (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Image Processing (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

複数のチャネルのオーディオ信号(例えば、ステレオオーディオ)は、周辺成分信号(反射または屈折される音)または他の成分信号と関連した音声成分信号(例えば、映画で俳優が話すダイアログ)のゲイン(例えば、ボリュームまたは騷音程度)を調節するように処理される。一実施例において、前記音声成分信号は識別及び修正される。一実施例において、前記音声成分信号は、前記音声ソース(例えば、前記俳優の現在のダイアログ)が複数のチャネルオーディオ信号のステレオ音像の中心に位置すると仮定し、音声成分信号のスペクトル成分を考慮して識別される。
本発明の直接的な具現方法、システム及びコンピュータで判読可能な記録媒体を含む他の具現例が開示される。
【選択図】図1

Description

本発明は、現在係留中の下記の米国仮出願を優先権として主張する。
2006年9月14日に出願された発明の名称“Method of Separately Controlling Dialogue Volume”、米国仮出願番号60/844,806、代理人管理番号19819−047P01; 2007年1月11日に出願された発明の名称“Separate Dialogue Volume(SDV)”、米国仮出願番号60/884,594、代理人管理番号19819−120P01; 及び2007年6月11日に出願された発明の名称“Enhancing Stereo Audio with Remix Capability and Separate Dialogue”、米国仮出願番号60/943,268、代理人管理番号19819−160P01の前記各仮出願は、全体が参照として本明細書に統合される。
本発明は、一般的な信号処理に関するものである。
オーディオ増幅技術は、しばしば家庭内の娯楽システム、立体音響及びその他の消費者の電子機器で低周波信号を増幅させ、多様な聴取環境(例えば、コンサートホール)を具現化するために使用される。例えば、一部の技術は、高周波信号を挿入することで、映画ダイアログをより明確にするために使用されることもある。しかしながら、如何なる技術においても、ダイアログを周辺環境や他の成分の信号と比較して相対的に増幅させる技術は開示されていない。
本発明の目的は、ダイアログを周辺環境や他の成分の信号と比較して相対的に増幅させる技術を提供することにある。
上記のような目的を達成するための本発明に係るダイアログ増幅技術は、音声成分信号と他の成分信号が含まれた複数のチャネルオーディオ信号を獲得する段階と、オーディオ信号の音像内での前記音声成分信号の位置に基づいて前記音声成分信号を修正する段階とを含むことを特徴とする。
本発明によると、ダイアログを周辺環境や他の成分の信号と比較して相対的に増幅させる技術を提供することができる。
ダイアログ増幅技術のためのミキシングモデルを示したブロック図である。 時間−周波数タイルを用いたステレオ信号の分解を示したグラフである。 音像の中心に位置する分解ゲインファクタの関数としてゲインを計算する関数のグラフである。 音像の中心に位置しない分解ゲインファクタの関数としてゲインを計算する関数のグラフである。 ダイアログ増幅システムを例示するブロック図である。 ダイアログ増幅プロセスを例示する順序図である。 図1乃至図5を参照して説明された機能とプロセスが行われるデジタルテレビジョンシステムの例を示したブロック図である。
ダイアログ増幅技術
図1は、ダイアログ増幅技術のためのミキシングモデル100を示した図である。前記ミキシングモデル100において、聴取者は、左右のチャネルからオーディオ信号を受信する。オーディオ信号sは、ファクターaによって決定される方向から局地化された音に対応する。以後に斜めに反射または反響される音に対応する独立的なオーディオ信号n1とn2は、しばしば背景音または背景を意味する。ステレオ信号は、与えられたオーディオソースに対して前記ソースオーディオ信号が特定方向の情報(例えば、レベル差、時間差)を用いて前記左右のオーディオ信号チャネルと連関して入力され、前記以後に反射または反響された独立的な信号n1及びn2が聴覚的イベント幅及び聴取者包格キュー(envelopment cues)を決定するチャネルに入力されるように記録またはミックスされる。前記ミキシングモデル100は、ステレオ信号の知覚的に動機付けられた分解として数学的に表現されるが、これは、前記オーディオ信号の局地化及び背景音を含む一つのオーディオソースを用いる。
1(n)=s(n)+n1(n)
2(n)=as(n)+n2(n) (1)
同時に活性化する複数のオーディオソースを含む非線形的なシナリオで効率的な分解を得るために、数学式1の前記分解は、複数の周波数領域で独立的であり、時間に順応的に行われる。
1(i,k)=S(i,k)+N1(i,k)
2(i,k)=A(i,k)S(i,k)+N2(i,k) (2)
ここで、iは、サブバンドインデックスを表し、kは、サブバンドの時間インデックスを表している。
図2は、時間−周波数タイルを用いたステレオ信号の分解を示したグラフである。索引iとkを有する各時間−周波数タイル200、前記信号S,N1,N2及び分解ゲインファクタAは独立的に推定される。簡潔な表記のために、前記サブバンド及び時間のインデックスiとkは下記の説明で省略される。
知覚的に誘発されたサブバンドのバンド幅を用いたサブバンドの分解を使用するとき、サブバンドの前記バンド幅は主要バンドと同一に選択される。S、N1、N2及びAは、各サブバンド別に略毎tミリセカンド(例えば、20ms)ごとに推定される。より低い演算複雑度のために、STFT(short time Fourier transform)がFFT(fast Fourier transform)を行うのに使用される。ステレオサブバンド信号であるX1及びX2が与えられるとき、S、A、N1、N2の推定が決定される。X1の累乗数の短期推定は下記のように表現される。
x1(i,k)=E{X1 2(i,k)} (3)
ここで、E{.}は、短期平均(short−time averaging)演算である。他の信号において、前記同一の規則が利用可能であり、換言すると、Px2、Psを用いることができる。そして、PN=PN1=PN2は、前記対応する短期パワー推定である。前記N1及びN2の累乗数は同一に仮定され、換言すると、側面の独立的な音の量は左右のチャネルにおいて同一であると仮定される。
s、A及びPNの推定
前記ステレオ信号のサブバンド表現が与えられる場合、前記パワー(Px1,Px2)及び標準化された相互相関が決定される。左右のチャネルの間の前記標準化された相互相関は下記の通りである。
Figure 2010504008
A、Ps、PNは、推定されたPx1、Px2、及びΦの関数として計算される。知られた変数及び知られていない変数と関連した三つの方程式は下記の通りである。
Figure 2010504008
数学式5は、A、Ps、及びPNに対して計算される。
Figure 2010504008
これと一緒に、下記の式が成立される。
Figure 2010504008
S、N1、及びN2の最小二乗推定
次に、S、N1、及びN2の最小二乗推定がA、Ps、及びPN関数として演算される。それぞれのiとk、前記信号Sは、下記のように推定される。
Figure 2010504008
ここで、w1とw2は、実際の加重値である。前記推定エラーは下記の通りである。
E=(1−w1−w2A)S−w11−w22 (9)
エラーEが下記のようにX1及びX2と直交する場合、前記加重値w1及びw2は、最小二乗規範で最適化される。
E{EX1}=0
E{EX2}=0 (10)
この式から二つの方程式が誘導される。
(1−w1−w2A)Ps−w1N=0
A(1−w1−w2A)Ps−w2N=0 (11)
この式から、前記加重値は下記のように計算される。
Figure 2010504008
前記N1の推定値は下記の通りである。
Figure 2010504008
前記推定エラーは下記の通りである。
E=(−w3−w4A)S−(1−w3)N1−w22 (14)
前記推定エラーがX1及びX2と直交するように前記加重値が再び計算され、下記のような結果が導出される。
Figure 2010504008
前記N2(下記の数学式16)の最小二乗推定値を計算するための前記加重値は、
Figure 2010504008
ポストスケーリング(post−scaling)
Figure 2010504008
Figure 2010504008
これと同一の理由で、N1及びN2も下記のように調節される。
Figure 2010504008
ステレオ信号合成
以前に説明された信号分解において、オリジナルステレオ信号と類似した信号は、各時間及び各サブバンド別に数学式2を適用し、前記各サブバンドを時間ドメインに変換することで得られる。
修正されたダイアログゲインを用いて前記信号を生成するために、前記各サブバンドは下記のように計算される。
Figure 2010504008
ここで、g(i,k)は、前記ダイアログゲインが所望の値に修正されたdB単位のゲインファクタである。
g(i,k)をどのように計算するか動機づける幾つかの注目すべき点がある。
・一般的に、ダイアログは音像のセンターに位置する。すなわち、ダイアログに属した時間k及び周波数iである成分信号は、1(0dB)に近い分解ゲインファクタA(i,k)を有することができる。
・各音声信号は、最大4kHzまでのエネルギーを含む。8kHz以上で、音声は実質的にエネルギーを含まない。
・音声は、一般的に非常に低い周波数帯域(例えば、約70Hz以下)を含まない。
このような観察は、g(i,k)が非常に低い周波数帯域と8kHz以上の帯域で0dBに決定され、ステレオ信号の修正可能性が非常に低いことを暗示する。他の周波数帯域で、g(i,k)は、下記の数学式22のように所定のダイアログゲインGdとA(i,k)の関数として調節される。
g(i,k)=f(Gd,A(i,k)) (22)
適切な関数fの例が図3Aに示された。図3Aを参照すると、fとA(i,k)の関係がログスケール(dB)に表示され、他の領域で、fとA(i,k)は線形スケールに定義される。fの特定例は下記の通りである。
Figure 2010504008
ここで、Wは、図3Aに示すように、前記関数fのゲイン領域の広さを決定する。前記常数Wは、前記ダイアログゲインの方向的な感度に関係する。例えば、W=6dBの値を有するとき、ほとんどの信号で良い結果が生成される。しかし、他の信号では、Wが異なる値を有するときに最適化される。
放送または受信装置の劣悪な測定(例えば、左右チャネルのゲインが互いに異なること)によって、ダイアログが正確にセンターに位置しないことがある。この場合、関数fは、前記ダイアログの位置によってセンターの位置を移動することができる。移動された関数fの例を図3Bに示した。
選択的遂行及び一般化
センター仮定(または、一般的な位置仮定)及び音声信号のスペクトル領域に基づいた前記ダイアログ成分信号の確認法は簡単であり、多くの場合によく一致する。しかし、前記ダイアログ確認法は、修正されるか、潜在的に向上される。フォルマント、ハーモニック構造、ダイアログ成分信号を探知するための転移のような音声信号の多くの特徴は調査される可能性がある。
上述したように、互いに異なるオーディオに対しては、互いに異なるゲイン関数の形状(例えば、図3A及び図3B)が最適である。したがって、信号適応的ゲイン関数が使用される。
ダイアログゲイン調節は、サラウンド音響のホームシネマシステムで行われる。ダイアログゲイン調節の重要な特徴は、センターチャネルにダイアログが存在するかどうかを探知することにある。これを行う一つの方法は、センターチャネルが充分に大きい信号エネルギーを有している場合、ダイアログがセンターチャネルに位置していると探知することである。ダイアログがセンターチャネルに含まれた場合、ダイアログボリュームを調節するためにゲインがセンターチャネルに含まれる。そして、ダイアログがセンターチャネルに存在しない場合(例えば、サラウンドシステムがステレオコンテンツを再生する場合)、図1〜図3を参照して説明したように、二つのチャネルダイアログゲイン調節が適用される。
一部の実施例において、前記開示されたダイアログ増幅技術は、音声成分信号以外の信号を減少することで行われる。例えば、複数のチャネルオーディオ信号は、音声成分信号(例えば、ダイアログ信号)と他の成分信号(例えば、反響音)を含むことができる。前記他の成分信号は、複数のチャネルオーディオ信号の音像に含まれた音声成分信号の位置に基づいて変更され(例えば、減衰され)、音声成分信号は変化しない状態で残存しうる。
ダイアログ増幅システム
図4は、ダイアログ増幅システム400を例示するブロック図である。一部の実施例において、前記システム400は、分析フィルターバンク402、パワー推定器404、信号推定器406、ポストスケーリングモジュール408、信号合成モジュール410、及び合成フィルターバンク412を含む。ダイアログ増幅システム400の前記各成分402〜412は、分離されたプロセスとして表現されたが、二つまたはそれ以上の成分のプロセスが一つの成分に結合されることもある。
Figure 2010504008
ダイアログ増幅プロセス
図5は、ダイアログ増幅プロセス500を例示する順序図である。一部の実施例において、前記プロセス500は、複数のチャネルオーディオ信号を周波数サブバンド信号502に分解しながら開始される(502)。前記分解は、多相のフィルタバンク(polyphase filterbank)、QMF(quadrature mirror filterbank)、ハイブリッドフィルタバンク(hybrid filterbank)、DFT(discrete Fourier transform)及びMDCT(modified discrete cosine transform)を含むことができるが、これに限定されることなく、多様な公知の変換技術を用いてフィルタバンクによって行われる。
前記オーディオ信号の二つまたはそれ以上のチャネルのパワーの第1セットは、前記サブバンド信号を用いて推定される(504)。相互相関(cross―correlation)は、パワーの第1セットを用いて決定される(506)。分解ゲインファクタは、前記パワーの第1セットと前記相互相関を用いて推定される(508)。前記分解ゲインファクタは、音像においてダイアログソースのロケーションキューを提供する。音声成分信号及び背景音成分信号のパワーの第2セットは、前記パワーの第1セットと前記相互相関を用いて推定される(510)。音声及び背景音成分信号は、前記パワーの第2セットと前記分解ゲインファクタを用いて推定される(512)。前記推定された音声と背景音成分信号は後調節される(514)。サブバンド信号は、後調節された音声と背景音成分信号及び所定のダイアログゲインを用いて修正されたダイアログゲインと合成される(516)。前記所定のダイアログゲインは、自動的に設定されるか、使用者によって決定される。前記合成された各サブバンド信号は、例えば、合成フィルタバンクを用いて修正されたダイアログゲイン512を適用することで時間ドメインオーディオ信号に変換される。
背景音減衰のための出力標準化
Figure 2010504008
Figure 2010504008
Figure 2010504008
知覚的な品質を最大化するために、gnormが修正される。前記標準化は、周波数ドメインと時間ドメイン上で全て行われる。前記標準化が周波数ドメインで行われるとき、例えば、70Hz乃至8kHzのダイアログゲインが適用される周波数領域で前記標準化が行われる。
選択的に、これと類似した結果は、S(i,k)にゲインが適用されない間にN1(i,k)及びN2(i,k)を減衰することで達成される。このような概念を下記の方程式を通して説明した。
Figure 2010504008
モノ探索に基づく別個のダイアログボリューム利用
入力信号X1(i,k)及びX2(i,k)が実質的に類似している場合(例えば、入力信号がモノ類似信号で、入力信号のほぼ全ての部分がSと見なされる場合)、使用者が所定のダイアログゲインを入力すると、前記所定のダイアログゲインは、前記信号の全体ボリュームを増加させる。これを防止するために、前記入力信号の特性を観測可能な別個のダイアログボリューム(SDV)技術を用いることが使用者にとって好ましい。
数学式4において、前記ステレオ信号の標準化された相互相関が計算された。前記標準化された相互相関は、モノ信号探索で測定の基準として使用される。数学式4でファイ(phi)が与えられた臨界値を超える場合、前記入力信号はモノ信号と見なされ、分離されたダイアログボリュームは自動的にオフになる。これと対照的に、ファイが与えられた臨界値より小さい場合、前記入力信号はステレオ信号と見なされ、分離されたダイアログボリュームは自動的に動作する。前記ダイアログゲインは、下記の数学式26のように別個のダイアログボリュームでアルゴリズム的なスイッチとして動作することができる。
Figure 2010504008
Figure 2010504008
Figure 2010504008
Figure 2010504008
デジタルテレビジョンシステムの例
図6は、図1〜図5を参照して説明された機能とプロセスが行われる例示的なデジタルテレビジョンシステム600のブロック図である。デジタルテレビジョン(DTV)は、デジタル信号による動映像及び音を受信して放送する遠隔通信システムである。デジタルテレビジョンは、デジタル的に圧縮され、特別にデザインされたテレビセット、セットトップボックスが備わった標準受信機、またはテレビジョンカードが備わったPCによって復号化されることが要求されるデジタル変調データを使用する。図6のシステムがデジタルテレビジョンシステムに関するものであるが、前記ダイアログ増幅のために開示された実施例は、ダイアログ増幅が必要なアナログテレビジョンシステムまたはその他のシステムに適用される。
一部の実施例において、前記システム600は、インターフェース602、デモジュレータ604、デコーダ606、オーディオ/ビデオ出力部608、使用者入力インターフェース610、一つまたはそれ以上のプロセッサ612(例えば、Intel(登録商標) processors)、一つまたはそれ以上のコンピュータで判読可能な媒体614(例えば、RAM、ROM、SDRAM、ハードディスク、光ディスク、フラッシュメモリ、SANなど)を含むことができる。このような各要素は、一つまたはそれ以上の通信チャネル616(例えば、バス)と結合される。一部の実施例において、前記インターフェース602は、オーディオ信号または結合されたオーディオ/ビデオ信号を獲得するための多様な回路を含む。例えば、アナログテレビジョンシステムで、インターフェースは、アンテナ装置、チューナまたはミキサ、ラジオ周波数(RF)増幅器、ローカルオシレータ、IF(intermediate frequency)増幅器、一つまたはそれ以上のフィルタ、デモジュレータ、オーディオ増幅器などを含むことができる。これに付加または限定される構成要素を有する実施例を含むシステムの他の実施例が具現可能である。
前記チューナ602は、ビデオとオーディオコンテンツを含むデジタルテレビジョン信号を受信するデジタルテレビジョンチューナである。前記デモジュレータ604は、前記デジタルテレビジョン信号からビデオ及びオーディオ信号を抽出する。ビデオとオーディオ信号が符号化された場合(例えば、MPEG符号化)、前記デコーダ606は、その信号を復号化する。前記オーディオ/ビデオ出力はビデオを出力し、オーディオを再生可能な如何なる装置(例えば、テレビジョンディスプレイ、コンピュータモニター、LCD、スピーカ、オーディオ・システム)でも出力される。
一部の実施例において、ダイアログボリュームレベルは、例えば、リモコンのディスプレイ装置またはOSD(On Screen Display)を用いて前記使用者に出力される。前記ダイアログボリュームレベルは、主音量レベルと相対的な関係にある。一つまたはそれ以上の図式的な客体は、ダイアログボリュームレベルと主音量に対して相対的なダイアログボリュームレベルを出力するのに使用される。例えば、第1図式的な客体(例えば、バー形態)は、主音量を表すように出力され、第2図式的な客体(例えば、線形態)は、第1図式的な客体と一緒にまたは合成されてダイアログボリュームレベルを表すように出力される。
一部の実施例において、前記使用者入力インターフェースは、リモコンから生成された赤外線通信または無線通信信号を受信して復号化する回路素子(例えば、無線または赤外線通信受信機)及び/またはソフトウェアを含むことができる。リモコンは、分離されたダイアログボリューム調節キーまたはボタン、主音量調節キーまたはボタンの状態を転換する分離されたダイアログボリューム調節選択キーを含むことができる。したがって、前記主音量調節方法としては、主音量を調節するか、分離されたダイアログボリュームを調節する方法が選択的に使用される。一部の実施例において、前記ダイアログボリュームまたは主音量キーは、作動状態を表すために視覚的に変化される。
調節器と使用者インターフェースの例は、2007年9月14日に出願された、米国特許出願番号、"Dialogue Enhancement Technique(ダイアログ増幅技術)"、代理人管理番号19819−160001に開示されており、本特許は、全体が参照として本明細書に統合される。
一部の実施例において、前記一つまたはそれ以上のプロセッサは、図1〜図5を参照して示すように、前記特性と機能618,620,622,626,628,630及び632を行う前記コンピュータで判読可能な媒体614に保存されているコードを行うことができる。
前記コンピュータで判読可能な媒体は、運営体制618、分析/合成フィルタバンク620、パワー推定器622、信号推定器624、ポストスケーリングモジュール626及び信号合成器628をさらに含む。前記"コンピュータで判読可能な媒体"は、非揮発性媒体(例えば、光学または磁気ディスク)、揮発性媒体(例えば、メモリ)及び伝送媒体を含むが、これに限定されることなく、実行のためにプロセッサ612に命令を提供するっことに関係する何れの媒体を意味する。伝送媒体は、同軸ケーブル、銅線及び光繊維を含むが、これに限定されることはない。伝送媒体は、前記音響、光線またはラジオ周波数波動の形態を受信することができる。
前記運営体制618は、多重使用者(multi−user)、マルチプロセッシング、マルチタスキング、マルチスレッディング(multithreading)、実時間などが可能である。前記運営体制618は、前記使用者入力インターフェース610からの入力信号認識と、トラック維持、及びコンピュータで判読可能な媒体614(例えば、メモリまたは保存装置)でのファイルまたはディレクトリ管理と、周辺装置の制御と、前記一つまたはそれ以上の通信チャネル616の疎通管理とを含むが、これに限定されることなく、上記のような基本的な機能を行う。
上記のように説明された特性は、少なくとも一つ以上の入力装置と出力装置を有するデータ保存システムからデータ及び命令を受信し、データ及び命令を伝送する少なくとも一つ以上のプログラム化可能なプロセッサを含むプログラミングシステムで実行される一つまたはそれ以上のコンピュータプログラムで有利に行われる。コンピュータプログラムは、特定の行為を行うか、特定の結果をもたらすコンピュータで直接または間接的に使用される命令の集合である。コンピュータプログラムは、コンパイルまたは機械語(interpreted languages)を含む如何なるプログラミング言語(例えば、Objective−C、Java(登録商標))の形態でも書き込まれ、独立したプログラムのような形態、モジュール、成分及びサブルーチンの形態、またはコンピュータ環境下で使用者に適した他のユニットを含む如何なる形態にも構成される。
前記命令のプログラム遂行のための適正なプロセッサは、例えば、何らかの種類のコンピュータの一般的または特別な目的のマイクロプロセッサのみならず、単独プロセッサ、マルチプルプロセッサまたはコアを含む。一般的に、プロセッサは、ROM(read−only memory)、RAM(random access memory)またはこれら二つから命令及びデータを受信する。前記コンピュータの必須要素は、命令を行うプロセッサと、命令及びデータを保存するための一つまたはそれ以上のメモリである。一般的に、コンピュータは、データファイルを保存するための一つまたはそれ以上の大容量保存装置を含むか、通信して動作可能に連結される。このような保存装置は、内部ハードディスクとデータ削除可能なディスクのような磁気ディスク、磁気光ディスク及び光ディスクを含む。コンピュータプログラム命令及びデータを実体的に具体化するのに適した保存装置は、非揮発性メモリの全ての形態、例えば、EPROM、EEPROM、フラッシュメモリ装置のような半導体メモリ装置、内部ハードディスクとデータ削除可能なディスクのような磁気ディスク、磁気光ディスク及びCD−ROM、DVD−ROMディスクを含む。前記プロセッサとメモリは、ASICS(application−specific integrated circuits)によって、またはASICSと一体化して補強される。
使用者との相互作用を提供するために、前記特性は、前記使用者に情報を出力するCRT(cathode ray tube)またはLCD(liquid crystal display)モニタのようなディスプレイ装置と、使用者がコンピュータに命令を入力できるキーボード及びマウスまたはトラックボールのようなポインティング装置が備わったコンピュータで実行される。
前記各特性は、データサーバのようなバックエンドコンポーネント(back−end component)を含むか、アプリケーションサーバまたはインターネットサーバのようなミドルウェアーコンポーネントを含むか、図式的な使用者インターフェース、インターネットブラウザまたはこれらの結合を備えるクライアントコンピュータのようなフロントエンドコンポーネント(front−end component)を含むコンピュータシステムで実行される。前記システムの各成分は、通信ネットワークのようなデジタルデータ通信の何らかの形態または媒体と連結される。通信ネットワークとしてはLAN、WANなどを含み、前記コンピュータとネットワークはインターネットを構成する。
前記コンピュータシステムは、クライアントとサーバを含むことができる。クライアントとサーバは、一般的に互いに遠く離れており、概してネットワークを通して互いに通信する。前記クライアントとサーバの関係は、それぞれのコンピュータで動作し、互いにクライアントサーバ関係を有するコンピュータプログラムの影響によって生じる。
以上、多くの実施例が説明されたが、これに限定されず、多様な変形例が可能であることを理解すべきである。例えば、一つまたはそれ以上の実施例を構成する構成要素は、他の実施例を形成するために結合、省略、変形または追加される。他の例として、図面に描写された論理フローは、所望の結果を得るために示された特別な順序や順次的な順序が要求されない。さらに、説明されたフローで他の段階が追加または省略されることもあり、説明されたシステムで他の成分が追加または省略されることもある。したがって、他の実施例も、下記の請求項の権利範囲内に含まれる。

Claims (25)

  1. 音声成分信号と他の成分信号が含まれた複数のチャネルオーディオ信号を獲得し、
    オーディオ信号の音像内での前記音声成分信号の位置に基づいて前記音声成分信号を修正し、
    を有することを特徴とする方法。
  2. 前記修正する段階は、
    前記音声成分信号のスペクトル成分に基づいて前記音声成分信号を修正することをさらに有する請求項1に記載の方法。
  3. 前記修正する段階は、
    前記音像内の前記音声成分信号の位置を決定し、
    ゲインファクターを前記音声成分信号に適用すること、をさらに有する請求項1または2に記載の方法。
  4. 前記ゲインファクタは、前記音声成分信号の位置の関数で、前記音声成分信号に対するゲインである、請求項3に記載の方法。
  5. 前記関数は、前記ゲインファクタの方向的な感度と連関したゲイン領域を有する信号適応的ゲイン関数である、請求項4に記載の方法。
  6. 前記修正する段階は、
    時間ドメインまたは周波数ドメインで前記複数のチャネルオーディオ信号を標準化ファクタで標準化することをさらに有する請求項1乃至5の何れか1項に記載の方法。
  7. 前記オーディオ信号が実質的にモノであるかを決定し、
    前記オーディオ信号が実質的にモノでない場合、前記音声成分信号を自動的に修正することをさらに有する請求項1乃至6の何れか1項に記載の方法。
  8. 前記オーディオ信号が実質的にモノであるかを決定する段階は、
    前記オーディオ信号の二つ以上のチャネルの間の相互相関を決定し、
    一つ以上の臨界値を用いて前記相互相関を比較し、
    前記比較の結果に基づいて前記オーディオ信号が実質的にモノであるかを決定することをさらに有する請求項7に記載の方法。
  9. 前記修正する段階は、
    前記オーディオ信号を複数の周波数サブバンド信号に分解し、
    前記サブバンド信号を用いて前記複数のチャネルオーディオ信号の二つ以上のチャネルの第1パワーセットを推定し、
    前記第1パワーセットを用いて相互相関を決定し、
    前記第1パワーセットと前記相互相関を用いて分解ゲインファクタを推定することをさらに有する請求項1乃至8の何れか1項に記載の方法。
  10. 前記少なくとも一つのサブバンドのバンド幅は、人間聴覚システムの主要バンドと同一になるように選択される、請求項9に記載の方法。
  11. 前記第1パワーセットと前記相互相関から前記音声成分信号と背景音成分信号の第2パワーセットを推定することをさらに有する請求項8に記載の方法。
  12. 前記第2パワーセットと分解ゲインファクタを用いて前記音声成分信号及び前記背景音成分信号を推定することをさらに有する請求項11に記載の方法。
  13. 前記推定された音声及び背景音成分信号は、最小二乗推定を用いて決定される、請求項12に記載の方法。
  14. 前記相互相関は標準化される、請求項12に記載の方法。
  15. 前記推定された音声成分信号及び前記推定された背景音成分信号はポストスケールされる、請求項13または14に記載の方法。
  16. 前記第2パワーセットと使用者設定ゲインを用いてサブバンド信号を合成することをさらに有する請求項11乃至15の何れか1項に記載の方法。
  17. 前記合成されたサブバンド信号を前記使用者設定ゲインによって修正された音声成分信号を含む時間ドメインオーディオ信号に変換することをさらに有する請求項16に記載の方法。
  18. オーディオ信号を獲得し、
    前記オーディオ信号の第1成分信号の修正を表す使用者入力を獲得し、
    前記オーディオ信号の音像で前記第1成分信号の位置情報及び前記入力に基づいて前記第1成分信号を修正することを有することを特徴とする方法。
  19. 前記修正する段階は、
    ゲインファクタを前記第1成分信号に適用する段階をさらに有する請求項18に記載の方法。
  20. 前記ゲインファクタは、位置情報の関数で、前記第1成分信号に対するゲインである、請求項19に記載の方法。
  21. 前記関数は、前記ゲインファクタの方向的な感度と連関したゲイン領域を有する、請求項20に記載の方法。
  22. 前記修正する段階は、
    時間ドメインまたは周波数ドメインで前記オーディオ信号を標準化ファクタで標準化することをさらに有する請求項18乃至21の何れか1項に記載の方法。
  23. 前記修正する段階は、
    前記オーディオ信号を複数の周波数サブバンド信号に分解し、
    前記サブバンド信号を用いて前記オーディオ信号の二つ以上のチャネルの第1パワーセットを推定し、
    前記第1パワーセットを用いて相互相関を決定し、
    前記第1パワーセットと前記相互相関を用いて分解ゲインファクタを推定し、
    前記第1パワーセットと前記相互相関から前記第1成分信号及び第2成分信号の第2パワーセットを推定し、
    前記第2パワーセットと前記分解ゲインファクタを用いて前記第1成分信号と前記第2成分信号を推定し、
    前記推定された第1及び第2成分信号及び前記入力を用いてサブバンド信号を合成し、
    前記合成されたサブバンド信号を修正された第1成分信号を有する時間ドメインのオーディオ信号に変換すること、
    を有する請求項18乃至22の何れか1項に記載の方法。
  24. 音声成分信号及び他の成分信号を含む複数のチャネルオーディオ信号を獲得するように構成されるインターフェースと、
    前記インターフェースと連結され、前記オーディオ信号の音像で前記音声成分信号の位置に基づいて前記音声成分信号を修正するように構成されるプロセッサと、
    を有することを特徴とするシステム。
  25. 音声成分信号及び他の成分信号を含む複数のチャネルオーディオ信号を獲得し、
    前記複数のチャネルオーディオ信号の音像での前記音声成分信号の位置に基づいて前記他の成分信号を修正する、
    ことを有することを特徴とする方法。
JP2009527747A 2006-09-14 2007-09-14 ダイアログ増幅技術 Pending JP2010504008A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US84480606P 2006-09-14 2006-09-14
US88459407P 2007-01-11 2007-01-11
US94326807P 2007-06-11 2007-06-11
PCT/EP2007/008028 WO2008031611A1 (en) 2006-09-14 2007-09-14 Dialogue enhancement techniques

Publications (1)

Publication Number Publication Date
JP2010504008A true JP2010504008A (ja) 2010-02-04

Family

ID=38853226

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2009527925A Pending JP2010518655A (ja) 2006-09-14 2007-09-14 ダイアログ増幅技術
JP2009527920A Pending JP2010515290A (ja) 2006-09-14 2007-09-14 ダイアログエンハンスメント技術のコントローラ及びユーザインタフェース
JP2009527747A Pending JP2010504008A (ja) 2006-09-14 2007-09-14 ダイアログ増幅技術

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2009527925A Pending JP2010518655A (ja) 2006-09-14 2007-09-14 ダイアログ増幅技術
JP2009527920A Pending JP2010515290A (ja) 2006-09-14 2007-09-14 ダイアログエンハンスメント技術のコントローラ及びユーザインタフェース

Country Status (11)

Country Link
US (3) US8184834B2 (ja)
EP (3) EP2070391B1 (ja)
JP (3) JP2010518655A (ja)
KR (3) KR101137359B1 (ja)
AT (2) ATE487339T1 (ja)
AU (1) AU2007296933B2 (ja)
BR (1) BRPI0716521A2 (ja)
CA (1) CA2663124C (ja)
DE (1) DE602007010330D1 (ja)
MX (1) MX2009002779A (ja)
WO (3) WO2008031611A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013527727A (ja) * 2010-06-02 2013-06-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音響処理システム及び方法

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101137359B1 (ko) 2006-09-14 2012-04-25 엘지전자 주식회사 다이알로그 증폭 기술
SG189747A1 (en) * 2008-04-18 2013-05-31 Dolby Lab Licensing Corp Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience
WO2010013946A2 (en) * 2008-07-29 2010-02-04 Lg Electronics Inc. A method and an apparatus for processing an audio signal
JP4826625B2 (ja) 2008-12-04 2011-11-30 ソニー株式会社 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器
JP4844622B2 (ja) * 2008-12-05 2011-12-28 ソニー株式会社 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器、音響装置
JP5120288B2 (ja) 2009-02-16 2013-01-16 ソニー株式会社 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器
JP5564803B2 (ja) * 2009-03-06 2014-08-06 ソニー株式会社 音響機器及び音響処理方法
JP5577787B2 (ja) * 2009-05-14 2014-08-27 ヤマハ株式会社 信号処理装置
JP2010276733A (ja) * 2009-05-27 2010-12-09 Sony Corp 情報表示装置、情報表示方法および情報表示プログラム
WO2011039413A1 (en) * 2009-09-30 2011-04-07 Nokia Corporation An apparatus
EP2532178A1 (en) 2010-02-02 2012-12-12 Koninklijke Philips Electronics N.V. Spatial sound reproduction
TWI459828B (zh) * 2010-03-08 2014-11-01 Dolby Lab Licensing Corp 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
JP5736124B2 (ja) * 2010-05-18 2015-06-17 シャープ株式会社 音声信号処理装置、方法、プログラム、及び記録媒体
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
US8761410B1 (en) * 2010-08-12 2014-06-24 Audience, Inc. Systems and methods for multi-channel dereverberation
JP5581449B2 (ja) 2010-08-24 2014-08-27 ドルビー・インターナショナル・アーベー Fmステレオ無線受信機の断続的モノラル受信の隠蔽
US8611559B2 (en) * 2010-08-31 2013-12-17 Apple Inc. Dynamic adjustment of master and individual volume controls
US9620131B2 (en) 2011-04-08 2017-04-11 Evertz Microsystems Ltd. Systems and methods for adjusting audio levels in a plurality of audio signals
US20120308042A1 (en) * 2011-06-01 2012-12-06 Visteon Global Technologies, Inc. Subwoofer Volume Level Control
FR2976759B1 (fr) * 2011-06-16 2013-08-09 Jean Luc Haurais Procede de traitement d'un signal audio pour une restitution amelioree.
JP5591423B1 (ja) 2013-03-13 2014-09-17 パナソニック株式会社 オーディオ再生装置およびオーディオ再生方法
US9729992B1 (en) 2013-03-14 2017-08-08 Apple Inc. Front loudspeaker directivity for surround sound systems
CN104683933A (zh) * 2013-11-29 2015-06-03 杜比实验室特许公司 音频对象提取
EP2945303A1 (en) * 2014-05-16 2015-11-18 Thomson Licensing Method and apparatus for selecting or removing audio component types
WO2016038876A1 (ja) * 2014-09-08 2016-03-17 日本放送協会 符号化装置、復号化装置及び音声信号処理装置
BR112017006325B1 (pt) 2014-10-02 2023-12-26 Dolby International Ab Método de decodificação e decodificador para o realce de diálogo
CN107004427B (zh) 2014-12-12 2020-04-14 华为技术有限公司 增强多声道音频信号内语音分量的信号处理装置
AU2016219043A1 (en) * 2015-02-13 2017-09-28 Fideliquest Llc Digital audio supplementation
JP6436573B2 (ja) * 2015-03-27 2018-12-12 シャープ株式会社 受信装置、受信方法、及びプログラム
EP3313103B1 (en) * 2015-06-17 2020-07-01 Sony Corporation Transmission device, transmission method, reception device and reception method
US10251016B2 (en) 2015-10-28 2019-04-02 Dts, Inc. Dialog audio signal balancing in an object-based audio program
US10225657B2 (en) 2016-01-18 2019-03-05 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
CA3011694C (en) 2016-01-19 2019-04-02 Boomcloud 360, Inc. Audio enhancement for head-mounted speakers
EP3409029A1 (en) 2016-01-29 2018-12-05 Dolby Laboratories Licensing Corporation Binaural dialogue enhancement
GB2547459B (en) * 2016-02-19 2019-01-09 Imagination Tech Ltd Dynamic gain controller
US10375489B2 (en) * 2017-03-17 2019-08-06 Robert Newton Rountree, SR. Audio system with integral hearing test
US10258295B2 (en) 2017-05-09 2019-04-16 LifePod Solutions, Inc. Voice controlled assistance for monitoring adverse events of a user and/or coordinating emergency actions such as caregiver communication
US10313820B2 (en) 2017-07-11 2019-06-04 Boomcloud 360, Inc. Sub-band spatial audio enhancement
US11386913B2 (en) 2017-08-01 2022-07-12 Dolby Laboratories Licensing Corporation Audio object classification based on location metadata
US10511909B2 (en) 2017-11-29 2019-12-17 Boomcloud 360, Inc. Crosstalk cancellation for opposite-facing transaural loudspeaker systems
US10764704B2 (en) 2018-03-22 2020-09-01 Boomcloud 360, Inc. Multi-channel subband spatial processing for loudspeakers
CN108877787A (zh) * 2018-06-29 2018-11-23 北京智能管家科技有限公司 语音识别方法、装置、服务器及存储介质
US11335357B2 (en) * 2018-08-14 2022-05-17 Bose Corporation Playback enhancement in audio systems
FR3087606B1 (fr) * 2018-10-18 2020-12-04 Connected Labs Decodeur televisuel ameliore
JP7001639B2 (ja) * 2019-06-27 2022-01-19 マクセル株式会社 システム
US10841728B1 (en) 2019-10-10 2020-11-17 Boomcloud 360, Inc. Multi-channel crosstalk processing
CN115668372A (zh) * 2020-05-15 2023-01-31 杜比国际公司 用于在回放音频数据期间提高对话可理解性的方法和设备
US11288036B2 (en) 2020-06-03 2022-03-29 Microsoft Technology Licensing, Llc Adaptive modulation of audio content based on background noise
US11410655B1 (en) 2021-07-26 2022-08-09 LifePod Solutions, Inc. Systems and methods for managing voice environments and voice routines
US11404062B1 (en) 2021-07-26 2022-08-02 LifePod Solutions, Inc. Systems and methods for managing voice environments and voice routines
CN114023358B (zh) * 2021-11-26 2023-07-18 掌阅科技股份有限公司 对话小说的音频生成方法、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05292592A (ja) * 1992-04-10 1993-11-05 Toshiba Corp 音質補正装置
JPH06335093A (ja) * 1993-05-21 1994-12-02 Fujitsu Ten Ltd 音場拡大装置
JPH08222979A (ja) * 1995-02-13 1996-08-30 Sony Corp オーディオ信号処理装置、およびオーディオ信号処理方法、並びにテレビジョン受像機
JP2002078100A (ja) * 2000-09-05 2002-03-15 Nippon Telegr & Teleph Corp <Ntt> ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体
JP2002247699A (ja) * 2001-02-15 2002-08-30 Nippon Telegr & Teleph Corp <Ntt> ステレオ音響信号処理方法及び装置並びにプログラム及び記録媒体
JP2004343590A (ja) * 2003-05-19 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> ステレオ音響信号処理方法、装置、プログラムおよび記憶媒体
JP2005086462A (ja) * 2003-09-09 2005-03-31 Victor Co Of Japan Ltd オーディオ信号再生装置のボーカル音帯域強調回路

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL278131A (ja) * 1961-05-08 1900-01-01
GB1522599A (en) * 1974-11-16 1978-08-23 Dolby Laboratories Inc Centre channel derivation for stereophonic cinema sound
NL8200555A (nl) * 1982-02-13 1983-09-01 Rotterdamsche Droogdok Mij Spaninrichting.
US4897878A (en) * 1985-08-26 1990-01-30 Itt Corporation Noise compensation in speech recognition apparatus
JPH03118519A (ja) 1989-10-02 1991-05-21 Hitachi Ltd 液晶表示素子
JPH03118519U (ja) * 1990-03-20 1991-12-06
JPH03285500A (ja) 1990-03-31 1991-12-16 Mazda Motor Corp 音響装置
JPH04249484A (ja) 1991-02-06 1992-09-04 Hitachi Ltd テレビジョン受信機用音声回路
US5142403A (en) 1991-04-01 1992-08-25 Xerox Corporation ROS scanner incorporating cylindrical mirror in pre-polygon optics
JPH05183997A (ja) 1992-01-04 1993-07-23 Matsushita Electric Ind Co Ltd 効果音付加自動判別装置
JP2950037B2 (ja) 1992-08-19 1999-09-20 日本電気株式会社 前方3chマトリクス・サラウンド・プロセッサ
DE69423922T2 (de) 1993-01-27 2000-10-05 Koninkl Philips Electronics Nv Tonsignalverarbeitungsanordnung zur Ableitung eines Mittelkanalsignals und audiovisuelles Wiedergabesystem mit solcher Verarbeitungsanordnung
US5572591A (en) * 1993-03-09 1996-11-05 Matsushita Electric Industrial Co., Ltd. Sound field controller
JP3118519B2 (ja) 1993-12-27 2000-12-18 日本冶金工業株式会社 排気ガス浄化用メタルハニカム担体及びその製造方法
JPH07115606A (ja) 1993-10-19 1995-05-02 Sharp Corp 音声モード自動切替装置
US5737331A (en) * 1995-09-18 1998-04-07 Motorola, Inc. Method and apparatus for conveying audio signals using digital packets
KR100206333B1 (ko) * 1996-10-08 1999-07-01 윤종용 두개의 스피커를 이용한 멀티채널 오디오 재생장치및 방법
US5912976A (en) * 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US7085387B1 (en) 1996-11-20 2006-08-01 Metcalf Randall B Sound system and method for capturing and reproducing sounds originating from a plurality of sound sources
US7016501B1 (en) * 1997-02-07 2006-03-21 Bose Corporation Directional decoding
US6243476B1 (en) * 1997-06-18 2001-06-05 Massachusetts Institute Of Technology Method and apparatus for producing binaural audio for a moving listener
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6111755A (en) * 1998-03-10 2000-08-29 Park; Jae-Sung Graphic audio equalizer for personal computer system
JPH11289600A (ja) 1998-04-06 1999-10-19 Matsushita Electric Ind Co Ltd 音響装置
WO1999053721A1 (en) * 1998-04-14 1999-10-21 Hearing Enhancement Company, L.L.C. Improved hearing enhancement system and method
US6311155B1 (en) * 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
DE69942521D1 (de) * 1998-04-14 2010-08-05 Hearing Enhancement Co Llc Vom benutzer einstellbare lautstärkensteuerung zur höranpassung
US6990205B1 (en) * 1998-05-20 2006-01-24 Agere Systems, Inc. Apparatus and method for producing virtual acoustic sound
US6170087B1 (en) * 1998-08-25 2001-01-09 Garry A. Brannon Article storage for hats
JP2000115897A (ja) 1998-10-05 2000-04-21 Nippon Columbia Co Ltd 音響処理装置
GB2353926B (en) 1999-09-04 2003-10-29 Central Research Lab Ltd Method and apparatus for generating a second audio signal from a first audio signal
JP2001245237A (ja) 2000-02-28 2001-09-07 Victor Co Of Japan Ltd 放送受信装置
US6879864B1 (en) 2000-03-03 2005-04-12 Tektronix, Inc. Dual-bar audio level meter for digital audio with dynamic range control
JP4474806B2 (ja) 2000-07-21 2010-06-09 ソニー株式会社 入力装置、再生装置及び音量調整方法
US6813600B1 (en) 2000-09-07 2004-11-02 Lucent Technologies Inc. Preclassification of audio material in digital audio compression applications
US7010480B2 (en) * 2000-09-15 2006-03-07 Mindspeed Technologies, Inc. Controlling a weighting filter based on the spectral content of a speech signal
US6804565B2 (en) 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
EP1425738A2 (en) * 2001-09-12 2004-06-09 Bitwave Private Limited System and apparatus for speech communication and speech recognition
JP2003084790A (ja) 2001-09-17 2003-03-19 Matsushita Electric Ind Co Ltd 台詞成分強調装置
DE10242558A1 (de) * 2002-09-13 2004-04-01 Audi Ag Audiosystem insbesondere für ein Kraftfahrzeug
US20040131192A1 (en) 2002-09-30 2004-07-08 Metcalf Randall B. System and method for integral transference of acoustical events
JP4694763B2 (ja) * 2002-12-20 2011-06-08 パイオニア株式会社 ヘッドホン装置
US7076072B2 (en) * 2003-04-09 2006-07-11 Board Of Trustees For The University Of Illinois Systems and methods for interference-suppression with directional sensing patterns
US7307807B1 (en) * 2003-09-23 2007-12-11 Marvell International Ltd. Disk servo pattern writing
JP4317422B2 (ja) 2003-10-22 2009-08-19 クラリオン株式会社 電子機器、及び、その制御方法
JP4765289B2 (ja) * 2003-12-10 2011-09-07 ソニー株式会社 音響システムにおけるスピーカ装置の配置関係検出方法、音響システム、サーバ装置およびスピーカ装置
US20070211910A1 (en) 2004-04-06 2007-09-13 Naoki Kurihara Sound Volume Control Circuit, Semiconductor Integrated Circuit And Sound Source Device
KR20060003444A (ko) * 2004-07-06 2006-01-11 삼성전자주식회사 모바일 기기에서 크로스토크 제거 장치 및 방법
US7383179B2 (en) * 2004-09-28 2008-06-03 Clarity Technologies, Inc. Method of cascading noise reduction algorithms to avoid speech distortion
US7502112B2 (en) * 2004-12-23 2009-03-10 Brytech Inc. Colorimetric device and colour determination process
SG124306A1 (en) * 2005-01-20 2006-08-30 St Microelectronics Asia A system and method for expanding multi-speaker playback
JP2006222686A (ja) 2005-02-09 2006-08-24 Fujitsu Ten Ltd オーディオ装置
KR100608025B1 (ko) * 2005-03-03 2006-08-02 삼성전자주식회사 2채널 헤드폰용 입체 음향 생성 방법 및 장치
US8270620B2 (en) * 2005-12-16 2012-09-18 The Tc Group A/S Method of performing measurements by means of an audio system comprising passive loudspeakers
KR101137359B1 (ko) 2006-09-14 2012-04-25 엘지전자 주식회사 다이알로그 증폭 기술

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05292592A (ja) * 1992-04-10 1993-11-05 Toshiba Corp 音質補正装置
JPH06335093A (ja) * 1993-05-21 1994-12-02 Fujitsu Ten Ltd 音場拡大装置
JPH08222979A (ja) * 1995-02-13 1996-08-30 Sony Corp オーディオ信号処理装置、およびオーディオ信号処理方法、並びにテレビジョン受像機
JP2002078100A (ja) * 2000-09-05 2002-03-15 Nippon Telegr & Teleph Corp <Ntt> ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体
JP2002247699A (ja) * 2001-02-15 2002-08-30 Nippon Telegr & Teleph Corp <Ntt> ステレオ音響信号処理方法及び装置並びにプログラム及び記録媒体
JP2004343590A (ja) * 2003-05-19 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> ステレオ音響信号処理方法、装置、プログラムおよび記憶媒体
JP2005086462A (ja) * 2003-09-09 2005-03-31 Victor Co Of Japan Ltd オーディオ信号再生装置のボーカル音帯域強調回路

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013527727A (ja) * 2010-06-02 2013-06-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音響処理システム及び方法

Also Published As

Publication number Publication date
DE602007010330D1 (de) 2010-12-16
CA2663124A1 (en) 2008-03-20
WO2008035227A2 (en) 2008-03-27
KR20090053951A (ko) 2009-05-28
US20080165975A1 (en) 2008-07-10
WO2008035227A3 (en) 2008-08-07
EP2070389A1 (en) 2009-06-17
KR101061132B1 (ko) 2011-08-31
KR20090053950A (ko) 2009-05-28
JP2010515290A (ja) 2010-05-06
WO2008032209A2 (en) 2008-03-20
EP2070391A2 (en) 2009-06-17
EP2070391B1 (en) 2010-11-03
AU2007296933A1 (en) 2008-03-20
US8238560B2 (en) 2012-08-07
EP2070389B1 (en) 2011-05-18
ATE487339T1 (de) 2010-11-15
JP2010518655A (ja) 2010-05-27
BRPI0716521A2 (pt) 2013-09-24
KR101061415B1 (ko) 2011-09-01
ATE510421T1 (de) 2011-06-15
EP2064915A2 (en) 2009-06-03
KR101137359B1 (ko) 2012-04-25
AU2007296933B2 (en) 2011-09-22
EP2064915A4 (en) 2012-09-26
MX2009002779A (es) 2009-03-30
US20080167864A1 (en) 2008-07-10
EP2064915B1 (en) 2014-08-27
WO2008031611A1 (en) 2008-03-20
EP2070391A4 (en) 2009-11-11
WO2008032209A3 (en) 2008-07-24
CA2663124C (en) 2013-08-06
US20080165286A1 (en) 2008-07-10
US8184834B2 (en) 2012-05-22
US8275610B2 (en) 2012-09-25
KR20090074191A (ko) 2009-07-06

Similar Documents

Publication Publication Date Title
JP2010504008A (ja) ダイアログ増幅技術
US20200152210A1 (en) Determining the inter-channel time difference of a multi-channel audio signal
US10891963B2 (en) Decoder, encoder, and method for informed loudness estimation in object-based audio coding systems
CN101518100B (zh) 对话增强技术
JP6506764B2 (ja) ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整
EP2149877B1 (en) A method and an apparatus for processing an audio signal
JP6001814B1 (ja) ハイブリッドの波形符号化およびパラメトリック符号化発話向上
US20220060824A1 (en) An Audio Capturing Arrangement
EP2212883B1 (en) An encoder
RU2408164C1 (ru) Методы улучшения диалогов
Beack et al. An Efficient Time‐Frequency Representation for Parametric‐Based Audio Object Coding

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110412

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111004