JP2009540378A - 信号分離器、マイクロフォン信号に基づいて出力信号を決定するための方法、及び、コンピュータプログラム - Google Patents
信号分離器、マイクロフォン信号に基づいて出力信号を決定するための方法、及び、コンピュータプログラム Download PDFInfo
- Publication number
- JP2009540378A JP2009540378A JP2009514695A JP2009514695A JP2009540378A JP 2009540378 A JP2009540378 A JP 2009540378A JP 2009514695 A JP2009514695 A JP 2009514695A JP 2009514695 A JP2009514695 A JP 2009514695A JP 2009540378 A JP2009540378 A JP 2009540378A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- microphone
- partial
- source
- separator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004590 computer program Methods 0.000 title claims description 7
- 238000000034 method Methods 0.000 title abstract description 67
- 238000000926 separation method Methods 0.000 claims description 38
- 238000012545 processing Methods 0.000 claims description 37
- 238000012937 correction Methods 0.000 claims description 26
- 230000003595 spectral effect Effects 0.000 claims description 20
- 230000005236 sound signal Effects 0.000 claims description 14
- 230000008859 change Effects 0.000 claims description 11
- 230000003111 delayed effect Effects 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 11
- 230000002452 interceptive effect Effects 0.000 claims description 7
- 230000001934 delay Effects 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims 1
- 230000003044 adaptive effect Effects 0.000 description 36
- 238000001914 filtration Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 14
- 238000012546 transfer Methods 0.000 description 10
- 238000012805 post-processing Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 7
- 238000012880 independent component analysis Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000010363 phase shift Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Electrophonic Musical Instruments (AREA)
- Auxiliary Devices For Music (AREA)
Abstract
Description
1.BSSとは無関係にあらかじめ決められた擬似空間特性または空間特性(または伝達関数)でBSS出力信号に下流フィルタリングを施すことによって空間情報が生成される([非特許文献6]、[非特許文献7]、及び、[非特許文献8]参照)。例えば、国際公開第2004/006624 A1号パンフレット([非特許文献8]も参照)には、ヘッド関連伝達関数(HRTF)のデータベースから伝達関数すなわち空間パルス応答を選択する方法が示されている。
2.特定のBSS法では、BSSシステムの混合解除フィルタから空間情報を取り出すことができるように、ブラインドシステム識別を実施することが可能である([非特許文献9]、[非特許文献10]参照)。次に、識別された空間特性を用いてBSS出力信号に下流フィルタリングを施すことによって、空間情報を生成することが可能になる。
3.さらに、ブラインドシステム識別を実施しない方法の場合、BSSシステムの混合解除フィルタから空間情報を取り出すことが可能である。[非特許文献19]には、この情報が下流フィルタリングの一部として用いられる、従って空間特性を含む出力信号を生成する技法が示された。
4.もう1つの概念では、もとのセンサ信号が、後処理ブロック内で出力信号と共にマルチチャネルノイズ低減の処理を受ける([非特許文献5]参照)。
ブラインド音源分離(BSS)と同様に、マルチチャネルノイズ低減も特定の所望の信号(点音源または信号源)を改善する方法であるが、BSSとは対照的にそれぞれの干渉源の定常状態の仮定に基づくものである(例えば[非特許文献11]参照)。
例えば[非特許文献5]に示すように、前述のアプローチには、マルチチャネルノイズ低減システムの出力チャネルyp(n)を基準信号dp(n)として遅延マイクロフォン信号を含んでいるそれぞれの1チャネル適応フィルタに接続するステップが含まれる([非特許文献5]の図1参照)。適応時間離散フィルタがデジタル信号処理に広く用いられる技法の代表である([非特許文献12]参照)。既知の原理は、既知の入力信号を前提としてシステムの出力信号を基準信号に近似させるようにフィルタ係数を決定することにある([非特許文献12]参照)。[非特許文献5]による概念の場合、これは、特定の基準に基づいて(例えば平均二乗誤差に基づいて)誤差信号ep(n)=dp(n)−yp(n)を最小限に抑えることによって実現する。
A.Hyvarinen、J.Harhunen、及び、E.Oja、「Independent Componento Analysis」、ニューヨーク、Wiley & Sons、2001年 L.Prra及びC.Spence、「Convolutive Blind Source Separation of Non−stationary Sources」、IEEE Trans. Speech an Audio Processing、2000年5月、p.302−327 欧州特許第1070390 B1号:提出日が1999年4月8日で、1998年4月8日の優先権を主張する、2005年6月22日に公告された、特許カテゴリ(IPC)H03H 21/00の、「Convolutive Blind Source Separation Using a Multiple Decorrelation Method」と題するL.Parra及びC.Spenceの欧州特許第1070390 B1号明細書 H.Buchner、R.Aichner、及び、W.Kellerman、「Blind Source Separation for Convolutive Mixtures:A Unified Treatment」、Y.Huang、J.Benesty(編集者)、Audio Signal Processing、ボストン、Kluwer Academic Publishers、2004年 T.Hoya、T.Tanaka、A.Cichicki、T.Murakami、G.Hori、及び、J.Chambers、「Stereophonic Noise Reduction Using a Combined Sliding Subspace Projection an Adaptive Signal Enchancement」、IEEE Trans. Speech an Audio Processing、2005年5月、第13巻、第3号、p.309−320 J.Allen及びD.Berkley、「Image Method for Efficiently Simulating Small−Room Acoustics」、J.Acoust.Soc.Am.、1979年、p.943−950 J.Garas、「Adaptive 3D Sound Systems」、Kluwer Academic Publishers、2000年 提出日が2003年6月27日で、2002年7月2日の優先権を主張する、2004年1月15日に公告された、特許カテゴリ(IPC)H04S 1/00の、「Sound Source Spatialization System」と題する、E.Schaefferの国際公開第2004/006624 A1号パンフレット Herbert Buchner、Robert Aichner、及び、Walter Kellermann、「Relation between Blind system Identification and Convolutive Blind Source Separation」、Hands−free Speech Communication and Microphone Arrays Workshop、米国ニュージャージー州ピスカタウェイ、2005年 Herbert Buchner、Robert Aichner、Jochen Stenglein、Heinz Teutsch、及び、Walter Kellermann、「Simulataneous Localization of Multiple Sound Source using Blind Adaptive MIMO Filtering」、Proc.IEEE Int.Conf. on Acoustic,Speech,and Signal Processing(ICASSP)、米国フィラデルフィア、2005年3月 R.Martin、「Noise Power Spectral Density Estimation Based on Optimal Smoothing and Minimum Statistics」、IEEE Trans. Speech and Audio Processing、2001年7月、第9巻、第5号、p.504−512 S.Haykin、「Adaptive Filter Theory」、第4版、Prentice−Hall、2002年 T.Takatani、T.Nishikawa、H.Saruwatari、及び、K.Shikano、「High−Fidelity Blind Separetion of Acoustic Signals using SIMO−Model−Based ICA with Information−Geometric Learning」、Proc.Int.Workshop on Acoustic Echo and Noise Control(IWAENC)、日本、京都、2003年9月 K.Matuoka及びS.Nakshimam、「Minimum Distorsion Principle for Blind Source Separation」、Proc.Int.Conf.on Independent Component Analysis and Blind Signal Separation、米国、カリフォルニア州サンディエゴ、2001年12月 T.J.Klasen、M.Moonen、T.Van den Bogaert、及び、J.Wouters、「Preservation of Interaural time delay for binaural hearing aids through multi−channel Wiener filtering based noise reduction」、Proc.IEEE Int.Conf. on Acousitcs,Speech,and Signal Processing(ICASSP)、米国、フィラデルフィア、2005年3月 W.Herbordt、F.Nakamura、W.Kellermann、「Multi−channel estimation of power spectral density of noise for mixture of non−stationay signals」、IPSJ SIG Technical Report、日本、京都、2004年12月、第2004巻、第131号、p.211−216 W.Herbordt、T.Trini、W.Kellermann、「Robust spatial estimation of the signal−to−interference ratio for non−stationary mixtures」、Proc.Int. Workshop on Acoustic Echo and Noise Control、日本、京都、2003年9月、p.247−250 Herbet Buchner、Robert Aichner、W.Kellermann、「TRINICON:A Versatile Framework for Multichannel Blind Signal Processing」、Proc.IEEE Int.Conf.On Accoustics,Speech and Signal Processing(ICASSP)、カナダ、モントリオール、2004年5月、p.889−892 S.Ikeda、N.Murata、「A method of ICA in time−frequency domain」、Proc.Int.Symposium on Independent Component Analysis and Blind Signal Separation、フランス、Aussois、1999年1月、p.365−371
所望の点音源がチャネルy1内に位置する(すなわち、チャネルy1が基本的に所望の点音源のオーディオ成分を表わす)場合、第1のセレクタ410(セレクタ1)はチャネルy1をz1に接続する。二次条件(ブラインド信号分離器330の)のために、z1には、第1の音源320(音源1)から第1のセンサまたは音響センサまたはマイクロフォン(センサ1)への伝搬について表わす正確な伝達関数が既に含まれている。従って、z1はその結果として第2のセレクタ420(セレクタ2)から第1の出力(出力1)につなぐことが可能になる(従って、第1の出力信号a1を生成することになる)。
e1(n)=x1′(n)−y2′(n)
ここで、nは、例えばサンプルのまたは時間間隔のモーメントを表わしており、平均2乗誤差(すなわち、誤差信号epまたはe1の平均パワーまたはエネルギ)は、例えば時間及び/または周波数で平均することによって求めることが可能である。
技法Bの場合、BSSシステムに関連したまたはブラインドチャネル推定器に関連した二次条件は、必須ではなく任意である。従って、信号y1及びy2には、センサまたは音響センサまたはマイクロフォン(センサ1、センサ2)に対する2つの音源320、322(音源1、音源2)の伝達関数が含まれていると仮定することはできない。このため、技法Bの場合、第2のセレクタ420(セレクタ2)は、第1の出力信号a1として信号e1を第1の出力(出力a1)につなぎ、さらに、第2の出力信号a2として信号e2を第2の出力(出力a2)につなぐ(図4参照)。
120 有用信号源
130 音源分離器
136 遅延手段
140 差生成器
200 信号分離器
300 信号分離器
320 有用信号源
330 音源分離器
340 可調整フィルタ
350 可調整フィルタ
370 差生成器
382 遅延手段
400 信号分離器
700 信号分離器
740 音源分離器
746A 可調整フィルタ
746P 可調整フィルタ
Claims (25)
- 第1のマイクロフォン信号(x1)における有用信号源(120、320)のオーディオ成分を表わす第1の出力信号(a1)を決定し、第2のマイクロフォン信号(x2)における有用信号源のオーディオ成分を表わす第2の出力信号(a2)を決定するための信号分離器(100、200、400、700)であって、
室内に配置された複数の信号源からのオーディオ信号を受信して少なくとも2つの信号源のオーディオ成分を分離するため、室内に配置された2つの音響センサから前記2つのマイクロフォン信号を受信する音源分離器(130、330)を有し、
この音源分離器は、第1の信号源のオーディオ成分を表わす前記第1の出力信号に相当する第1の部分信号(y1)を得るように、また、第2の信号源のオーディオ成分を表わす第2の部分信号(y2)を得るように構成され、
前記音源分離器は、処理仕様のパラメータを調整して、前記第1のマイクロフォン信号に対する前記第1の部分信号の歪みが最大歪みより小さくなるように前記マイクロフォン信号から前記第1の部分信号を生成し、しかも、処理仕様のパラメータを調整して、前記第2のマイクロフォン信号に対する前記第2の部分信号の歪みが最大歪みより小さくなるように前記マイクロフォン信号から前記第2の部分信号を生成するように構成され、更に、
前記第2のマイクロフォン信号から前記第2の部分信号を除去して、第2の出力信号を得るための信号除去器(140、370)を有し、前記第2の部分信号を低減する、
信号分離器。 - 前記音源分離器(130、330)は、前記室内における信号源の空間位置に基づいてまたは信号源の統計的特性に基づいて少なくとも2つの信号源のオーディオ成分を分離するように構成されている、請求項1に記載の信号分離器。
- 前記音源分離器(130、330、500)は、前記第1のマイクロフォン信号(x1)に対する前記第1の部分信号(y1)の歪みの測度の関数として前記第1の部分信号を生成して、前記第1のマイクロフォン信号に対する前記第1の部分信号の歪みに対する上限を設定するように処理仕様のパラメータを決定すべく構成され、
前記音源分離器は、前記第2のマイクロフォン信号(x2)に対する前記第2の部分信号(y2)の歪みの測度の関数として前記第2の部分信号を生成して、前記第2のマイクロフォン信号に対する前記第2の部分信号の歪みに対する上限を設定するように処理仕様のパラメータを決定すべく構成されている、
請求項1または2に記載の信号分離器。 - 前記音源分離器(130、330)が、費用関数を使用している間に、最適化によって前記第1の部分信号(y1)及び前記第2の部分信号(y2)を生成するための処理仕様のパラメータを決定するように構成され、
前記費用関数には、前記部分信号間の統計的独立性の測度、前記第1のマイクロフォン信号(x1)と前記第1の部分信号の間の歪みの測度、及び、前記第2のマイクロフォン信号(x2)と前記第2の部分信号(y2)との間の歪みの測度が含まれ、
前記最適化は、前記部分信号のできるだけ大きい統計的独立性と、前記第1のマイクロフォン信号と前記第1の部分信号との間のできるだけ小さい歪みと、前記第2のマイクロフォン信号と前記第2の部分信号との間のできるだけ小さい歪みとの間の費用関数によって決まる妥協を実現するように意図されている、
請求項1〜3のいずれか一つに記載の信号分離器。 - 前記第1の部分信号と前記第2の部分信号との間の統計的独立性の測度は、カルバックライブラー距離、最大エントロピー、最小伝達情報量、及び/または、ネゲントロピーに基づく、請求項4に記載の信号分離器。
- 前記費用関数においては、部分信号(y1、y2)の確率密度関数の非ガウス条件、非白色度、及び/または、非定常条件が考慮される、請求項4または5に記載の信号分離器。
- 前記第1のマイクロフォン信号(x1)と前記第1の部分信号(y1)との間の歪みの測度が、前記第1のマイクロフォン信号(x1)の値と前記第1の部分信号(y1)の値との間の差の大きさまたはノルムであり、
前記第2のマイクロフォン信号(x2)と前記第2の部分信号(y2)との間の歪みの測度が、前記第2のマイクロフォン信号(x2)の値と前記第2の部分信号(y2)の値との間の差の大きさまたはノルムである、
請求項3〜6のいずれか一つに記載の信号分離器。 - 前記信号除去器は、前記第2のマイクロフォン信号(x2)を遅延させて、前記第2の部分信号(y2)を決定する処理時間を相殺し、遅延した第2のマイクロフォン信号(x2′)を得るための遅延手段(136、382)と、前記遅延した第2のマイクロフォン信号と前記第2の部分信号との差として前記第2の出力信号(a2)を決定するための差生成器(140、370)とが含まれる、請求項1〜7のいずれか一つに記載の信号分離器。
- 前記信号分離器は、複数のオーディオ周波数領域における複数の信号部分によって前記第1のマイクロフォン信号(x1)、前記第2のマイクロフォン信号(x2)、前記第1の部分信号(y1)、及び/または、前記第2の部分信号(y2)を表わすことで、あるスペクトル範囲内における分析に基づいて少なくとも2つの信号源のオーディオ成分を分離し、しかも、複数のオーディオ周波数領域における複数の信号部分に関して差を生じさせることによって、前記第2のマイクロフォン信号から前記第2の部分信号を除去するように構成されている、請求項1〜8のいずれか一つに記載の信号分離器。
- 前記第1の信号源が有用信号源をなす、請求項1〜9のいずれか一つに記載の信号分離器。
- 前記音源分離器は、2つの信号源の信号部分を分離して、2つの信号源のどちらが有用信号源であり、どちらが干渉信号源であるかを認識し、前記有用信号源のオーディオ成分を第1の部分信号として出力し、前記干渉信号源のオーディオ成分を第2の部分信号として出力するように構成されている、請求項1〜10のいずれか一つに記載の信号分離器。
- 第1のマイクロフォン信号における有用信号源(320)のオーディオ成分を表わす第1の出力信号(a1)を決定し、第2のマイクロフォン信号(x2)における有用信号源のオーディオ成分を表わす第2の出力信号(a2)を決定するための信号分離器(300、400、700)であって、
室内に配置された2つの音響センサから前記2つのマイクロフォン信号を受信することで室内に配置された信号源からのオーディオ信号を受信して、少なくとも2つの信号源のオーディオ成分を分離するための音源分離器(330、740)を有し、この音源分離器は、基本的に干渉信号源322のオーディオ成分を表わす、部分信号(y2)を得るように構成され、さらに、
前記部分信号を歪ませて、第1の歪み部分信号(y2′)を得、また、前記部分信号を歪ませて、第2の歪み部分信号(y2″)を得るための可調整フィルタ(340、350、746A、746P)と、
前記第1の出力信号(a1)をなす第1の補正マイクロフォン信号(e1)を得るため、前記第1のマイクロフォン信号から前記第1の歪み部分信号を除去し、前記第2の出力信号(a2)をなす第2の補正マイクロフォン信号(e2)を得るため、前記第2のマイクロフォン信号から前記第2の歪み部分信号を除去する信号除去器(360、370)と、
前記可調整フィルタのフィルタパラメータを調整して、前記第1の出力信号における前記干渉信号源のオーディオ成分を低減し、前記可調整フィルタのフィルタパラメータを調整して、前記第2の出力信号における前記干渉信号源のオーディオ成分を低減するパラメータ調整器とを有する、
信号分離器。 - 前記音源分離器(130、330)は、室内におけるそれらの空間位置に基づいてまたは統計的特性に基づいて少なくとも2つの信号源のオーディオ成分を分離するように構成されている、請求項12に記載の信号分離器。
- 前記音源分離器(130、330)は、費用関数を使用している間に、最適化によって前記第1の部分信号(y1)及び前記第2の部分信号(y2)を生成するための処理仕様のパラメータを決定するように設計され、前記費用関数には、前記部分信号間の統計的独立性の測度が含まれ、前記音源分離器は最適化によって、最適化前の状態に比較して、前記部分信号の統計的独立性を増加するように設計される、請求項12または13に記載の信号分離器。
- 前記第1の部分信号と前記第2の部分信号との間の統計的独立性の測度が、カルバックライブラー距離、最大エントロピー、最小伝達情報量、及び/または、ネゲントロピーに基づく、請求項14に記載の信号分離器。
- 前記費用関数においては、部分信号(y1、y2)の確率密度関数の非ガウス条件、非白色度、及び/または、非定常条件が考慮される、請求項12または13に記載の信号分離器。
- 前記パラメータ調整器は、前記第1の補正マイクロフォン信号におけるパワーと前記第2の補正マイクロフォン信号におけるパワーを決定し、前記第1の可調整フィルタ(340、350、746A、746P)のフィルタパラメータを変化させて、前記第1の補正マイクロフォン信号(e1)におけるパワーを低下させ、前記可調整フィルタのフィルタパラメータを変化させて、前記第2の補正マイクロフォン信号(e2)におけるパワーを低下させるように構成されている、請求項12〜16のいずれか一つに記載の信号分離器。
- 前記パラメータ調整器は、前記第1の補正マイクロフォン信号(e1)におけるパワーが最適化前の状態に対して低下するように、最適化によって前記可調整フィルタ(340、350、746A、746P)のフィルタパラメータを調整し、前記第2の補正マイクロフォン信号(e2)におけるパワーが最適化前の状態に対して低下するように、前記可調整フィルタのフィルタパラメータを調整するように構成されている、請求項12〜17のいずれか一つに記載の信号分離器。
- 前記パラメータ調整器は、少なくとも最低の有用信号強度を備えた有用信号源(320)からの有用信号が前記第1のマイクロフォン信号(x1)または前記第2のマイクロフォン信号(x2)に存在する場合にそれを認識し、少なくとも最低の有用信号強度を具備する有用信号が存在しない場合に限って前記可調整フィルタ(340、350、746A、746P)のフィルタパラメータを変更または最適化するように構成された有用信号検出器(390)を有する、請求項12〜18のいずれか一つに記載の信号分離器。
- 前記信号分離器は、複数のオーディオ周波数領域における複数の信号部分によって前記第1のマイクロフォン信号(x1)、前記第2のマイクロフォン信号(x2)、前記第1の部分信号(y1)、及び/または、前記第2の部分信号(y2)を表わすように構成され、あるスペクトル範囲内における分析に基づいて前記少なくとも2つの信号源(320、322)のオーディオ成分を分離するように構成され、前記可調整フィルタ(340、350、746A、746P)が前記部分信号のさまざまなスペクトル成分を個別に歪ませるように構成され、
前記信号除去器(360、370)は、さまざまなスペクトル成分を個別に処理することによって前記第1の補正マイクロフォン信号(e1)における前記干渉信号源のオーディオ成分を低減し、さまざまなスペクトル成分を個別に処理することによって前記第2の補正マイクロフォン信号(e2)における前記干渉信号源のオーディオ成分を低減するように構成されている、請求項12〜19のいずれか一つに記載の信号分離器。 - 前記第1の補正マイクロフォン信号(e1)が前記信号除去器の出力信号に相当する、請求項12〜20のいずれか一つに記載の信号分離器。
- 前記信号除去器は、前記第1のマイクロフォン信号(x1)または前記第1のマイクロフォン信号の全通過フィルタリングバージョン(x1′)から前記第1の歪み部分信号(y2′)を減算するように構成されている差生成器を有し、この差生成器によって生成される差分信号が、前記第1の補正マイクロフォン信号(e1)に相当し、さらに、前記差生成器は、前記第2のマイクロフォン信号(x2)または前記第2のマイクロフォン信号の全通過フィルタリングバージョン(x2′)から前記第2の歪み部分信号(y2″)を減算するように構成され、前記差生成器によって生成される差分信号が、前記第2の補正マイクロフォン信号(e2)に相当する、請求項12〜21のいずれか一つに記載の信号分離器。
- 第1のマイクロフォン信号(x1)における有用信号源のオーディオ成分を表わした第1の出力信号(a1)を決定し、第2のマイクロフォン信号(x2)における有用信号源のオーディオ成分を表わした第2の出力信号(a2)を決定する方法であって、
室内に配置された2つの音響センサから2つのマイクロフォン信号を受信して、前記室内に配置された信号源からのオーディオ信号を受信するステップ(810)と、
少なくとも2つの信号源のオーディオ成分を分離して、前記第1の信号源のオーディオ成分を表わした第1の部分信号(y1)と、前記第2の信号源のオーディオ成分を表わした第2の部分信号(y2)を得るステップ(810)と、
処理仕様のパラメータを調整して、前記第1のマイクロフォン信号に対する前記第1の部分信号の歪みが最大歪みより小さくなるように、前記マイクロフォン信号から前記第1の部分信号を生成するするステップ(820)と、
処理仕様のパラメータを調整して、前記第2のマイクロフォン信号に対する前記第2の部分信号の歪みが最大歪みより小さくなるように、前記マイクロフォン信号から前記第2の部分信号を生成するするステップ(830)と、
前記第2のマイクロフォン信号から前記第2の部分信号を除去して、前記第2の出力信号を得るステップ(840)とを有し、前記第2の部分信号が低減される、方法。 - 第1のマイクロフォン信号(x1)における有用信号源のオーディオ成分を表わした第1の出力信号(a1)を決定し、第2のマイクロフォン信号(x2)における有用信号源のオーディオ成分を表わした第2の出力信号(a2)を決定する方法であって、
室内に配置された2つの音響センサからの信号を表わす2つのマイクロフォン信号を受信して、前記室内に配置された信号源からのオーディオ信号を受信するステップ(910)と、
少なくとも2つの信号源のオーディオ成分を分離して、基本的に干渉信号源のオーディオ成分を表わした部分信号(y2)を得るステップと、
可調整フィルタで前記部分信号を歪ませて、第1の歪み部分信号(y2′)を得るステップ(930)と、
可調整フィルタで前記部分信号を歪ませて、第2の歪み部分信号(y2″)を得るステップ(940)と、
前記第1のマイクロフォン信号から前記第1の歪み部分信号を除去して、前記第1の出力信号をなす第1の補正マイクロフォン信号を得るステップ(940)と、
前記第2のマイクロフォン信号から前記第2の歪み部分信号を除去して、前記第2の出力信号をなす第2の補正マイクロフォン信号を得るステップ(950)と、
前記可調整フィルタのフィルタパラメータを調整して、前記第1の補正マイクロフォン信号における前記干渉信号源のオーディオ成分を低減させるステップ(960)と、
前記可調整フィルタのフィルタパラメータを調整して、前記第2の補正マイクロフォン信号における前記干渉信号源のオーディオ成分を低減させるステップ(970)が含まれている、方法。 - コンピュータで、請求項23または24に記載のステップを実行させるためのコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102006027673A DE102006027673A1 (de) | 2006-06-14 | 2006-06-14 | Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm |
PCT/EP2007/005182 WO2007144147A1 (en) | 2006-06-14 | 2007-06-12 | Signal separator, method for determining output signals on the basis of microphone signals, and computer program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009540378A true JP2009540378A (ja) | 2009-11-19 |
Family
ID=38353840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009514695A Pending JP2009540378A (ja) | 2006-06-14 | 2007-06-12 | 信号分離器、マイクロフォン信号に基づいて出力信号を決定するための方法、及び、コンピュータプログラム |
Country Status (9)
Country | Link |
---|---|
US (1) | US8090111B2 (ja) |
EP (1) | EP2027581B1 (ja) |
JP (1) | JP2009540378A (ja) |
CN (1) | CN101484938B (ja) |
AT (1) | ATE547788T1 (ja) |
AU (1) | AU2007260233B2 (ja) |
DE (1) | DE102006027673A1 (ja) |
DK (1) | DK2027581T3 (ja) |
WO (1) | WO2007144147A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012510090A (ja) * | 2008-11-25 | 2012-04-26 | クゥアルコム・インコーポレイテッド | 複数のオーディオ信号を使用して、周囲ノイズを抑制するための方法および装置 |
KR101737270B1 (ko) | 2016-04-25 | 2017-05-19 | 울산대학교 산학협력단 | 능동 방향성 이득 조정 가능한 양이 보청기 시스템 |
CN108053834A (zh) * | 2017-12-05 | 2018-05-18 | 北京声智科技有限公司 | 音频数据处理方法、装置、终端及系统 |
JP2023506354A (ja) * | 2019-10-04 | 2023-02-16 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ソース分離 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2009051132A1 (ja) * | 2007-10-19 | 2011-03-03 | 日本電気株式会社 | 信号処理システムと、その装置、方法及びそのプログラム |
US9064499B2 (en) * | 2009-02-13 | 2015-06-23 | Nec Corporation | Method for processing multichannel acoustic signal, system therefor, and program |
WO2010092913A1 (ja) * | 2009-02-13 | 2010-08-19 | 日本電気株式会社 | 多チャンネル音響信号処理方法、そのシステム及びプログラム |
DK2234415T3 (da) * | 2009-03-24 | 2012-02-13 | Siemens Medical Instr Pte Ltd | Fremgangsmåde og akustisk signalbearbejdningssystem til binaural støjreduktion |
US8787591B2 (en) * | 2009-09-11 | 2014-07-22 | Texas Instruments Incorporated | Method and system for interference suppression using blind source separation |
DE102009052992B3 (de) | 2009-11-12 | 2011-03-17 | Institut für Rundfunktechnik GmbH | Verfahren zum Abmischen von Mikrofonsignalen einer Tonaufnahme mit mehreren Mikrofonen |
JP5939161B2 (ja) * | 2011-01-13 | 2016-06-22 | 日本電気株式会社 | 音声処理装置及びその制御方法とその制御プログラム、情報処理システム |
TWI457789B (zh) * | 2012-05-30 | 2014-10-21 | Wistron Corp | 電子裝置和輸入指令方法 |
CN103236264B (zh) * | 2013-05-03 | 2015-07-29 | 湖北文理学院 | 一种用于声源分离的编解码方法 |
CA2925734C (en) * | 2013-10-18 | 2018-07-10 | Guillaume Fuchs | Coding of spectral coefficients of a spectrum of an audio signal |
WO2017108085A1 (en) * | 2015-12-21 | 2017-06-29 | Huawei Technologies Co., Ltd. | A signal processing apparatus and method |
CN107871510B (zh) * | 2017-07-07 | 2019-11-26 | 西南交通大学 | 一种零吸引变核宽度的最大熵回声消除方法 |
CN107369458B (zh) * | 2017-07-07 | 2019-09-24 | 西南交通大学 | 一种基于熵吸引的最大熵子带回声消除方法 |
CN107527622B (zh) * | 2017-07-07 | 2019-09-24 | 西南交通大学 | 一种基于最大熵的变步长符号子带回声消除方法 |
CN107578782B (zh) * | 2017-07-07 | 2019-09-24 | 西南交通大学 | 一种变核宽度的最大熵子带回声消除方法 |
CN107818793A (zh) * | 2017-11-07 | 2018-03-20 | 北京云知声信息技术有限公司 | 一种可减少无用语音识别的语音采集处理方法及装置 |
CN108198569B (zh) * | 2017-12-28 | 2021-07-16 | 北京搜狗科技发展有限公司 | 一种音频处理方法、装置、设备及可读存储介质 |
CN108597531B (zh) * | 2018-03-28 | 2021-05-28 | 南京大学 | 一种通过多声源活动检测来改进双通道盲信号分离的方法 |
WO2020152264A1 (en) * | 2019-01-23 | 2020-07-30 | Sony Corporation | Electronic device, method and computer program |
CN110310683B (zh) * | 2019-07-01 | 2021-07-06 | 科大讯飞股份有限公司 | 录音处理方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003099093A (ja) * | 2001-09-25 | 2003-04-04 | Nippon Telegr & Teleph Corp <Ntt> | 雑音抑圧方法及びその装置、雑音抑圧プログラム並びにそのプログラム記録媒体 |
JP2006100869A (ja) * | 2004-09-28 | 2006-04-13 | Sony Corp | 音声信号処理装置および音声信号処理方法 |
JP2007279517A (ja) * | 2006-04-10 | 2007-10-25 | Kobe Steel Ltd | 音源分離装置、音源分離装置用のプログラム及び音源分離方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL101556A (en) * | 1992-04-10 | 1996-08-04 | Univ Ramot | Multi-channel signal separation using cross-polyspectra |
US6130949A (en) * | 1996-09-18 | 2000-10-10 | Nippon Telegraph And Telephone Corporation | Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor |
US6167417A (en) | 1998-04-08 | 2000-12-26 | Sarnoff Corporation | Convolutive blind source separation using a multiple decorrelation method |
FR2842064B1 (fr) | 2002-07-02 | 2004-12-03 | Thales Sa | Systeme de spatialisation de sources sonores a performances ameliorees |
US7099821B2 (en) * | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
US8873768B2 (en) * | 2004-12-23 | 2014-10-28 | Motorola Mobility Llc | Method and apparatus for audio signal enhancement |
KR101178801B1 (ko) * | 2008-12-09 | 2012-08-31 | 한국전자통신연구원 | 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법 |
-
2006
- 2006-06-14 DE DE102006027673A patent/DE102006027673A1/de not_active Ceased
-
2007
- 2007-06-12 JP JP2009514695A patent/JP2009540378A/ja active Pending
- 2007-06-12 AU AU2007260233A patent/AU2007260233B2/en not_active Ceased
- 2007-06-12 EP EP07764622A patent/EP2027581B1/en not_active Not-in-force
- 2007-06-12 CN CN200780022297XA patent/CN101484938B/zh not_active Expired - Fee Related
- 2007-06-12 DK DK07764622.2T patent/DK2027581T3/da active
- 2007-06-12 AT AT07764622T patent/ATE547788T1/de active
- 2007-06-12 WO PCT/EP2007/005182 patent/WO2007144147A1/en active Application Filing
- 2007-06-12 US US12/308,284 patent/US8090111B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003099093A (ja) * | 2001-09-25 | 2003-04-04 | Nippon Telegr & Teleph Corp <Ntt> | 雑音抑圧方法及びその装置、雑音抑圧プログラム並びにそのプログラム記録媒体 |
JP2006100869A (ja) * | 2004-09-28 | 2006-04-13 | Sony Corp | 音声信号処理装置および音声信号処理方法 |
JP2007279517A (ja) * | 2006-04-10 | 2007-10-25 | Kobe Steel Ltd | 音源分離装置、音源分離装置用のプログラム及び音源分離方法 |
Non-Patent Citations (3)
Title |
---|
CSNG200600992215; 高谷 智哉 Tomoya Takatani: 'SIMOモデルに基づくICAを用いたブラインド音源分離 Blind Source Separation Using SIMO-Model-Bas' 日本音響学会2003年春季研究発表会講演論文集-I- THE 2003 SPRING MEETING OF THE ACOUSTICAL SOCI , 200303, 社団法人日本音響学会 * |
JPN6012004894; 高谷 智哉 Tomoya Takatani: 'SIMOモデルに基づくICAを用いたブラインド音源分離 Blind Source Separation Using SIMO-Model-Bas' 日本音響学会2003年春季研究発表会講演論文集-I- THE 2003 SPRING MEETING OF THE ACOUSTICAL SOCI , 200303, 社団法人日本音響学会 * |
JPN6012052233; 鵜飼訓史,猿渡洋,高谷智哉,鹿野清宏,向井良,澤田宏: '周波数領域ICAと時間領域ICAを統合したSIMOモデル信号のブラインド抽出法の評価' 電子情報通信学会技術研究報告 , 20040625, 電子情報通信学会 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012510090A (ja) * | 2008-11-25 | 2012-04-26 | クゥアルコム・インコーポレイテッド | 複数のオーディオ信号を使用して、周囲ノイズを抑制するための方法および装置 |
KR101737270B1 (ko) | 2016-04-25 | 2017-05-19 | 울산대학교 산학협력단 | 능동 방향성 이득 조정 가능한 양이 보청기 시스템 |
CN108053834A (zh) * | 2017-12-05 | 2018-05-18 | 北京声智科技有限公司 | 音频数据处理方法、装置、终端及系统 |
CN108053834B (zh) * | 2017-12-05 | 2020-02-21 | 北京声智科技有限公司 | 音频数据处理方法、装置、终端及系统 |
JP2023506354A (ja) * | 2019-10-04 | 2023-02-16 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ソース分離 |
JP7373253B2 (ja) | 2019-10-04 | 2023-11-02 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ソース分離 |
Also Published As
Publication number | Publication date |
---|---|
DK2027581T3 (da) | 2012-06-18 |
AU2007260233A1 (en) | 2007-12-21 |
CN101484938B (zh) | 2012-02-15 |
US20100232621A1 (en) | 2010-09-16 |
AU2007260233B2 (en) | 2011-09-15 |
EP2027581A1 (en) | 2009-02-25 |
EP2027581B1 (en) | 2012-02-29 |
DE102006027673A1 (de) | 2007-12-20 |
ATE547788T1 (de) | 2012-03-15 |
WO2007144147A1 (en) | 2007-12-21 |
CN101484938A (zh) | 2009-07-15 |
US8090111B2 (en) | 2012-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009540378A (ja) | 信号分離器、マイクロフォン信号に基づいて出力信号を決定するための方法、及び、コンピュータプログラム | |
US10891931B2 (en) | Single-channel, binaural and multi-channel dereverberation | |
US8538035B2 (en) | Multi-microphone robust noise suppression | |
US9558755B1 (en) | Noise suppression assisted automatic speech recognition | |
US8682006B1 (en) | Noise suppression based on null coherence | |
US8606571B1 (en) | Spatial selectivity noise reduction tradeoff for multi-microphone systems | |
US9966086B1 (en) | Signal rate synchronization for remote acoustic echo cancellation | |
US9343073B1 (en) | Robust noise suppression system in adverse echo conditions | |
CN111128210B (zh) | 具有声学回声消除的音频信号处理的方法和系统 | |
CN110931031A (zh) | 一种融合骨振动传感器和麦克风信号的深度学习语音提取和降噪方法 | |
US8761410B1 (en) | Systems and methods for multi-channel dereverberation | |
JP6870078B2 (ja) | 動的サウンド調整のための雑音推定 | |
EP3005362B1 (en) | Apparatus and method for improving a perception of a sound signal | |
US11647344B2 (en) | Hearing device with end-to-end neural network | |
JP2014502471A (ja) | 動的マイクロフォン信号ミキサ | |
US10798511B1 (en) | Processing of audio signals for spatial audio | |
JP6840302B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP2011203414A (ja) | 雑音及び残響抑圧装置及びその方法 | |
Aichner et al. | Multi-channel source separation preserving spatial information | |
Sathyapriyan et al. | Binaural beam-forming with dominant spatial cue preservation for hearing aids | |
CN112703749B (zh) | 用于运行机动车上音频输出装置的方法 | |
Hussain et al. | Novel sub-band adaptive systems incorporating Wiener filtering for binaural speech enhancement | |
CN117376753A (zh) | 多领麦会议系统麦克风自适应选择方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100129 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20111122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120207 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120508 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120514 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121009 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130402 |