JPWO2017064840A1 - 音源分離装置および音源分離方法 - Google Patents
音源分離装置および音源分離方法 Download PDFInfo
- Publication number
- JPWO2017064840A1 JPWO2017064840A1 JP2017545086A JP2017545086A JPWO2017064840A1 JP WO2017064840 A1 JPWO2017064840 A1 JP WO2017064840A1 JP 2017545086 A JP2017545086 A JP 2017545086A JP 2017545086 A JP2017545086 A JP 2017545086A JP WO2017064840 A1 JPWO2017064840 A1 JP WO2017064840A1
- Authority
- JP
- Japan
- Prior art keywords
- crosstalk
- signal
- microphone
- sound
- transfer function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000926 separation method Methods 0.000 title claims abstract description 207
- 230000005236 sound signal Effects 0.000 claims abstract description 141
- 230000006870 function Effects 0.000 claims description 324
- 238000000034 method Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 15
- 238000012880 independent component analysis Methods 0.000 claims description 8
- 238000012886 linear function Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 14
- 239000011159 matrix material Substances 0.000 description 12
- 230000008878 coupling Effects 0.000 description 10
- 238000010168 coupling process Methods 0.000 description 10
- 238000005859 coupling reaction Methods 0.000 description 10
- 230000005534 acoustic noise Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000000470 constituent Substances 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000002457 bidirectional effect Effects 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/02—Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
- H04R3/14—Cross-over networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
以下、図1及び図2を用いて、実施の形態1を説明する。
図1は、実施の形態1における音源分離装置20の適用例を示す図である。ここでは、音源分離装置20を車10における双方向の会話を拡声して補助する装置(車室内会話補助装置)に適用した例が示されている。
図2は、図1に示された音源分離装置20の構成を示すブロック図である。この音源分離装置20は、第1マイク21、第1スピーカ22、第2マイク23、第2スピーカ24、第1クロストークキャンセラ50、及び、第2クロストークキャンセラ70を備える。なお、音源分離装置20の各構成要素は、有線又は無線で接続されている。また、第1クロストークキャンセラ50、及び、第2クロストークキャンセラ70は、例えば、車10のヘッドユニットの一部として実装される。
第1クロストークキャンセラ50は、第2クロストークキャンセラ70の出力信号を用いて、第2話者12の音声が第1マイク21に入力される第1クロストーク32の程度を示す第1妨害信号を推定して算出し、算出した第1妨害信号を、第1マイク21の出力信号から除去し、除去後の信号を第1スピーカ22に出力する。第1クロストークキャンセラ50は、本実施の形態では、デジタル音声データを時間軸領域で処理するデジタル信号処理回路である。
第2クロストークキャンセラ70は、第1クロストークキャンセラ50の出力信号を用いて、第1話者11の音声が第2マイク23に入力される第2クロストーク35の程度を示す第2妨害信号を推定して算出し、算出した第2妨害信号を、第2マイク23の出力信号から除去し、除去後の信号を第2スピーカ24に出力する。第2クロストークキャンセラ70は、本実施の形態では、デジタル音声データを時間軸領域で処理するデジタル信号処理回路である。
以上のように構成された本実施の形態における音源分離装置20では、第1話者の音声36及び第2話者の音声37は、次のように処理される。
以上のように、本実施の形態における音源分離装置20は、第1マイク21及び第1クロストークキャンセラ50を備える。そして、音源分離装置20では、第2話者12の同一時刻における音声について、信号が第1クロストークキャンセラ50に入力される時刻は、第2話者12の音声が第1マイク21に入力される時刻と同一、又は、より早くなるように、設計されている。よって、第1クロストークキャンセラ50は、第2話者12の音声が第1マイク21に入力される第1クロストーク32を推定して、第1マイク21の出力信号から除去する。
上記実施の形態では、第1伝達関数更新回路55は、上記式3に従って伝達関数を更新したが、以下の式7又は式8に示されるように、正規化された式に従って伝達関数を更新してもよい。
次に、実施の形態2における音源分離装置について説明する。本実施の形態における音源分離装置は、実施の形態1における音源分離装置と同様に、第1話者と第2話者による双方向の会話を拡声して補助する装置に適用される。ただし、実施の形態1における第1クロストーク32及び第2クロストーク35に加えて、第2スピーカ24から出力される第2話者12の音声が第1マイク21に入力される間接第1クロストーク32a、及び、第1スピーカ22から出力される第1話者11の音声が第2マイク23に入力される間接第2クロストーク35aが無視できない程度に音響結合が大きい場合に、好適な装置である。
図3は、実施の形態2における音源分離装置20aの構成を示すブロック図である。この音源分離装置20aの構成は、実施の形態1における音源分離装置20の構成と実質的に同等である。以下、実施の形態1と同じ構成要素については、実施の形態1と同じ符号を付し、その説明を省略する。
以上のように構成された本実施の形態における音源分離装置20aでは、第1話者の音声36及び第2話者の音声37は、次のように処理される。
本実施の形態における音源分離装置20aは、実施の形態1における音源分離装置20が有する第1クロストーク32及び第2クロストーク35の除去機能に追加して、間接第1クロストーク32a及び間接第2クロストーク35aの除去機能を有する。そのため、実施の形態1と同様、従来の分離行列を用いない比較的小規模なハードウェアにより、間接第1クロストーク32a及び間接第2クロストーク35aをも除去することができる。間接第1クロストーク32aの除去機能は、第1マイク21と第2スピーカ24とが間接第1クロストーク32aが無視できない程度に音響結合が大きい環境に設置されている場合に必要となり、間接第2クロストーク35aの除去機能は、第2マイク23と第1スピーカ22とが間接第2クロストーク35aが無視できない程度に音響結合が大きい環境に設置されている場合に必要となる。
次に、実施の形態3における音源分離装置について説明する。本実施の形態における音源分離装置は、実施の形態1における音源分離装置と比べて、第1話者及び第2話者に加えて第3話者が参加する会話を拡声して補助する場合に、個々の話者の音声を分離するために好適な装置である。
図4は、実施の形態3における音源分離装置20bの構成を示すブロック図である。この音源分離装置20bは、実施の形態1における音源分離装置20に、第3マイク25、第3スピーカ26、第3クロストークキャンセラ80、第4クロストークキャンセラ150、第5クロストークキャンセラ170、及び第6クロストークキャンセラ180を追加して構成される。第1マイク21、第2マイク23、第1スピーカ22、第2スピーカ24、第1クロストークキャンセラ50、及び第2クロストークキャンセラ70は、実施の形態1における音源分離装置20の対応する構成要素と実質的に同等である。以下、実施の形態1と同じ構成要素については、実施の形態1と同じ符号を付し、その説明を省略する。
以上のように構成された本実施の形態における音源分離装置20bでは、第1話者の音声36、第2話者の音声37、及び第3話者の音声38は、次のように処理される。
本実施の形態における音源分離装置20bは、実施の形態1における音源分離装置20が有する第1クロストーク32及び第2クロストーク35の除去機能に追加して、第1話者11及び第2話者12に加えて第3話者13が会話に参加する場合に必要となる、第3クロストーク131、第4クロストーク132、第5クロストーク133、及び第6クロストーク134の除去機能を有する。そのため、実施の形態1と同様、比較的小規模なハードウェアにより、第1クロストーク32及び第2クロストーク35に加えて、第3クロストーク131、第4クロストーク132、第5クロストーク133、及び第6クロストーク134をも除去することができる。
以上のように、本出願において開示する技術の例示として、実施の形態1〜3及び変形例を説明した。しかしながら、本開示における技術は、これらに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、上記実施の形態1〜3及び変形例で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。そこで、以下、他の実施の形態を例示する。
11 第1話者
12 第2話者
13 第3話者
20,20a,20b 音源分離装置
21 第1マイク
22 第1スピーカ
23 第2マイク
24 第2スピーカ
25 第3マイク
26 第3スピーカ
32 第1クロストーク
32a 間接第1クロストーク
35 第2クロストーク
35a 間接第2クロストーク
36 第1話者の音声
37 第2話者の音声
38 第3話者の音声
50 第1クロストークキャンセラ
51 第1減算器
52 第1記憶回路
53 第1畳み込み演算器
54 第1伝達関数記憶回路
55 第1伝達関数更新回路
70 第2クロストークキャンセラ
71 第2減算器
72 第2記憶回路
73 第2畳み込み演算器
74 第2伝達関数記憶回路
75 第2伝達関数更新回路
80 第3クロストークキャンセラ
81 第3減算器
82 第3記憶回路
83 第3畳み込み演算器
84 第3伝達関数記憶回路
85 第3伝達関数更新回路
131 第3クロストーク
132 第4クロストーク
133 第5クロストーク
134 第6クロストーク
150 第4クロストークキャンセラ
151 第4減算器
152 第4記憶回路
153 第4畳み込み演算器
154 第4伝達関数記憶回路
155 第4伝達関数更新回路
170 第5クロストークキャンセラ
171 第5減算器
172 第5記憶回路
173 第5畳み込み演算器
174 第5伝達関数記憶回路
175 第5伝達関数更新回路
180 第6クロストークキャンセラ
181 第6減算器
182 第6記憶回路
183 第6畳み込み演算器
184 第6伝達関数記憶回路
185 第6伝達関数更新回路
以下、図1及び図2を用いて、実施の形態1を説明する。
図1は、実施の形態1における音源分離装置20の適用例を示す図である。ここでは、音源分離装置20を車10における双方向の会話を拡声して補助する装置(車室内会話補助装置)に適用した例が示されている。
図2は、図1に示された音源分離装置20の構成を示すブロック図である。この音源分離装置20は、第1マイク21、第1スピーカ22、第2マイク23、第2スピーカ24、第1クロストークキャンセラ50、及び、第2クロストークキャンセラ70を備える。なお、音源分離装置20の各構成要素は、有線又は無線で接続されている。また、第1クロストークキャンセラ50、及び、第2クロストークキャンセラ70は、例えば、車10のヘッドユニットの一部として実装される。
第1クロストークキャンセラ50は、第2クロストークキャンセラ70の出力信号を用いて、第2話者12の音声が第1マイク21に入力される第1クロストーク32の程度を示す第1妨害信号を推定して算出する。第1クロストークキャンセラ50は、算出した第1妨害信号を、第1マイク21の出力信号から除去し、除去後の信号を第1スピーカ22に出力する。第1クロストークキャンセラ50は、本実施の形態では、デジタル音声データを時間軸領域で処理するデジタル信号処理回路である。
第2クロストークキャンセラ70は、第1クロストークキャンセラ50の出力信号を用いて、第1話者11の音声が第2マイク23に入力される第2クロストーク35の程度を示す第2妨害信号を推定して算出する。さらに、算出した第2妨害信号を、第2マイク23の出力信号から除去し、除去後の信号を第2スピーカ24に出力する。第2クロストークキャンセラ70は、本実施の形態では、デジタル音声データを時間軸領域で処理するデジタル信号処理回路である。
以上のように構成された本実施の形態における音源分離装置20では、第1話者11の音声36及び第2話者12の音声37は、次のように処理される。
以上のように、本実施の形態における音源分離装置20は、第1マイク21及び第1クロストークキャンセラ50を備える。そして、音源分離装置20では、第2話者12の同一時刻における音声について、信号が第1クロストークキャンセラ50に入力される時刻は、第2話者12の音声が第1マイク21に入力される時刻と同一、又は、より早くなるように、設計されている。よって、第1クロストークキャンセラ50は、第2話者12の音声が第1マイク21に入力される第1クロストーク32を推定して、第1マイク21の出力信号から除去する。
上記実施の形態では、第1伝達関数更新回路55は、上記式3に従って伝達関数を更新したが、以下の式7又は式8に示されるように、正規化された式に従って伝達関数を更新してもよい。
次に、実施の形態2における音源分離装置について説明する。本実施の形態における音源分離装置は、実施の形態1における音源分離装置と同様に、第1話者11と第2話者12による双方向の会話を拡声して補助する装置に適用される。ただし、実施の形態1における第1クロストーク32及び第2クロストーク35に加えて、第2スピーカ24から出力される第2話者12の音声が第1マイク21に入力される間接第1クロストーク32a、及び、第1スピーカ22から出力される第1話者11の音声が第2マイク23に入力される間接第2クロストーク35aが無視できない程度に音響結合が大きい場合に、好適な装置である。
図3は、実施の形態2における音源分離装置20aの構成を示すブロック図である。この音源分離装置20aの構成は、実施の形態1における音源分離装置20の構成と実質的に同等である。以下、実施の形態1と同じ構成要素については、実施の形態1と同じ符号を付し、その説明を省略する。
以上のように構成された本実施の形態における音源分離装置20aでは、第1話者11の音声36及び第2話者12の音声37は、次のように処理される。
本実施の形態における音源分離装置20aは、実施の形態1における音源分離装置20が有する第1クロストーク32及び第2クロストーク35の除去機能に追加して、間接第1クロストーク32a及び間接第2クロストーク35aの除去機能を有する。そのため、実施の形態1と同様、従来の分離行列を用いない比較的小規模なハードウェアにより、間接第1クロストーク32a及び間接第2クロストーク35aをも除去することができる。間接第1クロストーク32aの除去機能は、第1マイク21と第2スピーカ24とが間接第1クロストーク32aが無視できない程度に音響結合が大きい環境に設置されている場合に必要となる。また、間接第2クロストーク35aの除去機能は、第2マイク23と第1スピーカ22とが間接第2クロストーク35aが無視できない程度に音響結合が大きい環境に設置されている場合に必要となる。
次に、実施の形態3における音源分離装置について説明する。本実施の形態における音源分離装置は、実施の形態1における音源分離装置と比べて、第1話者11及び第2話者12に加えて第3話者13が参加する会話を拡声して補助する場合に、個々の話者の音声を分離するために好適な装置である。
図4は、実施の形態3における音源分離装置20bの構成を示すブロック図である。この音源分離装置20bは、実施の形態1における音源分離装置20に、第3マイク25、第3スピーカ26、第3クロストークキャンセラ80、第4クロストークキャンセラ150、第5クロストークキャンセラ170、及び第6クロストークキャンセラ180を追加して構成される。第1マイク21、第2マイク23、第1スピーカ22、第2スピーカ24、第1クロストークキャンセラ50、及び第2クロストークキャンセラ70は、実施の形態1における音源分離装置20の対応する構成要素と実質的に同等である。以下、実施の形態1と同じ構成要素については、実施の形態1と同じ符号を付し、その説明を省略する。
以上のように構成された本実施の形態における音源分離装置20bでは、第1話者11の音声36、第2話者12の音声37、及び第3話者13の音声38は、次のように処理される。
本実施の形態における音源分離装置20bは、実施の形態1における音源分離装置20が有する第1クロストーク32及び第2クロストーク35の除去機能に追加して、第1話者11及び第2話者12に加えて第3話者13が会話に参加する場合に必要となる、第3クロストーク131、第4クロストーク132、第5クロストーク133、及び第6クロストーク134の除去機能を有する。そのため、実施の形態1と同様、比較的小規模なハードウェアにより、第1クロストーク32及び第2クロストーク35に加えて、第3クロストーク131、第4クロストーク132、第5クロストーク133、及び第6クロストーク134をも除去することができる。
以上のように、本出願において開示する技術の例示として、実施の形態1〜3及び変形例を説明した。しかしながら、本開示における技術は、これらに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、上記実施の形態1〜3及び変形例で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。そこで、以下、他の実施の形態を例示する。
11 第1話者
12 第2話者
13 第3話者
20,20a,20b 音源分離装置
21 第1マイク
22 第1スピーカ
23 第2マイク
24 第2スピーカ
25 第3マイク
26 第3スピーカ
32 第1クロストーク
32a 間接第1クロストーク
35 第2クロストーク
35a 間接第2クロストーク
36 第1話者の音声
37 第2話者の音声
38 第3話者の音声
50 第1クロストークキャンセラ
51 第1減算器
52 第1記憶回路
53 第1畳み込み演算器
54 第1伝達関数記憶回路
55 第1伝達関数更新回路
70 第2クロストークキャンセラ
71 第2減算器
72 第2記憶回路
73 第2畳み込み演算器
74 第2伝達関数記憶回路
75 第2伝達関数更新回路
80 第3クロストークキャンセラ
81 第3減算器
82 第3記憶回路
83 第3畳み込み演算器
84 第3伝達関数記憶回路
85 第3伝達関数更新回路
131 第3クロストーク
132 第4クロストーク
133 第5クロストーク
134 第6クロストーク
150 第4クロストークキャンセラ
151 第4減算器
152 第4記憶回路
153 第4畳み込み演算器
154 第4伝達関数記憶回路
155 第4伝達関数更新回路
170 第5クロストークキャンセラ
171 第5減算器
172 第5記憶回路
173 第5畳み込み演算器
174 第5伝達関数記憶回路
175 第5伝達関数更新回路
180 第6クロストークキャンセラ
181 第6減算器
182 第6記憶回路
183 第6畳み込み演算器
184 第6伝達関数記憶回路
185 第6伝達関数更新回路
Claims (9)
- 第1音声を入力するための第1マイクと、
第2音声を入力するための第2マイクと、
前記第1マイクの音声信号から、前記第2音声が前記第1マイクに入力される第1クロストークを除去する第1クロストークキャンセラと、
前記第2マイクの音声信号から、前記第1音声が前記第2マイクに入力される第2クロストークを除去する第2クロストークキャンセラと、を備え、
前記第1クロストークキャンセラは、前記第2マイクの前記音声信号から前記第2クロストークが除去された音声信号を用いて、前記第1クロストークの程度を示す第1妨害信号を推定して算出し、算出した前記第1妨害信号を、前記第1マイクの前記音声信号から除去し、
前記第2クロストークキャンセラは、前記第1マイクの前記音声信号から前記第1クロストークが除去された音声信号を用いて、前記第2クロストークの程度を示す第2妨害信号を推定して算出し、算出した前記第2妨害信号を、前記第2マイクの前記音声信号から除去する、
音源分離装置。 - 同一時刻における前記第2音声について、前記第2マイクの前記音声信号が前記第1クロストークキャンセラに入力される時刻は、前記第2音声が前記第1マイクに入力される時刻と同一、又は、より早く、
同一時刻における前記第1音声について、前記第1マイクの前記音声信号が前記第2クロストークキャンセラに入力される時刻は、前記第1音声が前記第2マイクに入力される時刻と同一、又は、より早い、
請求項1記載の音源分離装置。 - さらに、
前記第1音声を出力するための第1スピーカと、
前記第2音声を出力するための第2スピーカと、を備え、
前記第1クロストークキャンセラは、さらに、前記第2スピーカから出力された前記第2音声が前記第1マイクに入力される間接第1クロストークを除去し、前記第1妨害信号は、前記第1クロストーク、及び、前記間接第1クロストークの程度を示し、
前記第2クロストークキャンセラは、さらに、前記第1スピーカから出力された前記第1音声が前記第2マイクに入力される間接第2クロストークを除去し、前記第2妨害信号は、前記第2クロストーク、及び、前記間接第2クロストークの程度を示す、
請求項2記載の音源分離装置。 - 前記第1クロストークキャンセラは、
前記第1クロストークの伝達関数として推定された前記伝達関数を記憶する第1伝達関数記憶回路と、
前記第2クロストークキャンセラの前記出力信号を記憶する第1記憶回路と、
前記第1記憶回路に記憶された前記出力信号と前記第1伝達関数記憶回路に記憶された前記伝達関数とを畳み込むことで前記第1妨害信号を生成する第1畳み込み演算器と、
前記第1マイクの前記出力信号から、前記第1畳み込み演算器から出力された前記第1妨害信号を除去し、当該第1クロストークキャンセラの前記出力信号として出力する第1減算器と、
前記第1減算器の前記出力信号と前記第1記憶回路に記憶された前記出力信号とに基づいて前記第1伝達関数記憶回路に記憶された前記伝達関数を更新する第1伝達関数更新回路と、を有し、
前記第2クロストークキャンセラは、
前記第2クロストークの伝達関数として推定された前記伝達関数を記憶する第2伝達関数記憶回路と、
前記第1クロストークキャンセラの前記出力信号を記憶する第2記憶回路と、
前記第2記憶回路に記憶された前記出力信号と前記第2伝達関数記憶回路に記憶された前記伝達関数とを畳み込むことで前記第2妨害信号を生成する第2畳み込み演算器と、
前記第2マイクの前記出力信号から、前記第2畳み込み演算器から出力された前記第2妨害信号を除去し、当該第2クロストークキャンセラの前記出力信号として出力する第2減算器と、
前記第2減算器の前記出力信号と前記第2記憶回路に記憶された前記出力信号とに基づいて前記第2伝達関数記憶回路に記憶された前記伝達関数を更新する第2伝達関数更新回路と、を有する、
請求項1記載の音源分離装置。 - 前記第1伝達関数更新回路は、独立成分分析を用いて、前記第1減算器の前記出力信号と前記第1記憶回路に記憶された前記出力信号とに基づいて、前記第1減算器の前記出力信号と前記第1記憶回路に記憶された前記出力信号とが相互に独立となるように、前記第1伝達関数記憶回路に記憶された前記伝達関数を更新し、
前記第2伝達関数更新回路は、独立成分分析を用いて、前記第2減算器の前記出力信号と前記第2記憶回路に記憶された前記出力信号とに基づいて、前記第2減算器の前記出力信号と前記第2記憶回路に記憶された前記出力信号とが相互に独立となるように、前記第2伝達関数記憶回路に記憶された前記伝達関数を更新する、
請求項4記載の音源分離装置。 - 前記第1伝達関数更新回路は、前記第1減算器の前記出力信号に対して非線形関数を用いた非線形処理を施し、得られた結果に対して前記第1記憶回路に記憶された前記出力信号と、前記第1クロストークの前記伝達関数の推定における学習速度を制御するための第1ステップサイズパラメータとを乗じることで第1更新係数を算出し、算出した前記第1更新係数を前記第1伝達関数記憶回路に記憶された前記伝達関数に加算することで更新を行い、
前記第2伝達関数更新回路は、前記第2減算器の前記出力信号に対して非線形関数を用いた非線形処理を施し、得られた結果に対して前記第2記憶回路に記憶された前記出力信号と、前記第2クロストークの前記伝達関数の推定における学習速度を制御するための第2ステップサイズパラメータとを乗じることで第2更新係数を算出し、算出した前記第2更新係数を前記第2伝達関数記憶回路に記憶された前記伝達関数に加算することで更新を行う、
請求項5記載の音源分離装置。 - 前記第1伝達関数更新回路、及び前記第2伝達関数更新回路が用いる前記非線形関数は、シグモイド関数、双曲線正接関数、正規化線形関数又は符号関数である、
請求項6記載の音源分離装置。 - さらに、
第3音声を入力するための第3マイクと、
前記第3マイクの音声信号から、前記第2音声が前記第3マイクに入力される第3クロストークを除去する第3クロストークキャンセラと、
前記第1マイクの音声信号から、前記第3音声が前記第1マイクに入力される第4クロストークを除去する第4クロストークキャンセラと、
前記第2マイクの音声信号から、前記第3音声が前記第2マイクに入力される第5クロストークを除去する第5クロストークキャンセラと、
前記第3マイクの音声信号から、前記第1音声が前記第3マイクに入力される第6クロストークを除去する第6クロストークキャンセラと、を備え、
前記第1クロストークキャンセラは、前記第1妨害信号を推定するにあたり、前記第2マイクの前記音声信号から前記第2クロストーク及び前記第5クロストークが除去された音声信号を用い、
前記第2クロストークキャンセラは、前記第2妨害信号を推定するにあたり、前記第1マイクの前記音声信号から前記第1クロストーク及び前記第4クロストークが除去された音声信号を用い、
前記第3クロストークキャンセラは、前記第2マイクの前記音声信号から前記第2クロストーク及び前記第5クロストークが除去された音声信号を用いて、前記第3クロストークの程度を示す第3妨害信号を推定して算出し、算出した前記第3妨害信号を、前記第3マイクの前記音声信号から除去し、
前記第4クロストークキャンセラは、前記第3マイクの前記音声信号から前記第3クロストーク及び前記第6クロストークが除去された音声信号を用いて、前記第4クロストークの程度を示す第4妨害信号を推定して算出し、算出した前記第4妨害信号を、前記第1マイクの前記音声信号から除去し、
前記第5クロストークキャンセラは、前記第3マイクの前記音声信号から前記第3クロストーク及び前記第6クロストークが除去された音声信号を用いて、前記第5クロストークの程度を示す第5妨害信号を推定して算出し、算出した前記第5妨害信号を、前記第2マイクの前記音声信号から除去し、
前記第6クロストークキャンセラは、前記第1マイクの前記音声信号から前記第1クロストーク及び前記第4クロストークが除去された音声信号を用いて、前記第6クロストークの程度を示す第6妨害信号を推定して算出し、算出した前記第6妨害信号を、前記第3マイクの前記音声信号から除去する、
請求項1記載の音源分離装置。 - 第1音声と第2音声とを含む音声信号から前記第1音声と前記第2音声とを分離する音源分離装置において行われる音源分離方法であって、
前記音源分離装置は、
前記第1音声を入力するための第1マイクと、
前記第2音声を入力するための第2マイクと、を備え、
前記音源分離方法は、
前記第1マイクの音声信号から、前記第2音声が前記第1マイクに入力される第1クロストークを除去する第1クロストークキャンセルステップと、
前記第2マイクの音声信号から、前記第1音声が前記第2マイクに入力される第2クロストークを除去する第2クロストークキャンセルステップと、を含み、
前記第1クロストークキャンセルステップでは、前記第2クロストークキャンセルステップにおいて前記第2マイクの前記音声信号から前記第2クロストークが除去された音声信号を用いて、前記第1クロストークの程度を示す第1妨害信号を推定して算出し、算出した前記第1妨害信号を、前記第1マイクの前記音声信号から除去し、
前記第2クロストークキャンセルステップでは、前記第1クロストークキャンセルステップにおいて前記第1マイクの前記音声信号から前記第1クロストークが除去された音声信号を用いて、前記第2クロストークの程度を示す第2妨害信号を推定して算出し、算出した前記第2妨害信号を、前記第2マイクの前記音声信号から除去する、
音源分離方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015205023 | 2015-10-16 | ||
JP2015205023 | 2015-10-16 | ||
PCT/JP2016/004391 WO2017064840A1 (ja) | 2015-10-16 | 2016-09-29 | 音源分離装置および音源分離方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6318376B2 JP6318376B2 (ja) | 2018-05-09 |
JPWO2017064840A1 true JPWO2017064840A1 (ja) | 2018-05-24 |
Family
ID=58517489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017545086A Active JP6318376B2 (ja) | 2015-10-16 | 2016-09-29 | 音源分離装置および音源分離方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10290312B2 (ja) |
EP (1) | EP3333850A4 (ja) |
JP (1) | JP6318376B2 (ja) |
WO (1) | WO2017064840A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021009234A (ja) * | 2019-07-02 | 2021-01-28 | トヨタ車体株式会社 | 車内会話支援装置 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6311136B2 (ja) | 2015-10-16 | 2018-04-18 | パナソニックIpマネジメント株式会社 | 双方向会話補助装置及び双方向会話補助方法 |
JP6809936B2 (ja) * | 2017-02-28 | 2021-01-06 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 雑音抽出装置およびマイクロホン装置 |
CN110675889A (zh) * | 2018-07-03 | 2020-01-10 | 阿里巴巴集团控股有限公司 | 音频信号处理方法、客户端和电子设备 |
CN110718237B (zh) | 2018-07-12 | 2023-08-18 | 阿里巴巴集团控股有限公司 | 串音数据检测方法和电子设备 |
JP6635394B1 (ja) | 2019-01-29 | 2020-01-22 | パナソニックIpマネジメント株式会社 | 音声処理装置および音声処理方法 |
US11270712B2 (en) | 2019-08-28 | 2022-03-08 | Insoundz Ltd. | System and method for separation of audio sources that interfere with each other using a microphone array |
JP7437650B2 (ja) * | 2019-11-21 | 2024-02-26 | パナソニックIpマネジメント株式会社 | 音響クロストーク抑圧装置および音響クロストーク抑圧方法 |
JP7486145B2 (ja) * | 2019-11-21 | 2024-05-17 | パナソニックIpマネジメント株式会社 | 音響クロストーク抑圧装置および音響クロストーク抑圧方法 |
US11546689B2 (en) * | 2020-10-02 | 2023-01-03 | Ford Global Technologies, Llc | Systems and methods for audio processing |
WO2023192312A1 (en) * | 2022-03-29 | 2023-10-05 | The Board Of Trustees Of The University Of Illinois | Adaptive binaural filtering for listening system using remote signal sources and on-ear microphones |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11508105A (ja) * | 1995-09-18 | 1999-07-13 | インターヴァル リサーチ コーポレイション | 信号処理のための適応フィルタおよびその方法 |
JP2010163054A (ja) * | 2009-01-15 | 2010-07-29 | Fujitsu Ten Ltd | 会話支援装置及び会話支援方法 |
WO2012046582A1 (ja) * | 2010-10-08 | 2012-04-12 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
JP2012195801A (ja) * | 2011-03-17 | 2012-10-11 | Panasonic Corp | 会話支援装置 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10217778A1 (de) * | 2002-04-18 | 2003-11-06 | Volkswagen Ag | Kommunikationseinrichtung zur Übertragung akustischer Signale in einem Kraftfahrzeug |
US4677676A (en) * | 1986-02-11 | 1987-06-30 | Nelson Industries, Inc. | Active attenuation system with on-line modeling of speaker, error path and feedback pack |
US5033082A (en) * | 1989-07-31 | 1991-07-16 | Nelson Industries, Inc. | Communication system with active noise cancellation |
US6496581B1 (en) * | 1997-09-11 | 2002-12-17 | Digisonix, Inc. | Coupled acoustic echo cancellation system |
US6505057B1 (en) * | 1998-01-23 | 2003-01-07 | Digisonix Llc | Integrated vehicle voice enhancement system and hands-free cellular telephone system |
US7039197B1 (en) * | 2000-10-19 | 2006-05-02 | Lear Corporation | User interface for communication system |
US6549629B2 (en) * | 2001-02-21 | 2003-04-15 | Digisonix Llc | DVE system with normalized selection |
JP3975153B2 (ja) | 2002-10-28 | 2007-09-12 | 日本電信電話株式会社 | ブラインド信号分離方法及び装置、ブラインド信号分離プログラム並びにそのプログラムを記録した記録媒体 |
JP4333369B2 (ja) * | 2004-01-07 | 2009-09-16 | 株式会社デンソー | 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置 |
US20090055180A1 (en) * | 2007-08-23 | 2009-02-26 | Coon Bradley S | System and method for optimizing speech recognition in a vehicle |
WO2011040549A1 (ja) | 2009-10-01 | 2011-04-07 | 日本電気株式会社 | 信号処理方法、信号処理装置、及び信号処理プログラム |
US8660271B2 (en) | 2010-10-20 | 2014-02-25 | Dts Llc | Stereo image widening system |
US20120294446A1 (en) | 2011-05-16 | 2012-11-22 | Qualcomm Incorporated | Blind source separation based spatial filtering |
US9641934B2 (en) * | 2012-01-10 | 2017-05-02 | Nuance Communications, Inc. | In-car communication system for multiple acoustic zones |
US20160039356A1 (en) * | 2014-08-08 | 2016-02-11 | General Motors Llc | Establishing microphone zones in a vehicle |
US9672805B2 (en) * | 2014-12-12 | 2017-06-06 | Qualcomm Incorporated | Feedback cancelation for enhanced conversational communications in shared acoustic space |
US9947334B2 (en) * | 2014-12-12 | 2018-04-17 | Qualcomm Incorporated | Enhanced conversational communications in shared acoustic space |
JP6311136B2 (ja) * | 2015-10-16 | 2018-04-18 | パナソニックIpマネジメント株式会社 | 双方向会話補助装置及び双方向会話補助方法 |
-
2016
- 2016-09-29 JP JP2017545086A patent/JP6318376B2/ja active Active
- 2016-09-29 EP EP16855097.8A patent/EP3333850A4/en not_active Ceased
- 2016-09-29 WO PCT/JP2016/004391 patent/WO2017064840A1/ja active Application Filing
-
2018
- 2018-02-06 US US15/889,279 patent/US10290312B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11508105A (ja) * | 1995-09-18 | 1999-07-13 | インターヴァル リサーチ コーポレイション | 信号処理のための適応フィルタおよびその方法 |
JP2010163054A (ja) * | 2009-01-15 | 2010-07-29 | Fujitsu Ten Ltd | 会話支援装置及び会話支援方法 |
WO2012046582A1 (ja) * | 2010-10-08 | 2012-04-12 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
JP2012195801A (ja) * | 2011-03-17 | 2012-10-11 | Panasonic Corp | 会話支援装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021009234A (ja) * | 2019-07-02 | 2021-01-28 | トヨタ車体株式会社 | 車内会話支援装置 |
Also Published As
Publication number | Publication date |
---|---|
US20180158467A1 (en) | 2018-06-07 |
EP3333850A4 (en) | 2018-06-27 |
US10290312B2 (en) | 2019-05-14 |
WO2017064840A1 (ja) | 2017-04-20 |
EP3333850A1 (en) | 2018-06-13 |
JP6318376B2 (ja) | 2018-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6318376B2 (ja) | 音源分離装置および音源分離方法 | |
JP6311136B2 (ja) | 双方向会話補助装置及び双方向会話補助方法 | |
JP4283212B2 (ja) | 雑音除去装置、雑音除去プログラム、及び雑音除去方法 | |
JP4957810B2 (ja) | 音処理装置、音処理方法及び音処理プログラム | |
CN109727604A (zh) | 用于语音识别前端的频域回声消除方法及计算机储存介质 | |
Djendi et al. | Analysis of two-sensors forward BSS structure with post-filters in the presence of coherent and incoherent noise | |
JP2007288775A (ja) | マルチチャネルエコー補正システムおよび方法 | |
WO2014024248A1 (ja) | ビームフォーミング装置 | |
JP2012195801A (ja) | 会話支援装置 | |
EP3833045B1 (en) | Conversation assistance system, method therefor, and program | |
JP7194900B2 (ja) | 翻訳装置及び翻訳方法 | |
JP5908170B2 (ja) | エコー消去装置 | |
KR20110021306A (ko) | 마이크로폰의 신호 보상 장치 및 그 방법 | |
CN1353904A (zh) | 用于时空回声消除的方法和装置 | |
JP5466581B2 (ja) | 反響消去方法、反響消去装置及び反響消去プログラム | |
JP2020144204A (ja) | 信号処理装置及び信号処理方法 | |
JP4920511B2 (ja) | マルチチャンネルエコーキャンセラ | |
JP2012049715A (ja) | 音源分離装置、音源分離方法、及び、プログラム | |
EP3770907B1 (en) | Systems and methods for estimating noise | |
JP4514153B2 (ja) | 音響装置 | |
Hidri et al. | A multichannel beamforming-based framework for speech extraction | |
Liu et al. | An Interference Cancellation Method Using Fixed Beamformer and Adaptive Filter in Car Environment | |
CN117558286A (zh) | 语音降噪方法、装置、车辆、电子设备和存储介质 | |
JP5889233B2 (ja) | 音響結合量推定装置、エコー消去装置、その方法及びプログラム | |
JP4578426B2 (ja) | オーディオ音キャンセルシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180119 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180119 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20180119 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20180209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180305 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6318376 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
SZ03 | Written request for cancellation of trust registration |
Free format text: JAPANESE INTERMEDIATE CODE: R313Z03 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |