JP6524463B2 - 自動ミキシング装置およびプログラム - Google Patents

自動ミキシング装置およびプログラム Download PDF

Info

Publication number
JP6524463B2
JP6524463B2 JP2014266387A JP2014266387A JP6524463B2 JP 6524463 B2 JP6524463 B2 JP 6524463B2 JP 2014266387 A JP2014266387 A JP 2014266387A JP 2014266387 A JP2014266387 A JP 2014266387A JP 6524463 B2 JP6524463 B2 JP 6524463B2
Authority
JP
Japan
Prior art keywords
time
sound
microphones
microphone
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014266387A
Other languages
English (en)
Other versions
JP2016126136A (ja
Inventor
堀内 俊治
俊治 堀内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2014266387A priority Critical patent/JP6524463B2/ja
Publication of JP2016126136A publication Critical patent/JP2016126136A/ja
Application granted granted Critical
Publication of JP6524463B2 publication Critical patent/JP6524463B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、複数のマイクロホンで得られた音声信号から目的音の音声信号を抽出する技術に関する。
一般に、会議やグループインタビューでは、複数のマイクロホンが使用される。複数のマイクロホンを同時使用した場合、ハウリングマージンの低下、周囲雑音の増加、およびコムフィルタの発生を引き起こす。この問題を解決するため、ミキシングエンジニアを配置するか、あるいはその作業を代替する自動ミキシング装置が使用される。自動ミキシング装置は、一般に、複数のマイクロホンの信号経路を監視し、最も入力レベルが大きいマイクロホンが出力する受音信号を選択し、出力レベルを調整するものである。従って、声の小さい人を救うために、該当するマイクロホンのミキシングゲインを上げると、当然ながら、妨害音(周囲雑音)の増加を招くことになる。
一方、街頭、車内あるいは駅のプラットホームなどの雑音環境下では、ハンドセットやヘッドセットなどの口元に近接配置されたマイクロホンを用いても、目的音である所望の音声に妨害音である他の音声や周囲雑音が混入してしまうことがある。この問題を解決するため、これまでに様々な妨害音抑圧手法や音源分離手法が提案されている。これらの手法は、単一のマイクロホンを使用するものと複数のマイクロホンを使用するものとに大別できる。複数のマイクロホンを使用するものでは、単一のマイクロホンを使用するものと比較して、より高い妨害音抑圧性能を得ることができる。
複数のマイクロホンを使用する手法では、複数のマイクロホンを空間的に配置し、各マイクロホンが出力する受音信号に、各マイクロホンと音源との空間的な位置関係に依存した時間差や振幅差を反映させる。これにより、各マイクロホンが出力する受音信号の時間差や振幅差の統計情報を利用して、目的音のみを選択的に収音したり、あるいは目的音と妨害音とを分離したりすることができる。
また、複数のマイクロホンを使用する手法として、音声信号のスパース性を利用した時間周波数マスキングと呼ばれる手法も提案されている。音声信号のスパース性とは、音声信号のエネルギが一部の時間周波数領域に集中し、その他の時間周波数領域ではほぼ0であるような性質をいう。時間周波数マスキングに基づく手法では、目的音および妨害音の方向は未知でよく、目的音を抽出するために、複数のマイクロホンが出力する受音信号の各時間周波数成分の振幅差と時間差の一方または両方を算出する。そして、それらの差に基づいて各時間周波数成分を分類し、目的音と妨害音とを分離する。複数のマイクロホンが出力する受音信号の各時間周波数成分の振幅差および時間差の算出では、所定時間長ごとに周波数分析を行なう。
時間周波数マスキングに基づく手法のうち、特に、複数のマイクロホンが出力する受音信号の各時間周波数成分の振幅差を用いるものは、より強い信号はそれより弱い信号をマスクするという聴覚マスキング現象を、計算機上に模擬したものである。2つのマイクロホンを用いるとき、目的音に重畳された妨害音をマスクするマスクパターンは、2つのマイクロホンが出力する受音信号の各時間周波数成分の振幅差を比較することで生成され、主マイクロホンに近接している音源の高振幅の受音信号の時間周波数成分を選択的に抽出するために用いられる。
この処理は、時間周波数領域で行われ、2つのマイクロホンのうちの主マイクロホンが出力する受音信号が支配的な周波数成分はそのまま出力し、もう一方の副マイクロホンが出力する受音信号が支配的な周波数成分はマスク処理する。主マイクロホンに近接している音源の受音信号に対するマスク処理は、下記式(1)で定義される。
このマスク処理では、主・副マイクロホンが出力する受音信号にスパース性が成立し、それらの時間周波数成分間に振幅差があると仮定している。この技術については、非特許文献1−4に記載されている。
また、特許文献1では、主・副マイクロホンの受音信号間に、振幅差を生じさせ、マスクパターンを生成している。また、特許文献2では、主・副マイクロホンの受音信号間に、パワースペクトル差を生じさせ、マスクパターンを生成している。
特許第5107956号明細書 特許第5113096号明細書
R.F.Lyon: "A computational model of binaural localization and separation, " In Proc. ICASSP, 1983. M. Bodden: "Modeling human sound-source localization and the cocktail-party-effect," Acta Acoustica, vol.1, pp.43--55, 1993. O. Yilmaz and S. Rickard: "Blind Separation of Speech Mixtures via Time-Frequency Masking," IEEE Transaction on Signal Processing, Vol. 52, No. 7, pp. 1830-1847, 2004. S. Rickard and O. Yilmaz: "On the Approximate W-disjoint Orthogonality of Speech," Proc. ICASSP, Vol. I, pp. 529-532, 2002.
しかしながら、一般に、人を音源とする受音信号ではスパース性は成立するが、例えば、妨害音(周囲雑音)の受音信号ではスパース性が成立しない。さらに、複数のマイクロホンが出力する受音信号において、目的音の受音信号間に振幅差があっても、妨害音の受音信号間には振幅差がない場合が多い。さらに、一般に、人を音源とする受音信号はその音圧がまちまちであるため、例えば、声の小さい人を救うために、該当するマイクロホンのミキシングゲインを上げると、当然ながら、妨害音(周囲雑音)の増加を招くことになる。
本発明は、このような事情に鑑みてなされたものであり、複数のマイクロホンが出力する受音信号にスパース性が成立せず、それらの時間周波数成分間に振幅差がない場合でも、妨害音抑圧や音源分離の性能が劣化しない自動ミキシング装置およびプログラムを提供することを目的とする。
(1)上記の目的を達成するために、本発明は、以下のような手段を講じた。すなわち、本発明の自動ミキシング装置は、複数のマイクロホンで得られた音声信号から目的音の音声信号を抽出する自動ミキシング装置であって、各マイクロホンのうちのいずれか一つである主マイクロホンおよび主マイクロホン以外の複数の副マイクロホンで得られた音声信号を、それぞれ時間周波数成分に変換する時間周波数変換部と、複数の副マイクロホンで得られた各音声信号に、それぞれゲインを付与するゲイン付与部と、主マイクロホンで得られた音声信号の時間周波数成分の振幅、およびゲインが付与された各音声信号の時間周波数成分の振幅を比較し、マスクパターンを生成するレベル差比較部と、主マイクロホンで得られた音声信号の時間周波数成分を、前記マスクパターンを用いてマスキングするマスキング処理部と、前記マスキングされた音声信号の時間周波数成分を合成する時間周波数合成部と、を備えることを特徴とする。
このように、各マイクロホンのうちのいずれか一つである主マイクロホンおよび主マイクロホン以外の複数の副マイクロホンで得られた音声信号を、それぞれ時間周波数成分に変換し、複数の副マイクロホンで得られた各音声信号に、それぞれゲインを付与し、主マイクロホンで得られた音声信号の時間周波数成分の振幅、およびゲインが付与された各音声信号の時間周波数成分の振幅を比較し、マスクパターンを生成し、主マイクロホンで得られた音声信号の時間周波数成分を、前記マスクパターンを用いてマスキングするので、マイクロホンが出力する受音信号の時間周波数成分間に振幅差を生じさせ、その後にマスクパターンを生成することが可能となる。これにより、マイクロホンが出力する受音信号にスパース性が成立せず、それらの時間周波数成分間に振幅差がない場合でも、音源分離や妨害音抑圧の性能が劣化することがなくなり、目的音を明確に得ることが可能となる。
(2)また、本発明の自動ミキシング装置において、前記ゲイン付与部は、各副マイクロホンで得られた妨害音としての音声信号の時間周波数成分間に振幅差を生じさせ、かつ、各副マイクロホンで得られた目的音としての音声信号の時間周波数成分の振幅と、各副マイクロホンで得られた妨害音としての音声信号の時間周波数成分の振幅との大小関係が逆転しないように、ゲインを設定することを特徴とする。
このように、各副マイクロホンで得られた妨害音としての音声信号の時間周波数成分間に振幅差を生じさせ、かつ、各副マイクロホンで得られた目的音としての音声信号の時間周波数成分の振幅と、各副マイクロホンで得られた妨害音としての音声信号の時間周波数成分の振幅との大小関係が逆転しないように、ゲインを設定するので、マイクロホンが出力する受音信号にスパース性が成立せず、それらの時間周波数成分間に振幅差がない場合でも、音源分離や妨害音抑圧の性能が劣化することがなくなり、目的音を明確に得ることが可能となる。
(3)また、本発明の自動ミキシング装置において、前記レベル差比較部は、主マイクロホンの時間周波数成分のレベルを|X1(f,t)|とし、ゲインG1n(f)が付与された複数の副マイクロホンの時間周波数成分のレベルを1/(N−1)・Σ|G1n(f)・Xn(f,t)|とし、次式に示すマスクパターンm1(f,t)を生成することを特徴とする。
この構成により、マイクロホンが出力する受音信号にスパース性が成立せず、それらの時間周波数成分間に振幅差がない場合でも、音源分離や妨害音抑圧の性能が劣化することがなくなり、目的音を明確に得ることが可能となる。
(4)また、本発明の自動ミキシング装置は、複数のマイクロホンで得られた音声信号から目的音の音声信号を抽出する自動ミキシング装置であって、各マイクロホンのうちのいずれか一つである主マイクロホンおよび主マイクロホン以外の複数の副マイクロホンで得られた音声信号を、それぞれ時間周波数成分に変換する時間周波数変換部と、主マイクロホンで得られた各音声信号に、ゲインを付与するゲイン付与部と、ゲインが付与された音声信号の時間周波数成分の振幅、および複数の副マイクロホンで得られた各音声信号の時間周波数成分の振幅を比較し、マスクパターンを生成するレベル差比較部と、ゲインが付与された音声信号の時間周波数成分を、前記マスクパターンを用いてマスキングするマスキング処理部と、前記マスキングされた音声信号からゲインを除去するゲイン除去部と、前記ゲインが除去された音声信号の時間周波数成分を合成する時間周波数合成部と、を備えることを特徴とする。
このように、各マイクロホンのうちのいずれか一つである主マイクロホンおよび主マイクロホン以外の複数の副マイクロホンで得られた音声信号を、それぞれ時間周波数成分に変換する時間周波数変換部と、主マイクロホンで得られた各音声信号に、ゲインを付与するゲイン付与部と、ゲインが付与された音声信号の時間周波数成分の振幅、および複数の副マイクロホンで得られた各音声信号の時間周波数成分の振幅を比較し、マスクパターンを生成するレベル差比較部と、ゲインが付与された音声信号の時間周波数成分を、前記マスクパターンを用いてマスキングするマスキング処理部と、前記マスキングされた音声信号からゲインを除去するので、マイクロホンが出力する受音信号の時間周波数成分間に振幅差を生じさせ、その後にマスクパターンを生成することが可能となる。これにより、マイクロホンが出力する受音信号にスパース性が成立せず、それらの時間周波数成分間に振幅差がない場合でも、音源分離や妨害音抑圧の性能が劣化することがなくなり、目的音を明確に得ることが可能となる。
(5)また、本発明のプログラムは、複数のマイクロホンで得られた音声信号から目的音の音声信号を抽出する自動ミキシング装置のプログラムであって、各マイクロホンのうちのいずれか一つである主マイクロホンおよび主マイクロホン以外の複数の副マイクロホンで得られた音声信号を、それぞれ時間周波数成分に変換する処理と、複数の副マイクロホンで得られた各音声信号に、それぞれゲインを付与する処理と、主マイクロホンで得られた音声信号の時間周波数成分の振幅、およびゲインが付与された各音声信号の時間周波数成分の振幅を比較し、マスクパターンを生成する処理と、主マイクロホンで得られた音声信号の時間周波数成分を、前記マスクパターンを用いてマスキングする処理と、前記マスキングされた音声信号の時間周波数成分を合成する処理と、の一連の処理を、コンピュータに実行させることを特徴とする。
このように、各マイクロホンのうちのいずれか一つである主マイクロホンおよび主マイクロホン以外の複数の副マイクロホンで得られた音声信号を、それぞれ時間周波数成分に変換し、複数の副マイクロホンで得られた各音声信号に、それぞれゲインを付与し、主マイクロホンで得られた音声信号の時間周波数成分の振幅、およびゲインが付与された各音声信号の時間周波数成分の振幅を比較し、マスクパターンを生成し、主マイクロホンで得られた音声信号の時間周波数成分を、前記マスクパターンを用いてマスキングするので、マイクロホンが出力する受音信号の時間周波数成分間に振幅差を生じさせ、その後にマスクパターンを生成することが可能となる。これにより、マイクロホンが出力する受音信号にスパース性が成立せず、それらの時間周波数成分間に振幅差がない場合でも、音源分離や妨害音抑圧の性能が劣化することがなくなり、目的音を明確に得ることが可能となる。
本発明によれば、マイクロホンが出力する受音信号の時間周波数成分間に振幅差を生じさせ、その後にマスクパターンを生成することが可能となる。これにより、マイクロホンが出力する受音信号にスパース性が成立せず、それらの時間周波数成分間に振幅差がない場合でも、音源分離や妨害音抑圧の性能が劣化することがなくなり、目的音を明確に得ることが可能となる。
本発明に係る自動ミキシング装置の概略構成を示すブロック図である。 マスクパターン生成の概念を示す図である。 マスクパターン生成の概念を示す図である。 本実施形態の変形例を示す図である。 本実施形態の変形例を示す図である。
本発明者は、複数のマイクロホンで人の音声を集音する場合、人の音声信号ではスパース性が成立するが、妨害音(周囲雑音)の音声信号ではスパース性が成立せず、また、目的音の音声信号間には振幅差があっても、妨害音の音声信号間には振幅差が無いことに着目し、妨害音にゲインを付与してからマスクパターンを生成することによって、複数のマイクロホンで得られた音声信号にスパース性が成立せず、それらの時間周波数成分間に振幅差が無い場合であっても、妨害音の抑圧や音源分離の性能を維持することができることを見出し、本発明をするに至った。
すなわち、本発明の自動ミキシング装置は、複数のマイクロホンで得られた音声信号から目的音の音声信号を抽出する自動ミキシング装置であって、各マイクロホンのうちのいずれか一つである主マイクロホンおよび主マイクロホン以外の複数の副マイクロホンで得られた音声信号を、それぞれ時間周波数成分に変換する時間周波数変換部と、複数の副マイクロホンで得られた各音声信号に、それぞれゲインを付与するゲイン付与部と、主マイクロホンで得られた音声信号の時間周波数成分の振幅、およびゲインが付与された各音声信号の時間周波数成分の振幅を比較し、マスクパターンを生成するレベル差比較部と、主マイクロホンで得られた音声信号の時間周波数成分を、前記マスクパターンを用いてマスキングするマスキング処理部と、前記マスキングされた音声信号の時間周波数成分を合成する時間周波数合成部と、を備えることを特徴とする。
これにより、本発明者は、マイクロホンが出力する受音信号にスパース性が成立せず、それらの時間周波数成分間に振幅差がない場合でも、音源分離や妨害音抑圧の性能が劣化することを回避し、目的音を明確に得ることを可能とした。以下、本発明の実施形態について、図面を参照しながら具体的に説明する。
図1は、本発明に係る自動ミキシング装置の概略構成を示すブロック図である。マイクロホン1で受音した受音信号x(t)とその他のマイクロホンで受音した受音信号x(t)(n=2,3,…,N)が、それぞれ独立した時間周波数分析部10〜10−nに入力され、時間周波数成分X(f,t)およびX(f,t)に変換される。ゲイン付与部70〜70−nでは、マイクロホン10とその他のマイクロホン10−2〜10−nの空間的な位置関係、周囲雑音の性質などから事前に算出された周波数ごとのゲインG1n(f)が、その他のマイクロホンで受音された時間周波数成分X(f,t)に付与される。
ここで、周波数ごとのゲインG1n(f)は、具体的には、
(A)マイクロホン10に接近している音源からの音波信号が、マイクロホン10とその他のマイクロホン10−2〜10−nで受音される際の振幅差
(B)低域では高く、高域では低いという一般的な周囲雑音の性質
を利用する。
上記の(B)は、様々な周囲雑音を測定し、それらの周波数特性から平均的な周囲雑音の周波数ごとの振幅を算出する。(A)の振幅差と(B)の周波数ごとの振幅から、周波数ごとのゲインを算出する。マイクロホン10に近接している音源からの音波が、マイクロホン10とその他のマイクロホン10−2〜10−nで受音される際の振幅差は、より具体的には、点音源と仮定すれば、音源からの距離が2倍になると、約6dBの減衰が生じる。
一方で、一般に、周囲雑音はほぼ同等程度である。このことを利用して、G1n(f)は、マイクロホン10からマイクロホン10−nまでの距離に応じたゲインを乗じることで、相対的に周囲雑音成分が大きくなり、結果として、後段でマスキングが可能となる。レベル差比較部90は、マイクロホン10の時間周波数成分のレベル|X(f,t)|とゲインG1n(f)が付与されたその他のマイクロホンの時間周波数成分のレベル“1/(N−1)・Σn|G1n(f)・X(f,t)|”が比較され、次式によりマイクロホン10で受音した時間周波数成分のうち、図2Aおよび図2Bに示すように、支配的な成分以外をマスクするマスクパターンm(f,t)を生成する。すなわち、レベル差比較部90は、各時間周波数成分を比較し、(マイクロホン10)>その他の音声成分、(マイクロホン10)≦その他の雑音成分を判断する。その結果、各々の成分をマスクするマスクパターンを生成する。
マスキング処理部30では、レベル差比較部90で生成されたマスクパターンm(f,t)を入力し、時間周波数分析部10から入力された音声信号をマスキング処理する。時間周波数合成部50では、マイクロホン10で受音した時間周波数成分のうち、支配的な成分のみを合成に使用し、出力信号Y(t)を出力する。
本実施形態では、ゲイン付与部70〜70−nは、マイクロホン10以外のマイクロホン10−2〜10−nのパスに設けているが、マイクロホン10のパスにゲイン付与部を設けてゲインを低下させても同一の効果が得られる。また、全てのマイクロホンのパスにゲイン付与部を設けてそれぞれのゲインを調整すれば同一の効果が得られる。
図3は、マイクロホン10のパスにゲイン付与部を設けた態様を示す図である。図3に示すように、マイクロホン10のパスにゲイン付与部60を設け、周波数ごとのゲインG1n(f)を付与した場合は、マイクロホン10で受音した受音信号が、周波数ごとのゲインG1n(f)によって変形しているため、ゲイン除去部61をマイクロホン10のパスに設ける。
また、本実施形態では、マイクロホン10で受音した音源信号のみを抽出するパスを示したが、図4に示すように、その他のマイクロホンで受音した音源信号にもマイクロホン10と同様な回路構成を用いることで、マイクロホン10とその他のマイクロホン10−2〜10−nで受音した音源信号をそれぞれ分離、抽出することができる。
なお、本発明は、自動ミキシング装置としてだけでなく、受音信号の処理手順で特定される自動ミキシング方法としても実現でき、さらにコンピュータに音源分離や妨害音抑圧の機能を実現させるためのプログラムとしても実現できる。また、自動ミキシング装置における各部は、ハードウエアでもソフトウエアでも実現することができる。
以上説明したように、本実施形態によれば、マイクロホンが出力する受音信号の時間周波数成分間に振幅差を生じさせ、その後にマスクパターンを生成することが可能となる。これにより、マイクロホンが出力する受音信号にスパース性が成立せず、それらの時間周波数成分間に振幅差がない場合でも、音源分離や妨害音抑圧の性能が劣化することがなくなり、目的音を明確に得ることが可能となる。
10〜10−n 時間周波数分析部
70〜70−n ゲイン付与部
1〜n マイクロホン
30 マスキング処理部
50 時間周波数合成部
60 ゲイン付与部
61 ゲイン除去部
90 レベル差比較部

Claims (3)

  1. 会議またはグループインタビュー用に配置された複数のマイクロホンで得られた音声信号から目的音の音声信号を抽出する自動ミキシング装置であって、
    各マイクロホンのうちのいずれか一つである主マイクロホンおよび主マイクロホン以外の複数の副マイクロホンで得られた音声信号を、それぞれ時間周波数成分に変換する時間周波数変換部と、
    複数の副マイクロホンで得られた各音声信号に、それぞれゲインを付与するゲイン付与部と、
    主マイクロホンで得られた音声信号の時間周波数成分の振幅、およびゲインが付与された各音声信号の時間周波数成分の振幅を比較し、マスクパターンを生成するレベル差比較部と、
    主マイクロホンで得られた音声信号の時間周波数成分を、前記マスクパターンを用いてマスキングするマスキング処理部と、
    前記マスキングされた音声信号の時間周波数成分を合成する時間周波数合成部と、を備え
    前記レベル差比較部は、
    主マイクロホンの時間周波数成分のレベルを|X1(f,t)|とし、
    ゲインG1n(f)が付与された複数の副マイクロホンの時間周波数成分のレベルを
    1/(N−1)・Σ|G1n(f)・Xn(f,t)|とし、次式に示すマスクパターンm1(f,t)を生成することを特徴とする自動ミキシング装置。
  2. 前記ゲイン付与部は、各副マイクロホンで得られた妨害音としての音声信号の時間周波数成分間に振幅差を生じさせ、かつ、各副マイクロホンで得られた目的音としての音声信号の時間周波数成分の振幅と、各副マイクロホンで得られた妨害音としての音声信号の時間周波数成分の振幅との大小関係が逆転しないように、ゲインを設定することを特徴とする請求項1記載の自動ミキシング装置。
  3. 会議またはグループインタビュー用に配置された複数のマイクロホンで得られた音声信号から目的音の音声信号を抽出する自動ミキシング装置のプログラムであって、
    各マイクロホンのうちのいずれか一つである主マイクロホンおよび主マイクロホン以外の複数の副マイクロホンで得られた音声信号を、それぞれ時間周波数成分に変換する処理と、
    複数の副マイクロホンで得られた各音声信号に、それぞれゲインを付与する処理と、
    主マイクロホンで得られた音声信号の時間周波数成分の振幅、およびゲインが付与された各音声信号の時間周波数成分の振幅を比較し、マスクパターンを生成する処理と、
    主マイクロホンで得られた音声信号の時間周波数成分を、前記マスクパターンを用いてマスキングする処理と、
    前記マスキングされた音声信号の時間周波数成分を合成する処理と、の一連の処理を、コンピュータに実行させ
    前記マスクパターンを生成する処理では、
    主マイクロホンの時間周波数成分のレベルを|X1(f,t)|とし、
    ゲインG1n(f)が付与された複数の副マイクロホンの時間周波数成分のレベルを
    /(N−1)・Σ|G1n(f)・Xn(f,t)|とし、次式に示すマスクパターンm1(f,t)を生成することを特徴とするプログラム。
JP2014266387A 2014-12-26 2014-12-26 自動ミキシング装置およびプログラム Expired - Fee Related JP6524463B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014266387A JP6524463B2 (ja) 2014-12-26 2014-12-26 自動ミキシング装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014266387A JP6524463B2 (ja) 2014-12-26 2014-12-26 自動ミキシング装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2016126136A JP2016126136A (ja) 2016-07-11
JP6524463B2 true JP6524463B2 (ja) 2019-06-05

Family

ID=56359354

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014266387A Expired - Fee Related JP6524463B2 (ja) 2014-12-26 2014-12-26 自動ミキシング装置およびプログラム

Country Status (1)

Country Link
JP (1) JP6524463B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102657293B1 (ko) * 2018-08-02 2024-04-15 주식회사 오성전자 전자제품을 제어하는 제어기기
JP7230427B2 (ja) 2018-10-24 2023-03-01 ヤマハ株式会社 音信号処理装置、ミキサ、および音信号処理方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5113096B2 (ja) * 2009-01-21 2013-01-09 Kddi株式会社 音源分離方法、装置およびプログラム
JP5107956B2 (ja) * 2009-03-31 2012-12-26 Kddi株式会社 雑音抑圧方法、装置およびプログラム
JP2012234150A (ja) * 2011-04-18 2012-11-29 Sony Corp 音信号処理装置、および音信号処理方法、並びにプログラム
CN102801861B (zh) * 2012-08-07 2015-08-19 歌尔声学股份有限公司 一种应用于手机的语音增强方法和装置

Also Published As

Publication number Publication date
JP2016126136A (ja) 2016-07-11

Similar Documents

Publication Publication Date Title
Wang Time-frequency masking for speech separation and its potential for hearing aid design
US7243060B2 (en) Single channel sound separation
US9418678B2 (en) Sound processing device, sound processing method, and program
KR102191736B1 (ko) 인공신경망을 이용한 음성향상방법 및 장치
TW201142829A (en) Adaptive noise reduction using level cues
RU2010119709A (ru) Робастная система подавления шума с двумя микрофонами
KR20090037692A (ko) 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
JP2004029754A (ja) 音源の位置情報を利用した分割スペクトルに基づく目的音声の復元方法
Madhu et al. A versatile framework for speaker separation using a model-based speaker localization approach
US9530429B2 (en) Reverberation suppression apparatus used for auditory device
Chatterjee et al. ClearBuds: wireless binaural earbuds for learning-based speech enhancement
TWI819478B (zh) 具端至端神經網路之聽力裝置及音訊處理方法
Min et al. Mask estimate through Itakura-Saito nonnegative RPCA for speech enhancement
JP6524463B2 (ja) 自動ミキシング装置およびプログラム
JP5107956B2 (ja) 雑音抑圧方法、装置およびプログラム
JP2009134102A (ja) 目的音抽出装置,目的音抽出プログラム,目的音抽出方法
Zhu et al. Modified complementary joint sparse representations: a novel post-filtering to MVDR beamforming
Priyanka et al. Generalized sidelobe canceller beamforming with combined postfilter and sparse NMF for speech enhancement
JP5113096B2 (ja) 音源分離方法、装置およびプログラム
Gergen et al. Source separation by feature-based clustering of microphones in ad hoc arrays
AU2020316738B2 (en) Speech-tracking listening device
JP2017181761A (ja) 信号処理装置及びプログラム、並びに、ゲイン処理装置及びプログラム
Pandey et al. Attentive Training: A New Training Framework for Talker-independent Speaker Extraction.
JP2001249676A (ja) 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法
JP6519801B2 (ja) 信号解析装置、方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190411

R150 Certificate of patent or registration of utility model

Ref document number: 6524463

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees