JP5134477B2 - 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 - Google Patents
目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP5134477B2 JP5134477B2 JP2008237642A JP2008237642A JP5134477B2 JP 5134477 B2 JP5134477 B2 JP 5134477B2 JP 2008237642 A JP2008237642 A JP 2008237642A JP 2008237642 A JP2008237642 A JP 2008237642A JP 5134477 B2 JP5134477 B2 JP 5134477B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- value
- power distribution
- frame
- arrival
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
Alvarez, A., Gomez, P., Nieto, V., Martinez, R., and Rodellar, V., "Application of a first-order differential microphone for efficient voice activity detection in a car platform", Proceedings of Interspeech, 2669-2672, 2005. Potamitis, I. and Fishler, E., "Speech activity detection and enhancement of a moving speaker based on the wideband generalized likelihood ratio and microphone arrays," Journal of the Acoustical Society of Ametica, vol. 116, pp. 2406-2415, 2004. Asano, F., Yamamoto, K., Ogata, J.,Yamada, M., and Nakamura, M., "Detection and separation of speech events in meeting recordings using a microphone array," EURASIP Journal Audio, Speech, and Music Processing, vol. 2007, Article ID 27616, 2007. Takahashi, Y., Takatani, T., Saruwatari, H., and Shikano, K., "Blind spatial subtraction array with independent component analysis for hands-free speech recognition," Proceedings of IWAENC, 2006. Le Bouquin-Jeannes R., Azirani, A. A., and Faucon, G., " Enhancement of speech degraded by coherent and incoherent noise using a cross-spectral estimator," IEEE Transactions on Speech and Audio Processing, vol. 5, pp. 484-487, 1997. Denda, Y., Nishiura, T., and Yamashita, Y., "Robust talker direction estimation based on weighted CSP analysis and maximum likelihood estimation," IEICE Transactions on Information and Systems, vol. E89-D, pp. 1050-1057, 2006. Juan E. Rubio, Kentaro Ishizuka, Hiroshi Sawada, Shoko Araki, Tomohiro Nakatani, and Masakiyo Fujimoto, "Two-Microphone Voice Activity Detection Based on the Homogeneity of the Direction of Arrival Estimates," Proceedings of the 32nd International Conference on Acoustics, Speech, and Signal Processing, Vol. 4, pp. 385-388, 2007.
図1は、本形態の目的信号区間推定装置10の全体構成を例示したブロック図である。また、図2(a)は、本形態の空間パワー分布推定部14の詳細を例示するブロック図であり、図2(b)は、本形態の判定部19の詳細を例示するブロック図である。
図1に例示するように、本形態の目的信号区間推定装置10は、信号切出部11と周波数領域変換部12と正規化部13と空間パワー分布推定部14と雑音区間空間パワー分布推定部15と事後信号対雑音比推定部16と事前信号対雑音比推定部17と尤度比計算部18と判定部19と制御部10aと記憶部10bとを具備し、S(S≧2)個のセンサ20−1〜Sで観測され、サンプリング部30でサンプリングされた信号が入力され、目的信号区間の分析結果を出力する装置である。また、図2(a)に例示する空間パワー分布推定部14は、時間周波数マスク生成部14aとマスク適用部14bとを有し、図2(b)に例示する判定部19は、平均算出部19aと閾値比較部19bとを有する。
次に、本形態の目的信号区間推定方法について説明する。
本形態の目的信号区間推定方法では、複数のセンサ20−1〜S(S≧2)で観測された各信号を時間周波数分析し、特定の基準センサを基準とした正規化信号値を求め、正規化信号値がとり得る全範囲を複数に分割した各区分である各到来方向区分におけるパワーの統計的性質の時間的変化に基づいて、目的信号の有無を検出して出力する。なお、本形態では、複数のセンサ20−1〜Sとしてマイクロホンを利用し、それらで観測された各音響信号を用い、音声信号や音楽信号などの目的信号の有無を検出して出力する場合を例示する。また、以下では明記しないが、目的信号区間推定装置10は、制御部10aの制御に基づいて各演算処理を実行する。また、本形態の場合、各演算処理の過程で得られたデータは記憶部10bに逐次格納され、それ以降の各演算処理において読み出されて利用される。すなわち、本形態において、処理部Aからデータが出力され、このデータが処理部Bに入力されるとは、処理部Aから出力されたデータが記憶部10bに格納され、処理部Bがこのデータを記憶部10bから読み込むことを意味する。
本形態では正規化信号値Z(i,k)の一例として、S=2とし、基準センサ20−1に対応する周波数領域信号X(1,i,k)と、他方のセンサ20−2に対応する周波数領域信号X(2,i,k)とから信号到来方向を推定し、その信号到来方向推定値を正規化信号値Z(i,k)とする(正規化信号値Z(i,k)の例1)。この例では、正規化部13は、以下の式(3)(4)によって算出された信号到来方向推定値θ(i,k)を正規化信号値Z(i,k)を算出する。なお、νは音速(約340m/秒)を示し、dはセンサ間距離(m)を示し、fは周波数インデックスkに対応する離散周波数f=fs・k/Mを示し、arg(・)は・の位相(偏角)を示す。また、τ(i,k)は信号源から各センサ20−1,2までの信号到達時間差を示し、θ(i,k)は信号到来方向推定値を示す。また、式(4)によって算出される信号到来方向θ(i,k)は、センサ20−1,2を結ぶ線分の中点を通り、その線分と直交する方向を0radianとした角度(radian)である。なお、このように算出された正規化信号値Z(i,k)は、周波数成分fが正規化され、周波数依存性が排除された値となる。
また、基準センサ20−Jと各センサ20−sとの信号到達時間差τ(s,i,k)を以下の式(6)で求め、それらを要素とした信号到達時間差ベクトルτ'(i,k)を以下の式(7)のように求める。
上述の式(5)〜(7)には以下の式(8)の関係が成り立ち、以下の式(8)から目的信号の到来方位角推定値θ(i,k)と仰角推定値φ(i,k)とを求める。なお、式(8)におけるD-1はムーア・ペンローズ型一般化逆行列などの一般化逆行列である。また、目的信号の到来方位角とはx−y平面上の目的信号の到来方向を意味し、目的信号の仰角とはx−z平面上の目的信号の到来方向を意味する。また、y軸線方向が0radianである。
ν・D-1・τ'(i,k)=[cosθ(i,k) cosφ(i,k),sinθ(i,k)sinφ(i,k),sinφ(i,k)] T
...(8)
図4(a)に示した例の場合、まず、空間パワー分布推定部14の時間周波数マスク生成部14a(図2(a))に各正規化信号値Z(i,k)が入力される。時間周波数マスク生成部14aは、各正規化信号値Z(i,k)を用い、特定の到来方向区分rに属する正規化信号値Z(i,k)の周波数ビンk及びフレームiに対してハイレベル値をとり、当該特定の到来方向区分rに属しない正規化信号値Z(i,k)の周波数ビンk及びフレームiに対してローレベル値(<ハイレベル値)をとる、当該特定の到来方向区分rと周波数ビンkとフレームiとを変数とする関数である時間周波数マスクMask(i,k,r)を生成して出力する(ステップS51)。時間周波数マスクMask(i,k,r)の一例は、以下のバイナリマスクである。
P(i,r)=|Mask(i,k',r)・X(1,i,k')|2 ...(11)
を空間パワー分布値P(i,r)としてもよい。
雑音区間空間パワー分布値λN(i,r)の生成は、例えば、複数の雑音区間のフレームでの各到来方向区分の空間パワー分布値P(i,r)を、到来方向区分rごとに当該雑音区間のフレームについて平均した値を、各到来方向区分rについての雑音区間空間パワー分布値λN(i,r)とすることによって行われる。すなわち、雑音区間空間パワー分布推定部15は、例えば、以下の式によって、全ての到来方向区分rについて雑音区間空間パワー分布値λN(i,r)を生成する。
事後信号対雑音比推定部16から出力された事後信号対雑音比γ(i,r)は、事前信号対雑音比推定部17に入力される。事前信号対雑音比推定部17は、事後信号対雑音比γ(i,r)を少なくとも用い、雑音区間空間パワー分布値λN(i,r)と、空間パワー分布値P(i,r)の目的信号成分である目的信号空間パワー分布値λS(i,r)との比である事前信号対雑音比ξ(i,r)を、到来方向区分rごとに各フレームiについて生成し、出力する(ステップS8)。以下にステップS8の詳細を例示する。
事前信号対雑音比推定部17は、例えば、事後信号対雑音比γ(i,r)から1を減じた値を、当該事後信号対雑音比γ(i,r)の到来方向区分r及びフレームiに対応する事前信号対雑音比ξ(i,r)=λS(i,r)/λN(i,r)として生成する。
この場合には、少ない演算量で事前信号対雑音比ξ(i,r)が算出できる。また、各フレームiの雑音区間空間パワー分布値λN(i,r)が実環境によく適合する場合、すなわち、
λS(i,r)=P(i,r)-λN(i,r) ...(16)
が実環境によく適合する場合にはよい推定となる。
S^(i-1,r)={(ν(i-1,r))1/2/γ(i-1,r)}・Γ(1.5)・exp(-ν(i-1,r)/2)・[(1+ν(i-1,r))・I0(ν(i-1,r)/2)+ν(i-1,r)・I1(ν(i-1,r)/2)]・(P(i-1,r))1/2 ...(18)
ν(i-1,r)=ξ(i-1,r)・γ(i-1,r)/(1+ξ(i-1,r)) ...(19)
以下にこの導出を行う。まず、尤度pi(X(r)|H0)及びpi(X(r)|H1)は、以下のように定義される(例えば、参考文献1「Sohn, J., Kim, N.-S., and Sung, W., "A Statistical Model-based Voice Activity Detection," IEEE Signal Processing Letters, Vol. 6, No.1, pp. 1-3, 1999.」の式(1)(2)参照)。
={1/(1+ξ(i,r))}・exp{(γ(i,r)・ξ(i,r))/(1+ξ(i,r))}
このように、本形態では、正確なλS(i,r)を直接求めることができないため、以上のように事後信号対雑音比γ(i,r)と事前信号対雑音比ξ(i,r)とを求め、それらを用いて尤度比Λ(i,r)を計算する。
図4(b)の例では、判定部19は、尤度比Λ(i,r)又はその関数値をフレームiごとに到来方向区分rについて平均し、その演算結果を指標として、各フレームiが目的信号区間であるか否かを判定する。
として1を出力し(ステップS103)、平均値Ave(i)<thである場合(「平均値Ave(i)≦thである場合」としてもよい)、そのフレームiは雑音区間である
として0を出力する(ステップS104)。なお、閾値thは、平均値Ave(i)の時間長平均(複数のフレームiに対する平均)や分散などの統計量を用いて設定されてもよいし、th=0.2などの固定値を事前に設定しておいてもよい。分散などの統計量を用いて閾値thを設定する場合の一例としては、目的信号が存在しないと推定されるフレームを判定対象のフレームについて平均値Ave(i)を求め、それらの平均値から所定のマージンを設けた値を閾値thとする方法がある。
次に、ステップS10の変形例を示す。
第1の変形例では、図2(a)の判定部19の代わりに、図5(a)の判定部19を用いる。この変形例の場合、判定部19の閾値比較部19cは、入力された尤度比Λ(i,r)と、到来方向区分rごとに設定された閾値th(r)とを到来方向区分rごとに比較し、到来方向区分rごとにそのフレームiが目的信号区間であるか否かを判定し、その判定結果を出力する。例えば、尤度比Λ(i,r)>th(r)である場合(「尤度比Λ(i,r)≧th(r)である場合」としてもよい)、そのフレームiはその到来方向区分rについて目的信号区間である
として1を出力し、尤度比Λ(i,r)<th(r)である場合(「尤度比Λ(i,r)≦th(r)である場合」としてもよい)、そのフレームiはその到来方向区分rについて雑音区間である
として0を出力する。なお、閾値th(r)は、尤度比Λ(i,r)の時間長平均(複数のフレームiに対する平均)や分散などの統計量を用いて設定されてもよいし、th=0.2などの固定値を事前に設定しておいてもよい。
本形態の効果を示すために、複数のマイクロホンを用いて観測した、音声信号を雑音信号が混在する音響信号を本形態の目的信号区間推定方法によって分析し、得られた尤度比Λ(i,r)(尤度比計算部18の出力)を用いて目的信号区間(この実験では音声信号区間)を検出する実験例を示す。使用した音響信号データは大学の研究室内で学生がポスターを用いて自身の研究の発表を行っている発話を収録した信号で、サンプリング周波数16kHz、量子化ビット数16ビットで離散サンプリングされたものを用いた。ここでの検出対象となる目的信号は発表者又は聞き手の発生した音声信号とする。この収録には、発表者1名と聞き手2名が参加した。収録された信号には、研究室内にある複数の計算機による雑音や、部屋外かの雑音が常に混入している。収録には8本の全指向性マイクロホン(センサ20−1〜8)を用いており、これらは図6に示す間隔で配置されていた。このようにして収録された音響信号に対し、1フレームの時間量を32ms(512サンプル点)とし、16ms(256サンプル点)ごとにフレームの始点を移動させて、本形態の目的信号区間推定方法を適用し、各フレームで尤度比を推定した。また、正規化信号値Z(i,k)として信号到来方向θ(i,k)を用い、0〜180度を1度毎に180分割した各区分を到来方向区分r(r∈{1,...,180})とした。
なお、本発明は上述の実施形態に限定されるものではない。例えば、上記の実施形態では、尤度比計算部18が、事後信号対雑音比推定部16で生成された事後信号対雑音比γ(i,r)と、事前信号対雑音比推定部17で生成された事前信号対雑音比ξ(i,r)とを用い、尤度比Λ(i,r)を計算して出力し、判定部19はそれを指標として目的信号区間であるか否かを判定していた。しかし、尤度比計算部18が、尤度比Λ(i,r)ではなく尤度比Λ(i,r)の関数値を出力し、判定部19がそれを指標として目的信号区間であるか否かを判定する構成でもよい。この場合には、判定部19での判定を容易にするため、尤度比Λ(i,r)の関数値は、尤度比Λ(i,r)に対して単調増加するものか、単調減少するものであることが望ましい。また、尤度比Λ(i,r)の関数値の一例は、尤度比Λ(i,r)の対数尤度比logΛ(i,r)である。尤度比計算部18が対数尤度比logΛ(i,r)を出力する例の場合、例えば、平均算出部19a(図2(a))が、入力された対数尤度比logΛ(i,r)をフレームiごとに到来方向区分rについて平均した平均値Ave(i)を生成して出力し、その後、前述したステップS102〜S104の処理を実行すればよい。
また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、信号区間推定装置10がサンプリング部30を包含する構成であってもよいし、信号区間推定装置10の機能を複数のコンピュータで分散処理する構成であってもよい。また、上述の実施形態では、マイクロホンで観測された音響信号を処理対象とし、目的信号区間を推定することとしたが、音響信号以外の信号、例えば、超音波、電磁波等を処理対象とし、目的信号区間を推定してもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
Claims (12)
- 目的信号が存在する目的信号区間を推定する目的信号区間推定装置であって、
複数のセンサで観測された各信号をそれぞれ所定の時間区間であるフレーム毎に切り出す信号切出部と、
上記信号切出部で切り出された各フレームの信号を周波数領域に変換した周波数領域信号を各センサについて生成する周波数領域変換部と、
上記センサに含まれる特定の基準センサに対応する上記周波数領域信号を基準として、少なくとも当該基準センサ以外の何れかの上記センサに対応する周波数領域信号を正規化し、上記センサで観測された信号の到来方向に対応する正規化信号値を各フレームについて生成する正規化部と、
上記正規化信号値がとり得る全範囲を複数に分割した各区分を各到来方向区分とし、上記正規化信号値に対応するフレームの上記周波数領域信号の振幅の絶対値に対して単調増加する値を、当該正規化信号値が属する上記到来方向区分の当該フレームでの空間パワー分布値とする空間パワー分布推定部と、
目的信号が存在しないと推定される雑音区間のフレームに対応する各到来方向区分の空間パワー分布値を用い、雑音区間の空間パワー分布値の推定値である雑音区間空間パワー分布値を各到来方向区分について生成する雑音区間空間パワー分布推定部と、
各到来方向区分の各フレームにおける上記空間パワー分布値と、各到来方向区分の上記雑音区間空間パワー分布値とを用い、当該空間パワー分布値と当該雑音区間空間パワー分布値との比である事後信号対雑音比を、到来方向区分ごとに各フレームについて生成する事後信号対雑音比推定部と、
上記事後信号対雑音比を少なくとも用い、到来方向区分ごとに、各フレームが雑音区間である尤度と各フレームが目的信号区間である尤度との比である尤度比又はその関数値を生成する尤度比計算部と、
を有する目的信号区間推定装置。 - 請求項1の目的信号区間推定装置であって、
上記事後信号対雑音比を少なくとも用い、上記雑音区間空間パワー分布値と、空間パワー分布値の目的信号成分である目的信号空間パワー分布値との比である事前信号対雑音比を、到来方向区分ごとに各フレームについて生成する事前信号対雑音比推定部をさらに有し、
上記尤度比計算部は、
上記事後信号対雑音比と上記事前信号対雑音比とを用いて上記尤度比又はその関数値を生成する、
ことを特徴とする目的信号区間推定装置。 - 請求項1又は2の目的信号区間推定装置であって、
上記尤度比又はその関数値を指標とし、各フレームが上記目的信号区間であるか否かを判定する判定部をさらに有する、
ことを特徴とする目的信号区間推定装置。 - 請求項3の目的信号区間推定装置であって、
上記判定部は、
上記尤度比又はその関数値をフレームごとに上記到来方向区分について平均し、その演算結果を指標として、各フレームが上記目的信号区間であるか否かを判定する、
ことを特徴とする目的信号区間推定装置。 - 請求項1から4の何れかの目的信号区間推定装置であって、
上記正規化部は、
周波数ビンとフレームとの組ごとに上記正規化信号値を生成し、
上記空間パワー分布推定部は、
特定の到来方向区分に属する上記正規化信号値の周波数ビン及びフレームに対してハイレベル値をとり、当該特定の到来方向区分に属しない上記正規化信号値の周波数ビン及びフレームに対してローレベル値をとる、当該特定の到来方向区分と周波数ビンとフレームとを変数とする関数である時間周波数マスクを生成する時間周波数マスク生成部と、
周波数ビンとフレームとの組が同一である上記周波数領域信号と上記時間周波数マスクとの積に対して単調増加する値を用い、当該フレームと当該到来方向区分とに対応する空間パワー分布値を生成するマスク適用部と、
を有することを特徴とする目的信号区間推定装置。 - 請求項1から5の何れかの目的信号区間推定装置であって、
上記雑音区間空間パワー分布推定部は、
複数の上記雑音区間のフレームでの各到来方向区分の空間パワー分布値を、到来方向区分ごとに当該雑音区間のフレームについて平均した値を、各到来方向区分についての雑音区間空間パワー分布値として生成する、
ことを特徴とする目的信号区間推定装置。 - 請求項2の目的信号区間推定装置であって、
上記事後信号対雑音比推定部は、
同一の到来方向区分に対応する上記空間パワー分布値と上記雑音区間空間パワー分布値との組ごとに、当該空間パワー分布値を当該雑音区間空間パワー分布値で除算し、その演算結果を、当該空間パワー分布値の到来方向区分及びフレームに対応する上記事後信号対雑音比として生成し、
上記事前信号対雑音比推定部は、
上記事後信号対雑音比から1を減じた値を、当該事後信号対雑音比の到来方向区分及びフレームに対応する事前信号対雑音比として生成する、
ことを特徴とする目的信号区間推定装置。 - 請求項2の目的信号区間推定装置であって、
上記事後信号対雑音比推定部は、
同一の到来方向区分に対応する上記空間パワー分布値と上記雑音区間空間パワー分布値との組ごとに、当該空間パワー分布値を当該雑音区間空間パワー分布値で除算し、その演算結果を、当該空間パワー分布値の到来方向区分及びフレームに対応する上記事後信号対雑音比として生成し、
上記事前信号対雑音比推定部は、
到来方向区分r及びフレームiに対応する上記事後信号対雑音比をγ(i,r)とし、到来方向区分r及びフレームiに対応する上記事前信号対雑音比をξ(i,r)とし、到来方向区分r及びフレームiに対応する空間パワー分布値をP(i,r)とし、到来方向区分r及びフレームiに対応する上記雑音区間空間パワー分布値をλN(i,r)とし、max(・)を・の最大値を出力する関数とし、Γ(・)をガンマ関数とし、I0(・)とI1(・)をそれぞれ0次と1次の第1種修正ベッセル関数とし、ν(i-1,r)=ξ(i-1,r)・γ(i-1,r)/(1+ξ(i-1,r))とし、S^(i-1,r)={(ν(i-1,r))1/2/γ(i-1,r)}・Γ(1.5)・exp(-ν(i-1,r)/2)・[(1+ν(i-1,r))・I0(ν(i-1,r)/2)+ν(i-1,r)・I1(ν(i-1,r)/2)]・(P(i-1,r))1/2とし、βを0以上1以下の定数とした場合における、ξ(i-1,r)=β・|S^(i-1,r)|2/λN(i-1,r)+(1-β)・max(γ(i,r)-1,0)を到来方向区分r及びフレームiに対応する上記事前信号対雑音比として生成する、
ことを特徴とする目的信号区間推定装置。 - 請求項2、7又は8の何れかの目的信号区間推定装置であって、
上記尤度比計算部は、
到来方向区分r及びフレームiに対応する上記事後信号対雑音比をγ(i,r)とし、到来方向区分r及びフレームiに対応する上記事前信号対雑音比をξ(i,r)とした場合における、Λ(i,r)={1/(1+ξ(i,r))}・exp{(γ(i,r)・ξ(i,r))/(1+ξ(i,r))}を上記尤度比として生成する、
ことを特徴とする目的信号区間推定装置。 - 目的信号が存在する目的信号区間を推定する目的信号区間推定装置の目的信号区間推定方法であって、
信号切出部が、複数のセンサで観測された各信号をそれぞれ所定の時間区間であるフレーム毎に切り出すステップと、
周波数領域変換部が、上記信号切出部で切り出された各フレームの信号を周波数領域に変換した周波数領域信号を各センサについて生成するステップと、
正規化部が、上記センサに含まれる特定の基準センサに対応する上記周波数領域信号を基準として、少なくとも当該基準センサ以外の何れかの上記センサに対応する周波数領域信号を正規化し、上記センサで観測された信号の到来方向に対応する正規化信号値を各フレームについて生成するステップと、
空間パワー分布推定部が、上記正規化信号値がとり得る全範囲を複数に分割した各区分を各到来方向区分とし、上記正規化信号値に対応するフレームの上記周波数領域信号の振幅の絶対値に対して単調増加する値を、当該正規化信号値が属する上記到来方向区分の当該フレームでの空間パワー分布値とするステップと、
雑音区間空間パワー分布推定部が、目的信号が存在しないと推定される雑音区間のフレームに対応する各到来方向区分の空間パワー分布値を用い、雑音区間の空間パワー分布値の推定値である雑音区間空間パワー分布値を各到来方向区分について生成するステップと、
事後信号対雑音比推定部が、各到来方向区分の各フレームにおける上記空間パワー分布値と、各到来方向区分の上記雑音区間空間パワー分布値とを用い、当該空間パワー分布値と当該雑音区間空間パワー分布値との比である事後信号対雑音比を、到来方向区分ごとに各フレームについて生成するステップと、
尤度比計算部が、上記事後信号対雑音比を少なくとも用い、到来方向区分ごとに、各フレームが雑音区間である尤度と各フレームが目的信号区間である尤度との比である尤度比又はその関数値を生成するステップと、
を有する目的信号区間推定方法。 - 請求項1から9の何れかに記載の目的信号区間推定装置としてコンピュータを機能させるための目的信号区間推定プログラム。
- 請求項11に記載の目的信号区間推定プログラムを格納したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008237642A JP5134477B2 (ja) | 2008-09-17 | 2008-09-17 | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008237642A JP5134477B2 (ja) | 2008-09-17 | 2008-09-17 | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010072164A JP2010072164A (ja) | 2010-04-02 |
JP5134477B2 true JP5134477B2 (ja) | 2013-01-30 |
Family
ID=42204027
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008237642A Expired - Fee Related JP5134477B2 (ja) | 2008-09-17 | 2008-09-17 | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5134477B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5459220B2 (ja) * | 2008-11-27 | 2014-04-02 | 日本電気株式会社 | 発話音声検出装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4195267B2 (ja) * | 2002-03-14 | 2008-12-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声認識装置、その音声認識方法及びプログラム |
JP4765461B2 (ja) * | 2005-07-27 | 2011-09-07 | 日本電気株式会社 | 雑音抑圧システムと方法及びプログラム |
JP5147012B2 (ja) * | 2008-08-22 | 2013-02-20 | 日本電信電話株式会社 | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 |
-
2008
- 2008-09-17 JP JP2008237642A patent/JP5134477B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5459220B2 (ja) * | 2008-11-27 | 2014-04-02 | 日本電気株式会社 | 発話音声検出装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2010072164A (ja) | 2010-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106663446B (zh) | 知晓用户环境的声学降噪 | |
US9666183B2 (en) | Deep neural net based filter prediction for audio event classification and extraction | |
JP4950930B2 (ja) | 音声/非音声を判定する装置、方法およびプログラム | |
KR100486736B1 (ko) | 두개의 센서를 이용한 목적원별 신호 분리방법 및 장치 | |
US8775173B2 (en) | Erroneous detection determination device, erroneous detection determination method, and storage medium storing erroneous detection determination program | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
US20080208578A1 (en) | Robust Speaker-Dependent Speech Recognition System | |
US20140078867A1 (en) | Sound direction estimation device, sound direction estimation method, and sound direction estimation program | |
JP2018165761A (ja) | 音声処理装置、音声処理方法及びプログラム | |
JP2006215564A (ja) | 自動音声認識システムにおける単語精度予測方法、及び装置 | |
KR20210137146A (ko) | 큐의 클러스터링을 사용한 음성 증강 | |
JP6538624B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
Martín-Doñas et al. | Dual-channel DNN-based speech enhancement for smartphones | |
JP2010175431A (ja) | 音源方向推定装置とその方法と、プログラム | |
JP4871191B2 (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 | |
BR112014009647B1 (pt) | Aparelho de atenuação do ruído e método de atenuação do ruído | |
JP6724290B2 (ja) | 音響処理装置、音響処理方法、及び、プログラム | |
JP5726790B2 (ja) | 音源分離装置、音源分離方法、およびプログラム | |
JP5134477B2 (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 | |
Al-Karawi et al. | The effects of distance and reverberation time on speaker recognition performance | |
JP5147012B2 (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 | |
Gburrek et al. | On source-microphone distance estimation using convolutional recurrent neural networks | |
JP5044581B2 (ja) | 複数信号強調装置とその方法と、プログラム | |
JP6633579B2 (ja) | 音響信号処理装置、方法及びプログラム | |
KR20210110081A (ko) | 심층 신경망 기반의 방향각 추정 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20101008 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101012 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20101008 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120326 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121030 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121109 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151116 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |