JP2010049086A - 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 - Google Patents
目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2010049086A JP2010049086A JP2008214097A JP2008214097A JP2010049086A JP 2010049086 A JP2010049086 A JP 2010049086A JP 2008214097 A JP2008214097 A JP 2008214097A JP 2008214097 A JP2008214097 A JP 2008214097A JP 2010049086 A JP2010049086 A JP 2010049086A
- Authority
- JP
- Japan
- Prior art keywords
- value
- signal
- frame
- target signal
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】複数のセンサで観測された各信号を所定の時間区間であるフレーム毎に切り出し、切り出された各センサについての各フレームの信号を周波数領域に変換し、時間周波数ビン毎の周波数領域信号を各センサについて生成する。また、基本周波数を推定し、基本周波数又はその倍音成分近傍のグリッドのみについて、基準センサに対応する周波数領域信号を基準として、当該基準センサ以外のセンサに対応する各周波数領域信号を正規化し、時間周波数ビン毎の正規化信号値を生成する。そして、グリッド毎に正規化信号値の偏在性を示す偏在値を求め、それらを用いてフレーム毎の偏在性を示す偏在性指標値を算出し、当該偏在性指標値を指標とし、各フレームが目的信号区間に対応するか否かを判定する。
【選択図】図1
Description
Alvarez, A., Gomez, P., Nieto, V., Martinez, R., and Rodellar, V., "Application of a first-order differential microphone for efficient voice activity detection in a car platform", Proceedings of Interspeech, 2669-2672, 2005. 田中貴雅,傳田遊亀,中山雅人,西浦敬信,"Weighted CSP法と音声特徴量に基づくハンズフリー発話区間検出の検討",日本音響学会2006年度春期全国大会講演論文集,1-P-3, pp. 149-150, Mar. 2006. 山本潔,浅野太,吉村隆,本村陽一,麻生英樹,原功,市村直幸,緒方淳,北脇信彦,"音響情報と画像情報の統合による発話区間検出・分離システムの評価," 日本音響学会秋季研究発表会講演論文集,3−6−10,P121−122,2003. 藤本雅清,有木康雄,堂下修司,"マルチモーダルインタラクションによるニュース映像中の人物認識,"日本音響学会誌,Vol.62,No.3,P182−192,2006. 荒木章子,藤本雅清,石塚健太郎,澤田宏,牧野昭二,「音声区間検出と方向情報を用いた会議音声話者識別システムとその評価」,日本音響学会春季研究発表会,pp.1−4,2008. Juan E. Rubio, Kentaro Ishizuka, Hiroshi Sawada, Shoko Araki, Tomohiro Nakatani, and Masakiyo Fujimoto, "Two-Microphone Voice Activity Detection Based on the Homogeneity of the Direction of Arrival Estimates," Proceedings of the 32nd International Conference on Acoustics, Speech, and Signal Processing, Vol. 4, pp. 385-388, 2007.
図1は、本形態の目的信号区間推定装置10の全体構成を例示したブロック図である。また、図2は、図1の偏在性指標値算出部16の詳細構成を例示したブロック図である。また、図3は、図1の判定部17の詳細構成を例示したブロック図である。
図1に例示するように、本形態の目的信号区間推定装置10は、信号切出部11と周波数領域変換部12と基本周波数推定部13と時間周波数領域分割部14と正規化部15と偏在性指標値算出部16と判定部17と制御部18と記憶部19とを具備し、S(S≧2)個のセンサ20−1〜Sで観測され、サンプリング部30でサンプリングされた信号が入力され、目的信号区間の分析結果を出力する装置である。また、図2(a)に例示するように、この例の偏在性指標値算出部16は、ヒストグラム生成部16aと確率密度関数計算部16bとエントロピー計算部16cと平均部16dを具備する。また、図2(b)に例示するように、この例の判定部17は、相対値計算部17aと尤度比算出部17bと閾値判定部17cとを具備する。
次に、本形態の目的信号区間推定方法について説明する。
本形態の目的信号区間推定方法では、複数のセンサ20−1〜S(S≧2)で観測された各信号を時間周波数分析し、特定の基準センサを基準とした正規化信号値を求め、所定の時間周波数区間であるグリッド内における正規化信号値の偏在性に基づいて、目的信号の有無を検出して出力する。なお、本形態では、複数のセンサ20−1〜Sとしてマイクロフォンを利用し、それらで観測された各音響信号を用い、音声信号や音楽信号などの目的信号の有無を検出して出力する場合を例示する。また、以下では明記しないが、目的信号区間推定装置10は、制御部18の制御に基づいて各演算処理を実行し、各演算処理の過程で得られたデータは記憶部19に逐次格納され、それ以降の各演算処理に利用される。
XGRIDg(s,i,k)={X(s,i+P,k'+Q)} ...(4)
なお、前述したように、本発明では、正規化信号値のグリッド毎の偏在性を示す偏在値を求め、当該グリッド毎の偏在値を用い、正規化信号値のフレーム毎の偏在性を示す偏在性指標値を算出し、そのフレームが目的信号区間であるか否かの判定を行う。ここで、グリッドの時間周波数区間が広すぎるとグリッド内での正規化信号値の偏在性が平坦化され、偏在性から目的信号区間であるか非目的信号区間であるかを判定することが困難となる。逆にグリッドの時間周波数区間が狭すぎると、サンプル数が少ないため全てのグリッドでの正規化信号値の偏在性が高くなり、偏在性から目的信号区間であるか非目的信号区間であるかを判定することが困難となる。よって、グリッド幅はこのような問題が生じない範囲で設定する必要がある。以下に好ましいグリッド幅の設定方法について説明する。
信号が音声信号の場合、およそ音声信号の定常性が仮定できる50〜300 msの時間長に対応するAを決定すればよい。すなわち、フレームシフトの幅をSF msとすると、50/SF〜300/SFの間の整数値をAとすればよい。また、話者の発話速度SR syllables/sec(1秒あたりに発話される音節数)が事前に分かるならば、(1000/SR)/SF近傍の(例えば最も近い)整数値をAとしてもよい(例えば、SR=7 syllables/sec, SF=16msならば、(1000/SR)/SF=(1000/7)/16=8.93なので、A=9とする、など)。また、対象信号が音楽信号ならば、音楽のリズム(音声のSRに対応)から同様にAを求める値を用いることが望ましい。
基本的に、窓関数w(n)のメインローブ幅から得られる幅を用いるとよい。例えば、窓関数w(n)の離散フーリエ変換値をW(k)とし、1<k<M/2の範囲で20 log10(W(k)/W(0))> -60dBを満たす最大の周波数ビンkをcfとし、cf・2+1近傍の(例えば最も近い)整数値をBとする。この値はサンプリング周波数fs,分析フレーム長L,離散フーリエ変換の周波数ビンの総数Mに応じて変化する(例えば、サンプリング周波数 8kHz,窓関数の幅が256サンプル点,M=256ならば、cf=2となり、B=5となる)。
本形態では正規化信号値ZGRIDg(i,k)の一例として、S=2とし、基準センサ20−1に対応する周波数領域信号XGRIDg(1,i,k)と、他方のセンサ20−2に対応する周波数領域信号XGRIDg(2,i,k)とから信号到来方向を推定し、その信号到来方向推定値を正規化信号値ZGRIDg(i,k)とする(正規化信号値ZGRIDg(i,k)の例1)。この例では、正規化部15は、以下の式(7)(8)によって算出された信号到来方向θg(i,k)を正規化信号値ZGRIDg(i,k)とする。なお、νは音速(約340m/秒)を示し、dはセンサ間距離(m)を示し、fは周波数ビンkに対応する離散周波数f=fs・k/Mを示し、arg(・)は・の位相(偏角)を示す。また、τg(i,k)は信号源から各センサ20−1,2までの信号到達時間差を示し、θg(i,k)は信号到来方向推定値を示す。また、式(8)によって算出される信号到来方向θg(i,k)は、センサ20−1,2を結ぶ線分の中点を通り、その線分と直交する方向を0radianとした角度(radian)である。なお、このように算出された正規化信号値ZGRIDg(i,k)は、周波数成分fが正規化され、周波数依存性が排除された値となる。
また、基準センサ20−Jと各センサ20−sとの信号到達時間差τg(s,i,k)を以下の式(10)で求め、それらを要素とした信号到達時間差ベクトルτg'(i,k)を以下の式(11)のように求める。
上述の式(9)〜(11)には以下の式(12)の関係が成り立ち、以下の式(12)から目的信号の到来方位角推定値θg(i,k)と仰角推定値φg(i,k)とを求める。なお、式(12)におけるD-1はムーア・ペンローズ型一般化逆行列などの一般化逆行列である。また、目的信号の到来方位角とはx−y平面上の目的信号の到来方向を意味し、目的信号の仰角とはx−z平面上の目的信号の到来方向を意味する。また、y軸線方向が0radianである。
また、上述の正規化信号値Z (i,k)の例1〜7で例示した正規化信号値ZGRIDg(i,k)を組み合わせ、時間周波数ビン(i,k)毎に2以上の正規化信号値ZGRIDg(i,k)算出する構成であってもよい(正規化信号値ZGRIDg(i,k)の例8)。例えば、位相差arg(XGRIDg(2,i,k)/XGRIDg(1,i,k))と振幅の比|XGRIDg(2,i,k)|/|XGRIDg(1,i,k)|との組を時間周波数ビン(i,k)の正規化信号値ZGRIDg(i,k)としてもよい。また、例えばS=3とし、位相差arg(XGRIDg(2,i,k)/XGRIDg(1,i,k))と振幅の比|XGRIDg(3,i,k)|/|XGRIDg(1,i,k)|との組を時間周波数ビン(i,k)の正規化信号値ZGRIDg(i,k)としてもよい。また、上述のように生成した値の写像を正規化信号値ZGRIDg(i,k)としてもよい([正規化信号値ZGRIDg(i,k)の例]の説明終わり)。
この例の場合、まず、偏在性指標値算出部16のヒストグラム生成部16a(図2)が、入力された各正規化信号値ZGRID1(i,k),...,ZGRIDG(i,k)をそれぞれC個の値Z(c)(c=1,..,C)に量子化し、量子化された正規化信号値Z(c)の頻度bin1(i,k,c),...,binG(i,k,c)(c=1,...,C)をグリッド毎に求め、グリッド毎のヒストグラムを生成する(ステップS71)。例えば、正規化信号値ZGRIDg(i,k)が信号到来方向θg(i,k)であり、C=32であった場合、各正規化信号値ZGRIDg(i,k)は以下のようなC個の正規化信号値Z(c)に量子化される。
Z(2) (-7π/16≦ZGRIDg(i,k)<-3π/16)
・・・
Z(C) (7π/16<ZGRIDg(i,k)<π/2)
なお、前述の式(7)で算出された信号到達時間差τg(i,k)を正規化信号値ZGRIDg(i,k)とした場合には、ヒストグラム生成部16aは、例えば|τg(i,k)|≦(d/ν)×α(αは正の定数)の単位で正規化信号値ZGRIDg(i,k)をC個に量子化する。
以下に重み係数W(i,k)の例を示す。重み係数W(i,k)の例として、例えば、以下の式(14)のように、全センサについての周波数領域信号X(1,i,k),...,X(S,i,k)のパワーを合算し、それを全センサ・全周波数についての周波数領域信号X(1,i,k),...,X(S,i,k)のパワー総和で正規化した値を例示できる(重み係数W(i,k)の例1)。
W(i,k)=|X(J,i,k)|2 ...(19)
なお、重み係数W(i,k)を1などの固定値としてもよい。また、雑音環境や目的信号の状況に応じ、重み係数W(i,k)を1などの固定値とする場合と、重み係数W(i,k)の例1〜4のように重み係数W(i,k)を逐次算出する場合と、を切り替え制御可能な構成としてもよい(《重み係数W(i,k)の例》の説明終わり)。
例えば、図2の偏在性指標値算出部16の代わりに、図7の偏在性指標値算出部16を用いてもよい(偏在性指標値H(i)の変形例1)。この例では分散を偏在性指標値H(i)として用いる。この場合、まず、偏在性指標値算出部16の平均値算出部16eに、正規化信号値ZGRIDg(i,k)が入力される。平均値算出部16eは、以下の式(22)のように、時間周波数ビン(i,k)毎に各正規化信号値ZGRIDg(i,k)を重み係数W(i,k)で重み付けし、グリッド毎に重み付け後の平均値Eg(i,k)を求めて出力する。なお、μはグリッド毎の正規化信号値ZGRIDg(i,k)の要素数である。
図3及び図6に示す例では、まず、判定部17の相対値算出部17a(図3)は、式(21)によって算出されて偏在性指標値算出部16から出力された偏在性指標値のうち、判定対象のフレームの偏在性指標値H’(i)とし、目的信号が存在しないと推定される非目的信号区間のフレームの偏在性指標値λとし、それらの比である除算値γ(i)を以下のように算出して出力する(ステップS81)。なお、目的信号が存在しないと推定される非目的信号区間の一例、例えば、i=1,...,20などの初期区間である。
次に、尤度比算出部17bに除算値γ(i)が入力され、尤度比算出部17bは、以下の式(26)に従って尤度比Λ(i)を算出して出力する(ステップS82)。なお、式(26)の対数は自然対数である。また、この尤度比の計算式は、例えば、Shon, J, Kim, N.-S., and Sung, W., “A Statistical Model-based Voice Activity Detection,” IEEE Signal Processing Letters, Vol. 6, No. 1, pp.1-3, 1999.等に開示されている。
例えば、図3の判定部17の代わりに、図9の判定部17を用いてもよい(目的信号区間判定方法の変形例1)。この変形例の場合、第1値算出部17aに前述の判定対象のフレームの偏在性指標値H’(i)と、目的信号が存在しないと推定される非目的信号区間のフレームの偏在性指標値λとが入力され、それらの比である除算値γ(i)を上述の式(25)のように算出して出力する。次に、閾値判定部17dに除算値γ(i)が入力され、閾値判定部17dは、フレームi毎に除算値γ(i)と閾値thとを比較し、除算値γ(i)が閾値thよりも大きい場合(「閾値th以上の場合」としてもよい)、除算値γ(i)に対応するフレームiが目的信号区間に対応し、そうでなければ除算値γ(i)に対応するフレームiが非目的信号区間であると判定し、その判定結果(1 or 0)を出力する。また、除算値γ(i)を用いる代わりに、偏在性指標値H’(i)から偏在性指標値λを減算した減算値を用い、その減算値に対して上記と同様な閾値処理を行って、目的信号区間であるか否かを推定してもよい。
本形態の効果を示すための実験結果を示す。この実験では、センサとして2本のマイクロフォンを用い、音声信号と雑音信号が混在する音響信号を観測し、その音響信号を本形態の信号区間推定方法によって分析し、音声信号区間を検出する実施例を示す。なお、この実験では、正規化信号値Z (i,k)として信号到来方向推定値を用い、偏在性指標値H(i)として式(21)によって算出されて偏在性指標値算出部16から出力された偏在性指標値を用いて目的信号区間の推定を行った。
(サンプリング周波数/基本周波数推定の探索範囲の下限周波数)/離散フーリエ変換の点数
により計算することができる。本形態に例示したサンプリング周波数(16kHz)と離散フーリエ変換の点数(512点)、及び基本周波数推定の探索範囲の下限周波数(50Hz)の場合は、(16000/50)/512=約31.25%の計算量で済む。実際は、推定される基本周波数の値は50~500Hzに分布するため、上記の実験により示されたように、最悪の計算量よりも少ない時間で計算が可能となる。
Claims (10)
- 目的信号区間を推定する目的信号区間推定装置であって、
複数のセンサで観測された各信号をそれぞれ所定の時間区間であるフレーム毎に切り出す信号抽出部と、
上記信号切出部で切り出された各フレームの信号を周波数領域に変換し、時間周波数ビン毎の周波数領域信号を各センサについて生成する周波数領域変換部と、
上記信号切出部で切り出された各フレームの信号の基本周波数をそれぞれ推定する基本周波数推定部と、
上記基本周波数又はその各倍音成分をそれぞれ含む有限の時間周波数区間であるグリッドを上記フレーム毎に1以上ずつ特定し、各グリッドに属する各時間周波数ビンの上記周波数領域信号を抽出する時間周波数領域分割部と、
上記センサに含まれる特定の基準センサに対応する上記時間周波数領域分割部で抽出された上記周波数領域信号を基準として、少なくとも当該基準センサ以外の上記センサに対応する上記時間周波数領域分割部で抽出された各周波数領域信号を正規化し、上記センサで観測された信号の到来方向に対応する正規化信号値を時間周波数ビン毎に生成する正規化部と、
上記正規化信号値の上記グリッド毎の偏在性を示す偏在値を求め、当該グリッド毎の偏在値を用い、上記正規化信号値の上記フレーム毎の偏在性を示す偏在性指標値を算出する偏在性指標値算出部と、
を有することを特徴とする目的信号区間推定装置。 - 請求項1の目的信号区間推定装置であって、
上記偏在性指標値を指標とし、各フレームが上記目的信号区間に対応するか否かを判定する判定部をさらに有する、
ことを特徴とする目的信号区間推定装置。 - 請求項1又は2の目的信号区間推定装置であって、
上記偏在性指標値算出部は、
上記正規化信号値を量子化し、量子化された正規化信号値の頻度を上記グリッド毎に求め、上記グリッド毎のヒストグラムを生成するヒストグラム生成部と、
上記グリッド毎のヒストグラムを用い、当該ヒストグラムの分布の偏りを示す偏在値を上記グリッド毎に算出する偏在性計算部と、
同一のフレームに対応する各グリッドの上記偏在値を平均し、その平均値を当該フレームの上記偏在性指標値として算出する平均部と、
を有することを特徴とする目的信号区間推定装置。 - 請求項3の目的信号区間推定装置であって、
上記偏在性計算部は、
上記グリッド毎のヒストグラムを用い、上記量子化された各正規化信号値にそれぞれ対応する値を確率変数とする確率密度関数を上記グリッド毎に求める確率密度関数生成部と、
上記確率密度関数のエントロピーに対して単調増加する関数値、又は、当該エントロピーに対して単調減少する関数値を、上記偏在値として求める偏在値算出部と、
を有することを特徴とする目的信号区間推定装置。 - 請求項2から4の何れかに記載の目的信号区間推定装置であって、
上記判定部は、
各フレームの上記偏在性指標値又はそれらの写像と、所定の閾値と、の大小を比較し、各フレームが上記目的信号区間であるか否かを判定する、
ことを特徴とする目的信号区間推定装置。 - 請求項2から4の何れかに記載の目的信号区間推定装置であって、
上記判定部は、
判定対象のフレームの上記偏在性指標値と、非目的信号区間のフレームの上記偏在性指標値と、の比である除算値又は当該除算値の写像が、所定の閾値以上であった場合に上記判定対象のフレームが上記目的信号区間であると判定するか、当該所定の閾値を超える場合に上記判定対象のフレームが上記目的信号区間であると判定する閾値判定部と、を有する、
ことを特徴とする目的信号区間推定装置。 - 請求項2から4の何れかに記載の目的信号区間推定装置であって、
上記判定部は、
事前学習されたフレームの上記偏在性指標値と当該フレームが上記目的信号区間であるか否かの判定結果との関係を用いたパターン認識により、上記偏在性指標値算出部で算出された上記偏在性指標値に対応するフレームが上記目的信号区間であるか否かを判定する、
ことを特徴とする目的信号区間推定装置。 - 目的信号区間を推定する目的信号区間推定装置の目的信号区間推定方法であって、
信号抽出部が、複数のセンサで観測された各信号をそれぞれ所定の時間区間であるフレーム毎に切り出すステップと、
周波数領域変換部が、上記信号切出部で切り出された各フレームの信号を周波数領域に変換し、時間周波数ビン毎の周波数領域信号を各センサについて生成するステップと、
基本周波数推定部が、上記信号切出部で切り出された各フレームの信号の基本周波数をそれぞれ推定するステップと、
時間周波数領域分割部が、上記基本周波数又はその各倍音成分をそれぞれ含む有限の時間周波数区間であるグリッドを上記フレーム毎に1以上ずつ特定し、各グリッドに属する各時間周波数ビンの上記周波数領域信号を抽出するステップと、
正規化部が、上記センサに含まれる特定の基準センサに対応する上記時間周波数領域分割部で抽出された上記周波数領域信号を基準として、少なくとも当該基準センサ以外の上記センサに対応する上記時間周波数領域分割部で抽出された各周波数領域信号を正規化し、上記センサで観測された信号の到来方向に対応する正規化信号値を時間周波数ビン毎に生成するステップと、
偏在性指標値算出部が、上記正規化信号値の上記グリッド毎の偏在性を示す偏在値を求め、当該グリッド毎の偏在値を用い、上記正規化信号値の上記フレーム毎の偏在性を示す偏在性指標値を算出するステップと、
を有することを特徴とする目的信号区間推定方法。 - 請求項1から7の何れかに記載の目的信号区間推定装置としてコンピュータを機能させるための目的信号区間推定プログラム。
- 請求項9に記載の目的信号区間推定プログラムを格納したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008214097A JP5147012B2 (ja) | 2008-08-22 | 2008-08-22 | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008214097A JP5147012B2 (ja) | 2008-08-22 | 2008-08-22 | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2010049086A true JP2010049086A (ja) | 2010-03-04 |
| JP5147012B2 JP5147012B2 (ja) | 2013-02-20 |
Family
ID=42066208
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008214097A Expired - Fee Related JP5147012B2 (ja) | 2008-08-22 | 2008-08-22 | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5147012B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010072164A (ja) * | 2008-09-17 | 2010-04-02 | Nippon Telegr & Teleph Corp <Ntt> | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 |
| JP2012215600A (ja) * | 2011-03-31 | 2012-11-08 | Oki Electric Ind Co Ltd | 音声区間判定装置、音声区間判定方法、及びプログラム |
-
2008
- 2008-08-22 JP JP2008214097A patent/JP5147012B2/ja not_active Expired - Fee Related
Non-Patent Citations (3)
| Title |
|---|
| CSNJ201010078415; 石塚 健太郎 Kentaro ISHIZUKA: '信号到来方向の推定値の偏りを用いた耐雑音音声区間検出法' 日本音響学会 2007年 秋季研究発表会講演論文集CD-ROM [CD-ROM] , 20070921, 日本音響学会 * |
| JPN6012035638; 石塚 健太郎 Kentaro ISHIZUKA: '信号到来方向の推定値の偏りを用いた耐雑音音声区間検出法' 日本音響学会 2007年 秋季研究発表会講演論文集CD-ROM [CD-ROM] , 20070921, 日本音響学会 * |
| JPN6012035640; Juan E. Rubio, Kentaro Ishizuka, Hiroshi Sawada, Shoko Araki: '"Two-Microphone Voice Activity Detection Based on the Homogeneity of the Direction of Arrival Estima' Proceedings of the 32nd International Conference on Acoustics, Speech, and Signal Processi&# * |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010072164A (ja) * | 2008-09-17 | 2010-04-02 | Nippon Telegr & Teleph Corp <Ntt> | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 |
| JP2012215600A (ja) * | 2011-03-31 | 2012-11-08 | Oki Electric Ind Co Ltd | 音声区間判定装置、音声区間判定方法、及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP5147012B2 (ja) | 2013-02-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN108597496B (zh) | 一种基于生成式对抗网络的语音生成方法及装置 | |
| US10373609B2 (en) | Voice recognition method and apparatus | |
| EP1536414B1 (en) | Method and apparatus for multi-sensory speech enhancement | |
| US7499686B2 (en) | Method and apparatus for multi-sensory speech enhancement on a mobile device | |
| Mousazadeh et al. | Voice activity detection in presence of transient noise using spectral clustering | |
| US20190172480A1 (en) | Voice activity detection systems and methods | |
| US20150340027A1 (en) | Voice recognition system | |
| EP2083417B1 (en) | Sound processing device and program | |
| JP6195548B2 (ja) | 信号解析装置、方法、及びプログラム | |
| CN112002307B (zh) | 一种语音识别方法和装置 | |
| WO2012063963A1 (ja) | 音声認識装置、音声認識方法、および音声認識プログラム | |
| Zhu et al. | A robust and lightweight voice activity detection algorithm for speech enhancement at low signal-to-noise ratio | |
| Berdibaeva et al. | Pre-processing voice signals for voice recognition systems | |
| CN115223584A (zh) | 音频数据处理方法、装置、设备及存储介质 | |
| JP4871191B2 (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 | |
| Saleem et al. | Spectral phase estimation based on deep neural networks for single channel speech enhancement | |
| JP5147012B2 (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 | |
| Wang et al. | Deep learning approaches for voice activity detection | |
| JP6724290B2 (ja) | 音響処理装置、音響処理方法、及び、プログラム | |
| Sinha et al. | Voice-Based Speaker Identification and Verification | |
| Dov et al. | Voice activity detection in presence of transients using the scattering transform | |
| JP5134477B2 (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 | |
| Ondusko et al. | Blind signal-to-noise ratio estimation of speech based on vector quantizer classifiers and decision level fusion | |
| Sharma et al. | Unsupervised voice activity detection with improved signal-to-noise ratio in noisy environment | |
| Nidhyananthan et al. | A review on speech enhancement algorithms and why to combine with environment classification |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110627 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110627 |
|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20111121 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20111121 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120628 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120710 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120831 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120918 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121025 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121113 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121121 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5147012 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151207 Year of fee payment: 3 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |
