JP3849116B2 - 音声検出装置及び音声検出プログラム - Google Patents

音声検出装置及び音声検出プログラム Download PDF

Info

Publication number
JP3849116B2
JP3849116B2 JP2001055324A JP2001055324A JP3849116B2 JP 3849116 B2 JP3849116 B2 JP 3849116B2 JP 2001055324 A JP2001055324 A JP 2001055324A JP 2001055324 A JP2001055324 A JP 2001055324A JP 3849116 B2 JP3849116 B2 JP 3849116B2
Authority
JP
Japan
Prior art keywords
voice
speech
feature amount
regularity
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001055324A
Other languages
English (en)
Other versions
JP2002258881A (ja
Inventor
香緒里 遠藤
恭士 大田
真司 中間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001055324A priority Critical patent/JP3849116B2/ja
Publication of JP2002258881A publication Critical patent/JP2002258881A/ja
Application granted granted Critical
Publication of JP3849116B2 publication Critical patent/JP3849116B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、音声検出装置及び音声検出プログラムに関する。一般に、音声信号を音声符号化器により圧縮して伝送する音声通信システム等では、通常の会話では約6割が発声の無い非音声区間であることに着目し、音声・非音声区間を判定することにより、非音声区間は伝送を停止して電池を長持ちさせたり、音声の代わりに他のデータを伝送するなどの通信制御を行うことができる。
【0002】
音声通信システム等における音声検出機能は、このような通信制御を行なうために、音声・非音声区間の判定を行なう。しかし、騒音環境などの条件によっては音声・非音声区間の判定に誤りが起こり、それによって音切れが発生するなどして通話品質が著しく損なわれることがあり、音声・非音声区間を精度良く判定することが要求されている。
【0003】
【従来の技術】
図5は従来の音声検出装置を示す。従来の音声検出装置は、環境騒音が重畳した音声信号が入力信号入力手段5−1に加えられ、入力手段5−1から時系列的に順に出力されるフレーム毎の入力信号に対して、音声特徴量算出手段5−2により、音声信号の電力、零交差率、パワースペクトルのピーク周波数、又はピッチ周期等の音声信号の特徴量を計算し、音声判定手段5−3において、これらの音声特徴量を閾値と比較することによって、当該フレームに音声が含まれているかどうかを判定する。
【0004】
【発明が解決しようとする課題】
しかしながら、従来の音声検出装置では環境騒音が大きい場合、雑音区間と音声区間との音声特徴量の差が小さくなり、音声・非音声区間を精度良く判定することが困難である。本発明は、環境騒音の影響を受け難くするように、音声特徴量に処理を加えることで、環境騒音が大きい場合でも、精度良く音声・非音声を判定することができる音声検出装置及び音声検出プログラムを提供することを目的とする。
【0005】
【課題を解決するための手段】
本発明の音声検出装置は、(1)入力信号として環境騒音が重畳した音声信号が時系列順に与えられるフレーム毎に、当該フレームに音声が含まれているか否かを判定する音声検出装置であって、電力、零交差率、パワースペクトルのピーク周波数、ピッチ周期のうち少なくとも一つを用いて音声の特徴量を算出する音声特徴量算出手段と、パワースペクトルのピーク周波数の高次成分のみの相違を基に音声の特徴量を算出する高次成分強調特徴量算出手段と、前記音声特徴量算出手段及び高次成分強調特徴量算出手段により算出された特徴量を基に、音声か非音声であるかを判定する音声判定手段と、を備えたものである。
【0006】
また、(2)電力、零交差率、パワースペクトルのピーク周波数、ピッチ周期のうち少なくとも一つを用いて音声の特徴量を算出する音声特徴量算出手段と、音声の共振周期の規則性を算出する共振周期の規則性算出手段と、前記音声特徴量算出手段により算出した音声特徴量及び規則性算出手段により算出した音声の共振周期の規則性を基に、音声か非音声であるかを判定する音声判定手段と、を備えたものである。
【0007】
また、本発明の音声検出プログラムは、(3)入力信号として環境騒音が重畳した音声信号が時系列順に与えられるフレーム毎に、当該フレームに音声が含まれているか否かを判定する音声検出プログラムであって、電力、零交差率、パワースペクトルのピーク周波数、ピッチ周期のうち少なくとも一つを用いて音声の特徴量を算出する音声特徴量算出手順と、パワースペクトルのピーク周波数の高次成分のみの相違を基に音声の特徴量を算出する高次成分強調特徴量算出手順と、前記音声特徴量算出手順及び高次成分強調特徴量算出手順により算出された特徴量を基に、音声か非音声であるかを判定する音声判定手順と、を実行させるものである。
【0008】
また、(4)電力、零交差率、パワースペクトルのピーク周波数、ピッチ周期のうち少なくとも一つを用いて音声の特徴量を算出する音声特徴量算出手順と、音声の共振周期の規則性を算出する共振周期の規則性算出手順と、前記音声特徴量算出手順により算出した音声特徴量及び規則性算出手順により算出した音声の共振周期の規則性を基に、音声か非音声であるかを判定する音声判定判定手順と、を実行させるものである。
【0009】
また、(5)電力、零交差率、パワースペクトルのピーク周波数、ピッチ周期のうち少なくとも一つを用いて音声の特徴量を算出する音声特徴量算出手順と、パワースペクトルのピーク周波数の高次成分のみの相違を基に音声の特徴量を算出する高次成分強調特徴量算出手順と、音声の共振周期の規則性を算出する共振周期の規則性算出手順と、前記音声特徴量算出手順により算出した音声特徴量、高次成分強調特徴量算出手順により算出した特徴量、及び規則性算出手順により算出した音声の共振周期の規則性を基に、音声か非音声であるかを判定する音声判定手順と、を実行させるものである。
【0010】
【発明の実施の形態】
図1は本発明の音声検出装置の第1の実施形態を示す。本発明の第1の実施形態は、入力手段1−1から時系列的に順に与えられるフレーム毎の入力信号に対して、音声特徴量算出手段1−2により、従来と同様に音声信号の特徴量を算出すると共に、高次成分強調手段1−3により、音声周波数の特徴量の高域成分を強調させた特徴量を算出する。音声判定手段1−4は、従来の特徴量に加えて高域成分を強調させた特徴量を基に、音声・非音声判定を行う。
【0011】
従来の音声検出方式及び装置では、音声周波数の高次の成分に着目することなく、全般的なパワースペクトルのピーク周波数が音声と非音声とで異なることを利用して判定している。これに対し本発明では、音声は低域の周波数成分にエネルギーが集中するのに対し、非音声は一般に特定の周波数領域へのエネルギーの集中がないので、高次の成分ほど音声と非音声との特徴量の差が大きくなることを利用して、高次の成分の違いを強調した特徴量を算出する。この特徴量を用いて判定することで、騒音の影響が大きい場合でも、正確に音声・非音声を判定することができる。
【0012】
図2は本発明の音声検出装置の第2の実施形態を示す。本発明の第2の実施形態は、入力手段2−1から時系列的に順に与えられるフレーム毎の入力信号に対して、音声特徴量算出手段2−2により、従来と同様に音声信号の特徴量を算出すると共に、共振周期の規則性算出手段2−3により、音声の共振周期の規則性を算出する。そして、音声判定手段2−4は、従来の特徴量に加えて音声の共振周期の規則性を基に、音声・非音声判定を行う。
【0013】
従来の音声検出方式及び装置では、通常は最も自己相関が高くなる周期を共振周期として求め、該共振周期を用いて音声・非音声を判定する。しかし、騒音の種類によっては、音声と同じような共振周期を有する場合があり、このような場合には判別が困難となる。
【0014】
母音などの音声は声道の共振によって生成されるため、声道の基本周期の倍数にエネルギーが集中し、共振する複数の周期(共振周期)の間に規則性が現れるのに対し、非音声では特別な規則性がないことに着目し、本発明は、音声の共振周期の規則性を算出し、これを基に音声・非音声を判定する。
【0015】
こうすることにより、最も自己相関が高くなる周期が音声と騒音で一致する場合でも、音声のみが複数の共振周期の間に規則性が現れるので、騒音と判別することができ、騒音の影響が大きい場合でも、正確に音声・非音声を判定することが可能になる。
【0016】
更に、本発明の第1の実施形態として説明したパワースペクトルのピーク周波数の高次成分の違いを強調した特徴量と、第2の実施形態として説明した音声の共振周期の規則性とを組合わせて、音声・非音声の判定を行うことにより、騒音の影響が大きい場合でも、より正確に音声・非音声を判定することが可能となる。
【0017】
図3は本発明の音声検出の処理フローを示す。同図はパワースペクトルのピーク周波数をPARCOR分析で得られる10次の線スペクトル周波数LSF[i](1≦i≦10)とした場合の処理フローの例を示している。ここで、従来の音声検出により用いられる特徴量を、フレーム電力E、零交差数Z,10次の線スペクトル周波数から求めた特徴量L1,共振周波数F1とする。そして、パワースペクトルのピーク周波数の高次成分を強調した特徴量をL2、共振周期の規則性をF2とする。
【0018】
先ず、ステップ3−1において、非音声区間のパラメータを以下の式(1)のとおり初期化する。ここで、非音声区間のフレーム電力をEN 、非音声区間の零交差数をZN 、非音声区間の線スペクトル周波数をLSFN [i]と表すものとする。
N =0,ZN =0,LSFN [i]=0 (1≦i≦10) …(1)
【0019】
次にステップ3−2により、入力音声を読み込む。次に、ステップ3−3により、現フレームのパラメータを以下の式(2)〜(5)により算出する。ここで、現フレームの電力をE、零交差数をZ、共振周波数をF1と表す。
【数1】
Figure 0003849116
【0020】
ここで、x(i)は現フレームのi番目の入力音声信号振幅値であり、sgn(x(i),x(i+1))は、x(i)とx(i+1)の符号が異なるとき1、同符号のとき0となる関数である。MAX(corr[k])は、k(1≦k≦143)サンプルずらして求めた自己相関のうち、最大値のkを表す。sはサンプリングレート(Hz)を表す。
【0021】
次にステップ3−4により、現フレームの特徴量と非音声区間の特徴量の差分を以下の式(6)により算出する。ここで、フレーム電力の差分をΔE、零交差数の差分をΔZで表す。
ΔE=E−EN ,ΔZ=Z−ZN …(6)
また、L1を以下の式(7)により算出する。ここまでは、従来の音声特徴量算出処理と同様である。
【数2】
Figure 0003849116
【0022】
次にステップ3−5により、線スペクトル周波数の高次成分を強調した特徴量L2を算出する。高次成分を強調する手法の一つとして、最高次数の線スペクトル周波数だけを用い、以下の式(8)により高次成分を強調した特徴量L2を算出することができる。この算出処理は、本発明の第1の実施形態における高次成分強調特徴量算出手段で行われる算出処理に相当する。
L2=LSF[10]−LSFN [10] …(8)
【0023】
次にステップ3−6により、共振周期の規則性F2を算出する。この共振周期の規則性F2の算出処理は、本発明の第2の実施形態における共振周期の規則性算出手段で行われる算出処理に相当する。規則性F2の算出の詳細は、図4を参照して後述する。
【0024】
次にステップ3−7により、非音声パラメータの更新を行うかどうかを判定するために、ΔE,ΔZ,L1,F1,L2,F2を、予め与えられた閾値THEN,THZN,THL1,THF1,THL2.THF2とそれぞれ比較する。そして、
ΔE<THEN∩ΔZ<THZN∩L1<THL1∩F1>THF1∩L2<THL2∩F2<THF2
の条件が成り立つ場合には更新を行うために、ステップ3−8へ処理を進め、上記条件が成り立たない場合には、更新を行うことなくステップ3−9へ処理を進める。
【0025】
ステップ3−8において、非音声パラメータを以下の式(9),(10)により更新する。
N =αE+(1−α)E,Z N =βZ+(1−β)Z …(9)
LSF[i]N =γLSF[i]+(1−γ)LSF[i]N …(10)
α,β,γは予め与えられた値で、0≦α,β,γ≦1、1≦i≦10である。
【0026】
次にステップ3−9において、以下の式により音声・非音声の判定を行う。ここで、THE ,THZ ,THL1.THF1,THL2,THF2は予め与えられた閾値とする。
ΔE>THE ∪ΔZ>THZ ∪L1>THL1∪F1<THF1∪L2>THL2∪F2>THF2
の条件が成り立つ場合には、音声と判定してステップ3−10へ処理を進める。上記条件が成り立たない場合には非音声と判定してステップ3−11へ処理を進める。
【0027】
ステップ3−10において音声と判定した旨の信号を出力する。ステップ3−11においては非音声と判定した旨の信号を出力する。ステップ3−12において次の入力信号が無いかどうかを判定し、無い場合には処理を終了する。次の入力信号が有る場合には、ステップ3−2に処理を進め、上記の処理フローを繰り返し実行する。
【0028】
次に、図4を用いて本発明における共振周波数の規則性の算出処理を説明する。先ずステップ4−1において、偏自己相関値(corr[k])を以下の式(11)により計算する。xは入力信号を示す。
【数3】
Figure 0003849116
【0029】
ステップ4−2において、偏自己相関値のピーク値上位10個とそれに対応するkの値を取る。即ち、corr[k−1]<corr[k]>corr[k+1]となる偏自己相関値のうち、値が大きいものから上位10個を取り、これをcor_max[i]とし、対応するkの値をlag[i] 1≦i≦10 とする。ステップ4−3において、cor_max[i]及びlag[i]を、lag[i]の昇順にソートする。ステップ4−4において、i=0,R=9,lnum=10とする。
【0030】
次に、ピーク位置の間隔が所定値TH1以下となるような近過ぎるもの同士を取り出し、その隣合ったもののうちピーク値の大きい方を採用し、所定の間隔以上のピーク値について規則性を調べるため、ステップ4−5において、
lag[i+1]−lag[i]<TH1 …(12)
の式により、ピーク位置の間隔が所定値TH1以下であるかどうか判定し、以下である場合ステップ4−6へ処理を進める。上記の式(12)が成り立たない、即ち所定の間隔TH1以上の場合はステップ4−22へ処理を進める。
【0031】
ステップ4−6において、
cor_max[i]<cor_max[i+1] …(13)
の式が成り立つか判定し、成り立つ場合ステップ4−8へ処理を進める。一方、cor_max[i]≧cor_max[i+1]
である場合、ステップ4−7へ処理を進める。
【0032】
ステップ4−7において、cor_max[i+1],lag[i+1]を除去し、cor_max,lagを以下の式(14),(15)により更新し、ステップ4−11へ処理を進める。
cor_max[j]=cor_max[j+1] …(14)
lag[j]=lag[j+1] i+1≦j≦R−1 …(15)
【0033】
ステップ4−8において、
cor_max[i+1]/cor_max[i]<TH2 …(16)
の式が成り立つか判定し、成り立つ場合ステップ4−10へ処理を進める。
一方、cor_max[i+1]/cor_max[i]≧TH2
の場合、ステップ4−9へ処理を進める。
【0034】
ステップ4−9において、cor_max[i],lag[i]を除去し、cor_max,lagを以下の式(17),(18)により更新し、ステップ4−11へ処理を進める。
cor_max[j]=cor_max[j+1] …(17)
lag[j]=lag[j+1] i≦j≦R−1 …(18)
【0035】
ステップ4−10において、cor_max[i+1],lag[i+1]を除去し、cor_max,lagを以下の式(19),(20)により更新し、ステップ4−11へ処理を進める。
cor_max[j]=cor_max[j+1] …(19)
lag[j]=lag[j+1] i+1≦j≦R−1 …(20)
【0036】
ステップ4−11において、R=R−1,lnum=lnum−1とし、ステップ4−12へ処理を進める。また、前述のステップ4−22において、i=i+1とし、ステップ4−12へ処理を進める。ステップ4−12においてi<Rかどうか判定し、i<Rならばステップ4−5へ処理を進める。i≧Rならばステップ4−13へ処理を進める。
【0037】
ステップ4−13において、lagの数lnumが2以上かどうか判定し、2以上ならばステップ4−15へ処理を進める。lnumが1ならばステップ4−14へ処理を進める。ステップ4−14において、規則性なしを出力する。
【0038】
ステップ4−15において、lagの数が3以上かどうか判定し、3以上ならステップ4−17へ処理を進める。lagの数が2ならばステップ4−16へ処理を進める。ステップ4−16において、
TH3_1<lag[1]/lag[0]<TH3_2 …(21)
が成り立つか判定し、成り立つ場合ステップ4−18へ処理を進める。
TH3_1≧lag[1]/lag[0]、又はlag[1]/lag[0]≧TH3_2 である場合、ステップ4−19へ処理を進める。
【0039】
ステップ4−17において、
TH4_1<lag[1]/lag[0]<TH4_2 …(22)
かつ、TH5_1<lag[2]/lag[0]<TH5_2 …(23)
の条件が成り立つか判定し、成り立つ場合ステップ4−20へ処理を進める。一方、TH4_1≧lag[1]/lag[0]、又はlag[1]/lag[0]≧TH4_2、又はTH5_1≧lag[2]/lag[0]、又はlag[2]/lag[0]≧TH5_2 である場合はステップ4−21へ処理を進める。
【0040】
ステップ4−18では規則性有りを出力する。ステップ4−19では規則性無しを出力する。ステップ4−20では規則性有りを出力する。ステップ4−21では規則性無しを出力する。ここで、規則性有りの場合、共振周期の規則性F2の値として例えば1を、規則性無しの場合、共振周期の規則性F2の値として例えば0を出力する。
【0041】
【発明の効果】
以上説明したように本発明によれば、従来の音声特徴量算出に加えて、環境騒音の影響を受け難いように、高次成分の違いを強調した音声特徴量の算出を行い、この音声特徴量を用いて音声・非音声を判定することにより、従来に比べて騒音の影響が大きい場合でも、より正確に音声・非音声を判定することができる。
【0042】
また、従来の音声特徴量算出に加えて、音声共振周期の規則性の有無を算出し、この規則性を用いて音声・非音声を判定することにより、従来に比べて騒音の影響が大きい場合でも、より正確に音声・非音声を判定することができる。
【0043】
更に、従来の音声特徴量算出に加えて、環境騒音の影響を受け難いように高次成分の違いを強調した特徴量、及び音声共振周期の規則性の有無を算出し、これらを用いて音声・非音声を判定することにより、従来に比べて騒音の影響が大きい場合でも、より正確に音声・非音声を判定することができるようになる。
【図面の簡単な説明】
【図1】本発明の音声検出装置の第1の実施形態を示す図である。
【図2】本発明の音声検出装置の第2の実施形態を示す図である。
【図3】本発明の音声検出の処理フローを示す図である。
【図4】本発明における共振周波数の規則性の算出処理のフロー図である。
【図5】従来の音声検出装置を示す図である。
【符号の説明】
1−1 入力手段
1−2 音声特徴量算出手段
1−3 高次成分強調手段
1−4 音声判定手段

Claims (3)

  1. 入力信号として環境騒音が重畳した音声信号が時系列順に与えられるフレーム毎に、当該フレームに音声が含まれているか否かを判定する音声検出装置であって、
    電力、零交差率、パワースペクトルのピーク周波数、ピッチ周期のうち少なくとも一つを用いて音声の特徴量を算出する音声特徴量算出手段と、
    パワースペクトルのピーク周波数の高次成分のみの相違を基に音声の特徴量を算出する高次成分強調特徴量算出手段と、
    前記音声特徴量算出手段及び高次成分強調特徴量算出手段により算出された特徴量を基に、音声か非音声であるかを判定する音声判定手段と、
    を備えたことを特徴とする音声検出装置。
  2. 入力信号として環境騒音が重畳した音声信号が時系列順に与えられるフレーム毎に、当該フレームに音声が含まれているか否かを判定する音声検出プログラムであって、
    電力、零交差率、パワースペクトルのピーク周波数、ピッチ周期のうち少なくとも一つを用いて音声の特徴量を算出する音声特徴量算出手順と、
    パワースペクトルのピーク周波数の高次成分のみの相違を基に音声の特徴量を算出する高次成分強調特徴量算出手順と、
    前記音声特徴量算出手順及び高次成分強調特徴量算出手順により算出された特徴量を基に、音声か非音声であるかを判定する音声判定手順と、
    を実行させる音声検出プログラム。
  3. 入力信号として環境騒音が重畳した音声信号が時系列順に与えられるフレーム毎に、当該フレームに音声が含まれているか否かを判定する音声検出プログラムであって、
    電力、零交差率、パワースペクトルのピーク周波数、ピッチ周期のうち少なくとも一つを用いて音声の特徴量を算出する音声特徴量算出手順と、
    パワースペクトルのピーク周波数の高次成分のみの相違を基に音声の特徴量を算出する高次成分強調特徴量算出手順と、
    音声の共振周期の規則性を算出する共振周期の規則性算出手順と、
    前記音声特徴量算出手順により算出した音声特徴量、高次成分強調特徴量算出手順により算出した特徴量、及び規則性算出手順により算出した音声の共振周期の規則性を基に、音声か非音声であるかを判定する音声判定手順と、
    を実行させる音声検出プログラム。
JP2001055324A 2001-02-28 2001-02-28 音声検出装置及び音声検出プログラム Expired - Fee Related JP3849116B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001055324A JP3849116B2 (ja) 2001-02-28 2001-02-28 音声検出装置及び音声検出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001055324A JP3849116B2 (ja) 2001-02-28 2001-02-28 音声検出装置及び音声検出プログラム

Publications (2)

Publication Number Publication Date
JP2002258881A JP2002258881A (ja) 2002-09-11
JP3849116B2 true JP3849116B2 (ja) 2006-11-22

Family

ID=18915523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001055324A Expired - Fee Related JP3849116B2 (ja) 2001-02-28 2001-02-28 音声検出装置及び音声検出プログラム

Country Status (1)

Country Link
JP (1) JP3849116B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2434486A2 (en) 2010-09-27 2012-03-28 Fujitsu Limited Voice-band extending apparatus and voice-band extending method
WO2012093470A1 (ja) 2011-01-04 2012-07-12 富士通株式会社 音声制御装置、音声制御方法及び音声制御プログラム
EP3823315A1 (en) 2019-11-18 2021-05-19 Panasonic Intellectual Property Corporation of America Sound pickup device, sound pickup method, and sound pickup program

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4527369B2 (ja) 2003-07-31 2010-08-18 富士通株式会社 データ埋め込み装置及びデータ抽出装置
KR100802984B1 (ko) 2006-11-24 2008-02-14 연세대학교 산학협력단 기준 모델을 이용하여 미확인 신호를 판별하는 방법 및장치
JP2008216618A (ja) * 2007-03-05 2008-09-18 Fujitsu Ten Ltd 音声判別装置
EP2474974A1 (en) 2009-09-02 2012-07-11 Fujitsu Limited Voice reproduction device and voice reproduction method
CN107305774B (zh) * 2016-04-22 2020-11-03 腾讯科技(深圳)有限公司 语音检测方法和装置
CN111883183B (zh) * 2020-03-16 2023-09-12 珠海市杰理科技股份有限公司 语音信号筛选方法、装置、音频设备和系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2434486A2 (en) 2010-09-27 2012-03-28 Fujitsu Limited Voice-band extending apparatus and voice-band extending method
WO2012093470A1 (ja) 2011-01-04 2012-07-12 富士通株式会社 音声制御装置、音声制御方法及び音声制御プログラム
EP3823315A1 (en) 2019-11-18 2021-05-19 Panasonic Intellectual Property Corporation of America Sound pickup device, sound pickup method, and sound pickup program

Also Published As

Publication number Publication date
JP2002258881A (ja) 2002-09-11

Similar Documents

Publication Publication Date Title
KR100744352B1 (ko) 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치
CN109034046B (zh) 一种基于声学检测的电能表内异物自动识别方法
EP0548054A2 (en) Voice activity detector
JP3840684B2 (ja) ピッチ抽出装置及びピッチ抽出方法
US5579435A (en) Discriminating between stationary and non-stationary signals
EP0718822A2 (en) A low rate multi-mode CELP CODEC that uses backward prediction
CN106601230B (zh) 基于连续混合高斯hmm模型的物流分拣地名语音识别方法、系统及物流分拣系统
CN102982804A (zh) 音频分类方法和系统
EP0415163B1 (en) Digital speech coder having improved long term lag parameter determination
JP3849116B2 (ja) 音声検出装置及び音声検出プログラム
CN101149921A (zh) 一种静音检测方法和装置
CN101393741A (zh) 一种宽带音频编解码器中的音频信号分类装置及分类方法
CN111326169A (zh) 一种语音质量的评价方法及装置
US8532986B2 (en) Speech signal evaluation apparatus, storage medium storing speech signal evaluation program, and speech signal evaluation method
CN1218945A (zh) 静态和非静态信号的鉴别
US6954726B2 (en) Method and device for estimating the pitch of a speech signal using a binary signal
CN113077812A (zh) 语音信号生成模型训练方法、回声消除方法和装置及设备
JPH0462399B2 (ja)
WO2001029822A1 (en) Method and apparatus for determining pitch synchronous frames
CN1971707B (zh) 一种进行基音周期估计和清浊判决的方法及装置
Yoo et al. Speech enhancement based on the generalized dual excitation model with adaptive analysis window
Chowdhury et al. Formant estimation from speech signal using the magnitude spectrum modified with group delay spectrum
JPH0650440B2 (ja) Lsp型パタンマツチングボコ−ダ
JPH02266400A (ja) 有音/無音判定回路
JPS63237100A (ja) 音声検出器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040419

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060718

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060818

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090908

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110908

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130908

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees