JPS60200300A - 音声の始端・終端検出装置 - Google Patents

音声の始端・終端検出装置

Info

Publication number
JPS60200300A
JPS60200300A JP59056622A JP5662284A JPS60200300A JP S60200300 A JPS60200300 A JP S60200300A JP 59056622 A JP59056622 A JP 59056622A JP 5662284 A JP5662284 A JP 5662284A JP S60200300 A JPS60200300 A JP S60200300A
Authority
JP
Japan
Prior art keywords
frame
voice
signal
sound
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59056622A
Other languages
English (en)
Other versions
JPH0222960B2 (ja
Inventor
森井 秀二
藤井 諭
昌克 星見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59056622A priority Critical patent/JPS60200300A/ja
Publication of JPS60200300A publication Critical patent/JPS60200300A/ja
Publication of JPH0222960B2 publication Critical patent/JPH0222960B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声認識装置に用いられる音声の始端・終端の
検出装置に関するものである。
従来例の構成とその問題点 音声の始端、終端の検出方法に関する従来例としては、
信号のエネルギーと零交差回数を用いた方法が知られて
いる。これは、新美康永:音声認識、共立出版(19γ
9)、あるいは、L、 R,Rabiner and 
M、 R,8ambur :ムn algovitbm
for determining the endpo
int of 1solatedutterances
 、 Bel l 5yst 、 To’ch、 J、
 、 (1975)に示されている。
零交差回数というのは信号の符号のみを残し、振幅を1
ビツトに量子化した零交差波の一定時間長の区間におけ
る零交差の平均回数である。音声のようにスペクトル構
造をもった信号の零交差回数はスペクトル中の優勢な周
波数成分とよく対応する。第1図(a)〜(C)は音声
信号の零交差回数の分布を示したもので、(→は無音、
(ロ)は無声音、(C)は有声音の分布である。図から
分るように、音声信号の零交差回数は、有声音のように
低域の周波数成分の優勢は音声では第1図(C)のよう
に小さな値を示し、無声音のように高域の周波数成分の
優勢な音声では第1図(b)のように大きな値を示す。
従来法による音声の始端・終端検出方法はこの零交差回
数を利用することにょシ信号のエネルギーは小さいが、
零交差回数は大きな値をとる無声子音の検出精度を上げ
た方法である。
以下図面を参照しながら従来例の音声の始端・終端検出
方法について説明する。
第2図は従来例の構成を示したものであシ、第3図は従
来例における音声の始端・終端検出方法の動作を説明す
るための例を示したものである。音声を含む信号は第2
図に示すエネルギー算出部1と零交差回数算出部2によ
りフレーム(例えば10 m5ec長)毎に信号エネル
ギーE(ロ)(nはフレーム番号)と零交差回数Nz(
n)という2つの特徴パラメータに変換される。3は信
号のエネルギーレベルによシ確実に音声区間であるとい
う部分を検出する始端・終端候補決定部であシ、信号エ
ネルギーE(ロ)に対対し2つの閾値1cs + El
(E+>El)を適用し音声の始端候補n1、終端候補
n2をめる。これは第3図(a)の例に示すように、エ
ネルギーの値がElを越え、かつその後E2以下になる
ことなしにElを越えるとき、音声区間に入ったとみな
し、K2を越えた点を始端候補n1とするものである。
終端候補n2は時間軸を逆にして、同様の方法で決定す
る。第2図の4は音声の始端・終端決定部である。ここ
では、零交差回数算出部2で計算された信号の零交差回
数Nz (n)と閾値NOを用いて、エネルギーE(→
は小さいが零交差回数Hz(→が大きな値をとる無声音
が、始端・終端候補決定部3で定められた音声の始端・
終端候補(nl、町)の外側にないか検査する。第3図
山)の例に示すように、始端候補n1より前の数フレー
ムの区間において零交差回数Nz(n)が閾値Noより
犬となるフレームの数を数え、その数が一定値(たとえ
ば3)以上であれば始端候補n1よp前に無声音がある
とみなし最初に閾値Noを越えたフレームn1に始端を
移す。終端についても同様である。ただし、第3図(b
)では終端n2はもとのままである場合を示している。
このようにして最終的な音声の始端、終端(n′+ 1
町)が決定される。
しかし、上記のように零交差回数を用いた方法では、エ
ネルギーが小さく零交差回数も小さい有声子音(例えば
、/b/、/d/)などの脱落を減少することはできな
い。また、音声の始端、終端には唇を開けたときの雑音
とか呼吸音による雑音が付加しやすい。第4図(a)、
(ロ)は上記雑音が付加した音声のエネルギー変化を示
したもので、(=11は唇の動きによる雑音が始端に付
加した場合の例として異様(/1joo/ )という音
声のパワー変化を示し、(b)は呼吸音による雑音が始
端に付加した場合の例として出湯(/1deju/ )
という音声のパワー変化を示したものである。図に示し
た例のような場合、従来例では始端は雑音部分となって
しまう。このように、従来例による方法では始端。
終端の位置を誤ってしまい音素の脱落や雑音による音素
の付加がさけら詐ない場合があるという欠点がある。
発明の目的 本発明は上記欠点に鑑み、音声の脱落、雑音の付加が少
なく、位置精度の高い音声の始端、終端検出装置を提供
するものである。
発明の構成 上記目的を達成するためには、信号のエネルギーとスペ
クトル形状によりフレーム毎(例えば10 m5ec 
)に有音・無音の判定を行なう有音・無音判定部と、フ
レーム毎の有音・無音判定結果の持続性によシ音声の始
端・終端候補を検出する部分と、無音から有音またはそ
の逆の有音から無音に変化する場合における信号のエネ
ルギーの変化とスペクトルの変化の大きさという動的な
特徴により始端・終端の位置を決定する部分とを備え、
入力された音声を含む信号から音声の始端・終端の位置
を検出するようにしたものである。
実施例の説明 以下、本発明の実施例について図面を参照しながら説明
する。
第6図は本発明の一実施例における音声認識装置に組込
まれた音声の始端・終端検出装置のブロック図を示した
ものである。図において6はエネルギー抽出部で、整流
平滑回路で構成され信号のパ’7−e7レーA毎に抽出
する。6はスペクトル形状抽出部で、例えば、低域(2
50〜600Hz)。
中域(600〜1500Hz )、 高域(1600〜
4000H2)の3種類の帯域通過フィルタ群と整流平
滑回路で構成され、各帯域におけるフレーム毎ノパワー
がスペクトル情報として用いられている。エネルギー抽
出部6とスペクトル形状抽出部6とで特徴量抽出部13
を構成する。7はマルチプレクサで、エネルギー抽出部
6がらの信号のパワーとスペクトル形状抽出部6からの
帯域フィルタパワーを時分割で有音・無音判定部8へ入
力するためのものである。8は有音・無音判定部で、無
音、無声音、有声音の判別を行うためのものである。9
,1oは閾値メモリと標準パターンメモリであり有音・
無音判定部8で用いられる定数値が格納されている。閾
値メモリ9には、パワーの2つの閾値g、、x2(xi
)IC2)が格納しである。また、標準パターンメモリ
10には、無音・無声音を判別するだめの線形判別関数
と無音・有声音を判別するだめの線形判別関数の2種類
の線形判別関数の係数が格納されている。そして、これ
ら2つの閾値L I E2と2つの線形判別関数の係数
は、あらかじめ使用する環境下で発声された音声データ
の統計処理によりめられ、格納されている。11は始端
・終端候補検出部であり、有音・無音判定部8より送ら
れてくるフレーム毎の有音・無音判定結果の持続時間に
より、音声の始端・終端候補を検出する。12は始端・
終端決定部で、最終的な始端・終端を決定する。なお、
第6図8〜12はマイクロプロセッサ1台で構成される
以上のように構成された音声の始端・終端検出装置につ
いてその動作を説明する。
マイク等よシ入力される音声を含む信号は第6図のエネ
ルギー抽出部6およびスペクトル形状抽出部6によりフ
レーム毎にパワーPWと3つの帯域ハry−Pi(i=
i〜3)に変換される。・このFW、Piはマルチプレ
クサ7を経て有音・無音判定部8に入力される。有音・
無音判定部8では入力されたP W 、 Pi (1=
 1〜3 ) (7) 4 つ(Dパラメータを対数変
換し対数パワーLPWと対数帯域パワーLP1 (1=
1〜3)をめる。そして、LPWとLPi(i−1〜3
)の4つのパラメータと閾値メモリ9と標準パターンメ
モリ10に格納されている閾値E1 + ”2と2つの
線形判別関数の係数、とを用いて、入力されたフレーム
が有音であるか無音であるかを判定する。この有音・無
音判定はまず最初に2つのエネルギー閾値EI z E
2(K+>Ih) と対数パワーLPWとの比較による
判定が行なわれる。2つの閾値E1r E2はLPW)
IC+ならば確実に有音であり、LPW(K2ならば確
実に無音であるという値に設定されているため判定結果
は式(1)に示すようなものとなる。
LPWというエネルギー量を用いた判定で不定という判
定結果を得た場合は、さらにスペクトル形状による有音
・無音判定を行なう。これは、低域。
中域、高域の3つの帯域の対数ノくワーLPi(i=1
〜3)をスペクトル形状を表わすノ(ラメータとし、標
準パターンメモリ10に格納しである2種類の線形判別
関数の係数を用い判別関数の値を計算することにより有
音・無音を判定するものである。この2つの線形判別関
数のうち1つは無音/無声音を判別するためのものであ
り、もう1つは無音/有声音を判別するためのものであ
る。
線形判別関数FXは式@)に示すものであシ、標準パタ
ーンメモリ1oには式(2)のム1(i=1〜3)とL
Pi(i=1〜3)が無音/無声音。
無音/有声音という2種類の線形判別関数毎に格(ただ
し、ムlは係数、I、Piは平均値)式(2)における
人iは2つのクラスの最適な判別を行なうように設定さ
れ2つのクラスの級内分散、縁間分散の比であるFis
her比の最大化条件からめられる。本実施例において
、式(2)のムiおよびLPiははあらかじめ使用環境
下で発声された音声データの無音・無声音・有声音を統
計処理してめられる。そしてFXの値は入力が無音のと
き負で、入力が無声音あるいは有声音のときは正の値を
とるように設定しである。したがって、スペクトル形状
による有音・無音判定は無音/無声音と無音/有声音の
2つの線形判別関数を計算しいずれか一方でも正の値を
とるならば有音、2つとも負の値ならば無音と判定する
。このようにして得られたフレーム毎の有音・無音の判
定結果は第6図の始端・終端候補検出部11に送られる
。始端・終端候補検出部11では7レーム毎に得られる
有音・無音の判定結果の持続時間により音声の始端候補
および終端候補を検出する。11の始端・終端候補検出
部はマイクロプロセッサの2つのレジスタをカウンタと
して用い、さらに比較演算機能を用いて構成される。そ
して、始端候補検出においては1つのカウンタだけを用
い、終端候補検出ではカウンタを2つとも用いている。
第6図は始端候補検出のための処理の流れを示したもの
である。第6図は有音と判定されたフレームが6フレ一
ム以上連続したときその先頭のフレームを始端候補とす
ることを示している。第6図の処理イハ有音フレームの
カウンタ(第6図のCtOtl)IT)。
始端候補フレーム番号格納領域(第6図邦人MKS )
そして処理フレームポジション(第6図りの初期化のた
めのリセットである。第6図処理口は処理フレームポジ
ションの更新である。処理・・は処理フレームが有音で
あるか無音であるかの比較による分岐である。処理して
いるフレームが有音である場合は有音フレームのカウン
タ(COLINT)に1を加える(第6図処理二)。さ
らに、始端候補フレーム番号格納領域(FRAMES)
が0にリセットされたままである場合は現在処理を行な
っているフレームの番号(I)を格納する(処理ホ。
へ)。処理トでは有音フレームのカウンタが6になった
かの判定を行なう。そして、カウンタが6以下の場合は
処理口に戻り、カウンタが6以上になりた場合は始端候
補が検出されたということで始端候補検出処理を終了す
る。処理が終了するまでの間に処理ノ〜において無音で
あるというフレームがあった場合は、処理チにおいて有
音フレームカウンタおよび始端候補フレーム番号格納領
域はリセットされ処理は口に戻る。有音フレームカウン
タは無音フレームがあると処理チによりリセットされる
ため有音が連続したフレーム数のカウンタとなる。した
がって、処理トの判定は有音が6フレ一ム以上連続した
かの判定となる。したがって、音声の始端の前に唇の動
きによる雑音などで有声と判定されたフレームが2〜3
フレームあってもその後に1フレームでも無音と判定さ
れるフレームがあればそれは除去される。このようにし
て始端候補が検出されると次に終端候補検出のだめの処
理が行なわれる。第7図は終端候補検出のための処理の
流れを示したものである。
第7図の処理イは無音フレームのカウンタ(第7図のC
0tTNT 1) 、有音フレームのカウンタ(第7図
のC0UNT2 )そして終端候補フレーム番号格納領
域(第7図FRムMiCIK ) の初期化のためのリ
セットである。第7図処理口は処理フレームポジション
(第7図工)の更新である。処理ハは処理フレームが有
音であるか無音であるかの比較による分岐である。処理
しているフレームが無音である場合は無音フレームカウ
ンタを更新し、有音フレームカウンタをリセットする(
処理二、ホ)。さらに無音カウンタが2以上でかつ終端
フレーム番号格納領域がリセットされている場合には無
音フレームカウンタが1となったフレームの番号を終端
候補フレームとして終端7レーム格納領域に格納する(
処理へ、ト)。処理チでは無音フレームカウンタが30
になったかの判定を行なう。そして、無音フレームカウ
ンタが30未満の場合は処理口に戻り、30以上となっ
た場合は音声が終了したとみなし処理を終了する。処理
ハにおいて有音であった場合に分岐する処理り。
ヌ、ルは終端候補フレームが格納されてから有音のフレ
ームが何フレーム連続したかの処理で67レ一ム以上連
続した場合は、音声は終了していないとみなし処理イに
戻り終端候補検出をやり直す。
有音フレームが6フレ一ム未満の場合は雑音とみなし、
その区間は無音区間であるということで処理二において
無音7レームカウンタにその区間長が加えられる。
終端候補は無音フレームが2フレーム連続したとき音声
の終了の可能性があるとし先頭の無音フレームを音声の
終了候補とし、その終了候補フレームから29フレーム
の間に有音フレームが5フレ一ム以上連続することがな
い場合は先の終了候補フレームを終端候補とする。もし
、終了候補から29フレーム後の間に有音フレームが6
フレ一ム以上連続した場合は、音声はまだ終了していな
いとし、カウンタおよび終了候補フレームをすべてリセ
ットし第7図に示す終端検出処理を次のフレームからや
シ直す。このような処理により終端に付加された4フレ
ーム以下の雑音は取り除かれる。
始端・終端決定部12では始端・終端候補検出部11に
よシ検出された始端・終端候補フレーム付近におけるパ
ワーLPWとスペクトルLP、の変化の大きさにより最
終的な始端・終端を決定する。
パワーの変化の大きさを表わすパラメータとしては式に
))に示すようにフレーム毎に得られる対数パワーLP
Wの差分値I、PWDが用いられる。
LPWDJ=LPWj−LPW5 t ・・・・・・ 
式(3)Cただし、Jはフレーム番号) また、スペクトルの変化の大きさを表わすパラメータと
しては式(4)に示す帯域対数パワーLPiのユークリ
ッド距離8PDを用いる。
SPD、==、Σ (LPij LPtl−t )2 
・・・・・・ 式(4(ただし、1は帯域を表わし、j
はフレーム番号を表わす) LPWI)というパラメータはパワーが増加している場
合圧の値をと9、パワーが減少している場合は負の値を
とる。また、8PDは無音から有音へと変化する場合の
ようにスペクトルの形状が大きく変化するところでは大
きな値をとる。始端の決定はまず始めにLPWDが正の
値をとるフレームを始端候補から後端に向って検索する
。次にLPWDが最初に正となったフレニムから後2フ
レームの計3フレームの中でLPWDが正の値でSPD
が最大となるフレームをめ、そのフレームを始端フレー
ムと決定する。
終端の決定は、まず始めにLPWDが負の値をとるフレ
ームを終端候補フレームから始端方向に向って検索する
。次にLPWDが最初に負となったフレームから2フレ
ーム前の計3フレームの中でLPWDが負の値でBPD
が最大となる請求め、そのフレームの1つ前のフレーム
を終端フレームと決定する。このようにして得られた始
端・終端は音声認識装置にて利用される。
本実施例によれば、有音・無音判定部8においてエネル
ギーレベルが低い入力信号に対し、線形判別関数を用い
無音とのスペクトル形状の相異によp有音であるか無音
であるか判定する方法をとっているため、エネルギーの
小さな無声子音や有声子音の脱落を減少することができ
る。また、始端・終端候補検出部11において、音声の
持続性を考慮した検出を行なっているので、音声の始端
・終端前後に付加された短かい雑音を取シ除くことがで
きる。さらに、始端・終端決定部12では、無音から有
音あるいは逆の場合におけるエネルギーの変化とスペク
トル形状の変化の大きさを利用して始端・終端の位置を
決定しているため位置精度の高い音声の始端・終端を得
ることができる。
第8図は「土台J (/ dodai / )と発声さ
れた音声に本発明の一実施例における始端・終端検出を
適応した例で、第8図aは対数パワーLPWを示し、b
はスペクトル変化SPD、cはパワー変化LPWD、d
の実線は無音/無声音を判別する線形判別関数の値、破
線は無音/有声音を判別する線形判別関数の値を示した
ものである。第8図の例においては、始端・終端にそれ
ぞれ雑音が見られる。フレーム毎の無音・有音判定部8
では、LPWが81以上であるか、またはLPWがEl
とE2の間にある場合はdに示す二つの線形判別関数の
正負を勘案することによシ、aに示すイから口およびハ
から二の区間を有音と判定する。これにより始端の雑音
が取り除かれる。始端・終端候補検出部11においては
、有音・無音フレームの持続性により始端候補フレーム
をイとし、終端候補フレームを口とする。このときノ・
から二の有音区間は5フレ一ム未満であるため雑音と判
定される。そして、始端・終端決定部12では対数パワ
ーの変化Cとスペクトルの変化すによp始端子、終端口
が決定され雑音が除去された正しい始端・終端の位置が
得られる。あらかじめ目視による始端・終端のラベル付
けが行なわれている男性話者1名が発声した212単語
を用いて本発明の一実施例の評価実験を行なった結果、
ラベルとの差が2フレ一ム以内となるものが始端で93
.4%、終端で92.9%、ラベルとの差が3フレ一ム
以内となるものが始端で97.6%、終端で97.2%
という結果を得た。そして、始端の音素脱落という重大
な誤シは2単語、終端の音素脱落という重大な誤9は2
単語と少なく、また雑音の付加による誤りはなく、良好
な結果を得ることができ、本発明による音声の始端・終
端検出装置が有効に動作することを確めることができた
なお、以上の説明ではスペクトル形状を表わすパラメー
タとして帯域対数・シワ−を用い有音・無音の判定とし
て線形判別関数を用いた場合について説明したが、スペ
クトル形状を表わすノ(ラメータとして信号のフーリエ
変換や線形予測分析によシ得られるパワースペクトルや
線形予測分析により得られるLPC−ケプヌトラム係数
を用い、有音・無音の判定法としてベイズ判定やマノ・
ラノピス距離などの統計的距離尺度を用いても良い。
発明の効果 以上のように、本発明は信号のエネルギー情報だけでな
くスペクトル形状をも用いたフレーム毎の有音・無音判
定部と、音、声の持続性を考慮した始端・終端候補検出
部と、エネルギーの変化およびスペクトル形状の変化量
により始端・終端位置を決定する決定部により構成され
る音声の始端・終端検出装置を提供するもので、有音・
無音判定として、無音・無声音・有声音のスペクトル標
準パターンとの統計的距離尺度を用いたスペクトル形状
の相異を利用しているため、エネルギーの小さな無声子
音や有声子音の脱落を少なくでき、また有音の持続性に
よる始端・終端候補検出を行なっているため雑音の付加
が少なく、シかもエネルギーとスペクトルの変化の大き
さにより始端・終端の位置を決定するため位置精度が高
いというすぐれた効果が得られる。
【図面の簡単な説明】
第1図は従来用いられている零交差回数の分布図、第2
図は従来の始端・終端検出装置のブロック図、第3図は
従来の始端・終端検出装置の動作例を説明する図、第4
図は従来で雑音が付加した音声のエネルギー変化を示す
図、第6図は本発明の一実施例における音声の始端・終
端検出装置のブロック図、第6図は本発明の一実施例に
おける始端候補検出処理を示すフローチャート図、第7
図は本発明の一実施例における終端候補検出処理を示す
フローチャート図、第8図は本発明の一実施例における
動作例を説明する図である。

Claims (4)

    【特許請求の範囲】
  1. (1)音声を含む信号から一定時間長の区間毎に信号の
    エネルギーとスペクトル形状を表わす特徴量を抽出する
    特徴量抽出部と、前記特徴量を用いて入力された信号が
    有音であるか無音であるか一定時間長の区間毎に判定す
    る有音・無音判定部と、前記有音・無音の判定結果の時
    系列を用い判定結果の持続時間によシ音声の始端・終端
    の候補を検出する始端・終端候補検出部と、始端・終端
    候補の前後における信号のエネルギー変化とスペクトル
    の変化の大きさを用いて始端・終端の位置を決定する始
    端・終端決定部とを具備することを特徴とする音声の始
    端・終端検出装置。
  2. (2)信号のスペクトル形状を表わす特徴量として、帯
    域フィルタ群、フーリエ変換若しくは線形子−スベクト
    ルまたは線形予測分析にょシ得られるLPCケブヌトラ
    ム係数のいずれかを用いることを特徴とする特許請求の
    範囲第1項記載の音声の始端・終端検出装置。
  3. (3)有音・無音判定部が、信号のエネルギーと二つの
    閾値との比較を行う第1判定部と、無音。 無声音、有声音の三つの標準パターンと久方信号のスペ
    クトルとの統計的距離尺度を用いスペクトルの類似度に
    よる判定を行う第2判定部とを備え、前記統計的距離尺
    度として線形判別関数、マハラノビス距離、ベイズ判定
    のいずれかを用いるこを特徴とする特許請求の範囲第1
    項記載の音声の始端・終端検出装置。
  4. (4)始端・終端決定部のスペクトルの変化の大きさを
    表わす特徴量として、一定時間長の区間におけるスペク
    トルを表わす特徴量と前の区間のスペクトルを表わす特
    徴量とのユークリッド距離を用いることを特徴とする特
    許請求の範囲第1項記載の音声の始端・終端検出装置。
JP59056622A 1984-03-23 1984-03-23 音声の始端・終端検出装置 Granted JPS60200300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59056622A JPS60200300A (ja) 1984-03-23 1984-03-23 音声の始端・終端検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59056622A JPS60200300A (ja) 1984-03-23 1984-03-23 音声の始端・終端検出装置

Publications (2)

Publication Number Publication Date
JPS60200300A true JPS60200300A (ja) 1985-10-09
JPH0222960B2 JPH0222960B2 (ja) 1990-05-22

Family

ID=13032381

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59056622A Granted JPS60200300A (ja) 1984-03-23 1984-03-23 音声の始端・終端検出装置

Country Status (1)

Country Link
JP (1) JPS60200300A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62244100A (ja) * 1986-04-17 1987-10-24 株式会社リコー 音声区間検出方式
JPS63163495A (ja) * 1986-12-26 1988-07-06 松下電器産業株式会社 音声区間検出装置
JPS63291096A (ja) * 1987-05-23 1988-11-28 日本電気株式会社 音声区間検出方式
JPS63300295A (ja) * 1987-05-29 1988-12-07 日本電気株式会社 音声認識装置
JPH01502858A (ja) * 1987-04-03 1989-09-28 アメリカン テレフォン アンド テレグラフ カムパニー 音声フレーム中の基本周波数の存在を検出する装置および方法
JPH01502853A (ja) * 1987-04-03 1989-09-28 アメリカン テレフォン アンド テレグラフ カムパニー 有声判定装置および有声判定方法
JPH01286643A (ja) * 1988-05-13 1989-11-17 Fujitsu Ltd 音声検出装置
JPH0277098A (ja) * 1988-09-13 1990-03-16 Sekisui Chem Co Ltd 音声検出方式
JPH0285896A (ja) * 1988-09-22 1990-03-27 Sekisui Chem Co Ltd 音声検出方式
JP2008151840A (ja) * 2006-12-14 2008-07-03 Nippon Telegr & Teleph Corp <Ntt> 仮音声区間決定装置、方法、プログラム及びその記録媒体、音声区間決定装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6711536B2 (en) * 1998-10-20 2004-03-23 Canon Kabushiki Kaisha Speech processing apparatus and method

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62244100A (ja) * 1986-04-17 1987-10-24 株式会社リコー 音声区間検出方式
JPS63163495A (ja) * 1986-12-26 1988-07-06 松下電器産業株式会社 音声区間検出装置
JPH07101354B2 (ja) * 1986-12-26 1995-11-01 松下電器産業株式会社 音声区間検出装置
JPH01502858A (ja) * 1987-04-03 1989-09-28 アメリカン テレフォン アンド テレグラフ カムパニー 音声フレーム中の基本周波数の存在を検出する装置および方法
JPH01502853A (ja) * 1987-04-03 1989-09-28 アメリカン テレフォン アンド テレグラフ カムパニー 有声判定装置および有声判定方法
JPS63291096A (ja) * 1987-05-23 1988-11-28 日本電気株式会社 音声区間検出方式
JPS63300295A (ja) * 1987-05-29 1988-12-07 日本電気株式会社 音声認識装置
JPH01286643A (ja) * 1988-05-13 1989-11-17 Fujitsu Ltd 音声検出装置
JPH0277098A (ja) * 1988-09-13 1990-03-16 Sekisui Chem Co Ltd 音声検出方式
JPH0285896A (ja) * 1988-09-22 1990-03-27 Sekisui Chem Co Ltd 音声検出方式
JP2008151840A (ja) * 2006-12-14 2008-07-03 Nippon Telegr & Teleph Corp <Ntt> 仮音声区間決定装置、方法、プログラム及びその記録媒体、音声区間決定装置
JP4758879B2 (ja) * 2006-12-14 2011-08-31 日本電信電話株式会社 仮音声区間決定装置、方法、プログラム及びその記録媒体、音声区間決定装置、方法

Also Published As

Publication number Publication date
JPH0222960B2 (ja) 1990-05-22

Similar Documents

Publication Publication Date Title
US7567900B2 (en) Harmonic structure based acoustic speech interval detection method and device
Evangelopoulos et al. Multiband modulation energy tracking for noisy speech detection
Deshmukh et al. Use of temporal information: Detection of periodicity, aperiodicity, and pitch in speech
US4933973A (en) Apparatus and methods for the selective addition of noise to templates employed in automatic speech recognition systems
US8311813B2 (en) Voice activity detection system and method
JPS6336676B2 (ja)
Khoa Noise robust voice activity detection
JPS60200300A (ja) 音声の始端・終端検出装置
Kitaoka et al. Development of VAD evaluation framework CENSREC-1-C and investigation of relationship between VAD and speech recognition performance
JP2797861B2 (ja) 音声検出方法および音声検出装置
JPH0449952B2 (ja)
Dumpala et al. Robust Vowel Landmark Detection Using Epoch-Based Features.
CN112489692A (zh) 语音端点检测方法和装置
Hahn et al. An improved speech detection algorithm for isolated Korean utterances
GB2216320A (en) Selective addition of noise to templates employed in automatic speech recognition systems
CN107039046B (zh) 一种基于特征融合的语音声效模式检测方法
Jijomon et al. An offline signal processing technique for accurate localisation of stop release bursts in vowel-consonant-vowel utterances
Pasad et al. Voice activity detection for children's read speech recognition in noisy conditions
JPS60129796A (ja) 音声入力装置
JPH03114100A (ja) 音声区間検出装置
JP2557497B2 (ja) 男女声の識別方法
Ananthapadmanabha et al. Relative occurrences and difference of extrema for detection of transitions between broad phonetic classes
Waardenburg et al. The automatic recognition of stop consonants using hidden Markov models
JP3049711B2 (ja) 音声処理装置
Mehta et al. Linear dynamic models for voice activity detection