JPH0232395A - 音声区間切出制御方式 - Google Patents

音声区間切出制御方式

Info

Publication number
JPH0232395A
JPH0232395A JP63181524A JP18152488A JPH0232395A JP H0232395 A JPH0232395 A JP H0232395A JP 63181524 A JP63181524 A JP 63181524A JP 18152488 A JP18152488 A JP 18152488A JP H0232395 A JPH0232395 A JP H0232395A
Authority
JP
Japan
Prior art keywords
signal
level signal
level
duration
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63181524A
Other languages
English (en)
Inventor
Makoto Okazaki
真 岡崎
Koji Eto
公二 江藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63181524A priority Critical patent/JPH0232395A/ja
Publication of JPH0232395A publication Critical patent/JPH0232395A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Time-Division Multiplex Systems (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 音声認識の為に、単語単位で音声区間の切出しを行う音
声区間切出制御方式に関し、 音声区間切出しの処理量を削減することを目的とし、 入力音声信号レベルと閾値レベルとを比較する比較手段
と、該比較手段からの前記入力音声信号レベルが前記H
値レベルより大きいハイレベル信号の継続時間と、前記
入力音声信号レベルが前記閾値レベルより小さいローレ
ベル信号の継続時間とを計測する計測手段と、該計測手
段による前記@I続待時間基に音声区間を判定する判定
手段とを備え、該判定手段により、前記ハイレベル信号
のm開時間が第1の所定時間以上′継続した時に、該ハ
イレベル信号の立上り時点を始端と判定し、前記ローレ
ベル信号の継続時間が第2の所定時間以上継続した時に
、該ローレベル信号の立下り時点を終端と判定し、前記
ハイレベル信号の継続時間が前記第1の所定時間以上継
続しないと共に、前記ローレベル信号の継続時間が前記
第2の所定時間以上継続せずに、次のノ\イレベル信号
の継続時間が前記第1の所定時間以上′継続した時に、
最初のハイレベル信号の立上り時点を始端と判定するよ
うに構成した。
〔産業上の利用分野〕
本発明は、音声認識の為に、単語単位で音声区間の切出
しを行う音声区間切出制御方式に関するものである。
音声認識は、入力音声を音素、音節、単語1文章等の認
識単位に切出すことにより行われるものである。従って
、このような認識単位の切出しを正確に且つ高速に行う
ことが要望さている。
〔従来の技術〕 音声認識の手段の一つとして、テンプレートマツチング
方式が知られている。この方式は、入力音声の成る区間
を切出して、既に登録されている音声とのマツチングを
とり、その距離を求めて、最短距離のものを入力音声と
判定する。その場合に、入力音声から音素、音節、単語
1文章等の認識単位で切出しが行われる。
又特定の人の音声や特徴を登録しておき、入力音声との
マツチングをとる特定話者用の音声認識方式と、一般的
な声の特徴や多数の人の声の平均的な声を登録しておき
、任意の人の入力音声についてマツチングをとる不特定
話者用の音声認識方式とがある。又単語等の発声単位毎
に区切って発声し、これを順次認識する離散発声認識方
式や、連続音声を認識する連続発声認識方式等がある。
テンプレートマツチング方式を適用した場合、連続発声
認識方式と離散発声認識方式との何れの場合に於いても
、音素、その音素のつながりからなる音節、その音節の
つながりからなる単語、複数の単語の組合せからなる文
章等の認識単位毎に入力音声を区切ることが必要である
このような入力音声から認識単位で切出す方式として、
レベル判定により認識単位の始端と終端とを判定する方
式が知られている。例えば、第8図に示すように、単語
として“サトー”を発声した場合、はぼ実線のような音
声信号レベルの変化となる。又点線は入力音声信号レベ
ルが低い場合を示す。
入力音声信号レベルと閾値レベルTHIと比較し、tl
の時点で入力音声信号レベルが閾値レベルTHIより大
きくなり、所定時間以上、例えば、40m5以上継続し
た場合は、tlを入力音声信号の始端と判定する。そし
て、t4の時点で入力音声信号レベルが閾値レベルTH
Iより小さくなり、次のt5の時点で入力音声信号レベ
ルが閾値レベルTHIより大きくなる。その時、入力音
声信号レベルの小さい期間、t4〜t5の期間が、所定
時間以上、例えば、200 m s以上muした場合は
、t4を終端と判定し、200ms以上継続しない場合
は、終端が未だ検出されないとして、入力音声信号レベ
ルが閾値レベルTHIより小さくなるのを待ち、例えば
、t8の時点で小さくなり、200 m s以上継続し
て小さくなると、このt8を終端と判定する。
点線で示すように、入力音声信号レベルが低い場合は、
t2からt3の間で入力音声信号レベルが閾値レベルT
HIより大きくなるが、所定時間以上′継続しないので
、ノイズと判断することになり、従って、t2を始端と
は判定しない。そしてt6に於いて入力音声信号レベル
が閾値レベルTHIより大きくなり、所定時間以上継続
すると、このt6を始端と判定し、又t7に於いて入力
音声信号レベルが閾値レベルTHIより小さくなり、所
定時間以上継続すると、このtlを終端と判定する。
この場合、始端をt6、終端をtlとして切出すことに
なり、“サトー”の“す”と“−”とが抜けて、“ト”
のみとなるから、誤認識が生じることになる。又一般に
単語の中の最初にある母音は、後からの母音に比較して
レベルが低い場合があるから、前述の場合には、“す”
が抜けることになる。なお、閾値レベルTHIは、無音
時と有音時との信号レベルの中間値に設定するのが一般
的であり、入力音声信号レベルの大小に拘わらず、閾値
レベルTHIは固定されている。
前述の入力音声信号レベルの大小による始端と終端との
検出誤りを防止する為に、例えば、第9図に示すように
、複数の閾値レベルTH1,TH2、TH3を設定し、
入力音声信号のレベル比較を行う方式が知られている。
この方式に於いて、入力音声信号レベルと各閾値レベル
THI、TH2、TH3と比較して、閾値レベルTHI
、TH2、TH3対応に始端と終端とを検出するもので
あり、例えば、実線の入力音声信号の場合、最小の閾値
レベルTH3よりtllに於いて大きくなり、次の閾値
レベルTH2よりt12に於いて太き(なり、最大の閾
値レベルTHIよりt13に於いて大きくなる。
そして、それぞれ所定の時間継続して大きくなる場合は
、時点tll、t12.t13を閾値レベルTH1,T
H2,TH3対応の始端と判定する。又継続時間が短い
場合は、ノイズと判定することになる。
又t14は実線の入力音声信号が閾値レベルTH2より
小さくなった時点を示し、t15は実線の入力音声信号
が閾値レベルTH2より大きくなった時点を示す。又実
線の入力音声信号が最大の閾値レベルTHIよりt16
に於いて小さくなり、中間の閾値レベルTH2よりt1
7に於いて小さくなり、最小の閾値レベルTH3よりt
18に於いて小さくなる。
そして、それぞれ所定の時間継続して小さくなる場合は
、t16.t17.t18を閾値レベルTH1,TH2
,TH3対応の終端と判定する。
又t14.tls間のように、継続時間が短い場合は、
入力音声信号レベルが閾値レベルより小さくなっても終
端とは判断しない。
前述のように、閾値レベルTHI、TH2,TH3対応
の始端と終端とによりそれぞれ音声区間を切出して、マ
ツチング処理を行うものである。
従って、実線の入力音声信号の場合、最大の閾値レベル
THIを用いて切出された音声区間は、t13〜t16
、或いは、t151〜t16となり、中間の閾値レベル
TH2を用いて切出された音声区間は、t12〜t17
となり、又最小の閾値レベルTH3を用いて切出された
音声区間は、t11〜t18となる。
又鎖線で示す入力音声信号を最大の閾値レベルTHIを
用いて始端、終端を検出し、実線で示す入力音声信号を
中間の閾値レベルTH2を用いて始端、終端を検出し、
点線で示す入力音声信号を最小の閾値レベルTH3を用
いて始端、終端を検出すると、はぼ同一のt12.t1
7となり、同一区間の切出しが可能となるから、人力音
声信号のレベルの大小に拘わらず、音声認識の精度を向
上することが可能となる。
〔発明が解決しようとする課題〕
単一の閾値レベルTHIを設定する場合に比較して、複
数の閾値レベルTHI、TH2,T、H3を設定した場
合は、入力音声信号レベルが異なる場合でも、音声認識
率の低下を防止することができる。しかし、各閾値レベ
ル対応に始端、終端の検出を行うものであるから、閾値
レベルの設定数を多くする程、処理量が飛躍的に増大し
、高速処理が必要となる。従って、音声認識システムが
非常に高価なものとなる欠点がある。
又閾値レベルの設定数や複数の閾値レベル間の差等は、
人力音声信号のレベル変化の範囲や、処理量と認識率と
の兼ね合い等により決定することになり、簡単には決定
することができないものである。
本発明は、音声区間切出しの処理量を削減することを目
的とするものである。
〔課題を解決するための手段〕
本発明の音声区間切出制御方式は、単一の閾値レベルを
用いて単語単位で切出しを行うものであり、第1図を参
照して説明する。
入力音声信号レベルと閾値レベルとを比較する比較手段
lと、この比較手段から入力音声信号しベルが閾値レベ
ルより大きいハイレベル信号の継続時間と、入力音声信
号レベルが閾値レベルより小さいローレベル信号の継続
時間とを計測する計測手段2と、この計測手段2による
継続時間を基に音声区間を判定する判定手段3とを備え
、この判定手段3により、ハイレベル信号の継続時間が
第1の所定時間以上継続した時に、このハイレベル信号
の立上り時点を始端と判定し、ローレベル信号の継続時
間が第2の所定時間以上継続した時に、このローレベル
信号の立下り時点を終端と判定する。更に、ハイレベル
信号の′mm待時間第1の所定時間以上継続しないと共
に、ローレベル信号の41続時間が第2の所定時間以上
継続しない状態に於いて、次のハイレベル信号の継続時
間が第1の所定時間以上継続した時に、最初のハイレベ
ル信号の立上り時点を始端と判定して、始端、終端間の
音声区間を切出すものである。
〔作用〕
比較手段1と計測手段2と判定手段3とは、プロセッサ
等により実現することができるものであり、比較手段l
により単一の閾値レベルと入力音声信号レベルとを比較
して、閾値レベルより大きい入力音声信号レベルの時は
ハイレベル信号を出力し、閾値レベルより小さい入力音
声信号レベルの時はローレベル信号を出力する。
計測手段2は、カウンタ等の機能をもちいて、ハイレベ
ル信号とローレベル信号との継続時間を計測し、その結
果を判定手段3に加える。
判定手段3は、ハイレベル信号が第1の所定時間以上、
例えば、40ms以上継続した場合に、そのハイレベル
信号の立上り時点を始端と判定するゆ又ローレベル信号
が第2の所定時間以上、例えば、200 m s以上¥
a続した場合に、そのローレベル信号の立下り時点を終
端と判定する。又入力音声信号が一旦大きくなった後、
直ぐに小さ(なり、又再び大きくなるような場合、即ち
、最初のハイレベル信号の継続時間が第1の所定時間よ
り短く、又ローレベル信号の継続時間が第2の所定時間
より短く、次のハイレベル信号の4!!続時間が第1の
所定時間以上継続した場合は、最初のハイレベル信号の
立上り時点を始端と判定して、単語中に短時間の無音状
態が生じても、始端を確実に検出することができる。
〔実施例〕
以下図面を参照して本発明の実施例について詳細に説明
する。
第2図は本発明の実施例のブロック図であり、鍵を音声
による命令で施錠、或いは解錠する場合について示す。
同図に於いて、11はマイクロホン、12はA/D変換
器、13はプリプロセッサ、14はプロセッサ、15は
メモリ、16は人出力制御部(Ilo) 、17は自動
錠である。
マイクロホン11からの音声信号は、A/D変換器12
によりディジタル信号に変換されてプリプロセッサ13
に加えられる。このプリプロセッサ13は、例えば、デ
ィジタル信号処理プロセッサで、音声帯域の300〜5
100Hzを12分割するバンドパスフィルタ処理と、
それぞれのバンドパスフィルタの出力信号レベルの検出
処理とを、プログラムに従って実行するフィルタバンク
を構成するものである。従って、第3図に示すように、
それぞれ中心周波数が異なる12個のディジタル信号処
理によるバンドパスフィルタ211〜21−12と、直
流レベルに変換する整流回路22−1〜22−12とか
らなり、12チャネル分の信号P、%P、2を出力する
構成を有することになる。
又プロセッサ14は、プリプロセッサ13に於いて音声
帯域を12分割して処理した12チャネル分の出力信号
P、〜P1□を所定の時間間隔、例えば、10m5毎に
読取って、音声信号としてのレベルを求めて閾値レベル
との比較を行い、この音声信号のレベルが、閾値レベル
に対してハイレベルかローレベルかの比較出力信号の継
続時間の計測を行い、その計測結果に基づいて始端又は
終端の判定を行うものである。従って、プロセッサ13
の演算機能やクロックのカウント機能等により、第1図
に於ける比較手段1と計測手段2と判定手段3とが形成
されている。
プロセッサ14に於ける判定手段により、始端と終端と
の間の音声区間を切出し、又プロセッサ14に於ける認
識処理手段により、メモリ15に格納されている音声パ
ターンとのマツチング処理を行うものであり、この認識
処理手段による認識結果に基づいて自動錠17の施錠、
解錠を入出力制御部16を介して制御するものである。
自動錠17は、例えば、電磁式で動作するもので、ドア
等に取付けられており、通常の鍵を用いることなく、マ
イクロホン11に向かって予め定められた単語や文章、
例えば、“オープン”と、“クローズ”との何れかを発
声することにより、前述のように単語単位で音声区間を
切出して、メモリ15に登録されている「オープン」と
、「クローズ」とのマツチング処理が行われ、入力音声
が「オープン」と認識されると、プロセッサ14により
自動錠17の解錠制御が行われ、又「クローズ」と認識
されると、自動錠17の施錠制御が行われる。
との場合の単語の最初の“オ”又は“り”と、その次と
の間にローレベルの区間が存在するが、それが少なくと
も閾値レベル以上のレベルであると共に、ローレベルの
継続時間が第2の所定時間以上、例えば、200ms以
上MI続しない場合、次のハイレベルの継続時間が第1
の所定時間以上、例えば、40ms以上継続すれば、最
初のハイレベルの立上り時点を始端と判定し、又ローレ
ベルの継続時間が第2の所定時間以上継続した時、終端
と判定するから、単語の最初のレベルが比較的低い場合
でも、確実に単語単位の音声区間の切出しが可能となる
第4図は本発明の実施例の動作説明図であり、第8図及
び第9図に示す場合と同様に“サトーの入力音声につい
て示し、T1−T12は、閾値レベルTHを入力音声信
号レベルが切る時点を示す。実線の入力音声信号レベル
の場合、T2に於いて閾値レベルTHより大きくなり、
比較手段からハイレベル信号が出力されることになり、
その継続時間が計測手段により計測開始され、T5に於
いて小さくなるから、T2〜T5間のハイレベル信号の
継続時間aが計測される。又T5に於いて閾値レベルT
Hより小さくなることによりローレベル信号が出力され
、その継続時間の計測が開始され、T8に於いて再び閾
値レベルTHより大きくなるまでのT5〜T8間のロー
レベル信号の継続時間すが計測される。次に、T8から
のハイレベル信号の継続時間の計測が開始され、Tll
までの間の継続時間Cが計測される。
ハイレベル信号の継続時間aが第1の所定時間以上、例
えば、4 Qms以上の場合は、T2を始端と判定する
。又ローレベル信号の継続時間すが第2の所定時間以上
、例えば、200 m s以上の場合は、T5を終端と
判定し、そうでない場合は音節が後続するものと判定す
る。又′mm待時間が第1の所定時間以上でない場合は
、次のローレベルの継続時間すが第2の所定時間以上か
否か識別し、第2の所定時間以上の場合は、′Ia続時
開時に於ける音声信号はノイズと判定する。又第2の所
定時間以上でない場合は、次のハイレベル信号の継続時
間Cが第1の所定時間以上であるか否か識別し、第1の
所定時間以上の場合は、継続時間aが短くても、T2を
始端と判定する。従って、単語単位の音声区間dが切出
される。
入力音声信号レベルが鎖線で示すように大きい場合は、
T1が始端と判定され、T12が終端と判定されること
になり、前述の継続時間dに比較して僅か大きい区間が
切出されることになる。又点線で示すように小さい場合
は、T3〜T4間が短(でも、T3〜T9間が第2の所
定時間より短い場合は、T3を始端と判定することがで
き、又TIOを終端と判定することになるが、少なくと
も“サト”の音声区間を切出すことができるから、マツ
チング処理により認識可能となる。
第5図、第6図及び第7図は本発明の実施例のフローチ
ャートであり、音声区間の切出しのスタートにより、1
0ms毎にフィルタバンク(第3図参照)の値P1〜p
+zを出力し■、プロセッサ14は、 POl、、= Σ  P、             
−・(1)の演算を行い■、その時点の入力音声信号の
レベルを求める。そして、閾値レベルTHと比較する■
。Paw>THでなければ、音声信号が入力されていな
いものとして、ステップ■に戻る。
又P。w〉THであると、ハイレベル信号継続時間HL
 1に10m5を加算して、次のハイレベル信号継続時
間HLIとし■、ハイレベル信号の継続時間を計測する
。このハイレベル信号継続時間HLIについて、HLI
≦4 Qmsの判定を行う■。
入力音声信号レベルP。0が閾値レベルTHを超えた最
初は、HLI≦4 Qmsの関係となるから、ステップ
■と同様に10m5毎にフィルタバンクの値P+−P+
tを出力し■、ステップ■と同様に(1)式により入力
音声信号レベルP。1.lを求め■、ステップ■と同様
にP。w>’rHであるか否か判定し■、Pow>TH
であると、ステップ■に戻り、Paw>THでないと、
第6図のステップに移行する。
ハイレベル信号が継続していると、ステップ■〜■を繰
り返すことにより、ステップ■に於いてHL 1 >4
 Qmsの条件となるから、その条件成立の時点より5
 Qms前を始端とする■。即ち、ハイレベル信号のm
開時間を1 Qms毎に計測するものであり、閾値レベ
ルTHより入力音声信号レベルが大きくなってから50
 m s後に、HLI>4 Qmsの条件となるから、
5 Qms前に遡った時点を始端と判定し、第7図に示
す処理に移行する。
前述のステップ■に於いて、入力音声信号レベルが閾値
レベルTHより小さくなった時、そのローレベル信号継
続時間LLIに1 Qmsを加算して次のローレベル信
号継続時間LLIとし、ローレベル信号のm開時間を計
測する[相]。このローレベル信号継続時間LLlが2
0 Qms以上か否か判定する■。即ち、ローレベル信
号が第2の所定時間以上継続するか否か判定する。そし
て、ローレベル信号継続時間LL1が20 Qms以上
の場合は、ハイレベル信号継続時間HLI及びローレベ
ル信号継続時間LLIをOとし@、ステップ■に移行す
る。即ち、ノイズと判断して、再び、入力音声信号のレ
ベル比較を開始する。
又ローレベル信号継続時間LLIが200 m s以上
でない場合は、lQms毎にフィルタバンクの値P1〜
P1□を出力し0、(1)式により入力音声信号レベル
P。0を求め[相]、ステップ■と同様にP。w>TH
であるか否か判定し■、P ow > T Hでない場
合は、ステップ[相]に戻り、P ow > T Hの
場合は、ハイレベル信号wI続時間HL2に10ms加
算して、次のハイレベル信号継続時間HL2とする[相
]。
このハイレベル信号継続時間HL2について、4 Qm
s以上であるか否か判定し■、4 Qms以上でない場
合は、1 Qms毎にフィルタバンクの値P1〜P1□
を出力し[相]、(1)式により入力音声信号レベルP
。8を求め0、pow>’rHであるか否か判定し[相
]、pow>’r’F(の場合は、ステップ[相]に戻
り、又P。w>Tttでない場合は、ハイレベル信号継
続時間HL2を最初のハイレベル信号継続時間HLIと
し、ローレベル信号継続時間LLIを0として■、ステ
ップ[相]に戻る。
又ステップOに於いて、ハイレベル信号継続時間HL2
が4 Qms以上の場合は、50 m s前を始端2と
し、HL 1 +LL 1 +5 Qms前を始端1と
する0゜そして、第7図のステップ(1)に移行する。
ステップ(1)〜(3)は、前述のステップ■〜■、■
〜■、0〜[相]、[相]〜[相]と同様に入力音声信
号レベルP。0を求めて、閾値レベルTHと比較するも
ので、pow>’rHでない場合は、ローレベル信号継
続時間LL2に1 Qmsを加算して次のローレベル信
号w!続時間LL2としく4)、ステップ■と同様にこ
のローレベル信号継続時間LL2が200m5以上か否
か判定しく5)、200 m s以上でない場合は、ス
テップ(1)〜(3)と同様なステップ(6)〜(8)
を実行し、入力音声信号レベルP。1.lと閾値レベル
THとを比較して、Paw>THでない場合はステップ
(4)に戻り、pow>’rHの場合はローレベル信号
mu時間LL2を0として、ステップ(1)に戻る。
又ステップ(5)に於いて、ローレベル信号継続時間L
L2が200 m s以上の場合、終端を210ms前
とし0の、音声区間の切出しを完了する。
前述の処理により、入力音声信号のレベルを単一の閾値
レベルTHにより比較し、ハイレベル信号の継続時間と
、ローレベル信号の継続時間とを基に、始端と終端とを
検出して、単語単位で音声区間の切出しを行うものであ
り、“サトー”のような単語に於ける最初の“す”の切
出し抜けを防止することができるから、認識率を向上す
ることが可能となる。
〔発明の効果〕
以上説明したように、本発明は、入力音声信号レベルP
。0と閾値レベルTHとを比較手段1により比較し、入
力音声信号レベルP。wが大きい時のハイレベル信号の
継続時間と、入力音声信号レベルP。8が小さい時のロ
ーレベル信号の継続時間とを計測手段2により計測し、
判定手段3により、ハイレベル信号継続時間が40ms
等の第1の所定時間以上継続した時にハイレベル信号の
立上り時点を始端と判定し、又ローレベル信号継続時間
が200 m s等の第2の所定時間以上継続した時に
ローレベル信号の立下り時点を終端と判定し、又ハイレ
ベル信号継続時間が第1の所定時間以上継続しない場合
に、ローレベル信号継続時間も第2の所定時間以上継続
しないで、次のハイレベル信号継続時間が第1の所定時
間以上継続する場合、最初のハイレベル信号の立上り時
点を始端と判定するものである。
従って、単語単位の音声区間の最初の音節が閾値レベル
より大きければ、その音節が短くても、次の音節との間
の休止期間(ローレベル信号継続時間)が第2の所定時
間以下であれば、最初の音節を含めて音声区間の切出し
が可能となり、入力音声信号レベルの変化に対しても、
単語単位で音声区間の切出しを行うことができる。又閾
値レベルTHは1個であるから、演算量が少なくて済む
利点があり、各種の音声認識システムを廉価に構成する
ことができる。
【図面の簡単な説明】
第1図は本発明の原理説明図、第2図は零発所の実施例
のブロック図、第3図はフィルタバンクの説明図、第4
図は本発明の実施例の動作説明図、第5図、第6図及び
第7図は本発明の実施例のフローチャート、第8図は単
一閾値レベルを用いた従来例の説明図、第9図は複数閾
値レベルを用いた従来例の説明図である。 1は比較手段、2は計測手段、3は判定手段、11はマ
イクロホン、12はA/D変換器、13はプリプロセッ
サ、14はプロセッサ、15はメモリ、16は入出力制
御部、17は自動錠である。

Claims (1)

  1. 【特許請求の範囲】 入力音声信号レベルと閾値レベルとを比較する比較手段
    (1)と、 該比較手段(1)からの前記入力音声信号レベルが前記
    閾値レベルより大きいハイレベル信号の継続時間と、前
    記入力音声信号レベルが前記閾値レベルより小さいロー
    レベル信号の継続時間とを計測する計測手段(2)と、 該計測手段(2)による前記継続時間を基に音声区間を
    判定する判定手段(3)とを備え、該判定手段(3)に
    より、前記ハイレベル信号の継続時間が第1の所定時間
    以上継続した時に、該ハイレベル信号の立上り時点を始
    端と判定し、前記ローレベル信号の継続時間が第2の所
    定時間以上継続した時に、該ローレベル信号の立下り時
    点を終端と判定し、前記ハイレベル信号の継続時間が前
    記第1の所定時間以上継続しないと共に、前記ローレベ
    ル信号の継続時間が前記第2の所定時間以上継続せずに
    、次のハイレベル信号の継続時間が前記第1の所定時間
    以上継続した時に、最初のハイレベル信号の立上り時点
    を始端と判定する ことを特徴とする音声区間切出制御方式。
JP63181524A 1988-07-22 1988-07-22 音声区間切出制御方式 Pending JPH0232395A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63181524A JPH0232395A (ja) 1988-07-22 1988-07-22 音声区間切出制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63181524A JPH0232395A (ja) 1988-07-22 1988-07-22 音声区間切出制御方式

Publications (1)

Publication Number Publication Date
JPH0232395A true JPH0232395A (ja) 1990-02-02

Family

ID=16102271

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63181524A Pending JPH0232395A (ja) 1988-07-22 1988-07-22 音声区間切出制御方式

Country Status (1)

Country Link
JP (1) JPH0232395A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03273722A (ja) * 1989-11-28 1991-12-04 Nec Corp 音声・モデム信号識別回路
CN102397881A (zh) * 2010-09-09 2012-04-04 宁波宝新不锈钢有限公司 用于轧机机架防护门的安全装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03273722A (ja) * 1989-11-28 1991-12-04 Nec Corp 音声・モデム信号識別回路
CN102397881A (zh) * 2010-09-09 2012-04-04 宁波宝新不锈钢有限公司 用于轧机机架防护门的安全装置

Similar Documents

Publication Publication Date Title
US5579431A (en) Speech detection in presence of noise by determining variance over time of frequency band limited energy
US4370521A (en) Endpoint detector
USRE32172E (en) Endpoint detector
Özaydın Examination of energy based voice activity detection algorithms for noisy speech signals
JPS60200300A (ja) 音声の始端・終端検出装置
JPH0232395A (ja) 音声区間切出制御方式
JP2816163B2 (ja) 話者照合方式
JPS60114900A (ja) 有音・無音判定法
WO2000072308A1 (fr) Normalisateur d'intervalle pour signal vocal d'entree de reconnaissance vocale
Sudhakar et al. Automatic speech segmentation to improve speech synthesis performance
CA1230180A (en) Method of and device for the recognition, without previous training, of connected words belonging to small vocabularies
JP2001042889A (ja) 音声認識入力音声の音程正規化装置
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPH034918B2 (ja)
Waardenburg et al. The automatic recognition of stop consonants using hidden Markov models
WO2003081575A1 (fr) Unite de sensibilisation de diagnostic a chaos theorique
JPH04230798A (ja) 雑音予測装置
JP2951333B2 (ja) 音声信号の区間判別方法
JPH02192335A (ja) 語頭検出方式
JPS607492A (ja) 単音節音声認識方式
JPS62113197A (ja) 音声認識装置
Lai et al. Discrete word recognition using energy-time profiles
CN116758923A (zh) 基于音频的用户识别方法、电子设备及存储介质
JPS63259690A (ja) 音声認識応答装置
JPS6227798A (ja) 音声認識装置