JPH027099A - 過大音声検出装置 - Google Patents
過大音声検出装置Info
- Publication number
- JPH027099A JPH027099A JP63158707A JP15870788A JPH027099A JP H027099 A JPH027099 A JP H027099A JP 63158707 A JP63158707 A JP 63158707A JP 15870788 A JP15870788 A JP 15870788A JP H027099 A JPH027099 A JP H027099A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- excessive
- input
- time
- feature parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 claims abstract description 25
- 238000005070 sampling Methods 0.000 claims abstract description 4
- 238000000605 extraction Methods 0.000 claims description 5
- 230000007423 decrease Effects 0.000 abstract description 4
- 238000000034 method Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 6
- 238000013144 data compression Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Toys (AREA)
- Control Of Amplification And Gain Control (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[発明の目的]
(産業上の利用分野)
この発明は、過大音声検出装置に関するもので、特に音
声認識装置において、入力音声が過大か過大でないかを
判断するために使用されるものである。
声認識装置において、入力音声が過大か過大でないかを
判断するために使用されるものである。
(従来の技術)
従来、入力された音声が過大かどうかの判定をする過大
音声検出装置は、第9図で示すように、入力の音声パワ
ーと、あるしきい値θ1とを比較し、音声パワーがしき
い値θ1より大きくなると過大音声の判定を下すもので
あった。あるいは、第10図で示すように、入力音声の
ダイナミックレンジが0〜θ2と限られているとき、入
力音声がこのレンジを越えオーバーフローを生じたとき
に、過大音声と判定を下すものであった。このため、パ
ルス状のノイズあるいは音声が入力されると、入力音声
の大半が過大でなくても過大音声と判断されてしまうた
め、その判断に従って入カゲインを下げると、全体のパ
ワーが下がり、音声の凹凸の特徴が減少し、音声認識に
おいては、認識率が下がるという欠点があった。
音声検出装置は、第9図で示すように、入力の音声パワ
ーと、あるしきい値θ1とを比較し、音声パワーがしき
い値θ1より大きくなると過大音声の判定を下すもので
あった。あるいは、第10図で示すように、入力音声の
ダイナミックレンジが0〜θ2と限られているとき、入
力音声がこのレンジを越えオーバーフローを生じたとき
に、過大音声と判定を下すものであった。このため、パ
ルス状のノイズあるいは音声が入力されると、入力音声
の大半が過大でなくても過大音声と判断されてしまうた
め、その判断に従って入カゲインを下げると、全体のパ
ワーが下がり、音声の凹凸の特徴が減少し、音声認識に
おいては、認識率が下がるという欠点があった。
(発明が解決しようとする問題点)
この発明は前記のような点に鑑みてなされたもので、パ
ルス状のノイズあるいは音声が入力されると、入力音声
の大半が過大でなくても過大音声と判断される従来の欠
点を改善し、入力音声の過大性の評価を音声認識に対し
て適切に行うような過大音声検出装置を提供することを
目的とする。
ルス状のノイズあるいは音声が入力されると、入力音声
の大半が過大でなくても過大音声と判断される従来の欠
点を改善し、入力音声の過大性の評価を音声認識に対し
て適切に行うような過大音声検出装置を提供することを
目的とする。
[発明の構成]
(問題点を解決するための手段)
この発明による過大音声検出装置にあっては、音声分析
手段により、入力される音声から特徴パラメータを抽出
し、該特徴パラメータの時系列パターン上で連続した特
徴パラメータが所定時間、一定値を越えていたことを検
出する手段により、入力された音声が過大であるか過大
でないかを判断するようにする。
手段により、入力される音声から特徴パラメータを抽出
し、該特徴パラメータの時系列パターン上で連続した特
徴パラメータが所定時間、一定値を越えていたことを検
出する手段により、入力された音声が過大であるか過大
でないかを判断するようにする。
(作用)
このような構成によれば、上記の入力された音声の特徴
パラメータの時系列パターン上で、連続した特徴パラメ
ータがしきい値を越える時間が一定値より短ければ入力
された音声が過大と判断されず、瞬間的にしきい値を越
えるパルス状のノイズ、あるいは音声が入力されても過
大と判断されなくなり、不必要に入力ゲインを下げるこ
となく、音声認識において、認識率がさがるという問題
もなくなる。
パラメータの時系列パターン上で、連続した特徴パラメ
ータがしきい値を越える時間が一定値より短ければ入力
された音声が過大と判断されず、瞬間的にしきい値を越
えるパルス状のノイズ、あるいは音声が入力されても過
大と判断されなくなり、不必要に入力ゲインを下げるこ
となく、音声認識において、認識率がさがるという問題
もなくなる。
(実施例)
以下、この発明の一実施例について、第1図乃至第8図
の図面を参照して説明する。
の図面を参照して説明する。
第1図は、この発明の一実施例の過大音声検出装置の概
略ブロック図である。
略ブロック図である。
第1図において、音声がマイク1より人力され、入力音
声が増幅器2を介して、BPF(BandPass F
1lter ) 3により、音声の特徴パラメータと
して出力され、この出力をRect(Rectil’i
・e「 整流器)4で整流し、整流した信号をL P
F (Low Pa5s Filter ) 5によ
り、低域成分だけとり出し、A/D変換器6でアナログ
から、デジタルに変換する。データ圧縮を必要とする場
合には、必要に応じて標本化回路7で所定の周期でサン
プリングしたものを過大音声検出のために、CPU8に
入力する。データ圧縮が必要ない場合は、直接、A/D
変換器6から信号をCPU8に入力しても良いことは、
勿論である。
声が増幅器2を介して、BPF(BandPass F
1lter ) 3により、音声の特徴パラメータと
して出力され、この出力をRect(Rectil’i
・e「 整流器)4で整流し、整流した信号をL P
F (Low Pa5s Filter ) 5によ
り、低域成分だけとり出し、A/D変換器6でアナログ
から、デジタルに変換する。データ圧縮を必要とする場
合には、必要に応じて標本化回路7で所定の周期でサン
プリングしたものを過大音声検出のために、CPU8に
入力する。データ圧縮が必要ない場合は、直接、A/D
変換器6から信号をCPU8に入力しても良いことは、
勿論である。
このように構成された該過大音声検出装置により入力音
声が過大であると判断された場合、過大音声検知信号S
がCPU8より出力され、増幅器1に入力されて入力ゲ
インを下げるように作用する。
声が過大であると判断された場合、過大音声検知信号S
がCPU8より出力され、増幅器1に入力されて入力ゲ
インを下げるように作用する。
第2図に、CPU8の機能ブロック図を示す。
第2図において、CPU5内に含まれる音声区間検出手
段9によって、入力音声の音声区間を検出し、次に、過
大判断手段10によって、この音声が過大であるか、過
大でないか判断し、過大であると判断した場合に過大音
声検出信号Sを出力する。上記過大音声検出装置の過大
音声の検出方法は、上記音声の特徴パラメータの時系列
バタン上で特徴パラメータが、周波数軸方向にFr)i
zlの幅を持ち、時間軸方向に、T [m5ec]連続
してしきい値θ3を越えた場合、入力音声が過大である
と判断し検出する。
段9によって、入力音声の音声区間を検出し、次に、過
大判断手段10によって、この音声が過大であるか、過
大でないか判断し、過大であると判断した場合に過大音
声検出信号Sを出力する。上記過大音声検出装置の過大
音声の検出方法は、上記音声の特徴パラメータの時系列
バタン上で特徴パラメータが、周波数軸方向にFr)i
zlの幅を持ち、時間軸方向に、T [m5ec]連続
してしきい値θ3を越えた場合、入力音声が過大である
と判断し検出する。
このような過大音声検出の方法によれば、第3図、第4
図で示されるように、しきい値θ3を越える周波数の幅
が小さく、または、時間が短ければ入力音声を過大とは
判断しない。一方、第5図、第6図で示されるように、
ある周波数帯域において、ある時間、しきい値θ3を越
えている音声に対しては過大であると判断される。
図で示されるように、しきい値θ3を越える周波数の幅
が小さく、または、時間が短ければ入力音声を過大とは
判断しない。一方、第5図、第6図で示されるように、
ある周波数帯域において、ある時間、しきい値θ3を越
えている音声に対しては過大であると判断される。
音声認識においては、第3図、第4図のように、最大値
が多少、大きすぎても、全体的に、音声波形の特徴が出
ているほうが、最大値がしきい値θ3を越えないように
、入力を小さくした音声よりも、認識しやすい。
が多少、大きすぎても、全体的に、音声波形の特徴が出
ているほうが、最大値がしきい値θ3を越えないように
、入力を小さくした音声よりも、認識しやすい。
第7図(a)は、入力音声の音声区間検出手段9の動作
を説明するためのフローチャートであり、第8図は、入
力音声の過大音声検出手段10の動作を説明するための
フローチャートでアル。
を説明するためのフローチャートであり、第8図は、入
力音声の過大音声検出手段10の動作を説明するための
フローチャートでアル。
次に、入力音声の音声区間検出方法について、第7図(
a)のフローチャー1・を用いて説明する。
a)のフローチャー1・を用いて説明する。
まず、最初のステップ、st、lで入力された音声の始
端候補を発見したか、しないかを判断し、Noの場合、
st、2に進み、マイクから入力された音のエネルギが
、ある基準値X(第7図(b)に示した例ではX−7)
より大きいかを判断する。
端候補を発見したか、しないかを判断し、Noの場合、
st、2に進み、マイクから入力された音のエネルギが
、ある基準値X(第7図(b)に示した例ではX−7)
より大きいかを判断する。
Noの場合、次のフレームに進み、st、lから再度始
める。Yesの場合、始端候補を発見したとし、次のフ
レームに進み、s’t、lでYesとなるから、st、
3に進み、始端を決定したか、しないかを判断する。N
oの場合、st、4に進み、入力されたエネルギが、あ
る基準値Xより大きいかを判断する。Noの場合、始端
候補取消とし、次のフレームに進み、st、1から再度
始める。Yesの場合には、st、、5に進み、入力さ
れたエネルギが、ある基準値Y、(第7図(b)に示し
た例ではY−10)よりも大きいものがある基準数Zフ
レーム(第7図(b)に示した例ではZ−5)以上ある
か、ないかを判断する。N。
める。Yesの場合、始端候補を発見したとし、次のフ
レームに進み、s’t、lでYesとなるから、st、
3に進み、始端を決定したか、しないかを判断する。N
oの場合、st、4に進み、入力されたエネルギが、あ
る基準値Xより大きいかを判断する。Noの場合、始端
候補取消とし、次のフレームに進み、st、1から再度
始める。Yesの場合には、st、、5に進み、入力さ
れたエネルギが、ある基準値Y、(第7図(b)に示し
た例ではY−10)よりも大きいものがある基準数Zフ
レーム(第7図(b)に示した例ではZ−5)以上ある
か、ないかを判断する。N。
の場合、次のフレームに進み、st、lから再度始める
。Yesの場合、始端が決定され、次のフレームに進み
、st、1でYes、st、3でYesとなるから、s
t、5に進み、こんどは、終端候補を発見したか、しな
いかを判断する。
。Yesの場合、始端が決定され、次のフレームに進み
、st、1でYes、st、3でYesとなるから、s
t、5に進み、こんどは、終端候補を発見したか、しな
いかを判断する。
Noの場合、st、7に進み、入力されたエネルギが、
基準値Yよりも小さいかをfJI断し、Noの場合、次
のフレームに進み、st、1から再度始める。Yesの
場合、終端候補発見したとし、次のフレームに進み、s
【、1でYes、s t、3でYes、s t、6でY
esであるから、st。
基準値Yよりも小さいかをfJI断し、Noの場合、次
のフレームに進み、st、1から再度始める。Yesの
場合、終端候補発見したとし、次のフレームに進み、s
【、1でYes、s t、3でYes、s t、6でY
esであるから、st。
8に進み、終端を決定したか、しないかを判断する。N
oの場合、st、9に進み、入力されたエネルギが、基
準値Yよりも小さいかを判断、N。
oの場合、st、9に進み、入力されたエネルギが、基
準値Yよりも小さいかを判断、N。
の場合、終端候補取消とし、次のフレームに進み、st
、lから再度始める。Yesの場合、st。
、lから再度始める。Yesの場合、st。
10に進み、入力されたエネルギが、基準値Yよりも小
さいものがある基準数Vフレーム(第7図(b)に示し
た例では、V−10)以上あるか、ないかを判断し、N
oの場合、次のフレームに進み、st、1から再度始め
る。Yesの場合、終端を決定し、次のフレームに進み
、St、lでYes、st、3でYes、s t、6で
Yes。
さいものがある基準数Vフレーム(第7図(b)に示し
た例では、V−10)以上あるか、ないかを判断し、N
oの場合、次のフレームに進み、st、1から再度始め
る。Yesの場合、終端を決定し、次のフレームに進み
、St、lでYes、st、3でYes、s t、6で
Yes。
st、8でYesでエンドとなる。第7図(b)に入力
された音声の音声区間の始端および、終端決定の一例を
グラフにより示す。この例では、ある基準値X、、Yの
値を夫々X−7、Y−10とし、ある基準フレーム数Z
1vの数を夫々5、V−10とする。
された音声の音声区間の始端および、終端決定の一例を
グラフにより示す。この例では、ある基準値X、、Yの
値を夫々X−7、Y−10とし、ある基準フレーム数Z
1vの数を夫々5、V−10とする。
次に、CPU8における入力音声の過大音声検出方法に
ついて、第8図のフローチャートを用いて説明する。
ついて、第8図のフローチャートを用いて説明する。
まず、音声区間検出装置9により、音声区間の始点が決
定され、スタートする。st、11で時間ポインタfp
を1にセットする。ここで、時間ポインタfpとは、音
声区間の始端が決定した音声の時間軸上で、始端から終
端までの離散的にサンプリングした音声特徴パラメータ
のフレーム数である。ステップst、12で、周波数ポ
インタCpを1にセットする。ここで、周波数ポインタ
cpとは、周波数軸上で、音声特徴パラメータをいくつ
かに分割したチャンネル数である。st。
定され、スタートする。st、11で時間ポインタfp
を1にセットする。ここで、時間ポインタfpとは、音
声区間の始端が決定した音声の時間軸上で、始端から終
端までの離散的にサンプリングした音声特徴パラメータ
のフレーム数である。ステップst、12で、周波数ポ
インタCpを1にセットする。ここで、周波数ポインタ
cpとは、周波数軸上で、音声特徴パラメータをいくつ
かに分割したチャンネル数である。st。
13で、時間カウンタfcおよび、周波数カウンタCC
を1にセットする。ここで、時間カウンタfeおよび、
周波数カウンタCCとは、音声特徴パラメータがあるし
きい値θ3をこえている場合のポインタの数である。次
いで、st、14に進み、音声特徴パラメータのパワー
がしきい値θ3を越えているか、いないか判断する。N
oの場合、st、15に進み、周波数ポインタcpが終
了したか、しないかを判断する。Yesの場合、st。
を1にセットする。ここで、時間カウンタfeおよび、
周波数カウンタCCとは、音声特徴パラメータがあるし
きい値θ3をこえている場合のポインタの数である。次
いで、st、14に進み、音声特徴パラメータのパワー
がしきい値θ3を越えているか、いないか判断する。N
oの場合、st、15に進み、周波数ポインタcpが終
了したか、しないかを判断する。Yesの場合、st。
16に進み、音声終了かどうかの判断をする。音声区間
検出手段9から音声終了の判断が下された場合、Yes
に進み、エンドとなる。Noの場合、st、20に進み
、時間ポインタfpに1をプラスする。ここで、fp+
十とは、fp−fp+1を示す。
検出手段9から音声終了の判断が下された場合、Yes
に進み、エンドとなる。Noの場合、st、20に進み
、時間ポインタfpに1をプラスする。ここで、fp+
十とは、fp−fp+1を示す。
st、15に戻り、Noの場合、st、17で、周波数
カウンタccを1にセット、周波数ポインタcpに1を
プラスする。ここで、cp+十とは、cp喝cp+1を
示す。
カウンタccを1にセット、周波数ポインタcpに1を
プラスする。ここで、cp+十とは、cp喝cp+1を
示す。
st、17からは、st、1.4に戻り、ここでYes
の場合、st、18で、周波数カウンタCCが、ある周
波数区間Fを越えているか、いないか判断する。Noの
場合、st、19に進み、周波数ポインタが終了したか
、しないか判断する。
の場合、st、18で、周波数カウンタCCが、ある周
波数区間Fを越えているか、いないか判断する。Noの
場合、st、19に進み、周波数ポインタが終了したか
、しないか判断する。
Yesの場合、st、16に進み、音声区間検出手段9
から、音声終了の判断が下された場合、Yesに進み、
エンドとなる。NOの場合、st。
から、音声終了の判断が下された場合、Yesに進み、
エンドとなる。NOの場合、st。
20で、時間ポインタfpに1をプラスする。
st、1.9に戻り、Noの場合、st、21で周波数
カウンタCCおよび、周波数ポインタcpに夫々1をプ
ラスし、st、14から再度始める。
カウンタCCおよび、周波数ポインタcpに夫々1をプ
ラスし、st、14から再度始める。
st、18に戻り、YPSの場合、st、22で音声終
了かどうか判断する。音声区間検出手段9から、音声終
了の判断が下された場合、エンドとなる。Noの場合、
st、23で時間ポインタfpに1をプラス、周波数ポ
インタcpから、周波数区間Fを引き算して、その値を
新たに、周波数ポインタcpにセットし、周波数カウン
タCCの1をセットする。次に、st、24で時間カウ
ンタfcがある時間゛rを越えたか、どうか判断する。
了かどうか判断する。音声区間検出手段9から、音声終
了の判断が下された場合、エンドとなる。Noの場合、
st、23で時間ポインタfpに1をプラス、周波数ポ
インタcpから、周波数区間Fを引き算して、その値を
新たに、周波数ポインタcpにセットし、周波数カウン
タCCの1をセットする。次に、st、24で時間カウ
ンタfcがある時間゛rを越えたか、どうか判断する。
Noの場合、st、25で、時間カウンタfcに1をプ
ラス、st、26に進み、音声特徴パラメータのパワー
が第3図および、第5図に示したし5きい値θ3を越え
ているか、越えていないかを判断する。Noの場合、s
t、27で、時間ポインタfpの内容から、時間カウン
タfcの値を引き算し、1をプラスし、その値を新たに
、時間ポインタfpO値とする。st、28で、周波数
ポインタが終了したか、しないかを判断する。
ラス、st、26に進み、音声特徴パラメータのパワー
が第3図および、第5図に示したし5きい値θ3を越え
ているか、越えていないかを判断する。Noの場合、s
t、27で、時間ポインタfpの内容から、時間カウン
タfcの値を引き算し、1をプラスし、その値を新たに
、時間ポインタfpO値とする。st、28で、周波数
ポインタが終了したか、しないかを判断する。
Yesの場合、st、20から再度始める。N。
の場合、st、29で周波数ポインタcpに1をプラス
し、st、13から再度始める。
し、st、13から再度始める。
st、26に戻り、Yesの場合、st、30で、周波
数カウンタがある周波数区間Fを越えているか、いない
か判断する。Noの場合、st。
数カウンタがある周波数区間Fを越えているか、いない
か判断する。Noの場合、st。
31で、周波数ポインタcpが終了したか、しないか判
断する。Yesの場合、s t、27に進み、再度始め
る。Noの場合、st、32で、周波数カウンタCCお
よび、周波数ポインタCpに1をプラスし、st、26
から、再度始める。st。
断する。Yesの場合、s t、27に進み、再度始め
る。Noの場合、st、32で、周波数カウンタCCお
よび、周波数ポインタCpに1をプラスし、st、26
から、再度始める。st。
24に戻り、Yesの場合、st、33で、音声過大と
判断し、st、34で過大音声検出信号Sを出力する。
判断し、st、34で過大音声検出信号Sを出力する。
st、35に進み、音声が終了かどうか判断する。No
の場合、st、34に戻り、信号Sが続けて出力される
。音声区間検出手段9から、音声終了の判断が下された
場合、Y e sに進み、エンドとなる。
の場合、st、34に戻り、信号Sが続けて出力される
。音声区間検出手段9から、音声終了の判断が下された
場合、Y e sに進み、エンドとなる。
このような溝底によれば、入力された音声の過大性の評
価が、あるしきい値を越えただけでは、過大とは判断さ
れず、しきい値を越える音声特徴パラメータが、ある周
波数区間で、ある一定時間超えた場合のみ、過大と判断
されるようになる。
価が、あるしきい値を越えただけでは、過大とは判断さ
れず、しきい値を越える音声特徴パラメータが、ある周
波数区間で、ある一定時間超えた場合のみ、過大と判断
されるようになる。
よって、瞬間的にしきい値を越えるパルス状の、ノイズ
、あるいは、瞬間的にしきい値を越えるパルス状の音声
が入力されても過大と判断されなくなり、入力ゲインを
下げることなく、音声認識において、認識率が下がると
いう問題もなくなる。
、あるいは、瞬間的にしきい値を越えるパルス状の音声
が入力されても過大と判断されなくなり、入力ゲインを
下げることなく、音声認識において、認識率が下がると
いう問題もなくなる。
尚、本発明は、上記の実施例において、音声特徴パラメ
ータ抽出法として、BPFによる、周波数分析を行った
ものについて、述べたが、FFT(F ast F o
urier T ransrors)による周波数分
析でも良いし、ケプストラム、メルケプストラムによる
分析出力、自己相関分析による分析出力でも良い。さら
に、過大音声決定方法において、上記の実施例による、
第6図に示す、周波数方向F、時間軸方向Tの方形でな
く、時間軸上T1周波数方向Fの軸を持つだ円で過大音
声を決定しても良いし、しきい値θ3を越える閉鎖領域
の面積を求め、それが、あるしきい値Sを越える時に過
大音声と判断しても良い。
ータ抽出法として、BPFによる、周波数分析を行った
ものについて、述べたが、FFT(F ast F o
urier T ransrors)による周波数分
析でも良いし、ケプストラム、メルケプストラムによる
分析出力、自己相関分析による分析出力でも良い。さら
に、過大音声決定方法において、上記の実施例による、
第6図に示す、周波数方向F、時間軸方向Tの方形でな
く、時間軸上T1周波数方向Fの軸を持つだ円で過大音
声を決定しても良いし、しきい値θ3を越える閉鎖領域
の面積を求め、それが、あるしきい値Sを越える時に過
大音声と判断しても良い。
[発明の効果]
以上のようにこの発明によれば、音声パワーのみならず
音声特徴パラメータを音声過大の判断に用いたため、音
声特徴パラメータによって、音声認識を行う音声認識装
置の認識性能と過大音声の評価との相関が高い。また、
あるひとつの時点のみならず、一定周波数区間の音声特
徴パラメータか、一定時間、あるしきい値を越える、あ
るいは、音声特徴パラメータがオーバーフローした時に
、音声過大の判断を下すために、音声認識性能と過大音
声の評価との相関が高い。
音声特徴パラメータを音声過大の判断に用いたため、音
声特徴パラメータによって、音声認識を行う音声認識装
置の認識性能と過大音声の評価との相関が高い。また、
あるひとつの時点のみならず、一定周波数区間の音声特
徴パラメータか、一定時間、あるしきい値を越える、あ
るいは、音声特徴パラメータがオーバーフローした時に
、音声過大の判断を下すために、音声認識性能と過大音
声の評価との相関が高い。
第1図は、本発明に係わる実施例の過大音声検出装置の
概略ブロック図であり、第2図は、第1図中のCPUの
機能ブロック図、第3図は、本発明の過大音声と判断さ
れない音声の周波数分析例で、第4図は、第3図の平面
A−Aに沿って切断した断面図、第5図は、本発明の過
大音声と判断される音声の周波数分析例で、第6図は、
第5図の平面B−Bに沿って切断した断面図、第7図(
a)乃至(b)は、本発明における入力音声の音声区間
検出の方法のフローチャートおよび、線図、第8図は本
発明における過大音声検出の方法のフローチャート、第
9図、第10図は夫々、従来の過大音声の判断の方法を
示したグラフである。 1・・・・・・マイク、2・・・・・・増幅器、3・・
・・・・帯域ろ波器、4・・・・・・整流器、5・・・
・・・低域ろ波器、6・・・・・・アナログ/デジタル
変換器、7・・・・・・標本化回路、8・・・・・CP
U、9・・・・・・音声区間検出手段、10・・・・・
・過大判断手段。 S・・・・・・過大音声検出信号、θ1・・・・・・従
来例のあるしきい値、θ2・・・・・・従来例のあるダ
イナミックレンジの上限、θ3・・・・・・実施例のあ
るしきい値、F・・・・・・実施例のある周波数区間、
T・・・・・・実施例のある一定時間、X・・・・・・
実施例のある第1の音声エネルギの値、Y・・・・・・
実施例のある第2の音声エネルギの値、■・・・・・・
実施例の音声区間の終端を決定する際のXを下回るフレ
ーム数、Z・・・・・・実施例の音声区間の始端を決定
する際のYを上回るフレーム数。 出願人代理人 弁理士 鈴丘゛武彦 第 3 図 周J数↑ 第4図 第 嬉 図 因 時間 第 図 (b)
概略ブロック図であり、第2図は、第1図中のCPUの
機能ブロック図、第3図は、本発明の過大音声と判断さ
れない音声の周波数分析例で、第4図は、第3図の平面
A−Aに沿って切断した断面図、第5図は、本発明の過
大音声と判断される音声の周波数分析例で、第6図は、
第5図の平面B−Bに沿って切断した断面図、第7図(
a)乃至(b)は、本発明における入力音声の音声区間
検出の方法のフローチャートおよび、線図、第8図は本
発明における過大音声検出の方法のフローチャート、第
9図、第10図は夫々、従来の過大音声の判断の方法を
示したグラフである。 1・・・・・・マイク、2・・・・・・増幅器、3・・
・・・・帯域ろ波器、4・・・・・・整流器、5・・・
・・・低域ろ波器、6・・・・・・アナログ/デジタル
変換器、7・・・・・・標本化回路、8・・・・・CP
U、9・・・・・・音声区間検出手段、10・・・・・
・過大判断手段。 S・・・・・・過大音声検出信号、θ1・・・・・・従
来例のあるしきい値、θ2・・・・・・従来例のあるダ
イナミックレンジの上限、θ3・・・・・・実施例のあ
るしきい値、F・・・・・・実施例のある周波数区間、
T・・・・・・実施例のある一定時間、X・・・・・・
実施例のある第1の音声エネルギの値、Y・・・・・・
実施例のある第2の音声エネルギの値、■・・・・・・
実施例の音声区間の終端を決定する際のXを下回るフレ
ーム数、Z・・・・・・実施例の音声区間の始端を決定
する際のYを上回るフレーム数。 出願人代理人 弁理士 鈴丘゛武彦 第 3 図 周J数↑ 第4図 第 嬉 図 因 時間 第 図 (b)
Claims (4)
- (1)音声から特徴パラメータを抽出する抽出手段と、
上記特徴パラメータの時系列パターン上で連続した特徴
パラメータが所定時間、一定値を越えていたことを検出
する手段とを具備したことを特徴とする過大音声検出装
置。 - (2)前記抽出手段は、周波数分析装置を含むことを特
徴とする請求項1に記載の過大音声検出装置。 - (3)前記抽出手段は、メルケプストラム分析装置を含
むことを特徴とする請求項1に記載の過大音声検出装置
。 - (4)前記抽出手段により抽出された特徴パラメータを
、時間軸上で離散的にサンプリングする標本化回路を具
備したことを特徴とする請求項1に記載の過大音声検出
装置。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63158707A JPH027099A (ja) | 1988-06-27 | 1988-06-27 | 過大音声検出装置 |
DE68919924T DE68919924T2 (de) | 1988-06-27 | 1989-06-27 | Verfahren zur Feststellung des Sättigungspegels eines Sprachsignals. |
EP89111669A EP0348888B1 (en) | 1988-06-27 | 1989-06-27 | Overflow speech detecting apparatus |
KR1019890008871A KR920009957B1 (ko) | 1988-06-27 | 1989-06-27 | 과대음성 검출장치 |
US07/552,325 US5058168A (en) | 1988-06-27 | 1990-07-13 | Overflow speech detecting apparatus for speech recognition |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63158707A JPH027099A (ja) | 1988-06-27 | 1988-06-27 | 過大音声検出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH027099A true JPH027099A (ja) | 1990-01-11 |
JPH0558551B2 JPH0558551B2 (ja) | 1993-08-26 |
Family
ID=15677598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63158707A Granted JPH027099A (ja) | 1988-06-27 | 1988-06-27 | 過大音声検出装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5058168A (ja) |
EP (1) | EP0348888B1 (ja) |
JP (1) | JPH027099A (ja) |
KR (1) | KR920009957B1 (ja) |
DE (1) | DE68919924T2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009080219A (ja) * | 2007-09-26 | 2009-04-16 | Nippon Telegr & Teleph Corp <Ntt> | レベル調整判定装置、その方法、およびそのプログラム |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5315688A (en) * | 1990-09-21 | 1994-05-24 | Theis Peter F | System for recognizing or counting spoken itemized expressions |
US5509102A (en) * | 1992-07-01 | 1996-04-16 | Kokusai Electric Co., Ltd. | Voice encoder using a voice activity detector |
DK46493D0 (da) * | 1993-04-22 | 1993-04-22 | Frank Uldall Leonhard | Metode for signalbehandling til bestemmelse af transientforhold i auditive signaler |
GB2421317B (en) * | 2004-12-15 | 2009-02-11 | Agilent Technologies Inc | A method and apparatus for detecting leading pulse edges |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55121500A (en) * | 1979-03-15 | 1980-09-18 | Fujitsu Ltd | Voice identification device |
JPS6114520A (ja) * | 1984-06-29 | 1986-01-22 | Omron Tateisi Electronics Co | 回転数、速度等の検出装置 |
JPS6329754A (ja) * | 1986-07-14 | 1988-02-08 | イ−ストマン コダツク カンパニ− | ポジ形像形成用組成物 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4624009A (en) * | 1980-05-02 | 1986-11-18 | Figgie International, Inc. | Signal pattern encoder and classifier |
CH645501GA3 (ja) * | 1981-07-24 | 1984-10-15 | ||
JPS5852695A (ja) * | 1981-09-25 | 1983-03-28 | 日産自動車株式会社 | 車両用音声検出装置 |
US4624008A (en) * | 1983-03-09 | 1986-11-18 | International Telephone And Telegraph Corporation | Apparatus for automatic speech recognition |
DE3314570A1 (de) * | 1983-04-22 | 1984-10-25 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Verfahren und anordnung zur einstellung der verstaerkung |
JPS603700A (ja) * | 1983-06-22 | 1985-01-10 | 日本電気株式会社 | 音声検出方式 |
US4720802A (en) * | 1983-07-26 | 1988-01-19 | Lear Siegler | Noise compensation arrangement |
US4707857A (en) * | 1984-08-27 | 1987-11-17 | John Marley | Voice command recognition system having compact significant feature data |
US4829578A (en) * | 1986-10-02 | 1989-05-09 | Dragon Systems, Inc. | Speech detection and recognition apparatus for use with background noise of varying levels |
-
1988
- 1988-06-27 JP JP63158707A patent/JPH027099A/ja active Granted
-
1989
- 1989-06-27 EP EP89111669A patent/EP0348888B1/en not_active Expired - Lifetime
- 1989-06-27 DE DE68919924T patent/DE68919924T2/de not_active Expired - Fee Related
- 1989-06-27 KR KR1019890008871A patent/KR920009957B1/ko not_active IP Right Cessation
-
1990
- 1990-07-13 US US07/552,325 patent/US5058168A/en not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55121500A (en) * | 1979-03-15 | 1980-09-18 | Fujitsu Ltd | Voice identification device |
JPS6114520A (ja) * | 1984-06-29 | 1986-01-22 | Omron Tateisi Electronics Co | 回転数、速度等の検出装置 |
JPS6329754A (ja) * | 1986-07-14 | 1988-02-08 | イ−ストマン コダツク カンパニ− | ポジ形像形成用組成物 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009080219A (ja) * | 2007-09-26 | 2009-04-16 | Nippon Telegr & Teleph Corp <Ntt> | レベル調整判定装置、その方法、およびそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
US5058168A (en) | 1991-10-15 |
DE68919924T2 (de) | 1995-05-18 |
KR900000754A (ko) | 1990-01-31 |
KR920009957B1 (ko) | 1992-11-06 |
DE68919924D1 (de) | 1995-01-26 |
EP0348888A3 (en) | 1991-06-12 |
EP0348888A2 (en) | 1990-01-03 |
JPH0558551B2 (ja) | 1993-08-26 |
EP0348888B1 (en) | 1994-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2561850B2 (ja) | 音声処理装置 | |
US5617508A (en) | Speech detection device for the detection of speech end points based on variance of frequency band limited energy | |
US7171357B2 (en) | Voice-activity detection using energy ratios and periodicity | |
US8818806B2 (en) | Speech processing apparatus and speech processing method | |
US4633499A (en) | Speech recognition system | |
US9454976B2 (en) | Efficient discrimination of voiced and unvoiced sounds | |
JPH027099A (ja) | 過大音声検出装置 | |
JPH07319498A (ja) | 音声信号のピッチ周期抽出装置 | |
JP2564821B2 (ja) | 音声判定検出装置 | |
JP3114757B2 (ja) | 音声認識装置 | |
KR100574883B1 (ko) | 비음성 제거에 의한 음성 추출 방법 | |
KR100345402B1 (ko) | 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법 | |
JP3023135B2 (ja) | 音声認識装置 | |
JPH0635498A (ja) | 音声認識装置及び方法 | |
JPS6229800B2 (ja) | ||
JPH0573090A (ja) | 音声認識方法 | |
JPS63226691A (ja) | 標準パターン作成方式 | |
KR100501919B1 (ko) | 2개의 증폭기를 구비한 음성인식기 및 그 음성인식 방법 | |
JPS63127294A (ja) | 音声区間検出方式 | |
JPH06130983A (ja) | 音声認識機構の音声区間検出装置 | |
JPS63266497A (ja) | 音声認識装置 | |
JPH04369697A (ja) | 音声認識装置 | |
JPH07219596A (ja) | 音声認識装置 | |
JPS6095600A (ja) | 音声サンプリング方式 | |
JPH07104675B2 (ja) | 音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |