JPS58105200A - 音声区間検出装置 - Google Patents
音声区間検出装置Info
- Publication number
- JPS58105200A JPS58105200A JP56204405A JP20440581A JPS58105200A JP S58105200 A JPS58105200 A JP S58105200A JP 56204405 A JP56204405 A JP 56204405A JP 20440581 A JP20440581 A JP 20440581A JP S58105200 A JPS58105200 A JP S58105200A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- voice section
- section
- zero
- comparator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、構成が簡単で安価な単語音声認識装置を実現
するための音声の区間検出装置VC関するものである。
するための音声の区間検出装置VC関するものである。
音声認識装置としては、多数のバンドパスフィルタやス
ペクトル分析手段等を用いた大規模なものが多く、構成
が複雑であり、コストも非常VC高い◇一方、認識する
学語数が少なく認識率は低くてもよいが、構成が簡単で
安価な音声認識装置に対する要求がある。
ペクトル分析手段等を用いた大規模なものが多く、構成
が複雑であり、コストも非常VC高い◇一方、認識する
学語数が少なく認識率は低くてもよいが、構成が簡単で
安価な音声認識装置に対する要求がある。
簡単な片角認識方法の1つに、片角波形のゼロクロス情
報を用いるものがある。第1図はその方法を用いた音声
認識装置の一列である。マイクロホン1から入力された
音声信号は、プリアンプ2゜ピッチ成分除去のだめの・
・イバスフィルタ3を通った後、コンパレータ4により
て、零クロスが検出される。コンパレータ4の出力はマ
イクロコンピュータ6の割り込み入力端子に入力され、
コンパレータ4の出力がハイレベルカラローレベルに変
1ヒするごとに、割込みが発生する。割込みが発生する
と、零クロスカウンタに割当てられたメモリの内容が1
つ増加させられる。さらに10msθCごとにタイマ割
込みをネ生させることにより、10m5ec (これ
を1フレームとする)中に何回零クロスがあるかがカウ
ントされる。
報を用いるものがある。第1図はその方法を用いた音声
認識装置の一列である。マイクロホン1から入力された
音声信号は、プリアンプ2゜ピッチ成分除去のだめの・
・イバスフィルタ3を通った後、コンパレータ4により
て、零クロスが検出される。コンパレータ4の出力はマ
イクロコンピュータ6の割り込み入力端子に入力され、
コンパレータ4の出力がハイレベルカラローレベルに変
1ヒするごとに、割込みが発生する。割込みが発生する
と、零クロスカウンタに割当てられたメモリの内容が1
つ増加させられる。さらに10msθCごとにタイマ割
込みをネ生させることにより、10m5ec (これ
を1フレームとする)中に何回零クロスがあるかがカウ
ントされる。
この場合、零クロス検出器としては、第2図に示すよう
に演算増幅4によって作成した零レベルを基準電圧とす
るコンパレータ4を用いることが考えられるが、入力波
形は第3図dに示−rように騒音などのノイズを含んで
おり、コンパレータ4けノイズの零クロスに対しても応
動することVCなり、第3図b[示す出力を生ずるため
音声区間以外の部分でも零クロスがカウントされ、音声
区間と音声のない区間とを区別できない。
に演算増幅4によって作成した零レベルを基準電圧とす
るコンパレータ4を用いることが考えられるが、入力波
形は第3図dに示−rように騒音などのノイズを含んで
おり、コンパレータ4けノイズの零クロスに対しても応
動することVCなり、第3図b[示す出力を生ずるため
音声区間以外の部分でも零クロスがカウントされ、音声
区間と音声のない区間とを区別できない。
そこでbt来、入力波形の包絡線情報を用いて音声区間
を倹t)」する方法が多く用いられてきた。第1図にお
いて、プリアンプ2を通った「声信号は。
を倹t)」する方法が多く用いられてきた。第1図にお
いて、プリアンプ2を通った「声信号は。
整流回路6を通り包絡線検出回路7によりて包絡線検出
がなされる。この包絡線の直はA/D変換器8によりて
A/D変換され、マイクロコンピュータ6に入力される
。この人力1直が一定の1直を越えている区間を音声区
間とし、この間、零クロスカウント11nがマイクロコ
ンピュータ6内の遂次メモリに書き込まれる。
がなされる。この包絡線の直はA/D変換器8によりて
A/D変換され、マイクロコンピュータ6に入力される
。この人力1直が一定の1直を越えている区間を音声区
間とし、この間、零クロスカウント11nがマイクロコ
ンピュータ6内の遂次メモリに書き込まれる。
音声区間が終わると、メモリVC書き込まれている音声
区間内の零クロスカウント値から等間隔に16フレ一ム
分がサンフ゛ルされる。この161固の零クロスデータ
Vこもとづいて認識を行う。認識に個の零クロスデータ
を登録する。登@はスイッチ入力等により登録モードで
ある旨をマイクロコンピュータ5に入力した後、マイク
ロホンから単語を順に発声することによってなされる。
区間内の零クロスカウント値から等間隔に16フレ一ム
分がサンフ゛ルされる。この161固の零クロスデータ
Vこもとづいて認識を行う。認識に個の零クロスデータ
を登録する。登@はスイッチ入力等により登録モードで
ある旨をマイクロコンピュータ5に入力した後、マイク
ロホンから単語を順に発声することによってなされる。
このようにあらかじめ登録されている各単語の16個の
零クロスデータのことを標準パターンと呼ぶ。認識を行
う時は、モードを認識モードにした後マイクロホンから
音声を入力する。入力音声からサンプルされた16個の
零クロスデータのi番目の値を5t(i=1・・・・・
φ16)、標準パターンのj番目に登録した単語のi番
目の直をTji (i二1・・・・・・16、j=1・
・・・・・W(Wは登録単語数)ンとするとき、入力音
声と1番目の単語との間の距離D1を Dj−Σ 1Tji−8i l l;1 と定義する。@標準パターンに対してi)】を計算し、
Djの最小値全厚える標準パターンに対応する単語を認
識結果とする。認R結果はLED等で表示される。
零クロスデータのことを標準パターンと呼ぶ。認識を行
う時は、モードを認識モードにした後マイクロホンから
音声を入力する。入力音声からサンプルされた16個の
零クロスデータのi番目の値を5t(i=1・・・・・
φ16)、標準パターンのj番目に登録した単語のi番
目の直をTji (i二1・・・・・・16、j=1・
・・・・・W(Wは登録単語数)ンとするとき、入力音
声と1番目の単語との間の距離D1を Dj−Σ 1Tji−8i l l;1 と定義する。@標準パターンに対してi)】を計算し、
Djの最小値全厚える標準パターンに対応する単語を認
識結果とする。認R結果はLED等で表示される。
上記の装置1 vcおい′C1零クロスを検出するため
の回路は非常に簡単であるが、音声区間検出のためvC
けやや複雑な回路を用いている。したがって構成がより
簡t1tで安価な単語音声認識装置を実現するためには
、より簡単な音声区間検出装置が望まれる。
の回路は非常に簡単であるが、音声区間検出のためvC
けやや複雑な回路を用いている。したがって構成がより
簡t1tで安価な単語音声認識装置を実現するためには
、より簡単な音声区間検出装置が望まれる。
本発明はより構成が簡単で安価な単語音声認識装置を実
現するために、コンパレータを用いた簡単な回路構成で
「声区間検出を行う装置を提供することを目的とするも
のである。
現するために、コンパレータを用いた簡単な回路構成で
「声区間検出を行う装置を提供することを目的とするも
のである。
本発明の「声区間検出装置によれば、コンパレータにヒ
ステリシスを持たせたり、零りロスe−14J定する基
準電圧を入力信号の平均値からずらせることにより1音
声のない比較的低信号レベル区間における零クロス検出
を阻止することをOT能とする。そして、一定時間連続
して零クロスが検出されたとき、その検出開始時点を音
声区間の始まりとし、一定時間連続して零クロスが検出
されないとき、検出さnなくなった時点を音声区間の終
わりとして音声区間を検出する。
ステリシスを持たせたり、零りロスe−14J定する基
準電圧を入力信号の平均値からずらせることにより1音
声のない比較的低信号レベル区間における零クロス検出
を阻止することをOT能とする。そして、一定時間連続
して零クロスが検出されたとき、その検出開始時点を音
声区間の始まりとし、一定時間連続して零クロスが検出
されないとき、検出さnなくなった時点を音声区間の終
わりとして音声区間を検出する。
本発明の一実施クリによる「声区間検出装置を用いた音
声認識装置を第4図に示す。同図において、第1図のも
のに対応するブロックには同符号を付している。異なる
のけ零クロスを検出するためのコンパレータであり、こ
のコンパレータ9[Viヒステリンス等を持たせること
により零クロスを判御する基準電圧を人力信号の平均値
よりずらせることにより、音声区間でのみゼロクロスを
検出するようにしている。
声認識装置を第4図に示す。同図において、第1図のも
のに対応するブロックには同符号を付している。異なる
のけ零クロスを検出するためのコンパレータであり、こ
のコンパレータ9[Viヒステリンス等を持たせること
により零クロスを判御する基準電圧を人力信号の平均値
よりずらせることにより、音声区間でのみゼロクロスを
検出するようにしている。
第6図はコンパレータ9の構造を示すもので、ヒステリ
シスを持つている。このコンパレータを用いた場合には
たとえば@6図aK示すようなノイズを含んだ入力波形
に対してヒステリシスを適当に設定することにより、@
6図すに示すように1声区間のみでゼロクロスを検出す
ることが可能である。
シスを持つている。このコンパレータを用いた場合には
たとえば@6図aK示すようなノイズを含んだ入力波形
に対してヒステリシスを適当に設定することにより、@
6図すに示すように1声区間のみでゼロクロスを検出す
ることが可能である。
また、第7図はコンパレータ9の他の構成列で、基準電
圧をずらせたコンパレータを示すものである。この場合
も第8図aに示すようなノイズを含んだ入力波形に対し
て基準電1fをずらせることVCより第8図すに示すよ
うに音声区間のみで応動するようにできる。
圧をずらせたコンパレータを示すものである。この場合
も第8図aに示すようなノイズを含んだ入力波形に対し
て基準電1fをずらせることVCより第8図すに示すよ
うに音声区間のみで応動するようにできる。
上述した零クロス処理のなされたコンパレータ9 (7
) 出力v」、マイクロコンピュータ5の割込み端子に
入力さJする。コンパレータ9の出力が・・イレベルか
らローレベルに変fヒするごとに割込みが余生し、零ク
ロスカウンタに割当てられたメモリの内容が1つ増7J
I]させられる。さらに10 m8ecごとにタイマ割
込みを発生させ、1フレーム(10msec) 中V
ζζ何回ツクロスあるかがカウントされる。
) 出力v」、マイクロコンピュータ5の割込み端子に
入力さJする。コンパレータ9の出力が・・イレベルか
らローレベルに変fヒするごとに割込みが余生し、零ク
ロスカウンタに割当てられたメモリの内容が1つ増7J
I]させられる。さらに10 m8ecごとにタイマ割
込みを発生させ、1フレーム(10msec) 中V
ζζ何回ツクロスあるかがカウントされる。
コンパレータ9は音声区間でのみ零クロスを検出するよ
うに構成されているので、1フレーム中の零りロスカウ
ント値は音声区間のフレームでは0でrI:r、ないが
、音声区間以外のフレームでは0になると考えられる。
うに構成されているので、1フレーム中の零りロスカウ
ント値は音声区間のフレームでは0でrI:r、ないが
、音声区間以外のフレームでは0になると考えられる。
したがりて零りロスカウント閘がo″cないような区間
を音声区間とみなし、その区間の零りロスカウント値ヲ
マイクロコンピュータのメモリに書き込むことが考えら
れる。
を音声区間とみなし、その区間の零りロスカウント値ヲ
マイクロコンピュータのメモリに書き込むことが考えら
れる。
裂音の前などに無音部分が存在するので、単に零クロス
カウント値が0でないところを音声区間とみなすのでは
不十分である。そこで零クロスカウント値の系列に対し
て第9図に示す方法で音声区間を決定する。
カウント値が0でないところを音声区間とみなすのでは
不十分である。そこで零クロスカウント値の系列に対し
て第9図に示す方法で音声区間を決定する。
まず、零クロスカウント値が0でないフレームが所定数
(たとえば5コ)連続すると、その最初の0でないフレ
ームを音声区間の始まりとするっ音声区間が始1つだ陵
、零りロスカウント1直がOであるフレームが所定数(
たとえば3011i!il)連続すると、最終の○でな
いフレームを音声区間の終わりとする。このようにして
検出された音声区間が一定長(たとえば200m5ec
)に達しない場合、m語音声としては短かすぎるので
音声区間とみなさない。同様に音声区間が一定長(たと
えば1,2sea )より長い場合も音声区間とみなさ
ない。
(たとえば5コ)連続すると、その最初の0でないフレ
ームを音声区間の始まりとするっ音声区間が始1つだ陵
、零りロスカウント1直がOであるフレームが所定数(
たとえば3011i!il)連続すると、最終の○でな
いフレームを音声区間の終わりとする。このようにして
検出された音声区間が一定長(たとえば200m5ec
)に達しない場合、m語音声としては短かすぎるので
音声区間とみなさない。同様に音声区間が一定長(たと
えば1,2sea )より長い場合も音声区間とみなさ
ない。
マイクロコンピュータ内部で行われていることを具体的
に述べるとμ下のようKなる。10m5ecごとのタイ
マ割込みによりて1フレーム中の零りロスカウント直が
検出されると、それが0かどうか判定する。零クロスカ
ウント値がOでないフレームが現れると、そこを音声区
間の始まりと仮定し、零クロスデータ収納用に割当てた
メモリ領域の先頭から順に1フレームごとの零りロスカ
ウント@全書き込み始める。書き込みを始めてから所定
フレーム数に達しないうちに零クロスカウント値がOで
あるフレームが検出されると、音声区間がまだ始まって
いないとして、そこから新たに音声区間の始まりを捜し
ていく。書き込みを始めてから、零クロスカウント値が
0でないフレームが所定数連続すると、音声区間の始筐
りが検出されたとしてさらに書き込みを続ける。その陵
零りロスカウント圃が0であるフレームがO″cあるフ
レームが所定数連続すると、「角区間の終わりが検出さ
れたとして書き込みを終了する。書き込まれたフレーム
数が所定数に達しない場合や、所定数J:り多く書き込
んでもまだ音声区間の終わりが検出されない場合は、書
き込んだ部分をけ角区間とみなさず、新たVこ音声区間
の始筐りを捜していく〇1゜ このようにして音声区間が検出されると、メモリに書き
込まれた音声区間内の零クロスカウント値から、従来例
で述べたのと同様の方法を用いて16個がサンプルされ
、標準パターンとの距離が計算される。距離■最小ll
1Iを与える標準パターンに対応する単語が認識結果で
ある。
に述べるとμ下のようKなる。10m5ecごとのタイ
マ割込みによりて1フレーム中の零りロスカウント直が
検出されると、それが0かどうか判定する。零クロスカ
ウント値がOでないフレームが現れると、そこを音声区
間の始まりと仮定し、零クロスデータ収納用に割当てた
メモリ領域の先頭から順に1フレームごとの零りロスカ
ウント@全書き込み始める。書き込みを始めてから所定
フレーム数に達しないうちに零クロスカウント値がOで
あるフレームが検出されると、音声区間がまだ始まって
いないとして、そこから新たに音声区間の始まりを捜し
ていく。書き込みを始めてから、零クロスカウント値が
0でないフレームが所定数連続すると、音声区間の始筐
りが検出されたとしてさらに書き込みを続ける。その陵
零りロスカウント圃が0であるフレームがO″cあるフ
レームが所定数連続すると、「角区間の終わりが検出さ
れたとして書き込みを終了する。書き込まれたフレーム
数が所定数に達しない場合や、所定数J:り多く書き込
んでもまだ音声区間の終わりが検出されない場合は、書
き込んだ部分をけ角区間とみなさず、新たVこ音声区間
の始筐りを捜していく〇1゜ このようにして音声区間が検出されると、メモリに書き
込まれた音声区間内の零クロスカウント値から、従来例
で述べたのと同様の方法を用いて16個がサンプルされ
、標準パターンとの距離が計算される。距離■最小ll
1Iを与える標準パターンに対応する単語が認識結果で
ある。
なお、本発明の音声区間検出装置は、上記実施列で述べ
た零クロスによる音声認識のみならず他の認識装置にお
いても有効である。
た零クロスによる音声認識のみならず他の認識装置にお
いても有効である。
以上の説明から明らかなように本発明によれば構造がき
わめて簡単な音声区間検出装置を提供することができ、
またこの装置を用いることにより従来よりも構成が簡m
で安価な「語音声認識装置を実現することができる。
わめて簡単な音声区間検出装置を提供することができ、
またこの装置を用いることにより従来よりも構成が簡m
で安価な「語音声認識装置を実現することができる。
第1図は従来の屯語片声認識装置のブロック図、第2図
はコンパレータの回路図、第3図はその装部の信号波形
図、第4図は本発明の一実施クリによる音声区間検出装
置を用いた単R丘声装置のブロック図、第6図および第
7図はその要部の回路図、第6図および第8図は同要部
の信号波形図、第9図は「角区間決定手順を不tフロー
チャートである0 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第2
図 第3図 第7図 第8図 699−
はコンパレータの回路図、第3図はその装部の信号波形
図、第4図は本発明の一実施クリによる音声区間検出装
置を用いた単R丘声装置のブロック図、第6図および第
7図はその要部の回路図、第6図および第8図は同要部
の信号波形図、第9図は「角区間決定手順を不tフロー
チャートである0 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第2
図 第3図 第7図 第8図 699−
Claims (1)
- 入力音声信号の平均値とは異なる屯田を基準電圧とする
電圧比較器と、この重圧比較kgの出力の状態の変1ヒ
回数が予め定めた基準の直を上回る状態が一定時間続く
とき、その開始時点を片角区間の始めとみなし、一定時
間取」二前記市圧比較器の出力の状態が変比しない時点
をもって音声区間の終了時点とする検出手段とを設けた
ことを特許とする音声区間検出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56204405A JPS58105200A (ja) | 1981-12-16 | 1981-12-16 | 音声区間検出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56204405A JPS58105200A (ja) | 1981-12-16 | 1981-12-16 | 音声区間検出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS58105200A true JPS58105200A (ja) | 1983-06-22 |
JPS6335995B2 JPS6335995B2 (ja) | 1988-07-18 |
Family
ID=16489994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56204405A Granted JPS58105200A (ja) | 1981-12-16 | 1981-12-16 | 音声区間検出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58105200A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59182498A (ja) * | 1983-04-01 | 1984-10-17 | 日本電気株式会社 | 音声検出回路 |
JPH01306897A (ja) * | 1988-06-06 | 1989-12-11 | Nippon Telegr & Teleph Corp <Ntt> | 音声検出回路 |
-
1981
- 1981-12-16 JP JP56204405A patent/JPS58105200A/ja active Granted
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59182498A (ja) * | 1983-04-01 | 1984-10-17 | 日本電気株式会社 | 音声検出回路 |
JPH01306897A (ja) * | 1988-06-06 | 1989-12-11 | Nippon Telegr & Teleph Corp <Ntt> | 音声検出回路 |
Also Published As
Publication number | Publication date |
---|---|
JPS6335995B2 (ja) | 1988-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Warren | Auditory temporal discrimination by trained listeners | |
JPH0713584A (ja) | 音声検出装置 | |
JPS58105200A (ja) | 音声区間検出装置 | |
JPS62150295A (ja) | 音声認識方法 | |
JPH02210500A (ja) | 標準パターン登録方式 | |
Niederjohn et al. | Computer recognition of the continuant phonemes in connected English speech | |
JP3515143B2 (ja) | パターン追加登録装置 | |
JPS61260299A (ja) | 音声認識装置 | |
JPS58116595A (ja) | 単語音声認識装置 | |
JPS60168200A (ja) | ピツチ抽出装置 | |
JPH0298000A (ja) | 男女声の識別方法 | |
JPS61292699A (ja) | 音声通過フイルタ | |
JPS5923398A (ja) | 単音節音声認識装置 | |
JPS58123598A (ja) | 音声認識装置 | |
JPS61258299A (ja) | 特定話者用単語音声認識装置 | |
JPS63220200A (ja) | 母音切出し装置 | |
JPS61262798A (ja) | 音声区間検出装置 | |
JPS63115200A (ja) | 音声分析方式 | |
JPS59231600A (ja) | 音声区間検出方法 | |
JPS60220073A (ja) | 生体帰還装置 | |
JPS61105597A (ja) | 連続音声認識装置 | |
JPS6027886A (ja) | 音声区間計時装置 | |
JPS6287993A (ja) | 音声認識装置 | |
JPS59219798A (ja) | 音声認識装置 | |
JPS59180594A (ja) | 音声認識装置 |