JPS58105200A - 音声区間検出装置 - Google Patents

音声区間検出装置

Info

Publication number
JPS58105200A
JPS58105200A JP56204405A JP20440581A JPS58105200A JP S58105200 A JPS58105200 A JP S58105200A JP 56204405 A JP56204405 A JP 56204405A JP 20440581 A JP20440581 A JP 20440581A JP S58105200 A JPS58105200 A JP S58105200A
Authority
JP
Japan
Prior art keywords
voice
voice section
section
zero
comparator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56204405A
Other languages
English (en)
Other versions
JPS6335995B2 (ja
Inventor
楠原 久代
英一 坪香
真弓 和昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP56204405A priority Critical patent/JPS58105200A/ja
Publication of JPS58105200A publication Critical patent/JPS58105200A/ja
Publication of JPS6335995B2 publication Critical patent/JPS6335995B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、構成が簡単で安価な単語音声認識装置を実現
するための音声の区間検出装置VC関するものである。
音声認識装置としては、多数のバンドパスフィルタやス
ペクトル分析手段等を用いた大規模なものが多く、構成
が複雑であり、コストも非常VC高い◇一方、認識する
学語数が少なく認識率は低くてもよいが、構成が簡単で
安価な音声認識装置に対する要求がある。
簡単な片角認識方法の1つに、片角波形のゼロクロス情
報を用いるものがある。第1図はその方法を用いた音声
認識装置の一列である。マイクロホン1から入力された
音声信号は、プリアンプ2゜ピッチ成分除去のだめの・
・イバスフィルタ3を通った後、コンパレータ4により
て、零クロスが検出される。コンパレータ4の出力はマ
イクロコンピュータ6の割り込み入力端子に入力され、
コンパレータ4の出力がハイレベルカラローレベルに変
1ヒするごとに、割込みが発生する。割込みが発生する
と、零クロスカウンタに割当てられたメモリの内容が1
つ増加させられる。さらに10msθCごとにタイマ割
込みをネ生させることにより、10m5ec  (これ
を1フレームとする)中に何回零クロスがあるかがカウ
ントされる。
この場合、零クロス検出器としては、第2図に示すよう
に演算増幅4によって作成した零レベルを基準電圧とす
るコンパレータ4を用いることが考えられるが、入力波
形は第3図dに示−rように騒音などのノイズを含んで
おり、コンパレータ4けノイズの零クロスに対しても応
動することVCなり、第3図b[示す出力を生ずるため
音声区間以外の部分でも零クロスがカウントされ、音声
区間と音声のない区間とを区別できない。
そこでbt来、入力波形の包絡線情報を用いて音声区間
を倹t)」する方法が多く用いられてきた。第1図にお
いて、プリアンプ2を通った「声信号は。
整流回路6を通り包絡線検出回路7によりて包絡線検出
がなされる。この包絡線の直はA/D変換器8によりて
A/D変換され、マイクロコンピュータ6に入力される
。この人力1直が一定の1直を越えている区間を音声区
間とし、この間、零クロスカウント11nがマイクロコ
ンピュータ6内の遂次メモリに書き込まれる。
音声区間が終わると、メモリVC書き込まれている音声
区間内の零クロスカウント値から等間隔に16フレ一ム
分がサンフ゛ルされる。この161固の零クロスデータ
Vこもとづいて認識を行う。認識に個の零クロスデータ
を登録する。登@はスイッチ入力等により登録モードで
ある旨をマイクロコンピュータ5に入力した後、マイク
ロホンから単語を順に発声することによってなされる。
このようにあらかじめ登録されている各単語の16個の
零クロスデータのことを標準パターンと呼ぶ。認識を行
う時は、モードを認識モードにした後マイクロホンから
音声を入力する。入力音声からサンプルされた16個の
零クロスデータのi番目の値を5t(i=1・・・・・
φ16)、標準パターンのj番目に登録した単語のi番
目の直をTji (i二1・・・・・・16、j=1・
・・・・・W(Wは登録単語数)ンとするとき、入力音
声と1番目の単語との間の距離D1を Dj−Σ 1Tji−8i  l l;1 と定義する。@標準パターンに対してi)】を計算し、
Djの最小値全厚える標準パターンに対応する単語を認
識結果とする。認R結果はLED等で表示される。
上記の装置1 vcおい′C1零クロスを検出するため
の回路は非常に簡単であるが、音声区間検出のためvC
けやや複雑な回路を用いている。したがって構成がより
簡t1tで安価な単語音声認識装置を実現するためには
、より簡単な音声区間検出装置が望まれる。
本発明はより構成が簡単で安価な単語音声認識装置を実
現するために、コンパレータを用いた簡単な回路構成で
「声区間検出を行う装置を提供することを目的とするも
のである。
本発明の「声区間検出装置によれば、コンパレータにヒ
ステリシスを持たせたり、零りロスe−14J定する基
準電圧を入力信号の平均値からずらせることにより1音
声のない比較的低信号レベル区間における零クロス検出
を阻止することをOT能とする。そして、一定時間連続
して零クロスが検出されたとき、その検出開始時点を音
声区間の始まりとし、一定時間連続して零クロスが検出
されないとき、検出さnなくなった時点を音声区間の終
わりとして音声区間を検出する。
本発明の一実施クリによる「声区間検出装置を用いた音
声認識装置を第4図に示す。同図において、第1図のも
のに対応するブロックには同符号を付している。異なる
のけ零クロスを検出するためのコンパレータであり、こ
のコンパレータ9[Viヒステリンス等を持たせること
により零クロスを判御する基準電圧を人力信号の平均値
よりずらせることにより、音声区間でのみゼロクロスを
検出するようにしている。
第6図はコンパレータ9の構造を示すもので、ヒステリ
シスを持つている。このコンパレータを用いた場合には
たとえば@6図aK示すようなノイズを含んだ入力波形
に対してヒステリシスを適当に設定することにより、@
6図すに示すように1声区間のみでゼロクロスを検出す
ることが可能である。
また、第7図はコンパレータ9の他の構成列で、基準電
圧をずらせたコンパレータを示すものである。この場合
も第8図aに示すようなノイズを含んだ入力波形に対し
て基準電1fをずらせることVCより第8図すに示すよ
うに音声区間のみで応動するようにできる。
上述した零クロス処理のなされたコンパレータ9 (7
) 出力v」、マイクロコンピュータ5の割込み端子に
入力さJする。コンパレータ9の出力が・・イレベルか
らローレベルに変fヒするごとに割込みが余生し、零ク
ロスカウンタに割当てられたメモリの内容が1つ増7J
I]させられる。さらに10 m8ecごとにタイマ割
込みを発生させ、1フレーム(10msec)  中V
ζζ何回ツクロスあるかがカウントされる。
コンパレータ9は音声区間でのみ零クロスを検出するよ
うに構成されているので、1フレーム中の零りロスカウ
ント値は音声区間のフレームでは0でrI:r、ないが
、音声区間以外のフレームでは0になると考えられる。
したがりて零りロスカウント閘がo″cないような区間
を音声区間とみなし、その区間の零りロスカウント値ヲ
マイクロコンピュータのメモリに書き込むことが考えら
れる。
裂音の前などに無音部分が存在するので、単に零クロス
カウント値が0でないところを音声区間とみなすのでは
不十分である。そこで零クロスカウント値の系列に対し
て第9図に示す方法で音声区間を決定する。
まず、零クロスカウント値が0でないフレームが所定数
(たとえば5コ)連続すると、その最初の0でないフレ
ームを音声区間の始まりとするっ音声区間が始1つだ陵
、零りロスカウント1直がOであるフレームが所定数(
たとえば3011i!il)連続すると、最終の○でな
いフレームを音声区間の終わりとする。このようにして
検出された音声区間が一定長(たとえば200m5ec
 )に達しない場合、m語音声としては短かすぎるので
音声区間とみなさない。同様に音声区間が一定長(たと
えば1,2sea )より長い場合も音声区間とみなさ
ない。
マイクロコンピュータ内部で行われていることを具体的
に述べるとμ下のようKなる。10m5ecごとのタイ
マ割込みによりて1フレーム中の零りロスカウント直が
検出されると、それが0かどうか判定する。零クロスカ
ウント値がOでないフレームが現れると、そこを音声区
間の始まりと仮定し、零クロスデータ収納用に割当てた
メモリ領域の先頭から順に1フレームごとの零りロスカ
ウント@全書き込み始める。書き込みを始めてから所定
フレーム数に達しないうちに零クロスカウント値がOで
あるフレームが検出されると、音声区間がまだ始まって
いないとして、そこから新たに音声区間の始まりを捜し
ていく。書き込みを始めてから、零クロスカウント値が
0でないフレームが所定数連続すると、音声区間の始筐
りが検出されたとしてさらに書き込みを続ける。その陵
零りロスカウント圃が0であるフレームがO″cあるフ
レームが所定数連続すると、「角区間の終わりが検出さ
れたとして書き込みを終了する。書き込まれたフレーム
数が所定数に達しない場合や、所定数J:り多く書き込
んでもまだ音声区間の終わりが検出されない場合は、書
き込んだ部分をけ角区間とみなさず、新たVこ音声区間
の始筐りを捜していく〇1゜ このようにして音声区間が検出されると、メモリに書き
込まれた音声区間内の零クロスカウント値から、従来例
で述べたのと同様の方法を用いて16個がサンプルされ
、標準パターンとの距離が計算される。距離■最小ll
1Iを与える標準パターンに対応する単語が認識結果で
ある。
なお、本発明の音声区間検出装置は、上記実施列で述べ
た零クロスによる音声認識のみならず他の認識装置にお
いても有効である。
以上の説明から明らかなように本発明によれば構造がき
わめて簡単な音声区間検出装置を提供することができ、
またこの装置を用いることにより従来よりも構成が簡m
で安価な「語音声認識装置を実現することができる。
【図面の簡単な説明】
第1図は従来の屯語片声認識装置のブロック図、第2図
はコンパレータの回路図、第3図はその装部の信号波形
図、第4図は本発明の一実施クリによる音声区間検出装
置を用いた単R丘声装置のブロック図、第6図および第
7図はその要部の回路図、第6図および第8図は同要部
の信号波形図、第9図は「角区間決定手順を不tフロー
チャートである0 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第2
図 第3図 第7図 第8図 699−

Claims (1)

    【特許請求の範囲】
  1. 入力音声信号の平均値とは異なる屯田を基準電圧とする
    電圧比較器と、この重圧比較kgの出力の状態の変1ヒ
    回数が予め定めた基準の直を上回る状態が一定時間続く
    とき、その開始時点を片角区間の始めとみなし、一定時
    間取」二前記市圧比較器の出力の状態が変比しない時点
    をもって音声区間の終了時点とする検出手段とを設けた
    ことを特許とする音声区間検出装置。
JP56204405A 1981-12-16 1981-12-16 音声区間検出装置 Granted JPS58105200A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56204405A JPS58105200A (ja) 1981-12-16 1981-12-16 音声区間検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56204405A JPS58105200A (ja) 1981-12-16 1981-12-16 音声区間検出装置

Publications (2)

Publication Number Publication Date
JPS58105200A true JPS58105200A (ja) 1983-06-22
JPS6335995B2 JPS6335995B2 (ja) 1988-07-18

Family

ID=16489994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56204405A Granted JPS58105200A (ja) 1981-12-16 1981-12-16 音声区間検出装置

Country Status (1)

Country Link
JP (1) JPS58105200A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59182498A (ja) * 1983-04-01 1984-10-17 日本電気株式会社 音声検出回路
JPH01306897A (ja) * 1988-06-06 1989-12-11 Nippon Telegr & Teleph Corp <Ntt> 音声検出回路

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59182498A (ja) * 1983-04-01 1984-10-17 日本電気株式会社 音声検出回路
JPH01306897A (ja) * 1988-06-06 1989-12-11 Nippon Telegr & Teleph Corp <Ntt> 音声検出回路

Also Published As

Publication number Publication date
JPS6335995B2 (ja) 1988-07-18

Similar Documents

Publication Publication Date Title
Warren Auditory temporal discrimination by trained listeners
JPH0713584A (ja) 音声検出装置
JPS58105200A (ja) 音声区間検出装置
JPS62150295A (ja) 音声認識方法
JPH02210500A (ja) 標準パターン登録方式
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPS6132679B2 (ja)
JP3515143B2 (ja) パターン追加登録装置
JPS61260299A (ja) 音声認識装置
JPS58116595A (ja) 単語音声認識装置
JPS60168200A (ja) ピツチ抽出装置
JPH0298000A (ja) 男女声の識別方法
JPS61292699A (ja) 音声通過フイルタ
JPS58223192A (ja) 鼻音識別装置
JPS5923398A (ja) 単音節音声認識装置
JPS58123598A (ja) 音声認識装置
JPS6217800A (ja) 音声区間判定方式
JPS63220200A (ja) 母音切出し装置
JPS61262798A (ja) 音声区間検出装置
JPS63115200A (ja) 音声分析方式
JPS59231600A (ja) 音声区間検出方法
JPS60220073A (ja) 生体帰還装置
JPS61105597A (ja) 連続音声認識装置
JPS6027886A (ja) 音声区間計時装置
JPS6287993A (ja) 音声認識装置