JPS58116595A - 単語音声認識装置 - Google Patents

単語音声認識装置

Info

Publication number
JPS58116595A
JPS58116595A JP21285881A JP21285881A JPS58116595A JP S58116595 A JPS58116595 A JP S58116595A JP 21285881 A JP21285881 A JP 21285881A JP 21285881 A JP21285881 A JP 21285881A JP S58116595 A JPS58116595 A JP S58116595A
Authority
JP
Japan
Prior art keywords
zero
comparator
voice section
frame
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP21285881A
Other languages
English (en)
Other versions
JPS6336679B2 (ja
Inventor
楠原 久代
真弓 和昭
英一 坪香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP21285881A priority Critical patent/JPS58116595A/ja
Publication of JPS58116595A publication Critical patent/JPS58116595A/ja
Publication of JPS6336679B2 publication Critical patent/JPS6336679B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は音声の零クロス情報VCよる単語音声認識装置
に関するものである。
音声認識装置としては、多数のパ/ドパスフィルタやス
ペクトル分析手段等を用い:を大規模なものが多く、構
成が複雑でありコストも高い。一方。
認識する単Mj数が少なく認識率は低ぐても構成が簡単
で安価な音声認識装置に対する要求がある。−簡単な音
声認識方法の1つに、音声波形の零クロス情報を用いる
ものがある。コンパレータによって音声信号の零クロス
を検出し、コノピユータ等を用いてそれを処理すること
によって単語の特捜 徴を描出し、認識するものである。実際には単に入力信
号の零クロスをとるたけでは、第1回に示すように入力
信号に含まれるノイズ等により、音声以外の部分でも零
クロスが検出されるため、音声区間と音声のない区間と
を分離することができないので、零クロス情報以外に、
入力信号の包絡線を検出し、包絡線が定められた値を越
える区IWを音声区間とみなして、その区間の零クロス
情報を認識に用いる。しかしこの方法によると、包絡線
検出のための回路が複雑になる。
音声区間を分離する他の方法としては、コンパレータに
ヒステリシスを持たせたり、コンパレータの基準電圧を
入力信号の平均値からずらせることにより、音声に比べ
て振幅の小さいノイズにコンパレータが応動しないよう
にすることが考えられる。第2図、第3図はそれぞれ、
コンパレータにヒステリシスを持たせた場合、コンハv
−タノ基準電圧をずらせた場合の、入力波形とコンパレ
ータの出力波形を示したものである。このようにノイズ
を含んだ入力波形に対し、ヒステリシスを適当に設定し
たり、基準電圧を適当にずらせることにより、音声のな
い区間におけるコンパレータの出力状態の変化を阻止す
ることができる。したがって、出力状態の変化のある区
間の情報を用いて認識を行なう。この除行られる情報は
厳密には零クロス情報ではないが、ノイズに比べ振幅の
大きい音声信号においては、−コンパレータのヒステリ
シスや基準電圧のずれはあ捷り影響せず、零クロス情報
とほぼ同じ情報が得られる。しかし、振幅の小さい子音
部については零クロス情報が失わ扛ることがある。零ク
ロス情報を用いた認識方法においては、母音部など比較
的零クロスの少ない部分と、摩擦音など零クロスの多い
部分との零クロス数の差が大きいことが望筐しい6.シ
かし、摩擦音部は振幅が小さいため、上記のb法による
と零クロス情報が失われ、特徴が現われに<<、認識精
度が十分得られないという問題がある。
したがって本発明は、コンパレータを用いて零クロス情
報を得、それによって単語音声認識を行なう装置におい
て、認識の精度を向−卜させることを目的とするもので
ある。
本発明は、音声信号の平均レベルに対応する基準値とを
比較する第1の比較手段と、音声信号と。
音声信号の平均レベルより所定量たけ偏倚した基準値と
を比較する第2の比較手段と、第2の比較手段の出力よ
り音声区間を検出する手段と、検出された音声区間にお
ける前記第1の比較手段の出力の零クロス情報から音声
認識を行なう認識手段から成り、簡単な構成で、認識精
度を上げることが可能となる。以下1本発明の実施例に
ついて説明する。
第4図に本発明による音声認識装置の実施例の構成を示
す。図において、マイクロホン1から入力された音声信
号は、プリアンプ2によって増幅され、ピッチ成分除去
のだめのバイパスフィルタ3、入力音声信号の平均値を
ゼロレベルに調節するためのオフセット調整部4を通っ
た後、コンパレータ6および6に入力される。コンパレ
ータ6は実質的に音声信号の平均レベルより所定量だけ
偏倚した基準値と音声信号を比較するもので、例えば第
3図で示したようにヒステリシスを持たせ。
ノイズを主として含む小振幅の信号に対しては応動しな
いようにすることで構成される。ここで。
ヒステリシスを持たせる代わりに、第2図に示したよう
にコンパレータの基準電圧を入力信号の平均値(零レベ
ル)からずらせることによりノイズに対して応動しない
ようにしてもよい。一方、コンパレータ6にはヒステリ
シスを持たせず、基準電圧を入力信号の平均値と一致さ
せている。
コンパレータ6および6の出力はそれぞれマイクロコン
ピュータ7の入力端子および割込み入力端子に入力され
る。マイクロコンビコータは、全体価格をできるだけ安
価にするため1通常4 bit程度のマイコンが用いら
れる。なおRAM8はマイクロコンピュータ内のRAM
容量容量小さい場合に外付けされるものである。
マイクロコンピュータ7はコンパレータ6からの入力を
逐次読み、入力の状態が変化するごとにカウント用に割
当てられたメモリの内容を1つ増加させる。この間、コ
ンパレータ6からの入力がハイレベルからローレベルに
変化するごとに割込みが発生し、割込み処理ルーチンに
おいてコンパレータ6のカウント用に割当てられたメモ
リの内容が1つ増加させられる。さらに10m5ecご
とにタイマ割込みを発生させることにより、10m5a
:(こ扛を1フレームとする。)中のコンパレータ6お
よび6の出力状態の変化回数が得ら扛る。1フレーム中
のコンパレータ6の出力状態の変化回数を零りロス数、
コンパレータ6の出力状態の変化回数を準零クロス数と
呼ぶことにする。これらの処理の流れは、第6図61お
よび63.62および66に示すとおりである。
まず準零クロス数を用いて音声区間を検出する。
前述ノようにコンパレータ6はノイズに対して応声区間
のフレームでは零でないが、音声のないフレームでは零
であると考えら扛る。したがって。
準零クロス数を用いて音声区間を検出することかり能で
ある。しかし音声区間内においても破裂音の前などには
無音区間が存在するので、単に準零クロス数が零でない
ところを音声区間とみなすのは不十分である。そこで準
零クロス数の系列に対して第6図に示すような方法で音
声区間を決定する。準零クロス数が零でないフレームが
所定数(たとえば6個)連続すると、その最初の零でな
いフレームを音声区間の始1りとする。音声区間が始ま
った後、準零クロス数が零であるフレームが所定数(た
とえば30個)連続すると零でないフレ・−ムの最後を
音声区間の終わりとする。このようにして検出された音
声区間が一定長(たとえは20フレーノ、)に達しない
場合、48語音声としては短かすぎるので音声区間とみ
なさない。また検出された音声区間が所定長(たとえば
120フレーム)を越える場合も単語音声とし、では長
すき−るので音声区間とみなさない。
音声区間検出64と平行して零クロス数のRAM8への
書き込み67が行なわれる。第6図に示すように準零ク
ロス数の値に基づいて零クロス数全書き込むか否かが決
定される。第6図において破線テ囲んだ部分はマイクロ
コンピュータ内の処理である。この様子を具体的に示す
と第7図のようになる。ここでNはRAM8に書き込ん
だフレームの数1Mは準零クロス数が零であるフレーム
の数である。1ず、準零クロス数が零でないフレームが
現われると、零クロス数のRAMへの書き込み制御66
によりRAM8の零クロス数格納用に割当てられた領域
の先頭から順次1つフレームごとの零クロス数′(f−
書き込む。書き込みを開始した後、所定フレーム(ここ
では6フレーム)ニ達シないうちに準零クロス数が零で
あるフレームが現れると音声区間でないと判断し、新た
に音声区間の開始点を捜す。音声区間が開始した後、所
定フレーム(ここでは30フレーム)連続して準零クロ
ス数が零となると、音声区間終了として書き込みを終え
、書き込んだ音声区間が所定フレーム(ここでは20)
V−ム)以上であるかどうか判定し、そうでない場合は
音声区間とみなさず新たに音声区間の開始点を捜す。音
声区間と判定された場合、零クロス数、準零クロス数の
カウントと書き込みを終了し次の処理へ移る。また所定
フレーム(ここでは音声区間の最大値120フレームと
音声区間終了検出のための30フレームの和である16
0フレーム)書き込んでも音声区間終了が検出されない
場合は音声区間とみなさず新たに音声区間の開始点を捜
す。
音声区間と判定され書き込みが終了すると、書き込1れ
たフレームの終わりから所定フレーム(ここでは30フ
レーム)さかのぼったフl/−ムが音声区間の終了点で
ある。このようにして音声区間が決定すると音声区間内
の零クロス数から等j’ffl隔K 1sフレ一ム分が
サンプルされる。音声区間をnフレームとすると、サン
プルされるフレー11は、1.nz”16+1.2−n
/1e+1.3−n ′1e+ 1.−=−,15−n
/16+1番めのフレームである。ここで使用した71
クロコンピユータは4ビノトマ/ンとしているので、1
6で割るのはフレーム計算のために割当てられたメ七り
の下位1ワードを無視することで実現され、上記の計算
は加算だけで行なうことができる。また。
フレーム番号とRAM番地は順序よく対応しているので
、サンプルフレームの計算は実際にはフレーム数ではな
(RAM番地によって計算される。
このようにして得られた1単語につ:e16(r!Aの
零クロス数にもとづいて認識を行う。壕ず、認識すべき
単語の各々について−F記の16個の零り「Jス数RA
M8に登録する。この登録さ扛たものを標準パターンと
呼ぶ。スイッチ入力により登録モードである旨にマイク
ロコンピュータ7に入力した後、マイクロホンから単語
を発声すると、 RAM8に書き込1れた零クロス数か
ら16個がサンプルされ、標準パターン登録用に割当て
られたRAM領域の先頭から順に書き込1れる。
登録が終了すると、スイッチ入力によりモードを認識に
した後、マイクロホンから音声を人力すん。入力音声か
らサンプルさ九fr 1e (Ilfiの雲クロス数の
i番目の値1si(i=1.−・・・・・、16)、 
 標準パターンのjm1に登録した単語のi番目の値を
Tji(i−1,−−、16、j = 1.−=−、%
(Wは登録単語数))とするとき、入力音声と3番目の
単語ものとする。各標準パターンに対してDjk計算し
功 の最小値を与える標準パターンに対応する単語を認
識結果とし、LED等の表示素子(図示せず)で表示す
る。
本実施例は以上述べたように、音声区間検出と単1ff
j 間の距離算出用の2つのコンパレータと、マイクロ
コンピュータとを用いることにより、簡単な回路で音声
区間を検出するとともに、振幅の小さい子音部の零クロ
スも比較的精度よく検出できる。また、認識のための処
理が簡単であるので。
4ヒント程度のマイクロコンピュータで実現できる。
なお、ノイズなどにより零クロスの頻度が非常ニ多く、
マイクロコンピュータの割り込み処理力N、ν間約に追
従できない恐れのある揚台は、コンパレータ6に対して
も若干のヒステリシスを持たせたり、基準電圧を音声信
号の平均値より偏倚きせたりしてもよい。
【図面の簡単な説明】
第1図は従来の単語音声認識装置のコンパレータの動作
を説明するための波形図、第2図はヒステリシスを設け
たコンパレータの動作を説明するための波形図、第3図
は偏倚した基準電圧を有するコンパレータの動作を説明
するための波形図。 第4図は本発明の一実施例による単語音声認識装置のブ
ロック図、第6図は同実施例における音声区間検出の流
n図、第6図および第7図は零クロス数のRAMへの書
き込みの流扛図である。 1・・・・・マイクロボン、2・・・・・プリアンプ、
3 ・・・・バイパスフィルタ、4・・・・・・オフセ
ット1A1t[。 5.6・・・・・コンパレータ、了・・・・・マイクロ
コンピュータ、8・・・・・・RAM。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第6
図 第7図

Claims (1)

    【特許請求の範囲】
  1. 音声信号と音声信号の平均レベルに対応する基準値とを
    比較する第1の比較手段と、音声信号と音声信号の平均
    レベルより所定量たけ偏倚した基準値とを比較する第2
    の比較手段と、第2の比較手段の出力より音声区間を検
    出する手段と、検出された音声区間における前記第1の
    比較手段の出力の零クロス情報を標準の零クロス情報と
    比較することによって単語音声認識を行なう認識手段と
    から成る単語音声認識装置。
JP21285881A 1981-12-29 1981-12-29 単語音声認識装置 Granted JPS58116595A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21285881A JPS58116595A (ja) 1981-12-29 1981-12-29 単語音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21285881A JPS58116595A (ja) 1981-12-29 1981-12-29 単語音声認識装置

Publications (2)

Publication Number Publication Date
JPS58116595A true JPS58116595A (ja) 1983-07-11
JPS6336679B2 JPS6336679B2 (ja) 1988-07-21

Family

ID=16629467

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21285881A Granted JPS58116595A (ja) 1981-12-29 1981-12-29 単語音声認識装置

Country Status (1)

Country Link
JP (1) JPS58116595A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04150252A (ja) * 1990-10-09 1992-05-22 Mitsubishi Electric Corp 音声/音声帯域内データ識別装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04150252A (ja) * 1990-10-09 1992-05-22 Mitsubishi Electric Corp 音声/音声帯域内データ識別装置

Also Published As

Publication number Publication date
JPS6336679B2 (ja) 1988-07-21

Similar Documents

Publication Publication Date Title
US4707857A (en) Voice command recognition system having compact significant feature data
JPS58116595A (ja) 単語音声認識装置
JPS6312312B2 (ja)
JPS6335995B2 (ja)
JP3352144B2 (ja) 音声認識装置
JP2002244697A (ja) 音声認証装置、音声認証方法、及びプログラム
JPS60164800A (ja) 音声認識装置
WO1987003127A1 (en) System and method for sound recognition with feature selection synchronized to voice pitch
JPS61138296A (ja) 音声認識装置
JPS6069694A (ja) 語頭子音のセグメンテ−ション法
JPS58195895A (ja) 単語音声認識装置
JPS59219800A (ja) 音声パターン比較方法
JPS6287993A (ja) 音声認識装置
JPS6310839B2 (ja)
JPH0412478B2 (ja)
JPS63183500A (ja) 音声セグメンテ−シヨン装置
JPS61190398A (ja) 破裂子音認識方式
JPS63254497A (ja) パタ−ン認識装置
JPS6257000A (ja) 音声認識装置
JPS6147994A (ja) 音声認識方式
JPH026079B2 (ja)
JPS58224400A (ja) 音声認識方式
JPS59195294A (ja) 音声パタ−ン比較装置
JPS61235899A (ja) 音声認識装置
JPS5926796A (ja) 音声認識装置