JPH04240899A

JPH04240899A - 音声認識装置

Info

Publication number: JPH04240899A
Application number: JP3023712A
Authority: JP
Inventors: Hirofumi Yajima; 弘文矢島
Original assignee: Clarion Co Ltd
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 1991-01-25
Filing date: 1991-01-25
Publication date: 1992-08-28

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、マイクロホンから取り
込まれた単発ノイズを含む単語や単語単位の発声音を認
識する音声認識装置に関する。

【０００２】

【従来の技術】従来の音声認識装置として、例えば、図
７に示すような構成のものが知られている。図７におい
て、マイクロホン１から取り込まれた発声音に対応する
音情報を増幅器２で増幅し、バンドパイフィルタ３で周
波数分析し、さらに、Ａ／Ｄコンバータ４でディジタル
データに変換し、音声認識装置５に入力する。ＣＰＵ７
では、モード選択スイッチ８が登録モードであれば、音
声認識部５の認識結果を、データメモリ６に登録し、認
識モードであれば、音声認識部５の認識結果を取り込み
、外部装置コントロール信号を出力する。

【０００３】

【発明が解決しようとする課題】このような構成におい
て、音声認識部５が音声認識ＬＳＩＴＣ８８６１Ｆ／Ｔ
Ｃ８８６５Ｆ０１（音声入力可能時間長、０．１２〜１
．６［ｓ］）で構成した場合、単発ノイズ（発声単語よ
りも短いノイズ）も音声とされてしまう。この原因は、
音声認識部５が「あ」とか「い」とかの単音単位（登録
も単音）でも認識可能とされていることにあるが、ユー
ザが単音でなく、「会社」のような単語単位で認識させ
たい場合には、上述した問題が発生していた。またこの問題を改善するために音声入力可能時間長のミ
ニマム値を大きくすると、逆に、ユーザが単音単位で認
識させたい場合に対応できなくなってしまう問題があっ
た。

【０００４】本発明の目的は、単発ノイズであることを
認識させ、認識率を向上させ、また単発ノイズ判定をキ
ャンセルすることにより認識率向上にはならないが単音
単位でも認識可能にした音声認識装置を提供することに
ある。

【０００５】

【課題を解決するための手段】このような目的を解決す
るために、本発明は、マイクロホンからの発声音に対応
する音情報を入力し、この音情報の所定の低周波領域で
の包絡線成分を抽出し、包絡線抽出信号を出力する抽出
手段と、この包絡線抽出信号を所定時間遅延して遅延信
号を出力する遅延手段と、この包絡線抽出信号および前
記遅延信号の各振幅レベルと予め定められた所定の基準
レベルとを比較して、振幅レベルが基準レベルを越えた
か否かを判定し、判定信号を出力する比較手段と、判定
信号を入力し、各振幅レベルが基準レベルを越えること
があった場合のみ、音情報を発声音と判断し、そうでな
い場合には音情報を単発ノイズと判断し、発声音と判断
したときのみ音声認識結果を出力するように音声認識部
を動作制御する認識制御手段とを備えたことを特徴とす
る。

【０００６】

【作用】本発明では、音情報の低周波領域での包絡線成
分とこの遅延信号の振幅レベルが基準レベルを越えたか
否かで単発ノイズかどうかを判断し、その結果で認識結
果を出力しているので、単発ノイズによる誤認識を防止
できる。

【０００７】

【実施例】以下、本発明の実施例を図面により詳細に説
明する。図１は本発明による音声認識装置の一実施例の
システム構成図で、９はローパスフィルタ、１０は遅延
回路、１１はコンパレータ、１２はラッチ回路、１３は
判定スイッチを示す。その他の符号は図７のものと同じ
である。

【０００８】図２は図１のＣＰＵ７でのコントロールの
メインルーチンを示すフローチャートであり、図３およ
び図４はそれぞれ登録ルーチンおよび音声認識ルーチン
を示すフローチャートである。

【０００９】以下図１の動作を図２〜図４を参照して説
明する。 ■音声データ登録時モード選択スイッチ８により、「登録モード」を選択す
る（図２、ステップ２１，２２）。ＣＰＵ７はそれを判
断して、登録ルーチンに移行する。ＣＰＵ７では、音声
認識部５に登録動作のコマンドを送る（図３、ステップ
３１）。音声認識部５では、Ａ／Ｄコンバータ４からの
音声の入力を待つ。この認識部５には音声トリガが内蔵
されており、Ａ／Ｄコンバータ４より入力された、ある
レベル以上のデータ間のみを音声データとして取り込む
。増幅器２、バンドパスフィルタ３、Ａ／Ｄコンバータ
４は常時作動しており、ユーザが発声した音声をマイク
ロホン１に入力し、増幅器２で増幅し、フィルタバンク
３で周波数分析し、その後、Ａ／Ｄコンバータ４でディ
ジタルデータに変換する。認識部５に取り込まれた音声
データを、認識部５のコントロールにより登録メモリ６
に保存し、また、登録順に、コード番号を付加する。 ■音声認識時モード選択スイッチ８により、「認識モード」を選択す
る（図２、ステップ２３）。ＣＰＵ７は、認識部５に認
識動作コマンドを送り（図４、ステップ４１）、認識部
５は音声入力待ちとなる。ユーザが認識対象単語を発声
することにより、マイクロホン１に入力された音声デー
タを、■と同様にして認識部５に取り込み、■で登録さ
れた音声データとのＤＰマッチングを認識部５で実行し
、一番類似度の高い登録データのコード番号及びその類
似度をそれぞれＣＰＵ７に返す。

【００１０】また、これと同時に、増幅器２からの出力
を、ローパスフィルタ９にも入力し、このフィルタ９で
、信号の包絡を求める。フィルタ９の出力を２つに分け
、方々を、例えば、約０．８［ｓ］（単発ノイズと音声
との音声区間のしきい値）の遅延を行う遅延回路１０に
通す。コンパレータ１１−１および１１−２では、ロー
パスフィルタ９および遅延回路１０の振幅レベルを基準
レベルと比較し、基準レベル以上の時に「１」を出力し
、その後、ラッチ回路１２に入力する。ラッチ回路１２
では、コンパレータ１１−１および１１−２の両方が同
時に「１」である時のみ、すなわち、現在の信号と０．
８［ｓ］前の信号が両方「１」である時のみ、ラッチ回
路１２の出力を「１」とする（その後はリセットが掛か
るまでは「１」出力のままである）。ＣＰＵ７は、認識
部５から何らかの情報を得た時に、ラッチ回路１２から
のデジタル信号を判断し（図４、ステップ４３）、「１
」ならば「発声音」と判断し、認識結果を外部に出力す
る（図４、ステップ４４）。そうでなければ、「単発ノ
イズ」として再度認識モードに入る。一方、「発声音」
と判断した場合、ラッチ回路へリセット信号を出力する
（図４、ステップ４５）。

【００１１】図５は単発ノイズの判定の様子を示すもの
で、（ａ）は単発ノイズの包絡線を示し、（ｂ）は発声
音声の包絡線を示している。図から解るように、単発ノ
イズの場合、その包絡線は０．８［ｓ］以上経過すると
、信号の振幅レベルは急激に低くなるが、発声音声の場
合、その包絡線は、０．８［ｓ］以上経過しても変わら
ない。

【００１２】図６は、図５の単発ノイズ判定の過程を簡
略的に示すもので、（ａ），（ｂ），（ｃ）は発声音声
の包絡線を示し、（ｄ），（ｅ），（ｆ）は単発ノイズ
の包絡線を示す。図６におけるしきい値レベルとは、音
声か、定常雑音かを判断するために設けられたもので、
図１のコンパレータ１１の基準レベルＲＥＦに相当する
。つまり、しきい値レベル（基準レベル）ＲＥＦを越え
た信号がコンパレータ１１に入力されたときに、コンパ
レータ１１は「１」を出力する。これを受けたラッチ回
路１２は両コンパレータ１１−１，１１−２の出力が「
１」の時のみ、ＣＰＵ７に信号「１」を送る（それ以外
の時の出力は０である）。一度、信号が「１」になった
ら、ラッチ回路１２の出力は「１」に固定され、ＣＰＵ
７からのリセット（ラッチ回路１２の出力を「０」とす
る。）のコントロール信号がないかぎり、そのままであ
る。

【００１３】（ｃ）または（ｆ）のような信号がコンパ
レータに入力されてきた時のコンパレータの出力は、（
ａ）→（ｂ）→（ｃ）または（ｄ）→（ｅ）→（ｆ）の
ようになる。発声音声の時には、信号がしきい値レベル
を越える時間が０．８［ｓ］以上あるために、両コンパ
レータの出力が（ｂ）の時点で「１」になるが、単発ノ
イズのときには、そのようなことはあり得ない。信号が
通り過ぎた後のラッチ回路１２の出力は、発声音声の時
には「１」、単発ノイズの時には「０」となる。

【００１４】これにより、しきい値レベルを越えて入っ
てきた信号が発声音声であったか、単発ノイズであった
かが、ＣＰＵ７で判定できる。また、ユーザが単発判定
スイッチ１３をオフにすることにより、単発の判定はで
きないが、ユーザは単音による音声の登録、認識が可能
となる。

【００１５】

【発明の効果】以上述べたように、本発明によれば、音
声認識装置において単発ノイズであるか否かを判断する
ことができ、認識率の向上が計れる。

【図面の簡単な説明】

【図１】本発明による音声認識装置の一実施例のシステ
ム構成図である。

【図２】本発明のＣＰＵのメインルーチンのフローチャ
ートである。

【図３】登録動作のフローチャートである。

【図４】音声認識動作のフローチャートである。

【図５】単発ノイズの判定を示す説明図である。

【図６】単発ノイズの判定過程を示す説明図である。

【図７】従来の音声認識装置のシステム構成図である。

【符号の説明】

１　　マイクロホン５　　音声認識部７　　ＣＰＵ８　　モード選択スイッチ１０　　遅延回路１１　　コンパレータ１２　　ラッチ回路１３　　単発判定スイッチ

Claims

【特許請求の範囲】

【請求項１】　　マイクロホンから取り込まれた発声音
に対応する音情報を登録時および認識時の音データに変
換し、音声認識部により両音データを比較して該比較結
果に基づいて音声認識を行う音声認識装置において、前
記音情報を入力し、該音情報の所定の低周波領域での包
絡線成分を抽出し、包絡線抽出信号を出力する抽出手段
と、該包絡線抽出信号を所定時間遅延して遅延信号を出
力する遅延手段と、前記包絡線抽出信号および前記遅延
信号の各振幅レベルと予め定められた所定の基準レベル
とを比較して該振幅レベルが基準レベルを越えたか否か
を判定し、判定信号を出力する比較手段と、該判定信号
を入力し、前記両振幅レベルが略同時に前記基準レベル
を越えた場合のみ前記音情報を発声音と判断し、前記以
外の越えない場合に前記音情報を単発ノイズと判断し、
発声音と判断したときのみ音声認識結果を出力するよう
に前記音声認識部を動作制御する認識制御手段とを有す
ることを特徴とする音声認識装置。