JPH02201400A

JPH02201400A - 音声認識辞書管理装置

Info

Publication number: JPH02201400A
Application number: JP1020490A
Authority: JP
Inventors: Harutake Yasuda; 安田　晴剛
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1989-01-30
Filing date: 1989-01-30
Publication date: 1990-08-09
Anticipated expiration: 2015-06-26
Also published as: JP3056745B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】挟亙分見本発明は、音声認識装置の辞書管理方式に関する。

胱」θ１欧音声認識において、例えば登録の際に音声と同時に周囲
ノイズなどが入った場合、その辞書は本来の辞書とは異
なる辞書となり、当然、認識させようとしても誤認識す
るか、認識してもその確度は低い、又、数回発声し平均
化するような辞書においては、−度の発声が異なるよう
な場合も同様の結果となる。

更に、そのような辞書は、比較的特徴のない辞書になっ
ているため、逆に認識時他の単語を発声した時、その辞
書単語が、第何位かの下位に入ってくる可能性が高くな
り、結果を阻害する場合が生ずる。

且−一旗本発明は、上述のごとき実情に鑑みてなされたもので、
音声認識装置の登録された辞書の不良を発見し、それを
その辞書内から削除し、他に与える影響を無くすととも
に、いち早くユーザにそれを促し、再登録して辞書の品
質を保持するように構成した音声認識辞書管理方式を提
供することを目的としてなされたものである。

構成本発明は、上記目的を達成するために、マイクから入力
された音声を補正して分析する補正・分析手段と、この
分析結果から特徴量を抽出する抽出手段と、その特徴量
を音声テンプレートとしてメモリして登録する登録手段
と、更に未知入力の特徴パターンと前記テンプレートを
比較して類似度を算出する算出手段とを有する音声認識
装置において、構成されている複数のテンプレートの各
々のテンプレートの評価演算を行い、その評価値がある
レベル以下の場合にその単語辞書を抹消する事、更に、
上記評価値演算に特徴量を有する部分と有しない部分の
差又は比により評価値を決定する事、更に、上記評価値
に基いて、その辞書の品質をユーザに知らせる事を特徴
としたものである。

一般に音声認識装置においては、多数の辞書が装置内に
おり、未知入力に対して、辞書と照合演算を行い、最も
類似性の大きい辞書を候補として抽出する。

本発明では、装置内に有する辞書をある評価値を用いて
評価し、その良否を判定し、悪いもの又は悪影響を与え
るものを消去するようにしたものである。以下、本発明
の実施例に基づいて説明する。

第１図は、本発明による音声認識辞書管理方式の一例を
説明するための構成図で、図中、１はマイク、２は特徴
抽出部、３は登録部、４は認識部、５は結果出力部、６
は評価部、７１〜７ｎは辞書である。マイク１から入力
された音声は、特徴抽出部２において、その特徴量が抽
出され、登録部３において辞書パターンが生成され辞書
メモリに登録される。この辞書メモリ内の辞書は登録時
以外、つまり認識時に更新されたり、頁登録されたりす
る。辞書評価部６はある任意のタイミングで７゜〜７ｎ
の各辞書１〜ｎを検査し不良のものは消去する。

この評価部６を例えばＢＴＳＰ方式（ＢｉｎａｒｙＴｉ
ｍｅ　Ｓｐｅｃｔｒｕｍ　Ｐａｔｔｅｒｎ）を用いて説
明する。ＢＴＳＰ方式においては、Ｊ　Ｏｌ　と′１′
の２値パターンでその音声の特徴量を表現しており、そ
の２値パターンを例えば特定話者認識の場合、３回の発
声パターンを荷重平均化して用いる。

第２図は、ＢＴＳＰ方式による辞書の例を示す図で、（
ａ）図は入カバターン例（分解能２）、（ｂ）図は特定
話者方式の標準パターン例（分解能４）を示し、図示の
ように、３回とも存在する場所は１３′に、−度も１１
′が存在しないものは′０′になっている。又、例えば
、既に存在している辞書に更新する場合、誤った更新を
した場合や、登録した時と極端に違った発声を行った場
合、この辞書が悪化し、よりブロードになり０と１．２
．３のバランスが変化し、例えば、第３図に示すように
（ａ）と（ｂ）の２回の発声を合わせた場合、（Ｃ）の
ように変化する。従って、このｔ　Ｏｔの総数と′１″
　１２１％３＋の部分の総数を比較することによりその
目安とすることができる。下記の式（１）において、ｔ
　Ｏｌの部分の総数ΣＫＯとそれ以外の部分の総数Σ（
ＫＩＵＫ２ＵＫ３）との比が閾値ＴＨを下まわる時、辞
書が悪化したものとして辞書を自動的に消去する。

又、消去する荊にユーザにその情報を示し指示を受ける
方法も考えられる。

以上の説明から明らかなように、本発明によると、辞書
内に存在する不良辞書、特に、誤った更新などによりユ
ーザの知らない内に悪化した辞書を自動的に発見し、消
去もしくはそれに準じた動作を行うことにより、誤認識
を防ぐことを可能となった。

【図面の簡単な説明】

第１図は、本発明による音声認識辞書管理方式を説明す
るための構成図、第２図は、音声の特徴量を表わす図で
、（ａ）図は入カバターンの例。（ｂ）図は特定話者方式の標準パターンの例を示す図、
第３図は、発声パターンと合成パターンの例を示す図で
ある。１・・・マイク、２・・・特徴抽出部、３・・・登録部
、４・・・認識部、５・・・結果出力部、６・・・評価
部、７□〜７ｎ・・・辞書。特許出願人　　株式会社　リコー

Claims

【特許請求の範囲】１、マイクから入力された音声を補正して分析する補正
・分析手段と、この分析結果から特徴量を抽出する抽出
手段と、その特徴量を音声テンプレートとしてメモリし
て登録する登録手段と、更に未知入力の特徴パターンと
前記テンプレートを比較して類似度を算出する算出手段
とを有する音声認識装置において、構成されている複数
のテンプレートの各々のテンプレートの評価演算を行い
、その評価値があるレベル以下の場合にその単語辞書を
抹消する事を特徴とする音声認識辞書管理方式。２、上記評価値演算に特徴量を有する部分と有しない部
分の差又は比により評価値を決定する事を特徴とする請
求項１記載の音声認識辞書管理方式。３、上記評価値に基いて、その辞書の品質をユーザに知
らせる事を特徴とする請求項１記載の音声認識辞書管理
方式。