JPH02198499A

JPH02198499A - 音声認識装置の辞書の自動更新システム

Info

Publication number: JPH02198499A
Application number: JP1018523A
Authority: JP
Inventors: Harutake Yasuda; 安田　晴剛
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1989-01-27
Filing date: 1989-01-27
Publication date: 1990-08-06

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】仮豊圀互本発明は、音声認識装置の辞書の自動更新システムに関
する。

嶽米扱権従来の音声認識システムの更新法は、更新のために入力
された入力パターンでユーザーの指定した標準パターン
を更新するか、又は、認識結果に基いて、その第一位の
結果がユーザーが正しいと判断したものについてのみそ
の未知入力パターンでその標準パターンを更新していた
。

従って、自動的に更新を行うために、ユーザの決定を仰
がなければならず面倒であった。

又、更新を、次の発声入力があった場合に更新可とみな
して、その入力後に前回の入力パターンを用いて、前回
の第一位の標準パターンを更新していた。しかしながら
、発声後に周囲ノイズが入った場合などに、誤りである
にもかかわらず更新してしまう様なことがあり、ユーザ
は絶えず注意を払う必要があり面倒であった。

この様に、従来技術においては誤認識により標準パター
ンを悪化させることがあり、また、それを防ぐためにユ
ーザを介する必要があり辞書のメンテナンスに労力を要
していた。

目　　　　　的本発明は、上述のごとき実情に鑑みてなされたもので、
音声認識装置の標準テンプレート群の自動更新を行うこ
とにより、より効率的にその標準テンプレート群を、現
在の音質に近づけ、認識率の降下をおさえることのでき
る音声認識装置の辞書の自動更新システムを提供するこ
とを目的としてなされたものである。

構　　　成本発明は、上記目的を達成するために、入力された音声
を増幅し、補正を行う前段部と、その音声信号から特徴
量を抽出する特徴抽出部と、その特徴データを用いて音
声の始端、終端を決定する音声区間検出部と、その様に
して得られた特徴データから標準パターンを生成する標
準パターン生成部と、未知入力に対して照合演算を行う
認識演算部と、その認識結果に基く＃Ａ＄パターンと入
力パターンとを用いて更新する更新演算部とを有する音
声認識装置の辞書の自動更新システムにおいて、認識結
果の第一位と第二位の類似度の比が第一の閾値以上で、
第一位の類似度が第二の閾値以上の時に限って標準パタ
ーンを更新すること、更に、更新した場合の認識結果に
対する過去の類似度の平均値を求め、その平均値以上の
認識結果の場合のみ更新すること、更に、条件を満たす
場合に更新した場合の類似度を求め、その類似度が認識
結果で得られた類似度のある定数倍より低い場合は更新
しないこと、更に、更新しようとする標準パターンと未
知入力パターンの無音区間数の差がＱ個以上ある場合に
更新しないこと、更には、更新しようとする標準パター
ンと未知入力パターンのフレーム長がある閾値以上差が
ある場合に更新しないことを特徴としたものである。以
下、本発明の実施例に基づいて説明する。

本来、更新演算を行う機会は、その認識のために発声さ
れたデータを用いて、その認識結果を何らかの手段で、
正しいかどうかを判断して、その結果の標準パターンに
対して、更新演算を行う。

第２図は、」−記の更新演算の概念を説明するための図
で、図中、１は認識部、２は更新判定部、３は更新演算
部、４は入力バッファ、５は標準パターン生成部である
。この場合、もっとも問題となるのは更新判定で、認識
装置からの結果の正確さをどのように知るかである。

第１図は、本発明による自動更新システムのブロック図
で、図中、６は前処理部、７は特徴抽出部、８は登録部
を示し、その他第２図の場合と同様の作用をする部分１
〜４には第２図の場合と同一の参照番号を付しである。

入力された音声は前処理部６で増幅、補正され、特徴抽
出部７において、例えばケプストラムやパワースペク１
〜ルなどの認識に必要な特徴量を得、入力パターンとし
て認識部１へ送られる。

認識部１は未知入力パターンと標準パターンとで照合演
算を行い、最も高い類似性を示すものを結果として出力
し、その結果について、更新判定部２で更新を行うか否
かを判断し、更新を行う場合は、入力バッファ４のデー
タで該当する標準パターンを更新する。更新を行わない
場合は何もせ６一す結果を出力する。

次に、本発明の主旨である更新判定法について説明する
。まず、出力された結果の第一位と第三位の比が閾値Ｔ
１以下の場合、つまり第一位と第三位の類似度が接近し
ている場合か、第一位の類似度が閾値Ｔ２より低い場合
、この結果の信頼性は低いと判断されるため更新は行わ
ない。

又、この類似度を各標準パターンに対して過去の類似度
を平均して行き、得られた類似度がその平均値に対して
、所定％以下の値の場合更新は行わない。

又、実際にパターンを更新して再びその入力と類似度を
求めると、その類似度は当然大きくなるはずであるが、
線型伸縮による照合や、数回の発声による加算で辞書を
作成するシステムにおいては、時として、かえって類似
度が小さくなる場合がある。従って、このような場合は
更新しない。

欣に、更新しようとする標準パターンの有する無音区間
数と入力パターンの無音区間数が所定（Ｑ）個以上の差
がある場合は更新しない。

更に同様に、両者のフレーム長がある閾値以上ある場合
も更新しない。この様に信頼性の高い場合のみ未知入力
パターンで標準パターンを更新することにより、誤認識
による更新の悪影響を極力小さくすることが可能である
。

効　　　果以上の説明から明らかなように、本発明によると、認識
結果を考慮して更新を行うようにしたので、より効率的
に正確に自動更新が可能となり、音声辞書のメンテナン
スが可能になった。

【図面の簡単な説明】

第１図は、本発明による自動辞書更新システムのブロッ
ク図、第２図は、更新演算の概念図である。１・・・認識部、２・・更新判定部、３・・・更新演算
部、４・・・入力バッファ、５・・・標準パターン生成
部、６・・・前処理部、７・・特徴抽出部、８・・・登
録部。特許出願人　　株式会社　リコー

Claims

【特許請求の範囲】１、入力された音声を増幅し、補正を行う前段部と、そ
の音声信号から特徴量を抽出する特徴抽出部と、その特
徴データを用いて音声の始端、終端を決定する音声区間
検出部と、その様にして得られた特徴データから標準パ
ターンを生成する標準パターン生成部と、未知入力に対
して照合演算を行う認識演算部と、その認識結果に基く
標準パターンと入力パターンとを用いて更新する更新演
算部とを有する音声認識装置の辞書の自動更新システム
において、認識結果の第一位と第二位の類似度の比が第
一の閾値以上で、第一位の類似度が第二の閾値以上の時
に限って標準パターンを更新することを特徴とする音声
認識装置の辞書の自動更新システム。２、更新した場合の認識結果に対する過去の類似度の平
均値を求め、その平均値以上の認識結果の場合のみ更新
することを特徴とする請求項１記載の音声認識装置の辞
書の自動更新システム。３、条件を満たす場合に更新した場合の類似度を求め、
その類似度が認識結果で得られた類似度のある定数倍よ
り低い場合は更新しないことを特徴とする請求項１又は
請求項２記載の音声認識装置の辞書の自動更新システム
。４、更新しようとする標準パターンと未知入力パターン
の無音区間数の差がｌ個以上ある場合に、更新しないこ
とを特徴とする請求項第１項乃至第３項のいずれか１項
に記載の音声認識装置の辞書の自動更新システム。５、更新しようとする標準パターンと未知入力パターン
のフレーム長がある閾値以上差がある場合に更新しない
ことを特徴とする請求項第１項乃至第３項のいずれか１
項に記載の音声認識装置の辞書の自動更新システム。