JPH05249990A

JPH05249990A - パターンマッチング方法およびパターン認識装置

Info

Publication number: JPH05249990A
Application number: JP4082831A
Authority: JP
Inventors: Masao Watari; 雅男渡; Miyuki Tanaka; 幸田中; Yasuhiko Kato; 靖彦加藤
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1992-03-04
Filing date: 1992-03-04
Publication date: 1993-09-28
Also published as: DE69329354T2; EP0559415A2; EP0559415A3; US5561722A; EP0559415B1; DE69329354D1

Abstract

(57)【要約】【目的】認識率を向上させるとともに、装置を安価に
製作する。【構成】距離計算部１において、例えば画像信号や音
声信号より作成された入力パターンと、あらかじめ標準
パターン格納部２に格納された標準パターン（テンプレ
ート）との距離が計算される。パターン選択部３におい
て、距離計算部１で現在入力パターンとの距離が計算さ
れている標準パターンに対応する、距離尺度を補正する
重み係数を、重み係数格納部５より読み出す制御が行わ
れ、重み補正部４に供給される。重み補正部４におい
て、距離計算部１より供給される入力パターンと標準パ
ターンとの距離に、重み係数格納部５より供給された重
み係数が乗じられ、距離判定部６に出力される。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、例えば音声や画像を認
識する場合に用いて好適なパターンマッチング方法、並
びにパターン認識装置に関する。

【０００２】

【従来の技術】例えば音声認識装置においては、入力さ
れた音声（入力パターン）が属する単語（標準パター
ン）のカテゴリを識別することにより、音声を認識する
ようになっている。

【０００３】ところで、同じ単語を同じ話者が発声して
も、その単語のパターンがまったく同一になるとは限ら
ず、従って単語のカテゴリは、識別空間に少なからず拡
がった領域を有する。このように、識別空間に拡がった
カテゴリを識別する方法として、例えば一つの単語に対
して標準パターンを複数用意するマルチテンプレート方
式などがある。

【０００４】従来のマルチテンプレート方式において
は、入力パターンとテンプレート（標準パターン）との
距離が、すべて同じ距離尺度で計算され、その距離を最
小にするテンプレート（標準パターン）が認識結果とさ
れる。このように、すべてのテンプレートに対し、同じ
距離尺度を用いてパターンの認識を行うことは、パラメ
ータ平面（空間）において、入力パターンとしての点
が、テンプレート（標準パターン）である点を中心とし
た同一半径の円（球）に含まれるか、または接するか否
かを判定することであり、従って、識別平面（空間）に
おいて、例えば図７に示すような単語のカテゴリを同一
半径の円（球）で、それぞれ過不足なく囲むことが認識
性能を向上させることになる。

【０００５】

【発明が解決しようとする課題】図８は、図７に示す単
語Ａまたは単語Ｂのカテゴリを３または６の同一半径の
円で、それぞれ囲んだ図である。即ち、図８は、単語Ａ
に対して３つのテンプレート（３つの円の中心に対応す
る）、単語Ｂに対して６つのテンプレート（６つの円の
中心に対応する）を用意したことを示す図である。単語
Ａを囲む３つの円は、そのカテゴリをすべて網羅してい
るが、その外側にまでおよんでおり、図中単語Ａを囲む
最上部の円においては、単語Ｂのカテゴリを含んでしま
っている。

【０００６】従って、従来の装置では、例えば単語Ｂを
単語Ａと認識してしまい、他の単語に対する棄却能力が
劣化するとともに、認識率が劣化する課題があった。

【０００７】そこで、図９に示すように、図８と比べて
小さな半径の円で単語ＡおよびＢのカテゴリを網羅する
ように囲むことにより、即ち単語ＡおよびＢに対して充
分な数のテンプレートを用意することにより、音声の認
識率の劣化を防止する方法がある。しかしながら、この
方法においては、多数のテンプレートを記憶するために
多くのメモリが必要になり、装置の製作コストが高価に
なるだけでなく、入力パターンと標準パターン（テンプ
レート）との距離を計算するときの演算量が増加し、認
識結果を出力するのに時間がかかる課題があった。

【０００８】本発明は、このような状況に鑑みてなされ
たものであり、認識率を向上させるだけでなく、装置を
安価に製作することができるようにするものである。

【０００９】

【課題を解決するための手段】請求項１に記載のパター
ンマッチング方法は、入力パターンと標準パターンとの
距離により入力パターンを認識するパターンマッチング
方法において、標準パターンごとに用意した距離尺度を
補正する重み係数を距離に乗ずることを特徴とする。

【００１０】請求項２に記載のパターン認識装置は、入
力パターンを作成する入力パターン作成手段としての音
響分析部１２またはＮＡＴ処理部１４と、標準パターン
とともに、標準パターンごとに用意された距離尺度を補
正する重み係数を記憶する記憶手段としての標準パター
ン格納部１６と、標準パターン格納部１６に記憶された
標準パターンと、音響分析部１２またはＮＡＴ処理部１
４により作成された入力パターンとの距離を計算する距
離計算手段としての距離計算部１５と、距離計算部１５
により計算された距離により入力パターンを認識する認
識手段としての距離判定部１７とを備え、距離計算部１
５は、入力パターンとの距離を計算する標準パターンに
対応して、標準パターン格納部１６に記憶された重み係
数を距離に乗ずることを特徴とする。

【００１１】

【作用】請求項１に記載のパターンマッチング方法にお
いては、標準パターンごとに用意した距離尺度を補正す
る重み係数を、入力パターンと標準パターンとの距離に
乗ずるようにしたので、標準パターンのカテゴリの形状
に対応した距離を求めることができ、入力パターンの認
識率を向上させることができる。

【００１２】請求項２に記載のパターン認識装置におい
ては、標準パターンとともに、標準パターンごとに用意
された距離尺度を補正する重み係数が標準パターン格納
部１６に記憶され、記憶された標準パターンと、音響分
析部１２またはＮＡＴ処理部１４により作成された入力
パターンとの距離が計算される。そして、入力パターン
との距離を計算する標準パターンに対応して、標準パタ
ーン格納部１６に記憶された重み係数が距離に乗ざれ
る。従って、標準パターンをマルチテンプレート化する
場合、テンプレートの数を少なくすることができ、さら
に入力パターンの認識率を向上させることができる。

【００１３】

【実施例】図１は、本発明のパターンマッチング方法を
応用したパターン認識装置の一実施例の構成を示すブロ
ック図である。距離計算部１は、例えば画像信号や音声
信号より作成された入力パターンと、あらかじめ標準パ
ターン格納部２に格納された標準パターン（テンプレー
ト）との距離（例えばユークリッド距離など）を計算す
る。標準パターン格納部２は、画像信号や音声信号より
あらかじめ作成された標準パターンを記憶している。重
み係数格納部５は、標準パターン格納部２に記憶された
標準パターンごとに、あらかじめ用意された距離尺度を
補正する重み係数を記憶している。

【００１４】ここで、図２は、識別平面におけるカテゴ
リＡまたはＢを、過不足ないようにそれぞれ円で囲んだ
図である。識別平面における各円は、その中心、即ちテ
ンプレート（標準パターン）からの等距離面を表す。従
って、半径の大きい円のテンプレート（標準パターン）
については、相対的に（半径の小さい円のテンプレート
の重み係数に比べて）小さな値の重み係数が重み係数格
納部５に記憶されており、半径の小さい円のテンプレー
ト（標準パターン）については、相対的に（半径の大き
な円のテンプレートの重み係数に比べて）大きな値の重
み係数が重み係数格納部５に記憶されている。

【００１５】パターン選択部３は、標準パターン格納部
２に記憶された標準パターンを距離計算部１に供給する
制御を行うとともに、重み係数格納部５に記憶された重
み係数を重み補正部４に供給する制御を行う。重み補正
部４は、距離計算部１より供給される入力パターンと標
準パターンとの距離に、重み係数格納部５に記憶された
重み係数を乗ずる。距離判定部６は、重み補正部４より
供給される、重み係数が乗じられた距離、即ち補正され
た入力パターンと標準パターンとの距離の中から最小の
ものを検出し、検出した入力パターンとの距離を最小に
する標準パターンを認識結果として出力する。

【００１６】次に、重み係数格納部５への重み係数の登
録について説明する。あらかじめ標準パターン（テンプ
レート）が標準パターン格納部２に登録されている場
合、認識しようとするカテゴリからはみ出す円（例え
ば、図８における単語Ａのカテゴリの上部を囲む２つの
円）の中心に対応する標準パターンにおいては、相対的
に（単語のカテゴリを網羅することができない円の中心
に対応する標準パターンの重み係数に比べ）大きい重み
係数を重み係数格納部５に登録し、認識しようとするカ
テゴリを網羅することができない円の中心に対応する標
準パターンにおいては、相対的に（単語のカテゴリから
はみ出す円の中心に対応する標準パターンの重み係数に
比べ）小さい重み係数を重み係数格納部５に登録する。

【００１７】また、新規に標準パターンを標準パターン
格納部２に登録する場合、新規に登録する標準パターン
を中心とする円が、その標準パターンに対応するカテゴ
リを過不足なく網羅するように重み係数を決定し、重み
係数格納部５に登録する。

【００１８】次に、その動作について説明する。距離計
算部１において、例えば画像信号や音声信号より作成さ
れた入力パターンと、あらかじめ標準パターン格納部２
に格納された標準パターン（テンプレート）との距離
（ユークリッド距離）が計算される。パターン選択部３
において、距離計算部１で現在入力パターンとの距離が
計算されている標準パターンに対応する、距離尺度を補
正する重み係数を、重み係数格納部５より読み出す制御
が行われ、重み補正部４に供給される。重み補正部４に
おいて、距離計算部１より供給される入力パターンと標
準パターンとの距離に、重み係数格納部５より供給され
た重み係数が乗じられ、距離判定部６に出力される。

【００１９】なお、標準パターン格納部２に記憶された
すべての標準パターンに対して、以上の処理が行われ
る。

【００２０】距離判定部６において、重み補正部４より
出力された、重み係数が乗じられた距離、即ち補正され
た入力パターンと標準パターンとの距離の中から最小の
ものが検出され、検出された入力パターンとの距離を最
小にする標準パターンが認識結果として出力される。

【００２１】以上のように、標準パターンごとに用意し
た距離尺度を補正する重み係数を、入力パターンと標準
パターンとの距離に乗ずるようにしたので、標準パター
ンのカテゴリの形状に対応した距離を求めることがで
き、入力パターンの認識率を向上させることができる。

【００２２】さらに、図３は、本発明のパターン認識装
置を応用した音声認識装置の一実施例の構成を示すブロ
ック図である。マイク１１は入力された音声を電気信号
である音声信号に変換し、音響分析部１２に供給する。
音響分析部１２は、マイク１１より供給された音声信号
に音響分析処理を施し、音声信号のパワーおよびゼロク
ロス数を抽出して音声区間検出部１３に供給するととも
に、例えば所定の周波数帯域ごとのスペクトル特性（パ
ワー）を特徴パラメータとして抽出してＮＡＴ処理部１
４に供給する（このときの周波数帯域数が特徴パラメー
タの次元数になる）。音声区間検出部１３は、音響分析
部１２より供給される音声信号のパワーまたはゼロクロ
ス数から、マイク１１より出力された音声信号の音声区
間、即ち音声信号の始点フレームと終点フレームを検出
し、ＮＡＴ処理部１４に供給する。

【００２３】ＮＡＴ（ＮｏｒｍａｌｉｚａｔｉｏｎＡ
ｌｏｎｇＴｒａｊｅｃｔｏｒｙ）処理部１４は、例え
ば特開昭６０−２４９１９８などに記載されているＮＡ
Ｔ処理を行う。ＮＡＴ処理部１４は、図４に示すよう
に、軌跡長算出器１４ａ、補間間隔算出器１４ｂ、およ
び補間点抽出器１４ｃより構成され、音声区間検出部１
３より供給される音声区間において、音響分析部１２よ
り供給される特徴パラメータ系列にＮＡＴ処理を施す。
ＮＡＴ処理部１４の軌跡長算出器１４ａは、音響分析部
１２より供給された特徴パラメータが、そのパラメータ
空間内に描く直線近似による軌跡長ＳＬを算出する。即
ち、軌跡長算出器１４ａは、例えば２つの（２次元の）
特徴パラメータのみを考えた場合、この２つのパラメー
タが、図５に示すような２次元のパラメータ空間（２次
元平面）に描く軌跡長を算出する（特徴パラメータの軌
跡を、図中・印で示す）。

【００２４】補間間隔算出器１４ｂは、パラメータ空間
内に描かれた特徴パラメータの軌跡を再サンプリングす
るための間隔（再サンプリング間隔）Ｔを、あらかじめ
設定されたサンプリング点数Ｋ、および軌跡長算出器１
４ａにより算出された軌跡長ＳＬから、次式にしたがっ
て算出し、補間点抽出器１４ｃに供給する。Ｔ＝ＳＬ／（Ｋ−１）（１）

【００２５】補間点抽出器１４ｃは、音響分析部２より
供給された特徴パラメータがパラメータ空間内に描く軌
跡を直線近似した軌跡に沿って、図５に○印で示すよう
に、補間間隔算出器１４ｂにより算出された再サンプリ
ング間隔Ｔで、特徴パラメータの軌跡を再サンプリング
し、入力パターンとしての新たな特徴パラメータ系列ｑ
（ｊ，ｋ）（ｊ＝１，２，・・・，Ｊ：Ｊは特徴パラメ
ータの次元数）（ｋ＝１，２，・・・，Ｋ：Ｋ＝ＳＬ／
Ｔ＋１）を算出し、距離計算部１５に供給する。

【００２６】標準パターン格納部１６は、後述する方法
で作成された、標準パターンｐ_i（ｊ，ｋ）（ｉ＝１，
２，・・・，Ｉ：Ｉは標準パターン数）および標準パタ
ーンｐ_i（ｊ，ｋ）ごとの重み係数ｗ_iを記憶する。距離
計算部１５は、ＮＡＴ処理部１４より供給される入力パ
ターンｑ（ｊ，ｋ）と標準パターン格納部１６に記憶さ
れた標準パターンｐ_i（ｊ，ｋ）との距離Ｄ_iを、次式に
したがって計算する。

【数１】

【００２７】なお、距離計算部１５は、標準パターン格
納部１６に記憶されたすべての標準パターンｐ₁（ｊ，
ｋ）乃至ｐ_I（ｊ，ｋ）に対して、入力パターンｑ
（ｊ，ｋ）との距離を計算する。

【００２８】距離判定部１７は、距離計算部１５により
計算された、入力パターンｑ（ｊ，ｋ）とすべての標準
パターンｐ₁（ｊ，ｋ）乃至ｐ_I（ｊ，ｋ）の距離Ｄ₁乃
至Ｄ_Iの中から、最小の距離Ｄ_i(MIN)を検出し、距離Ｄ
_i(MIN)が、所定の基準値Ｒ_THより大きいか否かを判定す
る。そして、距離判定部１７は、距離Ｄ_i(MIN)が、所定
の基準値Ｒ_THより大きいと判定した場合（Ｄ_i(MIN)＞Ｒ
_TH）、入力パターンｑ（ｊ，ｋ）を認識することができ
なかったとして、何も出力しない（入力パターンｑ
（ｊ，ｋ）をリジェクト（棄却）する）。

【００２９】ここで、所定の基準値Ｒ_THを、以下リジェ
クト閾値と呼ぶ。

【００３０】また、距離判定部１７は、距離Ｄ
_i(MIN)が、リジェクト閾値Ｒ_TH以下であると判定した場
合（Ｄ_i(MIN)≦Ｒ_TH）、入力パターンｑ（ｊ，ｋ）を認
識した結果として、入力パターンｑ（ｊ，ｋ）との距離
を最小にする標準パターンｐ_i(MIN)（ｊ，ｋ）に対応す
る単語を出力する。

【００３１】次に、標準パターンｐ_i（ｊ，ｋ）および
標準パターンｐ_i（ｊ，ｋ）ごとの重み係数ｗ_iを作成す
るアルゴリズムについて、図６を参照して説明する。図
６に示す処理を行う前に、あらかじめ、後述する入力パ
ターンが作成される場合（音声を認識する場合）と同様
の処理がマイク１１、音響分析部１２、音声区間検出部
１３およびＮＡＴ処理部１４において行われ、標準パタ
ーンが作成される。なお、標準パターン作成用に用意さ
れた、不特定話者により発声された音声データＳ個に対
してこの処理が行われ、Ｓ個の標準パターンＱ_s（１≦
ｓ≦Ｓ）が作成される。

【００３２】さらに、このようにして作成されたＳ個の
標準パターン（以下、候補パターンと呼ぶ）Ｑ_sの中か
ら、標準パターンとして登録する各単語のカテゴリを、
例えば上述したリジェクト閾値Ｒ_THを半径とする円で覆
い尽くすことができる、必要最小限の数の標準パターン
が選択される。このとき、選択された標準パターンの数
が、例えばＩ個であるとする。即ち、選択された最小限
の標準パターンをＰ₁乃至Ｐ_I（Ｐ_i（１≦ｉ≦Ｉ））と
する。

【００３３】そして、図６に示すステップＳ１におい
て、標準パターンをＰ₁乃至Ｐ_Iの各重み係数ｗ₁乃至ｗ_I
に初期値Ｗがセットされるとともに、あらかじめ設定さ
れたステップＳ２乃至Ｓ１２の処理を繰り返す反復回数
Ｃが、変数ｃｎｔにセットされ、ステップＳ２に進む。
ステップＳ２において、候補パターンＱ_sのサフィック
スである変数ｓに１がセットされる。さらに、ステップ
Ｓ２において、後述するステップＳ８で、重み係数ｗ_i
を更新（補正）する場合に１がセットされる変数ｓｗ_i
（１≦ｉ≦Ｉ）に０がセットされる。

【００３４】そして、ステップＳ３に進み、あらかじめ
選択された必要最小限の標準パターンＰ_iのサフィック
スである変数ｉに１がセットされ、ステップＳ４におい
て、候補パターンＱ_sと標準パターンＰ_iとの距離ｄ
_si（ｄ（Ｑ_s，Ｐ_i））が計算され、さらに距離ｄ_siに重
み係数ｗ_iを乗じた距離、即ち重み補正した距離Ｄ
_si（＝ｄ_s _i×ｗ_i）が計算され、ステップＳ５に進む。
ステップＳ５において、変数ｉが標準パターン数Ｉに等
しいか否かが判定される。ステップＳ５において、変数
ｉが標準パターン数Ｉに等しくないと判定された場合、
ステップＳ４に戻り、ステップＳ５において、変数ｉが
標準パターン数Ｉに等しいと判定されるまで、ステップ
Ｓ４，Ｓ５の処理を繰り返す。

【００３５】以上ステップＳ３乃至Ｓ５の処理により、
Ｉ個の各標準パターンＰ₁乃至Ｐ_Iと、候補パターンＱ_s
との組み合わせに関して、重み補正した距離（Ｄ_s1乃至
Ｄ_sIが計算される。

【００３６】ステップＳ５において、変数ｉが標準パタ
ーン数Ｉに等しいと判定された場合、ステップＳ６に進
み、重み補正した距離Ｄ_s1乃至Ｄ_sIの中から、最小の距
離Ｄ_smが検出される。ステップＳ７において、候補パタ
ーンＱ_sとの距離が、ステップＳ６で検出された最小の
距離Ｄ_smになる標準パターンＰ_mのカテゴリ、即ち候補
パターンＱ_sとの距離を最小にする標準パターンＰ_mのカ
テゴリと、候補パターンＱ_sのカテゴリとが、同じカテ
ゴリに属すか否かが判定される。

【００３７】ここで、標準パターンＰ₁乃至Ｐ_Iは、候補
パターンＱ₁乃至Ｑ_Sの中から、標準パターンとして登録
する各単語のカテゴリを、リジェクト閾値Ｒ_THを半径と
する円で覆い尽くすことができる、必要最小限の数のパ
ターンを選択したものである。従って、候補パターンＱ
_sとの距離がステップＳ６で検出された最小の距離Ｄ_s _m
になる標準パターンＰ_mのカテゴリと、候補パターンＱ_s
のカテゴリとは、同じカテゴリに属するはずであり、ス
テップＳ７において、標準パターンＰ_mのカテゴリと、
候補パターンＱ_sのカテゴリとが、同じカテゴリに属さ
ないと判定された場合、即ち、候補パターンＱ_sが標準
パターンＰ_mとして認識されない場合、候補パターンＱ_s
は誤認識されたことになる。

【００３８】よって、ステップＳ７において、標準パタ
ーンＰ_mのカテゴリと、候補パターンＱ_sのカテゴリと
が、同じカテゴリに属さないと判定された場合、ステッ
プＳ８に進み、誤認識された候補パターンＱ_sが標準パ
ターンＰ_mとして認識されるように重み係数ｗ_iを補正す
るために、変数ｓｗ_iに１がセットされ、ステップＳ９
に進む。ステップＳ７において、標準パターンＰ_mのカ
テゴリと、候補パターンＱ_sのカテゴリとが、同じカテ
ゴリに属すると判定された場合、ステップＳ８をスキッ
プして、ステップＳ９に進む。

【００３９】ステップＳ９において、候補パターンＱ_s
のサフィックスである変数ｓが、候補パターン数Ｓに等
しいか否かが判定される。ステップＳ９において、候補
パターンＱ_sのサフィックスである変数ｓが、候補パタ
ーン数Ｓに等しくないと判定された場合、ステップＳ３
に戻り、ステップＳ９において、候補パターンＱ_sのサ
フィックスである変数ｓが、候補パターン数Ｓに等しい
と判定されるまで、ステップＳ３乃至Ｓ９の処理を繰り
返す。

【００４０】ステップＳ９において、候補パターンＱ_s
のサフィックスである変数ｓが、候補パターン数Ｓに等
しいと判定された場合、ステップＳ１０に進み、ステッ
プＳ８で変数ＳＷ_iに１がセットされたｉをサフィック
スとする重み係数ｗ_iが、次式にしたがって更新（補
正）される。ｗ_i＝ｗ_i＋δ （３）但し、δは、Ｗより充分小さな値とする。

【００４１】さらに、ステップＳ９において、重み係数
ｗ_iとともに、ステップＳ７における、標準パターンＰ_m
のカテゴリと、候補パターンＱ_sのカテゴリとが、同じ
カテゴリに属すか否かが判定された結果、即ち候補パタ
ーンＱ_sの認識結果が所定の保存エリアに記憶され、ス
テップＳ１１に進む。ステップＳ１１において、変数ｃ
ｎｔが１だけデクリメントされ、ステップＳ１２に進
み、変数ｃｎｔが０に等しいか否かが判定される。ステ
ップＳ１２において、変数ｃｎｔが０に等しくないと判
定された場合、ステップＳ２に戻り、ステップＳ１２に
おいて、変数ｃｎｔが０に等しいと判定されるまで、ス
テップＳ２乃至Ｓ１２の処理を繰り返す。

【００４２】ステップＳ１２において、変数ｃｎｔが０
に等しいと判定された場合、ステップＳ１３に進み、ス
テップＳ１０で記憶された認識結果が参照され、例えば
最も認識率の高いときの重み係数ｗ₁乃至ｗ_Iが、最終的
な重み係数として決定され、処理を終了する。

【００４３】以上のようにして、例えば図２に示すよう
な、識別平面における単語としてのカテゴリＡまたはＢ
を、過不足ないようにそれぞれ円で囲むことができる重
み係数が決定される。

【００４４】次に、音声を認識する場合の動作について
説明する。マイク１１に入力された音声は、電気信号で
ある音声信号に変換され、音響分析部１２に供給され
る。音響分析部１２において、マイク１１より供給され
た音声信号に音響分析処理が施され、音声信号のパワー
およびゼロクロス数が抽出されて音声区間検出部１３に
供給されるとともに、所定の周波数帯域ごとのスペクト
ル特性（パワー）が特徴パラメータとして抽出されてＮ
ＡＴ処理部１４に供給される。音声区間検出部１３にお
いて、音響分析部１２より供給される音声信号のパワー
またはゼロクロス数から、マイク１１より出力された音
声信号の音声区間、即ち音声信号の始点フレームと終点
フレームが検出され、ＮＡＴ処理部１４に供給される。

【００４５】ＮＡＴ処理部１４では、音声区間検出部１
３より供給される音声区間において、音響分析部１２よ
り供給される特徴パラメータ系列にＮＡＴ処理が施され
る。即ち、ＮＡＴ処理部１４の軌跡長算出器１４ａにお
いて、音響分析部１２より供給された特徴パラメータ
が、そのパラメータ空間内に描く直線近似による軌跡長
ＳＬが算出される。補間間隔算出器１４ｂにおいて、パ
ラメータ空間内に描かれた特徴パラメータの軌跡を再サ
ンプリングするための間隔（再サンプリング間隔）Ｔ
が、あらかじめ設定されたサンプリング点数Ｋ、および
軌跡長算出器１４ａにより算出された軌跡長ＳＬから、
式（１）にしたがって算出され、補間点抽出器１４ｃに
供給される。

【００４６】補間点抽出器１４ｃにおいて、音響分析部
２より供給された特徴パラメータがパラメータ空間内に
描く軌跡を直線近似した軌跡に沿って、図５に○印で示
すように、補間間隔算出器１４ｂにより算出された再サ
ンプリング間隔Ｔで、特徴パラメータの軌跡が再サンプ
リングされ、入力パターンとしての新たな特徴パラメー
タ系列が算出される。

【００４７】距離計算部１５において、ＮＡＴ処理部１
４より供給される入力パターンｑ（ｊ，ｋ）と標準パタ
ーン格納部１６に記憶された標準パターンｐ_i（ｊ，
ｋ）との距離Ｄ_iが、式（２）にしたがい、標準パター
ンｐ_i（ｊ，ｋ）ごとに用意した距離尺度を補正する重
み係数ｗ_iが、入力パターンｑ（ｊ，ｋ）と標準パター
ンｐ_i（ｊ，ｋ）との単純な距離に乗じられて計算され
る。

【００４８】なお、距離計算部１５において、標準パタ
ーン格納部１６に記憶されたすべての標準パターンｐ₁
（ｊ，ｋ）乃至ｐ_I（ｊ，ｋ）に対して、入力パターン
ｑ（ｊ，ｋ）との距離が計算される。

【００４９】距離判定部１７において、距離計算部１５
により計算された、入力パターンｑ（ｊ，ｋ）とすべて
の標準パターンｐ₁（ｊ，ｋ）乃至ｐ_I（ｊ，ｋ）の距離
Ｄ₁乃至Ｄ_Iの中から、最小の距離Ｄ_i(MIN)が検出され、
距離Ｄ_i(MIN)が、リジェクト閾値Ｒ_THより大きいか否か
が判定される。そして、距離判定部１７において、距離
Ｄ_i(MIN)が、リジェクト閾値Ｒ_THより大きいと判定され
た場合（Ｄ_i(MIN)＞Ｒ_TH）、入力パターンｑ（ｊ，ｋ）
を認識することができなかったとして、入力パターンｑ
（ｊ，ｋ）がリジェクト（棄却）される。また、距離判
定部１７において、距離Ｄ_i(MIN)が、リジェクト閾値Ｒ
_TH以下であると判定された場合（Ｄ_i( _MIN)≦Ｒ_TH）、入
力パターンｑ（ｊ，ｋ）を認識した結果として、入力パ
ターンｑ（ｊ，ｋ）との距離を最小にする標準パターン
ｐ_i(MIN)（ｊ，ｋ）に対応する単語が出力される。

【００５０】以上のように、標準パターンごとに用意し
た距離尺度を補正する重み係数を、入力パターンと標準
パターンとの距離に乗じて、標準パターンのカテゴリの
形状に対応した距離を求めるようにしたので、音声の認
識率を向上させることができる。

【００５１】なお、本実施例においては、あらかじめ与
えられたＳ個の候補パターンからＩ個の標準パターンを
選択して、このＩ個の標準パターンの重み係数を、単語
のカテゴリの形状に合うように更新（補正）するように
したが、カテゴリの形状に合わせて標準パターン（テン
プレート）とともに重み係数（例えば図２におけるカテ
ゴリＡまたはＢを覆う円の中心と半径に対応する）を決
定するようにすれば、標準パターン（テンプレート）数
を減らすことができる。

【００５２】

【発明の効果】請求項１に記載のパターンマッチング方
法によれば、標準パターンごとに用意した距離尺度を補
正する重み係数を、入力パターンと標準パターンとの距
離に乗ずるようにしたので、標準パターンのカテゴリの
形状に対応した距離を求めることができ、入力パターン
の認識率を向上させることができる。

【００５３】請求項２に記載のパターン認識装置によれ
ば、標準パターンとともに、標準パターンごとに用意さ
れた距離尺度を補正する重み係数が記憶手段に記憶さ
れ、記憶された標準パターンと、入力パターン作成手段
により作成された入力パターンとの距離が計算される。
そして、入力パターンとの距離を計算する標準パターン
に対応して、記憶手段に記憶された重み係数が距離に乗
ざれる。従って、標準パターンをマルチテンプレート化
する場合、テンプレートの数を少なくすることができ、
さらに入力パターンの認識率を向上させることができ
る。

【図面の簡単な説明】

【図１】本発明のパターンマッチング方法を応用したパ
ターン認識装置の一実施例の構成を示すブロック図であ
る。

【図２】識別平面におけるカテゴリの形状を、過不足な
いように重み係数を補正した標準パターン（テンプレー
ト）で被覆した平面図である。

【図３】本発明のパターン認識装置を応用した音声認識
装置の一実施例の構成を示すブロック図である。

【図４】図３の実施例のＮＡＴ処理部１４のより詳細な
ブロック図である。

【図５】音声の特徴パラメータの軌跡を示す平面図であ
る。

【図６】図３の実施例の標準パターン格納部１６に記憶
される重み係数を作成するアルゴリズムを説明するため
のフローチャートである。

【図７】識別平面における単語のカテゴリの分布を示す
平面図である。

【図８】従来のテンプレート方式における標準パターン
（テンプレート）による単語のカテゴリを被覆した平面
図である。

【図９】従来のテンプレート方式における標準パターン
（テンプレート）による単語のカテゴリを被覆した平面
図である。

【符号の説明】

１距離計算部２標準パターン格納部３パターン選択部４重み補正部５重み係数格納部６距離判定部１１マイク１２音響分析部１３音声区間検出部１４ＮＡＴ処理部１５距離計算部１６標準パターン格納部１７距離判定部

Claims

【特許請求の範囲】

【請求項１】入力パターンと標準パターンとの距離に
より前記入力パターンを認識するパターンマッチング方
法において、前記標準パターンごとに用意した距離尺度を補正する重
み係数を前記距離に乗ずることを特徴とするパターンマ
ッチング方法。
【請求項２】入力パターンを作成する入力パターン作
成手段と、標準パターンとともに、前記標準パターンごとに用意さ
れた距離尺度を補正する重み係数を記憶する記憶手段
と、前記記憶手段に記憶された標準パターンと、前記入力パ
ターン作成手段により作成された入力パターンとの距離
を計算する距離計算手段と、前記距離計算手段により計算された距離により前記入力
パターンを認識する認識手段とを備え、前記距離計算手段は、前記入力パターンとの距離を計算
する前記標準パターンに対応して、前記記憶手段に記憶
された重み係数を前記距離に乗ずることを特徴とするパ
ターン認識装置。