JP2945454B2

JP2945454B2 - パターン識別方法

Info

Publication number: JP2945454B2
Application number: JP2232754A
Authority: JP
Inventors: 光森田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1990-09-03
Filing date: 1990-09-03
Publication date: 1999-09-06
Anticipated expiration: 2014-09-06
Also published as: JPH04112391A

Description

【発明の詳細な説明】「産業上の利用分野」この発明は、文字・画像・音声等の入力パターンから
特徴ベクトルを生成し、その特徴ベクトルを複数のカテ
ゴリーの何れかに同定して入力パターンの認識・識別を
行なうパターン識別方法に関する。

「従来技術」従来のパターン識別方法は、次に定義される距離値d_j
を候補カテゴリーｊ＝１、２、…、ｎに関して求め、距
離値の大小比較でカテゴリーの識別結果を選択する。

ここに、入力パターンから生成される特徴ベクトルの
次元値をx_i（ｉ＝１、２、…、ｍ）、各種候補カテゴリ
ーの次元値をx_ij（ｊ＝１、２、…、ｎ）、そして距離
値を調整する重み値をw_ijと置く。

「発明が解決しようとする課題」この様なパターン識別処理では、距離値を全候補カテ
ゴリーについて求めて識別結果を得た。このため、候補
カテゴリー数ｎまたは特徴次元数ｍが大きくなると処理
量が著しく増大した。カテゴリー数が多くなると一般に
識別精度向上のため特徴次元数が多く必要なので、この
問題はパターン識別における中心的な課題の１つとなっ
ていた。

この対策として、積和演算器やソータなどの専用ハー
ドの利用、処理の並列化、KL展開法等による特徴次元数
の圧縮等をし、上式におけるｍ、ｎの値を相対的に低下
させ計算量を削減していた。しかし、これらは計算処理
量を数分の１に削減する程度で、パターン識別処理の処
理方式を本質的に改良し計算量を大幅に削減する抜本的
な対策ではなかった。

また、従来、元の特徴次元値との関係が明らかでない
新たな特徴次元を精度向上を目的に付加するとき、シミ
ュレーションにより識別精度を検証する必要があり、そ
れに伴い膨大な計算処理量を必要とした。この為、従
来、複数の特徴ベクトルを組み合わせることによる精度
向上は困難であった。

この発明の目的は、入力パターンと各カテゴリー間の
距離算出処理とその距離値を使った候補探索処理とから
なる従来の方法に対し処理量を大幅に削減することがで
き、また、複数の特徴次元を組み合わせて識別精度を向
上させるときに、僅かな変更で対応できるパターン識別
方法を提供することにある。

「課題を解決するための手段」この発明によれば入力パターンから特徴ベクトルを生
成し、この特徴ベクトルから、予め用意されている候補
カテゴリーとして予想されるパターンについての２分木
テーブルを参照することでパターン識別を行う。

この２分木テーブルは、カテゴリー集合の分類効果が
大きい特徴ベクトルの各次元のビットによる場合分けを
探索条件として構成する。例えば、その各次元値の特定
のビットにより各候補カテゴリーからなる集合が２分さ
れる時、一方に分類される割合をαと置くと、分散パラ
メータはＳ＝α（１−α）で定義でき、その分散パラメ
ータの大小比較により探索条件を選択する。

更に、誤った識別結果を得た場合にその結果に至った
同定部を探索部に置き換え、そこから正しいカテゴリー
を示す同定部と、誤ってしまったカテゴリーを示す同定
部との何れかに分岐するように修正し、既存特徴ベクト
ルでは区別できない複数のカテゴリーの探索部がある場
合、新規次元値を特徴ベクトルに付加し、その新規次元
値を条件に持つ探索部を追加し、その探索部の分岐先に
新しい探索部又は同定部を生成するように修正し、探索
条件に合致しないため探索不能となる場合はその探索不
能となった探索部とその直前の探索部との間に新規な探
索部を追加し、その新規な探索部の条件の分岐項目に上
記合致しなかった次元値のビットに用いるように修正
し、既存２分木テーブルの識別能力を強化する。

「作用」この発明では分散パラメータの大小比較により、２分
木テーブルの根元に近い探索部ほど、多くのカテゴリー
も大分類できる特徴ベクトルの次元値のビットが探索条
件として選ばれ、末端の葉に近い探索部ほど、互いに類
似したカテゴリーを区別できるビットが選ばれる。従っ
て、入力パターンが入力されて識別されるまでの探索経
路は他のカテゴリーを区別するのに必要なビットだけが
必要で、全ビットを要しないので計算量が少なくなる。

更にこの発明では、識別に誤りが起きても、分散パラ
メータを用いて選定された条件を有す探索部を２分木テ
ーブルに追加修正できる。これにより、その誤った時の
事例は学習される。

「第１の実施例」以下に請求項１の発明に対応する実施例を示す。

特徴ベクトルこの発明は、文字・画像・音声など入力パターンの形
態、ならびに特徴ベクトルの種類に拘わらず、数値化さ
れていれば適用できる。しかし、説明を簡単化するた
め、実施例では、０〜９の数字を識別する文字認識を対
象とする。また、以下便宜的に特徴ベクトルを定義する
が、その特徴ベクトルに限らずこの発明を適用できる。

入力パターンは検出手段により第１図に示すように縦
11横７のメッシュに２値化されているとし、２分木テー
ブルを生成するための各カテゴリーも同様の入力パター
ンから得られていたとする。なお、第１図に示す入力パ
ターンを生成するのに、線幅を１とするなどの制約を掛
けているが、本質的ではない。

この時、特徴ベクトル（A,B,C,D）は次のように生成
される。横方向の特徴をＡ次元とし、その次元値Ａは横
方向へ画素が２個以上連続する個数で定義する。同様
に、縦方向の特徴をＢ次元、右上斜め方向の特徴をＣ次
元、左上斜め方向の特徴をＤ次元とし、それぞれの次元
値は縦方向、右上斜め方向、左上斜め方向へ２個以上連
続する画素数で定義する。第２図に各特徴次元の算出根
拠となる画素を白抜きで示す。このようにして求めた特
徴ベクトルを第３図に示す。ここで、例えば、“0"の特
徴ベクトルは（10,18,4,4）となる。

特徴ベクトルの次元値分布各次元値を第４図に示すように２進数表現で表示する
と、第３図に示した各特徴次元毎の数値から第５図に示
すカテゴリー分布が得られる。この第５図は例えば次元
値８は、Ａ特徴次元のカテゴリーがなし、Ｂ特徴次元の
カテゴリーが“2"と“8"、Ｃ特徴次元のカテゴリーがな
く、Ｄ特徴次元のカテゴリーが“4"と“5"であることを
示す。ここで、２進数の表現形式は任意であり、下位桁
より1,2,4,8,16の重みとした一般的な表現でも良い。こ
こで、各次元値のビットを表すのに、（特徴次元名）．
（ビット位置）とする。例えば、Ａ特徴次元の最上位ビ
ットはA.1、Ｂ特徴次元の上位から３番目のビットはB.3
と表す。

２分木テーブル第６図に２分木テーブルを示す。ここに、四角で囲ま
れた部分を探索部と呼び、丸で囲まれた部分を同定部と
呼ぶ。探索部の上段はそれまでに分類されたカテゴリー
の集合を示し、下段は次に探索する次元値の条件であり
照合項目と分岐項目とよりなる。例えば、＊３の探索部
はその上段より“0"と“4"のカテゴリー集合であって下
段より、照合項目C.1＝０で、分岐項目がC.2であってC.
1＝０かつC.2＝０なら“0"なるカテゴリーに同定され、
C.1＝０かつC.2＝１なら“4"なるカテゴリーに同定され
る条件を示す。また、＊４の探索部は“1,5,7"のカテゴ
リー集合で、照合項目がA.1＝０で分岐項目がA.2であっ
てA.1＝０かつA.2＝０なら＊６の探索部へ移り、A.1＝
０かつA.2＝１なら“5"なるカテゴリーに同定される。
このように、同定部内の数字は同定されたカテゴリーを
示し、また条件が、A.1＝０などの式で表現され照合す
るための条件となるものを照合項目と呼び、A.2＝？な
どの式で表現されその値で分岐されるものを分岐項目と
呼ぶ。

なお、２分木テーブル中に必ずしもカテゴリー集合の
リスト、つまり各探索部の上段を含める必要は無い。カ
テゴリーの探索では、この２分木テーブルにより、探索
条件とその結果移行すべき探索部または同定部が明らか
ならば十分であるためである。

パターン識別処理過程第７図に示す入力パターン“5"が与えられたときの識
別処理を以下に示す。この例では網点を施した１画素分
だけ元の候補カテゴリーと異なるデータを得たとする。

パターン識別処理は、入力パターンから特徴ベクトル
（15、11、７、８）を生成した後、第６図に示される２
分木テーブルを参照し探索を行なう。第７図の入力パタ
ーンに対応する特徴ベクトル（15、11、７、８）の場合
の探索を以下に示す：・上記木テーブルの根の探索部、つまり＊１探索部によ
り識別探索を開始し、その条件は分岐項目B.1＝？のみ
であり、入力パターンの特徴ベクトルのＢ特徴次元の第
１ビット（第１上位桁）がゼロ、つまりB.1＝０である
から＊２探索部へ移行する。

・＊２探索では照合項目がC.1＝０で分岐項目がC.2＝？
であり、これに対し入力ターンの特徴ベクトルのＣ特徴
次元の第１ビットC.1は０であり、第２ビットC.2は０で
あるから＊４探索部へ移行する。

・＊４探索部では同様にしてA.1＝０かをチェックし、
A.1＝０であり、かつA.2＝１であるから同定部に移行し
てカテゴリー“5"を識別結果とする。

２分木テーブルの生成第５図に示した各カテゴリー毎の特徴ベクトル上の分
布が得られているとき、これから２分木テーブルの生成
処理を以下に示す。

＊１探索部に於ける候補は総てのカテゴリー“012345
6789"であり、これらの総ての候補について、A.1＝０、
C.1＝０、D.1＝０であるが、B.1に関しては、B.1＝０と
なる候補カテゴリー“12356789"と、B.1＝１となる候補
カテゴリー“04"とに分類できる。このようにある特徴
次元値の特定のビット、この例ではB.1により候補カテ
ゴリーの集合が２分される時、一方に分類される割合を
αと置き、分散パラメータＳをＳ＝α（１−α）と定義
したとする。この時、B.1＝０またはB.1＝１により分割
されるカテゴリーの割合から分散パラメータＳは0.2
（１−0.2）＝0.16となる。以上の結果を「特徴次元
名．ビット位置」（０に分類されるカテゴリー、１に分
類されるカテゴリー、分散値×100）なる記号で示す
と、 A.1（0123456789、、０）、B.1（12356789、04、1
6）、C.1（0123456789、、０）、D.1（0123456789、、
０）となる（下線の部分が探索条件として選択された特
徴次元のビットを示す）。なお、各特徴次元のビットは
必ず０または１に分布するので、分散値×100の最大値
は25となる。

ここで求めたA.1,B.1,C.1,D.1の中では、分散値16が
最大となるので、B.1を探索条件（分岐項目として）に
場合わけをし、次に＊２探索部または＊３探索部へ移行
するテーブルを作る。

・＊２探索部に於ける候補は“12356789"となる。この
時、総ての候補がすでにA.1＝０、C.1＝０、D.1＝０に
なることは明らかであるので、次のビットA.2、C.2、D.
2について分散パラメータを出し、またB.1は既に利用済
みであるので、B.2について分散パラメータを計算する
と、 A.2（17、235689、19）、B.2（３、1256789、11）、
C.2（157、23689、23）、D.2（127、35689、23）とな
る。

ここで分散値23が最大であり、これにより最も均等に
分けられるので、C.1＝０を前提に、つまり照合項目と
して、C.2の値で場合分けし、つまりC.2を分岐項目とし
てその結果により次に＊４探索部または＊５探索部へ移
行するテーブルを作る。

・＊３探索部における候補は“04"となる。この時、 A.2（、04、０）、B.2（、04、０）、C.2（０、４、2
5）、D.2（０、４、25）となるからC.1＝０を前提（照
合項目）にし、C.2を分岐項目としその値で場合分け
し、その結果としてカテゴリー０または４を識別するテ
ーブルを作る。

・＊４探索部における候補は“157"となる。この時、C.
2が前の探索部の条件として選定されているのでC.3を選
び、その前段まではA.2、B.2、C.2、は分類に用いられ
ていないからこれらについて分散値を計算すると、 A.2（17、５、22）、B.2（、157、０）、C.3（０、15
7、０）、D.2（17、５、22）となり、A.1＝０を前提に
A.2の値で場合分けするとし、その結果として次に＊６
探索部へ移行するかカテゴリー５を同定するテーブルを
作る。

・＊５探索部における候補は“23689"となる。この時、
A.2（、23689、０）、B.2（３、2689、16）、C.3（８、
2369、16）、D.2（２、3689、16）となり、B.2を分岐項
目として選び、その値でカテゴリー３を同定するか次に
＊７探索部へ移行するテーブルとする。

・＊６探索部における候補は“17"となる。この時、 A.3（１、７、25）、B.2（、17、０）、C.3（、17、
０）、D.2（17、、０）となり、A.3を分岐項目に選び、
その値によりカテゴリー１または７を同定する。

・＊７探索部における候補は“2689"となる。この時、
A.2（、2689、０）、B.3（、2689、０）、C.3（８、26
9、19）、D.2（２、689、19）となり、C.3を分岐項目に
選び、その値によりカテゴリー８を同定するか＊８探索
部へ移行する。

・＊８探索部における候補は“269"となる。この時、 A.3（２、69、22）、B.4（２、69、22）、C.4（69、
２、22）、D.2（２、69、22）となり、C.4を分岐項目と
して場合分けし、その結果＊９探索部へ移行するかカテ
ゴリー２を同定する。

・＊９探索部における候補は“69"となる。この時、各
特徴次元の各ビットに対する分類が A.3 （、69、０）、B.4（、69、０）、 A.4 （、69、０）、B.5（、69、０）、 A.5 （69、、０）、 C.5 （、69、０）、D.2（、69、０）、 D.3（、69、０）、 D.4（、69、０）、 D.5（69、、０）となり、この特徴ベクトルによってはカテゴリーの６と
９とを分離できないことが分かる。

以上の結果、第６図のテーブルが生成される。以上の
実施例は、２分木テーブルの生成例を示すのみでこの発
明のほんの一例を示しているに過ぎない。例えば、＊１
探索部の条件を決定する際、分散値が０となる特徴次元
のビットで分離できないのは明らかなので、分散値が０
でない下位ビットまで分散値を計算し、A.2（17、02345
689、16）、B.1（2356789、04、16）、C.2（0157、2346
89、24）、D.2（0127、345689、24）なる結果を得、分
散値が大きいと言うことで、C.1＝０を前提（照合項
目）にC.2を分岐項目とし、その値で分類する方法があ
る。

「第２の実施例」以下に請求項２の発明に対応する２分木テーブル修正
方法の実施例を示す。

いま、第８図に示される入力パターン（網点の２画素
は元の候補カテゴリー“5"と異なる部分をしめす）を候
補カテゴリー“5"のバリエーションの一つとして識別す
るとする。この時、特徴ベクトルは（15、12、８、８）
となり、B.1＝０、C.1＝０、C.2＝１、B.2＝１、C.3＝
１、C.4＝０となる。このため、第６図に示した２分木
テーブルを使う識別処理によれば、この入力パターンは
＊９探索部で候補カテゴリー“6,9"を識別結果として出
力し、これらと共に識別できなくなる。この様なとき、
以下のように第６図に示した２分木テーブルを改良す
る。

この誤識別結果となった同定部、この例では＊９探索
部を新たな探索部とし、その＊９探索部に至るまでの＊
1,＊2,＊5,＊7,および＊８探索部の条件に現われていな
い特徴次元のビットで、入力カテゴリー５と6,9とを分
離するものについて分散値を計算すると、 A.1 （569、、０）、 B.3（、569、０）、 A.2 （、569、０）、 B.4（、569、０）、A.3 （５、69、22）、B.5（５、69、22）、 C.5 （５、69、22）、D.1（569、、０）、 D.2（、569、０）、 D.3（５、69、０）、 D.4（５、69、22）となり、例えばなるべく上位のビットで場合分けする
基準では、A.1＝０、A.2＝１を前提（照合項目）にA.3
を分岐項目とし、その新たな＊９探索部に続く次の分岐
先として誤ってしまった候補カテゴリー“5"を示す同定
部と、入力パターンの正しい候補カテゴリー“6,9"を示
す同定部（この例では＊10探索部）として、第６図の＊
９探索部を第９図で置き換え、新設の＊９探索部で新規
の候補カテゴリー“5"を分離する。

以上の様に、既存２分木テーブルが許容しないカテゴ
リーで、誤識別されるものについても、２分木テーブル
に若干の修正を加えることで、正しい識別が行なえるよ
うになる。なお、２分木テーブルにおいて、候補カテゴ
リーの名称が同じでありながら、２分木テーブルの葉に
あたる場合が複数存在するとき、それぞれをサブカテゴ
リーと呼ぶ。この発明に於いては、このサブカテゴリー
を沢山導入することで、識別率を向上させる。

「第３の実施例」以下に請求項３の発明に対応する２分木テーブルを修
正する実施例を示す。

いま、第６図の２分木テーブルでは、＊９探索部でカ
テゴリー“6"と“9"を分離する条件が無いので、“6"ま
たは“9"の入力パターンの時は探索を打ちきる。これは
使われている特徴ベクトルで“6"と“9"を区別できない
為である。

そこで、“6"と“9"を、特徴ベクトルに新たな次元値
を加えて分離することを考え、既存２分木テーブルを修
正する。新たな特徴次元値Ｅ及びその次元値として、第
10図に示すものを定義する。つまり、分離不能な候補カ
テゴリー“6"と“9"の各パターンを左右に等分し、左部
分の画素が右部分より多ければＥ＝０とし、その逆なら
Ｅ＝１とする。この新規特徴次元値Ｅ＝０かＥ＝１かに
より分離不能候補カテゴリーを場合分けした時の分散値
を求めると、 E.1（６、９、25）となるから、第６図の＊９探索部
を、第11図に示すように候補カテゴリーの集合を“6"及
び“9"、E.1を分岐項目とし、E.1＝０で“6"を同定し、
E.1＝１で“9"を同定するように置き換える。

以上の様に、既存特徴ベクトルでは分離できない時、
新規特徴次元を導入し、複数のカテゴリーに分離できる
ようにする。

なお、距離値を識別に使う従来法では、既存特徴次元
数ｍに新規特徴次元数を付加する場合は、多くの組み合
わせについて誤識別する場合が生じるか検証する必要が
あった。これに対し、この発明では、２分木テーブルに
おける分離不能となった探索部から下の枝についてのみ
新規特徴次元値の検証をするので、全体に与える影響は
僅かであり検証は必要ないので追加に伴うコストは僅か
である。

この様に、この発明では大分類に効率の良い特徴ベク
トルのビットで先に分離した誤で、詳細分離の精度が高
い特徴ベクトルを用いるなどの組み合わせが可能とな
り、識別率を向上させることができる。

「第４の実施例」以下に請求項４の発明に対応する２分木テーブルから
なる実施例を示す。

いま、候補カテゴリー５に分類される第12図の入力パ
ターン（第１図の候補カテゴリー５との違いを欠落画素
を網点で、付加画素を交差斜線で表示した）を、第６図
の２分木テーブルを用いて識別する場合を考える。この
入力パターンの特徴ベクトルは（16、10、６、８）であ
る。この時、B.1＝０、C.1＝０、C.2＝０ゆえに、＊４
探索部まで移行するが、A.1＝１、つまり照合項目不一
致なので探索不能となる。これは、２分木テーブルが予
めこの場合を想定していなかったため起きている。

そこで、第13図に示すように探索不能となった＊４探
索部とその直前の＊２探索部との間に新規の＊２−４探
索部を挿入し、その条件として一致しなかった次元値の
ビットA.1を分岐項目とするように既存２分木テーブル
を修正する。（ここでは、元の候補カテゴリー“5"とこ
の新たな候補カテゴリー“５＊”が＊２−４探索部の上
段にあるので説明上“５＊”として区別した。なお、
“５＊”なる枝の追加は既に述べた様にサブカテゴリー
という概念による拡張である。）以上のように、この発明を用いれば、探索部間に新規
探索部を挿入することによって探索不能状態を回避でき
る。

請求項１の発明における識別処理動作を一般的に示す
と第14図に示すようになる。つまりまず入力パターンか
ら特徴ベクトルを生成し（S₁）、２分木テーブルの根の
探索部から識別探索を開始し（S₂）、その照合項目と入
力パターンの特徴ベクトルの次元値の特定ビットとを比
較し（S₃）、一致していれば分岐項目に相当する入力パ
ターンの特徴ベクトルの次元値の特定ビットを取り出し
（S₄）、そのビット値による分岐項目の指示に従って次
の探索部又は同定部へ移行する（S₅）。この時移行先が
探索部であるか否かをチェックし（S₆）、探査部である
場合はその探索部に探索条件（分岐項目）があるかをチ
ェックし（S₇）、探索条件があればステップS₃に戻る。
ステップS₃ではその探索条件に照合項目が含まれていな
い時は照合項目との一致がとれたとして処理する。ステ
ップS₃で不一致の時は請求項４の発明による処理に移
る。ステップS₆で移行先が探索部でない場合は移行先の
同定部の示すカテゴリーを識別結果として出力して終了
する（S₈）。ステップS₇で探索条件がない場合は請求項
３の発明による処理に移る。

請求項２の発明による修正処理を第15図に示す。まず
誤った候補カテゴリーを示す同定部を探索部とし
（S₁）、その誤った候補カテゴリーと入力パターンの正
解カテゴリーとを分離できる探索部の条件を選定し
（S₂）、ステップS₁で探索部とした部分の分岐項目をス
テップS₂で選定した条件とし、その分岐項目の０又は１
により、誤った候補カテゴリーと入力パターンの正解カ
テゴリーとのそれぞれを示す同定部を分岐とする
（S₃）。

第16図に請求項３の発明による修正処理を示す。既存
探索部の個数がＮの場合、分離不能な探索部の番号をＮ
＋１に置きかえる（S₁）。後述する２分木生成フローに
おける初期値設定を、ｘ＝N,y＝Ｎ＋１に置きかえて、
カテゴリー集合を新規次元値について探索部の条件を選
定する（S₂）。

第17図に請求項４の発明による修正処理と示す。照合
項目に不一致が生じた探索部とその直前の探索部との間
に新規探索部を挿入する（S₁）。一致した照合項目は新
規探索部の照合項目とし、不一致の照合項目を新規短先
触の分岐項目とし、その新規分岐項目における０又は１
により正解カテゴリーの同定部と不一致が検出された探
索部とを分岐先とする（S₂）、不一致が検出された探索
部の元の照合項目から新規探索部の照合項目と分岐項目
とを除く（S₃）。

２分木テーブルの生成手順を第18図に示す。第５図の
分布に従って第６図のテーブルを生成する場合を例とし
ながら説明する。ステップS₁でｘ＝０、ｙ＝１とする。
ｙは探索部の番号である。ステップS₂でｚ＝ｘ＋1,zl＝
y,x＝ｙとする。従って木テーブルのトリーの１段目の
＊１探索部の探索条件の選定の際にはｚ＝1,zl＝1,x＝
１となる。ｚはトリーの各段における変数でｘ＋１〜zl
で変化し、トリーの各段における探索部の左から順にｚ
の数を増加させる。ステップS₃でｚがzlより大きいかを
チェックし、この場合はｚ＝1,zl＝１であるからステッ
プS₄に移り、分散パラメータによりｚ＝１番目の探索部
の探索条件を選定する。ステップS₅では探索条件が発見
できたら、ステップS₆に移る。ステップS₆では発見した
探索条件の分岐項目で、０の分岐先の候補カテゴリーが
２個以上ならｙ＋１＝２番目の探索部としｙ＝ｙ＋１＝
２とし、候補カテゴリーが１個ならそのカテゴリーの同
定部とし、分岐項目で１の分岐先の候補カテゴリーが２
個以上ならｙ＋１＝３番目の探索部とし、ｙ＝ｙ＋１＝
３とし、ｚ＝ｚ＋１＝２としてステップS₃に戻る。

ここでｚ＝２＞zl＝１であるからステップS₇に移り、
ｘ＝1,y＝３だからｘ＝ｙでなくて、ステップS₂に戻
る。よってｚ＝１＋１＝2,zl＝3,x＝３となり、ｚ＞zl
であるからステップS₄に移り、ｚ＝２、つまり＊２探索
部について探索条件を選定し、探索条件が得られるか
ら、ステップS₆に移り、０の分岐先がｙ＋１＝４の探索
部とされ、かつｙ＝ｙ＋１＝４とされ、かつ１の分岐先
がｙ＋１＝５の探索部とされ、かつｙ＝ｙ＋１＝５とさ
れ、ｚ＝２＋１＝３とされてステップS₃に戻る。zl＝３
であるからステップS₄に移り、ｚ＝３、＊３探索部につ
いて探索条件を選定し、探索条件が発見されるからステ
ップS₆に移る。この時の分岐項目の０の分岐先は候補カ
テゴリーが１個であり、そのカテゴリー“0"の同底部と
し、また１の分岐先はカテゴリー“4"の同定部として、
ｚ＝ｚ＋１＝４とされてステップS₃に戻る。

ｚ＝4,zl＝３だからステップS₇に移り、ｓ＝3,y＝５
だからステップS₂に戻り、ｚ＝３＋１＝4,zl＝5,x＝５
とされる。ｚ＝4,zl＝５だからステップS₄に移り、ｚ＝
4,つまり＊４探索部について探索条件を選定し、探索条
件が発見されるから、ステップS₆に移り、分岐項目の０
の分岐先がｙ＋１＝６の探索部とされ、かつｙ＝ｙ＋１
＝６とされ、１の分岐先がカテゴリー“5"の同定部とさ
れ、ｚ＝ｚ＋１＝５とされ、ステップS₃に戻る。以下同
様に処理される。その時のトリーの各段におけるステッ
プS₂の入力時のx,y（＝zl）の各値と、各段間に検出さ
れた探索部の値ｙを第６図に示す。

ステップS₂の入口でｘ＝8,y＝９となると、ステップS
₂でｚ＝８＋１＝9,zl＝9,x＝９となり、ステップS₄に移
り、ｚ＝9,つまり＊９探索部について探索条件が選定さ
れる。しかし探索条件が発見されないからステップS₈に
移り、＊９探索部で分離不能と表示し、ｚ＝ｚ＋１＝10
としてステップS₃に戻る。ここでｚ＝10,zl＝９である
からステップS₇に移り、ｘ＝9,y＝９であるからテーブ
ル生成処理は終了となる。

ステップS₄での分岐パラメータを比較する順番の選定
方法には、各次元値について、ビット番号を揃えつつ逐
次増加させる方法、各次元値について分散値がゼロより
大となるまでビット番号を増加させる方法など各種あ
る。またステップS₈で更に分離が必要であれば第16図に
示した処理をすればよい。

以上のようにして得られた２分木テーブルは例えば第
19図に示すようにメモリに記憶する。この例は第６図に
示したテーブルについて具体的に示した場合である。第
19図において特徴ベクトルの次元の各ビットは（次元値
の順番）．（ビットの順番）で表現しており、例えば
“2.1"は２番目の特徴次元の１番目のビットを示す。分
散ビット０の表示は、分散パラメータ０が続く集まり
を、（次元値の順番）．（分散パラメータ０の先頭ビッ
ト）（先頭ビットにおける30又は１の値）−（次のビッ
トにおける０又は１の値）−…のように表わす。例えば
“1.20−１−１−0"は１番目の次元で２ビット目が０、
かつ３ビット目が１、かつ４ビット目が１で、かつ５ビ
ット目が０のカテゴリー集合が２分木テーブル内で分岐
しなかったことを示す。図中右側のテンポラリーリスト
はテーブル生成時に必要とし、識別処理には不要であ
る。“_"は該当項目が無いことを示す。

「発明の効果」この発明では２分木による探索であり、２分木による
ため探索量が元から少ないが、更に、各特徴次元のビッ
ト数を全て使用しないので、効率良く探索できる。

又、０や１などの最終的なカテゴリーまで同定する必
要がない時、例えば、文字認識における数字と漢字との
識別、音声における対象音声と背景音との識別の様な用
途では、カテゴリー集合が数字・文字などのまとまりと
なる探索部で、２分木上での探索を打ちきり、探索途中
のカテゴリー集合を一つのカテゴリーと考えることで、
所望の識別が可能となり効率的である。

２つの特徴次元についてのカテゴリー分布例を第20図
に示す。ここでは、次元値の上位１ビットだけを使って
分類でき、入力されたデータはこの分布図に従いカテゴ
リーＡまたはＢに分離できる。この時、距離値を用いる
従来法では、各カテゴリーの平均値等を用いて代表値と
し、例えばカテゴリーＡは（0.25、0.75）を、カテゴリ
ーＢは（0.75、0.25）を代表値と定め距離計算をした。
しかし、入力が（1,1）のとき、共に同じ距離値となる
ので、カテゴリーＡと分類できない。これはこのカテゴ
リー分布が非線形分離で、距離値を用いる従来法ではこ
れに対応できない為である。

一方この発明では請求項２〜４の発明によりサブカテ
ゴリーを追加することで、２分木テーブルの候補カテゴ
リーＡに対し、a1,a2,a3をサブカテゴリーとし分類でき
るようにする。この時、第21図に示すテーブルが得られ
る。したがって、この発明により非線形分離が可能とな
るので、文字・画像・音声等の認識・識別処理の分野に
おいて、より高精度のパターン識別が可能となる。

【図面の簡単な説明】

第１図は分類様カテゴリーの入力パターン例を示す図、
第２図は特徴次元、カテゴリー別画素を示す図、第３図
は各カテゴリーの特徴ベクトルを示す図、第４図は特徴
次元値の２進数表現例を示す図、第５図は特徴次元別各
カテゴリー分布を示す図、第６図は２分木テーブル例を
示す図、第７図はカテゴリー５の入力パターン例を示す
図、第８図は誤識別するカテゴリー５の入力パターン例
を示す図、第９図は誤識別を回避するための木テーブル
修正箇所を示す図、第10図はカテゴリー“6"と“9"分離
用新規特徴ベクトルを示す図、第11図は新規特徴ベクト
ルによる木テーブル修正箇所を示す図、第12図は探索不
能となるカテゴリー５の入力パターン例を示す図、第13
図は探索不能を回避するための木テーブル修正箇所を示
す図、第14図は請求項１の発明の識別処理例を示す流れ
図、第15図は請求項２の発明における２分木テーブル修
正処理を示す流れ図、第16図は請求項３の発明における
２分木テーブル修正処理を示す流れ図、第17図は請求項
４の発明における２分木テーブル修正処理を示す流れ
図、第18図は２分木テーブル生成処理例を示す流れ図、
第19図は２分木テーブル格納メモリの記憶例を示す図、
第20図は非線形分離を起す特徴分布を示す図、第21図は
第20図と対応する２分木テーブルを示す図である。

Claims

(57)【特許請求の範囲】

【請求項１】文字・画像・音声等の入力パターンを、複
数のカテゴリーの何れに同定されるかを識別する方法に
おいて、上記入力パターンから数値で表現される次元値からなる
特徴ベクトルを生成し、照合項目と分岐項目とよりなる条件を有する複数の探索
部と、同定されるカテゴリーを示す同定部とから構成さ
れる２分木テーブルを用い、上記照合項目と、それに対応する上記入力パターンの特
徴ベクトルの次元値の特定の桁（以下ビットと呼ぶ）と
の一致を確認した後、上記分岐項目に対応する上記入力パターンの特徴ベクト
ルの次元値の特定のビットの値により次の探索部または
同定部を決定し、上記探索部の条件を、その分岐項目により２分されるカ
テゴリー数の分散パラメータの大小を比較して選定する
ことを特徴とするパターン識別方法。
【請求項２】入力パターンから誤ったカテゴリーを識別
結果として出力した場合、その結果に至った同定部を探
索部に置き換え、照合項目と分岐項目からなる条件を、
それまで経由した探索部の条件に含まれてなく、その条
件により２分されるカテゴリー数の割合から求められる
分散パラメータの大小比較により選定し、上記置き換え
た探索部に続く次の分岐先を、上記誤ってしまったカタ
ゴリーを示す同定部と、上記入力パターンの正しいカデ
ゴリーを示す同定部として上記２分木テーブルを修正す
ることを特徴とする請求項１記載のパターン識別方法。
【請求項３】上記２分木テーブルにおいて複数のカテゴ
リーを分離不能な探索部がある場合に、新規次元値を上
記特徴ベクトルに加え、その新規次元値により上記分離
不能な探索部の条件を設定し、その条件により２分され
るカテゴリーの数の分散パラメータの大小比較により上
記条件を選定し、次の分岐先として、新しい探索部また
は同定部を生成することを特徴とする請求項１記載のパ
ターン識別方法。
【請求項４】上記入力パターンの特徴ベクトルの次元値
の特定ビットの値が、上記探索部の条件である照合項目
に一致しないため既存カテゴリーのどれにも同定できな
い場合に、上記照合項目との不一致が検出された探索部
と、その前の探索部との間に新たな探索部を追加し、一
致しなかった次元値のビットをその新たな探索部の条件
である分岐項目とするように上記２分木テーブルを修正
することを特徴とする請求項１記載のパターン識別方
法。