JPH04112391A - パターン識別方法 - Google Patents

パターン識別方法

Info

Publication number
JPH04112391A
JPH04112391A JP2232754A JP23275490A JPH04112391A JP H04112391 A JPH04112391 A JP H04112391A JP 2232754 A JP2232754 A JP 2232754A JP 23275490 A JP23275490 A JP 23275490A JP H04112391 A JPH04112391 A JP H04112391A
Authority
JP
Japan
Prior art keywords
search
category
identification
section
categories
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2232754A
Other languages
English (en)
Other versions
JP2945454B2 (ja
Inventor
Hikari Morita
光 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2232754A priority Critical patent/JP2945454B2/ja
Publication of JPH04112391A publication Critical patent/JPH04112391A/ja
Application granted granted Critical
Publication of JP2945454B2 publication Critical patent/JP2945454B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は、文字・画像・音声等の人カバターンから特
徴ベクトルを生成し、その特徴ベクトルを複数のカテゴ
リーの何れかに同定して入力パターンの認識・識別を行
なうパターン識別方法に関する。
「従来技術」 従来のパターン識別方法は、次に定義される距離値dJ
を候補カテゴリーj−1,2、・・、nに関して求め、
距離値の大小比較でカテゴリーの識別結果を選択する。
トルの次元値をx、(i=1.2、・・・、m)、各種
候補カテゴリーの次元値をX、J(j−1,2、n)、
そして距離値を調整する重み値をWijと置く。
「発明が解決しようとする課題」 この様なパターン識別処理では、距離値を全候補カテゴ
リーについて求めて識別結果を得た。このため、候補カ
テゴリー数nまたは特徴次元数mが大きくなると処理量
が著しく増大した。カテゴリー数が多くなると一般に識
別精度向上のため特徴次元数が多く必要なので、この問
題はパターン識別における中心的な課題の1つとなって
いた。
この対策として、積和演算器やソータなどの専用ハード
の利用、処理の並列化、KL展開法等による特徴次元数
の圧縮等をし、上式におけるm、nの値を相対的に低下
させ計算量を削減していた。
しかし、これらは計算処理量を数分の1に削減する程度
で、パターン識別処理の処理方式を本質的に改良し計算
量を大幅に削減する抜本的な対策ではなかった。
また、従来、元の特徴次元値との関係が明らかでない新
たな特徴次元を精度向上を目的に付加するとき、シミュ
レーションにより識別精度を検証する必要があり、それ
に伴い膨大な計算処理量を必要とした。この為、従来、
複数の特徴ベクトルを組み合わせることによる精度向上
は困難であった。
この発明の目的は、入力パターンと各カテゴリー間の距
離算出処理とその距離値を使った候補探索処理とからな
る従来の方法に対し処理量を大幅に削減することができ
、また、複数の特徴次元を組み合わせて識別精度を向上
させるときに、僅かな変更で対応できるパターン識別方
法を提供することにある。
「課題を解決するための手段」 この発明によれば入力パターンから特徴ベクトルを生成
し、この特徴ベクトルから、予め用意されている候補カ
テゴリーとして予想されるパターンについての2分木テ
ーブルを参照することでパターン識別を行う。
この2分木テーブルは、カテゴリー集合の分類効果が大
きい特徴ベクトルの各次元のビットによる場合分けを探
索条件として構成する。例えば、その各次元値の特定の
ビットにより各候補カテゴリーからなる集合が2分され
る時、一方に分類される割合をαと置くと、分散パラメ
ータはS−α(1−a)で定義でき、その分散パラメー
タの大小比較により探索条件を選択する。
更に、誤った識別結果を得た場合にその結果に至った同
定部を探索部に置き換え、そこから正しいカテゴリーを
示す同定部と、誤ってしまったカテゴリーを示す同定部
との何れかに分岐するように修正し、既存特徴ベクトル
では区別できない複数のカテゴリーの探索部がある場合
、新規次元値を特徴ベクトルに付加し、その新規次元値
を条件に持つ探索部を追加し、その探索部の分岐先に新
しい探索部又は同定部を生成するように修正し、探索条
件に合致しないため探索不能となる場合はその探索不能
となった探索部とその直前の探索部との間に新規な探索
部を追加し、その新規な探索部の条件の分岐項目に上記
合致しなかった次元値のビットを用いるように修正し、
既存2分木テーブルの識別能力を強化する。
「作 用」 この発明では分散パラメータの大小比較により、2分木
テーブルの根元に近い探索部はど、多くのカテゴリーを
大分類できる特徴ベクトルの次元値のビットが探索条件
として選ばれ、末端の葉に近い探索部はど、互いに類似
したカテゴリーを区別できるビットが選ばれる。従って
、入力パターンが入力されて識別されるまでの探索経路
は他のカテゴリーを区別するのに必要なビットだけが必
要で、全ビットを要しないので計算量が少なくなる。
更にこの発明では、識別に誤りが起きても、分散パラメ
ータを用いて選定された条件を有す探索部を2分木テー
ブルに追加修正できる。これにより、その誤った時の事
例は学習される。
゛第1の実施例、1 以下に請求項1の発明に対応する実施例を示す。
称敗ユ叉上止 この発明は、文字・画像・音声など入力パターンの形態
、ならびに特徴ベクトルの種類に拘わらず、数値化され
ていれば適用できる。しかし、説明を簡単化するため、
実施例では、0〜9の数字を識別する文字認識を対象と
する。また、以下便宜的に特徴ベクトルを定義するが、
その特徴へクドルに限らずこの発明を適用できる。
入力パターンは検出手段により第1図に示すように縦1
1横7のメツシュに2値化されているとし、2分木テー
ブルを生成するための各カテゴリーも同様の入力パター
ンから得られていたとする。
なお、第1図に示す入力パターンを生成するのに、線幅
を1とするなどの制約を掛けているが、本質的ではない
この時、特徴ベクトル(A、B、C,D)は次のように
生成される。横方向の特徴をA次元とし、その次元値A
は横方向へ画素が2個以上連続する個数で定義する。同
様に、縦方向の特徴をB次元、右上斜め方向の特徴をC
次元、左上斜め方向の特徴をD次元とし、それぞれの次
元値は縦方向、右上斜め方向、左上斜め方向へ2個以上
連続する画素数で定義する。第2図に各特徴次元の算出
根拠となる画素を白抜きで示す。このようにして求めた
特徴ベクトルを第3図に示す。ここで、例えば、0”の
特徴ベクトルは、(10,18,4,4)  となる。
ベクトルの゛ − 各次元値を第4図に示すように2進数表現で表示すると
、第3図に示した各特徴次元毎の数値から第5図に示す
カテゴリー分布が得られる。この第5図は例えば次元値
8は、A特徴次元のカテゴリーがなし、B特徴次元のカ
テゴリーが“2″と°8″′、C特徴次元のカテゴリー
がなく、D*ftk次元のカテゴリーが′°4”と5”
であることを示す。ここで、2進数の表現形式は任意で
あり、下位桁より]、、2,4,8.16の重みとした
一般的な表現でも良い。ここで、各次元値のビットを表
すのに、(特徴次元名)、(ビット位置)とする。
例えば、A特徴次元の最上位ビットはA、l、B特徴次
元の上位から3番目のビットは8.3と表す。
I丘末±ニブ止 第6図に2分木テーブルを示す。ここに、四角で囲まれ
た部分を探索部と呼び、丸で囲まれた部分を同定部と呼
ぶ。探索部の上段はそれまでに分類されたカテゴリーの
集合を示し、下段は次に探索する次元値の条件であり照
合項目と分岐項目とよりなる。例えば、*3の探索部は
その上段より“0”と“4”のカテゴリー集合であって
下段より、照合項目がC,1=0で、分岐項目がC,2
であってC,1=0かつC,2=0なら“0″なるカテ
ゴリーに同定され、C,1=OがっC,2=1なら” 
4 ”なるカテゴリーに同定される条件を示す。また、
*4の探索部は“1,5.7”のカテゴリー集合で、照
合項目がA、1=0で分岐項目がA、2であっ7A、1
=0かつA、2=0なら*6の探索部へ移り、A、I=
0かつA、2= 1なら°5゛なるカテゴリーに同定さ
れる。このように、同定部内の数字は同定されたカテゴ
リーを示し、また条件が、A、l−〇などの式で表現さ
れ照合するための条件となるものを照合項目と呼び、A
、2=?などの式で表現されその値で分岐されるものを
分岐項目と呼ぶ。
なお、2分木テーブル中に必ずしもカテゴリー集合のリ
スト、つまり各探索部の上段を含める必要は無い。カテ
ゴリーの探索では、この2分木テーブルにより、探索条
件とその結果移行すべき探索部または同定部が明らかな
らば十分であるためである。
バ −ン゛ 1几 ゛。
第7図に示す入力パターン゛5゛が与えられたときの識
別処理を以下に示す。この例では網点を施した1画素分
だけ元の候補カテゴリーと異なるデータを得たとする。
パターン識別処理は、入力パターンから特徴ベクトル(
15、l017.8)を生成した後、第6図に示される
2分木テーブルを参照し探索を行なう。
第7図の入力パターンに対応する特徴ベクトル(15,
10,7,8)の場合の探索を以下に示す:・上記木テ
ーブルの根の探索部、つまり*1探索部により識別探索
を開始し、その条件は分岐項目B、1=?のみであり、
入力パターンの特徴ベクトルのB特徴次元の第1ビット
(第1上位桁)がゼロ、つまりB、l=0であるから*
2探索部へ移行する。
・*2探索部では照合項目がC,I=0で分岐項目がC
,2=?であり、これに対し入力パターンの特徴ベクト
ルのC特徴次元の第1ビyトc、1は0であり、第2ビ
ットC,2は0であるから*4探索部へ移行する。
・*4探索部では同様にしてA、1=0かをチエツクし
、A、1=0であり、かつA、2=1であるから同定部
に移行してカテゴリー“5″′を識別結果とする。
2\ −−プルの 第5図に示した各カテゴリー毎の特徴ベクトル上の分布
が得られているとき、これから2分木チーフルの生成処
理を以下に示す。
*1探索部に於ける候補は総てのカテゴリ” 0123
456789 ”であり、これらの総ての候補について
、A、1=0、C,1=0、D、1=0であるが、8.
1に関しては、8.1=0となる候補カテゴリー” 1
2356789 ”と、8.1= 1となる候補カテゴ
リー” 04 ”とに分類できる。このようにある特徴
次元値の特定のビット、この例ではB、Iにより候補カ
テゴリーの集合が2分される時、一方に分類される割合
をαと置き、分散パラメータSをS=α(1−α)と定
義したとする。
この時、B、1=0またはB、1=1により分割される
カテゴリーの割合から分散パラメータSは0.2(1−
0,2) −0,16となる。以上の結果を「特徴次元
塩、ビット位置J  (0に分類されるカテゴリ−毎 0)なる記号で示すと、 A 、 1 (01234567891,0)、8. 
2356789 04皿、C、1(012345678
91,0)、D 、 1 (01234567891,
0)となる(下線の部分が探索条件として選択されたv
P徴次元のビットを示す)aなお、各特徴次元のビット
は必ずOまたは1に分布するので、分散値X100の最
大値は25となる。
ここで求めたA、1、B、1.C,1,D、1の中では
、分散値16が最大となるので、B、lを探索条件(分
岐項目として)に場合わけをし、次に*2探索部または
*3探索部へ移行するテーブルを作る。
・*2探索部に於ける候補は°″12356789″と
なる。この時、総ての候補がすでにA、1=0、C,I
=0、D、I=0になることは明らかであるので、次の
ビットA、2、C,2、D、2について分散パラメータ
を出し、また8、1は既に利用済みであるので、8.2
について分散パラメータを計算すると、 A、2(17,235689,19)、8.2(3,1
256789,11)、C,21’57 23689 
23)、D、2(127,35689,23)となる。
ここで分散値23が最大であり、これにより最も均等に
分けられるので、C,1=0を前提に、つまり照合項目
として、C,2の値で場合骨けし、つまりC,2を分岐
項目としてその結果により次に*4探索部または*5探
索部へ移行するテーブルを作る。
・*3探索部における候補は“04”となる。
この時、 A、2(,04,0)、8.2(,04,0)、C,2
(0,4、%迂、D、2(041,0)となるからC,
1=0を前提(照合項目)にし、C,2を分岐項目とし
その値で場合分けし、その結果としてカテゴリー0また
は4を識別するテーブルを作る。
・*4探索部における候補は“’157’″となる。
この時、C,2が前の探索部の条件として選定されてい
るのでC,3を選び、その前段まではA、2、B、2、
D、2、は分類に用いられていないからこれらについて
分散値を計算すると、 A、2(17522)、8.2(,157,0)、C,
3(0,157、O)、D、2(17,5,22)とな
り、A、1=0を前提にA、2の値で場合分けするとし
、その結果として次に*6探索部へ移行するかカテゴリ
ー5を同定するテーブルを作る。
・*5探索部における候補は” 23689“となる。
この時、A、2(,23689,0)、8.2(326
89、■)、C,3(8,2369,16)、D、2(
2,3689,16)となり、8.2を分岐項目として
選び、その値でカテゴリー3を同定するか次に*7探索
部へ移行するテーブルとする。
・*6探索部における候補は“’ l 7 ”となる。
この時、 2NJ(L□ム」は)、B、2(,17,0)、C33
(,17,0)、D、2(171,0)  となり、A
、3を分岐項目に選び、その値によりカテゴリー1また
は7を同定する。
・*7探索部における候補は’2689”となる。この
時、A、2(,2689、O)、8.3(,2689,
0)、C,3(826919)、D、2(2,689,
19)となり、C,3を分岐項目に選び、その値により
カテゴリー8を同定するか*8探索部へ移行する。
・*8探索部における候補は’269”となる。
この時、 A、3(2,69,22)、B、4(2,69,22)
、U頁別、k」互、D、2(2,69,22)となり、
C,4を分岐項目として場合分けし、その結果*9探索
部へ移行するかカテゴリー2を同定する。
・*9探索部における候補は“69“となる。この時、
各特徴次元の各ビア)に対する分類がA、3(,69、
O)、 8.4(,69,0)、A、4(,69,0)
、 8.5(,69,0)、A、5(691,0)、 C,5代69.0)、D、2(,69,0)、D、3(
,69、O)、 D、4(,69,0)、 D、5(691、O) となり、この特徴ベクトルによってはカテゴリーの6と
9とを分離できないことが分かる。
以上の結果、第6図のテーブルが生成される。
以上の実施例は、2分木テーブルの生成例を示すのみで
この発明のほんの一例を示しているに過ぎない。例えば
、*1探索部の条件を決定する際、分散値が0となる特
徴次元のビットで分離できないのは明らかなので、分散
値がOでない下位ビットまで分散値を計算し、A、2(
17,02345689,16)、B 、 1 (23
56789,04,16)、C,2(0157,234
689,24)、D、2(0127,345689,2
4)なる結果を得、分散値か大きいと言うことで、c、
i=oを前提(照合項目)にC,2を分岐項目とし、そ
の値で分類する方法がある。
「第2の実施例」 以下に請求項2の発明に対応する2分木テーブル修正方
法の実施例を示す。
いま、第8図に示される入力パターン(網点の2画素は
元の候補カテゴリー゛′5”と異なる部分をしめず)を
候補カテゴリー“5パのバリエーションの一つとして識
別すると決める。この時、特徴ベクトルは(15,11
,8,8)となり、B、1=0、C,1=O,C,2=
1..8.2=1、C,3=1、C,4−〇となる。こ
のため、第6図に示した2分木テーブルを使う識別処理
によれば、この入力パターンは*9探索部で候補カテゴ
リー°“6.9”を識別結果として出力し、これらと共
に識別できなくなる。この様なとき、以下のように第6
図に示した2分木テーブルを改良する。
この誤識別結果となった同定部、この例では*9探索部
を新たな探索部とし、その*9探索部に至るまでの*I
、  *2.  *5.  *7.および*8探索部の
条件に現われていない特徴次元のビア)で、入力カテゴ
リー5と6,9とを分離するものについて分散値を計算
すると、 A、1(5691,0)、 8.3(,569,0)、
A、2(,569,0)、 8.4(,569,0)、
A、3 5 69 22  、B、5(5,69,22
)、C,5(5,69,22)、D、1 (5691,
0)、0.2(,569,0)、 D、3(5,69,0)、 D、4(5,69,22) となり、例えばなるべく上位のビットで場合分けする基
準では、A、1=0、A、2=1を前提(照合項目)に
A、3を分岐項目とし、その新たな*9探索部に続く次
の分岐先として誤ってしまった候補カテゴリー″5″゛
を示す同定部と、入力パターンの正しい候補カテゴリー
”6.9“′を示す同定部(この例では*10探索部)
として、第6図の*9探索部を第9図で置き換え、新設
の*9探索部で新規の候補カテゴリー“5”を分離する
以上の様に、既存2分木テーブルが許容しないカテゴリ
ーで、誤識別されるものについても、2分木テーブルに
若干の修正を加えることで、正しい識別が行なえるよう
になる。なお、2分木テーブルにおいて、候補カテゴリ
ーの名称が同じでありながら、2分木テーブルの葉にあ
たる場所が複数存在するとき、それぞれをサブカテゴリ
ーと呼ぶ。この発明に於いては、このサブカテゴリーを
沢山導入することで、識別率を向上させる。
r第3の実施例」 以下に請求項3の発明に対応する2分木チーフルを修正
する実施例を示す。
いま、第6図の2分木テーブルでは、*9探索部でカテ
ゴリー°“6パと″°9パを分離する条件が無いので、
6°゛または” 9 ”の入力パターンの時は探索を打
ちきる。これは使われている特徴ベクトルで“6゛と“
9“°を区別できない為である。
そこで、“°6°゛と“′9゛を、特徴ベクトルに新た
な次元値を加えて分離することを考え、既存2分木テー
ブルを修正する。新たな特徴次元値E及びその次元値と
して、第10図に示すものを定義する。つまり、分離不
能な候補カテゴリー゛°6′と′9″の各パターンを左
右に等分し、左部分の画素が右部分より多ければE=O
とし、その逆ならE=1とする。この新規特徴次元値E
=0かE=1かにより分離不能候補カテゴリーを場合分
けした時の分散値を求めると、 E、1(6,9,25)となるから、第6図の*9探索
部を、第11図に示すように候補カテゴリーの集合を“
6゛及び“°9”、E、1を分岐項目とし、E、1= 
0 テ“6”を同定し、E、I= 1 テ” 9”を同
定するように置き換える。
以上の様に、既存特徴ベクトルでは分離できない時、新
規特徴次元を導入し、複数のカテゴリーに分離できるよ
うにする。
なお、距離値を識別に使う従来法では、既存特徴次元数
mに新規特徴次元数を付加する場合は、多くの組み合わ
せについて誤識別する場合が生じるか検証する必要があ
った。これに対し、この発明では、2分木テーブルにお
ける分離不能となった探索部から下の枝についてのみ新
規特徴次元値の検証をするので、全体に与える影響は僅
かであり検証は必要ないので追加に伴うコストは僅かで
ある。
この様に、この発明では大分類に効率の良い特徴ベクト
ルのビットで先に分離した後で、詳細分離の精度が高い
特徴ベクトルを用いるなどの組み合わせが可能となり、
識別率を向上させることができる。
「第4の実施例」 以下に請求項4の発明に対応する2分木テーブルからな
る実施例を示す。
いま、候補カテゴリー5に分類される第12図の入力パ
ターン(第1図の候補カテゴリー5との違いを欠落画素
を網点て、付加画素を交差斜線で表示した)を、第6図
の2分木テーブルを用いて識別する場合を考える。この
入力パターンの特徴ベクトルは(16,10,6,8)
である。この時、B、1=0、C,1=O1C,2=O
ゆえに、*44探索まで移行するが、A、1= 1、つ
まり照合項目不一致なので探索不能となる。これは、2
分木テーブルが予めこの場合を想定していなかったため
起きている。
そこで、第13図に示すように探索不能となった*44
探索とその直前の*22探索との間に新規の*2−4探
索部を挿入し、その条件として一致しなかった次元値の
ビットA、1を分岐項目とするように既存2分木テーブ
ルを修正する。(ここでは、元の候補カテゴリー“5°
゛とこの新たな候補カテゴリー“5*″が*2−4探索
部の上段にあるので説明上“5*”として区別した。な
お、“5*”なる枝の追加は既に述べた様にサブカテゴ
リーという概念による拡張である。)以上のように、こ
の発明を用いれば、探索部間に新規探索部を挿入するこ
とによって探索不能状態を回避できる。
請求項Iの発明における識別処理動作を一般的に示すと
第14図に示すようになる。つまりまず入力パターンか
ら特徴ベクトルを生成しくSl)、2分木テーブルの根
の探索部から識別探索を開始しくSZ)、その照合項目
と入力パターンの特徴ベクトルの次元値の特定ビットと
を比較しくS3)、一致していれば分岐項目に相当する
人カバターンの特徴ベクトルの次元値の特定ビットを取
り出しくS、)、そのビット値による分岐項目の指示に
従って次の探索部又は同定部へ移行する(S、)。
この時移行先が探索部であるか否かをチエツクしくS6
)、探索部である場合はその探索部に探索条件(分岐項
目)があるかをチエツクしくS7)、探索条件があれば
ステップS3に戻る。ステップS、ではその探索条件に
照合項目が含まれていない時は照合項目との一致がとれ
たとして処理する。
ステップS3で不一致の時は請求項4の発明による処理
に移る。ステップS6で移行先が探索部でない場合は移
行先の同定部の示すカテゴリーを識別結果として出力し
て終了する(S8)。ステップS、で探索条件がない場
合は請求項3の発明による処理に移る。
請求項2の発明による修正処理を第15図に示す。まず
誤った候補カテゴリーを示す同定部を探索部としくS、
)、その誤った候補カテゴリーと入力パターンの正解カ
テゴリーとを分離できる探索部の条件を選定しくS2)
、ステップSIで探索部とした部分の分岐項目をステッ
プS2で選定した条件とし、その分岐項目のO又は1に
より、誤った候補カテゴリーと入力パターンの正解カテ
ゴリーとのそれぞれを示す同定部を分岐とする(S3)
第16図に請求項3の発明による修正処理を示す。既存
探索部の個数がNの場合、分離不能な探索部の番号をN
+1に置きかえる(S、)。後述する2分木生成フロー
における初期値設定を、X=N、y=N+1に置きかえ
て、カテゴリー集合を新規次元値について探索部の条件
を選定する(S2)。
第17図に請求項4の発明による修正処理を示す。照合
項目に不一致が生した探索部とその直前の探索部との間
に新規探索部を挿入する(Sl)。
一致した照合項目は新規探索部の照合項目とし、不一致
の照合項目を新規探索部の分岐項目とし、その新規分岐
項目におけるO又は1により正解カテゴリーの同定部と
不一致が検出された探索部とを分岐先とする(S2)、
不一致が検出された探索部の元の照合項目から新規探索
部の照合項目と分岐項目とを除< (53)。
2分木テーブルの生成手順を第18図に示す。
第5図の分布に従って第6図のテーブルを生成する場合
を例としながら説明する。ステップSIでx=o、y=
1とする。yは探索部の番号である。
ステップS2でz=x+1.z/!=y、x=yとする
。従って木テーブルのトリーの1段目の*11探索の探
索条件の選定の際にはz=1.zl=1、x=1となる
。2はトリーの各段における変数でx+1〜zlで変化
し、トリーの各段における探索部の左から順に2の数を
増加させる。ステ7プS3で2がzRより大きいかをチ
ェフクし、この場合はz−1,zl=1であるからステ
ップS、に移り、分散パラメータ己こよりz=1番目の
探索部の探索条件を選定する。ステップS、では探索条
件が発見できたら、ステップS6に移る。
ステップS6では発見した探索条件の分岐項目で、0の
分岐先の候補カテゴリーが2個以上ならy十1−2番目
の探索部としy−y+1−2とし、候補カテゴリーが1
個ならそのカテゴリーの同定部とし、分岐項目で1の分
岐先の候補カテゴリーが2個以上ならy+1=3番目の
探索部とし、y=y+1=aとし、z=z+1=2とし
てステップ゛S、に戻る。
ここでz=2>zf=1であるからステンブSフに移り
、x=1.y=3だからx=yでなくて、ステップS2
に戻る。よってz=1+1=2zl−3x=3となり辷
 z>zlであるからステップS4に移り、z=2、つ
まり*2探索部について探索条件を選定し、探索条件が
得られるから、ステップS6に移り、0の分岐先がy+
1=4の探索部とされ、かつy=y+t=4とされ、か
つlの分岐先がy −1−1= 5の探索部とされ、か
つy=y+1−sとされ、z=2+1=3とされてステ
ップS3に戻る。z l=3であるからステップS4に
移り、z=3、*3探索部について探索条件を選定し、
探索条件が発見されるからステ・7プS6に移る。この
時の分岐項目の0の分岐先は候補カテゴリーが1個であ
り、そのカテゴリー“′0゛の同定部とし、また1の分
岐先はカテゴリ“′4゛の同定部として、z=z+1=
4とされてステップS3に戻る。
z=4.z12=3だからステップS、に移り、x=3
.y=5だからステップS2に戻り、2=3+1=4.
zj2=5.x=5とされる。z−4゜z j2=5だ
からステップS4に移り、z=4.つまり*4探索部に
ついて探索条件を選定し、探索条件が発見されるから、
□ステップS6に移り、分岐項目のOの分岐先がy+t
==6の探索部とされ、かつy=y+t=6とされ、1
の分岐先がカテゴリー“5”の同定部とされ、z=z+
1=5とされ、ステップS、に戻る。以下同様に処理さ
れる。
その時のトリーの各段におけるステップS2の入力時の
x、y (=zj2)の各個と、各段間に検出された探
索部の値yを第6回に示す。
ステップS2の入口でx=8.y=9となると、ステッ
プS2でz=8+1=9.zffi=9.x−9となり
、ステップS4に移り、Z=9.つまり*9探索部につ
いて探索条件が選定される。しかし探索条件が発見され
ないからステップS8に移り、*9探索部で分離不能と
表示し、z=z+1=10としてステップS、に戻る。
ここで2−10z ff1=9であるからステップS、
に移り、x=9゜y=9であるからテーブル生成処理は
終了となる。
ステップS4での分岐パラメータを比較する順番の選定
方法には、各次元値について、ビ・ント番号を揃えつつ
逐次増加させる方法、各次元値について分散値がゼロよ
り大となるまでビット番号を増加させる方法など各種あ
る。またステップS@で更に分離が必要であれば第16
図に示した処理をすればよい。
以上のようにして得られた2分木テーブルは例えば第1
9図に示すようにメモリに記憶する。この例は第6図に
示したテーブルについて具体的に示した場合である。第
19図において特徴ベクトルの次元の各ビットは(次元
値の順番)、(ビットの順番)で表現しており、例えば
°“2.1”は2番目の特徴次元の1番目のビットを示
す。分散ビット0の表示は、分散パラメータ0が続く集
まりを、(次元値の順番)、(分散パラメータOの先頭
ビット)(先頭ビットにおける30又は1の値)−(次
のビットにおける0又は1の値)−・−のように表わす
。例えば“1.20−1−1−0”は1番目の次元で2
ビツト目が0、かつ3ビツト目が1、かつ4ビツト目が
1で、かつ5ビツト目が0のカテゴリー集合が2分木テ
ーブル内で分岐しなかったことを示す。図中右側のテン
ポラリ−リストはテーブル生成時に必要とし、識別処理
には不要である。  −”°は該当項目が無いことを示
す。
「発明の効果」 この発明では2分木による探索であり、2分木によるた
め探索量が元から少ないが、更に、各特徴次元のビット
数を全て使用しないので、効率良く探索できる。
又、0や1などの最終的なカテゴリーまで同定する必要
がない時、例えば、文字認識における数字と漢字との識
別、音声における対象音声と背景音との識別の様な用途
では、カテゴリー集合が数字・文字などのまとまりとな
る探索部で、2分木上での探索を打ちきり、探索途中の
カテゴリー集合を一つのカテゴリーと考えることで、所
望の識別が可能となり効率的である。
2つの特徴次元についてのカテゴリー分布例を第20図
に示す。ここでは、次元値の上位1ビツトだけを使って
分類でき、入力されたデータはこの分布図に従いカテゴ
リーAまたはBに分類できる。この時、距離値を用いる
従来法では、各カテゴリーの平均値等を用いて代表値と
し、例えばカテゴリーAは(0,25,0,75)を、
カテゴリーBは(0,75,0,25)を代表値と定め
距離計算をした。
しかし、入力が(1,1)のとき、共に同し距離(直と
なるので、カテゴリーAと分類できない。これはこのカ
テゴリー分布が非線形分離で、距離値を用いる従来法で
はこれに対応できない為である。
一方この発明では請求項2〜4の発明によりサブカテゴ
リーを追加することで、2分木テーブルの候補カテゴリ
ーAに対し、al、a2.a3をサブカテゴリーとし分
類できるようにする。この時、第21図に示すテーブル
が得られる。したがって、この発明により非線形分離が
可能となるので、文字・画像・音声等の認識・識別処理
の分野において、より高精度のパターン識別が可能とな
る。
【図面の簡単な説明】
第1図は分類様カテゴリーの入力パターン例を示す図、
第2図は特徴次元、カテゴリー別画素を示す図、第3図
は各カテゴリーの特徴ベクトルを示す図、第4図は特徴
次元値の2進数表現例を示す図、第5図は特徴次元別名
カテゴリー分布を示す図、第6図は2分木テーブル例を
示す図、第7図はカテゴリー5の入力パターン例を示す
図、第8図は誤識別するカテゴリー5の人カバターン例
を示す図、第9図は誤識別を回避するための木テーブル
修正箇所を示す図、第10図はカテゴリー′“6″と“
9”分離用新規特徴ベクトルを示す図、第11図は新規
特徴ベクトルによる木テーブル修正箇所を示す図、第1
2図は探索不能となるカテゴリー5の入力パターン例を
示す図、第13閲は探索不能を回避するための木テーブ
ル修正箇所を示す図、第14図は請求項1の発明の識別
処理例を示す流れ図、第15図は請求項2の発明におけ
る2分木テーブル修正処理を示す流れ図、第16図は請
求項3の発明における2分木テーブル修正処理を示す流
れ回、第17図は請求項4の発明における2分木テーブ
ル修正処理を示す流れ図、第18図は2分木テーブル生
成処理例を示す流れ図、第19図は2分木テーブル格納
メモリの記憶例を示す図、第20図は非線形分離を起す
特徴分布を示す図、第21図は第20図と対応する2分
木テーブルを示す回である。

Claims (4)

    【特許請求の範囲】
  1. (1)文字・画像・音声等の入力パターンを、複数のカ
    テゴリーの何れに同定されるかを識別する方法において
    、 上記入力パターンから数値で表現される次元値からなる
    特徴ベクトルを生成し、 照合項目と分岐項目とよりなる条件を有す複数の探索部
    と、同定されるカテゴリーを示す同定部とから構成され
    る2分木テーブルを用い、 上記照合項目と、それに対応する上記入力パターンの特
    徴ベクトルの次元値の特定の桁(以下ビットと呼ぶ)と
    の一致を確認した後、 上記分岐項目に対応する上記入力パターンの特徴ベクト
    ルの次元値の特定のビットの値により次の探索部または
    同定部を決定し、 上記探索部の条件を、その分岐項目により2分されるカ
    テゴリー数の分散パラメータの大小を比較して選定する
    ことを特徴とするパターン識別方法。
  2. (2)入力パターンから誤ったカテゴリーを識別結果と
    して出力した場合、その結果に至った同定部を探索部に
    置き換え、照合項目と分岐項目からなる条件を、それま
    で経由した(それ以前の)探索部の条件に含まれてなく
    、その条件により2分されるカテゴリー数の割合から求
    められる分散パラメータの大小比較により選定し、上記
    置き換えた探索部に続く次の分岐先として、上記誤って
    しまったカテゴリーを示す同定部と、上記入力パターン
    の正しいカテゴリーを示す同定部として上記2分木テー
    ブルを修正することを特徴とする請求項1記載のパター
    ン識別方法。
  3. (3)上記2分木テーブルにおいて複数のカテゴリーを
    分離不能な探索部がある場合に、新規次元値を上記特徴
    ベクトルに加え、その新規次元値により上記分離不能な
    探索部の条件を設定し、その条件により2分されるカテ
    ゴリーの数の分散パラメータの大小比較により上記条件
    を選定し、次の分岐先として、新しい探索部または同定
    部を生成することを特徴とする請求項1記載のパターン
    識別方法。
  4. (4)上記入力パターンの特徴ベクトルの次元値の特定
    ビットの値が、上記探索部の条件である照合項目に一致
    しないため既存カテゴリーのどれにも同定できない場合
    に、上記照合項目との不一致が検出された探索部と、そ
    の前の探索部との間に新たな探索部を追加し、一致しな
    かった次元値のビットをその新たな探索部の条件である
    分岐項目とするように上記2分木テーブルを修正するこ
    とを特徴とする請求項1記載のパターン識別方法。
JP2232754A 1990-09-03 1990-09-03 パターン識別方法 Expired - Fee Related JP2945454B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2232754A JP2945454B2 (ja) 1990-09-03 1990-09-03 パターン識別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2232754A JP2945454B2 (ja) 1990-09-03 1990-09-03 パターン識別方法

Publications (2)

Publication Number Publication Date
JPH04112391A true JPH04112391A (ja) 1992-04-14
JP2945454B2 JP2945454B2 (ja) 1999-09-06

Family

ID=16944234

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2232754A Expired - Fee Related JP2945454B2 (ja) 1990-09-03 1990-09-03 パターン識別方法

Country Status (1)

Country Link
JP (1) JP2945454B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06103313A (ja) * 1992-09-18 1994-04-15 Hitachi Ltd 情報処理方法及びその装置
JP2005346654A (ja) * 2004-06-07 2005-12-15 Glory Ltd 画像認識装置、画像認識方法およびその方法をコンピュータに実行させるプログラム
KR100734764B1 (ko) * 1999-12-09 2007-07-06 드그레몽 개선된 막 여과방법
SG146421A1 (en) * 1999-06-30 2008-10-30 Silverbrook Res Pty Ltd Method and system for searching information using coded marks
JP2009129253A (ja) * 2007-11-26 2009-06-11 Toshiba Corp パターン認識装置、パターン認識プログラム及びパターン認識方法
US7634140B2 (en) 2002-02-27 2009-12-15 Nec Corporation Pattern feature selection method, classification method, judgment method, program, and device
US8031982B2 (en) 1999-05-25 2011-10-04 Silverbrook Research Pty Ltd Pen-shaped sensing device for sensing surface regions
US9870618B2 (en) 2015-02-23 2018-01-16 Fujitsu Limited Image processing apparatus and image processing method

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06103313A (ja) * 1992-09-18 1994-04-15 Hitachi Ltd 情報処理方法及びその装置
US8295653B2 (en) 1999-05-25 2012-10-23 Silverbrook Research Pty Ltd Sensing device for sensing surface regions
US8031982B2 (en) 1999-05-25 2011-10-04 Silverbrook Research Pty Ltd Pen-shaped sensing device for sensing surface regions
US7590622B2 (en) 1999-06-30 2009-09-15 Silverbrook Research Pty Ltd System for facilitating searches for data stored on a network
SG146421A1 (en) * 1999-06-30 2008-10-30 Silverbrook Res Pty Ltd Method and system for searching information using coded marks
US7657510B2 (en) 1999-06-30 2010-02-02 Silverbrook Research Pty Ltd System for performing data searches on a network
KR100734764B1 (ko) * 1999-12-09 2007-07-06 드그레몽 개선된 막 여과방법
US7634140B2 (en) 2002-02-27 2009-12-15 Nec Corporation Pattern feature selection method, classification method, judgment method, program, and device
US7835547B2 (en) 2004-06-07 2010-11-16 Glory Ltd. Image recognition device, image recognition method, and program for causing computer to execute the method
WO2005122093A1 (ja) * 2004-06-07 2005-12-22 Glory Ltd. 画像認識装置、画像認識方法およびその方法をコンピュータに実行させるプログラム
JP2005346654A (ja) * 2004-06-07 2005-12-15 Glory Ltd 画像認識装置、画像認識方法およびその方法をコンピュータに実行させるプログラム
JP2009129253A (ja) * 2007-11-26 2009-06-11 Toshiba Corp パターン認識装置、パターン認識プログラム及びパターン認識方法
US9870618B2 (en) 2015-02-23 2018-01-16 Fujitsu Limited Image processing apparatus and image processing method
US10424068B2 (en) 2015-02-23 2019-09-24 Fujitsu Limited Image processing apparatus and image processing method for person identification

Also Published As

Publication number Publication date
JP2945454B2 (ja) 1999-09-06

Similar Documents

Publication Publication Date Title
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
CN111881289A (zh) 分类模型的训练方法、数据风险类别的检测方法及装置
Hossain et al. Recognition and solution for handwritten equation using convolutional neural network
CN107545049A (zh) 图片处理方法及相关产品
JPH04112391A (ja) パターン識別方法
CN115546586A (zh) 红外弱小目标的检测方法、装置、计算设备及存储介质
US20220180245A1 (en) System and method of constructing machine learning workflows through machine learning suggestions
JP2019057087A (ja) 文字認識方法及び文字認識システム
CN109472289A (zh) 关键点检测方法和设备
JPH03174685A (ja) パターン認識装置
Montagner et al. Learning to remove staff lines from music score images
JPH08115387A (ja) パターン認識装置
CN104268978A (zh) 纸钞序号辨识方法
Bilan et al. Description and recognition of symmetrical and freely oriented images based on parallel shift technology
KR102007791B1 (ko) 단계별 윤곽선 특성 분석을 이용한 숫자 인식 방법 및 장치
US20230065007A1 (en) Item classification assistance system, method, and program
JP3060922B2 (ja) 特徴生成装置
JPS58143396A (ja) 音声認識装置
JPH05258114A (ja) 文字認識装置
JP2752762B2 (ja) ノードマッチング処理方式
JPH041870A (ja) パターン認識方法および装置
CN114882538A (zh) 一种基于多级纹型的指纹比对方法及系统
JPH03294983A (ja) 文字認識装置
JP2875678B2 (ja) 文字認識結果の後処理方法
JP3446769B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees