JP3222699B2 - パターン認識装置 - Google Patents

パターン認識装置

Info

Publication number
JP3222699B2
JP3222699B2 JP27716694A JP27716694A JP3222699B2 JP 3222699 B2 JP3222699 B2 JP 3222699B2 JP 27716694 A JP27716694 A JP 27716694A JP 27716694 A JP27716694 A JP 27716694A JP 3222699 B2 JP3222699 B2 JP 3222699B2
Authority
JP
Japan
Prior art keywords
output
unit
input
vector
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP27716694A
Other languages
English (en)
Other versions
JPH08115387A (ja
Inventor
直毅 名取
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP27716694A priority Critical patent/JP3222699B2/ja
Publication of JPH08115387A publication Critical patent/JPH08115387A/ja
Application granted granted Critical
Publication of JP3222699B2 publication Critical patent/JP3222699B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字パターン、図形パ
ターン(以下単にパターンと称する)等を認識するパタ
ーン認識装置に関する。
【0002】
【従来の技術】この種従来のパターン認識装置として、
パターンをベクトルと見なし、ベクトル空間内での分布
領域を学習することにより、該入力パターンを認識する
ものがある。
【0003】これについて、図7を参照して説明する。
ここでは文字認識を例に挙げて説明する。文字のパター
ンは、図7に示すようにドット・パターンで示すことが
できる。このドット・パターンにおいて、白い部分のド
ットは‘0’、黒い部分のドットは‘1’とし、ドット
を1次元に展開すれば、文字パターンは例えば次に示す
ような‘0’と‘1’からなるベクトルとなる。
【0004】[0,0,1,1,1,1,0,…] 今、このような文字パターンのベクトルの任意のものを
xと書くと、パターン認識装置は、入力された文字パタ
ーンがベクトル空間内のどのような領域にあるかで、こ
の入力文字を分類する。特定の文字種がベクトル空間内
のどの領域を占めるかは、一般に現場から収集した多数
の文字データを用いて学習する。
【0005】図8は、このような状況を説明するための
ものであるが、パターン空間をベクトルの次元1,2か
らなる2次元と仮定している。図では文字パターンベク
トルXが‘4’と分類されている場合を示している。
【0006】図9は、最近注目されているニューラルネ
ットによる文字認識の場合の原理を説明するための図で
あり、これも前述の文字認識と同一原理である。図9
は、数字認識用のニューラルネットの一例であり、これ
は入力ユニット層IUと、中間ユニット層MUと、出力
ユニット層OUを有する階層型のニューラルネットであ
る。
【0007】入力ユニット層IUの各ユニットには前述
の文字パターンベクトルXの各要素の値が入力される
が、この場合入力ユニット層IUのユニットの数は入力
文字パターンベクトルXの次元数に一致する。
【0008】ニューラルネットでは、多くの文字パター
ンを学習するが、それは前述のような文字パターンベク
トルの空間において、‘0’と見なせるベクトル空間の
どの領域を占めるか、‘1’と見なせるベクトルは空間
のどの領域を占めるか、など、ベクトル空間を‘0’,
‘1’,‘2’,…,‘9’に対応する領域に分割して
いることになる。一般に、そのような領域は、超球と呼
ばれる中間ユニット層MUのユニットの反応領域を単位
として構成される。
【0009】図10は従来の数字認識用ニューラルネッ
トの反応領域を説明するための図である。図10は、図
8と同様、パターン空間を仮に2次元平面として表した
ものであり、超球は、円で表されている。ニューラルネ
ットは、これら超球の反応領域の組み合わせでパターン
の分布領域を学習していると言える。
【0010】図9の出力ユニット層OUの各ユニット
は、文字種に対応するものであり、この場合には、
‘0’,‘1’,‘2’,…,‘9’に対応する10個
のユニットである。一般に、各出力ユニットは、0以上
1以下の実数値を出力し、それが該文字パターンベクト
ルXのカテゴリである可能性の高さを示している。通
常、判定では最も高い値を出した出力ユニットを選択す
る。
【0011】以上述べたパターン認識装置は、既に文字
認識などに利用されているが、出力結果が確定的でない
とき、例えば手書きの崩れた‘2’の文字パターンベク
トルXの入力に対して、文字種‘2’の可能性を出す出
力ユニットOU2 と文字種‘7’の可能性を示す出力ユ
ニットOU7 の出力値がほぼ等しいときは、わずかの差
で高い値の方を判定結果としてしまい、‘2’の文字パ
ターンベクトルXを‘7’である、と判定する危険性が
ある。
【0012】そこで、従来では必要なときにフィードバ
ック手段を用いて判定結果を修正するものがある。図1
1は、従来のフィードバック手段を用いたパターン認識
装置を示したものであり、これは入力手段1、中間手段
2、出力手段3、フィードバック手段4Aを備えてい
る。
【0013】入力手段1は、文字パターンベクトルXを
入力し、入力信号Iを出力する。文字パターンベクトル
Xは、図7に示すようにドット・パターンで示すことが
できる。このドット・パターンにおいて、白い部分のド
ットは‘0’、黒い部分のドットは‘1’とし、ドット
を1次元に展開すれば、文字パターンベクトルXは例え
ば次に示すような‘0’と‘1’からなるベクトルとな
る。
【0014】[0,0,1,1,1,1,0,…] 学習時に入力される文字パターンベクトルXには、教師
信号Tが伴う。教師信号Tは、文字パターンベクトルX
が何の文字種であるかを装置に教示するためのものであ
り、例えば、数字を学習する装置に、‘2’である、と
教示するには、偽を‘0’、真を‘1’とし、文字種
‘0’から‘9’までに対応する10個の‘0’か
‘1’かの数字で、 [0,0,1,0,0,0,0,0,0,0] のような教師信号Tを用意する。
【0015】入力信号Iは、文字パターンベクトルXと
等しいか、あるいは文字パターンベクトルXの要素の一
部からなる部分ベクトルである。
【0016】中間手段2は、入力信号Iを、教師信号T
を用いて学習したり、未学習の入力信号Iが入力された
ときに類似度を分析し反応強度Aを出力する。
【0017】出力手段3は、中間手段2によって出され
る入力信号Iを集約し、出力信号Oや最終的な出力結果
Yを出力する。
【0018】フィードバック手段4Aは、知識工学的な
データベースを備え、出力手段3からの出力信号Oをも
とに再認識が必要かどうかの判断を行ない、再認識が必
要ないと判断したとき、出力手段3に対して出力結果Y
を出力するよう出力要求ROを出力する。そして、フィ
ードバック手段4Aは、再認識が必要であると判断した
場合(未学習データの場合)には、知識工学的なデータ
ベースを用いて入力手段1に対してグループ分割要求R
Dを出力し、また出力手段3に対して注視要求RWを出
力する。
【0019】
【発明が解決しようとする課題】ここで、従来のフィー
ドバック手段4Aに有する知識工学的なデータベース
は、以下のようなものである。例えば、‘2’と‘7’
両方の可能性が高いときはパターンの右下の部分領域に
注目して再認識する、というようなルールをデータベー
スとして用意し、これを利用するものである。知識工学
的なデータベースは、‘2’と‘7’という文字パター
ンの構造的な違いが文字領域の右下部分に最も多く見ら
れるという先験的な知識を用いている。
【0020】しかし、すべてのカテゴリ(文字の種類)
の組について、構造的な違いを見い出すことは、一般的
には困難であり、また、カテゴリ数が増えると組合せ爆
発を起こす。
【0021】そこで、本発明は、出力手段の出力結果を
確定的でないとき、ifーthenルールを用いること
なく、正しくパターン認識ができるパターン認識装置の
提供することを目的とする。
【0022】
【課題を解決するための手段】前記目的を達成するた
め、本発明に係るパターン認識装置は、文字、図形等の
パターンベクトルをパターン単位毎に入力し、グループ
分割要求が入力されたときは前記パターンベクトルをグ
ループ分けした部分パターンベクトルを出力し、グルー
プ分割要求が入力されないときは前記パターンベクトル
をそのまま出力する入力手段と、パターンの種類に応じ
て区分けされ、前記入力手段から出力されるパターンベ
クトルまたは部分パターンベクトルを入力信号とし、該
入力信号と荷重ベクトルとの間の距離及び荷重ベクトル
から求めた反応強度と該荷重ベクトルをそれぞれ出力す
る複数の中間ユニットと、前記入力手段に入力されるパ
ターンベクトルに対応して入力される教師信号に基づき
前記各中間ユニットの荷重ベクトルを学習させる学習部
とを有する中間手段と、前記中間手段の前記各中間ユニ
ットからそれぞれ出力される反応強度を集約して出力信
号を生成し、注視要求が入力されたとき予め定められた
注視率定義に従って該出力信号に重み数を乗じ、出力要
求が入力されたとき該出力信号を最終的な認識結果とし
て出力する出力手段と、前記出力手段からの出力信号に
ついて該出力信号のうち最も値の大きな第1候補と次に
値の大きな第2候補との差が所定のしきい値以下という
フィードバック条件を満たすとき対立候補検出要求を出
し、該フィードバック条件を満さないとき前記出力手段
に前記出力要求を出すフィードバック条件演算部と、前
記パターンを分割した複数の部分領域をグループとして
定義するグループ定義を予め保存したグループ定義デー
タベースと、前記中間手段から出力される反応強度を入
力し、前記対立候補検出要求が入力されたとき前記第1
候補及び第2候補の値をそれぞれ提供した二つの中間ユ
ニットの組を対立候補として検出する対立候補検出部
と、前記対立候補を構成する二つの中間ユニットのそれ
ぞれの荷重ベクトルを入力して該荷重ベクトルを前記グ
ループ定義に従ってグループ毎に比較し、該荷重ベクト
ルのベクトル間距離が最も大きいグループである注視部
分を検出したとき、前記出力手段に対して前記注視要求
を出すと共に前記入力手段に対して前記グループ分割要
求を出力する注視部分検出部とを有するフィードバック
手段とを具備する。
【0023】
【0024】
【0025】
【作用】発明によれば、出力手段からの認識前の出力
信号を入力し、この出力信号が何のパターンを表すかを
認識し、この認識結果が確定的でないときパターンベク
トルの認識の決め手となる注視部分領域を、対立するパ
ターン候補の種類をそれぞれを代表する荷重ベクトルの
比較により検出し、この検出された注視部分領域に注目
して再認識を行うためのフィードバック手段を具備した
したので、if−thenルールを用いることなく、よ
り正確なパターン認識が可能となる。
【0026】
【実施例】以下、図面を参照して本発明の実施例につい
て説明するが、前述した従来例と同一部分または対応す
る部分については同一番号を付し、その詳細な説明は省
略する。また、図を簡略化するため、ベクトル、信号な
どと表記していても1本の線で表現する。ここではパタ
ーン認識として文字認識を例に挙げて説明するが、図形
パターン認識あるいは、文字と画像の組み合わせたパタ
ーンの認識であってもよい。
【0027】図1は、本発明の概略説明を示すブロック
図であり、入力手段1、中間手段2、出力手段3、フィ
ードバック手段4からなり、フィードバック手段4が従
来例と大きく異なり、フィードバック手段4は後述する
フィードバック条件演算部41、対立候補検出部42、
注視部分検出部43、グループ定義データベース44か
ら構成されている。
【0028】入力手段1は、文字パターンベクトルXを
文字パターン単位毎に入力し、入力信号Iを出力する。
ここで、文字パターンベクトルXは、図7に示すように
ドット・パターンで示すことができる。このドット・パ
ターンにおいて、白い部分のドットは‘0’、黒い部分
のドットは‘1’とし、ドットを1次元に展開すれば、
文字パターンベクトルXは例えば次に示すような‘0’
と‘1’からなるベクトルとなる。
【0029】[0,0,1,1,1,1,0,…] 学習時に入力される文字パターンベクトルXには、教師
信号Tが伴う。教師信号Tは、文字パターンベクトルX
が何の文字種(カテゴリ)であるかを装置に教示するた
めのものであり、例えば、数字を学習する装置に、
‘2’である、と教示するには、偽を‘0’、真を
‘1’とし、文字種‘0’から‘9’までに対応する1
0個の‘0’か‘1’かの数字で、 [0,0,1,0,0,0,0,0,0,0] のような教師信号Tを用意する。
【0030】入力信号Iは、文字パターン単位の文字パ
ターンベクトルXと等しいか、あるいは文字パターンベ
クトルXの要素の一部からなる部分ベクトルである。
【0031】中間手段2は、入力信号Iすなわち文字パ
ターンベクトルまたは部分文字パターンベクトルを入力
し、類似度すなわち後述する反応強度Aおよび荷重ベク
トルWを出力する。この場合、前段の処理として中間手
段2内部において入力信号Iは教師信号Tを用いて学習
したり、未学習の入力信号Iが入力されたときは学習は
行なわれない。
【0032】出力手段3は、中間手段2によって出力さ
れる反応強度を集約して出力信号Oを生成し、また出力
要求が入力されたとき出力信号を最終的な認識結果Yと
して出力する。
【0033】フィードバック手段4は、出力信号Oをも
とにフィードバック条件演算部41による再認識が必要
かどうかを判断する。
【0034】このような構成のもとにおいて、文字パタ
ーンベクトルXが入力手段1に入力され、中間手段2に
おいて反応強度Aおよび荷重ベクトルWが求められる。
出力手段3では、中間手段2によって求められた反応強
度Aを集約し、出力信号Oや最終的な出力結果Yを出力
する。この場合、フィードバック手段4が、出力信号O
をもとにフィードバックによる再認識が必要かどうかを
判断し、もし再認識が必要でなければ、出力手段3に対
して出力結果Yを出力するよう出力要求ROを送る。フ
ィードバック手段4が、もしフィードバックによる再認
識が必要であると判断すれば、中間手段2の反応強度A
と荷重ベクトルWをもとに、認識の決め手となる注視部
分領域を、対立するパターン候補の種類をそれぞれ代表
する荷重ベクトルの比較により検出(カテゴリ候補の形
状比較から検出)する。そして、フィードバック手段4
は入力手段1に対してグループ分割要求RD、出力手段
3に注視要求RWを送り、再認識を行うよう要求する。
【0035】この結果、データの文字が、例えば‘2’
と‘7’両方について可能性が高いような、確定的でな
い認識結果の場合でも、知識工学的なifーthenル
ールなしに、対立するカテゴリ候補の形状比較から認識
の決め手となる部分領域を検出し、それに注目して再認
識し、認識結果をより正確な内容に修正することができ
る。
【0036】図2は、図1のより具体的な実施例を示す
ブロック図である。
【0037】入力手段1の記憶ワークメモリ11は、文
字パターンベクトルXを入力し、記憶する。この記憶
は、後述するフィードバックの際(具体的にはフィード
バック手段4から分割要求RDが出力されたとき)に、
文字パターンベクトルXを再入力しなくてすむようにす
るためのものである。入力信号生成部12は、記憶ワー
クメモリ11に入力要求RIを出し、記憶ワークメモリ
11から文字パターンベクトルXを入力て、入力信号
Iを生成し出力する。
【0038】通常、入力信号生成部12は、入力信号I
を文字パターンベクトルXと等しいものとするが、フィ
ードバックの際には、入力信号Iを文字パターンベクト
ルXの部分ベクトル、すなわち文字パターンベクトルX
の要素の一部からなるベクトルとする。
【0039】中間ユニット部21は、入力信号Iを入力
として、各中間ユニット21ijの反応強度Aijを出力す
る。また、中間ユニット部21は、フィードバックの際
に、中間ユニット21ijの荷重ベクトルWijを出力す
る。今、1つの中間ユニット2101に着目すると、中間
ユニット2101は、入力信号Iを入力し、反応強度A01
を出力する。
【0040】ここで、図3を用いて、中間ユニット21
01について説明する。まず、入力信号Iが反応強度計算
部51に入力される。次に、反応強度計算部51では、
荷重ベクトルデータベース52から荷重ベクトルW01
読み込み、以下のような(1)式により、反応強度A01
を求める。
【0041】
【数1】 これは、図4に示されるような曲線である。ここで、D
ijとは、入力信号Iと荷重ベクトルWijの距離例えばユ
ークリッド距離、すなわち、
【0042】
【数2】 である。ただし、Wijn は荷重ベクトルWijの第n番目
の要素、In は入力信号Iの第n番目の要素である。ま
た、‖Wij‖は、荷重ベクトルWijの大きさである。実
際には、あるしきい値θを設け、Aij<θのときは、A
ij=0とする。Aij≧0となるDijの区間を、その中間
ユニット21ijの反応領域と呼ぶ。
【0043】学習部22は、中間ユニット部21の各中
間ユニット21ijの荷重ベクトルWijを修正すること
で、学習データを学習させる。もっとも単純な方法は、
各中間ユニット21ijの荷重ベクトルWijを、入力され
た入力信号Iそのものとすることである。例えば、あら
かじめ反応すべき文字種(カテゴリ)が定められた各中
間ユニット21ijに、学習データを学習させるとする。
学習部22は、各学習データについて教師信号Tを入力
し、その文字種に反応すべき中間ユニット21ijでまだ
荷重ベクトルWijが定まっていないものの中から1つを
選択し、そのユニットに対して学習要求RLを出す。図
3を用いて、中間ユニット2101が学習する様子を説明
する。荷重ベクトル修正部53は、学習要求RLを受け
とると、入力信号生成部12から入力信号Iを入力し、
荷重ベクトルデータベース52から荷重ベクトルW01
入力する。ここでは、荷重ベクトルWijを入力信号Iそ
のものとする学習方法について説明しているから、 W01n ′=In となる。ただし、Wijn ′は修正荷重ベクトルの第n番
目の要素、In は入力信号Iの第n番目の要素である。
そして、荷重ベクトルデータベース52に修正荷重ベク
トルW01′が送られ、 W01n =W01n ′ として、荷重ベクトルW01が保存される。
【0044】出力手段3の出力信号生成部31は、中間
ユニット部21の反応強度Aを集約して、出力信号Oを
出力する。出力信号Oは、文字種ごとに設けられてお
り、入力されたパターンがその文字種である可能性を0
以上1以下の信号の強さで表現している。もっとも単純
な方法は、中間ユニット21ijを反応すべき文字種ごと
に区分けし、それぞれについて反応強度Aijの最大値を
求め、それを出力信号Oとすることである。例えば、図
2で、中間ユニット2101〜21ONが文字種‘0’に反
応すべきユニットだとすると、 O0 =max(A0n),1≦n≦N となる。ただし、Oi は、文字種‘i’である可能性を
示す出力信号Oの要素、Ainは、中間ユニット21in
反応強度である。
【0045】出力信号累積記憶ワークメモリ32は、出
力信号Oを入力し、フィードバックを行わない場合は、 Yi =Oi として、出力結果Yを出力する。ただし、Yi は、入力
されたパターンが文字種‘i’である可能性を最終的に
示す出力結果Yの要素である。上式で示したようにフィ
ードバックを行わない場合は、出力結果Yは、出力信号
Oに等しい。なお、出力信号累積記憶ワークメモリ32
は、出力要求ROを受けなければ出力結果Yを出力しな
い。フィードバックの場合には、出力信号累積記憶ワー
クメモリ32は、出力要求ROを受ける前に、複数回、
出力信号Oを入力し、それらを累積して記憶する。
【0046】フィードバック条件演算部41は、出力信
号Oを入力し、フィードバックを行うかどうかを判定す
る。フィードバックを行うための条件は、少なくとも第
1候補と第2候補の値の差がある閾値以下のときであ
る。ここで、第1候補とは、出力信号Oの要素の中でも
っとも大きな値のもの、第2候補とは、2番目に大きな
値のものを指す。それらの値の差がある閾値以下という
ことは、前述の‘2’と‘7’両方の可能性が高い、の
例のような確定的でない認識結果であることを意味す
る。フィードバック条件を満たさない場合は、出力信号
累積記憶ワークメモリ32に出力要求ROを出す。フィ
ードバック条件を満たす場合は、対立候補検出部42に
対立候補検出要求RAを出す。対立候補検出部42で
は、中間ユニット部21の反応強度Aを入力し、前述の
第1候補、第2候補の値のもっとも強い要因となったユ
ニットを検出する。例えば、前述のような、中間ユニッ
ト21ijを反応すべき文字種ごとに区分けし、それぞれ
について反応強度Aijの最大値を求めることで出力信号
Oを得る方法のもとでは、もっとも強い要因となったユ
ニットは、第1候補、第2候補それぞれついて、その値
を提供した中間ユニットである。それらを、中間ユニッ
ト21F 、中間ユニット21S と呼ぶことにする。ま
た、前述のような2つの中間ユニット21F ,21s
組にして、対立候補Pと呼ぶことにする。実質的には、
対立候補Pは、例えば、 P=(25,75) のような中間ユニット21のユニット番号の組となる。
すなわち、 F=25,S=75 である。
【0047】注視部分検出部43は、対立候補Pを入力
すると、それにしたがって中間ユニット21F ,21s
の荷重ベクトルWF ,WS を中間ユニット部21より入
力し、注視部分を検出する。注視部分とは、パターンを
認識する際に、もっとも有効な特徴を提供するパターン
の部分領域である。これは、人間がパターンを認識する
際に、そのパターンが一見して何であるか判断できない
ときは、パターンのもっとも特徴的な部分に注目する場
合と同じである。注視部分を検出する前の準備として、
部分領域の定義が必要である。
【0048】図5は、部分領域の定義の一例を示したも
のである。図5では、まずパターンを左上、右上、左
下、右下の4つに分割し、それに、パターンの中央部分
の領域を加え、合計5つの部分領域を定義している。部
分領域のことをグループと呼ぶことにする。グループ定
義DGは、グループ定義データベース44に保存され
る。
【0049】図6は、注視部分の検出の例を示したもの
である。図6は、‘2’と‘7’が対立候補Pで、右下
のグループが注視部分として検出された例である。検出
の方法としては、例えば、対立候補Pの中間ユニット2
F ,21s の荷重ベクトルWF ,WS をグループごと
に比較することが挙げられる。比較は、グループごとに
両者の部分ベクトルのベクトル間距離または統計の分散
値を求めることで行う。そして、もっともベクトル間距
離または分散値が大きいグループを注視部分とする。注
視部分検出部43は、グループ定義データベース44か
らグループ定義を読み込み注視部分を検出すると、入力
信号生成部12にグループ分割要求RD、出力信号生成
部31に注視要求RWを出す。
【0050】入力信号生成部12は、グループ分割要求
RDを受けとると、文字パターン記憶ワークメモリ11
に入力要求RIを出し、文字パターンベクトルXを入力
する。そして、グループ定義データベース13よりグル
ープ定義DGを入力し、グループ定義DGにしたがって
文字パターンベクトルXからグループごとの部分ベクト
ルを生成し、順次、入力信号Iとする。すなわち、グル
ープ数が5の場合は、入力信号Iは、5回生成される。
【0051】中間ユニット部21の中間ユニット21ij
は、順次、入力信号Iを入力し、フィードバックでない
場合と同様の処理を行う。ただし、荷重ベクトルW
ijは、入力信号Iが部分ベクトルであることに対応して
部分的に使われ、反応強度Aijが計算される。
【0052】出力信号生成部31は、グループごとに順
次、反応強度Aを入力すると、フィードバックでない場
合と同様の処理で出力信号Oを生成する。ただし、出力
信号Oには、注視率定義データベース33より読み込ま
れた注視率定義DFにしたがって重み数が乗じられる。
すなわち、注視部分のグループに対しては大きな重み数
を、それ以外のグループに対しては小さな重み数を乗じ
ることで、注視を実現している。
【0053】出力信号Oは、グループごとに順次、出力
信号累積記憶ワークメモリ32に送られ、累積され記憶
される。
【0054】そして、すべてのグループの出力信号Oを
受けとると、フィードバック条件演算部41から出力信
号累積記憶ワークメモリ32へ出力要求ROが送られ、
最終的な出力結果Yが出力される。
【0055】以上述べた実施例によれば、出力結果が確
定的でないときに、ifーthenルールを用いること
なしに、対立する文字の種類例えば‘2’と‘7’の形
状比較から、認識の決め手となるパターンの注視部分領
域例えば図6のグループを検出し、そこに注目して再認
識を試みるため、より正確な認識が可能となる。
【0056】本発明によるパターン認識装置の実施例の
能力を確かめるために、認識実験を行った。実験で用い
た学習データは、人工的につくられた300件の数字で
ある。これらを学習するために、中間ユニット部21に
は300個の中間ユニット21ijを用意した。すなわ
ち、 0≦i≦9,1≦j≦N,N=30 である。学習は、実施例で示したような、学習データの
文字パターンベクトルXを荷重ベクトルWijそのものと
する、というもっとも簡単な方法で行った。また、未学
習データは、1000件の手書き数字である。
【0057】従来のフィードバック機構のない手法で
は、出力結果Yが、例えば‘2’と‘7’両方の可能性
が高いというときも、わずかな差で値の大きな方を認識
結果としていた。その結果、例えば‘2’のデータが
‘7’と誤認識されてしまう可能性が高く、安定した認
識を実現することは困難となっていた。
【0058】これに対し本発明によるパターン認識装置
の実施例では、出力結果が確定的でないときに、対立す
るカテゴリ候補の形状比較から、認識の決め手となるパ
ターンの部分領域を検出し、そこに注目して再認識を試
みるため、より正確な認識が可能となった。具体的に
は、従来例と本実施例について未学習データ認識率につ
いて実験した結果、従来例は55.8%であったのに対
し、本実施例は74.3%と高い。
【0059】以上述べた実施例では、入力手段1に入力
されるパターンベクトルとして文字パターンベクトルX
について説明したが、これに限らず画像パターンベクト
ルであってもよく、この場合のパターンベクトルはパタ
ーンをドットの濃淡に対応する数値で表現したものなら
なんでもよい。
【0060】
【発明の効果】本発明によるパターン認識装置によれ
ば、従来のように認識結果が確定的でなく誤認識される
ような場合でも、ifーthenルールを用いることな
く、より正確な認識が可能となり、また、従来のフィー
ドバック手段で用いられた知識工学的なデータベースが
不要であるため、一般的に困難なデータベースの構築を
する必要もなく、カテゴリ数が増えることによるルール
の組合せ爆発が生じることもない。
【図面の簡単な説明】
【図1】本発明のパターン認識装置の概略構成を示すブ
ロック図。
【図2】本発明のパターン認識装置の実施例を示すブロ
ック図。
【図3】図2のユニットの機能を説明するための図。
【図4】図3のユニットの反応特性を説明するための
図。
【図5】パターンの部分領域の定義を説明するための
図。
【図6】パターンの注視部分の検出を説明するための
図。
【図7】従来の文字パターン認識の原理を説明するため
の図。
【図8】従来の文字パターン認識の原理を説明するため
の文字パターンベクトル図。
【図9】従来の数字認識用のニューラルネットの概略構
成を示す図。
【図10】従来の数字認識用のニューラルネットの反応
領域を説明するための図。
【図11】従来のフィードバック機構を用いたパターン
認識装置を説明するための図。
【符号の説明】
1…入力手段、11…文字パターン記憶ワークメモリ、
12…入力信号生成部、13…グループ定義データベー
ス、2…中間手段、21…中間ユニット部、21ij…中
間ユニット、22…学習部、 3…出力手段、31…出
力信号生成部、32…出力信号累積記憶ワークメモリ、
33…注視率定義データベース、4,4A…フィードバ
ック手段、41…フィードバック条件演算部、42…対
立候補検出部、43…注視部分検出部、44…グループ
定義データベース、51…反応強度計算部、52…荷重
ベクトルデータベース、53…荷重ベクトル修正部、5
4…グループ定義データベース。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文字、図形等のパターンベクトルをパター
    ン単位毎に入力し、グループ分割要求が入力されたとき
    は前記パターンベクトルをグループ分けした部分パター
    ンベクトルを出力し、グループ分割要求が入力されない
    ときは前記パターンベクトルをそのまま出力する入力手
    段と、 パターンの種類に応じて区分けされ、前記入力手段から
    出力されるパターンベクトルまたは部分パターンベクト
    ルを入力信号とし、該入力信号と荷重ベクトルとの間の
    距離及び荷重ベクトルから求めた反応強度と該荷重ベク
    トルをそれぞれ出力する複数の中間ユニットと、前記入
    力手段に入力されるパターンベクトルに対応して入力さ
    れる教師信号に基づき前記各中間ユニットの荷重ベクト
    ルを学習させる学習部とを有する中間手段と、 前記中間手段の前記各中間ユニットからそれぞれ出力さ
    れる反応強度を集約して出力信号を生成し、注視要求が
    入力されたとき予め定められた注視率定義に従って該出
    力信号に重み数を乗じ、出力要求が入力されたとき該出
    力信号を最終的な認識結果として出力する出力手段と、 前記出力手段からの出力信号について該出力信号のうち
    最も値の大きな第1候補と次に値の大きな第2候補との
    差が所定のしきい値以下というフィードバック条件を満
    たすとき対立候補検出要求を出し、該フィードバック条
    件を満さないとき前記出力手段に前記出力要求を出すフ
    ィードバック条件演算部と、前記パターンを分割した複
    数の部分領域をグループとして定義するグループ定義を
    予め保存したグループ定義データベースと、前記中間手
    段から出力される反応強度を入力し、前記対立候補検出
    要求が入力されたとき前記第1候補及び第2候補の値を
    それぞれ提供した二つの中間ユニットの組を対立候補と
    して検出する対立候補検出部と、前記対立候補を構成す
    る二つの中間ユニットのそれぞれの荷重ベクトルを入力
    して該荷重ベクトルを前記グループ定義に従ってグルー
    プ毎に比較し、該荷重ベクトルのベクトル間距離が最も
    大きいグループである注視部分を検出したとき、前記出
    力手段に対して前記注視要求を出すと共に前記入力手段
    に対して前記グループ分割要求を出力する注視部分検出
    部とを有するフィードバック手段とを具備するパターン
    認識装置。
JP27716694A 1994-10-18 1994-10-18 パターン認識装置 Expired - Lifetime JP3222699B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27716694A JP3222699B2 (ja) 1994-10-18 1994-10-18 パターン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27716694A JP3222699B2 (ja) 1994-10-18 1994-10-18 パターン認識装置

Publications (2)

Publication Number Publication Date
JPH08115387A JPH08115387A (ja) 1996-05-07
JP3222699B2 true JP3222699B2 (ja) 2001-10-29

Family

ID=17579728

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27716694A Expired - Lifetime JP3222699B2 (ja) 1994-10-18 1994-10-18 パターン認識装置

Country Status (1)

Country Link
JP (1) JP3222699B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102364692B1 (ko) * 2020-04-10 2022-02-18 엘지전자 주식회사 헤어드라이어
US11576474B2 (en) 2020-04-10 2023-02-14 Lg Electronics Inc. Diffuser and hair dryer having the same
US11633028B2 (en) 2020-04-10 2023-04-25 Lg Electronics Inc. Diffuser and hair dryer having a diffuser
US11647822B2 (en) 2020-04-10 2023-05-16 Lg Electronics Inc. Diffuser and hair dryer having a diffuser
US11832699B2 (en) 2020-04-10 2023-12-05 Lg Electronics Inc. Diffuser and hair dryer having a diffuser
US11844408B2 (en) 2020-04-10 2023-12-19 Lg Electronics Inc. Diffuser and hair dryer having a diffuser
US12004624B2 (en) 2020-04-10 2024-06-11 Lg Electronics Inc. Hair dryer

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102364692B1 (ko) * 2020-04-10 2022-02-18 엘지전자 주식회사 헤어드라이어
US11576474B2 (en) 2020-04-10 2023-02-14 Lg Electronics Inc. Diffuser and hair dryer having the same
US11589662B2 (en) 2020-04-10 2023-02-28 Lg Electronics Inc. Hair dryer
US11633028B2 (en) 2020-04-10 2023-04-25 Lg Electronics Inc. Diffuser and hair dryer having a diffuser
US11647822B2 (en) 2020-04-10 2023-05-16 Lg Electronics Inc. Diffuser and hair dryer having a diffuser
US11832699B2 (en) 2020-04-10 2023-12-05 Lg Electronics Inc. Diffuser and hair dryer having a diffuser
US11844408B2 (en) 2020-04-10 2023-12-19 Lg Electronics Inc. Diffuser and hair dryer having a diffuser
US12004624B2 (en) 2020-04-10 2024-06-11 Lg Electronics Inc. Hair dryer

Also Published As

Publication number Publication date
JPH08115387A (ja) 1996-05-07

Similar Documents

Publication Publication Date Title
Wu et al. Self-critical reasoning for robust visual question answering
US5299284A (en) Pattern classification using linear programming
US7308133B2 (en) System and method of face recognition using proportions of learned model
JP2940933B2 (ja) パターン認識方式
US7295687B2 (en) Face recognition method using artificial neural network and apparatus thereof
JP5207870B2 (ja) 次元削減方法、パターン認識用辞書生成装置、及びパターン認識装置
US5832108A (en) Pattern recognition method using a network and system therefor
Rajani et al. Stacking with auxiliary features for visual question answering
JPH02238588A (ja) 文字認識装置
EP0574936B1 (en) Method and apparatus for input classification using non-spherical neurons
JP3222699B2 (ja) パターン認識装置
CN112949954B (zh) 基于识别学习建立财务欺诈识别模型的方法
Batista et al. Improving performance of HMM-based off-line signature verification systems through a multi-hypothesis approach
JPH08227408A (ja) ニューラルネットワーク
Frank et al. Pretopological approach for supervised learning
US7181062B2 (en) Modular classification architecture for a pattern recognition application
JP3083562B2 (ja) 文字認識機構
Howell Face unit radial basis function networks
Wang et al. Interpret neural networks by extracting critical subnetworks
CN111523649B (zh) 针对业务模型进行数据预处理的方法及装置
Xu et al. Handwritten Bangla digit recognition using hierarchical Bayesian network
Altınçay et al. An information theoretic framework for weight estimation in the combination of probabilistic classifiers for speaker identification
JPH02210589A (ja) 文字認識装置
JP2880383B2 (ja) パターン認識装置および方法
JP2778194B2 (ja) パターン認識方法および装置

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080817

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080817

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090817

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100817

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100817

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110817

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120817

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120817

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130817

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term