JPH08115387A - パターン認識装置 - Google Patents

パターン認識装置

Info

Publication number
JPH08115387A
JPH08115387A JP6277166A JP27716694A JPH08115387A JP H08115387 A JPH08115387 A JP H08115387A JP 6277166 A JP6277166 A JP 6277166A JP 27716694 A JP27716694 A JP 27716694A JP H08115387 A JPH08115387 A JP H08115387A
Authority
JP
Japan
Prior art keywords
pattern
vector
input
unit
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6277166A
Other languages
English (en)
Other versions
JP3222699B2 (ja
Inventor
Naoki Natori
直毅 名取
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GIJUTSU KENKYU KUMIAI SHINJOHO SHIYORI KAIHATSU KIKO
Toshiba Corp
Original Assignee
GIJUTSU KENKYU KUMIAI SHINJOHO SHIYORI KAIHATSU KIKO
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GIJUTSU KENKYU KUMIAI SHINJOHO SHIYORI KAIHATSU KIKO, Toshiba Corp filed Critical GIJUTSU KENKYU KUMIAI SHINJOHO SHIYORI KAIHATSU KIKO
Priority to JP27716694A priority Critical patent/JP3222699B2/ja
Publication of JPH08115387A publication Critical patent/JPH08115387A/ja
Application granted granted Critical
Publication of JP3222699B2 publication Critical patent/JP3222699B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】認識結果が確定的でなく誤認識されるような場
合でも、ifーthenルールを用いずに、より正確な
認識が可能となるパターン認識装置を得る。 【構成】パターンベクトルXをパターン単位毎に入力
し、これと対応する荷重ベクトルの距離ならびに該荷重
ベクトルにより求められる反応強度Aを集約し、この集
約したAによりXの認識を行ない、この認識結果を出力
手段3に出力するもので、3からの認識前の出力信号を
入力し、この出力信号が何のパターンを表すかを認識
し、この認識結果が確定的でないときXの認識の決め手
となる注視部分領域を、対立するパターン候補の種類を
それぞれを代表する荷重ベクトルの比較により検出し、
この検出された注視部分領域に注目して再認識を行うた
めのフィードバック手段4を具備したもの。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字パターン、図形パ
ターン(以下単にパターンと称する)等を認識するパタ
ーン認識装置に関する。
【0002】
【従来の技術】この種従来のパターン認識装置として、
パターンをベクトルと見なし、ベクトル空間内での分布
領域を学習することにより、該入力パターンを認識する
ものがある。
【0003】これについて、図7を参照して説明する。
ここでは文字認識を例に挙げて説明する。文字のパター
ンは、図7に示すようにドット・パターンで示すことが
できる。このドット・パターンにおいて、白い部分のド
ットは‘0’、黒い部分のドットは‘1’とし、ドット
を1次元に展開すれば、文字パターンは例えば次に示す
ような‘0’と‘1’からなるベクトルとなる。
【0004】[0,0,1,1,1,1,0,…] 今、このような文字パターンのベクトルの任意のものを
xと書くと、パターン認識装置は、入力された文字パタ
ーンがベクトル空間内のどのような領域にあるかで、こ
の入力文字を分類する。特定の文字種がベクトル空間内
のどの領域を占めるかは、一般に現場から収集した多数
の文字データを用いて学習する。
【0005】図8は、このような状況を説明するための
ものであるが、パターン空間をベクトルの次元1,2か
らなる2次元と仮定している。図では文字パターンベク
トルXが‘4’と分類されている場合を示している。
【0006】図9は、最近注目されているニューラルネ
ットによる文字認識の場合の原理を説明するための図で
あり、これも前述の文字認識と同一原理である。図9
は、数字認識用のニューラルネットの一例であり、これ
は入力ユニット層IUと、中間ユニット層MUと、出力
ユニット層OUを有する階層型のニューラルネットであ
る。
【0007】入力ユニット層IUの各ユニットには前述
の文字パターンベクトルXの各要素の値が入力される
が、この場合入力ユニット層IUのユニットの数は入力
文字パターンベクトルXの次元数に一致する。
【0008】ニューラルネットでは、多くの文字パター
ンを学習するが、それは前述のような文字パターンベク
トルの空間において、‘0’と見なせるベクトル空間の
どの領域を占めるか、‘1’と見なせるベクトルは空間
のどの領域を占めるか、など、ベクトル空間を‘0’,
‘1’,‘2’,…,‘9’に対応する領域に分割して
いることになる。一般に、そのような領域は、超球と呼
ばれる中間ユニット層MUのユニットの反応領域を単位
として構成される。
【0009】図10は従来の数字認識用ニューラルネッ
トの反応領域を説明するための図である。図10は、図
8と同様、パターン空間を仮に2次元平面として表した
ものであり、超球は、円で表されている。ニューラルネ
ットは、これら超球の反応領域の組み合わせでパターン
の分布領域を学習していると言える。
【0010】図9の出力ユニット層OUの各ユニット
は、文字種に対応するものであり、この場合には、
‘0’,‘1’,‘2’,…,‘9’に対応する10個
のユニットである。一般に、各出力ユニットは、0以上
1以下の実数値を出力し、それが該文字パターンベクト
ルXのカテゴリである可能性の高さを示している。通
常、判定では最も高い値を出した出力ユニットを選択す
る。
【0011】以上述べたパターン認識装置は、既に文字
認識などに利用されているが、出力結果が確定的でない
とき、例えば手書きの崩れた‘2’の文字パターンベク
トルXの入力に対して、文字種‘2’の可能性を出す出
力ユニットOU2 と文字種‘7’の可能性を示す出力ユ
ニットOU7 の出力値がほぼ等しいときは、わずかの差
で高い値の方を判定結果としてしまい、‘2’の文字パ
ターンベクトルXを‘7’である、と判定する危険性が
ある。
【0012】そこで、従来では必要なときにフィードバ
ック手段を用いて判定結果を修正するものがある。図1
1は、従来のフィードバック手段を用いたパターン認識
装置を示したものであり、これは入力手段1、中間手段
2、出力手段3、フィードバック手段4Aを備えてい
る。
【0013】入力手段1は、文字パターンベクトルXを
入力し、入力信号Iを出力する。文字パターンベクトル
Xは、図7に示すようにドット・パターンで示すことが
できる。このドット・パターンにおいて、白い部分のド
ットは‘0’、黒い部分のドットは‘1’とし、ドット
を1次元に展開すれば、文字パターンベクトルXは例え
ば次に示すような‘0’と‘1’からなるベクトルとな
る。
【0014】[0,0,1,1,1,1,0,…] 学習時に入力される文字パターンベクトルXには、教師
信号Tが伴う。教師信号Tは、文字パターンベクトルX
が何の文字種であるかを装置に教示するためのものであ
り、例えば、数字を学習する装置に、‘2’である、と
教示するには、偽を‘0’、真を‘1’とし、文字種
‘0’から‘9’までに対応する10個の‘0’か
‘1’かの数字で、 [0,0,1,0,0,0,0,0,0,0] のような教師信号Tを用意する。
【0015】入力信号Iは、文字パターンベクトルXと
等しいか、あるいは文字パターンベクトルXの要素の一
部からなる部分ベクトルである。
【0016】中間手段2は、入力信号Iを、教師信号T
を用いて学習したり、未学習の入力信号Iが入力された
ときに類似度を分析し反応強度Aを出力する。
【0017】出力手段3は、中間手段2によって出され
る入力信号Iを集約し、出力信号Oや最終的な出力結果
Yを出力する。
【0018】フィードバック手段4Aは、知識工学的な
データベースを備え、出力手段3からの出力信号Oをも
とに再認識が必要かどうかの判断を行ない、再認識が必
要ないと判断したとき、出力手段3に対して出力結果Y
を出力するよう出力要求ROを出力する。そして、フィ
ードバック手段4Aは、再認識が必要であると判断した
場合(未学習データの場合)には、知識工学的なデータ
ベースを用いて入力手段1に対してグループ分割要求R
Dを出力し、また出力手段3に対して注視要求RWを出
力する。
【0019】
【発明が解決しようとする課題】ここで、従来のフィー
ドバック手段4Aに有する知識工学的なデータベース
は、以下のようなものである。例えば、‘2’と‘7’
両方の可能性が高いときはパターンの右下の部分領域に
注目して再認識する、というようなルールをデータベー
スとして用意し、これを利用するものである。知識工学
的なデータベースは、‘2’と‘7’という文字パター
ンの構造的な違いが文字領域の右下部分に最も多く見ら
れるという先験的な知識を用いている。
【0020】しかし、すべてのカテゴリ(文字の種類)
の組について、構造的な違いを見い出すことは、一般的
には困難であり、また、カテゴリ数が増えると組合せ爆
発を起こす。
【0021】そこで、本発明は、出力手段の出力結果を
確定的でないとき、ifーthenルールを用いること
なく、正しくパターン認識ができるパターン認識装置の
提供することを目的とする。
【0022】
【課題を解決するための手段】前記目的を達成するた
め、請求項1に対応する発明は、文字、図形等のパター
ンベクトルをパターン単位毎に入力し、このパターン単
位毎の荷重ベクトルならびにこの荷重ベクトルの距離か
らパターン単位のカテゴリの全てについて反応強度を求
め、この反応強度により前記パターンベクトルの認識を
行ない、この認識結果を出力手段により出力するパター
ン認識装置において、前記出力手段からの最終認識前の
出力信号を入力し、この出力信号のうち少なくとも第1
番目、第2番目に大きなもの同士を比較し、この差が所
定のしきい値以下のとき前記比較を行なったパターンベ
クトルに対してそれぞれ複数のグループに分割して複数
の部分パターンベクトルとし、この各部分パターンベク
トルのうちパターンベクトルの認識の決め手となる注視
部分領域を前記荷重ベクトルの比較により検出し、この
注視部分領域に注目して前記出力手段の最終認識出力と
するフィードバック手段を具備したパターン認識装置で
ある。
【0023】前記目的を達成するため、請求項2に対応
する発明は、文字、図形等のパターンベクトルをパター
ン単位毎に入力し、このパターン単位のパターンベクト
ルを出力し、またはグループ分割要求が入力されたとき
グループ定義データベースに格納されているグループ定
義に従ってパターン単位のパターンベクトルをグループ
分けし、このグループ分けされた部分パターンベクトル
を出力する入力手段と、パターンの種類毎に区分けした
複数の中間ユニットを備え、前記入力手段から出力され
るパターンベクトルまたは前記部分パターンベクトルを
前記各中間ユニットに入力し、グループ毎に定義された
荷重ベクトルおよびこの荷重ベクトルの距離から求めた
反応強度および前記荷重ベクトルをそれぞれ出力する中
間手段と、この中間手段からの反応強度を集約し、この
集約した反応強度を認識前の出力信号として出力すると
共に、出力要求があったとき認識後の最終的な認識結果
を出力し、さらに注視要求が入力されたとき注視率定義
に従って重み数を乗じる出力手段と、この出力手段から
の認識前の出力信号を入力し、この出力信号のうち少な
くとも最も大きな値の第1候補と、次に大きな値の第2
候補の差が所定のしきい値以下のフィードバック条件を
満たすとき対立候補検出要求を出し、前記フィードバッ
ク条件を満さないとき前記出力手段に出力要求を出すフ
ィードバック条件演算部と、前記パターンベクトルを認
識する際に有効な複数に分割したグループ定義を予め保
存したグループ定義データベースと、前記中間手段から
の反応強度を入力し、前記第1候補と前記第2候補の値
の最も強い要因の対立候補を検出する対立候補検出部
と、この対立候補検出部からの対立候補を入力し、前記
中間手段からの荷重ベクトルを入力し、前記グループ定
義データベースからのグループ定義を読み出し、前記入
力手段に対してグループ分割要求を出力すると共に、前
記出力手段に対して注視要求を出す注視部分検出部とか
らなるフィードバック手段と、を具備したパターン認識
装置である。
【0024】前記目的を達成するため、請求項6に対応
する発明は、入力手段と、中間手段と、出力手段と、フ
ィードバック手段からなり、前記入力手段は、文字パタ
ーン、画像パターン等のパターンベクトルを記憶し、入
力要求が入力されたとき前記記憶されたパターンベクト
ルを出力する記憶ワークメモリと、前記パターンベクト
ルを認識する際に有効な複数に分割したグループ定義を
保存し、この保存したグループ定義をグループ分割要求
が入力されたとき読み出し可能なグループ定義データベ
ースと、前記記憶ワークメモリに対して入力要求を出し
前記記憶ワークメモリに記憶されたパターンベクトルを
読み出しこれを出力し、またグループ分割要求が入力さ
れたとき前記記憶ワークメモリに記憶されたパターンベ
クトルを、前記グループ定義データベースのグループ定
義に基づき部分パターンベクトルを生成しこれを出力す
る入力信号生成部とから構成され、前記中間手段は、前
記パターンの種類に応じた個数の複数の中間ユニットと
学習部を備え、前記各中間ユニットは、荷重ベクトルを
保存し、かつこの保存データを修正可能な荷重ベクトル
データベースと、前記パターンベクトルを認識する際に
有効な複数に分割したグループ定義を保存し、この保存
したグループ定義を読み出し可能なグループ定義データ
ベースと、このグループ定義データベースのグループ毎
に定義された前記荷重ベクトルデータベースの荷重ベク
トルを入力し、各グループ毎に前記荷重ベクトルの距離
と前記入力手段から出力されるパターンベクトルから反
応強度を計算して出力する反応強度計算部と、この反応
強度計算部に入力される荷重ベクトルを、学習要求があ
ったとき前記入力手段から出力されるパターンベクトル
に基づき修正し、この修正した荷重ベクトルを前記反応
強度計算部に入力する荷重ベクトル修正部とから構成さ
れ、前記学習部は前記入力手段から出力されるパターン
ベクトルに対応して入力される教師信号に基づき前記各
中間ユニットの荷重ベクトルを学習しこれを前記各中間
ユニットの荷重ベクトルとして出力する学習部とから構
成され、前記出力手段は、前記反応強度計算部からの反
応強度を集約し出力信号を出力する出力信号生成部と、
この出力信号生成部からの出力信号を記憶し、出力要求
が入力されたとき出力信号を出力する出力信号累積記憶
ワークメモリと、注視率定義が格納され注視要求が入力
されたとき前記出力信号生成部からの出力信号に重みが
乗じられる注視率定義データベースとから構成され、前
記フィードバック手段は、前記出力信号生成部からの認
識前の出力信号を入力し、この出力信号のうち少なくと
も第1番目の大きな値の第1候補と、第2番目の大きな
値の第2候補を比較し、この差が所定のしきい値以下の
とき対立候補検出要求を出し、フィードバック条件を満
たすとき前記出力手段に出力要求を出すフィードバック
条件演算部と、前記パターンベクトルを認識する際に有
効な複数に分割したグループ定義を予め保存したグルー
プ定義データベースと、前記反応強度計算部からの反応
強度を入力し、前記第1候補と前記第2候補の値の最も
強い要因の対立候補を検出する対立候補検出部と、この
対立候補検出部からの対立候補を入力し、前記中間手段
からの荷重ベクトルを入力し、前記グループ定義データ
ベースからのグループ定義を読みだし、前記入力手段に
対してグループ分割要求を出力すると共に、前記出力手
段に対して注視要求を出す注視部分検出部とから構成さ
れたパターン認識装置である。
【0025】
【作用】請求項1、請求項2、請求項6のいずれか一つ
に記載の発明によれば、出力手段からの認識前の出力信
号を入力し、この出力信号が何のパターンを表すかを認
識し、この認識結果が確定的でないときパターンベクト
ルの認識の決め手となる注視部分領域を、対立するパタ
ーン候補の種類をそれぞれを代表する荷重ベクトルの比
較により検出し、この検出された注視部分領域に注目し
て再認識を行うためのフィードバック手段を具備したし
たので、ifーthenルールを用いることなく、より
正確なパターン認識が可能となる。
【0026】
【実施例】以下、図面を参照して本発明の実施例につい
て説明するが、前述した従来例と同一部分または対応す
る部分については同一番号を付し、その詳細な説明は省
略する。また、図を簡略化するため、ベクトル、信号な
どと表記していても1本の線で表現する。ここではパタ
ーン認識として文字認識を例に挙げて説明するが、図形
パターン認識あるいは、文字と画像の組み合わせたパタ
ーンの認識であってもよい。
【0027】図1は、本発明の概略説明を示すブロック
図であり、入力手段1、中間手段2、出力手段3、フィ
ードバック手段4からなり、フィードバック手段4が従
来例と大きく異なり、フィードバック手段4は後述する
フィードバック条件演算部41、対立候補検出部42、
注視部分検出部43、グループ定義データベース44か
ら構成されている。
【0028】入力手段1は、文字パターンベクトルXを
文字パターン単位毎に入力し、入力信号Iを出力する。
ここで、文字パターンベクトルXは、図7に示すように
ドット・パターンで示すことができる。このドット・パ
ターンにおいて、白い部分のドットは‘0’、黒い部分
のドットは‘1’とし、ドットを1次元に展開すれば、
文字パターンベクトルXは例えば次に示すような‘0’
と‘1’からなるベクトルとなる。
【0029】[0,0,1,1,1,1,0,…] 学習時に入力される文字パターンベクトルXには、教師
信号Tが伴う。教師信号Tは、文字パターンベクトルX
が何の文字種(カテゴリ)であるかを装置に教示するた
めのものであり、例えば、数字を学習する装置に、
‘2’である、と教示するには、偽を‘0’、真を
‘1’とし、文字種‘0’から‘9’までに対応する1
0個の‘0’か‘1’かの数字で、 [0,0,1,0,0,0,0,0,0,0] のような教師信号Tを用意する。
【0030】入力信号Iは、文字パターン単位の文字パ
ターンベクトルXと等しいか、あるいは文字パターンベ
クトルXの要素の一部からなる部分ベクトルである。
【0031】中間手段2は、入力信号Iすなわち文字パ
ターンベクトルまたは部分文字パターンベクトルを入力
し、類似度すなわち後述する反応強度Aおよび荷重ベク
トルWを出力する。この場合、前段の処理として中間手
段2内部において入力信号Iは教師信号Tを用いて学習
したり、未学習の入力信号Iが入力されたときは学習は
行なわれない。
【0032】出力手段3は、中間手段2によって出力さ
れる反応強度を集約し、認識前の出力信号Oおよび認識
後の最終的な出力結果Yを出力する。
【0033】フィードバック手段4は、出力信号Oをも
とにフィードバック条件演算部41による再認識が必要
かどうかを判断する。
【0034】このような構成のもとにおいて、文字パタ
ーンベクトルXが入力手段1に入力され、中間手段2に
おいて反応強度Aおよび荷重ベクトルWが求められる。
出力手段3では、中間手段2によって求められた反応強
度Aを集約し、出力信号Oや最終的な出力結果Yを出力
する。この場合、フィードバック手段4が、出力信号O
をもとにフィードバックによる再認識が必要かどうかを
判断し、もし再認識が必要でなければ、出力手段3に対
して出力結果Yを出力するよう出力要求ROを送る。フ
ィードバック手段4が、もしフィードバックによる再認
識が必要であると判断すれば、中間手段2の反応強度A
と荷重ベクトルWをもとに、認識の決め手となる注視部
分領域を、対立するパターン候補の種類をそれぞれ代表
する荷重ベクトルの比較により検出(カテゴリ候補の形
状比較から検出)する。そして、フィードバック手段4
は入力手段1に対してグループ分割要求RD、出力手段
3に注視要求RWを送り、再認識を行うよう要求する。
【0035】この結果、データの文字が、例えば‘2’
と‘7’両方について可能性が高いような、確定的でな
い認識結果の場合でも、知識工学的なifーthenル
ールなしに、対立するカテゴリ候補の形状比較から認識
の決め手となる部分領域を検出し、それに注目して再認
識し、認識結果をより正確な内容に修正することができ
る。
【0036】図2は、図1のより具体的な実施例を示す
ブロック図である。
【0037】入力手段1の記憶ワークメモリ11は、文
字パターンベクトルXを入力し、記憶する。この記憶
は、後述するフィードバックの際(具体的にはフィード
バック手段4から分割要求RDが出力されたとき)に、
文字パターンベクトルXを再入力しなくてすむようにす
るためのものである。入力信号生成部12は、記憶ワー
クメモリ11に入力要求RIを出し、文字パターンベク
トルXを入力て、入力信号Iを生成し出力する。
【0038】通常、入力信号生成部12は、入力信号I
を文字パターンベクトルXと等しいものとするが、フィ
ードバックの際には、入力信号Iを文字パターンベクト
ルXの部分ベクトル、すなわち文字パターンベクトルX
の要素の一部からなるベクトルとする。
【0039】中間ユニット部21は、入力信号Iを入力
として、各中間ユニット21ijの反応強度Aijを出力す
る。また、中間ユニット部21は、フィードバックの際
に、中間ユニット21ijの荷重ベクトルWijを出力す
る。今、1つの中間ユニット2101に着目すると、中間
ユニット2101は、入力信号Iを入力し、反応強度A01
を出力する。
【0040】ここで、図3を用いて、中間ユニット21
01について説明する。まず、入力信号Iが反応強度計算
部51に入力される。次に、反応強度計算部51では、
荷重ベクトルデータベース52から荷重ベクトルW01
読み込み、以下のような(1)式により、反応強度A01
を求める。
【0041】
【数1】 これは、図4に示されるような曲線である。ここで、D
ijとは、入力信号Iと荷重ベクトルWijの距離例えばユ
ークリッド距離、すなわち、
【0042】
【数2】 である。ただし、Wijn は荷重ベクトルWijの第n番目
の要素、In は入力信号Iの第n番目の要素である。ま
た、‖Wij‖は、荷重ベクトルWijの大きさである。実
際には、あるしきい値θを設け、Aij<θのときは、A
ij=0とする。Aij≧0となるDijの区間を、その中間
ユニット21ijの反応領域と呼ぶ。
【0043】学習部22は、中間ユニット部21の各中
間ユニット21ijの荷重ベクトルWijを修正すること
で、学習データを学習させる。もっとも単純な方法は、
各中間ユニット21ijの荷重ベクトルWijを、入力され
た入力信号Iそのものとすることである。例えば、あら
かじめ反応すべき文字種(カテゴリ)が定められた各中
間ユニット21ijに、学習データを学習させるとする。
学習部22は、各学習データについて教師信号Tを入力
し、その文字種に反応すべき中間ユニット21ijでまだ
荷重ベクトルWijが定まっていないものの中から1つを
選択し、そのユニットに対して学習要求RLを出す。図
3を用いて、中間ユニット2101が学習する様子を説明
する。荷重ベクトル修正部53は、学習要求RLを受け
とると、入力信号生成部12から入力信号Iを入力し、
荷重ベクトルデータベース52から荷重ベクトルW01
入力する。ここでは、荷重ベクトルWijを入力信号Iそ
のものとする学習方法について説明しているから、 W01n ′=In となる。ただし、Wijn ′は修正荷重ベクトルの第n番
目の要素、In は入力信号Iの第n番目の要素である。
そして、荷重ベクトルデータベース52に修正荷重ベク
トルW01′が送られ、 W01n =W01n ′ として、荷重ベクトルW01が保存される。
【0044】出力手段3の出力信号生成部31は、中間
ユニット部21の反応強度Aを集約して、出力信号Oを
出力する。出力信号Oは、文字種ごとに設けられてお
り、入力されたパターンがその文字種である可能性を0
以上1以下の信号の強さで表現している。もっとも単純
な方法は、中間ユニット21ijを反応すべき文字種ごと
に区分けし、それぞれについて反応強度Aijの最大値を
求め、それを出力信号Oとすることである。例えば、図
2で、中間ユニット2101〜21ONが文字種‘0’に反
応すべきユニットだとすると、 O0 =max(A0n),1≦n≦N となる。ただし、Oi は、文字種‘i’である可能性を
示す出力信号Oの要素、Ainは、中間ユニット21in
反応強度である。
【0045】出力信号累積記憶ワークメモリ32は、出
力信号Oを入力し、フィードバックを行わない場合は、 Yi =Oi として、出力結果Yを出力する。ただし、Yi は、入力
されたパターンが文字種‘i’である可能性を最終的に
示す出力結果Yの要素である。上式で示したようにフィ
ードバックを行わない場合は、出力結果Yは、出力信号
Oに等しい。なお、出力信号累積記憶ワークメモリ32
は、出力要求ROを受けなければ出力結果Yを出力しな
い。フィードバックの場合には、出力信号累積記憶ワー
クメモリ32は、出力要求ROを受ける前に、複数回、
出力信号Oを入力し、それらを累積して記憶する。
【0046】フィードバック条件演算部41は、出力信
号Oを入力し、フィードバックを行うかどうかを判定す
る。フィードバックを行うための条件は、少なくとも第
1候補と第2候補の値の差がある閾値以下のときであ
る。ここで、第1候補とは、出力信号Oの要素の中でも
っとも大きな値のもの、第2候補とは、2番目に大きな
値のものを指す。それらの値の差がある閾値以下という
ことは、前述の‘2’と‘7’両方の可能性が高い、の
例のような確定的でない認識結果であることを意味す
る。フィードバック条件を満たさない場合は、出力信号
累積記憶ワークメモリ32に出力要求ROを出す。フィ
ードバック条件を満たす場合は、対立候補検出部42に
対立候補検出要求RAを出す。対立候補検出部42で
は、中間ユニット部21の反応強度Aを入力し、前述の
第1候補、第2候補の値のもっとも強い要因となったユ
ニットを検出する。例えば、前述のような、中間ユニッ
ト21ijを反応すべき文字種ごとに区分けし、それぞれ
について反応強度Aijの最大値を求めることで出力信号
Oを得る方法のもとでは、もっとも強い要因となったユ
ニットは、第1候補、第2候補それぞれついて、その値
を提供した中間ユニットである。それらを、中間ユニッ
ト21F 、中間ユニット21S と呼ぶことにする。ま
た、前述のような2つの中間ユニット21F ,21s
組にして、対立候補Pと呼ぶことにする。実質的には、
対立候補Pは、例えば、 P=(25,75) のような中間ユニット21のユニット番号の組となる。
すなわち、 F=25,S=75 である。
【0047】注視部分検出部43は、対立候補Pを入力
すると、それにしたがって中間ユニット21F ,21s
の荷重ベクトルWF ,WS を中間ユニット部21より入
力し、注視部分を検出する。注視部分とは、パターンを
認識する際に、もっとも有効な特徴を提供するパターン
の部分領域である。これは、人間がパターンを認識する
際に、そのパターンが一見して何であるか判断できない
ときは、パターンのもっとも特徴的な部分に注目する場
合と同じである。注視部分を検出する前の準備として、
部分領域の定義が必要である。
【0048】図5は、部分領域の定義の一例を示したも
のである。図5では、まずパターンを左上、右上、左
下、右下の4つに分割し、それに、パターンの中央部分
の領域を加え、合計5つの部分領域を定義している。部
分領域のことをグループと呼ぶことにする。グループ定
義DGは、グループ定義データベース44に保存され
る。
【0049】図6は、注視部分の検出の例を示したもの
である。図6は、‘2’と‘7’が対立候補Pで、右下
のグループが注視部分として検出された例である。検出
の方法としては、例えば、対立候補Pの中間ユニット2
F ,21s の荷重ベクトルWF ,WS をグループごと
に比較することが挙げられる。比較は、グループごとに
両者の部分ベクトルのベクトル間距離または統計の分散
値を求めることで行う。そして、もっともベクトル間距
離または分散値が大きいグループを注視部分とする。注
視部分検出部43は、グループ定義データベース44か
らグループ定義を読み込み注視部分を検出すると、入力
信号生成部12にグループ分割要求RD、出力信号生成
部31に注視要求RWを出す。
【0050】入力信号生成部12は、グループ分割要求
RDを受けとると、文字パターン記憶ワークメモリ11
に入力要求RIを出し、文字パターンベクトルXを入力
する。そして、グループ定義データベース13よりグル
ープ定義DGを入力し、グループ定義DGにしたがって
文字パターンベクトルXからグループごとの部分ベクト
ルを生成し、順次、入力信号Iとする。すなわち、グル
ープ数が5の場合は、入力信号Iは、5回生成される。
【0051】中間ユニット部21の中間ユニット21ij
は、順次、入力信号Iを入力し、フィードバックでない
場合と同様の処理を行う。ただし、荷重ベクトルW
ijは、入力信号Iが部分ベクトルであることに対応して
部分的に使われ、反応強度Aijが計算される。
【0052】出力信号生成部31は、グループごとに順
次、反応強度Aを入力すると、フィードバックでない場
合と同様の処理で出力信号Oを生成する。ただし、出力
信号Oには、注視率定義データベース33より読み込ま
れた注視率定義DFにしたがって重み数が乗じられる。
すなわち、注視部分のグループに対しては大きな重み数
を、それ以外のグループに対しては小さな重み数を乗じ
ることで、注視を実現している。
【0053】出力信号Oは、グループごとに順次、出力
信号累積記憶ワークメモリ32に送られ、累積され記憶
される。
【0054】そして、すべてのグループの出力信号Oを
受けとると、フィードバック条件演算部41から出力信
号累積記憶ワークメモリ32へ出力要求ROが送られ、
最終的な出力結果Yが出力される。
【0055】以上述べた実施例によれば、出力結果が確
定的でないときに、ifーthenルールを用いること
なしに、対立する文字の種類例えば‘2’と‘7’の形
状比較から、認識の決め手となるパターンの注視部分領
域例えば図6のグループを検出し、そこに注目して再認
識を試みるため、より正確な認識が可能となる。
【0056】本発明によるパターン認識装置の実施例の
能力を確かめるために、認識実験を行った。実験で用い
た学習データは、人工的につくられた300件の数字で
ある。これらを学習するために、中間ユニット部21に
は300個の中間ユニット21ijを用意した。すなわ
ち、 0≦i≦9,1≦j≦N,N=30 である。学習は、実施例で示したような、学習データの
文字パターンベクトルXを荷重ベクトルWijそのものと
する、というもっとも簡単な方法で行った。また、未学
習データは、1000件の手書き数字である。
【0057】従来のフィードバック機構のない手法で
は、出力結果Yが、例えば‘2’と‘7’両方の可能性
が高いというときも、わずかな差で値の大きな方を認識
結果としていた。その結果、例えば‘2’のデータが
‘7’と誤認識されてしまう可能性が高く、安定した認
識を実現することは困難となっていた。
【0058】これに対し本発明によるパターン認識装置
の実施例では、出力結果が確定的でないときに、対立す
るカテゴリ候補の形状比較から、認識の決め手となるパ
ターンの部分領域を検出し、そこに注目して再認識を試
みるため、より正確な認識が可能となった。具体的に
は、従来例と本実施例について未学習データ認識率につ
いて実験した結果、従来例は55.8%であったのに対
し、本実施例は74.3%と高い。
【0059】以上述べた実施例では、入力手段1に入力
されるパターンベクトルとして文字パターンベクトルX
について説明したが、これに限らず画像パターンベクト
ルであってもよく、この場合のパターンベクトルはパタ
ーンをドットの濃淡に対応する数値で表現したものなら
なんでもよい。
【0060】
【発明の効果】本発明によるパターン認識装置によれ
ば、従来のように認識結果が確定的でなく誤認識される
ような場合でも、ifーthenルールを用いることな
く、より正確な認識が可能となり、また、従来のフィー
ドバック手段で用いられた知識工学的なデータベースが
不要であるため、一般的に困難なデータベースの構築を
する必要もなく、カテゴリ数が増えることによるルール
の組合せ爆発が生じることもない。
【図面の簡単な説明】
【図1】本発明のパターン認識装置の概略構成を示すブ
ロック図。
【図2】本発明のパターン認識装置の実施例を示すブロ
ック図。
【図3】図2のユニットの機能を説明するための図。
【図4】図3のユニットの反応特性を説明するための
図。
【図5】パターンの部分領域の定義を説明するための
図。
【図6】パターンの注視部分の検出を説明するための
図。
【図7】従来の文字パターン認識の原理を説明するため
の図。
【図8】従来の文字パターン認識の原理を説明するため
の文字パターンベクトル図。
【図9】従来の数字認識用のニューラルネットの概略構
成を示す図。
【図10】従来の数字認識用のニューラルネットの反応
領域を説明するための図。
【図11】従来のフィードバック機構を用いたパターン
認識装置を説明するための図。
【符号の説明】
1…入力手段、11…文字パターン記憶ワークメモリ、
12…入力信号生成部、13…グループ定義データベー
ス、2…中間手段、21…中間ユニット部、21ij…中
間ユニット、22…学習部、 3…出力手段、31…出
力信号生成部、32…出力信号累積記憶ワークメモリ、
33…注視率定義データベース、4,4A…フィードバ
ック手段、41…フィードバック条件演算部、42…対
立候補検出部、43…注視部分検出部、44…グループ
定義データベース、51…反応強度計算部、52…荷重
ベクトルデータベース、53…荷重ベクトル修正部、5
4…グループ定義データベース。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 文字、図形等のパターンベクトルをパタ
    ーン単位毎に入力し、このパターン単位毎の荷重ベクト
    ルならびにこの荷重ベクトルの距離からパターン単位の
    カテゴリの全てについて反応強度を求め、この反応強度
    により前記パターンベクトルの認識を行ない、この認識
    結果を出力手段により出力するパターン認識装置におい
    て、 前記出力手段からの最終認識前の出力信号を入力し、こ
    の出力信号のうち少なくとも第1番目、第2番目に大き
    なもの同士を比較し、この差が所定のしきい値以下のと
    き前記比較を行なったパターンベクトルに対してそれぞ
    れ複数のグループに分割して複数の部分パターンベクト
    ルとし、この各部分パターンベクトルのうちパターンベ
    クトルの認識の決め手となる注視部分領域を前記荷重ベ
    クトルの比較により検出し、この注視部分領域に注目し
    て前記出力手段の最終認識出力とするフィードバック手
    段を具備したパターン認識装置。
  2. 【請求項2】 文字、図形等のパターンベクトルをパタ
    ーン単位毎に入力し、このパターン単位のパターンベク
    トルを出力し、またはグループ分割要求が入力されたと
    きグループ定義データベースに格納されているグループ
    定義に従ってパターン単位のパターンベクトルをグルー
    プ分けし、このグループ分けされた部分パターンベクト
    ルを出力する入力手段と、 パターンの種類毎に区分けした複数の中間ユニットを備
    え、前記入力手段から出力されるパターンベクトルまた
    は前記部分パターンベクトルを前記各中間ユニットに入
    力し、グループ毎に定義された荷重ベクトルおよびこの
    荷重ベクトルの距離から求めた反応強度および前記荷重
    ベクトルをそれぞれ出力する中間手段と、 この中間手段からの反応強度を集約し、この集約した反
    応強度を認識前の出力信号として出力すると共に、出力
    要求があったとき認識後の最終的な認識結果を出力し、
    さらに注視要求が入力されたとき注視率定義に従って重
    み数を乗じる出力手段と、 この出力手段からの認識前の出力信号を入力し、この出
    力信号のうち少なくとも最も大きな値の第1候補と、次
    に大きな値の第2候補の差が所定のしきい値以下のフィ
    ードバック条件を満たすとき対立候補検出要求を出し、
    前記フィードバック条件を満さないとき前記出力手段に
    出力要求を出すフィードバック条件演算部と、前記パタ
    ーンベクトルを認識する際に有効な複数に分割したグル
    ープ定義を予め保存したグループ定義データベースと、
    前記中間手段からの反応強度を入力し、前記第1候補と
    前記第2候補の値の最も強い要因の対立候補を検出する
    対立候補検出部と、この対立候補検出部からの対立候補
    を入力し、前記中間手段からの荷重ベクトルを入力し、
    前記グループ定義データベースからのグループ定義を読
    み出し、前記入力手段に対してグループ分割要求を出力
    すると共に、前記出力手段に対して注視要求を出す注視
    部分検出部とからなるフィードバック手段と、 を具備したパターン認識装置。
  3. 【請求項3】 請求項2記載のパターン認識装置におい
    て、入力手段は、 文字パターン、図形パターン等のパターンベクトルを記
    憶し、入力要求が入力されたとき前記記憶されたパター
    ンベクトルを出力する記憶ワークメモリと、 前記パターンベクトルを認識する際に有効な複数に分割
    したグループ定義を保存し、この保存したグループ定義
    を前記フィードバック手段からグループ分割要求が入力
    されたとき読み出し可能なグループ定義データベース
    と、 前記記憶ワークメモリに対して入力要求を出し前記記憶
    ワークメモリに記憶されたパターンベクトルを読み出し
    これを出力し、また前記フィードバック手段からグルー
    プ分割要求が入力されたとき前記パターンべクトル記憶
    ワークメモリに記憶されたパターンベクトルを、前記グ
    ループ定義データベースのグループ定義に基づき部分パ
    ターンベクトルを生成しこれを出力する入力信号生成部
    とから構成されているパターン認識装置。
  4. 【請求項4】 請求項2記載のパターン認識装置におい
    て、中間手段は、パターンの種類に応じて区分けされ、
    前記入力手段から出力されるパターンベクトルをパター
    ン単位に入力し、これと対応する荷重ベクトルの距離な
    らびに荷重ベクトルから求めた反応強度および前記荷重
    ベクトルをそれぞれ出力する複数の中間ユニットと、 前記入力手段に入力されるパターンベクトルに対応して
    入力される教師信号に基づき前記各中間ユニットの荷重
    ベクトルを学習しこれを前記各中間ユニットの荷重ベク
    トルとして出力する学習部とから構成されているパター
    ン認識装置。
  5. 【請求項5】 請求項4記載のパターン認識装置におい
    て、前記各中間ユニットは、 荷重ベクトルを保存し、かつこの保存データを修正可能
    な荷重ベクトルデータベースと、 前記パターンベクトルを認識する際に有効な複数に分割
    したグループ定義を保存し、この保存したグループ定義
    を読み出し可能なグループ定義データベースと、 前記グループ定義データベースのグループ毎に定義され
    た荷重ベクトルおよびこの荷重ベクトルの距離と前記入
    力手段から出力されるパターンベクトルとから反応強度
    を計算して出力する反応強度計算部と、 この反応強度計算部に入力される荷重ベクトルを、前記
    学習部から学習要求があったとき前記入力手段から出力
    されるパターンベクトルに基づき修正し、この修正した
    荷重ベクトルを前記反応強度計算部に入力する荷重ベク
    トル修正部と、 から構成されているパターン認識装置。
  6. 【請求項6】 入力手段と、中間手段と、出力手段と、
    フィードバック手段からなり、 前記入力手段は、文字パターン、画像パターン等のパタ
    ーンベクトルを記憶し、入力要求が入力されたとき前記
    記憶されたパターンベクトルを出力する記憶ワークメモ
    リと、前記パターンベクトルを認識する際に有効な複数
    に分割したグループ定義を保存し、この保存したグルー
    プ定義をグループ分割要求が入力されたとき読み出し可
    能なグループ定義データベースと、前記記憶ワークメモ
    リに対して入力要求を出し前記記憶ワークメモリに記憶
    されたパターンベクトルを読み出しこれを出力し、また
    グループ分割要求が入力されたとき前記記憶ワークメモ
    リに記憶されたパターンベクトルを、前記グループ定義
    データベースのグループ定義に基づき部分パターンベク
    トルを生成しこれを出力する入力信号生成部とから構成
    され、 前記中間手段は、前記パターンの種類に応じた個数の複
    数の中間ユニットと学習部を備え、前記各中間ユニット
    は、荷重ベクトルを保存し、かつこの保存データを修正
    可能な荷重ベクトルデータベースと、前記パターンベク
    トルを認識する際に有効な複数に分割したグループ定義
    を保存し、この保存したグループ定義を読み出し可能な
    グループ定義データベースと、このグループ定義データ
    ベースのグループ毎に定義された前記荷重ベクトルデー
    タベースの荷重ベクトルを入力し、各グループ毎に前記
    荷重ベクトルの距離と前記入力手段から出力されるパタ
    ーンベクトルから反応強度を計算して出力する反応強度
    計算部と、この反応強度計算部に入力される荷重ベクト
    ルを、学習要求があったとき前記入力手段から出力され
    るパターンベクトルに基づき修正し、この修正した荷重
    ベクトルを前記反応強度計算部に入力する荷重ベクトル
    修正部とから構成され、前記学習部は前記入力手段から
    出力されるパターンベクトルに対応して入力される教師
    信号に基づき前記各中間ユニットの荷重ベクトルを学習
    しこれを前記各中間ユニットの荷重ベクトルとして出力
    する学習部とから構成され、 前記出力手段は、前記反応強度計算部からの反応強度を
    集約し出力信号を出力する出力信号生成部と、この出力
    信号生成部からの出力信号を記憶し、出力要求が入力さ
    れたとき出力信号を出力する出力信号累積記憶ワークメ
    モリと、注視率定義が格納され注視要求が入力されたと
    き前記出力信号生成部からの出力信号に重みが乗じられ
    る注視率定義データベースとから構成され、 前記フィードバック手段は、前記出力信号生成部からの
    認識前の出力信号を入力し、この出力信号のうち少なく
    とも第1番目の大きな値の第1候補と、第2番目の大き
    な値の第2候補を比較し、この差が所定のしきい値以下
    のとき対立候補検出要求を出し、フィードバック条件を
    満たすとき前記出力手段に出力要求を出すフィードバッ
    ク条件演算部と、前記パターンベクトルを認識する際に
    有効な複数に分割したグループ定義を予め保存したグル
    ープ定義データベースと、前記反応強度計算部からの反
    応強度を入力し、前記第1候補と前記第2候補の値の最
    も強い要因の対立候補を検出する対立候補検出部と、こ
    の対立候補検出部からの対立候補を入力し、前記中間手
    段からの荷重ベクトルを入力し、前記グループ定義デー
    タベースからのグループ定義を読みだし、前記入力手段
    に対してグループ分割要求を出力すると共に、前記出力
    手段に対して注視要求を出す注視部分検出部とから構成
    されたパターン認識装置。
JP27716694A 1994-10-18 1994-10-18 パターン認識装置 Expired - Lifetime JP3222699B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27716694A JP3222699B2 (ja) 1994-10-18 1994-10-18 パターン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27716694A JP3222699B2 (ja) 1994-10-18 1994-10-18 パターン認識装置

Publications (2)

Publication Number Publication Date
JPH08115387A true JPH08115387A (ja) 1996-05-07
JP3222699B2 JP3222699B2 (ja) 2001-10-29

Family

ID=17579728

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27716694A Expired - Lifetime JP3222699B2 (ja) 1994-10-18 1994-10-18 パターン認識装置

Country Status (1)

Country Link
JP (1) JP3222699B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102366461B1 (ko) 2020-04-10 2022-02-23 엘지전자 주식회사 디퓨저 및 이를 포함하는 헤어드라이어
KR102364692B1 (ko) * 2020-04-10 2022-02-18 엘지전자 주식회사 헤어드라이어
KR102364682B1 (ko) 2020-04-10 2022-02-18 엘지전자 주식회사 디퓨저 및 이를 포함하는 헤어드라이어
KR102364689B1 (ko) 2020-04-10 2022-02-18 엘지전자 주식회사 디퓨저 및 이를 포함하는 헤어드라이어
KR102364681B1 (ko) 2020-04-10 2022-02-18 엘지전자 주식회사 디퓨저 및 이를 포함하는 헤어드라이어
KR102364691B1 (ko) 2020-04-10 2022-02-18 엘지전자 주식회사 디퓨저 및 이를 포함하는 헤어드라이어

Also Published As

Publication number Publication date
JP3222699B2 (ja) 2001-10-29

Similar Documents

Publication Publication Date Title
Wu et al. Self-critical reasoning for robust visual question answering
EP1433118B1 (en) System and method of face recognition using portions of learned model
Kittler et al. On combining classifiers
US5343537A (en) Statistical mixture approach to automatic handwriting recognition
Chiang et al. Hybrid fuzzy-neural systems in handwritten word recognition
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
US5909510A (en) Method and apparatus for document classification from degraded images
JPH06309492A (ja) 複数分類器出力合成方法及び合成システム
Toh et al. A reduced multivariate polynomial model for multimodal biometrics and classifiers fusion
KR19990010210A (ko) 대용량 패턴 정합 장치 및 방법
JP2010039778A (ja) 次元削減方法、パターン認識用辞書生成装置、及びパターン認識装置
Altınçay et al. An information theoretic framework for weight estimation in the combination of probabilistic classifiers for speaker identification
CN111694954B (zh) 图像分类方法、装置和电子设备
US20040131235A1 (en) Image processing method, apparatus and storage medium
US7181062B2 (en) Modular classification architecture for a pattern recognition application
JP3083562B2 (ja) 文字認識機構
JP3222699B2 (ja) パターン認識装置
Singh et al. Correlation‐based classifier combination in the field of pattern recognition
JPH09245125A (ja) パターン認識装置及び同装置における辞書修正方法
US5712959A (en) Neural network architecture for non-Gaussian components of a mixture density function
KR100441706B1 (ko) 인식사전최적화방법
JPH05314320A (ja) 認識距離の差と候補順を利用した認識結果の評価方式
JPH08263660A (ja) 信号認識方法、信号認識装置、信号認識装置の学習方法及び信号認識装置の学習装置
Raudys et al. Multicategory nets of single-layer perceptrons: Complexity and sample-size issues
JPH1063632A (ja) 大規模ニューラルネットワーク構築方法及び大規模ニューラルネットワーク構築装置及びニューラルネットワーク装置

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080817

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080817

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090817

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100817

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100817

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110817

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120817

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120817

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130817

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term