JPH08115387A

JPH08115387A - パターン認識装置

Info

Publication number: JPH08115387A
Application number: JP6277166A
Authority: JP
Inventors: Naoki Natori; 直毅名取
Original assignee: GIJUTSU KENKYU KUMIAI SHINJOHO SHIYORI KAIHATSU KIKO; Toshiba Corp
Current assignee: GIJUTSU KENKYU KUMIAI SHINJOHO SHIYORI KAIHATSU KIKO; Toshiba Corp
Priority date: 1994-10-18
Filing date: 1994-10-18
Publication date: 1996-05-07
Anticipated expiration: 2016-10-29
Also published as: JP3222699B2

Abstract

(57)【要約】【目的】認識結果が確定的でなく誤認識されるような場
合でも、ｉｆーｔｈｅｎルールを用いずに、より正確な
認識が可能となるパターン認識装置を得る。【構成】パターンベクトルＸをパターン単位毎に入力
し、これと対応する荷重ベクトルの距離ならびに該荷重
ベクトルにより求められる反応強度Ａを集約し、この集
約したＡによりＸの認識を行ない、この認識結果を出力
手段３に出力するもので、３からの認識前の出力信号を
入力し、この出力信号が何のパターンを表すかを認識
し、この認識結果が確定的でないときＸの認識の決め手
となる注視部分領域を、対立するパターン候補の種類を
それぞれを代表する荷重ベクトルの比較により検出し、
この検出された注視部分領域に注目して再認識を行うた
めのフィードバック手段４を具備したもの。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、文字パターン、図形パ
ターン（以下単にパターンと称する）等を認識するパタ
ーン認識装置に関する。

【０００２】

【従来の技術】この種従来のパターン認識装置として、
パターンをベクトルと見なし、ベクトル空間内での分布
領域を学習することにより、該入力パターンを認識する
ものがある。

【０００３】これについて、図７を参照して説明する。
ここでは文字認識を例に挙げて説明する。文字のパター
ンは、図７に示すようにドット・パターンで示すことが
できる。このドット・パターンにおいて、白い部分のド
ットは‘０’、黒い部分のドットは‘１’とし、ドット
を１次元に展開すれば、文字パターンは例えば次に示す
ような‘０’と‘１’からなるベクトルとなる。

【０００４】［０，０，１，１，１，１，０，…］今、このような文字パターンのベクトルの任意のものを
ｘと書くと、パターン認識装置は、入力された文字パタ
ーンがベクトル空間内のどのような領域にあるかで、こ
の入力文字を分類する。特定の文字種がベクトル空間内
のどの領域を占めるかは、一般に現場から収集した多数
の文字データを用いて学習する。

【０００５】図８は、このような状況を説明するための
ものであるが、パターン空間をベクトルの次元１，２か
らなる２次元と仮定している。図では文字パターンベク
トルＸが‘４’と分類されている場合を示している。

【０００６】図９は、最近注目されているニューラルネ
ットによる文字認識の場合の原理を説明するための図で
あり、これも前述の文字認識と同一原理である。図９
は、数字認識用のニューラルネットの一例であり、これ
は入力ユニット層ＩＵと、中間ユニット層ＭＵと、出力
ユニット層ＯＵを有する階層型のニューラルネットであ
る。

【０００７】入力ユニット層ＩＵの各ユニットには前述
の文字パターンベクトルＸの各要素の値が入力される
が、この場合入力ユニット層ＩＵのユニットの数は入力
文字パターンベクトルＸの次元数に一致する。

【０００８】ニューラルネットでは、多くの文字パター
ンを学習するが、それは前述のような文字パターンベク
トルの空間において、‘０’と見なせるベクトル空間の
どの領域を占めるか、‘１’と見なせるベクトルは空間
のどの領域を占めるか、など、ベクトル空間を‘０’，
‘１’，‘２’，…，‘９’に対応する領域に分割して
いることになる。一般に、そのような領域は、超球と呼
ばれる中間ユニット層ＭＵのユニットの反応領域を単位
として構成される。

【０００９】図１０は従来の数字認識用ニューラルネッ
トの反応領域を説明するための図である。図１０は、図
８と同様、パターン空間を仮に２次元平面として表した
ものであり、超球は、円で表されている。ニューラルネ
ットは、これら超球の反応領域の組み合わせでパターン
の分布領域を学習していると言える。

【００１０】図９の出力ユニット層ＯＵの各ユニット
は、文字種に対応するものであり、この場合には、
‘０’，‘１’，‘２’，…，‘９’に対応する１０個
のユニットである。一般に、各出力ユニットは、０以上
１以下の実数値を出力し、それが該文字パターンベクト
ルＸのカテゴリである可能性の高さを示している。通
常、判定では最も高い値を出した出力ユニットを選択す
る。

【００１１】以上述べたパターン認識装置は、既に文字
認識などに利用されているが、出力結果が確定的でない
とき、例えば手書きの崩れた‘２’の文字パターンベク
トルＸの入力に対して、文字種‘２’の可能性を出す出
力ユニットＯＵ₂と文字種‘７’の可能性を示す出力ユ
ニットＯＵ₇の出力値がほぼ等しいときは、わずかの差
で高い値の方を判定結果としてしまい、‘２’の文字パ
ターンベクトルＸを‘７’である、と判定する危険性が
ある。

【００１２】そこで、従来では必要なときにフィードバ
ック手段を用いて判定結果を修正するものがある。図１
１は、従来のフィードバック手段を用いたパターン認識
装置を示したものであり、これは入力手段１、中間手段
２、出力手段３、フィードバック手段４Ａを備えてい
る。

【００１３】入力手段１は、文字パターンベクトルＸを
入力し、入力信号Ｉを出力する。文字パターンベクトル
Ｘは、図７に示すようにドット・パターンで示すことが
できる。このドット・パターンにおいて、白い部分のド
ットは‘０’、黒い部分のドットは‘１’とし、ドット
を１次元に展開すれば、文字パターンベクトルＸは例え
ば次に示すような‘０’と‘１’からなるベクトルとな
る。

【００１４】［０，０，１，１，１，１，０，…］学習時に入力される文字パターンベクトルＸには、教師
信号Ｔが伴う。教師信号Ｔは、文字パターンベクトルＸ
が何の文字種であるかを装置に教示するためのものであ
り、例えば、数字を学習する装置に、‘２’である、と
教示するには、偽を‘０’、真を‘１’とし、文字種
‘０’から‘９’までに対応する１０個の‘０’か
‘１’かの数字で、［０，０，１，０，０，０，０，０，０，０］のような教師信号Ｔを用意する。

【００１５】入力信号Ｉは、文字パターンベクトルＸと
等しいか、あるいは文字パターンベクトルＸの要素の一
部からなる部分ベクトルである。

【００１６】中間手段２は、入力信号Ｉを、教師信号Ｔ
を用いて学習したり、未学習の入力信号Ｉが入力された
ときに類似度を分析し反応強度Ａを出力する。

【００１７】出力手段３は、中間手段２によって出され
る入力信号Ｉを集約し、出力信号Ｏや最終的な出力結果
Ｙを出力する。

【００１８】フィードバック手段４Ａは、知識工学的な
データベースを備え、出力手段３からの出力信号Ｏをも
とに再認識が必要かどうかの判断を行ない、再認識が必
要ないと判断したとき、出力手段３に対して出力結果Ｙ
を出力するよう出力要求ＲＯを出力する。そして、フィ
ードバック手段４Ａは、再認識が必要であると判断した
場合（未学習データの場合）には、知識工学的なデータ
ベースを用いて入力手段１に対してグループ分割要求Ｒ
Ｄを出力し、また出力手段３に対して注視要求ＲＷを出
力する。

【００１９】

【発明が解決しようとする課題】ここで、従来のフィー
ドバック手段４Ａに有する知識工学的なデータベース
は、以下のようなものである。例えば、‘２’と‘７’
両方の可能性が高いときはパターンの右下の部分領域に
注目して再認識する、というようなルールをデータベー
スとして用意し、これを利用するものである。知識工学
的なデータベースは、‘２’と‘７’という文字パター
ンの構造的な違いが文字領域の右下部分に最も多く見ら
れるという先験的な知識を用いている。

【００２０】しかし、すべてのカテゴリ（文字の種類）
の組について、構造的な違いを見い出すことは、一般的
には困難であり、また、カテゴリ数が増えると組合せ爆
発を起こす。

【００２１】そこで、本発明は、出力手段の出力結果を
確定的でないとき、ｉｆーｔｈｅｎルールを用いること
なく、正しくパターン認識ができるパターン認識装置の
提供することを目的とする。

【００２２】

【課題を解決するための手段】前記目的を達成するた
め、請求項１に対応する発明は、文字、図形等のパター
ンベクトルをパターン単位毎に入力し、このパターン単
位毎の荷重ベクトルならびにこの荷重ベクトルの距離か
らパターン単位のカテゴリの全てについて反応強度を求
め、この反応強度により前記パターンベクトルの認識を
行ない、この認識結果を出力手段により出力するパター
ン認識装置において、前記出力手段からの最終認識前の
出力信号を入力し、この出力信号のうち少なくとも第１
番目、第２番目に大きなもの同士を比較し、この差が所
定のしきい値以下のとき前記比較を行なったパターンベ
クトルに対してそれぞれ複数のグループに分割して複数
の部分パターンベクトルとし、この各部分パターンベク
トルのうちパターンベクトルの認識の決め手となる注視
部分領域を前記荷重ベクトルの比較により検出し、この
注視部分領域に注目して前記出力手段の最終認識出力と
するフィードバック手段を具備したパターン認識装置で
ある。

【００２３】前記目的を達成するため、請求項２に対応
する発明は、文字、図形等のパターンベクトルをパター
ン単位毎に入力し、このパターン単位のパターンベクト
ルを出力し、またはグループ分割要求が入力されたとき
グループ定義データベースに格納されているグループ定
義に従ってパターン単位のパターンベクトルをグループ
分けし、このグループ分けされた部分パターンベクトル
を出力する入力手段と、パターンの種類毎に区分けした
複数の中間ユニットを備え、前記入力手段から出力され
るパターンベクトルまたは前記部分パターンベクトルを
前記各中間ユニットに入力し、グループ毎に定義された
荷重ベクトルおよびこの荷重ベクトルの距離から求めた
反応強度および前記荷重ベクトルをそれぞれ出力する中
間手段と、この中間手段からの反応強度を集約し、この
集約した反応強度を認識前の出力信号として出力すると
共に、出力要求があったとき認識後の最終的な認識結果
を出力し、さらに注視要求が入力されたとき注視率定義
に従って重み数を乗じる出力手段と、この出力手段から
の認識前の出力信号を入力し、この出力信号のうち少な
くとも最も大きな値の第１候補と、次に大きな値の第２
候補の差が所定のしきい値以下のフィードバック条件を
満たすとき対立候補検出要求を出し、前記フィードバッ
ク条件を満さないとき前記出力手段に出力要求を出すフ
ィードバック条件演算部と、前記パターンベクトルを認
識する際に有効な複数に分割したグループ定義を予め保
存したグループ定義データベースと、前記中間手段から
の反応強度を入力し、前記第１候補と前記第２候補の値
の最も強い要因の対立候補を検出する対立候補検出部
と、この対立候補検出部からの対立候補を入力し、前記
中間手段からの荷重ベクトルを入力し、前記グループ定
義データベースからのグループ定義を読み出し、前記入
力手段に対してグループ分割要求を出力すると共に、前
記出力手段に対して注視要求を出す注視部分検出部とか
らなるフィードバック手段と、を具備したパターン認識
装置である。

【００２４】前記目的を達成するため、請求項６に対応
する発明は、入力手段と、中間手段と、出力手段と、フ
ィードバック手段からなり、前記入力手段は、文字パタ
ーン、画像パターン等のパターンベクトルを記憶し、入
力要求が入力されたとき前記記憶されたパターンベクト
ルを出力する記憶ワークメモリと、前記パターンベクト
ルを認識する際に有効な複数に分割したグループ定義を
保存し、この保存したグループ定義をグループ分割要求
が入力されたとき読み出し可能なグループ定義データベ
ースと、前記記憶ワークメモリに対して入力要求を出し
前記記憶ワークメモリに記憶されたパターンベクトルを
読み出しこれを出力し、またグループ分割要求が入力さ
れたとき前記記憶ワークメモリに記憶されたパターンベ
クトルを、前記グループ定義データベースのグループ定
義に基づき部分パターンベクトルを生成しこれを出力す
る入力信号生成部とから構成され、前記中間手段は、前
記パターンの種類に応じた個数の複数の中間ユニットと
学習部を備え、前記各中間ユニットは、荷重ベクトルを
保存し、かつこの保存データを修正可能な荷重ベクトル
データベースと、前記パターンベクトルを認識する際に
有効な複数に分割したグループ定義を保存し、この保存
したグループ定義を読み出し可能なグループ定義データ
ベースと、このグループ定義データベースのグループ毎
に定義された前記荷重ベクトルデータベースの荷重ベク
トルを入力し、各グループ毎に前記荷重ベクトルの距離
と前記入力手段から出力されるパターンベクトルから反
応強度を計算して出力する反応強度計算部と、この反応
強度計算部に入力される荷重ベクトルを、学習要求があ
ったとき前記入力手段から出力されるパターンベクトル
に基づき修正し、この修正した荷重ベクトルを前記反応
強度計算部に入力する荷重ベクトル修正部とから構成さ
れ、前記学習部は前記入力手段から出力されるパターン
ベクトルに対応して入力される教師信号に基づき前記各
中間ユニットの荷重ベクトルを学習しこれを前記各中間
ユニットの荷重ベクトルとして出力する学習部とから構
成され、前記出力手段は、前記反応強度計算部からの反
応強度を集約し出力信号を出力する出力信号生成部と、
この出力信号生成部からの出力信号を記憶し、出力要求
が入力されたとき出力信号を出力する出力信号累積記憶
ワークメモリと、注視率定義が格納され注視要求が入力
されたとき前記出力信号生成部からの出力信号に重みが
乗じられる注視率定義データベースとから構成され、前
記フィードバック手段は、前記出力信号生成部からの認
識前の出力信号を入力し、この出力信号のうち少なくと
も第１番目の大きな値の第１候補と、第２番目の大きな
値の第２候補を比較し、この差が所定のしきい値以下の
とき対立候補検出要求を出し、フィードバック条件を満
たすとき前記出力手段に出力要求を出すフィードバック
条件演算部と、前記パターンベクトルを認識する際に有
効な複数に分割したグループ定義を予め保存したグルー
プ定義データベースと、前記反応強度計算部からの反応
強度を入力し、前記第１候補と前記第２候補の値の最も
強い要因の対立候補を検出する対立候補検出部と、この
対立候補検出部からの対立候補を入力し、前記中間手段
からの荷重ベクトルを入力し、前記グループ定義データ
ベースからのグループ定義を読みだし、前記入力手段に
対してグループ分割要求を出力すると共に、前記出力手
段に対して注視要求を出す注視部分検出部とから構成さ
れたパターン認識装置である。

【００２５】

【作用】請求項１、請求項２、請求項６のいずれか一つ
に記載の発明によれば、出力手段からの認識前の出力信
号を入力し、この出力信号が何のパターンを表すかを認
識し、この認識結果が確定的でないときパターンベクト
ルの認識の決め手となる注視部分領域を、対立するパタ
ーン候補の種類をそれぞれを代表する荷重ベクトルの比
較により検出し、この検出された注視部分領域に注目し
て再認識を行うためのフィードバック手段を具備したし
たので、ｉｆーｔｈｅｎルールを用いることなく、より
正確なパターン認識が可能となる。

【００２６】

【実施例】以下、図面を参照して本発明の実施例につい
て説明するが、前述した従来例と同一部分または対応す
る部分については同一番号を付し、その詳細な説明は省
略する。また、図を簡略化するため、ベクトル、信号な
どと表記していても１本の線で表現する。ここではパタ
ーン認識として文字認識を例に挙げて説明するが、図形
パターン認識あるいは、文字と画像の組み合わせたパタ
ーンの認識であってもよい。

【００２７】図１は、本発明の概略説明を示すブロック
図であり、入力手段１、中間手段２、出力手段３、フィ
ードバック手段４からなり、フィードバック手段４が従
来例と大きく異なり、フィードバック手段４は後述する
フィードバック条件演算部４１、対立候補検出部４２、
注視部分検出部４３、グループ定義データベース４４か
ら構成されている。

【００２８】入力手段１は、文字パターンベクトルＸを
文字パターン単位毎に入力し、入力信号Ｉを出力する。
ここで、文字パターンベクトルＸは、図７に示すように
ドット・パターンで示すことができる。このドット・パ
ターンにおいて、白い部分のドットは‘０’、黒い部分
のドットは‘１’とし、ドットを１次元に展開すれば、
文字パターンベクトルＸは例えば次に示すような‘０’
と‘１’からなるベクトルとなる。

【００２９】［０，０，１，１，１，１，０，…］学習時に入力される文字パターンベクトルＸには、教師
信号Ｔが伴う。教師信号Ｔは、文字パターンベクトルＸ
が何の文字種（カテゴリ）であるかを装置に教示するた
めのものであり、例えば、数字を学習する装置に、
‘２’である、と教示するには、偽を‘０’、真を
‘１’とし、文字種‘０’から‘９’までに対応する１
０個の‘０’か‘１’かの数字で、［０，０，１，０，０，０，０，０，０，０］のような教師信号Ｔを用意する。

【００３０】入力信号Ｉは、文字パターン単位の文字パ
ターンベクトルＸと等しいか、あるいは文字パターンベ
クトルＸの要素の一部からなる部分ベクトルである。

【００３１】中間手段２は、入力信号Ｉすなわち文字パ
ターンベクトルまたは部分文字パターンベクトルを入力
し、類似度すなわち後述する反応強度Ａおよび荷重ベク
トルＷを出力する。この場合、前段の処理として中間手
段２内部において入力信号Ｉは教師信号Ｔを用いて学習
したり、未学習の入力信号Ｉが入力されたときは学習は
行なわれない。

【００３２】出力手段３は、中間手段２によって出力さ
れる反応強度を集約し、認識前の出力信号Ｏおよび認識
後の最終的な出力結果Ｙを出力する。

【００３３】フィードバック手段４は、出力信号Ｏをも
とにフィードバック条件演算部４１による再認識が必要
かどうかを判断する。

【００３４】このような構成のもとにおいて、文字パタ
ーンベクトルＸが入力手段１に入力され、中間手段２に
おいて反応強度Ａおよび荷重ベクトルＷが求められる。
出力手段３では、中間手段２によって求められた反応強
度Ａを集約し、出力信号Ｏや最終的な出力結果Ｙを出力
する。この場合、フィードバック手段４が、出力信号Ｏ
をもとにフィードバックによる再認識が必要かどうかを
判断し、もし再認識が必要でなければ、出力手段３に対
して出力結果Ｙを出力するよう出力要求ＲＯを送る。フ
ィードバック手段４が、もしフィードバックによる再認
識が必要であると判断すれば、中間手段２の反応強度Ａ
と荷重ベクトルＷをもとに、認識の決め手となる注視部
分領域を、対立するパターン候補の種類をそれぞれ代表
する荷重ベクトルの比較により検出（カテゴリ候補の形
状比較から検出）する。そして、フィードバック手段４
は入力手段１に対してグループ分割要求ＲＤ、出力手段
３に注視要求ＲＷを送り、再認識を行うよう要求する。

【００３５】この結果、データの文字が、例えば‘２’
と‘７’両方について可能性が高いような、確定的でな
い認識結果の場合でも、知識工学的なｉｆーｔｈｅｎル
ールなしに、対立するカテゴリ候補の形状比較から認識
の決め手となる部分領域を検出し、それに注目して再認
識し、認識結果をより正確な内容に修正することができ
る。

【００３６】図２は、図１のより具体的な実施例を示す
ブロック図である。

【００３７】入力手段１の記憶ワークメモリ１１は、文
字パターンベクトルＸを入力し、記憶する。この記憶
は、後述するフィードバックの際（具体的にはフィード
バック手段４から分割要求ＲＤが出力されたとき）に、
文字パターンベクトルＸを再入力しなくてすむようにす
るためのものである。入力信号生成部１２は、記憶ワー
クメモリ１１に入力要求ＲＩを出し、文字パターンベク
トルＸを入力て、入力信号Ｉを生成し出力する。

【００３８】通常、入力信号生成部１２は、入力信号Ｉ
を文字パターンベクトルＸと等しいものとするが、フィ
ードバックの際には、入力信号Ｉを文字パターンベクト
ルＸの部分ベクトル、すなわち文字パターンベクトルＸ
の要素の一部からなるベクトルとする。

【００３９】中間ユニット部２１は、入力信号Ｉを入力
として、各中間ユニット２１_ijの反応強度Ａ_ijを出力す
る。また、中間ユニット部２１は、フィードバックの際
に、中間ユニット２１_ijの荷重ベクトルＷ_ijを出力す
る。今、１つの中間ユニット２１₀₁に着目すると、中間
ユニット２１₀₁は、入力信号Ｉを入力し、反応強度Ａ₀₁
を出力する。

【００４０】ここで、図３を用いて、中間ユニット２１
₀₁について説明する。まず、入力信号Ｉが反応強度計算
部５１に入力される。次に、反応強度計算部５１では、
荷重ベクトルデータベース５２から荷重ベクトルＷ₀₁を
読み込み、以下のような（１）式により、反応強度Ａ₀₁
を求める。

【００４１】

【数１】これは、図４に示されるような曲線である。ここで、Ｄ
_ijとは、入力信号Ｉと荷重ベクトルＷ_ijの距離例えばユ
ークリッド距離、すなわち、

【００４２】

【数２】である。ただし、Ｗ_ijnは荷重ベクトルＷ_ijの第ｎ番目
の要素、Ｉ_nは入力信号Ｉの第ｎ番目の要素である。ま
た、‖Ｗ_ij‖は、荷重ベクトルＷ_ijの大きさである。実
際には、あるしきい値θを設け、Ａ_ij＜θのときは、Ａ
_ij＝０とする。Ａ_ij≧０となるＤ_ijの区間を、その中間
ユニット２１_ijの反応領域と呼ぶ。

【００４３】学習部２２は、中間ユニット部２１の各中
間ユニット２１_ijの荷重ベクトルＷ_ijを修正すること
で、学習データを学習させる。もっとも単純な方法は、
各中間ユニット２１_ijの荷重ベクトルＷ_ijを、入力され
た入力信号Ｉそのものとすることである。例えば、あら
かじめ反応すべき文字種（カテゴリ）が定められた各中
間ユニット２１_ijに、学習データを学習させるとする。
学習部２２は、各学習データについて教師信号Ｔを入力
し、その文字種に反応すべき中間ユニット２１_ijでまだ
荷重ベクトルＷ_ijが定まっていないものの中から１つを
選択し、そのユニットに対して学習要求ＲＬを出す。図
３を用いて、中間ユニット２１₀₁が学習する様子を説明
する。荷重ベクトル修正部５３は、学習要求ＲＬを受け
とると、入力信号生成部１２から入力信号Ｉを入力し、
荷重ベクトルデータベース５２から荷重ベクトルＷ₀₁を
入力する。ここでは、荷重ベクトルＷ_ijを入力信号Ｉそ
のものとする学習方法について説明しているから、Ｗ_01n′＝Ｉ_n となる。ただし、Ｗ_ijn′は修正荷重ベクトルの第ｎ番
目の要素、Ｉ_nは入力信号Ｉの第ｎ番目の要素である。
そして、荷重ベクトルデータベース５２に修正荷重ベク
トルＷ₀₁′が送られ、Ｗ_01n＝Ｗ_01n′ として、荷重ベクトルＷ₀₁が保存される。

【００４４】出力手段３の出力信号生成部３１は、中間
ユニット部２１の反応強度Ａを集約して、出力信号Ｏを
出力する。出力信号Ｏは、文字種ごとに設けられてお
り、入力されたパターンがその文字種である可能性を０
以上１以下の信号の強さで表現している。もっとも単純
な方法は、中間ユニット２１_ijを反応すべき文字種ごと
に区分けし、それぞれについて反応強度Ａ_ijの最大値を
求め、それを出力信号Ｏとすることである。例えば、図
２で、中間ユニット２１₀₁〜２１_ONが文字種‘０’に反
応すべきユニットだとすると、Ｏ₀＝ｍａｘ（Ａ_0n），１≦ｎ≦Ｎとなる。ただし、Ｏ_iは、文字種‘ｉ’である可能性を
示す出力信号Ｏの要素、Ａ_inは、中間ユニット２１_inの
反応強度である。

【００４５】出力信号累積記憶ワークメモリ３２は、出
力信号Ｏを入力し、フィードバックを行わない場合は、Ｙ_i＝Ｏ_i として、出力結果Ｙを出力する。ただし、Ｙ_iは、入力
されたパターンが文字種‘ｉ’である可能性を最終的に
示す出力結果Ｙの要素である。上式で示したようにフィ
ードバックを行わない場合は、出力結果Ｙは、出力信号
Ｏに等しい。なお、出力信号累積記憶ワークメモリ３２
は、出力要求ＲＯを受けなければ出力結果Ｙを出力しな
い。フィードバックの場合には、出力信号累積記憶ワー
クメモリ３２は、出力要求ＲＯを受ける前に、複数回、
出力信号Ｏを入力し、それらを累積して記憶する。

【００４６】フィードバック条件演算部４１は、出力信
号Ｏを入力し、フィードバックを行うかどうかを判定す
る。フィードバックを行うための条件は、少なくとも第
１候補と第２候補の値の差がある閾値以下のときであ
る。ここで、第１候補とは、出力信号Ｏの要素の中でも
っとも大きな値のもの、第２候補とは、２番目に大きな
値のものを指す。それらの値の差がある閾値以下という
ことは、前述の‘２’と‘７’両方の可能性が高い、の
例のような確定的でない認識結果であることを意味す
る。フィードバック条件を満たさない場合は、出力信号
累積記憶ワークメモリ３２に出力要求ＲＯを出す。フィ
ードバック条件を満たす場合は、対立候補検出部４２に
対立候補検出要求ＲＡを出す。対立候補検出部４２で
は、中間ユニット部２１の反応強度Ａを入力し、前述の
第１候補、第２候補の値のもっとも強い要因となったユ
ニットを検出する。例えば、前述のような、中間ユニッ
ト２１_ijを反応すべき文字種ごとに区分けし、それぞれ
について反応強度Ａ_ijの最大値を求めることで出力信号
Ｏを得る方法のもとでは、もっとも強い要因となったユ
ニットは、第１候補、第２候補それぞれついて、その値
を提供した中間ユニットである。それらを、中間ユニッ
ト２１_F、中間ユニット２１_Sと呼ぶことにする。ま
た、前述のような２つの中間ユニット２１_F，２１_sを
組にして、対立候補Ｐと呼ぶことにする。実質的には、
対立候補Ｐは、例えば、Ｐ＝（２５，７５）のような中間ユニット２１のユニット番号の組となる。
すなわち、Ｆ＝２５，Ｓ＝７５である。

【００４７】注視部分検出部４３は、対立候補Ｐを入力
すると、それにしたがって中間ユニット２１_F，２１_s
の荷重ベクトルＷ_F，Ｗ_Sを中間ユニット部２１より入
力し、注視部分を検出する。注視部分とは、パターンを
認識する際に、もっとも有効な特徴を提供するパターン
の部分領域である。これは、人間がパターンを認識する
際に、そのパターンが一見して何であるか判断できない
ときは、パターンのもっとも特徴的な部分に注目する場
合と同じである。注視部分を検出する前の準備として、
部分領域の定義が必要である。

【００４８】図５は、部分領域の定義の一例を示したも
のである。図５では、まずパターンを左上、右上、左
下、右下の４つに分割し、それに、パターンの中央部分
の領域を加え、合計５つの部分領域を定義している。部
分領域のことをグループと呼ぶことにする。グループ定
義ＤＧは、グループ定義データベース４４に保存され
る。

【００４９】図６は、注視部分の検出の例を示したもの
である。図６は、‘２’と‘７’が対立候補Ｐで、右下
のグループが注視部分として検出された例である。検出
の方法としては、例えば、対立候補Ｐの中間ユニット２
１_F，２１_sの荷重ベクトルＷ_F，Ｗ_Sをグループごと
に比較することが挙げられる。比較は、グループごとに
両者の部分ベクトルのベクトル間距離または統計の分散
値を求めることで行う。そして、もっともベクトル間距
離または分散値が大きいグループを注視部分とする。注
視部分検出部４３は、グループ定義データベース４４か
らグループ定義を読み込み注視部分を検出すると、入力
信号生成部１２にグループ分割要求ＲＤ、出力信号生成
部３１に注視要求ＲＷを出す。

【００５０】入力信号生成部１２は、グループ分割要求
ＲＤを受けとると、文字パターン記憶ワークメモリ１１
に入力要求ＲＩを出し、文字パターンベクトルＸを入力
する。そして、グループ定義データベース１３よりグル
ープ定義ＤＧを入力し、グループ定義ＤＧにしたがって
文字パターンベクトルＸからグループごとの部分ベクト
ルを生成し、順次、入力信号Ｉとする。すなわち、グル
ープ数が５の場合は、入力信号Ｉは、５回生成される。

【００５１】中間ユニット部２１の中間ユニット２１_ij
は、順次、入力信号Ｉを入力し、フィードバックでない
場合と同様の処理を行う。ただし、荷重ベクトルＷ
_ijは、入力信号Ｉが部分ベクトルであることに対応して
部分的に使われ、反応強度Ａ_ijが計算される。

【００５２】出力信号生成部３１は、グループごとに順
次、反応強度Ａを入力すると、フィードバックでない場
合と同様の処理で出力信号Ｏを生成する。ただし、出力
信号Ｏには、注視率定義データベース３３より読み込ま
れた注視率定義ＤＦにしたがって重み数が乗じられる。
すなわち、注視部分のグループに対しては大きな重み数
を、それ以外のグループに対しては小さな重み数を乗じ
ることで、注視を実現している。

【００５３】出力信号Ｏは、グループごとに順次、出力
信号累積記憶ワークメモリ３２に送られ、累積され記憶
される。

【００５４】そして、すべてのグループの出力信号Ｏを
受けとると、フィードバック条件演算部４１から出力信
号累積記憶ワークメモリ３２へ出力要求ＲＯが送られ、
最終的な出力結果Ｙが出力される。

【００５５】以上述べた実施例によれば、出力結果が確
定的でないときに、ｉｆーｔｈｅｎルールを用いること
なしに、対立する文字の種類例えば‘２’と‘７’の形
状比較から、認識の決め手となるパターンの注視部分領
域例えば図６のグループを検出し、そこに注目して再認
識を試みるため、より正確な認識が可能となる。

【００５６】本発明によるパターン認識装置の実施例の
能力を確かめるために、認識実験を行った。実験で用い
た学習データは、人工的につくられた３００件の数字で
ある。これらを学習するために、中間ユニット部２１に
は３００個の中間ユニット２１_ijを用意した。すなわ
ち、０≦ｉ≦９，１≦ｊ≦Ｎ，Ｎ＝３０である。学習は、実施例で示したような、学習データの
文字パターンベクトルＸを荷重ベクトルＷ_ijそのものと
する、というもっとも簡単な方法で行った。また、未学
習データは、１０００件の手書き数字である。

【００５７】従来のフィードバック機構のない手法で
は、出力結果Ｙが、例えば‘２’と‘７’両方の可能性
が高いというときも、わずかな差で値の大きな方を認識
結果としていた。その結果、例えば‘２’のデータが
‘７’と誤認識されてしまう可能性が高く、安定した認
識を実現することは困難となっていた。

【００５８】これに対し本発明によるパターン認識装置
の実施例では、出力結果が確定的でないときに、対立す
るカテゴリ候補の形状比較から、認識の決め手となるパ
ターンの部分領域を検出し、そこに注目して再認識を試
みるため、より正確な認識が可能となった。具体的に
は、従来例と本実施例について未学習データ認識率につ
いて実験した結果、従来例は５５．８％であったのに対
し、本実施例は７４．３％と高い。

【００５９】以上述べた実施例では、入力手段１に入力
されるパターンベクトルとして文字パターンベクトルＸ
について説明したが、これに限らず画像パターンベクト
ルであってもよく、この場合のパターンベクトルはパタ
ーンをドットの濃淡に対応する数値で表現したものなら
なんでもよい。

【００６０】

【発明の効果】本発明によるパターン認識装置によれ
ば、従来のように認識結果が確定的でなく誤認識される
ような場合でも、ｉｆーｔｈｅｎルールを用いることな
く、より正確な認識が可能となり、また、従来のフィー
ドバック手段で用いられた知識工学的なデータベースが
不要であるため、一般的に困難なデータベースの構築を
する必要もなく、カテゴリ数が増えることによるルール
の組合せ爆発が生じることもない。

【図面の簡単な説明】

【図１】本発明のパターン認識装置の概略構成を示すブ
ロック図。

【図２】本発明のパターン認識装置の実施例を示すブロ
ック図。

【図３】図２のユニットの機能を説明するための図。

【図４】図３のユニットの反応特性を説明するための
図。

【図５】パターンの部分領域の定義を説明するための
図。

【図６】パターンの注視部分の検出を説明するための
図。

【図７】従来の文字パターン認識の原理を説明するため
の図。

【図８】従来の文字パターン認識の原理を説明するため
の文字パターンベクトル図。

【図９】従来の数字認識用のニューラルネットの概略構
成を示す図。

【図１０】従来の数字認識用のニューラルネットの反応
領域を説明するための図。

【図１１】従来のフィードバック機構を用いたパターン
認識装置を説明するための図。

【符号の説明】

１…入力手段、１１…文字パターン記憶ワークメモリ、
１２…入力信号生成部、１３…グループ定義データベー
ス、２…中間手段、２１…中間ユニット部、２１_ij…中
間ユニット、２２…学習部、３…出力手段、３１…出
力信号生成部、３２…出力信号累積記憶ワークメモリ、
３３…注視率定義データベース、４，４Ａ…フィードバ
ック手段、４１…フィードバック条件演算部、４２…対
立候補検出部、４３…注視部分検出部、４４…グループ
定義データベース、５１…反応強度計算部、５２…荷重
ベクトルデータベース、５３…荷重ベクトル修正部、５
４…グループ定義データベース。

Claims

【特許請求の範囲】

【請求項１】文字、図形等のパターンベクトルをパタ
ーン単位毎に入力し、このパターン単位毎の荷重ベクト
ルならびにこの荷重ベクトルの距離からパターン単位の
カテゴリの全てについて反応強度を求め、この反応強度
により前記パターンベクトルの認識を行ない、この認識
結果を出力手段により出力するパターン認識装置におい
て、前記出力手段からの最終認識前の出力信号を入力し、こ
の出力信号のうち少なくとも第１番目、第２番目に大き
なもの同士を比較し、この差が所定のしきい値以下のと
き前記比較を行なったパターンベクトルに対してそれぞ
れ複数のグループに分割して複数の部分パターンベクト
ルとし、この各部分パターンベクトルのうちパターンベ
クトルの認識の決め手となる注視部分領域を前記荷重ベ
クトルの比較により検出し、この注視部分領域に注目し
て前記出力手段の最終認識出力とするフィードバック手
段を具備したパターン認識装置。
【請求項２】文字、図形等のパターンベクトルをパタ
ーン単位毎に入力し、このパターン単位のパターンベク
トルを出力し、またはグループ分割要求が入力されたと
きグループ定義データベースに格納されているグループ
定義に従ってパターン単位のパターンベクトルをグルー
プ分けし、このグループ分けされた部分パターンベクト
ルを出力する入力手段と、パターンの種類毎に区分けした複数の中間ユニットを備
え、前記入力手段から出力されるパターンベクトルまた
は前記部分パターンベクトルを前記各中間ユニットに入
力し、グループ毎に定義された荷重ベクトルおよびこの
荷重ベクトルの距離から求めた反応強度および前記荷重
ベクトルをそれぞれ出力する中間手段と、この中間手段からの反応強度を集約し、この集約した反
応強度を認識前の出力信号として出力すると共に、出力
要求があったとき認識後の最終的な認識結果を出力し、
さらに注視要求が入力されたとき注視率定義に従って重
み数を乗じる出力手段と、この出力手段からの認識前の出力信号を入力し、この出
力信号のうち少なくとも最も大きな値の第１候補と、次
に大きな値の第２候補の差が所定のしきい値以下のフィ
ードバック条件を満たすとき対立候補検出要求を出し、
前記フィードバック条件を満さないとき前記出力手段に
出力要求を出すフィードバック条件演算部と、前記パタ
ーンベクトルを認識する際に有効な複数に分割したグル
ープ定義を予め保存したグループ定義データベースと、
前記中間手段からの反応強度を入力し、前記第１候補と
前記第２候補の値の最も強い要因の対立候補を検出する
対立候補検出部と、この対立候補検出部からの対立候補
を入力し、前記中間手段からの荷重ベクトルを入力し、
前記グループ定義データベースからのグループ定義を読
み出し、前記入力手段に対してグループ分割要求を出力
すると共に、前記出力手段に対して注視要求を出す注視
部分検出部とからなるフィードバック手段と、を具備したパターン認識装置。
【請求項３】請求項２記載のパターン認識装置におい
て、入力手段は、文字パターン、図形パターン等のパターンベクトルを記
憶し、入力要求が入力されたとき前記記憶されたパター
ンベクトルを出力する記憶ワークメモリと、前記パターンベクトルを認識する際に有効な複数に分割
したグループ定義を保存し、この保存したグループ定義
を前記フィードバック手段からグループ分割要求が入力
されたとき読み出し可能なグループ定義データベース
と、前記記憶ワークメモリに対して入力要求を出し前記記憶
ワークメモリに記憶されたパターンベクトルを読み出し
これを出力し、また前記フィードバック手段からグルー
プ分割要求が入力されたとき前記パターンべクトル記憶
ワークメモリに記憶されたパターンベクトルを、前記グ
ループ定義データベースのグループ定義に基づき部分パ
ターンベクトルを生成しこれを出力する入力信号生成部
とから構成されているパターン認識装置。
【請求項４】請求項２記載のパターン認識装置におい
て、中間手段は、パターンの種類に応じて区分けされ、
前記入力手段から出力されるパターンベクトルをパター
ン単位に入力し、これと対応する荷重ベクトルの距離な
らびに荷重ベクトルから求めた反応強度および前記荷重
ベクトルをそれぞれ出力する複数の中間ユニットと、前記入力手段に入力されるパターンベクトルに対応して
入力される教師信号に基づき前記各中間ユニットの荷重
ベクトルを学習しこれを前記各中間ユニットの荷重ベク
トルとして出力する学習部とから構成されているパター
ン認識装置。
【請求項５】請求項４記載のパターン認識装置におい
て、前記各中間ユニットは、荷重ベクトルを保存し、かつこの保存データを修正可能
な荷重ベクトルデータベースと、前記パターンベクトルを認識する際に有効な複数に分割
したグループ定義を保存し、この保存したグループ定義
を読み出し可能なグループ定義データベースと、前記グループ定義データベースのグループ毎に定義され
た荷重ベクトルおよびこの荷重ベクトルの距離と前記入
力手段から出力されるパターンベクトルとから反応強度
を計算して出力する反応強度計算部と、この反応強度計算部に入力される荷重ベクトルを、前記
学習部から学習要求があったとき前記入力手段から出力
されるパターンベクトルに基づき修正し、この修正した
荷重ベクトルを前記反応強度計算部に入力する荷重ベク
トル修正部と、から構成されているパターン認識装置。
【請求項６】入力手段と、中間手段と、出力手段と、
フィードバック手段からなり、前記入力手段は、文字パターン、画像パターン等のパタ
ーンベクトルを記憶し、入力要求が入力されたとき前記
記憶されたパターンベクトルを出力する記憶ワークメモ
リと、前記パターンベクトルを認識する際に有効な複数
に分割したグループ定義を保存し、この保存したグルー
プ定義をグループ分割要求が入力されたとき読み出し可
能なグループ定義データベースと、前記記憶ワークメモ
リに対して入力要求を出し前記記憶ワークメモリに記憶
されたパターンベクトルを読み出しこれを出力し、また
グループ分割要求が入力されたとき前記記憶ワークメモ
リに記憶されたパターンベクトルを、前記グループ定義
データベースのグループ定義に基づき部分パターンベク
トルを生成しこれを出力する入力信号生成部とから構成
され、前記中間手段は、前記パターンの種類に応じた個数の複
数の中間ユニットと学習部を備え、前記各中間ユニット
は、荷重ベクトルを保存し、かつこの保存データを修正
可能な荷重ベクトルデータベースと、前記パターンベク
トルを認識する際に有効な複数に分割したグループ定義
を保存し、この保存したグループ定義を読み出し可能な
グループ定義データベースと、このグループ定義データ
ベースのグループ毎に定義された前記荷重ベクトルデー
タベースの荷重ベクトルを入力し、各グループ毎に前記
荷重ベクトルの距離と前記入力手段から出力されるパタ
ーンベクトルから反応強度を計算して出力する反応強度
計算部と、この反応強度計算部に入力される荷重ベクト
ルを、学習要求があったとき前記入力手段から出力され
るパターンベクトルに基づき修正し、この修正した荷重
ベクトルを前記反応強度計算部に入力する荷重ベクトル
修正部とから構成され、前記学習部は前記入力手段から
出力されるパターンベクトルに対応して入力される教師
信号に基づき前記各中間ユニットの荷重ベクトルを学習
しこれを前記各中間ユニットの荷重ベクトルとして出力
する学習部とから構成され、前記出力手段は、前記反応強度計算部からの反応強度を
集約し出力信号を出力する出力信号生成部と、この出力
信号生成部からの出力信号を記憶し、出力要求が入力さ
れたとき出力信号を出力する出力信号累積記憶ワークメ
モリと、注視率定義が格納され注視要求が入力されたと
き前記出力信号生成部からの出力信号に重みが乗じられ
る注視率定義データベースとから構成され、前記フィードバック手段は、前記出力信号生成部からの
認識前の出力信号を入力し、この出力信号のうち少なく
とも第１番目の大きな値の第１候補と、第２番目の大き
な値の第２候補を比較し、この差が所定のしきい値以下
のとき対立候補検出要求を出し、フィードバック条件を
満たすとき前記出力手段に出力要求を出すフィードバッ
ク条件演算部と、前記パターンベクトルを認識する際に
有効な複数に分割したグループ定義を予め保存したグル
ープ定義データベースと、前記反応強度計算部からの反
応強度を入力し、前記第１候補と前記第２候補の値の最
も強い要因の対立候補を検出する対立候補検出部と、こ
の対立候補検出部からの対立候補を入力し、前記中間手
段からの荷重ベクトルを入力し、前記グループ定義デー
タベースからのグループ定義を読みだし、前記入力手段
に対してグループ分割要求を出力すると共に、前記出力
手段に対して注視要求を出す注視部分検出部とから構成
されたパターン認識装置。