JP3095623B2

JP3095623B2 - 属性判定方法

Info

Publication number: JP3095623B2
Application number: JP06133998A
Authority: JP
Inventors: 典昭湯川; 彰一石井; 光隆手嶋
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 1994-06-16
Filing date: 1994-06-16
Publication date: 2000-10-10
Anticipated expiration: 2015-10-10
Also published as: KR960002071A; KR100238572B1; US5655031A; CN1122237C; CN1144943A; JPH087045A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、テレビカメラなどの信
号入力装置とコンピュータを備えた信号処理装置を用い
て入力画像に含まれるパターンがどのような種類に属す
るかを判定する属性判定方法に関するものである。

【０００２】

【従来の技術】近年、工業製品等の検査工程において
は、製品の正確な種類分類、不良種類分類等が重要な課
題の一つとなっている。これらは自動化が強く望まれて
おり、テレビカメラなどの画像入力装置とコンピュータ
を備えた画像処理装置が広く用いられている。例えば、
製品に書かれている製造番号等を自動的に識別するテレ
ビカメラを用いた文字認識装置はその中の一つとして挙
げられる。

【０００３】従来のテレビカメラを用いた文字認識装置
の例を以下に説明する。図１５に装置の概略構成を示
す。対象１１の表面にハーフミラー１４を介して光源１
５から照明光を照射するとともに、ハーフミラー１４を
介してテレビカメラ１２で対象１１の表面を撮像する。
このテレビカメラ１２はＣＣＤセンサを備えており、各
画素ごとに濃淡信号が得られ、これはデジタル化された
形で認識処理部１３の中で処理される。なお、認識処理
部１３は、画像データを記憶する記憶部と文字認識処理
を実行するプログラムを格納する格納部が設けられてい
ることは言うまでもない。

【０００４】図１６に認識処理部の構成を示す。テレビ
カメラ１２から出力された映像信号ａはＡ／Ｄ変換回路
２１に入力され、Ａ／Ｄ変換回路２１にてデジタル化さ
れて出力されたデジタル信号ｂは画像メモリ２２で記憶
される。画像メモリ２２からは画像データｃが出力さ
れ、２値化回路２３で２値画像ｄに変換される。２値化
回路２３では、図１７に示すように、画像データ２７に
おける文字部分を「黒」、背景部分を「白」にするよう
に２値化を行う。２値画像ｄは文字切出回路２４に入力
され、切出画像ｅが出力される。文字切出回路２４で
は、図１８に示すように、１文字毎に外接する外接矩形
２８を検出して文字列が文字ごとに分離される。この文
字切出は、水平軸と垂直軸に投影される投影データをも
とに文字の分離が行われることが多い。文字毎に分離さ
れた切出画像ｅは正規化回路２５に入力され、メッシュ
パターンデータｆが出力される。正規化回路２５では、
各文字の外接矩形内に存在する画素が適当なメッシュサ
イズのパターンに正規化変換される。各メッシュに対応
する複数画素からの変換は、それらの平均値、最大値、
最小値、中央値、最多頻度値等を用いることによって行
われる。図１９に、文字毎に分離された画像２９が、横
５×縦９のメッシュサイズのメッシュパターン３０に変
換される様子を示す。メッシュパターンデータｆは文字
判定回路２６に入力され、文字の判定結果ｇが出力され
る。文字としては、工業用の場合、英数字の「０」〜
「９」、「Ａ」〜「Ｚ」、特殊文字の「−」の３７文字
が用いられることが多く、文字判定回路２６はメッシュ
パターンデータがどの文字に近いかを結果として出力す
る。図２０に上記３７文字の標準パターンデータ（スタ
ンダードパターンデータ）を示す。

【０００５】文字判定回路２６にはニューラルネットワ
ーク（以下、ＮＮと記す）がよく用いられる。ＮＮにつ
いては、各種の構成のものがあるが（参考文献：飯沼
編、「ニューロコンピュータ」、技術評論社、平成元年
９月刊）、実際に良く応用されるパーセプトロン型のＮ
Ｎの構成を図２１に示す。このＮＮは、入力層、中間
層、出力層の３層からなり、各々の多数のニューロンと
呼ばれる非線形素子で構成されている。入力層には、値
として背景の部分を示す「０」、文字の部分を示す
「１」を取る４５個（横５×縦９）のニューロンが存在
し、出力層には、判定される文字である英数字の「０」
〜「９」、「Ａ」〜「Ｚ」、特殊文字の「−」に対応す
る３７個のニューロンが存在する。ここでは、入力層と
中間層、中間層と出力層は、それぞれニューロン間で結
線されており、その上にウエイトωが定義されている。
個々のニューロンは、接続されているニューロンの出力
ｙとその結線上に定義されたウエイトωの積をすべての
結線について総和し、それを非線形関数処理してから
０．０から１．０の値を出力する。ここで、ウエイトω
の値により、このＮＮは様々な特性を持つことになる。
このウエイトの決定には、実際のデータを与えて、出力
層ニューロンが期待の出力を出すかどうか見て、その誤
差分だけのウエイトの修正を何度も繰り返すことで行わ
れる。この修正方法として、バックプロパゲーションが
よく用いられる。（D.E.Rumelhart,et.al:Learning Rep
resentations by Back-Propagating Errors,Nature,No.
323,pp533-536(1986））。スタンダードパターンデータ
を入力層に与え、その文字に対応するニューロンを１．
０に、それ以外のニューロンを０．０にするような出力
層の期待の出力を想定し、その誤差量分だけのウエイト
ωの修正を何度も繰り返すことで行われる。実施例で
は、すべての出力層のニューロンの値と期待の出力値の
誤差が０．１以下になるまで修正作業を繰り返すことに
している。修正作業が終わったＮＮに対して判定作業を
行わせた場合、図２２に示すように、入力層に「Ａ」が
入力されると、出力層における「Ａ」に対応するニュー
ロンの出力が他のニューロンに比べて大きくなる。理想
的には、「Ａ」に対応するニューロンが１．０に近い
値、それ以外のニューロンが０．０に近い値となる。実
施例では、文字の判定条件を次のようにしている。

【０００６】１）出力層のニューロンが０．７以上の値
になった場合、それの対応する文字を判定文字とする
（判定条件）。

【０００７】２）出力層のニューロンで１番目に大きい
値と２番目に大きい値の差が０．３以上の場合、１番目
に対応する文字を判定文字とする（判定条件）。

【０００８】３）出力層のどのニューロンからもそのよ
うな値が出力されない場合、「?」として判定不可能と
する。

【０００９】

【発明が解決しようとする課題】しかしながら、上記従
来のＮＮを用いた判定方法では、要求される信頼性でそ
の属性判定（文字判定）を行えないという問題があっ
た。実際の例をもとに以下に説明する。

【００１０】図２０に示した標準パターンデータ（スタ
ンダードパターンデータ）で、入力層：４５（横４５×
縦９の２値（０，１）パターン）、中間層：４５、出力
層：３７（英数字の「０」〜「９」、「Ａ」〜「Ｚ」、
特殊文字の「−」）の３層からなるネットワークに対
し、学習を行った結果実施したものである。

【００１１】図２３〜図２６は、文字判定の検定に用い
た文字パターンであり、「２」、「９」、「Ａ」、
「Ｆ」の４文字がそれぞれ３０個づつである。図の中で
は黒の「１」を「＊」で示し、白の「０」を「＿」で示
している。

【００１２】文字「２」について代表的な結果を示す
と、図２３において、（１）は１番大きい出力ニューロ
ンが「２」でその値が０．８６であり、判定条件を満
たしている。（２）は１番大きい出力ニューロンが
「２」でその値が０．６３であり、２番目に大きい出力
ニューロンが「Ｚ」でその値が０．１２であり、その差
が０．６３であるので判定条件を満たしている。しか
し、（４）は１番大きい出力ニューロンが「２」でその
値が０．３４であり、２番目に大きい出力ニューロンが
「Ｓ」でその値が０．１５であり、その差が０．１９で
あるため判定不可能になる。同様に、（９）は１番大き
い出力ニューロンが「２」でその値が０．５８であり、
２番目に大きい出力ニューロンが「Ｃ」でその値が０．
４８であり、その差が０．１０で判定不可能になる。

【００１３】文字「９」について代表的な結果を示す
と、図２４において、（１）は１番大きい出力ニューロ
ンが「９」でその値が０．９０であり、判定条件を満
たしている。（３）は１番大きい出力ニューロンが
「９」でその値が０．３７であり、２番目に大きい出力
ニューロンが「５」でその値が０．０７であり、その差
が０．３０であるので判定条件を満たしている。しか
し、（２）は１番大きい出力ニューロンが「９」でその
値が０．２７であり、２番目に大きい出力ニューロンが
「３」でその値が０．０７であり、その差が０．２０で
あるため判定不可能になる。同様に、（８）は１番大き
い出力ニューロンが「９」でその値が０．３８であり、
２番目に大きい出力ニューロンが「Ｓ」でその値が０．
１８であり、その差が０．２０で判定不可能になる。

【００１４】文字「Ａ」について代表的な結果を示す
と、図２５において、（１）は１番大きい出力ニューロ
ンが「Ａ」でその値が０．９１であり、判定条件を満
たしている。（３）は１番大きい出力ニューロンが
「Ａ」でその値が０．６６であり、２番目に大きい出力
ニューロンが「４」でその値が０．１１であり、その差
が０．５５であるので判定条件を満たしている。しか
し、（２２）は１番大きい出力ニューロンが「Ａ」でそ
の値が０．２２であり、２番目に大きい出力ニューロン
が「Ｍ」でその値が０．０８であり、その差が０．１４
であるため判定不可能になる。同様に、（２６）は１番
大きい出力ニューロンが「Ｑ」でその値が０．５２であ
り、２番目に大きい出力ニューロンが「Ａ」でその値が
０．３８であり、その差が０．１４で判定不可能にな
る。

【００１５】文字「Ｆ」について代表的な結果を示す
と、図２６において、（１）は１番大きい出力ニューロ
ンが「Ｆ」でその値が０．９１であり、判定条件を満
たしている。（３）は１番大きい出力ニューロンが
「Ｆ」でその値が０．６５であり、２番目に大きい出力
ニューロンが「Ｐ」でその値が０．２７であり、その差
が０．３９であるので判定条件を満たしている。しか
し、（５）は１番大きい出力ニューロンが「Ｋ」でその
値が０．１２であり、２番目に大きい出力ニューロンが
「Ｆ」でその値が０．０９であり、その差が０．０３で
あるため判定不可能になる。同様に、（６）は１番大き
い出力ニューロンが「Ｋ」でその値が０．１１であり、
２番目に大きい出力ニューロンが「Ｆ」でその値が０．
０９であり、その差が０．０２で判定不可能になる。

【００１６】以上の実験では、かなり標準パターンデー
タからかけ離れているものも実験文字に含んでいるもの
の、人間では何とか識別可能な文字である。１２０個全
部の結果では、正答：８２／１２０（６８％）、誤答：
５／１２０（４％）、判定不可能：３３／１２（２８
％）であった。この結果から分かるように誤答、判定不
可能の多さに問題がある。

【００１７】また、ＮＮの能力の改善を目指して構造を
変更しようと取り組んでも、ウエイトωの決定方法が実
際のデータとそれに対する期待出力を与えて自己組織化
を行っているため、内部構造がブラックボックス的にな
っていて最適な方法を見いだし難いという問題がある。

【００１８】本発明は、上記従来の問題点に鑑み、属性
判定の正答率が高く、信頼性の高い属性判定ができると
ともに、さらに能力改善も比較的容易に行える属性判定
方法を提供することを目的としている。

【００１９】

【課題を解決するための手段】本発明の属性判定方法
は、入力画像に含まれる入力パターンの複数の特徴デー
タと、前記入力パターンに対し、予めニューラルネット
ワークを用いて類似度の高い標準パターンの判定を行
い、その結果から上位の複数個の標準パターンを選択
し、選択した標準パターンから求めた特徴データのメン
バシップ関数とを比較し、入力パターンに最も類似度の
高い標準パターンを判定する属性判定方法であって、入
力パターンの各特徴データに対する各メンバシップ関数
の出力値を得ることを全ての特徴データに対して行い、
全ての特徴データに対する出力値の総合値を求め、これ
を判定すべき各標準パターンに対して行い、最も総合値
の高い標準パターンを判別することを特徴とする。

【００２０】好適には、総合値にニューラルネットワー
クの判定結果を考慮して行う。

【００２１】さらに、入力パターンをメッシュパターン
とし、特徴データとしてメッシュパターンデータを列ご
とに上から下及び下から上に進み黒のメッシュに当たる
までの白のメッシュ数を合計した上下の縦構造ベクトル
和と、メッシュパターンデータを行ごとに左から右及び
右から左に進み黒のメッシュに当たるまでの白のメッシ
ュ数を合計した左右の横構造ベクトル和と、メッシュパ
ターンデータの上半分と下半分及び左半分と右半分の黒
の面積差を求めた上下と左右の面積差と、列中央で上下
方向に黒と交叉する回数を求めた上下交叉本数とを用い
ることにより文字認識を行う。

【００２２】

【作用】本発明の属性判定方法によれば、予めニューラ
ルネットワークを用いて類似度の高い標準パターンの判
定を行って上位の複数個の標準パターンを選択し、選択
した標準パターンから求めた複数の特徴データのメンバ
シップ関数と入力パターンの複数の特徴データを比較
し、全ての特徴量についてのメンバシップ関数の出力値
の総合値を、ニューラルネットワークを用いて選択した
標準パターンに対して求め、最も総合値の高い標準パタ
ーンを判別するファジィ推論にて属性判別を行うので、
その特徴データを適当に設定することにより属性判定の
正答率を高くでき、信頼性の高い属性判定ができる。ま
た、本発明の判定方法は、その仕組みが明確であり、必
要な特徴データの組み合わせができるため、特徴データ
の補充・変更によりさらに的確な属性判定ができるよう
になり、能力改善も比較的容易に行うことができる。

【００２３】また、ニューラルネットワークは内部構造
がブラックボックス的であることに対応して特徴データ
の選定などの手間が要らず、その適否の影響を受けず、
かつ精細な判別には問題はあっても粗い判別には効果的
であるので、予めニューラルネットワークを用いて類似
度の高い標準パターンの判定を行って上位の複数個の標
準パターンを選択し、選択した標準パターンを用いて上
記方法にて判別を行っているので、より少ないデータ処
理にて信頼性の高い判別を行うことができるとともに、
特徴データの選定も簡単になる。

【００２４】

【実施例】以下、本発明の第１実施例について図１〜図
１２を参照しながら説明する。

【００２５】図１は属性判定方法の学習方法の処理の流
れを示し、図２は属性判定方法の処理の流れを示す。入
力パターンを得るまでは従来の技術と同様であり、２値
にメッシュ化されたメッシュパターンに対して以下の処
理を行う。ここでは、横５×縦９のメッシュパターンを
用いて説明する。

【００２６】まず、学習方法について説明する。これ
は、文字判定に必要な特徴量からメンバシップ関数を求
めるために行う。

【００２７】特徴量抽出回路１にスタンダードメッシュ
パターンデータｉが入力され、ここで必要とする特徴量
ｊが出力される。ここでは、特徴量ｊとして縦構造ベク
トル和１、縦構造ベクトル和２、横構造ベクトル和１、
横構造ベクトル和２、上下面積和、左右面積和、上下交
差本数の特徴量１〜７を用いる。

【００２８】縦構造ベクトル和１（特徴量１：ＵＤＶＥ
Ｃ）は、図３に示すように、列ごとに上から下へ進み、
最初に黒のメッシュに当たるまでの白のメッシュの数を
求め、これを合計する特徴量である。図３の「Ｕ」の例
では縦構造ベクトル和１は、０＋８＋８＋８＋０＝２４
となる。

【００２９】縦構造ベクトル和２（特徴量２：ＤＵＶＥ
Ｃ）は、列ごとに下から上へ進み、最初に黒のメッシュ
に当たるまでの白のメッシュの数を求め、これを合計す
る特徴量である。図３の「Ｕ」の例では縦構造ベクトル
和２は、０＋０＋０＋０＋０＝０となる。

【００３０】横構造ベクトル和１（特徴量３：ＬＲＶＥ
Ｃ）は、図４に示すように、行ごとに左から右へ進み、
最初に黒のメッシュに当たるまでの白のメッシュの数を
求め、これを合計する特徴量である。図４の「３」の例
では横構造ベクトル和１は、０＋４＋４＋４＋０＋４＋
４＋４＋０＝２４となる。

【００３１】横構造ベクトル和２（特徴量４：ＲＬＶＥ
Ｃ）は、行ごとに右から左へ進み、最初に黒のメッシュ
に当たるまでの白のメッシュの数を求め、これを合計す
る特徴量である。図４の「３」の例では横構造ベクトル
和２は、０＋０＋０＋０＋０＋０＋０＋０＋０＝０とな
る。

【００３２】上下面積差（特徴量５：ＵＤＤＩＦＦ）
は、図５に示すように、上半分の横４×縦４の黒の面積
と下半分の横４×縦４の黒の面積との差を求めた特徴量
である。図５の「Ｕ」の例では上下面積差は８−１１＝
−３となる。

【００３３】左右面積差（特徴量６：ＬＲＤＩＦＦ）
は、図５に示すように、左半分の横２×縦９の黒の面積
と右半分の横２×縦９の黒の面積との差を求めた特徴量
である。図７の「Ｕ」の例では上下面積差は１０−１０
＝０となる。

【００３４】上下交差本数（特徴量７：ＶＣＮ）は、図
６に示すように列中央で上から下へ進み、黒に交差する
回数を求めた特徴量である。図６の「３」の例では上下
交差本数は３となる。

【００３５】特徴量抽出回路１で求めた特徴量ｊは、メ
ンバシップ関数抽出回路２に入力され、メンバシップ関
数ｋが出力される。メンバシップ関数とは、スタンダー
ドメッシュパターンデータの特徴量（以下、基準特徴量
と呼ぶ）を中心として一定の広がりを持った入出力関数
であり、判定すべきメッシュパターンデータの特徴量ｊ
を入力とし、基準特徴量とのずれを評価する寄与値を出
力する。ここでは、基準特徴量が入力の時に最大値１．
０を出力するとして、これを中心に広がる関数を形成す
るように作成する。図７はメンバシップ関数を示し、横
軸に特徴量、縦軸に寄与値を取っている。図７の例で
は、基準特徴量Ｓに対し、幅Ａで寄与値１．０を出力す
る区間が続き、幅Ｂで寄与値０．０〜１．０を出力する
区間が続き、幅Ｃで寄与値−１．０〜０．０を出力する
区間が続くように形成している。なお、各幅Ａ、Ｂ、Ｃ
は他のスタンダードメッシュパターンデータの特徴量と
の重なりを考慮して経験的に設定する。例えば、各文字
の同じ基準特徴量が０〜３０程度の場合、幅Ａ＝１、幅
Ｂ＝２、幅Ｃ＝５程度を設定するのが適当である。図８
に基準特徴量Ｓが１０、幅Ａ＝１、幅Ｂ＝２、幅Ｃ＝５
の場合のメンバシップ関数を示している。

【００３６】次に、判定方法について、図２を参照して
説明する。これは、文字判定に必要な特徴量を求め、こ
れをメンバシップ関数と比較して寄与値を求め、最後に
総合寄与値を求めることにより判定を行う。

【００３７】特徴量抽出回路３に判定すべきメッシュパ
ターンデータｆが入力され、ここで必要とする特徴量ｊ
が抽出される。ここでは、予め求めている基準特徴量に
対応して縦構造ベクトル和１、縦構造ベクトル和２、横
構造ベクトル和１、横構造ベクトル和２、上下面積和、
左右面積和、上下交差本数を用いる。この特徴量ｊをメ
ンバシップ関数比較回路４に入力し、寄与値ｌを出力す
る。これを、ここで採用した７つの特徴量について同様
に行う。図９は寄与値の求め方を示しており、入力され
る特徴量（２３）に対して出力として寄与値（０．５）
が得られる。

【００３８】寄与値合計回路５に各寄与値ｌが入力さ
れ、総合寄与値ｍが出力される。図１０は、ファジィ推
論方法について示したものである。７つの特徴量に関し
て各文字のメンバシップ関数に対する寄与値を求め、各
文字毎に総合寄与値を横軸に沿って求め、最終的に最も
大きい総合寄与値を持つ文字を判定結果とする。

【００３９】次に、実際のメッシュパターンデータに対
して上記判定処理を適用した例を説明する。

【００４０】図２０に示すスタンダードメッシュパター
ンデータについては図１１に示すように基準特徴量が計
算される。そして、特徴量１〜６については幅Ａ＝１、
幅Ｂ＝２、幅Ｃ＝５で、特徴量７については幅Ａ＝０、
幅Ｂ＝１、幅Ｃ＝１としてメンバシップ関数が作成され
る。以上で学習を終了する。

【００４１】次に、判定処理を図１２を参照して説明す
る。判定対象のメッシュパターン１０を図１２（ａ）に
示し、図１２（ｂ）に各文字に関してそれぞれの特徴量
のメンバシップ関数に対する寄与値と、各文字に対する
総合寄与値を示す。図１２（ａ）において、「１」は
黒、「０」は白であり、この対象パターン１０の特徴量
を各々求めると、特徴量１（ＵＤＶＥＣ）は、１＋０＋
０＋０＋０＝１、特徴量２（ＤＵＶＥＣ）は、０＋０＋
０＋０＋０＝０、特徴量３（ＬＲＶＥＣ）は、１＋０＋
４＋３＋２＋１＋０＋０＋０＝１１、特徴量４（ＲＬＶ
ＥＣ）は、０＋０＋０＋１＋２＋３＋４＋４＋０＝１
４、特徴量５（ＵＤＤＩＦＦ）は、８−８＝０、特徴量
６（ＬＲＤＩＦＦ）は、７−７＝０、特徴量７（ＶＣ
Ｎ）は、３である。各文字について各々これらの特徴量
の寄与値を求め、その総合寄与値を求める処理を行う
が、ここでは簡単のために「２」、「３」、「Ｃ」、
「Ｅ」、「Ｉ」、「Ｓ」、「Ｚ」のみを例示し、他の文
字については図示を省略している。各々の文字に対する
総合寄与値は、「２」が７．００、「３」が１．３０、
「Ｃ」が０．１０、「Ｅ」が１．２０、「Ｉ」が４．０
０、「Ｓ」が６．００、「Ｚ」が６．５０であり、対象
パターン１１は最も大きい寄与値を持つ「２」と判定さ
れる。

【００４２】これらの処理は、文字を判定するのに適し
た特徴量を適当に補充・変更することにより、より判定
能力を向上させることが可能である。また、処理が非常
に簡単であるため特徴量の数をかなり多くしても問題に
なることもない。

【００４３】次に、本発明の第２実施例について説明す
る。この実施例は、ＮＮを用いた処理を予備的に行った
後に上記ファジィ推論による判定処理を行うものであ
る。即ち、ＮＮによる判別方法では上記のように精度の
高い判別には問題はあっても、殆どの文字判定において
正答の文字に対応する出力層のニューロンの値は上から
３位以内に入っているので、粗い判別の方法としては簡
単で良い方法であり、本実施例は予めＮＮ処理にて文字
を選択した後、ファジィ推論による判定を行うものであ
る。

【００４４】図１３に文字判定の流れを示している。メ
ッシュパターンデータを作成するまでは上記実施例と同
様である。ステップ＃１で従来例と同様にＮＮ判定処理
を行う。次にステップ＃２でＮＮ判定結果が判定しきい
値以上であれば、ステップ＃３で対応する文字を結果と
する。もし、判定しきい値以下であれば、ファジィ推論
に進むとともにその際にＮＮ判定結果のある程度大きい
値をもつものだけでファジィ推論を行うようにする。こ
のように、ステップ＃４でＮＮ出力データから選別され
たデータのみＮＮ出力データのポイントセットを行う。
ステップ＃５で選別されたデータ（文字）のみの特徴量
の抽出を行う。ステップ＃６で各々のメンバシップ関数
からファジィ推論によりポイントセットを行う。ステッ
プ＃７でファジィ推論判定結果が判定しきい値以上であ
れば、ステップ＃８で対応する文字を結果とする。も
し、判定しきい値以下であれば、ステップ＃９で判定不
可能であるとする。

【００４５】実際のパターンデータに対して適用した例
を説明すると、図２０に示したスタンダードメッシュパ
ターンに対して、判定対象のメッシュパターン１２を図
１４（ａ）に示し、図１４（ｂ）に選択された各文字に
関してＮＮ出力データとそれぞれの特徴量のメンバシッ
プ関数に対する寄与値と、各文字に対する総合寄与値を
示す。ＮＮ出力データは０．０１以上を選択して残し、
その出力データを１０倍してファジィ推論に加えてい
る。最終的に最も大きな総合寄与値を持つ「２」と判定
されている。

【００４６】上述の７つの特徴量以外に適当な特徴量を
加えて全部で２６個の特徴量を選んで、図２３〜図２６
に示した１２０個の文字パターンの判別に適用した具体
適用例においては、正答が１０８／１２０（９０％）、
誤答が１／１２０（１％）、判定不可能が１１／１２
（９％）であった。これは、ＮＮ単独による判定と比較
すると、誤答が１／５に、判定不可能が１／３に低減し
ている。人間が判断しても判断しにくい文字パターンを
含んでいることを考慮すると、判断能力は従来技術と比
較してかなり向上している。

【００４７】なお、上記実施例においては文字認識につ
いて説明したが、分別すべき属性に対して有効な特徴量
を選択し、メンバシップ関数を形成し、ファジィ推論を
行うのであれば、文字認識に限定せずに幅広く応用する
ことができることは言うまでもない。また、上記実施例
ではメッシュデータの中を２値データとして扱ったが、
メッシュデータの中で濃淡値から有効な特徴量を選べる
のであれば適用することができる。また、上記実施例で
は正規化後のメッシュデータから特徴量を抽出したが、
正規化前のデータから有効な特徴量を選べるのであれば
正規化する必要はない。また、寄与値の範囲を−１．０
〜１．０としたが、これに限定されるものではない。ま
た、特徴量の数も限定されない。また、ＮＮと組み合わ
せる際の判定しきい値も適当に設定すれば良い。また、
上記実施例ではファジィ推論による判定時にＮＮ出力デ
ータを加えたが、ＮＮでは文字選択だけを行い、ファジ
ィ推論時にはＮＮ出力データを考慮しなくてもよい。ま
た、ＮＮ出力データを考慮する場合にも、その乗数は判
別対象に応じて任意に設定すればよい。

【００４８】又、本発明の対象となる入力パターンとし
ては、例えば、半導体ウエハや液晶パネル上の識別番
号、ＩＣチップ上の製造番号など、対象物上の文字や記
号や模様などをテレビカメラで撮像した画像から得たパ
ターンには限らない。

【００４９】

【発明の効果】本発明の属性判定方法によれば、以上の
説明から明らかなように、予めニューラルネットワーク
を用いて類似度の高い標準パターンの判定を行って上位
の複数個の標準パターンを選択し、選択した標準パター
ンから求めた複数の特徴データのメンバシップ関数と入
力パターンの複数の特徴データを比較し、全ての特徴量
についてのメンバシップ関数の出力値の総合値を、ニュ
ーラルネットワークを用いて選択した標準パターンに対
して求め、最も総合値の高い標準パターンを判別して属
性判別を行うので、その特徴データを適当に設定するこ
とにより属性判定の正答率を高くでき、信頼性の高い属
性判定ができる。また、処理が非常に単純であるため、
特徴データの数をかなり多くしても処理時間や処理容量
等が問題となることもない。また、本発明の判定方法
は、その仕組みが明確であり、必要な特徴データの組み
合わせができるため、特徴データの補充・変更によりさ
らに的確な属性判定ができるようになり、能力改善も比
較的容易に行うことができる等の効果がある。

【００５０】また、ニューラルネットワークは精細な判
別には問題はあっても粗い判別には効果的であることに
鑑みて、予めニューラルネットワークを用いて類似度の
高い標準パターンの判定を行って上位の複数個の標準パ
ターンを選択し、選択した標準パターンを用いて上記方
法にて判別を行っているので、より少ないデータ処理に
て信頼性の高い判別を行うことができるとともに、特徴
データの選定も簡単になるという効果が得られる。

【００５１】また、ニューラルネットワークによる判別
を予め用いる場合に、属性判定時にニューラルネットワ
ークの出力値を考慮すると、さらに信頼性の高い判別が
できることがある。

【００５２】また、文字の判別に際して、入力パターン
をメッシュパターンとし、特徴データとして上下の縦構
造ベクトル和と、左右の横構造ベクトル和と、上下と左
右の面積差と、上下交叉本数とを用いることにより、文
字の持つ特徴を的確に識別して高い正答率で文字を判別
することができる。

【図面の簡単な説明】

【図１】本発明の属性判定方法の一実施例における学習
方法の処理の流れ図である。

【図２】同実施例における判定方法の処理の流れ図であ
る。

【図３】同実施例における特徴量の縦構造ベクトル和の
説明図である。

【図４】同実施例における特徴量の横構造ベクトル和の
説明図である。

【図５】同実施例における特徴量の面積差の説明図であ
る。

【図６】同実施例における特徴量の上下交差本数の説明
図である。

【図７】メンバシップ関数の説明図である。

【図８】同実施例におけるメンバシップ関数の一例の説
明図である。

【図９】同実施例における寄与値の求め方の説明図であ
る。

【図１０】同実施例におけるファジィ推論方法の説明図
である。

【図１１】同実施例におけるスタンダードメッシュパタ
ーンデータに対応する各基準特徴量を示す図である。

【図１２】同実施例における対象パターン「２」に対応
する判定結果を示す図である。

【図１３】本発明の属性判定方法の他の実施例における
処理の流れ図である。

【図１４】同実施例における対象パターン「２」に対応
する判定結果を示す図である。

【図１５】文字認識装置の概略構成図である。

【図１６】従来例の文字認識装置の画像処理部の構成図
である。

【図１７】２値化された画像の説明図である。

【図１８】文字切り出しされた画像の説明図である。

【図１９】メッシュパターンデータへの変換の説明図で
ある。

【図２０】標準パターンデータの説明図である。

【図２１】ニューラルネットワークの構成の説明図であ
る。

【図２２】ニューラルネットワークのデータ入力時の反
応の説明図である。

【図２３】判定対象が「２」の場合における判定検定用
文字データの説明図である。

【図２４】判定対象が「９」の場合における判定検定用
の文字データの説明図である。

【図２５】判定対象が「Ａ」の場合における判定検定用
の文字データの説明図である。

【図２６】判定対象が「Ｆ」の場合における判定検定用
の文字データの説明図である。

【符号の説明】

１特徴量抽出回路２メンバシップ関数抽出回路３特徴量抽出回路４メンバシップ関数比較回路５寄与値合計回路ｆメッシュパターンデータｉスタンダードメッシュパターンデータｊ特徴量ｋメンバシップ関数ｌ寄与値ｍ総合寄与値

フロントページの続き (56)参考文献特開平３−257695（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06K 9/66 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】入力画像に含まれる入力パターンの複数
の特徴データと、前記入力パターンに対し、予めニューラルネットワーク
を用いて類似度の高い標準パターンの判定を行い、その
結果から上位の複数個の標準パターンを選択し、選択し
た標準パターンから求めた特徴データのメンバシップ関
数とを比較し、入力パターンに最も類似度の高い標準パターンを判定す
る属性判定方法であって、入力パターンの各特徴データ
に対する各メンバシップ関数の出力値を得ることを全て
の特徴データに対して行い、全ての特徴データに対する
出力値の総合値を求め、これを判定すべき各標準パター
ンに対して行い、最も総合値の高い標準パターンを判別
することを特徴とする属性判定方法。
【請求項２】総合値にニューラルネットワークの判定
結果を考慮することを特徴とする請求項１に記載の属性
判定方法。
【請求項３】請求項１又は２に記載の属性判定方法に
おいて、入力パターンをメッシュパターンとし、特徴デ
ータとしてメッシュパターンデータを列ごとに上から下
及び下から上に進み黒のメッシュに当たるまでの白のメ
ッシュ数を合計した上下の縦構造ベクトル和と、メッシ
ュパターンデータを行ごとに左から右及び右から左に進
み黒のメッシュに当たるまでの白のメッシュ数を合計し
た左右の横構造ベクトル和と、メッシュパターンデータ
の上半分と下半分及び左半分と右半分の黒の面積差を求
めた上下と左右の面積差と、列中央で上下方向に黒と交
叉する回数を求めた上下交叉本数とを用いて文字認識を
行うことを特徴とする属性判定方法。