JPH0737041A

JPH0737041A - パターン認識方法

Info

Publication number: JPH0737041A
Application number: JP6167405A
Authority: JP
Inventors: Udo Maier; ウド・マイエル; Werner Ruppert; ベルナー・ルペルト
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1993-07-01
Filing date: 1994-06-27
Publication date: 1995-02-07
Anticipated expiration: 2013-01-19
Also published as: DE69315990D1; EP0632404A1; EP0632404B1; JP2700131B2; DE69315990T2

Abstract

(57)【要約】【目的】完全自動特徴生成技術を可能にし、極めて短
い時間での新しい文字クラスのトレーニングを可能にす
る。【構成】マスタパターンおよびサンプルパターンをカ
バーする部分領域に加えて、マスタパターンおよびサン
プルパターンの領域をカバーしない部分領域を使用す
る。正負の特徴係数を有すると共に、異なる重み係数を
組み入れた区分特徴および反対特徴が形成されている。
各意味クラスに対し、異なる形状クラスが統計的手段に
よって生成され、重み付けされた正の区分特徴が得られ
る。これと並行して、分類精度をかなり増大させる重み
付けされた反対特徴をトレーニングする。本発明の方法
は、銀行業務の要求にしたがって、例えば低印字品質の
文字の認識のために高精度の分類手段を実現する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、パターン認識方法およ
びパターン認識処理において使用される特徴マスクの生
成方法に関する。

【０００２】

【従来の技術】例えば光学的手段による印刷され、また
は書かれたテキストの形状のパターン認識は、デジタル
画像処理が存在する限りは必要とされる。一般的に言え
ば、パターン認識は、文字と数字からなる或る未知のパ
ターン、例えばテキストパターンを、多数の標準クラ
ス、即ちアスキー（ＡＳＣＩＩ）コードテーブル内の文
字の１つへ分類することを意味する。

【０００３】この認識処理は、通常、一般的な用語で次
に説明するような異なるステップで行われる。

【０００４】文書の画像は、読み取りヘッドの下を通過
するときに例えば垂直走査で走査される。読み取りヘッ
ドとして、例えば電荷結合素子（ＣＣＤ）アレイを使用
することができる。

【０００５】原画像は、例えば２４０ＰＥＬ／インチ
（画素／インチ）の解像度で捕えられる。原画像におけ
る各ＰＥＬは、ＣＣＤアレイにより測定される画素の強
度の８ビット量子化である。

【０００６】次のステップでは、しきい値処理が原画像
のＰＥＬに適用される。このしきい値処理は動的な処理
とすることができ、または固定されたしきい値を使用す
ることができる。しきい値処理において、各ＰＥＬの強
度は、２値の黒／白画像を生成するために、黒または白
のどちらかにクリップされる。

【０００７】生成された黒／白ビデオ画像は、次のステ
ップではセグメンテーション処理またはフレーミング処
理に入力される。セグメンテーション処理では、トラッ
クバンド内の文字が識別され、文字または一般的に言え
ばパターンは、フレームに登録される。

【０００８】次に行われるステップは、特徴抽出と呼ば
れる。特徴抽出処理は、文字フォントについての情報、
または一般的に言えばパターンの特定セットの異なる形
式と形状についての情報を使用する。これらの特徴は、
文字またはパターン・フラグメントのブール式（Ｂｏｏ
ｌｅａｎｅｘｐｒｅｓｓｉｏｎｓ）である。

【０００９】特に銀行業務の分野で文字認識として広く
使われ知られている文書リーダＩＢＭ３８９０／Ｘ
Ｐ，３８９１／ＸＰおよび３８９２／ＸＰにおいては、
全ての特徴は、使用されるフォントの文字クラス間の高
い識別能力を与えるためマニュアルにデザインされてい
る。例えば、ＯＣＲＡフォントを認識するためには、
９６個の特徴が必要である。またよく知られているＯＣ
ＲＢフォントについては、１０２個の特徴が必要であ
る。

【００１０】追加のフォントが、新たな特徴デザイン開
発サイクル、トレーニング・ラン、特徴の微調整を必要
とするのが、このマニュアルモードの非常に不利な点で
ある。その上、特徴デザインと特徴抽出との間に依存性
が存在し、このプロセスは、非常に労働集約的なもので
あり、或るフォントに対し作業を完了するためには、多
くの場合１チームの技術者を必要とする。特徴抽出処理
において、処理時間を節約するためには、入力文字画像
マトリクス中のテストされるビット数は、最小限に抑え
なければならない。これは、特徴抽出処理の信頼性と実
行速度との間に慎重なかね合い（ｔｒａｄｅ−ｏｆｆ）
を必要とする。また、バッチ向きコンピュータプログラ
ムの助けをかりて、入力文字画像マトリクス中のどのビ
ットをテストするかを選ぶ作業は、認識方法開発技術者
の肩にかかっている。実際的な特徴デザインは、特徴を
抽出する処理をデザインする作業から分離して行うこと
ができないので、この特徴デザイン処理と特徴抽出デザ
イン処理は、非常に労働集約的なものであり、厄介なも
のである。

【００１１】すでに述べたように、各特徴は、ブール式
で記述され、ＡＮＤおよびＯＲ用語を含んでいる。特徴
抽出処理の出力は、特徴ベクトルである。各特徴は、こ
の特徴ベクトルｆのビットで定められる。認識処理の最
後のステップは、線形決定処理と呼ばれている。係数記
憶装置または重みテーブルが、各文字クラスのクラス和
を計算するために特徴ベクトルｆに適用される。最も高
いクラス和から次に高いクラス和を減算したものが、一
定の確信レベルより大きいならば、最も高いクラス和を
有する文字クラスが採用される。

【００１２】ＩＢＭＴｅｃｈｎｉｃａｌＤｉｓｃｌ
ｏｓｕｒｅＢｕｌｌｅｔｉｎ，Ｖｏｌ．３４，Ｎｏ．
４Ａ，Ｓｅｐｔｅｍｂｅｒ１９９１，ｐｐ．４６９−
４７５より、機械印字された固定フォント文字に適した
自動文字認識方法が知られている。この既知の方法は、
特徴デザインおよび特徴抽出のための多くの時間および
労働集約的な処理を排除することを意図している。その
ためには、ニューラルネットワークにラベル付けされた
トレーニングセットを直接に入力することが提案されて
いる。ニューラルネットワーク・トレーニング・アルゴ
リズムは、トレーニングセットの中で文字画像の欠点特
徴を発見し、分類処理において、これらの自己生成特徴
を使用する。

【００１３】この既知の方法は、基礎となる方法論をさ
らに詳細に明らかにすることなく、完全にに相互接続さ
れたフィードフォワード人工ニューラルネットワークを
使用している。それ故、人工ニューラルネットワークを
含まない分類機構への適用は不可能である。

【００１４】

【発明が解決しようとする課題】本発明の目的は、自動
的にパターン認識しおよび特徴マスクを生成する方法を
提供して、時間のかかるマニュアル特徴デザイン処理を
避けることであり、また、人工ニューラルネットワーク
を必要としない分類機構をトレーニングすることができ
る方法を提供することにある。

【００１５】

【課題を解決するための手段】本発明の方法は、区分特
徴と反対特徴を使用し、それ故、例えば数分の非常に短
い時間で、新たな文字クラスのトレーニングをもまた可
能にする完全に自動化された特徴生成技術を可能にす
る。本発明の方法は、通常の動作による同時ラーニング
に適している。各意味クラスに対し、異なる形状クラス
が統計的手段によって生成され、重み付けされた正の区
分特徴が得られる。それと並行して、分類の精度をかな
り増大させる重み付けされた反対特徴をトレーニングす
る。分類処理は、決定方式に従う有望な候補の数を減少
させながら反復して繰り返される。従って、本発明は、
特に低印字品質を有するコードラインフォント文字の高
精度認識を実行する分類手段を提供するものである。そ
れ故、銀行業務の要件は、また、通常のストロークブレ
イク、ボイド、予期しないタッチングストロークを考慮
して、満たすことができる。

【００１６】

【実施例】図１は、文字“３”に対する特徴抽出の例を
示している。この数字は、ピクセル・グリッドで示され
ている。特徴＃１は左上ティップであり、特徴＃２は下
垂直バーであり、特徴＃３は右下カーブである。これら
の特徴は、矢印で示してある。これらの特徴１〜３は、
使用するフォントに依存し、文字“３”でさえ異なるフ
ォントに従って異なっている。ＩＢＭ文書リーダ３８９
０，３８９１および３８９２で使用されているような従
来技術によるそれらの特徴＃１〜３は、形状を考慮し、
およびどの特徴を採用するかの選択を考慮して、マニュ
アルにデザインされている。

【００１７】また、より良い理解のために、既知の線形
決定処理を、図１に示すような特徴＃１，＃２および＃
３を含む特徴ベクトルに関連して説明する。特徴ベクト
ルは、特徴番号または測定値＃１，＃２および＃３を含
む２進形式１１０１を有している（特徴ベクトルにおけ
る０はミスを意味し、１はヒットを意味する）。係数記
憶装置２１にプロダクト（ｐｒｏｄｕｃｔ）が作られ
る。プロダクトは、列における異なる特徴番号およびボ
ックス２２に異なる行で示される異なるクラス０，１，
２，３に関連している。ボックス２３には、クラス和の
結果が示されている。例えばクラス０の和は、特徴ベク
トルを与えるそれらの特徴または測定値として第１の行
の数字−５，−２０および−５０を加算することによっ
て生成されるが、特徴＃２はミスされ、それ故＋８０は
加算されない。このことは、全てのクラスにおいて行わ
れ、示されるように最高値１８２は番号３に与えられ、
次高値３９は番号２に与えられる。このことは、候補テ
ーブル２４に示されている。比較ステップ２５におい
て、最高クラス和１８２と次高クラス和３９との差が、
定数と比較される。その差が、確信レベルを表す定数よ
りも大きいならば、この和に関連するクラスが採用され
る。それ故、決定ボックス２６において、和１８２が＃
“３”に関係するという決定が示されている。従って、
線形決定処理において、次高クラス和だけ減算された最
高クラス和が、一定の確信レベルより大きいならば、最
高クラス和を有する文字クラスが採用される。

【００１８】一般的に言えば、本発明の基本的アイデア
は、マスタ文字またはマスタパターンの領域をカバーし
ないサンプルパターンの部分領域（ｐｉｅｃｅｓ）の利
用にある。このことは、さらに、マスタおよびサンプル
パターンまたはマスタおよびサンプル文字の各々をカバ
ーする部分領域を使用して行われる。マスタ文字の領域
をカバーしないサンプルパターンの部分領域の使用によ
って、この領域においてマッチングする文字部分領域を
有しないマスタ文字への割り当ての確率が減少する。

【００１９】本発明の決定的要因と決定的利点は、分類
のために使われる特徴が、上述した従来技術のようにマ
ニュアルにデザインされず、自動トレーニング処理の結
果であるという点である。それ故、特徴のデザインは、
従来の処理よりもより早く、より費用が安い。テストで
は６０：１の範囲の改良を示した。本発明によるトレー
ニング処理においては、マッチング文字部分領域が、重
み付けされ、重み係数が与えられるばかりでなく、トレ
ーニングサンプルパターンのノンマッチング文字部分領
域をも重み係数が与えられる。その結果は、負および正
の特徴ベクトルである。このことは、劇的にクラス間の
情報距離を増加させ、それ故、認識処理は、より早く、
より効果的で、より確かなものとなる。

【００２０】本発明によれば、マスクおよびサンプルパ
ターンのマッチングおよびノンマッチング部分領域は、
認識処理によって考慮されるので、正規化し、良好に配
列した文字パターンである前提条件を満たさなければな
らない。

【００２１】実施において、正規化し良好に配列した文
字パターンのこの前提条件は、次のステップで達成され
る。１．十分な数、例えば２５６個の灰色レベルによるテキ
ストの画像の捕獲２．（ａ）黒／白画像を得るための、例えば動的クリッ
ピング・アルゴリズムを有するインテリジェント・クリ
ッピング（ｂ）汚れを取り除くための文字領域の背景のクリーニ
ングによる画像の前処理３．認識すべきテキストラインの抽出４．文字またはパターンの各々へのプリントラインのセ
グメンテーション５．文字正規化、例えば、（ａ）各文字の文字角を正規化する傾斜修正（ｂ）ストローク幅の正規化、即ち文字ストロークの幅
の演算画像処理方法による拡張または圧縮（ｃ）サイズの正規化、即ち常に標準サイズが得られる
ように演算画像処理方法による文字の高さと幅のスケー
リング、この標準サイズは任意であるが、固定され、ト
レーニングおよび認識部分に等しくなければならない。６．文字またはパターン各々の配列、即ちデジタル化さ
れた文字またはパターンは、２次元認識パターンマトリ
ックスに配列されなけれならない。このマトリックスの
サイズは任意であるが、固定され、トレーニングおよび
認識部分に等しくなければならない。

【００２２】正規化処理が行われるならば、大文字の手
書き文字および／または数字は、本発明によって処理す
ることができる。特徴マスクの生成のための他の前提条
件は、文字フォントのトレーニングサンプルの十分なセ
ットおよび認識されるパターンセットの存在である。フ
ォントの文字の形状は、フォントの全文字の画像を有す
るトレーニングデッキによって表される。これは、悪い
サンプルと標準的なサンプルと良いサンプル、即ち高品
質文字および低品質文字を含み、標本的でなければなら
ない。トレーニング過程の結果、与えられたフォントは
文字クラスへ分類され、またはより一般的に言えば、与
えられたパターンセットはパターンクラスへ分類され
る。

【００２３】本発明の好適な実施例によれば、実施は異
なるステップで行われる。ステップ１は、理想マスクＫ
_iの生成と呼ばれる。

【００２４】フォントのｎ個の文字クラスｉの各々に対
し、２値理想マスク

【００２５】

【外１】

【００２６】が計算される。この計算の基礎は、ｎ個の
文字クラスの各々のｍ_i（ｉ＝１，２，・・・ｎ）文字
からなる標本的なトレーニングデッキの正規化された２
値文字画像にある。

【００２７】理想マスクＫ_iは、ピクセル単位で文字ク
ラスｉの全てのｍ_i文字マスクを加算することによって
作られる。ｍ_iは、クラスｉの文字の数である。この加
算の結果が、パターンマトリックスであり、各ピクセル
に対する０〜ｍ_iの値は、全文字パターン内の或る位置
におけるピクセルの頻度に依存している。２値パターン
を得るためには、マトリックスは、値Ｃ（０≦Ｃ≦
ｍ_i）によってクリップされる。それ故、再び黒／白２
値パターン表示が生成される。Ｃの値はａ₀×ｍ_iであ
る。ａ₀の値は、実際には０．５〜０．８の範囲にあ
る。それは、走査装置に依存している。Ｃより大きい全
てのピクセル値は１にセットされ、他は０にセットされ
る。

【００２８】図３には、クラス“３”，“８”および
“−”の３文字に関するフォントの理想マスクの例が示
されている。これらの理想マスクＫ３，Ｋ８，およびＫ
−は、理想マスクによって占められた位置にピクセル値
１によって表されている。それらは、後の認識過程の基
礎となるサイズと形状を有する正規化されたフレーム内
に示されている。文字３の理想マスクＫ３は、このフォ
ントが３つの文字の内の１つであることを要求する各位
置で図式的に１によって示されている。文字８の理想マ
スクＫ８および記号“−”の理想マスクＫ−についても
同様である。

【００２９】本発明による次のステップは、特徴クラス
ｆ_iが計算される特徴マスク初期化処理である。特徴ク
ラスｆ_iのこの計算のためには、フォント内のクラスま
たはマスクの各々ｉの各理想マスクＫ_iは、フォント内
の文字数＋１である（ｎ＋１）が乗算される。この乗算
の結果から、存在する全てのｎ個の理想マスクの和が減
算される。この計算は、文字マトリックス内のピクセル
を単位として行われ、結果は、文字またはパターンｉの
特徴クラスｆ_iである。これは、式

【００３０】

【数３】

【００３１】に従う。

【００３２】図４には、特徴マスクｆ３，ｆ８およびｆ
−の例が示されている。これらの３つの特徴の外に、３
つの理想文字マスクＫ３，Ｋ８およびＫ−の和が示され
ている。例えば、文字３の特徴マスクを計算する場合、
図３に示される理想マスクＫ３におけるピクセルマスク
値は、４が乗算され、そしてその結果から図４の右側に
に示される和が減算される。その結果は、図４の左側に
ｆ３として示されている。同じ方式が、図４に示された
特徴マスクｆ８およびｆ−を計算するために適用され
る。

【００３３】図４にさらに示されているように、特徴マ
スクｆ３には、指示値が−１である２つの領域４１が存
在する。特徴クラスｆ３の他の全ての領域では、値は１
または２のどちらかである。本発明によれば、正の値は
区分特徴であると認められ、負の値は反対特徴であると
認められる。図に示されるようなそれらの負の重みは、
この特徴マスクｆ３を例えば特徴マスクｆ８と区別する
のに非常に有用である。文字３により示されるのと同じ
位置領域４２に、文字８の増大された区分特徴がある。
本発明による反対特徴の貢献は、領域４３のみが、文字
によって示された正の値を含んでいる特徴マスクｆ−に
極めて明確に見い出される。“８”の形状における他の
全ての値は、−１か−２のどちらかの値であり、それ
故、これらの領域では、領域４４または４５のような他
の領域に強い反対特徴が存在することを示している。

【００３４】特徴クラス初期化のステップの際、正規化
係数Ｒもまた計算されなければならない。この正規化係
数Ｒは、ｆ_iとＫ_iの乗算の結果であるｖ列ｕ行のマト
リックスの全てのピクセル値の和である。これは、式

【００３５】

【数４】

【００３６】によって与えられる。特徴クラスｆ３，ｆ
８およびｆ−に関連した異なる正規化係数の値は、図４
の関連した特徴マスクの下に、Ｒ₃＝３０，Ｒ₈＝４２
およびＲ_-＝２のように示される。

【００３７】図５には、ＯＣＲＡフォントの文字０の
特徴マスクの例が示されている。線の間には、異なる正
の重み係数が示されている。文字０の外側と内側には、
０の重み係数と負の重み係数を有する領域が示されてい
る。高い正の重み係数と高い負の重み係数を有する部分
が存在する。図５に示される例は、特徴マスクの実例を
示している。それは、実データトレーニングデッキを有
するトレーニングランの結果である。マトリックスにお
いて数によって示された重み係数は、認識過程において
ピクセルに乗算される数である。

【００３８】図６には、図５に示されているものとわず
かに異なる実例が示されている。文字０の異なる正の重
み係数を有する異なる部分は、異なる灰色レベルによっ
て示されている。灰色レベルが暗くなるに従って、正の
重み係数は高くなる。

【００３９】図７には、文字０の反対特徴の重み係数が
示されている。ここでもまた、重み係数の重要さは、灰
色レベルで示されている。負の重み係数が高くなるに従
って、図７における表示が暗くなることがわかる。

【００４０】図８での説明のために、同じ方式が、文字
４の特徴マスクにおける異なる正の重み係数を示すため
に用いられている。そこでもまた、最も暗い部分は、そ
れぞれ最も重要な、または最も高い区分重み係数を示し
ている。

【００４１】図９には、反対特徴を表す負の値が同じ方
式に従って示されている。

【００４２】以上に、情報距離を増大させる正と負の値
を有するインテリジェント特徴とそれぞれ組合わされた
上述した新しいラーニングまたはトレーニング処理の結
果、本発明が自動特徴生成処理を提供する利点を有する
という発明の最も重要な面を述べてきた。これらのイン
テリジェント特徴は、区分特徴および反対特徴を支援す
るであろう。

【００４３】最後に、認識処理を簡単に説明する。認識
過程の際、走査処理または正規化処理の結果としてのサ
ンプル文字画像パターンは、分類される。それは、どの
文字画像も標準文字のフォント、即ちＯＣＲＡ内のマ
スクまたはクラスに割り当てられることを意味する。こ
の方法の前提条件は、走査後のサンプルパターンの正規
化処理が、トレーニング過程で行われた正規化に等しい
ことである。これは、ピクセル単位の比較によって明白
であり、乗算が行われ、比較される領域が一致しなけれ
ばならない。

【００４４】認識の際、各サンプル文字マトリックスＳ
_k（ｋはサンプル連続番号）は、フォントのマスクまた
はクラスｉの全ての特徴マスクまたは特徴クラスｆ_iが
乗算され、正規化係数Ｒ_iによって除算される。その結
果は、決定値Ｄ_iである。これは、式Ｄ_i＝Ｓ_k×ｆ_i／Ｒ_i に従う。

【００４５】Ｄ_iの最大値は１であるが、通常は１より
小さく、負になることもある。完全なサンプル文字だけ
が、ほぼ１の決定値を示す。どの文字クラスまたは文字
マスクがサンプル文字画像に近いかという決定は、Ｄの
値に依存する。最大値Ｄ_iを有するクラスは、フォント
内の最も可能性のある文字またはパターンとして採用さ
れる。それは、ｉ→ＳもしＤ_i＝ｍａｘならば、Ｓはクラスまたは文字ｉと認識されることを意
味している。

【００４６】図１０には、サンプル文字マトリックスＳ
１（図１０Ａ），Ｓ２（図１０Ｂ），Ｓ３（図１０Ｃ）
の認識の例が示されている。図１０に示された例は、図
３と図４に示された文字に相当する。各図の右側のボッ
クスには、異なる決定値Ｄ３，Ｄ８およびＤ−が、異な
るサンプルに関して示されている。どの決定値がその最
大値を有しているか、そしてそれ故、フォント内のどの
文字に入力サンプルが関係するか容易に識別することが
できる。

【００４７】まとめとして、本発明の構成に関して以下
の事項を開示する。（１）パターン認識処理において特徴マスクを使用した
パターン認識方法において、マスタパターンおよびサン
プルパターンをカバーする部分領域を使用し、さらに、
マスタパターンおよびサンプルパターンの領域をカバー
しない部分領域を使用し、正負の特徴係数を有すると共
に異なる重み係数を組み入れた区分特徴および反対特徴
を形成することを特徴とするパターン認識方法。（２）特徴マスクの生成を、認識されるパターン／文字
フォントの悪い例、通常の例、良い例の十分なセットを
含むトレーニングデータセットから自動的に行うことを
特徴とする上記（１）に記載のパターン認識方法。（３）上記（１）または（２）に記載のパターン認識方
法において、ｎ個のパターンマスクＫ_iの各々のｍ
_i（ｉ＝１，２，３，・・・ｎ）パターンからなるトレ
ーニングサンプルの標本セットの正規化された２値パタ
ーン画像に基づく特定の計算を使用することにより各パ
ターンまたは好適には各文字のそれぞれの理想マスクＫ
_iを生成し、ｍ_iがクラスまたはマスクの各々における
パターン番号であるパターンクラスｉの全ｍ_iパターン
マスクをピクセル単位で加算することにより前記理想マ
スクＫ_iを生成し、前記理想マスクの生成が、各ピクセ
ルに対し０とｍ_iの間の値を有するパターンマトリック
スを生じ、平均的理想パターンを得、パターンマトリッ
クスを、０とｍ_iの間の値Ｃを用いてしきい値処理し、
Ｃより大きいの全てのピクセル値を１にセットし、他を
０にセットして、黒／白２値パターン表示を生成し、フ
ォント内のマスクまたはクラスｉの各々の各理想マスク
Ｋ_iに、フォント内のパターン数＋１である（ｎ＋１）
を乗算し、その結果から、存在する全てのｎ個の理想マ
スクの和を減算する

【００４８】

【数５】

【００４９】ことによって、特徴マスクを計算する、こ
とを特徴とするパターン認識方法。（４）前記特徴マスクｆ_iの計算を、パターンマトリッ
クス内のピクセル単位で行うことを特徴とする上記
（３）に記載のパターン認識方法。（５）前記特徴マスクｆ_iの計算に加えて、正規化係数
Ｒを計算し、計算式は、

【００５０】

【数６】

【００５１】によって与えられ、前記正規化係数Ｒは、
ｆ_i×Ｋ_iの乗算の結果であるｖ列ｕ行のマトリックス
の全ての値、好適にはピクセル値の和であることを特徴
とする上記（３）または（４）に記載のパターン認識方
法。（６）認識過程の際に、各サンプルパターン画像マトリ
ックスＳ_k（トレーニング過程および生成過程の際の理
想マスクＫ_iと同様に、走査後に正規化され、Ｋはサン
プル連続番号である）を、式Ｄ_i＝Ｓ_k×ｆ_i／Ｒ_i に従って、関連フォントのマスクｉの全ての特徴マスク
ｆ_iで乗算し、正規化係数Ｒ_iで除算して、決定値Ｄ_i
を生成することを特徴とする上記（１）〜（５）のいず
れかに記載のパターン認識方法。（７）決定値Ｄが通常は１より小さく負にもなるのに対
して最大決定値Ｄ_iが１であり、前記値１は完全なサン
プルパターンに関連することを特徴とする上記（６）に
記載のパターン認識方法。（８）どのパターンマスクがサンプルパターン画像に最
も近いかという決定を、Ｄの値に基づいて行ない、最大
値Ｄ_iｍａｘを有するマスクｉは、フォントの最も可能
性のあるパターンとして採用し、ｉ→ＳもしＤ_i＝ｍａｘならば、Ｓをマスクまたはパターンｉとしてそれぞれ認
識することを特徴とする上記（６）または（７）に記載
のパターン認識方法。（９）前記パターンが文字および／または数字であり、
および／または前記フォントが好適には、ロゴ，絵文字
およびテクスチャのように標準化されたフォントおよび
画像パターンであることを特徴とする上記（１）〜
（８）８のいずれかに記載のパターン認識方法。（１０）ニューラルネットワークを、理想マスクＫ_iを
生成し、特徴ｆ_iを計算するために使用することを特徴
とする上記（１）〜（９）のいずれかに記載のパターン
認識方法。（１１）前記パターンが正規化された大文字手書き文字
および／または数字であることを特徴とする上記（１）
〜（１０）のいずれかに記載のパターン認識方法。

【００５２】

【発明の効果】本発明は、マスタパターンおよびサンプ
ルパターンをカバーする部分領域に加えて、マスタパタ
ーンおよびサンプルパターンの領域をカバーしない部分
領域を使用し、正負の特徴要素を有すると共に、異なる
重み係数を組み入れた区分特徴と反対特徴を使用し、そ
れ故、例えば数分の非常に短い時間で、新たな文字クラ
スのトレーニングをもまた可能にする完全に自動化され
た特徴生成技術が実現される。

【図面の簡単な説明】

【図１】マニュアルな特徴デザインの例を示す図であ
る。

【図２】マニュアルにデザインされた特徴を抽出する方
法に関連して使用される線形決定処理の例を示す図であ
る。

【図３】理想的なマスクの例を示す図である。

【図４】特徴マスクの例を示す図である。

【図５】ＯＣＲＡフォントの文字“０”の特徴クラス
例を示す図である。

【図６】各区分特徴の異なる重みを表す異なる灰色レベ
ルにより文字“０”の幾つかの特徴を示す図である。

【図７】文字“０”の反対特徴を示し、異なる灰色値に
より反対特徴の異なる重みを表す図である。

【図８】数“４”の異なる重みを表す異なる灰色レベル
により区分特徴を示す図である。

【図９】数“４”の灰色レベル表現により反対特徴を示
す図である。

【図１０】認識例を示す図である。

【符号の説明】

２１係数記憶装置２２，２３ボックス２４候補テーブル２５比較テーブル２６決定ボックス４１，４２，４３，４４，４５領域

フロントページの続き (72)発明者ベルナー・ルペルトドイツショーエンアイヒ 71101 ガルテンシュトラーセ９／１

Claims

【特許請求の範囲】

【請求項１】パターン認識処理において特徴マスクを使
用したパターン認識方法において、マスタパターンおよびサンプルパターンをカバーする部
分領域を使用し、さらに、マスタパターンおよびサンプ
ルパターンの領域をカバーしない部分領域を使用し、正
負の特徴係数を有すると共に異なる重み係数を組み入れ
た区分特徴および反対特徴を形成することを特徴とする
パターン認識方法。
【請求項２】特徴マスクの生成を、認識されるパターン
／文字フォントの悪い例、通常の例、良い例の十分なセ
ットを含むトレーニングデータセットから自動的に行う
ことを特徴とする請求項１記載のパターン認識方法。
【請求項３】請求項１または２記載のパターン認識方法
において、ｎ個のパターンマスクＫ_iの各々のｍ_i（ｉ＝１，２，
３，・・・ｎ）パターンからなるトレーニングサンプル
の標本セットの正規化された２値パターン画像に基づく
特定の計算を使用することにより各パターンまたは好適
には各文字のそれぞれの理想マスクＫ_iを生成し、ｍ_iがクラスまたはマスクの各々におけるパターン番号
であるパターンクラスｉの全ｍ_iパターンマスクをピク
セル単位で加算することにより前記理想マスクＫ_iを生
成し、前記理想マスクの生成が、各ピクセルに対し０とｍ_iの
間の値を有するパターンマトリックスを生じ、平均的理
想パターンを得、パターンマトリックスを、０とｍ_iの
間の値Ｃを用いてしきい値処理し、Ｃより大きいの全て
のピクセル値を１にセットし、他を０にセットして、黒
／白２値パターン表示を生成し、フォント内のマスクま
たはクラスｉの各々の各理想マスクＫ_iに、フォント内
のパターン数＋１である（ｎ＋１）を乗算し、その結果
から、存在する全てのｎ個の理想マスクの和を減算する【数１】ことによって、特徴マスクを計算する、ことを特徴とす
るパターン認識方法。
【請求項４】前記特徴マスクｆ_iの計算を、パターンマ
トリックス内のピクセル単位で行うことを特徴とする請
求項３記載のパターン認識方法。
【請求項５】前記特徴マスクｆ_iの計算に加えて、正規
化係数Ｒを計算し、計算式は、【数２】によって与えられ、前記正規化係数Ｒは、ｆ_i×Ｋ_iの
乗算の結果であるｖ列ｕ行のマトリックスの全ての値、
好適にはピクセル値の和であることを特徴とする請求項
３または４記載のパターン認識方法。
【請求項６】認識過程の際に、各サンプルパターン画像
マトリックスＳ_k（トレーニング過程および生成過程の
際の理想マスクＫ_iと同様に、走査後に正規化され、Ｋ
はサンプル連続番号である）を、式Ｄ_i＝Ｓ_k×ｆ_i／Ｒ_i に従って、関連フォントのマスクｉの全ての特徴マスク
ｆ_iで乗算し、正規化係数Ｒ_iで除算して、決定値Ｄ_i
を生成することを特徴とする請求項１〜５のいずれかに
記載のパターン認識方法。
【請求項７】決定値Ｄが通常は１より小さく負にもなる
のに対して最大決定値Ｄ_iが１であり、前記値１は完全
なサンプルパターンに関連することを特徴とする請求項
６記載のパターン認識方法。
【請求項８】どのパターンマスクがサンプルパターン画
像に最も近いかという決定を、Ｄの値に基づいて行な
い、最大値Ｄ_iｍａｘを有するマスクｉは、フォントの
最も可能性のあるパターンとして採用し、ｉ→ＳもしＤ_i＝ｍａｘならば、Ｓをマスクまたはパターンｉとしてそれぞれ認
識することを特徴とする請求項６または７記載のパター
ン認識方法。
【請求項９】前記パターンが文字および／または数字で
あり、および／または前記フォントが好適には、ロゴ，
絵文字およびテクスチャのように標準化されたフォント
および画像パターンであることを特徴とする請求項１〜
８のいずれかに記載のパターン認識方法。
【請求項１０】ニューラルネットワークを、理想マスク
Ｋ_iを生成し、特徴ｆ_iを計算するために使用すること
を特徴とする請求項１〜９のいずれかに記載のパターン
認識方法。
【請求項１１】前記パターンが正規化された大文字手書
き文字および／または数字であることを特徴とする請求
項１〜１０のいずれかに記載のパターン認識方法。