JP2700131B2 - パターン認識方法 - Google Patents

パターン認識方法

Info

Publication number
JP2700131B2
JP2700131B2 JP6167405A JP16740594A JP2700131B2 JP 2700131 B2 JP2700131 B2 JP 2700131B2 JP 6167405 A JP6167405 A JP 6167405A JP 16740594 A JP16740594 A JP 16740594A JP 2700131 B2 JP2700131 B2 JP 2700131B2
Authority
JP
Japan
Prior art keywords
pattern
feature
mask
character
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP6167405A
Other languages
English (en)
Other versions
JPH0737041A (ja
Inventor
ウド・マイエル
ベルナー・ルペルト
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0737041A publication Critical patent/JPH0737041A/ja
Application granted granted Critical
Publication of JP2700131B2 publication Critical patent/JP2700131B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/772Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、パターン認識方法およ
びパターン認識処理において使用される特徴マスクの生
成方法に関する。
【0002】
【従来の技術】例えば光学的手段による印刷され、また
は書かれたテキストの形状のパターン認識は、デジタル
画像処理が存在する限りは必要とされる。一般的に言え
ば、パターン認識は、文字と数字からなる或る未知のパ
ターン、例えばテキストパターンを、多数の標準クラ
ス、即ちアスキー(ASCII)コードテーブル内の文
字の1つへ分類することを意味する。
【0003】この認識処理は、通常、一般的な用語で次
に説明するような異なるステップで行われる。
【0004】文書の画像は、読み取りヘッドの下を通過
するときに例えば垂直走査で走査される。読み取りヘッ
ドとして、例えば電荷結合素子(CCD)アレイを使用
することができる。
【0005】原画像は、例えば240PEL/インチ
(画素/インチ)の解像度で捕えられる。原画像におけ
る各PELは、CCDアレイにより測定される画素の強
度の8ビット量子化である。
【0006】次のステップでは、しきい値処理が原画像
のPELに適用される。このしきい値処理は動的な処理
とすることができ、または固定されたしきい値を使用す
ることができる。しきい値処理において、各PELの強
度は、2値の黒/白画像を生成するために、黒または白
のどちらかにクリップされる。
【0007】生成された黒/白ビデオ画像は、次のステ
ップではセグメンテーション処理に入力される。セグメ
ンテーション処理では、トラックバンド内の文字が個別
に識別される。
【0008】次に行われるステップは、特徴抽出と呼ば
れる。特徴抽出処理は、文字フォントについての情報、
または一般的に言えばパターンの特定セットの異なる形
式と形状についての情報を使用する。これらの特徴は、
文字またはパターンの断片をブール式で組み合わせたも
のである。
【0009】特に銀行業務の分野で文字認識として広く
使われ知られている文書リーダIBM 3890/X
P,3891/XPおよび3892/XPにおいては、
全ての特徴は、使用されるフォントの文字クラス間の高
い識別能力を与えるため人手によってデザインされてい
る。例えば、OCR Aフォントを認識するためには、
96個の特徴が必要である。またよく知られているOC
R Bフォントについては、102個の特徴が必要であ
る。
【0010】追加のフォントが、新たな特徴デザイン開
発サイクル、トレーニング・ラン、特徴の微調整を必要
とするのが、この人手による作業の非常に不利な点であ
る。その上、特徴デザインと特徴抽出との間に依存性が
存在し、このプロセスは、非常に多くの労働力を必要と
し、或るフォントに対し作業を完了するためには、多く
の場合1チームの技術者を必要とする。特徴抽出処理に
おいて、処理時間を節約するためには、入力文字画像マ
トリクス中のテストされるビット数は、最小限に抑えな
ければならない。これは、特徴抽出処理の信頼性と実行
速度との間に慎重なかね合い(trade−off)を
必要とする。また、バッチ向きコンピュータプログラム
の助けをかりて、入力文字画像マトリクス中のどのビッ
トをテストするかを選ぶ作業は、認識方法開発技術者の
肩にかかっている。実際的な特徴デザインは、特徴を抽
出する処理をデザインする作業から分離して行うことが
できないので、この特徴デザイン処理と特徴抽出デザイ
ン処理は、非常に多くの労働力を必要とし、厄介なもの
である。
【0011】すでに述べたように、各特徴は、ブール式
で記述され、ANDおよびOR用語を含んでいる。特徴
抽出処理の出力は、特徴ベクトルである。各特徴は、こ
の特徴ベクトルfのビットで定められる。認識処理の最
後のステップは、線形決定処理と呼ばれている。係数記
憶装置または重みテーブルが、各文字クラスのクラス和
を計算するために特徴ベクトルfに適用される。最も高
いクラス和から次に高いクラス和を減算したものが、一
定の確信レベルより大きいならば、最も高いクラス和を
有する文字クラスが採用される。
【0012】IBM Technical Discl
osure Bulletin,Vol.34,No.
4A,September 1991,pp.469−
475より、機械印字された固定フォント文字に適した
自動文字認識方法が知られている。この既知の方法は、
特徴デザインおよび特徴抽出のための多くの時間および
労働力を必要とする処理を排除することを意図してい
る。そのためには、ニューラルネットワークにラベル付
けされたトレーニングセットを直接に入力することが提
案されている。ニューラルネットワーク・トレーニング
・アルゴリズムは、トレーニングセットの中で文字画像
の特徴を発見し、分類処理において、これらの発見され
た特徴を使用する。
【0013】この既知の方法は、基礎となる方法論をさ
らに詳細に明らかにすることなく、完全に相互接続され
たフィードフォワード人工ニューラルネットワークを使
用している。それ故、人工ニューラルネットワークを含
まない分類機構への適用は不可能である。
【0014】
【発明が解決しようとする課題】本発明の目的は、自動
的にパターン認識しおよび特徴マスクを生成する方法を
提供して、時間のかかる人手による特徴デザイン処理を
避けることであり、また、人工ニューラルネットワーク
を必要としない分類機構をトレーニングすることができ
る方法を提供することにある。
【0015】
【課題を解決するための手段】本発明の方法は、区分特
徴(正の特徴)と反対特徴(負の特徴)を使用し、それ
故、例えば数分の非常に短い時間で、新たな文字クラス
のトレーニングをもまた可能にする完全に自動化された
特徴生成技術を可能にする。本発明の方法は、通常の動
作の間における同時的学習に適している。各意味クラス
に対し、異なる形状クラスが統計的手段によって生成さ
れ、重み付けされた正の区分特徴が得られる。それと並
行して、分類の精度をかなり増大させる重み付けされた
反対特徴をトレーニングする。分類処理は、決定方式に
従う有望な候補の数を減少させながら反復して繰り返さ
れる。従って、本発明は、特に低印字品質を有するコー
ドラインフォント文字の高精度認識を実行する分類手段
を提供するものである。それ故、銀行業務環境において
通常生じるストロークの切断、ボイド、予期しないスト
ロークの重なりを考慮しても、本発明は銀行業務で求め
られる条件を満たすことができる。
【0016】
【実施例】図1は、文字“3”に対する特徴抽出の例を
示している。この数字は、ピクセル・グリッドで示され
ている。特徴#1は左上部の端であり、特徴#2は下垂
直バーであり、特徴#3は右下カーブである。これらの
特徴は、矢印で示してある。これらの特徴1〜3は、使
用するフォントに依存し、同じ文字“3”であってもフ
ォントが異なれば特徴が異なっている。IBM文書リー
ダ3890,3891および3892で使用されている
ような従来技術によるそれらの特徴#1〜3は、形状を
考慮し、およびどの特徴を採用するかの選択を考慮し
て、人手によりデザインされている。
【0017】また、より良い理解のために、既知の線形
決定処理を、図1に示すような特徴#1,#2および#
3を含む特徴ベクトルに関連して説明する。特徴ベクト
ルは、特徴番号または測定値#1,#2および#3を含
む2進形式1101を有している(特徴ベクトルにおけ
る0はミスを意味し、1はヒットを意味する)。係数記
憶装置21にプロダクト(product)が作られ
る。プロダクトは、列における異なる特徴番号およびボ
ックス22に異なる行で示される異なるクラス0,1,
2,3に関連している。ボックス23には、クラス和の
結果が示されている。例えばクラス0の和は、特徴ベク
トルを与えるそれらの特徴または測定値として第1の行
の数字−5,−20および−50を加算することによっ
て生成されるが、特徴#2はミスされ、それ故+80は
加算されない。このことは、全てのクラスにおいて行わ
れ、示されるように最高値182は番号3に与えられ、
次高値39は番号2に与えられる。このことは、候補テ
ーブル24に示されている。比較ステップ25におい
て、最高クラス和182と次高クラス和39との差が、
定数と比較される。その差が、確信レベルを表す定数よ
りも大きいならば、この和に関連するクラスが採用され
る。それ故、決定ボックス26において、和182が#
“3”に関係するという決定が示されている。従って、
線形決定処理において、次高クラス和だけ減算された最
高クラス和が、一定の確信レベルより大きいならば、最
高クラス和を有する文字クラスが採用される。
【0018】一般的に言えば、本発明の基本的アイデア
は、マスタ文字またはマスタパターンの領域をカバーし
ないサンプルパターンの部分領域(pieces)の利
用にある。このことは、さらに、マスタおよびサンプル
パターンまたはマスタおよびサンプル文字の各々をカバ
ーする部分領域を使用して行われる。マスタ文字の領域
をカバーしないサンプルパターンの部分領域の使用によ
って、この領域においてマッチングする文字部分領域を
有しないマスタ文字への割り当ての確率が減少する。
【0019】本発明の決定的要因と決定的利点は、分類
のために使われる特徴が、上述した従来技術のように人
手によりデザインされず、自動トレーニング処理の結果
であるという点である。それ故、特徴のデザインは、従
来の処理よりもより早く、より費用が安い。テストでは
60:1の範囲の改良を示した。本発明によるトレーニ
ング処理においては、マッチング文字部分領域が、重み
付けされ、重み係数が与えられるばかりでなく、トレー
ニングサンプルパターンのノンマッチング文字部分領域
をも重み係数が与えられる。その結果は、負および正の
特徴ベクトルである。このことは、劇的にクラス間の情
報距離を増加させ、それ故、認識処理は、より早く、よ
り効果的で、より確かなものとなる。
【0020】本発明によれば、マスクおよびサンプルパ
ターンのマッチング部分領域およびノンマッチング部分
領域が認識処理において考慮されるので、文字パターン
が正規化され、良好に配列しているという前提条件が満
たされなければならない。
【0021】実施において、正規化し良好に配列した文
字パターンのこの前提条件は、次のステップで達成され
る。
【0022】1.十分な数、例えば256個の灰色レベ
ルによるテキストの画像の捕獲 2.(a)黒/白画像を得るための、例えば動的クリッ
ピング・アルゴリズムを有するインテリジェント・クリ
ッピング (b)汚れを取り除くための文字領域の背景のクリーニ
ングによる画像の前処理 3.認識すべきテキストラインの抽出 4.文字またはパターンの各々へのプリントラインのセ
グメンテーション 5.文字正規化、例えば、 (a)各文字の文字角を正規化する傾斜修正 (b)ストローク幅の正規化、即ち文字ストロークの幅
の演算画像処理方法による拡張または圧縮 (c)サイズの正規化、即ち常に標準サイズが得られる
ように演算画像処理方法による文字の高さと幅のスケー
リング、この標準サイズは任意であるが、固定され、ト
レーニングおよび認識部分に等しくなければならない 6.文字またはパターン各々の配列、即ちデジタル化さ
れた文字またはパターンは、2次元認識パターンマトリ
ックスに配列されなければならない。このマトリックス
のサイズは任意であるが、固定され、トレーニングおよ
び認識部分に等しくなければならない。
【0023】正規化処理が行われるならば、大文字の手
書き文字および/または数字は、本発明によって処理す
ることができる。特徴マスクの生成のための他の前提条
件は、文字フォントのトレーニングサンプルの十分なセ
ットおよび認識されるパターンセットの存在である。フ
ォントの文字の形状は、フォントの全文字の画像を有す
るトレーニングデッキによって表される。これは、悪い
サンプルと標準的なサンプルと良いサンプル、即ち高品
質文字および低品質文字を含み、標本的でなければなら
ない。トレーニング過程の結果、与えられたフォントは
文字クラスへ分類され、またはより一般的に言えば、与
えられたパターンセットはパターンクラスへ分類され
る。
【0024】本発明の好適な実施例によれば、本発明の
方法は異なるステップで行われる。ステップ1は、理想
マスクKiの生成と呼ばれる。
【0025】フォントのn個の文字クラスiの各々に対
し、2値理想マスク Ki(i=1,2,・・・n、K∈{K1,K2,・・・Kn}) が計算される。この計算の基礎は、n個の文字クラスの
各々の文字mi(i=1,2,・・・n)からなる標本
的なトレーニングセットの正規化された2値文字画像に
ある。
【0026】理想マスクKiは、文字クラスiの複数の
文字miのピクセルを同じピクセル位置において加算す
ることによって作られる。miは、クラスiの文字の番
号である。この加算の結果が、パターンマトリックスで
あり、各ピクセルに対する0〜miの値は、全文字パタ
ーン内の各ピクセル位置におけるピクセルの頻度に依存
している。2値パターンを得るためには、マトリックス
は、値C(0≦C≦mi)によってクリップされる。そ
れ故、再び黒/白2値パターン表示が生成される。Cの
値はa0×miである。a0の値は、実際には0.5〜
0.8の範囲にある。それは、走査装置に依存してい
る。Cより大きい全てのピクセル値は1にセットされ、
他は0にセットされる。
【0027】図3には、クラス“3”,“8”および
“−”の3文字に関するフォントの理想マスクの例が示
されている。これらの理想マスクK3,K8,およびK
−は、理想マスクによって占められた位置にピクセル値
1によって表されている。それらは、後の認識過程の基
礎となるサイズと形状を有する正規化されたフレーム内
に示されている。文字3の理想マスクK3は、このフォ
ントが3つの文字の内の1つであることを要求する各位
置で図式的に1によって示されている。文字8の理想マ
スクK8および記号“−”の理想マスクK−についても
同様である。
【0028】本発明による次のステップは、特徴クラス
iが計算される特徴マスク初期化処理である。特徴ク
ラスfiのこの計算のためには、フォント内のクラスま
たはマスクの各々iの各理想マスクKiは、フォント内
の文字数+1である(n+1)が乗算される。この乗算
の結果から、存在する全てのn個の理想マスクの和が減
算される。この計算は、文字マトリックス内のピクセル
を単位として行われ、結果は、文字またはパターンiの
特徴クラスfiである。これは、式
【0029】
【数3】
【0030】に従う。
【0031】図4には、特徴マスクf3,f8およびf
−の例が示されている。これらの3つの特徴の外に、3
つの理想文字マスクK3,K8およびK−の和が示され
ている。例えば、文字3の特徴マスクを計算する場合、
図3に示される理想マスクK3におけるピクセルマスク
値は、4が乗算され、そしてその結果から図4の右側に
示される和が減算される。その結果は、図4の左側にf
3として示されている。同じ方式が、図4に示された特
徴マスクf8およびf−を計算するために適用される。
【0032】図4にさらに示されているように、特徴マ
スクf3には、指示値が−1である2つの領域41が存
在する。特徴クラスf3の他の全ての領域では、値は1
または2のどちらかである。本発明によれば、正の値は
区分特徴であると認められ、負の値は反対特徴であると
認められる。図に示されるようなそれらの負の重みは、
この特徴マスクf3を例えば特徴マスクf8と区別する
のに非常に有用である。文字3により示されるのと同じ
位置領域42に、文字8の増大された区分特徴がある。
本発明による反対特徴の貢献は、領域43のみが、文字
によって示された正の値を含んでいる特徴マスクf−に
極めて明確に見い出される。“8”の形状における他の
全ての値は、−1か−2のどちらかの値であり、それ
故、これらの領域では、領域44または45のような他
の領域に強い反対特徴が存在することを示している。
【0033】特徴クラス初期化のステップの際、正規化
係数Rもまた計算されなければならない。この正規化係
数Rは、fiとKiの乗算の結果であるv列u行のマトリ
ックスの全てのピクセル値の和である。これは、式
【0034】
【数4】
【0035】によって与えられる。特徴クラスf3,f
8およびf−に関連した異なる正規化係数の値は、図4
の関連した特徴マスクの下に、R3=30,R8=42お
よびR=2のように示される。
【0036】図5には、OCR Aフォントの文字0の
特徴マスクの例が示されている。線の間には、異なる正
の重み係数が示されている。文字0の外側と内側には、
0の重み係数と負の重み係数を有する領域が示されてい
る。高い正の重み係数と高い負の重み係数を有する部分
が存在する。図5に示される例は、特徴マスクの実例を
示している。それは、実データトレーニングデッキを有
するトレーニングランの結果である。マトリックスにお
いて数によって示された重み係数は、認識過程において
ピクセルに乗算される数である。
【0037】図6には、図5に示されているものとわず
かに異なる実例が示されている。文字0の異なる正の重
み係数を有する異なる部分は、異なる灰色レベルによっ
て示されている。灰色レベルが暗くなるに従って、正の
重み係数は高くなる。
【0038】図7には、文字0の反対特徴の重み係数が
示されている。ここでもまた、重み係数の重要さは、灰
色レベルで示されている。負の重み係数が高くなるに従
って、図7における表示が暗くなることがわかる。
【0039】図8での説明のために、同じ方式が、文字
4の特徴マスクにおける異なる正の重み係数を示すため
に用いられている。そこでもまた、最も暗い部分は、そ
れぞれ最も重要な、または最も高い区分重み係数を示し
ている。
【0040】図9には、反対特徴を表す負の値が同じ方
式に従って示されている。
【0041】以上に、情報距離を増大させる正と負の値
を有するインテリジェント特徴とそれぞれ組合わされた
上述した新しいラーニングまたはトレーニング処理の結
果、本発明が自動特徴生成処理を提供する利点を有する
という発明の最も重要な面を述べてきた。これらのイン
テリジェント特徴は、区分特徴および反対特徴を支援す
るであろう。
【0042】最後に、認識処理を簡単に説明する。認識
過程の際、走査処理または正規化処理の結果としてのサ
ンプル文字画像パターンは、分類される。それは、どの
文字画像も標準文字のフォント、即ちOCR A内のマ
スクまたはクラスに割り当てられることを意味する。こ
の方法の前提条件は、走査後のサンプルパターンの正規
化処理が、トレーニング過程で行われた正規化に等しい
ことである。これは、ピクセル単位の比較によって明白
であり、乗算が行われ、比較される領域が一致しなけれ
ばならない。
【0043】認識の際、各サンプル文字マトリックスS
k(kはサンプル連続番号)は、フォントのマスクまた
はクラスiの全ての特徴マスクまたは特徴クラスfi
乗算され、正規化係数Riによって除算される。その結
果は、決定値Diである。これは、式 Di=Sk×fi/Ri に従う。
【0044】Diの最大値は1であるが、通常は1より
小さく、負になることもある。完全なサンプル文字だけ
が、ほぼ1の決定値を示す。どの文字クラスまたは文字
マスクがサンプル文字画像に近いかという決定は、Dの
値に依存する。最大値Diを有するクラスは、フォント
内の最も可能性のある文字またはパターンとして採用さ
れる。それは、 i→S もし Di=max ならば、Sはクラスまたは文字iと認識されることを意
味している。
【0045】図10には、サンプル文字マトリックスS
1(図10A),S2(図10B),S3(図10C)
の認識の例が示されている。図10に示された例は、図
3と図4に示された文字に相当する。各図の右側のボッ
クスには、異なる決定値D3,D8およびD−が、異な
るサンプルに関して示されている。どの決定値がその最
大値を有しているか、そしてそれ故、フォント内のどの
文字に入力サンプルが関係するか容易に識別することが
できる。
【0046】
【発明の効果】本発明は、マスタパターンおよびサンプ
ルパターンをカバーする部分領域に加えて、マスタパタ
ーンおよびサンプルパターンの領域をカバーしない部分
領域を使用し、正負の特徴要素を有すると共に、異なる
重み係数を組み入れた区分特徴と反対特徴を使用し、そ
れ故、例えば数分の非常に短い時間で、新たな文字クラ
スのトレーニングをもまた可能にする完全に自動化され
た特徴生成技術が実現される。
【図面の簡単な説明】
【図1】人手による特徴デザインの例を示す図である。
【図2】人手によりデザインされた特徴を抽出する方法
に関連して使用される線形決定処理の例を示す図であ
る。
【図3】理想的なマスクの例を示す図である。
【図4】特徴マスクの例を示す図である。
【図5】OCR Aフォントの文字“0”の特徴クラス
例を示す図である。
【図6】各区分特徴の異なる重みを表す異なる灰色レベ
ルにより文字“0”の幾つかの特徴を示す図である。
【図7】文字“0”の反対特徴を示し、異なる灰色値に
より反対特徴の異なる重みを表す図である。
【図8】数“4”の異なる重みを表す異なる灰色レベル
により区分特徴を示す図である。
【図9】数“4”の灰色レベル表現により反対特徴を示
す図である。
【図10】認識例を示す図である。
【符号の説明】
21 係数記憶装置 22,23 ボックス 24 候補テーブル 25 比較テーブル 26 決定ボックス 41,42,43,44,45 領域
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭52−77636(JP,A) 特開 昭56−16271(JP,A) 特開 平3−192487(JP,A) 特開 昭63−237186(JP,A) 特開 平2−68681(JP,A)

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】認識すべきサンプル・パターンと照合され
    る特徴マスクを使用したパターン認識方法において、 mi(i=1,2,3,・・・n)をパターン・クラス
    iの各々におけるパターンの数として、パターン・クラ
    スiの複数のパターンmiのピクセルを同じピクセル位
    置において加算することにより、各ピクセルに対し0と
    iの間の値を有するパターンマトリックスを生成する
    ステップと、 前記パターンマトリックスを0とmiの間の値Cを用い
    てしきい値処理し、Cより大きい全てのピクセル値を1
    にセットし、他を0にセットして、黒/白2値パターン
    表示から成る理想マスクKiを生成するステップと、 次式、 【数1】 により、クラスiの各々の各理想マスクKiに、クラス
    数+1である(n+1)を乗算し、その結果から、存在
    する全てのn個の理想マスクのピクセル毎の和から成る
    マトリックスを減算することによって、特徴マスクfi
    を計算するステップと、 を含むパターン認識方法。
  2. 【請求項2】前記特徴マスクfiの計算するステップ
    は、パターンマトリックス内のピクセル単位で行うこと
    を特徴とする請求項1記載のパターン認識方法。
  3. 【請求項3】前記特徴マスクfiの計算に加えて、正規
    化係数Riを次の計算式、 【数2】 によって計算するステップ,及び 各サンプルパターン画像マトリックスSk(Kはサンプ
    ル番号である)を、式 Di=Sk×fi/Ri に従って、関連フォントのマスクiの全ての特徴マスク
    iで乗算し、正規化係数Riで除算して、サンプルパタ
    ーン画像マトリックスSkと特徴マスクとの近似度を決
    定する決定値Diを生成するステップを更に含み、 前記正規化係数Riは、fi×Kiの乗算の結果であるv
    列u行のマトリックスの全てのピクセル値の和であるこ
    とを特徴とする請求項1または2記載のパターン認識方
    法。
  4. 【請求項4】認識過程の際に、各サンプルパターン画像
    マトリックスSk(Kはサンプル番号である)を、式 Di=Sk×fi/Ri に従って、関連フォントのマスクiの全ての特徴マスク
    iで乗算し、正規化係数Riで除算して、決定値Di
    生成することを特徴とする請求項1〜3のいずれかに記
    載のパターン認識方法。
  5. 【請求項5】決定値Diが通常は1より小さく負にもな
    るのに対して最大決定値Diが1であることを特徴とす
    る請求項4記載のパターン認識方法。
JP6167405A 1993-07-01 1994-06-27 パターン認識方法 Expired - Lifetime JP2700131B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP93110481A EP0632404B1 (en) 1993-07-01 1993-07-01 Pattern recognition by generating and using zonal features and anti-features
DE93110481.4 1993-07-01

Publications (2)

Publication Number Publication Date
JPH0737041A JPH0737041A (ja) 1995-02-07
JP2700131B2 true JP2700131B2 (ja) 1998-01-19

Family

ID=8213029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6167405A Expired - Lifetime JP2700131B2 (ja) 1993-07-01 1994-06-27 パターン認識方法

Country Status (3)

Country Link
EP (1) EP0632404B1 (ja)
JP (1) JP2700131B2 (ja)
DE (1) DE69315990T2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19820353C2 (de) * 1998-05-07 2001-06-13 Ibm Verfahren und Vorrichtung zur Erkennung eines Musters auf einer Vorlage
SG158878A1 (en) 2005-01-20 2010-02-26 Sumitomo Bakelite Co Epoxy resin composition, method of rendering the same latent, and semiconductor device
US9898187B2 (en) 2013-06-09 2018-02-20 Apple Inc. Managing real-time handwriting recognition
DK179329B1 (en) 2016-06-12 2018-05-07 Apple Inc Handwriting keyboard for monitors
US11568629B2 (en) 2018-06-06 2023-01-31 Cognex Corporation System and method for finding and classifying patterns in an image with a vision system
US11194467B2 (en) 2019-06-01 2021-12-07 Apple Inc. Keyboard management user interfaces
CN111428688B (zh) * 2020-04-16 2022-07-26 成都旸谷信息技术有限公司 基于mask矩阵的车辆的行驶车道智能识别方法、系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5277636A (en) * 1975-12-24 1977-06-30 Kokusai Denshin Denwa Co Ltd Main wire transfer system by group specification
JPS6037955B2 (ja) * 1979-07-18 1985-08-29 富士通株式会社 文字・記号認識方式
JPH0715703B2 (ja) * 1986-05-16 1995-02-22 富士電機株式会社 文字読取方式
JPS63237186A (ja) * 1987-03-25 1988-10-03 Daihatsu Motor Co Ltd 標準パタ−ン作成装置
JPH0268681A (ja) * 1988-09-05 1990-03-08 Hitachi Ltd 文字認識方法
JPH03192487A (ja) * 1989-12-22 1991-08-22 Canon Inc パターン認識方法
US5204914A (en) * 1991-08-30 1993-04-20 Eastman Kodak Company Character recognition method using optimally weighted correlation

Also Published As

Publication number Publication date
DE69315990D1 (de) 1998-02-05
EP0632404A1 (en) 1995-01-04
EP0632404B1 (en) 1997-12-29
JPH0737041A (ja) 1995-02-07
DE69315990T2 (de) 1998-07-02

Similar Documents

Publication Publication Date Title
US5889885A (en) Method and apparatus for separating foreground from background in images containing text
US5625707A (en) Training a neural network using centroid dithering by randomly displacing a template
US5563403A (en) Method and apparatus for detection of a skew angle of a document image using a regression coefficient
US6807304B2 (en) Feature recognition using loose gray scale template matching
US4757551A (en) Character recognition method and system capable of recognizing slant characters
JPH04361391A (ja) 光学的文字認識システムおよび方法
CN110766017B (zh) 基于深度学习的移动终端文字识别方法及系统
JP2001167131A (ja) 文書シグネチュアを使用する文書の自動分類方法
CA2144793C (en) Method of thresholding document images
JP2000132690A (ja) ト―クン化によるイメ―ジ分割を用いたイメ―ジ処理方法および装置
US5768414A (en) Separation of touching characters in optical character recognition
US6266445B1 (en) Classification-driven thresholding of a normalized grayscale image
JP2700131B2 (ja) パターン認識方法
Liu et al. An object attribute thresholding algorithm for document image binarization
Liu et al. Document image binarization based on texture analysis
Sankur et al. Assessment of thresholding algorithms for document processing
CN111242047A (zh) 图像处理方法和装置、电子设备及计算机可读存储介质
JPH08272902A (ja) 異字体異品質文字の認識方法
EP0800147A2 (en) Degraded character image restoration
JP3463255B2 (ja) 多値画像パターンの認識処理方法
De Nardin et al. A One-Shot Learning Approach To Document Layout Segmentation of Ancient Arabic Manuscripts
KR100573392B1 (ko) 적응학습 모듈이 탑재된 문자인식 기반 대용량 문서디지털화 방법 및 시스템
Kholifah et al. IMAGE BACKGROUND PROCESSING FOR COMPARING ACCURACY VALUES OF OCR PERFORMANCE
JPH1166240A (ja) 文書認識方法および文書認識装置
JP3454626B2 (ja) 大分類方法