JPH0792820B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH0792820B2
JPH0792820B2 JP3035331A JP3533191A JPH0792820B2 JP H0792820 B2 JPH0792820 B2 JP H0792820B2 JP 3035331 A JP3035331 A JP 3035331A JP 3533191 A JP3533191 A JP 3533191A JP H0792820 B2 JPH0792820 B2 JP H0792820B2
Authority
JP
Japan
Prior art keywords
character
pixel
image
characters
identifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3035331A
Other languages
English (en)
Other versions
JPH06282686A (ja
Inventor
ラリー・アンソニー・ウィル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH06282686A publication Critical patent/JPH06282686A/ja
Publication of JPH0792820B2 publication Critical patent/JPH0792820B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/184Extraction of features or characteristics of the image by analysing segments intersecting the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は書類上の文字を認識する
方法とシステムに係り、特に文字、特に手書きされた、
特に小切手またはその他の金融関係の書類上の文字を識
別する新規な方法とシステムに関するものである。
【0002】
【従来の技術】従来、書類上の文字を認識または識別す
る多くの方法が提案されている。
【0003】これらのシステムでは、文字の特定の特徴
に対してテンプレートかテスト済みのキー領域を通常は
使用している。即ち、文字の組の各々の文字に対するテ
ンプレートまたはオーバレイは認識されるべき文字に対
して整合され、また文字は、これがオーバレイの予め設
定された公差内で整合した場合に認識される。
【0004】ディジタル処理の場合、文字認識のための
各種の手法が知られており、これには、前回の質問に対
する答えに基づいて次の質問を出し、次に最後に文字が
何であるかに関する結論に達するツリー論理または神経
回路網論理が使用される。
【0005】
【発明が解決しようとする課題】これらのシステムは一
般に、使用する記憶および処理が少ないという点で効果
があるが、これらシステムは文字の識別、特にフリーハ
ンド即ち無拘束で書かれた文字の識別には不適切なこと
が見出されている。
【0006】従って、文字を識別する従来のシステムに
は望ましくない制限と欠点が存在する。これは、無拘束
のフィールドにおいて手書き文字の認識を行うときに特
に問題となる。
【0007】本発明は、文字を認識する方法とシステム
を提供することにより従来のシステムの制限と欠点を克
服するものである。
【0008】
【課題を解決するための手段】本発明は、ルックアップ
テーブルで使用される履歴確率を計算するテストまたは
トレーニングセットを使用する。要求される精度に従っ
て、このトレーニングセットは必要なものとして展開可
能である。
【0009】このシステムは更に、特定の認識された文
字を求める信頼レベルがプログラム内かオペレータ制御
のいずれかによりセットまたはリセットされる。即ち、
如何なる文字も不当には読み取られず、また読取りに対
する付加的な失敗が受容できうことが重要なシステムに
おいては、成功裡の認識に対するしきい値は非常に高く
設定される。不当な読取り(置換)に対するペナルティ
が重要ではない他のシステムにおいては、しきい値は、
パーセントを読み取る失敗が非常に低く保たれるように
非常に低く設定可能である。
【0010】このシステムは更に、第1の選択と第2の
選択の間の確率の差が調整自在である点で柔軟である。
即ち、第2の選択が第1の選択と(予め設定された範囲
内で)殆ど同じのときは文字は誤った認識を回避するた
め読み取られないものとして排除可能である。
【0011】
【実施例】第1図はIBMのモデル3890イメージ・
プラス(商標)高性能処理システム(Image Pl
us High Performance Trans
action System)などの書類画像処理シス
テム11に含まれる画像捕捉システム10を示す図であ
る。通常、このようなシステムではトランスポート13
を使用し、書類が通過するときプログラム制御下で書類
から読み取られた情報内容に基づき、書類12を一枚ず
つ図示しない入力ホッパから複数の他の処理ステーショ
ンを逐次通し、最後に幾つかの出力ホッパまたはポケッ
トの1つに移動させるように構成されている。この書類
移送は高速で行われる(システムが分あたり2400枚
の書類を処理することを可能にするモデル3890XP
では秒あたり300インチ以上)。 収束用レンズ15
を有する光学システム14は拡張アレイ17を使用し、
書類の黒・白またはグレイ特性のいずれかに基づいて、
書類の各ライン16の電気的表示を捕捉するようにして
いる。システムの分解能は設計および構成要素による
が、例えば各々のインチは垂直および水平方向の各々で
240画素に分割される。
【0012】拡張アレイ17は、Rectionなど各
種の製造業者から市販されており、一連の電荷結合素子
を備え、これらの電荷結合素子においては各々のセンサ
に入射した光により光量に比例した電気信号が発生され
る。各々の素子からの電気信号はライン18上をアナロ
グ・ディジタル変換器19に送られ、この変換器はしき
い値処理と共に各々の画素をディジタル表示に変換し、
これは次にメモリ20に記憶され、必要に応じて記憶お
よび/または他の処理に供される。画像捕捉および処理
システムの詳細は、ここで特に引用される米国特許第
4,888,812号明細書に示されている。
【0013】書類12は印刷または手書きの多くの指標
を有する。他の書類ではタイプされた文字または機械印
刷文字を有する。この指標には、日付フィールド22,
受取人ライン24,金額フィールド26(殆どの場合が
ワードよりも数値からなるコーテシー金額フィールド」
と呼ばれることもある),ワードで表した金額を含むフ
ィールド28,署名30,およびMICRコードライン
32が含まれる。
【0014】図2は拡大された図1の書類12からの金
額フィールド26を示す図である。この金額フィールド
26には、参照番号30により示された「$」および内
部に金額フィールドを有するボックス32が含まれる。
参照番号34により示される点線は金額フィールドが如
何にセグメント化されるかを示すものである。このセグ
メント化は幾つかの公知の方法の1つにより実現される
が、それらの1つは同時に出願される特許出願「書類上
の金額フィールドにおける文字画像をセグメント化する
方法」(以下、セグメント化特許という)に示されてい
る。
【0015】セグメント化の結果、各々の文字は別々に
識別され、可能な場合には、本発明の文字認識アルゴリ
ズムに供される。
【0016】この場合、参照番号36は、金額フィール
ドにおいて小数点の後で1の前に生じる0を示してい
る。図4,5および9に関連した後の説明で、認識プロ
セスにおけるこの文字の使用を説明する。
【0017】図3は本発明における論理または流れを示
す図である。ブロック50において、金額フィールドな
どのフィールドが識別され、必要ならば他の処理のため
に、小さいが別のフィールドにコピーされる。これは、
同時に出願される特許出願「書類上の金額フィールドの
位置を特定する方法」により都合よく実現される。次
に、ブロック52において、画像は、「$」,小数点,
または認識されるべきその他の個々の文字などの個々の
文字または認識されるべきその他の指標にセグメント化
される。これは、好適な実施例のセグメント化特許に示
されるようにまたは他の類似の処理システムにより実施
することができる。
【0018】次に、ブロック54において、画像は正規
化され、次に視野(view)パターンがブロック56
で計算される。これの全ては図6から図9に関連して、
特に図6に関連してより詳細に説明されるが、これらの
視野パターンはブロック54からの正規化された画像中
の黒画素の各々において視野パターンをとることを含ん
でいる。次に、ブロック58において視野パターンが使
用される。本発明はトレーニングセットを用いて発生さ
れるベクトルの各々に対する確率を計算することを期待
するので、トレーニングモードにおいてこれらの視野が
用いられルックアップテーブルを生成する。
【0019】本発明は正規化された画像、即ち、単一画
素幅のスケルトンまたはストローク幅に低減されたもの
に関連して説明されている。これがなされないときは、
次の黒画素がどこにあるかということだけでなく、黒セ
グメントがそこに如何に長くあるかを知ることが望まれ
る。これは、図7に、また図8および図9のベクトルに
対して1つ以上の付加的視野の記述が付加可能であるこ
とを示唆するものである。これは、幾つかの場合には、
認識の精度に付加され、更に要求される記憶および処理
能力にほぼ付加される。
【0020】未知文字xの視野パターンは予め生成され
たテーブルに適用されて、所定のベクトル(図8)が文
字の組の各文字に関係するという確率を求めることにな
る。
【0021】図4は図2における金額フィールドの文字
0を示す図である。図示のように、複数の行(R0〜R
25)と複数の列(列C0〜C22)とが、文字0を含
むものとして識別されている長方形アレイを構成してい
る。
【0022】次に、この文字は正規化されて、行(R0
〜R9)および列(C0〜C7)を含む図5の画像を生
成する。
【0023】図6は、円で囲まれている中央画素60
と、8個の識別された周囲方向の各々に延びる8本の放
射ライン61〜68、即ち画素60から北(N)を見る
ライン61、北東(NE)を見るライン62、東(E)
を見るライン63、更に北西(NW)を見るライン68
までのラインを有する異なる文字(数字7)を示す図で
ある。全体の文字ボックスを通して上記ラインの各々に
沿って、黒画素がその経路内にあるか、もしあるならど
こにあるかということが問題である。
【0024】図7に示したように、任意の特定の方向に
見る所与の画素からの視野記述はいずれもその経路に黒
画素を含まず(この場合、それには0の視野番号が割り
当てられる。)、その経路内の隣接画素は黒であるか
(その場合1の視野番号が割り当てられる)、または隣
接画素はその経路内の最終的に黒が続く白である(この
場合、2の視野番号が割り当てられる)。2の視野番号
は更に、対角線が単に1/2 離れた2つの黒の間を通
る場合にも割り当てられる。これらの視野番号および視
野記述は幾分任意に割り当てられ、また記述および番号
付けの他の方法を使用することもできる。
【0025】従って、図8において、図6の画素60に
対する視野パターンが識別されており、即ち、画素60
から北(N)を見るライン61に沿う方向で、隣接画素
は、後に黒画素が続く白であり、2の視野番号が割り当
てられる。ライン62に沿う北東(NE)方向では、隣
接画素は黒であり、北東方向の1の視野番号が割り当て
られる。ライン63に沿う東(E)方向では、画素60
から文字の東方向エッジへの黒画素は存在せず、従って
視野番号は0である。同様に、南東(SE)方向では、
ライン65に沿う南(S)方向の場合と同様に経路内に
は黒画素はやはり存在しない。画素60から南西(S
W)を見るライン66に沿い、隣接画素は黒であり、1
の視野番号が割り当てられる。画素60から西(W)の
方向では径路内には黒画素は存在せず、0の視野番号が
割り当てられ、またライン68に沿う北西(NW)方向
では黒画素が最後に続く隣接白画素が存在し、北西方向
に対して2の視野番号が割り当てられる。
【0026】図5のパターンにこの方法を適用すると、
図9に示したテーブルが生成される。このテーブルにお
いて、位置R1,C5に対応するライン1は、それぞれ
北(N),北東(NE),東(E),南東(SE),南
(S),南西(SW),西(W),および北西(NW)
の方向の「00122100」のベクトルを有してい
る。
【0027】ライン2はR1,C6に配置された次の黒
画素に対する類似の視野パターンである。これは各々の
黒画素に対して継続し、ここではそれらの幾つかのみが
リストされている。
【0028】次に、ライン1に対して生成されたベクト
ルの各々に対して(例えば、ベクトル0012210
0)、このベクトルが許容された各々の文字状態に関わ
るという、ルックアップテーブルに確立され記憶されて
いる確率が存在する。設定された番号に対して、許容さ
れる文字状態は番号0〜9であるが、金額フィールド
は、$,小数点,および許容され認識が試みられる他の
記号などの他の文字を有する。
【0029】ライン1〜Nに対する確率の全てが決定さ
れた後、識別されるべき文字の確率は組内の第1の文字
であり、個々の確率の積であり、即ち、組内の第1文字
に対してそれはA1×B1×C1×D1×E1×〜×I
1になる。この文字が組内の第2文字である確率はA2
×B2×〜×I2になる。
【0030】次に、これらの積は正規化され、また1要
素である未知文字の確率は、それが次の要素である確率
と比較可能である。このとき適切な認識アルゴリズムが
用いられて、成功裡に認識される文字を考慮するために
絶対値の確率が如何に高く要求されるか、第2に第1の
候補が、問題が生じる前に第2の候補よりどれ程大きく
なければならないかに関するしきい値限界を設定するこ
とができる。
【0031】本発明の精神から逸脱せずに本発明に対す
る多くの変形および適合が効果的になされ得ることは勿
論である。例えば、正規化が開示され、いくつかの場合
にはそれが望ましいが、他の場合には望ましくない。更
に、割り当てられた視野番号および方向の番号は任意で
あり、所望に応じて、また処理システムにより許容され
るように増加または減少されてよい。
【0032】
【発明の効果】本発明は、認識される文字の大きさ、個
々の特徴が形成される筆致の方向に特に制限されないと
いう効果を有する。更に、本発明は、ストレイマーク、
筆記者の付加的なマークまたは背景ノイズのいずれか
が、認識プロセスに対して最小に作用するという効果を
有する。本発明には、単一画素のストローク幅へ多重画
素のストローク幅を初めに含む文字画像を正規化しスケ
ルトン化する、望ましいが任意の方法が含まれる。
【図面の簡単な説明】
【図1】本発明に関わる画像書類処理システムを示す図
である。
【図2】図1のサンプル小切手からの金額フィールドを
示す図である。
【図3】本発明の論理のための流れ図である。
【図4】図2の金額フィールドからの文字の画素要素の
マトリクスを示す図である。
【図5】図4の文字のスケルトン化され、正規化された
例を示す図である。
【図6】所与の画素から見られる多重方向ベクトルを展
開するのに有用な視野パターン認識システムを示す図で
ある。
【図7】特定の方向の特定の画素からの視野を記述する
と共にこの視野に対して視野番号を割り当てるテーブル
を示す図である。
【図8】図6の画素に対するサンプルベクトルを示す図
である。
【図9】図5の文字に対する視野ベクトルおよび確率を
含むテーブルを示す図である。
【符号の説明】
10 画像捕捉システム 11 書類画像処理システム 12 書類 13 トランスポート 14 光学システム 15 収束用レンズ 17 拡張アレイ 19 アナログ・ディジタル変換器 20 メモリ
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭53−49918(JP,A) 特開 昭58−200378(JP,A) 特開 昭56−59374(JP,A) 特開 昭56−8169(JP,A)

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】未知文字をそのディジタル画像から認識す
    る方法であって、 前記未知文字の画像中の黒画素を識別するステップと、 画像中の様々な黒画素に対して、複数の方向の各々にお
    ける次の黒画素の位置を識別するステップと、 識別された各々の方向における次の黒画素の位置に基づ
    いて情報のベクトルを発生するステップと、 前記ベクトルを、このベクトルが文字の組の中の各文字
    を識別する確率を示すテーブルと比較するステップと、 各々の画素ベクトルに対して文字の組の中の各文字の確
    率を乗算し、前記未知文字を最高の確率値を生成する文
    字として識別するステップとを含む文字認識方法。
  2. 【請求項2】画像中の黒画素を識別するステップの前
    に、ストロークを可能な単一画素幅に低減するステップ
    を更に含む請求項1記載の文字認識方法。
  3. 【請求項3】各々が隣接する方向から45度隔置された
    8方向の各々に対してベクトルおよび確率を発生する請
    求項1記載の文字認識方法。
  4. 【請求項4】前記次の黒画素の位置を識別するステップ
    とベクトルを発生するステップは、画像中の各黒画素に
    対して行われる請求項2記載の文字認識方法。
JP3035331A 1990-03-12 1991-02-05 文字認識方法 Expired - Lifetime JPH0792820B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/491,895 US5105470A (en) 1990-03-12 1990-03-12 Method and system for recognizing characters
US491895 1990-03-12

Publications (2)

Publication Number Publication Date
JPH06282686A JPH06282686A (ja) 1994-10-07
JPH0792820B2 true JPH0792820B2 (ja) 1995-10-09

Family

ID=23954115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3035331A Expired - Lifetime JPH0792820B2 (ja) 1990-03-12 1991-02-05 文字認識方法

Country Status (3)

Country Link
US (1) US5105470A (ja)
EP (1) EP0446632A3 (ja)
JP (1) JPH0792820B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5303311A (en) * 1990-03-12 1994-04-12 International Business Machines Corporation Method and apparatus for recognizing characters
US5428692A (en) * 1991-11-18 1995-06-27 Kuehl; Eberhard Character recognition system
US5481621A (en) * 1992-05-28 1996-01-02 Matsushita Electric Industrial Co., Ltd. Device and method for recognizing an image based on a feature indicating a relative positional relationship between patterns
CA2108536C (en) * 1992-11-24 2000-04-04 Oscar Ernesto Agazzi Text recognition using two-dimensional stochastic models
JPH07319924A (ja) * 1994-05-24 1995-12-08 Matsushita Electric Ind Co Ltd 手書き電子文書のインデックス付けおよび探索方法
US5692069A (en) * 1995-03-17 1997-11-25 Eastman Kodak Company Apparatus for performing character segmentation using slant histograms
US6094506A (en) * 1995-10-25 2000-07-25 Microsoft Corporation Automatic generation of probability tables for handwriting recognition systems
US6731803B1 (en) 1999-07-12 2004-05-04 Advanced Recognition Technologies, Ltd Points based handwriting recognition system
US7010166B2 (en) * 2000-11-22 2006-03-07 Lockheed Martin Corporation Character recognition system and method using spatial and structural feature extraction
CA2375355A1 (en) * 2002-03-11 2003-09-11 Neo Systems Inc. Character recognition system and method
US7639259B2 (en) * 2006-09-15 2009-12-29 Seiko Epson Corporation Method and apparatus for preserving font structure
GB2452513A (en) * 2007-09-05 2009-03-11 Sony Corp Image recognition including modifying width of image
US10725650B2 (en) * 2014-03-17 2020-07-28 Kabushiki Kaisha Kawai Gakki Seisakusho Handwritten music sign recognition device and program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2978675A (en) * 1959-12-10 1961-04-04 Bell Telephone Labor Inc Character recognition system
US4115760A (en) * 1974-11-18 1978-09-19 Fujitsu Limited Figure pre-processing device
US4177448A (en) * 1978-06-26 1979-12-04 International Business Machines Corporation Character recognition system and method multi-bit curve vector processing
JPS6279582A (ja) * 1985-10-03 1987-04-11 Ricoh Co Ltd 文字認識用辞書作成方式
US4888812A (en) * 1987-12-18 1989-12-19 International Business Machines Corporation Document image processing system

Also Published As

Publication number Publication date
JPH06282686A (ja) 1994-10-07
US5105470A (en) 1992-04-14
EP0446632A3 (en) 1993-03-24
EP0446632A2 (en) 1991-09-18

Similar Documents

Publication Publication Date Title
CA1160347A (en) Method for recognizing a machine encoded character
US5504822A (en) Character recognition system
Mohammad et al. Optical character recognition implementation using pattern matching
US4837842A (en) Character and pattern recognition machine and method
CN109740606B (zh) 一种图像识别方法及装置
US6807304B2 (en) Feature recognition using loose gray scale template matching
Shinde et al. Text pre-processing and text segmentation for OCR
RU2621601C1 (ru) Устранение искривлений изображения документа
US5915039A (en) Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition
US7305131B2 (en) Extracting graphical bar codes from an input image
MX2007010180A (es) Importacion inteligente de informacion de la interfaz de usuario de aplicacion del exterior utilizando inteligencia artificial.
JPH0792820B2 (ja) 文字認識方法
Yadav et al. A robust approach for offline English character recognition
Den Hartog et al. Knowledge-based interpretation of utility maps
US4776024A (en) System for segmenting character components
US6240209B1 (en) Method for deriving character features in a character recognition system
US6694059B1 (en) Robustness enhancement and evaluation of image information extraction
Ullmann Picture analysis in character recognition
Choudhary et al. Offline handwritten mathematical expression evaluator using convolutional neural network
Khuspe et al. Robust image forgery localization and recognition in copy-move using bag of features and SVM
JP2985893B2 (ja) パターン認識装置
US5872730A (en) Computerized correction of numeric data
US5307424A (en) Character recognition system
JPH07168910A (ja) 文書レイアウト解析装置及び文書フォ−マット識別装置
US5408540A (en) Character slant recognition in a word image