JP3035309B2 - キャラクタ・イメージの区分方法 - Google Patents

キャラクタ・イメージの区分方法

Info

Publication number
JP3035309B2
JP3035309B2 JP1273919A JP27391989A JP3035309B2 JP 3035309 B2 JP3035309 B2 JP 3035309B2 JP 1273919 A JP1273919 A JP 1273919A JP 27391989 A JP27391989 A JP 27391989A JP 3035309 B2 JP3035309 B2 JP 3035309B2
Authority
JP
Japan
Prior art keywords
character
pixel
window
field
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1273919A
Other languages
English (en)
Other versions
JPH02165392A (ja
Inventor
フエルドガジヤー オーレツグ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NCR International Inc
Original Assignee
NCR International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NCR International Inc filed Critical NCR International Inc
Publication of JPH02165392A publication Critical patent/JPH02165392A/ja
Application granted granted Critical
Publication of JP3035309B2 publication Critical patent/JP3035309B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は書類上に形成された行及び列のバイナリ・
ピクセルから成るイメ−ジ・デ−タのマトリクスを供給
する光学イメ−ジの処理システムであって、書類内の所
定のフィ−ルドにある文字バイナリ・ピクセルを検索及
び区分して、後の動作(例えば、文字認識)に使用しう
るよう文字のピクセル・デ−タを選出する方法に関す
る。
〔従来の技術〕
近年、書類上に記載されたイメ−ジを読みとってその
情報を処理する傾向が強まってきた。例えば、小切手の
ような書類はそれを移動して走査し、ピクセル・デ−タ
・マトリックスを発生するようにしたものがある。ピク
セルの語は走査した書類の微小領域に対応する画素とし
て定義する。例えば、スキャナから発生した各走査線又
は列について約600又は900ピクセルが存在するであろ
う。書類がスキャナ上を移動すると、一連の走査ピクセ
ル・ラインを発生し、各書類のピクセル・マトリックス
を発生する。
スキャナからのピクセル・マトリックスは、例えば、
しきい値で処理され、各ピクセルをデ−タを表わすバイ
ナリ“1"とデ−タなしを表わすバイナリ“0"とに分類さ
れる。この方式により各書類のイメ−ジに対応するピク
セル・マトリックスをその書類から得ることができる。
そのピクセル・マトリックスはRAMに記憶され、又はCRT
にディスプレイされ、デ−タを完成する際それをオペレ
−タが見ることができる。
ピクセル・マトリックスはその書類に関するイメ−ジ
・デ−タを含む。例えば、小切手のような金融書類を処
理する場合、小切手には機械で読取られるフィ−ルドが
ある。そのフィ−ルドは、例えば、E13B又はCMC7のよう
なホントで印刷される文字デ−タを含む。例えば、1走
査ラインに約200ピクセル/インチの解像度を持つ場
合、ピクセル・マトリックスを使用して光学文字認識に
よりそのフィ−ルドの機械読取が可能である。
〔発明が解決しようとする問題点〕
ピクセル・マトリックスを使用する場合の問題点は読
取られる文字を含むフィ−ルドを検出することが一般に
困難であるということである。特に、読取るべきフィ−
ルドが書類の異なる部分にあるときには難かしい。その
上、読取るフィ−ルドを検出した後、このフィ−ルドか
ら1つの文字のピクセルを分離するため、そのフィ−ル
ドのピクセル・マトリックスを区分する必要があるとい
う問題が生じた。各文字のピクセルが区分された後、そ
のピクセルは文字認識を受けるであろう。この文字認識
技術は、例えば、人工知能回路又は他の回路網を含むか
もしれないということである。
この発明の目的は、読み取るべきフィ−ルドを検出し
た後の文字認識を容易にするため、既知の所定の行位置
に設けられた少なくとも1つの文字フィ−ルドを有する
所定形状の書類に印字された予め規定されたフォント文
字を構成するバイナリ・ピクセル・マトリクスから成る
光学的に読取られたイメ−ジ・デ−タを、1文字分の前
記バイナリ・ピクセル・マトリクス毎に区分する方法を
提供することである。
〔問題点を解決するための手段〕
この発明は上記の問題点を下記のようにして解決し
た。すなわち、この発明によると、既知の所定の行位置
に設けられた少なくとも1つの文字フィ−ルドを有する
所定形状の書類に印字された予め規定されたフォント文
字を構成するバイナリ・ピクセル・マトリクスから成る
光学的に読取られたイメ−ジ・デ−タを、複数の連続す
る前記フォント文字を認識するために、前記バイナリ・
ピクセル・マトリクス毎に区分する方法であって、 (イ) 前記イメ−ジ・デ−タの文字に関する所定数の
行及び列から成るピクセルをカバ−する大きさの審査ウ
ィンドウを選ぶ工程と、 (ロ) 前記文字バイナリ・ピクセルを検索しようとす
る前記所定の行において、区分される一組の文字の各文
字に対する審査ウィンドウ内の各ピクセルについてドッ
トの存在確率値(以下PDFという)を求めて、当該審査
ウィンドウ内の各ピクセルについての合成PDFを計算す
る工程と、 (ハ) 前記審査フィ−ルドを前記文字フィ−ルドの前
記所定の行の一ヵ所の位置に位置付けする工程と、 (ニ) 前記審査ウィンドウ内の各バイナリ・ピクセル
及びそれに関する合成PDFを使用して前記審査ウィンド
ウにおけるPDF合計値を得る工程と、 (ホ) 前記審査フィ−ルドにおける前記審査ウィンド
ウを、同じ行の横方向にピクセル毎に移動して前記
(ニ)の工程を繰り返すことによって前記審査ウィンド
ウの前記PDF合計値の最大値を得る工程と、 (ヘ) 前記工程(ホ)において得られた前記PDF合計
値の最大値に基づいて、前記審査ウィンドウにおける前
記一組の文字の1文字に関するイメ−ジ・デ−タを区分
けする工程と、 (ト) 当該フィ−ルドにおける残りのイメ−ジ・デ−
タについて前記工程(ハ)乃至(ホ)を反復する工程、 の各工程により構成されることを特徴とする方法を提供
するものである。
〔実施例〕
第1図の装置10はこの発明の実施に使用することがで
きるもので、従来方式により書類14をスキャナ18で走査
する走査ライン16の方に書類14のようなものを移動する
物品トランスポ−ト12を含む。スキャナ18は物品14が読
取りうるように移動したときに一連の走査ライン又は列
のピクセル・デ−タを発生する。スキャナ18は、例え
ば、読取を行うため、固定書類上を、例えば、ハンド・
スキャナのようなものを用いるものでもよい。スキャナ
18からの一連の列ピクセル・デ−タは雑音を最小にする
処理を受け、デ−タの存在を示すバイナリ“1"とデ−タ
の不存在を示すバイナリ“0"とになるようしきい値が適
用される。この処理は処理回路20として示す従来の回路
で行われる。処理回路20の出力は書類14のイメ−ジに対
応するマトリックス22のバイナリ・デ−タ又はピクセル
(圧縮されていない)である。デ−タのマトリックス22
は、例えば、約900ピクセル/列を含み、200ピクセル/
インチの解像度を持つ。当然、デ−タ・マトリックス22
の全体的大きさは特定の応用によって異なるが、その大
きさはこの発明の理解にとって重要ではない。スキャナ
18及び物品トランスポ−ト12は別のコントロ−ラ24で制
御するようにしてもよく、デ−タ又はピクセル・マトリ
ックス22の処理に使用されるコントロ−ラ26を使用して
もよい。
コントロ−ラ26(第1図)はこの発明のピクセル・マ
トリックス22の処理に使用することができる従来のコン
トロ−ラである。コントロ−ラ26は読出専用メモリ−
(ROM28)と、ランダム・アクセス・メモリ−(RAM30)
と、キ−ボ−ド(KB)32と、ディスプレイ34と、インタ
フェ−ス36,38と、従来方式で他の成分と相互接続する
インタフェ−ス及び制御ロジック40とを含む。コントロ
−ラ26の形はその動作の説明を容易にするためにのみ使
用され、実際のコントロ−ラ26はこれとは異なるかもし
れない。
詳細な説明の前に、この発明による文字のピクセル・
デ−タ区分方法に使用される工程を説明した方が有益で
あり、処理42で示した(第5図)動作原理を説明する。
例えば、書類14のイメ−ジに対応するピクセル・マト
リックスを持つ場合、マトリックスの中に求めるデ−タ
又は情報が存在する場所をさがすのは困難である。例え
ば、第2図のピクセル・マトリックス44が(第1図のデ
−タ・マトリックス22と類似する)書類14のイメ−ジと
対応するものと仮定する。求めるイメ−ジ・デ−タ又は
ピクセルはフィ−ルド#1及びフィ−ルド#2にあるも
のと仮定する。第2図の全イメ−ジは、この例ではバイ
ナリ“1"又は“0"で示すデ−タ又はピクセルの行の数と
デ−タ列の数とで表わすことができる。例えば、列0は
書類14の右側からスタ−トすることができ、列600は書
類14の左側に接近する。従って、行1又は書類14の上部
にあり、行500は底部にある。マトリックス44(第2
図)の上右角は第1図の書類14の上右角に相当する。当
然、行及び列の配置は、例えば、走査の仕方によって逆
にすることもできる。
第2図に示すフィ−ルド#1及び#2を検索する処理
の第1の一般的工程は水平及び垂直にマトリックス44の
ピクセルを処理することである。マトリックス44のピク
セルを審査することによって、フィ−ルド#1の黒ピク
セル又はバイナリ1ピクセルは、この例の列75から開始
し、列175で終る。行方向にピクセルを審査した場合に
は、フィ−ルド#1は行#400から開始し、行#430で終
る。同様に、フィ−ルド#2は列325から開始して列525
で終り、行450から開始して行480で終る。この審査はRO
M28又はRAM30にある適当なソフトウエア・プログラムを
使用してコントロ−ラ26で行われる。
第2図で説明するフィ−ルド#1,#2の概念はピクセ
ル・マトリックス44に含まれているピクセルの処理を促
進するのに使用される。もし、例えば、フィ−ルド#1
のバンド幅を知ると、このフィ−ルドの最右端がわかり
(第2図の)、このフィ−ルドのピクセル列の適切な量
を引き出すことができる。この例では、#1の幅は列75
から列175に延びている。当然、フィ−ルドのピクセル
行の適当な数を引出すことができる。この例によるフィ
−ルド#1は行400〜430間に延びる。フィ−ルド#1及
び#2に示す特定の数は実際に各ホントで表わされた数
を示すのを容易にするため普通の形で示してある。
処理42で使用されるもう1つの概念は“ス−パ・ウイ
ンドウ”と称する。ス−パ・ウインドウは特定のホント
の個々の文字に関するピクセルの検索を容易にする。例
えば、E13Bホントで文字がプリントされている場合、こ
のホントの文字ピッチは0.125インチである。このピッ
チは文字の先端から次の文字の先端までの距離である。
スキャナ18(第1図)の解像度は200ピクセル/インチ
であり、その結果生じたス−パ・ウインドウは25ピクセ
ル(0.125×200)の幅を持つ。E13Bホントの実際の高さ
は0.117インチであり、ス−パ・ウインドウの高さに含
まれているピクセルの数は24である。ス−パ・ウインド
ウに含まれているピクセルの数はスキャナ18の解像度及
び使用されるホントによって異なる。又、これらホント
はこの発明にも使用される。すなわち、各使用されるホ
ントは自己の特定なス−パ・ウインドウを持つ。
審査ウインドウ又はス−パ・ウインドウ46は第3図に
示され、第1図に示す走査ライン16に対応する垂直列を
持ち、走査ライン16のピクセルを表わすしきい値処理さ
れたバイナリ・デ−タに対応する四角48,50を持つ。
この発明の特徴は、文字認識のための人工知能回路等
に供するべく、使用するホントに含まれているすべての
組の文字に対するス−パ・ウインドウ46に置かれている
各ピクセルのための統計的に平衡に分配されたドットの
存在確率値(PDFという)を得ることに使用することが
できるということである。この説明により、それが引出
される次の例で明解となるであろう。
例えば、ス−パ・ウインドウ46は処理42が前述の区分
を実行しうるよう“練習”されなければならない。その
練習処理はス−パ・ウインドウ46に供給された既知文字
で始めることができる。すなわち、第3図に示すよう
に、ウインドウ46に数1を与えることができる。説明を
簡単にするため、2つの列、すなわちX及びYに延びる
だけで、数1の設計は簡単であるものとする。当然、数
1が選ばれたホントでプリントされると、それは2つの
列以上に延びるかもしれない。この例のバイナリ・ピク
セル・デ−タはX及びY列のバイナリ1を含み、ス−パ
・ウインドウ46の他の列すべてにバイナリ“0"が存在す
ることになる。図を簡単にするため、第3図にはバイナ
リ1のみを示す。コントロ−ラ26は、例えばRAM30に記
憶されているソフトウエアを通して、ス−パ・ウインド
ウ46の行及び列位置の各位置に置かれているバイナリ1
の累計値を格納する。
前述の練習処理を継続し、数1の第2の例をス−パ・
ウインドウ46に提供する。又、そこに含まれている種々
の行及び列位置のためにス−パ・ウインドウ46に存在す
るすべてのバイナリ1の累計値が記憶される。又、X及
びY列にバイナリ1があり、X及びY列の行位置の各々
のために合計2が含まれていることになると仮定する。
この同じ処理は更に8サンプル繰返され、合計10サンプ
ルとなるものとする。これは、列X及びYのための行位
置の各1はカウント10を持つだろうということを意味す
る。これらカウントはス−パ・ウインドウ46内のすべて
のピクセルのための行及び列位置を表わす位置でコント
ロ−ラ26のRAM30に記憶される。何が得られたかに対す
る簡略説明は、2次元アレイの重みは使用するホントの
数1のために得られたということである。
上記の処理は使用するホントのすべての文字について
繰返えされる。すなわち、区分を受ける文字の組の文字
すべてについて、数字“2"、数字“3"等について10サン
プルが得られる。実際に、このホントに含まれている各
文字はそのために計算されたそれ自体の2次元アレイの
重み(バイナリ1をカウントする)を持つ。その組の各
文字のために計算されたアレイの重みのすべては行及び
列位置で共に加えられ、ス−パ・ウインドウ46内の各ピ
クセル位置のための合成合計を形成する。合成合計は合
計重み値とも考えられる。例えば、ス−パ・ウインドウ
46の上左角のピクセル52が使用するホントに含まれてい
る文字のすべてにバイナリ1を持たない場合には、その
ピクセル位置がE13B文字によりバイナリ1にセットされ
る可能性は0である。特定のピクセル位置において、カ
ウント又は重みが高いことは、このホントの文字がス−
パ・ウインドウ46に出合ったときに、そのピクセルがバ
イナリ1にセットされるだろうことの確率である。1つ
の実施例で、ス−パ・ウインドウは20ピクセル幅の高さ
24ピクセル(第3図)の大きさで480ピクセルのマトリ
ックスを形成する。
第4図は他の実施例であり、ス−パ・ウインドウ48は
幅16ピクセル高さ22ピクセルの大きさであり、全文字に
対する個々のピクセルの重みを持つ。その重みはピクセ
ル領域内の黒い四角の大きさで示される。例えば、完全
白のピクセル50はこのピクセルのPDFは0であることを
意味する。全黒のピクセル52は第3図の処理におけるホ
ントについてこのピクセルが非常に高いPDFであること
を示す。ピクセル54は小さいが存在するPDFを示す。
ス−パ・ウインドウ46が上記のように練習した後、処
理42の各工程を使用する。書類14のデ−タ・マトリック
ス22はコントロ−ラ26のRAM30に記憶される。デ−タ・
マトリックス22が終了したとき、RAM30から引出され、
前述のようにフィ−ルド#1及び#2をさがすように審
査される。
第6図はバイナリ1及び0から成るデ−タのマトリッ
クス56を示す。フィ−ルド#1及び#2のデ−タのみを
第6図に示すが、デ−タ・フィ−ルドの正確な位置は前
述のように知られない。このデ−タ・マトリックス56の
ためのデ−タの開始行は上部の代りに書類の底部にある
(第2図)。
処理42の部分は、書類のデ−タ・フィ−ルド又は領域
をさがすため、第5図の処理によってデ−タ・マトリッ
クス56(第6図)を走査又は審査することを含む。例え
ば、フィ−ルド#1は書類の金額フィ−ルドであり、フ
ィ−ルド#2は、例えば、客の口座番号でよい。例え
ば、アメリカにおいて、フィ−ルド#1,#2はE13Bホン
トの磁気インキでプリントされるが、走査及び文字認識
技術はデ−タの光学処理で行われる。
第6図のイメ−ジ・デ−タに関するデ−タの処理の説
明を続けると、処理42は第5図の水平方向へのイメ−ジ
・デ−タの走査を含む。イメ−ジ・デ−タのマトリック
ス56はコントロ−ラ26のRAM30に記憶され、例えば、RAM
30に記憶されているソフトウエア・ル−チンは第5図に
示すようなデ−タの処理に使用される。
デ−タのマトリックス56の走査又は処理は第6図のフ
ィ−ルド#1,#2のデ−タの範囲又は開始行及び停止行
を決定するために行われる。すなわち、処理42(第5
図)はブロック58に含まれている開始工程を含む。基本
的に、処理42は、ブロック60に示すように、その行のバ
イナリ“1"をさがすことによって、1時に1行テストし
てデ−タ・マトリックス56を走査する。空の行はバイナ
リ“1"を持たない1である。行が空であると(ブロック
62)、処理42は次の行デ−タを得(ブロック64)、その
行でバイナリ“1"をさがす。この処理で、走査は底部
(第6図)から上部に行われる。ある行にバイナリ“1"
が見つかったときに、その行はブロック66で示すフィ−
ルドの開始行としてマ−クされる。この開始行は第7図
のテ−ブル68にも記録され、テ−ブル68はRAM30に記憶
される。説明のために、フィ−ルド#1は行8で開始す
るものと推定する。
処理42(第5図)はブロック70で示すように次の行の
審査を続ける。この次の行はバイナリ1を含む可能性が
高いからブロック72で示すように“空”ではない。この
おこりうる可能性は少くとも1文字の高さだけあるであ
ろう。従って、次の行が得られ(ブロック74)、その処
理はバイナリ1がその行に見つからなくなるまで反復さ
れ、そのときはその行が空であることが示され(ブロッ
ク72)、ブロック76でフィ−ルドの終了を表示する。フ
ィ−ルドの終了又は行停止はテ−ブル68に記録され、第
7図に28で示される。例えば、行28がブロック78に述べ
るように、デ−タ・マトリックス56のためのバッファ又
はRAM30の最後の行ではないと、その処理は繰返えさ
れ、ブロック60のテスト工程から開始する。行28がデ−
タ・マトリックス56の最後の行であると、その処理はブ
ロック80で示すように停止する。
このときのロジッグは、ある行で重複部分を持つかも
しれない異なるフィ−ルドのために、いかに開始及び停
止行が決定される関にかするものである。第6図に示す
ように、書類上に複数フィ−ルドがある場合、このフィ
−ルドの開始及び停止行を検索する前にフィ−ルド#1,
#2の開始及び停止例を検索した方がよい。例えば、フ
ィ−ルド#1のための開始及び停止行を知ることによっ
て、これら開始及び停止列間にある行デ−タのみがこの
フィ−ルドの開始及び停止行の決定に使用することがで
きる。
第6図にフィ−ルドのデ−タのサ−チを示し、縦方向
のサ−チは第9図の処理42−1に示される。垂直方向の
サ−チのための処理42−1は水平方向のサ−チの処理42
と同一である。従って、第9図の個々の工程は第5図の
ブロックに対応する数で示され、単に第9図では数の後
に−1を付している。例えば、第5図のブロック60によ
るテスト工程は第9図の工程60−1のテスト工程に対応
する。
処理42−1(第9図)を行うことから受ける値は第7
図に示すテ−ブル68に記憶される。フィ−ルド#1の開
始列は20であり、停止列は120である。同様に、フィ−
ルド#2の開始及び停止列は200及び600である。テ−ブ
ル68に示す値は理想的状態における単なる表示用値であ
る。すなわち、これは無雑音値である。
第8図は、雑音状態下で開始及び停止行の値を得た場
合におけるフィ−ルド#1の値を示すテ−ブル82であ
る。“雑音”は、例えば、小切手14のインキのにじみや
背景のデ−タから生ずるかもしれない。テ−ブル82は行
1で開始し、行2で停止することを示し、又行8及び28
で夫々開始及び停止する第2群を示す。コントロ−ラ26
はフィ−ルド#1,#2の予定の高さは何であるを知り、
行1及び2の開始及び停止デ−タを雑音として拒絶し、
行8及び28の開始及び停止を有効デ−タとして受け入れ
る。又、コントロ−ラはフィ−ルドの幅を知っているの
で、列を走査したとき、デ−タを雑音として拒絶するこ
ともできる。
開始及び停止行と列の限界がデ−タの特定のマトリッ
クス56の各種フィ−ルドのために得られた後、処理42の
次の工程をス−パ・ウインドウ(第3図で説明した)46
を使用して開始する。前述のように、ス−パ・ウインド
ウ46の大きさはスキャナ18の解像度と使用するホントの
文字の高さ及び実際のピッチの大きさとに反映する。第
6,7,8図で述べたフィ−ルド#1を拡大して第10図に示
す。コントロ−ラ26はそのRAM30のフィ−ルド#1に関
する開始及び停止行及び列を有する。このイメ−ジ・デ
−タはス−パ・ウインドウ46について処理されるべく引
出される。
ス−パ・ウインドウ46はフィ−ルド#1に対して位置
決めされ、審査又はス−パ・ウインドウ46の縦方向中間
点は、フィ−ルドの右側から第10図の左側の方に移動す
る審査方向に進んだときに、文字のピッチの中間点まで
数列前に位置付けされる。例えば、ス−パ・ウインドウ
46は幅20ピクセル及び高さ24ピクセルの大きさであり、
区分される特定のホントのピッチは20ピクセル幅である
とする。この例により、ス−パ・ウインドウ46の縦の中
心は第10図に示すように開始列20から8列である列28に
位置付けされる。
ス−パ・ウインドウ46が第10図に示すように配置され
ると、コントロ−ラ24はス−パ・ウインドウ46の情報内
容を加算し、そのウインドウ位置における総和を得る。
すなわち、この例によるス−パ・ウインドウには20×24
=480ピクセルがある。ス−パ・ウインドウ46の各1ピ
クセルはス−パ・ウインドウ46の練習で説明した合成PD
Fを有するということを思い出そう。480ピクセルの各1
つは審査されて、バイナリ“1"か“0"が定められる。コ
ントロ−ラ26は各バイナリ“1"のピクセルのためにその
PDFを加えて、この例では列28である特定のウインドウ
位置における合計ウインドウ値(TWV)又はウインドウ
合計を得る。又は、TWVはス−パ・ウインドウ46のバイ
ナリ1とそのPDFの値との積を累計することによって得
ることができる。ウインドウ合計はこの例では280であ
ろう。コントロ−ラ26はス−パ・ウインドウ46を列29で
ウインドウ合計を得ることができるように移動し、その
位置でウインドウ合計は330であろう。同様に、ス−パ
・ウインドウ46が列30に移動したとき、ウインドウ合計
は310であろう。ス−パ・ウインドウ46がこの例では列2
9に位置付けされたときに、最大又はピ−ク・ウインド
ウ合計が得られた。これは、ス−パ・ウインドウ46の縦
中心が列29に配置されたときに、ス−パ・ウインドウ46
はフィ−ルド#1の最初の文字に対して最も正しく配置
されたということを意味する。
この例のフィ−ルド#1の最初の文字のイメ−ジ・デ
−タを見つけた後、ス−パ・ウインドウが列29において
縦の中心としたときに、ス−パ・ウインドウ46に入って
いるすべてのピクセルを引き出す。このピクセルは最初
の文字のピクセル・マトリックスを構成する。フィ−ル
ド#1から区分されたこのピクセル・マトリックスは後
に文字認識を受けるか、又はオン・ライン処理のために
文字認識で処理されるためにRAM30に記憶される。
次に、この例におけるフィ−ルド#1(第10図)の第
2の文字に関するイメ−ジ・デ−タの位置を説明する。
最初の文字のピクセル・マトリックスは列29に置かれる
ので、このホントのピッチは20であり、コントロ−ラ26
はス−パ・ウインドウ46を列48が中心となるよう移動す
る。列48の位置は前の文字(列29)の縦中心の位置に文
字ピッチ(20列)を加えて引出され、最初の文字のデ−
タ・マトリックスの縦中心に位置付けすることで行なわ
れたように、コントロ−ラ26が最大合計をチェックする
ことができるように列を後退する(−1列)。ス−パ・
ウインドウ46の中心が列48に配置されて、コントロ−ラ
26はそのウインドウに入っているピクセル合計を計算す
る。ウインドウを左に移動してピ−クを見つけたとき、
そのウインドウ内のピクセルをフィ−ルド#1の第2の
文字のピクセル・マトリックスを表わすものとして取出
す。この処理はフィ−ルドフィ−ルド#1の他の全ての
文字について繰返えされる。ウインドウ46をピクセル・
マトリックスの中心におくのは文字認識を容易にするよ
う、その文字を常に他から区分することである。
【図面の簡単な説明】
第1図は、この発明の実施に使用しうる装置を示す全体
図、 第2図は、デ−タ・マトリックスを示す略図、 第3図は、この発明の実施に使用する“ス−パ・ウイン
ドウ”を示す略図、 第4図は、そのピクセルのPDFを表わす黒色の大きさを
示し、特定のスタイル又はホントの一組の文字に対する
審査ウインドウ内の各ピクセルの確率密度関数(PDF)
を示す略図、 第5図は、書類のデ−タ・マトリックスのピクセル・デ
−タ行を審査するときにデ−タ・フィ−ルドをさがす処
理を示す流れ図、 第6図は、書類のバイナリ・デ−タ・マトリックスを示
す略図、 第7図は、理想的状態について決定された第6図のデ−
タ・マトリックスのあるフィ−ルドにおけるスタ−ト及
びストップ行と、スタ−ト及びストップ列とを示すテ−
ブル、 第8図は、雑音状態下で考えられる値の第7図と同様な
テ−ブル、 第9図は、書類のデ−タ・マトリックスのデ−タ列を審
査するときにデ−タ・フィ−ルドをさがす処理を示す流
れ図、 第10図は、デ−タ・マトリックスに含まれている文字フ
ィ−ルドの一部に置かれているス−パ・ウインドウを示
す略図である。 図中、10……本発明に使用する装置、12……物品トラン
スポ−ト、14……書類、16……走査ライン、18……スキ
ャナ、20……処理回路、22……マトリックス、24,26…
…コントロ−ラ、28……ROM、30……RAM、32……キ−ボ
−ド、34……ディスプレイ、36,38……インタフェ−
ス、40……制御ロジック。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】既知の所定の行位置に設けられた少なくと
    も1つの文字フィ−ルドを有する所定形状の書類に印字
    された予め規定されたフォント文字を構成するバイナリ
    ・ピクセル・マトリクスから成る光学的に読取られたイ
    メ−ジ・デ−タを、複数の連続する前記フォント文字を
    認識するために、前記バイナリ・ピクセル・マトリクス
    毎に区分する方法であって、 (イ) 前記イメ−ジ・デ−タの文字に関する所定数の
    行及び列から成るピクセルをカバ−する大きさの審査ウ
    ィンドウを選ぶ工程と、 (ロ) 前記文字バイナリ・ピクセルを検索しようとす
    る前記所定の行において、区分される一組の文字の各文
    字に対する審査ウィンドウ内の各ピクセルについてドッ
    トの存在確率値(以下、PDFという)を求めて、当該審
    査ウィンドウ内の各ピクセルについての合成PDFを計算
    する工程と、 (ハ) 前記審査フィ−ルドを前記文字フィ−ルドの前
    記所定の行の一ヵ所の位置に位置付けする工程と、 (ニ) 前記審査ウィンドウ内の各バイナリ・ピクセル
    及びそれに関する合成PDFを使用して前記審査ウィンド
    ウにおけるPDF合計値を得る工程と、 (ホ) 前記審査フィ−ルドにおける前記審査ウィンド
    ウを、同じ行の横方向にピクセル毎に移動して前記
    (ニ)の工程を繰り返すことによって前記審査ウィンド
    ウの前記PDF合計値の最大値を得る工程と、 (ヘ) 前記工程(ホ)において得られた前記PDF合計
    値の最大値に基づいて、前記審査ウィンドウにおける前
    記一組の文字の1文字に関するイメ−ジ・デ−タを区分
    けする工程と、 (ト) 当該フィ−ルドにおける残りのイメ−ジ・デ−
    タについて前記工程(ハ)乃至(ホ)を反復する工程、 の各工程により構成されることを特徴とする、書類上の
    所定行に記載された連続する複数のキャラクタ・イメ−
    ジの区分方法。
JP1273919A 1988-11-16 1989-10-23 キャラクタ・イメージの区分方法 Expired - Lifetime JP3035309B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/271,982 US4932065A (en) 1988-11-16 1988-11-16 Universal character segmentation scheme for multifont OCR images
US271,982 1988-11-16

Publications (2)

Publication Number Publication Date
JPH02165392A JPH02165392A (ja) 1990-06-26
JP3035309B2 true JP3035309B2 (ja) 2000-04-24

Family

ID=23037914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1273919A Expired - Lifetime JP3035309B2 (ja) 1988-11-16 1989-10-23 キャラクタ・イメージの区分方法

Country Status (5)

Country Link
US (1) US4932065A (ja)
EP (1) EP0369761B1 (ja)
JP (1) JP3035309B2 (ja)
CA (1) CA1316606C (ja)
DE (1) DE68915950T2 (ja)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法
GB2224906B (en) * 1988-10-21 1993-05-19 Ricoh Kk Dot region discriminating method
US6067379A (en) * 1988-12-09 2000-05-23 Cognex Corporation Method and apparatus for locating patterns in an optical image
US5050221A (en) * 1989-02-13 1991-09-17 Ricoh Company, Ltd. Image generating apparatus
JP2940936B2 (ja) * 1989-06-06 1999-08-25 株式会社リコー 表領域識別方法
US5048095A (en) * 1990-03-30 1991-09-10 Honeywell Inc. Adaptive image segmentation system
JPH04315272A (ja) * 1991-04-12 1992-11-06 Eastman Kodak Japan Kk 図形認識装置
US5500905A (en) * 1991-06-12 1996-03-19 Microelectronics And Computer Technology Corporation Pattern recognition neural network with saccade-like operation
US5237621A (en) * 1991-08-08 1993-08-17 Philip Morris Incorporated Product appearance inspection methods and apparatus employing low variance filter
US5150425A (en) * 1991-08-30 1992-09-22 Eastman Kodak Company Character recognition method using correlation search
US5553162A (en) * 1991-09-23 1996-09-03 Eastman Kodak Company Method for detecting ink jet or dot matrix printing
US5299269A (en) * 1991-12-20 1994-03-29 Eastman Kodak Company Character segmentation using an associative memory for optical character recognition
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US5337370A (en) * 1992-02-28 1994-08-09 Environmental Research Institute Of Michigan Character recognition method employing non-character recognizer
EP0566015A3 (en) * 1992-04-14 1994-07-06 Eastman Kodak Co Neural network optical character recognition system and method for classifying characters in amoving web
US5341438A (en) * 1992-07-22 1994-08-23 Eastman Kodak Company Method and apparatus for segmenting and classifying unconstrained handwritten characters
US5859923A (en) * 1992-12-29 1999-01-12 Cognex Corporation Mark quality inspection apparatus and method
US5305392A (en) * 1993-01-11 1994-04-19 Philip Morris Incorporated High speed, high resolution web inspection system
JPH06348800A (ja) * 1993-06-02 1994-12-22 Canon Inc 画像処理方法及び装置
US5748780A (en) * 1994-04-07 1998-05-05 Stolfo; Salvatore J. Method and apparatus for imaging, image processing and data compression
US6026176A (en) * 1995-07-25 2000-02-15 Cognex Corporation Machine vision methods and articles of manufacture for ball grid array inspection
US5764824A (en) * 1995-08-25 1998-06-09 International Business Machines Corporation Clustering mechanism for identifying and grouping of classes in manufacturing process behavior
US5872870A (en) * 1996-02-16 1999-02-16 Cognex Corporation Machine vision methods for identifying extrema of objects in rotated reference frames
US5909504A (en) * 1996-03-15 1999-06-01 Cognex Corporation Method of testing a machine vision inspection system
US6298149B1 (en) 1996-03-21 2001-10-02 Cognex Corporation Semiconductor device image inspection with contrast enhancement
US6259827B1 (en) 1996-03-21 2001-07-10 Cognex Corporation Machine vision methods for enhancing the contrast between an object and its background using multiple on-axis images
US5978502A (en) * 1996-04-01 1999-11-02 Cognex Corporation Machine vision methods for determining characteristics of three-dimensional objects
US6137893A (en) * 1996-10-07 2000-10-24 Cognex Corporation Machine vision calibration targets and methods of determining their location and orientation in an image
US5960125A (en) 1996-11-21 1999-09-28 Cognex Corporation Nonfeedback-based machine vision method for determining a calibration relationship between a camera and a moveable object
US5953130A (en) * 1997-01-06 1999-09-14 Cognex Corporation Machine vision methods and apparatus for machine vision illumination of an object
US6075881A (en) * 1997-03-18 2000-06-13 Cognex Corporation Machine vision methods for identifying collinear sets of points from an image
US5974169A (en) * 1997-03-20 1999-10-26 Cognex Corporation Machine vision methods for determining characteristics of an object using boundary points and bounding regions
US6141033A (en) * 1997-05-15 2000-10-31 Cognex Corporation Bandwidth reduction of multichannel images for machine vision
US6608647B1 (en) 1997-06-24 2003-08-19 Cognex Corporation Methods and apparatus for charge coupled device image acquisition with independent integration and readout
US5978080A (en) * 1997-09-25 1999-11-02 Cognex Corporation Machine vision methods using feedback to determine an orientation, pixel width and pixel height of a field of view
US6025854A (en) * 1997-12-31 2000-02-15 Cognex Corporation Method and apparatus for high speed image acquisition
US6236769B1 (en) 1998-01-28 2001-05-22 Cognex Corporation Machine vision systems and methods for morphological transformation of an image with zero or other uniform offsets
US6282328B1 (en) 1998-01-28 2001-08-28 Cognex Corporation Machine vision systems and methods for morphological transformation of an image with non-uniform offsets
US6381375B1 (en) 1998-02-20 2002-04-30 Cognex Corporation Methods and apparatus for generating a projection of an image
US6215915B1 (en) 1998-02-20 2001-04-10 Cognex Corporation Image processing methods and apparatus for separable, general affine transformation of an image
US6381366B1 (en) 1998-12-18 2002-04-30 Cognex Corporation Machine vision methods and system for boundary point-based comparison of patterns and images
US6687402B1 (en) 1998-12-18 2004-02-03 Cognex Corporation Machine vision methods and systems for boundary feature comparison of patterns and images
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US6684402B1 (en) 1999-12-01 2004-01-27 Cognex Technology And Investment Corporation Control methods and apparatus for coupling multiple image acquisition devices to a digital data processor
US6748104B1 (en) 2000-03-24 2004-06-08 Cognex Corporation Methods and apparatus for machine vision inspection using single and multiple templates or patterns
US7006669B1 (en) 2000-12-31 2006-02-28 Cognex Corporation Machine vision method and apparatus for thresholding images of non-uniform materials
US7386160B2 (en) * 2004-12-02 2008-06-10 International Business Machines Corporation System and method for determining image resolution using MICR characters
US7639861B2 (en) 2005-09-14 2009-12-29 Cognex Technology And Investment Corporation Method and apparatus for backlighting a wafer during alignment
US8111904B2 (en) 2005-10-07 2012-02-07 Cognex Technology And Investment Corp. Methods and apparatus for practical 3D vision system
US8162584B2 (en) 2006-08-23 2012-04-24 Cognex Corporation Method and apparatus for semiconductor wafer alignment
US20080310721A1 (en) * 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image
ITBA20110038A1 (it) 2011-07-12 2013-01-13 D A Bi Mus Srl Metodo e apparato per riconoscere testo in immagini digitali raffiguranti pagine di un documento antico
US9195908B2 (en) 2013-05-22 2015-11-24 Xerox Corporation Snow classifier context window reduction using class t-scores and mean differences
US10192127B1 (en) 2017-07-24 2019-01-29 Bank Of America Corporation System for dynamic optical character recognition tuning
US10346702B2 (en) 2017-07-24 2019-07-09 Bank Of America Corporation Image data capture and conversion

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3519990A (en) * 1966-09-15 1970-07-07 Control Data Corp Recognition system for reading machine
GB1233459A (ja) * 1968-07-15 1971-05-26
US4308523A (en) * 1980-02-04 1981-12-29 Compuscan, Incorporated Apparatus and method for character recognition
JPS5750076A (en) * 1980-09-10 1982-03-24 Toshiba Corp Character reader
US4562594A (en) * 1983-09-29 1985-12-31 International Business Machines Corp. (Ibm) Method and apparatus for segmenting character images
US4680803A (en) * 1984-12-17 1987-07-14 Ncr Corporation Method and apparatus for isolating image data for character recognition

Also Published As

Publication number Publication date
JPH02165392A (ja) 1990-06-26
EP0369761A2 (en) 1990-05-23
DE68915950D1 (de) 1994-07-14
CA1316606C (en) 1993-04-20
EP0369761A3 (en) 1991-12-18
US4932065A (en) 1990-06-05
EP0369761B1 (en) 1994-06-08
DE68915950T2 (de) 1995-02-02

Similar Documents

Publication Publication Date Title
JP3035309B2 (ja) キャラクタ・イメージの区分方法
US5373566A (en) Neural network-based diacritical marker recognition system and method
US4903312A (en) Character recognition with variable subdivisions of a character region
Wang et al. Classification of newspaper image blocks using texture analysis
US4757551A (en) Character recognition method and system capable of recognizing slant characters
EP1061469B1 (en) Method and apparatus for selecting text and/or non-text blocks in a stored document
EP0629970B1 (en) Method for detecting monetary amounts in binary images
US6674900B1 (en) Method for extracting titles from digital images
EP0163377A1 (en) Pattern recognition system
JPH05282495A (ja) 比較方法
US20030012438A1 (en) Multiple size reductions for image segmentation
US5563958A (en) System and method for optical character recognition bar-coded characters
US5864629A (en) Character recognition methods and apparatus for locating and extracting predetermined data from a document
US4901365A (en) Method of searching binary images to find search regions in which straight lines may be found
US5553162A (en) Method for detecting ink jet or dot matrix printing
JPH05166002A (ja) ソース画像を分析する方法
US5721790A (en) Methods and apparatus for separating integer and fractional portions of a financial amount
JPH06501803A (ja) 抽出されたデータから特定の部分を分離して抽出することを含む文字認識方法
Viswanathan et al. Characteristics of digitized images of technical articles
JPH0252329A (ja) 画像情報記録・読取方法
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법
KR930007083B1 (ko) 문자인식에서의 후보문자 분류방법
JP2795860B2 (ja) 文字認識装置
JP2747136B2 (ja) 文字認識装置
JP3127413B2 (ja) 文字認識装置