JP3035309B2 - キャラクタ・イメージの区分方法 - Google Patents
キャラクタ・イメージの区分方法Info
- Publication number
- JP3035309B2 JP3035309B2 JP1273919A JP27391989A JP3035309B2 JP 3035309 B2 JP3035309 B2 JP 3035309B2 JP 1273919 A JP1273919 A JP 1273919A JP 27391989 A JP27391989 A JP 27391989A JP 3035309 B2 JP3035309 B2 JP 3035309B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- pixel
- window
- field
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
【発明の詳細な説明】 〔産業上の利用分野〕 この発明は書類上に形成された行及び列のバイナリ・
ピクセルから成るイメ−ジ・デ−タのマトリクスを供給
する光学イメ−ジの処理システムであって、書類内の所
定のフィ−ルドにある文字バイナリ・ピクセルを検索及
び区分して、後の動作(例えば、文字認識)に使用しう
るよう文字のピクセル・デ−タを選出する方法に関す
る。
ピクセルから成るイメ−ジ・デ−タのマトリクスを供給
する光学イメ−ジの処理システムであって、書類内の所
定のフィ−ルドにある文字バイナリ・ピクセルを検索及
び区分して、後の動作(例えば、文字認識)に使用しう
るよう文字のピクセル・デ−タを選出する方法に関す
る。
近年、書類上に記載されたイメ−ジを読みとってその
情報を処理する傾向が強まってきた。例えば、小切手の
ような書類はそれを移動して走査し、ピクセル・デ−タ
・マトリックスを発生するようにしたものがある。ピク
セルの語は走査した書類の微小領域に対応する画素とし
て定義する。例えば、スキャナから発生した各走査線又
は列について約600又は900ピクセルが存在するであろ
う。書類がスキャナ上を移動すると、一連の走査ピクセ
ル・ラインを発生し、各書類のピクセル・マトリックス
を発生する。
情報を処理する傾向が強まってきた。例えば、小切手の
ような書類はそれを移動して走査し、ピクセル・デ−タ
・マトリックスを発生するようにしたものがある。ピク
セルの語は走査した書類の微小領域に対応する画素とし
て定義する。例えば、スキャナから発生した各走査線又
は列について約600又は900ピクセルが存在するであろ
う。書類がスキャナ上を移動すると、一連の走査ピクセ
ル・ラインを発生し、各書類のピクセル・マトリックス
を発生する。
スキャナからのピクセル・マトリックスは、例えば、
しきい値で処理され、各ピクセルをデ−タを表わすバイ
ナリ“1"とデ−タなしを表わすバイナリ“0"とに分類さ
れる。この方式により各書類のイメ−ジに対応するピク
セル・マトリックスをその書類から得ることができる。
そのピクセル・マトリックスはRAMに記憶され、又はCRT
にディスプレイされ、デ−タを完成する際それをオペレ
−タが見ることができる。
しきい値で処理され、各ピクセルをデ−タを表わすバイ
ナリ“1"とデ−タなしを表わすバイナリ“0"とに分類さ
れる。この方式により各書類のイメ−ジに対応するピク
セル・マトリックスをその書類から得ることができる。
そのピクセル・マトリックスはRAMに記憶され、又はCRT
にディスプレイされ、デ−タを完成する際それをオペレ
−タが見ることができる。
ピクセル・マトリックスはその書類に関するイメ−ジ
・デ−タを含む。例えば、小切手のような金融書類を処
理する場合、小切手には機械で読取られるフィ−ルドが
ある。そのフィ−ルドは、例えば、E13B又はCMC7のよう
なホントで印刷される文字デ−タを含む。例えば、1走
査ラインに約200ピクセル/インチの解像度を持つ場
合、ピクセル・マトリックスを使用して光学文字認識に
よりそのフィ−ルドの機械読取が可能である。
・デ−タを含む。例えば、小切手のような金融書類を処
理する場合、小切手には機械で読取られるフィ−ルドが
ある。そのフィ−ルドは、例えば、E13B又はCMC7のよう
なホントで印刷される文字デ−タを含む。例えば、1走
査ラインに約200ピクセル/インチの解像度を持つ場
合、ピクセル・マトリックスを使用して光学文字認識に
よりそのフィ−ルドの機械読取が可能である。
ピクセル・マトリックスを使用する場合の問題点は読
取られる文字を含むフィ−ルドを検出することが一般に
困難であるということである。特に、読取るべきフィ−
ルドが書類の異なる部分にあるときには難かしい。その
上、読取るフィ−ルドを検出した後、このフィ−ルドか
ら1つの文字のピクセルを分離するため、そのフィ−ル
ドのピクセル・マトリックスを区分する必要があるとい
う問題が生じた。各文字のピクセルが区分された後、そ
のピクセルは文字認識を受けるであろう。この文字認識
技術は、例えば、人工知能回路又は他の回路網を含むか
もしれないということである。
取られる文字を含むフィ−ルドを検出することが一般に
困難であるということである。特に、読取るべきフィ−
ルドが書類の異なる部分にあるときには難かしい。その
上、読取るフィ−ルドを検出した後、このフィ−ルドか
ら1つの文字のピクセルを分離するため、そのフィ−ル
ドのピクセル・マトリックスを区分する必要があるとい
う問題が生じた。各文字のピクセルが区分された後、そ
のピクセルは文字認識を受けるであろう。この文字認識
技術は、例えば、人工知能回路又は他の回路網を含むか
もしれないということである。
この発明の目的は、読み取るべきフィ−ルドを検出し
た後の文字認識を容易にするため、既知の所定の行位置
に設けられた少なくとも1つの文字フィ−ルドを有する
所定形状の書類に印字された予め規定されたフォント文
字を構成するバイナリ・ピクセル・マトリクスから成る
光学的に読取られたイメ−ジ・デ−タを、1文字分の前
記バイナリ・ピクセル・マトリクス毎に区分する方法を
提供することである。
た後の文字認識を容易にするため、既知の所定の行位置
に設けられた少なくとも1つの文字フィ−ルドを有する
所定形状の書類に印字された予め規定されたフォント文
字を構成するバイナリ・ピクセル・マトリクスから成る
光学的に読取られたイメ−ジ・デ−タを、1文字分の前
記バイナリ・ピクセル・マトリクス毎に区分する方法を
提供することである。
この発明は上記の問題点を下記のようにして解決し
た。すなわち、この発明によると、既知の所定の行位置
に設けられた少なくとも1つの文字フィ−ルドを有する
所定形状の書類に印字された予め規定されたフォント文
字を構成するバイナリ・ピクセル・マトリクスから成る
光学的に読取られたイメ−ジ・デ−タを、複数の連続す
る前記フォント文字を認識するために、前記バイナリ・
ピクセル・マトリクス毎に区分する方法であって、 (イ) 前記イメ−ジ・デ−タの文字に関する所定数の
行及び列から成るピクセルをカバ−する大きさの審査ウ
ィンドウを選ぶ工程と、 (ロ) 前記文字バイナリ・ピクセルを検索しようとす
る前記所定の行において、区分される一組の文字の各文
字に対する審査ウィンドウ内の各ピクセルについてドッ
トの存在確率値(以下PDFという)を求めて、当該審査
ウィンドウ内の各ピクセルについての合成PDFを計算す
る工程と、 (ハ) 前記審査フィ−ルドを前記文字フィ−ルドの前
記所定の行の一ヵ所の位置に位置付けする工程と、 (ニ) 前記審査ウィンドウ内の各バイナリ・ピクセル
及びそれに関する合成PDFを使用して前記審査ウィンド
ウにおけるPDF合計値を得る工程と、 (ホ) 前記審査フィ−ルドにおける前記審査ウィンド
ウを、同じ行の横方向にピクセル毎に移動して前記
(ニ)の工程を繰り返すことによって前記審査ウィンド
ウの前記PDF合計値の最大値を得る工程と、 (ヘ) 前記工程(ホ)において得られた前記PDF合計
値の最大値に基づいて、前記審査ウィンドウにおける前
記一組の文字の1文字に関するイメ−ジ・デ−タを区分
けする工程と、 (ト) 当該フィ−ルドにおける残りのイメ−ジ・デ−
タについて前記工程(ハ)乃至(ホ)を反復する工程、 の各工程により構成されることを特徴とする方法を提供
するものである。
た。すなわち、この発明によると、既知の所定の行位置
に設けられた少なくとも1つの文字フィ−ルドを有する
所定形状の書類に印字された予め規定されたフォント文
字を構成するバイナリ・ピクセル・マトリクスから成る
光学的に読取られたイメ−ジ・デ−タを、複数の連続す
る前記フォント文字を認識するために、前記バイナリ・
ピクセル・マトリクス毎に区分する方法であって、 (イ) 前記イメ−ジ・デ−タの文字に関する所定数の
行及び列から成るピクセルをカバ−する大きさの審査ウ
ィンドウを選ぶ工程と、 (ロ) 前記文字バイナリ・ピクセルを検索しようとす
る前記所定の行において、区分される一組の文字の各文
字に対する審査ウィンドウ内の各ピクセルについてドッ
トの存在確率値(以下PDFという)を求めて、当該審査
ウィンドウ内の各ピクセルについての合成PDFを計算す
る工程と、 (ハ) 前記審査フィ−ルドを前記文字フィ−ルドの前
記所定の行の一ヵ所の位置に位置付けする工程と、 (ニ) 前記審査ウィンドウ内の各バイナリ・ピクセル
及びそれに関する合成PDFを使用して前記審査ウィンド
ウにおけるPDF合計値を得る工程と、 (ホ) 前記審査フィ−ルドにおける前記審査ウィンド
ウを、同じ行の横方向にピクセル毎に移動して前記
(ニ)の工程を繰り返すことによって前記審査ウィンド
ウの前記PDF合計値の最大値を得る工程と、 (ヘ) 前記工程(ホ)において得られた前記PDF合計
値の最大値に基づいて、前記審査ウィンドウにおける前
記一組の文字の1文字に関するイメ−ジ・デ−タを区分
けする工程と、 (ト) 当該フィ−ルドにおける残りのイメ−ジ・デ−
タについて前記工程(ハ)乃至(ホ)を反復する工程、 の各工程により構成されることを特徴とする方法を提供
するものである。
第1図の装置10はこの発明の実施に使用することがで
きるもので、従来方式により書類14をスキャナ18で走査
する走査ライン16の方に書類14のようなものを移動する
物品トランスポ−ト12を含む。スキャナ18は物品14が読
取りうるように移動したときに一連の走査ライン又は列
のピクセル・デ−タを発生する。スキャナ18は、例え
ば、読取を行うため、固定書類上を、例えば、ハンド・
スキャナのようなものを用いるものでもよい。スキャナ
18からの一連の列ピクセル・デ−タは雑音を最小にする
処理を受け、デ−タの存在を示すバイナリ“1"とデ−タ
の不存在を示すバイナリ“0"とになるようしきい値が適
用される。この処理は処理回路20として示す従来の回路
で行われる。処理回路20の出力は書類14のイメ−ジに対
応するマトリックス22のバイナリ・デ−タ又はピクセル
(圧縮されていない)である。デ−タのマトリックス22
は、例えば、約900ピクセル/列を含み、200ピクセル/
インチの解像度を持つ。当然、デ−タ・マトリックス22
の全体的大きさは特定の応用によって異なるが、その大
きさはこの発明の理解にとって重要ではない。スキャナ
18及び物品トランスポ−ト12は別のコントロ−ラ24で制
御するようにしてもよく、デ−タ又はピクセル・マトリ
ックス22の処理に使用されるコントロ−ラ26を使用して
もよい。
きるもので、従来方式により書類14をスキャナ18で走査
する走査ライン16の方に書類14のようなものを移動する
物品トランスポ−ト12を含む。スキャナ18は物品14が読
取りうるように移動したときに一連の走査ライン又は列
のピクセル・デ−タを発生する。スキャナ18は、例え
ば、読取を行うため、固定書類上を、例えば、ハンド・
スキャナのようなものを用いるものでもよい。スキャナ
18からの一連の列ピクセル・デ−タは雑音を最小にする
処理を受け、デ−タの存在を示すバイナリ“1"とデ−タ
の不存在を示すバイナリ“0"とになるようしきい値が適
用される。この処理は処理回路20として示す従来の回路
で行われる。処理回路20の出力は書類14のイメ−ジに対
応するマトリックス22のバイナリ・デ−タ又はピクセル
(圧縮されていない)である。デ−タのマトリックス22
は、例えば、約900ピクセル/列を含み、200ピクセル/
インチの解像度を持つ。当然、デ−タ・マトリックス22
の全体的大きさは特定の応用によって異なるが、その大
きさはこの発明の理解にとって重要ではない。スキャナ
18及び物品トランスポ−ト12は別のコントロ−ラ24で制
御するようにしてもよく、デ−タ又はピクセル・マトリ
ックス22の処理に使用されるコントロ−ラ26を使用して
もよい。
コントロ−ラ26(第1図)はこの発明のピクセル・マ
トリックス22の処理に使用することができる従来のコン
トロ−ラである。コントロ−ラ26は読出専用メモリ−
(ROM28)と、ランダム・アクセス・メモリ−(RAM30)
と、キ−ボ−ド(KB)32と、ディスプレイ34と、インタ
フェ−ス36,38と、従来方式で他の成分と相互接続する
インタフェ−ス及び制御ロジック40とを含む。コントロ
−ラ26の形はその動作の説明を容易にするためにのみ使
用され、実際のコントロ−ラ26はこれとは異なるかもし
れない。
トリックス22の処理に使用することができる従来のコン
トロ−ラである。コントロ−ラ26は読出専用メモリ−
(ROM28)と、ランダム・アクセス・メモリ−(RAM30)
と、キ−ボ−ド(KB)32と、ディスプレイ34と、インタ
フェ−ス36,38と、従来方式で他の成分と相互接続する
インタフェ−ス及び制御ロジック40とを含む。コントロ
−ラ26の形はその動作の説明を容易にするためにのみ使
用され、実際のコントロ−ラ26はこれとは異なるかもし
れない。
詳細な説明の前に、この発明による文字のピクセル・
デ−タ区分方法に使用される工程を説明した方が有益で
あり、処理42で示した(第5図)動作原理を説明する。
デ−タ区分方法に使用される工程を説明した方が有益で
あり、処理42で示した(第5図)動作原理を説明する。
例えば、書類14のイメ−ジに対応するピクセル・マト
リックスを持つ場合、マトリックスの中に求めるデ−タ
又は情報が存在する場所をさがすのは困難である。例え
ば、第2図のピクセル・マトリックス44が(第1図のデ
−タ・マトリックス22と類似する)書類14のイメ−ジと
対応するものと仮定する。求めるイメ−ジ・デ−タ又は
ピクセルはフィ−ルド#1及びフィ−ルド#2にあるも
のと仮定する。第2図の全イメ−ジは、この例ではバイ
ナリ“1"又は“0"で示すデ−タ又はピクセルの行の数と
デ−タ列の数とで表わすことができる。例えば、列0は
書類14の右側からスタ−トすることができ、列600は書
類14の左側に接近する。従って、行1又は書類14の上部
にあり、行500は底部にある。マトリックス44(第2
図)の上右角は第1図の書類14の上右角に相当する。当
然、行及び列の配置は、例えば、走査の仕方によって逆
にすることもできる。
リックスを持つ場合、マトリックスの中に求めるデ−タ
又は情報が存在する場所をさがすのは困難である。例え
ば、第2図のピクセル・マトリックス44が(第1図のデ
−タ・マトリックス22と類似する)書類14のイメ−ジと
対応するものと仮定する。求めるイメ−ジ・デ−タ又は
ピクセルはフィ−ルド#1及びフィ−ルド#2にあるも
のと仮定する。第2図の全イメ−ジは、この例ではバイ
ナリ“1"又は“0"で示すデ−タ又はピクセルの行の数と
デ−タ列の数とで表わすことができる。例えば、列0は
書類14の右側からスタ−トすることができ、列600は書
類14の左側に接近する。従って、行1又は書類14の上部
にあり、行500は底部にある。マトリックス44(第2
図)の上右角は第1図の書類14の上右角に相当する。当
然、行及び列の配置は、例えば、走査の仕方によって逆
にすることもできる。
第2図に示すフィ−ルド#1及び#2を検索する処理
の第1の一般的工程は水平及び垂直にマトリックス44の
ピクセルを処理することである。マトリックス44のピク
セルを審査することによって、フィ−ルド#1の黒ピク
セル又はバイナリ1ピクセルは、この例の列75から開始
し、列175で終る。行方向にピクセルを審査した場合に
は、フィ−ルド#1は行#400から開始し、行#430で終
る。同様に、フィ−ルド#2は列325から開始して列525
で終り、行450から開始して行480で終る。この審査はRO
M28又はRAM30にある適当なソフトウエア・プログラムを
使用してコントロ−ラ26で行われる。
の第1の一般的工程は水平及び垂直にマトリックス44の
ピクセルを処理することである。マトリックス44のピク
セルを審査することによって、フィ−ルド#1の黒ピク
セル又はバイナリ1ピクセルは、この例の列75から開始
し、列175で終る。行方向にピクセルを審査した場合に
は、フィ−ルド#1は行#400から開始し、行#430で終
る。同様に、フィ−ルド#2は列325から開始して列525
で終り、行450から開始して行480で終る。この審査はRO
M28又はRAM30にある適当なソフトウエア・プログラムを
使用してコントロ−ラ26で行われる。
第2図で説明するフィ−ルド#1,#2の概念はピクセ
ル・マトリックス44に含まれているピクセルの処理を促
進するのに使用される。もし、例えば、フィ−ルド#1
のバンド幅を知ると、このフィ−ルドの最右端がわかり
(第2図の)、このフィ−ルドのピクセル列の適切な量
を引き出すことができる。この例では、#1の幅は列75
から列175に延びている。当然、フィ−ルドのピクセル
行の適当な数を引出すことができる。この例によるフィ
−ルド#1は行400〜430間に延びる。フィ−ルド#1及
び#2に示す特定の数は実際に各ホントで表わされた数
を示すのを容易にするため普通の形で示してある。
ル・マトリックス44に含まれているピクセルの処理を促
進するのに使用される。もし、例えば、フィ−ルド#1
のバンド幅を知ると、このフィ−ルドの最右端がわかり
(第2図の)、このフィ−ルドのピクセル列の適切な量
を引き出すことができる。この例では、#1の幅は列75
から列175に延びている。当然、フィ−ルドのピクセル
行の適当な数を引出すことができる。この例によるフィ
−ルド#1は行400〜430間に延びる。フィ−ルド#1及
び#2に示す特定の数は実際に各ホントで表わされた数
を示すのを容易にするため普通の形で示してある。
処理42で使用されるもう1つの概念は“ス−パ・ウイ
ンドウ”と称する。ス−パ・ウインドウは特定のホント
の個々の文字に関するピクセルの検索を容易にする。例
えば、E13Bホントで文字がプリントされている場合、こ
のホントの文字ピッチは0.125インチである。このピッ
チは文字の先端から次の文字の先端までの距離である。
スキャナ18(第1図)の解像度は200ピクセル/インチ
であり、その結果生じたス−パ・ウインドウは25ピクセ
ル(0.125×200)の幅を持つ。E13Bホントの実際の高さ
は0.117インチであり、ス−パ・ウインドウの高さに含
まれているピクセルの数は24である。ス−パ・ウインド
ウに含まれているピクセルの数はスキャナ18の解像度及
び使用されるホントによって異なる。又、これらホント
はこの発明にも使用される。すなわち、各使用されるホ
ントは自己の特定なス−パ・ウインドウを持つ。
ンドウ”と称する。ス−パ・ウインドウは特定のホント
の個々の文字に関するピクセルの検索を容易にする。例
えば、E13Bホントで文字がプリントされている場合、こ
のホントの文字ピッチは0.125インチである。このピッ
チは文字の先端から次の文字の先端までの距離である。
スキャナ18(第1図)の解像度は200ピクセル/インチ
であり、その結果生じたス−パ・ウインドウは25ピクセ
ル(0.125×200)の幅を持つ。E13Bホントの実際の高さ
は0.117インチであり、ス−パ・ウインドウの高さに含
まれているピクセルの数は24である。ス−パ・ウインド
ウに含まれているピクセルの数はスキャナ18の解像度及
び使用されるホントによって異なる。又、これらホント
はこの発明にも使用される。すなわち、各使用されるホ
ントは自己の特定なス−パ・ウインドウを持つ。
審査ウインドウ又はス−パ・ウインドウ46は第3図に
示され、第1図に示す走査ライン16に対応する垂直列を
持ち、走査ライン16のピクセルを表わすしきい値処理さ
れたバイナリ・デ−タに対応する四角48,50を持つ。
示され、第1図に示す走査ライン16に対応する垂直列を
持ち、走査ライン16のピクセルを表わすしきい値処理さ
れたバイナリ・デ−タに対応する四角48,50を持つ。
この発明の特徴は、文字認識のための人工知能回路等
に供するべく、使用するホントに含まれているすべての
組の文字に対するス−パ・ウインドウ46に置かれている
各ピクセルのための統計的に平衡に分配されたドットの
存在確率値(PDFという)を得ることに使用することが
できるということである。この説明により、それが引出
される次の例で明解となるであろう。
に供するべく、使用するホントに含まれているすべての
組の文字に対するス−パ・ウインドウ46に置かれている
各ピクセルのための統計的に平衡に分配されたドットの
存在確率値(PDFという)を得ることに使用することが
できるということである。この説明により、それが引出
される次の例で明解となるであろう。
例えば、ス−パ・ウインドウ46は処理42が前述の区分
を実行しうるよう“練習”されなければならない。その
練習処理はス−パ・ウインドウ46に供給された既知文字
で始めることができる。すなわち、第3図に示すよう
に、ウインドウ46に数1を与えることができる。説明を
簡単にするため、2つの列、すなわちX及びYに延びる
だけで、数1の設計は簡単であるものとする。当然、数
1が選ばれたホントでプリントされると、それは2つの
列以上に延びるかもしれない。この例のバイナリ・ピク
セル・デ−タはX及びY列のバイナリ1を含み、ス−パ
・ウインドウ46の他の列すべてにバイナリ“0"が存在す
ることになる。図を簡単にするため、第3図にはバイナ
リ1のみを示す。コントロ−ラ26は、例えばRAM30に記
憶されているソフトウエアを通して、ス−パ・ウインド
ウ46の行及び列位置の各位置に置かれているバイナリ1
の累計値を格納する。
を実行しうるよう“練習”されなければならない。その
練習処理はス−パ・ウインドウ46に供給された既知文字
で始めることができる。すなわち、第3図に示すよう
に、ウインドウ46に数1を与えることができる。説明を
簡単にするため、2つの列、すなわちX及びYに延びる
だけで、数1の設計は簡単であるものとする。当然、数
1が選ばれたホントでプリントされると、それは2つの
列以上に延びるかもしれない。この例のバイナリ・ピク
セル・デ−タはX及びY列のバイナリ1を含み、ス−パ
・ウインドウ46の他の列すべてにバイナリ“0"が存在す
ることになる。図を簡単にするため、第3図にはバイナ
リ1のみを示す。コントロ−ラ26は、例えばRAM30に記
憶されているソフトウエアを通して、ス−パ・ウインド
ウ46の行及び列位置の各位置に置かれているバイナリ1
の累計値を格納する。
前述の練習処理を継続し、数1の第2の例をス−パ・
ウインドウ46に提供する。又、そこに含まれている種々
の行及び列位置のためにス−パ・ウインドウ46に存在す
るすべてのバイナリ1の累計値が記憶される。又、X及
びY列にバイナリ1があり、X及びY列の行位置の各々
のために合計2が含まれていることになると仮定する。
この同じ処理は更に8サンプル繰返され、合計10サンプ
ルとなるものとする。これは、列X及びYのための行位
置の各1はカウント10を持つだろうということを意味す
る。これらカウントはス−パ・ウインドウ46内のすべて
のピクセルのための行及び列位置を表わす位置でコント
ロ−ラ26のRAM30に記憶される。何が得られたかに対す
る簡略説明は、2次元アレイの重みは使用するホントの
数1のために得られたということである。
ウインドウ46に提供する。又、そこに含まれている種々
の行及び列位置のためにス−パ・ウインドウ46に存在す
るすべてのバイナリ1の累計値が記憶される。又、X及
びY列にバイナリ1があり、X及びY列の行位置の各々
のために合計2が含まれていることになると仮定する。
この同じ処理は更に8サンプル繰返され、合計10サンプ
ルとなるものとする。これは、列X及びYのための行位
置の各1はカウント10を持つだろうということを意味す
る。これらカウントはス−パ・ウインドウ46内のすべて
のピクセルのための行及び列位置を表わす位置でコント
ロ−ラ26のRAM30に記憶される。何が得られたかに対す
る簡略説明は、2次元アレイの重みは使用するホントの
数1のために得られたということである。
上記の処理は使用するホントのすべての文字について
繰返えされる。すなわち、区分を受ける文字の組の文字
すべてについて、数字“2"、数字“3"等について10サン
プルが得られる。実際に、このホントに含まれている各
文字はそのために計算されたそれ自体の2次元アレイの
重み(バイナリ1をカウントする)を持つ。その組の各
文字のために計算されたアレイの重みのすべては行及び
列位置で共に加えられ、ス−パ・ウインドウ46内の各ピ
クセル位置のための合成合計を形成する。合成合計は合
計重み値とも考えられる。例えば、ス−パ・ウインドウ
46の上左角のピクセル52が使用するホントに含まれてい
る文字のすべてにバイナリ1を持たない場合には、その
ピクセル位置がE13B文字によりバイナリ1にセットされ
る可能性は0である。特定のピクセル位置において、カ
ウント又は重みが高いことは、このホントの文字がス−
パ・ウインドウ46に出合ったときに、そのピクセルがバ
イナリ1にセットされるだろうことの確率である。1つ
の実施例で、ス−パ・ウインドウは20ピクセル幅の高さ
24ピクセル(第3図)の大きさで480ピクセルのマトリ
ックスを形成する。
繰返えされる。すなわち、区分を受ける文字の組の文字
すべてについて、数字“2"、数字“3"等について10サン
プルが得られる。実際に、このホントに含まれている各
文字はそのために計算されたそれ自体の2次元アレイの
重み(バイナリ1をカウントする)を持つ。その組の各
文字のために計算されたアレイの重みのすべては行及び
列位置で共に加えられ、ス−パ・ウインドウ46内の各ピ
クセル位置のための合成合計を形成する。合成合計は合
計重み値とも考えられる。例えば、ス−パ・ウインドウ
46の上左角のピクセル52が使用するホントに含まれてい
る文字のすべてにバイナリ1を持たない場合には、その
ピクセル位置がE13B文字によりバイナリ1にセットされ
る可能性は0である。特定のピクセル位置において、カ
ウント又は重みが高いことは、このホントの文字がス−
パ・ウインドウ46に出合ったときに、そのピクセルがバ
イナリ1にセットされるだろうことの確率である。1つ
の実施例で、ス−パ・ウインドウは20ピクセル幅の高さ
24ピクセル(第3図)の大きさで480ピクセルのマトリ
ックスを形成する。
第4図は他の実施例であり、ス−パ・ウインドウ48は
幅16ピクセル高さ22ピクセルの大きさであり、全文字に
対する個々のピクセルの重みを持つ。その重みはピクセ
ル領域内の黒い四角の大きさで示される。例えば、完全
白のピクセル50はこのピクセルのPDFは0であることを
意味する。全黒のピクセル52は第3図の処理におけるホ
ントについてこのピクセルが非常に高いPDFであること
を示す。ピクセル54は小さいが存在するPDFを示す。
幅16ピクセル高さ22ピクセルの大きさであり、全文字に
対する個々のピクセルの重みを持つ。その重みはピクセ
ル領域内の黒い四角の大きさで示される。例えば、完全
白のピクセル50はこのピクセルのPDFは0であることを
意味する。全黒のピクセル52は第3図の処理におけるホ
ントについてこのピクセルが非常に高いPDFであること
を示す。ピクセル54は小さいが存在するPDFを示す。
ス−パ・ウインドウ46が上記のように練習した後、処
理42の各工程を使用する。書類14のデ−タ・マトリック
ス22はコントロ−ラ26のRAM30に記憶される。デ−タ・
マトリックス22が終了したとき、RAM30から引出され、
前述のようにフィ−ルド#1及び#2をさがすように審
査される。
理42の各工程を使用する。書類14のデ−タ・マトリック
ス22はコントロ−ラ26のRAM30に記憶される。デ−タ・
マトリックス22が終了したとき、RAM30から引出され、
前述のようにフィ−ルド#1及び#2をさがすように審
査される。
第6図はバイナリ1及び0から成るデ−タのマトリッ
クス56を示す。フィ−ルド#1及び#2のデ−タのみを
第6図に示すが、デ−タ・フィ−ルドの正確な位置は前
述のように知られない。このデ−タ・マトリックス56の
ためのデ−タの開始行は上部の代りに書類の底部にある
(第2図)。
クス56を示す。フィ−ルド#1及び#2のデ−タのみを
第6図に示すが、デ−タ・フィ−ルドの正確な位置は前
述のように知られない。このデ−タ・マトリックス56の
ためのデ−タの開始行は上部の代りに書類の底部にある
(第2図)。
処理42の部分は、書類のデ−タ・フィ−ルド又は領域
をさがすため、第5図の処理によってデ−タ・マトリッ
クス56(第6図)を走査又は審査することを含む。例え
ば、フィ−ルド#1は書類の金額フィ−ルドであり、フ
ィ−ルド#2は、例えば、客の口座番号でよい。例え
ば、アメリカにおいて、フィ−ルド#1,#2はE13Bホン
トの磁気インキでプリントされるが、走査及び文字認識
技術はデ−タの光学処理で行われる。
をさがすため、第5図の処理によってデ−タ・マトリッ
クス56(第6図)を走査又は審査することを含む。例え
ば、フィ−ルド#1は書類の金額フィ−ルドであり、フ
ィ−ルド#2は、例えば、客の口座番号でよい。例え
ば、アメリカにおいて、フィ−ルド#1,#2はE13Bホン
トの磁気インキでプリントされるが、走査及び文字認識
技術はデ−タの光学処理で行われる。
第6図のイメ−ジ・デ−タに関するデ−タの処理の説
明を続けると、処理42は第5図の水平方向へのイメ−ジ
・デ−タの走査を含む。イメ−ジ・デ−タのマトリック
ス56はコントロ−ラ26のRAM30に記憶され、例えば、RAM
30に記憶されているソフトウエア・ル−チンは第5図に
示すようなデ−タの処理に使用される。
明を続けると、処理42は第5図の水平方向へのイメ−ジ
・デ−タの走査を含む。イメ−ジ・デ−タのマトリック
ス56はコントロ−ラ26のRAM30に記憶され、例えば、RAM
30に記憶されているソフトウエア・ル−チンは第5図に
示すようなデ−タの処理に使用される。
デ−タのマトリックス56の走査又は処理は第6図のフ
ィ−ルド#1,#2のデ−タの範囲又は開始行及び停止行
を決定するために行われる。すなわち、処理42(第5
図)はブロック58に含まれている開始工程を含む。基本
的に、処理42は、ブロック60に示すように、その行のバ
イナリ“1"をさがすことによって、1時に1行テストし
てデ−タ・マトリックス56を走査する。空の行はバイナ
リ“1"を持たない1である。行が空であると(ブロック
62)、処理42は次の行デ−タを得(ブロック64)、その
行でバイナリ“1"をさがす。この処理で、走査は底部
(第6図)から上部に行われる。ある行にバイナリ“1"
が見つかったときに、その行はブロック66で示すフィ−
ルドの開始行としてマ−クされる。この開始行は第7図
のテ−ブル68にも記録され、テ−ブル68はRAM30に記憶
される。説明のために、フィ−ルド#1は行8で開始す
るものと推定する。
ィ−ルド#1,#2のデ−タの範囲又は開始行及び停止行
を決定するために行われる。すなわち、処理42(第5
図)はブロック58に含まれている開始工程を含む。基本
的に、処理42は、ブロック60に示すように、その行のバ
イナリ“1"をさがすことによって、1時に1行テストし
てデ−タ・マトリックス56を走査する。空の行はバイナ
リ“1"を持たない1である。行が空であると(ブロック
62)、処理42は次の行デ−タを得(ブロック64)、その
行でバイナリ“1"をさがす。この処理で、走査は底部
(第6図)から上部に行われる。ある行にバイナリ“1"
が見つかったときに、その行はブロック66で示すフィ−
ルドの開始行としてマ−クされる。この開始行は第7図
のテ−ブル68にも記録され、テ−ブル68はRAM30に記憶
される。説明のために、フィ−ルド#1は行8で開始す
るものと推定する。
処理42(第5図)はブロック70で示すように次の行の
審査を続ける。この次の行はバイナリ1を含む可能性が
高いからブロック72で示すように“空”ではない。この
おこりうる可能性は少くとも1文字の高さだけあるであ
ろう。従って、次の行が得られ(ブロック74)、その処
理はバイナリ1がその行に見つからなくなるまで反復さ
れ、そのときはその行が空であることが示され(ブロッ
ク72)、ブロック76でフィ−ルドの終了を表示する。フ
ィ−ルドの終了又は行停止はテ−ブル68に記録され、第
7図に28で示される。例えば、行28がブロック78に述べ
るように、デ−タ・マトリックス56のためのバッファ又
はRAM30の最後の行ではないと、その処理は繰返えさ
れ、ブロック60のテスト工程から開始する。行28がデ−
タ・マトリックス56の最後の行であると、その処理はブ
ロック80で示すように停止する。
審査を続ける。この次の行はバイナリ1を含む可能性が
高いからブロック72で示すように“空”ではない。この
おこりうる可能性は少くとも1文字の高さだけあるであ
ろう。従って、次の行が得られ(ブロック74)、その処
理はバイナリ1がその行に見つからなくなるまで反復さ
れ、そのときはその行が空であることが示され(ブロッ
ク72)、ブロック76でフィ−ルドの終了を表示する。フ
ィ−ルドの終了又は行停止はテ−ブル68に記録され、第
7図に28で示される。例えば、行28がブロック78に述べ
るように、デ−タ・マトリックス56のためのバッファ又
はRAM30の最後の行ではないと、その処理は繰返えさ
れ、ブロック60のテスト工程から開始する。行28がデ−
タ・マトリックス56の最後の行であると、その処理はブ
ロック80で示すように停止する。
このときのロジッグは、ある行で重複部分を持つかも
しれない異なるフィ−ルドのために、いかに開始及び停
止行が決定される関にかするものである。第6図に示す
ように、書類上に複数フィ−ルドがある場合、このフィ
−ルドの開始及び停止行を検索する前にフィ−ルド#1,
#2の開始及び停止例を検索した方がよい。例えば、フ
ィ−ルド#1のための開始及び停止行を知ることによっ
て、これら開始及び停止列間にある行デ−タのみがこの
フィ−ルドの開始及び停止行の決定に使用することがで
きる。
しれない異なるフィ−ルドのために、いかに開始及び停
止行が決定される関にかするものである。第6図に示す
ように、書類上に複数フィ−ルドがある場合、このフィ
−ルドの開始及び停止行を検索する前にフィ−ルド#1,
#2の開始及び停止例を検索した方がよい。例えば、フ
ィ−ルド#1のための開始及び停止行を知ることによっ
て、これら開始及び停止列間にある行デ−タのみがこの
フィ−ルドの開始及び停止行の決定に使用することがで
きる。
第6図にフィ−ルドのデ−タのサ−チを示し、縦方向
のサ−チは第9図の処理42−1に示される。垂直方向の
サ−チのための処理42−1は水平方向のサ−チの処理42
と同一である。従って、第9図の個々の工程は第5図の
ブロックに対応する数で示され、単に第9図では数の後
に−1を付している。例えば、第5図のブロック60によ
るテスト工程は第9図の工程60−1のテスト工程に対応
する。
のサ−チは第9図の処理42−1に示される。垂直方向の
サ−チのための処理42−1は水平方向のサ−チの処理42
と同一である。従って、第9図の個々の工程は第5図の
ブロックに対応する数で示され、単に第9図では数の後
に−1を付している。例えば、第5図のブロック60によ
るテスト工程は第9図の工程60−1のテスト工程に対応
する。
処理42−1(第9図)を行うことから受ける値は第7
図に示すテ−ブル68に記憶される。フィ−ルド#1の開
始列は20であり、停止列は120である。同様に、フィ−
ルド#2の開始及び停止列は200及び600である。テ−ブ
ル68に示す値は理想的状態における単なる表示用値であ
る。すなわち、これは無雑音値である。
図に示すテ−ブル68に記憶される。フィ−ルド#1の開
始列は20であり、停止列は120である。同様に、フィ−
ルド#2の開始及び停止列は200及び600である。テ−ブ
ル68に示す値は理想的状態における単なる表示用値であ
る。すなわち、これは無雑音値である。
第8図は、雑音状態下で開始及び停止行の値を得た場
合におけるフィ−ルド#1の値を示すテ−ブル82であ
る。“雑音”は、例えば、小切手14のインキのにじみや
背景のデ−タから生ずるかもしれない。テ−ブル82は行
1で開始し、行2で停止することを示し、又行8及び28
で夫々開始及び停止する第2群を示す。コントロ−ラ26
はフィ−ルド#1,#2の予定の高さは何であるを知り、
行1及び2の開始及び停止デ−タを雑音として拒絶し、
行8及び28の開始及び停止を有効デ−タとして受け入れ
る。又、コントロ−ラはフィ−ルドの幅を知っているの
で、列を走査したとき、デ−タを雑音として拒絶するこ
ともできる。
合におけるフィ−ルド#1の値を示すテ−ブル82であ
る。“雑音”は、例えば、小切手14のインキのにじみや
背景のデ−タから生ずるかもしれない。テ−ブル82は行
1で開始し、行2で停止することを示し、又行8及び28
で夫々開始及び停止する第2群を示す。コントロ−ラ26
はフィ−ルド#1,#2の予定の高さは何であるを知り、
行1及び2の開始及び停止デ−タを雑音として拒絶し、
行8及び28の開始及び停止を有効デ−タとして受け入れ
る。又、コントロ−ラはフィ−ルドの幅を知っているの
で、列を走査したとき、デ−タを雑音として拒絶するこ
ともできる。
開始及び停止行と列の限界がデ−タの特定のマトリッ
クス56の各種フィ−ルドのために得られた後、処理42の
次の工程をス−パ・ウインドウ(第3図で説明した)46
を使用して開始する。前述のように、ス−パ・ウインド
ウ46の大きさはスキャナ18の解像度と使用するホントの
文字の高さ及び実際のピッチの大きさとに反映する。第
6,7,8図で述べたフィ−ルド#1を拡大して第10図に示
す。コントロ−ラ26はそのRAM30のフィ−ルド#1に関
する開始及び停止行及び列を有する。このイメ−ジ・デ
−タはス−パ・ウインドウ46について処理されるべく引
出される。
クス56の各種フィ−ルドのために得られた後、処理42の
次の工程をス−パ・ウインドウ(第3図で説明した)46
を使用して開始する。前述のように、ス−パ・ウインド
ウ46の大きさはスキャナ18の解像度と使用するホントの
文字の高さ及び実際のピッチの大きさとに反映する。第
6,7,8図で述べたフィ−ルド#1を拡大して第10図に示
す。コントロ−ラ26はそのRAM30のフィ−ルド#1に関
する開始及び停止行及び列を有する。このイメ−ジ・デ
−タはス−パ・ウインドウ46について処理されるべく引
出される。
ス−パ・ウインドウ46はフィ−ルド#1に対して位置
決めされ、審査又はス−パ・ウインドウ46の縦方向中間
点は、フィ−ルドの右側から第10図の左側の方に移動す
る審査方向に進んだときに、文字のピッチの中間点まで
数列前に位置付けされる。例えば、ス−パ・ウインドウ
46は幅20ピクセル及び高さ24ピクセルの大きさであり、
区分される特定のホントのピッチは20ピクセル幅である
とする。この例により、ス−パ・ウインドウ46の縦の中
心は第10図に示すように開始列20から8列である列28に
位置付けされる。
決めされ、審査又はス−パ・ウインドウ46の縦方向中間
点は、フィ−ルドの右側から第10図の左側の方に移動す
る審査方向に進んだときに、文字のピッチの中間点まで
数列前に位置付けされる。例えば、ス−パ・ウインドウ
46は幅20ピクセル及び高さ24ピクセルの大きさであり、
区分される特定のホントのピッチは20ピクセル幅である
とする。この例により、ス−パ・ウインドウ46の縦の中
心は第10図に示すように開始列20から8列である列28に
位置付けされる。
ス−パ・ウインドウ46が第10図に示すように配置され
ると、コントロ−ラ24はス−パ・ウインドウ46の情報内
容を加算し、そのウインドウ位置における総和を得る。
すなわち、この例によるス−パ・ウインドウには20×24
=480ピクセルがある。ス−パ・ウインドウ46の各1ピ
クセルはス−パ・ウインドウ46の練習で説明した合成PD
Fを有するということを思い出そう。480ピクセルの各1
つは審査されて、バイナリ“1"か“0"が定められる。コ
ントロ−ラ26は各バイナリ“1"のピクセルのためにその
PDFを加えて、この例では列28である特定のウインドウ
位置における合計ウインドウ値(TWV)又はウインドウ
合計を得る。又は、TWVはス−パ・ウインドウ46のバイ
ナリ1とそのPDFの値との積を累計することによって得
ることができる。ウインドウ合計はこの例では280であ
ろう。コントロ−ラ26はス−パ・ウインドウ46を列29で
ウインドウ合計を得ることができるように移動し、その
位置でウインドウ合計は330であろう。同様に、ス−パ
・ウインドウ46が列30に移動したとき、ウインドウ合計
は310であろう。ス−パ・ウインドウ46がこの例では列2
9に位置付けされたときに、最大又はピ−ク・ウインド
ウ合計が得られた。これは、ス−パ・ウインドウ46の縦
中心が列29に配置されたときに、ス−パ・ウインドウ46
はフィ−ルド#1の最初の文字に対して最も正しく配置
されたということを意味する。
ると、コントロ−ラ24はス−パ・ウインドウ46の情報内
容を加算し、そのウインドウ位置における総和を得る。
すなわち、この例によるス−パ・ウインドウには20×24
=480ピクセルがある。ス−パ・ウインドウ46の各1ピ
クセルはス−パ・ウインドウ46の練習で説明した合成PD
Fを有するということを思い出そう。480ピクセルの各1
つは審査されて、バイナリ“1"か“0"が定められる。コ
ントロ−ラ26は各バイナリ“1"のピクセルのためにその
PDFを加えて、この例では列28である特定のウインドウ
位置における合計ウインドウ値(TWV)又はウインドウ
合計を得る。又は、TWVはス−パ・ウインドウ46のバイ
ナリ1とそのPDFの値との積を累計することによって得
ることができる。ウインドウ合計はこの例では280であ
ろう。コントロ−ラ26はス−パ・ウインドウ46を列29で
ウインドウ合計を得ることができるように移動し、その
位置でウインドウ合計は330であろう。同様に、ス−パ
・ウインドウ46が列30に移動したとき、ウインドウ合計
は310であろう。ス−パ・ウインドウ46がこの例では列2
9に位置付けされたときに、最大又はピ−ク・ウインド
ウ合計が得られた。これは、ス−パ・ウインドウ46の縦
中心が列29に配置されたときに、ス−パ・ウインドウ46
はフィ−ルド#1の最初の文字に対して最も正しく配置
されたということを意味する。
この例のフィ−ルド#1の最初の文字のイメ−ジ・デ
−タを見つけた後、ス−パ・ウインドウが列29において
縦の中心としたときに、ス−パ・ウインドウ46に入って
いるすべてのピクセルを引き出す。このピクセルは最初
の文字のピクセル・マトリックスを構成する。フィ−ル
ド#1から区分されたこのピクセル・マトリックスは後
に文字認識を受けるか、又はオン・ライン処理のために
文字認識で処理されるためにRAM30に記憶される。
−タを見つけた後、ス−パ・ウインドウが列29において
縦の中心としたときに、ス−パ・ウインドウ46に入って
いるすべてのピクセルを引き出す。このピクセルは最初
の文字のピクセル・マトリックスを構成する。フィ−ル
ド#1から区分されたこのピクセル・マトリックスは後
に文字認識を受けるか、又はオン・ライン処理のために
文字認識で処理されるためにRAM30に記憶される。
次に、この例におけるフィ−ルド#1(第10図)の第
2の文字に関するイメ−ジ・デ−タの位置を説明する。
最初の文字のピクセル・マトリックスは列29に置かれる
ので、このホントのピッチは20であり、コントロ−ラ26
はス−パ・ウインドウ46を列48が中心となるよう移動す
る。列48の位置は前の文字(列29)の縦中心の位置に文
字ピッチ(20列)を加えて引出され、最初の文字のデ−
タ・マトリックスの縦中心に位置付けすることで行なわ
れたように、コントロ−ラ26が最大合計をチェックする
ことができるように列を後退する(−1列)。ス−パ・
ウインドウ46の中心が列48に配置されて、コントロ−ラ
26はそのウインドウに入っているピクセル合計を計算す
る。ウインドウを左に移動してピ−クを見つけたとき、
そのウインドウ内のピクセルをフィ−ルド#1の第2の
文字のピクセル・マトリックスを表わすものとして取出
す。この処理はフィ−ルドフィ−ルド#1の他の全ての
文字について繰返えされる。ウインドウ46をピクセル・
マトリックスの中心におくのは文字認識を容易にするよ
う、その文字を常に他から区分することである。
2の文字に関するイメ−ジ・デ−タの位置を説明する。
最初の文字のピクセル・マトリックスは列29に置かれる
ので、このホントのピッチは20であり、コントロ−ラ26
はス−パ・ウインドウ46を列48が中心となるよう移動す
る。列48の位置は前の文字(列29)の縦中心の位置に文
字ピッチ(20列)を加えて引出され、最初の文字のデ−
タ・マトリックスの縦中心に位置付けすることで行なわ
れたように、コントロ−ラ26が最大合計をチェックする
ことができるように列を後退する(−1列)。ス−パ・
ウインドウ46の中心が列48に配置されて、コントロ−ラ
26はそのウインドウに入っているピクセル合計を計算す
る。ウインドウを左に移動してピ−クを見つけたとき、
そのウインドウ内のピクセルをフィ−ルド#1の第2の
文字のピクセル・マトリックスを表わすものとして取出
す。この処理はフィ−ルドフィ−ルド#1の他の全ての
文字について繰返えされる。ウインドウ46をピクセル・
マトリックスの中心におくのは文字認識を容易にするよ
う、その文字を常に他から区分することである。
第1図は、この発明の実施に使用しうる装置を示す全体
図、 第2図は、デ−タ・マトリックスを示す略図、 第3図は、この発明の実施に使用する“ス−パ・ウイン
ドウ”を示す略図、 第4図は、そのピクセルのPDFを表わす黒色の大きさを
示し、特定のスタイル又はホントの一組の文字に対する
審査ウインドウ内の各ピクセルの確率密度関数(PDF)
を示す略図、 第5図は、書類のデ−タ・マトリックスのピクセル・デ
−タ行を審査するときにデ−タ・フィ−ルドをさがす処
理を示す流れ図、 第6図は、書類のバイナリ・デ−タ・マトリックスを示
す略図、 第7図は、理想的状態について決定された第6図のデ−
タ・マトリックスのあるフィ−ルドにおけるスタ−ト及
びストップ行と、スタ−ト及びストップ列とを示すテ−
ブル、 第8図は、雑音状態下で考えられる値の第7図と同様な
テ−ブル、 第9図は、書類のデ−タ・マトリックスのデ−タ列を審
査するときにデ−タ・フィ−ルドをさがす処理を示す流
れ図、 第10図は、デ−タ・マトリックスに含まれている文字フ
ィ−ルドの一部に置かれているス−パ・ウインドウを示
す略図である。 図中、10……本発明に使用する装置、12……物品トラン
スポ−ト、14……書類、16……走査ライン、18……スキ
ャナ、20……処理回路、22……マトリックス、24,26…
…コントロ−ラ、28……ROM、30……RAM、32……キ−ボ
−ド、34……ディスプレイ、36,38……インタフェ−
ス、40……制御ロジック。
図、 第2図は、デ−タ・マトリックスを示す略図、 第3図は、この発明の実施に使用する“ス−パ・ウイン
ドウ”を示す略図、 第4図は、そのピクセルのPDFを表わす黒色の大きさを
示し、特定のスタイル又はホントの一組の文字に対する
審査ウインドウ内の各ピクセルの確率密度関数(PDF)
を示す略図、 第5図は、書類のデ−タ・マトリックスのピクセル・デ
−タ行を審査するときにデ−タ・フィ−ルドをさがす処
理を示す流れ図、 第6図は、書類のバイナリ・デ−タ・マトリックスを示
す略図、 第7図は、理想的状態について決定された第6図のデ−
タ・マトリックスのあるフィ−ルドにおけるスタ−ト及
びストップ行と、スタ−ト及びストップ列とを示すテ−
ブル、 第8図は、雑音状態下で考えられる値の第7図と同様な
テ−ブル、 第9図は、書類のデ−タ・マトリックスのデ−タ列を審
査するときにデ−タ・フィ−ルドをさがす処理を示す流
れ図、 第10図は、デ−タ・マトリックスに含まれている文字フ
ィ−ルドの一部に置かれているス−パ・ウインドウを示
す略図である。 図中、10……本発明に使用する装置、12……物品トラン
スポ−ト、14……書類、16……走査ライン、18……スキ
ャナ、20……処理回路、22……マトリックス、24,26…
…コントロ−ラ、28……ROM、30……RAM、32……キ−ボ
−ド、34……ディスプレイ、36,38……インタフェ−
ス、40……制御ロジック。
Claims (1)
- 【請求項1】既知の所定の行位置に設けられた少なくと
も1つの文字フィ−ルドを有する所定形状の書類に印字
された予め規定されたフォント文字を構成するバイナリ
・ピクセル・マトリクスから成る光学的に読取られたイ
メ−ジ・デ−タを、複数の連続する前記フォント文字を
認識するために、前記バイナリ・ピクセル・マトリクス
毎に区分する方法であって、 (イ) 前記イメ−ジ・デ−タの文字に関する所定数の
行及び列から成るピクセルをカバ−する大きさの審査ウ
ィンドウを選ぶ工程と、 (ロ) 前記文字バイナリ・ピクセルを検索しようとす
る前記所定の行において、区分される一組の文字の各文
字に対する審査ウィンドウ内の各ピクセルについてドッ
トの存在確率値(以下、PDFという)を求めて、当該審
査ウィンドウ内の各ピクセルについての合成PDFを計算
する工程と、 (ハ) 前記審査フィ−ルドを前記文字フィ−ルドの前
記所定の行の一ヵ所の位置に位置付けする工程と、 (ニ) 前記審査ウィンドウ内の各バイナリ・ピクセル
及びそれに関する合成PDFを使用して前記審査ウィンド
ウにおけるPDF合計値を得る工程と、 (ホ) 前記審査フィ−ルドにおける前記審査ウィンド
ウを、同じ行の横方向にピクセル毎に移動して前記
(ニ)の工程を繰り返すことによって前記審査ウィンド
ウの前記PDF合計値の最大値を得る工程と、 (ヘ) 前記工程(ホ)において得られた前記PDF合計
値の最大値に基づいて、前記審査ウィンドウにおける前
記一組の文字の1文字に関するイメ−ジ・デ−タを区分
けする工程と、 (ト) 当該フィ−ルドにおける残りのイメ−ジ・デ−
タについて前記工程(ハ)乃至(ホ)を反復する工程、 の各工程により構成されることを特徴とする、書類上の
所定行に記載された連続する複数のキャラクタ・イメ−
ジの区分方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/271,982 US4932065A (en) | 1988-11-16 | 1988-11-16 | Universal character segmentation scheme for multifont OCR images |
US271,982 | 1988-11-16 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02165392A JPH02165392A (ja) | 1990-06-26 |
JP3035309B2 true JP3035309B2 (ja) | 2000-04-24 |
Family
ID=23037914
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1273919A Expired - Lifetime JP3035309B2 (ja) | 1988-11-16 | 1989-10-23 | キャラクタ・イメージの区分方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US4932065A (ja) |
EP (1) | EP0369761B1 (ja) |
JP (1) | JP3035309B2 (ja) |
CA (1) | CA1316606C (ja) |
DE (1) | DE68915950T2 (ja) |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2822189B2 (ja) * | 1988-05-19 | 1998-11-11 | ソニー株式会社 | 文字認識装置及び方法 |
GB2224906B (en) * | 1988-10-21 | 1993-05-19 | Ricoh Kk | Dot region discriminating method |
US6067379A (en) * | 1988-12-09 | 2000-05-23 | Cognex Corporation | Method and apparatus for locating patterns in an optical image |
US5050221A (en) * | 1989-02-13 | 1991-09-17 | Ricoh Company, Ltd. | Image generating apparatus |
JP2940936B2 (ja) * | 1989-06-06 | 1999-08-25 | 株式会社リコー | 表領域識別方法 |
US5048095A (en) * | 1990-03-30 | 1991-09-10 | Honeywell Inc. | Adaptive image segmentation system |
JPH04315272A (ja) * | 1991-04-12 | 1992-11-06 | Eastman Kodak Japan Kk | 図形認識装置 |
US5500905A (en) * | 1991-06-12 | 1996-03-19 | Microelectronics And Computer Technology Corporation | Pattern recognition neural network with saccade-like operation |
US5237621A (en) * | 1991-08-08 | 1993-08-17 | Philip Morris Incorporated | Product appearance inspection methods and apparatus employing low variance filter |
US5150425A (en) * | 1991-08-30 | 1992-09-22 | Eastman Kodak Company | Character recognition method using correlation search |
US5553162A (en) * | 1991-09-23 | 1996-09-03 | Eastman Kodak Company | Method for detecting ink jet or dot matrix printing |
US5299269A (en) * | 1991-12-20 | 1994-03-29 | Eastman Kodak Company | Character segmentation using an associative memory for optical character recognition |
US8352400B2 (en) | 1991-12-23 | 2013-01-08 | Hoffberg Steven M | Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore |
US10361802B1 (en) | 1999-02-01 | 2019-07-23 | Blanding Hovenweep, Llc | Adaptive pattern recognition based control system and method |
US5337370A (en) * | 1992-02-28 | 1994-08-09 | Environmental Research Institute Of Michigan | Character recognition method employing non-character recognizer |
EP0566015A3 (en) * | 1992-04-14 | 1994-07-06 | Eastman Kodak Co | Neural network optical character recognition system and method for classifying characters in amoving web |
US5341438A (en) * | 1992-07-22 | 1994-08-23 | Eastman Kodak Company | Method and apparatus for segmenting and classifying unconstrained handwritten characters |
US5859923A (en) * | 1992-12-29 | 1999-01-12 | Cognex Corporation | Mark quality inspection apparatus and method |
US5305392A (en) * | 1993-01-11 | 1994-04-19 | Philip Morris Incorporated | High speed, high resolution web inspection system |
JPH06348800A (ja) * | 1993-06-02 | 1994-12-22 | Canon Inc | 画像処理方法及び装置 |
US5748780A (en) * | 1994-04-07 | 1998-05-05 | Stolfo; Salvatore J. | Method and apparatus for imaging, image processing and data compression |
US6026176A (en) * | 1995-07-25 | 2000-02-15 | Cognex Corporation | Machine vision methods and articles of manufacture for ball grid array inspection |
US5764824A (en) * | 1995-08-25 | 1998-06-09 | International Business Machines Corporation | Clustering mechanism for identifying and grouping of classes in manufacturing process behavior |
US5872870A (en) * | 1996-02-16 | 1999-02-16 | Cognex Corporation | Machine vision methods for identifying extrema of objects in rotated reference frames |
US5909504A (en) * | 1996-03-15 | 1999-06-01 | Cognex Corporation | Method of testing a machine vision inspection system |
US6298149B1 (en) | 1996-03-21 | 2001-10-02 | Cognex Corporation | Semiconductor device image inspection with contrast enhancement |
US6259827B1 (en) | 1996-03-21 | 2001-07-10 | Cognex Corporation | Machine vision methods for enhancing the contrast between an object and its background using multiple on-axis images |
US5978502A (en) * | 1996-04-01 | 1999-11-02 | Cognex Corporation | Machine vision methods for determining characteristics of three-dimensional objects |
US6137893A (en) * | 1996-10-07 | 2000-10-24 | Cognex Corporation | Machine vision calibration targets and methods of determining their location and orientation in an image |
US5960125A (en) | 1996-11-21 | 1999-09-28 | Cognex Corporation | Nonfeedback-based machine vision method for determining a calibration relationship between a camera and a moveable object |
US5953130A (en) * | 1997-01-06 | 1999-09-14 | Cognex Corporation | Machine vision methods and apparatus for machine vision illumination of an object |
US6075881A (en) * | 1997-03-18 | 2000-06-13 | Cognex Corporation | Machine vision methods for identifying collinear sets of points from an image |
US5974169A (en) * | 1997-03-20 | 1999-10-26 | Cognex Corporation | Machine vision methods for determining characteristics of an object using boundary points and bounding regions |
US6141033A (en) * | 1997-05-15 | 2000-10-31 | Cognex Corporation | Bandwidth reduction of multichannel images for machine vision |
US6608647B1 (en) | 1997-06-24 | 2003-08-19 | Cognex Corporation | Methods and apparatus for charge coupled device image acquisition with independent integration and readout |
US5978080A (en) * | 1997-09-25 | 1999-11-02 | Cognex Corporation | Machine vision methods using feedback to determine an orientation, pixel width and pixel height of a field of view |
US6025854A (en) * | 1997-12-31 | 2000-02-15 | Cognex Corporation | Method and apparatus for high speed image acquisition |
US6236769B1 (en) | 1998-01-28 | 2001-05-22 | Cognex Corporation | Machine vision systems and methods for morphological transformation of an image with zero or other uniform offsets |
US6282328B1 (en) | 1998-01-28 | 2001-08-28 | Cognex Corporation | Machine vision systems and methods for morphological transformation of an image with non-uniform offsets |
US6381375B1 (en) | 1998-02-20 | 2002-04-30 | Cognex Corporation | Methods and apparatus for generating a projection of an image |
US6215915B1 (en) | 1998-02-20 | 2001-04-10 | Cognex Corporation | Image processing methods and apparatus for separable, general affine transformation of an image |
US6381366B1 (en) | 1998-12-18 | 2002-04-30 | Cognex Corporation | Machine vision methods and system for boundary point-based comparison of patterns and images |
US6687402B1 (en) | 1998-12-18 | 2004-02-03 | Cognex Corporation | Machine vision methods and systems for boundary feature comparison of patterns and images |
US7904187B2 (en) | 1999-02-01 | 2011-03-08 | Hoffberg Steven M | Internet appliance system and method |
US6684402B1 (en) | 1999-12-01 | 2004-01-27 | Cognex Technology And Investment Corporation | Control methods and apparatus for coupling multiple image acquisition devices to a digital data processor |
US6748104B1 (en) | 2000-03-24 | 2004-06-08 | Cognex Corporation | Methods and apparatus for machine vision inspection using single and multiple templates or patterns |
US7006669B1 (en) | 2000-12-31 | 2006-02-28 | Cognex Corporation | Machine vision method and apparatus for thresholding images of non-uniform materials |
US7386160B2 (en) * | 2004-12-02 | 2008-06-10 | International Business Machines Corporation | System and method for determining image resolution using MICR characters |
US7639861B2 (en) | 2005-09-14 | 2009-12-29 | Cognex Technology And Investment Corporation | Method and apparatus for backlighting a wafer during alignment |
US8111904B2 (en) | 2005-10-07 | 2012-02-07 | Cognex Technology And Investment Corp. | Methods and apparatus for practical 3D vision system |
US8162584B2 (en) | 2006-08-23 | 2012-04-24 | Cognex Corporation | Method and apparatus for semiconductor wafer alignment |
US20080310721A1 (en) * | 2007-06-14 | 2008-12-18 | John Jinhwan Yang | Method And Apparatus For Recognizing Characters In A Document Image |
ITBA20110038A1 (it) | 2011-07-12 | 2013-01-13 | D A Bi Mus Srl | Metodo e apparato per riconoscere testo in immagini digitali raffiguranti pagine di un documento antico |
US9195908B2 (en) | 2013-05-22 | 2015-11-24 | Xerox Corporation | Snow classifier context window reduction using class t-scores and mean differences |
US10192127B1 (en) | 2017-07-24 | 2019-01-29 | Bank Of America Corporation | System for dynamic optical character recognition tuning |
US10346702B2 (en) | 2017-07-24 | 2019-07-09 | Bank Of America Corporation | Image data capture and conversion |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3519990A (en) * | 1966-09-15 | 1970-07-07 | Control Data Corp | Recognition system for reading machine |
GB1233459A (ja) * | 1968-07-15 | 1971-05-26 | ||
US4308523A (en) * | 1980-02-04 | 1981-12-29 | Compuscan, Incorporated | Apparatus and method for character recognition |
JPS5750076A (en) * | 1980-09-10 | 1982-03-24 | Toshiba Corp | Character reader |
US4562594A (en) * | 1983-09-29 | 1985-12-31 | International Business Machines Corp. (Ibm) | Method and apparatus for segmenting character images |
US4680803A (en) * | 1984-12-17 | 1987-07-14 | Ncr Corporation | Method and apparatus for isolating image data for character recognition |
-
1988
- 1988-11-16 US US07/271,982 patent/US4932065A/en not_active Expired - Fee Related
-
1989
- 1989-05-05 CA CA000598805A patent/CA1316606C/en not_active Expired - Fee Related
- 1989-10-23 JP JP1273919A patent/JP3035309B2/ja not_active Expired - Lifetime
- 1989-11-15 DE DE68915950T patent/DE68915950T2/de not_active Expired - Fee Related
- 1989-11-15 EP EP89311810A patent/EP0369761B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH02165392A (ja) | 1990-06-26 |
EP0369761A2 (en) | 1990-05-23 |
DE68915950D1 (de) | 1994-07-14 |
CA1316606C (en) | 1993-04-20 |
EP0369761A3 (en) | 1991-12-18 |
US4932065A (en) | 1990-06-05 |
EP0369761B1 (en) | 1994-06-08 |
DE68915950T2 (de) | 1995-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3035309B2 (ja) | キャラクタ・イメージの区分方法 | |
US5373566A (en) | Neural network-based diacritical marker recognition system and method | |
US4903312A (en) | Character recognition with variable subdivisions of a character region | |
Wang et al. | Classification of newspaper image blocks using texture analysis | |
US4757551A (en) | Character recognition method and system capable of recognizing slant characters | |
EP1061469B1 (en) | Method and apparatus for selecting text and/or non-text blocks in a stored document | |
EP0629970B1 (en) | Method for detecting monetary amounts in binary images | |
US6674900B1 (en) | Method for extracting titles from digital images | |
EP0163377A1 (en) | Pattern recognition system | |
JPH05282495A (ja) | 比較方法 | |
US20030012438A1 (en) | Multiple size reductions for image segmentation | |
US5563958A (en) | System and method for optical character recognition bar-coded characters | |
US5864629A (en) | Character recognition methods and apparatus for locating and extracting predetermined data from a document | |
US4901365A (en) | Method of searching binary images to find search regions in which straight lines may be found | |
US5553162A (en) | Method for detecting ink jet or dot matrix printing | |
JPH05166002A (ja) | ソース画像を分析する方法 | |
US5721790A (en) | Methods and apparatus for separating integer and fractional portions of a financial amount | |
JPH06501803A (ja) | 抽出されたデータから特定の部分を分離して抽出することを含む文字認識方法 | |
Viswanathan et al. | Characteristics of digitized images of technical articles | |
JPH0252329A (ja) | 画像情報記録・読取方法 | |
KR100317653B1 (ko) | 대용량인쇄체문자인식을위한특징추출방법 | |
KR930007083B1 (ko) | 문자인식에서의 후보문자 분류방법 | |
JP2795860B2 (ja) | 文字認識装置 | |
JP2747136B2 (ja) | 文字認識装置 | |
JP3127413B2 (ja) | 文字認識装置 |