JP3035309B2

JP3035309B2 - キャラクタ・イメージの区分方法

Info

Publication number: JP3035309B2
Application number: JP1273919A
Authority: JP
Inventors: フエルドガジヤーオーレツグ
Original assignee: NCR International Inc
Current assignee: NCR International Inc
Priority date: 1988-11-16
Filing date: 1989-10-23
Publication date: 2000-04-24
Anticipated expiration: 2015-04-24
Also published as: JPH02165392A; EP0369761A2; DE68915950D1; CA1316606C; EP0369761A3; US4932065A; EP0369761B1; DE68915950T2

Description

【発明の詳細な説明】〔産業上の利用分野〕この発明は書類上に形成された行及び列のバイナリ・
ピクセルから成るイメ−ジ・デ−タのマトリクスを供給
する光学イメ−ジの処理システムであって、書類内の所
定のフィ−ルドにある文字バイナリ・ピクセルを検索及
び区分して、後の動作（例えば、文字認識）に使用しう
るよう文字のピクセル・デ−タを選出する方法に関す
る。

〔従来の技術〕

近年、書類上に記載されたイメ−ジを読みとってその
情報を処理する傾向が強まってきた。例えば、小切手の
ような書類はそれを移動して走査し、ピクセル・デ−タ
・マトリックスを発生するようにしたものがある。ピク
セルの語は走査した書類の微小領域に対応する画素とし
て定義する。例えば、スキャナから発生した各走査線又
は列について約600又は900ピクセルが存在するであろ
う。書類がスキャナ上を移動すると、一連の走査ピクセ
ル・ラインを発生し、各書類のピクセル・マトリックス
を発生する。

スキャナからのピクセル・マトリックスは、例えば、
しきい値で処理され、各ピクセルをデ−タを表わすバイ
ナリ“1"とデ−タなしを表わすバイナリ“0"とに分類さ
れる。この方式により各書類のイメ−ジに対応するピク
セル・マトリックスをその書類から得ることができる。
そのピクセル・マトリックスはRAMに記憶され、又はCRT
にディスプレイされ、デ−タを完成する際それをオペレ
−タが見ることができる。

ピクセル・マトリックスはその書類に関するイメ−ジ
・デ−タを含む。例えば、小切手のような金融書類を処
理する場合、小切手には機械で読取られるフィ−ルドが
ある。そのフィ−ルドは、例えば、E13B又はCMC7のよう
なホントで印刷される文字デ−タを含む。例えば、１走
査ラインに約200ピクセル／インチの解像度を持つ場
合、ピクセル・マトリックスを使用して光学文字認識に
よりそのフィ−ルドの機械読取が可能である。

〔発明が解決しようとする問題点〕

ピクセル・マトリックスを使用する場合の問題点は読
取られる文字を含むフィ−ルドを検出することが一般に
困難であるということである。特に、読取るべきフィ−
ルドが書類の異なる部分にあるときには難かしい。その
上、読取るフィ−ルドを検出した後、このフィ−ルドか
ら１つの文字のピクセルを分離するため、そのフィ−ル
ドのピクセル・マトリックスを区分する必要があるとい
う問題が生じた。各文字のピクセルが区分された後、そ
のピクセルは文字認識を受けるであろう。この文字認識
技術は、例えば、人工知能回路又は他の回路網を含むか
もしれないということである。

この発明の目的は、読み取るべきフィ−ルドを検出し
た後の文字認識を容易にするため、既知の所定の行位置
に設けられた少なくとも１つの文字フィ−ルドを有する
所定形状の書類に印字された予め規定されたフォント文
字を構成するバイナリ・ピクセル・マトリクスから成る
光学的に読取られたイメ−ジ・デ−タを、１文字分の前
記バイナリ・ピクセル・マトリクス毎に区分する方法を
提供することである。

〔問題点を解決するための手段〕

この発明は上記の問題点を下記のようにして解決し
た。すなわち、この発明によると、既知の所定の行位置
に設けられた少なくとも１つの文字フィ−ルドを有する
所定形状の書類に印字された予め規定されたフォント文
字を構成するバイナリ・ピクセル・マトリクスから成る
光学的に読取られたイメ−ジ・デ−タを、複数の連続す
る前記フォント文字を認識するために、前記バイナリ・
ピクセル・マトリクス毎に区分する方法であって、（イ）前記イメ−ジ・デ−タの文字に関する所定数の
行及び列から成るピクセルをカバ−する大きさの審査ウ
ィンドウを選ぶ工程と、（ロ）前記文字バイナリ・ピクセルを検索しようとす
る前記所定の行において、区分される一組の文字の各文
字に対する審査ウィンドウ内の各ピクセルについてドッ
トの存在確率値（以下PDFという）を求めて、当該審査
ウィンドウ内の各ピクセルについての合成PDFを計算す
る工程と、（ハ）前記審査フィ−ルドを前記文字フィ−ルドの前
記所定の行の一ヵ所の位置に位置付けする工程と、（ニ）前記審査ウィンドウ内の各バイナリ・ピクセル
及びそれに関する合成PDFを使用して前記審査ウィンド
ウにおけるPDF合計値を得る工程と、（ホ）前記審査フィ−ルドにおける前記審査ウィンド
ウを、同じ行の横方向にピクセル毎に移動して前記
（ニ）の工程を繰り返すことによって前記審査ウィンド
ウの前記PDF合計値の最大値を得る工程と、（ヘ）前記工程（ホ）において得られた前記PDF合計
値の最大値に基づいて、前記審査ウィンドウにおける前
記一組の文字の１文字に関するイメ−ジ・デ−タを区分
けする工程と、（ト）当該フィ−ルドにおける残りのイメ−ジ・デ−
タについて前記工程（ハ）乃至（ホ）を反復する工程、の各工程により構成されることを特徴とする方法を提供
するものである。

〔実施例〕

第１図の装置10はこの発明の実施に使用することがで
きるもので、従来方式により書類14をスキャナ18で走査
する走査ライン16の方に書類14のようなものを移動する
物品トランスポ−ト12を含む。スキャナ18は物品14が読
取りうるように移動したときに一連の走査ライン又は列
のピクセル・デ−タを発生する。スキャナ18は、例え
ば、読取を行うため、固定書類上を、例えば、ハンド・
スキャナのようなものを用いるものでもよい。スキャナ
18からの一連の列ピクセル・デ−タは雑音を最小にする
処理を受け、デ−タの存在を示すバイナリ“1"とデ−タ
の不存在を示すバイナリ“0"とになるようしきい値が適
用される。この処理は処理回路20として示す従来の回路
で行われる。処理回路20の出力は書類14のイメ−ジに対
応するマトリックス22のバイナリ・デ−タ又はピクセル
（圧縮されていない）である。デ−タのマトリックス22
は、例えば、約900ピクセル／列を含み、200ピクセル／
インチの解像度を持つ。当然、デ−タ・マトリックス22
の全体的大きさは特定の応用によって異なるが、その大
きさはこの発明の理解にとって重要ではない。スキャナ
18及び物品トランスポ−ト12は別のコントロ−ラ24で制
御するようにしてもよく、デ−タ又はピクセル・マトリ
ックス22の処理に使用されるコントロ−ラ26を使用して
もよい。

コントロ−ラ26（第１図）はこの発明のピクセル・マ
トリックス22の処理に使用することができる従来のコン
トロ−ラである。コントロ−ラ26は読出専用メモリ−
（ROM28）と、ランダム・アクセス・メモリ−（RAM30）
と、キ−ボ−ド（KB）32と、ディスプレイ34と、インタ
フェ−ス36,38と、従来方式で他の成分と相互接続する
インタフェ−ス及び制御ロジック40とを含む。コントロ
−ラ26の形はその動作の説明を容易にするためにのみ使
用され、実際のコントロ−ラ26はこれとは異なるかもし
れない。

詳細な説明の前に、この発明による文字のピクセル・
デ−タ区分方法に使用される工程を説明した方が有益で
あり、処理42で示した（第５図）動作原理を説明する。

例えば、書類14のイメ−ジに対応するピクセル・マト
リックスを持つ場合、マトリックスの中に求めるデ−タ
又は情報が存在する場所をさがすのは困難である。例え
ば、第２図のピクセル・マトリックス44が（第１図のデ
−タ・マトリックス22と類似する）書類14のイメ−ジと
対応するものと仮定する。求めるイメ−ジ・デ−タ又は
ピクセルはフィ−ルド＃１及びフィ−ルド＃２にあるも
のと仮定する。第２図の全イメ−ジは、この例ではバイ
ナリ“1"又は“0"で示すデ−タ又はピクセルの行の数と
デ−タ列の数とで表わすことができる。例えば、列０は
書類14の右側からスタ−トすることができ、列600は書
類14の左側に接近する。従って、行１又は書類14の上部
にあり、行500は底部にある。マトリックス44（第２
図）の上右角は第１図の書類14の上右角に相当する。当
然、行及び列の配置は、例えば、走査の仕方によって逆
にすることもできる。

第２図に示すフィ−ルド＃１及び＃２を検索する処理
の第１の一般的工程は水平及び垂直にマトリックス44の
ピクセルを処理することである。マトリックス44のピク
セルを審査することによって、フィ−ルド＃１の黒ピク
セル又はバイナリ１ピクセルは、この例の列75から開始
し、列175で終る。行方向にピクセルを審査した場合に
は、フィ−ルド＃１は行＃400から開始し、行＃430で終
る。同様に、フィ−ルド＃２は列325から開始して列525
で終り、行450から開始して行480で終る。この審査はRO
M28又はRAM30にある適当なソフトウエア・プログラムを
使用してコントロ−ラ26で行われる。

第２図で説明するフィ−ルド＃1,＃２の概念はピクセ
ル・マトリックス44に含まれているピクセルの処理を促
進するのに使用される。もし、例えば、フィ−ルド＃１
のバンド幅を知ると、このフィ−ルドの最右端がわかり
（第２図の）、このフィ−ルドのピクセル列の適切な量
を引き出すことができる。この例では、＃１の幅は列75
から列175に延びている。当然、フィ−ルドのピクセル
行の適当な数を引出すことができる。この例によるフィ
−ルド＃１は行400〜430間に延びる。フィ−ルド＃１及
び＃２に示す特定の数は実際に各ホントで表わされた数
を示すのを容易にするため普通の形で示してある。

処理42で使用されるもう１つの概念は“ス−パ・ウイ
ンドウ”と称する。ス−パ・ウインドウは特定のホント
の個々の文字に関するピクセルの検索を容易にする。例
えば、E13Bホントで文字がプリントされている場合、こ
のホントの文字ピッチは0.125インチである。このピッ
チは文字の先端から次の文字の先端までの距離である。
スキャナ18（第１図）の解像度は200ピクセル／インチ
であり、その結果生じたス−パ・ウインドウは25ピクセ
ル（0.125×200）の幅を持つ。E13Bホントの実際の高さ
は0.117インチであり、ス−パ・ウインドウの高さに含
まれているピクセルの数は24である。ス−パ・ウインド
ウに含まれているピクセルの数はスキャナ18の解像度及
び使用されるホントによって異なる。又、これらホント
はこの発明にも使用される。すなわち、各使用されるホ
ントは自己の特定なス−パ・ウインドウを持つ。

審査ウインドウ又はス−パ・ウインドウ46は第３図に
示され、第１図に示す走査ライン16に対応する垂直列を
持ち、走査ライン16のピクセルを表わすしきい値処理さ
れたバイナリ・デ−タに対応する四角48,50を持つ。

この発明の特徴は、文字認識のための人工知能回路等
に供するべく、使用するホントに含まれているすべての
組の文字に対するス−パ・ウインドウ46に置かれている
各ピクセルのための統計的に平衡に分配されたドットの
存在確率値（PDFという）を得ることに使用することが
できるということである。この説明により、それが引出
される次の例で明解となるであろう。

例えば、ス−パ・ウインドウ46は処理42が前述の区分
を実行しうるよう“練習”されなければならない。その
練習処理はス−パ・ウインドウ46に供給された既知文字
で始めることができる。すなわち、第３図に示すよう
に、ウインドウ46に数１を与えることができる。説明を
簡単にするため、２つの列、すなわちＸ及びＹに延びる
だけで、数１の設計は簡単であるものとする。当然、数
１が選ばれたホントでプリントされると、それは２つの
列以上に延びるかもしれない。この例のバイナリ・ピク
セル・デ−タはＸ及びＹ列のバイナリ１を含み、ス−パ
・ウインドウ46の他の列すべてにバイナリ“0"が存在す
ることになる。図を簡単にするため、第３図にはバイナ
リ１のみを示す。コントロ−ラ26は、例えばRAM30に記
憶されているソフトウエアを通して、ス−パ・ウインド
ウ46の行及び列位置の各位置に置かれているバイナリ１
の累計値を格納する。

前述の練習処理を継続し、数１の第２の例をス−パ・
ウインドウ46に提供する。又、そこに含まれている種々
の行及び列位置のためにス−パ・ウインドウ46に存在す
るすべてのバイナリ１の累計値が記憶される。又、Ｘ及
びＹ列にバイナリ１があり、Ｘ及びＹ列の行位置の各々
のために合計２が含まれていることになると仮定する。
この同じ処理は更に８サンプル繰返され、合計10サンプ
ルとなるものとする。これは、列Ｘ及びＹのための行位
置の各１はカウント10を持つだろうということを意味す
る。これらカウントはス−パ・ウインドウ46内のすべて
のピクセルのための行及び列位置を表わす位置でコント
ロ−ラ26のRAM30に記憶される。何が得られたかに対す
る簡略説明は、２次元アレイの重みは使用するホントの
数１のために得られたということである。

上記の処理は使用するホントのすべての文字について
繰返えされる。すなわち、区分を受ける文字の組の文字
すべてについて、数字“2"、数字“3"等について10サン
プルが得られる。実際に、このホントに含まれている各
文字はそのために計算されたそれ自体の２次元アレイの
重み（バイナリ１をカウントする）を持つ。その組の各
文字のために計算されたアレイの重みのすべては行及び
列位置で共に加えられ、ス−パ・ウインドウ46内の各ピ
クセル位置のための合成合計を形成する。合成合計は合
計重み値とも考えられる。例えば、ス−パ・ウインドウ
46の上左角のピクセル52が使用するホントに含まれてい
る文字のすべてにバイナリ１を持たない場合には、その
ピクセル位置がE13B文字によりバイナリ１にセットされ
る可能性は０である。特定のピクセル位置において、カ
ウント又は重みが高いことは、このホントの文字がス−
パ・ウインドウ46に出合ったときに、そのピクセルがバ
イナリ１にセットされるだろうことの確率である。１つ
の実施例で、ス−パ・ウインドウは20ピクセル幅の高さ
24ピクセル（第３図）の大きさで480ピクセルのマトリ
ックスを形成する。

第４図は他の実施例であり、ス−パ・ウインドウ48は
幅16ピクセル高さ22ピクセルの大きさであり、全文字に
対する個々のピクセルの重みを持つ。その重みはピクセ
ル領域内の黒い四角の大きさで示される。例えば、完全
白のピクセル50はこのピクセルのPDFは０であることを
意味する。全黒のピクセル52は第３図の処理におけるホ
ントについてこのピクセルが非常に高いPDFであること
を示す。ピクセル54は小さいが存在するPDFを示す。

ス−パ・ウインドウ46が上記のように練習した後、処
理42の各工程を使用する。書類14のデ−タ・マトリック
ス22はコントロ−ラ26のRAM30に記憶される。デ−タ・
マトリックス22が終了したとき、RAM30から引出され、
前述のようにフィ−ルド＃１及び＃２をさがすように審
査される。

第６図はバイナリ１及び０から成るデ−タのマトリッ
クス56を示す。フィ−ルド＃１及び＃２のデ−タのみを
第６図に示すが、デ−タ・フィ−ルドの正確な位置は前
述のように知られない。このデ−タ・マトリックス56の
ためのデ−タの開始行は上部の代りに書類の底部にある
（第２図）。

処理42の部分は、書類のデ−タ・フィ−ルド又は領域
をさがすため、第５図の処理によってデ−タ・マトリッ
クス56（第６図）を走査又は審査することを含む。例え
ば、フィ−ルド＃１は書類の金額フィ−ルドであり、フ
ィ−ルド＃２は、例えば、客の口座番号でよい。例え
ば、アメリカにおいて、フィ−ルド＃1,＃２はE13Bホン
トの磁気インキでプリントされるが、走査及び文字認識
技術はデ−タの光学処理で行われる。

第６図のイメ−ジ・デ−タに関するデ−タの処理の説
明を続けると、処理42は第５図の水平方向へのイメ−ジ
・デ−タの走査を含む。イメ−ジ・デ−タのマトリック
ス56はコントロ−ラ26のRAM30に記憶され、例えば、RAM
30に記憶されているソフトウエア・ル−チンは第５図に
示すようなデ−タの処理に使用される。

デ−タのマトリックス56の走査又は処理は第６図のフ
ィ−ルド＃1,＃２のデ−タの範囲又は開始行及び停止行
を決定するために行われる。すなわち、処理42（第５
図）はブロック58に含まれている開始工程を含む。基本
的に、処理42は、ブロック60に示すように、その行のバ
イナリ“1"をさがすことによって、１時に１行テストし
てデ−タ・マトリックス56を走査する。空の行はバイナ
リ“1"を持たない１である。行が空であると（ブロック
62）、処理42は次の行デ−タを得（ブロック64）、その
行でバイナリ“1"をさがす。この処理で、走査は底部
（第６図）から上部に行われる。ある行にバイナリ“1"
が見つかったときに、その行はブロック66で示すフィ−
ルドの開始行としてマ−クされる。この開始行は第７図
のテ−ブル68にも記録され、テ−ブル68はRAM30に記憶
される。説明のために、フィ−ルド＃１は行８で開始す
るものと推定する。

処理42（第５図）はブロック70で示すように次の行の
審査を続ける。この次の行はバイナリ１を含む可能性が
高いからブロック72で示すように“空”ではない。この
おこりうる可能性は少くとも１文字の高さだけあるであ
ろう。従って、次の行が得られ（ブロック74）、その処
理はバイナリ１がその行に見つからなくなるまで反復さ
れ、そのときはその行が空であることが示され（ブロッ
ク72）、ブロック76でフィ−ルドの終了を表示する。フ
ィ−ルドの終了又は行停止はテ−ブル68に記録され、第
７図に28で示される。例えば、行28がブロック78に述べ
るように、デ−タ・マトリックス56のためのバッファ又
はRAM30の最後の行ではないと、その処理は繰返えさ
れ、ブロック60のテスト工程から開始する。行28がデ−
タ・マトリックス56の最後の行であると、その処理はブ
ロック80で示すように停止する。

このときのロジッグは、ある行で重複部分を持つかも
しれない異なるフィ−ルドのために、いかに開始及び停
止行が決定される関にかするものである。第６図に示す
ように、書類上に複数フィ−ルドがある場合、このフィ
−ルドの開始及び停止行を検索する前にフィ−ルド＃1,
＃２の開始及び停止例を検索した方がよい。例えば、フ
ィ−ルド＃１のための開始及び停止行を知ることによっ
て、これら開始及び停止列間にある行デ−タのみがこの
フィ−ルドの開始及び停止行の決定に使用することがで
きる。

第６図にフィ−ルドのデ−タのサ−チを示し、縦方向
のサ−チは第９図の処理42−１に示される。垂直方向の
サ−チのための処理42−１は水平方向のサ−チの処理42
と同一である。従って、第９図の個々の工程は第５図の
ブロックに対応する数で示され、単に第９図では数の後
に−１を付している。例えば、第５図のブロック60によ
るテスト工程は第９図の工程60−１のテスト工程に対応
する。

処理42−１（第９図）を行うことから受ける値は第７
図に示すテ−ブル68に記憶される。フィ−ルド＃１の開
始列は20であり、停止列は120である。同様に、フィ−
ルド＃２の開始及び停止列は200及び600である。テ−ブ
ル68に示す値は理想的状態における単なる表示用値であ
る。すなわち、これは無雑音値である。

第８図は、雑音状態下で開始及び停止行の値を得た場
合におけるフィ−ルド＃１の値を示すテ−ブル82であ
る。“雑音”は、例えば、小切手14のインキのにじみや
背景のデ−タから生ずるかもしれない。テ−ブル82は行
１で開始し、行２で停止することを示し、又行８及び28
で夫々開始及び停止する第２群を示す。コントロ−ラ26
はフィ−ルド＃1,＃２の予定の高さは何であるを知り、
行１及び２の開始及び停止デ−タを雑音として拒絶し、
行８及び28の開始及び停止を有効デ−タとして受け入れ
る。又、コントロ−ラはフィ−ルドの幅を知っているの
で、列を走査したとき、デ−タを雑音として拒絶するこ
ともできる。

開始及び停止行と列の限界がデ−タの特定のマトリッ
クス56の各種フィ−ルドのために得られた後、処理42の
次の工程をス−パ・ウインドウ（第３図で説明した）46
を使用して開始する。前述のように、ス−パ・ウインド
ウ46の大きさはスキャナ18の解像度と使用するホントの
文字の高さ及び実際のピッチの大きさとに反映する。第
6,7,8図で述べたフィ−ルド＃１を拡大して第10図に示
す。コントロ−ラ26はそのRAM30のフィ−ルド＃１に関
する開始及び停止行及び列を有する。このイメ−ジ・デ
−タはス−パ・ウインドウ46について処理されるべく引
出される。

ス−パ・ウインドウ46はフィ−ルド＃１に対して位置
決めされ、審査又はス−パ・ウインドウ46の縦方向中間
点は、フィ−ルドの右側から第10図の左側の方に移動す
る審査方向に進んだときに、文字のピッチの中間点まで
数列前に位置付けされる。例えば、ス−パ・ウインドウ
46は幅20ピクセル及び高さ24ピクセルの大きさであり、
区分される特定のホントのピッチは20ピクセル幅である
とする。この例により、ス−パ・ウインドウ46の縦の中
心は第10図に示すように開始列20から８列である列28に
位置付けされる。

ス−パ・ウインドウ46が第10図に示すように配置され
ると、コントロ−ラ24はス−パ・ウインドウ46の情報内
容を加算し、そのウインドウ位置における総和を得る。
すなわち、この例によるス−パ・ウインドウには20×24
＝480ピクセルがある。ス−パ・ウインドウ46の各１ピ
クセルはス−パ・ウインドウ46の練習で説明した合成PD
Fを有するということを思い出そう。480ピクセルの各１
つは審査されて、バイナリ“1"か“0"が定められる。コ
ントロ−ラ26は各バイナリ“1"のピクセルのためにその
PDFを加えて、この例では列28である特定のウインドウ
位置における合計ウインドウ値（TWV）又はウインドウ
合計を得る。又は、TWVはス−パ・ウインドウ46のバイ
ナリ１とそのPDFの値との積を累計することによって得
ることができる。ウインドウ合計はこの例では280であ
ろう。コントロ−ラ26はス−パ・ウインドウ46を列29で
ウインドウ合計を得ることができるように移動し、その
位置でウインドウ合計は330であろう。同様に、ス−パ
・ウインドウ46が列30に移動したとき、ウインドウ合計
は310であろう。ス−パ・ウインドウ46がこの例では列2
9に位置付けされたときに、最大又はピ−ク・ウインド
ウ合計が得られた。これは、ス−パ・ウインドウ46の縦
中心が列29に配置されたときに、ス−パ・ウインドウ46
はフィ−ルド＃１の最初の文字に対して最も正しく配置
されたということを意味する。

この例のフィ−ルド＃１の最初の文字のイメ−ジ・デ
−タを見つけた後、ス−パ・ウインドウが列29において
縦の中心としたときに、ス−パ・ウインドウ46に入って
いるすべてのピクセルを引き出す。このピクセルは最初
の文字のピクセル・マトリックスを構成する。フィ−ル
ド＃１から区分されたこのピクセル・マトリックスは後
に文字認識を受けるか、又はオン・ライン処理のために
文字認識で処理されるためにRAM30に記憶される。

次に、この例におけるフィ−ルド＃１（第10図）の第
２の文字に関するイメ−ジ・デ−タの位置を説明する。
最初の文字のピクセル・マトリックスは列29に置かれる
ので、このホントのピッチは20であり、コントロ−ラ26
はス−パ・ウインドウ46を列48が中心となるよう移動す
る。列48の位置は前の文字（列29）の縦中心の位置に文
字ピッチ（20列）を加えて引出され、最初の文字のデ−
タ・マトリックスの縦中心に位置付けすることで行なわ
れたように、コントロ−ラ26が最大合計をチェックする
ことができるように列を後退する（−１列）。ス−パ・
ウインドウ46の中心が列48に配置されて、コントロ−ラ
26はそのウインドウに入っているピクセル合計を計算す
る。ウインドウを左に移動してピ−クを見つけたとき、
そのウインドウ内のピクセルをフィ−ルド＃１の第２の
文字のピクセル・マトリックスを表わすものとして取出
す。この処理はフィ−ルドフィ−ルド＃１の他の全ての
文字について繰返えされる。ウインドウ46をピクセル・
マトリックスの中心におくのは文字認識を容易にするよ
う、その文字を常に他から区分することである。

【図面の簡単な説明】

第１図は、この発明の実施に使用しうる装置を示す全体
図、第２図は、デ−タ・マトリックスを示す略図、第３図は、この発明の実施に使用する“ス−パ・ウイン
ドウ”を示す略図、第４図は、そのピクセルのPDFを表わす黒色の大きさを
示し、特定のスタイル又はホントの一組の文字に対する
審査ウインドウ内の各ピクセルの確率密度関数（PDF）
を示す略図、第５図は、書類のデ−タ・マトリックスのピクセル・デ
−タ行を審査するときにデ−タ・フィ−ルドをさがす処
理を示す流れ図、第６図は、書類のバイナリ・デ−タ・マトリックスを示
す略図、第７図は、理想的状態について決定された第６図のデ−
タ・マトリックスのあるフィ−ルドにおけるスタ−ト及
びストップ行と、スタ−ト及びストップ列とを示すテ−
ブル、第８図は、雑音状態下で考えられる値の第７図と同様な
テ−ブル、第９図は、書類のデ−タ・マトリックスのデ−タ列を審
査するときにデ−タ・フィ−ルドをさがす処理を示す流
れ図、第10図は、デ−タ・マトリックスに含まれている文字フ
ィ−ルドの一部に置かれているス−パ・ウインドウを示
す略図である。図中、10……本発明に使用する装置、12……物品トラン
スポ−ト、14……書類、16……走査ライン、18……スキ
ャナ、20……処理回路、22……マトリックス、24,26…
…コントロ−ラ、28……ROM、30……RAM、32……キ−ボ
−ド、34……ディスプレイ、36,38……インタフェ−
ス、40……制御ロジック。

Claims

(57)【特許請求の範囲】

【請求項１】既知の所定の行位置に設けられた少なくと
も１つの文字フィ−ルドを有する所定形状の書類に印字
された予め規定されたフォント文字を構成するバイナリ
・ピクセル・マトリクスから成る光学的に読取られたイ
メ−ジ・デ−タを、複数の連続する前記フォント文字を
認識するために、前記バイナリ・ピクセル・マトリクス
毎に区分する方法であって、（イ）前記イメ−ジ・デ−タの文字に関する所定数の
行及び列から成るピクセルをカバ−する大きさの審査ウ
ィンドウを選ぶ工程と、（ロ）前記文字バイナリ・ピクセルを検索しようとす
る前記所定の行において、区分される一組の文字の各文
字に対する審査ウィンドウ内の各ピクセルについてドッ
トの存在確率値（以下、PDFという）を求めて、当該審
査ウィンドウ内の各ピクセルについての合成PDFを計算
する工程と、（ハ）前記審査フィ−ルドを前記文字フィ−ルドの前
記所定の行の一ヵ所の位置に位置付けする工程と、（ニ）前記審査ウィンドウ内の各バイナリ・ピクセル
及びそれに関する合成PDFを使用して前記審査ウィンド
ウにおけるPDF合計値を得る工程と、（ホ）前記審査フィ−ルドにおける前記審査ウィンド
ウを、同じ行の横方向にピクセル毎に移動して前記
（ニ）の工程を繰り返すことによって前記審査ウィンド
ウの前記PDF合計値の最大値を得る工程と、（ヘ）前記工程（ホ）において得られた前記PDF合計
値の最大値に基づいて、前記審査ウィンドウにおける前
記一組の文字の１文字に関するイメ−ジ・デ−タを区分
けする工程と、（ト）当該フィ−ルドにおける残りのイメ−ジ・デ−
タについて前記工程（ハ）乃至（ホ）を反復する工程、の各工程により構成されることを特徴とする、書類上の
所定行に記載された連続する複数のキャラクタ・イメ−
ジの区分方法。