JPH02165392A

JPH02165392A - 多ホント用万能文字区分方法

Info

Publication number: JPH02165392A
Application number: JP1273919A
Authority: JP
Inventors: Oleg Feldgajer; オーレツグ　フエルドガジヤー
Original assignee: NCR Corp
Current assignee: NCR Voyix Corp
Priority date: 1988-11-16
Filing date: 1989-10-23
Publication date: 1990-06-26
Anticipated expiration: 2015-04-24
Also published as: DE68915950T2; US4932065A; JP3035309B2; EP0369761A3; CA1316606C; EP0369761A2; EP0369761B1; DE68915950D1

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕この発明は多ホント光学イメーノ・システムのピクセル
・データ・マトリックスから文字に関するピクセル・デ
ータを区分して、後の動作（例えば、文字認識）に使用
しつるよう文字のピクセル・データを選出する方法に関
する。

〔従来の技術〕

近年、書類の像又はイメージを発生して使用してその情
報を処理する傾向が強まってきた。例えば、小切手のよ
うな書類はそ７″Ｌヲ移動して走査し、ピクセル・デー
タ・マトリックスを発生するようにしたものがある。ピ
クセルの語は走査した書類の微小領域に対応する画素と
して定義する。例えば、スキャナから発生した各走査線
又は列について約６００又は９００ピクセルが存在する
であろう。書類がスキャナ上を移動すると、一連の走査
ピクセル・ラインを発生し、各書類のピクセル・マトリ
ックスを発生する。

スキャナからのピクセル・マトリックスは、例えば、し
きい値で処理され、各ピクセルをデータを表わすバイナ
リ″１″とデータなしを表わすバイナリ″′０”とに分
類される。この方式により各書類のイメージに対応する
ピクセル・マトリックスをその書類から得ることができ
る。そのピクセル・マトリックスはＲＡＭに記憶され、
又はＣＲＴにディヌプレイされ、データを完成する際そ
れをオペレータが見ることができる。

ピクセル・マトリックスはその書類に関するイメージ・
データを含む。例えば、小切手のような金融書類を処理
する場合、小切手には機械で読取られるフィールドがあ
る。そのフィールドは、例えば、Ｅ１３Ｂ又はＣＭＣ７
のようなホントで印刷される文字データを含む。例えば
、１走査ラインに約２００ピクセル／インチの解像度を
持つ場合、ピクセル・マトリックスを使用して光学文字
認識によりそのフィールドの機械読取が可能である。

〔発明が解決しようとする問題点〕

ピクセル・マトリックスを使用する場合の問題点は読取
られる文字を含むフィールドを検出することが一般に困
難であるということである。特に、読取らべきフィール
ドが書類の異なる部分にあるときには難かしい。その上
、読取るフィールド？検出した後、そのフィールドから
１つの文字のピクセル乞分離するため、そのフィールド
のピクセル・マトリックスを区分する必要があるという
問題が生じた。各文字のピクセルが区分された後、その
ピクセルは文字認識を受けるであろう。この文字認識技
術は、例えば、後伝搬神経回路又は他の回路網を含むか
もしれないと−うことである。

従って、この発明の目的は書類のイメージに対するピク
セル・マトリックス内の文字フィールドの位置決めを容
易にすることである。

この発明の他の目的は文字認識を容易にするため、ピク
セル・マトリックスの文字に関するピクセル２区分する
方法を提供することである。

〔問題点を解決するための手段〕

この発明は上記の問題点？下記のようにして解決した。

すなわち、この発明によると、少くとも１つの文字フィ
ールドを有する書類上に行及び列のバイナリ・ピクセル
から成るイメージ・データのマトリックスを供給する処
理システムにより前記フィールドにある文字のバイナリ
・ピクセルを探索する方法であって、（イ）前記イメージ・データの文字に関するピクセルの
所定数の行及び列をカバーする大きさの審査ウィンドウ
を選び、（ロ）　　区分される１組の文字の各文字に対する審査
ウィンドウ内の各ピクセルについて確率密度関数（ＰＤ
Ｆ　）　を−計算して、審査ウィンドウ内の各ピクセル
の合成ＰＤＦを発生し、 ←→　前記審査ウィンドウを前記フィールドの一部に位
置付けし、（に）前記審査ウィンドウの各バイナリ１ピクセル及び
それに関する合成ＰＤＦ　ｉ使用して審査ウィンドウの
合計値を得、（ホ）　前記フィールド上を前記審査ウィンドウ全移動
して審査ウィンドウの最大合計値を得、（へ）前記審査
ウィンドウが前記一組の文字の一文字に関するイメージ
・データを含むということの表示として前記工程（ホ）
から得られた最大合計値？使用し、（ト）　　前記フィールドの残りのイメージ・データに
ついて前記工程（ハ）〜（ホ）を反復する各工程から成
る処理方法を提供する。

〔実施例〕

第１図の装置１０はこの発明の実施に使用することがで
きるもので、従来方式によシ書類１４をスキャナ１８で
走査する走査ライン１６の方に書類１４のようなものを
移動する物品トラ゛ンスポート１２を含む。スキャナ１
８は物品１４が読取りうる工うに移動したときに一連の
走査ライン又は列のピクセル・データを発生する。スキ
ャナ１８は、例えば、読取を行うため、固定書類上？、
例えば、ハンド・スキャナのようなものを用いるもので
もよい。スキャナ１８からの一連の列ピクセル・データ
は雑音を最小にする処理を受け、データの存在を示すバ
イナリ″１”とデータの不存在を示すバイナリ−〇”と
になるようしきい値が適用される。この処理は処理回路
２０として示す従来の回路で行われる。処理回路２０の
出力は書類１４のイメージに対応するマトリックス２２
のバイナリ・データ又はピクセル（圧縮されていない）
である。データのマトリックス２２は、例えば、約９０
０ピクセル／列を含み、２００ピクセル／インチの解像
度を持つ。当然、データ・マトリックス２２の全体的大
きさは特定の応用によって異なるが、その大きさはこの
発明の理解にとって重要ではない。スキャナ１８及び物
品トランスポート１２は別のコントローラ２４で制御す
るようにしてもよく、データ又はピクセル・マトリック
ス２２の処理に使用されるコントローラ２６を使用して
もよい。

コントローラ２６（第１図）はこの発明のピクセル・マ
トリックス２２の処理に使用することができる従来のコ
ントローラである。コントローラ２６は読出専用メモリ
ー（ＲＯＭ　２　ｇ　）と、ランダム・アクセス・メモ
リー（ＲＡＭ　３０　）と、キーボード（ＫＢ）３２と
、デイスプレィ３４と、インタフェース３６．３８と、
従来方式で他の成分と相互接続するインタフェース及び
制御ロジック４０トヲ含む。コントローラ２６の形はそ
の動作の説明を容易にするためにのみ使用され、実際の
コントローラ２６はこれとは異なるかもしれない。

詳細な説明の前に、この発明による文字のピクセル・デ
ータ区分方法に使用される工程を説明した方が有益であ
シ、処理４２で示した（第５図）動作原理を説明する。

例えば、書類１４のイメージに対応するピクセル・マト
リックスを持つ場合、マトリックスの中に求めるデータ
又は情報が存在する場所をさがすのは困難である。例え
ば、第２図のピクセル・マトリックス４４が（第１図の
データ・マトリックス２２と類似する）書類１４のイメ
ージと対応するものと仮定する。求めるイメージ・デー
タ又はピクセルはフィールド＃１及びフィールド＃２に
あるものと仮定する。第２図の全イメージは、この例で
はバイナリ”１″又は”０“で示すデータ又はピクセル
の行の数とデータ列の数とで表わすことができる。例え
ば、列Ｏは書類１４の右側からスタートすることができ
、列６００は書類１４の左側に接近する。従って、行１
は書類１４の上部にあり、行５００は底部にある。マト
リックス４４（第２図）の上布角は第１図の書類１４の
上布角に相当する。当然、行及び列の配置は、例えば、
走査の仕方によって逆にすることもできる。

第２図に示すフィールド＃１及び＃２を検索する処理の
第１の一般的工程は水平及び垂直にマトリックス４４の
ピクセルを処理することである。

マトリックス４４のピクセルを審査することによって、
フィールド＃１の黒ピクセル又はバイナリ１ピクセルは
、この例の列７５から開始し、列１７５で終る。反対又
は行方向にピクセルを審査した場合には、フィールド＃
１は行＃４００から開始し、行＃４３０で終る。同様に
、フィールド＃２は列３２５から開始して列５２５で終
り、行４５０から開始して行４８０で終る。この審査は
ＲＯＭ　２８又はＲＡＭ　３０にある適当なソフトウェ
ア・プログラムを使用してコントローラ２６で行われる
。

第２図で説明するフィールド＋１．１２の概念はピクセ
ル・マトリックス４４に含まれているピクセルの処理を
促進するのに使用される。もし、例えば、フィールド＃
１のバンド幅を知ると、このフィールドの最右端がわか
り（第２図の）、このフィールドのピクセル列の適切な
量を引き出すことができる。この例では、＃１の幅は列
７５から列１７５に延びている。当然、フィールドのピ
クセル行の適当な数を引出すことができる。この例によ
るフィールド＃ｌは行４００〜４３０間に延びる。フィ
ールド＃１及び＃２に示す特定の数は実際に各ホントで
衣わされた数を示すのｔ容易にするため普通の形で示し
である。

処理４２で使用されるもう１つの概念は“スー／ぐ・ウ
ィンドウ”と称する。スーパ・ウィンドウは特定のホン
トの個々の文字に関するピクセルをカバー又は強化する
よう設計される。例えば、Ｅ１３Ｂホントで文字がプリ
ントされている場合、このホントの文字ピッチは０．１
２５インチである。

このピッチは文字の先端から次の文字の先端までの距離
である。スキャナ１８（第１図）の解像度は２００ピク
セル／インチであり、その結果生じたスーパ・ウィンド
ウは２５ピクセル（０，１２５Ｘ２００）の幅を持つ。

Ｅ１３Ｂホントの実際の高さは０．１１フインチであシ
、スー７４・ウィンドウの高さに含まれているピクセル
の数は２４である。スー１４・ウィンドウに含まれてい
るピクセルの数はスキャナ１８の解像度及び使用される
ホントによって異なる。又、これらホントはこの発明に
も使用される。すなわち、各使用されるボンドは自己の
特定なスーパ・ウィンドウを持つ。

審査ウィンドウ又はスーパ・ウィンドウ４６は第３図に
示され、第１図に示す走査ライン１６に対応する垂直列
を持ち、走査ライン１６のピクセルを表わすしきい値処
理されたバイナリ・データに対応する四角４８，５０１
に持つ。

この発明の特徴は、この神経回路技術又は従来の技術は
使用するホントに含まれているすべての組の文字に対す
る７−・ぞ・ウィンドウ４６に置かれている各ピクセル
のための統計的に平衡に配分された確率密度関数（ＤＰ
Ｆ　）　−ｉ得ることに使用することができるというこ
とである。この説明によシ、それが引出される次の例で
明解となるであろう０例えば、スーパ・ウィンドウ４６は処理４２が前述の区
分を実行しうるよう６練習”されなければならない。そ
の練習処理はスーパ・ウィンドウ４６に提供された既知
文字で始めることができる。

すなわち、第３図に示すように、ウィンドウ４６に数１
？与えることができる。説明を簡単にするため、２つの
列、すなわちＸ及びＹに延びるだけで、数１の設計は簡
単であるものとする。当然、数１が選ばれたホントでプ
リントされると、それは２つの列以上に延びる′かもし
れない。この例のバイナリ・ピクセル・データはＸ及び
Ｙ列のパイナ！Ｊ１を含み、ヌーノ？・ウィンドウ４６
の他の列すべてにバイナリ″０”が存在することになる
。図を簡単にするため、第３図にはバイナリ１のみを示
す。コントローラ２６は、例えばＲＡＭ　３０に記憶さ
れているソフトウェアを通して、スーパ・ウィンドウ４
６の行及び列位置の各位置に置かれているバイナリｌの
タリイ又はカウントを維持する。

前述の練習処理を継続し、数１の第２の例をヌ−ｉ４・
ウィンドウ４６に提供する。又、そこに含まれている種
々の行及び列位置のためにスーパ・ウィンドウ４６に存
在するすべてのバイナリ１をタリイ又はカウントが維持
する。又、Ｘ及びＹ列にバイナリ１がちシ、Ｘ及びＹ列
の行位置の各々のために合計２が含まれていることにな
ると仮定する。この同じ処理は更に８サンプル繰返され
、合計１０サンプルとなるものとする。これは、列Ｘ及
びＹのための行位置の各１はカラン）１０ｉ持つだろう
ということ全意味する。これらカウントはヌーｉｅ・ウ
ィンドウ４６内のすべてのピクセルのための行及び列位
置を表わす位置でコントロラ２６のＲＡＭ　３０に記憶
される。何が得ら、ｆ′したかに対する簡略説明は、２
次元アレイの重みは使用するホントの数１のために得ら
れたということである。

上記の処理は使用するポンドのすべての文字について繰
返えされる。すなわち、区分を受ける文字の組の文字す
べてについて、数字″２”、数字３″等について１０サ
ンプルが得られる。実際に、このホントに含まれている
各文字はそのために計算されたそれ自体の２次元アレイ
の重み（パイナリ１？カウントする）を持つ。その組の
各文字のために計算されたアレイの重みのすべては行及
び列位置で共に加えられ、ヌーノや・ウィンドウ４６内
の各ピクセル位置のための合成合計を形成する。合成合
計は合計重み値とも考えられる。例えば、スーパ・ウィ
ンドウ４６の上左角のピクセル５２が使用するボンドに
含まれている文字のすべてにバイナリ１を持たない場合
には、そのピクセル位置がＥ１３Ｂ文字によりバイナＩ
Ｊ　１にセットされる可能性はＯである。特定のピクセ
ル位置において、カウント又は重みが高いことは、この
ボンドの文字がスーｌソ・ウィンドウ４６に出合ったと
きに、そのピクセルがバイナリ１にセットされるだろう
ことの確率である。１つの実施例で、スーパ・ウィンド
ウは２０ピクセル幅の高さ２４ビク七ル（第３図）の大
きさで４８０ピクセルのマ、トリックスを形成する。

第４図は他の実施例でろシ、ヌーノぞ・ウィンドウ４８
は幅１６ピクセル高さ２２ピクセルの大きさでメジ、全
文字に対する個々のピクセルの重みを持つ。その重みは
ピクセル領域内の黒い四角の大きさで示される。例えば
、完全臼のピクセル５０はこのピクセルのＰＤＦはＯで
あることを意味する。全黒のピクセル５２は第３図の処
理におけるホントについてこのピクセルが非常に高いＰ
ＤＦであることを示す。ピクセル５・４は小さいが存在
するＰＤＦを示す。

スーパ・ウィンドウ４６が上記のように練習した後、処
理４２の各工程を使用する。書類１４のデータ・マトリ
ックス２２はコントローラ２６のＲＡＭ　３０に記憶さ
れる。データ・マトリックス２２が終了したとき、ＲＡ
Ｍ　３０から引出され、前述のようにフィールド＃１及
び＃２１にさがすように審査される。

第６図はバイナリ１及び０から成るデータのマトリック
ス５６ｉ示す。フィールド＃１及び＃２のデータのみを
第６図に示すが、データ・フィールドの正確な位置は前
述のように知られない。このデータ・マトリックス５６
のためのｒ−夕の開始行は上部の代シに書類の底部にあ
る（第２図）。

処理４２の部分は、書類のデータ・フィールド又は領域
をさがすため、第５図の処理によ−ってデータ・マトリ
ックス５６（第６図）を走査又は審査すること？含む。

例えば、フィールド＃ｌは書類の金額フィールドであシ
、フィールド＃２は、例えば、客の口座番号でよい。例
えば、アメリカにおいては、フィールド＃１．＃２はＥ
１３Ｂホントの磁気インキでプリントされるが、走査及
び文字認識技術はデータの光学処理で行われる。

第６図のイメージ・データに関するデータの処理の説明
を続けると、処理４２は第５図の水平方向へのイメージ
・データの走査を含む。イメージ・データのマトリック
ス５６はコントローラ２６のＲＡＭ　３０に記憶され、
例えば、ＲＡＭ、　３０に記憶されているソフトウェア
・ルーチンは第５図に示すようなデータの処理に使用さ
れる。

データのマトリックス５６の走査又は処理は第６図のフ
ィールド＃１　、　＃２のデータの範囲又は開始行及び
停止行を決定するために行われる。すなわち、処理４２
（第５図）はブロック５８に含まれている開始工程を含
む。基本的に、処理４２は、ブロック６０に示すように
、その行のバイナリ″１”をさがすことによって、１時
に１行テストしてデータ・マトリックス５６を走査する
。空の行はバイナリ″１″？持たない１である。行が空
であると（ブロック６２）、処理４２は次の行データを
得（ブロック６４）、その行でバイナリ”１”をさがす
。この処理で、走査は底部（第６図）から上部に行われ
る。ある行にバイナリ″′１”が見つかったときに、そ
の行はブロック６６で示すフィールドの開始行としてマ
ークされる。この開始行は第７図のテーブル６８にも記
録され、テーブル６８はＲＡＭ　３０に記憶される。説
明のために、フィールド＃１は行８で開始するものと推
定する。

処理４２（第５図）はブロック７０で示すように次の行
の審査を続ける。この次の行はバイナリ１を含む可能性
が高いからブロック７２で示すように”空”ではない。

このおこ９うる可能性は少くとも１文字の高さだけある
であろう。従って、次の行が得られ（ブロック７４）、
その処理はバイナリ１がその行に見つからなくなるまで
反復され、そのときはその行が空であることが示され（
ブロック７２）、ブロック７６でフィールドの終了を表
示する。フィールドの終了又は行停止はテーブル６８に
記録され、第７図に２８で示される。例えば、行２８が
ブロック７８に述べるように、データ・マトリックス５
６のためのバッファ又はＲＡＭ　３０の最後の行ではな
いと、その処理は繰返えされ、ブロック６０のテスト工
程から開始する。行２８がｆ−タ・マトリックス５６の
最後の行であると、その処理はブロック８ｏで示すよう
に停止する。

このときのロジッグは、ある行で重複部分？持つかもし
れない異なるフィールドのために、いかに開始及び停止
行が決定されるかに関するものである。第６図に示すよ
うに、書類上に複数フィールドがある場合、このフィー
ルドの開始及び停止行を検索する前にフィールド＃１．
＃２の開始及び停止列？検索した方がよい。例えば、フ
ィールド＃１のための開始及び停止列を知ることによっ
て、これら開始及び停止列間にある行データのみがこの
フィールドの開始及び停止行の決定に使用することがで
きる。

第６図にフィールドのデータのサーチを示し、縦方向の
サーチは第９図の処理４２−１に示される。

垂直方向のサーチのための処理４２−１は水平方向のサ
ーチの処理４２と同一である。従って、第９図の個々の
工程は第５図のブロックに対応する数で示され、単に第
９図では数の後に−１を付している。例えば、第５図の
ブロック６０によるテスト工程は第９図の工程６０−１
のテスト工程に対応する。

処理４２−１（第９図）１に行うことから受ける値は第
７図に示すテーブル６８に記憶される。フィールド＃１
の開始列は２０であシ、停止列は１２０である。同様に
、フィールド＃２の開始及び停止列は２００及び６００
である。テーブル６８に示す値は理想的状態における単
なる表示用値である。

すなわち、これは無雑音値である。

第８図は、雑音状態下で開始及び停止行の値を得た場合
におけるフィールド＃１の値ヲ示すテーブル８２である
。”雑音”は、例えば、小切手１４のインキのにじみや
背景のデータから生ずるかもしれない。テーブル８２は
行１で開始し、行２で停止することを示し、又行８及び
２８で夫々開始及び停止する第２群？示す。コントロー
ラ２６はフィールド＃１．＃２の予定の高さは何である
かを知り、行１及び２の開始及び停止データを雑音とし
て拒絶し、行８及び２８の開始及び停止を有効データと
して受は入れる。又、コントローラはフィールドの幅？
知っているので、列と走査したとき、データを雑音とし
て拒絶することもできる。

開始及び停止行と列の限界がデータの特定のマトリック
ス５６の各種フィールドのために得られた後、処理４２
の次の工程を７−パ・ウィンドウ（第３図で説明した）
４６を使用して開始する。

前述のように、スーパ・ウィンドウ４６の大きさはヌキ
ャナ１８の解像度と使用するホントの文字の高さ及び実
際のピッチの大きさとに反映する。

第６．７．８図で述べたフィールド＃１を拡大して第１
０図に示す。コントローラ２６はそのＲＡＭ３０のフィ
ールド＃ｌＫ関する開始及び停止行及び列を有する。こ
のイメージ・データはスーツや・ウィンドウ４６につい
て処理されるべく引出される。

スーパ・ウィンドウ４６はフィールＰ＃ｌに対して位置
決めされ、審査又はスーパ・ウィンドウ４６の縦方向中
間点は、フィールドの右側から第１０図の左側の方に移
動する審査方向に進んだときに、文字のピッチの中間点
まで数列前に位置付けされる。例えば、スーツぞ・ウィ
ンドウ４６は幅２０ピクセル及び高さ２４ピクセルの大
きさであり、区分される特定のホントのピッチは２０ピ
クセル幅であるとする。この例により、７−パ・ウィン
ドウ４６の縦の中心は第１Ｏ図に示すように開始列２０
から８列である列２８に位置付けされる。

スーパ・ウィンドウ４６が第１０図に示すように配置さ
れると、コントローラ２４はスーパ・ウィンドウ４６の
情報内容？加算し、そのウィンドウ位置における総和を
得る。すなわち、この例によるスーツや・ウィンドウに
は２０Ｘ２４＝４８０ぎクセルがある。スーｔ？・ウィ
ンドウ４６の各１ピクセルはスー／や・ウィンドウ４６
の練習で説明した合成ＰＤＦ　ｉ有するということを思
い出そう。

４８０ぎクセルの各１つは審査されて、バイナリ”ｌ”
か０”が定められる。コントローラ２６ハ各バイナリ″
１″のピクセルのためにそのＰＤＦを加えて、この例で
は列２８である特定のウィンドウ位置における合計ウィ
ンドウ値（’ｒｗｖ　）又はウィンドウ合計を得る。又
は、胃はスー・（・ウィンドウ４６のバイナリ″１”を
その合成又は共同ＰＤＦで掛算し、結果の値を合計する
ことによって得ることができる。ウィンドウ合計はこの
例で１’ｊ２８０で、Ｓ６）。コントローラ２６Ｈスー
ツや・ウィンドウ４６を列２９でウィンドウ合計を得る
ことができるように移動し、その位置でウィンドウ合計
は３３０であろう。同様に、ヌー／や・ウィンドウ４６
が列３０に移動したとき、ウィンドウ合計は３１０であ
ろう。スーパ・ウィンドウ４６がこの例では列４９に位
置付けされたときに、最大又はピーク・ウィンドウ合計
が得られた。これは、スーノヤ・ウィンドウ４６の縦中
心が列２９に配置されたときに、ス〜ノぞ・ウィンドウ
４６はフィールド＃１の最初の文字に対して最も正しく
配置されたということ？意味する。

この例のフィールド＃１の最初の文字のイメージ・デー
タを見つけた後、スーパ・ウィンドウが列２９において
縦の中心としたときに、スーパ・ウィンドウ４６に入っ
ているすべてのピクセルを引き出す。このピクセルは最
初の文字のピクセル・マトリックヌ？構成する。フィー
ルド＃１から区分されたこのピクセル・マトリックスは
後に文字認識を受けるか、又はオン・ライン処理のため
に文字認識で処理されるためにＲＡＭ　３０に記憶され
る。

次に、この例におけるフィールド＃１（第１０図）の第
２の文人に関するイメージ・データの位１ｉｔ’を説明
する。最初の文字のピクセル・マ）　ＩＪソックス列２
９に置かれるので、このホントのピッチ／ｉ２０″Ｃあ
シ、コントロー、５２６はスーツ！・ウィンドウ４６を
列４８が中心となるよう移動する。

列４８の位置は前の文字（列２９）の縦中心の位置に文
字ピッチ（２０列）を加えて引出され、最初の文字のｒ
−タ・マトリックスの縦中心に位置付けすることで行な
われたように、コントローラ２６が最大合計をチエツク
することができるように列？後退する（−１列）。スー
・ぐ・ウィンドウ４６の中心が列４８に配置されて、コ
ントローラ２６はそのウィンドウに入っているピクセル
合計を計算する。ウィンドウを左に移動してピークを見
つけたとき、そのウィンドウ内のピクセルをフィールド
＃１の第２の文字のピクセル・マトリ２２７２表わすも
のとして取出す。この処理はフィールド＃２の全文字に
ついて繰返えされる。ウィンドウ４６をピクセル・マト
リックスの中心におくのは文字認識を容易にするよう、
その文字を常に他から区分することである。

【図面の簡単な説明】第１図は、この発明の実施釦使用しうる装置を示す全体
図、第２図は、データ・マトリックスを示す略図、第３図は
、この発明の実施に使用する０ヌーパ・ウィンドウ″を
示す略図、第４図は、そのピクセルのＰＤＦ　（ｉ−表わす黒色の
大きさ？示し、特定のスタイル又はホントの一組の文字
に対する審査ウィンドウ内の各ピクセルの確率密度関数
（ＰＤＦ　）を示す略図、第５図は、書類のデータ・マ
トリックスのピクセル・データ行？審査するときにデー
タ・フィールドをさがす処理を示す流れ図、第６図は、書類のバイナリ・データ・マトリックスを示
す略図、第７図は、理想的状態について決定された第６図のデー
タ・マトリックスのあるフィールドにおけるヌタート及
びヌトノグ行と、２タート及びストノゾ列とを示すテー
ブル、第８図は、雑音状態下で考えられる値の第７図と同様な
テーブル、第９図は、書類のｒ−タ・マ）　ＩＪソクスのデータ列
を審査するときにデータ・フィールドをさがす処理を示
す流れ図、第１０図は、データ・マトリックスに含まれている文字
フィールドの一部に置かれているスーｉｕ・ウィンドウ
を示す略図である。図中、１０・・・本発明に使用する装部、１２・・・物
品トランスポーｔ・、１４・・・書類、１６・・・走査
ライン、１８・・・２キヤナ、２０・・・処理回路、２
２・・・マトリックス、２４．２６・・・コントローラ
、２８・・・ＲＯＭ、３０−ＲＡＭ、３２−４−ｙｌＰ
−ド、３４・７”イヌプレイ、３６．３８・・・インタ
フェース、４０・・・制御ロノノク。出願人代理人　　斉　藤　　　　勲ＦＩＧ、４ＦＩＧ、５ＦＩＧ、９ＦＩＧ、６ＦＴ（’、１ｎ

Claims

【特許請求の範囲】

（１）少くとも１つの文字フィールドを有する書類上に
行及び列のバイナリ・ピクセルから成るイメージ・デー
タのマトリックスを供給する処理システムにより前記フ
ィールドにある文字のバイナリ・ピクセルを探索する方
法であって、（イ）前記イメージ・データの文字に関するピクセルの
所定数の行及び列をカバーする大きさの審査ウィンドウ
を選び、（ロ）区分される１組の文字の各文字に対する審査ウィ
ンドウ内の各ピクセルについて確率密度関数（ＰＤＦ）
を計算して、審査ウィンドウ内の各ピクセルの合成ＰＤ
Ｆを発生し、（ハ）前記審査ウィンドウを前記フィールドの一部に位
置付けし、（ニ）前記審査ウィンドウの各バイナリ１ピクセル及び
それに関する合成ＰＤＦを使用して審査ウィンドウの合
計値を得、（ホ）前記フィールド上を前記審査ウィンドウを移動し
て審査ウィンドウの最大合計値を得、（ヘ）前記審査ウ
ィンドウが前記一組の文字の一文字に関するイメージ・
データを含むということの表示として前記工程（ホ）か
ら得られた最大合計値を使用し、（ト）前記フィールドの残りのイメージ・データについ
て前記工程（ハ）〜（ホ）を反復する各工程から成る処
理方法。