JPH02165392A - 多ホント用万能文字区分方法 - Google Patents

多ホント用万能文字区分方法

Info

Publication number
JPH02165392A
JPH02165392A JP1273919A JP27391989A JPH02165392A JP H02165392 A JPH02165392 A JP H02165392A JP 1273919 A JP1273919 A JP 1273919A JP 27391989 A JP27391989 A JP 27391989A JP H02165392 A JPH02165392 A JP H02165392A
Authority
JP
Japan
Prior art keywords
window
field
pixel
character
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1273919A
Other languages
English (en)
Other versions
JP3035309B2 (ja
Inventor
Oleg Feldgajer
オーレツグ フエルドガジヤー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NCR Voyix Corp
Original Assignee
NCR Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NCR Corp filed Critical NCR Corp
Publication of JPH02165392A publication Critical patent/JPH02165392A/ja
Application granted granted Critical
Publication of JP3035309B2 publication Critical patent/JP3035309B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は多ホント光学イメーノ・システムのピクセル
・データ・マトリックスから文字に関するピクセル・デ
ータを区分して、後の動作(例えば、文字認識)に使用
しつるよう文字のピクセル・データを選出する方法に関
する。
〔従来の技術〕
近年、書類の像又はイメージを発生して使用してその情
報を処理する傾向が強まってきた。例えば、小切手のよ
うな書類はそ7″Lヲ移動して走査し、ピクセル・デー
タ・マトリックスを発生するようにしたものがある。ピ
クセルの語は走査した書類の微小領域に対応する画素と
して定義する。例えば、スキャナから発生した各走査線
又は列について約600又は900ピクセルが存在する
であろう。書類がスキャナ上を移動すると、一連の走査
ピクセル・ラインを発生し、各書類のピクセル・マトリ
ックスを発生する。
スキャナからのピクセル・マトリックスは、例えば、し
きい値で処理され、各ピクセルをデータを表わすバイナ
リ″1″とデータなしを表わすバイナリ″′0”とに分
類される。この方式により各書類のイメージに対応する
ピクセル・マトリックスをその書類から得ることができ
る。そのピクセル・マトリックスはRAMに記憶され、
又はCRTにディヌプレイされ、データを完成する際そ
れをオペレータが見ることができる。
ピクセル・マトリックスはその書類に関するイメージ・
データを含む。例えば、小切手のような金融書類を処理
する場合、小切手には機械で読取られるフィールドがあ
る。そのフィールドは、例えば、E13B又はCMC7
のようなホントで印刷される文字データを含む。例えば
、1走査ラインに約200ピクセル/インチの解像度を
持つ場合、ピクセル・マトリックスを使用して光学文字
認識によりそのフィールドの機械読取が可能である。
〔発明が解決しようとする問題点〕
ピクセル・マトリックスを使用する場合の問題点は読取
られる文字を含むフィールドを検出することが一般に困
難であるということである。特に、読取らべきフィール
ドが書類の異なる部分にあるときには難かしい。その上
、読取るフィールド?検出した後、そのフィールドから
1つの文字のピクセル乞分離するため、そのフィールド
のピクセル・マトリックスを区分する必要があるという
問題が生じた。各文字のピクセルが区分された後、その
ピクセルは文字認識を受けるであろう。この文字認識技
術は、例えば、後伝搬神経回路又は他の回路網を含むか
もしれないと−うことである。
従って、この発明の目的は書類のイメージに対するピク
セル・マトリックス内の文字フィールドの位置決めを容
易にすることである。
この発明の他の目的は文字認識を容易にするため、ピク
セル・マトリックスの文字に関するピクセル2区分する
方法を提供することである。
〔問題点を解決するための手段〕
この発明は上記の問題点?下記のようにして解決した。
すなわち、この発明によると、少くとも1つの文字フィ
ールドを有する書類上に行及び列のバイナリ・ピクセル
から成るイメージ・データのマトリックスを供給する処
理システムにより前記フィールドにある文字のバイナリ
・ピクセルを探索する方法であって、 (イ)前記イメージ・データの文字に関するピクセルの
所定数の行及び列をカバーする大きさの審査ウィンドウ
を選び、 (ロ)  区分される1組の文字の各文字に対する審査
ウィンドウ内の各ピクセルについて確率密度関数(PD
F ) を−計算して、審査ウィンドウ内の各ピクセル
の合成PDFを発生し、 ←→ 前記審査ウィンドウを前記フィールドの一部に位
置付けし、 (に)前記審査ウィンドウの各バイナリ1ピクセル及び
それに関する合成PDF i使用して審査ウィンドウの
合計値を得、 (ホ) 前記フィールド上を前記審査ウィンドウ全移動
して審査ウィンドウの最大合計値を得、(へ)前記審査
ウィンドウが前記一組の文字の一文字に関するイメージ
・データを含むということの表示として前記工程(ホ)
から得られた最大合計値?使用し、 (ト)  前記フィールドの残りのイメージ・データに
ついて前記工程(ハ)〜(ホ)を反復する各工程から成
る処理方法を提供する。
〔実施例〕
第1図の装置10はこの発明の実施に使用することがで
きるもので、従来方式によシ書類14をスキャナ18で
走査する走査ライン16の方に書類14のようなものを
移動する物品トラ゛ンスポート12を含む。スキャナ1
8は物品14が読取りうる工うに移動したときに一連の
走査ライン又は列のピクセル・データを発生する。スキ
ャナ18は、例えば、読取を行うため、固定書類上?、
例えば、ハンド・スキャナのようなものを用いるもので
もよい。スキャナ18からの一連の列ピクセル・データ
は雑音を最小にする処理を受け、データの存在を示すバ
イナリ″1”とデータの不存在を示すバイナリ−〇”と
になるようしきい値が適用される。この処理は処理回路
20として示す従来の回路で行われる。処理回路20の
出力は書類14のイメージに対応するマトリックス22
のバイナリ・データ又はピクセル(圧縮されていない)
である。データのマトリックス22は、例えば、約90
0ピクセル/列を含み、200ピクセル/インチの解像
度を持つ。当然、データ・マトリックス22の全体的大
きさは特定の応用によって異なるが、その大きさはこの
発明の理解にとって重要ではない。スキャナ18及び物
品トランスポート12は別のコントローラ24で制御す
るようにしてもよく、データ又はピクセル・マトリック
ス22の処理に使用されるコントローラ26を使用して
もよい。
コントローラ26(第1図)はこの発明のピクセル・マ
トリックス22の処理に使用することができる従来のコ
ントローラである。コントローラ26は読出専用メモリ
ー(ROM 2 g )と、ランダム・アクセス・メモ
リー(RAM 30 )と、キーボード(KB)32と
、デイスプレィ34と、インタフェース36.38と、
従来方式で他の成分と相互接続するインタフェース及び
制御ロジック40トヲ含む。コントローラ26の形はそ
の動作の説明を容易にするためにのみ使用され、実際の
コントローラ26はこれとは異なるかもしれない。
詳細な説明の前に、この発明による文字のピクセル・デ
ータ区分方法に使用される工程を説明した方が有益であ
シ、処理42で示した(第5図)動作原理を説明する。
例えば、書類14のイメージに対応するピクセル・マト
リックスを持つ場合、マトリックスの中に求めるデータ
又は情報が存在する場所をさがすのは困難である。例え
ば、第2図のピクセル・マトリックス44が(第1図の
データ・マトリックス22と類似する)書類14のイメ
ージと対応するものと仮定する。求めるイメージ・デー
タ又はピクセルはフィールド#1及びフィールド#2に
あるものと仮定する。第2図の全イメージは、この例で
はバイナリ”1″又は”0“で示すデータ又はピクセル
の行の数とデータ列の数とで表わすことができる。例え
ば、列Oは書類14の右側からスタートすることができ
、列600は書類14の左側に接近する。従って、行1
は書類14の上部にあり、行500は底部にある。マト
リックス44(第2図)の上布角は第1図の書類14の
上布角に相当する。当然、行及び列の配置は、例えば、
走査の仕方によって逆にすることもできる。
第2図に示すフィールド#1及び#2を検索する処理の
第1の一般的工程は水平及び垂直にマトリックス44の
ピクセルを処理することである。
マトリックス44のピクセルを審査することによって、
フィールド#1の黒ピクセル又はバイナリ1ピクセルは
、この例の列75から開始し、列175で終る。反対又
は行方向にピクセルを審査した場合には、フィールド#
1は行#400から開始し、行#430で終る。同様に
、フィールド#2は列325から開始して列525で終
り、行450から開始して行480で終る。この審査は
ROM 28又はRAM 30にある適当なソフトウェ
ア・プログラムを使用してコントローラ26で行われる
第2図で説明するフィールド+1.12の概念はピクセ
ル・マトリックス44に含まれているピクセルの処理を
促進するのに使用される。もし、例えば、フィールド#
1のバンド幅を知ると、このフィールドの最右端がわか
り(第2図の)、このフィールドのピクセル列の適切な
量を引き出すことができる。この例では、#1の幅は列
75から列175に延びている。当然、フィールドのピ
クセル行の適当な数を引出すことができる。この例によ
るフィールド#lは行400〜430間に延びる。フィ
ールド#1及び#2に示す特定の数は実際に各ホントで
衣わされた数を示すのt容易にするため普通の形で示し
である。
処理42で使用されるもう1つの概念は“スー/ぐ・ウ
ィンドウ”と称する。スーパ・ウィンドウは特定のホン
トの個々の文字に関するピクセルをカバー又は強化する
よう設計される。例えば、E13Bホントで文字がプリ
ントされている場合、このホントの文字ピッチは0.1
25インチである。
このピッチは文字の先端から次の文字の先端までの距離
である。スキャナ18(第1図)の解像度は200ピク
セル/インチであり、その結果生じたスーパ・ウィンド
ウは25ピクセル(0,125X200)の幅を持つ。
E13Bホントの実際の高さは0.11フインチであシ
、スー74・ウィンドウの高さに含まれているピクセル
の数は24である。スー14・ウィンドウに含まれてい
るピクセルの数はスキャナ18の解像度及び使用される
ホントによって異なる。又、これらホントはこの発明に
も使用される。すなわち、各使用されるボンドは自己の
特定なスーパ・ウィンドウを持つ。
審査ウィンドウ又はスーパ・ウィンドウ46は第3図に
示され、第1図に示す走査ライン16に対応する垂直列
を持ち、走査ライン16のピクセルを表わすしきい値処
理されたバイナリ・データに対応する四角48,501
に持つ。
この発明の特徴は、この神経回路技術又は従来の技術は
使用するホントに含まれているすべての組の文字に対す
る7−・ぞ・ウィンドウ46に置かれている各ピクセル
のための統計的に平衡に配分された確率密度関数(DP
F ) −i得ることに使用することができるというこ
とである。この説明によシ、それが引出される次の例で
明解となるであろう0 例えば、スーパ・ウィンドウ46は処理42が前述の区
分を実行しうるよう6練習”されなければならない。そ
の練習処理はスーパ・ウィンドウ46に提供された既知
文字で始めることができる。
すなわち、第3図に示すように、ウィンドウ46に数1
?与えることができる。説明を簡単にするため、2つの
列、すなわちX及びYに延びるだけで、数1の設計は簡
単であるものとする。当然、数1が選ばれたホントでプ
リントされると、それは2つの列以上に延びる′かもし
れない。この例のバイナリ・ピクセル・データはX及び
Y列のパイナ!J1を含み、ヌーノ?・ウィンドウ46
の他の列すべてにバイナリ″0”が存在することになる
。図を簡単にするため、第3図にはバイナリ1のみを示
す。コントローラ26は、例えばRAM 30に記憶さ
れているソフトウェアを通して、スーパ・ウィンドウ4
6の行及び列位置の各位置に置かれているバイナリlの
タリイ又はカウントを維持する。
前述の練習処理を継続し、数1の第2の例をヌ−i4・
ウィンドウ46に提供する。又、そこに含まれている種
々の行及び列位置のためにスーパ・ウィンドウ46に存
在するすべてのバイナリ1をタリイ又はカウントが維持
する。又、X及びY列にバイナリ1がちシ、X及びY列
の行位置の各々のために合計2が含まれていることにな
ると仮定する。この同じ処理は更に8サンプル繰返され
、合計10サンプルとなるものとする。これは、列X及
びYのための行位置の各1はカラン)10i持つだろう
ということ全意味する。これらカウントはヌーie・ウ
ィンドウ46内のすべてのピクセルのための行及び列位
置を表わす位置でコントロラ26のRAM 30に記憶
される。何が得ら、f′したかに対する簡略説明は、2
次元アレイの重みは使用するホントの数1のために得ら
れたということである。
上記の処理は使用するポンドのすべての文字について繰
返えされる。すなわち、区分を受ける文字の組の文字す
べてについて、数字″2”、数字3″等について10サ
ンプルが得られる。実際に、このホントに含まれている
各文字はそのために計算されたそれ自体の2次元アレイ
の重み(パイナリ1?カウントする)を持つ。その組の
各文字のために計算されたアレイの重みのすべては行及
び列位置で共に加えられ、ヌーノや・ウィンドウ46内
の各ピクセル位置のための合成合計を形成する。合成合
計は合計重み値とも考えられる。例えば、スーパ・ウィ
ンドウ46の上左角のピクセル52が使用するボンドに
含まれている文字のすべてにバイナリ1を持たない場合
には、そのピクセル位置がE13B文字によりバイナI
J 1にセットされる可能性はOである。特定のピクセ
ル位置において、カウント又は重みが高いことは、この
ボンドの文字がスーlソ・ウィンドウ46に出合ったと
きに、そのピクセルがバイナリ1にセットされるだろう
ことの確率である。1つの実施例で、スーパ・ウィンド
ウは20ピクセル幅の高さ24ビク七ル(第3図)の大
きさで480ピクセルのマ、トリックスを形成する。
第4図は他の実施例でろシ、ヌーノぞ・ウィンドウ48
は幅16ピクセル高さ22ピクセルの大きさでメジ、全
文字に対する個々のピクセルの重みを持つ。その重みは
ピクセル領域内の黒い四角の大きさで示される。例えば
、完全臼のピクセル50はこのピクセルのPDFはOで
あることを意味する。全黒のピクセル52は第3図の処
理におけるホントについてこのピクセルが非常に高いP
DFであることを示す。ピクセル5・4は小さいが存在
するPDFを示す。
スーパ・ウィンドウ46が上記のように練習した後、処
理42の各工程を使用する。書類14のデータ・マトリ
ックス22はコントローラ26のRAM 30に記憶さ
れる。データ・マトリックス22が終了したとき、RA
M 30から引出され、前述のようにフィールド#1及
び#21にさがすように審査される。
第6図はバイナリ1及び0から成るデータのマトリック
ス56i示す。フィールド#1及び#2のデータのみを
第6図に示すが、データ・フィールドの正確な位置は前
述のように知られない。このデータ・マトリックス56
のためのr−夕の開始行は上部の代シに書類の底部にあ
る(第2図)。
処理42の部分は、書類のデータ・フィールド又は領域
をさがすため、第5図の処理によ−ってデータ・マトリ
ックス56(第6図)を走査又は審査すること?含む。
例えば、フィールド#lは書類の金額フィールドであシ
、フィールド#2は、例えば、客の口座番号でよい。例
えば、アメリカにおいては、フィールド#1.#2はE
13Bホントの磁気インキでプリントされるが、走査及
び文字認識技術はデータの光学処理で行われる。
第6図のイメージ・データに関するデータの処理の説明
を続けると、処理42は第5図の水平方向へのイメージ
・データの走査を含む。イメージ・データのマトリック
ス56はコントローラ26のRAM 30に記憶され、
例えば、RAM、 30に記憶されているソフトウェア
・ルーチンは第5図に示すようなデータの処理に使用さ
れる。
データのマトリックス56の走査又は処理は第6図のフ
ィールド#1 、 #2のデータの範囲又は開始行及び
停止行を決定するために行われる。すなわち、処理42
(第5図)はブロック58に含まれている開始工程を含
む。基本的に、処理42は、ブロック60に示すように
、その行のバイナリ″1”をさがすことによって、1時
に1行テストしてデータ・マトリックス56を走査する
。空の行はバイナリ″1″?持たない1である。行が空
であると(ブロック62)、処理42は次の行データを
得(ブロック64)、その行でバイナリ”1”をさがす
。この処理で、走査は底部(第6図)から上部に行われ
る。ある行にバイナリ″′1”が見つかったときに、そ
の行はブロック66で示すフィールドの開始行としてマ
ークされる。この開始行は第7図のテーブル68にも記
録され、テーブル68はRAM 30に記憶される。説
明のために、フィールド#1は行8で開始するものと推
定する。
処理42(第5図)はブロック70で示すように次の行
の審査を続ける。この次の行はバイナリ1を含む可能性
が高いからブロック72で示すように”空”ではない。
このおこ9うる可能性は少くとも1文字の高さだけある
であろう。従って、次の行が得られ(ブロック74)、
その処理はバイナリ1がその行に見つからなくなるまで
反復され、そのときはその行が空であることが示され(
ブロック72)、ブロック76でフィールドの終了を表
示する。フィールドの終了又は行停止はテーブル68に
記録され、第7図に28で示される。例えば、行28が
ブロック78に述べるように、データ・マトリックス5
6のためのバッファ又はRAM 30の最後の行ではな
いと、その処理は繰返えされ、ブロック60のテスト工
程から開始する。行28がf−タ・マトリックス56の
最後の行であると、その処理はブロック8oで示すよう
に停止する。
このときのロジッグは、ある行で重複部分?持つかもし
れない異なるフィールドのために、いかに開始及び停止
行が決定されるかに関するものである。第6図に示すよ
うに、書類上に複数フィールドがある場合、このフィー
ルドの開始及び停止行を検索する前にフィールド#1.
#2の開始及び停止列?検索した方がよい。例えば、フ
ィールド#1のための開始及び停止列を知ることによっ
て、これら開始及び停止列間にある行データのみがこの
フィールドの開始及び停止行の決定に使用することがで
きる。
第6図にフィールドのデータのサーチを示し、縦方向の
サーチは第9図の処理42−1に示される。
垂直方向のサーチのための処理42−1は水平方向のサ
ーチの処理42と同一である。従って、第9図の個々の
工程は第5図のブロックに対応する数で示され、単に第
9図では数の後に−1を付している。例えば、第5図の
ブロック60によるテスト工程は第9図の工程60−1
のテスト工程に対応する。
処理42−1(第9図)1に行うことから受ける値は第
7図に示すテーブル68に記憶される。フィールド#1
の開始列は20であシ、停止列は120である。同様に
、フィールド#2の開始及び停止列は200及び600
である。テーブル68に示す値は理想的状態における単
なる表示用値である。
すなわち、これは無雑音値である。
第8図は、雑音状態下で開始及び停止行の値を得た場合
におけるフィールド#1の値ヲ示すテーブル82である
。”雑音”は、例えば、小切手14のインキのにじみや
背景のデータから生ずるかもしれない。テーブル82は
行1で開始し、行2で停止することを示し、又行8及び
28で夫々開始及び停止する第2群?示す。コントロー
ラ26はフィールド#1.#2の予定の高さは何である
かを知り、行1及び2の開始及び停止データを雑音とし
て拒絶し、行8及び28の開始及び停止を有効データと
して受は入れる。又、コントローラはフィールドの幅?
知っているので、列と走査したとき、データを雑音とし
て拒絶することもできる。
開始及び停止行と列の限界がデータの特定のマトリック
ス56の各種フィールドのために得られた後、処理42
の次の工程を7−パ・ウィンドウ(第3図で説明した)
46を使用して開始する。
前述のように、スーパ・ウィンドウ46の大きさはヌキ
ャナ18の解像度と使用するホントの文字の高さ及び実
際のピッチの大きさとに反映する。
第6.7.8図で述べたフィールド#1を拡大して第1
0図に示す。コントローラ26はそのRAM30のフィ
ールド#lK関する開始及び停止行及び列を有する。こ
のイメージ・データはスーツや・ウィンドウ46につい
て処理されるべく引出される。
スーパ・ウィンドウ46はフィールP#lに対して位置
決めされ、審査又はスーパ・ウィンドウ46の縦方向中
間点は、フィールドの右側から第10図の左側の方に移
動する審査方向に進んだときに、文字のピッチの中間点
まで数列前に位置付けされる。例えば、スーツぞ・ウィ
ンドウ46は幅20ピクセル及び高さ24ピクセルの大
きさであり、区分される特定のホントのピッチは20ピ
クセル幅であるとする。この例により、7−パ・ウィン
ドウ46の縦の中心は第1O図に示すように開始列20
から8列である列28に位置付けされる。
スーパ・ウィンドウ46が第10図に示すように配置さ
れると、コントローラ24はスーパ・ウィンドウ46の
情報内容?加算し、そのウィンドウ位置における総和を
得る。すなわち、この例によるスーツや・ウィンドウに
は20X24=480ぎクセルがある。スーt?・ウィ
ンドウ46の各1ピクセルはスー/や・ウィンドウ46
の練習で説明した合成PDF i有するということを思
い出そう。
480ぎクセルの各1つは審査されて、バイナリ”l”
か0”が定められる。コントローラ26ハ各バイナリ″
1″のピクセルのためにそのPDFを加えて、この例で
は列28である特定のウィンドウ位置における合計ウィ
ンドウ値(’rwv )又はウィンドウ合計を得る。又
は、胃はスー・(・ウィンドウ46のバイナリ″1”を
その合成又は共同PDFで掛算し、結果の値を合計する
ことによって得ることができる。ウィンドウ合計はこの
例で1’j280で、S6)。コントローラ26Hスー
ツや・ウィンドウ46を列29でウィンドウ合計を得る
ことができるように移動し、その位置でウィンドウ合計
は330であろう。同様に、ヌー/や・ウィンドウ46
が列30に移動したとき、ウィンドウ合計は310であ
ろう。スーパ・ウィンドウ46がこの例では列49に位
置付けされたときに、最大又はピーク・ウィンドウ合計
が得られた。これは、スーノヤ・ウィンドウ46の縦中
心が列29に配置されたときに、ス〜ノぞ・ウィンドウ
46はフィールド#1の最初の文字に対して最も正しく
配置されたということ?意味する。
この例のフィールド#1の最初の文字のイメージ・デー
タを見つけた後、スーパ・ウィンドウが列29において
縦の中心としたときに、スーパ・ウィンドウ46に入っ
ているすべてのピクセルを引き出す。このピクセルは最
初の文字のピクセル・マトリックヌ?構成する。フィー
ルド#1から区分されたこのピクセル・マトリックスは
後に文字認識を受けるか、又はオン・ライン処理のため
に文字認識で処理されるためにRAM 30に記憶され
る。
次に、この例におけるフィールド#1(第10図)の第
2の文人に関するイメージ・データの位1it’を説明
する。最初の文字のピクセル・マ) IJソックス列2
9に置かれるので、このホントのピッチ/i20″Cあ
シ、コントロー、526はスーツ!・ウィンドウ46を
列48が中心となるよう移動する。
列48の位置は前の文字(列29)の縦中心の位置に文
字ピッチ(20列)を加えて引出され、最初の文字のr
−タ・マトリックスの縦中心に位置付けすることで行な
われたように、コントローラ26が最大合計をチエツク
することができるように列?後退する(−1列)。スー
・ぐ・ウィンドウ46の中心が列48に配置されて、コ
ントローラ26はそのウィンドウに入っているピクセル
合計を計算する。ウィンドウを左に移動してピークを見
つけたとき、そのウィンドウ内のピクセルをフィールド
#1の第2の文字のピクセル・マトリ2272表わすも
のとして取出す。この処理はフィールド#2の全文字に
ついて繰返えされる。ウィンドウ46をピクセル・マト
リックスの中心におくのは文字認識を容易にするよう、
その文字を常に他から区分することである。
【図面の簡単な説明】 第1図は、この発明の実施釦使用しうる装置を示す全体
図、 第2図は、データ・マトリックスを示す略図、第3図は
、この発明の実施に使用する0ヌーパ・ウィンドウ″を
示す略図、 第4図は、そのピクセルのPDF (i−表わす黒色の
大きさ?示し、特定のスタイル又はホントの一組の文字
に対する審査ウィンドウ内の各ピクセルの確率密度関数
(PDF )を示す略図、第5図は、書類のデータ・マ
トリックスのピクセル・データ行?審査するときにデー
タ・フィールドをさがす処理を示す流れ図、 第6図は、書類のバイナリ・データ・マトリックスを示
す略図、 第7図は、理想的状態について決定された第6図のデー
タ・マトリックスのあるフィールドにおけるヌタート及
びヌトノグ行と、2タート及びストノゾ列とを示すテー
ブル、 第8図は、雑音状態下で考えられる値の第7図と同様な
テーブル、 第9図は、書類のr−タ・マ) IJソクスのデータ列
を審査するときにデータ・フィールドをさがす処理を示
す流れ図、 第10図は、データ・マトリックスに含まれている文字
フィールドの一部に置かれているスーiu・ウィンドウ
を示す略図である。 図中、10・・・本発明に使用する装部、12・・・物
品トランスポーt・、14・・・書類、16・・・走査
ライン、18・・・2キヤナ、20・・・処理回路、2
2・・・マトリックス、24.26・・・コントローラ
、28・・・ROM、30−RAM、32−4−ylP
−ド、34・7”イヌプレイ、36.38・・・インタ
フェース、40・・・制御ロノノク。 出願人代理人  斉 藤    勲 FIG、4 FIG、5 FIG、9 FIG、6 FT(’、1n

Claims (1)

    【特許請求の範囲】
  1. (1)少くとも1つの文字フィールドを有する書類上に
    行及び列のバイナリ・ピクセルから成るイメージ・デー
    タのマトリックスを供給する処理システムにより前記フ
    ィールドにある文字のバイナリ・ピクセルを探索する方
    法であって、 (イ)前記イメージ・データの文字に関するピクセルの
    所定数の行及び列をカバーする大きさの審査ウィンドウ
    を選び、 (ロ)区分される1組の文字の各文字に対する審査ウィ
    ンドウ内の各ピクセルについて確率密度関数(PDF)
    を計算して、審査ウィンドウ内の各ピクセルの合成PD
    Fを発生し、 (ハ)前記審査ウィンドウを前記フィールドの一部に位
    置付けし、 (ニ)前記審査ウィンドウの各バイナリ1ピクセル及び
    それに関する合成PDFを使用して審査ウィンドウの合
    計値を得、 (ホ)前記フィールド上を前記審査ウィンドウを移動し
    て審査ウィンドウの最大合計値を得、(ヘ)前記審査ウ
    ィンドウが前記一組の文字の一文字に関するイメージ・
    データを含むということの表示として前記工程(ホ)か
    ら得られた最大合計値を使用し、 (ト)前記フィールドの残りのイメージ・データについ
    て前記工程(ハ)〜(ホ)を反復する各工程から成る処
    理方法。
JP1273919A 1988-11-16 1989-10-23 キャラクタ・イメージの区分方法 Expired - Lifetime JP3035309B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/271,982 US4932065A (en) 1988-11-16 1988-11-16 Universal character segmentation scheme for multifont OCR images
US271,982 1988-11-16

Publications (2)

Publication Number Publication Date
JPH02165392A true JPH02165392A (ja) 1990-06-26
JP3035309B2 JP3035309B2 (ja) 2000-04-24

Family

ID=23037914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1273919A Expired - Lifetime JP3035309B2 (ja) 1988-11-16 1989-10-23 キャラクタ・イメージの区分方法

Country Status (5)

Country Link
US (1) US4932065A (ja)
EP (1) EP0369761B1 (ja)
JP (1) JP3035309B2 (ja)
CA (1) CA1316606C (ja)
DE (1) DE68915950T2 (ja)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法
GB2224906B (en) * 1988-10-21 1993-05-19 Ricoh Kk Dot region discriminating method
US6067379A (en) * 1988-12-09 2000-05-23 Cognex Corporation Method and apparatus for locating patterns in an optical image
US5050221A (en) * 1989-02-13 1991-09-17 Ricoh Company, Ltd. Image generating apparatus
JP2940936B2 (ja) * 1989-06-06 1999-08-25 株式会社リコー 表領域識別方法
US5048095A (en) * 1990-03-30 1991-09-10 Honeywell Inc. Adaptive image segmentation system
JPH04315272A (ja) * 1991-04-12 1992-11-06 Eastman Kodak Japan Kk 図形認識装置
US5500905A (en) * 1991-06-12 1996-03-19 Microelectronics And Computer Technology Corporation Pattern recognition neural network with saccade-like operation
US5237621A (en) * 1991-08-08 1993-08-17 Philip Morris Incorporated Product appearance inspection methods and apparatus employing low variance filter
US5150425A (en) * 1991-08-30 1992-09-22 Eastman Kodak Company Character recognition method using correlation search
US5553162A (en) * 1991-09-23 1996-09-03 Eastman Kodak Company Method for detecting ink jet or dot matrix printing
US5299269A (en) * 1991-12-20 1994-03-29 Eastman Kodak Company Character segmentation using an associative memory for optical character recognition
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US5337370A (en) * 1992-02-28 1994-08-09 Environmental Research Institute Of Michigan Character recognition method employing non-character recognizer
EP0566015A3 (en) * 1992-04-14 1994-07-06 Eastman Kodak Co Neural network optical character recognition system and method for classifying characters in amoving web
US5341438A (en) * 1992-07-22 1994-08-23 Eastman Kodak Company Method and apparatus for segmenting and classifying unconstrained handwritten characters
US5859923A (en) * 1992-12-29 1999-01-12 Cognex Corporation Mark quality inspection apparatus and method
US5305392A (en) * 1993-01-11 1994-04-19 Philip Morris Incorporated High speed, high resolution web inspection system
JPH06348800A (ja) * 1993-06-02 1994-12-22 Canon Inc 画像処理方法及び装置
US5748780A (en) * 1994-04-07 1998-05-05 Stolfo; Salvatore J. Method and apparatus for imaging, image processing and data compression
US6026176A (en) 1995-07-25 2000-02-15 Cognex Corporation Machine vision methods and articles of manufacture for ball grid array inspection
US5764824A (en) * 1995-08-25 1998-06-09 International Business Machines Corporation Clustering mechanism for identifying and grouping of classes in manufacturing process behavior
US5872870A (en) * 1996-02-16 1999-02-16 Cognex Corporation Machine vision methods for identifying extrema of objects in rotated reference frames
US5909504A (en) * 1996-03-15 1999-06-01 Cognex Corporation Method of testing a machine vision inspection system
US6298149B1 (en) 1996-03-21 2001-10-02 Cognex Corporation Semiconductor device image inspection with contrast enhancement
US6259827B1 (en) 1996-03-21 2001-07-10 Cognex Corporation Machine vision methods for enhancing the contrast between an object and its background using multiple on-axis images
US5978502A (en) * 1996-04-01 1999-11-02 Cognex Corporation Machine vision methods for determining characteristics of three-dimensional objects
US6137893A (en) * 1996-10-07 2000-10-24 Cognex Corporation Machine vision calibration targets and methods of determining their location and orientation in an image
US5960125A (en) 1996-11-21 1999-09-28 Cognex Corporation Nonfeedback-based machine vision method for determining a calibration relationship between a camera and a moveable object
US5953130A (en) * 1997-01-06 1999-09-14 Cognex Corporation Machine vision methods and apparatus for machine vision illumination of an object
US6075881A (en) * 1997-03-18 2000-06-13 Cognex Corporation Machine vision methods for identifying collinear sets of points from an image
US5974169A (en) * 1997-03-20 1999-10-26 Cognex Corporation Machine vision methods for determining characteristics of an object using boundary points and bounding regions
US6141033A (en) * 1997-05-15 2000-10-31 Cognex Corporation Bandwidth reduction of multichannel images for machine vision
US6608647B1 (en) 1997-06-24 2003-08-19 Cognex Corporation Methods and apparatus for charge coupled device image acquisition with independent integration and readout
US5978080A (en) * 1997-09-25 1999-11-02 Cognex Corporation Machine vision methods using feedback to determine an orientation, pixel width and pixel height of a field of view
US6025854A (en) * 1997-12-31 2000-02-15 Cognex Corporation Method and apparatus for high speed image acquisition
US6282328B1 (en) 1998-01-28 2001-08-28 Cognex Corporation Machine vision systems and methods for morphological transformation of an image with non-uniform offsets
US6236769B1 (en) 1998-01-28 2001-05-22 Cognex Corporation Machine vision systems and methods for morphological transformation of an image with zero or other uniform offsets
US6381375B1 (en) 1998-02-20 2002-04-30 Cognex Corporation Methods and apparatus for generating a projection of an image
US6215915B1 (en) 1998-02-20 2001-04-10 Cognex Corporation Image processing methods and apparatus for separable, general affine transformation of an image
US6687402B1 (en) 1998-12-18 2004-02-03 Cognex Corporation Machine vision methods and systems for boundary feature comparison of patterns and images
US6381366B1 (en) 1998-12-18 2002-04-30 Cognex Corporation Machine vision methods and system for boundary point-based comparison of patterns and images
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US6684402B1 (en) 1999-12-01 2004-01-27 Cognex Technology And Investment Corporation Control methods and apparatus for coupling multiple image acquisition devices to a digital data processor
US6748104B1 (en) 2000-03-24 2004-06-08 Cognex Corporation Methods and apparatus for machine vision inspection using single and multiple templates or patterns
US7006669B1 (en) 2000-12-31 2006-02-28 Cognex Corporation Machine vision method and apparatus for thresholding images of non-uniform materials
US7386160B2 (en) * 2004-12-02 2008-06-10 International Business Machines Corporation System and method for determining image resolution using MICR characters
US7639861B2 (en) 2005-09-14 2009-12-29 Cognex Technology And Investment Corporation Method and apparatus for backlighting a wafer during alignment
US8111904B2 (en) 2005-10-07 2012-02-07 Cognex Technology And Investment Corp. Methods and apparatus for practical 3D vision system
US8162584B2 (en) 2006-08-23 2012-04-24 Cognex Corporation Method and apparatus for semiconductor wafer alignment
US20080310721A1 (en) * 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image
ITBA20110038A1 (it) 2011-07-12 2013-01-13 D A Bi Mus Srl Metodo e apparato per riconoscere testo in immagini digitali raffiguranti pagine di un documento antico
US9195908B2 (en) 2013-05-22 2015-11-24 Xerox Corporation Snow classifier context window reduction using class t-scores and mean differences
US10346702B2 (en) 2017-07-24 2019-07-09 Bank Of America Corporation Image data capture and conversion
US10192127B1 (en) 2017-07-24 2019-01-29 Bank Of America Corporation System for dynamic optical character recognition tuning

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3519990A (en) * 1966-09-15 1970-07-07 Control Data Corp Recognition system for reading machine
GB1233459A (ja) * 1968-07-15 1971-05-26
US4308523A (en) * 1980-02-04 1981-12-29 Compuscan, Incorporated Apparatus and method for character recognition
JPS5750076A (en) * 1980-09-10 1982-03-24 Toshiba Corp Character reader
US4562594A (en) * 1983-09-29 1985-12-31 International Business Machines Corp. (Ibm) Method and apparatus for segmenting character images
US4680803A (en) * 1984-12-17 1987-07-14 Ncr Corporation Method and apparatus for isolating image data for character recognition

Also Published As

Publication number Publication date
DE68915950T2 (de) 1995-02-02
US4932065A (en) 1990-06-05
JP3035309B2 (ja) 2000-04-24
EP0369761A3 (en) 1991-12-18
CA1316606C (en) 1993-04-20
EP0369761A2 (en) 1990-05-23
EP0369761B1 (en) 1994-06-08
DE68915950D1 (de) 1994-07-14

Similar Documents

Publication Publication Date Title
JPH02165392A (ja) 多ホント用万能文字区分方法
JP3264932B2 (ja) テキストを含む画像における背景から前景を分離する方法及び装置
US5799115A (en) Image filing apparatus and method
US5687253A (en) Method for comparing word shapes
US5444793A (en) Method for detecting machine printed monetary amounts in binary images
US4817171A (en) Pattern recognition system
JP4172584B2 (ja) 文字認識結果出力装置、文字認識装置、その方法及びプログラム
EP2178028A2 (en) Representing documents with runlength histograms
JPH05174183A (ja) 文書画像傾き検出方式
JPH08166970A (ja) コード化したワードトークンを使用して文書画像をハイライトで強調する方法
EP1081648B1 (en) Method for processing a digital image
JPS61145693A (ja) 文字認識のためのイメージ・データを分離する方法及び装置
JPH0420226B2 (ja)
CN110503054A (zh) 文本图像的处理方法及装置
US4962432A (en) Selective retrieval of data from microfilm images of different forms by reading a memory index form cord (bar code) recorded on each image frame
JPH06501801A (ja) 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置
CA1316605C (en) Method of searching binary images to find search regions in which straight lines may be found
CN104077562B (zh) 一种答卷的扫描方向判断方法
US5553162A (en) Method for detecting ink jet or dot matrix printing
US5119441A (en) Optical character recognition apparatus and method using masks operation
US5721790A (en) Methods and apparatus for separating integer and fractional portions of a financial amount
KR102391068B1 (ko) 문서 인식 시스템 및 방법
Swargiary et al. Classification of basmati rice grains using image processing techniques
EP0446630A2 (en) Method and apparatus for segmenting characters in an amount field on a financial document
JP3197464B2 (ja) 文字認識方法および文字認識装置