JPS61145693A - 文字認識のためのイメージ・データを分離する方法及び装置 - Google Patents

文字認識のためのイメージ・データを分離する方法及び装置

Info

Publication number
JPS61145693A
JPS61145693A JP60281281A JP28128185A JPS61145693A JP S61145693 A JPS61145693 A JP S61145693A JP 60281281 A JP60281281 A JP 60281281A JP 28128185 A JP28128185 A JP 28128185A JP S61145693 A JPS61145693 A JP S61145693A
Authority
JP
Japan
Prior art keywords
character
data
groups
binary
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60281281A
Other languages
English (en)
Inventor
アントニオ デイレラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NCR Voyix Corp
Original Assignee
NCR Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NCR Corp filed Critical NCR Corp
Publication of JPS61145693A publication Critical patent/JPS61145693A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 この発明は、例えば、2文字から成るイメージ・データ
を分割して、機械文字認識を行わせるために、分割され
たイメージ・データを供給する方法及び装置に関する。
この出願はこの出願の出願人と同一人によって1982
年12月23日に米国で出願された米国特許出願第45
2,563号“銀行業務システム及び方法1に関連する
〔従来技術〕
例えば、銀行業務のような事務を自動化しようとしてい
る業務においては、機械及び手書データを自動的に読取
るべく努力が行われている。例えば、そのような銀行業
務における努力は小切手のような書類の手書1優遇金額
”又は金銭額を機械読取りすることにも向けられている
〔発明が解決しようとする問題点〕
従来技術における問題点の1つは、各人が金額の数字を
接触させたり重ね書きして、常に一定の間隔で書くこと
ばかりはないということである。
人間のオペレータであれば接触したり重ね書きの文字で
も読むことができるが、文字認識装置では正しく読取る
ことができない。
従って、この発明の目的は上記の問題を解決するため文
字に関するイメージ・データを前処理して文字認識を容
易にする相当簡単且つ低価の方法及び装置を提供するこ
とである。
上記の出願は書類のディジタル・イメージから小切手の
優遇金額又は金銭額を自動読取りするシステムを開示し
ており、この発明はそのシステムに有益に利用すること
ができる。
〔問題点を解決するだめの手段〕
この発明は上記の問題を次のようにして解決した。
この発明の一面によると、それは文字の走査に応答して
引き出されたデータ・ビットを分割する方法であって、
(a)1より多い文字から成るかもしれない個別の前記
データ・ビット・グループを絶縁し、(b)前記グルー
プ内の第1及び第2のデータ・ビット・グループ間の結
合の可能性のサーチにおいて所定の基準に従い前記個別
のデータ・ビット・グループを検査し、(C)第2の所
定の基準に従い、前記第1及び第2のデータ・ビット・
グループを分離するべく分割(セグメント化)ベクトル
を選択し、(d)選択された前記分割ベクトルに沿った
前記結合(ジヨイント)において前記第1及び第2のデ
ータ・ビット・グループを分離する各工程から成るデー
タ・ビットの分割方法である。
又、他の面によると、文字認識を容易にする装置であっ
て、文字の走査に応答して引き出されたイメージ・デー
タ・ビットを受取る手段と、1文字以上から成るかもし
れない個別の前記データ・ビット・グループを絶縁する
手段と、前記グループ内における第1及び第2のデータ
・ビット・グループ間で結合の可能性があるかどうかの
サーチにおいて所定の基準に従い前記個別のデータ・ビ
ット・グループを検査する手段と、前記第1及び第2の
データ・ビット・グループを分離するべ・く第2の所定
の基準に従い分割ベクトルを選択する手段と、選択され
た分割ベクトルに沿い前記結合ニオいて前記第1及び第
2のデータ・ビット・グループを分離する手段と、文字
を認識する手段と、文字認識を達成するべく前記認識手
段に対し前記第1及び第2のデータ・ビット・グループ
ヲ伝送する手段とから成る文字認識装置である。
この発明のその他の点については以下順次説明する。 
 。
、  ゛ 、〔実施例〕 第1図はシステム10として全体的に指定する銀行業、
務システムのブロック全体図である。システム10はエ
ントリ処理ユニット(EPU) 12 ト、イメージ・
ディスプレイ端末機(IDT) 14−1 。
14−2.14−3が接続されたデータ・エントリ・プ
ロセッサ(DEP) 14と、エンコード及びソート・
ユニツ) (ESU) 16とを含み、それらすべては
企業内通信網(LAN) 18で接続されている。  
・一般に、EPU 12の作用は、例えば、小切手や預
金票のような書類を受取ることであり、1パッチ当り約
200〜300枚のバッチとして処理された書類からあ
るデータを自動的に読取ることである。EPU 12は
この発明が施こされている優遇金額又は全銭額(以下金
額という)リーダ(c、 A。
R,)モジュール20を含む。一般にIDT14−1゜
14−2.14−3を持つDEP 14はEPUの出力
を使用する作用を遂行し、そしてEPU 12で機械的
に読取られなかったデータを完成し、必要な場合にミス
リード・データを修正し、例えば、プルーフ及び一致化
のようなある銀行業務処理を達成する。
ESU 16は一般にDEP 14からの書類パッチの
だめの完成したデータを受信し、ESU 16を移動し
た小切手又は預金票のような書類の金額をその書類上に
エンコード又は記録する。ESU 16においては、書
類が銀行の分類命令に従って各分類(ソー十)/ケラト
にソーティングされる前に、他の作用、すなわちスタン
プ、エンドース及びマイクロフィルム撮影などが行われ
る。
EPU 12は第2図に詳細に表わす。それは前述の如
く6パツチ”で、例えば、小切手又は預金票のような書
類の処理に使用されるリーダ/ソータに類似する一般的
構造を有する。
書類パッチはスタッカ又はホラ/422(lE2図)に
置かれ、従来のフィード機構24を用いてホッパ22か
ら書類26をピックアップし、その後書類26は書類ト
ラック30に溢い、この実施例では毎分200枚の=定
速度で従来のトランスポート機構28を移動する。
各書類26がトラック30に沿って移動すると、従来の
磁気インキ文字認識(MICR) IJ−ダ32と読取
関係に入る。MI CRリーダ32はトラック30に沿
つて配置され、書類26がそこを移動したときに書類2
6のMI ORライン34(第3図)を読取る。
MI ORライン34は、例えば・関係する銀行の番号
(トランジット・ルート番号)の識別記号と、顧客の口
座番号と、小切手番号とを含む。MICRリーダ32の
出力は読取られたデータを解釈する従来゛の認識回路3
6に送られる。
例えば、38で全体的に示したセンサがあり、それはト
ラック30(第2図)に沿つて置かれ、トラック30に
沿って移動する小切手等書類の状態をチェックする。セ
ンサ38はマイクロプロセッサ(図に示していない)を
含むことができ、例えば、フィード機構24及びトラン
スポート機構28を制御するような仕事である移動する
書類に関する通常動作を実行する従来のコントロ−ラ4
゜に接続される。コントロ−ラ40はインタフェース4
4を介してEPUプロセッサ42(第2図)に接続され
る。
更に、この例を説明すると、書類26がMICRIJ−
ダ32に近ずいたことをセンサ38(第2図)が示した
ときに、EPtJPt上ッサ42はその通知をコントロ
−ラ40かも受け、MICRリーダ32に読取られるべ
き書類26に関連するデータに書類参照番号(DRN)
を割当てる。このDRNは各書類に対して唯一のもので
あり、書類26に関する各種データを識別するためにシ
ステム10が使用し、システム10における書類26の
処理を容易にする。MICRIJ−ダ32からのMI 
CRデータは認識回路36で処理される。認識回路36
から来た、例えば、銀行番号、顧客口座番号、小切手番
号のような典型的なMICR7”−夕はインタフェース
44を介してEPUプロセッサ42のランダム・アクセ
ス・メモリー(RAM) 60に送られ、今使用可能と
なっているDRNに従って記憶される。
MICRIJ−ダ32によって書類26が読取られた後
、書類26はトラック30に沿って置かれている従来の
イメージング装置48(第2図)と動作関係に入る。書
類26は下部長端を下にして移動され、その前面がイメ
ージング装置48と対面する。
書類26が縦走査ライン(第2図にドツト50で表す)
を通過移動すると、書類26の最右端(第3図で見て)
が光源(図に示していない)で照射され、そこから反射
した光がイメージング装置48に含まれているイメージ
ング・センサ・アレイに対し、適当なレンズ系(図に示
しでいない)を通してフォーカスされる。この実施例に
おけるセンサ・アレイは走査ライン50に治った一定数
の画素又はピクセルを発生する型のものでよい。
例えば、リチコン(Reticon)コーーレーション
製のRL−1024Bのような1つのアレイは走査ライ
ン50に溢って1024ピクセルを発生するが、この実
施例の解像度の要求に合わせるために640ビクセルだ
けが使用される。書類26(第2図)が矢印52で示す
下流方向に移動したときに、走査ライン50に書類26
の新しい部分が現われ、新たな640ピクセル・グルー
プを発生する。センナ・アレイからの各ピクセルは関係
するアナログのダレイスケール値を持ち、処理回路54
で変換又はディジット化され、例えば、各ピクセルにつ
いて6ビツト・バイトを発生し、白から黒まで64グレ
イ値の範囲で記憶する。64グレイ値は、例えば、処理
回路54によって2つの値、すなわち白か黒に減じるこ
とができる。走査が完了すると、データ・バイト流又は
データ・ビット流は処理回路54から発行される。これ
は従来技術であるからこれ以上の説明は必要としない。
      ′書類260゛°イメージ”の走査ライン
50(第2図)からのデータ又はピクセル流は処理回路
54で処理されて高域濾波器(以下スレツシュホ−ルダ
と呼ぶ)56(第2図)に送られ、その出力はコンプレ
ッサ58に送うれるOスレツシュホ−ルダ56は従来型
であり、不必要な背景情報を除去し、例えば、背景情報
から必要なデータを取出すのに用いられる回路である。
コンプレッサ58は従来技術であり、スレソシュホ−ル
ダ56からのバイナリ・データを受信し、6冗長”なデ
ータを除去して、バイナリ・データを″圧縮する”こと
により圧縮ディジタル・イメージ・データを発生し、書
類26のイメージに関するデータの送信に必要な送信期
間を減少し、必要なメモリーの量を減少する。コンプレ
ッサ58の出力はインタフェース44を介してEPUプ
ロセッサ42のRAM 60に送られ、この書類26に
関するイメージ・デー・りをDRNに一時記憶する。オ
プションと′して、書類26の裏面の撮影のために第2
のイメージング装置及び関係回路(図に示していない)
を使用することができる。
EPUプロセッサ42(第2図)は前述のインタフェー
ス44、ROM 46、RAM 60、陰極線管(CR
T) 62のようなディスプレイ、キーデート(KB)
64、プロセッサ(MP)66及びインタフェース及び
制御ロジック68を含む。EPU fロセッサ42に関
する処理ルーチンはROM 46にあるが、より一般的
には、例えば、ディスク又はテープ記憶装置(図に示し
ていない)からRAM 60に負荷してもよく、それは
一般に従来の開始手順で行われる。CRT 62はキー
ビード(KB)64を使用してデータ又は指令を挿入す
るオペレータとの通信に用いられる。インタフェース及
び制御ロジック68はプロセッサ42の各成分間を相互
に接続して従来の如く“インテリジェント”アプリケー
ション・プロモレすとしてそれを作用させうるようにす
る。第2図に示すプロセッサ42の形は実行する各作用
を描くのに使用され、実際の形は異なるかもしれない。
ドラック30に沿った書類26の移動を継続する。書類
26がイメージング装置481E2図)を通過した後、
該当する書類26の前面にDRNをプリントする従来の
プリンタ(図に示していない)と動作関係に入る。DR
NはEPU fロセッサ42で先に割当てられた。エン
ドーサ及びマイクロフィルマ(図に示していない)のよ
うな各従来の装置はトラック30に沿って配置され、そ
こを通過する書類26と動作関係になることができる。
通常、書類26(第2図)は前述のようにパッチで処理
され、エンドース及びマイクロフィルム撮影後、インタ
フェース44を介してEPUゾロセッサ42に接続され
ているポケット・コントロ−ラ74で制御される転換器
72によって順次単一ポケット70に転向される。この
時点において、プロセッサ42が1以上の書類26から
1枚だけ取出したい場合(各種処理理由から)、プロセ
ッサ42はポケット・コントロ−ラ74に適当な指令を
送り、その書類を拒絶ポケット76に転向する。
書類26が移動して、順次、撮影装置50(凭2図)を
通過して、関連するイメージ・r−夕が処理され、強調
され、濾波され、前述のように圧縮され、圧縮された各
書類のイメージ・データはRAM 60に記憶される。
圧縮されたイメージ・データに対するDRNはその圧縮
されたイメージ・デタタと組合わされ、圧縮されたイメ
ージ、データはインタフェース44を介して直ちにEP
Uプロセッサ42から転送され、インタフェース78を
介して通信網18を通りDEP 14 (第1図)に転
送される。DEP 14は直ちに圧縮されたイメージ・
データをインタフェース78を介してイメージ・ディス
ク・ファイル(I、 D、F、)80に送り、該当する
DRNに従って記憶される。書類26は、例えばパッチ
当り200〜300枚のパッチで処理されるから、処理
される各書類パッチを識別するためにパッチ・ヘッダ・
カードが使用される。パッチ・ヘッダ・カードはそのパ
ッチで処理されるべきパッチの最初の書類であり、その
ヘッダ・カードについてのパッチ番号が使用されて該当
する書類バッチの各書類データを識別する。更に、その
点で、イメージ・ディスク・ファイル80の圧縮イメー
ジ・データはパッチ番号内のDRNに従って配置してそ
のアクセスを容易にすることができる。
イメージング装置48(第2図)から取出されたイメー
ジ・データは機械文字認識を実行して圧縮された書類2
6の金額の確認にも使用することカテキる。スレッシュ
ホ−ルダ56からきたイメージ・データ(圧縮前の)は
金額認識(C,A、 R,)モジュール82に供給され
、そこで金額の識別が実行される。
C,A、R汗ジュール20(第2図)の作用は第3図の
参照数字82によって表わされる金額の自動読取りを実
行することである。その金額は小切手の金銭の額であり
、数字で書かれ又はプリントされる。C,A、R,モジ
ュール82は各書類26がトラックに治ってイメージン
グ装置48を通過移動する際にその金額82の読取りを
試みる。C,A、R,モジュール20からの出力は読取
られた各数字のための信頼レベルが付いた読取り金額を
含む。例えば、特定の金額の数字82が全く自動的に読
むことができない場合はその特定の数字又はディジット
に信頼レベル′O”を付すことができる。同様に、金額
82の特定のディジットが正しく読取られる信頼性の程
度が高い場合はその特定の数又はディジットに信頼レベ
ル″9”を付すことができる。該当する信頼レベルを伴
い、C,A、R,20で処理された数字はEPUプロセ
ッサ20に送られ、前述のように、そこから更に処理す
るためにDEP14に送られる。IDT 14−1.1
4−2.14−3及びESU 16は従来のインタフェ
ース84を介してLAN 18に接続され、それら指定
された要素間で従来通りの接続が行われる。
第2図のC0A、R,モジュール20は第4図に更に詳
細に示す。C,A、R,モジュール20は、金額の自動
読取りを実行するために、スレッシュホ−ルダ56から
きたバイナリ・イメージ・データ(書類26についての
)を受信する。スレツシュホ−ルダ56からのデータは
バイナリ°′0#か″1”の流れから成り、このデータ
流はエンコーダ・プロセッサ86のインタフェース84
を通して送られ、該轟するRAM 88に記憶されると
いうことを思い出すべきである。センサ38(第2図)
の1つは新たな書類26のためのデータの開始を示すの
に使用され、その事実はカウンタ90.92を始動させ
るためにエンコーダ・プロセッサ86が使用する。カウ
ンタ90は走査の際のピクセルの数のカウントに使用さ
れ、カウンタ92は第5図に示すようなイメージの走査
の数のカウントに使用する。この実施例では、各走査範
囲≠0〜≠639内に640ビクセルがアシ、高さ約4
インチの書類26を処理する。カウンタ90はカウント
ダウン・モードに設定することができ、最後の書類を≠
0で参照するのを容易にする。この実施例では、364
走査が使用され、金額82が置かれている書類の部分を
カハ−する。エンコーダ・プロセッサ86は従来のもの
であり、ROM94 、MP96゜インタフェース及び
制御ロッジク98を含む。プロセッサ86の動作に必要
な指令はROM 94に記憶することができ、更に一般
的には、通常の開始手順の部分として毎日RAM 88
に記憶するよう・にしてもよい。ある状況では、スレッ
シュホ−ルダ56からきたデータ・ビット流をエンコー
ドすることが希望され、システム10で必要なメモリー
及び処理時間を少くすることができる。使用されるエン
コード方式の1つは典型的な“ラン・レングス”エンコ
ーディング方式である。それはこの発明の理解に重要で
はないので、それ以上説明する必要性がない。
完全マトリックス・データ又はエンコーデッド・データ
(エンコード・プロセッサ86(第4図)でエンコード
された場合)はインタフェース84゜102を介して金
額捜出プロセッサ100に転送され、プロセッサ100
のRAM 104に記憶される。金額捜出プロセッサ1
00は従来のものであり、又ROM 106 、 MP
108 、インタフェース及び制御ロジック110を含
む。金額捜出プロセッサ100の作用は金額82に対す
るイメージ・データを取出すことであり、そのイメージ
・データをインタフェース116を介して分割プロセッ
サ114のRAM 112に転送することである。金額
82に関するイメージ・データを取出す技術は従来のも
のでよい。イメージ・データがエンコーダ・プロセッサ
86でエンコードされた場合、分割プロセッサ114に
送られる前に金額捜出プロセッサ100でデコードされ
るようにしてよい。
金額82に関するイメージ・データは第6図のホ−マッ
トにあり、それは前述のようにプロセッサ100から分
割プロセッサ114に送られるものである。図118(
第6図)は書類26の金額82に関するイメージ・デー
タのエンコーディングを表わし、図118のエンコーデ
ィングは第7A図。
第7B図に表わすような全体的に120で指定されたイ
メージ・データに相当する。この例においては、イメー
ジ・データ120はバイナリ″0”と′1”とから成り
、バイナリ°゛0”は白ビクセルに対応し、バイナリ“
1#は黒ピクセルに対応する。バイナリ°I 1#は実
線で囲まれ、目的物又は対象物に関する記録を形成する
黒ピクセルを共にグループ化する。ここに表わすような
記録は個々の領域を形成するバイナリ″1#の集団を意
味し、対象物は数個の関連記録から成るようにすること
ができる。例えば、第7B図の′3″l′7”、′14
”。
′15#とマークされた記録は全体的に122で指定し
た目的物を構成する。対象物122は数字13″のよう
に見える。第7A図及び第7B図のすべてのイメージ・
データ120は金額捜出プロセッサ100から来た金額
を構成する。分割プロセッサ114(第4図)の作用は
図118(第6図)に提供されたエンコーデッド・デー
タを分析し、第4図に示す認識プロセッサ124におけ
る文字認識を容易にするために分離されるべきそれら記
録を分離する。例えば、記録+4はライン126に沿つ
て第7A図の記録す8から分離されて、結合された対象
物128を構成する一見“6”及び8#の読取りを容易
にするべきである。この発明の特徴は、第7A図及び第
7B図に示すイメージ・データ120が図118(第6
回)に示す形で供給されたときに、そこに示す記録又は
対象物は全く容易に分離して後の動作における文字認識
を容易にすることができるということである。
金額捜出プロセッサ100(第4図)が金額82(第3
図)を見つけたときに、該当するイメージ・データ12
0(第7A図及び第7B図)は第5図で説明したように
、約50行の高さであるデータの約150列から成ると
いうことを思い出そう。
金額捜出プロセッサ100は行(R)カウンタ゛129
と列(C)カウンタ130とを持ち、以下説明するよう
に各行及び列の位置をカウントする。
第7A図及び第7B図に関するエンコーディング技術を
説明する前に、数点の説明を追加する必要がある。基本
的に使用するエンコーディング技術は簡単なラン・レン
グス・エンコーディングである。この実施例において、
イメージ・データは列に沼って検査され、必要なことの
すべてはその点で一貫性があることである。金額82の
ためのイメージ・データ120(第7A図、第7B図)
を受信したときに、第5図に示された絶対性及び絶対列
は使用されず、更宜上、最上列は′0#番が付され、第
7A図の最左列も、例えば、′0″番が付される。ここ
に使用されるラン・レングス・エンコーディングのため
に、走査は(黒ピクセルのサーチにおいて)第7A図及
び第7B図の最上性から開始して、第7A図及び第7B
図の左から右に進める。最上性を走査後、次の下の行の
走査を行い、その行の左側から開始して右側の方に進め
る。
第6図に示す図118で実施するエンコーディング技術
は次のように進める。第7A図及び第7B図の最上性(
行すO)は′1″で指定する黒ピクセルをサーチして左
から右に走査された。次の行(行+1)も左から右に走
査されたが、黒ビクセルは見つからなかった。再び、次
の行(行+2)が左から右に走査され、始めて134(
第7B図)でマークした黒ビクセルに出合った。この実
施例におけるビクセル134列位置はCカウンタ130
(第4図)から得られ、このカウンタは最左列(第7B
図で見て)に達したときに(走査又は検査処理で)0“
にリセットされる。黒ピクセル134は前述のような走
査で出あった最初の黒ピクセルである。従って、ピクセ
ル134に対する記録は記録4=1とする。行2の黒ピ
クセルのランの長さは白ピクセルに遭遇するまで7″で
ある。
これは行4P2の記録す1の長さは7黒ピクセル長であ
るということを意味する。イメージ・データの最後の列
に達したときに、Cカウンタ130は0#にリセットさ
れ、Rカウンタ129は“1#1#れる。
このデータは今行尋2(第7A図、第7B図)から得ら
れ、下記のように記録され、図118(第6図)にエン
コードされる。長方形136で囲まれた9991のよう
な数字は新たな文字又は目的物の開始の表示に使用され
る。数字9991及び第6図に示す他の数字は金額捜出
プロセッサ100のRAM 104に挟入される。この
実施例では、行われるべき各エントリのために16ビツ
ト・ワードが使用される。エントリは一次元メモリーの
ようなRAM 104に挟入されるがこの点については
後述する。長方形1360次のエン) IJは行′°2
”の略である′°2#である。図118の次のエントリ
は最初の黒ピクセル134に出退う列105を略した°
” 105 ”である。これは第7A図の左側からカウ
ントして第105列目である。
′7”である次の数字は最初の黒ビクセルを含む行にあ
る黒ピクセルの数を表わす。黒ピクセル134から始ま
り、黒ぎクセル138で終るその行の黒ピクセルの長さ
はCカウンタ130(第4図)のカウントを使用して得
られる。故に、記録+1のための最初の行は行2にあり
、列105から始まり、7列幅に亘る。次の走査は行3
であり、この行で遭遇する最初の黒ピクセルはピクセル
140(第7B図)でおる。
その後の走査を記録する方法はその記録に対する前のラ
ンと比較してランの”成長”を記録することによって行
う。例えば、黒ピクセル】34(第7B図)から開始し
たう/は7黒ピクセル長である。
黒ピクセル140から始まる次のランは黒ピクセル13
4のだめの列105に対して列102から始まる。これ
は、黒ピクセル140から始まる行は黒ビクセル134
から始まる行の3列前から始まるということを意味する
。従って、図118の次の位置に(−3)が挟入される
。(−3)は括弧で囲まれる。黒ピクセル140から始
まる行の最後の黒ビクセル144は黒ピクセル138と
同じ列で終るから記録の成長は(0)であり、括弧14
2内の右側に数字0が置かれる。括弧146y148*
150.152,154,156内にある残りのエント
リ対はいかに記録+1のための後の行が記録されるかを
表わす。括弧156(第6図)内にあるエントリは黒ピ
クセル158から始まる行に関するものである。第6図
の最初のラインの数字99o1は1つの対象物に対する
新たな記録の開示を表示するために使用される。この場
合、その数字9901は記録≠6を表わす。
特に、この時点でいうべき点は第6図に表わすエンコー
ディングに関するものである。黒ビクセルをサーチする
ための走査は行基準で行われ、第7A図及び第7B図に
おいて左から右にサーチされるということを思い出すべ
きである。記録番号の割当も左から右に行い、第7A図
、第7B図で見て上の行から下の方に進められる。行5
に沿って走査すると、黒ビクセル160に遭遇する。こ
の黒ピクセルは記録≠2の一部である。更に、第5行に
沿って右に進むと、次に遭遇する黒ビクセルは(白ピク
セルの後の)記録≠3の開始を表わす黒ピクセル162
である。通常、記録+2のデータは記録≠6のデータの
前に挟入されるが、第6図の図118は数回のデータ取
扱いの後にRAM104の最終メモリー配置が行われた
ことを表わす。例えば、記録+2.+3のデータが、例
えば、記録+6の前に挿入され、記録+6は記録≠1の
後のメモリーに配置される。これは共にグループ化され
た対象物のすべての記録が関連するように行われる。一
般的な規則は、特定の対象物は究極的にその対象物につ
いて遭遇した最初の記録(前述の走査技術により)でグ
ループ化されるということである。その点で、記録+6
は記録+iでグループ化される。すなわち、記録す1は
記録+1゜≠6.+12.≠13を含む対象物164の
ために前述の走査方式で遭遇した最初の記録だからであ
る。従って、エントリ9901は記録+6となる(第6
図の参照番号166で表わす)。参照番号166(第6
図)で表示する新たな記録す6に続き、次の数字パフ”
は記録≠6が開始する行番号を表わしく第7B図の黒ビ
クセル168を介して)、参照番号17.0で表わす数
字103は記録≠6が開始した列の番号を表示する。数
字103と同じラインの次のエントリはこの行7の記録
のだめの黒ピクセルの数か又は“ラン・レングス”を表
わし、その“ラン・レングス”はパ8#である。次の括
弧172内の2つの数字゛2”及び′−1”は前に説明
した方式による記録+6の行8のだめの記録成長を表わ
す。
第6図の図118に現われた次の新たな対象物は対象物
128と呼び、第7A図に示す。対象物128のために
遭遇した最初の記録は記録≠2であり、従って、第6図
の数字174で表わされる新対象物コード” 9991
″は第7A図に表わす記録Φ2をいう。同様にして、第
6図の図118に現わ、れた次の対象物は対象物122
(第7B図)と呼ばれる。対象物122で遭遇した最初
の記録は記録≠3であり、従って、第6図の数字176
で表わされる新対象物コード°”9991 ”は第7B
図に表わす記録+3と称する。
先に述べたように、対象物に関する記録はその対象物に
ついて遭遇した最初の記録によって記録される(前述の
走査方式により)。そこで第7A図、第7B図に示す記
録は図118(第6図)に示された配列によってエンコ
ードされ供給される。
第7A図、第7B図に示した各種対象物に関する記録の
提供順序は次の如くに行う。
記録1.2.3(第7A図、第7B図)は夫々対象物1
64,128,122に関する最初の記録である。対象
物164のために記録≠6.+12.+ 13も関係し
、これらの関係を表わす速記的方法は次のように表わす
1、 6(1)、12(1)、13(1)同様に、第2
の対象物128に関する記録については、 2. 5(2)、4(2)、8(2)、9(2)、 1
0(2) 、 11(2)。
・・・16(2) 、 18(2) 、 17(2) 
、 19(2)最後に、第3の対象物に関する記録は、
3、 7(3)、 14(3) 、 15(3)次に、
第6図、第7A図及び第7B図に関するある説明を追加
する。金額捜出プロセッサ100に関するRAM 10
4 (第4図)の部分はこの実施例では16ビツトから
成る各ワードの直列メモリーとして配置される。新たな
記録が形成されるときはいつでも、それに関する列及び
行位置が決定される。すべてのデータがRAM 104
のどこにあるかを示すポインタが用いられる。例えば、
第7A図及び第7B図に示す対象物のだめの累積データ
の終りにおいて、プロセッサ100は記録≠13は対象
物164の記録≠1に関連するということを知り、又、
記録+13に関するデータを記録するために4データ・
バイトが使用され、次のことが行われるということを知
る。RAM 104のデータは対象物≠1のための最後
の記録(又は第7B図の対象物164)が得られるまで
チェックされる。その最後の記録を見つけると、すべて
の残りの記録(第6図のエントリのような)は4ワ−r
位置だけ“シフトダウン”され、ちょうど今空けたRA
M 104のワード位置に入れられる記録≠13に関す
る4データ・バイトのため場所を作る。
第6図の図118のデータの配列はデータの再構成を容
易にする。例えば、第6図に示す記録又はエンコーディ
ングから第7A図、第7B図のイメージ164を再生す
ることを希望する場合、第6□□□の最初のラインのデ
ータは数字136で表わした新対象物コード9991の
始めから開始して直列に読取られ、第6図に数字174
で表わす新対象物コード9991の始めで終了する。こ
のデータは前述のように、記録の成長又は短縮のために
指定する+″又はパ−″に従って積み上げられる。これ
らの指定は、例えば、括弧142及び172内に表わさ
れる。
要約すると、第6図の図118に表わすエンコーディン
グは第7A図、第7B図に表わすイメージ・データのマ
トリックス120を発生する。このエンコーディングは
第4図の金額捜出プロセッサ100で処理される。この
エンコーディングにより、対象物164,122及び1
28又はそれらに関する記録≠1〜≠19を分離する能
力が容易となる。第7A図、第7B図に表わすこのイメ
ージ・データは先に説明したように分割プロセッサ11
4による分離処理を受ける(必要な場合)。
ゾロセッサ114は、又ROM 178 、プロセッサ
(MP)180 、行(R)カウンタ1822列(C)
カウンタ184.及びそこに表わす各要素間を相互に接
続するインタフェース及び制御ロジック186を含む。
第7A図及び第7B図に表わすイメージ・データ120
は各個々の対象物164 、122 、128がRAM
 112に関する分離したバノフィ188に置くことが
できるように、それら対象物ごとに分割される。例えば
、対象物128のだめのイメージ・データは前述のよう
にバイナリ形式で供給され、ピクセルとしてバッファ1
88に記憶される。
この点において、書類の金額の・外隅(行及び列)を知
ることができる。金額に関するイメージ・r−夕は分割
ゾロセッサ114(第4図)に送られ、第8図の190
によって全体的に指定される分割処理を開始する。
′11゛ノ  7 “ !′;) 分割処理190は第8図に全体的に示し、その最初の工
程は、例えば、120のようなイメージ・データ(第7
A図、第7B図)を受信する工程192を含む。データ
はプロセッサ114が受信し、バッファ188に記憶さ
れる。このとき、各対象物又はイメージ・データの°°
文字”は第7A図及び第7B図に表わすようなマトリッ
クス形式である。又、このとき、対象物又は°′文字”
は第7A図に示す対象物128のように2つの接触した
ディジットかもしれない。行カウンタ182及び列カウ
ンタ184(第4図)は後述するように実行されるある
計算の決定に使用される。
分割処理190のだめのプログラム・リスティングは要
求に応じて開示することができる。そのプログラムはフ
ォートランIVで構成しである。それらプログラム・シ
ートは#1〜#46の一連番号を付してあり兄やすくし
である。
分割処理1900次の工程は対象物又は文字を再構成又
は(及び)絶縁する工程194(第8図)である。再構
成とは、たぶん物と共にグループ化されるべきかもしれ
ないある分離した記録又は対象物を再びグループ化する
ということを意味する。
絶縁とは、たぶん2つの文字を含む対象物が2つの対象
物又は文字に分離されたということを意味する。
再構成の基本的問題は、分離した文字に関する個々の記
録又は対象物のすべてを認識して、1つの対象物又は゛
文字”としてそれを記憶することである。第9図及び第
1O図は、典型的な再構成で遭遇する2つの状況を示す
。第9図に示すブロック又は対象物196,198はそ
れら対象物の周辺内に置かれている黒ビクセルすべての
領域を表わす。第1O図に表わす対象物200及び20
2についても同様のことがいえる。次のようにある定義
を定める。
1、196のような対象物はどちらの方向にも接続され
る黒ビクセル群から成る。
2.2つの対象物は次の条件(、)又は(b)を満足す
れば壊された文字の各部である。
(、)  細い方の対象物が縦方向に7%又はそれ以下
だけ他方と重複しており、水平方向にh%又はそれ以上
重複している。“細い方の対象物”の語句は幅が他方の
対象物より小さいということを意味する。
(b)  縦方向(第10図について)の重複が、S”
ビクセルより小であり、水平方向 に+1g”ビクセルより小さいギャップがあり、2つの
対象物のうち左側の方が右のものより下である。
第8図の工程194について上記したように対象物又は
文字を再構成した後、対象物は工程204に示すように
単一文字であるかどうかの決定のためにチェックされる
。その対象物はある条件を満足すれば接続文字を含むこ
とになる。その評価は分割プロセッサ114(第4図)
で行われる。この時点における文字又は対象物に関する
データは第7A図及び第7B図に表わすマトリックス・
フオームの中にあり、行カウンタ182及び列カウンタ
184(第4図)を使用して、後述するような各種・母
うメータを得ることができるということを思い出すべき
である。次のタームは工820・1で使用され、その対
象物に適用される。
P  =波すミタ(黒端部ビクセルの数)W  2幅 H=高さ A  =対象物内の黒ピクセルの数(領域)TA  =
幅×高さ=総領域 W/H=幅対高さ比 A/TA =領域対総領域比 P2/A=イリミタ平方対領域比 m  =この実施例では200 以上で定義したタームを使用して、次の3つの質問に満
足した場合、その°゛対象物″は接続する文字を含むか
又は工程204で評価したときに単一文字ではないかを
表わしてみる。その質問は次のようになる。
(1)P)m: (2)  W/H≧r及びP/A≧b;及び(3)  
W/H≧i及びA/TA ) を及びP2O例えば、最
初の質問について、4リミタ(P)がmより大きい場合
(m:この実施例では200)、その対象物は大体2つ
の文字から成るものと思われ、工程204における応答
はパノー″である。
この実施例においては、1インチ当り154ビクセルを
含み、そのピクセルは第7A図及び第7B図では誇張し
て描いである。工程204からの゛ノー″は2つの文字
″の対象物が後述する方式により工程206で分割され
なければならないことを意味している。工程206で対
象物を分割した後に、工程204ですでに説明したテス
トと同じテストが適用される工程208を受ける。そし
て、°゛2つの文字“の対象物ではないかと再び疑われ
た場合、再び工程206を受ける。工程206における
分割の後、そこから単一文字の結果となった場合、バッ
ファ1880分離した別の領域に単一文字が記憶される
。第8図に示す分割処理が完了したとき、個々の文字が
バッファ188から認識プロセッサ124(第4図)に
転送され(工程209)、そこで前述のように、文字認
識が行われる。
先に説明したように、例えば、第8図の工程2040対
象物のような“結合される文字”が発見されると、第7
A図の128のような対象物1ま第8図の工程206に
表わすような分割を受ける。
゛分割の目的は″結合されている文字”が接続されてい
る場合、それを分離して、結合されている文字を単一文
字に絶縁することにより文字認識を容易にするだめに、
その結合をさがし出すことである。
第8図に示す分割工程206は3つの基本サブルーチン
から成る。すなわち、 1、  JNTLOC(プログラム・リストの34頁)
2、  REMJNT (プログラム・リストの38頁
)3、  、 ZEROUT (プログラム・リストの
42頁)一般に、ルーチンJNTLOCの作用は結合さ
れている文字を含む対象物(128のような)を走査し
て2つの文字間の結合の場所をさがすことである。
ルーチンREMJNTの一般的作用はある方向に沿った
結合を分析することである゛。例えば、最も普通の結合
方向は45°、60°、90°、120°、135゜で
ある。これら結合の長さが確認され、長さに応じて分類
さ九、最短結合が最高優先権を持ち、最長結合が最低優
先権を有する。最短結合に沿って結合文字を分割するの
は長い結合に沿って文字を分割するより結合文字の元の
形をより良く残すことになるからである。
ルーチンZEROUTの一般的作用はルーチンREMJ
NTでさがし出された結合をテストしてそれが真の結合
であるかどうかを確認することである。真の結合は、そ
れを除去した後、結合していた文字を切り離すことにな
るようなものである。テストされた結合が真の結合でな
い場合、2番目に高い優先権を持つ結合をテストする。
真の結合を発見したときに、その結合に沿って2つの文
字が分割され、その後、分離した文字は各々について単
一文字が存在するかどうかのテストを受ける。この処理
は3文字から成る対象物が分割されうるまで繰返えされ
る。このテスト中に真の結合が発見されない場合、結合
された文字の分割は行われない。これら結合された文字
は単に処理のために文字認識プロセッサ124に接続さ
れる。すべての可能性において、結合された文字は文字
認識装置124において読取ることはできない。故に、
これら結合文字は前述したように、IDT14−1 、
14−2 。
14−3(第1図)の1つで書類のイメーノを見ながら
オペレータがその後読取らなければならない。
ルーチンJN’l”LOCは第7A図の対象物128を
見て説明することにより理解することができる。そこに
表わすバイナリ゛′1”と0”で示す結合文字゛6”及
び°゛8”から成る対象物128があることがわかる。
ルーチンJNTLOCの最初の工程はラインに沿って対
象物を走査しく第7A図の縦方向に)、文字パ6”と′
°8”とを接続している結合がどこにあるか、最もそれ
らしいのはどれかを見つけることである。実際の経験か
らそのような結合は一般に対象物128の幅の1/4乃
至3/4の間にあるということがわかっている。このと
き、対象物128を走査するべき場合、その外隅列及び
外隅行ノ’?ラメータは各対象物がバッファ188(第
4図)に別々に入っているということを知りている。走
査する領域は第7A図にRとして示され、次の方程式で
与えられる。
そこで°゛野″対象物128の中間点に等しい。
走査は第7A図で見て、左から右に、又対象物の下から
上部に向けて行われる。この処理時点においては、対象
物の最も左の列は列゛0”と呼び、第7A図の右に向っ
て増加し、対象物128の最底行を行“0”と呼ぶ。行
及び列カウンタ182゜184(第4図)はそれをカウ
ントし、参照するだめに使用される。
その走査は第7A図の列210から始まシ、対象物12
8の底部から上方に進められる。2つの文字間の結合を
検出するために、3×3検査ウインドウを対象物の上で
移動する。検査ウィンドウのための3×3マトリツクス
は1つの黒ピクセルから成る結合を検出することができ
るように選ばれた。第11図、第12図及び第13図は
分離されるべき2つの文字間の結合を表示する3つの異
なるピクセル配置を表わす。第11図乃至第13図につ
いて、各3×3マトリツクスの空白部は“無関心”ビッ
トを表わし、バイナリ゛′1”か“0″かを示している
ものが考慮するべきビットで、It X”は黒ピクセル
か又はバイナリ°゛1′′であり、検査するべき主ビク
セルである。各ウィンドウ212,214,216は2
つの文字間の潜在的結合を表わす。これらウィンドウを
選択するために、ウィンドウ内の各ますにバイナリの重
みが割当てられる。各ウィンドウの合計値を総計するこ
とによって、所定のバイナリ値を持つこれらウィンドウ
を図示の構造を持つものとして選ぶことができる。
第11図のウィンドウ212について、中央ビクセルX
が除去されたとすると、使用されるべき分割ラインは縦
であり、そこに示す0”を通過したであろう。
第12図のウィンドウ214について、中央ピクセルX
が除去された場合、使用されるべき分割ラインはバイナ
リ″″0″を通過し、縦線に対して45度の線に沿って
左から右に立上るであろう。
第13図のウィンドウ216について、中央ビクセルX
が除去された場合、使用されるべき分割ラインはバイナ
リ″0”を通過し、縦線に対して45度の線に沿い、左
から右に下るであろう。
結合の可能性を表わす他のパターンは第14図のウィン
ドウ218によって表わされる。ウィンドり218は、
例えば、第11図に表わすウィンドウ212かられずか
異なシ、2×2マトリツクスを表わす。Xがバイナリ′
″1#に等しい第14図のツクター/は結合している文
字間に多くの結合が存在するという特性がある場合に、
2つの文字間にある結合の可能性を取出すのに使用され
る・結合の可能性が第11図乃至第14図のX”ピクセ
ルの位置に存在する場合、以下に説明するようにルーチ
ンREMJTによって該当する特定の行及び列座標が用
いられる。上記のウィンドウ方式によって評価される各
黒ビクセルのために、3×3マトリツクス・ウィンドウ
が使用され(第11図乃至第13因のような)、その後
、(第14図のような)2×2マトリツクスが使用され
る。
以上、使用される各種検査ウィンドウを説明したが、次
に第7A図の対象物128に関するイメージ・データに
対していかにウィンドウが移動するかを説明する。先に
説明したように、走査は上方に向け、左から右の方に行
われる。
第7A図の列210から開始して上方に進み、最初に遭
遇した黒ピクセルは220とマークされたものである。
列210は、前述したように、分割が予期される範囲R
内の最初の列(この列における)である。最初の黒ピク
セルが列210で遭遇すると、その黒ピクセルに対する
ウィンドウの移動は次の工程で説明することができる。
工程+1: ウィンドウを検査中の黒ピクセルから下布
に6対角m#に移動する。
工程+2= ウィンドウを検査中の黒ビクセルから右に
移動する。
工程+3= ウィンドウを検査中の黒ピクセルから上布
に1対角線1に移動する。
工程◆4: ウィンドウを検査中の黒ピクセルから直上
方に移動する。
上記工程≠1〜す4の結果、黒ビクセルが見つかると、
新たに発見した黒ビクセルは上記ウィンドウ移動の基準
点となる。工程≠1〜+4のいずれかで、黒ビクセルが
発見されるとすぐ、それら1群の工程+1〜≠4の残り
の工程は実行する必要がない。基本的にこの方式は記録
の外隅をサーチして(その記録は128のような対象物
の中に2つ又はそれ以上の文字のうちの1つである可能
性がある)、全体として上方及び右に進み、分割するこ
とができる点を発見しようとすることである。分割は、
例えば、ウィンドウ212,214゜216(第11図
、第12図、第13図)に示す状況で説明したラインに
沿って行われる。ウィンドウ移動のfQは第7A図で説
明する。
第7A図に見られるように、領域R内の最初の列は、行
われるべき分割が予想される列210である。列210
に沿って上方に進むとき、遭遇した最初の黒ビクセルは
黒ピクセル220である。
黒ビクセル220から隣りのピクセルは前述のように工
程≠1〜+4を介して検査される。そこで、ピクセル2
20の右下対角線上のピクセルはIlo”又は白ピクセ
ルであり、右隣りも、上布対角線−上にも“0″ピクセ
ルが存在し、最後に工程≠4によって、黒ピクセル22
0の上に黒ピクセル222が発見される。次に、黒ピク
セル222が基準ピクセルとして使用されて工程+1〜
+4を繰返し、次の基準ピクセルとなるピクセル224
を発見する。次の検査工程において、工程+2で黒ピク
セル226を発見する。工程÷1〜+4は検査処理が黒
ピクセル228に進むまで繰返される。工程+1〜+4
は基準ピクセルとして黒ピクセル228を使用し、工程
+1−+4は、それらの工程で検査される6隣り”の黒
ビクセルがないということを発見する。そのような状況
に遭遇したときに、その処理は黒ピクセルに遭遇するま
で上方に進み(現在の基準ピクセル又は黒ピクセル22
8が捜出された列で)、黒ピクセル228の上に黒ピク
セル230を発見して、それを基準ピクセルとして検査
を続行する。次の黒ピクセル232 、234は工程≠
2で発見され、その後、黒ピクセル2361d工程≠1
で発見される。黒ビクセル23o。
232.234は記録+4に関連し、黒ビクセル236
は記録≠8に関連する。第7A図及び第7B図に表わす
イメージ・データは上記の工程−4Pl〜+4によって
検査されているときはバッファ188(第4図)に見出
され、図のようにそれはバイナリ″1#か′0″から成
る。又、工程+1〜+4が記録の外隅を捜索している間
、工程+1〜≠4に使用されている基準点ビクセルは夫
々第11図乃至第13図に表わすウィンドウ212,2
14゜216のII X”又は中央ピクセルとしても使
用され、又、第14図に表わすウィンドウ218の“X
”ピクセルとしても使用される。ウィンドウ218(第
14図)の基準ピクセル又はパX#ビクセル234は第
7A図の対象物128の記録≠4と+8との間に分割が
行われるかもしれない点を表わすかもしれないというこ
とをピクセル234が表示するということに注意しよう
第7A図の黒ピクセル234で表わされるような可能性
のある分割点を捜し出した後、記録+4と+8との間の
分割を行うべき方向を確かめるために、別の検査処理を
導入する。分割が行われるべき場合、経験から最も分割
が行われる可能性のあるベクトルは第15図に示すペク
トルナl−≠5に沿っているということを確認した。こ
れらベクトル+1〜◆5は優先権の順に番号が付された
例えば、第11図乃至第14図のウィンドウによって表
わされるような可能性のある結合が発見されたときに、
それに沿ってピクセルを検査する最初のベクトル方向は
第15図の分割ベクトル≠1によって表わされる。ベク
トル≠1は第11図乃至第14図に示す検査ウィンドウ
内にある基準点ビクセル“X#から同じ列又は直“上”
の方向を表わす。ベクトルΦ2は45度の角度で上及び
右の方向を表わす。上及び右の方向とはこの例における
第7A図のイメージ・データの現在点を基準とする。ベ
クトル+3は45度上及び左方向を表わす。最後にペク
トルナ4及びす5はそこに表わすようにペクトルナ1に
対して約30度の角度を表わす。これらベクトルI#1
1〜+5は図のように習慣的な三角法的指定で与えられ
る。
黒ビクセルのための検査が第15図のベクトル+1〜+
5で表わす方向に沿って行われると、遭遇した黒ピクセ
ルの数のカウントがそれら各ベクトルのためにバッファ
・メモリー 188 (第4図)に記憶される。ベクト
ル+1〜≠5に沿って遭遇した黒ピクセルの数は対象物
に対する記録を分離するためそれら各ベクトルに沿って
要求され−る分割切断の長さの測定又は最轡のテストに
提供される。一般に、そのベクトル、すなわちベクトル
≠1〜≠5間の最短のベクトルが分割又は切断のために
選ばれた方向である。しかし、それは常にそうであると
いうことはできない。分割の前に別のテストを行うべき
である。
どのベクトル41〜4P5(第15図)に決定するかの
第2のテストはある最初の白ピクセルがある列を検査し
て対象物の記録を分離するべき最良の線を提供すること
である。この最初の白ピクセルは黒ピクセルから成るこ
れらベクトルの長さを決定することで、ペクトルナ1〜
≠5に見出される1つである。その最初の白ピクセルに
遭遇したときに、それが置かれている列を注目し、その
列のピクセルの検査が行われる。それは最初の白ビクセ
ルから始まり、対象物の最上部の方に(第7A図で見て
)進む。“最初の白ビクセル”がベクトル≠1〜≠5の
終りにある列で黒ビクセルに遭遇しなかった場合、それ
は分割ラインが適切なものかもしれず、別の基準が適切
であることを与えることを意味する。“最初の白ピクセ
ル”がある列である黒ピクセルに出あうと、最初に発見
した黒ピクセルに関する記録のにリミタ又は外隅が前述
したように、上方及び右方に検査ウィンドウを移動して
検査される。2つの記録の間の結合に出あうことなくそ
のイメージ・データ(第7A図)の上部に達すると、第
2のテストを満足する。
第3及び第4のテストは意図した分割ラインが前述の範
囲“R”内になければならないということであ8る。範
囲Rは対象物を形成する2つの文字が結合しているかも
しれない最もありそうな場所を表わす。
要約すると、選ばれるべき分割多インとして、該当する
イメージ(第7A図)の上部の方に進んだときに、黒ピ
クセルがない列に6最初の白ピクセル”があるようなペ
クトルナ1〜す5のうちの最短ベクトルを選ぶというこ
とである。そのため、最短ベクトルは、又R範囲内にあ
るものを選ぶ。
ある例によって、これらのテストを明らかにする。
例えば、第7A図について、黒ピクセル234は第14
図に示すウィンドウ218にあるXビクセルを表わす。
黒ピクセル234がある列を見ると、分割ベクトル≠1
(直上)の象めに3つの黒ピクセルがあり、分割ベクト
ル+2のためにただ2つの黒ぎクセルがある(黒ピクセ
ル234及び238をカウントする)。分割ベクトル+
2は分割ラインのだめの最短長を与え、それはテスト+
1を満足する。ベクトル≠2を終了するべく遭遇した最
初の白ピクセルは白ピクセル240である。白ピクセル
は白ビクセル240を含むタリにあり、そこから開始し
て第7A図のイメージ・データの上部に続く。故に、テ
スト≠2は満足する。
黒ピクセル234.238を通る提案された分割ライン
は第7A図の底部に表わすR範囲内にある。
故に、テスト+3は満足する。テスト≠1〜≠3が満足
したので、切断線126は黒ピクセル234゜238を
通過するライン126に沿って存在する。
第16図は数字″1#と5#が結合されていると思われ
る対象物242のイメージ・データの他の例を表わす。
前述したように、242のような各対象物は外列マーク
244.246及び外性マーク248.250を持ち、
対象物242のペリミタ又は外隅を明確にする。バイナ
リ°゛0”又は白ピクセルは図を簡単にするために第1
6図には表わしておらず、バイナリ゛1”又は黒ビクセ
ルのみを表わす。
2つの記録間の結合をさがすために対象物242(第1
6図)を検査する際、工程≠1〜4P4を通して第11
図〜第1.4図に示すウィンドウを移動する方式は前述
の如く用いられる。これについて、黒ビクセル252は
第14図のウィンドウ218に示す“X#ピクセルを表
わす。第15図に示す分割ベクトル+1〜≠5に沿って
可能性のある切断を検査した後、分割ベクトル+2は前
述の如く選ばれ、黒ピクセル252を通過して、対象物
242(第16図)を第17図に示す2つの対象物24
2−1.242−5に分割する分割ライン254(第1
7図)を発生する。2つの対象物242−1.242−
5は再び検査されて、第8図の工程208で前述したよ
うに、これら2つの対象物が単一文字を表わすかどうか
について決定する。
この実施例では、2つの対象物242−1.242−5
は単一文字として解釈されたため、それらを文字認識の
ために、文字認識プロセッサ124に送信する。対象物
又は文字が分離されたときに、それらは金額を正しく読
みうるようにするため、書類26(第3図)に現われて
いる順序と同じ1臓序が維持される。
プログラム・リスティングの1頁乃至46頁にある事項
について、以下少々説明する。
前述したように、プログラム・リスティングはフォート
ラン(FORTRAN) I Vで書かれている。リス
ティング1〜46頁は全体に分散した各種説明を有し、
処理全体の理解を容易にする。
リスティングの1〜7頁は利用する色々なファイルから
データを得るための色々な初期手順に関するものである
。第7頁は書類トラック30に沿って送られてくる次の
書類26のだめの次のファイルの名称を用意するサブル
ーチンに関するものである。
リスティングの8頁及び9頁は機械プリント文字を分割
するだめのルーチンに含まれている色々な工程を表わす
。この特別ルーチンは従来のものであり、基本的に結合
プリントされている文字をその中間点で分割するもので
ある。
リスティングの10頁はこのリスティングにある色々な
サブルーチンを制御する高度な制御部分を含む。SEG
M′E2JはこのリスティングにあるENCODE 。
DECODE 、 PASTE及び5IFTと称する各
ルーチンを呼出すためのルーチン名である。ENCOD
Eルーチンは第6図において説明したものであり、DE
CODEは第6図から色々な図を再構成するものである
pAsTEルーチンはりスティングの11頁で述べる。
5IFTルーチンはりスティングの12頁で述べる。
リスティングの11頁は2つの要素又は部分が壊された
文字の一部であるか2つの離れた文字の各部分であるか
を決定するもので、第9図及び第10図で説明した処理
に関係する。
第11頁も第29頁及び第30頁にリストされている詳
細な関連リスティングと共にpAsTEルーチンを表わ
す。PASTEルーチンは本質的には壊された文字を再
構成するルーチンである。言換えると、そのルーチンは
壊された要素を別の・ぐツファに正しく結合するよう試
みるものである。例えば、第18図はそのバッファ25
8にある数字″5#の部分256を表わす。第19図は
その/<ツファ262にある文字の第2の部分260を
表わす。
各バッファ258.262の元の座標は、部分256及
び260が分離した別の文字か、1つのバッファ264
(第20図)に含まれて単一文字を表わすようにするべ
きかについて分割ゾロセッサ114が決めうるようにセ
ーブする。
リスティングの12頁は接続された文字の存在をテスト
する5IFTルーチンに関するものである。
そのルーチンは前に説明した工程204に関連する。関
連する高さ、幅等のノラメータの評価の後、1つの文字
だけであると5IFTルーチンが判断した場合、分割の
必要がなく、その文字は従来の文字認識のために認識プ
ロセッサ124に送られる。
リスティングの13頁乃至22頁は第6図のチャート1
18について説明したエンコード処理に関する詳細な工
程に関するものである。
第23頁及び第24頁のりスティングは、例えば、第7
A図及び第7B図に表わす文字を表現するバイナリを得
るために第6図のチャート118をデコードする詳細な
工程である。
リスティングの第25頁及び第26頁は、このプログラ
ムがフォトラン(FORTRAN)で書かれ、データ・
バイト又はワードを扱い、ここで説明する特定データを
単一ビット又はピクセルで記憶するために必要とするデ
ータ操作に関するものである。
リスティングの27頁及び28頁はフォトランに関する
データ操作の詳細な工程を含む。
リスティングの29頁及び3o頁はリスティングの11
頁で述べたPASTEルーチンに関する詳細な工程を示
す。
リスティングの31頁及び32頁はリスティングの12
頁にある5IFTルーチ/に関する詳細な工程を表わす
リスティングの33頁は、文字イメージが単一文字か結
合文字かを決定するのに使用するHTRANSルーチン
に関する。それは結合している文字″57#を表わす第
21図に示すような結合文字のために有益である。HT
RANSルーチンは角を検出できない対象物(第21図
)のヒストグラム分析を実行する。この形の物体268
のために、この物体の左側から右側への縦方向の走査を
したときに発生するピクセル変化の数を記録する。物体
268の場合、物体の中央部に′5”と7”を接続する
水平線には、はとんど遷移がないということがわかる。
一般に、この水平線の幅はこの実施例では約1黒ピクセ
ル幅である。そこで、分割を行うべき場所は物体の遷移
が最少のところであり、その部分が見つかると、その部
分は結合文字の最も狭蛎部分を表わす最少黒ピクセル数
を持つ部分である。
分割はその最も狭い部分で行われるべきであり、第21
図では数字“57”の間の水平部分の中にある。
リスティングの34頁及び35頁は第8図の工程206
について既に説明したJNTLOCルーチンに関するも
のである。
リスティングの36頁乃至41頁は既に説明した各処理
の更に詳細を示す。例えば、ルーチンREMJNTはリ
スティングの38頁から始まり結合文字間の接続を分離
するルーチンである。
リスティングの42頁乃至46頁は先に説明した各処理
部分の更に詳細を含、む。例えば、ルーチンZEROU
Tはりスティングの42頁に見られる。
【図面の簡単な説明】
第1図は、金額認識(C,A、R,)モジュールを含む
エントリ処理ユニット(EPU)と、イメージ・ディス
プレイ端末機(IDT)を接続しているデータ・エント
リ・プロセッサ(DEP)と、すべて企業内通信網(L
AN)によって相互に接続された二ンコード及びソート
・ユニツ) (ESU)とを表わす銀行業務システムの
ブロック形式の全体略図、 第2図は、第1図のEPUと、この発明の好ましい実施
例を含むC,A、R,モジュールとの詳細を示すブロッ
ク図、 第3図は、第1図のシステムで処理される書類の一例を
示す図、 第4図は、第2図のC,A、Rモジー−ルの更に詳細を
示すブロック図、 第5図は、この実施例におけるイメージ・データを構成
する複数のピクセル行及び列を示す図、゛第6図は、第
4図の分割プロセッサがいかに金額に対応するイメージ
・データを受信するかを示す図、 第7A図及び第7B図は、共に結合されて書類上の金額
に対するイメージ・データを表わす図、゛第8図は、後
の動作における文字認識を容易にするために、結合され
る文字を分割する処理に含まれている工程を一般的に示
した流れ図、第9図及び第10図は、対象物に関する記
録に存在するある関係を示す図、 第11図、第12図及び第13図は、検査ウィンドウに
対するある状況を示す図、 第14因は、第2の型の検査ウィンドウに対する状況を
示す図、 第15図は、対象物内の2つの記録を分離するために使
用される各種分割ベクトルを示す図、第16図は、2つ
の文字が結合される金額に対応するイメージ・データの
略図、 第17図は、分割(セグメント化)が行われた後におけ
る第16図に示すイメージ・データの略図、 第18図及び第19図は、数字”5”の部分を示す図、 第20図は、第18図及び第19図に示す部分がいかに
第20図の1文字として組合わされるかを示す図、 第21図は、この発明によって分割することができる結
合された“57”のような特定の結合対象物を示す図で
ある。 図中、10・・・銀行業務システム、12・・・エント
リ処理ユニット、14・・・データ・エントリ・プロセ
ッサ、14−1.14−2.14−3・・・イメージ・
ディスプレイ端末機、16・・・エンコード及びソート
・ユニット、18・・・企業内通信網、20・・・金額
リーグ・モジュール、26・・・書類。 出願代理人  斉 藤   勲 FtG、5 FIG、7A 060−10−I   Q   −100030It 
  O−81000100 3000Q   l   0  1  −1 −6 −
11  −1  8  −4 9901 1+   4
7  7  0  0  044  4   +   
l   I   OOr   I   OO−1−2−
10−2−2−1−1−3−199,Jl−2−1−1
f’)   −1−299014278〒0 −2 −
1  0  2 −4  蔗 8  べ?3..。 −1−1−2−20−1−i  −20−I   0 
 0  0  0  0  0  0  −10  −
1  10  0  0  0  169901 1+
01101+11? 001−1−5−1−10−i 27  19   G   −23−20−2−9、D
   −100−1−20−1−1FIG、7B FIG、18        FIG、19FIG、2
0        FIG、 21FIG、II   
       PIG、12FIG、 13     
    FIG、 14FIG、I5   、 FIG、16 トーt<−一一一一 一一一一−R−一

Claims (1)

  1. 【特許請求の範囲】 (1)文字走査の結果発生したデータ・ビットを分割す
    る方法であって、 (イ)1文字より多い文字かもしれない前記データ・ビ
    ットの個別グループを絶縁し、 (ロ)前記個別グループ内の第1及び第2のデータ・ビ
    ット・グループ間の結合の可能性をサーチする所定の基
    準に従って前記データ・ビットの個別グループを検査し
    、 (ハ)前記第1及び第2のデータ・ビット・グループを
    分離するために第2の所定の基準に従って分割ベクトル
    を選択し、 (ニ)前記選ばれた分割ベクトルに沿った前記結合にお
    いて前記第1及び第2のデータ・ビット・グループを分
    離する各工程から成るデータ・ビットの分割方法。 (2)(イ−1)前記絶縁する工程は所定の価に対し前
    記個別グループに関するデータ・ビットの所定の物理的
    パラメータをテストする工程を含む特許請求の範囲第1
    項記載の方法。 (3)(ロ−1)前記検査する工程は前記グループに関
    するデータ・ビットの物理的大きさから決定される所定
    の範囲で前記結合の可能性をサーチする工程を含む特許
    請求の範囲第1項記載の方法。 (4)前記サーチする工程は走査される前記文字と同一
    方向を有する前記データ・ビットの列に沿って行われる
    特許請求の範囲第3項記載の方法。 (5)前記データ・ビットはバイナリ“1”及び“0”
    から成り、 (ハ−1)前記選択する工程は、所定の範囲内にあり、
    関係対象物の所定の側に対し前記分割ベクトルの外端か
    らバイナリ“0”の道を提供するバイナリ“1”から成
    る最短長の分割ベクトルを捜出する工程を含み、 前記所定の範囲は次の方程式で与えられ、 MP−MP/2≦R≦(MP+MP/2) 上記方程式において、MPは前記データ・ビットの個別
    グループの中間点であり、Rは前記所定の範囲である特
    許請求の範囲第1項記載の方法。 (6)(ホ)前記方法は前記工程(ニ)から得られた前
    記第1及び第2のデータ・ビット・グループについて前
    記工程(イ)、(ロ)、(ハ)、(ハ−1)及び(ニ)
    を繰返す工程を含む特許請求の範囲第5項記載の方法。 (7)文字走査の結果発生したイメージ・データについ
    ての文字認識を容易にする方法であって、前記イメージ
    ・データは少くとも前記文字のイメージの部分に対応す
    るバイナリ“1”及び“0”から成る複数の記録の形で
    あり、 (イ)前記記録を少くとも1文字に表面上対応する各前
    記対象物にグループ化し、 (ロ)少くとも2つの文字を表面上含む前記対象物を絶
    縁し、 (ハ)所定の基準に従い前記対象物内の第1及び第2の
    イメージ・データ・グループ間の結合の可能性をサーチ
    するようにして前記工程(ロ)からの前記対象物を検査
    し、 (ニ)前記結合において前記第1及び第2のイメージ・
    データ・グループを分離するために第2の所定の基準に
    従って分割ベクトルを選択し、(ホ)個別対象物を形成
    するために前記工程(ニ)から選ばれた分割ベクトルに
    沿った前記結合において前記第1及び第2のイメージ・
    データ・グループを分離し、 (ヘ)文字認識を行うために前記工程(イ)及び前記工
    程(ホ)から文字認識回路に前記対象物を伝送する各工
    程から成る文字認識方法。 (6)(ロ−1)前記絶縁工程は発生した価に対して前
    記対象物に関するイメージ・データの所定の物理的パラ
    メータをテストする工程を含む特許請求の範囲第7項記
    載の方法。 (9)(ハ−1)前記検査する工程は前記対象物に関す
    るイメージ・データの物理的大きさから決定した所定の
    範囲で前記結合の可能性をサーチする工程を含み、 前記所定の範囲は次の方程式で与えられ、 MP−MP/2≦R≦(MP+MP/2) 前記方程式において、MPは前記データ・ビット個別グ
    ループの中間点であり、前記Rは前記所定の範囲である
    特許請求の範囲第7項記載の方法。 (10)(ハ−2)前記サーチする工程は結合の可能性
    を表わすバイナリ“1”及び“0”の特別のパターンを
    サーチするためにマスクを使用する工程を含む特許請求
    の範囲第9項記載の方法。 (11)前記サーチする工程は走査される前記文字と同
    一方向を有する前記データ・ビットの列に沿って行われ
    る特許請求の範囲第10項記載の方法。 (12)(ニ−1)前記選択する工程は前記所定の範囲
    内にあるバイナリ“1”から成る最短長の分割ベクトル
    を捜出する工程を含む特許請求の範囲第11項記載の方
    法。 (13)(ホ−1)前記分離する工程は、離れた記録は
    前記分離する工程を実行しないことを確認するために前
    記個別対象物を検査する工程を含む特許請求の範囲第7
    項記載の方法。 (14)(ホ−2)前記分離する工程は、接続されるべ
    き隣り合う記録である離れた記録の形成を避けるために
    前記分離する工程によって形成されるかもしれない前記
    離れた記録間にバイナリ“1”を加える工程を含む特許
    請求の範囲第13項記載の方法。 (15)(ニ−2)前記選択する工程は、所定の範囲内
    にあり、関係対象物の所定の側に対し前記分割ベクトル
    の外端からバイナリ“0”の道を提供するバイナリ“1
    ”から成る最短長の分割ベクトルを捜出する工程を含む
    特許請求の範囲第12項記載の方法。 (16)前記捜出する工程は前記イメージ・データの列
    について前記分割ベクトルを所定の角度に方向付けるこ
    とによって行われる特許請求の範囲第12項記載の方法
    。 (17)前記捜出する工程は前記分割ベクトルを角度9
    0°、45°、135°、60°及び120°に方向付
    けることによって行われ、前記角度90°、45°、1
    35°、60°及び120°は三角法的指定によって示
    され、前記イメージ・データの列は前記角度90°に整
    列される特許請求の範囲第16項記載の方法。 (18)文字走査から発生したデータ・ビットを分割す
    る方法であって、 (イ)所定の基準に従いデータ・ビット・グループ内の
    第1及び第2のデータ・ビット・サブグループ間の結合
    の可能性をサーチするために1以上の文字に関するもの
    かもしれない前記データ・ビット・グループについて検
    査ウィンドウを移動し、(ロ)所定の基準に従い前記第
    1及び第2のデータ・ビット・サブグループを分離する
    ために分割ベクトルを選択し、 (ハ)前記分割ベクトルに沿い前記結合において前記第
    1及び第2のデータ・ビット・サブグループを分離する
    各工程から成るデータ・ビットの分割方法。 (19)(イ)所定の基準に従いデータ・ビット・グル
    ープ内の第1及び第2のデータ・ビット・サブグループ
    間で結合の可能性をサーチするために1より多い文字の
    ものかもしれないデータ・ビット・グループに対して検
    査ウィンドウを移動し、(ロ)所定の基準に従い前記第
    1及び第2のデータ・ビット・サブグループを分離する
    ために分割ベクトルを選択し、 (ハ)前記分割ベクトルに沿い前記結合において前記第
    1及び第2のデータ・ビット・サブグループを分離する
    各工程から成る文字走査から発生したデータ・ビットの
    分割方法。 (19)(イ)文字を持つ書類を走査して前記文字に対
    応するバイナリ・イメージ・データを発生し、(ロ)前
    記書類に関するバイナリ・イメージ・データを個別対象
    物の形で提供し、各前記対象物はデータ・ビットのマト
    リックスから成り、各前記対象物は少くとも前記文字の
    1つに表面上対応し、(ハ)少くとも表面上2つの文字
    から成る前記対象物を絶縁し、 (ニ)前記工程(ハ)からの対象物の1つについて検査
    ウィンドウを移動して所定の基準に従い前記対象物の所
    定の範囲内で第1及び第2のデータ・ビット・サブグル
    ープ間の結合の可能性をサーチし、 (ホ)個別対象物の形成を検出したときに前記第1及び
    第2のデータ・ビット・サブグループを前記結合におい
    て分離し、 (ヘ)前記工程(ロ)及び(ホ)から文字認識装置に前
    記対象物を伝送して文字認識を行い、 前記所定の範囲は次の方程式で与えられ、 MP−MP/2≦R≦(MP+MP/2) 前記方程式において、MPは前記データ・ビットの個別
    グループの中間にあり、前記Rは前記所定の範囲である
    文字認識方法。 (20)前記データ・ビットはバイナリ“1”及び“0
    ”から成り、 (ニ−1)前記移動する工程は前記結合の可能性を表わ
    すバイナリ“1”及び“0”の特別なパターンのための
    前記検査ウィンドウを介してサーチするべくマスクを使
    用する工程を含む特許請求の範囲第19項記載の方法。 (21)(ホ−1)前記分離する工程は前記対象物内で
    前記第1及び第2のデータ・ビットのサブグループを分
    離するために第2の所定の基準に従い分割ベクトルを選
    択する工程を含む特許請求の範囲第19項記載の方法。 (22)前記データ・ビットはバイナリ“1”及び“0
    ”から成り、 (ホ−2)前記選択する工程は前記所定の範囲内にあり
    、前記分割ベクトルの外端から関係対象物の所定の側に
    バイナリ“0”の道を提供するバイナリ“1”から成る
    最短長の分割ベクトルを捜出する工程を含む特許請求の
    範囲第21項記載の方法。 (23)文字走査から発生したイメージ・データについ
    て文字認識を容易にする方法であって、前記イメージ・
    データは少くとも前記文字のイメージの部分に対応する
    バイナリ“1”及び“0”から成る複数の記録の形であ
    り、 (イ)各対象物が少くとも1文字に表面上対応する前記
    対象物に前記記録をグループ化し、 (ロ)表面上少くとも2文字からなる前記対象物を絶縁
    し、 (ハ)前記対象物内における第1及び第2のイメージ・
    データ・グループ間で結合の可能性のサーチにおいて前
    記工程(ハ)からの前記対象物を検査し、 (ニ)第2の所定の基準に従い分割ベクトルを選択して
    前記結合における前記第1及び第2のデータ・グループ
    を分離し、 (ホ)前記工程(ニ)から選ばれた分割ベクトルに沿っ
    た前記結合において前記第1及び第2のデータ・グルー
    プを分離して個別対象物を形成し、(ヘ)少くとも2文
    字を含む前記工程(ホ)からの前記第1及び第2のグル
    ープを絶縁し、 (ト)前記工程(ホ)からの前記グループ内の第3及び
    第4のイメージ・データ・グループ内の結合の可能性の
    ためのサーチにおいて前記所定の基準に従い前記工程(
    ホ)からの前記グループを検査し、(チ)前記第2の所
    定の基準に従い分割ベクトルを選択して前記結合におい
    て前記第3及び第4のイメージ・データ・グループを分
    離し、 (リ)前記工程(チ)から選ばれた分割ベクトルに沿っ
    た前記結合において前記第3及び第4のイメージ・デー
    タ・グループを分離して個別対象物を形成し、 (ヌ)前記工程(イ)、(ホ)及び(リ)からの前記対
    象物を文字認識するべく伝送して認識を行う各工程から
    成る文字認識を容易にする方法。 (24)文字走査から発生したイメージ・データ・ビッ
    トを受信する手段と、 1より多い文字のものかもしれない前記イメージ・デー
    タ・ビットの個別グループを絶縁する手段と、 前記グループ内の第1及び第2のイメージ・データ・ビ
    ット・グループ間の結合の可能性のためのサーチにおい
    て所定の基準に従い前記イメージ・データ・ビットの個
    別グループを検査する手段と、第2の所定の基準に従い
    分割ベクトルを選択して前記第1及び第2のイメージ・
    データ・ビット・グループを分離する手段と、 選ばれた分割ベクトルに沿った前記結合において前記第
    1及び第2のイメージ・データ・ビット・グループを分
    離する手段と、 文字を認識する手段と、 前記第1及び第2のイメージ・データ・ビット・グルー
    プを前記認識手段に伝送して文字認識を行う手段とから
    成る文字認識を容易にする装置。 (25)文字走査から発生したイメージ・データの文字
    認識を容易にする装置であって、前記イメージ・データ
    は少くとも前記文字のイメージの部分に対応するバイナ
    リ“1”及び“0”から成る複数の記録の形であり、 各対象物が少くとも1文字に表面上対応する前記対象物
    に前記記録をグループ化する手段と、表面上少くとも2
    文字を含む前記対象物を絶縁する手段と、 前記対象物内の第1及び第2のデータ・グループ間にお
    ける結合の可能性のサーチにおいて所定の基準に従い前
    記絶縁手段からの前記対象物を検査する手段と、 第2の所定の基準に従い分割ベクトルを選択して前記結
    合において前記第1及び第2のデータ・グループを分離
    する手段と、 前記選択する手段から選ばれた分割ベクトルに沿った前
    記結合において前記第1及び第2のデータ・グループを
    分離する手段と、 前記グループ化手段及び前記分離手段から文字認識プロ
    セッサに前記対象物を伝送して文字認識を行う手段とか
    ら成る文字認識を容易にする装置。 (26)前記絶縁手段は前記発生した価に対し前記対象
    物に関するイメージ・データの所定の物理的パラメータ
    をテストする手段を含む特許請求の範囲第25項記載の
    装置。 (27)前記テスト手段は結合の可能性を表わすバイナ
    リ“1”及び“0”の特別のパターンをサーチするべく
    マスクを含む特許請求の範囲第26項記載の装置。 (28)前記選択手段は所定の範囲内にあり、前記分割
    ベクトルの外端から関係対象物の所定の側にバイナリ“
    0”の道を提供するバイナリ“1”から成る最短長の分
    割ベクトルを捜出する手段を含み、 前記所定の範囲は次の方程式で与えられ、 MP−MP/2≦R≦(MP+MP/2) 前記方程式において、MPは前記データ・ビットの個別
    グループの中間点であり、前記Rは前記所定の範囲であ
    る特許請求の範囲第25項記載の装置。
JP60281281A 1984-12-17 1985-12-16 文字認識のためのイメージ・データを分離する方法及び装置 Pending JPS61145693A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US06/683,074 US4680803A (en) 1984-12-17 1984-12-17 Method and apparatus for isolating image data for character recognition
US683074 1984-12-17

Publications (1)

Publication Number Publication Date
JPS61145693A true JPS61145693A (ja) 1986-07-03

Family

ID=24742467

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60281281A Pending JPS61145693A (ja) 1984-12-17 1985-12-16 文字認識のためのイメージ・データを分離する方法及び装置

Country Status (2)

Country Link
US (1) US4680803A (ja)
JP (1) JPS61145693A (ja)

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6002799A (en) 1986-07-25 1999-12-14 Ast Research, Inc. Handwritten keyboardless entry computer system
US5504822A (en) * 1986-09-19 1996-04-02 Holt; Arthur W. Character recognition system
US5208869A (en) * 1986-09-19 1993-05-04 Holt Arthur W Character and pattern recognition machine and method
US5097517A (en) * 1987-03-17 1992-03-17 Holt Arthur W Method and apparatus for processing bank checks, drafts and like financial documents
WO1988002157A1 (en) * 1986-09-19 1988-03-24 Arthur Wheeler Holt Character and pattern recognition machine and method
US4817169A (en) * 1987-04-14 1989-03-28 Nippon Sheet Glass Co., Ltd. Page segmentor
US5040226A (en) * 1988-05-31 1991-08-13 Trw Financial Systems, Inc. Courtesy amount read and transaction balancing system
US4932065A (en) * 1988-11-16 1990-06-05 Ncr Corporation Universal character segmentation scheme for multifont OCR images
EP0446630A3 (en) * 1990-03-12 1993-02-24 International Business Machines Corporation Method and apparatus for segmenting characters in an amount field on a financial document
CA2037173C (en) * 1990-03-30 1996-01-09 Hirofumi Kameyama Character recognizing system
CA2092529A1 (en) * 1990-09-27 1992-03-28 Wolfgang Lellmann Process for extracting individual characters from raster images of a read-in handwritten or typed series of characters in free distribution
US5216725A (en) * 1990-10-31 1993-06-01 Environmental Research Institute Of Michigan Apparatus and method for separating handwritten characters by line and word
US5142589A (en) * 1990-12-21 1992-08-25 Environmental Research Institute Of Michigan Method for repairing images for optical character recognition performing different repair operations based on measured image characteristics
US5444793A (en) * 1993-06-15 1995-08-22 Ncr Corporation Method for detecting machine printed monetary amounts in binary images
US5737443A (en) * 1994-11-14 1998-04-07 Motorola, Inc. Method of joining handwritten input
AU690781B2 (en) * 1994-11-14 1998-04-30 Motorola, Inc. Method of splitting handwritten input
JP2939147B2 (ja) * 1994-12-29 1999-08-25 シャープ株式会社 手書き文字入力表示装置および方法
FR2729484B1 (fr) * 1995-01-16 1997-09-26 Totalgaz Snc Procede et dispositif de lecture d'elements d'identification portes par des bouteilles de gaz combustible liquefie a usage domestique, et leur utilisation
JPH08235310A (ja) * 1995-02-24 1996-09-13 Nec Corp 接触文字切り出し装置
US5692069A (en) * 1995-03-17 1997-11-25 Eastman Kodak Company Apparatus for performing character segmentation using slant histograms
US6363164B1 (en) 1996-05-13 2002-03-26 Cummins-Allison Corp. Automated document processing system using full image scanning
US9619841B2 (en) 1996-03-28 2017-04-11 Integrated Claims Systems, Llc Systems to assist in the creation, transmission, and processing of health insurance claims
US6003007A (en) * 1996-03-28 1999-12-14 Dirienzo; Andrew L. Attachment integrated claims system and operating method therefor
US20050276458A1 (en) 2004-05-25 2005-12-15 Cummins-Allison Corp. Automated document processing system and method using image scanning
US8162125B1 (en) 1996-05-29 2012-04-24 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US7903863B2 (en) 2001-09-27 2011-03-08 Cummins-Allison Corp. Currency bill tracking system
US7187795B2 (en) 2001-09-27 2007-03-06 Cummins-Allison Corp. Document processing system using full image scanning
US5956468A (en) * 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
US8478020B1 (en) 1996-11-27 2013-07-02 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US7519558B2 (en) 1997-08-27 2009-04-14 Ballard Claudio R Biometrically enabled private secure information repository
US5910988A (en) * 1997-08-27 1999-06-08 Csp Holdings, Inc. Remote image capture with centralized processing and storage
US8024269B1 (en) 1997-08-27 2011-09-20 Datatreasury Corporation Remote image capture with centralized processing and storage
US6256407B1 (en) * 1998-03-17 2001-07-03 Cummins-Allison Corporation Color scanhead and currency handling system employing the same
US6721442B1 (en) 1998-03-17 2004-04-13 Cummins-Allison Corp. Color scanhead and currency handling system employing the same
US6226636B1 (en) * 1998-11-20 2001-05-01 Philips Electronics North America Corp. System for retrieving images using a database
US7068832B1 (en) 1999-05-11 2006-06-27 The Chase Manhattan Bank Lockbox imaging system
US6389417B1 (en) * 1999-06-29 2002-05-14 Samsung Electronics Co., Ltd. Method and apparatus for searching a digital image
US8701857B2 (en) 2000-02-11 2014-04-22 Cummins-Allison Corp. System and method for processing currency bills and tickets
US7216106B1 (en) 2000-04-28 2007-05-08 Netdeposit, Inc. Method and system for processing financial instrument deposits physically remote from a financial institution
US7475040B2 (en) * 2000-04-28 2009-01-06 Netdeposit, Inc. Return item early notification and return
US7386511B2 (en) * 2000-04-28 2008-06-10 Netdeposit Inc. Methods and systems for processing financial instrument deposits
US7181430B1 (en) * 2000-04-28 2007-02-20 Netdeposit, Inc. Method and system for processing financial instrument deposits physically remote from a financial institution
US7647275B2 (en) 2001-07-05 2010-01-12 Cummins-Allison Corp. Automated payment system and method
US8437529B1 (en) 2001-09-27 2013-05-07 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8437530B1 (en) 2001-09-27 2013-05-07 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8428332B1 (en) 2001-09-27 2013-04-23 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8433123B1 (en) 2001-09-27 2013-04-30 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8944234B1 (en) 2001-09-27 2015-02-03 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
WO2003091849A2 (en) 2002-04-23 2003-11-06 The Clearing House Service Company L.L.C. Payment identification code system
US8171567B1 (en) 2002-09-04 2012-05-01 Tracer Detection Technology Corp. Authentication method and system
US8627939B1 (en) 2002-09-25 2014-01-14 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8725607B2 (en) 2004-01-30 2014-05-13 The Clearing House Payments Company LLC Electronic payment clearing and check image exchange systems and methods
US7336813B2 (en) * 2004-04-26 2008-02-26 International Business Machines Corporation System and method of determining image skew using connected components
GB2459223B (en) 2007-03-09 2012-07-11 Cummins Allison Corp Document imaging and processing system
US8538123B1 (en) 2007-03-09 2013-09-17 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8417017B1 (en) 2007-03-09 2013-04-09 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8009928B1 (en) * 2008-01-23 2011-08-30 A9.Com, Inc. Method and system for detecting and recognizing text in images
WO2010105327A1 (en) * 2009-03-18 2010-09-23 Tata Consultancy Services Limited Method, system and computer program for generating financial transaction instructions
US8437532B1 (en) 2009-04-15 2013-05-07 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8391583B1 (en) 2009-04-15 2013-03-05 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8929640B1 (en) 2009-04-15 2015-01-06 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8761511B2 (en) * 2009-09-30 2014-06-24 F. Scott Deaver Preprocessing of grayscale images for optical character recognition
FR2976387B1 (fr) * 2011-06-09 2018-11-09 Mbda France Procede et dispositif pour determiner automatiquement des lignes de crete d'une zone a hauteur variable.
US9141876B1 (en) 2013-02-22 2015-09-22 Cummins-Allison Corp. Apparatus and system for processing currency bills and financial documents and method for using the same
US11295308B1 (en) 2014-10-29 2022-04-05 The Clearing House Payments Company, L.L.C. Secure payment processing
US11042882B2 (en) 2015-07-01 2021-06-22 The Clearing House Payments Company, L.L.C. Real-time payment system, method, apparatus, and computer program
US11694168B2 (en) 2015-07-01 2023-07-04 The Clearing House Payments Company L.L.C. Real-time payment system, method, apparatus, and computer program
US11436577B2 (en) 2018-05-03 2022-09-06 The Clearing House Payments Company L.L.C. Bill pay service with federated directory model support

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3517387A (en) * 1965-10-24 1970-06-23 Ibm Character isolation apparatus
US3500325A (en) * 1966-01-19 1970-03-10 Ibm Apparatus for separating closely spaced characters in a character recognition machine
US3500324A (en) * 1966-07-27 1970-03-10 Ibm Analog segmentation apparatus
FR2073822A5 (ja) * 1969-12-31 1971-10-01 Ibm
US3629826A (en) * 1970-01-02 1971-12-21 Ibm Sectioning apparatus and method for character recognition systems
US3863218A (en) * 1973-01-26 1975-01-28 Hitachi Ltd Pattern feature detection system
US4013999A (en) * 1974-08-15 1977-03-22 Recognition Equipment Incorporated Single read station acquisition for character recognition
US4024500A (en) * 1975-12-31 1977-05-17 International Business Machines Corporation Segmentation mechanism for cursive script character recognition systems
US4461027A (en) * 1981-12-04 1984-07-17 Tokyo Shibaura Denki Kabushiki Kaisha Character separating system in use for an optical character reader

Also Published As

Publication number Publication date
US4680803A (en) 1987-07-14

Similar Documents

Publication Publication Date Title
JPS61145693A (ja) 文字認識のためのイメージ・データを分離する方法及び装置
US5193121A (en) Courtesy amount read and transaction balancing system
US4932065A (en) Universal character segmentation scheme for multifont OCR images
US6249604B1 (en) Method for determining boundaries of words in text
US5119433A (en) Method and system for locating the amount field on a document
US5544259A (en) Apparatus and method for separating handwritten characters by line and word
JP3925971B2 (ja) 統合同値類の作成方法
EP0113410B1 (en) Image processors
US5631984A (en) Method and apparatus for separating static and dynamic portions of document images
US4685141A (en) Method and system for finding image data associated with the monetary amount on financial documents
EP0063454B1 (en) Method for recognizing machine encoded characters
EP0128950B1 (en) Apparatus and method for processing documents
EP1358622B1 (en) Identification , separation and compression of multiple forms with mutants
EP0790573B1 (en) Document processor and document processing method
US5325447A (en) Handwritten digit normalization method
EP0555023B1 (en) Pattern recognition
US5142589A (en) Method for repairing images for optical character recognition performing different repair operations based on measured image characteristics
JPH05282495A (ja) 比較方法
EP0764308A1 (en) System and method for automatic page registration and automatic zone detection during forms processing
GB1584096A (en) Optical character recognition system
EP0154449A2 (en) Real time character thinning system
US5926564A (en) Character recognition method and apparatus based on 0-1 pattern representation of histogram of character image
JPH04502526A (ja) 像認識
Balm An introduction to optical character reader considerations
JP3020662B2 (ja) 文字行切り出し装置及び文字認識装置