JPS6154575A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPS6154575A
JPS6154575A JP59176027A JP17602784A JPS6154575A JP S6154575 A JPS6154575 A JP S6154575A JP 59176027 A JP59176027 A JP 59176027A JP 17602784 A JP17602784 A JP 17602784A JP S6154575 A JPS6154575 A JP S6154575A
Authority
JP
Japan
Prior art keywords
format
information
slip
format information
image memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59176027A
Other languages
English (en)
Inventor
Masahiro Kojima
雅広 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59176027A priority Critical patent/JPS6154575A/ja
Publication of JPS6154575A publication Critical patent/JPS6154575A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は光学文字読取装置に係り、特に文字が古かれて
いる帳票の識別に関するものである。
光学文字読取装置はOCRと呼ばれ、大量のデータを取
り扱うデータ処理システムに於いて広く使用されている
〔従来の技術〕
従来OCRによりデータを読み取る場合、データの四か
れている111≦票の物理的な情報(寸法や連■等)や
論理的なデータ処理条件等の情報はフォーマット情報と
して予め設定されている。
処理帳票の種類が複数個有る場合には、帳票上に設けら
れた帳票識別フィールドの内容により、フォーマット定
義体より該当するフォーマ・ノド情報に切替えて文字認
識処理を行う。此の時帳票識別フィールドに記入されて
いる識別コード(iffl常は数字)を認識し、該当す
るフォーマット11′f報を探索する。此の結果該当す
るフォーマットが存在しない場合は、入力した帳票の全
ての情報を棄却し、処理不可能としている。
此の為、其の後処理不可能となった帳票のデータをキー
ボード等から入力して救済する処理が必要となり、帳票
識別フィールドの処理の良否により多くの帳票データが
処理されなくなるばかりでなく、救済に多(の無駄な時
間が浪費されると云う欠点があった。
〔発明が解決しようとする問題点〕 本発明の目的は上記従来の欠点を除去し、寸法演算部を
設げ、此の寸法演算部により算出された寸法に近似する
帳票フォーマットが存在する場合には処理不可能とはせ
ず処理の継続を可能とすることである。
〔問題点を解決するための手段〕
問題点を解決するための手段は、帳票上の画像情報を2
値化する走査部、該2値化情報を記録する画像メモリ、
該帳票の読取りに関する種々の情報を定義したフォーマ
ット定義体、該フォーマット定義体から目的の帳票のフ
ォーマットを探索するフォーマット制御部、該フォーマ
ット情報に従って該画像メモリから文字画像を一文字づ
つ切出し、予め設けられた認識用の辞書を参照して文字
を認識する認識部、認識結果を出力する為の出力用記録
媒体、及び上記各部を制御する主制御部より構成される
文字読取装置に於いて、該フォーマット情報で設定され
該帳票上に存在する帳票識別フィールドの内容により複
数個の該フォーマット情報に跨がって読取り処理を行う
場合に発生する該帳票識別フィールドの認識過誤や認識
不能による処理不能時、該画像メモリ上に格納した情報
により帳票寸法を算出する寸法算出部を設けることによ
り、求められた寸法に近似する該フォーマット定義体上
の該フォーマット情報を探索し、探索された該フォーマ
ット1f’J報が一個の場合には該フォーマット情報に
より読取り処理を行い、複数個存在する場合には近似す
る該フォーマット情報の帳票識別番号群と該画像メモリ
の内容を表示する表示部により打鍵操作を行って希望す
る該帳票識別番号を選択し、選択された該帳票識別番号
に対する該フォーマット情報により5タコ取り処理を行
うことにより達成される。
〔作用〕
本発明に依ると帳票の種類を決定する情報として予め設
定された帳票フォーマット情報内の帳票寸法をフォーマ
ット情報探索の項目とし”ζ利用し、より確実に動作を
行う帳票フォーマット決定手段として、画像メモリ上に
取り込まれた情報により寸法算出部から帳票寸法を算出
し、比較型口とする(、1)にする為従来方式のOCR
に比しより6′n゛実で効率の良い文字読取装置が実現
出来ると云う効果が生まれる。
〔実施例〕
第1図は本発明に依る文字読取装置の一実施例を示ず図
である。
第2図はフォーマット定義体内に設定されているフォー
マット定義内容である。
図中、MCNTは主制御部、5CANは走査部、MEM
aは画像メモリ、DIMは寸法算出部、DImPLAY
は表示部、K E Yは打鍵部、RECOGは認識部、
DICは認識用辞書、MEMbは切出しメモリ、M I
F、 M cはフォーマット定義体、F−CNTはフォ
ーマ・ノド制御部、OUTは出力用外部記録媒体である
フォーマット定義体MEMcに格納されているフォーマ
ット定義内容は第2図に示す様に各帳票処理制御情報毎
に、帳票制御情報長、帳票識別番号、帳票横寸法、36
1寸法、及びフィールド定義情報が用意されている。
帳票S HE E T上に書かれた記録情報は走査部5
CANにより光学センサを介して読み取られ、2値化さ
れた結果が画像メモ’) M IE M aに格納され
る。主制御部M CN Tでは、予め決定されている手
順に従ってフォーマット定コ(体M lu +’/+ 
(+上の初1すIフォーマットI’i°7報内に存在す
る帳票識別フィールド情t[jを求め、此れにより定義
されているIII;票識別フィール1゛の位置情(・[
4を認識部RIE COGに送出する。
認識部RE COGでは、画(j(−メモリMIJLM
a上の該当する文字画像を切出しメモリMEMbに格納
し、認識用辞書1) I Cと照合する。
照合結果はフォーマット制御部F−CN Tに送られ、
3亥当する1賑票フォーマノI・をj栗ず。若し該当す
る11四票フA・−マットが見−フカ)れば11亥当す
る11旧票フォーマ・ノドは主制御部MCNTに送出さ
れ、。
其の帳票の読取り(認識)処理を行う。
若しJ亥当する11収票フォーマノ1−力)見つからな
い場合には、寸法算出部DIMに対し11法算出を指令
する。寸法算出部DIMでは第3図に示す様な画像メモ
リMEMaに格納されている情報の横寸法と縦寸法を算
出する。
第3図ば画像メEすMEMaに格納されている情報の横
寸法と:fi(寸法を算出する方法を説明する為の図で
ある。
第3図に於いて、斜’ljh’、で囲ま11.た一番外
側の矩形部分は画像メモリの大きさを示し、斜1.5H
部は黒部分を表し、中の白い矩形部分は読込まれた帳票
イメージを表し、此処の部分の左上に書かれている数字
は帳票識別1114号を、其の他の数字、アルファべ・
7トは吉き込まれた帳票イメージを夫々表し、・印は書
込み開始位置を表す。
此の占込み開始位置から走査し、X方向に対し黒から白
への変換点x1と白から黒への変換点×2の間の距離X
を求め、更に前記変換点x1からY方向に対し白から黒
への変換点¥1と前記変換点×1との間の距離Yを求め
る。
此の場合距離X、及びYは走査部SCΔNの記録密度に
換算して求める。尚実際には変換点X1、×2 、及び
Ylは唯一の点として求められることばな(数点の平均
値として求められるのが習通である。
此の様にして得られた寸法情報に詰づき、再度フォーマ
ット制御部F−CNTに対して近似する帳票寸法を有す
る11す;票フォーマット情報の探索依頼を行う。
フォーマット制御部F−CNTでは近似する帳票フォー
マットを探索し、存在する場合には其の個数と帳票識別
番号を主制御部MCNTに報告する。
主制御部MCNTは若し報告された個数がOである時は
処理不可能として処理し、若し1個である時は其の報告
された帳票識別番号に対応する帳票フォーマットの送出
をフォーマット制御部F−CNTに依頼し、送られて来
たフォーマット情報に従って其の帳票の読取り(認識)
処理を行う。
又若し複数の帳票識別番号が有ると報告された時は、画
像メモリMEMaに格納されている情報内容を表示部D
I9PLAYに表示し、併せて報告された複数の帳票識
別番号も表示し、使用者がこの表示内容を見て選択する
。使用者・は打鍵部KBYを介して選択された帳票識別
番号に従ってフォーマット制御部F−CNTに対し該当
する帳票フォーマットの送出を依[j L、送出された
帳票フォーマットに従って帳票の読取り(認識)処理を
行う。上記動作をフローチャート形式で表したものが第
4図である。
尚走査部5CANが画像メモ’JMEMaに古込む際に
帳票の横寸法、縦寸法を求めるようにすることも出来る
。此の場合各ライン情報を画像メモリMEMaに」込み
ながら全ラインの平均を取ることが出来るので高速度で
正確な寸法を算出出来る利点がある。
〔発明の効果〕
以上詳細に説明した様に本発明によれば、帳票識別の二
次手段として帳票寸法を利用する為従来のOCRに比し
より確実で効率の良い文字読取装置が実現出来ると云う
大きい効果がある。
【図面の簡単な説明】
第1図は本発明に依る文字読取装置の一実施例を示す図
である。 第2図はフォーマット定義体内に設定されているフォー
マット定養内容である。 第3図は画像メモリMEMaに格納されている1i’J
 tHの横寸法と縦寸法を算出する方法を説明する為の
図である。 第4図は本発明に依る文字読取装置の動作を説明する為
のフローチャート形式である。 図中、MCNTは主制御部、5CANは走査部、MEM
aは画像メモリ、DrMは寸法算出部、D[pt、ΔY
は表示部、KEYは打鍵部、RECOGは認識部、DE
Cは認識用辞書、MEMbは切出しメモリ、MEMcは
フォーマット定義体、F−CNTはフォーマット制御部
、OUTは出力用外部記録媒体である。 茶 1 囚

Claims (1)

    【特許請求の範囲】
  1. 帳票上の画像情報を2値化する走査部、該2値化情報を
    記録する画像メモリ、該帳票の読取りに関する種々の情
    報を定義したフォーマット定義体、該フォーマット定義
    体から目的の帳票のフォーマットを探索するフォーマッ
    ト制御部、該フォーマット情報に従って該画像メモリか
    ら文字画像を一文字づつ切出し、予め設けられた認識用
    の辞書を参照して文字を認識する認識部、認識結果を出
    力する為の出力用記録媒体、及び上記各部を制御する主
    制御部より構成される文字読取装置に於いて、該フォー
    マット情報で設定され該帳票上に存在する帳票識別フィ
    ールドの内容により複数個の該フォーマット情報に跨が
    って読取り処理を行う場合に発生する該帳票識別フィー
    ルドの認識過誤や認識不能による処理不能時、該画像メ
    モリ上に格納した情報により帳票寸法を算出する寸法算
    出部を設けることにより、求められた寸法に近似する該
    フォーマット定義体上の該フォーマット情報を探索し、
    探索された該フォーマット情報が一個の場合には該フォ
    ーマット情報により読取り処理を行い、複数個存在する
    場合には近似する該フォーマット情報の帳票識別番号群
    と該画像メモリの内容を表示する表示部により打鍵操作
    を行って希望する該帳票識別番号を選択し、選択された
    該帳票識別番号に対する該フォーマット情報により読取
    り処理を行うことを特徴とする文字読取装置。
JP59176027A 1984-08-24 1984-08-24 文字読取装置 Pending JPS6154575A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59176027A JPS6154575A (ja) 1984-08-24 1984-08-24 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59176027A JPS6154575A (ja) 1984-08-24 1984-08-24 文字読取装置

Publications (1)

Publication Number Publication Date
JPS6154575A true JPS6154575A (ja) 1986-03-18

Family

ID=16006444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59176027A Pending JPS6154575A (ja) 1984-08-24 1984-08-24 文字読取装置

Country Status (1)

Country Link
JP (1) JPS6154575A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006155551A (ja) * 2004-10-26 2006-06-15 Canon Inc データ処理装置、ネットワークシステム、制御方法、及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006155551A (ja) * 2004-10-26 2006-06-15 Canon Inc データ処理装置、ネットワークシステム、制御方法、及びプログラム

Similar Documents

Publication Publication Date Title
US7295694B2 (en) MICR-based optical character recognition system and method
US8005300B2 (en) Image search system, image search method, and storage medium
JP2575539B2 (ja) 書類上の金額フィールドの位置特定方法および識別方法
US4201978A (en) Document processing system
US5280544A (en) Optical character reading apparatus and method
JPH04321183A (ja) ファイリング装置の文書登録方法
US6320983B1 (en) Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein
JP3078318B2 (ja) 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置
US4797940A (en) Optical character reader
EP1202213B1 (en) Document format identification apparatus and method
JPH08161436A (ja) 領収書読取装置
JPH07182448A (ja) 文字認識方法
JP2003091730A (ja) 画像照合装置、画像照合方法および画像照合プログラム
JPS6154575A (ja) 文字読取装置
JPS5841542B2 (ja) 光学式文字読取装置
US6052494A (en) Image filing apparatus and method for displaying a retrieval result list representing the retrieval of a stored document image or for displaying the index of a document image retrieved by retrieval means
JP4221960B2 (ja) 帳票識別装置及びその識別方法
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
CN101303731B (zh) 印刷线生成方法
JPH09114926A (ja) オンライン文字認識における入力文字大分類方法および装置
JP2784004B2 (ja) 文字認識装置
JPS5875278A (ja) 文字・記号認識装置
JPH02230366A (ja) 帳票認識装置
JP3310063B2 (ja) 文書処理装置
JP2878772B2 (ja) 光学的文字読取装置