JPS62177686A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPS62177686A
JPS62177686A JP61019462A JP1946286A JPS62177686A JP S62177686 A JPS62177686 A JP S62177686A JP 61019462 A JP61019462 A JP 61019462A JP 1946286 A JP1946286 A JP 1946286A JP S62177686 A JPS62177686 A JP S62177686A
Authority
JP
Japan
Prior art keywords
image
format
document
identification number
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61019462A
Other languages
English (en)
Inventor
Hiroyuki Harashima
原島 裕之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61019462A priority Critical patent/JPS62177686A/ja
Publication of JPS62177686A publication Critical patent/JPS62177686A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は光学的文字読取装置(以下OCRという)にか
かり、特にフォーマットの異なる帳票を混在させて処理
することのできるOCRに関する。
(発明の技術的背景とその問題点〕 フォーマットの異なる帳票を混在させた状態で読取り処
理可能なOCRが知られている。
従来のこめ種のOCRにおいて処理が可能な条件は次の
ようである。
■ 帳票識別番号(以下10という)を帳票上の同−位
置に記すこと。
■ 混在処理する帳票はその大きさ、紙質、紙厚および
色が同一で°あること。
このような条件を要することから10が付されていない
帳票は混在処理が不可能となる。
第5図は従来にOCRに用いられる帳票とその帳票の読
取行に対するフォーマット情報を示したものである。
まずフォーマットの異なる帳票100と帳票110とが
混在する場合の処理方法について説明する。第5図(a
)から明らかなように帳票100においてはその読取行
102が帳票100のほぼ中央にあり、第5図(b)に
示す帳票110においてはその読取行112は下部に位
置している。このようなフォーマットの賃なる帳票の読
取りにおいてはID101および111をそれぞれの帳
票の所定の部分ずなわら、本例の場合には帳票の右上部
の所定位置に記すようにしている。本例の場合には帳票
100にはIDとして01が、帳票110にはIDとし
て02が付されておりこのIDをOCRで読取ることに
より帳票は識別される。
ここで帳票100と110とはサイズ、組質および紙厚
等が同一である必要があり、しかもID101と111
とは同一位置になければならない。
このようなフォーマットの異なる帳票100と111と
は第6図に示ずフォーマット情報103および113に
従ってそれぞれの帳票に対応して行の位置や文字の位置
がOCRに与えられ、それに従っ“C読取られる。
このように従来のOCRにあっては帳票の読取りに際し
てはフォーマットごとに所定位置にIDを記してこのI
Dを識別することによりフォーマット情報を得、これに
より帳票の読取りをおこなっている。
したがって帳票にIDを付さない限りフォーマットの異
なる帳票は混在処理不可能であり、大量に読取り処理し
なければならない場合にはあらかじめ帳票フォーマット
ごとに仕分けしておかなければならない。
したがって従来のOCRによる混在処理においては処理
が複雑になってしまうという不都合がある。
〔発明の目的〕
本発明は上記事情を′Jg慮してなされたもので、フォ
ーマットの異なる帳票であってもそれが同一サイズの帳
票である限り帳票にIDを記すことなく混在して読取り
処理が可能なOCRを提供することを目的とする。
〔発明の概要〕
本発明にかかる光学的文字読取装置においては、白紙帳
票イメージを符号化し、フォーマット毎に異なる識別番
号を付して格納する帳票辞書と、処理される帳票のイメ
ージを格納するイメージバッファと、イメージバッファ
内の帳票イメージおよび帳票辞書内に格納された白紙帳
票イメージを照合し、照合が取れたフォーマットの識別
番号を出力する帳票認識部と、処理される帳票の読取行
のフォーマット情報を識別番号に対応づけて格納するフ
ォーマット情報記憶手段とを具備し、帳票認識部から出
力される識別番号に対応するフォーマット情報をフォー
マツミル情報記憶手段から検索し、このフォーマット情
報に基づいてイメージバッファ内に格納された帳票の読
取り処理をすることを特徴としている。
〔発明の実施例〕
以下本発明を図示する実施例に基づいて詳細に説明する
第1図は本発明の一実施例にかかるOCRの構成ブロッ
ク図である。
本装置は帳票を搬送走査し、光電変換をおこなう搬送走
査部300と、光電変換された帳票イメージを格納する
イメージバッファ301と、イメージバッファ301よ
り文字を切出し認識をおこなう文字認識部302と、帳
票の白紙状態のイメージをデータ圧縮して格納している
帳票辞書303と、帳票辞!!303の帳票イメージを
データ伸張し、白紙帳票イメージに変換するデータ変換
部304とデータ変換部304で変換された帳票イメー
ジ(帳票辞書)と光電変換されたイメージバッファ30
1内のイメージとの照合をおこない照合がとれた帳票辞
書の識別番号を出力する帳票認識部305と、装置全体
の制御を司る制御部306と、読取られるべき各帳票の
読取行のフォーマット情報を格納するフォーマットバッ
ファ307とを備えている。
なお帳票辞書303にはフォーマット毎に異なる識別番
号が属性としてず」されて格納されている。
第2図は本発明によるOCRによって読取られるFA票
を示したものであり、それぞれフォーマットの異なる帳
票200と帳票210とが示されている。
なお帳票200(第2図(a))と210(第2図(b
))とはそれぞれ読取文字が印字(または記入)されて
いない状態(以下白紙という)であり、読取文字が印字
された状態の帳票はそれぞれ201(第2図(C))お
よび211(第2図(d))として示される。なおそれ
ぞれの読取行は202および212どして示されており
、文字枠や「振込内J 「領収書」の文字はドロップア
ウトカラーでない黒色で印刷されている。
第3図は第1図に示したOCRの帳票辞書303の内部
構成の一部を示した概念図である。
ここでは文字枠や帳票名を含む白紙帳票イメージを符号
化し、白および黒の占める長さくランレングス)として
データ圧縮した帳票イメージ400とその属性としての
識別番号401とから構成されている。
また第4図は第2図(C)に示す帳票201がイメージ
バッファ301に格納された状態を示す概念図である。
次に第1図に示すOCRの動作を説明する。
本発明によるOCRでは第2図に示される帳票からも明
らかなように、IDが付されていない。
したがってa在する帳票の認識方法は従来の方法と異な
る。搬送走査部300は第2図に示す帳票201および
211を搬送走査し、帳票イメージを第4図に示される
ようにイメージバッファ301に格納する。
ここで制御部306は帳票認識部305によりイメージ
バッファ301に格納された帳票イメージから帳票を識
別する制御指令を発する。
この指令に応答する帳票認識部305は、帳票辞書30
3に格納されている各種の帳票イメージ(辞書データ)
を順次データ変換部304を介してデータ伸張し取出し
てくる。そしてイメージバッファ301に格納された帳
票イメージとの間で論理演算を行い白紙イメージにおけ
る照合する。
この場合、帳票上のデータについては一致がとれないが
所定値以上一致したとぎは特定の帳票であると判断する
この際帳票辞N303から取出された帳票の白紙イメー
ジとイメージバッファ301に格納された帳票イメージ
の白紙イメージとの間で照合が取れた場合、その帳票辞
書の属性である識別番号が制御部306に出力される。
帳票辞書303内に格納される各種帳票の白紙イメージ
にはおのおの識別番号が付されているため、イメージバ
ッファ内から入力される白紙帳票イメージとの照合が取
れた場合にこの識別番号を出力すればよい。
このようにしてイメージバッファ301に入力された帳
票の識別が完了する。ここで制御部306は入力された
識別番号に相当する帳票の読取行のフォーマットをフォ
ーマットバッファ307より取出し文字認識部302へ
出力する。
このように制御部306が識別番号を検索キーとしてフ
ォーマットバッファ307からフォーマット情報を検索
する。
文字認識部302は入力したフォーマットバッファに従
ってイメージバッフ?301に格納されたイメージを走
査し、文字を切出しその文字を認識して読取処理を完了
する。
以上の実施例においてはフォーマット情報をバッフ7メ
モリに記憶させているが、フロッピーディスク等のあら
ゆる記憶手段を用いることができる。
〔発明の効果〕
以上実施例に基づいて詳細に説明したように、本発明に
よる光学的文字読取装置ではあらかじめ帳票辞書を用意
し、各種の白紙帳票イメージを識別番号を付して格納し
ておき、読取った白紙帳票イメージを抽出してこの帳票
辞書内の格納イメージと照合を行って照合が取れた場合
にその識別番号を抽出するような(8成としている。そ
してこの抽出された識別番号によりフォーマット情報を
選択して帳票の読取処理を行うようにしているため、帳
票にあらかじめIDを付すことなく同一サイズの帳票の
混在処理が可能となる。
したがってフォーマットの異なる帳票を大量に読取処理
する場合においてもフォーマット毎に仕分けすることな
く読取りが可能となるため処理能力が大幅に向上する。
【図面の簡単な説明】
第1図は本発明の一実施例にかかるOCRの構成ブロッ
ク図、第2図は本発明に用いられる帳票のフォーマット
図、第3図は本発明に用いられる帳票辞書内の格納状態
を示す概念図、第4図は本発明に用いられるイメージバ
ッファ内の格納状態を示す概念図、第5図は従来のOC
Rに用いられる帳票のフォーマット図、第6図はフォー
マット情報を示す図である。 200.210・・・帳票、202.212・・・読取
行、300・・・搬送走査部、301・・・イメージバ
ッファ、302・・・文字認識部、303・・・帳票辞
書、304・・・データ変換部、305・・・帳票認識
部、306・・・制御部、307・・・フォーマットバ
ッファ部。 出願人代理人  佐  藤  −柑 第1図 第3図     第4図 第2図

Claims (1)

    【特許請求の範囲】
  1. 白紙帳票イメージを符号化し、フォーマット毎に異なる
    識別番号を付して格納する帳票辞書と、処理される帳票
    のイメージを格納するイメージバッファと、前記イメー
    ジバッファ内の帳票イメージおよび前記帳票辞書内に格
    納された白紙帳票イメージを照合し、照合が取れたフォ
    ーマットの識別番号を出力する帳票認識部と、処理され
    る帳票の読取行のフォーマット情報を前記識別番号に対
    応づけて格納するフォーマット情報記憶手段とを具備し
    、前記帳票認識部から出力される識別番号に対応するフ
    ォーマット情報を前記フォーマット情報記憶手段から検
    索し、このフォーマット情報に基づいて前記イメージバ
    ッファ内に格納された帳票の読取り処理をすることを特
    徴とする光学的文字読取装置。
JP61019462A 1986-01-31 1986-01-31 光学的文字読取装置 Pending JPS62177686A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61019462A JPS62177686A (ja) 1986-01-31 1986-01-31 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61019462A JPS62177686A (ja) 1986-01-31 1986-01-31 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPS62177686A true JPS62177686A (ja) 1987-08-04

Family

ID=11999991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61019462A Pending JPS62177686A (ja) 1986-01-31 1986-01-31 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS62177686A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02116986A (ja) * 1988-10-26 1990-05-01 Nec Corp 光学的文字認識装置
JP2013196611A (ja) * 2012-03-22 2013-09-30 Fuji Xerox Co Ltd 帳票判別装置及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02116986A (ja) * 1988-10-26 1990-05-01 Nec Corp 光学的文字認識装置
JP2013196611A (ja) * 2012-03-22 2013-09-30 Fuji Xerox Co Ltd 帳票判別装置及びプログラム

Similar Documents

Publication Publication Date Title
JP2553608B2 (ja) 光学文字読取装置
US4989258A (en) Character recognition apparatus
CN100540156C (zh) 利用改进的条码读取处理邮件项目的方法
US20060291692A1 (en) Information processing apparatus having learning function for character dictionary
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
JPS61227483A (ja) 文書の読み取り,処理及び圧縮装置
CN111860524A (zh) 一种数字档案智能分类的装置及方法
JPS62177686A (ja) 光学的文字読取装置
JP2000029983A (ja) 文書読取装置
JPH0291789A (ja) 文字認識方法
JP2001331764A (ja) 文字認識方法
JPS59158482A (ja) 文字認識装置
JPS59103177A (ja) 名刺読取装置
JPS5949671A (ja) 光学的文字読取装置
JP2784004B2 (ja) 文字認識装置
JPH07152856A (ja) 光学的文字読取装置
JPS6336389A (ja) 文字読取装置
JPS6095689A (ja) 光学的文字読取装置
JPS63257081A (ja) 文書入力方式
JPS6143383A (ja) 文字認識装置
JP3720405B2 (ja) 領域識別装置及び方法
JPH04251395A (ja) 光学的文字図形読取装置
JPS62169289A (ja) 光学文字読取装置
JP2002222195A (ja) 文書選別装置及び文書選別方法
JPH01199285A (ja) 光学的文字読取装置