JPH07334610A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPH07334610A
JPH07334610A JP6126106A JP12610694A JPH07334610A JP H07334610 A JPH07334610 A JP H07334610A JP 6126106 A JP6126106 A JP 6126106A JP 12610694 A JP12610694 A JP 12610694A JP H07334610 A JPH07334610 A JP H07334610A
Authority
JP
Japan
Prior art keywords
unit
image
correction
threshold value
read information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6126106A
Other languages
English (en)
Inventor
Masaaki Masuda
正昭 増田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6126106A priority Critical patent/JPH07334610A/ja
Publication of JPH07334610A publication Critical patent/JPH07334610A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 認識結果のチェックやリジェクト訂正等を容
易に行える光学的文字読取装置を提供する。 【構成】 各光学的文字読取機(OCR)2で読み取ら
れた読取情報は、中央制御装置(管理手段)1により各
訂正端末装置(訂正手段)3に振り分けられ、読取情報
の訂正に供される。訂正端末装置3の選択部により閾値
を選択すると、中央制御装置1はその閾値を設定し、O
CR2の2値化部は設定された閾値を基に多値イメージ
を2値化し、訂正端末装置3の表示部に濃度が最適化さ
れた2値イメージが表示される。認識結果と実際の帳票
との照合を行わなくても濃度が最適化された2値イメー
ジとの照合により、認識結果のチェックやリジェクト訂
正が可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学的文字読取装置に
関し、より詳しくはリジェクト訂正の効率向上に関す
る。
【0002】
【従来の技術】従来より光学的文字読取装置では、帳票
に記入された文字等について誤読無しに完全な文字の認
識結果を得ることは困難であるため、帳票のイメージを
CRTディスプレイ等に表示して、オペレータによりチ
ェックやリジェクト訂正等を行うようにしている。
【0003】
【発明が解決しようとする課題】しかしながら、帳票に
記入された文字に掠れや潰れがあると、イメージで文字
を確認することが困難となるため、認識結果を実際の帳
票と照合しなければならなくなり、チェックやリジェク
ト訂正が煩雑となるという問題があった。このため、筆
記具を指定するなどして、ある程度記入される文字の濃
度を管理する場合もあるが、筆記具の種類が制限される
という欠点を有することになる。
【0004】また、流通業界,金融業界等では、各支店
からの帳票を事務センターで集計し、各支店の業務を管
理することが行われているが、帳票そのものを郵送して
管理していたため、そのために人手と時間を要し、迅速
確実な集計を行えないという問題もあった。
【0005】そこで、本発明は、上記事情に鑑みてなさ
れたものであり、認識結果のチェックやリジェクト訂正
等を容易に行える光学的文字読取装置を提供することを
目的とする。
【0006】
【課題を解決するための手段】請求項1記載の光学的文
字読取装置は、帳票の多値イメージを検出するイメージ
検出手段と、検出された多値イメージを記憶する記憶手
段と、初期設定された閾値又は再設定された閾値を基に
前記記憶手段が記憶する多値イメージを2値化する2値
化手段と、この2値化手段により得られた2値イメージ
に対し文字認識処理を行って帳票に記入された文字の認
識結果を得る認識手段と、前記2値化手段により得られ
た2値イメージを表示する表示手段と、選択操作に基づ
いて閾値を再設定して前記2値化手段に2値化処理を行
わせる制御手段とを有することを特徴とするものであ
る。
【0007】請求項2記載の光学的文字読取装置は、帳
票に対する読取処理により読取情報を得る任意数の光学
的文字読取手段と、読取情報に対して訂正処理を行う任
意数の訂正端末手段と、前記各光学的文字読取手段によ
って得られた読取情報を前記各訂正端末手段に振り分け
て訂正を行わせる管理手段とを有することを特徴とする
ものである。
【0008】請求項3記載の光学的文字読取装置は、前
記光学的文字読取手段は、帳票の多値イメージを検出す
るイメージ検出部と、検出された多値イメージを記憶す
るイメージ記憶部と、初期設定された閾値又は再設定さ
れた閾値を基に前記イメージ記憶部が記憶する多値イメ
ージを2値化する2値化部と、この2値化部により得ら
れた2値イメージに対し文字認識処理を行って帳票に記
入された文字の認識結果を得る認識部とを有し、前記訂
正端末手段は、前記2値化部により得られた2値イメー
ジを表示する表示部と、閾値を選択する選択部とを有
し、前記管理手段は、各光学的文字読取手段で得られた
認識結果及び2値イメージを含む読取情報を記憶する読
取情報記憶部と、この読取情報記憶部が記憶する読取情
報を前記訂正端末手段に送出し、前記選択部により閾値
が選択された場合は、その選択された閾値を再設定して
前記2値化部に2値化を行わせて得られた2値イメージ
を前記読取情報記憶部に記憶して記憶内容を更新すると
ともに、その2値イメージを前記訂正端末手段に送り、
その訂正端末手段により読取情報が訂正された場合は、
その訂正情報を基に前記読取情報記憶部の記憶内容を訂
正する制御部とを有することを特徴とするものである。
【0009】請求項4記載の光学的文字読取装置は、前
記帳票の2値イメージを出力する出力手段を有すること
を特徴とするものである。
【0010】
【作用】請求項1記載の光学的文字読取装置によれば、
イメージ検出手段が帳票の多値イメージを検出すると、
その多値イメージは記憶手段に記憶され、2値化手段は
初期設定された閾値を基に多値イメージを2値化して2
値イメージを得る。その2値イメージは、認識手段によ
る文字認識処理及び表示手段による表示に供される。認
識手段の文字認識処理により、帳票に記入された文字の
認識結果が得られる。表示手段の表示により、2値イメ
ージの濃度が文字を認識する上で最適か否かを判断する
ことができる。最適でないと判断した場合は、選択操作
により閾値を選択すると、制御手段はその閾値を再設定
し、2値化手段は再設定された閾値を基に多値イメージ
を2値化し、表示手段はその2値イメージを表示する。
これにより、最適な濃度で2値イメージを表示させるこ
とが可能となるので、認識結果と実際の帳票との照合を
行わなくても、表示された2値イメージとの照合を行う
だけで、認識結果のチェックやリジェクト訂正が可能と
なる。
【0011】請求項2記載の光学的文字読取装置によれ
ば、各光学的文字読取手段にて得られた読取情報は、管
理手段により各訂正手段に振り分けられて訂正に供され
るので、大量の帳票の処理が可能となる。
【0012】請求項3記載の光学的文字読取装置によれ
ば、光学的文字読取手段のイメージ検出部が帳票の多値
イメージを検出すると、その多値イメージはイメージ記
憶部に記憶され、2値化部はその多値イメージを2値化
して2値イメージを得る。その2値イメージは、認識部
による文字認識処理に供され、さらに訂正手段の表示部
による表示に供される。認識部の文字認識処理により、
帳票に記入された文字の認識結果が得られる。表示部の
表示により、2値イメージの濃度が文字を認識する上で
最適か否かを判断することができる。最適でないと判断
した場合は、訂正手段の選択部により閾値を選択する
と、管理手段はその閾値を再設定し、2値化部は再設定
された閾値を基に多値イメージを2値化し、表示部はそ
の2値イメージを表示する。これにより、最適な濃度で
2値イメージを表示させることが可能となるので、認識
結果と実際の帳票との照合を行わなくても、表示された
2値イメージとの照合を行うだけで、認識結果のチェッ
クやリジェクト訂正が可能となり、大量の訂正処理が可
能となる。
【0013】請求項4記載の光学的文字読取装置によれ
ば、出力手段から濃度が最適化された2値イメージを出
力させることが可能となる。
【0014】
【実施例】以下、本発明の実施例を図面を参照して詳述
する。
【0015】図1は本発明の光学的文字読取装置の一実
施例を示すブロック図である。
【0016】この光学的文字読取装置は、この装置全体
の制御を司どる管理手段としての中央制御装置1を有
し、この中央制御装置1に任意数の光学的文字読取機
(OCR)2、任意数の訂正端末装置3及び例えば磁気
テープ装置の如き外部記憶装置4を各々接続して構成さ
れている。
【0017】図2は中央制御装置1のブロック図であ
る。
【0018】この中央制御装置1は、本光学的文字読取
装置全体を制御するホストCPU10を有し、このホス
トCPU10に、光学的文字読取装置全体及びこの中央
制御装置1内を制御するための制御プログラム等が格納
されたメモリ11、OCR2の読取処理に必要なFC
(フォーマットコントロール)情報を記憶するFC情報
記憶部12、多数の帳票の読取情報をその帳票識別情報
とともに記憶する読取情報記憶部13、各OCR2に対
して情報の送受を行うOCRインタフェース14、各訂
正端末装置3に対して情報の送受を行う端末インタフェ
ース15及び外部記憶装置4に対して情報の送受を行う
外部インタフェース16を各々接続して構成されてい
る。なお、本実施例において、「読取情報」とは、帳票
の多値イメージ,2値イメージ,認識情報(認識結果,
候補文字)等の情報をいい、「帳票識別情報」とは、読
取情報を特定するための情報、例えばOCR2を特定す
る情報(OCR番号)とそのOCR2が処理した帳票を
特定するための情報(連番)とからなる情報をいうもの
とする。
【0019】ホストCPU10は、FC情報記憶部12
が記憶するFC情報を各OCR2に送り、各OCR2に
帳票の読取処理を行わせて、各OCR2の読取処理によ
り得られた読取情報を帳票識別情報とともに読取情報記
憶部13に記憶するようになっている。また、ホストC
PU10は、各訂正端末装置3の後述する端末CPU3
0との通信により、空いている訂正端末装置3を捜し出
し、その空いている訂正端末装置3に読取情報とともに
帳票識別情報を送ってリジェクト訂正を強制的に行わせ
るようになっている。また、ホストCPU10は、訂正
端末装置3にて階調レベルD1 乃至Dn が変更された場
合には、その階調レベルD1 乃至Dn に対応して予め決
められている閾値を再設定して2値化部24に2値化処
理を行わせるようになっている。また、ホストCPU1
0は、訂正端末装置3にて読取情報が訂正された場合
は、その訂正情報を基に読取情報記憶部13の記憶内容
を訂正するようになっている。
【0020】読取情報記憶部13は、認識ファイル,候
補ファイル及びイメージファイルから構成されており、
認識ファイルには認識結果、候補ファイルには候補文
字、イメージファイルには2値イメージ及び多値イメー
ジが、それぞれ帳票識別情報に対応して記憶される。
【0021】図3はOCR2のブロック図である。
【0022】このOCR2は、ホストCPU10との通
信を行うとともにOCR2の各部を制御するOCR C
PU20を有し、このOCR CPU20に、OCR2
を制御するための制御プログラム等が格納されたメモリ
21、帳票の多値イメージを検出するイメージ検出手段
としてのスキャナ部22、帳票の多値イメージを記憶す
るイメージバッファ23、初期設定された閾値又は再設
定された閾値を基に帳票の多値イメージを2値化する2
値化部24、2値化部24により得られた2値イメージ
に対して文字切出し処理及びこの文字切出し処理により
得られた文字パターンと辞書部25が記憶する認識辞書
とを照合して文字認識処理を行って認識情報を得る認識
部26、帳票に連番を印字する印字部27及び中央制御
装置1のOCRインタフェース14との間でオンライン
回線5を介して情報の送受を行う通信インタフェース2
8を各々接続して構成されている。
【0023】OCR CPU20は、イメージバッファ
23が記憶している帳票の多値のイメージ、2値化部2
4により得られた2値イメージ及び認識部26により得
られた認識情報(認識結果、候補文字)等の読取情報
を、OCR番号及び連番からなる帳票識別情報とともに
通信インタフェース28及びオンライン回線5を介して
中央制御装置1のOCRインタフェース14に送るよう
になっている。
【0024】スキャナ部22は、帳票に光を照射する光
源と、帳票からの反射光をその光量に応じた電気信号に
変換する光電変換器22aと、その変換された電気信号
を例えば256階調のデジタルデータに変換するA/D
変換器22bとを備え、OCR CPU20の制御によ
って帳票全体の多値イメージを検出するようになってい
る。
【0025】認識部26は、送出されたFC情報に基づ
いて、文字切出し処理及び文字認識処理を行うものであ
る。文字切出し処理は、FC情報で指定された読取フィ
ールド内の2値イメージから文字パターンを切り出すも
のである。文字認識処理は、切り出した文字パターンと
辞書部25が記憶する認識辞書とを照合して類似度値を
演算して求め、その類似度値を点数に換算し、点数の最
も大きい第1候補文字から順に第n候補文字まで複数の
候補文字を選択し、第1候補文字を認識結果として決定
するものである。また、認識部26は、この文字認識処
理で認識結果が誤読となるおそれが高い場合、例えば第
1候補文字と第2候補文字の点数が同点の場合は、その
文字の認識結果として第1候補文字の代りにリジェクト
文字(例えば「?」)を出力するようにしている。
【0026】図4は訂正端末装置3のブロック図であ
る。
【0027】この訂正端末装置3は、ホストCPU10
との通信を行うとともに訂正端末装置3の各部を制御す
る端末CPU30を有し、この端末CPU30に、訂正
端末装置3内を制御するための制御プログラム等が格納
されたメモリ31、中央制御装置1から送られてきた読
取情報を帳票識別情報とともに記憶する訂正情報記憶部
32、読取情報,帳票識別情報等を表示する表示部3
3、表示部33に表示されるイメージの階調レベルD1
乃至Dn の変更及びリジェクト訂正等を行う選択手段と
しての操作部34及び中央制御装置1の端末インタフェ
ース15との間でオンライン回線6を介して情報の送受
を行う通信インタフェース35を各々接続して構成され
ている。
【0028】操作部34は、キーボード,マウス等を備
え、2値化部24が2値化する際の閾値に対応する階調
レベルD1 乃至Dn を変更できるようになっている。階
調レベルD1 乃至Dn の変更は、キーボード上の特定キ
ー、例えば、カーソル移動キー,機能キーの押下によっ
て行ってもよく、テンキーにより階調レベルD1 乃至D
n を数字で入力してもよい。また、表示部33に「濃
く」,「薄く」の如く表示し、マウスの操作でカーソル
を「濃く」,「薄く」のいずれかの表示領域に移動させ
て、必要な回数分クリック操作することで行ってもよ
い。
【0029】階調レベルD1 乃至Dn が変更された場合
には、前述したように、階調レベルD1 乃至Dn に対応
して予め決められている閾値を設定するようにしたが、
以下に説明する方法によってもよい。その閾値の設定方
法を図5及び図6をも参照して説明する。
【0030】例えば、帳票の多値イメージについて、図
5に示すように、横軸を濃度、縦軸を度数として濃度ヒ
ストグラム7を作成し、その濃度ヒストグラム7に基づ
いて階調レベルD1 乃至Dn に対して濃度(閾値)の割
当てを行う。帳票の濃度ヒストグラム7は、図5に示す
ように、帳票の性質上双峰性を示すことから、まず谷7
0を見つけて、その谷70より濃度の高い側で最大の度
数N1 を捜し、その最大の度数N1 に対して所定の割合
(例えば8割)の度数N2 を求め、その求めた度数N2
から最大の度数N1 までの領域を文字レベル領域71、
他の領域を背景レベル領域72a,72bとして区分
し、文字レベル領域71内の濃度のみを複数の階調レベ
ルD1 ,D2 ,D3 ,…,Dn に対して割り当てるよう
にする。また、図6に示すように、背景レベル領域72
a,72bを荒いピッチで分け、文字レベル領域71を
背景レベル領域72a,72bよりも細かいピッチで分
けて、濃度の低い方の背景レベル領域72aを階調レベ
ルD1 乃至Da に割り当て、文字レベル領域71を階調
レベルDa 乃至Db に割り当て、濃度の高い方の背景レ
ベル領域72bを階調レベルDb 乃至Dn に割り当てて
もよい。なお、濃度ヒストグラム7の作成は、ホストC
PU10,訂正端末端末CPU30又はOCRCPU2
0が行ってもよく、階調レベルD1 乃至Dn に対する濃
度の割当ても、ホストCPU10,端末CPU30又は
OCR CPU20が行ってもよいが、処理効率の観点
からOCR CPU20が濃度ヒストグラム7の作成及
び濃度の割当てを行うのが望ましい。
【0031】次に、本実施例の動作を図7,図8をも参
照し、図9に示すフローチャートに従って説明する。図
7は初期設定された閾値で2値化された帳票の2値イメ
ージを示す図、図8は再設定された閾値で2値化された
帳票の2値イメージを示す図である。
【0032】まず、本光学的文字読取装置の中央制御装
置1,各OCR2,各訂正端末装置3及び外部記憶装置
4に電源を投入して起動すると、中央制御装置1のホス
トCPU10は、メモリ11に格納されている制御プロ
グラムに基づき、FC情報記憶部12が記憶するFC情
報を各OCR2にOCRインタフェース14及びオンラ
イン回線5を介して送り、各OCR2に帳票の読取処理
を行わせる。
【0033】各OCR2は、送出されたFC情報に基づ
いて読取処理を行う。まず、OCR2のスキャナ部22
は、OCR CPU20の制御の下に、帳票の多値イメ
ージを検出する(S1)。すなわち、スキャナ部22の
光電変換器22aは、光源から照射された光によって帳
票から反射された光を電気信号に変換する。A/D変換
器22bは、光電変換器22aによって変換された電気
信号を例えば256階調のデジタルデータに変換する。
OCR CPU20は、A/D変換器22bが変換した
デジタルデータをイメージバッファ23に記憶する。イ
メージバッファ23には、帳票の多値イメージが記憶さ
れる(S1)。
【0034】2値化部24は、OCR CPU20の制
御により、予め初期設定されている閾値でイメージバッ
ファ23が記憶する帳票の多値イメージを2値化し、そ
の2値イメージを認識部26に出力する(S2)。
【0035】次に、認識部26は、文字切出し処理及び
文字認識処理を行う(S3)。すなわち、認識部26
は、2値化部24により得られた帳票の2値イメージの
うちFC情報で指定された読取フィールド内の2値イメ
ージから文字パターンを切り出す。続いて認識部26
は、切り出した文字パターンと辞書部25が記憶する認
識辞書とを照合して類似度値を演算して求め、その類似
度値を点数に換算し、点数の最も大きい第1候補文字か
ら順に第n候補文字まで複数の候補文字を選択し、第1
候補文字を認識結果として決定する。この時、第1候補
文字と第2候補文字との点数が同点の場合は、その文字
の認識結果としてリジェクト文字(「?」)を出力す
る。
【0036】認識部26によって帳票上の文字が読み取
られると、OCR CPU20の制御の下に、印字部2
7によって連番が印字される。
【0037】そして、OCR CPU20は、イメージ
バッファ23が記憶している帳票の多値イメージ、2値
化部24により得られた2値イメージ及び認識部26に
より得られた認識情報(認識結果、候補文字)等の読取
情報を、OCR番号及び連番からなる帳票識別情報とと
もに通信インタフェース28及びオンライン回線5を介
して中央制御装置1に送る。このようにして各OCR2
は、複数の帳票に対して読取処理を行って順次読取情報
及びその帳票識別情報を中央制御装置1に送る。
【0038】中央制御装置1のホストCPU10は、各
OCR2からオンライン回線5を介して順次送られてく
る読取情報及びその帳票識別情報をOCRインタフェー
ス14を介して取り込み、読取情報のうちの認識結果,
候補文字及び2値イメージ・多値イメージを、それぞれ
読取情報記憶部13の認識ファイル、候補ファイル及び
イメージファイルに帳票識別情報とともに記憶する。
【0039】次に、ホストCPU10は、各訂正端末装
置3の端末CPU30との通信により、空きの訂正端末
装置3を捜し出し、その捜し出した空きの訂正端末装置
3へ端末インタフェース15及びオンライン回線6を介
して多値イメージを除く読取情報及びその帳票識別情報
を送る。これらの情報を送る際に、ホストCPU10
は、認識結果にリジェクト訂正が含まれているために訂
正が必要な読取情報のみを送る。しかも、各訂正端末装
置3には、その処理能力に応じた1又は複数枚分の読取
情報を送る。
【0040】中央制御装置1から訂正が必要とされる読
取情報及びその帳票識別情報が送られた訂正端末装置3
の端末CPU30は、送られてきた読取情報及びその帳
票識別情報を通信インタフェース35を介して取り込
み、訂正情報記憶部32に記憶するとともに、訂正情報
記憶部32に記憶した読取情報のうち帳票の2値イメー
ジを表示部33に表示する(S4)。
【0041】オペレータは、表示部33に表示されたイ
メージの濃度が適切か否かを判断する(S5)。例え
ば、図7に示すように薄過ぎる場合は、操作部34のキ
ーボード又はマウスを操作して階調レベルD1 乃至Dn
を変更する(S6)。
【0042】端末CPU30は、操作部34により変更
された階調レベルD1 乃至Dn 情報を帳票識別情報とと
もに通信インタフェース35及びオンライン回線6を介
して中央制御装置1へ送る。
【0043】中央制御装置1のホストCPU10は、訂
正端末装置3から階調レベルD1 乃至Dn 情報が送られ
てくると、その帳票識別情報を基にその訂正に係る多値
イメージを読取情報記憶部13から読み出し、その多値
イメージと訂正端末装置3から送られてきた階調レベル
1 乃至Dn 情報に対応する閾値情報とを帳票識別情報
とともにOCRインタフェース14及びオンライン回線
5を介してOCR2に送る。なお、多値イメージ及び閾
値情報の送り先のOCR2は、当該多値イメージを検出
したOCR2には限られず、各OCR2のOCR CP
U20との通信により、空きのOCR2を捜し出し、そ
の捜し出した空きのOCR2へ送るようにしてもよい。
【0044】OCR2のOCR CPU20は、中央制
御装置1から送られた多値イメージをイメージバッファ
23に記憶するとともに、閾値を再設定する。
【0045】2値化部24は、再設定された閾値を基に
イメージバッファ23が記憶する多値イメージを再度2
値化する(S7)。
【0046】OCR CPU20は、2値化部24によ
る再度の2値化処理により得られた2値イメージを帳票
識別情報とともに中央制御装置1へ送る。ホストCPU
10は、OCR2から送られた2値イメージを読取情報
記憶部13のイメージファイルに記憶してその記憶内容
を更新するとともに、その2値イメージを元の訂正端末
装置3へ送り返す。
【0047】端末CPU30は、送り返された2値イメ
ージを訂正情報記憶部32に記憶するとともに、表示部
33に表示する(S4)。
【0048】ここで、オペレータは、修正画面を見て表
示部33に表示されたイメージの濃度が、図8に示すよ
うに適切となったと判断すると(S5)、操作部34を
操作して、修正画面表示を要求する。なお、表示部33
に表示されたイメージの濃度が、まだ適切となっていな
ければ、適切となるまで、前記ステップS6,S7,S
4を繰り返す。
【0049】端末CPU30は、修正画面表示の要求に
基づき、訂正情報記憶部32から必要な情報を読み出し
て表示部33に修正画面を表示する(S8)。修正画面
には、例えば読取フィールド単位で認識結果(候補文
字)とそれに対応する2値イメージが表示される。な
お、修正画面には、帳票全体の2値イメージを表示して
もよい。
【0050】オペレータは、リジェクト文字を発見する
と、操作部34を操作して例えばカナ漢字変換により正
しい文字を入力して訂正する(S10)。なお、この訂
正の際に、そのリジェクト文字に関連する複数の候補文
字を表示させて、その複数の候補文字の中から選択する
ようにしてもよい。
【0051】端末CPU30は、訂正が終了するとその
訂正情報を中央制御装置1に送る。
【0052】ホストCPU10は、送出された訂正情報
に基づいて読取情報記憶部13に記憶されている読取情
報のうち対応する認識結果を訂正する。
【0053】オペレータは、リジェクト文字の訂正を全
て終了すると(S9)、ホストCPU10は、所定のタ
イミングで、リジェクト文字が全て訂正された帳票の2
値化イメージ及び認識結果を帳票識別情報とともに外部
記憶装置4に記憶する(S11)。外部記憶装置4に記
憶された2値化イメージ及び認識結果は、帳票の管理に
供される。
【0054】このような本実施例によれば、訂正端末装
置3側で認識結果のチェックやリジェクト訂正を行う際
に、訂正端末装置3の表示部33に帳票の2値イメージ
を最適な濃度で表示させることができるので、認識結果
と実際の帳票との照合を行わなくても、表示された2値
イメージとの照合を行うだけで済み、認識結果のチェッ
クやリジェクト訂正等を容易に行うことができるので、
訂正業務の効率が大幅に向上する。また、複数のOCR
2を用いて帳票の読取処理を行い、その読取情報を複数
の訂正端末装置3を用いて認識結果のチェックやリジェ
クト訂正等を行うことができるので、大量の帳票の処理
が可能となる。また、濃度が最適化された2値イメージ
を認識結果とともに外部記憶装置4に出力できるので、
従来、人手と時間を要していた流通業界,金融業界等に
おける事務センターの集計管理において、効率的な集計
管理が可能となる。
【0055】なお、本発明は上記実施例に限定されず、
その要旨を変更しない範囲内で変形実施できる。例え
ば、閾値の設定は、読取フィールド8a,8b毎に設定
できるようにしてもよい。このようにすることにより、
図10に示すように、例えば鉛筆とボールペンの如く異
なる筆記具で書かれた場合や、印刷と手書きの如く記入
方法が異なる場合等のように、読取フィールド8a,8
bによっては薄い文字と濃い文字とが混在している場合
がある。この場合は、読取フィールド8a,8b毎に閾
値を設定することにより、図11に示すように、各読取
フィールド8a,8bについて同程度の濃度が得られ
る。また、読取情報記憶部13に記憶される帳票の多値
イメージは、帳票全体でなくても、図12に示すよう
に、帳票のうち例えばFC情報により指定した領域9の
みを多値イメージとして記憶するようにしてもよい。こ
れにより、図13に示すように、その指定した領域9は
最適な濃度となり、多値イメージを記憶する読取情報記
憶部13のイメージファイルの記憶容量を最小限に抑え
ることができ、高速な検索が可能となる。また、チェッ
クやリジェクト訂正が終了して濃度が最適化された帳票
の2値イメージ及び認識結果をプリンタ等の出力装置に
出力して紙に印字するようにしてもよい。これにより、
文字の読み難い帳票の代わりに濃度が最適化された印字
結果で保管することができる。
【0056】
【発明の効果】以上詳述した本発明によれば、以下の効
果を奏する。
【0057】請求項1記載の発明によれば、認識結果と
の照合の対象となる2値イメージを最適な濃度で表示さ
せることが可能となるので、認識結果のチェックやリジ
ェクト訂正等を容易に行える光学的文字読取装置を提供
することができる。
【0058】請求項2記載の発明によれば、各光学的文
字読取手段により得られた読取情報は、管理手段により
各訂正手段に振り分けられて訂正に供されるので、大量
の帳票の訂正処理が可能な光学的文字読取装置を提供す
ることができる。
【0059】請求項3記載の発明によれば、各光学的文
字読取手段にて得られた帳票の2値イメージ及び認識結
果は、管理手段により各訂正手段に振り分けられて訂正
に供され、しかも認識結果との照合の対象となる2値イ
メージを最適な濃度で表示させることが可能となるの
で、認識結果のチェックやリジェクト訂正等を容易に行
え、大量の帳票の訂正処理が可能な光学的文字読取装置
を提供することができる。
【0060】請求項4記載の発明によれば、最適化され
た2値イメージの出力が可能となり、帳票の管理業務の
効率向上が図れる。
【図面の簡単な説明】
【図1】本発明の実施例を示すブロック図
【図2】本実施例の中央制御装置のブロック図
【図3】本実施例の光学的文字読取機(OCR)のブロ
ック図
【図4】本実施例の訂正端末装置のブロック図
【図5】本実施例の階調レベルに対する閾値の割当て方
法を説明するための濃度ヒストグラム
【図6】本実施例の階調レベルに対する閾値の割当て方
法を説明するための濃度ヒストグラム
【図7】初期設定された閾値で2値化された帳票の2値
イメージを示す図
【図8】再設定された閾値で2値化された帳票の2値イ
メージを示す図
【図9】本実施例の動作を示すフローチャート
【図10】他の実施例を説明するための図
【図11】他の実施例を説明するための図
【図12】他の実施例を説明するための図
【図13】他の実施例を説明するための図
【符号の説明】
1 中央制御装置(管理手段) 2 光学的文字読取機(OCR) 3 訂正端末装置 10 ホストCPU 13 読取情報記憶部 22 スキャナ部(イメージ検出手段) 23 イメージバッファ 24 2値化部 26 認識部 34 操作部(選択手段)

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 帳票の多値イメージを検出するイメージ
    検出手段と、 検出された多値イメージを記憶する記憶手段と、 初期設定された閾値又は再設定された閾値を基に前記記
    憶手段が記憶する多値イメージを2値化する2値化手段
    と、 この2値化手段により得られた2値イメージに対し文字
    認識処理を行って帳票に記入された文字の認識結果を得
    る認識手段と、 前記2値化手段により得られた2値イメージを表示する
    表示手段と、 選択操作に基づいて閾値を再設定して前記2値化手段に
    2値化処理を行わせる制御手段とを有することを特徴と
    する光学的文字読取装置。
  2. 【請求項2】 帳票に対する読取処理により読取情報を
    得る任意数の光学的文字読取手段と、 読取情報に対して訂正処理を行う任意数の訂正端末手段
    と、 前記各光学的文字読取手段によって得られた読取情報を
    前記各訂正端末手段に振り分けて訂正を行わせる管理手
    段とを有することを特徴とする光学的文字読取装置。
  3. 【請求項3】 前記光学的文字読取手段は、帳票の多値
    イメージを検出するイメージ検出部と、検出された多値
    イメージを記憶するイメージ記憶部と、初期設定された
    閾値又は再設定された閾値を基に前記イメージ記憶部が
    記憶する多値イメージを2値化する2値化部と、この2
    値化部により得られた2値イメージに対し文字認識処理
    を行って帳票に記入された文字の認識結果を得る認識部
    とを有し、 前記訂正端末手段は、前記2値化部により得られた2値
    イメージを表示する表示部と、閾値を選択する選択部と
    を有し、 前記管理手段は、各光学的文字読取手段で得られた認識
    結果及び2値イメージを含む読取情報を記憶する読取情
    報記憶部と、この読取情報記憶部が記憶する読取情報を
    前記訂正端末手段に送出し、前記選択部により閾値が選
    択された場合は、その選択された閾値を再設定して前記
    2値化部に2値化を行わせて得られた2値イメージを前
    記読取情報記憶部に記憶して記憶内容を更新するととも
    に、その2値イメージを前記訂正端末手段に送り、その
    訂正端末手段により読取情報が訂正された場合は、その
    訂正情報を基に前記読取情報記憶部の記憶内容を訂正す
    る制御部とを有することを特徴とする請求項2記載の光
    学的文字読取装置。
  4. 【請求項4】 前記帳票の2値イメージを出力する出力
    手段を有することを特徴とする請求項1又は3記載の光
    学的文字読取装置。
JP6126106A 1994-06-08 1994-06-08 光学的文字読取装置 Pending JPH07334610A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6126106A JPH07334610A (ja) 1994-06-08 1994-06-08 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6126106A JPH07334610A (ja) 1994-06-08 1994-06-08 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPH07334610A true JPH07334610A (ja) 1995-12-22

Family

ID=14926773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6126106A Pending JPH07334610A (ja) 1994-06-08 1994-06-08 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPH07334610A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7440617B2 (en) 1997-12-19 2008-10-21 Canon Kabushiki Kaisha Communication system and control method thereof, and computer-readable memory
US7805000B2 (en) 2000-05-01 2010-09-28 Minolta Co., Ltd. Image processing for binarization of image data
JP2018005694A (ja) * 2016-07-05 2018-01-11 株式会社近畿システムサービス パスポート情報を利用した免税書類用データ生成装置、免税書類作成システム、および免税書類作成方法。

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7440617B2 (en) 1997-12-19 2008-10-21 Canon Kabushiki Kaisha Communication system and control method thereof, and computer-readable memory
US7805000B2 (en) 2000-05-01 2010-09-28 Minolta Co., Ltd. Image processing for binarization of image data
JP2018005694A (ja) * 2016-07-05 2018-01-11 株式会社近畿システムサービス パスポート情報を利用した免税書類用データ生成装置、免税書類作成システム、および免税書類作成方法。

Similar Documents

Publication Publication Date Title
US6950533B2 (en) Sorting images for improved data entry productivity
US4933979A (en) Data reading apparatus for reading data from form sheet
US4944022A (en) Method of creating dictionary for character recognition
US6687401B2 (en) Pattern recognizing apparatus and method
JP2001521821A (ja) 配送物の分配情報の識別方法および識別装置
JPH07185473A (ja) ビデオコーティング装置
US7013045B2 (en) Using multiple documents to improve OCR accuracy
US7694216B2 (en) Automatic assignment of field labels
US20010043742A1 (en) Communication document detector
EP1202213B1 (en) Document format identification apparatus and method
JPH07334610A (ja) 光学的文字読取装置
JP3319203B2 (ja) 文書ファイリング方法及び装置
JP3435375B2 (ja) 文字認識方法および装置
JPH08101890A (ja) ビデオコーディングシステム
JP2000020640A (ja) 分類システム、検索システム、分類方法及び記録媒体
JP3557048B2 (ja) ビデオコーディング装置
JPS63155385A (ja) 光学文字読取装置
JP2578768B2 (ja) 画像処理方法
JP2578767B2 (ja) 画像処理方法
JPH1125214A (ja) 画像識別装置
JPH0778820B2 (ja) 画像処理方法
JPH0957207A (ja) ビデオコ−ディングシステム、郵便物処理装置及び郵便物処理方法
JP2001060249A (ja) 帳票識別用文字列照合方式
JPH10187880A (ja) 文字読取装置およびその文字読取処理を記憶した記憶媒体
JP2001175858A (ja) 高速ラベリング方式