JPH11345281A - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JPH11345281A
JPH11345281A JP10151654A JP15165498A JPH11345281A JP H11345281 A JPH11345281 A JP H11345281A JP 10151654 A JP10151654 A JP 10151654A JP 15165498 A JP15165498 A JP 15165498A JP H11345281 A JPH11345281 A JP H11345281A
Authority
JP
Japan
Prior art keywords
character
mark
selection
recognition
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10151654A
Other languages
English (en)
Inventor
Takayuki Kato
貴之 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP10151654A priority Critical patent/JPH11345281A/ja
Publication of JPH11345281A publication Critical patent/JPH11345281A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 選択マークの付け方が変化しても選択された
選択項目を特定できる光学式文字読取装置を実現する。 【構成】 帳票36の画像は、イメージセンサ38及び
A/D変換器41を介してイメージとしてイメージメモ
リ42に格納される。前処理CPU33は、イメージメ
モリ42中のイメージから文字記載相当位置の領域を文
字単位で切出し、認識CPU34が、該各領域に対して
文字認識をそれぞれ行う。これに対し、マーク認識CP
U30は、主制御CPU31を介して選択項目の記載形
態を示すフォーマットデータ35の情報を取得し、該情
報と文字認識結果とから、選択の意志を示す選択マーク
が付された選択項目を特定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、帳票中に印字された文
字で構成される複数の選択項目のうち、マークによって
選択された選択項目を特定するマーク認識を行う光学式
文字読取装置(以下、OCRという)に関するものであ
る。
【従来の技術】
【0002】図2は、従来のOCRを示す構成図であ
る。このOCRは、4つの中央処理装置(以下、CPU
という)、つまり、主制御CPU1と、対象帳票をOC
Rに導入する機構を制御するメカコンCPU2と、前処
理CPU3と、認識CPU4とを備えている。主制御C
PU1、メカコンCPU2、前処理CPU3及び認識C
PU4は、バスBによって接続され、該主制御CPU1
が各CPU2,3,4を統括してOCR全体の制御を行
う構成になっている。また、主制御CPU1は、読取り
に関する情報のフォーマットデータ5を持つ構成になっ
ている。メカコンCPU2は、帳票6を搬送する帳票搬
送系7とイメージセンサ8とに接続されている。帳票6
の光学的画像は、レンズ9と光学フィルタ10を介して
イメージセンサ8に取込まれるようになっている。イメ
ージセンサ8には、アナログ/ディジタル(以下、A/
Dという)変換器11が接続され、該A/D変換器11
には、イメージメモリ12が接続されている。イメージ
センサ8は、帳票6の画像を取込むためのラインセンサ
であり、該イメージセンサ8、レンズ9及び光学フィル
タ10が、光学系の入力手段を形成している。
【0003】イメージメモリ12は、多値階調のディジ
タル画像を記憶することができるメモリであり、このイ
メージメモリ12の出力側は、前処理CPU3に接続さ
れている。前処理CPU3は、イメージメモリ12中の
イメージの任意のアドレスの領域を切出して2値化する
機能を有し、該前処理CPU3の出力側が、パターンメ
モリ13に接続されている。パターンメモリ13は白黒
の2値の切出された領域のイメージを格納するメモリで
ある。パターンメモリ13の出力側に、認識CPU4が
接続されている。認識CPU4は、前処理CPU3に格
納された領域中の文字パターンの特徴抽出を行い、その
特徴を特徴抽出メモリ14に格納する構成になってい
る。また認識CPU4には、認識辞書メモリ15が接続
されている。
【0004】図3は、図2のOCRの動作を示すフロー
チャートである。この図3を参照しつつ、従来のOCR
の一般的な動作を説明する。図3のイメージ取込み処理
S1において、主制御CPU1がメカコンCPU2に対
し、イメージの取込みの指示を行う。指示を受けたメカ
コンCPU2は、帳票搬送系7を制御して帳票6を搬送
する。帳票6の画像がレンズ9によって集光され、光学
フィルタ10を介してイメージセンサ8に入力される。
即ち、イメージセンサ8及び光学フィルタ10の前を帳
票が通過することで、帳票6の画像が取込まれる。イメ
ージセンサ8は、帳票6の画像を光電変換する。これに
より、帳票6の画像がアナログ信号に変換され、更にA
/D変換器11によって、多値階調のディジタル信号に
変換される。この多値階調のディジタル信号が帳票6の
イメージとしてイメージメモリ12に格納される。
【0005】一方、フォーマットデータ5は帳票6上の
記載形態を表しており、切出す文字の領域等の情報が含
まれている。処理S1の後のフォーマット解読処理S2
において、読取り領域の文字を切出すために、主制御C
PU1は、フォーマットデータ5を解読し、イメージメ
モリ12に格納されたイメージにおける読取り相当位置
を計算する。主制御CPU1は前処理CPU3に対し、
文字の認識のために切出す領域の位置を指示する。続
く、文字切出し処理S3において、主制御CPU1から
指示された位置に基づき、前処理CPU3がイメージメ
モリ12のイメージから、読取文字のパターンを含む領
域を切出す。前処理CPU3は、切出した1文字の分の
領域をパターンメモリ13に書込む。このとき、前処理
CPU3は多値イメージを2値のイメージに変換する。
文字切出し処理S3の後の文字認識処理S4において、
認識CPU4は、パターンメモリ13に格納された領域
の文字パターンの特徴抽出を行い、その結果を特徴抽出
メモリ14に格納する。認識CPU4は、更に、認識辞
書メモリ15の認識辞書とその特徴抽出結果とのマッチ
ングによって文字コードを決定し、主制御CPU1に出
力する。文字認識処理S4の後の認識出力処理S5で
は、主制御CPU1が、文字認識処理S4で得た文字コ
ードを編集し、それを図示しない上位装置へ出力する。
【0006】このようなOCRを用い、帳票6のマーク
フィールドに印字された文字のうち、選択的に選択マー
クが付された文字を特定するマーク認識を行うことがあ
る。マーク認識を行う場合には、予めフォーマットデー
タ5に選択される文字に関する情報を登録しておくと共
に、例えばマークが未記入の帳票6における選択文字の
大きさや黒点数を特徴として求めておき、該求めた特徴
と切出された領域の特徴とを比較することにより、マー
クが付された文字を抽出する。
【0007】
【発明が解決しようとする課題】しかしながら、従来の
OCRでは、次のような課題があった。図4(a),
(b)は、図2の第1の課題を示す説明図であり、帳票
6の選択項目20と選択マークMとが示されている。図
2のOCRでは、マークMが付された文字に対する文字
認識処理S4での文字認識結果が不読となるので、該認
識結果によって選択マークMの付された文字を選択項目
として抽出することは可能となる。ところが、図4
(a)のように、選択項目20が複数の文字21で構成
され、その複数の文字に跨がって選択マークMが付され
た場合には、文字単位の文字認識処理S4では、マーク
Mが付された選択項目20を特定できなかった。また、
処理を変更しても、図4(b)のように、マークMの付
け方が偏ったりして帳票毎に変化する場合には、その結
果がばらつく可能性がある。
【0008】図5(a),(b)は、図2の第2の課題
を示す説明図である。帳票6によっては、図5(a)の
ように、マークフィールド22に選択項目20が予め印
刷されたタイプのものと、図5(b)のように、マーク
フィールド22に適当な記入を行うタイプのものとがあ
って、それらが混在されて搬送される場合がある。従来
のOCRでは、このような場合に対応がとれないばかり
か、例えばマークフィールド22に、認識に関係のない
ガイド文字等がある場合には、誤認識等が発生すること
があった。図6は、図2の第3の課題を示す説明図であ
る。帳票6によっては、マークフィールド22に、選択
項目20が印刷されると共に、文字を記入する文字記入
領域23が設けられたものがある。このように同じ、マ
ークフィールド22に選択項目20と文字記入領域23
とが混在し、選択マークMが付されるときと、記入領域
23に文字が記入されるときとの両方がある場合には、
マーク認識を行うことができなかった。
【0009】図7(a),(b)は、図2の第4の課題
を示す説明図である。帳票6によっては、図7(a)の
ように、選択項目20の一つに選択を示すマークMが付
けられ、他の選択項目20には非選択を示す「=」等の
非選択マーク24が付される場合がある。また、図7
(b)のように、選択項目20には選択を示すマークM
が付され、記入者が誤ってマークMを書入れたときにそ
の選択項目20上に「X」や塗りつぶしの取消しマーク
25が付される場合がある。これらの帳票6に対して
は、図2のOCRではマークMが付された選択項目20
を特定できなかった。図8は、図2の第5の課題を示す
説明図である。帳票6によっては、選択項目20のうち
の非選択の選択項目20のみに非選択を示す「*」等の
非選択マーク26を付ける場合がある。図2のOCRで
は、このような帳票6に対するマーク認識が困難であっ
た。
【0010】以上のような第1〜第5課題の他に、従来
の図2のOCRでは、帳票6に通常の文字認識を行った
場合には、マークが付された文字は、単に不読、誤読と
いう認識結果になるため、通常の文字を認識するための
一連の処理と、マークの付された選択項目を認識する処
理とを完全に別けて行う必要があった。また、予め未記
入の帳票6を読ませて登録するための手間がかかると課
題もあった。
【0011】
【課題を解決するための手段】前記課題を解決するため
に、本発明のうちの第1の発明は、帳票の光学的画像を
入力してイメージに変換する入力手段と、前記イメージ
を格納するイメージメモリと、前記帳票における文字の
記載形態を示すフォーマットデータに基づき、前記イメ
ージメモリに格納されたイメージから前記文字の記載相
当位置の領域を切出す前処理手段と、前記前処理手段に
よって切出された領域に対する特徴を抽出し、該抽出さ
れた特徴に基づき前記帳票に記載された前記文字の認識
を文字単位で行う文字認識手段とを、備えたOCRにお
いて、次のようなマーク認識手段を設けている。
【0012】前記マーク認識手段は、前記文字認識手段
に接続され、前記入力手段に入力された帳票が、任意数
の文字でそれぞれ構成される複数の選択項目が設定され
たマークフィールドに予め印字され、かつ該複数の選択
項目のうちのいずれかには選択の意思を示す選択マーク
が付されている場合、前記フォーマットデータから該各
選択項目の記載形態に関する情報を取得し、該マークフ
ィールドの各前記領域に対してそれぞれ行われた前記認
識の結果と該各選択項目に関する情報とから、前記選択
マークが付された選択項目を特定するものである。この
ような構成を採用したことにより、マークフィールドで
選択項目を構成する各文字に対する認識結果が、文字認
識手段によって得られる。ここで、各選択項目を構成す
る文字が複数であっても、マーク認識手段はフォーマッ
トデータからそれらの各文字がどの選択項目に属するか
判断できる。よって、文字認識手段によって認識に基づ
き、選択されて選択マークが付された選択項目が特定さ
れる。
【0013】第2の発明では、第1の発明のOCRにお
いて、次のような構成にしている。前記前処理手段は、
前記マークフィールドの前記文字の記載相当位置の領域
と前記マークフィールドで前記各選択項目をそれぞれ構
成する該文字の間の領域とを切出し、前記文字認識手段
は、前記文字の記載相当位置の領域と前記文字の間の領
域とに対して前記認識を行い、前記マーク認識手段は、
該マークフィールドの前記各領域に対してそれぞれ行わ
れた前記認識の結果と該各選択項目に関する情報とか
ら、前記選択マークが付された選択項目を特定する構成
にしている。このような構成を採用したことにより、例
えば選択項目を構成する各文字の間に選択マークが付さ
れても、それが文字認識手段によって認識される。
【0014】第3の発明では、OCRにおいて、次のよ
うなマーク認識手段を設けている。この第3の発明にお
ける前記マーク認識手段は、前記前処理手段と前記文字
認識手段とに接続されている。そして、このマーク認識
手段は、任意数の前記文字でそれぞれ構成される複数の
選択項目がマークフィールドに予め印字され、該複数の
選択項目のいずれかには選択の意思を示す選択マークが
付された第1の帳票と、該マークフィールドには該複数
の選択項目が印字されておらず、該複数の選択項目のう
ちの選択された選択項目に対応する任意数の該文字が後
から記入された第2の帳票とが混在して前記入力手段に
与えられる場合、該第1の帳票のマークフィールドの前
記フォーマットデータを取得し、前記前処理手段の切出
したマークフィールドの前記各領域を該取得したフォー
マットデータを用いて評価することにより、該入力手段
に与えられた帳票が該第1の帳票か該第2の帳票かを判
定し、前記判定結果が前記第1の帳票のときには、前記
フォーマットデータに基づき前記文字認識手段の認識結
果から前記選択マークが付された前記選択項目を特定
し、該判定結果が前記第2の帳票のときには、前記マー
クフィールドに対して行われた該文字認識手段の認識結
果を前記選択された選択項目として出力する構成にして
いる。
【0015】このような構成を採用したことにより、複
数の選択項目がマークフィールドに予め印字された第1
の帳票と、複数の選択項目のうちの選択された選択項目
に対応する任意数の該文字が後から記入された第2の帳
票とが混在して入力されても、マーク認識手段は、前処
理手段の切出す領域をフォーマットデータで評価するこ
とにより、入力手段に入力された帳票が第1の帳票か第
2の帳票かを判断する。そして、入力された帳票が第1
の帳票の場合には、文字認識手段の認識結果とフォーマ
ットデータとに基づき、選択マークが付された選択項目
が、マーク認識手段によって特定される。入力された帳
票が第2の帳票の場合に、文字認識手段の認識が選択さ
れた選択項目としてそのまま出力される。
【0016】第4の発明では、OCRにおいて、次のよ
うなマーク認識手段を設けている。この第4の発明にお
けるマーク認識手段は、前記文字認識手段に接続され、
任意数の前記文字でそれぞれ構成される複数の選択項目
と他のガイダンス文字とがマークフィールドに予め印字
されると共に該複数の選択項目のいずれかには選択の意
思を示す選択マークが付された前記帳票に対し、該マー
クフィールドの前記フォーマットデータを入力し、該複
数の選択項目を構成する各文字には前記認識を行うよう
に前記文字認識手段を制御し、該ガイダンス文字には該
認識を行わないように該文字認識手段を制御し、該複数
の選択項目を構成する各文字に対して行った該認識の結
果と該フォーマットデータとから、該選択マークが付さ
れた選択項目を特定するものである。このような構成を
採用したことにより、ガイダンス文字がマークフィール
ドに含まれていても、文字認識手段は、マーク認識手段
の制御によって、ガイダンス文字に対する認識を行わな
い。
【0017】第5の発明では、OCRにおいて、次のよ
うなマーク認識手段を設けている。この第5の発明にお
けるマーク認識手段は、前記文字認識手段に接続され、
任意数の前記文字でそれぞれ構成される複数の選択項目
が予めマークフィールドに印字されると共に該複数の選
択項目にはない他の選択枝を書込む記入領域が該マーク
フィールドに設定された前記帳票に対し、該マークフィ
ールドの前記フォーマットデータと前記文字認識手段が
出力する認識結果とから該記入領域に該選択枝が書込ま
れているか否かを判断し、該記入領域に該選択枝が書き
込まれていると判断したときには、該記入領域に対する
該文字認識手段の認識結果を出力し、該記入領域に該選
択枝が書込まれていないと判断したときには該複数の選
択項目の該各文字に対する該文字認識手段の認識結果と
該フォーマットデータとから、該選択マークが付された
選択項目を特定するものである。このような構成を採用
したことにより、マーク認識手段は、文字認識手段の認
識結果から、記入領域に書込みがある場合と無い場合と
を判断する。マーク認識手段で記入領域に書込みがある
と判断した場合には、その記入領域に対する文字認識手
段の認識結果が、マーク認識手段によって出力される。
そして、記入領域に書込みがないと判断した場合には、
マーク認識手段により、文字認識手段の認識結果に基づ
き、選択された選択項目が特定される。
【0018】第6の発明は、OCRにおいて、次のよう
なマーク認識手段を設けている。この第6の発明におけ
るマーク認識手段は、前記前処理手段に接続され、任意
数の前記文字でそれぞれ構成される複数の選択項目が予
めマークフィールドに印字され、該複数の選択項目のい
ずれかには選択の意思を示す選択マークが付され、か
つ、他の選択項目には該選択マーク以外のマークが付さ
れた前記帳票に対し、該前処理手段の切出した前記各領
域の状態から該選択マーク以外のマークが付された該他
の選択項目を抽出し、該抽出の結果から該選択マークが
付された選択項目を特定するものである。このような構
成を採用したことにより、前処理手段の切出した各領域
の状態に基づき、選択マーク以外のマークが付された選
択項目がマーク認識手段に抽出されるので、該マーク認
識手段により、選択マークが付された選択項目が特定さ
れる。
【0019】第7の発明は、OCRにおいて、次のよう
なマーク認識手段を設けている。この第7の発明におけ
るマーク認識手段は、前記前処理手段と前記文字認識手
段とに接続され、任意数の前記文字でそれぞれ構成され
る複数の選択項目が予めマークフィールドに印字され、
該複数の選択項目のいずれかには選択の意思を示す選択
マークが付され、かつ、他の選択項目のうちのいずれか
には一旦付された該選択マークを取消す取消しマークが
付された前記帳票に対し、該前処理手段の切出した前記
各領域の状態から該取消しマークが付された選択項目を
抽出し、該取消しマークが付された選択項目を除いた前
記選択項目に対する前記文字認識手段の認識結果と前記
フォーマットデータとから、該選択マークが付された選
択項目を特定するものである。このような構成を採用し
たことにより、前処理手段の切出した各領域の状態に基
づき、一旦付された選択マークを取消す取消しマークが
付された選択項目がマーク認識手段に抽出され、さら
に、この取消しマークが付された選択項目を除いた選択
項目に対する文字認識手段の認識結果とフォーマットデ
ータとから、選択マークが付された選択項目が、マーク
認識手段によって特定される。
【0020】第8の発明では、OCRにおいて、次のよ
うなマーク認識手段を設けている。この第8の発明にお
けるマーク認識手段は、前記文字認識手段に接続され、
任意数の前記文字でそれぞれ構成される複数の選択項目
が予めマークフィールドに印字され、該複数の選択項目
のうちの選択する項目以外の項目に対して選択をしない
意思を示す非選択マークが付された帳票に対し、前記文
字認識手段の認識結果から前記非選択マークが付された
選択項目を抽出し、該抽出の結果と前記フォーマットデ
ータとから該選択された選択項目を特定するものであ
る。このような構成を採用したことにより、選択をしな
い意思を示す非選択マークが付された帳票において、マ
ーク認識手段により、文字認識手段の認識結果に基づ
き、その非選択マークが付された選択項目が抽出され
る。この抽出の結果とフォーマットデータとから該選択
された選択項目が特定される。
【0021】第9の発明では、前記入力手段、イメージ
メモリ及び前処理手段と、標準文字の特徴を示す標準文
字パターンを格納する認識辞書メモリと、前記前処理手
段によって切出された領域に対する特徴を抽出し、該抽
出された特徴と前記認識辞書メモリに格納された標準文
字パターンとを照合して前記帳票に記載された前記文字
の認識を文字単位で行う文字認識手段とを、備えたOC
Rにおいて、次のようなマーク認識手段を設けると共
に、これら認識辞書と文字認識手段とマーク認識手段と
を次のように構成している。
【0022】この第9の発明におけるマーク認識手段
は、前記文字認識手段に接続され、前記フォーマットデ
ータと前記文字認識手段の認識結果とから、任意数の前
記文字でそれぞれ構成される複数の選択項目が予めマー
クフィールドに印字されると共に該複数の選択項目には
適宜マークが付されて選択された帳票に対し、該選択さ
れた選択項目を特定するものである。そして、前記認識
辞書メモリには、前記各選択項目を構成する文字に前記
マークを付した状態のパターンをそれぞれ学習パターン
として予め登録する構成とし、前記文字認識手段は、前
記抽出した特徴と前記各学習パターン及び標準文字パタ
ーンとを照合して前記認識を行い、該認識の結果とその
信頼性を示すランク値とを出力する構成にしている。そ
して、前記マーク認識手段は、前記文字認識手段が出力
する各ランク値に基づき前記選択された選択項目を特定
する構成にしている。このような構成を採用したことに
より、文字認識手段が学習パターン及び標準文字パター
ンと、前処理手段が切出した領域の特徴とを照合して認
識を行い、その信頼性を示すランク値と共に認識結果を
出力する。そして、マーク認識手段により、ランク値に
基づき、選択された選択項目が特定される。
【0023】第10の発明では、第9の発明のOCRに
おいて、前記認識辞書に、選択マークが付された状態の
文字のパターンのみを前記学習パターンとして登録して
いる。このような構成を採用したことにより、マークが
付された学習パターンが、選択マークが付された文字の
1種類になるので、ランク値の大小関係だけで、選択さ
れた選択項目が特定される。
【0024】第11の発明は、第9または第10の発明
のOCRにおいて、前記マーク認識手段は、前記文字認
識手段に接続されると共に前記前処理手段に接続され、
該前処理手段で切出された各領域における情報を数値化
し、該数値化した情報と前記各ランク値とを統合した値
に基づき、前記選択された選択項目を特定する構成にし
ている。このような構成を採用したことにより、ランク
値ばかりでなく、前処理手段で切出された各領域におけ
る情報が加味された上で、選択された選択項目が特定さ
れる。
【0025】
【発明の実施の形態】第1の実施形態 図1は、本発明の第1の実施形態を示すOCRの構成図
である。このOCRは、図2と同様のOCRに、新たに
マーク認識手段であるマーク認識CPU30を設けたも
のであり、合計5個のCPUを有している。つまり、こ
のOCRは、そのマーク認識CPU30と、従来の各C
PU1〜4に対応する主制御CPU31、対象帳票をO
CRに導入する機構を制御するメカコンCPU32、前
処理手段である前処理CPU33、及び文字認識手段で
ある認識CPU34を備えている。
【0026】主制御CPU31、メカコンCPU32、
前処理CPU33、認識CPU34、及びマーク認識C
PU30は、バスBによって接続され、該主制御CPU
31が各CPU30〜34を統括してOCR全体の制御
を行う構成になっている。また、主制御CPU31は、
フォーマットデータ35を持つ構成になっている。フォ
ーマットデータ35には、帳票36の記載形態やそれら
の位置情報等が含まれている。メカコンCPU32は、
帳票36を搬送する帳票搬送系37とイメージセンサ3
8とに接続されている。帳票36のイメージは、レンズ
39と光学フィルタ40を介してイメージセンサ38に
取込まれるようになっている。イメージセンサ38に
は、A/D変換器41が接続され、該A/D変換器41
にイメージメモリ42が接続されている。イメージセン
サ38は、帳票36の画像を取込むためのラインセンサ
であり、該イメージセンサ38、レンズ39及び光学フ
ィルタ40が、光学系の入力手段を形成している。
【0027】イメージメモリ42は、多値階調のディジ
タル画像を記憶することができるメモリであり、このイ
メージメモリ42の出力側は、前処理CPU33に接続
されている。前処理CPU33は、イメージメモリ42
中のイメージの任意のアドレスの領域を切出すと共に、
該切出した領域のイメージデータを2値化し、パターン
メモリ43に与える接続である。パターンメモリ43は
白黒の2値のイメージを格納するメモリである。パター
ンメモリ43の出力側に、認識CPU34が接続されて
いる。認識CPU34は、前処理CPU33に格納され
たパターンの特徴抽出を行い、その特徴を特徴抽出メモ
リ44に格納する構成になっている。また認識CPU3
4には、認識辞書を記憶した認識辞書メモリ45が接続
されている。
【0028】図9は、図1のOCRの動作を示すフロー
チャートである。この図1を参照しつつ、マーク認識を
行う場合の図1のOCRの動作を説明する。図1のOC
Rは、次の処理S11〜S21を行ってマーク認識を行
う。先ず、イメージ取込み処理S11において、主制御
CPU31がメカコンCPU2に対し、イメージ取込み
の指示を行う。これを受けたメカコンCPU32は、帳
票搬送系37を制御し帳票36を搬送する。帳票36の
画像がレンズ9によって集光され、光学フィルタ40を
介してイメージセンサ38に入力される。即ち、イメー
ジセンサ38及び光学フィルタ40の前を帳票38が通
過することで、帳票36の画像が取込まれる。イメージ
センサ38は、帳票36の画像を光電変換する。これに
より、帳票36の画像がアナログ信号に変換され、更に
A/D変換器41によって、多値階調のディジタル信号
に変換される。そして多値階調のディジタル画像が帳票
36のイメージとしてイメージメモリ42に格納され
る。
【0029】処理S11の後のフォーマット解読処理S
12において、主制御CPU31は、フォーマット35
を解読し、さらに、領域の特定処理S13において、マ
ークフィールドで選択項目を構成する各文字を切出すた
めに、イメージメモリ42における読取り相当位置を計
算する。主制御VCPU31は、計算した読取り相当位
置を前処理CPU33に与える。
【0030】領域の特定処理S13の後に、前処理CP
U33は文字切出し処理S14を行い、主制御CPU3
1から指示された位置に基づき、イメージメモリ12の
イメージから1文字相当文の領域を切出する。切出され
た領域が1文字分のパターンとしてパターンメモリ43
に書込まれる。このときに、前処理CPU33は多値の
イメージを2値のイメージに変換する。文字切出し処理
S14の後の文字認識処理S15において、認識CPU
34は、パターンメモリ43に書込まれた領域中のパタ
ーンの特徴抽出を行い、その結果を特徴抽出メモリ14
に格納し、更に、認識辞書メモリ45の認識辞書とその
特徴抽出結果とのマッチングによって文字コードを決定
し、主制御CPU31に出力する。判断処理S16にお
いて、主制御CPU31は、フォーマットデータ35か
ら、マークフィールド内の文字かどうかにより、マーク
認識を行う必要があるかどうかを判断し、該マーク認識
を行う必要があると判断した場合には、選択項目に関す
る情報、認識CPU34から与えられた認識結果、及び
前処理CPU33の切出した領域Rの情報をマーク認識
CPU30に送り、該認識CPU30に、処理S17の
マーク判定処理及び処理S18のマーク後処理を行わせ
てマーク認識を行う。マーク認識を行わない場合には、
マーク後処理S18の後の処理S19,S20に処理を
進め、すべての文字に対する処理が終了するまで、文字
切出し処理S14と文字認識処理S14を繰り返す。マ
ーク認識を行う場合には、マークフィールドに対するマ
ーク認識が終了するまで、文字切出し処理S14〜マー
ク後処理S18を繰り返す。
【0031】図10(a)〜(d)は、図1で行うマー
ク認識の概念を示す説明図である。この図10(a)〜
(d)を参照しつつ、図1のOCRの動作を説明する。
例えば、帳票36のマークフィールドに、図10(a)
のような2文字でそれぞれ構成された4個の選択項目
「1明」,「2大」,「3昭」,「4平」が1行に印刷
され、そのうちの選択項目「1明」の全体にかかって選
択の意思を示す「○」の選択マーク51が付された場合
には、文字切出し処理S14によって、選択項目「1
明」に関してはイメージの“1明”が1つの領域Rとし
て切出され、選択項目「2大」に関しては、イメージの
“2”と“大”とがそれぞれ一つの領域Rとして切出さ
れる。同様に、選択項目「3昭」及び「4平」に関して
は、イメージの“3”及び“昭”と、イメージの“4”
及び“平”とがそれぞれ一つの領域Rとして切出され
る。文字認識処理S15の繰り返しによって、イメージ
の“1明”、“2”、“大”、“3”、“昭”、“4”
及び“平”の領域Rが、認識辞書35とマッチングさ
れ、図10(c)のように、“?(不読)”、“2”、
“大”、3”“昭”、“4”及び“平”の認識結果が得
られる。
【0032】一方、フォーッマットデータ35には、図
10(a)のマークフィールドに関し、図10(d)の
ように、各選択項目「1明」〜「4平」をそれぞれ構成
する文字が登録される(以下、この登録された文字を登
録文字という)と共に、これらの4個の選択項目が例え
ば1行に印刷されている点とが登録されている。マーク
判定処理S17において、マーク認識CPU30は、例
えばフォーマットデータ35の登録文字に対し、単純に
前後の3文字の候補の認識結果をマッチングし、該構成
文字に合う認識結果の文字を探し、残りの文字に選択マ
ークが付されていると判定する。これにより、フォーマ
ットデータ35の登録文字“1”及び“明”に一致する
認識結果がないので、帳票36の文字「1」及び「明」
に選択マークが付されていると判定する。マーク判定処
理S17の後のマーク後処理において、マーク認識CP
U30は、登録文字“1”及び“明”によって1つの選
択項目「1明」が構成されていることをフォーマットデ
ータ35で確認し、認識結果出力処理S21において、
“1明”をマーク認識結果として出力する。マーク認識
でない、通常の文字認識に文字認識結果も、この認識結
果出力処理S21により、主制御CPU31から出力さ
れる。
【0033】図10では、選択マーク51が選択項目
「1明」の両方の文字に跨がって付されていたが、多く
の帳票36のうちには、図10とは異なる付け方で選択
マーク51が付される場合がある。図11及び図12
は、選択マーク51の他の付け方(その1,2)を示す
図である。選択マーク51によって、帳票36のマーク
フィールドで選択項目を選択する場合に、その選択項目
を構成する文字の一つに対して選択マーク51が付され
ることがある。例えば、図11のように、選択項目「1
明」のうちの「1」の文字に対して選択マーク51が付
されることや、図12のように、「明」の文字に対して
選択マーク51が付されることがある。
【0034】これら場合では、文字切出し処理S14に
よって切出される領域Rは、帳票36の文字単位にな
り、イメージの“1”と“明”とに対応する領域にな
る。よって、文字認識処理S15により、選択マーク5
1の付いた領域“1”或いは“明”に対する文字認識結
果が不読となり、マーク判定処理S17で、フォーマッ
トデータ35とは不一致であると判定される。不一致と
判定された文字「1」或いは「明」は、1番目の選択項
目に属しているので、選択項目「1明」がマーク認識結
果として出力される。
【0035】以上のように、この第1の実施形態では、
OCRにマーク認識CPU30を設け、認識CPU34
で得られた認識結果に基づき、項目単位でマークが付さ
れた選択項目を抽出するので、記入者の負担が低減でき
ると共に、上位のアプリケーション等での結果処理が簡
素化して処理時間を短縮できる。そのうえ、マーク判定
処理S17の後にマーク後処理S18を行って、フォー
マットデータとのマッチングを行うようにしたので、例
えば、マークフィールドの記載内容が変更になった場合
にそれを不読として検出できる。よって、特に、その変
更の前後の帳票36が混在する場合でも、誤読を防止で
きる。その上、マーク認識と通常の文字認識とを区別す
ることなく、マーク認識を行えるばかりでなく、イメー
ジの文字の大きさの変化等でマークの付された文字を特
定しないので、未記入の帳票36を最初に読み取らせる
必要がなくなり、オペレータの負担が軽減できる。
【0036】第2の実施形態 図13は、本発明の第2の実施形態を示すOCRの構成
図であり、第1の実施形態の図1中の要素と共通の要素
には共通の符号が付されている。このOCRは、第1の
実施形態の前処理CPU33を前処理CPU60に置換
したものであり、他の構成は図1と同様になっている。
前処理CPU60は、帳票36のマークフィールドの各
領域Rを切出すときに、イメージ中の各文字に対応する
領域ばかりでなく、文字の間も含むように切出す機能を
有している。
【0037】図14(a)〜(f)は、図13で行うマ
ーク認識の概念を示す説明図である。この図14(a)
〜(f)を参照しつつ、図13のOCRの動作を説明す
る。前処理CPU60を備えたOCRでは、第1の実施
形態の図9と同様の手順でマーク認識を行うが、図14
(a)に示すように、例えば選択項目を構成する文字
「1」と文字「明」との間に選択マーク51が付されて
いる帳票の場合には、前処理CPU60が行う文字切出
し処理S14により、図14(b)に示すように、文字
「1」と文字「明」との間に付された選択マーク51
も、例えば文字「1」と同じ一つの領域Rに切出され、
文字認識処理S15の処理を行うことにより、認識結果
は“1”と“〇”と“明”とが得られる。マーク認識C
PU30は“1”、“〇”及び“明”と、選択項目「1
明」に対するフォーマットデータ35の登録文字とを、
第1の実施形態と同様のマーク判定処理S17で照合す
ることにより、2文字目に該登録文字に一致しない文字
があることが判定できる。そして、1文字目と3文字目
の文字認識結果に着目することにより、これらが1番目
の選択項目「1明」に相当するので、該選択項目「1
明」にマークが付されていると判定する。
【0038】なお、マーク判定処理S14では、図14
(e)の文字認識結果の文字数と、図14(f)のフォ
ーマットデータ35から定義された各選択項目の文字数
とを比較し、それが不一致の選択項目を選択マークが付
された選択項目として特定してもよい。以上のように、
この第2の実施形態では、前処理CPU60を備え、選
択項目を構成する複数の文字の文字間も切出し、該文字
間に対する認識を行うようにしたので、帳票36の選択
項目における文字と文字との間に選択マークが記入され
てもその選択マークが付された選択項目を抽出でき、第
1の実施形態と同様の効果に加え、第1の実施形態より
も、記入者のマーク記入の負担が低減できる。
【0039】第3の実施形態 図15は、本発明の第3の実施形態を示すOCRの構成
図であり、第1の実施形態の図1中の要素と共通の要素
には共通の符号が付されている。このOCRは、第1の
実施形態のマーク認識CPU30をマーク認識CPU6
1に置換したものであり、他の構成は図1と同様になっ
ている。マーク認識CPU61は、搬送される帳票36
のうち、マークフィールドに予め選択項目が印字され、
該印字されたた選択項目に対して選択マーク51が付さ
れた帳票36aと、選択項目が事前に印字されておら
ず、選択マーク51を付加する代わりに、選択項目に対
応する文字62が後から記入された帳票36bとを自動
的に区別し、その上でマーク認識を行う機能を有してい
る。
【0040】図16(a),(b)は、図15で行うマ
ーク認識の概念を示す説明図である。この図16
(a),(b)を参照しつつ、図15のOCRの動作を
説明する。例えば、マークフィールドに図16(a)の
ような選択項目「10」「9」「8」が印刷され、選択
された選択項目「9」に選択マーク51が付加された帳
票36aに対するマーク認識を行う場合、その帳票36
aの関する記載形式を示すフォーマットデータ35に
は、図16(b)のように各選択項目「10」「9」
「8」の登録文字が登録されている。文字数の4と、複
数の選択項目のうちの最大の長さを持つ項目の文字数
(2)とが登録されている。マーク認識CPU61を備
えたOCRは、第1の実施形態と同様のイメージ取込み
処理S11〜文字切出し処理S14を行い、図16
(c)のように、文字の記載相当位置の領域Rを切出
す。領域Rに対して、認識処理CPU34が文字認識処
理S15を行い、図16(d)のような“10?8”の
認識結果が得られる。
【0041】マーク認識CPU61は、第1の実施形態
と同様の判断処理S16で、主制御CPU31を介して
フォーマットデータ35の帳票36aに関する情報を入
力し、マークフィールドの文字数の4と、該マークフィ
ールドの文字数の4と切出し文字数との差分の絶対値が
所定の閾値以下かどうかで、第1の実施形態と同様のマ
ーク認識を行うか否かを判別する。例えば、マーク認識
CPU61は、複数の選択項目のうちの最長の項目の文
字数の2を閾値として算出し、次の(1)式で判別を行
う。 |(切出し文字数)−(全選択項目の文字数)| <(最長の選択項目の文字数)=2 ・・・(1) 帳票36aの場合には、(1)式が|(4)−(4)|
<2であり、判別結果が、図16(e)のように真(Y
ES)となる。判別結果が真のときには、マーク認識C
PU61は、第1の実施形態のマーク判定処理S17及
びマーク後処理S18を行い、選択マーク51が付加さ
れた選択項目「9」を抽出して出力する。
【0042】一方、図16(g)のように、選択された
選択項目の文字62の例えば「9」のみがマークフィー
ルドに後から記入された帳票36bの場合には、(1)
式の絶対値が|(1)−(4)|=3となり、閾値以下
とならないので判別結果はNoになる。この場合には、
認識CPU34が文字認識処理S15で“9”を文字認
識結果として抽出しているので、マーク認識CPU61
が、該“9”の認識結果をそのままマーク認識結果とし
て出力する。以上のように、この第3の実施形態では、
OCRに第1の実施形態とは異なるマーク認識CPU6
1を設け、帳票36aと帳票36bとを区別し、帳票3
6aに対しては第1の実施形態と同様のマーク認識を行
い、帳票36bには文字認識結果をそのまま認識結果と
して出力するようにしたので、共通のマークフィールド
に対し、選択マークで選択内容を示すものと、直接数値
を記入または印字するもののような、2種類の帳票36
a,36bが混在する場合、今まで、これらの帳票を別
々に分離し、それぞれ読み取りを行っていたが、その必
要がなくなり、ユーザーが、2種類の帳票36a,36
bを意識せずにすみ、作業効率等が大幅に向上できる。
さらに、第1の実施形態と同様に、未記入の帳票36を
最初に登録する必要がないので、そのための手間が省け
る。
【0043】第4の実施形態 図17は、本発明の第4の実施形態を示すOCRの構成
図であり、第1の実施形態の図1中の要素と共通の要素
には共通の符号が付されている。このOCRは、第1の
実施形態のマーク認識CPU30をマーク認識CPU6
3に置換したものであり、他の構成は図1と同様になっ
ている。マーク認識CPU63は、主制御CPU31を
介してフォーマットデータ35の情報を入力し、該情報
に基づき、認識CPU34で行う文字認識を制御する構
成になっている。
【0044】図18は、図17で行うマーク認識の概念
を示す説明図である。この図18を参照しつつ、図17
のOCRの動作を説明する。マーク認識CPU63を備
えたOCRでは、第1の実施形態の同様のイメージ取込
み処理S11〜認識結果出力処理S21を行い、マーク
認識結果を出力するが、例えば、図18(a)に示すよ
うに、マークフィールドに選択項目「90」、選択マー
クがされた選択項目「80」、及び選択項目「70」
と、以外の文字「割」「合」が印字されている場合に
は、該文字「割」「合」に対しては文字認識を行わない
ようにしている。この選択項目以外の文字がマークフィ
ールドに含まれているときのフォーマットデータ35に
は、図18(b)のように、各選択項目「90」「8
0」「70」に登録文字が登録されると共に、「割合」
が選択項目とは別けて登録されている。マーク認識CP
U63は、このマークフィールドに関するフォーマット
データ35の情報を主制御CPU31から入力し、認識
CPU34を制御し、図18(c)の「割合」に対応す
る切出し領域Rには文字認識処理S15を行わせない。
よって、文字認識処理S15を繰り返して得られる認識
結果は、図18(d)のように、“90?70”とな
る。文字認識処理S15の認識結果に対して、第1の実
施形態と同様の、マーク判定処理S17及びマーク後処
理S18のマーク認識が、マーク認識CPU63によっ
て行われ、2番目の選択項目の「80」が、抽出されて
出力される。
【0045】以上のように、この第4の実施形態では、
OCR装置に認識CPU34を制御するマーク認識CP
U63を設け、マーク認識に関係のある文字だけに対し
て文字認識を行うようにしたので、処理の高速化や、認
識率の向上等が可能になる。その上、第1の実施形態と
同様に、未記入の帳票36を最初に登録する必要がない
ので、そのための手間が省ける。さらに、例えば、フォ
ーマットデータ35の選択項目の一部または全部を除外
して文字認識を行わせることも可能になり、例えば、特
定の選択項目に選択マークが付されているかどうかをチ
ェックする等の高度な処理が、上位アプリケーションと
相俟って可能になる。
【0046】第5の実施形態 図19は、本発明の第5の実施形態を示すOCRの構成
図であり、第1の実施形態の図1中と共通の要素には共
通の符号が付されている。このOCRは、第1の実施形
態のマーク認識CPU30をマーク認識CPU64に置
換したものであり、他の構成は図1と同様になってい
る。マーク認識CPU64は、選択マーク51を付ける
複数の選択項目と、選択マーク51を付ける代わりに該
選択項目にはない選択枝を記入する記入領域の両方が共
通のマークフィールドに設定された帳票36に対し、フ
ォーマットデータ35を参照して、選択マーク51が付
された選択項目を抽出するか、または該記入領域に記載
された選択枝を認識する機能を有している。
【0047】図20(a)〜(d)は、図19で行うマ
ーク認識の概念を示す説明図である。図21は、図19
の処理手順の一例を示すフローチャートある。これらの
図20(a)〜(d)及び図21を参照しつつ、図19
のOCR動作を説明する。図20(a)には、未記入の
帳票36のマークフィールドが示されている。この帳票
36は、選択項目「10」,「9」,「8」,「7」が
2行に分けて印刷されると共に、記入領域65が()で
示されている。記入領域65は、例えば選択項目「1
0」〜「7」にない選択枝を記入するために設定された
ものである。このようなマークフィールドを有する帳票
36が、例えば選択項目「9」に選択マーク51が付さ
れて搬送された場合に、図19のOCRは、第1の実施
形態のイメージ取込み処理S11〜文字認識処理S15
と同様の図21に示したイメージ取込み処理S31〜文
字認識処理S35を行い、“10?87()”の認識結
果を得る。マーク認識CPU64は、帳票36のマーク
フィールドに関するフォーマットデータ35の情報を主
制御CPU31を介して入力する。帳票36のフォーマ
ットデータ35のマークフィールドに関する情報には、
図20(b)のように、各選択項目(図中では||で区
切られている)をそれぞれ構成する文字と、選択項目が
改行されている(図中では‖で示されている)ことと、
記入領域65が存在(“(”“)”)することとが予め
登録されている。マーク認識CPU64はフォーマット
データ35の情報を参照し、第1の実施形態の判断処理
S16と同様の第1の判断処理S36を行い、帳票36
に対してマーク認識が必要かどうか判断する。マーク認
識が必要でない場合(N)には、処理S35で得られた
認識結果を通常の文字認識結果として出力する。
【0048】マーク認識が必要である場合(Y)には、
マーク認識CPU64は第2の判断処理S37で、フォ
ーマットデータ35に基づき、通常の文字認識を行う必
要があるか否かを判断する。具体的には、認識結果“1
0?87()”における()内に文字があるか否かで判
断する。この第2の判断処理S37で、通常の文字認識
を行う必要がない(N)と判断できる場合には、第1の
実施形態のマーク判定処理S17及びマーク後処理S1
8に対応するマーク判定処理S37及びマーク後処理S
38を行ってマーク認識を行い、選択項目「9」に対応
するマーク認識結果“9”を認識結果出力処理利S40
で出力する。第2の判断処理S37で通常の文字認識を
行う必要がある(Y)と判断した場合には、通常文字読
取りエリア特定処理S41とエリア内文字認識結果決定
処理S42を行う。
【0049】例えば図20(d)のように、選択項目
「10」〜「7」に選択マーク51が付されておらず、
帳票記入者が選択枝として選択項目「10」〜「7」以
外の「6」を記入領域65に記載した帳票36が搬送さ
れた場合に、イメージ取込み処理S31〜文字認識処理
S37により、“10987(6)”の認識結果が得ら
れる。マーク認識CPU64は、認識結果“10987
(6)”における()内に文字があることから、通常文
字読取エリア特定処理S41を行い、通常の文字認識を
行う記入領域65の位置を()に特定する。そして、マ
ーク認識CPU64は、エリア内文字認識結果決定処理
S42により、認識結果から“6”を抽出し、認識結果
出力処理S40でその“6”をそのまま出力する。以上
のように、この第5の実施形態では、OCRにマーク認
識CPU64を設け、選択項目「10」〜「7」に対し
てはマーク認識を行い、記入領域65がある場合には、
該記入領域65に記載された文字に対する認識結果を選
択枝として抽出するようにしている。そのため、次のよ
うな利点を有する。
【0050】帳票設計では多くの選択枝がある場合に、
その代表的な項目をマークで選択される選択項目として
印刷し、代表的でない項目は選択枝から選んで直接記入
するというスタイルのマークフィールドを設定し、ユー
ザーへの記入負荷を最小限にする場合が非常に多い。従
来の技術では、これらを同―のフィールドとして読み取
ることはできなかった。これに対し、図19のOCRで
は、このように選択される選択項目と記入領域65とが
混在しても、自動的に読み取ることが可能になる。よっ
て、大幅に、OCRで読み取り可能な帳票の制限が緩和
される。その上、第1の実施形態と同様に、未記入の帳
票36を最初に登録する必要がないので、そのための手
間が省ける。
【0051】第6の実施形態 図22は、本発明の第6の実施形態を示すOCRの構成
図であり、第1の実施形態の図1中の要素と共通の要素
には共通の符号が付されている。このOCRは、第1の
実施形態のマーク認識CPU30をマーク認識CPU6
6に置換したものであり、他の構成は図1と同様になっ
ている。マーク認識CPU66は、前処理CPU33が
切出した領域に基づき、帳票36のマークフィールドに
印刷された複数の選択項目に付されたマークが、選択の
意思を示す選択マーク51か、或いは非選択の意思を示
す非選択マークかを判定し、該判定結果に基づきマーク
認識を行う機能を有している。
【0052】図23(a)〜(c)は、図22で行うマ
ーク認識の概念を示す説明図である。この図23(a)
〜(c)を参照しつつ、図22のOCRの動作を説明す
る。例えば、帳票36のマークフィールドに選択項目
「出席」と「欠席」とが、図23(a)のように予め印
刷され、図23(b)のように記入者によってそれらの
選択項目のうちの「出席」に、選択マーク51が付され
たとする。このような帳票36が搬送された場合、OC
Rは、第1の実施形態のイメージ取込み処理S11〜文
字切出し処理S14を行うことにより、選択マーク51
が付された「出席」を含む領域67と、各文字「欠」
「席」の領域68,69とが切出される。マーク認識C
PU65は、前処理CPU33が切出した領域67の縦
の長さh1及び横の長さw1 と、領域68の縦の長さh
2 及び横の長さw2 と、領域69の縦の長さh3 及び横
の長さw3 とから算出した各領域67〜69のサイズ、
第1の実施形態と同様の文字認識結果を利用したマーク
認識、或いは、選択項目の文字数等から、選択項目の
「出席」に選択マーク51が付されていると判断し、該
「出席」に対応するコード“出席”を出力する。
【0053】ところが、記入者によっては、図23
(c)のように、選択をしない側の選択項目「欠席」に
対して、非選択を示す例えば二重線等の非選択マーク7
0を付けることがある。このような帳票36にイメージ
取込み処理S11〜文字切出し処理S14を行うと、前
処理CPU33で切出される領域は、各「出席」及び
「欠席」に1個ずつの領域71及び領域72となる。こ
の場合、マーク認識CPU66は、領域71の縦の長さ
4 及び横の長さW4 、領域72の縦の長さh5 及び横
の長さW5 を参照し、選択マーク51の付いた選択項目
「出席」を抽出する。選択マーク51が「○」で、非選
択マーク70が二重線の場合には、領域の幅がW4 >W
5 となるので、その抽出が可能である。マーク認識の精
度を向上するために、抽出の条件に2種類のマークを判
別しやすい特徴データを追加してもよい。例えば、文字
の幅より2割程度狭く、1文字目の中心から、最後の文
字の中心をそれぞれ上辺、下辺とする各矩形b1,b2
b2を領域71,72にそれぞれ設定し、該矩形b1,
b2aの黒点数をカウントして領域71,72を比較す
る。ある闇値bkに対し、bk>b1又はb2>bkと
なれば、b1側が選択されていると判断する。
【0054】以上のように、この第6の実施形態では、
OCRにマーク認識CPU66を設け、前処理CPU3
3で切出した領域71,72に基づき、非選択マーク7
0が付された選択項目「欠席」と、選択マーク51が付
された選択項目「出席」とを特定するようにしたので、
選択マーク51のみが付された帳票36と、選択マーク
51及び非選択マーク70の両方が付された帳票36と
が混在して搬送される場合でも、確実に選択マーク51
が付された選択項目を特定できる。
【0055】第7の実施形態 図24は、本発明の第7の実施形態を示すOCRの構成
図であり、第1の実施形態の図1中の要素と共通の要素
には共通の符号が付されている。このOCRは、第1の
実施形態のマーク認識CPU30をマーク認識CPU7
3に置換したものであり、他の構成は図1と同様になっ
ている。マーク認識CPU73は、前処理CPU33が
切出した領域に基づき、帳票36のマークフィールドに
印刷された複数の選択項目に付されたマークが、選択の
意思を示す選択マークか、或いは該選択マークに重ね書
きされて該選択の意思を否定する消去マークかを判定す
る機能と、該判定結果から選択の意思に基づく選択項目
を特定する機能とを有している。
【0056】図25(a)〜(d)は、図24で行うマ
ーク認識の概念を示す説明図である。この図25(a)
〜(d)を参照しつつ、図24のOCRの動作を説明す
る。例えば、帳票36のマークフィールドに2個の選択
項目「1社・国」と「2公費」とが、図25(a)のよ
うに予め印刷され、図25(b)のように記入者によっ
てそれらの選択項目のうちの「1社・国」の全文字に跨
がって、選択マーク51が付されたとする。このような
帳票36が搬送された場合、OCRは、第1の実施形態
のイメージ取込み処理S11〜文字切出し処理S14を
行うことにより、選択マーク51が付された「1社・
国」を含むイメージの領域74と、各文字「2」「公」
「費」のイメージの領域75,76,77とが切出され
る。前処理CPU33が切出した領域74〜74に対し
て、例えば第1の実施形態の文字認識処理S15、マー
ク判定処理S17、及びマーク後処理S18とを行うこ
とにより、選択マーク51が付された選択項目「1社・
国」を抽出することができる。
【0057】ところが、図25(c)のように、記入者
が誤って選択項目「2公費」に選択マーク51を付けて
しまい、それを否定するために二重線や“X”或いは塗
り潰しからなる取消マーク78が選択マーク51上に重
ね書きされた帳票36が搬送されることがある。この場
合、前処理CPU33で切出される領域は、「1社・
国」及び「2公費」に対応するそれぞれ一つの領域7
9,80となる。この領域79,80に対して、認識C
PU34が文字認識処理S15を行うと、いずれも不読
となり、選択された選択項目が特定できない。そこで、
マーク認識CPU73は、領域79,80内の黒点数を
求め、該各黒点数が所定の閾値に対して多い方の領域8
0を、取消マーク78が付された項目と判断し、他方の
領域79に対応する選択項目「1社・国」を選択マーク
51が付された項目として特定する。なお、選択マーク
51が付されていない選択項目がさらに他にある場合に
は、その項目に対応する領域と領域80とに対して、第
1の実施形態と同様のマーク判定処理S17とマーク後
処理S18を行うことで、本来の選択された選択項目
「1社・国」を抽出できる。また、図25(d)のよう
に、各選択項目を構成する文字群のうちの一部に選択マ
ーク51が付され、それが取り消された場合でも同様の
処理によって、選択された項目が確実に特定される。
【0058】以上のように、この第7の実施形態では、
OCRにマーク認識CPU73を設け、前処理CPU3
3で切出した領域79,80の黒点数を求め、該黒点数
が閾値を越えるの場合に、記入ミスがあった項目と判断
するようにしたので、例えば、記入者が誤って選択項目
51を付けたのち、二重線や“X”でそれを取り消した
場合でも、本来選択された選択項目を特定できる。
【0059】第8の実施形態 図26は、本発明の第8の実施形態を示すOCRの構成
図であり、第1の実施形態の図1中の要素と共通の要素
には共通の符号が付されている。このOCRは、第1の
実施形態のマーク認識CPU30をマーク認識CPU8
1に置換したものであり、他の構成は図1と同様になっ
ている。マーク認識CPU81は、フォーマットデータ
35と認識CPU34で文字認識を行った結果とから、
帳票36のマークフィールドで非選択マークが付された
項目を求め、該非選択マークが付されていない項目を、
選択された項目として抽出する機能を有している。
【0060】図27(a)〜(g)は、図26で行うマ
ーク認識の概念を示す説明図である。この図27を参照
しつつ、図26のOCRの動作を説明する。例えば、未
記入の状態での帳票36のマークフィールドには、図2
7(a)のような4つの選択項目「明」,「大」,
「昭」,「平」が予め印刷され、かつ、これら選択項目
「明」〜「平」のうちの「昭」が選択され、他の各選択
項目「明」、「大」及び「平」にのみ非選択を示す
「*」の非選択マーク70が、重ねて付されているもの
とする。帳票36に対し、図26のOCRは第1の実施
形態のイメージ取込み処理S11〜文字認識処理S15
を行う。これにより、図27(c)のように、“??昭
?”の文字認識結果が得られる。マーク認識CPU81
は、図27(b)のように、各選択項目を構成する文字
“明”“大”“昭”“平”が予め登録されたフォーマッ
トデータ35の情報を主制御CPU31を介して入力
し、該フォーマットデータ35の情報と、文字認識結果
とから、非選択マーク70の「*」がされた選択項目を
抽出し、残りの選択項目「昭」を選択された選択項目と
して特定する。
【0061】なお、選択された選択項目の抽出の信頼性
を高めるために、必要により、前処理CPU33の切出
した領域を、黒点数、文字サイズ、位置ずれ等で評価
し、それらの総合評価から、選択された選択項目「昭」
を抽出するようにしてもよい。例えば、非選択マーク7
0の「*」の付された項目は、付されていない項目に対
し、図27(e)のように黒点数が大きくなり、図27
(f)のように文字サイズに相当する切出し領域が大き
くなり、図27(g)のように切出した領域の外接矩形
の位置がずれる。以上のように、この第8の実施形態で
は、OCRにマーク認識CPU81を設け、フォーマッ
トデータ35と認識CPU34で文字認識を行った結果
とから、帳票36のマークフィールドで非選択マーク7
0が付された項目を求め、該非選択マークが付されてい
ない項目を、選択された選択項目として抽出するように
している。そのため、通常の選択する項目に選択マーク
51を付さず、他の項目に非選択マーク「*」を付した
帳票36に対し、選択した選択項目を抽出できる。この
ような帳票36は、人間が見ても選択した選択項目だけ
が読めるというメリットがあるが、この帳票36に対し
て有効なマーク認識が行える。
【0062】第9の実施形態 図28は、本発明の第9の実施形態を示すOCRの構成
図であり、第1の実施形態の図1中の要素と共通の要素
には共通の符号が付されている。このOCRは、第1の
実施形態のマーク認識CPU30をマーク認識CPU8
2に置換する共に、認識CPU34及び認識辞書メモリ
45を認識CPU83及び認識辞書メモリ84に置換し
たもので、他の構成は図1と同様になっている。認識辞
書メモリ84には、通常の文字認識に用いるための標準
文字の特徴を示す標準文字パターンを格納する他に、帳
票36のマークフィールドに印刷された複数の選択項目
をそれぞれ構成する各文字に対し、マークが重ね書きま
たは印字された状態の特徴を示すパターンが学習されて
学習パターンとして予め登録されている。認識CPU8
3は、通常の文字認識を行う機能の他に、選択項目を構
成する各文字とその学習パターンとを照合し、該各文字
に付されたマークの種類を抽出すると共にその抽出結果
の信頼性を例えば0〜100の範囲で表すランク値を求
める機能を有している。マーク認識CPU82は、認識
CPU83が出力する抽出結果とランク値から、複数の
選択項目のうち選択された選択項目を特定する機能を有
している。
【0063】図29は、図28中の認識辞書メモリ84
の学習パターンを示す説明図であり、図30(a),
(b)は、図28で行うマーク認識の一例を示す説明図
である。これらの図29及び図30(a),(b)を参
照しつつ、図28の動作を説明する。帳票36のマーク
フィールドには、例えば、4個の選択項目「明」「大」
「昭」「平」が印字され、そのうちの「明」「大」
「平」には、選択をしない意思を示す非選択マーク
「*」または「=」のうちの一方の例えば「*」が、記
載者によって重ね書きされているものとする。このよう
な帳票36に対し、このOCRは、第1の実施形態のイ
メージ取込み処理S11〜文字切出し処理S14を行
い、各選択項目を構成する文字の記載相当位置の領域を
イメージから切出す。切出された領域には、図30
(a)のような非選択マークが付された状態のパターン
が含まれる。
【0064】一方、認識辞書メモリ84には、各選択項
目「明」,「大」,「昭」,「平」等の文字に対応する
標準的な構成文字パターン“明”,“大”,“昭”,
“平”の他に、図29のように、非選択マーク「*」及
び「=」が付された状態の「明」,「大」,「昭」,
「平」に対応する学習パターンが、予め登録されてい
る。認識CPU83は、第1の実施形態と同様の文字認
識処理S15により、パターンメモリ43から読出され
た領域における特徴を抽出し、該抽出した特徴と、認識
辞書メモリ84の各標準文字パターン及び各学習パター
ンとを比較して文字認識を行う。この文字認識の結果、
認識CPU83は、選択項目「明」,「大」,「平」等
の文字に対し、該各文字に付されたマーク“*”と、ラ
ンク値とをそれぞれ出力し、文字「昭」に対しては
“昭”の文字認識結果を出力する。ここで、各ランク値
は100に近い方が信頼性が高いことを示している。マ
ーク認識CPU82は、主制御CPU31を介して入力
したフォーマットデータ35の情報を参照し、前記認識
CPU83が出力する各認識結果から、選択された選択
項目が「昭」であることを特定し、その選択項目「昭」
に対応する認識結果“昭”を出力する、
【0065】図31は、図28で行うマーク認識の他の
例を示す説明図である。前述の図30は、非選択マーク
のみが付された場合であったが、「○」の選択マーク5
1が付された場合でも、その「○」が付された状態の
「明」,「大」,「昭」,「平」の学習パターンを学習
して認識辞書メモリ84に追加して登録しておけば、図
28のOCRで、選択された選択項目を特定できる。例
えば、帳票36において、選択項目の文字「昭」に
「○」が付された場合には、図31(a)のように、選
択項目の文字「昭」に選択マークの「○」が付された状
態でイメージが切出される。認識CPU83は、文字認
識処理S15により、パターンメモリ43から読出した
領域における特徴を抽出し、該抽出した特徴と、認識辞
書メモリ84の各標準文字パターン及び各学習パターン
とを比較して文字認識を行う。この文字認識では、例え
ば選択項目の文字「明」〜「平」に付されたマークがす
べて「*」と仮定して文字認識を行う場合と、文字
「明」〜「平」に付されたマークがすべて「○」と仮定
して文字認識を行う場合と、「*」と「○」とが混在す
ると仮定して認識を行う場合とがある。
【0066】文字「明」〜「平」に付されたマークがす
べて「*」と仮定する場合は、学習パターンは「*」が
付された状態の文字「明」〜「平」に対応する学習パタ
ーンが用いられる。認識CPU83は、これらの学習パ
ターンと切出した領域の特徴とを照合して認識を行い、
“*”と、各文字「明」〜「平」に対応するランク値9
2,“85”,“61”,“89”を出力する。マーク
認識CPU82は、フォーマットデータ35の情報と各
ランク値“92”〜“89”とに基づき、3番目の項目
に対応するランク値が低いことから、選択項目の文字
「昭」に、選択マーク51の「○」が付されていると判
定し、マーク認識結果として“昭”を出力する。文字
「明」〜「平」に付されたマークがすべて「○」と仮定
する場合は、学習パターンは「○」が付された状態の文
字「明」〜「平」に対応する学習パターンが用いられ
る。認識CPU83は、これらの学習パターンと切出し
た領域の特徴とを照合して認識を行い、“○”と、各文
字「明」〜「平」に対応するランク値“42”,“3
9”,“87”,“47”を出力する。マーク認識CP
U82は、フォーマットデータ35の情報と各ランク値
“42”〜“47”とに基づき、3番目の項目に対応す
るランク値が高いことから、選択項目の文字「昭」に、
選択マーク51の「○」が付されていると判定し、マー
ク認識結果として“昭”を出力する。
【0067】文字「明」〜「平」に付されはマーク
「○」または「*」が混在して付けられていると仮定す
る場合は、学習パターンは「*」及び「○」が付された
状態の「明」〜「平」に対応する学習パターンが用いら
れる。認識CPU83は、これらの学習パターンと切出
した領域の特徴とを照合して認識を行い、文字「明」,
「大」及び「平」に対してマークの“*”とランク値の
例えば“92“,“85”,“89”を出力し、文字
「昭」に対して“○”とランク値の“87”を出力す
る。マーク認識CPU82は、フォーマットデータ35
と各ランク値“92”〜“89”とに基づき、選択項目
の文字「昭」に選択マークの「○」が付されていると判
断し、マーク認識結果として“昭”を出力する。以上の
ように、この第9の実施形態では、OCRにマーク認識
CPU82を設けると共に、認識辞書メモリ84に、付
される可能性の有るマークを付した状態の文字「明」〜
「平」のパターンを学習して登録しておき、その学習パ
ターンを用いた文字認識の結果により、選択された選択
項目「昭」を判断するようにしたので、予め、マークを
付した文字のパターンを学習しておけば、選択する選択
項目に選択マーク51を付す場合、選択しない選択項目
に非選択マークを付す場合、或いは両方にマークを付す
場合のいずれに対しても、簡単にマーク認識ができるよ
うになる。
【0068】第10の実施形態 図32は、本発明の第10の実施形態を示すOCRの構
成図であり、第9の実施形態の図28中の要素と共通の
要素には共通の符号が付されている。このOCRは、第
9の実施形態における認識辞書メモリ84を認識辞書メ
モリ85に置換したものであり、他の構成は図28と同
様になっている。認識辞書メモリ84には、標準文字パ
ターンの他に、選択マークの「○」を重ね書きまたは印
刷した状態の帳票36の選択項目を構成する文字のパタ
ーンのみが学習パターンとして追加して登録されてい
る。図33は、図32で行うマーク認識の概念を示す説
明図である。帳票36のマークフィールドに、例えば、
4個の選択項目「明」,「大」,「昭」,「平」が印字
され、そのうちの「明」,「大」,「平」には、選択の
意思を示す「○」の選択マーク51が、記載者によって
重ね書きまたは印刷れているものとする。このような帳
票36に対し、このOCRは、第1の実施形態のイメー
ジ取込み処理S11〜文字切出し処理S14を行い、各
選択項目を構成する文字の記載相当位置の領域をイメー
ジから切出す。切出されて領域には、図33(a)のよ
うな選択マークが付された状態のパターンが含まれる。
【0069】一方、認識辞書メモリ85には、各選択項
「明」〜「平」等の文字に対応する標準的な構成文字パ
ターン“明”,“大”,“昭”,“平”の他に、図29
のように、選択マーク「○」が付された状態の文字
「明」,「大」,「昭」,「平」に対応する学習パター
ンが、予め登録されている。認識CPU83は、第1の
実施形態と同様の文字認識処理S15により、パターン
メモリ43から読出された領域における特徴を抽出し、
該抽出した特徴と、認識辞書メモリ85の各標準文字パ
ターン及び各学習パターンとを比較して文字認識を行
う。この文字認識の結果、認識CPU83は、各選択項
目「明」,「大」,「昭」,「平」を構成する文字
「明」〜「平」に対し、該マーク「○」が印字されたと
仮定した場合のランク値をそれぞれ出力する。ランク値
は0〜100の範囲の値であり、100に近い方が信頼
性が高いことを示している。例えば、図33(b)のよ
うに、各文字「明」,「大」,「昭」,「平」に対し
て、ランク値が“42”,“38”,“94”,“5
1”となり、選択マーク51の「○」が付された文字
「昭」のランク値が高い値になる。マーク認識CPU8
2は、ランク値から文字「昭」にマークが付されている
こと判断し、該文字「昭」に対応するマーク認識結果
“昭”を出力する。
【0070】ここで、マーク認識CPU82に、第8の
実施形態のマーク認識CPU31と同様に前処理CPU
33が切出した領域の特徴を参照する機能を設けておく
と、さらに、マーク認識の精度を向上できる。例えば、
図33(c)のように各領域における黒点数を“普通”
或るは“大きい”で評価してこれを“0”または“1”
に数値化し、図33(d)のように文字サイズを“普
通”或るは“大きい”で評価してこれを“0”または
“1”に数値化し、図33(e)にように位置ずれを
“有”或いは“なし”で評価してこれを“0”から
“0.5”で数値化する。マーク認識CPU82は、各
数値化した値を認識CPU83が出力したランク値に加
算して統合ランクを求める。このようにすると、文字
「昭」の統合ランクは、図33(f)のように“96.
5”になる。この場合、マーク認識CPU82は、“9
6.5”の統合ランク値が例えば“80”に設定された
閾値よりも高いことから、文字「昭」に選択マーク
「○」が付されていることを認識し、該文字「昭」に対
応する認識結果“昭”を出力する。以上のように、この
第10の実施形態のOCRでは、認識辞書メモリ85に
選択マーク「○」が付された状態の文字の選択学習パタ
ーンのみを登録しておくので、ランク値を比較するだけ
で、選択マーク51の「○」が付された選択項目「昭」
を特定できるので、処理が簡単になって高速化できる。
さらに、マーク認識CPU82で行う処理を認識CPU
83や主制御CPU31に任せることも可能になる。
【0071】なお、本発明は、上記実施形態に限定され
ず種々の変形が可能である。その変形例としては、例え
ば次のようなものがある。 (1) 帳票36の記載形態は、上記第1〜第10の実
施形態で示した記載形態に限定されるものではない。例
えば、第1の実施形態では、選択項目「1明」,「2
大」,「3昭」,「4平」が2行に印刷されている場合
でも、図1のOCRは、選択された選択項目を特定でき
る。また、各選択項目「1明」〜「4平」の文字数も、
任意に変化させてもよい。 (2) 図34は、図19の他の処理手順を示すフロー
チャートである。第5の実施形態のOCRで、選択項目
「10」,「9」,「8」,「7」の他に記入領域65
が()で示されている帳票36に対してマーク認識を行
う場合、図34のように、第1の判断処理S36と第2
の判断処理S37との間に、マーク判定処理S38とマ
ーク後処理S39を行うようにしてもよい。このように
すると、マーク認識と通常の文字認識による処理S4
1,S42との優先順位を入れ替えることができる。
【0072】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、入力手段とイメージメモリと前処理手段と文
字認識手段とを備えたOCRに、任意数の文字でそれぞ
れ構成された複数の選択項目のいずれかには選択マーク
が付されている帳票に対し、フォーマットデータから各
選択項目の記載形態に関する情報を取得し、文字認識手
段の認識の結果と該各選択項目に関する情報とから、選
択マークが付された選択項目を特定するマーク認識手段
を設けたので、選択項目を構成する文字に跨がって選択
マークが付された帳票や該選択マークが偏って付された
帳票に対しても、選択された選択項目が特定できる。
【0073】第2の発明によれば、第1の発明における
前処理手段は、マークフィールドの文字の記載相当位置
の領域と各選択項目をそれぞれ構成する該文字間の領域
とを切出し、文字認識手段が文字の記載相当位置の領域
と文字間の領域とに対して認識を行い、マーク認識手段
がマークフィールドの各領域に対してそれぞれ行われた
認識の結果と該各選択項目に関する情報とから、選択マ
ークが付された選択項目を特定する構成にしたので、文
字間に選択マークが付されても、選択された選択項目を
特定できる。
【0074】第3の発明よれば、前処理手段と認識手段
とに接続されたマーク認識手段を設け、複数の選択項目
がマークフィールドに予め印字され、複数の選択項目の
いずれかには選択の意思を示す選択マークが付された第
1の帳票と、この複数の選択項目が印字されておらず、
選択された選択項目に対応する文字が後から記入された
第2の帳票とが混在して入力手段に与えられる場合、前
処理手段の切出したマークフィールドの領域をフォーマ
ットデータを用いて評価することにより、入力手段に与
えられた帳票が第1の帳票か第2の帳票かを判定し、そ
れが第1の帳票のときには、フォーマットデータに基づ
き文字認識手段の認識結果から選択マークが付された選
択項目を特定し、第2の帳票のときには、マークフィー
ルドに対して行われた文字認識手段の認識結果を選択さ
れた選択項目として出力するようにしたので、第1及び
第2の帳票が混在しても、帳票を分けることなく、自動
的にマーク認識が行える。
【0075】第4の発明によれば、複数の選択項目と他
のガイダンス文字とがマークフィールドに予め印字され
ると共に該複数の選択項目のいずれかには選択の意思を
示す選択マークが付された帳票に対し、複数の選択項目
を構成する各文字には認識を行うように文字認識手段を
制御し、ガイダンス文字には認識を行わないように文字
認識手段を制御し、複数の選択項目を構成する各文字に
対して行った認識の結果とフォーマットデータとから、
その選択マークが付された選択項目を特定するマーク認
識手段を設けたので、マーク認識を行う上で不要な文字
認識を行う時間が省略され、処理が高速化できる。第5
の発明よれば、複数の選択項目が予めマークフィールド
に印字されると共にこれら複数の選択項目にはない他の
選択枝を書込む記入領域が該マークフィールドに設定さ
れた帳票に対し、フォーマットデータと文字認識手段が
出力する認識結果とから記入領域に選択枝が書込まれて
いるか否かを判断し、該記入領域に選択枝が書き込まれ
ていると判断したときには、該記入領域に対する文字認
識手段の認識結果を出力し、その選択枝が書込まれてい
ないと判断したときには複数の選択項目の各文字に対す
る文字認識手段の認識結果とフォーマットデータとか
ら、選択マークが付された選択項目を特定するマーク認
識手段を設けたので、帳票の制限が緩和され、記入者に
記入負荷をかけない帳票を設計できる。
【0076】第6の発明は、複数の選択項目が予めマー
クフィールドに印字され、これら複数の選択項目のいず
れかには選択の意思を示す選択マークが付され、かつ、
他の選択項目には選択マーク以外のマークが付された帳
票に対し、前処理手段の切出した各領域の状態から選択
マーク以外のマークが付された他の選択項目を抽出し、
この抽出結果から選択マークが付された選択項目を特定
するマーク認識手段を設けたので、選択マークが付され
た選択項目と選択マーク以外のマークが付された選択項
目の両方がある帳票が入力されても、選択マークによっ
て選択された選択項目を特定できる。第7の発明は、複
数の選択項目が予めマークフィールドに印字され、複数
の選択項目のいずれかには選択の意思を示す選択マーク
が付され、かつ、他の選択項目のうちのいずれかには一
旦付された選択マークを取消す取消しマークが付された
帳票に対し、前処理手段の切出した各領域から取消しマ
ークが付された選択項目を抽出し、取消しマークが付さ
れた選択項目を除いた選択項目に対する文字認識手段の
認識結果とフォーマットデータとから、選択マークが付
された選択項目を特定するマーク認識手段を設けたの
で、取消しマークが付された帳票であっても、本来選択
された選択項目を確実に特定できる。
【0077】第8の発明によれば、複数の選択項目が予
めマークフィールドに印字され、該複数の選択項目のう
ちの選択する項目以外の項目に対して選択をしない意思
を示す非選択マークが付された帳票に対し、文字認識手
段の認識結果から非選択マークが付された選択項目を抽
出し、この抽出結果とフォーマットデータとから選択さ
れた選択項目を特定するマーク認識手段を設けたので、
非選択マークのみが付された帳票から、選択された選択
項目を特定できる。第9の発明によれば、複数の選択項
目が予めマークフィールドに印字されると共に該複数の
選択項目には適宜にマークが付されて選択された帳票に
対し、該各文字に該マークを付した状態のパターンをそ
れぞれ学習パターンとして認識辞書メモリに予め登録
し、文字認識手段が、前処理手段が切出した領域の特徴
と前記各学習パターン及び標準文字パターンとを照合し
て認識を行い、該認識結果とその信頼性を示すランク値
とを出力する構成とすると共に、フォーマットデータと
文字認識手段が出力する認識結果及びランク値とに基づ
き、選択された選択項目を特定するマーク認識手段を設
けたので、選択項目に選択マーク、非選択マーク、或い
はそれらの両方が付された帳票のいずれの場合でも、選
択された選択項目を特定できる。
【0078】第10の発明によれば、第9の発明のOC
Rにおける認識辞書には、選択マークが付された状態の
選択項目を構成する文字のパターンのみを学習パターン
として登録する構成にしたので、各選択項目に選択マー
クが付されたと仮定した場合のランク値に基づき、選択
項目が特定できるようになり、処理が簡単かつ高速化で
きる。第11の発明によれば、第9または第10の発明
のOCRにおいて、マーク認識手段は、前処理手段で切
出された各領域における情報を数値化し、該数値化した
情報と各ランク値とを統合した値に基づき、選択された
選択項目を特定する構成にしたので、マーク認識の精度
が向上できる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示すOCRの構成図
である。
【図2】従来のOCRを示す構成図である。
【図3】図2のOCRの動作を示すフローチャートであ
る。
【図4】図2の第1の課題を示す説明図である。
【図5】図2の第2の課題を示す説明図である。
【図6】図2の第3の課題を示す説明図である。
【図7】図2の第4の課題を示す説明図である。
【図8】図2の第5の課題を示す説明図である。
【図9】図1のOCRの動作を示すフローチャートであ
る。
【図10】図1で行うマーク認識の概念を示す説明図で
ある。
【図11】選択マーク51の他の付け方(その1)を示
す図である。
【図12】選択マーク51の他の付け方(その2)を示
す図である。
【図13】本発明の第2の実施形態を示すOCRの構成
図である。
【図14】図13で行うマーク認識の概念を示す説明図
である。
【図15】本発明の第3の実施形態を示すOCRの構成
図である。
【図16】図15で行うマーク認識の概念を示す説明図
である。
【図17】本発明の第4の実施形態を示すOCRの構成
図である。
【図18】図17で行うマーク認識の概念を示す説明図
である。
【図19】本発明の第5の実施形態を示すOCRの構成
図である。
【図20】図19で行うマーク認識の概念を示す説明図
である。
【図21】図19の処理手順の一例を示すフローチャー
トある。
【図22】本発明の第6の実施形態を示すOCRの構成
図である。
【図23】図22で行うマーク認識の概念を示す説明図
である。
【図24】本発明の第7の実施形態を示すOCRの構成
図である。
【図25】図24で行うマーク認識の概念を示す説明図
である。
【図26】本発明の第8の実施形態を示すOCRの構成
図である。
【図27】図26で行うマーク認識の概念を示す説明図
である。
【図28】本発明の第9の実施形態を示すOCRの構成
図である。
【図29】図28中の認識辞書メモリ84の学習パター
ンを示す説明図である。
【図30】図28で行うマーク認識の一例を示す説明図
である。
【図31】図28で行うマーク認識の他の例を示す説明
図である。
【図32】本発明の第10の実施形態を示すOCRの構
成図である。
【図33】図32で行うマーク認識の概念を示す説明図
である。
【図34】図19の他の処理手順を示すフローチャート
である。
【符号の説明】
30,61,63,64,66,73,81,82 マ
ーク認識CPU 31 主
制御CPU 32 メ
カコンCPU 33,60 前
処理CPU 34,83 認
識CPU 35 フ
ォーマットデータ 36 帳
票 37 搬
送系 38 イ
メージセンサ 41 A
/D変換器 42 イ
メージメモリ 43 パ
ターンメモリ 44 特
徴抽出メモリ 45,84,85 認
識辞書メモリ 51 選
択マーク 65 記
入領域 70 非
選択マーク 78 取
消マーク

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 帳票の光学的画像を入力してイメージに
    変換する入力手段と、 前記イメージを格納するイメージメモリと、 前記帳票における文字の記載形態を示すフォーマットデ
    ータに基づき、前記イメージメモリに格納されたイメー
    ジから前記文字の記載相当位置の領域を切出す前処理手
    段と、 前記前処理手段によって切出された領域に対する特徴を
    抽出し、該抽出された特徴に基づき前記帳票に記載され
    た前記文字の認識を文字単位で行う文字認識手段とを、
    備えた光学式文字読取装置において、 前記文字認識手段に接続され、前記入力手段に入力され
    た帳票が、任意数の文字でそれぞれ構成される複数の選
    択項目が設定されたマークフィールドに予め印字され、
    かつ該複数の選択項目のうちのいずれかには選択の意思
    を示す選択マークが付されている場合、前記フォーマッ
    トデータから該各選択項目の記載形態に関する情報を取
    得し、該マークフィールドの各前記領域に対してそれぞ
    れ行われた前記認識の結果と該各選択項目に関する情報
    とから、前記選択マークが付された選択項目を特定する
    マーク認識手段を設けたことを特徴とする光学式文字読
    取装置。
  2. 【請求項2】 前記前処理手段は、前記マークフィール
    ドの前記文字の記載相当位置の領域と該マークフィール
    ドで前記各選択項目をそれぞれ構成する該文字の間の領
    域とを切出し、 前記文字認識手段は、前記文字の記載相当位置の領域と
    前記文字の間の領域とに対して前記認識を行い、 前記マーク認識手段は、前記マークフィールドの前記各
    領域に対してそれぞれ行われた前記認識の結果と該各選
    択項目に関する情報とから、前記選択マークが付された
    選択項目を特定する構成にしたことを特徴とする請求項
    1記載の光学式文字読取装置。
  3. 【請求項3】 帳票の光学的画像を入力してイメージに
    変換する入力手段と、 前記イメージを格納するイメージメモリと、 前記帳票における文字の記載形態を示すフォーマットデ
    ータに基づき、前記イメージメモリに格納されたイメー
    ジから前記文字の記載相当位置の領域を切出す前処理手
    段と、 前記前処理手段によって切出された領域に対する特徴を
    抽出し、該抽出された特徴に基づき前記帳票に記載され
    た前記文字の認識を文字単位で行う文字認識手段とを、
    備えた光学式文字読取装置において、 前記前処理手段と前記文字認識手段とに接続されたマー
    ク認識手段を設け、 前記マーク認識手段は、 任意数の前記文字でそれぞれ構成される複数の選択項目
    がマークフィールドに予め印字され、該複数の選択項目
    のいずれかには選択の意思を示す選択マークが付された
    第1の帳票と、該マークフィールドには該複数の選択項
    目が印字されておらず、該複数の選択項目のうちの選択
    された選択項目に対応する任意数の該文字が後から記入
    された第2の帳票とが混在して前記入力手段に与えられ
    る場合、該第1の帳票のマークフィールドの前記フォー
    マットデータを取得し、前記前処理手段の切出したマー
    クフィールドの前記各領域を該取得したフォーマットデ
    ータを用いて評価することにより、該入力手段に与えら
    れた帳票が該第1の帳票か該第2の帳票かを判定し、 前記判定結果が前記第1の帳票のときには、前記フォー
    マットデータに基づき前記文字認識手段の認識結果から
    前記選択マークが付された前記選択項目を特定し、該判
    定結果が前記第2の帳票のときには、前記マークフィー
    ルドに対して行われた該文字認識手段の認識結果を前記
    選択された選択項目として出力する構成にしたことを、
    特徴とする光学式文字読取装置。
  4. 【請求項4】 帳票の光学的画像を入力してイメージに
    変換する入力手段と、 前記イメージを格納するイメージメモリと、 前記帳票における文字の記載形態を示すフォーマットデ
    ータに基づき、前記イメージメモリに格納されたイメー
    ジから前記文字の記載相当位置の領域を切出す前処理手
    段と、 前記前処理手段によって切出された領域に対する特徴を
    抽出し、該抽出された特徴に基づき前記帳票に記載され
    た前記文字の認識を文字単位で行う文字認識手段とを、
    備えた光学式文字読取装置において、 前記文字認識手段に接続され、任意数の前記文字でそれ
    ぞれ構成される複数の選択項目と他のガイダンス文字と
    がマークフィールドに予め印字されると共に該複数の選
    択項目のいずれかには選択の意思を示す選択マークが付
    された前記帳票に対し、該マークフィールドの前記フォ
    ーマットデータを入力し、該複数の選択項目を構成する
    各文字には前記認識を行うように前記文字認識手段を制
    御し、該ガイダンス文字には該認識を行わないように該
    文字認識手段を制御し、該複数の選択項目を構成する各
    文字に対して行った該認識の結果と該フォーマットデー
    タとから、該選択マークが付された選択項目を特定する
    マーク認識手段を、設けたことを特徴とする光学式文字
    読取装置。
  5. 【請求項5】 帳票の光学的画像を入力してイメージに
    変換する入力手段と、 前記イメージを格納するイメージメモリと、 前記帳票における文字の記載形態を示すフォーマットデ
    ータに基づき、前記イメージメモリに格納されたイメー
    ジから前記文字の記載相当位置の領域を切出す前処理手
    段と、 前記前処理手段によって切出された領域に対する特徴を
    抽出し、該抽出された特徴に基づき前記帳票に記載され
    た前記文字の認識を文字単位で行う文字認識手段とを、
    備えた光学式文字読取装置において、 前記文字認識手段に接続され、任意数の前記文字でそれ
    ぞれ構成される複数の選択項目が予めマークフィールド
    に印字されると共に該複数の選択項目にはない他の選択
    枝を書込む記入領域が該マークフィールドに設定された
    前記帳票に対し、該マークフィールドの前記フォーマッ
    トデータと前記文字認識手段が出力する認識結果とから
    該記入領域に該選択枝が書込まれているか否かを判断
    し、該記入領域に該選択枝が書き込まれていると判断し
    たときには、該記入領域に対する該文字認識手段の認識
    結果を出力し、該記入領域に該選択枝が書込まれていな
    いと判断したときには該複数の選択項目の該各文字に対
    する該文字認識手段の認識結果と該フォーマットデータ
    とから、該選択マークが付された選択項目を特定するマ
    ーク認識手段を、設けたことを特徴とする光学式文字読
    取装置。
  6. 【請求項6】 帳票の光学的画像を入力してイメージに
    変換する入力手段と、 前記イメージを格納するイメー
    ジメモリと、 前記帳票における文字の記載形態を示すフォーマットデ
    ータに基づき、前記イメージメモリに格納されたイメー
    ジから前記文字の記載相当位置の領域を切出す前処理手
    段と、 前記前処理手段によって切出された領域に対する特徴を
    抽出し、該抽出された特徴に基づき前記帳票に記載され
    た前記文字の認識を文字単位で行う文字認識手段とを、
    備えた光学式文字読取装置において、 前記前処理手段に接続され、任意数の前記文字でそれぞ
    れ構成される複数の選択項目が予めマークフィールドに
    印字され、該複数の選択項目のいずれかには選択の意思
    を示す選択マークが付され、かつ、他の選択項目には該
    選択マーク以外のマークが付された前記帳票に対し、該
    前処理手段の切出した前記各領域の状態から該選択マー
    ク以外のマークが付された該他の選択項目を抽出し、該
    抽出の結果から該選択マークが付された選択項目を特定
    するマーク認識手段を、設けたことを特徴とする光学式
    文字読取装置。
  7. 【請求項7】 帳票の光学的画像を入力してイメージに
    変換する入力手段と、 前記イメージを格納するイメー
    ジメモリと、 前記帳票における文字の記載形態を示すフォーマットデ
    ータに基づき、前記イメージメモリに格納されたイメー
    ジから前記文字の記載相当位置の領域を切出す前処理手
    段と、 前記前処理手段によって切出された領域に対する特徴を
    抽出し、該抽出された特徴に基づき前記帳票に記載され
    た前記文字の認識を文字単位で行う文字認識手段とを、
    備えた光学式文字読取装置において、 前記前処理手段と前記文字認識手段とに接続され、任意
    数の前記文字でそれぞれ構成される複数の選択項目が予
    めマークフィールドに印字され、該複数の選択項目のい
    ずれかには選択の意思を示す選択マークが付され、か
    つ、他の選択項目のうちのいずれかには一旦付された該
    選択マークを取消す取消しマークが付された前記帳票に
    対し、該前処理手段の切出した前記各領域から該取消し
    マークが付された選択項目を抽出し、該取消しマークが
    付された選択項目を除いた前記選択項目に対する前記文
    字認識手段の認識結果と前記フォーマットデータとか
    ら、該選択マークが付された選択項目を特定するマーク
    認識手段を、設けたことを特徴とする光学式文字読取装
    置。
  8. 【請求項8】 帳票の光学的画像を入力してイメージに
    変換する入力手段と、 前記イメージを格納するイメージメモリと、 前記帳票における文字の記載形態を示すフォーマットデ
    ータに基づき、前記イメージメモリに格納されたイメー
    ジから前記文字の記載相当位置の領域を切出す前処理手
    段と、 前記前処理手段によって切出された領域に対する特徴を
    抽出し、該抽出された特徴に基づき前記帳票に記載され
    た前記文字の認識を文字単位で行う文字認識手段とを、
    備えた光学式文字読取装置において、 前記文字認識手段に接続され、任意数の前記文字でそれ
    ぞれ構成される複数の選択項目が予めマークフィールド
    に印字され、該複数の選択項目のうちの選択する項目以
    外の項目に対して選択をしない意思を示す非選択マーク
    が付された帳票に対し、前記文字認識手段の認識結果か
    ら前記非選択マークが付された選択項目を抽出し、該抽
    出の結果と前記フォーマットデータとから該選択された
    選択項目を特定するマーク認識手段を、設けたことを特
    徴とする光学式文字読取装置。
  9. 【請求項9】 帳票の光学的画像を入力してイメージに
    変換する入力手段と、 前記イメージを格納するイメージメモリと、 前記帳票における文字の記載形態を示すフォーマットデ
    ータに基づき、前記イメージメモリに格納されたイメー
    ジから前記文字の記載相当位置の領域を切出す前処理手
    段と、 標準文字の特徴を示す標準文字パターンを格納する認識
    辞書メモリと、 前記前処理手段によって切出された領域に対する特徴を
    抽出し、該抽出された特徴と前記認識辞書メモリに格納
    された標準文字パターンとを照合して前記帳票に記載さ
    れた前記文字の認識を文字単位で行う文字認識手段と
    を、備えた光学式文字読取装置において、 前記認識辞書メモリには、任意数の前記文字でそれぞれ
    構成される複数の選択項目が予めマークフィールドに印
    字されると共に該複数の選択項目には適宜にマークが付
    されて選択された帳票に対し、該各文字に該マークを付
    した状態のパターンをそれぞれ学習パターンとして予め
    登録し、 前記文字認識手段は、前記抽出した特徴と前記各学習パ
    ターン及び前記標準文字パターンとを照合して前記認識
    を行い、該認識の結果とその信頼性を示すランク値とを
    出力する構成とすると共に、 前記文字認識手段に接続され、前記フォーマットデータ
    と該文字認識手段が出力する前記認識結果及びランク値
    とに基づき、前記選択された選択項目を特定するマーク
    認識手段を設けたことを特徴とする光学式文字読取装
    置。
  10. 【請求項10】 前記認識辞書には、前記選択項目に付
    される選択の意志を示す選択マークが付された状態の該
    選択項目を構成する文字のパターンのみを前記学習パタ
    ーンとして登録したことを特徴とする請求項9記載の光
    学式文字読取装置。
  11. 【請求項11】 前記マーク認識手段は、前記文字認識
    手段に接続されると共に前記前処理手段に接続され、該
    前処理手段で切出された各領域における情報を数値化
    し、該数値化した情報と前記各ランク値とを統合した値
    に基づき、前記選択された選択項目を特定する構成にし
    たことを特徴とする請求項9または10記載の光学式文
    字読取装置。
JP10151654A 1998-06-01 1998-06-01 光学式文字読取装置 Withdrawn JPH11345281A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10151654A JPH11345281A (ja) 1998-06-01 1998-06-01 光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10151654A JPH11345281A (ja) 1998-06-01 1998-06-01 光学式文字読取装置

Publications (1)

Publication Number Publication Date
JPH11345281A true JPH11345281A (ja) 1999-12-14

Family

ID=15523309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10151654A Withdrawn JPH11345281A (ja) 1998-06-01 1998-06-01 光学式文字読取装置

Country Status (1)

Country Link
JP (1) JPH11345281A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058485A (ja) * 2005-08-24 2007-03-08 Fuji Xerox Co Ltd 画像認識装置、画像認識方法および画像認識プログラム
JP2020067991A (ja) * 2018-10-26 2020-04-30 ネットスマイル株式会社 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058485A (ja) * 2005-08-24 2007-03-08 Fuji Xerox Co Ltd 画像認識装置、画像認識方法および画像認識プログラム
JP2020067991A (ja) * 2018-10-26 2020-04-30 ネットスマイル株式会社 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム

Similar Documents

Publication Publication Date Title
EP0063454B1 (en) Method for recognizing machine encoded characters
US5898157A (en) Automatic check reading device
US20100001073A1 (en) Image capture apparatus and method
EP1290621A1 (en) Character recognition, including method and system for processing checks with invalidated micr lines
JP3001065B2 (ja) プログラムの作成方法
JPH11345281A (ja) 光学式文字読取装置
US5887072A (en) Full address reading apparatus
JP2003242441A (ja) 帳票処理方法および装置並びにプログラム
JP3435374B2 (ja) 文字読取装置および文字認識方法
JP2000331117A (ja) 文書読取システム
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
JP3928739B2 (ja) 文書ファイリングシステム
JP4224914B2 (ja) 文字読取システム及び文字読取方法
JP3006294B2 (ja) 光学的文字読取装置
JPH1185899A (ja) 文字読み取り装置、その読み取り方法および記録媒体
JP2529421B2 (ja) 文字認識装置
JP2002259909A (ja) 文字読取装置
JPH03122786A (ja) 光学的文字読取装置
CN112446273A (zh) 信息处理装置以及存储介质
JPH07296102A (ja) データ入力方式
JP2570571B2 (ja) 光学文字読取装置
JPH0962789A (ja) 光学式文字読取装置のマーク認識方法
JP2002133358A (ja) 帳票読み取り方法
JPH09305712A (ja) 文字認識方法及び装置、及び文字認識用プログラムを記憶した記憶媒体
JPH05120475A (ja) 文字認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050802