JP2002259909A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JP2002259909A
JP2002259909A JP2001055010A JP2001055010A JP2002259909A JP 2002259909 A JP2002259909 A JP 2002259909A JP 2001055010 A JP2001055010 A JP 2001055010A JP 2001055010 A JP2001055010 A JP 2001055010A JP 2002259909 A JP2002259909 A JP 2002259909A
Authority
JP
Japan
Prior art keywords
mark
image
reading device
memory
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001055010A
Other languages
English (en)
Inventor
Kazuhiro Ishikawa
和弘 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2001055010A priority Critical patent/JP2002259909A/ja
Publication of JP2002259909A publication Critical patent/JP2002259909A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 マークガイドが非ドロップアウトカラーで帳
票に印刷されている場合でも、マーク無しの状態とマー
ク有りの状態との判別を可能にする。 【解決手段】 フォームイメージ格納部88はフォーム
イメージ(未記入状態の帳票のイメージ)を格納する。
フォーマットデータ格納部90は、ガイド域の位置情報
を含むフォーマットデータを格納する。帳票イメージ入
力部92は、入力イメージを取り込み、イメージメモリ
106に格納する。フォーム除去CPU80は、イメー
ジメモリおよびフォームイメージ格納部から入力イメー
ジおよびフォームイメージをそれぞれ読み出し、入力イ
メージからフォームイメージに含まれるパタンを除去し
たフォーム除去イメージを作成し、フォーム除去メモリ
108に格納する。マーク認識部86は、フォーマット
データおよびフォーム除去イメージに基づき、ガイド域
におけるマークの有無を検出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、帳票中に印字さ
れた文字で構成される複数の選択項目のうち、マークに
よって選択された選択項目を特定するというマーク認識
を行う文字読取装置に関する。
【0002】
【従来の技術】従来の文字読取装置は次のように動作す
る。まず、文字読取装置は、光学的手段を用いて帳票の
画像を取得する。次に文字読取装置は、取得した画像か
ら文字パタンの部分を切り出す。続いて文字読取装置
は、切り出した文字パタンの特徴抽出を行う。最後に文
字読取装置は、認識処理によって、抽出した特徴に合致
する文字コードを決定する。このように、文字読取装置
は、文字を認識することができる。認識処理を工夫すれ
ば、文字だけでなくマークの認識も行えるようになる。
【0003】
【発明が解決しようとする課題】しかしながら、マーク
の認識にあたっては次のような問題点がある。この問題
点を明らかにするため、以下に従来の文字読取装置の詳
細な説明を行う。
【0004】従来の文字読取装置の例を図20に示す。
この文字読取装置は、4つの中央処理装置(以下、CP
Uと称する。)、すなわち、主制御CPU10、メカコ
ンCPU12、前処理CPU14および検出CPU16
を備える。主制御CPU10が他の各CPU12、14
および16を統括して文字読取装置全体の制御を行う構
成になっている。また、主制御CPU10は、読み取り
に関する情報のフォーマットデータが格納されたフォー
マットデータ格納部18に接続されている。さらに主制
御CPU10は、所定の上位装置(不図示)に接続され
ている。
【0005】メカコンCPU12は、対象帳票を文字読
取装置に導入する機構を制御するものである。メカコン
CPU12は、帳票イメージ入力部20に接続されてい
る。帳票イメージ入力部20の構成を図21に示す。帳
票イメージ入力部20は、帳票搬送系22、レンズ2
4、光学フィルタ26、イメージセンサ28およびアナ
ログ/デジタル変換器(以下、A/D変換器と称す
る。)30により構成される。メカコンCPU12は、
帳票搬送系22およびイメージセンサ28に接続されて
いる。
【0006】この帳票イメージ入力部20では、帳票3
2の光学的画像が、レンズ24および光学フィルタ26
を介してイメージセンサ28に取り込まれるようになっ
ている。イメージセンサ28にはA/D変換器30が接
続され、このA/D変換器30にイメージメモリ34が
接続されている。イメージセンサ28は、帳票32の画
像を読み込むためのラインセンサである。これらイメー
ジセンサ28、レンズ24および光学フィルタ26が、
光学系の入力手段を構成している。イメージメモリ34
は、多値階調のデジタル画像を記憶することが可能なメ
モリである。このイメージメモリ34の出力側は前処理
CPU14に接続されている。
【0007】前処理CPU14は、イメージメモリ34
中のイメージの任意のアドレスの領域を切り出して2値
化する機能を有している。前処理CPU14の出力側は
パタンメモリ36に接続されている。パタンメモリ36
は、白黒2値の切り出された領域のイメージを格納する
メモリである。このパタンメモリ36の出力側は検出C
PU16に接続されている。
【0008】検出CPU16には、パタンメモリ36の
他に特徴抽出メモリ38および認識辞書メモリ40が接
続されている。検出CPU16は、前処理CPU14に
より切り出され、パタンメモリ36に格納された文字パ
タンの特徴抽出を行い、その特徴抽出結果を特徴抽出メ
モリ38に格納するものである。また、検出CPU16
は、特徴抽出メモリ38中の特徴抽出結果と認識辞書メ
モリ40中の認識辞書とのマッチングによって文字コー
ドを決定する機能を有している。
【0009】図22は、図20および図21に示す従来
の文字読取装置の動作を示すフローチャートである。図
20、図21および図22を参照して、従来の文字読取
装置の一般的な動作を説明する。
【0010】図21に示した帳票32内の読取枠42は
ドロップアウトカラーで印刷されており、読取枠42内
の記入文字または印刷文字44は非ドロップアウトカラ
ーで記入または印刷されている。図22のS1のステッ
プのイメージ取込み処理では、主制御CPU10がメカ
コンCPU12に対して、イメージ取込みの指示を行
う。この指示を受けたメカコンCPU12は、帳票搬送
系22を制御して、帳票32を搬送する。帳票32がイ
メージセンサ28および光学フィルタ26の前を通過す
ることで、帳票画像が取り込まれる。すなわち、帳票画
像は、レンズ24および光学フィルタ26を介してイメ
ージセンサ28に与えられ、イメージセンサ28がそれ
を光電変換する。これにより帳票画像はアナログ信号に
変換される。さらにこのアナログ信号はA/D変換器3
0によって、多値階調のデジタル画像に変換される。こ
のデジタル画像はイメージメモリ34に格納される。こ
のとき、ドロップアウトカラーの読取枠42は光学フィ
ルタ26を透過せず、非ドロップアウトカラーの記入文
字または印刷文字44のみが光学フィルタ26を透過す
る。よって、イメージメモリ34に取り込まれた帳票画
像46には、読取枠42のイメージは存在しない。
【0011】図22のS2のステップのフォーマット解
読処理において、読取枠42内の文字を切り出すため
に、主制御CPU10はフォーマットデータ格納部18
からフォーマットデータを読み出す。そして主制御CP
U10はフォーマットデータを解読することにより、イ
メージメモリ34上の読取枠相当位置48を計算する。
【0012】図23は、フォーマットデータの説明に供
する図である。図23には、帳票50の一部分が示され
ている。図23に示すように、帳票50上には複数の読
取枠52が配置されている。図23において、行位置5
4は、帳票50の上辺50aから読取行の中心までの距
離である。また、フィールド位置56は、帳票50の左
辺50bから最左端にある読取枠52までの距離であ
る。また、読取枠高さ58および読取枠幅60は、それ
ぞれ読取枠52の高さ(左辺50bに平行な方向の読取
枠52の長さ)および幅(上辺50aに平行な方向の読
取枠52の長さ)である。また、ピッチ62は読取枠5
2の配列ピッチである。また、文字数64は読取枠52
の個数である。これら行位置54、フィールド位置5
6、読取枠高さ58、読取枠幅60、ピッチ62および
文字数64等が、帳票の読取情報を示すためのフォーマ
ットデータに含まれる。つまり、フォーマットデータ
は、帳票上の読取枠の位置を示す情報である。
【0013】主制御CPU10は、計算した読取枠相当
位置48を前処理CPU14に送り、前処理CPU14
に文字切出しを指示する。図22のS3のステップの文
字切出し処理では、前処理CPU14が、与えられた読
取枠相当位置48に基づき、イメージメモリ34中の帳
票画像46から文字画像を切り出す。
【0014】図24は、文字切出しの説明に供する図で
ある。前処理CPU14は、イメージメモリ34中の帳
票画像46から、読取枠相当位置48で指定される1文
字分の文字画像をラスタスキャンによって読み出す。図
24中、矢印aの方向が主走査方向であり、矢印bの方
向が副走査方向である。また、図24中の下側にパタン
メモリ36の記憶内容36aを示している。前処理CP
U14は、読み出した文字画像66をパタンメモリ36
に格納する。このとき、前処理CPU14は文字画像6
6の2値化処理を行う。前処理CPU14は、文字画像
66に対し上下左右から枠詰めを行って、文字の領域を
示す文字位置68a、68b、68cおよび68dを求
める。
【0015】図22のS4のステップの文字認識処理で
は、検出CPU16が、パタンメモリ36中の各文字位
置68a、68b、68cおよび68dで示される領域
にある文字パタンの特徴抽出を行う。検出CPU16
は、特徴抽出結果を特徴抽出メモリ38に格納する。次
に、検出CPU16は、特徴抽出メモリ38中の特徴抽
出結果と認識辞書メモリ40上の認識辞書とのマッチン
グを行って、文字コードを決定する。続いて検出CPU
16は、決定した文字コードを主制御CPU10に出力
する。
【0016】図22のS5のステップの認識出力処理で
は、主制御CPU10が、受け取った文字コードを編集
して、上位装置へ出力する。
【0017】なお、上述した検出CPU16を主体とす
る文字認識部は、文字の認識とマークの認識とで異なっ
た処理を行う。文字認識部は、文字の認識にあっては上
述したように、文字切出し処理で得た文字パタンを文字
認識処理によって文字コードに変換する。また、文字認
識部は、マークの認識にあっては文字切出し処理で得た
文字パタンを構成する黒点の数などから、マークの有無
を判定する。然る後、文字認識装置は、例えばマーク有
りの場合は「1」を、マーク無しの場合は「0」を出力
する。
【0018】上述したマーク認識処理は、以下に説明す
るように、帳票の記入形態が選択式マークを使用するも
のである場合に利用される。
【0019】図25は選択式マークの説明に供する図で
ある。図25に示すように、帳票上には複数の選択用文
字70a、70b、70cおよび70dが印刷された選
択式マーク記入欄72が設けられることがある。これら
の選択用文字70a、70b、70cおよび70dはマ
ークガイドと呼ばれる。帳票記入者には、マークガイド
のいずれかの上にマーク74例えば丸印を重ねて記入し
てもらうようになっている。上述した文字認識部のマー
ク認識処理によって、各マークガイドを個別に含むガイ
ド域におけるマーク74の有無がそれぞれ判定される
と、どのマークガイドが帳票記入者により選択されたか
が文字読取装置に認識される。
【0020】なお、ガイド域は帳票上の上述した読取枠
内の領域に相当するものである。マークガイドに対して
は読取枠が印刷されていない場合があるので、このよう
な表現を用いることにする。
【0021】しかしながら、上述したマークガイドは非
ドロップアウトカラーで帳票に印刷されることが多い。
したがって、従来の文字読取装置で帳票イメージを取り
込むと、マークガイド自体もイメージとして取り込まれ
る。よって、マーク74のイメージとマークガイドのイ
メージとが共通のガイド域内に含まれてしまい、マーク
74のみを選択的に認識処理することができない。この
ため、マーク無しの状態とマーク有りの状態との判別が
困難である。
【0022】
【課題を解決するための手段】そこで、この発明の文字
読取装置によれば、帳票に印刷されたマークガイドを含
むガイド域におけるマークの有無を判定する文字読取装
置において、未記入状態の帳票のイメージに相当するフ
ォームイメージを格納するフォームイメージ格納部と、
ガイド域の位置情報を含むフォーマットデータを格納す
るフォーマットデータ格納部と、帳票のイメージを入力
イメージとして取り込む帳票イメージ入力部と、帳票イ
メージ入力部で取り込まれた入力イメージを格納するイ
メージメモリと、イメージメモリおよびフォームイメー
ジ格納部から入力イメージおよびフォームイメージをそ
れぞれ読み出し、入力イメージからフォームイメージに
含まれるパタンを除去したフォーム除去イメージを作成
するフォーム除去処理部と、フォーム除去イメージを格
納するフォーム除去メモリと、フォーマットデータ格納
部およびフォーム除去メモリからフォーマットデータお
よびフォーム除去イメージをそれぞれ読み出し、これら
フォーマットデータおよびフォーム除去イメージに基づ
いて、ガイド域におけるマークの有無を判定するマーク
認識部とを備えることを特徴とする。
【0023】ここでガイド域とは、1つのマークガイド
を含む帳票上の領域のことをいう。
【0024】この構成によれば、所定の文字およびマー
クの記入が終了した帳票のイメージをイメージメモリに
取り込み、取り込んだイメージから、未記入状態の帳票
のイメージに含まれるパタンを除去したフォーム除去イ
メージを作成するようにしたので、マークガイドが非ド
ロップアウトカラーであっても、マークのみが含まれた
ガイド域のイメージが取得できるようになる。よって、
このフォーム除去イメージと、ガイド域の位置情報を含
むフォーマットデータとを用いれば、ガイド域における
マークの有無を判定することができる。
【0025】
【発明の実施の形態】以下、図を参照して、この発明の
実施の形態につき説明する。なお、図は、この発明を理
解できる程度に接続関係や配置関係などを概略的に示す
ものに過ぎない。よってこの発明は、図示例に限定され
ることはない。また、各図において同様な構成成分につ
いては同一の番号を付して示すことにし、その重複する
成分についての説明は省略することがある。
【0026】[第1の実施の形態]図1は、第1の実施
の形態の文字読取装置の構成を示すブロック図である。
この文字読取装置は、帳票に印刷されたマークガイドを
含むガイド域におけるマークの有無を判定する機能を有
している。この文字読取装置は、5つの中央処理装置
(以下、CPUと称する。)、すなわち、主制御CPU
76、メカコンCPU78、フォーム除去CPU80、
前処理CPU82および検出CPU84を備えている。
主制御CPU76が他の各CPU78、80、82およ
び84を統括して文字読取装置全体の制御を行う構成に
なっている。
【0027】また、文字読取装置は、マーク認識部86
を備えている。このマーク認識部86には、上述した前
処理CPU82および検出CPU84が含まれている。
【0028】上述の主制御CPU76には、フォームイ
メージを格納したフォームイメージ格納部88が接続さ
れている。フォームイメージ格納部88は、未記入状態
の帳票のイメージであるフォームイメージを格納する記
憶装置である。主制御CPU76は、フォームイメージ
格納部88から読み出したフォームイメージを、フォー
ム除去CPU80に送るように構成されている。
【0029】また、主制御CPU76には、フォーマッ
トデータを格納したフォーマットデータ格納部90が接
続されている。フォーマットデータ格納部90は、読み
取りに関する情報、すなわち、帳票上のガイド域の位置
情報を含むフォーマットデータを格納する記憶装置であ
る。主制御CPU76は、フォーマットデータ格納部9
0から読み出したフォーマットデータを、前処理CPU
82に送るように構成されている。
【0030】また、主制御CPU76は、所定の上位装
置(不図示)に接続されている。
【0031】上述のメカコンCPU78は、読取帳票の
イメージを文字読取装置に導入する機構を制御するもの
である。メカコンCPU78は、帳票イメージ入力部9
2に接続されている。帳票イメージ入力部92は、読取
対象の帳票94のイメージを入力イメージとして取り込
む装置である。この帳票イメージ入力部92の構成を図
2に示す。
【0032】図2に示すように、帳票イメージ入力部9
2は、帳票搬送系96、レンズ98、光学フィルタ10
0、イメージセンサ102およびアナログ/デジタル変
換器(以下、A/D変換器と称する。)104により構
成される。メカコンCPU78は、帳票搬送系96およ
びイメージセンサ102に接続されている。
【0033】読取対象の帳票94の光学的画像は、レン
ズ98および光学フィルタ100を介してイメージセン
サ102に取り込まれるようになっている。イメージセ
ンサ102にはA/D変換器104が接続され、このA
/D変換器104にイメージメモリ106が接続されて
いる。イメージセンサ102は、帳票94の画像を読み
込むためのラインセンサである。これらイメージセンサ
102、レンズ98および光学フィルタ100が、光学
系の入力手段を構成している。
【0034】上述のイメージメモリ106は、帳票イメ
ージ入力部92で取り込まれた入力イメージを格納する
ためのメモリである。このイメージメモリ106は、多
値階調のデジタル画像を記憶することが可能である。こ
のイメージメモリ106の出力側はフォーム除去CPU
80に接続されている。
【0035】フォーム除去CPU(フォーム除去処理
部)80は、イメージメモリ106およびフォームイメ
ージ格納部88から入力イメージおよびフォームイメー
ジをそれぞれ読み出し、入力イメージからフォームイメ
ージに含まれるパタンを除去したフォーム除去イメージ
を作成するものである。このフォーム除去CPU80
は、イメージメモリ106中の任意のアドレスのイメー
ジデータを読み出してそれを2値化することができる。
フォーム除去CPU80は、その2値化したイメージに
対して、主制御CPU76から入力されたフォームイメ
ージに基づき、上述したフォーム除去処理を行う。フォ
ーム除去処理により得られたフォーム除去イメージは、
フォーム除去メモリ108に格納される。このフォーム
除去メモリ108は白黒2階調の画像を蓄えるメモリで
ある。このフォーム除去メモリ108の出力側は前処理
CPU82に接続されている。
【0036】また、上述のマーク認識部86は、フォー
マットデータおよびフォーム除去イメージに基づき、帳
票上のガイド域におけるマークの有無を判定するもので
ある。このマーク認識部86は、前処理CPU82、パ
タンメモリ110、検出CPU84、特徴抽出メモリ1
12および認識辞書メモリ114により構成される。
【0037】前処理CPU(前処理部)82は、フォー
ム除去メモリ108中の任意のアドレスのイメージデー
タを読み出すことができるように構成されている。前処
理CPU82の出力側はパタンメモリ110に接続され
ている。前処理CPU82は、主制御CPU76から送
られたフォーマットデータに基づき、フォーム除去メモ
リ80内のフォーム除去イメージからガイド域に相当す
る部分の画像を切り出すものである。前処理CPU82
は、その切り出した画像を、出力側に接続されたパタン
メモリ110に一時的に保存する。パタンメモリ110
は、前処理CPU82により切り出された白黒2値のイ
メージを格納するメモリである。このパタンメモリ11
0の出力側は検出CPU84に接続されている。
【0038】検出CPU(検出部)84には、パタンメ
モリ110の他に特徴抽出メモリ112および認識辞書
メモリ114が接続されている。検出CPU84は、前
処理CPU82によってパタンメモリ110に格納され
た画像の特徴抽出を行い、その特徴抽出結果を特徴抽出
メモリ112に格納するように構成してある。認識辞書
メモリ114には、あらかじめ行われた学習処理によっ
て、様々な文字パタンの特徴を含む認識辞書が収められ
ている。検出CPU84は、特徴抽出メモリ112中の
特徴抽出結果と認識辞書メモリ114中の認識辞書との
マッチングによって文字コードを決定する。
【0039】また、検出CPU84は、パタンメモリ1
10に格納された画像が、マークが記入される可能性の
あるガイド域の画像に相当する場合、この画像中のマー
クを構成する画素(黒画素)の個数を計数し、この計数
結果に応じてマークの有無を判定することができるよう
に構成してある。そのため、認識辞書メモリ114に
は、マーク有無判定用の閾値が記憶されている。検出C
PU84で計数された画素の個数は特徴抽出メモリ11
2に格納される。検出CPU84は、特徴抽出メモリ1
12中の計数結果と認識辞書メモリ114中の閾値との
対比により、マークの有無を判定する。
【0040】次に、第1の実施の形態の文字読取装置の
動作につき説明する。図3は、この文字読取装置の動作
フローを示すフローチャートである。
【0041】まず、文字読取装置はイメージ取込み処理
を実行する(図3のS11)。この処理が開始される
と、主制御CPU76は、メカコンCPU78に対し
て、イメージ取込みを指示する。この指示を受けたメカ
コンCPU78は、帳票搬送系96を制御して帳票94
を搬送し、帳票94をイメージセンサ102および光学
フィルタ100の前を通過させる。この結果、イメージ
センサ102に帳票画像が取り込まれる。この帳票画像
は、レンズ98および光学フィルタ100を介してイメ
ージセンサ102に与えられる。また、イメージセンサ
102は取り込んだ帳票画像を光電変換する。この結
果、帳票画像はアナログ信号に変換される。さらにこの
アナログ信号はA/D変換器104によって、多値階調
のデジタル画像に変換される。このデジタル画像はイメ
ージメモリ106に入力イメージとして格納される。
【0042】図4に、入力イメージの一例を示す。図4
に示すように、入力イメージ116中の帳票の紙面に対
応する部分には、選択式マーク記入欄118aおよび1
18bなどが設けられている。一方の選択式マーク記入
欄118aには、性別を示す「男」および「女」の文字
がそれぞれマークガイドとして、非ドロップアウトカラ
ーで印刷されている。また、他方の選択式マーク記入欄
118bには、年号を示す「明」、「大」、「昭」およ
び「平」の文字がそれぞれマークガイドとして、非ドロ
ップアウトカラーで印刷されている。帳票記入者には、
各選択式マーク記入欄内のマークガイドのいずれかの位
置に、非ドロップアウトカラーで所定のマークを記入し
てもらう。この例では、図4に示すように、「男」およ
び「昭」のマークガイドに、それぞれ丸印によるマーク
120aおよび120bが記入されている。したがっ
て、この例では、帳票記入者によって「男」および
「昭」がそれぞれ選択されている。帳票上の読取枠はド
ロップアウトカラーで印字されているため、入力イメー
ジ116上には現れていない。
【0043】次に、文字読取装置はフォーム除去処理を
実行する(図3のS12)。まず、主制御CPU76
は、フォームイメージ格納部88から読取帳票94に対
応する所定のフォームイメージを読み出し、それをフォ
ーム除去CPU80に送る。次に、フォーム除去CPU
80は、イメージメモリ106中の入力イメージ全体
を、ラスタスキャンによって読み出して2値化する。こ
の例では、入力イメージの帳票紙面に対応する部分が白
画素とされ、入力イメージの文字パタンなどに相当する
部分が黒画素とされる。次いでフォーム除去CPU80
は、2値化した入力イメージから、主制御CPU76か
ら入力されたフォームイメージに含まれるパタンを除去
したフォーム除去イメージを作成する。フォーム除去C
PU80は、作成したフォーム除去イメージをフォーム
除去メモリ108に保存する。
【0044】図5に、この例のフォームイメージを示
す。図5に示すように、フォームイメージ122は、図
4に示した入力イメージ116から、マーク120aお
よび120bのパタンを除去したものに相当する。すな
わち、フォームイメージ122は、マーク未記入状態の
帳票94の入力イメージに相当する。実際にこのフォー
ムイメージ122は、マーク未記入状態の帳票94のイ
メージを上述したイメージ取込み処理(図3のS11)
と同様にして取り込み、そのイメージを2値化したもの
である。このようなフォームイメージ122を、あらか
じめフォームイメージ格納部88に登録しておく。な
お、この登録に際しては、フォーマットデータの登録に
併せて行われるのが好適である。
【0045】また、図6に、この例のフォーム除去イメ
ージを示す。図6に示すように、フォーム除去イメージ
124は、図4に示した入力イメージ116から、図5
に示したフォームイメージ122に含まれるパタンを除
去したものに相当する。上述したフォーム除去処理によ
って、入力イメージ116からマークガイドなどのパタ
ンが除去されるので、フォーム除去イメージ124に
は、フォームイメージ122と異なる部分、すなわち記
入されたマーク120aおよび120bのパタンのみが
残っている。フォーム除去処理の手順は任意好適なもの
で構わないが、例えば、フォームイメージ上にある黒点
の座標に対応する、入力イメージ上の黒点を白に置き換
えることによって実現できる。
【0046】次に、文字読取装置はフォーマット解読処
理を実行する(図3のS13)。すなわち、主制御CP
U76は、フォーマットデータ格納部90からフォーマ
ットデータを読み出して、そのフォーマットデータを解
読する。フォーマットデータには、図23を参照して説
明した読取枠の場合と同様に、行位置、フィールド位
置、ガイド域高さ、ガイド域幅、ピッチおよび文字数等
といった、帳票の読取情報が含まれている。図7には、
読取対象の帳票94の一部が示されている。例えば、帳
票94上の選択式マーク記入欄118aでは、「男」お
よび「女」が印刷された部分がそれぞれガイド域126
aおよび126bである。フォーマットデータは、フォ
ーム除去イメージ上の、ガイド域126aおよび126
bに相当する位置(以下、ガイド域相当位置と称す
る。)を示す情報として用いられる。
【0047】次に、文字読取装置は文字切出し処理を実
行する(図3のS14)。まず、主制御CPU76が、
計算したガイド域相当位置を前処理CPU82に送っ
て、前処理CPU82に文字切出しを指示する。続い
て、前処理CPU82が、与えられたガイド域相当位置
に基づき、フォーム除去メモリ108中のフォーム除去
イメージからガイド域に相当する部分の画像をラスタス
キャンによって読み出す(切り出す)。切り出された画
像はパタンメモリ110に格納される。パタンメモリ1
10に保持された1つの画像には1つの文字パタン(あ
るいはマークパタン)が含まれている。続いて、前処理
CPU82は、図24を参照して説明したように、パタ
ンメモリ110に保持された画像に対して上下左右から
枠詰めを行うことにより、この文字パタンの領域を示す
文字位置を求める。前処理CPU82は、求めた文字位
置を検出CPU84に出力する。
【0048】次に、文字読取装置は文字認識処理を実行
する(図3のS15)。検出CPU84は、前処理CP
U82で求められた文字位置に基づき、パタンメモリ1
10中の文字位置で示される領域にある文字パタンの特
徴抽出を行う。検出CPU84は、特徴抽出結果を特徴
抽出メモリ112に格納する。次に、検出CPU84
は、特徴抽出メモリ112中の特徴抽出結果と認識辞書
メモリ114上の認識辞書とのマッチングを行い、文字
コードを決定する。続いて検出CPU84は、決定した
文字コードを主制御CPU76に出力する。
【0049】なお、マークパタンの特徴抽出は、検出C
PU84がマークパタンを構成する黒点の数を計数する
ことによって行われる。検出CPU84は、この計数結
果を特徴抽出メモリ112に格納する。次いで検出CP
U84は、この計数結果と認識辞書メモリ114中のマ
ーク有無判定用閾値とを比較する。例えば、検出CPU
84は、計数結果が閾値よりも大きい場合、マーク有り
と判定する。また、検出CPU84は、計数結果が閾値
よりも小さい場合、マーク無しと判定する。そして例え
ば、検出CPU84は、マーク有りの場合は「1」、マ
ーク無しの場合は「0」を文字コードとして主制御CP
U76に出力する。
【0050】次に、文字読取装置は認識出力処理を実行
する(図3のS16)。すなわち、主制御CPU76
は、フォーマットデータを参照して、検出CPU84か
ら送られた文字コードを編集し、その編集結果を上位装
置へ出力する。フォーマットデータには出力形式が指定
されている。例えば図7に示した帳票94では、選択式
マーク記入欄118aのガイド域126aおよび126
bにはそれぞれ「男」および「女」のマークガイドが印
刷されている。この情報はフォーマットデータの登録時
には分かっている。したがって、認識結果でガイド域1
26aおよび126bのどちらかにマーク有りという出
力が得られたなら、例えばマーク有りと判断されたガイ
ド域内のマークガイドに対応する文字コードを、上位装
置へ出力するように構成される。例えば、主制御CPU
76は、ガイド域126a内にマーク有りという認識結
果を受けた場合は「男」という文字コードを、あるいは
ガイド域126b内にマーク有りという認識結果を受け
た場合は「女」という文字コードをそれぞれ上位装置へ
出力する。また、主制御CPU76は、1つの選択式マ
ーク記入欄において、複数のガイド域にマーク有りとい
う認識結果を受けた場合や、いずれのガイド域にもマー
クが無いという認識結果を受けた場合は、「不明」に該
当する文字コード(例えば「RJ」)を上位装置へ出力
する。
【0051】また、複数のガイド域が選択式マーク記入
欄を構成している場合は、上述した黒画素の計数結果が
最も大きいガイド域を、選択式マーク記入欄におけるマ
ークの付与位置として判定するように検出CPU84を
構成しても良い。このとき、各計数結果の間に所定の大
きさの差が無い場合は、マークの付与位置が不明である
と判定される。
【0052】以上説明したように、第1の実施の形態の
文字読取装置によれば、マークガイドが非ドロップアウ
トカラーの場合においても、マーク無しとマーク有りと
の状態の判別が容易に行える。
【0053】また、従来の文字読取装置に、フォーム除
去処理に係る構成を加えるだけで済むので、構築が容易
にできる。
【0054】[第2の実施の形態]図8は、第2の実施
の形態の文字読取装置の構成を示すブロック図である。
この文字読取装置は、帳票に印刷されたマークガイドを
含むガイド域におけるマークの有無を判定する機能を有
している。この文字読取装置は、5つの中央処理装置
(以下、CPUと称する。)、すなわち、主制御CPU
76、メカコンCPU78、パタン除去CPU128、
前処理CPU82および検出CPU84を備えている。
主制御CPU76が他の各CPU78、128、82お
よび84を統括して文字読取装置全体の制御を行う構成
になっている。
【0055】また、文字読取装置はマーク認識部86を
備えている。このマーク認識部86には、上述した前処
理CPU82および検出CPU84が含まれている。
【0056】上述の主制御CPU76には、フォームパ
タン130とフォーマットデータとを格納したフォーマ
ットデータ格納部132が接続されている。フォームパ
タン130は、未記入状態の帳票のガイド域を含む読取
フィールドのイメージに相当する。フォーマットデータ
は、第1の実施の形態と同様に、読み取りに関する情
報、すなわち、帳票上のガイド域の位置情報を含むデー
タである。主制御CPU76は、フォーマットデータ格
納部132から読み出したフォームパタン130を、パ
タン除去CPU128に送るように構成されている。ま
た、主制御CPU76は、フォーマットデータ格納部1
32から読み出したフォーマットデータを、前処理CP
U82に送るように構成されている。
【0057】また、主制御CPU76は、所定の上位装
置(不図示)に接続されている。
【0058】上述のメカコンCPU78は、第1の実施
の形態で説明したように、帳票イメージ入力部92を制
御して、読取帳票のイメージを文字読取装置に導入する
ものである。帳票イメージ入力部92は、図2を参照し
て説明したものと同じものである。帳票イメージ入力部
92で取り込まれた入力イメージは、イメージメモリ1
06に格納される。このイメージメモリ106も、第1
の実施の形態で説明したものと同じものである。このイ
メージメモリ106の出力側はパタン除去CPU128
に接続されている。
【0059】パタン除去CPU(パタン除去処理部)1
28は、イメージメモリ106およびフォーマットデー
タ格納部132から入力イメージおよびフォームパタン
130をそれぞれ読み出し、読み出した入力イメージか
ら読取フィールドのイメージ(以下、フィールドイメー
ジと称する。)を切り出し、然る後、切り出したフィー
ルドイメージからフォームパタン130を除去したパタ
ン除去イメージを作成するものである。このパタン除去
CPU128は、イメージメモリ106中の任意のアド
レスのイメージデータを読み出してそれを2値化するこ
とができる。パタン除去CPU128は、2値化したフ
ィールドイメージに対して、主制御CPU76から入力
されたフォームパタンに基づき、上述したパタン除去処
理を行う。パタン除去処理により得られたパタン除去イ
メージ134は、パタン除去メモリ136に格納され
る。このパタン除去メモリ136は、白黒2階調の画像
を蓄えるメモリである。このパタン除去メモリ136の
出力側は前処理CPU82に接続されている。
【0060】また、上述のマーク認識部86の構成は、
第1の実施の形態で説明したものと同じ構成である。す
なわち、このマーク認識部86は、前処理CPU82、
パタンメモリ110、検出CPU84、特徴抽出メモリ
112および認識辞書メモリ114により構成される。
この例のマーク認識部86は、フォーマットデータおよ
びパタン除去イメージに基づき、帳票上のガイド域にお
けるマークの有無を判定する。
【0061】前処理CPU(前処理部)82は、パタン
除去メモリ136中の任意のアドレスのイメージデータ
を読み出すことができるように構成されている。前処理
CPU82の出力側はパタンメモリ110に接続されて
いる。前処理CPU82は、主制御CPU76から送ら
れたフォーマットデータに基づき、パタン除去メモリ1
36内のパタン除去イメージ134からガイド域に相当
する部分の画像を切り出すものである。前処理CPU8
2は、その切り出した画像を、出力側に接続されたパタ
ンメモリ110に一時的に保存する。パタンメモリ11
0は、前処理CPU82により切り出された白黒2値の
イメージを格納するメモリである。このパタンメモリ1
10の出力側は検出CPU84に接続されている。
【0062】検出CPU(検出部)84、特徴抽出メモ
リ112および認識辞書メモリ114については、第1
の実施の形態で説明した通りであるから、ここではその
説明を省略する。
【0063】次に、第2の実施の形態の文字読取装置の
動作につき説明する。図9は、この文字読取装置の動作
フローを示すフローチャートである。
【0064】まず、文字読取装置はイメージ取込み処理
を実行する(図9のS21)。この処理は、第1の実施
の形態で説明した処理と同様にして行われる。この処理
の結果、イメージメモリ106に、図4に示したような
入力イメージが格納される。
【0065】次に、文字読取装置はフォーマット解読処
理を実行する(図9のS22)。すなわち、主制御CP
U76は、フォーマットデータ格納部132からフォー
マットデータを読み出して、そのフォーマットデータを
解読する。フォーマットデータには、図23を参照して
説明した読取枠の場合と同様に、行位置、フィールド位
置、ガイド域高さ、ガイド域幅、ピッチおよび文字数等
といった、帳票の読取情報が含まれている。
【0066】次に、文字読取装置はパタン除去処理を実
行する(図9のS23)。まず、主制御CPU76は、
フォーマットデータ格納部132から読取帳票94に対
応する所定のフォームパタンを読み出し、それをパタン
除去CPU128に送る。次に、パタン除去CPU12
8は、主制御CPU76で解読されたフォーマットデー
タに基づき、イメージメモリ106中の入力イメージの
読取フィールドに相当する部分(フィールドイメージ)
を、ラスタスキャンによって読み出して2値化する。こ
の例では、この2値化処理によって、フィールドイメー
ジの帳票紙面に対応する部分が白画素とされ、フィール
ドイメージの文字パタンなどに相当する部分が黒画素と
される。次いでパタン除去CPU128は、2値化した
フィールドイメージから、主制御CPU76から入力さ
れたフォームパタンを除去したパタン除去イメージを作
成する。パタン除去CPU128は、作成したパタン除
去イメージをパタン除去メモリ136に保存する。
【0067】図10に、この例のフィールドイメージを
示す。図10に示すように、フィールドイメージ138
は、図4に示した入力イメージ116の、選択式マーク
記入欄118aを含む領域のイメージである。フィール
ドイメージ138中には、「男」および「女」といった
マークガイドが印字されている。この例では、「男」の
側にマーク120aが記入されている。
【0068】また、図11に、この例のフォームパタン
を示す。図11に示すように、フォームパタン130
は、図10に示したフィールドイメージ138から、マ
ーク120aのイメージを除去したものに相当する。す
なわち、フォームパタン130は、マーク未記入状態の
帳票94の入力イメージの読取フィールドの部分のイメ
ージに相当する。実際にこのフォームパタン130は、
マーク未記入状態の帳票94のイメージを上述したイメ
ージ取込み処理(図9のS21)と同様にして取り込
み、そのイメージからフィールドイメージを切り出し、
このフィールドイメージを2値化したものである。この
ようなフォームパタン130を、あらかじめフォーマッ
トデータ格納部132に登録しておく。なお、この登録
に際しては、フォーマットデータの登録に併せて行われ
るのが好適である。
【0069】また、図12に、この例のパタン除去イメ
ージを示す。図12に示すように、パタン除去イメージ
134は、図10に示したフィールドイメージ138か
ら、図11に示したフォームパタン130を除去したも
のに相当する。上述したパタン除去処理によってフィー
ルドイメージ138からマークガイドなどのパタンが除
去されるので、パタン除去イメージ134には、フォー
ムパタン130と異なる部分、すなわち記入されたマー
ク120aのパタンのみが残っている。パタン除去処理
の手順は任意好適なもので構わないが、例えば、フォー
ムパタン上にある黒点の座標に対応する、フィールドイ
メージ上の黒点を白に置き換えることによって実現でき
る。
【0070】次に、文字読取装置は文字切出し処理を実
行する(図9のS24)。第1の実施の形態と同様に、
前処理CPU82は、主制御CPU76から与えられた
ガイド域相当位置に基づき、パタン除去メモリ136中
のパタン除去イメージからガイド域に相当する部分の画
像をラスタスキャンによって切り出す。切り出された画
像はパタンメモリ110に格納される。パタンメモリ1
10に保持された1つの画像には1つの文字パタン(あ
るいはマークパタン)が含まれている。前処理CPU8
2は、文字パタンの領域を示す文字位置を求め、求めた
文字位置を検出CPU84に出力する。
【0071】次に、文字読取装置は文字認識処理を実行
する(図9のS25)。第1の実施の形態と同様に、検
出CPU84は、前処理CPU82で求められた文字位
置に基づき、パタンメモリ110中の文字パタンの特徴
抽出を行い、文字コードを決定する。検出CPU84
は、決定した文字コードを主制御CPU76に出力す
る。
【0072】また、マークパタンの特徴抽出は、第1の
実施の形態で説明したように、検出CPU84が、マー
クパタンを構成する黒点の数を計数することによって行
われる。検出CPU84は、この計数結果を用いて、例
えばマーク有りの場合は「1」を、あるいはマーク無し
の場合は「0」を文字コードとして主制御CPU76に
出力する。
【0073】次に、文字読取装置は認識出力処理を実行
する(図9のS26)。第1の実施の形態と同様に、主
制御CPU76が検出CPU84から受けた文字コード
を編集し、その編集結果を上位装置へ出力する。
【0074】以上説明したように、第2の実施の形態の
文字読取装置によれば、マークガイドが非ドロップアウ
トカラーの場合においても、マーク無しとマーク有りと
の状態の判別が容易に行える。
【0075】また、従来の文字読取装置に、パタン除去
処理に係る構成を加えるだけで済むので、構築が容易に
できる。
【0076】さらに、読取フィールドに係るフォームパ
タンのみを登録すればよいので、第1の実施の形態の構
成に比べ、メモリ・ディスク容量の削減が図れる。
【0077】[第3の実施の形態]図13は、第3の実
施の形態の文字読取装置の構成を示すブロック図であ
る。この文字読取装置は、帳票に印刷されたマークガイ
ドを含むガイド域におけるマークの有無を判定する機能
を有している。特に、この実施の形態の文字読取装置
は、複数のガイド域を含む選択式マーク記入欄における
マークの付与位置を検出するのに好適である。例えば、
ガイド域からマークがはみ出ている場合にも、そのマー
クが記入されたガイド域を特定することができる。
【0078】この実施の形態の文字読取装置は、4つの
中央処理装置(以下、CPUと称する。)、すなわち、
主制御CPU76、メカコンCPU78、パタン除去C
PU128およびマーク検出CPU140を備えてい
る。主制御CPU76が他の各CPU78、128およ
び140を統括して文字読取装置全体の制御を行う構成
になっている。
【0079】また、文字読取装置はマーク認識部142
を備えている。このマーク認識部142には、上述した
マーク検出CPU140が含まれている。
【0080】第2の実施の形態と同様に、上述の主制御
CPU76には、フォームパタン130とフォーマット
データとを格納したフォーマットデータ格納部132が
接続されている。主制御CPU76は、フォーマットデ
ータ格納部132から読み出したフォームパタン130
を、パタン除去CPU128に送るように構成されてい
る。また、主制御CPU76は、フォーマットデータ格
納部132から読み出したフォーマットデータを、前処
理CPU82に送るように構成されている。
【0081】また、主制御CPU76は、所定の上位装
置(不図示)に接続されている。
【0082】上述のメカコンCPU78は、第1の実施
の形態で説明したように、帳票イメージ入力部92を制
御して、読取帳票のイメージを文字読取装置に導入する
ものである。帳票イメージ入力部92は、図2を参照し
て説明したものと同じものである。帳票イメージ入力部
92で取り込まれた入力イメージは、イメージメモリ1
06に格納される。このイメージメモリ106も、第1
の実施の形態で説明したものと同じものである。このイ
メージメモリ106の出力側はパタン除去CPU128
に接続されている。
【0083】パタン除去CPU128は、第2の実施の
形態で説明したものと同じものである。第2の実施の形
態で説明したように、パタン除去CPU128は、イメ
ージメモリ106およびフォーマットデータ格納部13
2から入力イメージおよびフォームパタン130をそれ
ぞれ読み出し、読み出した入力イメージからフィールド
イメージを切り出す。然る後、パタン除去CPU128
は、切り出したフィールドイメージからフォームパタン
130を除去したパタン除去イメージを作成する。作成
したパタン除去イメージ134aは、パタン除去メモリ
136に格納される。このパタン除去メモリ136は白
黒2階調の画像を蓄えるメモリであり、このパタン除去
メモリ136の出力側はマーク検出CPU140に接続
されている。
【0084】また、上述のマーク認識部142は、マー
ク検出CPU140およびマーク検出メモリ144によ
り構成される。マーク検出CPU(マーク検出部)14
0は、パタン除去メモリ136からパタン除去イメージ
を読み出して、パタン除去イメージ中のマークを構成す
る画素の位置情報(以下、マーク位置と称する。)を検
出するものである。マーク検出CPU140は、パタン
除去メモリ136中の任意のアドレスのイメージデータ
を読み出すことができる。マーク検出メモリ144は、
マーク検出CPU140で検出されたマーク位置を一時
的に保存するためのメモリである。
【0085】上述したように、この例の読取帳票には、
複数のガイド域を含む選択式マーク記入欄が設けられて
いる。マーク検出CPU140によれば、フォーマット
データに基づき、マーク検出メモリ144内のマーク位
置のうちのガイド域内に含まれるマーク位置をガイド域
ごとに計数する。そして、マーク検出CPU140は、
これらの計数結果に応じて、最も多くのマーク位置が含
まれるガイド域を、選択式マーク記入欄におけるマーク
の付与位置として判定するように構成されている。
【0086】次に、第3の実施の形態の文字読取装置の
動作につき説明する。図14は、この文字読取装置の動
作フローを示すフローチャートである。
【0087】まず、文字読取装置はイメージ取込み処理
を実行する(図14のS31)。この処理により、第1
および第2の実施の形態で説明したように、イメージメ
モリ106に入力イメージが格納される。
【0088】次に、文字読取装置はフォーマット解読処
理を実行する(図14のS32)。第2の実施の形態で
説明したように、主制御CPU76は、フォーマットデ
ータ格納部132からフォーマットデータを読み出し
て、そのフォーマットデータを解読する。
【0089】次に、文字読取装置はパタン除去処理を実
行する(図14のS33)。第2の実施の形態で説明し
たように、パタン除去CPU128は、イメージメモリ
106から読み出したフィールドイメージから、主制御
CPU76から送られたフォームパタンおよびフォーマ
ットデータを用いて、パタン除去イメージを作成する。
パタン除去CPU128は、作成したパタン除去イメー
ジ134aをパタン除去メモリ136に保存する。
【0090】図15に、この例のフィールドイメージを
示す。図15に示すように、フィールドイメージ146
には、入力イメージ中の選択式マーク記入欄の領域が含
まれている。フィールドイメージ146中には、「男」
および「女」といったマークガイドが印刷されている。
この例では、「男」の側にマーク148が記入されてい
るが、そのマーク148の一部が「女」の側まで及んで
いる。
【0091】また、フォームパタンとしては、図11に
示したフォームパタン130が用いられる。
【0092】図16に、この例のパタン除去イメージを
示す。図16に示すように、パタン除去イメージ134
aは、図15に示したフィールドイメージ146から、
図11に示したフォームパタン130を除去したものに
相当する。パタン除去イメージ134aには、マーク1
48のパタンのみが残る。なお、図16には、ガイド域
150aおよび150bの位置を示してある。ガイド域
150aは「男」のマークガイドのガイド域に相当し、
ガイド域150bは「女」のマークガイドのガイド域に
相当する。マーク148はガイド域150aをはみ出て
いて、ガイド域150bまで及んでいる。
【0093】次に、文字読取装置はマーク検出処理を実
行する(図14のS34)。この処理では、マーク検出
CPU140が、パタン除去メモリ136中のパタン除
去イメージ134aからマーク148の位置を検出す
る。図16に示すように、パタン除去イメージ134a
上の、黒点で構成されるパタンがマーク148のパタン
に相当している。マーク検出CPU140は、パタン除
去イメージ134a上の黒点の位置をマーク148の位
置として検出する。マーク検出CPU140は、検出し
たマーク位置を、マーク検出メモリ144に保存する。
【0094】次に、文字読取装置はマーク認識処理を実
行する(図14のS35)。マーク検出CPU140
は、マーク検出メモリ144中のマーク位置と、フォー
マット解読処理(図14のS32)で得られたガイド域
の位置とに基づき、どのガイド域にマークが記入されて
いるかを認識する。そして、マーク検出CPU140
は、例えば認識したガイド域に印刷されたマークガイド
に対応する文字コードを、主制御CPU76に出力す
る。
【0095】図16に示すパタン除去イメージ134a
を例にとると、マーク検出CPU140は、各ガイド域
150aおよび150b内に含まれるマーク148の位
置をそれぞれ計数する。その結果、マーク検出CPU1
40は、ガイド域150a内のマーク位置の個数が、ガ
イド域150b内のマーク位置の個数に比べて大きいこ
とを検出する。よって、マーク検出CPU140は、マ
ーク148がガイド域150aに記入されたものである
ことを認識する。然る後、マーク検出CPU140は、
ガイド域150a内のマークガイド、すなわち、「男」
に対応する文字コードを主制御CPU76に出力する。
【0096】このように、マーク検出CPU140は、
マーク位置のガイド域ごとの計数結果に応じて、最も多
くのマーク位置が含まれるガイド域を、選択式マーク記
入欄におけるマークの付与位置として判定する。なお、
マーク検出CPU140は、各計数結果の間に所定の大
きさの差が無い場合は、マークの付与位置が不明である
と判定するように構成しても良い。図16を例にとる
と、マーク検出CPU140は、ガイド域150a内の
マーク位置の個数と、ガイド域150b内のマーク位置
の個数との差が所定の値よりも小さい場合に、マーク1
48の付与位置が不明であると判定し、「不明」に該当
する文字コード「RJ」を主制御CPU76に出力す
る。
【0097】次に、文字読取装置は認識出力処理を実行
する(図14のS36)。第1の実施の形態と同様に、
主制御CPU76がマーク検出CPU140から受けた
文字コードを編集して、その編集結果を上位装置へ出力
する。例えば、主制御CPU76は、マーク検出CPU
140から「男」や「RJ」という文字コードを受けた
場合はそれらを上位装置へ出力する。また、主制御CP
U76は、選択式マーク記入欄にマークの付与位置が複
数有ると判定された場合や、選択式マーク記入欄にマー
クの付与位置がひとつも無いと判定された場合は、「不
明」に該当する文字コード「RJ」を上位装置に出力す
るように構成すると良い。
【0098】なお、単に各ガイド域におけるマークの有
無を判定したい場合は、ガイド域内に含まれるマーク位
置の個数に基づき、例えば閾値処理などにより、マーク
の有無を判定するようにマーク検出CPU140を構成
すると良い。
【0099】以上説明したように、第3の実施の形態の
文字読取装置によれば、マークガイドが非ドロップアウ
トカラーの場合においても、マーク無しとマーク有りと
の状態の判別が容易に行える。
【0100】また、読取フィールドに係るフォームパタ
ンのみを登録すればよいので、第1の実施の形態の構成
に比べ、メモリ・ディスク容量の削減が図れる。
【0101】さらに、複数のガイド域に重なるようにマ
ークが記入された場合であっても、マークの付与位置を
高精度に認識することができる。
【0102】なお、上述したマーク認識部142を次の
ように制御する構成にしても良い。図17は、マーク認
識部142の制御例の説明に供する図である。図17に
は、図16に示したものと同様のパタン除去イメージ1
34aが示されている。
【0103】まず、マーク検出CPU140は、マーク
検出メモリ144内のマーク位置に基づきマーク148
の中心位置152を決定する。また、マーク検出CPU
140は、フォーマットデータに基づきガイド域150
aおよび150bの各々の中心位置154aおよび15
4bをそれぞれ検出する。続いてマーク検出CPU14
0は、マーク148の中心位置152とガイド域150
aの中心位置154aとの距離、およびマーク148の
中心位置152とガイド域150bの中心位置154b
との距離をそれぞれ求める。然る後、マーク検出CPU
140は、これらの距離を比較する。そして、マーク検
出CPU140は、距離が小さい方のガイド域150a
を、この選択式マーク記入欄におけるマーク148の付
与位置として判定する。
【0104】また、マーク検出CPU140は、求めた
各距離の間に所定の大きさの差が無い場合は、マークの
付与位置が不明であると判定する。図17を例にとる
と、マーク検出CPU140は、中心位置152および
154a間の距離と、中心位置152および154b間
の距離との差が所定の値よりも小さい場合に、マーク1
48の付与位置が不明であると判定する。
【0105】なお、単に各ガイド域におけるマークの有
無を判定したい場合は、ガイド域ごとに求めた上述の距
離の大きさに基づき、例えば閾値処理などにより、マー
クの有無を判定するようにマーク検出CPU140を構
成すると良い。
【0106】[第4の実施の形態]図18は、第4の実
施の形態の文字読取装置の構成を示すブロック図であ
る。すでに説明した第3の実施の形態の文字読取装置
は、第2の実施の形態のマーク認識部86を、第3の実
施の形態で説明したマーク認識部142に置き換えた構
成である。同じように、第4の実施の形態の文字読取装
置は、第1の実施の形態のマーク認識部86を、第3の
実施の形態で説明したマーク認識部142に置き換えた
構成である。
【0107】この文字読取装置は、帳票に印刷されたマ
ークガイドを含むガイド域におけるマークの有無を判定
する機能を有している。特に、この実施の形態の文字読
取装置は、複数のガイド域を含む選択式マーク記入欄に
おけるマークの付与位置を検出するのに好適である。例
えば、ガイド域からマークがはみ出ている場合にも、そ
のマークが記入されたガイド域を特定することができ
る。
【0108】この実施の形態の文字読取装置は、4つの
中央処理装置(以下、CPUと称する。)、すなわち、
主制御CPU76、メカコンCPU78、フォーム除去
CPU80およびマーク検出CPU140を備えてい
る。主制御CPU76が他の各CPU78、80および
140を統括して文字読取装置全体の制御を行う構成に
なっている。
【0109】また、文字読取装置はマーク認識部142
を備えている。このマーク認識部142には、上述した
マーク検出CPU140が含まれている。
【0110】第1の実施の形態で説明したように、主制
御CPU76にはフォームイメージ格納部88およびフ
ォーマットデータ格納部90が接続されている。メカコ
ンCPU78には帳票イメージ入力部92が接続されて
いる。帳票イメージ入力部92の構成は図2に示した通
りである。帳票イメージ入力部92の出力側はイメージ
メモリ106に接続されている。フォーム除去CPU8
0にはイメージメモリ106およびフォーム除去メモリ
108が接続されている。
【0111】第3の実施の形態で説明したようにマーク
認識部142は、マーク検出CPU140およびマーク
検出メモリ144により構成される。マーク検出CPU
140にはフォーム除去メモリ108およびマーク検出
メモリ144が接続されている。
【0112】次に、第4の実施の形態の文字読取装置の
動作につき説明する。図19は、この文字読取装置の動
作フローを示すフローチャートである。
【0113】まず、文字読取装置はイメージ取込み処理
を実行する(図19のS41)。この処理により、第1
の実施の形態で説明したように、イメージメモリ106
に入力イメージが格納される。
【0114】次に、文字読取装置はフォーム除去処理を
実行する(図19のS42)。第1の実施の形態で説明
したように、フォーム除去CPU80は、入力イメージ
からフォームイメージに含まれるパタンを除去したフォ
ーム除去イメージを作成し、作成したフォーム除去イメ
ージをフォーム除去メモリ108に保存する。
【0115】次に、文字読取装置はフォーマット解読処
理を実行する(図19のS43)。第1の実施の形態で
説明したように、主制御CPU76は、フォーマットデ
ータ格納部90からフォーマットデータを読み出して、
そのフォーマットデータを解読する。
【0116】次に、文字読取装置はマーク検出処理を実
行する(図19のS44)。第3の実施の形態の場合と
同様に、マーク検出CPU140が、フォーム除去メモ
リ108中のフォーム除去イメージからマーク位置を検
出し、検出したマーク位置をマーク検出メモリ144に
保存する。
【0117】次に、文字読取装置はマーク認識処理を実
行する(図19のS45)。第3の実施の形態の場合と
同様に、マーク検出CPU140は、マーク検出メモリ
144中のマーク位置と、フォーマット解読処理(図1
9のS43)で得られたガイド域の位置とに基づき、ど
のガイド域にマークが記入されているかを認識して、文
字コードを決定する。
【0118】次に、文字読取装置は認識出力処理を実行
する(図19のS46)。第3の実施の形態の場合と同
様に、主制御CPU76がマーク検出CPU140から
受けた文字コードを編集し、その編集結果を上位装置へ
出力する。
【0119】以上説明したように、第4の実施の形態の
文字読取装置によれば、マークガイドが非ドロップアウ
トカラーの場合においても、マーク無しとマーク有りと
の状態の判別が容易に行える。
【0120】また、複数のガイド域に重なるようにマー
クが記入された場合であっても、マークの付与位置を高
精度に認識することができる。
【0121】なお、上述したマーク認識部142を、図
17を参照して説明したように制御する構成にしても良
い。
【0122】この発明の文字読取装置は、以上説明した
各実施の形態に何ら限定されるものではなく、多くの変
形または変更を加えることができる。
【0123】また、各実施の形態で説明した処理の手順
はこの発明の範囲の一例に過ぎず、他の好適な処理手順
に変更することができる。
【0124】
【発明の効果】この発明の文字読取装置によれば、あら
かじめ未記入状態の帳票のイメージであるフォームイメ
ージを用意しておき、マーク記入済の帳票のイメージか
ら、フォームイメージに含まれるパタンを除去したフォ
ーム除去イメージを作成するようにしたので、マークガ
イドが非ドロップアウトカラーであっても、マークのみ
が含まれたガイド域のイメージを取得することができ
る。よって、ガイド域におけるマークの有無を容易に判
定することができる。
【図面の簡単な説明】
【図1】第1の実施の形態の文字読取装置の構成を示す
図である。
【図2】帳票イメージ入力部の構成を示す図である。
【図3】第1の実施の形態の文字読取装置の動作フロー
を示す図である。
【図4】入力イメージの一例を示す図である。
【図5】フォームイメージの例を示す図である。
【図6】フォーム除去イメージの例を示す図である。
【図7】読取対象の帳票の一部を示す図である。
【図8】第2の実施の形態の文字読取装置の構成を示す
図である。
【図9】第2の実施の形態の文字読取装置の動作フロー
を示す図である。
【図10】フィールドイメージの例を示す図である。
【図11】フォームパタンの例を示す図である。
【図12】パタン除去イメージの例を示す図である。
【図13】第3の実施の形態の文字読取装置の構成を示
す図である。
【図14】第3の実施の形態の文字読取装置の動作フロ
ーを示す図である。
【図15】フィールドイメージの例を示す図である。
【図16】パタン除去イメージの例を示す図である。
【図17】マーク認識部の制御例の説明に供する図であ
る。
【図18】第4の実施の形態の文字読取装置の構成を示
す図である。
【図19】第4の実施の形態の文字読取装置の動作フロ
ーを示す図である。
【図20】従来の文字読取装置の例を示す図である。
【図21】帳票イメージ入力部の構成を示す図である。
【図22】従来の文字読取装置の動作フローを示す図で
ある。
【図23】フォーマットデータの説明に供する図であ
る。
【図24】文字切出しの説明に供する図である。
【図25】選択式マークの説明に供する図である。
【符号の説明】
10,76:主制御CPU 12,78:メカコンCPU 14,82:前処理CPU 16,84:検出CPU 18,90,132:フォーマットデータ格納部 20,92:帳票イメージ入力部 22,96:帳票搬送系 24,98:レンズ 26,100:光学フィルタ 28,102:イメージセンサ 30,104:A/D変換器 32,50,94:帳票 34,106:イメージメモリ 36,110:パタンメモリ 36a:パタンメモリの記憶内容 38,112:特徴抽出メモリ 40,114:認識辞書メモリ 42,52:読取枠 44:記入文字または印刷文字 46:帳票画像 48:読取枠相当位置 50a:帳票の上辺 50b:帳票の左辺 54:行位置 56:フィールド位置 58:読取枠高さ 60:読取枠幅 62:ピッチ 64:文字数 66:文字画像 68a,68b,68c,68d:文字位置 70a,70b,70c,70d:選択用文字 72,118a,118b:選択式マーク記入欄 74,120a,120b,148:マーク 80:フォーム除去CPU 86,142:マーク認識部 88:フォームイメージ格納部 108:フォーム除去メモリ 116:入力イメージ 122:フォームイメージ 124:フォーム除去イメージ 126a,126b,150a,150b:ガイド域 128:パタン除去CPU 130:フォームパタン 134,134a:パタン除去イメージ 136:パタン除去メモリ 138,146:フィールドイメージ 140:マーク検出CPU 144:マーク検出メモリ 152:マークの中心位置 154a,154b:ガイド域の中心位置

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 帳票に印刷されたマークガイドを含むガ
    イド域におけるマークの有無を判定する文字読取装置に
    おいて、 未記入状態の前記帳票のイメージに相当するフォームイ
    メージを格納するフォームイメージ格納部と、 前記ガイド域の位置情報を含むフォーマットデータを格
    納するフォーマットデータ格納部と、 前記帳票のイメージを入力イメージとして取り込む帳票
    イメージ入力部と、 前記帳票イメージ入力部で取り込まれた入力イメージを
    格納するイメージメモリと、 前記イメージメモリおよびフォームイメージ格納部から
    前記入力イメージおよびフォームイメージをそれぞれ読
    み出し、前記入力イメージから前記フォームイメージに
    含まれるパタンを除去したフォーム除去イメージを作成
    するフォーム除去処理部と、 前記フォーム除去イメージを格納するフォーム除去メモ
    リと、 前記フォーマットデータ格納部およびフォーム除去メモ
    リから前記フォーマットデータおよびフォーム除去イメ
    ージをそれぞれ読み出し、これらフォーマットデータお
    よびフォーム除去イメージに基づいて、前記ガイド域に
    おけるマークの有無を判定するマーク認識部とを備える
    ことを特徴とする文字読取装置。
  2. 【請求項2】 請求項1に記載の文字読取装置におい
    て、 前記マーク認識部は、 前記フォーマットデータに基づいて前記フォーム除去メ
    モリ内の前記フォーム除去イメージから前記ガイド域に
    相当する部分の画像を切り出す前処理部と、 前記前処理部により切り出された画像を格納するパタン
    メモリと、 前記パタンメモリ内の画像における前記マークの有無を
    判定する検出部とを備えることを特徴とする文字読取装
    置。
  3. 【請求項3】 請求項1に記載の文字読取装置におい
    て、 前記マーク認識部は、 前記フォーム除去メモリから前記フォーム除去イメージ
    を読み出して、該フォーム除去イメージ中の前記マーク
    を構成する画素の位置情報を検出するマーク検出部と、 前記マーク検出部で検出された位置情報を格納するマー
    ク検出メモリとを備えており、 前記マーク検出部は、前記フォーマットデータに基づ
    き、前記ガイド域の位置情報と前記マーク検出メモリ内
    の位置情報との対比を行い、該対比結果に応じて前記マ
    ークの有無を判定することを特徴とする文字読取装置。
  4. 【請求項4】 帳票に印刷されたマークガイドを含むガ
    イド域におけるマークの有無を判定する文字読取装置に
    おいて、 未記入状態の前記帳票の前記ガイド域を含む読取フィー
    ルドのイメージに相当するフォームパタンと、前記ガイ
    ド域の位置情報を含むフォーマットデータとを格納する
    フォーマットデータ格納部と、 前記帳票のイメージを入力イメージとして取り込む帳票
    イメージ入力部と、 前記帳票イメージ入力部で取り込まれた入力イメージを
    格納するイメージメモリと、 前記イメージメモリおよびフォーマットデータ格納部か
    ら前記入力イメージおよびフォームパタンをそれぞれ読
    み出し、該読み出した入力イメージから読取フィールド
    のイメージを切り出し、然る後、該切り出したイメージ
    から前記フォームパタンを除去したパタン除去イメージ
    を作成するパタン除去処理部と、 前記パタン除去イメージを格納するパタン除去メモリ
    と、 前記フォーマットデータ格納部およびパタン除去メモリ
    から前記フォーマットデータおよびパタン除去イメージ
    をそれぞれ読み出し、これらフォーマットデータおよび
    パタン除去イメージに基づいて、前記ガイド域における
    マークの有無を判定するマーク認識部とを備えることを
    特徴とする文字読取装置。
  5. 【請求項5】 請求項4に記載の文字読取装置におい
    て、 前記マーク認識部は、 前記フォーマットデータに基づいて前記パタン除去メモ
    リ内の前記パタン除去イメージから前記ガイド域に相当
    する部分の画像を切り出す前処理部と、 前記前処理部により切り出された画像を格納するパタン
    メモリと、 前記パタンメモリ内の画像における前記マークの有無を
    判定する検出部とを備えることを特徴とする文字読取装
    置。
  6. 【請求項6】 請求項4に記載の文字読取装置におい
    て、 前記マーク認識部は、 前記パタン除去メモリから前記パタン除去イメージを読
    み出して、該パタン除去イメージ中の前記マークを構成
    する画素の位置情報を検出するマーク検出部と、 前記マーク検出部で検出された位置情報を格納するマー
    ク検出メモリとを備えており、 前記マーク検出部は、前記フォーマットデータに基づ
    き、前記ガイド域の位置情報と前記マーク検出メモリ内
    の位置情報との対比を行い、該対比結果に応じて前記マ
    ークの有無を判定することを特徴とする文字読取装置。
  7. 【請求項7】 請求項2または5に記載の文字読取装置
    において、 前記検出部は、前記パタンメモリ内の画像に含まれる前
    記マークを構成する画素の個数を計数し、該計数結果に
    応じて前記マークの有無を判定することを特徴とする文
    字読取装置。
  8. 【請求項8】 請求項7に記載の文字読取装置におい
    て、 前記検出部は、複数の前記ガイド域が選択式マーク記入
    欄を構成している場合、前記計数結果が最も大きい前記
    ガイド域を、前記選択式マーク記入欄における前記マー
    クの付与位置として判定することを特徴とする文字読取
    装置。
  9. 【請求項9】 請求項8に記載の文字読取装置におい
    て、 前記検出部は、各前記計数結果の間に所定の大きさの差
    が無い場合は、前記マークの付与位置が不明であると判
    定することを特徴とする文字読取装置。
  10. 【請求項10】 請求項3または6に記載の文字読取装
    置において、 前記マーク検出部は、前記フォーマットデータに基づ
    き、前記マーク検出メモリ内の位置情報のうちの前記ガ
    イド域内に含まれる位置情報を計数し、該計数結果に応
    じて前記マークの有無を判定することを特徴とする文字
    読取装置。
  11. 【請求項11】 請求項10に記載の文字読取装置にお
    いて、 前記マーク検出部は、複数の前記ガイド域が選択式マー
    ク記入欄を構成している場合、前記計数結果が最も大き
    い前記ガイド域を、前記選択式マーク記入欄における前
    記マークの付与位置として判定することを特徴とする文
    字読取装置。
  12. 【請求項12】 請求項11に記載の文字読取装置にお
    いて、 前記マーク検出部は、各前記計数結果の間に所定の大き
    さの差が無い場合は、前記マークの付与位置が不明であ
    ると判定することを特徴とする文字読取装置。
  13. 【請求項13】 請求項3または6に記載の文字読取装
    置において、 前記マーク検出部は、前記マーク検出メモリ内の位置情
    報に基づき前記マークの中心位置を決定するとともに、
    前記フォーマットデータに基づき前記ガイド域の中心位
    置を検出し、続いて前記マークの中心位置と前記ガイド
    域の中心位置との距離を求め、該距離に応じて前記マー
    クの有無を判定することを特徴とする文字読取装置。
  14. 【請求項14】 請求項13に記載の文字読取装置にお
    いて、 前記マーク検出部は、複数の前記ガイド域が選択式マー
    ク記入欄を構成している場合、前記距離が最も小さい前
    記ガイド域を、前記選択式マーク記入欄における前記マ
    ークの付与位置として判定することを特徴とする文字読
    取装置。
  15. 【請求項15】 請求項14に記載の文字読取装置にお
    いて、 前記マーク検出部は、各前記距離の間に所定の大きさの
    差が無い場合は、前記マークの付与位置が不明であると
    判定することを特徴とする文字読取装置。
  16. 【請求項16】 請求項8、11および14のいずれか
    一項に記載の文字読取装置において、 前記選択式マーク記入欄に前記マークの付与位置が複数
    有ると判定された場合、または前記選択式マーク記入欄
    に前記マークの付与位置がひとつも無いと判定された場
    合、「不明」に相当する文字コードを所定の上位装置に
    出力するようにしたことを特徴とする文字読取装置。
  17. 【請求項17】 請求項1ないし16のいずれか一項に
    記載の文字読取装置において、 前記判定したマークの有無または付与位置に応じて、前
    記マークガイドに対応する文字コードを所定の上位装置
    に出力するようにしたことを特徴とする文字読取装置。
JP2001055010A 2001-02-28 2001-02-28 文字読取装置 Withdrawn JP2002259909A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001055010A JP2002259909A (ja) 2001-02-28 2001-02-28 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001055010A JP2002259909A (ja) 2001-02-28 2001-02-28 文字読取装置

Publications (1)

Publication Number Publication Date
JP2002259909A true JP2002259909A (ja) 2002-09-13

Family

ID=18915259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001055010A Withdrawn JP2002259909A (ja) 2001-02-28 2001-02-28 文字読取装置

Country Status (1)

Country Link
JP (1) JP2002259909A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011076390A (ja) * 2009-09-30 2011-04-14 Fujitsu Frontech Ltd マーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラム
CN104978577A (zh) * 2014-04-04 2015-10-14 联想(北京)有限公司 信息处理方法、装置及电子设备
JP2016062347A (ja) * 2014-09-18 2016-04-25 富士通フロンテック株式会社 帳票認識装置、帳票認識方法、及び、プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011076390A (ja) * 2009-09-30 2011-04-14 Fujitsu Frontech Ltd マーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラム
CN104978577A (zh) * 2014-04-04 2015-10-14 联想(北京)有限公司 信息处理方法、装置及电子设备
CN104978577B (zh) * 2014-04-04 2019-02-05 联想(北京)有限公司 信息处理方法、装置及电子设备
JP2016062347A (ja) * 2014-09-18 2016-04-25 富士通フロンテック株式会社 帳票認識装置、帳票認識方法、及び、プログラム

Similar Documents

Publication Publication Date Title
EP0063454A2 (en) Method for recognizing machine encoded characters
US5805740A (en) Bar-code field detecting apparatus performing differential process and bar-code reading apparatus
US5164996A (en) Optical character recognition by detecting geo features
US4797940A (en) Optical character reader
JP5630689B2 (ja) 文字認識方法及び文字認識装置
JP2004280334A (ja) 画像読み取り装置
JP2002259909A (ja) 文字読取装置
JP3022459B2 (ja) 帳票識別登録装置
JPH09237312A (ja) 光学的文字読取装置
JP2005092543A (ja) 帳票読取り装置
JP2000331117A (ja) 文書読取システム
JP4206604B2 (ja) パターン検出装置及び方法
JPH11282959A (ja) 文字列照合装置、方法及び記録媒体、並びに文書分類装置、文字読み取り装置及び真贋判定装置
JPH06111060A (ja) 光学的文字読取装置
JP2022073944A (ja) 品質検査装置
JP3606218B2 (ja) 文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法
JP2925300B2 (ja) 光学的文字読取装置
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP3199033B2 (ja) 光学式文字読取方法、及び光学式文字読取装置
JPH11238095A (ja) 郵便物宛先読取装置
JPH0962789A (ja) 光学式文字読取装置のマーク認識方法
JPH06301813A (ja) 文字読取方法
JP2004013188A (ja) 帳票読取り装置および帳票読取り方法ならびプログラム
JPH08155397A (ja) 郵便物区分装置およびバーコード印刷装置
JP2001126019A (ja) 光学式マーク読取装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080513