JPH0962789A - 光学式文字読取装置のマーク認識方法 - Google Patents

光学式文字読取装置のマーク認識方法

Info

Publication number
JPH0962789A
JPH0962789A JP7219236A JP21923695A JPH0962789A JP H0962789 A JPH0962789 A JP H0962789A JP 7219236 A JP7219236 A JP 7219236A JP 21923695 A JP21923695 A JP 21923695A JP H0962789 A JPH0962789 A JP H0962789A
Authority
JP
Japan
Prior art keywords
character
mark
recognition
code
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7219236A
Other languages
English (en)
Inventor
Mitsuru Takiguchi
充 瀧口
Takayuki Kato
貴之 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7219236A priority Critical patent/JPH0962789A/ja
Publication of JPH0962789A publication Critical patent/JPH0962789A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 非ドロップアウトカラーのマークガイドを使
用する場合でも、マークの付されたマークガイドの抽出
を可能にする。 【解決手段】 帳票56のイメージデータは、光学フィ
ルタ60、イメージセンサ58、A/D変換器61を介
してイメージメモリ62に取込まれる。前処理CPU5
3は主制御CPU51に制御され、イメージメモリ62
から読取対象の文字を切出し、パターンメモリ63に格
納する。一方、認識辞書メモリ65には、予め行われた
学習処理により、マークの付されていないマークガイド
の特徴が格納されている。認識CPU54は、パターン
メモリ63に格納された文字の特徴を抽出して特徴メモ
リ64に格納し、それらと認識辞書メモリ65に格納さ
れた特徴とのヒット率をそれぞれ求め、該各ヒット率に
基づいてマーク付加文字を抽出し、対応する文字コード
を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、光学式文字読取装
置(以下、OCRという)を用いて、帳票中の選択用文
字のどの文字にマークが付されたかを認識するOCRの
マーク認識方法に関するものである。
【0002】
【従来の技術】図2は、従来のOCRの構成例を示す構
成ブロック図である。このOCRは、4つのCPU、つ
まり主制御CPU1と、対象帳票をOCRに導入する機
構を制御するメカコンCPU2と、前処理CPU3と、
認識CPU4とを、備えている。主制御CPU1はメカ
コンCPU2、前処理CPU3、及び認識CPU4に接
続され、該主制御CPU1が各CPU2,3,4を統括
し、OCR全体の制御を行う構成である。主制御CPU
1は、読取りに関する情報のフォーマットデータ5を持
つ構成である。メカコンCPU2は読取り帳票6の帳票
イメージを取込むために、帳票搬送系7とイメージセン
サ8を制御する接続になっている。帳票6のイメージ
は、レンズ9と光学フィルタ10を介してイメージセン
サ8に取込まれ、イメージセンサ8の出力は、アナログ
/ディジタル(以下、A/Dという)変換器11を介し
て、イメージメモリ12に入力される構成である。イメ
ージセンサ8は、帳票イメージを取込むためのラインセ
ンサであり、イメージセンサ8、レンズ9及び光学フィ
ルタ10が、光学系を形成している。イメージメモリ1
2の出力側は、前処理CPU3に接続されている。イメ
ージメモリ12は、多値階調のデジタル画像を蓄えるこ
とができるメモリであり、前処理CPU3は、イメージ
メモリ12中の任意のアドレスのイメージデータを読出
すことができるようになっている。前処理CPU3は、
イメージメモリ12上の読取枠に該当する部分のイメー
ジを切出して二値化し、その文字パターンを一次的に保
存するために、パターンメモリ13に与える接続であ
る。パターンメモリ13は、白黒の2値面像を蓄えるメ
モリである。認識CPU4はパターンメモリ13に接続
され、前処理CPU3が切出してパターンメモリ13に
格納した文字パターンから特徴抽出を行い、その結果を
接続された特徴抽出メモリ14に格納する構成である。
また、認識CPU4には、認識辞書メモリ15も接続さ
れている。
【0003】図3は、図2による従来の動作を示すフロ
ーチャートであり、この図2及び図3を参照しつつ、従
来のOCRの一般的な動作を説明する。図2中の読取り
帳票6内の読取枠16は、ドロップアウトカラー印刷さ
れ、記入文字または印字文字17は、非ドロップアウト
カラーである。図3に示されたステップS1のイメージ
取込み処理では、主制御CPUlがメカコンCPU2に
対し、イメージ取込みの指示を行う。これを受けたメカ
コンCPU2は、搬送系7を制御し、帳票6を搬送す
る。イメージセンサ8及び光学フィルタ10の前を帳票
6が通過することで、帳票画像が取り込まれる。帳票面
像は、レンズ9び光学フィルタ10を介してイメージセ
ンサ8に与えられ、イメージセンサ8がそれを光電変換
する。これにより、帳票画像がアナログ信号に変換さ
れ、さらに、A/D変換器11によって、多値階調のデ
ィジタル画像にされる。多値階調のディジタル画像がイ
メージメモリ12に格納される。このとき、ドロップア
ウトカラー印刷の読取枠16は、光学フィルタ10を透
過せずに、非ドロップアウトカラーの記入文字または印
字文字17のみが通過する。よって、イメージメモリ1
2に取り込まれた帳票画像には、読取枠16自身のイメ
ージは、存在しない。ステップS2のフォーマット解読
処理において、読取枠内の文字を切出すために、主制御
CPUlはフォーマットデータ5を解読すると共に、イ
メージメモリ12上の読取相当位置18を計算する。
【0004】図4は、図2のフォーマットデータの概念
を説明する図である。フォーマットデータ5には、図4
のように、帳票の読取情報を示すために、行位置20、
フィールド位置21、読取枠高さ22、読取枠幅23、
ピッチ24、及び文字数25等が記憶されている。行位
置20は帳票の上辺から読取行の中心までの距離を示
し、フィールド位置21は帳票左辺から読取枠左端まで
の距離を示ている。読取枠高さ22は読取枠の高さを示
し、読取枠幅23は読取枠の幅、及びピッチ24は隣接
の読取枠との距距離を示し、及び文字数25は読取枠の
数を示す。つまり、フォーマットデータ5は、帳票上の
読取枠の存在位置を示す。読取相当位置18に基づき、
主制御CPU1は前処理CPU3に文字切出しを指示す
る。ステップS3の文字切出し処理では、前処理CPU
3は与えられた読取枠相当位置18に基づき、イメージ
メモリ12から読取文字を切出す。その例を図5に示
す。
【0005】図5は、文字切出しを示す図である。前処
理CPU3は、イメージメモリ12中の1文字分の読取
枠相当位置26をラスタスキャンによって読出し、その
画像をパターンメモリ13に取込む。このとき、前処理
CPU3は多値2値変換を行う。図6は、図2中のパタ
ーンメモリに保持された画像を示す図である。前処理C
PU3は、パターンメモリ13に保持れた文字画像(斜
線部)の中で、上下左右から枠詰めを行い、図6のよう
に文字の領域を示す文字位置27,28,29,30を
求める。ステップS4の文字認識処理では、認識CPU
4は各文字位置27,28,29,30の示す文字パタ
ーンの特徴抽出を行い、その結果を特徴抽出メモリ14
に格納し、さらに、次に認識辞書メモリ15上の認識辞
書とその特徴抽出結果とのマッチングによって文字コー
ドを決定し、主制御CPU1に出力する。ステップS5
の認識出力処理では、主制御CPU1が受けた文字コ―
ドを編集し、かつ上位装置ヘ出力する。ここで、OCR
による文字読取りとマーク読取りの違いを示す。文字読
取りでは、文字切出し処理で得た文字パターンを文字認
識処理で文字コードに変換する。マーク読取りでは、文
字切出し処理で得た文字パターンの黒点数の大きさによ
り、マークの有り無しを判定して出力する。図2の例で
は、マーク有りの場合は1、マーク無しの場合は0を出
力する。
【0006】
【発明が解決しようとする課題】しかしながら、従来で
マーク読取方法では、次の(1)(2)ような課題があ
った。図7(a)(b)(c)は選択式マークの説明図
である。選択式マークとは、図7(a)に示すように、
複数の選択用文字31,32,33,34の上にマーク
35を重ねて表示し、選択を行うマークである。複数文
字31,32,33,34をマークガイドと呼ぶ。 (1) マークガイドが非ドロップアウトカラーのた
め、マークガイド自身もイメージとして取り込まれ、マ
ーク無しとマーク有りの状態の判別が困難になってい
た。 (2) 図7(b)のように、選択式マークおよびその
他の文字が同―行内に存在するイメージの中から、選択
式マーク36を読取る場合、読取枠相当位置37,38
が、フォーマットデータ5で、特定されていることが必
要不可欠であった。しかしながら、従来の装置では、図
7(c)のように、選択式マーク39が読取枠相当位置
40,41を外れた場合、読取ることは不可能であっ
た。
【0007】
【課題を解決するための手段】第1の発明は、前記課題
を解決するために、帳票に対してOCRを用い、該帳票
に印字された複数の選択用文字のうち選択されてマーク
の付されたマーク付加文字を抽出し、該マーク付加文字
の文字コードを出力するOCRのマーク認識方法におい
て、次のような方法を講じている。即ち、第1の発明に
おけるOCRのマーク認識方法においては、予め、前記
マーク無付加状態での前記複数の選択用文字の特徴をそ
れぞれ求めておく学習処理を行い、前記OCRで読取対
象帳票中の前記複数の選択用文字に対する特徴をそれぞ
れ求め、それらの特徴と前記学習処理で求めた各特徴と
のマッチングによって該各特徴間の類似度を表すヒット
率をそれぞれ求め、該各ヒット率と閾値との比較で前記
マーク付加文字を抽出して該マーク付加文字の文字コー
ドを出力するマーク認識処理を行うようにしている。
【0008】第2の発明は、予め、第1の発明における
学習処理を行っておき、対象の前記複数の選択用文字の
文字位置が特定された帳票に対して該特定された文字位
置を前記OCRの読取領域として設定し、該読取領域で
第1の発明におけるマーク認識処理を施すようにしてい
る。第3の発明は、予め、第1の発明における学習処理
を行っておき、対象の前記複数の選択用文字の文字位置
が不特定の帳票に対してそれら選択用文字のすべてを含
む部分を前記OCRの読取領域として設定し、該読取領
域中の文字位置を検出する文字位置検出処理と、前記検
出された文字位置の文字に対して第1の発明におけるマ
ーク認識処理とを施すようにしている。第4の発明は、
予め、第3の発明における学習処理を行っておき、第3
の発明における文字位置検出処理と、前記文字位置検出
処理で検出された文字位置の各文字に対して特徴をそれ
ぞれ求め、それらの特徴と前記予め求めた各特徴とのマ
ッチングで該各特徴間の類似度を表すヒット率をそれぞ
れ求めると共にそれらの文字コードをそれぞれ求める文
字認識処理と、前記文字コードを参照して前記読取領域
中の各文字が読取対象の選択用文字かどうかを判断しつ
つ、前記ヒット率と閾値との比較で前記選択用文字のう
ちマークが付加されたマーク付加文字を抽出し、その文
字コードを出力するマーク認識処理とを行うようにして
いる。
【0009】第5の発明は、予め、第4の発明における
学習処理を行っておき、第4の発明における文字位置検
出処理及び文字認識処理と、前記文字認識処理で求めた
文字コードを参照して前記読取領域中の各文字が読取対
象の選択項目に対応する選択用文字かどうかを判断しつ
つ、前記ヒット率と閾値との比較で前記選択用文字のう
ちマークが付加されたマーク付加文字を抽出して該マー
ク付加文字の文字コードを出力するマーク認識処理とを
行うようにしている。第6の発明は、第4または第5の
発明のOCRのマーク認識方法において、前或いは後の
文字に対する前記文字認識処理結果と該前或いは後の文
字に前記マークが付されているかいないかを判断した結
果とを参照し、対象文字が選択用文字以外の一般読取用
文字か否かを判別し、該判別結果が一般読取用文字の場
合、前記文字認識処理で求めた対応する文字コードを出
力する一般読取用文字出力処理を行うようにしている。
第7の発明は、第6の発明のOCRのマーク認識方法に
おいて、前記一般読取用文字と前記選択用文字の判別が
不可能な場合、リジェクトコードを出力する判別不能出
力処理を行うようにしている。第8の発明は、第1、
2、3、4、5、6、または7の発明のOCRのマーク
認識方法において、前記複数の選択用文字のすべてに前
記マークが付加されていない場合に、リジェクトコード
を出力する無マーク出力処理を行うようにしている。
【0010】第9の発明は、帳票に対してOCRを用
い、該帳票に印字された複数の選択用文字のうち選択さ
れてマークの付されたマーク付加文字を抽出し、該マー
ク付加文字の文字コードを出力するOCRのマーク認識
方法において、次のような方法を講じている。即ち、第
9の発明のOCRのマーク認識方法においては、読取対
象帳票で前記複数の選択用文字のある部分を前記OCR
の読取領域として設定し、該読取領域中の各文字の高さ
と幅と黒点数とをそれぞれ求め、該高さ、幅及び黒点数
とそれらに対応して設けられた閾値とをそれぞれ比較す
ることにより、前記マーク付加文字の位置を検出して登
録する文字位置登録処理と、前記マーク付加文字の位置
の前後の位置にある文字に対して文字認識を行い、該認
識結果に基づき前記マーク付加文字を認識してそれに対
応する文字コードを出力するマーク認識処理とを、行う
ようにしている。第1及び第2の発明によれば、以上の
ようにOCRのマーク認識方法を構成したので、予め行
われる学習処理によって、マーク無付加状態における選
択用文字の特徴がそれぞれ求められる。マーク認識処理
では、OCRで読取対象帳票中の選択用文字の特徴が求
められる。ここで、選択されてマークの付されたマーク
付加文字における特徴は、学習処理によって得られた特
徴からずれているので、それらの間のヒット率が低くな
る。各選択文字におけるヒット率が閾値と比較され、マ
ーク付加文字が抽出される。抽出されたマーク付加文字
に対応する文字コードが出力される。
【0011】第3の発明によれば、学習処理により、マ
ーク無付加状態における選択用文字の特徴がそれぞれ求
められる。文字位置検出処理により、複数の選択用文字
の文字位置が不特定の帳票に対してそれら選択用文字の
すべてを含むある程度広い部分がOCRの読取領域とし
て設定され、その読取領域中の文字位置が検出される。
そして、マーク認識処理により、その文字位置における
選択用文字の特徴が求められ、ヒット率との比較で、マ
ーク付加文字が抽出される。抽出されたマーク付加文字
に対応する文字コードが出力される。第4の発明によれ
ば、さらに、文字認識処理により、第3の発明における
文字位置検出処理で検出された文字位置の各文字に対し
て特徴が求められ、それらの特徴と学習処理で各特徴と
のマッチングでヒット率をそれぞれ求めると共に、それ
らの文字コードが求められる。マーク認識処理により、
その文字コードを参照して読取領域中の各文字が読取対
象の選択用文字かどうかが判断されつつ、ヒット率と閾
値との比較でマーク付加文字が抽出される。そして、そ
の文字コードが出力される。
【0012】第5の発明によれば、マーク認識処理によ
り、第4の発明における文字認識処理で求めた文字コー
ドを参照して読取領域中の各文字が読取対象の選択項目
に対応する選択用文字かどうかが判断されつつ、ヒット
率と閾値との比較で選択用文字のうちマークが付加され
たマーク付加文字が抽出される。そして、マーク付加文
字の文字コードが出力される。第6の発明によれば、前
或いは後の文字に対する第4または第5の発明における
文字認識処理結果と該前或いは後の文字に前記マークが
付されているかいないかを判断した結果とが参照され、
対象文字が選択用文字以外の一般読取用文字であるか否
かが判別される。判別結果が一般読取用文字の場合、文
字認識処理で求めた対応する文字コードが出力される。
第7の発明によれば、第6の発明において、判別不能出
力処理がさらにおこなわれ、一般読取用文字と選択用文
字の判別が不可能な場合には、リジェクトコードが出力
される。
【0013】第8の発明によれば、第1、2、3、4、
5、6、または7の発明のOCRのマーク認識方法にお
いて、無マーク出力処理が行われ、複数の選択用文字の
すべてにマークが付加されていない場合に、リジェクト
コードが出力される。第9の発明によれば、マーク付加
文字は、マーク無付加文字よりも、文字の高さ、文字の
幅、或いは黒点数が増える。文字位置登録処理により、
読取領域中の各文字の高さと幅と黒点数がそれぞれ求め
られ、該高さ、幅及び黒点数とそれらに対応して設けら
れた閾値とのそれぞれ比較により、マーク付加文字の位
置が検出されて登録される。マーク認識処理により、マ
ーク付加文字の位置の前後の位置にある文字に対して文
字認識が行われ、その認識結果に基づき、マーク付加文
字が認識される。そして、対応する文字コードが出力さ
れる。従って、前記課題を解決できるのである。
【0014】
【発明の実施の形態】第1の実施形態 図1は、本発明の第1の実施形態を示すOCRの構成ブ
ロック図である。このOCRは、従来の図2と同様に、
主制御CPU51と外部装置制御用のメカコンCPU5
2と前処理CPU53と認識CPU54の、4個のCP
Uを備えている。主制御CPU51はメカコンCPU5
2、前処理CPU53、及び認識CPU54に接続さ
れ、該主制御CPU51が各CPU52,53,54を
統括し、OCR全体の制御を行う構成である。主制御C
PU51は、読取りに関する情報のフォーマットデータ
55を持つ構成である。メカコンCPU52は読取り帳
票56の帳票イメージを取込むために、帳票搬送系57
とイメージセンサ58を制御する接続になっている。帳
票56のイメージは、レンズ59と光学フィルタ60を
介してイメージセンサ58に取込まれ、イメージセンサ
58の出力は、A/D変換器61を介して、イメージメ
モリ62に入力される構成である。イメージセンサ58
は帳票イメージを取込むためのラインセンサである。イ
メージメモリ62の出力側は、前処理CPU53に接続
されている。イメージメモリ62は多値階調のデジタル
画像を蓄えることができるメモリであり、前処理CPU
53はイメージメモリ62中の任意のアドレスのイメー
ジデータを読出すことができるようになっている。前処
理CPU53はイメージメモリ62上の読取枠に該当す
る部分のイメージを切出して二値化し、その文字パター
ンを一次的に保存するために、パターンメモリ63に与
える接続である。パターンメモリ63は、白黒の2値面
像を蓄えるメモリである。認識CPU54はパターンメ
モリ63に接続され、前処理CPU53が切出してパタ
ーンメモリ63に格納した文字パターンから特徴抽出を
行い、その結果を接続された特徴抽出メモリ64に格納
する構成である。また、認識CPU54には、認識辞書
メモリ65も接続されている。認識辞書メモリ65に
は、予め行われた学習処理により、選択文字であるマー
クガイドの特徴が収められている。
【0015】図8は、図1の動作を示すフローチャート
であり、この図8を参照しつつ、第1の実施形態のOC
Rのマーク認識方法を説明する。OCRは、図8のフロ
ーチャートに従い、読取対象となる選択式マークの文字
位置が特定されたイメージの中から対象の選択式マーク
を抽出して読取る。ここでは、帳票中の性別或いは年号
を表す選択式マーク等を読取る場合を説明するが、性別
或いは年号に限らず、選択式マークであれば読取可能で
ある。図8のステップ11のイメージ取込み処理におい
て、図1の主制御CPU5lは、メカコンCPU52に
対し、イメージ取込みの指示を行う。これを受けたメカ
コンCPU52は、搬送系57を稼働して読取帳票56
を搬送し、イメージセンサ58及び光学フィルタ60の
前を通過させる。このとき、帳票面像が取込まれる。帳
票画像がレンズ59及び光学フィルタ60を介して、イ
メージセンサ58に与えられる。イメージセンサ58に
より、帳票画像は光電変換され、アナログ信号に変わ
る。さらに、イメージセンサ58の出力する帳票画像の
アナログ信号は、A/D変換器61によって多値階調の
デジタル画像になり、該デジタル画像がイメージメモリ
62に格納される。
【0016】図9は、図1中のフォ―マットデータを示
す図である。ステップS12のフォーマット解読処理に
おいて、読取枠内の文字を切出すために、主制御CPU
51はフォ―マットデータ55を解読して読取相当枠位
置を求める。フォーマットデータ55には、帳票の読取
情報を示すために、図9の行位置、フィールド位置、読
取枠高さ、読取枠幅、ピッチ、及び文字数等が記憶され
ている。行位置は帳票の上辺から読取行の中心までの距
離を示し、フィールド位置は帳票左辺から読取枠左端ま
での距離を示ている。読取枠高さは読取枠の高さを示
し、読取枠幅は読取枠の幅、及びピッチは隣接の読取枠
との距距離を示し、文字数は読取枠の数を示す。つま
り、フォーマットデータ55は、帳票上の読取枠の存在
位置を示す。続くステップS13において、前処理CP
U53は、文字No.を表す変数nに初期値の1をセッ
トする。
【0017】図10は、図1の文字切出しを示す図であ
る。ステップS14の文字切出し処理において、前処理
CPU53はイメージメモリ52中の画像データの1文
字分の読取枠相当位置をラスタスキャンによって読出し
て二値化し、その画像をパターンメモリ63に取込む。
図11(a),(b)は、図1中のパターンメモリに保
持された画像を示す図である。認識率を高めるために、
前処理CPU53はパターンメモリ63に保持れた文字
画像(斜線部)に対し、図11(a)のような上下左右
からの枠詰めを行い、文字の領域を示す文字位置70,
71,72,73を求める。文字切出し処理の後のステ
ップS15の文字認識処理において、認識CPU54
は、文字位置70,71,72,73の示す文字パター
ンの特徴抽出を行い、その結果を特徴抽出メモリ64に
格納する。次に、認識CPU54は認識辞書メモリ65
上の認識辞書とその特微抽出結果とのマッチングによ
り、一番高いヒット率を求め、配列変数hit[]にその
ヒット率を格納する。ここでの格納は、認識CPU54
に接続された図示しないメモリに対して行われる。ヒッ
ト率とは、対象文字パターンと、認識辞書を作成した時
の文字パターン(学習パターン)との類似度を示すもの
である。
【0018】ステップS16において、認識CPU54
は図示しないメモリ用いて、文字No.を示す変数nに
1を加える。ステップS17では、フォーマットデータ
55の指定する文字数に達したか否かをチェックする。
チェック結果で、未達の場合にはステップS14からS
17の処理を繰り返す。即ち、隣接するマークガイドに
対するマーク認識が順次行われる。ステップS18の認
識出力処理において、ステップS15で求めた文字認識
結果、つまり、ヒット率を用いて、マークの付された文
字を検出し、その文字コードを上位装置に出力する。即
ち、ステップS14〜S18の一連処理は、マーク付加
文字を抽出してそれに対応した文字コードを出力するマ
ーク認識処理になっている。ここで、マークを付加した
文字(マーク付加文字)と、マークを付加しない文字
(マーク無付加文字)の認識傾向の違いを示す。図12
(a),(b)は、マーク付加文字と無付加文字を示す
図である。認識辞書メモリ15に格納されている認識辞
書は、マーク無付加文字を学習パターンに使用して作成
されているため、マーク無付加文字に対する文字認識結
果のヒット率は、高い値を出力する傾向がある。それに
対し、図12(b)のようなマーク付加文字は未学習で
あるため、文字認識結果のヒット率は低くなる傾向があ
る。
【0019】図13は、図8中のステップS18の例を
示すフローチャートである。ステップS18の認識出力
処理は、次のステップS181 〜S1810の処理を行
い、認識結果を外部装置に出力する処理である。まず、
図13のステップS181 において、文字No.を表す
変数mに初期値の1をセットする。続くステップS18
2 では、マークの数を示す変数mcに初期値の0をセッ
トする。ステップS183 では、変数mの示す文字のヒ
ット率hit[m]が閾値a1 よりも低いものをマーク
付加文字と見做し、処理をステップS184 に進める。
反対に、閾値a1より高い文字はマーク付加文字と見做
し、処理をステップS186 に進める。ステップS18
4 では、マーク付加文字と見做された文字の文字No.
を変数mnoに保存する。ステップS185 では、マー
クの数を示す変数mcにlを加算する。ステップS18
6 では、文字No.を示す変数mに1を加える。ステッ
プS187 では、フォーマットデータ指定の文字数に到
達したかを判断し、未達の場合は、処理はステップS1
3 に戻る。到達の場合は、処理はステップS188
進む。スステップS188 では、マークの数を示す変数
mcを参照し、変数mcが1以外の値の場合、つまり性
別の両方にマークが付されているか、または両方ともマ
ークが付されていない場合、処理はステップS189
進む。変数mcが1の場合、処理はステップS1810
進む。ステップS189 では、変数mcがマーク無しま
たは複数マークを示すので、リジェクトコードを外部の
上位装置に出力する。即ち、無マーク出力処理が行われ
る。ステップS1810では、マークが1つ存在するた
め、変数mnoを参照し、該当の文字コードを上位装置
へ出力する。本実施形態は性別を対象とし、第1文字目
を男、第2文字目を女としているため、mno=1なら
ば「男」、mno=2ならば「女」を出力する。同じく
年号を対象とした読取の場合は、mno=lならば
「明」、mno=2ならば「大」、mno=3ならば
「昭」、mno=4ならば「平」を出力する。
【0020】以上のようにこの第1の実施形態では、選
択式マークの選択されたマークガイドを読取るために、
ステップS15で文字パターンの認識処理を行ってヒッ
ト率を求め、求めたヒット率と閾値a1とを比較し、マ
ーク付加文字とマーク無付加文字を検出するようにして
いるので、非ドロップアウトカラーのマークガイドを使
用する場合でも、マーク付加された選択文字を抽出する
ことが可能となっている。また、ステップS18の認識
出力処理において、マーク付加文字の個数を検出してそ
の適否を判定し、適の場合にそのマーク付加文字の文字
コードを上位装置に出力し、不適の場合には、リジェク
トコードを上位装置に出力するので、選択式マークの読
取における信頼性が高くなっている。
【0021】第2の実施形態 図14は、本発明の第2の実施形態を示すOCRの構成
ブロック図である。このOCRのハードウエアの特徴
は、図1の第1の実施形態に投影メモリ96を加えた構
成になっている。このOCRでは、主制御CPU81と
外部装置制御用のメカコンCPU82と前処理CPU8
3と認識CPU84の、4個のCPUを備えている。第
1の実施形態と同様に、主制御CPU81はメカコンC
PU82、前処理CPU83、及び認識CPU84に接
続され、該主制御CPU81が各CPU82,83,8
4を統括してOCR全体の制御を行う構成である。主制
御CPU81は、読取りに関する情報のフォーマットデ
ータ85を持つ構成である。メカコンCPU82は読取
り帳票86の帳票イメージを取込むために、帳票搬送系
87とイメージセンサ88を制御する接続になってい
る。帳票86のイメージは、レンズ89と光学フィルタ
90を介してイメージセンサ88に取込まれ、イメージ
センサ88の出力がA/D変換器91を介して、イメー
ジメモリ92に入力される構成である。イメージメモリ
92の出力側は、前処理CPU83に接続されている。
イメージメモリ92は多値階調のデジタル画像を蓄える
メモリであり、前処理CPU83はイメージメモリ92
中の任意のアドレスのイメージデータを読出すことがで
きるようになっている。前処理CPU83は、イメージ
メモリ92上の読取枠に該当する部分のイメージを切出
して二値化し、その文字パターンを一次的に保存するた
めに、パターンメモリ93に与える接続である。パター
ンメモリ93は、白黒の2値面像を蓄えるメモリであ
る。認識CPU84はパターンメモリ93に接続され、
前処理CPU83が切出してパターンメモリ93に格納
した文字パターンから特徴抽出を行い、その結果を接続
された特徴抽出メモリ94に格納する構成である。ま
た、認識CPU84には、認識辞書メモリ95も接続さ
れている。本実施形態の特徴である投影メモリ96が、
前処理CPU83に接続されている。なお、投影メモリ
96は、前処理CPU83の持つメモリ空間を代用し、
ハードウエアの増設を不要とすることも可能である。
【0022】次に、図14のOCRの動作を説明する。
図15は、図14で読取を行うマークガイドを示す図で
ある。OCRは、読取対象となる「男」と「女」のマー
クガイド100の文字位置が不特定のイメージの中か
ら、対象の選択式マーク101のついたマークガイド1
00を抽出して読取る。本実施形態では、例えば、性別
及び年号を表す選択式マーク読取について説明を行う
が、性別、年号に限らず、選択式マークであれば読取可
能である。図16は、図14の動作を示すフローチャー
トである。ステップS21のイメージ取込み処理におい
て、図14の主制御CPU81は、メカコンCPU82
に対してイメージ取込みの指示を行う。これを受けたメ
カコンCPU82は、読取対象の帳票86を搬送し、イ
メージセンサ88及び光学フィルタ90の前を通過させ
つつ、帳票画像を取り込む。帳票画像は、レンズ89及
び光学フィルタ90を介して、イメージセンサ88に与
えれる。イメージセンサ88により、帳票画像は光電変
換されてアナログ信号に変わる。さらに、イメージセン
サ88の出力する帳票画像のアナログ信号は、A/D変
換器91によって多値階調のデジタル画像になり、該デ
ジタル画像がイメージメモリ92に取込まれる。
【0023】図17は、図14の帳票86の読取領域を
示す図である。ステップS22のフォーマット解読処理
において、主制御CPU81はフォ―マットデータ85
を解読し、図17に示すような読取領域110を計算す
る。読取領域110内には、性別、年号及びその他の文
字が混在している。フォーマットデータ85は、それら
の記載されている行位置111、フィールド位置11
2、フィールド高さ113、フィールド幅114で構成
されている。従来技術で使用したピッチ、読取枠幅、文
字数が特定できないため、フィールド幅114により、
対象選択用文字を含むある程度大きな読取領域を与え
る。図18は、図17のイメージ画像を示す図である。
ステップS23の読取領域投影処理において、主制御C
PU8lは求められた読取領域110を前処理CPU8
3に渡す。図18に示すように、前処理CPU83は読
取領域内をラスタスキャンによって読出していき、投影
メモリ96上に投影画像を作成する。ラスタスキャンの
際には多値2値変換が行われ、2値面像により、投影画
像が作成される。ステップS24の文字位置決定処理に
おいて、前処理CPU83は投影メモリ96中の投影画
像上を左から右方向ヘ検索し、文字開始点116と文字
終了点117を求める。文字開始点116は投影画像の
値が0から1以上に変化した点であり、文字終了点11
7は投影画像の値が1以上から0に変化した点である。
文字開始点116から文字終了点117までの間が1文
字分の文字位置の領域である。これらステップS23,
S24の処理は、対象領域中の文字位置を検出する文字
位置検出処理である。
【0024】前処理CPU83は、図示しないメモリを
用いて求めた文字開始点116を配列変数Xs[]に、文
字終了点117を配列変数Xe[]にそれぞれ登録すると
共に、対応する文字変数acを格納する。ステップS2
5では、文字No.を表す変数noに初期値の1セット
する。ステップS26の文字切出し処理において、格納
された文字開始点(Xs[])、文字終了点(Xe[])を
基に、前処理CPU83はイメージメモリ92から読取
領内の1文字を切出す。図19は、文字の切出しを示す
図である。前処理CPU83は、イメージメモリ92上
の最初の文字「明」の文字開始位点116と文字終了点
117の間をラスタスキャンにより、読出していき、そ
の画像をパターンメモリ93に取込む。ラスタスキャン
の際には、多値2値変換を行い、2値面像をパターンメ
モリに格納する。
【0025】図20は、図19における文字位置を説明
する図である。前処理CPU83は、パターンメモリ9
3に格納された文字面像(斜線部)の中で上下左右から
の枠詰めを行い、図20に示すように、文字位置11
8,119,120,121を求める。ステップS27
の文字認識処理において、第1の実施形態に同じく、認
識辞書内のヒット率の一番高いカテゴリを決定し、その
ヒット率を配列変数hit[]に格納する。ステップS2
8では、文字No.を示す変数nに1を加える。ステッ
プS29では、ステップS24で求めた全文字数(変数
ac)に処理文字数が達したか否かを判定し、未達の場
合は、ステップS26からS29を繰り返す。即ち、領
域読取領域110中の複数の文字に対して、同様の処理
が行なわれる。ステップS30の認識出力処理において
は、第1の実施形態のステップS18と同じく、求めた
文字認識結果のヒット率を用いて、マーク付加文字のコ
ードを生成し、該コードが上位装置に出力される。以上
のように、第2の実施形態によれば、選択式マークを読
み取るために、ステップS23で読取領域110の投影
画像を求め、その求めた投影画像からステップS24で
文字数と各文字の文字位置を求める。そして、文字位置
内の文字パターンを切出した認識処理で、得られたヒッ
ト率を求め、第1の実施形態と同様にして文字コードあ
るいはリジェクトコードを出力するので、読取対象とな
る選択式マークのマークガイドの文字位置が不特定であ
っても、マークの読取りが可能になっている。
【0026】第3の実施形態 第3の実施形態のOCRのハードウエア構成は、投影メ
モリ96を備えた図14の第2の実施形態のOCRと同
様である。図21は、本発明の第3の実施形態のOCR
のマーク認識方法を示すフローチャートである。第3の
実施形態のOCRでは、図21のフローチャートに従
い、読取対象となる選択式マークの文字位置が不特定で
あり、かつ読取対象外の文字が混在した中から、対象の
選択式マークを抽出して読取る。本実施形態では、性別
及び年号を表す選択式マーク読取について説明を行う
が、性別及び年号に限らず、選択式マークであれば、読
取可能である。図22〜図25は、対象の選択マーク
(その1〜その4)を示す図である。OCRは、それ
ら、図22〜図25の各(a)に示された領域、及び図
15(a)に示された領域を読取対象とする。ステップ
S31のイメージ取込み処理は、第2の実施形態のステ
ップS21と同様であり、ステップS32のフォーマッ
ト解読処理も、第2の実施形態とステップS22と同じ
である。ステップS33の読取領域投影処理は、ステッ
プS23と同じであり、ステップS34の文字位置決定
処理も、ステップS24に同じである。ステップS35
では、文字No.を表す変数nに初期値の1をセットす
る。ステップS36の文字切出し処理が、第2の実施形
態のS26と同様に行われる。
【0027】ステップS37の文字認識処理において、
認識CPU84は、文字切出し処理で求めた文字位置の
示す文字パターンの特徴抽出を行い、その結果を特徴抽
出メモリ94に格納する。次に、認識CPU84は認識
辞書メモリ95上の認識辞書と前記求めた特徴抽出メモ
リ94上の特徴抽出結果とのマッチングにより、ヒット
率の一番高いカテゴリを文字コードとして決定すると共
に、配列変数code[]に文字コードを格納し、配列変
数hit[]にヒット率を格納する。続くステップS38
では、文字No.を示す変数nに1を加える。ステップ
S39では、ステップS34で求めた全文字数(変数a
c)に達したか否かをチェックし、未達の場合、処理を
ステップS36からS39を繰り返す。これにより、読
取領域に存在する文字の文字コードが配列変数code
[]に順次格納され、配列変数hit[]にヒット率が順次
格納される。ステップS40の認識出力処理において
は、文字認識結果(文字コード及び、ヒット率)を参照
して、マーク付加文字の文字コードを生成し、上位装置
に出力する。ここでは、[I]選択された性別のマーク
付加文字を抽出する場合と[II]選択された年号のマー
ク付加文字を抽出する場合を説明する。
【0028】[I]選択された性別のマーク付加文字を
抽出する場合 図26は、図21中の認識出力処理40で性別の文字コ
ード出力する場合のフローチャートである。ステップS
4011において、文字No.を表す変数mに初期値の1
をセットする。ステップS4012では、変数mの示す文
字のヒット率(hit[m])が閾値a2より高いもの
をマーク無付加文字と見做し、処理をステップS4013
に進める。反対に、閾値a2より低い文字はマーク付加
文字と見做し、処理をステップS4014に進める。ステ
ップS4013では、マーク無付加文字と見做された文字
の文字コードcode[m]が、対象のマークガイドに
該当するか否かを判別する。性別の読取りゆえ、対象の
マークガイドは「男」または「女」である。ステップS
4012でマーク無付加文字と見做された文字の文字コー
ドcode[m]が「男」の場合、処理はステップS4
15に進み、「女」の場合はステップS4016に進み、
それ以外の場合、処理はステップS4014に進む。ステ
ップS4015において、マークガイドが「男」に該当し
た文字の1つ後ろにある文字(m+1 文字目)のヒット率
(hit[m+1])を参照し、ヒット率(hit[m
+1])が閾値b2より低い場合は、そのm+1文字目
をマーク付加文字と見做し、処理はステップS4017
進む。反対に、ヒット率(hit[m+1])が閾値b
2より高い場合は、m+1文字目をマーク無付加文字と
し、処理はステップS4018に進む。
【0029】ステップS4017では、m文字目の「男」
のマーク無付加文字とm+1文字目のマーク付加文字の
組合わせから、「女」にマークがあるとし、「女」の文
字コードを上位装置へ出力する。ステップS4018
は、マーク無付加文字と判定されたm+1文字目の文字
コード(code[m+1])を参照する。code
[m+1]が[「女」に該当する場合、処理はステップ
S4019に進められ、code[m+1]が他の文字に
なっている場合には、処理はステップS4020に進む。
ステップS4019では、m文字目の「男」のマーク無付
加文字とm+1文字目の「女」のマーク無付加文字の組
み合わせから、「男」「女」ともにマーク無しとし、リ
ジェクト文字コードを上位装置に出力する。即ち、無マ
ーク出力処理が行われる。ステップS4020では、m文
字目の「男」のマーク無付加文字とm+1文字目の
「女」の以外のマーク無付加文字の組み合わせから、m
文字目の「男」を―般読取文字として、「男」の文字コ
ードを上位出力する。一方、ステップS4016では、ガ
イドマークが「女」に該当した文字の1つ前にある文字
(m-1 文字目)のヒット率(hit[m−1])を参照
し、ヒット率(hit[m−1])が閾値c2より低い
場合は、そのm−1文字目をマーク付加文字と見做し、
処理をステップS4021に進める。反対に、ヒット率
(hit[m−1])が閾値c2より高い場合は、m−
1文字目をマーク無付加文字とし、処理をステップS4
22に進める。
【0030】ステップS4021では、m文字目の「女」
のマーク無付加文字とm−1文字目のマーク付加文字の
組み合わせから、「男」にマークがあるとし、「男」の
文字コードを上位装置へ出力する。ステップS4022
は、マーク無付加文字と判定されたm−1文字目の文字
コード(code[m−1])を参照する。code
[m−1]が「男」に該当する場合、処理はステップS
4023に進められ、code[m−1]が他の文字にな
っている場合には、処理はステップS4024に進む。ス
テップS4023では、m文字目の「女」のマーク無付加
文字とm−1文字目の「男」のマーク無付加文字の組み
合わせから、「男」「女」ともにマーク無しとし、リジ
ェクト文字コードを上位装置に出力する。即ち、無マー
ク出力処理が行われる。ステップS4024では、m文字
目の「女」のマーク無付加文字とm−1文字目の「男」
以外のマーク無付加文字の組合わせから、m文字目の
「女」を―般読取文字として、「女」の文字コードを上
位装置に出力する。即ち、一般文字出力処理が行われ
る。
【0031】一方、ステップS4014では文字No.を
示す変数mに1を加える。続いて、ステップS4025
は、変数mが全文字数(変数ac)に到達したかを判断
し、未達の場合、処理はステップS4012に戻る。到達
の場合、処理がステップS4026に進む。ステップS4
26では、「男」及び「女」が存在しないので、印字さ
れた「男」及び「女」が存在しないと判断し、リジェク
トコードを上位装置に出力する。即ち、判別不能出力処
理が行われる。ここで、認識処理S40で使用された閾
値a2、b2、c2について説明を加える。各閾値a
2,b2,c2は、予めそれぞれ設定しておく値であ
る。閾値b2は「女」の文字におけるマークの有無を判
別するものであり、閾値c2は「男」の文字におけるマ
ークの有無を判別するものである。閾値b2を求めるた
めには、複数のマーク無付加文字の「女」を用意し、そ
れらに対する文字認識を行う。そして、ヒット率の最低
値hitbn を求める。更に、複数のマーク付加文字の
「女」を用意して文字認識を行い、ヒット率の最高値h
itbm を求める。マーク付加文字の認識傾向により、
求めたヒット率hitbn とhitbm の間には、hi
tbn >hitbm の関係が成り立っている。閾値b2
には、各ヒット率hitbn とhitbm の間にある値
を用いる。例えば、中間値として閾値b2=(hitb
n +hitbm )/2を用いる。
【0032】閾値c2を求めるためには、複数のマーク
無付加文字の「男」を用意し、それらに対する文字認識
を行う。そして、ヒット率の最低値hitcn を求め
る。更に、複数のマーク付加文字の「男」を用意して文
字認識を行い、ヒット率の最高値hitcm を求める。
マーク付加文字の認識傾向により、求めたヒット率hi
tcn とhitcm の間には、hitcn >hitcm
の関係が成り立っている。閾値c2には、各ヒット率h
itcn とhitcm の間にある値を用いる。例えば、
中間値として閾値c2=(hitcn +hitcm )/
2を用いる。閾値a2は、「男」にマーク無し、または
「女」にマーク無しを検出するための値である。閾値a
2を求めるためには、閾値b2,c2を求める際に使用
したヒット率hitbn 、hitcn の最低値hita
n を求め、そして、ヒット率hitbm、hitcm
最高値hitam を求める。ヒット率hitan とhi
tam の間には、hitan >hitam の関係が成り
立っている。閾値a2は、それらヒット率hitan
hitam の間にある値を用いる。例えば、中間値とし
て閾値値a2=(hitan +hitam )/2が用い
られる。
【0033】図27は、図26中の閾値a2,b2,c
2を示す図である。文字認識によって得られるヒット率
は百分率で表され、最大値が100及び最小値が0の値
をとる。図27ように、算出された各閾値a2,b2,
c2の値も0〜100の範囲内の値となる。図21のフ
ローチャートに基づいた認識出力の具体例を示す。例え
ば、図15のような読取領域110内の不特定位量に表
示された選択式マーク100の読取りを行う場合、ステ
ップS31からステップS39までの処理により、既
に、各文字のヒット率、文字コードが求めらている。図
15(b),(c)は、同図(a)に対する読取りを説
明する図であり、同図(b)は「女」がマーク付加文字
の場合、及び同図(c)は「男」がマーク付加文字の場
合を示している。「女」がマーク付加文字の場合、第1
文字目(文字No.=1)には、ヒット率90%及び文
字コード「男」、第2文字目(文字No.=2)にはヒ
ット率10%及び文字コード「女」が得られている。ス
テップS4012で、第1文字目のヒット率90%と閾値
a2の50%とを比較し、「男」にマーク無しと判断す
る。ステップS4013に進み、第l文字目の文字コード
が「男」であるため、ステップS4015で、第2文字目
のヒット率10%を参照して閾値b2の55%と比較
し、その結果、第2文字目にマークあると判断する。そ
して、ステップS4017で「女」の文字コードを上位装
置に出力する。
【0034】「男」がマーク付加文字の場合、図15
(c)のように、1文字目(文字No.=1)として、
ヒット率5%、文字コード「男」、2文字目(文字n0
=2)にはヒット率100%、文字コード「女」が得ら
れている。ステップS4012では、第l文字目のヒット
率5%を参照し、閾値a2の50%と比較し、1文字目
にマーク有りと判断し、ステップS4014及びステップ
S4025を経た後のステップS4012で、2文字目のヒ
ット率100%を参照した閾値a2の50%との比較に
より、2文字目をマーク無しと判断する。ステップS4
13に進んで2文字目の文字コードの「女」を参照し、
ステップS4016に進む。ここでは、1文字目のヒット
率5%を参照し、閾値c2の45%との比較により、1
文字目にマークが有ると判断し、ステップS4021に進
んで「男」の文字コードを上位装置に出力する。図22
に示す読取領域131内には、不特定位置に表示された
選択式マーク132と読取対象外文字133とがある。
ここで、読取対象外文字133を避け、選択式マーク1
32を読取る例を示す。この場合には、ステップS31
からステップS39までの処理により、1文字目のヒッ
ト率80%と文字コード「3」、2文字目のヒット率9
5%と文字コード「年」、3文字目のヒット率90%と
文字コード「男」、及び4文字目のヒット率10%と文
字コード「女」が得られている。
【0035】ステップS4012では、1文字目のヒット
率80%を参照した閾値a2の50%と比較で、それを
マーク無しと判断する。ステップS4013に進み、第1
文字目の文字コード「3」を参照し、「男」または
「女」に該当しないために、ステップS4014、S40
25を経た後のステップS4012で、2文字目のヒット率
の95%を参照して2文字目をマーク無しと判断する。
そして、ステップS4013で、2文字目の文字コード
「年」を参照し、「男」または「女」に該当しないた
め、ステップS4014、S4025を経た後に再びステッ
プS4012に進み、第3文字目、4文字目について、前
記の図15に場合と同様の処理で、「女」の文字コード
を出力する。以上示したように、読取対象外の文字が、
読取領域131に混在した場合でも、選択式マークの読
取が可能である。図23(a)に示された読取領域13
4内には、不特定位置に表示された読取対象の選択式マ
ーク135とマークの付加された読取対象外の選択式マ
ーク136がある。読取対象外のマークの付加文字に影
響されず、読取対象の選択式マーク135を読取る例を
示す。この場合には、ステップS31からステップS3
9までの処理により、図23(b)のように、1文字目
のヒット率90%と文字コード「明」、2文字目のヒッ
ト率95%と文字コード「大」、3文字目のヒット率9
5%と文字コード「昭」、4文字目のヒット率30%と
文字コード「平」、5文字目のヒット率90%と文字コ
ード「男」、及び6文字目のヒット率10%と文字コー
ド「女」が得られる。
【0036】ステップS4012では、1文字目のヒット
率90%を参照し、閾値a2の50%との比較により、
それをマーク無しと判断する。ステップS4013に進
み、1文字目の文字コード「明」を参照し、それが
「男」または「女」に該当ないので、ステップS4
14、S4025を経た後のステップS4012で、2文字
目のヒット率の95%を参照し、閾値a2の50%との
比較により、2文字目をマーク無しと判断する。ステッ
プS4013に進み2文字目の文字コード「大」を参照
し、それが「男」または「女」に該当しないので、ステ
ップS4014、S4025を経た後のステップS40
12で、3文字目のヒット率の95%を参照し、マーク無
しと判断する。ステップ4013に進んで3文字目の文字
コード「昭」を参照する。それが「男」または「女」に
該当しないので、ステップS4014、S4025を経た後
のステップS4012で、4文字目のヒット率の30%を
参照し、閾値a2の50%との比較により、4文字目に
マークが有ると判定する。処理はステップS4013を介
さず、ステップS4014、S4025ヘ進む。そして、処
理は再びステップS4012に進み、3文字目、4文字目
について図15の場合と同様の処理を行い、「女」の文
字コードを出力する。以上示したように、読取対象外の
マーク付き文字を含む選択式マーク136が、読取領域
134に混在した場合でも、読取対象の選択式マーク1
35の読取りが可能である。
【0037】図24(a)に示された読取領域137内
には、不特定位置に表示された―般読取文字138があ
る。一般読取文字とは、従来のOCRで扱っているよう
に、表示された文字を文字認識して、その認識結果の文
字コードを上位装置に出力するものである。この例では
「女」が表示されているため、「女」の文字コードを出
力する。ところが、読取領域137内には、図24
(a)のように―般読取文字138と、図24(b)の
ような、選択式マーク139のいずれが表示されている
か不明の場合がある。このような場合でも、―般読取文
字と選択式マークの判別を行い、適切な読取結果を出力
する。ステップS31からステップS39までの処理に
より、例えば、1文字目のヒット率90%と文字コード
「女」が得られる。ステップS4012では、1文字目の
ヒット率の90%を参照して、閾値a2の50%との比
較により、1文字目をマーク無しと判断する。ステップ
S4013に進み、1文字目の文字コード「女」を参照す
る。1文字目が「女」に該当するため、処理はステップ
S4016に進み、前文字(0文字目)のヒット率を参照
するが、前文字が存在しないため、マーク無しと判断
し、処理はステップS4022に進む。前文字(0文字
目)の文字コードを参照しようとするが、前文字が存在
しないため「男」に該当せず、ステップS4024に進
み、「女」の文字コードを上位装置に出力する。
【0038】以上示したように、―般読取文字で表現さ
れた場合でも読取りが可能である。図25に示された読
取領域140内には、不特定位置に表示されたマーク無
付加の選択式マーク141が存在する。マーク無付加状
態を検出し、リジエクト文字コードを上位に出力する場
合を説明する。ステップS31からステップS39まで
の処理により、1文字目のヒット率90%と文字コード
「男」、及び2文字目のヒット率100%と文字コード
「女」が得られる。ステップS4012では、1文字目の
ヒット率の90%を参照して閾値a2の50%との比較
により、1文字目をマーク無しと判断し、ステップS4
13で1文字目の文字コード「男」を参照し、それが
「男」に該当するため、処理はステップS4015に進
む。2文字目のヒット率の100%を参照し、閾値b2
の45%との比較により、2文字目をマーク無しと判断
する。そして、処理はステップS4018に進み、2文字
目の文字コード「女」を参照し、それが「女」に該当す
るため、ステップS4019の処理でリジェクトコードを
上位装置へ出力する。
【0039】[II]年号のマーク付加文字を抽出する場
合を説明する。 図28は、図21中の認識出力処理で年号のマーク付加
文字を抽出する場合のフローチャートである。ステップ
S4031では、文字No.を表す変数mに初期値の1を
セットする。ステップS4031の後のステップS4032
では、変数mの示す文字のヒット率(hit[m])が
閾値dより高いものをマーク無付加文字と見做し、この
場合処理はステップS4033に進む。反対に閾値dより
低い文字を、マーク付加文字と見做し、処理はステップ
S4034に進むようになっている。ステップS4033
は、マーク無付加文字と見做された文字の文字コード
(code[m])が対象とするマークガイドに該当す
るか否かを判別する。年号の読取ゆえ、マークガイドは
「明」、「大」、「昭」及び「平」とする。文字コード
(code[m])が、「明」の場合、処理はステップ
S4035に進み、 「大」の場合はステップS4036
進み、「昭」の場合にはステップS4037に進み、
「平」の場合はステップS4038に進み、それ以外の場
合はステップS4034に進む。
【0040】ステップS4035では、マークガイドの
「明」に該当した文字の1つ後にある文字(m+1文字
目)のヒット率(hit[m+1])を参照し、それが
閾値eより低い場合は1文字目をマーク付加文字と見做
し、処理はステップS4039に進む。反対に、閾値eよ
り高い場合は、m+1文字目をマーク無付加文字と見做
し、処理はステップS4040に進む。ステップS4040
では、マーク無付加文字と判定されたm+1文字目の文
字コード(code[m+1])を参照する。m+1文
字目が「大」に該当する場合、処理はステップS4034
に進み、該当しない場合、処理はステップS4041に進
む。ステップS4041では、m文字目の「明」のマーク
無付加文字とm+l文字目の「大」以外のマーク無付加
文字の組合せから、「明」を―般読取文字と見做し、
「明」の文字コードを上位装置に出力する。ステップS
4036では、ステップS4033でマークガイドの「大」
に該当したマーク無付加文字(m文字目)の1つ前にあ
る文字(m―l文字目)のヒット率(hit[m―
l])を参照し、それが閾値fより低い場合、m―l文
字目をマーク付加文字と見なし、処理はステップS40
42に進む。反対に、閾値fより高い場合は、m―l文字
目をマーク無付加文字と見做し、処理はステップS40
43に進む。
【0041】ステップS4042では、m―1文字目のマ
ーク付加文字とm文字目の「大」のマーク無付加文字の
組合せから、「明」をマーク有りとし、「明」の文字コ
ードを上位装置へ出力する。ステップS4043では、マ
ークガイドの「大」に該当した文字(m文字目)の1つ
後ろにある文字(m+1文字目)のヒット率(hit
[m+1])を参照し、それが閾値gより低い場合は、
m+1文字目をマーク付加文字と見做し、処理はステッ
プS4044に進む。反対に、閾値gより高い場合は、m
+l文字目をマーク無付加文字と見做し、処理はステッ
プS4045に進む。ステップS4044では、m文字目の
「大」のマーク無付加文字とm+1文字目のマーク付加
文字の組合せから、「昭」をマーク有りとし、「昭」の
文字コードを上位装置へ出力する。ステップS4045
は、マーク無付加文字と判定されたm+1文字目の文字
コード(code[m+l])を参照し、そのコードが
「昭」に該当する場合は、処理はステップS4034に進
み、反対に「昭」に該当しない場合は、処理はステップ
S4046に進む。
【0042】ステップS4046では、m文字目の「大」
のマーク無付加文字とm+1文字目の「昭」以外のマー
ク無付加文字の組合せから、「大」を―般読取文字と見
做し、「大」の文字コードを上位装置に出力する。一
方、ステップS4037では、ステップS4033で「昭」
に該当したマーク無付加文字(m文字目)の1つ前にあ
る文字(m―l文字目)のヒット率(hit[m―
l])を参照し、それが閾値hより低い場合は、m―1
文字目をマーク付加文字と見做し、処理はステップS4
47に進む。反対に閾値hより高い場合は、m―1文字
目をマーク無付加文字と見做し、処理はステップS40
48に進む。ステップS4047では、m―1文字目のマー
ク付加文字とm文字目の「昭」のマーク無付加文字の組
合せから、「大」をマーク有りとし、「大」の文字コー
ドを上位装置へ出力する。ステップS4048では、
「大」に該当した文字(m文字目)の1つ後にある文字
(m+1文字目)のヒット率(hit[m+l])を参
照し、それが閾値iより低い場合は、m+l文字目をマ
ーク付加文字と見做し、処理はステップS4049に進
む。反対に、閾値iより高い場合は、m+l文字目をマ
ーク無付加文字と見做し、処理はステップS4050に進
む。
【0043】ステップS4049では、m文字目の「昭」
のマーク無付加文字とm+l文字目のマーク付加文字の
組合せから、「平」をマーク有りとし、「平」の文字コ
ードを上位装置へ出力する。ステップS4050では、マ
ーク無付加文字と判定されたm+1文字目の文字コード
(code[m+1])を参照し、それが「平」に該当
する場合は、ステップS4034に進み、反対に「平」に
該当しない場合は、ステップS4051に処理は進む。ス
テップS4051では、前記求めた、m文字目の「昭」の
マーク無付加文字とm+1文字目の「平」以外のマーク
無付加文字の組合せから、「昭」を―般読取文字と見做
し、「昭」の文字コードを上位装置に出力する。ステッ
プS4038では、「平」に該当したマーク無付加文字
(m文字目)の1つ前にある文字(m―l文字目)のヒ
ット率(hit[m―l])を参照し、それが閾値jよ
り低い場合は、m―1文字目をマーク付加文字と見做
し、処理はステップS4052に進む。反対に閾値jより
高い場合は、m―1文字目をマーク無付加文字と見做
し、処理はステップS4053に進む。
【0044】ステップS4052では、m―l文字目のマ
ーク付加文字とm文字目の「平」のマーク無付加文字の
組合せから、「昭」にマーク有りとし、「昭」の文字コ
ードを上位装置へ出力する。ステップS4053では、m
―l文字目のマーク無付加文字の文字コード(code
[m―l])を参照し、それが「昭」に該当する場合、
処理はステップS4054に進み、反対に「昭」に該当し
ない場合、処理はステップS4055に進む。ステップS
4055では、m―l文字目の「昭」以外のマーク無付加
文字とm文字目の「平」マーク無付加文字の組合せか
ら、「平」を―般読取文字と見做し、「平」の文字コー
ドを上位装置に出力する。ステップS4054では、m―
l文字目の「昭」マーク無付加文字と「平」マーク無付
加文字の組合せから、「昭」「平」共にマーク無しと
し、リジェクトコードを上位装置に出力する。また、ス
テップS4034では、文字No.を示す変数mに1を加
え、処理はステップS4056に進む。ステップS4056
では、変数mが文字数(変数ac)に到達したかを判断
し、未達の場合、処理はステップS4032に戻る。到達
の場合は、処理はステップS4057に進む。ステップS
4057では、リジェクトコードを上位装置へ出力する。
【0045】以上のように第3の実施形態によれば、選
択式マークを読み取るために、ステップS33の読取領
域投影処理で読取領域内の投影を取得し、ステップS3
4の文字位置決定処理で文字数と文字位置を求めてい
る。そして、ステップS35の文字切出し処理で切出し
た文字パターンに対して、ステップS37の文字認識処
理を施してヒット率を求め、ステップS40の認識出力
処理において、前後の文字と文字コードとヒット率の関
係から、マーク付加文字を抽出するようにしている。さ
らに、ステップS40の認識出力処理では、該当する文
字がない場合に、リジェクトコードを上位装置に出力す
るようにしている。そのため、読取対象となる選択式マ
ークにおけるマークガイドの文字位置が不特定であって
も、読取対象外の文字が混在する場合でも、また、マー
ク付加された読取対象外の選択式マークが混在する場合
でも、読取対象の選択式マークを容易に読取ることがで
きる。さらに、一般読取文字が存在する場合も、その読
取が可能となる。
【0046】第4の実施形態 第4の実施形態のOCRのハードウエア構成は、投影メ
モリ96を備えた図14の第2の実施形態のOCRと同
様である。図29は、本発明の第4の実施形態のOCR
のマーク認識方法を示すフローチャートである。図29
のフローチャートに従い、読取対象となる選択式マーク
のマークガイドの文字位置が不特定であり、かつ読取対
象外の文字が混在した中から対象の選択式マークを抽出
して読取る。本実施形態では、性別および年号を表す選
択式マーク読取について説明を行うが、性別、年号に限
らず、選択式マークであれば読取可能である。ステップ
S51のイメージ取込み処理は、第2の実施形態のステ
ップS21と同様であり、ステップS52のフォーマッ
ト解読処理も、第2の実施形態とステップS22と同じ
である。ステップS53の読取領域投影処理は、ステッ
プS23と同じであり、ステップS54の文字位置決定
処理も、ステップS24に同じである。ステップS55
では、文字No.を表す変数nに初期値の1をセットす
る。続くステップS56の文字切出し処理が、第2の実
施形態のS26と同様に行われ、処理はステップS57
に移る。。
【0047】ステップS57のマーク文字検出処理にお
いて、ステップS56の文字切出処理で求めた図20の
各文字位置118,119,120,121から、文字
の横幅、高さ及び黒点数を求め、それらに対応して設定
された閾値との比較により、マーク有り無し検出してそ
れぞれ登録する。各文字の横幅は(文字位置119)―
(文字位置118)+l、文字の高さは(文字位置12
1)―(文字位置120)+1によりそれぞれ求めら
れ、各文字の黒点数は、パターンメモリ上での位置11
8、119、120、121で囲まれた領域内の黒点数
を計数することで、それぞれ求められる。図30
(a),(b)は、図29中の文字位置登録処理を説明
する図であり、同図(a)はマーク付加文字の「男」の
場合、及び同図(b)はマーク無付加文字の「女」の場
合の具体例を示している。ステップS57では、各文字
パターンの文字の横幅、高さおよび黒点数と予め設定し
た閾値(高さ閾値、横幅閾値、黒点閾値)とをそれぞれ
比較し、閾値より大きいものについては、得点を加え、
合計点を求める。図30(a)の場合、文字高さ及び黒
点数が閾値より大きいため、合計点の値は、2ポイント
となる。図30(b)の場合は閾値より大きいものが存
在しないため、合計点は0ポイントとなる。例えば、合
計点が1ポイント以上をマーク有りとし、0ポイントを
マーク無しとする。
【0048】認識CPU84は図示しないメモリを用
い、マーク有りと判定された文字の文字No.をマーク
文字No.として配列変数mno[n]に登録し、更に
マーク有りと判定された文字の数をマーク文字数とし
て、変数mcに登録する。ステップS58の文字位置登
録処理では、パターンメモリ93上のマークがあるとさ
れた文字の文字位置120,121を、イメージメモリ
92上のアドレスに変換し、配列変数ys[n]及びy
e[n]に格納する。即ち、ステップS57,S58
は、該読取領域中の各文字の高さと幅と黒点数とをそれ
ぞれ求め、該高さ、幅及び黒点数とそれらに対応して設
けられた閾値とをそれぞれ比較することにより、マーク
付加文字の位置を検出して登録するマーク文字登録処理
を行うことになる。ステップS59では、文字No.を
示す変数nに1を加え、処理はステップS60に移る。
ステップ60では、ステップS54で求めた全文字数
(変数ac)に達したか否かをチェックし、未達の場合
はステップS56からステップS59を繰り返す。反対
に到達の場合、処理がステップS61に進む。ステップ
S61の認識出力処理では、マーク有りと判定された文
字の前後の文字について文字認識を行い、得られた認識
結果に対応する文字コードを上位装置へ出力する。即
ち、マーク認識処理が行われる。ここでは、[III ]性
別の文字を出力する場合と、[V]年号を出力する場合
を説明する。
【0049】[III ]性別の文字を出力する場合 図31は、図29中の認識出力処理で性別の文字コード
を出力する場合のフローチャートである。ステップS6
11では、ステップS57のマーク登録処理で求めたマ
ーク文字数mcを判別する。変数mcがl以上の場合、
処理はステップS6112に進み、反対にマーク文字数m
cが0の場合には、処理はステップS6113に進む。ス
テップS6112では、マークNo.を示す変数mに初期
値の1をセットする。続くステップS6114では、ステ
ップS57で求めた配列変数mno[]と変数mからマ
ーク付加文字の文字No.を表す変数nを求める。ステ
ップS6115では、マーク付加文字(n文字目)の1つ
前にある文字(n―l文字目)について文字認職を行
い、文字コードを得る。即ち、n―1文字目のイメージ
メモリ92上の文字位置は、既に、変数xs[n―
l],xe[n―l],ys[n―l],ye[n―
l]に格納されているので、イメージメモリ92の該文
字位置について、文字切出しと文字認識を行い、文字コ
ードを得る。そして、得た文字コードを変数codeに
格納する。次のステップS6116では変数codeを参
照し、それが「男」に該当する場合、処理はステップS
6117に進み、そのほかの場合、処理がステップS61
18に進む。
【0050】ステップS6118では、マーク付加文字
(n文字目)のlつ後にある文字(n+1文字目)につ
いて文字認識を行い、その文字コードを得る。つまり、
n+1文字目のイメージメモリ92上の文字位量は、既
に、変数xs[n+l],xe[n+l],ys[n+
l],ye[n+l]に格納されているので、イメージ
メモリ92の該文字位置について、文字切出しと文字認
識を行うことで、その文字コードを得る。そして、得た
文字コードを変数codeに格納する。次のステップS
6119では、求められた変数codeを参照し、「女」
に該当する場合、処理はステップS6120に進み、その
ほかの場合の処理は、ステップS6121に進む。ステッ
プS6121では変数mに1を加える。続くステップS6
22では、変数mが、マーク文字数に達したかを判断
し、未達の場合、処理はステップS6114に戻り、到達
の場合はステップS6113に進む。ステップS6113
は、マーク認識結果として、リジェクトコードを上位装
置に出力する。一方、ステップS6117では、マーク認
識結果として「女」の文字コードを出力し、ステップS
6120では、「男」の文字コードを上位装置へ出力す
る。
【0051】[V]年号を出力する場合 図32は、図29中の認識出力処理で年号の文字コード
を出力する場合のフローチャートである。ステップS6
31では、求められたマーク文字数mcを判別する。文
字数mcが1以上の場合、処理はステップS6132へ進
み、0の場合は処理がステップS6133に進んでリジェ
クトコードを出力する。ステップS6132では、マーク
No.を示す変数mに初期値の1をセットする。続い
て、ステップS6134では、ステップS57で求めた配
列変数mno[]と変数mからマーク付加文字の文字N
o.を表す変数nを求める。ステップS6135では、マ
ーク付加文字(n文字目)のlつ前にある文字(n―l
文字目)について、文字認識処理を行い、文字コードを
得る。つまり、n―l文字目のイメージメモリ92上の
文字位置は、変数xs[n―1],xe[n―l],y
s[n―l],ye[n―l]に、既に格納されている
ので、イメージメモリ92の該文字位置について。文字
切出しと文字認識を行い、文字コードを得る。そして、
得た文字コードを変数codeに格納する。ステップS
6136では、求めた変数codeを参照し、それが
「明」に該当する場合、処理はステップS6137に進
み、そのほかの場合、処理はステップS6138に進む。
ステップS6138では、変数codeを参照し、それが
「大」に該当する場合、処理はステップS6139に進
み、そのほかの場合、処理はステップS6140に進む。
ステップS6140では変数codeを参照し、それが
「昭」に該当する場合、処理はステップS6141へ進
み、そのほかの場合、処理はステップS6142に進む。
【0052】ステップS6142では、マーク付加文字
(n文字目)の1つ後にある文字(n+l文字目)につ
いて文字認識を行い、それに対応する文字コードを得
る。つまり、n+l文字目のイメージメモリ上の文字位
置は、各変数xs[n+l],xe[n+1],ys
[n+1],ye[n+1]として既に格納されている
ので、イメージメモリの該文字位置について文字切出し
を行った後に文字認識を行い、文字コードを得る。そし
て、得た文字コードを変数codeに格納する。続く、
ステップS6143では、ステップS6142で求めた変数
codeを参照し、その変数codeが「大」に該当す
る場合、処理はステップS6144に進み、その他の場合
には処理がステップS6145に進む。ステップS6145
では、ステップS6142で求めた変数codeを参照
し、それが「昭」に該当する場合、処理はステップS6
37に進み、その他の場合は、処理がステップS6146
に進む。ステップS6146では、ステップS6142で求
めた変数codeを参照し、その変数が「平」に該当す
る場合、処理はステップS6139に進み、その他の場合
には処理がステップS6147に進む。ステップS6147
では、変数mに1を加える。次のステップS6148
は、変数mマーク文字数mcに達したかを判断し、未達
の場合には、処理ステップS6134に戻り、到達の場合
はステップS6133に進む。ステップS6133では、マ
ーク認識結果としてリジェクトコードを上位装置に出力
する。一方、ステップS6144では、マーク認識結果と
して「明」の文字コードを上位装置に出力し、ステップ
S6137ではマーク認識結果として「大」の文字コード
を出力する。また、ステップS6139では、マーク認識
結果として「昭」の文字コードを上位装置に出力し、ス
テップS6141では、マーク認識結果として「平」の文
字コードを上位装置に出力する。
【0053】以上のように、この第4の実施形態によれ
ば、ステップS57,S58において、読取領域中の各
文字の高さと幅と黒点数とをそれぞれ求め、該高さ、幅
及び黒点数とそれらに対応して設けられた閾値とをそれ
ぞれ比較することにより、マーク付加文字の位置を検出
して登録するマーク文字登録処理を行ない。ステップS
61の認識出力処理で、マーク付加文字の位置の前後の
位置にある文字に対して文字認識を行い、該認識結果に
基づきマーク付加文字を認識してそれに対応する文字コ
ードを出力するマーク認識処理を実行するようにしてい
る。そのため、読取対象となる選択式マークのガイドマ
ークの文字位置が不特定であっても、また、読取対象外
の文字が混在する場合でも、対象の選択式マークの読取
を可能にしている。また、マーク付加文字の前後の文字
だけに、文字認識を行なうので、例えば、第1の実施形
態に比べて、全体の処理時間を短縮できる。さらに、前
後の文字に該当する文字が無い場合には、リジェクトコ
ードを出力するので、認識における信頼性が向上する。
なお、本発明は上記実施形態に限定されず、種々の変形
が可能である。例えば選択用文字のマークガイドは文字
だけでなく、記号等であっても上記実施形態と同様の処
理でマーク認識を行なうことができる。また、OCRの
ハードウエアの構成は図1或いは図14に限定されず、
第1〜第4の実施形態の処理を行なう物であれば、他の
構成とすることが可能である。
【0054】
【発明の効果】以上詳細に説明したように、第1及び第
2の発明によれば、マーク無付加状態での複数の選択用
文字の特徴をそれぞれ求めておく学習処理を行い、読取
対象帳票中の文字の特徴をそれぞれ求め、それらの特徴
と学習処理で求めた各特徴とのマッチングによってヒッ
ト率を求め、該各ヒット率と閾値との比較に基づきマー
ク付加文字の文字コードを出力するマーク認識処理を行
うので、非ドロップアウトカラーのマークガイドを使用
する場合でも、マーク付加された選択文字を抽出するこ
とが可能となる。第3の発明によれば、第1の発明にお
ける学習処理を行っておき、対象の前記複数の選択用文
字の文字位置が不特定の帳票に対してそれら選択用文字
のすべてを含む部分を読取領域として設定し、文字位置
検出処理と、文字位置の文字に対してマーク認識処理と
を施すので、選択用文字の文字位置が不特定の帳票にお
けるマーク認識が可能になる。
【0055】第4の発明によれば、前記学習処理を行っ
ておき、第3の発明における文字位置検出処理と、各文
字位置の文字に対して特徴をそれぞれ求め、それらの特
徴と学習処理で求めた各特徴とのマッチングでヒット率
をそれぞれ求めると共にそれらの文字コードをそれぞれ
求める文字認識処理と、文字コードを参照して読取領域
中の各文字が読取対象の選択用文字かどうかを判断しつ
つ、ヒット率と閾値との比較で選択用文字のうちマーク
が付加されたマーク付加文字を抽出するマーク認識処理
とを行うので、読取対象外の文字が領域に存在した帳票
におけるマーク認識を可能にする。第5の発明によれ
ば、第4の発明における学習処理と、文字位置検出処理
と、文字認識処理と、文字認識処理で求めた文字コード
を参照して読取領域中の各文字が読取対象の選択項目に
対応する選択用文字かどうかを判断しつつ、ヒット率と
閾値との比較で選択用文字のうちマークが付加されたマ
ーク付加文字を抽出する。そのため、読取対象外の選択
マークが読取領域にある帳票に対するマーク認識が可能
になる。
【0056】第6の発明によれは、第4または第5の発
明において、前或いは後の文字に対する文字認識処理結
果とマークが付されているかいないかを判断した結果と
を参照して一般読取用文字を判別する一般読取用文字出
力処理を行なうので、さらに一般読取用文字の文字コー
ドも出力できることになる。第7及び第8の発明によれ
ば、リジェクトコードを出力する判別不能出力処理また
は無マーク出力処理を行うので、第1〜7の発明にOC
Rのマーク認識方法における信頼性が向上する。第9の
発明によれば、読取対象帳票で複数の選択用文字のある
部分を読取領域として設定し、該読取領域中の各文字の
高さと幅と黒点数とからマーク付加文字の位置を検出し
て登録するマーク文字登録処理と、マーク付加文字の位
置の前後の位置にある文字に対して文字認識を行い、該
認識結果に基づきマーク付加文字に対応する文字コード
を出力するマーク認識処理とを行なうので、読取対象と
なる選択式マークのガイドマークの文字位置が不特定で
あっても、また、読取対象外の文字が混在する場合で
も、対象の選択式マークの読取を可能にしている。ま
た、マーク付加文字の前後の文字だけに、文字認識を行
なうので、全体の処理時間を短縮できる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示すOCRの構成ブ
ロック図である。
【図2】従来のOCRの構成例を示す構成ブロック図で
ある。
【図3】図2による従来の動作を示すフローチャートで
ある。。
【図4】図2のフォーマットデータの概念を説明する図
である。
【図5】文字切出しを示す図である。
【図6】図2中のパターンメモリに保持された画像を示
す図である。
【図7】選択式マークの説明図である。
【図8】図1の動作を示すフローチャートである。
【図9】図1中のフォ―マットデータを示す図である。
【図10】図1の文字切出しを示す図である。
【図11】図1中のパターンメモリに保持された画像を
示す図である。
【図12】マーク付加文字と無付加文字を示す図であ
る。
【図13】図8中のステップS18の例を示すフローチ
ャートである。
【図14】本発明の第2の実施形態を示すOCRの構成
ブロック図である。
【図15】図14で読取を行うマークガイドを示す図で
ある。
【図16】図14の動作を示すフローチャートである。
【図17】図14の帳票86の読取領域を示す図であ
る。
【図18】図17のイメージ画像を示す図である
【図19】文字の切出しを示す図である。
【図20】図19における文字位置を説明する図であ
る。
【図21】本発明の第3の実施形態のOCRのマーク認
識方法を示すフローチャートである。
【図22】対象の選択マーク(その1)を示す図であ
る。
【図23】対象の選択マーク(その2)を示す図であ
る。
【図24】対象の選択マーク(その3)を示す図であ
る。
【図25】対象の選択マーク(その4)を示す図であ
る。
【図26】図21中の認識出力処理で性別の文字コード
出力する場合のフローチャートである。
【図27】図26中の閾値a2,b2,c2を示す図で
ある。
【図28】図21中の認識出力処理で年号のマーク付加
文字を抽出する場合のフローチャートである
【図29】本発明の第4の実施形態のOCRのマーク認
識方法を示すフローチャートである。
【図30】図29中の文字位置登録処理を説明する図で
ある。
【図31】図29中の認識出力処理で性別の文字コード
を出力する場合のフローチャートである。
【図32】図29中の認識出力処理で年号の文字コード
を出力する場合のフローチャートである。
【符号の説明】
51,81 主制御CPU 53,83 前処理CPU 54,84 認識CPU 55,85 フォーマットデータ 56,86 帳票 62,92 イメージメモリ 63,93 パターンメモリ 64,94 特徴抽出メモリ 65,95 認識辞書メモリ 96 投影メモリ

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 帳票に対して光学式文字読取装置を用
    い、該帳票に印字された複数の選択用文字のうち、選択
    されてマークの付されたマーク付加文字を抽出し、該マ
    ーク付加文字の文字コードを出力する光学式文字読取装
    置のマーク認識方法において、 予め、前記マーク無付加状態での前記複数の選択用文字
    の特徴をそれぞれ求めておく学習処理を行い、 読取対象帳票中の前記複数の選択用文字に対する特徴を
    前記光学式文字読取装置でそれぞれ求め、それらの特徴
    と前記学習処理で求めた各特徴とのマッチングによって
    該各特徴間の類似度を表すヒット率をそれぞれ求め、該
    各ヒット率と閾値との比較で前記マーク付加文字を抽出
    して該マーク付加文字の文字コードを出力するマーク認
    識処理を行うことを特徴とする光学式文字読取装置のマ
    ーク認識方法。
  2. 【請求項2】 予め、請求項1記載の学習処理を行って
    おき、対象の前記複数の選択用文字の文字位置が特定さ
    れた帳票に対して該特定された文字位置を前記光学式文
    字読取装置の読取領域として設定し、該読取領域で請求
    項1記載のマーク認識処理を施すことを特徴とする光学
    式文字読取装置のマーク認識方法。
  3. 【請求項3】 予め、請求項1記載の学習処理を行って
    おき、対象の前記複数の選択用文字の文字位置が不特定
    の帳票に対してそれら選択用文字のすべてを含む部分を
    前記光学式文字読取装置の読取領域として設定し、該読
    取領域中の文字位置を検出する文字位置検出処理と、前
    記検出された文字位置の文字に対して請求項1記載のマ
    ーク認識処理とを施すことを特徴とする光学式文字読取
    装置のマーク認識方法。
  4. 【請求項4】 予め、請求項3記載の学習処理を行って
    おき、 請求項3記載の文字位置検出処理と、 前記文字位置検出処理で検出された文字位置の各文字に
    対して特徴をそれぞれ求め、それらの特徴と前記予め求
    めた各特徴とのマッチングで該各特徴間の類似度を表す
    ヒット率をそれぞれ求めると共にそれらの文字コードを
    それぞれ求める文字認識処理と、 前記文字コードを参照して前記読取領域中の各文字が読
    取対象の選択用文字かどうかを判断しつつ、前記ヒット
    率と閾値との比較で前記選択用文字のうちマークが付加
    されたマーク付加文字を抽出して該マーク付加文字の文
    字コードを出力するマーク認識処理とを行うことを特徴
    とする光学式文字読取装置のマーク認識方法。
  5. 【請求項5】 予め、請求項4記載の学習処理を行って
    おき、 請求項4記載の文字位置検出処理及び文字認識処理と、 前記文字認識処理で求めた文字コードを参照して前記読
    取領域中の各文字が読取対象の選択項目に対応する選択
    用文字かどうかを判断しつつ、前記ヒット率と閾値との
    比較で前記選択用文字のうちマークが付加されたマーク
    付加文字を抽出して該マーク付加文字の文字コードを出
    力するマーク認識処理とを、 行うことを特徴とする光学式文字読取装置のマーク認識
    方法。
  6. 【請求項6】 前或いは後の文字に対する前記文字認識
    処理結果と該前或いは後の文字に前記マークが付されて
    いるかいないかを判断した結果とを参照し、対象文字が
    選択用文字以外の一般読取用文字か否かを判別し、該判
    別結果が一般読取用文字の場合、前記文字認識処理で求
    めた対応する文字コードを出力する一般読取用文字出力
    処理を行うことを特徴とする請求項4または5記載の光
    学式文字読取装置のマーク認識方法。
  7. 【請求項7】 前記一般読取用文字と前記選択用文字の
    判別が不可能な場合、リジェクトコードを出力する判別
    不能出力処理を行うことを特徴とする請求項6記載の光
    学式文字読取装置のマーク認識方法。
  8. 【請求項8】 前記複数の選択用文字のすべてに前記マ
    ークが付加されていない場合に、リジェクトコードを出
    力する無マーク出力処理を行うことを特徴とする請求項
    1、2、3、4、5、6、または7記載の光学式文字読
    取装置のマーク認識方法。
  9. 【請求項9】 帳票に対して光学式文字読取装置を用
    い、該帳票に印字された複数の選択用文字のうち選択さ
    れてマークの付されたマーク付加文字を抽出し、該マー
    ク付加文字の文字コードを出力する光学式文字読取装置
    のマーク認識方法において、 読取対象帳票で前記複数の選択用文字のある部分を前記
    光学式文字読取装置の読取領域として設定し、該読取領
    域中の各文字の高さと幅と黒点数とをそれぞれ求め、該
    高さ、幅及び黒点数とそれらに対応して設けられた閾値
    とをそれぞれ比較することにより、前記マーク付加文字
    の位置を検出して登録するマーク文字登録処理と、 前記マーク付加文字の位置の前後の位置にある文字に対
    して文字認識を行い、該認識結果に基づき前記マーク付
    加文字を認識してそれに対応する文字コードを出力する
    マーク認識処理とを、 行うことを特徴とする光学式文字読取装置のマーク認識
    方法。
JP7219236A 1995-08-28 1995-08-28 光学式文字読取装置のマーク認識方法 Pending JPH0962789A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7219236A JPH0962789A (ja) 1995-08-28 1995-08-28 光学式文字読取装置のマーク認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7219236A JPH0962789A (ja) 1995-08-28 1995-08-28 光学式文字読取装置のマーク認識方法

Publications (1)

Publication Number Publication Date
JPH0962789A true JPH0962789A (ja) 1997-03-07

Family

ID=16732352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7219236A Pending JPH0962789A (ja) 1995-08-28 1995-08-28 光学式文字読取装置のマーク認識方法

Country Status (1)

Country Link
JP (1) JPH0962789A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6320983B1 (en) 1998-03-27 2001-11-20 Fujitsu Limited Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6320983B1 (en) 1998-03-27 2001-11-20 Fujitsu Limited Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein

Similar Documents

Publication Publication Date Title
US5799115A (en) Image filing apparatus and method
US6366696B1 (en) Visual bar code recognition method
JP6869208B2 (ja) 光電式コードリーダ及び光学コードの読み取り方法
US6575367B1 (en) Image data binarization methods enabling optical reader to read fine print indicia
EP0063454B1 (en) Method for recognizing machine encoded characters
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US5164996A (en) Optical character recognition by detecting geo features
JPS60189082A (ja) 金融書類上の金額位置検出装置及び検出方法
CN114155527A (zh) 一种场景文本识别方法和装置
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
WO1991017519A1 (en) Row-by-row segmentation and thresholding for optical character recognition
US5150425A (en) Character recognition method using correlation search
JPH07120389B2 (ja) 光学的文字読取装置
JP4416890B2 (ja) 帳票識別装置
EP0144006B1 (en) An improved method of character recognitionand apparatus therefor
JPH0962789A (ja) 光学式文字読取装置のマーク認識方法
JPS6162983A (ja) 楽譜読取装置
JP3163235B2 (ja) 光学式文字読取装置
JP2001236467A (ja) パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体
JP2002259909A (ja) 文字読取装置
JPS6379193A (ja) 文字読取装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JP2674475B2 (ja) 文字読取装置
JPH11184965A (ja) 帳票識別登録装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000711