JPH10222602A - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JPH10222602A
JPH10222602A JP9018449A JP1844997A JPH10222602A JP H10222602 A JPH10222602 A JP H10222602A JP 9018449 A JP9018449 A JP 9018449A JP 1844997 A JP1844997 A JP 1844997A JP H10222602 A JPH10222602 A JP H10222602A
Authority
JP
Japan
Prior art keywords
unit
character
image
halftone
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9018449A
Other languages
English (en)
Inventor
Yasuhiko Shimizu
保彦 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP9018449A priority Critical patent/JPH10222602A/ja
Publication of JPH10222602A publication Critical patent/JPH10222602A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 光学式文字認識装置の文字認識率を向上させ
る。 【解決手段】 読取部10により、帳票1の多値画像D
0が取得され、イメージメモリ41に格納される。2値
化処理部42は多値画像D0の2値化を行って2値化さ
れたパタンD1を生成する。フィルタ処理部44は、異
なるルールで平滑化を行う複数のフィルタを有し、その
選択したフィルタでパタンD1の整形を行ってパタンD
2を出力する。パタンD2は文字単位に切出され、文字
識別部48でその文字コードが求められる。ここで、文
字コードが得られない場合、再認識処理が行われる。中
間調計数手段43は、画像D0における中間調を計数し
ており、リスキャン方式判定部45はその計数結果を参
照し、閾値を変更して2値化処理部42〜文字識別部4
8による処理、またはフィルタの選択を変更してフィル
タ処理部44〜文字識別部48による処理を実行させ
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票に記入または
印刷された文字を認識する光学式文字読取装置(以下、
OCRという)に関するものである。
【0002】
【従来の技術】図2は、従来のOCRの構成ブロック図
である。
【0003】このOCRは、帳票1の画像を取り込む読
取部10と、認識部20とを有している。読取部10に
は、光源11、レンズ12、CCDセンサ13、及びア
ナログ/ディジタル変換(以下、A/D変換という)回
路14が設けられ、該CCDセンサ13の出力側にその
AD変換回路14が接続されている。認識部20は、A
/D変換回路14に接続されたイメージメモリ21、2
値化処理部22、フィルタ処理部23、前処理部24、
文字識別部25、及びこれらを制御する認識制御部26
を備えている。イメージメモリ21の出力側に2値化処
理部22が接続され、該2値化処理部22の出力側にフ
ィルタ処理部23が接続されている。フィルタ処理部2
3の出力側に、前処理部24が接続され、この前処理部
24の出力側に文字識別部25が接続されている。
【0004】帳票1は図示しない機構部によって搬送さ
れ、所定の位置で、光源11によりれ照射される。帳票
1の表面で反射した光がレンズ12を透過し、CCDセ
ンサ13上で帳票像が結像する。CCDセンサ13は、
帳票1の像をアナログの電気信号に変換してA/D変換
回路14に与える。A/D変換回路14は、アナログの
電気信号をディジタル信号に変換する。このディジタル
信号が、イメージメモリ21に格納される。イメージメ
モリ21には、帳票1全体の画像データが格納される。
図3は、図2中の認識部20の処理フローを示す図であ
り、この図2を参照しつつ、図2の動作の概略を説明す
る。
【0005】図3のステップS1で2イメージメモリ2
1に格納されたデータは、多値で帳票1を表現した画像
データD0であるが、ステップS2のイメージ2値化処
理において、多値の画像データD0が2値化処理部22
によって白と黒に2値化され、2値化パターンD1が求
められる。ステップS3のフィルタ処理により、フィル
タ処理部23が、2値化パタンD1における文字パタン
以外の黒点(ゴミ)や、文字パタン内の白抜けを除去す
る。フィルタ処理によって作成された文字パタンD2に
対して、予め与えられた図示しない文字位置情報(帳票
フォーマット)に基づき、前処理部24は1文字毎の文
字パタンD3を抽出する切出し処理(ステップS4)を
行う。ステップS5において、文字識別部25は、1文
字毎に切り出された文字パタンD3に対して特徴点の抽
出を行い、標準パタン(辞書)との照合により、文字認
識処理を行う。ステップS6では判定処理を行う。即
ち、文字認識処理の結果、切出された文字パタンD3に
対応する文字コードが検索できたか否かを判定する。検
索できなかった場合がリジェクト(不読文字)であり、
認識制御部26は、処理をステップS7に進める。ステ
ップS7では、イメージ2値化処理における閾値を変え
る2値化閾値変更処理を行う。そして、再度、ステップ
S2のイメージ2値化処理からステップS5の文字認識
処理までの処理を行う。このようなステップS2〜ステ
ップS7の処理を繰り返すことで文字コードが決定した
ときには、ステップS8の認識結果出力処理で、その文
字コードを認識結果として出力する。
【0006】ここで、イメージメモリ21に格納された
画像データと、各処理におけるパターンの状態を、以下
の図4〜図8を参照しつつ説明する。図4は、図2のイ
メージメモリ21に格納された画像データを示す図であ
り、例えば8階調で表現したものである。図4におい
て、「・」は白、「0」は黒を表わしている。「1」〜
「6」は白と黒の間の中間調を表し、数値が大きいほど
白に近いことを示している。このように、A/D変換回
路14を介してイメージメモリ21に与えられる画像デ
ータD0は、画素毎に濃度が異なる。図5は、図4に対
する2値化処理を説明する図である。
【0007】図4の画像データD0を2値化したパタン
D1は、例えば2値化の閾値を「3」とすると図5のよ
うになる。ここで、「・」は白に相当し、「0〜3」は
黒に相当する。図6は、ステップS3のフィルタ処理の
概念の説明図であり、同図中の「○」及び「●」は、2
値化後のパタンの1画素を表わし、「○」は白、「●」
が黒を表わしている。図6には、4つの画素群31,3
2,33,34が示されているが、その中心が着目画素
である。ステップS3のフィルタ処理では、着目画素を
囲む周辺画素を参照して着目画素を白または黒に再設定
する。画素群31のように着目画素が黒であっても、周
辺画素に白の画素が多いので、画素群32のように着目
画素は白に置き換えられる。画素群33のように着目画
素が白であっても、周辺画素に黒の画素が多いので、画
素群34のように着目画素は黒に置き換えられる。
【0008】図7は、図5の2値化パタンD1をフィル
タ処理した後のパタンD2を示す図である。フィルタ処
理により、文字以外のノイズ(ゴミ)35の部分が白に
置き換えられる。また、文字線部のぎざぎざの部分36
が白に置き換えられて平滑化される。図8は、文字切り
出し処理を示す図である。フィルタ処理された図7のパ
タンD2に対して、周知の技術による文字切出し処理を
行うことにより、図8のような文字単位の文字パターン
D3が求められ、これにステップS5の文字認識処理が
行われる。
【0009】
【発明が解決しようとする課題】しかしながら、従来の
OCRでは、次のような課題があった。図9は、薄い多
値パタンを示す図であり、図10は、図9の2値化パタ
ンD1を示す図であり、及び図11は、図10をフィル
タ処理したパタンD3を示す図である。これら図9〜図
11を参照しつつ、従来の課題を説明する。イメージメ
モリ21に格納される画像データD0中の文字パタン
が、図9のように薄い場合がある。図9では文字の最も
濃い画素でも、その画素値が2になっている。この画像
データを、2値化閾値「3」で2値化すると、図10の
ように白に相当する部分が増加し、数字2の上部と下部
が欠ける。図10に対してフィルタ処理と文字切り出し
処理を行うと、図11のパタンD3が得られる。図11
に対して文字認識処理を行うと、認識結果がリジェクト
になる可能性が増加するばかりでなく、誤った認識結果
を得るという問題が発生する。
【0010】
【課題を解決するための手段】前記課題を解決するため
に、本発明のうちの第1の発明は、OCRにおいて、文
字の記載された帳票の画像を光学的に取得し且つ光電変
換し、該帳票の画素毎の多値の画像データを順次出力す
る読取部と、前記画素データを入力して前記帳票の文字
パタンを含む多値画像を格納するイメージメモリと、前
記多値画像に対して閾値を用いた2値化を行い2値画像
を生成する2値化処理部と、前記2値画像おける各画素
データを異なるルールを用いて再設定する機能を持つ複
数のフィルタを有し、該複数のフィルタのうち選択した
該フィルタで該2値画像の局所的な整形を行うフィルタ
処理部と、前記局所的な整形を終了した前記2値画像に
おける1文字単位の領域を切出す前処理部と、前記領域
中の文字パタンの特徴を求め該特徴と辞書との比較で該
文字パタンに対応する文字コードを検索する文字識別部
とを、備えている。さらに、このOCRには、前記多値
画像における中間調のデータを集計する中間調計数部
と、前記文字コードが得られなかった場合には前記中間
調計数部の集計結果を参照し、前記文字識別部で用いる
前記文字パタンを変形した上で該文字識別部に前記文字
コードの再検索を行わせるリスキャン手段とが、設けら
れている。
【0011】第2の発明によれば、第1の発明における
フィルタ処理部を、前記2値画像における各画素データ
を異なるルールを用いて再設定する機能を持つ複数のフ
ィルタを有し、該複数のフィルタのうち選択したフィル
タで該2値画像の局所的な整形を行う構成としている。
そして、前記リスキャン手段は、前記中間調計数部の集
計結果を参照し、前記文字パタンの変形を前記閾値の変
更によって行うか或いは前記フィルタの選択の変更によ
って行うかを判定するリスキャン方式判定部を備え、該
リスキャン方式判定部の判定結果に基づき、該閾値を変
更して前記2値化処理部、前記フィルタ処理部、前記前
処理部及び前記文字識別部による処理を再度実行させる
か、または、該フィルタの選択を変更して前記フィルタ
処理部、前記前処理部及び前記文字識別部による処理を
再度実行させる構成にしている。第3の発明は、第2の
発明におけるリスキャン手段に、前記中間計数部の集計
結果から前記多値画像における文字パタンの濃淡差を判
定する濃度勾配判定部を設け、前記リスキャン方式判定
部は、該濃淡差の判定結果に基いて前記文字パタンの変
形を前記閾値の変更によって行うか或いは前記フィルタ
の選択の変更によって行うかを判定する構成としてい
る。
【0012】第4の発明は、第1の発明におけるリスキ
ャン手段に、前記中間調計数部の集計結果から前記多値
画像における文字パタンの中間調の範囲を判定し、該中
間調の範囲内で前記2値化処理部の用いる閾値を再設定
する2値化閾値判定部を備え、該2値化処理部、前記フ
ィルタ処理部、前記前処理部及び前記文字識別部による
処理を再度実行させる構成にしている。第1〜4の発明
によれば、以上のようにOCRを構成したので、読取部
により、帳票の画像が光学的に取得されると共に光電変
換され、多値の画像データが得られる。この多値の画像
データがイメージメモリに格納される。2値処理部によ
り、2値画像が生成され、2値画像おける各画素データ
がフィルタ処理部で再設定、される。前処理部により、
1文字単位の領域が切出され、文字識別部で文字コード
が検索される。一方、多値画像における中間調のデータ
が中間調計数部によって集計されている。文字識別部で
文字コードが検索できなかった場合には、文字識別部の
用いる文字パタンの変形を行って文字コードの検索が行
われるが、このときには、リスキャン手段により、中間
調計数部の集計結果が参照され、その集計結果に応じて
文字パタンの変形方法が選択される。
【0013】第2の発明によれば、閾値が変更されて2
値化処理部、フィルタ処理部、前処理部及び文字識別部
による処理が再度実行されるか、またはフィルタの選択
が変更されて、フィルタ処理部、前処理部及び文字識別
部による処理が、再度実行去れる。第3の発明によれ
ば、濃度勾配判定部により、中間計数部の集計結果から
多値画像中の文字パタンにおける濃淡差が判定され、濃
度勾配判定部の判定結果に基づき、2値化処理部の閾値
が変更されて2値化処理部、フィルタ処理部、前処理部
及び文字識別部による処理が再度実行されるか、または
フィルタの選択が変更されてフィルタ処理部、前処理部
及び文字識別部による処理が再度実行される。第4の発
明によれば、2値化閾値設定手段により、多値画像中の
文字パタンの中間調の範囲が判定され、中間調の範囲に
対応して2値化処理部の閾値が変更去れてこの2値化処
理部、フィルタ処理部、前処理部及び文字識別部による
処理が再度実行される。従って、前記課題を解決できる
のである。
【0014】
【発明の実施の形態】第1の実施形態 図1は、本発明の第1の実施形態を示すOCRの構成ブ
ロック図である。このOCRは、光源11、レンズ1
2、CCDセンサ13、及びA/D変換回路14を備
え、帳票1のイメージを取得する従来の図2と同様の読
取部10と、従来とは異なる構成の認識部40とを有し
ている。認識部40は、帳票1を多値データで表わした
帳票の画像D0を格納するイメージメモリ41を備えて
いる。イメージメモリ41には、2値化処理部42と中
間調計数部43とが接続されている。2値化処理部42
は、多値データを閾値でスライスして多値画像D0を2
値画像D1に変換するものである。中間調計数部43
は、パタンD0における中間調のデータを集計するもの
であある。
【0015】2値化処理部42の出力側に、フィルタ処
理部44が接続され、中間調計数部43の出力側に、リ
スキャン方式判定部45が接続されている。リスキャン
方式判定部45の出力側は、2値化処理部42に接続さ
れると共にフィルタ制御部46に接続されている。フィ
ルタ制御部46の出力側は、フィルタ処理部44に接続
されている。フィルタ処理部44の出力側に前処理部4
7が接続され、この前処理部47の出力側に、文字識別
部48が接続されている。
【0016】フィルタ処理部44は、異なったルールで
パタンD1の画素データを再設定する複数のフィルタを
有し、選択したフィルタで、2値化されたパタンD1の
ノイズ(ゴミ)の除去と文字の平滑化とを行い、パタン
D1を整形したパタンD2を生成する。フィルタ制御部
46は、フィルタ処理部44の制御を行うものである。
前処理部47は、画像D2から文字パタンを1文字分ず
つ切出すものである。文字識別部48は、切出された文
字パタンの識別を行い、文字コードを求めるものであ
る。この文字認識装置は、文字識別部48で文字コード
が得られない文字(リジェクト文字)がある場合に再度
の文字認識を行う。リスキャン方式判定部45は、再度
の文字認識において、中間調計数部43の集計結果を参
照して、再度2値化処理を行うか、フィルタの種類を変
えるかの判定を行う機能を有し、フィルタの種類を変え
る場合は、指示をフィルタ制御部46に与え、2値化を
再度行う場合には、指示を2値化処理部42に与える。
フィルタ制御部46は、フィルタ処理部44の制御を行
うものである。認識部40には、さらに、認識制御部4
9が設けられている。認識制御部49が認識部40中の
各部を制御するものであり、リスキャン方式判定部45
と共にリスキャン手段を構成している。
【0017】図12は、図1の認識部40の処理フロー
を示す図であり、この図12を参照しつつ、図1の文字
認識装置の動作を説明する。この第1の実施形態の読取
部10は、従来の文字認識装置の読取部10と同様に動
作し、帳票1のイメージを光学的に読取って電気信号に
変換する。読取部10中のA/D変換回路14は、帳票
1のイメージに対応する多値の画素毎の画像データを順
に出力する。この多値の画像データが、イメージメモリ
41に書込まれ、イメージメモリ41に帳票1の多値画
像D0が格納される(図12のステップS11)。次の
ステップS12において、2値化処理部42は帳票1の
多値画像D0を、予め決められた2値化閾値を用いて変
換し、2値化画像D1を求める。これと同時に、中間調
計数部43は、多値画像D0における中間調データの数
を集計する(ステップS13)。ステップS12の後の
ステップS14において、フィルタ処理44は、2値画
像D1のノイズ除去を行うと共に文字の平滑化を行う。
これら2値化処理とフィルタ処理により、文字パタンが
整形された画像D2が形成される。
【0018】ステップS15において、前処理部47は
画像D2を1文字を表わす文字パタンD3ごとにを切出
す。ステップS25において、文字識別部48が文字パ
タンD3に対する文字認識処理を行う。ステップS26
において、認識処理結果がリジェクトか否かの判定を行
い、文字認識処理で文字コードが決定した場合にはその
文字コードを認識結果として出力する(ステップS1
8)が、リジェクトの場合には、つぎのようなうな再度
文字認識処理を行う。図13は、図12の中間調計数処
理S13を説明する図であり、イメージメモリ41内の
多値画像を示している。同図中「・」は白であり、他は
中間調データの値を示す数字である。
【0019】中間調計数部43は、各中間調データの個
数を計数している。画像D0が例えば図13のような多
値画像の場合には、集計結果は6=23個、5=20
個、4=79個、3=79個、2=37個、1=0個、
及び0=0個になる。ステップS19において、リスキ
ャン方式判定部45は、中間調計数部43の集計結果に
基づき画像D0の濃度を判定する。多値画像の濃度判定
は、中間調データの比率(例えば中間調値6の数/全体
の中間調データ数)を求め、それが予め設定された値よ
りも多ければ画像D0における文字パタンが薄く、少な
ければ濃いと判定する。画像D0における文字パタンが
濃いと判定され、且つ、文字認識結果がリジェクトとな
った場合、ステップS20において、2値化処理部42
は画像データD0に対する2値化閾値を変更し、再びス
テップS12の2値化処理を行う。このときの2値化で
新たな2値画像D1* が得られる。以降、2値画像D1
* に対して、ステップS13のフィルタ処理からステッ
プS18の認識結果出力処理まで処理が、前述と同様に
行われる。
【0020】画像D0における文字パタンが薄いと判定
された場合には、最初の2値画像D1に対してフィルタ
の種類を変えてステップS14のフィルタ処理を行う。
フィルタの種類を変えることによって着目画素の設定が
変化し、2値化でかすれたような文字が、ある程度復元
され、ステップS15で切出される文字パタンが文字パ
タンD3* に変形される。この文字パタンD3* に対し
てステップS15以降の一連の認識処理が行われる。こ
のように、リジェクト文字の場合、再度の文字認識処理
を文字コードが確定するまで繰り返す。ただし、リジェ
クト発生時の再認識処理は、予め定めた回数まで行うこ
ととし、再認識処理の回数が最大になっても、文字コー
ドが検索できない場合には、認識結果はリジェクトにな
る。以上のように、この第1の実施形態のOCRでは、
中間調計数部43と、リスキャン方式判定部45を設
け、文字認識でリジェクトになった場合に行われる再認
識処理において、多値画像の階調データの集計結果を参
照して文字パタンの濃度を判定し、2値化する閾値を変
更して文字パタンを変形させるか、或いはフィルタの種
類変えて文字パタンを変形させるようにしている。その
ため、認識対象となる文字パタンが薄い場合でも、リジ
ェクトまたは誤読の原因となるパタン切れを低減でき、
文字認識率が向上する。さらに、パタン切れによる再認
識処理がの回数が少なくなるので、認識処理速度の向上
が期待できる。
【0021】第2の実施形態 図14は、本発明の第2の実施形態を示すOCRの構成
ブロック図である。このOCRは、第1の実施形態と同
様の読取部10と、新たに、濃度勾配判定部を設けた認
識部50とを有している。認識部50は、第1の実施形
態と同様に帳票の多値画像D0を格納するイメージメモ
リ51を備えている。イメージメモリ51には、2値化
処理部52と中間調計数部53が接続されている。2値
化処理部52は、多値データを閾値でスライスして多値
の画像パタンD0を2値の画像パタンD1に変換するも
のである。中間調計数部53は、パタンD0における中
間調のデータを集計するものである。2値化処理部52
の出力側に、フィルタ処理部54が接続され、中間調計
数部53の出力側に、濃度勾配判定部55が接続されて
いる。濃度勾配判定部55の出力側に、リスキャン方式
判定部56が接続されている。リスキャン方式判定部5
6の出力側は、2値化処理部52に接続されると共にフ
ィルタ制御部57に接続されている。フィルタ制御部5
7の出力側は、フィルタ処理部54に接続されている。
フィルタ処理部54の出力側に前処理部58が接続さ
れ、この前処理部58の出力側に、文字識別部59が接
続されている。
【0022】フィルタ処理部54は、異なったルールで
パタンD1の画素データを再設定する複数のフィルタを
有し、選択したフィルタで2値化画像D1におけるノイ
ズの除去と文字パタンの平滑化とを行い、文字パタンを
整形した画像D2を生成する。フィルタ制御部57は、
フィルタ処理部54の制御を行うものである。前処理部
58は、画像D2から文字パタンを1文字分ずつ切出す
ものである。文字識別部59は、切出された文字パタン
の識別を行い、文字コードを求めるものである。濃度勾
配判定部55は、中間調判定部53の集計結果から、文
字パタンの濃度勾配を判定するものである。この文字認
識装置も第1の実施形態と同様に、文字識別部59で文
字コードが得られない場合に再度の文字認識を行うが、
リスキャン方式判定部56は、再度の文字認識におい
て、濃度勾配の大小によって再度2値化処理を行うか、
フィルタの種類を変えるかの判定を行う機能を有してい
る。フィルタの種類を変える場合は、その指示をフィル
タ制御部57に与え、2値化を再度行う場合には、指示
を2値化処理部52に与える。認識部50には、さら
に、認識制御部60が設けられている。認識制御部60
が認識部50中の各部を制御する構成になっている。
【0023】図15は、図14の認識部50の処理フロ
ーを示す図であり、この図15を参照しつつ、OCRの
動作を説明する。読取部10は、第1の実施形態と同様
に動作し、帳票1のイメージを光学的に読取って電気信
号に変換する。読取部10中のA/D変換回路14は、
帳票1のイメージに対応する多値の画素毎の画像データ
を順に出力する。図15のステップS31において、こ
の多値の画像データがイメージメモリ51に書込まれ、
イメージメモリ51に、帳票1の多値画像D0が格納さ
れる。次のステップS32において、2値化処理部52
は帳票1の多値画像D0を、予め決められた2値化閾値
を用いて変換し、2値化画像D1を求める。これと同時
のステップS33において、中間調計数部53は、多値
画像D0における中間調データの数を集計する。そし
て、ステップS34において、濃度勾配判定部55は、
中間調データの集計結果から、画像D0における文字パ
タンの濃度勾配を判定する。即ち、濃淡の差が大きいか
小さいかの大小を判定を行う。図16は、図15中の濃
度勾配判定処理の説明図であり、画像D0が示されてい
る。
【0024】図16では、「0」が最も濃い黒を表わ
し、「1」,「2」,…と数字が大きくなる程、白に近
くなり、「7」に相当する「・」が白を表わすような階
調を行った場合の例であるが、この画像D0では、中間
調データが「0」,「1」のみで構成されている。濃度
勾配判定部55は、予め設定された閾値を用いることに
より、濃淡の差が小さいと判定する。ステップS32の
後のステップS35において、フィルタ処理54は、2
値画像D1のノイズ除去を行うと共に文字の平滑化を行
う。これら2値化処理とフィルタ処理により、文字パタ
ンが整形された画像D2が形成される。ステップS36
において、前処理部58は画像D2から1文字毎の文字
パタンを切出す。ステップS37において、文字識別部
59が切出された文字パタンに対する文字認識処理を行
う。この文字認識処理では、文字パタンの特徴抽出を行
い、図示しない辞書との比較で、該文字パタンに対応す
る文字コードを検索する。文字ステップS38におい
て、認識処理結果がリジェクトか否かの判定を行う。そ
して、文字認識処理で文字コードが決定した場合には、
ステップS39でその文字コードを認識結果として出力
する。リジェクトの場合には、つぎのような再認識処理
を行う。
【0025】リスキャン方式判定部56は、濃度勾配判
定の結果が大の場合(濃度差が大)には、ステップS4
1で2値化処理部52に指示を与え、2値化処理の2値
化閾値を変更し、ステップS32〜S38の一連の文字
認識処理を行わせる。濃度勾配判定結果が小の場合(濃
度差が小)には、フィルタ処理で用いるフィルタの種類
を変更し、ステップS33〜S38の一連の文字認識処
理を行わせる。このように、リジェクト文字の場合、再
度の文字認識処理を文字コードが確定するまで繰り返
す。ただし、リジェクト発生時の再認識処理は、予め定
めた回数まで行うこととし、再認識処理の回数が最大に
なっても、文字コードが検索できない場合には、認識結
果はリジェクトになる。以上のように、この第2の実施
形態では、濃度勾配判定部55を設け、リジェクト発生
時の再認識処理において、多値画像D0の階調に基づい
て文字パタンの濃度差により、2値化する閾値を変更し
て文字パタンを変形させるか、或いはフィルタの種類を
変えて文字パタンを変形させるようにしている。そのた
め、認識対象となる文字パタンの濃度差が小さい場合で
も(薄い文字パタンの場合に多い)、リジェクトまたは
誤読の原因となるパタン切れを低減でき、或いは、中間
調の少ない場合(濃い文字パタンの場合に多い)でも、
文字パタンを変形させることができ、文字認識率が向上
する。さらに、パタン切れによる再認識処理の回数が少
なくなるので、認識処理速度の向上が期待できる。
【0026】第3の実施形態 図17は、本発明の第3の実施形態を示すOCRの構成
ブロック図である。このOCRは、第1及び第2の実施
形態と同様の読取部10と、認識部70とを有してい
る。認識部70は、帳票1を多値データで表わした帳票
の画像D0を格納するイメージメモリ71を備えてい
る。イメージメモリ71には、2値化処理部72と中間
調計数部73とが接続されている。2値化処理部72
は、多値データを閾値でスライスして多値画像D0を2
値画像D1に変換するものである。中間調計数部73
は、多値画像D0における中間調のデータを集計するも
のであある。2値化処理部72の出力側に、フィルタ処
理部74が接続されている。中間調計数部73の出力側
に、2値化閾値判定部75が接続され、該2値化閾値判
定部75の出力側が、2値化処理部72に接続されてい
る。フィルタ処理部74の出力側に前処理部76が接続
され、この前処理部76の出力側に、文字識別部77が
接続されている。
【0027】フィルタ処理部74は、2値画像D1のノ
イズの除去と文字の平滑化とを行い、2値画像D1を整
形した画像D2を生成するものである。前処理部76
は、画像D2から文字パタンを1文字分ずつ切出すもの
である。文字識別部77は、切出された文字パタンの識
別を行い、文字コードを求めるものである。このOCR
は、文字識別部77で文字コードが得られないリジェク
ト文字がある場合に、再度の文字認識を行うが、2値化
閾値判定部75は、再度の文字認識において、中間調計
数部73の集計結果を参照して、中間調の範囲を判定
し、多値画像D0を2値化する際の閾値の範囲を設定す
るものである。認識部70には、さらに、認識制御部7
9が設けられている。認識制御部79が認識部70中の
各部を制御する構成になっている。
【0028】図18は、図17の認識部70の処理フロ
ーを示す図であり、この図17を参照しつつ、OCRの
動作を説明する。読取部10は、第1の実施形態と同様
に動作し、帳票1のイメージを光学的に読取って電気信
号に変換する。読取部10中のA/D変換回路14は、
帳票1のイメージに対応する多値の画素毎の画像データ
を順に出力する。図18のステップS51において、こ
の多値の画像データがイメージメモリ71に書込まれ、
イメージメモリ71に、帳票1の多値画像D0が格納さ
れる。次のステップS52において、2値化処理部72
は帳票1の多値画像D0を、予め決められた2値化閾値
を用いて変換し、2値化画像D1を求める。これと同時
のステップS53において、中間調計数部73は、多値
画像D0における中間調データの数を集計する。そし
て、ステップS54において、2値化閾値判定部75
は、中間調データの集計結果から、次に2値化を行う際
の2値化閾値の範囲を判定して設定する。
【0029】図19は、図18中の2値化範囲判定処理
の説明図であり、画像D0が示されている。画像D0が
図19のような多値画像の場合、中間調は「6」から
「2」になっている。この時の2値化閾値は、(中間調
の最大値−n)〜(中間調の最小値+m)で設定され
る。但し、n,mは予め定められた整数である。ステッ
プS52の後のステップS55において、フィルタ処理
部74は、フィルタ処理を実施して、2値画像D1のノ
イズ除去を行うと共に文字の平滑化を行う。これら2値
化処理とフィルタ処理により、文字パタンが整形された
画像D2が形成される。ステップS56において、前処
理部76は文字切出し処理により、画像D2から1文字
毎の文字パタンを切出す。ステップS57において、文
字識別部77が切出された文字パタンに対する文字認識
処理を行う。この文字認識処理では、文字パタンの特徴
抽出を行い、図示しない辞書との比較で、該文字パタン
に対応する文字コードを検索する。ステップS58にお
いて、認識処理結果がリジェクトか否かの判定を行う。
そして、文字認識処理で文字コードが決定した場合に
は、ステップS59でその文字コードを認識結果として
出力する。リジェクトの場合には、つぎのような再認識
処理を行う。
【0030】リジェクトの場合は、ステップS60で2
値化処理部72が、2値化処理の2値化閾値を変更し、
ステップS52〜S58の一連の文字認識処理を行わせ
る。このような、再度の文字認識処理を文字コードが確
定するまで繰り返す。ただし、リジェクト発生時の再認
識処理は、予め定めた回数まで行うこととし、再認識処
理の回数が最大になっても、文字コードが検索できない
場合には、認識結果はリジェクトになる。以上のよう
に、この第3の実施形態では、中間調計数部73と2値
化閾値設定部75を設け、リジェクト発生時の再認識処
理において、中間調の集計結果から2値化閾値の範囲を
きめ、2値化する閾値を変更して文字パタンを変形させ
るようにしたので、認識対象となる文字パタンの濃度差
が小さい場合でも(薄い文字パタンの場合に多い)、リ
ジェクトまたは誤読の原因となるパタン切れを低減で
き、文字認識率が向上する。さらに、パタン切れによる
再認識処理が少なくなるので、認識処理速度の向上が期
待できる。なお、本発明は、上記実施形態に限定されず
種々の変形が可能である。例えば、第1〜第3の実施形
態では、画像データD0が8階調の場合を説明している
が、他の階調の場合にも適用可能であり、その階調に応
じて2値化閾値やフィルタの特性を変更すればよい。
【0031】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、OCRに、多値画像における中間調のデータ
を集計する中間調計数部と、文字コードが得られなかっ
た場合には中間調計数部の集計結果を参照し、文字識別
部で用いる文字パタンを変形した上で文字コードの再検
索を行わせるリスキャン手段とを設けたので、多値画像
の状態に応じた文字パタンの変形が可能になり、文字認
識の認識率が向上する。第2の発明によれば、第1の発
明におけるフィルタ処理部に複数のフィルタを設け、リ
スキャン手段にリスキャン判定手段を設け、文字認識部
で文字コードが得られなかった場合に、2値化閾値を変
更して2値化処理部、フィルタ処理部、前処理部及び文
字識別部による処理を再度実行させるか、またはフィル
タの選択を変更してフィルタ処理部、前処理部及び文字
識別部による処理を再度実行させるようにしている。よ
って、イメージメモリに格納された多値画像の濃度が薄
い場合でも、文字パタンを適切に調整できるので、誤読
やリジェクトが減少し、文字認識率が向上する。
【0032】第3の発明によれば、リスキャン手段に濃
度勾配判定部をさらに設け、文字認識部で文字コードが
得られなかった場合に、濃度勾配判定部の判定結果に基
づき、2値化閾値を変更して2値化処理部、フィルタ処
理部、前処理部及び文字識別部による処理を再度実行さ
せるか、またはフィルタの選択を変更してフィルタ処理
部、前処理部及び文字識別部による処理を再度実行させ
る構成にしたので、濃度差の少ない文字パタンや中間調
の少ない文字パタンに対しても、文字パタンを適切に調
整できるので、誤読やリジェクトが減少し、文字認識率
が向上する。第4の発明によれば、リスキャン手段に、
文字パタンの中間調の範囲を判定し、中間調の範囲内で
2値化処理部の用いる閾値を再設定する2値化閾値判定
部を備え、該2値化処理部、フィルタ処理部、前処理部
及び文字識別部による処理を再度実行させる構成にした
ので、文字パタンが薄く濃度差が小さい場合でも、文字
パタンを適切に調整できるので、誤読やリジェクトが減
少し、文字認識率が向上する。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示すOCRの構成ブ
ロック図である。
【図2】従来のOCRの構成ブロック図である。
【図3】図2中の認識部20の処理フローを示す図であ
る。
【図4】図2のイメージメモリ21に格納された画像デ
ータを示す図である。
【図5】図4に対する2値化処理を説明する図である。
【図6】ステップS3のフィルタ処理の概念の説明図で
ある。
【図7】図5の2値化パタンD1をフィルタ処理した後
のパタンD2を示す図である。
【図8】文字切り出し処理を示す図である。
【図9】薄い多値パタンを示す図である。
【図10】図9の2値化パタンD1を示す図である。
【図11】図10をフィルタ処理したパタンD3を示す
図である。
【図12】図1の認識部40の処理フローを示す図であ
る。
【図13】図12の中間調計数処理S13を説明する図
である。
【図14】本発明の第2の実施形態を示すOCRの構成
ブロック図である。
【図15】図14の認識部50の処理フローを示す図で
ある。
【図16】図15中の濃度勾配判定処理の説明図であ
る。
【図17】本発明の第3の実施形態を示すOCRの構成
ブロック図である。
【図18】図17の認識部70の処理フローを示す図で
ある。
【図19】図18中の2値化範囲判定処理の説明図であ
る。
【符号の説明】
1 帳票 10 読取部 40,50,70 認識部 41,51,71 イメージメモリ 42,52,72 2値化処理部 43,53,73 中間調計数部 44,54,74 フィルタ処理部 45,56 リスキャン方式判定部 47,58,76 前処理部 48,59,77 文字識別部 55 濃度勾配判定部 75 2値化閾値判定部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 文字の記載された帳票の画像を光学的に
    取得し且つ光電変換し、該帳票の画素毎の多値の画像デ
    ータを順次出力する読取部と、 前記画素データを入力して前記帳票の文字パタンを含む
    多値画像を格納するイメージメモリと、 前記多値画像に対して閾値を用いた2値化を行い2値画
    像を生成する2値化処理部と、 前記2値画像おける各画素データを再設定して該2値画
    像の局所的な整形を行うフィルタ処理部と、 前記局所的な整形を終了した前記2値画像における1文
    字単位の領域を切出す前処理部と、 前記領域中の文字パタンの特徴を求め該特徴と辞書との
    比較で該文字パタンに対応する文字コードを抽出する文
    字識別部と、 前記多値画像における中間調のデータを集計する中間調
    計数部と、 前記文字コードが得られなかった場合には前記中間調計
    数部の集計結果を参照し、前記文字識別部で用いる前記
    文字パタンを変形した上で該文字識別部に前記文字コー
    ドの再検索を行わせるリスキャン手段とを、 備えたことを特徴とする光学式文字読取装置。
  2. 【請求項2】 前記フィルタ処理部は、前記2値画像に
    おける各画素データを異なるルールを用いて再設定する
    機能を持つ複数のフィルタを有し、該複数のフィルタの
    うち選択したフィルタで該2値画像の局所的な整形を行
    う構成とし、 前記リスキャン手段は、前記中間調計数部の集計結果を
    参照し、前記文字パタンの変形を前記閾値の変更によっ
    て行うか或いは前記フィルタの選択の変更によって行う
    かを判定するリスキャン方式判定部を備え、該リスキャ
    ン方式判定部の判定結果に基づき、該閾値を変更して前
    記2値化処理部、前記フィルタ処理部、前記前処理部及
    び前記文字識別部による処理を再度実行させるか、また
    は、該フィルタの選択を変更して前記フィルタ処理部、
    前記前処理部及び前記文字識別部による処理を再度実行
    させる構成にしたことを特徴とする請求項1記載の光学
    式文字読取装置。
  3. 【請求項3】 前記リスキャン手段に、前記中間計数部
    の集計結果から前記多値画像における文字パタンの濃淡
    差を判定する濃度勾配判定部を設け、前記リスキャン方
    式判定部は、該濃淡差の判定結果に基いて前記文字パタ
    ンの変形を前記閾値の変更によって行うか或いは前記フ
    ィルタの選択の変更によって行うかを判定する構成とし
    たことを特徴とする請求項2記載の光学式文字読取装
    置。
  4. 【請求項4】 前記リスキャン手段は、前記中間調計数
    部の集計結果から前記多値画像における文字パタンの中
    間調の範囲を判定し、該中間調の範囲内で前記2値化処
    理部の用いる閾値を再設定する2値化閾値判定部を備
    え、該2値化処理部、前記フィルタ処理部、前記前処理
    部及び前記文字識別部による処理を再度実行させる構成
    にしたことを特徴とする請求項1記載の光学式文字読取
    装置。
JP9018449A 1997-01-31 1997-01-31 光学式文字読取装置 Withdrawn JPH10222602A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9018449A JPH10222602A (ja) 1997-01-31 1997-01-31 光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9018449A JPH10222602A (ja) 1997-01-31 1997-01-31 光学式文字読取装置

Publications (1)

Publication Number Publication Date
JPH10222602A true JPH10222602A (ja) 1998-08-21

Family

ID=11971944

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9018449A Withdrawn JPH10222602A (ja) 1997-01-31 1997-01-31 光学式文字読取装置

Country Status (1)

Country Link
JP (1) JPH10222602A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6714322B1 (en) * 1998-11-19 2004-03-30 Murata Kikai Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium therefor
JP2008250545A (ja) * 2007-03-29 2008-10-16 Fuji Xerox Co Ltd 画像処理装置、画像形成装置、及びプログラム
JP2012109941A (ja) * 2010-11-15 2012-06-07 Konica Minolta Laboratory Usa Inc ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法
US8401299B2 (en) 2008-11-23 2013-03-19 Nidec Sankyo Corporation Character line recognition method and character line recognition device
WO2017141802A1 (ja) * 2016-02-15 2017-08-24 日本電気株式会社 画像処理装置、文字認識装置、画像処理方法及びプログラム記録媒体
WO2019116466A1 (ja) * 2017-12-13 2019-06-20 株式会社Pfu 情報処理装置、制御方法及び制御プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6714322B1 (en) * 1998-11-19 2004-03-30 Murata Kikai Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium therefor
JP2008250545A (ja) * 2007-03-29 2008-10-16 Fuji Xerox Co Ltd 画像処理装置、画像形成装置、及びプログラム
US8401299B2 (en) 2008-11-23 2013-03-19 Nidec Sankyo Corporation Character line recognition method and character line recognition device
JP2012109941A (ja) * 2010-11-15 2012-06-07 Konica Minolta Laboratory Usa Inc ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法
WO2017141802A1 (ja) * 2016-02-15 2017-08-24 日本電気株式会社 画像処理装置、文字認識装置、画像処理方法及びプログラム記録媒体
US11341739B2 (en) 2016-02-15 2022-05-24 Nec Corporation Image processing device, image processing method, and program recording medium
WO2019116466A1 (ja) * 2017-12-13 2019-06-20 株式会社Pfu 情報処理装置、制御方法及び制御プログラム

Similar Documents

Publication Publication Date Title
EP0750272B1 (en) Image binarization apparatus and method
JP4180497B2 (ja) コード種類判別方法、およびコード境界検出方法
US6160913A (en) Method and apparatus for digital halftone dots detection and removal in business documents
JP5334042B2 (ja) 文字列認識方法及び文字列認識装置
US5081690A (en) Row-by-row segmentation and thresholding for optical character recognition
JP3640573B2 (ja) バーコード読取り方法及びバーコード読取りシステム
US8467608B2 (en) Method and apparatus for character string recognition
JPH10222602A (ja) 光学式文字読取装置
JP2003115031A (ja) 画像処理装置および方法
JPS6037952B2 (ja) 最適二値化方式
JP2002157552A (ja) 光学式文字読取装置
JPH0119193B2 (ja)
JPH1125223A (ja) 文字読取装置
JPH09305707A (ja) 画像抽出方式
JPH10261045A (ja) 光学式文字読取装置
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPH0916715A (ja) 文字認識装置および方法
JPH11353417A (ja) 光学式文字読取装置
JPH1125221A (ja) 光学式文字読取装置
JPH06274691A (ja) 文字認識装置
JP3584478B2 (ja) 2値化処理装置及び2値化処理方法
JP3277977B2 (ja) 文字認識方法
JPS63109592A (ja) 文字認識方式
JPH05166009A (ja) 文字切出し・認識方法及び装置
JPH10143608A (ja) 文字読取装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20040406