JP4329226B2 - 基準マーク検出方法、基準マーク検出装置及び光学式文字読取装置 - Google Patents

基準マーク検出方法、基準マーク検出装置及び光学式文字読取装置 Download PDF

Info

Publication number
JP4329226B2
JP4329226B2 JP2000124152A JP2000124152A JP4329226B2 JP 4329226 B2 JP4329226 B2 JP 4329226B2 JP 2000124152 A JP2000124152 A JP 2000124152A JP 2000124152 A JP2000124152 A JP 2000124152A JP 4329226 B2 JP4329226 B2 JP 4329226B2
Authority
JP
Japan
Prior art keywords
reference mark
image
mark
reading
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000124152A
Other languages
English (en)
Other versions
JP2001014427A (ja
Inventor
かおる 鷲尾
和弘 石川
充 瀧口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2000124152A priority Critical patent/JP4329226B2/ja
Publication of JP2001014427A publication Critical patent/JP2001014427A/ja
Application granted granted Critical
Publication of JP4329226B2 publication Critical patent/JP4329226B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、光学式文字読取装置(以下、「OCR」という)やファクシミリ等に用いられる、読取位置の基準とするために帳票に予め印刷された基準マークを検出する基準マーク検出技術に関するものである。
【0002】
【従来の技術】
図8は、従来のOCRの構成を示すブロック図である。以下に、図8を用いて、OCRを一例にして従来技術の構成を説明する。
【0003】
図8において、200は、OCRに入力される画像データを格納する画像メモリである。201は、OCRに入力されるフォーマット情報を格納するフォーマット情報メモリである。フォーマット情報は、例えばOCRで処理する画像についての基準マークの位置情報や読み取りとなる文字の領域に関する情報等である。202は、フォーマット情報メモリ201に格納されている基準マークの位置情報に基づいて、画像メモリ200に格納された帳票の画像イメージから基準マークを検出する基準マーク検出部である。203は、基準マーク検出部202により検出された基準マークの位置に基づいて、帳票の傾きを検出したり、帳票の向きを検出し、画像に回転処理等の補正を行う必要がある場合に、画像を補正する画像補正部である。
【0004】
204は、フォーマット情報メモリ201に格納されている読み取り対象となる文字の領域に関する情報に基づいて、画像メモリ200に格納された画像イメージから文字を切り出す文字切出部である。205は、後述の文字認識辞書メモリ206に格納された文字認識辞書を用いて、文字切出部204で切り出された文字を文字認識し、その結果を外部に出力する文字認識部である。206は、OCRに入力される文字認識辞書データを格納する文字認識辞書である。
【0005】
図9は基準マーク検出部202の動作の概要を示すフローチャートである。上述の構成において、基準マーク検出部202は、以下のようにして帳票の画像イメージから基準マークを検出する。
【0006】
図9のステップS101において、基準マーク検出部202は、画像メモリ200から帳票の画像イメージを取得するとともに、フォーマット情報メモリ201から基準マークの位置情報を取得する。次に、ステップS102において、画像イメージに対して、基準マークの位置情報に基づいて、基準マークを検出するための検出領域を設定する。次に、ステップS103において、検出領域内の画像を走査して黒の連結領域を検出し、ステップS104において、予め定められた基準マークの形状および大きさに最も類似する黒の連結領域を抽出して、この領域を基準マークと見なす。ステップS105において、基準マークの位置座標を識別して、その位置座標を文字切出部204に出力する。
【0007】
【発明が解決しようとする課題】
帳票は、基準マークと帳票の辺の間の領域に書込みや汚れ、マーク等が付されている場合がある。従来のOCRは、垂直方向又は水平方向に走査するため、これらを検出しやすく、これらを検出した時点で基準マークか否かを判定する処理を行なうことになる。そのため、処理時間がかかってしまう。
【0008】
また、従来のOCRは、基準マークの位置が不明な場合(即ち、基準マークの位置情報が画像メモリ200に格納されていない場合)に、基準マークを検出できなかった。また、帳票を傾けて搬送して読み取った場合に、帳票の画像イメージの基準マークは、画像メモリ200に格納された基準マークの位置情報と異なる位置に存在することになり、基準マークを検出できなかった。
【0009】
本発明は、前記従来技術が持っていた課題を解決し、基準マークを確実に検出する基準マーク検出方法、基準マーク検出装置及びOCRを提供するものである。
【0010】
【課題を解決するための手段】
前記課題を解決するために、第1の発明は、読取位置の基準となる基準マークが付された帳票を光学的に読み取り、読み取った帳票の画像イメージから基準マークを検出する基準マーク検出方法において、読取手段が帳票を読み取り、検出手段が、前記読取手段により読み取られた帳票の画像イメージを斜め方向の走査線で走査して基準マークを検出する構成となっている。また、第2の発明と第3の発明は、第1の発明を実現する基準マーク読取装置及びOCRの構成となっている。
【0011】
第1の発明から第3の発明によれば、次のような作用が行われる。
【0012】
読取手段によって帳票の画像イメージが光学的に読み取られ、画像メモリに格納される。画像メモリに格納された画像イメージは、検出手段によって斜め方向の走査線で走査されて、基準マークが検出される。そして、画像イメージ中のこれらの基準マークの位置に基づいて、所定の位置に記載された文字が読み取られる。
【0013】
第4の発明は、読取位置の基準となる基準マークが複数付された帳票を光学的に読み取り、読み取った帳票の画像イメージから基準マークを検出する基準マーク検出方法において、読取手段が帳票を読み取り、検出手段が、前記読取手段により読み取られた帳票の画像イメージを斜め方向の走査線で走査して基準マークの一角を検出し、検出した基準マークの一角の位置を基準にして、更に他の基準マークを検出する構成となっている。また、第5の発明と第6の発明は、第4の発明を実現する基準マーク読取装置及びOCRの構成となっている。
【0014】
第5の発明から第6の発明によれば、次のような作用が行われる。
【0015】
読取手段によって帳票の画像イメージが光学的に読み取られ、画像メモリに格納される。画像メモリに格納された画像イメージは、検出手段によって斜め方向の走査線で走査されて、基準マークの一角が検出され、その位置に基づいて画像イメージ中の他の基準マークの位置が検出される。そして、画像イメージ中のこれらの基準マークの位置に基づいて、所定の位置に記載された文字が読み取られる。
【0016】
第7の発明は、読取位置の基準となる基準マークが複数付された帳票を光学的に読み取り、読み取った帳票の画像イメージ中の基準マークの位置に基づいて所定の位置に記載された文字を読み取るOCRにおいて、帳票を横及び縦方向の画素に分解して光学的に読み取り、読み取った画像イメージを画像メモリに格納する読取手段と、帳票における基準マークの位置情報に基づいて、前記画像メモリに格納された帳票の画像イメージから基準マークを検出する第1の検出手段と、前記画像メモリに格納された帳票の画像イメージを斜め方向の走査線で走査して基準マークの一角を検出し、検出した基準マークの一角の位置を基準にして、更に他の基準マークを検出する第2の検出手段と、前記第1または第2の検出手段を選択する選択手段と、前記第1または第2の検出手段により検出された基準マークの位置に基づいて、所定の位置に記載された文字を認識する文字認識手段とを有している。
【0017】
第7の発明によれば、次のような作用が行われる。
【0018】
選択手段によって第1または第2の検出手段が選択される。第1の検出手段が選択されたときには、帳票における基準マークの位置情報に基づいて画像イメージ中の基準マークの位置が検出される。また、第2の検出手段が選択されたときには、画像メモリに格納された画像イメージが斜め方向の走査線で走査されて基準マークの一角が検出される。そして、検出された基準マークの一角の位置に基づいて画像イメージ中の他の基準マークの位置が検出される。文字認識手段では、第1または第2の検出手段で検出されたこれらの基準マークの位置に基づいて所定の位置に記載された文字が認識される。
【0019】
第8の発明は、第7の発明のOCRにおける選択手段を、予め与えられた前記読取手段の読取位置の許容範囲の情報に基づいて、前記第1または第2の検出手段のいずれか一方を選択するように構成している。
【0020】
第8の発明によれば、選択手段において次のような作用が行われる。
【0021】
予め与えられた読取手段の読取位置の許容範囲の情報に基づいて、第1または第2の検出手段のいずれか一方が選択される。
【0022】
第9の発明は、第7の発明のOCRにおける選択手段を、最初に前記第1の検出手段を選択し、該第1の検出手段で前記基準マークが検出できない場合に、前記第2の検出手段を選択するように構成している。
【0023】
第9の発明によれば、選択手段において次のような作用が行われる。
【0024】
最初に第1の検出手段が選択される。そして、第1の検出手段で基準マークが検出できない場合に、第2の検出手段が選択される。
【0025】
第10の発明は、マークが付された帳票を光学的に読み取り、読み取った帳票の画像イメージからマークを検出するマーク検出方法において、マークの形状情報を記憶手段に予め記憶させておき、読取手段が帳票を読み取り、検出手段が、前記読取手段により読み取られた帳票の画像イメージを斜め方向の走査線で走査して、前記記憶手段に記憶されたマーク形状情報に類似するマークを検出する構成となっている。
【0026】
第10の発明によれば、次のような作用が行われる。
【0027】
記憶手段には検出するマークの形状に関する情報(マーク形状情報)が予め記憶されている。読取手段によって帳票の画像イメージが光学的に読み取られ、画像メモリに格納される。画像メモリに格納された画像イメージは、検出手段によって斜め方向の走査線で走査されて、マーク形状に類似するマークが検出される。
【0028】
第11の発明は、第10の発明の検出手段を、走査範囲を限定し、その範囲内を対象にしてマーク形状情報に類似するマークを検出するように構成している。更に、第12の発明は、走査範囲を帳票の角を基準にして限定している。
【0029】
第13の発明は、第10の発明の検出手段を、走査範囲内における黒の連結領域の中からマークの形状に最も類似した領域をマークとして検出するように構成している。
【0030】
第14の発明は、第10の発明の記憶手段に、更に、マーク同士の位置関係を示すマーク位置情報を予め記憶させておき、前記検出手段が、前記記憶手段に記憶されたマーク位置情報に基づいて、検出したマークの一角を基準にして、更に他のマークを検出するように構成している。
【0031】
第14の発明によれば、次のような作用が行われる。
【0032】
記憶手段には検出するマークの形状に関する情報(マーク形状情報)とマーク同士の位置関係を示す情報(マーク位置情報)が予め記憶されている。読取手段によって帳票の画像イメージが光学的に読み取られ、画像メモリに格納される。画像メモリに格納された画像イメージは、検出手段によって斜め方向の走査線で走査されて、マーク形状に類似するマークの一角が検出され、その位置に基づいて画像イメージ中の他の基準マークの位置が検出される。そして、画像イメージ中のこれらの基準マークの位置に基づいて、所定の位置に記載された文字が読み取られる。
【0033】
第15の発明は第10の発明を実現するマーク読取装置の構成となっている。更に、第16の発明は第14の発明を実現するマーク読取装置の構成となっている。
【0034】
第17の発明は第10の発明を実現するOCRの構成となっている。更に、第18の発明は第14の発明を実現するOCRの構成となっている。
【0035】
【発明の実施の形態】
第1の実施形態
帳票は帳票の四隅の角付近には書込みや汚れ、マーク等が付されている場合がほとんどない。そこで、本発明は、帳票の四隅の角付近に基準マークを設けるようにし、帳票を斜め方向に走査する。これにより、本発明は、基準マークと帳票角の間の領域に書込みや汚れ、マーク等がほとんど付されていないので、これらを検出する場合が少なくなる。そのため、これらを基準マークか否かを判定する処理を行なう場合が従来構成よりも少なくなり、処理効率が従来構成よりも高くするようにした。
【0036】
図1は、本発明の第1の実施形態を示すOCRの概略構成図である。
【0037】
このOCRは、読み取り対象となる帳票1を、横及び縦方向の白黒2値の画素に分解して光学的に読み取り、画像イメージを生成する読取手段(例えば、イメージスキャナ)10、この画像イメージを格納するための画像メモリ20、及び帳票1の様式を定義したフォーマット情報が格納されたフォーマット情報メモリ30を有している。フォーマット情報は、例えば、基準マークがどのような形をしており、その寸法がどれ程かを示す基準マークの形状に関する情報や、基準マークの位置情報、読み取り対象となる文字の領域に関する情報等で構成されている。また、このOCRは、次のような第1の検出手段(例えば、マーク領域算出部)40、第2の検出手段(例えば、基準マーク検出部)50、基準マーク判定部60、画像補正部70、読取領域検出部80、文字切出部90、文字認識手段(例えば、文字認識部)100、及び選択手段(例えば、制御部)110を有している。
【0038】
マーク領域算出部40は、矩形の帳票1の四隅に予め印刷された一定寸法の基準マークが、画像メモリ20中のどの領域に格納されるかを、フォーマット情報メモリ30中のフォーマット情報に基づいて算出するものである。
【0039】
一方、基準マーク検出部50は、画像メモリ20に格納された画像イメージを走査して読み取り、基準マークの存在位置を検出するものである。基準マーク検出部50は、画像メモリ20中の画像イメージを斜め方向の走査線に沿って順次走査し、基準マークの一角の黒画素を検出するマーク角検出部51と、検出された基準マークの一角の位置に基づいて、その基準マークが存在すると推定される画像イメージの領域を算出するマーク領域算出部52とで構成されている。
【0040】
基準マーク判定部60は、マーク領域算出部40または基準マーク検出部50によって算出された基準マークの存在領域に従って、画像メモリ20中の画像イメージを切り出して、基準マークが存在するか否かを判定するものである。
【0041】
画像補正部70は、基準マーク判定部60で検出された複数の基準マークの位置データに基づいて、画像メモリ20に格納された画像イメージの傾きや伸縮等を補正して、正しい形状の画像イメージに変換するものである。
【0042】
読取領域検出部80は、フォーマット情報メモリ30中のフォーマット情報に基づいて、帳票1上の読取領域に対応する画像イメージの存在位置を検出するものである。
【0043】
文字切出部90は、読取領域検出部80で検出された読取領域に対応する画像メモリ20内の画像イメージの文字を、1文字単位で切り出すものである。
【0044】
文字認識部100は、文字切出部90で1文字単位に切り出された画像イメージを文字辞書101を参照して文字認識し、その認識した文字に対応する文字コードを認識結果として出力するものである。
【0045】
図2は、図1のOCRにおける基準マークの検出方法の説明図であり、図3は、図1のOCRの動作の概要を示すフローチャートである。以下、この図2及び図3を参照しつつ、図1のOCRの動作を説明する。
【0046】
図3のステップS1において、読み取り対象となる帳票1は、図1中のイメージスキャナ10によって光学的に読み取られ、白黒の2値の画素データで構成される画像イメージが生成されて、画像メモリ20に格納される。ステップS1の後、ステップS2へ進む。
【0047】
ステップS2において、図示しないキーボード等の入力装置から、制御部110に基準マークの検出モードの入力が行われ、ステップS3へ進む。
【0048】
ステップS3では、制御部110において、入力された検出モードに基づいて基準マーク検出動作の選択が行われる。即ち、例えばイメージスキャナ10の読取位置の精度が高い場合等に、フォーマット情報メモリ30に格納されたフォーマット情報に基づいて基準マークを検出する第1の動作が選択されると、ステップS4へ進む。また、イメージスキャナ10の読取位置の精度が低い場合等に、画像イメージ全体から基準マークを検出するために第2の動作が選択されると、ステップS6へ進む。
【0049】
ステップS4では、マーク領域算出部40が起動され、このマーク領域算出部40によって、フォーマット情報メモリ30中のフォーマット情報が読み取られ、ステップS5へ進む。
【0050】
ステップS5において、読み取られたフォーマット情報メモリ30に基づいて、帳票1に予め印刷された基準マークが画像メモリ20中のどの領域に格納されるかが算出される。マーク領域算出部40によるマーク領域算出処理の後、ステップS8へ進む。
【0051】
一方、ステップS3で第2の動作が選択されてステップS6に進んだ場合には、基準マーク検出部50が起動される。そして、マーク角検出部51において、後述する方法によって基準マークの一角の存在する位置の検出が行われる。ステップS6におけるマーク角検出処理の後、ステップS7へ進む。
【0052】
ステップS7では、マーク領域算出部52が起動され、ステップS6で検出された基準マークの一角の位置に基づいて、帳票1に予め印刷された基準マークが画像メモリ20中のどの領域に格納されるかが算出される。ステップS7におけるマーク領域算出処理の後、ステップS8へ進む。
【0053】
ステップS8において、ステップS5,S7で算出された基準マークの存在領域の情報が、基準マーク判定部60に与えられ、この基準マーク判定部60によって、画像メモリ20中の画像イメージが切り出される。そして、基準マーク判定部60において、切り出された画像イメージ中に基準マークが存在するか否かの判定が行われ、基準マークが存在すれば、その位置が検出される。
【0054】
基準マークの判定方法は、図2に示すように、切り出された領域21aの画像イメージを、横及び縦方向に走査して黒画素の個数をカウントすることにより、横方向ヒストグラムHx、及び縦方向ヒストグラムHyが生成される。次に、横方向ヒストグラムHxの黒画素数が一定の値X以上となっている領域の高さH、及び縦方向ヒストグラムHyの黒画素数が一定の値Y以上となっている領域の幅Wが算出される。そして、算出された高さH及び幅Wが予め印刷された基準マークの寸法にほぼ一致していれば、これが基準マークであると判定される。更に、基準マークの存在位置が検出される。ステップS8における基準マーク位置検出処理の後、ステップS9へ進む。
【0055】
ステップS9において、画像補正部70が起動され、この画像補正部70によって、基準マーク判定部60で検出された複数の基準マークの位置データに基づいて、画像メモリ20に格納された画像イメージの傾きや伸縮等が補正され、正しい形状の画像イメージが生成される。画像メモリ20中の画像イメージの補正が終了すると、ステップS10へ進む。
【0056】
ステップS10において、読取領域検出部80が起動され、フォーマット情報メモリ30中のフォーマット情報に基づいて、帳票1上の読取領域に対応する画像イメージの存在位置が検出される。ステップS10の読み取り領域検出処理の後、ステップS11へ進む。
【0057】
ステップS11において、読取領域検出部80で検出された読取領域に対応する画像メモリ20内の画像イメージが、文字切出部90によって1文字単位で切り出され、ステップS12へ進む。
【0058】
ステップS12において、文字認識部100が起動され、この文字認識部100によって文字辞書101が参照されて1文字単位で切り出された画像イメージの文字が認識される。そして、その認識された文字に対応する文字コードが認識結果として出力される。
【0059】
図4は、図1中の基準マーク検出部50における基準マークの検出方法の説明図である。また、図5は、図1中の基準マーク検出部50の動作の一例を示すフローチャートである。
【0060】
基準マーク検出部50は、図4に示すように、画像メモリ20に格納された帳票1の画像イメージから、四隅の基準マーク2a,2b,2c,2dの位置を検出するものである。
【0061】
例えば、図4における左上の基準マーク2aを検出する場合、画像メモリ20の左上隅から下に等間隔に、右上がりの斜めの走査線SLA1,SLA2,SLA3,…を設定し、これらの走査線SLA1,SLA2,SLA3,…によって、この画像メモリ20中の画像イメージの画素を順次走査する。そして、例えば走査線SLA5の中間で、最初に検出した黒画素の位置が基準マーク2aの角として検出される。
【0062】
また、右上の基準マーク2bを検出する場合は、画像メモリ20の右上隅から下に等間隔に、右下がりの斜めの走査線SLB1,SLB2,SLB3,…を設定し、これらの走査線SLB1,SLB2,SLB3,…によって、画像イメージの画素を順次走査する。左下の基準マーク2cを検出する場合は、画像メモリ20の左下隅から上に等間隔に、右下がりの斜めの走査線SLC1,SLC2,SLC3,…を設定し、これらの走査線SLC1,SLC2,SLC3,…によって、画像イメージの画素を順次走査する。更に、右下の基準マーク2dを検出する場合は、画像メモリ20の右下隅から上に等間隔に、右上がり斜めの走査線SLD1,SLD2,SLD3,…を設定し、これらの走査線SLD1,SLD2,SLD3,…によって、画像イメージの画素を順次走査する。そして、これらの走査によって最初に検出した黒画素の位置が、基準マーク2b,2c,2dの角として検出される。
【0063】
このような基準マーク検出処理は、図5のフローチャートに従って行われる。
【0064】
マーク角検出部51の処理が開始されると、ステップS21において、例えば基準マーク2aを検出するために、第1の走査線SLA1が設定され、ステップS22へ進む。
【0065】
ステップS22において、走査線SLA1の走査開始位置の設定が行われる。この場合は、例えば走査線SLA1の左端が走査開始位置に設定される。
【0066】
ステップS23において、設定された開始位置の画素が黒画素であるか否かが判定される。黒画素であればステップS24へ進み、黒画素でなければステップS25へ進む。
【0067】
ステップS24では、ステップS23で検出された黒画素が基準マーク2aの左上の角であると見なされ、マーク領域検出部52が起動される。そして、黒画素の位置に基づいて基準マーク2aが存在すると推定される領域が算出され、基準マーク検出処理は終了する。
【0068】
一方、ステップS23の判定結果、黒画素ではない場合には、ステップS25において、走査線SLA1上の画素位置が右上に移動させられ、ステップS26へ進む。
【0069】
ステップS26において、移動された画素位置が画像イメージの領域内にあるか否かが判定される。領域内にあればステップS23へ進み、その画素位置の画素が黒画素か否かが判定される。領域内から外れた場合には、ステップS27へ進む。
【0070】
ステップS27において、すべての走査線SLA1,SLA2,SLA3,…について走査を完了したか否かが判定される。すべての走査線SLA1,SLA2,SLA3,…の走査が完了していれば、基準マークが存在しなかったとしてこの基準マーク検出処理は終了する。一方、未走査の走査線SLA2,SLA3,…が存在すれば、ステップS28へ進む。
【0071】
ステップS28において、次に走査すべき走査線(例えば、走査線SLA2)が設定され、ステップS22へ戻る。
【0072】
このような走査により、ステップS23で、帳票1の画像イメージ中の四隅の黒画素が検出され、ステップS24で、これを基準マークの角として基準マークの存在領域が算出されるようになっている。この後、OCRは、基準マークの存在領域から四隅の基準マークを検出し、四隅の基準マークの間隔から読み取った帳票の画像イメージの歪みを算出する。そして、歪みの量に応じて画像イメージに回転や伸張等の補正を加え、文字を切出して認識を行なう。
【0073】
以上のように、この第1の実施形態のOCRは、画像イメージを斜め方向の走査線に沿って順次走査し、基準マークの一角の黒画素を検出するマーク角検出部51と、検出された基準マークの一角の位置に基づいて、その基準マークが存在すると推定される画像イメージの領域を算出するマーク領域算出部52とを有している。これにより、帳票1の読取位置のずれに影響されず、基準マークを確実に検出することができるという利点がある。
【0074】
第2の実施形態
図6は、本発明の第2の実施形態を示すOCRの動作の概要を示すフローチャートであり、図3中の要素と共通の要素には共通の符号が付されている。また、このOCRの構成は図1と同様であり、制御部110における全体的な動作制御が若干相異するだけである。
【0075】
このOCRでは、図3中のステップS2,S3におけるマーク検出モード入力処理と入力された検出モードによる動作選択処理とを削除している。そして、従来技術として説明したような第1のマーク検出処理であるステップS4,S5を行い、続いて基準マーク位置を検出するステップS5aと、マーク検出位置に基準マークが存在するか否かを判定するステップS5bの処理を行うようにしている。
【0076】
ステップS5bの判定処理で、基準マークが検出できないと判断されると、ステップS6へ進み、このステップS6のマーク角検出処理、ステップS7のマーク領域算出処理、及びステップS8の基準マーク位置検出処理で構成される第2の基準マーク検出処理が行われる。そしてステップS8の後、ステップS9の画像補正処理へ進む。
【0077】
一方、ステップS5bの判定処理で、基準マークが検出できたと判定されると、直ちに、ステップS9の画像補正処理へ進む。ステップS9以降の処理は、図3と同様である。
【0078】
以上のように、この第2の実施形態のOCRは、最初にステップS4〜S5aの従来の方法による基準マークの検出を行い、従来の方法で検出ができなかった場合にのみ、ステップS6〜S8による基準マークの検出を行うようにしている。これにより、第1の実施形態の利点に加えて、操作が簡略化でき、かつ帳票が正常に読み取られた場合の処理時間の短縮が可能になるという利点がある。
【0079】
第3の実施形態
図7は、本発明の第3の実施形態を示すOCRの動作の概要を示すフローチャートであり、図3中の要素と共通の要素には共通の符号が付されている。また、このOCRの構成は図1と同様であり、制御部110における全体的な動作制御が若干相違するだけである。
【0080】
このOCRでは、図3中のステップS5の後に、ステップS5aの基準マーク判定処理を追加している。
【0081】
ステップS5aは、ステップS2のマーク検出モード入力によって従来と同様の第1の基準マーク検出動作が選択されたときに、ステップS5のマーク領域算出処理で算出された領域中の基準マーク位置を検出する処理である。ステップS5bは、ステップS5aで検出されたマーク検出位置に基準マークが存在するか否かを判定する処理である。そして、このステップS5aで基準マークが検出されないと判定されると、ステップS6〜S8において、第2の方法による基準マーク検出処理を行うようにしている。一方、ステップS5aで基準マークが検出されたと判定されると、直ちに、ステップS9の画像補正処理へ進むようになっている。ステップS9以降の処理は、図3と同様である。
【0082】
以上のように、この第3の実施形態のOCRは、従来の方法による第1の基準マーク検出処理を選択して基準マークが検出できなかった時に、ステップS6〜S8による第2の基準マーク検出処理を行うようにしている。これにより、第1の実施形態の利点に加えて、オペレータの選択誤りによって読み取り動作が中断するというおそれがなくなるという利点がある。
【0083】
第4の実施形態
第4の実施形態は、基準マークが必ず帳票領域内にあることに着目して、まず帳票領域を検出し、検出した帳票領域内(更には帳票角から特定の範囲内)に走査範囲を限定して、予め記憶させておいた基準マークの形状に関する情報(以下、基準マークの形状情報と称する)と一致する画素の集合を検出するようにしたものである。これにより、基準マークの位置情報を用いることなく基準マークを検出できるようにし、特に、基準マークの位置がフォーマット情報における位置から大きくズレた場合でも検出できるようにした。
【0084】
図10は第4の実施形態における基準マーク検出部50の動作の概要を示すフローチャートである。
【0085】
基準マーク検出部50は、ステップS41において、画像メモリ20から帳票の画像イメージを取得するとともに、フォーマット情報メモリ30から基準マークの形状情報を取得する。なお、基準マークの形状情報には基準マークの大きさの情報を含めるようにしてもよい。次に、ステップS42において帳票を検出し、ステップS43において基準マークの角を検出する。次に、ステップS44において、ステップS43で検出した基準マークの角に基づいて、画像イメージに対して基準マークを検出するための検出領域を設定する。
【0086】
次に、ステップS45において検出領域内の画像を走査して黒の連結領域を検出し、ステップS46において予め定められた基準マークの形状および大きさに最も類似する黒の連結領域を抽出して、この領域を基準マークと見なす。そして、ステップS47において、基準マークの位置座標を識別し、その位置座標を文字切出部90に出力する。
【0087】
以上により、図10の動作が終了する。
【0088】
以下に、上述の各ステップについて補足する。
【0089】
まず、ステップS42について補足する。
【0090】
基準マーク検出部50は、画像イメージを斜め方向の走査線に沿って走査する。以下、図11〜図18を用いて、走査について説明する。
【0091】
図11は帳票角の検出方法を示す図である。
【0092】
図11中、1は帳票であり、1Aは帳票領域、1Bは背景領域、1a〜1dは帳票の角、2a〜2dは基準マーク、20は画像メモリに記憶されている領域、SLA1〜SLA5は左上の帳票の角1aを検出するための走査線、SLB1〜SLB5は右上の帳票の角1bを検出するための走査線、SLC1〜SLC5は左下の帳票の角1c、SLD1〜SLD5は右下の帳票の角1dを検出するための走査線である。
【0093】
図12は帳票領域検出処理の流れを示す図である。
【0094】
図12に示すように、本実施例では、左上(ステップS51)、右上(ステップS52)、右下(ステップS53)、左下(ステップS54)の順で帳票の角1a〜1dを検出し、帳票の角1a〜1dを上下左右の隣接するもの同士で結び、これにより形成される領域を帳票領域1Aとして設定する。以下、図13〜図18を用いて、帳票の角を検出する方法について補足する。
【0095】
図13は領域21aを拡大した図である。
【0096】
図13中、SLA1〜SLA5は走査線であり、2aは左上の基準マーク、62は走査線SLA1上の背景領域1Bの左端に位置する点、63は走査線SLA1上の背景領域1B内に位置する点、64は走査線SLA1上の背景領域1Bの右端に位置する点、65は走査線SLA5上の帳票領域1A内に位置する点、66は走査線SLA2上の背景領域1Bの左端に位置する点、67は走査線SLA2上の背景領域1Bの右端に位置する点である。
【0097】
図14は帳票の角の検出処理の動作を示すフローチャートである。
【0098】
基準マーク検出部50は、ステップS61において走査線SLA1を第一走査線として設定し、ステップS62において走査線SLA1上の点62を走査の開始位置として設定し、点64を走査の終了位置と設定する。
【0099】
次に、基準マーク検出部50は、ステップS63において、点62付近の画像が帳票領域1A内の画像であるのか、背景画像1B内の画像であるのかを判定する。この判定は、例えば、走査線上の点の座標を注目画素とし、注目画素から水平方向に8ビット、垂直方向に3ビットのブロック(以下、注目画素から8×3で作成される画像のブロックを画像ブロックと称する)に対して行う。
【0100】
図15は背景と判定される場合の画像ブロックの例である。図15(a)は画像ブロックの全画素が黒の場合を示しており、図15(b)は画像ブロックに白画素が混在している場合を示している。図15中、71と75は左上の帳票の角1a近辺の画像ブロックの注目画素である。基準マーク検出部50は、画像ブロックが図15(a)のような場合に、画像ブロックが背景領域内にあると判定する。また、画像ブロックが図15(b)のような場合にも、黒画素の割合が白画素の割合よりも高いので、白画素を微少なゴミと見なして、画像ブロックが背景領域内にあると判定する。
【0101】
図16は帳票と判定される場合の画像ブロックの例である。図16は画像ブロックの全画素が白である場合を示している。図16中、81は左上の帳票の角1a近辺の画像ブロックの注目画素である。基準マーク検出部50は、画像ブロックが図16のような場合に、画像ブロックが帳票領域内にあると判定する。なお、図16に示す画像に若干の黒画素が含まれる場合にも、画像ブロックが帳票領域内にあると判定するようにすることができるが、本実施形態では、図16に示すように、画像ブロックの全画素が白である場合に、画像ブロックが帳票領域内にあるもとのして説明する。
【0102】
基準マーク検出部50は、ステップS64において、点62の画像ブロックが帳票領域内でなければ、走査線上の次の走査位置に座標を移動させる。図13では点62の次の走査位置を点63としている。
【0103】
基準マーク検査部50は、次の走査位置である点63に座標を移動させた後、ステップS65において、走査線上の画像ブロックの判定がすべて終了したかどうか、つまり、点63の座標が走査線SLA1における走査の終了位置である点64を超えているかどうかを判定する。点63は点64を超えていないので、動作はステップS63に戻り、基準マーク50は、点63の画像ブロックが帳票領域内にあるかどうかを判定する。
【0104】
点63の画像ブロックが帳票領域内になければ、動作は再びステップS64に進み、基準マーク検出部50は走査線上の次の走査位置に座標を移動させる。以後、走査線上の走査位置を移動させて、移動させた走査位置が点64に達するまで、走査位置の画像ブロックが帳票領域内にあるかどうかの判定を繰り返す。すなわち、ステップS63〜S65を繰り返し行う。
【0105】
なお、走査位置が点64を越える場合は、走査位置を一旦点64の座標に移動させ、ステップS63において、点64の画像ブロックについて判定する。このときも点64の画像ブロックが背景領域内にあった場合は、基準マーク検出部50は走査位置を点64を越えた座標に移動させる。これにより、ステップS65において、判定はYesとなり、動作はステップS66に進み、基準マーク検査部50は、次の走査線であるSLA2に走査線を移動する。
【0106】
基準マーク検出部50は、ステップS67において、画像内の走査がすべて終了したどうかを判定する。Noの場合は、動作はステップS62に戻り、基準マーク検出部50は走査線SLA2上での走査を開始する。すなわち、走査線SLA2上の点66を走査の開始位置として設定し、点67を走査の終了位置と設定する。
【0107】
以後、走査線SLA2においても走査線SLA1で行ったのと同じ要領で走査位置を移動させながら画像ブロックの判定を行い、画像ブロックが帳票領域内にあると判定される座標を探す。なお、帳票領域内にあると判定される走査位置が走査線SLA2上にない場合は、他の走査線SLA3、SLA4、SLA5について同様の方法で順次帳票領域内にあると判定される走査位置を探す。
【0108】
なお、帳票領域内にあると判定される走査位置がない場合は、ステップS67において、判定はYesとなり、動作はステップS68に進む。そしてステップS68において、帳票角なしと判定される。帳票領域内にあると判定される走査位置がある場合は、ステップS63において、判定はYesとなり、動作はステップS69に進む。図13では走査線SLA5上の点65が帳票領域と交わっており、点65の画像ブロックが帳票領域内にあると判定される。基準マーク検出部50は、ステップS69において、点65の画像ブロックの座標位置を左上の帳票角の座標位置として内部に保持し、左上の帳票角を検出する処理を終了する。なお、このとき検出された点65は左上の帳票角1aに相当するものと見なされる。
【0109】
以上に説明したように、本実施形態は、斜めの走査線を画像イメージの外側から順次設定してゆき、走査線上の走査位置の座標を注目画素として画像ブロックを作成する。そして、画像ブロックが帳票領域内にあると判定される走査位置が検出されるまで、走査位置の移動と走査線の設定を繰り返し行って帳票角を検出するようにしたものである。本実施形態は、他の帳票角1b〜1dについても同様の方法で検出できる。
【0110】
なお、画像イメージ中に背景領域がない場合は、以下のようにして帳票角を設定する。
【0111】
図17は背景画像がない場合における左上の帳票角付近の拡大図である。
【0112】
図17中、SLA1は走査線であり、2aは左上の基準マーク、172は走査線SLA1上の左端に位置する点、173は走査線SLA1上の点173と点174の中点、174は走査線SLA1上の右端に位置する点である。なお、点172は第一走査線SLA1上の走査の開始位置とし、点174を第一走査線SLA1上の走査の終了位置とする。
【0113】
図17のように、背景画像がない場合は、第一走査線上の走査において、画像ブロックがすべて白となる。その場合は、走査の開始位置である点172と走査の終了位置である点174の中点に相当する点173を左上の帳票角と見なす。点173は、実際の帳票角1aとは相違するものであるが、基準マーク角検出処理には影響しないので、これを仮の帳票角と見なす。
【0114】
なお、本実施形態は、図18に示すように、走査線の設定の仕方によっては、走査線が帳票角から大きくズレる場合がある。図18は領域21aの拡大図である。図中、SLA6は第六の走査線、点181は走査線SLA5上の帳票角1aに最接近する点、点182は走査線SLA6上の左端に位置する点である。
【0115】
図18は帳票角として点182を検出したことを示している。しかしながら、帳票角1aは点182よりも点181の方に近い。この様なズレは、走査線同士の間隔を狭ばめることにより、小さくすることができる。
【0116】
次に、図10におけるステップS43について補足する。
【0117】
基準マーク検出部50は、ステップS42と同様に、画像イメージを斜め方向の走査線に沿って走査する。以下、図19〜図24を用いて、走査について説明する。
【0118】
図19は基準マーク角の検出方法を示す図である。
【0119】
図19中、1は帳票であり、1Aは帳票領域、1Bは背景領域、1a〜1dは帳票の角、2a〜2dは基準マーク、20は画像メモリに記憶されている領域、191a〜191dは基準マークの角、SLA1〜SLA5は左上の基準マークの角191aを検出するための走査線、SLB1〜SLB5は右上の基準マークの角191bを検出するための走査線、SLC1〜SLC5は左下の基準マークの角191c、SLD1〜SLD5は右下の基準マークの角191dを検出するための走査線である。
【0120】
図20は基準マーク角の検出処理の流れを示す図である。
【0121】
図20に示すように、本実施例では、左上(ステップS81)、右上(ステップS82)、右下(ステップS83)、左下(ステップS84)の順で基準マークの角191a〜191dを検出する。以下、図21〜図24を用いて、基準マークの角を検出する方法について以下に補足する。
【0122】
図21は領域21aを拡大した図である。
【0123】
図21中、SLA1〜SLA5は走査線であり、2aは左上の基準マーク、191aは基準マークの角、212は走査線SLA1上の帳票領域1Aの左端に位置する点、213は走査線SLA1上の帳票領域1A内に位置する点、214は走査線SLA1上の帳票領域1Aの右端に位置する点、215は走査線SLA5上の基準マーク2aと交差する点、216は走査線SLA2上の帳票領域1Aの左端に位置する点、217は走査線SLA2上の帳票領域1Aの右端に位置する点である。
【0124】
図22は基準マークの角の検出処理の動作を示すフローチャートである。
【0125】
基準マーク検出部50は、ステップS91において走査線SLA1を第一走査線として設定し、ステップS92において走査線SLA1上の点212を走査の開始位置として設定し、点214を走査の終了位置と設定する。
【0126】
次に、基準マーク検出部50は、ステップS93において、点212付近の画像ブロックが基準マーク2a内の画像であるのか、帳票領域1A内の画像であるのかを判定する。
【0127】
図23は帳票と判定される場合の画像ブロックの例である。図23(a)は画像ブロックの全画素が白の場合を示しており、図23(b)は画像ブロックに黒画素が混在している場合を示している。図23中、231と235は左上の基準マークの角191a近辺の画像ブロックの注目画素である。基準マーク検出部50は、画像ブロックが図23(a)のような場合に、画像ブロックが帳票領域内にあると判定する。また、画像ブロックが図23(b)のような場合にも、白画素の割合が黒画素の割合よりも高いので、黒画素を微少なゴミと見なして、画像ブロックが帳票領域内にあると判定する。
【0128】
図24は基準マークと判定される場合の画像ブロックの例である。図24は画像ブロックの全画素が黒である場合を示している。図24中、241は左上の基準マークの角191a近辺の画像ブロックの注目画素である。基準マーク検出部50は、画像ブロックが図24のような場合に、画像ブロックが基準マーク内にあると判定する。なお、図24に示す画像に若干の白画素が含まれる場合にも、画像ブロックが基準マーク内にあると判定するようにすることができるが、本実施形態では、図24に示すように、画像ブロックの全画素が黒である場合に、画像ブロックが基準マーク内にあるもとのして説明する。
【0129】
基準マーク検出部50は、ステップS94において、点212の画像ブロックが基準マーク内でなければ、走査線上の次の走査位置に座標を移動させる。図21では点212の次の走査位置を点213としている。
【0130】
基準マーク検査部50は、次の走査位置である点213に座標を移動させた後、ステップS95において、走査線上の画像ブロックの判定がすべて終了したかどうか、つまり、点213の座標が走査線SLA1における走査の終了位置である点214を超えているかどうかを判定する。点213は点214を超えていないので、動作はステップS213に戻り、基準マーク50は、点213の画像ブロックが基準マーク内にあるかどうかを判定する。
【0131】
点213の画像ブロックが基準マーク内になければ、動作は再びステップS214に進み、基準マーク検出部50は走査線上の次の走査位置に座標を移動させる。以後、走査線上の走査位置を移動させて、移動させた走査位置が点214に達するまで、走査位置の画像ブロックが基準マーク内にあるかどうかの判定を繰り返す。すなわち、ステップS93〜S95を繰り返し行う。
【0132】
なお、走査位置が点214を越える場合は、走査位置を一旦点214の座標に移動させ、ステップS93において、点214の画像ブロックについて判定する。このときも点214の画像ブロックが基準マーク内にあった場合は、基準マーク検出部50は走査位置を点214を越えた座標に移動させる。これにより、ステップS95において、判定はYesとなり、動作はステップS96に進み、基準マーク検査部50は、次の走査線であるSLA2に走査線を移動する。
【0133】
基準マーク検出部50は、ステップS97において、画像内の走査がすべて終了したどうかを判定する。Noの場合は、動作はステップS92に戻り、基準マーク検出部50は走査線SLA2上での走査を開始する。すなわち、走査線SLA2上の点216を走査の開始位置として設定し、点217を走査の終了位置と設定する。
【0134】
以後、走査線SLA2においても走査線SLA1で行ったのと同じ要領で走査位置を移動させながら画像ブロックの判定を行い、画像ブロックが基準マーク内にあると判定される座標を探す。なお、基準マーク内にあると判定される走査位置が走査線SLA2上にない場合は、他の走査線SLA3、SLA4、SLA5について同様の方法で順次基準マーク内にあると判定される走査位置を探す。
【0135】
なお、基準マーク内にあると判定される走査位置がない場合は、ステップS97において、判定はYesとなり、動作はステップS98に進む。そしてステップS98において、基準マーク角なしと判定される。基準マーク内にあると判定される走査位置がある場合は、ステップS93において、判定はYesとなり、動作はステップS99に進む。図21では走査線SLA5上の点215が基準マークと交わっており、点215の画像ブロックが基準マーク内にあると判定される。基準マーク検出部50は、ステップS99において、点215の画像ブロックの座標位置を左上の基準マーク角の座標位置として内部に保持し、左上の基準マーク角を検出する処理を終了する。なお、このとき検出された点215は左上の基準マーク角191aに相当するものと見なされる。
【0136】
以上に説明したように、本実施形態は、斜めの走査線を画像イメージの外側から順次設定してゆき、走査線上の走査位置の座標を注目画素として画像ブロックを作成する。そして、画像ブロックが基準マーク内にあると判定される走査位置が検出されるまで、走査位置の移動と走査線の設定を繰り返し行って基準マーク角を検出するようにしたものである。本実施形態は、他の基準マーク角191b〜191dについても同様の方法で検出できる。
【0137】
次に、図10におけるステップS44について補足する。
【0138】
基準マーク検出部50は、従来技術で参照していたフォーマットの基準マーク位置情報ではなく、上述の基準マーク角の検出処理(ステップS43)で検出された基準マーク角を用いて、各基準マークの検出領域を算出し、基準マークの検出領域を設定する。
【0139】
図25は左上基準マーク付近における基準マーク検出領域例を示す図である。
【0140】
図25中、2aは基準マークであり、215はステップS43で検出された基準マーク角、251は基準マークの垂直方向の大きさ、252は基準マークの水平方向の大きさ、253は左上の基準マーク検出領域、254は検出領域上端から基準マーク上端までの距離、255は検出領域下端から基準マーク下端までの距離、256は検出領域の左端から基準マーク左端までの距離、257は検出領域右端から基準マーク右端までの距離である。なお、基準マークの端から検出領域端までの距離254〜257は任意の値にすることが可能である。
【0141】
基準マーク検出部50は、上述のステップS43で検出された基準マーク角に対し、基準マークの垂直方向の大きさ251と基準マークの水平方向の大きさ252を割り当てて、基準マーク2aの領域を設定する。更に、基準マーク2aの領域に、検出領域上端から基準マーク上端までの距離254と検出領域下端から基準マーク下端までの距離255、検出領域の左端から基準マーク左端までの距離256、検出領域右端から基準マーク右端までの距離257を割り当てて、左上の基準マーク検出領域253を設定する。その後、基準マーク検出部50は、基準マーク検出領域253の中から、従来技術と同様に、黒の連結領域を検出して形状および大きさが基準マークに最も類似する図形を基準マークと判定し、基準マークの位置座標を検出する。そして、基準マークの位置座標を文字切出部90に出力する。
【0142】
以上に説明したように、第4の実施形態は、基準マークの形状および大きさに関する情報のみを用いることによって、基準マークの位置情報を用いることなく基準マークを検出することが可能となる。また、第4の実施形態は、基準マークの位置がフォーマット情報における位置から大きくズレても、検出することが可能である。そのため、文字切出しの精度を高めることができる。
【0143】
なお、基準マークの形状や大きさ、数、位置等は本実施形態に限定されるものではなく、適宜変更可能である。例えば、本実施形態では、背景及び基準マークの画像を黒、帳票領域の画像白と限定して説明したが、適宜変更可能である。また、走査の開始位置や画像ブロックの設定の仕方等も適宜変更可能である。更に、走査線の設定方法や設定位置、走査線同士の間隔等も適宜変更可能である。
【0144】
また、ステップS51〜ステップS54に示す帳票角を検出する順序やステップS81〜ステップS84に示す基準マーク角を検出する順序も適宜変更可能である。特に、これらは、常に4つ検出しなくても、必要な角のみ検出するようにすることができる。
【0145】
なお、第4の実施形態は、文字切出しのために設定した基準マークに限らず、マーク全般の検出にも有効である。
【0146】
第5の実施形態
第5の実施形態は、帳票に複数の基準マークが設定されている場合に、各基準マーク同士の位置関係を規定し、規定された基準マークの位置情報を用いて1つの基準マークから他の基準マークを検出できるようにした。
【0147】
図26は基準マークの位置関係の例を示す図である。
【0148】
図26中、1は帳票であり、2a〜2dは基準マーク、261〜264は上下左右に隣接する基準マーク2a〜2dの中心座標同士を結ぶ線と線の間の角度である。なお、本実施形態では角度261〜264を90度に設定したものとする。
【0149】
図27は第5の実施形態における基準マーク検出部50の動作の概要を示すフローチャートである。
【0150】
基準マーク検出部50は、ステップS111において、画像メモリ20から帳票の画像イメージを取得するとともに、フォーマット情報メモリ30から基準マークの形状情報と基準マークの位置情報を取得する。
【0151】
次に、基準マーク検出部50は、ステップS112において帳票を検出し、ステップS113において基準マークの角を検出する。次に、ステップS114において、ステップS113で検出した基準マークの角に基づいて、画像イメージに対して基準マークを検出するための検出領域を設定する。次に、ステップS115において検出領域内の画像を走査して黒の連結領域を検出し、ステップS116において予め定められた基準マークの形状および大きさに最も類似する黒の連結領域を抽出して、この領域を基準マークと見なす。なお、ステップS112〜S116の動作は第4の実施形態のステップS42〜S46の動作と同じである。
【0152】
次に、基準マーク検出部50は、ステップS117において、ステップS116で検出された基準マークの位置座標とフォーマット情報メモリ30から取得した基準マークの位置情報とを比較し、検出した基準マークの位置座標が妥当か否かを判定する。判定は、画像イメージから検出された各基準マークの中心座標を算出し、これらを上下左右に隣接するもの同士で線を結び、これによって形成される線と線の間の角度を測定し、測定された角度をフォーマット情報メモリ30から取得した基準マークの位置情報とを比較し、両者が所定の閾値内に収まっているか否かを識別することによって行われる。本実施形態では、全ての角度が約90度であれば、検出した基準マークの位置座標が妥当であると判断される。
【0153】
ステップS117において、妥当であると判定されると、動作はステップS118に進み、検出した基準マークの位置座標を文字切出部90に出力する。妥当でないと判定されると、ステップS112に戻り、ステップS112以降の動作を繰り返す。なお、再び、ステップS117で妥当でないと判定されると、基準マーク検出部50は、基準マークの位置検出が不能である旨を文字切出部90に出力する。
【0154】
なお、基準マーク検出部50は、帳票1に付着した汚れ等を基準マークとして検出する場合がある。この場合においても、本実施形態では、以下のように、基準マークの妥当性を判定することによって正しい基準マークを検出することができる。
【0155】
図28は基準マークの妥当性を判定する例を示す図である。図28は、基準マーク検出部50が5つの基準マークを検出したことを示している。図28中、1は帳票であり、2a〜2d及び2c’は検出した基準マーク、281〜684は上下左右に隣接する基準マーク2a〜2dの中心座標同士を結ぶ線と線の間の角度、285〜287は上下左右に隣接する基準マーク2a,2b,2c’,2dの中心座標同士を結ぶ線と線の間の角度である。なお、基準マーク2cと基準マーク2c’は同じ左下の帳票角付近に設定された検出領域において検出されたものとする。
【0156】
本実施形態において、基準マークは各帳票角付近の検出領域に1つづつ設定されているので、2cと2c’のどちらかが妥当であり、どちらかが妥当でないものとなる。この場合、基準マーク検出部50は、角度283と角度287を比較し、フォーマット情報メモリ30から取得した基準マークの位置情報に近い方を妥当なものと見なす。本実施形態では、フォーマット情報メモリ30から取得した基準マークの位置情報における角度263が90度に設定されているので角度283の方を近いものと判定し、2cが基準マークとして妥当であると判断する。
【0157】
なお、第5の実施形態を文字読取装置に適用した場合は、以下のような構成になる。
【0158】
図29は第5の実施形態を適用した文字読取装置の構成を示す図である。
【0159】
20は、画像メモリであり、入力される画像データを格納する。
【0160】
30は、フォーマット情報メモリであり、入力される画像の読取対象となる文字の領域の情報ならびに基準マークの形状および大きさに関する情報が格納されている。
【0161】
50は、基準マーク検出部であり、画像メモリ20に格納された帳票の画像イメージに対し、フォーマット情報メモリ30に格納されている基準マークの形状情報や基準マークの位置情報を用いて基準マークを検出する。
【0162】
70は、画像処理部であり、基準マーク検出部50により検出された基準マークの位置に基づいて画像の傾きや帳票の方向を検出し、回転処理等を行って画像を補正する。
90は、文字切出部であり、基準マーク検出部50により検出した基準マーク位置座標を用いて画像メモリ20から取得した画像イメージから文字を切出す。
【0163】
100は、文字認識部であり、文字切出部90で切出された文字に対して文字認識を行なう。
【0164】
101は、文字認識部100が文字認識する際に用いられる文字認識辞書メモリである。
【0165】
このような構成において、文字読取装置は、以下のように動作する。
【0166】
まず、文字読取装置は、読取対象の画像データが入力されると、画像メモリ20に画像データを格納する。
【0167】
その後、基準マーク検出部50は、画像メモリ20から画像イメージを取得するとともに、フォーマット情報メモリ30から基準マークの形状情報および基準マークの位置情報を取得して、画像イメージから基準マークを検出する。このとき、画像補正部70が基準マーク検出部50にて検出された基準マーク位置座標に基づいて画像の傾きや帳票の方向を検出し、回転処理等を行って画像を補正する。その後、基準マーク検出部50は、検出した基準マークの位置座標を文字切出部90に出力する。
【0168】
文字切出部90は、フォーマット情報メモリ30に格納されている文字領域の座標を取得し、文字領域内の文字を切出して文字認識部100に出力する。
【0169】
文字認識部100は、文字切出部90で切出された文字に対して認識処理を行い、認識結果を外部に出力する。
【0170】
以上に説明したように、第5の実施形態は、第4の実施形態の効果に加え、基準マークの位置情報の入手が困難な場合でも、画像の傾きや帳票の方向の検出が可能となる。また、基準マーク同士の間隔から文字領域の歪みを算出することができるので、これに合わせて文字領域の補正が可能となる。これにより、文字切出しや文字認識の精度も向上する。また、基準マークに類似した図形が検出された場合にも適正な基準マークを選択することが可能となり、これによっても文字切出しの精度が向上する。
【0171】
なお、本実施形態は、基準マークの検出に限定されるものではなき、マーク全般の検出に用いることができる。また、本実施形態の基準マークの位置情報は、角度に限定されるものではなく、適宜変更可能である。また、妥当性の判定における閾値は任意に設定可能である。また、基準マークの数や基準マークの位置も適宜変更可能である。但し、基準マークの位置情報を用いるので、2点以上が必要となる。
【0172】
なお、本発明は、上記実施形態に限定されず、種々の変形が可能である。この変形例としては、例えば、次の(a)〜(e)のようなものがある。
(a) 図1のOCRは、マーク領域算出部40、及び基準マーク検出部50等の個別の処理部を有しているが、これらの各処理部における処理をコンピュータを用いてプログラム制御で行うようにしても良い。
(b) 図4に示したマーク検出方法では、白地に黒色の基準マーク2a等が付された帳票1について説明したが、黒地に白色の基準マークが付された帳票に対しても同様に適用可能である。
(c) 基準マーク2a等は、必ずしも帳票1の四隅全部に付されている必要はなく、その数、形状、大きさ、及び位置等は変形可能である。
(d) 基準マーク判定部60における基準マークの検出方法は、ヒストグラムを用いた方法に限定されず、他の方法も同様に適用可能である。
(e) 図3中のステップS2,S3,S4,S5を削除し、ステップS6,S7による基準マークの検出のみを行うようにしても良い。これにより、処理時間が増加する場合があるが、単純な処理で確実に基準マークを検出することができる。
【0173】
【発明の効果】
以上詳細に説明したように、第1から第3の発明によれば、以下のような効果を得ることができる。
【0174】
すなわち、帳票は帳票の四隅の角付近には書込みや汚れ、マーク等が付されている場合がほとんどない。そこで、本発明は、帳票の四隅の角付近に基準マークを設けるようにし、帳票を斜め方向に走査する。これにより、本発明は、基準マークと帳票角の間の領域に書込みや汚れ、マーク等がほとんど付されていないので、これらを検出する場合が少なくなる。そのため、これらを基準マークか否かを判定する処理を行なう場合が従来構成よりも少なくなり、処理効率が従来構成よりも高くなるという効果がある。
【0175】
第4から第6の発明によれば、画像メモリ中の画像イメージを斜め方向に順次走査して基準マークの一角を検出し、その位置に基づいて他の基準マークの位置を検出する検出手段を備えている。これにより、確実に基準マークを検出することができるという効果がある。
【0176】
第7の発明によれば、帳票の基準マークの位置情報に基づいて画像イメージ中の基準マークの位置を検出する第1の検出手段と、画像イメージを斜めに順次走査して基準マークの一角を検出し、これに基づいて基準マークの位置を検出する第2の検出手段と、第1または第2の検出手段を選択する選択手段とを備えている。これにより、読取手段の位置精度に応じて効率の良い検出手段を選択することができるという効果がある。
【0177】
第8の発明によれば、読取手段の読取位置の許容範囲の情報に基づいて、第1または第2の検出手段のいずれか一方を選択する選択手段を有している。これにより、効率的に検出手段を選択できるという効果がある。
【0178】
第9の発明によれば、最初に第1の検出手段を選択し、この第1の検出手段で基準マークが検出できない場合に、第2の検出手段を選択する選択手段を有している。これにより、確実に基準マークを検出することができるという効果がある。
【0179】
第10から第13の発明によれば、マーク形状情報に類似するマークを検出すればよいので、基準マーク位置情報を用いることなく基準マークを検出することが可能になる。また、基準マークの位置がフォーマット情報における位置から大きくズレても、検出することが可能である。そのため、文字切出しの精度を高めることができる。
【0180】
第14から第18の発明によれば、第10の発明の効果に加え、基準マークの位置情報の入手が困難な場合でも、画像の傾きや帳票の方向の検出が可能となる。また、基準マーク同士の間隔から文字領域の歪みを算出することができるので、これに合わせて文字領域の補正が可能となる。これにより、文字切出しや文字認識の精度も向上する。また、基準マークに類似した図形が検出された場合にも適正な基準マークを選択することが可能となり、これによっても文字切出しの精度が向上する。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示すOCRの概略の構成図である。
【図2】図1のOCRにおける基準マーク検出方法の説明図である。
【図3】図1のOCRの動作の概要を示すフローチャートである。
【図4】図1中の基準マーク検出部50における基準マークの検出方法の説明図である。
【図5】図1中の基準マーク検出部50の動作の一例を示すフローチャートである。
【図6】本発明の第2の実施形態を示すOCRの動作の概要を示すフローチャートである。
【図7】本発明の第3の実施形態を示すOCRの動作の概要を示すフローチャートである。
【図8】従来のOCRの構成を示す図である。
【図9】従来技術における基準マーク検出部の動作の概要を示すフローチャートである。
【図10】第4の実施形態における基準マーク検出部の動作の概要を示すフローチャートである。
【図11】帳票角の検出方法を示す図である。
【図12】帳票領域検出処理の流れを示す図である。
【図13】領域21aの拡大図である。
【図14】帳票角検出の動作を示すフローチャートである。
【図15】背景と判定される場合の画像ブロックの例を示す図である。
【図16】帳票と判定される場合の画像ブロックの例を示す図である。
【図17】背景領域がない場合の左上の帳票角付近の拡大図である。
【図18】領域21aの拡大図である。
【図19】基準マーク角の検出方法を示す図である。
【図20】基準マーク角検出処理の流れを示す図である。
【図21】領域21aの拡大図である。
【図22】基準マーク角検出の動作を示すフローチャートである。
【図23】帳票と判定される場合の画像ブロックの例を示す図である。
【図24】基準マークと判定される場合の画像ブロックの例を示す図である。
【図25】基準マークの検出領域の例を示す図である。
【図26】基準マークの位置関係の例を示す図である。
【図27】第5の実施形態における基準マーク検出部の動作の概要を示すフローチャートである。
【図28】基準マークの妥当性を判定する例を示す図である。
【図29】第5の実施形態を適用した文字読取装置の構成を示す図である。
【符号の説明】
1 帳票
2a,2b,… 基準マーク
10 イメージスキャナ
20 画像メモリ
30 フォーマット情報メモリ
40,52 マーク領域算出部
50 基準マーク検出部
51 マーク角検出部
60 基準マーク判定部
100 文字認識部
101 文字辞書
110 制御部

Claims (18)

  1. 読取位置の基準となる基準マークが付された帳票を光学的に読み取り、読み取った帳票の画像イメージから基準マークを検出する基準マーク検出方法において、
    読取手段が帳票を読み取り、
    検出手段が、前記読取手段により読み取られた帳票の画像イメージを斜め方向の走査線で走査して基準マークを検出することを特徴とする基準マーク検出方法。
  2. 読取位置の基準となる基準マークが付された帳票を光学的に読み取り、読み取った帳票の画像イメージから基準マークを検出する基準マーク検出装置において、
    帳票を読み取る読取手段と、
    前記読取手段により読み取られた帳票の画像イメージを斜め方向の走査線で走査して基準マークを検出する検出手段とを、
    有することを特徴とする基準マーク検出装置。
  3. 読取位置の基準となる基準マークが付された帳票を光学的に読み取り、読み取った帳票の画像イメージ中の基準マークの位置に基づいて所定の位置に記載された文字を読み取る光学式文字読取装置において、
    帳票を横及び縦方向の画素に分解して光学的に読み取り、読み取った画像イメージを画像メモリに格納する読取手段と、
    前記画像メモリに格納された帳票の画像イメージを斜め方向の走査線で走査して基準マークを検出する検出手段と、
    前記検出手段により検出された基準マークの位置に基づいて、所定の位置に記載された文字を認識する文字認識手段とを、
    有することを特徴とする光学式文字読取装置。
  4. 読取位置の基準となる基準マークが複数付された帳票を光学的に読み取り、読み取った帳票の画像イメージから基準マークを検出する基準マーク検出方法において、
    読取手段が帳票を読み取り、
    検出手段が、前記読取手段により読み取られた帳票の画像イメージを斜め方向の走査線で走査して基準マークの一角を検出し、検出した基準マークの一角の位置を基準にして、更に他の基準マークを検出することを特徴とする基準マーク検出方法。
  5. 読取位置の基準となる基準マークが複数付された帳票を光学的に読み取り、読み取った帳票の画像イメージから基準マークを検出する基準マーク検出装置において、
    帳票を読み取る読取手段と、
    前記読取手段により読み取られた帳票の画像イメージを斜め方向の走査線で走査して基準マークの一角を検出し、検出した基準マークの一角の位置を基準にして、更に他の基準マークを検出する検出手段とを、
    有することを特徴とする基準マーク検出装置。
  6. 読取位置の基準となる基準マークが複数付された帳票を光学的に読み取り、読み取った帳票の画像イメージ中の基準マークの位置に基づいて所定の位置に記載された文字を読み取る光学式文字読取装置において、
    帳票を横及び縦方向の画素に分解して光学的に読み取り、読み取った画像イメージを画像メモリに格納する読取手段と、
    前記画像メモリに格納された帳票の画像イメージを斜め方向の走査線で走査して基準マークの一角を検出し、検出した基準マークの一角の位置を基準にして、更に他の基準マークを検出する検出手段と、
    前記検出手段により検出された基準マークの位置に基づいて、所定の位置に記載された文字を認識する文字認識手段とを、
    有することを特徴とする光学式文字読取装置。
  7. 読取位置の基準となる基準マークが複数付された帳票を光学的に読み取り、読み取った帳票の画像イメージ中の基準マークの位置に基づいて所定の位置に記載された文字を読み取る光学式文字読取装置において、
    帳票を横及び縦方向の画素に分解して光学的に読み取り、読み取った画像イメージを画像メモリに格納する読取手段と、
    帳票における基準マークの位置情報に基づいて、前記画像メモリに格納された帳票の画像イメージから基準マークを検出する第1の検出手段と、
    前記画像メモリに格納された帳票の画像イメージを斜め方向の走査線で走査して基準マークの一角を検出し、検出した基準マークの一角の位置を基準にして、更に他の基準マークを検出する第2の検出手段と、
    前記第1または第2の検出手段を選択する選択手段と、
    前記第1または第2の検出手段により検出された基準マークの位置に基づいて、所定の位置に記載された文字を認識する文字認識手段とを、
    有することを特徴とする光学式文字読取装置。
  8. 前記選択手段は、予め与えられた前記読取手段の読取位置の許容範囲の情報に基づいて、前記第1または第2の検出手段のいずれか一方を選択することを特徴とする請求項7に記載の光学式文字読取装置。
  9. 前記選択手段は、最初に前記第1の検出手段を選択し、該第1の検出手段で前記基準マークが検出できない場合に、前記第2の検出手段を選択することを特徴とする請求項7に記載の光学式文字読取装置。
  10. 読取位置の基準となる基準マークが付された帳票を光学的に読み取り、読み取った帳票の画像イメージから基準マークを検出する基準マーク検出方法において、
    基準マークの形状情報を記憶手段に予め記憶させておき、
    読取手段が帳票を読み取り、
    検出手段が、前記読取手段により読み取られた帳票の画像イメージを斜め方向の走査線で走査して、前記記憶手段に記憶された基準マーク形状情報に類似するマークを検出することを特徴とする基準マーク検出方法。
  11. 前記検出手段は、走査範囲を限定し、その範囲内を対象にして基準マーク形状情報に類似するマークを検出することを特徴とする請求項10に記載の基準マーク検出方法。
  12. 前記検出手段は、帳票の角を基準にして走査範囲を限定することを特徴とする請求項11に記載の基準マーク検出方法。
  13. 前記検出手段は、走査範囲内における黒の連結領域の中から基準マークの形状に最も類似した領域をマークとして検出することを特徴とする請求項10に記載の基準マーク検出方法。
  14. 更に、基準マーク同士の位置関係を示す基準マーク位置情報を前記記憶手段に予め記憶させておき、
    前記検出手段が、前記記憶手段に記憶された基準マーク位置情報に基づいて、検出した基準マークの一角を基準にして、更に他の基準マークを検出することを特徴とする請求項10に記載の基準マーク検出方法。
  15. 読取位置の基準となる基準マークが付された帳票を光学的に読み取り、読み取った帳票の画像イメージから基準マークを検出する基準マーク検出装置において、
    基準マークの形状情報が予め記憶された記憶手段と、
    帳票を読み取る読取手段と、
    前記読取手段により読み取られた帳票の画像イメージを斜め方向の走査線で走査して、前記記憶手段に記憶された基準マーク形状情報に類似するマークを検出する検出手段とを、
    有することを特徴とする基準マーク検出装置。
  16. 前記記憶手段は、更に、基準マーク同士の位置関係を示す基準マーク位置情報が予め記憶されており、
    前記検出手段は、前記記憶手段に記憶された基準マーク位置情報に基づいて、検出した基準マークの一角を基準にして、更に他の基準マークを検出することを特徴とする請求項15に記載の基準マーク検出装置。
  17. 読取位置の基準となる基準マークが付された帳票を光学的に読み取り、読み取った帳票の画像イメージ中の基準マークの位置に基づいて所定の位置に記載された文字を読み取る光学式文字読取装置において、
    帳票を横及び縦方向の画素に分解して光学的に読み取り、読み取った画像イメージを画像メモリに格納する読取手段と、
    前記画像メモリに格納された帳票の画像イメージを斜め方向の走査線で走査して、前記記憶手段に記憶された基準マーク形状情報に類似するマークを検出する検出手段と、
    前記検出手段により検出された基準マークの位置に基づいて、所定の位置に記載された文字を認識する文字認識手段とを、
    有することを特徴とする光学式文字読取装置。
  18. 前記記憶手段は、更に、基準マーク同士の位置関係を示す基準マーク位置情報が予め記憶されており、
    前記検出手段は、前記記憶手段に記憶された基準マーク位置情報に基づいて、検出した基準マークの一角を基準にして、更に他の基準マークを検出することを特徴とする請求項17に記載の光学式文字読取装置。
JP2000124152A 1999-04-26 2000-04-25 基準マーク検出方法、基準マーク検出装置及び光学式文字読取装置 Expired - Fee Related JP4329226B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000124152A JP4329226B2 (ja) 1999-04-26 2000-04-25 基準マーク検出方法、基準マーク検出装置及び光学式文字読取装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP11753799 1999-04-26
JP11-117537 1999-04-26
JP2000124152A JP4329226B2 (ja) 1999-04-26 2000-04-25 基準マーク検出方法、基準マーク検出装置及び光学式文字読取装置

Publications (2)

Publication Number Publication Date
JP2001014427A JP2001014427A (ja) 2001-01-19
JP4329226B2 true JP4329226B2 (ja) 2009-09-09

Family

ID=26455630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000124152A Expired - Fee Related JP4329226B2 (ja) 1999-04-26 2000-04-25 基準マーク検出方法、基準マーク検出装置及び光学式文字読取装置

Country Status (1)

Country Link
JP (1) JP4329226B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006035528A (ja) * 2004-07-23 2006-02-09 Katsuragawa Electric Co Ltd 出力同期制御装置
EP3796218A4 (en) 2018-07-06 2021-06-23 Rakuten, Inc. IMAGE PROCESSING SYSTEM, IMAGE PROCESSING METHOD AND PROGRAM
JP6574920B1 (ja) 2018-07-06 2019-09-11 楽天株式会社 画像処理システム、画像処理方法、及びプログラム
JP6815712B1 (ja) * 2020-07-30 2021-01-20 株式会社マネーフォワード 画像処理システム、画像処理方法、画像処理プログラム、画像処理サーバ、及び学習モデル

Also Published As

Publication number Publication date
JP2001014427A (ja) 2001-01-19

Similar Documents

Publication Publication Date Title
EP0669593B1 (en) Two-dimensional code recognition method
EP1619604B1 (en) Code type determining method and code boundary detecting method
US8254683B2 (en) Code image processing method
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
US5164996A (en) Optical character recognition by detecting geo features
JP4329226B2 (ja) 基準マーク検出方法、基準マーク検出装置及び光学式文字読取装置
KR20010015025A (ko) 문자인식장치의 문자추출방법 및 장치
EP0766193B1 (en) Optical character reader with skew correction
JP3058791B2 (ja) 画像認識装置の図形の切出し方法
JPH03232100A (ja) ナンバープレート読み取り装置
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP3622347B2 (ja) 帳票認識装置
JP2004334913A (ja) 帳票認識装置及び帳票認識方法
JP3019897B2 (ja) 行切出し方法
JP2824372B2 (ja) 帳票の認識装置
JPH05266250A (ja) 文字列検出装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JPS62211779A (ja) タイミングダイヤグラム読取装置
JP2004013188A (ja) 帳票読取り装置および帳票読取り方法ならびプログラム
JPS62200490A (ja) 光学的文字読取装置
JPH0483467A (ja) 読み取り画像の傾斜補正方式
JPH11161739A (ja) 文字認識装置
JP2001307097A (ja) パターン検出装置及び方法
JPH06348898A (ja) 符号認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060825

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060923

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060929

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061013

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090526

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090608

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120626

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120626

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120626

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130626

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees