JP2006215964A - 文字認識装置 - Google Patents
文字認識装置 Download PDFInfo
- Publication number
- JP2006215964A JP2006215964A JP2005030552A JP2005030552A JP2006215964A JP 2006215964 A JP2006215964 A JP 2006215964A JP 2005030552 A JP2005030552 A JP 2005030552A JP 2005030552 A JP2005030552 A JP 2005030552A JP 2006215964 A JP2006215964 A JP 2006215964A
- Authority
- JP
- Japan
- Prior art keywords
- show
- character recognition
- image
- character
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【課題】 文字が記入されるエリアに裏写りがある場合においても文字認識ができる文字認識装置を提供する。
【解決手段】 帳票PAの表面の画像が多値画像Aとして画像メモリ41に記憶される。一方、帳票PAの裏面の画像が多値画像Bとして画像メモリ44に記憶される。CPU42は、帳票フォーマットに基づいて、指定したフィールドの多値画像A及び多値画像Bを抽出する。次に、抽出した多値画像に対して裏写りがあるかどうかを判定する。すなわち、指定したフィールドの裏面の多値画像で濃度値がD以上の画素の個数を数え、その個数がN以上の場合には裏写りがあると判断する。もし裏写りがあるフィールドに対しては、式(2)で示された方式で裏写り除去を行い、裏写りがない場合には、裏写り除去を行わない。次に、指定したフィールドに対して二値化処理を行い、各文字の画像を切り出し、文字認識辞書45と照合することにより文字認識を行う。
【選択図】 図1
【解決手段】 帳票PAの表面の画像が多値画像Aとして画像メモリ41に記憶される。一方、帳票PAの裏面の画像が多値画像Bとして画像メモリ44に記憶される。CPU42は、帳票フォーマットに基づいて、指定したフィールドの多値画像A及び多値画像Bを抽出する。次に、抽出した多値画像に対して裏写りがあるかどうかを判定する。すなわち、指定したフィールドの裏面の多値画像で濃度値がD以上の画素の個数を数え、その個数がN以上の場合には裏写りがあると判断する。もし裏写りがあるフィールドに対しては、式(2)で示された方式で裏写り除去を行い、裏写りがない場合には、裏写り除去を行わない。次に、指定したフィールドに対して二値化処理を行い、各文字の画像を切り出し、文字認識辞書45と照合することにより文字認識を行う。
【選択図】 図1
Description
本発明は、帳票の裏に記入された文字による裏写りを除去する文字認識装置に関する。
文字認識装置は、文字の記入された帳票の画像をスキャナで読み込み、パターン認識技術を用いて記入された文字を読み取る装置である。
従来の文字認識装置は、文字認識装置のための専用帳票に記入された文字を読み取るように設計されていたが、近年では、機械で読み取ることを前提としない一般の帳票も文字認識装置で読み取ることが可能になってきている。
このような一般の帳票を上記文字認識装置で文字認識を行う場合、紙厚が薄い帳票の表面をスキャナで読み取る際、帳票の裏面に記入された文字・図形などが表面に透過(裏写り)してノイズとなり、文字認識性能を低下させる要因となっていた。
このような裏写りの要因を解決するために従来から多くの考案がなされてきた。例えば、帳票の裏面からの照明を消灯した際の画像と点灯した際の画像の差分によって裏写り除去する方法、及び帳票の表面の画像と裏面の画像の差分によって裏写り除去する方法として以下に示す2種類の方法が開示されている。
第1の方法を図11、図12を参照して説明する。図11は、帳票の表面を読取る表画像入力部123と、帳票の表を照明する表照明121と、帳票の裏を照明する裏照明131とを備え、裏写りを防止する原稿読み取り装置である。この装置では、照明121を点灯し照明131を消灯した際に表画像入力部123から得られる画像をAとし、照明121と照明131とを両方点灯した際に得られる画像をBとすると、下式(1)により裏写り除去処理された画像Cが得られる。
C=A−(B−A)×K・・・・(1)
ただし、Kは係数である。
C=A−(B−A)×K・・・・(1)
ただし、Kは係数である。
図12は、図11に示す裏写り除去の原理を説明する図である。この図は各画像の1本の走査線上の信号波形を表示したものである。
図12(A)は、裏照明131を消灯した場合の画像Aの波形である。この波形の中央部分の低いピークが裏写りを表しているものとする。
図12(B)は、裏照明131を点灯した場合の画像Bの波形である。この波形では裏面からの照明の効果により裏写り部分が強調されている。
図12(C)は、両方の画像の差である画像B−画像Aの波形である。この波形では裏写り部分のみが抽出されている。
図12(D)は、図12(A)の波形から、図12(C)の波形をK倍して引き算して得られた補正画像Cの波形である。このようにして、裏写り部分が除去された波形が得られる(例えば、特許文献1参照。)。
第2の方法を図13、図14を参照して説明する。図13は、帳票の表面の画像と裏面の画像の差分によって裏写りを防止する画像処理装置である。すなわち、図13に示した装置で、表画像入力部123から表面の画像Aを入力し、裏画像入力部133から裏面の画像Bを入力したとすると、下式(2)により裏写り除去された画像Cが得られる。
C=A−B×K・・・・・(2)
ただし、Kは係数である。
C=A−B×K・・・・・(2)
ただし、Kは係数である。
図14は、図13に示す裏写りを防止する画像処理装置の原理を説明する図である。この図は各画像の1本の走査線上の信号波形を表示したものである。
図14(A)は、表画像入力部123から入力した表面画像Aの波形である。この波形の中央部分の低いピークが裏面画像Bが裏写りした画像を表しているものとする。
図14(B)は、裏画像入力部133から入力した裏面画像Bの波形である。この波形の両端の低いピークが表面画像Aが裏写りした画像である。
図14(C)は、図14(A)の波形から、図14(B)の波形をK倍して引き算して得られた補正画像Cの波形である。このようにして、裏写り除去処理された波形が得られる(例えば、特許文献2参照。)。
特開平9−135344号公報 (第1−4頁、図1)
特開2003−78766号公報 (第1−4頁、図5)
しかしながら、特許文献1記載の原稿読取装置又は特許文献2記載の画像処理装置は、主にコピー機にて裏写りのない画像を印刷することを目的としている。しかし、このような方法を文字認識装置に適用しようとすると、以下のような問題点が生じる
第1に、裏写り除去処理を行うことによってかえって画質が悪化する場合がある。上で述べた裏写り除去処理では、画像全面に対して減算処理が行われるため、裏写りのない部分にも余計な処理が加わり、かえって画質が悪くなり、文字認識性能が低下する可能性がある。また、裏写りのある部分においても、必要以上に画像の除去が行われたり、裏写りの除去が不完全であったりして、性能が劣化する可能性があるという問題がある。
第1に、裏写り除去処理を行うことによってかえって画質が悪化する場合がある。上で述べた裏写り除去処理では、画像全面に対して減算処理が行われるため、裏写りのない部分にも余計な処理が加わり、かえって画質が悪くなり、文字認識性能が低下する可能性がある。また、裏写りのある部分においても、必要以上に画像の除去が行われたり、裏写りの除去が不完全であったりして、性能が劣化する可能性があるという問題がある。
第2に、上で述べた裏写り除去処理では、画像全面に対して処理が行われるため、多くの処理時間を必要とするという問題がある。
本発明は、上記問題を解決するためになされたもので、文字が記入されるエリアに対してのみ裏写り除去処理を行うことによって、裏写りがある場合においても高性能に文字認識ができる文字認識装置を提供する。
上記目的を達成するために、本発明の請求項1記載の文字認識装置は、帳票の表面及び裏面の画像を読み取る読取手段と、この読取手段によって読み取られた画像データの中の文字認識の対象となるフィールドを前記帳票の種類毎に記憶する記憶手段と、この記憶手段から読み込んで設定された前記フィールド毎に前記画像データの裏写りを検出する検出手段と、この検出手段の検出結果に基づいて裏写りの有無を判定する判定手段と、前記判定手段の結果、裏写りがあると判定されたフィールドに対して裏写り除去を行う裏写り除去手段と、この裏写り除去手段の結果得られた画像の文字認識を行う文字認識手段とを備えたことを特徴とする。
また、本発明の請求項2記載の文字認識装置は、帳票の表面及び裏面の画像を読み取る読取手段と、この読取手段によって読み取られた画像データの中の文字認識の対象となるフィールドを前記帳票の種類毎に記憶する記憶手段と、この記憶手段から読み込んで設定された前記フィールド毎に前記画像データの裏写り除去を行う裏写り除去手段と、前記文字認識の対象となる前記フィールドの各々に対して、前記裏写り除去手段を適用した第1画像と、裏写り除去を適用しない第2画像とを生成し、前記第1画像と前記第2画像を個々に文字認識する文字認識手段と、この文字認識手段によって前記第1画像を文字認識した結果と、前記第2画像を文字認識した結果とを評価する評価手段と、前記評価手段の結果に基づいて何れかの文字認識結果を選択する選択手段とを備えたことを特徴とする。
さらに、本発明の請求項3記載の文字認識装置は、帳票の表面及び裏面の画像を読み取る読取手段と、この読取手段によって読み取られた画像データの中の文字認識の対象となるフィールドを前記帳票の種類毎に記憶する記憶手段と、この記憶手段から読み込んで設定された前記フィールド毎に前記画像データに対して、複数の強度に設定して裏写り除去を複数回行う裏写り除去手段と、この裏写り除去手段を適用して得られた複数画像に対して文字認識する文字認識手段と、この文字認識手段の文字認識の結果を評価する評価手段と、この評価手段の評価結果に基づいて何れかの文字認識結果を選択する選択手段とを備えたことを特徴とする。
さらにまた、本発明の請求項5記載の文字認識装置は、帳票の表面の画像を読み取る読取手段と、この読取手段によって読み取られた画像データから複数の文字ブロックを検出するブロック抽出手段と、前記検出手段で検出された文字ブロック毎に文字切り出し手段によって切り出された正方向文字と、この正方向画像を鏡像反転して得られた反転文字とを文字認識する文字認識手段と、この文字認識手段の文字認識の結果に基づいて前記ブロック毎の裏写りを判定する裏写り判定手段と、この裏写り判定手段の判定の結果裏写りなしと判定された前記文字ブロックの認識結果を選択する選択手段とを備えたことを特徴とする。
本発明によれば、文字が記入されるエリアに対してのみ裏写り除去処理を行うことによって、裏写りがある場合においても高性能に文字認識ができる文字認識装置を提供することができる。
以下、図面を参照して本発明の実施例を説明する。
図1は、本発明の実施例1による文字認識装置(以下、装置と称する)1の構成を示す図である。
装置1は、帳票PAを搬送する搬送部7、この搬送部7によって搬送された帳票PAの表面を読み取る表読取部(読取手段)2、帳票PAの裏面を読み取る裏読取部(読取手段)3、表読取部2及び裏読取部3によって読み取られた画像データの文字を認識する文字認識部4を備えている。
表読取部(読取手段)2には、搬送路7によって図示矢マークA方向に搬送される帳票PAの表読取面22を照射する表照明21が設けられており、さらに、この表照明21によって照射された表読取面22のデータを1ライン毎に読み取る表画像入力部23が設けられている。この表画像入力部23によって読み取られた画像データは、文字認識部4の画像メモリ41に記憶される。
裏読取部3(読取手段)には、帳票PAの裏読取面(図示しない)を照射する裏照明31が設けられており、さらに、この裏照明31によって照射された裏読取面のデータを1ライン毎に読み取る裏画像入力部33が設けられている。裏画像入力部33で読み取られた画像データは、文字認識部4の画像メモリ44に記憶される。
文字認識部(文字認識手段)4には、帳票フォーマットデータベース(記憶手段)43、文字認識辞書45、画像メモリ41、画像メモリ44、CPU(Central Processing Unit)42が設けられている。
帳票フォーマットデータベース43は、後述する帳票フォーマットの文字認識の対象となるエリアを設定するフィールドデータが記憶されているデータベースである。
文字認識辞書45には、帳票に記入された文字を認識するための文字認識用の辞書が記憶されている。
CPU42は、帳票フォーマットデータベース43から該当する帳票フォーマットの、文字認識の対象となるフィールドデータを読み出し、この読み出したフィールドデータに基づいて画像メモリ41、42内の文字認識すべきエリアを設定する。さらに、このようにして設定されたエリア内の文字と、文字認識辞書45とを、例えば類似度法などを用いて文字認識を行う。
図2は、装置1の読み取り対象となる帳票PAの帳票フォーマットの一例である。この帳票PAに、例えば名前及び住所が記入されている場合について説明する。
名前エリアは、姓エリアPA1及び名エリアPA2で構成される。住所エリアは、都道府県エリアPA3、市区郡エリアPA4、町村エリアPA5、丁目・番地・号エリアPA6で構成される。
図3は、図2の帳票に関して、例えば都道府県エリアPA3に裏写り画像(「星」マーク)のある表面及び裏面の画像を示している。
図3(A)は、帳票PAの都道府県エリアPA3を表読取部2で読み取った場合の読取画像で、表面の読取画像である「神奈川県」と、裏写り画像である「星」マークとが読み取られた状態を示す。
図3(B)は、帳票PAの都道府県エリアPA3を裏読取部3で読み取った場合の読取画像で、裏面の読取画像である「星」マークと、裏写り画像である「神奈川県」とが反転して読み取られた状態を示す。
図3(C)は、図3(A)の読取画像から裏写り画像を削除した画像で、本実施例の目的とする画像データである(詳細は、後述する。)。
図4は、本発明の実施例1の処理手順を示すフローチャートである。以下に示す1.〜8.の順に説明する。
1.まず、文字認識部4のCPU42は、図2に示す帳票PAの帳票フォーマットを帳票フォーマットデータベース(記憶手段)43から読み出す(S1)。
この帳票フォーマットには、帳票内の読み取るべきエリアの位置座標を示すフィールドが複数個、登録されている。図2の例で言えば、姓エリアPA1に対応する姓のフィールド、名エリアPA2に対応する名のフィールド、都道府県エリアPA3に対応する都道府県のフィールド、市区郡エリアPA4に対応する市区郡のフィールド、町村エリアPA5に対応する町村のフィールド、丁目・番地・号エリアPA6に対応する丁目・番地・号のフィールドなど、帳票PA内における各々の位置座標が登録されている。
2.次に、この帳票の表面の画像が表読取部(読取手段)2の表画像入力部23から入力され、多値画像Aとして文字認識部4内の画像メモリ41に記憶される。一方、帳票PAの裏面の画像は裏読取部(読取手段)3の裏画像入力部33から入力され、多値画像Bとして文字認識部4内の画像メモリ44に記憶される。
3.CPU42は帳票フォーマットに基づいて、画像メモリ41から指定したフィールドの画像を抽出する(S3)。図3(A)は、このようにして、例えば都道府県フィールドの表面画像を抽出した例である。この図では、「星」マークが裏写りしている状態を示している。
4.同様にCPU42は帳票フォーマットに基づいて、画像メモリ44から指定したフィールドの裏面の画像を抽出する。図3(B)は、このようにして、例えば都道府県フィールドの裏面画像を抽出した例である(S4)。この図では、「星」マークがはっきりと見え、表面に記入された「神奈川県」文字列が反転して裏写りしている。
5.次に、CPU42は、指定したフィールドに対して、裏写りがあるかどうかを検出する。この検出方法は、指定したフィールドの裏面の画像で濃度値が設定値D以上の画素の個数を数える方法である(検出手段、S6)。また、この検出手段の検出結果、その個数が設定値N以上の場合には裏写りがあると判定する(判定手段、S7)。
6.もし裏写りがあると判定されたフィールドに対しては(S7のYES)、上式(2)で示された方式で裏写り除去処理を行う(裏写り除去手段、S8)。図3(C)に都道府県フィールドの裏写りを除去した例を示す。一方、もし、裏写りがないと判定された場合には(S7のNO)、当該フィールドに対しては裏写り除去処理を行わない。
7.次に、指定したフィールドの画像に対して二値化処理を行い、各文字の画像を切り出し、切り出された文字画像を文字認識辞書45と照合することにより文字認識を行う(文字認識手段、S9)。
8.最後に文字認識の結果を出力する(S10)。
ここで、ステップS5及びステップS11は、この間に含まれるステップS6〜ステップS10が各フィールドの画像に対して繰り返し行われることを意味する。この繰り返し処理によって、全てのフィールドの画像処理が終了する。
以上の説明においては、指定したフィールドの画像に対して、裏写り検出ステップ(S6)から文字認識するステップ(S10)までの処理を行い、この処理を全てのフィールドの画像に対して繰り返す方法を説明したが、各ステップ毎に全てのフィールドの画像に対して処理する方法を用いても同じ結果が得られるのは当然である。
さらに、ステップS2及びステップS12は、この間に含まれるステップS3〜ステップS11までの処理が、搬送される帳票PAに対して繰り返して行われることを意味する。従って、この繰り返し処理により、搬送される複数の帳票PAが全て同様に処理される。
本実施例1では、背景技術に示す第2の方法に基づく裏写り除去処理を用いたが、背景技術に示す第1の方法を用いても同様に実現できる。背景技術に示す第1の方法を用いる場合には、裏写りがあるかどうかの判定は以下の手順で行う。すなわち、各フィールドについて、裏面からの照明を消灯して得られる画像をAとし、点灯して得られる画像をBとすると、画像B−Aの画素値が閾値D以上の画素の個数を数え、その個数が閾値N以上のとき裏写りがあると判断する。
図5は、本発明の実施例2の処理手順を示すフローチャートである。本実施例2の文字認識装置の構成は、実施例1の図1と同様である。また、読み取り対象となる帳票も同様である(図2参照)。以下に示す1.〜9.の順に説明する。
1.まず、文字認識部4のCPU42は、図2に示す帳票PAの帳票フォーマットを帳票フォーマットデータベース(記憶手段)43から読み出す(S20)。
この帳票フォーマットには、帳票内の読み取るべきフィールドの位置が複数個、登録されている。図2の例で言えば、姓エリアPA1に対応する姓のフィールド、名エリアPA2に対応する名のフィールド、都道府県エリアPA3に対応する都道府県のフィールド、市区郡エリアPA4に対応する市区郡のフィールド、町村エリアPA5に対応する町村のフィールド、丁目・番地・号エリアPA6に対応する丁目・番地・号のフィールドなど、帳票PA内における各々の位置座標が登録されている。
2.次に、この帳票の表面の画像が表読取部(読取手段)2の表画像入力部23から入力され、多値画像Aとして文字認識部4内の画像メモリ41に記憶される。一方、帳票PAの裏面の画像は裏読取部(読取手段)3の裏画像入力部33から入力され、多値画像Bとして文字認識部4内の画像メモリ44に記憶される。
3.CPU42は帳票フォーマットに基づいて、画像メモリ41の中の指定したフィールドの表画像を抽出する(S22)。図3(A)は、このようにして、例えば都道府県フィールドの表面画像を抽出した例である。この図では、「星」マークが裏写りしている状態を示している。
4.同様にCPU42は帳票フォーマットに基づいて、画像メモリ44から指定したフィールドの裏面の画像を抽出する。図3(B)は、このようにして、例えば都道府県フィールドの裏面画像を抽出した例である(S23)。この図では、「星」マークがはっきりと見え、表面に記入された「神奈川県」文字列が裏写りしている。
5.次に、CPU42は、指定したフィールドに対して、背景技術に示す第2の方法を用いて裏写り除去を行い、裏写り除去されたフィールドの画像(第1画像)を画像メモリ41に記憶する(裏写り除去手段)。このようにして、実施例1同様、図3(C)に示すように都道府県フィールドの裏写りが除去できる。
6.裏写り処理を実施したフィールド画像に対して二値化処理を行い、各文字の画像を切り出し、切り出された文字画像を文字認識辞書と照合することにより文字認識を行う(文字認識手段、S26)。
7.次に、裏写り除去処理を適用しないフィールドの画像(第2画像)に対して二値化処理を行い、各文字の画像を切り出し、切り出された文字画像を文字認識辞書と照合することにより文字認識を行う(文字認識手段、S27)。
8.次に、裏写り処理を実施したフィールド画像に対して文字認識を行った結果(S26)と、裏写り処理を実施しないフィールド画像に対して文字認識を行った結果(S27)とを比較して(評価手段)、妥当と判断される方を最終的な文字認識結果として選択する(選択手段)。判断する基準は、例えば、文字認識結果の類似度の平均値が大きい方を選択すればよい。また、単語辞書46と照合して文字認識結果が単語辞書にヒットした方を選択する方法もある(S28)。ここでいう単語辞書とは、本実施例の、例えば「都道府県」のように限られた言語だけ現れることがわかっている場合に適用できる。
9.最後に文字認識の結果を出力する(S29)。
ここで、ステップS21及びステップS30は、この間に含まれるステップS22〜ステップS29が各フィールドに対して繰り返し行われることを意味する。この繰り返し処理によって、全てのフィールドの処理が終了する。
以上の説明においては、指定したフィールドに対して、裏写り検出ステップ(S25)から認識結果出力ステップ(S29)までの処理を行い、この処理を全てのフィールドに対して繰り返す方法を説明したが、各ステップ毎に全てのフィールドに対して処理する方法を用いても同じ結果が得られるのは当然である。
さらに、ステップS21及びステップS31は、この間に含まれるステップS22〜ステップS30までの処理が、搬送される帳票PAに対して繰り返して行われることを意味する。従って、この繰り返し処理により、搬送される複数の帳票PAが全て同様に処理される。
本実施例2では、背景技術に示す第2の方法に基づく裏写り除去処理を用いたが、背景技術に示す第1の方法を用いても同様に実現できる。
図6は、本発明の実施例3の処理手順を示すフローチャートである。本実施例3の文字認識装置の構成は、実施例1の図1と同様である。また、読み取り対象となる帳票も同様である(図2参照)。以下に示す1.〜8.の順に説明する。
1.まず、文字認識部4のCPU42は、図2に示す帳票PAの帳票フォーマットを帳票フォーマットデータベース(記憶手段)43から読み出す(S40)。
この帳票フォーマットには、帳票内の読み取るべきフィールドの位置が複数個、登録されている。図2の例で言えば、姓エリアPA1に対応する姓のフィールド、名エリアPA2に対応する名のフィールド、都道府県エリアPA3に対応する都道府県のフィールド、市区郡エリアPA4に対応する市区郡のフィールド、町村エリアPA5に対応する町村のフィールド、丁目・番地・号エリアPA6に対応する丁目・番地・号のフィールドなど、帳票PA内における各々の位置座標が登録されている。
2.次に、この帳票の表面の画像が表読取部(読取手段)2の表画像入力部23から入力され、多値画像Aとして文字認識部4内の画像メモリ41に記憶される。一方、帳票PAの裏面の画像は裏読取部(読取手段)3の裏画像入力部33から入力され、多値画像Bとして文字認識部4内の画像メモリ44に記憶される。
3.CPU42は帳票フォーマットに基づいて、画像メモリ41から指定したフィールドの表画像を抽出する(S42)。図3(A)は、このようにして、例えば都道府県フィールドの表面画像を抽出した例である。この図では、「星」マークが裏写りしている状態を示している。
4.同様にCPU42は帳票フォーマットに基づいて、画像メモリ44から指定したフィールドの裏面の画像を抽出する(S43)。図3(B)は、このようにして、例えば都道府県フィールドの裏面画像を抽出した例である。この図では、「星」マークがはっきりと見え、表面に記入された「神奈川県」文字列が裏写りしている。
5.次に、CPU42は、指定されたフィールドの画像に対して、背景技術に示す第2の方法を用いて裏写り除去を行う。本実施例の場合には、上式(2)のパラメタKを変化させて複数種類の裏写り除去画像を生成する(裏写り除去手段、S46)。ここで、パラメータKは、裏移りを除去する強度を示すパラメータで、例えば、K=0(これは裏写り除去をしない場合に相当する)、0.1、0.2、0.3の4種類の値を用いて裏写り除去処理を行う(裏写り除去手段、S46)。ここで、適切なKが選ばれた場合には、実施例1、実施例2同様、図3(C)に示すように都道府県フィールドの裏写りが除去できる。
6.次に、裏写り除去された複数の画像のそれぞれに対して二値化処理を行い、各文字の画像を切り出し、切り出された文字画像を文字認識辞書45と照合することにより文字認識を行う(文字認識手段、S47)。
7.得られた複数の文字認識結果を比較して(評価手段)、最も妥当と判断されるものを最終的な文字認識結果として選択する(選択手段)。判断する基準は、例えば、文字認識結果の類似度の平均値が最大の結果を選択すればよい。また、上述した単語辞書46と照合して文字認識結果が単語辞書に最も高い類似度でヒットした結果を選択する方法もある。
8.最後に文字認識の結果を出力する。
ここで、ステップS41及びステップS51は、この間に含まれるステップS42〜ステップS50が各フィールドの画像に対して繰り返し行われることを意味する。この繰り返し処理によって、全てのフィールドの画像処理が終了する。
以上の説明においては、指定したフィールの画像に対して、裏写り検出ステップ(S46)から認識結果出力ステップ(S50)までの処理を行い、この処理を全てのフィールドに対して繰り返す方法を説明したが、各ステップ毎に全てのフィールドの画像に対して処理する方法を用いても同じ結果が得られるのは当然である。
さらに、ステップS41及びステップS52は、この間に含まれるステップS41〜ステップS51までの処理が、搬送される帳票PAに対して繰り返して行われることを意味する。従って、この繰り返し処理により、搬送される複数の帳票PAが全て同様に処理される。
本実施例3では、背景技術に示す第2の方法に基づく裏写り除去処理を用いたが、背景技術に示す第1の方法を用いても同様に実現できる。
図7は、本実施例4の文字認識装置1の構成を示す図である。この実施例4では、図1に示す裏読取部3が設けられていないが、その他の部分は図1と同様である。従って、図1と同一部分には同一符号を付け、その説明を省略し、異なる部分の説明を行う。
図8は、装置1の読み取り対象となる帳票PBの一例である。この帳票PBは、実施例1のような記入枠が固定した帳票フォーマットではなく記載位置が自由な形式であるものと仮定している。また、この帳票PBには裏面にも同様な記入欄があるため、裏面に記入された住所・氏名が表に透けてみえているものとする。図8には、以上の条件のもとに、表面に記載した住所・氏名PB1、及び裏面に記載した住所・氏名PB2が示してある。
図9は、本実施例4の処理の流れを説明する図である。図10は、実施例4の処理手順を示すフローチャートである。以下に示す1.〜10.の順に説明する。
1.まず、帳票PBの表面の画像PB1、PB2が表読取部(読取手段)2の表画像入力部23から入力され、多値画像として文字認識部4内の画像メモリ41に記憶される(S60)。帳票PBの表面の画像PB1、PB2を図9(A)に示す。
2.次に、CPU42は、画像メモリ41に記憶された多値画像を二値化する(二値化手段、S61)。この二値化画像を図9(B)に示す。
3.ラベリング処理によって、2値画像の黒画素の連結成分を抽出する(ラベリング手段、S62)。黒画素の連結成分をそれに外接する長方形で表示したものを図9(C)に示す。
4.近接した連結成分をまとめて、行を抽出する(行抽出手段、S63)。抽出された行を長方形で表示したものを図9(D)に示す。
5.近接した行をまとめて、ブロックを抽出する(ブロック抽出手段、S64)。抽出されたブロックを点線で表示したものを図9(E)に示す。
6.抽出された各ブロックに含まれる行から、個々の文字を切り出す(S66)。
7.切り出された文字を、そのままの方向(正方向)で文字認識する(S69)。この正方向画像の文字認識結果を図9(F)に示す。また、同時に、当該切り出された文字を鏡像反転して裏文字として文字認識する(S67〜S68)。この、反転画像の文字認識結果を図9(G)に示す。
8.そのままの方向で認識した文字認識結果と鏡像反転した文字認識結果を比較する(比較手段)。比較の方法は、そのままの方向で認識した場合の平均類似度値S1と、鏡像反転して認識した場合の平均類似度値S2を比較して、下式(3)、(4)により、平均類似度知の大きい方を表側の文字と判定する方法を用いている(表裏判定手段、S70)。
S1≧S2・・・・(3)
S1<S2・・・・(4)
式(3)が成立する場合、当該ブロックは表側の文字と判定され(S71のNO)、式(4)が正立する場合(S71のYES)、当該ブロックは裏側の文字と判定される。
S1≧S2・・・・(3)
S1<S2・・・・(4)
式(3)が成立する場合、当該ブロックは表側の文字と判定され(S71のNO)、式(4)が正立する場合(S71のYES)、当該ブロックは裏側の文字と判定される。
9.裏写りと判断されたブロックの認識結果は、廃棄する(S73)。
10.表面と判断された認識結果は、出力する(S72)。
ここで、ステップS65及びステップS74は、この間に含まれるステップS66〜ステップS73が各ブロックに対して繰り返し行われることを意味する。この繰り返し処理によって、全てのブロックの処理が終了する。
本実施例4では、7において、文字画像をそのまま、および鏡像反転して文字認識したが、これを変形して、そのままの文字画像を通常の文字認識辞書と鏡像反転文字の文字認識辞書の両方で認識することにしても同じ結果が得られる。
PA 帳票
1 文字認識装置
2 表読取部
21 表証明
22 表読取面
23 表画像入力部
3 裏読取部
31 裏照明
33 裏画像入力部
4 文字認識部
7 搬送路
1 文字認識装置
2 表読取部
21 表証明
22 表読取面
23 表画像入力部
3 裏読取部
31 裏照明
33 裏画像入力部
4 文字認識部
7 搬送路
Claims (7)
- 帳票の表面及び裏面の画像を読み取る読取手段と、
この読取手段によって読み取られた画像データの中の文字認識の対象となるフィールドを前記帳票の種類毎に記憶する記憶手段と、
この記憶手段から読み込んで設定された前記フィールド毎に前記画像データの裏写りを検出する検出手段と、
この検出手段の検出結果に基づいて裏写りの有無を判定する判定手段と、
この判定手段による判定の結果、裏写りがあると判定されたフィールドに対して裏写り除去を行う裏写り除去手段と、
この裏写り除去手段による裏写り除去の結果得られた画像の文字認識を行う文字認識手段と
を備えたことを特徴とする文字認識装置。 - 帳票の表面及び裏面の画像を読み取る読取手段と、
この読取手段によって読み取られた画像データの中の文字認識の対象となるフィールドを前記帳票の種類毎に記憶する記憶手段と、
この記憶手段から読み込んで設定された前記フィールド毎に前記画像データの裏写り除去を行う裏写り除去手段と、
前記文字認識の対象となる前記フィールドの各々に対して、前記裏写り除去手段による裏写り除去を適用した第1画像と、裏写り除去を適用しない第2画像とを生成し、前記第1画像と前記第2画像を個々に文字認識する文字認識手段と、
この文字認識手段によって前記第1画像を文字認識した結果と、前記第2画像を文字認識した結果とを評価する評価手段と、
前記評価手段の結果に基づいて何れかの文字認識結果を選択する選択手段と
を備えたことを特徴とする文字認識装置。 - 帳票の表面及び裏面の画像を読み取る読取手段と、
この読取手段によって読み取られた画像データの中の文字認識の対象となるフィールドを前記帳票の種類毎に記憶する記憶手段と、
この記憶手段から読み込んで設定された前記フィールド毎に前記画像データに対して、複数の裏写りを除去する強度に設定して裏写り除去を複数回行う裏写り除去手段と、
この裏写り除去手段を適用して得られた複数画像に対して文字認識する文字認識手段と、
この文字認識手段の文字認識の結果を評価する評価手段と、
この評価手段の評価結果に基づいて何れかの文字認識結果を選択する選択手段と
を備えたことを特徴とする文字認識装置。 - 前記裏写り除去手段は、
前記読取手段によって読み取られた表面の画像及び裏面の画像をそれぞれA及びBとし、前記裏写り除去された画像をCとするとき、C=A−B×Kで表され、裏写りを除去する強度を示すパラメータKの値を0から所定値ずつ増やして設定した前記強度で裏写り除去することを特徴とする請求項3記載の文字認識装置。 - 帳票の表面の画像を読み取る読取手段と、
この読取手段によって読み取られた画像データから複数の文字ブロックを抽出するブロック抽出手段と、
このブロック抽出手段で抽出された文字ブロック毎に文字の切り出しを行うと共に、切り出された正方向文字と、この正方向文字を鏡像反転して得られた反転文字とを文字認識する文字認識手段と、
この文字認識手段の文字認識の結果に基づいて前記ブロック毎の裏写りの有無を判定する裏写り判定手段と、
この裏写り判定手段の判定の結果裏写りなしと判定された前記文字ブロックの認識結果を選択する選択手段と
を備えたことを特徴とする文字認識装置。 - 前記ブロック抽出手段は、
前記画像データを二値化する二値化手段と、
この二値化手段によって生成された2値画像の黒画素の連結成分を抽出して外接する長方形を生成するラベリング手段と、
このラベリング手段によって近接した連結成分をまとめて抽出する行抽出手段と、
この行抽出手段によって抽出された行をまとめてブロックを抽出するブロック抽出手段と
を備えたことを特徴とする請求項5記載の文字認識装置。 - 前記裏写り判定手段は、
前記各ブロック毎に前記正方向文字の平均類似度値と、前記反転文字の平均類似度値とを比較する比較手段と、
この比較手段による比較の結果、平均類似度値の大きい方を表側の文字と判定する表裏判定手段と
を備えたことを特徴とする請求項5記載の文字認識装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005030552A JP2006215964A (ja) | 2005-02-07 | 2005-02-07 | 文字認識装置 |
EP06002291A EP1705602A2 (en) | 2005-02-07 | 2006-02-03 | Character recognition apparatus |
US11/348,466 US20060177134A1 (en) | 2005-02-07 | 2006-02-07 | Character recognition apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005030552A JP2006215964A (ja) | 2005-02-07 | 2005-02-07 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006215964A true JP2006215964A (ja) | 2006-08-17 |
Family
ID=36353341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005030552A Pending JP2006215964A (ja) | 2005-02-07 | 2005-02-07 | 文字認識装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20060177134A1 (ja) |
EP (1) | EP1705602A2 (ja) |
JP (1) | JP2006215964A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009116520A (ja) * | 2007-11-05 | 2009-05-28 | Oki Electric Ind Co Ltd | 画像認識装置、画像認識方法及びプログラム |
JP2011090418A (ja) * | 2009-10-21 | 2011-05-06 | Toshiba Corp | 帳票読取装置およびプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5646744A (en) * | 1996-01-11 | 1997-07-08 | Xerox Corporation | Show-through correction for two-sided documents |
JPH09200455A (ja) * | 1996-01-19 | 1997-07-31 | Minolta Co Ltd | 読取り画像の濃度補正方法及び画像読取り装置 |
JPH09205544A (ja) * | 1996-01-26 | 1997-08-05 | Minolta Co Ltd | 読取り画像の修正方法及び画像読取り装置 |
US6101283A (en) * | 1998-06-24 | 2000-08-08 | Xerox Corporation | Show-through correction for two-sided, multi-page documents |
US6288798B1 (en) * | 1998-11-30 | 2001-09-11 | Xerox Corporation | Show-through compensation apparatus and method |
US7343049B2 (en) * | 2002-03-07 | 2008-03-11 | Marvell International Technology Ltd. | Method and apparatus for performing optical character recognition (OCR) and text stitching |
-
2005
- 2005-02-07 JP JP2005030552A patent/JP2006215964A/ja active Pending
-
2006
- 2006-02-03 EP EP06002291A patent/EP1705602A2/en not_active Withdrawn
- 2006-02-07 US US11/348,466 patent/US20060177134A1/en not_active Abandoned
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009116520A (ja) * | 2007-11-05 | 2009-05-28 | Oki Electric Ind Co Ltd | 画像認識装置、画像認識方法及びプログラム |
JP2011090418A (ja) * | 2009-10-21 | 2011-05-06 | Toshiba Corp | 帳票読取装置およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20060177134A1 (en) | 2006-08-10 |
EP1705602A2 (en) | 2006-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4323328B2 (ja) | 取り込み画像データから文字列を識別して抜出するシステムおよび方法 | |
CN110033471B (zh) | 一种基于连通域分析和形态学操作的框线检测方法 | |
US8947736B2 (en) | Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JP5600723B2 (ja) | 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム | |
JP2009169948A (ja) | 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体 | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
JP2009251800A (ja) | 紙葉類の汚れ検出装置及び汚れ検出方法 | |
JP2004265264A (ja) | 画像処理装置 | |
JP5847062B2 (ja) | 画像処理装置 | |
JP5697649B2 (ja) | 画像処理装置 | |
JP4565396B2 (ja) | 画像処理装置および画像処理プログラム | |
JP2004280334A (ja) | 画像読み取り装置 | |
JP2006215964A (ja) | 文字認識装置 | |
JP2005266907A (ja) | バーコード検出切り出し方法及びその装置、並びにプログラムを格納したコンピュータ読み取り可能な記録媒体 | |
JP5730274B2 (ja) | 画像処理装置 | |
JP5271956B2 (ja) | 原稿方向の検出方法及び装置 | |
JP4749382B2 (ja) | 2次元コード読取装置及びその方法 | |
JP5291387B2 (ja) | ナンバー認識装置およびナンバー認識方法 | |
JP5427828B2 (ja) | 2次元コード読取装置及びその方法 | |
CN113420579A (zh) | 标识码位置定位模型的训练及定位方法、装置、电子设备 | |
JP6144892B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2871590B2 (ja) | 画像抽出方式 | |
JP4890351B2 (ja) | 画像処理装置、画像処理プログラムおよび該画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに画像処理方法 | |
JP5262877B2 (ja) | ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体 |