JP2006215964A

JP2006215964A - 文字認識装置

Info

Publication number: JP2006215964A
Application number: JP2005030552A
Authority: JP
Inventors: Shunji Ariyoshi; 俊二有吉; Bunpei Irie; 文平入江; Takuma Akagi; 琢磨赤木; Tomoyuki Hamamura; 倫行浜村
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2005-02-07
Filing date: 2005-02-07
Publication date: 2006-08-17
Also published as: US20060177134A1; EP1705602A2

Abstract

【課題】文字が記入されるエリアに裏写りがある場合においても文字認識ができる文字認識装置を提供する。
【解決手段】帳票ＰＡの表面の画像が多値画像Ａとして画像メモリ４１に記憶される。一方、帳票ＰＡの裏面の画像が多値画像Ｂとして画像メモリ４４に記憶される。ＣＰＵ４２は、帳票フォーマットに基づいて、指定したフィールドの多値画像Ａ及び多値画像Ｂを抽出する。次に、抽出した多値画像に対して裏写りがあるかどうかを判定する。すなわち、指定したフィールドの裏面の多値画像で濃度値がＤ以上の画素の個数を数え、その個数がＮ以上の場合には裏写りがあると判断する。もし裏写りがあるフィールドに対しては、式（２）で示された方式で裏写り除去を行い、裏写りがない場合には、裏写り除去を行わない。次に、指定したフィールドに対して二値化処理を行い、各文字の画像を切り出し、文字認識辞書４５と照合することにより文字認識を行う。
【選択図】図１

Description

本発明は、帳票の裏に記入された文字による裏写りを除去する文字認識装置に関する。

文字認識装置は、文字の記入された帳票の画像をスキャナで読み込み、パターン認識技術を用いて記入された文字を読み取る装置である。

従来の文字認識装置は、文字認識装置のための専用帳票に記入された文字を読み取るように設計されていたが、近年では、機械で読み取ることを前提としない一般の帳票も文字認識装置で読み取ることが可能になってきている。

このような一般の帳票を上記文字認識装置で文字認識を行う場合、紙厚が薄い帳票の表面をスキャナで読み取る際、帳票の裏面に記入された文字・図形などが表面に透過（裏写り）してノイズとなり、文字認識性能を低下させる要因となっていた。

このような裏写りの要因を解決するために従来から多くの考案がなされてきた。例えば、帳票の裏面からの照明を消灯した際の画像と点灯した際の画像の差分によって裏写り除去する方法、及び帳票の表面の画像と裏面の画像の差分によって裏写り除去する方法として以下に示す２種類の方法が開示されている。

第1の方法を図１１、図１２を参照して説明する。図１１は、帳票の表面を読取る表画像入力部１２３と、帳票の表を照明する表照明１２１と、帳票の裏を照明する裏照明１３１とを備え、裏写りを防止する原稿読み取り装置である。この装置では、照明１２１を点灯し照明１３１を消灯した際に表画像入力部１２３から得られる画像をＡとし、照明１２１と照明１３１とを両方点灯した際に得られる画像をＢとすると、下式（１）により裏写り除去処理された画像Ｃが得られる。
Ｃ＝Ａ−（Ｂ−Ａ）×Ｋ・・・・(１)
ただし、Ｋは係数である。

図１２は、図１１に示す裏写り除去の原理を説明する図である。この図は各画像の１本の走査線上の信号波形を表示したものである。

図１２（Ａ）は、裏照明１３１を消灯した場合の画像Ａの波形である。この波形の中央部分の低いピークが裏写りを表しているものとする。

図１２（Ｂ）は、裏照明１３１を点灯した場合の画像Ｂの波形である。この波形では裏面からの照明の効果により裏写り部分が強調されている。

図１２（Ｃ）は、両方の画像の差である画像Ｂ−画像Ａの波形である。この波形では裏写り部分のみが抽出されている。

図１２（Ｄ）は、図１２（Ａ）の波形から、図１２（Ｃ）の波形をＫ倍して引き算して得られた補正画像Ｃの波形である。このようにして、裏写り部分が除去された波形が得られる（例えば、特許文献１参照。）。

第２の方法を図１３、図１４を参照して説明する。図１３は、帳票の表面の画像と裏面の画像の差分によって裏写りを防止する画像処理装置である。すなわち、図１３に示した装置で、表画像入力部１２３から表面の画像Ａを入力し、裏画像入力部１３３から裏面の画像Ｂを入力したとすると、下式（２）により裏写り除去された画像Ｃが得られる。
Ｃ＝Ａ−Ｂ×Ｋ・・・・・(２)
ただし、Ｋは係数である。

図１４は、図１３に示す裏写りを防止する画像処理装置の原理を説明する図である。この図は各画像の１本の走査線上の信号波形を表示したものである。

図１４（Ａ）は、表画像入力部１２３から入力した表面画像Ａの波形である。この波形の中央部分の低いピークが裏面画像Ｂが裏写りした画像を表しているものとする。

図１４（Ｂ）は、裏画像入力部１３３から入力した裏面画像Ｂの波形である。この波形の両端の低いピークが表面画像Ａが裏写りした画像である。

図１４（Ｃ）は、図１４（Ａ）の波形から、図１４（Ｂ）の波形をＫ倍して引き算して得られた補正画像Ｃの波形である。このようにして、裏写り除去処理された波形が得られる（例えば、特許文献２参照。）。
特開平９−１３５３４４号公報（第１−４頁、図１）特開２００３−７８７６６号公報（第１−４頁、図５）

しかしながら、特許文献１記載の原稿読取装置又は特許文献２記載の画像処理装置は、主にコピー機にて裏写りのない画像を印刷することを目的としている。しかし、このような方法を文字認識装置に適用しようとすると、以下のような問題点が生じる
第1に、裏写り除去処理を行うことによってかえって画質が悪化する場合がある。上で述べた裏写り除去処理では、画像全面に対して減算処理が行われるため、裏写りのない部分にも余計な処理が加わり、かえって画質が悪くなり、文字認識性能が低下する可能性がある。また、裏写りのある部分においても、必要以上に画像の除去が行われたり、裏写りの除去が不完全であったりして、性能が劣化する可能性があるという問題がある。

第２に、上で述べた裏写り除去処理では、画像全面に対して処理が行われるため、多くの処理時間を必要とするという問題がある。

本発明は、上記問題を解決するためになされたもので、文字が記入されるエリアに対してのみ裏写り除去処理を行うことによって、裏写りがある場合においても高性能に文字認識ができる文字認識装置を提供する。

上記目的を達成するために、本発明の請求項１記載の文字認識装置は、帳票の表面及び裏面の画像を読み取る読取手段と、この読取手段によって読み取られた画像データの中の文字認識の対象となるフィールドを前記帳票の種類毎に記憶する記憶手段と、この記憶手段から読み込んで設定された前記フィールド毎に前記画像データの裏写りを検出する検出手段と、この検出手段の検出結果に基づいて裏写りの有無を判定する判定手段と、前記判定手段の結果、裏写りがあると判定されたフィールドに対して裏写り除去を行う裏写り除去手段と、この裏写り除去手段の結果得られた画像の文字認識を行う文字認識手段とを備えたことを特徴とする。

また、本発明の請求項２記載の文字認識装置は、帳票の表面及び裏面の画像を読み取る読取手段と、この読取手段によって読み取られた画像データの中の文字認識の対象となるフィールドを前記帳票の種類毎に記憶する記憶手段と、この記憶手段から読み込んで設定された前記フィールド毎に前記画像データの裏写り除去を行う裏写り除去手段と、前記文字認識の対象となる前記フィールドの各々に対して、前記裏写り除去手段を適用した第1画像と、裏写り除去を適用しない第２画像とを生成し、前記第1画像と前記第２画像を個々に文字認識する文字認識手段と、この文字認識手段によって前記第1画像を文字認識した結果と、前記第２画像を文字認識した結果とを評価する評価手段と、前記評価手段の結果に基づいて何れかの文字認識結果を選択する選択手段とを備えたことを特徴とする。

さらに、本発明の請求項３記載の文字認識装置は、帳票の表面及び裏面の画像を読み取る読取手段と、この読取手段によって読み取られた画像データの中の文字認識の対象となるフィールドを前記帳票の種類毎に記憶する記憶手段と、この記憶手段から読み込んで設定された前記フィールド毎に前記画像データに対して、複数の強度に設定して裏写り除去を複数回行う裏写り除去手段と、この裏写り除去手段を適用して得られた複数画像に対して文字認識する文字認識手段と、この文字認識手段の文字認識の結果を評価する評価手段と、この評価手段の評価結果に基づいて何れかの文字認識結果を選択する選択手段とを備えたことを特徴とする。

さらにまた、本発明の請求項５記載の文字認識装置は、帳票の表面の画像を読み取る読取手段と、この読取手段によって読み取られた画像データから複数の文字ブロックを検出するブロック抽出手段と、前記検出手段で検出された文字ブロック毎に文字切り出し手段によって切り出された正方向文字と、この正方向画像を鏡像反転して得られた反転文字とを文字認識する文字認識手段と、この文字認識手段の文字認識の結果に基づいて前記ブロック毎の裏写りを判定する裏写り判定手段と、この裏写り判定手段の判定の結果裏写りなしと判定された前記文字ブロックの認識結果を選択する選択手段とを備えたことを特徴とする。

本発明によれば、文字が記入されるエリアに対してのみ裏写り除去処理を行うことによって、裏写りがある場合においても高性能に文字認識ができる文字認識装置を提供することができる。

以下、図面を参照して本発明の実施例を説明する。

図１は、本発明の実施例１による文字認識装置（以下、装置と称する）１の構成を示す図である。

装置１は、帳票ＰＡを搬送する搬送部７、この搬送部７によって搬送された帳票ＰＡの表面を読み取る表読取部（読取手段）２、帳票ＰＡの裏面を読み取る裏読取部（読取手段）３、表読取部２及び裏読取部３によって読み取られた画像データの文字を認識する文字認識部４を備えている。

表読取部（読取手段）２には、搬送路７によって図示矢マークＡ方向に搬送される帳票ＰＡの表読取面２２を照射する表照明２１が設けられており、さらに、この表照明２１によって照射された表読取面２２のデータを１ライン毎に読み取る表画像入力部２３が設けられている。この表画像入力部２３によって読み取られた画像データは、文字認識部４の画像メモリ４１に記憶される。

裏読取部３（読取手段）には、帳票ＰＡの裏読取面（図示しない）を照射する裏照明３１が設けられており、さらに、この裏照明３１によって照射された裏読取面のデータを１ライン毎に読み取る裏画像入力部３３が設けられている。裏画像入力部３３で読み取られた画像データは、文字認識部４の画像メモリ４４に記憶される。

文字認識部（文字認識手段）４には、帳票フォーマットデータベース（記憶手段）４３、文字認識辞書４５、画像メモリ４１、画像メモリ４４、ＣＰＵ（Central Processing Unit）４２が設けられている。

帳票フォーマットデータベース４３は、後述する帳票フォーマットの文字認識の対象となるエリアを設定するフィールドデータが記憶されているデータベースである。

文字認識辞書４５には、帳票に記入された文字を認識するための文字認識用の辞書が記憶されている。

ＣＰＵ４２は、帳票フォーマットデータベース４３から該当する帳票フォーマットの、文字認識の対象となるフィールドデータを読み出し、この読み出したフィールドデータに基づいて画像メモリ４１、４２内の文字認識すべきエリアを設定する。さらに、このようにして設定されたエリア内の文字と、文字認識辞書４５とを、例えば類似度法などを用いて文字認識を行う。

図２は、装置１の読み取り対象となる帳票ＰＡの帳票フォーマットの一例である。この帳票ＰＡに、例えば名前及び住所が記入されている場合について説明する。

名前エリアは、姓エリアＰＡ１及び名エリアＰＡ２で構成される。住所エリアは、都道府県エリアＰＡ３、市区郡エリアＰＡ４、町村エリアＰＡ５、丁目・番地・号エリアＰＡ６で構成される。

図３は、図２の帳票に関して、例えば都道府県エリアＰＡ３に裏写り画像（「星」マーク）のある表面及び裏面の画像を示している。

図３（Ａ）は、帳票ＰＡの都道府県エリアＰＡ３を表読取部２で読み取った場合の読取画像で、表面の読取画像である「神奈川県」と、裏写り画像である「星」マークとが読み取られた状態を示す。

図３（Ｂ）は、帳票ＰＡの都道府県エリアＰＡ３を裏読取部３で読み取った場合の読取画像で、裏面の読取画像である「星」マークと、裏写り画像である「神奈川県」とが反転して読み取られた状態を示す。

図３（Ｃ）は、図３（Ａ）の読取画像から裏写り画像を削除した画像で、本実施例の目的とする画像データである（詳細は、後述する。）。

図４は、本発明の実施例１の処理手順を示すフローチャートである。以下に示す１．〜８．の順に説明する。

１．まず、文字認識部４のＣＰＵ４２は、図２に示す帳票ＰＡの帳票フォーマットを帳票フォーマットデータベース（記憶手段）４３から読み出す（Ｓ１）。

この帳票フォーマットには、帳票内の読み取るべきエリアの位置座標を示すフィールドが複数個、登録されている。図２の例で言えば、姓エリアＰＡ１に対応する姓のフィールド、名エリアＰＡ２に対応する名のフィールド、都道府県エリアＰＡ３に対応する都道府県のフィールド、市区郡エリアＰＡ４に対応する市区郡のフィールド、町村エリアＰＡ５に対応する町村のフィールド、丁目・番地・号エリアＰＡ６に対応する丁目・番地・号のフィールドなど、帳票ＰＡ内における各々の位置座標が登録されている。

２．次に、この帳票の表面の画像が表読取部（読取手段）２の表画像入力部２３から入力され、多値画像Ａとして文字認識部４内の画像メモリ４１に記憶される。一方、帳票ＰＡの裏面の画像は裏読取部（読取手段）３の裏画像入力部３３から入力され、多値画像Ｂとして文字認識部４内の画像メモリ４４に記憶される。

３．ＣＰＵ４２は帳票フォーマットに基づいて、画像メモリ４１から指定したフィールドの画像を抽出する（Ｓ３）。図３（Ａ）は、このようにして、例えば都道府県フィールドの表面画像を抽出した例である。この図では、「星」マークが裏写りしている状態を示している。

４．同様にＣＰＵ４２は帳票フォーマットに基づいて、画像メモリ４４から指定したフィールドの裏面の画像を抽出する。図３（Ｂ）は、このようにして、例えば都道府県フィールドの裏面画像を抽出した例である（Ｓ４）。この図では、「星」マークがはっきりと見え、表面に記入された「神奈川県」文字列が反転して裏写りしている。

５．次に、ＣＰＵ４２は、指定したフィールドに対して、裏写りがあるかどうかを検出する。この検出方法は、指定したフィールドの裏面の画像で濃度値が設定値Ｄ以上の画素の個数を数える方法である（検出手段、Ｓ６）。また、この検出手段の検出結果、その個数が設定値Ｎ以上の場合には裏写りがあると判定する（判定手段、Ｓ７）。

６．もし裏写りがあると判定されたフィールドに対しては（Ｓ７のＹＥＳ）、上式（２）で示された方式で裏写り除去処理を行う（裏写り除去手段、Ｓ８）。図３（Ｃ）に都道府県フィールドの裏写りを除去した例を示す。一方、もし、裏写りがないと判定された場合には（Ｓ７のＮＯ）、当該フィールドに対しては裏写り除去処理を行わない。

７．次に、指定したフィールドの画像に対して二値化処理を行い、各文字の画像を切り出し、切り出された文字画像を文字認識辞書４５と照合することにより文字認識を行う（文字認識手段、Ｓ９）。

８．最後に文字認識の結果を出力する（Ｓ１０）。

ここで、ステップＳ５及びステップＳ１１は、この間に含まれるステップＳ６〜ステップＳ１０が各フィールドの画像に対して繰り返し行われることを意味する。この繰り返し処理によって、全てのフィールドの画像処理が終了する。

以上の説明においては、指定したフィールドの画像に対して、裏写り検出ステップ（Ｓ６）から文字認識するステップ（Ｓ１０）までの処理を行い、この処理を全てのフィールドの画像に対して繰り返す方法を説明したが、各ステップ毎に全てのフィールドの画像に対して処理する方法を用いても同じ結果が得られるのは当然である。

さらに、ステップＳ２及びステップＳ１２は、この間に含まれるステップＳ３〜ステップＳ１１までの処理が、搬送される帳票ＰＡに対して繰り返して行われることを意味する。従って、この繰り返し処理により、搬送される複数の帳票ＰＡが全て同様に処理される。

本実施例１では、背景技術に示す第２の方法に基づく裏写り除去処理を用いたが、背景技術に示す第1の方法を用いても同様に実現できる。背景技術に示す第1の方法を用いる場合には、裏写りがあるかどうかの判定は以下の手順で行う。すなわち、各フィールドについて、裏面からの照明を消灯して得られる画像をＡとし、点灯して得られる画像をＢとすると、画像Ｂ−Ａの画素値が閾値Ｄ以上の画素の個数を数え、その個数が閾値Ｎ以上のとき裏写りがあると判断する。

図５は、本発明の実施例２の処理手順を示すフローチャートである。本実施例２の文字認識装置の構成は、実施例１の図１と同様である。また、読み取り対象となる帳票も同様である（図２参照）。以下に示す１．〜９．の順に説明する。

１．まず、文字認識部４のＣＰＵ４２は、図２に示す帳票ＰＡの帳票フォーマットを帳票フォーマットデータベース（記憶手段）４３から読み出す（Ｓ２０）。

この帳票フォーマットには、帳票内の読み取るべきフィールドの位置が複数個、登録されている。図２の例で言えば、姓エリアＰＡ１に対応する姓のフィールド、名エリアＰＡ２に対応する名のフィールド、都道府県エリアＰＡ３に対応する都道府県のフィールド、市区郡エリアＰＡ４に対応する市区郡のフィールド、町村エリアＰＡ５に対応する町村のフィールド、丁目・番地・号エリアＰＡ６に対応する丁目・番地・号のフィールドなど、帳票ＰＡ内における各々の位置座標が登録されている。

３．ＣＰＵ４２は帳票フォーマットに基づいて、画像メモリ４１の中の指定したフィールドの表画像を抽出する（Ｓ２２）。図３（Ａ）は、このようにして、例えば都道府県フィールドの表面画像を抽出した例である。この図では、「星」マークが裏写りしている状態を示している。

４．同様にＣＰＵ４２は帳票フォーマットに基づいて、画像メモリ４４から指定したフィールドの裏面の画像を抽出する。図３（Ｂ）は、このようにして、例えば都道府県フィールドの裏面画像を抽出した例である（Ｓ２３）。この図では、「星」マークがはっきりと見え、表面に記入された「神奈川県」文字列が裏写りしている。

５．次に、ＣＰＵ４２は、指定したフィールドに対して、背景技術に示す第２の方法を用いて裏写り除去を行い、裏写り除去されたフィールドの画像（第1画像）を画像メモリ４１に記憶する（裏写り除去手段）。このようにして、実施例１同様、図３（Ｃ）に示すように都道府県フィールドの裏写りが除去できる。

６．裏写り処理を実施したフィールド画像に対して二値化処理を行い、各文字の画像を切り出し、切り出された文字画像を文字認識辞書と照合することにより文字認識を行う（文字認識手段、Ｓ２６）。

７．次に、裏写り除去処理を適用しないフィールドの画像（第２画像）に対して二値化処理を行い、各文字の画像を切り出し、切り出された文字画像を文字認識辞書と照合することにより文字認識を行う（文字認識手段、Ｓ２７）。

８．次に、裏写り処理を実施したフィールド画像に対して文字認識を行った結果（Ｓ２６）と、裏写り処理を実施しないフィールド画像に対して文字認識を行った結果（Ｓ２７）とを比較して（評価手段）、妥当と判断される方を最終的な文字認識結果として選択する（選択手段）。判断する基準は、例えば、文字認識結果の類似度の平均値が大きい方を選択すればよい。また、単語辞書４６と照合して文字認識結果が単語辞書にヒットした方を選択する方法もある（Ｓ２８）。ここでいう単語辞書とは、本実施例の、例えば「都道府県」のように限られた言語だけ現れることがわかっている場合に適用できる。

９．最後に文字認識の結果を出力する（Ｓ２９）。

ここで、ステップＳ２１及びステップＳ３０は、この間に含まれるステップＳ２２〜ステップＳ２９が各フィールドに対して繰り返し行われることを意味する。この繰り返し処理によって、全てのフィールドの処理が終了する。

以上の説明においては、指定したフィールドに対して、裏写り検出ステップ（Ｓ２５）から認識結果出力ステップ（Ｓ２９）までの処理を行い、この処理を全てのフィールドに対して繰り返す方法を説明したが、各ステップ毎に全てのフィールドに対して処理する方法を用いても同じ結果が得られるのは当然である。

さらに、ステップＳ２１及びステップＳ３１は、この間に含まれるステップＳ２２〜ステップＳ３０までの処理が、搬送される帳票ＰＡに対して繰り返して行われることを意味する。従って、この繰り返し処理により、搬送される複数の帳票ＰＡが全て同様に処理される。

本実施例２では、背景技術に示す第２の方法に基づく裏写り除去処理を用いたが、背景技術に示す第1の方法を用いても同様に実現できる。

図６は、本発明の実施例３の処理手順を示すフローチャートである。本実施例３の文字認識装置の構成は、実施例１の図１と同様である。また、読み取り対象となる帳票も同様である（図２参照）。以下に示す１．〜８．の順に説明する。

１．まず、文字認識部４のＣＰＵ４２は、図２に示す帳票ＰＡの帳票フォーマットを帳票フォーマットデータベース（記憶手段）４３から読み出す（Ｓ４０）。

３．ＣＰＵ４２は帳票フォーマットに基づいて、画像メモリ４１から指定したフィールドの表画像を抽出する（Ｓ４２）。図３（Ａ）は、このようにして、例えば都道府県フィールドの表面画像を抽出した例である。この図では、「星」マークが裏写りしている状態を示している。

４．同様にＣＰＵ４２は帳票フォーマットに基づいて、画像メモリ４４から指定したフィールドの裏面の画像を抽出する（Ｓ４３）。図３（Ｂ）は、このようにして、例えば都道府県フィールドの裏面画像を抽出した例である。この図では、「星」マークがはっきりと見え、表面に記入された「神奈川県」文字列が裏写りしている。

５．次に、ＣＰＵ４２は、指定されたフィールドの画像に対して、背景技術に示す第２の方法を用いて裏写り除去を行う。本実施例の場合には、上式（２）のパラメタＫを変化させて複数種類の裏写り除去画像を生成する（裏写り除去手段、Ｓ４６）。ここで、パラメータＫは、裏移りを除去する強度を示すパラメータで、例えば、Ｋ＝０（これは裏写り除去をしない場合に相当する）、０．１、０．２、０．３の４種類の値を用いて裏写り除去処理を行う（裏写り除去手段、Ｓ４６）。ここで、適切なＫが選ばれた場合には、実施例１、実施例２同様、図３（Ｃ）に示すように都道府県フィールドの裏写りが除去できる。

６．次に、裏写り除去された複数の画像のそれぞれに対して二値化処理を行い、各文字の画像を切り出し、切り出された文字画像を文字認識辞書４５と照合することにより文字認識を行う（文字認識手段、Ｓ４７）。

７．得られた複数の文字認識結果を比較して（評価手段）、最も妥当と判断されるものを最終的な文字認識結果として選択する（選択手段）。判断する基準は、例えば、文字認識結果の類似度の平均値が最大の結果を選択すればよい。また、上述した単語辞書４６と照合して文字認識結果が単語辞書に最も高い類似度でヒットした結果を選択する方法もある。

８．最後に文字認識の結果を出力する。

ここで、ステップＳ４１及びステップＳ５１は、この間に含まれるステップＳ４２〜ステップＳ５０が各フィールドの画像に対して繰り返し行われることを意味する。この繰り返し処理によって、全てのフィールドの画像処理が終了する。

以上の説明においては、指定したフィールの画像に対して、裏写り検出ステップ（Ｓ４６）から認識結果出力ステップ（Ｓ５０）までの処理を行い、この処理を全てのフィールドに対して繰り返す方法を説明したが、各ステップ毎に全てのフィールドの画像に対して処理する方法を用いても同じ結果が得られるのは当然である。

さらに、ステップＳ４１及びステップＳ５２は、この間に含まれるステップＳ４１〜ステップＳ５１までの処理が、搬送される帳票ＰＡに対して繰り返して行われることを意味する。従って、この繰り返し処理により、搬送される複数の帳票ＰＡが全て同様に処理される。

本実施例３では、背景技術に示す第２の方法に基づく裏写り除去処理を用いたが、背景技術に示す第1の方法を用いても同様に実現できる。

図７は、本実施例４の文字認識装置１の構成を示す図である。この実施例４では、図１に示す裏読取部３が設けられていないが、その他の部分は図１と同様である。従って、図１と同一部分には同一符号を付け、その説明を省略し、異なる部分の説明を行う。

図８は、装置１の読み取り対象となる帳票ＰＢの一例である。この帳票ＰＢは、実施例１のような記入枠が固定した帳票フォーマットではなく記載位置が自由な形式であるものと仮定している。また、この帳票ＰＢには裏面にも同様な記入欄があるため、裏面に記入された住所・氏名が表に透けてみえているものとする。図８には、以上の条件のもとに、表面に記載した住所・氏名ＰＢ１、及び裏面に記載した住所・氏名ＰＢ２が示してある。

図９は、本実施例４の処理の流れを説明する図である。図１０は、実施例４の処理手順を示すフローチャートである。以下に示す１．〜１０．の順に説明する。

１．まず、帳票ＰＢの表面の画像ＰＢ１、ＰＢ２が表読取部（読取手段）２の表画像入力部２３から入力され、多値画像として文字認識部４内の画像メモリ４１に記憶される（Ｓ６０）。帳票ＰＢの表面の画像ＰＢ１、ＰＢ２を図９（Ａ）に示す。

２．次に、ＣＰＵ４２は、画像メモリ４１に記憶された多値画像を二値化する（二値化手段、Ｓ６１）。この二値化画像を図９（Ｂ）に示す。

３．ラベリング処理によって、２値画像の黒画素の連結成分を抽出する（ラベリング手段、Ｓ６２）。黒画素の連結成分をそれに外接する長方形で表示したものを図９（Ｃ）に示す。

４．近接した連結成分をまとめて、行を抽出する（行抽出手段、Ｓ６３）。抽出された行を長方形で表示したものを図９（Ｄ）に示す。

５．近接した行をまとめて、ブロックを抽出する（ブロック抽出手段、Ｓ６４）。抽出されたブロックを点線で表示したものを図９（Ｅ）に示す。

６．抽出された各ブロックに含まれる行から、個々の文字を切り出す（Ｓ６６）。

７．切り出された文字を、そのままの方向（正方向）で文字認識する（Ｓ６９）。この正方向画像の文字認識結果を図９（Ｆ）に示す。また、同時に、当該切り出された文字を鏡像反転して裏文字として文字認識する（Ｓ６７〜Ｓ６８）。この、反転画像の文字認識結果を図９（Ｇ）に示す。

８．そのままの方向で認識した文字認識結果と鏡像反転した文字認識結果を比較する（比較手段）。比較の方法は、そのままの方向で認識した場合の平均類似度値Ｓ１と、鏡像反転して認識した場合の平均類似度値Ｓ２を比較して、下式（３）、（４）により、平均類似度知の大きい方を表側の文字と判定する方法を用いている（表裏判定手段、Ｓ７０）。
Ｓ１≧Ｓ２・・・・（３）
Ｓ１＜Ｓ２・・・・（４）
式（３）が成立する場合、当該ブロックは表側の文字と判定され（Ｓ７１のＮＯ）、式（４）が正立する場合（Ｓ７１のＹＥＳ）、当該ブロックは裏側の文字と判定される。

９．裏写りと判断されたブロックの認識結果は、廃棄する（Ｓ７３）。

１０．表面と判断された認識結果は、出力する（Ｓ７２）。

ここで、ステップＳ６５及びステップＳ７４は、この間に含まれるステップＳ６６〜ステップＳ７３が各ブロックに対して繰り返し行われることを意味する。この繰り返し処理によって、全てのブロックの処理が終了する。

本実施例４では、７において、文字画像をそのまま、および鏡像反転して文字認識したが、これを変形して、そのままの文字画像を通常の文字認識辞書と鏡像反転文字の文字認識辞書の両方で認識することにしても同じ結果が得られる。

本発明の実施例１による文字認識装置の構成を示す図。図１の読み取り対象となる帳票フォーマットの一例を示す図。裏写りのあるフィールドの表面及び裏面の画像を示す図。本発明の実施例１の処理手順を示すフローチャート。本発明の実施例２の処理手順を示すフローチャート。本発明の実施例３の処理手順を示すフローチャート。本発明の実施例４による文字認識装置の構成を示す図。実施例４の読み取り対象となる帳票の一例を示す図。実施例４の処理を説明する図。実施例４の処理手順を示すフローチャート。従来技術の裏写りを防止する原稿読み取り装置を説明する図。図１１に示す裏写りを防止する原稿読み取り装置の原理を説明する図。従来技術の裏写りを防止する画像処理装置を説明する図。図１３に示す裏写りを防止する画像処理装置の原理を説明する図。

符号の説明

ＰＡ帳票
１文字認識装置
２表読取部
２１表証明
２２表読取面
２３表画像入力部
３裏読取部
３１裏照明
３３裏画像入力部
４文字認識部
７搬送路

Claims

帳票の表面及び裏面の画像を読み取る読取手段と、
この読取手段によって読み取られた画像データの中の文字認識の対象となるフィールドを前記帳票の種類毎に記憶する記憶手段と、
この記憶手段から読み込んで設定された前記フィールド毎に前記画像データの裏写りを検出する検出手段と、
この検出手段の検出結果に基づいて裏写りの有無を判定する判定手段と、
この判定手段による判定の結果、裏写りがあると判定されたフィールドに対して裏写り除去を行う裏写り除去手段と、
この裏写り除去手段による裏写り除去の結果得られた画像の文字認識を行う文字認識手段と
を備えたことを特徴とする文字認識装置。
帳票の表面及び裏面の画像を読み取る読取手段と、
この読取手段によって読み取られた画像データの中の文字認識の対象となるフィールドを前記帳票の種類毎に記憶する記憶手段と、
この記憶手段から読み込んで設定された前記フィールド毎に前記画像データの裏写り除去を行う裏写り除去手段と、
前記文字認識の対象となる前記フィールドの各々に対して、前記裏写り除去手段による裏写り除去を適用した第1画像と、裏写り除去を適用しない第２画像とを生成し、前記第1画像と前記第２画像を個々に文字認識する文字認識手段と、
この文字認識手段によって前記第1画像を文字認識した結果と、前記第２画像を文字認識した結果とを評価する評価手段と、
前記評価手段の結果に基づいて何れかの文字認識結果を選択する選択手段と
を備えたことを特徴とする文字認識装置。
帳票の表面及び裏面の画像を読み取る読取手段と、
この読取手段によって読み取られた画像データの中の文字認識の対象となるフィールドを前記帳票の種類毎に記憶する記憶手段と、
この記憶手段から読み込んで設定された前記フィールド毎に前記画像データに対して、複数の裏写りを除去する強度に設定して裏写り除去を複数回行う裏写り除去手段と、
この裏写り除去手段を適用して得られた複数画像に対して文字認識する文字認識手段と、
この文字認識手段の文字認識の結果を評価する評価手段と、
この評価手段の評価結果に基づいて何れかの文字認識結果を選択する選択手段と
を備えたことを特徴とする文字認識装置。
前記裏写り除去手段は、
前記読取手段によって読み取られた表面の画像及び裏面の画像をそれぞれＡ及びＢとし、前記裏写り除去された画像をＣとするとき、Ｃ＝Ａ−Ｂ×Ｋで表され、裏写りを除去する強度を示すパラメータＫの値を０から所定値ずつ増やして設定した前記強度で裏写り除去することを特徴とする請求項３記載の文字認識装置。
帳票の表面の画像を読み取る読取手段と、
この読取手段によって読み取られた画像データから複数の文字ブロックを抽出するブロック抽出手段と、
このブロック抽出手段で抽出された文字ブロック毎に文字の切り出しを行うと共に、切り出された正方向文字と、この正方向文字を鏡像反転して得られた反転文字とを文字認識する文字認識手段と、
この文字認識手段の文字認識の結果に基づいて前記ブロック毎の裏写りの有無を判定する裏写り判定手段と、
この裏写り判定手段の判定の結果裏写りなしと判定された前記文字ブロックの認識結果を選択する選択手段と
を備えたことを特徴とする文字認識装置。
前記ブロック抽出手段は、
前記画像データを二値化する二値化手段と、
この二値化手段によって生成された２値画像の黒画素の連結成分を抽出して外接する長方形を生成するラベリング手段と、
このラベリング手段によって近接した連結成分をまとめて抽出する行抽出手段と、
この行抽出手段によって抽出された行をまとめてブロックを抽出するブロック抽出手段と
を備えたことを特徴とする請求項５記載の文字認識装置。
前記裏写り判定手段は、
前記各ブロック毎に前記正方向文字の平均類似度値と、前記反転文字の平均類似度値とを比較する比較手段と、
この比較手段による比較の結果、平均類似度値の大きい方を表側の文字と判定する表裏判定手段と
を備えたことを特徴とする請求項５記載の文字認識装置。