JP5871116B2 - 画像処理装置、方法、およびプログラム - Google Patents

画像処理装置、方法、およびプログラム Download PDF

Info

Publication number
JP5871116B2
JP5871116B2 JP2011192689A JP2011192689A JP5871116B2 JP 5871116 B2 JP5871116 B2 JP 5871116B2 JP 2011192689 A JP2011192689 A JP 2011192689A JP 2011192689 A JP2011192689 A JP 2011192689A JP 5871116 B2 JP5871116 B2 JP 5871116B2
Authority
JP
Japan
Prior art keywords
image
image data
dimensional symbol
raw
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011192689A
Other languages
English (en)
Other versions
JP2013054555A (ja
Inventor
青木 淳
淳 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011192689A priority Critical patent/JP5871116B2/ja
Publication of JP2013054555A publication Critical patent/JP2013054555A/ja
Application granted granted Critical
Publication of JP5871116B2 publication Critical patent/JP5871116B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明は、画像の読み取り装置および方法に関し、特に、OCR(optical character reader)サーバにおいて低品質画像を読み取る、画像処理装置、方法およびプログラムに関する。
従来のOCRサーバでの画像の読み取り方法では、次に述べるような問題があった。すなわち、問題は、画像データからスキャンに用いたスキャナ装置の機種やスキャン方式、スキャナ装置のタイプ(フラットベッド型スキャナ、搬送型スキャナ、非接触型スキャナ)を識別できず、混在する低品質画像を正しく読み取ることができないことである。
また、画像の読み取り実行前に、すべての画像データに対して画像補正を行う方法も知られている。しかしながら、この方法では、画像補正不要な高品質画像に対しても補正処理を行うため、処理時間が増加するという問題がある。
一方、低品質画像の読み取りは、従来から行われている。例えば、従来の読み取り方法の一例が、特開2007−41709号公報(特許文献1)に記載されている。
特許文献1では、あらかじめ帳票内に使用するスキャナの情報を含んだ二次元シンボル(二次元バーコード)等の識別子を印刷しておき、画像の読み取りの際は、この二次元シンボル(識別子)の内容を用いて読み取り処理に適した画像を生成している。
特開2007−41709公報
しかしながら、この特許文献1に開示された技術では、次のような問題が解決されていない。
第1の問題は、帳票内にスキャナ情報を含んだ二次元シンボル(識別子)の印刷がない場合、読み取り処理に適した画像を生成できないことである。
第2の問題は、帳票内に印字されたスキャナ情報を含む二次元シンボル(識別子機)の内容が、実際に使用したスキャナ装置・設定などと異なる場合、読み取り処理に適さない画像が生成されてしまうことである。
本発明の目的は、以上の問題点を解決し、低品質画像の読み取りが可能な、画像処理装置、方法、およびプログラムを提供することにある。
本発明の画像処理装置は、複数種類の識別子中の少なくも1つの識別子を含む画像を読み取って、生の画像データを出力する読取手段と、この生の画像データの中から読み取った識別子データに基づいて、当該生の画像データの画像品質を判定する判定手段と、この判定手段において生の画像データの画像品質が低品質と判定された場合にのみ、当該生の画像データを補正して、補正した画像データを出力する補正手段と、生の画像データ又は補正した画像データを認識処理して、認識結果を出力する認識処理手段と、を有し、上記複数種類の識別子が、二次元シンボル、一次元シンボル、および英数字活字の中の、少なくとも2つからなり、上記画像が、上記識別子として上記二次元シンボルを含む場合、上記判定手段は、 読み取った二次元シンボルデータをデコード処理して、第1の画質判定値を出力する二次元シンボルデコード部と、第1の画質判定値があらかじめ設定した第1の閾値より大きい場合に、生の画像データの画像品質を低品質と判定して、二次元シンボルの領域の背景濃度が一定となるように画像補正処理を行う第1の画質判定・補正部と、を含む
本発明によれば、読み取り画像の中に低品質画像が混入した場合でも、画像の読み取りができる。
本発明の第1の実施形態による低品質画像の読み取り方法が適用される画像処理装置を示すブロック図である。 図1に示した画像処理装置の動作を説明するためのフローチャートである。 画像内に含まれる帳票領域を検出する動作を説明するための図である。 帳票種別を識別する動作を説明するための図である。 帳票内に読み取り対象となる二次元シンボルが存在する場合、デコードを行う動作を説明するための図である。 二次元シンボルを含む矩形領域の背景濃度が一定となるよう画像補正処理を行う動作を説明するための図である。 帳票内に読み取り対象となる一次元シンボルが存在する場合、デコードを行う動作を説明するための図である。 一次元シンボルの品質を数値化する動作を説明するための図である。 一次元シンボルを含む矩形領域の背景濃度が一定となるよう画像補正処理を行う動作を説明するための図である。 帳票内に読み取り対象となる英数字活字が存在する場合、読み取りを行う動作を説明するための図である。 文字パタンの切り出し座標を取得し、文字パタンの高さ変動(分散)を求める動作を説明するための図である。 英数字活字領域の背景濃度が一定となるように画像補正処理を行う動作を説明するための図である。
最初に、本発明の特徴について説明する。
本発明では、不特定多数のスキャナ装置で入力した定型帳票の多値画像を、OCRサーバで読み取る方法において、スキャナ装置のタイプ(フラットベッド型スキャナ、搬送型スキャナ、非接触型スキャナ)にかかわらず、読み取り可能にする。
本発明の実施形態は、帳票(画像)に印字された二次元シンボル、一次元シンボル、および、英数字活字を先に読み取り、その結果から帳票(画像)の画像品質を判定して低品質画像のみ補正を行うことで、低品質画像混在、および、画像補正による処理時間増加の影響を吸収することを特徴とする、OCRサーバにおける低品質画像の読み取り方法である。
次に、本発明の実施形態の構成について、図面を参照して詳細に説明する。
図1は、本発明の実施形態に係る、低品質画像の読み取り方法が適用される画像処理装置を示すブロック図である。図示の画像処理装置は、スキャナ装置等の入力装置1と、プログラム制御により動作するデータ処理装置2とを含む。この画像処理装置が、OCRサーバとして働く。
図示の画像処理装置は、複数種類の識別子の少なくとも1つ識別子を含む画像を読み取って、認識結果を出力する装置である。図示の例では、複数種類の識別子として、二次元シンボル(二次元バーコード)、一次元シンボル(バーコード)、および英数字活字を使用している。読み取るべき画像には、これら二次元シンボル、一次元シンボル、および英数字活字の内の少なくとも1つが、あらかじめ形成(印刷)されている。また、図示の例では、画像が、OCR処理する帳票3である場合を例に挙げて説明している。
入力装置1は、スキャナ装置11を含む。スキャナ装置11は、画像を光学的に走査し、光電変換素子(イメージセンサ)により電気信号(生の多値画像データ)に変換する。
したがって、入力装置1は、複数種類の識別子中の少なくとも1つの識別子を含む画像を読み取って、生の画像データを出力する読取手段として動作する。
データ処理装置2は、帳票切り出し部201と、帳票識別部202と、二次元シンボルデコード部203と、第1の画質判定・補正部204と、一次元シンボルデコード部205と、第2の画質判定・補正部206と、英数字活字認識部207と、第3の画質判定・補正部208と、画像補正部209と、認識処理部210とを備える。
帳票切り出し部201は、入力装置1から与えられた生の多値画像データからエッジ検出を行い、帳票領域を抽出する。
帳票識別部202は、帳票切り出し部201で検出した帳票領域から、帳票ID、または、帳票キーワードを認識し、帳票種別を識別する。
二次元シンボルデコード部203は、帳票識別部202で識別した帳票種別の帳票レイアウト情報4を参照し、帳票領域内の二次元シンボルデータのデコード処理をする。
第1の画質判定・補正部204は、二次元シンボルデコード部203から取得した第1の画質判定値が第1の閾値より大きい場合、生の画像データの画像品質が低品質画像であると判断して、二次元シンボル領域の画像補正処理を行う。
一次元シンボルデコード部205は、帳票レイアウト情報4を参照し、帳票領域内の一次元シンボルデータのデコード処理をする。
第2の画質判定・補正部206は、一次元シンボルデコード部205から取得した第2の画質判定値が第2の閾値より大きい場合、生の画像データの画像品質が低品質画像であると判断して、一次元シンボル領域の画像補正処理を行う。
英数字活字認識部207は、帳票レイアウト情報4を参照し、帳票領域内の英数字活字データの認識処理をする。
第3の画質判定・補正部208は、英数字活字認識部207から取得した第3の画質判定値が第3の閾値より大きい場合、生の画像データの画像品質が低品質画像であると判断して、英数字活字領域の画像補正処理を行う。
したがって、二次元シンボルデコード部203、第1の画質判定・補正部204、一次元シンボルデコード部205、第2の画質判定・補正部206、英数字活字認識部207、および第3の画質判定・補正部208の組み合わせは、生の画像データの中から読み取った識別子データに基づいて、当該名もの画像データの画像品質を判定する判定手段として働く。
画像補正部209は、第1の画質判定・補正部204、第2の画質判定・補正部206、および第3の画質判定・補正部208のいずれかにおいて、生の画像データが低品質画像と判定された場合に、二次元シンボル、一次元シンボル、および英数字活字以外の読み取り領域の生の画像データの画像補正を行い、補正した画像データを出力する。
すなわち、画像補正部209は、上記判定手段において生の画像データの画像品質が低品質と判定された場合にのみ、当該生の画像データを補正して、補正した画像データを出力する補正手段として働く。
認識処理部210は、二次元シンボル、一次元シンボル、英数字活字以外の読み取り領域の生の画像データ又は補正した画像データを認識処理して、認識結果を出力する。
すなわち、認識処理部210は、生の画像データ又は補正した画像データを認識処理して、認識結果を出力する認識処理手段として動作する。
次に、図1および図2を参照して、画像処理装置による、本実施形態に係る低品質画像の読み取り方法の動作について詳細に説明する。
入力装置1で入力された帳票の生の多値画像データは、帳票切り出し部201に供給される(図2のステップA1)。帳票切り出し部201は、この入力画像(生の多値画像データ)のエッジを検出し、画像内の帳票位置を検出する(図2のステップA2)。帳票識別部202は、帳票切り出し部201で検出した帳票領域から、帳票ID、または、帳票キーワードを認識し、帳票種別を識別する(図2のステップA3)。ステップA3で、帳票レイアウト情報4に二次元シンボルの読み取りが存在しない場合(図2のステップA4のNo)は、一次元シンボルデコード部205へ進む。
二次元シンボルデコード部203では、帳票識別部202で識別した帳票種別の帳票レイアウト情報4を参照し、帳票領域(生の多値画像データ)内の二次元シンボルデータをデコード処理する(図2のステップA5)。二次元シンボルデータのデコードでは、読み取り結果とともにエラー訂正したデータブロックの数を取得する。帳票印刷品質が同等である場合、低品質画像読み取り時のエラー訂正ブロック数は、高品質画像読み取り時のエラー訂正ブロック数よりも大きくなる。第1の画質判定値v1を(エラー訂正ブロック数/総ブロック数)と定義する。第1の画質判定値v1があらかじめ設定した第1の閾値th1以下であれば(図2のステップA6のYes)、第1の画質判定・補正部204は、生の画像データが低品質画像ではないと判定して、一次元シンボルデコード部205へ進む。
第1の画質判定・補正部204では、二次元シンボル領域の背景濃度が一定となるよう画像補正処理を行い(図2のステップA7)、再度、二次元シンボルデコード部203で二次元シンボルデータをデコード処理して、二次元シンボルデータの画質を判定する(図2のステップA5およびA6)。ステップA5〜A7は、第1の画質判定値v1が第1の閾値th1以下になるまで、または、上限回数まで実行する。
帳票レイアウト情報に一次元シンボルの読み取りが存在しない場合は(図2のステップA8のNo)、英数字活字認識部207へ進む。
一次元シンボルデコード部205では、帳票識別部202で識別した帳票種別の帳票レイアウト情報4を参照し、帳票領域(生の画像データ)内の一次元シンボルデータをデコード処理する(図2のステップA9)。一次元シンボルデータのデコードでは、読み取り結果とともに最低反射率Rmin、シンボルコントラストSC、最少エッジコントラストECmin、モジュレーションMOD(=ECmin/SC)を取得し、一次元シンボルの画像品質を数値化(0〜4.0)する。帳票印刷品質が同等である場合、低品質画像読み取り時の一次元シンボルの品質値は、高品質画像読み取り時の一次元シンボルの品質値よりも小さくなる。第2の画質判定値v2を(4.0−(一次元シンボルの品質値))と定義する。第2の画質判定値v2があらかじめ設定した第2の閾値th2以下であれば(図2のステップA10のYes)、第2の画質判定・補正部206は、生の画像データが低品質画像ではないと判定して、英数字活字認識部207へ進む。
第2の画質判定・補正部206では、一次元シンボル領域の背景濃度が一定となるよう画像補正処理を行い(図2のステップA11)、再度、一次元シンボルデコード部205で一次元シンボルデータをデコード処理して、生の画像データの画質を判定する(図2のステップA9およびA10)。ステップA9〜11は、第2の画質判定値v2が第2の閾値th2以下になるまで、または、上限回数まで実行する。
帳票レイアウト情報4に活字英数字の読み取りが存在しない場合は(図2のステップA12のNo)、画像補正部209へ進む。
英数字活字認識部207では、帳票識別部202で識別した帳票種別の帳票レイアウト情報4を参照し、帳票領域(生の画像データ)内の英数字活字データを認識処理する(図2のステップA13)。英数字活字データの認識では、読み取り結果とともに文字パタンの切り出し座標を取得する。帳票印刷品質が同等である場合、低品質画像読み取り時の文字パタンの高さ変動は、高品質画像読み取り時の文字パタンの高さの変動よりも大きくなる。第3の画質判定値v3を切出された文字パタンの高さ変動(分散)と定義する。第3の画質判定値v3があらかじめ設定した第3の閾値th3以下であれば(図2のステップA14のYes)、第3の画質判定・補正部208は、生の画像データが低品質画像ではないと判定して、画像補正部209へ進む。
第3の画質判定・補正部208では、英数字活字領域の背景濃度が一定となるよう画像補正処理を行い(図2のステップA15)、再度、英数字活字認識部207で英数字活字データを認識処理して、生の画像データの画質を判定する(図2のステップA13およびA14)。ステップA13〜A15は、第3の画質判定値v3が第3の閾値th3以下になるまで、または、上限回数まで実行する。
画像補正部209は、第1の画質判定・補正部204、第2の画質判定・補正部206、第3の画質判定・補正部208のいずれかにおいて、生の画像データが低品質画像と判定された場合に、画像補正部209は、二次元シンボル、一次元シンボル、英数字活字以外の読み取り領域の生の画像データを画像補正して、補正した画像データを出力する(図2のステップA17)。認識処理部210は、二次元シンボル、一次元シンボル、英数字活字以外の読み取り領域の生の画像データ又は補正した画像データを認識処理する(図2のステップA18)。
次に、具体例を用いて本実施例の動作を説明する。
図3に示すように、帳票切り出し部201は、入力多値画像データ(生の画像データ)からエッジ検出をし、画像内に含まれる帳票領域を検出する(図2のステップA1およびA2)。図4に示すように、帳票識別部202は、検出された帳票領域から、帳票ID、または、キーワードを認識し、帳票種別を識別する(図2のステップA3)。図5に示すように、帳票内に読み取り対象となる二次元シンボルが存在する場合(図2のステップA4のYes)、二次元シンボルデコード部203は、二次元シンボルデータをデコードする(図2のステップA5)。図6に示すように、第1の画質判定値v1が第1の閾値th1より大きい場合は(図2のステップA6のNo)、第1の画質判定・補正部204は、生の画像データが低品質画像であると判定して、二次元シンボルを含む矩形領域の背景濃度が一定となるよう画像補正処理を行う(図2のステップA7)。
図7に示すように、帳票内に読み取り対象となる一次元シンボルが存在する場合(図2のステップA8のYes)、一次元シンボルデコード部205は、一次元シンボルデータをデコードする(図2のステップA9)。図8に示すように、一次元シンボルデコード部205は、最低反射率Rmin、シンボルコントラストSC、最少エッジコントラストECmin、モジュレーションMOD(=ECmin/SC)を取得し、一次元シンボルの品質を数値化する。
図9に示すように、第2の画質判定値v2が第2の閾値th2より大きい場合は(図2のステップA10のNo)、第2の画質判定・補正部206は、生の画像データが低品質画像であると判定して、一次元シンボルを含む矩形領域の背景濃度が一定となるよう画像補正処理を行う(図2のステップA11)。
図10に示すように、帳票内に読み取り対象となる英数字活字が存在する場合(図2のステップA12のYes)、英数字活字認識部207は、英数字活字データの読み取りを行う(図2のステップA13)。図11に示すように、英数字活字認識部207は、文字パタンの切り出し座標を取得し、文字パタンの高さ変動(分散)を求める。
図12に示すように、第3の画質判定値v3が第3の閾値th3より大きい場合は(図2のステップA14のNo)、第3の画質判定・補正部208は、生の画像データが低品質画像であると判定して、英数字活字領域の背景濃度が一定となるよう画像補正処理を行う(図2のステップA15)。
二次元シンボル、一次元シンボル、英数字活字のいずれかの読み取りで、生の画像データが低品質画像であると判定された場合は(図2のステップA16のYes)、画像補正部209は、二次元シンボル、一次元シンボル、英数字活字以外の読み取り領域の生の画像データの画像補正を行って、補正した画像データを出力し(図2のステップA17)、認識処理部210は、二次元シンボル、一次元シンボル、英数字活字以外の補正した画像データを認識処理して、認識結果を出力する(図2のステップA18)。
本実施形態(実施例)の効果について説明する。
効果は、読み取り画像の中に低品質画像が混入した場合でも、帳票の読み取りができることである。この結果、スキャナ装置の機種やスキャン方式、スキャナ装置のタイプ(フラットベッド型スキャナ、搬送型スキャナ、非接触型スキャナ)が不特定となる状況でも、処理時間の増加なく帳票の読み取りができる。その理由は、二次元シンボル、一次元シンボルおよび、英数字活字から成る識別子を先に読み取り、その読み取った識別子データに基づいて画像データの画像品質を判定することで、低品質画像に対してのみ画像補正できるためである。
尚、データ処理装置2は、コンピュータによって実現され得る。コンピュータは、周知のように、中央処理装置(CPU)と、データを格納するRAMなどの記憶装置と、プログラムを格納するプログラム用メモリ(ROM)とを備える。そして、プログラム用メモリ(ROM)に格納されたプログラムを読み出すことにより、CPUは、帳票切り出し部201、帳票識別部202、二次元シンボルデコード部203、第1の画像判定・補正部204、一次元シンボルデコード部205、第2の画質判定・補正部206、英数字活字認識部207、第3の画質判定・補正部208、画像補正部209、および認識処理部201の機能を実現する。
以上、実施形態(実施例)を参照して本発明を説明したが、本発明は上記実施形態(実施例)に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
例えば、本発明の他の実施例については、以下の設定変更が考えられる。
(1)帳票を画像表示可能なモバイル端末に変更する。
(2)帳票をナンバープレート、パッケージ基板などの紙以外の印刷・刻印可能物に変更する。
また、上記実施形態では、複数種類の識別子が、二次元シンボル、一次元シンボル、および英数字活字から成る場合を例に挙げて説明しているが、複数種類の識別子は、二次元シンボル、一次元シンボル、および英数字活字の中の、少なくとも2つからなってよい。
さらに、上記実施形態では、判定手段が、二次元シンボルデコード部202と第1の画質判定・補正部204との第1の組み合わせ、一次元シンボルデコード部205と第2の画質判定・補正部206との第2の組み合わせ、および英数字活字認識部207と第3の画質判定・補正部208との第3の組み合わせの、3つの組み合わせから構成されているが、判定手段は、使用する上記複数種類の識別子に合わせて、上記3つの組み合わせの中の、少なくとも2からなってよい。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1) 複数種類の識別子中の少なくも1つの識別子を含む画像を読み取って、生の画像データを出力する読取手段と、
該生の画像データの中から読み取った識別子データに基づいて、当該生の画像データの画像品質を判定する判定手段と、
該判定手段において前記生の画像データの画像品質が低品質と判定された場合にのみ、当該生の画像データを補正して、補正した画像データを出力する補正手段と、
前記生の画像データ又は前記補正した画像データを認識処理して、認識結果を出力する認識処理手段と、
を有する画像処理装置。
(付記2) 前記複数種類の識別子が、二次元シンボル、一次元シンボル、および英数字活字の中の、少なくとも2つからなる、付記1に記載の画像処理装置。
(付記3) 前記画像が、前記識別子として前記二次元シンボルを含む場合、
前記判定手段は、
読み取った二次元シンボルデータをデコード処理して、第1の画質判定値を出力する二次元シンボルデコード部と、
前記第1の画質判定値があらかじめ設定した第1の閾値より大きい場合に、前記生の画像データの画像品質を低品質と判定して、前記二次元シンボルの領域の背景濃度が一定となるように画像補正処理を行う第1の画質判定・補正部と、
を含む、付記2に記載の画像処理装置。
(付記4) 前記二次元シンボルデコード部は、前記二次元シンボルデータのデコード処理の際に、エラー訂正したデータブロックの数を取得し、(エラー訂正ブロック数/総ブロック数)を前記第1の画質判定値として出力する、付記3に記載の画像処理装置。
(付記5) 前記画像が、前記識別子として前記一次元シンボルを含む場合、
前記判定手段は、
読み取った一次元シンボルデータをデコード処理して、第2の画質判定値を出力する一次元シンボルデコード部と、
前記第2の画質判定値があらかじめ設定した第2の閾値より大きい場合に、前記生の画像データの画像品質を低品質と判定して、前記一次元シンボルの領域の背景濃度が一定となるように画像補正処理を行う第2の画質判定・補正部と、
を含む、付記2乃至4のいずれか一項に記載の画像処理装置。
(付記6) 前記一次元シンボルデコード部は、前記一次元シンボルデータのデコード処理の際に、最低反射率、シンボルコントラスト、最小エッジコントラスト、およびモジュレーションを取得して、前記一次元シンボルの品質値を0〜4.0の間で数値化し、(4.0−(一次元シンボルの品質値))を前記第2の画質判定値として出力する、付記5に記載の画像処理装置。
(付記7) 前記画像が、前記識別子として前記英数字活字を含む場合、
前記判定手段は、
読み取った英数字活字データを認識して、第3の画質判定値を出力する英数字活字認識部と、
前記第3の画質判定値があらかじめ設定した第3の閾値より大きい場合に、前記生の画像データの画像品質を低品質と判定して、前記英数字活字の領域の背景濃度が一定となるように画像補正処理を行う第3の画質判定・補正部と、
を含む、付記2乃至6のいずれか一項に記載の画像処理装置。
(付記8) 前記英数字活字認識部は、前記英数字活字データの認識の際に、文字パタンの切り出し座標を取得し、該切出された文字パタンの高さ変動を前記第3の画質判定値として出力する、付記7に記載の画像処理装置。
(付記9) 前記補正手段は、前記判定手段で、前記生の画像データの画像品質が低品質と判定された場合に、前記二次元シンボル、前記一次元シンボル、前記英数字活字以外の読み取り領域の前記生の画像データの画像補正を行う、付記2乃至8のいずれか一項に記載の画像処理装置。
(付記10) 前記画像が、帳票、画像表示可能なモバイル端末、および紙以外の印刷・刻印可能物の中から選択されたいずれか1つである、付記1乃至9のいずれか一項に記載の画像処理装置。
(付記11) 複数種類の識別子中の少なくも1つの識別子を含む画像を読み取って得られた生の画像データを処理して、認識結果を出力する画像認識方法であって、
前記生の画像データの中から読み取った識別子データに基づいて、当該生の画像データの画像品質を判定する判定ステップと、
該判定ステップにおいて前記生の画像データの画像品質が低品質と判定された場合にのみ、当該生の画像データを補正して、補正した画像データを出力する補正ステップと、
前記生の画像データ又は前記補正した画像データを認識処理して、前記認識結果を出力する認識処理ステップと、
を含む画像処理方法。
(付記12) 前記複数種類の識別子が、二次元シンボル、一次元シンボル、および英数字活字の中の、少なくとも2つからなる、付記11に記載の画像処理方法。
(付記13) 前記画像が、前記識別子として前記二次元シンボルを含む場合、
前記判定ステップは、
読み取った二次元シンボルデータをデコード処理して、第1の画質判定値を出力する二次元シンボルデコードステップと、
前記第1の画質判定値があらかじめ設定した第1の閾値より大きい場合に、前記生の画像データの画像品質を低品質と判定して、前記二次元シンボルの領域の背景濃度が一定となるように画像補正処理を行う第1の画質判定・補正ステップと、
を含む、付記12に記載の画像処理方法。
(付記14) 前記二次元シンボルデコードステップは、前記二次元シンボルデータのデコード処理の際に、エラー訂正したデータブロックの数を取得し、(エラー訂正ブロック数/総ブロック数)を前記第1の画質判定値として出力する、付記13に記載の画像処理方法。
(付記15) 前記画像が、前記識別子として前記一次元シンボルを含む場合、
前記判定ステップは、
読み取った一次元シンボルデータをデコード処理して、第2の画質判定値を出力する一次元シンボルデコードステップと、
前記第2の画質判定値があらかじめ設定した第2の閾値より大きい場合に、前記生の画像データの画像品質を低品質と判定して、前記一次元シンボルの領域の背景濃度が一定となるように画像補正処理を行う第2の画質判定・補正ステップと、
を含む、付記12乃至14のいずれか一項に記載の画像処理方法。
(付記16) 前記一次元シンボルデコードステップは、前記一次元シンボルデータのデコード処理の際に、最低反射率、シンボルコントラスト、最小エッジコントラスト、およびモジュレーションを取得して、前記一次元シンボルの品質値を0〜4.0の間で数値化し、(4.0−(一次元シンボルの品質値))を前記第2の画質判定値として出力する、付記15に記載の画像処理方法。
(付記17) 前記画像が、前記識別子として前記英数字活字を含む場合、
前記判定ステップは、
読み取った英数字活字データを認識して、第3の画質判定値を出力する英数字活字認識ステップと、
前記第3の画質判定値があらかじめ設定した第3の閾値より大きい場合に、前記生の画像データの画像品質を低品質と判定して、前記英数字活字の領域の背景濃度が一定となるように画像補正処理を行う第3の画質判定・補正ステップと、
を含む、付記12乃至16のいずれか一項に記載の画像処理方法。
(付記18) 前記英数字活字認識ステップは、前記英数字活字データの認識の際に、文字パタンの切り出し座標を取得し、該切出された文字パタンの高さ変動を前記第3の画質判定値として出力する、付記17に記載の画像処理方法。
(付記19) 前記補正ステップは、前記判定ステップで、前記生の画像データの画像品質が低品質と判定された場合に、前記二次元シンボル、前記一次元シンボル、前記英数字活字以外の読み取り領域の前記生の画像データの画像補正を行う、付記12乃至18のいずれか一項に記載の画像処理方法。
(付記20) 前記画像が、帳票、画像表示可能なモバイル端末、および紙以外の印刷・刻印可能物の中から選択されたいずれか1つである、付記11乃至19のいずれか一項に記載の画像処理方法。
(付記21) コンピュータに、複数種類の識別子中の少なくも1つの識別子を含む画像を読み取って得られた生の画像データを処理させて、認識結果を出力させる画像処理プログラムであって、前記コンピュータに、
前記生の画像データの中から読み取った識別子データに基づいて、当該生の画像データの画像品質を判定する判定機能と、
該判定ステップにおいて前記生の画像データの画像品質が低品質と判定された場合にのみ、当該生の画像データを補正して、補正した画像データを出力する補正機能と、
前記生の画像データ又は前記補正した画像データを認識処理して、前記認識結果を出力する認識処理機能と、
を実現させるための画像処理プログラム。
(付記22) 前記複数種類の識別子が、二次元シンボル、一次元シンボル、および英数字活字の中の、少なくとも2つからなる、付記21に記載の画像処理プログラム。
(付記23) 前記画像が、前記識別子として前記二次元シンボルを含む場合、
前記判定機能は、前記コンピュータに、
読み取った二次元シンボルデータをデコード処理して、第1の画質判定値を出力する二次元シンボルデコード機能と、
前記第1の画質判定値があらかじめ設定した第1の閾値より大きい場合に、前記生の画像データの画像品質を低品質と判定して、前記二次元シンボルの領域の背景濃度が一定となるように画像補正処理を行う第1の画質判定・補正機能と、
を実現させる、付記22に記載の画像処理プログラム。
(付記24) 前記二次元シンボルデコード機能は、前記コンピュータに、前記二次元シンボルデータのデコード処理の際に、エラー訂正したデータブロックの数を取得させ、(エラー訂正ブロック数/総ブロック数)を前記第1の画質判定値として出力させる、付記23に記載の画像処理プログラム。
(付記25) 前記画像が、前記識別子として前記一次元シンボルを含む場合、
前記判定機能は、前記コンピュータに、
読み取った一次元シンボルデータをデコード処理して、第2の画質判定値を出力する一次元シンボルデコード機能と、
前記第2の画質判定値があらかじめ設定した第2の閾値より大きい場合に、前記生の画像データの画像品質を低品質と判定して、前記一次元シンボルの領域の背景濃度が一定となるように画像補正処理を行う第2の画質判定・補正機能と、
を実現させる、付記22乃至24のいずれか一項に記載の画像処理プログラム。
(付記26) 前記一次元シンボルデコード機能は、前記コンピュータに、前記一次元シンボルデータのデコード処理の際に、最低反射率、シンボルコントラスト、最小エッジコントラスト、およびモジュレーションを取得させ、前記一次元シンボルの品質値を0〜4.0の間で数値化させ、(4.0−(一次元シンボルの品質値))を前記第2の画質判定値として出力させる、付記25に記載の画像処理プログラム。
(付記27) 前記画像が、前記識別子として前記英数字活字を含む場合、
前記判定機能は、前記コンピュータに、
読み取った英数字活字データを認識して、第3の画質判定値を出力する英数字活字認識機能と、
前記第3の画質判定値があらかじめ設定した第3の閾値より大きい場合に、前記生の画像データの画像品質を低品質と判定して、前記英数字活字の領域の背景濃度が一定となるように画像補正処理を行う第3の画質判定・補正機能と、
を実現させる、付記22乃至26のいずれか一項に記載の画像処理プログラム。
(付記28) 前記英数字活字認識機能は、前記コンピュータに、前記英数字活字データの認識の際に、文字パタンの切り出し座標を取得させ、該切出された文字パタンの高さ変動を前記第3の画質判定値として出力させる、付記27に記載の画像処理プログラム。
(付記29) 前記補正機能は、前記コンピュータに、前記判定機能で、前記生の画像データの画像品質が低品質と判定された場合に、前記二次元シンボル、前記一次元シンボル、前記英数字活字以外の読み取り領域の前記生の画像データの画像補正を行なわせる、付記22乃至28のいずれか一項に記載の画像処理プログラム。
(付記30) 前記画像が、帳票、画像表示可能なモバイル端末、および紙以外の印刷・刻印可能物の中から選択されたいずれか1つである、付記21乃至29のいずれか一項に記載の画像処理プログラム。
本発明は、不特定多数のスキャナ装置でスキャンした定型帳票画像をOCRサーバで一括読み取りして各種サービスを行う分野に利用され得る。
1 ・・・ 入力装置
2 ・・・ データ処理装置
3 ・・・ OCR処理する帳票
4 ・・・ 帳票レイアウト情報
11 ・・・ スキャナ装置
201 ・・・ 帳票切り出し部
202 ・・・ 帳票識別部
203 ・・・ 二次元シンボルデコード部
204 ・・・ 第1の画質判定・補正部
205 ・・・ 一次元シンボルデコード部
206 ・・・ 第2の画質判定・補正部
207 ・・・ 英数字活字認識部
208 ・・・ 第3の画質判定・補正部
209 ・・・ 画像補正部
210 ・・・ 認識処理部

Claims (6)

  1. 複数種類の識別子中の少なくも1つの識別子を含む画像を読み取って、生の画像データを出力する読取手段と、
    該生の画像データの中から読み取った識別子データに基づいて、当該生の画像データの画像品質を判定する判定手段と、
    該判定手段において前記生の画像データの画像品質が低品質と判定された場合にのみ、当該生の画像データを補正して、補正した画像データを出力する補正手段と、
    前記生の画像データ又は前記補正した画像データを認識処理して、認識結果を出力する認識処理手段と、
    を有する画像処理装置であって、
    前記複数種類の識別子が、二次元シンボル、一次元シンボル、および英数字活字の中の、少なくとも2つからなり、
    前記画像が、前記識別子として前記二次元シンボルを含む場合、
    前記判定手段は、
    読み取った二次元シンボルデータをデコード処理して、第1の画質判定値を出力する二次元シンボルデコード部と、
    前記第1の画質判定値があらかじめ設定した第1の閾値より大きい場合に、前記生の画像データの画像品質を低品質と判定して、前記二次元シンボルの領域の背景濃度が一定となるように画像補正処理を行う第1の画質判定・補正部と、
    を含む、画像処理装置
  2. 前記画像が、前記識別子として前記一次元シンボルを含む場合、
    前記判定手段は、
    読み取った一次元シンボルデータをデコード処理して、第2の画質判定値を出力する一次元シンボルデコード部と、
    前記第2の画質判定値があらかじめ設定した第2の閾値より大きい場合に、前記生の画像データの画像品質を低品質と判定して、前記一次元シンボルの領域の背景濃度が一定となるように画像補正処理を行う第2の画質判定・補正部と、
    を含む、請求項に記載の画像処理装置。
  3. 前記画像が、前記識別子として前記英数字活字を含む場合、
    前記判定手段は、
    読み取った英数字活字データを認識して、第3の画質判定値を出力する英数字活字認識部と、
    前記第3の画質判定値があらかじめ設定した第3の閾値より大きい場合に、前記生の画像データの画像品質を低品質と判定して、前記英数字活字の領域の背景濃度が一定となるように画像補正処理を行う第3の画質判定・補正部と、
    を含む、請求項1又は2に記載の画像処理装置。
  4. 前記補正手段は、前記判定手段で、前記生の画像データの画像品質が低品質と判定された場合に、前記二次元シンボル、前記一次元シンボル、前記英数字活字以外の読み取り領域の前記生の画像データの画像補正を行う、請求項1乃至3のいずれか一項に記載の画像処理装置。
  5. 複数種類の識別子中の少なくも1つの識別子を含む画像を読み取って得られた生の画像データを処理して、認識結果を出力する画像認識方法であって、
    前記生の画像データの中から読み取った識別子データに基づいて、当該生の画像データの画像品質を判定する判定ステップと、
    該判定ステップにおいて前記生の画像データの画像品質が低品質と判定された場合にのみ、当該生の画像データを補正して、補正した画像データを出力する補正ステップと、
    前記生の画像データ又は前記補正した画像データを認識処理して、前記認識結果を出力する認識処理ステップと、
    を含む画像処理方法であって、
    前記複数種類の識別子が、二次元シンボル、一次元シンボル、および英数字活字の中の、少なくとも2つからなり、
    前記補正ステップは、前記判定ステップで、前記生の画像データの画像品質が低品質と判定された場合に、前記二次元シンボル、前記一次元シンボル、前記英数字活字以外の読み取り領域の前記生の画像データの画像補正を行う、画像処理方法
  6. コンピュータに、複数種類の識別子中の少なくも1つの識別子を含む画像を読み取って得られた生の画像データを処理させて、認識結果を出力させる画像処理プログラムであって、前記コンピュータに、
    前記生の画像データの中から読み取った識別子データに基づいて、当該生の画像データの画像品質を判定する判定機能と、
    該判定ステップにおいて前記生の画像データの画像品質が低品質と判定された場合にのみ、当該生の画像データを補正して、補正した画像データを出力する補正機能と、
    前記生の画像データ又は前記補正した画像データを認識処理して、前記認識結果を出力する認識処理機能と、
    を実現させるための画像処理プログラムであって、
    前記複数種類の識別子が、二次元シンボル、一次元シンボル、および英数字活字の中の、少なくとも2つからなり、
    前記補正機能は、前記判定機能で、前記生の画像データの画像品質が低品質と判定された場合に、前記二次元シンボル、前記一次元シンボル、前記英数字活字以外の読み取り領域の前記生の画像データの画像補正を行う、画像処理プログラム
JP2011192689A 2011-09-05 2011-09-05 画像処理装置、方法、およびプログラム Expired - Fee Related JP5871116B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011192689A JP5871116B2 (ja) 2011-09-05 2011-09-05 画像処理装置、方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011192689A JP5871116B2 (ja) 2011-09-05 2011-09-05 画像処理装置、方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2013054555A JP2013054555A (ja) 2013-03-21
JP5871116B2 true JP5871116B2 (ja) 2016-03-01

Family

ID=48131478

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011192689A Expired - Fee Related JP5871116B2 (ja) 2011-09-05 2011-09-05 画像処理装置、方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5871116B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05120488A (ja) * 1991-10-29 1993-05-18 Ricoh Co Ltd 線図形認識方法
JP5262869B2 (ja) * 2009-03-12 2013-08-14 株式会社リコー 画像処理システム、画像処理サーバ、mfp及び画像処理方法

Also Published As

Publication number Publication date
JP2013054555A (ja) 2013-03-21

Similar Documents

Publication Publication Date Title
JP4911340B2 (ja) 二次元コード検出システムおよび二次元コード検出プログラム
JP5262869B2 (ja) 画像処理システム、画像処理サーバ、mfp及び画像処理方法
US8610929B2 (en) Image processing apparatus, control method therefor, and program
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
US20050271275A1 (en) Text character identification system and method thereof
US20100259777A1 (en) Image forming apparatus, image forming method, and storage medium
US9626738B2 (en) Image processing apparatus, image processing method, and storage medium
US20130120806A1 (en) Image processing apparatus, line detection method, and computer-readable, non-transitory medium
US20170124390A1 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
JP2007081458A (ja) 画像処理装置および画像処理装置の制御方法
US20160044196A1 (en) Image processing apparatus
JPWO2013061468A1 (ja) 画像生成方法、情報処理方法、プログラム、及び情報処理装置
KR20150099116A (ko) Ocr를 이용한 컬러 문자 인식 방법 및 그 장치
US10706337B2 (en) Character recognition device, character recognition method, and recording medium
US9215344B2 (en) Image forming apparatus, image processing apparatus, image forming method, image processing method, and non-transitory computer readable medium
JP5871116B2 (ja) 画像処理装置、方法、およびプログラム
JP2017116974A (ja) 画像処理装置および画像処理プログラム
US9641723B2 (en) Image processing apparatus with improved slide printout based on layout data
JP4205554B2 (ja) 帳票処理装置
JP2010182219A (ja) 画像処理装置
JP4905767B2 (ja) 二次元コード検出システムおよび二次元コード検出プログラム
US9007634B2 (en) Information processing device, information processing method, and computer program product
JP2007334478A (ja) 画像処理装置及び画像処理方法
JP4974794B2 (ja) 文書認識装置、文書認識方法、コンピュータプログラム
JP6802107B2 (ja) 情報処理装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140806

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150422

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151229

R150 Certificate of patent or registration of utility model

Ref document number: 5871116

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees