JP5960010B2 - 画像処理装置、画像処理方法、およびプログラム - Google Patents

画像処理装置、画像処理方法、およびプログラム Download PDF

Info

Publication number
JP5960010B2
JP5960010B2 JP2012212208A JP2012212208A JP5960010B2 JP 5960010 B2 JP5960010 B2 JP 5960010B2 JP 2012212208 A JP2012212208 A JP 2012212208A JP 2012212208 A JP2012212208 A JP 2012212208A JP 5960010 B2 JP5960010 B2 JP 5960010B2
Authority
JP
Japan
Prior art keywords
image
binarization
unit
image data
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012212208A
Other languages
English (en)
Other versions
JP2014068195A (ja
Inventor
中村 宏
宏 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nidec Sankyo Corp
Original Assignee
Nidec Sankyo Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nidec Sankyo Corp filed Critical Nidec Sankyo Corp
Priority to JP2012212208A priority Critical patent/JP5960010B2/ja
Priority to US14/015,181 priority patent/US9076225B2/en
Publication of JP2014068195A publication Critical patent/JP2014068195A/ja
Application granted granted Critical
Publication of JP5960010B2 publication Critical patent/JP5960010B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration by the use of local operators
    • G06T5/92
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/01Solutions for problems related to non-uniform document background
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、読み取り多値画像(濃淡画像)から2値化画像を生成する画像処理装置、画像処理方法、およびプログラムに関するものである。
従来から、たとえば、小切手などの媒体表面に記載された文字列などを読み取ってデジタル画像を取得する画像読取装置が様々に提案されている。
その画像は、画像に含まれる様々な情報を認識するアプリケーションで利用されることが多いが、アプリケーションに見合った画像を提供するという点で画像読取装置(画像処理装置)の役割は非常に重要になってきている。
画像読取装置で読取った画像を入力として様々な認識処理を行うアプリケーションでは、2値化画像をベースに認識を行うものがある。
特許文献1には、一般的なグレー(濃淡)画像から、アプリケーションの目的に適した2値化画像を生成する技術が開示されている。
この技術では、一般的な2値化の後、中間階調部分に発生しがちなノイズを連結成分の有無を利用した追加処理によって除去する。
しかし、この技術では、特に画像に大きい輝度ムラがある場合には対応しきれない場合がある。
非特許文献1に開示された技術は、これに対処したものであり、輝度ムラがあっても背景と認識対象物とをコントラストよく分離できるようにしている。
特開2000-331118号公報
Kindratenko他:Binarization of Inhomogeneously Illuminated Images, ICIAP’95
しかし、非特許文献1に開示された技術は、最適な2値化結果を得るまでにフィルタパラメータを振って画像全体に対する相関演算を繰り返すことから、膨大な演算量が要求され、多くの処理時間を要することになる等の不利益がある。
本発明は、比較的少ない演算量で品質の高い2値化画像を得ることが可能な画像処理装置、画像処理方法、およびプログラムを提供することにある。
本発明の第1の観点は、濃淡のある読み取り多値画像から2値化画像を生成する画像処理装置であって、画像を前記多値画像として読み取る画像読取部と、前記画像読取部による読み取り多値画像を格納する画像メモリと、前記画像メモリに格納された読み取り多値画像に対してサンプル領域を設定するサンプル領域設定部と、前記サンプル領域が設定された読み取り多値画像に対してフィルタ処理を行って補正画像データを生成し、当該補正画像データを2値化する2値化部と、前記2値化部で得られた2値化画像データと前記読み取り多値画像データとの相関関係をそれぞれ求める相関演算部と、前記相関関係に基づいて最適なパラメータ値または2値化画像データを選択する最適2値化情報選択部と、を有し、前記2値化部は、フィルタにおける注目画素の係数に可変付加量を加算した複数のパラメータ値を設定するパラメータ値設定部と、中心の前記注目画素とその周囲の画素を含むマトリクスを形成し、前記パラメータ値が設定される前記フィルタを用いて読み取り多値画像データに対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成するフィルタ処理部と、前記各補正画像データを、所定の2値化閾値で2値化する2値化処理部と、を含む。
これにより、計算時間を短縮でき、相関演算をあらかじめ注目し設定したサンプル領域に絞ることで、その領域に最適な2値化画像を得ることが可能となる。
好適には、前記2値化部の前記フィルタ処理部は、前記サンプル領域内の読み取り多値画像データに対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成する。
好適には、前記最適2値化情報選択部は、前記相関関係に基づいて最適なパラメータ値を選択して、前記2値化部のパラメータ設定部に報知し、前記2値化部の前記フィルタ処理部は、前記報知されたパラメータ値を用いたフィルタ処理を読み取り多値画像の全体に対して行って、前記最適パラメータ値に応じた補正画像データを生成し、前記2値化処理部は、前記全体の補正画像データを、所定の2値化閾値で2値化する。
好適には、前記2値化部の前記フィルタ処理部は、前記サンプル領域を含む読み取り多値画像データの全体に対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成する。
好適には、前記最適2値化情報選択部は、前記相関関係に基づいて最適な2値化画像データを選択して、前記2値化部の2値化処理部に報知し、前記2値化部の前記2値化処理部は、前記全体の補正画像データを、所定の2値化閾値で2値化した2値化画像を出力する。
好適には、前記サンプル領域設定部は、前記画像メモリ内の読み取り多値画像の画素値が示す輝度値とあらかじめ設定した輝度閾値とを比較し、輝度閾値より高い領域の中から所定のサンプル領域を設定する。
好適には、前記画像読取部の読み取り対象媒体は、複数の記入領域を含み、前記サンプル領域設定部は、前記複数の記入領域から前記輝度閾値より高い輝度の記入領域を選択し、選択した記入力領域からサンプル領域を設定する。
本発明の第2の観点は、濃淡のある読み取り多値画像から2値化画像を生成する画像処理方法であって、画像を前記多値画像として読み取る画像読取ステップと、前記画像読取ステップによる読み取り多値画像を画像メモリに格納する画像格納ステップと、前記画像メモリに格納された読み取り多値画像に対してサンプル領域を設定するサンプル領域設定ステップと、前記サンプル領域が設定された読み取り多値画像に対してフィルタ処理を行って補正画像データを生成し、当該補正画像データを2値化する2値化ステップと、前記2値化ステップで得られた2値化画像データと前記読み取り多値画像データとの相関関係をそれぞれ求める相関演算部ステップと、前記相関関係に基づいて最適なパラメータ値または2値化画像データを選択する最適2値化情報選択ステップと、を有し、前記2値化ステップは、フィルタにおける注目画素の係数に可変付加量を加算した複数のパラメータ値を設定するパラメータ値設定ステップと、中心の前記注目画素とその周囲の画素を含むマトリクスを形成し、前記パラメータ値が設定される前記フィルタを用いて読み取り多値画像データに対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成するフィルタ処理ステップと、前記各補正画像データを、所定の2値化閾値で2値化する2値化処理ステップと、を含む。
本発明の第3の観点は、濃淡のある読み取り多値画像から2値化画像を生成する画像処理をコンピュータに実行させるプログラムであって、多値画像として読み取られ、画像メモリに格納された読み取り多値画像に対してサンプル領域を設定するサンプル領域設定処理と、前記サンプル領域が設定された読み取り多値画像に対してフィルタ処理を行って補正画像データを生成し、当該補正画像データを2値化する2値化処理と、前記2値化処理で得られた2値化画像データと前記読み取り多値画像データとの相関関係をそれぞれ求める相関演算処理と、前記相関関係に基づいて最適なパラメータ値または2値化画像データを選択する最適2値化情報選択処理と、を有し、前記2値化処理は、フィルタにおける注目画素の係数に可変付加量を加算した複数のパラメータ値を設定するパラメータ値設定処理と、中心の前記注目画素とその周囲の画素を含むマトリクスを形成し、前記パラメータ値が設定される前記フィルタを用いて読み取り多値画像データに対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成するフィルタ処理と、前記各補正画像データを、所定の2値化閾値で2値化する画像2値化処理と、を含む画像処理をコンピュータに実行させるプログラムである。
本発明は、比較的少ない演算量で品質の高い2値化画像を得ることができる。
本発明の実施形態に係る画像処理装置の構成例を示す図である。 本実施形態の画像処理装置の読み取り対象媒体例として小切手の一例を示す図である。 本実施形態においてイメージセンサで読み取られ画像メモリに格納される小切手の原画像の例を示す図である。 本第1の実施形態に係る画像処理部の構成例を示すブロック図である。 5×5の画素マトリクスを示す図である。 図5の画素マトリクスの対応するカーネルおよびフィルタ特性の一例を示す図である。 本実施形態に係る2値化処理の概要を説明するためのフローチャートである。 パラメータの可変付加量pと、原画像および2値化画像の相関係数との関係を示す図である。 本第1の実施形態に係る画像処理装置の動作を説明するためのフローチャートである。 本実施形態の画像処理装置による原画像と2値化画像の一例を示す図である。 本第2の実施形態に係る画像処理部の構成例を示すブロック図である。 本第2の実施形態に係る画像処理装置の動作を説明するためのフローチャートである。 図2に示す小切手を撮像し、本実施形態の特徴的なサンプル領域設定、フィルタ処理および2値化処理を行った場合の2値化画像を示す第1図である。 図2に示す小切手を撮像し、本実施形態の特徴的なサンプル領域設定、フィルタ処理および2値化処理を行った場合の2値化画像を示す第2図である。 図13および図14の2値化画像の可変付加量と相関係数r(R)との関係を示す図である。 本第3の実施形態に係る画像処理部の構成例を示すブロック図である。 本第3の実施形態に係る画像処理装置の動作を説明するためのフローチャートである。 本第3の実施形態に係るサンプル領域の設定方法について説明するための図である。 本第4の実施形態に係る画像処理部の構成例を示すブロック図である。 本第4の実施形態に係る画像処理装置の動作を説明するためのフローチャートである。
以下、本発明の実施形態を図面に関連付けて説明する。
<第1実施形態>
図1は、本発明の実施形態に係る画像処理装置の構成例を示す図である。
本画像処理装置10は、画像読取部としてのイメージセンサ11、媒体搬送部12、媒体搬送駆動回路13、イメージセンサ駆動増幅回路14、機構制御部15、画像メモリ16、および画像処理部17を含んで構成されている。
本実施形態においては、画像処理装置10を画像読み取り機能を備えた小切手リーダを例として説明する。
[読み取り対象媒体である小切手の構成例]
図2は、本実施形態の画像処理装置10の読み取り対象媒体例として小切手CHKの一例を示す図である。
小切手CHKは、その券面FCにおいて、たとえば背景BGDはグレー系を基調とし、複数の箇所に発行日付、支払先の名前、金額、決済金額、支払目的(家賃や公共料金等)、サイン等を記入する記入領域FARが複数配置されている。
図2の例では、記入領域FAR1は発行日付が記入され、記入領域FAR2は支払先の名前が記入され、記入領域FAR3は金額が記入され、記入領域FAR4は決済金額が記入され、記入領域FAR5は支払目的が記入され、記入領域FAR6はサインが記入される。
図2は、多数の種類がある小切手CHKの一例であるが、基本的に、背景BGDはグレー系であり、少なくとも記入領域FARおよびその周辺部は、基本的に白地に近く背景BGDより明度が高くなるように形成されている。
以下に、このような小切手CHKの画像読み取り機能を備えた本画像処理装置10の具体的な構成および画像処理機能について説明する。
画像処理装置10において、基本的に、媒体搬送部12、媒体搬送駆動回路13、イメージセンサ駆動増幅回路14等は、動作等が機構制御部15により制御される。
本実施形態の画像処理装置10では、媒体搬送部(搬送路)12上に読み取り対象媒体である小切手CHKの券面FCの画像を読取るためのイメージセンサ11が配置されている。
イメージセンサ11は、たとえば密着型1次元撮像素子で構成され、機構制御部15の制御の下、イメージセンサ駆動増幅回路14により駆動される。
ここでは、イメージセンサ11として密着型1次元撮像素子を採用して装置の小型化等を図っているが、イメージセンサ11としては、読み取り対象媒体である小切手CHKの券面FCの全面を読み取り対象する2次元のエリアセンサ等を採用することも可能である。イメージセンサの撮像素子は、たとえばCCDやCMOSセンサにより形成される。
イメージセンサ11は、図1の例は搬送面部の上部側に配置されているが、搬送面の上部または下部または両側に配置される場合もある。
さらに小切手の処理過程で所定の事項を印字する機能をもたせるために印字ブロックが媒体搬送部12の最後段に配置されることもある。
読み取り対象媒体である小切手CHKは、券面FCをイメージセンサ11のセンサヘッド(読み取り部)に対向するよう媒体搬送部12に挿入される。
媒体搬送部12には、媒体搬送駆動回路13によて駆動される媒体搬送機構としてのローラ121,122が配置されており、このローラ121,122の駆動に伴い読み取り対象媒体である小切手CHKが、図中矢印Aで示す方向に搬送される。
媒体搬送部12に挿入された小切手CHKがイメージセンサ11のセンサヘッドを通過するとそのデジタル化された読み取り多値画像(濃淡画像)が画像メモリ16に格納(記録)される。
このように、画像メモリ16は、画像読取部としてのイメージセンサ11で読み取られた多値(濃淡)画像である原画像OIM(X)を格納する。
画像メモリ16に格納される原画像OIM(X)は、複数の画素がマトリクス状に配列されて形成され、各画素はそれぞれ画素値(輝度値)を有する。各画素値は、たとえば8ビットで表現すると0〜255の間のいずれかの値をとり、画素値は黒に近いほど小さく、白に近いほど大きな値をとる。
この原画像OIM(X)の各画素値は、たとえば後述するように、画像処理部17のフィルタ処理部において、ラプラシアンフィルタカーネルの対応する係数と掛け合わされる。これにより、原画像OIM(X)は、ラプラシアンフィルタ処理(演算処理)を受ける。
なお、ラプラシアンフィルタは、エッジ検出や先鋭化に用いる2次微分フィルタの一種である。換言すれば、ラプラシアンフィルタは空間2次微分を計算し、輪郭を検出するフィルタであり、輝度の差分の変化量が極端に大きくなっている部分を抽出するフィルタである。
図3は、本実施形態においてイメージセンサで読み取られ画像メモリに格納される小切手CHKの原画像OIM(X)の例を示す図である。
図3の原画像OIM(X)は、照明光量やその方向等の撮像条件等に起因して、背景BGDの大部分、特に、支払目的の記入領域FAR5が配置されている、小切手CHKの図中左側が文字の判別がし難くいような黒に近い状態となっている。
図3の原画像OIM(X)では、小切手CHKの中央部の、支払先の名前の記入領域FAR2、決済金額の記入領域FAR4、サインの記入領域FAR6は、読み取り可能であるが、やはり読み取り難くいように黒味がかった画像となっている。
一方、図3の原画像OIM(X)では、小切手CHKの図中右側よりに形成された発行日付の記入領域FAR1や金額の記入領域FAR3は比較的鮮明に再現性高く撮像されている。特に、金額の記入領域FAR3は問題なく判読可能な程度に再現性高く撮像されている。
画像処理部17は、画像メモリ16に格納される原画像(読み取り多値画像(濃淡画像))OIM(X)において、サンプルとして選択的に畳み込みフィルタ演算の一つであるラプラシアンフィルタ処理(演算処理)を含む画像処理を施すサンプル領域を設定する。
本第1の実施形態において、画像処理部17は、設定されたサンプル領域に対してフィルタ処理および2値化処理を行う。
画像処理部17は、この2値化処理において、まず、ラプラシアンフィルタにおける注目画素の係数αに可変付加量pを加算した複数のパラメータ値PTを設定し、設定した各パラメータ値を用いたフィルタ処理を行って、所定の2値化閾値で2値化する2値化補正処理を行う。
画像処理部17は、2値化処理されたサンプル領域の各補正画像データと原画像OIM(X)のサンプル領域との相関係数Rを計算し、相関係数Rが最も高い(大きい)補正画像データの生成に用いたパラメータ値を、最適なパラメータ値PTとして選択する。
そして、画像処理部17は、選択した最適パラメータ値PTを用いたラプラシアンフィルタ処理および2値化処理を原画像OIM(X)全体に対して行い、この全体の補正画像データを画像表示部および画像認識部に出力する。
このように、画像メモリ16に格納された画像データは、画像処理部17でフィルタ処理、2値化補正処理によって抽出された最適2値化画像が画像表示または文字認識処理で参照される。
文字認識処理は、たとえば小切手リーダに内蔵されたマイクロプロセッサで実行されるが、デジタル画像データを上位制御装置に転送して、上位側で文字認識処理を行うようにしてもよい。
もちろん媒体搬送部12上に小切手紙面に印刷されたMICR文字を読取るための磁気ヘッドを設けてもよい。
次に、第1の実施形態に係る画像処理部17の具体的な構成例について説明する。
図4は、本第1の実施形態に係る画像処理部の構成例を示すブロック図である。
図4の画像処理部17には、LCD等の画像表示部18および画像認識部19が接続されている。
図4の画像処理部17は、サンプル領域設定部20、2値化部21、相関演算部22、および最適2値化情報選択部23を含んで構成されている。
サンプル領域設定部20は、画像メモリ16に格納される原画像(濃淡のある読み取り多値画像)OIM(X)において、サンプルとして選択的に畳み込みフィルタ演算の一つであるラプラシアンフィルタ処理(演算処理)を含む画像処理を施すサンプル領域を設定する。
注目するサンプル領域が媒体によって変動しない場合は固定の領域を設定する。
本第1の実施形態においては、読み取り対象媒体である小切手CHKにおける記入領域FAR1〜6は基本的に変動しないことから、それらのうちたとえば金額の記入領域FAR3がサンプル領域SMPLとして設定される。
このサンプル領域設定部20で設定されたサンプル領域SMPLの読み取り多値(濃淡)画像データは2値化部21に供給される。
なお、サンプル領域SMPLとしては、媒体によって変動する場合は、その領域を自動的に自己判断するような仕組みをもたせることができる。
2値化部21は、ラプラシアンフィルタ処理部(フィルタ処理部)211、パラメータ設定部212、および2値化処理部213を有する。
ラプラシアンフィルタ処理部211は、サンプル領域設定部20で設定されたサンプル領域SMPLの画像に対して、パラメータ設定部212で設定される各パラメータ値PTを用いたラプラシアンフィルタ処理を行い、パラメータ値に応じたサンプル領域SMPLの補正画像データを生成して2値化処理部213に出力する。
ラプラシアンフィルタ処理(演算処理)は、2次元畳み込み行列(マトリクス)を用いた2次元畳み込みフィルタ処理の一つであり、カーネル行列を用いた演算処理を行う。
図5は、5×5の画素マトリクスを示す図である。
図6(A)および(B)は、図5の画素マトリクスの対応するカーネルおよびフィルタ特性の一例を示す図である。
図5の画素マトリクスMPXは、画素PX00〜PX04,PX10〜PX14,PX20〜PX24,PX30〜PX34,PX40〜PX44の25個の画素PXをマトリクス状に配置して構成されている。
換言すると、画素マトリクスMPXは、マトリクスの中心(中央)の画素PX22が注目画素TPXとして選定され、この注目画素TPX(PX22)と周辺の画素PX00〜PX04,PX10〜PX14,PX20,PX21,PX23,PX24,PX30〜PX34,PX40〜PX44により形成されている。
この注目画素TPXを中心した画素マトリクスの各画素に対応して、図6に示すカーネルにおいて、フィルタ処理の目的に応じてある値、たとえば「−1」、「−2」、「0」等が設定される。
図6の例では、注目画素はパラメータ値PTが(α+p)の値に設定される。
ここで、係数αは、周辺の画素PX00〜PX04,PX10〜PX14,PX20,PX21,PX23,PX24,PX30〜PX34,PX40〜PX44で使用する値の総和Σである。
pは係数αに付加する可変付加量を示し、たとえば1〜20等の正の整数に設定される。
図6の例では、周辺画素PX00〜PX04,PX10,PX20,PX30,PX14,PX24,PX34,PX40〜PX44に対応して「−1」が設定される。
また、注目画素TPX(PX22)に隣接する8個の周辺画素PX11,PX12,PX13,PX21,PX23,PX31,PX32,PX33に対応して「−2」が設定される。
したがって、図6の例では、注目画素TPXの係数αは32となる。
このラプラシアンフィルタは、図6(B)に示すように、注目画素TPXの周囲を尖鋭化するように機能する。
ラプラシアンフィルタ処理部211は、パラメータ設定部212により供給される信号S211を受けて、可変付加量pが変更されるパラメータ値PTを設定したラプラシアンフィルタを用いてサンプル領域SMPL内の読み取り多値画像データに対してラプラシアンフィルタ処理を行い、パラメータ値PTに応じた補正(多値)画像データを生成する。
ラプラシアンフィルタ処理部211は、パラメータ値PTに応じた補正画像データを信号S211として2値化処理部213に出力する。
ラプラシアンフィルタ処理部211は、パラメータ設定部212により供給される信号S212Rを受けると、最適なパラメータ値PTを受けたものと判断し、このパラメータ値PTを設定したラプラシアンフィルタを用いて読み取り多値画像データ全体に対してラプラシアンフィルタ処理を行い、パラメータ値PTに応じた補正画像データを生成する。
ラプラシアンフィルタ処理部211は、パラメータ値PTに応じた補正画像データを信号S211Rとして2値化処理部213に出力する。
パラメータ設定部212は、上述したラプラシアンフィルタ処理に適用するパラメータ値PTの可変付加量pを順次に変更したパラメータ値PTを設定し、このパラメータ値PTにたとえば番号を付し、信号S212として、ラプラシアンフィルタ処理部211に出力する。
また、パラメータ設定部212は、最適2値化情報選択部23から最適のパラメータ値PTであると報知されたパラメータ値を信号S212Rとして、再度ラプラシアンフィルタ処理部211に出力する。
2値化処理部213は、ラプラシアンフィルタ処理部211から信号S211を受けると、パラメータ値が順次変更されてラプラシアンフィルタ処理を受けたサンプル領域SMPLの各補正画像データを、所定の2値化閾値で2値化し、2値化後の各補正画像データを信号S213として相関演算部22に出力する。
2値化処理部213は、ラプラシアンフィルタ処理部211から信号S211Rを受けると、最適なパラメータ値で読み取り多値画像データ全体に対してラプラシアンフィルタ処理を受けた補正画像データを、所定の2値化閾値で2値化し、2値化後の全体補正画像データを信号S213Rとして画像表示部18および画像認識部19に出力する。
ここで2値化閾値は、たとえば固定値として説明したが、2値化閾値は、判別分析法により求めるように構成することも可能である。
判別分析法とは、画像の濃度値ヒストグラムにおいて、濃度値の集合を閾値tで2つのクラスに分割したときに、クラス内の分散が最小、クラス間の分散が最小となるようなtを閾値として決める方法である。
相関演算部22は、2値化処理部213から信号S213を受けると、サンプル領域SMPLにおける2値化補正画像データと、原画像OIM(X)のサンプル領域SMPLの画像データとの相関係数Rをそれぞれ求める。
相関演算部22は、求めた相関係数Rにフィルタ処理に用いられたパラメータ値の番号情報を含め信号S22として、最適2値化情報選択部23に出力する。
最適2値化情報選択部23は、相関演算部22による信号S22を受けて、各相関係数を比較し、相関係数Rが最も大きくなるパラメータ値PT、より具体的にはパラメータ値PTを形成する可変付加量pを用いてフィルタ処理および2値化処理を行った画像が最適な2値化画像データであると判別し、この最適な2値化画像データを生成するように、最適パラメータ値PTの情報(たとえば番号)を信号S23として、パラメータ設定部212に報知する。
このように、本第1の実施形態における最適2値化情報選択部23は、最適パラメータ情報選択部として機能する。
ここで、原画像と2値化画像との相関関係についてさらに説明する。
図7は、本実施形態に係る2値化処理の概要を示すフローチャートである。
本実施形態の2値化処理では、パラメータをもったフィルタを用いる。ひとつのパラメータ値に対してひとつの2値化画像が対応する。
2値化処理を構成するフィルタ処理および固定閾値2値化処理は、たとえば非特許文献1に開示されている方法を用いることができる。
本実施形態において、2値化画像は、上述したようにフィルタのパラメータ値PT、より具体的には、パラメータ値PTを形成する可変付加量pによって変化する。
そこで、パラーメータ値PT(p)を初期化後(ステップST1)を段階的に変化させて、原画像X(ここでは、サンプル領域)にフィルタ処理を施し変換し(ステップST2)、変換後の画像に2値化処理を施すことにより、逐次2値化画像Y(p)を求める(ステップST3)。
この処理をすべての可変付加量pで実行するすることにより(ステップST4,ST5)、各可変付加量pによって変化する複数の2値化画像を取得する。
そして、本実施形態では、その2値化画像が最も原画像Xに近いものを採用するようにしている。
その類似性の尺度として上述したように相関係数を用いることができる。相関係数は2値化画像と原画像との間で画素値に対して下記式のように計算される。
Xiは原画像の要素を表し、Yiは2値化画像の要素を表す。iは要素のインデクスを表し、画像の左上隅がi=1、右下隅がi=nとすることが多い。画像がp行×q列であれば、n=p*qである。要素とは具体的には画素値である。
相関係数R(rと示す場合もある)が最大になる2値化画像を選択すればそれが最適解となる。
しかしながら、非特許文献1の方式では、相関演算を画像全体を用いて実行するため、CPU演算能力やメモリ容量など実装に制約がある場合には演算処理コストがかさむというデメリットがある。
一方、本実施形態では、最適2値化画像を求めるための相関演算を、あらかじめ設定したサンプル領域(注目領域)に限定して計算するようにしている。
その結果、演算時間が少なくてすむとともに、サンプル領域の画像を用いて相関演算を実行することから、サンプル領域がもっとも原画像に近いという性質を備えた2値化画像が選択される。このために、より目的に沿った結果を得ることができるという利点がある。
図8は、パラメータの可変付加量pと、原画像および2値化画像の相関係数Rとの関係を示す図である。
図8において、横軸がパラメータの可変付加量pを、縦軸が相関係数Rをそれぞれ示している。
図8の例では、可変付加量pが5のときが相関係数Rが最大となっている。したがって、この場合、可変付加量pが5のパラメータ値PT(α+p)を適用したフィルタ処理および2値化処理を行って得た画像が、原画像に近いという性質を備えた2値化画像として選択される。
次に、本第1の実施形態に係る画像処理装置10の動作について図9に関連付けて説明する。
図9は、本第1の実施形態に係る画像処理装置10の動作を説明するためのフローチャートである。
読み取り対象媒体である小切手CHKが媒体搬送部12に挿入されると、小切手CHKが搬送されるに伴い、イメージセンサ11のセンサヘッドを通過するとその画像が読み取られ(ステップST11)、そのデジタル化された読み取り多値画像(濃淡画像)が画像メモリ16に格納される(ステップST12)。
次に、画像処理部17のサンプル領域設定部20において、画像メモリ16に格納される原画像(濃淡のある読み取り多値画像)OIM(X)に対して、サンプルとして選択的にラプラシアンフィルタ処理を含む画像処理を施すサンプル領域SMPLが設定される(ステップST13)。
次に、2値化部21において、設定したサンプル領域に対して以下のフィルタ処理および2値化処理が行われる。
まず、パラメータ設定部212において、ラプラシアンフィルタ処理に適用するパラメータ値PTの可変付加量pを順次に変更したパラメータ値PTが設定される(ステップST14)。このパラメータ値PTにたとえば番号を付し、信号S212として、ラプラシアンフィルタ処理部211に出力される。
ラプラシアンフィルタ処理部211において、パラメータ設定部212により供給される信号S212に応答して、可変付加量pが変更されるパラメータ値PTを設定したラプラシアンフィルタを用いてサンプル領域SMPL内の読み取り多値画像データに対してラプラシアンフィルタ処理が行われる(ステップST15)。
これにより、パラメータ値PTに応じた補正画像データが生成される(ステップST16)。
このパラメータ値PTに応じた補正画像データは信号S211として2値化処理部213に出力される。
2値化処理部213においては、ラプラシアンフィルタ処理部211からの信号S211に応答して、パラメータ値が順次変更されてラプラシアンフィルタ処理を受けたサンプル領域SMPLの各補正画像データが、所定の2値化閾値で2値化される(ステップST17)。
2値化後の各補正画像データは信号S213として相関演算部22に出力される。
ここで、フィルタのパラメータ値PT、ここでは可変付加量pのすべてについてフィルタ処理および2値化処理が行われたか否かが判別される(ステップST18)。
判別の結果、すべて終了していない場合には、ステップST14の処理に移行して、パラメータ設定部212でパラメータ値の可変付加量pが更新されて、ステップST14からステップST17の処理がすべてのパラメータ値PT(可変付加量p)についてフィルタ処理および2値化処理が行われるまで繰り返し行われる。
次に、相関演算部22において、2値化処理部213からの信号S213に応答して、サンプル領域SMPLにおける2値化画像データと、原画像OIM(X)のサンプル領域SMPLの画像データとの相関係数Rがそれぞれ求められる(ステップST19)。
求められた相関係数Rは、たとえばフィルタ処理に用いられたパラメータ値の番号情報を含め信号S22として、最適2値化情報選択部23に出力される。
最適2値化情報選択部23においては、相関演算部22による信号S22を受けて、各相関係数が比較され、相関係数Rが最も大きくなるパラメータ値PTが選択される(ステップST20)。
より具体的には、最適2値化情報選択部23において、パラメータ値PTを形成する可変付加量pを用いてフィルタ処理および2値化処理を行った画像が最適な2値化画像データであると判別される。
そして、この最適な2値化画像データを生成するように、最適パラメータ値PTの情報(たとえば番号)が信号S23として、パラメータ設定部212に報知される。
これにより、2値化部21において、2値化に最適と判別され選択されたパラメータ値PTを用いた原画像OIM(X)の全体に対してフィルタ処理および2値化処理が行われる。
すなわち、パラメータ設定部212において、最適2値化情報選択部23から最適のパラメータ値PTであると報知されたパラメータ値が信号S212Rとして、再度ラプラシアンフィルタ処理部211に出力される(ステップST21)。
次いで、ラプラシアンフィルタ処理部211において、パラメータ設定部212により供給される信号S212Rを受けると、最適なパラメータ値PTを受けたものと判断される。
そして、ラプラシアンフィルタ処理部211においては、このパラメータ値PTを設定したラプラシアンフィルタを用いて原画像OIM(X)の読み取り多値画像データ全体に対してラプラシアンフィルタ処理が行われる(ステップST22)。
これにより、パラメータ値PTに応じた原画像OIM(X)全体の補正(多値)画像データが生成される(ステップST23)。
この最適パラメータ値PTに応じた補正画像データは信号S2113として2値化処理部213に出力される。
2値化処理部213においては、ラプラシアンフィルタ処理部211からの信号S211Rに応答して、パラメータ値が順次変更されてラプラシアンフィルタ処理を受けた原画像OIM(X)全体の補正画像データが、所定の2値化閾値で2値化され(ステップST24)。
そして、2値化後の全体画像データが信号S213Rとして画像表示部18および画像認識部19に出力される。
以上説明したように、本第1の実施形態によれば、以下の効果を得ることができる。
本第1の実施形態においては、原画像に対してサンプル領域を設定して、画像全体の相関係数を計算するのではなく、注目するサンプル領域に限定して相関係数演算を行う。
こうすることによって、計算時間を短縮でき、相関演算をあらかじめ注目し設定したサンプル領域に絞ることで、その領域に最適な2値化画像を得ることが可能となる。
たとえば、媒体上に特定の文字領域がある場合は、この領域を注目のサンプル領域に設定することで、このサンプル領域をもっともよく表現する2値化画像を得ることができる。
したがって、本実施形態によれば、演算時間やメモリ容量が少なくてすむとともに、注目のサンプル領域の画像を用いて相関演算を実行することから、注目のサンプル領域が最も原画像に近いという性質を備えた2値化画像が選択されるために、より目的に沿った結果を得ることができるという利点がある。
また、本実施形態において、相関係数演算結果から、最適なパラメータ値を選択してこの最適なパラメータ値を用いたフィルタ処理および2値化処理を行うことから、サンプル領域を最もよく表現する2値化画像を得ることはもとより、画像全体においても、原画像より比較的少ない演算量で格段に再現性が高く品質の高い2値化画像を得ることが可能となる。
図10(A)および(B)は、本実施形態の画像処理装置による原画像と2値化画像の一例を示す図である。
図10(A)が原画像を、図10(B)が2値化画像をそれぞれ示している。
原画像OIM(X)は、図3に関連付けて説明したと同様、照明光量やその方向等の撮像条件等に起因して、背景BGDの大部分、特に、支払目的の記入領域FAR5が配置されている、小切手CHKの図中左側が文字の判別がし難くいような黒に近い状態となっている。
図10(A)の原画像OIM(X)では、小切手CHKの中央部の、支払先の名前の記入領域FAR2、決済金額の記入領域FAR4、サインの記入領域FAR6は、読み取り可能であるが、やはり読み取り難くいように黒味がかった画像となっている。
これに対して、本実施形態に係る2値化画像では、図10(B)に示すように、小切手CHKの中央部の、支払先の名前の記入領域FAR2、決済金額の記入領域FAR4、支払目的の記入領域FAR5やサインの記入領域FAR6は問題なく判読可能な程度に再現性高く2値化されている。
勿論、小切手CHKの図中右側よりに形成された発行日付の記入領域FAR1や金額の記入領域FAR3は比較的鮮明に再現性高く2値化されている。特に、本実施形態の注目領域(サンプル領域)の金額の記入領域FAR3は問題なく判読可能な程度に再現性高く2値化されている。
このように、本実施形態によれば、原画像で字を判読可能な領域のみならず、字の判別がし難くいような黒に近い状態となっている領域も、問題なく判読可能な程度に再現性高く最適に2値化できるという利点がある。
また、読み取り対象媒体は小切手に限らず、たとえば写真付きIDカードや運転免許証、パスポートのように写真の領域を注目のサンプル領域に設定することで、写真に最適な2値化画像を得ることができる。
注目するサンプル領域が媒体によって変動しない場合は固定の領域を設定し、媒体によって変動する場合は、その領域を自動的に自己判断するような仕組みをもたせることができる。
運転免許証を例にとれば、注目領域設定候補としては、運転免許証番号の印刷された領域や肖像写真の領域などである。
このように、本実施形態の画像処理装置10は、小切手のみならず、パスポート、運転免許証など、あらゆる媒体への適用が可能である。
<第2実施形態>
次に、第2の実施形態に係る画像処理部17Aの構成例について説明する。
図11は、本第2の実施形態に係る画像処理部の構成例を示すブロック図である。
図12は、本第2の実施形態に係る画像処理装置の動作を説明するためのフローチャートである。
本第2の実施形態に係る画像処理部17Aが第1の実施形態に係る画像処理部17と異なる点が次の通りである。
第1の実施形態の画像処理部17では、設定されたサンプル領域SMPLに対してのみ、フィルタ処理および2値化処理を行い、相関係数の演算をこのサンプル領域のみで行っている。
これに対して、本第2の実施形態の画像処理部17Aでは、設定されたサンプル領域SMPLに対してのみではなく、サンプル領域SMPLを含む原画像全体に対してフィルタ処理および2値化処理を行い(図12のステップST15A、ST16,ST17)、相関係数の演算をこのサンプル領域のみで行っている。
そして、画像処理部17Aにおいては、最適2値化情報選択部23Aで相関演算部22の相関演算の結果により最適な2値化画像が選択される。
そして、その最適な2値化画像を報知する情報が2値化処理部213に信号S23Rとして出力され、これに伴い、たとえばメモリに格納されていた複数2値化画像が選択され、信号S213Rとして、画像表示部18および画像認識部19に出力される。
本第2の実施形態によれば、パラメータ値に応じた2値化画像を一旦保持しておくメモリの容量が増えることにはなるが、ほぼ上述した第1の実施形態と同様の効果を得ることが可能である。
以上のように、本第1および第2の実施形態によれば、メモリ容量等の相違はあるものの、計算時間を短縮でき、相関演算をあらかじめ注目し設定したサンプル領域に絞ることで、その領域に最適な2値化画像を得ることが可能となる。
たとえば、媒体上に特定の文字領域がある場合は、この領域を注目のサンプル領域に設定することで、このサンプル領域をもっともよく表現する2値化画像を得ることができる。
したがって、本第1および第2の実施形態によれば、演算時間やメモリ容量が少なくてすむとともに、注目のサンプル領域の画像を用いて相関演算を実行するために、注目のサンプル領域がもっとも原画像に近いという性質を備えた2値化画像が選択されるために、より目的に沿った結果を得ることができるという利点がある。
また、本第1および第2の実施形態において、相関係数演算結果から、最適なパラメータ値を選択してこの最適なパラメータ値を用いたフィルタ処理および2値化処理を行うことから、サンプル領域をもっともよく表現する2値化画像を得ることはもとより、画像全体においても、原画像より比較的少ない演算量で格段に再現性が高く品質の高い2値化画像を得ることが可能となる。
ここで、本実施形態に係る画像処理装置10,10Aを用いて読み取り対象媒体である小切手CHKを撮像して上述した本実施形態の特徴的なサンプル領域設定、フィルタ処理および2値化処理を行った場合の2値化画像例を示す。
図13(A)〜(I)および図14(A)〜(I)は、図2に示す小切手を撮像し、本実施形態の特徴的なサンプル領域設定、フィルタ処理および2値化処理を行った場合の2値化画像を示す図である。
図13(A)および図14(A)は、撮像された原画像OIM(X)を示し、他の2値化画像には可変付加量pおよびそのときの相関係数r(R)を添えて示してある。
また、図15は、図13および図14の2値化画像の可変付加量と相関係数r(R)との関係を示す図である。
この例では、図14(B)の2値化画像、すなわち、可変付加量pが「9」である時のパラメータ値に相当する2値化画像が相関係数rが「0.373407」と最も大きく、本実施形態ではこの2値化画像が最適2値化画像として選択される。
ただし、図13および図14からわかることは、相関係数rが最も大きい2値化画像ではなくとも、可変付加量pが5以上の場合、それに対応する2値化画像は原画像では読み取り難くいように黒味がかって、判読が困難であるような領域であっても、問題なく判読可能な程度に再現性高く2値化されている。
また、相関係数rが最も大きい2値化画像を形成可能な可変付加量p(本例では9)より大きな可変付加量p(本例では10〜16)に対応する2値化画像は、再現された文字の鮮明度が若干劣っているものの、小切手全体をより明度が高くなるように、換言すれば、白地に近いような2値化画像を得ることができる。
したがって、本実施形態の特徴的なサンプル領域設定、フィルタ処理および2値化処理を行った場合の2値化画像は、原画像で字を判読可能な領域のみならず、字の判別がし難くいような黒に近い状態となっている領域も、問題なく判読可能な程度に再現性高く最適に2値化できるという利点がある。
<第3実施形態>
次に、第3の実施形態に係る画像処理部17Bの構成例について説明する。
図16は、本第3の実施形態に係る画像処理部の構成例を示すブロック図である。
図17は、本第3の実施形態に係る画像処理装置の動作を説明するためのフローチャートである。
本第3の実施形態に係る画像処理部17Bが第1の実施形態に係る画像処理部17と異なる点が次の通りである。
第1の実施形態に係る画像処理部17では、サンプル領域設定部20が小切手CHKの所定領域、具体的には最も撮像画像の輝度の高い画素が存在するであろう金額の記入領域FAR3を選択して設定している。
この方法では、記入領域FAR3が確実に輝度高く撮像される場合には問題ないものと考えられるが、たとえば図18に示すように、記入領域FAR3が撮像時に何らかの影響での判別がし難くいような黒に近い状態となった場合、相関演算の精度等に影響を及ぼしかねない。また、多様な読み取り対象媒体に適応することが困難である。
そこで、本第3の実施形態のサンプル領域設定部20Bでは、図17のステップST13に示すように、原画像OIM(X)の全体において、画素値、ここでは輝度値があらかじめ設定した閾値LVTHより高い領域をサンプル領域の設定領域として決定する。
図18は、本第3の実施形態に係るサンプル領域の設定方法について説明するための図である。
一例としては、文字が記入される発行日付の記入領域FAR1、支払先の名前の記入領域FAR2、金額の記入領域FAR3、決済金額の記入領域FAR4、支払目的の記入領域FAR5やサインの記入領域FAR6をサンプル設定領域候補とする。
そして、サンプル領域設定部20Bは、各記入領域FAR1〜FAR6の輝度値LM1〜LM6を確認し、これらの輝度値が閾値LVTHより高いか否かを判別する。ここで、仮に閾値LVTHより低い輝度値の領域がある場合はその領域を設定領域の候補から除外する。図18の例では、記入領域FAR3,FAR5が候補から除外される。
そして、サンプル領域設定部23Bは、残った領域のうち、最も輝度値の高い記入領域、図18の例では記入領域FAR1をサンプル領域として設定する。
これにより、相関演算の精度等に影響を及ぼすことなく、サンプル領域を確実に設定することが可能となる。
なお、候補として選定する輝度値は最も高い領域とすることは必ずしも必要ではなく、2番目や3番目等の領域をサンプル領域として設定するように構成することが可能である。
これにより、読み取り対象媒体の種類に応じてサンプル領域を設定することが可能となる等の利点がある。
また、上記例では、複数の記入領域をサンプル領域の設定候補とするような方法を示したが、これに限定されるものではなく、たとえば原画像全体を輝度閾値で区分けし、輝度値が高いとして選定された領域内から所定の領域をサンプル領域として設定するように構成することも可能である。
本第3の実施形態によれば、上述した第1の実施形態の効果に加えて、多様な読み取り対象媒体に適応可能で、相関演算の精度等に影響を及ぼすことなく、的確に最適な2値化処理を行うことが可能となる。
<第4実施形態>
次に、第4の実施形態に係る画像処理部17Cの構成例について説明する。
図19は、本第4の実施形態に係る画像処理部の構成例を示すブロック図である。
図20は、本第4の実施形態に係る画像処理装置の動作を説明するためのフローチャートである。
本第4の実施形態に係る画像処理部17Cは、第2の実施形態に係る画像処理部17Aの構成に、上述した第3の実施形態のサンプル領域設定部20Bと同様、サンプル領域設定部20Cにおいて、原画像OIM(X)の全体において、画素値、ここでは輝度値があらかじめ設定した閾値LVTHより高い領域をサンプル領域の設定領域として決定するように構成されている(図20のステップST13C)。
サンプル領域設定部20Cの基本的な構成おび機能は、上述た第3の実施形態のサンプル領域設定部20Bと同様であることから、ここではその詳細な説明は省略する。
本第4の実施形態によれば、上述した第2の実施形態の効果に加えて、多様な読み取り対象媒体に適応可能で、相関演算の精度等に影響を及ぼすことなく、的確に最適な2値化処理を行うことが可能となる。
なお、以上詳細に説明した方法は、上記手順に応じたプログラムとして形成し、CPU等のコンピュータで実行するように構成することも可能である。
また、このようなプログラムは、半導体メモリ、磁気ディスク、光ディスク、フロッピー(登録商標)ディスク等の記録媒体、この記録媒体をセットしたコンピュータによりアクセスし上記プログラムを実行するように構成可能である。
10,10A〜10C・・・画像処理装置、11・・・イメージセンサ(画像読取部)、12・・・媒体搬送部、13・・・媒体搬送駆動回路、14・・・イメージセンサ駆動増幅回路、15・・・機構制御部、16・・・画像メモリ、17,17A〜17C・・・画像処理部、18・・・画像表示部、19・・・画像認識部、20,20B,20C・・・サンプル領域設定部、21,21A〜21C・・・2値化部、211,211A〜211C・・・ラプラシアンフィルタ処理部(ラプラシアン演算処理部)、212・・・パラメータ設定部、213・・・2値化処理部、22・・・相関演算部、23,23A・・・最適2値化情報選択部。

Claims (9)

  1. 濃淡のある読み取り多値画像から2値化画像を生成する画像処理装置であって、
    画像を前記多値画像として読み取る画像読取部と、
    前記画像読取部による読み取り多値画像を格納する画像メモリと、
    前記画像メモリに格納された読み取り多値画像に対してサンプル領域を設定するサンプル領域設定部と、
    前記サンプル領域が設定された読み取り多値画像に対してフィルタ処理を行って補正画像データを生成し、当該補正画像データを2値化する2値化部と、
    前記2値化部で得られた2値化画像データと前記読み取り多値画像データとの相関関係をそれぞれ求める相関演算部と、
    前記相関関係に基づいて最適なパラメータ値または2値化画像データを選択する最適2値化情報選択部と、を有し、
    前記2値化部は、
    フィルタにおける注目画素の係数に可変付加量を加算した複数のパラメータ値を設定するパラメータ値設定部と、
    中心の前記注目画素とその周囲の画素を含むマトリクスを形成し、前記パラメータ値が設定される前記フィルタを用いて読み取り多値画像データに対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成するフィルタ処理部と、
    前記各補正画像データを、所定の2値化閾値で2値化する2値化処理部と、を含む
    画像処理装置。
  2. 前記2値化部の前記フィルタ処理部は、
    前記サンプル領域内の読み取り多値画像データに対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成する
    請求項1記載の画像処理装置。
  3. 前記最適2値化情報選択部は、
    前記相関関係に基づいて最適なパラメータ値を選択して、前記2値化部のパラメータ設定部に報知し、
    前記2値化部の前記フィルタ処理部は、
    前記報知されたパラメータ値を用いたフィルタ処理を読み取り多値画像の全体に対して行って、前記最適パラメータ値に応じた補正画像データを生成し、
    前記2値化処理部は、
    前記全体の補正画像データを、所定の2値化閾値で2値化する
    請求項2記載の画像処理装置。
  4. 前記2値化部の前記フィルタ処理部は、
    前記サンプル領域を含む読み取り多値画像データの全体に対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成する
    請求項1記載の画像処理装置。
  5. 前記最適2値化情報選択部は、
    前記相関関係に基づいて最適な2値化画像データを選択して、前記2値化部の2値化処理部に報知し、
    前記2値化部の前記2値化処理部は、
    前記全体の補正画像データを、所定の2値化閾値で2値化した2値化画像を出力する
    請求項4記載の画像処理装置。
  6. 前記サンプル領域設定部は、
    前記画像メモリに格納された読み取り多値画像の画素値が示す輝度値とあらかじめ設定した輝度閾値とを比較し、当該輝度閾値より高い領域の中から所定のサンプル領域を設定する
    請求項1から5のいずれか一に記載の画像処理装置。
  7. 前記画像読取部の読み取り対象媒体は、複数の記入領域を含み、
    前記サンプル領域設定部は、
    前記複数の記入領域から前記輝度閾値より高い輝度の記入領域を選択し、選択した記入力領域からサンプル領域を設定する
    請求項6記載の画像処理装置。
  8. 濃淡のある読み取り多値画像から2値化画像を生成する画像処理方法であって、
    画像を前記多値画像として読み取る画像読取ステップと、
    前記画像読取ステップによる読み取り多値画像を画像メモリに格納する画像格納ステップと、
    前記画像メモリに格納された読み取り多値画像に対してサンプル領域を設定するサンプル領域設定ステップと、
    前記サンプル領域が設定された読み取り多値画像に対してフィルタ処理を行って補正画像データを生成し、当該補正画像データを2値化する2値化ステップと、
    前記2値化ステップで得られた2値化画像データと前記読み取り多値画像データとの相関関係をそれぞれ求める相関演算部ステップと、
    前記相関関係に基づいて最適なパラメータ値または2値化画像データを選択する最適2値化情報選択ステップと、を有し、
    前記2値化ステップは、
    フィルタにおける注目画素の係数に可変付加量を加算した複数のパラメータ値を設定するパラメータ値設定ステップと、
    中心の前記注目画素とその周囲の画素を含むマトリクスを形成し、前記パラメータ値が設定される前記フィルタを用いて読み取り多値画像データに対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成するフィルタ処理ステップと、
    前記各補正画像データを、所定の2値化閾値で2値化する2値化処理ステップと、を含む
    画像処理方法。
  9. 濃淡のある読み取り多値画像から2値化画像を生成する画像処理をコンピュータに実行させるプログラムであって、
    多値画像として読み取られ、画像メモリに格納された読み取り多値画像に対してサンプル領域を設定するサンプル領域設定処理と、
    前記サンプル領域が設定された読み取り多値画像に対してフィルタ処理を行って補正画像データを生成し、当該補正画像データを2値化する2値化処理と、
    前記2値化処理で得られた2値化画像データと前記読み取り多値画像データとの相関関係をそれぞれ求める相関演算処理と、
    前記相関関係に基づいて最適なパラメータ値または2値化画像データを選択する最適2値化情報選択処理と、を有し、
    前記2値化処理は、
    フィルタにおける注目画素の係数に可変付加量を加算した複数のパラメータ値を設定するパラメータ値設定処理と、
    中心の前記注目画素とその周囲の画素を含むマトリクスを形成し、前記パラメータ値が設定される前記フィルタを用いて読み取り多値画像データに対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成するフィルタ処理と、
    前記各補正画像データを、所定の2値化閾値で2値化する画像2値化処理と、を含む
    画像処理をコンピュータに実行させるプログラム。
JP2012212208A 2012-09-26 2012-09-26 画像処理装置、画像処理方法、およびプログラム Active JP5960010B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012212208A JP5960010B2 (ja) 2012-09-26 2012-09-26 画像処理装置、画像処理方法、およびプログラム
US14/015,181 US9076225B2 (en) 2012-09-26 2013-08-30 Image processing device, an image processing method and a program to be used to implement the image processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012212208A JP5960010B2 (ja) 2012-09-26 2012-09-26 画像処理装置、画像処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2014068195A JP2014068195A (ja) 2014-04-17
JP5960010B2 true JP5960010B2 (ja) 2016-08-02

Family

ID=50338900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012212208A Active JP5960010B2 (ja) 2012-09-26 2012-09-26 画像処理装置、画像処理方法、およびプログラム

Country Status (2)

Country Link
US (1) US9076225B2 (ja)
JP (1) JP5960010B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102016004549A1 (de) * 2016-04-15 2017-11-02 Noventi Gmbh Verfahren zu Erkennung von gedruckten Texten auf Dokumenten
CN106709928B (zh) * 2016-12-22 2019-12-10 湖北工业大学 一种快速的含噪图像二维最大类间方差阈值法
JP2020067959A (ja) * 2018-10-26 2020-04-30 キヤノン株式会社 画像処理装置、その制御方法及びプログラム
CN111583157B (zh) * 2020-05-13 2023-06-02 杭州睿琪软件有限公司 图像处理方法、系统及计算机可读存储介质
CN115311147A (zh) * 2021-05-06 2022-11-08 影石创新科技股份有限公司 图像处理方法、装置、电子设备和存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06292007A (ja) * 1993-03-31 1994-10-18 Minolta Camera Co Ltd 画像処理装置および画像読取り装置
EP0811946A3 (en) * 1994-04-15 1998-01-14 Canon Kabushiki Kaisha Image pre-processor for character recognition system
JP3797404B2 (ja) * 1998-02-03 2006-07-19 富士ゼロックス株式会社 画像処理装置及び画像処理方法
JP2000331118A (ja) 1999-05-17 2000-11-30 Ricoh Co Ltd 画像処理装置及び記録媒体
JP2001119577A (ja) * 1999-10-15 2001-04-27 Sharp Corp 画像処理装置
US7426291B2 (en) * 2002-07-29 2008-09-16 Seiko Epson Corporation Apparatus and method for binarizing images of negotiable instruments using a binarization method chosen based on an image of a partial area
US7312902B2 (en) * 2003-05-02 2007-12-25 Infoprint Solutions Company, Llc Background data recording and use with document processing

Also Published As

Publication number Publication date
US9076225B2 (en) 2015-07-07
JP2014068195A (ja) 2014-04-17
US20140086473A1 (en) 2014-03-27

Similar Documents

Publication Publication Date Title
US11062130B1 (en) Systems and methods of check detection
US9898808B1 (en) Systems and methods for removing defects from images
JP5960010B2 (ja) 画像処理装置、画像処理方法、およびプログラム
Gou et al. Robust scanner identification based on noise features
RU2659745C1 (ru) Реконструкция документа из серии изображений документа
Khare et al. A blind deconvolution model for scene text detection and recognition in video
Roeder et al. A computational image analysis glossary for biologists
US8768052B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
WO2023070447A1 (zh) 模型训练方法、图像处理方法、计算处理设备及非瞬态计算机可读介质
US20230099984A1 (en) System and Method for Multimedia Analytic Processing and Display
US20190384954A1 (en) Detecting barcodes on images
Ntogas et al. A binarization algorithm for historical manuscripts
Ding et al. A novel method for detecting image sharpening based on local binary pattern
CN102737240B (zh) 分析数字文档图像的方法
Lee et al. Counterfeit bill detection algorithm using deep learning
Tsai et al. Decision-theoretic model to identify printed sources
KR101011908B1 (ko) 디지털 이미지의 노이즈 감소 방법 및 이를 이용한 이미지 처리 장치
WO2010102289A1 (en) Object-based optical character recognition pre-processing algorithm
Chakraborty et al. Review of various image processing techniques for currency note authentication
Mohammad et al. Practical recognition system for text printed on clear reflected material
Janumala et al. Development of an Algorithm for Vertebrae Identification Using Speeded up Robost Features (SURF) Technique in Scoliosis X-Ray Images
Alsandi Image Splicing Detection Scheme Using Surf and Mean-LBP Based Morphological Operations
CN112308141A (zh) 一种扫描票据分类方法、系统及可读存储介质
Singh et al. Pencil drawing of microscopic images through edge preserving filtering
Jayanthi et al. Comparative study: enhancing legibility of ancient Indian script images from diverse stone background structures using 34 different pre-processing methods

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150806

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160614

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160622

R150 Certificate of patent or registration of utility model

Ref document number: 5960010

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150