JP5960010B2 - 画像処理装置、画像処理方法、およびプログラム - Google Patents
画像処理装置、画像処理方法、およびプログラム Download PDFInfo
- Publication number
- JP5960010B2 JP5960010B2 JP2012212208A JP2012212208A JP5960010B2 JP 5960010 B2 JP5960010 B2 JP 5960010B2 JP 2012212208 A JP2012212208 A JP 2012212208A JP 2012212208 A JP2012212208 A JP 2012212208A JP 5960010 B2 JP5960010 B2 JP 5960010B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- binarization
- unit
- image data
- read
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000000034 method Methods 0.000 claims description 74
- 230000008569 process Effects 0.000 claims description 59
- 238000004364 calculation method Methods 0.000 claims description 48
- 238000001914 filtration Methods 0.000 claims description 23
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000010586 diagram Methods 0.000 description 20
- 101150115562 FAR3 gene Proteins 0.000 description 11
- 101100334284 Arabidopsis thaliana FAR6 gene Proteins 0.000 description 7
- 102100022366 Fatty acyl-CoA reductase 1 Human genes 0.000 description 7
- 101000824458 Homo sapiens Fatty acyl-CoA reductase 1 Proteins 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 101100334283 Arabidopsis thaliana FAR5 gene Proteins 0.000 description 6
- 101100334282 Arabidopsis thaliana FAR4 gene Proteins 0.000 description 5
- 102100029595 Fatty acyl-CoA reductase 2 Human genes 0.000 description 5
- 101000917301 Homo sapiens Fatty acyl-CoA reductase 2 Proteins 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 230000003321 amplification Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 102100035353 Cyclin-dependent kinase 2-associated protein 1 Human genes 0.000 description 1
- 102220509678 Guanine deaminase_S23R_mutation Human genes 0.000 description 1
- 101000760620 Homo sapiens Cell adhesion molecule 1 Proteins 0.000 description 1
- 102100029860 Suppressor of tumorigenicity 20 protein Human genes 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 108090000237 interleukin-24 Proteins 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration by the use of local operators
-
- G06T5/92—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/01—Solutions for problems related to non-uniform document background
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
特許文献1には、一般的なグレー(濃淡)画像から、アプリケーションの目的に適した2値化画像を生成する技術が開示されている。
この技術では、一般的な2値化の後、中間階調部分に発生しがちなノイズを連結成分の有無を利用した追加処理によって除去する。
しかし、この技術では、特に画像に大きい輝度ムラがある場合には対応しきれない場合がある。
これにより、計算時間を短縮でき、相関演算をあらかじめ注目し設定したサンプル領域に絞ることで、その領域に最適な2値化画像を得ることが可能となる。
図1は、本発明の実施形態に係る画像処理装置の構成例を示す図である。
図2は、本実施形態の画像処理装置10の読み取り対象媒体例として小切手CHKの一例を示す図である。
小切手CHKは、その券面FCにおいて、たとえば背景BGDはグレー系を基調とし、複数の箇所に発行日付、支払先の名前、金額、決済金額、支払目的(家賃や公共料金等)、サイン等を記入する記入領域FARが複数配置されている。
図2の例では、記入領域FAR1は発行日付が記入され、記入領域FAR2は支払先の名前が記入され、記入領域FAR3は金額が記入され、記入領域FAR4は決済金額が記入され、記入領域FAR5は支払目的が記入され、記入領域FAR6はサインが記入される。
画像処理装置10において、基本的に、媒体搬送部12、媒体搬送駆動回路13、イメージセンサ駆動増幅回路14等は、動作等が機構制御部15により制御される。
イメージセンサ11は、たとえば密着型1次元撮像素子で構成され、機構制御部15の制御の下、イメージセンサ駆動増幅回路14により駆動される。
ここでは、イメージセンサ11として密着型1次元撮像素子を採用して装置の小型化等を図っているが、イメージセンサ11としては、読み取り対象媒体である小切手CHKの券面FCの全面を読み取り対象する2次元のエリアセンサ等を採用することも可能である。イメージセンサの撮像素子は、たとえばCCDやCMOSセンサにより形成される。
イメージセンサ11は、図1の例は搬送面部の上部側に配置されているが、搬送面の上部または下部または両側に配置される場合もある。
さらに小切手の処理過程で所定の事項を印字する機能をもたせるために印字ブロックが媒体搬送部12の最後段に配置されることもある。
媒体搬送部12には、媒体搬送駆動回路13によて駆動される媒体搬送機構としてのローラ121,122が配置されており、このローラ121,122の駆動に伴い読み取り対象媒体である小切手CHKが、図中矢印Aで示す方向に搬送される。
媒体搬送部12に挿入された小切手CHKがイメージセンサ11のセンサヘッドを通過するとそのデジタル化された読み取り多値画像(濃淡画像)が画像メモリ16に格納(記録)される。
画像メモリ16に格納される原画像OIM(X)は、複数の画素がマトリクス状に配列されて形成され、各画素はそれぞれ画素値(輝度値)を有する。各画素値は、たとえば8ビットで表現すると0〜255の間のいずれかの値をとり、画素値は黒に近いほど小さく、白に近いほど大きな値をとる。
この原画像OIM(X)の各画素値は、たとえば後述するように、画像処理部17のフィルタ処理部において、ラプラシアンフィルタカーネルの対応する係数と掛け合わされる。これにより、原画像OIM(X)は、ラプラシアンフィルタ処理(演算処理)を受ける。
図3の原画像OIM(X)は、照明光量やその方向等の撮像条件等に起因して、背景BGDの大部分、特に、支払目的の記入領域FAR5が配置されている、小切手CHKの図中左側が文字の判別がし難くいような黒に近い状態となっている。
図3の原画像OIM(X)では、小切手CHKの中央部の、支払先の名前の記入領域FAR2、決済金額の記入領域FAR4、サインの記入領域FAR6は、読み取り可能であるが、やはり読み取り難くいように黒味がかった画像となっている。
一方、図3の原画像OIM(X)では、小切手CHKの図中右側よりに形成された発行日付の記入領域FAR1や金額の記入領域FAR3は比較的鮮明に再現性高く撮像されている。特に、金額の記入領域FAR3は問題なく判読可能な程度に再現性高く撮像されている。
本第1の実施形態において、画像処理部17は、設定されたサンプル領域に対してフィルタ処理および2値化処理を行う。
画像処理部17は、この2値化処理において、まず、ラプラシアンフィルタにおける注目画素の係数αに可変付加量pを加算した複数のパラメータ値PTを設定し、設定した各パラメータ値を用いたフィルタ処理を行って、所定の2値化閾値で2値化する2値化補正処理を行う。
画像処理部17は、2値化処理されたサンプル領域の各補正画像データと原画像OIM(X)のサンプル領域との相関係数Rを計算し、相関係数Rが最も高い(大きい)補正画像データの生成に用いたパラメータ値を、最適なパラメータ値PTとして選択する。
そして、画像処理部17は、選択した最適パラメータ値PTを用いたラプラシアンフィルタ処理および2値化処理を原画像OIM(X)全体に対して行い、この全体の補正画像データを画像表示部および画像認識部に出力する。
文字認識処理は、たとえば小切手リーダに内蔵されたマイクロプロセッサで実行されるが、デジタル画像データを上位制御装置に転送して、上位側で文字認識処理を行うようにしてもよい。
もちろん媒体搬送部12上に小切手紙面に印刷されたMICR文字を読取るための磁気ヘッドを設けてもよい。
図4は、本第1の実施形態に係る画像処理部の構成例を示すブロック図である。
図4の画像処理部17には、LCD等の画像表示部18および画像認識部19が接続されている。
注目するサンプル領域が媒体によって変動しない場合は固定の領域を設定する。
本第1の実施形態においては、読み取り対象媒体である小切手CHKにおける記入領域FAR1〜6は基本的に変動しないことから、それらのうちたとえば金額の記入領域FAR3がサンプル領域SMPLとして設定される。
このサンプル領域設定部20で設定されたサンプル領域SMPLの読み取り多値(濃淡)画像データは2値化部21に供給される。
図5は、5×5の画素マトリクスを示す図である。
図6(A)および(B)は、図5の画素マトリクスの対応するカーネルおよびフィルタ特性の一例を示す図である。
換言すると、画素マトリクスMPXは、マトリクスの中心(中央)の画素PX22が注目画素TPXとして選定され、この注目画素TPX(PX22)と周辺の画素PX00〜PX04,PX10〜PX14,PX20,PX21,PX23,PX24,PX30〜PX34,PX40〜PX44により形成されている。
図6の例では、注目画素はパラメータ値PTが(α+p)の値に設定される。
ここで、係数αは、周辺の画素PX00〜PX04,PX10〜PX14,PX20,PX21,PX23,PX24,PX30〜PX34,PX40〜PX44で使用する値の総和Σである。
pは係数αに付加する可変付加量を示し、たとえば1〜20等の正の整数に設定される。
また、注目画素TPX(PX22)に隣接する8個の周辺画素PX11,PX12,PX13,PX21,PX23,PX31,PX32,PX33に対応して「−2」が設定される。
したがって、図6の例では、注目画素TPXの係数αは32となる。
このラプラシアンフィルタは、図6(B)に示すように、注目画素TPXの周囲を尖鋭化するように機能する。
ラプラシアンフィルタ処理部211は、パラメータ値PTに応じた補正画像データを信号S211として2値化処理部213に出力する。
ラプラシアンフィルタ処理部211は、パラメータ値PTに応じた補正画像データを信号S211Rとして2値化処理部213に出力する。
また、パラメータ設定部212は、最適2値化情報選択部23から最適のパラメータ値PTであると報知されたパラメータ値を信号S212Rとして、再度ラプラシアンフィルタ処理部211に出力する。
判別分析法とは、画像の濃度値ヒストグラムにおいて、濃度値の集合を閾値tで2つのクラスに分割したときに、クラス内の分散が最小、クラス間の分散が最小となるようなtを閾値として決める方法である。
相関演算部22は、求めた相関係数Rにフィルタ処理に用いられたパラメータ値の番号情報を含め信号S22として、最適2値化情報選択部23に出力する。
このように、本第1の実施形態における最適2値化情報選択部23は、最適パラメータ情報選択部として機能する。
図7は、本実施形態に係る2値化処理の概要を示すフローチャートである。
本実施形態の2値化処理では、パラメータをもったフィルタを用いる。ひとつのパラメータ値に対してひとつの2値化画像が対応する。
2値化処理を構成するフィルタ処理および固定閾値2値化処理は、たとえば非特許文献1に開示されている方法を用いることができる。
そこで、パラーメータ値PT(p)を初期化後(ステップST1)を段階的に変化させて、原画像X(ここでは、サンプル領域)にフィルタ処理を施し変換し(ステップST2)、変換後の画像に2値化処理を施すことにより、逐次2値化画像Y(p)を求める(ステップST3)。
この処理をすべての可変付加量pで実行するすることにより(ステップST4,ST5)、各可変付加量pによって変化する複数の2値化画像を取得する。
そして、本実施形態では、その2値化画像が最も原画像Xに近いものを採用するようにしている。
Xiは原画像の要素を表し、Yiは2値化画像の要素を表す。iは要素のインデクスを表し、画像の左上隅がi=1、右下隅がi=nとすることが多い。画像がp行×q列であれば、n=p*qである。要素とは具体的には画素値である。
しかしながら、非特許文献1の方式では、相関演算を画像全体を用いて実行するため、CPU演算能力やメモリ容量など実装に制約がある場合には演算処理コストがかさむというデメリットがある。
その結果、演算時間が少なくてすむとともに、サンプル領域の画像を用いて相関演算を実行することから、サンプル領域がもっとも原画像に近いという性質を備えた2値化画像が選択される。このために、より目的に沿った結果を得ることができるという利点がある。
図8において、横軸がパラメータの可変付加量pを、縦軸が相関係数Rをそれぞれ示している。
図9は、本第1の実施形態に係る画像処理装置10の動作を説明するためのフローチャートである。
次に、画像処理部17のサンプル領域設定部20において、画像メモリ16に格納される原画像(濃淡のある読み取り多値画像)OIM(X)に対して、サンプルとして選択的にラプラシアンフィルタ処理を含む画像処理を施すサンプル領域SMPLが設定される(ステップST13)。
まず、パラメータ設定部212において、ラプラシアンフィルタ処理に適用するパラメータ値PTの可変付加量pを順次に変更したパラメータ値PTが設定される(ステップST14)。このパラメータ値PTにたとえば番号を付し、信号S212として、ラプラシアンフィルタ処理部211に出力される。
これにより、パラメータ値PTに応じた補正画像データが生成される(ステップST16)。
このパラメータ値PTに応じた補正画像データは信号S211として2値化処理部213に出力される。
2値化後の各補正画像データは信号S213として相関演算部22に出力される。
判別の結果、すべて終了していない場合には、ステップST14の処理に移行して、パラメータ設定部212でパラメータ値の可変付加量pが更新されて、ステップST14からステップST17の処理がすべてのパラメータ値PT(可変付加量p)についてフィルタ処理および2値化処理が行われるまで繰り返し行われる。
求められた相関係数Rは、たとえばフィルタ処理に用いられたパラメータ値の番号情報を含め信号S22として、最適2値化情報選択部23に出力される。
より具体的には、最適2値化情報選択部23において、パラメータ値PTを形成する可変付加量pを用いてフィルタ処理および2値化処理を行った画像が最適な2値化画像データであると判別される。
そして、この最適な2値化画像データを生成するように、最適パラメータ値PTの情報(たとえば番号)が信号S23として、パラメータ設定部212に報知される。
すなわち、パラメータ設定部212において、最適2値化情報選択部23から最適のパラメータ値PTであると報知されたパラメータ値が信号S212Rとして、再度ラプラシアンフィルタ処理部211に出力される(ステップST21)。
次いで、ラプラシアンフィルタ処理部211において、パラメータ設定部212により供給される信号S212Rを受けると、最適なパラメータ値PTを受けたものと判断される。
そして、ラプラシアンフィルタ処理部211においては、このパラメータ値PTを設定したラプラシアンフィルタを用いて原画像OIM(X)の読み取り多値画像データ全体に対してラプラシアンフィルタ処理が行われる(ステップST22)。
これにより、パラメータ値PTに応じた原画像OIM(X)全体の補正(多値)画像データが生成される(ステップST23)。
この最適パラメータ値PTに応じた補正画像データは信号S2113として2値化処理部213に出力される。
そして、2値化後の全体画像データが信号S213Rとして画像表示部18および画像認識部19に出力される。
本第1の実施形態においては、原画像に対してサンプル領域を設定して、画像全体の相関係数を計算するのではなく、注目するサンプル領域に限定して相関係数演算を行う。
こうすることによって、計算時間を短縮でき、相関演算をあらかじめ注目し設定したサンプル領域に絞ることで、その領域に最適な2値化画像を得ることが可能となる。
たとえば、媒体上に特定の文字領域がある場合は、この領域を注目のサンプル領域に設定することで、このサンプル領域をもっともよく表現する2値化画像を得ることができる。
したがって、本実施形態によれば、演算時間やメモリ容量が少なくてすむとともに、注目のサンプル領域の画像を用いて相関演算を実行することから、注目のサンプル領域が最も原画像に近いという性質を備えた2値化画像が選択されるために、より目的に沿った結果を得ることができるという利点がある。
図10(A)が原画像を、図10(B)が2値化画像をそれぞれ示している。
図10(A)の原画像OIM(X)では、小切手CHKの中央部の、支払先の名前の記入領域FAR2、決済金額の記入領域FAR4、サインの記入領域FAR6は、読み取り可能であるが、やはり読み取り難くいように黒味がかった画像となっている。
勿論、小切手CHKの図中右側よりに形成された発行日付の記入領域FAR1や金額の記入領域FAR3は比較的鮮明に再現性高く2値化されている。特に、本実施形態の注目領域(サンプル領域)の金額の記入領域FAR3は問題なく判読可能な程度に再現性高く2値化されている。
このように、本実施形態によれば、原画像で字を判読可能な領域のみならず、字の判別がし難くいような黒に近い状態となっている領域も、問題なく判読可能な程度に再現性高く最適に2値化できるという利点がある。
注目するサンプル領域が媒体によって変動しない場合は固定の領域を設定し、媒体によって変動する場合は、その領域を自動的に自己判断するような仕組みをもたせることができる。
運転免許証を例にとれば、注目領域設定候補としては、運転免許証番号の印刷された領域や肖像写真の領域などである。
このように、本実施形態の画像処理装置10は、小切手のみならず、パスポート、運転免許証など、あらゆる媒体への適用が可能である。
次に、第2の実施形態に係る画像処理部17Aの構成例について説明する。
図11は、本第2の実施形態に係る画像処理部の構成例を示すブロック図である。
図12は、本第2の実施形態に係る画像処理装置の動作を説明するためのフローチャートである。
第1の実施形態の画像処理部17では、設定されたサンプル領域SMPLに対してのみ、フィルタ処理および2値化処理を行い、相関係数の演算をこのサンプル領域のみで行っている。
これに対して、本第2の実施形態の画像処理部17Aでは、設定されたサンプル領域SMPLに対してのみではなく、サンプル領域SMPLを含む原画像全体に対してフィルタ処理および2値化処理を行い(図12のステップST15A、ST16,ST17)、相関係数の演算をこのサンプル領域のみで行っている。
そして、画像処理部17Aにおいては、最適2値化情報選択部23Aで相関演算部22の相関演算の結果により最適な2値化画像が選択される。
そして、その最適な2値化画像を報知する情報が2値化処理部213に信号S23Rとして出力され、これに伴い、たとえばメモリに格納されていた複数2値化画像が選択され、信号S213Rとして、画像表示部18および画像認識部19に出力される。
たとえば、媒体上に特定の文字領域がある場合は、この領域を注目のサンプル領域に設定することで、このサンプル領域をもっともよく表現する2値化画像を得ることができる。
したがって、本第1および第2の実施形態によれば、演算時間やメモリ容量が少なくてすむとともに、注目のサンプル領域の画像を用いて相関演算を実行するために、注目のサンプル領域がもっとも原画像に近いという性質を備えた2値化画像が選択されるために、より目的に沿った結果を得ることができるという利点がある。
図13(A)および図14(A)は、撮像された原画像OIM(X)を示し、他の2値化画像には可変付加量pおよびそのときの相関係数r(R)を添えて示してある。
また、図15は、図13および図14の2値化画像の可変付加量と相関係数r(R)との関係を示す図である。
また、相関係数rが最も大きい2値化画像を形成可能な可変付加量p(本例では9)より大きな可変付加量p(本例では10〜16)に対応する2値化画像は、再現された文字の鮮明度が若干劣っているものの、小切手全体をより明度が高くなるように、換言すれば、白地に近いような2値化画像を得ることができる。
したがって、本実施形態の特徴的なサンプル領域設定、フィルタ処理および2値化処理を行った場合の2値化画像は、原画像で字を判読可能な領域のみならず、字の判別がし難くいような黒に近い状態となっている領域も、問題なく判読可能な程度に再現性高く最適に2値化できるという利点がある。
次に、第3の実施形態に係る画像処理部17Bの構成例について説明する。
図16は、本第3の実施形態に係る画像処理部の構成例を示すブロック図である。
図17は、本第3の実施形態に係る画像処理装置の動作を説明するためのフローチャートである。
第1の実施形態に係る画像処理部17では、サンプル領域設定部20が小切手CHKの所定領域、具体的には最も撮像画像の輝度の高い画素が存在するであろう金額の記入領域FAR3を選択して設定している。
この方法では、記入領域FAR3が確実に輝度高く撮像される場合には問題ないものと考えられるが、たとえば図18に示すように、記入領域FAR3が撮像時に何らかの影響での判別がし難くいような黒に近い状態となった場合、相関演算の精度等に影響を及ぼしかねない。また、多様な読み取り対象媒体に適応することが困難である。
一例としては、文字が記入される発行日付の記入領域FAR1、支払先の名前の記入領域FAR2、金額の記入領域FAR3、決済金額の記入領域FAR4、支払目的の記入領域FAR5やサインの記入領域FAR6をサンプル設定領域候補とする。
そして、サンプル領域設定部20Bは、各記入領域FAR1〜FAR6の輝度値LM1〜LM6を確認し、これらの輝度値が閾値LVTHより高いか否かを判別する。ここで、仮に閾値LVTHより低い輝度値の領域がある場合はその領域を設定領域の候補から除外する。図18の例では、記入領域FAR3,FAR5が候補から除外される。
そして、サンプル領域設定部23Bは、残った領域のうち、最も輝度値の高い記入領域、図18の例では記入領域FAR1をサンプル領域として設定する。
これにより、読み取り対象媒体の種類に応じてサンプル領域を設定することが可能となる等の利点がある。
次に、第4の実施形態に係る画像処理部17Cの構成例について説明する。
図19は、本第4の実施形態に係る画像処理部の構成例を示すブロック図である。
図20は、本第4の実施形態に係る画像処理装置の動作を説明するためのフローチャートである。
サンプル領域設定部20Cの基本的な構成おび機能は、上述た第3の実施形態のサンプル領域設定部20Bと同様であることから、ここではその詳細な説明は省略する。
また、このようなプログラムは、半導体メモリ、磁気ディスク、光ディスク、フロッピー(登録商標)ディスク等の記録媒体、この記録媒体をセットしたコンピュータによりアクセスし上記プログラムを実行するように構成可能である。
Claims (9)
- 濃淡のある読み取り多値画像から2値化画像を生成する画像処理装置であって、
画像を前記多値画像として読み取る画像読取部と、
前記画像読取部による読み取り多値画像を格納する画像メモリと、
前記画像メモリに格納された読み取り多値画像に対してサンプル領域を設定するサンプル領域設定部と、
前記サンプル領域が設定された読み取り多値画像に対してフィルタ処理を行って補正画像データを生成し、当該補正画像データを2値化する2値化部と、
前記2値化部で得られた2値化画像データと前記読み取り多値画像データとの相関関係をそれぞれ求める相関演算部と、
前記相関関係に基づいて最適なパラメータ値または2値化画像データを選択する最適2値化情報選択部と、を有し、
前記2値化部は、
フィルタにおける注目画素の係数に可変付加量を加算した複数のパラメータ値を設定するパラメータ値設定部と、
中心の前記注目画素とその周囲の画素を含むマトリクスを形成し、前記パラメータ値が設定される前記フィルタを用いて読み取り多値画像データに対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成するフィルタ処理部と、
前記各補正画像データを、所定の2値化閾値で2値化する2値化処理部と、を含む
画像処理装置。 - 前記2値化部の前記フィルタ処理部は、
前記サンプル領域内の読み取り多値画像データに対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成する
請求項1記載の画像処理装置。 - 前記最適2値化情報選択部は、
前記相関関係に基づいて最適なパラメータ値を選択して、前記2値化部のパラメータ設定部に報知し、
前記2値化部の前記フィルタ処理部は、
前記報知されたパラメータ値を用いたフィルタ処理を読み取り多値画像の全体に対して行って、前記最適パラメータ値に応じた補正画像データを生成し、
前記2値化処理部は、
前記全体の補正画像データを、所定の2値化閾値で2値化する
請求項2記載の画像処理装置。 - 前記2値化部の前記フィルタ処理部は、
前記サンプル領域を含む読み取り多値画像データの全体に対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成する
請求項1記載の画像処理装置。 - 前記最適2値化情報選択部は、
前記相関関係に基づいて最適な2値化画像データを選択して、前記2値化部の2値化処理部に報知し、
前記2値化部の前記2値化処理部は、
前記全体の補正画像データを、所定の2値化閾値で2値化した2値化画像を出力する
請求項4記載の画像処理装置。 - 前記サンプル領域設定部は、
前記画像メモリに格納された読み取り多値画像の画素値が示す輝度値とあらかじめ設定した輝度閾値とを比較し、当該輝度閾値より高い領域の中から所定のサンプル領域を設定する
請求項1から5のいずれか一に記載の画像処理装置。 - 前記画像読取部の読み取り対象媒体は、複数の記入領域を含み、
前記サンプル領域設定部は、
前記複数の記入領域から前記輝度閾値より高い輝度の記入領域を選択し、選択した記入力領域からサンプル領域を設定する
請求項6記載の画像処理装置。 - 濃淡のある読み取り多値画像から2値化画像を生成する画像処理方法であって、
画像を前記多値画像として読み取る画像読取ステップと、
前記画像読取ステップによる読み取り多値画像を画像メモリに格納する画像格納ステップと、
前記画像メモリに格納された読み取り多値画像に対してサンプル領域を設定するサンプル領域設定ステップと、
前記サンプル領域が設定された読み取り多値画像に対してフィルタ処理を行って補正画像データを生成し、当該補正画像データを2値化する2値化ステップと、
前記2値化ステップで得られた2値化画像データと前記読み取り多値画像データとの相関関係をそれぞれ求める相関演算部ステップと、
前記相関関係に基づいて最適なパラメータ値または2値化画像データを選択する最適2値化情報選択ステップと、を有し、
前記2値化ステップは、
フィルタにおける注目画素の係数に可変付加量を加算した複数のパラメータ値を設定するパラメータ値設定ステップと、
中心の前記注目画素とその周囲の画素を含むマトリクスを形成し、前記パラメータ値が設定される前記フィルタを用いて読み取り多値画像データに対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成するフィルタ処理ステップと、
前記各補正画像データを、所定の2値化閾値で2値化する2値化処理ステップと、を含む
画像処理方法。 - 濃淡のある読み取り多値画像から2値化画像を生成する画像処理をコンピュータに実行させるプログラムであって、
多値画像として読み取られ、画像メモリに格納された読み取り多値画像に対してサンプル領域を設定するサンプル領域設定処理と、
前記サンプル領域が設定された読み取り多値画像に対してフィルタ処理を行って補正画像データを生成し、当該補正画像データを2値化する2値化処理と、
前記2値化処理で得られた2値化画像データと前記読み取り多値画像データとの相関関係をそれぞれ求める相関演算処理と、
前記相関関係に基づいて最適なパラメータ値または2値化画像データを選択する最適2値化情報選択処理と、を有し、
前記2値化処理は、
フィルタにおける注目画素の係数に可変付加量を加算した複数のパラメータ値を設定するパラメータ値設定処理と、
中心の前記注目画素とその周囲の画素を含むマトリクスを形成し、前記パラメータ値が設定される前記フィルタを用いて読み取り多値画像データに対してフィルタ処理を行い、前記パラメータ値に応じた補正画像データを生成するフィルタ処理と、
前記各補正画像データを、所定の2値化閾値で2値化する画像2値化処理と、を含む
画像処理をコンピュータに実行させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012212208A JP5960010B2 (ja) | 2012-09-26 | 2012-09-26 | 画像処理装置、画像処理方法、およびプログラム |
US14/015,181 US9076225B2 (en) | 2012-09-26 | 2013-08-30 | Image processing device, an image processing method and a program to be used to implement the image processing |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012212208A JP5960010B2 (ja) | 2012-09-26 | 2012-09-26 | 画像処理装置、画像処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014068195A JP2014068195A (ja) | 2014-04-17 |
JP5960010B2 true JP5960010B2 (ja) | 2016-08-02 |
Family
ID=50338900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012212208A Active JP5960010B2 (ja) | 2012-09-26 | 2012-09-26 | 画像処理装置、画像処理方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9076225B2 (ja) |
JP (1) | JP5960010B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102016004549A1 (de) * | 2016-04-15 | 2017-11-02 | Noventi Gmbh | Verfahren zu Erkennung von gedruckten Texten auf Dokumenten |
CN106709928B (zh) * | 2016-12-22 | 2019-12-10 | 湖北工业大学 | 一种快速的含噪图像二维最大类间方差阈值法 |
JP2020067959A (ja) * | 2018-10-26 | 2020-04-30 | キヤノン株式会社 | 画像処理装置、その制御方法及びプログラム |
CN111583157B (zh) * | 2020-05-13 | 2023-06-02 | 杭州睿琪软件有限公司 | 图像处理方法、系统及计算机可读存储介质 |
CN115311147A (zh) * | 2021-05-06 | 2022-11-08 | 影石创新科技股份有限公司 | 图像处理方法、装置、电子设备和存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06292007A (ja) * | 1993-03-31 | 1994-10-18 | Minolta Camera Co Ltd | 画像処理装置および画像読取り装置 |
EP0811946A3 (en) * | 1994-04-15 | 1998-01-14 | Canon Kabushiki Kaisha | Image pre-processor for character recognition system |
JP3797404B2 (ja) * | 1998-02-03 | 2006-07-19 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理方法 |
JP2000331118A (ja) | 1999-05-17 | 2000-11-30 | Ricoh Co Ltd | 画像処理装置及び記録媒体 |
JP2001119577A (ja) * | 1999-10-15 | 2001-04-27 | Sharp Corp | 画像処理装置 |
US7426291B2 (en) * | 2002-07-29 | 2008-09-16 | Seiko Epson Corporation | Apparatus and method for binarizing images of negotiable instruments using a binarization method chosen based on an image of a partial area |
US7312902B2 (en) * | 2003-05-02 | 2007-12-25 | Infoprint Solutions Company, Llc | Background data recording and use with document processing |
-
2012
- 2012-09-26 JP JP2012212208A patent/JP5960010B2/ja active Active
-
2013
- 2013-08-30 US US14/015,181 patent/US9076225B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US9076225B2 (en) | 2015-07-07 |
JP2014068195A (ja) | 2014-04-17 |
US20140086473A1 (en) | 2014-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11062130B1 (en) | Systems and methods of check detection | |
US9898808B1 (en) | Systems and methods for removing defects from images | |
JP5960010B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
Gou et al. | Robust scanner identification based on noise features | |
RU2659745C1 (ru) | Реконструкция документа из серии изображений документа | |
Khare et al. | A blind deconvolution model for scene text detection and recognition in video | |
Roeder et al. | A computational image analysis glossary for biologists | |
US8768052B2 (en) | Image processing apparatus, image processing method, and non-transitory computer readable medium | |
WO2023070447A1 (zh) | 模型训练方法、图像处理方法、计算处理设备及非瞬态计算机可读介质 | |
US20230099984A1 (en) | System and Method for Multimedia Analytic Processing and Display | |
US20190384954A1 (en) | Detecting barcodes on images | |
Ntogas et al. | A binarization algorithm for historical manuscripts | |
Ding et al. | A novel method for detecting image sharpening based on local binary pattern | |
CN102737240B (zh) | 分析数字文档图像的方法 | |
Lee et al. | Counterfeit bill detection algorithm using deep learning | |
Tsai et al. | Decision-theoretic model to identify printed sources | |
KR101011908B1 (ko) | 디지털 이미지의 노이즈 감소 방법 및 이를 이용한 이미지 처리 장치 | |
WO2010102289A1 (en) | Object-based optical character recognition pre-processing algorithm | |
Chakraborty et al. | Review of various image processing techniques for currency note authentication | |
Mohammad et al. | Practical recognition system for text printed on clear reflected material | |
Janumala et al. | Development of an Algorithm for Vertebrae Identification Using Speeded up Robost Features (SURF) Technique in Scoliosis X-Ray Images | |
Alsandi | Image Splicing Detection Scheme Using Surf and Mean-LBP Based Morphological Operations | |
CN112308141A (zh) | 一种扫描票据分类方法、系统及可读存储介质 | |
Singh et al. | Pencil drawing of microscopic images through edge preserving filtering | |
Jayanthi et al. | Comparative study: enhancing legibility of ancient Indian script images from diverse stone background structures using 34 different pre-processing methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150806 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160614 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160622 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5960010 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |