JP2013171469A - 画像処理装置、二値化閾値算出方法及びコンピュータプログラム - Google Patents

画像処理装置、二値化閾値算出方法及びコンピュータプログラム Download PDF

Info

Publication number
JP2013171469A
JP2013171469A JP2012035581A JP2012035581A JP2013171469A JP 2013171469 A JP2013171469 A JP 2013171469A JP 2012035581 A JP2012035581 A JP 2012035581A JP 2012035581 A JP2012035581 A JP 2012035581A JP 2013171469 A JP2013171469 A JP 2013171469A
Authority
JP
Japan
Prior art keywords
threshold
pixel
region
value
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012035581A
Other languages
English (en)
Other versions
JP5870745B2 (ja
Inventor
Hiroshi Tanaka
宏 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012035581A priority Critical patent/JP5870745B2/ja
Publication of JP2013171469A publication Critical patent/JP2013171469A/ja
Application granted granted Critical
Publication of JP5870745B2 publication Critical patent/JP5870745B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)

Abstract

【課題】多値画像を二値化するための二値化閾値を算出する画像処理装置、二値化閾値算出方法及びコンピュータプログラムの提供。
【解決手段】Niblackの二値化により局所閾値Tを算出し(S11)、算出した局所閾値Tを用いて局所領域及びその近傍の領域内の画像を二値化する(S13)。そして、局所領域及びその近傍の領域夫々において、黒画素及び白画素を計数し(S14)、閾値変化度を算出する(ステップS15)。算出した閾値変化度を用いて局所閾値Tに対する補正の度合いを定め、定めた補正の度合いに従って局所閾値Tを補正する。
【選択図】図11

Description

本発明は、多値画像を二値化するための二値化閾値を算出する画像処理装置、二値化閾値算出方法及びコンピュータプログラムに関する。
文書を電子化して保存する場合、画像入力手段としてスキャナ装置が使用されることが多い。スキャナ装置は、読み取り対象の原稿に光を照射する光源を有し、原稿からの反射光をCCD(Charge Coupled Device)、CIS(Contact ImageCensor)などの光学センサで読み取ることにより、原稿画像を取得する。
スキャナ装置では、光源や光学センサまでの距離など読取条件が一定であるため、高品質な画像を取得することが可能であるが、光源が有限の大きさを有しているため、文字画像の輪郭部分が不鮮明になる現象が見られる。また、出力する原稿画像の解像度が低い場合、小さな文字が鮮明でないことが多い。更に、データサイズを小さくするために、不可逆圧縮などの処理を施した出力形式が選択されることが多く、画像圧縮処理の際に文書画像の微細な特徴が失われ、画質が低下することがある。
更に、近年では、デジタルカメラによって文書を撮像することにより、文書画像を取得する機会も増えている。この場合、スキャナ装置に比べて焦点ズレによる画像のボケが発生しやすい。
以下では、スキャナ装置、デジタルカメラなどの読取装置において、様々な要因で発生する画像劣化を、画像のボケと称する。
カラー又はモノクロの多階調の文書画像を保存する場合、白黒の二値画像に変換して保存することがある。また、文書画像から文字を認識してテキストコードを抽出する場合、文書画像を二値化してから文字認識を行うことが多い。更に、文書画像を小さなデータサイズで保存する場合にも二値画像に変換してから保存することが多い。
多値画像を二値化する方法は、大別して、大域的二値化及び局所的二値化の2種類がある。大域的二値化では、入力画像全体に対して1つの二値化閾値を設定し、各画素の値(例えば、画素値)と二値化閾値との大小関係によって、画素を文字、図形などの前景画素と背景を表す背景画素とに分類する。大域的二値化の従来技術としては、大津の二値化(非特許文献1を参照)と呼ばれる手法によって二値化閾値を求める方法、特許文献1に開示された画像二値化装置などが存在する。
一方、局所的二値化は画素毎に異なった二値化閾値を設定して二値化を行う。一般に、背景が一様な画像の場合、大域的二値化を利用して二値化することが可能であるが、原稿の載置位置によって照明に偏りがある場合などのように、背景が一様でない場合や、画像中の文字などの一部がボケている場合には、原稿全体で1つの二値化閾値を適用するよりも、画素毎に二値化閾値を設定することができる局所二値化を適用することが好ましい。局所二値化の従来技術としては、Niblackの二値化と呼ばれる手法が存在する(非特許文献2を参照)。
特開平7−212591号公報
大津展之、「判別および最小2乗基準に基づく自動しきい値選定方法」、電子情報通信学会論文誌、1980年4月、'84/4 Vol. J63-D No. 4、p. 349-356 ニブラック(W. Niblack)、「デジタル画像処理入門(An Introduction toDigital Image Processing)」、Englewood Cliffs, N.J.、1986年、p. 115-116 トリーア及びジェイン(O. Trier, A. Jain)、「二値化方法のゴール指向評価(Goal-DirectedEvaluation of Binarization Methods)」、PAMI vol 17, No. 12、1995年、p. 47-58 マーディア他(K. V. Mardia, et. al)、「画像分割における空間閾値法(ASpatial Thresholding Method for Image Segmentation)」、PAMIvol.10, No. 6、1988年、p. 919-927
局所的二値化では、画素毎に局所領域を設定し、局所領域の内部に存在する画素の画素値(例えば、輝度値)により、画素値の頻度分布を求める。ただし、局所領域内では画素数が少ないため分布が安定しないこと、及び画素毎に二値化閾値を計算するために処理量が大きくなることから、局所的二値化における二値化閾値の計算には比較的単純な式を用いることが多い。例えば、非特許文献2に開示されているNiblackの二値化手法では、以下の式1〜式3を用いて、画素毎の二値化閾値Tを計算する。
ここで、wは局所領域の一辺の長さ、I(i,j)は座標(i,j)における画素値、kは適宜の定数を表す。局所領域内の画素値の頻度分布から、局所領域内での画素値の平均値m、及び標準偏差σを算出することにより、画素に適用すべき二値化閾値Tを決定することができる。
このようにして決定した二値化閾値Tを用いて二値画像を生成した例を図13に示す。図13(a)は、画像入力手段を通じて入力された多値画像の一例を示す。前述したように、出力する原稿画像の解像度が低い場合、画像圧縮処理を行った場合等において、文書画像(図13(a)に示した例では「日本語」という文字)の微細な特徴が失われ、画像のボケが生じる。図13(b)は、Niblackの二値化を利用して二値化閾値Tを算出し、二値化を行った結果を示している。図13(c)は、その部分拡大図である。
Niblackの二値化は、様々な局所二値化の中でも、二値画像を文字認識した結果が最も良いと評価された二値化技術であり(非特許文献3を参照)、精度の低い二値化方式ではない。しかしながら、二値化対象の多値画像にボケが生じている場合には、図13(b)及び図13(c)に示すように、線の一部が細くなったり、逆に線の一部が太くなったりして、文字形状の崩れが発生している。
本願の一側面として、文字、図形等の形状の崩れが少ない二値画像を生成するための二値化閾値を設定することを目的とする。
本願の画像処理装置は、夫々の画素が画素値を有する多階調の画像を取得する画像取得部と、該画像取得部が取得した画像内の任意の注目画素を含む領域、及び該領域の近傍に位置する複数の領域を設定する領域設定部と、該領域設定部が設定した各領域について、領域内に含まれる各画素の画素値を取得して、画素値の頻度分布を算出する頻度分布算出部と、該頻度分布算出部が算出した頻度分布に基づき、各領域内に含まれる各画素を二値化するための閾値を領域毎に設定する閾値設定部と、該閾値設定部が設定した領域毎の閾値を用いて、閾値以上の画素値を有する画素の数及び前記閾値未満の画素値を有する画素の数を領域毎に計数する計数部と、該計数部による計数結果に基づき、前記閾値設定部が設定した閾値夫々について領域毎の閾値の変化度合いを算出する変化度算出部と、該変化度算出部が算出した領域毎の閾値の変化度合いに応じて、前記注目画素を含む領域について設定した閾値に対する補正すべき度合いを定める補正強度決定部と、該補正強度決定部が定めた補正すべき度合いに応じて、前記閾値を補正する閾値補正部と、前記画像取得部が取得した画像内で順次的に注目画素を設定し、設定した注目画素について求めた補正後の閾値を用いて、該注目画素を二値化する二値化処理部とを備えることを特徴とする。
一態様においては、文字、図形等の形状の崩れが少ない二値画像を生成するための二値化閾値を設定することができる。
本実施の形態に係る画像処理装置の全体構成を示すブロック図である。 画像取得部の構成を示すブロック図である。 頻度分布算出部の構成を示すブロック図である。 本実施の形態に係る画像処理装置のハードウェア構成を示すブロック図である。 二値化閾値設定部の構成を示すブロック図である。 局所領域内での輝度分布による閾値変動を説明する説明図である。 従来の局所的二値化の手法を用いて二値化した画像の一例を説明する説明図である。 画像のボケによる角の丸みについて説明する説明図である。 局所的二値化に大域的二値化の閾値補正技術を適用した例を示す図である。 二値化処理部にて二値化を行った画像の一例を示す図である。 二値化閾値設定部が実行する処理の手順を説明するフローチャートである。 二値化閾値設定部が実行する処理の手順を説明するフローチャートである。 従来の局所的二値化の手法を用いて生成した二値画像の一例を示す図である。
以下、本発明をその実施の形態を示す図面に基づいて具体的に説明する。
図1は本実施の形態に係る画像処理装置の全体構成を示すブロック図である。本実施の形態に係る画像処理装置は、画像取得部10、頻度分布算出部20、二値化閾値設定部30、及び二値化処理部40を備える。
画像取得部10は、複数の画素からなる多階調のデジタル画像を取得する。図2は画像取得部10の構成を示すブロック図である。画像取得部10は、画像読取部11、輝度値変換部12、及び画像メモリ13を備える。
画像読取部11は、例えば、読取対象の原稿に対して光を照射する光源、CCDのようなイメージセンサ等を備えたスキャナ装置である。画像読取部11は、光源から照射した光の反射光をイメージセンサに結像させることにより、原稿上に記録された文字、図形等を含む画像を光学的に読取り、アナログ電気信号を生成する。
輝度値変換部12は、画像読取部11により生成されるアナログ電気信号をAD変換することにより、デジタル信号を生成する。そして、輝度値変換部12は、AD変換して得られたデジタル信号に対して、原稿読取時の光源の配光特性、イメージセンサの感度ムラ等の補正を施すことにより、各画素が輝度値で表現される2次元の画像データを生成する。
画像メモリ13は、輝度値変換部12が生成した画像データ(各画素の輝度値)を記憶する。画像データの各画素の輝度値が、例えば、0〜255の値で表現される場合、1つの画素につき1バイトの記憶領域が割り当てられる。画像メモリ13は、予め設計されたデータサイズの画像データを記憶する記憶領域を有する。
本実施の形態では、各画素の値をR(赤色)、G(緑色)、B(青色)とした場合、例えば、0.299×R+0.587×G+0.114×Bのような変換式により変換される値(いわゆるYIQ表色系における輝度信号)を用いて画素値を表現することとする。なお、各画素の画素値として、輝度値の代わりに、明度値、階調値、濃度値等を用いてもよいことは勿論のことである。
頻度分布算出部20は、画像取得部10が取得した画像について複数の画素からなる局所領域を設定し、設定した局所領域内の輝度値の頻度分布を算出する。図3は頻度分布算出部20の構成を示すブロック図である。頻度分布算出部20は、領域設定部21、局所画像取得部22、局所画像メモリ23、輝度値カウント部24、及び輝度分布メモリ25を備える。
領域設定部21は、画像メモリ13に記憶した画像データについて、この画像データを構成する画素の中から注目画素を設定し、設定した注目画素を中心とするw×w(wは5以上の奇数)の局所領域を設定する。領域設定部21は、設定した局所領域を指定する座標値を出力する。例えば、領域設定部21は、注目画素の座標を[50,100]、w=7とした場合、局所領域の左上の座標[47,97]、及び局所領域の右下の座標[53,103]を出力する。
局所画像取得部22は、領域設定部21が出力する座標を参照して局所領域内の各画素の輝度値を画像メモリ13から読み出し、局所画像メモリ23に格納する。局所画像メモリ23は、1つの画素につき1バイトの記憶領域が割り当てられ、局所領域のサイズに応じた記憶容量(w=7の場合、49バイト)を有する。以下では、局所画像メモリに格納した画像を局所画像と呼ぶ。
輝度値カウント部24は、局所画像メモリ23に格納された局所画像の各画素の輝度値を参照し、同一の輝度値を有する画素の数をカウントして輝度分布メモリ25に格納する。輝度値が、例えば、0から255までの整数値を取る場合、輝度分布メモリ25は、256個の整数要素を持つメモリ領域により実現することができる。例えば、32ビットマシン上では、輝度分布メモリ25は、4バイト整数を256個格納できる1Kバイト分のメモリ領域を有していればよい。
二値化閾値設定部30は、局所画像メモリ23及び輝度分布メモリ25に格納された記憶内容を参照して、二値化閾値を算出する。二値化閾値設定部30の構成については、後に詳述することとする。
二値化処理部40は、二値化閾値設定部30にて取得した二値化閾値と、領域設定部21で設定した注目画素の輝度値とを比較し、二値化閾値よりも注目画素の輝度値が低ければ、この注目画素を前景画素と判断して画素値0(黒画素に対応)を出力し、二値化閾値よりも注目画素の輝度値が高ければ、この注目画素を背景画素と判断して画素値1(白画素に対応)を出力する。二値化処理部40は、二値化した画素値を図に示していない画像メモリに格納する。
二値化処理部40は、二値化処理を行った注目画素が画像メモリ13に記憶されている画像データの終端の画素(例えば、左上隅の画素から順次二値化処理を行う場合、右下隅の画素)であるかを判断する。終端の画素でない場合には、二値化処理部40は、その旨を頻度分布算出部20に通知する。二値化処理部40からの通知を受けた頻度分布算出部20は、二値化すべき画素が残っているとして、注目画素を1画素分だけずらし、局所領域を再設定した上で輝度分布を算出する。そして、二値化閾値設定部30が、新たに設定された注目画素について二値化閾値を設定し、二値化処理部40が新たに設定された注目画素を二値化する。
このようにして、本実施の形態では、画像取得部10が取得した画像データについて、各画素を順次走査しならが二値化処理を行う。
図4は本実施の形態に係る画像処理装置のハードウェア構成を示すブロック図である。画像処理装置は、CPU101、ROM102、RAM103、入力インタフェース104、ハードディスクドライブ105、及び光ディスクドライブ106を備える。
ROM102には、上述したハードウェア各部の動作を制御するために必要な制御用プログラムが予め格納されている。また、ハードディスク105Dには、本願の画像処理装置を実現するためのコンピュータプログラムが予め格納されている。
CPU101は、適宜のタイミングでROM102又はハードディスク105Dに格納されているコンピュータプログラムをRAM103上に読み出し、実行することにより、上述したハードウェア各部の動作を制御することにより、本願の画像処理装置として動作させる。
RAM103は、例えば、DRAM(Dynamic RAM)、SRAM(Static RAM)、フラッシュメモリなどであり、CPU101によるコンピュータプログラムの実行時に発生する種々のデータ(例えば、画像データ、輝度分布、局所画像等)を一時的に記憶する。
入力インタフェース104には、画像読取部11として機能するスキャナ装置110が接続され、このスキャナ装置110を通じて二値化対象の画像データを取得する。
ハードディスクドライブ105は、ハードディスク105Dに対してデータの書き込み、及びハードディスク105Dからのデータの読み出しを制御する。ハードディスクドライブ105は、外部から入力された情報、光ディスクドライブ106を通じて読み込まれる情報などをハードディスク105Dに書き込むことにより、ハードディスク105Dに各種情報を記憶させる。
光ディスクドライブ106は、光ディスク106Dに対してデータの書き込み、及び光ディスク106Dに記録されたデータの読み出しを制御する。なお、本実施の形態では、本願のコンピュータプログラムがハードディスク105Dに記憶されているものとするが、光ディスク106Dに記録された状態で提供されるものであってもよい。
なお、画像処理装置は、ユーザによる操作及び文字入力を受付けるキーボード等の入力インタフェース、ユーザに報知する情報を表示するディスプレイを備えるものであってもよい。
また、本実施の形態では、スキャナ装置110を通じて二値化対象の画像データを取得する構成としたが、光ディスクドライブ106を通じて読み込まれた画像データ、図に示していない通信手段によって外部から取得した画像データ、画像処理装置内部で生成した画像データを二値化対象とすることも可能である。
画像処理装置は、ハードディスク105Dに格納されたコンピュータプログラムをCPU101に実行させ、ROM102に格納された制御用プログラムに従ってハードウェア各部を制御することにより、前述した画像取得部10、頻度分布算出部20、二値化閾値設定部30、及び二値化処理部40の各機能を実現する。
以下、二値化閾値設定部30の構成について説明する。
図5は二値化閾値設定部30の構成を示すブロック図である。二値化閾値設定部30は、閾値設定部31、二値画像生成部32、二値画像メモリ33、計数部34、変化度算出部35、補正強度決定部36及び閾値補正部37を備える。
閾値設定部31は、局所画像メモリ23及び輝度分布メモリ25に格納された記憶内容を参照して、局所画像を二値化するための局所閾値を設定する。この局所閾値は、補正後の二値化閾値を得るために利用する仮の閾値という位置付けであり、本実施の形態では、例えば、Niblackの二値化による二値化閾値を用いる。閾値設定部31は、前述した式1〜式3を、局所画像メモリ23に格納した局所画像に適用することにより、その局所画像に対する二値化閾値(以下、局所閾値Tという)を算出する。頻度分布算出部20が算出した輝度値の頻度分布をH(i)とする。ここで、iは輝度値を表す。また、H(i)は、局所画像内で輝度値iを持つ画素数を表し、輝度分布メモリ25に格納された値を用いることができる。局所画像における輝度値の平均値mは、下記の式4により、標準偏差σは下記の式5により算出することができる。閾値設定部31は、式4より求めた平均値m、式5より求めた標準偏差σを式3に代入することにより、局所閾値Tを算出する。
なお、閾値設定部31が算出した局所閾値Tと注目画素の輝度値との差分が一定値(例えば50)よりも大きい場合、算出した局所閾値Tを補正しても二値化の結果が変わらないことが予想される。その場合、二値化閾値設定部30は、これ以降の処理を行わずに(すなわち、局所閾値Tの補正を行わずに)、閾値設定部31で算出した局所閾値Tを注目画素に適用する二値化閾値として出力する構成としてもよい。これにより、計算量の削減を期待することができる。
二値画像生成部32は、局所画像メモリ23に格納されている各画素の輝度値と閾値設定部31が設定した局所閾値Tとを比較して、局所領域の二値画像を生成する。二値画像生成部32は、生成した局所領域の二値画像を二値画像メモリ33に格納する。二値画像メモリ33は、1つの画素ごとに黒画素(画素値0に対応する画素)か、白画素(画素値1に対応する画素)かを記憶すれば良いので、1つの画素あたり1ビットのメモリ領域で実現することができる。また、局所画像メモリと同一の記憶領域を持ち、1画像あたり1バイトで表現し、例えば、データが0なら黒画素、1なら白画素等のように値の意味を決めておくようにしてもよい。
なお、以下の説明において、二値画像生成部32が生成した局所領域の二値画像を、局所二値画像という。
計数部34は、二値画像メモリ33の内容を参照して黒画素及び白画素それぞれの数を計数し、計数結果を保持する。本実施の形態では、二値画像生成部32において局所二値画像を生成した後に、黒画素及び白画素の数を計数する構成としたが、計数部34が、局所画像メモリ23に格納されている各画素の輝度値と閾値設定部31が設定した局所閾値Tとを直接的に比較して、黒画素及び白画素の数を計数する構成としてもよい。この場合、二値化閾値設定部30は、二値画像生成部32及び二値画像メモリ33を備えていなくてもよい。
変化度算出部35は、計数部34による計数結果に基づき、閾値設定部31が設定した局所閾値について閾値の変化度合いを算出する。前述したように、閾値設定部31は、局所領域内での輝度分布に基づいて局所閾値Tを算出しているので、二値化前の画像における輝度分布に応じて局所閾値Tが変化する。変化度算出部35では、二値化前の画像の輝度分布に応じて変化する局所閾値Tの変化の度合いを示す指標として、閾値変化度Sを算出する。変化度算出部35は、例えば、以下の式6により閾値変化度Sを算出することができる。
ここで、n1は、局所領域内での黒画素の数を表し、n2は、局所領域内での白画素の数を表す。
補正強度決定部36は、前述した局所閾値Tに対する補正の度合いを算出する。このとき、補正強度決定部36は、設定した局所領域の近傍に黒画素及び白画素のばらつきの少ない局所領域が存在するか否かに応じて、局所閾値Tに対する補正の度合いを表す補正強度Ax,y を定める。補正強度Ax,y の算出例については後に詳述することとする。
閾値補正部37は、補正強度決定部36が決定した補正強度Ax,y に応じて、閾値設定部31が設定した閾値を補正する。
前述したように、Niblackの二値化は、精度の低い二値化方式ではないにも関わらず、二値化対象の多値画像にボケが発生している場合には、図13(b)及び図13(c)に示すように、線の一部が細くなったり、逆に線の一部が太くなったりして、文字形状の崩れが発生する。そこで、本実施の形態では、文字、図形等に形状の崩れが少ない二値画像を生成するために、閾値の補正を行う。
Niblackの二値化などの従来の局所的二値化の手法を用いて閾値を設定する場合、設定する閾値は、局所領域内の輝度分布の偏りの影響を受け易い。図6は局所領域内での輝度分布による閾値変動を説明する説明図である。図6(a)は、太線で囲む局所領域内において、文字を構成する画素(前景画素)の数と背景領域を示す画素(背景画素)の数とが同程度であり、輝度分布に偏りが少ない例を示している。この場合、従来の局所的二値化の手法を用いて設定する閾値は、低輝度領域及び高輝度領域の2つの群の中央付近の値となる。一方、図6(b)は、局所領域内において、前景画素の数が背景画素の数より多く、輝度分布に偏りがある例を示している。この場合、局所領域内において頻度が高い低輝度側の群に閾値が引っ張られ、設定する閾値は、2つの群の中央よりも低輝度側へ変動する。
このように、従来の局所的二値化の手法では、設定する閾値が局所領域内の輝度分布の偏りの影響を受け易いため、このような閾値を用いて二値化を行った場合、文字形状に崩れが発生することがある。図7は従来の局所的二値化の手法を用いて二値化した画像の一例を説明する説明図である。図7(a)に示す多値画像は、画像領域の左端側に描画された縦線とこの縦線に連結する細い横線とを有し、横線の終端が画像領域内に描画された多値画像を示している。
多値画像の縦線及び横線の交点付近の1つの画素について局所領域を設定した場合、前景画素が多く取り込まれるため、図7(b)に示すように、低輝度側の頻度が高くなり、閾値が低輝度側(前景側)に変動する。横線の中央付近では、前景画素と背景画素とがバランスよく取り込まれるため、図7(c)に示すように、閾値は、低輝度側の群と高輝度側の群との中央付近に設定される。また、横線の終端付近では、背景画素が多く取り込まれるため、図7(d)に示すように、閾値が高輝度側(背景側)に変動する。
この結果、文字の輪郭付近に存在する画像のボケによって生成された灰色の画素を二値化する場合、その位置によって前景画素(黒画素)と判定されたり、背景画素(白画素)と判定されたりする。例えば、図7(a)に示す多値画像において、横線と縦線の交点付近に存在する灰色の画素は、この画素を判定する閾値が低輝度側に変動するため、背景画素(白画素)と判定されることが多く、逆に、横線の終端付近に存在する灰色の画素は、この画素を判定する閾値が高輝度側に変動するため、前景画素(黒画素)と判定されることが多い。よって、従来の局所二値化の手法を用いて二値化を行った場合、複数の線が連結又は交差する付近では、黒画素と判定されるべき画素が白画素と判定されたり、線の終端付近では、白画素と判定されるべき画素が黒画素と判定されたりすることによって、図7(e)に示すように、文字形状の崩れが発生する。
このような、閾値変動に起因した文字形状の崩れを防止するために、閾値補正部37は、閾値設定部31が設定した閾値を補正する。本実施の形態では、大域的二値化の閾値補正技術を局所的二値化に適用することにより、閾値設定部31が設定した閾値を補正する。
輝度頻度分布での群(例えば、前景画素による群及び背景画素による群)の要素数に偏りがある場合に、閾値が変動するという現象は、大域的二値化において既に知られている。大域的二値化で求めた閾値を補正する技術として、例えば、非特許文献4が知られている。非特許文献4では、まず、従来技術により二値化閾値を計算し、その二値化閾値と各画素値との大小関係により、画素を2つのクラスに分類する。各クラスの画素値の群内平均をそれぞれz1、z2とし、それぞれのクラスに属する画素の数をn1、n2とする。また、輝度分布全体での標準偏差をσとした場合、補正後の閾値tを次の式7により求める。
この式7に依れば、各クラスの画素数によって閾値の変動が補正される。
大域的二値化の場合、閾値に変動があった場合であっても、二値画像の黒画素数が画像全体で若干増減するだけであり、例えば、文字画像の形状が崩れるというような現象は生じない。そのため、大域的二値化における閾値変動は、二値画像の品質を大きく左右する現象だとはみなされていない。
一方、局所的二値化において閾値変動が二値画像の品質に大きく影響するのは、入力多値画像のボケが大きな場合に限られている。ボケの度合いが小さい場合には、文字輪郭の周辺部でのグレイ画素の領域が小さいため、閾値変動が文字形状に与える影響が少なく、局所的二値化における閾値変動と形状の崩れとを結び付ける考え方は一般的ではなかった。このため、局所二値化において、閾値変動に起因した形状の崩れを防止するために、大局的二値化の閾値補正技術を適用するという発想は、これまで存在しなかった。
更に、本願発明者は、大局的二値化の閾値補正技術を単に局所的二値化に適用しただけでは、二値画像の品質向上を十分に達成することができない場合があることを見出している。
図8は画像のボケによる角の丸みについて説明する説明図である。図8(a)は、ボケのない画像を示している。このような画像を画像読取部11で読み取った場合、前述したように、画像のボケと称する画像劣化が生じる場合がある。画像は、有限の大きさを有する光源からの照射光に対する像として読み取られるため、2つの線が交わる角の付近では、一方の線による像(影)と他方の線による像(影)との重ね合せが発生し、像(影)と認識される領域がそれぞれの線幅よりも広がる。このため、2つの線が交わる角の付近では、図8(b)に示すように角に丸みが生じた多値画像となる。
このような多値画像を大域的二値化で二値化した場合、多値画像の角の丸みを直接的に反映した二値画像が得られる(図8(c)を参照)。
図9は局所的二値化に大域的二値化の閾値補正技術を適用した例を示す図である。図9(a)及び図9(b)は、左側の多値画像を局所的二値化する際に、前述した大域的二値化の閾値補正技術を適用して閾値補正を行い、補正後の閾値を用いて二値化した結果をそれぞれの右側に示した図である。図9(a)は、比較的に高品質な二値画像が得られているが、図9(b)では、各線が交わる角の領域が丸くなった二値画像となっている。図9(b)は、閾値補正により、二値画像の黒画素と判定された領域が広がり、図8を用いて説明したようなボケ画像の特徴と組み合わさって、角が丸い二値画像が生成された例である。
図9(b)に示すような複雑な構造を有する場合、局所的二値化において設定する局所領域の中に前景画素が多く取り込まれるため、低輝度側の頻度が高くなり、局所的二値化で設定する閾値は、低輝度側(前景側)に変動した値となる(図7(b)を参照)。大域的二値化の補正技術を適用した場合、低輝度側及び高輝度側の2つのクラスの夫々に属する画素数の相違によって、局所的二値化による閾値の変動が補正される。この結果、線が交わる角の付近に存在する灰色の画素の多くが黒画素と判定されるため、図9(b)に示すように、角が丸みを帯びた形状となる。
二値画像の形状の崩れの原因は、局所領域内の輝度頻度分布の偏りに起因した二値化閾値の変動であり、この閾値変動を補正するために、大域的二値化の閾値補正技術が有効である。しかしながら、二値化閾値の変動による形状の崩れは、単に局所領域内で閾値が変動することだけが問題でなく、閾値が変動する領域と、閾値が変動しない領域とが隣接していることが原因である。仮に、二値化閾値が変動する場合であっても、図9(b)に示すように、狭い領域に罫線が密集しているようなケースでは、隣接する夫々の局所領域において閾値変動が生じているため、形状の崩れは生じず、閾値補正の必要度は低い。
そこで、本実施の形態では、領域設定部21が設定した局所領域の近傍の領域における黒画素及び白画素のばらつき具合を考慮し、補正強度決定部36にて閾値補正の適用度合いを表す補正強度Ax,y を決定する。
閾値補正の対象の局所領域における中心座標、すなわち、注目画素の座標を(x,y)とした場合、領域設定部21は、前述したように、座標(x,y)を中心とするw×w(wは5以上の奇数)のサイズの局所領域を設定する。この局所領域の近傍の領域として、例えば、中心座標を(x+i,y+j)とし、局所領域と同じサイズを有する複数の領域を設定する。ここで、i,jは、0を除いた−w〜wの範囲の整数値をとるものとする。
なお、本実施の形態では、設定した局所領域に対し、中心座標を−w〜wの範囲で1画素ずつ変位させた領域を近傍の領域として設定する構成について説明を行うが、近傍の領域は上記に限定されるものではない。たとえば、中心座標を変位させる範囲を、例えば、−2w〜2wのように拡大してもよく、また近傍領域のサイズwに依存しない任意に範囲としてもよい。また、中心座標をk画素(kは2以上の整数)ずつ変位させて近傍の領域を定める構成であってもよい。
局所領域に対して設定する近傍の領域の夫々について、局所領域と同様に、閾値設定部31、二値画像生成部32、計数部34、及び変化度算出部35による処理を適用することにより、近傍の領域の夫々についても閾値変化度を算出する。
以下では、閾値補正の対象の局所領域について算出した閾値変化度をSx,y と表記し、その近傍の領域それぞれについて算出した閾値変化度をSx+i, y+jと表記するものとする。
補正強度決定部36は、変化度算出部35が算出した閾値変化度Sx,y ,Sx+i,y+jを用いて、座標(x,y)の注目画素について設定した局所閾値Tに対する補正の度合い(補正強度Ax,y )を算出する。
本実施の形態では、補正強度Ax,y を0〜1.0の実数値とし、補正強度Ax,y が1.0に近づくにつれて局所閾値Tを補正する度合いが高くなり、補正強度Ax,y が0に近づくにつれて局所閾値Tを補正する度合いが低くなるように係数を定める。
補正強度Ax,y の表式として、例えば、以下の式8に示すように、注目画素を含む局所領域での閾値変化度Sx,y と、その局所領域の近傍の領域について求めた閾値変化度Sx+i, y+jとの間の差分の最大値を用いて表すことができる。
閾値補正部37は、閾値設定部31が設定した局所閾値T、式7に従って算出する閾値t、及び補正強度決定部36が決定した補正強度Ax,y を用いて、補正後の閾値T’を、以下の式9により算出する。
ここで、閾値tに含まれるn1、n2の値は、計数部34が計数した黒画素及び白画素の数を用いることができ、それぞれのクラスの画素値平均z1、z2、頻度分布全体の標準偏差σは、閾値補正部37が、頻度分布メモリ25を参照することにより計算することができる。
式9は、閾値補正の適用度合いが高い場合は、閾値tの割合が強くなり,閾値補正の適用度合いが低い場合には、局所閾値Tの割合が強くなるように設定した計算式である。
閾値補正部37は、補正後の閾値T’を注目画素に適用する二値化閾値として出力する。なお、補正強度決定部36が算出した補正強度Ax,y が0である場合、閾値補正部37の演算を省略し、補正前の局所閾値Tをそのまま出力する構成とすればよい。
二値化処理部40は、閾値補正部37より出力される二値化閾値と、領域設定部21で設定した注目画素の輝度値とを比較し、二値化閾値よりも注目画素の輝度値が低ければ、この注目画素を前景画素(黒画素)と判断し、二値化閾値よりも注目画素の輝度値が高ければ、この注目画素を背景画素(白画素)と判断して、注目画素の二値化を行う。
二値化処理を行った注目画素が画像の終端の画素でない場合には、注目画素を1画素分だけずらして前述した処理を繰り返し、新たに設定した注目画素について二値化を行う。
このようにして、本実施の形態の画像処理装置は、画像取得部10が取得した画像データについて、画素を順次走査しならが二値化処理を行う。
図10は二値化処理部40にて二値化を行った画像の一例を示す図である。比較のために、多値画像には図13(a)に示すものと同一のものを使用した。本実施の形態による場合、複数の線が交わる領域において、背景画素と誤判定される可能性が少なくなるため、文字形状に崩れが少ない二値画像が生成される。
したがって、OCR(Optical Character Reader)などで文字認識をする際の認識精度の向上や、二値画像をユーザが参照する際の視認性の向上が可能となり、デジタルカメラ等によって文書画像を撮像した場合や、画像圧縮などによって文字画像の鮮明度が低下した場合であっても、文字認識、検索、参照などが精度良く実施できるようになる.
図11及び図12は二値化閾値設定部30が実行する処理の手順を説明するフローチャートである。二値化閾値設定部30の閾値設定部31は、画像取得部10が取得した画像内において、現在位置を初期値に設定する(ステップS11)。例えば、画像の左上隅から副走査方向又は主走査方向に二値化すべき注目画素を順次変更して、注目画素毎の二値化閾値を算出する場合、閾値設定部31は、現在位置の初期値として画像の左上隅に対応する座標を設定する。
次いで、閾値設定部31は、Niblackの二値化の式に基づいて、現在位置での局所閾値Tを算出する(ステップS12)。二値画像生成部32は、算出した局所閾値Tを用いて局所領域の画像(局所画像)を二値化し(ステップS13)、その結果を、二値画像メモリ33に格納する。
計数部34は、二値画像メモリ33に格納された二値画像を参照して、二値画像に含まれる黒画素及び白画素の数を計数し(ステップS14)、計数結果を変化度算出部35へ出力する。
変化度算出部35は、計数部34から通知される計数結果に基づき、閾値変化度Sを算出する(ステップS15)。変化度算出部35は、例えば、式6を用いて閾値変化度Sを算出することができる。
次いで、補正強度決定部36は、計数部34が計数した黒画素及び白画素の計数値、閾値設定部31が設定した局所閾値T、及び変化度算出部35が算出した閾値変化度Sを取得し、図に示していないメモリに記憶する(ステップS16)。
補正強度決定部36は、全画素を処理したか否かを判断し(ステップS17)、全画素を処理していない場合(S17:NO)、現在位置を次に進めて(ステップS18)、処理をステップS12へ戻す。すなわち、設定する局所領域の中心画素(注目画素)の座標を1画素ずつ変位させることにより、局所領域近傍の領域について、閾値変化度S等の算出を行う。
ステップS17で全画素を処理したと判断した場合(S17:YES)、補正強度決定部36は、現在位置を初期値に設定すると共に(ステップS19)、現在位置の局所閾値Tをメモリから取得する(ステップS20)。
次いで、補正強度決定部36は、現在位置の画素の画素値と取得した局所閾値Tとの差分が一定値(例えば、50)より大きいか否かを判断する(ステップS21)。現在位置の画素の画素値と局所閾値Tとの差分が一定値より大きい場合(S21:YES)、算出した局所閾値Tを補正しても二値化の結果が変わらないことが予想されるため、二値化閾値設定部30は、閾値設定部31で算出した局所閾値Tを現在位置の画素に適用する二値化閾値として出力する(ステップS22)。
現在位置の画素の画素値と取得した局所閾値Tとの差分が一定値以下の場合(S21:NO)、ステップS20で取得した局所閾値Tを用いて、局所領域の画像を二値化する(ステップS23)。
次いで、補正強度決定部36は、閾値変化度Sx,y ,Sx+i,y+jをメモリから取得し(ステップS24)、補正強度Ax,y を算出する(ステップS25)。補正強度決定部36は、算出した補正強度Ax,y を閾値補正部37に出力する。
閾値補正部37は、補正強度決定部36から取得した補正強度Ax,y が0であるか否かを判断する(ステップS26)。補正強度Ax,y が0である場合には(S26:YES)、閾値補正部37は、閾値設定部31が設定した局所閾値Tを注目画素に適用する二値化閾値として出力する(S22)。
補正強度Ax,y が0でない場合(S26:NO)、閾値補正部37は、現在位置の黒画素及び白画素の計数値を取得し(ステップS27)、局所閾値Tを補正する(ステップS28)。このとき、閾値補正部37は、二値化前の局所画像から、局所閾値T以上の画素を有する画素値の平均値z1及び局所閾値T未満の画素を有する画素値の平均値z2、並びに画素値の頻度分布から得られる標準偏差σを算出して、大域的二値化における閾値補正技術を用いた閾値tを求め、式9に従って補正を行うことにより、補正後の二値化閾値T’を算出する。
閾値補正部37は、補正後の閾値T’を現在位置(注目画素)に適用する二値化閾値として出力する(ステップS29)。
次いで、二値化閾値設定部30は、全画素を処理したか否かを判断する(ステップS30)。全画素を処理していないと判断した場合(S30:NO)、二値化閾値設定部30は現在位置を次に進め(ステップS31)、処理をステップS12へ戻す。
全画素を処理したと判断した場合(S30:YES)、本フローチャートによる処理を終了する。
なお、本実施の形態の変化度算出部35は、式6に従って閾値変化度Sを算出する構成としたが、閾値変化度Sの算出式は式6に限定されるものではない。閾値変化度Sは、設定する局所領域に応じて閾値が変化する度合いを表す値である。局所領域内で黒画素(又は白画素)の割合が高くなるほど、閾値変化度Sの絶対値が大きくなるように、閾値変化度Sの表式を定めればよい。
変化度算出部35は、例えば、前述した式6に代えて、以下の式10により閾値変化度Sを算出してもよい。
更に、変化度算出部35は、式10に代えて、以下の式11により閾値変化度Sを算出してもよい。
式6、式10、式11は、何れも局所領域内での黒画素(又は白画素)の割合が高くなるほど、閾値変化度Sが1(又は−1)に近づくように計算式を定めている。
局所領域内での黒画素(又は白画素)の割合を同一とした場合、閾値変化度Sの絶対値は、式11、式6、式10の順に大きくなる。したがって、閾値補正を強く適用したい場合には、式10に従って閾値変化度Sを算出し、閾値補正を弱く適用したい場合には、式11に従って閾値変化度Sを算出するといった使い分けが可能である。
また、二値化対象の画像の種類(例えば、文字画像、網点画像といった種類)に応じて、適用する式を予め選択しておいてもよい。この場合、画像の種類毎にそれぞれの式を適用して生成した二値画像をユーザが検証し、得られる二値画像の品質が最も高くなるように何れかの式を選択すればよい。得られる二値画像の品質が同程度である場合には、計算量が最も少ない式6を選択すればよい。
また、本実施の形態の補正強度決定部36は、式8に従って補正強度Ax,y を算出する構成としたが、補正強度Ax,y の算出式は式8に限定されるものではない。補正強度Ax,y は、前述した閾値変化度Sに基づいて算出される閾値補正の適用度合いを示す値である。閾値補正の対象の局所領域から求めた閾値変化度Sx,y と、その近傍の領域から求めた閾値変化度Sx+i, y+jとの差が大きいほど、補正強度Ax,y の値が大きくなるように、補正強度Ax,y の表式を定めればよい。
補正強度決定部36は、例えば、前述した式8に代えて、以下の式12により補正強度Ax,y を算出してもよい。
式12では、閾値補正の対象の局所領域から求めた閾値変化度Sx,y と、その近傍の領域から求めた閾値変化度Sx+i, y+jとの間の差分の平均値を用いて、補正強度Ax,y を定めている。平均値を用いる場合、最大値を用いる場合と比較して値が小さくなるため、0.5で除算していた係数を0.3に変更している。これらの係数は、生成される二値画像の品質に応じて適宜設定すればよい。
式12を用いる場合、画素毎の局所的な変動に対する感度が低下するので、画像中に微小なノイズが多い場合に適している。
以上の実施の形態に関し、更に以下の付記を開示する。
(付記1)
夫々の画素が画素値を有する多階調の画像を取得する画像取得部と、
該画像取得部が取得した画像内の任意の注目画素を含む領域、及び該領域の近傍に位置する複数の領域を設定する領域設定部と、
該領域設定部が設定した各領域について、領域内に含まれる各画素の画素値を取得して、画素値の頻度分布を算出する頻度分布算出部と、
該頻度分布算出部が算出した頻度分布に基づき、各領域内に含まれる各画素を二値化するための閾値を領域毎に設定する閾値設定部と、
該閾値設定部が設定した領域毎の閾値を用いて、閾値以上の画素値を有する画素の数及び前記閾値未満の画素値を有する画素の数を領域毎に計数する計数部と、
該計数部による計数結果に基づき、前記閾値設定部が設定した閾値夫々について領域毎の閾値の変化度合いを算出する変化度算出部と、
該変化度算出部が算出した領域毎の閾値の変化度合いに応じて、前記注目画素を含む領域について設定した閾値に対する補正すべき度合いを定める補正強度決定部と、
該補正強度決定部が定めた補正すべき度合いに応じて、前記閾値を補正する閾値補正部と、
前記画像取得部が取得した画像内で順次的に注目画素を設定し、設定した注目画素について求めた補正後の閾値を用いて、該注目画素を二値化する二値化処理部と
を備えることを特徴とする画像処理装置。
(付記2)
前記補正強度算出部は、
前記変化度算出部が算出した前記注目画素を含む領域における閾値の変化度合いと前記領域の近傍に位置する複数の領域における閾値の変化度合い夫々との間の差分を算出し、
算出した差分の最大値又は平均値の大小に応じて、補正すべき度合いの高低を定めるようにしてあることを特徴とする付記1に記載の画像処理装置。
(付記3)
前記閾値補正部は、
前記頻度分布算出部が前記注目画素を含む領域について算出した頻度分布から画素値の標準偏差を算出し、
前記画像取得部が取得した画像内の前記注目画素を含む領域内で、前記閾値設定部が設定した閾値以上の画素値を有する画素の画素値平均、及び前記閾値未満の画素値を有する画素の画素値平均を算出し、
算出した標準偏差、及び前記閾値以上及び閾値未満の画素値を有する画素の画素値平均、並びに前記計数部が前記注目画素を含む領域について計数した閾値以上の画素値を有する画素の数及び前記閾値未満の画素値を有する画素の数を用いて、第2の閾値を算出し、
前記閾値設定部が前記注目画素について設定した閾値、算出した第2の閾値、及び前記補正強度決定部が定めた補正すべき度合いに基づき、補正後の閾値を算出するようにしてあることを特徴とする付記1又は付記2に記載の画像処理装置。
(付記4)
コンピュータが、
夫々の画素が画素値を有する多階調の画像について、画像内の任意の注目画素を含む領域、及び該領域の近傍に位置する複数の領域を設定し、
設定した各領域について、領域内に含まれる各画素の画素値を取得して、画素値の頻度分布を算出し、
算出した頻度分布に基づき、各領域内に含まれる各画素を二値化するための閾値を領域毎に設定し、
設定した領域毎の閾値を用いて、閾値以上の画素値を有する画素の数及び前記閾値未満の画素値を有する画素の数を領域毎に計数し、
計数した結果に基づき、設定した閾値夫々について領域毎の閾値の変化度合いを算出し、
算出した領域毎の閾値の変化度合いに応じて、前記注目画素を含む領域について設定した閾値に対する補正すべき度合いを定め、
定めた補正すべき度合いに応じて、前記閾値を補正することにより、前記注目画素を二値化するための二値化閾値を取得する
ことを特徴とする二値化閾値算出方法。
(付記5)
前記コンピュータが、
前記注目画素を含む領域における閾値の変化度合いと前記領域の近傍に位置する複数の領域における閾値の変化度合い夫々との間の差分を算出し、
算出した差分の最大値又は平均値の大小に応じて、補正すべき度合いの高低を定めることを特徴とする付記4に記載の二値化閾値算出方法。
(付記6)
前記コンピュータが、
前記注目画素を含む領域について算出した頻度分布から画素値の標準偏差を算出し、
前記注目画素を含む領域内で、設定した閾値以上の画素値を有する画素の画素値平均、及び前記閾値未満の画素値を有する画素の画素値平均を算出し、
算出した標準偏差、及び前記閾値以上及び閾値未満の画素値を有する画素の画素値平均、並びに前記注目画素を含む領域について計数した閾値以上の画素値を有する画素の数及び前記閾値未満の画素値を有する画素の数を用いて、第2の閾値を算出し、
前記注目画素について設定した閾値、算出した第2の閾値、及び前記補正すべき度合いに基づき、補正後の閾値を算出することを特徴とする付記4又は付記5に記載の二値化閾値算出方法。
(付記7)
コンピュータに、
夫々の画素が画素値を有する多階調の画像について、画像内の任意の注目画素を含む領域、及び該領域の近傍に位置する複数の領域を設定し、
設定した各領域について、領域内に含まれる各画素の画素値を取得して、画素値の頻度分布を算出し、
算出した頻度分布に基づき、各領域内に含まれる各画素を二値化するための閾値を領域毎に設定し、
設定した領域毎の閾値を用いて、閾値以上の画素値を有する画素の数及び前記閾値未満の画素値を有する画素の数を領域毎に計数し、
計数した結果に基づき、設定した閾値夫々について領域毎の閾値の変化度合いを算出し、
算出した領域毎の閾値の変化度合いに応じて、前記注目画素を含む領域について設定した閾値に対する補正すべき度合いを定め、
定めた補正すべき度合いに応じて、前記閾値を補正することにより、前記注目画素を二値化するための二値化閾値を取得する
処理を実行させることを特徴とするコンピュータプログラム。
(付記8)
前記コンピュータに、
前記注目画素を含む領域における閾値の変化度合いと前記領域の近傍に位置する複数の領域における閾値の変化度合い夫々との間の差分を算出し、
算出した差分の最大値又は平均値の大小に応じて、補正すべき度合いの高低を定める
処理を実行させることを特徴とする付記7に記載のコンピュータプログラム。
(付記9)
前記コンピュータに、
前記注目画素を含む領域について算出した頻度分布から画素値の標準偏差を算出し、
前記注目画素を含む領域内で、設定した閾値以上の画素値を有する画素の画素値平均、及び前記閾値未満の画素値を有する画素の画素値平均を算出し、
算出した標準偏差、及び前記閾値以上及び閾値未満の画素値を有する画素の画素値平均、並びに前記注目画素を含む領域について計数した閾値以上の画素値を有する画素の数及び前記閾値未満の画素値を有する画素の数を用いて、第2の閾値を算出し、
前記注目画素について設定した閾値、算出した第2の閾値、及び前記補正すべき度合いに基づき、補正後の閾値を算出する
処理を実行させることを特徴とする付記7又は8に記載のコンピュータプログラム。
10 画像取得部
11 画像読取部
12 輝度値変換部
13 画像メモリ
20 頻度分布算出部
21 領域設定部
22 局所画像取得部
23 局所画像メモリ
24 輝度値カウント部
25 輝度分布メモリ
30 二値化閾値設定部
31 閾値設定部
32 二値画像生成部
33 二値画像メモリ
34 計数部
35 変化度算出部
36 補正強度決定部
37 閾値補正部
40 二値化処理部

Claims (5)

  1. 夫々の画素が画素値を有する多階調の画像を取得する画像取得部と、
    該画像取得部が取得した画像内の任意の注目画素を含む領域、及び該領域の近傍に位置する複数の領域を設定する領域設定部と、
    該領域設定部が設定した各領域について、領域内に含まれる各画素の画素値を取得して、画素値の頻度分布を算出する頻度分布算出部と、
    該頻度分布算出部が算出した頻度分布に基づき、各領域内に含まれる各画素を二値化するための閾値を領域毎に設定する閾値設定部と、
    該閾値設定部が設定した領域毎の閾値を用いて、閾値以上の画素値を有する画素の数及び前記閾値未満の画素値を有する画素の数を領域毎に計数する計数部と、
    該計数部による計数結果に基づき、前記閾値設定部が設定した閾値夫々について領域毎の閾値の変化度合いを算出する変化度算出部と、
    該変化度算出部が算出した領域毎の閾値の変化度合いに応じて、前記注目画素を含む領域について設定した閾値に対する補正すべき度合いを定める補正強度決定部と、
    該補正強度決定部が定めた補正すべき度合いに応じて、前記閾値を補正する閾値補正部と、
    前記画像取得部が取得した画像内で順次的に注目画素を設定し、設定した注目画素について求めた補正後の閾値を用いて、該注目画素を二値化する二値化処理部と
    を備えることを特徴とする画像処理装置。
  2. 前記補正強度算出部は、
    前記変化度算出部が算出した前記注目画素を含む領域における閾値の変化度合いと前記領域の近傍に位置する複数の領域における閾値の変化度合い夫々との間の差分を算出し、
    算出した差分の最大値又は平均値の大小に応じて、補正すべき度合いの高低を定めるようにしてあることを特徴とする請求項1に記載の画像処理装置。
  3. 前記閾値補正部は、
    前記頻度分布算出部が前記注目画素を含む領域について算出した頻度分布から画素値の標準偏差を算出し、
    前記画像取得部が取得した画像内の前記注目画素を含む領域内で、前記閾値設定部が設定した閾値以上の画素値を有する画素の画素値平均、及び前記閾値未満の画素値を有する画素の画素値平均を算出し、
    算出した標準偏差、及び前記閾値以上及び閾値未満の画素値を有する画素の画素値平均、並びに前記計数部が前記注目画素を含む領域について計数した閾値以上の画素値を有する画素の数及び前記閾値未満の画素値を有する画素の数を用いて、第2の閾値を算出し、
    前記閾値設定部が前記注目画素について設定した閾値、算出した第2の閾値、及び前記補正強度決定部が定めた補正すべき度合いに基づき、補正後の閾値を算出するようにしてあることを特徴とする請求項1又は請求項2に記載の画像処理装置。
  4. コンピュータが、
    夫々の画素が画素値を有する多階調の画像について、画像内の任意の注目画素を含む領域、及び該領域の近傍に位置する複数の領域を設定し、
    設定した各領域について、領域内に含まれる各画素の画素値を取得して、画素値の頻度分布を算出し、
    算出した頻度分布に基づき、各領域内に含まれる各画素を二値化するための閾値を領域毎に設定し、
    設定した領域毎の閾値を用いて、閾値以上の画素値を有する画素の数及び前記閾値未満の画素値を有する画素の数を領域毎に計数し、
    計数した結果に基づき、設定した閾値夫々について領域毎の閾値の変化度合いを算出し、
    算出した領域毎の閾値の変化度合いに応じて、前記注目画素を含む領域について設定した閾値に対する補正すべき度合いを定め、
    定めた補正すべき度合いに応じて、前記閾値を補正することにより、前記注目画素を二値化するための二値化閾値を取得する
    ことを特徴とする二値化閾値算出方法。
  5. コンピュータに、
    夫々の画素が画素値を有する多階調の画像について、画像内の任意の注目画素を含む領域、及び該領域の近傍に位置する複数の領域を設定し、
    設定した各領域について、領域内に含まれる各画素の画素値を取得して、画素値の頻度分布を算出し、
    算出した頻度分布に基づき、各領域内に含まれる各画素を二値化するための閾値を領域毎に設定し、
    設定した領域毎の閾値を用いて、閾値以上の画素値を有する画素の数及び前記閾値未満の画素値を有する画素の数を領域毎に計数し、
    計数した結果に基づき、設定した閾値夫々について領域毎の閾値の変化度合いを算出し、
    算出した領域毎の閾値の変化度合いに応じて、前記注目画素を含む領域について設定した閾値に対する補正すべき度合いを定め、
    定めた補正すべき度合いに応じて、前記閾値を補正することにより、前記注目画素を二値化するための二値化閾値を取得する
    処理を実行させることを特徴とするコンピュータプログラム。
JP2012035581A 2012-02-21 2012-02-21 画像処理装置、二値化閾値算出方法及びコンピュータプログラム Active JP5870745B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012035581A JP5870745B2 (ja) 2012-02-21 2012-02-21 画像処理装置、二値化閾値算出方法及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012035581A JP5870745B2 (ja) 2012-02-21 2012-02-21 画像処理装置、二値化閾値算出方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2013171469A true JP2013171469A (ja) 2013-09-02
JP5870745B2 JP5870745B2 (ja) 2016-03-01

Family

ID=49265348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012035581A Active JP5870745B2 (ja) 2012-02-21 2012-02-21 画像処理装置、二値化閾値算出方法及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP5870745B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2661793C1 (ru) * 2017-05-10 2018-07-19 Акционерное общество "Научно-Производственный Комплекс "Альфа-М" Способ обработки матрицы чисел
RU2662630C1 (ru) * 2017-08-14 2018-07-26 Акционерное общество "Научно-Производственный Комплекс "Альфа-М" Способ фильтрации бинарного изображения
CN111062910A (zh) * 2019-11-13 2020-04-24 易思维(杭州)科技有限公司 局部阈值分割方法及缺陷检测方法
CN111967282A (zh) * 2020-07-09 2020-11-20 广州洛图终端技术有限公司 彩票阅读器灵敏度校正方法、系统、装置和存储介质
CN113362319A (zh) * 2021-06-30 2021-09-07 深圳市创想三维科技股份有限公司 基于图像处理的激光打印方法和装置、激光打印机、计算机可读存储介质
CN114757913A (zh) * 2022-04-15 2022-07-15 电子科技大学 一种显示屏缺陷检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10285399A (ja) * 1997-03-31 1998-10-23 Toyota Central Res & Dev Lab Inc 画像の二値化方法
JP2001155146A (ja) * 1999-11-26 2001-06-08 Fujitsu Ltd 画像処理装置及び画像処理方法
JP2009105768A (ja) * 2007-10-24 2009-05-14 Fujitsu Ltd 画像処理プログラム、画像処理装置、および画像処理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10285399A (ja) * 1997-03-31 1998-10-23 Toyota Central Res & Dev Lab Inc 画像の二値化方法
JP2001155146A (ja) * 1999-11-26 2001-06-08 Fujitsu Ltd 画像処理装置及び画像処理方法
JP2009105768A (ja) * 2007-10-24 2009-05-14 Fujitsu Ltd 画像処理プログラム、画像処理装置、および画像処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6015024859; 田中宏 外2名: '二値化閾値の補正による低解像度画像に頑強な文字抽出用二値化' 電子情報通信学会技術研究報告 Vol.110 No.467 PRMU2010-237-PRMU201 第110巻 第467号, 20110303, pp.99-104 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2661793C1 (ru) * 2017-05-10 2018-07-19 Акционерное общество "Научно-Производственный Комплекс "Альфа-М" Способ обработки матрицы чисел
RU2662630C1 (ru) * 2017-08-14 2018-07-26 Акционерное общество "Научно-Производственный Комплекс "Альфа-М" Способ фильтрации бинарного изображения
CN111062910A (zh) * 2019-11-13 2020-04-24 易思维(杭州)科技有限公司 局部阈值分割方法及缺陷检测方法
CN111967282A (zh) * 2020-07-09 2020-11-20 广州洛图终端技术有限公司 彩票阅读器灵敏度校正方法、系统、装置和存储介质
CN111967282B (zh) * 2020-07-09 2022-12-13 广州洛图终端技术有限公司 彩票阅读器灵敏度校正方法、系统、装置和存储介质
CN113362319A (zh) * 2021-06-30 2021-09-07 深圳市创想三维科技股份有限公司 基于图像处理的激光打印方法和装置、激光打印机、计算机可读存储介质
CN114757913A (zh) * 2022-04-15 2022-07-15 电子科技大学 一种显示屏缺陷检测方法

Also Published As

Publication number Publication date
JP5870745B2 (ja) 2016-03-01

Similar Documents

Publication Publication Date Title
JP5768590B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5870745B2 (ja) 画像処理装置、二値化閾値算出方法及びコンピュータプログラム
EP1910994B1 (en) Binarization of an image
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
CN110298282B (zh) 文档图像处理方法、存储介质和计算设备
RU2721188C2 (ru) Улучшение контраста и снижение шума на изображениях, полученных с камер
JP2002084420A (ja) 画像処理装置、画像処理方法および画像処理プログラムが格納された記録媒体
US8538191B2 (en) Image correction apparatus and method for eliminating lighting component
JPH09179930A (ja) 情報再生システム、情報記録媒体、及び情報記録装置
JP4764903B2 (ja) テキストマップの中からライン構造を検出する方法および画像処理装置
JP2004166007A (ja) 画像処理装置及び画像処理方法、画像処理プログラム、記憶媒体
EP2536123B1 (en) Image processing method and image processing apparatus
JP3886727B2 (ja) 画像処理装置
WO2004029867A1 (ja) 画像補正装置および画像補正方法
CN111445402A (zh) 一种图像去噪方法及装置
JP3906221B2 (ja) 画像処理方法及び画像処理装置
US11570331B2 (en) Image processing apparatus, image processing method, and storage medium
KR100603618B1 (ko) 어파인 변환을 이용한 문서 영상의 기하학적 왜곡 보정장치 및 방법
JP4569785B2 (ja) 二値化装置及び二値化処理プログラム
JP4227530B2 (ja) 画像処理装置および画像処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム
JP4790031B2 (ja) 画像処理装置、画像処理方法、プログラム及び記録媒体
JP2004128643A (ja) 画像の傾き補正方法
JP3966448B2 (ja) 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体
JP3358133B2 (ja) 画像処理装置
JP6815274B2 (ja) 画像読取装置及び画像読取方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151228

R150 Certificate of patent or registration of utility model

Ref document number: 5870745

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150