JP4966384B2 - シェーディング補正を行なう装置及び方法 - Google Patents

シェーディング補正を行なう装置及び方法 Download PDF

Info

Publication number
JP4966384B2
JP4966384B2 JP2010010371A JP2010010371A JP4966384B2 JP 4966384 B2 JP4966384 B2 JP 4966384B2 JP 2010010371 A JP2010010371 A JP 2010010371A JP 2010010371 A JP2010010371 A JP 2010010371A JP 4966384 B2 JP4966384 B2 JP 4966384B2
Authority
JP
Japan
Prior art keywords
image
light intensity
background pixels
image block
background
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010010371A
Other languages
English (en)
Other versions
JP2010191952A (ja
Inventor
ウェン ドンチャオ
シュ リーフェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2010191952A publication Critical patent/JP2010191952A/ja
Application granted granted Critical
Publication of JP4966384B2 publication Critical patent/JP4966384B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像全体又は一部にシェーディングのある画像に対してシェーディング補正を行なう装置及び方法に関する。
シェーディング・アーティファクト(以降、シェーディングとも呼ぶ)は、印刷物等のカメラ又はスキャナを用いた結像に対する非常に一般的な問題である。シェーディング・アーティファクトは、印刷物の不均一な照明及び非平面形状により含まれる可能性がある。
関連技術において、カメラ又はスキャナにより取り込まれた文書画像におけるシェーディング・アーティファクトの問題に対処する多くの文献及び特許が存在する。
米国特許第5,912,992号公報には、シェーディングを含む画像から事前にシェーディングを除去することによりシェーディングの影響のない文字及び行等の物体を抽出する方法を開示する。しかし、この発明は、主にライセンスプレート画像を処理することを目的とし、一般的な文書(例えば、紙の文書又は書籍)画像の処理に関する教示を与ない。
米国特許第6,788,822号公報は、MSR(multi-scale retinex)を使用してシェーディング補正を行なう方法を開示し、最適なダイナミックレンジをDC画像に提供する。しかし、retinexを計算するのは、非常に時間のかかる処理である。更に、retinexは画像中のシェーディングを完全に除去できない。
米国特許第6,577,762号公報は、文書画像の背景画像を生成するための閾値処理技術を開示し、背景画像を使用して画像の背景を正規化する。しかし、米国特許第6,577,762号公報の開示は、文書画像に大きな空白領域(例えば、ページの四辺の余白、行間)が存在すると仮定し、空白領域に従って背景画像を推定する。しかし、文書によっては、行間が非常に小さく、背景を推定するためにこの技術により使用できない。この場合、ページの四辺の余白にのみ依存することにより、例えば撮影環境に2つ以上の光源が存在する場合は推定される背景は不正確になる。
本発明は、従来技術における不足する点又は欠点の少なくとも一部に対処することに関する。
米国特許第5,912,992号公報 米国特許第6,788,822号公報 米国特許第6,577,762号公報
本発明は、従来技術における不足する点又は欠点の少なくとも一部に対処することに関する。
本発明によると、画像における光強度分布を自動的に推定でき且つ推定された光強度分布に従ってシェーディング・アーティファクトを除去できる方法が提供される。
本発明に係る方法は、全体又は一部にシェーディングのある画像(I)に対してシェーディング補正を行なう方法であって、前記画像(I)から背景画素を抽出する工程と、前記抽出した背景画素に従って光強度画像を生成する工程と、前記光強度画像を用いて、前記画像(I)からシェーディングを除去する工程とを備え、前記画像(I)から背景画素を抽出する工程は、前記画像(I)を複数の画像ブロックに分割する工程と、当該分割された各画像ブロックに2値化を適用し、前記各画像ブロックに対応する2値画像ブロックを生成する工程と、前記各2値画像ブロックを参照することにより、前記各画像ブロックから背景画素の第1の集合を検出する工程と、前記各画像ブロックから検出された前記背景画素の第1の集合に対して、前景画素及びノイズ画素の除去用の閾値T1およびT2を求めるための関数を適用することにより、前記各画像ブロックについて光強度範囲[T1,T2]を決定する工程と、前記各画像ブロックから検出された前記背景画素の第1の集合から、光強度が前記光強度範囲[T1,T2]内にある背景画素の第2の集合を背景画素として抽出する工程と、を備えることを特徴とする。
本発明を使用して、画像におけるシェーディングは効果的且つより正確に除去され、画像に対するOCR精度は向上される。
本発明の一実施形態によると、詳細には背景画素を検出し且つ/又は光強度画像を生成する時に画像ブロックに基づいて前記検出及び前記生成を実行するように画像を画像ブロックに分割することにより、更に詳細には先に抽出された背景画素の第1の集合から光強度範囲に基づいて背景画素の第2の集合を更に抽出することにより、背景画素はより正確に判定され、光強度画像は背景画素に従ってより適切に生成される。
本発明の一実施形態に係るシェーディング補正方法を示すフローチャートである。 本発明の異なる実施形態に従って背景画素を検出するステップを示す例示的なフローチャートである。 本発明の異なる実施形態に従って背景画素を検出するステップを示す例示的なフローチャートである。 本発明の一実施形態に従って、画像Iから背景画素の第1の集合を抽出し、背景画素の第1の集合の光強度範囲[T1,T2]を判定する処理を示すフローチャートである。 本発明の一実施形態に従って光強度画像を生成する処理を示すフローチャートである。 本発明の一実施形態に係るシェーディング補正を行なう装置を示すブロック図である。 撮影又は走査等が行なわれる紙の文書に対するシェーディングを含む原画像を示す図である。 本発明の一実現例に従って図7の原画像から生成された2値画像を示す図である。 本発明の一実現例に従って推定された図7の原画像の光強度分散を示す光強度画像を示す図である。 図7の原画像のシェーディングを除去した画像を示す図である。 本発明が適用されるOCRシステムの処理を示すフローチャートである。
本発明の上述の特徴及び利点は単なる例示であり、本発明の他の特徴及び利点は、以下の詳細な説明を熟慮又は調査することにより当業者により容易に理解されるか、あるいは本発明の実施により認識される。
本明細書に取り入れられ且つ本明細書の一部を構成する添付の図面は、本発明の原理を更に理解するために提供され、本発明の範囲を限定するものではない。本発明の例示的な実施形態を図示する。
第1及び第2等の関係を示す用語は、エンティティ、項目又は動作間の任意の実際の関係又は順序を必ずしも要求せず又は示さず、1つのエンティティ、項目又は動作を別のエンティティ、項目又は動作と区別するために使用されることが理解される。
本発明の多くの機能性及び本発明の多くの原理は、実現される際、コンピュータプログラム、中央処理装置(CPU)により実行可能なソフトウェア命令及び/又は特定用途向け集積回路等のソフトウェア、ファームウェア、ハードウェア及び/又はそれらの任意の組合せで最適に実施されることが更に理解される。例えば利用可能な時間、現在の技術及び経済上の考慮が動機となって多くの設計選択及び多くの労力が必要となる可能性にもかかわらず、本明細書において開示される概念及び原理に従えば、当業者は最小限の実験によりそのようなプログラム、命令及び/又はICを容易に生成できることが予想される。
以下において、添付の図面を参照して本発明を詳細に説明する。
図1は、本発明の一実施形態に係るシェーディング補正方法を示すフローチャートである。方法は、図1に示すように、画像Iから背景画素を検出するステップ(ステップ100)と、前記検出した背景画素から光強度画像を生成するステップ(ステップ200)と、前記光強度画像を使用してシェーディングを除去するステップ(ステップ300)とを含む。このように、シェーディングを除去した画像Oは本発明の方法に従って取得される。
以下において、図2〜図5を参照して図1に示すそれらのステップを更に詳細に説明する。
図2及び図3は、それぞれ本発明の異なる実施形態に従って背景画素を検出するステップを示す例示的なフローチャートである。
ステップ100において、背景画素は原画像Iから検出される。図2に示すように、本発明の特定の一実施形態において、ステップ100の処理は以下のように実行されてもよい。
最初に、2値画像Aは画像Iから生成される(ステップ110)。2値画像は、画素が2種類の値のみを含む画像を示す。2種類の値のうち一方は前景画素を表し、他方は背景画素を表す。
次に、背景画素の第1の集合(set1で示される)は、検出された背景画素として、2値画像Aを参照することにより画像Iの全体又は一部から抽出される(ステップ120)。
本発明の更なる実施形態において、ステップ100は、図3に示すように、set1に従って光強度範囲[T1,T2]を判定するステップ(ステップ130)と、光強度が光強度範囲[T1,T2]内にある画素を抽出することによりset1から背景画素の第2の集合(set2で示される)を抽出するステップ(ステップ140)とを更に含む。そのような場合、背景画素の第1の集合の代わりに背景画素の第2の集合が、検出された背景画素として処理される。
いくつかの実施形態において、当業者が以下の詳細な説明から理解するように、本発明に係る方法は、画像を画像ブロックに分割することにより実行される。
次に、図2及び図3を参照してステップ110〜140の詳細を更に説明する。
ステップ110において、2値画像Aが原画像Iから生成される。本発明の好適な実施形態において、画像は画像ブロックに分割され、2値画像Aを共に形成する2値画像ブロックを生成するために2値化が各画像ブロックに適用される。本明細書において、周知のNiblack法等の多くの局所2値化法が適用可能である。
文書(紙の文書等)の画像に対しては、画像ブロックのサイズが原画像の平均文字サイズに設定されるのが更に適切である。殆どの場合、画像の平均文字サイズを推定する必要はない。本発明者の実験によると、15〜50画素のブロックサイズが殆どの画像に適用可能である。本発明の一実現例において、ブロックサイズは20画素に設定される。その結果、背景画素をより正確に検出することを容易にするためにテキストの範囲を非常に高い精度で検出できる。
ステップ120において、背景画素の第1の集合(set1で示される)が、2値画像Aを参照して画像Iの全体又は一部から抽出される。
しかし、本発明者は、文字又はストロークを含む殆どの前景画素がステップ110で識別されたが、前景に属するいくつかの保持される薄いストロークが依然として背景から分離されないことを発見した。すなわち、背景画素から分離されずに保持される前景画素が存在する可能性がある。これらの保持される前景画素が光強度画像を生成するための検出された背景画素に含まれる場合、より不利益になるだろう。
更に、光強度が強い画素であり且つ抽出されたset1における「ごま塩」(salt and pepper)ノイズ等である特定のノイズ画素が依然として存在する可能性がある。これらのノイズ画素が光強度画像を生成するために検出された背景画素に含まれる場合も、より不利益になるだろう。
背景画素をより正確に抽出するために、2値画像Aを参照して抽出され且つステップ110で識別されなかった保持される前景画素及び/又はノイズ画素を含む可能性のあるそれらの背景画素に対して更に高精度な処理が必要である。
この問題に対処するために、本発明の更に好適な一実施形態において、光強度範囲[T1,T2]は、背景画素の第1の集合(set1)に従って更に判定され(ステップ130)、その後、背景画素の第2の集合(set2)は、背景画素の第1の集合(set1)から光強度範囲[T1,T2]に基づいて抽出される(ステップ140)。これについては、以下に詳細に更に説明する。
本明細書において、光強度範囲[T1,T2]は、薄いストローク等により形成される保持される前景画素を検出及び除去するために規定される。すなわち、光強度範囲は、set1中で保持される前景画素を除去するために使用される。他の予備情報がないため、光強度範囲を判定するために平均及び分散は適切な基準である。
set1はn画素を有し且つ記号Viはset1に属する画素の濃度値を表す(濃度値は画素の光強度に対応しても良い)と仮定する。一般に、Mはset1の背景画素の濃度値の光強度平均を表すために使用され、σはset1の背景画素の濃度値の光強度分散を表すために使用され、以下の式が成り立つ。
・・・(1)
・・・(2)
下限T及び上限Tは、以下の式に示すように平均及び分散を含む関数により記述される。
・・・(3)
殆どの応用例に対して一次関数で十分であることを考慮して、以下の式が取得される。
・・・(4)
式中、因子αは信頼区間により判定される定数値であり、信頼区間は、画素が背景画素として考えられると保証される区間を意味する。従って、以下の式が成り立つ。
・・・(5)
・・・(6)
式中、T<T、α∈[−1,0]且つα∈[0,1]である。本発明の一実現例において、α=0、α=0.5である。本発明の他の実施形態において、下限T及び上限Tを判定するために、他の適切な関数が採用されてもよい。
その後、図3に示すようにステップ140に進む。
ステップ140において、保持される前景画素及びノイズ画素が実質的に除去されるように、光強度が光強度範囲[T1,T2]内にある背景画素の第2の集合(set2で示される)はset1から抽出される。
set1はn画素を有し、記号iはset1に属する画素を表すために使用され、記号Viは画素の光強度に対応してもよい画素iの濃度値を表すことが仮定される。2つの閾値T及びTは、ステップ130で規定される。Vi<Tである場合、画素iは前景画素であると考えられる。Vi>Tである場合、画素iはノイズ画素であると考えられる。Viが光強度範囲[T1,T2]内にある場合、画素iは適切な背景画素として受け入れられる。そのような演算をset1に適用すると、実質的に背景画素のみを含む背景画素の第2の集合(set2)が取得される。
以下において、図4を参照して、本発明に従ってset1を抽出し且つ光強度範囲[T1,T2]を判定する別の例示的な処理を更に説明する。
図4は、本発明の一実施形態に従って、画像Iから背景画素の第1の集合を抽出し且つ背景画素の第1の集合の光強度範囲[T1,T2]を判定する処理を示すフローチャートである。
本発明の好適な一実施形態によると、ステップ121において、画像Iから背景画素を抽出する場合、画像Iは少なくとも1つの画像ブロックに分割される。一実施形態において、画像はP*Qの画像ブロックに分割される(ステップ121)。そのような場合、P=1且つQ=1である時に画像全体が1つのブロックとして考えられることは容易に理解されるだろう。更に好適な実施形態において、画像は同一サイズの画像ブロックに分割される。
文書(紙の文書等)の画像に対しては、画像ブロックのサイズが原画像Iの平均文字サイズに設定されるのが更に適切である。一般に、連結成分解析(CCA)等の文字のサイズを計算する方法がいくつか存在する。しかし、殆どの場合、画像中の平均文字サイズを推定する必要はない。本発明者の実験によると、15〜50画素のブロックサイズが殆どの画像に適用可能である。本発明の一実現例において、ブロックサイズは20画素として設定される。尚、上記教示は、説明中必要に応じて画像を画像ブロックに分割する際に適用されてもよい。
その後、ステップ122に進む。
ステップ122において、背景画素の集合は、画像ブロック毎に2値画像Aを参照することにより抽出される。画像ブロック中の指定された各画素は、2値画像Aの画素に対応している。2値画像Aを参照することにより、指定されたブロック中の背景画素及び前景画素に容易にラベル付けできる。抽出された背景画素の集合は、個々に又は共に背景画素の第1の集合(set1)を形成する。その後、ステップ130’に進む。
ステップ130と同様に、ステップ130’において、光強度範囲[T1,T2]は抽出された背景画素の集合に従って画像ブロック毎に判定される。
その後、ステップ140’において、背景画素の部分集合は、最終的に抽出される背景画素として、抽出された背景画素の集合から光強度範囲[T1,T2]に従って画像ブロック毎に抽出される。画像ブロックから抽出された前記背景画素の部分集合は、前記背景画素の第2の集合(set2)を共に形成してもよい。そのような場合、背景画素に保持される上述の薄い文字又はストロークは実質的に除去される。
また、本発明の好適な一実施形態において、ステップ121の前記分割は、ステップ110に関して上述した分割と同一であり、更に詳細には、この場合、ステップ121の分割は、122、130’及び140’等の後続ステップがステップ110に関して上述した画像ブロックに従って実行できるように無視される。
以下において、本発明に従って前記検出された背景画素から光強度画像を生成する例示的な処理を説明する。
背景画素が適切に検出された後、ステップ200において、光強度画像は背景画素から計算される。
本発明の好適な一実施形態において、画像は少なくとも1つの画像ブロックに分割され、それに対応して検出された背景画素が分割される。一実施形態において、画像は例えばP1*Q1の画像ブロックに分割される。P1=1且つQ1=1である場合、画像全体は1つのブロックとして考えられる。更に好適な一実施形態において、画像は同一サイズの画像ブロックに分割される。
各画像ブロックに含まれる検出された背景画素(set1又はset2)の光強度の平均値は、画像ブロックの平均背景光強度として計算される。画像ブロックはk個の検出された背景画素を有し、記号Viは画像ブロック中の検出された背景画素iの濃度値を表し、記号Vaverageは画像ブロックの平均背景光強度を表し、記号Mは画像ブロックの検出された背景画素の光強度の平均を表すために使用されると仮定され、以下が成り立つ。
・・・(7)
このように、画像ブロックの平均背景光強度は取得される。その後、光強度画像は画像ブロックの平均背景光強度から生成される。
生成された光強度画像の解像度が原画像Iの解像度と一致しない場合もあることを考慮すると、更に好適な一実施形態において、生成された光強度画像は原画像Iの解像度に一致するように双線形アップ・サンプリングされる等、更にアップ・サンプリングされる。すなわち、平均背景光強度はアップ・サンプリング(例えば、双線形・アップサンプリング)され、原画像Iと同一サイズの光強度画像を生成する。解像度を一致させる目的で、本発明の教示に鑑みて他の適切な手段が利用可能であることは当業者には理解されるだろう。この場合、アップ・サンプリングされた背景画像は、原画像Iに対する前記光強度画像として考慮されてもよい。更なる実施形態において、光強度画像は、ガウス平滑化法等のある種の平滑化法を使用してノイズ又は異常データを消去するために更に平滑化される。
ステップ200の前記分割は必須ではなく又は必要ではないことが理解されるべきである。本発明の他の実施形態において、ステップ200は、ステップ200において画像を分割する代わりに先行ステップ110又は121で分割された画像ブロックを参照して実行される。以下において、そのような場合の例示的な処理について、図5を参照して詳細に説明する。
図5は、本発明の一実施形態に従って画像Iに対する光強度画像を生成する例示的な処理を示すフローチャートである。図4に示すようなステップ121、122、130’及び140’と同様に、画像Iは画像ブロックに分割され(ステップ121’)、背景画素の集合は2値画像Aを参照することにより画像ブロック毎に抽出され(ステップ122’)、光強度範囲[T1,T2]は抽出された背景画素の集合から画像ブロック毎に判定される(ステップ130”)。その後、光強度が画像ブロックの光強度範囲[T1,T2]内にある画素を抽出することにより、背景画素の部分集合は画像ブロック毎にステップ122’で抽出された背景画素の集合から画像ブロック毎に抽出される(ステップ140”)。その後、画像ブロックの平均背景光強度は、画像ブロック毎に上述したように計算される(ステップ210)。その後、光強度画像は画像ブロックの平均背景光強度から生成される(ステップ220)。
以下において、本発明の一実施形態に従って光強度画像を使用してシェーディングを除去する処理(図1に示すステップ300)について更に説明する。
ステップ300において、画像の全体又は一部におけるシェーディングは、前記光強度画像を使用して除去される。
本発明の特定の一実施形態において、原画像データがI(x,y)であり、光強度画像データがM(x,y)であると仮定すると、出力画像であるシェーディングを除去した画像データO(x,y)は以下の式により計算される。
・・・(8)
式中、cは、O(x,y)が有効な光強度範囲内にある(例えば、8ビット濃淡画像の場合、O(x,y)は0〜255内である必要がある)ことを保証する定数値である。cが大きい程、出力画像は輝度が高い。本発明の一実現例において、cは原画像の最大光強度として設定される。シェーディングを除去した画像データO(x,y)は、画像I内の画素毎に上述の計算を実行することにより取得される。
本発明の開示に鑑みて、シェーディング除去を実行するためにステップ300において他の適切な方法又は技術が適用可能であることは、当業者には理解されるだろう。
尚、前記光強度画像を生成することは、背景画素から光強度データを生成することを示してもよく、必ずしも光強度画像として実体のあるファイルを実際に生成することを意味するとは限らない。あるいは、場合によっては、必要に応じて光強度画像に対して実体のあるファイルを生成できる。
本発明の1つの態様として、画像の全体又は一部にシェーディングのある画像Iに対してシェーディング補正を行なう装置が更に提供される。図6は、本発明の一実施形態に係るシェーディング補正を行なう装置を示すブロック図である。図6に示すように、装置は、画像Iから背景画素を検出する検出モジュール600と、検出した背景画素に従って光強度画像を生成する生成モジュール700と、光強度画像を使用して画像Iからシェーディングを除去するシェーディング除去モジュール800とを含む。
本発明のいくつかの特定の実施形態に係る装置において、画像Iから背景画素を検出し且つ/又は光強度画像を生成する時、画像ブロックに基づいて前記検出及び/又は前記生成を実行するように、画像Iは画像ブロックに分割される。
本発明の好適な一実施形態において、検出モジュール600は、画像Iから2値画像Aを生成でき、2値画像Aを参照することにより、検出された背景画素として画像Iの全体又は一部から背景画素の第1の集合を抽出できる。
本発明の更に好適な実施形態において、画像Iから背景画素を検出する検出モジュール600は、背景画素の第1の集合に従って光強度範囲[T1,T2]を判定でき、背景画素の第1の集合の代わりに検出された背景画素として、光強度が光強度範囲[T1,T2]内にある背景画素を抽出することにより背景画素の第1の集合から背景画素の第2の集合を抽出できる。
本発明の更に好適な実施形態において、検出モジュール600は、背景画素の第1の集合における光強度平均M及び光強度分散σを計算でき、以下のようにT及びTを計算できる。
=M+α*σ
=M+α*σ
式中、α∈[−1,0]且つα∈[0,1]である。
本発明の更に好適な一実施形態において、検出モジュール600は、画像Iを画像ブロックに分割でき、各2値画像ブロックを生成するために各画像ブロックに2値化を適用できる。結果として得られる2値画像ブロックは、2値画像Aを共に形成する。その後、検出モジュール600は、2値画像Aの対応する2値画像ブロックを参照することにより、検出された背景画素として各画像ブロックから背景画素の集合を抽出できる。
本発明の更に好適な一実施形態において、検出モジュール600は画像Iを画像ブロックに分割でき、2値画像Aを参照することにより、検出された背景画素として各画像ブロックから背景画素の集合を抽出できる。
また、本発明の好適な一実施形態において、上述した検出モジュール600による2つの分割は同一であり、その場合、後続処理が前者の分割のように分割された画像ブロックに基づいて実行されるように、後者の分割は無視される。
本発明の更に好適な一実施形態において、画像Iから背景画素を検出する検出モジュール600は、画像ブロックから抽出された背景画素の各集合に従って画像ブロック毎に光強度範囲[T1,T2]を判定でき、画像ブロック毎に抽出された背景画素の各集合から、光強度が画像ブロックの光強度範囲[T1,T2]内にある背景画素の部分集合を背景画素の第1の集合の代わりに検出された背景画素として抽出できる。
本発明の更に好適な一実施形態において、検出モジュール600は、画像ブロック毎に抽出された背景画素の各部分集合における光強度平均M及び光強度分散σを計算でき、上述のように画像ブロック毎にT及びTを計算できる。
本発明の更に好適な実施形態において、前記背景画素から光強度画像を生成する生成モジュール700は、画像を画像ブロックに分割でき、各画像ブロックの平均背景光強度を画像ブロックの検出された背景画素の光強度の平均値として設定でき、且つ画像ブロックの平均背景光強度から光強度画像を生成できる。
また、本発明の好適な一実施形態において、生成モジュール700による上述の分割は、検出モジュール600による分割と同一であってもよく、その場合、後続処理が前者の分割のように分割された画像ブロックに基づいて実行されるように、生成モジュール700による分割は無視される。画像が上述したように検出モジュールにおいて画像ブロックに分割された場合、前記背景画素から光強度画像を生成する生成モジュール700は、画像ブロック中の検出された背景画素の光強度の平均値として各画像ブロックの平均背景光強度を設定し、画像ブロックの平均背景光強度から光強度画像を生成してもよい。
本発明の更に好適な一実施形態において、画像ブロックは同一サイズである。
本発明の更に好適な一実施形態において、生成モジュール700は、画像ブロックの平均背景光強度をアップ・サンプリングすることにより又はアップ・サンプリング及び平滑化することにより前記原画像Iの同一サイズの光強度画像を生成できる。
本発明の更に好適な実施形態において、前記光強度画像を使用して画像Iのシェーディングを除去するシェーディング除去モジュール800は、以下の式によりシェーディングを除去した画像データO(x,y)を計算できる。
O(x,y)=c*(I(x,y)/M(x,y))
式中、I(x,y)は原画像データを表し、M(x,y)は光強度画像データを表す。
本発明に係る方法及び装置、並びにそれらのステップ及びモジュールがソフトウェア、ファームウェア、ハードウェア及び/又はそれらの任意の組合せで実施できることは、本開示から理解されるだろう。
図7〜図10は、本発明が本発明の実験に従って達成されることを示す図である。図7は、撮影又は走査等が行なわれる紙の文書に対するシェーディングを含む原画像である。図8は、本発明の一実現例に従って図7の原画像から生成された2値画像である。図9は、本発明の一実現例に従って推定された図7の原画像の光強度分散を示す光強度画像である。図10は、図7の原画像のシェーディングを除去した画像であり、図中、画像のシェーディングは本発明の実現例に従って除去されている。図7〜図10から分かるように、画像のシェーディングは実質的に正確に除去されるため、結果として得られるシェーディングを除去した画像上のテキストは、例えばOCRシステムにより更に正確に認識されるだろう。
更に、本発明の種々の実施形態に係る装置及び方法は、少なくともデジタルカメラOCRシステム等のOCRシステムに適用可能であると考えられる。
図11は、本発明が適用されるOCRシステムに対する処理を示す。図11に示すように、最初に、紙の文書、書籍等の文書資料は、デジタルカメラにより撮影されるか又はスキャナにより走査され、画像等の文書資料の電子バージョンを形成する。その後、画像は、画像のシェーディングをより正確に除去する本発明に係る方法又は装置によりシェーディング補正され、シェーディングを除去した画像は取得される。テキストコンテンツが画像から正確に認識されるように、必要に応じて追加の2値化処理を含む従来のOCR処理は、シェーディングを除去した画像に適用される。
本発明の実施形態について添付の図面を参照して上述のように詳細に説明したが、図面及びそれに対する詳細な説明は、本発明を開示される特定の形態に限定することを意図せず、本発明の範囲は添付の特許請求の範囲及びそれらの等価物によってのみ規定されることが理解されるべきである。添付の特許請求の範囲により規定されるような本発明の趣旨の範囲内の全ての変形例、等価物及び代替物は、本発明に含まれることが意図される。

Claims (17)

  1. 全体又は一部にシェーディングのある画像(I)に対してシェーディング補正を行なう方法であって、
    前記画像(I)から背景画素を抽出する工程と、
    前記抽出した背景画素に従って光強度画像を生成する工程と、
    前記光強度画像を用いて、前記画像(I)からシェーディングを除去する工程とを備え
    前記画像(I)から背景画素を抽出する工程は、
    前記画像(I)を複数の画像ブロックに分割する工程と、
    当該分割された各画像ブロックに2値化を適用し、前記各画像ブロックに対応する2値画像ブロックを生成する工程と、
    前記各2値画像ブロックを参照することにより、前記各画像ブロックから背景画素の第1の集合を検出する工程と、
    前記各画像ブロックから検出された前記背景画素の第1の集合に対して、前景画素及びノイズ画素の除去用の閾値T1およびT2を求めるための関数を適用することにより、前記各画像ブロックについて光強度範囲[T1,T2]を決定する工程と、
    前記各画像ブロックから検出された前記背景画素の第1の集合から、光強度が前記光強度範囲[T1,T2]内にある背景画素の第2の集合を背景画素として抽出する工程と、
    を備えることを特徴とする方法。
  2. 全体又は一部にシェーディングのある画像(I)に対してシェーディング補正を行なう方法であって、
    前記画像(I)から背景画素を抽出する工程と、
    前記抽出した背景画素に従って光強度画像を生成する工程と、
    前記光強度画像を用いて、前記画像(I)からシェーディングを除去する工程とを備え、
    前記画像(I)から背景画素を抽出する工程は、
    前記画像(I)に2値化を適用し、2値画像(A)を生成する工程と、
    前記画像(I)を複数の画像ブロックに分割する工程と、
    前記2値画像(A)を参照することにより、当該分割された前記各画像ブロックから背景画素の第1の集合を検出する工程と、
    前記各画像ブロックから検出された前記背景画素の第1の集合に対して、前景画素及びノイズ画素の除去用の閾値T1およびT2を求めるための関数を適用することにより、前記各画像ブロックについて光強度範囲[T1,T2]を決定する工程と、
    前記各画像ブロックから抽出された前記背景画素の第1の集合から、光強度が前記光強度範囲[T1,T2]内にある背景画素の第2の集合を背景画素として抽出する工程と、
    を備えることを特徴とする方法。
  3. 前記光強度範囲[T1,T2]を決定する工程は、
    画像ブロック毎に検出された前記背景画素の第1の集合における光強度平均M及び光強度分散σを計算する工程と、
    α∈[−1,0]且つα∈[0,1]である場合に、
    =M+α*σ
    =M+α*σ
    のように前記画像ブロック毎にT及びTを計算する工程と、
    を更に備えることを特徴とする請求項1又は2に記載の方法。
  4. 前記光強度画像を生成する工程は、
    前記各画像ブロックに基づいて、前記光強度画像を生成することを特徴とする請求項1乃至3の何れか1項に記載の方法。
  5. 記光強度画像を生成する工程は、
    前記各画像ブロックについて抽出した背景画素の光強度の平均値として前記各画像ブロックの平均背景光強度を設定する工程と、
    前記画像ブロックの前記平均背景光強度から光強度画像を生成する工程とを更に備えることを特徴とする請求項に記載の方法。
  6. 前記画像ブロックの前記平均背景光強度から光強度画像を生成する工程は、
    前記各画像ブロックの前記平均背景光強度をアップ・サンプリングすることにより又はアップ・サンプリング及び平滑化することにより、前記画像(I)の同一サイズの光強度画像を生成する工程を更に含むことを特徴とする請求項に記載の方法。
  7. 前記適用される2値化は、局所2値化法による2値化であることを特徴とする請求項1乃至6の何れか1項に記載の方法。
  8. 前記画像(I)は、テキストを含む紙文書を光学的に読み取ることで得られる画像であり、
    前記画像(I)から前記シェーディングが除去された画像は、OCR処理されることを特徴とする請求項1乃至7の何れか1項に記載の方法。
  9. 全体又は一部にシェーディングのある画像(I)に対してシェーディング補正を行なう装置であって、
    前記画像(I)から背景画素を抽出する抽出モジュールと、
    前記抽出した背景画素に従って光強度画像を生成する生成モジュールと、
    前記光強度画像を用いて、前記画像(I)からシェーディングを除去するシェーディング除去モジュールとを備え
    前記画像(I)から背景画素を抽出する抽出モジュールは、
    前記画像(I)を複数の画像ブロックに分割し、
    当該分割された各画像ブロックに2値化を適用し、前記各画像ブロックに対応する2値画像ブロックを生成し、
    前記各2値画像ブロックを参照することにより、前記各画像ブロックから背景画素の第1の集合を検出し、
    前記各画像ブロックから検出された前記背景画素の第1の集合に対して、前景画素及びノイズ画素の除去用の閾値T1およびT2を求めるための関数を適用することにより、前記各画像ブロックについて光強度範囲[T1,T2]を決定し、
    前記各画像ブロックから検出された前記背景画素の第1の集合から、光強度が前記光強度範囲[T1,T2]内にある背景画素の第2の集合を背景画素として抽出する、
    ことを特徴とする装置。
  10. 全体又は一部にシェーディングのある画像(I)に対してシェーディング補正を行なう装置であって、
    前記画像(I)から背景画素を抽出する抽出モジュールと、
    前記抽出した背景画素に従って光強度画像を生成する生成モジュールと、
    前記光強度画像を用いて、前記画像(I)からシェーディングを除去するシェーディング除去モジュールとを備え、
    前記画像(I)から背景画素を抽出する抽出モジュールは、
    前記画像(I)に2値化を適用し、2値画像(A)を生成し、
    前記画像(I)を複数の画像ブロックに分割し、
    前記2値画像(A)を参照することにより、当該分割された前記各画像ブロックから背景画素の第1の集合を検出し、
    前記各画像ブロックから検出された前記背景画素の第1の集合に対して、前景画素及びノイズ画素の除去用の閾値T1およびT2を求めるための関数を適用することにより、前記各画像ブロックについて光強度範囲[T1,T2]を決定し、
    前記各画像ブロックから抽出された前記背景画素の第1の集合から、光強度が前記光強度範囲[T1,T2]内にある背景画素の第2の集合を背景画素として抽出する、
    ことを特徴とする装置。
  11. 前記光強度範囲[T1,T2]は、
    画像ブロック毎に検出された前記背景画素の第1の集合における光強度平均M及び光強度分散σを計算し、
    α∈[−1,0]且つα∈[0,1]である場合に、
    =M+α*σ
    =M+α*σ
    のように前記画像ブロック毎にT及びTを計算する、ことによって決定されることを特徴とする請求項9又は10に記載の装置。
  12. 前記生成モジュールは、
    前記各画像ブロックに基づいて、前記光強度画像を生成することを特徴とする請求項9乃至11の何れか1項に記載の装置。
  13. 前記生成モジュールは、
    前記各画像ブロックについて抽出した背景画素の光強度の平均値として前記各画像ブロックの平均背景光強度を設定し、
    前記各画像ブロックの前記平均背景光強度から光強度画像を生成する、ことを特徴とする請求項12に記載の装置。
  14. 記光強度画像は、前記各画像ブロックの前記平均背景光強度をアップ・サンプリングすることにより又はアップ・サンプリング及び平滑化することにより、前記画像(I)の同一サイズの光強度画像を生成する、ことを特徴とする請求項13に記載の装置。
  15. 前記適用される2値化は、局所2値化法による2値化であることを特徴とする請求項9乃至14の何れか1項に記載の装置。
  16. 前記画像(I)は、テキストを含む紙文書を光学的に読み取ることで得られる画像であり、
    前記画像(I)から前記シェーディングが除去された画像は、OCR処理されることを特徴とする請求項9乃至15の何れか1項に記載の装置。
  17. 請求項1乃至8の何れか1項に記載の方法の各工程をコンピュータに実行させるプログラム。
JP2010010371A 2009-01-22 2010-01-20 シェーディング補正を行なう装置及び方法 Expired - Fee Related JP4966384B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2009100099228A CN101789121B (zh) 2009-01-22 2009-01-22 用于阴影校正的装置和方法
CN200910009922.8 2009-01-22

Publications (2)

Publication Number Publication Date
JP2010191952A JP2010191952A (ja) 2010-09-02
JP4966384B2 true JP4966384B2 (ja) 2012-07-04

Family

ID=42532324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010010371A Expired - Fee Related JP4966384B2 (ja) 2009-01-22 2010-01-20 シェーディング補正を行なう装置及び方法

Country Status (2)

Country Link
JP (1) JP4966384B2 (ja)
CN (1) CN101789121B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5488530B2 (ja) * 2011-05-23 2014-05-14 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
CN104240207B (zh) * 2014-10-10 2017-12-19 深圳开立生物医疗科技股份有限公司 一种图像去阴影方法及装置
CN106023113B (zh) * 2016-05-27 2018-12-14 哈尔滨工业大学 基于非局域稀疏的卫星高分图像阴影区域恢复方法
JP6317413B1 (ja) 2016-10-28 2018-04-25 株式会社Pfu 画像処理装置、画像処理方法及び画像処理プログラム
CN108257104B (zh) * 2018-01-26 2020-03-06 维沃移动通信有限公司 一种图像处理方法及移动终端
CN113222826A (zh) * 2020-01-21 2021-08-06 深圳富泰宏精密工业有限公司 文档阴影去除方法及装置
CN113221601A (zh) * 2020-01-21 2021-08-06 深圳富泰宏精密工业有限公司 字符识别方法、装置及计算机可读存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5374841A (en) * 1976-12-15 1978-07-03 Nec Corp Television signal processor
JPH01126877A (ja) * 1987-11-12 1989-05-18 Fuji Photo Film Co Ltd シェーディング補正方法
JP3804214B2 (ja) * 1996-10-29 2006-08-02 セイコーエプソン株式会社 画像処理方法および画像処理装置
JP2000276581A (ja) * 1999-03-23 2000-10-06 Minolta Co Ltd 画像処理装置および画像処理方法ならびに画像処理プログラムを記録した記録媒体
JP3917341B2 (ja) * 2000-01-05 2007-05-23 株式会社東芝 画像処理装置
JP4375069B2 (ja) * 2004-03-19 2009-12-02 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
CN101789121B (zh) 2013-11-13
JP2010191952A (ja) 2010-09-02
CN101789121A (zh) 2010-07-28

Similar Documents

Publication Publication Date Title
JP5566811B2 (ja) プリントアンドスキャン文書の画像評価のためのボケ除去および監視適応的スレッショルディング
JP4966384B2 (ja) シェーディング補正を行なう装置及び方法
US9619872B1 (en) Systems and methods for removing defects from images
JP3768052B2 (ja) カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体
JP3809404B2 (ja) 画像処理方法、装置およびシステム
JP5521164B2 (ja) 連続して存在する英数字を識別するための画像処理システムおよびその方法
CN107330433B (zh) 图像处理方法和装置
US8326078B2 (en) System and method for removing artifacts from a digitized document
JP5559619B2 (ja) 画像比較解析を用いた印刷文書における変更の検出方法
US8331670B2 (en) Method of detection document alteration by comparing characters using shape features of characters
JP2015065654A (ja) 自動修復を用いたカラー文書画像セグメンテーション及び二値化
US9349237B2 (en) Method of authenticating a printed document
JP2011045078A (ja) カメラベースの文書画像処理のための適応的ボケ除去
US10455163B2 (en) Image processing apparatus that generates a combined image, control method, and storage medium
JP5301694B2 (ja) 画像処理装置、画像処理方法、プログラムおよびその記録媒体
CN114283156B (zh) 一种用于去除文档图像颜色及手写笔迹的方法及装置
KR101011908B1 (ko) 디지털 이미지의 노이즈 감소 방법 및 이를 이용한 이미지 처리 장치
JP6542230B2 (ja) 投影ひずみを補正するための方法及びシステム
JP5979008B2 (ja) 画像処理装置、画像処理方法及びプログラム
RU2520407C1 (ru) Способ и система улучшения текста при цифровом копировании печатных документов
Konya et al. Adaptive methods for robust document image understanding
JP2019021085A (ja) 画像処理プログラム、画像処理方法及び画像処理装置
US11778122B2 (en) Apparatus, method, and storage medium for removing shading dots
Kasar Camera-captured document image analysis
Mehta et al. Text Detection from Scene Videos having Blurriness and Text of Different Sizes

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110715

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120302

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120330

R151 Written notification of patent or utility model registration

Ref document number: 4966384

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees