JP6592992B2 - 画像の背景輝度画像の抽出装置及び方法、並びに影除去装置及び方法 - Google Patents

画像の背景輝度画像の抽出装置及び方法、並びに影除去装置及び方法 Download PDF

Info

Publication number
JP6592992B2
JP6592992B2 JP2015135640A JP2015135640A JP6592992B2 JP 6592992 B2 JP6592992 B2 JP 6592992B2 JP 2015135640 A JP2015135640 A JP 2015135640A JP 2015135640 A JP2015135640 A JP 2015135640A JP 6592992 B2 JP6592992 B2 JP 6592992B2
Authority
JP
Japan
Prior art keywords
luminance
image
background
brightness
missing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015135640A
Other languages
English (en)
Other versions
JP2016019287A (ja
Inventor
ジォン・ユヌ
ファヌ・ウエイ
俊 孫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2016019287A publication Critical patent/JP2016019287A/ja
Application granted granted Critical
Publication of JP6592992B2 publication Critical patent/JP6592992B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/94Dynamic range modification of images or parts thereof based on local image properties, e.g. for local contrast enhancement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/401Compensating positionally unequal response of the pick-up or reproducing head
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/407Control or modification of tonal gradation or of extreme levels, e.g. background level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/407Control or modification of tonal gradation or of extreme levels, e.g. background level
    • H04N1/4072Control or modification of tonal gradation or of extreme levels, e.g. background level dependent on the contents of the original
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

本公開は、画像処理分野に関し、具体的にはコンピュータビジョンに関し、より具体的には、画像の背景輝度画像を抽出する装置及び方法、画像における影を自動的に除去する影除去装置及び方法、並びに該影除去装置を含むスキャナ又はデジタルカメラに関する。
従来では、スキャナ又はデジタルカメラなどの機器により、スキャンされる対象、例えば紙の書籍又は雑誌の画像を取得し、デジタル化することができる。しかし、図1に示すように、光線、及びスキャンされる対象、例えば書籍の表面そのものの撓みにより、通常、取得された画像には影が存在している。よって、画像形成の効果を改善するため、これらの影を自動的に除去することは望まれている。
以下は、本公開のある態様を理解させるため、本公開を簡単に説明する。なお、この説明は、本公開を限定するものではない。この説明は、本公開の肝心な部分又は重要な部分を決定するものではないし、本公開の範囲を限定するものではない。その目的は、単なる本公開に関するある概念を簡単に説明し、より詳細な説明は後述する。
本発明の一の態様では、画像の背景輝度画像を抽出する装置であって、前記画像における輝度値を抽出し、輝度画像を取得する輝度抽出手段と、前記輝度画像に基づいて前記画像を背景と前景とに分離し、初期背景輝度画像を取得する分離手段と、前記初期背景輝度画像における最上行及び最下行の値を頂部輝度及び底部輝度として抽出し、前記頂部輝度及び/又は底部輝度の一部が欠けている場合、前記頂部輝度及び/又は底部輝度における既存データを用いて欠けている部分を補填し、完全な頂部輝度及び底部輝度を取得する頂部底部輝度取得手段と、前記頂部底部輝度取得手段により取得された完全な頂部輝度及び底部輝度に基づいて画像全体を補間し、前記画像の背景輝度画像を取得する補間手段と、を含む、装置を提供する。
本発明の他の態様では、画像における影を除去する影除去装置であって、上記の画像の背景輝度画像を抽出する装置を含み、前記輝度画像から前記背景輝度画像の影響を除去する除去手段、をさらに含む、影除去装置を提供する。
本発明の他の態様では、画像の背景輝度画像を抽出する方法であって、前記画像における輝度値を抽出し、輝度画像を取得するステップと、前記輝度画像に基づいて前記画像を背景と前景とに分離し、初期背景輝度画像を取得するステップと、前記初期背景輝度画像における最上行及び最下行の値を頂部輝度及び底部輝度として抽出し、前記頂部輝度及び/又は底部輝度の一部が欠けている場合、前記頂部輝度及び/又は底部輝度における既存データを用いて欠けている部分を補填し、完全な頂部輝度及び底部輝度を取得するステップと、取得された完全な頂部輝度及び底部輝度に基づいて画像全体を補間し、前記画像の背景輝度画像を取得するステップと、を含む、方法を提供する。
本発明の他の態様では、画像における影を除去する影除去方法であって、上記の画像の背景輝度画像を抽出する方法を含み、前記輝度画像から前記背景輝度画像の影響を除去するステップをさらに含む、影除去方法を提供する。
本発明の他の態様では、上記の影除去装置を含むスキャナ及びデジタルカメラを提供する。
本発明の他の態様では、対応するコンピュータプログラムコード、コンピュータが読み取り可能な記憶媒体、及びコンピュータプログラムプロダクトをさらに提供する。
以下は、本発明のこれらの利点及び他の利点は、図面を参照しながら本発明の好適な実施例を詳細に説明することによって、より明確になる。
以下は、本発明の上記及びその他の利点及び特徴を説明するため、図面を参照しながら本発明の具体的な実施形態を詳細に説明する。図面及び以下の詳細な説明は、本明細書に含まれ、且つ明細書の一部を構成する。同一の機能及び構成を有する部材は、同一の符号で示されている。なお、これらの図面は、単なる本発明の典型的な例を説明するものであり、本発明の範囲を限定するものではない。
影を有する画像の例を示す図である。 本願の1つの実施例に係る画像の背景輝度画像の抽出装置の構成を示すブロック図である。 本願の1つの実施例に係る分離部の構成を示すブロック図である。 本願の1つの実施例に係る背景部分抽出モジュールの構成を示すブロック図である。 図1における画像に対応する勾配画像の例を示す図である。 図5を二値化して得られた画像の例を示す図である。 図6をマーキングして得られた画像の例を示す図である。 図7を充填して得られた初期背景輝度画像の例を示す図である。 欠けている部分を補填する時に用いられるモデルを示す図である。 最後に取得された背景輝度画像の例を示す図である。 本願のもう1つの実施例に係る画像の背景輝度画像の抽出装置の構成を示すブロック図である。 本願の1つの実施例に係る画像における影を除去する影除去装置の構成を示すブロック図である。 図1の影が除去された画像の例を示す図である。 本願の実施例に係る画像の背景輝度画像の抽出方法及び画像における影を除去する影除去方法のフローチャートである。 図14におけるステップS12のサブステップのフローチャートである。 図15におけるステップS201のサブステップのフローチャートである。 本発明の実施例の方法及び/又は装置を実現するための汎用コンピュータの構成を示すブロック図である。
以下、図面を参照しながら本発明の例示的な実施例を詳細に説明する。説明の便宜上、明細書には実際の実施形態の全ての特徴が示されていない。なお、実際に実施する際に、開発者の具体的な目標を実現するために、特定の実施形態を変更してもよい、例えばシステム及び業務に関する制限条件に応じて実施形態を変更してもよい。また、開発作業が非常に複雑であり、且つ時間がかかるが、本公開の当業者にとって、この開発作業は単なる例の作業である。
なお、本発明を明確にするために、図面には本発明に密に関連する装置の構成要件又は処理のステップのみが示され、本発明と関係のない細部が省略される。
上述したように、スキャンされる対象、例えば書籍に対して画像形成を行って得られた画像における影を自動的に除去する装置及び方法は望まれている。この問題点を解決するため、特にレイアウトが複雑である場合には、画像の背景輝度画像を正確に取得するのは重要である。
以下は、図2を参照しながら、本願の1つの実施例に係る画像の背景輝度画像の抽出装置100の構成を説明する。図2に示すように、装置100は、画像における輝度値を抽出し、輝度画像を取得する輝度抽出部101と、輝度画像に基づいて画像を背景と前景とに分離し、初期背景輝度画像を取得する分離部102と、初期背景輝度画像における最上行及び最下行の値を頂部輝度及び底部輝度として抽出し、頂部輝度及び/又は底部輝度の一部が欠けている場合、頂部輝度及び/又は底部輝度における既存データを用いて欠けている部分を補填し、完全な頂部輝度及び底部輝度を取得する頂部底部輝度取得部103と、頂部底部輝度取得部により取得された完全な頂部輝度及び底部輝度に基づいて画像全体を補間し、画像の背景輝度画像を取得する補間部104と、を含む。
画像の背景輝度画像を取得するため、装置100は、画像から背景を分離し、頂部輝度及び底部輝度における既存データを用いて欠けている部分を補填し、取得された完全な頂部輝度及び底部輝度に基づいて画像全体を補間する。
ここで、画像はカラー画像であってもよいし、グレースケール画像であってもよい。画像の例は図1に示している。
輝度抽出部101は、各画素の輝度値を抽出して輝度画像を取得してもよい。一例として、画像がカラー画像である場合、輝度抽出部101は、カラー画像をYUV色空間に変換して、そのY画像を輝度画像としてもよい。画像がグレースケール画像である場合、グレースケール値を輝度値として用いてもよい。
そして、分離部102は、輝度画像に基づいて、画像の背景及び前景の輝度についての特徴に応じて分離し、即ち画像の内容情報を用いる。以下は、図3を参照しながら分離部102の一例を説明する。図3に示すように、分離部102は、輝度画像における背景の部分を抽出する背景部分抽出モジュール201と、前景周辺の背景部分の画素の値を用いて前景をある程度まで充填し、充填して得られた輝度画像を初期背景輝度画像とする充填モジュール202と、を含む。
ここで、充填モジュール202を設定するのは、前景における面積の小さい領域を除去し、ノイズを低減するためである。ここで、充填は、前景における少なくとも一部の画像の値を背景部分の画素値に代えることであってもよく、充填の程度、即ち毎回充填される画素の数は予め設定されてもよい。
図4は、本願の1つの実施例に係る背景部分抽出モジュール201の構成を示すブロック図である。背景部分抽出モジュール201は、輝度画像を勾配画像に変換して二値化する変換部2011と、最大サイズを有する白色の連結成分、及びその平均輝度との差が一定の範囲内にある他の白色の連結成分を背景部分としてマーキングするマーキング部2012と、を含む。
背景部分抽出モジュール201は、背景が緩やかに変化し、且つ前景が急速に変化するという特徴により、背景部分を抽出する。図1の画像の例では、輝度画像を変換部2011により処理して得られた勾配画像は図5に示され、二値化された画像は図6に示され、画像において、前景部分を黒色で示し、背景部分を白色で示している。説明の便宜上、図5において、水平方向をx方向と定義し、垂直方向をy方向と定義する。
ここで、勾配画像は畳み込みマスクを用いて畳み込むことによって取得されてもよく、畳み込みマスクは、水平方向、即ちx方向が[−1,0,1]であり、垂直方向、即ちy方向が[−1,0,1]である。畳み込んだ後で、勾配画像を例えば[0,255]の区間に正規化してもよい。また、二値化の閾値は、勾配画像のヒストグラムの90%分位点を計算して得られてもよい。なお、これは単なる一例であり、他の百分比を用いてもよい。
そして、マーキング部2012は、図6における面積の最も大きい白色の連結成分を背景部分として取得し、その平均輝度に近い他の白色の連結成分を背景部分としてマーキングしてもよい。ここで、平均輝度に近いことは、両者の平均輝度の差が所定の範囲(例えば60)内にあることであってもよい。また、平均輝度値の比較に加えて、平均色、即ち平均のU値及びV値を比較してもよい。言い換えれば、平均輝度及び平均色が近い白色の連結成分を背景部分としてマーキングしてもよい。図6をマーキングして得られた画像は図7に示され、白色部分は背景部分である。
1つの実施例では、頂部底部輝度取得部103は、背景部分抽出モジュール201により抽出された背景部分の平均輝度が所定の閾値(例えば120)よりも低い場合、頂部輝度及び底部輝度を全て輝度画像における対応列の最大輝度値に設定する。この場合は、背景が暗いため、列方向における背景輝度の変化を考慮しなくてもよい。ここで、列方向は例えば図5及び図6における垂直方向、即ちy方向である。
また、図8は、充填モジュール202を用いて図7を充填して得られた初期背景輝度画像を示す図である。
図に示すように、頂部部分の右側は背景ではなく、前景であるため、頂部底部輝度取得部103により初期背景輝度画像における最上行の値を頂部輝度として抽出する場合、この部分に対応する背景輝度が欠けている。この現象は、複雑なレイアウト配置に起因する。この場合は、頂部底部輝度取得部103は、既存のデータを用いて該欠けている部分を補填し、完全な頂部輝度を取得する。
同様に、底部輝度の一部が欠けている場合、頂部底部輝度取得部103は、同様の処理を行い、完全な底部輝度を取得する。
ここで、頂部底部輝度取得部103は、既存データに基づく多項式フィッティングを用いて頂部輝度及び/又は底部輝度における欠けている部分を補填してもよい。
例えば、下記の式(1)に従って、n次の多項式f(x)を構築して既存データをフィッティングし、フィッティングして得られたf(x)を用いて欠けている部分の輝度値を計算してもよい。
Figure 0006592992
ここで、xは左境界までの距離であり、Cは頂部輝度におけるデータのある部分、例えば図8における頂部の左からの白色の部分であり、f(x)は多項式で表れたxにおける推定背景輝度であり、Yxは既存データから取得された、対応位置における実際の背景輝度値である。図9は例示的な光線照射のモデルを示し、z方向はxy平面(即ちデスクトップ)に垂直な方向であり、アークは机に開いて置いた本のデスクトップに垂直な方向に沿う断面図を表し、光線が上方から照射され、式(1)において、背景輝度値がx軸方向の位置に関連すると考えられる。
式(1)を最小化することで多項式f(x)を決定でき、f(x)を右側のデータが欠けている部分、即ち図8の右上の黒色の部分に適用し、完全な頂部輝度を取得できる。同様に、底部輝度に欠けている部分が存在する場合、式(1)を用いて同様な処理を行ってもよい。
1つの実施例では、頂部底部輝度取得部103は、最小二乗法を用いて多項式のフィッティングを行ってもよい。なお、これに限定されず、他の従来の多項式のフィッティング方法を用いてもよい。
もう1つの実施例では、頂部底部輝度取得部103は、Lambertian反射モデルに基づいて頂部輝度及び/又は底部輝度における欠けている部分の推定輝度を計算し、該推定輝度に関連する値を既存データの一部として、頂部輝度及び/又は底部輝度における欠けている部分を補填する。
具体的には、頂部底部輝度取得部103は、下記の式(2)を用いて多項式f(x)のフィッティングを行ってもよい。
Figure 0006592992
ここで、式(2)における1番目の総和は式(1)と同様な意味を有し、2番目の総和におけるL(x)はLambertian反射モデルに基づいて推定された、欠けている部分の背景輝度値を表し、Mは頂部輝度又は底部輝度におけるデータが欠けている部分、例えば図8における頂部の右側の黒色の部分を表す。λは重み係数を表し、両部分の占めている割合を調整するためのものである。
Lambertian反射モデルは、以下のように示され、ここで、I0は光源の光照射輝度を表し、図9に示すように、I0は高度Hにおける光照射輝度であり、Hは本を置いているデスクトップからの高さであり、dは本のページのデスクトップからの高さであり、θは、x方向の位置の変化に伴い、ページの法線方向とz軸方向との角度である。
Figure 0006592992
この反射モデルは、背景輝度を大ざっぱに推定できるが、光線が厳密に垂直することではなく、高さdが必ずしも正確ではないため、それを直接に用いて計算された背景輝度の結果は正確ではない。この実施例では、その計算結果を既存データの一部として用いて多項式f(x)をフィッティングし、画像に対応する本の三次元の形状情報を用いることで、式(1)だけを用いてフィッティングして得られた結果よりも正確な結果を取得できる。
また、下記の式(4)に従って、推定輝度の頂部及び底部の辺に平行な方向に沿う導関数を既存データの一部として、多項式をフィッティングしてもよい。
Figure 0006592992
この式は、式(3)に比べて、L(x)の導関数を用いて計算することで、dの不正確な影響を低減でき、より正確な結果を取得できる。
他の実施例では、頂部底部輝度取得部103は、既存データに基づく線形補間を用いて頂部輝度及び/又は底部輝度における欠けている部分を補填してもよい。例えば、既存データの欠けている部分に最も近いデータとを用いて線形補間を行ってもよい。なお、少なくとも一部の既存データと完全に同一のデータを用いて欠けている部分を補填してもよい。
このように、頂部底部輝度取得部103を用いることで、複雑なレイアウトにより頂部輝度及び/又は底部輝度が不完全である場合であっても、欠けている部分を補填でき、完全な頂部輝度及び底部輝度のデータを取得でき、後で行われる補間の正確性を向上できる。
補間部104は、頂部輝度及び底部輝度を用いて画像全体に対して線形補間を行い、例えば、画像の左上隅を座標の原点として、図5に示される座標軸の設定を用いる場合、下記の式(5)を用いて各位置の背景輝度値BIを取得できる。
Figure 0006592992
ここで、Sは本のページのy方向における長さであり、Itop,xは頂部輝度であり、Ibottom,xは底部輝度である。最終に取得された背景輝度画像は例えば図10に示されている。
また、画像解像度が高い場合、計算量を低減するため、図11に示す本願の1つの実施例に係る画像の背景輝度画像の抽出装置200を用いてもよい。装置200は、装置100に含まれる各部に加えて、輝度抽出部101により取得された輝度画像をダウンサンプリングするダウンサンプリング部105と、補間部104により取得された背景輝度画像をアップサンプリングするアップサンプリング部106と、をさらに含む。
具体的には、計算量を低減し、処理速度を向上するように、ダウンサンプリング部105は、輝度画像を、所定の画像範囲、例えば輝度画像の長手の辺が1000画素よりも小さい範囲に、ダウンサンプリングしてもよい。補間部104により背景輝度画像が取得された後、アップサンプリング部106は該背景輝度画像に対してアップサンプリングする。なお、アップサンプリング部106は、画像をオリジナルサイズにアップサンプリングしてもよし、他のサイズにアップサンプリングしてもよいが、これは背景輝度画像の適用シーンにより決められる。
以上のことから、上記の装置100又は200を用いることで、複雑レイアウトの文書画像を含む各種の文書画像の背景輝度画像を正確に抽出できる。
図12は、画像における影を除去する影除去装置300を示す図である。装置300は、上記の画像の背景輝度画像の抽出装置100又は200を含み、輝度画像から背景輝度画像の影響を除去する除去部301、をさらに含む。
1つの実施例では、除去部301は、輝度画像の値を背景輝度画像の値で割って、それに所定の係数を掛けて、輝度全体を調整する。具体的には、下記の式(6)に従って影除去処理を行う。
Figure 0006592992
ここで、Yout(x,y)は最終に取得された輝度画像の値であり、Y(x,y)は輝度抽出部101により抽出された輝度画像の値であり、BI(x,y)は装置100又は200の処理により取得された背景輝度画像の値であり、ωは輝度全体を調整するためのものであり、通常、ωが大きいほど画像全体は明るく、逆の場合に画像は暗い。
図1の例では、装置300により影除去処理を実行して得られた画像は図13に示されている。図から分かるように、影は殆ど除去され、ユーザの読み体験が改善された。
また、処理される画像がカラー画像である場合、Yout、U、VをオリジナルのRGB空間に変換してもよい。
装置100又は200画像の背景輝度画像を正確に抽出できるため、上記装置300は画像に存在する影を効率的、且つ迅速に除去できる。装置300は、取得された画像に対して影除去処理を行うため、例えばスキャナ又はデジタルカメラに含まれ、或いは接続されてもよい。なお、装置300を含むスキャナ又はデジタルカメラも本願の公開範囲内にあるものである。
以上、図面を参照しながら本発明に係る画像の背景輝度画像の抽出装置及び画像における影を除去する影除去装置の実施形態を説明しているが、実際には画像の背景輝度画像の抽出方法及び画像における影の除去方法も説明している。以下は、図面14〜16を参照しながら方法を簡単に説明し、その細部は上述した装置の説明を参照してもよい。
図14に示すように、画像の背景輝度画像の抽出方法は、画像における輝度値を抽出し、輝度画像を取得するステップ(S11)と、輝度画像に基づいて画像を背景と前景とに分離し、初期背景輝度画像を取得するステップ(S12)と、初期背景輝度画像における最上行及び最下行の値を頂部輝度及び底部輝度として抽出し、頂部輝度及び/又は底部輝度の一部が欠けている場合、頂部輝度及び/又は底部輝度における既存データを用いて欠けている部分を補填し、完全な頂部輝度及び底部輝度を取得するステップ(S13)と、取得された完全な頂部輝度及び底部輝度に基づいて画像全体を補間し、画像の背景輝度画像を取得するステップ(S14)と、を含む。
また、図14における破線ブロックのS15及びS16に示すように、計算量を低減し、速度を向上するため、上記方法は、ステップS11の後、ステップS12の前にステップS15をさらに含んでもよく、S15において、ステップS11において取得された輝度画像をダウンサンプリングする。また、ステップS14の後でステップS16を実行し、ステップS16において、ステップS14において取得された背景輝度画像をアップサンプリングする。
ここで、処理される画像はカラー画像であってもよく、この場合は、ステップS11においてカラー画像をYUV色空間に変換して、Y画像を輝度画像とする。グレースケール画像であってもよく、この場合は、輝度値はグレースケール値である。
1つの実施例では、図15に示すように、ステップS12は、下記のサブステップ、即ち輝度画像における背景の部分を抽出するステップ(S201)と、前景周辺の背景部分の画素の値を用いて前景をある程度まで充填し、充填して得られた輝度画像を初期背景輝度画像とするステップ(S202)と、を含んでもよい。
一例として、図16に示すように、ステップS201は、輝度画像を勾配画像に変換するステップ(S2011)と、二値化するステップ(S2012)と、最大サイズを有する白色の連結成分、及びその平均輝度との差が一定の範囲内にある他の白色の連結成分を背景部分としてマーキングするステップ(S2013)と、を含んでもよい。
また、ステップS13において、既存データに基づく多項式フィッティングを用いて頂部輝度及び/又は底部輝度における欠けている部分を補填してもよい。
1つの実施例では、ステップS13において、Lambertian反射モデルに基づいて頂部輝度及び/又は底部輝度における欠けている部分の推定輝度を計算し、該推定輝度に関連する値を既存データの一部として、頂部輝度及び/又は底部輝度における欠けている部分を補填する。一例として、推定輝度に関連する値は、推定輝度の頂部及び底部の辺に平行な方向に沿う導関数であってもよい。
また、ステップS13において、既存データに基づく線形補間を用いて頂部輝度及び/又は底部輝度における欠けている部分を補填してもよい。
一方、ステップS201において抽出された背景部分の平均輝度が所定の閾値よりも低い場合、ステップS13において、頂部輝度及び底部輝度を全て輝度画像における対応列の最大輝度値に設定する。この場合は、画像の各列は同一の背景輝度値を有し、補間を行う必要がない。
図14に戻り、画像における影を除去する影除去方法をさらに示し、該影除去方法は、上記の図14に説明された各ステップに加え、輝度画像から背景輝度画像の影響を除去するステップ(S21)、をさらに含む。
1つの実施例では、ステップ21は、輝度画像の値を背景輝度画像の値で割って、所定の係数を掛けて、輝度全体を調整するステップを含む。
該影除去方法を用いることで、画像の背景輝度画像を正確に抽出できるため、画像における影を迅速、且つ効率的に除去できる。
上記の処理及び装置は、ソフトウェア及び/又はファームウェアで実施されてもよい。ソフトウェア及び/又はファームウェアで実施されている場合、記憶媒体又はネットワークから専有のハードウェア構造を有するコンピュータ(例えば図17に示される汎用コンピュータ1700に該ソフトウェアを構成するプログラムをインストールしてもよく、該コンピュータに各種のプログラムがインストールされており、各種の機能を実行することができる。
図17において、中央処理部(即ちCPU)1701は、読み出し専用メモリ(ROM)1702に記憶されているプログラム、又は記憶部1708からランダムアクセスメモリ(RAM)1703にロードされたプログラムにより各種の処理を実行する。RAM1703には、必要に応じて、CPU1701が各種の処理を実行するに必要なデータが記憶されている。CPU1701、ROM1702、及びRAM1703は、バス1704を介して互いに接続されている。入力/出力インターフェース1705もバス1704に接続されている。
入力部1706(キーボード、マウスなどを含む)、出力部1707(ディスプレイ、例えばブラウン管(CRT)、液晶ディスプレイ(LCD)など、及びスピーカなどを含む)、記憶部1708(例えばハードディスクなどを含む)、通信部1709(例えばネットワークのインタフェースカード、例えばLANカード、モデムなどを含む)は、入力/出力インターフェース1705に接続されている。通信部1709は、ネットワーク、例えばインターネットを介して通信処理を実行する。必要に応じて、ドライブ部1710は、入力/出力インターフェース1705に接続されてもよい。取り外し可能な媒体1711は、例えば磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどであり、必要に応じてドライブ部1710にセットアップされて、その中から読みだされたコンピュータプログラムは必要に応じて記憶部1708にインストールされている。
ソフトウェアにより上記処理を実施する場合、ネットワーク、例えばインターネット、又は記憶媒体、例えば取り外し可能な媒体1711を介してソフトウェアを構成するプログラムをインストールする。
なお、これらの記憶媒体は、図17に示されている、プログラムを記憶し、機器と分離してユーザへプログラムを提供する取り外し可能な媒体1711に限定されない。取り外し可能な媒体1711は、例えば磁気ディスク(フロッピー(登録商標)ディスクを含む)、光ディスク(光ディスク−読み出し専用メモリ(CDROM)、及びデジタル多目的ディスク(DVD)を含む)、光磁気ディスク(ミニディスク(MD)(登録商標))及び半導体メモリを含む。或いは、記憶媒体は、ROM1702、記憶部1708に含まれるハードディスクなどであってもよく、プログラムを記憶し、それらを含む機器と共にユーザへ提供される。
また、本発明は機器が読み取り可能な指令コードを記録するプログラムプロダクトをさらに提供する。該指令コードは、機器により読み取られ、実行され、上記本発明の実施例に係る方法を実行できる。
また、上記の機器が実行可能な指令を記憶するプログラムプロダクトを記録する記憶媒体も本発明の公開に含まれる。該記憶媒体は、フロッピーディスク、光ディスク、光磁気ディスク、メモリカード、及びメモリスティックなどを含むが、これらに限定されない。
本発明の特定の実施形態は、後述の説明及び図面に示すように、詳細に開示され、本発明の原理を採用されることが可能な方式を示している。なお、本発明の実施形態は、範囲上には限定されるものではない。本発明の実施形態は、添付されている特許請求の範囲の主旨及び内容の範囲内、各種の改変、修正、及び均等的なものが含まれる。なお、用語「包括/含む」は、本文に使用される際に、特徴、要素、ステップ又は構成要件の存在を意味し、一つ又は複数の他の特徴、要素、ステップ又は構成要件の存在又は追加を排除するものではない。
以上、図面を参照しながら本発明の実施例を説明しているが、これは単なる一例であり、本発明を限定するものではない。当業者は実際の要求に応じて上記実施例に記載された機能的モジュールを組み合わせてもよいし、省略してもよいし、1つ又は複数の機能的モジュールを追加してもよく、これらの変形例は本公開の範囲に属する。本発明の範囲は添付されたクレーム及びその均等的内容に限定される。
また、上述の各実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
画像の背景輝度画像を抽出する装置であって、
前記画像における輝度値を抽出し、輝度画像を取得する輝度抽出手段と、
前記輝度画像に基づいて前記画像を背景と前景とに分離し、初期背景輝度画像を取得する分離手段と、
前記初期背景輝度画像における最上行及び最下行の値を頂部輝度及び底部輝度として抽出し、前記頂部輝度及び/又は底部輝度の一部が欠けている場合、前記頂部輝度及び/又は底部輝度における既存データを用いて欠けている部分を補填し、完全な頂部輝度及び底部輝度を取得する頂部底部輝度取得手段と、
前記頂部底部輝度取得手段により取得された完全な頂部輝度及び底部輝度に基づいて画像全体を補間し、前記画像の背景輝度画像を取得する補間手段と、を含む、装置。
(付記2)
前記輝度抽出手段により取得された輝度画像をダウンサンプリングするダウンサンプリング手段と、
前記補間手段により取得された前記背景輝度画像をアップサンプリングするアップサンプリング手段と、をさらに含む、付記1に記載の装置。
(付記3)
前記分離手段は、
前記輝度画像における背景の部分を抽出する背景部分抽出モジュールと、
前景周辺の背景部分の画素の値を用いて前記前景をある程度まで充填し、充填して得られた輝度画像を前記初期背景輝度画像とする充填モジュールと、を含む、付記1又は2に記載の装置。
(付記4)
前記背景部分抽出モジュールは、
前記輝度画像を勾配画像に変換して二値化する変換手段と、
最大サイズを有する白色の連結成分、及びその平均輝度との差が一定の範囲内にある他の白色の連結成分を背景部分としてマーキングするマーキング手段と、を含む、付記3に記載の装置。
(付記5)
前記頂部底部輝度取得手段は、既存データに基づく多項式フィッティングを用いて前記頂部輝度及び/又は底部輝度における欠けている部分を補填する、付記1又は2に記載の装置。
(付記6)
前記頂部底部輝度取得手段は、Lambertian反射モデルに基づいて前記頂部輝度及び/又は底部輝度における欠けている部分の推定輝度を計算し、該推定輝度に関連する値を既存データの一部として、前記頂部輝度及び/又は底部輝度における欠けている部分を補填する、付記5に記載の装置。
(付記7)
前記推定輝度に関連する値は、前記推定輝度の頂部及び底部の辺に平行な方向に沿う導関数である、付記6に記載の装置。
(付記8)
前記頂部底部輝度取得手段は、最小二乗法を用いて多項式フィッティングを行う、付記5に記載の装置。
(付記9)
前記頂部底部輝度取得手段は、既存データに基づく線形補間を用いて前記頂部輝度及び/又は底部輝度における欠けている部分を補填する、付記1又は2に記載の装置。
(付記10)
前記頂部底部輝度取得手段は、前記背景部分抽出モジュールにより抽出された背景部分の平均輝度が所定の閾値よりも低い場合、前記頂部輝度及び底部輝度を全て前記輝度画像における対応列の最大輝度値に設定する、付記3に記載の装置。
(付記11)
前記画像はカラー画像であり、前記輝度抽出手段は、前記カラー画像をYUV色空間に変換し、前記Y画像を前記輝度画像とする、付記1又は2に記載の装置。
(付記12)
前記画像はグレースケール画像であり、前記輝度値はグレースケール値である、付記1又は2に記載の装置。
(付記13)
画像における影を除去する影除去装置であって、
付記1乃至12の何れかに記載の装置を含み、
前記輝度画像から前記背景輝度画像の影響を除去する除去手段、をさらに含む、影除去装置。
(付記14)
前記除去手段は、前記輝度画像の値を前記背景輝度画像の値で割って、所定の係数を掛けて、輝度全体を調整する、付記13に記載の装置。
(付記15)
請求項13又は14に記載の影除去装置を含むスキャナ又はデジタルカメラ。
(付記16)
画像の背景輝度画像を抽出する方法であって、
前記画像における輝度値を抽出し、輝度画像を取得するステップと、
前記輝度画像に基づいて前記画像を背景と前景とに分離し、初期背景輝度画像を取得するステップと、
前記初期背景輝度画像における最上行及び最下行の値を頂部輝度及び底部輝度として抽出し、前記頂部輝度及び/又は底部輝度の一部が欠けている場合、前記頂部輝度及び/又は底部輝度における既存データを用いて欠けている部分を補填し、完全な頂部輝度及び底部輝度を取得するステップと、
取得された完全な頂部輝度及び底部輝度に基づいて画像全体を補間し、前記画像の背景輝度画像を取得するステップと、を含む、方法。
(付記17)
既存データに基づく多項式フィッティングを用いて前記頂部輝度及び/又は底部輝度における欠けている部分を補填する、付記16に記載の方法。
(付記18)
Lambertian反射モデルに基づいて前記頂部輝度及び/又は底部輝度における欠けている部分の推定輝度を計算し、該推定輝度に関連する値を既存データの一部として、前記頂部輝度及び/又は底部輝度における欠けている部分を補填する、付記17に記載の方法。
(付記19)
前記推定輝度に関連する値は、前記推定輝度の頂部及び底部の辺に平行な方向に沿う導関数である、付記18に記載の方法。
(付記20)
画像における影を除去する影除去方法であって、
付記16乃至19の何れかに記載の方法を含み、
前記輝度画像から前記背景輝度画像の影響を除去するステップ、をさらに含む、影除去方法。

Claims (10)

  1. 画像の背景輝度画像を抽出する装置であって、
    前記画像における輝度値を抽出し、輝度画像を取得する輝度抽出手段と、
    前記輝度画像に基づいて前記画像を背景と前景とに分離し、初期背景輝度画像を取得する分離手段と、
    前記初期背景輝度画像における最上行及び最下行の値を頂部輝度及び底部輝度として抽出し、前記頂部輝度及び/又は底部輝度の一部が欠けている場合、前記頂部輝度及び/又は底部輝度における既存データを用いて欠けている部分を補填し、完全な頂部輝度及び底部輝度を取得する頂部底部輝度取得手段と、
    前記頂部底部輝度取得手段により取得された完全な頂部輝度及び底部輝度に基づいて画像全体を補間し、前記画像の背景輝度画像を取得する補間手段と、を含む、装置。
  2. 前記輝度抽出手段により取得された輝度画像をダウンサンプリングするダウンサンプリング手段と、
    前記補間手段により取得された前記背景輝度画像をアップサンプリングするアップサンプリング手段と、をさらに含む、請求項1に記載の装置。
  3. 前記分離手段は、
    前記輝度画像における背景の部分を抽出する背景部分抽出モジュールと、
    前景周辺の背景部分の画素の値を用いて前記前景の少なくとも一部を充填し、充填して得られた輝度画像を前記初期背景輝度画像とする充填モジュールと、を含む、請求項1又は2に記載の装置。
  4. 前記背景部分抽出モジュールは、
    前記輝度画像を勾配画像に変換して二値化する変換手段と、
    最大サイズを有する白色の連結成分、及びその平均輝度との差が一定の範囲内にある他の白色の連結成分を背景部分としてマーキングするマーキング手段と、を含む、請求項3に記載の装置。
  5. 前記頂部底部輝度取得手段は、既存データに基づく多項式フィッティングを用いて前記頂部輝度及び/又は底部輝度における欠けている部分を補填する、請求項1又は2に記載の装置。
  6. 前記頂部底部輝度取得手段は、Lambertian反射モデルに基づいて前記頂部輝度及び/又は底部輝度における欠けている部分の推定輝度を計算し、該推定輝度に関連する値を既存データの一部として、前記頂部輝度及び/又は底部輝度における欠けている部分を補填する、請求項5に記載の装置。
  7. 前記推定輝度に関連する値は、前記推定輝度の頂部及び底部の辺に平行な方向に沿う導関数である、請求項6に記載の装置。
  8. 前記頂部底部輝度取得手段は、前記背景部分抽出モジュールにより抽出された背景部分の平均輝度が所定の閾値よりも低い場合、前記頂部輝度及び底部輝度を全て前記輝度画像における対応列の最大輝度値に設定する、請求項3に記載の装置。
  9. 画像における影を除去する影除去装置であって、
    請求項1乃至8の何れかに記載の装置を含み、
    前記輝度画像から前記背景輝度画像の影響を除去する除去手段、をさらに含む、影除去装置。
  10. 請求項に記載の影除去装置を含むスキャナ又はデジタルカメラ。
JP2015135640A 2014-07-07 2015-07-06 画像の背景輝度画像の抽出装置及び方法、並びに影除去装置及び方法 Active JP6592992B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201410320078.1 2014-07-07
CN201410320078.1A CN105335953B (zh) 2014-07-07 2014-07-07 提取图像的背景亮度图的装置和方法、去阴影装置和方法

Publications (2)

Publication Number Publication Date
JP2016019287A JP2016019287A (ja) 2016-02-01
JP6592992B2 true JP6592992B2 (ja) 2019-10-23

Family

ID=54609406

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015135640A Active JP6592992B2 (ja) 2014-07-07 2015-07-06 画像の背景輝度画像の抽出装置及び方法、並びに影除去装置及び方法

Country Status (3)

Country Link
US (1) US9204011B1 (ja)
JP (1) JP6592992B2 (ja)
CN (1) CN105335953B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106611406B (zh) * 2015-10-27 2019-08-16 富士通株式会社 图像校正方法和图像校正设备
CN106709904A (zh) * 2016-11-21 2017-05-24 天津大学 一种基于主动视觉的高值目标细微变化检测方法
US11069043B1 (en) * 2020-03-13 2021-07-20 Konica Minolta Business Solutions U.S.A., Inc. Background noise reduction using a variable range of color values dependent upon the initial background color distribution
CN113744172A (zh) * 2020-05-29 2021-12-03 北京小米松果电子有限公司 文档图像的处理方法及装置、训练样本的生成方法及装置
JP2022088249A (ja) * 2020-12-02 2022-06-14 シャープ株式会社 画像処理装置、制御方法及びプログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4731865A (en) * 1986-03-27 1988-03-15 General Electric Company Digital image correction
JPH09200455A (ja) * 1996-01-19 1997-07-31 Minolta Co Ltd 読取り画像の濃度補正方法及び画像読取り装置
US6192163B1 (en) * 1996-10-29 2001-02-20 Seiko Epson Corporation Image processing method and image processing apparatus
US6621595B1 (en) * 2000-11-01 2003-09-16 Hewlett-Packard Development Company, L.P. System and method for enhancing scanned document images for color printing
JP4991411B2 (ja) * 2006-07-28 2012-08-01 キヤノン株式会社 画像処理方法
JP2008160250A (ja) * 2006-12-21 2008-07-10 Kyocera Mita Corp 画像処理装置および画像処理プログラム
CN100592763C (zh) * 2007-02-15 2010-02-24 北京思比科微电子技术有限公司 对图像亮度进行调整的方法和装置
JP5182530B2 (ja) * 2007-07-03 2013-04-17 日本電気株式会社 画像補間方法、画像補間装置、及びプログラム
US8587834B2 (en) * 2009-01-15 2013-11-19 Kabushiki Kaisha Toshiba Shading correction apparatus in image scanning apparatus
JP5744510B2 (ja) * 2010-12-28 2015-07-08 キヤノン株式会社 画像処理方法
CN102081793A (zh) * 2011-01-06 2011-06-01 西北工业大学 星空背景图像帧转移型CCD传感器Smear效应亮线消除方法
CN102289668A (zh) * 2011-09-07 2011-12-21 谭洪舟 基于像素邻域特征的自适应文字图像的二值化处理方法
JP5865113B2 (ja) * 2012-02-20 2016-02-17 株式会社Pfu 画像処理装置、画像処理システム、画像処理方法及び画像処理プログラム
CN104700362A (zh) * 2013-12-06 2015-06-10 富士通株式会社 文档图像处理装置和方法
CN104851078A (zh) * 2014-02-14 2015-08-19 富士通株式会社 文档图像处理装置和方法

Also Published As

Publication number Publication date
CN105335953B (zh) 2018-04-10
US9204011B1 (en) 2015-12-01
JP2016019287A (ja) 2016-02-01
CN105335953A (zh) 2016-02-17

Similar Documents

Publication Publication Date Title
JP6592992B2 (ja) 画像の背景輝度画像の抽出装置及び方法、並びに影除去装置及び方法
JP5555706B2 (ja) 高解像度映像獲得装置およびその方法
JP6100744B2 (ja) 自動修復を用いたカラー文書画像セグメンテーション及び二値化
US20200258196A1 (en) Image processing apparatus, image processing method, and storage medium
JP5452116B2 (ja) 高解像度映像取得装置およびその方法
US9697583B2 (en) Image processing apparatus, image processing method, and computer-readable recording medium
US10455163B2 (en) Image processing apparatus that generates a combined image, control method, and storage medium
JP5870598B2 (ja) 画像のホワイトバランス処理方法及び装置
JP2017130060A (ja) 画像処理装置、画像処理方法及びプログラム
JP2013020617A (ja) グレースケール文字画像正規化装置及び方法
JP2015153424A (ja) 文書画像処理装置及び文書画像処理方法
JP6904842B2 (ja) 画像処理装置、画像処理方法
JP2017085570A (ja) 画像補正方法及び画像補正装置
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP2021196451A (ja) 画像変換装置、画像変換方法及び画像変換用コンピュータプログラム
CN103618904B (zh) 基于像素的运动估计方法及装置
JP6317413B1 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US20230162413A1 (en) Stroke-Guided Sketch Vectorization
KR102470242B1 (ko) 영상 처리 장치, 영상 처리 방법, 및 프로그램
WO2020241337A1 (ja) 画像処理装置
KR102340942B1 (ko) 영상 처리 방법 및 이를 이용한 표시장치
CN114648751A (zh) 一种处理视频字幕的方法、装置、终端及存储介质
JP2011053456A (ja) 画像表示方法、プログラム、画像表示装置、及び、この画像表示装置を有する撮像装置
JP7417166B2 (ja) デプスマップの精度向上装置、方法、およびプログラム
JP2022181493A (ja) 画像処理装置、画像処理方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190618

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190827

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190909

R150 Certificate of patent or registration of utility model

Ref document number: 6592992

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150