JP2015153424A - 文書画像処理装置及び文書画像処理方法 - Google Patents

文書画像処理装置及び文書画像処理方法 Download PDF

Info

Publication number
JP2015153424A
JP2015153424A JP2015022808A JP2015022808A JP2015153424A JP 2015153424 A JP2015153424 A JP 2015153424A JP 2015022808 A JP2015022808 A JP 2015022808A JP 2015022808 A JP2015022808 A JP 2015022808A JP 2015153424 A JP2015153424 A JP 2015153424A
Authority
JP
Japan
Prior art keywords
luminance
image
component image
luminance component
estimated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2015022808A
Other languages
English (en)
Inventor
攀 潘
Pan Pan
攀 潘
源 何
Yuan He
源 何
俊 孫
Shun Son
俊 孫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2015153424A publication Critical patent/JP2015153424A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/407Control or modification of tonal gradation or of extreme levels, e.g. background level
    • H04N1/4072Control or modification of tonal gradation or of extreme levels, e.g. background level dependent on the contents of the original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/94Dynamic range modification of images or parts thereof based on local image properties, e.g. for local contrast enhancement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/407Control or modification of tonal gradation or of extreme levels, e.g. background level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/141Control of illumination

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)
  • Image Input (AREA)
  • Image Analysis (AREA)

Abstract

【課題】文書画像処理装置及び方法を提供する。
【解決手段】文書画像処理方法は、文書画像の輝度成分画像を生成し、輝度成分画像に基づいて輝度画像を推定し、推定された輝度画像に基づいて輝度成分画像を調整し、輝度成分画像に基づいて輝度画像を推定するステップにおいて、輝度成分画像の背景の一部の輝度値に基づいて輝度成分画像の少なくとも水平エッジ領域の画素の輝度値を推定し、推定された輝度値が有効であると所定の基準に従って決定された場合、推定された輝度値に基づいて輝度画像を推定し、無効であると決定された場合、輝度成分画像の各画素列における全ての画素の輝度値を画素列における画素の最大輝度値に設定することで輝度画像を推定する。この装置及び方法によれば、適切な輝度画像の推定方式及び輝度成分画像の調整方式を自己適応的に用いることができるため、より良い輝度成分画像を取得できる。
【選択図】図3

Description

本発明は、一般的に画像処理分野に関し、特に輝度画像の推定及び輝度成分画像の調整を行う文書画像処理装置及び文書画像処理方法に関する。
スキャンして、或いは撮影して得られた文書画像、例えばオーバヘッド型スキャナによりスキャンした文書画像は、表面に凹凸を有する文書が例えばスキャナのLEDの光源により照らされ、スキャンして得られた画像に影が存在する可能性がある。影が存在すると、画像品質の劣化に繋がる。よって、影を除去するため、画像の背景を均一化する必要がある。
従来の影の除去方法は、文書画像(より具体的には、文書画像の輝度成分画像)から推定された輝度画像に基づいて文書画像の画像強度を調整して(輝度成分画像を調整して)、影を除去することで、背景の均一な文書画像を取得する。以下は、式(1)及び式(2)を参照しながら影除去の基本原理を説明する。式(1)は以下の通りである。
Figure 2015153424
ここで、Iは入力画像であり、Lは輝度画像であり、Rは反射画像であり、下付きYはこれらの画像が輝度成分画像でありことを表す。
よって、式(2)により背景のより均一な画像を取得できる。
Figure 2015153424
ここで、cは定数であり、平均画像グレースケールを意味し、εは非常に小さい定数であり、分母が0となることを防止するためのものである。
図1は、スキャンを行って取得された文書画像の輝度成分画像(図1(a))、輝度成分画像に基づいて推定された輝度画像(図1(b))、及び影を除去して取得された調整後の輝度成分画像(図1(c))を示す図である。以上のことから、正確な輝度画像を取得するのは、輝度成分画像を正確に調整し、文書画像から影を除去するためであることが分かった。現在、より正確な輝度画像を取得するのは、益々注目されている。
本発明の実施例は、文書画像処理装置及び文書画像処理方法を提供することを目的とする。
本発明の実施例の一の態様では、文書画像の輝度成分画像を生成する生成手段と、前記輝度成分画像に基づいて輝度画像を推定する推定手段と、推定された輝度画像に基づいて前記輝度成分画像を調整する調整手段と、を含み、前記推定手段は、前記輝度成分画像の背景の一部の輝度値に基づいて前記輝度成分画像の少なくとも水平エッジ領域の画素の輝度値を推定し、推定された水平エッジ領域の画素の輝度値が有効であると所定の基準に従って決定された場合、前記推定された輝度値に基づいて前記輝度画像を推定し、推定された輝度値が無効であると所定の基準に従って決定された場合、前記輝度成分画像の各画素列における全ての画素の輝度値を前記画素列における画素の最大輝度値に設定することで前記輝度画像を推定する、文書画像処理装置を提供する。
本発明の実施例では、前記所定の基準は、前記水平エッジ領域に、背景と決定されていない大きな連結領域が存在する場合、前記推定された輝度値が無効であると決定すること、を含んでもよい。
本発明の実施例では、前記所定の基準は、画素列の上下の水平エッジ領域の画素の前記推定された輝度値の差が所定レベルを超えた場合、前記推定された輝度値が無効であると決定すること、を含んでもよい。
本発明の実施例では、前記調整手段は、前記輝度成分画像と前記調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えた場合、前記輝度成分画像を前記調整された輝度成分画像として出力してもよい。
本発明の実施例では、前記調整手段は、前記輝度成分画像と前記調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えた場合、ガンマ補正が行われた前記輝度成分画像を前記調整された輝度成分画像として出力してもよい。
本発明の実施例の他の態様では、文書画像の輝度成分画像を生成するステップと、前記輝度成分画像に基づいて輝度画像を推定するステップと、推定された輝度画像に基づいて前記輝度成分画像を調整するステップと、を含み、前記輝度成分画像に基づいて輝度画像を推定するステップは、前記輝度成分画像の背景の一部の輝度値に基づいて前記輝度成分画像の少なくとも水平エッジ領域の画素の輝度値を推定し、推定された水平エッジ領域の画素の輝度値が有効であると所定の基準に従って決定された場合、前記推定された輝度値に基づいて前記輝度画像を推定し、推定された輝度値が無効であると所定の基準に従って決定された場合、前記輝度成分画像の各画素列における全ての画素の輝度値を前記画素列における画素の最大輝度値に設定することで前記輝度画像を推定するステップ、を含む、文書画像処理方法を提供する。
本発明の実施例に係る文書画像処理装置及び方法によれば、適切な輝度画像の推定方式及び輝度成分画像の調整方式を自己適応的に用いることができるため、輝度画像をより正確に推定でき、輝度成分画像をより効率的に調整でき、より自然な、よい視覚効果を取得できる。
下記図面の詳細の説明を通じて、本発明の実施例の上記の目的、他の目的、特徴及び利点はより明確になる。図面におけるユニットは、単なる本発明の原理を示すものである。図面において、同一又は類似する技術的特徴又はユニットは、同一又は類似する符号で示されている。図面において、縮尺に合わせてユニットのサイズ及び相対的な位置を引かなくてもよい。
スキャンを行って取得された文書画像の輝度成分画像、輝度成分画像に基づいて推定された輝度画像、及び調整された輝度成分画像を示す図である。 本発明の実施例に係る文書画像処理装置の構成を示すブロック図である。 本発明の実施例に係る推定部の機能的構成を示すブロック図である。 本発明の実施例に係る、輝度成分画像の水平エッジ領域の画素の輝度値に基づいて輝度画像を推定することを示す図である。 輝度画像を推定するために用いられる穴充填方法の原理を説明する図である。 本発明の実施例に係る文書画像処理方法のフローチャートである。 本発明の実施例に係る調整部の機能的構成を示すブロック図である。 本発明の実施例に係る輝度成分画像の調整処理のフローチャートである。 本発明を実施するためのコンピュータの構成を例示するブロック図である。
以下、図面を参照しながら本発明の例示的な実施例を詳細に説明する。説明の便宜上、明細書及び図面には、本発明の実施例と関係のないユニット及び処理、又は当業者にとって周知のユニット及び処理についての説明が省略される。
図2は、本発明の実施例に係る文書画像処理装置200の構成を示すブロック図である。文書画像処理装置200は、生成部201、推定部202、及び調整部203を含む。生成部201は、文書画像の輝度成分画像を生成する。生成部201は、周知の如何なる方法を用いて文書画像の輝度成分画像を生成してもよく、ここにその説明が省略される。推定部202は、生成部201により生成された輝度成分画像に基づいて輝度画像を推定する。調整部203は、推定部202により推定された輝度画像に基づいて、生成部201から受信された輝度成分画像を調整し、調整された輝度成分画像を調整結果として出力する。
例えば小説、漫画、雑誌など異なる文書をスキャン、或いは撮影して得られた、異なる組み版方式を有する文書画像は、対応する輝度画像の推定方法を用いてより正確な輝度画像の推定結果を取得できる。本発明の実施例に係る推定部202によれば、異なるタイプの文書(それに基づいて取得された輝度成分画像)について自己適応の輝度画像推定を提供でき、より正確な推定結果を取得できる。
図3は、本発明の実施例に係る推定部300の機能的構成を示すブロック図である。図3に示すように、推定部300は、第1の推定部301、判断部302、及び第2の推定部303を含む。これらのユニットは、例えばFPGA、集積回路チップ等のハードウェアにより実施されてもよいし、コンピュータソフトウェアにより実施された機能的モジュールであってもよし、ソフトウェアとハードウェアとを組み合わせたファームウェアにより実施されてもよい。また、これらのユニットは、物理的に分離して実施されてもよいし、1つの単独のモジュールに統合されてもよい。
第1の推定部301は、生成部により生成された輝度成分画像を受信し、受信された輝度成分画像の背景の一部の輝度値に基づいて輝度成分画像の少なくとも水平エッジ領域の画素の輝度値を推定する。
通常、文書画像は、例えば文字、図などの内容部分(「内容」と称する)と、内容を含まない背景部分(「背景」と称する)を含む。文書画像から輝度成分画像を生成した後で、輝度成分画像における各部分は、文書画像の内容部分及び背景部分にそれぞれ対応する。輝度成分画像の背景における画素の輝度値は、インクの影響を受けないから、その位置の真実の輝度をより正確に表現できるため、輝度成分画像の背景の一部の輝度値を用いて文書画像の輝度画像を推定してもよい。本発明の実施例では、まず、水平エッジ領域の画素の輝度値を推定してもよい。
1つの具体例では、第1の推定部301は、受信された輝度成分画像のグラディエントマップ(gradient map)を取得して、それに対して二値化処理を行う。取得された二値化画像においては、第1の推定部301は輝度値に基づいて背景である連結領域を決定する。例えば、背景が、二値化処理後の輝度成分画像における高輝度を表す値を有する画素の連結領域又は最大の連結領域の結合領域に対応する、と仮定する。第1の推定部301は、このような連結領域又は連結領域の結合領域に基づいて背景の位置を決定する。そして、第1の推定部301は、輝度成分画像において決定された背景の一部に位置する画素の輝度値に基づいて、輝度成分画像の水平エッジ領域の画素の輝度値を推定する。
他の例では、背景をより正確に決定するため、背景連結領域を決定する前に、二値化された画像に対して「ノイズ除去」及び「膨張」の処理を行ってもよい。ここの「膨張」処理とは、ノイズの干渉を低減するように、内容部分を外へ適当に拡張することを指す。また、水平エッジ領域の画素の輝度値を推定するため、例えばその隣接領域などの関連領域の輝度値を推定する場合がある。このように背景として決定された画素の輝度値に基づいて、背景と決定されていない(非背景として決定される)画素の輝度値を推定する方法は、穴充填方法とも称される。これらの背景と決定されていない画素により構成された連結領域は穴と称される。
通常、文書のエッジ領域は、単純であり、内容を含まない。例えば、書籍では、上下の水平エッジ領域及び両脇の縦エッジ領域がある。よって、輝度成分画像のエッジ領域の画素の推定された輝度値に基づいて輝度画像を推定するのは、信頼性が高い。
また、通常、文書画像における輝度の変化は、方向に応じて異なる変化規律を有する。例えば、文書画像の輝度画像の輝度値は、一方向に沿う変化が他方向に沿う変化よりも小さい。これは、いくつの原因によるものである。例えば、行列状又は線状に配列されたスキャナの光源(例えば発光ダイオード)又はカメラの光源により照射されて、生じた輝度値が規則的に変化する。又は、例えば開いた本をスキャン或いは撮影して得られた文書画像の輝度画像は、本を開いた時に紙の曲がった形により、綴じ糸に平行する方向(通常は縦方向)に沿う輝度値の変化が小さい、或いはない。従って、例えば開いた本をスキャン或いは撮影して得られた文書画像は、その縦エッジ方向に沿う文書画像の輝度変化が小さい或いはなく、一方、水平エッジ方向に沿う文書画像の輝度変化が大きい。
よって、文書画像の縦方向に沿う輝度変化が水平エッジの方向に沿う輝度変化よりも小さく、且つエッジ領域の輝度値が高い信頼性を有するという特徴を鑑み、第1の推定部301は、輝度成分画像の水平エッジ領域の画素の推定された輝度値に基づいて輝度画像を推定してもよい。
図4は、本発明の実施例に係る、輝度成分画像の水平エッジ領域の画素の輝度値に基づいて輝度画像を推定することを示す図である。図4の例では、縦方向に綴じた本では、上下の水平エッジに対応する方向がx方向であり、左右の辺に対応する方向がy方向である。y方向に沿う輝度変化が小さいため、x方向に平行する水平エッジのエッジ画素の推定輝度値、例えば直線x=x1上のエッジ画素の推定輝度値又はいくつのエッジ画素の推定輝度値の平均値に基づいて直線x=x1上の他の画素の輝度値を推定してもよい。図4に示される直線x=x1における矩形に囲まれている部分は、水平エッジ領域の、輝度画像の推定に利用可能な画素の位置を表す。例えば、直線x=x1上のエッジ画素の推定輝度値(又は平均値)を用いて直線x=x1に対して補間を行って、直線x=x1上の他の画素の輝度値を推定してもよい。
図5は、背景として決定された連結領域における画素の輝度値に基づいて背景と決定されていない連結領域における画素の輝度値を推定する穴充填方法の原理を説明する図である。図5(a)は、スキャンして得られた文書画像の二値化後のグラディエントマップを示している。文書画像における背景領域の一部の輝度情報を直接に決定できるが、背景領域として決定されていない部分、例えば文字及び図の輝度情報は、推定して取得する必要がある。よって、図5(b)に示すように、輝度画像を取得するための中間ステップにおいて、例えば文字及び図の部分は穴(黒色の穴)となった。文字部分はサイズの小さい穴(小さい穴)であり、図の部分はサイズの大きい穴(大きい穴)である。穴の充填では、適当な輝度値により各穴を充填する。大きい穴及び小さい穴について、同一の充填方法を用いてもよいし、異なる充填方法を用いてもよい。通常、穴のサイズが大きいほど、充填して得られた輝度値の信頼性が低い。実際の信頼性への要求に応じて、「大きい穴」のサイズ基準を指定してもよい。例えば、文書画像の全体高さの1/4以上の高さを有する穴を大きい穴としてもよい。
本発明の1つの実施例では、第1の推定部301は、輝度成分画像の水平エッジ領域の画素の輝度値を推定した後で、直ちに推定された輝度値に基づいて輝度成分画像全体の輝度画像を推定しない。好ましくは、最適な輝度画像推定方法を自己適応的に選択し、最も正確な輝度画像を取得するため、第1の推定部301は、輝度成分画像の水平エッジ領域の画素の輝度値を推定した後で、取得されたエッジ領域の推定輝度値を判断部302に出力する。
判断部302は、所定の基準に従って、第1の推定部301により推定された水平エッジ領域の画素の輝度値が有効であるか否かを決定する。そして、輝度値が有効であると判断部302により決定された場合は、推定された輝度値が有効であるという結果を第1の推定部301に通知する、或いは処理継続の指示を第1の推定部301に直接に送信する。判断部302のフィードバックに応じて、第1の推定部301は、推定された水平エッジ領域の輝度値に基づいて全体の輝度画像を推定する。具体的な推定方法は、例えば図4に示される方法を参照する。輝度値が無効であると判断部302により決定された場合は、第1の推定部301の処理を停止し、第2の推定部303の推定を起動する。判断部302によれば、適当な輝度画像推定方式を自己適応的に選択して輝度画像を推定できる。
システムの要求に応じて、判断部302は、設計者により決められた所定の基準に基づいて品質決定を行う。例えば、以下の基準を用いてもよい。画素列の上下の水平エッジ領域の画素の推定された輝度値の差が所定レベルを超えた場合は、推定された輝度値が無効であると決定する。例えば、画素列の上下の水平エッジ領域の画素の推定輝度値の差が所定の閾値よりも大きい場合は、推定輝度値が無効であると決定する。具体的には、例えば、輝度値を0〜255の範囲内の値で表示する場合、閾値を例えば50〜70に設定してもよい。より具体的な例では、画素列の上下の2つの画素の推定輝度値の差が所定の閾値(例えば60)よりも大きい場合、判断部302は、推定された輝度値が無効であると決定してもよい。他の例では、条件が少し緩和され、連続的な画素列における上下の2つの画素の輝度値の差が所定の閾値よりも大きい場合は、判断部302は推定された輝度値が無効であると決定してもよい。即ち、この例では、複数の離散的な列のみの水平エッジ領域における画素の推定輝度値の差が所定閾値よりも大きい場合は、判断部302は推定された輝度値が有効であると決定してもよい。他の例では、推定輝度値の差と所定閾値との比較に代わって、上下の水平エッジ画素の推定輝度値(又はその平均値)の差の絶対値を上下の水平エッジ画素の推定輝度値(又はその平均値)で割って得られた変化率と、所定の変化率閾値(例えば1.0〜2.0の値に設定されたもの)とを比較することで、上下の水平エッジ領域の画素の推定輝度値の差が所定のレベルを超えたか否かを決定してもよい。
また、判断部302は、以下の基準を用いて決定してもよい。輝度成分画像の水平エッジ領域に、背景と決定されていない大きな連結領域(即ち大きい穴)が存在する場合、判断部302は、推定された輝度値が無効であると決定してもよい。本実施例では、「水平エッジ領域」とは、予め設定された輝度画像を推定するための、輝度成分画像における上下の水平エッジに最も接近する所定数の行の集合を指す。例えば、輝度成分画像の最も上の10行及び最も下の10行の画素の推定輝度値を用いて輝度画像全体の推定を行うことと判断部302により予め設定された場合は、「水平エッジ領域」は、この最も上の10個の画素行の集合及び最も下の10個の画素行の集合を指す。水平エッジ領域に含まれる行の数に依らずに、その内の行に大きい穴が存在する場合だけ、判断部302は推定輝度値が無効であると決定する。穴の大きさは例えばその高さにより判断される。例えば、輝度画像全体の高さの1/4よりも大きい高さを有する穴を大きい穴と決定する。
1つの例では、第1の推定部301が輝度成分画像の水平エッジの行の画素(即ち最も上の行の画素及び最も下の行の画素)の推定輝度値に基づいて輝度画像を推定するように構成された場合、判断部302は、最も上の画素行及び/又は最も下の画素行に大きい穴が存在するか否かに基づいて、水平エッジ領域に大きい穴が存在するか否かを決定してもよい。もう1つの例では、第1の推定部301が輝度成分画像の水平エッジ領域における所定数の行の画素の推定輝度値の平均値に基づいて輝度画像を推定するように構成された場合、判断部302は、該水平エッジ領域の所定数の行に大きい穴の一部が存在するか否かに基づいて、水平エッジ領域に大きい穴が存在するか否かを決定してもよい。
輝度成分画像の水平エッジ領域に対して穴充填処理を行う前に、判断部302によりこの基準に基づく判断が実行されるため、システムの効率を向上でき、計算コストを低減できる。
なお、上述した2つの基準は同一の実施例に用いられてもよい。例えば、水平エッジ領域に大きい穴が存在しないと決定された場合は、輝度成分画像の背景の一部の輝度値に基づいて水平エッジ領域の輝度値を推定する。推定した後で、上下の水平エッジ領域(例えば最も上の行及び最も下の行)の輝度値の間の変化が所定のレベルを超えたか否かを決定する。
第1の推定部301により入力された推定輝度値が無効であると判断部302により決定された場合は、第2の推定部303の操作が起動される。第2の推定部303は、輝度成分画像の各画素列における全ての画素の輝度値を該画素列における画素の最大輝度値に設定することで輝度画像を推定する。これによって、輝度画像の推定方法を自己適応的に選択できる。
通常は、文書画像には、紙(影を含む、或いは影を含まない)及びインク(文字、図などの内容を含む)が含まれる。文書画像における各画素は、紙の画素に属するか、それともインクの画素に属する。各列に少なくとも1つの画素が紙に属する(インクではない)と仮定すると、最も明るい画素の輝度値が影のない紙の輝度値に対応すると考えられる。この場合は、第2の推定部303は、輝度成分画像の各画素列における全ての画素の輝度値を該画素列における画素の最大輝度値に設定することで輝度画像を推定してもよい。
文書画像における単一の列の画素が全てインクに属する場合は、連続的な列が全てインクではない限り、第2の推定部303の推定方法を用いてもよい。この際に、第2の推定部303は、平滑化技術によりこれらの欠けている列を回復すればよい。
図6は、本発明の実施例に係る文書画像処理方法のフローチャートである。図2の実施例を参照しながら、ステップS601において、生成部201は、文書画像の輝度成分画像を生成する。周知の各種の方法を用いて輝度成分画像を生成してもよい。
ステップ602において、推定部202は、輝度成分画像の背景の一部の輝度値に基づいて輝度成分画像の少なくとも水平エッジ領域の画素の輝度値を推定する。上述したように、穴充填方法により輝度成分画像の少なくとも水平エッジ領域の画素の輝度値を推定してもよい。具体的な方法は、上述したものであり、ここにその説明が省略される。
ステップ603において、推定部202は、所定の基準に従って、ステップS602において推定された輝度値が有効であるか否かを決定する。所定の基準としては、水平エッジ領域に、背景と決定されていない大きな連結領域(大きい穴)が存在する場合、推定された輝度値が無効であると決定してもよい。大きい穴の定義は、必要に応じて設計者により決定されてもよい。他の例では、所定の基準としては、画素列の上下の水平エッジ領域の画素の推定された輝度値の差が所定レベルを超えた場合、推定された輝度値が無効であると決定してもよい。
推定された輝度値が有効であると推定部202により決定された場合(ステップ603では「YES」)、処理がステップS604に進む。ステップS604において、推定部202は、推定された輝度値に基づいて輝度画像を推定する。
例えば、1つの実施例では、穴充填方法により推定された上下の水平エッジ領域の画素の輝度値の差が所定レベルを超えていないとステップS603において決定された場合、推定された輝度値が有効であると決定する。よって、ステップS604に進み、穴充填が行われた水平エッジ領域の画素の輝度値により輝度画像の他の部分を推定する。
推定された輝度値が無効であると推定部202により決定された場合(ステップS603では「NO」)、処理がステップS605に進む。ステップS605において、輝度成分画像の各画素列における全ての画素の輝度値を画素列における画素の最大輝度値に設定することで輝度画像を推定する。
ステップS604又はステップS605において輝度画像の推定が完了した場合、処理はステップS606に進む。ステップS606において、推定された輝度画像に基づいて輝度成分画像を調整する。そして、処理が終了する。
図3に戻り、第1の推定部301又は第2の推定部303により輝度画像の推定が行われた後で、推定部は、調整部、例えば図2の調整部203に推定結果を出力する。調整部203は、推定された輝度画像に基づいて輝度成分画像を調整する。文書画像の輝度成分画像に対する調整の対象はユーザである。即ち、ユーザに心地よく、且つ自然の視覚効果を提供できる輝度成分画像の調整結果が求めている。よって、不自然の結果を生じることなく、ユーザに良い視覚効果を提供できるように、調整結果として調整後の輝度成分画像を出力するため、調整部203は、更なる検証機能を有してもよい。
図7は、本発明の実施例に係る調整部700の機能的構成を示すブロック図である。第1の調整部701は、推定部から入力された輝度画像に基づいて、生成部から入力された輝度成分画像を調整する。第1の調整部701は、周知の如何なる方法により調整してもよい。そして、調整結果は、検証部702に入力される。
検証部702は、元々入力された輝度成分画像と、調整された輝度成分画像との同一位置の画素の値の間の変化が所定レベルを超えたか否かを決定する。例えば、元々入力された輝度成分画像と、調整された輝度成分画像との同一位置の画素の値の変化は、R=abs(inimg[x,y]−outimg[x,y])/inimg[x,y]で表示されてもよく、ここで、「abs」は絶対値の計算を表し、「inimg[x,y]」は元々入力された輝度成分画像の位置(x,y)の画素の値を表し、「outimg[x,y]」は調整された輝度成分画像の位置(x,y)の画素の値を表す。例えば、変化Rの閾値は、1.0〜2.0の値に設定されてもよい。
1つの実施例では、全ての位置の変化Rのうちの最大値が閾値よりも大きい場合、検証部702は、原輝度成分画像と調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えたと決定してもよい。そうでないと、所定レベルを超えていないと決定してもよい。他の実施例では、全ての位置の変化Rのうち所定数(N)のRが該閾値を超えた場合のみ、検証部702は、原輝度成分画像と前記調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えたと決定する。そうでないと、所定レベルを超えていないと決定する。
現輝度成分画像と調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えていないと検証部702により決定された場合、調整部700は、第1の調整部701の調整結果を最終調整の輝度成分画像として直接に出力してもよい。
現輝度成分画像と調整された輝度成分画像との同一位置(又はNよりも多い位置)の画素の値の変化が所定レベルを超えた場合、第2の調整部703の操作を起動する。
1つの実施例では、第2の調整部703は、生成部から受信された輝度成分画像に対して処理を行わずに、それを調整部700の調整結果として直接に出力する。この場合は、第2の調整部703は、調整部700における記憶装置として実施されてもよく、輝度成分生成部により生成された輝度成分画像を記憶し、調整部700は、調整された輝度成分画像の変化が範囲を超えたか否かの検証結果に応じて、記憶された原輝度成分画像を第2の調整部703から読み出して出力する。
もう1つの実施例では、第2の調整部703は、検証部702による調整された輝度成分画像の変化が範囲を超えたか否かの検証結果に応じて、元々入力された輝度成分画像に対してガンマ補正処理を行ってもよい。そして、ガンマ補正が行われた輝度成分画像を調整部700の調整結果として出力する。ガンマ補正によれば、輝度成分画像における影が低減された。
図8は、本発明の実施例に係る輝度成分画像の調整処理のフローチャートである。図2に示される実施例を参照しながら、ステップS801において、調整部203は、推定部202により推定された輝度画像に基づいて、輝度成分画像を調整する。
ステップ802において、調整部203は、現輝度成分画像と調整された輝度成分画像との同一位置の画素の値の変化(例えば変化率R)が所定レベル(所定閾値TH)を超えたか否かを決定する。
現輝度成分画像と調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えていないとステップS802において決定された場合(ステップS802では「NO」)、ステップS804に進む。ステップS804において、ステップS801において取得された調整後の輝度成分画像を調整結果として出力する。そして、処理が終了する。
現輝度成分画像と調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えたとステップS802において決定された場合(ステップS802では「YES」)、ステップS803に進む。ステップS803において、ステップS801の調整結果を放棄し、例えば輝度成分画像における影を低減するように、原輝度成分画像に対してガンマ補正を行う。そして、処理がステップS804に進む。
ステップS804において、ガンマ処理が行われた輝度成分画像を調整結果として出力する。そして、処理が終了する。
図9は、本発明を実施するためのコンピュータの構成を例示するブロック図である。図9において、中央処理部(即ちCPU)901は、読み出し専用メモリ(ROM)902に記憶されているプログラム、又は記憶部908からランダムアクセスメモリ(RAM)903にロードされたプログラムにより各種の処理を実行する。RAM903には、必要に応じて、CPU901が各種の処理を実行するに必要なデータが記憶されている。
CPU901、ROM902、及びRAM903は、バス904を介して互いに接続されている。入力/出力インターフェース905もバス904に接続されている。
入力部906(キーボード、マウスなどを含む)、出力部907(ディスプレイ、例えばブラウン管(CRT)、液晶ディスプレイ(LCD)など、及びスピーカなどを含む)、記憶部908(例えばハードディスクなどを含む)、通信部909(例えばネットワークのインタフェースカード、例えばLANカード、モデムなどを含む)は、入力/出力インターフェース905に接続されている。通信部909は、ネットワーク、例えばインターネットを介して通信処理を実行する。
必要に応じて、ドライブ部910は、入力/出力インターフェース905に接続されてもよい。取り外し可能な媒体911は、例えば磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどであり、必要に応じてドライブ部910にセットアップされて、その中から読みだされたコンピュータプログラムは必要に応じて記憶部908にインストールされている。
ソフトウェアにより上記処理を実施する場合、ネットワーク、例えばインターネット、又は記憶媒体、例えば取り外し可能な媒体911を介してソフトウェアを構成するプログラムをインストールする。
なお、これらの記憶媒体は、図9に示されている、プログラムを記憶し、機器と分離してユーザへプログラムを提供する取り外し可能な媒体911に限定されない。取り外し可能な媒体911は、例えば磁気ディスク(フロッピー(登録商標)ディスクを含む)、光ディスク(光ディスク−読み出し専用メモリ(CDROM)、及びデジタル多目的ディスク(DVD)を含む)、光磁気ディスク(ミニディスク(MD)(登録商標))及び半導体メモリを含む。或いは、記憶媒体は、ROM902、記憶部908に含まれるハードディスクなどであってもよく、プログラムを記憶し、それらを含む機器と共にユーザへ提供される。
本発明は、機器に読み取り可能な指令コードを記憶するプログラムプロダクトをさらに提供する。該指令コードは機器により読み出されて、上述した本発明の実施例に係る方法を実行できる。
それに応じて、本発明は、機器読み取り可能な指令コードを記憶するプログラムのプロダクトが記録されている記憶媒体をさらに含む。該記憶媒体は、フロッピーディスク、光ディスク、光磁気ディスク、メモリカード、メモリスティックを含むが、これらに限定されない。
また、本発明の実施例に係る組み合わせツールに適用する方法及び装置は、組み合わせの使用範囲が拡大されてもよい。
なお、ここに例示されたものは単なる一例であり、本発明はこれに限定されない。
1つの例としては、上記実施例に係る方法の各ステップ及び上記実施例に係る装置の各構成モジュール及び又はユニットは、ソフトウェア、ファームウェア、ハードウェア又はそれらの組み合わせであってもよく、機器の一部としてもよい。上記装置の各構成モジュール、ユニットをソフトウェア、ファームウェア、ハードウェア又はそれらの組み合わせの方式で配置する際に用いられる具体的な手段又は方法は、当業者にとって周知であり、ここにその説明が省略される。
1つの例としては、ソフトウェア又はファームウェアで実施する際に、記憶媒体又はネットワークから専有のハードウェア構造を有するコンピュータ(例えば図9に示される汎用コンピュータ900)に該ソフトウェアを構成するプログラムをインストールしてもよく、該コンピュータに各種のプログラムがインストールされており、各種の機能を実行することができる。
1つの実施形態について記載および/または図示した特徴は同一または類似の方法で1つまたは複数の他の実施形態で使用することができ、また、その他の実施形態の中の特徴と組合せ、または他の実施形態の特徴を代替することもできる。
なお、用語「包括/含む」は、本文に使用される際に、特徴、要素、ステップ又は構成要件の存在を意味し、一つ又は複数の他の特徴、要素、ステップ又は構成要件の存在又は追加を排除するものではない。
また、本発明の方法は、明細書に説明された時間順で行なわれることに限らず、他の時間順で、又は並行して、又は単独で実行することもできる。従って、本発明の技術的範囲は、明細書に記載の方法の実行順番に限定されない。
本発明の特定の実施形態は、後述の説明及び図面に示すように、詳細に開示され、本発明の原理を採用されることが可能な方式を示している。なお、本発明の実施形態は、範囲上には限定されるものではない。本発明の実施形態は、添付されている特許請求の範囲の主旨及び内容の範囲内、各種の改変、修正、及び均等的なものが含まれる。
また、上述の各実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
文書画像の輝度成分画像を生成する生成手段と、
前記輝度成分画像に基づいて輝度画像を推定する推定手段と、
推定された輝度画像に基づいて前記輝度成分画像を調整する調整手段と、を含み、
前記推定手段は、前記輝度成分画像の背景の一部の輝度値に基づいて前記輝度成分画像の少なくとも水平エッジ領域の画素の輝度値を推定し、推定された水平エッジ領域の画素の輝度値が有効であると所定の基準に従って決定された場合、前記推定された輝度値に基づいて前記輝度画像を推定し、推定された輝度値が無効であると所定の基準に従って決定された場合、前記輝度成分画像の各画素列における全ての画素の輝度値を前記画素列における画素の最大輝度値に設定することで前記輝度画像を推定する、文書画像処理装置。
(付記2)
前記所定の基準は、
前記水平エッジ領域に、背景と決定されていない大きな連結領域が存在する場合、前記推定された輝度値が無効であると決定すること、を含む、付記1に記載の文書画像処理装置。
(付記3)
前記所定の基準は、
画素列の上下の水平エッジ領域の画素の前記推定された輝度値の差が所定レベルを超えた場合、前記推定された輝度値が無効であると決定すること、を含む、付記1又は2に記載の文書画像処理装置。
(付記4)
前記調整手段は、前記輝度成分画像と前記調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えた場合、前記輝度成分画像を前記調整された輝度成分画像として出力する、付記1乃至3のいずれかに記載の文書画像処理装置。
(付記5)
前記調整手段は、前記輝度成分画像と前記調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えた場合、ガンマ補正が行われた前記輝度成分画像を前記調整された輝度成分画像として出力する、付記1乃至3のいずれかに記載の文書画像処理装置。
(付記6)
文書画像の輝度成分画像を生成するステップと、
前記輝度成分画像に基づいて輝度画像を推定するステップと、
推定された輝度画像に基づいて前記輝度成分画像を調整するステップと、を含み、
前記輝度成分画像に基づいて輝度画像を推定するステップは、
前記輝度成分画像の背景の一部の輝度値に基づいて前記輝度成分画像の少なくとも水平エッジ領域の画素の輝度値を推定し、推定された水平エッジ領域の画素の輝度値が有効であると所定の基準に従って決定された場合、前記推定された輝度値に基づいて前記輝度画像を推定し、推定された輝度値が無効であると所定の基準に従って決定された場合、前記輝度成分画像の各画素列における全ての画素の輝度値を前記画素列における画素の最大輝度値に設定することで前記輝度画像を推定するステップ、を含む、文書画像処理方法。
(付記7)
前記所定の基準は、
前記水平エッジ領域に、背景と決定されていない大きな連結領域が存在する場合、前記推定された輝度値が無効であると決定すること、を含む、付記6に記載の文書画像処理方法。
(付記8)
前記所定の基準は、
画素列の上下の水平エッジ領域の画素の前記推定された輝度値の差が所定レベルを超えた場合、前記推定された輝度値が無効であると決定すること、を含む、付記6又は7に記載の文書画像処理方法。
(付記9)
前記輝度成分画像と前記調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えた場合、前記輝度成分画像を前記調整された輝度成分画像として出力するステップ、をさらに含む、付記6乃至8のいずれかに記載の文書画像処理方法。
(付記10)
前記輝度成分画像と前記調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えた場合、ガンマ補正が行われた前記輝度成分画像を前記調整された輝度成分画像として出力するステップ、をさらに含む、付記6乃至8のいずれかに記載の文書画像処理方法。

Claims (10)

  1. 文書画像の輝度成分画像を生成する生成手段と、
    前記輝度成分画像に基づいて輝度画像を推定する推定手段と、
    推定された輝度画像に基づいて前記輝度成分画像を調整する調整手段と、を含み、
    前記推定手段は、前記輝度成分画像の背景の一部の輝度値に基づいて前記輝度成分画像の少なくとも水平エッジ領域の画素の輝度値を推定し、推定された水平エッジ領域の画素の輝度値が有効であると所定の基準に従って決定された場合、前記推定された輝度値に基づいて前記輝度画像を推定し、推定された輝度値が無効であると所定の基準に従って決定された場合、前記輝度成分画像の各画素列における全ての画素の輝度値を前記画素列における画素の最大輝度値に設定することで前記輝度画像を推定する、文書画像処理装置。
  2. 前記所定の基準は、
    前記水平エッジ領域に、背景と決定されていない大きな連結領域が存在する場合、前記推定された輝度値が無効であると決定すること、を含む、請求項1に記載の文書画像処理装置。
  3. 前記所定の基準は、
    画素列の上下の水平エッジ領域の画素の前記推定された輝度値の差が所定レベルを超えた場合、前記推定された輝度値が無効であると決定すること、を含む、請求項1又は2に記載の文書画像処理装置。
  4. 前記調整手段は、前記輝度成分画像と前記調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えた場合、前記輝度成分画像を前記調整された輝度成分画像として出力する、請求項1乃至3のいずれかに記載の文書画像処理装置。
  5. 前記調整手段は、前記輝度成分画像と前記調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えた場合、ガンマ補正が行われた前記輝度成分画像を前記調整された輝度成分画像として出力する、請求項1乃至3のいずれかに記載の文書画像処理装置。
  6. 文書画像の輝度成分画像を生成するステップと、
    前記輝度成分画像に基づいて輝度画像を推定するステップと、
    推定された輝度画像に基づいて前記輝度成分画像を調整するステップと、を含み、
    前記輝度成分画像に基づいて輝度画像を推定するステップは、
    前記輝度成分画像の背景の一部の輝度値に基づいて前記輝度成分画像の少なくとも水平エッジ領域の画素の輝度値を推定し、推定された水平エッジ領域の画素の輝度値が有効であると所定の基準に従って決定された場合、前記推定された輝度値に基づいて前記輝度画像を推定し、推定された輝度値が無効であると所定の基準に従って決定された場合、前記輝度成分画像の各画素列における全ての画素の輝度値を前記画素列における画素の最大輝度値に設定することで前記輝度画像を推定するステップ、を含む、文書画像処理方法。
  7. 前記所定の基準は、
    前記水平エッジ領域に、背景と決定されていない大きな連結領域が存在する場合、前記推定された輝度値が無効であると決定すること、を含む、請求項6に記載の文書画像処理方法。
  8. 前記所定の基準は、
    画素列の上下の水平エッジ領域の画素の前記推定された輝度値の差が所定レベルを超えた場合、前記推定された輝度値が無効であると決定すること、を含む、請求項6又は7に記載の文書画像処理方法。
  9. 前記輝度成分画像と前記調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えた場合、前記輝度成分画像を前記調整された輝度成分画像として出力するステップ、をさらに含む、請求項6乃至8のいずれかに記載の文書画像処理方法。
  10. 前記輝度成分画像と前記調整された輝度成分画像との同一位置の画素の値の変化が所定レベルを超えた場合、ガンマ補正が行われた前記輝度成分画像を前記調整された輝度成分画像として出力するステップ、をさらに含む、請求項6乃至8のいずれかに記載の文書画像処理方法。
JP2015022808A 2014-02-14 2015-02-09 文書画像処理装置及び文書画像処理方法 Withdrawn JP2015153424A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201410051815.2A CN104851078A (zh) 2014-02-14 2014-02-14 文档图像处理装置和方法
CN201410051815.2 2014-02-14

Publications (1)

Publication Number Publication Date
JP2015153424A true JP2015153424A (ja) 2015-08-24

Family

ID=53798376

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015022808A Withdrawn JP2015153424A (ja) 2014-02-14 2015-02-09 文書画像処理装置及び文書画像処理方法

Country Status (3)

Country Link
US (1) US9256782B2 (ja)
JP (1) JP2015153424A (ja)
CN (1) CN104851078A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017146856A (ja) * 2016-02-18 2017-08-24 富士通フロンテック株式会社 画像処理装置及び画像処理方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335953B (zh) * 2014-07-07 2018-04-10 富士通株式会社 提取图像的背景亮度图的装置和方法、去阴影装置和方法
CN106611406B (zh) * 2015-10-27 2019-08-16 富士通株式会社 图像校正方法和图像校正设备
US9799106B2 (en) * 2015-12-16 2017-10-24 Dropbox, Inc. Enhancing a digital image
US9930218B2 (en) * 2016-04-04 2018-03-27 Adobe Systems Incorporated Content aware improvement of captured document images
JP6810892B2 (ja) * 2017-06-05 2021-01-13 京セラドキュメントソリューションズ株式会社 画像処理装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09200455A (ja) * 1996-01-19 1997-07-31 Minolta Co Ltd 読取り画像の濃度補正方法及び画像読取り装置
JP3425366B2 (ja) * 1998-06-30 2003-07-14 シャープ株式会社 画像補正装置
JP4991411B2 (ja) * 2006-07-28 2012-08-01 キヤノン株式会社 画像処理方法
US8290293B2 (en) * 2006-10-17 2012-10-16 Samsung Electronics Co., Ltd. Image compensation in regions of low image contrast
TWI401973B (zh) * 2009-02-13 2013-07-11 Altek Corp A Method to Improve the Color Shadow in Digital Image
JP5488530B2 (ja) * 2011-05-23 2014-05-14 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP6021557B2 (ja) * 2012-09-28 2016-11-09 株式会社Pfu 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム
CN104700362A (zh) * 2013-12-06 2015-06-10 富士通株式会社 文档图像处理装置和方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017146856A (ja) * 2016-02-18 2017-08-24 富士通フロンテック株式会社 画像処理装置及び画像処理方法

Also Published As

Publication number Publication date
CN104851078A (zh) 2015-08-19
US20150235080A1 (en) 2015-08-20
US9256782B2 (en) 2016-02-09

Similar Documents

Publication Publication Date Title
JP2015153424A (ja) 文書画像処理装置及び文書画像処理方法
JP3881439B2 (ja) 画像処理装置
JP7175197B2 (ja) 画像処理方法および装置、記憶媒体、コンピュータ装置
JP6182092B2 (ja) 画像処理装置および画像処理方法
US8649578B2 (en) Method and system for defining a breast window
US9294655B2 (en) Apparatus for and method of processing document image
JP6642970B2 (ja) 注目領域検出装置、注目領域検出方法及びプログラム
JP2015211471A (ja) 画像処理装置及び方法
US9824267B2 (en) Writing board detection and correction
US10009507B2 (en) Image processing device
WO2011014236A1 (en) Digital image brightness adjustment using range information
JP2012199901A (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法
KR20080006112A (ko) 경계 영역의 선명도를 개선하는 하프토닝 방법 및 장치
JP2013020617A (ja) グレースケール文字画像正規化装置及び方法
JP4966384B2 (ja) シェーディング補正を行なう装置及び方法
KR101377910B1 (ko) 화상 처리 방법 및 화상 처리 장치
JP2012210799A (ja) 画像処理装置、画像処理方法およびプログラム
JP6771134B2 (ja) 画像補正方法及び画像補正装置
JP6592992B2 (ja) 画像の背景輝度画像の抽出装置及び方法、並びに影除去装置及び方法
JP2007079586A (ja) 画像処理装置
US8970902B2 (en) Red-eye removal systems and method for variable data printing (VDP) workflows
JP2007079587A (ja) 画像処理装置
US8908986B1 (en) Systems and methods for selecting ink colors
JP6442846B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP2016092560A (ja) 画像処理装置、および、コンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171215

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20180122