JP2014128023A - 画像処理装置およびコンピュータプログラム - Google Patents

画像処理装置およびコンピュータプログラム Download PDF

Info

Publication number
JP2014128023A
JP2014128023A JP2012286231A JP2012286231A JP2014128023A JP 2014128023 A JP2014128023 A JP 2014128023A JP 2012286231 A JP2012286231 A JP 2012286231A JP 2012286231 A JP2012286231 A JP 2012286231A JP 2014128023 A JP2014128023 A JP 2014128023A
Authority
JP
Japan
Prior art keywords
image data
value
specific range
background
gradation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012286231A
Other languages
English (en)
Other versions
JP5939154B2 (ja
Inventor
Tomohiko Hasegawa
智彦 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2012286231A priority Critical patent/JP5939154B2/ja
Priority to US14/141,061 priority patent/US9300840B2/en
Priority to EP13199908.8A priority patent/EP2750365B1/en
Publication of JP2014128023A publication Critical patent/JP2014128023A/ja
Application granted granted Critical
Publication of JP5939154B2 publication Critical patent/JP5939154B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/38Circuits or arrangements for blanking or otherwise eliminating unwanted parts of pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/407Control or modification of tonal gradation or of extreme levels, e.g. background level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/407Control or modification of tonal gradation or of extreme levels, e.g. background level
    • H04N1/4072Control or modification of tonal gradation or of extreme levels, e.g. background level dependent on the contents of the original
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/407Control or modification of tonal gradation or of extreme levels, e.g. background level
    • H04N1/4072Control or modification of tonal gradation or of extreme levels, e.g. background level dependent on the contents of the original
    • H04N1/4074Control or modification of tonal gradation or of extreme levels, e.g. background level dependent on the contents of the original using histograms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/6027Correction or control of colour gradation or colour contrast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/6072Colour correction or control adapting to different types of images, e.g. characters, graphs, black and white image portions

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract


【課題】 元画像内の文字が消去された背景画像内に残り得る文字の輪郭を目立ち難くする。
【解決手段】 画像処理装置は、元画像データから、文字画像データを生成する文字画像データ生成部と、元画像データから背景画像データを生成する背景画像データ生成部と、を備える。背景画像データ生成部は、補正処理前に特定範囲内の階調値を有する第1種の画素の値が、補正処理後に特定範囲内の階調値に設定され、かつ、補正処理前に特定範囲外の階調値を有する第2種の画素の値が、補正処理後に特定範囲内の階調値に設定されるように、処理対象の対象画像データに対して補正処理を実行する補正部を備える。特定範囲は、複数個の連続する階調値を含み、特定範囲内の複数個の連続する階調値は、元画像データの階調値分布におけるピーク階調値であって文字の背景に対応するピーク階調値を含む。
【選択図】 図5

Description

本発明は、画像処理に関し、特に、元画像内の文字が消去された背景画像を生成する技術に関する。
文字を含む元画像を表す元画像データを用いて、文字を表す文字画像データと文字を含まない背景画像データと、を生成する技術が知られている(例えば、特許文献1)。この技術では、元画像データから、文字を構成する文字画素と、文字を構成しない背景画素とによって文字を表す文字画像データ(二値データ)が生成される。そして、この技術では、文字画像データ内の文字画素に対応する元画像データ内の画素の色を、文字画像データ内の背景画素に対応する元画像内の画素の色に置き換えることによって、元画像データから背景画像データが生成される。文字画像データは、文字画像データの圧縮に適した圧縮方式(例えば、MMR(Modified Modified Read)方式)で圧縮され、背景画像データは、背景画像データの圧縮に適した圧縮方式(例えば、JPEG(Joint Photographic Experts Group)方式)で圧縮される。この結果、元画像データ全体を高い圧縮率で圧縮することができる。
特開2005−12768号公報 特開2003−046746号公報 特開2008−028717号公報 特開2006−093880号公報 特開2004−362541号公報 特開平3−104380号公報
例えば、元画像内の文字の鮮鋭度が低い場合には、換言すれば、文字がぼけている場合には、背景画像内に文字の輪郭が残る可能性があった。特許文献1の技術では、文字の線幅を拡大するように調整された文字画像データを用いて、背景画像データを生成することによって、背景画像内に文字の輪郭が残る可能性を低減している。
しかしながら、上記技術では、例えば、文字の線幅を適切に拡大できない場合に、背景画像内に文字の輪郭が残る可能性があった。
本発明は、元画像内の文字が消去された背景画像内に残り得る文字の輪郭を目立ち難くする技術を提供することを目的とする。
本発明は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の適用例として実現することが可能である。
[適用例1]画像処理装置であって、元画像を表す元画像データから、文字画像を表す文字画像データを生成する文字画像データ生成部と、前記元画像データから、背景画像を表す背景画像データを生成する背景画像データ生成部であって、前記背景画像は、前記元画像から文字が消去された画像を表す、前記背景画像データ生成部と、を備え、前記背景画像データ生成部は、補正処理前に特定範囲内の階調値を有する第1種の画素の値が、補正処理後に前記特定範囲内の階調値に設定され、かつ、補正処理前に前記特定範囲外の階調値を有する第2種の画素の値が、補正処理後に前記特定範囲内の階調値に設定されるように、処理対象の対象画像データに対して補正処理を実行する補正部を備え、前記特定範囲は、複数個の連続する階調値を含み、前記特定範囲内の前記複数個の連続する階調値は、前記元画像データの階調値分布におけるピーク階調値であって文字の背景に対応する前記ピーク階調値を含む、画像処理装置。
上記構成によれば、特定範囲外の階調値を有する第1種の画素の値と、特定範囲内の諧調値を有する第2種の画素の値とが、特定範囲内の階調値に設定される。このため、文字の背景に対応するピーク階調値から比較的遠い第2種の画素の値を、換言すれば、背景画像内に残り得る文字の輪郭を構成する第2種の画素の値を、文字の背景に対応するピーク階調値に近づけることができる。この結果、背景画像内に残り得る文字の輪郭を目立ち難くすることができる。
[適用例2]適用例1に記載の画像処理装置であって、前記補正部は、補正処理前に前記特定範囲外の第1の階調値を有する前記第2種の画素である第1の画素の値を、前記特定範囲内の第2の階調値に変更し、補正処理前に前記特定範囲外の第3の階調値であって、第1の階調値よりもピーク階調値に近い前記第3の階調値を有する前記第2種の画素である第2の画素の値を、前記特定範囲内の第4の階調値であって、前記第2の階調値よりもピーク階調値に近い前記第4の階調値に変更する、画像処理装置。
この構成によれば、補正処理の前後で、第1の第2種の画素の値と第2の第2種の画素の値との間の大小関係が維持されるので、背景画像内に残り得る文字の輪郭を効果的に目立ち難くすることができる。
[適用例3]適用例1に記載の画像処理装置であって、前記補正部は、補正処理前に前記特定範囲外の階調値を有する前記第2種の画素の値を、前記特定範囲内の前記複数個の連続する階調値の中からランダムに選択される階調値に変更する、画像処理装置。
この構成によれば、背景画像内に残り得る文字の輪郭をさらに目立ち難くすることができる。
[適用例4]適用例1ないし3のいずれかに記載の画像処理装置であって、前記補正部は、補正処理前に前記特定範囲内の階調値を有する前記第1種の画素の値を、前記特定範囲内の階調値に変更すると共に、補正処理前に前記特定範囲外の階調値を有する前記第2種の画素の値を、前記特定範囲内の階調値に変更する、画像処理装置。
[適用例5]適用例1ないし3のいずれかに記載の画像処理装置であって、前記補正部は、補正処理前に前記特定範囲内の階調値を有する前記第1種の画素の値を変更せずに、補正処理前に前記特定範囲外の階調値を有する前記第2種の画素の値を、前記特定範囲内の階調値に変更する、画像処理装置。
この構成によれば、補正処理前に、ピーク階調値を含む特定範囲内の階調値を有する第1種の画素の値を変更しないので、背景画像の見た目が補正処理によって変更されることを抑制することができる。
[適用例6]適用例1ないし5のいずれかに記載の画像処理装置であって、前記背景画像データ生成部は、さらに、前記対象画像データの階調値分布を表す分布データを生成する分布データ生成部と、前記分布データを用いて、前記特定範囲を決定する特定範囲決定部と、を備える、画像処理装置。
この構成によれば、対象画像データの階調値分布に応じて、適切な特定範囲を決定することができる。
[適用例7]適用例6に記載の画像処理装置であって、前記特定範囲決定部は、前記分布データが、前記対象画像データ内の背景を表す複数個の画素の値のばらつきが比較的小さいことを表す場合には、前記特定範囲の幅を第1の幅に決定し、前記分布データが、前記対象画像データ内の背景を表す複数個の画素の値のばらつきが比較的大きいことを表す場合には、前記特定範囲の幅を前記第1の幅よりも大きな第2の幅に決定する、画像処理装置。
この構成によれば、対象画像データ内の背景を表す複数個の画素の値のばらつきに応じて、特定範囲の幅を適切に決定することができる。
[適用例8]適用例1ないし7のいずれかに記載の画像処理装置であって、前記補正部は、前記対象画像データとしての前記元画像データに対して、前記補正処理を実行する、画像処理装置。
[適用例9]適用例1ないし8のいずれかに記載の画像処理装置であって、前記背景画像データ生成部は、前記元画像内の文字を構成する文字構成画素の値を前記ピーク階調値に変更することによって、前記元画像データから中間画像データを生成する中間画像データ生成部を備え、前記補正部は、前記対象画像データとしての前記中間画像データに対して、前記補正処理を実行する、画像処理装置。
[適用例10]適用例1ないし9のいずれかに記載の画像処理装置であって、前記対象画像データは、複数個の色成分に対応する複数個の成分画像データを含み、前記補正部は、前記複数個の成分画像データのそれぞれに対して、前記補正処理を実行する、画像処理装置。
[適用例11]適用例1ないし10のいずれかに記載の画像処理装置であって、さらに、前記背景画像データを圧縮する圧縮部を備える、画像処理装置。
この構成によれば、背景画像データに補正処理を行うことによって、背景画像データ内に含まれる画素の値の種類数を低減できるので、圧縮後の背景画像データのデータ量を低減することができる。
[適用例12]画像処理装置であって、背景画像を表す背景画像データを取得する取得部であって、背景画像は文字の輪郭を含む画像を表す、前記取得部と、補正処理前に特定範囲内の階調値を有する第1種の画素の値が、補正処理後に前記特定範囲内の階調値に設定され、かつ、補正処理前に前記特定範囲外の階調値を有する第2種の画素の値が、補正処理後に前記特定範囲内の階調値に設定されるように、背景画像データに対して補正処理を実行する補正部であって、前記補正処理は、前記背景画像内の文字の輪郭を目立ち難くするための処理を含む、前記補正部と、を備え、前記特定範囲内の前記複数個の連続する階調値は、前記背景画像データの階調値分布におけるピーク階調値であって文字の輪郭の背景に対応する前記ピーク階調値を含む、画像処理装置。
この構成によれば、特定範囲外の階調値を有する第1種の画素の値と、特定範囲内の諧調値を有する第2種の画素の値とが、特定範囲内の階調値に設定される。このため、文字の輪郭の背景に対応するピーク階調値から比較的遠い第2種の画素の値を、換言すれば、背景画像内に残り得る文字の輪郭を構成する第2種の画素の値を、文字の輪郭の背景に対応するピーク階調値に近づけることができる。この結果、背景画像内に残り得る文字の輪郭を目立ち難くすることができる。
[適用例13]適用例12に記載の画像処理装置であって、さらに、前記背景画像データの階調値分布を表す分布データを生成する分布データ生成部と、前記分布データを用いて、前記特定範囲を決定する特定範囲決定部と、を備える、画像処理装置。
この構成によれば、背景画像データの階調値分布に応じて、適切な特定範囲を決定することができる。
[適用例14]適用例13に記載の画像処理装置であって、前記特定範囲決定部は、前記分布データが、前記背景画像データ内の背景を表す複数個の画素の値のばらつきが比較的小さいことを表す場合には、前記特定範囲の幅を第1の幅に決定し、前記分布データが、前記背景画像データ内の背景を表す複数個の画素の値のばらつきが比較的大きいことを表す場合には、前記特定範囲の幅を前記第1の幅よりも大きな第2の幅に決定する、画像処理装置。
この構成によれば、背景画像データの階調値分布に応じて、特定範囲の幅を適切に決定することができる。
本発明は、種々の形態で実現することが可能であり、例えば、上記装置の機能を実現する方法、上記装置の機能を実現するコンピュータプログラム、当該コンピュータプログラムを記録した記録媒体、等の形態で実現することができる。
第1実施例における画像処理装置としての計算機の構成を示すブロック図。 画像処理のフローチャート。 画像処理に用いられる画像の一例を示す図。 高圧縮PDFファイルCFの概念図。 背景画像データ調整処理のフローチャート。 対象成分画像データのヒストグラムの一例を示す図。 R成分画像データのヒストグラムの一例を示す図。 第1実施例の補正プロファイルを示す図。 第1実施例の補正処理後のR成分画像データのヒストグラムを示す図。 第2実施例の補正プロファイルを示す図。 第2実施例の補正処理後のR成分画像データのヒストグラムを示す図。 第3実施例の背景色範囲を決定する処理のフローチャート。 第3実施例の背景色範囲を決定する処理の説明図。 第3実施例の背景色範囲の一例を示す図。 第4実施例の背景画像データ調整処理のフローチャート。
A.第1実施例:
A−1.画像処理装置の構成:
次に、本発明の実施の形態を実施例に基づき説明する。図1は、第1実施例における画像処理装置としての計算機200の構成を示すブロック図である。
計算機200は、例えば、パーソナルコンピュータであり、CPU210と、ROMとRAMとを含む内部記憶装置240と、液晶ディスプレイなどの表示部260と、マウスやキーボードなどの操作部270と、外部装置と通信を行うための通信部280と、ハードディスクドライブなどの外部記憶装置290と、を備えている。
計算機200は、通信部280を介して、スキャナ300などの外部装置と通信可能に接続される。スキャナ300は、光学的に原稿を読み取ることによってスキャンデータを取得する画像読取装置である。
内部記憶装置240には、CPU210が処理を行う際に生成される種々の中間データを一時的に格納するバッファ領域が確保されている。外部記憶装置290には、ドライバプログラム291が格納されている。ドライバプログラム291は、例えば、CD−ROMなどに格納されて提供される。
CPU210は、ドライバプログラム291を実行することにより、後述する画像処理(図2)を実行するスキャナドライバ100として機能する。スキャナドライバ100は、スキャンデータ取得部110と、文字画像データ生成部120と、背景画像データ生成部130と、圧縮部140と、ファイル生成部150と、を備えている。背景画像データ生成部130は、補正部131と、階調値分布生成部132と、特定範囲決定部133と、を備えている。スキャンデータ取得部110は、本実施例における元画像データとしてのスキャンデータを取得する。文字画像データ生成部120は、元画像データから、文字画像を表す文字画像データを生成する。背景画像データ生成部130は、元画像データから、背景画像データを生成する。背景画像データは、後述するように、元画像から文字が消去された背景画像を表す。圧縮部140は、文字画像データと、背景画像データと、をそれぞれ異なる圧縮方式を用いて圧縮して、圧縮済みの文字画像データと、圧縮済みの背景画像データと、を生成する。ファイル生成部150は、圧縮済みの文字画像データと、圧縮済みの背景画像データと、を用いて、1個の画像を表す画像ファイルを生成する。本実施例にて生成される画像ファイルは、比較的高い圧縮率を実現できるPDFファイルである(高圧縮PDFファイル)。
A−2.画像処理:
図2は、画像処理のフローチャートである。画像処理は、例えば、利用者が、原稿をスキャナ300にセットして、スキャナドライバ100に対して原稿の読取(スキャンデータの生成)を指示した場合に、スキャナドライバ100によって実行される。
ステップS10では、スキャンデータ取得部110は、処理対象の元画像データとしてのスキャンデータを取得する。具体的には、スキャンデータ取得部110は、スキャナ300を制御して、利用者が準備した原稿を読み取らせることによって、スキャンデータを取得する。以下、ステップS10にて取得されたスキャンデータを元画像データとも呼び、該スキャンデータによって表される画像を元画像とも呼ぶ。
元画像データは、RGB画像データであり、元画像データを構成する複数個の画素データのそれぞれは、RGBの3個の色成分値(R値、G値、B値)を含んでいる。本実施例では、各色成分の階調数は、256である。RGB画像データは、3個の色成分にそれぞれ対応する3個の成分画像データ(R成分画像データ、G成分画像データ、B成分画像データ)を含んでいると言うことができる。各成分画像データは、1種類の色成分値を画素の値とする画像データである。以下、画素データに含まれる3個の成分値を、単に、「画素の値」とも呼ぶ。
図3は、画像処理に用いられる画像の一例を示す図である。図3(A)は、元画像SIの一例を示している。元画像SIは、下地Bg1と、4個のオブジェクトOb1〜Ob4、すなわち、文字Ob1、Ob2と、写真Ob3と、描画Ob4とを含んでいる。ここで、描画Ob4は、イラスト、表、線図、模様などを表すオブジェクトである。
ステップS15(図2)では、スキャナドライバ100は、元画像SI内の文字領域を特定する文字特定処理を実行する。具体的には、スキャナドライバ100は、sobelフィルタなどのエッジ検出フィルタを元画像データに適用して、エッジ画像EI(図3(B))を表すエッジ画像データを生成する。スキャナドライバ100は、エッジ画像EI内の、エッジ強度が基準値より大きい領域を特定し、当該領域に対応する元画像SI内の領域をオブジェクト領域として特定する。図3(B)の例では、元画像SIの4個のオブジェクトOb1〜Ob4にそれぞれ対応する4個のオブジェクト領域OA1〜OA4が、エッジ画像EI内に特定されている。スキャナドライバ100は、元画像SI内の各オブジェクト領域OA1〜OA4の色分布に応じて、各オブジェクト領域OA1〜OA4が、文字領域であるか否かを判定する。具体的には、スキャナドライバ100は、オブジェクト領域の輝度のヒストグラムを用いて、当該領域内に含まれる輝度値の種類数Cを算出する。スキャナドライバ100は、オブジェクト領域に含まれる複数個の画素を、オブジェクト領域の周囲の色(背景色)に近似する色を有する背景画素と、背景画素以外のオブジェクト画素とに分類し、背景画素の個数に対するオブジェクト画素の個数の比率Dを算出する。文字は、文字以外のオブジェクトと比較して、輝度値の種類数C、および、オブジェクト画素の比率Dが小さい傾向がある。このため、スキャナドライバ100は、判定対象のオブジェクト領域の輝度値の種類数Cが第1の閾値より小さく、かつ、オブジェクト画素の比率Dが第2の閾値より小さい場合に、当該オブジェクト領域は、文字領域であると判定する。図3(A)の例では、文字Ob1、Ob2にそれぞれ対応する文字領域TA1、TA2が、元画像SI内に特定されている。
なお、文字領域を特定する手法は、様々な公知の手法を採用することができ、公知の手法は、例えば、特開平5−225378号公報、特開2002−288589号公報に開示されている。
ステップS20では、スキャナドライバ100は、1個の文字領域を処理対象として選択する。図3(A)の例では、特定された文字領域TA1、TA2の中から、1個の文字領域が順次に選択される。
ステップS25では、文字画像データ生成部120は、処理対象の文字領域に対応する文字二値データ(文字画像データ)を生成する。具体的には、文字画像データ生成部120は、元画像データから、処理対象の文字領域を表す部分画像データを取得し、部分画像データに対して二値化処理を実行する。具体的には、文字画像データ生成部120は、処理対象の文字領域の周囲の色を表すRGB値(BR、BG、GB)を算出する。文字画像データ生成部120は、処理対象の文字領域を構成する画素iの成分値(Ri、Gi、Bi)が、以下の式(1)〜式(3)を全て満たす場合には、画素iに対応する文字二値データの画素値を「0」とする。文字画像データ生成部120は、画素iの成分値(Ri、Gi、Bi)が、式(1)〜式(3)のいずれかを満たさない場合には、画素iに対応する文字二値データの画素値を「1」とする。
BR−ΔV<Ri<BR+ΔV ...(1)
BG−ΔV<Gi<BG+ΔV ...(2)
BB−ΔV<Bi<BB+ΔV ...(3)
文字二値データ内の画素値が「1」である画素は、文字を構成する文字構成画素であり、画素値が「0」である画素は、文字を構成しない背景画素である。上記式(1)〜(3)から解るように、画素iの色が、周囲領域の色と、ほぼ同じである場合(色値の差分がΔV未満である場合)には、画素iは、背景画素に分類される。画素iの色が、周囲領域の色と、異なる場合(色値の差分がΔV以上である場合)には、画素iは、文字構成画素に分類される。
文字二値データにおける文字構成画素に対応する元画像SIの画素(元画像SIの部分画像である文字領域の画素を含む)も、文字構成画素と呼ぶ。文字二値データにおける背景画素に対応する元画像SIの画素(元画像SIの部分画像である文字領域の画素を含む)も、背景画素と呼ぶ。図3(C)には、元画像SIの文字領域TA1、TA2に対応する文字二値データによって表される二値画像(文字画像)TIA、TIBが示されている。
ステップS30(図2)では、スキャナドライバ100は、文字領域内の文字の色を表す文字色値(RGB値)を特定する。具体的には、スキャナドライバ100は、文字二値データを用いて、文字領域内の複数個の文字構成画素を特定する。スキャナドライバ100は、文字領域内の全ての文字構成画素のRGB値(色値)の最頻値を、文字色値として特定する。
ステップS35では、スキャナドライバ100は、文字領域内の背景の色を表す背景色値(RGB値)を特定する。具体的には、スキャナドライバ100は、文字二値データを用いて、文字領域内の複数個の背景画素を特定する。スキャナドライバ100は、文字領域内の全ての背景画素のRGB値(色値)の最頻値を、背景色値として特定する。
ステップS40では、背景画像データ生成部130は、文字領域内の複数個の文字構成画素の画素値を、ステップS350で特定された背景色値に変更する。なお、背景画像データ生成部130は、文字領域内の複数個の文字構成画素を、文字二値データを用いて特定する。この結果、元画像SIから、処理対象の文字領域に含まれる文字が消去される。すなわち、ステップS40は、元画像SIから文字が消去された背景画像BIを表す背景画像データを生成する処理の一部分である。なお、図2のステップS40が破線で示されているのは、ステップS40は後述するように省略され得るからである。
ステップS45では、圧縮部140は、文字二値データを圧縮して、圧縮済みの文字二値データを生成する。文字二値データによって表される文字画像は、解像度を落とすとエッジのがたつきが目立ち、視認性が悪化しやすい。圧縮部140は、二値データを、高い圧縮率で、かつ、解像度を落とすことなく圧縮できる可逆圧縮方式であるMMR(Modified Modified Read)方式(FAXG4方式とも呼ばれる。)を用いて、圧縮済みの文字二値データを生成する。
ステップS50では、ファイル生成部150は、圧縮済みの文字二値データと文字色値と座標情報とを関連づけてPDFファイルに格納する。座標情報は、圧縮済みの文字二値データによって表される二値画像(文字画像)が、元画像SIに対して配置されるべき位置を表す情報である。
ステップS55では、スキャナドライバ100は、全ての文字領域を処理対象として選択したか否かを判断する。スキャナドライバ100は、全ての文字領域が選択されていない場合には(ステップS55:NO)、ステップS20に戻って、未選択の文字領域を選択して、上述したステップS25〜S50の処理を繰り返す。スキャナドライバ100は、全ての文字領域が選択された場合には(ステップS55:YES)、ステップS60に処理を移行する。
ステップS60に移行した時点で、元画像SIから文字が消去された背景画像BI(図3(D))を表す背景画像データが生成されている。図3(D)に示すように、背景画像BIは、下地Bg1とともに、写真Ob3や描画Ob4を含み得るが、文字Ob1、Ob2を含まない。
ここで、背景画像BIは、文字Ob1、Ob2を含まないものの、文字Ob1、Ob2の輪郭EG1、EG2を含む可能性がある(図3(D))。元画像SIの文字Ob1、Ob2と、背景(下地Bg1)と、の間の境界部分には、文字の色と背景の色との中間の色を有する境界領域が現れ得る。これは、スキャナ300によって原稿を読み取って元画像データを生成する際に、境界領域の画素は、原稿の文字部分で反射された光と原稿の背景部分で反射された光との両方に基づいて、生成されてしまうからである。このような境界領域の画素の色は、文字の色とは差があるので、文字二値データを生成する際には、文字構成画素ではなく、背景画素に分類される場合がある。背景画素に分類された境界領域の画素は、文字を消去して背景画像データを生成する際、すなわち、文字構成画素の画素値を、背景色値に変更する際(ステップS40)に、変更対象とされない。この結果、背景画像BI内の境界領域の画素の色は、元画像SI内の境界領域の画素の色と同じに維持される。境界領域の画素の色は、周囲の背景画素の色とも差があるので、背景画像BI内に、該境界領域の画素によって表される輪郭EG1、EG2が現れる。
ステップS60では、背景画像データ生成部130は、背景画像BIに現れた輪郭EG1、EG2を目立ち難くするための背景画像データ調整処理を実行する。本処理の詳細は、後述するが、本処理によって、背景画像BIに現れた輪郭EG1、EG2は、目視では認識できない程度まで、目立ち難くされる。
ステップS70では、圧縮部140は、背景画像データ調整処理後の背景画像データ(処理済みの背景画像データとも呼ぶ。)を圧縮して、圧縮済みの背景画像データを生成する。処理済みの背景画像データは、文字を含んでおらず、写真や描画を含み得る背景画像BIを表すRGB画像データである。圧縮部140は、このような多階調画像の圧縮に適したJPEG(Joint Photographic Experts Group)方式を用いて、処理済みの背景画像データを圧縮する。さらに、圧縮部140は、JPEG圧縮された処理済みの背景画像データを、Deflate方式を用いて、さらに圧縮して、圧縮済みの背景画像データを生成する。
ここで、JPEG圧縮では、圧縮部140は、処理済みの背景画像データ(RGB画像データ)をYCrCb画素データに変換する。圧縮部140は、処理済みの背景画像データが表す背景画像BIを縦8画素×横8画素のブロックに分割し、ブロックごとに二次元離散コサイン変換を行なって縦方向8種×横方向8種の周波数成分を表すDCT係数に変換する。圧縮部140は、さらに、図示しない量子化テーブルに規定されている量子化閾値で各ブロックのDCT係数を除算することによって、各ブロックの量子化係数を取得する。圧縮部140は、得られた量子化係数を、所定の走査順に並べてハフマン符号化することによって、処理済みの背景画像データを圧縮する。この説明から解るように、JPEG圧縮では、圧縮対象の画像データの均一性が高いほど、すなわち、各周波数成分が小さいほど、「0」になる量子化係数が増加するので、圧縮率が高くなる。本実施例では、ステップS60の背景画像データ調整処理によって、背景画像BIに現れた輪郭EG1、EG2を目立ち難くされている。すなわち、圧縮対象の背景画像データの均一性が、背景画像データ調整処理によって向上しているので、ステップS70での圧縮による圧縮率を高くすることができる。
ステップS75では、ファイル生成部150は、ステップS50にて圧縮済みの文字二値データ等が格納されたPDFファイルに、圧縮済みの背景画像データを格納して、高圧縮PDFファイルCFを完成させる。高圧縮PDFファイルCFが生成されると、画像処理は終了する。
図4は、高圧縮PDFファイルCFの概念図である。PDFファイルは、複数個の異なる形式の画像データを1個のファイルに格納可能である。また、PDFファイルは、当該ファイルに格納された画像データを表示する際には、格納された複数個の画像データを重畳して1個の画像として再現可能である。
圧縮済みの背景画像データは、最下位レイヤーの画像データとして、高圧縮PDFファイルCFに格納されている。圧縮済みの文字二値データは、圧縮済みの背景画像データより上位のレイヤーの画像データとして、高圧縮PDFファイルCFに格納されている。
二値画像TIAを表す圧縮済みの文字二値データには、文字色値TC1(R1、G1、B1)と、座標値CD1(X1、Y1)と、が関連付けられている。また、二値画像TIBには、文字色値TC2(R2、G2、B2)と、座標値CD2(X2、Y2)と、が関連付けられている。文字色値TC1、TC2は、文字の色を表すRGB値であり、ステップS30で算出された値である。座標値CD1、CD2は、背景画像BIFに対して、二値画像TIA、TIBが配置されるべき位置を表す情報である。座標値CD1、CD2は、例えば、二値画像TIA、TIBにそれぞれ外接する最小矩形の左上の角の画素の座標値で表される。
元画像データを高圧縮PDFファイルCFに変換することによって、元画像SIの各オブジェクトが、オブジェクトの種類に適した画質で表現された画像を、データ量が比較的小さい保存形態で、保存することができる。すなわち、高圧縮PDFファイルCFによって表される画像において、文字は、エッジがシャープに表現され、描画や写真は、階調性が重視された画質で表現される。
A−3.背景画像データ調整処理
図2のステップS60の背景画像データ調整処理の具体的な内容について説明する。
図5は、背景画像データ調整処理のフローチャートである。
ステップS61では、背景画像データ生成部130は、背景画像BI内の1個の文字領域を処理対象として選択する。図3(D)の例では、輪郭EG1、EG2が残っている文字領域TA1、TA2の中から、1個の文字領域が順次に選択される。背景画像データのうち、処理対象の文字領域に対応する部分画像データを対象部分画像データとも呼ぶ。
ステップS62では、背景画像データ生成部130は、RGBの3個の色成分の中から、処理対象の1個の色成分を選択する。なお、対象部分画像データは、ステップS62の前に、CMY色空間や、YCbCr色空間などの他の色空間に変換されても良い。この場合には、ステップS62では、変換後の色空間の1個の成分が選択される。対象部分画像データのうち、処理対象の色成分に対応する成分画像データを、対象成分画像データとも呼ぶ。
ステップS63では、階調値分布生成部132は、処理対象の文字領域の階調値分布を表すヒストグラムデータを、処理対象の色成分について生成する。すなわち、階調値分布生成部132は、対象成分画像データのヒストグラムデータを生成する。ヒストグラムデータは、対象成分画像データの各画素を、その画素値に応じて、複数個のクラスに分類することによって得られるデータである。本実施例では、256階調の階調値のそれぞれを、1個のクラスとして、ヒストグラムデータが生成される。
図6は、対象成分画像データのヒストグラムの一例を示す図である。図6(A)〜図6(C)は、1個の文字領域を表す3個の成分画像データのヒストグラムをそれぞれ表している。3個の成分画像データのヒストグラムは、処理対象の文字領域内の背景に対応するピークPBr、PBg、PBbを含んでいる。背景に対応する3個のピークPBr、PBg、PBbに対応する3個の階調値Rb、Gb、Bbを、背景に対応するピーク階調値と呼ぶ。3個のピーク階調値Rb、Gb、Bbは、背景色を表す背景色値BC(Rb、Gb、Bb)に対応している。
図6に示す3個のヒストグラムの破線部分は、元画像SIの文字領域における文字に対応する部分である。これらの破線部分の3個のピーク(文字に対応するピーク)PTr、PTg、PTbに対応する3個の階調値Rt、Gt、Btを、文字に対応するピーク階調値とも呼ぶ。3個のピーク階調値Rt、Gt、Btは、文字色を表す文字色値TC(Rt、Gt、Bt)に対応している。本実施例の背景画像データ調整処理の処理対象は、文字が消去された背景画像BIの文字領域であるので、ヒストグラムに、図6の破線部分は現れない。上述した文字の輪郭EG1、EG2を表す画素が有する階調値は、背景に対応するピークを含む山と、文字に対応するピークを含む山(破線部分)と、の間に位置する階調値、具体的には、図6において符号ETで示す付近の階調値であると考えられる。
以下では、対象成分画像データが、R成分に対応するR成分画像データである場合を例に説明する。図7は、R成分画像データのヒストグラムの一例を示す図である。ステップS64では、特定範囲決定部133は、ヒストグラムデータを用いて、R成分画像データを構成する複数個の画素の値(R値)の最頻値を特定する。図7に示すように、背景に対応するR成分のピーク階調値Rbが、最頻値として特定される。
ステップS65では、特定範囲決定部133は、補正プロファイルの生成に用いる特定範囲としての背景色範囲A12を決定する。具体的には、ピーク階調値Rbを中心とした範囲、すなわち、図7のR1<R<R2の範囲が、R成分の背景色範囲A12に決定される。背景色範囲の下限値R1は、(Rb−ΔW)と表され、上限値R2は、(Rb+ΔW)と表される。ΔWは設計値であり、本実施例では、ヒストグラムにおけるピーク階調値Rbを中心とした山(比較的度数が多い範囲)のほぼ全体を含むように、実験的、経験的に、予め定められている。ΔWは、例えば、R値の階調数の3%〜10%程度に設定される。本実施例では、ΔWは、R値の階調数「256」に対して、ΔWは、固定値の「15」(階調数の約6%)に設定されている。図7に示すように、背景色範囲A12は、ピーク階調値Rbを含む複数個の連続した階調値を含む。
ステップS64、65の説明から解るように、特定範囲決定部133は、背景画像データのヒストグラムデータ(分布データ)を用いて、背景色範囲A12を決定する。この結果、背景画像データの階調値分布に応じて、適切な背景色範囲A12を決定することができる。
ステップS66では、補正部131は、決定された背景色範囲A12を用いて、補正プロファイルを生成する。図8は、第1実施例の補正プロファイルを示す図である。この補正プロファイルは、入力値Rinと出力値Routとの対応関係を規定した1次元ルックアップテーブルである。この補正プロファイルは、以下の式(4)を用いて表される。
Figure 2014128023
この補正プロファイルによれば、背景色範囲A12内の階調値が、背景色範囲A12内の階調値に変更され、かつ、背景色範囲A12外の階調値が、背景色範囲A12内の階調値に変更される。具体的には、最小値Rmin(通常は、「0」)からピーク階調値Rbまでの範囲C1(図7)の階調値は、背景色範囲A12の下限値R1からピーク階調値Rbまでの範囲A1内の階調値に変更される。また、ピーク階調値Rbから最大値Rmax(例えば、「255」)までの範囲C2(図7)の階調値は、ピーク階調値Rbから背景色範囲A12の上限値R2までの範囲A2内の階調値に変更される。また、図8に示すように、補正プロファイルでは、入力値Rinの増加に対して、出力値Routが直線的に増加している。このため、図8の4個の入力値Rin1〜Rin4(Rin1<Rin2<Rin3<Rin4)に対応する4個の出力値Rout1〜Rout4は、Rout1<Rout2<Rout3<Rout4の関係を満たす。すなわち、この補正プロファイルを用いた補正では、補正の前後で、2個の画素の値の大小関係は変化しない。
ステップS67では、補正部131は、図8の補正プロファイルを用いて、処理対象の文字領域に対応するR成分画像データ内の全ての画素の値(R値)を、補正する。
図9は、第1実施例の補正処理後のR成分画像データのヒストグラムを示す図である。図9から解るように、補正処理の後には、背景色範囲A12外の階調値を有する画素の個数は、すなわち、RminからR1までの範囲内の階調値およびR2からRmaxまでの範囲内の階調値を有する画素の個数は、ゼロになる。また、補正処理後のヒストグラムでは、ピーク階調値Rbを含む山の幅が、補正処理前の対応する山の幅より狭くなる。また、補正処理後の当該山の高さは、補正処理前の対応する山の高さより高くなる。なお、補正処理によって、山の幅より狭くなる程度および山の高さが高くなる程度は、図の見やすさを重視して、図9では正確には示されていない。
また、図8の補正プロファイルから解るように、ステップS67の補正処理の前に背景色範囲A12外の複数個の異なる階調値(例えば、図8のRin1とRin2)をそれぞれ有する複数個の画素の値は、補正処理によって背景色範囲A12内の複数個の異なる階調値(例えば、図8のRout1とRout2)に変更される。同様に、補正処理の前に背景色範囲A12内の複数個の異なる階調値(例えば、図8のRin3とRin4)をそれぞれ有する複数個の画素の値は、補正処理によって背景色範囲A12内の複数個の異なる階調値に設定される(Rout3とRout4)。
上述した背景画像BI内の文字の輪郭EG1、EG2(図3(D))を表す画素の値(図6、7の符号ET付近のR値)は、背景色範囲A12内の階調値に変更されていることが解る(図9)。
ステップS68では、背景画像データ生成部130は、3個の色成分値を全て補正したか、換言すれば、RGBの3個の成分画像データを全て補正したか否かを判断する。補正されていない色成分値がある場合には(ステップS68:NO)、背景画像データ生成部130は、ステップS62に戻って、補正されていない色成分を新たに選択して、上述したステップS63〜S68の処理を繰り返す。上記の説明では、R成分画像データに対する補正を例に説明したが、G成分画像データおよびB成分画像データについても、それぞれ、ピーク階調値Gb、Bbの位置に応じた背景色範囲が決定され(ステップS65)、該背景色範囲に応じた補正プロファイルが生成される(ステップS66)。そして、G成分画像データおよびB成分画像データに対して、生成された補正プロファイルを用いて、適切な補正処理が実行される。なお、背景色範囲の幅を規定するΔWの値は、3個の成分R、G、Bで、それぞれ同じ固定値(例えば、上述した「15」)が用いられる。
3個の色成分値が全て補正されている場合には(ステップS68:YES)、背景画像データ生成部130は、全ての文字領域を選択したか否かを判断する(ステップS69)。背景画像データ生成部130は、全ての文字領域が選択されていない場合には(ステップS69:NO)、ステップS61に戻って、未選択の文字領域を選択して、上述したステップS62〜S69の処理を繰り返す。背景画像データ生成部130は、全ての文字領域が選択された場合には(ステップS69:YES)、背景画像データ調整処理を終了する。
以上説明した本実施例によれば、図8の補正プロファイルから解るように、補正部131は、ステップS67の補正処理の前に背景色範囲A12内の階調値を有する画素(第1種の画素とも呼ぶ)の値(R値、G値、B値)を、ステップS67の補正処理において背景色範囲A12内の階調値に変更する。また、補正部131は、ステップS67の補正処理の前に背景色範囲A12外の階調値を有する画素(第2種の画素とも呼ぶ)の値を、ステップS67の補正処理において、背景色範囲A12内の階調値に変更する。この結果、第1種の画素の値と、第2種の画素の値と、の両方が、背景色範囲内の階調値に設定される。このため、背景に対応するピーク階調値Rb、Gb、Bbから比較的遠い第2種の画素の値を、背景に対応するピーク階調値に近づけることができる。換言すれば、背景画像BI内に残り得る文字の輪郭EG1、EG2を表す第2種の画素の値を、背景に対応するピーク階調値、すなわち、背景色値BCを表す階調値に近づけることができる。この結果、背景画像BI内に残り得る文字の輪郭EG1、EG2を目立ち難くすることができる。背景色範囲A12は比較的狭い範囲に設定されるため、第2種の画素の値は、十分に背景色値BCを表す階調値に近い値になる。この結果、背景画像データ生成部130は、補正処理後の背景画像BI内の輪郭EG1、EG2を、目視では確認できない程度まで目立ち難くすることができ、実質的に、背景画像BI内から輪郭EG1、EG2を消去することができる。
背景画像BI内に残り得る文字の輪郭EG1、EG2を目立ち難くすると、図2のステップS75にて生成される高圧縮PDFファイルCFによって表される画像の画質を向上することができる。具体的には、背景画像BIと、文字を表す二値画像TIA、TIBとを重畳して表示した場合に、文字のエッジのぼけや、文字のエッジが二重に見えることを抑制することができる。
さらに説明すると、背景画像BI内の文字領域の全体を背景色に塗りつぶす場合のように、背景色範囲外の階調値を複数個の第2種の画素の値を、1個の階調値(例えば、ピーク階調値)に変更する場合を想定する。この場合には、文字領域内の背景の見え方が補正によって変化する可能性がある。文字領域内の背景の見え方が変化すると、例えば、背景画像BIにおいて、文字領域と該文字領域の周囲の領域との間の見え方の差に起因して、文字領域と該文字領域の周囲の領域との間に不自然な境界線が表れる場合がある。本実施例によれば、文字領域内の背景の見え方を維持しつつも、背景画像BI内に残り得る文字の輪郭EG1、EG2を目立ち難くすることによって、このような不都合を抑制できる。
背景画像BIに、輪郭EG1、EG2が現れていると、図2のステップS70で背景画像データを圧縮した場合に、圧縮済みの背景画像データのデータ量が十分に小さくならない不都合が生じ得る。本実施例によれば、背景画像BI内の輪郭EG1、EG2を目立ち難くすることによって、背景画像BI内の文字の背景の均一性を向上することができる、すなわち、背景画像BI内の文字の背景を表す色の数を減らすことができる。この結果、圧縮済みの背景画像データのデータ量を低下させることができる。
また、図8に示すように、ステップS67の補正によって、階調値Rin1を有する画素の値は、階調値Rout1に変更され、階調値Rin2(Rin1<Rin2)を有する画素の値は、階調値Rout2(Rout1<Rout2)に変更される。この結果、背景画像BI内に残り得る文字の輪郭EG1、EG2をより効果的に目立ち難くすることができる。例えば、背景色範囲外の階調値を有する複数個の画素の値を、1個の階調値(例えば、ピーク階調値)に変更する場合や、該複数個の画素の値の大小関係を補正の前後で逆転させる場合と比較して、背景画像BI内の背景の見え方が補正処理の前後で変化することを抑制することができる。このように、本実施例によれば、元画像SIにおける文字領域内の背景の見え方を維持しつつも、背景画像BI内に残り得る文字の輪郭EG1、EG2を目立ち難くすることができる。
背景画像データ生成部130は、元画像SI内の文字構成画素の値をピーク階調値に変更することによって、元画像データから、補正処理前の背景画像データ(中間画像データとも呼ぶ。)を生成する(図2のステップS40)。そして、背景画像データ生成部130は、中間画像データに対して、補正部131による補正処理を含む背景画像データ調整処理を実行する(図2のステップS60)。
これに代えて、背景画像データ生成部130は、中間画像データの生成(図2のステップS40)を省略しても良い。すなわち、背景画像データ生成部130は、図3(A)の元画像SIを表す元画像データに対して、背景画像データ調整処理(図2のステップS60)を実行しても良い。この場合には、背景画像データ調整処理の処理対象の文字領域(図3(A)のTA1、TA2)は、図2のステップS40を実行した場合に消去される文字と、残存する輪郭EG1、EG2との両方を含む。したがって、図5のステップS63にて生成されるヒストグラムには、図6、7に示す破線部分、すなわち、文字に対応するピークを含む山が現れる。そして、背景画像データ調整処理のステップS67の補正処理によって、輪郭EG1、EG2を含む文字全体を構成する複数個の画素の値が、背景色範囲内の階調値に変更される。以上の説明から解るように、図2のステップS40が省略されることによって、元画像データに対して、背景画像データ調整処理が実行された場合でも、図2のステップS40が実行される場合と同様に、文字が消去された背景画像BIを表す背景画像データが生成される。そして、背景画像BI内に残り得る文字の輪郭EG1、EG2を目立ち難くすることができる。
B.第2実施例
第2実施例の背景画像データ調整処理では、図5のステップS66において生成される補正プロファイルが、第1実施例の補正プロファイル(図8)と異なる。他の処理は、第1実施例の画像処理(図2、図5)と同じである。また、第1実施例と同様に、第2実施例においても、図2のステップS40を省略することができる。
図10は、第2実施例の補正プロファイルを示す図である。この補正プロファイルは、R成分画像データを補正するための1次元ルックアップテーブルである。この補正プロファイルは、以下の式(5)を用いて表される。
Figure 2014128023
図10の補正プロファイルが、図8の第1実施例の補正プロファイルと異なる点は、背景色範囲A12内の階調値は変更されないことである。すなわち、式(5)に示すように、入力値Rinが、R1≦Rin<R2の範囲内にある場合には、入力値Rin=出力値Routとされることである。図10の補正プロファイルでは、背景色範囲外の階調値は、図8の補正プロファイルと同様に、変更される。
図11は、第2実施例の補正処理後のR成分画像データのヒストグラムを示す図である。補正処理後のR成分画像データでは、第1実施例(図9)と同様に、背景色範囲A12外の階調値を有する画素の個数、すなわち、RminからR1までの範囲内の階調値およびR2からRmaxまでの範囲内の階調値を有する画素の個数は、ゼロになる。一方、第1実施例とは異なり、補正処理後のヒストグラムでは、ピーク階調値Rbを含む山の形状(幅や高さ)が、補正処理前の対応する山の形状とほぼ同じである。図11のハッチングされた部分は、補正処理によって、増加した度数に対応する領域を表している。このように、補正処理前と補正処理後で、ピーク階調値Rbを含む山の形状は、背景色範囲A12内の度数が全体的にわずかに増加する分、わずかに変化するだけである。これらの特徴は、他の色成分の成分画像データについても同様である。
第1実施例では、背景色範囲内の階調値が変更されて、ピーク階調値を含む山の形状が補正処理の前後で変化している(図7、図9)ので、補正処理によって、背景画像BI内の背景の見え方が補正処理の前後で変化する可能性がある。具体的には、ピーク階調値を含む山の形状が細く高く変化しているので、補正処理後の文字の背景は、ノイズが減少することによって、補正処理前の文字の背景よりざらつき感がなく、つやのある見え方となる可能性がある。一方、第2実施例では、背景色範囲A12内の階調値を有する第1種の画素の値(R値、G値、B値)は変更されない。この結果、ピーク階調値を含む山の形状が補正処理の前後でほぼ同じになるので、背景画像BI内の背景の見え方が補正処理の前後で変化することを抑制することができる。したがって、高圧縮PDFファイルCFによって表される画像を、元画像SIに近づけることができる。
なお、第2実施例では、背景色範囲A12内の階調値を有する画素と、背景色範囲A12外の階調値を有する画素と、に対して、式(5)を用いた補正処理が実行されるので、式(5)から解るように、背景色範囲A12内の階調値を有する画素の値は、変更されない。換言すれば、背景色範囲A12内の階調値を有する画素は、その値が維持されるが、背景色範囲A12外の階調値を有する画素と同様に、補正対象の画素として扱われている。これに代えて、背景色範囲A12内の階調値を有する画素は、背景色範囲A12外の階調値を有する画素と異なり、補正対象外の画素として扱われてもよい。具体的には、以下の式(6)を用いて補正処理が実行されてもよい。
Figure 2014128023
この場合には、まず、各注目画素の値が、背景色範囲A12内の階調値であるか否かが判断される。注目画素の値が背景色範囲A12内の階調値を有する場合には、注目画素が補正対象外の画素でないと判断され、式(6)に従った補正処理は実行されない。注目画素の値が背景色範囲A12外の階調値を有する場合には、注目画素が補正対象の画素であると判断され、式(6)に従った補正処理が実行される。
C.第3実施例
第3実施例の背景画像データ調整処理では、図5のステップS65の背景色範囲を決定する処理が、第1実施例と異なる。例えば、図9にR成分画像データを補正するための背景色範囲A12が示されているように、第1実施例の背景色範囲の幅は、ピーク階調値(例えば、図9のRb)を中心とした固定された幅(2×ΔW)に決定される。これに代えて、第3実施例の背景色範囲の幅は、処理対象の成分画像データのヒストグラム(図7)に応じた大きさに決定される。したがって、第3実施例の背景色範囲の幅は、成分画像データ毎、すなわち、RGBの色成分毎に異なり得る。第3実施例の画像処理のその他の処理は、第1実施例の画像処理(図2、図5)と同じである。また、第1実施例と同様に、第3実施例においても、図2のステップS40を省略することができる。以下では、R成分画像データ(図9)を処理対象とする場合を例に、第3実施例の背景色範囲の決定について説明する。
図12は、第3実施例の背景色範囲を決定する処理のフローチャートである。図13は、第3実施例の背景色範囲を決定する処理の説明図である。図12のフローチャートは、図5のステップS65の具体的な処理内容を示している。ステップS651では、特定範囲決定部133は、処理対象の成分画像データのヒストグラムにおいて、画素数(度数)のカウント対象とする階調値(クラス)を初期値に設定する。本実施例では、カウント対象とする階調値の初期値は、ピーク階調値Rbである。
ステップS652では、特定範囲決定部133は、カウント対象とする階調値(カウント対象値とも呼ぶ。)を有する画素数をヒストグラムデータを用いて算出し、カウント値CVに加算する。したがって、最初のステップS652では、カウント値CVの値は、ピーク階調値Rbを有する画素数とされる。
ステップS653では、特定範囲決定部133は、カウント値CVが、しきい値THより大きいか否かを判断する。しきい値THは、設計値であり、例えば、ヒストグラムにおけるピーク階調値Rbを中心とした山(比較的度数が多い範囲)のほぼ全体を含むように、実験的、経験的に、定められている。本実施例では、特定範囲決定部133は、処理対象の文字領域内の総画素数の90パーセントをしきい値THとして用いる。
カウント値CVが、しきい値TH以下である場合には(ステップS653:NO)、特定範囲決定部133は、カウント順序に従って、カウント対象値を次の階調値に設定する(ステップS654)。図13の右側にはカウント順序が示されている。本実施例のカウント順序では、背景に対応するピーク階調値Rbが1番目(初期値)であり、ピーク階調値Rbより、文字の色を表す階調値Rtに1階調だけ近い階調値が2番目である。そして、ピーク階調値Rbより、階調値Rtから1階調だけ遠い階調値が3番目である。以下、ピーク階調値Rbより階調値Rtに近い階調値と、ピーク階調値Rbより階調値Rtから遠い階調値とが、ピーク階調値Rbに近い順に、交互に、カウント対象値に設定される。一般的に、ピーク階調値Rbが、最小値Rmin(例えば0)より最大値Rmax(例えば255)に近い場合(例えばRb>128である場合)には、文字を表す階調値Rtは、ピーク階調値Rbより小さい(Rb>Rt)。また、ピーク階調値Rbが、最大値Rmaxより最小値Rminに近い場合(例えばRb≦128である場合)には、文字を表す階調値Rtは、ピーク階調値Rbより大きい(Rb<Rt)。したがって、例えば、特定範囲決定部133は、Rb>128である場合には、ピーク階調値Rbより1階調小さい階調値を、2番目のカウント対象値に設定し、Rb≦128である場合には、ピーク階調値Rbより1階調大きい階調値を、2番目のカウント対象値に設定すれば良い。
新たなカウント対象値が設定されると(ステップS654)、特定範囲決定部133は、ステップS652で、新たに設定されたカウント対象値の画素数を、カウント値CVに加算する。以下、特定範囲決定部133は、カウント値CVが、しきい値THより大きくなるまで、新たなカウント対象値の設定(ステップS654)と、カウント値CVの加算(ステップS652)とを繰り返す。
カウント値CVが、しきい値THより大きい場合には(ステップS653:YES)、特定範囲決定部133は、カウント値CVの算出範囲を背景色範囲に決定する(ステップS655)。すなわち、ステップS655に移行するまでに、カウント対象値に設定された全ての階調値によって規定される範囲が、背景色範囲に決定される。
以上説明した第3実施例によれば、特定範囲決定部133は、背景色範囲の幅を、ヒストグラムデータ(分布データ)に応じて異なる幅に決定するので、処理対象の成分画像データの階調値分布に応じて、背景色範囲の幅を適切に決定することができる。具体的には、図12のフローチャートから解るように、特定範囲決定部133は、背景色範囲内の階調値を有する画素の個数が基準値(しきい値TH)より大きくなるように、背景色範囲を決定している。
図14は、第3実施例の背景色範囲の一例を示す図である。図14(A)は、ピーク階調値Rbを含む山の幅が比較的狭い場合、換言すれば、背景を表す複数個の画素の値のばらつきが比較的小さい場合の例を示している。図14(B)は、ピーク階調値Rbを含む山の幅が比較的広い場合、換言すれば、背景を表す複数個の画素の値のばらつきが比較的大きい場合の例を示している。これらの図から解るように、特定範囲決定部133は、背景色範囲の幅を、処理対象の成分画像データ内の背景を表す複数個の画素の値のばらつきが大きいほど広く設定する。すなわち、ヒストグラムデータが、処理対象の成分画像データ内の背景を表す複数個の画素の値のばらつきが比較的小さいことを表す場合には、背景色範囲の幅は、第1の幅ΔW1に決定され(図14(A))、ヒストグラムデータが、処理対象の成分画像データ内の背景を表す複数個の画素の値のばらつきが比較的大きいことを表す場合には、背景色範囲の幅は、第1の幅ΔW1よりも大きな第2の幅ΔW2に決定される(図14(B))。
例えば、上述したばらつきが小さい、すなわち、ピーク階調値Rbを含む山の幅が狭いにも拘わらずに、過度に広い背景色範囲が用いられると、補正処理の前に背景色範囲外の階調値を有する画素の値が、補正処理によって、十分にピーク階調値Rbに近づけられない可能性がある。この場合には、背景画像BI内の残り得る文字の輪郭EG1、EG2(図3(D))が、目立ち難くされない可能性がある。また、上述したばらつきが大きい、すなわち、ピーク階調値Rbを含む山の幅が広いにも拘わらずに、過度に狭い背景色範囲が用いられると、補正処理の前に背景色範囲外の階調値を有する第2種の画素の個数が過度に多くなる。補正処理によって、第2種の画素の値は変更され、背景色範囲外の階調値を有する画素の個数はゼロになるので、この場合には、背景画像BI内の文字の背景の見え方が補正の前後で変化してしまう可能性がある。本実施例によれば、背景を表す複数個の画素の値のばらつきに応じて、背景色範囲の幅を適切に決定することができるので、このような不都合を抑制することができる。
なお、第3実施例の背景色範囲の決定方法は、第1実施例の背景画像データ調整処理に採用されても良く、第2実施例の背景画像データ調整処理に採用されても良い。いずれの場合であっても、処理対象の成分画像データの階調値分布に応じて、背景色範囲の幅を適切に決定することができる。
D.第4実施例
図15は、第4実施例の背景画像データ調整処理のフローチャートである。第4実施例では、補正プロファイルを用いることなく、背景画像データ調整処理を実行する。具体的には、第4実施例の背景画像データ調整処理では、第1実施例の背景画像データ調整処理(図5)のステップS66およびS67に代えて、図15のステップS671〜S674の処理が実行される。第4実施例の背景画像データ調整処理の他の処理ステップは、第1実施例の背景画像データ調整処理の同符号のステップと同一である。
ステップS671では、補正部131は、処理対象の成分画像データ内の全画素のうち、背景色範囲外の階調値を有する1個の画素を、処理対象の画素として選択する。
ステップS672では、補正部131は、背景色範囲内の複数個の階調値の中から、1個の階調値をランダムに取得する。
ステップS673では、補正部131は、処理対象の画素の値(R値、G値、B値のいずれか)を、ステップS672にてランダムに取得された1個の階調値に変更する。
ステップS674では、補正部131は、背景色範囲外の階調値を有する全ての画素を処理対象の画素として選択したか否かを判断する。未選択の画素がある場合には(ステップS674:NO)、補正部131は、ステップS671に戻って、未選択の画素を新たな処理対象の画素として選択して、上述のステップS672〜S673の処理を繰り返す。背景色範囲外の階調値を有する全ての画素が選択済みである場合には(ステップS674:YES)、補正部131は、処理をステップS68に移行する。
以上説明した第4実施例によれば、補正部131は、補正処理の前に背景色範囲外の階調値を有する第2種の画素の値を、背景色範囲内の複数個の階調値の中からランダムに選択される階調値に変更する。この結果、背景画像BI内に残り得る文字の輪郭EG1、EG2をさらに目立ち難くすることができる。例えば、第1実施例のように、補正処理の前後で、背景色範囲外の複数個の異なる階調値をそれぞれ有する複数個の第2種の画素のうちの第1の画素の値と第2の画素との間の大小関係が維持される場合を考える。この場合には、背景画像BI内に残り得る文字の輪郭EG1、EG2を表す複数個の画素の値は、補正処理によって、背景の色に対応するピーク階調値に近づくが、輪郭EG1、EG2を表す複数個の画素の値と、周囲の画素の値との大小関係は、維持されやすい。このため、例えば、背景色範囲の幅が比較的広い場合には、すなわち、輪郭EG1、EG2を表す複数個の画素の値が、補正処理によって、背景の色に対応するピーク階調値に近づく程度が比較的小さい場合には、背景画像BI内に残り得る文字の輪郭EG1、EG2を十分に目立ち難くすることができない可能性がある。第4実施例によれば、輪郭EG1、EG2を表す画素の値が、輪郭EG1、EG2の周囲の画素が取り得る値の中からランダムに選ばれた値に変更される。この結果、輪郭EG1、EG2を表す複数個の画素の値と、周囲の画素の値との大小関係がランダムに変更されるので、背景色範囲の幅が比較的広い場合であっても、背景画像BI内に残り得る文字の輪郭EG1、EG2を十分に目立ち難くすることができる。
また、第4実施例では、第2実施例と同様に、補正処理の前に背景色範囲内の階調値を有する第1種の画素の値は、変更されない。したがって、補正処理の前後で、処理対象の成分画像データのヒストグラムにおけるピーク階調値を含む山の形状は、ほぼ維持される。補正処理の前に背景色範囲内の階調値を有する第1種の画素の個数は、補正処理の前に背景色範囲外の階調値を有する第2種の画素の個数よりも十分に多いからである。この結果、第2種の画素の値をランダムに決定した場合であっても、文字領域内の背景の見え方が補正の前後で変化する可能性を低減することができる。
なお、第4実施例において、第1実施例と同様に、補正処理の前に背景色範囲内の階調値を有する第1種の画素の値を変更しても良い。例えば、補正処理の前に背景色範囲内の階調値を有する第1種の画素の値を、第2種の画素の値と同様に、ランダムに決定された背景色範囲内の階調値に変更しても良い。この場合には、文字領域内の背景の見え方が補正の前後で変化する可能性は高くなるものの、背景色範囲の幅が比較的広い場合であっても、背景画像BI内に残り得る文字の輪郭EG1、EG2を十分に目立ち難くすることができる。また、第4実施例における背景色範囲の幅は、第1実施例と同様に、固定値(2×ΔW)に決定されても良いし、第3実施例と同様に、処理対象の成分画像データの分布データを用いて、動的に決定されても良い。
C.変形例:
(1)上記第1実施例および第2実施例の補正プロファイル(図8、図10)は一例であり、これに限られない。例えば、図8の補正プロファイルは、Rmin≦R<Rbの範囲の入力値Rinの増加に対して、出力値Routが直線的に単調増加するように、設定されている。補正プロファイルは、直線的に限らず、Rmin≦R<Rbの入力値Rinの範囲内で、入力値Rinの増加に対して、出力値Routが単調増加するように設定されていれば良い。例えば、入力値Rinの増加に対して、出力値Routがステップ状に段階的に単調増加するように補正プロファイルが設定されても良い。あるいは、入力値Rinの増加に対して、出力値Routが、曲線状(例えば、漸近線状)に単調増加するように補正プロファイルが設定されても良い。Rb≦R<Rmaxの範囲の入力値Rinについても同様である。また、上記第1実施例のように、補正部131は、補正処理の前に背景色範囲内の階調値を有する第1種の画素の値を補正によって変更してもよく、上記第2実施例のように、補正部131は、第1種の画素の値を補正処理の前後で維持しても良い。一般的に言えば、補正部131は、補正処理の前に背景色範囲内の階調値を有する第1種の画素の値が、補正処理の後に背景色範囲内の階調値に設定され、かつ、補正処理の前に背景色範囲外の階調値を有する第2種の画素の値が、補正処理の後に背景色範囲内の階調値に設定されるように、処理対象の対象画像データに対して補正処理を実行すれば良い。こうすれば、背景画像内に残り得る文字の輪郭を十分に目立ち難くすることができる。
(2)上記第2実施例では、補正部131は、補正処理の前に背景色範囲内の階調値を有する全ての第1種の画素の値を変更していない。これに代えて、例えば、補正部131は、背景色範囲より狭い範囲であって、ピーク階調値Rbを含む範囲内の階調値を有する第1種の画素の値だけを変更せず、他の第1種の画素の値は変更しても良い。
(3)上記第1実施例および第2実施例では、補正部131は、補正処理の前に背景色範囲外の階調値を有する全ての第2種の画素の値を、背景色範囲内の階調値に変更している。これに代えて、例えば、補正部131は、第2種の画素の値のうち、背景に対応するピーク階調値(例えば、図7のRb)より、文字の色を表す階調値(例えば、図7のRt)側の階調値(例えば、図7のRmin≦R<R1までの範囲内の階調値)を有する画素の値だけを、背景色範囲内の階調値に変更してもよい。
(4)上記実施例では、3個の成分に対応する3個の成分画像データを含むカラーのスキャンデータが元画像データとして用いられているが、例えば、1個の成分画像データのみを含むモノクロのスキャンデータが元画像データとして用いられても良い。この場合には、背景画像データ生成部130は、上記各実施例において、3個の成分画像データに対して実行される処理(例えば、図5のステップS63〜S67の処理)を、1個の成分画像データに対して実行すれば良い。
(5)上記第1実施例の画像処理は、図2のステップS40によって、文字の輪郭を含む背景画像を表す背景画像データが取得され、該背景画像データに対して、図2のステップS60の背景画像データ調整処理、すなわち、背景画像内の文字の輪郭を目立ち難くするための補正処理が実行される画像処理であると、言うことができる。なお、上記実施例では、背景画像データは、高圧縮PDFファイルを生成する過程で取得されているが、これに代えて、背景画像データは、例えば、背景画像データ調整処理が実行されることなく生成された高圧縮PDFファイル内から取得されてもよい。この場合には、計算機は、例えば、背景画像データに対して背景画像データ調整処理を実行して、文字の輪郭が低減された元画像を再現することができる。あるいは、計算機は、背景画像データに対して背景画像データ調整処理を実行して、圧縮率のより高い高圧縮PDFファイルを作成することができる。
(6)上記各実施例では、背景色範囲は、背景に対応するピーク階調値を中心とした範囲である。すなわち、ピーク階調値から下限値までの幅と、ピーク階調値から上限値までの幅とがほぼ等しくなるように、背景色範囲の上限値と下限値とが決定されている。これに代えて、ピーク階調値から下限値までの幅と、ピーク階調値から上限値までの幅と、は異なっていても良い。
(7)上記実施例では、スキャナドライバ100の画像処理機能は、計算機200によって実現されているが、これに代えて、複合機、デジタルカメラ、スキャナなどが備える制御装置、または、これらの機器とネットワークを介して通信可能なサーバによって実現されてもよい。また、当該画像処理機能は、1つの装置で実現されてもよいし、これに代えて、ネットワークを介して接続される複数個の装置(例えば、スキャナまたは複合機と、サーバ)によって、実現されても良い。この場合には、当該画像処理機能を実現する複数個の装置を備えるシステムが、画像処理装置に相当する。例えば、計算機200からの読み取り指示に基づいて、スキャナ300はスキャンデータを生成して、所定のサーバに該スキャンデータを送信する。サーバは、該スキャンデータを用いて、上記実施例の処理(図2)を実行して、高圧縮PDFファイルを生成して、スキャナ300または計算機200に送信しても良い。
(8)上記実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部をハードウェアに置き換えるようにしてもよい。
以上、実施例、変形例に基づき本発明について説明してきたが、上記した発明の実施の形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれる。
100...スキャナドライバ、110...スキャンデータ取得部、120...文字画像データ生成部、130...背景画像データ生成部、131...補正部、132...階調値分布生成部、133...特定範囲決定部、140...圧縮部、150...ファイル生成部、200...計算機、210...CPU、240...内部記憶装置、260...表示部、270...操作部、280...通信部、290...外部記憶装置、291...ドライバプログラム、300...スキャナ

Claims (16)

  1. 画像処理装置であって、
    元画像を表す元画像データから、文字画像を表す文字画像データを生成する文字画像データ生成部と、
    前記元画像データから、背景画像を表す背景画像データを生成する背景画像データ生成部であって、前記背景画像は、前記元画像から文字が消去された画像を表す、前記背景画像データ生成部と、
    を備え、
    前記背景画像データ生成部は、補正処理前に特定範囲内の階調値を有する第1種の画素の値が、補正処理後に前記特定範囲内の階調値に設定され、かつ、補正処理前に前記特定範囲外の階調値を有する第2種の画素の値が、補正処理後に前記特定範囲内の階調値に設定されるように、処理対象の対象画像データに対して補正処理を実行する補正部を備え、
    前記特定範囲は、複数個の連続する階調値を含み、
    前記特定範囲内の前記複数個の連続する階調値は、前記元画像データの階調値分布におけるピーク階調値であって文字の背景に対応する前記ピーク階調値を含む、画像処理装置。
  2. 請求項1に記載の画像処理装置であって、
    前記補正部は、
    補正処理前に前記特定範囲外の第1の階調値を有する前記第2種の画素である第1の画素の値を、前記特定範囲内の第2の階調値に変更し、
    補正処理前に前記特定範囲外の第3の階調値であって、第1の階調値よりもピーク階調値に近い前記第3の階調値を有する前記第2種の画素である第2の画素の値を、前記特定範囲内の第4の階調値であって、前記第2の階調値よりもピーク階調値に近い前記第4の階調値に変更する、画像処理装置。
  3. 請求項1に記載の画像処理装置であって、
    前記補正部は、
    補正処理前に前記特定範囲外の階調値を有する前記第2種の画素の値を、前記特定範囲内の前記複数個の連続する階調値の中からランダムに選択される階調値に変更する、画像処理装置。
  4. 請求項1ないし3のいずれかに記載の画像処理装置であって、
    前記補正部は、補正処理前に前記特定範囲内の階調値を有する前記第1種の画素の値を、前記特定範囲内の階調値に変更すると共に、補正処理前に前記特定範囲外の階調値を有する前記第2種の画素の値を、前記特定範囲内の階調値に変更する、画像処理装置。
  5. 請求項1ないし3のいずれかに記載の画像処理装置であって、
    前記補正部は、補正処理前に前記特定範囲内の階調値を有する前記第1種の画素の値を変更せずに、補正処理前に前記特定範囲外の階調値を有する前記第2種の画素の値を、前記特定範囲内の階調値に変更する、画像処理装置。
  6. 請求項1ないし5のいずれかに記載の画像処理装置であって、
    前記背景画像データ生成部は、さらに、
    前記対象画像データの階調値分布を表す分布データを生成する分布データ生成部と、
    前記分布データを用いて、前記特定範囲を決定する特定範囲決定部と、
    を備える、画像処理装置。
  7. 請求項6に記載の画像処理装置であって、
    前記特定範囲決定部は、
    前記分布データが、前記対象画像データ内の背景を表す複数個の画素の値のばらつきが比較的小さいことを表す場合には、前記特定範囲の幅を第1の幅に決定し、
    前記分布データが、前記対象画像データ内の背景を表す複数個の画素の値のばらつきが比較的大きいことを表す場合には、前記特定範囲の幅を前記第1の幅よりも大きな第2の幅に決定する、画像処理装置。
  8. 請求項1ないし7のいずれかに記載の画像処理装置であって、
    前記補正部は、前記対象画像データとしての前記元画像データに対して、前記補正処理を実行する、画像処理装置。
  9. 請求項1ないし8のいずれかに記載の画像処理装置であって、
    前記背景画像データ生成部は、前記元画像内の文字を構成する文字構成画素の値を前記ピーク階調値に変更することによって、前記元画像データから中間画像データを生成する中間画像データ生成部を備え、
    前記補正部は、前記対象画像データとしての前記中間画像データに対して、前記補正処理を実行する、画像処理装置。
  10. 請求項1ないし9のいずれかに記載の画像処理装置であって、
    前記対象画像データは、複数個の色成分に対応する複数個の成分画像データを含み、
    前記補正部は、前記複数個の成分画像データのそれぞれに対して、前記補正処理を実行する、画像処理装置。
  11. 請求項1ないし10のいずれかに記載の画像処理装置であって、さらに、
    前記背景画像データを圧縮する圧縮部を備える、画像処理装置。
  12. 画像処理装置であって、
    背景画像を表す背景画像データを取得する取得部であって、背景画像は文字の輪郭を含む画像を表す、前記取得部と、
    補正処理前に特定範囲内の階調値を有する第1種の画素の値が、補正処理後に前記特定範囲内の階調値に設定され、かつ、補正処理前に前記特定範囲外の階調値を有する第2種の画素の値が、補正処理後に前記特定範囲内の階調値に設定されるように、背景画像データに対して補正処理を実行する補正部であって、前記補正処理は、前記背景画像内の文字の輪郭を目立ち難くするための処理を含む、前記補正部と、
    を備え、
    前記特定範囲内の前記複数個の連続する階調値は、前記背景画像データの階調値分布におけるピーク階調値であって文字の輪郭の背景に対応する前記ピーク階調値を含む、画像処理装置。
  13. 請求項12に記載の画像処理装置であって、さらに、
    前記背景画像データの階調値分布を表す分布データを生成する分布データ生成部と、
    前記分布データを用いて、前記特定範囲を決定する特定範囲決定部と、
    を備える、画像処理装置。
  14. 請求項13に記載の画像処理装置であって、
    前記特定範囲決定部は、
    前記分布データが、前記背景画像データ内の背景を表す複数個の画素の値のばらつきが比較的小さいことを表す場合には、前記特定範囲の幅を第1の幅に決定し、
    前記分布データが、前記背景画像データ内の背景を表す複数個の画素の値のばらつきが比較的大きいことを表す場合には、前記特定範囲の幅を前記第1の幅よりも大きな第2の幅に決定する、画像処理装置。
  15. コンピュータプログラムであって、
    元画像を表す元画像データから、文字画像を表す文字画像データを生成する文字画像データ生成機能と、
    前記元画像データから、背景画像を表す背景画像データを生成する背景画像データ生成機能であって、前記背景画像は、前記元画像から文字が消去された画像を表す、前記背景画像データ生成機能と、
    をコンピュータに実現させ、
    前記背景画像データ生成機能は、補正処理前に特定範囲内の階調値を有する第1種の画素の値が、補正処理後に前記特定範囲内の階調値に設定され、かつ、補正処理前に前記特定範囲外の階調値を有する第2種の画素の値が、補正処理後に前記特定範囲内の階調値に設定されるように、処理対象の対象画像データに対して補正処理を実行する補正機能を備え、
    前記特定範囲は、複数個の連続する階調値を含み、
    前記特定範囲内の前記複数個の連続する階調値は、前記元画像データの階調値分布におけるピーク階調値であって文字の背景に対応する前記ピーク階調値を含む、コンピュータプログラム。
  16. コンピュータプログラムであって、
    背景画像を表す背景画像データを取得する取得機能であって、背景画像は文字の輪郭を含む画像を表す、前記取得機能と、
    補正処理前に特定範囲内の階調値を有する第1種の画素の値が、補正処理後に前記特定範囲内の階調値に設定され、かつ、補正処理前に前記特定範囲外の階調値を有する第2種の画素の値が、補正処理後に前記特定範囲内の階調値に設定されるように、背景画像データに対して補正処理を実行する補正機能であって、前記補正処理は、前記背景画像内の文字の輪郭を目立ち難くするための処理を含む、前記補正機能と、
    をコンピュータに実現させ、
    前記特定範囲内の前記複数個の連続する階調値は、前記背景画像データの階調値分布におけるピーク階調値であって文字の輪郭の背景に対応する前記ピーク階調値を含む、コンピュータプログラム。
JP2012286231A 2012-12-27 2012-12-27 画像処理装置およびコンピュータプログラム Active JP5939154B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012286231A JP5939154B2 (ja) 2012-12-27 2012-12-27 画像処理装置およびコンピュータプログラム
US14/141,061 US9300840B2 (en) 2012-12-27 2013-12-26 Image processing device and computer-readable storage medium storing computer-readable instructions
EP13199908.8A EP2750365B1 (en) 2012-12-27 2013-12-31 Image processing device and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012286231A JP5939154B2 (ja) 2012-12-27 2012-12-27 画像処理装置およびコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2014128023A true JP2014128023A (ja) 2014-07-07
JP5939154B2 JP5939154B2 (ja) 2016-06-22

Family

ID=50028712

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012286231A Active JP5939154B2 (ja) 2012-12-27 2012-12-27 画像処理装置およびコンピュータプログラム

Country Status (3)

Country Link
US (1) US9300840B2 (ja)
EP (1) EP2750365B1 (ja)
JP (1) JP5939154B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6344064B2 (ja) * 2014-05-30 2018-06-20 ブラザー工業株式会社 画像処理装置およびコンピュータプログラム
JP6341085B2 (ja) * 2014-12-26 2018-06-13 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
US9805662B2 (en) * 2015-03-23 2017-10-31 Intel Corporation Content adaptive backlight power saving technology
CN108182439B (zh) * 2017-12-20 2022-03-15 电子科技大学 一种基于多分类增量学习的分窗口计数方法及装置
US11069043B1 (en) * 2020-03-13 2021-07-20 Konica Minolta Business Solutions U.S.A., Inc. Background noise reduction using a variable range of color values dependent upon the initial background color distribution
JP2022088249A (ja) * 2020-12-02 2022-06-14 シャープ株式会社 画像処理装置、制御方法及びプログラム
US11423597B2 (en) * 2020-12-16 2022-08-23 Palo Alto Research Center Incorporated Method and system for removing scene text from images
US20230005107A1 (en) * 2021-06-30 2023-01-05 Palo Alto Research Center Incorporated Multi-task text inpainting of digital images

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003046746A (ja) * 2001-07-31 2003-02-14 Canon Inc 画像処理方法及び画像処理装置
JP2005303506A (ja) * 2004-04-08 2005-10-27 Ricoh Co Ltd 画像処理装置、画像処理方法、画像処理用プログラム及び記憶媒体

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4903145A (en) 1986-08-06 1990-02-20 Canon Kabushiki Kaisha Image quality control apparatus capable of density-correcting plural areas of different types
JP2611012B2 (ja) 1989-09-19 1997-05-21 日本電信電話株式会社 文字分離符号化方法
JPH05225378A (ja) 1991-06-03 1993-09-03 Fujitsu Ltd 文書画像の領域分割システム
WO1996024114A2 (en) * 1995-01-31 1996-08-08 United Parcel Service Of America, Inc. Method and apparatus for separating foreground from background in images containing text
JP3207067B2 (ja) * 1995-01-31 2001-09-10 株式会社東芝 画像形成装置
US6389162B2 (en) 1996-02-15 2002-05-14 Canon Kabushiki Kaisha Image processing apparatus and method and medium
JP3779400B2 (ja) * 1996-11-28 2006-05-24 株式会社東芝 画像処理方法
US6400844B1 (en) * 1998-12-02 2002-06-04 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
JP2000175052A (ja) * 1998-12-07 2000-06-23 Xerox Corp ピクセルマップ表現の処理方法及び装置
JP3424642B2 (ja) 1999-04-28 2003-07-07 ミノルタ株式会社 画像処理装置およびこれを搭載した画像読取装置と画像形成装置、並びに画像処理方法
JP2001103309A (ja) * 1999-09-28 2001-04-13 Sharp Corp 画像処理方法及び画像処理装置
JP3880277B2 (ja) * 2000-03-03 2007-02-14 キヤノン株式会社 画像処理装置およびその制御方法
US6879416B2 (en) * 2000-04-27 2005-04-12 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
US6920245B1 (en) * 2000-11-22 2005-07-19 Kabushiki Kaisha Toshiba Image processing apparatus and image forming apparatus
JP4558232B2 (ja) 2001-03-26 2010-10-06 株式会社リコー 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
WO2002102056A1 (en) 2001-06-06 2002-12-19 Sharp Kabushiki Kaisha Image encoding method, and image device
TWI231701B (en) * 2001-06-14 2005-04-21 Matsushita Electric Ind Co Ltd Automatic tone correction device, automatic tone correction method, and tone correction program recording medium
JP2004206686A (ja) * 2002-12-12 2004-07-22 Fuji Photo Film Co Ltd 画像処理装置および画像処理プログラム
JP4383157B2 (ja) 2003-05-15 2009-12-16 株式会社リコー 画像処理装置、プログラム及び記憶媒体
JP4235583B2 (ja) 2003-05-26 2009-03-11 株式会社リコー 画像処理装置、画像処理用プログラム及び記憶媒体
JP2005073015A (ja) * 2003-08-26 2005-03-17 Canon Inc 画像処理装置及び画像処理方法及びコンピュータプログラム
US7433535B2 (en) 2003-09-30 2008-10-07 Hewlett-Packard Development Company, L.P. Enhancing text-like edges in digital images
EP1555804A3 (en) 2004-01-19 2006-08-16 Ricoh Company, Ltd. Image processing apparatus, image processing program and storage medium
JP2006093880A (ja) 2004-09-21 2006-04-06 Canon Inc 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2006091980A (ja) * 2004-09-21 2006-04-06 Seiko Epson Corp 画像処理装置、画像処理方法および画像処理プログラム
US7783117B2 (en) * 2005-08-12 2010-08-24 Seiko Epson Corporation Systems and methods for generating background and foreground images for document compression
US7864365B2 (en) 2006-06-15 2011-01-04 Sharp Laboratories Of America, Inc. Methods and systems for segmenting a digital image into regions
JP2008028717A (ja) 2006-07-21 2008-02-07 Canon Inc 画像処理装置および方法、プログラム
JP2008236204A (ja) * 2007-03-19 2008-10-02 Kyocera Mita Corp 画像処理装置
US7813588B2 (en) 2007-04-27 2010-10-12 Hewlett-Packard Development Company, L.P. Adjusting source image data prior to compressing the source image data
JP4700721B2 (ja) * 2008-10-10 2011-06-15 株式会社沖データ 画像処理装置
JP5036844B2 (ja) 2010-04-15 2012-09-26 シャープ株式会社 画像圧縮装置、画像出力装置、画像読取装置、画像圧縮方法、コンピュータプログラム及び記録媒体
US20130004066A1 (en) * 2011-07-03 2013-01-03 Butler David G Determining a background color of a document

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003046746A (ja) * 2001-07-31 2003-02-14 Canon Inc 画像処理方法及び画像処理装置
JP2005303506A (ja) * 2004-04-08 2005-10-27 Ricoh Co Ltd 画像処理装置、画像処理方法、画像処理用プログラム及び記憶媒体

Also Published As

Publication number Publication date
JP5939154B2 (ja) 2016-06-22
EP2750365B1 (en) 2021-04-28
US20140185104A1 (en) 2014-07-03
US9300840B2 (en) 2016-03-29
EP2750365A2 (en) 2014-07-02
EP2750365A3 (en) 2014-10-15

Similar Documents

Publication Publication Date Title
JP5939154B2 (ja) 画像処理装置およびコンピュータプログラム
JP5958023B2 (ja) 画像処理装置および画像処理プログラム
JP3828210B2 (ja) 画像コントラスト強化方法
JP5874497B2 (ja) 画像処理装置および画像処理プログラム
JP4423298B2 (ja) デジタル画像におけるテキスト状エッジの強調
JP5935454B2 (ja) 画像処理装置および画像処理プログラム
JP6781406B2 (ja) 画像処理装置、および、コンピュータプログラム
JP2003348360A (ja) 文書エンコーディングシステム、文書デコーディングシステムおよびその方法
JP6098298B2 (ja) 画像処理装置およびコンピュータプログラム
RU2469400C1 (ru) Способ преобразования растрового изображения в метафайл
JP4064023B2 (ja) デジタル画像中間調処理方法及び装置、並びに、デジタル画像中間調処理プログラムを記録した記録媒体
JP3715905B2 (ja) 画像処理装置、画像処理方法、プログラム並びに記憶媒体
US9330447B2 (en) Image evaluation device, image selection device, image evaluation method, recording medium, and program
JP2014072666A (ja) 画像処理装置およびプログラム
JP2019140538A (ja) 画像処理装置、画像形成装置、画像処理方法、及びプログラム
JP4446797B2 (ja) 文書復元装置、文書復元方法、文書復元プログラムおよび記録媒体
JP2004304543A (ja) ハーフトーン化処理方法及びハーフトーン化処理システム
JP6145983B2 (ja) 画像処理装置およびコンピュータプログラム
JP4805590B2 (ja) 画像処理装置および画像処理プログラム
JP5949399B2 (ja) 画像処理装置およびプログラム
JP2001268349A (ja) オブジェクト画素判断装置、オブジェクト画素判断方法、オブジェクト画素判断プログラムを記録した媒体、オブジェクト画素判断プログラム、オブジェクト画素抽出装置、オブジェクト画素抽出方法、オブジェクト画素抽出プログラムを記録した媒体およびオブジェクト画素抽出プログラム
JP3054299B2 (ja) 画像処理装置及びその方法
JP2004096715A (ja) 画像データ補間装置、画像データ補間処理用コンピュータ、画像データ補間方法および画像データ補間プログラムを記録した媒体
JP2005184403A (ja) 画像処理装置
JP5597028B2 (ja) 画像復号装置及びその制御方法、並びにプログラム及びコンピュータ可読記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150313

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160419

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160502

R150 Certificate of patent or registration of utility model

Ref document number: 5939154

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150