JP5874497B2 - 画像処理装置および画像処理プログラム - Google Patents

画像処理装置および画像処理プログラム Download PDF

Info

Publication number
JP5874497B2
JP5874497B2 JP2012080288A JP2012080288A JP5874497B2 JP 5874497 B2 JP5874497 B2 JP 5874497B2 JP 2012080288 A JP2012080288 A JP 2012080288A JP 2012080288 A JP2012080288 A JP 2012080288A JP 5874497 B2 JP5874497 B2 JP 5874497B2
Authority
JP
Japan
Prior art keywords
character
image
color
target image
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012080288A
Other languages
English (en)
Other versions
JP2013210817A (ja
Inventor
浩一 次村
浩一 次村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2012080288A priority Critical patent/JP5874497B2/ja
Priority to US13/838,912 priority patent/US9014468B2/en
Priority to EP13160218.7A priority patent/EP2645697B1/en
Publication of JP2013210817A publication Critical patent/JP2013210817A/ja
Application granted granted Critical
Publication of JP5874497B2 publication Critical patent/JP5874497B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/62Retouching, i.e. modification of isolated colours only or in isolated picture areas only
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/64Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
    • H04N1/642Adapting to different types of images, e.g. characters, graphs, black and white image portions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Color Image Communication Systems (AREA)

Description

本発明は、画像処理に関し、特に、対象画像データから、文字画像データと背景画像データとを生成する技術に関する。
文字を含む対象画像を表す対象画像データを用いて、文字を表す文字画像データと文字を含まない背景画像データと、を生成(分離)する技術が知られている(例えば、特許文献1)。この技術では、文字を構成する第1画素と、文字を構成しない第2画素とによって文字を表す文字画像データ(二値データ)を生成する。そして、この技術は、対象画像において、二値データの複数の第1画素に対応する複数の画素を、二値データの複数の第2画素に対応する複数の画素の平均色で塗りつぶして、背景画像データを生成している。分離後の文字画像データは、文字画像データの圧縮に適した圧縮方式(例えば、MMR(Modified Modified Read)方式)で圧縮され、分離後の背景画像データは、背景画像データの圧縮に適した圧縮方式(例えば、JPEG(Joint Photographic Experts Group)方式)で圧縮される。この結果、対象画像データ全体を高い圧縮率で圧縮することができる。
特開2003−046746号公報 特開2006−093880号公報 特開2004−362541号公報 特開2005−12768号公報
しかしながら、上記技術では、例えば、対象画像内の文字の鮮鋭度が低い(換言すれば、文字がぼけている)場合に、背景画像内に鮮鋭度が低い文字のエッジが残ってしまう可能性があった。この場合には、例えば、背景画像データと文字画像データを用いて対象画像を再現した際に、文字の見栄えが低下する可能性があった。
本発明の主な利点は、対象画像データを用いて、背景画像データと文字画像データとを生成する技術に関して、背景画像データと文字画像データとを用いて対象画像を再現した際に、文字の見栄えの低下を抑制することである。
本発明は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の適用例として実現することが可能である。
[適用例1]画像処理装置であって、文字を含む対象画像を表す対象画像データを用いて、文字画像を表す文字画像データを生成する文字画像生成部と、前記対象画像データを用いて、前記対象画像内の前記文字画像の色が変更された背景画像を表す背景画像データを生成する背景画像生成部と、を備え、前記背景画像生成部は、前記対象画像に含まれる拡張文字領域であって、前記対象画像のうち、前記文字画像の文字を構成する画素群に対応する文字領域と、前記対象画像のうち、前記文字領域の周囲の周囲領域と、を含む前記拡張文字領域を決定する拡張文字領域決定部と、前記拡張文字領域の色を、前記対象画像の背景の色に変更する変更部と、を備え、前記拡張文字領域決定部は、前記対象画像に含まれる文字の鮮鋭度に関する関連情報を取得する取得部と、前記関連情報に応じて、前記周囲領域のサイズを決定する周囲領域決定部と、を備える、画像処理装置。
上記構成によれば、対象画像内の拡張文字領域の色が背景色に変更された背景画像データを生成する。周囲領域のサイズは、文字の鮮鋭度に関する情報に応じて決定される。この結果、文字の鮮鋭度に応じた適切な拡張文字領域を決定できる。この結果、文字画像データと背景画像データとを用いて対象画像を再現する場合に、文字の見栄えの低下を抑制することができる。
[適用例2]適用例2に記載の画像処理装置であって、前記拡張文字領域決定部は、さらに、前記対象画像に含まれる文字の鮮鋭度に関する特徴値を算出する算出部を備え、前記取得部は、前記特徴値を含む前記関連情報を取得する、画像処理装置。
上記構成によれば、上記構成によれば、文字の鮮鋭度に関する特徴値に応じて周囲領域のサイズが決定されるので、文字の鮮鋭度に応じた適切な拡張文字領域を決定することができる。
[適用例3]適用例1または適用例2に記載の画像処理装置であって、前記拡張文字領域決定部は、さらに、前記対象画像に含まれる文字の色を表す文字色値を特定する文字色特定部を備え、前記取得部は、前記文字色値を含む前記関連情報を取得する、画像処理装置。
文字色に応じて文字の鮮鋭度は異なり得る。上記構成によれば、文字色値に応じて周囲領域のサイズが決定されるので、文字の鮮鋭度に応じた適切な拡張文字領域を決定することができる。
[適用例4]適用例1ないし適用例3のいずれかに記載の画像処理装置であって、前記関連情報が所定条件を満たす場合に、前記周囲領域決定部は、前記前記周囲領域のサイズを上限値に設定し、前記背景画像生成部は、さらに、前記関連情報が前記所定条件を満たした場合に、前記変更部によって前記拡張文字領域の色が変更された後の前記対象画像データに対して補正処理を実行する補正部であって、前記補正処理は、前記拡張文字領域の変更後の色と前記拡張文字領域の周囲の領域の色との差を、補正前よりも小さくする処理である、前記補正部を備える、画像処理装置。
上記構成によれば、関連情報が所定条件を満たす場合には、周囲領域のサイズが上限値に決定されるとともに、補正処理が実行されるので、文字画像データと背景画像データとを用いて対象画像が再現される場合に、文字の見栄えの低下を、さらに、抑制することができる。
[適用例5]適用例1ないし適用例4のいずれかに記載の画像処理装置であって、前記対象画像データは、原稿を光学的に読み取る画像読取装置によって生成され、前記取得部は、前記画像読取装置の特性に応じた設定値を含む前記関連情報を取得する、画像処理装置。
画像読取装置の特定によって、文字の鮮鋭度は異なり得る。上記構成によれば、画像読取装置の特性に応じた設定値に応じて周囲領域のサイズが決定されるので、文字の鮮鋭度に応じた適切な拡張文字領域を決定することができる。
本発明は、種々の形態で実現することが可能であり、例えば、上記装置の機能を実現する方法、上記装置の機能を実現するコンピュータプログラム、当該コンピュータプログラムを記録した記録媒体、等の形態で実現することができる。
画像処理装置としての計算機200の構成を示すブロック図。 画像処理のフローチャートである。 画像処理に用いられる画像の一例を示す図である。 背景画像データ生成処理のフローチャートである。 文字オブジェクト領域のヒストグラムの一例を示す図である。 文字の膨張レベルについて説明する図である。 文字のぼけ度とヒストグラムHGとの関係を説明する図である。 文字領域を拡張するためのフィルタの例を示す図である。 拡張文字二値データの生成について説明する図である。 特性データ293について説明する図である。 特性データ293を作成する特定データ生成処理のフローチャートである。 標準原稿500の一例を表す図である。
A.第1実施例:
A−1.画像処理装置の構成:
次に、本発明の実施の形態を実施例に基づき説明する。図1は、第1実施例における画像処理装置としての計算機200の構成を示すブロック図である。
計算機200は、例えば、パーソナルコンピュータであり、CPU210と、ROMとRAMとを含む内部記憶装置240と、マウスやキーボードなどの操作部270と、外部装置と通信を行うための通信部280と、ハードディスクドライブなどの外部記憶装置290と、を備えている。
計算機200は、通信部280を介して、スキャナ300などの外部装置と通信可能に接続される。スキャナ300は、光学的に原稿を読み取ることによってスキャンデータを取得する画像読取装置である。
内部記憶装置240には、CPU210が処理を行う際に生成される種々の中間データを一時的に格納するバッファ領域を提供する。外部記憶装置290は、ドライバプログラム291を格納している。ドライバプログラム291は、例えば、CD−ROMなどに格納されて提供される。
CPU210は、ドライバプログラム291を実行することにより、スキャナドライバ100として機能する。スキャナドライバ100は、スキャンデータ取得部110と、文字画像生成部120と、背景画像生成部130と、圧縮部140と、を備えている。背景画像生成部130は、拡張文字領域決定部131と、変更部136と、補正部137と、を備えている。拡張文字領域決定部131は、情報取得部132と、周囲領域決定部133と、算出部134と、を備えている。
スキャンデータ取得部110は、文字を含む対象画像を表す対象画像データとして、スキャンデータを取得する。文字画像生成部120は、取得されたスキャンデータを用いて、文字画像を表す文字画像データ(例えば、文字二値データ)を生成する。背景画像生成部130は、スキャンデータを用いて、スキャン画像内の文字画像の色を変更することによって文字が消去された背景画像を表す背景画像データを生成する。圧縮部140は、文字画像データと、背景画像データとを、それぞれ異なる圧縮方式で圧縮する。圧縮された各データは、例えば、1つのPDFファイルに格納され、スキャンデータを圧縮した圧縮画像ファイルが生成される。
A−2.画像処理:
図2は、画像処理のフローチャートである。画像処理は、例えば、利用者が、原稿をスキャナ300にセットして、スキャナドライバ100に対して原稿の読取(スキャンデータの生成)を指示した場合に、スキャナドライバ100によって実行される。ステップS100では、スキャンデータ取得部110は、処理対象のスキャンデータを取得する。具体的には、スキャンデータ取得部110は、スキャナ300の画像読取部を制御して、利用者が準備した原稿を読み取ってスキャンデータを取得する。スキャンデータは、レッド(R)、グリーン(G)、ブルー(B)の3つの成分値(本実施例の各成分値は、256階調の階調値)を含む画素データによって構成されたRGB画像データである。
図3は、画像処理に用いられる画像の一例を示す図である。図3(A)は、スキャンデータによって表わされるスキャン画像SIの一例を示している。スキャン画像SIは、下地Bg1と、文字を表す文字オブジェクトOb1,Ob2と、写真を表す写真オブジェクトOb3と、描画を表す描画オブジェクトOb4とを含んでいる。ここで、描画オブジェクトは、イラスト,表,線図,模様などを表すオブジェクトである。
ステップS150(図2)では、文字画像生成部120は、スキャン画像SI内で、文字オブジェクトを含む文字オブジェクト領域を特定する文字オブジェクト特定処理を実行する。具体的には、文字画像生成部120は、sobelフィルタなどのエッジ検出フィルタをスキャンデータに適用して、エッジ画像EI(図3(B))を表すエッジ画像データを生成する。文字画像生成部120は、エッジ画像EI内で、エッジ強度が基準値より大きい領域を特定し、当該領域に対応するスキャン画像SI内の領域をオブジェクト領域として特定する。図3(B)の例では、スキャン画像SI内の4つのオブジェクトOb1〜Ob4に対応する4つの領域OA1〜OA4が、エッジ画像EI内に特定されている。
文字画像生成部120は、スキャン画像SI内の各オブジェクト領域の色分布に応じて、各オブジェクト領域が、文字オブジェクト領域であるか否かを判定する。具体的には、文字画像生成部120は、オブジェクト領域の輝度のヒストグラムを用いて、当該領域内に含まれる輝度値の種類数Cを算出する。文字画像生成部120は、オブジェクト領域に含まれる複数の画素を、オブジェクト領域の周囲の色(背景色)に近似する色を有する背景画素と、背景画素以外のオブジェクト画素と、に分類し、オブジェクト画素の比率Dを算出する。オブジェクト画素の比率Dは、(オブジェクト画素の数)/(背景画素の数)で表される。文字オブジェクトは、文字以外のオブジェクトと比較して、輝度値の種類数C(色の種類数)、および、オブジェクト画素の比率Dが小さい傾向がある。文字画像生成部120は、判定対象のオブジェクト領域の輝度値の種類数C(色の種類数)が第1の閾値より小さく、かつ、オブジェクト画素の比率Dが第2の閾値より小さい場合に、当該オブジェクト領域は、文字オブジェクト領域であると判定する。図3(A)の例では、文字オブジェクトOb1、Ob2にそれぞれ対応する文字オブジェクト領域TA1、TA2が、スキャン画像SI内に特定されている。
なお、文字オブジェクト領域を特定する手法は、様々な公知の手法を採用することができ、公知の手法は、例えば、特開平5−225378号公報、特開2002−288589号公報に開示されている。
ステップS200(図2)では、文字画像生成部120は、特定された文字オブジェクト領域の文字二値データを生成する。具体的には、文字画像生成部120は、スキャンデータのうち、文字オブジェクト領域を表す部分画像データを取得(抽出)し、部分画像データに対して二値化処理を実行する。より具体的には、文字画像生成部120は、文字オブジェクト領域の周囲の領域の色(下地Bg1の色)を表すRGB値(BR、BG、GB)を算出する。次に、文字画像生成部120は、文字オブジェクト領域を構成する画素iの成分値(Ri、Gi、Bi)が、以下の式(1)〜式(3)を全て満たす場合には、画素iに対応する文字二値データの画素値を「0」とし、式(1)〜式(3)のいずれかを満たさない場合には、当該画素値を「1」とすることによって、文字二値データを生成する。
BR−ΔV<Ri<BR+ΔV ...(1)
BG−ΔV<Gi<BG+ΔV ...(2)
BB−ΔV<Bi<BB+ΔV ...(3)
文字二値データに内の画素値が「1」である画素は、文字を構成する文字構成画素であり、画素値が「0」である画素は、文字を構成しない非文字構成画素である。上記式(1)〜(3)から解るように、画素iの色が、周囲の領域の色と、ほぼ同じである場合(色値の差分がΔV未満である場合)には、画素iは、文字構成画素に分類される。画素iの色が、周囲の領域の色と、異なる場合(色値の差分がΔV以上である場合)には、画素iは、非文字構成画素に分類される。図3(C)では、スキャン画像SIの文字オブジェクト領域TA1,TA2に対応する文字二値データが表す二値画像TIA,TIBが示されている。
ステップS250(図2)では、文字画像生成部120は、文字オブジェクト領域の文字色を表す文字色値(RGB値)を特定する。具体的には、文字画像生成部120は、スキャン画像SIの文字オブジェクト領域において、文字二値データの複数の文字構成画素(文字構成画素群)に対応する文字領域を特定する。文字画像生成部120は、文字領域内の画素値(色値)の平均値を、文字色値として特定する。
ステップS300では、背景画像生成部130は、背景画像データ生成処理を実行する。背景画像データ生成処理によって、文字が消去された背景画像BIを表す背景画像データが生成される。図3(D)には、図3(A)に示すスキャン画像SI内の文字オブジェクトOb1、Ob2が消去されて、写真オブジェクトOb3と描画オブジェクトOb4とが残された背景画像BIが図示されている。背景画像データ生成処理の詳細は、後述する。
ステップS350では、圧縮部140は、ステップS200で生成された文字二値データを圧縮して、圧縮文字二値データを生成する。文字二値データが表す文字画像は、解像度を低下させるとエッジのがたつきが目立ち、視認性が悪化しやすい。圧縮部140は、二値画像データを、高い圧縮率で、かつ、解像度を低下させることなく圧縮できる可逆圧縮方式であるMMR(Modified Modified Read)方式(CCITT-G4方式とも呼ばれる。)を用いて、圧縮文字二値データを生成する。図3の例では、図3(C)に示す文字の二値画像TIA,TIBを表す2つの文字二値データが圧縮されて、2つの圧縮文字二値データが生成される。
ステップS400では、スキャナドライバ100は、圧縮文字二値データと文字色値と座標情報とを関連づけてPDFファイルに格納する。座標情報は、スキャン画像SI内での圧縮文字二値データによって表わされる文字二値画像の位置を表す。
ステップS450では、圧縮部140は、ステップS300で生成された背景画像データを圧縮して、圧縮背景画像データを生成する。背景画像データが表す背景画像BI(図3(D))は、文字を含んでおらず、写真や描画を含み得る多階調(256階調)画像である。圧縮部140は、このような多階調画像の圧縮に適したJPEG(Joint Photographic Experts Group)方式を用いて、背景画像データを圧縮する。
ここで、JPEG圧縮では、圧縮部140は、背景画像データを構成するRGB画素データをYCrCb画素データに変換する。圧縮部140は、背景画像データが表す背景画像BIを縦8画素×横8画素のブロックに分割し、ブロックごとに二次元離散コサイン変換を行なって縦方向8種×横方向8種の周波数成分を表すDCT係数に変換する。圧縮部140は、さらに、図示しない量子化テーブルに規定されている量子化閾値で各ブロックのDCT係数を除算することによって、各ブロックの量子化係数を取得する。圧縮部140は、得られた量子化係数を、所定の走査順に並べてハフマン符号化することによって、背景画像データを圧縮する。この説明から解るように、JPEG圧縮では、圧縮対象の画像データの均一性が高いほど、すなわち、各周波数成分が小さいほど、「0」になる量子化係数が増加するので、圧縮率が高くなる。
ステップS500では、スキャナドライバ100は、圧縮文字二値データ等が格納されたPDFファイル(ステップS400参照)に、圧縮背景画像データを格納して、本画像処理を終了する。PDFファイルは、複数の異なる形式の画像データを1つのファイルに格納可能である。また、PDFファイルは、当該ファイルに格納された画像データを表示する際には、格納された複数の画像データを重畳して1つの画像として再現可能である。ステップS400において、圧縮文字二値データと文字色値と座標情報とが、1つのPDFファイルに格納され、ステップS550において、圧縮背景画像データ該PDFファイルが格納されることによって、スキャン画像SIを表す高圧縮PDFデータが生成される。この結果、文字を含むスキャン画像SIは、文字がシャープで読みやすく、かつ、データ量が比較的小さい保存形態で、保存される。
A−3.背景画像データ生成処理:
図4は、背景画像データ生成処理(図2のS300)のフローチャートである。
ステップS305では、背景画像生成部130は、スキャン画像SI内の1つの文字オブジェクト領域を選択する。図3(A)の例では、スキャン画像SI内で特定された2つの文字オブジェクト領域TA1、TA2の中から、1つずつ処理対象の文字オブジェクト領域が選択される。
ステップS310では、算出部134は、選択された文字オブジェクト領域の色分布データ(ヒストグラム)を、RGBの3つの色成分について、それぞれ生成する。図5は、文字オブジェクト領域のヒストグラムの一例を示す図である。図5のヒストグラムHGは、横軸にR成分の階調値(R値)を取り、階調値を有する画素の数を縦軸にプロットした図である。
ステップS315では、算出部134は、文字色の分布の標準偏差を、色成分ごとに算出する。R成分(図5)を例に説明する。図5に示すように、文字オブジェクト領域のヒストグラムHGは、文字に対応するピークTP1と、背景に対応するピークTP2を含んでいる。算出部134は、文字オブジェクト領域内の文字領域(文字二値データにおける文字構成画素群に対応する領域)のR値の平均値を算出する。算出部134は、2つのピークTP1、TP2に対応する2つのR値のうち、算出された平均値に近いR値を特定する。特定されたR値は、文字構成画素群が有するR値の最頻値であるので、当該R値を文字代表値TCVと呼ぶ。算出部134は、文字代表値TCVを中心とした所定幅RGの範囲(文字色分布範囲とも呼ぶ)を決定する。文字色分布範囲の下限値Lthは、TCV−(RG/2)であり、文字色分布範囲の上限値Hthは、TCV+(RG/2)である(図5)。算出部134は、文字色分布範囲内のn個の画素のR値の標準偏差σを算出する。標準偏差σは、以下の式(4)を用いて算出される。なお、式(4)において、Raveは、文字色分布範囲RG内のn個の画素のR値の平均値である。
Figure 0005874497
ステップS320では、拡張文字領域決定部131は、文字のエッジがぼけることによる文字の膨張の程度を表す膨張レベルを決定する。具体的には、拡張文字領域決定部131の情報取得部132は、RGBの3つの成分について算出された3つの標準偏差σのうちの最大値σmaxを取得する。情報取得部132は、最大標準偏差σmaxにスキャンデータの解像度RSを乗じて、文字のぼけ度に関する指標値SLを算出する(SL=σmax×RS)。スキャンデータの解像度(単位は、dpi(dot per inch))は、例えば、スキャナ300ごとに決まっており、スキャナドライバ100は予め認識している。縦方向と横方向の解像度が異なる場合には、両方向の解像度の平均値が用いられる。拡張文字領域決定部131の周囲領域決定部133は、指標値SLに応じて、膨張レベルを決定する。
図6は、文字の膨張レベルについて説明する図である。図6(A)の表は、指標値SLと、膨張レベルとの対応関係を示している。本実施例では、図6(A)に示すように、膨張レベルは、指標値SLと、4つの閾値TH1〜TH4との比較結果に応じて、0から4までの5つのレベルのいずれかに決定される。具体的には、指標値SLが、第1閾値TH1以下である場合には、膨張レベルは、「0」に決定され、指標値SLが、第1閾値TH1より大きく、第2閾値TH2以下である場合には、膨張レベルは、「1」に決定される。また、指標値SLが、第2閾値TH2より大きく、第3閾値TH3以下である場合には、膨張レベルは、「2」に決定され、指標値SLが、第3閾値TH3より大きく、第4閾値TH4以下である場合には、膨張レベルは、「3」に決定され、指標値SLが、第4閾値TH4より大きい場合には、膨張レベルは、「4」に決定される。
ここで、指標値SLの技術的に意味について説明する。図6(B)(C)には、スキャン画像SIに含まれる文字の画像を概念的に示している。図6(B)(C)は、1色で表された文字を含む原稿を読み取って得られた文字画像の概略図を示している。スキャン画像SIに含まれる文字画像TI1(図6(B))、TI2(図6(C))に含まれる文字(アルファベットのT)は、原稿の文字の色とほぼ等しい色のコア領域CMと、コア領域CMを囲み、背景と文字との境界付近のエッジ領域BL1(図6(B))、BL2(図6(C))を含んでいる。エッジ領域BL1、BL2は、コア領域CMと背景との中間の色を有しており、図5のヒストグラムHGにおける文字に対応するピークTP1の裾部分FA(ハッチング)に対応している。
図6(B)には、文字のぼけ度が大きい場合のエッジ領域BL1が示され、図6(C)には、文字のぼけ度が小さい場合のエッジ領域BL2とが概念的に示されている。文字のぼけ度(ぼけの程度)が大きいほど、文字と背景との間のエッジが不明瞭となり(太くなり)、エッジ領域BL2が大きくなる(図6(B))。逆に文字TIのぼけ度の小さいほど、文字と背景との間のエッジが明瞭となり(細くなり)、エッジ領域BL1が小さくなる(図6(B))。
図7は、文字のぼけ度と、ヒストグラムとの関係を説明する図である。図7(A)は、文字のぼけ度が比較的大きい場合のR成分のヒストグラムを示している。図7(B)は、文字のぼけ度が比較的小さい場合のR成分のヒストグラムを示す。文字のぼけ度が比較的大きい場合には、ヒストグラムの広がり(分散や標準偏差で表される)は、比較的大きくなる。文字のぼけ度が比較的小さい場合には、ヒストグラムの広がりは、比較的小さくなる。したがって、最大標準偏差σmaxが大きいほど、文字のぼけ度は大きくなる。最大標準偏差σmaxは、文字のぼけ度、すなわち、エッジ領域(図6のBL1、BL2)の大きさ(幅)の程度を表す指標値と言うことができる。なお、文字のぼけ度は、文字の鮮鋭度が高いほど小さく、文字の鮮鋭度が低いほど大きい。従って、最大標準偏差σmaxの逆数TL(=1/σmax)は、文字の鮮鋭度を示す指標値と言うことが出来る。
ここで、ステップS320において最大標準偏差σmaxに解像度RSを乗じているのは、エッジ領域BLの大きさ(幅)を画素の大きさを基準にした値に補正するためである。解像度RSが高いほど、1つの画素の大きさ(幅)は小さくなる。従って、解像度RSが高いほど、最大標準偏差σmaxに解像度RSを乗じた指標値SL(画素の大きさを基準にしてエッジ領域BLの大きさの程度を表す値)は、大きくなる。具体的には、最大標準偏差σmaxは、エッジ領域の幅(実際の画像上の寸法)に対応している。しかし、膨張レベルは、後述するように、エッジ領域の幅に相当する画素数を定める値であるために、エッジ領域の幅を画素単位で表す必要がある。このために、本実施例では、最大標準偏差σmaxに解像度RSを乗じた指標値SLを、膨張レベルを定めるために用いている。
ステップS325では、周囲領域決定部133は、膨張レベルに応じて、文字領域を拡張するために使用するフィルタを決定する。図8は、文字領域を拡張するためのフィルタの例を示す図である。膨張レベルが0である場合には、フィルタは設定されない(すなわち、後述する文字領域の拡張は、実行されない)。膨張レベルが1である場合には、使用するフィルタは、縦3画素×横3画素のサイズのフィルタF1(図8(A))に決定される。膨張レベルが2である場合には、使用するフィルタは、縦5画素×横5画素のサイズのフィルタF2(図8(B))に決定される。膨張レベルが3または4である場合には、使用するフィルタは、縦7画素×横7画素のサイズのフィルタF3(図8(C))に決定される。
ステップS330では、拡張文字領域決定部131は、処理対象の文字オブジェクト領域の文字二値データに対して、決定されたフィルタを適用して、拡張文字二値データを生成する。図9は、拡張文字二値データの生成について説明する図である。図9(A)は、フィルタが適用される前の文字二値データによって表される二値画像TIS1を示している。図9(B)は、フィルタが適用された後の文字二値データ(拡張文字二値データ)によって表される拡張文字二値画像TIS2を示している。図9(A)内のハッチングされた領域は、文字構成画素群(画素値「1」の画素群)に対応する文字領域OTAを示し、文字領域OTA以外の領域は、非文字構成画素群(画素値「0」の画素群)に対応する非文字領域を示している。拡張文字領域決定部131は、文字二値データが表す文字二値画像TISを構成する複数の画素を、1つずつ順次に注目画素として選択する。拡張文字領域決定部131は、注目画素とフィルタの中央画素CPが同じ位置になるように、文字二値画像TISとフィルタとを重ねた場合に、フィルタの範囲(中央画素CPを含む全範囲)内に文字構成画素(画素値「1」)があるか否かを判断する。拡張文字領域決定部131は、フィルタの範囲内に文字構成画素がある場合には、注目画素に設定された画素の画素値を「1」に設定する。拡張文字領域決定部131は、フィルタの範囲内に文字構成画素がない場合、すなわち、フィルタの範囲内の画素が全て非文字構成画素である場合には、注目画素に設定された画素の画素値を「1」にに設定する(画素値を「0」に維持する)。
フィルタが適用された後の文字二値データ(拡張文字二値データ)が表す文字二値画像TIS2の文字領域WTA(拡張文字領域)は、フィルタが適用される前の文字領域OTAに対応する領域TPAと、文字領域TPAの周囲領域CPAと、を含む。周囲領域CPAの幅CW、すなわち、周囲領域CPAのサイズは、適用されたフィルタのサイズによって決定される。例えば、フィルタF1(図8(A))が適用された場合には、幅CWは1画素分であり、フィルタF2(図8(B))が適用された場合には、幅CWは2画素分であり、フィルタF3(図8(C))が適用された場合には、幅CWは3画素分である。
ステップS335(図4)では、変更部136は、拡張文字二値データを用いて、スキャン画像SI(文字オブジェクト領域)の拡張文字領域の色を変更する。図9(C)は、上述した拡張文字二値画像TIS2(図9(B))に対応するスキャン画像SIの部分画像PSIを示している。図9(C)には、拡張文字二値画像TIS2の拡張文字領域WTAに対応するスキャン画像SIの領域DA(スキャン画像SIの拡張文字領域DAとも呼ぶ)が、示されている。この拡張文字領域DAは、スキャン画像SIの文字TO(文字領域PDA2)と、当該文字領域PDA2の周囲の周囲領域PDA1を含む。先ず、変更部136は、拡張文字二値データを用いて、スキャン画像SI(文字オブジェクト領域)の複数の非文字構成画素を特定する。変更部136は、文字オブジェクト領域の全ての非文字構成画素の画素値(色値)の平均値を、背景色値として特定する。変更部136は、拡張文字二値データにおける拡張文字領域WTAに対応する領域(スキャン画像SIの拡張文字領域DA)を特定する。変更部136は、スキャン画像SIの拡張文字領域DAを構成する全ての画素の画素値(色値)を、背景色値に変更する。この結果、スキャン画像SI内の処理対象の文字オブジェクト領域の文字が消去される、すなわち、背景画像BIを表す背景画像データが生成される。
図9(D)は、スキャン画像SIの拡張文字領域DAの色が背景色に変更された後の画像、すなわち、背景画像BIの部分画像PSIを示している。図9(D)には、背景画像BIの色が変更された領域EA(背景画像BIの拡張文字領域EAとも呼ぶ)が示されている。背景画像BIの拡張文字領域EAは、スキャン画像SIの文字TOに対応する領域PEA2と、当該領域PEA2の周囲の周囲領域PEA1を含むことが解る。
ステップS340では、背景画像生成部130は、補正条件が満たされたか否かを判断する。補正条件は、文字のぼけ度が基準以上であること(本実施例では、ステップS320で指標値SLに応じて決定された膨張レベルが「4」であること)である。背景画像生成部130は、補正条件が満たされている場合には(ステップS340:YES)、補正フラグを「ON」に設定して(ステップS345)、ステップS350に処理を移行する。背景画像生成部130は、補正条件が満たされていない場合には(ステップS340:NO)、補正フラグを「ON」に設定することなく、ステップS350に処理を移行する。なお、補正フラグの初期値は、「OFF」である。
ステップS350では、背景画像生成部130は、全ての文字オブジェクト領域を選択したか否かを判断する。背景画像生成部130は、全ての文字オブジェクト領域が選択されていない場合には(ステップS350:NO)、ステップS305に戻って、未選択の文字オブジェクト領域を選択して、上述したステップS310〜S345の処理を繰り返す。背景画像生成部130は、全ての文字オブジェクト領域が選択された場合には(ステップS350:YES)、ステップS360に処理を移行する。
ステップS360に移行した時点で、背景画像生成部130によって、スキャン画像SIから文字オブジェクトが全て消去された背景画像BI(図3(D))を表す背景画像データが最終的に生成される。図3(D)に示すように、背景画像BIは、下地Bg1とともに、写真オブジェクトOb3や描画オブジェクトOb4を含み得るが、文字オブジェクトOb1、Ob2を含まない。
ステップS360では、背景画像生成部130は、補正フラグが「ON」に設定されているか否かを判断する。補正フラグが「ON」に設定されていない場合には(ステップS360:NO)、背景画像生成部130は、背景画像データ生成処理を終了する。補正フラグが「ON」に設定されている場合には(ステップS360:YES)、補正部137は、背景画像データに対して色数低減補正を実行する(ステップS365)。具体的には、補正部137は、背景画像データに含まれる各画素データの画素値(RGBの各値)を、以下の式(5)を用いて補正する。
Vb=K×ROUND(Va/K)...(5)
式(5)において、Vaは、補正前の画素値であり、Vbは、補正後の画素値である。式(5)において、Kは、色数低減係数であり、Kの値が大きいほど、色数が減少する。本実施例では、K=4とする。ROUND(引数)は、引数の小数点以下第1位を四捨五入して、当該引数を整数にする関数である。この色数低減補正によって、連続するK個ずつの階調値が1つの階調値に変更されて、背景画像データに含まれる色数(階調値の種類数)が減少する。色数低減補正が実行されると、背景画像生成部130は、背景画像データ生成処理を終了する。
以上説明した本実施例によれば、スキャン画像SIの各文字オブジェクト領域(図3(A):TA1、TA2)内の文字領域PDA2と、当該文字領域PDA2の周囲の周囲領域PDA1と、を含む拡張文字領域DA(図9(C))の色を、背景色に変更して、背景画像データを生成する。スキャン画像SIの周囲領域PDA1のサイズ(背景画像BIのPEA1のサイズ)は、文字の鮮鋭度に関する特徴値に応じて、より具体的には、文字のぼけ度を示す指標値SLに応じて、決定される。この結果、拡張文字領域決定部131は、文字の鮮鋭度(あるいは文字のぼけ度)に応じた適切な拡張文字領域DAを決定できるので、高圧縮PDFファイルを用いてスキャン画像SIを再現した再現画像における文字の見栄えの低下を抑制することができる。すなわち、背景画像データを生成する際に、スキャン画像SIの周囲領域PDA1の色を背景色に変更しない場合には、文字のぼけ度によっては、背景画像BIの周囲領域PEA1(図9(D))に、文字のぼけたエッジ(図6(B):BL1、BL2)が残る場合がある。そうすると、背景画像データと、文字二値データと、を用いた再現画像において、文字二値データによってクリアに再現された文字画像のエッジ近傍に、ぼけたエッジが表れ、再現画像における文字の見栄えが低下する可能性がある。本実施例は、スキャン画像SI内の文字領域PDA2の周囲の周囲領域PDA1の色を背景色に変更することよって、背景画像BIに文字のぼけたエッジが残る可能性を低減することができる。
なお、背景画像BIにおいて、例えば、文字オブジェクト領域の背景部分にムラが生じている場合などに、背景色に変更された周囲領域PEA1と、他の背景との境界部分SUA(図9(D))に、元のスキャン画像SIにはないエッジが現れる可能性がある。このようなエッジは、周囲領域PEA1のサイズ(幅CW(図9(D)))が大きいほど目立ちやすい(再現画像において、文字のエッジが二重線に見える)。このために、周囲領域PEA1のサイズは、文字のぼけたエッジを残さない範囲で、できるだけ小さいことが好ましい。本実施例の拡張文字領域決定部131は、文字のぼけ度に応じた適切なサイズの周囲領域PEA1を決定できるので、再現画像内の文字の見栄えの低下をさらに抑制することができる。
さらに、背景画像BIの周囲領域PEA1に、文字のぼけたエッジが残っていると、背景画像BIの均一性が低下して、背景画像BIの周波数成分が増大する。この結果、背景画像BIを表す背景画像データがJPEG方式で圧縮された際に、圧縮率が低下する可能性がある。本実施例では、背景画像BIに文字のぼけたエッジが残る可能性を低減して、背景画像データの圧縮率を向上することができる。
さらに、本実施例では、算出部134が、文字のぼけ度に関する特徴値として、文字オブジェクト領域における文字色の分布の標準偏差σを3つの色成分のそれぞれについて算出している。周囲領域決定部133は、3つの標準偏差σのうちの最大標準偏差σmaxに応じて、文字二値画像TISの周囲領域CPAのサイズ(すなわち、背景画像BIの周囲領域PEA1のサイズ)を決定している。この結果、適切なサイズの周囲領域PEA1を決定することができる。以上の説明から解るように、最大標準偏差σmaxは、文字の鮮鋭度やぼけ度に関する特徴値の例である。
さらに、本実施例では、背景画像BIの周囲領域PEA1のサイズが過度に大きいと、再現画像において、例えば、図9(D)の境界部分SUAにおいて、元のスキャン画像SIにはないエッジが目立ち得ることから、周囲領域PEA1のサイズに上限(図8(C)のフィルタF3に対応するサイズ)を設けている。そして、文字のぼけ度を表す指標値SLが閾値TH4より大きい場合、すなわち、膨張レベルが「4」に決定された場合には、周囲領域PEA1のサイズを上限に決定するとともに、背景画像データに対して色数低減補正を実行している。色数低減補正によって、背景画像BIの周囲領域PEA1の色と、周囲領域PEA1の周囲を囲む領域の色との差を補正前より小さくなる。この結果、背景画像BI内の周囲領域PEA1のさらに外側に文字のぼけたエッジが残っている場合に、当該エッジを目立たなくすることができる。この結果、再現画像内の文字の見栄えの低下を、さらに、抑制することができる。また、当該色数低減補正によって、背景画像BIに内の周囲領域PEA1のさらに外側に文字のぼけたエッジが残っている場合に、当該エッジ部分の均一性を向上することができるので、背景画像データの圧縮率を向上することができる。
B.第2実施例:
B−1:計算機200の構成:
第2実施例の拡張文字領域決定部131は、文字オブジェクト領域の文字の色に応じて、周囲領域PEA1のサイズを決定する。具体的には、第2実施例の拡張文字領域決定部131は、文字色特定部135を備えている(図1:破線)。また、第2実施例の計算機200の外部記憶装置290には、特性データ293が格納されている。
図10は、特性データ293について説明する図である。図10(A)は、特性データ293の一例を示し、図10(B)は、色ブロックが定義されたRGB色空間SCPを示す。特性データ293は、文字の色と、文字のぼけ度を表す上述した標準偏差σとを対応付けたテーブルである。具体的には、特性データ293では、文字の色が取り得る色値が複数の色ブロックCBに分割され、各色ブロックCBに、標準偏差σが対応付けられている(図10(A))。スキャンデータの画素値は、図10(B)に示すRGB色空間SCPにおける座標によって、色を表している。複数の色ブロックCBは、3次元直交座標系でRGB色空間SCPを表現した場合に立方体で表される色域を、4×4×4個(64個)に等分割したブロックである。ここでは、3つの色成分の階調値を、それぞれ4つのグループ、すなわち、グループ0(0〜63)、グループ1(64〜127)、グループ2(128〜191)、グループ3(192〜255)に分けた場合のグループ番号0〜3を用いて、各色ブロックCBを表現する。例えば、原点(黒色)を含む色ブロックは、R値が(0〜64)、G値が(0〜64)、B値が(0〜64)の範囲に相当する色ブロックであるので、色ブロックCB(0、0、0)と表現される(図10(B))。また、白色(255、255、255)を含む色ブロックは、色ブロックCB(3、3、3)と表現される(図10(B))。
B−2:背景画像データ生成処理:
図4を参照して、第2実施例の背景画像データ生成処理について説明する。第2実施例における背景画像データ生成処理では、第1実施例における背景画像データ生成処理のステップS315とS320とに代えて、図4に破線で示すステップS315BとS320BとS322Bとを実行する。その他の処理は、第1実施例における背景画像データ生成処理と同一である。
ステップS315Bでは、文字色特定部135は、処理対象の文字オブジェクト領域の文字色値(RGB値)を特定する。具体的には、文字色特定部135は、処理対象の文字オブジェクト領域において、文字二値データの複数の文字構成画素に対応する文字領域を特定する。文字画像生成部120は、文字領域内の画素値(色値)の平均値を、文字色値として特定する。
ステップS320Bでは、情報取得部132は、文字色値に応じて、特性データ293から標準偏差σを取得する。具体的には、情報取得部132は、文字色値が属する色ブロックCB(図10(B))を特定し、特定された色ブロックCBに対応付けられた標準偏差σを特性データ293から取得する。
ステップS322Bでは、拡張文字領域決定部131は、特性データ293から取得された標準偏差σとスキャンデータの解像度RSから膨張レベルを決定する。具体的には、拡張文字領域決定部131は、標準偏差σと解像度RSを乗じて指標値SL(=σ×RS)を取得し、取得された指標値SLに応じて膨張レベルを決定する(図6(A)参照)。
B−3:特性データ293の作成方法:
特性データ293の作成方法について説明する。特性データ293は、例えば、スキャナドライバ100の提供者(スキャナ300の製造者など)によって、生成装置を用いて作成される。生成装置は、例えば、スキャナ300と接続された計算機(パーソナルコンピュータなど)である。図11は、特性データ293を作成する特定データ生成処理のフローチャートである。
ステップS610では、生成装置は、スキャナ300を制御して、標準原稿500を読み取ることにより標準スキャンデータを生成する。図12は、標準原稿500の一例を表す図である。標準原稿500には、上述した4×4×4個(64個)の色ブロックCBにそれぞれ対応する64本のカラーラインCLが印刷されている。各カラーラインCLは、対応する色ブロックCBの代表色で印刷されている。色ブロックCBの代表色は、例えば、RGB色空間SCP内の各色ブロックCBの中心に位置する色値で表される。例えば、図10(B)に示すように、色ブロックCB(0、0、0)の代表色は、色ブロックCB(0、0、0)の中心CC(32、32、32)で表される色である。カラーラインCLは、例えば、文字を構成する一般的な線と同程度の太さを有している。
ステップS620では、生成装置は、標準スキャンデータを用いて各カラーラインCLのヒストグラムの標準偏差σを算出する。具体的には、生成装置は、標準スキャンデータが表すスキャン画像(標準スキャン画像)内の、処理対象の1本のカラーラインCLを含むライン領域を特定し、当該ライン領域のヒストグラムを算出する。ライン領域のヒストグラムは、図5に示す文字オブジェクト領域のヒストグラムに類似しており、カラーラインCLに対応するピークと、背景に対応するピークとを含む。生成装置は、カラーラインCLに対応するピークを中心とした所定範囲におけるヒストグラムの標準偏差σを算出する。生成装置は、64本のカラーラインCLにそれぞれ対応する64個の標準偏差σをそれぞれ算出する。
ステップS630では、生成装置は、64個の色ブロックCBと、64個の標準偏差σとの組み合わせが記録された特性データ293を生成する。具体的には、生成装置は、各カラーラインCLに対応する色ブロックCBと、当該カラーラインCLに対応する標準偏差σとを対応付けて、特性データ293を作成する。
以上説明した第2実施例によれば、周囲領域決定部133は、文字色値に応じて、背景画像BIの周囲領域PEA1のサイズを決定するので、適切な拡張文字領域を決定することができる。文字のぼけ度は、文字オブジェクト領域の文字の色によって異なり得るので、文字色値は、文字のぼけ度に関する関連情報、文字の鮮鋭度に関する関連情報と言うことができる。
また、第2実施例の計算機200は、外部記憶装置290に特性データ293を格納している。文字のぼけ度は、画像読取装置(例えば、スキャナ300)に固有の特性によって異なり得る。特性データ293は、スキャナ300を用いて生成された標準スキャンデータに基づいて作成されている。すなわち、特性データ293に記録された標準偏差σは、スキャナ300(画像読取装置)の特性に応じた設定値である。上記実施例によれば、スキャナ300の特性に応じた標準偏差σに応じて周囲領域PEA1のサイズを決定するので、適切な拡張文字領域を決定することができる。特性データ293には、スキャナ300の機種(型番)ごとに異なる値が設定されても良いし、同じ機種であっても個体ごとに異なる値が設定されても良い。
C.変形例:
(1)上記第2実施例の特性データ293は、スキャナ300の装置特性に応じたぼけ度を表す値として、複数の色ブロックCBに対応付けられた複数の標準偏差σを含んでいるが、装置ごとに1つの標準偏差σのみを含んでいても良い。この場合には、例えば、上述した特定データ生成処理(図11)に、破線で示すステップS640が追加される。ステップS640では、生成装置は、各カラーラインCLについて算出された複数の標準偏差σの平均値σaveを算出する。そして、平均値σaveが、特性データ293に記録される。この場合には、図4の背景画像データ生成処理のステップS315B、320Bでは、文字色値が特定されることなく、文字色値とは無関係に1つの平均値σaveが取得される。
(2)上記実施例における色数低減補正(図4:S365)は、背景画像BIの全体に対して行われる必要はなく、背景画像BIの一部に対して行われても良い。例えば、補正部137は、背景画像BI(図3(D))のうち、写真オブジェクトOb3や描画オブジェクトOb4が配置された領域を除いた領域に対して、色数低減補正を実行しても良い。一般的言えば、色数低減補正は、背景画像BIにおける拡張文字領域EAの色と拡張文字領域EAの周囲を囲む領域の色との差を補正前より小さくするように、拡張文字領域EAの一部と、拡張文字領域EAの周囲の領域の一部と、を少なくとも含む領域に対して実行されることが好ましい。
(3)上記実施例における色数低減補正は、一例であり、他の各種の補正が採用され得る。補正部は、例えば、色数低減補正に代えて、平均値フィルタを用いた補正、メディアンフィルタを用いた補正、白色均一化補正などが採用され得る。平均値フィルタを用いた補正は、縦3画素×横3画素などの所定サイズのフィルタの中央画素の画素値(RGBの各値)を、フィルタ範囲内の複数の画素値の平均値に変更する補正である。メディアンフィルタを用いた補正は、所定サイズのフィルタの中央画素の画素値を、フィルタ範囲内の複数の画素値の中央値に変更する補正である。白色均一化補正は、白色に近似する所定範囲の色を、白色に置き換える補正である。例えば、RGB画素データで構成された画像に対する白均一化補正では、補正部137は、補正前の画素値に対して1以上の所定の係数(例えば、1.1)を乗じた値を、補正後の画素値に設定する。ただし、補正部137は、所定の係数を乗じた値が最大値(255)を超える場合には、最大値を補正後の画素値に設定する。白均一化補正は、背景画像BIの文字オブジェクト領域の背景色が、白または白に近似する色である場合に、実行されることが好ましい。一般的には、補正部137は、背景画像BIにおける拡張文字領域EAの色と、拡張文字領域EAの周囲を囲む領域の色と、の差を補正前より小さくするように、背景画像BIの色を補正することが好ましい。
(4)第1実施例では、文字オブジェクト領域のヒストグラムを用いて算出された標準偏差σが、第2実施例では、文字色値、および、特性データ293に記述された標準偏差が、文字のぼけ度に関する関連情報(文字の鮮鋭度に関する関連情報とも言える)としてそれぞれ用いられている。これに代えて、当該関連情報には、文字オブジェクト画像のヒストグラムにおけるピークの広がりと相関のある他の統計量、例えば、文字構成画素数とピークの高さの比などが用いられても良い。また、当該関連情報には、スキャンデータの生成に用いられた画像読取装置(スキャナ300など)の特性、例えば、光学センサ(CCDなど)や光源の特性を含む装置特性、特に、文字のぼけ度に相関のある装置特性を表す情報が用いられても良い。
(5)上記各実施例において、計算機200のスキャナドライバ100が備える画像処理機能は、スキャナ300や、複合機などの画像読取部を有する装置、あるいは、デジタルカメラなどの光学的な画像データ生成部を有する装置に備えられても良い。この場合には、例えば、当該画像処理機能を備える複合機やスキャナは、自身が有する画像読取部を用いて生成したスキャンデータに対して画像処理を行って、処理済み画像データ(例えば、高圧縮PDFデータ)を生成し、当該処理済み画像データを、通信可能に接続された計算機(パーソナルコンピュータなど)に出力しても良い。
一般的に言えば、スキャナドライバ100の画像処理機能を実現する装置は、計算機200に限らず、複合機、デジタルカメラ、スキャナなどによって実現されても良い。また、当該画像処理機能は、1つの装置で実現されても良いし、ネットワークを介して接続された複数の装置によって、実現されても良い。この場合には、当該画像処理機能を実現する複数の装置を備えるシステムが、画像処理装置に相当する。
(6)上記実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部をハードウェアに置き換えるようにしてもよい。
以上、実施例、変形例に基づき本発明について説明してきたが、上記した発明の実施の形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれる。
200...複合機、210...CPU、240...内部記憶装置、270...操作部、280...通信部、290...外部記憶装置、291...ドライバプログラム、100...スキャナドライバ

Claims (7)

  1. 画像処理装置であって、
    文字を含む対象画像を表す対象画像データを用いて、文字画像を表す文字画像データを生成する文字画像生成部と、
    前記対象画像データを用いて、前記対象画像内の前記文字画像の色が変更された背景画像を表す背景画像データを生成する背景画像生成部と、
    を備え、
    前記背景画像生成部は、
    前記対象画像に含まれる拡張文字領域であって、前記対象画像のうち、前記文字画像の文字を構成する画素群に対応する文字領域と、前記対象画像のうち、前記文字領域の周囲の周囲領域と、を含む前記拡張文字領域を決定する拡張文字領域決定部と、
    前記拡張文字領域の色を、前記対象画像の背景の色に変更する変更部と、
    を備え、
    前記対象画像データは、3つの色成分で構成され、
    前記拡張文字領域決定部は、
    前記対象画像に含まれる文字の鮮鋭度に関する特徴値を、前記3つの色成分のそれぞれについて算出する算出部と、
    前記3つの色成分に対応する3つの前記特徴値を含む関連情報を取得する取得部と、
    前記関連情報に含まれる前記3つの色成分に対応する前記3つの特徴値のうち、文字の鮮鋭度が最も低いことを示す1つの色成分に対応する1つの特徴値に応じて、前記周囲領域のサイズを決定する周囲領域決定部と、
    を備える、画像処理装置。
  2. 画像処理装置であって、
    文字を含む対象画像を表す対象画像データを用いて、文字画像を表す文字画像データを生成する文字画像生成部と、
    前記対象画像データを用いて、前記対象画像内の前記文字画像の色が変更された背景画像を表す背景画像データを生成する背景画像生成部と、
    を備え、
    前記背景画像生成部は、
    前記対象画像に含まれる拡張文字領域であって、前記対象画像のうち、前記文字画像の文字を構成する画素群に対応する文字領域と、前記対象画像のうち、前記文字領域の周囲の周囲領域と、を含む前記拡張文字領域を決定する拡張文字領域決定部と、
    前記拡張文字領域の色を、前記対象画像の背景の色に変更する変更部と、
    を備え、
    前記拡張文字領域決定部は、
    前記対象画像に含まれる文字の鮮鋭度に関する関連情報を取得する取得部と、
    前記関連情報に応じて、前記周囲領域のサイズを決定する周囲領域決定部であって、前記関連情報が所定条件を満たす場合に、前記周囲領域のサイズを上限値に決定する、前記周囲領域決定部と、
    を備え
    前記背景画像生成部は、さらに、
    前記関連情報が前記所定条件を満たす場合に、前記変更部によって前記拡張文字領域の色が変更された後の前記対象画像データに対して補正処理を実行する補正部であって、前記補正処理は、前記拡張文字領域の変更後の色と前記拡張文字領域の周囲の領域の色との差を、補正前よりも小さくする処理である、前記補正部を備える、画像処理装置。
  3. 請求項に記載の画像処理装置であって、
    前記拡張文字領域決定部は、さらに、
    前記対象画像に含まれる文字の鮮鋭度に関する特徴値を算出する算出部を備え、
    前記取得部は、前記特徴値を含む前記関連情報を取得する、画像処理装置。
  4. 請求項1ないし請求項3のいずれかに記載の画像処理装置であって、
    前記拡張文字領域決定部は、さらに、
    前記対象画像に含まれる文字の色を表す文字色値を特定する文字色特定部を備え、
    前記取得部は、前記文字色値を含む前記関連情報を取得する、画像処理装置。
  5. 請求項1ないし請求項4のいずれかに記載の画像処理装置であって、
    前記対象画像データは、原稿を光学的に読み取る画像読取装置によって生成され、
    前記取得部は、前記画像読取装置の特性に応じた設定値を含む前記関連情報を取得する、画像処理装置。
  6. 画像処理プログラムであって、
    文字を含む対象画像を表す対象画像データを用いて、文字画像を表す文字画像データを生成する文字画像生成機能と、
    前記対象画像データを用いて、前記対象画像内の前記文字画像の色が変更された背景画像を表す背景画像データを生成する背景画像生成機能と、
    をコンピュータに実現させ、
    前記背景画像生成機能は、
    前記対象画像に含まれる拡張文字領域であって、前記対象画像のうち、前記文字画像の文字を構成する画素群に対応する文字領域と、前記対象画像のうち、前記文字領域の周囲の周囲領域と、を含む前記拡張文字領域を決定する拡張文字領域決定機能と、
    前記拡張文字領域の色を、前記対象画像の背景の色に変更する変更機能と、
    を備え、
    前記対象画像データは、3つの色成分で構成され、
    前記拡張文字領域決定機能は、
    前記対象画像に含まれる文字の鮮鋭度に関する特徴値を、前記3つの色成分のそれぞれについて算出する算出機能と、
    前記3つの色成分に対応する3つの前記特徴値を含む関連情報を取得する取得機能と、
    前記関連情報に含まれる前記3つの色成分に対応する前記3つの特徴値のうち、文字の鮮鋭度が最も低いことを示す1つの色成分に対応する1つの特徴値に応じて、前記周囲領域のサイズを決定する周囲領域決定機能と、
    を備える、画像処理プログラム。
  7. 画像処理プログラムであって、
    文字を含む対象画像を表す対象画像データを用いて、文字画像を表す文字画像データを生成する文字画像生成機能と、
    前記対象画像データを用いて、前記対象画像内の前記文字画像の色が変更された背景画像を表す背景画像データを生成する背景画像生成機能と、
    をコンピュータに実現させ、
    前記背景画像生成機能は、
    前記対象画像に含まれる拡張文字領域であって、前記対象画像のうち、前記文字画像の文字を構成する画素群に対応する文字領域と、前記対象画像のうち、前記文字領域の周囲の周囲領域と、を含む前記拡張文字領域を決定する拡張文字領域決定機能と、
    前記拡張文字領域の色を、前記対象画像の背景の色に変更する変更機能と、
    を備え、
    前記拡張文字領域決定機能は、
    前記対象画像に含まれる文字の鮮鋭度に関する関連情報を取得する取得機能と、
    前記関連情報に応じて、前記周囲領域のサイズを決定する周囲領域決定機能であって、前記関連情報が所定条件を満たす場合に、前記周囲領域のサイズを上限値に決定する、前記周囲領域決定機能と、
    を備え
    前記背景画像生成機能は、さらに、
    前記関連情報が前記所定条件を満たす場合に、前記変更機能によって前記拡張文字領域の色が変更された後の前記対象画像データに対して補正処理を実行する補正機能であって、前記補正処理は、前記拡張文字領域の変更後の色と前記拡張文字領域の周囲の領域の色との差を、補正前よりも小さくする処理である、前記補正機能を備える、画像処理プログラム。
JP2012080288A 2012-03-30 2012-03-30 画像処理装置および画像処理プログラム Active JP5874497B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012080288A JP5874497B2 (ja) 2012-03-30 2012-03-30 画像処理装置および画像処理プログラム
US13/838,912 US9014468B2 (en) 2012-03-30 2013-03-15 Image processing apparatus, computer-readable storage medium storing computer-readable instructions and associated method
EP13160218.7A EP2645697B1 (en) 2012-03-30 2013-03-20 Image processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012080288A JP5874497B2 (ja) 2012-03-30 2012-03-30 画像処理装置および画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2013210817A JP2013210817A (ja) 2013-10-10
JP5874497B2 true JP5874497B2 (ja) 2016-03-02

Family

ID=48050436

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012080288A Active JP5874497B2 (ja) 2012-03-30 2012-03-30 画像処理装置および画像処理プログラム

Country Status (3)

Country Link
US (1) US9014468B2 (ja)
EP (1) EP2645697B1 (ja)
JP (1) JP5874497B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9554897B2 (en) 2011-04-28 2017-01-31 Neovasc Tiara Inc. Methods and apparatus for engaging a valve prosthesis with tissue
JP2014068274A (ja) * 2012-09-26 2014-04-17 Olympus Imaging Corp 画像編集装置、画像編集方法、およびプログラム
JP6693701B2 (ja) * 2015-02-13 2020-05-13 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法及びコンピュータプログラム
US9466001B1 (en) * 2015-04-07 2016-10-11 Toshiba Tec Kabushiki Kaisha Image processing apparatus and computer-readable storage medium
JP6433384B2 (ja) * 2015-07-01 2018-12-05 キヤノン株式会社 画像処理装置および画像処理方法
JP6436358B2 (ja) * 2016-03-03 2018-12-12 京セラドキュメントソリューションズ株式会社 画像形成装置
JP7039882B2 (ja) * 2017-08-16 2022-03-23 富士フイルムビジネスイノベーション株式会社 画像解析装置及び画像解析プログラム
JP6939449B2 (ja) * 2017-11-14 2021-09-22 株式会社リコー 画像処理装置、画像処理方法および画像処理プログラム
JP7248942B2 (ja) * 2018-09-28 2023-03-30 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
JP7205292B2 (ja) * 2019-02-26 2023-01-17 京セラドキュメントソリューションズ株式会社 情報処理装置及び画像形成装置
CN111861991B (zh) * 2020-06-11 2024-05-24 北京百度网讯科技有限公司 计算图像清晰度的方法以及装置
JP7543014B2 (ja) 2020-07-17 2024-09-02 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2611012B2 (ja) 1989-09-19 1997-05-21 日本電信電話株式会社 文字分離符号化方法
JPH05225378A (ja) 1991-06-03 1993-09-03 Fujitsu Ltd 文書画像の領域分割システム
JPH1139486A (ja) * 1997-07-24 1999-02-12 Ricoh Co Ltd 画像の画質評価方法
JP2000030052A (ja) * 1998-07-13 2000-01-28 Oki Electric Ind Co Ltd 画像処理装置
JP3501031B2 (ja) 1999-08-24 2004-02-23 日本電気株式会社 画像領域判定装置、画像領域判定方法及びそのプログラムを記憶した記憶媒体
JP4374686B2 (ja) * 1999-12-03 2009-12-02 ノーリツ鋼機株式会社 画像の鮮鋭度判断方法、画像の鮮鋭度を判断する処理を行うためのプログラムを記録した記録媒体、画像処理装置および写真焼付装置
JP2001309170A (ja) * 2000-04-25 2001-11-02 Sharp Corp 画像処理装置
JP4558232B2 (ja) 2001-03-26 2010-10-06 株式会社リコー 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003046746A (ja) 2001-07-31 2003-02-14 Canon Inc 画像処理方法及び画像処理装置
US7236641B2 (en) * 2002-07-01 2007-06-26 Xerox Corporation Page background detection and neutrality on scanned documents
JP2004320448A (ja) * 2003-04-16 2004-11-11 Ricoh Co Ltd 画像処理装置、画像処理システム、およびコンピュータが実行するためのプログラム
JP4383157B2 (ja) 2003-05-15 2009-12-16 株式会社リコー 画像処理装置、プログラム及び記憶媒体
JP4235583B2 (ja) 2003-05-26 2009-03-11 株式会社リコー 画像処理装置、画像処理用プログラム及び記憶媒体
EP1555804A3 (en) 2004-01-19 2006-08-16 Ricoh Company, Ltd. Image processing apparatus, image processing program and storage medium
JP2006093880A (ja) 2004-09-21 2006-04-06 Canon Inc 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
US7965412B2 (en) * 2006-02-17 2011-06-21 Primax Electronics Ltd. Image processing system and method thereof for processing an image data
US8068684B2 (en) * 2007-05-04 2011-11-29 I.R.I.S. Compression of digital images of scanned documents
US7991229B2 (en) * 2007-08-28 2011-08-02 Seiko Epson Corporation Reducing compression artifacts in multi-layer images
KR101566196B1 (ko) * 2009-03-02 2015-11-05 삼성전자주식회사 히스토그램 분석을 이용한 영상 분류 방법 및 장치, 이를 이용한 문자 인식 방법 및 장치

Also Published As

Publication number Publication date
US20130259366A1 (en) 2013-10-03
US9014468B2 (en) 2015-04-21
JP2013210817A (ja) 2013-10-10
EP2645697A3 (en) 2017-11-01
EP2645697B1 (en) 2019-01-02
EP2645697A2 (en) 2013-10-02

Similar Documents

Publication Publication Date Title
JP5874497B2 (ja) 画像処理装置および画像処理プログラム
JP5958023B2 (ja) 画像処理装置および画像処理プログラム
JP5935454B2 (ja) 画像処理装置および画像処理プログラム
JP5939154B2 (ja) 画像処理装置およびコンピュータプログラム
JP4814217B2 (ja) 画像を低ダイナミックレンジから高ダイナミックレンジに変換するシステム及びコンピュータプログラム
JP3828210B2 (ja) 画像コントラスト強化方法
JP5116393B2 (ja) 画像処理装置及び画像処理方法
JP5886265B2 (ja) 携帯端末装置、プログラム、及び記録媒体
JP2020160616A (ja) 生成装置、コンピュータプログラム、生成方法
US9088754B2 (en) Image processing device determining characteristic quantity relating to number of colors
JP2005045404A (ja) 画像処理装置、画像処理方法およびプログラム
CN103716506B (zh) 图像处理装置及图像处理方法
US6665447B1 (en) Method for enhancing image data by sharpening
JP5942546B2 (ja) 画像処理装置
JP5884605B2 (ja) 画像処理装置およびプログラム
JP2005284423A (ja) 画像処理装置、および、画像処理方法
US8532404B2 (en) Image processing apparatus, image processing method and computer-readable medium
US9582744B2 (en) Image processing device and computer-readable medium using photographic and non-photographic correspondence data
JP5116873B2 (ja) 画像処理装置及び画像処理方法
JP7451187B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP3926685B2 (ja) 画像処理装置
JP2006050155A (ja) 画像の鮮鋭化装置および方法、画像の鮮鋭化装置を用いた電子機器及び鮮鋭化プログラム、及びそのプログラムを記録した記録媒体
JP2014072750A (ja) 画像処理装置およびコンピュータプログラム
JP2020077998A (ja) 画像処理装置、および、コンピュータプログラム
JP2011135301A (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150123

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160104

R150 Certificate of patent or registration of utility model

Ref document number: 5874497

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150