JP5935454B2 - 画像処理装置および画像処理プログラム - Google Patents

画像処理装置および画像処理プログラム Download PDF

Info

Publication number
JP5935454B2
JP5935454B2 JP2012081493A JP2012081493A JP5935454B2 JP 5935454 B2 JP5935454 B2 JP 5935454B2 JP 2012081493 A JP2012081493 A JP 2012081493A JP 2012081493 A JP2012081493 A JP 2012081493A JP 5935454 B2 JP5935454 B2 JP 5935454B2
Authority
JP
Japan
Prior art keywords
value
character
target image
image data
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012081493A
Other languages
English (en)
Other versions
JP2013211750A (ja
Inventor
良平 小澤
良平 小澤
近藤 真樹
真樹 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2012081493A priority Critical patent/JP5935454B2/ja
Priority to EP13156806.5A priority patent/EP2645304B1/en
Priority to US13/777,431 priority patent/US9092892B2/en
Publication of JP2013211750A publication Critical patent/JP2013211750A/ja
Application granted granted Critical
Publication of JP5935454B2 publication Critical patent/JP5935454B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/001Texturing; Colouring; Generation of texture or colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion

Description

本発明は、文字を含む画像を表す画像データを用いる画像処理に関する。
文字を含む対象画像を表す対象画像データを用いて、文字を適切に表す二値画像データを生成する技術が求められている。当該二値画像データは、対象画像データの圧縮や文字認識処理(OCR処理)のために、有効に利用することができる。例えば、RGB画像データに対して色成分ごとに二値化を行い、3つの色成分の二値データの論理和を取得することによって二値画像データを生成する技術が知られている(特許文献1)。
特開2000−333022号公報 特開平9−97309号公報
しかしながら、上記技術では、二値化閾値を決定手法について十分に工夫されているとは言えず、適切な二値化閾値が決定できないことに起因して、文字を表す適切な二値画像データを生成できない可能性があった。
本発明の主な利点は、文字を含む画像を表す画像データを用いて、文字を表す適切な二値画像データを生成できる新たな技術を提供することである。
本発明は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の適用例として実現することが可能である。
[適用例1]画像処理装置であって、文字を含む対象画像を表す対象画像データを取得する対象画像取得部と、前記対象画像データを用いて、前記対象画像内の文字を表す二値画像データを生成する生成部と、を備え、前記生成部は、前記対象画像内の背景の色を表す背景色値を特定する背景色特定部と、前記対象画像内の文字の色を表す文字色値を特定する文字色特定部と、前記対象画像内の文字の鮮鋭度に関する特徴値を決定する特徴値決定部と、前記背景色値と前記文字色値と前記特徴値とを用いて、二値化閾値を決定する閾値決定部と、前記対象画像データに対して、前記二値化閾値を用いた二値化処理を実行して、前記二値画像データを生成する二値化処理部と、を備える、画像処理装置。
上記構成によれば、背景色値と文字色値と鮮鋭度に関する特徴値とを用いて、二値化閾値を決定するので、文字の鮮鋭度に応じて、文字を適切に表す二値画像データを生成することができる。
[適用例2]適用例1に記載の画像処理装置であって、前記閾値決定部は、前記特徴値が、文字の鮮鋭度が比較的低いことを示す第1の場合には、前記文字色値と前記二値化閾値との差分が比較的大きくなるように、第1の二値化閾値を決定し、前記特徴値が、文字の鮮鋭度が比較的高いことを示す第2の場合には、前記文字色値と前記二値化閾値との差分が比較的小さくなるように、第2の二値化閾値を決定する、画像処理装置。
上記構成によれば、文字の鮮鋭度が比較的低い場合と、鮮鋭度が比較的高い場合において、異なる二値化閾値が決定されるので、文字を適切に表す二値画像データを生成することができる。
[適用例3]適用例1または適用例2に記載の画像処理装置であって、前記生成部は、さらに、前記対象画像内の文字を構成する画素群を仮に特定する仮特定部を備え、前記特徴値決定部は、前記画素群の平均の色値と、前記文字色値と、の差分に応じて、文字の鮮鋭度に関する前記特徴値を決定する、画像処理装置。
上記構成によれば、文字の鮮鋭度に関する特徴値を容易に決定することができる。
[適用例4]適用例1ないし適用例3に記載の画像処理装置であって、前記対象画像データは、表色系を構成する複数の成分のそれぞれに対応する複数の成分画像データを含み、前記生成部は、さらに、前記文字色値と前記背景色値との差分を取得する差分取得部であって、前記差分は、前記複数の成分にそれぞれ対応する複数の成分差分を含む、前記差分取得部と、前記複数の成分画像データの中から、前記複数の成分のうちの1つの特定成分に対応する1つの特定成分画像データを選択する選択部であって、前記特定成分は、前記複数の成分差分のうちの最大の差分に対応する成分である、前記選択部と、を備え、前記閾値決定部は、前記文字色値のうちの前記特定成分の値と、前記背景色値のうちの前記特定成分の値と、の間の特定成分閾値を前記二値化閾値として決定し、前記二値化処理部は、1つの前記特定成分画像データに対して前記特定成分閾値を用いた前記二値化処理を実行して、1つの前記二値画像データを生成する、画像処理装置。
上記構成によれば、背景色値と文字色値との差分が最大である成分に対応する1つの特定成分画像データのみを用いて、1つの二値画像データを生成する。この結果、文字を適切に表す二値画像データを生成することができる。
[適用例5]適用例1ないし適用例3のいずれかに記載の画像処理装置であって、前記対象画像データは、表色系を構成する複数の成分のそれぞれに対応する複数の成分画像データを含み、前記閾値決定部は、前記複数の成分にそれぞれ対応する複数の成分閾値を含む前記二値化閾値を決定し、前記二値化処理部は、前記複数の成分画像データのそれぞれに対して、対応する前記成分閾値を用いた前記二値化処理を実行して、複数の成分二値データを生成し、前記複数の成分二値データを用いて、1つの前記二値画像データを生成する、画像処理装置。
上記構成によれば、複数の成分画像データをそれぞれ二値化した複数の成分二値データを用いて、1つの二値画像データを生成するので、文字を適切に表す二値画像データを生成することができる。
[適用例6]適用例5に記載の画像処理装置であって、前記成分閾値は、前記文字色値のうちの対応する成分の値と、前記背景色値のうちの対応する成分の値と、の間の値である、画像処理装置。
[適用例7]適用例1ないし適用例6のいずれかに記載の画像処理装置であって、前記文字色特定部は、前記背景色値を用いて、前記文字色値を特定する、画像処理装置。
上記構成によれば、背景色値に応じた適切な文字色値を特定することができる。
[適用例8]適用例7に記載の画像処理装置であって、前記生成部は、さらに、前記対象画像における文字を構成する画素群を仮に特定する仮特定部を備え、前記文字色特定部は、前記画素群の一部の複数の画素を用いて、前記文字色値を特定し、前記一部の複数の画素は、前記背景色値との差分が最も大きい色値を有する画素を含む、画像処理装置。
上記構成によれば、適切な文字色値を特定することができる。
[適用例9]適用例3または適用例8に記載の画像処理装置であって、前記仮特定部は、前記対象画像を構成する複数の画素のうち、前記背景色を含む所定範囲内の色値を有する画素を除いた一部の画素群を、文字を構成する前記画素群として特定する、画像処理装置。
上記構成によれば、文字を構成する画素群を容易に特定することができる。
[適用例10]適用例1ないし適用例9のいずれかに記載の画像処理装置であって、前記対象画像取得部は、親画像データによって表わされる親画像のうちの一部である前記対象画像を表す前記対象画像データを取得し、前記背景色特定部は、前記親画像データのうち、前記対象画像データとは異なるデータを用いて前記背景色値を特定する、画像処理装置。
上記構成によれば、適切な背景色値を特定することができる。
本発明は、種々の形態で実現することが可能であり、例えば、上記装置の機能を実現する方法、上記装置の機能を実現するコンピュータプログラム、当該コンピュータプログラムを記録した記録媒体、等の形態で実現することができる。
画像処理装置としての計算機200の構成を示すブロック図。 画像処理のフローチャート。 スキャンデータが表すスキャン画像SIの一例を示す図。 エッジ画像データが表すエッジ画像EGIの一例を示す図。 スキャン画像SI(図3)に対応する二値画像データの一例を示す図。 オブジェクトラベリング処理のフローチャート。 オブジェクトラベリング処理の説明図。 輝度分布を表すヒストグラムの一例を示す図。 判定テーブル292の一例を示す図。 圧縮画像生成処理のフローチャート。 圧縮画像生成処理の説明図。 文字二値データ生成処理のフローチャート。 文字オブジェクト画像の一例を示す図。 文字色特定処理のフローチャート。 文字オブジェクト画像のヒストグラムの一例を示す図。 使用成分の選択について説明する図。 二値化閾値決定処理のフローチャート。 第1実施例の効果を説明する図。 文字の鮮鋭度と閾値THとの関係を説明する図。 第2実施例の文字二値データ生成処理のフローチャート。 文字オブジェクト画像の各成分のヒストグラムを説明する図。
A.実施例:
A−1.画像処理装置の構成:
次に、本発明の実施の形態を実施例に基づき説明する。図1は、実施例における画像処理装置としての計算機200の構成を示すブロック図である。
計算機200は、例えば、パーソナルコンピュータであり、CPU210と、ROMとRAMとを含む内部記憶装置240と、マウスやキーボードなどの操作部270と、外部装置と通信を行うための通信部280と、ハードディスクドライブなどの外部記憶装置290と、を備えている。
計算機200は、通信部280を介して、外部装置であるスキャナ300と複合機400と通信可能に接続されている。スキャナ300は、光学的に原稿を読み取ることによってスキャンデータを取得する画像読取装置である。複合機400は、光学的に原稿を読み取ることによってスキャンデータを取得する画像読取部を備えている。
内部記憶装置240には、CPU210が処理を行う際に生成される種々の中間データを一時的に格納するバッファ領域241が設けられている。外部記憶装置290は、ドライバプログラム291と、後述する画像処理において参照される判定テーブル292と、を格納している。ドライバプログラム291は、CD−ROMなどに格納されて提供される。
CPU210は、ドライバプログラム291を実行することにより、スキャナドライバ100として機能する。スキャナドライバ100は、スキャンデータに対して後述する画像処理を実行して高圧縮PDFファイルを生成する。スキャナドライバ100は、スキャンデータ取得部110と、領域特定部120と、文字二値画像生成部130とを備えている。
領域特定部120は、後述するように、スキャンデータを用いて文字を含む領域に対応する画像(文字オブジェクト画像)を特定して、当該文字オブジェクト画像を表す部分画像データを取得する。
文字二値画像生成部130は、仮特定部131と、背景色特定部132と、文字色特定部133と、差分取得部134と、選択部135と、特徴値決定部136と、閾値決定部137と、二値化処理部138と、を備えている。文字二値画像生成部130は、領域特定部120によって取得された部分画像データを用いて、文字二値データを生成する。
A−2.画像処理:
図2は、画像処理のフローチャートである。
ステップS100では、スキャナドライバ100のスキャンデータ取得部110は、処理対象のスキャンデータを取得する。具体的には、スキャンデータ取得部110は、スキャナ300または複合機400の画像読取部を制御して、スキャンデータを取得する。スキャンデータは、RGB画素データによって構成されたビットマップデータである。RGB画素データは、レッド(R)、グリーン(G)、ブルー(B)の3つの成分値(本実施例の各成分値は、256階調の階調値)を含む画素データである。
図3は、スキャンデータが表すスキャン画像SIの一例を示す図である。このスキャン画像SIは、背景画像Bg1と、文字を表す文字オブジェクトOb2と、写真を表す写真オブジェクトOb3と、描画を表す描画オブジェクトOb4とを含んでいる。ここで、描画オブジェクトは、イラスト、表、線図、模様などを表すオブジェクトである。文字オブジェクトOb2は、3行分の文字を含んでいる。3行の文字群は、行ごとに色が異なっている。
ステップS150(図2)では、領域特定部120は、スキャンデータを用いて、エッジ画像EGIを表すエッジ画像データを作成する。エッジ画像データは、スキャンデータに含まれる複数の画素の各成分値に対して、sobelフィルタを適用して得られる。エッジ画像データは、スキャンデータと同数の画素データを含む。エッジ画像データの各画素データは、スキャン画像SIの対応する画素のエッジ強度をR、G、Bの各成分値についてそれぞれ表したデータである。具体的には、エッジ画像EGIにおける画素位置(x,y)の画素の所定の成分値S(x,y)は、スキャン画像SIにおける9つの画素の成分値Pを用いて、以下の式(1)によって算出される。
...式(1)
ここで、上記式(1)に示すように、9つの画素は、エッジ画像EGIにおける画素位置(x,y)に対応するスキャン画像SIにおける画素位置(x,y)を中心とした上下左右の9つの位置の画素である。上記式(1)の第1項および第2項は、9つの位置の画素の成分値に、対応する係数をそれぞれ乗じた値の和の絶対値である。なお、エッジ画像EGIの作成には、Sobelフィルタに限らず、Prewittフィルタ、Robertsフィルタなど種々のエッジ検出用フィルタが利用できる。エッジ強度は、注目画素と周辺画素との間の成分値の変化の大きさ(微分値)で表され、式(1)の第1項は、横方向の微分を算出する項であり、第2項は、縦方向の微分を算出する項である。
図4は、エッジ画像データが表すエッジ画像EGIの一例を示す図である。なお、図4では、便宜上、エッジ強度が小さい画素を白で、エッジ強度が大きい画素を黒で示している。エッジ画像EGIには、スキャン画像SIの各オブジェクトOb2〜Ob4のエッジEg2〜Eg4が含まれていることが解る。
ステップS200では、領域特定部120は、エッジ画像EGIに対して複数のブロックB(図4)を設定する。ブロックBは、エッジ画像EGIに対して格子状に配置されたブロックである。1つのブロックBは、例えば、縦N画素×横N画素(Nは所定の自然数)の大きさを有する。Nの値は、例えば、10〜50程度に設定される。エッジ画像EGIとスキャン画像SIとは同じサイズ(縦および横の画素数が同じ)であるので、ブロックBはスキャン画像SIに対して設定されていると言うこともできる。
ステップS250では、領域特定部120は、ブロック単位でベタ領域と非ベタ領域とを特定する。具体的には、領域特定部120は、スキャン画像SIにおける各ブロックBの平均エッジ強度(ERave、EGave、EBave)を算出する。平均エッジ強度(ERave、EGave、EBave)は、エッジ画像EGIにおけるブロックB内の複数の画素の各成分値(R、G、B)の平均値である。そして、領域特定部120は、ブロックBの平均エッジ強度と所定の基準値とを比較して、当該ブロックBを、ベタブロックおよび非ベタブロックのいずれかに分類する。ベタブロックは、平均エッジ強度が所定の基準値より小さいブロックである。非ベタ領域は、平均エッジ強度が所定の基準値以上である領域である。例えば、領域特定部120は、平均エッジ強度(ERave、EGave、EBave)を、成分ごとに定められた基準値(ETr、ETg、ETb)と比較する。この結果、領域特定部120は、ERave<ETr、かつ、EGave<ETg、かつ、EBave<ETbが成立する場合には、領域特定部120は、処理対象のブロックBをベタブロックに分類する。逆に、ERave≧ETr、および、EGave≧ETg、および、EBave≧ETbのうちの少なくとも一つが成立する場合には、領域特定部120は、処理対象のブロックBを非ベタブロックに分類する。
領域特定部120は、1または複数の非ベタブロックで構成される非ベタ領域と、1または複数のベタブロックで構成されるベタ領域と、を特定する。具体的には、領域特定部120は、互いに隣接する複数の非ベタブロックを連結して、1つの非ベタ領域として特定する。また、領域特定部120は、周囲を全てベタブロックで囲まれた1つの非ベタブロックを、1つの非ベタ領域として特定する。同様に、領域特定部120は、互いに隣接する複数のベタブロックを連結して、1つのベタ領域として特定する。また、領域特定部120は、周囲を全て非ベタブロックで囲まれた1つのベタブロックを、1つのベタ領域として特定する。
この結果、スキャン画像SI(図3)において破線で示す領域A2、A3、A4内のブロックBが非ベタ領域として特定され、これらの領域A2、A3、A4を除いた領域A1がベタ領域として特定される。非ベタ領域A2、A3、A4は、それぞれ、オブジェクトOb2、Ob3、Ob4に対応する領域であることが解る。また、ベタ領域A1は、背景画像Bg1に対応する領域であることが解る。上述したように互いに隣接する非ベタブロックは、1つの非ベタ領域として特定されるために、非ベタ領域は、通常、ベタ領域に囲まれている。
ステップS300では、領域特定部120は、スキャン画像SIにおいて、非ベタ領域の周囲を囲むベタ領域の画素のRGBの各成分値を用いて、非ベタ領域を二値化するための二値化基準値を、成分ごとに特定する。図3の例では、各非ベタ領域A2〜A4は、1つのベタ領域A1に囲まれているので、各非ベタ領域A2〜A4を二値化するための二値化基準値は、ベタ領域A1の画素の成分値を用いて特定される。具体的には、領域特定部120は、ベタ領域A1の各成分の平均値(BCR、BCG、BCB)を二値化基準値として算出する。すなわち、領域特定部120は、ベタ領域A1を構成する全画素について、各成分値の平均値(平均成分値)を算出する。なお、二値化基準値としては、各成分の平均値に代えて、各成分の最頻値や、各成分の中間値などが採用されても良い。二値化基準値は、ベタ領域のうち、非ベタ領域に比較的近い一部の領域の画素データを用いて特定されても良い。
ステップS350では、領域特定部120は、二値化基準値(BCR、BCG、BCB)を用いて、各非ベタ領域の二値画像データを生成する。具体的には、領域特定部120は、スキャン画像SIの非ベタ領域を構成する各画素の画素値を「0」および「1」のいずれかに二値化することによって、当該非ベタ領域を構成する各画素を、「1」に対応するオブジェクト画素と、「0」に対応する非オブジェクト画素とに分類する。領域特定部120は、非ベタ領域を構成する画素iの成分値(Ri、Gi、Bi)が、以下の式(2)〜式(4)を全て満たす場合には、画素iに対応する二値画像データの画素値を「0」とし、式(2)〜式(4)のいずれかを満たさない場合には、当該画素値を「1」とする。
BCR−ΔV<Ri<BCR+ΔV ...(2)
BCG−ΔV<Gi<BCG+ΔV ...(3)
BCB−ΔV<Bi<BCB+ΔV ...(4)
文字二値データ内の画素値が「1」である画素は、文字を構成する文字構成画素であり、画素値が「0」である画素は、文字を構成しない非文字構成画素である。上記式(2)〜(4)から解るように、画素iの色が、周囲のベタ領域の色と、ほぼ同じである場合(色値の差分がΔV未満である場合)には、画素iは、文字構成画素に分類される。画素iの色が、周囲のベタ領域の色と、異なる場合(色値の差分がΔV以上である場合)には、画素iは、非文字構成画素に分類される。
図5は、スキャン画像SI(図3)に対応する二値画像データの一例を示す図である。図5において黒い部分はオブジェクト画素によって構成される画像を表しており、白い部分は非オブジェクト画素によって構成される画像を表している。
ステップS400(図2)では、領域特定部120は、ラベリング処理を実行する。図6はラベリング処理のフローチャートである。図7は、ラベリング処理の説明図である。図7には、非ベタ領域A2(図3)に対応する部分二値画像PWIが示されている。
ステップS410では、領域特定部120は、二値画像データ(図5)を用いてオブジェクト画素および非オブジェクト画素にラベリングを実行する。互いに隣接する複数のオブジェクト画素から構成されるオブジェクト画素群には、1つのラベル(識別子)が付される。図7の例では、各文字(例えば、文字BK11、BK12)には、別々のラベルが付され、1つの文字を構成する分離したパーツ(例えば、パーツBK21、BK22)には、別々のラベルが付される。また、互いに隣接する複数の非オブジェクト画素から構成される非オブジェクト画素群には、1つのラベルが付される。図7の例では、文字を囲む領域に対応する周囲部分WO1と、1つの文字に囲まれた微小領域WO2、WO3とには、別々のラベルが付される。
ステップS420では、領域特定部120は、統合条件を満たす複数のオブジェクト画素群を統合する(同じラベルを付す)。統合条件は、1.互いの距離が基準値より近いこと 2.互いの色の相違が基準値より小さいこと、の両方を満たすことを含んでいる。2つのオブジェクト画素群の距離は、例えば、2つのオブジェクト画素群の外接矩形の縦方向の距離と、横方向の距離とで表される。オブジェクト画素群の色は、スキャン画像SIにおけるオブジェクト画素群に対応する全ての画素データの各成分の平均値(Rob、Gob、Bob)で表される。2つのオブジェクト画素群の色の相違は、当該2つの色のRGB色空間における距離(ユークリッド距離)で表される。
統合条件の基準値を適切に設定することによって、実質的に同じ色とみなせ、かつ、距離が比較的近い複数のオブジェクト画素群を統合し、1つの統合オブジェクト画素群として特定することができる。また、実質的に色が異なる複数の文字は、互いの距離とは無関係に、それぞれ別のオブジェクト画素群として特定することができる。上述したように、スキャン画像SIの文字オブジェクトOb2(図3)の3行分の複数の文字は、行ごとに色が異なる。このために、図7の例では、文字オブジェクトOb2を表す複数のオブジェクト画素は、上側の1行の文字群(アルファベット)と、中央の1行の文字群(記号)と、下側の1行の文字群(アルファベット)と、をそれぞれ表す3つのオブジェクト画素群に統合される。
ステップS730では、領域特定部120は、統合条件を満たす複数の非オブジェクト画素群を統合する(同じラベルを付す)。具体的には、領域特定部120は、大きさが基準値より小さい非オブジェクト画素群を、当該非オブジェクト画素群をオブジェクト画素を挟んで囲んでいる別の非オブジェクト画素群に統合する。統合条件の基準値を適切に設定することによって、文字群の背景を構成する非オブジェクト画素群を1つの画素群として特定することができる。図7の例では、上述した周囲部分WO1と、微小領域WO2、WO3とが、1つの非オブジェクト画素群に統合される。
以上説明したラベリング処理によって、図5に破線で示すオブジェクト画像BK1〜BK5が特定される。1つのオブジェクト画像は、それぞれ、1つのラベルが付されたオブジェクト画素群の外接矩形に対応する部分画像である。図5の例では、文字オブジェクトOb2(図3)と、写真オブジェクトOb3(図3)と、描画オブジェクトOb4(図3)とにそれぞれ対応する5つのオブジェクト画像BK1〜BK5が特定されている。すなわち、二値画像データにラベリングされることによって、スキャン画像SIの部分画像として5つのオブジェクト画像BK1〜BK5が特定される。
図2のステップS450では、領域特定部120は、オブジェクト属性判定処理を実行することによって、スキャン画像SI内の各オブジェクト画像の属性を判定する。領域特定部120は、処理対象のオブジェクト画像の画素密度D、分布幅W、色数Cに基づいて、オブジェクト画像の属性を判定する。
画素密度Dは、スキャン画像SI内のオブジェクト画像に占めるオブジェクト画素(対応する二値画像データにおける画素値が「1」である画素)の割合を示す値である。画素密度Dは、D=No/Naで表される。ここで、Noは、オブジェクト画素の数、Naは、オブジェクト画像の全ての画素の数である。
ステップS450では、領域特定部120は、さらに、スキャン画像SI内のオブジェクト画像の輝度分布を算出する。図8は、オブジェクト画像の輝度分布を表すヒストグラムの一例を示す図である。図8のヒストグラムは、横軸に輝度値Y(256階調)を取り、各輝度値を有する画素の数を縦軸にプロットして得られる。輝度値Yは、RGB画素データ(R、G、B)を用いて、例えば、輝度値Y=((0.298912×R)+(0.586611×G)+(0.114478×B))という式で算出される。
分布幅Wは、例えば、有効輝度値の最大値と有効輝度値の最小値との差分である。有効輝度値は、階調数分(例えば、256個)の輝度値Yのうち、基準数Th2以上の画素が有する輝度値Y(図8のハッチングされた領域に対応する輝度値)である(図8)。図8の例では、分布幅Wは、輝度値Y6と、輝度値Y1との差分である。
色数Cは、本実施例では、上述した有効輝度値の数である。輝度値Yが異なれば、その画素の色が異なるので、異なる輝度値Yの数(輝度値Yの種類の数)は、色の数(色の種類の数)を表している。図8の例では、色数Cは、C1+C2+C3である(C1=Y2−Y1、C2=Y4−Y3、C3=Y6−Y5)。
領域特定部120は、上述した画素密度Dと、分布幅Wと、色数Cとに基づいて、オブジェクト画像の属性を判定する。例えば、領域特定部120は、上述した画素密度D、分布幅W、色数Cのそれぞれが、対応する基準値Dth、Wth、Cth以上であるか否かを判断する。領域特定部120は、これらの判断結果を用いて、判定テーブル292を参照して、オブジェクト画像の属性を判定する。本実施例では、オブジェクト画像の属性は、「写真」「文字」「描画」のいずれかに判定される。
図9は、判定テーブル292の一例を示す図である。
判定テーブル292から解るように、対象領域の属性が「文字」であると判定される場合は、以下の2つである。
(1−1)色数C<Cth、かつ、画素密度D<Dth
(1−2)分布幅W<Wth、かつ、色数C≧Cth、かつ、画素密度D<Dth
また、対象領域の属性が「描画」であると判定される場合は、以下の1つである。
(2−1)色数C<Cth、かつ、画素密度D≧Dth
また、対象領域の属性が「写真」であると判定される場合は、以下の2つである。
(3−1)分布幅W≧Wth、かつ、色数C≧Cth
(3−2)分布幅W<Wth、かつ、色数C≧Cth、かつ、画素密度D≧Dth
例えば、(1−1)に示す場合に、対象領域の属性を「文字」であると判定するので、色数Cが比較的少なく、画素密度Dが比較的小さいという、典型的な文字の特徴を有する画像領域の属性を、正しく判定することができる。また、(2−1)に示す場合に、対象領域の属性を「描画」であると判定するので、色数Cが比較的少なく、画素密度Dが比較的大きいという、典型的な描画の特徴を有する画像領域の属性を、正しく判定することができる。また、(3−1)に示す場合に、対象領域の属性を「写真」であると判定するので、分布幅Wが比較的大きく、色数Cが比較的多いという、典型的な写真の特徴を有する画像領域の属性を、正しく判定することができる。
分布巾Wが比較的小さく、かつ、色数Cが比較的多く、かつ、画素密度Dが比較的小さい場合には、分布巾Wが比較的小さい点、画素密度Dが比較的小さい点の2点で、「文字」の特徴に合致している。一方、「写真」の特徴に合致している点は、色数Cが比較的多い点だけであり、「描画」の特徴に合致している点は、見られない。本実施例では、上述した(1−2)の場合には、対象領域の属性は、「文字」であると判定するので、典型的ではないものの、特徴の合致点の多さに基づいて、精度良く画像領域の属性を特定することができる。
スキャン画像SIの例では、3つのオブジェクト画像BK1〜BK3の属性は「文字」であると判定され、オブジェクト画像BK4、BK5の属性は、それぞれ「写真」「描画」であると判定される。
ステップS500では、スキャナドライバ100は、属性が「文字」であると判定されたオブジェクト画像(文字オブジェクト画像)があるか否かを判断する。文字オブジェクト画像がない場合には(ステップS500:NO)、スキャナドライバ100は、ステップS600に処理を移行する。文字オブジェクト画像がある場合には(ステップS500:YES)、スキャナドライバ100の文字二値画像生成部130は、文字二値データ生成処理を実行する(ステップS550)。
ステップS550で生成される文字二値データは、文字を適切に表す二値画像データであり、上述したステップS350にて生成された二値画像データ(図5)とは異なる。文字二値データは、文字を構成する文字構成画素を「1」で表し、文字を構成しない非文字構成画素を「0」で表したデータである。詳細は後述するが、文字二値データ生成処理によって、属性が「文字」であると判定された各オブジェクト画像(スキャン画像SIの例では、3つのオブジェクト画像BK1〜BK3(図5))について、それぞれ文字二値データが生成される。文字二値データ生成処理が終了すると、スキャナドライバ100は、ステップS600に処理を移行する。
ステップS600では、スキャナドライバ100は、圧縮画像データ生成処理を実行する。図10は、圧縮画像生成処理のフローチャートである。図11は、圧縮画像生成処理の説明図である。
ステップS610では、スキャナドライバ100は、文字二値データと、スキャンデータとを用いて、背景画像データを生成する。具体的には、スキャナドライバ100は、スキャンデータに含まれる複数の画素データのうち、文字二値データによって特定される文字構成画素に対応する画素データ(色値)を背景色値に置き換える。この結果、スキャン画像SIから文字が消去された背景画像BGIを表す背景画像データが生成される。背景色値は、スキャン画像SIにおける文字オブジェクトの背景の色を表す値である。本実施例では、背景色値として、文字オブジェクトを含む非ベタ領域A2を囲むベタ領域A1の平均色値を用いる。すなわち、図2のステップS300にて二値化基準値として算出されたベタ領域A1の平均色値(BCR、BCG、BCB)を背景色値として用いる。図11(A)には、図3のスキャン画像SIに対応する背景画像BGIが図示されている。文字オブジェクトOb2(図3)が消去され、写真オブジェクトOb3と、描画オブジェクトOb4とが残されていることが解る。
ステップS620では、スキャナドライバ100は、生成された背景画像データを圧縮して、圧縮背景画像データを生成する。背景画像BGIは、文字を含んでおらず、写真や描画を含み得る多階調(例えば、256階調)画像である。スキャナドライバ100は、このような多階調画像の圧縮に適したJPEG(Joint Photographic Experts Group)圧縮を用いて、圧縮背景画像データを生成する。背景画像データは、文字を含んでいないので、高周波数成分が比較的少ない。この結果、背景画像データをJPEG圧縮を用いて圧縮した際の圧縮率は、元画像(文字を含むスキャンデータ)を圧縮した際の圧縮率より高くなる。
ステップS630では、スキャナドライバ100は、文字二値データを圧縮して、圧縮文字二値データを生成する。図11(B)には、スキャン画像SIの3つの文字オブジェクト画像BK1〜BK3を二値化した3つの文字二値データが表す3つの文字画像TL1〜TL3が図示されている。文字画像TL1〜TL3は、解像度を落とすとエッジのがたつきが目立ち、視認性が悪化しやすい。スキャナドライバ100は、二値画像データを、高い圧縮率で、かつ、解像度を落とすことなく圧縮できる可逆圧縮方式であるMMR(Modified Modified Read)圧縮を用いて、圧縮文字二値データを生成する。
ステップS640では、スキャナドライバ100は、圧縮背景画像データと、圧縮文字二値データと、圧縮文字二値データが表す文字の色を表す文字色値(文字色を表すRGB値)と、座標情報とを用いて、高圧縮PDFデータを生成する。なお、文字色値は、後述する文字二値データ生成処理(図2のS550)において特定される。座標情報は、圧縮文字二値データが表す文字画像TL1〜TL3が、圧縮背景画像データが表す背景画像BGIとの位置関係を、背景画像BGIにおける座標で表した情報である。PDFでは、複数の異なる形式の画像データを1つのファイルに格納し、当該ファイルを再現する際には、これらの画像データを重畳して1つの画像として再現可能なように、規格が定められている。スキャナドライバ100は、規格に従って、1つのファイルに、圧縮背景画像データと圧縮文字二値データとを格納するとともに、当該ファイルに、文字色値と座標情報を圧縮文字二値データと関連付けて格納することによって、スキャン画像SIを表す高圧縮PDFデータを生成する。この結果、文字を含むスキャン画像SIを、文字がシャープで読みやすく、かつ、データ量が比較的小さい形で保存することができる。高圧縮PDFデータを生成すると、スキャナドライバ100は、画像処理を終了する。
A−3:文字二値データ生成処理:
図12は、図2のS550の文字二値データ生成処理のフローチャートである。上述のように、文字二値データ生成処理は、文字オブジェクト画像について、文字を適切に表す二値画像データである文字二値データを生成する処理である。
ステップS551では、文字二値画像生成部130は、1つの文字オブジェクト画像を処理対象として選択する。図13は、文字オブジェクト画像の一例を示す図である。以下では、図13に示す文字オブジェクト画像BK2が処理対象として選択されたものとして、説明する。
ステップS552では、文字二値画像生成部130の仮特定部131と背景色特定部132と文字色特定部133は、文字色特定処理を実行して、文字オブジェクト画像BK2内の文字の色を表す文字色値を特定する。
図14は、文字色特定処理のフローチャートである。
ステップS5521では、仮特定部131は、文字オブジェクト画像BK2の文字構成画素を仮特定して、有効画素数VMNを算出する。具体的には、仮特定部131は、図2のステップS350で生成された文字オブジェクト画像BK2の二値画像データのオブジェクト画素(画素値が「1」)を文字構成画素として仮特定する。仮特定部131は、仮特定された文字構成画素の総数を算出する。仮特定部131は、文字構成画素の総数に、所定の係数(割合)を乗じて、有効画素数VMNを算出する。本実施例では、係数は、0.2に設定されている。
ステップS5522では、背景色特定部132は、文字オブジェクト画像BK2の背景の色を表す背景色値を特定する。本実施例では、背景色特定部132は、スキャン画像SIにおいて、文字オブジェクト画像BK2を含む非ベタ領域A2の周囲を囲むベタ領域A1の色データ(画素データ)を用いて、背景色値を特定する。文字オブジェクト画像BK2の背景は、ベタ領域A1と連続する領域であるので、ベタ領域A1とほぼ同一であると考えられるためである。具体的には、ベタ領域A1の平均色値(BCR、BCG、BCB)を背景色値として特定する。この背景色値は、上述したステップS300にて二値化基準値として算出された色値と同じである。
ステップS5523では、文字色特定部133は、文字オブジェクト画像BK2を表す画像データ(スキャンデータの部分画像データ)の画素データに用いられている表色系を構成する複数の成分(本実施例では、RGBの3成分)の中から、1つの成分を選択する。
ステップS5524では、選択された成分に対応する成分画像データの色分布データ(ヒストグラム)を生成する。文字オブジェクト画像BK2を表す画像データの各画素データは、RGBの3つの成分値を含んでいる。すなわち、文字オブジェクト画像BK2を表す画像データは、3つの成分画像データを含んでいるということができる。各成分画像データは、3つ成分値のうちの1つの成分値で構成される画像データである。色分布データは、選択された成分に対応する成分画像データのうち、上述した文字構成画素群について生成される。
図15は、文字オブジェクト画像BK2のヒストグラムの一例を示す図である。図15は、文字オブジェクト画像BK2のR成分のヒストグラム(R成分画像データのヒストグラム)を示している。このヒストグラムのうち、実線で示す部分HGR1は、ステップS5522にて仮特定された文字オブジェクト画像BK2内の文字構成画素群のヒストグラムであり、破線で示す部分HGR2は、当該文字構成画素群を除いた画素群(背景部分を表す画素群)のヒストグラムである。
ステップS5525では、文字色特定部133は、生成されたヒストグラムを用いて、仮特定された文字構成画素群の最大成分値Mxと最小成分値Mnとを特定する(図15)。ステップS5526では、文字色特定部133は、背景色値のうちの選択された成分の階調値(背景色成分値)と最大成分値Mxとの差分DW1と、背景色成分値と最小成分値Mnとの差分DW2と、を比較する。そして、文字色特定部133は、最大成分値Mxと最小成分値Mnのうち、背景成分値との差分が大きい値は、いずれであるかを判断する。図15の例は、最小成分値Mnと背景色成分値BCRとの差分DW2が、最大成分値Mxと背景色成分値BCRとの差分DW1より大きい場合を示している(例えば、背景色が白に近く、文字色が黒に近い場合)。逆に、最大成分値Mxと背景色成分値BCRとの差分DW1が、最小成分値Mnと背景色成分値BCRとの差分DW2より大きい場合も考えられる(例えば、背景色が黒に近く、文字色が白に近い場合)。
背景成分値との差分が大きい値が最小成分値Mnである場合には(ステップS5526:Mn)、文字色特定部133は、最小成分値Mnから有効上限成分値VVまでの範囲の成分値を有する文字構成画素の平均成分値を、文字色成分値として算出する(ステップS5527)。有効上限成分値VVは、最小成分値Mnから有効上限成分値VVまでの範囲の成分値を有する文字構成画素の数が、有効画素数VMN個となるように、設定される。具体的には、文字色特定部133は、ヒストグラムにおいて最小成分値Mnから順に1つずつ成分値を選択して、選択された成分値を有する文字構成画素の数をカウントする。文字色特定部133は、選択済みの全ての成分値のカウント値の合計が有効画素数VMNを超えるまで、成分値の選択と、文字構成画素の数のカウントを繰り返す。文字色特定部133は、選択済みの全ての成分値のカウント値の合計が有効画素数VMNを超えた時点で、成分値の選択と、文字構成画素の数のカウントを終了し、その時点でカウント対象とされたVMN個の文字構成画素の平均成分値を算出する。図15の例では、有効画素数VMN相当の画素が含まれるヒストグラムの領域VA(図15:ハッチング)に含まれる画素群のR成分の平均成分値TCRが、文字色成分値として算出される。
背景成分値との差分が大きい値が最大成分値Mxである場合には(ステップS5526:Mx)、文字色特定部133は、最大成分値Mxから有効下限成分値VUまでの範囲の成分値を有する文字構成画素の平均成分値を、文字色成分値として算出する(ステップS5528)。有効下限成分値VUは、最小成分値Mnから有効下限成分値VUまでの範囲の成分値を有する文字構成画素の数が、有効画素数VMN個となるように、設定される。具体的には、文字色特定部133は、最大成分値Mxから順に1つずつ成分値を選択して、上述したステップS5527と同様の処理を実行することによって、文字色成分値を算出する。図15には、R成分の文字色成分値TCRが示されている。
ステップS5529では、文字色特定部133は、表色系を構成する3つの成分が選択されたか否かを判断する。文字色特定部133は、3つの成分が選択済みである場合には(ステップS5529:YES)、文字色特定処理を終了する。文字色特定部133は、3つの成分が選択済みでない場合には(ステップS5529:NO)、ステップS5523に戻って未選択の成分を選択して、上述したステップS5524〜S5528までの処理を繰り返す。
文字色特定処理が終了した時点で、表色系を構成する各成分について、文字色成分値が算出される。この結果、これらの文字色成分値の組を含む文字色値が特定される。本実施例では、RGB表色系で表された文字色値(TCR、TCG、TCB)が特定される。ここで、文字オブジェクト画像BK2は、スキャナ300や複合機400の画像読取部によって生成されたスキャンデータによって表されるスキャン画像SIの一部である。このために、文字オブジェクト画像BK2は、図13に示すように、文字と背景とのエッジ近傍に、背景色と文字色との中間色を有する中間色領域TEAが表れ得る。上述した文字色特定処理では、文字構成画素のうち、ヒストグラム上で背景色から最も遠い色(成分値間の差が最も大きい色)から順に所定割合の画素を用いて文字色を算出している。これは、文字オブジェクト画像BK2上で言えば、文字構成画素のうち、文字と背景とのエッジからの距離が遠い領域TCA(文字のコア領域TCAとも呼ぶ)の画素を用いて文字色を算出していると言える。
図12のステップS553では、差分取得部134は、背景色値(BCR、BCG、BCB)と文字色値(TCR、TCG、TCB)との差分を、表色系を構成する複数の成分ごとに算出して取得する。すなわち、本ステップで取得される差分は、RGBの各成分の差分DFR、DFG、DFGを含む。R成分の差分DFRは、(BCR−TCR)の絶対値である。G成分の差分DFGは、(BCG−TCG)の絶対値である。B成分の差分DFBは、(BCB−TCB)の絶対値である。
ステップS554では、選択部135は、3つの差分DFR、DFG、DFBのうちの最大の差分に対応する特定成分を選択する。図16は、使用成分の選択について説明する図である。図16(A)〜(C)は、1つの文字オブジェクト画像に含まれるR成分画像データと、G成分画像データと、B成分画像データと、のヒストグラムHGR、HGG、HGBをそれぞれ示している。この例のように、RGB表色系を構成する3つの成分の差分は、それぞれ異なり得る。この例では、3つの成分の差分の関係は、(R成分の差分DFR)>(B成分の差分DFB)>(G成分の差分DFG)である。したがって、この例では、選択部135は、R成分を使用成分として選択する。すなわち、選択部135は、R成分画像データを、後述するステップS555、S556において使用する1つの成分画像データとして選択する。
ステップS555(図12)では、特徴値決定部136と閾値決定部137は、二値化閾値決定処理を実行する。図17は、二値化閾値決定処理のフローチャートである。ステップS5551では、特徴値決定部136は、処理対象である文字オブジェクト画像の使用成分の平均値を取得する。使用成分の平均値は、文字オブジェクト画像に含まれる全ての文字構成画素の平均値である。例えば、図15に示すR成分の平均値AVRは、文字オブジェクト画像を構成する複数の画素のうち、最小成分値Mnから最大成分値Mxまでの範囲内のR成分値を有する画素群のR成分値の平均値である。
ステップS5552では、特徴値決定部136は、先に特定された文字色値のうちの使用成分の階調値(使用成分の文字色成分値)と、使用成分の平均値とを用いて、文字の鮮鋭度に関する特徴値TL(以下、鮮鋭度TLと呼ぶ。)を取得する。具体的には、特徴値決定部136は、(使用成分の文字色成分値−使用成分の平均成分値)の絶対値SLを算出する。鮮鋭度TLは、この絶対値SLの逆数で表される(鮮鋭度TL=1/SL)。なお、文字のぼけ度は、鮮鋭度TLが高いほど小さくなり、鮮鋭度TLが低いほど大きくなる。従って、絶対値SLは、文字のぼけ度を表す指標値と言うことが出来る。すなわち、鮮鋭度TLが比較的高い(鮮鋭度TLの値が比較的大きい)場合には、文字のぼけ度が比較的小さいことを示し、鮮鋭度TLが比較的低い(鮮鋭度TLの値が比較的小さい)場合には、文字のぼけ度が比較的大きいことを示している。図15には、使用成分であるR成分の絶対値SL(平均成分値AVR−文字色成分値TCR)が図示されている。
ステップS5553では、閾値決定部137は、鮮鋭度TLを用いて、文字二値データを生成するための閾値TH(二値化閾値)を決定する。具体的には、閾値決定部137は、まず、パラメータPRを、以下の式を用いて算出する。
PR=2×(1/TL)−20 ...(5)
さらに、閾値決定部137は、パラメータPRを用いて、以下の式を用いて閾値THを算出する。具体的には、閾値決定部137は、使用成分の文字色成分値を、パラメータPR分だけ、使用成分の背景色成分値の方向にずらした値を閾値THとして算出する。すなわち、閾値決定部137は、(使用成分の文字色成分値)≦(使用成分の背景色成分値)である場合(例えば、文字よりも背景が明るい場合)には、(使用成分の文字色成分値)+(パラメータPR)を閾値THとし、(使用成分の文字色成分値)>(使用成分の背景色成分値)である場合(例えば、背景よりも文字が明るい場合)には、(使用成分の文字色成分値)−(パラメータPR)を閾値THとする。この結果、閾値THは、使用成分の文字色成分値と、使用成分の背景色成分値との間に、適切に決定される。図15には、使用成分であるR成分の閾値THRが図示されている。図15の例では、文字色成分値TCR≦背景色成分値BCRであるので、閾値THRは、(文字色成分値TCR+パラメータPR)である。
ステップS556では、二値化処理部138は、使用成分の成分画像データに対して、決定された閾値THを用いた二値化処理を実行する。この結果、文字オブジェクト画像BK2の文字を表す文字二値データが生成される。使用成分がR成分である場合を例に説明する。二値化処理部138は、R成分値≦背景色成分値BCRである場合には、R成分画像データに含まれる複数のR成分値のうち、閾値THR以下であるR成分値を「1」とし、閾値THRを超えるR成分値を「0」とすることによって、文字二値データを生成する。また、二値化処理部138は、文字色成分値BCR>R成分値である場合には、R成分画像データに含まれる複数のR成分値のうち、閾値THR以上であるR成分値を「1」とし、閾値THR未満であるR成分値を「0」とすることによって、文字二値データを生成する。
ステップS557では、文字二値画像生成部130は、全ての文字オブジェクト画像が処理対象として選択済みか否かを判断する。全ての文字オブジェクト画像が処理対象として選択済みである場合には(ステップS557:YES)、文字二値画像生成部130は、文字二値データ生成処理を終了する。未選択の文字オブジェクト画像がある場合には(ステップS557:NO)、文字二値画像生成部130は、ステップS551に戻って、未選択の文字オブジェクト画像を選択して、上述したステップS552〜S556までの処理を繰り返す。
以上説明した本実施例の文字二値データ生成処理によれば、文字オブジェクト画像の背景色値(例えば、背景色成分値BCR)と、文字色値(例えば、文字色成分値TCR)と、鮮鋭度TLとを用いて、閾値THを決定する。この結果、文字の鮮鋭度に応じて、文字を適切に表す文字二値データを生成することができる。
図13を用いて文字オブジェクト画像BK2の例で説明したように、スキャン画像の文字には、コア領域TCAと、コア領域TCAの周囲に位置する中間色領域TEA(文字と背景とのエッジ近傍の領域)が表れる。文字画像の中間色領域TEAのサイズ(太さ)が大きいほど、文字の鮮鋭度TLが低く、ぼけ度が大きい(文字の輪郭がぼけている)ということができる。また、文字画像の中間色領域TEAのサイズ(太さ)が小さいほど、鮮鋭度TLが高く、文字のぼけ度が小さい(文字の輪郭がクリアである)ということができる。このような文字オブジェクト画像の文字二値データにおいて、適切な閾値THを決定できない場合には、文字二値画像によって表される文字の構成要素(主として細線)が、不適切な太さになる可能性がある。
図18は、本実施例の効果を説明する図である。図18(A)は、本実施例の文字二値データ生成処理(図12)によって生成された文字二値データによって表される文字画像の例を示している。図18(B)は、比較例1として、閾値THが背景色値に近すぎる値(文字色値から遠すぎる値)に設定された場合に生成される二値データによって表される文字画像の例を示している。この比較例1の文字画像は、文字の構成要素が過度に太くなり、実施例の文字画像(図18(A))と比較して、文字の見栄えや識別性(識別のしやすさ)が低下している。例えば、左から3番目の文字(@)では、離間しているべき構成要素が繋がっていることが解る。
図18(C)は、比較例2として、閾値THが背景色値から遠すぎる値(文字色値に近すぎる値)に設定された場合に生成される二値データによって表される文字画像の例を示している。この比較例1の文字画像は、文字の構成要素が過度に細くなり、実施例の文字画像(図18(A))と比較して、文字の見栄えや識別性が低下している。例えば、右から2番目の文字(¥)および右から3番目の文字(#)では、細線の欠けが生じていることが解る。
これに対して、本実施例では、特に、鮮鋭度TLを用いて、二値化のための閾値THを適切に決定することできるので、図18(A)に示すように、生成される文字二値データによって表される文字の見栄えや識別性の低下を抑制することができる。
図19は、文字の鮮鋭度TLと、本実施例にて決定される閾値THと、の関係を説明する図である。図19(A)は、鮮鋭度TLが比較的低い場合の所定成分の成分値のヒストグラムを示している。図19(B)は、文字の鮮鋭度TLが比較的高い場合の所定成分の成分値のヒストグラムを示す。鮮鋭度TLが比較的低い場合には、ヒストグラムHG1の広がり(例えば、分散で表される)が、比較的大きくなる。すなわち、文字色値(コア領域TCAの色(図13))と、文字全体の平均色値との差が大きくなり、絶対値SLの値が大きくなる。また、鮮鋭度TLが比較的高い場合には、ヒストグラムHG2の広がりが、比較的小さくなる。すなわち、文字色値と、平均色値との差が小さくなり、絶対値SLの値も小さくなる。このように、特徴値決定部136は、仮に特定された文字構成画素群(図2:ステップS350で生成される二値画像データによって特定される)の平均色値と、文字色値と、の差分に応じて、鮮鋭度TLを適切に決定することができる。
ここで、本実施例の閾値決定部137は、上述したように使用成分の文字色成分値を、パラメータPR分だけ、使用成分の背景色成分値の方向にずらした値を閾値THとして算出する。そして、閾値THの文字色成分値からのずれ量に対応するパラメータPRは、PR=2×(1/TL)−20の式を用いて算出される。したがって、鮮鋭度TLが比較的高い場合(文字のぼけ度が比較的小さい場合)には、閾値THは、文字色値と閾値THとの差分が比較的小さくなるように、決定される。また、鮮鋭度TLが比較的低い場合(文字のぼけの程度が比較的大きい場合)には、閾値THは、文字色値と閾値THとの差分が比較的大きくなるように、決定される。したがって、本実施例の文字二値データ生成処理によれば、鮮鋭度TLが比較的低い場合(文字のぼけ度が比較的大きい場合)と、鮮鋭度TLが比較的高い場合(文字のぼけ度が比較的小さい場合)の両方において、適切な閾値THを決定ことができる。この結果、文字を適切に表す文字二値データを生成することができる。
さらに、本実施例の文字二値データ生成処理によれば、スキャンデータで用いられているRGB表色系の複数の成分(RGB成分)のうちの1つの特定成分に対応する成分画像データを用いて、二値画像データを生成している。特定成分は、文字色値と背景色値との3つの成分差分DFR、DFG、DFBのうちの最大の成分差分に対応する成分である。成分差分が小さい場合には、閾値THの位置の僅かな違いで、二値化の結果を大きく変化する可能性がある。このために、成分差分が小さい成分画像データでは、適切な閾値THを決定することが困難な場合がある。
例えば、成分差分が比較的小さい成分画像データについて、最適な閾値THより僅かに文字色値に近い閾値THが決定されたとする。この場合には、当該成分画像データと当該閾値THとを用いて生成された文字二値データによって表される文字画像は、図18の比較例2のように、過度に文字の構成要素が細い画像になる可能性が高くなる。逆に、成分差分が比較的小さい成分画像データについて、最適な閾値THより僅かに背景色値に近い閾値THが決定されたとする。この場合には、当該成分画像データと当該閾値THとを用いて生成された文字二値データによって表される文字画像は、図18の比較例1のように、過度に文字の構成要素が太い画像になる可能性が高くなる。これに対して、成分差分が比較的大きい成分画像データを用いる場合には、最適な閾値THからずれた閾値THを用いたとしても、生成された文字二値データによって表される文字画像が、最適な閾値THを用いた場合の文字画像と比較して、大きく異なる可能性は低くなる。すなわち、成分差分が比較的大きい成分画像データを用いる場合には、許容される閾値THの範囲が広くなり、安定して良好な文字画像を表す文字二値データを生成することができる。本実施例のスキャナドライバ100は、最大の成分差分に対応する成分画像データを用いて、文字を適切に表す文字二値データを生成することができる。
また、極端な例として、背景色が白色(256階調のRGB値で(255、255、255))で、文字色が黄色(256階調のRGB値で(255、255、0))である場合を考える。この例のように、背景色値と文字色値の組合せによっては、第1の成分画像データ(例えば、R成分画像データまたはG成分画像データ)では、成分差分がほとんど無いが、第2の成分画像データ(例えば、B成分画像データ)では、大きな成分差分がある場合がある。このような場合には、第1の成分画像データを用いて、文字二値データを生成することは困難である。しかしながら、大きな成分差分を有する第2の成分画像データを用いて、容易に適切な文字二値画像データを生成することができる。すなわち、本実施例によれば、背景色値と文字色値の組合せに拘わらず、容易に適切な文字二値画像データを生成することができる。
また、背景色が白色で、文字色が黄色である場合には、背景色の輝度値Yと文字色の輝度値との間に、大きな差分は生じない。輝度値Yは、例えば、輝度値Y=((0.298912×R)+(0.586611×G)+(0.114478×B))の式で定義されることから解るように、黄色と白色との差が生じるB成分の輝度値Yに対する寄与は、R、G成分と比較して、非常に小さいからである。すなわち、背景色値と文字色値の組合せによっては、輝度画像データを用いても、適切な文字二値データを生成できない可能性がある。しかしながら、本実施例によれば、最大の成分差分を有する成分画像データを用いて、容易に適切な文字二値画像データを生成することができる。
また、上記実施例では、文字色特定部133は、背景色値を用いて、文字色値を特定する。さらに、文字色特定部133は、仮特定された文字構成画素群のうちの一部の画素群を用いて、文字色値を特定する。この結果、適切な文字色値を特定することができる。すなわち、上記実施例では、文字色特定部133は、オブジェクト画像のヒストグラムにおいて、仮特定された画素群の最大成分値Mxと、最小成分値Mnとを特定する。文字色特定部133は、最大成分値Mxと最小成分値Mnのうち、背景色値との差分が大きい値の近傍の成分値を有する画素群(有効画素数VMN個の画素を含む)を用いて、文字色値を特定している。すなわち、文字色値の特定も用いられる画素群は、仮特定された文字構成画素群のうち、背景色値との差分が最も大きい色値(最大成分値Mxまたは最小成分値Mnのうちの一方)を含んでいる。したがって、文字の鮮鋭度や、背景色値に依存しにくい文字のコア領域TCA(図13)との色を表す色値を、文字色値として特定することができる。この結果、文字の鮮鋭度(ぼけ度)や、背景色の種類に拘わらず、適切な文字色値を特定することができる。
また、上記実施例では、背景色特定部132は、スキャン画像SIにおいて、文字オブジェクト画像を囲むベタ領域A1の画素値を用いて背景色値を特定している。すなわち、スキャン画像SIを表すスキャンデータのうち、文字オブジェクト画像を表す部分データとは異なる部分データを用いて背景色値を特定するので、スキャン画像SIにおける文字オブジェクト画像とは異なる部分に応じて適切な背景色値を特定することができる。このように、文字オブジェクト画像を表すデータは、対象画像データの例であり、スキャン画像SIを表すスキャンデータは、対象画像データの親データの例である。また、領域特定部120は、対象画像取得部の例である。
B.第2実施例:
図20は、第2実施例の文字二値データ生成処理のフローチャートである。第2実施例の文字二値データ生成処理は、第1実施例の文字二値データ生成処理と異なり、1つの特定の成分画像データだけでなく、表色系を構成する複数の成分に対応する複数の成分画像データを用いて、文字二値データを生成する。なお、図20において、第1実施例の文字二値データ生成処理と同じ処理ステップは、図12と同一の符号を付し、第1実施例の文字二値データ生成処理と異なる処理ステップは、符号の末尾に「B」を付した。
第1実施例と同様に、処理対象の文字オブジェクト画像が選択され(ステップS551)、文字色特定処理が実行されると(ステップS552)、文字二値画像生成部130は、表色系を構成する複数の成分(例えば、RGBの3成分)の中から、1つの成分を選択する(ステップS553B)。そして、ステップS555では、閾値決定部137は、選択された成分を使用成分として、第1実施例における二値化閾値決定処理と同一の処理を実行して、使用成分の閾値THを決定する。ステップS556Bでは、第1実施例のステップS556と同様の処理、すなわち、使用成分の閾値THを用いた二値化処理を処理対象の文字オブジェクト画像を表すデータに対して実行して、二値データを生成する。ここで、生成される二値データは、最終的に生成されるべき文字二値データではないので、成分別二値データと呼ぶこととする。
ステップS557Bでは、文字二値画像生成部130は、表色系を構成する3つの成分を選択したか否かを判断する。3つの成分が選択済みである場合には(ステップS557B:YES)、文字二値画像生成部130は、ステップS558Bに処理を進める。未選択の成分がある場合には(ステップS557B:NO)、文字二値画像生成部130は、ステップS553Bに戻って、未選択の成分を選択して、上述したステップS555〜S556Bまでの処理を繰り返す。
ステップS558Bに移行した時点で、表色系を構成する全ての成分の成分別二値データが生成されている。スキャン画像SIを表すスキャンデータがRGB色データで構成されている場合には、RGBの3つの成分にそれぞれ対応する3つの成分別二値データが生成される。
ステップS558Bでは、文字二値画像生成部130は、複数の成分別二値データの論理和(OR)を画素ごとに算出し、算出結果を対応する画素の画素値とした二値データを生成する。本ステップで生成される二値データが、処理対象の文字オブジェクト画像の最終的な文字二値データである。
ステップS559Bでは、文字二値画像生成部130は、文字オブジェクト画像が処理対象として選択済みか否かを判断する。全ての文字オブジェクト画像が処理対象として選択済みである場合には(ステップS559B:YES)、文字二値画像生成部130は、文字二値データ生成処理を終了する。未選択の文字オブジェクト画像がある場合には(ステップS559B:NO)、文字二値画像生成部130は、ステップS551に戻って、未選択の文字オブジェクト画像を選択して、上述したステップS552〜S558Bまでの処理を繰り返す。
以上説明した第2実施例の文字二値データ生成処理によれば、RGBの各成分画像データごとに適切な二値化のための閾値TH(成分閾値ともよぶ。)を決定して、複数の成分別二値データを生成する。そして、複数の成分別二値データを用いて、1つの文字二値データを生成するので、文字を適切に表す文字二値データを生成することができる。
図21は、文字オブジェクト画像のRGBの各成分のヒストグラムHGR、HGG、HGBと、各成分の閾値THR、THG、THBとを説明する図である。図21に示すように、成分ごとに、ヒストグラムの形状、具体的には、文字色値と背景色とに対応する2つのピークの位置、ピークの広がり(分散)、ピークの間隔などが異なる。本実施例によれば、成分に応じた適切な閾値THが、鮮鋭度TL等を考慮して決定される。ここで、第1実施例で説明した各成分の成分差分DFR、DFG、DFBに、基準値より小さい成分差分が含まれる場合には、当該成分差分に対応する成分別二値データは、最終的に生成される文字二値データの生成には用いないこととしても良い。成分差分が比較的小さい成分は、第1実施例において説明したように、閾値THを適切に決定することが困難であるので、当該成分に対応する成分別二値データは、適切に文字を表していない可能性があるからである。
C.変形例:
(1)上記各実施例において、文字の鮮鋭度に関する特徴値として、上述した鮮鋭度TL=(1/SL)、(SLは、(平均成分値AVR−文字色成分値TCR)の絶対値)が用いられているが、他の様々な特徴値が採用され得る。具体的には、文字オブジェクト画像のヒストグラムにおけるピークの広がりと相関のある統計量、例えば、分散の逆数、文字構成画素数に対するピークの高さなどが、特徴値として用いられても良い。また、スキャンデータの生成に用いられた画像読取装置(スキャナ300など)の特性、例えば、光学センサ(CCDなど)や光源の特性を含む装置特性、特に、文字の鮮鋭度に相関のある装置特性が特徴値として用いられても良い。
また、文字オブジェクト画像の背景色値には、当該文字オブジェクト画像を囲むベタ領域に含まれる全ての画素の平均色値が用いられているが、これに限られない。例えば、ベタ領域のうちの一部の領域、例えば、文字オブジェクト画像を囲む所定幅の環状の領域の平均色値を採用しても良い。所定幅は、例えば、領域特定の際に設定されるブロックB(図4)の1個〜数個分の幅であっても良い。また、背景色特定部132は、文字オブジェクト画像に含まれる画素を用いて背景色値を特定しても良い。背景色特定部132は、例えば、文字オブジェクト画像に含まれる画素のうち、文字構成画素を除く複数の画素の全部または一部の画素を用いて、背景色値を特定しても良い。
また、上記各実施例において具体的に説明した文字色の特定方法は一例であり、これに限られない。例えば、文字色特定部133は、文字オブジェクト画像のヒストグラムにおいて、基準値以上の画素数がある成分値の範囲(最大成分値Mx−最小成分値Mn)において、背景色成分値がある側とは反対側から所定の位置(例えば、成分値の範囲の4分の1の位置)にある成分値を文字色成分値としても良い。
文字色値、背景色値、鮮鋭度TLが、それぞれ、どのような手法で取得されたかに拘わらず、文字二値画像生成部130の閾値決定部137は、取得された背景色値と文字色値と特徴値とを用いて、閾値THを決定することが好ましい。
(2)上記第1実施例では、差分取得部134は、RGB表色系を構成する成分の成分画像データのヒストグラムを用いて、成分差分(成分ごとの文字色値と背景色値との差分)を算出している。そして、選択部135は、最大の成分差分に対応する成分を使用成分として選択している。差分取得部134は、他の表色系、例えば、YCaCb表色系を構成する3つの成分、または、CIELAB表色系を構成する3つの成分の成分差分を算出しても良い。そして、選択部135は、これらの成分差分のうちの最大の成分差分に対応する成分を使用成分として選択しても良い。このように、表色系を構成する複数の成分は、RGB表色系を構成する各成分のように、全ての成分が色味に関連する色成分であっても良いし、YCaCb表色系を構成する輝度成分(Y)のように、色味に関連しない成分を含んでも良い。
(3)上記各実施例では、最終的に文字二値データが生成される前に、仮に文字構成画素を特定するために、背景色値を基準にした二値化処理を行っている(図2:ステップS350)が、仮に文字構成画素を特定する手法はこれに限られない。例えば、仮特定部131は、文字オブジェクト画像を構成する複数の画素のうち、背景色値を含む所定範囲の色値を有する画素を除いた一部の画素群を、文字を構成する画素群として特定すれば良い。こうすれば、文字を構成する画素群を容易に仮特定することができる。
(4)上記第2実施例では、成分ごとに異なる閾値THを算出して、成分ごとに異なる閾値THを用いて各成分画像データを二値化している。これに代えて、3つの成分に共通の閾値THを算出し、当該共通の閾値THを用いて各成分画像データを二値化しても良い。
(5)上記各実施例において、計算機200のスキャナドライバ100が備える画像処理機能は、複合機400やスキャナ300などの画像読取部を有する装置、あるいは、デジタルカメラなどの光学的な画像データ生成部を有する装置に備えられても良い。この場合には、例えば、当該画像処理機能を備える複合機やスキャナは、自身が有する画像読取部を用いて生成したスキャンデータに対して画像処理を行って、処理済み画像データ(例えば、高圧縮PDFデータ)を生成し、当該処理済み画像データを、通信可能に接続された計算機(パーソナルコンピュータなど)に出力しても良い。
一般的に言えば、スキャナドライバ100の画像処理機能を実現する装置は、計算機200に限らず、複合機、デジタルカメラ、スキャナなどによって実現されても良い。また、当該画像処理機能は、1つの装置で実現されても良いし、ネットワークを介して接続された複数の装置によって、実現されても良い。この場合には、当該画像処理機能を実現する複数の装置を備えるシステムが、画像処理装置に相当する。
(6)上記実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部をハードウェアに置き換えるようにしてもよい。
以上、実施例、変形例に基づき本発明について説明してきたが、上記した発明の実施の形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれる。
200...複合機、210...CPU、240...内部記憶装置、270...操作部、280...通信部、290...外部記憶装置、291...ドライバプログラム、292...判定テーブル、100...スキャナドライバ、110...領域特定部、130...文字二値画像生成部

Claims (16)

  1. 画像処理装置であって、
    文字を含む対象画像を表す対象画像データを取得する対象画像取得部と、
    前記対象画像データを用いて、前記対象画像内の文字を表す二値画像データを生成する生成部と、
    を備え、
    前記生成部は、
    前記対象画像内の背景の色を表す背景色値を特定する背景色特定部と、
    前記対象画像内の文字の色を表す文字色値を特定する文字色特定部と、
    前記対象画像内の文字の鮮鋭度に関する特徴値を決定する特徴値決定部と、
    前記背景色値と前記文字色値と前記特徴値とを用いて、二値化閾値を決定する閾値決定部と、
    前記対象画像データに対して、前記二値化閾値を用いた二値化処理を実行して、前記二値画像データを生成する二値化処理部と、
    を備え、
    前記閾値決定部は、
    前記特徴値の変化に応じて変化するパラメータ値を求め、前記パラメータ値を用いて、前記背景色値と前記文字色値との間の値である前記二値化閾値を決定し、
    前記閾値決定部は、
    前記特徴値が、第1の特徴値である場合には、前記第1の特徴値に応じた第1のパラメータ値を求め、前記第1のパラメータ値を用いて、第1の二値化閾値を決定し、
    前記特徴値が、前記第1の特徴値よりも、文字の鮮鋭度が高いことを示す第2の特徴値である場合には、前記第2の特徴値に応じた第2のパラメータ値であって、前記第1のパラメータ値と異なる値である前記第2のパラメータ値を求め、前記第2のパラメータ値を用いて、前記文字色値と第2の二値化閾値との差分が前記文字色値と前記第1の二値化閾値との差分よりも小さくなるような前記第2の二値化閾値を決定る、
    画像処理装置。
  2. 請求項1に記載の画像処理装置であって、
    前記生成部は、さらに、
    前記対象画像内の文字を構成する画素群を仮に特定する仮特定部を備え、
    前記特徴値決定部は、前記画素群の平均の色値と、前記文字色値と、の差分に応じて、文字の鮮鋭度に関する前記特徴値を決定する、画像処理装置。
  3. 請求項1または請求項に記載の画像処理装置であって、
    前記対象画像データは、表色系を構成する複数の成分のそれぞれに対応する複数の成分画像データを含み、
    前記生成部は、さらに、
    前記文字色値と前記背景色値との差分を取得する差分取得部であって、前記差分は、前記複数の成分にそれぞれ対応する複数の成分差分を含む、前記差分取得部と、
    前記複数の成分画像データの中から、前記複数の成分のうちの1つの特定成分に対応する1つの特定成分画像データを選択する選択部であって、前記特定成分は、前記複数の成分差分のうちの最大の差分に対応する成分である、前記選択部と、
    を備え、
    前記閾値決定部は、前記文字色値のうちの前記特定成分の値と、前記背景色値のうちの前記特定成分の値と、の間の特定成分閾値を前記二値化閾値として決定し、
    前記二値化処理部は、1つの前記特定成分画像データに対して前記特定成分閾値を用いた前記二値化処理を実行して、1つの前記二値画像データを生成する、画像処理装置。
  4. 請求項1または請求項に記載の画像処理装置であって、
    前記対象画像データは、表色系を構成する複数の成分のそれぞれに対応する複数の成分画像データを含み、
    前記閾値決定部は、前記複数の成分にそれぞれ対応する複数の成分閾値を含む前記二値化閾値を決定し、
    前記二値化処理部は、
    前記複数の成分画像データのそれぞれに対して、対応する前記成分閾値を用いた前記二値化処理を実行して、複数の成分二値データを生成し、
    前記複数の成分二値データを用いて、1つの前記二値画像データを生成する、画像処理装置。
  5. 請求項に記載の画像処理装置であって、
    前記成分閾値は、前記文字色値のうちの対応する成分の値と、前記背景色値のうちの対応する成分の値と、の間の値である、画像処理装置。
  6. 請求項1ないし請求項のいずれかに記載の画像処理装置であって、
    前記文字色特定部は、前記背景色値を用いて、前記文字色値を特定する、画像処理装置。
  7. 請求項に記載の画像処理装置であって、
    前記生成部は、さらに、前記対象画像内の文字を構成する画素群を仮に特定する仮特定部を備え、
    前記文字色特定部は、前記画素群の一部の複数の画素を用いて、前記文字色値を特定し、
    前記一部の複数の画素は、前記背景色値との差分が最も大きい色値を有する画素を含む、画像処理装置。
  8. 請求項または請求項に記載の画像処理装置であって、
    前記仮特定部は、前記対象画像を構成する複数の画素のうち、前記背景色を含む所定範囲内の色値を有する画素を除いた一部の画素群を、文字を構成する前記画素群として特定する、画像処理装置。
  9. 請求項1ないし請求項のいずれかに記載の画像処理装置であって、
    前記対象画像取得部は、親画像データによって表わされる親画像のうちの一部である前記対象画像を表す前記対象画像データを取得し、
    前記背景色特定部は、前記親画像データのうち、前記対象画像データとは異なるデータを用いて前記背景色値を特定する、画像処理装置。
  10. 画像処理装置であって、
    文字を含む対象画像を表す対象画像データを取得する対象画像取得部と、
    前記対象画像データを用いて、前記対象画像内の文字を表す二値画像データを生成する生成部と、
    を備え、
    前記生成部は、
    前記対象画像内の背景の色を表す背景色値を特定する背景色特定部と、
    前記対象画像内の文字の色を表す文字色値を特定する文字色特定部と、
    前記対象画像内の文字を構成する画素群を仮に特定する仮特定部と、
    前記画素群の平均の色値と、前記文字色値と、の差分に応じて、前記対象画像内の文字の鮮鋭度に関する特徴値を決定する特徴値決定部と、
    前記背景色値と前記文字色値と前記特徴値とを用いて、二値化閾値を決定する閾値決定部と、
    前記対象画像データに対して、前記二値化閾値を用いた二値化処理を実行して、前記二値画像データを生成する二値化処理部と、
    を備える、画像処理装置。
  11. 画像処理装置であって、
    文字を含む対象画像を表す対象画像データであって、表色系を構成する複数の成分のそれぞれに対応する複数の成分画像データを含む、前記対象画像データを取得する対象画像取得部と、
    前記対象画像データを用いて、前記対象画像内の文字を表す二値画像データを生成する生成部と、
    を備え、
    前記生成部は、
    前記対象画像内の背景の色を表す背景色値を特定する背景色特定部と、
    前記対象画像内の文字の色を表す文字色値を特定する文字色特定部と、
    前記文字色値と前記背景色値との差分を取得する差分取得部であって、前記差分は、前記複数の成分にそれぞれ対応する複数の成分差分を含む、前記差分取得部と、
    前記複数の成分画像データの中から、前記複数の成分のうちの1つの特定成分に対応する1つの特定成分画像データを選択する選択部であって、前記特定成分は、前記複数の成分差分のうちの最大の差分に対応する成分である、前記選択部と、
    前記対象画像内の文字の鮮鋭度に関する特徴値を決定する特徴値決定部と、
    前記背景色値と前記文字色値と前記特徴値とを用いて、前記文字色値のうちの前記特定成分の値と、前記背景色値のうちの前記特定成分の値と、の間の特定成分閾値を決定する閾値決定部と、
    1つの前記特定成分画像データに対して、前記特定成分閾値を用いた二値化処理を実行して、1つの前記二値画像データを生成する二値化処理部と、
    を備える、画像処理装置。
  12. 画像処理装置であって、
    文字を含む対象画像を表す対象画像データを取得する対象画像取得部と、
    前記対象画像データを用いて、前記対象画像内の文字を表す二値画像データを生成する生成部と、
    を備え、
    前記生成部は、
    前記対象画像内の背景の色を表す背景色値を特定する背景色特定部と、
    前記対象画像内の文字を構成する画素群を仮に特定する仮特定部と、
    前記背景色値と、前記画素群の一部の複数の画素と、を用いて、前記対象画像内の文字の色を表す文字色値を特定する文字色特定部であって、前記一部の複数の画素は、前記背景色値との差分が最も大きい色値を有する画素を含む、前記文字色特定部と、
    前記対象画像内の文字の鮮鋭度に関する特徴値を決定する特徴値決定部と、
    前記背景色値と前記文字色値と前記特徴値とを用いて、二値化閾値を決定する閾値決定部と、
    前記対象画像データに対して、前記二値化閾値を用いた二値化処理を実行して、前記二値画像データを生成する二値化処理部と、
    を備える、画像処理装置。
  13. 画像処理プログラムであって、
    文字を含む対象画像を表す対象画像データを取得する対象画像取得機能と、
    前記対象画像データを用いて、前記対象画像内の文字を表す二値画像データと、を生成する生成機能と、
    をコンピュータに実現させ、
    前記生成機能は、
    前記対象画像内の背景の色を表す背景色値を特定する背景色特定機能と、
    前記対象画像内の文字の色を表す文字色値を特定する文字色特定機能と、
    前記対象画像内の文字の鮮鋭度に関する特徴値を決定する特徴値決定機能と、
    前記背景色値と前記文字色値と前記特徴値とを用いて、二値化閾値を決定する閾値決定機能と、
    前記対象画像データに対して、前記二値化閾値を用いた二値化処理を実行して、前記二値画像データを生成する二値化処理機能と、
    を備え、
    前記閾値決定機能は、
    前記特徴値の変化に応じて変化するパラメータ値を求め、前記パラメータ値を用いて、前記背景色値と前記文字色値との間の値である前記二値化閾値を決定し、
    前記閾値決定機能は、
    前記特徴値が、第1の特徴値である場合には、前記第1の特徴値に応じた第1のパラメータ値を求め、前記第1のパラメータ値を用いて、第1の二値化閾値を決定し、
    前記特徴値が、前記第1の特徴値よりも、文字の鮮鋭度が高いことを示す第2の特徴値である場合には、前記第2の特徴値に応じた第2のパラメータ値であって、前記第1のパラメータ値と異なる値である前記第2のパラメータ値を求め、前記第2のパラメータ値を用いて、前記文字色値と第2の二値化閾値との差分が前記文字色値と前記第1の二値化閾値との差分よりも小さくなるような前記第2の二値化閾値を決定る、画像処理プログラム。
  14. 画像処理プログラムであって、
    文字を含む対象画像を表す対象画像データを取得する対象画像取得機能と、
    前記対象画像データを用いて、前記対象画像内の文字を表す二値画像データと、を生成する生成機能と、
    をコンピュータに実現させ、
    前記生成機能は、
    前記対象画像内の背景の色を表す背景色値を特定する背景色特定機能と、
    前記対象画像内の文字の色を表す文字色値を特定する文字色特定機能と、
    前記対象画像内の文字を構成する画素群を仮に特定する仮特定機能と、
    前記画素群の平均の色値と、前記文字色値と、の差分に応じて、前記対象画像内の文字の鮮鋭度に関する特徴値を決定する特徴値決定機能と、
    前記背景色値と前記文字色値と前記特徴値とを用いて、二値化閾値を決定する閾値決定機能と、
    前記対象画像データに対して、前記二値化閾値を用いた二値化処理を実行して、前記二値画像データを生成する二値化処理機能と、
    を備える、画像処理プログラム。
  15. 画像処理プログラムであって、
    文字を含む対象画像を表す対象画像データであって、表色系を構成する複数の成分のそれぞれに対応する複数の成分画像データを含む、前記対象画像データを取得する対象画像取得機能と、
    前記対象画像データを用いて、前記対象画像内の文字を表す二値画像データと、を生成する生成機能と、
    をコンピュータに実現させ、
    前記生成機能は、
    前記対象画像内の背景の色を表す背景色値を特定する背景色特定機能と、
    前記対象画像内の文字の色を表す文字色値を特定する文字色特定機能と、
    前記文字色値と前記背景色値との差分を取得する差分取得機能であって、前記差分は、前記複数の成分にそれぞれ対応する複数の成分差分を含む、前記差分取得機能と、
    前記複数の成分画像データの中から、前記複数の成分のうちの1つの特定成分に対応する1つの特定成分画像データを選択する選択機能であって、前記特定成分は、前記複数の成分差分のうちの最大の差分に対応する成分である、前記選択機能と、
    前記対象画像内の文字の鮮鋭度に関する特徴値を決定する特徴値決定機能と、
    前記背景色値と前記文字色値と前記特徴値とを用いて、前記文字色値のうちの前記特定成分の値と、前記背景色値のうちの前記特定成分の値と、の間の特定成分閾値を決定する閾値決定機能と、
    1つの前記特定成分画像データに対して、前記特定成分閾値を用いた二値化処理を実行して、1つの前記二値画像データを生成する二値化処理機能と、
    を備える、画像処理プログラム。
  16. 画像処理プログラムであって、
    文字を含む対象画像を表す対象画像データを取得する対象画像取得機能と、
    前記対象画像データを用いて、前記対象画像内の文字を表す二値画像データと、を生成する生成機能と、
    をコンピュータに実現させ、
    前記生成機能は、
    前記対象画像内の背景の色を表す背景色値を特定する背景色特定機能と、
    前記対象画像内の文字を構成する画素群を仮に特定する仮特定機能と、
    前記背景色値と、前記画素群の一部の複数の画素と、を用いて、前記対象画像内の文字の色を表す文字色値を特定する文字色特定機能であって、前記一部の複数の画素は、前記背景色値との差分が最も大きい色値を有する画素を含む、前記文字色特定機能と、
    前記対象画像内の文字の鮮鋭度に関する特徴値を決定する特徴値決定機能と、
    前記背景色値と前記文字色値と前記特徴値とを用いて、二値化閾値を決定する閾値決定機能と、
    前記対象画像データに対して、前記二値化閾値を用いた二値化処理を実行して、前記二値画像データを生成する二値化処理機能と、
    を備える、画像処理プログラム。
JP2012081493A 2012-03-30 2012-03-30 画像処理装置および画像処理プログラム Active JP5935454B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012081493A JP5935454B2 (ja) 2012-03-30 2012-03-30 画像処理装置および画像処理プログラム
EP13156806.5A EP2645304B1 (en) 2012-03-30 2013-02-26 Image processing device determining binarizing threshold value
US13/777,431 US9092892B2 (en) 2012-03-30 2013-02-26 Image processing device determining binarizing threshold value

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012081493A JP5935454B2 (ja) 2012-03-30 2012-03-30 画像処理装置および画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2013211750A JP2013211750A (ja) 2013-10-10
JP5935454B2 true JP5935454B2 (ja) 2016-06-15

Family

ID=47845729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012081493A Active JP5935454B2 (ja) 2012-03-30 2012-03-30 画像処理装置および画像処理プログラム

Country Status (3)

Country Link
US (1) US9092892B2 (ja)
EP (1) EP2645304B1 (ja)
JP (1) JP5935454B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5958023B2 (ja) * 2012-03-30 2016-07-27 ブラザー工業株式会社 画像処理装置および画像処理プログラム
JP5935454B2 (ja) 2012-03-30 2016-06-15 ブラザー工業株式会社 画像処理装置および画像処理プログラム
CN106033528A (zh) * 2015-03-09 2016-10-19 富士通株式会社 从彩色文档图像中提取特定区域的方法和设备
JP5992567B1 (ja) * 2015-03-20 2016-09-14 株式会社Pfu 日付識別装置
JP6451461B2 (ja) * 2015-03-31 2019-01-16 ブラザー工業株式会社 画像処理プログラム、画像処理装置、及び、画像処理方法
US11587327B2 (en) 2015-10-01 2023-02-21 Intellivision Technologies Corp Methods and systems for accurately recognizing vehicle license plates
US10706330B2 (en) 2015-10-01 2020-07-07 Intellivision Technologies Corp Methods and systems for accurately recognizing vehicle license plates
US10198819B2 (en) 2015-11-30 2019-02-05 Snap Inc. Image segmentation and modification of a video stream
JP2017135613A (ja) 2016-01-28 2017-08-03 ブラザー工業株式会社 画像処理装置およびコンピュータプログラム
JP2018022343A (ja) * 2016-08-03 2018-02-08 株式会社東芝 画像処理装置、および画像処理方法
JP6834417B2 (ja) * 2016-11-30 2021-02-24 ブラザー工業株式会社 画像処理装置及びプログラム
CN106951902B (zh) * 2017-03-27 2020-10-20 深圳怡化电脑股份有限公司 一种图像二值化处理方法及装置
JP6781406B2 (ja) 2017-03-28 2020-11-04 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
GB2577989B (en) * 2018-09-30 2021-03-24 Lenovo Beijing Co Ltd Information processing method and electronic device
US11238618B2 (en) * 2019-11-26 2022-02-01 International Business Machines Corporation Image recognition

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01158879A (ja) * 1987-12-15 1989-06-21 Mitsubishi Heavy Ind Ltd 二値画像形成装置
JPH0997309A (ja) 1995-09-28 1997-04-08 Glory Ltd 文字抽出装置
KR100239357B1 (ko) 1997-04-17 2000-01-15 구자홍 영상 표시 장치의 문자 처리 방법 및 장치
JPH11312218A (ja) * 1998-04-28 1999-11-09 Matsushita Electric Ind Co Ltd 文字最適2値化装置
JP2000333022A (ja) 1999-05-17 2000-11-30 Canon Inc 画像の二値化方法及び装置並びに記憶媒体
JP2001119577A (ja) * 1999-10-15 2001-04-27 Sharp Corp 画像処理装置
JP4228530B2 (ja) * 2000-02-09 2009-02-25 富士通株式会社 画像処理方法及び画像処理装置
US7426291B2 (en) * 2002-07-29 2008-09-16 Seiko Epson Corporation Apparatus and method for binarizing images of negotiable instruments using a binarization method chosen based on an image of a partial area
JP2004199622A (ja) * 2002-12-20 2004-07-15 Ricoh Co Ltd 画像処理装置、画像処理方法、記録媒体およびプログラム
ES2262035T3 (es) 2003-01-08 2006-11-16 Glory Ltd. Dispositivo para la lectura de los numeros de serie de billetes de banco y metodo correspondiente.
EP1555804A3 (en) 2004-01-19 2006-08-16 Ricoh Company, Ltd. Image processing apparatus, image processing program and storage medium
JP2006085665A (ja) 2004-08-18 2006-03-30 Ricoh Co Ltd 画像処理装置、画像処理プログラム、記憶媒体、画像処理方法および画像形成装置
ATE501487T1 (de) 2004-12-21 2011-03-15 Canon Kk Segmentierung eines digitalen bildes und herstellung einer kompakten repräsentation
JP4238902B2 (ja) * 2006-09-04 2009-03-18 日本電気株式会社 文字ノイズ除去装置、文字ノイズ除去方法、文字ノイズ除去プログラム
JP4569785B2 (ja) 2008-01-07 2010-10-27 富士ゼロックス株式会社 二値化装置及び二値化処理プログラム
US8351720B2 (en) * 2008-04-24 2013-01-08 Hewlett-Packard Development Company, L.P. Method and system providing edge enhanced image binarization
US8213735B2 (en) * 2008-10-10 2012-07-03 Accusoft Corporation Methods and apparatus for performing image binarization
KR101566196B1 (ko) * 2009-03-02 2015-11-05 삼성전자주식회사 히스토그램 분석을 이용한 영상 분류 방법 및 장치, 이를 이용한 문자 인식 방법 및 장치
TWI409718B (zh) 2009-12-04 2013-09-21 Huper Lab Co Ltd 移動中車輛之車牌定位方法
JP5776419B2 (ja) 2011-07-29 2015-09-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5853470B2 (ja) 2011-07-29 2016-02-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5701182B2 (ja) 2011-08-18 2015-04-15 株式会社Pfu 画像処理装置、画像処理方法及びコンピュータプログラム
EP2573670B1 (en) 2011-09-16 2017-12-20 Huawei Device (Dongguan) Co., Ltd. Character display method and device
JP5935454B2 (ja) 2012-03-30 2016-06-15 ブラザー工業株式会社 画像処理装置および画像処理プログラム
JP5958023B2 (ja) * 2012-03-30 2016-07-27 ブラザー工業株式会社 画像処理装置および画像処理プログラム

Also Published As

Publication number Publication date
US9092892B2 (en) 2015-07-28
EP2645304B1 (en) 2023-04-12
JP2013211750A (ja) 2013-10-10
EP2645304A2 (en) 2013-10-02
EP2645304A3 (en) 2015-03-25
US20130257892A1 (en) 2013-10-03

Similar Documents

Publication Publication Date Title
JP5958023B2 (ja) 画像処理装置および画像処理プログラム
JP5935454B2 (ja) 画像処理装置および画像処理プログラム
JP5776419B2 (ja) 画像処理装置、画像処理プラグラム
US9135722B2 (en) Perceptually lossless color compression
US6999619B2 (en) Processing for accurate reproduction of symbols and other high-frequency areas in a color image
JP5874497B2 (ja) 画像処理装置および画像処理プログラム
JP2000175051A (ja) デジタル画像デ―タの区分方法並びにデ―タブロックの区分方法及び分類方法
JP2005150855A (ja) カラー画像の圧縮方法及びカラー画像圧縮装置
KR101597739B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체
JP2009031876A (ja) 画像処理装置およびそれを備えた画像形成装置、画像読取装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体
JP4362538B2 (ja) 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
JP5939154B2 (ja) 画像処理装置およびコンピュータプログラム
KR20120132314A (ko) 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체
JP5796392B2 (ja) 画像処理装置、および、コンピュータプラグラム
JP5884605B2 (ja) 画像処理装置およびプログラム
JP6024795B2 (ja) 画像処理装置、画像処理プラグラム
JP4228905B2 (ja) 画像処理装置及びプログラム
JP6145983B2 (ja) 画像処理装置およびコンピュータプログラム
US20110311139A1 (en) Automated segmentation tuner
KR102051130B1 (ko) 이웃 정보에 기반한 이미지의 문서 영역 분리 방법 및 장치
JP2021097288A (ja) 画像処理システムおよびプログラム
JP2005202841A (ja) 画像処理方法及び装置
KR20040036843A (ko) 디지털 화질 개선방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150123

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160425

R150 Certificate of patent or registration of utility model

Ref document number: 5935454

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150