JP2012010188A - 画像処理装置およびプログラム - Google Patents

画像処理装置およびプログラム Download PDF

Info

Publication number
JP2012010188A
JP2012010188A JP2010145518A JP2010145518A JP2012010188A JP 2012010188 A JP2012010188 A JP 2012010188A JP 2010145518 A JP2010145518 A JP 2010145518A JP 2010145518 A JP2010145518 A JP 2010145518A JP 2012010188 A JP2012010188 A JP 2012010188A
Authority
JP
Japan
Prior art keywords
connected component
feature amount
pixel
size
reference range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010145518A
Other languages
English (en)
Other versions
JP5648340B2 (ja
Inventor
Koichi Fujii
晃一 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2010145518A priority Critical patent/JP5648340B2/ja
Publication of JP2012010188A publication Critical patent/JP2012010188A/ja
Application granted granted Critical
Publication of JP5648340B2 publication Critical patent/JP5648340B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】大きさが一律の参照範囲を用いて画像から特定の画素群を抽出する場合に比べて、その抽出の精度を向上させる。
【解決手段】CPU11は、入力された画像を、下地領域に沿って連結成分ごとに分離し、分離した連結成分を順次取得する。そして、CPU11は、取得した連結成分の特徴量を生成する。次に、CPU11は、その特徴量に応じて参照範囲の大きさを設定し、連結成分の画素ごとに参照範囲の位置を決定するとともに、位置が決まった参照範囲に属する全画素の代表値を算出する。そして、CPU11は、算出した代表値との差が閾値を超える画素値を有する画素群を前景画素群として抽出する。
【選択図】図1

Description

本発明は、画像処理装置およびプログラムに関する。
背景の上に文字列等の前景が描かれた画像から、その前景を抽出するための種々の技術が開発されている。特許文献1には、多値画像について算出したヒストグラムに基づいて複数のしきい値を選択し、当該多値画像を当該複数のしきい値を用いてそれぞれ2値化すると共に、生成した2値化画像に含まれる黒領域相互の対応関係に関する解析の結果に基づいて、当該多値画像を最終的に2値化する際の黒領域(文字領域)の座標情報、しきい値、並びに反転するか否かを当該黒領域毎に決定し、その決定した情報に従って2値化を行う技術が記載されている。特許文献2には、像域分離工程が終了したと判断されるまで、画像中の中間像域を背景像域および中間像域へと、さらに分離する像域分離工程を再帰的に繰返して、像域を抽出する技術が記載されている。特許文献3には、画像データに対して所定の参照範囲内に属する画素が持つ値の代表値を算出し、算出した代表値よりも所定値以上大きい値を有する第1の画素群を前記画像データから抽出するとともに、当該代表値よりも所定値以上小さい値を有する第2の画素群を前記画像データから抽出し、これら第1の画素群および第2の画素群の両方を基に、前記画像データから特定の画像領域を抽出する技術が記載されている。
特開2001−69346号公報 特開平8−186706号公報 特開2002−175532号公報
本発明の目的は、大きさが一律の参照範囲を用いて画像から特定の画素群を抽出する場合に比べて、その抽出の精度を向上させることにある。
上述した課題を解決するため、本発明の請求項1に係る画像処理装置は、下地を表す画素以外の複数の画素が連結されて成る連結成分を画像から取得する取得手段と、前記取得手段により取得された連結成分の特徴を示す特徴量を生成する生成手段と、前記連結成分に対応づけられ、複数の画素を含む範囲である参照範囲の大きさを、前記生成手段により生成された当該連結成分の特徴を示す特徴量に応じて設定する設定手段と、前記設定手段により大きさが設定された前記参照範囲の位置を、前記連結成分の画素ごとに定め、予め定められた色空間において画素の色を表す色成分毎の階調値である画素値を前記位置が定められた当該参照範囲に属する全画素について集計して、当該画素値を代表する代表値を算出する算出手段と、前記算出手段が算出した代表値との差の絶対値が閾値を超える画素値を有する画素群を、前記連結成分から抽出する抽出手段とを具備することを特徴とする。
本発明の請求項2に係る画像処理装置は、請求項1に記載の態様において、前記連結成分は、背景を表す複数の画素である背景画素群と、前記背景に重ねて描かれる前景を表す複数の画素である前景画素群とを含み、前記特徴量は、前記連結成分に含まれる前記前景画素群の大きさを推定可能な量であり、前記設定手段は、前記特徴量により推定される前記前景画素群の大きさが大きいほど、前記参照範囲の大きさを大きく設定することを特徴とする。
本発明の請求項3に係る画像処理装置は、請求項2に記載の態様において、前記特徴量は、前記連結成分の大きさに関する特徴を示す量であり、前記設定手段は、前記特徴量により示される前記連結成分の大きさが大きいほど、前記参照範囲の大きさを大きく設定することを特徴とする。
本発明の請求項4に係る画像処理装置は、請求項3に記載の態様において、前記大きさに関する特徴量は、画素の配列方向に沿った矩形領域のうち前記連結成分に外接する矩形領域の短手方向の長さであり、前記設定手段は、前記特徴量により示される前記矩形領域の短手辺の長さが長いほど、前記参照範囲の大きさを大きく設定することを特徴とする。
本発明の請求項5に係る画像処理装置は、請求項3に記載の態様において、前記大きさに関する特徴量は、画素の配列方向に沿った矩形領域のうち前記連結成分に外接する矩形領域に対する前記連結成分の大きさに関する割合であり、前記設定手段は、前記特徴量により示される前記割合が大きいほど、前記参照範囲の大きさを大きく設定することを特徴とする。
本発明の請求項6に係る画像処理装置は、請求項5に記載の態様において、前記大きさに関する特徴量は、前記連結成分に外接する矩形領域に含まれる全画素の数に対する前記連結成分に含まれる画素の数の割合である矩形内画素密度であることを特徴とする。
本発明の請求項7に係る画像処理装置は、請求項6に記載の態様において、前記生成手段は、前記矩形内画素密度に加え、前記矩形領域の外周の長さに対する前記連結成分の外周の長さの比である矩形度を前記特徴量として生成し、前記設定手段は、前記特徴量のうち前記矩形内画素密度が閾値を超える場合に、前記矩形度が1に近いほど、前記参照範囲の大きさを大きく設定することを特徴とする。
本発明の請求項8に係る画像処理装置は、請求項3に記載の態様において、前記大きさに関する特徴量は、前記連結成分の太さであり、前記設定手段は、前記特徴量により示される前記連結成分の太さが太いほど、前記参照範囲の大きさを大きく設定することを特徴とする。
本発明の請求項9に係る画像処理装置は、請求項2に記載の態様において、前記特徴量は、前記連結成分に含まれる各画素についての、当該画素と当該画素に隣接する画素との画素値の差に関する量であり、前記設定手段は、前記特徴量により示される前記量が小さいほど、前記参照範囲の大きさを大きく設定することを特徴とする。
本発明の請求項10に係る画像処理装置は、請求項9に記載の態様において、前記差に関する特徴量は、前記連結成分に含まれる画素の数に対する、前記差が閾値を超える画素の数の割合であり、前記設定手段は、前記特徴量により示される前記割合が小さいほど、前記参照範囲の大きさを大きく設定することを特徴とする。
本発明の請求項11に係る画像処理装置は、請求項9に記載の態様において、前記差に関する特徴量は、前記差の累計値を前記連結成分に含まれる画素の数で除算した値であり、前記設定手段は、前記特徴量により示される前記値が小さいほど、前記参照範囲の大きさを大きく設定することを特徴とする。
本発明の請求項12に係る画像処理装置は、請求項1に記載の態様において、前記生成手段は、前記連結成分の複数種類の特徴を示す特徴量をそれぞれ生成し、前記設定手段は、前記生成手段により生成された複数の特徴量の組み合わせに応じて前記参照範囲の大きさを設定することを特徴とする。
本発明の請求項13に係る画像処理装置は、請求項1に記載の態様において、前記生成手段は、前記連結成分の第1の特徴を示す第1特徴量を生成し、且つ、当該第1特徴量が或る条件を満たす場合には、前記第1の特徴と異なる前記連結成分の第2の特徴を示す第2特徴量を生成し、前記設定手段は、前記生成手段が前記第2特徴量を生成しなかった場合には、前記生成手段により生成された前記第1特徴量に応じて前記参照範囲の大きさを設定し、前記生成手段が前記第2特徴量を生成した場合には、当該第2特徴量に応じて前記参照範囲の大きさを設定することを特徴とする。
本発明の請求項14に係る画像処理装置は、請求項1に記載の態様において、前記生成手段は、前記連結成分の第1の特徴を示す第1特徴量を生成した後、前記第1の特徴と異なる前記連結成分の第2の特徴を示す第2特徴量を生成し、前記設定手段は、前記生成手段により生成された前記第1特徴量に応じて前記参照範囲の大きさを設定した後、前記生成手段により生成された前記第2特徴量に応じて、設定した前記大きさを修正することを特徴とする。
本発明の請求項15に係る画像処理装置は、請求項1から14のいずれかに記載の態様において、画像を入力する入力手段と、前記入力手段により入力された画像を、下地に属する画素に沿って領域ごとに分離する分離手段とを具備し、前記取得手段は、前記分離手段により分離された各領域を前記連結成分として取得することを特徴とする。
本発明の請求項16に係る画像処理装置は、請求項15に記載の態様において、前記分離手段は、前記画像を前記領域ごとに分離するとともに、当該領域の属性を示す属性情報を生成し、前記取得手段は、前記分離手段により分離された各領域を前記連結成分として取得するとともに、当該各領域について前記分離手段により生成された前記属性情報をそれぞれ取得し、前記設定手段は、前記参照範囲の大きさを、前記生成手段により生成された特徴量および前記取得手段により取得された前記属性情報により示される前記属性の組み合わせに応じて設定することを特徴とする。
本発明の請求項17に係る画像処理装置は、請求項1から16のいずれかに記載の態様において、前記算出手段は、前記参照範囲に属する全画素の画素値の平均値を前記代表値として算出することを特徴とする。
また、本発明の請求項18に係るプログラムは、コンピュータを、下地を表す画素以外の複数の画素が連結されて成る連結成分を画像から取得する取得手段と、前記取得手段により取得された連結成分の特徴を示す特徴量を生成する生成手段と、前記連結成分に対応づけられ、複数の画素を含む範囲である参照範囲の大きさを、前記生成手段により生成された当該連結成分の特徴を示す特徴量に応じて設定する設定手段と、前記設定手段により大きさが設定された前記参照範囲の位置を、前記連結成分の画素ごとに定め、予め定められた色空間において画素の色を表す色成分毎の階調値である画素値を前記位置が定められた当該参照範囲に属する全画素について集計して、当該画素値を代表する代表値を算出する算出手段と、前記算出手段が算出した代表値との差の絶対値が閾値を超える画素値を有する画素群を、前記連結成分から抽出する抽出手段として機能させるためのプログラムである。
請求項1、17に記載の画像処理装置によれば、大きさが一律の参照範囲を用いて画像から特定の画素群を抽出する場合に比べて、その抽出の精度を向上させることができる。
請求項2に記載の画像処理装置によれば、様々な大きさの前景画素群について、その抽出精度を向上させることができる。
請求項3、8,9に記載の画像処理装置によれば、他の特徴量を用いる場合に比較して、前景画素群の大きさをより正確に推定し、前景画像群の抽出精度を向上することができる。
請求項4に記載の画像処理装置によれば、連結成分の大きさに関する量のうち、より簡易な処理により、画像から特定の画素群を精度よく抽出することができる。
請求項5、6に記載の画像処理装置によれば、特定の画素群を含んだ連結成分の配列方向や形状によって生じる抽出精度の低下を抑制することができる。
請求項7に記載の画像処理装置によれば、特定の画素群を含んだ連結成分の形状によって生じる抽出精度の低下を抑制することができる。
請求項10、11に記載の画像処理装置によれば、連結成分に含まれる特定の画素群の細かさに応じて生じる抽出精度の低下を抑制することができる。
請求項12、14に記載の画像処理装置によれば、単一の特徴量を用いて特定の画素群を抽出する場合に比べて、その抽出の精度を向上させることができる。
請求項13に記載の画像処理装置によれば、単一の特徴量を用いて特定の画素群を抽出する場合に比べて、その抽出の精度を向上させるとともに、処理負荷を軽減することができる。
請求項15に記載の画像処理装置によれば、画像が下地に属する画素を含んでいる場合であっても、その画像から特定の画素群を抽出することができる。
請求項16に記載の画像処理装置によれば、特徴量のみを用いて特定の画素群を抽出する場合に比べて、その抽出の精度を向上させるとともに、処理負荷を軽減することができる。
請求項18に記載のプログラムによれば、大きさが一律の参照範囲を用いて画像から特定の画素群を抽出する場合に比べて、その抽出の精度を向上させることができる。
画像処理システムのハードウェア構成を説明するためのブロック図である。 本発明の実施形態に係る画像処理装置の機能的構成を示すブロック図である。 生成手段が生成する連結成分の特徴量について説明するための図である。 適切な大きさの参照範囲の例を示す図である。 不適切な大きさの参照範囲の例を示す図である。 図5で示した参照範囲が機能する例を示す図である。 参照範囲が小さすぎるために前景画素群を抽出できない例を示す図である。 連結成分と参照範囲の大きさに関する関係の一例を示す図である。 画像処理装置の動作を説明するためのフロー図である。 斜めに配置された文字列を有する連結成分の例である。 外周が矩形でない連結成分の例を示す図である。 連結成分の太さを算出する処理を説明するための図である。 連結成分の太さと参照範囲の大きさとの関係を示す図である。 連結成分のエッジ画素密度を算出する処理を説明するための図である。 ルックアップテーブルの一例を示す図である。 変形例における画像処理装置の動作を示すフロー図である。 変形例における画像処理装置の動作を示すフロー図である。 変形例における画像処理装置の動作を示すフロー図である。
1.定義
実施形態において使用する語を以下のように定義する。
「画」とは、対象を描いたものである。
「下地」とは、画が描かれていない部分である。
「画像」とは、下地および下地に重ねて描かれた画を、縦および横に配列された複数の画素で表したものである。
「画素値」とは、予め定められた色空間において画素の色を表す色成分毎の階調値である。
「下地色」とは、画像の下地を構成する色であり、予め定められた色(例えば白色)でも良いし、画像毎に検知した色でも良い。
「描画色」とは、画を描くために用いられる色、すなわち描画に用いられる色であり、下地色以外の色である。
「下地画素」とは、下地色を示す画素値を有する画素である。
「下地領域」とは、下地画素からなる領域である。
「描画画素」とは、描画色を示す画素値を有する画素である。
「描画領域」とは、描画画素から成る領域である。
「連結成分」とは、描画画素が連結されて成る成分である。
「前景」とは、複数の対象を或る方向から重ねて見た様子を描いた画のうち、その方向における最も手前に重ねて描かれた対象を描いた部分である。例えば、写真の上に文字を重ねて描かれた画の場合、文字の部分が前景である。
「背景」とは、画のうち、前景以外の部分である。例えば、写真の上に文字を重ねて描かれた画の場合、文字以外の部分が背景である。
「前景画素群」とは、連結成分に含まれる描画画素のうち前景を表す複数の画素である。
「背景画素群」とは、連結成分に含まれる描画画素のうち背景を表す複数の画素である。
「前景抽出処理」とは、連結成分に含まれる複数の描画画素について順次検査して、その連結成分に含まれる前景画素群を抽出する処理である。
「注目画素」とは、前景抽出処理において、検査のために注目する連結成分の描画画素である。
「参照範囲」とは、前景抽出処理において、連結成分に対応付けられた範囲であって、注目画素ごとに位置を定められて検査される複数の画素を含む範囲である。なお、参照範囲は、注目画素を含んでいてもよく、また、注目画素の周囲にある画素を含んでいてもよい。
「代表値」とは、複数の値を代表する値であり、それら複数の値の平均値、中央値、最頻値等の統計量を含む値である。
「平均値」とは、複数の値の平均を表す値であり、例えば相加平均、相乗平均、調和平均等である。
「矩形領域」とは、画素の配列方向に沿った矩形の領域である。
「長手辺」とは、矩形の2組の向かい合う辺のうち長い方の辺である。
「短手辺」とは、矩形の2組の向かい合う辺のうち短い方の辺である。
「距離変換」とは、連結成分に含まれる描画画素ごとに、その描画画素から下地画素までの最短距離を表す距離値を割り当てる処理である。
「距離変換画像」とは、距離変換により各描画画素に割り当てられた距離値に応じて、その描画画素の画素値を決定して作られた画像である。距離変換画像における各画素値は、輪郭からその画素までの距離値を示しており、連結成分の内部に入るほど大きな値となる。
「連結成分の太さ」とは、連結成分の距離変換画像における画素値の最大値に基づいて定められる値であり、例えば、その最大値の2倍である。
「矩形内画素密度」とは、連結成分に外接する矩形領域に含まれる全画素の数に対する、その連結成分に含まれる描画画素の数の割合である。
辺や周等の「長さ」とは、これらを構成する画素の数である。
「矩形度」とは、連結成分に外接する矩形領域の外周の長さに対する、その連結成分の外周の長さの比である。
「隣接画素」とは、或る画素に隣接する画素である。ここで、画素の隣接する方向には、縦方向、横方向、斜め方向が含まれる。
「エッジ量」とは、或る画素について定められる量であって、その画素と隣接画素との各画素値の差に関する量である。ここで、画素値の差には、画素値から算出される色成分についての差も含まれる。例えば、画素値から算出した明度・彩度・色相の3成分のうち、1成分のみについての差も、この差に含まれる。また、画素値がベクトルとして表される場合には、この画素値の差は、各成分について求めた差の絶対値の合計であってもよいし、ベクトル同士の距離であってもよい。例えば、或る画素と隣接画素とについて、明度・彩度・色相の3成分の差を求める場合には、その3成分を表す3次元空間における各ベクトルが示す点の距離を画素値の差としてもよい。また、画素値の差とは、上記の或る画素の画素値から隣接画素の画素値を減算した値でも、隣接画素の画素値から或る画素の画素値を減算した値でもよく、これらの差の絶対値であってもよい。なお、上述した画素値の差を画素のエッジ量としてもよく、また、隣接画素を複数採用する場合には、その画素の画素値と、各隣接画素の画素値とのそれぞれの差の合計値をその画素のエッジ量としてもよい。
「エッジ画素」とは、予め定められた閾値を超えるエッジ量を有する画素である。
「エッジ画素密度」とは、連結成分に含まれる全画素の数に対する、その連結成分に含まれるエッジ画素の数の割合である。
「エッジ量率」とは、連結成分に含まれる全画素のエッジ量の累計値を、その連結成分に属する全画素の数で除算した値である。
2.構成
2−1.全体構成
本発明の実施形態である画像処理システム10の構成を説明する。
図1は、画像処理システム10のハードウェア構成を説明するためのブロック図である。図1に示すように、画像処理システム10は、画像処理装置1とスキャナ2を含む。
スキャナ2は、用紙等の記録媒体に光を照射し、反射光強度を測定することにより、記録媒体上に形成されている画像を読み取って、この画像を示す原画像データG0を生成する光学読取装置である。
画像処理装置1は、スキャナ2が生成した原画像データG0に対して前景抽出処理を行うことにより、その原画像データG0が示す画像から前景を抽出する装置である。図1の二点鎖線で囲んだ内側は、画像処理装置1を示している。
CPU11は、ROM12に記憶されているコンピュータプログラム(以下、単にプログラムという)を読み出して実行することにより画像処理装置1の各部を制御する。例えば、CPU11は、後述する生成手段や算出手段として機能する。ROM12は半導体素子等で構成された読み出し専用の不揮発性記憶装置である。このROM12には、種々のプログラムやBIOS(Basic Input/Output System)が記憶されている。RAM13はCPU11がプログラムを実行する際のワークエリアとして利用される。VRAM(Video RAM)14は、画像を示すデータ(以下、画像データという)を記憶するRAMである。入力部15は、スキャナやコンピュータなどの外部入力装置とのインターフェースであり、CPU11の制御の下、画像データを受け付ける。ここでは、入力部15は、スキャナ2から入力される原画像データG0を受け付ける。
2−2.機能的構成
図2は、本発明の実施形態に係る画像処理装置1の機能的構成を示すブロック図である。図2の二点鎖線の枠で囲まれた各手段は、画像処理装置1のCPU11がプログラムを実行することにより実現される。
入力手段110は、スキャナ2が生成した原画像データG0を画像処理装置1に入力する手段である。具体的には、CPU11が入力部15およびバスを介してスキャナ2から原画像データG0を取り込み、VRAM14に記憶する。
分離手段111は、入力手段110によりVRAM14に記憶された原画像データG0が表す画像を、連結成分ごとに分離する手段である。具体的には、VRAM14に記憶された原画像データG0の各画素の濃度や明度に基づいて、CPU11がラベリング処理をすることにより、原画像データG0が示す画像を、下地領域に沿って連結成分ごとに分離する。
また、分離手段111は、分離した連結成分の属性を示す属性情報を生成する。具体的には、分離手段111は、連結成分に含まれる描画画素の画素値から求まる色成分のヒストグラムを算出し、このヒストグラムの急峻さを表す数値を求める。ヒストグラムの急峻さは、そのピーク値と平均値との差が閾値を超えているか否かによって求めればよい。そして、求めたこの数値に応じて、連結成分の属性を、「絵柄」または「写真」のいずれかに特定する。また、分離手段111は、連結成分に含まれる描画画素を行または列ごとに分離し、行ごとに分離した場合には各行について横方向に、列ごとに分離した場合には各列について縦方向に画素値を走査してそれぞれの画素値から求まる色成分のヒストグラムを算出する。そして、ピークと平均値との差が或る閾値(閾値Aという)以下になるヒストグラムと、その差が閾値Aよりも高い閾値である閾値Bを超えるヒストグラムとが共存していると判断したときに、分離手段111は、その連結成分の属性を「表」と特定する。
取得手段112は、分離手段111により分離された連結成分を取得する手段である。原画像データG0が示す画像に連結成分が複数含まれていた場合、取得手段112は、複数の連結成分を逐次取得する。取得手段112が取得した連結成分は、生成手段113および算出手段115に供給される。
生成手段113は、取得手段112により取得された連結成分の特徴を示す特徴量を生成する手段である。この特徴量は、連結成分に含まれる前景画素群の大きさを推定可能なの特徴量である。具体的には、生成手段113は、連結成分の大きさに関する特徴を示す特徴量を生成する。連結成分よりも大きな前景画素群はその連結成分の中に収めることはできず、前景画素群の大きいと連結成分も大きい傾向にあるからである。
図3は、生成手段113が生成する連結成分の特徴量について説明するための図である。生成手段113は、まず連結成分に外接する矩形領域を特定する。そして、生成手段113は、連結成分の大きさに関する特徴量としてその矩形領域の短手辺の長さを表す値を生成する。図3に示した連結成分C1には背景画素群B1と前景画素群F1が含まれている。前景画素群F1は、横書きされた「ABCDE」という文字列である。連結成分C1の形状は、画素の縦横方向に沿った矩形であるから、これに外接する矩形領域R1は、連結成分C1の領域と一致する。生成手段113は、連結成分C1から矩形領域R1を特定し、連結成分C1の特徴量として矩形領域R1の短手辺の長さである値L1を生成する。
連結成分C2には背景画素群B2と前景画素群F2が含まれている。前景画素群F2は、前景画素群F1の2倍の大きさのフォントで横書きされた「ABCDE」という文字列である。図3に示す例では、前景画素群F1よりも大きい前景画素群F2を内側に描くため、連結成分C2は連結成分C1よりも大きい。連結成分C2の形状も、画素の縦横方向に沿った矩形であるため、これに外接する矩形領域R2は、連結成分C2の領域と一致する。生成手段113は、連結成分C2から矩形領域R2を特定し、連結成分C2の特徴量として矩形領域R2の短手辺の長さである値L2を生成する。
連結成分C3には前景画素群として縦書きされた「ABCDE」という文字列が含まれている。連結成分C3の形状も、画素の縦横方向に沿った矩形であるため、これに外接する矩形領域R3は、連結成分C3の領域と一致する。また、連結成分C3は、上述の縦書きされた文字列である前景画素群に沿った大きさの領域であるため、縦方向が長手である。したがって、生成手段113は、連結成分C3の特徴量として矩形領域R3の短手辺の長さである値L3を生成する。
連結成分C4には連結成分C1と同じ横書きされた「ABCDE」という文字列が前景画素群として含まれている。連結成分C4の形状は矩形ではあるが、画素の縦横方向に沿っていないため、図3に示すようにこれに外接する矩形領域R4は、連結成分C4の領域と一致しない。したがって、生成手段113は、連結成分C4の特徴量として矩形領域R4の短手辺の長さである値L4を生成する。
連結成分C5には横書きされた「AABCDEE」という文字列と縦書きされた「ABCDE」という文字列を交差させた前景画素群が含まれている。連結成分C5は、このような前景画素群に沿った大きさの領域であるため、矩形ではなく十字型である。そのため、図3に示すように連結成分C5に外接する矩形領域R5は、連結成分C5の領域と一致しない。したがって、生成手段113は、連結成分C5の特徴量として矩形領域R5の短手辺の長さである値L5を生成する。
図2に戻る。設定手段114は、生成手段113によって生成された特徴量に応じて、参照範囲の大きさを設定する手段である。具体的には、設定手段114は、生成手段113が生成した特徴量Lが閾値Lx以下である場合、特徴量Lに係数αを乗算した値W(=α×L)を参照範囲の大きさとして設定する。
算出手段115は、取得手段112により取得される連結成分の注目画素に対して、設定手段114により大きさが設定された参照範囲の位置を定め、その参照範囲内に属する各画素の画素値の代表値を算出する手段である。具体的には、算出手段115は、設定手段114により大きさが設定された参照範囲の中央の画素が注目画素となるように、参照範囲の位置を定める。そして、算出手段115は、参照範囲内の画素について画素値の相加平均を算出し、算出された平均値を上述した代表値とする。
抽出手段116は、算出手段115が算出した代表値との差の絶対値が閾値を超える画素値を有する画素群を連結成分から抽出する手段である。具体的には、抽出手段116は、連結成分の各画素について、その画素値と代表値との差の絶対値を算出し、閾値を超えるか否かをそれぞれ判定する。そして、代表値との差の絶対値が閾値を超えると判定された画素群を表すデータとして抽出画像データG1を生成する。これにより抽出された画素群は、前景画素群として特定され、文字認識処理等に用いられる。
ここで、参照範囲の大きさと前景画素群の大きさの関係について図4〜7を用いて説明する。ここでは、画像全体に対して一律の参照範囲の大きさで代表値を算出し、前景を抽出するとする。図4は、適切な大きさの参照範囲の例を示す図である。図4(a)に示すように、縦9画素・横13画素の背景画素群B10の上に、縦7画素・横4画素を占める「E」という文字の前景画素群F10が描かれている。連結成分C10は、背景画素群B10と前景画素群F10とを含む。ここで、設定手段114が参照範囲の大きさとしてW=5を設定したとすると、算出手段115は、連結成分C10の画素ごとに、その画素が中心となるように縦5画素・横5画素の参照範囲の位置を定めて、その参照範囲に属する全画素の画素値を代表する代表値を算出する。図4(a)に示す参照範囲RW11は、連結成分C10の画素のうち★印を付した画素を注目画素としたときに算出手段115が用いる参照範囲である。このとき、図4(b)に示すように、抽出手段116は、前景画素群F10のみを抽出可能である。
一方、図5は、不適切な大きさの参照範囲の例を示す図である。図4(a)に示した背景画素群B10および前景画素群F10に対して、参照範囲の大きさとしてW=13を設定したとすると、図5(a)に示すように、算出手段115は、例えば連結成分C10の画素のうち★印を付した画素を注目画素としたときに、参照範囲RW12を用いる。これにより、参照範囲RW12には多くの下地領域Uに属する画素を含むこととなり、代表値が下地色の影響を強く受ける。そのため、背景画素群B10に属する画素の画素値と代表値との差も大きくなり、図5(b)に示すように、連結成分C10の全てが抽出手段116によって抽出されてしまうこととなる。
ところが、上述の大きさの前景画素群F10を抽出する際には不適切であった参照範囲であっても、前景画素群の大きさが異なると適切である場合がある。図6は、図5で示した参照範囲が機能する例を示す図である。図6(a)に示すように、縦22画素・横15画素の背景画素群B20の上に、縦19画素・横11画素を占める「E」という文字の前景画素群F20が描かれている。連結成分C20は、背景画素群B20と前景画素群F20とを含む。ここで、設定手段114が参照範囲の大きさとして図5と同様にW=13を設定したとすると、算出手段115は、例えば連結成分C20の画素のうち★印を付した画素を注目画素としたときに、参照範囲RW21を用いる。この場合、図6(b)に示すように、抽出手段116は、前景画素群F20のみを抽出する。
一方、参照範囲が小さすぎると前景画素群を抽出できない場合がある。図7は、参照範囲が小さすぎるために前景画素群を抽出できない例を示す図である。図6(a)に示した背景画素群B20および前景画素群F20に対して、設定手段114が参照範囲の大きさとしてW=5を設定したとすると、図7(a)に示すように、算出手段115は、例えば連結成分C20の画素のうち★印を付した画素を注目画素としたときに、参照範囲RW22を用いる。この参照範囲RW22には前景画素群20以外の画素が全く含まれない。そのため、参照範囲RW22の代表値は注目画素の画素値と等しくなる。つまり、この注目画素は閾値を超えることがなく、抽出手段116によって抽出されない。したがって、設定手段114がW=5を設定した場合に、抽出手段116は、図7(b)に示すような画素群を連結成分C20から抽出することとなり、前景画素群F20は抽出されない。
以上、説明したとおり、画像全体に一律の大きさの参照範囲を使用して前景抽出を行うと、種々の大きさの前景を抽出することはできない。前景に応じて適切な参照範囲の設定が必要になる。参照範囲の適切な大きさは、前景画素群の大きさに関係している。前景画素群を含む連結成分がその前景画素群よりも小さいことはありえないので、前景画素群を含む連結成分の大きさからその前景画素群の大きさを推定することが可能である。
図8は、連結成分と参照範囲の大きさに関して予め定められた関係の一例を示す図である。図8に示す例では、連結成分の大きさが或る値(ここでは、閾値Lx)以下である範囲においては、その連結成分の大きさが大きくなるほど、適切な参照範囲の大きさが大きくなるように両者の関係を示す関係データが予め定められ、ROM12に記憶されている。このように定められていると、設定手段114は、この関係を参照して、生成手段113が生成した連結成分の大きさを示す特徴量から参照範囲の大きさを設定する。すなわち、上述したとおり、設定手段114は、閾値Lx以下の特徴量Lに対しては、係数αを用いてW=α×Lを参照範囲の大きさとして設定する。なお、この係数αは、背景画素群および前景画素群の画素値、並びに抽出手段116が用いる閾値との関係で定められる。例えば、係数αが1.0であると、図4(a)の例においては、W=9となり、図6(a)の例においては、W=15となる。係数αが1.0を超えると、参照範囲には下地領域Uが含まれることとなるため、係数αは1.0以下に設定することが一般的であるが、参照範囲に下地領域が含まれた場合の処理の方法を設定することにより、1.0を超える係数αを好適に用いることができる場合もある。
3.動作
図9は、本発明の実施形態である画像処理システム10のうち、画像処理装置1の動作を説明するためのフロー図である。
スキャナ2が画像の形成された用紙を読み取り、原画像データG0を生成すると、画像処理装置1のCPU11は、この原画像データG0の入力を行う(ステップS11)。CPU11は、原画像データG0が示す画像を、下地領域に沿って連結成分ごとに分離し(ステップS12)、分離した連結成分を順次取得する(ステップS13)。そして、CPU11は、取得した連結成分の特徴量を生成する。すなわち、連結成分に外接する矩形領域を特定し、その短手辺の長さを表す値を特徴量として生成する。次に、CPU11は、その特徴量に応じて参照範囲の大きさを設定し(ステップS15)、連結成分の画素ごとに参照範囲の位置を決定するとともに(ステップS16)、位置が決まった参照範囲に属する全画素の代表値(この場合は、相加平均値)を算出する(ステップS17)。そして、CPU11は、算出した代表値との差の絶対値が閾値を超える画素値を有する画素群を前景画素群として抽出する(ステップS18)。
以上のように連結成分の大きさに関する特徴量に応じて参照範囲の大きさを設定するので、前景抽出処理において、図5(b)や図7(b)に示したような不具合が生じる可能性は低減される。
4.変形例
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の変形例を組み合わせてもよい。
(1)連結成分の大きさに関する特徴量
上述の実施形態では、連結成分の大きさに関する特徴量として、連結成分に外接する矩形領域の短手辺の長さを生成していたが、連結成分の大きさに関する特徴量は他に様々なものを用いることができる。
(1−1)矩形内画素密度
連結成分について矩形内画素密度を算出し、その連結成分の大きさに関する特徴量として算出してもよい。図10は、前景画素群として、画素の配列方向に対して斜めに配置された文字列を有する連結成分の例である。図10(a)に示す連結成分C7は、図3に示した連結成分C1と同じ大きさの連結成分を、画素の配列方向に対して45度の角度に配置したものである。連結成分C7に外接する矩形領域R7は、一辺の長さがL7の正方形になる。つまり、実施形態に示した生成手段113により特徴量として短手辺の長さを算出すると、連結成分C1と同じ大きさであるにも関わらず、連結成分C7の特徴量は図3に示したL1よりも大きいL7となる。一方、特徴量として矩形内画素密度を算出すると、矩形領域R7には下地領域Uが多く含まれているから、図3に示した連結成分C1よりも連結成分C7の特徴量は小さくなる。図10(b)に示すように、矩形内画素密度と参照範囲の大きさとの関係を定めると、矩形内画素密度が或る範囲内にあるときに矩形内画素密度が大きくなるほど参照範囲の大きさが大きくなるように設定される。
設定手段114は、生成手段113が生成した特徴量である矩形内画素密度Dと、参照範囲の初期値であるW1と、係数D0、γにより、参照範囲の大きさWを次式に従って求める。
W=W1−γ×(D0−D)×U(D0−D)
ただし、U(x)はステップ関数であり、x≧0のときに1、x<0のときに0となる関数である。D0は完全な矩形と同等の大きさの前景画素群が入っていると考えられる矩形内画素密度である。W1は固定値でもよいし、連結成分の大きさに関する特徴量に基づいて導出されてもよい。
(1−2)矩形度
連結成分について矩形度を算出し、その連結成分の大きさに関する特徴量として算出してもよい。図11は、外周が矩形でない連結成分の例を示す図である。図11(a)に示す連結成分C8の外周は矩形ではないため、これに外接する矩形領域R8には下地領域Uが含まれる。しかし、連結成分C8は複雑な形状を有しているため、図10に示した矩形領域R7に比べると下地領域Uが占める面積比率は小さい。つまり、特徴量として矩形内画素密度を算出すると、図11に示した連結成分C8の特徴量は、図10に示した連結成分C7の特徴量よりも大きくなる場合がある。そこで、特徴量として矩形度を算出すると、連結成分C8の外周は矩形領域R8よりも長いから、連結成分C8の特徴量は、図10に示した連結成分C7や図3に示した連結成分C1よりも大きくなる。図11(b)に示すように、矩形度と参照範囲の大きさとの関係を定めると、矩形度が1に近いほど参照範囲の大きさが大きくなるように設定される。このように設定するのは、矩形度が1に近いほど、連結成分は、その連結成分に外接する矩形領域に近くなるため、連結成分に占める前景画素群の割合が高くなる傾向があるからである。
設定手段114は、生成手段113が生成した特徴量である矩形内画素密度Rと、参照範囲の初期値であるW1と、係数ζ1、ζ2により、参照範囲の大きさWを次式に従って求める。さらに、Wの最小値を設定し、最小値よりは小さくならないようにWを決定しても良い。
W = W1−ζ1×(R−1)×U(R−1)−ζ2×(1−R)×U(1−R)
ただし、U(x)は上述したステップ関数である。W1は固定値でもよいし、連結成分の大きさに関する特徴量に基づいて導出されてもよい。
(1−3)連結成分の太さ
連結成分の太さをその連結成分の大きさに関する特徴量として算出してもよい。図12は、連結成分の太さを算出する処理を説明するための図である。この場合、生成手段113は、具体的には距離変換を行う。図12(a)に示す連結成分C9について距離変換を行うと、図12(b)に示すような距離変換画像が得られる。この距離変換画像は画素値を1つの数値で描いており、下地領域Uからの距離が最大となる画素値は、同図に示すM=4である。したがって、連結成分の太さをその連結成分の距離変換画像における画素値の最大値の2倍とした場合には、同図に示す連結成分C9の太さは2×M=8である。
設定手段114は、生成手段113が生成した特徴量Mの2倍の値に係数αを乗算した値W(=α×2×M)を参照範囲の大きさとして設定する
図13は、連結成分の太さと参照範囲の大きさとの関係を示す図である。同図に示すように、連結成分の太さと参照範囲の大きさとの関係を定めると、連結成分の太さが或る範囲内にあるときに、この太さが太くなるほど参照範囲の大きさが大きくなるように設定される。このように設定するのは、連結成分の太さが太くなるほど、連結成分に占める前景画素群が大きくなる傾向があるからである。
(2)連結成分に含まれる各画素とその隣接画素との画素値の差に関する特徴量
上述の実施形態では、連結成分の特徴を示す特徴量として、連結成分の大きさに関する特徴量を生成していたが、連結成分の大きさ以外の特徴を示す特徴量を生成してもよい。
例えば、連結成分に含まれる各画素とその隣接画素との画素値の差に関する特徴量を生成してもよい。
(2−1)エッジ画素密度
連結成分のエッジ画素密度をその連結成分の特徴を示す特徴量として算出してもよい。図14は、連結成分のエッジ画素密度を算出する処理を説明するための図である。
図14(a)には背景画素群B11に重ねて「ABC」という文字列が書かれた前景画素群F11が描かれている。連結成分C11は、背景画素群B11と前景画素群F11とを含む。一方、図14(b)には、背景画素群B12に重ねて、前景画素群F11よりも小さなフォントで描かれた「ABCDEFGH」「IJKLMNOPQ」「RSTUVWXYZ」という3つの文字列が縦方向に並べて書かれた前景画素群F12が描かれている。生成手段113は、図14(a)および図14(b)にそれぞれ示した走査線Scnを縦方向に順次移動させて、各走査線上の各画素におけるエッジ量を算出する。ここで、エッジ画素とは、予め定められた閾値を超えるエッジ量を有する画素であるから、例えば、図14(c)に示すように、背景画素群B11と前景画素群F11との境にある画素はエッジ画素として判定される。このようにして、CPU11は、全ての走査線Scnにおいて判定したエッジ画素の数の、連結成分C11に含まれる画素の数に対する割合をエッジ画素密度Eとして算出する。
設定手段114は、生成手段113が生成した特徴量であるエッジ画素密度Eと、参照範囲の初期値であるW1と、係数E0、βにより、参照範囲の大きさWを次式に従って求める。
W=W1−β×E×U(E−E0)
ただし、U(x)は上述したステップ関数である。E0は初期値W1で想定される最大の前景画素群の太さに起因する値である。なお、E0は、実験的に求めてもよい。また、W1は固定値でもよいし、連結成分の大きさに関する特徴量に基づいて導出されてもよい。
連結成分内の隅々に小さな文字が敷き詰められて描かれていると、エッジ画素密度は大きくなる。反対に、エッジ画素密度が小さくなるほど、連結成分内には大きな文字が描かれている可能性が高い。このような傾向があるため、図14(d)に示すように、エッジ画素密度と参照範囲の大きさとの関係を定めることにより、エッジ画素密度が或る範囲内にあるときにエッジ画素密度が小さくなるほど参照範囲の大きさが大きくなるように設定される。
(2−2)エッジ量率
連結成分のエッジ量率をその連結成分の特徴を示す特徴量として算出してもよい。エッジ画素密度を特徴量とする場合、閾値の設定によってエッジ画素と判定されない画素のエッジ量も特徴量に反映されるので、閾値の如何に関わらず、エッジ量の累計値が小さい連結成分ほど、参照範囲の大きさが大きくなるように設定することができる。
(3)複数種類の特徴量
生成手段113は、連結成分の複数種類の特徴を示す特徴量をそれぞれ生成してもよい。
(3−1)特徴量の組み合わせ
この場合、設定手段114は、生成手段113により生成された複数の特徴量の組み合わせに応じて参照範囲の大きさを設定してもよい。具体的には、CPU11は、予め定められた複数の特徴量についてのルックアップテーブル(LUT:Look-Up Table)をROM12から読み出すか、または作成してRAM13に記憶させる。生成手段113により複数の特徴量がそれぞれ生成されると、設定手段114は、上述したルックアップテーブルを参照することにより、参照範囲の大きさを設定する。
図15は、ルックアップテーブルの一例を示す図である。ルックアップテーブルには、3つの特徴量P1,P2,P3がそれぞれ複数の範囲に区分けされ、各区分けの組み合わせごとに対応する参照値がそれぞれ記述されている。例えば、特徴量P1が範囲Q11にあり、特徴量P2が範囲Q22にあり、特徴量P3が範囲Q33にあるときには、参照値はW96である。設定手段114は、このようにして3つの特徴量に応じた参照値を特定し、これに応じて参照範囲の大きさを設定する。
図16は、この変形例における画像処理装置1の動作を示すフロー図である。CPU11は、図9に示すステップS13の後、特徴量P1として、連結成分に外接する矩形領域の短手辺の長さを生成し(ステップS141)、特徴量P2として、連結成分のエッジ画素密度を生成し(ステップS142)、特徴量P3として、連結成分の矩形内画素密度を生成する(ステップS143)。なお、ステップS141〜S143の順序は問わない。
次に、CPU11は、特徴量P1,P2,P3について作成された3次元のルックアップテーブルを参照する(ステップS151)。そして、CPU11は、参照結果に応じて参照範囲の大きさを設定し(ステップS152)、図9に示すステップS16へ処理を進める。
これにより、複数の特徴量の組み合わせに応じて、参照範囲の大きさが設定されるので、多面的な判断が成され、連結成分から前景画素群を抽出する精度が向上する。
(3−2)他の特徴量により設定された設定値の修正
生成手段113は、或る特徴量により設定された設定値を他の特徴量により修正してもよい。図17は、この変形例における画像処理装置1の動作を示すフロー図である。CPU11は、図9に示すステップS13の後、連結成分の特徴を示す特徴量P4を生成し(ステップS144)、この特徴量P4に応じて参照範囲の大きさを設定する(ステップS154)。次に、CPU11は、連結成分の特徴を示す特徴量であって特徴量P4とは異なる量である特徴量P5を生成し(ステップS145)、この特徴量P5に応じて参照範囲の大きさを修正する(ステップS155)。なお、これに続いて、さらに他の特徴量を生成し、設定された大きさを修正してもよい。このように参照範囲の大きさが修正された後、CPU11は、図9に示すステップS16へ処理を進める。
これにより、或る特徴量に応じて設定された値を他の特徴量によって修正することができるので、多面的な判断が成され、連結成分から前景画素群を抽出する精度が向上する。
(3−3)生成された特徴量に応じた他の特徴量の要否判断
生成手段113は、或る特徴量が予め定められた条件を満たすか否かに応じて、他の特徴量を生成する処理を行うか否かについての判断をしてもよい。図18は、この変形例における画像処理装置1の動作を示すフロー図である。CPU11は、図9に示すステップS13の後、連結成分の特徴を示す特徴量P6を生成し(ステップS146)、この特徴量P6について、或る条件を満たしているか否かを判断する(ステップS147)。特徴量P6がこの条件を満たしていないと判断した場合(ステップS147;NO)、CPU11は、特徴量P6に応じて参照範囲の大きさを設定し(ステップS156)、図9に示すステップS16へ処理を進める。
一方、特徴量P6が上記の条件を満たしていると判断した場合(ステップS147;YES)、CPU11は、連結成分の特徴を示す特徴量であって特徴量P6とは異なる量である特徴量P7を生成し(ステップS148)、この特徴量P7に応じて参照範囲の大きさを設定する(ステップS157)。なお、ステップS157においては、特徴量P6と特徴量P7の組み合わせに応じて参照範囲の大きさを設定してもよい。このように参照範囲の大きさが設定された後、CPU11は、図9に示すステップS16へ処理を進める。
これにより、多面的な判断が成され、連結成分から前景画素群を抽出する精度が向上するほか、生成に時間がかかる特徴量については、先行して生成した特徴量に応じて生成するか否かを決定することができるので、処理時間が短縮される。
(4)連結成分の属性
設定手段114は、生成手段113により生成された特徴量および連結成分の属性の組み合わせに応じて参照範囲の大きさを設定してもよい。この場合、取得手段112は、連結成分を取得すると共に、その連結成分について分離手段111により生成された属性情報を取得する。ROM12には、図8に示したような関係データが属性情報により示される連結成分の属性ごとに記憶されている。すなわち、絵柄には絵柄用の関係データが、写真には写真用の関係データが記憶されており、また、表であるか否かに応じて、異なる関係データがROM12に記憶されている。生成手段113が連結成分の特徴を示す特徴量を生成すると、設定手段114は、上述の属性情報により示される連結成分の属性に応じた関係データを参照し、生成された特徴量に対応する参照範囲の大きさを設定する。
なお、上述した属性情報は、「絵柄」「写真」の別と「表」「表以外」の別であったが、連結成分の属性を示す属性情報はこれに限られない。連結成分の属性を示す属性情報は、例えば、連結成分において使用されている色数であってもよい。この場合、使用されている色数ごとにROM12に関係データが記憶されていればよい。
(5)取得手段より上流の構成
分離手段111は、画像に下地領域が含まれていない場合に、入力手段110で入力された原画像データG0が示す画像の全体を一つの連結成分として扱うように構成されてもよい。このような場合であっても、上述した処理に沿って、連結成分の特徴量を算出し、参照範囲の大きさを設定し、前景画素群を抽出する処理を行えばよい。
1…画像処理装置、10…画像処理システム、11…CPU、12…ROM、13…RAM、14…VRAM、15…入力部、2…スキャナ、110…入力手段、111…分離手段、112…取得手段、113…生成手段、114…設定手段、115…算出手段、116…抽出手段。

Claims (18)

  1. 下地を表す画素以外の複数の画素が連結されて成る連結成分を画像から取得する取得手段と、
    前記取得手段により取得された連結成分の特徴を示す特徴量を生成する生成手段と、
    前記連結成分に対応づけられ、複数の画素を含む範囲である参照範囲の大きさを、前記生成手段により生成された当該連結成分の特徴を示す特徴量に応じて設定する設定手段と、
    前記設定手段により大きさが設定された前記参照範囲の位置を、前記連結成分の画素ごとに定め、画素値を前記位置が定められた当該参照範囲に属する画素について集計して、当該画素値を代表する代表値を算出する算出手段と、
    前記算出手段が算出した代表値との差の絶対値が閾値を超える画素値を有する画素群を、前記連結成分から抽出する抽出手段と
    を具備することを特徴とする画像処理装置。
  2. 前記連結成分は、背景を表す複数の画素である背景画素群と、前記背景に重ねて描かれる前景を表す複数の画素である前景画素群とを含み、
    前記特徴量は、前記連結成分に含まれる前記前景画素群の大きさを推定可能な量であり、
    前記設定手段は、前記特徴量により推定される前記前景画素群の大きさが大きいほど、前記参照範囲の大きさを大きく設定する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記特徴量は、前記連結成分の大きさに関する特徴を示す量であり、
    前記設定手段は、前記特徴量により示される前記連結成分の大きさが大きいほど、前記参照範囲の大きさを大きく設定する
    ことを特徴とする請求項2に記載の画像処理装置。
  4. 前記大きさに関する特徴量は、画素の配列方向に沿った矩形領域のうち前記連結成分に外接する矩形領域の短手方向の長さであり、
    前記設定手段は、前記特徴量により示される前記矩形領域の短手辺の長さが長いほど、前記参照範囲の大きさを大きく設定する
    ことを特徴とする請求項3に記載の画像処理装置。
  5. 前記大きさに関する特徴量は、画素の配列方向に沿った矩形領域のうち前記連結成分に外接する矩形領域に対する前記連結成分の大きさに関する割合であり、
    前記設定手段は、前記特徴量により示される前記割合が大きいほど、前記参照範囲の大きさを大きく設定する
    ことを特徴とする請求項3に記載の画像処理装置。
  6. 前記大きさに関する特徴量は、前記連結成分に外接する矩形領域に含まれる全画素の数に対する前記連結成分に含まれる画素の数の割合である矩形内画素密度である
    ことを特徴とする請求項5に記載の画像処理装置。
  7. 前記生成手段は、前記矩形内画素密度に加え、前記矩形領域の外周の長さに対する前記連結成分の外周の長さの比である矩形度を前記特徴量として生成し、
    前記設定手段は、前記特徴量のうち前記矩形内画素密度が閾値を超える場合に、前記矩形度が1に近いほど、前記参照範囲の大きさを大きく設定する
    ことを特徴とする請求項6に記載の画像処理装置。
  8. 前記大きさに関する特徴量は、前記連結成分の太さであり、
    前記設定手段は、前記特徴量により示される前記連結成分の太さが太いほど、前記参照範囲の大きさを大きく設定する
    ことを特徴とする請求項3に記載の画像処理装置。
  9. 前記特徴量は、前記連結成分に含まれる各画素についての、当該画素と当該画素に隣接する画素との画素値の差に関する量であり、
    前記設定手段は、前記特徴量により示される前記量が小さいほど、前記参照範囲の大きさを大きく設定する
    ことを特徴とする請求項2に記載の画像処理装置。
  10. 前記差に関する特徴量は、前記連結成分に含まれる画素の数に対する、前記差が閾値を超える画素の数の割合であり、
    前記設定手段は、前記特徴量により示される前記割合が小さいほど、前記参照範囲の大きさを大きく設定する
    ことを特徴とする請求項9に記載の画像処理装置。
  11. 前記差に関する特徴量は、前記差の累計値を前記連結成分に含まれる画素の数で除算した値であり、
    前記設定手段は、前記特徴量により示される前記値が小さいほど、前記参照範囲の大きさを大きく設定する
    ことを特徴とする請求項9に記載の画像処理装置。
  12. 前記生成手段は、前記連結成分の複数種類の特徴を示す特徴量をそれぞれ生成し、
    前記設定手段は、前記生成手段により生成された複数の特徴量の組み合わせに応じて前記参照範囲の大きさを設定する
    ことを特徴とする請求項1に記載の画像処理装置。
  13. 前記生成手段は、前記連結成分の第1の特徴を示す第1特徴量を生成し、且つ、当該第1特徴量が或る条件を満たす場合には、前記第1の特徴と異なる前記連結成分の第2の特徴を示す第2特徴量を生成し、
    前記設定手段は、前記生成手段が前記第2特徴量を生成しなかった場合には、前記生成手段により生成された前記第1特徴量に応じて前記参照範囲の大きさを設定し、前記生成手段が前記第2特徴量を生成した場合には、当該第2特徴量に応じて前記参照範囲の大きさを設定する
    ことを特徴とする請求項1に記載の画像処理装置。
  14. 前記生成手段は、前記連結成分の第1の特徴を示す第1特徴量を生成した後、前記第1の特徴と異なる前記連結成分の第2の特徴を示す第2特徴量を生成し、
    前記設定手段は、前記生成手段により生成された前記第1特徴量に応じて前記参照範囲の大きさを設定した後、前記生成手段により生成された前記第2特徴量に応じて、設定した前記大きさを修正する
    ことを特徴とする請求項1に記載の画像処理装置。
  15. 画像を入力する入力手段と、
    前記入力手段により入力された画像を、下地に属する画素に沿って領域ごとに分離する分離手段と
    を具備し、
    前記取得手段は、前記分離手段により分離された各領域を前記連結成分として取得する
    ことを特徴とする請求項1から14のいずれかに記載の画像処理装置。
  16. 前記分離手段は、前記画像を前記領域ごとに分離するとともに、当該領域の属性を示す属性情報を生成し、
    前記取得手段は、前記分離手段により分離された各領域を前記連結成分として取得するとともに、当該各領域について前記分離手段により生成された前記属性情報をそれぞれ取得し、
    前記設定手段は、前記参照範囲の大きさを、前記生成手段により生成された特徴量および前記取得手段により取得された前記属性情報により示される前記属性の組み合わせに応じて設定する
    ことを特徴とする請求項15に記載の画像処理装置。
  17. 前記算出手段は、前記参照範囲に属する画素の画素値の平均値を前記代表値として算出する
    ことを特徴とする請求項1から16のいずれかに記載の画像処理装置。
  18. コンピュータを、
    下地を表す画素以外の複数の画素が連結されて成る連結成分を画像から取得する取得手段と、
    前記取得手段により取得された連結成分の特徴を示す特徴量を生成する生成手段と、
    前記連結成分に対応づけられ、複数の画素を含む範囲である参照範囲の大きさを、前記生成手段により生成された当該連結成分の特徴を示す特徴量に応じて設定する設定手段と、
    前記設定手段により大きさが設定された前記参照範囲の位置を、前記連結成分の画素ごとに定め、予め定められた色空間において画素の色を表す色成分毎の階調値である画素値を前記位置が定められた当該参照範囲に属する画素について集計して、当該画素値を代表する代表値を算出する算出手段と、
    前記算出手段が算出した代表値との差の絶対値が閾値を超える画素値を有する画素群を、前記連結成分から抽出する抽出手段
    として機能させるためのプログラム。
JP2010145518A 2010-06-25 2010-06-25 画像処理装置およびプログラム Expired - Fee Related JP5648340B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010145518A JP5648340B2 (ja) 2010-06-25 2010-06-25 画像処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010145518A JP5648340B2 (ja) 2010-06-25 2010-06-25 画像処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2012010188A true JP2012010188A (ja) 2012-01-12
JP5648340B2 JP5648340B2 (ja) 2015-01-07

Family

ID=45540210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010145518A Expired - Fee Related JP5648340B2 (ja) 2010-06-25 2010-06-25 画像処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5648340B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016024481A (ja) * 2014-07-16 2016-02-08 富士ゼロックス株式会社 画像処理装置およびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002175532A (ja) * 2000-12-08 2002-06-21 Fuji Xerox Co Ltd 画像処理装置、画像処理方法および画像処理プログラムを記録した記憶媒体
JP2005184404A (ja) * 2003-12-18 2005-07-07 Fuji Xerox Co Ltd 画像処理装置
JP2005184402A (ja) * 2003-12-18 2005-07-07 Fuji Xerox Co Ltd 画像処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002175532A (ja) * 2000-12-08 2002-06-21 Fuji Xerox Co Ltd 画像処理装置、画像処理方法および画像処理プログラムを記録した記憶媒体
JP2005184404A (ja) * 2003-12-18 2005-07-07 Fuji Xerox Co Ltd 画像処理装置
JP2005184402A (ja) * 2003-12-18 2005-07-07 Fuji Xerox Co Ltd 画像処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016024481A (ja) * 2014-07-16 2016-02-08 富士ゼロックス株式会社 画像処理装置およびプログラム

Also Published As

Publication number Publication date
JP5648340B2 (ja) 2015-01-07

Similar Documents

Publication Publication Date Title
JP6705912B2 (ja) 画像内の文字領域を認識するための方法及び装置
JP4821869B2 (ja) 文字認識装置、画像読取装置、およびプログラム
JP3950777B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
CN105528614B (zh) 一种漫画图像版面的识别方法和自动识别系统
US9158987B2 (en) Image processing device that separates image into plural regions
JP4748234B2 (ja) 画像処理装置および画像形成装置
US20210248729A1 (en) Superpixel merging
US8620081B2 (en) Image processing apparatus, method, and storage medium for determining attributes
JP5335581B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5648340B2 (ja) 画像処理装置およびプログラム
JP2010011450A (ja) 画像形成装置及び画像処理方法
JP4208520B2 (ja) 画像処理装置および画像処理方法、プログラムおよび記憶媒体
JP4825888B2 (ja) 文書画像処理装置および文書画像処理方法
US8295602B2 (en) Image processing apparatus and image processing method
JP6354497B2 (ja) 表示領域特定装置、表示領域特定方法、及びプログラム
JP2004038530A (ja) 画像処理方法、同方法の実行に用いるプログラム及び画像処理装置
JP2005210650A (ja) 画像処理装置
JP6613625B2 (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
JP2019195117A (ja) 情報処理装置、情報処理方法、及びプログラム
JP5245949B2 (ja) 画像処理装置および画像読取装置
JP6111796B2 (ja) 画像処理装置およびコンピュータプログラム
JP2006185017A (ja) 画像処理装置、画像処理プログラム及び画像処理方法
JP2003271973A (ja) 画像処理方法および画像処理プログラム
JP2001143076A (ja) 画像処理装置
JP6173097B2 (ja) 画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130522

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140602

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141014

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141027

R150 Certificate of patent or registration of utility model

Ref document number: 5648340

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees