JP2010192966A

JP2010192966A - 画像処理装置及び画像処理プログラム

Info

Publication number: JP2010192966A
Application number: JP2009032370A
Authority: JP
Inventors: Shunichi Kimura; 俊一木村; Koichi Fujii; 晃一藤井; Yutaka Koshi; 裕越
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2009-02-16
Filing date: 2009-02-16
Publication date: 2010-09-02
Anticipated expiration: 2029-02-16
Also published as: JP5206468B2

Abstract

【課題】画像を分割した領域の属性を判断する場合にあって、その属性に属する領域を属していないとする誤った判断、又はその属性に属していない領域を属しているとする誤った判断を抑制するようにした画像処理装置を提供する。
【解決手段】画像処理装置の分割手段は、受け付けた画像を領域に分割し、第１の判断手段は、前記分割手段によって分割された領域がある属性に属するか否かを判断し、第２の判断手段は、前記分割手段によって分割された領域が該属性に属するか否かを、前記第１の判断手段によって行われる判断手法とは異なる判断手法によって判断し、第３の判断手段は、前記第１の判断手段による判断結果と前記第２の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する。
【選択図】図１

Description

本発明は、画像処理装置及び画像処理プログラムに関する。

受け付けた画像を、例えば絵柄領域と文字領域に分けて、それぞれの領域に異なる画像処理を施すことが行われている。

これに関連する技術として、例えば、特許文献１には、デジタル画像データの圧縮率を高めることを課題とし、オリジナルピクセルマップを２つのプレーンにセグメント化し、次に各プレーンを効率的な方法で別々に圧縮し、損失性圧縮法で圧縮するピクセルは一方のプレーンに配置され、非損失性圧縮が施されるべきピクセルはもう一方のプレーンに配置され、セレクタプレーンはオリジナルピクセルマップの全てのピクセルを追跡するために作成されることが開示されている。

また、例えば、特許文献２には、文書を、複数のバイナリ前景平面を有する複合ラスタコンテンツフォーマットで画像データに変換するシステム及び方法を提供することを課題とし、画像データを線毎に分析して、類似の色及びエッジ特徴を有する画素を特定し、１つの線上にあるこれらの画素と別の線上の画素とは、両者が類似の特徴を共有する場合にはリンクされ、これらのリンクされた画素同士は領域としてグループ化され、この領域の平均色が計算され、画素が属する領域を特定する画像マップが、領域の最終的なテーブルと共に生成されることが開示されている。

また、例えば、特許文献３には、画像の分離処理、特に文字線画の分離を良好に行い、解像度変換処理や圧縮処理を施した際の画質劣化を低減し、高画質かつ高圧縮率で画像を送信又は蓄積可能な画像処理装置及び画像処理方法を提供することを課題とし、画像データが入力されると、色空間変換部にて所定の色空間に変換後、選択データ生成部で分離情報プレーンに文字線画情報を抽出し、膨張処理部において、分離情報プレーンに対して文字線画を太らせる膨張処理を施し、膨張分離情報プレーンを生成し、この膨張分離情報プレーンを用いて多層分離部にて文字線画部の色情報を文字情報プレーンに、文字線画部以外の絵柄情報と背景画像を絵柄情報プレーンに分離し、膨張分離情報プレーンを用いて分離することにより、文字線画の輪郭部が絵柄情報プレーンに分離されるのを防止することが開示されている。

また、例えば、特許文献４には、像域分離において、網点抽出可能な水色などの色領域上に書かれた文字などについては、その領域全体が網点抽出されてしまうため、色領域上に書かれた文字を像域分離結果として抽出することができないことを課題とし、まず、入力画像データに対して２値化部で前景と背景を分離し、かつ線分抽出部で所定画素数分の幅の線分を抽出する処理を行い、２値化部で前景とされた連結する画素に対してラベリング部で同一のラベルを付与し、この同一ラベルが付与されたラベル領域毎に、ラベル特徴量算出部で画像特徴量を算出し、そのラベル領域毎のラベル特徴量から該ラベル領域の属性を第１属性判定部で判定し、そして、ラベリング部でラベリングされたラベル領域毎の第１属性判定部による属性判定結果を用いて、線分補正部で線分抽出部によって抽出された線分の補正を行うことが開示されている。

また、例えば、特許文献５には、像域分離において、１つの文字の中で幅の太い箇所と細い箇所が存在した場合に、抽出される箇所とされない箇所が存在し、また絵柄中に誤抽出が発生する場合は、ブロック状の誤抽出となることがあり、画像を再現した際に画質劣化が目立ちやすいことを課題とし、まず、入力画像データに対し、シャドー抽出部によって濃度の濃い領域を抽出するとともに、網点抽出部によって網点で構成された領域を抽出する一方、線分抽出部によって第１の所定画素数分の幅の線分を抽出し、そして、シャドー抽出部及び網点抽出部で抽出された各領域から、小領域抽出部によって第２の所定画素数分の幅を有する領域を抽出し、この抽出された領域に基づいて、線分補正部において線分抽出部によって抽出された線分の補正を行うことが開示されている。

また、例えば、特許文献６には、符号化する画像が写真的な画像、又は、文字的な画像のどちらであっても良好に符号化するとともに、特に、色画像のようにエッジのレベル差の小さい場合や、ブロック境界にわずかにエッジがかかる場合であっても、画像の特性に応じた符号化を行うことのできる画像符号化装置を提供することを目的とし、入力される画像信号より、１ブロック抽出部において、画素ブロックを抽出し、抽出された画素ブロックに対し、領域判定部において、分散情報、ヒストグラム情報、ダイナミックレンジ情報等の特徴量に基づいて、画素ブロックが写真的か、文字的かを判定し、画素ブロックが写真的な場合には、画素ブロックは、変換符号化部において変換符号化され、画素ブロックが文字的な場合には、ブロック近似符号化部によってブロック近似符号化されることが開示されている。

また、例えば、特許文献７には、カラー文字／中間調の混在画像のそれぞれの領域を高性能で識別でき、ハードウェア実現性にも優れた画像領域識別方式を提供することを目的とし、複数画素のブロック化手段と、ブロック内の画素から複数の特性値を検出する特性値検出と、複数の特性値から文字／中間調の領域識別を行う領域識別手段とを備え、複数の特性値は、ブロック内平均値と高レベル画素及び中間レベル画素のそれぞれのブロック内の総和値との３種とし、領域識別手段は、複数の特性値の量子化手段と、予め領域識別のための中間レベル画素の総和値の閾値をセットしたＬＵＴと、比較手段とを備え、ブロック内平均値と高レベル画素の総和値とを量子化し合成した値をアドレスとしてＬＵＴから中間レベル画素の総和値の閾値を求め、実際に求めた中間レベル画素の総和値とを比較してブロック内の領域を識別することが開示されている。

また、例えば、特許文献８には、画像をその局所的な特徴に基づいて良好に２種類の領域に分離することを課題とし、画像入力部から入力された画像信号は、画像蓄積部に蓄積され、特徴判別部は、画像蓄積部から画像を画素単位、又は、所定サイズの矩形領域毎に読み出し、所定の特徴について２値の判別を行い、結果をそれぞれ判別結果記憶部に記憶し、領域決定部は、判別結果記憶部に記憶されている判別結果に基づいて領域情報を決定し、出力選択部は、原稿蓄積部内の画素データを順次読み出し、領域決定部の決定した領域情報にしたがって２つの領域を振り分けて第１の領域を含む画像信号と第２の領域を含む画像信号の２通りの画像出力を得ることが開示されている。

特開２０００−１９６８９３号公報特開２００５−２２８３３１号公報特開２０００−１９４８５７号公報特開２００１−１２７９９９号公報特開２００１−１４４９５４号公報特開平０６−３１９１３３号公報特開平０４−３１７２６１号公報特開２０００−２６１６６３号公報

本発明は、画像を分割した領域の属性を判断する場合にあって、その属性に属する領域を属していないとする誤った判断、又はその属性に属していない領域を属しているとする誤った判断を抑制するようにした画像処理装置及び画像処理プログラムを提供することを目的としている。

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項１の発明は、受け付けた画像を領域に分割する分割手段と、前記分割手段によって分割された領域がある属性に属するか否かを判断する第１の判断手段と、前記分割手段によって分割された領域が該属性に属するか否かを、前記第１の判断手段によって行われる判断手法とは異なる判断手法によって判断する第２の判断手段と、前記第１の判断手段による判断結果と前記第２の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第３の判断手段を具備することを特徴とする画像処理装置である。

請求項２の発明は、前記第３の判断手段は、前記第１の判断手段によって前記属性に属すると判断された領域である第１の領域に前記第２の判断手段によって該属性に属すると判断された第２の領域が接している場合に、該第２の領域を該属性に属すると判断することを特徴とする請求項１に記載の画像処理装置である。

請求項３の発明は、前記第３の判断手段は、前記第１の領域と前記第２の領域を結合し、その結合した領域内に該第１の領域が含まれているか否かによって、前記領域が前記属性に属するか否かを判断することを特徴とする請求項１に記載の画像処理装置である。

請求項４の発明は、前記第１の判断手段及び前記第２の判断手段は、前記領域内の画素値、画素値頻度、画素塊数のいずれか１つ以上に基づいて、該領域が前記属性に属するか否かの判断を行うことを特徴とする請求項１から３のいずれか一項に記載の画像処理装置である。

請求項５の発明は、前記第２の判断手段は、前記第１の判断手段によって領域が前記属性に属するか否かの判断をする場合の閾値とは異なる閾値を用いて、領域の判断を行うことを特徴とする請求項１から４のいずれか一項に記載の画像処理装置である。

請求項６の発明は、前記第２の判断手段は、前記第１の判断手段によって領域が前記属性に属するか否かの判断をする場合の領域の大きさとは異なる領域の大きさを用いて、領域の判断を行うことを特徴とする請求項１から４のいずれか一項に記載の画像処理装置である。

請求項７の発明は、前記属性に属する領域内に含まれている画素と該属性には属していない領域に含まれている画素の割合に基づいて、画素塊が該属性であるか否かを判断する画素塊判断手段を有することを特徴とする請求項１から６のいずれか一項に記載の画像処理装置である。

請求項８の発明は、前記画素塊判断手段は、前記属性に属する領域内に画素塊の全体が含まれている場合は、該画素塊は該属性であると判断することを特徴とする請求項７に記載の画像処理装置である。

請求項９の発明は、前記画素塊判断手段は、前記属性に属する領域内に画素塊の一部が含まれている場合は、該画素塊は該属性であると判断することを特徴とする請求項７に記載の画像処理装置である。

請求項１０の発明は、コンピュータを、受け付けた画像を領域に分割する分割手段と、前記分割手段によって分割された領域がある属性に属するか否かを判断する第１の判断手段と、前記分割手段によって分割された領域が該属性に属するか否かを、前記第１の判断手段によって行われる判断手法とは異なる判断手法によって判断する第２の判断手段と、前記第１の判断手段による判断結果と前記第２の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第３の判断手段として機能させることを特徴とする画像処理プログラムである。

請求項１の画像処理装置によれば、画像を分割した領域の属性を判断する場合にあって、第１の判断手段あるいは第２の判断手段のいずれか一方のみを用いてある属性に属するか否かを判断する場合に比べて、その属性に属する領域を属していないとする誤った判断、又はその属性に属していない領域を属しているとする誤った判断を抑制できる。

請求項２、３の画像処理装置によれば、画像を分割した領域以上の面積を有する領域の属性を判断するにあたって、第１の判断手段あるいは第２の判断手段のいずれか一方のみを用いてある属性に属するか否かを判断する場合に比べて、その判断の誤りを抑制できる。

請求項４の画像処理装置によれば、本構成を有さない場合に比べて、効率的な判断ができる。

請求項５の画像処理装置によれば、本構成を有さない場合に比べて、装置の小型化および高速化が可能となる。

請求項６の画像処理装置によれば、判定位置精度が高い判断と判定が安定した判断を選択することが可能となる。

請求項７の画像処理装置によれば、本構成を有さない場合に比べて、精密な判断ができる。

請求項８の画像処理装置によれば、本構成を有さない場合に比べて、ある属性ではないと判断する可能性を高くすることができる。

請求項９の画像処理装置によれば、本構成を有さない場合に比べて、ある属性であると判断する可能性を高くすることができる。

請求項１０の画像処理プログラムによれば、画像を分割した領域の属性を判断する場合にあって、本構成を有さない場合に比べて、その属性に属する領域を属していないとする誤った判断、又はその属性に属していない領域を属しているとする誤った判断を抑制できる。

本実施の形態の構成例についての概念的なモジュール構成図である。弱−判断モジュール、強−判断モジュールによる処理結果の例を示す説明図である。結合処理モジュールによる処理結果の例を示す説明図である。ラベル付けモジュールによる処理結果の例を示す説明図である。ラベル・強ブロックフラグ対応テーブルのデータ構造の例を示す説明図である。強−判断モジュールのブロックサイズの例を示す説明図である。弱−判断モジュールのブロックサイズの例を示す説明図である。絵柄ブロックと文字との関係の例を示す説明図である。絵柄ブロックと文字との関係の例を示す説明図である。強−判断モジュール、弱−判断モジュールで用いるパラメタの選定の例を示す説明図である。２種類のパラメタで判断した場合の例を示す説明図である。判断結果の例を示す説明図である。本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。層分けした画像の例を示す説明図である。層分けした画像の例を示す説明図である。文字の抜き出し処理例を示す説明図である。文字として抜き出した場合の誤り例を示す説明図である。文字として抜き出した場合の誤り例を示す説明図である。絵柄画像の抜き出し処理例を示す説明図である。絵柄画像の抜き出し処理例を示す説明図である。絵柄画像の抜き出し処理例を示す説明図である。

まず、本実施の形態の理解を容易にするために、本実施の形態が適用され得る技術（本実施の形態による処理が行われた後に適用される技術）について、２種類説明する。

＜１＞受け付けた画像を絵柄領域と文字領域に分割し、各領域に適した画像圧縮方式を適用する。これは、全体の画像圧縮率を向上させるために、本実施の形態が用いられるものである。なお、絵柄とは、文字・線画以外をいい、主に写真、網点画像があり、非可逆圧縮の対象となる。
一般にカラー画像のデータ量は大きいため、圧縮して蓄積又は伝送等が行われる。画像に歪みを与えない可逆圧縮方式では、高い圧縮率を得ることができないため、一般的な圧縮画像フォーマットとしては、ＪＰＥＧ（ＪｏｉｎｔＰｈｏｔｏｇｒａｐｈｉｃＥｘｐｅｒｔｓＧｒｏｕｐ）方式（さらに具体的にはＪＰＥＧベースライン方式、以下、単純にＪＰＥＧ方式と称する）が利用されることが多い。ＪＰＥＧ方式は非可逆符号化の一種であるため、圧縮によって、画像に歪みが生じる。そのため、極端に高い圧縮率を得ることは困難である。

そこで、従来のＪＰＥＧ方式よりも高い圧縮率を得る方式として、特許文献１、特許文献２等に示されるような多層構造の画像フォーマットが提案されてきた。
これらは、ＪＰＥＧの画像歪みは、主として、高周波成分電力の大きな画像のエッジ部分に発生する、という現象を避けるため、受け付けた画像を、高周波成分電力の大きな文字／線画部分と、文字／線画部分を除いたバックグラウンド部分に分解して、バックグラウンド部分は、ＪＰＥＧで高い圧縮率で圧縮し、文字／線画部分は、可逆符号化で圧縮する、という方策を採るものである。

その中で、特許文献１記載の技術は、３層方式を採用している。
図１４の例に示されるように、画像１４１０を絵柄部分１４１４と文字／線画部分１４１２に分ける。さらに最終的な出力画像として、絵柄部分１４１４を選択するか、文字／線画部分１４１２を選択するかのセレクタ情報１４１６を保持する。この３層のデータを用いて画像を表現するものである。以下、絵柄部分をバックグラウンド画像、文字/線画部分をフォアグラウンド画像とする。

特許文献２記載の技術は、バックグラウンド多値画像１層と、２値画像のＮ層の構造で圧縮する方式を採用している。多値ＪＰＥＧ画像をバックグラウンド画像として、その上に色情報を持つ２値画像を重ねていくものである。
図１５に示す例での一番下の層であるバックグラウンド画像１５１０に対しては、ＪＰＥＧ等の多値画像形式で圧縮を行う。その他の層（２値画像１５２０〜１５８０）に対しては、２値画像符号化方式で圧縮する。各２値画像符号化層の画像には色情報が付与されているため、復号時にはその色を付与して復号する。

前述のように、絵柄部分と、文字部分に分割して符号化することによって、画質を保ちながら、圧縮率を上げるようにしている。なお、特許文献１、特許文献２に記載の技術においては、受け付けた画像から文字部分を抜き出すことによって、領域分割を行っている。そして、文字以外の画素が絵柄部分となる。

また、受け付けた画像から文字部分を抜き出す技術は、他に、特許文献３、特許文献４、特許文献５等のように様々にある。これらに記載の文字抜き出し方法は、絵柄の中に存在している文字を抜き出すことも行うものである。
図１６（ａ）の例に示すように、画像１６００の絵柄画像１６１０中に文字が実際に存在している場合は、図１６（ｂ）の例に示す画像１６５０のように、文字として抜き出しても問題はない。
ところが、図１７や図１８の例に示すように、本来であれば、絵柄中の模様とすべきもの（図１７（ｂ）、図１８（ｂ）の例に示す模様）までも、文字として抽出してしまうと、画質が劣化する原因となる。なお、図１７（ａ）に示す画像１７００の絵柄画像１７１０は写真画像であって、色の濃い線が混じっているものであり、図１８（ａ）に示す画像１８００の絵柄画像１８１０は人物を撮影した写真画像である。
一般に特許文献１に記載の方式では、フォアグラウンドの圧縮率を高く設定する。また、特許文献２に記載の方式では、文字として抜き出した画像の色を１色で塗りつぶすことになる。そのため、絵柄部の画像が、文字として抜き出されてしまった場合、抜き出さない場合と比較して、画質劣化が発生する。

そこで、望ましくは、図１６の例に示す場合では、文字部分は、文字として抽出し、文字以外は絵柄として抽出すべきである。さらに、図１７、図１８の例に示す場合では、文字として抽出しないようにすべきである。
そのためには、受け付けた画像から絵柄部を正確に抜き出すことができればよい。図１６、図１７、図１８の例に示す画像１６００、１７００、１８００を対象とした場合の望ましい絵柄部抽出例は、図１９（ｂ）、図２０（ｂ）、図２１（ｂ）の例に示す絵柄画像１９６０、２０６０、２１６０の斜線部となる。なお、図１９（ｂ）の例に示す絵柄画像１９６０は、文字部分（「ＡＢＣ」の部分）以外の部分を絵柄部として抽出したものである。

＜２＞受け付けた画像に画像処理を適用するにあたって、領域毎に適した画像処理の方法又はパラメタ等を用いる。これは、画像処理後の画質を向上させるために、本実施の形態が用いられるものである。
従来より、複写機、ファクシミリ等の画像処理装置においては、画像中の各領域毎に適した画像処理を施し、画質を向上させている。例えば、受け付けた画像に文字や線画などの文字領域と写真や網点などの絵柄領域が混在していた場合、その画像を再生するときには文字領域と絵柄領域を分離し、文字領域には解像度を重視した処理を実施し、絵柄領域には階調性を重視した処理を施すことが、画像品質の面から望ましい。
具体的には、スキャナ等によって画像を読み取ったり、ファクシミリ等で画像が送信されてきた場合に、文字・線画・写真・網点等が混在した画像を印刷する場合、文字・線画等によって構成されている文字領域に対しては解像度を重視した処理を実施し、写真・網点等によって構成されている絵柄領域に対しては、階調性を重視した処理を施す。これにより、高画質な再生画像となる。
したがって、このような技術に適用する場合にあっても、前述の通り、図１６、図１７、図１８の例に示す画像１６００、１７００、１８００を対象とした場合の望ましい絵柄部抽出例は、図１９（ｂ）、図２０（ｂ）、図２１（ｂ）の例に示す絵柄画像１９６０、２０６０、２１６０の斜線部となる。

次に、本実施の形態の理解を容易にするために、本実施の形態による具体的な処理例を示して説明する。
本実施の形態による処理例として、ブロック毎の領域判断（領域分割）を行うものとする。
まず、２つのパラメタ（強いパラメタと弱いパラメタ）で、ブロック毎に領域判断を行う。例えば、ここでは、絵柄／文字判断を行うものとする。なお、判断したい属性には、絵柄、写真、網点、文字、等々種々のものがあるが、ここでは、説明を簡単にするため、絵柄と文字の２つとする。
強いパラメタは、高い確度を持って、絵柄であると判断できるものだけを選び出すためのパラメタであるとする。強いパラメタで絵柄と判断した場合は、文字である可能性は低いこととなる。
弱いパラメタは、強いパラメタよりも確度が低いが、ある程度、絵柄であると判断するためのパラメタである。弱いパラメタで絵柄と判断した場合は、文字であっても絵柄と判断されている場合がある。

このような２種類のパラメタで判断したブロックは、図１１の例に示すような構造を持つと考えられる。図１１に示す例において、１つの四角形は１つのブロックを示している。そして、１つのブロックは、複数の画素で構成されている。例えば、縦Ｍ画素、横Ｎ画素の矩形であるとする。Ｍ、Ｎの値のとしては、限定しないが、例えば、数画素（１画素であってもよい）から数百画素の様々な範囲にある。図１１に示す例で、斜線のブロックは、強いパラメタで絵柄と判断されたブロックであることを示している（以下、強ブロックとする）。縦線のブロックは、弱いパラメタで絵柄と判断されたブロックであることを示している（以下、弱ブロックとする）。弱ブロックは、強ブロックの周囲に分布していることがわかる。

通常、絵柄領域は、２次元的な広がりを持つものである。
このような２次元的な広がりを持つ絵柄領域をブロックに分割する場合、絵柄領域ブロックに隣接するブロックは絵柄領域である可能性が高い。逆に、絵柄領域ブロックに隣接しないブロックは、絵柄領域である可能性は比較的低い。

そこで、本実施の形態では、まず、強ブロックは、絵柄であると判断する。次に、強ブロックに接する弱ブロックは、絵柄であると判断する。
さらに、既に絵柄であると判断されたブロック（以下、絵柄ブロック）に接する弱ブロックも、絵柄であると判断する。絵柄ブロックに接する弱ブロックの絵柄ブロック化は、反復的に行う。すなわち、弱ブロックが絵柄ブロック化された後に、絵柄ブロック化された弱ブロック周囲の弱ブロックも絵柄であると判断する。
このような処理を図１１に示す例に対して行うと、図１２の例に示す黒部分のように、絵柄部を判断することになる。

このような処理を行うことによって、強ブロックに連結していない弱ブロックを絵柄とは判断しない。つまり、２次元的に連続していない孤立した確度の低いブロックを絵柄とは判断しなくなる。また、強ブロックに連結している弱ブロックは絵柄と判断する。つまり、確度の低いブロックであっても、確度の高いブロックと２次元的に連結していれば、絵柄と判断する。

２次元的に連結しているブロックを前述のように処理することは、擬似的により面積の広いブロックを用いているということになる。これにより、ブロックサイズが比較的小さくても安定的に領域判断を行うものである。

前述の説明では、ブロックが絵柄か否かを判断していたが、これに限定されず、例えば、判断するのは文字か否かであってもよいし、網点か否かであってもよいし、写真か否かであってもよい。
前述の説明では、「既に絵柄であると判断されたブロックに接する弱ブロックを、絵柄であると判断する。」としており、この場合は、既に絵柄であると判断されたブロックに接している領域のみを判定するため、高速の判定が可能である。また、その他の処理例として、強ブロック又は弱ブロックに関係なく絵柄として判断されたブロックを連結してブロックの塊とし、その塊の中に強ブロックが存在すれば、その塊全体を絵柄として判断する方法でもよい。
前述の説明では、確度の違いを「強いパラメタ」と「弱いパラメタ」で変化させていたが、パラメタの違いでなくてもよい。「強い判断処理」、「弱い判断処理」など、判断処理そのものが違っていてもよい。また、「広いブロック」、「狭いブロック」のようにブロックサイズが違っていてもよい。この場合は、「広いブロックで絵柄と判断された画素」に連結する「狭いブロックで絵柄と判断された画素」を絵柄と判断すればよい。

以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図１は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア（コンピュータ・プログラム）、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、１モジュールを１プログラムで構成してもよいし、複数モジュールを１プログラムで構成してもよく、逆に１モジュールを複数プログラムで構成してもよい。また、複数モジュールは１コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって１モジュールが複数コンピュータで実行されてもよい。なお、１つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続（データの授受、指示、データ間の参照関係等）の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク（一対一対応の通信接続を含む）等の通信手段で接続されて構成されるほか、１つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。

本実施の形態である画像処理装置は、図１に示すように、ブロック化モジュール１１０、強−判断モジュール１２０、弱−判断モジュール１３０、結合処理モジュール１４０、ラベル付けモジュール１５０、統合判断処理モジュール１６０を有している。画像を属性毎に分割する技術に関するものである。以下、属性として絵柄を主に例示して説明する。

ブロック化モジュール１１０は、強−判断モジュール１２０、弱−判断モジュール１３０と接続されている。受け付けた画像をブロックに分割する。画像を受け付けるとは、例えば、スキャナ、カメラ等で画像を読み込むこと、ファクシミリ等で通信回線を介して外部機器から画像を受信すること、ハードディスク（コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む）等に記憶されている画像を読み出すこと等が含まれる。画像は、２値画像、多値画像（カラー画像を含む）であってもよい。受け付ける画像は、１枚であってもよいし、複数枚であってもよい。また、画像の内容として、ビジネスに用いられる文書、広告宣伝用のパンフレット等であってもよい。ブロックに分割（ブロック化）とは、例えば、ここでは、Ｎ×Ｍの矩形形状に受け付けた画像を分割することをいう。そして、各ブロックの画素値を強−判断モジュール１２０、弱−判断モジュール１３０に渡す。

強−判断モジュール１２０は、ブロック化モジュール１１０、結合処理モジュール１４０、統合判断処理モジュール１６０と接続されている。ブロック化モジュール１１０によって分割されたブロックが絵柄の属性に属するか否かを判断する。そして、その判断結果を結合処理モジュール１４０、統合判断処理モジュール１６０に渡す。
弱−判断モジュール１３０は、ブロック化モジュール１１０、結合処理モジュール１４０と接続されている。ブロック化モジュール１１０によって分割されたブロックが絵柄の属性に属するか否かを、強−判断モジュール１２０によって行われる判断手法とは異なる判断手法によって判断する。そして、その判断結果を結合処理モジュール１４０に渡す。「強−判断モジュール１２０によって行われる判断手法とは異なる判断手法」とは、強−判断モジュール１２０によって絵柄の属性に属すると判断したブロック（以下、第１のブロック）のうち、少なくとも１つ以上のブロックが異なるように、弱−判断モジュール１３０が絵柄の属性に属するブロック（以下、第２のブロック）と判断すればよい。したがって、ブロックによっては、第１のブロックとも判断され、第２のブロックとも判断されているものがある。また、第１のブロック数と第２のブロック数とが同じであっても、異なるブロックがあればよい。

強−判断モジュール１２０、弱−判断モジュール１３０による絵柄の判断処理について、より具体的な例を説明する。
まず、ブロック内の画素値のヒストグラムを取得する。
ヒストグラムの最大値が閾値ＴＨ以下であれば、そのブロックは絵柄であると判断する。
絵柄ブロックでは、滑らかに画素値が変動することが多いため、画素値のヒストグラム（画素値毎の出現頻度）は、画素値が異なっても類似した値になる。そのため、ヒストグラムの最大値は小さな値となる。逆に文字ブロックでは、背景画素と文字色画素がほとんどを占める。この場合には、背景画素の出現頻度と文字色画素の出現頻度が大きくなるため、ヒストグラムの最大値が大きくなる。

例えば、受け付けた画像がグレイスケール画像である場合には、その画素値そのもののヒストグラムを取得すればよい。
また、例えば、受け付けた画像がカラー画像である場合には、一旦カラー画像をＹＣｂＣｒや、Ｌａｂ等の輝度色差系の色空間に変換してから、Ｙ成分、あるいはＬ成分等の輝度信号をグレイスケール値と捉えて、グレイスケール値のヒストグラムを取得すればよい。

強−判断モジュール１２０では、前述の処理で閾値ＴＨとして閾値ＴＳを用いる。
弱−判断モジュール１３０では、前述の処理で閾値ＴＨとして閾値ＴＷを用いる。閾値ＴＷは、閾値ＴＳと異なる値である。
ここで、強−判断モジュール１２０は、絵柄であることを高い精度で確信できる判断器であるため、閾値ＴＳは、閾値ＴＷと比べて比較的小さな値とすればよい。
また、弱−判断モジュール１３０は、絵柄である可能性はあるが、条件次第では文字である可能性もあるブロックを抽出する判断器であるため、閾値ＴＷは、閾値ＴＳと比べて比較的大きな値とすればよい。
また、画像処理装置の小型化及び高速化を図るために、強−判断モジュール１２０と弱−判断モジュール１３０において、共通化したモジュール（装置、プログラム（アルゴリズム）等）を用いて、そのモジュールが処理を行う場合に閾値だけを異ならせるようにしてもよい。つまり、強−判断モジュール１２０と弱−判断モジュール１３０を一つのモジュールで実現させてもよい。

強−判断モジュール１２０、弱−判断モジュール１３０による判断結果の出力は、ブロック毎に１ビットの情報としてもよい。例えば、ここで、絵柄と判定された場合に１、それ以外の場合に０とする。図２（ａ）に強−判断モジュール１２０の出力例を示し、図２（ｂ）に弱−判断モジュール１３０の出力例を示す。図２（ａ）は図１１の例に示す縦線のブロック（弱ブロック）、図２（ｂ）は図１１の例に示す斜線のブロック（強ブロック）にそれぞれ対応するものである。

結合処理モジュール１４０は、強−判断モジュール１２０、弱−判断モジュール１３０、ラベル付けモジュール１５０と接続されている。強−判断モジュール１２０、弱−判断モジュール１３０から判断結果を受け取り、第１のブロックと第２のブロックを結合する。そして、その処理結果をラベル付けモジュール１５０に渡す。例えば、両者からの判断結果の論理和（ＯＲ）処理を行う。図３に結合処理モジュール１４０による出力例を示す。

ラベル付けモジュール１５０は、結合処理モジュール１４０、統合判断処理モジュール１６０と接続されている。結合処理モジュール１４０の出力をラベル付けする。そして、その処理結果を統合判断処理モジュール１６０に渡す。ラベル付け処理は、連結している画素に対して同じ値のラベルを付与する周知のアルゴリズムを用いる。ここでは、１つのブロックを１画素であると捉えてラベル付けを行う。図４にラベル付けモジュール１５０の出力例を示す。

統合判断処理モジュール１６０は、強−判断モジュール１２０、ラベル付けモジュール１５０と接続されている。強−判断モジュール１２０による判断結果と弱−判断モジュール１３０による判断結果（ここでは、結合処理モジュール１４０、ラベル付けモジュール１５０による処理結果）に基づいて、ブロック化モジュール１１０によって分割されたブロックが絵柄の属性に属するか否かを判断する。
より具体的な例として、統合判断処理モジュール１６０は、ラベル付けモジュール１５０から受け取った処理結果から各ラベル毎に、ラベル内に強−判断モジュール１２０の出力が１となっているブロックが存在しているか否かを判断する。

例えば、図４に示した例では、ラベルが１の画素内に、強−判断モジュール１２０の出力（図２（ｂ）参照）が１となる画素が存在しているか否かを検査する。ラベルが１の場合には、そのような画素は存在していないため、ラベル１に対応するブロックは絵柄とは判断しない。
ラベル２でも同様の判断処理を行う。ラベル２の画素内に、強−判断モジュール１２０の出力（図１２参照）が１となる画素が存在しているか否かを検査する。ラベルが２の場合には、そのような画素が存在しているため、ラベル２に対応するブロックは絵柄と判断する。
同様な判断処理によって、ラベル３、ラベル４に対応するブロックは絵柄とは判断しない。

以上で、本実施の形態は、ブロック毎に絵柄／非絵柄の判断を行っている。最終的に、統合判断処理モジュール１６０は、ブロック毎の、絵柄の属性に属しているか否かの判断結果を出力する。

以下に、本実施の形態の変形例を説明する。
＜ブロック形状＞
ブロック形状は矩形以外であってもよい。また、全てのブロックは同じ形状でなくともよい。矩形以外の形状のブロックを採用した場合、ブロックＡとブロックＢが接しているという条件は、ブロックＡ内の１個以上の画素とブロックＢ内の１個以上の画素が接しているという条件に切り替えて処理すればよい。ラベル付けモジュール１５０でのラベル付けは、ブロックを１画素と捉えるのではなく、受け付けた画像と同じ解像度で１画素単位にラベル付けを行えばよい。

＜カラー画像のヒストグラム＞
強−判断モジュール１２０、弱−判断モジュール１３０において、カラー画像を一旦グレイスケールに変換してグレイスケールのヒストグラムを取得したが、カラー値そのもののヒストグラムを利用してもよい。
カラー成分がＲＧＢであれば、Ｒ、Ｇ、Ｂそれぞれのヒストグラムを取得する。その他の色成分、例えば、ＹＣｂＣｒであれば、Ｙ、Ｃｂ、Ｃｒそれぞれのヒストグラムを取得する。それぞれのヒストグラムの最大値が全て、閾値以下であれば、絵柄と判定する。閾値は色成分に依存せず同じ値でもよいし、色成分毎に違う値でもよい。

＜結合処理モジュール１４０＞
結合処理モジュール１４０では、強−判断モジュール１２０の出力と弱−判断モジュール１３０の出力との論理和を取得していた。しかし、強−判断モジュール１２０、弱−判断モジュール１３０の処理内容によっては、強−判断モジュール１２０で１であれば、論理的に必ず弱−判断モジュール１３０の出力も１となる場合がある。このような場合は、弱−判断モジュール１３０の出力をそのまま結合処理モジュール１４０の出力として用いてもよく、結合処理モジュール１４０は不要である。
前述の実施の形態で示したヒストグラムの最大値を用いる場合がこれにあたる。この場合は結合処理モジュール１４０は不要となる。

＜強−判断モジュール１２０と弱−判断モジュール１３０＞
前述の実施の形態では、強−判断モジュール１２０と弱−判断モジュール１３０で別々に処理していたが、必ずしも別々に処理する必要は無い。前述の実施の形態で使用したようなヒストグラムを用いる判断器では、ブロックのヒストグラムは同じものを用いて、閾値だけ変更することによって、強ブロック、弱ブロック、その他に判別するようにしてもよい。

例えば、ヒストグラムの最大値をＨとし、強−判断モジュール１２０、弱−判断モジュール１３０における判断器の出力をＹとした場合の演算処理を示す。
ｉｆ（Ｈ＞ＴＷ）Ｙ＝０
ｅｌｓｅｉｆ（Ｈ＞ＴＳ）Ｙ＝１
ｅｌｓｅＹ＝２
これは、もしＨが閾値ＴＷより大であるならばＹを０とし、それ以外の場合は、Ｈが閾値ＴＳより大であるならばＹを１とし、それ以外の場合は、Ｙを２とするものである。この演算処理によって、一度に、強−判断モジュール１２０の判断結果と、弱−判断モジュール１３０の判断結果を得ることができる。前述の演算処理の例では、ＹのＬＳＢ（最下位ビット）が弱−判断モジュール１３０の判断結果であり、Ｙの下から２ビット目が強−判断モジュール１２０の判断結果となる。

また、例えば、次のような演算処理としてもよい。
ｉｆ（Ｈ＞ＴＷ）Ｙ＝０
ｅｌｓｅｉｆ（Ｈ＞ＴＳ）Ｙ＝１
ｅｌｓｅＹ＝３
これは、もしＨが閾値ＴＷより大であるならばＹを０とし、それ以外の場合は、Ｈが閾値ＴＳより大であるならばＹを１とし、それ以外の場合は、Ｙを３とするものである。これによって、ＹのＬＳＢが弱−判断モジュール１３０及び結合処理モジュール１４０による処理結果であり、Ｙの下から２ビット目が強−判断モジュール１２０の判断結果となる。

＜ラベル付けモジュール１５０と統合判断処理モジュール１６０＞
前述の実施の形態では、説明を簡単にするために、ラベル付け処理を画像全体に行った後に統合判断処理モジュール１６０による判断処理を行った。しかし、実際にはラベル付けを行っているときに、ラスタスキャンをしているため、ラベル付けを行いながら各ラベル内に強ブロックが存在するかどうかを判断するようにしてもよい。
例えば、強ブロックが２、弱ブロックが１、それ以外が０とする画像のラベル付けを行うとする。
基本のラベル付けは、画素値が１以上の画素の連結状態を見てラベル付けをすればよい。その際に、各ラベル内に強ブロックが含まれているか否かをラベル・強ブロックフラグ対応テーブル５００に記入していく。
ラベル・強ブロックフラグ対応テーブル５００を図５の例に示す。ラベル・強ブロックフラグ対応テーブル５００は、ラベル番号欄５１０、強ブロックフラグ欄５２０を有している。初期状態は、全てのラベルに強ブロックが含まれない（強ブロックフラグ＝０）とする。ラベル付けの途中でラスタスキャンをするが、そのラスタスキャン中の画素値が２であれば、そのラベルに対応する強ブロックフラグ欄５２０を１に書き換える。ラベルを統合する場合には、統合するラベルに対応する強ブロックフラグの論理和を取るようにすればよい。

＜ラベル付けを行わない形態＞
前述の実施の形態では、ラベル付けモジュール１５０がラベル付けを行うことによって、強ブロックに連結する全てのブロックを抽出したが、必ずしもそのようにしなくてもよい。
統合判断処理モジュール１６０は、強−判断モジュール１２０と弱−判断モジュール１３０の判断結果を用いて、強ブロックに接していて、かつ、強ブロックから予め定められた距離内にある弱ブロックのみを絵柄と判断してもよい。

このような処理とするには、統合判断処理モジュール１６０が以下の処理（（１）〜（３））を行う。
（１）強ブロックを絵柄ブロックとする。
（２）ラスタスキャンを行い、絵柄ブロックに接している弱ブロックを絵柄とする。
（３）上記（２）のラスタスキャンをＰ回行う。
このラスタスキャンの回数Ｐを制御することによって、強ブロックへの距離的近さを制御する。

＜判断器の別の形態＞
前述の実施の形態の強−判断モジュール１２０、弱−判断モジュール１３０では、ヒストグラムを用いた判断器を利用したが、判断器はどのようなものでもよい。
強−判断モジュール１２０及び弱−判断モジュール１３０は、ブロック内の画素値、画素値頻度、画素塊数のいずれか１つ以上に基づいて、そのブロックが絵柄の属性に属するか否かの判断を行うようにしてもよい。
例えば、画素値を用いた判断として、そのブロック内の画素値の最大値と最小値の差分値と予め定められた閾値との比較で行うようにしてもよい。また、画素値頻度を用いた判断として、そのブロックにおける画素値頻度の最大値と予め定められた閾値との比較で行うようにしてもよい。また、画素塊数を用いた判断として、そのブロック内の画素塊数と閾値との比較で行うようにしてもよい。
これらを組み合わせた判断を行うようにしてもよい。例えば、そのブロック内の画素値の最大値と最小値の差分値と予め定められた閾値との比較で行う判断と、そのブロックにおける画素値頻度の最大値と予め定められた閾値との比較で行う判断を行い、強−判断モジュール１２０は、両方の判断が絵柄の属性に属していると判断した場合（論理積）に絵柄の属性に属していると判断し、弱−判断モジュール１３０は、いずれか一方の判断が絵柄の属性に属していると判断した場合（論理和）に絵柄の属性に属していると判断する。
より具体的な例を以下に示す。

＜判断器の別の形態その１＞
強−判断モジュール１２０、弱−判断モジュール１３０の絵柄の判断器は、例えば、特許文献６、特許文献７、特許文献８等に記載されている方法を用いてもよい。

＜判断器の別の形態その２＞
強−判断モジュール１２０、弱−判断モジュール１３０の絵柄の判断器として、他の形態でもよい。
例えば、図１７に示されるような小さなノイズを文字として判断しないようにする判断器としてもよい。
まず、受け付けた画像から文字部分を抜き出す。文字部分を抜き出す手法は、特許文献１、特許文献２、特許文献３、特許文献４、特許文献５等に記載されている手法を用いればよい。
抜き出した文字部分は、文字部が１、非文字部が０の２値画像として表現する。この２値画像をラベル付けする。
そのラベル付けされた２値画像をブロックに分割して、ブロック内の文字ラベル種類数を計測する。文字ラベル種類数は、単純に連結している画素塊の数と捉えてもよい。
文字ラベル種類数が多いブロックは、図１７の例に示されるような小さなノイズが多いブロックであるため、絵柄と判断する。ここで、閾値ＴＨを定めて、文字ラベル種類数がＴＨよりも多いときに、絵柄と判断すればよい。

＜判断器の別の形態その３＞
強−判断モジュール１２０と弱−判断モジュール１３０における処理対象のブロックサイズを異ならせてもよい。
強−判断モジュール１２０では、弱−判断モジュール１３０と比べてブロックサイズを大きくする。ブロックサイズが大きいと、判別の位置精度が悪くなる代わりに、判別の確度を高くすることができる。
弱−判断モジュール１３０として、強−判断モジュール１２０と比べて小さなブロックサイズを採用する。判別の位置精度を高くする代わりに、判別の確度が低くなる。
異なるブロックサイズとするために、例えば、ブロック化モジュール１１０によって分割されたブロックを結合して新たなサイズのブロックとしてもよいし、ブロック化モジュール１１０が、強−判断モジュール１２０、弱−判断モジュール１３０用に、それぞれ異なるブロックサイズでブロックに分割するようにしてもよい。
そして、強−判断モジュール１２０と弱−判断モジュール１３０は、それぞれパラメタ（閾値）で判断するようにしてもよい。

ブロックサイズが異なる場合は、強−判断モジュール１２０と弱−判断モジュール１３０の出力画素数が違ってしまうこととなる。
そこで、ここでは、強−判断モジュール１２０と弱−判断モジュール１３０のブロックサイズの最大公約数を用いて処理を行う。最大公約数のブロックサイズの精度で、強−判断モジュール１２０、弱−判断モジュール１３０の出力を行えばよい。
例えば、強−判断モジュール１２０のブロックサイズを横８画素×縦８画素（図６（ａ）参照）、弱−判断モジュール１３０のブロックサイズを横６画素×縦３画素（図７（ａ）参照）とする。
横方向の最大公約数は２、縦方向の最大公約数は１であるので、強−判断モジュール１２０、弱−判断モジュール１３０の出力ブロックサイズは、横２画素×縦１画素とすればよい。すなわち、横２画素×縦１画素の精度で、判断結果を出力する。横２画素×縦１画素の精度であるので、強−判断モジュール１２０の１ブロックの出力がＸのとき、横４画素、縦８画素全てＸのブロック（図６（ｂ）参照）を出力すればよい。弱−判断モジュール１３０の１ブロックの出力がＸのとき、横３画素、縦３画素全てＸのブロック（図７（ｂ）参照）を出力すればよい。
このようにして作成した出力画像の解像度は、強−判断モジュール１２０と弱−判断モジュール１３０で同じとなるため、結合処理モジュール１４０等での処理（例えば、論理演算）が行える。
なお、論理演算可能とするためには、必ずしも最大公約数のブロックを取る必要はない。すなわち１×１画素のブロック精度で論理演算を行えばよい。
以上のように論理演算可能なブロックサイズとして、結合処理モジュール１４０、ラベル付けモジュール１５０、統合判断処理モジュール１６０による処理を行えばよい。

＜文字部除去＞
前述の実施の形態の統合判断処理モジュール１６０では、ブロック単位に絵柄／非絵柄を判断していた。
このようなブロック単位の判断では、図１９に示す例のように、文字部分を排除して絵柄判断することは困難である。
そこで、さらに、以下の手法を用いる。
統合判断処理モジュール１６０は、絵柄の属性に属するブロック内に絵柄の属性とは異なる画素塊の全体が含まれている場合は、そのブロックは絵柄であると判断するようにしてもよい。
統合判断処理モジュール１６０は、絵柄の属性に属するブロック内に絵柄の属性とは異なる画素塊の一部が含まれている場合は、そのブロックは絵柄ではないと判断するようにしてもよい。
そのブロックは絵柄であると一旦判断された後に、文字（非絵柄）である画素塊があるか否かを判断し、その画素塊の全体がブロック内に収まっている場合は、その画素塊を含めて対象ブロックは絵柄であると判断し、その画素塊がブロック内に収まっていない場合（一部はブロック内にあるが、他の一部はそのブロック内にない場合である。つまり画素塊が複数のブロックをまたがって存在している場合）は、その画素塊の一部が含まれている対象ブロックは絵柄ではない（この場合は、文字である）と判断する。

より具体的な例として、絵柄ブロックの中に、文字（非絵柄）の全体が含まれている場合には、その文字は絵柄中の文字であると判断する（図８参照）。図８の例に示すように１つの絵柄ブロックでは文字がはみ出している場合でも、はみ出す先が絵柄ブロックであれば、絵柄ブロックの中に文字が全て含まれると判断する。
絵柄ブロック中に、文字が全て含まれずに、絵柄ブロックから文字がはみ出してしまっている場合、その文字は絵柄とは判断しない（図９参照）。
ここで、判別で用いるブロックサイズが十分小さければ、図１９に示す例のように、文字部分を排除して絵柄と判断し得る。
前述の処理において、絵柄ブロック中の「文字ではない画素」は、絵柄であると判断すればよい。

さらに、精密に判断するには、統合判断処理モジュール１６０は、絵柄の属性に属するブロック又は絵柄の属性には属していないブロックに含まれている絵柄ではない画素塊の画素の割合に基づいて、そのブロックは絵柄であるか否かを判断するようにしてもよい。
例えば、文字画素塊の画素のうち、絵柄ブロック中に存在する画素と、非絵柄ブロック中に存在する画素の比Ｒを次の式１のように算出する。
Ｒ＝非絵柄ブロック中に存在する画素数／絵柄ブロック中に存在する画素数（式１）
この比Ｒと予め定められた閾値との比較を行って、閾値よりも大きければその文字を非絵柄として判断する。小さければその文字を絵柄として判断する。

又は、比Ｒは、次の式２を用いてもよい。つまり、文字の全画素数と、非絵柄ブロック中に存在する画素の画素数との比であってもよい。
Ｒ＝非絵柄ブロック中に存在する画素数／文字部全画素数（式２）
この場合も、この比Ｒと予め定められた閾値との比較を行って、閾値よりも大きければその文字を非絵柄として判断する。小さければその文字を絵柄として判断する。

又は、比Ｒは、次の式３を用いてもよい。つまり、文字の全画素数と、絵柄ブロック中に存在する画素の画素数との比であってもよい。
Ｒ＝絵柄ブロック中に存在する画素数／文字部全画素数（式３）
この場合は、この比Ｒと予め定められた閾値との比較を行って、閾値よりも大きければその文字を絵柄として判断する。小さければその文字を非絵柄として判断する。

＜他の属性の判断＞
前述の実施の形態では、絵柄と非絵柄の判断を例示したが、本実施の形態が判断するブロックの属性は、ほかの属性であってもよい。２次元的に分布しており、塊として出現しやすい属性であれば、安定的に判断することができる。

＜強いパラメタと弱いパラメタの決定方法＞
ここで、強いパラメタと弱いパラメタの決定方法に関して説明する。
ここでは、前述の実施の形態と同様に、ブロック内画素値のヒストグラムの最大値と閾値との比較とを行うこととする。
強−判断モジュール１２０では、強いパラメタを閾値として比較することになる。ヒストグラムの最大値が強いパラメタよりも小さければ、強ブロックとして判断される。
弱−判断モジュール１３０では、弱いパラメタを閾値として比較することになる。ヒストグラムの最大値が弱いパラメタよりも小さければ、弱いブロックとして判断される。
ここで、ある画像をブロックに分割して、ブロック毎に、絵柄か非絵柄かが判断されている教師データを用いる。教師データは、例えばオペレータによる操作によって与えるようにしてもよい。

ヒストグラムの最大値を横軸にとり、絵柄ブロックと非絵柄ブロックの頻度をプロットすると図１０の例に示すようになる。
一般に、絵柄ブロックのヒストグラムの最大値は小さく、非絵柄ブロックのヒストグラムの最大値は大きい。
２つの属性のブロックの頻度分布に重なりが無ければ、その分布間にパラメタを設定することによって、１つの判断器で判断ができる。しかし、一般には２つの属性のブロックの頻度分布に重なりが生じてしまう。
そこで、以下のように２つのパラメタを設定する。
強いパラメタは、絵柄ブロックだけを判定できるパラメタである。強いパラメタよりも小さなブロックは、高い確率で絵柄ブロックであると判断できる。例えば、非絵柄ブロックを全く選択しない値を強いパラメタとすればよい。
弱いパラメタは、絵柄ブロックを全て抽出できるパラメタである。弱いパラメタよりも大きなブロックは、高い確率で非絵柄ブロックであると判断できる。例えば、全ての絵柄ブロックを選択できる値を弱いパラメタとすればよい。
このように、非絵柄ブロックを「全く」選択しない、又は、「全て」の絵柄ブロックを選択できる値を決定することは、かなり困難な場合がある。そこで、ある割合で間違いが混在する値としてもよい。
例えば、非絵柄ブロックをＸ％以下しか選択しない値を強いパラメタとすればよい。そして、絵柄ブロックを選択しない割合をＹ％以下とする値を弱いパラメタとすればよい。

図１３を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図１３に示す構成は、例えばパーソナルコンピュータ（ＰＣ）などによって構成されるものであり、スキャナ等のデータ読み取り部１３１７と、プリンタなどのデータ出力部１３１８を備えたハードウェア構成例を示している。

ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１３０１は、前述の実施の形態において説明した各種のモジュール、すなわち、ブロック化モジュール１１０、強−判断モジュール１２０、弱−判断モジュール１３０、結合処理モジュール１４０等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。

ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１３０２は、ＣＰＵ１３０１が使用するプログラムや演算パラメータ等を格納する。ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１３０３は、ＣＰＵ１３０１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはＣＰＵバスなどから構成されるホストバス１３０４により相互に接続されている。

ホストバス１３０４は、ブリッジ１３０５を介して、ＰＣＩ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ／Ｉｎｔｅｒｆａｃｅ）バスなどの外部バス１３０６に接続されている。

キーボード１３０８、マウス等のポインティングデバイス１３０９は、操作者により操作される入力デバイスである。ディスプレイ１３１０は、液晶表示装置又はＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）などがあり、各種情報をテキストやイメージ情報として表示する。

ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）１３１１は、ハードディスクを内蔵し、ハードディスクを駆動し、ＣＰＵ１３０１によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、ブロック化モジュール１１０が受け付けた画像、各モジュールの処理結果データなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。

ドライブ１３１２は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体１３１３に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース１３０７、外部バス１３０６、ブリッジ１３０５、及びホストバス１３０４を介して接続されているＲＡＭ１３０３に供給する。リムーバブル記録媒体１３１３も、ハードディスクと同様のデータ記録領域として利用可能である。

接続ポート１３１４は、外部接続機器１３１５を接続するポートであり、ＵＳＢ、ＩＥＥＥ１３９４等の接続部を持つ。接続ポート１３１４は、インタフェース１３０７、及び外部バス１３０６、ブリッジ１３０５、ホストバス１３０４等を介してＣＰＵ１３０１等に接続されている。通信部１３１６は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部１３１７は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部１３１８は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。

なお、図１３に示す画像処理装置のハードウェア構成は、１つの構成例を示すものであり、本実施の形態は、図１３に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア（例えば特定用途向け集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ：ＡＳＩＣ）等）で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図１３に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファクシミリ、スキャナ、プリンタ、複合機（スキャナ、プリンタ、複写機、ファクシミリ等のいずれか２つ以上の機能を有している画像処理装置）などに組み込まれていてもよい。

また、前述の実施の形態の説明において、「以上」、「以下」、「より大きい」、「より小さい（未満）」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい（未満）」、「以上」、「以下」としてもよい。

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク（ＤＶＤ）であって、ＤＶＤフォーラムで策定された規格である「ＤＶＤ−Ｒ、ＤＶＤ−ＲＷ、ＤＶＤ−ＲＡＭ等」、ＤＶＤ＋ＲＷで策定された規格である「ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等」、コンパクトディスク（ＣＤ）であって、読出し専用メモリ（ＣＤ−ＲＯＭ）、ＣＤレコーダブル（ＣＤ−Ｒ）、ＣＤリライタブル（ＣＤ−ＲＷ）等、ブルーレイ・ディスク（Ｂｌｕ−ｒａｙＤｉｓｃ（登録商標））、光磁気ディスク（ＭＯ）、フレキシブルディスク（ＦＤ）、磁気テープ、ハードディスク、読出し専用メモリ（ＲＯＭ）、電気的消去及び書換可能な読出し専用メモリ（ＥＥＰＲＯＭ）、フラッシュ・メモリ、ランダム・アクセス・メモリ（ＲＡＭ）等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク（ＬＡＮ）、メトロポリタン・エリア・ネットワーク（ＭＡＮ）、ワイド・エリア・ネットワーク（ＷＡＮ）、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。

１１０…ブロック化モジュール
１２０…強−判断モジュール
１３０…弱−判断モジュール
１４０…結合処理モジュール
１５０…ラベル付けモジュール
１６０…統合判断処理モジュール

Claims

受け付けた画像を領域に分割する分割手段と、
前記分割手段によって分割された領域がある属性に属するか否かを判断する第１の判断手段と、
前記分割手段によって分割された領域が該属性に属するか否かを、前記第１の判断手段によって行われる判断手法とは異なる判断手法によって判断する第２の判断手段と、
前記第１の判断手段による判断結果と前記第２の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第３の判断手段
を具備することを特徴とする画像処理装置。
前記第３の判断手段は、前記第１の判断手段によって前記属性に属すると判断された領域である第１の領域に前記第２の判断手段によって該属性に属すると判断された第２の領域が接している場合に、該第２の領域を該属性に属すると判断する
ことを特徴とする請求項１に記載の画像処理装置。
前記第３の判断手段は、前記第１の領域と前記第２の領域を結合し、その結合した領域内に該第１の領域が含まれているか否かによって、前記領域が前記属性に属するか否かを判断する
ことを特徴とする請求項１に記載の画像処理装置。
前記第１の判断手段及び前記第２の判断手段は、前記領域内の画素値、画素値頻度、画素塊数のいずれか１つ以上に基づいて、該領域が前記属性に属するか否かの判断を行う
ことを特徴とする請求項１から３のいずれか一項に記載の画像処理装置。
前記第２の判断手段は、前記第１の判断手段によって領域が前記属性に属するか否かの判断をする場合の閾値とは異なる閾値を用いて、領域の判断を行う
ことを特徴とする請求項１から４のいずれか一項に記載の画像処理装置。
前記第２の判断手段は、前記第１の判断手段によって領域が前記属性に属するか否かの判断をする場合の領域の大きさとは異なる領域の大きさを用いて、領域の判断を行う
ことを特徴とする請求項１から４のいずれか一項に記載の画像処理装置。
前記属性に属する領域内に含まれている画素と該属性には属していない領域に含まれている画素の割合に基づいて、画素塊が該属性であるか否かを判断する画素塊判断手段を有する
ことを特徴とする請求項１から６のいずれか一項に記載の画像処理装置。
前記画素塊判断手段は、前記属性に属する領域内に画素塊の全体が含まれている場合は、該画素塊は該属性であると判断する
ことを特徴とする請求項７に記載の画像処理装置。
前記画素塊判断手段は、前記属性に属する領域内に画素塊の一部が含まれている場合は、該画素塊は該属性であると判断する
ことを特徴とする請求項７に記載の画像処理装置。
コンピュータを、
受け付けた画像を領域に分割する分割手段と、
前記分割手段によって分割された領域がある属性に属するか否かを判断する第１の判断手段と、
前記分割手段によって分割された領域が該属性に属するか否かを、前記第１の判断手段によって行われる判断手法とは異なる判断手法によって判断する第２の判断手段と、
前記第１の判断手段による判断結果と前記第２の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第３の判断手段
として機能させることを特徴とする画像処理プログラム。