JP5974589B2

JP5974589B2 - 画像処理装置およびプログラム

Info

Publication number: JP5974589B2
Application number: JP2012079871A
Authority: JP
Inventors: 近藤　真樹; 真樹近藤; 良平小澤
Original assignee: Brother Industries Ltd
Current assignee: Brother Industries Ltd
Priority date: 2012-03-30
Filing date: 2012-03-30
Publication date: 2016-08-23
Anticipated expiration: 2032-03-30
Also published as: US20130259383A1; EP2645332A2; JP2013210785A; US9158987B2; EP2645332A3; EP2645332B1

Description

本発明は、画像を複数の領域に分離する画像処理に関する。

従来から、１枚の画像を複数の領域に分離する画像処理が行われている。例えば、適当な閾値を用いて画像全体を２値化し、２値画像における黒画素の連結成分の集合を抽出することによって文字矩形を検索し、矩形毎に閾値を決めて局所的に２値化し、矩形毎の閾値から画像全体のための閾値を決定し、決定された閾値を利用して、局所的に２値化を行った部分以外の部分の全体を２値化する、技術が提案されている。

特開２００１−２９１０５８号公報

ところが、互いに表示内容が異なる複数の領域を表す画像を処理する場合には、複数の領域を適切に分離できない場合があった。例えば、１つの領域として特定すべき領域が、複数の領域に分離される場合があった。

本発明の主な利点は、領域分離の精度を向上することである。

本発明は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の適用例として実現することが可能である。

［適用例１］対象画像データによって表される対象画像を、第１領域と、前記第１領域とは異なる第２領域と、を含む複数の領域に分離する第１分離部と、前記第１領域を複数の小領域に分離し、前記第２領域を複数の小領域に分離する、第２分離部と、前記複数の小領域の中の少なくとも２つの前記小領域を統合することによって統合領域を生成する生成部と、を備える、画像処理装置。
この構成によれば、一旦分離された領域が統合されることなく単独の領域として利用される場合と比べて、領域分離の精度を向上できる。

［適用例２］適用例１に記載の画像処理装置であって、前記第２分離部は、第１閾値を用いて前記第１領域の前記分離を行い、前記第１閾値とは異なる第２閾値を用いて前記第２領域の前記分離を行う、画像処理装置。
この構成によれば、１つの閾値を用いて対象画像の全体を複数の領域に分離する場合と比べて、領域分離の精度を向上できる。

［適用例３］適用例１または２に記載の画像処理装置であって、前記第１分離部は、Ｕ個（Ｕは２以上の整数）の画素を含む第１ブロック毎に、前記第１領域と前記第２領域とを含む前記複数の領域の分離を行う、画像処理装置。
この構成によれば、第１分離部が画素毎に領域の分離を行う場合と比べて、処理を簡素化できる。

［適用例４］適用例３に記載の画像処理装置であって、前記第２分離部は、Ｊ個（Ｊは１以上Ｕ未満の整数）の画素を含む第２ブロック毎に、前記複数の小領域の分離を行う、画像処理装置。
この構成によれば、第１分離部が粗い領域分離を行った後に、第２分離部が細かい領域分離を行うので、対象画像が複数種類の領域（オブジェクト）を表す場合に、領域分離の精度を向上できる。

［適用例５］適用例４に記載の画像処理装置であって、前記第２ブロックに含まれる前記画素の数であるＪ個は、１個である、画像処理装置。
この構成によれば、２個以上の画素を含むブロック毎に領域の分離が行われる場合と比べて、細かい領域分離を実現できる。

［適用例６］適用例１ないし５のいずれかに記載の画像処理装置であって、前記第１分離部は、前記対象画像から、エッジ強度の程度を表す特徴値が所定の基準以上である領域であるエッジ領域を抽出し、前記対象画像を、前記エッジ領域を含む前記第１領域と、前記エッジ領域を含む前記第２領域と、前記エッジ領域を含まない第３領域と、を含む複数の領域に分離する、画像処理装置。
この構成によれば、エッジ強度の程度を表す特徴値を利用して、エッジ領域を含む第１領域と第２領域と、エッジ領域を含まない第３領域と、が分離されるので、対象画像に含まれる色に依存せずに、領域分離の精度を向上できる。

［適用例７］適用例２に記載の画像処理装置であって、前記第２分離部は、前記第１閾値を用いて前記第１領域に含まれる画素の階調値を二値化し、前記二値化後の階調値が同じである画素が連続する１つの領域を、１つの前記小領域として分離し、前記第２閾値を用いて前記第２領域に含まれる画素の階調値を二値化し、前記二値化後の階調値が同じである画素が連続する１つの領域を、１つの前記小領域として分離する、画像処理装置。
この構成によれば、第２分離部による領域分離の処理を簡素化できる。

［適用例８］適用例１ないし７のいずれかに記載の画像処理装置であって、前記生成部は、前記第１領域の小領域と前記第２領域の小領域とを統合することによって前記統合領域を生成する、画像処理装置。
この構成によれば、１つの領域として分離されるべき領域が第１領域と第２領域とに分離した場合に、分離した領域を統合することができるので、領域分離の精度を向上できる。

［適用例９］適用例１ないし８のいずれかに記載の画像処理装置であって、前記生成部は、第１小領域と第２小領域とが所定の統合条件を満たす場合に、前記第１小領域と前記第２小領域とを統合し、前記所定の統合条件は、１）前記第１小領域の大きさと前記第２小領域の大きさとが、所定の大きさ基準以下である、２）前記第１小領域と前記第２小領域との間の距離が、所定の距離基準以下である、３）前記第１小領域と前記第２小領域との間の階調値の差が、所定の階調差基準以下である、の少なくとも１つを要する、画像処理装置。
この構成によれば、１つの領域として分離されるべき領域が第１領域と第２領域とに分離した場合に、分離した領域を適切に統合することができるので、領域分離の精度を向上できる。

［適用例１０］適用例１ないし９のいずれかに記載の画像処理装置であって、前記生成部は、３つ以上の前記小領域を統合することによって前記統合領域を生成する、画像処理装置。
この構成によれば、１つの領域として分離されるべき領域が３つ以上の小領域に分離した場合に、分離した領域を統合することができるので、領域分離の精度を向上できる。

[適用例１１]適用例１０に記載の画像処理装置であって、前記生成部は、２つの小領域を統合することによって前記統合領域を生成し、前記生成した統合領域に前記２つの小領域とは異なる小領域を統合することによって、前記統合領域を更新する、画像処理装置。
この構成によれば、３つ以上の小領域を含む統合領域の生成を、適切に行うことができる。

［適用例１２］適用例２に記載の画像処理装置であって、前記第２分離部は、前記第１領域の周囲の領域の階調値と、前記第１領域の縁部分の階調値と、の少なくとも一方に基づく前記第１閾値を用いて、前記第１領域の前記分離を行い、前記第２領域の周囲の領域の階調値と、前記第２領域の縁部分の階調値と、の少なくとも一方に基づく前記第２閾値を用いて、前記第２領域の前記分離を行う、画像処理装置。
この構成によれば、第１領域に適した第１閾値と、第２領域に適した第２閾値と、を用いることができるので、領域分離の精度を向上できる。

［適用例１３］適用例１ないし１２のいずれかに記載の画像処理装置であって、さらに、前記統合領域が、文字を表す文字領域であるか否かを、判定する判定部を含み、前記判定部は、前記統合領域に含まれる前記小領域の総数が所定の領域数以上であることを要する条件が満たされる場合に、前記統合領域が前記文字領域であると判定する、画像処理装置。
この構成によれば、文字領域であるか否かを適切に判定できる。

［適用例１４］画像処理をコンピュータに実行させるためのプログラムであって、対象画像データによって表される対象画像を、第１領域と、前記第１領域とは異なる第２領域と、を含む複数の領域に分離する機能と、前記第１領域を複数の小領域に分離し、前記第２領域を複数の小領域に分離する、機能と、前記複数の小領域の中の少なくとも２つの前記小領域を統合することによって統合領域を生成する機能と、をコンピュータに実行させるためのプログラム。

なお、本発明は、種々の形態で実現することが可能であり、例えば、画像処理方法および画像処理装置、それらの方法または装置の機能を実現するためのコンピュータプログラム、そのコンピュータプログラムを記録した記録媒体（例えば、一時的ではない記録媒体）、等の形態で実現することができる。

計算機２００の構成を示すブロック図である。画像処理のフローチャートである。画像処理の全体の流れを示す概略図である。第１分離部１２０による処理の概略図である。エッジ強度の算出式である。２つの非ベタ領域Ｌ１０１、Ｌ１０２の処理例を示す概略図である。統合処理のフローチャートである。２つの領域の統合を示す概略図である。階調差ＴＤの算出式である。４つの領域Ｌ２０１〜Ｌ２０４の統合を示す概略図である。判定処理のフローチャートである。

Ａ．実施例：
次に、本発明の実施の形態を実施例に基づき説明する。図１は、本発明の一実施例としての計算機２００の構成を示すブロック図である。計算機２００は、例えば、パーソナルコンピュータであり、ＣＰＵ２１０と、ＤＲＡＭ等を含む揮発性記憶装置２４０と、フラッシュメモリやハードディスクドライブ等を含む不揮発性記憶装置２９０と、タッチパネルやキーボード等の操作部２７０と、外部装置と通信を行うためのインタフェースである通信部２８０と、を備えている。

計算機２００は、通信部２８０を介して、外部装置（ここでは、スキャナ３００と複合機４００）に、通信可能に接続されている。スキャナ３００は、光学的に対象物（例えば、紙の文書）を読み取ることによってスキャンデータを取得する画像読取装置である。複合機４００は、光学的に対象物を読み取ることによってスキャンデータを取得する画像読取部を備えている。

揮発性記憶装置２４０には、ＣＰＵ２１０が処理を行う際に生成される種々の中間データを一時的に格納するバッファ領域２４１が設けられている。不揮発性記憶装置２９０は、ドライバプログラム２９１を格納している。

ＣＰＵ２１０は、ドライバプログラム２９１を実行することにより、スキャナドライバ１００として機能する。スキャナドライバ１００は、画像データ取得部１１０と、第１分離部１２０と、第２分離部１３０と、生成部１４０と、判定部１５０と、画像調整部１６０と、を含んでいる。後述するように、スキャナドライバ１００は、対象画像データとしてのスキャンデータを利用して、画像処理を実行する。画像処理の結果、対象画像データによって表される対象画像は、複数の領域に分離され、領域毎に画像（領域内のオブジェクト）の種類（属性とも呼ぶ）が判定される。

図２は、画像処理のフローチャートである。ステップＳ１００では、画像データ取得部１１０（図１）は、通信部２８０を介して、スキャンデータを、対象画像データとして、取得する。具体的には、画像データ取得部１１０は、スキャナ３００または複合機４００の画像読取部を制御して、スキャンデータを取得する。スキャンデータは、例えば、紙の文書の読み取り結果を表している。また、スキャンデータは、複数の画素毎の色を表すビットマップデータである。

図３は、画像処理の全体の流れを示す概略図である。図３（Ａ）〜図３（Ｅ）に示す画像ＴＩ、ＬＩ１、ＬＩ２、ＬＩ３、ＲＩは、画像処理の後述する５つの段階における処理結果の例を示している。画像処理は、図３（Ａ）〜図３（Ｅ）の順に、進行する。図３（Ａ）の対象画像ＴＩは、スキャンデータによって表される画像の一例である。対象画像ＴＩでは、図示しない複数の画素が、第一方向Ｄ１と、第一方向Ｄ１と直交する第二方向Ｄ２と、に沿って、マトリクス状に配置されている。１つの画素の画素データは、例えば、赤Ｒと緑Ｇと青Ｂとの３つの色成分の階調値（例えば、２５６階調）を表している。

図３（Ａ）の例では、対象画像ＴＩは、背景画像Ｂｇ１と、２つの文字画像Ｏｂ１、Ｏｂ２と、写真画像Ｏｂ３と、４つの描画画像Ｏｂ４〜Ｏｂ７と、を表している。ここで、文字画像は、１以上の文字を表す画像である。写真画像は、デジタルカメラによる撮影や動画から静止画を抜き出す等によって得られた画像である。描画画像は、イラスト、表、グラフ、線図、ベクトルグラフィックス、模様等の、描画によって表された画像である。以下、文字画像を、文字オブジェクトとも呼び、写真画像を、写真オブジェクトとも呼び、描画画像を、描画オブジェクトとも呼ぶ。また、文字画像と写真画像と描画画像とを総称して、オブジェクトとも呼ぶ。

対象画像ＴＩ内のオブジェクトＯｂ１〜Ｏｂ７は、スキャンデータを生成するためのスキャン対象（例えば、紙の文書や原稿等）に記録されていたものである。図３（Ａ）の例では、第１オブジェクトＯｂ１は、４つの文字（「Ｅ」、「Ｆ」、「Ｇ」、「Ｈ」）を含む文字列を表し、第２オブジェクトＯｂ２は、３つの文字（「Ｗ」、「Ｘ」、「Ｙ」）を含む文字列を表している。また、第５オブジェクトＯｂ５は、枠を表し、第６オブジェクトＯｂ６は、枠に囲まれた一様な領域を表し、第７オブジェクトＯｂ７は、枠に囲まれた別の一様な領域を表している。第１オブジェクトＯｂ１の２つの文字「Ｅ」、「Ｆ」は、第６オブジェクトＯｂ６内に配置され、第１オブジェクトＯｂ１の残りの２つの文字「Ｇ」、「Ｈ」は、第７オブジェクトＯｂ７内に配置されている。第６オブジェクトＯｂ６の色と、第７オブジェクトＯｂ７の色と、背景画像Ｂｇ１の色とは、互いに異なっている。

図２のステップＳ１０５〜Ｓ１１５では、第１分離部１２０（図１）は、対象画像ＴＩを複数の領域に分離する。具体的には、ステップＳ１０５で、第１分離部１２０（図１）は、対象画像ＴＩ（スキャンデータ）を解析することによって、エッジ画像データを生成する。図４は、第１分離部１２０による処理の概略図である。図４（Ａ）は、対象画像ＴＩを示し、図４（Ｂ）は、エッジ画像データの特徴の概略を表すエッジ画像ＥＩを示している。

エッジ画像ＥＩは、対象画像ＴＩ内の各画素位置におけるエッジ強度を表している。エッジ強度は、画像内の位置の変化（隣り合う複数の画素）に対する階調値の変化の大きさを表している。図５は、本実施例におけるエッジ強度の算出式を示している。本実施例では、第１分離部１２０は、いわゆるソーベルオペレータ（Sobel operator）を用いて、赤Ｒと緑Ｇと青Ｂとの３つの色成分毎に、エッジ強度Ｓｅを算出する。

図５中の階調値Ｐ（ｘ，ｙ）は、対象画像ＴＩ内の特定の画素位置（ｘ，ｙ）の階調値を表している。第一方向位置ｘは、第一方向Ｄ１の画素位置を示し、第二方向位置ｙは、第二方向Ｄ２の画素位置を示している。図示するように、対象画像ＴＩ内の画素位置（ｘ，ｙ）におけるエッジ強度Ｓｅ（ｘ，ｙ）は、その画素位置（ｘ，ｙ）を中心とし隣り合う３行３列の９つの画素を用いて算出される。図５の算出式の第１項および第２項は、９つの位置の画素の階調値に、対応する係数をそれぞれ乗じた値の和の絶対値である。第１項は、第一方向Ｄ１の階調値の変化の大きさを示し、第２項は、第二方向Ｄ２の階調値の変化の大きさを示している。

図４（Ｂ）のエッジ画像ＥＩは、各画素位置における、赤Ｒのエッジ強度と緑Ｇのエッジ強度と青Ｂのエッジ強度とを平均化して得られるエッジ強度（参考エッジ強度と呼ぶ）を表している。図中では、参考エッジ強度が小さい画素が白で示され、参考エッジ強度が大きい画素が黒で示されている。エッジ画像ＥＩは、対象画像ＴＩのオブジェクトＯｂ１〜Ｏｂ７によって構成されるエッジＥｇＡ１〜ＥｇＡ６を、表している。なお、エッジ画像ＥＩ（参考エッジ強度）は、説明の便宜上、示されており、画像処理には要しない。

図２のステップＳ１０５で、エッジ画像データを生成した後、ステップＳ１１０、Ｓ１１５では、第１分離部１２０（図１）は、複数の画素を含む第１ブロックＢＬ毎に、ベタ領域と非ベタ領域とを特定する。図４（Ｂ）に示すように、第１ブロックＢＬは、エッジ画像ＥＩ（すなわち、対象画像ＴＩ）上にマトリクス状に配置されている。１つの第１ブロックＢＬは、例えば、ＢＬｎ行×ＢＬｎ列（ＢＬｎは、２以上の整数）の画素ＰＸのブロックである。ＢＬｎの値としては、例えば、１０〜５０の範囲内の値を採用可能である。

ベタ領域とは、領域が有するエッジ強度が所定の基準未満の領域であり、非ベタ領域とは、領域が有するエッジ強度が所定の基準以上の領域である。第１分離部１２０は、ステップＳ１１０で、第１ブロックＢＬ毎に、平均エッジ強度（ＥＲａｖｅ、ＥＧａｖｅ、ＥＢａｖｅ）を算出する。平均エッジ強度（ＥＲａｖｅ、ＥＧａｖｅ、ＥＢａｖｅ）は、赤Ｒと緑Ｇと青Ｂとの３つの色成分毎に、算出される。第１分離部１２０は、処理対象の第１ブロックＢＬの平均エッジ強度と所定の基準とを比較して、処理対象の第１ブロックＢＬを、ベタブロックおよび非ベタブロックのいずれかに分類する。ベタブロックは、平均エッジ強度が所定の基準より小さいブロックである。非ベタブロックは、平均エッジ強度が所定の基準以上であるブロックである。本実施例では、第１分離部１２０は、平均エッジ強度（ＥＲａｖｅ、ＥＧａｖｅ、ＥＢａｖｅ）を、色成分ごとに定められた基準値（ＥＴｒ、ＥＴｇ、ＥＴｂ）と比較する。この結果、第１分離部１２０は、ＥＲａｖｅ＜ＥＴｒ、かつ、ＥＧａｖｅ＜ＥＴｇ、かつ、ＥＢａｖｅ＜ＥＴｂが成立する場合には、処理対象の第１ブロックＢＬをベタブロックに分類する。ＥＲａｖｅ≧ＥＴｒ、および、ＥＧａｖｅ≧ＥＴｇ、および、ＥＢａｖｅ≧ＥＴｂのうちの少なくとも一つが成立する場合には、第１分離部１２０は、処理対象の第１ブロックＢＬを非ベタブロックに分類する。

図４（Ｃ）の画像ＳＩは、分類の結果を示している。ハッチングが付された第１ブロックＢＬが、非ベタブロックであり、ハッチングのない第１ブロックＢＬが、ベタブロックである。図示するように、連続する（隣り合う）複数の非ベタブロックで構成される６つの領域ＮＡ１〜ＮＡ６が、それぞれ形成されている。これらの領域ＮＡ１〜ＮＡ６の間は、ベタブロックによって隔てられている。２つの領域ＮＡ１、ＮＡ２は、図４（Ａ）の第１文字画像Ｏｂ１に対応する。残りの４つの領域ＮＡ３、ＮＡ４、ＮＡ５、ＮＡ６は、４つのオブジェクトＯｂ５、Ｏｂ２、Ｏｂ３、Ｏｂ４に、それぞれ対応する。第３領域ＮＡ３の内部に配置されたベタブロックは、第６オブジェクトＯｂ６または第７オブジェクトＯｂ７に対応する。他のベタブロックは、背景画像Ｂｇ１に対応する。このように、一般的には、非ベタブロックは、各画素の階調値が一様ではないオブジェクトを表し、ベタブロックは、背景、または、各画素の階調値がおおよそ一様なオブジェクトを表している。各画素の階調値がおおよそ一様なオブジェクトは、背景の一種であり得る。

図２のステップＳ１１０で、ベタブロックと非ベタブロックとを特定した後、ステップＳ１１５では、第１分離部１２０（図１）は、対象画像ＴＩにおけるベタ領域と非ベタ領域との特定（ラベリング）を行う。具体的には、第１分離部１２０は、連続する１以上の非ベタブロックで構成される連続な１つの領域に対応する領域を、１つの非ベタ領域として特定し、連続する１以上のベタブロックで構成される連続な１つの領域に対応する領域を、１つのベタ領域として特定する。このように、連続する１以上の非ベタブロックは、１つの非ベタ領域に組み込まれるので、非ベタ領域は、通常は、ベタ領域に囲まれている。

図４（Ｄ）の第１ラベル画像ＬＩ１は、領域の特定結果を示している。図４（Ｃ）の領域ＮＡ１〜ＮＡ６に対応して、６つの非ベタ領域Ｌ１０１〜Ｌ１０６が、特定されている。また、第３領域Ｌ１０３内には、２つのベタ領域Ｌ１０７、Ｌ１０８が、特定されている。残りの領域も、ベタ領域Ｌ１００である。第１分離部１２０（図１）は、領域Ｌ１００〜Ｌ１０８に、領域を識別するラベル（例えば、０〜８）を割り当てる。例えば、第１分離部１２０は、対象画像ＴＩの各画素に、どの領域に含まれるのかを表すラベル（識別子）を割り当てる。なお、第１ラベル画像ＬＩ１は、図３（Ｂ）の第１ラベル画像ＬＩ１と同じである。

図２のステップＳ１１５で、対象画像ＴＩにおけるベタ領域と非ベタ領域との特定（ラベリング）を行った後の、ステップＳ１２０〜Ｓ１３５では、第２分離部１３０（図１）は、第１分離部１２０によって分離された非ベタ領域毎に、非ベタ領域を複数の小領域に分離する処理を、行う。具体的には、ステップＳ１２０で、第２分離部１３０は、１つの未処理の非ベタ領域を、処理対象領域Ｈとして選択する。次いで、ステップＳ１２５では、第２分離部１３０は、処理対象領域Ｈの周囲を囲むベタ領域の階調値を利用して、処理対象領域Ｈを二値化するための閾値を決定する。

図６は、２つの非ベタ領域Ｌ１０１、Ｌ１０２の処理例を示す概略図である。図中には、対象画像ＴＩの一部分ＴＩａが示されている。部分ＴＩａは、第１領域Ｌ１０１と第２領域Ｌ１０２とを含む部分である。図中では、第１領域Ｌ１０１と第２領域Ｌ１０２との間の部分（第３領域Ｌ１０３）の図示が省略されている。

以下、第１領域Ｌ１０１が処理対象領域Ｈである場合について、説明する。第２分離部１３０（図１）は、第１領域Ｌ１０１の周囲を囲むベタ領域を特定する（ここでは、第７領域Ｌ１０７）。第２分離部１３０は、図３（Ｂ）の第１ラベル画像ＬＩ１を解析することによって、第１領域Ｌ１０１の周囲を囲むベタ領域を特定することができる。第２分離部１３０は、特定されたベタ領域Ｌ１０７を代表する色ＣＬｏ１を算出する（以下、第１代表色ＣＬｏ１と呼ぶ）。第１代表色ＣＬｏ１のＲＧＢ毎の階調値Ｒｒ、Ｇｒ、Ｂｒは、ベタ領域Ｌ１０７の全ての画素についての、ＲＧＢ毎の平均階調値である。

通常は、オブジェクトは背景上に配置される。従って、第１領域Ｌ１０１の周囲を囲むベタ領域Ｌ１０７は、第１領域Ｌ１０１内のオブジェクトの背景を表している。すなわち、ベタ領域Ｌ１０７の代表色ＣＬｏ１は、第１領域Ｌ１０１の背景の色と、同じである。

次に、第２分離部１３０は、第１代表色ＣＬｏ１を利用して、第１閾値群Ｃｔｈｏ１を決定する。本実施例では、第１閾値群Ｃｔｈｏ１は、色成分毎（ＲＧＢ毎）の上限値と下限値とを含んでいる。具体的には、以下の６つの閾値Ｒ１、Ｒ２、Ｇ１、Ｇ２、Ｂ１、Ｂ２が、第１閾値群Ｃｔｈｏ１として決定される。
赤Ｒの下限値Ｒ１＝Ｒｒ−ｄＶ、赤Ｒの上限値Ｒ２＝Ｒｒ＋ｄＶ
緑Ｇの下限値Ｇ１＝Ｇｒ−ｄＶ、緑Ｇの上限値Ｇ２＝Ｇｒ＋ｄＶ
青Ｂの下限値Ｂ１＝Ｂｒ−ｄＶ、青Ｂの上限値Ｂ２＝Ｂｒ＋ｄＶ
ここで、値ｄＶは、予め決められた値である。これらの値Ｒ１、Ｒ２、Ｇ１、Ｇ２、Ｂ１、Ｂ２は、第１代表色ＣＬｏ１に近い色の範囲、すなわち、背景の色に近い色の範囲を、定めている。

図２のステップＳ１２５で、閾値を決定した後、ステップＳ１３０では、第２分離部１３０（図１）は、ステップＳ１２５で決定された閾値を利用して、処理対象領域Ｈを二値化する（二値画像データを生成する）。具体的には、処理対象領域Ｈ内の各画素を、１画素毎に、オブジェクト画素と、非オブジェクト画素とに分類する。二値画像データの画素毎の階調値は、オブジェクト画素を表す値（例えば、「１」）と、非オブジェクト画素を表す値（例えば、「ゼロ」）と、のいずれかに設定される。

第２分離部１３０は、処理対象領域Ｈ内（例えば、第１領域Ｌ１０１内）の画素Ｐｘｉの色成分毎（ＲＧＢ毎）の階調値Ｒｉ、Ｇｉ、Ｂｉの全てが、上記の閾値群Ｒ１、Ｒ２、Ｇ１、Ｇ２、Ｂ１、Ｂ２で定められる色範囲内にある場合に、画素Ｐｘｉを非オブジェクト画素に分類する。換言すれば、階調値Ｒｉ、Ｇｉ、Ｂｉは、以下の３つの条件Ｅ１〜Ｅ３を満たしている場合に、画素Ｐｘｉは、非オブジェクト画素に分類される。

（第１条件Ｅ１）Ｒ１（＝Ｒｒ−ｄＶ）＜Ｒｉ＜Ｒ２（＝Ｒｒ＋ｄＶ）
（第２条件Ｅ２）Ｇ１（＝Ｇｒ−ｄＶ）＜Ｇｉ＜Ｇ２（＝Ｇｒ＋ｄＶ）
（第３条件Ｅ３）Ｂ１（＝Ｂｒ−ｄＶ）＜Ｂｉ＜Ｂ２（＝Ｂｒ＋ｄＶ）

この場合には、画素Ｐｘｉの色は、第１代表色ＣＬｏ１（背景の色）に近いので、画素Ｐｘｉは、背景を表している可能性が高い。

一方、第２分離部１３０は、色成分毎の階調値Ｒｉ、Ｇｉ、Ｂｉの少なくとも１つが、上述の色範囲外にある場合には、画素Ｐｘｉをオブジェクト画素に分類する（３つの条件Ｅ１〜Ｅ３の少なくとも１つが満たされない）。この場合には、画素Ｐｘｉの色は、第１代表色ＣＬｏ１（背景の色）から遠いので、画素Ｐｘｉは、背景とは異なる画像（オブジェクト）を表している可能性が高い。

図６の第１色分布ＣＤ１は、ＲＧＢ色空間における、第１領域Ｌ１０１内の画素の色分布例を示している。第１色分布ＣＤ１には、第１閾値群Ｃｔｈｏ１によって定められる色範囲ＢＡ１（すなわち、条件Ｅ１〜Ｅ３の全てが満たされる範囲）が示されている。この色範囲ＢＡ１は、背景の色に近い色の範囲を示している（以下、第１背景色範囲ＢＡ１とも呼ぶ）。図中の１つの色点ＰＸｃは、１つの画素の色を示している。図示された複数の色点ＰＸｃのうちの第１色点群ＣＧｔ１は、文字を表す画素の色の分布を示し、第２色点群ＣＧｂ１は、文字の周りの背景を表す画素の色の分布を示している。第１色点群ＣＧｔ１は、第１背景色範囲ＢＡ１の外に分布しているので、それらの色点に対応する複数の画素は、オブジェクト画素（文字を表す複数の画素）に分類される。第２色点群ＣＧｂ１は、第１背景色範囲ＢＡ１の内に分布しているので、それらの色点に対応する複数の画素は、非オブジェクト画素（背景を表す複数の画素）に分類される。

図６中の二値部分画像ＢＩａは、二値画像データにおける第１領域Ｌ１０１と第２領域Ｌ１０２とに対応する部分の一例である。図中のハッチングが付された部分は、オブジェクト画素によって構成される領域を示し、ハッチングの無い部分（白い部分）は、非オブジェクト画素によって構成される領域を示している。図示するように、第１領域Ｌ１０１内においては、文字「Ｅ」、「Ｆ」を表す画素が、オブジェクト画素に分類され、他の画素（背景を表す画素）が、非オブジェクト画素に分類されている。

図２のステップＳ１３０で、処理対象領域Ｈを二値化した（二値画像データを生成した）後、ステップＳ１３５では、第２分離部１３０（図１）が、二値画像データを利用して、オブジェクト領域と非オブジェクト領域との特定（ラベリング）を行う。具体的には、第１分離部１２０は、連続する１以上のオブジェクト画素（二値化後の階調値が「１」）で構成される連続な１つの領域を、１つのオブジェクト領域として特定し、連続する１以上の非オブジェクト画素（二値化後の階調値が「ゼロ」）で構成される連続な１つの領域を、１つの非オブジェクト領域として特定する。

図６中の画像ＬＩ２ａは、領域の特定結果を示している。二値部分画像ＢＩａに示す２つの文字の領域Ｋ２１、Ｋ２２に対応して、２つのオブジェクト領域Ｌ２０１、Ｌ２０２が特定されている。

二値部分画像ＢＩａに示す非オブジェクト領域（特に、文字の領域Ｋ２１、Ｋ２２の周囲を囲む非オブジェクト画素の領域Ｗ１）は、第１領域Ｌ１０１の周囲を囲むベタ領域Ｌ１０７と同じ背景を表している可能性が高い。そこで、本実施例では、第２分離部１３０は、第１領域Ｌ１０１内の非オブジェクト領域Ｗ１と、第１領域Ｌ１０１の周囲を囲むベタ領域Ｌ１０７とを含む領域を、１つの領域Ｌ２１１として、特定する。

第２分離部１３０（図１）は、特定した領域に、領域を識別するラベルを割り当てる。例えば、第２分離部１３０は、対象画像ＴＩの各画素に、どの領域に含まれるのかを表すラベル（識別子）を割り当てる。なお、図６中の画像ＬＩ２ａは、図３（Ｃ）の第２ラベル画像ＬＩ２の一部分を示している。

図２のステップＳ１３５で、オブジェクト領域と非オブジェクト領域との特定（ラベリング）を行った後、ステップＳ１４０では、第２分離部１３０（図１）は、全ての非ベタ領域の処理が終了したか否かを判定する。未処理の非ベタ領域が残っている場合には（Ｓ１４０：Ｎｏ）、第２分離部１３０は、ステップＳ１２０に戻って、未処理の非ベタ領域に対して、ステップＳ１２０〜Ｓ１３５の処理を、上述の第１領域Ｌ１０１の処理と同様に、実行する。全ての非ベタ領域の処理が終了した場合には（Ｓ１４０：Ｙｅｓ）、第２分離部１３０は、ステップＳ１４５に移行する。

例えば、第２領域Ｌ１０２については、第２分離部１３０（図１）は、以下のように、処理を行う。図６に示すように、第２分離部１３０は、第２領域Ｌ１０２の周囲を囲むベタ領域（ここでは、第８領域Ｌ１０８）の代表色ＣＬｏ２（第２代表色ＣＬｏ２と呼ぶ）を算出し、第２閾値群Ｃｔｈｏ２を決定する。図６中の第２色分布ＣＤ２は、第２領域Ｌ１０２内の画素の色分布を示している。図中の第２背景色範囲ＢＡ２は、第２閾値群Ｃｔｈｏ２によって定められる色の範囲である。本実施例では、第７オブジェクトＯｂ７（図３（Ａ））の色が、第６オブジェクトＯｂ６の色と異なっているので、第２代表色ＣＬｏ２は、第１代表色ＣＬｏ１と異なっている。従って、第２閾値群Ｃｔｈｏ２は、第１閾値群Ｃｔｈｏ１とは異なっている。すなわち、第２背景色範囲ＢＡ２は、第１背景色範囲ＢＡ１とは異なっている。

図中の第１色点群ＣＧｔ２は、文字を表す画素の色の分布を示し、第２色点群ＣＧｂ２は、文字の周りの背景を表す画素の色の分布を示している。第１色点群ＣＧｔ２は、背景色範囲ＢＡ２の外に分布しているので、それらの色点に対応する複数の画素は、オブジェクト画素（文字を表す複数の画素）に分類される。第２色点群ＣＧｂ２は、背景色範囲ＢＡ２の内に分布しているので、それらの色点に対応する複数の画素は、非オブジェクト画素（背景を表す複数の画素）に分類される。そして、第２分離部１３０は、二値部分画像ＢＩａに示す２つの文字の領域Ｋ２３、Ｋ２４に対応して、２つのオブジェクト領域Ｌ２０３、Ｌ２０４を特定する。文字の領域Ｋ２３、Ｋ２４の周囲を囲む非オブジェクト領域Ｗ２については、非オブジェクト領域Ｗ２とベタ領域Ｌ１０８とを含む領域が、１つの領域Ｌ２１２として、特定される。

第４領域Ｌ１０４（図３（Ｂ））についても、同様に、オブジェクト領域と非オブジェクト領域との分離が行われる。図３（Ｃ）に示すように、３つの文字「Ｗ」、「Ｘ」、「Ｙ」を表す３つの領域Ｌ２０６、Ｌ２０７、Ｌ２０８が、特定されている。

文字とは異なる種類のオブジェクトを表す（含む）非ベタ領域についても、同様に、第２分離部１３０は、オブジェクト領域と非オブジェクト領域との分離を行う。例えば、第５領域Ｌ１０５（図３（Ｂ））中の非オブジェクト領域（例えば、写真画像Ｏｂ３（図３（Ａ））の周囲の背景を表す領域）は、第５領域Ｌ１０５の周囲を囲むベタ領域Ｌ１００に組み込まれて、１つの領域Ｌ２００（図３（Ｃ））の一部として特定されている。第５領域Ｌ１０５中のオブジェクト領域は、第９領域Ｌ２０９（図３（Ｃ））として特定されている。同様に、第６領域Ｌ１０６（図３（Ｂ））中の非オブジェクト領域は、第１０領域Ｌ２１０（図３（Ｃ））として特定され、第３領域Ｌ１０３（図３（Ｂ））中の非オブジェクト領域は、第５領域Ｌ２０５（図３（Ｃ））として特定されている。ベタ領域については、第２分離部１３０は、１つのベタ領域を、１つの領域として、特定する。例えば、ベタ領域Ｌ１００（図３（Ｂ））は、第０領域Ｌ２００（図３（Ｃ））として特定されている。

以上の結果、図３（Ｃ）の例では、１３個の領域Ｌ２００〜Ｌ２１２が特定されている。特定された領域の総数（ラベルの総数Ｋ）は、１３個である。

図２のステップＳ１４５では、生成部１４０（図１）は、第２分離部１３０によって特定された複数の領域のうちの、後述する条件を満たす複数の領域を統合する。この統合は、互いに分離する複数の文字を統合するための処理である。図７は、統合処理のフローチャートである。ステップＳ２００では、生成部１４０は、第２分離部１３０によって特定された複数の領域（例えば、図３（Ｃ）の領域Ｌ２００〜Ｌ２１２）の中から、背景領域を選択する。背景領域は、対象画像ＴＩ（図３（Ａ））の縁部分に対応するベタ領域である。図３（Ｃ）の例では、第０領域Ｌ２００が、背景領域として選択される。この背景領域Ｌ２００は、統合の対象から外される。

ステップＳ２００で、背景領域を選択した後、ステップＳ２０５では、生成部１４０（図１）は、１つの未処理の領域を、処理対象領域Ｎとして選択する。次いで、ステップＳ２１０では、生成部１４０は、処理対象領域Ｎの画素数が、所定の画素数基準以下であるか否かを判定する。画素数基準は、予め決められている。例えば、画素数基準としては、処理対象領域Ｎが他の領域と統合すべき文字を表す場合に、処理対象領域Ｎの画素数が取り得る最大値を若干上回る値を、採用可能である。処理対象領域Ｎが１つの文字を表す場合の画素数が取り得る最大値を若干上回る値に、予め設定されている。処理対象領域Ｎの画素数が画素数基準を超える場合には（Ｓ２１０：Ｎｏ）、生成部１４０は、ステップＳ２０５に戻る（現行の処理対象領域Ｎは、統合の対象から外れる）。この場合には、現行の処理対象領域Ｎは、典型的な文字よりも大きいので、文字以外の種類のオブジェクトを表している（含む）可能性が高い。

なお、本実施例では、処理対象領域Ｎの画素数は、対象画像ＴＩにおける、処理対象領域Ｎに外接する最小矩形に含まれる画素数である。図８は、２つの領域の統合を示す概略図である。図中には、文字「Ｅ」を表す処理対象領域Ｌｎが示されている。図中の矩形ＬｎＲは、処理対象領域Ｌｎに外接する最小矩形である。この矩形ＬｎＲ内に含まれる画素数が、処理対象領域Ｌｎの画素数である。ここで、「領域に外接する最小矩形」は、以下のような矩形である。すなわち、矩形は、第一方向Ｄ１と平行な２本の辺と、第二方向Ｄ２と平行な２本の辺と、で構成されている。そして、矩形の上辺が、領域の上端と接し、矩形の下辺が、領域の下端と接し、矩形の左辺が、領域の左端と接し、矩形の右辺が、領域の右端と接している。ここで、上辺および上端は、第二方向Ｄ２の反対方向側の辺および端であり、下辺および下端は、第二方向Ｄ２側の辺および端であり、左辺および左端は、第一方向Ｄ１の反対方向側の辺および端であり、右辺および右端は、第一方向Ｄ１側の辺および端である。なお、生成部１４０は、処理対象領域Ｎの画素のみをカウントすることによって、処理対象領域Ｎの画素数を算出してもよい。すなわち、生成部１４０は、外接矩形内の複数の画素のうちの処理対象領域Ｎに含まれない画素をカウントせずに、画素数を算出してもよい。

図７のＳ２１０で、処理対象領域Ｎの画素数が、所定の画素数基準以下である場合（Ｓ２１０：Ｙｅｓ）、ステップＳ２１５では、生成部１４０（図１）は、統合の候補領域Ｍのリストを初期化する。生成部１４０は、ステップＳ２０５で処理対象領域Ｎとして選択されたことがない領域のリストを、生成する。例えば、図３（Ｃ）の例において、初めて実行されるステップＳ２１５で第１領域Ｌ２０１が処理対象領域Ｎとして選択された場合には、残りの１１個の領域Ｌ２０２〜Ｌ２１２が、リストに挙げられる。次回のステップＳ２１５で第２領域Ｌ２０２が処理対象領域Ｎとして選択された場合には、残りの１０個の領域Ｌ２０３〜Ｌ２１２が、リストに挙げられる。なお、他の領域に統合済の領域は、リストから除かれる。

次いで、ステップＳ２２０では、生成部１４０（図１）は、生成したリストの中から、１つの未処理の領域を、候補領域Ｍとして選択する。生成部１４０は、続く３つのステップＳ２２５、Ｓ２３０、Ｓ２３５で、候補領域Ｍを処理対象領域Ｎに統合するか否かを判定する。各ステップＳ２２５、Ｓ２３０、Ｓ２３５では、以下の条件が判定される。

（Ｓ２２５：第１条件Ｆ１）候補領域Ｍの画素数≦画素数基準
（Ｓ２３０：第２条件Ｆ２）第１距離Ｄｉｓ１≦距離基準、かつ、第２距離Ｄｉｓ２≦距離基準
（Ｓ２３５：第３条件Ｆ３）階調差ＴＤ≦階調差基準

候補領域Ｍが、これら全ての条件Ｆ１、Ｆ２、Ｆ３を満たす場合（Ｓ２２５：Ｙｅｓ、かつ、Ｓ２３０：Ｙｅｓ、かつ、Ｓ２３５：Ｙｅｓ）に、図７のステップＳ２４０で、生成部１４０（図１）は、候補領域Ｍを処理対象領域Ｎに統合する。

ステップＳ２２５の第１条件Ｆ１は、ステップＳ２１０の条件と同様の条件である。ステップＳ２１０とステップＳ２２５の条件は、「処理対象領域Ｎの大きさと候補領域Ｍの大きさとが、所定の大きさ基準以下である」という条件の例である。候補領域Ｍが第１条件Ｆ１を満たさない場合には（Ｓ２２５：Ｎｏ）、候補領域Ｍは、文字とは異なる種類のオブジェクトを表している（含む）可能性が高い。この場合には、生成部１４０は、候補領域Ｍを処理対象領域Ｎに統合しない（ステップＳ２４０をスキップする）。

ステップＳ２３０の第２条件Ｆ２は、「処理対象領域Ｎと候補領域Ｍとの間の距離が、所定の距離基準以下である」という条件の例である。第２条件Ｆ２は、候補領域Ｍが処理対象領域Ｎに近いことを示している。図８は、第２条件Ｆ２の第１距離Ｄｉｓ１と第２距離Ｄｉｓ２との概略を示している。図中には、処理対象領域Ｌｎと候補領域Ｌｍとが示されている。対象矩形ＬｎＲは、処理対象領域Ｌｎに外接する最小矩形であり、候補矩形ＬｍＲは、候補領域Ｌｍに外接する最小矩形である。

第１距離Ｄｉｓ１は、図８（Ａ）に示すように、対象矩形ＬｎＲと候補矩形ＬｍＲとの間の、第一方向Ｄ１に沿った最短距離（画素数）である。図８（Ｂ）に示すように、対象矩形ＬｎＲの第一方向Ｄ１の位置の範囲（左端ＰｎＬ〜右端ＰｎＲ）が、候補矩形ＬｍＲの第一方向Ｄ１の位置の範囲（左端ＰｍＬ〜右端ＰｍＲ）の少なくとも一部と重なる場合には、第１距離Ｄｉｓ１は、ゼロである。

第２距離Ｄｉｓ２は、図８（Ｂ）に示すように、対象矩形ＬｎＲと候補矩形ＬｍＲとの間の、第二方向Ｄ２に沿った最短距離（画素数）である。図８（Ａ）に示すように、対象矩形ＬｎＲの第二方向Ｄ２の位置の範囲（上端ＰｎＴ〜下端ＰｎＢ）が、候補矩形ＬｍＲの第二方向Ｄ２の位置の範囲（上端ＰｍＴ〜下端ＰｍＢ）の少なくとも一部と重なる場合には、第２距離Ｄｉｓ２は、ゼロである。

第２条件Ｆ２の距離基準は、予め決められている。例えば、距離基準としては、統合すべき２つの文字の間の距離がとり得る最大値を若干上回る値を、採用可能である。候補領域Ｍが第２条件Ｆ２を満たす場合には、候補領域Ｍと処理対象領域Ｎとが、同じ文字列に含まれる文字を表している可能性が高い。候補領域Ｍが第２条件Ｆ２を満たさない場合には（Ｓ２３０：Ｎｏ）、候補領域Ｍは、処理対象領域Ｎとは関連しないオブジェクトを表している（含む）可能性が高い。この場合には、生成部１４０は、候補領域Ｍを処理対象領域Ｎに統合しない（ステップＳ２４０をスキップする）。なお、処理対象領域Ｎと候補領域Ｍとの間の距離としては、上記の距離Ｄｉｓ１、Ｄｉｓ２に限らず、距離を表す種々の値を採用可能である。例えば、処理対象領域Ｎと候補領域Ｍとの間の最短距離（方向を制限しない最短距離）を採用可能である。

ステップＳ２３５の第３条件Ｆ３は、「処理対象領域Ｎと候補領域Ｍとの間の階調値の差が、所定の階調差基準以下である」という条件の例である。第３条件Ｆ３は、候補領域Ｍの色が処理対象領域Ｎの色に近いことを、示している。図９は、第３条件Ｆ３の階調差ＴＤの算出式を示している。本実施例では、階調差ＴＤは、ＲＧＢ色空間における、処理対象領域Ｎの平均色（Rav_n、Gav_n、Bav_n）と、候補領域Ｍの平均色（Rav_m、Gav_m、Bav_m）との間のユークリッド距離の二乗である。第３条件Ｆ３の階調差基準は、予め決められている。例えば、階調差基準としては、同じ色で表された文字列に含まれる複数の文字が、複数の領域に分離した場合に、それらの領域の間の階調差ＴＤが取り得る最大値を採用可能である。候補領域Ｍが第３条件Ｆ３を満たさない場合には（Ｓ２３５：Ｎｏ）、候補領域Ｍは、処理対象領域Ｎとは異なる別のオブジェクトを表している（含む）可能性が高い。この場合には、生成部１４０は、候補領域Ｍを処理対象領域Ｎに統合しない（ステップＳ２４０をスキップする）。なお、処理対象領域Ｎと候補領域Ｍとの間の階調値の差としては、上記の階調差ＴＤに限らず、階調値の差を表す種々の値を採用可能である。例えば、ＹＣｂＣｒ色空間におけるユークリッド距離を採用してもよい。

図７のステップＳ２４０で、候補領域Ｍを処理対象領域Ｎに統合した後、または、ステップＳ２２５、ステップＳ２３０、ステップＳ２３５のいずれかのステップでＮｏと判断した後、ステップＳ２４５では、生成部１４０（図１）は、リストの全ての候補領域Ｍの処理が終了したか否かを判定する。未処理の候補領域Ｍが残っている場合には（Ｓ２４５：Ｎｏ）、生成部１４０は、ステップＳ２２０に戻り、未処理の候補領域Ｍに対して、ステップＳ２２０〜Ｓ２４０の処理を実行する。リストの全ての候補領域Ｍの処理が終了した場合には（Ｓ２４５：Ｙｅｓ）、生成部１４０は、ステップＳ２５０に移行する。

ステップＳ２５０では、生成部１４０（図１）は、最後にステップＳ２１５が実行された後に、処理対象領域Ｎが拡張されたか否か、すなわち、処理対象領域Ｎに統合された候補領域Ｍの総数が１以上であるか否か、を判定する。処理対象領域Ｎが拡張された場合には（Ｓ２５０：Ｙｅｓ）、生成部１４０は、拡張済の処理対象領域Ｎを利用して、再び、ステップＳ２１５〜Ｓ２４５の処理を実行する。従って、生成部１４０は、３つ以上の領域を統合し得る。

図１０は、４つの領域Ｌ２０１〜Ｌ２０４の統合を示す概略図である。ここでは、統合処理が、図１０（Ａ）〜図１０（Ｄ）の順に、進行する。図中には、領域に外接する最小矩形も示されている。矩形の符号は、対応する領域の符号の末尾に「Ｒ」を付加したものである。例えば、矩形Ｌ２０１Ｒは、第１領域Ｌ２０１に対応付けられた矩形である。

図１０（Ａ）では、第１領域Ｌ２０１が、処理対象領域Ｎである（図７：Ｓ２０５）。第１領域Ｌ２０１の隣に配置された第２領域Ｌ２０２は、上記条件Ｆ１〜Ｆ３を満たすので、生成部１４０（図１）は、第２領域Ｌ２０２を第１領域Ｌ２０１に統合する（Ｓ２４０）。第３領域Ｌ２０３と第４領域Ｌ２０４とは、第１領域Ｌ２０１からの距離が遠いので（第２条件Ｆ２を満たさないので）、第１領域Ｌ２０１に統合されない。

上述したように、第２領域Ｌ２０２が第１領域Ｌ２０１に統合された場合、図７のステップＳ２５０では、生成部１４０（図１）は、処理対象領域Ｎ（第１領域Ｌ２０１）が拡張された、と判定する。続くステップＳ２１５では、生成部１４０は、第２領域Ｌ２０２を含む拡張済の第１領域Ｌ２０１ｂ（図１０（Ｂ））のためのリストを生成する。生成されるリストは、第３領域Ｌ２０３と第４領域Ｌ２０４とを含んでいる。

図１０（Ｂ）では、拡張済の第１領域Ｌ２０１ｂが、処理対象領域Ｎである。第１領域Ｌ２０１ｂの隣に配置された第３領域Ｌ２０３は、上記条件Ｆ１〜Ｆ３を満たすので、生成部１４０は、第３領域Ｌ２０３を、第１領域Ｌ２０１ｂに統合する（図７：Ｓ２４０）。条件Ｆ１〜Ｆ３の判定には、拡張済の第１領域Ｌ２０１ｂ（「Ｅ」の文字と「Ｆ」の文字）に外接する最小矩形Ｌ２０１ｂＲが利用される。第４領域Ｌ２０４は、第１領域Ｌ２０１ｂからの距離が遠いので、第１領域Ｌ２０１ｂに統合されない。

上述したように、第３領域Ｌ２０３が拡張済みの第１領域Ｌ２０１ｂに統合された場合、図７のステップＳ２５０では、生成部１４０（図１）は、処理対象領域Ｎ（第１領域Ｌ２０１ｂ）が拡張された、と判定する。続くステップＳ２１５では、生成部１４０は、第３領域Ｌ２０３を含む拡張済の第１領域Ｌ２０１ｃ（図１０（Ｃ））のためのリストを生成する。生成されるリストは、第４領域Ｌ２０４を含んでいる。

図１０（Ｃ）では、拡張済の第１領域Ｌ２０１ｃが、処理対象領域である。第１領域Ｌ２０１ｃの隣に配置された第４領域Ｌ２０４は、上記条件Ｆ１〜Ｆ３を満たすので、生成部１４０は、第４領域Ｌ２０４を、第１領域Ｌ２０１ｃに統合する（図７：Ｓ２４０）。これにより、第４領域Ｌ２０４を含む拡張済みの第１領域Ｌ２０１ｄ（図１０（Ｄ））が生成される。

このように、生成部１４０は、処理対象領域Ｎが拡張された場合には、拡張済の処理対象領域Ｎと他の領域との統合を試みることによって、３つ以上の領域の統合を実現する。

処理対象領域Ｎの拡張が完了したら（Ｓ２５０：Ｎｏ）、ステップＳ２５５で、生成部１４０は、全ての領域の処理が完了したか否かを判定する。未処理の領域が残っている場合には（Ｓ２５５：Ｎｏ）、生成部１４０は、ステップＳ２０５に戻る。全ての領域の処理が完了した場合には（Ｓ２５５：Ｙｅｓ）、生成部１４０は、ステップＳ２６０で、ラベル（領域の識別子）を更新し、統合処理を終了する。

図３（Ｄ）の第３ラベル画像ＬＩ３は、統合処理（図７）によって更新された領域（ラベル）を示している。図３（Ｃ）の４つの領域Ｌ２０１、Ｌ２０２、Ｌ２０３、Ｌ２０４（図３（Ａ）の第１文字画像Ｏｂ１の４つの文字）が統合されて、１つの領域Ｌ３０１が生成されている。また、図３（Ｃ）の３つの領域Ｌ２０６、Ｌ２０７、Ｌ２０８（図３（Ａ）の第２文字画像Ｏｂ２の３つの文字）が統合されて、１つの領域Ｌ３０３が生成されている。図３（Ｃ）中の６つの領域Ｌ２００、Ｌ２０５、Ｌ２０９、Ｌ２１０、Ｌ２１１、Ｌ２１２は、他の領域と統合されずに、６つの領域Ｌ３００、Ｌ３０２、Ｌ３０４、Ｌ３０５、Ｌ３０６、Ｌ３０７として、維持されている。以下、複数の領域が統合されて生成された領域を「統合領域」とも呼ぶ。

図２のステップＳ１４５で、統合処理が終了後、ステップＳ１５０では、判定部１５０（図１）は、生成部１４０による統合処理の結果得られる複数の領域毎に、画像種類（領域内のオブジェクトの種類）が「文字」であるか否かを判定する。図１１は、文字判定処理のフローチャートである。ステップＳ３００では、判定部１５０は、統合数が文字基準値以上であるか否かを判定する。統合数は、統合された領域の総数である。例えば、図３（Ｄ）の第１領域Ｌ３０１の統合数は「４」であり、第３領域Ｌ３０３の統合数は「３」である。文字基準値は、予め決められている。例えば、文字基準値としては、統合領域が典型的な文字列を表す場合の統合数が取り得る最小値を若干下回る値（例えば、２〜３）を採用可能である。判定部１５０は、統合数が文字基準値以上である統合領域の種類を「文字」と判定する（ステップＳ３００：Ｙｅｓ、ステップＳ３１０）。判定部１５０は、統合数が文字基準値未満である統合領域の種類を「非文字」と判定する（ステップＳ３００：Ｎｏ、ステップＳ３２０）。なお、判定部１５０は、統合処理（図７）で他の領域と統合されなかった領域の種類も「非文字」と判定する（ステップＳ３００：Ｎｏ、ステップＳ３２０）。

図３（Ｅ）の画像ＲＩは、判定結果を示している。２つの領域Ｌ３０１、Ｌ３０３の種類は「文字」と判定され、６つの領域Ｌ３００、Ｌ３０２、Ｌ３０４、Ｌ３０５、Ｌ３０６、Ｌ３０７の種類は「非文字」と判定されている。

図２のステップＳ１５０で、文字判定処理が終了後、ステップＳ１５５では、画像調整部１６０（図１）は、判定結果を利用する画像調整を実行する。例えば、画像調整部１６０は、対象画像ＴＩ中の「文字」の領域に、シャープネスを強調する処理を行い、対象画像ＴＩ中の「非文字」の領域に、予め設定された色調整処理を行う。このように、画像調整部１６０は、スキャンデータに対して、画像種類の判定結果を利用する画像調整を行うことによって、処理済の画像データを生成する。画像調整部１６０は、処理済の画像データを、不揮発性記憶装置２９０に格納する。ユーザは、格納された画像データを、画像の出力（例えば、印刷と表示）等に利用することができる。

なお、本実施例では、第１ブロックＢＬ毎に算出される平均エッジ強度（ＥＲａｖｅ、ＥＧａｖｅ、ＥＢａｖｅ）は、「エッジ強度の程度を表す特徴値」の例である。また、「ＥＲａｖｅ≧ＥＴｒ、および、ＥＧａｖｅ≧ＥＴｇ、および、ＥＢａｖｅ≧ＥＴｂのうちの少なくとも一つが成立する」ことは、「エッジ強度の程度を表す特徴値が所定の基準以上である」ことの例である。

以上のように、本実施例では、第１分離部１２０（図１）は、対象画像ＴＩ（図３（Ａ））を、第１領域Ｌ１０１と第２領域Ｌ１０２とを含む複数の領域に分離する（図３（Ｂ））。第２分離部１３０は、第１領域Ｌ１０１を複数の小領域Ｌ２０１、Ｌ２０２に分離し、第２領域Ｌ１０２を複数の小領域Ｌ２０３、Ｌ２０４に分離する。そして、生成部１４０は、複数の小領域Ｌ２０１〜Ｌ２０４を統合することによって、統合領域Ｌ３０１（図３（Ｄ））を生成する。この結果、一旦分離された領域が統合されることなく単独の領域として利用される場合と比べて、領域分離の精度を向上できる。

また、第２分離部１３０は、図６に示すように、第１閾値群Ｃｔｈｏ１を用いて第１領域Ｌ１０１の分離を行い、第１閾値群Ｃｔｈｏ１とは異なる第２閾値群Ｃｔｈｏ２を用いて第２領域Ｌ１０２の分離を行う。従って、１つの閾値を用いて対象画像の全体を複数の領域に分離する場合と比べて、領域分離の精度を向上できる。

ここで、第２分離部１３０は、第１閾値群Ｃｔｈｏ１を、第１領域Ｌ１０１の周囲の領域（第７領域Ｌ１０７）の階調値に基づいて決定し、第２閾値群Ｃｔｈｏ２を、第２領域Ｌ１０２の周囲の領域（第８領域Ｌ１０８）の階調値に基づいて決定する。このように、第２分離部１３０は、第１領域Ｌ１０１に適した第１閾値群Ｃｔｈｏ１と、第２領域Ｌ１０２に適した第２閾値群Ｃｔｈｏ２とを利用することができるので、領域分離の精度を向上できる。

また、第２分離部１３０は、図６に示すように、二値化後の階調値が同じである画素が連続する１つの領域を、分離された１つの領域として特定する（例えば、オブジェクト画素の階調値は「１」であり、非オブジェクト画素の階調値は「ゼロ」である）。従って、第２分離部１３０は、容易に領域分離を行うことができるので、領域分離の処理を簡素化できる。

また、第１分離部１２０は、図４（Ｂ）に示すように、複数の画素ＰＸを含む第１ブロックＢＬ毎に、第１領域Ｌ１０１と第２領域Ｌ１０２とを含む複数の領域の分離を行う。従って、第１分離部１２０が画素ＰＸ毎に領域の分離を行う場合と比べて、処理を簡素化できる。

また、第２分離部１３０は、図６に示すように、１つの画素ＰＸ毎に小領域の分離を行う。従って、２個以上の画素ＰＸを含むブロック毎に小領域の分離が行われる場合と比べて、第２分離部１３０は、細かい領域分離を実現できる。また、第２分離部１３０は、第１分離部１２０が第１ブロックＢＬ毎の粗い領域分離を行った後に、細かい領域分離を行うので、対象画像が複数種類の領域（オブジェクト）を表す場合に、領域分離の精度を向上できる。

また、図４に示すように、第１分離部１２０は、エッジ強度の程度を表す特徴値（平均エッジ強度（ＥＲａｖｅ、ＥＧａｖｅ、ＥＢａｖｅ））が所定の基準以上である領域であるエッジ領域（非ベタ領域）を抽出し、対象画像ＴＩを、エッジ領域を含む２つの領域Ｌ１０１、Ｌ１０２と、エッジ領域を含まない領域Ｌ１００と、を含む複数の領域に分離する。このように、エッジ強度を利用して領域分離を行うので、対象画像に含まれる色に依存せずに、領域分離の精度を向上できる。

特に、実施例では、第１分離部１２０が、エッジ強度を利用した粗い領域分離を行い、その後に、第２分離部１３０が、第１分離部１２０によって分離された領域毎に、背景色を利用した細かい領域分離を行っている。このように、第１分離部１２０は、階調値の大きさ（すなわち、色）を分離する閾値ではなくエッジ強度を利用して、対象画像を複数の領域に分離する。従って、対象画像が複数種類のオブジェクトを表す場合であっても、オブジェクト間の色（特に背景色）の差が領域分離に与える影響を緩和できる。そして、第１分離部１２０による領域分離の後には、第２分離部１３０は、分離された領域毎に、背景色を特定するための閾値を利用した細かい領域分離を行う。第１分離部１２０によって分離された１つの領域内では、背景の色は、特定の色に集中している可能性が高い。従って、第２分離部１３０は、閾値を利用することによって、適切な領域分離を実現できる。また、第２分離部１３０は、第１分離部１２０と比べて、細かい領域分離を行う。以上により、領域分離の精度を向上できる。

また、図７、図１０で説明したように、生成部１４０は、分離された複数の領域を統合することによって、統合領域を生成する。従って、１つの領域として分離されるべき領域（例えば、第１文字画像Ｏｂ１の領域）が、複数の領域に分離した場合に、生成部１４０は、それらの領域を統合することができるので、領域分離の精度を向上できる。ここで、２つの領域を統合するための統合条件は、上述の３つの条件Ｆ１〜Ｆ３を要する。従って、分離した領域を適切に統合することができる。

特に、図７、図１０で説明したように、生成部１４０は、２つの領域を統合することによって統合領域を生成し、生成した統合領域に別の領域を統合することによって、統合領域を更新する。従って、３つ以上の領域を含む統合領域の生成を、適切に行うことができる。

また、図１１で説明したように、判定部１５０は、統合領域に含まれる領域の総数が文字基準値以上であることを要する条件が満たされる場合に、領域の種類が文字であると判定する。従って、判定部１５０は、領域の種類が文字であるか否かを適切に判定できる。

Ｂ．変形例：
（１）エッジ強度の算出式としては、図５の算出式に限らず、階調値の変化の大きさを表す値を算出可能な他の任意の算出式を採用可能である。例えば、エッジ強度は、第一方向Ｄ１の変化の大きさの二乗と、第二方向Ｄ２の変化の大きさの二乗との合計値であってもよい。また、ソーベルオペレータの代わりに、プレウィットオペレータ（Prewitt operator）、または、ロバーツクロスオペレータ（Roberts Cross operator）など種々のエッジ検出用オペレータを利用可能である。また、エッジ強度は、赤緑青の各色成分に限らず、他の色成分（例えば、輝度）の階調値を用いて算出されてもよい。

（２）第１分離部１２０によって領域分離に利用される「エッジ強度の程度を表す特徴値」としては、エッジ強度の程度を表す任意の値を採用可能である。例えば、色成分毎の平均エッジ強度（ＥＲａｖｅ、ＥＧａｖｅ、ＥＢａｖｅ）のうちの最大値を、特徴値として採用してもよい。また、輝度値を利用して算出されたエッジ強度を、採用してもよい。

また、「エッジ強度の程度を表す特徴値が所定の基準以上である」ことの判定条件としては、「ＥＲａｖｅ≧ＥＴｒ、および、ＥＧａｖｅ≧ＥＴｇ、および、ＥＢａｖｅ≧ＥＴｂのうちの少なくとも一つが成立する」ことに限らず、種々の条件を採用可能である。例えば、特徴値が１つの値によって表される場合には、特徴値が特定の閾値以上であることを、採用可能である。

（３）図４（Ｂ）に示す第１ブロックＢＬの縦の長さ（第二方向Ｄ２の画素数）は、横の長さ（第一方向Ｄ１の画素数）と、異なっていてもよい。また、第１ブロックＢＬの形状としては、矩形に限らず、他の種々の形状を採用可能である。また、１つの第１ブロックＢＬに含まれる画素ＰＸの総数としては、種々の値（例えば、Ｕ個（Ｕは２以上の整数））を採用可能である。

また、第２分離部１３０は、２個以上の画素ＰＸを含む第２ブロック毎に、小領域の分離を行ってもよい。こうすれば、第２分離部１３０による処理を簡素化できる。この場合には、第２分離部１３０は、例えば、第２ブロックを代表する階調値（色成分毎の階調値）を利用して、領域分離を行うことができる。第２ブロックを代表する階調値としては、例えば、第２ブロック内の平均階調値、第２ブロック内の所定位置の画素の階調値等を採用可能である。

一般には、第２ブロックに含まれる画素ＰＸの総数Ｊは、１以上、かつ、第１ブロックＢＬに含まれる画素ＰＸの総数Ｕ未満、であることが好ましい。こうすれば、第１分離部１２０が、粗い領域分離を行った後に、第２分離部１３０が、細かい領域分離を行うので、対象画像ＴＩが複数種類の領域（オブジェクト）を表す場合に、領域分離の精度を向上できる。

（４）図２のステップＳ１２５で決定される背景色範囲において、色成分毎の幅が互いに異なっていてもよい。また、背景色範囲は、ＲＧＢ色空間において、代表色からの距離（ユークリッド距離）が所定値以下の範囲であってもよい。一般には、背景色範囲としては、代表色を含む種々の範囲を採用可能である。

また、代表色（より一般的には、閾値）は、処理対象領域Ｈの周囲の領域（処理対象領域Ｈの周囲を囲むベタ領域）内の、処理対象領域Ｈに近い一部の領域の階調値を利用して、算出されてもよい。例えば、図６の第１領域Ｌ１０１のための第１代表色ＣＬｏ１は、ベタ領域Ｌ１０７内の、第１領域Ｌ１０１からの距離が所定値以下の領域Ｌ１０７ｃから、算出されてもよい。この代わりに、代表色（閾値）は、処理対象領域Ｈの縁部分の階調値を利用して、算出されてもよい。例えば、図６の第１領域Ｌ１０１のための第１代表色ＣＬｏ１は、第１領域Ｌ１０１内の、第１領域Ｌ１０１の輪郭からの最短距離が所定値以下の領域Ｌ１０１ｉから、算出されてもよい。また、代表色（閾値）は、処理対象領域Ｈの周囲の領域の階調値と、処理対象領域Ｈの縁部分の階調値と、の両方を利用して、算出されてもよい。いずれの場合も、代表色のＲＧＢ毎の階調値としては、平均値に限らず、種々の値（例えば、ＲＧＢ毎の最頻値、ＲＧＢ毎の中央値等）を採用可能である。

（５）第２分離部１３０（図１）によって行われる領域分離の方法としては、階調値の二値化を利用する方法に限らず、種々の方法を採用可能である。例えば、第２分離部１３０は、第１分離部１２０と同様に、エッジ強度を利用して領域分離を行ってもよい。

（６）図７の処理において、生成部１４０（図１）は、統合の候補領域Ｍとして、処理対象領域Ｎと同じ領域から分離した領域のみを、採用してもよい。

また、候補領域Ｍを処理対象領域Ｎに統合するための条件は、上記の条件Ｆ１、Ｆ２、Ｆ３のうちの予め選択された１つの条件であってもよく、上記の条件Ｆ１、Ｆ２、Ｆ３のうちの予め選択された２つの条件であってもよい。また、上記条件Ｆ１、Ｆ２、Ｆ３とは異なる条件を採用してもよい。

また、３個以上の領域を統合する方法としては、図１０で説明したように１つずつ統合する方法に限らず、種々の方法を採用可能である。例えば、まず、統合の条件を満たす複数のペア領域（２つの領域が統合された領域）を生成し、次に、複数のペア領域のうちの共通の領域を含む複数のペア領域を統合する、方法を採用可能である。

（７）文字判定の条件は、「統合数が文字基準値以上であること」に加えて、他の条件を要してもよい。例えば、文字判定の条件は、判定対象領域で利用されている色の数が所定値以下であることを要しても良い。

（８）文字判定の結果を利用する画像処理（図２のＳ１５５）としては、シャープネス強調処理や色調整処理に限らず、種々の処理を採用可能である。例えば、文字の領域を比較的高い圧縮率で圧縮し、他の領域を比較的低い圧縮率で圧縮することによって、いわゆる高圧縮ＰＤＦ（Portable Document Format）データを生成する処理を採用可能である。

また、領域分離の結果を利用する画像処理としては、文字判定（図２のＳ１５０）に限らず、種々の処理を採用可能である。例えば、画像調整部１６０（図１）は、ユーザによって選択されたオブジェクトを表すように画像を自動的にトリミングする処理を実行してもよい。このように、図１の判定部１５０と、図２のステップＳ１５０（図３（Ｅ）の画像ＲＩ）、Ｓ１５５とは、省略可能である。さらに、画像調整部１６０を省略してもよい。この場合には、生成部１４０は、特定された領域を表す画像データ（例えば、図３（Ｄ）の第３ラベル画像ＬＩ３を表す画像データ）を、不揮発性記憶装置２９０に格納すればよい。格納された画像データは、種々の画像処理に利用可能である。

（９）第１分離部１２０（図１）が、対象領域を、第１領域と、第１領域とは異なる第２領域と、を含む複数の領域に分離すること（第１分離と呼ぶ）を実現できない場合があってもよい。例えば、上記実施例では、対象画像が、１つ写真画像のみを表す場合には、第１分離部１２０は、背景以外の領域として、その写真画像を表す１つの領域のみを分離する可能性がある。このように第１分離を実現できない場合があったとしても、対象画像が特定の条件である第１特定条件を満たす場合に（例えば、対象画像が、互いに離れた複数のオブジェクトを表す場合に）、第１分離部１２０が第１分離を実現できるのであれば、この第１分離部１２０は、第１分離を行う第１分離部の例である。換言すれば、この第１分離部１２０は、第１分離を行うように構成された第１分離部の例である。

また、第２分離部１３０（図１）が、第１領域を複数の小領域に分離し、第２領域を複数の小領域に分離すること（第２分離と呼ぶ）を実現できない場合があってもよい。例えば、上記実施例では、対象画像が、１つの写真画像のみを表す場合には、第２分離部１３０は、写真を表す１つの領域（第１分離部１２０によって分離された領域）を、複数の小領域に分離できない可能性がある。このように第２分離を実現できない場合があったとしても、対象画像が特定の条件である第２特定条件を満たす場合に（例えば、第１領域が複数の文字で構成された文字列を表し、かつ、第２領域が複数の文字で構成された文字列を表す場合に）、第２分離部１３０が第２分離を実現できるのであれば、この第２分離部１３０は、第２分離を行う第２分離部の例である。換言すれば、この第２分離部１３０は、第２分離を行うように構成された第２分離部の例である。

また、第１領域のための第１閾値が、第２領域のための第２閾値と同じである場合があってもよい。すなわち、第２分離部１３０が、第１閾値を用いて第１領域の分離を行い、第１閾値とは異なる第２閾値を用いて第２領域の分離を行うこと（異閾値分離と呼ぶ）を実現できない場合があってもよい。例えば、上記実施例では、図３（Ａ）において、第６オブジェクトＯｂ６の色が、第７オブジェクトＯｂ７の色と同じである場合には、図３（Ｂ）において、第１領域Ｌ１０１の周囲を囲む第７領域Ｌ１０７の色が、第２領域Ｌ１０２の周囲を囲む第８領域Ｌ１０８の色と、同じである。この場合、第１領域Ｌ１０１のための第１閾値群Ｃｔｈｏ１（図６）が、第２領域Ｌ１０２のための第２閾値群Ｃｔｈｏ２と、同じとなり得る。このように異閾値分離を実現できない場合があったとしても、対象画像が特定の条件である第３特定条件を満たす場合に（例えば、第２領域の周囲を囲む領域の色が、第１領域の周囲を囲む領域の色と異なる場合に）、第２分離部１３０が異閾値分離を実現できるのであれば、この第２分離部１３０は、異閾値分離を行う第２分離部の例である。換言すれば、この第２分離部１３０は、異閾値分離を行うように構成された第２分離部の例である。

また、生成部１４０（図１）が、３つ以上の小領域を統合することによって統合領域を生成すること（三統合生成と呼ぶ）を実現できない場合があってもよい。例えば、上記実施例では、対象画像が、２つの文字で構成された１つの文字列のみを表す場合には、生成部１４０は、３個以上の小領域を統合することができない可能性がある。このように、三統合生成を実現できない場合があったとしても、対象画像が特定の条件である第４特定条件を満たす場合に（例えば、対象画像が、３個以上の文字を含む文字列を表す場合に）、生成部１４０が三統合生成を実現できるのであれば、この生成部１４０は、三統合生成を行う生成部の例である。換言すれば、この生成部１４０は、三統合生成を行うように構成された生成部の例である。また、生成部１４０が、複数の小領域の中の少なくとも２つの小領域を統合することによって統合領域を生成すること（統合領域生成と呼ぶ）を実現できない場合があってもよい。例えば、上記実施例では、対象画像が、１つ写真画像のみを表す場合には、第１分離部１２０と第２分離部１３０との処理の結果、背景以外の領域として、その写真画像を表す１つの領域のみが分離される可能性がある。この場合、生成部１４０は、統合領域を生成できない。このように、統合領域生成を実現できない場合があったとしても、対象画像が特定の条件である第５特定条件を満たす場合に（例えば、対象画像が、２個以上の文字を含む文字列を表す場合に）、生成部１４０が、統合領域生成を実現できるのであれば、この生成部１４０は、統合領域生成を行う生成部の例である。換言すれば、この生成部１４０は、統合領域生成を行うように構成された生成部の例である。

（１０）計算機２００のスキャナドライバ１００による画像処理機能は、光学的に対象物を読み取ることによって対象物を表す画像データを生成する画像読取部を含む画像処理装置によって実現されてもよい（例えば、複合機４００やスキャナ３００や図示しないデジタルカメラ）。この場合には、画像処理装置は、自身の画像読取部によって生成された画像データを用いて、画像処理（例えば、図２の処理）を行えばよい。

一般的には、画像処理（例えば、図２の処理）を実現する画像処理装置は、計算機２００に限らず、種々の装置であってよい。例えば、プリンタ、デジタルカメラ、スキャナなどの画像関連機器の内部のコンピュータ、汎用のパーソナルコンピュータ、ネットワークに接続されたサーバ等を採用可能である。また、ネットワークを介して互いに通信可能な複数のコンピュータが、画像処理に要する機能を一部ずつ分担して、全体として、画像処理の機能を提供してもよい（このようなコンピュータシステムを利用する技術は、クラウドコンピューティングとも呼ばれる）。この場合、コンピュータシステムの全体が、特許請求の範囲における画像処理装置に対応する。いずれの場合も、対象画像データを取得する画像データ取得部１１０を、画像処理装置に設けることができる。対象画像データを取得する方法としては、任意の方法を採用可能である。例えば、画像データ取得部１１０は、画像処理装置内の他の要素（例えば、不揮発性記憶装置２９０や画像読取部）から対象画像データを取得してもよく、通信路を介して他の装置（例えば、ＵＳＢメモリやスマートフォン）から、対象画像データを取得してもよい。

（１１）上記各実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部あるいは全部をハードウェアに置き換えるようにしてもよい。例えば、図１の処理部１１０〜１６０から任意に選択された一部または全部の処理部の機能を、論理回路を有する専用のハードウェア回路によって実現してもよい。

また、本発明の機能の一部または全部がソフトウェアで実現される場合には、そのソフトウェア（コンピュータプログラム）は、コンピュータ読み取り可能な記録媒体（例えば、一時的ではない記録媒体）に格納された形で提供することができる。また、ソフトウェア（コンピュータプログラム）は、提供時と同一または異なる記録媒体（コンピュータ読み取り可能な記録媒体）に格納された状態で、使用され得る。「コンピュータ読み取り可能な記録媒体」は、メモリーカードやＣＤ−ＲＯＭのような携帯型の記録媒体に限らず、各種ＲＯＭ等のコンピュータ内の内部記憶装置や、ハードディスクドライブ等のコンピュータに接続されている外部記憶装置も含んでいる。

以上、実施例、変形例に基づき本発明について説明してきたが、上記した発明の実施の形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれる。

２００...計算機、２１０...ＣＰＵ、２４０...揮発性記憶装置、２４１...バッファ領域、２７０...操作部、２８０...通信部、２９０...不揮発性記憶装置、２９１...ドライバプログラム、３００...スキャナ、４００...複合機、１００...スキャナドライバ、１１０...画像データ取得部、１２０...第１分離部、１３０...第２分離部、１４０...生成部、１５０...判定部、１６０...画像調整部

Claims

対象画像データによって表される対象画像を、前記対象画像を解析することによって、第１領域と、前記第１領域とは異なる第２領域と、を含む複数の領域に分離する第１分離部と、
前記第１領域を複数の小領域に分離し、前記第２領域を複数の小領域に分離する、第２分離部と、
前記複数の小領域の中の少なくとも２つの前記小領域を統合することによって統合領域を生成する生成部と、
を備え、
前記第２分離部は、第１閾値を用いて前記第１領域の前記分離を行い、前記第１閾値とは異なる第２閾値を用いて前記第２領域の前記分離を行い、
前記生成部は、前記第１領域の小領域と前記第２領域の小領域とを統合することによって前記統合領域を生成する、
画像処理装置。
対象画像データによって表される対象画像を、第１領域と、前記第１領域とは異なる第２領域と、を含む複数の領域に分離する第１分離部と、
前記第１領域を複数の小領域に分離し、前記第２領域を複数の小領域に分離する、第２分離部と、
前記複数の小領域の中の少なくとも２つの前記小領域を統合することによって統合領域を生成する生成部と、
を備え、
前記第１分離部は、
前記対象画像から、エッジ強度の程度を表す特徴値が所定の基準以上である領域であるエッジ領域を抽出し、
前記対象画像を、前記エッジ領域を含む前記第１領域と、前記エッジ領域を含む前記第２領域と、前記エッジ領域を含まない第３領域と、を含む複数の領域に分離する、
画像処理装置。
対象画像データによって表される対象画像を、第１領域と、前記第１領域とは異なる第２領域と、を含む複数の領域に分離する第１分離部と、
前記第１領域を複数の小領域に分離し、前記第２領域を複数の小領域に分離する、第２分離部と、
前記複数の小領域の中の少なくとも２つの前記小領域を統合することによって統合領域を生成する生成部と、
を備え、
前記第２分離部は、
第１閾値を用いて前記第１領域の前記分離を行い、前記第１閾値とは異なる第２閾値を用いて前記第２領域の前記分離を行い、
前記第１閾値を用いて前記第１領域に含まれる画素の階調値を二値化し、前記二値化後の階調値が同じである画素が連続する１つの領域を、１つの前記小領域として分離し、
前記第２閾値を用いて前記第２領域に含まれる画素の階調値を二値化し、前記二値化後の階調値が同じである画素が連続する１つの領域を、１つの前記小領域として分離する、
画像処理装置。
対象画像データによって表される対象画像を、第１領域と、前記第１領域とは異なる第２領域と、を含む複数の領域に分離する第１分離部と、
前記第１領域を複数の小領域に分離し、前記第２領域を複数の小領域に分離する、第２分離部と、
前記複数の小領域の中の少なくとも２つの前記小領域を統合することによって統合領域を生成する生成部と、
を備え、
前記第２分離部は、
第１閾値を用いて前記第１領域の前記分離を行い、前記第１閾値とは異なる第２閾値を用いて前記第２領域の前記分離を行い、
前記第１領域の周囲の領域の階調値と、前記第１領域の縁部分の階調値と、の少なくとも一方に基づく前記第１閾値を用いて、前記第１領域の前記分離を行い、
前記第２領域の周囲の領域の階調値と、前記第２領域の縁部分の階調値と、の少なくとも一方に基づく前記第２閾値を用いて、前記第２領域の前記分離を行う、
画像処理装置。
請求項１から４のいずれかに記載の画像処理装置であって、
前記第１分離部は、Ｕ個（Ｕは２以上の整数）の画素を含む第１ブロック毎に、前記第１領域と前記第２領域とを含む前記複数の領域の分離を行う、画像処理装置。
請求項５に記載の画像処理装置であって、
前記第２分離部は、Ｊ個（Ｊは１以上Ｕ未満の整数）の画素を含む第２ブロック毎に、前記複数の小領域の分離を行う、画像処理装置。
請求項６に記載の画像処理装置であって、
前記第２ブロックに含まれる前記画素の数であるＪ個は、１個である、画像処理装置。
請求項１から７のいずれかに記載の画像処理装置であって、
前記生成部は、第１小領域と第２小領域とが所定の統合条件を満たす場合に、前記第１小領域と前記第２小領域とを統合し、
前記所定の統合条件は、
１）前記第１小領域の大きさと前記第２小領域の大きさとが、所定の大きさ基準以下である、
２）前記第１小領域と前記第２小領域との間の距離が、所定の距離基準以下である、
３）前記第１小領域と前記第２小領域との間の階調値の差が、所定の階調差基準以下である、
の少なくとも１つを要する、画像処理装置。
請求項１から８のいずれかに記載の画像処理装置であって、
前記生成部は、３つ以上の前記小領域を統合することによって前記統合領域を生成する、画像処理装置。
請求項９に記載の画像処理装置であって、
前記生成部は、２つの小領域を統合することによって前記統合領域を生成し、前記生成した統合領域に前記２つの小領域とは異なる小領域を統合することによって、前記統合領域を更新する、
画像処理装置。
請求項１から１０のいずれかに記載の画像処理装置であって、さらに、
前記統合領域が、文字を表す文字領域であるか否かを、判定する判定部を含み、
前記判定部は、前記統合領域に含まれる前記小領域の総数が所定の領域数以上であることを要する条件が満たされる場合に、前記統合領域が前記文字領域であると判定する、
画像処理装置。
画像処理をコンピュータに実行させるためのプログラムであって、
対象画像データによって表される対象画像を、前記対象画像を解析することによって、第１領域と、前記第１領域とは異なる第２領域と、を含む複数の領域に分離する第１分離機能と、
前記第１領域を複数の小領域に分離し、前記第２領域を複数の小領域に分離する、第２分離機能と、
前記複数の小領域の中の少なくとも２つの前記小領域を統合することによって統合領域を生成する生成機能と、
をコンピュータに実行させ、
前記第２分離機能は、第１閾値を用いて前記第１領域の前記分離を行い、前記第１閾値とは異なる第２閾値を用いて前記第２領域の前記分離を行い、
前記生成機能は、前記第１領域の小領域と前記第２領域の小領域とを統合することによって前記統合領域を生成する、
プログラム。
画像処理をコンピュータに実行させるためのプログラムであって、
対象画像データによって表される対象画像を、第１領域と、前記第１領域とは異なる第２領域と、を含む複数の領域に分離する第１分離機能と、
前記第１領域を複数の小領域に分離し、前記第２領域を複数の小領域に分離する、第２分離機能と、
前記複数の小領域の中の少なくとも２つの前記小領域を統合することによって統合領域を生成する生成機能と、
をコンピュータに実行させ、
前記第１分離機能は、
前記対象画像から、エッジ強度の程度を表す特徴値が所定の基準以上である領域であるエッジ領域を抽出し、
前記対象画像を、前記エッジ領域を含む前記第１領域と、前記エッジ領域を含む前記第２領域と、前記エッジ領域を含まない第３領域と、を含む複数の領域に分離する、
プログラム。
画像処理をコンピュータに実行させるためのプログラムであって、
対象画像データによって表される対象画像を、第１領域と、前記第１領域とは異なる第２領域と、を含む複数の領域に分離する第１分離機能と、
前記第１領域を複数の小領域に分離し、前記第２領域を複数の小領域に分離する、第２分離機能と、
前記複数の小領域の中の少なくとも２つの前記小領域を統合することによって統合領域を生成する生成機能と、
をコンピュータに実行させ、
前記第２分離機能は、
第１閾値を用いて前記第１領域の前記分離を行い、前記第１閾値とは異なる第２閾値を用いて前記第２領域の前記分離を行い、
前記第１閾値を用いて前記第１領域に含まれる画素の階調値を二値化し、前記二値化後の階調値が同じである画素が連続する１つの領域を、１つの前記小領域として分離し、
前記第２閾値を用いて前記第２領域に含まれる画素の階調値を二値化し、前記二値化後の階調値が同じである画素が連続する１つの領域を、１つの前記小領域として分離する、
プログラム。
画像処理をコンピュータに実行させるためのプログラムであって、
対象画像データによって表される対象画像を、第１領域と、前記第１領域とは異なる第２領域と、を含む複数の領域に分離する第１分離機能と、
前記第１領域を複数の小領域に分離し、前記第２領域を複数の小領域に分離する、第２分離機能と、
前記複数の小領域の中の少なくとも２つの前記小領域を統合することによって統合領域を生成する生成機能と、
をコンピュータに実行させ、
前記第２分離機能は、
第１閾値を用いて前記第１領域の前記分離を行い、前記第１閾値とは異なる第２閾値を用いて前記第２領域の前記分離を行い、
前記第１領域の周囲の領域の階調値と、前記第１領域の縁部分の階調値と、の少なくとも一方に基づく前記第１閾値を用いて、前記第１領域の前記分離を行い、
前記第２領域の周囲の領域の階調値と、前記第２領域の縁部分の階調値と、の少なくとも一方に基づく前記第２閾値を用いて、前記第２領域の前記分離を行う、
プログラム。