JP2005505870A - 画像の異なる領域を識別をするための方法及び装置 - Google Patents
画像の異なる領域を識別をするための方法及び装置 Download PDFInfo
- Publication number
- JP2005505870A JP2005505870A JP2003536989A JP2003536989A JP2005505870A JP 2005505870 A JP2005505870 A JP 2005505870A JP 2003536989 A JP2003536989 A JP 2003536989A JP 2003536989 A JP2003536989 A JP 2003536989A JP 2005505870 A JP2005505870 A JP 2005505870A
- Authority
- JP
- Japan
- Prior art keywords
- natural
- image
- block
- gradient
- artificial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 239000011159 matrix material Substances 0.000 claims abstract description 23
- 239000003623 enhancer Substances 0.000 claims description 10
- 230000000877 morphologic effect Effects 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012109 statistical procedure Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40062—Discrimination between different image types, e.g. two-tone, continuous tone
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本発明は、ピクセルの行及び列の行列から成る画像の人工領域と自然領域とを識別する方法及び関連する装置を提供する。前記方法は、前記画像の前記ピクセルの輝度値の行列をブロックマップを表わすブロックに分割するステップと、前記ブロック中の前記輝度値の輝度勾配の勾配行列(G)の分析により該ブロックが自然画像タイプのものであるか又は人工画像タイプのものであるかを識別するステップと、同じ画像タイプのブロックを前記画像の各々の自然領域及び人工領域にクラスタ化するステップとを有する。前記ブロックが前記自然画像タイプのものであるか又は前記人工画像タイプのものであるかを識別するステップは、前記ブロックの行及び列方向における前記ピクセルの前記輝度値Lの一次差分値に基づいて各ブロック内の前記勾配行列(G)を計算するステップを有する。
Description
【技術分野】
【0001】
本発明は、ピクセルの行及び列の行列から成る画像の人工領域と自然領域とを識別する方法であって、前記画像の前記ピクセルの輝度値の行列をブロックマップを表わすブロックに分割するステップと、前記ブロック中の前記輝度値の輝度勾配の勾配行列Gの分析により該ブロックが自然画像タイプのものであるか又は人工画像タイプのものであるかを識別するステップと、同じ画像タイプのブロックを前記画像の各々の自然領域及び人工領域にクラスタ化するステップとを有する方法及び関連する装置に関する。本発明は、更に、表示画面及びイメージエンハンサ(image enhancer)を有する表示装置に関する。
【背景技術】
【0002】
特徴抽出及びコンテンツ駆動処理(content driven processing)、圧縮並びに検索動作などの信号処理アプリケーションの多くの態様が、表示を写真又はビデオ画像などの自然画像を表示しそうだとみなされる領域と、コンピュータ生成テキスト及び/又はグラフィック領域などの所謂人工画像を表示しそうな領域とに正確にセグメント化する能力に大きく依存する。
【0003】
自然なもの又は人工的なもののいずれかとして分類される表示の領域を表わすデータを識別することにより、次いで、更にとりわけ適切且つ正確な信号処理アプリケーションを供給するために、自然コンテンツ専用のアルゴリズム又は人工コンテンツ専用のアルゴリズムが用いられ得る。このようなセグメント化なしでは、全表示に対する一様のアルゴリズムの適用が行なわれ、不利な点が生じ得る。例えば、同じ画像強調アルゴリズム(image-enhancement algorithm)が画像の自然領域と人工領域との両方に適用されることは、自然画像領域の知覚品質の著しい向上をもたらすのには役立つであろうが、不利なことに、表示の人工部分においてアーチファクトをもたらすであろう。
【0004】
斯くして、最初に、表示の自然領域と表示の人工領域とを識別し、分離しようと努めずに、全表示を向上させようとするのは不適切だと分かり得る。このような異なる領域が識別されたら、次いで、各々、適切な処理アルゴリズムが適用され得る。
【0005】
当然、このように画像データを処理することで他の利点が生じる。例えば、ビデオ画像と純粋なテキスト/グラフィックコンテンツとに対して別個の符号化方式を採用するようにファックス装置を構成するなどの符号化アプリケーションにおける帯域幅利用の自動最適化が達成され得る。
【0006】
米国特許公報第US-A-6195459号は、画像の自然領域と人工領域とを識別するよう構成されるアルゴリズムであり、その後の、人工カテゴリ又は自然カテゴリのいずれかに入りそうだと分かったブロックのクラスタ化(clustering)を備える表示のブロック分析を供給するアルゴリズムを開示している。このようなクラスタ化されたブロックによって形成される概ね長方形の領域は、次いで精密化(refine)され、他の分析ステップに応答して人工領域又は自然領域として受け入れられるか、又は放棄される。
【0007】
しかしながら、このような既知の構成は、不利なことには、正確に識別され得るグラフィックパターンの範囲が限られており、その一般的な正確さ及び効率並びにその雑音に対する敏感さに関しても限られている。
【0008】
また、この既知のアルゴリズムは、不必要に複雑だと考えられる方法であり、幾つかの状況においてはアルゴリズムの正確な動作を不都合なほどに制限し得るかなり高い計算負荷を呈する方法に基づいて動作するよう構成される。
【発明の開示】
【課題を解決するための手段】
【0009】
本発明は、既知のこのような方法及び装置を上回る利点を供給する上記のタイプの方法及び装置を提供せんとするものである。本発明は独立項によって規定される。従属項は有利な実施例を規定する。
【0010】
本発明の或る特徴によれば、ブロックが自然画像タイプのものであるか又は人工画像タイプのものであるかを識別するステップが、該ブロックの行及び列方向におけるピクセルの輝度値Lの一次差分値に基づいて各ブロック内の勾配行列を計算するステップを有することを特徴とする上記のタイプの方法が提供される。
【0011】
本発明は、分類がもっぱら輝度勾配の推定に基づき得る点で有利である。絶対一次差分値を用いることはまた、単純な一次差分の採用があり得るより多種多様なグラフィカルパターンについて非自然画像を表示するブロックを正確に識別するのを手助けすることから有利だと分かる。
【0012】
請求項2の特徴は、各ブロックの人工ブロック又は自然ブロックのいずれかとしての分類を単純にする点で有利である。
【0013】
請求項3乃至6の特徴は、さもなければ付加的な雑音が分類プロシージャに及ぼし得る影響を制限する点でとりわけ有利だと分かる。
【0014】
請求項7の特徴は、ブロックをきれいにする一方で、共通タイプのものらしいと決定されるブロックのクラスタ化もする効果的且つ単純な構成を提供する。
【0015】
請求項8乃至13の特徴は、例えば、様々な接続された構成要素の領域の識別又は生成が不必要であることから計算負荷を制限する点で有利である。
【0016】
また、人工的なもの又は自然なもののいずれかとしての領域の受入れ又は排除は、長方形内の自然ブロックの割合だけでなく、境界の規則正しさに基づき得る。
【0017】
請求項14の特徴は、ピクセルレベルの例えば長方形のエッジ(edge)検出を可能にする最終的な精密化ステップを導入する点で有利である。
【0018】
一般に、本発明の方法における各ステップの計算負荷は、従来技術の比較可能なステップの計算負荷より低い。
【0019】
本発明の別の特徴によれば、表示画像の自然領域と人工領域とを識別する装置であり、表示の異なる各々のピクセルのブロックを表わすグループに画像データを分割する識別手段と、前記ブロックが自然画像タイプのものであるか又は人工画像タイプのものであるかを識別するよう構成される輝度勾配推定手段(luminance gradient estimation means)と、同じタイプのブロックをクラスタ化するために前記データを更にグループ化するクラスタ化手段と、クラスタ化されたブロックによって形成された領域を、該領域を自然画像又は人工画像のいずれかを表わすものとして確認するために、分析する分析手段とを含む装置であって、前記輝度勾配推定手段が、前記ブロックの水平方向及び垂直方向における一次差分値によって前記勾配を推定するよう構成されることを特徴とする装置が提供される。
【0020】
本発明はまた、上記の方法ステップのいずれか1つ以上に基づいて動作するよう構成される上記のような装置も提供する。
【0021】
以下に添付図面を参照して本発明のこれら及び他の特徴を説明し、明らかにする。
【発明を実施するための最良の形態】
【0022】
まず図1を参照すると、本発明を実施するモニタ10の単純化された概略的なブロック図が図示されている。モニタ10は、機能ブロックの形態(functional block form)で図示されている人工/自然画像コンテンツ検出器12を含む。しかしながら、検出器12は、一般的に、制御アルゴリズムの形態で供給される。モニタは、表示画面16及びイメージエンハンサ29を更に含む。フレームバッファ14はビデオ信号VSを受け取り、ビデオ信号VSはデジタルフォーマットで輝度データを含む。これらのデータは、ピクセル素子の行及び列の行列から成る入力画像の輝度値Lを表わす。
【0023】
動画の場合には、ビデオ信号VSは一連の画像を含み、各画像は輝度値Lの行列によって表わされる。ビデオ信号VSが、各ピクセルの色成分についての情報、例えば、赤、緑及び青の色成分の値を含む場合には、輝度値は、既知の方法で色成分の値から導き出され得る。説明を簡略化するために、ビデオ信号は輝度値Lを含み、これらの値Lはフレームバッファ14に記憶されると仮定してこの実施例を説明する。
【0024】
人工/自然画像コンテンツ検出器12はフレームバッファ14に接続される。人工/自然画像コンテンツ検出器12によって供給される関数アルゴリズム(functional algorithm)は、有利なことに、画像分類アルゴリズムを有し、ビデオ信号VSの形態で受け取られる画像の自然領域の認識を供給するよう構成される。1つ又は複数の前記画像は、例えば、デジタル化された写真又はビデオクリップであり得る。
【0025】
輝度データは、フレームバッファ14から取り出され、ブロック選択ユニット20においてアルゴリズムに基づいて小さな正方形のブロックに分割される。ブロックのコンテンツは、輝度勾配推定ユニット22において自然なもの又は人工的なもののいずれかとして分類される。勾配推定ユニットの出力は、モルフォロジカルフィルタ(morphological filter)24に供給され、モルフォロジカルフィルタ24は、隣接ブロックを概ね長方形のおそらくは人工的な又は自然な領域(generally rectangular likely synthetic or natural regions)にクラスタ化する。クラスタ化されたブロックは、次いで、シード領域育成器(seed region gorwer)26において更に処理され、シード領域育成器26は、例えば長方形のおそらくは自然画像の領域(likely rectangular natural image region)の大きさを最大化せんとして、行方向と列方向との両方において、段階的な方法でシード領域を育成する。
【0026】
最大限の長方形のおそらくは自然画像の領域(likely maximum rectangular natural image region)に到達したら、エッジ位置精密化装置(edge position refiner)28が、自然画像領域の境界をピクセルレベルで正確に識別する。
【0027】
画像において1つ以上のこのような自然画像領域が識別されたら、この情報は、この画像の輝度データのどの部分がどの画像処理及び/又は強調アルゴリズムにかけられるべきかを決定するために用いられ得る。それ故、イメージエンハンサ29は、フレームバッファ14からの輝度データと、自然領域及び人工領域の場所についての情報とを受け取る。これらの入力に基づいて、エンハンサ29は、各タイプの領域に対して適切な処理を実行する。イメージエンハンサ29の出力信号は、表示画面を駆動するのに用いられる。
【0028】
機能の点からみると、コンテンツ検出器は、自然領域内にある確率が高い画像の場所を探索する。このあとには領域育成プロシージャが続き、領域育成プロシージャは、停止条件が確認されるまで最初に推定された自然領域を拡大する。
【0029】
画像検出器12によって実行されるような制御アルゴリズムについて以下に更に詳細に記載する。
【0030】
まず、入力画像は、効果的に、そのコンテンツが統計的プロシージャに基づいて自然なもの又は人工的なもののいずれかとして分類される小さな正方形のブロックに分割される。ブロックの側部の長さの下限及び上限は、評価測定の信頼性により課される制約によって規定される。例えば、ブロックが小さすぎる場合には、考慮に入れられるピクセルが少なすぎて、この測定は局所特性を表わせないだろう。他の例においては、ブロックサイズが長すぎる場合には、ブロックは、誤りを導く情報を含む可能性が高い。ブロックの側部の長さの好ましい値は10ピクセルであることが分かった。
【0031】
各ブロックの自然/人工分類は以下のステップに基づく。まず、分析されるべき画像内の全ピクセルについて、輝度値Lの勾配行列Gが、公式
【数4】
を用いて決定され、ここで、
【数5】
は行方向の勾配であり、
【数6】
は列方向の勾配である。それ故、各ピクセルについて、勾配行列Gは、行方向又は列方向におけるこのピクセルの勾配のうち最大のものである勾配値を含む。次いで、ブロック内の全てのピクセルの勾配値が零である場合には、完全に一定の輝度は自然画像の一部でありそうにないことから、このブロックは人工的なものとして印をつけられる。
【0032】
ブロック内の全勾配値が、予め規定された最小しきい値thmin、例えば4という値より小さいが、零より大きい場合には、このブロックは自然なものとして印をつけられる。この場合には、このブロックは、ピクチャ中の空の小さな一部などの一様な自然の背景の一部でありそうである。
【0033】
前の条件が偽である場合には、ブロック内の勾配値の部分集合(subset)の平均値
【数7】
が計算される。
【数8】
の高い値は激しく変化する輝度を示し、自然部分は通常小さな値を呈することから、これは画像の人工部分に特有のものである。それ故、このような状況を定量的に識別するために、最大しきい値thmax、例えば40という値が、
【数9】
を用いて平均値に対して規定され、
【数10】
である。
【0034】
平均値
【数11】
が計算される部分集合の選択は、実際的な要件に基づいて最良のものである。わずかに一様でない背景の上のテキストなどのよくある'人工的な'状況は、少数のピクセルの輝度勾配がその他の大半と大きく異なるというものである。この場合に、ブロック全体の平均値
【数12】
は、小さな値を呈示し、斯くして、ブロックの誤った自然分類を提案するであろう。この理由のために、その値が最小しきい値thminより小さいブロック内の全ての勾配値Gの要素が、平均値
【数13】
の計算から除外される。
【0035】
画像の全ブロックが分類される場合、このようにして得られた自然/人工ブロックマップにおいてモルフォロジカルフィルタリングが行なわれる。この種の処理は、それらを分類し直すことにより偽隔離ブロック(spurious isolated blocks)を取り除くのに役立つ。これは、図4に示されているようにブロックのクラスタ化の改善をもたらす。詳細には、「開」動作が後に続く「閉」動作が、両方の場合において、構成要素(structuring element)
【数14】
を用いて行なわれる。
【0036】
モルフォロジカルフィルタリングの参考文献は、W.K.Pratt, Digital Image Processing, chapter 15, second edition, Wiley-Interscience, 1991である。
【0037】
全ブロックが、自然なもの又は人工的なもののいずれかとして分類され、モルフォロジカルフィルタによって適切にクラスタ化されたら、次いで、一般的に接続された自然ブロックのセットを有する'自然オブジェクト'を識別せんとする。対象にされるべき自然オブジェクトの形状には制約があり得る。本例においては、長方形の領域しか考慮に入れられない。それ故、アルゴリズムは、オブジェクトを有する最小サイズの長方形を決定することが出来なければならない。長方形の形状という前提(hypothesis)は、インターネット上の写真アーカイブなどの多くの実際的な状況において一般に満たされることに留意することが重要である。
【0038】
このような長方形領域の識別の仕方を以下に記載する。記載されているステップは、2つ以上の自然オブジェトを見つけるために繰り返され得る。
【0039】
まず、人工/自然ブロックマップにおいて、自然ブロックしか含まない最大の正方形がシークされる。これは、可能な限り大きな正方形から開始し、図5に図示されているように正方形がブロックマップの最大自然領域内にぴったりと収まるまで段階的に開始正方形の大きさを縮小することによりなされる。開始正方形の側部の長さは、ブロックマップの高さ及び幅の最小値である。各ステップについて、マップは、正方形の「シード領域」によりラインに関して(line-wise)走査され、各位置において、完全自然領域(totally natural region)が「囲まれ」得るか否かを調べる。段階的な縮小は、正方形の大きさの下限において停止される。この下限は、ブロックサイズについて上述されているのと同様の考慮により決定される。この下限の好ましい選択は10×10ブロックであることが分かった。それ故、縮小プロセスは、「シード領域」が完全自然領域において適正に配置される場合、又はシードの大きさが所定の下限より小さい場合のいずれかの場合に停止される。後者の場合には、アルゴリズムは終了し、否定的な結果を返す。
【0040】
「シード領域」が適正に配置されたと仮定すると、その場合には、繰返しプロシージャに従って、このシード領域が、列方向のブロックの行及び/又は行方向のブロックの列を付加することによって育成される。各ステップにおいて、育成されたシード領域が長方形のままであるように拡大がなされる。繰り返しの各ステップにおいては、その拡大が含めるであろう新しい自然ブロックの量に基づいて、育成されるべき側部が選択される。詳細には、各ステップにおいて、新たに隣接するブロックの列又は行を用いての拡大が各側部においてテストされる。その割合が所定のしきい値より大きく、「シード領域」内の人工ブロックの全量が10%未満にとどまるという条件で、4つの側部の中で、列方向又は行方向に最も高い割合の新しい自然ブロックを持つ側部が選ばれる。所定のしきい値の好ましい値は30%である。育成プロセスは、図6に図示されている状況のように、シード領域の4つの側部のうちのいずれもが更には拡大され得ない場合に停止する。
【0041】
育成プロセスが停止したら、自然領域が長方形であることを確実にするために、シード領域内の自然領域の形状に関しての他の調査が行なわれ得る。実際は、たとえ「育成されたシード」の形状が長方形であっても、それは、長方形でない自然領域内に配置され得る。完全に長方形の自然領域は、通常、育成されたシード領域に隣接する如何なる自然ブロックも持たないであろうことに気付くであろう。それ故、各側部について、外部に隣接する自然ブロックの割合が40%未満であるか否か、及び全側部合わせて、外部に隣接するブロックの平均割合が20%未満であるか否かが決定される。
【0042】
このプロシージャの段階的なブロック育成のために、前のステップは、その範囲が1/2ブロックサイズである誤差を持つエッジを配置し得る。自然画像は通常多くのグレイレベルを含むのに対して、人工画像内の異なるグレイレベルの数は少なく、故に、自然領域と人工領域との間の境界はグレイレベルの数の劇的な変化によって特徴付けられることに気付いた。それ故、エッジの正確な位置は、グレイレベルの数の最も激しい変化を見つけることにより決定される。
【0043】
一例として、列Xに配置された右側境界について図7を参照すると、誤差範囲内の各列について、対応ピクセル列に沿って異なるグレイレベルの数、
【数15】
が計算される。この公式において、bsはブロックサイズである。異なるグレイレベルの数の最大変化を見つけるために、差ベクトル
【数16】
が計算され、該差ベクトルの最大値が探索される。
【0044】
次いで、図7における自然画像の境界づけによって図示されているように、D(i)の最大値を求めることにより、エッジの正確な位置が決定され得る。ピクセルレベルの精度での本当のエッジ位置は矢印REPによって示されている。同様に、列方向の左側境界及び行方向の境界が決定される。図7に示されている画像中のピクチャの周囲の灰色ブロックは、育成プロセスの結果としてのシード領域を示す。
【0045】
本発明の別の実施例が図8に示されている。コンピュータPCは、グラフィックカードGCを含む。グラフィックカードGCは、ビデオ信号VSが記憶されるフレームバッファFBを持つ。画像コンテンツ検出器12は、コンピュータPCのオペレーティングシステムのバックグランドプロセスとして走るよう適応されるソフトウェアの形態で実現される。コンテンツ検出器12は、フレームバッファFBにビデオ信号VSの形態で記憶される画像を分析する。自然コンテンツ検出器12は、前の実施例において記載されているような方法で自然領域の位置NAPを計算する。モニタ10は、イメージエンハンサ29及び表示画面16を含む。計算からもたらされる位置NAPは、イメージエンハンサ29に供給される。このエンハンサはまた、グラフィックカードGCからビデオ信号VSを受け取る。それ故、自然領域の位置NAPについての情報により、イメージエンハンサ29は、画像の領域が自然情報を含むか人工情報を含むかに依存してビデオ信号VSを強調する(enhance)ことが出来る。
【0046】
それ故、本発明が、従来技術のモニタと比較して利点を供給することが出来ることが分かるであろう。
【0047】
お分かりのように、各ブロックの分類は輝度勾配にしか基づく必要がない。
【0048】
また、米国特許公報第US-A-6,196,459号において用いられているSobel演算子と比較すると、水平方向及び垂直方向における絶対一次差分値の最大値の使用を介する異なるより単純な方法で勾配が推定される。更に、単純な一次差分の採用は、より多くのグラフィックパターンを自然ではないものとして適正に分類するのに役立つ。実際は、提案されている勾配推定器は、大きさの小さい'm'の水平断面又はチェスボードパターンなどのグラフィックパターンにおけるオン-オフシーケンスに対しても非零出力を与えるであろう。
【0049】
更に、米国特許公報第US-A-6,196,459号のように、その関連する勾配が零ではないしきい値thminより小さいものを含まないピクセルの部分集合の勾配平均が計算され得ることに気付かれるであろう。これは、推定を付加的な雑音に対してずっと敏感でなくさせる。それ故、少量の付加的な雑音によっても生成され得る非常に低いコントラストだが単一色ではない背景の上に非常に少ないテキスト/グラフィックピクセルを備えるブロックが、非自然ブロックとして適正に分類されるであろう。
【0050】
一般的な見解として、各ステップの計算負荷は、従って、アルゴリズムの全計算負荷は、米国特許公報第US-A-6,196,459号に開示されているものなどの既知の装置より低い。
【0051】
上記の実施例は、本発明を限定するものではなく、例示するものであり、当業者は、添付されている特許請求の範囲の範囲から外れない多くの別の実施例を設計することが出来るであろうことに注意されたい。特許請求の範囲において、括弧内に配置されている如何なる参照符号も特許請求の範囲を限定するものとして解釈されるべきではない。特許請求の範囲において、「有する」という用語は、列挙されている要素又はステップ以外の要素又はステップの存在を除外しない。要素の単数形表記は、斯様な要素の複数の存在を除外しない。本発明は、幾つかの別個の素子を有するハードウェアによって実施されることができ、適当にプログラムされたコンピュータによって実施されことが出来る。幾つかの手段を列挙しているデバイスクレームにおいては、これらの手段の幾つかは、ハードウェアの同一アイテムによって実施され得る。単に、或る方策が互いに異なる従属項において列挙されているという事実は、これらの方策の組み合わせが有利に用いられ得ないことを示さない。
【図面の簡単な説明】
【0052】
【図1】本発明を実施するモニタを図示する概略的なブロック図である。
【図2】図1のモニタの表示画面上に表示されるような合成自然/人工画像の表示である。
【図3】前記表示の自然ブロック又は人工ブロックのいずれかとして分類されるブロックを図示する図2のオリジナル画像のブロックマップである。
【図4】クラスタ化動作にかけた図3のブロックマップの図示である。
【図5】領域検査ステップの初期段階の間の図4のブロックマップの図示である。
【図6】図4に関して例示されている検査ステップが完了されたブロックマップの図示である。
【図7】自然画像の精密なエッジを正確に識別せんとする他の精密化ステップを図示する。
【図8】本発明の別の実施例を図示する。
【0001】
本発明は、ピクセルの行及び列の行列から成る画像の人工領域と自然領域とを識別する方法であって、前記画像の前記ピクセルの輝度値の行列をブロックマップを表わすブロックに分割するステップと、前記ブロック中の前記輝度値の輝度勾配の勾配行列Gの分析により該ブロックが自然画像タイプのものであるか又は人工画像タイプのものであるかを識別するステップと、同じ画像タイプのブロックを前記画像の各々の自然領域及び人工領域にクラスタ化するステップとを有する方法及び関連する装置に関する。本発明は、更に、表示画面及びイメージエンハンサ(image enhancer)を有する表示装置に関する。
【背景技術】
【0002】
特徴抽出及びコンテンツ駆動処理(content driven processing)、圧縮並びに検索動作などの信号処理アプリケーションの多くの態様が、表示を写真又はビデオ画像などの自然画像を表示しそうだとみなされる領域と、コンピュータ生成テキスト及び/又はグラフィック領域などの所謂人工画像を表示しそうな領域とに正確にセグメント化する能力に大きく依存する。
【0003】
自然なもの又は人工的なもののいずれかとして分類される表示の領域を表わすデータを識別することにより、次いで、更にとりわけ適切且つ正確な信号処理アプリケーションを供給するために、自然コンテンツ専用のアルゴリズム又は人工コンテンツ専用のアルゴリズムが用いられ得る。このようなセグメント化なしでは、全表示に対する一様のアルゴリズムの適用が行なわれ、不利な点が生じ得る。例えば、同じ画像強調アルゴリズム(image-enhancement algorithm)が画像の自然領域と人工領域との両方に適用されることは、自然画像領域の知覚品質の著しい向上をもたらすのには役立つであろうが、不利なことに、表示の人工部分においてアーチファクトをもたらすであろう。
【0004】
斯くして、最初に、表示の自然領域と表示の人工領域とを識別し、分離しようと努めずに、全表示を向上させようとするのは不適切だと分かり得る。このような異なる領域が識別されたら、次いで、各々、適切な処理アルゴリズムが適用され得る。
【0005】
当然、このように画像データを処理することで他の利点が生じる。例えば、ビデオ画像と純粋なテキスト/グラフィックコンテンツとに対して別個の符号化方式を採用するようにファックス装置を構成するなどの符号化アプリケーションにおける帯域幅利用の自動最適化が達成され得る。
【0006】
米国特許公報第US-A-6195459号は、画像の自然領域と人工領域とを識別するよう構成されるアルゴリズムであり、その後の、人工カテゴリ又は自然カテゴリのいずれかに入りそうだと分かったブロックのクラスタ化(clustering)を備える表示のブロック分析を供給するアルゴリズムを開示している。このようなクラスタ化されたブロックによって形成される概ね長方形の領域は、次いで精密化(refine)され、他の分析ステップに応答して人工領域又は自然領域として受け入れられるか、又は放棄される。
【0007】
しかしながら、このような既知の構成は、不利なことには、正確に識別され得るグラフィックパターンの範囲が限られており、その一般的な正確さ及び効率並びにその雑音に対する敏感さに関しても限られている。
【0008】
また、この既知のアルゴリズムは、不必要に複雑だと考えられる方法であり、幾つかの状況においてはアルゴリズムの正確な動作を不都合なほどに制限し得るかなり高い計算負荷を呈する方法に基づいて動作するよう構成される。
【発明の開示】
【課題を解決するための手段】
【0009】
本発明は、既知のこのような方法及び装置を上回る利点を供給する上記のタイプの方法及び装置を提供せんとするものである。本発明は独立項によって規定される。従属項は有利な実施例を規定する。
【0010】
本発明の或る特徴によれば、ブロックが自然画像タイプのものであるか又は人工画像タイプのものであるかを識別するステップが、該ブロックの行及び列方向におけるピクセルの輝度値Lの一次差分値に基づいて各ブロック内の勾配行列を計算するステップを有することを特徴とする上記のタイプの方法が提供される。
【0011】
本発明は、分類がもっぱら輝度勾配の推定に基づき得る点で有利である。絶対一次差分値を用いることはまた、単純な一次差分の採用があり得るより多種多様なグラフィカルパターンについて非自然画像を表示するブロックを正確に識別するのを手助けすることから有利だと分かる。
【0012】
請求項2の特徴は、各ブロックの人工ブロック又は自然ブロックのいずれかとしての分類を単純にする点で有利である。
【0013】
請求項3乃至6の特徴は、さもなければ付加的な雑音が分類プロシージャに及ぼし得る影響を制限する点でとりわけ有利だと分かる。
【0014】
請求項7の特徴は、ブロックをきれいにする一方で、共通タイプのものらしいと決定されるブロックのクラスタ化もする効果的且つ単純な構成を提供する。
【0015】
請求項8乃至13の特徴は、例えば、様々な接続された構成要素の領域の識別又は生成が不必要であることから計算負荷を制限する点で有利である。
【0016】
また、人工的なもの又は自然なもののいずれかとしての領域の受入れ又は排除は、長方形内の自然ブロックの割合だけでなく、境界の規則正しさに基づき得る。
【0017】
請求項14の特徴は、ピクセルレベルの例えば長方形のエッジ(edge)検出を可能にする最終的な精密化ステップを導入する点で有利である。
【0018】
一般に、本発明の方法における各ステップの計算負荷は、従来技術の比較可能なステップの計算負荷より低い。
【0019】
本発明の別の特徴によれば、表示画像の自然領域と人工領域とを識別する装置であり、表示の異なる各々のピクセルのブロックを表わすグループに画像データを分割する識別手段と、前記ブロックが自然画像タイプのものであるか又は人工画像タイプのものであるかを識別するよう構成される輝度勾配推定手段(luminance gradient estimation means)と、同じタイプのブロックをクラスタ化するために前記データを更にグループ化するクラスタ化手段と、クラスタ化されたブロックによって形成された領域を、該領域を自然画像又は人工画像のいずれかを表わすものとして確認するために、分析する分析手段とを含む装置であって、前記輝度勾配推定手段が、前記ブロックの水平方向及び垂直方向における一次差分値によって前記勾配を推定するよう構成されることを特徴とする装置が提供される。
【0020】
本発明はまた、上記の方法ステップのいずれか1つ以上に基づいて動作するよう構成される上記のような装置も提供する。
【0021】
以下に添付図面を参照して本発明のこれら及び他の特徴を説明し、明らかにする。
【発明を実施するための最良の形態】
【0022】
まず図1を参照すると、本発明を実施するモニタ10の単純化された概略的なブロック図が図示されている。モニタ10は、機能ブロックの形態(functional block form)で図示されている人工/自然画像コンテンツ検出器12を含む。しかしながら、検出器12は、一般的に、制御アルゴリズムの形態で供給される。モニタは、表示画面16及びイメージエンハンサ29を更に含む。フレームバッファ14はビデオ信号VSを受け取り、ビデオ信号VSはデジタルフォーマットで輝度データを含む。これらのデータは、ピクセル素子の行及び列の行列から成る入力画像の輝度値Lを表わす。
【0023】
動画の場合には、ビデオ信号VSは一連の画像を含み、各画像は輝度値Lの行列によって表わされる。ビデオ信号VSが、各ピクセルの色成分についての情報、例えば、赤、緑及び青の色成分の値を含む場合には、輝度値は、既知の方法で色成分の値から導き出され得る。説明を簡略化するために、ビデオ信号は輝度値Lを含み、これらの値Lはフレームバッファ14に記憶されると仮定してこの実施例を説明する。
【0024】
人工/自然画像コンテンツ検出器12はフレームバッファ14に接続される。人工/自然画像コンテンツ検出器12によって供給される関数アルゴリズム(functional algorithm)は、有利なことに、画像分類アルゴリズムを有し、ビデオ信号VSの形態で受け取られる画像の自然領域の認識を供給するよう構成される。1つ又は複数の前記画像は、例えば、デジタル化された写真又はビデオクリップであり得る。
【0025】
輝度データは、フレームバッファ14から取り出され、ブロック選択ユニット20においてアルゴリズムに基づいて小さな正方形のブロックに分割される。ブロックのコンテンツは、輝度勾配推定ユニット22において自然なもの又は人工的なもののいずれかとして分類される。勾配推定ユニットの出力は、モルフォロジカルフィルタ(morphological filter)24に供給され、モルフォロジカルフィルタ24は、隣接ブロックを概ね長方形のおそらくは人工的な又は自然な領域(generally rectangular likely synthetic or natural regions)にクラスタ化する。クラスタ化されたブロックは、次いで、シード領域育成器(seed region gorwer)26において更に処理され、シード領域育成器26は、例えば長方形のおそらくは自然画像の領域(likely rectangular natural image region)の大きさを最大化せんとして、行方向と列方向との両方において、段階的な方法でシード領域を育成する。
【0026】
最大限の長方形のおそらくは自然画像の領域(likely maximum rectangular natural image region)に到達したら、エッジ位置精密化装置(edge position refiner)28が、自然画像領域の境界をピクセルレベルで正確に識別する。
【0027】
画像において1つ以上のこのような自然画像領域が識別されたら、この情報は、この画像の輝度データのどの部分がどの画像処理及び/又は強調アルゴリズムにかけられるべきかを決定するために用いられ得る。それ故、イメージエンハンサ29は、フレームバッファ14からの輝度データと、自然領域及び人工領域の場所についての情報とを受け取る。これらの入力に基づいて、エンハンサ29は、各タイプの領域に対して適切な処理を実行する。イメージエンハンサ29の出力信号は、表示画面を駆動するのに用いられる。
【0028】
機能の点からみると、コンテンツ検出器は、自然領域内にある確率が高い画像の場所を探索する。このあとには領域育成プロシージャが続き、領域育成プロシージャは、停止条件が確認されるまで最初に推定された自然領域を拡大する。
【0029】
画像検出器12によって実行されるような制御アルゴリズムについて以下に更に詳細に記載する。
【0030】
まず、入力画像は、効果的に、そのコンテンツが統計的プロシージャに基づいて自然なもの又は人工的なもののいずれかとして分類される小さな正方形のブロックに分割される。ブロックの側部の長さの下限及び上限は、評価測定の信頼性により課される制約によって規定される。例えば、ブロックが小さすぎる場合には、考慮に入れられるピクセルが少なすぎて、この測定は局所特性を表わせないだろう。他の例においては、ブロックサイズが長すぎる場合には、ブロックは、誤りを導く情報を含む可能性が高い。ブロックの側部の長さの好ましい値は10ピクセルであることが分かった。
【0031】
各ブロックの自然/人工分類は以下のステップに基づく。まず、分析されるべき画像内の全ピクセルについて、輝度値Lの勾配行列Gが、公式
【数4】
を用いて決定され、ここで、
【数5】
は行方向の勾配であり、
【数6】
は列方向の勾配である。それ故、各ピクセルについて、勾配行列Gは、行方向又は列方向におけるこのピクセルの勾配のうち最大のものである勾配値を含む。次いで、ブロック内の全てのピクセルの勾配値が零である場合には、完全に一定の輝度は自然画像の一部でありそうにないことから、このブロックは人工的なものとして印をつけられる。
【0032】
ブロック内の全勾配値が、予め規定された最小しきい値thmin、例えば4という値より小さいが、零より大きい場合には、このブロックは自然なものとして印をつけられる。この場合には、このブロックは、ピクチャ中の空の小さな一部などの一様な自然の背景の一部でありそうである。
【0033】
前の条件が偽である場合には、ブロック内の勾配値の部分集合(subset)の平均値
【数7】
が計算される。
【数8】
の高い値は激しく変化する輝度を示し、自然部分は通常小さな値を呈することから、これは画像の人工部分に特有のものである。それ故、このような状況を定量的に識別するために、最大しきい値thmax、例えば40という値が、
【数9】
を用いて平均値に対して規定され、
【数10】
である。
【0034】
平均値
【数11】
が計算される部分集合の選択は、実際的な要件に基づいて最良のものである。わずかに一様でない背景の上のテキストなどのよくある'人工的な'状況は、少数のピクセルの輝度勾配がその他の大半と大きく異なるというものである。この場合に、ブロック全体の平均値
【数12】
は、小さな値を呈示し、斯くして、ブロックの誤った自然分類を提案するであろう。この理由のために、その値が最小しきい値thminより小さいブロック内の全ての勾配値Gの要素が、平均値
【数13】
の計算から除外される。
【0035】
画像の全ブロックが分類される場合、このようにして得られた自然/人工ブロックマップにおいてモルフォロジカルフィルタリングが行なわれる。この種の処理は、それらを分類し直すことにより偽隔離ブロック(spurious isolated blocks)を取り除くのに役立つ。これは、図4に示されているようにブロックのクラスタ化の改善をもたらす。詳細には、「開」動作が後に続く「閉」動作が、両方の場合において、構成要素(structuring element)
【数14】
を用いて行なわれる。
【0036】
モルフォロジカルフィルタリングの参考文献は、W.K.Pratt, Digital Image Processing, chapter 15, second edition, Wiley-Interscience, 1991である。
【0037】
全ブロックが、自然なもの又は人工的なもののいずれかとして分類され、モルフォロジカルフィルタによって適切にクラスタ化されたら、次いで、一般的に接続された自然ブロックのセットを有する'自然オブジェクト'を識別せんとする。対象にされるべき自然オブジェクトの形状には制約があり得る。本例においては、長方形の領域しか考慮に入れられない。それ故、アルゴリズムは、オブジェクトを有する最小サイズの長方形を決定することが出来なければならない。長方形の形状という前提(hypothesis)は、インターネット上の写真アーカイブなどの多くの実際的な状況において一般に満たされることに留意することが重要である。
【0038】
このような長方形領域の識別の仕方を以下に記載する。記載されているステップは、2つ以上の自然オブジェトを見つけるために繰り返され得る。
【0039】
まず、人工/自然ブロックマップにおいて、自然ブロックしか含まない最大の正方形がシークされる。これは、可能な限り大きな正方形から開始し、図5に図示されているように正方形がブロックマップの最大自然領域内にぴったりと収まるまで段階的に開始正方形の大きさを縮小することによりなされる。開始正方形の側部の長さは、ブロックマップの高さ及び幅の最小値である。各ステップについて、マップは、正方形の「シード領域」によりラインに関して(line-wise)走査され、各位置において、完全自然領域(totally natural region)が「囲まれ」得るか否かを調べる。段階的な縮小は、正方形の大きさの下限において停止される。この下限は、ブロックサイズについて上述されているのと同様の考慮により決定される。この下限の好ましい選択は10×10ブロックであることが分かった。それ故、縮小プロセスは、「シード領域」が完全自然領域において適正に配置される場合、又はシードの大きさが所定の下限より小さい場合のいずれかの場合に停止される。後者の場合には、アルゴリズムは終了し、否定的な結果を返す。
【0040】
「シード領域」が適正に配置されたと仮定すると、その場合には、繰返しプロシージャに従って、このシード領域が、列方向のブロックの行及び/又は行方向のブロックの列を付加することによって育成される。各ステップにおいて、育成されたシード領域が長方形のままであるように拡大がなされる。繰り返しの各ステップにおいては、その拡大が含めるであろう新しい自然ブロックの量に基づいて、育成されるべき側部が選択される。詳細には、各ステップにおいて、新たに隣接するブロックの列又は行を用いての拡大が各側部においてテストされる。その割合が所定のしきい値より大きく、「シード領域」内の人工ブロックの全量が10%未満にとどまるという条件で、4つの側部の中で、列方向又は行方向に最も高い割合の新しい自然ブロックを持つ側部が選ばれる。所定のしきい値の好ましい値は30%である。育成プロセスは、図6に図示されている状況のように、シード領域の4つの側部のうちのいずれもが更には拡大され得ない場合に停止する。
【0041】
育成プロセスが停止したら、自然領域が長方形であることを確実にするために、シード領域内の自然領域の形状に関しての他の調査が行なわれ得る。実際は、たとえ「育成されたシード」の形状が長方形であっても、それは、長方形でない自然領域内に配置され得る。完全に長方形の自然領域は、通常、育成されたシード領域に隣接する如何なる自然ブロックも持たないであろうことに気付くであろう。それ故、各側部について、外部に隣接する自然ブロックの割合が40%未満であるか否か、及び全側部合わせて、外部に隣接するブロックの平均割合が20%未満であるか否かが決定される。
【0042】
このプロシージャの段階的なブロック育成のために、前のステップは、その範囲が1/2ブロックサイズである誤差を持つエッジを配置し得る。自然画像は通常多くのグレイレベルを含むのに対して、人工画像内の異なるグレイレベルの数は少なく、故に、自然領域と人工領域との間の境界はグレイレベルの数の劇的な変化によって特徴付けられることに気付いた。それ故、エッジの正確な位置は、グレイレベルの数の最も激しい変化を見つけることにより決定される。
【0043】
一例として、列Xに配置された右側境界について図7を参照すると、誤差範囲内の各列について、対応ピクセル列に沿って異なるグレイレベルの数、
【数15】
が計算される。この公式において、bsはブロックサイズである。異なるグレイレベルの数の最大変化を見つけるために、差ベクトル
【数16】
が計算され、該差ベクトルの最大値が探索される。
【0044】
次いで、図7における自然画像の境界づけによって図示されているように、D(i)の最大値を求めることにより、エッジの正確な位置が決定され得る。ピクセルレベルの精度での本当のエッジ位置は矢印REPによって示されている。同様に、列方向の左側境界及び行方向の境界が決定される。図7に示されている画像中のピクチャの周囲の灰色ブロックは、育成プロセスの結果としてのシード領域を示す。
【0045】
本発明の別の実施例が図8に示されている。コンピュータPCは、グラフィックカードGCを含む。グラフィックカードGCは、ビデオ信号VSが記憶されるフレームバッファFBを持つ。画像コンテンツ検出器12は、コンピュータPCのオペレーティングシステムのバックグランドプロセスとして走るよう適応されるソフトウェアの形態で実現される。コンテンツ検出器12は、フレームバッファFBにビデオ信号VSの形態で記憶される画像を分析する。自然コンテンツ検出器12は、前の実施例において記載されているような方法で自然領域の位置NAPを計算する。モニタ10は、イメージエンハンサ29及び表示画面16を含む。計算からもたらされる位置NAPは、イメージエンハンサ29に供給される。このエンハンサはまた、グラフィックカードGCからビデオ信号VSを受け取る。それ故、自然領域の位置NAPについての情報により、イメージエンハンサ29は、画像の領域が自然情報を含むか人工情報を含むかに依存してビデオ信号VSを強調する(enhance)ことが出来る。
【0046】
それ故、本発明が、従来技術のモニタと比較して利点を供給することが出来ることが分かるであろう。
【0047】
お分かりのように、各ブロックの分類は輝度勾配にしか基づく必要がない。
【0048】
また、米国特許公報第US-A-6,196,459号において用いられているSobel演算子と比較すると、水平方向及び垂直方向における絶対一次差分値の最大値の使用を介する異なるより単純な方法で勾配が推定される。更に、単純な一次差分の採用は、より多くのグラフィックパターンを自然ではないものとして適正に分類するのに役立つ。実際は、提案されている勾配推定器は、大きさの小さい'm'の水平断面又はチェスボードパターンなどのグラフィックパターンにおけるオン-オフシーケンスに対しても非零出力を与えるであろう。
【0049】
更に、米国特許公報第US-A-6,196,459号のように、その関連する勾配が零ではないしきい値thminより小さいものを含まないピクセルの部分集合の勾配平均が計算され得ることに気付かれるであろう。これは、推定を付加的な雑音に対してずっと敏感でなくさせる。それ故、少量の付加的な雑音によっても生成され得る非常に低いコントラストだが単一色ではない背景の上に非常に少ないテキスト/グラフィックピクセルを備えるブロックが、非自然ブロックとして適正に分類されるであろう。
【0050】
一般的な見解として、各ステップの計算負荷は、従って、アルゴリズムの全計算負荷は、米国特許公報第US-A-6,196,459号に開示されているものなどの既知の装置より低い。
【0051】
上記の実施例は、本発明を限定するものではなく、例示するものであり、当業者は、添付されている特許請求の範囲の範囲から外れない多くの別の実施例を設計することが出来るであろうことに注意されたい。特許請求の範囲において、括弧内に配置されている如何なる参照符号も特許請求の範囲を限定するものとして解釈されるべきではない。特許請求の範囲において、「有する」という用語は、列挙されている要素又はステップ以外の要素又はステップの存在を除外しない。要素の単数形表記は、斯様な要素の複数の存在を除外しない。本発明は、幾つかの別個の素子を有するハードウェアによって実施されることができ、適当にプログラムされたコンピュータによって実施されことが出来る。幾つかの手段を列挙しているデバイスクレームにおいては、これらの手段の幾つかは、ハードウェアの同一アイテムによって実施され得る。単に、或る方策が互いに異なる従属項において列挙されているという事実は、これらの方策の組み合わせが有利に用いられ得ないことを示さない。
【図面の簡単な説明】
【0052】
【図1】本発明を実施するモニタを図示する概略的なブロック図である。
【図2】図1のモニタの表示画面上に表示されるような合成自然/人工画像の表示である。
【図3】前記表示の自然ブロック又は人工ブロックのいずれかとして分類されるブロックを図示する図2のオリジナル画像のブロックマップである。
【図4】クラスタ化動作にかけた図3のブロックマップの図示である。
【図5】領域検査ステップの初期段階の間の図4のブロックマップの図示である。
【図6】図4に関して例示されている検査ステップが完了されたブロックマップの図示である。
【図7】自然画像の精密なエッジを正確に識別せんとする他の精密化ステップを図示する。
【図8】本発明の別の実施例を図示する。
Claims (16)
- ピクセルの行及び列の行列から成る画像の人工領域と自然領域とを識別する方法であり、前記画像の前記ピクセルの輝度値の行列をブロックマップを表わすブロックに分割するステップと、前記ブロック中の前記輝度値の輝度勾配の勾配行列Gの分析により該ブロックが自然画像タイプのものであるか又は人工画像タイプのものであるかを識別するステップと、同じ画像タイプのブロックを前記画像の各々の自然領域及び人工領域にクラスタ化するステップとを有する方法であって、前記ブロックが前記自然画像タイプのものであるか又は前記人工画像タイプのものであるかを識別するステップが、該ブロックの行及び列方向における前記ピクセルの前記輝度値Lの一次差分値に基づいて各ブロック内の前記勾配行列を計算するステップを有することを特徴とする方法。
- 前記勾配行列G中の値が所定のしきい値と零との間にあるかどうかを決定するステップを含むことを特徴とする請求項1に記載の方法。
- 前記勾配行列G中の値が前記所定のしきい値より大きい場合に、前記勾配行列G中の前記勾配値の部分集合を決定し、前記部分集合の平均勾配値が最大しきい値より大きいかどうかを決定するステップを含むことを特徴とする請求項3に記載の方法。
- 前記平均勾配値が前記最大しきい値より小さい場合には、前記ブロックが自然画像の一部として識別され、前記平均勾配値が前記最大しきい値より大きい場合には、前記ブロックが人工画像の一部として識別されることを特徴とする請求項4に記載の方法。
- 前記所定のしきい値より小さい勾配値が前記部分集合から除かれることを特徴とする請求項4に記載の方法。
- 同じタイプのブロックをクラスタ化するために開動作が後に続く閉動作を用いるモルフォロジカルフィルタリングステップが含まれることを特徴とする請求項1に記載の方法。
- 複数のブロックを有するシード領域が、該シード領域が完全に前記ブロックマップの自然領域内に収容されると決定されるまで段階的な方法で大きさを縮小されることを特徴とする請求項1に記載の方法。
- 段階的に縮小する前記シード領域の大きさを所定のしきい値の大きさと比較し、前記シード領域が完全に前記ブロックマップの自然領域内に配置される場合に、又は前記シード領域の大きさが前記所定のしきい値の大きさを下回ったら、前記段階的な縮小を中止する他のステップが含まれることを特徴とする請求項8に記載の方法。
- 前記画像の自然領域内にあると決定される前記シード領域の大きさを最大化しようとして前記行方向及び/又は前記列方向に該シード領域の大きさを拡大するステップが含まれることを特徴とする請求項8に記載の方法。
- ブロックの列及び/又は行が、該列/該行のどれが自然ブロックの最も高い割合を呈するかの決定に基づいて前記シード領域に付加されることを特徴とする請求項10に記載の方法。
- 前記シード領域内の人工ブロックの割合が所定のしきい値の割合を超えて増大する場合に、該シード領域の前記拡大が終わることを特徴とする請求項10に記載の方法。
- 付加されるべきブロックの行又は列の中の外部隣接自然ブロックの割合が所定のしきい値の割合より低い場合に、前記付加が中止されることを特徴とする請求項11に記載の方法。
- 前記シード領域の周囲に沿って前記ブロック中に前記ピクセルを有する隣接する行又は列内の異なるグレイレベルの数を決定し、異なるグレイレベルの数において最も大きな差を呈する2つの隣接するピクセルの行又は列の位置を識別するステップが含まれることを特徴とする請求項1に記載の方法。
- ピクセルの行及び列の行列から成る画像の自然領域と人工領域とを識別する装置であり、前記画像の前記ピクセルの輝度値をブロックに分割するブロック選択ユニットと、前記ブロックが自然画像タイプのものであるか又は人工画像タイプのものであるかを識別するよう構成される輝度勾配推定手段と、同じタイプのブロックを更にクラスタ化するクラスタ化手段とを含む装置であって、前記輝度勾配推定手段が前記ブロックの行方向及び列方向における前記ピクセルの前記輝度値の一次差分値を決定することによって輝度勾配値を決定するよう構成されることを特徴とする装置。
- 請求項15に記載の装置を有することを特徴とする表示画面及びイメージエンハンサユニットを有する表示装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01203860 | 2001-10-11 | ||
PCT/IB2002/004181 WO2003034335A2 (en) | 2001-10-11 | 2002-10-10 | Method and apparatus for discriminating between different regions of an image |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005505870A true JP2005505870A (ja) | 2005-02-24 |
Family
ID=8181050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003536989A Pending JP2005505870A (ja) | 2001-10-11 | 2002-10-10 | 画像の異なる領域を識別をするための方法及び装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20050002566A1 (ja) |
EP (1) | EP1438696A2 (ja) |
JP (1) | JP2005505870A (ja) |
KR (1) | KR20040050909A (ja) |
CN (1) | CN1276382C (ja) |
AU (1) | AU2002337455A1 (ja) |
WO (1) | WO2003034335A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9754162B2 (en) | 2014-12-05 | 2017-09-05 | Samsung Display Co., Ltd. | Image processing method and device for adaptive image enhancement |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101819325B (zh) * | 2003-01-16 | 2015-11-25 | 帝欧希数字光学科技国际有限公司 | 光学系统和产生所述光学系统的方法 |
US7203359B1 (en) * | 2003-02-18 | 2007-04-10 | Novell, Inc. | Split screen technique for improving bandwidth utilization when transferring changing images |
US7034776B1 (en) * | 2003-04-08 | 2006-04-25 | Microsoft Corporation | Video division detection methods and systems |
FR2860902B1 (fr) * | 2003-10-10 | 2005-12-09 | France Telecom | Determination de caracteristiques textuelles de pixels |
GB2425230B (en) | 2005-04-15 | 2011-03-23 | Filmlight Ltd | A method and apparatus for image processing |
AU2005211665A1 (en) * | 2005-09-23 | 2007-04-19 | Canon Kabushiki Kaisha | Vectorisation of colour gradients |
TW200820767A (en) * | 2006-06-26 | 2008-05-01 | Genesis Microchip Inc | Universal, highly configurable video and graphic measurement device |
US7826680B2 (en) * | 2006-06-26 | 2010-11-02 | Genesis Microchip Inc. | Integrated histogram auto adaptive contrast control (ACC) |
US7920755B2 (en) * | 2006-06-26 | 2011-04-05 | Genesis Microchip Inc. | Video content detector |
US7881547B2 (en) * | 2006-07-28 | 2011-02-01 | Genesis Microchip Inc. | Video window detector |
US7840071B2 (en) * | 2006-12-12 | 2010-11-23 | Seiko Epson Corporation | Method and apparatus for identifying regions of different content in an image |
US20080219561A1 (en) * | 2007-03-05 | 2008-09-11 | Ricoh Company, Limited | Image processing apparatus, image processing method, and computer program product |
JP2008252862A (ja) * | 2007-03-05 | 2008-10-16 | Ricoh Co Ltd | 画像処理装置、画像処理方法及び画像処理プログラム |
KR100880612B1 (ko) * | 2007-06-25 | 2009-01-30 | 중앙대학교 산학협력단 | 디지털 이미지의 위·변조 분석기 및 그 방법 |
US7936923B2 (en) * | 2007-08-31 | 2011-05-03 | Seiko Epson Corporation | Image background suppression |
US7974437B2 (en) * | 2007-11-19 | 2011-07-05 | Seiko Epson Corporation | Identifying steganographic data in an image |
US8081823B2 (en) * | 2007-11-20 | 2011-12-20 | Seiko Epson Corporation | Segmenting a string using similarity values |
US8031905B2 (en) * | 2007-11-21 | 2011-10-04 | Seiko Epson Corporation | Extracting data from images |
US8243981B2 (en) * | 2007-11-26 | 2012-08-14 | Seiko Epson Corporation | Identifying embedded data in an image |
US8009862B2 (en) * | 2007-11-27 | 2011-08-30 | Seiko Epson Corporation | Embedding data in images |
TWI423246B (zh) * | 2009-08-21 | 2014-01-11 | Primax Electronics Ltd | 圖像處理方法及其相關裝置 |
CN102087741B (zh) * | 2009-12-03 | 2013-01-02 | 财团法人工业技术研究院 | 采用区域架构的图像处理方法及系统 |
US8724899B2 (en) * | 2010-02-11 | 2014-05-13 | Thomson Licensing | Method of processing an image and corresponding device |
EP2564591A4 (en) * | 2010-04-29 | 2014-06-11 | Thomson Licensing | PROCESS FOR PROCESSING AN IMAGE |
US12105684B2 (en) * | 2010-06-22 | 2024-10-01 | Primal Fusion Inc. | Methods and devices for customizing knowledge representation systems |
CN102156866A (zh) * | 2011-03-09 | 2011-08-17 | 深圳百维达科技有限公司 | 路牌识别系统及路牌识别方法 |
US9218782B2 (en) | 2011-11-16 | 2015-12-22 | Stmicroelectronics International N.V. | Video window detection |
US20130120588A1 (en) * | 2011-11-16 | 2013-05-16 | Stmicroelectronics, Inc. | Video window detection |
CN103295186B (zh) * | 2012-02-24 | 2016-03-09 | 佳能株式会社 | 图像描述符生成方法和系统、图像检测方法和系统 |
US9275300B2 (en) | 2012-02-24 | 2016-03-01 | Canon Kabushiki Kaisha | Method and apparatus for generating image description vector, image detection method and apparatus |
CN102930295B (zh) * | 2012-10-24 | 2015-11-11 | 中国科学院自动化研究所 | 基于自适应空间信息有向图的图像分类方法 |
KR102248172B1 (ko) * | 2015-03-16 | 2021-05-04 | 한양대학교 산학협력단 | 영상 분석을 이용한 비디오 부호화/복호화 방법 및 장치 |
CN106385592B (zh) * | 2016-08-31 | 2019-06-28 | 西安万像电子科技有限公司 | 图像压缩方法和装置 |
CN108093246B (zh) * | 2017-11-21 | 2020-04-28 | 青岛海信电器股份有限公司 | 一种数字机顶盒视频播放区域的识别方法及装置 |
CN108090511B (zh) * | 2017-12-15 | 2020-09-01 | 泰康保险集团股份有限公司 | 图像分类方法、装置、电子设备及可读存储介质 |
US11775814B1 (en) | 2019-07-31 | 2023-10-03 | Automation Anywhere, Inc. | Automated detection of controls in computer applications with region based detectors |
US10489682B1 (en) * | 2017-12-21 | 2019-11-26 | Automation Anywhere, Inc. | Optical character recognition employing deep learning with machine generated training data |
US11176443B1 (en) | 2017-12-21 | 2021-11-16 | Automation Anywhere, Inc. | Application control and text detection from application screen images |
US10769427B1 (en) | 2018-04-19 | 2020-09-08 | Automation Anywhere, Inc. | Detection and definition of virtual objects in remote screens |
CN109635669B (zh) * | 2018-11-19 | 2021-06-29 | 北京致远慧图科技有限公司 | 图像分类方法、装置及分类模型的训练方法、装置 |
US11513670B2 (en) | 2020-04-27 | 2022-11-29 | Automation Anywhere, Inc. | Learning user interface controls via incremental data synthesis |
CN113744282B (zh) * | 2021-08-09 | 2023-04-25 | 深圳曦华科技有限公司 | 图像处理方法、装置及存储介质 |
CN114808823B (zh) * | 2022-04-28 | 2024-06-14 | 湖北佰思图汽车有限公司 | 一种清扫车快速清理路面积液的智能控制方法及系统 |
CN117390600B (zh) * | 2023-12-08 | 2024-02-13 | 中国信息通信研究院 | 用于深度合成信息的检测方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS613568A (ja) * | 1984-06-18 | 1986-01-09 | Ricoh Co Ltd | 中間調領域識別方式 |
EP0818693A1 (en) * | 1992-07-08 | 1998-01-14 | Matsushita Electric Industrial Co., Ltd. | Optical waveguide device and manufacturing method of the same |
US5327262A (en) * | 1993-05-24 | 1994-07-05 | Xerox Corporation | Automatic image segmentation with smoothing |
US5546474A (en) * | 1993-12-21 | 1996-08-13 | Hewlett-Packard Company | Detection of photo regions in digital images |
EP0685959B1 (en) * | 1994-05-31 | 2000-07-26 | NEC Corporation | Image processing apparatus for identifying character, photo and dot images in the image area |
US5583659A (en) * | 1994-11-10 | 1996-12-10 | Eastman Kodak Company | Multi-windowing technique for thresholding an image using local image properties |
US6009196A (en) * | 1995-11-28 | 1999-12-28 | Xerox Corporation | Method for classifying non-running text in an image |
AUPN727295A0 (en) * | 1995-12-21 | 1996-01-18 | Canon Kabushiki Kaisha | Zone segmentation for image display |
-
2002
- 2002-10-10 JP JP2003536989A patent/JP2005505870A/ja active Pending
- 2002-10-10 EP EP02772728A patent/EP1438696A2/en not_active Withdrawn
- 2002-10-10 KR KR10-2004-7005276A patent/KR20040050909A/ko not_active Application Discontinuation
- 2002-10-10 WO PCT/IB2002/004181 patent/WO2003034335A2/en not_active Application Discontinuation
- 2002-10-10 AU AU2002337455A patent/AU2002337455A1/en not_active Abandoned
- 2002-10-10 US US10/492,004 patent/US20050002566A1/en not_active Abandoned
- 2002-10-10 CN CNB028200160A patent/CN1276382C/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9754162B2 (en) | 2014-12-05 | 2017-09-05 | Samsung Display Co., Ltd. | Image processing method and device for adaptive image enhancement |
Also Published As
Publication number | Publication date |
---|---|
WO2003034335A2 (en) | 2003-04-24 |
AU2002337455A1 (en) | 2003-04-28 |
CN1276382C (zh) | 2006-09-20 |
KR20040050909A (ko) | 2004-06-17 |
CN1568479A (zh) | 2005-01-19 |
US20050002566A1 (en) | 2005-01-06 |
EP1438696A2 (en) | 2004-07-21 |
WO2003034335A3 (en) | 2003-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005505870A (ja) | 画像の異なる領域を識別をするための方法及び装置 | |
JP3862140B2 (ja) | ピクセル化されたイメージをセグメント化する方法および装置、並びに記録媒体、プログラム、イメージキャプチャデバイス | |
JP4017489B2 (ja) | セグメント化方法 | |
EP3021575B1 (en) | Image processing device and image processing method | |
US9251429B2 (en) | Superpixel-based refinement of low-resolution foreground segmentation | |
US6778698B1 (en) | Method and apparatus for digital image segmentation | |
JP4746050B2 (ja) | ビデオデータを処理するための方法及びシステム | |
EP1321898B1 (en) | Method and apparatus for digital image segmentation | |
WO2017121018A1 (zh) | 二维码图像处理的方法和装置、终端、存储介质 | |
US10748023B2 (en) | Region-of-interest detection apparatus, region-of-interest detection method, and recording medium | |
JP2008148298A (ja) | 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体 | |
CN109478329B (zh) | 图像处理方法和装置 | |
US7747079B2 (en) | Method and system for learning spatio-spectral features in an image | |
JP2008187709A (ja) | 画素の分類方法および画像処理装置 | |
CN112862832B (zh) | 一种基于同心圆分割定位的脏污检测方法 | |
KR20050085355A (ko) | 분할된 이미지로부터 폴스 엣지들을 제거하는 방법 및 장치 | |
KR102010086B1 (ko) | 미세조직의 상 분할 방법 및 장치 | |
US7502525B2 (en) | System and method for edge detection of an image | |
CN109448010B (zh) | 一种基于内容特征的四方连续纹样自动生成方法 | |
KR20030027953A (ko) | 영상 정보에서의 자동적인 자연 콘텐트 검출 | |
WO2003049036A2 (en) | Discriminating between synthetic and natural image regions | |
JP2005202567A (ja) | 画像処理方法、画像処理装置及び画像処理プログラム | |
Jung et al. | Text Segmentation from Web Images using Two-level Variance Maps. | |
JP2014095935A (ja) | エッジ検出装置、エッジ検出方法及びエッジ検出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051007 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080603 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081028 |