JP2008524728A - デジタル画像をセグメント化する方法及びコンパクトな表現の生成方法 - Google Patents
デジタル画像をセグメント化する方法及びコンパクトな表現の生成方法 Download PDFInfo
- Publication number
- JP2008524728A JP2008524728A JP2007547088A JP2007547088A JP2008524728A JP 2008524728 A JP2008524728 A JP 2008524728A JP 2007547088 A JP2007547088 A JP 2007547088A JP 2007547088 A JP2007547088 A JP 2007547088A JP 2008524728 A JP2008524728 A JP 2008524728A
- Authority
- JP
- Japan
- Prior art keywords
- color
- pixels
- tile
- block
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 319
- 238000004458 analytical method Methods 0.000 claims abstract description 66
- 230000008569 process Effects 0.000 claims description 146
- 238000012545 processing Methods 0.000 claims description 86
- 238000012360 testing method Methods 0.000 claims description 75
- 239000003086 colorant Substances 0.000 claims description 72
- 230000011218 segmentation Effects 0.000 claims description 58
- 238000007906 compression Methods 0.000 claims description 44
- 230000006835 compression Effects 0.000 claims description 44
- 230000015654 memory Effects 0.000 claims description 36
- 238000013507 mapping Methods 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 16
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 230000003139 buffering effect Effects 0.000 claims description 14
- 230000002427 irreversible effect Effects 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 238000013139 quantization Methods 0.000 description 42
- 230000000694 effects Effects 0.000 description 29
- 238000010586 diagram Methods 0.000 description 22
- 230000008439 repair process Effects 0.000 description 16
- 238000003860 storage Methods 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 11
- 230000008859 change Effects 0.000 description 9
- 230000008901 benefit Effects 0.000 description 6
- 238000007639 printing Methods 0.000 description 6
- 101100243022 Mus musculus Pcnt gene Proteins 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 238000003709 image segmentation Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 230000007935 neutral effect Effects 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000000740 bleeding effect Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010422 painting Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000003973 paint Substances 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 238000012372 quality testing Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007773 growth pattern Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000012432 intermediate storage Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Facsimile Image Signal Circuits (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Color Image Communication Systems (AREA)
Abstract
Description
2.カラーセグメント化
2.1.入力画像の次のタイルの取得
2.2.タイルのカラーセグメント化の形成
2.2.1.色量子化
2.2.1.1.2Dヒストグラム及び第1のパレットの形成
2.2.1.2.ヒストグラムの解析及び画像の分類
2.2.1.3.第2のパレットの形成
2.2.1.3.1.2色パレットの生成
2.2.1.3.2.多色パレットの生成
2.2.1.4.画素と第2のパレットとの関連付け
2.2.1.4.1.2レベルのタイルのマップ
2.2.1.4.2.多重レベルのタイルのマップ
2.2.2.カラーCC解析及びブロブ統計
2.2.2.1.ブロブの形成
2.2.2.2.ブロブマージの例
2.2.3.タイル内のマージ
2.2.4.タイル間のマージ
2.2.4.1.タイル間マージ条件
2.2.4.2.タイル間マージの例
2.2.4.3.最適なブロブ/CCの対の処理
2.2.4.4.CCマッピングの結果
2.2.5.マージの後処理
2.3.セグメント化の例
3.レイアウト解析
3.1.CCのグループ化
3.1.1.親CCに対する子の検索
3.1.2.初期グループ化
3.1.2.1.2つのCCに対するグループ化テスト
3.2.グループのチェック
3.2.1.位置合わせのチェック
3.2.2.位置合わせの例
4.圧縮出力画像の生成
4.1.タイルの修復
4.1.1.タイル前景ビットマスクの形成
4.1.2.画素の修復及びタイルアクティビティの測定
4.1.3.修復の例
4.1.4.タイルの均一化
5.ハードウェアの実施形態
5.1.カラーセグメント化モジュール
6.コンピュータの実現例
7.産業上の利用可能性
上記節は、上記順序で以下に詳細に説明される。
本発明の第1の実施形態は、汎用コンピュータ上で実行する処理である。図1は、デジタル画像をセグメント化、解析及び圧縮する処理100の高水準な概要を提供する。処理100に対する入力は、300dpiの解像度のRGB画像であるのが好ましい。しかし、他の色空間の画像が適切な変更を伴って処理100に入力されてもよい。同様に、異なる解像度の画像が入力されてもよい。ステップ110において、画像の連結成分(CC)へのカラーセグメント化が、入力画像に対して単一パスを使用して実行されてもよい。1パス処理を使用すると、デジタル画像は迅速に処理されるため、大量の高解像度の画像が処理される。連結成分は、全てが連結された(接触する)同様の色を有する画素のグループである。例えば、白色のページに黒色のインクで印刷された文字「i」の本体又はステムを形成する画素は1つの連結成分を形成し、「i」のドットは別のCCを形成し、文字「i」を囲む背景である任意の白色画素は更に別のCCを形成する。図6は、文字「i」を含む画像600を示す。図6において、黒色のドットは黒色画素を表し、白色のドットは白色画素を表す。「i」CCのステム610及び「i」CCのドット612が示される。また、結果として得られる黒色画素の別のCC614が示される。
図2は、図1のステップ110を更に詳細に示す。図2に示す処理は、例えばサイズが32×32画素であってもよい入力画像のタイルを処理する。タイルは、ラスタ順に、すなわち左から右及び上から下に処理されてもよい。処理される最初のタイルは入力画像の左上のタイルであり、処理される最後のタイルは入力画像の右下のタイルである。このタイリングは、効率の目的で行なわれる。
図3は、図2のステップ210を詳細に示す。処理210は、入力デジタル画像のバンドを処理する。画像の1つのバンドは、多数の連続画像線である。各バンドの高さは、タイルの高さと同一であってもよい。従って、画像の最初の32本の線は1つのバンド、この場合は画像の第1のバンドを形成し、次の32本の画像線は次のバンドを形成する。各バンドの幅は、入力画像の幅であってもよい。判定ステップ310において、別のバンドが読み込まれる必要があるかを判定するためのチェックが行なわれる。現在のバンドの全てのタイルが処理された場合、別のバンドが読み込まれる必要がある。ステップ310が初めて実行される時にも別のバンドが読み込まれる必要がある。これは、この時点でバンドが読み込まれていないためである。ステップ310の結果がYesである場合、ステップ320に進む。Noである場合、ステップ340に進む。
カラーブロブ処理は、タイルラスタ順で動作する画像セグメント化アルゴリズムである。ブロブは、単一タイル内の同一量子化ラベルの画素の連結グループである。各ブロブは以下の統計値を有する。すなわち、画素のサイズ、中間色、バイナリマスク、ブロブ境界線の長さ及びバウンディングボックスを有する。その目的は、文書画像をオーバーラップしない連結成分のセットにセグメント化することである。この時、各連結成分はセマンティカリー(semantically)に関連した画素の連結セットを含む。例えば、特定のテキスト文字の画素のセットは1つの連結成分を形成し、テキストの周りの画像部分の画素は別の連結成分を形成するなどである。
色量子化の目的は、入力フルカラーを連結成分生成の準備のために減少した色セットに減少することである。ドミナントカラーを見つけるために、各入力画素は1度検査され、ヒストグラムが生成される。本発明の実施形態は、第1の次元である輝度を使用し且つ第2の次元である2つの色度成分を組み合わせるヒストグラムを採用する。これは、3つの色成分の軸に従ってビンを3つの次元に分割する従来の色ヒストグラムとは異なる。本発明の実施形態は、適切なドミナントカラーをより簡単に見つけることを助長するコンパクトなヒストグラムを生成する。ヒストグラムの特徴から、タイルは、均一、2レベル及び多色の3つの種類に分類される。パレットは、タイルの分類に依存してタイルに対して生成される。パレットの生成後、各画素は、画素がマップされるパレット色に従って量子化ラベルを割り当てられる。方法は、処理を高速にし且つメモリ要求を低くするように設計される。均一なタイルは、量子化ラベルを1つのみ有する。2レベルのタイルは、2つの量子化ラベルを有する。多色タイルは、最大4つの量子化ラベルを有する。
図40は、図11のステップ1110の処理を更に詳細に示す。入力フルカラータイルは、所定のマッピング方法により1パスで画素ラスタ順に指標付きマップに量子化される。図29(a)は、結果として得られる生成される指標付きマップ及び元の入力タイルの一例を示す。マッピングは、8つの輝度バンド及び4つのカラーコラムに編成される32個の色のビンに対して構成されてもよい。色の各ビンは、ビンに入れられる第1の画素のYUV値により設定される登録ID、画素カウンタ及び色累算器を有してもよい。所定のマッピング方法は、2Dヒストグラムの状態に応じて変更されてもよい。その結果、各ビンに対して所定の色は存在せず、画素の色の順序は第1のパレットの構成に影響を及ぼすだろう。最後に、空でない各ビンの平均色が第1のパレットを構成する。図29(c)は生成されるパレットを示し、図29(c)において、高階調部及び低階調部は空のビンを表す。
column = (|U - REF_U| + |V - REF_V|) * NORMALISING_FACTOR[band]
階調の色度値は、REF_U及びREF_Vに対して使用されてもよい(すなわち、8ビットのRBG入力データに対して、REF_U=128且つREF_V=128である)。各バンドに対するNORMALISING_FACTORは、各バンドをRGB色空間の4つのビンに正規化するために、選択したREF_U及びREF_Vを使用して事前に計算される。NORMALISING_FACTORは、表1の擬似コードを使用して生成される。
式中、MAX_BIN_ERROR[band]は、正規化因子を生成する上記擬似コードで規定されるように、各バンドにおけるmax_distの1/8である。
タイルの分類は、タイル内のドミナントカラーを見つける方法である。パレットの色の多様性及び分布に基づいて、タイルは、均一、2レベル及び多色の3つのグループに分類される。均一なタイルは、人間の目に対して視覚的に一定の色を有し、通常2Dヒストグラムにおいてクラスタを形成する。均一なパレットは最大3色を有し、色の多様性は小さい。2レベルのタイルは、2つの特有の色を有し、通常2Dヒストグラムにおいて垂直に並ぶ。2レベルのパレットは、いくつかの輝度バンドにわたる複数の色を有するが、各輝度バンドの色の多様性は小さい。多色タイルは、通常、2Dヒストグラムにおいて多数のビンに分散する。多色パレットは、最初の2つのテストを通過しないタイルを含む。
2.LumRnage <= 2
3.FlatColourVariance < FLAT_COLOUR_VARIANCE
式中、FlatColourVarianceは、最大のビンと残りのビンとの画素カウント加重マンハッタン距離の合計と定義される。閾値パラメータは、FLAT_COLOUR_VARIANCE=15であってもよい。
2.LumRnage > 2
3.MaxColourVariance < BILEVEL_COLOUR_VARIANCE
MaxColourVarianceは、max(ColourVariance[band])と定義され、ColourVariance[band]は、バンドの最大のビンと残りのビンとの画素カウント加重マンハッタン距離の合計である。パラメータ値は、BILEVEL_MAX_BIN_CNT=16且つBILEVEL_COLOUR_VARIANCE=40であってもよい。
図41は、図11のステップ1130の処理を更に詳細に示す。ステップ4110は、タイルが均一として分類されるかをテストする。タイルが均一である場合、ステップ4120は均一な色を形成する。これは、空でないビンの加重平均を計算することにより行なわれてもよい。ステップ4110のテスト結果がNoである場合、ステップ4130に進み、タイルが2レベルとして分類されるかをテストする。テスト結果がYesである場合、ステップ4140に移る。ステップ4140において、2色パレットが生成される。ステップ4130が偽を返す場合、ステップ4150に進む。ステップ4150において、多色パレットが生成される。
図42は、ステップ4140の2レベルのタイルに対する2色パレットの生成を更に詳細に提供する。その目的は、画像を表すために2つの対比色を見つけることである。印刷時の中間調及び登録エラーにより、通常、元の2つの対比色を表す色が汚染される。その結果、前景領域及び背景領域の平均色は、元の画像に対する適切な表現ではない。遷移領域の色を除外することにより、画像はより鮮明に見える。
図43は、多色タイルに対して多色パレットを生成する図41のステップ4150を詳細に示す。ステップ4310において、最も暗い色及び最も明るい色が選択され、初期ドミナントカラーとして初期パレットを形成する。ステップ4320において、以下の条件が双方とも真である場合、第3の色はパレットに追加される。
2.LargestVar > THIRD_COLOUR_MIN_VAR
LargestVarは、最も暗い輝度バンドと最も明るい輝度バンドとの間のビンの中で最も明るい色及び最も暗い色の中間色からの最大マンハッタン色距離と定義される。上記テストが真である場合、LargestVarを生成する色は初期パレットの第3の色として追加される。閾値は、THIRD_COLOUR_MIN_LD=4且つTHIRD_COLOUR_MIN_VAR=40であってもよい。
&&
(
minDist > BIN_MERGE_THRESHOLD2
‖
(
minDist > BIN_MERGE_THRESHOLD3
&&
(minDist * pCnt) > BIN_NEW_MIN
&&
pixel_count_closest_palette_colour > BIN_DONT_TOUCH_CNT
)
)
minDistは、パレットの色に対するCの最近接マンハッタン色距離である。pCntは、Cの画素カウントである。pixel_count_closest_palette_colourは、minDistを生成するパレットの色の画素カウントである。閾値は、MAX_NUM_PALETTE_COLOURS=4、BIN_MERGE_THRESHOLD2=70、BIN_MERGE_THRESHOLD3=40、BIN_NEW_MIN=4000且つBIN_DONT_TOUCH_CNT=150であってもよい。
ドミナントカラーが見つけられると、タイル内の画素はドミナントカラーの1つに量子化される。量子化マップは、連結成分解析のためにドミナントカラーリストと共に生成される。各グループに対する量子化処理は以下の通りである。
2)2レベル−パレットを2つのドミナントカラーのうちのいずれか一方に再マップするか、あるいは元の画素を2値化するために閾値を見つける
3)多色−パレットをドミナントカラーの1つに再マップする
2値化はより鮮明な輪郭を生成するが、適切な閾値を見つけることを必要とするため時間がかかる。閾値を見つけるステップは、1)輝度チャネルに対して1次微分を実行し、2)エッジ画素を識別し、3)エッジ画素からの平均輝度値を閾値として使用する。エッジ画素は、取り囲む3×3の1次微分の出力が全て予め定められた閾値を超える画素である。
図45は、ステップ4420の更なる詳細を提供する。処理4420全体は、量子化エラーチェックを使用して空でないビンを全て第2のパレットの2つの色にマップする。ステップ4510〜ステップ4570は、空でない各ビンに対して量子化及びエラーチェックを実行する。大きな量子化エラーが見つけられない場合、ビン量子化後、全ての画素を第2のパレットに再マップする。大きな量子化エラーが見つけられた場合、タイルは多色として分類され、多色タイルマッピングが行なわれる。2レベルのタイルのマッピングの詳細を以下に説明する。
‖
(
minDist > BIN_NEW_BILEVEL_COLOUR_DIFF
&&
pCnt > BIN_MERGE_BILEVEL_CNT_MIN
)
式中、閾値は、BIN_NEW_BILEVEL_THRESHOLD=6000、BIN_NEW_BILEVEL_COLOUR_DIFF=50且つBIN_MERGE_BILEVEL_CNT_MIN=100であってもよい。
&&
abs(D1 - D2) < BILEVEL_THRESHOLD_MERGIN
式中、閾値は、BILEVEL_THRESHOLD_MERGIN=16であってもよい。
図44のステップ4430は、図46に詳細に示される。ステップ4610は、次の空でないビンを取得する。ステップ4620は、ビンをパレットの色の1つに量子化する。これは、最近接マンハッタン色距離に基づいて行なわれてもよい。ステップ4630は、処理される空でないビンが更に存在するかをチェックする。ステップ4630のテストが真である場合、ステップ4610に進む。ステップ4630のテストがNoを返す場合、ステップ4640に進む。ステップ4640において、全ての画素は、ステップ4620のビットマッピングに従ってパレットの色の1つに再マップされる。その後、処理は終了する。
図10の処理1020は、先のステップから量子化タイルを得てブロブを形成する。各ブロブは以下の統計値を有する。すなわち、バウンディングボックス、サイズ、中間色、ビットマスク及びブロブ境界線の長さを有する。ブロブは、単一ラスタパスで高速に且つ効率的に形成される。同一の色クラスに属する量子化タイルの隣接する画素は、ラスタ順にグループ化され、「ラン」を形成する。各ラン(セグメント)の最後では、成長又はマージのために、ランが上側の行の接触するセグメントと(8方向連結性に関して)比較される。ブロブラベルを与えられる必要のあるランが同一クラスのブロブと接触している場合、成長が行なわれる。これに対して、同一クラスの2つのブロブが接触する時、マージは行なわれる。成長が不可能な場合、新しいブロブが形成される。ブロブ統計値は、各ランの最後で更新される。
2.2つのブロブに対する統計値を1つに統合することにより、2つのブロブをマージする
3.現在のセグメントを使用してブロブを初期化することにより、新しいブロブを形成する
タイル3640は、結果として得られるブロブであるブロブ0及びブロブ1を示す。ブロブ0は外側のバウンディングボックスを有し、ブロブ1は内側のバウンディングボックスを有する。ブロブの統計値は、ラン及びブロブが形成されるのと同時に累積される。従って処理段階が終了するまでに、各ブロブは、ブロブ0及びブロブ1に対して図36に示されるような全ての統計値を有する。ビットマスク3650及び3660は例である。図示されるビットマップ3650及び3660は、この時点では実際に形成されてない。量子化された色は、ブロブの中間色として使用される。あるいは、ブロブの中間色は、量子化された色ではなくブロブの実際の画素値を累積することにより判定されてもよい。これにより、より正確な中間色が与えられる。ブロブ統計値は、サイズ、中間色、境界線の長さ、バウンディングボックス及びビットマスクを含んでもよい。
図12は、ステップ930を更に詳細に示す。図12の処理は、図9のステップ920において識別されたように、現在のセグメントScを入力とする。ステップ1205において、変数kは1に初期化される。この値は、現在のセグメントScに連結される現在のタイルの行の上側のタイルの行のk番目のセグメントSkを示す。連結は、8方向連結であるのが好ましい。ステップ1210において、SkとScとの間で比較が実行される。判定ステップ1215において、Sc及びSkが同一クラスのセグメントであるかを判定するためのチェックが行なわれる。2つのセグメントSk及びScが同一の量子化ラベルを有する場合、ステップ1215からステップ1220に移る。同一の量子化ラベルを有さない場合、判定ステップ1235に進む。判定ステップ1220において、Skが同一クラスの第1の連結セグメントであるかを判定するためのチェックが行なわれる。SkがScである同一の量子化ラベルを有する第1の連結セグメントである場合、ステップ1225に進む。Skが第1の連結セグメントでない場合、ステップ1230に進む。ステップ1225において、現在のブロブが成長する。現在のセグメントは、k番目のセグメントが属するブロブ上で成長する。ブロブを成長させることは、ブロブのサイズ、境界線情報、バウンディングボックス及び累積されたYUV値を更新することを含む。その後、ステップ1235に進む。これに対して、判定ステップ1220が偽を返す場合、これは、現在のセグメントがblob[i]等のブロブラベルを既に割り当てられており、blob[j]等の別のブロブと接触することを示し、ステップ1230に進む。ブロブが異なるブロブラベルを有する場合、すなわちi(jである場合、それら2つのブロブはステップ1230でマージされる。ステップ1230のブロブマージ処理を図15に示す。その後、ステップ1235に進む。
図15は、ブロブマージ1500の一例を示す。セグメント1510及び1520はblob[i]に属し、blob[i]はblob[j]に属するセグメント1530に連結される。セグメント1520の現在の開始位置及び現在の終了位置は、セグメント1530に対する上側開始位置及び上側終了位置と同様に示される。また、セグメント1520及び1530のオーバーラップを図15に示す。ブロブマージ処理1500は、2つのブロブの統計値を組み合わせること、1つのブロブラベルを別のブロブラベルにマッピングすること及びブロブ数を1減少することを含む。図15の例の場合、ラベルjはラベルiにマップされる。以下の擬似コード命令は、ブロブ統計値を組み合わせるために使用される。
blob[i].size += blob[j].size
blob[i].tileBorderPixelCount += blob[j].tileBorderPixelCount
blob[i].horizontalEdges += blob[j].horizontalEdges - 2 * overlap
blob[i].verticalEdges += blob[j].verticalEdges
blob[i].YUV += blob[j].YUV
2.2.3.タイル内のマージ
タイルに対するブロブが連結成分解析により形成されると、次の段階では、色、サイズ及びブロブ境界線の長さの統計値を使用してセマンティカリー(semantically)に関連したブロブをマージする。この段階から先では、ブロブはマージのみされ、分割されない。従って、タイルは、過度のセグメント化レベルからセグメント化の現在のレベルに非常に近いレベルに移動する。図37及び図38は、タイル内のマージの一例を示す。ここで、ブロブ統計値は、ブロブの所定の対をマージするか否かを評価するのに使用される。この例において、4つの量子化色が存在し、連結成分解析は10個のブロブを返す。図37は、マージ前のブロブ3710を左側に示す。それらブロブの数は、残りの中間調パターン及び2つの別個の色領域間の色の「にじみ」の影響による。タイル内のマージの適用後、比較的長い境界線の長さを有する小さなブロブは、同様の色の特徴を有するより大きなブロブにマージされる。マージ後のブロブ3720は、例3700に示される。図38は、元のタイル3810とマージされたブロブ3820との比較3800を含む。
図13は、ステップ1040のタイル間のマージ処理を詳細に示す。この処理は、現在のタイルの左側境界線及び上側境界線の各々に対して順不同に繰り返される。以下の説明は、現在のタイルの左側境界線又は上側境界線に沿うマージに適用可能である。例えば、32×32のタイルは隣接タイルの状態を含む32画素の境界線を有し、各画素はブロブラベルを有する。隣接タイルの状態は32画素の境界線を有し、各画素はCCラベルを有する。従って、境界線に沿う各画素ステップに対して、ブロブラベルが現在のタイルに存在し且つ対応するCCラベルが隣接タイルの状態に存在する。ステップ1310において、次のタイル境界線画素に対する現在のタイルのブロブラベル及び隣接タイルの状態のCCラベルを取得することにより、共通の境界線に沿って処理が開始される。
図17によると、通常、各側にある1つの候補がマージするのに十分である時にCCラベル及びブロブラベルが同時に変化する場合を除いて、一方側に2つの候補が存在し且つ他方側に1つの候補が存在する場合にマージは行なわれる。これは、一方側にある2つの隣接する候補が他方側にある同一候補にマージすることを回避するためである。図17は条件を示し、タイル間マージ動作はその条件下で実行されてもよい。現在のCCカウント及びブロブカウントが(1,1)である場合、双方のラベルは行なわれるマージに対して同時に変化する必要がある。しかし、現在のCCカウント及びブロブカウントが(1,2)又は(2,1)である場合、行なわれるマージに対してはいずれかのラベルにおける変化で十分である。(2,2)となることはない。
図49は、ブロブ候補とCC候補との間のマージの図を提供する。以下の3つの典型的な例が存在する。i)4910において、各側は1つの候補のみを有する。ii)4920は1つのCC及び2つのブロブを有する。iii)4930は2つのCC及び1つのブロブを有する。例4920において、CC候補は2つのブロブ候補に連結される。双方のブロブはCCの色に近いが、一方のみがCCとマージされてもよいと仮定する。マージが1度に各側の1つの候補に対して上から下へ順に実行される場合、上側のブロブがCCとマージし、下側のブロブはマージされない。これは、下側のブロブがマージにより適した候補である可能性があるため、最も望ましい結果をもたらすわけではないことがある。従って、4920及び4930の例と同様の例の場合、一方側で2つの候補が必要とされる。例4910は、4連結に対して別のマージの組合せが存在しないため、各側に1つの候補を必要とするのみである。
図14は、図13のステップ1360を更に詳細に示し、ステップ1350で識別された最適なブロブ/CCの対を入力とする。処理はステップ1410で開始される。判定ステップ1410において、ブロブが別のCCと既にマージされているかを判定するためのチェックが行なわれる。判定ブロック1410において、識別されたブロブがCCラベルを既に割り当てられている場合、判定ブロック1440に進む。割り当てられていない場合、判定ブロック1420に移る。判定ブロック1420において、識別されたブロブ/CCの対の間のステップ1330で計算された色距離は、色マージ閾値と比較される。閾値の値は450でもよい。強制マージフラグが設定されている場合、閾値は900でもよい。色距離が閾値より小さい場合、ステップ1430に進む。閾値以上である場合、ステップ1460に進む。ステップ1430において、ブロブ及び識別されたCCはマージされる。これは、ブロブの統計値を使用してCCの統計値を更新し且つCCのラベルをブロブに割り当てることにより行なわれる。その後、処理は終了する。ステップ1460において、新しいCCが現在のブロブに対して形成される。その後、処理は終了する。
図18は、図14のステップ1450によるCCマッピング処理の結果を示す図である。図18は、CCのリンクされたリスト1850がCC1805、1810、1820、1830をマージした結果として形成できることを示す。この図において、CC(k)1830は、NULL1840を指し示すマップポインタ1832を有し、別のCCにマージされなかったことを示すため、ルートCCと呼ばれる。更に、ルートCCの統計値1834は、いくつかのマージを介して個別のCCの統計値を累積することにより判定される。例えば、CC1830の最終的な統計値は、CC(h)1805、CC(i)1810、CC(j)1820及びCC(k)1830がマージされる前のそれらCCの組合せ統計値である。統計値が組み合わされる順番は重要ではない。図18において、CC(i)1810はCC(j)1820を指し示し、CC(h)1805及びCC(j)1820はCC(k)1830を指し示す。
図50は、図10のマージの後処理ステップ1050を示すフローチャートである。ステップ5010において、図14のステップ1460と同様の処理で、新しいCCが現在のタイルのマージされていない各ブロブに対して形成される。ステップ5020において、ブロブの形状及び見えを格納する2値画像は、ブロブラベルを使用して出力される。n個のブロブを含むタイルの場合、n−1個の領域が取り出された後にn番目の2値画像が残りの領域として黙示的に格納されるため、n−1個の2値画像が出力される必要がある。従って、単一のブロブを含む均一のタイルは、2値画像の格納を必要としない。別の実施形態において、2値画像は指標マップとして単一のコンパクトなデータ構造に格納されてもよい。ここで、各画素位置は、ブロブ指標を有し且つlog2(n)ビットを使用して表される。例えば、タイル毎の最大ブロブ数が16である場合、各画素位置におけるブロブ指標は、4ビットの数字を使用して符号化される。更に別の実施形態において、2レベルのタイルに対する2値画像は、1ビットのビットマップを使用して格納されてもよい。ステップ5030において、現在のタイル内の各CCの接触リストが更新される。これは、そのタイルの隣接する全てのCCを識別することにより行なわれる。ステップ5040において、タイル状態が出力される。カラーセグメント化処理は、次の入力タイルとマージするためにブロブ及びCCの情報をコンパクトなタイル状態データ構造に格納する。上述のように、2つのタイル状態が存在する。ここで、左側タイル状態はタイルの右側のタイル境界線に沿ってCCラベル情報を有し、上側タイル状態はタイルの下側のタイル境界線に沿ってCCラベル情報を有する。
図25(a)は、3つ以上の量子化レベルに基づくセグメント化の利点を示す単純な例を示す。背景2510は黒色であり、その上に白色の三角形2520及び灰色の単語「text」の文字2530が配置される。通常、この画像の2値セグメント化の結果としては、図25(b)及び図25(c)に示すように、背景2510又は三角形2520とtext2530がマージされる。それらセグメント化のいずれも、テキスト領域を選択するために文書レイアウト解析に使用できない。すなわち、テキストの特徴が失われる。
レイアウト解析は、ページの前景内容が識別されるシステムの一部である。中間(レイアウト解析)モジュールは、連結成分のリスト及び「接触リスト」をフロントエンドモジュールからの入力とする。レイアウト解析の出力は、本質的に、スキャン済み画像の前景内容(例えば、テキスト、行、黒丸点)を表す連結成分に対する決定である。レイアウト解析は、2値画像ではなくカラーセグメント化に基づく。これは、見つけることが可能な前景オブジェクトの種類に関して多くの利点を有するが、2値画像に対しては存在した明確な包含階層が存在しない。効率に対しては、レイアウト解析は、グループ化の基となる連結成分に対するバウンディングボックス及び他のいくつかの一般的な統計値のみを使用する。レイアウト解析は、元の画素データ又はビットレベルのセグメント化に対するアクセス権を有さない。
図20は、ステップ110によりセグメント化されたCCのセットをグループ化する図4のステップ420を詳細に示す。処理は、ルートCCを取得することによりステップ2010で開始される。ルートCCは、カラーセグメント化段階中に別のCCにマージされなかったCCである。ステップ2020において、ルートCCの子CCが見つけられる。このルートCCに対する子CCのリストが形成される。子は、バウンディングボックスが現在のルートCCのバウンディングボックス内に完全に含まれ且つ境界線でルートCCのバウンディングボックスに接触するCCと定義されてもよい。ステップ2020については、図22と関連して更に詳細に説明する。
図22は、所定の親CCに対して子CCを見つけ且つ子のリストを形成するステップ2020を示す。ステップ2210において、接触CCが親CCの接触CCのリストから取得される。ステップ2220において、ルートCCが見つけられる。これは、接触CCと関連付けられたカラーセグメント化段階からのマージ情報を使用して行なわれる。判定ステップ2230において、図4のステップ410によるCCの分類は、CCがクラステストを満足するか(すなわち、このCCを子リストに格納するのが適切か)を判定するためにチェックされる。ノイズサイズのCC以外の全てのCCが格納されてもよいが、別の実施形態は、クラスの他の組合せ、例えばテキストである可能性があるCCのみを格納してもよい。接触CCのクラスが適切である場合、ステップ2240に進む。適切でない場合、ステップ2260に進む。判定ステップ2240において、CCは、親CCに対する包含のチェックが行なわれる。包含テストは、CCのバウンディングボックスが親CCのバウンディングボックスの範囲に完全に含まれることをチェックすることを含むが、別の方法も可能である。包含テストが満足される場合、ステップ2250に進む。ステップ2250において、CCは子のリストに含まれ、ステップ2260に進む。全てのCCは子のリストに1度だけ現れるべきであるため、ステップ2250は、CCがリストに含まれていないことをチェックすることを含む。このチェックは、ハッシュテーブルを使用して実行されてもよい。その後、判定ステップ2260に進む。ステップ2260は、親の接触リストに更なる要素が存在するかをテストする。存在する場合、ステップ2210に進む。存在しない場合、現在のCCに対する子のリストは完了し、処理は終了する。
図23は、図20のステップ2030からの隣接データを使用して実行される初期グループ化の図20のステップ2040を示す。この方法は、純粋にテキストをグループ化するように設計されてもよいが、別の実施形態においては、表等の他の文書オブジェクトを分類又はグループ化してもよい。初期グループ化は2パス処理であってもよく、第1のパスはCCをグループに結合し、第2のパスはグループを更に大きなグループに結合する。ステップ2305において、カウンタPASSは1に設定される。ステップ2310において、子が取得される。ステップ2320において、子の隣接CCが取得される。ステップ2330において、子及び隣接CCがグループ化テストを満足するかを判定するためのチェックが行なわれる。それらオブジェクトは、一連のテストを使用してグループ化のためにテストされる。テストは、初期分類、配置及び色に基づいてもよく、第1のパスと第2のパスとの間で異なる。以下に説明する図26は、文書の領域の抽出を説明する。図26を使用して、ステップ2320のグループ化テストを説明する。
2つの隣接するCCに対する好ましいグループ化テストを説明するために、図26は、文字「g」及び「h」の2つのオブジェクトのみを含む文書の領域からの単純な抽出を示す。破線は、各文字に対するバウンディングボックスの座標を表す。座標は、i番目のCCの左右のx座標及び上下のy座標に対してxl i、xr i、yt i及びyb iに位置付けられる。添え字1及び2は、1番目のCC及び2番目のCC(すなわち、文字「g」及び「h」)をそれぞれ示す。本実施形態の処理は、YUV空間の各CCの色[yi,ui,vi]、並びにバウンディングボックス(bounding boxes)の幅wi及び高さhiを更に使用する。
又は
[(dyov > 0)且つ(dxin/max(wmin, hmin) < TS)] (5)
閾値パラメータはTS=0.65であってもよい。
図21は、グループをチェックする図4のステップ430を詳細に示す。この処理は、各グループがテキストから構成されるか否かを判定する。この判定は、主にグループのオブジェクトが行又は列のどちらで位置合わされたかに基づいて行なわれる。グループは、テキストであると仮定され、テキストと同等のプロパティに対してテストされる。グループがそれらテストを通過しない場合、グループは拒否される。
図24は、図21のステップ2150を更に詳細に示す。このステップの間、グループのCCのサブセットは、文字と定義される。文字は、2120で推定された文字サイズの半分より大きく且つその文字サイズの2倍より小さいサイズを有するオブジェクトであってもよい。
図27(b)は、画像2700からセグメント化された部分の結果である不規則に配置されたバウンディングボックス2710、2712、2714の選択を示す。図27(b)は、ランダムに配置された連結成分を示す。図27(a)は、その画像に対するバウンディングボックスの底部の値のヒストグラム2720を示す。図27(d)は、連結成分を適切に位置合わせしたテキストグループに対するページ上のバウンディングボックス2740、2742の配置を示し、図27(c)は、対応するヒストグラム2730を示す。図示するように、テキストに対するヒストグラム2730は、値のいくつかの大きなクラスタを有するが、他方のヒストグラム2720は、より均等に分布した値を有する。ヒストグラムビン値の2乗和を尺度として使用すると、図27(a)は19の値を与え、図27(c)は47の値を与える。m=19及びn=13に対する上記受入れテストの右側の項は45である。従ってこのテストによると、図27(b)の画像データは拒否されるが、図27(d)のテキストデータは受け入れられる。あるいは、受入れテストは、平均カウントよりかなり大きいビンに存在する値の総数等の他の統計値に基づいてもよい。
バックエンドモジュールは、推定された背景色で前景領域をペイントすることにより、背景画像をより圧縮可能にするために修復を使用する。修復は、低解像度(例えば、150dpi)で背景画像に対して実行されるのが好ましい。修復アルゴリズムは、単一パスのタイルに基づくアルゴリズムであり、圧縮率を増加しようとする。各画素の色は、大きな領域に対して1つの平均色を使用するのではなく、左右にある周囲の画素から補間することにより選択される。
a.画素がマスクされていない場合、タイルのアクティビティを更新する。
b.画素がマスクされている場合、左右の最近接するマスクされていない画素の色から補間された色で画素をペイントする。
4)マスクされていない領域のアクティビティがある特定の閾値を下回る場合、マスクされていない画素の中間色でタイル全体をペイントする(これにより、ZLib圧縮されたJPEGで圧縮が向上する)。5)タイル全体がマスクされている場合、タイル全体を先のタイルの中間色でペイントする。上記ステップ2)は、にじみの影響を排除し、出力品質を鮮明にすると共に圧縮を向上させる。
図30は、図5のステップ520を詳細に示す。この処理は、背景から前景CCを除去し且つ可視アクティビティの低い画像タイルを均一化することにより、前景CCの圧縮率を向上し且つ鮮明度を増加するために、ダウンサンプルされた背景画像を変更する。前景CCを取り囲む小さな領域は、にじみの影響を除去して画像を強調し且つ圧縮率を向上するために修復される。
図31は、タイル前景ビットマスクを形成する図30のステップ3020を更に詳細に示す。ステップ3110において、タイルに対する初期ビットマスクが作成される。このビットマスクはタイルの幅と同一の幅であり、タイルより1行分高い。ビットマスクの最初の行が空白に設定された場合にタイルが文書の第1のバンドに存在しない限り、そのビットマスクの最初の行は上側タイルの最後の行と同一になるように設定される。これにより、修復された領域は、タイルの境界線に位置合わせされる下側エッジを有する前景CCの下方に拡張される。
図32は、図30のステップ3030を更に詳細に示す。各画素は、修復されるべき画素が見つけられるまでラスタ順に検査され、修復する画素のランの開始位置をマーク付けする。続く画素は、修復する画素のランの終了位置が見つけられるまで検査される。画素の水平ランは、修復ランの左右にある画素の色の間で線形補間された色でペイントされる。
図35は、いくつかの1次元修復の例を示す。画素強度が位置Xの関数としてグラフ化される場合、2つの例3510、3520に対して修復前後のグラフを提供する。第1の例3510において、修復する画素のランは完全にタイル内にあり、修復された画素値(斜線で示される)は、すぐ左右にある未修復の画素値の間で線形補間された値で置換される。修復された領域は、前景成分より僅かに大きく、にじみの影響を除去する。これは、拡張されたマスク領域として示される。各画素を修復する色は、左右のマスクされていない画素の色の間で補間することにより見つけられる。図35の第2の例3520において、修復する画素のランはタイルエッジ3530を横切る。左側のタイルを処理する場合、修復される画素の値は、すぐ左側にある未修復の画素の値で置換される。例3520の右側のタイルを処理する場合、修復された画素値は、この行に対する最後に記録された未修復の画素値と右側にある最初の未修復の画素値との間で線形補間された値に設定される。
図33は、図30のステップ3040を更に詳細に示す。判定ステップ3310において、全ての画素が修復されたかのチェックが行なわれる。特に、ステップ3220で記録されたような修復された画素数がチェックされる。タイルの全ての画素が修復された場合、タイルの可視領域は小さいと考えられ、ステップ3320に進む。ステップ3320において、現在のタイルの全ての画素は、ラスタ順に先のタイルの中間色にペイント(設定)される。これにより、JPEGのようなブロックに基づく圧縮技術が使用される場合、背景画像の圧縮率は非常に向上される。その後、処理は終了する。ステップ3310がタイルの全ての画素が修復されていないことを判定する場合、判定ステップ3330に進む。ステップ3330において、ステップ3220で測定されたような未修復の画素のアクティビティが所定の閾値に対してチェックされる。アクティビティがその閾値より小さいと分かった場合、再構成画像のタイルのアクティビティ可視領域は均一に近いと考えられる。この場合、ステップ3340に進み、タイルの未修復の可視画素の中間色でタイルの全ての画素をペイントすることにより、タイルは完全に均一化される。これにより、背景画像の圧縮率は非常に向上される。図33の処理は、ステップ3340の後に終了するか、あるいはタイルのアクティビティが閾値より大きいと分かった場合にはステップ3330の後に終了する。
図51は、本発明の第2の実施形態によるシステム5100を示す。システム5100は、パイプラインを処理する、異なる段階の間の効率的なデータフローを特徴とする。その設計は、メモリ帯域幅を大きく減少し、システム5100が高速に実行することを可能にする。
図52は、モジュール5125を詳細に示す。CCへのカラーセグメント化モジュール5125の構成要素は、逆ハーフトーン化モジュール5220を含む。逆ハーフトーン化モジュール5220は、タイル順に画素のストリームを利用し、インクジェットプリンタ等の印刷する中間調システムを使用して印刷されたデータをスキャンすることにより発生するアーティファクトを除去する。逆ハーフトーン化モジュール5220は、上述したソフトウェアによる実施形態のハードウェアによる実施形態である。このモジュールは、必要な速度を達成するために、スタティックRAM及びパイプライン処理を内部的に使用してもよい。
Cb = R * -0.1687 + G * -0.3313 + B * 0.5000
Cr = R * 0.5000 + G * -0.4183 + B * -0.0816
この四則演算は、変倍された固定小数点演算において実行され、モジュール5125の複雑性を減少し且つ速度を増加する。色変換モジュール5230からの出力は、ダウンスキャン(DownScanモジュール)5240及び連結成分解析モジュール5260の2つのモジュールに渡される。DownScanモジュール5240は、4つ(2×2の正方形)又は16個(4×4の正方形)の1セットの色を単純に平均し、各出力画素を形成する。DownScanモジュール5240から出力される画素は、ハードウェアのJPEG圧縮器5250により圧縮される。
本発明の実施形態による方法は、1つ以上の汎用コンピュータシステム、印刷装置及び他の適切な演算装置を使用して実現されてもよい。図1〜図52の任意の1つ以上の図を参照して説明された処理は、コンピュータシステム内で実行するアプリケーションプログラム又は印刷装置に組み込まれたアプリケーションプログラム等のソフトウェアとして実現されてもよい。ソフトウェアは、アプリケーションプログラム、オペレーティングシステム、手順、規則、データ構造及びデータを含む1つ以上のコンピュータプログラムを含んでもよい。命令は、各々が1つ以上の特定のタスクを実行する1つ以上のコードモジュールとして形成されてもよい。ソフトウェアは、例えば以下に説明される1つ以上の記憶装置を含むコンピュータ可読媒体に格納されてもよい。コンピュータシステムは、コンピュータ可読媒体からソフトウェアをロードし、そのソフトウェアを実行する。
本発明の実施形態は、コンピュータ及びデータ処理分野に適用可能である。上述は、本発明の実施形態に従ってデジタル画像を処理及び圧縮する少数の方法、装置及びコンピュータ可読媒体を説明しているだけであり、本発明の趣旨の範囲から逸脱せずに、それらに対して変形及び/又は変更を行なうことができる。それら実施形態は例であり、限定するものではない。
Claims (44)
- 複数の画素を含むデジタル画像をセグメント化する方法であって、
前記デジタル画像から複数の画素のブロックを生成するステップと、
1パスで前記画素のブロックを用いて、各ブロックに対して少なくとも1つの連結成分を作成するステップとを備え、前記作成するステップは、
各々が空間的に連結しかつセマンティカリーに関連する画素のグループを含む少なくとも1つの連結成分に、画素のブロックをセグメント化するステップと、
前記ブロックの少なくとも1つの連結成分を、先に処理された少なくとも1つの他のブロックからセグメント化された少なくとも1つの連結成分と、マージするステップと、
前記ブロックの前記連結成分の前記画像における配置をコンパクトな形式で格納するステップと、
備えることを特徴とする方法。 - 前記セマンティカリーに関連する画素は、同様の色を有する画素を含むことを特徴とする請求項1に記載の方法。
- 前記生成するステップは、
各々が予め定められた数の画素の連続的な線を含む複数のバンドに、前記デジタル画像を配置するステップと、
前記バンドを1つずつバッファリングし、処理するステップとを含み、当該処理するステップは、
現在のバンドを複数の画素のブロックに配置するステップと、
前記作成するステップに対して前記現在のバンドの前記ブロックを1つずつバッファリングし、処理するステップとを含み、当該配置するステップと、当該バッファリングし、処理するステップとの処理は現在バッファリングされている各バンドに対して実行されることを特徴とする請求項1に記載の方法。 - 前記格納するステップは、M−1個の2値ビットマップを格納するステップを含み、M個の連結成分はブロック内に存在し、Mは整数であることを特徴とする請求項1に記載の方法。
- 前記格納するステップは、指標マップを格納するステップを含むことを特徴とする請求項1に記載の方法。
- 前記セグメント化するステップは、
各ブロックに対していくつかの代表色を推定するステップと、
前記代表色に対して各ブロックを量子化するステップと、
各量子化ブロックから連結成分を形成するステップと、を含むことを特徴とする請求項1に記載の方法。 - 前記セグメント化するステップは、形成される前記連結成分のサブセットをマージするステップを更に含むことを特徴とする請求項6に記載の方法。
- 前記マージするステップは、前記連結成分の統計値を収集するステップを含むことを特徴とする請求項7に記載の方法。
- ノイズと考えられる前記形成された連結成分を除去するステップを更に含むことを特徴とする請求項8に記載の方法。
- 前記ノイズは予め定められた閾値を下回る画素カウント及び予め定められた他の閾値を上回る境界線長さ対画素カウント比を有する連結成分を含むことを特徴とする請求項9に記載の方法。
- 前記統計値は、バウンディングボックス、画素カウント、境界線長さ及び平均色のうち、少なくとも1つを含むことを特徴とする請求項8に記載の方法。
- 前記マージするステップは、
ブロックの連結成分を、左上にあるブロックの連結成分とマージするステップと、
前記マージした連結成分の前記統計値を更新するステップと、を備えることを特徴とする請求項8に記載の方法。 - 前記統計値は、バウンディングボックス、画素カウント、塗りつぶし率及び平均色のうち、少なくとも1つを含むことを特徴とする請求項12に記載の方法。
- 前記推定するステップは、
各ブロックの画素のYUVデータに基づいて複数の色のビンに関連するヒストグラムを形成するステップと、
ヒストグラム統計値に基づいて各ブロックを分類するステップと、
前記ブロックの分類に基づいて前記代表色を形成するためにビンの色をマージするステップと、を備えることを特徴とする請求項6に記載の方法。 - 1パスで各画素に対する指標マップを形成するステップを更に備えることを特徴とする請求項14に記載の方法。
- 前記量子化するステップは、
空でないビンを代表色に量子化するステップと、
前記代表色に対してビンマッピングを作成するステップと、
前記ビンマッピングを使用して前記指標マップを前記代表色に再マッピングするステップと、を備えることを特徴とする請求項15に記載の方法。 - 前記形成するステップは、
Y値に基づいて輝度バンドを決定するステップと、
U値及びV値に基づいてカラーコラムを決定するステップと、
前記マップされたビンに前記画素の色を累積するステップと、
前記マップされたビンの前記画素カウントを増分するステップと、を備えることを特徴とする請求項14に記載の方法。 - 輝度バンドを決定する前記ステップは、輝度バンドアンチエイリアシングを更に含むことを特徴とする請求項17に記載の方法。
- 前記カラーコラムを決定することは、カラーコラムアンチエイリアシングを更に含むことを特徴とする請求項17に記載の方法。
- 前記マージするステップは、
共通の境界線に沿う現在の連結成分に接触する連結成分のリストを検索するステップと、
マージするのに最も適した候補を決定するステップとを備え、当該検索するステップと、当該決定するステップとの処理は、左上の境界線に接触する現在のブロックの各連結成分に対して実行されることを特徴とする請求項12に記載の方法。 - 請求項1乃至20のいずれか1項に記載の方法に従って、複数の画素を含むデジタル画像をセグメント化するプロセッサと、メモリとを備えることを特徴とする装置。
- 請求項1乃至20のいずれか1項に記載の方法に従って、複数の画素を含むデジタル画像をセグメント化するためのコンピュータプログラムを記録したことを特徴とするコンピュータ可読媒体。
- カラー文書のコンパクトな表現を自動的に生成する方法であって、
1パスのブロックラスタ順にカラー文書ページのデジタル画像を連結成分にセグメント化するステップと、
前記ページ全体のコンパクトな連結成分統計値に基づくレイアウト解析を使用して、前記ページの前記デジタル画像を前景画像及び背景画像に区分するステップと、
前記前景画像の少なくとも一部が前記背景画像を隠蔽する場合に、前記背景画像の少なくとも一部を1パスのブロックラスタ順に修復するステップと、
コンパクトな文書を形成するために、前記前景画像及び前記背景画像を格納するステップと、
を備えることを特徴とする方法。 - 前記背景画像をダウンサンプリングするステップを更に備えることを特徴とする請求項23に記載の方法。
- 前記背景画像を圧縮するステップを更に備えることを特徴とする請求項23または24に記載の方法。
- 前記圧縮ステップは、不可逆的圧縮するステップを含むことを特徴とする請求項25に記載の方法。
- 前記不可逆的に圧縮された背景画像を圧縮するための異なるステップを更に含むことを特徴とする請求項26記載の方法。
- 請求項23乃至27のいずれか1項に記載の方法に従って、カラー文書のコンパクトな表現を自動的に生成するプロセッサと、メモリとを備えることを特徴とする装置。
- 請求項23乃至27のいずれか1項に記載の方法に従って、カラー文書のコンパクトな表現を自動的に生成するためのコンピュータプログラムを記録したことを特徴とするコンピュータ可読媒体。
- 複数の画素を含むデジタル画像を解析する方法であって、
前記デジタル画像をオブジェクトにセグメント化するステップであり、前記セグメント化が3つ以上のラベルにより表現されるステップと、
各オブジェクトに対してプロパティのセットを提供するステップと、
前記オブジェクトのサブセットに対して、境界線を共有する隣接するオブジェクト間に親子関係が存在するか判定するために包含の尺度を使用するステップと、
オブジェクトプロパティに基づいて、親を共有するオブジェクトのグループを形成するステップと、
プロパティのセット及びグループの形成に従ってオブジェクトを分類するステップと、を備えることを特徴とする方法。 - 前記包含は、各オブジェクトの周囲のバウンディングボックス及びオブジェクト間の接触関係を示す情報を用いて判定されることを特徴とする請求項30に記載の方法。
- 2つのオブジェクトが境界線で接触し且つオブジェクトのバウンディングボックスが他のオブジェクトのバウンディングボックスを完全に含む場合、前記オブジェクトは前記他のオブジェクトを含むことを特徴とする請求項31に記載の方法。
- 前記グループを形成するステップは、
共通の親の子リストから子オブジェクトの対を検索するステップと、
前記オブジェクトプロパティを使用して、各対がグループ化されるべきかを判定するステップと、を備えることを特徴とする請求項30に記載の方法。 - 同一の親を有する子オブジェクトのリストのうち隣接するオブジェクトのみがグループ化に対して検索されることを特徴とする請求項33に記載の方法。
- オブジェクトは、バウンディングボックス及び色情報に基づいてグループ化されることを特徴とする請求項33に記載の方法。
- オブジェクトのグループは、前記グループ内の前記オブジェクトのテキストと同様の品質のテストに従ってテキストとして分類されることを特徴とする請求項30に記載の方法。
- テキストと同様の品質の前記テストは、
前記オブジェクトの配置を表す各オブジェクトに対する単一の値を識別するステップと、
前記値のヒストグラムを形成するステップと、
前記ヒストグラムのプロパティによりテキストを識別するステップと、を含むことを特徴とする請求項36に記載の方法。 - 親子プロパティに関わらず、プロパティに従ってオブジェクトのテキスト分類されたグループに更なるオブジェクトを追加するステップを更に含むことを特徴とする請求項30に記載の方法。
- 文書ページの複数の画素を含むデジタル画像を解析する方法であって、
前記画像に基づいてオブジェクトを形成するために前記デジタル画像をセグメント化するステップと、
前記オブジェクトのグループを形成するステップと、
前記オブジェクトの前記グループの各々がテキストを表すか判定するステップとを備え、前記判定するステップは、
前記ページ上の前記オブジェクトの配置に依存して、各オブジェクトに対する単一の値を識別するステップと、
前記値のヒストグラムを形成するステップと、
前記ヒストグラムのプロパティによりテキストを識別するステップと、を含むことを特徴とする方法。 - 前記ヒストグラムの前記プロパティは、指定された数より多いオブジェクトを有する前記ヒストグラムのビンのオブジェクトの総数であることを特徴とする請求項39に記載の方法。
- 前記プロパティは、前記ヒストグラムのカウントの2乗和であることを特徴とする請求項39に記載の方法。
- 前記オブジェクトの前記配置を表す各オブジェクトに対する前記単一の値は、前記オブジェクトのバウンディングボックスのエッジであることを特徴とする請求項39に記載の方法。
- 請求項39乃至42のいずれか1項に記載の方法に従って、複数の画素を含むデジタル画像を解析するプロセッサと、メモリと、を備えることを特徴とする装置。
- 請求項39乃至42のいずれか1項に記載の方法に従って、複数の画素を含むデジタル画像を解析するためのコンピュータプログラムを記録したことを特徴とするコンピュータ可読媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AU2004242421A AU2004242421A1 (en) | 2004-12-21 | 2004-12-21 | Segmenting digital image and producing compact representation |
AU2004242421 | 2004-12-21 | ||
AU2004242419 | 2004-12-21 | ||
AU2004242419A AU2004242419A1 (en) | 2004-12-21 | 2004-12-21 | Analysing digital image of a document page |
PCT/AU2005/001926 WO2006066325A1 (en) | 2004-12-21 | 2005-12-20 | Segmenting digital image and producing compact representation |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2008524728A true JP2008524728A (ja) | 2008-07-10 |
JP2008524728A5 JP2008524728A5 (ja) | 2009-02-19 |
JP5008572B2 JP5008572B2 (ja) | 2012-08-22 |
Family
ID=36601261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007547088A Expired - Fee Related JP5008572B2 (ja) | 2004-12-21 | 2005-12-20 | 画像処理方法、画像処理装置およびコンピュータ可読媒体 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7991224B2 (ja) |
EP (1) | EP1831823B1 (ja) |
JP (1) | JP5008572B2 (ja) |
KR (1) | KR100926193B1 (ja) |
AT (1) | ATE501487T1 (ja) |
DE (1) | DE602005026862D1 (ja) |
WO (1) | WO2006066325A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015514519A (ja) * | 2012-11-02 | 2015-05-21 | アイロボット コーポレイション | 自律式カバレッジロボット |
KR20160009477A (ko) * | 2014-05-05 | 2016-01-26 | 시아오미 아이엔씨. | 화상 분할 방법, 장치, 프로그램 및 기록매체 |
US9633444B2 (en) | 2014-05-05 | 2017-04-25 | Xiaomi Inc. | Method and device for image segmentation |
Families Citing this family (85)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE602005026862D1 (de) * | 2004-12-21 | 2011-04-21 | Canon Kk | Segmentierung eines digitalen bildes und herstellung einer kompakten repräsentation |
US7831111B2 (en) * | 2005-10-31 | 2010-11-09 | Yahoo! Inc. | Method and mechanism for retrieving images |
US20070098257A1 (en) * | 2005-10-31 | 2007-05-03 | Shesha Shah | Method and mechanism for analyzing the color of a digital image |
US8630498B2 (en) | 2006-03-02 | 2014-01-14 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting pictorial regions in digital images |
US7792359B2 (en) | 2006-03-02 | 2010-09-07 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting regions in digital images |
US7889932B2 (en) | 2006-03-02 | 2011-02-15 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting regions in digital images |
US7916141B2 (en) * | 2006-04-10 | 2011-03-29 | Choi Kum-Young | Image processing system using vector pixel |
US8437054B2 (en) | 2006-06-15 | 2013-05-07 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying regions of substantially uniform color in a digital image |
US7864365B2 (en) | 2006-06-15 | 2011-01-04 | Sharp Laboratories Of America, Inc. | Methods and systems for segmenting a digital image into regions |
US7876959B2 (en) | 2006-09-06 | 2011-01-25 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text in digital images |
US7916924B2 (en) * | 2006-09-19 | 2011-03-29 | Primax Electronics Ltd. | Color processing method for identification of areas within an image corresponding to monetary banknotes |
JP4798077B2 (ja) * | 2007-06-27 | 2011-10-19 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理方法、画像処理装置、画像データ圧縮装置、およびコンピュータプログラム |
US7925089B2 (en) * | 2007-09-18 | 2011-04-12 | Microsoft Corporation | Optimization of multi-label problems in computer vision |
US8014596B2 (en) | 2007-10-30 | 2011-09-06 | Sharp Laboratories Of America, Inc. | Methods and systems for background color extrapolation |
US8472716B2 (en) * | 2007-12-05 | 2013-06-25 | Canon Kabushiki Kaisha | Block-based noise detection and reduction method with pixel level classification granularity |
AU2007237365B2 (en) * | 2007-12-05 | 2011-05-12 | Canon Kabushiki Kaisha | Colour reproduction in a colour document image |
US8532374B2 (en) * | 2007-12-05 | 2013-09-10 | Canon Kabushiki Kaisha | Colour document layout analysis with multi-level decomposition |
US8682029B2 (en) * | 2007-12-14 | 2014-03-25 | Flashfoto, Inc. | Rule-based segmentation for objects with frontal view in color images |
US8270483B1 (en) * | 2008-01-18 | 2012-09-18 | Maxim Integrated Products, Inc. | Method and apparatus for applying accurate parameter estimation and efficient fade detection in weighted prediction for video compression |
JP4952627B2 (ja) * | 2008-03-21 | 2012-06-13 | 富士通株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
US8571106B2 (en) * | 2008-05-22 | 2013-10-29 | Microsoft Corporation | Digital video compression acceleration based on motion vectors produced by cameras |
US8446463B2 (en) * | 2008-08-22 | 2013-05-21 | Genprime, Inc. | Apparatus, method and article to perform assays using assay strips |
JP5049921B2 (ja) * | 2008-08-26 | 2012-10-17 | キヤノン株式会社 | 画像処理装置及び画像処理方法 |
JP5049920B2 (ja) | 2008-08-26 | 2012-10-17 | キヤノン株式会社 | 画像処理装置及び画像処理方法 |
JP5049922B2 (ja) * | 2008-08-26 | 2012-10-17 | キヤノン株式会社 | 画像処理装置及び画像処理方法 |
US20100158376A1 (en) * | 2008-10-17 | 2010-06-24 | Klosterman Peter S | Systems and methods for labeling and characterization of connected regions in a binary mask |
US8351691B2 (en) * | 2008-12-18 | 2013-01-08 | Canon Kabushiki Kaisha | Object extraction in colour compound documents |
JP5153676B2 (ja) | 2009-02-10 | 2013-02-27 | キヤノン株式会社 | 画像処理装置、画像処理方法、プログラムおよび記憶媒体 |
AU2009201252B2 (en) * | 2009-03-31 | 2011-06-02 | Canon Kabushiki Kaisha | Colour correcting foreground colours for visual quality improvement |
JP5511468B2 (ja) | 2009-04-13 | 2014-06-04 | キヤノン株式会社 | 画像処理装置およびその制御方法、並びにプログラム |
JP5511467B2 (ja) | 2009-04-13 | 2014-06-04 | キヤノン株式会社 | 画像処理装置およびその制御方法、並びにプログラム |
TWI381321B (zh) * | 2009-04-30 | 2013-01-01 | Ind Tech Res Inst | 重組多張影像與辨識方法以及影像擷取與辨識系統 |
JP5276539B2 (ja) * | 2009-07-23 | 2013-08-28 | キヤノン株式会社 | 画像処理方法および画像処理装置およびプログラム |
US8670615B2 (en) * | 2009-09-30 | 2014-03-11 | Flashfoto, Inc. | Refinement of segmentation markup |
US9047674B2 (en) * | 2009-11-03 | 2015-06-02 | Samsung Electronics Co., Ltd. | Structured grids and graph traversal for image processing |
JP2011216080A (ja) * | 2010-03-18 | 2011-10-27 | Canon Inc | 画像処理装置、画像処理方法、および記憶媒体 |
US9311567B2 (en) | 2010-05-10 | 2016-04-12 | Kuang-chih Lee | Manifold learning and matting |
US20120159292A1 (en) * | 2010-12-16 | 2012-06-21 | Oce-Technologies B.V. | Method of processing an object-based image file with content type dependent image processing algorithms |
US9147264B2 (en) | 2011-02-23 | 2015-09-29 | Nvidia Corporation | Method and system for quantizing and squeezing base values of associated tiles in an image |
KR101767269B1 (ko) * | 2011-04-25 | 2017-08-10 | 한국전자통신연구원 | 영상 검색 장치 및 방법 |
JP5537492B2 (ja) * | 2011-05-12 | 2014-07-02 | 富士重工業株式会社 | 環境認識装置 |
JP5796392B2 (ja) * | 2011-07-29 | 2015-10-21 | ブラザー工業株式会社 | 画像処理装置、および、コンピュータプラグラム |
JP5776419B2 (ja) * | 2011-07-29 | 2015-09-09 | ブラザー工業株式会社 | 画像処理装置、画像処理プラグラム |
US9008356B1 (en) * | 2011-11-21 | 2015-04-14 | Google Inc. | Perceptually-driven representation for object recognition |
EP2807604A1 (en) | 2012-01-23 | 2014-12-03 | Microsoft Corporation | Vector graphics classification engine |
US9990347B2 (en) | 2012-01-23 | 2018-06-05 | Microsoft Technology Licensing, Llc | Borderless table detection engine |
WO2013110288A1 (en) * | 2012-01-23 | 2013-08-01 | Microsoft Corporation | Fixed format document conversion engine |
US8989493B1 (en) * | 2012-02-06 | 2015-03-24 | Marvell International Ltd. | Method and apparatus for identifying regions of an image to be filtered during processing of the image |
JP5974589B2 (ja) * | 2012-03-30 | 2016-08-23 | ブラザー工業株式会社 | 画像処理装置およびプログラム |
JP5958023B2 (ja) | 2012-03-30 | 2016-07-27 | ブラザー工業株式会社 | 画像処理装置および画像処理プログラム |
JP5935454B2 (ja) * | 2012-03-30 | 2016-06-15 | ブラザー工業株式会社 | 画像処理装置および画像処理プログラム |
JP6069923B2 (ja) * | 2012-07-20 | 2017-02-01 | セイコーエプソン株式会社 | ロボットシステム、ロボット、ロボット制御装置 |
JP5847062B2 (ja) * | 2012-11-27 | 2016-01-20 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
JP5847063B2 (ja) * | 2012-11-27 | 2016-01-20 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
US10158858B2 (en) * | 2012-12-27 | 2018-12-18 | Nvidia Corporation | Method and system for index compression for fixed block size texture formats and for non-linear interpolation of index values along an edge in a tile |
US9953008B2 (en) | 2013-01-18 | 2018-04-24 | Microsoft Technology Licensing, Llc | Grouping fixed format document elements to preserve graphical data semantics after reflow by manipulating a bounding box vertically and horizontally |
US9600869B2 (en) | 2013-03-14 | 2017-03-21 | Cyberlink Corp. | Image editing method and system |
US9190016B2 (en) | 2013-03-15 | 2015-11-17 | Valspar Sourcing, Inc. | Color-matching tool for virtual painting |
JP2014235452A (ja) * | 2013-05-30 | 2014-12-15 | 株式会社東芝 | 整形装置 |
US9042649B2 (en) * | 2013-09-24 | 2015-05-26 | Konica Minolta Laboratory U.S.A., Inc. | Color document image segmentation and binarization using automatic inpainting |
US9819969B2 (en) | 2013-11-26 | 2017-11-14 | Nvidia Corporation | Generalization of methods and systems for image compression while encoding at least one extra bit |
US9681135B2 (en) | 2014-03-14 | 2017-06-13 | Hfi Innovation Inc. | Method for palette table initialization and management |
CN105389776B (zh) | 2014-09-02 | 2019-05-03 | 辉达公司 | 图像缩放技术 |
JP6472279B2 (ja) * | 2015-03-09 | 2019-02-20 | キヤノン株式会社 | 画像処理装置及び画像処理方法 |
US9710157B2 (en) * | 2015-03-12 | 2017-07-18 | Lenovo (Singapore) Pte. Ltd. | Removing connective strokes |
US20160292275A1 (en) * | 2015-04-03 | 2016-10-06 | Apropose, Inc. | System and method for extracting and searching for design |
ES2550903B1 (es) * | 2015-07-15 | 2016-06-21 | Universidad De La Rioja | Procedimiento para la estimación automática de la porosidad del viñedo mediante visión artificial |
US9715624B1 (en) * | 2016-03-29 | 2017-07-25 | Konica Minolta Laboratory U.S.A., Inc. | Document image segmentation based on pixel classification |
US9846951B2 (en) | 2016-03-31 | 2017-12-19 | Konica Minolta Laboratory U.S.A., Inc. | Determining a consistent color for an image |
JP6173542B1 (ja) * | 2016-08-10 | 2017-08-02 | 株式会社Pfu | 画像処理装置、画像処理方法、および、プログラム |
US10576475B2 (en) | 2016-09-15 | 2020-03-03 | Genprime, Inc. | Diagnostic assay strip cassette |
US11205103B2 (en) | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
US10635927B2 (en) | 2017-03-06 | 2020-04-28 | Honda Motor Co., Ltd. | Systems for performing semantic segmentation and methods thereof |
US10453221B2 (en) * | 2017-04-10 | 2019-10-22 | Intel Corporation | Region based processing |
CN108345893B (zh) * | 2018-03-15 | 2021-01-26 | 京东方科技集团股份有限公司 | 一种直线检测方法、装置、计算机存储介质及终端 |
CN110796133B (zh) * | 2018-08-01 | 2024-05-24 | 北京京东尚科信息技术有限公司 | 文案区域识别方法和装置 |
CA3114255C (en) * | 2018-09-25 | 2023-08-22 | Element Ai Inc. | Automatically detecting and isolating objects in images |
US11195308B2 (en) * | 2018-12-05 | 2021-12-07 | Sony Group Corporation | Patcher tool |
WO2020174447A1 (en) * | 2019-02-28 | 2020-09-03 | Tata Consultancy Services Limited | Multi-label placement for augmented and virtual reality and video annotations |
CN111918065A (zh) * | 2019-05-08 | 2020-11-10 | 中兴通讯股份有限公司 | 一种信息压缩/解压缩方法及装置 |
US11605177B2 (en) | 2019-06-11 | 2023-03-14 | Cognex Corporation | System and method for refining dimensions of a generally cuboidal 3D object imaged by 3D vision system and controls for the same |
US11335021B1 (en) * | 2019-06-11 | 2022-05-17 | Cognex Corporation | System and method for refining dimensions of a generally cuboidal 3D object imaged by 3D vision system and controls for the same |
US11501550B2 (en) | 2020-11-24 | 2022-11-15 | International Business Machines Corporation | Optical character recognition segmentation |
US11330149B1 (en) * | 2021-01-15 | 2022-05-10 | Konica Minolta Business Solutions U.S.A., Inc. | Finding the page background color range |
CN116704048B (zh) * | 2023-08-09 | 2023-11-17 | 四川元祉智慧科技有限公司 | 一种双光配准方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57187778A (en) * | 1981-05-12 | 1982-11-18 | Omron Tateisi Electronics Co | Pattern extracting method |
JPS61243569A (ja) * | 1985-04-19 | 1986-10-29 | Fujitsu Ltd | デイジタル画像領域へのラベル付け方式 |
JPS6261175A (ja) * | 1985-09-12 | 1987-03-17 | インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション | 画素の連結性を解析する装置 |
JPS63217479A (ja) * | 1987-03-06 | 1988-09-09 | Hitachi Ltd | 粒子画像の解析装置 |
JPH05165955A (ja) * | 1991-12-13 | 1993-07-02 | Sony Corp | 画像処理方法 |
JP2000172849A (ja) * | 1998-12-09 | 2000-06-23 | Fujitsu Ltd | 画像処理装置及びパターン抽出装置 |
US20020122175A1 (en) * | 2001-01-10 | 2002-09-05 | Dance Christopher R. | Document optimized reconstruction of color filter array images |
JP2003173442A (ja) * | 2001-12-06 | 2003-06-20 | Nec Corp | 多次元画像をセグメント化する方法およびコンピュータシステム |
JP2003348361A (ja) * | 2002-05-22 | 2003-12-05 | Canon Inc | 画像処理装置 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5321770A (en) * | 1991-11-19 | 1994-06-14 | Xerox Corporation | Method for determining boundaries of words in text |
US5384864A (en) | 1993-04-19 | 1995-01-24 | Xerox Corporation | Method and apparatus for automatic determination of text line, word and character cell spatial features |
EP0811946A3 (en) * | 1994-04-15 | 1998-01-14 | Canon Kabushiki Kaisha | Image pre-processor for character recognition system |
US5751859A (en) * | 1995-06-14 | 1998-05-12 | Lucent Technologies Inc. | Compression of text images by soft pattern matching |
JPH1051642A (ja) | 1996-07-31 | 1998-02-20 | Fuji Xerox Co Ltd | 画像処理装置 |
JP4170441B2 (ja) | 1997-11-28 | 2008-10-22 | 富士通株式会社 | 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体 |
AUPP444898A0 (en) | 1998-07-02 | 1998-07-23 | Canon Kabushiki Kaisha | A method and apparatus for boundary filtering a digital image |
JP2000163594A (ja) | 1998-11-30 | 2000-06-16 | Canon Inc | 画像パタ―ン検出方法及び装置 |
NL1015943C2 (nl) * | 2000-08-16 | 2002-02-19 | Ocu Technologies B V | Interpretatie van gekleurde documenten. |
US6782126B2 (en) * | 2001-02-20 | 2004-08-24 | International Business Machines Corporation | Method for combining feature distance with spatial distance for segmentation |
US7432940B2 (en) | 2001-10-12 | 2008-10-07 | Canon Kabushiki Kaisha | Interactive animation of sprites in a video production |
US7027647B2 (en) | 2001-12-31 | 2006-04-11 | Hewlett-Packard Development Company, L.P. | Coder matched layer separation for compression of compound documents |
US7392472B2 (en) | 2002-04-25 | 2008-06-24 | Microsoft Corporation | Layout analysis |
US7120297B2 (en) * | 2002-04-25 | 2006-10-10 | Microsoft Corporation | Segmented layered image system |
US7227893B1 (en) * | 2002-08-22 | 2007-06-05 | Xlabs Holdings, Llc | Application-specific object-based segmentation and recognition system |
US20040096102A1 (en) * | 2002-11-18 | 2004-05-20 | Xerox Corporation | Methodology for scanned color document segmentation |
US7272258B2 (en) * | 2003-01-29 | 2007-09-18 | Ricoh Co., Ltd. | Reformatting documents using document analysis information |
AU2003903445A0 (en) | 2003-06-26 | 2003-07-17 | Canon Kabushiki Kaisha | Optimising compositing calculations for a run of pixels |
US7280120B2 (en) | 2003-06-26 | 2007-10-09 | Canon Kabushiki Kaisha | Compositing with a sub-pixel mask in graphic object rendering |
AU2003903447A0 (en) | 2003-06-26 | 2003-07-17 | Canon Kabushiki Kaisha | Rendering successive frames in a graphic object system |
US7586647B2 (en) | 2004-07-29 | 2009-09-08 | Canon Kabushiki Kaisha | Halftone detection and removal |
DE602005026862D1 (de) * | 2004-12-21 | 2011-04-21 | Canon Kk | Segmentierung eines digitalen bildes und herstellung einer kompakten repräsentation |
-
2005
- 2005-12-20 DE DE602005026862T patent/DE602005026862D1/de active Active
- 2005-12-20 US US11/720,059 patent/US7991224B2/en active Active
- 2005-12-20 JP JP2007547088A patent/JP5008572B2/ja not_active Expired - Fee Related
- 2005-12-20 AT AT05818582T patent/ATE501487T1/de not_active IP Right Cessation
- 2005-12-20 EP EP05818582A patent/EP1831823B1/en not_active Not-in-force
- 2005-12-20 WO PCT/AU2005/001926 patent/WO2006066325A1/en active Application Filing
- 2005-12-20 KR KR1020077015120A patent/KR100926193B1/ko active IP Right Grant
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57187778A (en) * | 1981-05-12 | 1982-11-18 | Omron Tateisi Electronics Co | Pattern extracting method |
JPS61243569A (ja) * | 1985-04-19 | 1986-10-29 | Fujitsu Ltd | デイジタル画像領域へのラベル付け方式 |
JPS6261175A (ja) * | 1985-09-12 | 1987-03-17 | インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション | 画素の連結性を解析する装置 |
JPS63217479A (ja) * | 1987-03-06 | 1988-09-09 | Hitachi Ltd | 粒子画像の解析装置 |
JPH05165955A (ja) * | 1991-12-13 | 1993-07-02 | Sony Corp | 画像処理方法 |
JP2000172849A (ja) * | 1998-12-09 | 2000-06-23 | Fujitsu Ltd | 画像処理装置及びパターン抽出装置 |
US20020122175A1 (en) * | 2001-01-10 | 2002-09-05 | Dance Christopher R. | Document optimized reconstruction of color filter array images |
JP2003173442A (ja) * | 2001-12-06 | 2003-06-20 | Nec Corp | 多次元画像をセグメント化する方法およびコンピュータシステム |
JP2003348361A (ja) * | 2002-05-22 | 2003-12-05 | Canon Inc | 画像処理装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015514519A (ja) * | 2012-11-02 | 2015-05-21 | アイロボット コーポレイション | 自律式カバレッジロボット |
KR20160009477A (ko) * | 2014-05-05 | 2016-01-26 | 시아오미 아이엔씨. | 화상 분할 방법, 장치, 프로그램 및 기록매체 |
KR101670004B1 (ko) * | 2014-05-05 | 2016-10-27 | 시아오미 아이엔씨. | 화상 분할 방법, 장치, 프로그램 및 기록매체 |
US9633444B2 (en) | 2014-05-05 | 2017-04-25 | Xiaomi Inc. | Method and device for image segmentation |
Also Published As
Publication number | Publication date |
---|---|
US20080123945A1 (en) | 2008-05-29 |
JP5008572B2 (ja) | 2012-08-22 |
EP1831823A1 (en) | 2007-09-12 |
KR100926193B1 (ko) | 2009-11-09 |
EP1831823B1 (en) | 2011-03-09 |
EP1831823A4 (en) | 2009-06-24 |
DE602005026862D1 (de) | 2011-04-21 |
ATE501487T1 (de) | 2011-03-15 |
KR20070091178A (ko) | 2007-09-07 |
WO2006066325A1 (en) | 2006-06-29 |
US7991224B2 (en) | 2011-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5008572B2 (ja) | 画像処理方法、画像処理装置およびコンピュータ可読媒体 | |
US6807304B2 (en) | Feature recognition using loose gray scale template matching | |
US9135722B2 (en) | Perceptually lossless color compression | |
US7343046B2 (en) | Systems and methods for organizing image data into regions | |
US5778092A (en) | Method and apparatus for compressing color or gray scale documents | |
JP4667062B2 (ja) | 画像解析装置、画像解析方法、及びブロブ識別装置 | |
US6556711B2 (en) | Image processing apparatus and method | |
US6993185B2 (en) | Method of texture-based color document segmentation | |
US8417029B2 (en) | Image processing apparatus and method, including fill-up processing | |
JP3353968B2 (ja) | 画像処理装置 | |
US7298900B2 (en) | Image processing method, image processing apparatus and image processing program | |
Chen et al. | Decompose algorithm for thresholding degraded historical document images | |
KR101150901B1 (ko) | 위성영상을 이용한 객체기반 분석을 위한 자동 영상분할 방법 | |
JP2000132690A (ja) | ト―クン化によるイメ―ジ分割を用いたイメ―ジ処理方法および装置 | |
US20020076107A1 (en) | Document image segmentation using loose gray scale template matching | |
US6360006B1 (en) | Color block selection | |
JP4441300B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体 | |
CN114549649A (zh) | 一种基于特征匹配的扫描地图点符号的快速识别方法 | |
Fateh et al. | Color reduction in hand-drawn Persian carpet cartoons before discretization using image segmentation and finding edgy regions | |
CN100543766C (zh) | 图像分段方法、紧凑表示产生方法、图像分析方法及装置 | |
AU2005211628A1 (en) | Processing digital image | |
AU2004242421A1 (en) | Segmenting digital image and producing compact representation | |
AU2004242418A1 (en) | Generating compressed output representation | |
Chang et al. | Using color variation to mimic human visual perception for color image quantization | |
Xingyuan et al. | Skeletonizing by compressed line adjacency graph in two directions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081222 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120305 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120525 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120529 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5008572 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150608 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |