JP2005228342A - 走査された書類の区分方法及びシステム - Google Patents

走査された書類の区分方法及びシステム Download PDF

Info

Publication number
JP2005228342A
JP2005228342A JP2005036118A JP2005036118A JP2005228342A JP 2005228342 A JP2005228342 A JP 2005228342A JP 2005036118 A JP2005036118 A JP 2005036118A JP 2005036118 A JP2005036118 A JP 2005036118A JP 2005228342 A JP2005228342 A JP 2005228342A
Authority
JP
Japan
Prior art keywords
value
signal
edge
pixel
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005036118A
Other languages
English (en)
Other versions
JP4680622B2 (ja
Inventor
Donald J Curry
ジェイ.カリー ドナルド
Asghar Nafarieh
ナファリエ アスガー
Doron Kletter
クレター ドロン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2005228342A publication Critical patent/JP2005228342A/ja
Application granted granted Critical
Publication of JP4680622B2 publication Critical patent/JP4680622B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20004Adaptive image processing
    • G06T2207/20012Locally adaptive
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20192Edge enhancement; Edge preservation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

【課題】 文書を多重フォアグランド面を有する混合ラスターコンテンツフォーマットに変換するための方法及び装置を提供する。
【解決手段】本発明の方法及びシステムは、画像データを受け取り対象ピクセル周囲のウィンドウ内で従属最小値及び従属最大値を生成する従属最小・最大モジュールを有する。従属最小値及び従属最大値に基づき、動的閾値モジュールが例えばブロブ識別に適した連続性データ及び強調化データを発生する。
【選択図】 図3

Description

本発明は、複数のフォアグランド面を有するコンテンツフォーマットへの画像データの変換に関する。
従来、画像圧縮の手段として、フォアグランド、バックグランド、及びマスク層の3層に画像を分割する方法(3層混合ラスターコンテンツ分解フォーマット)が開発されている。しかし、PDFなどの画像ドキュメントフォーマットは、ラスターイメージをそのような3層に分割することに対応していない。そのため、画像の修正ができないか、できたとしても不要なアーティファクト(人工生成物)が発生するという問題があった。
米国特許第6,633,670号公報
上記問題を解決するため、本発明は文書(ドキュメント)を多重フォアグランド面を有する混合ラスターコンテンツフォーマットに変換するための方法及び装置を提供することを目的とする。
本発明の方法は、エッジ連続性ピクセルデータを生成する方法に於いて、ピクセルの第一近傍の最大輝度値及び最小輝度値に基づいてピクセルをエッジピクセルと識別する工程と、最大輝度値及び付随するクロマ値と最小輝度値及び付随するクロマ値とのドット積に基づいてエッジピクセルの極性値を設定する工程と、を有することを特徴とする。
図1は三層混合ラスターコンテンツ画像データを示す。
図3は三層画像データ生成システム1000を示す。
図4は図3に示すセグメントモジュール1600の詳細を示す。
を示す。
図5はN層画像データ生成システム2000を示す。N層画像データ生成システム2000はスキャナ信号SRCを信号線2010を介してスキャナカラー変換モジュール2100に入力する。スキャナカラー変換モジュール2100はスキャナカラー変換信号SCCを信号線2110を介してスクリーン推定モジュール2200及びデスクリーンモジュール2300に出力する。スクリーン推定モジュール2200はスクリーン推定周波数信号SCFを信号線2210を介してデスクリーンモジュール2300に出力し、またスクリーン推定強度信号SCMを信号線2220を介してデスクリーンモジュール2300及びスケールモジュール2400に出力する。デスクリーンモジュール2300はボケ信号信号(blur signal)BLRを信号線2310を介して統計モジュール3100に出力すると共にデスクリーン化画像データ信号DSCを信号線2320を介してスケールモジュール2400に出力する。スケールモジュール2400はスケール化スクリ−ン強度信号SMSを信号線2410を介してセグメントモジュール2600に出力すると共にスケール化スクリ−ン化画像データ信号DSSを信号線2420を介してガマット(Gamut)強調モジュール2500に出力する。ガマット強調モジュール2500はガマット強調化画像データ信号GMEを信号線2510を介してセグメントモジュール2600に出力する。
図6は図5に示すN層画像データ生成システム2000のセグメントモジュール2600の例示的態様を詳細に示す。ガマット強調化画像データ信号GMEは信号線2510を介して従属最小−最大モジュール2610及び動的閾値モジュール2620に入力される。同様にスケール化スクリ−ン強度信号SMSは、存在する場合には、信号線2410を介して動的閾値モジュール2620に入力される。
従属最小−最大モジュール2610は最大値信号MAX及び最小値信号MINを一対の信号線2611,2612を介してそれぞれ動的閾値モジュール2620及びエッジ強調モジュール2650に出力する。動的閾値モジュール2620は強調化画像データ信号Enhを信号線2621を介してエッジ強調モジュール2650に出力し、また原グレースケールセレクタ信号Grrを信号線2622を介して量子化モジュール2640に出力する。
測定された従属最大値及び最小値、MAX及びMINは、従属最小−最大モジュール2610によって現在対象のピクセルの周囲の近傍の領域、例えば7×7ピクセルウィンドウ中で測定される。現在の対象ピクセルの従属最大値はウィンドウ内で最大輝度を有するピクセルの画像値である。従属最小値はウィンドウ内で最小輝度を有するピクセルの画像値である。MAX及びMIN信号のクロマ値は通常は最大値又は最小値処理には含まれず、所定のウィンドウ領域内で最大又は最小輝度値を有する画像ピクセルの対応するクロマ値を示す(従って“従属”と呼ばれる)。一般に、従属最大値及び最小値信号MAX,MINは適当な色空間の直交三軸に対応する24ビット3成分ベクトル信号である。
動的閾値モジュール2620は識別されたピクセルの画像値を使用してガマット強調化画像データ信号GMEに適応的に閾値を適用する。特に動的閾値モジュール2620は対象ピクセルに対して従属閾値と従属規格化値を決定する。従属閾値は様々な例示的態様のうち対象ピクセルのMAX,MIN値の平均又は中央値として決定され、また従属規格化値は様々な例示的態様のうち対象ピクセルのMAX,MIN値の差として決定される。
種々の例示的態様に於いて、動的閾値モジュール2620及び量子化モジュール2640は、ガマット強調化画像データ信号GME及び従属最大値及び最小値信号、MAX及びMINを入力して三値(tri−state)エッジ連続性信号TECを出力する単一のモジュールとして結合できる。
かかる例示的態様に於いては、従属規格化信号の絶対値がコントラスト閾値と比較される。従属規格化信号の絶対値がコントラスト閾値より小さい場合、現在の対象ピクセルについての三値エッジ連続性信号TECは0に設定される。従属規格化信号の絶対値がコントラスト閾値より大きいかこれと等しい場合、現在の対象ピクセルについての三値エッジ連続性信号TECは、現在の対象ピクセルについてのガマット強調化画像データ信号GMEが動的閾値より大きいか小さいかに応じて、+1または−1に設定される。
量子化モジュール2640は8ビットの原グレースケールセレクタ信号Grrを三値エッジ連続性信号TECに変換し、これは信号線2641を介してブロブ(blob)識別モジュール2700に出力される。2ビットの三値エッジ連続性信号はまた信号線2642を介してセレクタエッジ抽出信号SEEとしてエッジ強調モジュール2650に出力される。エッジ強調モジュールはまた強調化レベル信号ENLを信号線2631を介して、またガマット強調化画像データ信号GMEを信号線2510を介して入力する。エッジ強調モジュール2650はこれらすべての入力信号に基づいてカラー強調化画像データ信号ENHを、図5に示す如く、信号線2656を介してブロブ識別モジュール2700及びブロブマッピング・クラスターモジュール2800の両方に出力する。
上記に概略を説明されたように量子化モジュール2640は8ビットの原グレースケールセレクタ信号Grrを信号線2622を介して入力し、この8ビット信号を2ビットの3状態値信号TECに変換する。表1は−128から+127迄のGrr値が信号線2641を介して出力される三値エッジ連続性信号TECと信号線2642を介してエッジ強調モジュール2650に出力される信号EEEとにどのように変換されるかを示す。
Figure 2005228342
表1に示す如く、三値エッジ連続性信号TECは三種の値、即ち−1、0、+1を有する。三値エッジ連続性信号TECがスキャナの解像力を有する場合、セレクタエッジ抽出信号EEEはTECと同じ値を有する。TECの記号解釈には三値エッジ連続性信号TECの値、−1、0、+1の代わりにL,0,Hが使用される。表1に示す如く、三値エッジ連続性信号TEC及びセレクタエッジ抽出信号EEEの0値は原グレースケールセレクタ信号Grrでの弱いエッジ又はエッジ無しに、即ちGrr信号値の[−1から+1]の範囲全てに対応する。これに対し、原グレースケールセレクタ信号Grrで+1より大きい値を有する強いエッジは三値エッジ連続性信号TEC及びセレクタエッジ抽出信号EEEの+1(または“H”)に変換される。さらに原グレースケールセレクタ信号Grrで−1より小さい値を有する強い負エッジは三値エッジ連続性信号TEC及びセレクタエッジ抽出信号EEEの−1(または“L”)にマッピングされる。図7に詳細を示すエッジ強調モジュール2650はセレクタエッジ抽出信号EEEの値H、0,Lを使用して各カラー信号GME,MAX及びMINのいずれを強調化画像データ信号ENHとして出力するかを決定する。
図7は図6に示すエッジ強調モジュール2650を図示する。エッジ強調モジュール2650は第一及び第二内挿モジュール2651、2653及びマルチプレクサ2655とを有する。第一内挿モジュール2651は従属最大値信号MAXを信号線2611を介して、またガマット強調化画像データ信号GMEを信号線2510を介して、また強調化レベル信号ENLを信号線2631を介して強調化レベルメモリー2630から入力する。これに対して第二内挿モジュール2653は従属最小値信号MINを信号線2612を介して、またガマット強調化画像データ信号GMEを信号線2510を介して、また強調化レベル信号ENLを信号線2631を介して入力する。第一及び第二内挿モジュール2651,2653はガマット強調化画像データ信号GMEから、ガマット強調化画像データ信号GMEを各ピクセルごとに明るく又は暗くしてエッジ強調化画像データを生成する。特に第一内挿モジュール2651は各ピクセルごとにより明るいエッジ強調化画像データEHを:
EH=[GME+(MAX−GME)(ENL/256)] (1)
として生成する。これに対して、第二内挿モジュール2653は各ピクセルごとにより暗いエッジ強調化画像データELを:
EL=[GME+(MIN−GME)(ENL/256)] (2)
として生成する。
明及び暗画像データ信号EH、ELのそれぞれはガマット強調化画像データ信号GMEと共にマルチプレクサ2655に出力される。マルチプレクサ2655はまた三値エッジ連続性信号TECをセレクタエッジ抽出信号EEEとして入力する。
マルチプレクサ2655はセレクタエッジ抽出信号EEEを制御信号として使用して、各ピクセルごとに、元のガマット強調化画像データ信号GMEと明または暗画像データ信号EHまたはELとの選択を行う。ふたたび表1を参照すると、セレクタエッジ抽出信号EEEのH値は信号EHを選択するために使用され、セレクタエッジ抽出信号EEEのL値は信号ELを選択するために使用される。セレクタエッジ抽出信号EEEの0値はガマット強調化画像データ信号GMEを選択するために使用される。信号EEEの値に基づいて、マルチプレクサ2655は信号EH、ガマット強調化画像データ信号GME及び信号ELのうち選択された一つを強調化画像データ信号ENHとして信号線2656を介して出力する。
信号線2656に出力された強調化画像データ信号ENHは、強い正エッジが存在する場合には、元のガマット強調化画像データ信号と比べて明るくされ、強い負エッジが存在する場合には、元のガマット強調化画像データ信号GMEと比べて暗くされる。また強い正エッジまたは強い負エッジが存在せず、或いはせいぜい弱いエッジが存在する場合には、元のガマット強調化画像データ信号GMEが出力されて強調化は行われない。
図8は信号線2631を介して第一及び第二内挿モジュール2651及び2653に入力される強調化レベル信号ENLの効果を示す。元のガマット強調化画像データ信号GMEについては、図8に斜線ハッチングで示す如く、強調化レベル信号ENLの値が50%或いは8ビット信号について128の場合、閾値2601より下の値は最小値2614に向かって移動されるが最大限部分的であり、他方閾値2601より上の値は最大値2616に向かって部分的に移動されて50%強調化信号320を生じる。これに対し、上記の二式に用いられて値1を有する分数部ENL/256を生じる100%強調化信号に於いては、元のガマット強調化画像データ信号GMEの値は完全に最小値2614に移動され、また閾値2610より大きい値は全て最大値2616に移動される。これは、上記二式に於いて、分数部ENL/256が1の場合、二式におけるガマット強調化画像データ信号GMEの値は打ち消され、二式において従属最大値信号MAX及び従属最小値信号MINのみが残るためである。
図9は図5に示すN層画像データ発生システム2000に使用しうる他のセグメントモジュール2600’を示す。セグメントモジュール2600’はボケフィルター4010,従属最小−最大モジュール4020、動的閾値モジュール4030、三値エッジ連続性フィルター4040及びエッジ強調モジュール4050を有する。セグメントモジュール2600’はガマット強調化画像データ信号GME又はスケール化スクリ−ン強度信号SMSを受け取らない。その代わりにセグメントモジュール2600’は入力ソース信号Srcを受け取り、これはボケフィルター4010によってボケカラー信号Blrに変換される。ボケフィルター4010は任意であり、ボケフィルター4010を使用しない態様に於いては、セグメントモジュール2600’はボケカラー信号BLRをデスクリーンモジュール1300から受け取っても良い。
セグメントモジュール2600’は入力としてフルカラーソース信号Srcを受け取り、二個の出力、強調画像信号ENH’及び三状態エッジ連続性信号TEC”を形成する。入力ソース信号Srcのクロマ成分は早い走査方向(x)に於いて係数2でサブサンプリング可能である。セグメントモジュール2600’により形成されるクロマ信号はいずれもクロマ−xサブサンプリング(XCSS)を使用していない。従って、ソース信号Srcのクロマ値にアクセスする場合、調整フィルタリングは不要である。即ち4サンプルXCSSクアッドL0011に於いて、ピクセル0はL001であり、ピクセル1はL101である。
ソース信号Srcはボケフィルター4010に送られる。ボケフィルター4010は入力ソース信号Srcの一連のぼけた状態(信号)を作る一群のフィルターを有している。各フィルターサイズはソース信号Srcの入力解像度の一つに対応していて良い。従って、ソース信号の入力解像度が300,400,600dpiである場合、フィルターサイズはそれぞれ2×2,3×3,5×5とすることが出来る。ソース信号Srcのクロマ成分はフィルターされない状態でボケフィルター4010を通過するが、ソース信号Srcの輝度成分は通常フィルターされる。但し、低解像度の入力信号及びノイズの多いスキャナの場合にはクロマに対するフィルター操作を行っても良い。
各フィルターはその形に於いて対称かつ分離可能なn×nの2次元(2D)有限パルスレスポンスフィルターとすることが出来る。例として、5×5(F_5)フィルターのレスポンスを図10に示す。フィルターが3×3(F_3)フィルター又は5×5(F_5)フィルターのように奇数サイズのウィンドウを有する場合、フィルターは整数係数を有する対称三角形であるが、2×2(F_2)フィルターのように偶数サイズのウィンドウを有する場合、フィルターは等しい係数値を有し、これは2×2ピクセル平均化と等価である。F_2フィルターのレスポンスも図10に示す。フィルターは分離可能であるため、フィルターを二つの直交ステップで使用するのが好ましい。
ボケフィルター4010はボケカラー信号Blrを信号線4012を介して出力し、これは従属最小−最大モジュール4020によって受け取られる。対象ピクセル周囲の7×7ウィンドウを測定する図6の従属最小−最大モジュール2610と異なり、従属最小−最大モジュール4020は対象ピクセル周囲の2×2ウィンドウを測定する。この後対象ピクセル周囲の4×4ウィンドウを測定して両ウィンドウ中のピクセルの最大輝度maxL及び最小輝度minLを求める。この操作は7×7ウィンドウを使用するのと同等の結果を得られる。また最大輝度maxLの位置及び最小輝度minLの位置におけるクロマ値を求める。従属Max値は最大輝度maxL及び最大輝度maxLの位置におけるクロマ値から生成される。同様に、従属Min値は最小輝度minL及び最小輝度minLの位置におけるクロマ値から生成される。ついで最大−最小モジュール4020は従属Max及びMin値をそれぞれ信号線4022,4024を介して出力する。従属Max値及び従属Min値は対象ピクセル周囲のウィンドウ内における極限輝度値、及びこれら極限輝度値に付随するクロマ値を表す。
従属最小−最大モジュール4020の操作を以下に説明する。この操作は二段階で進行する。第一段階では、従属最小−最大モジュールは対象ピクセル周囲の2×2ウィンドウで最大輝度maxL及び最小輝度minLを検索する。最大輝度maxL及び最小輝度minLが見出されると、従属最小−最大モジュール4020は最大輝度maxL及び最小輝度minLの位置におけるクロマ値(A,B)を決定する。第一段階での結果は、第二段階において4×4ウィンドウを使用して従属Max値及び従属Min値を求めるのに使用される。ボケカラー信号Blrはx−サブサンプリングされたクロマ成分と共に従属最小−最大モジュール4020に届いているが、この時点でx−クロマサブサンプリングは停止される。従って、従属Max値及び従属Min値はx−サブサンプリングされたクロミナンスを有さない。この方法は中心ピクセルについて対称ではないが、7×7ウィンドウを使用する方法より計算量が少ない。
従属最小−最大モジュール4020の操作は分離しても良い。例えば、各列の従属Max/Min値をまず計算する。ついで最小のLを有する列内のMinピクセルを見出すことによって最終の従属Min値を求めることが出来る。この方法ではウィンドウを画像上で順次移動させつつ高さ8の列及び幅8の行について計算を行って従属Max値及び従属Min値を求めるので、余分な計算が必要とされることになる。
動的閾値モジュール4030は従属最小−最大モジュール4020から従属Max値及び従属Min値を、またボケフィルター4010からボケカラー信号Blrを受け取る。動的閾値モジュール4030は従属Max値及び従属Min値を用いてボケカラー信号Blrに適応的に閾値を適用して、信号線4032を介して三状態連続性信号TECを生成し、これは2ビット信号であってよい。
三状態連続性信号TECは各ピクセルを正エッジあり、エッジ無し、負エッジありのいずれかに分類する。三状態連続性信号TECの論理図を図12に示す。図11に於いて、線形データを使用すると動的閾値モジュール4030の操作を最適化することが出来る。入力データがLabまたはsYCCカラーデータの如く非線形の場合、ボケカラー信号Blr0、従属Max値mx0及び従属Min値mn0の輝度値が非線形−線形変換モジュール(即ち線形化部)4034に送られる。非線形−線形変換モジュール4034はボケカラー信号Blr0、従属Max値mx0及び従属Min値mn0の輝度値をほぼ線形となるように修正する。修正されたボケカラー信号Blr0’、従属Max値mx0’及び従属Min値mn0’の輝度値ならびに付随するクロマ値がドット積モジュール4036に送られる。
ドット積モジュール4036はボケカラー信号Blr、従属Max値及び従属Min値を受け取る。上記の如く、場合により、ボケカラー信号Blr、従属Max値及び従属Min値の輝度値は修正されることがある。従属Max値及び従属Min値がLab値で定義されていることを前提として、ドット積モジュール4036は下記のドット積乗算を行う。
gsr=<X,Y> (3)
ここで<X,Y>はベクトルX、Y間のドット積操作を示す。従って、
<X,Y>=(XL,XA,BB)(YL,YA,YBt=XLL+XAA+XBB (4)
ここで
Figure 2005228342
上記(L,A,B)値は入力されるボケカラー信号Blrの成分である。式(5)のXベクトルはMinとMaxの平均から入力ボケカラー信号Blrを減算したものである。これら二つのベクトルのドット積を取ると、出力は、Xベクトルと直交しかつこれと途中で交わる平面からの相対距離に比例する。最終出力Gsrは負であってもよい。負の出力Gsrは軽いエッジを有するピクセルを示す。
ドット積モジュール4036はさらにエッジ信号Edgeを出力してもよく、これはエッジ信号EdgLとなる。エッジ信号EdgLが正の値の時信号Edgが活性化(enable)され、これは現在のピクセルに対するエッジの位置を示す。エッジ信号EdgLは下記によって得られる。
EdgL=((Mx0−SegLumLoConThr)*1HiCmp)>
(Mn0*1LoCmp) (7)
但し、
Mx0は調整された最大輝度(非線形の場合)
Mn0は調整された最小輝度(非線形の場合)
1HiCmp=256−SegLumHiConThr
1LoCmp=256−SegLumLoConThr
SegLumHiConThrは約40のパラメータ
SegLumLoConThrは約80のパラメータ
である。
パラメータ値SegLumHiConThr及びSegLumLoConThrは単に例であり、他のパラメータを使用しても良い。また上記の式はエッジ検出器としてドット積モジュール4036中で使用しても良い。また全クロマコントラスト量のスケール値Cccが、ベクトルXの二つのクロマ成分の絶対値の加算によって得られる。
Ccc=|XA|+|XB| (8)
輝度Lは正の領域[0…255]に限定されており、また最大値は常に最小値より大きいので、輝度成分の絶対値は無視可能である。
上記に基づいて、ドット積モジュール4036は4個の出力信号Gsr,EdgL,Cc0,Cccを生成する。輝度コントラストCc0は輝度Lmax―輝度Lminである。出力信号EdgLはエッジが真の場合にエッジの存在を示す。出力信号Gsrの正の値はEdge信号の極性が暗いことを示し、これによって信号snsが活性化される。従属Max及びMin値によって与えられる輝度コントラストが不十分な場合、下記の如くエッジを見出すためにクロミナンスのコントラストが輝度コントラストと共に使用される。
図11に示す如く、信号EdgLが活性化されると、信号Edgも活性化される。これは、現在のピクセルがエッジ上にあること(即ちエッジピクセル)を意味する。このエッジは信号snsの極性によって正又は負となりうる。
c0>SegLumHiThr/4及びCcc>SeqClrConThr/2が共に真の場合(SegLumHiThr/4及びSeqClrConThr/2は閾値)、信号Edgは信号EdgLの値に拘わらず活性化される。信号Edg及び信号snsはTECロジック4038に送られて、図12に例示するロジックによってピクセルごとの三状態エッジ連続性信号TECを生成する。
TECフィルターモジュール4040は動的閾値モジュール4030からの三状態エッジ連続性信号TECを信号線4032を介して受け取る。TECフィルターモジュール4040はフィルターされた三状態エッジ連続性信号TEC’を信号線4042を介して出力する。上記の如く三状態エッジ連続性信号はピクセルを正エッジ、負エッジ、又はエッジ無しに分類する。以下に説明する如く、N層画像データ発生システム2000は三状態エッジ連続性信号TECの値を使用してエッジの包囲境界を見出すものである。換言すれば、三状態エッジ連続性信号TECの値を使用してブロブを識別し、これによって内部のピクセル全てについて色の連続性を検査することが不要となるものである。しかし、スキャナは通常ノイズを走査された画像に導入する。従って、三状態エッジ連続性信号TECに基づいて操作される画像はランダムな“ゴマ塩(salt and pepper)”ノイズを含んでいることがあり、このためブロブ識別モジュール2700がブロブを連続な包囲エッジ境界として識別することが妨げられることがある。従ってN層画像データ発生システムはブロブを正確に区分できないことがある。よって、TECフィルターモジュール4040には“ゴマ塩”ノイズに対する補償を行う。
図13−15に示す如く、TECフィルターモジュール4040は対象ピクセル周囲の例えば3×3ウィンドウを通じて検索を行う。TECフィルター4040は図13−15に示す如くウィンドウ中心の孤立ピクセル値を変更することが出来る。TECフィルター4040は下記の法則に従う分類器/脱分類器を使用して中心ピクセルの値を変更しうる。
図13に於いて、中心が負エッジピクセルと分類され、周囲の少なくとも一個のピクセルが同じ分類を持たず、かつ周囲のピクセルが正エッジピクセルまたはエッジ無しピクセルと分類される場合、中心ピクセルはエッジ無しピクセルとして再分類して良い。
図14に於いて、中心が正エッジピクセルと分類され、周囲の少なくとも一個のピクセルが同じ分類を持たず、かつ周囲のピクセルがエッジ無しピクセルまたは負エッジピクセルと分類される場合、中心ピクセルはエッジ無しピクセルとして再分類して良い。
図15に於いて、中心がエッジ無しピクセルと分類され、周囲の少なくとも一個のピクセルが同じ分類を持たず、かつ周囲のピクセルが正エッジピクセルまたは負エッジピクセルと分類される場合、中心ピクセルは負エッジピクセルまたは正エッジピクセルとして再分類して良い。変更された三状態エッジ連続性信号TEC’はセグメントモジュール2600’から信号線4042を介して出力される。
エッジ強調モジュール4050はボケカラー信号Blrをボケフィルター4010から、また従属Max及びMin値を従属最大−最小モジュール4020から受け取る。エッジ強調モジュール4050はまた三状態エッジ連続性信号TECを動的閾値モジュール4030から受け取る。エッジ強調モジュール4050はボケカラー信号Blrの強調を行う。即ち、エッジ強調モジュール4050は、従属Max及びMin値及び三状態エッジ連続性値TECに応じて各ピクセル毎にボケカラー信号Blrを明るく、暗く或いは変化なしとすることによってボケカラー信号Blrの強調を行う。
図16はエッジ強調モジュール4050のより詳細な例を示す。受信された三状態エッジ連続性信号TECをエッジ強調モジュール4050の操作を助けるTECロジック4038と関連して示す。図16に示す如く、エッジ強調モジュール4050は三個のマルチプレクサ4052,4054,4056を有する。マルチプレクサ4052は入力としてボケカラー信号Blrを受け取る。マルチプレクサ4054は入力として従属Min値を受け取る。マルチプレクサ4056は入力として従属Max値を受け取る。三個のマルチプレクサ4052,4054,4056はすべて制御信号として三状態エッジ連続性信号TECを受け取る。エッジ強調モジュール4050の操作は下記の通りである。三状態エッジ連続性信号TECが信号Edgを含まない場合、マルチプレクサ4052は活性化されてボケカラー信号Blrを通過させる。他方マルチプレクサ4054,4056は不活性化されて従属Max及びMin値を通過させない。従って、エッジ強調モジュール4050はボケカラー信号Blrを強調化画像データ信号ENH’として出力する。
三状態エッジ連続性信号TECが信号Edgを含む場合、信号snsによりマルチプレクサ4054,4056のいずれが活性化されるかが決定される。他方マルチプレクサ4052は不活性化されてボケカラー信号Blrを通過させない。信号snsが高い論理値の場合、マルチプレクサ4054が活性化されて従属Min値を通過させるが、マルチプレクサ4056は不活性化される。従って従属Min値が強調化画像データ信号ENH’として出力される。逆に信号snsが低い論理値の場合、マルチプレクサ4056が活性化されて従属Max値を通過させるが、マルチプレクサ4054は不活性化される。従って従属Max値が強調化画像データ信号ENH’として出力される。
図5に於いて、表2に示す如く、ブロブ識別モジュール2700が現在の対象ピクセルについてのブロブ数を識別する。
Figure 2005228342
図17〜20はブロブ識別モジュール2700が遭遇しうるブロブの四種の異なる形式を示す。
図21は、一つのブロブが他のブロブに完全に含まれる場合に、異なるブロブ内のピクセルにどのようにブロブIDが割り当てられるかを示す。
図22はブロブマッピング・クラスターモジュール2800の詳細を示す。
一実施態様に於けるブロブ分類法では、残存する良いブロブに対してオクタルツリー(octal tree)が作製される。これを図23〜25を参照して更に詳細に説明する。ブロブマッピングモジュール2840は生成されたオクタルツリーを信号線2841を介してブロブクラスターモジュール2850に出力する。図23は強調化画像データ信号ENHがどのように解析されてオクタルツリー及びブロブ・カラーインデックスを生成するかを示す。
図25に示す如く、図24のノード694,693は統合されてノード690が最初のリーフ1,2,3それぞれを含む単一のリーフを有するようにされる。
図26は識別されたピクセルを特定の二進フォアグランドに集める状態を示す。
図27はこのプロセスを別の方法で示す。
図28,29は、走査された画像データを複数の二進フォアグランド平面を用いてポータブルドキュメントフォーマット(PDF)のドキュメントファイルに変換する方法を示すフローチャートである。走査はステップS1000で開始し、ステップS2000に進んで走査された画像データが選択された色空間に変換される。ステップS3000において、変換された画像データに対してハーフトーンスクリーンパラメータ例えばスクリーン周波数及びスクリーンサイズが推定される。ステップS4000において、変換された画像データはデスクリーン処理されて推定された少なくとも一個のハーフトーンスクリーンパラメータに基づいて変換された画像データからハーフトーンスクリーニングを除去する。
ステップS5000において、デスクリーンされた画像データのスケーリングを行う。ステップS6000において、スケーリング及びデスクリーンされた画像データからガマット強調化画像データを生成する。ステップS7000において、ガマット強調化画像データからエッジ強調画像データ及びエッジ連続性データを生成する。
ステップS8000において、エッジ強調画像データに基づいて、エッジ強調画像データ内に生じる複数の二進フォアグランド平面に配分されるべき複数の画像データブロブが決定される。ステップS9000において、定義が不十分なブロブ、例えば悪いブロブが除去される。ステップS10000において、決定されたブロブから“悪い”ブロブを除去した後に残存するブロブからカラーツリーが生成される。
ステップS11000において、残存するブロブが分離した二進フォアグランド平面及びグレースケールバックグランド平面にクラスター化される。ステップS12000において、グレースケールバックグランド平面内の画像データを調整してグレースケールバックグランド平面の圧縮性を改善する。ステップS13000において、ステップS11000で決定された分離した二進フォアグランド平面のそれぞれを、かかる二進フォアグランド平面に適した圧縮技術を用いて、圧縮する。
ステップS14000において、グレースケールバックグランド平面を、かかるグレースケールバックグランドに適した圧縮技術を用いて、圧縮する。ついで、ステップS15000において、圧縮された二進フォアグランド平面及び解凍されたグレースケールバックグランド平面からポータブルドキュメントフォーマット(PDF)のドキュメントファイルが生成される。ついで、ステップS16000において、生成されたポータブルドキュメントフォーマット(PDF)のドキュメントファイルが下流のプロセサに出力され、かつ/又はメモリーに格納される。ついで操作はステップS17000に進んで、このプロセスの操作が終了する。
図30はステップS7000に於いてガマット強調化画像データからエッジ強調化画像データ及びエッジ連続性データを生成する方法を詳細に示すフローチャートである。ステップS7000でスタートした後、操作はステップS7050に進み、ガマット強調化画像データの最初のライン又は次のラインが現在のラインとして選択される。ステップS7100に於いてステップS7050で選択された現在のラインの最初及び/又は次のピクセルが現在のピクセルとして選択される。ステップS7150に於いて、規定されたウィンドウに基づき、現在のピクセルに隣接する一群の隣接ピクセルが選択される。前記の如く、規定されたウィンドウは例えば現在のピクセルを中心とする7×7ウィンドウである。
ステップS7200に於いて、現在のピクセルの周囲でウィンドウ中に現れるピクセルを検査して、現在のピクセルに対して、ウィンドウ中で最大輝度値を有するピクセル及びウィンドウ中で最小輝度値を有するピクセルが識別される。ステップS7250に於いては、ステップS7200に於いて識別されたピクセルの三成分ガマット強調化画像データに基づいてグレースケールベクトルが決定される。ステップS7300に於いては、原グレースケールベクトル値が現在のピクセルに対するエッジ連続性データに変換される。上述の如く、種々の例示的態様に於いてエッジ連続性データはウィンドウ中又は現在のピクセルに現在のピクセルと関連するエッジが存在するか否か、及び現在のピクセルに対するこのエッジの関係を示す。
ステップS7350に於いては、現在のピクセルに対するガマット強調化画像データとステップS7200に於いて識別されたピクセルに対するガマット強調化画像データに基づく現在のピクセルに対するエッジ強調化画像データと、現在のピクセルに対するエッジ連続性データが生成される。ステップS7350に於いては、現在のラインの全てのピクセルが現在のピクセルとして選択されたかが判定される。選択されていない場合、操作はステップS7100に戻り、現在のラインの次のピクセルが現在のピクセルとして選択される。他方、現在のラインの全てのピクセルが現在のピクセルとして選択された場合、操作はステップS7450に継続される。ステップS7450に於いては、画像データの全てのラインが選択されたかが判定される。選択されていない場合、操作はステップS7050に戻り、ガマット強調化画像データの次のラインが現在のライン他方として選択される。他方、画像データの全てのラインが選択された場合、即ち全画像が解析され、エッジ強調化画像データとエッジ連続性データが走査された画像データの各ピクセルについて生成された場合、操作はステップS7500に進み、ここでステップS8000に戻る。
図31,32は、ステップS8000のエッジ連続性データに基づいてエッジ強調化画像データ内の複数のブロブを決定する方法を詳細に示す。ステップS8000でスタートした後、操作はステップS8050に進み、エッジ強調化画像データの最初のライン又は次のラインが現在のラインとして選択される。ステップS8100に於いて現在のラインの最初の又は次のラインが現在のピクセルとして選択される。ステップS8150に於いて、現在のピクセル、上方に隣接するピクセル及び左方に隣接するピクセルのエッジ連続性データがすべて0でない同じエッジ連続性値を有するかが判定される。ステップS8000のこの例示的態様に於いては、エッジ連続性データは現在のピクセルと上縁を共有するピクセル、即ち上方隣接ピクセルと、現在のピクセルと左縁を共有するピクセル、即ち左方隣接ピクセルとについて検査される。ステップS8150に於いて、現在のピクセル、上方隣接ピクセル及び左方隣接ピクセルがすべて0でない同じエッジ連続性値を有する場合には、操作はステップS8650にジャンプし、それ以外の場合はステップS8200に進む。
ステップS8200に於いては、現在のピクセルと上方隣接ピクセルのエッジ連続性データが同じであり、他方左方隣接ピクセルのエッジ連続性データが異なるが0でない状態かが判定される。そうである場合、操作はステップS8250に進み、それ以外の場合はステップS8300にジャンプする。ステップS8250に於いては上方隣接ピクセルのブロブIDが現在のピクセルにも割り当てられ、これら2個のピクセルが同一のブロブに含まれることを示す。ついで操作はステップS8700にジャンプする。
ステップS8300に於いては、現在のピクセルと左方隣接ピクセルのエッジ連続性データが同じであり、他方上方隣接ピクセルのエッジ連続性データが異なるが0でない状態かが判定される。そうである場合、操作はステップS8350に進み、それ以外の場合はステップS8400にジャンプする。ステップS8350に於いては左方隣接ピクセルのブロブIDが現在のピクセルにも割り当てられ、従ってこれら2個のピクセルは同一のブロブに含まれる。ついで操作はステップS8700にジャンプする。
ステップS8400に於いては、左方隣接ピクセルと上方隣接ピクセルのエッジ連続性データが同じであり、他方、現在のピクセルのエッジ連続性データが0でない異なるが値かが判定される。そうである場合、操作はステップS8450に進み、それ以外の場合はステップS8500にジャンプする。
ステップS8450に於いて、現在のピクセルには左方隣接ピクセル及び上方隣接ピクセルのブロブIDと異なるブロブIDが割り当てられる。従って現在のピクセルは左方隣接ピクセル及び上方隣接ピクセルのブロブとは、これら2個のピクセルが同一のブロブに属する場合でも、異なるブロブとなる。ついで操作はステップS8700にジャンプする。
ステップS8500に於いては、現在のピクセル、上方隣接ピクセル及び左方隣接ピクセルのエッジ連続性データが全て異なる値かが判定される。即ち現在のピクセル、上方隣接ピクセル、左方隣接ピクセルのうちの一つが第一の値を有し、他の一つが第二の値を有し、残る一つが第三の値を有する場合である。そうである場合、操作はステップS8600にジャンプし、それ以外の場合はステップS8550に進む。ステップS8550に於いては、左方隣接ピクセルと上方隣接ピクセルのエッジ強調化画像データそれぞれが現在のピクセルのエッジ強調化画像データに十分類似しているかが判定される。層でない場合、操作はステップS8600に進み、それ以外の場合はステップS8650にジャンプする。
ステップS8600に於いては、現在のピクセル、上方隣接ピクセル及び左方隣接ピクセルが異なるエッジ連続性データを有するか、或いは上方隣接ピクセル及び左方隣接ピクセルの色が現在のピクセルの色に十分に類似していないので、現在のピクセルはグレースケールバックグランド平面に統合される。更に、上方隣接ピクセル及び左方隣接ピクセルを含むブロブ、即ちこのブロブに含まれる全てのピクセルもグレースケールバックグランド平面に統合される。ついで操作はステップS8700にジャンプする。
これに対し、ステップS8650に於いては、現在のピクセル、上方隣接ピクセル及び左方隣接ピクセルが同じエッジ連続性データを有するか、或いは全てのピクセルが十分に類似したエッジ連続性データを有しかつ現在のピクセル、上方隣接ピクセル及び左方隣接ピクセルのいずれか二つが同じエッジ連続性値を有しかつ残る一つが0値を有し、或いは現在のピクセル、上方隣接ピクセル及び左方隣接ピクセルのうちの二つが0値を有するため、現在のピクセルは上方隣接ピクセル及び左方隣接ピクセル両方を含む両ブロブに統合することが出来る。結果としてこれら両ブロブ及び現在のピクセルは全て単一のブロブに統合される。この単一ブロブは左方隣接ピクセルのブロブID、上方隣接ピクセルのブロブID、全く新しいブロブID、或いは他の任意の適当なブロブIDを特定の目的に応じて採用することが出来る。ついで操作はステップS8700に進む。
ステップS8700に於いては、エッジ強調化画像データの現在のラインの全てのピクセルが選択されたかが判定される。選択されていない場合、操作はステップS8100に戻る。それ以外の場合、操作はステップS8750に進む。ステップS8750に於いては、エッジ強調化画像データの全てのラインが現在のラインとして選択されたかが判定される。選択されていない場合、操作はステップS8050に戻る。それ以外の場合、操作はステップS8800に進み、ここでステップS9000に戻る。
図33はステップS9000の悪いブロブを除去する方法の詳細を示すフローチャートである。
図34はステップS9100の潜在的に悪いブロブを識別する方法の詳細を示すフローチャートである。
図35はステップS10000のカラーツリーを生成する方法の詳細を示すフローチャートである。
図36はステップS11000のブロブをクラスター化する方法の詳細を示すフローチャートである。
三層混合ラスターコンテンツフォーマットのフォアグランド、バックグランド及びセレクタ平面及び生成される書面を示す図。 複数の二進フォアグランド平面及び生成される書面画像を示す図。 三層画像データ発生システムを示す図。 図3の三層画像データ発生システムのセグメントモジュールを示す図。 N層画像データ発生システムを示す図。 図5のN層画像データ発生システムのセグメントモジュールを示す図。 図6のセグメントモジュールのエッジ強調モジュールを示す図。 原スキャナ信号及び原スキャナ信号から誘導される各種強調化信号を示すグラフ。 図5のN層画像データ発生システムの他のセグメントモジュールを示す図。 F_2フィルターとF_5フィルターのフィルターレスポンスを示す図。 図9のセグメントモジュールの動的閾値モジュールを示す図。 図11の動的閾値モジュールの三状態エッジ連続性(TEC)ロジックを示す図。 図9のセグメントモジュールのTECフィルターモジュールのフィルターレスポンスを示す図。 図9のセグメントモジュールのTECフィルターモジュールのフィルターレスポンスを示す図。 図9のセグメントモジュールのTECフィルターモジュールのフィルターレスポンスを示す図。 図9のセグメントモジュールのエッジ強調モジュールを示す図。 確定及び不確定ブロブを示す図。 確定及び不確定ブロブを示す図。 確定及び不確定ブロブを示す図。 確定及び不確定ブロブを示す図。 確定ブロブが他の確定ブロブ内に含まれる状態を示す図。 図5のN層画像データ発生システムのブロブマッピング・クラスターモジュールを示す図。 複数二進フォアグランド平面に使用されるカラー情報の保存に使用されるデータ構造及びカラーデータから生成可能なツリーデータ構造を示す図。 図23のツリー構造を結合してリーフノードの数を削減する種々の技術を示す図。 図23のツリー構造を結合してリーフノードの数を削減する種々の技術を示す図。 画像のブロブが識別された後の原画像データ、及びブロブ及び特定の二進フォアグランド平面のカラーデータに基づいて識別されたブロブを特定の二進フォアグランド平面に集める技術を示す図。 処理された画像データがバックグランド平面及び複数のフォアグランド平面に配分される状態を示す図。 走査された画像データを複数の二進フォアグランド平面を用いてPDF形式のドキュメントファイルに変換する方法を示すフローチャート。 走査された画像データを複数の二進フォアグランド平面を用いてPDF形式のドキュメントファイルに変換する方法を示すフローチャート。 ガマット強調化画像データからエッジ強調化画像データ及びエッジ連続性データを生成する方法を詳細に示すフローチャート。 エッジ連続性データに基づいてエッジ強調化画像データ内の複数のブロブを決定する方法を詳細に示すフローチャート。 エッジ連続性データに基づいてエッジ強調化画像データ内の複数のブロブを決定する方法を詳細に示すフローチャート。 悪いブロブを除去する方法の詳細を示すフローチャート。 潜在的に悪いブロブを識別する方法の詳細を示すフローチャート。 カラーツリーを生成する方法の詳細を示すフローチャート。 ブロブをクラスター化する方法の詳細を示すフローチャート。

Claims (3)

  1. エッジ連続性ピクセルデータを生成する方法に於いて、
    ピクセルの第一近傍の最大輝度値及び最小輝度値に基づいてピクセルをエッジピクセルと識別する工程と、
    最大輝度値及び付随するクロマ値と最小輝度値及び付随するクロマ値とのドット積に基づいてエッジピクセルの極性値を設定する工程と、
    を有することを特徴とする方法。
  2. エッジ連続性ピクセルデータを生成する装置に於いて、
    ピクセルの第一近傍の最大輝度値及び最小輝度値に基づいて最大輝度値及び付随するクロマ値と最小輝度値及び付随するクロマ値とを出力する最小・最大値発生器と、
    最大輝度値及び付随するクロマ値と最小輝度値及び付随するクロマ値とのドット積に基づいてピクセルの極性値を発生するドット積乗算器と、
    を有することを特徴とする装置。
  3. データ処理装置で実施可能な一組のプログラム指令を記憶する記憶媒体であって、前記一組のプログラム指令が、
    ピクセルの第一近傍の最大輝度値及び最小輝度値に基づいてピクセルをエッジピクセルと識別する指令と、
    最大輝度値及び付随するクロマ値と最小輝度値及び付随するクロマ値とのドット積に基づいてエッジピクセルの極性値を設定する指令と、
    を有することを特徴とする記憶媒体。
JP2005036118A 2004-02-12 2005-02-14 分類装置 Expired - Fee Related JP4680622B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/776,516 US7324120B2 (en) 2002-07-01 2004-02-12 Segmentation method and system for scanned documents

Publications (2)

Publication Number Publication Date
JP2005228342A true JP2005228342A (ja) 2005-08-25
JP4680622B2 JP4680622B2 (ja) 2011-05-11

Family

ID=34711834

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005036118A Expired - Fee Related JP4680622B2 (ja) 2004-02-12 2005-02-14 分類装置

Country Status (4)

Country Link
US (1) US7324120B2 (ja)
EP (1) EP1566768B1 (ja)
JP (1) JP4680622B2 (ja)
TW (1) TWI380675B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005228341A (ja) * 2004-02-12 2005-08-25 Xerox Corp 画像データを領域へ編成するシステムおよび方法
WO2010101292A1 (en) * 2009-03-03 2010-09-10 Sharp Kabushiki Kaisha Method of and apparatus for processing a video image

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3792149B2 (ja) * 2001-11-12 2006-07-05 任天堂株式会社 画像処理装置および画像処理プログラム
US20040032412A1 (en) * 2002-08-13 2004-02-19 Odom Brian Keith Generating a graphical program based on a timing diagram
US7139442B2 (en) * 2002-12-16 2006-11-21 Xerox Corporation Template matching applied to selector planes for multiple raster content (MRC) representation of documents
JP2004336453A (ja) * 2003-05-08 2004-11-25 Ricoh Co Ltd 複写機、画像処理システム、プログラム及び記憶媒体
JP4095530B2 (ja) * 2003-10-01 2008-06-04 キヤノン株式会社 画像処理装置及び方法
US20050265600A1 (en) * 2004-06-01 2005-12-01 Xerox Corporation Systems and methods for adjusting pixel classification using background detection
US8204306B2 (en) * 2004-06-14 2012-06-19 Xerox Corporation Method for image segmentation based on block clustering for improved processing of touching characters
US7783117B2 (en) * 2005-08-12 2010-08-24 Seiko Epson Corporation Systems and methods for generating background and foreground images for document compression
US7899258B2 (en) * 2005-08-12 2011-03-01 Seiko Epson Corporation Systems and methods to convert images into high-quality compressed documents
US8849031B2 (en) * 2005-10-20 2014-09-30 Xerox Corporation Document analysis systems and methods
US8085416B2 (en) * 2005-12-08 2011-12-27 Xerox Corporation Method and system for color highlighting of text
WO2007081234A1 (fr) * 2006-01-12 2007-07-19 Otkrytoe Aktsionernoe Obschestvo 'bineuro' Procede de codage de la semantique de documents-textes
JP4764231B2 (ja) * 2006-03-31 2011-08-31 キヤノン株式会社 画像処理装置、制御方法、コンピュータプログラム
US8179556B2 (en) * 2007-03-26 2012-05-15 Xerox Corporation Masking of text in document reproduction
US7894689B2 (en) * 2007-05-31 2011-02-22 Seiko Epson Corporation Image stitching
US8155437B2 (en) * 2007-09-07 2012-04-10 CVISION Technologies, Inc. Perceptually lossless color compression
JP4766030B2 (ja) * 2007-10-11 2011-09-07 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US7992087B1 (en) * 2008-02-27 2011-08-02 Adobe Systems Incorporated Document mapped-object placement upon background change
US8165388B2 (en) * 2008-03-05 2012-04-24 Xerox Corporation Neutral pixel detection in an image path
US7843616B2 (en) * 2008-03-27 2010-11-30 Xerox Corporation Background suppression in a multi-function color scanning system
US8111918B2 (en) * 2008-10-20 2012-02-07 Xerox Corporation Segmentation for three-layer mixed raster content images
US8473467B2 (en) * 2009-01-02 2013-06-25 Apple Inc. Content profiling to dynamically configure content processing
US8532437B2 (en) * 2009-05-18 2013-09-10 Citrix Systems, Inc. Systems and methods for block recomposition for compound image compression
US8565531B2 (en) * 2009-10-09 2013-10-22 Xerox Corporation Edge detection for mixed raster content (MRC) images for improved compression and image quality
TWI420403B (zh) * 2009-11-13 2013-12-21 Primax Electronics Ltd 影像處理方法及影像處理裝置
US8335379B2 (en) * 2009-12-28 2012-12-18 Xerox Corporation System and method for cleanup of MRC images for improved compression and image quality
US8340363B2 (en) 2010-05-27 2012-12-25 Palo Alto Research Center Incorporated System and method for efficient interpretation of images in terms of objects and their parts
US9288484B1 (en) 2012-08-30 2016-03-15 Google Inc. Sparse coding dictionary priming
US9300906B2 (en) 2013-03-29 2016-03-29 Google Inc. Pull frame interpolation
US9286653B2 (en) 2014-08-06 2016-03-15 Google Inc. System and method for increasing the bit depth of images
US9153017B1 (en) 2014-08-15 2015-10-06 Google Inc. System and method for optimized chroma subsampling
US9438769B1 (en) * 2015-07-23 2016-09-06 Hewlett-Packard Development Company, L.P. Preserving smooth-boundaried objects of an image
US10152630B2 (en) 2016-08-09 2018-12-11 Qualcomm Incorporated Methods and systems of performing blob filtering in video analytics
CN107086027A (zh) * 2017-06-23 2017-08-22 青岛海信移动通信技术股份有限公司 文字显示方法及装置、移动终端及存储介质
US10832049B2 (en) 2018-05-31 2020-11-10 Intematlonal Business Machlnes Corporation Electronic document classification system optimized for combining a plurality of contemporaneously scanned documents
US10915546B2 (en) 2018-10-10 2021-02-09 Micron Technology, Inc. Counter-based compaction of key-value store tree data block
US11100071B2 (en) * 2018-10-10 2021-08-24 Micron Technology, Inc. Key-value store tree data block spill with compaction
US10852978B2 (en) 2018-12-14 2020-12-01 Micron Technology, Inc. Key-value store using journaling with selective data storage format
US10936661B2 (en) 2018-12-26 2021-03-02 Micron Technology, Inc. Data tree with order-based node traversal

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5515452A (en) * 1992-12-31 1996-05-07 Electroglas, Inc. Optical character recognition illumination method and system
EP1380992A1 (en) * 2002-07-01 2004-01-14 Xerox Corporation Segmentation method and system for multiple raster content (MRC) representation of documents

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4685143A (en) * 1985-03-21 1987-08-04 Texas Instruments Incorporated Method and apparatus for detecting edge spectral features
US4849914A (en) 1987-09-22 1989-07-18 Opti-Copy, Inc. Method and apparatus for registering color separation film
US5583659A (en) 1994-11-10 1996-12-10 Eastman Kodak Company Multi-windowing technique for thresholding an image using local image properties
US5684894A (en) * 1994-11-28 1997-11-04 Eastman Kodak Company Scale specific and robust line/edge encoding of images
US5745596A (en) 1995-05-01 1998-04-28 Xerox Corporation Method and apparatus for performing text/image segmentation
US5900953A (en) 1997-06-17 1999-05-04 At&T Corp Method and apparatus for extracting a foreground image and a background image from a color document image
US6058214A (en) 1998-01-20 2000-05-02 At&T Corp. Compression of partially masked still images
US6324305B1 (en) 1998-12-22 2001-11-27 Xerox Corporation Method and apparatus for segmenting a composite image into mixed raster content planes
US6400844B1 (en) 1998-12-02 2002-06-04 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
US6633670B1 (en) 2000-03-31 2003-10-14 Sharp Laboratories Of America, Inc. Mask generation for multi-layer image decomposition
US6891549B2 (en) * 2002-01-11 2005-05-10 Applied Materials, Inc. System and method for edge enhancement of images

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5515452A (en) * 1992-12-31 1996-05-07 Electroglas, Inc. Optical character recognition illumination method and system
EP1380992A1 (en) * 2002-07-01 2004-01-14 Xerox Corporation Segmentation method and system for multiple raster content (MRC) representation of documents

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005228341A (ja) * 2004-02-12 2005-08-25 Xerox Corp 画像データを領域へ編成するシステムおよび方法
JP4587832B2 (ja) * 2004-02-12 2010-11-24 ゼロックス コーポレイション 画像データ内で識別された領域を編成する方法及び装置
WO2010101292A1 (en) * 2009-03-03 2010-09-10 Sharp Kabushiki Kaisha Method of and apparatus for processing a video image

Also Published As

Publication number Publication date
TW200541311A (en) 2005-12-16
EP1566768A3 (en) 2008-09-24
TWI380675B (en) 2012-12-21
EP1566768A2 (en) 2005-08-24
US7324120B2 (en) 2008-01-29
EP1566768B1 (en) 2016-05-18
JP4680622B2 (ja) 2011-05-11
US20040227758A1 (en) 2004-11-18

Similar Documents

Publication Publication Date Title
JP4680622B2 (ja) 分類装置
US7403661B2 (en) Systems and methods for generating high compression image data files having multiple foreground planes
JP4667062B2 (ja) 画像解析装置、画像解析方法、及びブロブ識別装置
KR101795823B1 (ko) 광학 문자 인식되는 텍스트 영상의 텍스트 개선 기법
US6766053B2 (en) Method and apparatus for classifying images and/or image regions based on texture information
CN105339951B (zh) 用于检测文档边界的方法
EP2645304B1 (en) Image processing device determining binarizing threshold value
JP2016505186A (ja) エッジ保存・ノイズ抑制機能を有するイメージプロセッサ
US8351720B2 (en) Method and system providing edge enhanced image binarization
JP2001169080A (ja) カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体
JP2007504719A (ja) 組み込みアプリケーションに適した、画像における赤目の検出と補正を行うシステム及び方法
US7602967B2 (en) Method of improving image quality
KR20050085355A (ko) 분할된 이미지로부터 폴스 엣지들을 제거하는 방법 및 장치
CN112233037B (zh) 基于图像分割的图像增强系统及方法
US20110085737A1 (en) Method and system for detecting edges within an image
US20060126136A1 (en) Image inspecting apparatus, image inspecting method, control program and computer-readable storage medium
JP3906221B2 (ja) 画像処理方法及び画像処理装置
JPWO2002045021A1 (ja) エントロピーフィルタ及び該フィルタを用いた領域抽出法
Boiangiu et al. Methods of bitonal image conversion for modern and classic documents
CN112634229B (zh) 图像去除黑边的方法
Cheng et al. Background identification based segmentation and multilayer tree representation of document images
JPH08265572A (ja) 画像処理装置
Bolan Document image enhancement
Prabha et al. PREDICTION AND QUALITY ANALYSIS OF RICE USING ANN CLASSIFIER
CN112801112A (zh) 一种图像二值化处理方法、装置、介质及设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101012

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110105

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110203

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140210

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees