JP4226484B2 - Method and system for improving weak selector signal of mixed raster signal - Google Patents

Method and system for improving weak selector signal of mixed raster signal Download PDF

Info

Publication number
JP4226484B2
JP4226484B2 JP2004028660A JP2004028660A JP4226484B2 JP 4226484 B2 JP4226484 B2 JP 4226484B2 JP 2004028660 A JP2004028660 A JP 2004028660A JP 2004028660 A JP2004028660 A JP 2004028660A JP 4226484 B2 JP4226484 B2 JP 4226484B2
Authority
JP
Japan
Prior art keywords
signal
selector
foreground
plane
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004028660A
Other languages
Japanese (ja)
Other versions
JP2005039771A (en
Inventor
ジェイ カリー ドナルド
クレッター ドロン
ナファリー アスガー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2005039771A publication Critical patent/JP2005039771A/en
Application granted granted Critical
Publication of JP4226484B2 publication Critical patent/JP4226484B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/64Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
    • H04N1/642Adapting to different types of images, e.g. characters, graphs, black and white image portions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/27Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding involving both synthetic and natural picture components, e.g. synthetic natural hybrid coding [SNHC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/29Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding involving scalability at the object level, e.g. video object layer [VOL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20192Edge enhancement; Edge preservation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

ドキュメントのMRC(マルチ又は混合ラスタコンテンツ)表現は汎用性がある。これは、カラー画像、及びカラー又は白黒テキストのいずれも表す能力を提供する。MRC表現は、ドキュメント内容を表すために、多数の「プレーン」を用いることを可能にする。MRC表現は、市場においてますます重要になってきている。これは既に、主要なカラーファックスの標準として確立されている。   The MRC (multiple or mixed raster content) representation of a document is versatile. This provides the ability to represent color images and either color or black and white text. The MRC representation allows multiple “planes” to be used to represent document content. MRC representation is becoming increasingly important in the market. This is already established as a major color fax standard.

MRC表現において、画像は1つ以上のプレーンにより表される。ドキュメントのMRC表現の主要な利点は、大きなデジタルカラードキュメントを格納し、送信したり、操作するための効果的な方法を提供することである。この方法は、コントラストの高いエッジ(縁)がある場合には小さな色の変化を識別する能力が大幅に低減される、という人間の視覚システムの特性を利用するものである。エッジの情報は、通常、滑らかに変化する色の情報から分けられ、セレクタプレーンと呼ばれるプレーンの1つにおいて(可能であれば、ピクセル当たり2ビット以上の高い解像度で)コード化される。慎重な分離に続き、種々のプレーンを良好な圧縮及び高い品質をもつ標準的な圧縮方式(JPEG及びG4のような)を用いて独立して圧縮することができる。   In the MRC representation, an image is represented by one or more planes. A major advantage of the MRC representation of a document is that it provides an effective way to store, send and manipulate large digital color documents. This method takes advantage of the characteristics of the human visual system that the ability to identify small color changes is greatly reduced when there is a high contrast edge. Edge information is usually separated from smoothly changing color information and is encoded in one of the planes called selector planes (if possible with a high resolution of 2 bits per pixel or higher). Following careful separation, the various planes can be independently compressed using standard compression schemes (such as JPEG and G4) with good compression and high quality.

MRC表現の利点を十分に利用して、画像を効率的に一組のプレーンに分離するための方法及びシステムが必要とされる。   What is needed is a method and system for fully separating the images into a set of planes, taking full advantage of the MRC representation.

混合ラスタ圧縮セグメント化を改良する方法は、第1ステージの工程により生成されるマルチビットのセレクタ(GraySel)信号上で作動することにより、MRCセレクタプレーンを生成する第2の工程のステージを利用する。GraySelを生成するように用いられる第1ステージの方法は、PDLすなわち走査の向きとすることができる。第2のステージにより生成されるバイナリのセレクタ信号は、再構成された画像において明らかな圧縮ノイズを最小にする。この第2のステージの処理は、セグメント化されたフォアグラウンドプレーン及びバックグラウンドプレーンを圧縮するように用いられるJPEG最小符号化ユニット(MCU)の大きさを知ることにより行われる。これは、偽の(ソフト)エッジを現実の(ハード)エッジからできるだけ大きな距離だけ、MCUブロックの境界から落ちることになる点にまで離れるように移動させるという考えである。したがって、2つのハードエッジの間に生じるソフトエッジは、排除されるか又は中間点に再配置され、ハードエッジとMCU境界との間にあるソフトエッジは、その境界まで移動される。JPEGのMCUブロックは独立して圧縮されるため、境界における遷移は圧縮解除された出力に「リンギング」を生じさせることはない。   A method for improving mixed raster compression segmentation utilizes a second process stage that generates an MRC selector plane by operating on a multi-bit selector (GraySel) signal generated by the first stage process. . The first stage method used to generate GraySel can be PDL or scan orientation. The binary selector signal generated by the second stage minimizes the apparent compression noise in the reconstructed image. This second stage of processing is done by knowing the size of the JPEG minimum coding unit (MCU) used to compress the segmented foreground and background planes. The idea is to move the fake (soft) edge away from the actual (hard) edge by as much distance as possible to the point where it will fall from the MCU block boundary. Thus, soft edges that occur between two hard edges are eliminated or relocated to an intermediate point, and soft edges that are between the hard edge and the MCU boundary are moved to that boundary. Since JPEG MCU blocks are compressed independently, transitions at the boundary do not cause "ringing" in the decompressed output.

本発明は、画像信号を一組の画像プレーンに分離する方法及びシステムを提供する。画像信号は、デジタル走査されたドキュメントを表す。画像プレーンは、デジタル走査されたドキュメントの混合ラスタコンテンツ(MRC)表現に適当である。   The present invention provides a method and system for separating an image signal into a set of image planes. The image signal represents a digitally scanned document. Image planes are suitable for mixed raster content (MRC) representations of digitally scanned documents.

図1は一般的なMRC表現を示す。この表現は、4つの独立したプレーン、すなわち、フォアグラウンド(FG)、バックグラウンド(BG)、セレクタ(SEL)、及びレンダリングヒント(HINTS)を含む。最も一般的な場合においては、より高レベルで、多数のフォアグラウンド及びセレクタの対があり得る。しかしながら、多くの適用例においては、この表現は、3つ又は4つのプレーンに限定される。バックグラウンドプレーンは、典型的には、ピクチャ及び/又は滑らかに変化する背景カラーのような連続階調情報を格納するために用いられる。セレクタプレーンは、通常は、他のエッジ情報(例えば線画図)と併せてテキスト画像(バイナリ)を保持する。フォアグラウンドプレーンは、通常は、対応するテキスト及び/又は線画のカラーを保持する。しかしながら、MRC表現は、プレーン、及びそれに関連する圧縮方法のみを指定する。それは、他の方法によりプレーンの各々のコンテンツを制限したり実行したりはしない。プレーンの各々のコンテンツは、MRC表現の実行により適切に定義することができる。   FIG. 1 shows a general MRC representation. This representation includes four independent planes: foreground (FG), background (BG), selector (SEL), and rendering hint (HINTS). In the most general case, there can be multiple foreground and selector pairs at a higher level. However, in many applications this representation is limited to 3 or 4 planes. Background planes are typically used to store continuous tone information such as pictures and / or smoothly changing background colors. The selector plane normally holds a text image (binary) along with other edge information (for example, a line drawing). The foreground plane typically holds the color of the corresponding text and / or line art. However, the MRC representation specifies only the plane and its associated compression method. It does not limit or enforce the contents of each plane in any other way. Each content of the plane can be appropriately defined by performing an MRC representation.

MRC構造はさらに、ドキュメントのコンテンツについての付加的な情報を伝達するために用いられる4番目のプレーン、すなわちレンダリングヒントプレーンを考慮する。例えば、レンダリングヒントプレーンは、ページ上の種々の対象に最適なカラー整合方法を識別するICC(国際カラーコンソーシアム)のカラーヒントを実行することができる。   The MRC structure further considers the fourth plane used to convey additional information about the content of the document, ie the rendering hint plane. For example, the rendering hint plane can implement an ICC (International Color Consortium) color hint that identifies the best color matching method for various objects on the page.

フォアグラウンド及びバックグラウンドプレーンは、2つのフルカラー(L、a、b)又はYCCプレーンと定義される。セレクタプレーンは、バイナリ(1ビットの深さ)プレーンと定義される。1つの例示的なMRC表現は、フォアグラウンド及びバックグラウンドがJPEG圧縮されるように、しかもセレクタプレーンがITU−G4圧縮(標準のグループ4のファクシミリ圧縮)されるように指定する。レンダリングヒントプレーンは任意であると考えられるが、それが用いられる場合には、Lempel−Ziv−Welch方式と同様の圧縮方式をその圧縮に用いることができる。一般に、フォアグラウンド、バックグラウンド、セレクタ、及びレンダリングヒントプレーンは全て異なる解像度であってよく、それらはオリジナルのソース入力解像度を維持する必要はない。   The foreground and background planes are defined as two full color (L, a, b) or YCC planes. The selector plane is defined as a binary (1 bit deep) plane. One exemplary MRC representation specifies that the foreground and background are JPEG compressed, and that the selector plane is ITU-G4 compressed (standard group 4 facsimile compression). The rendering hint plane is considered arbitrary, but if it is used, a compression scheme similar to the Lempel-Ziv-Welch scheme can be used for the compression. In general, the foreground, background, selector, and rendering hint planes may all be at different resolutions and they need not maintain the original source input resolution.

「セグメント化された」MRC画像を、その構成要素(例えばプレーン)から戻すように組み立てる方法は、フォアグラウンドカラーを、セレクタプレーンの「マスク」を通してバックグラウンドプレーンの上に「注ぎ」、これにより、これらの位置において、バックグラウンドプレーンの前のコンテンツに上書きするようにすることによるものである。換言すると、この組み立ては、セレクタプレーンのバイナリ制御信号に基づいて、ピクセル毎に、フォアグラウンド情報及びバックグラウンド情報の間で多重化することにより達成される。例えば、セレクタの値が1である場合には、フォアグラウンドのコンテンツが用いられ、そうでない場合(すなわち、セレクタの値=0の場合)には、バックグラウンドのコンテンツが用いられる。そのマルチプレクシング操作は、全ての出力ピクセルが定義されるまで、ピクセル毎に繰り返される。   The method of assembling a “segmented” MRC image back from its components (eg, planes) is to “pour” the foreground color over the background plane through the “mask” of the selector plane, thereby This is because the content in front of the background plane is overwritten at the position. In other words, this assembly is accomplished by multiplexing between the foreground information and the background information on a pixel-by-pixel basis based on the binary control signal of the selector plane. For example, when the value of the selector is 1, the foreground content is used, and when it is not (that is, when the value of the selector = 0), the background content is used. The multiplexing operation is repeated for each pixel until all output pixels are defined.

ドキュメントのMRC表現の主な利点は、大きなデジタルカラードキュメントを格納し、送信し、及び操作するための効果的な方法を提供することである。この方法は、コントラストの高いエッジがある場合には、小さなカラー変化を識別する能力が大幅に低減される、という人間の視覚システムの特性を利用するものである。エッジの情報は、通常、滑らかに変化するカラー情報から分けられ、セレクタプレーンにおいて(多分、ソースピクセル当たり1セレクタサンプルより高い解像度で)コード化される。慎重な分離に続き、種々のプレーンを良好な圧縮及び高い品質をもつ標準的な圧縮方式(JPEG及びG4のような)を用いて独立して圧縮することができる。   The main advantage of the MRC representation of a document is that it provides an effective way to store, send and manipulate large digital color documents. This method takes advantage of the characteristics of the human visual system that the ability to identify small color changes is greatly reduced when there are high contrast edges. The edge information is usually separated from the smoothly changing color information and coded in the selector plane (possibly with a resolution higher than one selector sample per source pixel). Following careful separation, the various planes can be independently compressed using standard compression schemes (such as JPEG and G4) with good compression and high quality.

セグメントモジュールは、セグメント化されるべきフルカラーの入力画像を取り込み、3つのMRCプレーン、すなわちフォアグラウンドプレーンFG、バックグラウンドプレーンBG、及びセレクタプレーンSelについて3つの別々の出力、並びに幾つかの付加的な信号を生成する。セグメントモジュールのブロック図は図2に示される。セグメントモジュールは、セグメント化ステージ24の後に、MRCスケール及びタイルタグ生成ステージ44が続く2つのステージで構成される。セグメント化ステージ24は、2つの相互に排他的なモード(走査セグメント化24又はPDLセグメント化26)の1つにより作動することができる。   The segment module takes a full color input image to be segmented, three separate outputs for three MRC planes: foreground plane FG, background plane BG, and selector plane Sel, and some additional signals Is generated. A block diagram of the segment module is shown in FIG. The segment module consists of two stages followed by a segmentation stage 24 followed by an MRC scale and tile tag generation stage 44. The segmentation stage 24 can operate in one of two mutually exclusive modes (scan segmentation 24 or PDL segmentation 26).

走査セグメント化モジュール24に対する一次入力はSrc20である。これは更に、本出願人の係属中の米国特許出願D/A3011に詳述される8ビットのスクリーン・マグニチュード推定信号SCM22を利用する。走査セグメント化モジュール24は、フルカラー(生すなわち未処理)のフォアグラウンドプレーン出力Fgr30及びバックグラウンドプレーン出力Bgr28、及びモジュール24によりエクスポートされた(モジュール24によりスーパーサンプルされた可能性がある)Sel出力32を出力する。   The primary input to the scan segmentation module 24 is Src20. This further utilizes the 8-bit screen magnitude estimation signal SCM22 detailed in Applicant's pending US patent application D / A 3011. Scan segmentation module 24 provides full color (raw or raw) foreground plane output Fgr 30 and background plane output Bgr 28 and Sel output 32 (which may have been supersampled by module 24). Output.

PDLモード40において、PDLセグメント化モジュール26はSCM22を用いないが、代わりに、ヒント情報をPDLインタープリタからキャプチャする信号Rht34を用いることができ、CEFヒントプレーンHnt38にコード化される。PDLセグメント化モジュール26からの出力は、フルカラー(生すなわち未処理)のフォアグラウンドプレーンFgr30及びバックグラウンドプレーンBgr28、バイナリのセレクタプレーンSel32、及びヒントがある場合にはヒントプレーンHnt38を含む。上に示されるように、ヒントプレーンは1ビット又は8ビット深さとすることができる。   In PDL mode 40, PDL segmentation module 26 does not use SCM 22, but instead can use signal Rht34 to capture hint information from the PDL interpreter and is encoded into CEF hint plane Hnt38. The output from the PDL segmentation module 26 includes a full color (raw or raw) foreground plane Fgr30 and background plane Bgr28, a binary selector plane Sel32, and a hint plane Hnt38 if there is a hint. As indicated above, the hint plane can be 1 bit or 8 bits deep.

走査モード42及びPDLモード40についてのSrc画像は、典型的には、異なって処理されたものである。走査セグメントモジュール24は、デ・スクリーンされている入力に依存する。このことは、PDLソースから直接生成されるクリーンでノイズのない画像については必要とされない。   Src images for scan mode 42 and PDL mode 40 are typically processed differently. Scan segment module 24 relies on the input being descreened. This is not required for clean, noiseless images generated directly from PDL sources.

走査処理において、ソース入力画像Src20のクロマ成分は、高速走査方向(x:XCSS)において、係数2によりサブサンプルされると仮定される。セグメンタにより生成された如何なるカラー画像もXCSSを用いない。ソース画像のクロマサンプルがアクセスされた場合には、如何なる「調整」フィルタ作用も必要とされない。すなわち、4つのサンプルXCSS象限、L0011についてであり、ピクセル0は、L001であり、ピクセル1は、L101、である。 In the scanning process, it is assumed that the chroma component of the source input image Src20 is subsampled by a factor of 2 in the fast scan direction (x: XCSS). Any color image generated by the segmenter does not use XCSS. If a chroma sample of the source image is accessed, no “tuning” filtering is required. That is, for four sample XCSS quadrants, L 0 A 0 L 1 B 1 , pixel 0 is L 0 A 0 B 1 , and pixel 1 is L 1 A 0 B 1 .

セレクタプレーンSelの出力はバイナリ(1ビット深さ)であり、パックされたセレクタプレーンSpkは、2×2のバイナリの隣接するセレクタピクセル(4ビット)を互いにパックする。   The output of the selector plane Sel is binary (1 bit deep), and the packed selector plane Spk packs 2 × 2 binary adjacent selector pixels (4 bits) together.

PDL処理においては、ソース入力Src20は、フルカラー画像であると仮定され、ここでクロマチャネルは典型的にはサブサンプルされず、したがって、輝度チャネルと同じ解像度である。   In PDL processing, the source input Src20 is assumed to be a full color image, where the chroma channel is typically not subsampled and is therefore the same resolution as the luminance channel.

一般に、エクスポートされたフォアグラウンド、バックグラウンド、及びセレクタプレーンはすべて、入力画像に対して異なる解像度であってよい。例えば、フォアグラウンド及びバックグラウンドプレーンは、典型的には、ダウンサンプルされ、セレクタプレーンは元の入力解像度からアップサンプルされることがある。アップ又はダウンサンプリングの量は、ソフトウェア制御の下でプログラム可能である。   In general, the exported foreground, background, and selector plane may all be at different resolutions for the input image. For example, the foreground and background planes are typically downsampled and the selector plane may be upsampled from the original input resolution. The amount of upsampling or downsampling is programmable under software control.

MRCスケール及びタイルタグ生成モジュール44は、最初(生:未処理)のバックグラウンドBgr28、フォアグラウンドFgr30、セレクタSel32、及び存在する場合には(PDLモードのみ)、任意に、ヒントHnt38を読み込む。これは、「ホール」すなわち生(未処理)の画像において前もって指定されていないピクセルをサブサンプルし塗ることにより、最終カラーMRC層、すなわちバックグラウンドBgd46及びフォアグラウンドFgdを生成する。さらに、MRCスケール及びタイルタグ生成モジュール44は、バックグラウンドTtb50、フォアグラウンドTtf52、セレクタTts53、及び存在する場合には(PDLモードのみ)、任意にレンダリングヒントTth54についての4つの関連するタイルタグ信号を生成する。タイルタグは、タイル(又はストリップ)当たり1バイナリビットであり、現在のタイル全体を省くことができるかどうかを示す。このことは更に、全体のファイルの大きさを減らす。欠けているタイルは、各々のプレーンについて自動的に既定のデフォルトカラーに塗られる。   The MRC scale and tile tag generation module 44 reads the first (raw: unprocessed) background Bgr 28, foreground Fgr 30, selector Sel32, and optionally (if PDL mode only), optionally reads the hint Hnt38. This creates a final color MRC layer, background Bgd 46 and foreground Fgd, by sub-sampling and painting pixels that have not been previously specified in the “hole” or raw (raw) image. In addition, the MRC scale and tile tag generation module 44 generates four associated tile tag signals for the background Ttb50, foreground Ttf52, selector Tts53, and optionally (PDL mode only), and optionally the rendering hint Tth54. A tile tag is one binary bit per tile (or strip) and indicates whether the entire current tile can be omitted. This further reduces the overall file size. Missing tiles are automatically painted to the default color for each plane.

走査セグメント化モジュール24は、走査されたドキュメントについて、3つのプレーンにMRCセグメント化を行う役割のものである。走査セグメント化モジュール24に対する入力は、入力カラー信号Src20及び8ビットのスクリーン・マグニチュード推定信号SCM22を含む。走査セグメント化モジュール24は、フルカラー(生:未処理)のフォアグラウンドプレーンFgr28及びバックグラウンドプレーンBgr30、及びセレクタSel32プレーンを出力する。   The scan segmentation module 24 is responsible for performing MRC segmentation on the scanned document into three planes. Inputs to the scan segmentation module 24 include an input color signal Src20 and an 8-bit screen magnitude estimation signal SCM22. The scan segmentation module 24 outputs a full color (raw: unprocessed) foreground plane Fgr28, background plane Bgr30, and selector Sel32 plane.

走査セグメント化モジュール24のブロック図は図3に示される。以下は、走査セグメント化モジュール24を構成する種々のモジュールについての簡単な説明である。カラー入力信号Src20は、関心のある現在のピクセル上に中心が置かれた7×7ウィンドウにおいて、動的(ダイナミック)しきい値処理のために、最小Min及び最大Maxカラー値を探索する依存最小最大モジュール60に転送される。   A block diagram of the scan segmentation module 24 is shown in FIG. The following is a brief description of the various modules that make up the scan segmentation module 24. The color input signal Src20 is a dependent minimum that searches for the minimum Min and maximum Max color values for dynamic thresholding in a 7 × 7 window centered on the current pixel of interest. Transferred to the maximum module 60.

最小Min61及び最大Max63値は、ダイナミックしきい値モジュール62及び走査MRCモジュール64に転送される。ダイナミックしきい値モジュール62はさらに、入力カラー画像Src20及び8ビットのスクリーン・マグニチュード推定信号SCM22を用いる。ダイナミックしきい値モジュール62は、モノクロの8ビット信号Grr55を出力し、そのバイアスされたゼロ交差は、セレクタプレーンにおけるエッジの位置を表す。また、ダイナミックしきい値モジュール62はさらに、セグメント化が適用される場合には、ピクセル毎に走査MRC分離モジュール64に通信するように用いられ、その場合には、どれだけの付加的な増強が適用されるかを通信する8ビットのセグメント増強制御Enh59を生成する。   The minimum Min 61 and maximum Max 63 values are transferred to the dynamic threshold module 62 and the scanning MRC module 64. The dynamic threshold module 62 further uses the input color image Src20 and the 8-bit screen magnitude estimation signal SCM22. The dynamic threshold module 62 outputs a monochrome 8-bit signal Grr55, whose biased zero crossing represents the position of the edge in the selector plane. Also, the dynamic threshold module 62 is further used to communicate to the scanning MRC separation module 64 on a pixel-by-pixel basis when segmentation is applied, in which case how much additional enhancement is provided. An 8-bit segment enhancement control Enh 59 that communicates what is applied is generated.

ブロックスムージング(平滑化)ユニット56の目的は、弱い(「偽」とも言われる)エッジを強いエッジから離れるように移動させて、フォアグラウンド及びバックグラウンドのJPEG最小コード化ユニット(MCU)ブロック内でコントラストの高い遷移を阻止するようにすることである。近くに如何なる強いエッジもない場合には、弱いエッジはJPEGブロックから近くのブロックの間の境界に押し出される。この方法は、JPEGブロック内での不必要な急激な遷移を排除し、このようにして、圧縮及び質全体が増加されることになる。ブロックスムージングユニット56からの出力は、入ってくる信号Grr55の平滑化された(フィルタ処理された)形態を表す8ビットの平滑化されたGrs57信号である。   The purpose of the block smoothing unit 56 is to move the weak (sometimes referred to as “false”) edges away from the strong edges and contrast in the foreground and background JPEG minimum coding unit (MCU) blocks. To prevent high transitions. In the absence of any strong edges nearby, weak edges are pushed from the JPEG block to the boundary between nearby blocks. This method eliminates unnecessary abrupt transitions within the JPEG block, thus increasing the overall compression and quality. The output from the block smoothing unit 56 is an 8-bit smoothed Grs57 signal representing the smoothed (filtered) form of the incoming signal Grr55.

フォアグラウンドエローション(erosion)ユニット200は、線形YCCセグメント化を用いて、薄い(しかし壊れてはいない)テキストの要求事項に対処するように用いられる。一定の値がグレイセレクタから引かれ、これによりフォアグラウンドが薄くなる/エローションされる。このことは、近くの試験が、以下にさらに完全に詳述されるように、薄くすることが破線をもたらさないことを実証する場合にのみ行われる。   The foreground erosion unit 200 is used to address thin (but not broken) text requirements using linear YCC segmentation. A constant value is pulled from the gray selector, which makes the foreground lighter / eroded. This is done only if a nearby test demonstrates that thinning does not result in a dashed line, as will be more fully detailed below.

バイナリスケールユニット66は、ブロックスムージング56の出力からもたされた平滑化されたグレイセレクタ信号Grs57をスーパーサンプルする能力を与える。通常の1:1モードにおいては、Grs57信号はしきい値にされて、バイナリのセレクタプレーン出力Sel32が生成されるようになる。しかしながら、高品質のテキスト及び線画の再現においては、セレクタプレーンを、入力解像度の2倍でスーパーサンプルすることがある(例えば、600dpiの入力について1200dpiで)。セレクタ信号のスーパーサンプル処理は、しきい値化の前にサンプル処理周波数を2倍にすることにより行われる。その結果もたらされるより高い解像度のセレクタピクセルは、隣接する4つが一度にパックされて、パックされたセレクタ信号Spk122にされる。   Binary scale unit 66 provides the ability to supersample the smoothed gray selector signal Grs57 derived from the output of block smoothing 56. In the normal 1: 1 mode, the Grs57 signal is thresholded to produce a binary selector plane output Sel32. However, in high quality text and line art reproduction, the selector plane may be supersampled at twice the input resolution (eg, 1200 dpi for 600 dpi input). Supersample processing of the selector signal is performed by doubling the sample processing frequency before thresholding. The resulting higher resolution selector pixel is packed into the packed selector signal Spk 122, with the four adjacent packed at once.

マークエッジ処理モジュール58は、パックされた高解像度のセレクタ出力Spk122を取り込み、関心のある現在の(低解像度)ピクセル上に中心を置く5×5(高解像度)ウィンドウにおけるオン及びオフのピクセル数をカウントする。マークエッジ処理モジュール58からの出力は2ビットの信号See142である。See信号142は、5×5ウィンドウの内側のすべての入力ピクセルがオフである場合には0に設定される(3×3の一定のバックグラウンド区域に対応する)。同様に、See信号142は、ウィンドウの内側のすべての入力ピクセルがオンである場合には3に設定される(3×3の一定のフォアグラウンド区域に対応する)。更に、See出力は、5×5ウィンドウが、ほとんどバックグラウンドであるか又はほとんどフォアグラウンドのそれぞれである場合には、1又は2に設定される。   The mark edge processing module 58 takes the packed high resolution selector output Spk 122 and calculates the number of on and off pixels in a 5 × 5 (high resolution) window centered on the current (low resolution) pixel of interest. Count. The output from the mark edge processing module 58 is a 2-bit signal See142. The See signal 142 is set to 0 (corresponding to a constant background area of 3 × 3) if all input pixels inside the 5 × 5 window are off. Similarly, the See signal 142 is set to 3 if all input pixels inside the window are on (corresponding to a 3 × 3 constant foreground area). In addition, the See output is set to 1 or 2 when the 5 × 5 window is almost background or almost foreground respectively.

最後に、走査MRC分離モジュール64は、セグメント化されるべきフルカラーのソース信号Src20、並びに、依存(dependent)最小最大モジュール60からのカラーの最小及び最大(Min、Max)を取り込む。更に、MRC分離モジュール24はマークエッジ処理モジュール58からのSee信号142、及びダイナミックしきい値モジュール62からセグメント化及び増強信号Enh59を用いる。MRC分離モジュール64は、実際は、2つのフルカラーの出力Fgr24及びBgr30を、フォアグラウンド及びバックグラウンドプレーンのそれぞれについての粗い推定値として生成する。ここで、走査セグメント化モジュールの種々のモジュールが以下に述べられる。   Finally, the scanning MRC separation module 64 captures the full color source signal Src20 to be segmented and the minimum and maximum colors (Min, Max) from the dependent minimum / maximum module 60. Further, the MRC separation module 24 uses the See signal 142 from the mark edge processing module 58 and the segmentation and enhancement signal Enh 59 from the dynamic threshold module 62. The MRC separation module 64 actually produces two full color outputs Fgr24 and Bgr30 as coarse estimates for the foreground and background planes, respectively. Here, the various modules of the scan segmentation module are described below.

依存最小最大モジュールのブロック図が図4に示される。依存最小最大モジュール60は、Src信号20を入力し、関心のあるピクセル80上に中心を置く7×7ウィンドウを調査して、最大L及び最小Lピクセルを見出し、ここでLは輝度チャネルである。最大出力68は最大L72を有するピクセルである。最小出力70は最小L74を有するピクセルである。最小出力70は最小L74を有するピクセルである。その結果もたらされるクロマ値はしたがって、極値が見出された位置に依存する。   A block diagram of the dependent minimum and maximum module is shown in FIG. The dependent minimum / maximum module 60 inputs the Src signal 20 and examines a 7 × 7 window centered on the pixel of interest 80 to find the maximum L and minimum L pixels, where L is the luminance channel. . The maximum output 68 is the pixel having the maximum L72. The minimum output 70 is the pixel with the minimum L74. The minimum output 70 is the pixel with the minimum L74. The resulting chroma value is therefore dependent on the location where the extreme value was found.

依存最小最大モジュール60の作動が図5に示される。この作動は2つの段階で進められる。第1の段階において、依存最小最大モジュール60は、輝度成分Lの最も大きな68及び最も小さな70サンプルをウィンドウにわたって探索する。最小輝度値74及び最大輝度値72の位置が見出されると、それらは、これらの位置におけるクロマ成分(A、B)と併せて出力される。Src信号20がXサブサンプルされたクロマ成分と共にこのモジュールに到達した場合でも、これが、Xクロマサブサンプル処理が中断される点である。すなわち、最大及び最小カラー信号は、Xサブサンプルされたクロミナンスをもたない。   The operation of the dependent minimum and maximum module 60 is illustrated in FIG. This operation proceeds in two stages. In the first stage, the dependent minimum / maximum module 60 searches the window for the largest 68 and smallest 70 samples of the luminance component L. When the positions of the minimum brightness value 74 and the maximum brightness value 72 are found, they are output together with the chroma components (A, B) at these positions. Even if the Src signal 20 arrives at this module with an X subsampled chroma component, this is the point at which the X chroma subsample processing is interrupted. That is, the maximum and minimum color signals do not have X subsampled chrominance.

このフィルタ作用工程は分離可能である。例えば、個々の列の最小/最大を最初に計算して、次に、最小Lを有する列最小ピクセルを見出すことにより最終の最小74を計算することができる。このことは、Src画像にわたって実行されるウィンドウとして必要とされる段階的な作業が、最小及び最大出力の両方について、1つの高さ7の列と、1つの幅7の行とを計算することになる。   This filtering step is separable. For example, the minimum / maximum of an individual column can be calculated first, and then the final minimum 74 can be calculated by finding the column minimum pixel with minimum L. This means that the step-by-step work required as a window performed over the Src image is to calculate one height 7 column and one width 7 row for both minimum and maximum output. become.

図6を参照すると、ダイナミックしきい値モジュール62は、適応しきい値化を入ってくるカラーソース信号Src20に適用して、ゼロ交差がセレクタプレーンの遷移を表す生の符号付8ビットのグレイセレクタ信号Grr出力114を生成する。グレイセレクタ値≧0は、セレクタ値が1であるピクセルをマークし、フォアグラウンドに置かれる。グレイセレクタ値<0は、バックグラウンドに置かれるピクセルをマークする。図6に示されるように、ダイナミックしきい値モジュール60は、依存最小最大モジュール60からの一対の依存最小/最大(Min、Max)90及び92のそれぞれ、並びにスクリーン推定モジュール(SEM)からの8ビットのスクリーン・マグニチュード推定信号Scm22を利用する。ダイナミックしきい値モジュール62はさらに、8ビットの信号Enh118を生成する。Enh信号118は、走査MRC分離モジュール64に通信されて、ピクセルがバックグラウンド及び/又はフォアグラウンドプレーンに置かれたときに、どれだけの増強が適用されるかを判断するようにする。   Referring to FIG. 6, the dynamic threshold module 62 applies adaptive thresholding to the incoming color source signal Src20 to generate a raw signed 8-bit gray selector where the zero crossing represents a selector plane transition. A signal Grr output 114 is generated. A gray selector value ≧ 0 marks a pixel with a selector value of 1 and puts it in the foreground. A gray selector value <0 marks a pixel that is placed in the background. As shown in FIG. 6, the dynamic threshold module 60 includes a pair of dependent minimum / maximum (Min, Max) 90 and 92 from the dependent minimum / maximum module 60 and 8 from the screen estimation module (SEM), respectively. A bit screen magnitude estimation signal Scm22 is used. The dynamic threshold module 62 further generates an 8-bit signal Enh118. The Enh signal 118 is communicated to the scanning MRC separation module 64 to determine how much enhancement is applied when the pixel is placed in the background and / or foreground plane.

ダイナミックしきい値モジュール62は、ダイナミックしきい値、静的しきい値、及びフォアグラウンドに対する力という3つのセグメント化モジュールで作動する。静的しきい値化は、画像が平滑である(変化しない)場合に適用される。このモードにおいては、DefautThr76より大きいか又は等しい輝度値をもったピクセルがバックグラウンドに割り当てられ(Grr==127=−1)、DefaultThrより少ない輝度値をもったピクセルがフォアグラウンドに割り当てられる(Gr==129=+1)。127及び129(+−1)は、Grr114についての小さなマグニチュード値を表す。これらは、近くにある強い決定の位置及び極性を考慮することによって、後続するブロックスムージングモジュール56により修正することができる弱い決定を表す。前記の強い決定は、符号付Grrマグニチュード>1(符号化された値<127、又は>129)により表される。強い決定はダイナミックしきい値モードにおいてのみ生成され、強い決定だけが非ゼロEnhコードを有することができる。静的しきい値化及びフォアグラウンドに対する力のモードの両方は、弱い決定しか生成しない。   The dynamic threshold module 62 operates with three segmentation modules: dynamic threshold, static threshold, and force against foreground. Static thresholding is applied when the image is smooth (does not change). In this mode, pixels with luminance values greater than or equal to DefaultThr76 are assigned to the background (Grr == 127 = −1), and pixels with luminance values less than DefaultThr are assigned to the foreground (Gr = = 129 = + 1). 127 and 129 (+ −1) represent small magnitude values for Grr114. These represent weak decisions that can be corrected by the subsequent block smoothing module 56 by taking into account the location and polarity of strong decisions that are nearby. Said strong decision is represented by signed Grr magnitude> 1 (encoded value <127 or> 129). Strong decisions are generated only in dynamic threshold mode, and only strong decisions can have non-zero Enh codes. Both static thresholding and the mode of force against the foreground produce only weak decisions.

幾つかの構成においては、フォアグラウンドに対する力のモードは、ハーフトーン画像についてイネーブルにされ、このモードは、HTFGScmThr84を256より少ない或る値に設定することによりイネーブルにされる。Scm22がHTFGScmThr84に等しいか又はこれより大きい場合にはいつでも、Grr114は129(=±1)という最小フォアグラウンド値にさせられ、Enh118はゼロに設定される。   In some configurations, the force mode against foreground is enabled for halftone images, and this mode is enabled by setting HTFGScmThr84 to some value less than 256. Whenever Scm22 is equal to or greater than HTFGScmThr84, Grr114 is brought to a minimum foreground value of 129 (= ± 1) and Enh118 is set to zero.

フォアグラウンドに対する力が優先されない場合には、セグメント化は、弱い静的しきい値の決定の生成と強いダイナミックしきい値の決定の生成との間でアクティブに切り換わる。信号EnhEnは、強い決定を示し、EhFVsScm関数の出力をEnhにゲート制御する。EhFVsScm関数は、スクリーン・マグニチュード推定Scmをドメイン値として用いる。真である場合、EnhEnはさらに、符号付き8ビットの信号GSelをGrrの符号化のためのソースとして選択する。以下にさらに詳細に述べられるGSelは、ドット積モジュールの一次出力である。図6に示されるように、フォアグラウンドに対する力(HTFGEn)が優先されない場合には、ドット積ユニットの他の2つの出力、Ccc及びCc0(以下に述べられる)が試験され、その結果が互いにORedされて、EnhEnが計算されるようになる。   If the force on the foreground is not prioritized, segmentation switches actively between the generation of weak static threshold decisions and the generation of strong dynamic threshold decisions. The signal EnhEn indicates a strong decision and gates the output of the EhFVsScm function to Enh. The EhFVsScm function uses the screen magnitude estimate Scm as the domain value. If true, EnhEn further selects the signed 8-bit signal GSel as the source for encoding Grr. GSel, described in further detail below, is the primary output of the dot product module. As shown in FIG. 6, if the force on the foreground (HTFGEn) is not preferred, the other two outputs of the dot product unit, Ccc and Cc0 (described below), are tested and the results are ORed with each other. Thus, EnhEn is calculated.

Ccc≧EhClrConThrVsMin関数の出力である場合には、EnhEnがイネーブルにされる。或いは、Cc0≧EhLumConThrVsMax関数及びEhLumConThrVsScm関数の最大である場合には、EnhEnがイネーブルにされる。EhClrConThrVsMin関数及びEhLumConThrVsMax関数についての入力信号が、Min及びMax信号それぞれの輝度成分である場合には、EhLumConThrVsScm関数についての入力信号はScmである。   If it is the output of the Ccc ≧ EhClrConThrVsMin function, EnhEn is enabled. Alternatively, EnhEn is enabled if Cc0 ≧ EhLumConThrVsMax and EhLumConThrVsScm functions are maximum. When the input signals for the EhClrConThrVsMin function and the EhLumConThrVsMax function are the luminance components of the Min and Max signals, the input signal for the EhLumConThrVsScm function is Scm.

ドット積ユニット82(図6の左上から2つ目のブロック)は、フルカラーの入力信号Src20、並びに、依存最小最大ユニットからのフルカラーの最小92及び最大90(Min、Max)を用いる。これらの値は、輝度の極値、及び関心のある現在のピクセル上に中心が置かれた(7×7)ウィンドウ内に見出される対応するクロマ値を表す。このブロックの作動は、主に、2つのベクトルのドット積乗算を行うことである。
[数1]
GSel=最小(127、最大(−127(<X、Y>>/256)))
ここで、<X、Y>は2つのベクトルX及びYの間のドット積演算である
[数2]
<X、Y>=(XL、XA、XB)(YL、YA、YB1=XLL+XAA+XBB
ここで、Xは、下記数式3の通りであり、

Figure 0004226484
及びYは下記数式4の通りである。
Figure 0004226484
The dot product unit 82 (second block from the upper left in FIG. 6) uses the full color input signal Src20 and the full color minimum 92 and maximum 90 (Min, Max) from the dependent minimum maximum unit. These values represent the extreme values of the luminance and the corresponding chroma values found in the (7 × 7) window centered on the current pixel of interest. The operation of this block is mainly to perform a dot product multiplication of two vectors.
[Equation 1]
GSel = minimum (127, maximum (−127 (<X, Y >>>> 256)))
Here, <X, Y> is a dot product operation between two vectors X and Y [Equation 2]
<X, Y> = (X L , X A , X B ) (Y L , Y A , Y B ) 1 = X L Y L + X A Y A + X B Y B
Here, X is as shown in Equation 3 below.
Figure 0004226484
And Y are as in Equation 4 below.
Figure 0004226484

さらに改善するための実施形態としては、LMN==0である場合に、数式4における輝度成分値はLMX/2からLMX/4に変化する。これは、前の鮮明化ステージにより生成されるのが普通である輝度のアンダーシュートを調整する一次の試みである。これは、薄いテキスト特徴がセグメント化工程により拡大されるのを阻止することを助ける。すなわち、以下の数式5に表される。

Figure 0004226484
The embodiment for further improvement, in the case of L MN == 0, the luminance component value in equation 4 changes from L MX / 2 to L MX / 4. This is a primary attempt to adjust the luminance undershoot that is usually produced by the previous sharpening stage. This helps prevent thin text features from being expanded by the segmentation process. That is, it is expressed by the following formula 5.
Figure 0004226484

数式4又は5における(L、A、B)値は、入ってくる信号Src20の対応するカラー成分である。数式3におけるXベクトルは、(Min、Max)の最大及び最小の間のベクトル差である。数式4におけるYベクトルは、入ってくる信号Src20から最小及び最大平均を引いたものである。これら2つのベクトルのドット積を取ることにより、出力は、Xベクトルに対して垂直であり、それを途中まで沿って交差するプレーンからの相対的な距離と比例するようになる。{XA、XB、YL、YA、YB}並びに最終出力GSelは負になることがある。数式1におけるドット積出力の絶対マグニチュードは、ゼロ交差を識別することほどは重要ではないため、この結果は単純に256により割られて(8だけ右にシフトする)、8ビット範囲に嵌まるように換算し戻される。(ドット積の正規化は、ベクトルのマグニチュードにより割ることを必要とする)。しかしながら、出力は、多くの場合、依然として8ビット範囲を桁あふれすることがあるため(おおよそ3又は最大1.5ビットの係数だけ)、これがさらに大きくなりすぎる場合には、出力マグニチュードを127に制限する論理を加えることが必要になる。ドット積82出力は、図6においては、符号付8ビット信号GSel又はグレイセレクタ出力として示される。ドット積乗数の大きさを8ビットに制限するために、X及びYの両方の成分を1/2によりあらかじめ換算し、最終除数を64に変更することができる。 The (L, A, B) values in Equation 4 or 5 are the corresponding color components of the incoming signal Src20. The X vector in Equation 3 is the vector difference between the maximum and minimum of (Min, Max). The Y vector in Equation 4 is the incoming signal Src20 minus the minimum and maximum averages. By taking the dot product of these two vectors, the output is perpendicular to the X vector and proportional to the relative distance from the plane that intersects it halfway. {X A , X B , Y L , Y A , Y B } and the final output GSel can be negative. The absolute magnitude of the dot product output in Equation 1 is not as important as identifying the zero crossing, so this result is simply divided by 256 (shifted right by 8) to fit into the 8-bit range. Converted back to. (Dot product normalization requires division by the magnitude of the vector). However, the output can still often overflow the 8-bit range (approximately 3 or up to a factor of 1.5 bits), so if this becomes too large, limit the output magnitude to 127 It is necessary to add logic to do. The dot product 82 output is shown in FIG. 6 as a signed 8-bit signal GSel or a gray selector output. In order to limit the size of the dot product multiplier to 8 bits, both the X and Y components can be pre-converted by 1/2 and the final divisor can be changed to 64.

ドット積ユニット82はさらに、輝度及びクロマ・コントラスト・マグニチュードを測定する2つの8ビットの信号を出力する。輝度部分Cc0106はベクトルXの第1成分により表される。
[数6]
Cc0=XL=L最大−L最小
The dot product unit 82 further outputs two 8-bit signals that measure luminance and chroma contrast magnitude. Luminance portion Cc0106 is represented by the first component of vector X.
[Equation 6]
Cc0 = X L = L maximum− L minimum

全体のクロマ・コントラスト・マグニチュードCcc104についてのスカラー尺度はさらに、ベクトルXの2つのクロマ成分の絶対値を互いに加えることにより生成される。

Figure 0004226484
輝度成分における絶対値は、Lが正の範囲[0...255]に制限されるために無視することができ、最大は常に最小より大きい。 A scalar measure for the overall chroma contrast magnitude Ccc 104 is further generated by adding together the absolute values of the two chroma components of the vector X.
Figure 0004226484
The absolute value of the luminance component is a range where L is positive [0. . . Can be ignored and the maximum is always greater than the minimum.

図6の左部分における決定論理関数91は、デフォルトとアクティブなセグメント化モードとの間での切り換えを管理する。各々の関数は、区分的線形関数を表す小さな組の(x、y)点の対により表される。最初のx値より小さいx値については、出力は最初のy値である。x値>最後のx値については、出力は最後のy値である。   The decision logic function 91 in the left part of FIG. 6 manages the switch between default and active segmentation mode. Each function is represented by a small set of (x, y) point pairs that represent piecewise linear functions. For x values less than the first x value, the output is the first y value. For x value> last x value, the output is the last y value.

上記の論理の重要性は、アクティブなセグメント化モードの下で作動するためには、ドット積輝度コントラスト又はドット積クロマコントラストのいずれかが十分に大きくなくてはならないことである。クロマコントラストは、(7×7)ウィンドウにおいて見出される最小輝度の関数より大きくなくてはならない。同様に、輝度コントラストは、同じウィンドウ内に見出される最大輝度の関数より大きくなくてはならず、またさらに、スクリーン・マグニチュードScmの関数より大きくなくてはならない。エクスポート前に、HTFGEn及びENhEnによりゲート制御された符号付きグレイセレクタの出力は、128を加えることにより、符号なし8ビット信号Grrとして符号化される。   The importance of the above logic is that either dot product luminance contrast or dot product chroma contrast must be large enough to operate under active segmentation mode. The chroma contrast must be greater than a function of the minimum brightness found in the (7 × 7) window. Similarly, the brightness contrast must be greater than a function of maximum brightness found in the same window, and moreover greater than a function of screen magnitude Scm. Prior to export, the output of the signed gray selector gated by HTFGEn and ENhEn is encoded as 128 by adding 128 to the unsigned 8-bit signal Grr.

ブロックスムージングユニット56の目的は、弱い(別名「偽」)エッジをできるだけ強いエッジから遠くに離すように移動させることである。このことは、JPEGプレーンにおけるパルス幅を増加させ(周波数を減らし)、これにより圧縮された大きさ及び圧縮ノイズが減ることになる。これを遮断する如何なる強いエッジもない場合には、弱いエッジはブロックから完全に掃引して出される。弱いエッジが2つの強いエッジの間でトラップされた場合には、2つの間の途中に再配置されることになる。この方法はさらに、3つのプレーンすべてにおける圧縮を改善する多数の弱いエッジの遷移を合体させる/取り除く。   The purpose of the block smoothing unit 56 is to move weak (aka “false”) edges as far away from strong edges as possible. This increases the pulse width in the JPEG plane (decreases the frequency), thereby reducing the compressed size and compression noise. In the absence of any strong edge blocking this, the weak edge is swept out of the block. If a weak edge is trapped between two strong edges, it will be repositioned halfway between the two. This method also coalesces / removes multiple weak edge transitions that improve compression in all three planes.

ブロックスムージングユニット56に対する入力は、しきい値化工程からの8ビットの生のグレイセレクタ出力Gr.である(アクティブ又はデフォルトのセグメント化のいずれかの下での)。ブロックスムージングユニット56からの出力は、入力信号Grの平滑化された(フィルタされた)形態を表す8ビットの平滑化されたグラス信号である。   The input to the block smoothing unit 56 is the 8-bit raw gray selector output Gr. (Under either active or default segmentation). The output from the block smoothing unit 56 is an 8-bit smoothed glass signal that represents the smoothed (filtered) form of the input signal Gr.

ブロックスムージングユニット56の一番最初の段階は、Gr.’を符号付の数にするために、128のバイアスを引くことである(Ms.をトグルする)。次に、(Gr.−128)の範囲が調査される。これが−1又は1と等しい場合には、弱いエッジBG又はFGのそれぞれであると考えられる。−1又は1より大きいすべてのものは、強いBG又はFGエッジのいずれかであると考えられる。   The very first stage of the block smoothing unit 56 is Gr. Subtract 128 biases (toggling Ms.) to make 'be a signed number. Next, the range of (Gr.-128) is examined. If this is equal to -1 or 1, it is considered to be a weak edge BG or FG, respectively. Anything greater than -1 or 1 is considered to be either a strong BG or FG edge.

ブロックスムージング工程は、Bgd及びFgdプレーンについてのJPEG最小符号化ユニット(MCU)の大きさを表す正方形の一時的な格納区域(Tm[Sm][sz]において4つのパスを含む。例えば、Bgd及びFgdがJPEC圧縮のために係数4によりサブサンプルされる場合には、さらにクロミナンス・成分が付加的に係数2によりサブサンプルされる場合には、MCUは16×16となる。このブロックスムージングアルゴリズムに必要なTmpブロックは、Tmp[64][64]の寸法にされる。実施における制約はこのブロックの大きさをより小さくすることを要求し、この場合は32×32が適するであろう。現在のパイプライン構成は、1/4の縮小を適用するときにはクロマのサブサンプリングが用いられないために、32×32ブロックしか必要としない。   The block smoothing process includes four passes in a square temporary storage area (Tm [Sm] [sz]) that represents the size of the JPEG minimum coding unit (MCU) for the Bgd and Fgd planes. If Fgd is subsampled by a factor of 4 for JPEC compression, then if the chrominance component is additionally subsampled by a factor of 2, the MCU will be 16 × 16. The required Tmp block is sized to Tmp [64] [64] Implementation constraints require that the block size be smaller, in this case 32x32 would be suitable. This pipeline configuration does not use chroma subsampling when applying 1/4 reduction. Only 32 × 32 blocks are required.

第1のパスにおいて(Grr−128)ピクセルは、各々の行が独立したTmpの中に左から右へ処理される。強いエッジがある場合にはいつでも、対応するTmpの位置が+/−K(あらかじめ定義された定数==2*Tmp−1の寸法)に初期化される。符号はGrr−128と同じである。或いは、弱いエッジについては、Tmpはマグニチュードが1だけ減らされた前のTmp値で書かれる。第1のパスが左から右に移動しているため、前のTmp値はちょうど左側にあるTmp値である。行における第1の値の前の値は、0になるように定義される。マグニチュードを1だけ減らすことは、+4を+3に、−2をー1に、及び0を0に変換する。さらに、このパスにおいては、すべての弱い値、+1、−1の蓄積(WeakCnt)が計算される(Grrが弱いところだけ)。   In the first pass, (Grr-128) pixels are processed from left to right in each row's independent Tmp. Whenever there is a strong edge, the position of the corresponding Tmp is initialized to +/− K (predefined constant == 2 * Tmp−1 dimension). The code is the same as Grr-128. Alternatively, for weak edges, Tmp is written with the Tmp value before the magnitude was reduced by one. Since the first path is moving from left to right, the previous Tmp value is just the Tmp value on the left side. The value before the first value in the row is defined to be zero. Decreasing magnitude by 1 converts +4 to +3, -2 to -1, and 0 to 0. In addition, in this pass, all weak values, accumulations of +1, −1 (WeakCnt) are calculated (only where Grr is weak).

第2のパスにおいては、Tmpの各々の行は、右から左に旋回し、今回は、マグニチュードが減った前の値が現在の値と比較される。最も大きなマグニチュードをもった値は、現在の位置に置かれる。再び、右側にある第1の値についての前の値は0と仮定される。パス1及び2の行は独立しているため、パス2は、パス1と交互配置することができる。パス3及び4は、方向が上から下及び下から上であることを除いては、パス2と同じである。   In the second pass, each row of Tmp turns from right to left and this time the value before the magnitude has decreased is compared with the current value. The value with the largest magnitude is placed at the current position. Again, the previous value for the first value on the right is assumed to be zero. Since the rows of passes 1 and 2 are independent, pass 2 can be interleaved with pass 1. Passes 3 and 4 are the same as pass 2 except that the direction is from top to bottom and from bottom to top.

4番目のパスの後、最終的な平滑化された結果がTmpを調査することにより生成される。Tmp値が最大マグニチュード(+K又は−K)を有する場合には、用いられる値はGrrからの元の強いエッジの値である。或いは、弱いフォアグラウンド又はバックグラウンドについてのコード(128+1又は128−1)が、Tmp値が正であるか又は負であるかによって用いられる。   After the fourth pass, the final smoothed result is generated by examining Tmp. If the Tmp value has a maximum magnitude (+ K or -K), the value used is the value of the original strong edge from Grr. Alternatively, a weak foreground or background code (128 + 1 or 128-1) is used depending on whether the Tmp value is positive or negative.

図7を参照すると、バイナリ・スケール・モジュール66は、8ビットのグレイスケールセレクタの入力Grs120を、バイナリのセレクタプレーンの出力Sel32に変換する。高品質テキスト及び線画においては、バイナリのセレクタ出力Sel32はSrc20より高い解像度で維持することができる。例えば、現在の設計は、各々の方向において2倍の解像度を用いることを可能にするため(SEG_Sel_ScaleUp)、標準的な600dpiのスキャナについては、バイナリのSel信号の出力解像度は1200dpiになることがある。セレクタ論理モジュールは、グレイセレクタGrs入力をより高い解像度に補間し、その後信号をしきい値にしてバイナリの出力Sel32を生成するようにする役割のものである。冗長なSel(Spk)のパックされたコピーがさらにSrc20解像度で生成される。   Referring to FIG. 7, the binary scale module 66 converts the 8-bit grayscale selector input Grs120 to the binary selector plane output Sel32. For high quality text and line drawings, the binary selector output Sel32 can be maintained at a higher resolution than Src20. For example, the current design allows the use of twice the resolution in each direction (SEG_Sel_ScaleUp), so for a standard 600 dpi scanner, the output resolution of the binary Sel signal may be 1200 dpi. . The selector logic module is responsible for interpolating the gray selector Grs input to a higher resolution and then generating a binary output Sel32 with the signal as a threshold. A redundant Sel (Spk) packed copy is also generated at Src20 resolution.

バイナリ・スケール・モジュール66のブロック図が図8に示される。8ビットのグレイセレクタ入力信号Grs120が、最初に、2Dの双一次補間124を用いて、各々の方向で、係数2によりグレイドメインにおいて補間される。双一次補間からの出力は、補間された(スーパーサンプルされた)セレクタを用いるか又はSrcと同じ解像度である通常のバイナリのものを用いるかを選択するために乗算器126を通過させられる。最後に、グレイ出力がしきい値ユニット128を用いてバイナリに変換されて、セレクタ信号Sel32が生成されるようになる。   A block diagram of the binary scale module 66 is shown in FIG. The 8-bit gray selector input signal Grs120 is first interpolated in the gray domain by a factor of 2 in each direction using a 2D bilinear interpolation. The output from the bilinear interpolation is passed through a multiplier 126 to select whether to use an interpolated (supersampled) selector or a normal binary one that is the same resolution as Src. Finally, the gray output is converted to binary using the threshold unit 128 so that the selector signal Sel32 is generated.

2xの補間係数については、バイナリのSel出力データ転送速度は、各々の方向において、ソース信号Srcの2倍だけ速いことに注目されたい。このことは、8ビットの入力Grs毎に、バイナリ・スケール・モジュールは4つのバイナリ出力Selサンプルを生成することを意味する。Sel出力の第2のパックされた形態(Spk)122は、図9に示されるように、4つのバイナリのセレクタビットが互いパックされるように生成される。セレクタ出力140は、より高い出力解像度を示すためにベクトル表記法を用いることに注目することが重要である。出力は依然としてバイナリであると考えられるが(すなわち、値が0又は1のいずれかのみであると仮定する)、各々の入ってくる信号Grs入力は、出力において4つのセレクタビットを生成する(2x補間係数を仮定する)。4つのバイナリピクセルは、上に示されるように、8ビットのパックされた信号Spk122にパックされる。補間係数が1だけである場合には、すべての4つのビットは同じである。   Note that for the 2x interpolation factor, the binary Sel output data rate is twice as fast as the source signal Src in each direction. This means that for every 8-bit input Grs, the binary scale module generates four binary output Sel samples. A second packed form (Spk) 122 of the Sel output is generated such that the four binary selector bits are packed together, as shown in FIG. It is important to note that the selector output 140 uses vector notation to indicate a higher output resolution. Although the output is still considered binary (ie, it is assumed that the value is only either 0 or 1), each incoming signal Grs input produces four selector bits at the output (2x Assuming an interpolation factor). The four binary pixels are packed into an 8-bit packed signal Spk 122 as shown above. If the interpolation factor is only 1, all four bits are the same.

図10を参照すると、マークエッジモジュール58は、パックされた高解像度のセレクタの形態Spk122を取り、関心のある現在のピクセル80上に中心を置く5×5の[高解像度]ウィンドウ155におけるオン及びオフのピクセル数をカウントする。マークエッジモジュール58からの出力は、4値信号See142である。ウィンドウの内側のすべての入力ピクセルが0である場合には(一定のバックグラウンド区域に対応して)、See信号142は0に設定される。同様に、ウィンドウの内側のすべての入力ピクセルがオンである場合には(一定のフォアグラウンド区域に対応して)、See信号142は3に設定される。さらに、ウィンドウのコンテンツがほとんど後面グランドであるか又はほとんどフォアグランドである場合には、See出力142は1又は2のいずれかに設定される。Seeは4つの値のみであり、2ビットで符号化することができる。   Referring to FIG. 10, the mark edge module 58 takes the form of packed high resolution selector Spk 122 and turns on and off in a 5 × 5 [high resolution] window 155 centered on the current pixel 80 of interest. Count off pixels. The output from the mark edge module 58 is a quaternary signal See142. If all input pixels inside the window are zero (corresponding to a constant background area), the See signal 142 is set to zero. Similarly, the See signal 142 is set to 3 if all input pixels inside the window are on (corresponding to a constant foreground area). Further, the See output 142 is set to either 1 or 2 if the window content is mostly back ground or mostly foreground. See has only 4 values and can be encoded with 2 bits.

マークエッジモジュール58の作動が図11に示される。ユニットの作動は以下の通りである。エッジ処理モジュール58への入力は、Srcと同じ解像度であるパックされたバイナリのセレクタ信号Spkである。エッジ処理モジュール58は、関心のある現在のピクセル上に中心が置かれた3×3ピクセルのコンテクストウィンドウを維持する(元の入力解像度で)。論理的には、パックされたセレクタ(Spk)セレクタは、図11に示されるように、3×3ピクセルウィンドウにおける各々のSrc解像度ピクセルについて4つのバイナリのセレクタピクセルを含む。より太いラインは、高解像度ドメインにおける6×6ピクセルのコンテクストウィンドウに対応する元のSrc解像度を表す。しかしながら、5×5高解像度ピクセル区域の内側のコンテンツだけが用いられ、図11の影が付けられた区域はカウントにおいては除外される。   The operation of the mark edge module 58 is shown in FIG. The operation of the unit is as follows. The input to the edge processing module 58 is a packed binary selector signal Spk having the same resolution as Src. Edge processing module 58 maintains a 3 × 3 pixel context window centered on the current pixel of interest (at the original input resolution). Logically, the packed selector (Spk) selector includes four binary selector pixels for each Src resolution pixel in the 3 × 3 pixel window, as shown in FIG. The thicker line represents the original Src resolution corresponding to a 6 × 6 pixel context window in the high resolution domain. However, only the content inside the 5 × 5 high resolution pixel area is used, and the shaded area in FIG. 11 is excluded in the count.

5×5高解像度のコンテクストは、関心のある現在のピクセルに近接した潜在的なエッジを「検知する」ために設計されたものである。ウィンドウパターンは、現在のピクセルの上から又は左に1つだけ下に及び右に延びる2つの[高解像度]ピクセルの完全なコンテクストを用いる。独自のウィンドウパターンは、多数の(低解像度)ピクセルに関連した如何なるエッジも近くのピクセルと重なり合わないように、すなわち、如何なる潜在的なエッジの位置も1回以上検知(すなわち共有)できないようにされる。関心のある現在のウィンドウ内にある4×4=16の可能性のあるエッジの位置がさらに図11に示される。   The 5 × 5 high resolution context is designed to “sense” potential edges close to the current pixel of interest. The window pattern uses the full context of two [high resolution] pixels that extend from the top of the current pixel or one down to the left and to the right. The unique window pattern ensures that any edge associated with a large number of (low resolution) pixels does not overlap with nearby pixels, ie no potential edge location can be detected (ie shared) more than once. Is done. The position of 4 × 4 = 16 possible edges within the current window of interest is further illustrated in FIG.

マークエッジモジュール58は5×5高解像度区域において現在オンにされた高解像度ピクセルの数をカウントする。この数は、0から25までとすることができる。これは、以下のようにマークエッジモジュール58から出力信号Seeにマップされる。
See=0 5×5カウントが0である(如何なるフォアグラウンドピクセルも見出されなかった)場合
See=1 カウントが[1...12]の範囲にある(ほとんどがバックグラウンドピクセル)の場合
See=2 カウントが[13...24]の範囲にある(ほとんどがフォアグラウンドピクセル)の場合
See=3 カウントが25である(フォアグラウンドピクセルだけが見出された)場合
The mark edge module 58 counts the number of high resolution pixels currently turned on in the 5 × 5 high resolution area. This number can be from 0 to 25. This is mapped from the mark edge module 58 to the output signal See as follows.
Seee = 0 If the 5 × 5 count is 0 (no foreground pixel was found) Seee = 1 count is [1. . . 12] (mostly background pixels) See = 2 count is [13. . . 24] (mostly foreground pixels) See = 3 count is 25 (only foreground pixels found)

再び図3を参照すると、出力信号Seeは、走査MRC分離モジュール64に転送される。See信号は元の入力解像度(典型的に600dpi)である。走査MRC分離モジュール64は、入ってくるソース信号Srcをフォアグラウンド及びバックグラウンドプレーンに分割する役割のものである。このモジュールは、依存最小最大モジュールからのフルカラーの最小及び最大(Min、Max)出力並びにマークエッジモジュールからのマークされたセレクタエッジカウント信号Seeを用いる。さらに、走査MRC分離モジュールは、ダイナミックしきい値モジュールからのセグメント増強制御信号Enhを介して、エッジの上昇を増強する能力を有する。   Referring again to FIG. 3, the output signal See is transferred to the scanning MRC separation module 64. The See signal is the original input resolution (typically 600 dpi). The scanning MRC separation module 64 is responsible for dividing the incoming source signal Src into foreground and background planes. This module uses the full color minimum and maximum (Min, Max) output from the dependent minimum maximum module and the marked selector edge count signal See from the mark edge module. Furthermore, the scanning MRC separation module has the ability to enhance edge rise via the segment enhancement control signal Enh from the dynamic threshold module.

走査MRC分離モジュール64は、フォアグラウンド出力Fgr30及びバックグラウンド出力Bgr28のそれぞれの2つのフルカラーの生:未処理の推定値を出力する。追跡モジュール、MRCスケール、及びタイルタグ生成モジュールは、次に、さらに最終のフォアグラウンドFgd及びバックグラウンドBgd出力のそれぞれを生成するようにFgr及びBfrを処理する。   Scan MRC separation module 64 outputs two full-color raw: unprocessed estimates of each of foreground output Fgr30 and background output Bgr28. The tracking module, MRC scale, and tile tag generation module then process Fgr and Bfr to generate further final foreground Fgd and background Bgd outputs, respectively.

走査MRC分離モジュール64は、セグメント化されるべきフルカラーのソース信号Srcを取り込み、Fgr及びBgr出力の1つ又は時には両方についての値を生成する。走査MRC分離モジュールは、フォアグラウンドFgr又はバックグラウンドBgr出力のいずれかにおける空の(求められていない)ピクセルを示すように、ゼロ輝度及びクロマ(L=a=b=0)の特別なコードを備える。ページにわたりこの工程が継続すると、幾つかのフォアグラウンド及びバックグラウンドピクセルが求められないまま残る。MRCスケール及びタイルタグ生成モジュールは、次に、これらの求められていないピクセルについての値を慎重に塗られて、圧縮を低く維持し、付加的なJPEGのリンギングによるアーチファクトを阻止するようにする。   The scan MRC separation module 64 takes a full color source signal Src to be segmented and generates values for one or sometimes both of the Fgr and Bgr outputs. The scanning MRC separation module has special codes of zero intensity and chroma (L = a = b = 0) to indicate empty (unsought) pixels in either the foreground Fgr or background Bgr output. . As this process continues across the page, some foreground and background pixels remain sought after. The MRC scale and tile tag generation module then carefully paints the values for these unsought pixels to keep compression low and prevent additional JPEG ringing artifacts.

走査MRC分離モジュール64は、マークエッジモジュールからのセレクタエッジカウント信号Seeの値を用いて、増強されたSrcピクセルをバックグラウンド、フォアグラウンド、又は両方のいずれにコピーするかを判断するようにする。決定範囲は図12に示される。基本的には、増強されたSrcピクセルは、

Figure 0004226484
である場合にはフォアグラウンドにコピーされ、
Figure 0004226484
である場合にはバックグラウンドにコピーされる。したがって、See==0である場合にはフォアグラウンドは未定義としてマークされ、See==3である場合にはバックグラウンドが未定義としてマークされる。 The scan MRC separation module 64 uses the value of the selector edge count signal See from the mark edge module to determine whether to copy the enhanced Src pixel to the background, foreground, or both. The determination range is shown in FIG. Basically, the enhanced Src pixel is
Figure 0004226484
Is copied to the foreground,
Figure 0004226484
Is copied to the background. Therefore, the foreground is marked as undefined when See == 0, and the background is marked as undefined when See == 3.

最初に、増強係数Enhf1は、ちょうど1だけ増分された信号Enhであるため、最大値は255ではなく256である。
[数12]
Enhf=Enh
[数13]
Enhf1=Enhf+1
Initially, the enhancement factor Enhf1 is a signal Enh incremented by exactly 1, so the maximum value is 256 instead of 255.
[Equation 12]
Enhf = Enh
[Equation 13]
Enhf1 = Enhf + 1

次に、以下のフォアグラウンド及びバックグラウンドの2つのフルカラーの増強された形態を定義する(この目的は以下に述べられる)。
[数14]
enhFG=LIM[Src+(Min−Src)(Enhf1/256)]
[数15]
enhBG=LIM[Src+(Max−Src)(Enhf1/256)]
実施メモ。最終のBgd及びFgdの出力がXCss(Xクロマによりサブサンプルされ)であるか又はスケールダウンされた場合には、enhFG及びenhBGはXCSSとなることがある。
Next, we define the following two full-color enhanced forms of foreground and background (the purpose of which is described below).
[Formula 14]
enhFG = LIM [Src + (Min−Src) (Enhf1 / 256)]
[Equation 15]
enhBG = LIM [Src + (Max−Src) (Enhf1 / 256)]
Implementation note. If the final Bgd and Fgd outputs are XCss (subsampled by X chroma) or scaled down, enhFG and enhBG may be XCSS.

数式14及び15において、Srcはフルカラーの入力信号であり、Min及びMaxは依存最小最大モジュールからの依存最小及び最大のカラー出力である。制限関数LIMは、成分の各々についての結果が8ビットの範囲[1...255]に制限されるようにするものであり、これにより未定義のピクセルをマークするように備えられた特別なゼロのコードが排除されるようになる。Src及びMin及びMaxはフルカラー(L、A、B)のベクトルであるため、作動は3D空間にある。   In equations 14 and 15, Src is a full color input signal, and Min and Max are the dependent minimum and maximum color outputs from the dependent minimum-maximum module. The limiting function LIM has a range of 8 bits [1. . . 255], which eliminates the special zero code provided to mark undefined pixels. Since Src and Min and Max are full color (L, A, B) vectors, the operation is in 3D space.

フォアグラウンドが定義されている場合においては、すなわち、
See={1、2、又は3}
である場合には、出力Fgr値は、
[数16]
SEE={1、2、3}である場合、Fgr=enhFG
[数17]
SEE=0である場合、Fgr=0
であるように求められる。
In the case where foreground is defined, i.e.
See = {1, 2, or 3}
The output Fgr value is
[Equation 16]
When SEE = {1, 2, 3}, Fgr = enhFG
[Equation 17]
When SEE = 0, Fgr = 0
Is required to be.

フォアグラウンドが用いられていない場合(すなわち、See=0)には、フォアグラウンド値は、その値を数式16にしたがって、特別なコードFgr=0に設定することにより(3つの成分すべてについて)、未定義であるとしてマークされる。メモ:この実施は、Enhfを9ビット表現に拡張し、その値は255ではなく256による正規化が可能になるように1だけ増分される(Enhf1)。   If foreground is not used (ie See = 0), the foreground value is undefined by setting the value to the special code Fgr = 0 according to Equation 16 (for all three components). Marked as. Note: This implementation extends Enhf to a 9-bit representation and its value is incremented by 1 (Enhf1) to allow normalization by 256 rather than 255.

数式14の厳密な検査は、Enhf1により表されるセグメント増強量によって、出力フォアグラウンドFgr値は、現在の入力信号値Srcと依存最小最大モジュールの最小Minとの間で補間される(3D空間において)ことを明らかにする。Enhf=0である場合には、如何なる増強も行われず、出力は入力信号Fgr=Srcに設定される。このことは、(7×7)ウィンドウにおいて十分なコントラスト活動がない限り、通常の例となる。Enhf1=256(最大の増強)である場合には、出力は、最小信号Fgr=Minに設定される。このことは、エッジのすぐ近くにあるピクセルの例を表し、ここでは、近くの最小値により与えられるように(0=黒)、フォアグラウンドをできるだけ暗く塗ることによりエッジを増強することが有利となる。しかしながら、一般に、セグメント増強Enhfは上記の2つの極値の間で変化することができ、出力フォアグラウンド値は、Src及びMin値の間で対応して重み付けされる。   A rigorous examination of Equation 14 shows that the output foreground Fgr value is interpolated between the current input signal value Src and the minimum Min of the dependent minimum maximum module (in 3D space) by the segment enhancement amount represented by Enhf1. Make it clear. If Enhf = 0, no enhancement is performed and the output is set to the input signal Fgr = Src. This is a normal example as long as there is not enough contrast activity in the (7 × 7) window. If Enhf1 = 256 (maximum enhancement), the output is set to the minimum signal Fgr = Min. This represents an example of a pixel in the immediate vicinity of the edge, where it is advantageous to enhance the edge by painting the foreground as dark as possible, as given by the nearby minimum (0 = black). . In general, however, the segment enhancement Enhf can vary between the two extreme values described above, and the output foreground value is correspondingly weighted between the Src and Min values.

同様に、セグメント化においてバックグラウンドを用いる場合、
すなわちSee={0、1、2}である場合においては、出力Bgr値は、

[数18]
See={0、1、2}である場合、Bgr=enhBG
[数19]
See=3である場合、Bgr=0
により求められる。
Similarly, when using background in segmentation,
That is, when See = {0, 1, 2}, the output Bgr value is

[Equation 18]
If See = {0, 1, 2}, Bgr = enhBG
[Equation 19]
When Seee = 3, Bgr = 0
It is calculated by.

前のように、出力Bgr値は、数式15により与えられるように、セグメント増強量Enhf1に比例して、入力Src及びMax値の間で変化する。数式18は、最小Minの代わりに最大Maxを用いること及びSeeの範囲が異なることを除いては、数式16と同様である。Bgr出力についてMaxを用いることは、フォアグラウンドを用いた場合と同じように、暗くなるのではなく明るくなるようになる。   As before, the output Bgr value varies between the input Src and Max values in proportion to the segment enhancement amount Enhf1, as given by Equation 15. Formula 18 is the same as Formula 16 except that the maximum Max is used instead of the minimum Min and the range of See is different. Using Max for the Bgr output becomes brighter, not darker, as with the foreground.

さらに、数式19により示され、数式17と対応して、バックグラウンド又はフォアグラウンドのそれぞれが用いられない場合(すなわち、See=3)には、(see=0)のそれぞれ又はバックグラウンド値が、その値を特別なコードBgr=0に設定することにより(3つの成分すべてについて)、未定義であるとしてマークされる。   Furthermore, when each of the background or foreground is not used (that is, See = 3), as shown by Equation 19 and corresponding to Equation 17, each (see = 0) or background value is By setting the value to the special code Bgr = 0 (for all three components), it is marked as undefined.

MRC分離モジュールからの出力は、2つの部分的に塗られたフルカラーのプレーンFgr及びBgrである。セレクタプレーンのエッジから離れたところにおいては、それが明るいか又は暗いかによって、典型的には、フォアグラウンド又はバックグラウンドの出力の1つだけが、現在のピクセルの[増強された]カラーを含む。しかしながら、近くのエッジ情報は、フォアグラウンド及びバックグラウンドチャネルの両方に同時に支持されることがある。   The output from the MRC separation module is two partially painted full color planes Fgr and Bgr. Beyond the selector plane edge, depending on whether it is bright or dark, typically only one of the foreground or background outputs will contain the [enhanced] color of the current pixel. However, nearby edge information may be supported simultaneously on both foreground and background channels.

図2を参照すると、PDLセグメント化モジュール26は、MRCセグメント化を3つのPDLドキュメントにおけるプレーンに実行する役割のものである。PDLのMRCセグメント化モジュール26への入力は、入力カラー信号Src20及びPDL分解器により供給することができる如何なるレンダリングヒントRht34をも含むことができる。   Referring to FIG. 2, the PDL segmentation module 26 is responsible for performing MRC segmentation on planes in three PDL documents. The input to the PDL MRC segmentation module 26 can include the input color signal Src20 and any rendering hint Rht 34 that can be provided by the PDL decomposer.

PDLのMRCセグメント化モジュール26は、フルカラーのフォアグラウンド及びバックグラウンドプレーンFgr28及びBgr30、バイナリのセレクタプレーンSel32を出力し、多分8ビットのヒントプレーンHntにおいて幾らかのPDLヒントを保存する。   The PDL MRC segmentation module 26 outputs full color foreground and background planes Fgr28 and Bgr30, a binary selector plane Sel32, preserving some PDL hints, possibly in the 8-bit hint plane Hnt.

PDLのMRCセグメント化モジュール25のブロック図が図13に示される。左から始まり、PDLセグメンタは、入力カラー信号Src20及びPDLインタープリタからの8ビットのレンダリングヒントRhtを読み込む。PDLセグメンタ26は、走査処理により用いられたものと機能が同様である8ビットのグレイセレクタ信号Grrを生成する。さらに、PDLセグメンタは、幾らかのPDLヒントをMRCヒントHntとして出力する。   A block diagram of the PDL MRC segmentation module 25 is shown in FIG. Starting from the left, the PDL segmenter reads the input color signal Src20 and the 8-bit rendering hint Rht from the PDL interpreter. The PDL segmenter 26 generates an 8-bit gray selector signal Grr having the same function as that used in the scanning process. Furthermore, the PDL segmenter outputs some PDL hints as MRC hints Hnt.

PDLのMRCセグメント化モジュール25からのグレイセレクタ信号Grrは、ブロックスムージングユニット56を通して処理されて、バイナリスケールユニット66に転送される平滑化されたグレイセレクタ信号Grsが生成される。バイナリスケールユニット66は、バイナリのセレクタ信号Selを生成するようにGrs信号をしきい値にする。PDLデータの質はスーパーサンプル処理により改良されないため、バイナリスケールユニットにより生成されたセレクタは常にSrc解像度にある。ブロックスムージングユニット及びバイナリスケールユニットの作動はそれぞれ上述される。   The gray selector signal Grr from the PDL MRC segmentation module 25 is processed through a block smoothing unit 56 to produce a smoothed gray selector signal Grs that is forwarded to a binary scale unit 66. The binary scale unit 66 sets the Grs signal as a threshold value so as to generate a binary selector signal Sel. Since the quality of PDL data is not improved by supersample processing, the selector generated by the binary scale unit is always at Src resolution. The operation of the block smoothing unit and the binary scale unit are each described above.

最後に、PDLのMRC分離モジュール25は、入ってくるソース信号Src20を、フォアグラウンド及びバックグラウンドプレーンFgr30及びBgr28のそれぞれに分割する役割のものである。この分離はバイナリのセレクタプレーンSel32に基づくものである。   Finally, the PDL MRC separation module 25 is responsible for dividing the incoming source signal Src20 into foreground and background planes Fgr30 and Bgr28, respectively. This separation is based on the binary selector plane Sel32.

PDLセグメント化モジュール26は、入力カラー信号Src20を取り込み、8ビットのグレイセレクタ信号Grr66を生成する役割のものである。さらに、PDLセグメント化モジュール26は幾らかの8ビットのPDLインタープリタヒントRhtを、ヒントプレーン上の8ビットのPRCヒントとして保存する。   The PDL segmentation module 26 takes an input color signal Src20 and generates an 8-bit gray selector signal Grr66. In addition, the PDL segmentation module 26 stores some 8-bit PDL interpreter hints Rht as 8-bit PRC hints on the hint plane.

PDLセグメント化モジュールの作動は、上述の走査処理とは異なる。走査セグメント化工程は依存最小/最大分析に基づくものであり、その後にダイナミックしきい値処理が続く。しかしながら、クリーンなPDLデータについては、セグメント化は、関心のある現在のピクセル上に中心が置かれた3×3ウィンドウにおけるピクセルのコンテンツの分類に基づくものである。この分類は、現在のピクセルがフォアグラウンドFgr又はバックグラウンドBgrプレーンのいずれと関連しているかを判断する一組の法則として優先される。   The operation of the PDL segmentation module is different from the scanning process described above. The scan segmentation process is based on a dependent minimum / maximum analysis followed by dynamic thresholding. However, for clean PDL data, segmentation is based on a classification of pixel content in a 3x3 window centered on the current pixel of interest. This classification is preferred as a set of rules for determining whether the current pixel is associated with a foreground Fgr or background Bgr plane.

入ってくるSrcピクセルの各々について、このピクセルの周りの3×3ウィンドウのコンテンツが分析され、図14の表に示される1つ又はそれ以上の後続するクラス158に分類される。3×3ウィンドウの試験は、図14において最も左側の列に示されるように優先順位が付けられている。したがって、例えば、PDLインタープリタにより画像ピクセルになるようにタグ付けされた中心ピクセルは、黒、白、又はテキストとしてタグ付けされた中心ピクセルのような如何なる他の組み合わせにも優先する。   For each incoming Src pixel, the content of the 3 × 3 window around this pixel is analyzed and classified into one or more subsequent classes 158 as shown in the table of FIG. The 3 × 3 window tests are prioritized as shown in the leftmost column in FIG. Thus, for example, a center pixel tagged to be an image pixel by a PDL interpreter takes precedence over any other combination, such as a center pixel tagged as black, white, or text.

図14の表における第2の列は、Cコードシミュレーションにおけるクラス名をリスト表示する。第3の列は、クラスの意味についての簡単な説明及びそれがどのように試験されるのかを示す。最後に、最後の列は、クラスがどのようにフォアグラウンド又はバックグラウンドプレーンと関連付けられる(すなわち、セグメント化される)かを示す。3×3ウィンドウの試験についての1つの例外は、クラス6及び7の場合である。これらのクラスについての方法は、以下の通りである。   The second column in the table of FIG. 14 displays a list of class names in the C code simulation. The third column gives a brief description of the meaning of the class and how it is tested. Finally, the last column shows how the class is associated (ie segmented) with the foreground or background plane. One exception for the 3 × 3 window test is for classes 6 and 7. The methods for these classes are as follows.

1.第1に、中心ピクセルにNEARでなく、さらに該中心ピクセルからFARでもないあらゆる外側ピクセルがBADピクセルとして分類される。ここでNEAR及びFARの意味は、マンハッタン距離DMに基づくものである。
すなわち、
(DM<PDLEqualDistLim)である場合はNEAR

Figure 0004226484
ここで、PDLEqualDistLim及びPDLOtlDistThrは2つの構成のしきい値である。
2.遭遇する中心ピクセルにNEARでなく、さらに該中心ピクセルからFARである第1のBadではない外側ピクセルは、OTHERクラスについての基準となる。
3.次に遭遇する中心ピクセルにNEARではなく、さらに(該中心ピクセルからFARではないか、又は、上のOTHER基準ピクセルにNEARではない)ピクセルがBadピクセルとして分類される。
4.最後に、OTHERクラス6及び7は、遭遇するウィンドウ内のBadではないピクセルに依存する。クラス6(OthDark)又は7(OthLite)は基準のOTHERピクセルのカラー値に基づいて差別化される。 1. First, any outer pixel that is not NEAR at the center pixel and is not FAR from the center pixel is classified as a BAD pixel. Here, the meanings of NEAR and FAR are based on the Manhattan distance D M.
That is,
NEAR if (D M <PDLEqualDistLim)
Figure 0004226484
Here, PDLEqualDistLim and PDLOtlDistThr are threshold values of two configurations.
2. The first non-Bad outer pixel that is not NEAR to the center pixel encountered and is FAR from the center pixel is the reference for the OTHER class.
3. The next center pixel encountered is not NEAR, and further (not FAR from the center pixel or NEAR to the OTHER reference pixel above) is classified as a Bad pixel.
4). Finally, OTHER classes 6 and 7 depend on non-Bad pixels in the window encountered. Class 6 (OthDark) or 7 (OthLite) is differentiated based on the color value of the reference OTHER pixel.

PDL分離モジュールは、入ってくるソース信号Srcをフォアグラウンド及びバックグラウンドプレーンFgr及びBgrのそれぞれに分割する役割のものである。この分離は、バイナリのセレクタプレーンSelに基づくものである。分離工程は、用いられていないピクセルを示すように、特別に備えられたゼロのコード(L=a=b=0)をもったフォアグラウンド及びバックグラウンドプレーンを初期化することにより開始される。   The PDL separation module is responsible for dividing the incoming source signal Src into foreground and background planes Fgr and Bgr, respectively. This separation is based on the binary selector plane Sel. The separation process begins by initializing the foreground and background planes with a specially provided zero code (L = a = b = 0) to indicate the unused pixels.

次に、入ってくるカラーSrc値が、「用いられていない」特別に備えられたコードとの混乱が阻止されるように、ゼロから離れるように移動される。
Val=Max(1、Src)
最大関数は、Valがそのプレーンのいずれにおいても決してゼロにはならないことを保証する。分離工程は、直接的に継続する。
(Sel=1)である場合には、Fgd=Val、或いはBgd=Val
The incoming color Src value is then moved away from zero so that confusion with the “not used” specially provided code is prevented.
Val = Max (1, Src)
The maximum function ensures that Val will never be zero in any of the planes. The separation process continues directly.
When (Sel = 1), Fgd = Val or Bgd = Val

すなわち、各々の入ってくるカラーピクセルは、フォアグラウンド又はバックグラウンドのいずれかに置かれる。走査されたドキュメントの場合とは異なり、この情報は、両方のプレーンに置かれることはなく、エッジの近くにさえも置かれることはない。したがって、分離方式は、走査の場合に対して大幅に単純化されている。   That is, each incoming color pixel is placed in either the foreground or background. Unlike in the case of scanned documents, this information is not placed in both planes, and is not even near the edges. The separation scheme is therefore greatly simplified for the scanning case.

図15を参照すると、MRCスケール及びタイルタグ生成モジュールは、粗いフォアグラウンド及びバックグラウンドの推定値Fgr及びBgrに付加的な処理を適用して、最終のフォアグラウンド及びバックグラウンド出力Fgd及びBgdを生成するようにする。MRCスケール及びタイルタグ生成モジュールにより行われる処理は、最初に、未定義のピクセルは無視しながら、フォアグラウンド及びバックグラウンド値をサブサンプルするものである。次に、この結果を係数8によりサブサンプルして、ブロック平均を計算するようにする(やはり定義されていないピクセルは無視する)。第3の段階は、計算されたブロック平均を未定義のピクセルに挿入することである。この目的は、未定義のピクセルをブロック平均で塗られることにより、JPEG圧縮のリンギングによるアーチファクトを減らすことである。   Referring to FIG. 15, the MRC scale and tile tag generation module applies additional processing to the coarse foreground and background estimates Fgr and Bgr to generate the final foreground and background outputs Fgd and Bgd. To do. The processing performed by the MRC scale and tile tag generation module is to first subsample the foreground and background values, ignoring undefined pixels. The result is then subsampled by a factor of 8 to calculate the block average (ignoring pixels that are also not defined). The third step is to insert the calculated block average into undefined pixels. The purpose is to reduce artifacts due to JPEG compression ringing by painting undefined pixels with a block average.

MRCスケール及びタイルタグ生成モジュールの内側の付加的な論理はさらに、一定の黒だけの又は白だけのタイルを検知しフラグを立てるように、フォアグラウン度及びバックグラウンドの出力値を監視する。同様の論理は、セレクタ及びヒントがゼロであるときに検知する。MRCスケール及びタイルタグ生成モジュールのブロック図が図17に示される。   Additional logic inside the MRC scale and tile tag generation module also monitors the foreground level and background output values to detect and flag certain black-only or white-only tiles. Similar logic detects when the selector and hint are zero. A block diagram of the MRC scale and tile tag generation module is shown in FIG.

サブサンプル処理モジュールの4つのすべての例が同様の方法により作動する。N×N区域におけるすべてのピクセルの合計が計算されて、valid=notZeroであるピクセル数の別々のカウントが維持される。次に、この合計が有効なピクセルのカウントにより正規化されて、出力が生成されるようになる。サブサンプル処理の第1のステージは、典型的には、Fgd及びBgdのサブサンプル処理の程度全体を表す4×4の区域に渡る。サブサンプル処理の量は、パラメータ:Seg_Fdg_ScaleDn:SEG_Bgd_ScaleDn:SEG_Fgd_Dst_Css:及びSEG_Bgd_Dst_Cssにより特定される。   All four examples of subsample processing modules operate in a similar manner. The sum of all pixels in the N × N area is calculated and a separate count of the number of pixels where valid = notZero is maintained. This sum is then normalized by a valid pixel count to produce an output. The first stage of sub-sample processing typically spans a 4 × 4 area that represents the entire extent of Fgd and Bgd sub-sample processing. The amount of sub-sample processing is specified by parameters: Seg_Fdg_ScaleDn: SEG_Bgd_ScaleDn: SEG_Fgd_Dst_Css: and SEG_Bgd_Dst_Css.

Cssパラメータは、クロマサンプルが付加的に係数2によりサブサンプルされたかどうかを制御する。第2のステージは、必ず、サブサンプルされた解像度でJPEGブロックの大きさを表す8×8の区域にわたりサブサンプルする。サブサンプルされた出力の最終の正規化は、合計重量の値に依存する。しかしながら、可能性のある合計重量値について多数の選択肢をもった所定の乗算表を用いることにより、数式において割り算を避けるようにすることが依然として可能である。   The Css parameter controls whether the chroma sample is additionally subsampled by a factor of 2. The second stage always subsamples over an 8 × 8 area that represents the size of the JPEG block at the subsampled resolution. The final normalization of the subsampled output depends on the total weight value. However, it is still possible to avoid division in the formula by using a predetermined multiplication table with a number of options for possible total weight values.

穴埋めブロックはブロック平均Fga及びBgaをFgx及びBgxに挿入して、すべての未定義のピクセルを置き換え、最終のフォアグラウンドFgd及びバックグラウンドBgd信号を生成するようにする。穴埋めブロックはさらに、CEFファイルがエクスポートされたときに、圧縮を最適化するように用いることができるタイル又はストリップ当たり1ビットの非常に低い帯域出力Tgb/Tgbを生成する。各々の穴埋めブロックは、タイルにおける各々のピクセルを監視して、すべてのピクセルが輝度及びクロミナンスサンプルについて設定された制限内にあるかどうかを試験するようにする。すべてのタイルのピクセルが試験に通った場合には、タイルタグのビットが設定される。各々のピクセルには、3つの試験が行われる。
LumRef−L <=TileLumErr{ここでLumRefはBgdについては255、Fgdについては0である}
abs(128−A) <=TileChrmErr
abs(128−B) <=TileChrmErr
Sel及びHntのタイルタグモジュールは、1つのタイルブロックにおいて作動している大きなNORゲートの均等物に過ぎない。これらは、タイルにおけるバイナリのピクセルすべてが0である場合には1を生成する。タイルの大きさはプログラム可能であるが、典型的な値は64×64から512×512ピクセルで変化する。
The fill-in block inserts the block averages Fga and Bga into Fgx and Bgx to replace all undefined pixels and generate the final foreground Fgd and background Bgd signals. The hole filling block also produces a very low bandwidth output Tgb / Tgb of 1 bit per tile or strip that can be used to optimize compression when the CEF file is exported. Each fill block monitors each pixel in the tile to test whether all pixels are within the limits set for luminance and chrominance samples. If all tile pixels pass the test, the tile tag bit is set. Three tests are performed on each pixel.
LumRef-L <= TileLumErr {where LumRef is 255 for Bgd and 0 for Fgd}
abs (128-A) <= TileChrmErr
abs (128-B) <= TileChrmErr
The Sel and Hnt tile tag modules are just the equivalent of a large NOR gate operating in one tile block. These produce a 1 if all the binary pixels in the tile are 0. The tile size is programmable, but typical values vary from 64x64 to 512x512 pixels.

再び図3を参照すると、フォアグラウンドエローションユニット200は、線形YCCセグメント化を用いて、薄い(しかし壊れていない)カンジの要求事項に対処するように用いられる。一定の値がグレイセレクタから引かれ、これによりフォアグラウンドが薄くなる/エローションされる。ピクセルがフォアグラウンドからバックグラウンドに変換される場合には、このことは、近くの試験が、薄くなることが破線をもたらさないことを実証した場合においてのみ行われる。図16を参照すると、図は、このモジュール200の作動を示している。フォアグラウンドエローションユニット200は、幾つかのテンプレートに適合することを試みる。適合が見出された場合には、調整が行われる。図16は2つのパターンを示す。斜線がひかれたブロック210はバックグラウンドを表し、斜線がひかれたブロック214は調整より大きい強いフォアグラウンドを表す。斜線がひかれたブロック216は、調整が引かれた場合にはバックグラウンドに変わる弱いフォアグラウンドを表す。ブロック212は特定されていない。弱いフォアグラウンド216は、図16に示される2つのパターンの1つが適合する場合にのみ、バックグラウンド210に切り換わることが可能である(各々が4つの可能性のある方位を有する)。   Referring again to FIG. 3, the foreground erosion unit 200 is used to address thin (but not broken) Kanji requirements using linear YCC segmentation. A constant value is pulled from the gray selector, which makes the foreground lighter / eroded. If the pixel is converted from the foreground to the background, this is done only if a nearby test has demonstrated that thinning does not result in a dashed line. Referring to FIG. 16, the figure shows the operation of this module 200. The foreground erosion unit 200 attempts to fit several templates. If a match is found, adjustments are made. FIG. 16 shows two patterns. The shaded block 210 represents the background, and the shaded block 214 represents a stronger foreground that is larger than the adjustment. The shaded block 216 represents a weak foreground that changes to the background when adjustments are drawn. Block 212 is not specified. A weak foreground 216 can switch to the background 210 only if one of the two patterns shown in FIG. 16 is matched (each having four possible orientations).

ドキュメントについてのMRC構造を示す図である。It is a figure which shows the MRC structure about a document. セグメントモジュールのブロック図である。It is a block diagram of a segment module. 走査セグメントモジュールのブロック図である。FIG. 3 is a block diagram of a scan segment module. 依存最小最大モジュールのブロック図である。It is a block diagram of a dependent minimum maximum module. 依存最小最大モジュールの作動を示す図である。It is a figure which shows the action | operation of a dependence minimum maximum module. ダイナミックしきい値モジュールのブロック図である。FIG. 4 is a block diagram of a dynamic threshold module. バイナリ・スケール・モジュールのブロック図である。FIG. 3 is a block diagram of a binary scale module. バイナリ・スケール・モジュールの作動を示す図である。It is a figure which shows the operation | movement of a binary scale module. パックされたセレクタのフォーマットを示す図である。It is a figure which shows the format of the packed selector. マークエッジモジュールのブロック図である。It is a block diagram of a mark edge module. マークエッジモジュールの作動を示す図である。It is a figure which shows the action | operation of a mark edge module. バックグラウンド及びフォアグラウンドを定義する決定範囲を示す図である。It is a figure which shows the determination range which defines a background and a foreground. PDLのMRCセグメント化モジュールのブロック図である。FIG. 3 is a block diagram of a PDL MRC segmentation module. PDLセグメント化モジュールのクラスを示す表である。It is a table | surface which shows the class of a PDL segmentation module. FG/BGクリーンアップモジュールのブロック図である。It is a block diagram of an FG / BG cleanup module. フォアグラウンドのエローションを示すブロック図である。It is a block diagram which shows the erosion of a foreground.

Claims (3)

フォアグラウンドプレーンのためのフォアグラウンド信号と、バックグラウンドプレーンのためのバックグラウンド信号と、フォアグラウンドプレーン及びバックグラウンドプレーンの一方を選択するセレクタプレーンのためのセレクタ信号とを含む混合ラスタ信号の弱いセレクタ信号を改良する方法であって、
(a)ブロックスムージングユニットが、セレクタ信号を含む、前記混合ラスタ信号のマルチビットのモノクロ信号を画像データソース装置から受取り、前記モノクロ信号は、基準レベル未満において弱いセレクタ信号を示し前記基準レベルより上において強いセレクタ信号を示すものであり
(b)前記ブロックスムージングユニットが、前記セレクタ信号を複数の一様なブロックに区分化し、
(c)前記ブロックスムージングユニットが、各々のブロックについて2次元フィルタ処理を行い、
(d)前記ブロックスムージングユニットが、前記弱いセレクタ信号を前記フィルタ処理された結果と置き換えること、
を包含することを特徴とする方法。
Improved weak selector signal for mixed raster signals, including foreground signal for foreground plane, background signal for background plane, and selector signal for selector plane that selects one of foreground plane and background plane A way to
(A) A block smoothing unit receives a multi-bit monochrome signal of the mixed raster signal including a selector signal from an image data source device, the monochrome signal indicating a weak selector signal below a reference level and above the reference level. Indicates a strong selector signal ,
(B) the block smoothing unit partitions the selector signal into a plurality of uniform blocks;
(C) the block smoothing unit performs two-dimensional filtering on each block;
(D) the block smoothing unit replaces the weak selector signal with the filtered result;
A method characterized by comprising.
請求項に記載の方法において、更に、
(e)前記ブロックスムージングユニットが、前記モノクロ信号から前記基準レベルに対応するバイアスを引いて該モノクロ信号を符号(+又は−の符号)付きの数にすること、
(f)前記ブロックスムージングユニットが、前記符号付きの数が+1又は−1である場合に前記モノクロ信号は弱いセレクタ信号であると判断することを包含する、
ことを特徴とする
方法。
The method of claim 1 , further comprising:
(E) the block smoothing unit subtracts a bias corresponding to the reference level from the monochrome signal to make the monochrome signal a number with a sign (+ or-sign);
(F) including that the block smoothing unit determines that the monochrome signal is a weak selector signal when the signed number is +1 or -1.
A method characterized by :
フォアグラウンドプレーンのためのフォアグラウンド信号と、バックグラウンドプレーンのためのバックグラウンド信号と、フォアグラウンドプレーン及びバックグラウンドプレーンの一方を選択するセレクタプレーンのためのセレクタ信号とを含む混合ラスタ信号の弱いセレクタ信号を改良するシステムであって、
(a)セレクタ信号を含む、前記混合ラスタ信号のマルチビットのモノクロ信号を画像データソース装置から受取り、前記モノクロ信号は、基準レベル未満において弱いセレクタ信号を示し前記基準レベルより上において強いセレクタ信号を示すものであり、
(b)前記セレクタ信号を複数の一様なブロックに区分化する手段と、
(c)各々のブロックについて2次元フィルタ処理を行う手段と、
(d)基準レベルより弱いセレクタ信号を前記フィルタ処理された結果と置き換える手段と、
を包含することを特徴とするシステム
Improved weak selector signal for mixed raster signals, including foreground signal for foreground plane, background signal for background plane, and selector signal for selector plane that selects one of foreground plane and background plane A system that
(A) receiving a multi-bit monochrome signal of the mixed raster signal including a selector signal from an image data source device, the monochrome signal indicating a weak selector signal below a reference level and a strong selector signal above the reference level; It is shown
(B) means for partitioning the selector signal into a plurality of uniform blocks;
(C) means for performing two-dimensional filtering on each block;
(D) means for replacing a selector signal weaker than a reference level with the filtered result;
A system characterized by including .
JP2004028660A 2003-07-01 2004-01-05 Method and system for improving weak selector signal of mixed raster signal Expired - Fee Related JP4226484B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/612,250 US7308136B2 (en) 2002-07-01 2003-07-01 Weak edge repositioning in a MRC segmentor

Publications (2)

Publication Number Publication Date
JP2005039771A JP2005039771A (en) 2005-02-10
JP4226484B2 true JP4226484B2 (en) 2009-02-18

Family

ID=33435453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004028660A Expired - Fee Related JP4226484B2 (en) 2003-07-01 2004-01-05 Method and system for improving weak selector signal of mixed raster signal

Country Status (4)

Country Link
US (1) US7308136B2 (en)
EP (1) EP1494455A3 (en)
JP (1) JP4226484B2 (en)
TW (1) TWI311022B (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7190837B2 (en) * 2003-08-12 2007-03-13 Xerox Corporation Compression of mixed raster content (MRC) image data
US7542164B2 (en) * 2004-07-14 2009-06-02 Xerox Corporation Common exchange format architecture for color printing in a multi-function system
WO2008098188A2 (en) 2007-02-08 2008-08-14 Behavioral Recognition Systems, Inc. Behavioral recognition system
US8064695B2 (en) * 2007-09-27 2011-11-22 Behavioral Recognition Systems, Inc. Dark scene compensation in a background-foreground module of a video analysis system
US8300924B2 (en) * 2007-09-27 2012-10-30 Behavioral Recognition Systems, Inc. Tracker component for behavioral recognition system
US8200011B2 (en) 2007-09-27 2012-06-12 Behavioral Recognition Systems, Inc. Context processor for video analysis system
US8218887B2 (en) * 2007-09-28 2012-07-10 Abbyy Software, Ltd. Enhanced method of multilayer compression of PDF (image) files using OCR systems
JP4600491B2 (en) 2008-02-26 2010-12-15 富士ゼロックス株式会社 Image processing apparatus and image processing program
US8111918B2 (en) * 2008-10-20 2012-02-07 Xerox Corporation Segmentation for three-layer mixed raster content images
US8335379B2 (en) * 2009-12-28 2012-12-18 Xerox Corporation System and method for cleanup of MRC images for improved compression and image quality

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4849914A (en) * 1987-09-22 1989-07-18 Opti-Copy, Inc. Method and apparatus for registering color separation film
US5367385A (en) * 1992-05-07 1994-11-22 Picturetel Corporation Method and apparatus for processing block coded image data to reduce boundary artifacts between adjacent image blocks
US5515452A (en) * 1992-12-31 1996-05-07 Electroglas, Inc. Optical character recognition illumination method and system
US5475768A (en) * 1993-04-29 1995-12-12 Canon Inc. High accuracy optical character recognition using neural networks with centroid dithering
US5583659A (en) * 1994-11-10 1996-12-10 Eastman Kodak Company Multi-windowing technique for thresholding an image using local image properties
KR0171147B1 (en) * 1995-03-20 1999-03-20 배순훈 Apparatus for selecting feature point by means of gradient
US5745596A (en) * 1995-05-01 1998-04-28 Xerox Corporation Method and apparatus for performing text/image segmentation
US5915044A (en) * 1995-09-29 1999-06-22 Intel Corporation Encoding video images using foreground/background segmentation
KR100242636B1 (en) * 1996-03-23 2000-02-01 윤종용 Signal adaptive post processing system for reducing blocking effect and ringing noise
US5778092A (en) * 1996-12-20 1998-07-07 Xerox Corporation Method and apparatus for compressing color or gray scale documents
US5900953A (en) * 1997-06-17 1999-05-04 At&T Corp Method and apparatus for extracting a foreground image and a background image from a color document image
DE19727133A1 (en) * 1997-06-26 1999-01-07 Thomson Brandt Gmbh Method, device and recording device for suppressing pulse-like interference in analog audio and / or video signals
US6058214A (en) * 1998-01-20 2000-05-02 At&T Corp. Compression of partially masked still images
US6324305B1 (en) * 1998-12-22 2001-11-27 Xerox Corporation Method and apparatus for segmenting a composite image into mixed raster content planes
US6373981B1 (en) * 1998-12-21 2002-04-16 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
US6400844B1 (en) * 1998-12-02 2002-06-04 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
US6728416B1 (en) * 1999-12-08 2004-04-27 Eastman Kodak Company Adjusting the contrast of a digital image with an adaptive recursive filter
EP1119186A3 (en) * 2000-01-19 2002-07-31 Xerox Corporation Method for generating anti-aliased text and line graphics in compressed document images
US6633670B1 (en) * 2000-03-31 2003-10-14 Sharp Laboratories Of America, Inc. Mask generation for multi-layer image decomposition
US6707952B1 (en) * 2000-05-30 2004-03-16 Sharp Laboratories Of America, Inc. Method for removing ringing artifacts from locations near dominant edges of an image reconstructed after compression

Also Published As

Publication number Publication date
EP1494455A2 (en) 2005-01-05
JP2005039771A (en) 2005-02-10
TW200507624A (en) 2005-02-16
TWI311022B (en) 2009-06-11
US7308136B2 (en) 2007-12-11
US20040052419A1 (en) 2004-03-18
EP1494455A3 (en) 2008-01-23

Similar Documents

Publication Publication Date Title
US7242802B2 (en) Segmentation method and system for Multiple Raster Content (MRC) representation of documents
US8335379B2 (en) System and method for cleanup of MRC images for improved compression and image quality
US7433535B2 (en) Enhancing text-like edges in digital images
US7324120B2 (en) Segmentation method and system for scanned documents
US7324247B2 (en) Image processing apparatus, image processing program and storage medium storing the program
US6987882B2 (en) Separation system for Multiple Raster Content (MRC) representation of documents
US8565531B2 (en) Edge detection for mixed raster content (MRC) images for improved compression and image quality
US7031518B2 (en) Segmentation method and system for Multiple Raster Content (MRC) representation of documents
JP4907060B2 (en) Priority PDL segmentation to generate a 2-bit selector
US6859204B2 (en) Dynamic threshold system for multiple raster content (MRC) representation of documents
JP4226484B2 (en) Method and system for improving weak selector signal of mixed raster signal
US7356183B2 (en) Segmentation method and system for multiple raster content (MRC) representation of documents
US7190837B2 (en) Compression of mixed raster content (MRC) image data
US7269294B2 (en) Foreground erosion method and system for Multiple Raster Content (MRC) representation of documents
US8111918B2 (en) Segmentation for three-layer mixed raster content images
EP1436980B1 (en) Reduction of chromatic bleeding artifacts in images
US7456982B2 (en) Segmentation method and system for multiple raster content (MRC) representation of documents
JP5118171B2 (en) Segmentation method and system for multi-raster content (MRC) representation of documents

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081027

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081126

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121205

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131205

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees