TW200306080A

TW200306080A - Segmented layered image system

Info

Publication number: TW200306080A
Application number: TW092106232A
Authority: TW
Inventors: Patrice Y Simard; Erin L Renshaw; James Russell Rinker; Henrique S Malvar
Original assignee: Microsoft Corp
Priority date: 2002-04-25
Filing date: 2003-03-20
Publication date: 2003-11-01
Also published as: CN1458791A; TWI230516B; EP1388815A3; KR100937542B1; EP1388815A2; CN100563296C; JP2003348360A; JP4773678B2; KR20030084591A

Description

200306080 玖、發明說明【發明所屬之技術領域】本發明係有關於文件影像之處理，且特別有及壓縮文件影像的系統與方法。【先前技術】電腦網路，網際網路，及數位儲存裝置的廣衍，使得透過電腦可用的資訊量急劇地增加。如加的資訊量，使得資訊傳送的速度及儲存的效率迫切。資料壓縮為一種可促使資訊有效傳送及術。資料的壓縮降低了表達資訊的資料空間，並多種資訊型態。對於數位資訊壓縮的須求更為增含影像，文字，聲音以及動畫。一般而言，資料標準的電腦系統；然而，其它技術則利用資料壓街但不限於數位及衛星電視，以及蜂槽式/數位電索當管理，傳送及處理大量資訊的須求增加時料的壓縮須求也同樣地增加了。雖然儲存裝置的著地增加，但資訊的須求卻遠超過容量的進步。個未壓縮的影像須要5百萬位元組的空間，而相對無漏失壓縮可以到只須要2.5百萬位元組的空有漏失壓縮可以到只須要5 0 0千位元組的空間。料壓縮可傳送更大的資訊量。即使傳輸率增加， DSL，纜線數據機，網際網路等，如用未壓縮的關於定義泛分佈繁此快速增變得更為儲存的技能用在許加了，包壓縮是用 I >例如’ i ° ，對此資容量已顯例如，一同的影像間，或對因此，資如寬頻，資訊，很 200306080 容易便達到了傳輸率的上限。例如，在dsl線壓縮的影像要花掉1Q分鐘。然而，同樣的影像在則只須化一分鐘傳送，因而可提供1 〇倍的資料傳一般而言，有兩種壓縮型態，無漏失及有漏失壓縮可在壓縮後完全回復原始資料，而漏失的縮後則所回復的資料會與原始資料有所差異。這 2弋之間各有千秋，漏失壓縮比無漏失壓縮提供壓縮率’ ®為資料整體性在某個程度上被容忍了失壓縮則可用纟，例如，要壓縮重要的文字，因精確地重建資料1會大大地影響文字的品質及漏失壓縮可以用在影像或非重要的文字，其中某或雜訊是可接受的，或對人的感官是無法察覺的壓縮對文件的數位代表（數位文件U特別可行而言’數位文件包含文纟，影像，及/或文字及了儲存目前的數位資料比較不佔空間外，也使儲不造成品質的重大損害，這將鼓勵目前影印文化，進而使播紙化的辦公室更為可行。對許多企無紙化辦公室是-種追求的目標，因為無紙I二許多優點，諸如使資訊的存取更加容易，降低環降低儲存成本，等等。甚且，透過壓縮可降低2 大小，提高網際網路頻寬之使用效率，使得更多更快速地傳送，並降低網路的擁塞。降低資訊所空間，邁向更有效率的無紙化辦公室，以及增加頻寬的效率，正是與壓縮技術相關之許多重要的上傳送未壓縮後，輸效能。失。無漏壓縮在壓兩種壓縮了更好的。而無漏為右無法可讀性。種扭曲量。資料的的。一般影像。除存量小而件的數位業而言，公室具有境成本，位檔案的的資訊可須的儲存網際網路好處其中 6 200306080 的一些而已。為使數位文件的利用更為吸引人，數位文件的壓當滿足某些目的。第—，壓縮應該要用少量的時間壓解®縮大量的資訊。第二，壓縮應該能使數位文件正重製。另外，數位文件的資料壓縮應該利用文件之企目的或=終的目的。某些數位文件用來存檔或提供紙件。、其它的文件可以被修改及/或編輯1多傳統的壓縮方法在觀看時，無法處理文字及/或影像的回流 flowuig)，並無法提供有效率且有效的手段以使壓縮能辨識文字，並將之回流到文字處理器，個人數位 (PDAS)，行動電話，等等。因此，如果紙本的辦公件被掃描成數位形 <，如果無法更新1改，或改變化的文件，則目前的壓縮技術將難以施行。通常，壓縮架構可被裁剪成特別的檔案型態，如元，非二位元，紋理的或影像，以増加壓縮^而，種文件型態而裁剪的壓縮架構’一般不能用在其它的型態。例如，依據文件的纹理而裁剪的壓縮架構一般用在處理影像檔案。對此問題的—種解決方法是，選種針對該文件型態而裁剪，或編碼的影像壓縮架$構。然此解決方法無法應用在單-文件中具有—種以上資訊的數位文件。例如’數位文件可具有—高彩影像及紋訊’如m於料文章。要克服此問題的一種手分析文件，並將之分成各種區域。該各種區域可被分判斷其中所包含的資訊型態。依據此資訊型態，可對縮應縮及確地圖的本文資料 (re- 技術助理室文數位二位為某檔案不能擇一而，型態理資段是析以每個 7 200306080 區域挑選一個壓縮架構。然而要具有不同大小及形狀的區域另一種方法是將文件分成背景的影像。這是有幫助的，因及定色的影像上。然而，定一定色而造成影像的漏失。，這種方法很難實現，且須 ’這將造成壓縮上的困難。及一定色（constant color ) 為不同的壓縮架構可用在背景色影像可因為迫使圖素值加入另外數位文件的資料壓縮應該利用文件的目的。有些數位文件是用來存檔或提供紙本。*它的文件可能要修改且/或、爲輯目前的資料壓縮在觀看時，無法處理文字及/或影像的回％，並無法提供有效率及有效的手段，以使壓縮技術能用在文字辨識，並回流至文字處理器，個人數位助理（PDAs )，行動電話，等等。因此，如果紙本的辦公室文件被掃描成數位型式，如果不能更新，修改，或一般改變數位化的文件，則目前的壓縮技術將使之更為難行。【内容】以下為本發明之簡要說明，以對本發明之一些實施例有基本的瞭解。本概要不是要定義本發明之主要/關鍵的元件或要描繪本發明之範圍。其唯一的目的是要以簡化的格式表達本發明之某些主要的概念，當作是對稍後要描述的一些更詳盡的說明之引言。本發明主要疋有關於文件影像之編碼及解碼的系統與方法。文件的影像依據遮罩而被分割成許多的層次，其中 8 200306080 這些多層次以非二位元的方式表示。各個層次可被分開處理及壓縮，以對文件影像整體造成較佳的壓縮。

依據本發明之一實施例，從文件影像產生一個遮罩。該遮罩的產生是要降低遮罩與文件影像的多層次之組合大小的壓縮預估。該遮罩用來分割文件影像為多層次。該遮罩決定，或將文件影像的圖素配置在相對應的層次中。該遮罩及該多層次被分開處理及編碼，以改善整體的文件影像壓縮效能。此多層次為非二位元的影像，且例如能包含一前景影像與一背景影像。

依據本發明之另一實施例，文件的影像被分割成許多層次，該複數層包含一前景影像，一背景影像及一遮罩。該遮罩為一二位元的影像，用來分割影像為前景影像及背景影像。一般而言，該遮罩的產生是要降低遮罩，前景影像及背景影像的組合大小之預估。不像有些習知的系統限制一個層次只用一個顏色，前景影像及背景影像可使用任何合適範圍内的顏色，且不限定為單一顏色或定色。除了該遮罩可這樣處理之外，前景影像及背景影像也可以。該遮罩，前景影像及背景影像被編碼且組合成單一的位元流。可用任何數的合適的壓縮架構來編碼。對解碼而言，壓縮的位元流被分成一遮罩位元流，一前景位元流及一背景位元流。該遮罩位元流，前景位元流及背景位元流被解碼為一遮罩，一前景影像及一背景影像。除了該遮罩可這樣處理之外，前景影像及背景影像也可以。前景影像及背景影像依據該遮罩被組合成一重新組合的文件影像。 9 200306080 依據本發明之另一實施例，一遮罩分離器接收到一文件影像，並從該文件影像產生一遮罩。該遮罩以二位元的格式表示。前景背景分割器接收該遮罩及該文件影像，並將該文件影像分割成一前景影像及一背景影像。遮罩編碼器將遮罩編碼為遮罩位元流。前景編碼器將前景影像編碼為前景位元流。背景編碼器將背景影像編碼為背景位元流。一組合組件將遮罩位元流，前景位元流及背景位元流組合成一組合位元流。為達到上述及相關之目的，本發明之某些說明的部份在此由以下的描述及所附的圖示加以表示。這些目的是本發明之各種可能之實施例的表示，這些全被本發明所涵蓋。當輔以以下之圖示說明時，本發明之其它的優點及新的特性將可從以下的詳細描述而更為明白。【實施方式】現在本發明便參照圖式加以描述，其中相同的參考圖號是用來指相同的元件。在以下的描述中，為了解說的目的，描述了許多特別的細節以便於對本發明有徹底的瞭解。然而，很顯然本發明可以不須要這些特別的細節便能加以實施。在其它的案例中，以方塊圖的型式顯示已知的結構及裝置，以便於描述本發明。如在本申請案中所使用的，「組件（component)」是用來指與電腦相關的實體，可為硬體，軟硬體的結合，軟體，或執行中的軟體。例如，組件可以成為，但不限於為，在 10 200306080 處理器上執行的程纟，處理器，物件，可執行的執行緒，程式’及電腦。為了說明起卩，在伺服器上所執行的應用程式，以及伺服器兩者皆可為組件。—或更多個組件可以位於一個程序及/或執行緒中，且組件可位於—台電腦及/ 或分佈於兩台以上的電腦。而且，「又件影像（document image)」是指文件的數位表示，包含一或多種顏色（例如，二位元（黑/白），灰階及/或彩色文件）。而且，文件影像可具有影像，文字，及/或文夺含於像’潛在的文字與影像交登。文件影像可包含二位元，紅綠藍（RGB)，YUV及/或其它文件的代表。 RGB文件影像可表示紅，綠，及藍的組件。γυν文件影像可表示使用以 Y 表示亮度組件（luminescence component )，及以 U及 V表示色度組件（chrominance components)。YUV —般更適合當壓縮的表示之用，因為人的眼睛對U及V的扭曲比較不敏感，因此U及V可被分量2再取樣（subsampled)，而且因為Y相員取了 R，G， B之間的相互關係。為了文字叢集的目的，γ的代表特別有意思，因為當亮度改變時，文字比較容易閱讀。來自於色度改變的文字，例如從紅色變至綠色，在某個色度時，比較難以閱讀。彩色的文件因而可轉換為YUV的文件，它可為二位元的格式，而不會減少紋理的訊息。文件影像包含，圖畫組件，一般用「圖素（pixel)」表示。文件影像可為依據任何形狀或大小的單一或多頁的文件。圖1為依據本發明之一種實施例的分割層次影像編螞 200306080 系統1 0 0之高階的方塊圖。本系統1 0 0定義並壓縮文字，手寫字，圖式等等，且本系統可操作任何合適形狀或大小的單頁或多頁的文件上。此系統1 00包含遮罩分離器1 02，前景背景分割器 104,遮罩編碼器 106,前景編碼器108，背景編碼器 110，及組合組件 112。該遮罩分離器 102 接收文件影像（如文件的數位代表），並產生一個遮罩。文件影像可具有一或多頁，且基本上是從文件掃描來的。該文件影像可具有任何的解析度，一般以 dpi ( dots per inch )表示。例如，傳真文件一般使用約 15 0〜2 00 dpi的解析度。另外，文件影像可具有任何的圖素大小，或檔案大小，例如，6 4 0 X 4 8 0圖素及/或A 4大小。由遮罩分離器102所產生的遮罩，可用來切割文件影像為兩層，一前景影像及一背景影像。請注意，本發明之其它實施例也可將影像分割成兩層以上的層次。遮罩，也稱為遮罩影像，為二位元的影像，其圖素值決定相對應的圖素是否在前景影像或背景影像。遮罩分離器 102產生遮罩，使得前景影像及背景影像的組合大小得以縮小。請注意，本概念可延申至多重遮罩及多重前景，且仍在本發明之範圍内。有許多方式可以用來產生遮罩。就壓縮而言，相似的圖素值比不同的圖素值壓縮得妤。例如，藍色天空的區域壓縮得比具有各種顏色及密度的區域好。如前所述，該遮罩的產生是用來降低遮罩，前景影像及背景影像組合的大小。 12 200306080 另一個可行的方法是產生可能之遮罩的上位集合 (superset)，並選擇該上位集合的最佳遮罩。對具有 N 圖素的文件影像而言，便有 2N個的可能遮罩。因此，可分析每個可能的遮罩，並判斷哪個遮罩可產生最小的整體組合影像。然而，要分析每個可能的遮罩，這在計算上的成本很昂貴，而且耗時’所以並不貫用。

另一種方式是將文件分割成許多區域，然後分析每個區域以依據至少一部份在能量上（如能量變化（energy variance ))，以配置圖素及合併區域。能量變化（其為可能得到的壓縮預估）為依據距離平方的總合之量測。該文件的小區域，例如 2 X 2圖素或4 X 4圖素，可被分析作能量變化。小區域可被分割成前景及背景區域，而使該小區域的能量變化被降低或減少。每個可能的遮罩可用來判斷要用哪個遮罩，因為被分析的區域小得可使這樣的分析變得可行。例如，一個4個圖素的區域在那區域的遮罩便只有 16種可能的排列組合。這些小區域因而可被合併（如成對地）在一起以產生遮罩，整體而言，這可降低遮罩，前景影像及背景影像組合的大小。前景背景分割器1 04從遮罩分離器1 02接收遮罩，及文件影像。前景背景分割器 1 04使用該遮罩以分割該文件影像為前景影像及背景影像。就該文件影像的每個圖素而言，該遮罩的相對應圖素被參考到。圖素依據該遮罩之相對應的圖素而被配置到前景影像或背景影像。例如，如果該遮罩之相對應的圖素是” 1 ”，該圖素便被分配到前景 13 200306080 影像。反之，如果該遮罩之相對應的圖素是π οπ，該圖素便被分配到背景影像。然而，’’ 1 ”或” 0 ”指的是前景或背景，這可由使用者自行設定（如” 1π被分派給背景影像而被分派給前景影像）。另外，前景影像及背景影像可彼此分離。然而，該遮罩的額外處理可產生不同的前景及背景遮罩，這有時可以重疊，以降低延著遮罩邊緣的不自然效果，或整個忽略某些圖素，以增加壓縮。前景遮罩則用來從該文件影像分割出前景影像，而背景遮罩則用來從該文件影像分割出背景影像。在此例中，前景影像及背景影像並非彼此分離，而是有些重疊一這樣的重疊能降低壓縮，但降低邊緣效應 (edge effects)。甚至如果前景遮罩及背景遮罩用來分割文件影像，在文件影像被分割之後，前景遮罩及背景遮罩便不須要了。前景影像與背景影像具有洞孔，或圖素被設定到其它影像的空區域。這些空區域也可為不相關（don’t care)圖素。相對地，非空的區域可被指為相關（do care)圖素。這些空的區域可適當的處置，以降低前景影像與背景影像整體的壓縮大小。一種方法是用不相關（don’t care)圖素值填滿這些空的區域。這些不相關圖素值被挑選來增加壓縮，進而縮小影像。例如，一示範的背景影像可為白色的，但在文件所在之處則用不相關圖素。在此例中，不相關圖素可用白色填滿以改善壓縮。另一種方式是不填滿空的區域，並使用利用空白區域的壓縮架構，例如屏蔽的小波壓 14 200306080 縮（masked wavelet compression)。其它的方式也可依據本發明而實現。

在前景影像與背景影像上還可執行額外的處理。前景影像與背景影像可用較小的解析度縮小尺寸，因而可降低相對的壓縮大小。例如，背景影像與前景影像可從300dpi 縮小至1 〇 0 d i p。而且，定色的相連組件可在背景及前景影像中被界定。定色的相連組件為複數個相連的圖素，具有實質上相同的顏色。該定色的相連組件可利用配置種子圖素（s e e d p i X e 1 )來定義，並利用演算法以判定與之相連之實質上相同顏色之圖素。臨界值或最少的圖素可被設定而使定色的相連組件具有最少的圖素。所定義之定色的相連組件可增加文件影像的壓縮。

遮罩編碼器1 06從遮罩分離器102接收該遮罩，並將該遮罩編碼以產生壓縮位元，或從該遮罩產生壓縮遮罩位元流。遮罩編碼器 106可用任何適合的壓縮架構。該遮罩為二位元並一般包含紋理資訊。因此，應挑選壓縮二位元及紋理資訊好的壓縮架構。二階壓縮架構可用來將該遮罩編碼。可用來將遮罩編碼的壓縮架構是CCITT(Consultative Committee on International Telephone and Telegraph) 〇 CCITT 目前名為 ITU-T 國際通訊聯盟通訊區（ITU-T International Telecommunications Union-

Telecommunications Sector)(於 1994年改名），其為一製定標準的組織，以及傳真/數據機通訊無漏失壓縮技術。 15 200306080 此壓縮型態在二位元的影像上用得比較好。一般在較早的版本V.42bis的壓縮比為4:1，新的版本V.44 2000為6:1，其為依據Lempel-Ziv-Jeff-Heath(LZJH)壓縮演算法。依據本發明，其它適合的壓縮方法或架構也可用來壓縮遮罩。前景編碼器1 08從前景背景分割器1 04接收前景影像並將前景影像編碼為前景位元流。背景編碼器1 1 0從前景背景分割器1 04接收背景影像，並將背景影像編碼為背景位元流。任何合適的壓縮架構都可用在前景編碼器 108及背景編碼器110。例如，前進式波長編碼（pro gressive wavelength encoding，PWE)，前進式轉換編碼（progressive transform coding，PTC) ，JPEG，JPEG2000，及屏蔽的小波壓縮架構可被用來將前景影像或背景區域編碼。就某些壓縮架構而言（例如，屏蔽的小波），前景編碼器i 〇 8 及背景編碼器1 1 0可以用遮罩，以將前景影像與背景影像編碼。組合組件1 1 2從遮罩編碼器1 06，前景編碼器1 〇8，及为景編碼器11 0接收該壓縮的位元，並將這些位元人併為一輸出位元流或輸出檔案。組合組件i丨2可在輸出樓案中包含檐頭資訊’定義或提供訊息如，編碼型態，索引表，等，以便被解碼器用來重建該影像檔案。為便於說明’該編碼系統已被描述為透過以上所描述之各種組件以立即處理整個影像。然而，重疊的掃描區域可被用來降低記憶體的使用。例如，5丨2行的文件影像的第一條線可被本系統所處理。然後，本系統用一重叠的量 16 200306080 的第二條線來重疊該第一條線，如1 〇條線。後來的線條皆如此處理，直到整個文件影像皆處理完成一重疊的量使得線條之間的變化比較小。如前所述，前景影像與背景影像有空的或不相關區域。空的區域有許多處理的方式。一種方式是用資料來填滿空的區域，然後使用一般的壓縮技術。一種簡單的處理是將這些影像的空的區域用該影像中平均的圖素值來填滿。然而，此方法可能在遮罩的邊緣產生鮮明的不連續，可能就一所給的峰值訊號至雜訊率（peak signal-to-noise ratio， PS NR)會增加所須的位元率，並在接近遮罩或空區域的邊緣上’產生顯著的振铃雜訊（ringing)。另一種方式是用最接近非遮罩圖素（或相關區域）的顏色將每個圖素著色。標準的形態演算法（morphology algorithm )可容許對該遮罩下’對所有導向Voronoi填滿（Voronoi-filled )的空區域内的圖素，只以兩道程序來處理。然後，當前景或背.景影像被重建時，被重建的影像為低通濾的（l〇w-passed)，且已知的圖素被回復其正確值。如果低通濾器將頻率切得太低，會產生尖銳的邊緣，而增加所須的位元率及在接近邊緣處發生顯著的振鈴雜訊（ringing)。另一種處理空區域的方法是在凸形組（convex sets) 上投影（projection)。例如，有兩個凸形組：符合在這些可見圖素上之輸入的影像組，以及具有設為零的某些小波係數（wavelet coefficient )的影像組（例如，超過某些解析度的所有高頻係數）。藉由改變在這兩組上的投影， 17 200306080 可以發現具有許多而另一格子所設小波轉換與電腦視面。這樣可用# (masked 景編碼器個案而定是提供給蔽的小波用k值作無法處理區域或空的數值，的小波轉圖2 步驟之圖驟，及位中省略了其線性組值（由高i ，與可見圖素相同的影像其壓縮較好，因為它們零的小波係數。種處理空區域的方法是，在特別為不規則之小計之前景編碼器 1 0 8與背景編碼器 1 1 0上，用。這樣的小波解構（decomposition)用在，如覺，及與電腦圖學中之幾何資料的壓縮有關方的小波適用於遮罩的不規則圖案。〖勺小波轉換壓縮架構是一種屏蔽的小波轉換 wavelet transform )。屏蔽的小波轉換可用在前 1 0 8及背景編碼器11 〇，其小波函數的改變依，此為該遮罩的功能。雖然未視於圖1 ,該遮罩前景編碼器1 0 8及背景編碼器11 〇，以使用屏轉換壓縮架構。例如，一般習用的小波函數可使為預測。然而，以遮罩及空區域，一般小波函數不具數值的圖素，（例如，不相關圖素在不相關區域）。相對地，可改變的小波函數只應用現有或前景影像與背景影像的可見區域。因此，屏蔽換不須要以不相關圖素將空區域填滿。為使用’’拉力·’（ lifting)之傳統小波運算的一個示。該圖示說明，方形小波，在位置3的預測步置6的相對應的更新步驟（為清楚表示起見，圖其它的位置）。在每値答缺本 %可似則號旁的係數指示如何計合以執行每個步驟。你丨杯 .^ 0 ^ 例如，在位置3之”詳細”數 i率波器所得來的）是由下万丨玄斗 ^疋田下列等式所計算出來的： 18 200306080 ds = S3- ( 一 s〇 +9s2 +—s6) /16 式（1) 此更新的步驟是用以下的等式計算的： ^ = d6+ ( 一 ^ +9d5 + 9d7 —d9) /32 式（2) 圖3顯示當某些圖素值遺失時所產生的問題。在此圖不中’在位置1 ’ 2，5，8及9中沒有數值。顯然，傳統的方形小波運算是行不通的，因為結果會依據這些遺失的值而定。將這些遺失的值設為某些常數（零，或整個影像的某個平均值）會產生鮮明的不連續現象，這會轉換為很槽的壓縮，及/或不想得到的人工化效果。相對地，屏蔽的小波壓縮架構以其遮罩的功能’視個案而定地改變小波函數。例如，在拉力的預測步驟中，％果有用來作預測的 1值，k— 1級的多項式可用來作補點（interpoUtion)。當只有三個值可用時，則用四次多項式而非三次多項式。如果只有-個值可用’貝I】用一個常數的多項式，而小波會成為Haar小波。須注意，如果該訊號是让—上次的多項式’ 且k圖素未被遮蔽，則該預測非常精確。該屏蔽的小波轉換壓縮架構利用從偶數位置上的係數，對在奇數位置上所有的係數做預測計算。在奇數係數與其預測之間的差，為小波係數—此可被視為在偶數位置上，具有某些零的高通濾波器。訊號s位於一位置的中央，並依此而被索引。為簡化起見，該架構依據一 7步濾波器 (7-tap filter)來描述’如圖4所示。圖4描述一拉力步驟，其中s。被預測為s-3，，s!，S3的函數，餘數d也 19 200306080 被計算出來。濾波器a依據標準的矩陣標示法被標示為0至i。小波係數d由以下的等式所提供： d -- Sq "i- ί=|Λ/2| t=0 2i-k/2ai 式（3) 其中k為在濾波器中步驟的數目（在此k = 7 )。高通濾波器的動能Μ可被寫為（設為Si = in ): 式⑷

/=μ/2| η

Mrt=(T+ Ζ(2ζ·-众/2)' /=〇假設一般的訊號可被一低次的多項式以j的次數所逼近（使用泰勒展延）（Taylor expansion)，然後選擇a以將第一個 j + Ι矩量（moment )設為零p然後，小波轉換將有許多個零，因而可壓縮得很好。因此，如果k = 7，a有 4級的自由度，且前4個矩量設為0。這些結果可用以下的系統來驗證： 1 1 1 Γ a; "~Γ 一 3 一 1 1 3 αι 0 9 1 1 9 a2 0 27 一 1 1 27_ 3 一 _0_ 式（5)

其以用矩陣表示法寫成：wa = c。對本系統的解是用在已知方形小波的係數：a = [ 1/16，一 9/16，一 9/16，1/16]。本系統可用在所有具有遮罩的情況，如圖1的遮罩。換言之，某些係數S2i_k/2不見了，可以矩陣m作為範例， 20 200306080 no 0 0 0 0 0 0 0 0 m2 0 0 0 0 m, 式（6) 其中m g {0,1}，諸如 :wma=c。m的效果是要移除等式（5) 中系統的欄位。不巧，在本系統中，當 mfO時，是被低估的，而在其它情況則被高估。這是因為有太多消退的矩量限制加在符合可見圖素之ai。這也可用只在第一個j 矩量上設〇的方式來處理，如果有j個係數則％矣0。這符合於等式（5)中的只保存系統中的第一個j等式。對於被低估的係數a丨（當a丨乘以m,·关0 )，加上一任一的限制a丨= Ο ;這可用單一的系統來完成： (pwm+m-I) a = pc P〇 0 0 0 0 P' 0 0 0 0 Pi 0 0 0 0 P3

式⑺ 其中I是相等矩陣（identitymatrix)，而且式（8)

Pi= ( tr ( m) > i) ? 1:0 ；式（9) 在A上的限制確定，就m中為0的每個係數，在等式 (5)中之系統中的線，被從等式（5)之系統的底部係數中移除。換言之，如果m f•有j個係數不等於0，則= 1，i = [0…j 一 1 ]，否則；? ； = 0。這很容易驗證，就％· e {〇，l}，系統總是有唯一的解法。等式（9)之系統可就 a對每個可能的 21 200306080 m值提供解法，以下之表（1)就方形小波加以整理，其中當系統為4維時，等式（9)就不同m值之解法如表中所示。 (ΐϋο,η^，m2，m3 ) a〇 a2 a3 0000 0 0 0 0 0001 0 0 0 -1 0010 0 0 -1 0 0011 0 0 -3/2 1/2 0100 0 -1 0 0 0101 0 -3/4 0 -1/4 0110 0 -1/2 -1/2 0 0111 0 -3/8 -3/4 1/8 1000 -1 0 0 0 1001 -1/2 0 0 -1/2 1010 -1/4 0 -3/4 0 1011 -1/8 0 -9/8 1/4 1100 1/2 -3/2 0 0 1101 1/4 -9/8 0 -1/8 1110 1/8 -3/4 -3/8 0 1111 1/16 -9/16 -9/16 1/16 表⑴ 接下來，訊號s以上述之預測值來更新。在更新步騾中，當訊號被乘以（一 1 ) 1之後，希望低通濾波器的第一個矩量會消失。換言之，如果一般的訊號（例如，可被寫 22 200306080 為低次多項式）可乘以最高頻率的訊號，（一1 ) 1，然後，低通率波器應輸出0。這個條件可輕易地被當作0矩量的限制，如同先前所描述的，除了輸入的形式會是士=(-iyr，而非\ =Γ。預測步驟使用相同的標示符號，更新的步驟符合此等式： i=\kll\ S = S0~^ 式（ίο) /=0

其中 k為濾波器中步騾（tap)的次數（在此例中通濾波器的矩量可寫成如下：式（11) i=\k/2\ /=〇但，就每個di，等式可局部被改寫成（假設r -1 ) Ίη )： i = \k /2\ i = \k /2\ n dj = sj+ L s J^2i-k/2ai = - jn + Za (j 2i - Ic / 2) 式（12) /=0 / = 0 由於j及k/2為奇數。因為個別的的設定是要產生零矩量，以下便為真：

/=μ/2| η 0 = jn + 21 Ο +2/-^/2) at 式（13) 這隱含 < =一心·。因此， i = \k /2\ n Μ Λ = 0Λ + X - 2(2/ - A: /2) bt 式（14) 要將小波壓縮得如一般訊號的壓縮一樣好，便要儘可能得將更多的矩量等於零。由於有四次的自由度，第四個 23 200306080 矩量可設為零證： - 3 9 一 27

'1/21 0 0 0 24個結果可以在以下的系統中很容易地驗式（15) 這可以矩陣的择+ 士』& ^ 737 *、万式寫成w 6 == c，。這個系統的解法為適、方形小波的係數·· b = [— 1/32, 9/32,9/32，一 1/32]。

、在叙叹有些係數〜不見了。首先，假設所有遺失、P /、在偶數的位置上。本系統可用如先前類似的方式解決以驗證： (pwm + I) b

Pc 式（16) 汪意 -、P的矩陣視Sq中央的位置而定。每個位置看到遮罩不同的部份’因此有自己的m及p。表（2)提供等式（1 6)的觫& , t 、，八中^系統為四維時，等式（1 6)對不同的 :值之解法如表⑺所示。要得出等式(16)，假設奇數位置 /又被遮罩遮蔽。如果奇數位置被遮罩遮蔽了，❻遮罩的值小於η，則广一"〃且等式（16)維持不變。否則，在預測步驟中有太多被遮蔽的圖素，而無法在更新㈣（小波係數仍將很小，但不是零）中將第n個矩量變成$。此逆小波轉換（inverse wavelet transform)很容易計算只要局邵地不要執行每個步驟，感謝拉力的形式化袼式。 24 200306080 (1110,111^1112,1113 ) bo b! b2 b3 0000 0 0 0 0 0001 0 0 0 1/2 0010 0 0 1/2 0 0011 0 0 3/4 -1/4 0100 0 1/2 0 0 0101 0 3/8 0 1/8 0110 0 1/4 1/4 0 0111 0 3/16 3/8 -1/16 1000 1/2 0 0 0 1001 1/4 0 0 1/4 1010 1/8 0 3/8 0 1011 1/16 0 9/16 -1/8 1100 -1/4 3/4 0 0 1101 -1/8 9/16 0 1/16 1110 -1/16 3/8 3/16 0 1111 -1/32 9/32 9/32 -1/32 因此，屏蔽的小波轉換可被用來將前景影像與背景影像編碼而不必將空區域填滿。然而，不同的實現方式可用其它的編碼方法或壓縮架構，如前所述，可將空區域以不相關值填滿。圖5為依據本發明之一種實施例之分割層次影像解碼 25 200306080 系統的方塊圖。本系統接收一壓縮的位元流，並從壓縮的位元流產生重新組合的影像。該系統包含一分離組件 502，前景解碼器504，背景解碼器506，遮罩解碼器508 及組合器 5 1 0。分離組件5 02接收壓縮的位元，並將位元分離以形成前景位元流，背景位元流及遮罩位元流。分離組件 502 可利用檔頭資訊以將位元流分離。前景解碼器 5 04將前景位元流解壓縮以產生前景影像。背景解碼器5 06將背景位元流解壓縮以產生背景影像。前景解碼器504及背景解碼器 5 06可使用任何數目的解壓縮架構，諸如，前進式波形（progressive waveform ) 或前進式轉換 (progressive transform) 〇遮罩解碼器5 0 8解壓縮遮罩位元流以產生遮罩或遮罩影像。遮罩解碼器 508也能存取佈局（layout)且/或回流訊息（re-flow information )。另外，遮罩解碼器 508 能獲得一索引表（dictionary )，用來重建紋理訊息（textual information )。遮罩解碼器 5 08 —般利用雙層解壓縮架構 (bi-level decompression scheme)。對某些壓縮架構而言 (如屏蔽的小波），前景解碼器504與背景解碼器5〇6可從遮罩解碼器508得到解壓縮的遮罩，以取得前景影像與背景影像。組合器5 1 0組合前景影像，背景影像與遮罩為重新組合的文件影像。重新組合的文件影像與原本之文件影像相同或近似。另外，重新組合的文件影像可視其所要之顯示 26 200306080 器特性而具有不同的形狀及/或尺寸。例如，掃描信件大小的文件與顯示在具有較小螢幕之可攜式裝置上便不同。組合器 5 1 0依據遮罩，從前景影像與背景影像，產生為了重新組合之文件影像用的圖素。重新組合之文件影像的每個圖素是由參考一遮罩之相對應的圖素來決定的，以判定重新組合之文件影像的圖素是否可取自前景影像或背景影像。例如，遮罩圖素值為1可表示重新組合的文件圖素可來自前景影像之相對應的圖素。

圖 6顯示本發明之另一實施例的文件影像範例。圖 6 為一範例，並只是用來更進一步說明本發明。文件影像 60 1 具有多種色彩及/或陰影。文件影像 601為一典型的文件影像，包含紋理訊息 602及背景訊息 604，前景訊息 6 03，背景 605。圖 6中之圖案顯示不同的陰影或色彩。因此，紋理訊息 602的顏色可以與影像訊息 603及 604 或背景 605不同。另外，此訊息可以用任何適合數目的顏色。依據本發明，如使用圖1之系統，文件影像 601 可分割成3個組件：遮罩610，前景影像611及背景影像6 1 2。本發明之其他實施例可將文件影像分割為二或三種以上的層次。遮罩 61 0為二位元的影像，因而只用黑色與白色區域顯示。遮罩 6 1 0決定或配置是否文件影像6 0 1的圖素應該在前景影像6 11或背景影像6 1 2。遮罩6 1 0也利用判斷哪個前景影像6 11及背景影像6 1 2的圖素要在該重建的文件影像，來產生重建的文件影像。重建的文件影像與 27 200306080 文件影像 601相同或近似。

如圖6所示，前景影像6 1 1包含文件影像 6 0 1的部份，如遮罩 6 1 0所指示的。遮罩 6 1 0的黑圖素，將文件影像 6 0 1的圖素配置到前景影像 6 11。前景訊息 6 0 3的其它部份可用不相關圖素6 1 5填滿。如前所述，不相關圖素615 增加壓縮效能，但不會出現在該重建的文件影像中。同樣地，背景影像 6 1 2包含文件影像6 0 1的部份，如遮罩 6 1 0 所指示的。遮罩 610的白圖素，將文件影像 601的圖素配置到背景影像 6 12。背景訊息 604的其它部份可用不相關圖素606填滿，如圖6中所示。不相關圖素606的出現是為了增加壓縮起見，但不出現在該重建的文件影像中。為說明起見，紋理訊息 602的輪廓出現在背景影像 6 12。然而，紋理訊息 602可用符合背景 605的不相關圖素填滿，而使紋理訊息 602在背景影像 6 1 2中看不見。如前所述，圖 6只是依據本發明之實施例中，許多可能之文件影像中的一個例子。影像可作許多變化，並仍符合本發明之精神。

圖 7為依據本發明之實施例的一種分割層次影像編碼系統的方塊圖。本系統可定義文件中的訊息，如紋理，手寫字，圖畫等，並壓縮該文件。本系統可操作任何形狀或尺寸的單一或多頁文件。色彩空間轉換器（color space converter) 702將文件影像轉換為文件影像的色彩空間。該色彩空間指色彩如何表現在文件影像中。色彩空間一般有許多種組件，提供圖 28 200306080 素單位的顏色。例如’影像可用 RGB (紅綠藍）的色彩空間表示，每個圖素有RGB組件的每個值。另外，透明組件（transparency component )可加入以顯出圖素的透明度。圖素的整個顏色是用這些組件組合而成的。例如，白色可用255，25 5及25 5的RGB值來取得（假設每個組件是8位元），而藍色可用〇，0及200的rgb值來取得。 RGB色彩空間通常用來顯示影像及/或掃描影像。然而， RGB色彩空間會阻礙壓縮。文件中的顏色一般有關且/或相互有關。就RGB色彩空間而言，組件被個別壓縮（依頻道），造成相同的影像被編碼了許多次。可用轉換文件色彩空間至壓縮度更高的色彩空間之方式來改善文件影像的壓縮。一種可能的色彩空間轉換是要將文件影像從RGB色彩空間轉成YUV色彩空間。Y，U，V組件分別為亮度，色度紅色（chrominance red)及色度藍色（chrominance blue) 組件。YUV原先是為電视的顯示而發展的。轉換可基於觀看的喜好設定而發展，而非可壓縮性。因此，文件影像可用以下的等式從RGB色彩空間轉換為YUV色彩空間：

Y = 0.6G+ 0.3R+ 0.1B U = R- γ V = B— Υ 式（17) YUV色彩空間提供比RGB色彩空間更好的壓縮，因為它利用組件之間的關聯，所以相同的訊息不會被編碼許 29 200306080 多/入。大多數的關聯訊息包含在y組件中。等式(17)顯示 YUI組件可被比RGB相對應之組件更小的值代表。然而，士則所迷’ YUV色彩2間不是為壓縮性而設計的，而是為了可觀㈣。文件影像可為任何…如顯示，而轉換回RGB色彩空間，如藉由修改等式（17)。另一種色彩空間轉換是將文件影像從RGB色彩空間轉換為YCQCg色彩空間。YCQCg代表利用由γ所表示的亮度，

C。所代表的橘色’及Cg所代表的綠色。利用此轉換，RGB ’、且件可對應至YC^Cg (如，前所述之習知γυν的一種選擇）。 "Y" '12 1 · -R一 -R- 1 -Γ 丫 C。 LC，J 2 0 -2 一—1 2 -1 G B G B 10 1 1 1 一1 C〇式（18) 色彩空間符應（color space mapping)的好處是，從RGB至YCQCg及從YCQCg至RGB的逆轉換可用整數運算來達成。而且，此逆轉換可不用乘法運算。YCcCg色彩二間表示法會產生比一般Y u V壓縮更顯著的效果改善，因為YCQcg色彩空間表示法從當代數位圖素資料（modern d i g i t a 1 p i c t u r e d a t a ) 的主要組件分析上，可得到最接近統計上最佳的空間。先進的Y C。C g色彩空間不是為觀看的目的而設計的，而是為了壓縮目的而設計的。而且，由於等式或等式（1 8 )的轉換是利用整數運算，文件影像用有效率的計算方式被轉換成YCDCg色彩空間。色彩空間轉換器7 0 2可將文件影像從任何色彩空間轉 30 200306080 換成任何色彩空間。例如，色彩空間轉換器7〇2可將文件影像從γυν色彩空間轉換成YqCg色彩空間。另外，如果文件影像已在喜好的色彩空間中，便不須要作任何轉換。遮罩分離器704從色彩空間轉換器702接收文件影像並產生遮罩。由遮罩分離器7 04所產生的遮罩是用來將又件影像分割成兩層的：前景影像與背景影像。本發明之其b貫施例可將影像分割成兩層以上的層次。遮軍，也稱為遮罩景> 像為二位元影像，其每個圖素的值決定圖素屬於則景影像或背景影像。遮罩分離器704產生的遮罩，可將遮罩’前景影像與背景影像之組合尺寸縮小。有許多方式可用來產生遮罩。就壓縮而言，相似的圖素值比不相似的圖素值壓縮得更好。例如，藍天的區域比具有各種顏色密度的區域壓縮得更好。如前所述，遮罩的產生是要將遮罩’前景影像與背景影像之組合尺寸縮小。另一種方法是，產生所有可能的遮罩，並挑選其中最好的。就具有N圖素的文件影像而言，便有2N個可能的遮罩。因此，理論上可將每個可能的遮罩經過測試，然後判定哪個會產生最小的整體組合影像。然而，要測過每個可能的遮罩’其運算成本太高，費時，且不可行。另一種方法是將文件細分為區域（regions)，分析每個區域以配置圖素並將區域合併起來。能量變化（energy varience )，其為可以取得的壓縮預估（estinlate of compression )，為一基於距離平方之總合的量測。文件的 31 200306080 小區域，如 2x2圖素或4x4圖素，可被分析化。小區域可分割成前景及背景區域，而使小變化可以降低或減小。每個可能的遮罩可被分個遮罩可使用，因為區域夠小，而使這樣的分析例如，4個圖素的區域在那區域的遮罩有1 6種小區域可合併在一起以產生遮罩，整體上縮小影像與背景影像的組合尺寸。另一種方法是產生遮罩，假設前景與背景而言是個常數，且遮罩的產生，減少或實質上數週圍的變化或能量變化（energy variance ) 是用作前景及背景兩者可取得之壓縮的預估，產生遮罩，然後分割文件影像以取得前景影像並將之壓縮。能量變化，如前所述，是對前景縮後的大小之可接受度的預估。首先，壓縮遮全被忽略了。更多的步騾能將遮罩的大小加入假設某個區域，該區域為N圖素的一集合 B為 S的部份（即，= 且Fn5 = 0 )。如於圖素位置X之影像值，；ceS，前景與背景的變 2 匕= Σ(/(χ)-〜）

XeF 2

XeB 其中一 Σ/(χ)及α=77~Σ/(χ)分別為前景與

XeF ^B X^B 作為能量變區域的能量析以判定哪變得可行。排列組合。遮罩，前景對整個區域降低這些常。變化在此而非實際上與背景影像與背景在壓罩的成本完考量。 S，且F與果f(x)是位 1化分別為：式（19) 式（20) 背景的中間 32 200306080 值，且nf及nb分別為前景與背景中圖素的數目。注意，這些變化也可表示為： 2 ^ = Σ/(χ) ^NfMf2 式（2 1)

XeF 2 ^NbMb2 式（22)

XeB 適當的分配F及S的B，這將減少五=+ L的總合。即使以這樣的簡化，這問題仍然非常地難解決，因為仍然有 2N個可能的遮罩。因此，影像可更進一步地分割成 2x2 個圖素次影像（s u b - i m a g e s )。在每個 2 X 2個圖素次影像上，只有24 = 1 6個可能的遮罩，這意謂著每個這樣的區域上，有可能可判定最佳的F及B，可減少五=匕（藉由嘗試所有 16種的組合，並保持那種具最小能量的組合。）這變成不須要試過所有的16種組合。這個問題等於K-means問題，K = 2，並且由於f(影像）是級數函數（scalar function )，f(x)的值可被排序而產生一個解，這可非常有效地計算：排列所有四個圖素的值，並判斷這三個分割中 (依據排序）哪個產生最小的能量。部份總合可在每次分割中被重新使用，以減少操作次數。然而，此解法的缺點是，每個2 X 2子區域具有明確的前景與背景，甚至可挑出最小的圖素雜訊，而造成不正確的遮罩。下一步在於組合連接的區域。例如，假設2個區域，1及2，其相對應的前景與背景，F,，Βι及F2，B2。當組合這四個集合時，實際上有7個分別的可能性： 33 200306080 NEW F new B F1 B1 ， FI ， B2 FI ， Bl ， F2 B2 FI ， F2 ， B2 Bl F2 F1 ， Bl ， B2 FI，F2 B1，B2 FI，B1 FI，F2 FI，B2 Bl , f2 表（3)

最佳組合為具有最小能f的五—+ F 5組合。注意，所有的7個組合都可被嘗試，或其在前景與背景中的平均可被排序，且只考慮相對應之排序的部份。甚且，如果每個區域具有Σ/(χ)，Σ/(χ)2且Nf為前景及Σ/⑺，Σ/(χ)2且nb，

F F b B

E的組合可在常數時間内完成計算。在合併之後，這些量必須常被重新計算，但幸運地，這也可在常數時間内完成。也注意到對整個區域的總合Σ/ω2與每個部分的比是常數，且不須要為了挑選最佳的區域而被計算。對整個區域的總合也可用來判斷，何時不必合併區域，如以下所示。區域而成為 4x4區域。合併連接的區域時可用合併水平連接2 X 2 2 X 4區域，然後合併垂直連接的2 x 4區域成為 34 200306080 4χ 4區域合併為8 χ 8區域，如此一直合併到只剩下一個區域為止。最後這個區域再分為前景與背景。不幸的是，以這樣技術的合併會將許多灰階放在前景或背景，而每當有兩個以上的顏色在同一區域時，可能會漏掉潛在的重要細節，如文字。例如，如果區域1在白色上寫下灰階的文字時，而區域2大多為黑色時，這兩個區域的合併會變成灰色，且白色在最後區域的前景，而黑色在其背景，而將使文字的訊息遺失了。然而，只要有兩個顏色合併在前景或背景，在該區域便會有明顯的能量增加 (或改變），由於對該區域而言，常數已不再是個好的典範。依此，須要應用一個演算法，如果能量 Ε超過某個由實驗所決定的門檻值Κ時，不要將連接的區域合併。此演算法產生一個遮罩，可這在一頁中擷取了大多數的文字與圖形線。然而，這演算法還有一些改善的方法，其中一個是要用簡單的區域。小區域的 A1區能量（例如4 X 4 )可被測量，而且如果能量夠低（用另一個實驗上所決定的門檻值），整個區域可被放在前景或背景。因此，如果能量低於一個門檻值，藉由加速此演算法的操作，可以避免將小區域分割。在前景與背景上不用常數假設，而用多項式後退（polynomial regression)來代表前景及背景。例如，如果多項式為等式ca +你+芦的平面，能量可定義為：〜=Σ〇"(χ，少)-¥ +心 + "尸)2 式（23)

x.y^F 35 200306080 VB = ^{Λχ^)-^βχ + + MbY 式（24) x,y^B \ ) 其中x，y指圖素的位置，而，A及/iF為減少VF的純量 (scalars)，而A，久及A，為減少〜的純量。注意，α〆 Α及〜可在常數時間内用2>卜，外，，χ/(χ，7)3；及的量解決。這是三個未知及三個等式的線性系統，且這同樣適用於αβ ’久及a。如前所述，此演算法是由下而上’且在每次合併時會減少E。前景與背景不能用平均來排序’因此所有的七個組合被測試以判斷哪個組合可減少E。要將每個測試及合併以常數時間處理，，冰，及及N的量應留給每個區域的前景與背景。簡單區域的最佳化仍有可能，但可假設有個常數在該區域，多項式後退，或兩者。遮罩處理器組件706執行遮罩上任何次數的處理操作。遮罩處理器組件706包括雜訊移除組件（n〇ise retnoval component ) 708，及混色偵測器（dither detector ) 710。本發明之另一實施例可包括其它的遮罩處理組件。本發明的其它實施例可包含差不多的處理組件。雜Λ移除組件7 0 8從遮罩移除雜訊。如前所述，數位文件一般由掃描標準文件的方式建立。雜訊的某些量幾乎總是透過掃描及數位化的處理而成為數位文件。例如，掃描器上的手指印或文件上的皺摺會產生雜訊及/或錯誤的遮罩’而被含在文件影像中。雜訊移除組件7 〇 8首先試著去定義遮罩中的雜訊。有許多方法可用來定義遮罩中的 36 200306080 雜訊。一種方法是分析相連組件的遮罩。相同顏色相連的圖素，如黑色。遮罩可從左至描，逐頁地搜尋相連的組件。相連的組件可或位元映射（bitmap )資訊的方式儲存。然個圖素被分析以判定是否為雜訊。因此，要域（surrounding region )的每個圖素，例距離内的所有圖素，以判定相連組件的數與該％繞區域交叉的位置。如果相連組件纪小，該圖素便被視為雜訊且由該遮罩移除。依據任何較佳之壓縮條件而被配置到該文竹背景影像。依據本發明之精神的其他方法访一般而言，雜訊移除組件70S可定義看及/或與文件之文字或影像無關的圖素^雜翻並不必要從文件中移除所有的雜訊。聋訊藉由將圖素分配至前景影像或背景影像的为除被定義的雜訊。另外，移除該雜訊，可襄素之值來取代被認為是雜訊的圖素。混色偵測器71 〇偵測遮罩中的混色（從該遮罩中移除混色。混色是一種應用在零術，以在單色顯示器或列表機上產生不同象，或在彩色顯示器或列表機上產生額外合將於像的區域當作點狀的群組，以不同的g 印W像熟悉者稱此為半調的（h a 1 f t 〇 n e )，^ 睛趨於將不同顏色的點以其平均值來看待：丨連的組件為相 •右，上至下掃以位蓄置，形狀 r後，文件的每 •分軒環繞的區如在五個圖素目是否在及/或丨數目比門檻值然後，該圖素 :的前景影像或 :可適用。 •來似乎為散亂 ^移除組件7 0 8 移除組件708 '式，從遮罩移 F由如以周園圖 dithering )，並匕腦圖學上的技灰色形狀的假 )顏色。混色是 3案著色。對列色色利用人類眼 ’並將之合併為 37 2〇〇3〇6〇8〇單一太 —查覺到的形狀或顏色。在某個區域内，視黑點對又比例，其整體的效應是灰色的某種陰影。混色也用電腦圖形增加真實感，並使鋸齒狀的邊緣平滑化， 4占 7 一 7以低解析度來平滑化。然而，混色對文件影像可能題。若未經過適當地偵測及處理，混色將被誤認為是文手寫字或圖形。混色偵測器7 1 〇定義遮罩中的混色區域…該區域分割而使每個區域或次區域有類似的混色圖案。混色器710移除或處理被定義的混色區域。例如，混色器7 1 0可定義混色區域為淺灰色。混色偵測器7 1 〇混色區域移除，或將該區域設為淺灰色。請暸解，將改變為陰影也會涉及改變文件影像。藉由修改遮罩，偵測器 7 1 0也可將所定義的混色區域重新配置到前背景。有許多方法可用來偵測及/或處理混色。一種方法析相連組件的遮罩。相連組件為相同顏色的相連圖素如黑色。遮罩可由左至右，上至下掃描’逐頁地搜尋的組件。相連的組件可用其位置，形狀或位元映射資方式儲存。遮罩的每個圖素，在及/或與環繞區域交位置，被判定有多少的量或數目的相連組件。環繞區為與環繞該圖素的某個數的圖素，如7個。如果在該内的相連組件的數目比門檻值大，混色便被移除。然該圖素被配置到前景影像或背景影像，因而移除該混此配置可由計算該區域的背景中的圖素數目及該區域白點來對對角有問字，可被偵測偵測可將區域混色景或是分，例相連訊的又的域可區域後，色。之前 38 200306080 六中的圖素數目來判定。然後，圖素可被配置到前景影像，如果區域的前景影像中的圖素數量大於該區域的背景中的數量，否則圖素可被配置到背景。依據本發明之精神，其他用來定義及/或處理混色或半調的方法亦可適用。襄集化組件712定義遮罩中的叢集（clustering)。叢集化組件7 1 2將相連的組件放在遮罩中。相連的組件，如前所述，為複數個相連的圖素’且如可為四面相連的組件或八方相連的組件。在將相連的組件放在遮罩之後’叢集化組件712定義類似相連的組件，並將之群聚為叢集。叢集為一群類似的相連組件。一般而言’叢集代表字母與數字混合編製的特性，包含手寫字’但也可包含其它訊息。然而，也可有許多叢集代表單一的特性。叢集可大幅增加恩縮率。增加壓縮，降低檔案大小的原因是，每個相連組件是由位置所涵蓋，對形狀的指標（a pointer to a shape)，屬於形狀的索引表（a dictionary of shapes )。形狀是位元映射或相連組件或叢集的，，影像"（image )。相連組件也稱為遮罩。演算法的叢集面是要判斷哪個形狀應屬於該索引表，而哪個形狀最接近每個相連的組件。一般而言，形狀的索引表為檔案尺寸的一部份，而且可為跨頁分享。對形狀的指標是以頁中的位置（x，y)，及形狀數（shape number )來表示。x，y位置可用前一個位置來壓縮，而形狀索引（shape indices )用上下文脈絡或語言模式來壓縮0 39 200306080 藉由叢集化組件7丨2 ·有許多方法可用來以定一種万法是比較每個記號（mark )的形狀，並及/或相同的特徵。另一種方法是用現有的叢集號（mark )的特性或相連組件。現有的叢集為個记號的群組，它先前已被定義為叢集。從文科號特性與現有之叢集特性比較。這樣的比較並不時且昂貴的位元對位元比較法，以找出不符合於果記號的特性無法符合任何現有之叢集的特性，號與任何現有之叢集的特性差太遠，則該記號僅新增的叢集，而避免了位元對位元的比對。此方方法不同的特性是，可藉由計算效率高的掃描以合I處’以及計算效率高的演算法以偵測叢集度。叢集的一個有用的特性是X大小及7大小。及y大小提供現有之叢集的尺寸資訊。記號之】大小可與現有之叢集的x大小及y大小相比較，符合之處。本發明之一個實施例是要將叢 (b u c k e t )的二維表加以組織，並以X大小及乂標。當找到新記號時，相同之X大小及y大小的抽離出來，該記號便與該桶子中的叢集相比較。子也可被搜尋以找到更多正確的符應（所有其它被忽略或篩選）。對於叢集中心之"不飄移”（假設，如下所述，在此是有用的，因為它保證叢桶子中。 .義叢集。定義相似特怏，記矣少有一 .得來的記 :須要用即 f地方。如 jL如果記 :被當作是 •法與其它彳貞須ιΐ不符的符合程諒χ ϋ c大小及y 以找出不桶子大小當指桶子侵^皮彳目連的桶的桶子將 drift)的集會留在 40 200306080 一種可用來比較記號與現有之叢集的特性是印字 (ink size )。該印字大小通常指在記號或叢集中，黑素對整個圖素的比例。同樣地，記號的印字大小可與之叢集的印字大小比較，以找出不符合的地方。記號個特性是”熱點”（hot point )。該熱點是記號上的一置，其可為重心，或由其它手段所計算出來的（例如特徵（surrounding characters )的線性等式）。在比間，記號的熱點與叢集在比較開始之前便被對齊，通成翻譯（translation )。而另一個特性是縮小的記號像，其為圖素大小之縮小版的記號及/或叢集的一個映射。在本發明之另一實施例，縮小的記號置於熱點央，該記號被重新調整大小而使縮小的記號有固定大又，叢集之不飄移的假設有助於保證該叢集的縮小版確代表叢集中的所有記號。縮小的記號（mark )可小的記號或現有之叢集的縮小影像比較，以找出不符地方。當一個記號通過所有的特性試驗之後，它便可與以更直接的方式相比較。記號與叢集之間的距離被比並與第一門檻相較。如果距離是在某個門檻之内’該便被加入於現有的叢集中。記號可被加入該第一個可的現有叢集，或該記號可加入與之相距最短距離的現集。另外，叢集可用叢集中之第一元件（element )作特徵。這樣的好處是’在叢集中加入新記號不必要重大小色圖現有另一個位環繞較期常造或影位元的中小〇可正與縮合的叢集較，記號接受有叢為其新計 41 200306080 算該叢集的特性。本方法的另一個妤處是’它避免了”叢集漂移，，（cluster drift )，這發生在當每次有新記號加入叢集中時，叢集的中心便跟著移動。不具叢集漂移’也稱為"不飄移"假設，保證同一個叢集中的雨個兀件 < 間保有最大的距離--此保證提供了有效且激進的筛選。這種方法的主要缺點是，對相同平均的叢集至記號（cluster_t〇-mark )的距離，它會產生更多的叢集，如此比起其它叢集演算法，如k-means，叢集不是最隹的。然而’本方法的重要優點是速度的增加。在文字壓縮的案例上，因為索引表的大小，而不須擔心叢集的數目增加1 〇 %，索引表帶有每個叢集的訊息，是壓縮文件之尺寸的一部份。在叢集化組件712於遮罩中找出叢集之後，光學文字辨識器7 1 4便收到遮罩，光學文字辨識器7丨4執行遮罩上的光學文字辨識。光學文字辨識器7丨4找出遮罩中可能的文字，並從叢集組件707利用叢集以協助文字叢集的分析。每個叢集被分析以判定該叢集是否為文字，然後判斷該叢集代表甚麼字形。此方法可依據不同的語言及/戈丰母而奴而$ ，叢集的形狀或位元映射與所使用的字母的字形或位兀映射相比較。如果形狀夠相似，叢集被視為該特別的字形。每個所找到的文字的位置訊息，可以保持其順序。這些文字可用標準的字母的文字順序排列，如ASCn碼。佈局分析器716在遮罩上操作，以改善壓縮並提供佈局資Λ。佈局資訊後來可用來將文件影像回流。佈局分析 42 200306080 佈局資置組織件來提份依據連組件度，加二個以或其它資訊。及該文器7 1 6可利用許多種方万去以改善壓縮及/或提供訊。一種方法是先用色彩，垂直位置及/或水平位相連的組件。相連的組件 1〒可由系統700的另一組供，如叢集化組件712。徐&w 怖局分析器7 1 6至少一部顏色，垂直位置，水平位 u置，加入的距離（如，相之間的距離），相連組件之*吞其/ + 4 ^ τ <回度及/或相連組件之寬入或合併相連的組件。因办 ,λ ,,,. 口此，加入的相連組件包含上的相連組件。加入的組件也可與其它相連的組件加入的組件-合在一起。佈局分析器716產生佈局佈局資訊可包含加入的組件之位置，線條的位置，件影像的其它訊息。遮罩編碼器718從体局分析器716接收到遮罩，並將遮罩編碼以產生壓縮的位元流，稱為遮罩位元流。任何適合的壓縮架構可用遮罩編碼器718來實現。該遮罩為二位元且一般包含紋理訊息。因此，應挑選對二位元及紋理訊息壓縮較好的壓縮架構。二級的壓縮架構可用來將遮罩編碼。另外，遮罩編碼器7丨8編碼或提供編碼訊息以應用在將遮罩位元流解碼，如函式庫，索引表，符號，表的大小等等。可用來將遮罩編碼的壓縮架構為CCITT ( Consultative Committee on International Telephone and Telegraph)。 CCITT目前為ITU-T國際電訊聯盟-電訊區（International

Telecommunications Union-Telecommunications Sector)，於1994年改名，為標準的組織，及傳真/數據機通訊的無 43 200306080 漏失壓縮技術的名稱。這種壓縮型態適合二位元的影像。一般對舊版V.42bis的壓縮比為4:1，對新版V.44 2000的為 6·1 ’ 這是依據 Lempel-Ziv-Jeff-Heath(LZJHH)壓縮演算法而疋的。其它的壓縮方法或架構可被用來將遮罩編碼並仍符合本發明之精神。則景背景分割器7 1 9接收文件影像及該遮罩，並將文件影像分離為前景影像與背景影像。依據本發明之實施例，前景影像與背景影像實質上與文件影像的大小相同（如文件影像為640x480，前景影像為640x480，背景影像為 6 40M80圖素）。然而，本發明之另一實施例可產生前景與背景影像’其大小與文件影像差很多。前景影像與背景影像為，當組合在一起或重新組合時，可與文件影像相同或類似。刚景背景分割器7 1 9利用二位元形式的遮罩以產生前景與背景影像。例如，所有在遮罩中用1表示的圖素可到前景影像，而所有用0表示的圖素可到背景影像。相反地，舉例而吕’所有在遮罩中用〇表示的圖素可到前景影像，而所有用1表示的圖素可到背景影像。然而，前景影像與背景影像一般有未設值的圖素。這些未設值的圖素稱為孔洞’空的區域及/或不相關區域。另外’前景背景分割器719包括擴充組件（dUate component ) 720 及修整組件（retouch component ) 721。擴充組件7 2 0在遮罩上操作，以依據前景影像與/或背景影像將遮罩擴大。遠擴大的動作為依據距離轉換（d i s t a n c e 44 200306080 transform )的形態操作（離轉換用一個遮罩，並將 (morphological operation)，該距的區域用k圖素擴展，其中k 為常數（如2 )。距離可為曼哈頓距離（Manhattan distance )

或球形距離。此交談的操作（ (erosion)’可用逆遮罩（inversemask)的擴展來執行。在基本的掃描文件中，文字通常被洗掉，為漏墨（ink bleeding )的結果，或在掃描期間的低dpi設定。因此從白到黑的過渡期為持續且漸序的，遮罩定義了前景與背景 <間不可逾越的界限。在接近前景與背景兩者之邊緣的持續轉變（continuous transiti〇n)會導入振鈴雜訊⑴叫丨叩），而難以編碼。要減輕此效應，可忽略接近邊緣的圖素值。运可利用前景與背景的「不相關」值以擴展許多圖素距離來實現。在文字區域週圍，「不相關」圖素的擴展（dilation) 一面縮小檐案大小，一面增加了對比與可讀性。然而，當擴展用在自然影像的區域時，增加對比的效應將使影像看起來冷張不貫。要避免此問題，可執行遮罩的佈局分析，並偵/則哪個區域是文字所構成的。擴展可只針對文字區域。擴充組件72〇可將遮罩分離為前景遮罩與背景遮罩。 I口果會有給前景與背景兩者的不相關圖素。這些圖素仍附有合理的值，因為擴展的距離小，且前景與背景一般因為壓縮的關係而平順，因此不相關圖素會得到與鄰近相關圖素相差不遠的值。然而，在將不相關擴展時必須注意，不要元全將相關圖素的小或薄的區域完全抹除。如果發生适種情況時’圖素會變得無法控、制，而與任何相關圖素離 45 200306080 得很遠，造成該圖素與離很遠的區域在著色無法預測。要避免适種情況發生，必須注意距離的轉換，並保護區域的極值（local extrema)，使之不要從相關變成不相關。前景影像與背景影像最後可被重新組合成一再組合的文件。然而’尖銳的邊緣與轉換（transiti〇ns )將造成壓縮的降低，並造成重新組合的影像有視覺上的缺陷，如邊緣或線條。例如，這會發生在當遮罩造成跨越實質上相似之色區的假邊緣（spurious boundary)時，造成實質上相似之色區的部份被放在前景影像，而另一部份被放到背景影像。當最後重新組合時，這些部份會有看得出來的，可察覺的線條跨過假邊緣，因為這些部份被分開處理且分開編碼。另外，這些部份的壓縮效率被降低，因為假邊緣實質上是依照每個部份編碼的。修整組件721在遮罩上將文件影像”修整y ret〇uch)，而使文件影像整體的壓縮可被改善，因此，重新組合的文件影像可明顯地被改善。一般而言，修整組件72丨定義假邊緣及/或將前景及/或背景影像用遮罩的.方式擴展。就一種方法而言，修整組件72 1利用遮罩以定義前景與背景影像的假邊緣。藉由比第一門檻的圖素量（如5圖素）長的合併區域的邊緣，其水平及/或垂直線可偵測到假邊緣’其（1)邊緣的一邊是前景而另一邊是背景，（2)以大於第二個門檻量的差別，延著任一邊的線的線性後退， (如，線性後退可在圖素延著前景邊的邊緣圖素上執行，線性後退可在圖素延著背景邊的邊緣圖素上執行）。修整 46 200306080 組件7 2 1可從遮罩分離器 7 04取得區域訊息。修整組件 72 1以從遮罩上產生分別的前景與背景遮罩來擴展前景及 /或背景影像。前景遮罩擴展前景影像，而背景遮罩擴展背景影像。一般而言，前景影像與背景影像擴展了一些圖素而越過邊緣。前景與背景遮罩不是被編碼，或用來作為解碼程序的一部份。依據本發明之精神，在重新組合時，修整組件 7 2 1也可用其它方法以改善文件影像的壓縮及外觀。如前所述，前景背景分割器 7 1 9使用該遮罩以將文件影像分割成前景與背景影像。如果前景與背景遮罩是由擴充組件 720且/或修整組件721所產生的，該前景遮罩用來分割文件影像為前景影像，而背景遮罩用來將文件影像分割為背景影像。前景圖素過濾器 722從前景背景分割器 7 1 9接收前景影像。一般而言，前景圖素過濾器 722在前景影像中找出不相關區域或空區域，並將這些區域以不相關圖素填滿。這些區域是由位在背景影像的文件影像之圖素所形成的，留下空的或不相關區域在前景影像中。不相關圖素一般不出現在重新組合的文件影像中，以致於前景圖素過濾器 722不考慮不相關圖素的外觀。本發明之另一實施例可避免用壓縮架構將不相關圖素填滿，該壓縮架構正確地處理不相關區域，如屏蔽的小波壓縮架構。如前所述，前景影像與背景影像具有空或不相關區域。這空區域可以許多方式來處理。一種方式是以資料來填滿 47 200306080 空區域，然後用一般壓縮的技術。一種填滿影像空區域之簡單方法是以該影像的平均圖素值，來填滿這些空區域。然而，此方法會在遮罩的邊緣上產生尖銳的不連續，對一所給予的峰值訊號至雜訊率（peak signal-to-noise ratio， PS NR )會增加須要的位元率，並在接近遮罩或空區域的邊緣上，產生顯著的振鈴雜訊（ringing)。另一種方法是以最接近非遮罩的圖素（或相關區域）的顏色來將每個圖素上色。標準的形態演算法（morphology algorithm)可容許對該遮罩下，對所有導向Voronoi填滿（Voronoi-filled ) 的空區域内的圖素，只以兩道程序來處理。然後，當前景或免景影像被重建時’重建的影像是低通率（low-passed) 的，且已知的圖素回復其正確值。如果低通濾波器將頻率切得太低’會產生尖銳的邊緣，而增加所須的位元率及在接近邊緣處發生顯著的振鈴雜訊（ringing)。另一種處理空£域的方法是在凸形組（convex sets) 上投影（projection)。例如，有兩個凸形組：符合在這些可見圖素上之輸入的影像組，以及具有設為零的某些小波係數（wavelet coefficient )的影像組（例如，超過某些解析度的所有高頻係數）。藉由改變在這兩組上的投影，可以發現，與可見圖素相同的影像其壓縮較好，因為它們具有許多零的小波係數。然而另一種處理空區域的方法是，在特別為不規則之小格子所設計的小波轉換。這樣的小波解構 (decomposition )在電腦視覺及電腦圖學中的幾何資料 48 200306080 壓縮中是須要的 & 另—種、、廷樣的小波適用於遮罩的不規則圖案。万去是使用屏蔽的小波壓飨加前景影像壓縮妊工、、木構來編碼，以將滿。屏蔽的、』不必以不相關圖素來將不相關區域填屏敝的小波壓縮架構，如縮架構。依攄士政圖所描述者，為可用的壓方法也可使用。，、匕處理不相關區域的可行 ί or 則广減組件724從前景圖素過滤器M2接收前景影 ^並將該前景影像縮小。前景縮減組件724將前景影縮J以增加則景影像與文件影像的壓縮。例如，x48〇的圖素的則景影像可被縮小為320x240。有許多方法可用來縮小前景影|。例如，前景影像可用放棄每兩個圖素的方法，使影像由640x480降到32〇x24()圖素。另一種方法是依據前景影像相對應的圖素之平均值或中間值產生新圖素。例如’前景影像的新圖素可產生為八個相鄰圖素的平均而另一種方法是用方形補點（cubic interpolate 來縮小。依據本發明之精神仍有其它的方法可將影像小。如果前景與背景在編碼器中被縮小，則它們在用遮被組合以前，應該先在解碼器中被放大。前景編碼器726將前景影像編碼。前景編碼器726 前景影像中產生編碼位元流。該位元流可稱為前景位流。前景編碼器 726可利用許多個合適的壓縮架構將景影像編碼。有些壓縮架構的範例可利用，如，前進式小波編碼（progressive wavelet encoding)或前進式轉換編碼(progressive transform encoding) 〇 49 200306080 前景編碼器 726也可包括定色相連組件分析器於圖），以將前景影像的壓縮進一步改善。定色相可使用與叢集化組件 7 1 2所描述之相類似的方法法。定色相連組件分析器掃描前景影像，以將定色圖素找出來。如果定色相連圖素的群組比門檻值大群組被視為一定色相連的組件或定色遮罩。”定色” 色彩中的一些變化。定色相連組件分析器可將類似相連組件更進一步地組合為定色叢集。相關的訊息色叢集的位置訊息，位元映射，形狀，定色相連組置訊息等等，可被包含在前景位元流中。透過用來個區域是由文字所構成的佈局分析器，定色也可只文字上。背景圖素過濾器730從前景背景分割器 719接影像。背景圖素過濾器 730在背景影像中找出不域並以不相關圖素將這些區域填滿。這些區域是由像的圖素所形成，分配在前景影像而將空的或不相留在背景影像中。不相關圖素一般不出現在重新組件影像中，所以背景圖素過濾器 730不考慮不相之可察覺的外觀。本發明之其它實施例可用壓縮架免填滿不相關區域，這壓縮架構可適當處理不相關如屏蔽的小波壓縮架構。背景圖素過濾器 730與素過濾器 722在操作上實質相同。如前所述，前景影像與背景影像有空的或不相關空區域有許多處理方式。一種方法是以資料填滿空 (未示連組件與演算相連的時，該可包含的定色，如定件的位偵測哪限制在收前景相關區文件影關區域合的文關圖素構來避區域，前景圖區域。區域， 50 200306080 然後是，法會值訊增加生顯罩的的形下，内的像被其正邊緣的振 I 上投可見係數解析可以具有 fi 格子在電用〜般的壓縮技術。填滿影像中之空區域的簡單方法以謗影像的圖素平均值填滿這些空區域。然而，這方在遮罩的邊緣上產生尖銳的不連續，對一所給予的學就至雜訊率（peak signal-to-noise ratio，PSNR)會所須的位元率，並在接近遮罩或空區域的邊緣上，產著的振铃雜訊（ringing)。另一種方法是以最接近非遮圖素（或相關區域）的顏色來將每個圖素著色。標準態演算法（morphology algorithm)可容許對該遮罩對所有導向Voronoi填滿（Voronoi-filled)的空區域圖素，只以兩道程序來處理。然後，當前景或背景影重建時，重建的影像為低通濾的，且已知的圖素回復確值。如果低通濾器將頻率切得太低，會產生尖銳的 ’而使所須的位元率增加，並在接近邊緣處發生顯著鋒雜訊（ringing)。 * 7 種處理空區域的方法是在凸形組（convex sets) 影（projection)。例如，有兩個凸形組：符合在這些圖素上之輸入的影像組，以及具有設為零的某些小波 (wavelet coefficient )的影像組（例如，超過某些度的所有高頻係數）。藉由改變在這兩組上的投影，發現，與可見圖素相同的影像其壓縮較好，因為它們許多零的小波係數。 6另一種處理空區域的方法是，在特別為不規則之小上’使用小波轉換。這樣的小波解構（d e c 〇 m ρ 〇 s i t i ο η ) 腦視覺，及電腦圖學中的幾何資料壓縮中，是須要的。 51 200306080 这樣的小波適用於遮罩的不規則圖案。 >另「種万法是使用屏蔽的小波壓縮架構來編碼，以將如景影像壓縮好，而不必以 ^ 相關圖素來將不相關區域填滿。屏蔽的小波壓縮架構，#圖”斤描述者，為適用的壓縮架構。依據本發明之精神，其它處理不相關區域的可行方法也可使用。

背景縮減組件732從背景圖素過滤器730接收背景影像，、並將該背景影像縮小。背景縮減組件將背景影像，宿】以增加背景影像與文件影像的壓縮。例如，以⑼ 的圖素的背景影像可被縮小為320x240。有許多方法可用來縮】、U ,像。一種是用放棄圖素的方法來將背景影像縮小。例如，背景影像可用放棄每兩個圖素的方法，使影像由64〇x48〇降到32〇x24〇圖素。另一種方法是依據背景影像相對應的圖素之平均值或中間值產生新圖素。例如，月景影像的新圖素可分別產生為八個相鄰圖素的平均。依據本發明之精神仍有其它的方法可將影像縮小。一般而言’在分別以前景縮減組件724與背景縮減組件732 縮小後’前景影像與背景影像的大小實質上相同。皆景編碼器734將背景影像編碼。背景編碼器734從背景影像中產生編碼位元流。該位元流可稱為背景位元流。背景編碼器7 3 4可利用許多個合適的壓縮架構將背景影像編碼。有些壓縮架構的範例可利用，如，前進式小波編碼（Progressive wavelet encoding)或前進式轉換編碼（progressive transform encoding)。 52 200306080 組件分析善。定色的方法與將定色相檻值大時 ”定色"可將類似的的訊息，相連組件過用來偵也可只限器（未示相連組件演算法。連的圖素，該群組包含色彩定色相連如定色叢的位置訊測哪個區制在文字

於圖），以將背景影像的壓縮進一步改可使用與叢集化組“2所描述類似定色相連組件分析器掃描背景影像，以找出來。如果定色相連圖素的群組比門被視為一定色相連的組件或定色遮罩。中的-些變化。定色相連組件分析器可組件更進-步地組合為定色叢集。相關集的位置訊息，位元映射，形狀，定色息等等，可被包含在背景位元流中。透域疋由文字所構成的佈局分析器，定色任何適當數目的壓縮架構可以應用在遮罩編碼器 7 1 8、前景編碼器7 2 6、及背景編碼器734上。有些架構已描述如上。其它可用遮罩編碼器71 8，前景編碼器72 6，背景編碼器7 3 4的壓縮架構則在此加以描述。

可用在本發明之習知的壓縮架構為JPEG ( Joint Photographic Experts Group，PWT ( Progressive Wavelet Transform )，JPEG 2000，PTC ( progressive transform codec)，GIF ( graphic interchange format)，PNG ( portable network graphics))。JPEG 依據離散餘弦轉換（Discrete Cosine Transformation，DCT)，一般是指會漏失的壓縮，達到2 ·· 1的壓縮比。此壓縮技術一般用來作攝影的影像β JPEG可儲存每個圖素24-位元的顏色，以20 : 1的平均 53 200306080 壓縮率為全彩壓縮。一般而言，平均的壓縮比到20 : 1為察覺不到的漏失，60 ·· 1-100:1是而60 : 1至100 : 1為不好的品質。此技術的法處理尖銳的邊緣，而且缺少對透明度的支援比GIF還須要更長的時間，但在掃描全彩或影像上，則比giF優良。 pwt為無漏失技術的〜部份，而且為許多術的基礎。PWT的基本觀念是，最好先看到然後隨著時間逐步增加解柝度。這可有效傳輸影像。特別是，藉由先傳送低頻的組件，低解個影像可先傳送出去。然後，其解析度會隨著的到來而增加。 JPEG 2 0 00是設計要來取代jPEG標準的，以小波為基礎的壓縮技術。jpEG 2000消除出的人工化效果，而維持2 4位元的色彩。另外，漏失與無漏失壓縮，以2 〇 1 : 1的漏失與2 : 1 PTC 是由組合 JPEG，GIF，PNG，M-JPEG，及其它等格式之某些特性而成的壓縮架構，但壓縮效能，且在許多案例中的編碼及解碼更 JPEG，PCT可提供較低的人工化效果。 P T C也加入新的特性。一種新加的重要特性（或逐漸彩現）。從原始的PTC檔案，低解靠度的圖片，可從檔案中的一部份，以分析及解 PTC也支援多達16位元的顏色，四個顏色的率從1 〇 : 1 普通品質，缺點為，無。另外，它灰階的照片其它壓縮技整個影像，高可靠度的析度版的整更高頻組件為依據DCT 現在 JPEG • JPEG支援的無漏失。 JPEG-LS，具有較好的快。相較於性是可擴充析度或低可碼來取得。頻道或組件 54 200306080 (R，G，B及alpha)，其中aipha為透明的組件。在單一的編碼解碼器（codec)中，PTC也整合無漏失與漏失的編碼。另外’ PTC也有足夠的參考碼。這個碼具有低記憶足跡（low memory footprint )且只用整數的算數（沒有浮點數），作為完全的複製。為實現ptc ’可用多解析度轉換（multi-resolution) 來達成逐漸的彩現。一種方法是用小波，但更有效的是，以較低的運算成本而言，是用階層式重疊雙正交轉換 (hierarchical lapped biorthonognal transform, LBT)。在 PTC中新的階層式重疊雙正交轉換，利用比較小的4x4 區塊大小改善先前的PTC建構，以及整數係數—可使其運算不須太多的乘法計算（在前p T C的架構中仍使用浮點算數）。重暨的轉換比離散餘弦轉換（Dct，用在jpeg 與MPEG )好是因為，重疊的轉換沒有dcτ的，，塊狀人工化效果’（blocking artifacts)。而且，由於用在PTC的LBT 為多解析度（階層的）形式，因此振铃雜訊（ringing)的人工化效果比在DCT為主的編碼解碼器（c〇dec)較不顯著。 GIF是無漏失8位元圖素色彩（256色）的壓縮格式，平均壓縮比為3 ·_ 1。GIF有内建的Lempel-Ziv_Welch (LZW )編碼，這便是為何它無法對照片提供高壓縮，但可對簡單的線條繪圖提供高壓縮的原因。GIF壓縮可用在所有種類的影像，但對只具有少許色彩的電腦圖形其效果最好，這使它廣為應用在以網路為主的圖形上。而且，gIF 對具有尖銳邊緣之圖形影像，比jPEG的壓縮更好。 55 200306080 PNG為無漏失的格式’提供比GIF平均小10-30%的壓縮。它在全真彩色影像上的壓縮也比JPEG好’因為它有 48位元的色彩’比JPEG的24位元色彩更妤。另外，PNG 有透明色’其壓縮為不對稱的’也就是說，其解壓縮很快而壓縮的時間卻較長。PNG是為網際網路上的使用而設計，所以其快速的解壓縮能力是個優點。另外，PNG是設計要取代GIF格式的，它使用LZW碼。PNG使用免費的Gzip壓縮架構，而非LZW碼。

圖8為依據本發明之一實施例的分割層次影像解碼系，统的方換闻 & °本系統接收壓縮位元，位元流或檔案，並產 ^ f新纟且合的影像。本系統包含分離器組件802，前景解·碼器 R Λ U4，背景解碼器 806，遮罩解碼器 808，回流組件 810 ， w Ώ 以及組合器 8 1 2。 a _器組件802接收壓縮的位元，並將該位元分離以

形成則景位元流，背景位元流及遮罩位元流。分離器組件 802可利用檔頭訊息以分離位元流。前景解碼器804將前景位70流解壓縮以產生前景影像。背景解碼器806將背景位兀流解壓縮以產生背景影像。遮罩解碼器808將遮罩位元流解壓縮，以產生遮罩或遮罩影像。遮罩解碼器808可能存取佈局及/或回流（reflow )的訊息。另外，遮罩解碼器8〇8可取得重建紋理訊息的索？丨表。就某些壓縮的架構而言（如屏蔽的小波），前景解螞器804及背景解碼器806可從遮罩解碼器808 要·欠解壓输的遮罩，以取得前景影像與背景影像。 56 200306080

回流組件8 1 0依據所要的顯示特性操作前景影像，背景影像與遮罩。所要的顯示特性可包括顯示頁的大小，欄位數’ 4·體大小等等。所要的顯示特性可能與原稿的文件影像有很大的差異。例如，文件影像可有信件大小及1 0 點的文字大小。這些文件影像的特性在顯示於標準的信件紙上時沒有問題。然而，這些特性將難以顯示於可攜式裝置上觀看，如個人數位助理（PDA )。PDA通常是小螢幕且低解析度。若不用回流，PDA的使用者將得上下左右移動才能讀取每行的文字。因此，就PDA而言，所須的特性將為2 0欄’ 14點的文字大小等。回流組件$ 1 〇可依據所須的特性，將文字包裹起來，重新排列段落，句子，影像，調整影像大小，及/或執行任何其它合適的修改。回流組件8 10利用佈局訊息，其係利用前景影像，背景影像及/或遮罩所編碼的。

組合器8 1 2組合前景影像，背景影像及遮罩為一重新組合的文件影像。该重新組合的文件影像與原始的文件影像相同或逼近。另外，重新組合的文件影像可依據所須的顯示特性而有不同的形狀及/或大小。組合器8 1 2依據遮罩，從前景與背景影像產生用以重新組合文件影像的圖素。該重新組合的文件影像的每個圖素，是由參考該遮罩的相對應圖素而決定的，藉以判定該重新組合的文件影像之圖素是否應來自前景影像或背景影像。例如，遮罩圖素值為1者，可指示該重新組合的文件的圖素是否應來自前景影像之相對應的圖素。另外，組合器8 1 2執行任何須 57 200306080 要的合適的色彩空間轉換。例如，重新組合 YCoCg❸色彩空間。因Λ，繼續以此例說明，組人时可用將從YCoCg色彩空間轉換到RGB色彩空間七 812 示在螢幕上）。 σ’為了顯編碼方法的 —位元映射該文件影像如YUV或圖9為依據本發明之一實施例的文件影像流程圖。文件影像由9〇2提供。該文件影像為的影像並有一色彩空間代表，一般為RGB。可從其色彩空間轉換為另一種色彩空間， YCoCg，以增加壓縮。在904，為文件影像而產生一遮罩。該遮罩為依據文件影像的二位元影像。該遮罩的產生以致於該文件影像可被分割或分離成前景影像與背景影像，而使該前景影像與背景影像的壓縮率提高。該遮罩的每個圖素用來判斷，該文件影像相對應的圖素是否放在前景影像或背景影像。該遮罩可以任何適合的方式產生，而使遮罩，前景影像與背景影像的組合大小在壓縮後縮小。該遮罩的另外處理，包含但不限於雜訊偵測，雜訊矯正，混色偵測，及處理類似的事物，可在遮罩上執行《例如，雜訊通常在數位化的過程中導入於文件影像中。例如，指印及或髒東西可能無意地被含在文件影像中。雜訊可從遮罩中找出並移除。混色為用來產生灰色或彩色的各種陰影的影像技巧。混色改變區域中的點的百分比或比例以模擬陰影。混色可使影像看起來的效果較好，但對數位文件卻可能會有問題。混色會對文字，手寫字等造成誤讀。在 58 200306080 遮罩中的混色可被找出來，並適當地處理。另外，遮罩中的叢集會被找出來。相連的中被定義。相連的組件為一或更多個相連的黑形成的群組，一般是黑點。類似之相連的組件集。每個叢集在遮罩中的位置，可用位元 (Pointer )作代表。叢集的使用可減少大量集可代表文字，手寫字等。而且，光學文字辨識可在遮罩上實現。叢以找出文字或字體，無論代表的是手寫字或文識出來之後，字體可儲存為如，AScn碼，而二間。而且，當文件影像最後被重新組合時，識將增強回流，而使文件影像容易編輯。遮罩也可被分析，以找出文件影像的佈局制叢集及影像位置可被分析，以找出佈局的特性性包含但不限於，可被定義的句子，段落，格置，編頁碼等。佈局特性可以被附上或以遮罩曰後使用。在906,依據遮罩，文件影像被分割為前景影像。例如，所有在遮罩中以、為代表的所到前景影像，而所有以〇為代表的圖素，可到本發明之其它實施例也可將文件影像分割成另的層二’本發明並不限於圖9中所描述的兩層 &刖⑦於像與背景影像與該文件影像的大小才丨 ]斤、以像與月景影像具有某些尚未附予值的圖組件在遮罩 b (dots)所被群聚成叢映射及指標的空間。叢集可被分析字。一旦辨省下更多的光學文字辨 ^性。字體，。佈局的特式，影像位編碼，以便景影像與背有圖素，可背景影像。外適合數目次。同。然而，素。這些圖 59 200306080 素稱為孔洞，空洞及/或空區域。此孔洞的發生是因為，與這些圖素相符合的值被設定給另一個影像。修整 (retouching)可在背景影像與前景影像上執行，以降低在最後重新組合之影像上所產生的硬邊緣（hard edges)。修整包含，以一些圖素擴展該前景影像與背景影像，而避免尖銳的邊緣及/或轉接區。一般而言，修整的產生是以遮罩來產生前景遮罩及背景遮罩，並以前景遮罩從文件影像分割前景影像’及以背景遮罩從文件影像分割背景影像。則景遮罩可使前景影像擴延，而背景遮罩可使背景影像擴延。在9 0 8，則景影像中的孔洞或空洞以不相關圖素填滿。不相關圖素被挑選，以增加前景影像的壓縮，並在壓縮後縮減前景影像的大小。不相關圖素可用一些合適的方法來決定。一種方法是以文件影像的平均圖素值來填滿不相關區域。然而’此方法可在遮罩邊緣產生鮮明的不連續性，可能就一所給的峰值訊號至雜訊率（peak signal -to-noise ratio， PSNR)增加一所須的位元率.，並在接近遮罩的地方產生顯著的振铃雜訊（ringing)或空區域的邊線。另一種方式是用最接近非遮罩圖素（或相關區域）的顏色將每個圖素著色。標準的形態演算法（m〇rph〇l〇gy alg〇rithm) 可容許對該遮罩下，對所有導向V〇ron〇i填滿（Vor〇n〇i_ filled )的空區域内的圖素，只以兩道程序來處理。然後，當前景或背景影像被重建時，被重建的影像為低通濾，然後已知的圖素被重建為其正確值。如果低通濾器將頻率切 60 200306080 得太低，會產生尖銳的邊緣，使得所須的位元率及接近邊緣顯著的振鈴雜訊（RINGING)增加。另一種處理空區域的方法是要在凸形組上投影（projection)。例如，有兩個凸形組··符合在這些可見圖素上的輸入之影像組，以及具有設為零的某些小波係數（wavelet coefficient )的影像組 (例如，超過某些解析度的所有高頻係數）^藉由改變在這兩組上的投影，可以發現，與可見圖素相同的影像其壓縮較好’因為它們具有許多零的小波係數。依據本發明之精神其它適合的方法，也可用來填滿不相關區域。在9 1 0，背景影像的孔洞或空洞被填不相關圖素填滿。不相關圖素被挑選，以增加背景影像的壓縮，並在壓縮後縮減背景影像的大小。不相關圖素可用一些合適的方法來決定’如先前有關前景影像的描述。 ^ 个丹雨的空區域。因此壓縮的架構，如屏蔽的小波壓縮，可用术將前景影像及景影像編碼而不必填滿空或不相關區域。在9 1 2，遮罩被編碼以產生遮罩户一、之罩位疋流。遮罩用合的壓縮架構被編碼。壓縮架構可利用、、里訊息及垆輩的位元代表以改善遮罩的壓縮。另外，素卷返半最'集，你片、自暮可用來將遮罩壓縮得更好。々訊心Τ 在背景影像與前景影像上可執行额外白勺雜訊移除及取樣縮減可在背景影像訊移除移除或處理出現在前景影像一般而言，雜訊是在掃描或轉換處與前景影與背景影理中產生處理。例如’ 像上執行。雜像中的雜訊。的。取樣縮減 61 200306080 將前景影像與背景影像的大小縮小。例如，640x480的圖素的前景影像及背景影像可被縮小為320x240的影像。在 914，前景影像被編碼，以產生前景位元流。前景影像可利用許多個合適的壓縮架構來編碼。有些示範的壓縮架構可利用在前景影像的編碼，如，PWC，PTC，JPEC， JPEG2000，PNG ’及GIF。其它的壓縮架構也可利用，仍然符合本發明之精神。背景影像與前景影像也可被分析，以定義定色相連的組件，並更進一步改善前景影像與背景影像的壓縮。定色相連組件包含複數個具有實質上相同色值（color value) 的相連圖素。定色相連組件可利用某個顏色的種子圖素來定義，並利用演繹法以找出所有，或實質上所有的，具有相同色彩或實質上相同色彩的相連圖素。遮罩位元流’則景位元流及背景位元流在步驟 9 1 8被組合，以形成一組合位元流。組合位元流也可為一個構案。檔頭資訊可被加到組合位元流中，以包含如所使用的編碼，索引表’符號’函式庫等等的訊息。圖1 〇為依據本發明之一實施例的文件影像解碼的方法流程圖。在1 〇〇 2 ’收到位元流。該位元流為一組合位元流，包含遮罩位元流’前景位元流’背景位元流及構頭位元流。在讀位元流分離成遮罩位元流’前景位元流，及背景位元流。另外’構頭訊息可被抽離出來。在1 〇 0 6，遮罩，前景影像及背景影像分別從遮罩位元流，前景位元流’及背景位元流中被解碼。遮罩，前景影 62 200306080 像及背景影像統稱為影像組件。遮罩，前景影像及背景影像的解碼，是使用與其編碼壓縮架構相容的解壓縮架構。檔頭訊息可包含此壓縮/解壓縮訊息。遮罩及/或檔頭訊息可包含佈局訊息或怖局特性。另外，索引表，符號，及其它的訊息可從遮罩被解碼或從檔頭訊息取得。在1 008，提供顯示的特性。該顯示特性可被預先設定，由使用者輸入及/或動態地決定。顯示特性包含如顯示大小，字體大小，欄位等等的訊息。在 1010，遮罩，前景影像與背景影像依據顯示特性被修改。影像組件被修改，以致於當重新組合時，可與顯示特性相符合。例如，文字在遮罩中可回流，以在窄螢幕上正確顯示，而不必上下左右移動。在 1 0 1 2，遮罩，前景影像與背景影像被組合以形成組合文件影像。前景影像與背景影像依據遮罩而被組合以形成重新組合的文件影像。該遮罩為二位元的，因此該重新組合的文件影像的每個圖素，視該遮罩的相對應圖素而定，從前景影像或背景影像的相對應圖素，被附予一個值。該重新組合的文件影像與原始的文件影像相同或逼近。該原始的文件影像為最初編碼為所收到之位元流的文件影像。本發明之系統或方法可利用在整個系統，以便於文字，手寫字，圖式等的辨識及/或壓縮。而且，熟知該項技術者將會明暸，本發明之系統及/或方法可用在許多文件影像的應用，包含但不限於，影印，文件掃描器，光學文字 63 200306080 辨識系广’ i>da，傳真機，數位像機及/或數位攝影機。為幸疋供本發明之其它實施例，目i玉及以下的討論將對種可此的，合適的運算環境丨丨〗〇，提供一個簡要且概要的描述，本發明的各種實施例可實現於其中。運算環境 1Π0/是一種可能的運算環境，不是要用來限制本發明之運算環境。雖然本發明以上的描述是以電腦可執行的指 v來說明’可在一台或以上的電腦上執行，但本發明也可以f他的程式模組及/或硬體及軟體的組合來實現。一般而言，程式模組包含程序（routine)，程式（pr〇grams)，組件：資料結構等，這些執行特別的工作或實現特別的抽象資料型態。甚且，本發明 <万法可用其他的電腦系統設定來實現，包含單一的處理器及多處理咨電腦系統，微電腦，大型電腦及個人電腦，掌 .^ , 7ί 旱上1计算機，微處理器為主關裝置連在-起操作。切:所^種可用—或以上的相散式的電腦環境，其中^ $明的貫施例也可用在分 τ某個工作是漆遠端處理器來執行。在八％、、汛網路相連的 π政的運I Ρ 士於局部及遠端的記憶傲兄中’程式模組可位丨帘仔裝置中。圖11顯示-種可能的硬體“、統與方法。雖然所描述的0 a叹疋以支持在此所描述之系何合適的運其環境皆可運疋獨立的架構’依據本發明，任限於，獨立的，多處裡哭用。例如，運算架構包含，但不型主機，超級電腦，數位欢的，主從式，微電腦，大參照圖"，-示範的=比等皆符合本發明之精神。衣兄1110 〃實現本發明之各種 64 200306080 實施例，包含電腦111 2，含有處理單元111 4，系統體1 1 1 6，系統匯流排 1 1 1 8，搞合各種系統組件，包統記憶體至處理單元1114。處理單元1114可為商可用的任何處理器。雙微處理器及其他多處理器的架也可用來作為處理單元1114。系統匯流排11 1 8可為任何匯流排架構，包含記匯流排或記憶體控制器，週邊匯流排及使用任何市售流排架構的區域匯流排。系統記憶體1 11 6包含唯讀體（ROM) 1120及隨機存取記憶體（RAM) 1122。一基入/輸出系統（BIΟ S )，包含可幫助在電腦j丨j 2中元間傳送’貝訊的基本程序，如在啟動時，儲存在R〇M 中。電腦1 1 1 2可更包含硬碟i丨2 4，軟碟機丨丨2 6，磁片1128讀取或寫至可移除式磁碟機1128，及光 83〇等，以讀取光碟片1132或從其它的光媒體讀取入。硬碟1124，軟碟機1126，光碟機113〇分別藉碟驅動介面1134，磁碟驅動介面1136，及光碟驅動 1138連接至系統匯流排1118。電腦ιιΐ2 一般包含某種型態的電腦可讀取媒體。電腦可讀取媒體可為任被電腦11 1 2存取的媒體。以下藉由例子說明，但表限制’電腦可讀取媒體可句各雪您迁…巴令屯細儲存媒體及通訊媒電腦儲存媒體包含揮發性及非捏菸 κ ^ u 坎丨王汉非輝赞性，可移除及非可媒體，以方法或資訊儲存技術所實現者，如電腦可讀令’資料結構’程式模組或其它的資料。電腦儲存記憶含系業上構，憶體的匯記憶本輸件之 1120 如從碟機或寫由硬介面至少何可示為體。移除取指體包 65 200306080 含，它的或任 1112 構，或其資料個訊訊息線媒聲音上的操作非中何市如滑圖）碟（裝置 1152 行璋型態但不限於，RAM，ROM, EEPR〇M，快閃記憶體或^ 5己憶體技術’CD-ROM，DVD或其它的電磁儲存裝置，何其它的媒體，可用來儲存所要的資訊且可被電腦存取。通訊媒體一般建有電腦可讀取指令，資料結 t式楔組，或在調變資料訊號中的其它資料，如載^ ;匕傳輪的機制’且包含任何傳送媒體的訊號。"調變訊號”（modulated data signal)這個詞的意思是指一號，有一或以上的特性被設定或改變’以在訊號中將編碼。以案㈣明’而非作為限制’通訊媒體包含有體，如有線網路或直接有線的連線，無線的媒體，如的，射頻的，紅外線的，及其它無線的媒體。任何以組合也應包含在電腦可讀取媒體中。 •多程式模組可儲存在驅動器及RAM 1122中，包含 ^先1 1 40，應用程式i丨42，程式模組丨i 44，程式斷：貝料11 46。操作系統i i 4〇在電腦j i j 2中可為任售的操作系統。者了將4曰令及訊息透過鍵盤1148及指示裝置，鼠1150加到電腦1112中。其它的輸入裝置（未示於可包含麥克風，紅外線搖控，搖桿，遊戲面版，衛星 satellite dish),掃描器，等等。這些及其它的輸入通常透過搞合至系統匯流排1118的序列埠介面連接到處理單元丨丨14，但可由其它介面連接，如平，遊戲埠，USB，紅外線介面等。螢幕1154或其它的顯不器也可透過介面連到系統匯流排丨丨丨8，如影 66 200306080 像配接器顯示卡 1 1 5 6。除了顯示器之外，電腦通常包含其它的週邊輸出裝置（未示於圖），如揚聲器，列表機等。電腦 1112可用邏輯的及/或實體上連接至一或以上的遠端電腦的網路環境操作，如遠端電腦 11 5 8。遠端電腦 115 8可為工作站，伺服電腦，路由器，個人電腦，微處理器為主的娛樂應用，同儕裝置或其它一般的網路節點，且一般包含許多或所有與電腦 1112相關的元件。雖然，為了簡要說明的目的，在圖中只顯示記憶儲存裝置11 60。所繪的邏輯連接包含區域網路11 62及廣域網路1 1 64。這樣的網路環境常見於辨公室中，企業電腦網路，内部網路及網際網路上。當在區域網路環境中使用時，電腦 111 2透過網路介面或網路卡 1 1 6 6連上區域網路 11 6 2。當在廣域網路的環境中使用時，電腦 1112 —般包含數據機 1168，或連上區域網路中的通訊伺服器，或用其它方法以在廣域網路 1164上建立通訊，如網際網路。數據機 1168，可為内建或外接，透過序列埠介面 1 1 5 2連到系統匯流排 11 1 8。在網路環境中，與電腦 111 2相關的程式模組，或其部份，可儲存在記憶儲存裝置11 60。所顯示的網路連線只是示意之用，也可使用電腦之間其它建立通訊連線的方法。圖12為一示範的運算環境1200之概要方塊圖，本發明可與之互動。運算環境 1200 包含一或以上的客戶端 1 2 1 0。客戶端 1 2 1 0可為硬體及/或軟體（如執行緒，處理，計算裝置）。運算環境 1200也包含一或以上的伺服 67 200306080

器1 2 3 0。伺服器 1 2 3 0也可為硬體及/或軟體（如執行緒，處理，計算裝置）。例如，伺服器 1 2 3 0可具備執行緒以利用本發明執行轉換。客戶端 1 2 1 0與伺服器 1 2 3 0之間一種可能的通訊為，在兩個或更多個電腦處理之間傳送資料封包。運算環境 1200包含通訊架構 1250，可用在客戶端 1210與伺服器 1230之間的通訊。客戶端 1210可連到一或更多個客戶資料儲存1260，其可用來儲存對客戶端 1 2 1 0局部的訊息。同樣地，伺服器 1 2 3 0連接一或以上的伺服器資料儲存 1240，以儲存對伺服器 1 230局部的訊息。

以上所述包含本發明之實施例。為描述本發明，當然無法描述每個可能的組件之組合或方法’但熟知該項技術者可暸解本發明有許多進一步的組合與排列。依此，本發明希望涵蓋所有在本發明之申請範圍内及依據本發明之精神所作的改變，修改，及變化。甚且，在此所用的”包含”，無論是詳細說明中的或在申請專利範圍中所使用的，這個詞的用法是如同’’至少包含’’的含意，如在申請專利範圍中的用法一樣。【圖式簡單說明】圖1為一方塊圖，顯示本發明之實施例之一的被分割的影像層編碼系統。圖2為一圖形，顯示小波運算的一示範步驟。圖3為一圖形，顯示當有些圖素不見時，小波運算的一示 68 200306080 範步驟。圖4為一圖形，顯示一屏蔽的小波運算的一示範步騾。圖5為一方塊圖，顯示本發明之實施例之一的被分割的影像層解碼系統。圖6顯示本發明之實施例之一的文件影像案例。圖7為一方塊圖，顯示本發明之實施例之一的被分割的影像層編碼系統。

圖8為一方塊圖，顯示本發明之實施例之一的被分割的影像層解碼系統。圖9為一流程圖，顯示本發明之實施例之一的文件編碼方法。圖10為一流程圖，顯示本發明之實施例之一的文件編碼方法。圖11為一架構方塊圖，顯示一示範操作環境依據本發明設定的系統。圖12為本發明之示範通訊環境的架構方塊圖。【組件代表符號簡單說明】 ® 102: 遮罩分離器 104: 前景背景分割器 106: 遮罩編碼器 108: 前景編碼器 110: 前景編碼器 112: 組合位元 502: 分離組件 504: 前景解碼器 506: 背景解碼器 510: 組合器 508: 遮罩解碼器 601: 文件影像 610: 遮罩 611: 前景影像 69 200306080 612: 背景影像 702: 色彩空間轉換器 704: 遮罩分離器 706: 遮罩處理器組件 708: 雜訊移除 710: 混色偵測器 712: 叢集化組件 714: 光學文字辨識器 716: 佈局分析器 718: 遮罩編碼器 719: 前景背景分割器 720: 擴充組件 721: 修整組件 722: 前景圖素過遽器 724: 前景縮減組件 726: 前景編碼器 730: 背景圖素過濾器 732: 背景縮減組件 734: 背景編碼器 802: 分離器組件 804: 前景解碼器 806: 背景解碼器 808: 遮罩解碼器 810: 回流組件 812: 組合器 1110: 運算環境 1112: 電腦 1114: 處理單元 1116: 系統記憶體 1122: RAM 1120: ROM 1134: 介面 1136: 介面 1138: 介面 1156: 顯示卡 1152: 序列埠介面 1168: 數據機 1166: 網路卡 1124: 硬碟機 1126: 磁碟機 1128: 磁碟片 1130: 光碟機 1132: 光碟片 1118: 系統匯流排 1140: 操作系統 1142: 應用程式 1144: 模組 1146: 資料 1154: 螢幕 1148: 鍵盤 1150: 滑鼠 1158: 遠端電腦 200306080 1160: 記憶儲存 1210: 客戶端 1260: 客戶資料儲存 1250: 通訊架構 1230: 伺服器 1240: 伺服器資料儲存

71

Claims

200306080 拾、申請專利範圍 1 · 一種文件編碼系統，至少包含：一遮罩分離器，用以接收一文件影像，並自該文件影像產生一遮罩，該遮罩係至少一部份藉由合併區域的方式以文件影像的組對而產生，該文件影像的組對至少一部份是以圖素能量的減少為依據；一影像分割器，用以將該文件影像依據該遮罩切割成複數個層次，該複數個層次以非二位元的格式表示。 2. 如申請專利範圍第1項所述之文件編碼系統，上述之複數個層次至少包含一第一影像層，及一第二影像層，與以二位元格式表示的遮罩。 3. 如申請專利範圍第2項所述之文件編碼系統，上述之第一影像層係為一前景影像，及上述之第二影像層係為一背景影像。 4. 如申請專利範圍第3項所述之文件編碼系統，更包含一遮罩編碼器，以將上述之遮罩編碼為一遮罩位元流。 5. 如申請專利範圍第4項所述之文件編碼系統，上述之遮罩編碼器利用一以傳真為基礎的壓縮架構。 72 200306080 6.如申請專利範圍第4項所述之文件編碼系統，上述之遮罩編碼器利用一二階的壓縮架構。 7 ·如申請專利範圍第4項所述之文件編碼系統，更包含：一前景編碼器，用以將上述之前景影像從上述之影像分割益編碼為一前景位元流；及一务景編碼器，用以將上述之背景影像從上述之影像分割器編碼為一背景位元流。 8 ·如申請專利範圍第7項所述之文件編碼系統，上述之前景編碼器及背景編碼器，利用一前進式小波轉換壓縮架構（progressive wavelet transform compression scheme) 〇 9 ·如申請專利範圍第7項所述之文件編碼系統，上述之前景編碼器及背景編碼器，利用一前進式轉換塵縮架構(progressive transform compression scheme ) 〇 10.如申請專利範圍第7項所述之文件編碼系統，上述之前景編碼器及背景編碼器，利用一屏蔽的小波塵縮架構（masked wavelet compression scheme ) 〇 73 200306080 11.如申請專利範圍第7項所述之文件編碼系統，更包含一組合組件，用以組合上述之遮罩位元流，上述之前景位元流及背景位元流，為一組合的位元流0 1 2. —種文件編碼系統包含：一遮罩分離器，用以接收一文件影像，並自該文件影像產生一遮罩；一修飾組件，用以定義擬似邊緣，及/或以該遮罩擴展其前景及/或背景影像；及一影像分割器，用以將該文件影像依據該遮罩切割成複數個層次，該複數個層次以非二位元的格式表示。 1 3 ·如申請專利範圍第1 2項所述之文件編碼系統，上述之修飾組件係可依據上述之定義的擬似邊緣操作，以產生一前景遮罩及一背景遮罩，且上述之影像分割器利用上述之前景遮罩以取得一前景影像，並以上述之背景遮罩取得一背景影像。 14.如申請專利範圍第12項所述之文件編碼系統，更包含：一遮罩編碼器，用以將上述之遮罩編碼為一遮罩 74 200306080 位元流；一前景編碼器，用以將上述之前景影像從上述之影像分割器編碼為一前景位元流；及一背景編碼器，用以將上述之背景影像從上述之影像分割器編碼為一背景位元流。 1 5 . —種文件編碼系統包含：一遮罩分離器，用以接收一文件影像，並自該文件影像產生遮罩，該遮罩係以二位元的格式表示，並至少一部份藉由合併區域的方式以文件影像的組對而產生，該文件影像的組對至少一部份是以圖素能量的減少為依據；以及一前景背景分割器，用以依據該遮罩，將該文件影像切割成一前景影像及一背景影像，該前景影像及該背景影像係以非二位元的方式表示。 1 6.如申請專利範圍第1 5項所述之文件編碼系統，上述之遮罩的產生係用以縮小上述之遮罩，前景影像及背景影像所組合的大小。 17.如申請專利範圍第15項所述之文件編碼系統，上述之遮罩的產生係用以降低上述之前景影像及背景影像之預估壓縮，該預估壓縮包含一能量變化計算(energy variance computation) ° 75 200306080 1 8 ·如申請專利範圍第1 5項所述之文件編碼系統，上述之前景影像包含複數個顏色，及上述之背景影像包含複數個顏色。 1 9.如申請專利範圍第1 5項所述之文件編碼系統，上述之文件影像包含紋理資訊。 20.如申請專利範圍第1 5項所述之文件編碼系統，上述之文件影像包含一單頁。 2 1 ·如申請專利範圍第1 5項所述之文件編碼系統，上述之文件影像包含手寫字。 22. —種影印機，其係應用申請範圍第15項之系統。 23. —種文件掃描器，其係應用申請範圍第1 5項之系統。 24. —種光學文字辨識系統，其係應用申請範圍第 1 5項之系統。 25. —種個人數位助理，其係應用申請範圍第1 5項 76 200306080 之系統。 26. —種傳真機，其係應用申請範圍第15項之系統0 27· —種數位照像機，其係應用申請範圍第1 5項之系統。 2 8. —種數位攝影機，其係應用申請範圍第15項之系統。 29. —種分割的層次影像系統，其係應用申請範圍第1 5項之系統。 3 0. —種電視遊戲機，其係應用申請範圍第15項之系統。 3 1. —種文件編碼系統包含：一色彩空間轉換器，用以將具有第一色彩空間的文件影像轉換為具有第二色彩空間的文件影像；一遮罩分離器，用以自該轉換的文件影像產生一遮罩，該遮罩以二位元的格式表示，該遮罩係至少一部份藉由合併區域的方式以文件影像的組對而產生，該文件影像的組對至少一部份是以圖素能量的 77 200306080 減少為依據；及一前景背景影像分割器，用以將該轉換的文件影像依據該遮罩，切割成一前景影像及一背景影像，該前景影像及該背景影像係以非二位元的格式表示0 3 2.如申請專利範圍第3 1項所述之文件編碼系統，上述之第一色彩空間為RGB及上述之第二色彩空間為YUV 〇 3 3 ·如申請專利範圍第3 1項所述之文件編碼系統，上述之第一色彩空間為RGB及上述之第二色彩空間為YCoCg 〇 3 4. —種文件編碼系統，至少包含：一分離組件，用以將一位元流分離成一前景位元流，一背景位元流及一遮罩位元流；一前景解碼器，用以將該前景位元流解碼為一前景影像；一背景解碼器，用以將該背景位元流解碼為一背景影像；一遮罩解碼器，用以將該遮罩位元流解碼為一遮罩；及一組合組件，用以依據該遮罩，將該前景影像及 78 200306080 該背景影像組合為一文件影像。 3 5.如申請專利範圍第34項所述之文件編碼系統，上述之文件影像具有複數個圖素，該複數個圖素中的每個圖素係來自包含上述之前景影像及背景影像的一個群組。 3 6.如申請專利範圍第34項所述之文件編碼系統，上述之文件影像係與一原始的文件影像相同。 3 7.如申請專利範圍第34項所述之文件編碼系統，上述之文件影像係實質上與一原始的文件影像類似0 3 8·如申請專利範圍第37項所述之文件編碼系統，更包含一分割層文件編碼系統，以產生上述之遮罩，前景影像及背景影像，以將該遮罩編碼為一遮罩位元流，將該前景影像編碼為前景位元流，將該背景影像編碼為背景位元流，以及組合該遮罩位元流，該前景位元流，及該背景位元流為該位元流。 39. —種文件系統包含：一色彩空間轉換器，用以轉換一文件的影像的色彩空間； 79 200306080 、一遮罩分離器，用以自該色彩空間轉換器接收該文件的影像，並自該文件影像產生遮罩，該遮罩係至少一部份藉由合併區域的方式以文件影像的組對而產生，該文件影像的組對至少一部份是以圖素能量的減少為依據； ' 遮罩處理器組件，用以自該遮罩分離器接收該遮罩並處理該遮罩；以及分割器’用以依據該遮罩將該文件影像分割成一前景影像及一背景影像。 40·如申請專利範圍第39項所述之系統，上述之遮罩處理器組件包含一混色（dither )偵測組件，以界定並自該遮罩移除混色。 4 1 ·如申請專利範圍第39項所述之系統，上述之遮罩處理器組件更包含一雜訊移除組件，用以界定並自該遮罩移除雜訊。 42·如申請專利範圍第39項所述之系統，更包含：、叢集組件，用以自該遮罩處理組件接收該遮罩，並判定該遮罩中連接的組件，並利用至少一種篩選特性，以將類似的連接組件集結為叢集。 43·如申請專利範圍第42項所述之系統，更包含： 80 200306080 、、佈局組件，用以從該叢集組件接收該遮罩，並從遠遮罩定義佈局（layout)資訊。 44_如申請專利範圍第43項所述之系統，更包含：一遮罩編碼器，用以從該佈局組件接收該遮罩，並將該遮罩編碼為一遮罩位元流。 45·如申請專利範圍第44項所述之系統，上述之分割器包含一修飾組件，用以分析該遮罩及該文件影像的擬似邊緣，並以複數個跨越該擬似邊緣的圖素擴展别景遮罩及一背景遮罩，該前景遮罩及該背景遮罩係依據該遮罩，該前景遮罩被該分割器用來取得該前景影像，而該背景遮罩被該分割器用來取得該背景影像。 46·如申請專利範圍第45項所述之系統，更包含：一色彩連接組件，用以界定上述之前景影像及背景影像中的色彩連接組件。 47·如申請專利範圍第45項所述之系統，更包含：一前景編碼器，用以接收該前景影像並將該前景影像編碼為一前景位元流； θ景編碼器，用以接收該背景影像並將該背景衫像編碼為一背景位元流；及 81 200306080 一組合組件，用以將該遮罩位元流，該前景位元流及該背景位元流組合成一組合位元流。 48. 如申請專利範圍第47項所述之系統，更包含一光學文字辨識組件，用以從該叢集組件接受該遮罩，並定義該遮罩中的字形。 49. 如申請專利範圍第48項所述之系統，更包含一前景圖素填滿器，及一背景圖素填滿器，該前景圖素填滿器係以不相關（don’t care)圖素將該前景影像的不相關（don’t care)區域填滿，及該背景圖素填滿器係以不相關（don’t care)圖素將該背景影像的不相關（don’t care)區域填滿。 50. —種文件編碼方法，包含：產生一文件影像的遮罩，該遮罩係至少一部份藉由合併區域的方式以文件影像的組對而產生，該文件影像的組對至少一部份是以圖素能量的減少為依據；以及分割該文件影像為一前景影像及一背景影像，該前景影像及該背景影像係為非二位元的格式。 5 1.如申請專利範圍第50項所述之方法，更包含：將該遮罩編碼以產生一遮罩位元流； 82 200306080 將該前景影像編碼以產生一前景影像位元流；將該背景影像編碼以產生一背景影像位元流；以及組合該遮罩位元流，該前景位元流及該背景位元流為一組合位元流。 5 2.如申請專利範圍第50項所述之方法，該遮罩的產生係使該前景影像，該背景影像及該遮罩的能量變化減少，該能量變化為壓縮的預估。 5 3.如申請專利範圍第50項所述之方法，更包含以不相關（don’t care)圖素填滿前景影像及背景影像的不相關（don’t care)區域。 54. 如申請專利範園第50項所述之方法，更包含從上述之遮罩定義佈局資訊。 55. 如申請專利範圍第50項所述之方法，更包含從上述之遮罩移除雜訊。 5 6.如申請專利範圍第50項所述之方法，該分割文件影像的步驟更包含將上述之前景影像及背景影像擴展複數個圖素。 83 200306080 5 7 · —種文件解碼的方法，至少包含：接收一位元流；將該位元流分成一遮罩位元流，一前景位元流及一背景位元流；將該前景位元流解碼為一前景影像；將該背景位元流解碼為一背景影像；將該遮罩位元流解碼為一遮罩；以及依據該遮罩，組合該前景影像及該背景影像為一重建的文件影像。 φ 5 8.如申請專利範圍第57項所述之方法，更包含提供顯示特性。 5 9.如申請專利範圍第57項所述之方法，該顯示特性係由使用者提供。 60. 如申請專利範圍第57項所述之方法，上述之顯示特性係可動態設定。 _ 61. 如申請專利範圍第57項所述之方法，上述之顯示特性係預先設定。 62. 如申請專利範圍第57項所述之方法，更包含：依據上述之顯示特性修改上述之前景影像，背景影 84 200306080 像及遮罩。 63.如申請專利範圍第57項所谈、、 Α ^ 万法，更句本轉換上述之重建的文件影像之色彩空間。口 64· —種可傳送於兩個或更多個啦的資料封包，該資料封包至少包：& 5里程序之間與：，罩，-背景影像，及景影像相關的資訊，孩3景影像及該前景影像依建的文件影像。 &據孩逦罩形成一重 65· —種電腦可讀取媒體碼系統的電腦可使用組件一色彩空間轉換器組件色彩空間；係具有可應用在文件編至少包含：用以轉換一文件影像的一遮罩分離器組件，用以自兮&〜、 _、疼色彩空間轉換器組件接收一文件影像，並產生該文杜人件影像的遮罩，該遮罩係至少一部份藉由合併區域的方式以文件影像的組對而產生’該文件影像的組對至少一部份是以圖素能量的減少為依據；以及一分割器組件，用以自該色彩空間轉換器組件接收該文件影像，並依據該遮罩將該文件影像分割成一前景影像及一背景影像。 85 200306080 66.如申請專利範圍第65項所述之電腦可讀取媒體，更包含·· 一遮罩處理器組件，用以自上述之遮罩分離器接收該遮罩並處理該遮罩；一叢集組件，用以自該遮罩處理組件接收該遮罩’並定義該遮罩中的叢集；以及一佈局組件，用以從該叢集組件接收上述之遮罩並從上述之遮罩定義佈局資訊。體專 · · 請含申包如更第圍媒取 ±1貝、言可腦電之述所項一遮罩編碼器組件，用以從上述之佈局組件接收上述之遮罩，並將上述之遮罩編碼為一遮罩位元流；一前景編碼器組件，用以將上述之前景影像編碼為一前景位元流；一背景編碼器組件，用以接收上述之背景影像並將上述之背景影像編碼為一背景位元流；及一組合組件，用以將該遮罩位元流，該前景位元流及該背景位元流組合成一組合位元流。 68· —種編碼系統，至少包含：遮罩產生裝置，用以產生_文件影像的遮罩，該遮罩係至少一部份藉由合併區域的方式以文件影 86 200306080 像的組對而產生，該文件影像的組對至少一部份是以圖素能量的減少為依據；一分割裝置，用以將該文件影像分割為一前景影像及一背景影像；一遮罩編碼裝置，用以將該遮罩編碼為一遮罩位元流；一前景影像編碼裝置，用以將該前景影像編碼為一前景影像位元流；一背景影像編碼裝置，用以將該背景影像編碼為一背景影像位元流；以及一組合裝置，用以將該遮罩位元流，該前景影像位元流，及該背景影像位元流組合為一組合位元流0 87