TW200306080A - Segmented layered image system - Google Patents

Segmented layered image system Download PDF

Info

Publication number
TW200306080A
TW200306080A TW092106232A TW92106232A TW200306080A TW 200306080 A TW200306080 A TW 200306080A TW 092106232 A TW092106232 A TW 092106232A TW 92106232 A TW92106232 A TW 92106232A TW 200306080 A TW200306080 A TW 200306080A
Authority
TW
Taiwan
Prior art keywords
mask
image
foreground
background
bit stream
Prior art date
Application number
TW092106232A
Other languages
English (en)
Other versions
TWI230516B (en
Inventor
Patrice Y Simard
Erin L Renshaw
James Russell Rinker
Henrique S Malvar
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/133,842 external-priority patent/US7263227B2/en
Priority claimed from US10/133,939 external-priority patent/US7392472B2/en
Priority claimed from US10/133,558 external-priority patent/US7164797B2/en
Priority claimed from US10/180,771 external-priority patent/US7110596B2/en
Priority claimed from US10/180,169 external-priority patent/US7120297B2/en
Priority claimed from US10/180,649 external-priority patent/US7024039B2/en
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of TW200306080A publication Critical patent/TW200306080A/zh
Application granted granted Critical
Publication of TWI230516B publication Critical patent/TWI230516B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Description

200306080 玖、發明說明 【發明所屬之技術領域】 本發明係有關於文件影像之處理,且特別有 及壓縮文件影像的系統與方法。 【先前技術】 電腦網路,網際網路,及數位儲存裝置的廣 衍,使得透過電腦可用的資訊量急劇地增加。如 加的資訊量,使得資訊傳送的速度及儲存的效率 迫切。資料壓縮為一種可促使資訊有效傳送及 術。 資料的壓縮降低了表達資訊的資料空間,並 多種資訊型態。對於數位資訊壓縮的須求更為增 含影像,文字,聲音以及動畫。一般而言,資料 標準的電腦系統;然而,其它技術則利用資料壓街 但不限於數位及衛星電視,以及蜂槽式/數位電索 當管理,傳送及處理大量資訊的須求增加時 料的壓縮須求也同樣地增加了。雖然儲存裝置的 著地增加,但資訊的須求卻遠超過容量的進步。 個未壓縮的影像須要5百萬位元組的空間,而相 對無漏失壓縮可以到只須要2.5百萬位元組的空 有漏失壓縮可以到只須要5 0 0千位元組的空間。 料壓縮可傳送更大的資訊量。即使傳輸率增加, DSL,纜線數據機,網際網路等,如用未壓縮的 關於定義 泛分佈繁 此快速增 變得更為 儲存的技 能用在許 加了 ,包 壓縮是用 I >例如’ i ° ,對此資 容量已顯 例如 ,一 同的影像 間,或對 因此,資 如寬頻, 資訊,很 200306080 容易便達到了傳輸率的上限。例如,在dsl線 壓縮的影像要花掉1Q分鐘。然而,同樣的影像在 則只須化一分鐘傳送,因而可提供1 〇倍的資料傳 一般而言,有兩種壓縮型態,無漏失及有漏 失壓縮可在壓縮後完全回復原始資料,而漏失的 縮後則所回復的資料會與原始資料有所差異。這 2弋之間各有千秋,漏失壓縮比無漏失壓縮提供 壓縮率’ ®為資料整體性在某個程度上被容忍了 失壓縮則可用纟,例如,要壓縮重要的文字,因 精確地重建資料1會大大地影響文字的品質及 漏失壓縮可以用在影像或非重要的文字,其中某 或雜訊是可接受的,或對人的感官是無法察覺的 壓縮對文件的數位代表(數位文件U特別可行 而言’數位文件包含文纟,影像,及/或文字及 了儲存目前的數位資料比較不佔空間外,也使儲 不造成品質的重大損害,這將鼓勵目前影印文 化,進而使播紙化的辦公室更為可行。對許多企 無紙化辦公室是-種追求的目標,因為無紙I二 許多優點,諸如使資訊的存取更加容易,降低環 降低儲存成本,等等。甚且,透過壓縮可降低2 大小,提高網際網路頻寬之使用效率,使得更多 更快速地傳送,並降低網路的擁塞。降低資訊所 空間,邁向更有效率的無紙化辦公室,以及增加 頻寬的效率,正是與壓縮技術相關之許多重要的 上傳送未 壓縮後, 輸效能。 失。無漏 壓縮在壓 兩種壓縮 了更好的 。而無漏 為右無法 可讀性。 種扭曲量 。資料的 的。一般 影像。除 存量小而 件的數位 業而言, 公室具有 境成本, 位檔案的 的資訊可 須的儲存 網際網路 好處其中 6 200306080 的一些而已。 為使數位文件的利用更為吸引人,數位文件的壓 當滿足某些目的。第—,壓縮應該要用少量的時間壓 解®縮大量的資訊。第二,壓縮應該能使數位文件正 重製。另外,數位文件的資料壓縮應該利用文件之企 目的或=終的目的。某些數位文件用來存檔或提供紙 件。、其它的文件可以被修改及/或編輯1多傳統的 壓縮方法在觀看時,無法處理文字及/或影像的回流 flowuig),並無法提供有效率且有效的手段以使壓縮 能辨識文字,並將之回流到文字處理器,個人數位 (PDAS),行動電話,等等。因此,如果紙本的辦公 件被掃描成數位形 <,如果無法更新1改,或改變 化的文件,則目前的壓縮技術將難以施行。 通常,壓縮架構可被裁剪成特別的檔案型態,如 元,非二位元,紋理的或影像,以増加壓縮^而, 種文件型態而裁剪的壓縮架構’一般不能用在其它的 型態。例如,依據文件的纹理而裁剪的壓縮架構一般 用在處理影像檔案。對此問題的—種解決方法是,選 種針對該文件型態而裁剪,或編碼的影像壓縮架$構。然 此解決方法無法應用在單-文件中具有—種以上資訊 的數位文件。例如’數位文件可具有—高彩影像及紋 訊’如m於料文章。要克服此問題的一種手 分析文件,並將之分成各種區域。該各種區域可被分 判斷其中所包含的資訊型態。依據此資訊型態,可對 縮應 縮及 確地 圖的 本文 資料 (re- 技術 助理 室文 數位 二位 為某 檔案 不能 擇一 而, 型態 理資 段是 析以 每個 7 200306080 區域挑選一個壓縮架構。然而 要具有不同大小及形狀的區域 另一種方法是將文件分成背景 的影像。這是有幫助的,因 及定色的影像上。然而,定 一定色而造成影像的漏失。 ,這種方法很難實現,且須 ’這將造成壓縮上的困難。 及一定色(constant color ) 為不同的壓縮架構可用在背景 色影像可因為迫使圖素值加入 另外數位文件的資料壓縮應該利用文件的目的。有 些數位文件是用來存檔或提供紙本。*它的文件可能要修 改且/或、爲輯目前的資料壓縮在觀看時,無法處理文 字及/或影像的回%,並無法提供有效率及有效的手段, 以使壓縮技術能用在文字辨識,並回流至文字處理器,個 人數位助理(PDAs ),行動電話,等等。因此,如果紙本 的辦公室文件被掃描成數位型式,如果不能更新,修改, 或一般改變數位化的文件,則目前的壓縮技術將使之更為 難行。 【内容】 以下為本發明之簡要說明,以對本發明之一些實施例 有基本的瞭解。本概要不是要定義本發明之主要/關鍵的 元件或要描繪本發明之範圍。其唯一的目的是要以簡化的 格式表達本發明之某些主要的概念,當作是對稍後要描述 的一些更詳盡的說明之引言。 本發明主要疋有關於文件影像之編碼及解碼的系統與 方法。文件的影像依據遮罩而被分割成許多的層次,其中 8 200306080 這些多層次以非二位元的方式表示。各個層次可被分開處 理及壓縮,以對文件影像整體造成較佳的壓縮。
依據本發明之一實施例,從文件影像產生一個遮罩。 該遮罩的產生是要降低遮罩與文件影像的多層次之組合大 小的壓縮預估。該遮罩用來分割文件影像為多層次。該遮 罩決定,或將文件影像的圖素配置在相對應的層次中。該 遮罩及該多層次被分開處理及編碼,以改善整體的文件影 像壓縮效能。此多層次為非二位元的影像,且例如能包含 一前景影像與一背景影像。
依據本發明之另一實施例,文件的影像被分割成許多 層次,該複數層包含一前景影像,一背景影像及一遮罩。 該遮罩為一二位元的影像,用來分割影像為前景影像及背 景影像。一般而言,該遮罩的產生是要降低遮罩,前景影 像及背景影像的組合大小之預估。不像有些習知的系統限 制一個層次只用一個顏色,前景影像及背景影像可使用任 何合適範圍内的顏色,且不限定為單一顏色或定色。除了 該遮罩可這樣處理之外,前景影像及背景影像也可以。該 遮罩,前景影像及背景影像被編碼且組合成單一的位元 流。可用任何數的合適的壓縮架構來編碼。對解碼而言, 壓縮的位元流被分成一遮罩位元流,一前景位元流及一背 景位元流。該遮罩位元流,前景位元流及背景位元流被解 碼為一遮罩,一前景影像及一背景影像。除了該遮罩可這 樣處理之外,前景影像及背景影像也可以。前景影像及背 景影像依據該遮罩被組合成一重新組合的文件影像。 9 200306080 依據本發明之另一實施例,一遮罩分離器接收到一文 件影像,並從該文件影像產生一遮罩。該遮罩以二位元的 格式表示。前景背景分割器接收該遮罩及該文件影像,並 將該文件影像分割成一前景影像及一背景影像。遮罩編碼 器將遮罩編碼為遮罩位元流。前景編碼器將前景影像編碼 為前景位元流。背景編碼器將背景影像編碼為背景位元 流。一組合組件將遮罩位元流,前景位元流及背景位元流 組合成一組合位元流。 為達到上述及相關之目的,本發明之某些說明的部份 在此由以下的描述及所附的圖示加以表示。這些目的是本 發明之各種可能之實施例的表示,這些全被本發明所涵 蓋。當輔以以下之圖示說明時,本發明之其它的優點及新 的特性將可從以下的詳細描述而更為明白。 【實施方式】 現在本發明便參照圖式加以描述,其中相同的參考圖 號是用來指相同的元件。在以下的描述中,為了解說的目 的,描述了許多特別的細節以便於對本發明有徹底的瞭 解。然而,很顯然本發明可以不須要這些特別的細節便能 加以實施。在其它的案例中,以方塊圖的型式顯示已知的 結構及裝置,以便於描述本發明。 如在本申請案中所使用的,「組件(component)」是用 來指與電腦相關的實體,可為硬體,軟硬體的結合,軟體, 或執行中的軟體。例如,組件可以成為,但不限於為,在 10 200306080 處理器上執行的程纟,處理器,物件,可執行的執行緒, 程式’及電腦。為了說明起卩,在伺服器上所執行的應用 程式,以及伺服器兩者皆可為組件。—或更多個組件可以 位於一個程序及/或執行緒中,且組件可位於—台電腦及/ 或分佈於兩台以上的電腦。 而且,「又件影像(document image)」是指文件的數 位表示,包含一或多種顏色(例如,二位元(黑/白),灰 階及/或彩色文件)。而且,文件影像可具有影像,文字, 及/或文夺含於像’潛在的文字與影像交登。文件影像可 包含二位元,紅綠藍(RGB),YUV及/或其它文件的代表。 RGB文件影像可表示紅,綠,及藍的組件。γυν文件影 像可表示使用以 Y 表示亮度組件(luminescence component ),及以 U及 V表示色度組件(chrominance components)。YUV —般更適合當壓縮的表示之用,因為 人的眼睛對U及V的扭曲比較不敏感,因此U及V可被 分量2再取樣(subsampled),而且因為Y相員取了 R,G, B之間的相互關係。為了文字叢集的目的,γ的代表特別 有意思,因為當亮度改變時,文字比較容易閱讀。來自於 色度改變的文字,例如從紅色變至綠色,在某個色度時, 比較難以閱讀。彩色的文件因而可轉換為YUV的文件, 它可為二位元的格式,而不會減少紋理的訊息。文件影像 包含,圖畫組件,一般用「圖素(pixel)」表示。文件影 像可為依據任何形狀或大小的單一或多頁的文件。 圖1為依據本發明之一種實施例的分割層次影像編螞 200306080 系統1 0 0之高階的方塊圖。本系統1 0 0定義並壓縮文字, 手寫字,圖式等等,且本系統可操作任何合適形狀或大小 的單頁或多頁的文件上。此系統1 00包含遮罩分離器1 02, 前景背景分割器 104,遮罩編碼器 106,前景編碼器108, 背景編碼器 110,及組合組件 112。該遮罩分離器 102 接收文件影像(如文件的數位代表),並產生一個遮罩。 文件影像可具有一或多頁,且基本上是從文件掃描來的。 該文件影像可具有任何的解析度,一般以 dpi ( dots per inch )表示。例如,傳真文件一般使用約 15 0〜2 00 dpi的 解析度。另外,文件影像可具有任何的圖素大小,或檔案 大小,例如,6 4 0 X 4 8 0圖素及/或A 4大小。 由遮罩分離器102所產生的遮罩,可用來切割文件影 像為兩層,一前景影像及一背景影像。請注意,本發明之 其它實施例也可將影像分割成兩層以上的層次。遮罩,也 稱為遮罩影像,為二位元的影像,其圖素值決定相對應的 圖素是否在前景影像或背景影像。遮罩分離器 102產生 遮罩,使得前景影像及背景影像的組合大小得以縮小。請 注意,本概念可延申至多重遮罩及多重前景,且仍在本發 明之範圍内。 有許多方式可以用來產生遮罩。就壓縮而言,相似的 圖素值比不同的圖素值壓縮得妤。例如,藍色天空的區域 壓縮得比具有各種顏色及密度的區域好。如前所述,該遮 罩的產生是用來降低遮罩,前景影像及背景影像組合的大 小。 12 200306080 另一個可行的方法是產生可能之遮罩的上位集合 (superset),並選擇該上位集合的最佳遮罩。對具有 N 圖素的文件影像而言,便有 2N個的可能遮罩。因此,可 分析每個可能的遮罩,並判斷哪個遮罩可產生最小的整體 組合影像。然而,要分析每個可能的遮罩,這在計算上的 成本很昂貴,而且耗時’所以並不貫用。
另一種方式是將文件分割成許多區域,然後分析每個 區域以依據至少一部份在能量上(如能量變化(energy variance )),以配置圖素及合併區域。能量變化(其為可 能得到的壓縮預估)為依據距離平方的總合之量測。該文 件的小區域,例如 2 X 2圖素或4 X 4圖素,可被分析作能 量變化。小區域可被分割成前景及背景區域,而使該小區 域的能量變化被降低或減少。每個可能的遮罩可用來判斷 要用哪個遮罩,因為被分析的區域小得可使這樣的分析變 得可行。例如,一個4個圖素的區域在那區域的遮罩便只 有 16種可能的排列組合。這些小區域因而可被合併(如 成對地)在一起以產生遮罩,整體而言,這可降低遮罩, 前景影像及背景影像組合的大小。 前景背景分割器1 04從遮罩分離器1 02接收遮罩,及 文件影像。前景背景分割器 1 04使用該遮罩以分割該文 件影像為前景影像及背景影像。就該文件影像的每個圖素 而言,該遮罩的相對應圖素被參考到。圖素依據該遮罩之 相對應的圖素而被配置到前景影像或背景影像。例如,如 果該遮罩之相對應的圖素是” 1 ”,該圖素便被分配到前景 13 200306080 影像。反之,如果該遮罩之相對應的圖素是π οπ,該圖素 便被分配到背景影像。然而,’’ 1 ”或” 0 ”指的是前景或背景, 這可由使用者自行設定(如” 1π被分派給背景影像而被 分派給前景影像)。 另外,前景影像及背景影像可彼此分離。然而,該遮 罩的額外處理可產生不同的前景及背景遮罩,這有時可以 重疊,以降低延著遮罩邊緣的不自然效果,或整個忽略某 些圖素,以增加壓縮。前景遮罩則用來從該文件影像分割 出前景影像,而背景遮罩則用來從該文件影像分割出背景 影像。在此例中,前景影像及背景影像並非彼此分離,而 是有些重疊一這樣的重疊能降低壓縮,但降低邊緣效應 (edge effects)。甚至如果前景遮罩及背景遮罩用來分割 文件影像,在文件影像被分割之後,前景遮罩及背景遮罩 便不須要了。 前景影像與背景影像具有洞孔,或圖素被設定到其它 影像的空區域。這些空區域也可為不相關(don’t care)圖 素。相對地,非空的區域可被指為相關(do care)圖素。這 些空的區域可適當的處置,以降低前景影像與背景影像整 體的壓縮大小。一種方法是用不相關(don’t care)圖素值 填滿這些空的區域。這些不相關圖素值被挑選來增加壓 縮,進而縮小影像。例如,一示範的背景影像可為白色的, 但在文件所在之處則用不相關圖素。在此例中,不相關圖 素可用白色填滿以改善壓縮。另一種方式是不填滿空的區 域,並使用利用空白區域的壓縮架構,例如屏蔽的小波壓 14 200306080 縮(masked wavelet compression)。其它的方式也可依據 本發明而實現。
在前景影像與背景影像上還可執行額外的處理。前景 影像與背景影像可用較小的解析度縮小尺寸,因而可降低 相對的壓縮大小。例如,背景影像與前景影像可從300dpi 縮小至1 〇 0 d i p。而且,定色的相連組件可在背景及前景 影像中被界定。定色的相連組件為複數個相連的圖素,具 有實質上相同的顏色。該定色的相連組件可利用配置種子 圖素(s e e d p i X e 1 )來定義,並利用演算法以判定與之相 連之實質上相同顏色之圖素。臨界值或最少的圖素可被設 定而使定色的相連組件具有最少的圖素。所定義之定色的 相連組件可增加文件影像的壓縮。
遮罩編碼器1 06從遮罩分離器102接收該遮罩,並將 該遮罩編碼以產生壓縮位元,或從該遮罩產生壓縮遮罩位 元流。遮罩編碼器 106可用任何適合的壓縮架構。該遮 罩為二位元並一般包含紋理資訊。因此,應挑選壓縮二位 元及紋理資訊好的壓縮架構。二階壓縮架構可用來將該遮 罩編碼。 可用來將遮罩編碼的壓縮架構是CCITT(Consultative Committee on International Telephone and Telegraph) 〇 CCITT 目前名為 ITU-T 國際通訊聯盟通訊區(ITU-T International Telecommunications Union-
Telecommunications Sector)(於 1994年改名),其為一 製定標準的組織,以及傳真/數據機通訊無漏失壓縮技術。 15 200306080 此壓縮型態在二位元的影像上用得比較好。一般在較早的 版本V.42bis的壓縮比為4:1,新的版本V.44 2000為6:1, 其為依據Lempel-Ziv-Jeff-Heath(LZJH)壓縮演算法。依據 本發明,其它適合的壓縮方法或架構也可用來壓縮遮罩。 前景編碼器1 08從前景背景分割器1 04接收前景影像 並將前景影像編碼為前景位元流。背景編碼器1 1 0從前 景背景分割器1 04接收背景影像,並將背景影像編碼為 背景位元流。任何合適的壓縮架構都可用在前景編碼器 108及背景編碼器110。例如,前進式波長編碼(pro gressive wavelength encoding,PWE),前進式轉換編碼(progressive transform coding,PTC) ,JPEG,JPEG2000,及屏蔽的 小波壓縮架構可被用來將前景影像或背景區域編碼。就某 些壓縮架構而言(例如,屏蔽的小波),前景編碼器i 〇 8 及背景編碼器1 1 0可以用遮罩,以將前景影像與背景影 像編碼。 組合組件1 1 2從遮罩編碼器1 06,前景編碼器1 〇8, 及为景編碼器11 0接收該壓縮的位元,並將這些位元人 併為一輸出位元流或輸出檔案。組合組件i丨2可在輸出 樓案中包含檐頭資訊’定義或提供訊息如,編碼型態,索 引表,等,以便被解碼器用來重建該影像檔案。 為便於說明’該編碼系統已被描述為透過以上所描述 之各種組件以立即處理整個影像。然而,重疊的掃描區域 可被用來降低記憶體的使用。例如,5丨2行的文件影像的 第一條線可被本系統所處理。然後,本系統用一重叠的量 16 200306080 的第二條線來重疊該第一條線,如1 〇條線。後來的線條 皆如此處理,直到整個文件影像皆處理完成一重疊的量使 得線條之間的變化比較小。 如前所述,前景影像與背景影像有空的或不相關區域。 空的區域有許多處理的方式。一種方式是用資料來填滿空 的區域,然後使用一般的壓縮技術。一種簡單的處理是將 這些影像的空的區域用該影像中平均的圖素值來填滿。然 而,此方法可能在遮罩的邊緣產生鮮明的不連續,可能就 一所給的峰值訊號至雜訊率(peak signal-to-noise ratio, PS NR)會增加所須的位元率,並在接近遮罩或空區域的邊 緣上’產生顯著的振铃雜訊(ringing)。另一種方式是用最 接近非遮罩圖素(或相關區域)的顏色將每個圖素著色。標 準的形態演算法(morphology algorithm )可容許對該遮 罩下’對所有導向Voronoi填滿(Voronoi-filled )的空區 域内的圖素,只以兩道程序來處理。然後,當前景或背.景 影像被重建時,被重建的影像為低通濾的(l〇w-passed), 且已知的圖素被回復其正確值。如果低通濾器將頻率切得 太低,會產生尖銳的邊緣,而增加所須的位元率及在接近 邊緣處發生顯著的振鈴雜訊(ringing)。 另一種處理空區域的方法是在凸形組(convex sets) 上投影(projection)。例如,有兩個凸形組:符合在這些 可見圖素上之輸入的影像組,以及具有設為零的某些小波 係數(wavelet coefficient )的影像組(例如,超過某些 解析度的所有高頻係數)。藉由改變在這兩組上的投影, 17 200306080 可以發現 具有許多 而另一 格子所設 小波轉換 與電腦視 面。這樣 可用# (masked 景編碼器 個案而定 是提供給 蔽的小波 用k值作 無法處理 區域或空 的數值, 的小波轉 圖2 步驟之圖 驟,及位 中省略了 其線性組 值(由高i ,與可見圖素相同的影像其壓縮較好,因為它們 零的小波係數。 種處理空區域的方法是,在特別為不規則之小 計之前景編碼器 1 0 8與背景編碼器 1 1 0上,用 。這樣的小波解構(decomposition)用在,如 覺,及與電腦圖學中之幾何資料的壓縮有關方 的小波適用於遮罩的不規則圖案。 〖勺小波轉換壓縮架構是一種屏蔽的小波轉換 wavelet transform )。屏蔽的小波轉換可用在前 1 0 8及背景編碼器11 〇,其小波函數的改變依 ,此為該遮罩的功能。雖然未視於圖1 ,該遮罩 前景編碼器1 0 8及背景編碼器11 〇,以使用屏 轉換壓縮架構。例如,一般習用的小波函數可使 為預測。然而,以遮罩及空區域,一般小波函數 不具數值的圖素,(例如,不相關圖素在不相關 區域)。相對地,可改變的小波函數只應用現有 或前景影像與背景影像的可見區域。因此,屏蔽 換不須要以不相關圖素將空區域填滿。 為使用’’拉力·’( lifting)之傳統小波運算的一個 示。該圖示說明,方形小波,在位置3的預測步 置6的相對應的更新步驟(為清楚表示起見,圖 其它的位置)。在每値答缺本 %可似則號旁的係數指示如何計 合以執行每個步驟。你丨杯 .^ 0 ^ 例如,在位置3之”詳細”數 i率波器所得來的)是由下万丨玄斗 ^疋田下列等式所計算出來的: 18 200306080 ds = S3- ( 一 s〇 +9s2 +—s6) /16 式(1) 此更新的步驟是用以下的等式計算的: ^ = d6+ ( 一 ^ +9d5 + 9d7 —d9) /32 式(2) 圖3顯示當某些圖素值遺失時所產生的問題。在此圖 不中’在位置1 ’ 2,5,8及9中沒有數值。顯然,傳統 的方形小波運算是行不通的,因為結果會依據這些遺失的 值而定。將這些遺失的值設為某些常數(零,或整個影像 的某個平均值)會產生鮮明的不連續現象,這會轉換為很 槽的壓縮,及/或不想得到的人工化效果。相對地,屏蔽 的小波壓縮架構以其遮罩的功能’視個案而定地改變小波 函數。例如,在拉力的預測步驟中,%果有用來作預測的 1值,k— 1級的多項式可用來作補點(interpoUtion)。 當只有三個值可用時,則用四次多項式而非三次多項式。 如果只有-個值可用’貝I】用一個常數的多項式,而小波會 成為Haar小波。須注意,如果該訊號是让—上次的多項式’ 且k圖素未被遮蔽,則該預測非常精確。 該屏蔽的小波轉換壓縮架構利用從偶數位置上的係 數,對在奇數位置上所有的係數做預測計算。在奇數係數 與其預測之間的差,為小波係數—此可被視為在偶數位置 上,具有某些零的高通濾波器。訊號s位於一位置的中央, 並依此而被索引。為簡化起見,該架構依據一 7步濾波器 (7-tap filter)來描述’如圖4所示。圖4描述一拉力步 驟,其中s。被預測為s-3,,s!,S3的函數,餘數d也 19 200306080 被計算出來。 濾波器a依據標準的矩陣標示法被標示為0至i。小波 係數d由以下的等式所提供: d -- Sq "i- ί=|Λ/2| t=0 2i-k/2ai 式(3) 其中k為在濾波器中步驟的數目(在此k = 7 )。高通濾 波器的動能Μ可被寫為(設為Si = in ): 式⑷
/=μ/2| η
Mrt=(T+ Ζ(2ζ·-众/2)' /=〇 假設一般的訊號可被一低次的多項式以j的次數所逼 近(使用泰勒展延)(Taylor expansion),然後選擇a以將 第一個 j + Ι矩量(moment )設為零p然後,小波轉換將 有許多個零,因而可壓縮得很好。因此,如果k = 7,a有 4級的自由度,且前4個矩量設為0。這些結果可用以下 的系統來驗證: 1 1 1 Γ a; "~Γ 一 3 一 1 1 3 αι 0 9 1 1 9 a2 0 27 一 1 1 27_ 3 一 _0_ 式(5)
其以用矩陣表示法寫成:wa = c。對本系統的解是用在已 知方形小波的係數:a = [ 1/16,一 9/16,一 9/16,1/16]。 本系統可用在所有具有遮罩的情況,如圖1的遮罩。 換言之,某些係數S2i_k/2不見了,可以矩陣m作為範例, 20 200306080 no 0 0 0 0 0 0 0 0 m2 0 0 0 0 m, 式(6) 其中m g {0,1},諸如 :wma=c。m的效果是要移除等式(5) 中系統的欄位。不巧,在本系統中,當 mfO時,是被 低估的,而在其它情況則被高估。這是因為有太多消退的 矩量限制加在符合可見圖素之ai。這也可用只在第一個j 矩量上設〇的方式來處理,如果有j個係數則%矣0。這符 合於等式(5)中的只保存系統中的第一個j等式。對於被 低估的係數a丨(當a丨乘以m,·关0 ),加上一任一的限制a丨= Ο ;這可用單一的系統來完成: (pwm+m-I) a = pc P〇 0 0 0 0 P' 0 0 0 0 Pi 0 0 0 0 P3
式⑺ 其中I是相等矩陣(identitymatrix),而且 式(8)
Pi= ( tr ( m) > i) ? 1:0 ; 式(9) 在A上的限制確定,就m中為0的每個係數,在等式 (5)中之系統中的線,被從等式(5)之系統的底部係數中移 除。換言之,如果m f•有j個係數不等於0,則= 1,i = [0…j 一 1 ],否則;? ; = 0。這很容易驗證,就%· e {〇,l},系統 總是有唯一的解法。等式(9)之系統可就 a對每個可能的 21 200306080 m值提供解法,以下之表(1)就方形小波加以整理,其中 當系統為4維時,等式(9)就不同m值之解法如表中所示。 (ΐϋο,η^,m2,m3 ) a〇 a2 a3 0000 0 0 0 0 0001 0 0 0 -1 0010 0 0 -1 0 0011 0 0 -3/2 1/2 0100 0 -1 0 0 0101 0 -3/4 0 -1/4 0110 0 -1/2 -1/2 0 0111 0 -3/8 -3/4 1/8 1000 -1 0 0 0 1001 -1/2 0 0 -1/2 1010 -1/4 0 -3/4 0 1011 -1/8 0 -9/8 1/4 1100 1/2 -3/2 0 0 1101 1/4 -9/8 0 -1/8 1110 1/8 -3/4 -3/8 0 1111 1/16 -9/16 -9/16 1/16 表⑴ 接下來,訊號s以上述之預測值來更新。在更新步騾 中,當訊號被乘以(一 1 ) 1之後,希望低通濾波器的第一 個矩量會消失。換言之,如果一般的訊號(例如,可被寫 22 200306080 為低次多項式)可乘以最高頻率的訊號,(一1 ) 1,然後, 低通率波器應輸出0。這個條件可輕易地被當作0矩量的 限制,如同先前所描述的,除了輸入的形式會是士=(-iyr, 而非\ =Γ。預測步驟使用相同的標示符號,更新的步驟符 合此等式: i=\kll\ S = S0~^ 式(ίο) /=0
其中 k為濾波器中步騾(tap)的次數(在此例中 通濾波器的矩量可寫成如下: 式(11) i=\k/2\ /=〇 但, 就每個di,等式可局部被改寫成(假設r -1 ) Ίη ): i = \k /2\ i = \k /2\ n dj = sj+ L s J^2i-k/2ai = - jn + Za (j 2i - Ic / 2) 式(12) /=0 / = 0 由於j及k/2為奇數。因為個別的的設定是要產生 零矩量,以下便為真:
/=μ/2| η 0 = jn + 21 Ο +2/-^/2) at 式(13) 這隱含 < =一心·。因此, i = \k /2\ n Μ Λ = 0Λ + X - 2(2/ - A: /2) bt 式(14) 要將小波壓縮得如一般訊號的壓縮一樣好,便要儘可 能得將更多的矩量等於零。由於有四次的自由度,第四個 23 200306080 矩量可設為零 證: - 3 9 一 27
'1/21 0 0 0 24個結果可以在以下的系統中很容易地驗 式(15) 這可以矩陣的择+ 士』& ^ 737 *、万式寫成w 6 == c,。這個系統的解法為適 、方形小波的係數·· b = [— 1/32, 9/32,9/32,一 1/32]。
、 在叙叹有些係數〜不見了。首先,假設所有遺失 、P /、在偶數的位置上。本系統可用如先前類似的方式 解決以驗證: (pwm + I) b
Pc 式(16) 汪意 -、P的矩陣視Sq中央的位置而定。每個位置看 到遮罩不同的部份’因此有自己的m及p。表(2)提供等 式(1 6)的觫& , t 、 ,八中^系統為四維時,等式(1 6)對不同的 :值之解法如表⑺所示。要得出等式(16),假設奇數位置 /又被遮罩遮蔽。如果奇數位置被遮罩遮蔽了,❻遮罩的值 小於η,則广一"〃且等式(16)維持不變。否則,在預測 步驟中有太多被遮蔽的圖素,而無法在更新㈣(小波係 數仍將很小,但不是零)中將第n個矩量變成$。此逆小 波轉換(inverse wavelet transform)很容易計算 只要 局邵地不要執行每個步驟,感謝拉力的形式化袼式。 24 200306080 (1110,111^1112,1113 ) bo b! b2 b3 0000 0 0 0 0 0001 0 0 0 1/2 0010 0 0 1/2 0 0011 0 0 3/4 -1/4 0100 0 1/2 0 0 0101 0 3/8 0 1/8 0110 0 1/4 1/4 0 0111 0 3/16 3/8 -1/16 1000 1/2 0 0 0 1001 1/4 0 0 1/4 1010 1/8 0 3/8 0 1011 1/16 0 9/16 -1/8 1100 -1/4 3/4 0 0 1101 -1/8 9/16 0 1/16 1110 -1/16 3/8 3/16 0 1111 -1/32 9/32 9/32 -1/32 因此,屏蔽的小波轉換可被用來將前景影像與背景影 像編碼而不必將空區域填滿。然而,不同的實現方式可用 其它的編碼方法或壓縮架構,如前所述,可將空區域以不 相關值填滿。 圖5為依據本發明之一種實施例之分割層次影像解碼 25 200306080 系統的方塊圖。本系統接收一壓縮的位元流,並從壓縮的 位元流產生重新組合的影像。該系統包含一分離組件 502,前景解碼器504,背景解碼器506,遮罩解碼器508 及組合器 5 1 0。 分離組件5 02接收壓縮的位元,並將位元分離以形成 前景位元流,背景位元流及遮罩位元流。分離組件 502 可利用檔頭資訊以將位元流分離。前景解碼器 5 04將前 景位元流解壓縮以產生前景影像。背景解碼器5 06將背 景位元流解壓縮以產生背景影像。前景解碼器504及背 景解碼器 5 06可使用任何數目的解壓縮架構,諸如,前 進式波形 (progressive waveform ) 或前進式轉換 (progressive transform) 〇 遮罩解碼器5 0 8解壓縮遮罩位元流以產生遮罩或遮罩 影像。遮罩解碼器 508也能存取佈局(layout)且/或回 流訊息(re-flow information )。另外,遮罩解碼器 508 能獲得一索引表(dictionary ),用來重建紋理訊息(textual information )。遮罩解碼器 5 08 —般利用雙層解壓縮架構 (bi-level decompression scheme)。對某些壓縮架構而言 (如屏蔽的小波),前景解碼器504與背景解碼器5〇6可 從遮罩解碼器508得到解壓縮的遮罩,以取得前景影像 與背景影像。 組合器5 1 0組合前景影像,背景影像與遮罩為重新組 合的文件影像。重新組合的文件影像與原本之文件影像相 同或近似。另外,重新組合的文件影像可視其所要之顯示 26 200306080 器特性而具有不同的形狀及/或尺寸。例如,掃描信件大 小的文件與顯示在具有較小螢幕之可攜式裝置上便不同。 組合器 5 1 0依據遮罩,從前景影像與背景影像,產生為 了重新組合之文件影像用的圖素。重新組合之文件影像的 每個圖素是由參考一遮罩之相對應的圖素來決定的,以判 定重新組合之文件影像的圖素是否可取自前景影像或背景 影像。例如,遮罩圖素值為1可表示重新組合的文件圖素 可來自前景影像之相對應的圖素。
圖 6顯示本發明之另一實施例的文件影像範例。圖 6 為一範例,並只是用來更進一步說明本發明。文件影像 60 1 具有多種色彩及/或陰影。文件影像 601為一典型的文件 影像,包含紋理訊息 602及背景訊息 604,前景訊息 6 03,背景 605。圖 6中之圖案顯示不同的陰影或色彩。 因此,紋理訊息 602的顏色可以與影像訊息 603及 604 或背景 605不同。另外,此訊息可以用任何適合數目的 顏色。依據本發明,如使用圖1之系統,文件影像 601 可分割成3個組件:遮罩610,前景影像611及背景影 像6 1 2。本發明之其他實施例可將文件影像分割為二或三 種以上的層次。 遮罩 61 0為二位元的影像,因而只用黑色與白色區域 顯示。遮罩 6 1 0決定或配置是否文件影像6 0 1的圖素應 該在前景影像6 11或背景影像6 1 2。遮罩6 1 0也利用判 斷哪個前景影像6 11及背景影像6 1 2的圖素要在該重建 的文件影像,來產生重建的文件影像。重建的文件影像與 27 200306080 文件影像 601相同或近似。
如圖6所示,前景影像6 1 1包含文件影像 6 0 1的部份, 如遮罩 6 1 0所指示的。遮罩 6 1 0的黑圖素,將文件影像 6 0 1的圖素配置到前景影像 6 11。前景訊息 6 0 3的其它部 份可用不相關圖素6 1 5填滿。如前所述,不相關圖素615 增加壓縮效能,但不會出現在該重建的文件影像中。同樣 地,背景影像 6 1 2包含文件影像6 0 1的部份,如遮罩 6 1 0 所指示的。遮罩 610的白圖素,將文件影像 601的圖素 配置到背景影像 6 12。背景訊息 604的其它部份可用不 相關圖素606填滿,如圖6中所示。不相關圖素606的出 現是為了增加壓縮起見,但不出現在該重建的文件影像 中。為說明起見,紋理訊息 602的輪廓出現在背景影像 6 12。然而,紋理訊息 602可用符合背景 605的不相關圖 素填滿,而使紋理訊息 602在背景影像 6 1 2中看不見。 如前所述,圖 6只是依據本發明之實施例中,許多可 能之文件影像中的一個例子。影像可作許多變化,並仍符 合本發明之精神。
圖 7為依據本發明之實施例的一種分割層次影像編碼 系統的方塊圖。本系統可定義文件中的訊息,如紋理,手 寫字,圖畫等,並壓縮該文件。本系統可操作任何形狀或 尺寸的單一或多頁文件。 色彩空間轉換器(color space converter) 702將文件 影像轉換為文件影像的色彩空間。該色彩空間指色彩如何 表現在文件影像中。色彩空間一般有許多種組件,提供圖 28 200306080 素單位的顏色。例如’影像可用 RGB (紅綠藍)的色彩 空間表示,每個圖素有RGB組件的每個值。另外,透明 組件(transparency component )可加入以顯出圖素的透 明度。圖素的整個顏色是用這些組件組合而成的。例如, 白色可用255,25 5及25 5的RGB值來取得(假設每個組 件是8位元),而藍色可用〇,0及200的rgb值來取得。 RGB色彩空間通常用來顯示影像及/或掃描影像。然而, RGB色彩空間會阻礙壓縮。 文件中的顏色一般有關且/或相互有關。就RGB色彩 空間而言,組件被個別壓縮(依頻道),造成相同的影像 被編碼了許多次。可用轉換文件色彩空間至壓縮度更高的 色彩空間之方式來改善文件影像的壓縮。 一種可能的色彩空間轉換是要將文件影像從RGB色彩 空間轉成YUV色彩空間。Y,U,V組件分別為亮度,色 度紅色(chrominance red)及色度藍色(chrominance blue) 組件。YUV原先是為電视的顯示而發展的。轉換可基於 觀看的喜好設定而發展,而非可壓縮性。因此,文件影像 可用以下的等式從RGB色彩空間轉換為YUV色彩空間:
Y = 0.6G+ 0.3R+ 0.1B U = R- γ V = B— Υ 式(17) YUV色彩空間提供比RGB色彩空間更好的壓縮,因 為它利用組件之間的關聯,所以相同的訊息不會被編碼許 29 200306080 多/入。大多數的關聯訊息包含在y組件中。等式(17)顯示 YUI組件可被比RGB相對應之組件更小的值代表。然而, 士則所迷’ YUV色彩2間不是為壓縮性而設計的,而是 為了可觀㈣。文件影像可為任何…如顯示,而轉換 回RGB色彩空間,如藉由修改等式(17)。 另一種色彩空間轉換是將文件影像從RGB色彩空間轉 換為YCQCg色彩空間。YCQCg代表利用由γ所表示的亮度,
C。所代表的橘色’及Cg所代表的綠色。利用此轉換,RGB ’、且件可對應至YC^Cg (如,前所述之習知γυν的一種選 擇)。 "Y" '12 1 · -R一 -R- 1 -Γ 丫 C。 LC,J 2 0 -2 一—1 2 -1 G B G B 10 1 1 1 一1 C〇 式(18) 色彩空間符應(color space mapping)的好處是, 從RGB至YCQCg及從YCQCg至RGB的逆轉換可用整數運 算來達成。而且,此逆轉換可不用乘法運算。YCcCg色彩 二間表示法會產生比一般Y u V壓縮更顯著的效果改善, 因為YCQcg色彩空間表示法從當代數位圖素資料(modern d i g i t a 1 p i c t u r e d a t a ) 的主要組件分析上,可得到最接近 統計上最佳的空間。先進的Y C。C g色彩空間不是為觀看 的目的而設計的,而是為了壓縮目的而設計的。而且,由 於等式或等式(1 8 )的轉換是利用整數運算,文件影像 用有效率的計算方式被轉換成YCDCg色彩空間。 色彩空間轉換器7 0 2可將文件影像從任何色彩空間轉 30 200306080 換成任何色彩空間。例如,色彩空間轉換器7〇2可將文 件影像從γυν色彩空間轉換成YqCg色彩空間。另外, 如果文件影像已在喜好的色彩空間中,便不須要作任何轉 換。 遮罩分離器704從色彩空間轉換器702接收文件影像 並產生遮罩。由遮罩分離器7 04所產生的遮罩是用來將 又件影像分割成兩層的:前景影像與背景影像。本發明之 其b貫施例可將影像分割成兩層以上的層次。遮軍,也稱 為遮罩景> 像為二位元影像,其每個圖素的值決定圖素屬於 則景影像或背景影像。遮罩分離器704產生的遮罩,可 將遮罩’前景影像與背景影像之組合尺寸縮小。 有許多方式可用來產生遮罩。就壓縮而言,相似的圖 素值比不相似的圖素值壓縮得更好。例如,藍天的區域比 具有各種顏色密度的區域壓縮得更好。如前所述,遮罩的 產生是要將遮罩’前景影像與背景影像之組合尺寸縮小。 另一種方法是,產生所有可能的遮罩,並挑選其中最 好的。就具有N圖素的文件影像而言,便有2N個可能的 遮罩。因此,理論上可將每個可能的遮罩經過測試,然後 判定哪個會產生最小的整體組合影像。然而,要測過每個 可能的遮罩’其運算成本太高,費時,且不可行。 另一種方法是將文件細分為區域(regions),分析每 個區域以配置圖素並將區域合併起來。能量變化(energy varience ),其為可以取得的壓縮預估 (estinlate of compression ),為一基於距離平方之總合的量測。文件的 31 200306080 小區域,如 2x2圖素或4x4圖素,可被分析 化。小區域可分割成前景及背景區域,而使小 變化可以降低或減小。每個可能的遮罩可被分 個遮罩可使用,因為區域夠小,而使這樣的分析 例如,4個圖素的區域在那區域的遮罩有1 6種 小區域可合併在一起以產生遮罩,整體上縮小 影像與背景影像的組合尺寸。 另一種方法是產生遮罩,假設前景與背景 而言是個常數,且遮罩的產生,減少或實質上 數週圍的變化或能量變化(energy variance ) 是用作前景及背景兩者可取得之壓縮的預估, 產生遮罩,然後分割文件影像以取得前景影像 並將之壓縮。能量變化,如前所述,是對前景 縮後的大小之可接受度的預估。首先,壓縮遮 全被忽略了。更多的步騾能將遮罩的大小加入 假設某個區域,該區域為N圖素的一集合 B為 S的部份(即,= 且Fn5 = 0 )。如 於圖素位置X之影像值,;ceS,前景與背景的變 2 匕= Σ(/(χ)-〜)
XeF 2
XeB 其中一 Σ/(χ)及α=77~Σ/(χ)分別為前景與
XeF ^B X^B 作為能量變 區域的能量 析以判定哪 變得可行。 排列組合。 遮罩,前景 對整個區域 降低這些常 。變化在此 而非實際上 與背景影像 與背景在壓 罩的成本完 考量。 S,且F與 果f(x)是位 1化分別為: 式(19) 式(20) 背景的中間 32 200306080 值,且nf及nb分別為前景與背景中圖素的數目。注意, 這些變化也可表示為: 2 ^ = Σ/(χ) ^NfMf2 式(2 1)
XeF 2 ^NbMb2 式(22)
XeB 適當的分配F及S的B,這將減少五=+ L的總合。即 使以這樣的簡化,這問題仍然非常地難解決,因為仍然有 2N個可能的遮罩。因此,影像可更進一步地分割成 2x2 個圖素次影像(s u b - i m a g e s )。在每個 2 X 2個圖素次影像 上,只有24 = 1 6個可能的遮罩,這意謂著每個這樣的區域 上,有可能可判定最佳的F及B,可減少五=匕(藉 由嘗試所有 16種的組合,並保持那種具最小能量的組 合。)這變成不須要試過所有的16種組合。這個問題等 於K-means問題,K = 2,並且由於f(影像)是級數函數(scalar function ),f(x)的值可被排序而產生一個解,這可非常有 效地計算:排列所有四個圖素的值,並判斷這三個分割中 (依據排序)哪個產生最小的能量。部份總合可在每次分 割中被重新使用,以減少操作次數。 然而,此解法的缺點是,每個2 X 2子區域具有明確的 前景與背景,甚至可挑出最小的圖素雜訊,而造成不正確 的遮罩。下一步在於組合連接的區域。例如,假設2個區 域,1及2,其相對應的前景與背景,F,,Βι及F2,B2。 當組合這四個集合時,實際上有7個分別的可能性: 33 200306080 NEW F new B F1 B1 , FI , B2 FI , Bl , F2 B2 FI , F2 , B2 Bl F2 F1 , Bl , B2 FI,F2 B1,B2 FI,B1 FI,F2 FI,B2 Bl , f2 表(3)
最佳組合為具有最小能f的五—+ F 5組合。注意,所有 的7個組合都可被嘗試,或其在前景與背景中的平均可被 排序,且只考慮相對應之排序的部份。甚且,如果每個區 域具有Σ/(χ),Σ/(χ)2且Nf為前景及Σ/⑺,Σ/(χ)2且nb,
F F b B
E的組合可在常數時間内完成計算。在合併之後,這些量 必須常被重新計算,但幸運地,這也可在常數時間内完成。 也注意到對整個區域的總合Σ/ω2與每個部分的比是常 數,且不須要為了挑選最佳的區域而被計算。對整 個區域的總合也可用來判斷,何時不必合併區域,如以下 所示。 區域而成為 4x4區域。 合併連接的區域時可用合併水平連接2 X 2 2 X 4區域,然後合併垂直連接的2 x 4區域成為 34 200306080 4χ 4區域合併為8 χ 8區域,如此一直合併到只剩下一個區 域為止。最後這個區域再分為前景與背景。 不幸的是,以這樣技術的合併會將許多灰階放在前景 或背景,而每當有兩個以上的顏色在同一區域時,可能會 漏掉潛在的重要細節,如文字。例如,如果區域1在白色 上寫下灰階的文字時,而區域2大多為黑色時,這兩個區 域的合併會變成灰色,且白色在最後區域的前景,而黑色 在其背景,而將使文字的訊息遺失了。然而,只要有兩個 顏色合併在前景或背景,在該區域便會有明顯的能量增加 (或改變),由於對該區域而言,常數已不再是個好的典 範。依此,須要應用一個演算法,如果能量 Ε超過某個 由實驗所決定的門檻值Κ時,不要將連接的區域合併。 此演算法產生一個遮罩,可這在一頁中擷取了大多數的文 字與圖形線。 然而,這演算法還有一些改善的方法,其中一個是要 用簡單的區域。小區域的 A1區能量(例如4 X 4 )可被測 量,而且如果能量夠低(用另一個實驗上所決定的門檻 值),整個區域可被放在前景或背景。因此,如果能量低 於一個門檻值,藉由加速此演算法的操作,可以避免將小 區域分割。在前景與背景上不用常數假設,而用多項式後 退(polynomial regression)來代表前景及背景。例如, 如果多項式為等式ca +你+芦的平面,能量可定義為: 〜=Σ〇"(χ,少)-¥ +心 + "尸)2 式(23)
x.y^F 35 200306080 VB = ^{Λχ^)-^βχ + + MbY 式(24) x,y^B \ ) 其中x,y指圖素的位置,而,A及/iF為減少VF的純量 (scalars),而A,久及A,為減少〜的純量。注意,α〆 Α及〜可在常數時間内用2>卜,外,,χ/(χ,7)3;及 的量解決。這是三個未知及三個等式的線性系統, 且這同樣適用於αβ ’久及a。如前所述,此演算法是由下 而上’且在每次合併時會減少E。前景與背景不能用平均 來排序’因此所有的七個組合被測試以判斷哪個組合可減 少E。要將每個測試及合併以常數時間處理,, 冰,及及N的量應留給每個區域的 前景與背景。簡單區域的最佳化仍有可能,但可假設有個 常數在該區域,多項式後退,或兩者。 遮罩處理器組件706執行遮罩上任何次數的處理操 作。遮罩處理器組件706包括雜訊移除組件(n〇ise retnoval component ) 708,及混色偵測器(dither detector ) 710。 本發明之另一實施例可包括其它的遮罩處理組件。本發明 的其它實施例可包含差不多的處理組件。 雜Λ移除組件7 0 8從遮罩移除雜訊。如前所述,數位 文件一般由掃描標準文件的方式建立。雜訊的某些量幾乎 總是透過掃描及數位化的處理而成為數位文件。例如,掃 描器上的手指印或文件上的皺摺會產生雜訊及/或錯誤的 遮罩’而被含在文件影像中。雜訊移除組件7 〇 8首先試 著去定義遮罩中的雜訊。有許多方法可用來定義遮罩中的 36 200306080 雜訊。一種方法是分析相連組件的遮罩。相 同顏色相連的圖素,如黑色。遮罩可從左至 描,逐頁地搜尋相連的組件。相連的組件可 或位元映射(bitmap )資訊的方式儲存。然 個圖素被分析以判定是否為雜訊。因此,要 域(surrounding region )的每個圖素,例 距離内的所有圖素,以判定相連組件的數 與該%繞區域交叉的位置。如果相連組件纪 小,該圖素便被視為雜訊且由該遮罩移除。 依據任何較佳之壓縮條件而被配置到該文竹 背景影像。依據本發明之精神的其他方法访 一般而言,雜訊移除組件70S可定義看 及/或與文件之文字或影像無關的圖素^雜翻 並不必要從文件中移除所有的雜訊。聋訊 藉由將圖素分配至前景影像或背景影像的为 除被定義的雜訊。另外,移除該雜訊,可襄 素之值來取代被認為是雜訊的圖素。 混色偵測器71 〇偵測遮罩中的混色( 從該遮罩中移除混色。混色是一種應用在零 術,以在單色顯示器或列表機上產生不同 象,或在彩色顯示器或列表機上產生額外合 將於像的區域當作點狀的群組,以不同的g 印W像熟悉者稱此為半調的(h a 1 f t 〇 n e ),^ 睛趨於將不同顏色的點以其平均值來看待: 丨連的組件為相 •右,上至下掃 以位蓄 置,形狀 r後,文件的每 •分軒環繞的區 如在五個圖素 目是否在及/或 丨數目比門檻值 然後,該圖素 :的前景影像或 :可適用。 •來似乎為散亂 ^移除組件7 0 8 移除組件708 '式,從遮罩移 F由如以周園圖 dithering ),並 匕腦圖學上的技 灰色形狀的假 )顏色。混色是 3案著色。對列 色色利用人類眼 ’並將之合併為 37 2〇〇3〇6〇8〇 單一太 —查覺到的形狀或顏色。在某個區域内,視黑點對 又比例,其整體的效應是灰色的某種陰影。混色也用 電腦圖形增加真實感,並使鋸齒狀的邊緣平滑化, 4占 7 一 7以低解析度來平滑化。然而,混色對文件影像可能 題。若未經過適當地偵測及處理,混色將被誤認為是文 手寫字或圖形。 混色偵測器7 1 〇定義遮罩中的混色區域…該區域 分割而使每個區域或次區域有類似的混色圖案。混色 器710移除或處理被定義的混色區域。例如,混色 器7 1 0可定義混色區域為淺灰色。混色偵測器7 1 〇 混色區域移除,或將該區域設為淺灰色。請暸解,將 改變為陰影也會涉及改變文件影像。藉由修改遮罩, 偵測器 7 1 0也可將所定義的混色區域重新配置到前 背景。 有許多方法可用來偵測及/或處理混色。一種方法 析相連組件的遮罩。相連組件為相同顏色的相連圖素 如黑色。遮罩可由左至右,上至下掃描’逐頁地搜尋 的組件。相連的組件可用其位置,形狀或位元映射資 方式儲存。遮罩的每個圖素,在及/或與環繞區域交 位置,被判定有多少的量或數目的相連組件。環繞區 為與環繞該圖素的某個數的圖素,如7個。如果在該 内的相連組件的數目比門檻值大,混色便被移除。然 該圖素被配置到前景影像或背景影像,因而移除該混 此配置可由計算該區域的背景中的圖素數目及該區域 白點 來對 對角 有問 字, 可被 偵測 偵測 可將 區域 混色 景或 是分 ,例 相連 訊的 又的 域可 區域 後, 色。 之前 38 200306080 六中的圖素數目來判定。然後,圖素可被配置到前景影像, 如果區域的前景影像中的圖素數量大於該區域的背景中的 數量,否則圖素可被配置到背景。依據本發明之精神, 其他用來定義及/或處理混色或半調的方法亦可適用。 襄集化組件712定義遮罩中的叢集(clustering)。叢 集化組件7 1 2將相連的組件放在遮罩中。相連的組件, 如前所述,為複數個相連的圖素’且如可為四面相連的組 件或八方相連的組件。在將相連的組件放在遮罩之後’叢 集化組件712定義類似相連的組件,並將之群聚為叢 集。叢集為一群類似的相連組件。一般而言’叢集代表字 母與數字混合編製的特性,包含手寫字’但也可包含其它 訊息。然而,也可有許多叢集代表單一的特性。叢集可大 幅增加恩縮率。 增加壓縮,降低檔案大小的原因是,每個相連組件是 由位置所涵蓋,對形狀的指標(a pointer to a shape),屬 於形狀的索引表(a dictionary of shapes )。形狀是位元映 射或相連組件或叢集的,,影像"(image )。相連組件也稱為 遮罩。演算法的叢集面是要判斷哪個形狀應屬於該索引 表,而哪個形狀最接近每個相連的組件。一般而言,形狀 的索引表為檔案尺寸的一部份,而且可為跨頁分享。對形 狀的指標是以頁中的位置(x,y),及形狀數(shape number )來表示。x,y位置可用前一個位置來壓縮,而 形狀索引(shape indices )用上下文脈絡或語言模式來壓 縮0 39 200306080 藉由叢集化組件7丨2 ·有許多方法可用來以定 一種万法是比較每個記號(mark )的形狀,並 及/或相同的特徵。另一種方法是用現有的叢集 號(mark )的特性或相連組件。現有的叢集為 個记號的群組,它先前已被定義為叢集。從文科 號特性與現有之叢集特性比較。這樣的比較並不 時且昂貴的位元對位元比較法,以找出不符合於 果記號的特性無法符合任何現有之叢集的特性, 號與任何現有之叢集的特性差太遠,則該記號僅 新增的叢集,而避免了位元對位元的比對。此方 方法不同的特性是,可藉由計算效率高的掃描以 合I處’以及計算效率高的演算法以偵測叢集 度。 叢集的一個有用的特性是X大小及7大小。 及y大小提供現有之叢集的尺寸資訊。記號之】 大小可與現有之叢集的x大小及y大小相比較, 符合之處。本發明之一個實施例是要將叢 (b u c k e t )的二維表加以組織,並以X大小及乂 標。當找到新記號時,相同之X大小及y大小的 抽離出來,該記號便與該桶子中的叢集相比較。 子也可被搜尋以找到更多正確的符應(所有其它 被忽略或篩選)。對於叢集中心之"不飄移”( 假設,如下所述,在此是有用的,因為它保證叢 桶子中。 .義叢集。 定義相似 特怏,記 矣少有一 .得來的記 :須要用即 f地方。如 jL如果記 :被當作是 •法與其它 彳貞須ιΐ不符 的符合程 諒χ ϋ c大小及y 以找出不 桶子 大小當指 桶子侵^皮 彳目連的桶 的桶子將 drift)的 集會留在 40 200306080 一種可用來比較記號與現有之叢集的特性是印字 (ink size )。該印字大小通常指在記號或叢集中,黑 素對整個圖素的比例。同樣地,記號的印字大小可與 之叢集的印字大小比較,以找出不符合的地方。記號 個特性是”熱點”(hot point )。該熱點是記號上的一 置,其可為重心,或由其它手段所計算出來的(例如 特徵(surrounding characters )的線性等式)。在比 間,記號的熱點與叢集在比較開始之前便被對齊,通 成翻譯(translation )。而另一個特性是縮小的記號 像,其為圖素大小之縮小版的記號及/或叢集的一個 映射。在本發明之另一實施例,縮小的記號置於熱點 央,該記號被重新調整大小而使縮小的記號有固定大 又,叢集之不飄移的假設有助於保證該叢集的縮小版 確代表叢集中的所有記號。縮小的記號(mark )可 小的記號或現有之叢集的縮小影像比較,以找出不符 地方。 當一個記號通過所有的特性試驗之後,它便可與 以更直接的方式相比較。記號與叢集之間的距離被比 並與第一門檻相較。如果距離是在某個門檻之内’該 便被加入於現有的叢集中。記號可被加入該第一個可 的現有叢集,或該記號可加入與之相距最短距離的現 集。 另外,叢集可用叢集中之第一元件(element )作 特徵。這樣的好處是’在叢集中加入新記號不必要重 大小 色圖 現有 另一 個位 環繞 較期 常造 或影 位元 的中 小〇 可正 與縮 合的 叢集 較, 記號 接受 有叢 為其 新計 41 200306080 算該叢集的特性。本方法的另一個妤處是’它避免了”叢 集漂移,,(cluster drift ),這發生在當每次有新記號加入 叢集中時,叢集的中心便跟著移動。不具叢集漂移’也稱 為"不飄移"假設,保證同一個叢集中的雨個兀件 < 間保有 最大的距離--此保證提供了有效且激進的筛選。這種方法 的主要缺點是,對相同平均的叢集至記號(cluster_t〇-mark )的距離,它會產生更多的叢集,如此比起其它叢 集演算法,如k-means,叢集不是最隹的。然而’本方法 的重要優點是速度的增加。在文字壓縮的案例上,因為索 引表的大小,而不須擔心叢集的數目增加1 〇 %,索引表帶 有每個叢集的訊息,是壓縮文件之尺寸的一部份。 在叢集化組件712於遮罩中找出叢集之後,光學文字 辨識器7 1 4便收到遮罩,光學文字辨識器7丨4執行遮罩 上的光學文字辨識。光學文字辨識器7丨4找出遮罩中可 能的文字,並從叢集組件707利用叢集以協助文字叢集的 分析。每個叢集被分析以判定該叢集是否為文字,然後判 斷該叢集代表甚麼字形。此方法可依據不同的語言及/戈 丰母而奴而$ ,叢集的形狀或位元映射與所使用的 字母的字形或位兀映射相比較。如果形狀夠相似,叢集被 視為該特別的字形。每個所找到的文字的位置訊息,可以 保持其順序。這些文字可用標準的字母的文字順序排列, 如ASCn碼。 佈局分析器716在遮罩上操作,以改善壓縮並提供佈 局資Λ。佈局資訊後來可用來將文件影像回流。佈局分析 42 200306080 佈局資 置組織 件來提 份依據 連組件 度,加 二個以 或其它 資訊。 及該文 器7 1 6可利用許多種方 万去以改善壓縮及/或提供 訊。一種方法是先用色彩, 垂直位置及/或水平位 相連的組件。相連的組件 1〒可由系統700的另一組 供,如叢集化組件712。徐&w 怖局分析器7 1 6至少一部 顏色,垂直位置,水平位 u置,加入的距離(如,相 之間的距離),相連組件之*吞其/ + 4 ^ τ <回度及/或相連組件之寬 入或合併相連的組件。因办 ,λ ,,,. 口此,加入的相連組件包含 上的相連組件。加入的組件也可與其它相連的組件 加入的組件-合在一起。佈局分析器716產生佈局 佈局資訊可包含加入的組件之位置,線條的位置, 件影像的其它訊息。 遮罩編碼器718從体局分析器716接收到遮罩,並將 遮罩編碼以產生壓縮的位元流,稱為遮罩位元流。任何適 合的壓縮架構可用遮罩編碼器718來實現。該遮罩為二 位元且一般包含紋理訊息。因此,應挑選對二位元及紋理 訊息壓縮較好的壓縮架構。二級的壓縮架構可用來將遮罩 編碼。另外,遮罩編碼器7丨8編碼或提供編碼訊息以應 用在將遮罩位元流解碼,如函式庫,索引表,符號,表的 大小等等。 可用來將遮罩編碼的壓縮架構為CCITT ( Consultative Committee on International Telephone and Telegraph)。 CCITT目前為ITU-T國際電訊聯盟-電訊區(International
Telecommunications Union-Telecommunications Sector), 於1994年改名,為標準的組織,及傳真/數據機通訊的無 43 200306080 漏失壓縮技術的名稱。這種壓縮型態適合二位元的影像。 一般對舊版V.42bis的壓縮比為4:1,對新版V.44 2000的 為 6·1 ’ 這是依據 Lempel-Ziv-Jeff-Heath(LZJHH)壓縮演 算法而疋的。其它的壓縮方法或架構可被用來將遮罩編碼 並仍符合本發明之精神。 則景背景分割器7 1 9接收文件影像及該遮罩,並將文 件影像分離為前景影像與背景影像。依據本發明之實施 例,前景影像與背景影像實質上與文件影像的大小相同(如 文件影像為640x480,前景影像為640x480,背景影像為 6 40M80圖素)。然而,本發明之另一實施例可產生前景 與背景影像’其大小與文件影像差很多。前景影像與背景 影像為,當組合在一起或重新組合時,可與文件影像相同 或類似。 刚景背景分割器7 1 9利用二位元形式的遮罩以產生前 景與背景影像。例如,所有在遮罩中用1表示的圖素可到 前景影像,而所有用0表示的圖素可到背景影像。相反地, 舉例而吕’所有在遮罩中用〇表示的圖素可到前景影像, 而所有用1表示的圖素可到背景影像。然而,前景影像與 背景影像一般有未設值的圖素。這些未設值的圖素稱為孔 洞’空的區域及/或不相關區域。 另外’前景背景分割器719包括擴充組件(dUate component ) 720 及修整組件(retouch component ) 721。 擴充組件7 2 0在遮罩上操作,以依據前景影像與/或背景 影像將遮罩擴大。遠擴大的動作為依據距離轉換(d i s t a n c e 44 200306080 transform )的形態操作( 離轉換用一個遮罩,並將 (morphological operation),該距 的區域用k圖素擴展,其中k 為常數(如2 )。距離可為曼哈頓距離(Manhattan distance )
或球形距離。此交談的操作( (erosion)’可用逆遮罩(inversemask)的擴展來執行。 在基本的掃描文件中,文字通常被洗掉,為漏墨(ink bleeding )的結果,或在掃描期間的低dpi設定。因此從 白到黑的過渡期為持續且漸序的,遮罩定義了前景與背景 <間不可逾越的界限。在接近前景與背景兩者之邊緣的持 續轉變(continuous transiti〇n)會導入振鈴雜訊⑴叫丨叩), 而難以編碼。要減輕此效應,可忽略接近邊緣的圖素值。 运可利用前景與背景的「不相關」值以擴展許多圖素距離 來實現。在文字區域週圍,「不相關」圖素的擴展(dilation) 一面縮小檐案大小,一面增加了對比與可讀性。然而,當 擴展用在自然影像的區域時,增加對比的效應將使影像看 起來冷張不貫。要避免此問題,可執行遮罩的佈局分析, 並偵/則哪個區域是文字所構成的。擴展可只針對文字區 域。擴充組件72〇可將遮罩分離為前景遮罩與背景遮罩。 I口果會有給前景與背景兩者的不相關圖素。這些圖素仍 附有合理的值,因為擴展的距離小,且前景與背景一般因 為壓縮的關係而平順,因此不相關圖素會得到與鄰近相關 圖素相差不遠的值。然而,在將不相關擴展時必須注意, 不要元全將相關圖素的小或薄的區域完全抹除。如果發生 适種情況時’圖素會變得無法控、制,而與任何相關圖素離 45 200306080 得很遠,造成該圖素與離很遠的區域在著色無法預測。要 避免适種情況發生,必須注意距離的轉換,並保護區域的 極值(local extrema),使之不要從相關變成不相關。 前景影像與背景影像最後可被重新組合成一再組合的 文件。然而’尖銳的邊緣與轉換(transiti〇ns )將造成壓 縮的降低,並造成重新組合的影像有視覺上的缺陷,如邊 緣或線條。例如,這會發生在當遮罩造成跨越實質上相似 之色區的假邊緣(spurious boundary)時,造成實質上相 似之色區的部份被放在前景影像,而另一部份被放到背景 影像。當最後重新組合時,這些部份會有看得出來的,可 察覺的線條跨過假邊緣,因為這些部份被分開處理且分開 編碼。另外,這些部份的壓縮效率被降低,因為假邊緣實 質上是依照每個部份編碼的。 修整組件721在遮罩上將文件影像”修整y ret〇uch), 而使文件影像整體的壓縮可被改善,因此,重新組合的文 件影像可明顯地被改善。一般而言,修整組件72丨定義 假邊緣及/或將前景及/或背景影像用遮罩的.方式擴展。就 一種方法而言,修整組件72 1利用遮罩以定義前景與背 景影像的假邊緣。藉由比第一門檻的圖素量(如5圖素) 長的合併區域的邊緣,其水平及/或垂直線可偵測到假邊 緣’其(1)邊緣的一邊是前景而另一邊是背景,(2)以大 於第二個門檻量的差別,延著任一邊的線的線性後退, (如,線性後退可在圖素延著前景邊的邊緣圖素上執行, 線性後退可在圖素延著背景邊的邊緣圖素上執行)。修整 46 200306080 組件7 2 1可從遮罩分離器 7 04取得區域訊息。修整組件 72 1以從遮罩上產生分別的前景與背景遮罩來擴展前景及 /或背景影像。前景遮罩擴展前景影像,而背景遮罩擴展 背景影像。一般而言,前景影像與背景影像擴展了 一些圖 素而越過邊緣。前景與背景遮罩不是被編碼,或用來作為 解碼程序的一部份。依據本發明之精神,在重新組合時, 修整組件 7 2 1也可用其它方法以改善文件影像的壓縮及 外觀。 如前所述,前景背景分割器 7 1 9使用該遮罩以將文件 影像分割成前景與背景影像。如果前景與背景遮罩是由擴 充組件 720且/或修整組件721所產生的,該前景遮罩用 來分割文件影像為前景影像,而背景遮罩用來將文件影像 分割為背景影像。 前景圖素過濾器 722從前景背景分割器 7 1 9接收前景 影像。一般而言,前景圖素過濾器 722在前景影像中找 出不相關區域或空區域,並將這些區域以不相關圖素填 滿。這些區域是由位在背景影像的文件影像之圖素所形成 的,留下空的或不相關區域在前景影像中。不相關圖素一 般不出現在重新組合的文件影像中,以致於前景圖素過濾 器 722不考慮不相關圖素的外觀。本發明之另一實施例 可避免用壓縮架構將不相關圖素填滿,該壓縮架構正確地 處理不相關區域,如屏蔽的小波壓縮架構。 如前所述,前景影像與背景影像具有空或不相關區域。 這空區域可以許多方式來處理。一種方式是以資料來填滿 47 200306080 空區域,然後用一般壓縮的技術。一種填滿影像空區域之 簡單方法是以該影像的平均圖素值,來填滿這些空區域。 然而,此方法會在遮罩的邊緣上產生尖銳的不連續,對一 所給予的峰值訊號至雜訊率(peak signal-to-noise ratio, PS NR )會增加須要的位元率,並在接近遮罩或空區域的 邊緣上,產生顯著的振鈴雜訊(ringing)。另一種方法是以 最接近非遮罩的圖素(或相關區域)的顏色來將每個圖素 上色。標準的形態演算法(morphology algorithm)可容 許對該遮罩下,對所有導向Voronoi填滿(Voronoi-filled ) 的空區域内的圖素,只以兩道程序來處理。然後,當前景 或免景影像被重建時’重建的影像是低通率(low-passed) 的,且已知的圖素回復其正確值。如果低通濾波器將頻率 切得太低’會產生尖銳的邊緣,而增加所須的位元率及在 接近邊緣處發生顯著的振鈴雜訊(ringing)。 另一種處理空£域的方法是在凸形組(convex sets) 上投影(projection)。例如,有兩個凸形組:符合在這些 可見圖素上之輸入的影像組,以及具有設為零的某些小波 係數(wavelet coefficient )的影像組(例如,超過某些 解析度的所有高頻係數)。藉由改變在這兩組上的投影, 可以發現,與可見圖素相同的影像其壓縮較好,因為它們 具有許多零的小波係數。 然而另一種處理空區域的方法是,在特別為不規則之 小格子所設計的小波轉換。這樣的小波解構 (decomposition )在電腦視覺及電腦圖學中的幾何資料 48 200306080 壓縮中是須要的 & 另—種、、廷樣的小波適用於遮罩的不規則圖案。 万去是使用屏蔽的小波壓飨加 前景影像壓縮妊工 、、木構來編碼,以將 滿。屏蔽的、』 不必以不相關圖素來將不相關區域填 屏敝的小波壓縮架構,如 縮架構。依攄士政 圖所描述者,為可用的壓 方法也可使用。 ,、匕處理不相關區域的可行 ί or 則广減組件724從前景圖素過滤器M2接收前景影 ^並將該前景影像縮小。前景縮減組件724將前景影 縮J以增加則景影像與文件影像的壓縮。例如,x48〇 的圖素的則景影像可被縮小為320x240。有許多方法可用 來縮小前景影|。例如,前景影像可用放棄每兩個圖素的 方法,使影像由640x480降到32〇x24()圖素。另一種方 法是依據前景影像相對應的圖素之平均值或中間值產生新 圖素。例如’前景影像的新圖素可產生為八個相鄰圖素的 平均而另一種方法是用方形補點(cubic interpolate 來縮小。依據本發明之精神仍有其它的方法可將影像 小。如果前景與背景在編碼器中被縮小,則它們在用遮 被組合以前,應該先在解碼器中被放大。 前景編碼器726將前景影像編碼。前景編碼器726 前景影像中產生編碼位元流。該位元流可稱為前景位 流。前景編碼器 726可利用許多個合適的壓縮架構將 景影像編碼。有些壓縮架構的範例可利用,如,前進式小 波編碼(progressive wavelet encoding)或前進式轉換編 碼(progressive transform encoding) 〇 49 200306080 前景編碼器 726也可包括定色相連組件分析器 於圖),以將前景影像的壓縮進一步改善。定色相 可使用與叢集化組件 7 1 2所描述之相類似的方法 法。定色相連組件分析器掃描前景影像,以將定色 圖素找出來。如果定色相連圖素的群組比門檻值大 群組被視為一定色相連的組件或定色遮罩。”定色” 色彩中的一些變化。定色相連組件分析器可將類似 相連組件更進一步地組合為定色叢集。相關的訊息 色叢集的位置訊息,位元映射,形狀,定色相連組 置訊息等等,可被包含在前景位元流中。透過用來 個區域是由文字所構成的佈局分析器,定色也可只 文字上。 背景圖素過濾器730從前景背景分割器 719接 影像。背景圖素過濾器 730在背景影像中找出不 域並以不相關圖素將這些區域填滿。這些區域是由 像的圖素所形成,分配在前景影像而將空的或不相 留在背景影像中。不相關圖素一般不出現在重新組 件影像中,所以背景圖素過濾器 730不考慮不相 之可察覺的外觀。本發明之其它實施例可用壓縮架 免填滿不相關區域,這壓縮架構可適當處理不相關 如屏蔽的小波壓縮架構。背景圖素過濾器 730與 素過濾器 722在操作上實質相同。 如前所述,前景影像與背景影像有空的或不相關 空區域有許多處理方式。一種方法是以資料填滿空 (未示 連組件 與演算 相連的 時,該 可包含 的定色 ,如定 件的位 偵測哪 限制在 收前景 相關區 文件影 關區域 合的文 關圖素 構來避 區域, 前景圖 區域。 區域, 50 200306080 然後 是, 法會 值訊 增加 生顯 罩的 的形 下, 内的 像被 其正 邊緣 的振 I 上投 可見 係數 解析 可以 具有 fi 格子 在電 用〜般的壓縮技術。填滿影像中之空區域的簡單方法 以謗影像的圖素平均值填滿這些空區域。然而,這方 在遮罩的邊緣上產生尖銳的不連續,對一所給予的學 就至雜訊率(peak signal-to-noise ratio,PSNR)會 所須的位元率,並在接近遮罩或空區域的邊緣上,產 著的振铃雜訊(ringing)。另一種方法是以最接近非遮 圖素(或相關區域)的顏色來將每個圖素著色。標準 態演算法(morphology algorithm)可容許對該遮罩 對所有導向Voronoi填滿(Voronoi-filled)的空區域 圖素,只以兩道程序來處理。然後,當前景或背景影 重建時,重建的影像為低通濾的,且已知的圖素回復 確值。如果低通濾器將頻率切得太低,會產生尖銳的 ’而使所須的位元率增加,並在接近邊緣處發生顯著 鋒雜訊(ringing)。 * 7 種處理空區域的方法是在凸形組(convex sets) 影(projection)。例如,有兩個凸形組:符合在這些 圖素上之輸入的影像組,以及具有設為零的某些小波 (wavelet coefficient )的影像組(例如,超過某些 度的所有高頻係數)。藉由改變在這兩組上的投影, 發現,與可見圖素相同的影像其壓縮較好,因為它們 許多零的小波係數。 6另一種處理空區域的方法是,在特別為不規則之小 上’使用小波轉換。這樣的小波解構(d e c 〇 m ρ 〇 s i t i ο η ) 腦視覺,及電腦圖學中的幾何資料壓縮中,是須要的。 51 200306080 这樣的小波適用於遮罩的不規則圖案。 >另「種万法是使用屏蔽的小波壓縮架構來編碼,以將 如景影像壓縮好,而不必以 ^ 相關圖素來將不相關區域填 滿。屏蔽的小波壓縮架構,#圖”斤描述者,為適用的壓 縮架構。依據本發明之精神,其它處理不相關區域的可行 方法也可使用。
背景縮減組件732從背景圖素過滤器730接收背景影 像,、並將該背景影像縮小。背景縮減組件將背景影 像,宿】以增加背景影像與文件影像的壓縮。例如,以⑼ 的圖素的背景影像可被縮小為320x240。有許多方法可用 來縮】、U ,像。一種是用放棄圖素的方法來將背景影像 縮小。例如,背景影像可用放棄每兩個圖素的方法,使影 像由64〇x48〇降到32〇x24〇圖素。另一種方法是依據背 景影像相對應的圖素之平均值或中間值產生新圖素。例 如,月景影像的新圖素可分別產生為八個相鄰圖素的平 均。依據本發明之精神仍有其它的方法可將影像縮小。一 般而言’在分別以前景縮減組件724與背景縮減組件732 縮小後’前景影像與背景影像的大小實質上相同。 皆景編碼器734將背景影像編碼。背景編碼器734從 背景影像中產生編碼位元流。該位元流可稱為背景位元 流。背景編碼器7 3 4可利用許多個合適的壓縮架構將背 景影像編碼。有些壓縮架構的範例可利用,如,前進式小 波編碼(Progressive wavelet encoding)或前進式轉換編 碼(progressive transform encoding)。 52 200306080 組件分析 善。定色 的方法與 將定色相 檻值大時 ”定色"可 將類似的 的訊息, 相連組件 過用來偵 也可只限 器(未示 相連組件 演算法。 連的圖素 ,該群組 包含色彩 定色相連 如定色叢 的位置訊 測哪個區 制在文字
於圖),以將背景影像的壓縮進一步改 可使用與叢集化組“2所描述類似 定色相連組件分析器掃描背景影像,以 找出來。如果定色相連圖素的群組比門 被視為一定色相連的組件或定色遮罩。 中的-些變化。定色相連組件分析器可 組件更進-步地組合為定色叢集。相關 集的位置訊息,位元映射,形狀,定色 息等等,可被包含在背景位元流中。透 域疋由文字所構成的佈局分析器,定色 任何適當數目的壓縮架構可以應用在遮罩編碼器 7 1 8、前景編碼器7 2 6、及背景編碼器734上。有些架構 已描述如上。其它可用遮罩編碼器71 8,前景編碼器72 6, 背景編碼器7 3 4的壓縮架構則在此加以描述。
可用在本發明之習知的壓縮架構為JPEG ( Joint Photographic Experts Group,PWT ( Progressive Wavelet Transform ),JPEG 2000,PTC ( progressive transform codec),GIF ( graphic interchange format),PNG ( portable network graphics))。JPEG 依據離散餘弦轉換(Discrete Cosine Transformation,DCT),一般是指會漏失的壓縮, 達到2 ·· 1的壓縮比。此壓縮技術一般用來作攝影的影像β JPEG可儲存每個圖素24-位元的顏色,以20 : 1的平均 53 200306080 壓縮率為全彩壓縮。一般而言,平均的壓縮比 到20 : 1為察覺不到的漏失,60 ·· 1-100:1是 而60 : 1至100 : 1為不好的品質。此技術的 法處理尖銳的邊緣,而且缺少對透明度的支援 比GIF還須要更長的時間,但在掃描全彩或 影像上,則比giF優良。 pwt為無漏失技術的〜部份,而且為許多 術的基礎。PWT的基本觀念是,最好先看到 然後隨著時間逐步增加解柝度。這可有效傳輸 影像。特別是,藉由先傳送低頻的組件,低解 個影像可先傳送出去。然後,其解析度會隨著 的到來而增加。 JPEG 2 0 00是設計要來取代jPEG標準的, 以小波為基礎的壓縮技術。jpEG 2000消除出 的人工化效果,而維持2 4位元的色彩。另外, 漏失與無漏失壓縮,以2 〇 1 : 1的漏失與2 : 1 PTC 是由組合 JPEG,GIF,PNG,M-JPEG, 及其它等格式之某些特性而成的壓縮架構,但 壓縮效能,且在許多案例中的編碼及解碼更 JPEG,PCT可提供較低的人工化效果。 P T C也加入新的特性。一種新加的重要特 性(或逐漸彩現)。從原始的PTC檔案,低解 靠度的圖片,可從檔案中的一部份,以分析及解 PTC也支援多達16位元的顏色,四個顏色的 率從1 〇 : 1 普通品質, 缺點為,無 。另外,它 灰階的照片 其它壓縮技 整個影像, 高可靠度的 析度版的整 更高頻組件 為依據DCT 現在 JPEG • JPEG支援 的無漏失。 JPEG-LS, 具有較好的 快。相較於 性是可擴充 析度或低可 碼來取得。 頻道或組件 54 200306080 (R,G,B及alpha),其中aipha為透明的組件。在單一 的編碼解碼器(codec)中,PTC也整合無漏失與漏失的編 碼。另外’ PTC也有足夠的參考碼。這個碼具有低記憶足 跡(low memory footprint )且只用整數的算數(沒有浮 點數),作為完全的複製。 為實現ptc ’可用多解析度轉換(multi-resolution) 來達成逐漸的彩現。一種方法是用小波,但更有效的是, 以較低的運算成本而言,是用階層式重疊雙正交轉換 (hierarchical lapped biorthonognal transform, LBT)。在 PTC中新的階層式重疊雙正交轉換,利用比較小的4x4 區塊大小改善先前的PTC建構,以及整數係數—可使其運 算不須太多的乘法計算(在前p T C的架構中仍使用浮點 算數)。重暨的轉換比離散餘弦轉換(Dct,用在jpeg 與MPEG )好是因為,重疊的轉換沒有dcτ的,,塊狀人工 化效果’(blocking artifacts)。而且,由於用在PTC的LBT 為多解析度(階層的)形式,因此振铃雜訊(ringing)的人 工化效果比在DCT為主的編碼解碼器(c〇dec)較不顯著。 GIF是無漏失8位元圖素色彩(256色)的壓縮格式, 平均壓縮比為3 ·_ 1。GIF有内建的Lempel-Ziv_Welch (LZW )編碼,這便是為何它無法對照片提供高壓縮,但 可對簡單的線條繪圖提供高壓縮的原因。GIF壓縮可用在 所有種類的影像,但對只具有少許色彩的電腦圖形其效果 最好,這使它廣為應用在以網路為主的圖形上。而且,gIF 對具有尖銳邊緣之圖形影像,比jPEG的壓縮更好。 55 200306080 PNG為無漏失的格式’提供比GIF平均小10-30%的壓 縮。它在全真彩色影像上的壓縮也比JPEG好’因為它有 48位元的色彩’比JPEG的24位元色彩更妤。另外,PNG 有透明色’其壓縮為不對稱的’也就是說,其解壓縮很快 而壓縮的時間卻較長。PNG是為網際網路上的使用而設 計,所以其快速的解壓縮能力是個優點。另外,PNG是 設計要取代GIF格式的,它使用LZW碼。PNG使用免費 的Gzip壓縮架構,而非LZW碼。
圖8為依據本發明之一實施例的分割層次影像解碼系 ,统的方換闻 & °本系統接收壓縮位元,位元流或檔案,並產 ^ f新纟且合的影像。本系統包含分離器組件802,前景 解·碼器 R Λ U4,背景解碼器 806,遮罩解碼器 808,回流組 件 810 , w Ώ 以及組合器 8 1 2。 a _器組件802接收壓縮的位元,並將該位元分離以
形成則景位元流,背景位元流及遮罩位元流。分離器組件 802可利用檔頭訊息以分離位元流。前景解碼器804將前 景位70流解壓縮以產生前景影像。背景解碼器806將背 景位兀流解壓縮以產生背景影像。 遮罩解碼器808將遮罩位元流解壓縮,以產生遮罩或 遮罩影像。遮罩解碼器808可能存取佈局及/或回流(reflow )的訊息。另外,遮罩解碼器8〇8可取得重建紋理 訊息的索?丨表。就某些壓縮的架構而言(如屏蔽的小波), 前景解螞器804及背景解碼器806可從遮罩解碼器808 要·欠解壓输的遮罩,以取得前景影像與背景影像。 56 200306080
回流組件8 1 0依據所要的顯示特性操作前景影像,背 景影像與遮罩。所要的顯示特性可包括顯示頁的大小,欄 位數’ 4·體大小等等。所要的顯示特性可能與原稿的文件 影像有很大的差異。例如,文件影像可有信件大小及1 0 點的文字大小。這些文件影像的特性在顯示於標準的信件 紙上時沒有問題。然而,這些特性將難以顯示於可攜式裝 置上觀看,如個人數位助理(PDA )。PDA通常是小螢幕 且低解析度。若不用回流,PDA的使用者將得上下左右 移動才能讀取每行的文字。因此,就PDA而言,所須的 特性將為2 0欄’ 14點的文字大小等。回流組件$ 1 〇可依 據所須的特性,將文字包裹起來,重新排列段落,句子, 影像,調整影像大小,及/或執行任何其它合適的修改。 回流組件8 10利用佈局訊息,其係利用前景影像,背景 影像及/或遮罩所編碼的。
組合器8 1 2組合前景影像,背景影像及遮罩為一重新 組合的文件影像。该重新組合的文件影像與原始的文件影 像相同或逼近。另外,重新組合的文件影像可依據所須的 顯示特性而有不同的形狀及/或大小。組合器8 1 2依據遮 罩,從前景與背景影像產生用以重新組合文件影像的圖 素。該重新組合的文件影像的每個圖素,是由參考該遮罩 的相對應圖素而決定的,藉以判定該重新組合的文件影像 之圖素是否應來自前景影像或背景影像。例如,遮罩圖素 值為1者,可指示該重新組合的文件的圖素是否應來自前 景影像之相對應的圖素。另外,組合器8 1 2執行任何須 57 200306080 要的合適的色彩空間轉換。例如,重新組合 YCoCg❸色彩空間。因Λ,繼續以此例說明,組人时可用 將從YCoCg色彩空間轉換到RGB色彩空間七 812 示在螢幕上)。 σ’為了顯 編碼方法的 —位元映射 該文件影像 如YUV或 圖9為依據本發明之一實施例的文件影像 流程圖。文件影像由9〇2提供。該文件影像為 的影像並有一色彩空間代表,一般為RGB。 可從其色彩空間轉換為另一種色彩空間, YCoCg,以增加壓縮。 在904,為文件影像而產生一遮罩。該遮罩為依據文 件影像的二位元影像。該遮罩的產生以致於該文件影像可 被分割或分離成前景影像與背景影像,而使該前景影像與 背景影像的壓縮率提高。該遮罩的每個圖素用來判斷,該 文件影像相對應的圖素是否放在前景影像或背景影像。該 遮罩可以任何適合的方式產生,而使遮罩,前景影像與背 景影像的組合大小在壓縮後縮小。 該遮罩的另外處理,包含但不限於雜訊偵測,雜訊矯 正,混色偵測,及處理類似的事物,可在遮罩上執行《例 如,雜訊通常在數位化的過程中導入於文件影像中。例如, 指印及或髒東西可能無意地被含在文件影像中。雜訊可從 遮罩中找出並移除。混色為用來產生灰色或彩色的各種陰 影的影像技巧。混色改變區域中的點的百分比或比例以模 擬陰影。混色可使影像看起來的效果較好,但對數位文件 卻可能會有問題。混色會對文字,手寫字等造成誤讀。在 58 200306080 遮罩中的混色可被找出來,並適當地處理。 另外,遮罩中的叢集會被找出來。相連的 中被定義。相連的組件為一或更多個相連的黑 形成的群組,一般是黑點。類似之相連的組件 集。每個叢集在遮罩中的位置,可用位元 (Pointer )作代表。叢集的使用可減少大量 集可代表文字,手寫字等。 而且,光學文字辨識可在遮罩上實現。叢 以找出文字或字體,無論代表的是手寫字或文 識出來之後,字體可儲存為如,AScn碼,而 二間。而且,當文件影像最後被重新組合時, 識將增強回流,而使文件影像容易編輯。 遮罩也可被分析,以找出文件影像的佈局制 叢集及影像位置可被分析,以找出佈局的特性 性包含但不限於,可被定義的句子,段落,格 置,編頁碼等。佈局特性可以被附上或以遮罩 曰後使用。 在906,依據遮罩,文件影像被分割為前 景影像。例如,所有在遮罩中以、為代表的所 到前景影像,而所有以〇為代表的圖素,可到 本發明之其它實施例也可將文件影像分割成另 的層二’本發明並不限於圖9中所描述的兩層 &刖⑦於像與背景影像與該文件影像的大小才丨 ]斤、以像與月景影像具有某些尚未附予值的圖 組件在遮罩 b (dots)所 被群聚成叢 映射及指標 的空間。叢 集可被分析 字。一旦辨 省下更多的 光學文字辨 ^性。字體, 。佈局的特 式,影像位 編碼,以便 景影像與背 有圖素,可 背景影像。 外適合數目 次。 同。然而, 素。這些圖 59 200306080 素稱為孔洞,空洞及/或空區域。此孔洞的發生是因為, 與這些圖素相符合的值被設定給另一個影像。修整 (retouching)可在背景影像與前景影像上執行,以降低 在最後重新組合之影像上所產生的硬邊緣(hard edges)。 修整包含,以一些圖素擴展該前景影像與背景影像,而避 免尖銳的邊緣及/或轉接區。一般而言,修整的產生是以 遮罩來產生前景遮罩及背景遮罩,並以前景遮罩從文件影 像分割前景影像’及以背景遮罩從文件影像分割背景影 像。則景遮罩可使前景影像擴延,而背景遮罩可使背景影 像擴延。 在9 0 8,則景影像中的孔洞或空洞以不相關圖素填滿。 不相關圖素被挑選,以增加前景影像的壓縮,並在壓縮後 縮減前景影像的大小。不相關圖素可用一些合適的方法來 決定。一種方法是以文件影像的平均圖素值來填滿不相關 區域。然而’此方法可在遮罩邊緣產生鮮明的不連續性, 可能就一所給的峰值訊號至雜訊率(peak signal -to-noise ratio, PSNR)增加一所須的位元率.,並在接近遮罩 的地方產生顯著的振铃雜訊(ringing)或空區域的邊線。另 一種方式是用最接近非遮罩圖素(或相關區域)的顏色將每 個圖素著色。標準的形態演算法(m〇rph〇l〇gy alg〇rithm) 可容許對該遮罩下,對所有導向V〇ron〇i填滿(Vor〇n〇i_ filled )的空區域内的圖素,只以兩道程序來處理。然後, 當前景或背景影像被重建時,被重建的影像為低通濾,然 後已知的圖素被重建為其正確值。如果低通濾器將頻率切 60 200306080 得太低,會產生尖銳的邊緣,使得所須的位元率及接近邊 緣顯著的振鈴雜訊(RINGING)增加。另一種處理空區域的 方法是要在凸形組上投影(projection)。例如,有兩個凸 形組··符合在這些可見圖素上的輸入之影像組,以及具有 設為零的某些小波係數(wavelet coefficient )的影像組 (例如,超過某些解析度的所有高頻係數)^藉由改變在這 兩組上的投影,可以發現,與可見圖素相同的影像其壓縮 較好’因為它們具有許多零的小波係數。依據本發明之精 神其它適合的方法,也可用來填滿不相關區域。 在9 1 0,背景影像的孔洞或空洞被填不相關圖素填滿。 不相關圖素被挑選,以增加背景影像的壓縮,並在壓縮後 縮減背景影像的大小。不相關圖素可用一些合適的方法來 決定’如先前有關前景影像的描述。 ^ 个丹雨的空區域。因此 壓縮的架構,如屏蔽的小波壓縮,可 用术將前景影像及 景影像編碼而不必填滿空或不相關區域。 在9 1 2,遮罩被編碼以產生遮罩户一、 之罩位疋流。遮罩用合 的壓縮架構被編碼。壓縮架構可利用 、、里訊息及垆輩的 位元代表以改善遮罩的壓縮。另外,素卷 返半 最'集,你片、自暮 可用來將遮罩壓縮得更好。 々訊心Τ 在背景影像與前景影像上可執行额外白勺 雜訊移除及取樣縮減可在背景影像 訊移除移除或處理出現在前景影像 一般而言,雜訊是在掃描或轉換處 與前景影 與背景影 理中產生 處理。例如’ 像上執行。雜 像中的雜訊。 的。取樣縮減 61 200306080 將前景影像與背景影像的大小縮小。例如,640x480的圖 素的前景影像及背景影像可被縮小為320x240的影像。 在 914,前景影像被編碼,以產生前景位元流。前景 影像可利用許多個合適的壓縮架構來編碼。有些示範的壓 縮架構可利用在前景影像的編碼,如,PWC,PTC,JPEC, JPEG2000,PNG ’及GIF。其它的壓縮架構也可利用,仍 然符合本發明之精神。 背景影像與前景影像也可被分析,以定義定色相連的 組件,並更進一步改善前景影像與背景影像的壓縮。定色 相連組件包含複數個具有實質上相同色值(color value) 的相連圖素。定色相連組件可利用某個顏色的種子圖素來 定義,並利用演繹法以找出所有,或實質上所有的,具有 相同色彩或實質上相同色彩的相連圖素。 遮罩位元流’則景位元流及背景位元流在步驟 9 1 8被 組合,以形成一組合位元流。組合位元流也可為一個構案。 檔頭資訊可被加到組合位元流中,以包含如所使用的編 碼,索引表’符號’函式庫等等的訊息。 圖1 〇為依據本發明之一實施例的文件影像解碼的方法 流程圖。在1 〇 〇 2 ’收到位元流。該位元流為一組合位元 流,包含遮罩位元流’前景位元流’背景位元流及構頭位 元流。在讀位元流分離成遮罩位元流’前景位元 流,及背景位元流。另外’構頭訊息可被抽離出來。 在1 〇 0 6,遮罩,前景影像及背景影像分別從遮罩位元 流,前景位元流’及背景位元流中被解碼。遮罩,前景影 62 200306080 像及背景影像統稱為影像組件。遮罩,前景影像及背景影 像的解碼,是使用與其編碼壓縮架構相容的解壓縮架構。 檔頭訊息可包含此壓縮/解壓縮訊息。遮罩及/或檔頭訊息 可包含佈局訊息或怖局特性。另外,索引表,符號,及其 它的訊息可從遮罩被解碼或從檔頭訊息取得。 在1 008,提供顯示的特性。該顯示特性可被預先設定, 由使用者輸入及/或動態地決定。顯示特性包含如顯示大 小,字體大小,欄位等等的訊息。在 1010,遮罩,前景 影像與背景影像依據顯示特性被修改。影像組件被修改, 以致於當重新組合時,可與顯示特性相符合。例如,文字 在遮罩中可回流,以在窄螢幕上正確顯示,而不必上下左 右移動。 在 1 0 1 2,遮罩,前景影像與背景影像被組合以形成組 合文件影像。前景影像與背景影像依據遮罩而被組合以形 成重新組合的文件影像。該遮罩為二位元的,因此該重新 組合的文件影像的每個圖素,視該遮罩的相對應圖素而 定,從前景影像或背景影像的相對應圖素,被附予一個值。 該重新組合的文件影像與原始的文件影像相同或逼近。該 原始的文件影像為最初編碼為所收到之位元流的文件影 像。 本發明之系統或方法可利用在整個系統,以便於文字, 手寫字,圖式等的辨識及/或壓縮。而且,熟知該項技術 者將會明暸,本發明之系統及/或方法可用在許多文件影 像的應用,包含但不限於,影印,文件掃描器,光學文字 63 200306080 辨識系广’ i>da,傳真機,數位像機及/或數位攝影機。 為幸疋供本發明之其它實施例,目i玉及以下的討論將對 種可此的,合適的運算環境丨丨〗〇,提供一個簡要且概 要的描述,本發明的各種實施例可實現於其中。運算環境 1Π0/是一種可能的運算環境,不是要用來限制本發明 之運算環境。雖然本發明以上的描述是以電腦可執行的指 v來說明’可在一台或以上的電腦上執行,但本發明也可 以f他的程式模組及/或硬體及軟體的組合來實現。一般 而言,程式模組包含程序(routine),程式(pr〇grams), 組件:資料結構等,這些執行特別的工作或實現特別的抽 象資料型態。甚且,本發明 <万法可用其他的電腦系統設 定來實現,包含單一的處理器 及多處理咨電腦系統,微電 腦,大型電腦及個人電腦,掌 .^ , 7ί 旱上1计算機,微處理器為主 關裝置連在-起操作。切:所^種可用—或以上的相 散式的電腦環境,其中^ $明的貫施例也可用在分 τ某個工作是漆 遠端處理器來執行。在八 %、、汛網路相連的 π政的運I Ρ 士 於局部及遠端的記憶傲 兄中’程式模組可位 丨帘仔裝置中。 圖11顯示-種可能的硬體“、 統與方法。雖然所描述的0 a叹疋以支持在此所描述之系 何合適的運其環境皆可運疋獨立的架構’依據本發明,任 限於,獨立的,多處裡哭用。例如,運算架構包含,但不 型主機,超級電腦,數位 欢的,主從式,微電腦,大 參照圖",-示範的=比等皆符合本發明之精神。 衣兄1110 〃實現本發明之各種 64 200306080 實施例,包含電腦111 2,含有處理單元111 4,系統 體1 1 1 6,系統匯流排 1 1 1 8,搞合各種系統組件,包 統記憶體至處理單元1114。處理單元1114可為商 可用的任何處理器。雙微處理器及其他多處理器的架 也可用來作為處理單元1114。 系統匯流排11 1 8可為任何匯流排架構,包含記 匯流排或記憶體控制器,週邊匯流排及使用任何市售 流排架構的區域匯流排。系統記憶體1 11 6包含唯讀 體(ROM) 1120及隨機存取記憶體(RAM) 1122。一基 入/輸出系統(BIΟ S ),包含可幫助在電腦j丨j 2中元 間傳送’貝訊的基本程序,如在啟動時,儲存在R〇M 中。 電腦1 1 1 2可更包含硬碟i丨2 4,軟碟機丨丨2 6, 磁片1128讀取或寫至可移除式磁碟機1128,及光 83〇等,以讀取光碟片1132或從其它的光媒體讀取 入。硬碟1124,軟碟機1126,光碟機113〇分別藉 碟驅動介面1134,磁碟驅動介面1136,及光碟驅動 1138連接至系統匯流排1118。電腦ιιΐ2 一般包含 某種型態的電腦可讀取媒體。電腦可讀取媒體可為任 被電腦11 1 2存取的媒體。以下藉由例子說明,但表 限制’電腦可讀取媒體可句各雪您 迁…巴令屯細儲存媒體及通訊媒 電腦儲存媒體包含揮發性及非捏菸 κ ^ u 坎丨王汉非輝赞性,可移除及非可 媒體,以方法或資訊儲存技術所實現者,如電腦可讀 令’資料結構’程式模組或其它的資料。電腦儲存 記憶 含系 業上 構, 憶體 的匯 記憶 本輸 件之 1120 如從 碟機 或寫 由硬 介面 至少 何可 示為 體。 移除 取指 體包 65 200306080 含, 它的 或任 1112 構, 或其 資料 個訊 訊息 線媒 聲音 上的 操作 非中 何市 如滑 圖) 碟( 裝置 1152 行璋 型態 但不限於,RAM,ROM, EEPR〇M,快閃記憶體或^ 5己憶體技術’CD-ROM,DVD或其它的電磁儲存裝置, 何其它的媒體,可用來儲存所要的資訊且可被電腦 存取。通訊媒體一般建有電腦可讀取指令,資料結 t式楔組,或在調變資料訊號中的其它資料,如載^ ;匕傳輪的機制’且包含任何傳送媒體的訊號。"調變 訊號”(modulated data signal)這個詞的意思是指一 號,有一或以上的特性被設定或改變’以在訊號中將 編碼。以案㈣明’而非作為限制’通訊媒體包含有 體,如有線網路或直接有線的連線,無線的媒體,如 的,射頻的,紅外線的,及其它無線的媒體。任何以 組合也應包含在電腦可讀取媒體中。 •多程式模組可儲存在驅動器及RAM 1122中,包含 ^先1 1 40,應用程式i丨42,程式模組丨i 44,程式 斷:貝料11 46。操作系統i i 4〇在電腦j i j 2中可為任 售的操作系統。 者了將4曰令及訊息透過鍵盤1148及指示裝置, 鼠1150加到電腦1112中。其它的輸入裝置(未示於 可包含麥克風,紅外線搖控,搖桿,遊戲面版,衛星 satellite dish),掃描器,等等。這些及其它的輸入 通常透過搞合至系統匯流排1118的序列埠介面 連接到處理單元丨丨14,但可由其它介面連接,如平 ,遊戲埠,USB,紅外線介面等。螢幕1154或其它 的顯不器也可透過介面連到系統匯流排丨丨丨8,如影 66 200306080 像配接器顯示卡 1 1 5 6。除了顯示器之外,電腦通常包含 其它的週邊輸出裝置(未示於圖),如揚聲器,列表機等。 電腦 1112可用邏輯的及/或實體上連接至一或以上的 遠端電腦的網路環境操作,如遠端電腦 11 5 8。遠端電腦 115 8可為工作站,伺服電腦,路由器,個人電腦,微處 理器為主的娛樂應用,同儕裝置或其它一般的網路節點, 且一般包含許多或所有與電腦 1112相關的元件。雖然, 為了簡要說明的目的,在圖中只顯示記憶儲存裝置11 60。 所繪的邏輯連接包含區域網路11 62及廣域網路1 1 64。這 樣的網路環境常見於辨公室中,企業電腦網路,内部網路 及網際網路上。 當在區域網路環境中使用時,電腦 111 2透過網路介 面或網路卡 1 1 6 6連上區域網路 11 6 2。當在廣域網路的 環境中使用時,電腦 1112 —般包含數據機 1168,或連 上區域網路中的通訊伺服器,或用其它方法以在廣域網路 1164上建立通訊,如網際網路。數據機 1168,可為内建 或外接,透過序列埠介面 1 1 5 2連到系統匯流排 11 1 8。 在網路環境中,與電腦 111 2相關的程式模組,或其部份, 可儲存在記憶儲存裝置11 60。所顯示的網路連線只是示 意之用,也可使用電腦之間其它建立通訊連線的方法。 圖12為一示範的運算環境1200之概要方塊圖,本發 明可與之互動。運算環境 1200 包含一或以上的客戶端 1 2 1 0。客戶端 1 2 1 0可為硬體及/或軟體(如執行緒,處 理,計算裝置)。運算環境 1200也包含一或以上的伺服 67 200306080
器1 2 3 0。伺服器 1 2 3 0也可為硬體及/或軟體(如執行緒, 處理,計算裝置)。例如,伺服器 1 2 3 0可具備執行緒以 利用本發明執行轉換。客戶端 1 2 1 0與伺服器 1 2 3 0之間 一種可能的通訊為,在兩個或更多個電腦處理之間傳送資 料封包。運算環境 1200包含通訊架構 1250,可用在客 戶端 1210與伺服器 1230之間的通訊。客戶端 1210可 連到一或更多個客戶資料儲存1260,其可用來儲存對客 戶端 1 2 1 0局部的訊息。同樣地,伺服器 1 2 3 0連接一或 以上的伺服器資料儲存 1240,以儲存對伺服器 1 230局 部的訊息。
以上所述包含本發明之實施例。為描述本發明,當然 無法描述每個可能的組件之組合或方法’但熟知該項技術 者可暸解本發明有許多進一步的組合與排列。依此,本發 明希望涵蓋所有在本發明之申請範圍内及依據本發明之精 神所作的改變,修改,及變化。甚且,在此所用的”包含”, 無論是詳細說明中的或在申請專利範圍中所使用的,這個 詞的用法是如同’’至少包含’’的含意,如在申請專利範圍中 的用法一樣。 【圖式簡單說明】 圖1為一方塊圖,顯示本發明之實施例之一的被分割的影 像層編碼系統。 圖2為一圖形,顯示小波運算的一示範步驟。 圖3為一圖形,顯示當有些圖素不見時,小波運算的一示 68 200306080 範步驟。 圖4為一圖形,顯示一屏蔽的小波運算的一示範步騾。 圖5為一方塊圖,顯示本發明之實施例之一的被分割的影 像層解碼系統。 圖6顯示本發明之實施例之一的文件影像案例。 圖7為一方塊圖,顯示本發明之實施例之一的被分割的影 像層編碼系統。
圖8為一方塊圖,顯示本發明之實施例之一的被分割的影 像層解碼系統。 圖9為一流程圖,顯示本發明之實施例之一的文件編碼方 法。 圖10為一流程圖,顯示本發明之實施例之一的文件編碼 方法。 圖11為一架構方塊圖,顯示一示範操作環境依據本發明 設定的系統。 圖12為本發明之示範通訊環境的架構方塊圖。 【組件代表符號簡單說明】 ® 102: 遮罩分離器 104: 前景背景分割器 106: 遮罩編碼器 108: 前景編碼器 110: 前景編碼器 112: 組合位元 502: 分離組件 504: 前景解碼器 506: 背景解碼器 510: 組合器 508: 遮罩解碼器 601: 文件影像 610: 遮罩 611: 前景影像 69 200306080 612: 背景影像 702: 色彩空間轉換器 704: 遮罩分離器 706: 遮罩處理器組件 708: 雜訊移除 710: 混色偵測器 712: 叢集化組件 714: 光學文字辨識器 716: 佈局分析器 718: 遮罩編碼器 719: 前景背景分割器 720: 擴充組件 721: 修整組件 722: 前景圖素過遽器 724: 前景縮減組件 726: 前景編碼器 730: 背景圖素過濾器 732: 背景縮減組件 734: 背景編碼器 802: 分離器組件 804: 前景解碼器 806: 背景解碼器 808: 遮罩解碼器 810: 回流組件 812: 組合器 1110: 運算環境 1112: 電腦 1114: 處理單元 1116: 系統記憶體 1122: RAM 1120: ROM 1134: 介面 1136: 介面 1138: 介面 1156: 顯示卡 1152: 序列埠介面 1168: 數據機 1166: 網路卡 1124: 硬碟機 1126: 磁碟機 1128: 磁碟片 1130: 光碟機 1132: 光碟片 1118: 系統匯流排 1140: 操作系統 1142: 應用程式 1144: 模組 1146: 資料 1154: 螢幕 1148: 鍵盤 1150: 滑鼠 1158: 遠端電腦 200306080 1160: 記憶儲存 1210: 客戶端 1260: 客戶資料儲存 1250: 通訊架構 1230: 伺服器 1240: 伺服器資料儲存
71

Claims (1)

  1. 200306080 拾、申請專利範圍 1 · 一種文件編碼系統,至少包含: 一遮罩分離器,用以接收一文件影像,並自該文 件影像產生一遮罩,該遮罩係至少一部份藉由合併 區域的方式以文件影像的組對而產生,該文件影像 的組對至少一部份是以圖素能量的減少為依據; 一影像分割器,用以將該文件影像依據該遮罩切 割成複數個層次,該複數個層次以非二位元的格式 表示。 2. 如申請專利範圍第1項所述之文件編碼系統,上 述之複數個層次至少包含一第一影像層,及一第二 影像層,與以二位元格式表示的遮罩。 3. 如申請專利範圍第2項所述之文件編碼系統,上 述之第一影像層係為一前景影像,及上述之第二影 像層係為一背景影像。 4. 如申請專利範圍第3項所述之文件編碼系統,更 包含一遮罩編碼器,以將上述之遮罩編碼為一遮罩 位元流。 5. 如申請專利範圍第4項所述之文件編碼系統,上 述之遮罩編碼器利用一以傳真為基礎的壓縮架構。 72 200306080 6.如申請專利範圍第4項所述之文件編碼系統,上 述之遮罩編碼器利用一二階的壓縮架構。 7 ·如申請專利範圍第4項所述之文件編碼系統,更 包含: 一前景編碼器,用以將上述之前景影像從上述之 影像分割益編碼為一前景位元流;及 一务景編碼器,用以將上述之背景影像從上述之 影像分割器編碼為一背景位元流。 8 ·如申請專利範圍第7項所述之文件編碼系統,上 述之前景編碼器及背景編碼器,利用一前進式小波 轉換壓縮架構(progressive wavelet transform compression scheme) 〇 9 ·如申請專利範圍第7項所述之文件編碼系統,上 述之前景編碼器及背景編碼器,利用一前進式轉換 塵縮架構(progressive transform compression scheme ) 〇 10.如申請專利範圍第7項所述之文件編碼系統, 上述之前景編碼器及背景編碼器,利用一屏蔽的小 波塵縮架構(masked wavelet compression scheme ) 〇 73 200306080 11.如申請專利範圍第7項所述之文件編碼系統, 更包含一組合組件,用以組合上述之遮罩位元流, 上述之前景位元流及背景位元流,為一組合的位元 流0 1 2. —種文件編碼系統包含: 一遮罩分離器,用以接收一文件影像,並自該文 件影像產生一遮罩; 一修飾組件,用以定義擬似邊緣,及/或以該遮 罩擴展其前景及/或背景影像;及 一影像分割器,用以將該文件影像依據該遮罩切 割成複數個層次,該複數個層次以非二位元的格式 表示。 1 3 ·如申請專利範圍第1 2項所述之文件編碼系統, 上述之修飾組件係可依據上述之定義的擬似邊緣操 作,以產生一前景遮罩及一背景遮罩,且上述之影 像分割器利用上述之前景遮罩以取得一前景影像, 並以上述之背景遮罩取得一背景影像。 14.如申請專利範圍第12項所述之文件編碼系統, 更包含: 一遮罩編碼器,用以將上述之遮罩編碼為一遮罩 74 200306080 位元流; 一前景編碼器,用以將上述之前景影像從上述之 影像分割器編碼為一前景位元流;及 一背景編碼器,用以將上述之背景影像從上述之 影像分割器編碼為一背景位元流。 1 5 . —種文件編碼系統包含: 一遮罩分離器,用以接收一文件影像,並自該 文件影像產生遮罩,該遮罩係以二位元的格式表 示,並至少一部份藉由合併區域的方式以文件影像 的組對而產生,該文件影像的組對至少一部份是以 圖素能量的減少為依據;以及 一前景背景分割器,用以依據該遮罩,將該文 件影像切割成一前景影像及一背景影像,該前景影 像及該背景影像係以非二位元的方式表示。 1 6.如申請專利範圍第1 5項所述之文件編碼系統, 上述之遮罩的產生係用以縮小上述之遮罩,前景影 像及背景影像所組合的大小。 17.如申請專利範圍第15項所述之文件編碼系統, 上述之遮罩的產生係用以降低上述之前景影像及背 景影像之預估壓縮,該預估壓縮包含一能量變化計 算(energy variance computation) ° 75 200306080 1 8 ·如申請專利範圍第1 5項所述之文件編碼系統, 上述之前景影像包含複數個顏色,及上述之背景影 像包含複數個顏色。 1 9.如申請專利範圍第1 5項所述之文件編碼系統, 上述之文件影像包含紋理資訊。 20.如申請專利範圍第1 5項所述之文件編碼系統, 上述之文件影像包含一單頁。 2 1 ·如申請專利範圍第1 5項所述之文件編碼系統, 上述之文件影像包含手寫字。 22. —種影印機,其係應用申請範圍第15項之系 統。 23. —種文件掃描器,其係應用申請範圍第1 5項之 系統。 24. —種光學文字辨識系統,其係應用申請範圍第 1 5項之系統。 25. —種個人數位助理,其係應用申請範圍第1 5項 76 200306080 之系統。 26. —種傳真機,其係應用申請範圍第15項之系 統0 27· —種數位照像機,其係應用申請範圍第1 5項之 系統。 2 8. —種數位攝影機,其係應用申請範圍第15項之 系統。 29. —種分割的層次影像系統,其係應用申請範圍 第1 5項之系統。 3 0. —種電視遊戲機,其係應用申請範圍第15項之 系統。 3 1. —種文件編碼系統包含: 一色彩空間轉換器,用以將具有第一色彩空間的 文件影像轉換為具有第二色彩空間的文件影像; 一遮罩分離器,用以自該轉換的文件影像產生一 遮罩,該遮罩以二位元的格式表示,該遮罩係至少 一部份藉由合併區域的方式以文件影像的組對而產 生,該文件影像的組對至少一部份是以圖素能量的 77 200306080 減少為依據;及 一前景背景影像分割器,用以將該轉換的文件影 像依據該遮罩,切割成一前景影像及一背景影像, 該前景影像及該背景影像係以非二位元的格式表 示0 3 2.如申請專利範圍第3 1項所述之文件編碼系統, 上述之第一色彩空間為RGB及上述之第二色彩空 間為YUV 〇 3 3 ·如申請專利範圍第3 1項所述之文件編碼系統, 上述之第一色彩空間為RGB及上述之第二色彩空 間為YCoCg 〇 3 4. —種文件編碼系統,至少包含: 一分離組件,用以將一位元流分離成一前景位元 流,一背景位元流及一遮罩位元流; 一前景解碼器,用以將該前景位元流解碼為一前 景影像; 一背景解碼器,用以將該背景位元流解碼為一背 景影像; 一遮罩解碼器,用以將該遮罩位元流解碼為一遮 罩;及 一組合組件,用以依據該遮罩,將該前景影像及 78 200306080 該背景影像組合為一文件影像。 3 5.如申請專利範圍第34項所述之文件編碼系統, 上述之文件影像具有複數個圖素,該複數個圖素中 的每個圖素係來自包含上述之前景影像及背景影像 的一個群組。 3 6.如申請專利範圍第34項所述之文件編碼系統, 上述之文件影像係與一原始的文件影像相同。 3 7.如申請專利範圍第34項所述之文件編碼系統, 上述之文件影像係實質上與一原始的文件影像類 似0 3 8·如申請專利範圍第37項所述之文件編碼系統, 更包含一分割層文件編碼系統,以產生上述之遮 罩,前景影像及背景影像,以將該遮罩編碼為一遮 罩位元流,將該前景影像編碼為前景位元流,將該 背景影像編碼為背景位元流,以及組合該遮罩位元 流,該前景位元流,及該背景位元流為該位元流。 39. —種文件系統包含: 一色彩空間轉換器,用以轉換一文件的影像的色 彩空間; 79 200306080 、一遮罩分離器,用以自該色彩空間轉換器接收該 文件的影像,並自該文件影像產生遮罩,該遮罩係 至少一部份藉由合併區域的方式以文件影像的組對 而產生,該文件影像的組對至少一部份是以圖素能 量的減少為依據; ' 遮罩處理器組件,用以自該遮罩分離器接收該 遮罩並處理該遮罩;以及 分割器’用以依據該遮罩將該文件影像分割成 一前景影像及一背景影像。 40·如申請專利範圍第39項所述之系統,上述之遮 罩處理器組件包含一混色(dither )偵測組件,以 界定並自該遮罩移除混色。 4 1 ·如申請專利範圍第39項所述之系統,上述之遮 罩處理器組件更包含一雜訊移除組件,用以界定並 自該遮罩移除雜訊。 42·如申請專利範圍第39項所述之系統,更包含: 、叢集組件,用以自該遮罩處理組件接收該遮罩, 並判定該遮罩中連接的組件,並利用至少一種篩選 特性,以將類似的連接組件集結為叢集。 43·如申請專利範圍第42項所述之系統,更包含: 80 200306080 、、佈局組件,用以從該叢集組件接收該遮罩,並從 遠遮罩定義佈局(layout)資訊。 44_如申請專利範圍第43項所述之系統,更包含: 一遮罩編碼器,用以從該佈局組件接收該遮罩,並 將該遮罩編碼為一遮罩位元流。 45·如申請專利範圍第44項所述之系統,上述之分 割器包含一修飾組件,用以分析該遮罩及該文件影 像的擬似邊緣,並以複數個跨越該擬似邊緣的圖素 擴展别景遮罩及一背景遮罩,該前景遮罩及該背 景遮罩係依據該遮罩,該前景遮罩被該分割器用來 取得該前景影像,而該背景遮罩被該分割器用來取 得該背景影像。 46·如申請專利範圍第45項所述之系統,更包含: 一色彩連接組件,用以界定上述之前景影像及背景 影像中的色彩連接組件。 47·如申請專利範圍第45項所述之系統,更包含: 一前景編碼器,用以接收該前景影像並將該前景 影像編碼為一前景位元流; θ景編碼器,用以接收該背景影像並將該背景 衫像編碼為一背景位元流;及 81 200306080 一組合組件,用以將該遮罩位元流,該前景位元 流及該背景位元流組合成一組合位元流。 48. 如申請專利範圍第47項所述之系統,更包含一 光學文字辨識組件,用以從該叢集組件接受該遮 罩,並定義該遮罩中的字形。 49. 如申請專利範圍第48項所述之系統,更包含一 前景圖素填滿器,及一背景圖素填滿器,該前景圖 素填滿器係以不相關(don’t care)圖素將該前景影像 的不相關(don’t care)區域填滿,及該背景圖素填滿 器係以不相關(don’t care)圖素將該背景影像的不相 關(don’t care)區域填滿。 50. —種文件編碼方法,包含: 產生一文件影像的遮罩,該遮罩係至少一部份藉 由合併區域的方式以文件影像的組對而產生,該文 件影像的組對至少一部份是以圖素能量的減少為依 據;以及 分割該文件影像為一前景影像及一背景影像,該 前景影像及該背景影像係為非二位元的格式。 5 1.如申請專利範圍第50項所述之方法,更包含: 將該遮罩編碼以產生一遮罩位元流; 82 200306080 將該前景影像編碼以產生一前景影像位元流; 將該背景影像編碼以產生一背景影像位元流;以 及 組合該遮罩位元流,該前景位元流及該背景位元 流為一組合位元流。 5 2.如申請專利範圍第50項所述之方法,該遮罩的 產生係使該前景影像,該背景影像及該遮罩的能量 變化減少,該能量變化為壓縮的預估。 5 3.如申請專利範圍第50項所述之方法,更包含以 不相關(don’t care)圖素填滿前景影像及背景影像的 不相關(don’t care)區域。 54. 如申請專利範園第50項所述之方法,更包含從 上述之遮罩定義佈局資訊。 55. 如申請專利範圍第50項所述之方法,更包含從 上述之遮罩移除雜訊。 5 6.如申請專利範圍第50項所述之方法,該分割文 件影像的步驟更包含將上述之前景影像及背景影像 擴展複數個圖素。 83 200306080 5 7 · —種文件解碼的方法,至少包含: 接收一位元流; 將該位元流分成一遮罩位元流,一前景位元流及 一背景位元流; 將該前景位元流解碼為一前景影像; 將該背景位元流解碼為一背景影像; 將該遮罩位元流解碼為一遮罩;以及 依據該遮罩,組合該前景影像及該背景影像為一 重建的文件影像。 φ 5 8.如申請專利範圍第57項所述之方法,更包含提 供顯示特性。 5 9.如申請專利範圍第57項所述之方法,該顯示特 性係由使用者提供。 60. 如申請專利範圍第57項所述之方法,上述之顯 示特性係可動態設定。 _ 61. 如申請專利範圍第57項所述之方法,上述之顯 示特性係預先設定。 62. 如申請專利範圍第57項所述之方法,更包含: 依據上述之顯示特性修改上述之前景影像,背景影 84 200306080 像及遮罩。 63.如申請專利範圍第57項所谈、、 Α ^ 万法,更句本 轉換上述之重建的文件影像之色彩空間。 口 64· —種可傳送於兩個或更多個啦 的資料封包,該資料封包至少包:& 5里程序之間 與:,罩,-背景影像,及景影像相關的資 訊,孩3景影像及該前景影像依 建的文件影像。 &據孩逦罩形成一重 65· —種電腦可讀取媒體 碼系統的電腦可使用組件 一色彩空間轉換器組件 色彩空間; 係具有可應用在文件編 至少包含: 用以轉換一文件影像的 一遮罩分離器組件,用以自兮&〜、 _、 疼色彩空間轉換器組 件接收一文件影像,並產生該文杜 人件影像的遮罩,該 遮罩係至少一部份藉由合併區域的方式以文件影像 的組對而產生’該文件影像的組對至少一部份是以 圖素能量的減少為依據;以及 一分割器組件,用以自該色彩空間轉換器組件接 收該文件影像,並依據該遮罩將該文件影像分割成 一前景影像及一背景影像。 85 200306080 66.如申請專利範圍第65項所述之電腦可讀取媒 體,更包含·· 一遮罩處理器組件,用以自上述之遮罩分離器接 收該遮罩並處理該遮罩; 一叢集組件,用以自該遮罩處理組件接收該遮 罩’並定義該遮罩中的叢集;以及 一佈局組件,用以從該叢集組件接收上述之遮罩 並從上述之遮罩定義佈局資訊。 體 專 · · 請含 申包 如更 第 圍 媒 取 ±1貝 、言 可 腦 電 之 述 所 項 一遮罩編碼器組件,用以從上述之佈局組件接收 上述之遮罩,並將上述之遮罩編碼為一遮罩位元 流; 一前景編碼器組件,用以將上述之前景影像編碼 為一前景位元流; 一背景編碼器組件,用以接收上述之背景影像並 將上述之背景影像編碼為一背景位元流;及 一組合組件,用以將該遮罩位元流,該前景位元 流及該背景位元流組合成一組合位元流。 68· —種編碼系統,至少包含: 遮罩產生裝置,用以產生_文件影像的遮罩, 該遮罩係至少一部份藉由合併區域的方式以文件影 86 200306080 像的組對而產生,該文件影像的組對至少一部份是 以圖素能量的減少為依據; 一分割裝置,用以將該文件影像分割為一前景影 像及一背景影像; 一遮罩編碼裝置,用以將該遮罩編碼為一遮罩位 元流; 一前景影像編碼裝置,用以將該前景影像編碼為 一前景影像位元流; 一背景影像編碼裝置,用以將該背景影像編碼為 一背景影像位元流;以及 一組合裝置,用以將該遮罩位元流,該前景影像 位元流,及該背景影像位元流組合為一組合位元 流0 87
TW092106232A 2002-04-25 2003-03-20 Segmented layered image system TWI230516B (en)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US10/133,842 US7263227B2 (en) 2002-04-25 2002-04-25 Activity detector
US10/133,939 US7392472B2 (en) 2002-04-25 2002-04-25 Layout analysis
US10/133,558 US7164797B2 (en) 2002-04-25 2002-04-25 Clustering
US10/180,771 US7110596B2 (en) 2002-04-25 2002-06-26 System and method facilitating document image compression utilizing a mask
US10/180,169 US7120297B2 (en) 2002-04-25 2002-06-26 Segmented layered image system
US10/180,649 US7024039B2 (en) 2002-04-25 2002-06-26 Block retouching

Publications (2)

Publication Number Publication Date
TW200306080A true TW200306080A (en) 2003-11-01
TWI230516B TWI230516B (en) 2005-04-01

Family

ID=29587951

Family Applications (1)

Application Number Title Priority Date Filing Date
TW092106232A TWI230516B (en) 2002-04-25 2003-03-20 Segmented layered image system

Country Status (5)

Country Link
EP (1) EP1388815A3 (zh)
JP (1) JP4773678B2 (zh)
KR (1) KR100937542B1 (zh)
CN (1) CN100563296C (zh)
TW (1) TWI230516B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI425372B (zh) * 2009-01-15 2014-02-01 Hon Hai Prec Ind Co Ltd 圖片搜索系統及方法

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2864857B1 (fr) * 2004-01-05 2006-03-03 Canon Kk Procede et dispositif d'optimisation de la taille d'un document numerique
US7991238B2 (en) 2004-04-30 2011-08-02 Neiversan Networks Co. Llc Adaptive compression of multi-level images
US6992686B2 (en) * 2004-06-14 2006-01-31 Xerox Corporation System and method for dynamic control of file size
US8086050B2 (en) 2004-08-25 2011-12-27 Ricoh Co., Ltd. Multi-resolution segmentation and fill
US7430321B2 (en) * 2004-09-09 2008-09-30 Siemens Medical Solutions Usa, Inc. System and method for volumetric tumor segmentation using joint space-intensity likelihood ratio test
AU2004242419A1 (en) * 2004-12-21 2006-07-06 Canon Kabushiki Kaisha Analysing digital image of a document page
KR100599141B1 (ko) * 2005-05-20 2006-07-12 삼성전자주식회사 문서 압축시스템 및 그 압축방법
US7907783B2 (en) 2007-01-24 2011-03-15 Samsung Electronics Co., Ltd. Apparatus and method of matching symbols in a text image coding and decoding system
US20090303550A1 (en) * 2008-06-05 2009-12-10 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method
JP5245771B2 (ja) * 2008-12-01 2013-07-24 株式会社リコー 符号化装置、符号化方法、プログラム及び記録媒体
US8194977B2 (en) * 2008-12-09 2012-06-05 Microsoft Corporation Remote desktop protocol compression acceleration using single instruction, multiple dispatch instructions
CN101957995A (zh) * 2010-10-14 2011-01-26 华中科技大学 一种图像中关联像素点的检测提取方法及其应用
TWI508530B (zh) * 2011-10-06 2015-11-11 Mstar Semiconductor Inc 影像壓縮方法、媒體資料檔案與解壓縮方法
EP2670139A1 (en) 2012-06-01 2013-12-04 Alcatel Lucent Method and apparatus for encoding a video stream having a transparency information channel
US20140089778A1 (en) * 2012-09-24 2014-03-27 Amazon Technologies, Inc Progressive Image Rendering Utilizing Data URI Enhancements
GB2507510B (en) * 2012-10-31 2015-06-24 Sony Comp Entertainment Europe Apparatus and method for augmented reality
US9380307B2 (en) * 2012-11-19 2016-06-28 Qualcomm Incorporated Method and system for intra base layer (BL) transform in video coding
US9042649B2 (en) * 2013-09-24 2015-05-26 Konica Minolta Laboratory U.S.A., Inc. Color document image segmentation and binarization using automatic inpainting
US9633451B2 (en) * 2014-02-12 2017-04-25 Mediatek Singapore Pte. Ltd. Image data processing method of multi-level shuffles for multi-format pixel and associated apparatus
CN106709876B (zh) * 2015-08-27 2020-04-14 上海沃韦信息科技有限公司 一种基于暗像元原理的光学遥感图像去雾方法
US10015504B2 (en) * 2016-07-27 2018-07-03 Qualcomm Incorporated Compressing image segmentation data using video coding
CN109993824B (zh) * 2017-12-29 2023-08-04 深圳市优必选科技有限公司 图像处理方法、智能终端及具有存储功能的装置
CN109391787A (zh) * 2018-09-30 2019-02-26 武汉中科通达高新技术股份有限公司 文件格式、图像聚合及读取方法
CN110070483B (zh) * 2019-03-26 2023-10-20 中山大学 一种基于生成式对抗网络的人像卡通化方法
CN111666933B (zh) * 2020-06-08 2023-04-07 广东小天才科技有限公司 一种文本检测的方法、装置、电子设备和存储介质
CN111953983A (zh) * 2020-07-17 2020-11-17 西安万像电子科技有限公司 视频编码方法及装置
CN112418249A (zh) * 2020-11-18 2021-02-26 北京字跳网络技术有限公司 掩膜图像生成方法、装置、电子设备和计算机可读介质
US11721119B2 (en) * 2020-12-18 2023-08-08 Konica Minolta Business Solutions U.S.A., Inc. Finding natural images in document pages
CN114581443B (zh) * 2022-05-06 2022-08-26 中科慧远视觉技术(北京)有限公司 一种图像处理方法、装置、计算机设备和可读存储介质
CN117119119A (zh) * 2023-08-24 2023-11-24 深圳市丕微科技企业有限公司 一种图像数据的压缩传输方法、装置以及系统
CN117390206A (zh) * 2023-10-26 2024-01-12 杭州食方科技有限公司 生鲜图像存储方法、装置、电子设备和计算机可读介质
CN117593530A (zh) * 2024-01-19 2024-02-23 杭州灵西机器人智能科技有限公司 一种密集纸箱分割方法和系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2832059B2 (ja) * 1990-03-05 1998-12-02 キヤノン株式会社 カラー画像の符号化装置
JPH05276396A (ja) * 1992-03-25 1993-10-22 Toshiba Corp 画像情報処理装置
JP3733161B2 (ja) * 1995-08-01 2006-01-11 キヤノン株式会社 画像処理装置および方法
DE19615493A1 (de) * 1996-04-19 1997-10-23 Philips Patentverwaltung Verfahren zur Bildsegmentierung
KR100220582B1 (ko) 1996-05-16 1999-09-15 전주범 적응적 부호화기능을 갖는 영상 부호화기
JP3304858B2 (ja) 1997-11-28 2002-07-22 富士ゼロックス株式会社 画像送信装置および画像送信方法
US6373981B1 (en) * 1998-12-21 2002-04-16 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
JP2000184205A (ja) * 1998-12-18 2000-06-30 Fuji Xerox Co Ltd 画像形成システム及びその制御方法
JP3931468B2 (ja) * 1999-03-08 2007-06-13 富士ゼロックス株式会社 画像用領域分離装置および方法
JP3551908B2 (ja) 1999-09-24 2004-08-11 日本電信電話株式会社 背景スプライトと前景オブジェクトの分離方法、及びその装置
ATE509330T1 (de) * 1999-12-04 2011-05-15 Luratech Imaging Gmbh Verfahren zur kompression von gescannten farb- und/oder graustufendokumenten
DE19958553A1 (de) 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI425372B (zh) * 2009-01-15 2014-02-01 Hon Hai Prec Ind Co Ltd 圖片搜索系統及方法

Also Published As

Publication number Publication date
CN1458791A (zh) 2003-11-26
TWI230516B (en) 2005-04-01
EP1388815A3 (en) 2005-11-16
KR100937542B1 (ko) 2010-01-19
EP1388815A2 (en) 2004-02-11
CN100563296C (zh) 2009-11-25
JP2003348360A (ja) 2003-12-05
JP4773678B2 (ja) 2011-09-14
KR20030084591A (ko) 2003-11-01

Similar Documents

Publication Publication Date Title
TW200306080A (en) Segmented layered image system
US7376266B2 (en) Segmented layered image system
Lin et al. Compound image compression for real-time computer screen image transmission
RU2321063C2 (ru) Система и способ последовательного преобразования и кодирования цифровых данных
JP4152789B2 (ja) クラスタリングシステムおよびクラスタリング方法
US5848185A (en) Image processing apparatus and method
US8218908B2 (en) Mixed content image compression with two edge data representations
EP4052471A1 (en) Mesh compression via point cloud representation
US6608928B1 (en) Generic pre-processing of mixed raster content planes
JP2002094805A (ja) 分解画像のレイヤを生成する方法
JP2005516553A (ja) 複合文書の圧縮のためのコーダに整合したレイヤ分離
JP2005020227A (ja) 画像圧縮装置
US20060062456A1 (en) Determining regions of interest in synthetic images
US7065254B2 (en) Multilayered image file
JP2004362541A (ja) 画像処理装置、プログラム及び記憶媒体
JP3462867B2 (ja) 画像圧縮方法および装置、画像圧縮プログラムならびに画像処理装置
JP2010098743A (ja) 画像処理装置、画像読取装置、及び画像処理方法
JP7438612B2 (ja) ビデオベースのポイント・クラウド・コーディングのための高速パッチ生成
US20070165281A1 (en) Method and apparatus identifying halftone regions within a digital image
KR20030063850A (ko) 문자와 이미지가 포함된 문서의 압축, 복원 시스템 및방법
KR100495001B1 (ko) 이미지 압축 부호화 방법 및 시스템
JP2001103315A (ja) 画像符号化方法および画像符号化装置
JP2010028819A (ja) 画像処理装置、画像処理方法及び画像読取装置
JPH08186706A (ja) 画像処理装置およびその方法
JPH08298589A (ja) 写真・文書混在画像の画像処理装置

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees