TW411714B - A perceptual compression and robust bit-rate control system - Google Patents
A perceptual compression and robust bit-rate control system Download PDFInfo
- Publication number
- TW411714B TW411714B TW087116626A TW87116626A TW411714B TW 411714 B TW411714 B TW 411714B TW 087116626 A TW087116626 A TW 087116626A TW 87116626 A TW87116626 A TW 87116626A TW 411714 B TW411714 B TW 411714B
- Authority
- TW
- Taiwan
- Prior art keywords
- coefficients
- scope
- patent application
- item
- quantization
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/2662—Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Description
411734 Α7 、 Β7 五、發明說明(1) 〔發明領域〕 (請先閲讀背面之注意事項再填寫本頁) 本發明關於資料壓縮,更明確地說,關於基於知覺之 來源(例如視訊信號,靜態影像,音訊信號等)之壓縮技 術,該被壓縮源可以然後被傳送或儲存於對傳送錯誤不敏 感之機構中。 〔發明背景〕 如於先前技藝中所知,一動畫係爲暫時合成之連續靜 態影像,其係被一個個地很快投影,使得人心智上並未知 覺諸分立影像,而將之混合成一相關移動影像。這是真實 的,不論動畫是被電子傳送及儲存爲一視訊信號或在醋酸 軟片捲上。 當一動畫被數位傳送時,每一靜止影像,或"圖框" 係典型地被視訊處理系統所個別處理及傳送。例如,第1 圖描繪了一個人招手之較長連續之四個圖框。 每一圖框包含一二維陣列之棋盤形圖素,或、像素# 經濟部智慧財產局員Η消費合作社印5衣 ’其於心智上並未被解釋爲個別方塊,而是一馬賽克。於 典型視訊系統中,如於第1圖之圖框1 0 2之圖框可以構 成5 1 2乘以5 1 2之陣列。取決於系統之特定性,每一 像素可以爲黑或白,若干灰陰影之一,或者是若干色彩之 —。典型地,當每一像素爲2 n色彩之一時,其中η爲整數 ’每一像素之色彩係由π位兀所代表。因此,每圖框包含 2 6 2 ,1 4 4像素之8位元彩色系統於標稱上每圖框需 要2,097,152位元之儲存値。 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -4- A7 B7___ 五、發明說明(2) {請先閱讀背面之沒意事項再填寫本頁) 當於整體處理整個圖框係繁瑣或計算複雜時,圖框係 經常被視爲一陣列之個別方塊,每個方塊均具有一方便視 訊處理系統處理之大小。第2圖描繪第1圖之圖框1 〇 2 ,其係以已知方法被處理爲3 2乘以3 2方塊之陣列。因 此,每一方塊包含1 6乘以1 6像素之陣列。 一典型視訊處理系統每秒投射出2 4個圖框,因此, 第1圖之視訊影像每秒標稱上需要50,33 1 ,648 位元。因此,當此一視訊影像被儲存於媒體上(例如數位 影音碟片,半導體RAM等)時或被傳送於一電信通道( 例如一基本電話服務線,一 I S _ 9 5 A C D Μ A無線 電信通道等)時,因此,即使以今日標準看來,此一影像 將需要相當大頻寬。 經濟部智慧財產局員工消費合作社印製 爲了減少傳送一視訊影像所需之頻寬,一稱爲視訊壓 縮之技術已經被開發。視訊壓縮之典型形式涉及動畫補償 分立餘弦轉換(MCDCT)處理(例如MPEG)。此 類型處理之特性是一壓縮視訊信號所得位元率於上時間隨 著視訊影像成份之函數改變。例如,一圖框可能需要 2 0 0 0位元,而下一圖框可能只需要2 0 0位元。當被 壓縮視訊位元串流被即時送於頻帶寬有限電信通道上,例 如一 C D Μ A無線電信通道上,則一位元率控制機制必須 用以匹配由編碼系統所產生之位元之變化速率至電信通道 之固定容量。傳統上1這是以一F I F 0將電信通道緩衝 加以完成,該F I F 0深度係依據已知佇列理論技術加以 決定。 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -5 - 411W4 A7 · a B7 _ 五、發明說明(3) (請先間讀背面之注意事項再填寫本頁) 以定義得知,過量緩衝對電信通道引入了過量之暫時 延遲,這與即時傳送相反的。因此,用於位元率控制之另 一機制已經被開發,其避免了過量緩衝。基本上,此機制 對可以被傳送於電信通道上之每一壓縮圖框之位元數量上 設定一上限。該被稱爲 ''位元預算〃之上限係基於電信通 道之頻寬,由位元預算所容許之壓縮圖框之大小之統計資 料,經由電信通道之可接受延遲量,及排序理論,以已知 方法加以決定。每一圖框然後被壓縮,若有需要再壓縮, 直到所壓縮圖框具有較位元預算爲少之位元爲止。 第4圖繪出於先前技藝中之視訊壓縮方法等級之重要 步驟,其中倂入一基於位元預算之速率控制機制。於方法 開始前,一用以位元預算之値係被創造。 如上所述,於動畫中之每一圖框係個別被一個個地處 理,以及,隨後於步驟4 0 1中,該方法取得予以處理之 圖框。 於步驟4 0 3中,每一圖框係被使用例如已知之二維 經濟部智慧財產局員工消費合作社印製 分立餘弦轉換(DFT)所轉換成諸係數。有時,該圖框 係被一體轉換。然而,更明確地說,將整個圖框一體轉換 係複雜的,因此,該圖框係被處理爲方塊陣列,諸方塊係 被個別轉換及處理。 於步驟4 0 5中,每一轉換係數係被分成一分立値組 ,該値組跨越一可用範圍。用以跨越此範圍之値或位準數 量決定了量化器之精確度或解析度,及個別準位之大小係 被稱爲量化步階大小。量化轉換係數之目的係藉由省略較 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -6- 414714 A7 __j_B7 五、發明說明(4) (請先閱讀背面之注意事項再填寫本頁) 不能知覺到之細節,而減少於壓縮影像中之位元數量。量 化步階大小影響壓縮影像成原始影像之傳真度以及於壓縮 影像中之位元數量。事實上,量化步階大小一般被使用作 爲一參數,以犧牲傳真度,而捨去於壓縮影像中之位元數 量,作爲一速率控制機構。當量化步階大小很小時,壓縮 影像大致包含更多位元並代表一影像對於原始影像具有合 理傳真度。相反地,當量化步階大小變大時,壓縮影像大 致包含較少位元,同時,代表一影像對原始影像具有較低 傳真度。開始時,量化步階大小被設定至一預設値。 於步驟4 0 7,每一量化係數例如被以一已知之赫夫 曼碼之無損失可變長度碼加以壓縮。 於步驟4 0 9中,於被壓縮係數之位元總數係被以已 知方式加以決定。 於步驟4 1 1中,該方法決定是否所有被壓縮量化係 數之總數在位元預算內。 經濟部智慧財產局員工消費合作社印制衣 當步驟4 1 1中,位元預算未符合時,控制進行至步 驟4 1 3 ,及量化步階大小增加。當量化步階大小增加時 ,壓縮影像逼真度變差,但再壓縮影像將包含更少位元。 由步驟4 1 3中,控制進行至步驟4 0 3 ,及轉換係數使 用新量化步階大小重新量化。一般而言,經由步驟4 1 1 之環路係持續進行,直到壓縮影像滿足位元預算爲止。 當步驟4 0 9中,最後符合位元預算時,控制進行至 步驟4 1 3及壓縮影像被傳送。每一次,一壓縮影像係被 傳送以新量化步階大小,則新量化步階大小必須也被傳送 本紙張尺度適用中國國家標準(CNS)A4規格(210X 297公釐) iillU A1 ^ B7 五、發明說明(5) ,使得視訊解碼器可以知道如何適當解釋於壓縮影像中之 量化係數。 當壓縮影像及新量化步階大小被傳送於一無損耗通訊 頻道時,描述於第4圖中之壓縮技術大致上係可接受的。 相反地,當壓縮影像及量化步階大小係傳送於一有損耗通 訊頻道時,例如,一無線電信頻道時,量化步階大小於傳 送時可能錯誤。當這情形發生時,所有之後續傳送量化係 數將被視訊解碼器所誤解,直到一新量化步階被傳送並正 確接收爲止。該結果可以是一錯誤視訊信號,而保持幾個 圖框或幾秒之錯誤。 因此,有需要一位元率控制系統’其係可適用於有損 耗通訊通道上之傳送。 描繪於第4圖中之方法有另一缺點。經由步驟4 0 5 之控制環路之遞迴特性使得所處理之圖框之速率係取決於 圖框內容之本身,因此,在一給定時間內,有多少計算功 率需要以壓縮已知量之圖框,或已知量之圖框可以多快被 壓縮只可以在猜想下完成。因此,有需要一位元率控制系 統,其計算需求係可預測的。 〔發明槪要〕 本發明之一些實施例,可以壓縮一視訊信號,一靜止 影像或一音訊信號,用以傳送於易錯誤之通訊通道上,而 不必先前技藝中之一些成本及缺點。例如,本發明之一些 實施例中,並不需要改變量化步階大小,這排除了於傳送 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) ---------- -裝i I (請先閱讀背面之注意事項再填寫本頁) _ 經濟部智慧財產局員工消費合作社印製 -8- 經濟部智慧財產局員工消費合作社印*1衣 «1Τ14 A7 ____B7____ 五、發明說明(6) 時被誤傳之可能,以及,後續傳送轉換係數被接收器所錯 誤解釋之可能。 再者,本發明之一些實施例中,使用一非遞迴法,以 壓縮,將其本身借給可預測計算之需求。因爲每一圖框只 被處理一次而非遞迴,所以其於傳送圖框時,較先前技藝 爲少之即時延遲。再者,本發明之其他實施例,較壓縮處 理中各點處改變量化步階大小之技術,更能均勻地影響予 以壓縮的來源之逼真度。 於先前技藝中,於量化步階大小之增加均勻地影響了 所有轉換係數。但轉換係數之知覺有效値並不相同,因此 ,於量化步階大小之增加均勻地粗糙化高知覺有效値係數 及低知覺有效値係數。依據本發明之例示實施例中,高知 覺有效値係數係被適當地傳送或儲存,而只有所需之低知 覺有效値係數被拋棄,以確保所編碼係數滿足位元預算。 再者,本發明之一些實施例能創造一輸出位元串流, 其係完全相容於現今視訊編碼標準,例如Μ P E G, ¥ ITU η. 261及H. 26d’而大大增加了諸實施 例之實用性,同時避免了利用技術改良來進行標準轉換。 於本發明之例示實施例中可以取得之優點包含以已知 方式將一來源(例如一視訊圖框,音訊取樣等)轉換爲m 係數之步驟’其中ΠΊ係數之每一個係由已知若干位元所代 表。然後,m係數之η個係適當地被用以傳送或儲存,其 中η係數係較未使用之m- η係數有更高知覺有效値。 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -----------裝 *----- - I 訂-1 I I ---— (請先閱讀背面之注意事項再填寫本頁) -9- 經濟部智慧財產局員工消費合作社印製 «1714 ' A7 ____B7____ 五、發明說明(7) 〔圖式之簡要說明〕 第1圖描繪一人招手之動畫之四圖框之圖式。 第2圖描繪第1圖中之一圖框之圖,及其構成之3 2 乘3 2方塊陣列。 第3圖描繪第2圖之圖框之一方塊之圖式,及其構成 之1 6乘以1 6像素陣列。 第4圖描述於先前技藝中之視訊壓縮技術之重要步驟 之流程圖。 第5圖爲本發明之例示實施例之流程圖。 〔詳細說明〕 第5圖描繪本發明之例示實施例之流程圖,其係由視 訊處理系統所執行者。雖然,例示實施例包含速率控制動 畫,但對於熟習於本技藝者而言,明顯地其他實施例也能 壓縮靜止圖案及壓縮及速率控制音訊信號。 熟習於本技藝者可以知道例示實施例係特別適用以控 制壓縮視訊位元串流之位元速。熟習本技藝者可知本發明 之實施例可以創造一位元串流,其係相容於各種視訊壓縮 標準,例如 MPEG,ITU Η. 261 及 Η. 263 %=。 於步驟5 Ο 1中’因爲例不實施例視一圖框爲一方塊 陣列並個別處理每一方塊,所以,一位元預算係以已知方 式建立以用於每一方塊。當本發明之其他實施例處理圖框 爲一整體時,或巨方塊時,熟習於本技藝者可以建立用於 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) ---------- ----- -- 訂---------Μ (請先閱讀背面之注意事項再填寫本頁) -10- 經濟部智慧財產局員工消費合作社印製 411714 a7 ___B7___ 五、發明說明(8) 該圖框或巨方塊之位元預算。 於步驟5 0 2中,本發明之例示實施例一次處理動畫 之一圖框,因此,所例示實施例取得一用以處理之圖框。 依據例示實施例,每一圖框包含一陣列之2 5 6乘以 2 5 6像素,每一像素可以描述28或2 5 6色之一。再者 ,每一圖框係被創造爲1 2 8乘以1 2 8方塊之陣列’每 一方塊係包含16乘以16之像素陣列。熟習於本技藝者 可以明顯地知道如何完成及使用本發明之實施例,其中每 一圖框包含不同量之像素或方塊,或其中每一像素代表不 同量之色彩或兩者都不同。 於步驟5 0 3中,於圖框中之每一方塊係以已知方式 被轉換爲m係數之陣列。所例示實施例對每一 4乘4像素 之陣列,執行已知之分立餘弦轉換(D C T ),以創造如 於表1中所繪之1 6係數之4 X 4陣列。熟習此技藝 者將明顯可完成及使用本發明之其他實施例,其中使用不 同轉換技術。 C 1,1 C 1 2 C 1,3 C 1,4 C 2 _ 1 C 2 · 2 C Ξ · 3 C 2 4 C 3 - 1 C 3 2 C 3 · 3 C 3 * 4 C 4 ^ 1 C 4 2 C 4 · 3 C 4 4 表1 一轉換係數 於步驟5 0 5中,該1 6轉換係數之每一個均被以量 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) ------- - - - - --------訂·!-----I Μ (請先閱讀背面之注意事項再填寫本頁) -11 - 4U714 A7 B7 五、發明說明(9 ) 化步階大小以已知方法’加以量化,以創造1 6個量化係 數。開始時’量化步階大小係被設定一啓始値,其有利地 於例示實施例中保持爲常數。表2繪出表1之轉換係數被 以已知方法爲量化步階大小所量化。 Q C 1 1 Q C 1 ' 2 Q C 1 · 3 Q C 1,4 Q C 2 ' 1 Q C 2 2 Q C 2 . 3 Q C 2 4 Q C 3 1 Q C 3 . 2 Q C 3 · 3 Q C 3 . 4 Q C 4 - 1 Q C 4 2 Q C 4 3 Q C 4 4 表2量化係數 於步驟5 0 7中,m量化係數之每一個係使用已知之 無損耗變更長度壓縮碼加以壓縮,其係例如赫夫曼編碼, 以創造m二1 6之壓縮量化係數。 於步驟5 0 9中,需要以代表m= 1 6壓縮量化係數 之每一個的位元數量係以已知方式加以決定。表3列出表 ------'-------裝--- (請先閱讀背面之注意事項再填寫本頁) 位 之 數 係 化 量 縮 壓 一 每 表 代 以 要 需 及 數 係 化 量 6 1 量 之數 2 元 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -12- 411714 A7 B7 五、發明說明(1G) 經濟部智慧財產局員工消費合作社印制衣 壓縮量化係數 於壓縮量化係數中之位元數 Q C 1 . 1 2 Q C 1 2 5 Q C 1,3 3 Q C 1 4 1 Q C 2,1 3 Q C 2 . 2 2 Q C 2,3 2 Q C 2 4 6 Q C 3 . 1 3 Q C 3 2 8 Q C 3 τ 3 3 Q C 3 - 4 2 Q C 4 - 1 4 Q C 4,2 5 Q C 4 - 3 7 Q C 4 ' 4 4 表3 -每一壓縮量化係數需要之位元 於步驟5 1 1中,例示實施例依據知覺模式,基於其 知覺有效値排序1 6個壓縮量化係數。如同由熟習於此技 藝者所知’很多音訊及視覺之知覺模式。本發明之例示實 施例利用一已知模式’其中,分立餘弦轉換中之低頻係數 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) ---------------- (請先閱讀背面之注意事項再填寫本頁) '15 _ -13- 41%714 A7 ——_____B7______ 五、發明說明(11) <請先閱讀背面之注意事項再填寫本頁) 被認爲較高頻係數具有更高知覺有效値。例如,於本技藝 中所知,於表1中’轉換係數c iτ爲最高知覺有效値係 數。再者’轉換係數C i +. 2及c 2 . i係彼此具相等知覺有 效値.但較轉換係數c i , i爲少之有效値,但仍較其他剩 餘轉換係數爲高之知覺有效値。換句話說,一分立餘弦轉 換係數C i u之相對知覺有效値係相關於量i + j。 表4描繪於表2中之16個壓縮量化係數之每一個之 相對知覺有效値 1 2 3 4 2 3 4 5 3 4 5 6 4 5 6 7 表4 一知覺有效性之相對排行 經濟部智慧財產局員工消費合作社印製 依據例示實施例中,步驟5 1 1中,每一壓縮量化係 數係基於表4中之相對知覺有效値排行,而個別地依序排 列,而沒有綁帶。熟習於本技藝者可知步驟5 1 1可以發 生於步驟5 1 3前之任一時間,並只需要作一次,因爲於 壓縮進行排行不需要再改變。例如,步驟5 1 1可以發生 於步驟502之前。 例如,雖然轉換係數C ! . 2及C 2 :佔用於該列中之第 二及第三位置,但其可以被選擇爲第二或第三。表5繪出 依據本發明之實施例之1 6個壓縮量化係數之排行。熟習 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -14- 經濟部智慧財產局員工消費合作社印製 «1714 A7 ___B7______ 五、發明說明(12) 於本技藝者可知其他相符於表4中之相對排行之絕對排行 係可接受的。 1 3 6 10 2 5 9 13 4 8 1 2 15 7 11 14 16 表5 -知覺有效値之絕對排行 例如表6爲轉換係數之另一絕對排行,其係於表4之 絕對排行內。 1 2 6 8 3 4 7 12 5 9 13 14 10 1 1 15 16 表6 -知覺有效値之另一絕對排行 組合表3及表5產生表7,其中係爲1 6個壓縮量化 係數及係數編碼之位元數量係由表5中之知覺有效値加以 排列。 ------\-------裝--------訂. (請先閱讀背面之注意事項再填寫本頁) 本紙張尺度適用中國國家標準<CNS)A4規格(210 X 297公釐) -15- __411714五、發明說明(13) 經濟部智慧財產局貝工消費合作杜印製 壓縮量化係數 於壓縮量化係數中之位元數 Q C ! . ! 2 Q C 2 1 3 Q C 1 . 2 5 Q C 3 - 1 3 Q C 2 2 2 Q C 1 · 3 3 Q C 4,1 4 Q C 1 . 2 8 Q C 3,3 2 Q C 1 4 1 Q C 4 . 2 5 Q C 3 3 3 Q C 2 4 6 Q C 4 _ 3 7 Q C 3 - 4 2 Q C 4,4 4 表7 -(以知覺有效値排列)之壓縮量化係數 於步驟5 1 3中,1 6壓縮量化係數中之η個被 使用(即被傳送或儲存),以便不超出用於該來源物件之 位元預算。該η個壓縮量化係數係由m壓縮量化係數之中 加以選擇,使得:(1 ) η個壓縮量化係數係較所有m - 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐〉 -------------裝--------訂· (請先閱讀背面之注意事項再填寫本頁) -16 - 經濟部智慧財產局員工消費合作社印製 411Τ14 Α7 Β7 五、發明說明(14) η個未使用之壓縮量化係數有更高知覺有效性,及(2 ) η個壓縮量化係數總數上需要較位元預算爲少之位元》 例如’當位元預算爲4 5位元時,於表7中之使用 4 1位元之前1 2個壓縮量化係數係被使用,因爲它是使 用較位元預算爲少之位元的最高數量之最高有效値係數。 剩下4個壓縮量化係數被拋棄。 於步驟5 1 5中,η個被使用壓縮量化係數係被已知 方式所適當地傳送或儲存。 於步驟5 1 5後,控制回到步驟5 0 1 ,其中處理重 覆進行。因爲依據本例示實施例中,量化步階大小未改變 ’所以於壓縮影像中並不需要將其傳送或儲存。因此,速 率控制演繹法可以一圖框一圖框地改變η(編碼量化係數 之數量)’但量化器步階大小保持不變。於此之重大差別 是於η中之變化並不需要明確地送至解碼器,因爲位元串 流語法本身指示每一編碼方塊之結束,而於量化器步階大 小之變化並不需要傳送給解碼器。因此,例示實施例於易 錯誤通道中,明顯優於先前技藝,於該通道中,量化步階 大小之傳送可以遺失。 應了解的是,上述實施例只作本發明之例示,其他很 多變化可以在不脫離本發明之範圍下由熟習此技藝者導出 。因此,這些變化係想要包含於以下申請專利範圍及其等 效之範圍內。 本紙張尺度適用中國國家標準(CNSXA4規格(210 X 297公釐) -17- --------1 --- I ! I--訂·--I---1 I Μ (請先閱讀背面之注意事項再填寫本頁)
Claims (1)
- Α8 Β8 C8 D8 «1714 六、申請專利範圍 1 .—種方法,包含: 將一來源轉換爲ra係數,其中m係數之每一個均被一 位元數所代表:及 使用m係數之η個,其中該η係數係較m— η個未使 用之係數,具有較高知覺有效値。 2 .如申請專利範圍第1項所述之方法,更包含將該 m係數以一量化步階大小加以量化。 3 .如申請專利範圍第1項所述之方法,其中上述之 轉換步驟更包含將該來源以一分立餘弦轉換加以轉換之步 驟。 4 .如申請專利範圍第1項所述之方法,其中上述之 來源代表一聲音信號。 5 .如申請專利範圍第1項所述之方法,其中上述之 η係數係由總數少於b位元所代表。 6 . —種用以將一來源轉換爲m係數之設備,其中該 m係數之每一個係由一位元數所代表,其特徵在於 m係數之η個被使用,其中η係數係較m — η個未使 用係數具有更高之知覺有效値。 7 .如申請專利範圍第6項所述之設備,其中上述之 轉換步驟更包含將該來源以一分立餘弦轉換加以轉換之步 驟。 8 .如申請專利範圍第6項所述之設備,其中上述之 來源代表一聲音信號。 9 .如申請專利範圍第6項所述之設備,其中上述之 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) ---------------裝·------—訂---------〆> (請先閱讀背面之注意事項再填寫本頁> 經濟部智慧財產局員工消費合作社印製 -18- 經濟部智慧財產局員工消費合作社印製 ^1ίΊί4 I _ D8 六、申請專利範圍 η係數係被儲存於一非揮發性媒體中。 1 0 .如申請專利範圍第6項所述之設備,其中上述 之η係數係由總數少於b位元所代表。 1 1 種方法,包含: 建立一位元預算; 將一來源轉換爲m係數; 以一量化步階大小,來量化該m係數,以創造m個量 化係數; 將該m個量化係數壓縮,以創造m個壓縮量化係數, 其中m個壓縮量化係數之每一個係由一位元數所代表; 以知覺有效値來排列該m個壓縮量化係數;及 使用m個壓縮量化係數之η個,其中該η壓縮量化係 數係較未使用之m - η壓縮量化係數具有更高之知覺有效 値,及其中該η個壓縮量化係數消耗較位元預算爲少之位 元。 1 2 .如申請專利範圍第1 1項所述之方法,其中上 述之來源代表一 2維影像及該轉換步驟包含將該來源以一 2維分立餘弦轉換來轉換之步驟。 1 3 · —種用以控制被傳送信號之位元率之方法,該 傳送信號代表一圖框,該方法包含: 建立用於一方塊之位元預算,其中該方塊係該圖框之 至少一部份; 將該方塊轉換爲m個係數; 以一量化步階大小來量化該m個係數,以創造m個量 本紙張尺度適用中國國家標準(CNS)A4規格(210 x 297公釐) ------;-------I----*----訂--I----!〆 (锖先閱讀背面之注意事項再填寫本頁) -19- 4A8B8C8D8 經濟部智慧財產局員工消費合作社印製 六、申請專利範圍 . 化係數: 壓縮該m個量化係數,以創造m個壓縮量化係數;及 傳送該m個壓縮量化係數之η個,其中該η個壓縮量 化係數係較m~ η個未使用之壓縮量化係數具有更高知覺 有效値,及其中該η個壓縮量化係數總數需要較位元預算 爲少之位元。 1 4 .如申請專利範圍第1 3項所述之方法,更包含 放棄該m_ η個未使用之壓縮量化係數之步驟。 1 5 _如申請專利範圍第1 3項所述之方法,其中上 述之方法爲動畫補償分立餘弦轉換視訊處理系統之一部份 〇 1 6 . —種視訊處理系統,用以控制代表一壓縮動畫 之傳送信號之位元率,其特徵在於: 一位元預算係被建立用於一方塊,該方塊係爲一圖框 之至少一部份, 該方塊係被轉換爲m個係數; 該m個係數係以一量化步階大小加以量化,以創造m 個量化係數; 該m個量化係數係被壓縮以創造in個壓縮量化係數; 及 該m個壓縮量化係數之η個係被傳送,其中n個壓縮 量化係數係較m - η個未使用之壓縮量化係數具有較高知 覺有效値,及其中該η個壓縮量化係數總數需要較位元預 算爲少之位元。 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) ------1------i ------- I 訂·--II----〆 (請先閱讀背面之注意事項再填寫本頁) -20- mm AS B8 C8 D8 t、申請專利範圍 1 7 .如申請專利範圍第1 6項所述之深-ra 1 ;;' _:\ 方塊係被以分立餘弦轉換加以轉換。 1 8 .如申請專利範圍第1 6項所述之, 個壓縮量化係數係儲存於非揮發媒體中。 _其中該 其中η ------I-------裝—— (請先閱讀背面之注意事項再填寫本頁) I . 經濟部智慧財產局員工消費合作社印^J 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -21 -
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/961,624 US6185253B1 (en) | 1997-10-31 | 1997-10-31 | Perceptual compression and robust bit-rate control system |
Publications (1)
Publication Number | Publication Date |
---|---|
TW411714B true TW411714B (en) | 2000-11-11 |
Family
ID=25504764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW087116626A TW411714B (en) | 1997-10-31 | 1998-10-07 | A perceptual compression and robust bit-rate control system |
Country Status (6)
Country | Link |
---|---|
US (1) | US6185253B1 (zh) |
EP (1) | EP0914006A3 (zh) |
JP (1) | JPH11289535A (zh) |
KR (1) | KR100383684B1 (zh) |
CA (1) | CA2250284C (zh) |
TW (1) | TW411714B (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1051853B1 (en) * | 1998-01-26 | 2003-06-18 | STMicroelectronics Asia Pacific Pte Ltd. | One-pass variable bit rate moving pictures encoding |
US6822978B2 (en) * | 1999-05-27 | 2004-11-23 | Spectra Physics, Inc. | Remote UV laser system and methods of use |
TW499672B (en) * | 2000-02-18 | 2002-08-21 | Intervideo Inc | Fast convergence method for bit allocation stage of MPEG audio layer 3 encoders |
US6832006B2 (en) * | 2001-07-23 | 2004-12-14 | Eastman Kodak Company | System and method for controlling image compression based on image emphasis |
US6810083B2 (en) * | 2001-11-16 | 2004-10-26 | Koninklijke Philips Electronics N.V. | Method and system for estimating objective quality of compressed video data |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7418037B1 (en) * | 2002-07-15 | 2008-08-26 | Apple Inc. | Method of performing rate control for a compression system |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
US7564874B2 (en) | 2004-09-17 | 2009-07-21 | Uni-Pixel Displays, Inc. | Enhanced bandwidth data encoding method |
US7747095B2 (en) | 2004-10-08 | 2010-06-29 | Nvidia Corporation | Methods and systems for rate control in image compression |
US7974193B2 (en) | 2005-04-08 | 2011-07-05 | Qualcomm Incorporated | Methods and systems for resizing multimedia content based on quality and rate information |
US7831434B2 (en) | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US8792555B2 (en) * | 2006-01-31 | 2014-07-29 | Qualcomm Incorporated | Methods and systems for resizing multimedia content |
US20070201388A1 (en) * | 2006-01-31 | 2007-08-30 | Qualcomm Incorporated | Methods and systems for resizing multimedia content based on quality and rate information |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
CN101340571B (zh) * | 2008-08-15 | 2012-04-18 | 北京中星微电子有限公司 | 一种码率控制方法及控制装置 |
US9185424B2 (en) * | 2011-07-05 | 2015-11-10 | Qualcomm Incorporated | Image data compression |
KR20140090999A (ko) | 2011-10-14 | 2014-07-18 | 어드밴스드 마이크로 디바이시즈, 인코포레이티드 | 영역-기반 이미지 압축 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2811369B2 (ja) * | 1989-01-27 | 1998-10-15 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 高品質オーディオ用短時間遅延変換コーダ、デコーダ、及びエンコーダ・デコーダ |
EP0535272A1 (en) * | 1991-10-02 | 1993-04-07 | Alcatel N.V. | Hybrid encoder arrangement for an image processing system |
KR100287494B1 (ko) * | 1993-06-30 | 2001-04-16 | 이데이 노부유끼 | 디지탈신호의부호화방법및장치,복호화방법및장치와부호화시킨신호의기록매체 |
US5684920A (en) * | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
JPH07322252A (ja) * | 1994-05-23 | 1995-12-08 | Canon Inc | 画像符号化装置 |
JP3307138B2 (ja) * | 1995-02-27 | 2002-07-24 | ソニー株式会社 | 信号符号化方法及び装置、並びに信号復号化方法及び装置 |
DE69629986T2 (de) * | 1995-07-27 | 2004-07-15 | Victor Company of Japan, Ltd., Yokohama | Verfahren und Gerät zum Kodieren digitaler akustischer Signale |
US5801779A (en) * | 1995-12-26 | 1998-09-01 | C-Cube Microsystems, Inc. | Rate control with panic mode |
US5929916A (en) * | 1995-12-26 | 1999-07-27 | Legall; Didier J. | Variable bit rate encoding |
US5731835A (en) * | 1996-02-26 | 1998-03-24 | David Sarnoff Research Center, Inc. | Dynamic coding rate control in a block-based video coding system |
-
1997
- 1997-10-31 US US08/961,624 patent/US6185253B1/en not_active Expired - Lifetime
-
1998
- 1998-10-07 TW TW087116626A patent/TW411714B/zh not_active IP Right Cessation
- 1998-10-14 CA CA002250284A patent/CA2250284C/en not_active Expired - Fee Related
- 1998-10-19 EP EP98308536A patent/EP0914006A3/en not_active Withdrawn
- 1998-10-30 KR KR10-1998-0046021A patent/KR100383684B1/ko not_active IP Right Cessation
- 1998-10-30 JP JP10309314A patent/JPH11289535A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CA2250284C (en) | 2002-03-05 |
EP0914006A2 (en) | 1999-05-06 |
KR19990037507A (ko) | 1999-05-25 |
US6185253B1 (en) | 2001-02-06 |
JPH11289535A (ja) | 1999-10-19 |
CA2250284A1 (en) | 1999-04-30 |
EP0914006A3 (en) | 1999-12-01 |
KR100383684B1 (ko) | 2003-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW411714B (en) | A perceptual compression and robust bit-rate control system | |
KR100303054B1 (ko) | 정지영상과동영상부호화를위한양자화매트릭스 | |
RU2127962C1 (ru) | Способ и устройство для кодирования изображения | |
US8565298B2 (en) | Encoder rate control | |
US7016545B1 (en) | Reversible embedded wavelet system implementation | |
US20120287992A1 (en) | Method and apparatus for coding image information, method and apparatus for decoding image information, method and apparatus for coding and decoding image information, and system of coding and transmitting image information | |
US6330369B1 (en) | Method and apparatus for limiting data rate and image quality loss in lossy compression of sequences of digital images | |
JPH08256335A (ja) | 量子化パラメータ決定装置及び方法 | |
KR100317792B1 (ko) | 가역임베디드웨이블릿을이용한데이터압축/복원장치및방법 | |
US7212680B2 (en) | Method and apparatus for differentially compressing images | |
JP2003061093A (ja) | 能動的テーブル生成による量子化/逆量子化方法および装置 | |
EP0699003A1 (en) | Method and device for encoding image signal | |
JPH0879537A (ja) | 画像情報符号化処理装置及び画像情報通信装置 | |
JP2000307879A (ja) | カラー画像通信方法およびカラー画像通信装置 | |
US20090074059A1 (en) | Encoding method and device for image data | |
EP0998818B1 (en) | A method in compression coding | |
de Queiroz et al. | Fast JPEG encoding for color fax using HVQ | |
Novosel et al. | Still image compression analysis | |
JPH0799577A (ja) | 画像圧縮装置 | |
JP2004304589A (ja) | 画像符号化装置及び画像符号化方法 | |
JPH06205401A (ja) | リーク予測方式による量子化方法 | |
JPH08263645A (ja) | デジタル複写機 | |
AU2004218686A1 (en) | A Combined Spatial and Transform Domain Method for Compressing Image Data into a Fixed Size Buffer | |
JP2005534222A (ja) | デジタルビデオ信号を符号化する方法及びエンコーダ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MM4A | Annulment or lapse of patent due to non-payment of fees |