TW404132B - A real-time single pass variable bit rate control strategy and encoder - Google Patents

A real-time single pass variable bit rate control strategy and encoder Download PDF

Info

Publication number
TW404132B
TW404132B TW087110219A TW87110219A TW404132B TW 404132 B TW404132 B TW 404132B TW 087110219 A TW087110219 A TW 087110219A TW 87110219 A TW87110219 A TW 87110219A TW 404132 B TW404132 B TW 404132B
Authority
TW
Taiwan
Prior art keywords
frame group
bits
patent application
scope
item
Prior art date
Application number
TW087110219A
Other languages
English (en)
Inventor
Nader Mousenian
Original Assignee
Ibm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibm filed Critical Ibm
Application granted granted Critical
Publication of TW404132B publication Critical patent/TW404132B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Description

第87110219號專利申請案 中文說明書修正頁(89年5月) A7 五、發明説明( 21 B7^04132 一種技術,用以調變K,並估計待分配給每一G〇p的位元 數。將此種即時單一掃描VBR架構稱為學習程序,因為該 架構在進行中學習某些資訊。下文中將參照圖4而說明一學 習程序實施例: 1.以P代表重元組(tuple)所界定的一經先前編碼之幻像·在 步驟(400)中,Z0的典型值為108,且N。的典型值為114。 N.
g〇P set ζϋ·- Σ
Ng〇p~i k=o and nq and 9〇P' 广请先st#背面之注意事項#填寫本莨) 一装· 2.在步驟(402)中,啟動VBR速率控制技術,使用諸如一 CBR MPEG-2編碼器,而在f.^〇p的速率下將輸入影像 流的前兩個GOP(亦即%及5〇編碼。f 的標稱值應 對應於使用者所設定的VBR影像流之平均速率。 J .在將S k ·,編碼之後,在步驟(4 〇 4)中更新各參數。例如, 將代表編碼困難度量測值總和的z k及作為調整後G 〇 p數 的〜更新如下:Zk = Zk 1+ r F(Qk i aetuai),Nni + γ,其中r是學習演算法的更新速度(例如τ=2 〇)。此 外,並計算Cu actual及總和Σ爲Cj。 (a) 如果(k -丨=〇) ’則將k遞增1,並回到步驟3。 (b) 否則,根據方程式(1 〇)中所界定的預測模型而計算諸 如fk及??(:等的其他參數。 4.在步驟(404)中,利用步驟3之總和項以決定預定位元數中之 剩餘位元Ru〇t。例如,以Rt〇t減掉Σ爲c ],而得到R _。 -24- 本紙張尺度_中ΐ國家鮮(⑽( 21GX297公缝 訂 線 經濟部中央標準局員工消费合作社印製 404.32 at -----------------B7 五、發明説明(1 ) 技術領域 本發明係大致有關數位影像壓縮毛一領域,尤係有關適於 在—個採用MPEG-2國際標準的影像壓縮系統、中進行即時 單掃為可變位元傳送速率编碼之途率控制技術。 $景技術 一在諸如廣播電視、通訊網路、消費電子、及多媒體電腦 等行業中,各種數位影像技術已以愈來愈快的速率出現。 由於數位資訊的信號處理、編輯、及資料轉移在執行相同 工作上,比以類比形式執行容易許多,所以激發了各種應 用的廣泛使用。但更重要的是:數位影像的廣泛流行係歸 因於在最近幾年已爲數位影像壓縮創造了數種標準。 數位影像壓縮的解決方案大概是任何數位影像平台的最 重要组成郅分。因爲我們知道數位影像在未經壓縮的格式 下包含了巨量的資訊,所以此種格式的數位影像之操縱、 儲存、及傳輸即使不是不可能,也是相當耗時且成本昂貴 的。因此’需要以數位影像壓縮技術減少巨量的資料,並 同時保有其内谷的收視品質。然後利用相容的影像解壓縮 架構將資料解壓縮,以供播放。 由移動影像專家群(Moving Pictures and Expert Group)提 出的MPEG-2國際標準意圖滿足上述各業界之壓縮需求, 而 MPEG-2 國際標準係述kIS0/iec 13818_2之„Inf〇rmati〇n technology-Generic coding of moving pictures and associated audio information: Video, 1996”,本發明特此引用該文件之 全文以供參照。該標準規定了编碼影像流之語法、及解碼 -4-
. 复-----1TL _ *~ ί請先閱讀背面之注意事項再填寫本頁J
本纸張尺度適州中园國家標準(CNS ) A4規格(210X297公釐) J A7 A7 B7 4*413^ 五'發明説明(2 技術。該標準提供了較大的彈性給編碼器設計者,使設計 者可以衍生其自己的一组壓縮參數,因而可以使該設^者 的產品與其他製造商開發的其他產品有所區隔。 經由固定通訊頻寬傳送的或一數位媒體所儲存I影像之 收視傳眞度與MPEG-2編碼系統的效率有關。對於諸如數 位衛星系統中的某些應用而言,係爲了廣播而將多個節目 多工化成單-大型影像流,且使用了 — Mmpeg_2編碼器 對所有的節目進行監視及編碼,並同時保持所有接收頻道 的收視品質。係經由一固定通訊頻寬或非同步傳輸模式 (Asynchronous Transfer Mode ;簡稱 ATM)網路中之動態頻 ^ 而傳送MPEG-2影像流。對於儲存媒體容量有限的家用视 訊或個人電腦等應用而言,使用者可能想要儘量累積更多 =資訊,JL 一個有效率的編碼器在這些情形+的確是有利 所開發的大部分MPEG_2编碼器是在固定位元傳送率 (C〇Stant Bit Rate;簡稱CBR)模式下執行,在模 式中’影像流的平均速率自開始到結束幾乎都是相同的二 -影像流複數個各種類型的影像或圖框如叫,例如卜 =及P型影像。-個影像由於其類型的不同,可能耗用比 β像流的設定目標速率更多或更少的位元。CBR速率控制 策略之責任在於爲影像流的不同影像類型維持—位元: 像=而滿足所需的平均位元傳送速率,並顯示高品質的影 包括其他MPEG-2編碼器的其他編碼器係在作爲一可變 本紙張尺度適用中囤囤家標準(CNS ) A4規格(2Ι〇χ297公釐 --------^—— .-V f靖先閱讀背面之注意事項再填寫本頁)
、1T ---4Ml32_____ 五、發明説明(3 ) 位凡傳送速率(Variable Bit Rate;簡稱VBR)模式的不 同模式下執行。可變位&像送速率编瑀可盞!過路縮的每 景夕像根據影像内(intra-picture)壓縮及影像間(inter-picture) 壓縮特性之複雜性,而具有不同的位元數。例如,對影像 内今較簡單的場景(例如彩色檢驗圖)编碼時’所耗用的位 凡將遠少於影像内容較'複雜的場景(例如人群擁擠的市區街 道)’即可得到相同的影像品質。 因爲將影像特徵化所需的資訊量、及解譯該資訊以便有 效地強化编碼程序所需演算法之複雜性,所以傳統上係以 非即時而使用兩次或更多次程序掃描(pass)之方式完成 VB R編碼。在第一次掃描中,執行编碼,並搜集且分析統 <>十資料,且在第二次掃描中,利用分析的結果來控制編碼 程序。雖然此種方式產生了經過壓縮的高品質影像流,但 是也無法進行即時作業,也無法進行單一掃抬编碼。 因此,目前需要一種可提供高品質影像的即時單—择描 可變位元傳送速率编碼架構。也需要一種易於以硬體實施 的即時單一掃描可變位元傳送速率編碼架構。 發明概述 由於提供了一種處理圖框群的方法,而克服了習用技街 的缺點’並提供了額外的優點。該方法包含諸如下列步樣 :將一輸入影_像_^的至少一個圖框群编碼;以及在對整個 輸入影像流编碼之前,先決定待分配給該輸八影像流的另 一囷框群之位元數。將在可變位元傳送速率模式下對另— 圖框群編碼。該決定步驟使用了得自該編碼的一個或多個 ^紙張尺度適;則,國囤家標苹(CNS ) A4規格(210X297公釐) m I...... n I · I- I- - —I— I I , m''. In - XV Kw U3. s 、T • i * • · (請先閲讀背面之注意事項再填巧本頁) 紂浐部中呔"^Γ^Βτ·"·於合竹衫卬?i __ 404132^_Βτ_ 五、發明説明(4 ) 參象ϋ » 在本發明的另一實施例中,該方法包冬下丨于㉗.二^ 單-掃描可變位元傳送速率模式下將另—圖框群编碼,其 中只在一次编碼掃描下將另一圖框群編碼。 在本發明的又一實施例中,該決定步驟包含下列步驟: 爲另一圖框群將一預定感知函數之斜率調變;以及柬該經 過調變的斜率用於一位元傳送速率方程式,以便決定待分 配的位元數。 在又一實施例中,該決定步驟包含下列步驟:爲另—圖 框群決定一預定感知函數之以及將該轉換因數 用於一位元傳送速率方程式,以便決定位元數。 在本發明的又一實施例中,該击螂包含下列步祿· 補償該輸入影像流的一個或多個不穩定狀況。且在另—實 施例中,該決定步驟包含下列步驟:利用一預定函數決定 位元數。 在本發明的又一面向中,提供了 —種處理1框群之方法 。該方法包含諸如下列步驟:利用—個或多個先前編碼的 圖框群決定複數個參數値;在一單一掃描可變位元傳送速 率模式下,爲所要編碼的的一圖框群計算一預定函數之— 斜率,其中該計算步驟使用該等複數個參數値中之—個或 多個參數値;以及利用所計算出的斜率、及慈等複數個參 數値中之一個或多個參數値,取得所要编碼的圖框群之位 元傳送速率。 在本發明的另一面向中,提供了—種處理圖框群之方法 -7- 本紙張尺度適财1^|:標率(CNS ) Μ規格(2丨〇'χ 297公楚) --- --------‘裝——.^丨^__訂Κ——_---^ ·' (請先閱讀背面之注意事項再填寫本頁} A7 B7 404132 五、發明説明(5 ) 。該方法包含諸如下列步驟··決定待分配給一輸入影像流 的一圖框群之位元數》該決定步驟使用該圖框群的一瞬時 速率量化狀態、及一個指示該圖框群的複雜性之感知模型 。該方法又包含下列步驟:在該決定步驟所界定的一速率 下,使用一可變位元傳送速率模式將該圖框群編碼。 在本發明的又一面向中,提供了一種單一掃楛可變位_立 傳送速率编碼^器^該编碼爲包全諸如_ :一個適於將一輸入 影像流的至少一個胤jg群編碼才編碼引擎;以及決定裝置 ’該決定裝置在辦> 整個餘込;_影像流编碼之前,先決定待分 配給該輸入影像流的另一圖框群之位元數。係在一可變位 元傳送速率模式下將另一圖枢群编碼。該決定裝置使用得 自該编碼引擎的一個或多個參數値。 在本發明的又一面向中,提供了一種單一掃描可變位元 傳送速率編碼器,該編碼器包含諸如:決定裝置,用以決 定一個或多個先前編碼的圖框群之複數個參數値;身算裝 置,該計算裝置爲將在一單一掃描可變位元傳送速率模式 下編碼的一圖框群計算一預定函數的一斜率,其中使用了 該等複數個參數値中之一個或多個參數値;以兵^得褽I ,該取得裝£利用料算㈣斜率、及㈣複數個參數値 中之一個或多個參數値,取得所要編碼 送速率。 在本發真的又二冬崎Ρ提供了—料—掃描可變位 凡傳运速率編碼器,該編碼器包含諸如:決^裝置,用以 決定待分配給-輸人影像流的—圖框群之位元數,其中兮 表纸張尺度通州中囤國家標卒(CNS ) Α4規格( --------Τ 裝--.--*---訂 h------4 te » !···". (锖先閱讀背面之注意事項再填寫本頁) 的圖框群之位元傳 210X297 公釐) 經米部中次ir.5r^’.il-T消於合竹·^印5'! A7 ----------ΜΛ1Ά2__ 五、發明説明(6 ) 決定裝置使用該圖框群的一瞬時速率屢旨 不該圖框群的複雜性之感知模型;以及—編碼引擎,該编 碼引擎適於在該決定裝置所界定的一/途率下Λ使用一可變 位元傳送速率模式將該圖框群編碼。 本發明特別適用於無法對影像進杆預丰分柄蛊葙丰瑞碼 的應用,例如在家中進行數位影音光碟(Digital video Disk ’ 痛% DVD)、數位舞影機(Digital Video Cassette Recorder;簡稱DVCR)、電腦多媒體、及數位攝錄機節目的 製作。一單一掃描VBR編碼器只使用先前编碼的影像,即 可估計所要編碼的一影像之複雜性。此種方式與用於高階 DVD母盤製作的多次掃描vbr影像壓縮不同,在後一種方 式中可對一影像來源進行數次的預先編碼及預先编碼,以 便爲一特定的儲存媒體產生一最佳的經過壓縮之影像流。 因此,一單—掃描VBr編碼器依賴一因果預測模型,而動 態地碉整影像流的平均速率,並產生高傳眞的影像。 經由本發明的揭示事項將實現額外的特徵及優點。下文 中將詳述本發明的其他實施例及面向,並將這些實施例及 面向視爲本發明申請專利範圍之一部分。 附圖簡述 將在本説明書結尾的申請專利範圍中特別指出並明確主 張被視爲本發明的主題。若參照下文中之詳細説明並配合 各附圖’將可易於了解本發明的前述及其他的目的、特徵 、及優點,這些附圖有: 圖1是設有並使用本發明的即時單一掃描可變位元傳送速 (請先閱讀背面之注意事項再填寫本再) -裝. 、1Τ -9- ---- A7 B7 好"‘部中次"^^h-Tivi於A::竹.71卬;^ 404132 五、發明説明( 率控制策略的—MpEG-2編碼器實例之方塊圖; 圖2是P及B影像類型的移動估計工作實例之方塊圖; 囷3示出本發明的可變位元傳送速率㈣技術之模型 及作用點實例; 圖4 π出與根據本發明的原理而估計待分配給一影像群 (Group Of Pieture;簡稱㈣)的位元數相關聯之一邏 輯實施例; 圖5是本發月的—可變位元傳送速率控制策略實施之 塊圖; 、圖6示出與根據本發明的原理而估計待分配給—影像群的 位凡數相關聯之另—邏輯實施例; 圖7示出本發明的另—可變位元傳送速率控制技術之〒 模型及作用點實例; 圖8示出於-換景時使用本發明之中心値餘技術之— G 0 Β位元調整實例;以及 圖9示出根據本發明的原理而進行速率控制不穩定性之一 G Ο Ρ位元調整實例。 f施本發明之最佳禮式 根據本發明的原理’提供了 一種即時即時單一掃 位4送速率(VBR)編碼之速率控制策略,易於以硬體實 =種控制策略,並可在諸如任何MpEG_2壓縮系統 用此種控制策略。 _ MPEG-2編碼器(! 00)的塊圖實例係示於圖l。圖1 、、出編碼器用來將_影像流編碼並將經過壓縮的影 •10· 本纸狀度iii则’關( CNS ) A4)tm ( 210X29TS7 (請先閱讀背面之注意事項再填寫本頁)
_____404132 b7 五、發明説明(8 ) 像流解碼之這種影像及信號處理工作β MPEG-2編碼器(1〇〇)是—種精緻 · ,及時間影像分析器、量^訊内 1 (她〇Py)編碼器、及一速率_策略,該速率㈣策略確 保滿足一所選應用需求的完全符合影像流之產生。將一影 像2的每一亮度影像分成若干16 χ 16像素的非重疊區段 ,廷些區段又再被分成8 χ 8個區段。根據4 2:2或4:2:〇 的色訊抽樣選擇’兩個色訊影像將產生四個或兩個8χ8區 段。將包含所有亮度及色訊區段的這组區段稱爲一巨區段 (macroblock)。一個4:2:2巨區段具有八個區段,而4:2:〇巨 區段具有六個區段。利用—個二維離散型餘弦變換 (Discrete Cosine Transformation;簡稱 DCT)(1〇2)將每 8 χ 8區段的像素變換到頻域。DCT係用來得到高優先(低頻)頻 率係數及低優先(高頻)頻率係數之類別,而對輸入區段執 行能量緊縮。DCT是一種去掉影像區段的某些空間冗餘的 快速且有效率之方式。 係經由一種稱爲移動估計(Motl〇n Estimati〇n;簡稱 ME)(104)之技術去掉時間冗餘。在此種架構下,在—搜 尋窗内移動一個屬於一先前影像之對應巨區段,即可預測 任何売度巨區段。將搜尋最佳巨區段匹配的程序定義爲移 動估计。然後在考慮下以巨區段減掉該最佳匹配(預測), 並對巨區段差異應用一 DCT變換。此外,產生一個指向所 預測巨區段的移動向量(1 〇 6 )。编碼器及解碼器使用該移動 向量(Motion Vector;簡稱MV)向對應的巨區段進行移 -11 - 本纸張尺度適用中囚國家標率(CNS ) A4規格(21 ox 297公楚) •裝--·-----訂 i------ \ (讀先閲讀背面之注意事項再填寫本頁) A7 404132 b7 _ 五、發明説明(9 ) 動補償(Motion C〇mpensete;簡稱⑽),並找出最佳的匹配。 只對巨區段的亮度部分實施移動估計,而換算並使用所 得到的移動向量以移動補償色訊區段對。係採用__種被稱 爲差動脈碼調變(Differential pulse c〇de M〇dulati〇n ;簡稱 DPCM)的技術實施移動向量的编碼,其中係利用一先前編 碼的巨區段I移動向量預劍一移動向量,且只將移動向量 &其預測間I差異編碼。利用之 代碼字组表示移動向量差異。 如圖2所示,MPEG-2標準使用丨(影像内編碼)、p(預設) 、及B(雙向預測)型影像。影像内编碼〖只使用影像内"之資 訊,而P型採用對先前編碼的丨或p型執行的移動估計及補償 工作,而預測一巨區段(200),並計算—個所要編碼的預測 誤差。這是一種有效率的壓縮方式,因爲經過移動補償的 巨區段差異包含的資訊少於原始的巨區段。 通常將P型影像稱爲順向預測影像,因爲這些影像利用先 前的影像而預先作預測。例如,在圖2中,一移動向量 MV<(202)被用來找出影像P中巨區段(2〇〇)之最佳匹配, 該巨區·^又(200)係位於影像I中,且係位於一搜尋窗(2 〇 4 )(以 圖2中之虛線示出)内。 B型影像使用順向預測及逆向預測的及未來I或p瘦 影像之資訊’ B型影像尤其適甩老不同的方向及不同 的速度移動之物體。此外,與用於p型影像的因果預測比較 時,用於B型影像的雙向移動估計架構在有雜訊的環境中更 具有軔性。這是因爲可平均兩種預測的標稱値,而同時使 -12- 本纸張尺度適州中國國家標準(CNS ) A4規格(210X297公釐) I— I - -- - -- I ..... ί ^ I- =· I i 1 --- ml·. I l~ -- - - !— HI ^ i- (請先閱讀背面之注意事項再填寫本萸) 404132 at _B7 五、發明説明(1G ) 用兩種預測。在圖2所示的實例中,影像B i中巨區段 之移動估計工作包含由MV ^代表的—順向預測、及由 Μ V ^代表的一逆向預測。對於影像b 2而言,係分別以 及MVh代表順向預測及。 編碼器(100)在數個步驟中將各種影像類型量化(100)。 首先’將一影像類型特有的量化矩陣應用到一個8 X 8 D C T區段。該矩陣各元素(權値)係經過選擇,使^^查係 數較爲重要°這些係數包含且,影像的收視 品質有較大的影響。然後計算—量化換算因數,而根據局 部影像的活動性、影像類型__的複雜性、及緩銜^充滿的一 量測値,而將各巨區段分類成若干不同的類別。該指標與 分配給一影像的位元數、及該影像之收視品質直接相關。 根據MPEG-2標準所規定的程序,首先掃描(112)每一 DCT區段,然後將量化後的各交流(Alternate Current; 簡稱A C )係數聚集在一起,而得到實際位元數。利用一 Huffman查閱表,以一特有的可變長度碼(Variable Length Code;簡稱VLC)對每一群進行平均資訊内容编 碼(1 1 4)。利用D P C Μ (類似於爲Μ V之編碼)及均勻量化, 而將直流(D i r e c t C u r r e n t;簡稱D C)係數編碼。 平均資訊内谷编碼邊(1 14)的輸出被輸入到平均資訊内容 解碼器(116)。解碼器(11 6)之輸出在經過一反向掃描 (118)、反向量化(120) '及反-向離散型餘弦變換(122)等 的處理之後,送回一個有耗損的差異巨區段。如本門技術 中所習知的,經過解碼的影像然後經由一延遲裝置(124)而 -13- 本紙張尺度適川中囤國家標準(CNS ) A4規格(210X297公釐) ---- (請先閱硪背面之注意事項再填寫本页) ---------------扣^— -V1--I- - '1T·—J - II--^- ----- I--- A7 404132_£ 五、發明説明(11 ) 傳送到移動估計裝置(104)及(或)移動補償裝置(1〇8)。 因爲經過壓縮的影像流之瞬時速率隨著時間而改變,所 以使用一解碼緩衝器來吸收速率波動,並將固定的頻道速 率轉換成經過壓縮的影像位元,且將這些經過壓縮的影像 位元傳送到一個實際的解碼器’以供處理。因此,在本發 明的一速率控制策略實施例中,追蹤緩衝器的佔用層級、 影像的複雜性、及影像巨區段的局部活動性,其中情形將 於下文中詳述之。 编碼器(100)包含一種用來產生一個完全符合的影像流且 滿足所選擇應用的需求之速率控制策略。根據本發明的原 理’編碼器(100)的速率控制策略包含一個用來將一輸入位 元流(例如一影像流)的圖框编碼之可變位元傳送速率 (VB R)编碼架構。然而’在討論本發明的vB R編碼架構之 如’將先討論某些速率控制的基本概念,以便強化對本發 明的了解。這些基本概念與固定位元傳送率(CBR)编碼架 構有關。 1 · C B R速率控制某太概仝 通常將一 Μ P E G - 2影像流分割成若干較小的間隔,例如 立,像為(G Ο Ρ)或圖枢群ί這些影像又被分類成影像類型I、 Ρ、及Β。分配每一 g 〇 ρ的位元數,使一 I型影像的分配數 多於一 Ρ型影像的分配數。這是因爲一 ρ型影像使用移動估 計技術來估計其内容,因此,將平均資訊内宕低_原始來 源的一經過移動補償吃圖框差異(M〇ti〇n Compensated Frame Difference;簡稱MCFD)编碼。B型影像传用最少的位 -14- 本紙乐尺度適削,國國家標準(CNS) A4規格(2I0x297公幻 ---------- --r--?--訂一1 I* 一讀先閱讀背面之注意事項再填寫本頁} A7 B7 五、發明説明(12 疋數,因爲其移動估計技街較p型影像更爲徹底。將不同類 型的影像編碼時,上述方式提供了一個在一G〇p内維持相 同影像品質的基礎。此外,可減少B型影像的位元分配,因 爲將不B利用B型衫像來估計其他的影像。一個經過编瑪的 GOP係以一 I型影像開始。指定給一影像類型χ ( χ ε { I,Ρ,Β })的位元數係與在該類型影像品質中所感知的失眞 量有反向的相關。 在 J.L. Mitchel卜 W.B. pennebaker、C.E. Fogg、及 D.J.
LeGall 的著作 Mp£g_Vj_de〇 Compression Standard,,(^^MPw York的Chapman and H a 11公司於i 9 9 7年出版;本發明特 此引用孩著作炙全文以供參照))中之實驗結果顯示來源(或 影像、或圖框)的速率R與量化因數Q之間存在著類似的行 爲’可以簡化的形式如下式所示: (1), (請先閱讀背面之注意事項再填寫本頁) 裝· 訂! 好浐部中""'-準而,,5(-7消於合竹^卬欠 其中X是每一影像類型的一預定複雜性量測値。 然而,因爲來源隨著時間而改變之、本性,所以在將每一 影像類型編碼之前,先決定—個新的複雜性量測値。通常 是根據過去的編碼參數(例如位元、量化因數、及(或)某些 預測統計値)計算該參數。對_鮮£(3_2影像流的每一 G〇p 而言’ C k所提供的位元數被強制爲:
X
x=I,P,B (2), -15- 冬紙張尺度適扣中國國家標準(CNS ) A4規^公釐 404132 A7 _____________B7 五、發明説明(I3 ) 其中指標k表示GOP數,X是影像類型,Νχ是在一 GOP 中類型x的影像數,Rx是類型x的目標影像位元。 對於一 CBR影像流而言,Ck = Cgop,其中Cgop是一固定 GOB位元。對一特定的C]c而言,在方程式(2)的條件下儘 量減小各量化換算因數的平均總和,而儘量提高該G〇p之 影像品質,
Nx (3). 並不在方程式(2)的限制下儘量減小ψ ,而是去掉此一限 制條件’並使用拉格朗日乘數(Lagrange multiplier)几,以便 儘量減少丁: (4). 在方程式(1)所述的速率量化模型的協助下,將每一影像 類型的目標位元推論如下: R: X3 ck Σχ (5). (請先閱讀背面之注意事項再填寫本頁) ml -1— I 1-.- - i I. - s- 1 !-- -II . - - - I J -1 —!-· 1- - I - . ,i- n^— 訂
好浐部中决"·^^,·^ t_消於合竹U卬ϊ! 方程式(5 )中之目標代表理想的影像位元,且平均位元將 幾乎必然偏離該理想位元。計算累積誤差,並將該累積誤 差傳送回固定位元傳送率控制技術,以便確保最後的 MPEG-2位元流符合平均位元傳送率或總預定位元數。使 Cic,ideai&Ck actual分別代表g〇p k的理想位元及實際位元 -16- ’ __ 本張尺度適用中固國( CNS ) M規格(21〇χ297公楚) — 404132 五、發明説明(Μ A7 B7 c
Ck,ideal爲理想位元與實際位元間之 差異。此外,使“㈤分別代表影像立的理想位 凡及實際位7L,JL β i pic = Ri actuai_Ri Μ…爲理想位元與 實際位7G間4差異。在已將n個影像編碼之後,可計算總累 積誤差如下: u a 1 - n-n9G-i .pic=An-1(9〇 +Δ 9〇Ρ n-l,pjc (6) · GOP的大小爲g=2 ΧΝΧ且ng = 有已處理GOP的子誤差累積-係爲•丨,㈣,而An十伙是 在编碼順序中最後—個但當爲結束的G Ο P之子誤差累'積。 現在可爲得自先前編碼的影像的位元之產生過度或產生不 足,調整出理想的影像目標。屬於G〇p(k = ng)而在對第11 個影像編碼前之新理想位元爲: 吾·丨碼GOP的數目。所 --I - -- 1 - - - I mu I - 1 ^ii— I. —^n n fc M I lOJ1 - 1* * - i (讀先閱讀背面之注意事項再填寫本頁)
R ^nt ideal' ΣΧ-χ (7), N: 好沪部中"^19x'J、h T·消抡"竹杉卬欠 其中Cgop是一固定數目的CBR (JOB位元;cv是諸如10 乂及八11-1-/\11-1,§〇{)+八)1-1,1^(; ο Λ是一個指示進行調整 的積極私度之常數。在將每一X影裱編碼之後,即更新複雜 性量測値X,並計算次一影像的基於方程式(7)之新的目標 。孩目標應符合將於下文中説明的某些限制條件,以便確 保解碼缓衝器不會碰到上溢或下溢的狀況。 最後’得到一個在方程式(1)的雙曲線上界定之量化換算 17 本紙張尺度4則,_轉準(⑽)Α4規格(2似297公楚 404132 ΑΊ --------------Β7 五、發明説明(15 ) ~" 因數Q。請注意,每一影像氣型有其本身的複合(R_Q)曲線 ’此外,對於每一影像,可稍微調整Q因數,以 便保證以相同6^^|見到直|的圖框。本文中將不説明 加入巨區段層級速率控制的收视效果之方式及在經由調 變Q因數而將工作編碼的過程中符合理想目標之方式。然 而’上述廷些方式係述於1993年4月公佈的1§〇/1]^ JTCl/SC29/WGll/N040〇"Test M〇del 5",本發明特此引 用該文獻之全文以供參照。 前又所述爲各種CBR基本概念之説明,下文中將説明本 發明的VBR技術,尤其是即時單一掃描VBR技術。 2. VBR影像 調變各量化參數,即可在_ G0P内得到一固定目標Cg。 的恆定品質,此種方式因而激發了第i節之CBR速率控制 技術。利用任何統計値變化或位元不足,以協助穩定在時 間向度上的C B R速率控制技術。此外,一 μ p £ g - 2 C B R 編碼器利用一组通用常數及預定起始複雜性量測値,而在 分配給不同影像類型的位元數之間維持某一比率。然而, 就複雜性的嚴厲或柔和而將一群諸如G 〇 的連 續影像分類成不同類型的時間間隔而言,在即時單一掃描 Μ P E G - 2編碼中上述的努力受到限制。爲產咕眞結果 而需要的大量(或少量)位元界定了影像複雜性的嚴厲(或柔 和)。對於多次掃描CBR或多次掃描VBR編碼而言,此種 資訊是已知的,因而可提昇品質。 然而,在本發明中,由於係即時調整G 〇 B位亓.,所以 -18- 本纸張尺度通扣中囤囤家標準(CNS ) Α4規格(2丨0Χ297公釐) (請先閲讀背面之注意事項再填寫本頁) -裝_
、1T I- - 1
II I —.n κι A7 B7 404132 五、發明説明(l6 CBR編碼的速率控制策略又增加了一層複雜性。此一問題 特別具有挑戰性,因I任何影像來源的統計本質既無法預 先知道且又暖I時間變而且不可能正確估計來源的^ 佈。本發明的即時單一掃描VBR編碼器利用_(c_q)感知 模型來區別各影像段落複雜性的嚴厲或柔和,其中每二影 像段落對應於方程式(1)所=定的一特定雙曲線。'然後沿= 該雙曲線計算各實際的(¾ _万)對。 2 _ 1速率量化感知模型: 由於每一影像段落(亦即每一 G0P)係與—編碼困難度層 級相關聯,且可以諸如總影像位元、量化換算因數、空間 活動性,時間活動性、信號雜訊比、或上述各項的任何组 〇等各種來源統計値或壓縮參數來量側此種複雜性,因而 在觀念上激發了本發明的VBR ^應將較大量的位元分配給 一個編碼困難度層級較高之影像段落。這是—種與速 2控制技術不同的方式,在CBR速率控制技術中,係將固 定^目的位元分配,而不管來源的複雜程度如 何。由研究的努力得知:對於由複雜、中等、及容易的材 料構成的太量測試實例而言,影像間隔的速率與量化換算 因數I間有相當大的相關性。此種相關性係述於諸如r RajagopaUn等人於1 998年1月26日提出申請的待審查美 國專利申請案09/0 1 3, 149"固定或可變速率的數位移動影 像流1兩次掃描编碼方法"(内部案號γ〇 9 9 8 _〇23),本發 明特此引用該專利申請案之令文以供參照。 此種相關性尤其係由下列方程式示出: -19 本紙張尺度適/1]中囤囤家棉準(CNS ) Α4規格(21〇)<297公釐 1^— - I I II— - 11 ----I -I ' I - . - I: - * ----- ----IU.1 _ - . * (請先閲讀背面之注意事項再填寫本頁) 好浐部中夾ir.-^-/';.,J!T.消介合竹.^卬-^ 404132 A7 —---------- 五、發明説明(Π ) (a1+a2i?J) (8), 其中a!是一感知線(301)與一 C抽(302)交叉的一點 (3 〇 〇)(圖3 )(例如a〖=〇 2) ; a 2是感知線(3 〇 i )的斜率(例如 a2 = 〇.〇6) ’且々指示該感知模型是線性或非線性(例如卢 =1指示線性)。 係根據應以相同品質下收視到所有類型的影像間隔之準 則,而推導出方程式(8)之Ra_Qa關係。此外,我們建議產 生一較大量化換算因數Q的困難影像段落應耗用比經過壓 縮的影像流的平均位元傳送率更大的位元傳送速率,而容 易的影像段落則使用較少的位—元數上此身量雅在形喊 可靠性的單—掃描VBR编碼技術時提供了一積丰式部件, 因爲此種關係利用了影像來源的可狻柹。 利用上述關係時,可根據本發明的原理,而以下列感知 模型的斜率K決定分配給每一間隔(例如每一 〇 〇 p)的實際 位元數:
Ra = K{at+a2Ql) = KF{Q^ (9) ·
I 尤其根據本發明的一技術,爲每一影像間隔(亦即每— G Ο P)調變(以每秒百萬位元數量測的)常數κ,以便確保經 過壓縮的影像流之平均速率符合所需的目標速率。將於下 文中詳述用來調變K的一種技術。 2.2 V B RI率控制技術!: -20- 本紙張尺度適川十國國家標隼(CNS ) A4規格(210X297公釐) (請先閱讀背面之注意事項再填寫本頁) I - < 1— bnn 一 IT * t^n In— · ----: 1^1 HI n^— -1- 1 1 - -. - II I -- - —I— A7 B7 一 404132
五、發明説明(W 枯描VBR编碼器的效率係與該編碼器的速率控制 ΪΓ:ί根據影像流複雜性的柔和或嚴厲而調整的速度 ,/A w ;符沐效果的區域中,應儘量減 =品質的降低。因爲在單一掃插編碼中影像的統計値 2又限於先前分析及编碼的影像,所以速率控制技術的學 習速率應適當而足以預測未來影像間隔的内容,但又不會 太過積極而造成演算法的不穩定性。解決此種雙重問題二 一種方式即是在每-時間間隔(亦即每—G0P)中調整經過 壓縮的影像流之品質,使該速率控制抹術學習在該時間間 隔内每一影像之局部内容。 根據本發明的原理,VBR輸入影像流Svbr是諸如數個相 接的影像或時間間隔(亦即G0P)之—序連,每—影像間隔 在在一個不同的CBR位元傳送速率下工作。2 i節中説明 的感知模型決定了每一影像間隔之動態位元傳送速率調整 ’而係利用方程式(1 )之速率量化模型計算實際的(己_ ^ )對 。因此,可將VBR影像流Svbr分割成由指定的有限 數目之GOP。界定GOP Sk的一平均位元數Ck、及一平均 量化換算因數,使[LSkpG-ICk Qk]。根據本發明 的原理修改方程式(9)的各項,以便形成G Ο P S k的千崎仓 元與量化換算因數間之一相依性如下:KF(Gk)(方 程式(9 a)),其中係由f界定影像之圖框速率。 以(Ck-2, actual,Qlc-2,actual)及(Ck-l,actual,Qk-l,actual)代 表已編碼的GOP Sk<2及Sk-1之平均位元及平均量化摄 數對。可將一 CBR或VBR MPEG-2编碼器J於這些G〇p -21 - 本紙張尺度辿州中國囤家標率(CNS ) A4規格(2丨0X297公釐) (請先閱讀背面之注意事項再填艿本頁) 裝--------訂一^------- 部 中 A il if 消 A ίΐ 卬 f- 404132 A7 B7 五、發明説明(l9 的編碼。此外,假設如同在方程式 ^ ,1. 4* . .. .. J 干 C 1c 與 Q k 之間有一 雙曲線相依性,並假設在本發明中利用上 關係的一線性模型如下: 士預'到^ where,
△A ^Qk tljc=Cfc-l.acCuai + iJt0., actual ^C^ck-i.actu^-ck_2iactual ^〇k=Qk.2iactual~Q 尺 **1,actual (10). 二程式(10)界定了-特定G0P在分析下的瞬時速率h 狀態。圖3中示出方程式(1G)的線性模型及該線性模型與〉 程式(9a)的感知模型間之關係。爲了找出 同時解方程式⑽及方程式(9a)之感知模型。^用點 例如,以(己1,6 1 )及(己2,6 2 )解各方程式,而得到理想十 用點3 ’並以(C2,Q2)及(c:3,Q3)解各方程式,而得到理衣 作用點4。 A 尤其是在下式所示的平均位元下將次一GOP編碼: (11) 調變每一G ο ρ的常數κ,而確保VB R影像流所產生的總 位凡數不會大於諸如DVD光碟等儲存或擷取裝置之容量。 例如’如果可使用的總位元數是Rtct,則在對輸入影像流 的每一GOP進行分析及编碼之後,可利用方程式(9a)的感 知模型計算K如下: -22 本紙張尺度關巾_家網M CNS ) Μ規格(2丨GX297公麓) ---------‘裝--------訂-----„---^ ** (諳先閱讀背面之注意事項再填寫本頁) A7 A7 =—______ gE^W- ic=o (12), 五、發明説明(20 fR, iom一 其中N g。p疋輸入影像流中之G 〇 p數,G是G 〇 p的大小。 可易於在-多次掃指編碼架構中計算出方程式(i 2)的分 母,但疋在如同本發明的單一掃描即時壓墙架構中無法得 到該分母。因此,根據本發明的原理,替代性地使用_先 前編碼的幻像影像流,其中—組G〇p量化器係界定如下: (¾ 4〇p-x k=Q, 其中是幻像影像流中經過編碼的G〇p之數目。因而在 將輸入影像流的每-G〇P編碼之後,調整方程式(12)之總 和〇 若已知-影像數及-預定位元數Rt〇t,則本發明之單一 掃描VBR編碼器將負責將所產生的所有位元放入數位媒體 中。爲了避免超出或不足,動態地修改每一 G〇kRT〇T。 以RT0T減掉實際位元,而得到經過調整的預定位元數 Rk,t〇t ’並利用該Rk,tC)t設定一個新的斜率: 1^1 I - I ! . I-- - ' I m. I· - -- ί - *- (請先閱讀背面之注意事項再填寫本頁) :‘部中""-^-^m T.消於合竹ίι卬舻
Kk: fRk. tot (13). 圖3示出如何在將複雜性爲柔和或嚴厲的G〇p編碼的情 形中調整感知模型。因爲無法在—單—掃描vbr編碼架構 中-十算出K及K的仝母’所以已根據本發明的原理而開發了 ,23- 本紙張尺度適中國國家標準(CNS ) A4規格(210X297公釐) 第87110219號專利申請案 中文說明書修正頁(89年5月) A7 五、發明説明( 21 B7^04132 一種技術,用以調變K,並估計待分配給每一G〇p的位元 數。將此種即時單一掃描VBR架構稱為學習程序,因為該 架構在進行中學習某些資訊。下文中將參照圖4而說明一學 習程序實施例: 1.以P代表重元組(tuple)所界定的一經先前編碼之幻像·在 步驟(400)中,Z0的典型值為108,且N。的典型值為114。 N.
g〇P set ζϋ·- Σ
Ng〇p~i k=o and nq and 9〇P' 广请先st#背面之注意事項#填寫本莨) 一装· 2.在步驟(402)中,啟動VBR速率控制技術,使用諸如一 CBR MPEG-2編碼器,而在f.^〇p的速率下將輸入影像 流的前兩個GOP(亦即%及5〇編碼。f 的標稱值應 對應於使用者所設定的VBR影像流之平均速率。 J .在將S k ·,編碼之後,在步驟(4 〇 4)中更新各參數。例如, 將代表編碼困難度量測值總和的z k及作為調整後G 〇 p數 的〜更新如下:Zk = Zk 1+ r F(Qk i aetuai),Nni + γ,其中r是學習演算法的更新速度(例如τ=2 〇)。此 外,並計算Cu actual及總和Σ爲Cj。 (a) 如果(k -丨=〇) ’則將k遞增1,並回到步驟3。 (b) 否則,根據方程式(1 〇)中所界定的預測模型而計算諸 如fk及??(:等的其他參數。 4.在步驟(404)中,利用步驟3之總和項以決定預定位元數中之 剩餘位元Ru〇t。例如,以Rt〇t減掉Σ爲c ],而得到R _。 -24- 本紙張尺度_中ΐ國家鮮(⑽( 21GX297公缝 訂 線 經濟部中央標準局員工消费合作社印製 --404132五、發明説明(22 A7 B7 5.在步驟(4 〇6)中,量測新的斜率: fRk.t〇tNk Kf=--->Pkzk 6_在步驟(408)中,利用前文所述的方程式(1 1)或將於下 又中説明的方程式(i4)計算新的目標。7. 在步驟(41〇)中,在¥6尺模式中將51^編碼。 8. 在步驟(414)中,如果影像流中尚有未完成的G〇p,則 回到步戰3,否則停止。 Zk項係用來將其本身調整到每.4QP的影像内容,並使 V B R影像的變化性平滑化。—該項係作爲一安全措施,避免 將不合理的位元分配給極高(或極低)複雜性的各〇 〇 p。 則文所述是一種用來決定所要編碼的一 〇 〇 p s k之平均位 元。概言之’係以下列方程式設定該等目標位元:
b, tot^k) PkZk J (14) (請先閱讀背面之:;i意事項再填寫本頁) -裝.
*1T 經濟部中央標4,-局员工消费合作社印裂 下文中將參照圖5而詳述本發明之速率控制技術。在—實 施例中’將一個未經壓縮的輸入位元流(例如一影像流)輸 入一壓縮引擎(500) ’該壓縮引擎(5 00)包含諸如圖!所示 且於前文中説明之編碼器。因爲無法預先知道該輸入影像 流’所以利用舊有的晶片技術(亦即一習知的C b r或v b R 汝算法)啓動該壓縮引擎(5 0 0 )。’然後在諸如匚b R模式下將 前兩個G Ο P编碼。 -25- 本紙張尺度適用中國國家標準(CNS ) Λ4%格(210X 297公垃) A7 B7 -- 五、發明説明(23 前—延遲以(5G2),用以説明資訊將係得自先 ㈣GUG()IV2),並非得自作爲 秤編碼的次一 GOP之G〇Pk。 然後在步驟(504)中計算最後兩個經過編碼的G〇p(例如 G〇Pk.丨及GOPk-2)中的每—G〇p之平均位元d]、及這 一 G 0 P的平均Q因數Q丨,Q 2。舉例而t,前文中係參照方 彳式1到7而説明计算前兩個GQp的平均位元及平均Q因數 =方式。然後緩衝儲存(Uo,仏九)値,且隨後將用 這二値來估计所要編碼的次一 G 〇 p所需之g 〇 b位元。 爲了在步驟(506)中估計新的g〇b位元,將方程式(1〇) 之(ε-β)預測模型(508)及方程式(9a)之感知模型用 於估計新的GOB位元。如圖5所示,在步驟(511)中,將待 耗用的剩餘位元及待編碼的影像數等學習程序之經過更新 的參數輸入到隨時間變化的感知模型。預測模型及感知模 型相符的點即是G Ο P k的G Ο B位元之估計値。係由前文中 説明的方程式(1 4)界定該點。 除了前文所述的以外,在步驟(5 12)中可針對特殊效果或 不穩定性而調整G Ο B位元的估計,其中情形將於下文中説 明之。 在推導出新的GOB位元之後,在步驟(514)中使用一影 像位元分配模型將一位元數指定给所要编碼的G Ο P之每一 圖框或影像。在一實施例中,爲了調整每一影像類型的目 標位元,將C k乘以G Ο P大小G,並利用下列方程式得到每 一影像的理想位元: -26- 本紙張尺度適用肀囤囤家標準(CNS ) A4规格(210X297公釐) 請 先 閱 讀 背 面 之 注 意 事 項 再 填 η 本 頁 裝 訂 好浐部中夹悴^-’-?,,Ji.T>vi於合竹=11印纪 A7 B7 __404132 五、發明説明(24 ideal' ai^n~1^g〇p"0C2^n-lfpic) (15). 對於一CBR類型的作業而言,每一G0P將耗用相同的位 兀數,而且如果在理想的G0P目標位元與實際値之間有差 異,則長期G0P誤差將被所要編碼的次一g〇p承接。因此 ,一 G0P、一群G0P、或整個影像流的影像流位元傳送速 率將是相同的。長期G0P誤差是。然而,在即時 VBR的情形中,並不需要承接長期G〇p誤差,因爲每一 G0P可在一不同的位元傳送速率下工作。vbr架構的責任 在於針對影像品質而將總預定位元數最佳化。在有上述方 私式的參數a 1的情形下,我們可換算該長期G Ο P誤差,並 在將該長期G Ο P誤差傳送到V B R編碼器的速率控制演算法 時,控制該資訊。一旦設定VBR G0P目標位元之後,即 利用a 2以符合G 0 P内的預定位元數。a 1及a 2的典型値分 別是0.0 5及〇 . 2。 例如’將C B R速率設定在每秒4 · 〇百(萬位元,並將第一 個G 0 P編碼。假設每秒耗用了 3 · 9百萬位元。其餘的每秒 0.1百萬位元將進入次一 G0P(第2個),且該g〇P將得到每 秒4.1百萬位元(在理想狀況下)。但是,如果第2個G〇P只 得到每秒3 · 5百萬位元,則前兩個G 〇 P共有每秒〇 · 6百萬位 元的不足’此種不足將由第3個G0P承接,以便確保在每 一個G0P計算的固定位元傳送率dVBR並不需要此種方式 ’因爲我們嘗試在C B R不穩定的區域將影像品質最佳化。 •27· 本紙張尺度適/11中囤國家標準(CNS ) A4規格(210X297公釐) n^i aft im mt^ fl^n »·111 w Iw ,T .· (請先閱讀背面之注意事項再填荇本頁} ~^--- 五、發明说明(25 ) " ~~ ---------^丨_ -~ f請先聞讀背面之注意事項再填艿本页) 應保留剩餘的位元(每秒0·6百萬位元),並將這些剩餘位元 有效率地用於較困難的(較嚴厲的)影像編碼。這就是〇 1相 當小的原因。 在決定影像的理想位元之後,利用諸如方程式(1)推導每 一影像的量化因數。將該量化因數輸入到壓縮引擎(5〇〇), I縮引擎(5 00)被用來壓縮現有g〇P的每—圖框或影像。 該壓縮引擎的輸出是根據本發明的原理而在_單一掃描即 時可變位元傳送速率模式下壓縮的一影像流。 在將圖框編碼之後,即可自諸如壓縮引擎(5 〇 〇 )内的一計 數器取得分配給每一影像的實際位元數。然後將這些値放 入方程式(6 ),以便決定實際位元偏離理想位元有多少。 在圖5中,示出與壓縮引擎(5〇0)無關而係用來估計g〇b 位元數的各種程序。亦即,獨立於壓縮引擎(5 〇 〇 )的這些處 理邏輯或電路可用來執行這些程序。然而,在另一實施例 中,可將圖5所示的一個或多個程序包含在一個晶片内(亦 即在壓縮引擎(5 00)内)。 :¾¾:-部中戎«.·準而h-t.;/]贽合竹彩印纪 前文所述之單一掃描VB R速率量化架構係基於下列假設 :一解壓縮引擎内的解碼緩衝器有無限大的容量,且永遠 可取得足夠大的位元數。然而,在現實的情形中,緩衝器 的容量是有限的,且係由Μ P E G - 2標準所界定。因此,本 發明之編碼架構負貴消除解碼緩衝器可能會碰到的任何上 溢或下溢狀況。檢查一假想解碼缓衝器(亦即一影像緩衝器 驗證器(Video Buffer Verifier;簡稱 VBV))、,並計算 指定給—影像類型的位元數之下限/上限,即可達到上述目 -28- 本紙张尺度適jiTFig!家標率(CNS ) A4規格(21〇χ297公瘦) —' _ 404132 — _ -___ 五、發明説明(26 A7 B7 的。在-VBR的情科,幸運的是不會在解碼緩衝器中發 生上溢的狀況。這是因爲在VBV解碼緩衝器的佔用量到達 其最大限度之後,立即停止填充解碼緩衝器的工作。因此 ,在影像界限中加上-個零的下限。此外,係在使用者設 定的最大速率R„ax(以每秒百萬位元爲單位)下填充解碼緩 衝器。 然而,在一VBR解碼器的VBV緩衝器中可能發生下溢的 狀況,且應指定一個不大於一預定値之上限,以避免此種 狀況。因此’以分別代表在去掉^個影像之前 及之後的解碼緩衝器填滿程度。可將Β 計算爲:
Bn=Bn~Rn,actual (16). 此外,在去掉次一影像之前的缓衝器填滿程度爲 (17), I I----- - 1. - m I I—--Γ '!iT - (請先M讀背面之注意事項存填筇本筲) fes;.部中央奵^1-,而U.T消妁合竹.^卬*';本 其中Bvbv是影像缓衝器驗證器的總容量,且L是第η個影 像(顯示期間。(Tn*f的相反)。在去掉第&個影像之前, 可得到緩衝器中所有的資訊,因而上限^變成緩衝器之填 滿程度。限制影像目標位元的標稱値係由下限Ln及上限u 所指定: " °
Lnn^〇IN{BvbV' Bn'X -Rn-1, actual ) (18). -29- 本紙張尺度適則,_家料(CNS ) A4規格(21GX297公货) A7404132 ~~•一 〜—^... ________ 五、發明説明(27 ) B7 因此,利用影像界限來限制理想的影像位元: R 一 .ideal'
Pn lf ^Rn.ldeal>Un) Ln el5eif ^n,ideal<Ln) 户n, idea! (19). 經米部中呔i:.^'-^h.t消价合竹打卬纪 上述是由{RT。!·,{Ri,Qi} f=〇}指定的一單一掃描VBR MPEG-2编碼器。該编碼器沿著由聯解一隨時間變化的感 知模型及一組C-$模型而形成的星座上工作。首先以GOP 複雜性的"柔和"或"嚴厲"決定該星座内—G Ο P的(ί: k - Q k) 對之相對理想位置,然後以預定位元數的剩餘數目的位元 來調整該相對理想位置。以-影像類型的(R _ Q )模型表示一 影像的(Ri,Qi)對的當地位置。圖3示出採用可變位元傳送 速率控制技術1的VB R編碼器形成的(ck_Qk)對之—星座之情 形。在此圖中,己= 0gQp界定的常數線指示在cBR模式下編 碼時所有(Ck-Qk)對的理想位置。此外,該圖反映了下列 事實’當各GOP複雜性的嚴厲増加時,平均量化換算因數 亦增加。—分別^以白S及苎色的圓圈示出理想及實際的作用 點。以(Cj-Qd及(C2-Q2)代表一,,柔和” G〇p的前兩對, 而係在一影像流開始時啓動VBR編碼器而得到這兩對。以 ”3"表示的次一理想作用點係在感知模型(實線)與因果預測 模型的f又點上。點"3"的位置指示分配—個小於影 均位元Cgcp的平均位元。然而,該編碼器的輸出(亦即(_^3_ Q3)點)將是不同的’因此’將推導一個新的感知模型心 表示),以符合預定位元數限制。然後利用及 (CrQO對而得到—個新的感知模型(以虛線表示),並計算 -30- 本紙張尺心财 _ ^-(cns)^~(210x297^7 I - I ...... I - -I - U - -1 > —11 * - HI τ» "1-'m -- (請先閱讀背面之注意事項再填本頁) 好浐部中^^^Λ.-;!-τί7ί^;Α"4"卬·" 404132 五、發明説明(28 ) —個新的作用點,亦即點"4,,。如果影像流包含大量的相接 —柔和” G Ο P,則感知模型終將涵蓋—條在接近c B R輸出對 (Ci-Ch)及(C2-Q2)處與 C = Cg()p 交又的線。 如果影像素材以"嚴厲"G Ο P開始,則實際點(c 3 _ $ 3)的 位置係在C = Cg。p線之上《因而確保在c b r编碼器作業最不 穩定的區域(亦即”嚴厲” G Ο P)中對可用預定位元數的最佳 化》在此種情形中,形成一個新的感知模型(以虛線表示) ’而逐漸降低所分配的GOB_位元’一^含預戈备每美φ] 。該模划i拿同新的因果預測模型(亦以虛線示出)決定以"4 " 表示的次一作用點。在輸入影像流主要由"嚴厲"G 〇 p構成 的情2卞,感知模型終將與在一接近及(ϋ2:)處 符合C = C g。ρ的一線重合。對於—個典型的影像節目而言, 不可Bb在一段較長的時間中沿著同一 G 〇, P (或先前計算出各 點的一星座)工作。然而,有可能在短時間之後自一 G〇p跳 到次一鄰近的G0P。因此,我們可推論下列行爲。在感知 模型於該模式可無變化地降低一 G 〇 ρ的"嚴厲"或"柔和"的 情況中安定之前,速率控制技術將遷移到一個新的GOp。 先刖编碼的影像類型之實際量化換算因數値決定遷移到_ 個••較嚴厲"或較柔和^的G 0 Ρ。對於—個未來的”較嚴厲 的”(”較柔和的”)G0P而言Γ係如圖3所示而移到先前編碼 的G0P之右方。因此,在與感知模型交叉的位置產生了高 於(或低於)先前G0P所耗用實際位元的G〇B位元。此種機 制確保在一群具有類似"編碼困難度層級"的相接G 〇 ρ中, 係在對應的影像間隔之編碼後内容中分佈"嚴厲"(或"柔和 -31 - 本紙張尺度適州中國國家標準(CNS )Α4規格(210X297公楚) _ I_ II I - II ' 士.f/ I ΐ I m ~ - 1^1 *T 齡 · (請先閱讀背面之注意事項再填寫本頁) A7 404132 五、發明説明(29 ) ")降低或增加之效應’而最複雜的(最不複雜的)(3〇ρ將相 對於其他GO Ρ而獲得最大的(最小的)位元分配。雖然此種 技術係基於調變感知模型的斜率K,但是亦可轉換該感知 模型以符合使用者所設定的總位元數,而形成一種替代的 VBR速率控制技術。將於下文中説明此種可變位元傳送速 率控制技術。 2-3 VBR速率控制枯俯7 在本節中’將説明用來計算所要编碼的每一 G〇p的目標 位元之苐一種技術。根據本發明的原理,並不調變(C_Q) 感知模型的斜率K,而是解參數&1以轉換感知模型的位置 β斜率K係固定在一 CBR速率[(^”上,且以下式推導參 數 a ί · __________ — R -C a ν' N90P-1— KT〇T k=p Q~k (20). 一即時單一掃描VBR編碼器並未界定上述方程式的總和 項。因此,利用一先前編碼的幻像影像流(如同技術丨)啓動 本發明的VBR速率控制技術2 ^爲了確保數位儲存媒體不 會碰到超過/不足’定期監視剩餘位元,並利用剩餘位元 作爲瞬時總位元數(亦即Rk,t〇t)。感知模型的轉換變化爲· 11 - I I - t 1:1 -:- - -I V 士I -I -.I- - - - I I - I Ty -- (請先閲讀背面之注意事項再填存衣頁) # tot a. ra - (21〉 -32 本纸張尺度述州中國國家標準(CNS)A4規格(210x297公釐) A7 B7 #?沪部中夾"-^而「-3!-7消抡合竹卬?^ 五、發明説明(3〇 其中rg代表尚未編碼的〇〇1>之長期速率與影像流的一 CBR速率=之比—率^且將於下文中説明Yk&Ek。對於嚴厲 的G Ο P而Q,( c k :> C g。p)及比率r $随著時間而變小,以便 滿足二位元數'Ek提供其他的強制動作,而沿著星座向下 移動(ek_Qk)對的位置,以便降低經過壓縮的影像流之速 率。如果在一段時間中將數個柔和的GOP編碼,則將發生 相反的情形。每一G0P的平均位元係設定如下: (22) 根據本發明的原理,亦將一學習程岸提供給vbr速率控 制技術2。在該學習程序中,設定γ的起始値並更新之。係 以與形成VBR速率控制技術i相同的方式界走其餘的編碼 參數。 下文中將參照圖6而説明學習程序2^ —實施制。 1·以P表示由重元組界定的-先前編碼 之句像,並設定VYD= (Συ,且N〇=NW ’ 步驟(600) 〇 2.在步驟(602)中,啓動VBR速^控制技術,使用諸如— CBR MPEG-2编碼器,而在%”的速率下將輸入影像 流的前兩個GOP(亦即S〇及Sl)編碼。f允”的標稱値應 對應於VBR影像流之平均速率。 3·在將31£_1編碼之後,在步驟(604)中更新各參數。例如, 將代表每一圖框群的平均量化因數總和之更新爲 -33 一装-------ΐτ t-· (請先閱讀背面之注意事項再域寫本筲} 本紙張尺度適則家標準(CNS ) A4規格 (21 OX297公釐 A7 B7 __404132 ' 一·· ___ I - 一 五、發明説明(31
Yk ,其中厂是學習 演算法的更新速度(例如r=2.0)e並計算Ckiaetuai及 總和 2 爲 Cj,actual。 (a) 如果(k-i = 0),則將k遞増i,並回到步驟3。 (b) 否則,根據方程式(10)中所界定的預測模型而計算諸 如f k及7 k。 4. 在步驟(604)中,利用步驟3之總和項以決定預定位元數 中之剩餘位元Rk,tc)t。更新所要編碼的的剩餘影像匕數。 5. 在步驟(606)中,計算4、Ek及新的轉換因數“。 6_在步驟(608)中,利用諸如友程式(22)計算新的目標匕。 7. 在步驟(6 10)中,在VBR模式中將%編碼。 8. 如果在查詢步驟(6 12)中,發現影像流中尚有未完成的 G Ο P,則回到步驟3,否則在步驟(6〗* )中停止。 以如同先前各節中所述之方式處理對VBV緩衝器佔用程 度之限制及目標調整。圖7示出如何在每一 G〇p内形成瞬 時因果預測模型,並配合一個隨著時間變化的感知模型而 使用該因果預測模型,以便爲採用可變位元傳送速率控制 技術2的VBR編碼器估計一個新的。如果在—段 時間中將數個柔和(或嚴厲)的G0P编碼,則將向上(或向^ )移動該感知模型,以便符合預定位元數限制。 2.4換景 在編碼程序的過程中’ VBR速率控制技術可能變得不穩 定。其原因通常是特殊效果或自然發生的現象,例如換景 陵速或快速移動的淡入淡出(例如自舊景淡出到黑色背子 .34· 私紙張尺度適用中囤國家標準(CNS ) A4規格(210X297公釐 I I- - - -- I - - - -I . - - · 士良 I- Hr —i— - Γ· . XJ 、-'° I- (請先閱讀背面之注意事項再填寫本頁) A7 B7 _ 404132 一 ------—------- 五、發明説明(32 ) =淡入到新景)、及突然的亮度改變(由於在動作片等電影 ' ‘B>、、相機的強烈閃光、槍擊等鏡頭)、以及壓縮後影像參數 之易欠化本質。對於上述的時間及空間轉變而言,幾乎不 可能進行编碼器的參數調整。 s根據本發明的原理’縱使在壓縮特殊效果的影像時,也 提仏了 π ρα處的V B R景> 像流。這是由於偵測v B R編碼器( 因特殊效果而引起的)演算法不穩定性,並沿著前面各節所 述的一條與程序不同之軌跡設定各GOP目標,而達到上述 目的。 圖8不出自一柔和的G0P轉變到一個嚴厲的G〇p時對所 要編碼的次一GOP作出一錯誤估計的情形。圖中係以,,不良 作用點"表示該錯誤估計。將一 3點中心値濾波應用於一組 小心選出的參數,即可作出較佳的估計。 例如’對於V B R速率控制技術1而言,係利用下式推導 出新的目標: ~ (請先閲讀背面之注意事項再填寫本頁) --° q,new=G· Indian{^KkF{Qk^ actual else (23) 再舉一個例子,對於VBR速率控制技術2而言,係利用 下式推導新的目標: (24)
Af/7Dr叫丨丨 a 抑1 ^-l,accuaj) : k·^ ' imk<〇) else _ l (幻 ,μ2°ν〇ρ,μ3s_立卿、 ^2Bk+H(k) 其中 = + γ幻. -35- 本紙张尺度適用中國國家標準(cns )A4規格(210x297公釐) 好浐部中央"'^/;),,;!二消診合竹彩卬欠 —---4D413-2__B7_ 五、發明说明(33 ) ~ 中心値濾波係用來補償可能在所有類型的G〇p(例如柔和 或嚴厲的GOP)發生的(因換景而引起之)不穩定狀況。常數 組{ A 1,# 2, A s}對一換景中產生的位元數強制執行—界限 。在一實施例中’〆尸1〇," 2 = 0.9、M 3 = 〇.9。 當偵測到換景時,亦可使用方程式(23)及(24)的G〇p目 標分配。本文中將不説明偵測換景的方式,因爲可在文獻 中找到許多換景偵測的技術。因爲對每一 G〇p的編碼係以 -個I型影像’,所以如果該影像的位置是在在影像流中 發生換景的地方,則使用方程式(23)或方程式(24)來設定 新的目標。此外,如果編碼器偵測到—p型影像的換景,則 將此類型的影像改變成一個Ϊ型影像,並開始一個新的G〇p ,且号4根據方程式(23)或方程式(24)設定新的目標。 2-5 C - 〇不穩宕& : 我們知道方程式(1)的(11_(^關係式對各種類別的影像流 都工作良好,且爲許多即時MPEG及非MpEG壓縮系统所 採用的基本觀念。然而,根據本發明的原理,利用該關係 式建立一因果預測模型’以便依據先前各G〇p的實際平均 GOP位元及平均量化隨,而估計所要編碼的—現紅 之平均位元。多而,縱使在沒有特殊效果或換景時;此種 預測模型在某些影像段落中也可能變得不穩定。其原因係 與影像來源的不固定本質有關,例如,數個細節豐富的物 體緩慢移動通過一個有強烈亮度或豐富色_傻細節的背 景時’或者在景中出現的意料外的雜訊時。 圖9示出由一編碼器所推導出的兩點,其中一點係在複合 -36- 本紙張尺度適川中®囤家標準(CNS ) A4規格(2丨公釐y -I- - I. I - I - 11 I -1 I I _ - Hr I -I 1 -- - (諳先閱讀背'面之注意事項再填寫本頁) 404132 a7 ___________B7 五、發明説明(34 ) (C-Q)曲線之外。該點是前文所述準則的結果,而並不依 循(ό-i)關係式。此外,此種方式有助於計算—個"不良作 用點"。本發明之VBR編碼器額外引用方程式或方程 式(2 4 )所界定的策略,而抑制了此種不穩定性。尤其係根 據下列條件而設定各G Ο B位元: (25) (諳先閲讀背面之注意事項再填寫本頁). (Θ^ΙΔΟ^Θ^) Λ ) M^N{Ck.nevG^ninCktfn) θΐΒβί£(ξι:<0)/\ (ei<|Ap|<0Cf)/yi(cJ: ^<Cyop)GC— eJseii(G<0)A (θΐ·<1△罚 <θ„)八
g〇P 裝---------訂 其中
A fil ωΛ-2 ,actual+^2^~k-1 .actual ωχ+ω2 (26), 好采部中呔糅泽而.,::;丁-消«-合竹.=[1卬^ 其中①!及ω 2代表濾波的權値。在一實例中,ω i = 1 . 〇且ω 2=1.0,而在另一實例中,被設定爲1〇,且ω2被設定 爲 3.0。 在上述方程式中,Φ是用來調變待分配的位元數之一常 數。例如,φ最大値是H,且φ最小値是〇 9。在未來的 GOP屬於已處理過的G〇p所在之同一影像段落之假設下, 選擇臨界値Θ L (例如〇 ;[)及θ 口(例如1 . 〇 );且亡k, f;丨丨是一 -37- 艮尺度適削國家標準(CNS) A4規格(21〇><297公瘦) A7 B7 404132 五 '發明説明(35 ) 平均G Ο B位无,其中係對先前編碼的各G Ο P之位元進行線 性濾波,而決定該平均GOB位元。該線性濾波的輸出是新 的作用點。利用MAX及Μ IN函數以濾除將造成(5-5)不穩 定性的這些編碼位元參數。 前文中詳述的是提供一種易於實施且可產生高品質影像 的即時單一掃描可變位元傳送速率編碼器之技術。決定待 分配給一 G Ο P的位元數之估計値,然^利用各種技術調整 該估計値。 ' 可將本發明包含在一個具有諸如電腦可使用的媒體之製 品(例如一個或多個電腦程式產品)。該媒體中包含諸如電 腦可讀取的程式碼裝置,用以提供且協助本發明的各種能 力。可將該製品包含在一電腦系統中,作爲電腦系統的— 部分,亦可單獨出售該製品。 此外,可提供—機器可讀取的至少一個程式儲存裝置, 該等程式儲存裝置實體上包含該機器可執行的至少一個指 令程式’用以執行本發明的各種能力。 •本發明所不出的各流程圖只供舉例。在不脱離本發明的 下尚可對本文所述的這些圖示或步驟(或作業)作出 =變化。例如’可按照不同的順序執行這些步骤,或可 ;t a:除、或修改—些步驟。將所有這些變化視爲本發 明申請專利範圍的一部分。 悉已詳細示出並説明了 —些較佳實施例,但是熟 作出久術者當可了解’在不脱離本發明的精神下,尚可 =各^改、增添、替代等變化,因而將這些變化視爲 又的申4專利範圍中所界定的本發明範圍内。 - 1- - i -- I - -- I I- - - - - I 士文 I-- I I - Γ- -II. - - (^1 TV 、-=-0 ' > ί' ί請先閱讀背面之注意事項再填寫本頁j •38-

Claims (1)

  1. 經濟部中央標準局貝工消費合作社印製 第87110219號專利申請案 A8 中文申請專利範固修正本(89年5月) 含f __ D8__ 六、申請專利範圍 一 ~~~~~~- 404132 1. 種處理圖框群之方法,該方法包含下列步驟: 將一輸入影像流的至少—個圖框群編碼;以及 在對整個輸入影像流編碼之前,先決定待分配給該 輸入影像流的另一圖框群之位元數,且將在—可變位 兀•傳送速率模式下對該另一圖框群編碼,其中該決定 步驟使用了得自該編碼步驟的一個或多個參數值。 2. 如申請專利範圍第丨項之方法,又包含下列步驟: 在—單一掃描可變位元傳送速率模式下將該另一圖 框群編碼,其中只在一次編碼掃描下將該另—圖框群 編碼。 3. 如申請專利範圍第2項之方法,又包含下列步驟: 針對該輸入影像流的其他圖框群,重複對該另一圖 框群執行該決定步驟及該編碼步驟,其中針對每—該 等其他圖框群進行的該決定步驟使用得自一個或多個 先削編碼的圖框群之一個或多個參數值。 4. 如申印專利範圍第2項之方法,其中該將另一圖框群編 碼的該步驟包含下列步驟: 决毛待指定給該另一圖框群的—個或多個圖框之一 理想位元數;以及 凋整该理想位元數,以便確保—解碼緩衝器中不會 發生一上溢狀況及一下溢狀況。 5. 如申叫專利範圍第4項之方法,其中該調整步驟包含下 列步驟: 決定一個或多個影像界限,用以設定待指定給該等 本紙張尺度適用中國國家標準(CNS) M说格(2](}χ297公釐) ---------^裝------訂------線 (請先聞讀背面之注-^項再填寫本頁) 經濟部中央標準局貝工消費合作社印製 第87110219號專利申請案 A8 中文申請專利範固修正本(89年5月) 含f __ D8__ 六、申請專利範圍 一 ~~~~~~- 404132 1. 種處理圖框群之方法,該方法包含下列步驟: 將一輸入影像流的至少—個圖框群編碼;以及 在對整個輸入影像流編碼之前,先決定待分配給該 輸入影像流的另一圖框群之位元數,且將在—可變位 兀•傳送速率模式下對該另一圖框群編碼,其中該決定 步驟使用了得自該編碼步驟的一個或多個參數值。 2. 如申請專利範圍第丨項之方法,又包含下列步驟: 在—單一掃描可變位元傳送速率模式下將該另一圖 框群編碼,其中只在一次編碼掃描下將該另—圖框群 編碼。 3. 如申請專利範圍第2項之方法,又包含下列步驟: 針對該輸入影像流的其他圖框群,重複對該另一圖 框群執行該決定步驟及該編碼步驟,其中針對每—該 等其他圖框群進行的該決定步驟使用得自一個或多個 先削編碼的圖框群之一個或多個參數值。 4. 如申印專利範圍第2項之方法,其中該將另一圖框群編 碼的該步驟包含下列步驟: 决毛待指定給該另一圖框群的—個或多個圖框之一 理想位元數;以及 凋整该理想位元數,以便確保—解碼緩衝器中不會 發生一上溢狀況及一下溢狀況。 5. 如申叫專利範圍第4項之方法,其中該調整步驟包含下 列步驟: 決定一個或多個影像界限,用以設定待指定給該等 本紙張尺度適用中國國家標準(CNS) M说格(2](}χ297公釐) ---------^裝------訂------線 (請先聞讀背面之注-^項再填寫本頁) 1°4132、申請專利範圍 ABCD —個或多個圖框的理想位元數之界限。 如申6青專利範圍第2項之方法,纟中將該另一圖框群绪 碼的該步驟包含下列步驟: 一在及另一圖框群内,碉整—影像類型的—理想目指 位元數其中該調整步驟包含:利用一第一換算因絮 換算孩輸入影像流的先前編碼的圖框群之一子誤差 累積,以及利用-第二換算因數,換算該另__ 的各圖框之一子誤差累積。 7·如申請專利範圍第6項之方法,其中該第—換算因數小 於該第二換算因數。 8. 如申請專利範圍第i項之方法,其中該決定步驟包含下 列步驟: 為垓另圖框群將一預定感知函數之斜率調變;以及 將孩經過調變的斜率用於一位元傳送速率方程式, 以便決定該位元數。 9. 如申明專利範圍第8項之方法,其中該預定感知函數包 含: Ck-/'lKF (QJ --------------IT------線 (請先聞讀背面之注意事項再填寫本頁} 經濟部中央樣準局員工消費合作社印製 f中F(Qk) = ai+a2Q /,其中叫、a2、及召是常數 ’ Q k是一量化因數,且κ代表一斜率值。 丨〇.如申請專利範圍第8項之方法,其中該位元傳送速率方 程式包含:ckJ^〇^ ^k, Cottle -2- 本紙伕尺度適用中國國家標準(CNS )八4規格(21〇χ:297公釐) i〇4m申請專利範圍
    其中Rk’tot代表一預定位元數中之剩餘位元數,Nk代 表輸入影像流中經調整後的圖框群數,p k代表所要 編2該另-圖框群之剩餘圖框數,Zk代表編碼困難 度值之總和,§k*^ck/Aak(其中·^是平均位 是平均量化因數),h等於Ck.lactual+Mkl_, 乂及31與32是常數。 η·如申請專利範圍第1項之方法,其中該決定步驟包含 列步驟: α 為另-圖框群決定-預定感知函數之轉換因數;以及 ^將該轉換因數用於一位元傳送速率方程式,以便 足遠位元數。 12.如申請專利範圍第Η項之方法’其中決定該轉換因數的 孩步驟包含使用下式: 決 4 PjC 心 tot C ff〇P 經濟部中央橾隼局員工消費合作社印装 其中Pk代表所要編碼的該另一圖框群之剩餘圖框數 ’ Rk,tut代表一預定位元數中之剩餘位元數,^ 輻入影像流之一速率,γ k代表每—圖框群的平均 因數之總和,N k代表一輸入影像流中經調整後的 群數’以及a2是一常數。 13.如申請專利範圍第!項之方法,其中該編碼步驟包冬 列步驟: 13 是該 量化 圖框 下 I— I —裝 訂 線 (請先聞讀背面之注意事項再填寫本頁) 404132 '申請專利範圍 A8 B8 C8 D8 將該輸入影像流的一第一圖框群及一第二圖框群編 碼,且其中該等一個或多個參數值包含該第一圖框群 的—第一位元傳送速率及—第一量化因數'以及該第 二圖框群的一第二位元傳送速率及一第二量化因數。 14·如申蜻專利範圍第1 3項之方法,其中該決定步驟包含下 列步驟: ° 使用一預定函數以決定待分配的該位元數,該預定 函數使用該第一位元傳送速率、該第二位元傳送速率 、該第一量化因數、及該第二量化因數。 15.如申請專利範圍第丨4項之方法,其中該預定函數包含: 經濟部中央標準局員工消費合作社印裂 其中代表一預定位元數中之剩餘位元數,N 表一輸入影像流中經調整後的圖框群數,pk代表所^ 編碼的該另一圖框群之剩餘圖框數,z k代表編碼困 度量2值之總和,§1^是^1/△一gk(其中可是平均 元,巧是平均量化因數),n k等於万k, a_l+ f 二 ’以及a丨與&2是常數。 16.如申請專利範圍第丨項之方法,其中該決定步驟包含 列步驟: 。 補償該輸入影像流的一個或多個不穩定狀況。 Π.如申請專利範圍第丨6項之方法,其中該等一個或多個不 代 難 位 下 裝 訂 線 (請先閲讀背面之注意事項再填寫本頁) 本紙乐尺度適种關家鮮(CNS )〜胁(21QX297公着 A8 B8 C8 D8 __404132 六、申請專利範圍 穩定狀況包含-換景、-切景、及—個或多個特殊效果 中之至少-個情形,且其中該補償步驟包含下列步驟 對用來決定該位元數的—預定函數之一個或多個 屬性進行一中心值濾波。 、擇 18.如申請專利範圍第16項之方法,其中該等一個或多個不 穩定狀況包含與該輸入影像流的非固定本質有關的一不 穩足狀況,且其中該補償步驟包含下列步驟:濾除造成 該不穩定狀況的各編碼位元屬性。 •如申請專利範圍第18項之方法,其中該滹除步驟包含下 列步驟: ° 對與該輸入影像流的一個或多個先前編碼的圖框群 相關聯之一位元傳送速率進行一線性濾波。 20. 如申請專利範圍第之方法,其中該決定步驟包含下 列步驟: 使用一預定函數以決定該位元數。 21. —種處理圖框群之方法,該方法包含下列步驟: 利用一個或多個先前編碼的圖框群決定複數個參數 值; / 為將在一單一掃描可變位元傳送速率模式下編碼的 一圖框群計算一預定函數之斜率,該計算步驟包含 列步驟:使用一個或多個該等複數個參數值;以及 利用所計算出的該斜率及一個或多個該等複數個 數值’彳于到所要編碼的該圖框群之一位元傳送速率 22. 如申凊專利範園第2 1項之方法,又包含下列步驟: ---------裝------訂------線 (請先閲讀背面之注意事項再填寫本I} 經濟部中央標隼局員工消费合作社印製 下 參 A8 B8 C8 D8 404132 申請專利範圍 ,在為所要編碼的該圖框群取得的該位元傳送速率, 為將在該可變位元你送请牽 又U兀评迗述+梃式下編碼的該圖框男 编!碼。 2乂如申請專利範圍第22項之方法’又包含下列步驟: 峡針射該輸人影像流的其他圖框群,重複該決定、封 鼻、取得 '及編碼步驟。 24_^申請專利範圍第23項之方法,其中針對所要編碼的每 一圖框群之該決定步驟包含下列步驟: 使用經過編碼的最後兩圖框群之資料。 25·如申請專利範圍第21項之方法,其中計算該斜率的該步 驟包含使用下列函數: Γ裝— (請先聞讀背面之注意事項再填寫本頁) % J^k, tot^k~~pJT 訂 經濟部中央標隼局員工消費合作社印製 其中f是該輸入影像流的—圖框速率,R k t是一 定位元數中之剩餘位元數,Nk代表一輸入影中二 凋整後的圖框群數,p k代表所要編碼的該另一圖框群 之剩餘圖框數,Zk代表編碼困難度量測值之總和。 26. 如申請專利範圍第21項之方法’其中該取得步^包各下 列步驟: G " 使用一預定函數以取得該位元傳送速率。 27. 如申請專利範圍第26項之方法,其中該預定函數包含: 預 經 線 ^ ^k. coc^): j -6- 本紙張尺度適用巾關家料(CNS) (211)><297公瘦) 404132 一 申請專利範圍 AS B8 C8 D8 經濟部中央橾牟局貝工消費合作社印裂 其代表一預定位元數中之剩餘位元數,心代 表〜輸入影像流中經調整後的圖框群數,Pk代表所^要 編碼的該另一圖框群之剩餘圖框數,Zk代表編碼困難 度量漁Μ直之總和,f k*ZMk/z^Qk(其中亡[;是平均位 元,I是平均量化因數),h等於万;Uctual+ f _ ’以及a〖與&2是常數。 28如申請專利範圍第2 6項之方法,其中該預定函數代表該 另—圖框群之一瞬時速率量化狀態,且一感知模型指示 該另一圖框群之一複雜性。 29. 如令請專利範園第2 8項之方法,其中該速率量化狀態係 由下式所界定: Ck = -fk^c+7/k,其中是一平均位元,&是一平 均量化換算因數,f k等於(其中 *-actUa|- C^j; - 2,actual ? AQk ="Q1: - 2 . a c t u a I : a c t u a 1 ) * >及々1:寺於(^(;_|,“11;1|+|:|^〇|^-|.01(:1"“1° 30. 如申請專利範圍第2 8項之方法,其中該感知模型係由下 式所界定: Ck = f'KF(Qk) 其中/ ’其中a,、a2、及沒是常數, Qk是一量化因數,且κ代表一斜率值。 31. 如申請專利範圍第2 1項之方法,其中該決定步驟包含下 列步驟: 補償該輸入影像流的一個或多個不穩定狀況。 本紙乐尺度適用中國國家標準(CNS ) A4说格(210X297公釐) (請先聞讀背面之注意事項再填寫本頁) 一裝· 訂 A8 B8 C8 D8 404132 '申請專利範圍 32_ ~種處理圖框群之方法,該方法包含下列步驟: 決定待分配給一輸入影像流的一圖框群之位元數, 該決定步驟使用該圖框群的一瞬時速率量化狀態、及 —個指示該圖框群的複雜性之感知模螌;以及 在該決定步驟所界定的一速率下,使用一可變位元 傳送速率模式將該圖框群編碼β 33_如申請專利範圍第3 2項之方法,其中該速率量化狀態係 由下式所界定: Ck = -fkQlc+?7k ’其中Ck是一平均位元,Qk-是—平 均量化換算因數,f k等於(其中△CpCl '.•ictual-Cfc^^ctual ' Δ Qk = Qk-2,actual*Qk.actual) 5 以及h等於石.hetuV m—丨。 34.如申請專利範圍第3 2項之方法,其中該感知模型係由下 式所界定: 一 Ck = f'KF(Qk) 其中F(Qk) = a丨+ a2Q / ’其中a丨、a2、及冷是常數, Q~k是一量化因數,且κ代表一斜率值。 •>5.如申清專利範圍第3 2項之方法,其中該可變位元傳送速 率模式編碼可讓經過壓縮的每一影像根據影像内壓缩及 影像間壓縮特性之複雜性,而具有不同的位元數。 J6. —種早一掃描可變位元傳送速率編碼器,包含: 一編碼引擎,該編碼引擎適於將一輸入影像流的至 少一個圖框群編碼;以及 決足裝置,該決定裝置在對整個輸入影像流編螞之 本紙張尺度適用巾家料(CNS )八4胁(2丨Qx297公疫 --------L^------IT------線 (請先閎讀背面之注意#•項再填寫本頁) 經濟部中央標準局員工消費合作社印裂 A8 B8 C8 D8 404132 申請專利範圍 ^ 夫疋待分配給該輸入影像流的另—圖框群之位 兀數且將在—可變位元傳送速率模式下對該另一圖 群扁馬其中該決定裝置使用了得自將該等至少一 個圖框群之-個或多個參數值。 37.如申請專=範圍第36項之編碼器,其中該編碼引擎又適 於在H描可變位元傳送速率模式下將該另一圖框 群編馬,、中,、在—次編碼掃描下將該另一圖框群編碼。 38·如申請專利範圍第37項之編碼器,其中將該另一圖框群 編碼的編.碼引擎包含: 決定裝置,用以決定待指定給該另一圖框群的一個 或多個圖框之一理想位元數;以及 調整裝置’用以調整該理想位元數,以便確保一解 碼緩衝器中不會發生-上溢狀況及_下溢狀泥。 39. 如申請專利範圍第3 8項之編碼器,其中該調整裝置包含 決足裝置,用以決定一個或多個影像界限,該等影像界 限係用來設定待指定給該等一個或多個圖框的理想位元 數之界限。 40. 如申請專利範圍第38項之編碼器,其中該決定裝置包冬: 凋變裝置,用以為该另一圖框群將一預定感知函數 之斜率調變;以及 將該經過調變的斜率用於一位元傳送速率方程式以 決定該位元數之裝置= 41 ·如申請專利範園第3 6項之編碼器’其中該決定裝置包含: 為該另一圖框群決定一預定感知函數的一轉換因數 -9- 本紙承尺度制中賴家標準(CNS ) A·*· ( 21GX297公着) --------C裝------訂-------線 (請先閱讀背面之注意事項再填寫本f ) 經濟部中央橾隼局員工消費合作社印製 經濟部中央榡隼局員工消費合作社印製 404132 δ» ---_______ D8___ 六、申請專利範圍 之裝置;以及 將該轉換因數用於一位元傳送速率方程式以決定該 位元數之裝置。 42. 如申請專利範圍第3 6項之編碼器,其中該等至少一個圖 框群包含該輸入影像流的一第一圖框群及一第二圖框群 ’且其中該等一個或多個參數值包含該第一圖框群的一 第一位元傳送速率及一第一量化因數、以及該第二圖框 群的一第二位元傳送速率及—第二量化因數。 43. 如申請專利範圍第4 2項之編碼器,其中該決定裝置包含 使用一預定函數以決定待分配的該位元數之裝置,該預 定函數使用該第一位元傳送速率、該第二位元傳送速率 、該第一量化因數、及該第二量化因數。 44. 如申請專利範圍第3 6項之編碼器,其中該決定裝置包含 補償該輸入影像流的一個或多個不穩定狀況之裝置。 45. 如申請專利範圍第44 員編碼’其中纟茨寺個多個 不穩定狀況包含一換景、一切景、及一個或多個特殊效. 果中之至少一個情形’且其中該補償裝置包含對用來決 定該位元數的一預定函數之一個或多個所選擇屬性進行 一中心值濾波之裝置。 46. 如申請專利範圍第4 4項之編碼器,其中該等一個或多個 不穩定狀況包含與該輸入影像流的非固定本質有關的— 不穩定狀況’且其中該補償裝置包含濾除造成該不穩定 狀況的各編碼位元屬性之裝置。 47. 如申請專利範圍第4 6項之編碼器,其中該遽除裝置包人 ' -10- 本紙張尺度逋用中國國家標準(CNS ) A4規格(210X297公董) ' --------- n m n I n· n I tf I n n n I T__I I I I (诗先聞讀背面之注$項再填寫本頁) A8 B8 C8 D8 404132 ----- 申請專利範圍 對與孩輸入影像流的一個或多個先前編碼的圖框群相關 聯的一位元傳送速率進行一線性濾波之裝置。 48·如申請專利範圍第3 6項之編碼器,其中該決定裝置是該 編碼弓丨擎的一部分。 49·—種單—掃描可變位元傳送速率編碼器,包含: 決疋裝置,該決定裝置利用一個或多個先前編碼的 圖框群決定複數個參數值; 計算裝置,該計算裝置為將在一單一掃描可變位元 傳送速率模式下編碼的一圖框群計算一預定函數之斜 率’該計算裝置使用一個或多個該等複數個參數值; 以及 得到位元傳送速率之裝置,用以利用所計算出的該 斜率及一個或多個該等複數個參數值,而得到所要編 碼的該圖框群之一位元傳送速率。 5〇.如申請專利範圍第4 9項之編碼器,又包含編碼裝置,用 以在為所要編碼的該圖框群取得的該位元傳送速率下, 為將在一可變位元傳送速率模式下編碼的該圖框群編碼。 D1.如申請專利範園第4 9項之編碼器,其中該得到裝置包含 利用一預定函數以得到該位元傳送速率之裝置。 52. 如申請專利範圍第5丨項之編碼器,其中該預定函數代表 該另一圖框群之一瞬時速率量化狀態,且—感知模型指 示該另一圖框群之一複雜性。 53. 如申請專利範圍第4 9項之編碼器,其中該決定裝置包含 補償該輸入影像流的一個或多個不穩定狀況之裝置。 54- —種單一掃描可變位元傳送速率編碼器,包含: -11 - ^纸張尺度適用冲國國家梂準(CNS ) A4規格(2丨OX297i^-'~~ --- --------- ^------.1T------.d. (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消资合作社印製 A8 B8 C8 D8 ------ 申請專利範圍 決·疋裝置,用以決定待分配給一輸入影像流的一圖 框群之位元數’該決定裝置使用該圖框群的一瞬時速 ^f—^1 —^n vr__vtnf nn n^l ^^^^1 ^^^^1 ^ (請先閎讀背面之注意事項再填寫本页) 率量化狀態、及一個指示該圖框群的複雜性之感知模 型;以及 ''編碼引擎’該編碼引擎適於在該決定裝置所界定 的一速率下’使用一可變位元傳送速率模式將該圖框 群編碼。 55·如申請專利範圍第5 4項之編碼器,其中該速率量化狀態 係由下式所界定: = - f π k,其中飞^是一平均位元,~Qk是一平 均量化換^因數’ !:k等於△UAQk(其中k=C Ual ^ k- 2,actual ' AQk = Qk- 2,actual~Qk,actual) * V^^^^k.liactual+^k^k i actua, 0 56如申請專利範圍第5 4項之編碼器,其中該感知模型係由 下式所界定: — _ Ck = f'KF(Qk) _其中F(Qk) = a,+a2Q夕,其中a|、a2、及/5是常數, _ Qk是—量化因數,且K代表一斜率值。 經濟部中央樣隼局K工消費合作社印策 )7.如申凊專利範圍第5 4項之編碼器,其中該可變位元傳送 速率模式編碼可讓經過壓縮的每一影像根據影像内壓縮 及影像間壓縮特性之複雜性,而具有不同的位元數。 58.—種製品,包含: 至少一個電腦可使用的媒體,該等電腦可使用的媒 也中包含電腦可讀取的程式碼裝置,用以進行各圖框 -12 本紙張尺度適用中關家網t ( CNS )八4辦_ ( 2似297公缝) ^04132 --------申請專利範圍 A8 B8 C8 D8 經濟部中央標隼局貝工消费合作社印製 群的處理’該製品中之電腦可讀取的程式碼裝置包含: 使-電腦進行編碼之電腦可讀取的程式碼裝置,用 乂將輸入影像流的至少一個圖框群編碼:以及 ,使-電腦進行決定之電腦可讀取的程式碼裝置,用 以在對整個輸入影像流編碼之前,先決 輸入影像流的另-圖框群之位元數,且將在一可= =傳运速率模式下對該另一圖框群編碼,其中使一電 腦進行決定之眾電腦可讀取的程式碼裝置使用了得 孩編碼步驟的一個或多個參數值。 59.如申請專利範圍第58項之製品,又包含: 使一電腦進行編碼之電腦可讀取的程式碼裝置, 以在一單一掃描可變位元傳送速率模式下將該另一 ^ t群、.爲碼,其中只在一次編碼掃描下將該另一圖框群 編碼。 60·如申請專利範圍第58項之製品,其中使一電腦進行決定 之該電腦可讀取的程式碼裝置包含: 使一電腦進行調變之電腦可讀取的程式碼裝置, 以為該另一圖框群將一預定感知函數之斜率調變;以及 使一電腦使用經過調變的斜率之電腦可讀取的程 碼裝置,用以將?茨經過調變的斜率用於一位元傳送 率方程式,以便決定該位元數。 61.如申请專利範圍第5 8項之製品’其中使一電腦進行決定 之該電腦可讀取的程式碼裝置包含: 使一電腦進行決定之電腦可讀取的程式碼裝置,用 請 先 閲 面 之 注 I 裝 圖 用 式 速 訂 • 13- 本紙張尺度逋用中國國家標準(CNS ) Α4規格(210 X 297公釐) 經濟部中央標準局貝工消費合作社印製 404132 S -------_D8____ 六、申請專利範固 以為該另一圖框群決定一預定感知函數之轉換因數; 以及 使一電腦使用轉換因數之電腦可讀取的程式碼裝置 ,用以將該轉換因數用於一位元傳送速率方程式’以 便決定該位元數。 62·如申請專利範圍第58項之製品,其中使一電腦進行決定 之該電腦可讀取的程式碼裝置包含: 使一電腦進行補償之電腦可讀取的程式碼裝置,用 以補償該輸入影像流的一個或多個不穩定狀況。 6j.如申請專利範圍第5 8項之製品,其中使一電腦進行決定 之該電腦可讀取的程式碼裝置包含: 使一電腦使用一預定函數以決定該位元數之電腦可 讀取的程式碼裝置。 64. —種製品,包含: 至少一個電腦可使用的媒體,該等電腦可使用的媒 體中包含電腦可讀取的程式碼裝置,用以進行各圖框 群的處理’該製品中之電腦可讀取的程式碼裝置包含: 使一電腦進行決定之電腦可讀取的程式碼裝置,用 以決定待分配給一輸入影像流的一圖框群之位元數’ 該電腦可讀取的程式碼裝置使用該圖框群的一瞬時速 率量化狀態、及一個指示該圖框群的複雜性之感·知模 型;以及 使一電腦進行編碼之電腦可讀取的程式碼裝置’用 以在使一電腦進行決定的該電腦可讀取的程式碼裝置 -14- 本紙張尺度適用中國國家揉準(CNS ) A4規格(210X297公釐) I 裝 訂 I線 (請先閱讀背面之注^^項再填寫本頁) ^04132 ~—~—.申請專利範圍 A8 B8 C8 D8 所界定的一速康τ 、、 <午下’使用一可變位元傳送速率模式將 孩圖框群編碼。 中4專利園第6 4項之製品其中該速率量化狀態係 由下式所界定: ’其中^是.一平均位元,Qk是一平 均量化換算因數, 1 > a C t u a I - C k 等於(其中△Cpf; 2?dCtUal ' Δ Qk = Qk-2,actual*Qk.actual) * 以及等於Γ 'l.actual + ζ kQ^ ., 66·如申請專利範圍第64項之製品,其 式所界定: 其中該感知模型係由下 _ Cic = f'KF(Qk) _其中F(Qk) = ai+a2Q /,其中ai、a2、及/?是常數, t是一量化因數,且K代表一斜率值。 67.如申請專利範圍第64項之製品,其中該可變位元傳送速 千模式編碼可讓經過壓縮的每一影像根據影像内壓縮及 衫像間壓縮特性之複雜性,而具有不同的位元數。 (請先閲讀背面之注意#'項再填寫本頁) b --6 - Γ 經濟部中央榡準局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐)
TW087110219A 1998-03-19 1998-06-25 A real-time single pass variable bit rate control strategy and encoder TW404132B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09/044,642 US6278735B1 (en) 1998-03-19 1998-03-19 Real-time single pass variable bit rate control strategy and encoder

Publications (1)

Publication Number Publication Date
TW404132B true TW404132B (en) 2000-09-01

Family

ID=21933502

Family Applications (1)

Application Number Title Priority Date Filing Date
TW087110219A TW404132B (en) 1998-03-19 1998-06-25 A real-time single pass variable bit rate control strategy and encoder

Country Status (5)

Country Link
US (1) US6278735B1 (zh)
JP (1) JPH11346362A (zh)
KR (1) KR100305941B1 (zh)
SG (1) SG80615A1 (zh)
TW (1) TW404132B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103517080A (zh) * 2012-06-21 2014-01-15 北京数码视讯科技股份有限公司 实时视频流编码器和实时视频流编码方法
US9268723B2 (en) 2011-12-21 2016-02-23 Intel Corporation Dram compression scheme to reduce power consumption in motion compensation and display refresh

Families Citing this family (111)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2334860B (en) * 1997-10-15 2002-08-21 Sony Corp Video data multiplexing device, video data multiplexing control method, encoded data stream multiplexing device and method and encoding device and method
GB2333656B (en) * 1998-01-22 2002-08-14 British Broadcasting Corp Compressed signals
GB2333657B (en) 1998-01-22 2002-08-21 Snell & Wilcox Ltd Video signal compression
GB2335104B (en) 1998-03-06 2002-01-30 British Broadcasting Corp Cascading of up conversion and down conversion
GB2337389B (en) 1998-05-15 2002-05-29 Snell & Wilcox Ltd Video signal processing
GB9822094D0 (en) 1998-10-09 1998-12-02 Snell & Wilcox Ltd Improvements in data compression
GB9822087D0 (en) * 1998-10-09 1998-12-02 Snell & Wilcox Ltd Improvements in data compression
GB9822092D0 (en) 1998-10-09 1998-12-02 Snell & Wilcox Ltd Analysis of compression decoded sequences
GB9824061D0 (en) 1998-11-03 1998-12-30 Snell & Wilcox Ltd Film sequence detection (nt4)
US6700623B1 (en) 1998-12-10 2004-03-02 Snell & Wilcox Limited Video signal processing using triplets of pixels
GB2346282B (en) * 1999-01-28 2003-02-19 Snell & Wilcox Ltd Bit rate control in compression encoding
US6453424B1 (en) * 1999-03-31 2002-09-17 International Business Machines Corporation System and method for temporally controlling instruction execution
FR2792798B1 (fr) * 1999-04-26 2001-05-25 Thomson Multimedia Sa Procede et dispositif de quantification pour compression video
EP1061750A3 (en) * 1999-06-18 2010-05-05 THOMSON multimedia Picture compression process, especially of the MPEG2 type
DE19946267C2 (de) * 1999-09-27 2002-09-26 Harman Becker Automotive Sys Digitales Transcodiersystem
GB2361126B (en) * 2000-04-05 2004-04-21 Snell & Wilcox Ltd Spatial video processing
US20020021756A1 (en) * 2000-07-11 2002-02-21 Mediaflow, Llc. Video compression using adaptive selection of groups of frames, adaptive bit allocation, and adaptive replenishment
JP4256574B2 (ja) * 2000-08-04 2009-04-22 富士通株式会社 画像信号符号化方法および画像信号符号化装置
US6741648B2 (en) * 2000-11-10 2004-05-25 Nokia Corporation Apparatus, and associated method, for selecting an encoding rate by which to encode video frames of a video sequence
US6990144B2 (en) * 2000-12-11 2006-01-24 Sony Corporation System and method for overrun catch-up in a real-time software
KR100394014B1 (ko) * 2001-06-23 2003-08-09 엘지전자 주식회사 영상 변환 부호화 장치
US7062445B2 (en) * 2001-01-26 2006-06-13 Microsoft Corporation Quantization loop with heuristic approach
US6947598B2 (en) * 2001-04-20 2005-09-20 Front Porch Digital Inc. Methods and apparatus for generating, including and using information relating to archived audio/video data
US7206453B2 (en) * 2001-05-03 2007-04-17 Microsoft Corporation Dynamic filtering for lossy compression
US6859494B2 (en) * 2001-07-27 2005-02-22 General Instrument Corporation Methods and apparatus for sub-pixel motion estimation
US6941017B2 (en) * 2001-09-18 2005-09-06 Tektronix, Inc. Temporal processing for realtime human vision system behavior modeling
FR2831742B1 (fr) * 2001-10-25 2004-02-27 Cit Alcatel Procede de transmission de paquets par l'intermediaire d'un reseau de telecommunications utilisant le protocole ip
US7403564B2 (en) * 2001-11-21 2008-07-22 Vixs Systems, Inc. System and method for multiple channel video transcoding
FR2832582A1 (fr) * 2001-11-21 2003-05-23 Canon Kk Procede et dispositif de determination d'au moins un parametre de codage de donnees multimedia
US7356079B2 (en) 2001-11-21 2008-04-08 Vixs Systems Inc. Method and system for rate control during video transcoding
US7027982B2 (en) * 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
US6847682B2 (en) * 2002-02-01 2005-01-25 Hughes Electronics Corporation Method, system, device and computer program product for MPEG variable bit rate (VBR) video traffic classification using a nearest neighbor classifier
US20040057465A1 (en) * 2002-09-24 2004-03-25 Koninklijke Philips Electronics N.V. Flexible data partitioning and packetization for H.26L for improved packet loss resilience
US7609767B2 (en) * 2002-05-03 2009-10-27 Microsoft Corporation Signaling for fading compensation
US7277486B2 (en) 2002-05-03 2007-10-02 Microsoft Corporation Parameterization for fading compensation
KR100848457B1 (ko) * 2002-05-06 2008-07-28 주식회사 케이티 비디오 인코더의 비트발생 제한 및 버퍼넘침 방지 방법
US7543326B2 (en) * 2002-06-10 2009-06-02 Microsoft Corporation Dynamic rate control
US20030235250A1 (en) * 2002-06-24 2003-12-25 Ankur Varma Video deblocking
US6980695B2 (en) * 2002-06-28 2005-12-27 Microsoft Corporation Rate allocation for mixed content video
US7042943B2 (en) 2002-11-08 2006-05-09 Apple Computer, Inc. Method and apparatus for control of rate-distortion tradeoff by mode selection in video encoders
US7194035B2 (en) * 2003-01-08 2007-03-20 Apple Computer, Inc. Method and apparatus for improved coding mode selection
FR2851397B1 (fr) * 2003-02-14 2005-05-13 Canon Europa Nv Procede et dispositif d'analyse de sequences video dans un reseau de communication
US8194751B2 (en) * 2003-02-19 2012-06-05 Panasonic Corporation Moving picture coding method and moving picture decoding method
JP2007525063A (ja) * 2003-06-26 2007-08-30 トムソン ライセンシング スライディング・ウィンドウ・チャネル制限に一致させるようマルチパス・ビデオレートを制御する方法
US7343291B2 (en) * 2003-07-18 2008-03-11 Microsoft Corporation Multi-pass variable bitrate media encoding
US7738554B2 (en) 2003-07-18 2010-06-15 Microsoft Corporation DC coefficient signaling at small quantization step sizes
US10554985B2 (en) 2003-07-18 2020-02-04 Microsoft Technology Licensing, Llc DC coefficient signaling at small quantization step sizes
US7602851B2 (en) * 2003-07-18 2009-10-13 Microsoft Corporation Intelligent differential quantization of video coding
US7383180B2 (en) * 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques
US8218624B2 (en) * 2003-07-18 2012-07-10 Microsoft Corporation Fractional quantization step sizes for high bit rates
US7580584B2 (en) * 2003-07-18 2009-08-25 Microsoft Corporation Adaptive multiple quantization
US8009739B2 (en) * 2003-09-07 2011-08-30 Microsoft Corporation Intensity estimation/compensation for interlaced forward-predicted fields
US7535959B2 (en) 2003-10-16 2009-05-19 Nvidia Corporation Apparatus, system, and method for video encoder rate control
FR2867291B1 (fr) * 2004-03-08 2006-05-19 Canon Kk Procede et dispositif d'acces a une image numerique stockee sur un ordinateur serveur
US7801383B2 (en) 2004-05-15 2010-09-21 Microsoft Corporation Embedded scalar quantizers with arbitrary dead-zone ratios
US7590059B2 (en) * 2004-05-21 2009-09-15 Broadcom Corp. Multistandard video decoder
US8406293B2 (en) 2004-06-27 2013-03-26 Apple Inc. Multi-pass video encoding based on different quantization parameters
US8005139B2 (en) 2004-06-27 2011-08-23 Apple Inc. Encoding with visual masking
JP4988567B2 (ja) * 2004-06-27 2012-08-01 アップル インコーポレイテッド マルチパスのビデオ符号化
US7474701B2 (en) * 2004-09-23 2009-01-06 International Business Machines Corporation Single pass variable bit rate control strategy and encoder for processing a video frame of a sequence of video frames
US9781433B2 (en) * 2005-01-26 2017-10-03 Avago Technologies General Ip (Singapore) Pte. Ltd. Systems, methods, and apparatus for real-time video encoding
JP2008533853A (ja) * 2005-03-10 2008-08-21 クゥアルコム・インコーポレイテッド 先読みを伴う準一定品質のレート制御
US20060227870A1 (en) * 2005-03-10 2006-10-12 Tao Tian Context-adaptive bandwidth adjustment in video rate control
US7974193B2 (en) 2005-04-08 2011-07-05 Qualcomm Incorporated Methods and systems for resizing multimedia content based on quality and rate information
US8208536B2 (en) * 2005-04-28 2012-06-26 Apple Inc. Method and apparatus for encoding using single pass rate controller
US8422546B2 (en) 2005-05-25 2013-04-16 Microsoft Corporation Adaptive video encoding using a perceptual model
US8582905B2 (en) * 2006-01-31 2013-11-12 Qualcomm Incorporated Methods and systems for rate control within an encoding device
JP4795223B2 (ja) * 2006-01-31 2011-10-19 キヤノン株式会社 画像処理装置
US7995649B2 (en) 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US8059721B2 (en) 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
US8503536B2 (en) 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US8130828B2 (en) 2006-04-07 2012-03-06 Microsoft Corporation Adjusting quantization to preserve non-zero AC coefficients
US7974340B2 (en) 2006-04-07 2011-07-05 Microsoft Corporation Adaptive B-picture quantization control
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
WO2008042259A2 (en) * 2006-09-28 2008-04-10 Thomson Licensing Method for rho-domain frame level bit allocation for effective rate control and enhanced video coding quality
US8238424B2 (en) 2007-02-09 2012-08-07 Microsoft Corporation Complexity-based adaptive preprocessing for multiple-pass video compression
US8498335B2 (en) 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US8243797B2 (en) 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
US8442337B2 (en) 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
US8331438B2 (en) 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
US8254455B2 (en) 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
US8750390B2 (en) * 2008-01-10 2014-06-10 Microsoft Corporation Filtering and dithering as pre-processing before encoding
US8160132B2 (en) 2008-02-15 2012-04-17 Microsoft Corporation Reducing key picture popping effects in video
US8189933B2 (en) 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
US8325800B2 (en) 2008-05-07 2012-12-04 Microsoft Corporation Encoding streaming media as a high bit rate layer, a low bit rate layer, and one or more intermediate bit rate layers
US8379851B2 (en) 2008-05-12 2013-02-19 Microsoft Corporation Optimized client side rate control and indexed file layout for streaming media
US7860996B2 (en) 2008-05-30 2010-12-28 Microsoft Corporation Media streaming with seamless ad insertion
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US8265140B2 (en) 2008-09-30 2012-09-11 Microsoft Corporation Fine-grained client-side control of scalable media delivery
JP5774995B2 (ja) * 2008-11-13 2015-09-09 トムソン ライセンシングThomson Licensing Gopマージおよびビット割付けを用いたマルチスレッド・ビデオ符号化
US8396114B2 (en) * 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
US8189666B2 (en) 2009-02-02 2012-05-29 Microsoft Corporation Local picture identifier and computation of co-located information
US20100223396A1 (en) * 2009-02-27 2010-09-02 Yahoo! Inc. Intelligent status polling
US9363534B2 (en) * 2009-10-29 2016-06-07 Vestel Elektronik Sanayi Ve Ticaret A.S. Method and device for processing a video sequence
US8331709B2 (en) * 2010-04-14 2012-12-11 Newport Media, Inc. Fixed buffer real-time image compression technique
US8705616B2 (en) 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
EP2472868A1 (en) 2010-12-29 2012-07-04 British Telecommunications Public Limited Company Video coding
US9271005B2 (en) * 2011-02-24 2016-02-23 Vixs Systems, Inc. Multi-pass video encoder and methods for use therewith
US9159139B2 (en) * 2011-07-14 2015-10-13 Technische Universitat Berlin Method and device for processing pixels contained in a video sequence
US9591318B2 (en) 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
US20130279882A1 (en) 2012-04-23 2013-10-24 Apple Inc. Coding of Video and Audio with Initialization Fragments
US10152389B2 (en) 2015-06-19 2018-12-11 Western Digital Technologies, Inc. Apparatus and method for inline compression and deduplication
US9552384B2 (en) * 2015-06-19 2017-01-24 HGST Netherlands B.V. Apparatus and method for single pass entropy detection on data transfer
JP6537396B2 (ja) * 2015-08-03 2019-07-03 キヤノン株式会社 画像処理装置、撮像装置および画像処理方法
EP3376766B1 (en) * 2017-03-14 2019-01-30 Axis AB Method and encoder system for determining gop length for encoding video
US10750175B2 (en) * 2017-05-04 2020-08-18 Sony Corporation Quantization partitioning for enhanced image compression
US10602147B2 (en) * 2018-07-10 2020-03-24 Samsung Display Co., Ltd. Efficient entropy coding group grouping methodology for transform mode
US10863179B1 (en) * 2018-09-05 2020-12-08 Amazon Technologies, Inc. Overlapped rate control for high-quality segmented video encoding
TWI806707B (zh) * 2022-07-13 2023-06-21 緯創資通股份有限公司 通訊方法及其通訊裝置

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5134476A (en) * 1990-03-30 1992-07-28 At&T Bell Laboratories Video signal encoding with bit rate control
JPH04358486A (ja) 1991-06-04 1992-12-11 Toshiba Corp 高能率符号化信号処理装置
US5231484A (en) 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
US5241383A (en) 1992-05-13 1993-08-31 Bell Communications Research, Inc. Pseudo-constant bit rate video coding with quantization parameter adjustment
US5426463A (en) 1993-02-22 1995-06-20 Rca Thomson Licensing Corporation Apparatus for controlling quantizing in a video signal compressor
US5703646A (en) 1993-04-09 1997-12-30 Sony Corporation Picture encoding method, picture encoding apparatus and picture recording medium
PL175445B1 (pl) * 1993-11-08 1998-12-31 Sony Corp Sposób i urządzenie do kodowania sygnału wizyjnego
JP3224465B2 (ja) * 1993-12-22 2001-10-29 シャープ株式会社 画像符号化装置
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
JPH07212710A (ja) 1994-01-21 1995-08-11 Hitachi Ltd 画像送信方法および画像送信装置および画像受信方法および画像受信装置および可変速度対応蓄積装置
EP0670663A1 (fr) * 1994-03-02 1995-09-06 Laboratoires D'electronique Philips S.A.S. Procédé et dispositif de codage de signaux numériques représentatifs d'une séquence d'images
US5566208A (en) 1994-03-17 1996-10-15 Philips Electronics North America Corp. Encoder buffer having an effective size which varies automatically with the channel bit-rate
US5877814A (en) * 1994-04-20 1999-03-02 Thomson Consumer Electronics, Inc. Asynchronous control signal generating apparatus
TW374283B (en) * 1994-05-25 1999-11-11 Sony Corp A multiple coding device
EP0710033A3 (en) * 1994-10-28 1999-06-09 Matsushita Electric Industrial Co., Ltd. MPEG video decoder having a high bandwidth memory
US5606369A (en) 1994-12-28 1997-02-25 U.S. Philips Corporation Buffering for digital video signal encoders using joint bit-rate control
US5539469A (en) * 1994-12-30 1996-07-23 Daewoo Electronics Co., Ltd. Apparatus for determining motion vectors through the use of an adaptive median filtering technique
FR2736743B1 (fr) 1995-07-10 1997-09-12 France Telecom Procede de controle de debit de sortie d'un codeur de donnees numeriques representatives de sequences d'images
JPH0937242A (ja) 1995-07-21 1997-02-07 Nippon Telegr & Teleph Corp <Ntt> 可変ビットレート画像信号符号化装置
JPH0970041A (ja) 1995-08-30 1997-03-11 Kokusai Denshin Denwa Co Ltd <Kdd> 可変ビットレート符号化装置
JPH0974566A (ja) * 1995-09-04 1997-03-18 Sony Corp 圧縮符号化装置及び圧縮符号化データの記録装置
JPH0993537A (ja) 1995-09-27 1997-04-04 Mitsubishi Electric Corp ディジタル映像信号記録再生装置及びディジタル映像信号符号化方法
US5675384A (en) 1995-10-03 1997-10-07 Nec Usa, Inc. VBR MPEG video encoding for ATM networks with dynamic bandwidth renegotiation
JP2000506686A (ja) * 1995-10-25 2000-05-30 サーノフ コーポレイション オーバラップブロック動き補償及びゼロツリーウェーブレット符号化を用いる低ビットレートビデオ符号化器
US5682204A (en) 1995-12-26 1997-10-28 C Cube Microsystems, Inc. Video encoder which uses intra-coding when an activity level of a current macro-block is smaller than a threshold level
KR970057960A (ko) 1995-12-27 1997-07-31 구자홍 디지탈 동영상 압축장치
US5715176A (en) 1996-01-23 1998-02-03 International Business Machines Corporation Method and system for locating a frame position in an MPEG data stream
CN1112809C (zh) 1996-03-02 2003-06-25 德国汤姆逊-布朗特公司 数字视频数据的编码或译码方法和装置
FR2748623B1 (fr) 1996-05-09 1998-11-27 Thomson Multimedia Sa Encodeur a debit variable
US5987179A (en) * 1997-09-05 1999-11-16 Eastman Kodak Company Method and apparatus for encoding high-fidelity still images in MPEG bitstreams

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9268723B2 (en) 2011-12-21 2016-02-23 Intel Corporation Dram compression scheme to reduce power consumption in motion compensation and display refresh
CN103517080A (zh) * 2012-06-21 2014-01-15 北京数码视讯科技股份有限公司 实时视频流编码器和实时视频流编码方法

Also Published As

Publication number Publication date
KR19990077445A (ko) 1999-10-25
KR100305941B1 (ko) 2001-09-26
US6278735B1 (en) 2001-08-21
SG80615A1 (en) 2001-05-22
JPH11346362A (ja) 1999-12-14

Similar Documents

Publication Publication Date Title
TW404132B (en) A real-time single pass variable bit rate control strategy and encoder
JP5173409B2 (ja) 符号化装置および符号化装置を備えた動画像記録システム
CN102006471B (zh) 视频编码的图片级速率控制
JP6286718B2 (ja) 高効率な次世代ビデオコーディングのためのフレーム階層応答型量子化を使用する、コンテンツ適応ビットレートおよび品質管理
US7023914B2 (en) Video encoding apparatus and method
US8559501B2 (en) Method and apparatus for adaptively determining a bit budget for encoding video pictures
KR100987765B1 (ko) 동영상 부호화기에서의 예측 수행 방법 및 장치
US7925108B2 (en) Encoding device and dynamic image recording system having the encoding device
US20100021071A1 (en) Image coding apparatus and image decoding apparatus
US20050094870A1 (en) Video encoding method and video encoding apparatus
CN113766226A (zh) 图像编码方法、装置、设备及存储介质
JP2009528738A (ja) 画像信号エンコードにおいて画像中のピクセル・ブロックの諸グループについてビット割り当てを決定するための方法および装置
WO2003061265A2 (en) Method and apparatus for selecting macroblock quantization in a video encoder
KR20070117660A (ko) 컨텐트 적응적 멀티미디어 처리
KR20070007295A (ko) 비디오 인코딩 방법 및 장치
US7373004B2 (en) Apparatus for constant quality rate control in video compression and target bit allocator thereof
US20100111180A1 (en) Scene change detection
KR20080063352A (ko) Min-max 접근법을 이용하여 비디오 코딩을 하기 위한2 패스 레이트 제어 기술
JP4081727B2 (ja) 画像符号化装置および画像符号化方法、並びに記録装置および記録方法
Pang et al. Dependent joint bit allocation for H. 264/AVC statistical multiplexing using convex relaxation
Ravi Chandra Varma et al. Pyramid coding based rate control for constant bit rate video streaming
Overmeire et al. Constant quality video coding using video content analysis
Childers A Study of Rate Control for H. 265/HEVC Video Compression
Liao et al. Content-adaptive Rate-Distortion Modeling for Frame-level Rate Control in Versatile Video Coding
Kang et al. SNR-based bit allocation in video quality smoothing

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MM4A Annulment or lapse of patent due to non-payment of fees