TW200400767A

TW200400767A - Method and apparatus for transcoding compressed video bitstreams

Info

Publication number: TW200400767A
Application number: TW092113354A
Authority: TW
Inventors: Li-Ming Wang; Krit Panusopone
Original assignee: Gen Instrument Corp
Priority date: 2002-05-17
Filing date: 2003-05-16
Publication date: 2004-01-01
Also published as: WO2003098938A3; KR20050010814A; MXPA04011439A; CA2485181A1; WO2003098938A2; EP1506677A2; JP2005526457A; AU2003237860A8; CN1653822A; AU2003237860A1; US20030215011A1; KR100620270B1

Description

200400767 玖、發明說明：【發明所屬技術領域】本發明關係視訊壓縮技術，及較具體而言，關係編碼，角午碼及碼轉換技術用於壓縮視訊位元流。【先前技術】視訊壓縮為一種技術用於編碼一視訊「流」或「位元流」成為與原有形式不同的編碼形式（一般為更小的形式視訊流為一移動圖像影像的電子形式。近年來，隨低價個人電腦普及，平常電腦使用者具有的磁碟空間及記憶體量大幅增加，網際網路存取利用率普及及通信頻寬更增加，經網際網路的流視訊的使用已變為尋常。一種較重要及廣為人知的編碼流視訊用的視訊壓縮標準為MPEG-4標準，由動畫專家群（MPEG)提供，ISO/IEC (國際標準組織/國際工程團）的一工作組負責發展國際標準用於壓縮，解壓縮，處理，及編碼移動圖像，音訊及其組合的形式。ISO吟辨公室位於 1 rue de Varemb6, Case postale 56, CH-1211 Geneva 20，瑞士。IEC 的辩公室位於 549 West Randolph Street，Suite 600, Chicago, IL 60661-2208，美國。 MPEG-4壓縮標準，正式標示為ISO/IEC 14496 (分6部份），為大家所知及用於運動視訊應用。儘管網際網路連接頻寬快速增加及高性能個人電腦普及，各使用者的網際網路連接速度及電腦功率之間有許多不同。這種不同需要網際網路内容提供者供應視訊流及其他多媒體内容形式成為終端使用者環境的一分集。例如，一新聞内容提供者希望提供視訊新聞夾至終端使用者，但 85429 200400767 必須迎合使用者分集的需求其連接至網際網路範圍從下端 33.6叫遗據機至—DSL，電㈣據機，或上端較高速寬頻連接。終端使用者的有效計算功率同樣分集。另外複雜 $問，為網路擁擠，結果限制資料流（如視訊）能在網際網路同2里時運迗的速率。這表示新内容提供者必須提供寬位元率範圍供有效視訊流，特定適合終端使用連接/計算料及變化的纟叫條件。、種長1仏相同視訊私式材料各種不同位元率的特別有效、、為視汛碼轉換。視釩碼轉換為一種方法藉由預壓縮位元流轉換成一新壓縮位元流具有不同位元率，訊框尺寸，視訊編碼標準等。視訊碼轉換對任何必須根據因素如網路擁擠，解碼器能力或終端使用者的申請求以不同位元率，角午析度或格式運送壓縮視訊位元流的應用特別有用。一般，壓縮視訊碼轉換器以較低位元率解碼一壓縮視訊 4元机及然後再編碼該已解碼位元流。雖然，非碼轉換器技術可提供類似能力，不過這些技術有高成本及儲存的缺點。例如，多位元率的視訊内容，格式及解析度各自分開，碼及儲存在一視訊伺服器上。不過，這種方法如預期只 k供許多分離選擇及預編碼，及需要大量的磁碟儲存空間。或者，一視訊系列可編碼成一壓縮「可伸縮」形式。不過，這種技術需要基本視訊編碼資源（硬體及/或軟體）以提供一有限數目的選擇。碼轉換技術提供的優點超過這些及其他非碼轉換器技術由於其超配合性提供一寬譜的位元率，解析度及格式的選 85429 200400767 擇:可同時容納的不同選擇的數目只根據能獨立碼轉獨立視訊流的數目而定。叩為了同時谷納大量不同選擇，必須提供大量的碼轉換器。儘管該應用碼轉換器的成本及配合性優點，大量^ 扠态仍然非常貴昂，由於主要硬體及軟體資源必須屬傳統視說碼轉換技術專用的資源。、、、如前述討論，確實需要—種最低成本及最小複雜性的視訊碼轉換器。、【發明内容】一：據本發明，一種方法用於碼轉換不同位元率包括接收 :罘一位元率的輸入壓縮位元流的一輸入壓縮視訊位元流 ^輸^縮視訊位元流。標示—輸出壓縮視訊位元流的、、新目標位兀率。部份編碼輸入位元流以產生解量化資枓二使用不同量化位準(Qp)再量化解量化資料以產生再量化貝料，及再編碼該再量化資料以產生輸出壓縮視訊位-元 >瓦。 $據本發明的一特徵，本方法進_步包括決定一適合初 :里化位皁（QP)用於再量化。監視輸出壓縮視訊位元流的 Z率’及調整量化位準以使輸出壓縮視訊位元流的位元年較接近目標位元率。 2據本發明的另外特徵，本方法進—步包括直接複製不又勺標頭資料至輸出壓纟自視訊位元流。旦康本I明的另外特徵，本方法進一步包括藉由解量化 I化資料及減去解量化資料決定再量化錯誤。使用一反 85429 200400767 向離散餘弦轉換（IDCT)處理量化錯誤以產生一相等錯嗖與 ^根據來自輸入壓縮視訊位元流運動補償參數施加運： ^貝至錯誤影像。運動補償錯誤影像4dct處理及施加丁處理錯誤影像至解量化资料祚補償校正。 ^作相再f化錯誤的運動，據本發明的另外特徵’再量化錯誤以8位元訊號數表示儲存於8位疋無訊號儲存緩衝器之前偏移其—半間距的量（即，+128)。擷取後，減去量化錯誤值。咸去偏私，储存原來訊號的再根據本發明的另外特徵，—全部為零CBp(編碼塊圖案）在碼轉換器出現以取代巨集堍鬼、、扁碼跳過。另外，用於使用運動補償的預先編碼模式，全邱王哔為零移動向量（MVs)出現在碼轉換器取代跳過巨集塊。根據本發明的另外膝彡吟 ' 如果碼轉換造成一全部為零編碼塊圖案（CBP)，選擇跳過锶 (禪跳也扁碼挺式。本方法主要用於不.使 ^ - 貝）的、，扁碼杈式。用於使用運動補償資料的預測模式，如果碼轉 ^ τ 得杈CBP為全零及移動向量為全零，則選擇跳過模式。執行本方法的裝置也加以說明。名詞表除非另有說明，或由並估m w 么二 ^ ^ /、用環境證明，本文使用的任何域的一般意義解釋。下照本發明最接近的技術領 ._ . ^ j名巧表的目的只是為了使本文及 “種技術文件的說明更為清楚及一致。 85429 -10- 200400767 AC係數： MPEG ： MPEG-4 ：任何一或兩座標的頻率不等於零的Dcτ係數。動畫專家群。改的MPEG移動圖像編碼標準目的為多媒體應用及廣大位元率範圍的視訊流。正式名稱為 ISO/IEC 14496，分 6部份。 B-VOP ；雙向預測編碼VOP ··使用來自過去及/或將來參考v〇p的運動補償預測編碼的VOP。反向相容性··一種新的編碼標準與舊的編碼標準反向相容如果解碼器的設計依舊編碼標準操作則能繼續操作以解碼全部或部份根據新編碼標準產生的位元流。反向移動向量：-種移動向量用於顯示順序後段時間一參考VOP的運動補償。反向預測：從將來參考VOP預測。基層： —可伸縮分層結構的獨立解碼層。二元《塊：-塊的尺寸為16xl6pels，與巨集塊共處，顯示二元α映像的形狀資訊，也稱作bab。元《映像、2D二元遮罩用來表示視訊物件的形狀致使不透明像素被認為是物件的部份而透明像素則不是物件的部份。位元流：一種形成資料的編碼形式的順序排列的位元系列。位元率··編碼位元流從儲存媒體或s 乂、吗路輸迗至解碼器的 85429 -11 - 200400767 輸入的速率。塊：一 8行x8列的樣品（像素）矩陣，或64 DCT係數 (源，量化或解量化）。對齊位元組：一個編碼位元流的一位元為對齊位元組如果其位置從該位元流的第一位元起為8位元的倍數。位元組： 8位元系列。環境基準計算編碼：二元形狀編碼使用的方法；也稱為cae。頻道：一種數位媒體或網路用於儲存或輸送根據MPEG-4 (ISO/IEC 14496)規格構成的位元流。色度格式：定義一巨集塊内的色度塊數量。色度成分：表示相對位元流中定義的原色的兩色差訊號之一的矩陣，塊或單樣品。色差訊號所使用的符號為Cr及Cb。 CBP ：編碼塊圖案。 CBPY ：可變長度碼表示巨集塊内的一非透明亮度塊的圖案具有至少一非内DC轉換係數。編碼B-VOP: —個已編碼的B-VOP。編碼VOP : —編碼VOP為一個已編碼I-VOP，一個已編碼 P-VOP或一個已編碼B-VOP。編碼I-VOP : —個已編碼的Ι-VOP。編碼P-VOP : —個已編碼的P-VOP。編碼視訊位元流：一或更多VOP系列的編碼形式根據MPEG-4 (ISO/IEC丨4496)規格定義。 -12- 85429 200400767 編碼順序：V〇p傳送及順序相同。^ 順序。本順序不需要與顯示編碼形式：_種編碼參數：用來顯:;式表示的資料元件。 a 丁、、爲碼視訊位元流特徵的使用者定義參數組。位开、、* ^ ， /礼的特徵由編碼參數表示。哭組件：的特徵由能解碼的位元流表示。 … 組成方法構成圖案的三矩陣（亮度及兩色差）之-的矩陣’塊或樣品。一方法規（非標準）將重建v〇p組成一景色及顯 7JT 〇 :縮：減少用來表示-項資料的位元數。 2位7°率編碼視訊：具有常數位元率的編碼視訊位元流。常數位元率；CBR : γ pE) ^ r、 <巧士口土冗成編碼位元流的操作其間變換比率資料元件 DC係數： DCT係數位元率維持不變。形狀控制率用的尺寸變換比率。編碼前及解碼後表示的一項資料。兩座標的頻率為零的DCT係數。特定餘弦基本函數的振幅。解碼器輸入緩衝器：視訊緩衝檢查符號標示的先入先出 (FIFO)緩衝器。解碼器··—解碼方法的一具體實施例。解碼（方法）：本規格定義的方法即讀取一輸入編碼位元流及產生解碼VOP或音訊樣品。解量化·在位元流的形式解碼之後及出現在反DCT之前 85429 -13- 200400767 重定標量化DCT係數的方法。數位儲存媒體； DSM ：一種數位儲存或傳輸裝置或系統。離散餘弦轉換； DCT : 不論正向離散餘弦轉換或反向離散餘弦轉換。 DCT為反向離散正交轉換。顯示順序：顯示解碼圖案的順序。一般本順序與出現在編碼器輸入的順序相同。 DQUANT : — 2位元碼標示I-，p-，及s(GMC)-V〇P的量化器的變化。編輯· 操作一或更多編碼位元流以產生一新編碼位元 blU的方法。確|忍編輯位元流必須符合jyjpEG-4 (ISO/IEC I4496)規格定義的要求。編碼器：一編碼方法的一具體實施例。編碼（方法）· 一種本規格未標示的方法即讀取輸入圖像流或首訊樣品及產生一有效編碼位元流如mpeg_4 (ISO/IEC 14496)規格所定義。加強層··可伸縮分層結構中一相對參考層（基層之上）。用於所有伸縮性的形式，.解碼方法的說明參考下層解碼方法及加強層本身的額外解碼方法。面部動畫參數單元； FAPU ：

特別正常化單元（如，轉換，角度，邏輯）定義以谷许使用任何面部模型解釋FAp一致產生合理的表情及語言發音的結果。 85429 -14- 200400767 面部動畫製作參數； F A P · .^流動畫製作參數即操作㈣特徵的位移及面部動畫製作;:及說話期間控制嘴型及面部表情的混合。 FAT : 從進來的FAP映像的一可下| τ # 了下載函數至面部網目的特徵控制點以提供F Δ p八机& 杌仏FAP分段線性加權用於控制面部移動。面部校正網目·· 3D網目的渣敝绛田、人，、氣妁π晰度用於杈正基準線面部模型的形狀及結構。面部清晰度參數； FDP：可下載資料解瑪器内以製作-基準線面部模土土特別面邓，或下載一面部模型包括如何製作動畫的資訊。FDP一般每次交談傳送一次，隨後為一壓縮FAP流。FDp包括特徵點用於杈正一基準線面部，面部特徵及座標以映像在面邵，動畫製作表，等。面部特徵控制點：—組㈣點中的—標準頂點用於定義面郅特徵内由FAP控制的臨界位置及容許用於分類基準線面部的形狀。面部内插法轉換；可下載節點开> ISO/IEC 14496_1定義用於選擇性映像進來的FAP至FAP在其應用於特徵點之萷’經加權有理多項式函數，用於複數交又華禹合標準FAP以鏈結其效果成為定製或專用面部 85429 -15- 200400767 模型。面部模型網目：2_D相鄰幾何形網目由垂直及平面多邊 %利用頂點座標定義’適合提供光測特性（如，特徵，彩色，標準）。削齊· 一種工具用於削齊- 戶丨一兀α遮罩周圍的值以便混合背景。 —位元整數的變數只取兩值（0及1)之一。如果定義編碼位元流的文句中使用名詞“禁用” 即表7F不使用該值。_般為了避免模仿開始碼。 -種時間内編碼巨集塊的方法以確保編碼器及解碼器反DCT處理之間失配錯誤不會過度累積。 " 種較新的編碼標準與舊的編碼標準正向相谷如果解碼条的设計依新編碼標準操作而能解碼舊編碼標準的位元流。正向移動向量：-種移動向量用於在顯示順序較早時間的一參考訊框VOP的運動補償。從過去參考VOP預測。 :訊框包括視訊訊號的空間資訊的線。用於連續視訊這些線包括從一瞬間開始及連續經過後續線至訊框的底部。訊框率的循環。訊框從組成方法輸出的速率旗標禁用氟強制更新正向預測訊框：訊框週期訊框率：將來參考VOP :將來參考VQP為依照顯㈣序比目前ν〇ρ 85429 -16 - 200400767 GMC ： GOV ：晚發生的一參考VOP。全球運動補償。 VOP 組。混合伸縮性··混合伸縮性為二（或更多）種伸縮性的結合。又錯：傳統電視訊框的特性其中訊框的交替線代表即時『同％景。在交錯訊框中，—欄表示首先必 /’、’、”員'。廷種欄稱為第-欄。第-攔可以為訊框的頂邵攔或底部欄。内編碼V〇P ·只使用本身資訊編碼的VOP。 X使用巨集塊或v〇P資訊編碼的巨集塊或V0P。内形狀編碼·不使用任何暫時預測的形狀編碼。中間形狀編碼：使用暫時預測的形狀編碼。位準·特别曲線内一組定義的MPEG-4(ISO/IEC 14496-2) 規^參數限制值。曲線包含—或更多位準。在同中’位準為-非零係數的絕對值（見-運 w伸、、傾刀層結構中表示順序位元流組之一及其解碼方法。層位元流··關係一特別层AA μ ㈢的—單位元流（必須結合層合格 ::如，“加強層位元流，，使用)。踩考層直接在已知加強層的下方解碼加強層下方的所有層）。二:巨陣，塊或單樣品表示訊號單色形式及相對 W以羲的原色。亮度用的符號為Υ。 I-VOP 内編碼層下層亮度成分 85429 -17- 200400767

Mbit ： 1，000,000位元。 MB ;巨集塊：4個8x8亮度資料塊及兩個（4:2:〇色度格式）相對8x8色度資料塊來自圖像的亮度成分的 16x1 6段區。巨集塊常用來表示樣品資料及樣品值的編碼形式及其他MPEG-4 (ISO/IEC 14496-2) 規格定義的語法的巨集塊標頭定義的資料元件。從上下文明白用法。 MCBPC ·巨集塊圖案編碼。這是一可變長度碼用來導出巨集塊種類及色度的編碼塊圖案。必須包括編碼巨集塊。物件平面成為三角形貼片。三角形網目元件的頂點稱作節點。節點之間的直線段稱為邊。: 個二角形相鄰則具有一共同邊。網目幾何形狀··節點的空網目移動：網目#外網目的三角結構。-間。p .、、、的暫時位移即時從-時間至下一時 MC ；用移動向量以=樣品值預測效率， VOP包括4^偏移至過去及/或將來4 值。 W中碼形成預測錯誤使用的福移動估計：移動向量：雙維向量用方法。以提供一偏移從目前 85429 -18- 200400767 圖像或欄的座標位置至一參考ν〇Ρ的座標。厂“多動向量：移動向量用於形狀運動補償。非内編碼：編碼巨集塊或v〇p以使用來自本身及來自巨集塊及其他時間產生V〇p的資訊。不透明巨集塊··一巨集塊具有全部255 P-VOP ；、早預測編碼赠：使用來自過去術的運動補償預測編碼的圖像。參數· 一變數為本規格語法範園内的-值。只能取兩值之一的變數稱為旗標。

過去參考圖像：過去參考vop為依照組合順序比目前VOP 早發生的一參考V〇p。圖像來源’編碼或重建影像資料。—來源或重建圖像”個8位元三角形矩陣組成表示亮度及兩色預測度訊號。—較早定義的編碼VQP。用於連續視訊’圖像與訊框相同。、使用預測值以提供目前正在解碼的樣料元件的估計。預測錯誤··樣品值戋资祖— 、、，飞貝科冗件的實值及其預測值之間的差。本規格的語法的定義子集膜訊框的特性其中所有^框樣品表示即時的同例子。輪廓漸進預測值先刖角^碼樣品值或資料元件的線型組合。 85429 -19- 200400767 量化矩陣：解量化器使用的一組64個8位元值。量化DCT係數：解量化前DCT係數。傳送一量化DCT係數的可變長度編碼形式作為編碼視訊位元流的部份。量化器刻度：位元流的一編碼刻度因素及由解碼方法使用以標不解量化。 QP : 量化參數。隨機存取：開始讀取及解碼任意點的編碼位元流的方法。重建VOP: —重建VOP由3個8位元數矩陣組成表示亮度及兩色度訊號。由解碼一編碼VOP獲得。參考VOP ··參考訊框為重建VOP編碼成編碼Ι-VOP或編碼 P-VOP的形式。參考VOP係用於正向及反向預測如果解碼P-VOP及B-VOP。重排序延遲：由VOP重排序造成解碼處理延遲。保留：在定義編碼位元流句子使用名詞“保留”表示將來使用該值定義ISO/IEC擴充。可伸縮分層結構：編碼視訊資料由一組大於一順序視訊位元流組成。伸縮性：伸縮性為一解碼器的能力以解碼一順序位元流組以產生一重建系列。另外，如果子集解碼便輸出有用視訊。能解碼的最小子集為該集稱為基層的第一位元流。集内其他的各位元流稱為加強層。如果定址一特定加強層，下層即表示該加強層之前的位元流。 -20- 85429 200400767 側面資訊：控制解碼器運轉飽和掃描順序中非零係係數的絕對值稱為藉由設定其值達最過一定義範圍。所需的位元流資訊數之前的零係數的數位準。大或最小範圍以限制。非零一值超源；輸入空間預測名詞用來說明視訊材料或其在編碼前的特性。預測導自m伸縮性使用的下層解瑪器的一解空間伸縮性：一種伸縮性並中 τ偈庄具中加強層也使用導自下層不使用移動向量的樣品資料的預測。各層具：不同的VOP尺寸或V0P速率。靜止子畫面:亮度，色度及二元α平面用於及時不變的物件。子真面Ρ二S V〇P ·使用由纏繞全部或部份靜止子晝面獲得的資訊編碼的圖像。開始碼：唯—32位元㈣人編碼位元流。用於許多用.途〜包括識Μ編碼語法的一些結構。充填（位元）；充填（位元組插入編碼位元流的碼字並在解碼處理中丟茱。其用途為增加流的位元率否則比希望的位元率低。暫時預測：預測導自定義為空間預測外的參考νορ。暫時伸縮性：-種伸縮性其中—加強層也使用導自下層使用移動向量的樣品資料的預測。各層具有相同的訊框尺寸，但不具有相同VOP速率。 85429 -21- 200400767 頂層· 可伸縮分層結構的一最上層（且有3丄漆明曰鱼祕· 目有取尚層的id) 〇透月巨集塊.具有所有零形狀遮罩的巨集塊。 β變位7G率’ VBR .解碼編碼位元流期間位化的操作。手^時間笑可變長度編碼； VLC：用於編碼分配於頻繁事件的較短碼字及用於少、、頻繁事件的較長碼字的反向程序。視訊緩衝檢查符號； VBV：—假設解碼器概念上連接編碼器的輸出。並用途為提供-限制編碼器或編輯方法產率的可變性。 ” 視訊物件； VO ：一訊框内所有VOP的成分。視訊物件層； VOL : — VOP的暫時順序。視訊物件平面； VOP : 所屬訊框内任意形狀的區域。 VOP重排順序：如果編碼順序與顯示的組成順序不同，重排重建VOP順序的方&。如果B_Vc^現在一位元流中便發生VOP重排順序。如果解碼低延遲位元流便沒有vOP重排順序。視訊交談層··編碼視訊位元流的最高語法結構。人包含'一系列的一或更多編碼視訊物件。嘴型：嘴，舌及頷的實際配置形態視覺上與談話聲音 85429 -22- 200400767 的音位有關。丁旦¢7 VOP的方法逆止子畫面描出少數移動參數（0, 2, 4, 8)驅動的全球空間轉換組成以回收亮度，色度及形狀資訊。曲折掃描順序：DCT係數的—特別系列排順序⑽最低空間頻率至最高。【實施方式】關係編碼，解碼本發明關係視訊壓縮技術，及較具體及碼轉換技術用於壓縮視訊位元流。根據本發明’ 一成本合理有效碼轉換器包括解碼一輸入流降至巨集塊”，分析標頭資訊解量化及料解碼該巨集塊’調整量化參數以相配希望輸出流特性，然後再量化及再編碼巨集塊’從輸人流至輸出流複製未變或不變頭資訊。 h 視訊瑀轉柊$ 圖1為根據本發明一完全視訊碼轉換器100的方塊圖。一輸入位元流（舊位元流）102碼轉換輸入碼轉換器100位於 VOL (視訊物件層）標頭處理塊11〇及連續處理經3標頭處理塊（V0L標頭處理塊110，GOV標頭處理塊120及v0P標頭處理塊130)，一部份解碼塊14〇，一碼轉換塊ι5〇及一再編碼塊 16 0。 V0L標頭處理塊Π0解碼及抽取輸入位元流102的VOL標頭位元112。其次，G0V標頭處理塊12〇解碼及抽取g〇v (VOP組）標頭位元丨22。其次，VOP (視訊物件平面）標頭處 85429 -23- 200400767 理塊130解碼及抽取輸入v〇P標頭位元132。輸入v〇p標頭位元132包含資訊，包括量化參數資訊，有關如何連結原來壓縮編碼的位元流102内的巨集塊。在VOL，GOV及V0P標頭位元（分別112，122及132)已經抽取後’在邵份解碼塊丨4〇中部份解碼剩下的位元流（主要由巨集塊組成，以下討論）。部份解碼塊14〇由巨集塊標頭資訊的分離巨集塊資料組成及按需要（根據儲存在標頭位元編碼資訊）解量化成為可用形式。率控制塊180藉由決定新量化參數182及184回應一希望新位兀率輸入訊號1〇4其中輸入位元流1〇2必須重壓縮。完成後，部份監視新位元流162 (以下討論）及調整量化參數 182及184以維持新位元流162在希望的位元率。新決定量化參數184併入調整塊170的輸入ν〇ρ標頭位元132以產生輸出標頭位元172。率控制塊18〇也提供量化參數資訊182至碼轉換塊150以控制再量化（壓縮）自輸入位元流1〇2的解碼視訊資料。 _ 碼轉換塊150操作一來自部份解碼塊14〇的解量化巨集塊資料及根據來自率控制塊18〇的新量化參數182再量化該巨集塊資料。碼轉換塊150也處理運動補償及編碼資料插入巨集塊，保持追蹤及補償量化錯誤（原來位元流及再量化位元流之間因量化產生的差）及決定再量化位元流中各巨集塊的編碼模式。再編碼塊160根據由碼轉換器決定的編碼模式再編碼碼轉換位元流以產生一新位元流162。再編碼塊Μ 乂沉’⑻”如有需要认術標頭位以分別⑴^及⑴） 85429 -24- 200400767 於適當位置重插入新位元流1 62 (標頭資訊的詳細說明參考下列圖2A)。輸入位元流102可以是編碼的VBR (可變位元率）或CBR (不變位元率）。同樣，輸出位元流可以是編碼的VBR或CBR。 MPEG-4位元流結構圖2A為一 MPEG-4位元流200的結構示意圖，顯示如MPEG-4 規格定義的層結構。VOL標頭2 1 0包括下列資訊：

-物件層ID _ VOP時間增量解析度 -固定VOP率 -物件尺寸 -交錯/非交錯符號 -子畫面/GMC -量化形式 -量化矩陣，如有 - 該資訊包括在VOL標頭210内影響所有後續資訊必須解釋及處理。 VOL標頭之後為GOV標頭220，包括下列資訊： -時間碼 -關閉/打開 -斷鏈 GOV標頭220控制後續一或更多VOP的解釋及處理。各VOP包括一 VOP標頭23 0及一或更多巨集塊（MBs) (240a ，b，c.·.)。VOP標頭230包括下列資訊： -25- 85429 200400767 -VOP編碼形式（P，B，S或I) - VOP時間增量 -編碼/直接（未編碼） "猶形式 -最初始量化參數（QP) -移動向量碼（MV) VOP標頭23 0影響後續MBs (24〇)的解碼及解釋。圖2B顯示一巨集塊（MB) 240的一般格式。一巨集塊或MB 240由一 MB標頭242及塊資料244組成。MB標頭242的格式及編碼資訊係根據V0P標頭230的定義。總之，MB標頭242 包括下列資訊： -碼模式（内部，中間，等） -編碼或直接（未編碼） -編碼塊圖案（CBP) -AC預測旗標（AC_pred) -量化參數（QP) -交錯/非交錯 -移動向量（MVs) 各MB標頭有關的塊資料244包含可變長度（VLC)編碼DCT 係數用於6個由MB表示的8x8像素塊。標頭處理參考圖1，根據位元流顯示，VOL標頭處理塊11 0檢查輸入位元流1 02用於識別VOL標頭。偵測V0L標頭後，由識別及解碼標頭相關的輸入位元流的各編碼層（VOL，G0V， -26 - 85429 200400767 VOP，等）開始處理輸入位元流102。處理VOL，GOV及VOP 標頭如下： 1. VOL標頭虛理： VOL標頭處理塊1 1 0偵測及識別輸入位元流1 02中的一 VOL標頭（如MPEG-4規格定義）及然後解碼儲存在VOL標頭内的資訊。然後將該資訊傳遞至GOV標頭處理塊120，包括位元流，用於進一步分析及處理。分出VOL標頭位元112用來重插入輸出位元流（新位元流）1 62。用於率減少碼轉換，並不需要改變輸入位元流102及輸出位元流162之間VOL標頭的任何資訊。因此，VOL標題位元112可簡單複製存入輸出位元流162中適當位置。 2. GOV標頭處理：根據由VOL標頭處理塊110傳遞的資料，GOV標頭處理塊 120搜尋輸入位元流102内的一 GOV標頭（如MPEG-4規格定義）。因為VOP (及VOP標頭）在GOV標頭下可以不編碼，VOP 標頭可獨立於GOV標頭產生。如果GOV標頭在輸入位元流 102中發生，由GOV標頭處理塊120識別及解碼，及分出GOV 標頭位元122用於重插入輸出位元流162。任何解碼GOV標頭資訊及輸入位元流傳遞至VOP標頭處理塊130作進一步分析及處理。由於使用VOL標頭，不需要改變輸入位元流 102及輸出位元流162之間GOV標頭的任何資訊，所以GOV 標頭位元122係簡單複製存入輸出位元流162中的適當位置。 3. VOP標頭虛理： -27- 85429 200400767 V〇P標頭處理塊130識別及解碼輸入位元流102的任何 VOP標頭（如MPEG-4規格定義）。分出偵測的VOP標頭位元 13 2及傳遞至一 QP調整塊170。也將解碼VOP標頭資訊及輸入元流102傳遞至部份解碼塊140作進一步分析及處理。解碼VOP標頭資訊由部份解碼塊140及碼轉換塊150使用作 MB巨集塊解碼及處理。因為MPEG-4規格限制QP改變從MB 至MB +/- 2，基本要求各VOP標示適當初始QP。初始QP形成VOP標頭的一部份。根據率控制塊1 80出現的新位元率 1 04，及在輸出位元流162觀察的位元率的環境下，率控制塊1 80決定適當量化參數（QP) 1 82及提供參數至碼轉換塊 180作MB再量化。提供適當初始量化參數184至QP調整塊 1 70用於修改偵測VOP標頭位元132及藉由將初始QP併入偵測VOP標頭位元132而產生新VOP標頭位元172。新VOP標頭位元172然後插入輸出位元流162的適當位置。 4. MB標頭處理： MPEG-4為一根據編碼系統的方塊其中各訊框分割成巨集塊MBs。各MB由1個16x16亮度塊（即4個8x8亮度塊）及2 個8x8色度塊組成。VOP中的MB係一接一方式從左到右及從上到下編碼。如MPEG-4規格定義，VOP由一 VOP標頭及許多MBs表示（見圖2A)。為了效率簡化，本發明的MPEG-4 碼轉換器100只部份解碼MBs。即是，MBs只處理及解量化 VLD (可變長度解碼，或解碼VLC編碼資料）。圖3為部份解碼塊300的方塊圖（比較130，圖1)。MB塊資料由VLC編碼量化DCT係數組成。必須轉換為解編碼，解 -28- 85429 200400767 量化係數用於分析及處理。可變長度編碼（VLC) MB塊資料位元302由VLD塊310作VLD處理以擴大成解編碼’量化 dct係數，及然後於解量化塊（Q-1) 320解量化以產生解編碼及解量化DCT係數3 22形式的解量化MB資料322。 MB標頭（242)及MB塊資料（244)的編碼及解說係根據所屬VOP的種類而定。MPEG-4規格定義4種VOP: I-VOP或「内編碼」VOP，P-VOP或「預測編碼」V0P，S-V0P或「子畫面」VOP及B-VOP或「雙向預測編碼」vop。各種VOP的 MB標頭（242)包含的資訊及MB塊資料（244)的格式及解釋如下： I-VOP 的 MB層如MPEG-4規格定義，I-VOP的MB標頭包括下列編碼參數：

-MCBPC -AC預測旗標（AC—pred—flag)

-CBPY -DQUANT，及 -Interlace_inform I-VOP的定義MB塊資料只有兩種編碼模式：intra及 intra__q。 MCBPC表示MB的種類及兩個8x8色度塊的編碼圖案。 AC_pred_flag表示如果使用AC預測。CBPY為4個8x8亮度塊的編碼圖案。DQUANT表示差動量化。如果VOL内交錯設定，interlace_inform包括用於轉換MB塊資料的DCT係數的 -29- 85429 200400767 DCT (離散餘弦轉換）種類。 P-VOP 的 MB 層如MPEG-4規格定義，P-VOP的MB標頭包括下列編碼參數：

-COD -MCBPC -AC預測旗標（AC—pred—flag)

-CBPY

-DQUANT -Interlace__inform

-MVD -MVD2 -MVD3 及 -MCD4 MB的移動向量（MVs)為差動編碼。即是，編碼移動向量差（MVDs)，-非 MVs。MVD = MV—PMV，其中 PMV為預測 MV 〇 I-VOPs的MB塊資料定義有六種編碼模式：not_coded， inter，inter_q，inter_4MV，intra及 iiitra_q 〇 COD為MB是否編碼或不編碼的符號。MCBPC表示MB的種類及兩個8x8色度塊的編碼圖案。AC_pred_flag只在 MCBPC表示intra或intra—q編碼時出現，並表示是否使用AC 預測。CBPY為4個8x8亮度塊的編碼圖案。DQUANT表示差動量化。如果VOL標頭標示interlace，interlace_inform標示 -30- 85429 200400767 DCT (離散餘弦轉換）種類，場預測及頂或底預測。MVD， MVD2，MVD3及MVD4只在MCBPC標示適當編碼時出現。塊資料只在MCBPC及CBPY標示適當編碼時出現。 S-VOP 的 MB層如MPEG-4規格定義，P-VOP的MB標頭包括下列編碼參數： -COD -MCBPC -MCSEL -AC_pred_flag -CBPY -DQUANT -Interlace_inform -MVD -MVD2 -MVD3 及 -MCD4 除了 P-VOP定義的六種碼模式外，MPEG-4規格定義 S-VOP額夕卜兩種編碼模式：inter_gmc 及 inter_gmc—q。MCSEL 只在MCBPC標示的編碼模式為inter或inter_q時於MCBPC 之後產生。如果設定為MCSEL，MB以inter__gmc或inter_gmc_q 編碼，而後沒有 MVDs (MVD，MVD2，MVD3，MVD4)。 Inter_gmc為一種編碼模式其中MB以inter模式編碼具有全球運動補償。 -31 - 85429 200400767 Β-VOP 的 MB層如MPEG-4規格定義，P-VOP的MB標頭包括下列編碼參數··

-MODB -MBTYPE -CBPB -DQUANT - Interlace_inform -MVDf -MVDb，及 -MVDB CBPB為一 3至6位元碼表示B-VOP編碼塊圖案，如果由 MODB表示。MODB為一可變長度碼只在B-VOP的編碼巨集塊中出現。用來表示是否ΜΒΤΥΡΕ及/或CBPB資訊在巨集塊出現。 MPEG-4規格定義五種B-VOP的MB編碼模式：not—coded ，direct，interpolate—MC—Q，backward MC_Q，及forward—MC—Q 。如果跳過最近I-或P-VOP的一 MB，則B-VOP的相對MB也要跳過。否則，不跳過該MB。每個不跳過的B-VOP的MB 出現MODB。MODB表示如果ΜΒΤΥΡΕ及CBPB隨後。ΜΒΤΥΡΕ 表示移動向量模式（出現MVDf，MVDb及MVDB)及量化 (DQUANT)。碼韓換參考圖1，在部份解碼塊140的VLD解碼及解量化後，解 -32- 85429 200400767 碼及解量化MB塊資料（參考322,圖3)傳遞至碼轉換引擎150 (包括前處理塊決定的資訊）。碼轉換塊1 50再量化解量化MB 塊資料使用來自率控制塊（以下詳述）的新量化參數（QP) 182 ，及建造一再編碼（碼轉換）MB，決定新MB的適當的新編碼模式。VOP種類及MB編碼（如MB標頭標示）影響碼轉換塊 15 0處理來自部份解碼塊140的解碼及解量化塊資料。各MB 種類（如VOP/MB定義）具有一特別策略（以下詳述）用於決定新MB的編碼形式。圖4A-4G為用來處理解碼及解量化塊資料的各種碼轉換技術的方塊圖，並結合各種VOP/MB編碼形式討論如下。 Ι-VOP的MB^I棘換 Ι-VOP的MBs的編碼為intra或intra_q模式，即是，編碼不參考其他VOP，先前或以後。圖4A為一用於處理intra/intra_q 編碼MBs的碼轉換塊400a方塊圖。解碼MB資料402 (比較 3 22，圖3)輸入碼轉換塊400a及出現於量化器塊410。量-化器塊根據來自率控制塊（參考圖1，180)的新QP 4 12再量化解量化MB資料402及提供結果的再量化MB資料至模式決定塊480，其中選擇一適當模式以再編碼再量化MB資料。再量化MB資料及模式選擇482傳遞至再編碼器（見160,圖1)。決定編碼模式的技術的詳細說明如下。解量化MB資料在 intra/intra_q編碼模式中為直接量化無運動補償（MC)。同時也傳遞再量化MB至一解量化塊420 (Q·1)其中不執行量化以產生DCT係數。如熟悉本技術者所知，碼轉換塊400a出現的解量化MB資料402及解量化塊420產生的DCT係數為由 -33 - 85429 200400767 碼轉換MB表示的視訊影像資料的頻率-範圍形式。不過，因為量化由量化塊410根據導出解量化mb資料402的原來 MB資料使用以外最有可能的不同qp而執行，其中解量化塊 420產生的DCT係數及出現在碼轉換塊4〇〇&的解量化mb資料402之間有差異。這些差異係在計差塊425計算，及經IDCT 塊43 0的IDCT處理（反向離散餘弦轉換）以產生一 r錯誤影像」表示由差異造成最後輸出位元流的量化錯誤。量化錯誤的錯誤影像形式儲存在一訊框緩衝器44〇 (FB2)内。因為量化錯誤可為正或負，但像素資料未帶符號，錯誤影像形式偏移一半的FB2動態範圍。例如，假設8位元像素，FB2 的任何項目的範圍可從〇至255。影像資料向上偏移+128致使錯誤影像值從-128至+127相對FB2項目值為0至255。與 MB合併儲存FB2的内容用於結合其他v〇P/編碼形式的運動補償（MC)。熟悉本技術者會立刻承認有許多不同的方法處理數目-轉換（不同形式的數，如帶符號及未帶符號混雜），及上述的偏移技術只代表一種技術，不能作為限制。必須注意I-VOP的MB不可跳過。 P-VOP的MB石馬棘換 P-VOP 的 MB 可用 intra/intra_q，inter/inter_q/inter_4MV、編碼，或跳過。不同種類（inter，inter_q，inter__4MV)的MB為不同的碼轉換。上述碼轉換Intra/intra_q編碼P-VOP的MB參考圖4A。碼轉換Inter，inter_q&inter_4MV編碼的MB如圖 4B所示。跳過MB的處理如圖4C所示。 -34- 85429 200400767 圖4B為碼轉換塊400b的方塊圖，適合碼轉換原為inter， inter_q4inter_4MV編碼的MB資料，如由VOP及MB標頭表示。這些編碼模式使用運動補償。在碼轉換P-VOP之前，傳送訊框緩衝器FB2 440的内容形至訊框緩衝器FBI 450。 FBI的内容出現於運動補償塊460。在儲存於FB2 440之前加在錯誤影像資料的偏移在FB 1 450擷取後反向。運動補償塊 460 (MC)也接收碼模式及移動向量資訊（從MB標頭部份解碼，參考圖3)及如MPEG-4規格標示操作以產生一運動補償「影像」然後在DCT塊470作DCT處理以產生運動補償DCT 係數。這些運動補償DCT係數於合併塊405合併進來解量化 MB資料以產生運動補償MB資料。合併結果只將運動補償加在碼轉換MB錯誤（原來MB資料及碼轉換MB資料482之間的差異作為使用不同QP再量化的結果）。運動補償MB資料在量化器塊410出現。與上述圖4A所示相似，量化器塊根據來自率控制塊（參考圖1，180)的新QP 4 12再量化運屬補償MB資料及提供結果的再量化MB資料至模式決定塊480，其中選擇一適當模式以再編碼再量化 MB資料。再量化MB資料及模式選擇485傳遞至再編碼器（見 1 6 0，圖1)。決定編碼模式的技術的詳細說明如下。T同時也傳遞再量化MB至一解量化塊420 (Q·1)其中不執行量化以產生DCT係數。如前述，因為量化由量化塊410根據導出解量化MB資料402的原來MB資料使用以外的不同QP而執行，其中解量化塊420產生的DCT係數及計差塊425計算的運動補償MB資料之間有差異，及經IDCT塊430的IDCT處理 -35- 85429 200400767 (反向離散餘弦轉換）以產生一「錯誤影像」表示由差異造成最後輸出位元流的量化錯誤。量化錯誤的錯誤影像形式儲存在一訊框緩衝器FB2 440，如前述。因為量化錯誤可為正或負’但像素資料未帶符號，錯誤影像形式偏移一半的FB2 動態範圍。圖4C為碼轉換塊4〇〇c的方塊圖，適合原來編碼為「跳過」的MB，如由V0P及MB標頭表示。在這種情況下，如果編碼模式為「inter」及所有係數（MB資料）及所有運動補償向量（MV)為零，則處理mb及MB資料。藉由強制所有解量化 MB資料402及所有移動向量462 (MV)為零便可完成而上述碼轉換的說明須參考圖4B。由於先前訊框的剩餘錯誤資訊’由合併器塊405產生的運動補償MB資料可能包括非零元件，表示編碼的影像資訊。因此，跳過的MB在碼轉換後可能產生一非跳過MB。這是因為由率控制塊（參考180，圖1) 分配的新QP 412能隨MB改變。原來非跳過MB在再量化後不具有非零DCT係數。另一方面，原來跳過的MB在MC及再量化後具有一些非零DCT係數。 S-VOP的MB碼棘換 OPs或「子畫面VOP」與P-VOPs相似但容許兩額外MB編碼模式。inter—gmc及 inter_gmc—q。原來以 intra，intraq—q， inter，丨11^1：_4及inter_4MV編碼的S-VOPs MBs的處理由如上述類似編碼的 P-VOP MBs。原來以 inter—gmc，inter_gmc__q 編碼及跳過的S-VOPs MBs的處理如圖4D所示。圖4D為碼轉換塊400d的方塊圖，適合碼轉換原為inter_gmc -36- 85429 200400767 ，inter_gmc_q編碼的MB資料，如由VOP及MB標頭表示。這些編碼模式使用GMC (全球運動補償）。如P-VOP，在碼轉換S-VOP之前，訊框緩衝器FB2 440的内容傳送至訊框緩衝器FBI 45 0。FBI的内容在運動補償塊460中出現用於GMC 。在儲存於FB2 440之前加在錯誤影像資料的偏移在從FBI 45 0擷取後反向。運動補償塊460 (MC)也接收GMC參數資訊 462 (從MB標頭部份解碼，參考圖3)及如MPEG-4規格標示操作以產生一 GMC影像然後在DCT塊470作DCT處理以產生運動補償DCT係數。這些運動補償DCT係數於合併塊405 合併進來解量化MB資料以產生GMC MB資料。合併結果只將GMC加在碼轉換MB錯誤（原來MB資料及碼轉換MB資料 482之間的差異作為使用不同qp再量化的結果）。 GMC MB資料在量化器塊410出現。與上述圖4A-4C所示相似，量化器塊根據來自率控制塊（參考圖1，1 80)的新QP 412再量化GMC MB資料及提供結果的再量化MB資料至-模式決定塊480-，其中選擇一適當模式以再編碼再量化MB資料。再量化MB資料及模式選擇485 (圖1中沒有48 5)傳遞至再編碼器（見160，圖1)。決定編碼模式的技術的詳細說明如下。同時也傳遞再量化MB至一解量化塊420 (Q-1)其中不執行量化以產生DCT係數。如前述，因為量化由量化塊41 〇根據導出解量化MB資料402的原來MB資料使用以外的不同 QP而執行，其中解量化塊420產生的DCT係數及計差塊425 計算的GMC MB資料之間有差異，及經IDCT塊430的IDCT 處理（反向離散餘弦轉換）以產生一錯誤影像表示由差異造 -37- 85429 200400767 成最後輸出位元流的量化錯誤。量化錯誤的錯誤影像形式儲存在一訊框缓衝器FB2 440，如前述。因為量化錯誤可為正或負，但像素資料未帶符號，錯誤影像形式偏移一半的 FB2動態範圍。圖4E為碼轉換塊400e的方塊圖，適合原來編碼為“跳過” 的MB，如由VOP及MB標頭表示。在這種情況下，如果編碼模式為inter_gmc及所有係數（MB資料）為零，則處理MB 及MB資料。藉由強制模式選擇，設定GMC運動補償（462) 及強制所有解量化MB資料402為零，便可完成碼轉換如上述說明參考圖4D。由於先前訊框的剩餘錯誤資訊，由合併器塊405產生的GMC MB資料可能包括非零元件，表示影像資訊須要編碼。因此，跳過的MB在碼轉換後可能產生一非跳過MB。這是因為由率控制塊（參考180，圖1)分配的新QP 4 12能隨MB改變。原來非跳過MB在再量化後不具有非零 DCT係數。另一方面，原來跳過的MB在GMC及再量化後具有一些非零EXC T係數。 B-VOPs的MB碼棘換 B-VOPs或「雙向預測編碼VOPs」並不編碼新影像資料，但在過去I-VOPs或P-VOPs，將來I-VOPs或P-VOPs，或兩者之間内插（「將來」V0P資訊係在訊框系列順序外由處理 B-VOPs獲得，即是，在「將來」VOP之後導出影像資訊）。 B-VOPs定義4種編碼模式：直接，内插，反向及正向。這些模式的B-VOP MBs的碼轉換如圖4F所示。原來編碼為「跳過」的B-VOP MBs的碼轉換如圖4G所示。 -38 - 85429 200400767 圖4F為碼轉換塊400f的方塊圖，適合碼轉換原為直接，正向，反向或内插編碼的MB資料，如由V〇p及MB標頭表示。這些編碼模式使用運動補償。碼轉換之前，先前（及或將來）V Ο P s的錯誤影像資訊處理在訊框緩衝器ρ b 1 4 5 0。 FBI的内容出現於運動補償塊460。在儲存於FBI 450之前加在錯誤影像資料的任何偏移在從訊框緩衝器FB 1 450擷取後反向。運動補償塊460 (MC)也接收移動向量（MV)及編碼模式資訊462 (從MB標頭部份解碼，參考圖3)及如MPEG-4 規格標示操作以產生一運動補償MC「影像」然後在DCT塊 470作〇(3丁處理以產生乂匸〇(3丁係數。這些]\^〇(3丁係數於合併塊405合併進來解量化MB資料402以產生Mc MB資料。合併結果只將運動補償根據編碼模式加在來自其他先前，將來或兩者VOP的碼轉換MB錯誤（原來MB資料及碼轉換MB 資料482之間的差異作為使用不同Qp再量化的結果）。 MC MB資料在量化器塊41 0出現。量化器塊根據來自率_控制塊（參考圖1，180)的新QP 412再量化MC MB資料及提供結果的再量化MB資料至模式決定塊480，其中選擇一適當模式以再編碼再量化MB資料。再量化mb資料及模式選擇 485傳遞至再編碼器（見160，圖1)。決定編碼模式的技術的詳細說明如下。因為B-VOP不曾用於將來運動補償，不計异及儲存B-VOP的量化錯誤及其結果錯誤影像。圖4G為碼轉換塊400g的方塊圖，適合原來編碼為跳過的 B-VOPMBs，如由VOP及MB標頭表示。在這種情況下，如果編碼模式為「直接」及所有係數（mb資料）及移動向量為 -39- 85429 200400767 零，則處理MB及MB資料。藉由強制模式選擇及移動向量 462分Μ為「正向」及令，及強制所有解量化mb資料4〇2為零，便可完成碼轉換如上述說明參考圖4F。由於先前訊框的剩餘錯次貝訊，由合併益塊4 0 5產生的jyjc MB資料可能包括非令元件’表示影像貪訊須要編碼。因此，跳過的mb在碼轉換後可能產生一非跳過MB。這是因為由率控制塊（參考180，圖1)分配的新QP 412能隨MB改變。原來非跳過MB 在再量化後不具有非零DCT係數。另一方面，原來跳過的 MB在GMC及再量化後具有一些非零dct係數。热悉本技術者會發現上述圖4A-4G所示的方塊圖之間有相當的共同性。雖然，上述不同編碼模式的碼轉換係為分開項目，可提供一單碼轉換塊以容納上述所有編碼模式的所有碼轉換操作。例如，一碼轉換塊如圖4B所示，其中Mc 塊也可以容納GMC，可以完成所有上述碼轉換操作。這樣的效率較高，同時為較佳執行模式。圖丨的碼轉換塊15〇顯示完全碼轉換器100的全部碼轉換功能，其實施可以為一組衩數個分開專用的碼轉換塊，或為單一的通用碼轉換塊。模式決定在前述碼轉換的討論中，各碼轉換操作包括根據適當的選擇編碼模式再編碼新MB資料的步驟。決定編碼模式的方法如圖5，6，7a，7b，8a及8b所示。以下討論參考上述各圖，圖中相對說明中的動作及決定的參考號碼包含在括狐内。 l^yops的編石馬模尤沬佘 85429 -40- 200400767 圖5為一流程圖500顯示決定I-VOP MB的再編碼模式的方法。在決定步騾505中，決定是否新QP (qi)與先前QP (q^) 相同。如果相同，在步驟5 1 0設定新編碼模式（再編碼模式）為intra。如果不同，在步驟5 1 5設定新編碼模式為intra_q。 P-VOPs的編碼模式決定圖6為一流程圖600顯示決定P-VOP MB的再編碼模式的方法。在一第一決定步騾605中，如果原來P-VOP MB編碼模式為intra或intra_q。則模式決定傳至決定步驟610處理。如果不是，模式決定傳至決定步騾625處理。在決定步騾610中，如果新QP(qi)與先前的QP(qN1)相同，在步驟61 5設定新編碼模式為intra。如果不同，在步驟620 設定新編碼模式為intra_q。在決定步騾625中，如果原來P-VOP MB編碼模式為inter 或inter_q，則模式決定到決定步驟630處理。如果不是，模式決定到決定步騾655處理。 - 在決定步驟630中，如果新QP(qi)與先前QPCq^)不相同，在決定步驟63 5設定新編碼模式為inter_q。如果相同，模式決定到決定步騾640決定如果編碼塊圖案（CBP)全部為零及移動向量（MV)為零。如果是，在步驟645設定新編碼模式為跳過。如果不是，在步驟650設定新編碼模式為inter。在決定步驟655中，因為原來編碼模式先前已經決定不是 inter，inter__q，intra 或 ibtra__q，便假定為inter__4MV，唯一其他可能性。如果編碼塊圖案（CBP)全部為零及移動向量 (MV)為零，在步驟660設定新編碼模式為跳過。如果不是， -41 - 85429 200400767 在步騾665設定新編碼模式為inter_4MV。 S-VOPs的編碼模式決定圖7a及7b為流程圖部份700a及700b結合形成一單流程圖顯示決定S-VOP MBs的再編碼模式的方法。接頭「A」及「B」表示流程圖部份700a及700b之間的連接點。圖7a及7b結合說明。一決定步騾705中，如果原來S-VOP MB編碼模式為intra 或intra_q。則模式決定到決定步騾710處理。如果不是，模式決定到決定步騾725處理。在決定步騾710中，如果新QP(qi)與先前的QPQ^)相同，在步騾71 5設定新編碼模式為intra。如果不同，在步騾720 設定新編碼模式為intra_q。在決定步驟725中，如果原來S-VOP MB編碼模式為inter 或inter_q，則模式決定到決定步驟730處理。如果不是，模式決定到決定步驟755處理。在決定步驟730中，如果新QP(q〇與先前QPQid)不相同，在步驟73 5設定新編碼模式為inter_q。如果相同，模式決定到決定步騾740決定如果編碼塊圖案（CBP)全部為零及移動向量（MV)為零。如果是，在步騾745設定新編碼模式為「跳過」。如果不是，在步驟75 0設定新編碼模式為inter。在決定步驟755中，如果原來S-VOP MB編碼模式為inter_gmc 或inter_gmc_q，則模式決定到決定步驟760處理。如果不是，模式決定到決定步驟7 8 5處理（經接頭「A」）。在決定步驟760中，如果新QP (q〇與先前QP (q^)不相同， -42- 85429 200400767 在決定步騾765設定新編碼模式為inter_gmc_q。如果相同，模式決定到決定步驟770決定如果編碼塊圖案（CBP)全部為零。如果是，在步騾775設定新編碼模式為跳過。如果不是，在步驟780設定新編碼模式為inter。在決定步驟785中，因為原來編碼模式先前已經決定不是 inter，inter—q，inter—gmc，inter—gmc—q，intra或 intra_q，便假定為inter_4MV，唯一其他可能性。如果編碼塊圖案 (CBP)全部為零及移動向量（MV)為零，在步騾790設定新編碼模式為「跳過」。如果不是，在步騾795設定新編碼模式為 inter_4MV 〇 B-VOPs的編石焉模式決定圖8a及8b為流程圖部份800a及800b結合形成一單流程圖顯示決定B- VOP MBs的再編碼模式的方法。接頭「C」及「D」表示流程圖部份800a及800b之間的連接點。圖8a及8b結合說明。 - 在一第一決定步驟805中，如果先前P-VOP的一共定位 MB (MV相對編碼視訊影像中相同位置）編碼為跳過。則在步驟8 1 0設定新編碼模式為跳過。如果不是，模式決定到決定步驟815處理，如果原來B-VOP MB編碼模式為「内插」 (interp_MC或interp_MC__q)，便作決定。如果是，模式決定方法到決定步騾820處理，如果不是，模式決定到決定步驟 835處理。在決定步驟820中，如果新QP(qi)與先前的QPQi-O相同，在步驟825設定新編碼模式為interp_MC。如果不同，在步 -43 - 85429 200400767 驟83 0設定新編碼模式為丨1^6印_1^1(1；_卩。一決定步騾835中，如果原來B-VOP MB編碼模式為「反向」（backwd或backwd—q)，貝1J模式決定到決定步驟840處理。如果不是，模式決定到決定步騾855處理。在決定步驟840中，如果新QP (qi)與先前的QP (ςΝ1)相同，在步騾845設定新編碼模式為backward_MC。如果不同，在步驟85 0設定新編碼模式為backward_MC_q。在決定步驟855中，如果原來B-VOP MB編碼模式為「正向」（forward—或forward_MC—q)，則模式決定到決定步驟860 處理。如果不是，模式決定到決定步驟875處理（經接頭「C」）。在決定步驟860中，如果新QP (q〇與先前的QP (q^)相同，在步驟865設定新編碼模式為for war d_MC。如果不同，在步驟870設定新編碼模式為化1界&1(1_]\/1(1：_9。在決定步騾875中，因為原來編碼模式先前已經決定不是 interp—MC，interp—MC—q，backwd—MC，backwd—MC一q ’ forward或forward_MC_q，便假定為直接，唯一其他可能性。如果編碼塊圖案（CBP)全部為零及移動向量（MV)為零，在步騾880設定新編碼模式為「跳過」:.。如果不是，在步騾 8 8 5設定新編碼模式為直接。再編碼圖9為再編碼塊900 (比較160，圖1)的方塊圖。其中使用4 個編碼模組（910，920，930，940)以處理各種再編碼任務。再編碼塊900接收來自碼轉換塊（見150，圖1及圖4A-4G)的 -44- 85429 200400767 資料905由再編碼的再量化MB資料及再編碼模式組成。再編碼模式決定使用那個再編碼模組以再編碼再量化MB資料。使用再編碼MB資料以提供一新位元流945。使用一 Intra_MB再編碼模組910以再編碼I-VOPs，P-VOPs 或 S-VOPs 的 MBs 的 intra 及 intra__q 模式。使用一 Inter_MB 再編碼模組920以再編碼P-VOPs或S-VOPs的MBs的inter， inter_q，及inter_4MV模式。使用GMC__MB再編碼模組93 0 以再編碼S-VOPs 的 MB 的inter—gmc 及 inter—gmc—q 模式。一 B_MB重編碼模組處理所有B-VOP MB編碼模式（interp__MC ，interp_MC_q，forward，forward_MC_q，backwd，backwd_MC__q 及直接）。在新位元流945中，各種VOP的MB層的結構保持相同，但是各攔的内容不同。特別： VOP標頭產生 Ι-VOP標頭 MB層的所有欄可從舊位元流不同編碼。因為，率控制引擎分配一新QP於邵份的任何MB。如果這樣作，便造成MB 的不同CBP。雖然AC係數由新Qp再量化，所有intra模式的 DC係數必須由8量化。所以，再量化:DC係數等於原來編碼 DC係數。intra模式的量化DC係數為編碼空間預測。預測方向係根據目前塊及相鄰塊（即，巨集塊）的量化DC係數之間的差異決定。因為量化DC係數不變，DC係數的預測方向也不變。AC預測方向隨後為DC預測方向。不過，因為mb分配的新QP與原來編碼QP不同，比例AC預測不同。結果造成 -45- 85429 200400767 AC預測旗標（ACpred_flag)設定不同，以表示是否AC預測有效或失效。新QP差動編碼。另外，因為從MB至MB的QP變化由率控制塊（參考180，圖1)決定，DQUANT參數也改變。 P_VOP標頭 MB層的所有欄，MVDs除外，不同於舊位元流。Intra及 intra_q編碼MB再編碼用於I-VOPs。依新位元流的特徵的要求編碼或不編碼inter及inter_q MBs。MV為差動編碼。MB 的PMV為相鄰MV的媒體。因為MV不變，PMV也不變。所以，相同MVD再編碼成為新位元流。 S-VOP標頭 MB層的所有欄，MVDs除外，不同於舊位元流（圖6)。Intra ，intra_q，inter 及 inter_qMB 再編碼如 I-及 P-VOP 内。GMC MB的參數不變。 B-VOP標頭 MB層的所有欄，MVDs除外，不同於舊位元流。MV從 MPEG-4的PMV及DMV計算。B-VOP的PMV編碼模式可利用碼轉換方法改變。MV再同步方法修改DMV值致使碼轉換位元流能產生一 MV與輸入位元流的原來MV相同。解碼器儲存反向及正向的PMVs。直接模式的PMV必須為零及從反向及正向PMV獨立處理。在各MB行的開始PMV由零取代或如果MB為MC編碼（分別為正向，反向，或兩者）則由MB (分別為正向，反向，或兩者）值取代。如果MB編碼為跳過，PMV 為不變。所以，由碼轉換位元流產生的PMV可與輸入位元流的不同如果MB由跳過模式變為MC模式或相反。較理 -46- 85429 200400767 想，在解碼及A絶、再 '扁馬万法的PM V為兩獨立儲存的分開變數°再編碼方法方久γ

, 在各仃的開始歸零PM V及更新PM V如果MB 為MC編碼。另冰 ^ ^ Γ ’冉編碼方法發現一剩餘MV，PMV及決 Θ /、、C (可茭長埂碼）用於包括碼轉換位元流。如果MB不扁馬為跳過，PMV更新及重新計算剩餘及其相對VLc。再’人參考圖1 ’位元率控制塊18〇根據一目標位元率104 决疋碼轉換的新量化參數。位元率控制塊分配各v〇p 目栝位元數根據v〇p種類，v〇p種類的複雜性，在一時間冒内的VOP數，分配時間窗的位元數，景色變化，等。因為MGEP-4限制MB至MB變化達+/— 2，計算每VOP的適當最初QP以符合目標位元率。根據下列公式計算： n — hd 1卿一 j~ hd 1 new 其中： R〇ld為每VOP的位元數。

Tnew為目標位元數。 q〇ld為舊QP及 q n e w 為新 Q P。根據MB對MB基礎調整QP以符合每νορ的目標位元數。檢查輸出位元流（新位元流，162)是否符合目標VOP位元分配。如果使用太多位元，增加QP。如果使用太少位元，減少QP。評估MPEG-4碼轉換器的性能，完成一些測試視訊系列模擬。所有系列為CIF格式：352x288及4:2:0。測試系列為第 85429 -47- 200400767 一編碼使用MPEG-4編碼器，；i Mbits/sec。壓縮位元流碼轉換成新位元流，500 Kbits/sec。為了比較，相同系列也編碼使用MPEG-4直接編碼’ 500 Kbits/sec。結果列於圖1〇的表其中頭π系列的PSNR在CIF解析度直接使用MpEG-4及碼轉換為，500 Kbits/sec。如所示，直接MpEG_4及碼轉換器的PSNR差兴約大各車為〇 50 dB - 0.28 dB，花為〇·49 dB，小汽車為0.58 dB及樣板為〇·3ΐ dB。品質損失由於事實碼轉換器量化視訊訊號兩次，所以產生額外量化離訊。例如，圖11顯示在VBR或固定QP，根據平均位元率使用 PSNR，大客車系列碼轉換器性能。鑽石線為直接MpEG-4 在固定QP=4，6，8，1〇，12，14，16，18，20 及 22。然後 QP=4的壓縮位元流在 qp=6，8，1〇，12，14，ΐ6，ΐ8，π 及22碼轉換。在較低位元率，碼轉換器性能很接近直接 MPEG-4,而在較高位元率，其差異約為ldB。階梯編碼與碼轉換器的性能幾乎相同。不過，執行碼轉換器要比階梯編碼簡單許多。雖然本發明及各特別具體實施例已作說明，熟悉本技術者g明白本發明可以作許多修改並不背離如申請專利範圍所列的本發明範圍及精神。【圖式簡單說明】圖1為根據本發明的一完全視訊碼轉換器的方塊圖；圖2 A根據本發明標準MpEG-4視訊流的結構示意圖；圖2B根據本發明標準MpEG-4巨集塊的結構示意圖；圖3為根據本發明的一種從編碼Μ B描取資料技術的方塊 85429 -48 - 200400767 圖圖4A-4G為根據本發 4 '明應用各種不同編却派擴換哭A/> ％格式的一完全視訊碼轉換器的碼轉換部份的方塊圖5為根據本發明的 % A的一種決疋卜V〇p的的流程圖；丹、，扁碼棱式的技術圖圖； 6為根據本發明的又月的一種決足P-VOP的術的流程圖；再編碼棱式的技編碼模式圖7a及7b為根據本發明的—種決定s_v〇p的再的技術的流程圖；圖8a及8b為根據本發明的話4 ^ Ώ、明的一種決疋B-VOP的再編碼模式的技術的流程圖；吴八圖9為根據本發明的一 + 疋王視訊碼轉換器的編碼部份的方塊圖；切的圖10為根據本發明的一種介於直接刪G-4編碼，階梯式編碼’及碼轉換之間的一视訊源特別組的訊號對雜訊比較表；及 - 圖11為根據本發明直接MPEG-4編碼及碼轉換之間訊號對雜訊比較曲線。；ϋ 【圖式代表符號說明】 100 視訊碼轉換器 102 輸入位元流 104 新位元率 110 V0L標頭 112 V0L標頭位元 85429 -49- 200400767 120 GOV標頭 122 GOV標頭位元 130 VOP標頭 132 VOP標頭位元 140 部份解碼 150 碼轉換 160 再編碼 162 新位元流 170 調整 172 VOP標頭位元 180 位元率控制 182 調整量化參數 184 調整量化參數 200 MPEG-4位元流 210 VOL標頭 230 VOL標頭 240 巨集塊 300 部份解碼 302 MB塊資料位元 310 VLD塊 320 解量化塊 322 解量化MB資料 85429 - 50

Claims

200400767 拾、申請專利範圍： 1 · 一種用於碼轉換一輸入壓縮視訊位元流至不同位元率的一輸出壓縮視訊位元流之方法，包括：接收第一位元率的輸入壓縮視訊位元流；標示一輸出壓縮視訊位元流的一新目標位元率；部份解碼輸入位元流以產生解量化資料；使用不同量化位準（QP)再量化該解量化資料以產生再量化資料；及再編碼該再量化資料以產生該輸出壓縮視訊位元流。 2 ·如申請專利範圍第1項之方法，進一步包括：決定一再量化的適當初始量化位準（QP); 監視輸出壓縮視訊位元流的位元率；及調整量化位準以使輸出壓縮視訊位元流較接近相配目標位元率。 3·如申請專利範圍第1項之方法，進一步包括：直接對輸出壓縮視訊位元流複製不變標頭資料。 4·如申請專利範圍第1項之方法，進一步包括：由解量化該再量化資料及從該解量化資料減去該再量化資料決定再量化錯誤； IDCT處理該量化錯誤以產生一相等錯誤影像；根據來自輸入壓縮視訊位元流的運動補償參數施加運動補償至錯誤影像；及 DCT處理運動補償錯誤影像及施加DCT處理錯誤影像至解f化貧料作為因再量化錯誤的運動補償校正。 85429 200400767 5 · —種用於碼轉換一輸入壓縮視訊位元流至不同位元率的一輸出壓縮視訊位元流之裝置，包括：用於接收第一位元率的輸入壓縮視訊位元流之裝置；用於標示一輸出壓縮視訊位元流的一新目標位元率之裝置；用於部份解碼輸入位元流以產生解量化資料之裝置；用於使用不同量化位準（QP)再量化該解量化資料以產生再量化資料之裝置；及用於再編碼該再量化資料以產生輸出壓縮視訊位元流之裝置。 6·如申請專利範圍第5項之裝置，進一步包括：裝置用於決定一再量化的適當初始量化位準（Qp); 裝置用於監視輸出壓縮視訊位元流的位元率；及裝置用於調整量化位準以使輸出壓縮視訊位元流之位元率較接近相配目標位元率。 7·如申請專利範圍第5項之裝置，進一步包括：衣置用於直接對輸出壓縮視訊位元流複製不變標頭資料。 8·如申請專利範圍第5項之裝置，進一步包括：裝置用於由解量化該再量化資料及從該解量化資料減去該再量化資料決定再量化錯誤；裝置用於IDCT處理量化錯誤以產生一相等錯誤影像；裝置用於根據來自輸入壓縮視訊位元流的運動補償參數施加運動補償至錯誤影像；及 85429 200400767 裝置用於DCT處理運動補償錯誤影像及施加DCT處理錯誤影像至解量化資料作為因再量化錯誤的運動補償正。、人 9. 同位元率的一種用於碼轉換一輸入壓縮視訊位元流至不一輸出壓縮視訊位元流之方法，包招：：接收一輸入位元流；從輸入位元流抽取一視訊物件層標頭；從輸入位元流解量化巨集塊資料；再量化該解量化巨集塊資料；及將抽取視訊物件層標頭插入輸出位元流，巨集塊資料。 u 量化 1 0 ·如申請專利範圍第9項之方法，進一步包括從輸入位元流抽取一組視訊物件層標頭；及將抽取的視訊物件層標頭組插入輸出位元汽 U.如申請專利範圍第9項之方法，進—步包括：⑽ 攸鳥11入和元流抽取一視訊物件平面柄卩写·及將拙取的視訊物件平面標頭插入輪出位元流 12·如申請專利範圍第9項之方法，進一步包括· 決定一再量化的適當初始量化位準（Qp); 監視輸出壓縮視訊位元流的位元率；及調整量化位準以使輸出壓縮視近相配目標位元率。

訊位元流之位元如申凊專利範圍第9項之方法，進—步包括· 直接從輸入位元流複製不變標頭資^輸出位元流 85429 200400767 14.如申請專利範圍第9項之方法，進一步包括：由解量化該再量化資料及從該解量化資料減去該再量化資料決定再量化錯誤； IDCT處理量化錯誤以產生一相等錯誤影像；根據來自輸入壓縮視訊位元流的運動補償參數施加運動補償至錯誤影像；及 DCT處理運動補償錯誤影像及施加DCT處理錯誤影像至解f化資料作為因再量化錯誤的運動補償校正。 1 5 ·如申請專利範圍第9項之方法，進一步包括：顯示再量化錯誤為8位元符號數；在儲存該再量化錯誤於一 8位元無符號儲存緩衝器之前附加一半再量化錯誤間距的偏移至該再量化錯誤；及在從8位元無符號儲存緩衝器擷取後從該再量化錯誤減去該偏移。 1 6·如申請專利範圍第9項之方法，進一步包括：用於編碼為「跳過」的MBs，才是供所有零則至碼轉換器。 17·如申請專利範圍第16項之方法，進一步包括：用於具有編碼為「跳過」的MBs的預測v〇p模式，提供所有零MV值至碼轉換器。 18·如申請專利範圍第9項之方法，進一步包括：在碼轉換及運動補彳當乡、、力硐杈後如果編碼塊圖案全部為零便作決足，及選擇「跳過」的編碼模式。 19.如申請專利範圍第9項之方法，進一步包括： 85429 200400767 用於預測VOP模式，在碼轉換及運動補償後，如果編碼塊圖案全邵為零及Μν值全部為零便作決定，及選擇「跳過」的編碼模式。 ' 20·如申請專利範圍第9項之方法，進一步包括： · 用於原來編碼模式真「制，讲 ^ ^ 八4跳過」的P-VOP，s-νορ及B_V0P ’碼轉換後決定，如果：編碼塊圖案全部為零；及 Μ V全部為零；及跳過」編碼模式進一步包括：如果兩條件為真，便只選擇 21·如申請專利範圍第9項之方法，用於P-VOP，其中：原來編碼模式為「跳過· 輸入MB全部為零；模式為「正向」；及 MV全部為零；碼轉換後-決定，如果：編碼塊圖案全部為零；與 MV全部為零，·及如果兩條件為真，便u ^ ^卜、璲擇「跳過」編碼模式 22·如申請專利範圍第9項乏士、冬 "<万法，進一步包括：用於S-VOP，其令：輸入MB全邵為零； G M C設定值為零；碼轉換後決定，如果： 85429 200400767 編碼塊圖案全部為零；及運動補償全部為零；及如果兩條件為真，便只選擇「跳過」編碼模式。 23.如申請專利範圍第9項之方法，進一步包括：用於B-VOP，其中：輸入MB全部為零；模式為「直接」；及 MV全部為零；碼轉換後決定，如果：編碼塊圖案全部為零；模式為「直接」；及 MV全部為零；如果所有三條件為真，便只選擇「跳過」編碼模式。 85429