TW200400767A - Method and apparatus for transcoding compressed video bitstreams - Google Patents

Method and apparatus for transcoding compressed video bitstreams Download PDF

Info

Publication number
TW200400767A
TW200400767A TW092113354A TW92113354A TW200400767A TW 200400767 A TW200400767 A TW 200400767A TW 092113354 A TW092113354 A TW 092113354A TW 92113354 A TW92113354 A TW 92113354A TW 200400767 A TW200400767 A TW 200400767A
Authority
TW
Taiwan
Prior art keywords
data
bit stream
compressed video
vop
encoding
Prior art date
Application number
TW092113354A
Other languages
English (en)
Inventor
Li-Ming Wang
Krit Panusopone
Original Assignee
Gen Instrument Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gen Instrument Corp filed Critical Gen Instrument Corp
Publication of TW200400767A publication Critical patent/TW200400767A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

200400767 玖、發明說明: 【發明所屬技術領域】 本發明關係視訊壓縮技術,及較具體而言,關係編碼, 角午碼及碼轉換技術用於壓縮視訊位元流。 【先前技術】 視訊壓縮為一種技術用於編碼一視訊「流」或「位元流」 成為與原有形式不同的編碼形式(一般為更小的形式視訊 流為一移動圖像影像的電子形式。 近年來,隨低價個人電腦普及,平常電腦使用者具有的 磁碟空間及記憶體量大幅增加,網際網路存取利用率普及 及通信頻寬更增加,經網際網路的流視訊的使用已變為尋 常。一種較重要及廣為人知的編碼流視訊用的視訊壓縮標 準為MPEG-4標準,由動畫專家群(MPEG)提供,ISO/IEC (國 際標準組織/國際工程團)的一工作組負責發展國際標準用 於壓縮,解壓縮,處理,及編碼移動圖像,音訊及其組合 的形式。ISO吟辨公室位於 1 rue de Varemb6, Case postale 56, CH-1211 Geneva 20,瑞士。IEC 的辩公室位於 549 West Randolph Street,Suite 600, Chicago, IL 60661-2208,美國。 MPEG-4壓縮標準,正式標示為ISO/IEC 14496 (分6部份), 為大家所知及用於運動視訊應用。 儘管網際網路連接頻寬快速增加及高性能個人電腦普 及,各使用者的網際網路連接速度及電腦功率之間有許多 不同。這種不同需要網際網路内容提供者供應視訊流及其 他多媒體内容形式成為終端使用者環境的一分集。例如, 一新聞内容提供者希望提供視訊新聞夾至終端使用者,但 85429 200400767 必須迎合使用者分集的需求其連接至網際網路範圍從下端 33.6叫遗據機至—DSL,電㈣據機,或上端較高速寬 頻連接。終端使用者的有效計算功率同樣分集。另外複雜 $問,為網路擁擠,結果限制資料流(如視訊)能在網際網路 同2里時運迗的速率。這表示新内容提供者必須提供寬位 元率範圍供有效視訊流,特定適合終端使用 連接/計算料及變化的纟叫條件。 、種長1仏相同視訊私式材料各種不同位元率的特別有效 、、為視汛碼轉換。視釩碼轉換為一種方法藉由預壓縮位 元流轉換成一新壓縮位元流具有不同位元率,訊框尺寸, 視訊編碼標準等。視訊碼轉換對任何必須根據因素如網路 擁擠,解碼器能力或終端使用者的申請求以不同位元率, 角午析度或格式運送壓縮視訊位元流的應用特別有用。 一般,壓縮視訊碼轉換器以較低位元率解碼一壓縮視訊 4元机及然後再編碼該已解碼位元流。雖然,非碼轉換器 技術可提供類似能力,不過這些技術有高成本及儲存的缺 點。例如,多位元率的視訊内容,格式及解析度各自分開 ,碼及儲存在一視訊伺服器上。不過,這種方法如預期只 k供許多分離選擇及預編碼,及需要大量的磁碟儲存空 間。或者,一視訊系列可編碼成一壓縮「可伸縮」形式。 不過,這種技術需要基本視訊編碼資源(硬體及/或軟體)以 提供一有限數目的選擇。 碼轉換技術提供的優點超過這些及其他非碼轉換器技術 由於其超配合性提供一寬譜的位元率,解析度及格式的選 85429 200400767 擇:可同時容納的不同選擇的數目只根據能獨立碼轉 獨立視訊流的數目而定。 叩為了同時谷納大量不同選擇,必須提供大量的碼轉換 器。儘管該應用碼轉換器的成本及配合性優點,大量^ 扠态仍然非常貴昂,由於主要硬體及軟體資源必須屬傳統 視說碼轉換技術專用的資源。 、、 、如前述討論,確實需要—種最低成本及最小複雜性的視 訊碼轉換器。 、 【發明内容】 一:據本發明,一種方法用於碼轉換不同位元率包括接收 :罘一位元率的輸入壓縮位元流的一輸入壓縮視訊位元流 ^輸^縮視訊位元流。標示—輸出壓縮視訊位元流的 、、新目標位兀率。部份編碼輸入位元流以產生解量化資 枓二使用不同量化位準(Qp)再量化解量化資料以產生再量 化貝料,及再編碼該再量化資料以產生輸出壓縮視訊位-元 >瓦。 $據本發明的一特徵,本方法進_步包括決定一適合初 :里化位皁(QP)用於再量化。監視輸出壓縮視訊位元流的 Z率’及調整量化位準以使輸出壓縮視訊位元流的位元 年較接近目標位元率。 2據本發明的另外特徵,本方法進—步包括直接複製不 又勺標頭資料至輸出壓纟自視訊位元流。 旦康本I明的另外特徵,本方法進一步包括藉由解量化 I化資料及減去解量化資料決定再量化錯誤。使用一反 85429 200400767 向離散餘弦轉換(IDCT)處理量化錯誤以產生一相等錯嗖與 ^根據來自輸入壓縮視訊位元流運動補償參數施加運: ^貝至錯誤影像。運動補償錯誤影像4dct處理及施加 丁處理錯誤影像至解量化资料祚 補償校正。 ^作相再f化錯誤的運動 ,據本發明的另外特徵’再量化錯誤以8位元訊號數表示 儲存於8位疋無訊號儲存緩衝器之前偏移其—半間距 的量(即,+128)。擷取後,減去 量化錯誤值。 咸去偏私,储存原來訊號的再 根據本發明的另外特徵,—全部為零CBp(編碼塊圖案) 在碼轉換器出現以取代巨集堍 鬼、、扁碼跳過。另外,用於使用 運動補償的預先編碼模式,全邱 王哔為零移動向量(MVs)出現在 碼轉換器取代跳過巨集塊。 根據本發明的另外膝彡吟 ' 如果碼轉換造成一全部為零編 碼塊圖案(CBP),選擇跳過锶 (禪跳也扁碼挺式。本方法主要用於不.使 ^ - 貝)的、,扁碼杈式。用於使用運動補償資 料的預測模式,如果碼轉 ^ τ 得杈CBP為全零及移動向量為全 零,則選擇跳過模式。 執行本方法的裝置也加以說明。 名詞表 除非另有說明,或由並估m w 么二 ^ ^ /、 用環境證明,本文使用的任何 域的一般意義解釋。下照本發明最接近的技術領 ._ . ^ j名巧表的目的只是為了使本文及 “種技術文件的說明更為清楚及一致。 85429 -10- 200400767 AC係數: MPEG : MPEG-4 : 任何一或兩座標的頻率不等於零的Dcτ係數。 動畫專家群。 改的MPEG移動圖像編碼標準目的為多媒體 應用及廣大位元率範圍的視訊流。正式名稱為 ISO/IEC 14496,分 6部份。 B-VOP ; 雙向預測編碼VOP ··使用來自過去及/或將來參考v〇p的運 動補償預測編碼的VOP。 反向相容性··一種新的編碼標準與舊的編碼標準反向相容 如果解碼器的設計依舊編碼標準操作則能繼續 操作以解碼全部或部份根據新編碼標準產生的 位元流。 反向移動向量:-種移動向量用於顯示順序後段時間一參 考VOP的運動補償。 反向預測:從將來參考VOP預測。 基層: —可伸縮分層結構的獨立解碼層。 二元《塊:-塊的尺寸為16xl6pels,與巨集塊共處,顯示 二元α映像的形狀資訊,也稱作bab。 元《映像、2D二元遮罩用來表示視訊物件的形狀致使不 透明像素被認為是物件的部份而透明像素則不 是物件的部份。 位元流:一種形成資料的編碼形式的順序排列的位元 系列。 位元率··編碼位元流從儲存媒體或s 乂、吗路輸迗至解碼器的 85429 -11 - 200400767 輸入的速率。 塊: 一 8行x8列的樣品(像素)矩陣,或64 DCT係數 (源,量化或解量化)。 對齊位元組:一個編碼位元流的一位元為對齊位元組如果 其位置從該位元流的第一位元起為8位元的倍 數。 位元組: 8位元系列。 環境基準計算編碼:二元形狀編碼使用的方法;也稱為cae。 頻道: 一種數位媒體或網路用於儲存或輸送根據MPEG-4 (ISO/IEC 14496)規格構成的位元流。 色度格式:定義一巨集塊内的色度塊數量。 色度成分:表示相對位元流中定義的原色的兩色差訊號之 一的矩陣,塊或單樣品。色差訊號所使用的符 號為Cr及Cb。 CBP : 編碼塊圖案。 CBPY : 可變長度碼表示巨集塊内的一非透明亮度塊的 圖案具有至少一非内DC轉換係數。 編碼B-VOP: —個已編碼的B-VOP。 編碼VOP : —編碼VOP為一個已編碼I-VOP,一個已編碼 P-VOP或一個已編碼B-VOP。 編碼I-VOP : —個已編碼的Ι-VOP。 編碼P-VOP : —個已編碼的P-VOP。 編碼視訊位元流:一或更多VOP系列的編碼形式根據MPEG-4 (ISO/IEC丨4496)規格定義。 -12- 85429 200400767 編碼順序:V〇p傳送及 順序相同。^ 順序。本順序不需要與顯示 編碼形式:_種 編碼參數:用來顯:;式表示的資料元件。 a 丁、、爲碼視訊位元流特徵的使用者定義參 數組。位开、、* ^ , /礼的特徵由編碼參數表示。 哭 組件: 的特徵由能解碼的位元流表示。 … 組成方法 構成圖案的三矩陣(亮度及兩色差)之-的矩 陣’塊或樣品。 一方法規(非標準)將重建v〇p組成一景色及顯 7JT 〇 :縮:減少用來表示-項資料的位元數。 2位7°率編碼視訊:具有常數位元率的編碼視訊位元流。 常數位元率;CBR : γ pE) ^ r、 <巧士口土冗成編碼位元流的操作其間 變換比率 資料元件 DC係數: DCT係數 位元率維持不變。 形狀控制率用的尺寸變換比率。 編碼前及解碼後表示的一項資料。 兩座標的頻率為零的DCT係數。 特定餘弦基本函數的振幅。 解碼器輸入緩衝器:視訊緩衝檢查符號標示的先入先出 (FIFO)緩衝器。 解碼器··—解碼方法的一具體實施例。 解碼(方法):本規格定義的方法即讀取一輸入編碼位元流及 產生解碼VOP或音訊樣品。 解量化·在位元流的形式解碼之後及出現在反DCT之前 85429 -13- 200400767 重定標量化DCT係數的方法。 數位儲存媒體; DSM : 一種數位儲存或傳輸裝置或系統。 離散餘弦轉換; DCT : 不論正向離散餘弦轉換或反向離散餘弦轉換。 DCT為反向離散正交轉換。 顯示順序:顯示解碼圖案的順序。一般本順序與出現在編 碼器輸入的順序相同。 DQUANT : — 2位元碼標示I-,p-,及s(GMC)-V〇P的量化 器的變化。 編輯· 操作一或更多編碼位元流以產生一新編碼位元 blU的方法。確|忍編輯位元流必須符合jyjpEG-4 (ISO/IEC I4496)規格定義的要求。 編碼器:一編碼方法的一具體實施例。 編碼(方法)· 一種本規格未標示的方法即讀取輸入圖像流或 首訊樣品及產生一有效編碼位元流如mpeg_4 (ISO/IEC 14496)規格所定義。 加強層··可伸縮分層結構中一相對參考層(基層之上)。 用於所有伸縮性的形式,.解碼方法的說明參考 下層解碼方法及加強層本身的額外解碼方法。 面部動畫參數單元; FAPU :
特別正常化單元(如,轉換,角度,邏輯)定義 以谷许使用任何面部模型解釋FAp一致產生合 理的表情及語言發音的結果。 85429 -14- 200400767 面部動畫製作參數; F A P · .^流動畫製作參數即操作㈣特徵的位移及 面部動畫製作;:及說話期間控制嘴型及面部表情的混合。 FAT : 從進來的FAP映像的一可下| τ # 了下載函數至面部網目 的特徵控制點以提供F Δ p八机& 杌仏FAP分段線性加權用於控 制面部移動。 面部校正網目·· 3D網目的渣敝绛田、人,、 氣 妁π晰度用於杈正基準線面部模型 的形狀及結構。 面部清晰度參數; FDP:可下載資料解瑪器内以製作-基準線面部模 土土特別面邓,或下載一面部模型包括如何 製作動畫的資訊。FDP一般每次交談傳送一 次,隨後為一壓縮FAP流。FDp包括特徵點用於 杈正一基準線面部,面部特徵及座標以映像在 面邵,動畫製作表,等。 面部特徵控制點:—組㈣點中的—標準頂點用於定義面 郅特徵内由FAP控制的臨界位置及容許用於分 類基準線面部的形狀。 面部内插法轉換; 可下載節點开> ISO/IEC 14496_1定義用於選擇 性映像進來的FAP至FAP在其應用於特徵點之 萷’經加權有理多項式函數,用於複數交又華禹 合標準FAP以鏈結其效果成為定製或專用面部 85429 -15- 200400767 模型。 面部模型網目:2_D相鄰幾何形網目由垂直及平面多邊 %利用頂點座標定義’適合提供光測特性(如, 特徵,彩色,標準)。 削齊· 一種工具用於削齊- 戶丨一兀α遮罩周圍的值以便混 合背景。 —位元整數的變數只取兩值(0及1)之一。 如果定義編碼位元流的文句中使用名詞“禁用” 即表7F不使用該值。_般為了避免模仿開始碼。 -種時間内編碼巨集塊的方法以確保編碼器及 解碼器反DCT處理之間失配錯誤不會過度累 積。 " 種較新的編碼標準與舊的編碼標準正向相 谷如果解碼条的设計依新編碼標準操作而能解 碼舊編碼標準的位元流。 正向移動向量:-種移動向量用於在顯示順序較早時間的 一參考訊框VOP的運動補償。 從過去參考VOP預測。 :訊框包括視訊訊號的空間資訊的線。用於連 續視訊這些線包括從一瞬間開始及連續經過後 續線至訊框的底部。 訊框率的循環。 訊框從組成方法輸出的速率 旗標 禁用 氟 強制更新 正向預測 訊框: 訊框週期 訊框率: 將來參考VOP :將來參考VQP為依照顯㈣序比目前ν〇ρ 85429 -16 - 200400767 GMC : GOV : 晚發生的一參考VOP。 全球運動補償。 VOP 組。 混合伸縮性··混合伸縮性為二(或更多)種伸縮性的結合。 又錯:傳統電視訊框的特性其中訊框的交替線代表即 時『同%景。在交錯訊框中,—欄表示首先必 /’、’、”員'。廷種欄稱為第-欄。第-攔可以為訊 框的頂邵攔或底部欄。 内編碼V〇P ·只使用本身資訊編碼的VOP。 X使用巨集塊或v〇P資訊編碼的巨集塊或V0P。 内形狀編碼·不使用任何暫時預測的形狀編碼。中間形狀編碼:使用暫時預測的形狀編碼。位準·特别曲線内一組定義的MPEG-4(ISO/IEC 14496-2) 規^參數限制值。曲線包含—或更多位準。在 同中’位準為-非零係數的絕對值(見-運 w伸、、傾刀層結構中表示順序位元流組之一 及其解碼方法。層位元流··關係一特別层AA μ ㈢的—單位元流(必須結合層合格 ::如,“加強層位元流,,使用)。 踩考層直接在已知加強層的下方 解碼加強層下方的所有層)。 二:巨陣,塊或單樣品表示訊號單色形式及相對 W以羲的原色。亮度用的符號為Υ。 I-VOP 内編碼 層 下層 亮度成分 85429 -17- 200400767
Mbit : 1,000,000位元。 MB ;巨集塊:4個8x8亮度資料塊及兩個(4:2:〇色度格式)相 對8x8色度資料塊來自圖像的亮度成分的 16x1 6段區。巨集塊常用來表示樣品資料及樣品 值的編碼形式及其他MPEG-4 (ISO/IEC 14496-2) 規格定義的語法的巨集塊標頭定義的資料元 件。從上下文明白用法。 MCBPC ·巨集塊圖案編碼。這是一可變長度碼用來導出 巨集塊種類及色度的編碼塊圖案。必須包括編 碼巨集塊。 物件平面成為三角形貼片。三角形網目元件的 頂點稱作節點。節點之間的直線段稱為邊。: 個二角形相鄰則具有一共同邊。 網目幾何形狀··節點的空 網目移動:網目#外網目的三角結構。-間。p .、、、的暫時位移即時從-時間至下一時 MC ; 用移動向量以=樣品值預測效率, VOP包括4^偏移至過去及/或將來4 值。 W中碼形成預測錯誤使用的福 移動估計: 移動向量: 雙維向量用 方法。 以提供一 偏移從目前 85429 -18- 200400767 圖像或欄的座標位置至一參考ν〇Ρ的座標。 厂“多動向量:移動向量用於形狀運動補償。 非内編碼:編碼巨集塊或v〇p以使用來自本身及來自巨集 塊及其他時間產生V〇p的資訊。 不透明巨集塊··一巨集塊具有全部255 P-VOP ; 、早 預測編碼赠:使用來自過去術的運動補償預測編碼的 圖像。 參數· 一變數為本規格語法範園内的-值。只能取兩 值之一的變數稱為旗標。
過去參考圖像:過去參考vop為依照組合順序比目前VOP 早發生的一參考V〇p。 圖像 來源’編碼或重建影像資料。—來源或重建圖 像”個8位元三角形矩陣組成表示亮度及兩色 預測 度訊號。—較早定義的編碼VQP。用於連續視 訊’圖像與訊框相同。 、 使用預測值以提供目前正在解碼的樣 料元件的估計。 預測錯誤··樣品值戋资祖— 、 、, 飞貝科冗件的實值及其預測值之間的 差。 本規格的語法的定義子集 膜訊框的特性其中所有^框樣品表示即時的 同例子。 輪廓 漸進 預測值先刖角^碼樣品值或資料元件的線型組合。 85429 -19- 200400767 量化矩陣:解量化器使用的一組64個8位元值。 量化DCT係數:解量化前DCT係數。傳送一量化DCT係數 的可變長度編碼形式作為編碼視訊位元流的部 份。 量化器刻度:位元流的一編碼刻度因素及由解碼方法使用 以標不解量化。 QP : 量化參數。 隨機存取:開始讀取及解碼任意點的編碼位元流的方法。 重建VOP: —重建VOP由3個8位元數矩陣組成表示亮度及 兩色度訊號。由解碼一編碼VOP獲得。 參考VOP ··參考訊框為重建VOP編碼成編碼Ι-VOP或編碼 P-VOP的形式。參考VOP係用於正向及反向預 測如果解碼P-VOP及B-VOP。 重排序延遲:由VOP重排序造成解碼處理延遲。 保留: 在定義編碼位元流句子使用名詞“保留”表示將 來使用該值定義ISO/IEC擴充。 可伸縮分層結構:編碼視訊資料由一組大於一順序視訊位 元流組成。 伸縮性: 伸縮性為一解碼器的能力以解碼一順序位元流 組以產生一重建系列。另外,如果子集解碼便 輸出有用視訊。能解碼的最小子集為該集稱為 基層的第一位元流。集内其他的各位元流稱為 加強層。如果定址一特定加強層,下層即表示 該加強層之前的位元流。 -20- 85429 200400767 側面資訊:控制解碼器 運轉 飽和 掃描順序中非零係 係數的絕對值稱為 藉由設定其值達最 過一定義範圍。 所需的位元流資訊 數之前的零係數的數 位準。 大或最小範圍以限制 。非零 一值超 源;輸入 空間預測 名詞用來說明視訊材料或其在編碼前的特性。 預測導自m伸縮性使用的下層解瑪器的一解 空間伸縮性:一種伸縮性並中 τ偈庄具中加強層也使用導自下層不 使用移動向量的樣品資料的預測。各層具:不 同的VOP尺寸或V0P速率。 靜止子畫面:亮度,色度及二元α平面用於及時不變的物件。 子真面Ρ二S V〇P ·使用由纏繞全部或部份靜止子晝面 獲得的資訊編碼的圖像。 開始碼:唯—32位元㈣人編碼位元流。用於許多用.途 〜包括識Μ編碼語法的一些結構。 充填(位元); 充填(位元組插入編碼位元流的碼字並在解碼處理中丟 茱。其用途為增加流的位元率否則比希望的位 元率低。 暫時預測:預測導自定義為空間預測外的參考νορ。 暫時伸縮性:-種伸縮性其中—加強層也使用導自下層使 用移動向量的樣品資料的預測。各層具有相同 的訊框尺寸,但不具有相同VOP速率。 85429 -21- 200400767 頂層· 可伸縮分層結構的一最上層(且有3丄 漆明曰鱼祕· 目有取尚層的id) 〇 透月巨集塊.具有所有零形狀遮罩的巨集塊。 β變位7G率’ VBR .解碼編碼位元流期間位 化的操作。 手^時間笑 可變長度編碼; VLC:用於編碼分配於頻繁事件的較短碼字及用於少 、、 頻繁事件的較長碼字的反向程序。 視訊緩衝檢查符號; VBV:—假設解碼器概念上連接編碼器的輸出。並用 途為提供-限制編碼器或編輯方法產 率的可變性。 ” 視訊物件; VO : 一訊框内所有VOP的成分。 視訊物件層; VOL : — VOP的暫時順序。 視訊物件平面; VOP : 所屬訊框内任意形狀的區域。 VOP重排順序:如果編碼順序與顯示的組成順序不同,重 排重建VOP順序的方&。如果B_Vc^現在一 位元流中便發生VOP重排順序。如果解碼低延 遲位元流便沒有vOP重排順序。 視訊交談層··編碼視訊位元流的最高語法結構。人 包含'一系 列的一或更多編碼視訊物件。 嘴型: 嘴,舌及頷的實際配置形態視覺上與談話聲音 85429 -22- 200400767 的音位有關。 丁旦¢7 VOP的方法 逆止子畫面描出 少數移動參數(0, 2, 4, 8)驅動的全球空間轉 換組成以回收亮度,色度及形狀資訊。 曲折掃描順序:DCT係數的—特別系列排順序⑽最低空 間頻率至最高。 【實施方式】 關係編碼,解碼 本發明關係視訊壓縮技術,及較具體 及碼轉換技術用於壓縮視訊位元流。 根據本發明’ 一成本合理有效碼轉換器包括解碼一輸入 流降至巨集塊”,分析標頭資訊解量化及料解碼該巨 集塊’調整量化參數以相配希望輸出流特性,然後再量化 及再編碼巨集塊’從輸人流至輸出流複製未變或不變 頭資訊。 h 視訊瑀轉柊$ 圖1為根據本發明一完全視訊碼轉換器100的方塊圖。一 輸入位元流(舊位元流)102碼轉換輸入碼轉換器100位於 VOL (視訊物件層)標頭處理塊11〇及連續處理經3標頭處理 塊(V0L標頭處理塊110,GOV標頭處理塊120及v0P標頭處 理塊130),一部份解碼塊14〇,一碼轉換塊ι5〇及一再編碼 塊 16 0。 V0L標頭處理塊Π0解碼及抽取輸入位元流102的VOL標 頭位元112。其次,G0V標頭處理塊12〇解碼及抽取g〇v (VOP組)標頭位元丨22。其次,VOP (視訊物件平面)標頭處 85429 -23- 200400767 理塊130解碼及抽取輸入v〇P標頭位元132。輸入v〇p標頭 位元132包含資訊,包括量化參數資訊,有關如何連結原來 壓縮編碼的位元流102内的巨集塊。 在VOL,GOV及V0P標頭位元(分別112,122及132)已經 抽取後’在邵份解碼塊丨4〇中部份解碼剩下的位元流(主要 由巨集塊組成,以下討論)。部份解碼塊14〇由巨集塊標頭 資訊的分離巨集塊資料組成及按需要(根據儲存在標頭位 元編碼資訊)解量化成為可用形式。 率控制塊180藉由決定新量化參數182及184回應一希望 新位兀率輸入訊號1〇4其中輸入位元流1〇2必須重壓縮。完 成後,部份監視新位元流162 (以下討論)及調整量化參數 182及184以維持新位元流162在希望的位元率。新決定量化 參數184併入調整塊170的輸入ν〇ρ標頭位元132以產生輸 出標頭位元172。率控制塊18〇也提供量化參數資訊182至碼 轉換塊150以控制再量化(壓縮)自輸入位元流1〇2的解碼視 訊資料。 _ 碼轉換塊150操作一來自部份解碼塊14〇的解量化巨集塊 資料及根據來自率控制塊18〇的新量化參數182再量化該巨 集塊資料。碼轉換塊150也處理運動補償及編碼資料插入巨 集塊,保持追蹤及補償量化錯誤(原來位元流及再量化位元 流之間因量化產生的差)及決定再量化位元流中各巨集塊 的編碼模式。再編碼塊160根據由碼轉換器決定的編碼模式 再編碼碼轉換位元流以產生一新位元流162。再編碼塊Μ 乂沉’⑻”如有需要认術標頭位以分別⑴^及⑴) 85429 -24- 200400767 於適當位置重插入新位元流1 62 (標頭資訊的詳細說明參考 下列圖2A)。 輸入位元流102可以是編碼的VBR (可變位元率)或CBR (不變位元率)。同樣,輸出位元流可以是編碼的VBR或CBR。 MPEG-4位元流結構 圖2A為一 MPEG-4位元流200的結構示意圖,顯示如MPEG-4 規格定義的層結構。VOL標頭2 1 0包括下列資訊:
-物件層ID _ VOP時間增量解析度 -固定VOP率 -物件尺寸 -交錯/非交錯符號 -子畫面/GMC -量化形式 -量化矩陣,如有 - 該資訊包括在VOL標頭210内影響所有後續資訊必須解 釋及處理。 VOL標頭之後為GOV標頭220,包括下列資訊: -時間碼 -關閉/打開 -斷鏈 GOV標頭220控制後續一或更多VOP的解釋及處理。 各VOP包括一 VOP標頭23 0及一或更多巨集塊(MBs) (240a ,b,c.·.)。VOP標頭230包括下列資訊: -25- 85429 200400767 -VOP編碼形式(P,B,S或I) - VOP時間增量 -編碼/直接(未編碼) "猶形式 -最初始量化參數(QP) -移動向量碼(MV) VOP標頭23 0影響後續MBs (24〇)的解碼及解釋。 圖2B顯示一巨集塊(MB) 240的一般格式。一巨集塊或MB 240由一 MB標頭242及塊資料244組成。MB標頭242的格式 及編碼資訊係根據V0P標頭230的定義。總之,MB標頭242 包括下列資訊: -碼模式(内部,中間,等) -編碼或直接(未編碼) -編碼塊圖案(CBP) -AC預測旗標(AC_pred) -量化參數(QP) -交錯/非交錯 -移動向量(MVs) 各MB標頭有關的塊資料244包含可變長度(VLC)編碼DCT 係數用於6個由MB表示的8x8像素塊。 標頭處理 參考圖1,根據位元流顯示,VOL標頭處理塊11 0檢查輸 入位元流1 02用於識別VOL標頭。偵測V0L標頭後,由識別 及解碼標頭相關的輸入位元流的各編碼層(VOL,G0V, -26 - 85429 200400767 VOP,等)開始處理輸入位元流102。處理VOL,GOV及VOP 標頭如下: 1. VOL標頭虛理: VOL標頭處理塊1 1 0偵測及識別輸入位元流1 02中的一 VOL標頭(如MPEG-4規格定義)及然後解碼儲存在VOL標頭 内的資訊。然後將該資訊傳遞至GOV標頭處理塊120,包括 位元流,用於進一步分析及處理。分出VOL標頭位元112用 來重插入輸出位元流(新位元流)1 62。用於率減少碼轉換, 並不需要改變輸入位元流102及輸出位元流162之間VOL標 頭的任何資訊。因此,VOL標題位元112可簡單複製存入輸 出位元流162中適當位置。 2. GOV標頭處理: 根據由VOL標頭處理塊110傳遞的資料,GOV標頭處理塊 120搜尋輸入位元流102内的一 GOV標頭(如MPEG-4規格定 義)。因為VOP (及VOP標頭)在GOV標頭下可以不編碼,VOP 標頭可獨立於GOV標頭產生。如果GOV標頭在輸入位元流 102中發生,由GOV標頭處理塊120識別及解碼,及分出GOV 標頭位元122用於重插入輸出位元流162。任何解碼GOV標 頭資訊及輸入位元流傳遞至VOP標頭處理塊130作進一步 分析及處理。由於使用VOL標頭,不需要改變輸入位元流 102及輸出位元流162之間GOV標頭的任何資訊,所以GOV 標頭位元122係簡單複製存入輸出位元流162中的適當位 置。 3. VOP標頭虛理: -27- 85429 200400767 V〇P標頭處理塊130識別及解碼輸入位元流102的任何 VOP標頭(如MPEG-4規格定義)。分出偵測的VOP標頭位元 13 2及傳遞至一 QP調整塊170。也將解碼VOP標頭資訊及輸 入元流102傳遞至部份解碼塊140作進一步分析及處理。解 碼VOP標頭資訊由部份解碼塊140及碼轉換塊150使用作 MB巨集塊解碼及處理。因為MPEG-4規格限制QP改變從MB 至MB +/- 2,基本要求各VOP標示適當初始QP。初始QP形 成VOP標頭的一部份。根據率控制塊1 80出現的新位元率 1 04,及在輸出位元流162觀察的位元率的環境下,率控制 塊1 80決定適當量化參數(QP) 1 82及提供參數至碼轉換塊 180作MB再量化。提供適當初始量化參數184至QP調整塊 1 70用於修改偵測VOP標頭位元132及藉由將初始QP併入偵 測VOP標頭位元132而產生新VOP標頭位元172。新VOP標頭 位元172然後插入輸出位元流162的適當位置。 4. MB標頭處理: MPEG-4為一根據編碼系統的方塊其中各訊框分割成巨 集塊MBs。各MB由1個16x16亮度塊(即4個8x8亮度塊)及2 個8x8色度塊組成。VOP中的MB係一接一方式從左到右及 從上到下編碼。如MPEG-4規格定義,VOP由一 VOP標頭及 許多MBs表示(見圖2A)。為了效率簡化,本發明的MPEG-4 碼轉換器100只部份解碼MBs。即是,MBs只處理及解量化 VLD (可變長度解碼,或解碼VLC編碼資料)。 圖3為部份解碼塊300的方塊圖(比較130,圖1)。MB塊資 料由VLC編碼量化DCT係數組成。必須轉換為解編碼,解 -28- 85429 200400767 量化係數用於分析及處理。可變長度編碼(VLC) MB塊資料 位元302由VLD塊310作VLD處理以擴大成解編碼’量化 dct係數,及然後於解量化塊(Q-1) 320解量化以產生解編碼 及解量化DCT係數3 22形式的解量化MB資料322。 MB標頭(242)及MB塊資料(244)的編碼及解說係根據所 屬VOP的種類而定。MPEG-4規格定義4種VOP: I-VOP或「内 編碼」VOP,P-VOP或「預測編碼」V0P,S-V0P或「子畫 面」VOP及B-VOP或「雙向預測編碼」vop。各種VOP的 MB標頭(242)包含的資訊及MB塊資料(244)的格式及解釋 如下: I-VOP 的 MB層 如MPEG-4規格定義,I-VOP的MB標頭包括下列編碼參 數:
-MCBPC -AC預測旗標(AC—pred—flag)
-CBPY -DQUANT,及 -Interlace_inform I-VOP的定義MB塊資料只有兩種編碼模式:intra及 intra__q。 MCBPC表示MB的種類及兩個8x8色度塊的編碼圖案。 AC_pred_flag表示如果使用AC預測。CBPY為4個8x8亮度塊 的編碼圖案。DQUANT表示差動量化。如果VOL内交錯設 定,interlace_inform包括用於轉換MB塊資料的DCT係數的 -29- 85429 200400767 DCT (離散餘弦轉換)種類。 P-VOP 的 MB 層 如MPEG-4規格定義,P-VOP的MB標頭包括下列編碼參 數:
-COD -MCBPC -AC預測旗標(AC—pred—flag)
-CBPY
-DQUANT -Interlace__inform
-MVD -MVD2 -MVD3 及 -MCD4 MB的移動向量(MVs)為差動編碼。即是,編碼移動向量 差(MVDs),-非 MVs。MVD = MV—PMV,其中 PMV為預測 MV 〇 I-VOPs的MB塊資料定義有六種編碼模式:not_coded, inter,inter_q,inter_4MV,intra及 iiitra_q 〇 COD為MB是否編碼或不編碼的符號。MCBPC表示MB的 種類及兩個8x8色度塊的編碼圖案。AC_pred_flag只在 MCBPC表示intra或intra—q編碼時出現,並表示是否使用AC 預測。CBPY為4個8x8亮度塊的編碼圖案。DQUANT表示差 動量化。如果VOL標頭標示interlace,interlace_inform標示 -30- 85429 200400767 DCT (離散餘弦轉換)種類,場預測及頂或底預測。MVD, MVD2,MVD3及MVD4只在MCBPC標示適當編碼時出現。 塊資料只在MCBPC及CBPY標示適當編碼時出現。 S-VOP 的 MB層 如MPEG-4規格定義,P-VOP的MB標頭包括下列編碼參 數: -COD -MCBPC -MCSEL -AC_pred_flag -CBPY -DQUANT -Interlace_inform -MVD -MVD2 -MVD3 及 -MCD4 除了 P-VOP定義的六種碼模式外,MPEG-4規格定義 S-VOP額夕卜兩種編碼模式:inter_gmc 及 inter_gmc—q。MCSEL 只在MCBPC標示的編碼模式為inter或inter_q時於MCBPC 之後產生。如果設定為MCSEL,MB以inter__gmc或inter_gmc_q 編碼,而後沒有 MVDs (MVD,MVD2,MVD3,MVD4)。 Inter_gmc為一種編碼模式其中MB以inter模式編碼具有全 球運動補償。 -31 - 85429 200400767 Β-VOP 的 MB層 如MPEG-4規格定義,P-VOP的MB標頭包括下列編碼參 數··
-MODB -MBTYPE -CBPB -DQUANT - Interlace_inform -MVDf -MVDb,及 -MVDB CBPB為一 3至6位元碼表示B-VOP編碼塊圖案,如果由 MODB表示。MODB為一可變長度碼只在B-VOP的編碼巨集 塊中出現。用來表示是否ΜΒΤΥΡΕ及/或CBPB資訊在巨集塊 出現。 MPEG-4規格定義五種B-VOP的MB編碼模式:not—coded ,direct,interpolate—MC—Q,backward MC_Q,及forward—MC—Q 。如果跳過最近I-或P-VOP的一 MB,則B-VOP的相對MB也 要跳過。否則,不跳過該MB。每個不跳過的B-VOP的MB 出現MODB。MODB表示如果ΜΒΤΥΡΕ及CBPB隨後。ΜΒΤΥΡΕ 表示移動向量模式(出現MVDf,MVDb及MVDB)及量化 (DQUANT)。 碼韓換 參考圖1,在部份解碼塊140的VLD解碼及解量化後,解 -32- 85429 200400767 碼及解量化MB塊資料(參考322,圖3)傳遞至碼轉換引擎150 (包括前處理塊決定的資訊)。碼轉換塊1 50再量化解量化MB 塊資料使用來自率控制塊(以下詳述)的新量化參數(QP) 182 ,及建造一再編碼(碼轉換)MB,決定新MB的適當的新編 碼模式。VOP種類及MB編碼(如MB標頭標示)影響碼轉換塊 15 0處理來自部份解碼塊140的解碼及解量化塊資料。各MB 種類(如VOP/MB定義)具有一特別策略(以下詳述)用於決定 新MB的編碼形式。 圖4A-4G為用來處理解碼及解量化塊資料的各種碼轉換 技術的方塊圖,並結合各種VOP/MB編碼形式討論如下。 Ι-VOP的MB^I棘換 Ι-VOP的MBs的編碼為intra或intra_q模式,即是,編碼不 參考其他VOP,先前或以後。圖4A為一用於處理intra/intra_q 編碼MBs的碼轉換塊400a方塊圖。解碼MB資料402 (比較 3 22,圖3)輸入碼轉換塊400a及出現於量化器塊410。量-化 器塊根據來自率控制塊(參考圖1,180)的新QP 4 12再量化解 量化MB資料402及提供結果的再量化MB資料至模式決定 塊480,其中選擇一適當模式以再編碼再量化MB資料。再 量化MB資料及模式選擇482傳遞至再編碼器(見160,圖1)。 決定編碼模式的技術的詳細說明如下。解量化MB資料在 intra/intra_q編碼模式中為直接量化無運動補償(MC)。同時 也傳遞再量化MB至一解量化塊420 (Q·1)其中不執行量化以 產生DCT係數。如熟悉本技術者所知,碼轉換塊400a出現 的解量化MB資料402及解量化塊420產生的DCT係數為由 -33 - 85429 200400767 碼轉換MB表示的視訊影像資料的頻率-範圍形式。不過, 因為量化由量化塊410根據導出解量化mb資料402的原來 MB資料使用以外最有可能的不同qp而執行,其中解量化塊 420產生的DCT係數及出現在碼轉換塊4〇〇&的解量化mb資 料402之間有差異。這些差異係在計差塊425計算,及經IDCT 塊43 0的IDCT處理(反向離散餘弦轉換)以產生一 r錯誤影 像」表示由差異造成最後輸出位元流的量化錯誤。量化錯 誤的錯誤影像形式儲存在一訊框緩衝器44〇 (FB2)内。因為 量化錯誤可為正或負,但像素資料未帶符號,錯誤影像形 式偏移一半的FB2動態範圍。例如,假設8位元像素,FB2 的任何項目的範圍可從〇至255。影像資料向上偏移+128致 使錯誤影像值從-128至+127相對FB2項目值為0至255。與 MB合併儲存FB2的内容用於結合其他v〇P/編碼形式的運 動補償(MC)。 熟悉本技術者會立刻承認有許多不同的方法處理數目-轉 換(不同形式的數,如帶符號及未帶符號混雜),及上述的偏 移技術只代表一種技術,不能作為限制。 必須注意I-VOP的MB不可跳過。 P-VOP的MB石馬棘換 P-VOP 的 MB 可用 intra/intra_q,inter/inter_q/inter_4MV、編 碼,或跳過。不同種類(inter,inter_q,inter__4MV)的MB為 不同的碼轉換。上述碼轉換Intra/intra_q編碼P-VOP的MB參 考圖4A。碼轉換Inter,inter_q&inter_4MV編碼的MB如圖 4B所示。跳過MB的處理如圖4C所示。 -34- 85429 200400767 圖4B為碼轉換塊400b的方塊圖,適合碼轉換原為inter, inter_q4inter_4MV編碼的MB資料,如由VOP及MB標頭表 示。這些編碼模式使用運動補償。在碼轉換P-VOP之前, 傳送訊框緩衝器FB2 440的内容形至訊框緩衝器FBI 450。 FBI的内容出現於運動補償塊460。在儲存於FB2 440之前加 在錯誤影像資料的偏移在FB 1 450擷取後反向。運動補償塊 460 (MC)也接收碼模式及移動向量資訊(從MB標頭部份解 碼,參考圖3)及如MPEG-4規格標示操作以產生一運動補償 「影像」然後在DCT塊470作DCT處理以產生運動補償DCT 係數。這些運動補償DCT係數於合併塊405合併進來解量化 MB資料以產生運動補償MB資料。合併結果只將運動補償 加在碼轉換MB錯誤(原來MB資料及碼轉換MB資料482之間 的差異作為使用不同QP再量化的結果)。 運動補償MB資料在量化器塊410出現。與上述圖4A所示 相似,量化器塊根據來自率控制塊(參考圖1,180)的新QP 4 12再量化運屬補償MB資料及提供結果的再量化MB資料 至模式決定塊480,其中選擇一適當模式以再編碼再量化 MB資料。再量化MB資料及模式選擇485傳遞至再編碼器(見 1 6 0,圖1)。決定編碼模式的技術的詳細說明如下。T同時 也傳遞再量化MB至一解量化塊420 (Q·1)其中不執行量化以 產生DCT係數。如前述,因為量化由量化塊410根據導出解 量化MB資料402的原來MB資料使用以外的不同QP而執 行,其中解量化塊420產生的DCT係數及計差塊425計算的 運動補償MB資料之間有差異,及經IDCT塊430的IDCT處理 -35- 85429 200400767 (反向離散餘弦轉換)以產生一「錯誤影像」表示由差異造成 最後輸出位元流的量化錯誤。量化錯誤的錯誤影像形式儲 存在一訊框緩衝器FB2 440,如前述。因為量化錯誤可為正 或負’但像素資料未帶符號,錯誤影像形式偏移一半的FB2 動態範圍。 圖4C為碼轉換塊4〇〇c的方塊圖,適合原來編碼為「跳過」 的MB,如由V0P及MB標頭表示。在這種情況下,如果編 碼模式為「inter」及所有係數(MB資料)及所有運動補償向 量(MV)為零,則處理mb及MB資料。藉由強制所有解量化 MB資料402及所有移動向量462 (MV)為零便可完成而上述 碼轉換的說明須參考圖4B。由於先前訊框的剩餘錯誤資 訊’由合併器塊405產生的運動補償MB資料可能包括非零 元件,表示編碼的影像資訊。因此,跳過的MB在碼轉換後 可能產生一非跳過MB。這是因為由率控制塊(參考180,圖1) 分配的新QP 412能隨MB改變。原來非跳過MB在再量化後 不具有非零DCT係數。另一方面,原來跳過的MB在MC及 再量化後具有一些非零DCT係數。 S-VOP的MB碼棘換 OPs或「子畫面VOP」與P-VOPs相似但容許兩額外MB編 碼模式。inter—gmc及 inter_gmc—q。原來以 intra,intraq—q, inter,丨11^1:_4及inter_4MV編碼的S-VOPs MBs的處理由如上 述類似編碼的 P-VOP MBs。原來以 inter—gmc,inter_gmc__q 編碼及跳過的S-VOPs MBs的處理如圖4D所示。 圖4D為碼轉換塊400d的方塊圖,適合碼轉換原為inter_gmc -36- 85429 200400767 ,inter_gmc_q編碼的MB資料,如由VOP及MB標頭表示。 這些編碼模式使用GMC (全球運動補償)。如P-VOP,在碼 轉換S-VOP之前,訊框緩衝器FB2 440的内容傳送至訊框緩 衝器FBI 45 0。FBI的内容在運動補償塊460中出現用於GMC 。在儲存於FB2 440之前加在錯誤影像資料的偏移在從FBI 45 0擷取後反向。運動補償塊460 (MC)也接收GMC參數資訊 462 (從MB標頭部份解碼,參考圖3)及如MPEG-4規格標示 操作以產生一 GMC影像然後在DCT塊470作DCT處理以產 生運動補償DCT係數。這些運動補償DCT係數於合併塊405 合併進來解量化MB資料以產生GMC MB資料。合併結果只 將GMC加在碼轉換MB錯誤(原來MB資料及碼轉換MB資料 482之間的差異作為使用不同qp再量化的結果)。 GMC MB資料在量化器塊410出現。與上述圖4A-4C所示 相似,量化器塊根據來自率控制塊(參考圖1,1 80)的新QP 412再量化GMC MB資料及提供結果的再量化MB資料至-模 式決定塊480-,其中選擇一適當模式以再編碼再量化MB資 料。再量化MB資料及模式選擇485 (圖1中沒有48 5)傳遞至 再編碼器(見160,圖1)。決定編碼模式的技術的詳細說明如 下。同時也傳遞再量化MB至一解量化塊420 (Q-1)其中不執 行量化以產生DCT係數。如前述,因為量化由量化塊41 〇根 據導出解量化MB資料402的原來MB資料使用以外的不同 QP而執行,其中解量化塊420產生的DCT係數及計差塊425 計算的GMC MB資料之間有差異,及經IDCT塊430的IDCT 處理(反向離散餘弦轉換)以產生一錯誤影像表示由差異造 -37- 85429 200400767 成最後輸出位元流的量化錯誤。量化錯誤的錯誤影像形式 儲存在一訊框缓衝器FB2 440,如前述。因為量化錯誤可為 正或負,但像素資料未帶符號,錯誤影像形式偏移一半的 FB2動態範圍。 圖4E為碼轉換塊400e的方塊圖,適合原來編碼為“跳過” 的MB,如由VOP及MB標頭表示。在這種情況下,如果編 碼模式為inter_gmc及所有係數(MB資料)為零,則處理MB 及MB資料。藉由強制模式選擇,設定GMC運動補償(462) 及強制所有解量化MB資料402為零,便可完成碼轉換如上 述說明參考圖4D。由於先前訊框的剩餘錯誤資訊,由合併 器塊405產生的GMC MB資料可能包括非零元件,表示影像 資訊須要編碼。因此,跳過的MB在碼轉換後可能產生一非 跳過MB。這是因為由率控制塊(參考180,圖1)分配的新QP 4 12能隨MB改變。原來非跳過MB在再量化後不具有非零 DCT係數。另一方面,原來跳過的MB在GMC及再量化後具 有一些非零EXC T係數。 B-VOPs的MB碼棘換 B-VOPs或「雙向預測編碼VOPs」並不編碼新影像資料, 但在過去I-VOPs或P-VOPs,將來I-VOPs或P-VOPs,或兩者 之間内插(「將來」V0P資訊係在訊框系列順序外由處理 B-VOPs獲得,即是,在「將來」VOP之後導出影像資訊)。 B-VOPs定義4種編碼模式:直接,内插,反向及正向。這 些模式的B-VOP MBs的碼轉換如圖4F所示。原來編碼為「跳 過」的B-VOP MBs的碼轉換如圖4G所示。 -38 - 85429 200400767 圖4F為碼轉換塊400f的方塊圖,適合碼轉換原為直接, 正向,反向或内插編碼的MB資料,如由V〇p及MB標頭表 示。這些編碼模式使用運動補償。碼轉換之前,先前(及或 將來)V Ο P s的錯誤影像資訊處理在訊框緩衝器ρ b 1 4 5 0。 FBI的内容出現於運動補償塊460。在儲存於FBI 450之前加 在錯誤影像資料的任何偏移在從訊框緩衝器FB 1 450擷取 後反向。運動補償塊460 (MC)也接收移動向量(MV)及編碼 模式資訊462 (從MB標頭部份解碼,參考圖3)及如MPEG-4 規格標示操作以產生一運動補償MC「影像」然後在DCT塊 470作〇(3丁處理以產生乂匸〇(3丁係數。這些]\^〇(3丁係數於合 併塊405合併進來解量化MB資料402以產生Mc MB資料。合 併結果只將運動補償根據編碼模式加在來自其他先前,將 來或兩者VOP的碼轉換MB錯誤(原來MB資料及碼轉換MB 資料482之間的差異作為使用不同Qp再量化的結果)。 MC MB資料在量化器塊41 0出現。量化器塊根據來自率_控 制塊(參考圖1,180)的新QP 412再量化MC MB資料及提供 結果的再量化MB資料至模式決定塊480,其中選擇一適當 模式以再編碼再量化MB資料。再量化mb資料及模式選擇 485傳遞至再編碼器(見160,圖1)。決定編碼模式的技術的 詳細說明如下。因為B-VOP不曾用於將來運動補償,不計 异及儲存B-VOP的量化錯誤及其結果錯誤影像。 圖4G為碼轉換塊400g的方塊圖,適合原來編碼為跳過的 B-VOPMBs,如由VOP及MB標頭表示。在這種情況下,如 果編碼模式為「直接」及所有係數(mb資料)及移動向量為 -39- 85429 200400767 零,則處理MB及MB資料。藉由強制模式選擇及移動向量 462分Μ為「正向」及令,及強制所有解量化mb資料4〇2為 零,便可完成碼轉換如上述說明參考圖4F。由於先前訊框 的剩餘錯次貝訊,由合併益塊4 0 5產生的jyjc MB資料可能包 括非令元件’表示影像貪訊須要編碼。因此,跳過的mb在 碼轉換後可能產生一非跳過MB。這是因為由率控制塊(參 考180,圖1)分配的新QP 412能隨MB改變。原來非跳過MB 在再量化後不具有非零DCT係數。另一方面,原來跳過的 MB在GMC及再量化後具有一些非零dct係數。 热悉本技術者會發現上述圖4A-4G所示的方塊圖之間有 相當的共同性。雖然,上述不同編碼模式的碼轉換係為分 開項目,可提供一單碼轉換塊以容納上述所有編碼模式的 所有碼轉換操作。例如,一碼轉換塊如圖4B所示,其中Mc 塊也可以容納GMC,可以完成所有上述碼轉換操作。這樣 的效率較高,同時為較佳執行模式。圖丨的碼轉換塊15〇顯 示完全碼轉換器100的全部碼轉換功能,其實施可以為一組 衩數個分開專用的碼轉換塊,或為單一的通用碼轉換塊。 模式決定 在前述碼轉換的討論中,各碼轉換操作包括根據適當的 選擇編碼模式再編碼新MB資料的步驟。決定編碼模式的方 法如圖5,6,7a,7b,8a及8b所示。以下討論參考上述各 圖,圖中相對說明中的動作及決定的參考號碼包含在括狐 内。 l^yops的編石馬模尤沬佘 85429 -40- 200400767 圖5為一流程圖500顯示決定I-VOP MB的再編碼模式的 方法。在決定步騾505中,決定是否新QP (qi)與先前QP (q^) 相同。如果相同,在步驟5 1 0設定新編碼模式(再編碼模式) 為intra。如果不同,在步驟5 1 5設定新編碼模式為intra_q。 P-VOPs的編碼模式決定 圖6為一流程圖600顯示決定P-VOP MB的再編碼模式的 方法。在一第一決定步騾605中,如果原來P-VOP MB編碼 模式為intra或intra_q。則模式決定傳至決定步驟610處理。 如果不是,模式決定傳至決定步騾625處理。 在決定步騾610中,如果新QP(qi)與先前的QP(qN1)相同, 在步驟61 5設定新編碼模式為intra。如果不同,在步驟620 設定新編碼模式為intra_q。 在決定步騾625中,如果原來P-VOP MB編碼模式為inter 或inter_q,則模式決定到決定步驟630處理。如果不是,模 式決定到決定步騾655處理。 - 在決定步驟630中,如果新QP(qi)與先前QPCq^)不相同, 在決定步驟63 5設定新編碼模式為inter_q。如果相同,模式 決定到決定步騾640決定如果編碼塊圖案(CBP)全部為零及 移動向量(MV)為零。如果是,在步驟645設定新編碼模式為 跳過。如果不是,在步驟650設定新編碼模式為inter。 在決定步驟655中,因為原來編碼模式先前已經決定不是 inter,inter__q,intra 或 ibtra__q,便假定為inter__4MV,唯一 其他可能性。如果編碼塊圖案(CBP)全部為零及移動向量 (MV)為零,在步驟660設定新編碼模式為跳過。如果不是, -41 - 85429 200400767 在步騾665設定新編碼模式為inter_4MV。 S-VOPs的編碼模式決定 圖7a及7b為流程圖部份700a及700b結合形成一單流程圖 顯示決定S-VOP MBs的再編碼模式的方法。接頭「A」及「B」 表示流程圖部份700a及700b之間的連接點。圖7a及7b結合 說明。 一決定步騾705中,如果原來S-VOP MB編碼模式為intra 或intra_q。則模式決定到決定步騾710處理。如果不是,模 式決定到決定步騾725處理。 在決定步騾710中,如果新QP(qi)與先前的QPQ^)相同, 在步騾71 5設定新編碼模式為intra。如果不同,在步騾720 設定新編碼模式為intra_q。 在決定步驟725中,如果原來S-VOP MB編碼模式為inter 或inter_q,則模式決定到決定步驟730處理。如果不是,模 式決定到決定步驟755處理。 在決定步驟730中,如果新QP(q〇與先前QPQid)不相同, 在步驟73 5設定新編碼模式為inter_q。如果相同,模式決定 到決定步騾740決定如果編碼塊圖案(CBP)全部為零及移動 向量(MV)為零。如果是,在步騾745設定新編碼模式為「跳 過」。如果不是,在步驟75 0設定新編碼模式為inter。 在決定步驟755中,如果原來S-VOP MB編碼模式為inter_gmc 或inter_gmc_q,則模式決定到決定步驟760處理。如果不 是,模式決定到決定步驟7 8 5處理(經接頭「A」)。 在決定步驟760中,如果新QP (q〇與先前QP (q^)不相同, -42- 85429 200400767 在決定步騾765設定新編碼模式為inter_gmc_q。如果相同, 模式決定到決定步驟770決定如果編碼塊圖案(CBP)全部為 零。如果是,在步騾775設定新編碼模式為跳過。如果不是, 在步驟780設定新編碼模式為inter。 在決定步驟785中,因為原來編碼模式先前已經決定不是 inter,inter—q,inter—gmc,inter—gmc—q,intra或 intra_q, 便假定為inter_4MV,唯一其他可能性。如果編碼塊圖案 (CBP)全部為零及移動向量(MV)為零,在步騾790設定新編 碼模式為「跳過」。如果不是,在步騾795設定新編碼模式 為 inter_4MV 〇 B-VOPs的編石焉模式決定 圖8a及8b為流程圖部份800a及800b結合形成一單流程圖 顯示決定B- VOP MBs的再編碼模式的方法。接頭「C」及「D」 表示流程圖部份800a及800b之間的連接點。圖8a及8b結合 說明。 - 在一第一決定步驟805中,如果先前P-VOP的一共定位 MB (MV相對編碼視訊影像中相同位置)編碼為跳過。則在 步驟8 1 0設定新編碼模式為跳過。如果不是,模式決定到決 定步驟815處理,如果原來B-VOP MB編碼模式為「内插」 (interp_MC或interp_MC__q),便作決定。如果是,模式決定 方法到決定步騾820處理,如果不是,模式決定到決定步驟 835處理。 在決定步驟820中,如果新QP(qi)與先前的QPQi-O相同, 在步驟825設定新編碼模式為interp_MC。如果不同,在步 -43 - 85429 200400767 驟83 0設定新編碼模式為丨1^6印_1^1(1;_卩。 一決定步騾835中,如果原來B-VOP MB編碼模式為「反 向」(backwd或backwd—q),貝1J模式決定到決定步驟840處 理。如果不是,模式決定到決定步騾855處理。 在決定步驟840中,如果新QP (qi)與先前的QP (ςΝ1)相同, 在步騾845設定新編碼模式為backward_MC。如果不同,在 步驟85 0設定新編碼模式為backward_MC_q。 在決定步驟855中,如果原來B-VOP MB編碼模式為「正 向」(forward—或forward_MC—q),則模式決定到決定步驟860 處理。如果不是,模式決定到決定步驟875處理(經接頭 「C」)。 在決定步驟860中,如果新QP (q〇與先前的QP (q^)相同, 在步驟865設定新編碼模式為for war d_MC。如果不同,在步 驟870設定新編碼模式為化1界&1(1_]\/1(1:_9。 在決定步騾875中,因為原來編碼模式先前已經決定不是 interp—MC,interp—MC—q,backwd—MC,backwd—MC一q ’ forward或forward_MC_q,便假定為直接,唯一其他可能 性。如果編碼塊圖案(CBP)全部為零及移動向量(MV)為零, 在步騾880設定新編碼模式為「跳過」:.。如果不是,在步騾 8 8 5設定新編碼模式為直接。 再編碼 圖9為再編碼塊900 (比較160,圖1)的方塊圖。其中使用4 個編碼模組(910,920,930,940)以處理各種再編碼任務。 再編碼塊900接收來自碼轉換塊(見150,圖1及圖4A-4G)的 -44- 85429 200400767 資料905由再編碼的再量化MB資料及再編碼模式組成。再 編碼模式決定使用那個再編碼模組以再編碼再量化MB資 料。使用再編碼MB資料以提供一新位元流945。 使用一 Intra_MB再編碼模組910以再編碼I-VOPs,P-VOPs 或 S-VOPs 的 MBs 的 intra 及 intra__q 模式。使用一 Inter_MB 再 編碼模組920以再編碼P-VOPs或S-VOPs的MBs的inter, inter_q,及inter_4MV模式。使用GMC__MB再編碼模組93 0 以再編碼S-VOPs 的 MB 的inter—gmc 及 inter—gmc—q 模式。一 B_MB重編碼模組處理所有B-VOP MB編碼模式(interp__MC ,interp_MC_q,forward,forward_MC_q,backwd,backwd_MC__q 及直接)。 在新位元流945中,各種VOP的MB層的結構保持相同, 但是各攔的内容不同。特別: VOP標頭產生 Ι-VOP標頭 MB層的所有欄可從舊位元流不同編碼。因為,率控制引 擎分配一新QP於邵份的任何MB。如果這樣作,便造成MB 的不同CBP。雖然AC係數由新Qp再量化,所有intra模式的 DC係數必須由8量化。所以,再量化:DC係數等於原來編碼 DC係數。intra模式的量化DC係數為編碼空間預測。預測方 向係根據目前塊及相鄰塊(即,巨集塊)的量化DC係數之間 的差異決定。因為量化DC係數不變,DC係數的預測方向也 不變。AC預測方向隨後為DC預測方向。不過,因為mb分 配的新QP與原來編碼QP不同,比例AC預測不同。結果造成 -45- 85429 200400767 AC預測旗標(ACpred_flag)設定不同,以表示是否AC預測有 效或失效。新QP差動編碼。另外,因為從MB至MB的QP變 化由率控制塊(參考180,圖1)決定,DQUANT參數也改變。 P_VOP標頭 MB層的所有欄,MVDs除外,不同於舊位元流。Intra及 intra_q編碼MB再編碼用於I-VOPs。依新位元流的特徵的要 求編碼或不編碼inter及inter_q MBs。MV為差動編碼。MB 的PMV為相鄰MV的媒體。因為MV不變,PMV也不變。所 以,相同MVD再編碼成為新位元流。 S-VOP標頭 MB層的所有欄,MVDs除外,不同於舊位元流(圖6)。Intra ,intra_q,inter 及 inter_qMB 再編碼如 I-及 P-VOP 内。GMC MB的參數不變。 B-VOP標頭 MB層的所有欄,MVDs除外,不同於舊位元流。MV從 MPEG-4的PMV及DMV計算。B-VOP的PMV編碼模式可利用 碼轉換方法改變。MV再同步方法修改DMV值致使碼轉換位 元流能產生一 MV與輸入位元流的原來MV相同。解碼器儲 存反向及正向的PMVs。直接模式的PMV必須為零及從反向 及正向PMV獨立處理。在各MB行的開始PMV由零取代或如 果MB為MC編碼(分別為正向,反向,或兩者)則由MB (分別 為正向,反向,或兩者)值取代。如果MB編碼為跳過,PMV 為不變。所以,由碼轉換位元流產生的PMV可與輸入位元 流的不同如果MB由跳過模式變為MC模式或相反。較理 -46- 85429 200400767 想,在解碼及A絶 、 再 '扁馬万法的PM V為兩獨立儲存的分開變 數°再編碼方法方久γ
, 在各仃的開始歸零PM V及更新PM V如果MB 為MC編碼。另冰 ^ ^ Γ ’冉編碼方法發現一剩餘MV,PMV及決 Θ /、、C (可茭長埂碼)用於包括碼轉換位元流。如果MB不 扁馬為跳過,PMV更新及重新計算剩餘及其相對VLc。 再’人參考圖1 ’位元率控制塊18〇根據一目標位元率104 决疋碼轉換的新量化參數。位元率控制塊分配各v〇p 目栝位元數根據v〇p種類,v〇p種類的複雜性,在一時 間冒内的VOP數,分配時間窗的位元數,景色變化,等。 因為MGEP-4限制MB至MB變化達+/— 2,計算每VOP的適當 最初QP以符合目標位元率。根據下列公式計算: n — hd 1卿一 j~ hd 1 new 其中: R〇ld為每VOP的位元數。
Tnew為目標位元數。 q〇ld為舊QP及 q n e w 為新 Q P。 根據MB對MB基礎調整QP以符合每νορ的目標位元數。 檢查輸出位元流(新位元流,162)是否符合目標VOP位元分 配。如果使用太多位元,增加QP。如果使用太少位元,減 少QP。 評估MPEG-4碼轉換器的性能,完成一些測試視訊系列模 擬。所有系列為CIF格式:352x288及4:2:0。測試系列為第 85429 -47- 200400767 一編碼使用MPEG-4編碼器,;i Mbits/sec。壓縮位元流碼轉 換成新位元流,500 Kbits/sec。為了比較,相同系列也編碼 使用MPEG-4直接編碼’ 500 Kbits/sec。結果列於圖1〇的表 其中頭π系列的PSNR在CIF解析度直接使用MpEG-4及碼 轉換為,500 Kbits/sec。如所示,直接MpEG_4及碼轉換器 的PSNR差兴約大各車為〇 50 dB - 0.28 dB,花為〇·49 dB, 小汽車為0.58 dB及樣板為〇·3ΐ dB。品質損失由於事實碼轉 換器量化視訊訊號兩次,所以產生額外量化離訊。 例如,圖11顯示在VBR或固定QP,根據平均位元率使用 PSNR,大客車系列碼轉換器性能。鑽石線為直接MpEG-4 在固定QP=4,6,8,1〇,12,14,16,18,20 及 22。然後 QP=4的壓縮位元流在 qp=6,8,1〇,12,14,ΐ6,ΐ8,π 及22碼轉換。在較低位元率,碼轉換器性能很接近直接 MPEG-4,而在較高位元率,其差異約為ldB。階梯編碼與 碼轉換器的性能幾乎相同。不過,執行碼轉換器要比階梯 編碼簡單許多。 雖然本發明及各特別具體實施例已作說明,熟悉本技術 者g明白本發明可以作許多修改並不背離如申請專利範圍 所列的本發明範圍及精神。 【圖式簡單說明】 圖1為根據本發明的一完全視訊碼轉換器的方塊圖; 圖2 A根據本發明標準MpEG-4視訊流的結構示意圖; 圖2B根據本發明標準MpEG-4巨集塊的結構示意圖; 圖3為根據本發明的一種從編碼Μ B描取資料技術的方塊 85429 -48 - 200400767 圖 圖4A-4G為根據本發 4 '明應用各種不同編 却派擴換哭A/> %格式 的一完全 視訊碼轉換器的碼轉換部份的方塊 圖5為根據本發明的 % A的一種決疋卜V〇p的 的流程圖; 丹、,扁碼棱式的技術 圖 圖; 6為根據本發明的 又月的一種決足P-VOP的 術的流程圖; 再編碼棱式的技 編碼模式 圖7a及7b為根據本發明的—種決定s_v〇p的再 的技術的流程圖; 圖8a及8b為根據本發明的話4 ^ Ώ、 明的一種決疋B-VOP的再編碼模式 的技術的流程圖; 吴八 圖9為根據本發明的一 + 疋王視訊碼轉換器的編碼部份的 方塊圖; 切的 圖10為根據本發明的一種介於直接刪G-4編碼,階梯式 編碼’及碼轉換之間的一视訊源特別組的訊號對雜訊比較 表;及 - 圖11為根據本發明直接MPEG-4編碼及碼轉換之間訊號 對雜訊比較曲線。 ;ϋ 【圖式代表符號說明】 100 視訊碼轉換器 102 輸入位元流 104 新位元率 110 V0L標頭 112 V0L標頭位元 85429 -49- 200400767 120 GOV標頭 122 GOV標頭位元 130 VOP標頭 132 VOP標頭位元 140 部份解碼 150 碼轉換 160 再編碼 162 新位元流 170 調整 172 VOP標頭位元 180 位元率控制 182 調整量化參數 184 調整量化參數 200 MPEG-4位元流 210 VOL標頭 230 VOL標頭 240 巨集塊 300 部份解碼 302 MB塊資料位元 310 VLD塊 320 解量化塊 322 解量化MB資料 85429 - 50

Claims (1)

  1. 200400767 拾、申請專利範圍: 1 · 一種用於碼轉換一輸入壓縮視訊位元流至不同位元率的 一輸出壓縮視訊位元流之方法,包括: 接收第一位元率的輸入壓縮視訊位元流; 標示一輸出壓縮視訊位元流的一新目標位元率; 部份解碼輸入位元流以產生解量化資料; 使用不同量化位準(QP)再量化該解量化資料以產生再 量化資料;及 再編碼該再量化資料以產生該輸出壓縮視訊位元流。 2 ·如申請專利範圍第1項之方法,進一步包括: 決定一再量化的適當初始量化位準(QP); 監視輸出壓縮視訊位元流的位元率;及 調整量化位準以使輸出壓縮視訊位元流較接近相配目 標位元率。 3·如申請專利範圍第1項之方法,進一步包括: 直接對輸出壓縮視訊位元流複製不變標頭資料。 4·如申請專利範圍第1項之方法,進一步包括: 由解量化該再量化資料及從該解量化資料減去該再量 化資料決定再量化錯誤; IDCT處理該量化錯誤以產生一相等錯誤影像; 根據來自輸入壓縮視訊位元流的運動補償參數施加運 動補償至錯誤影像;及 DCT處理運動補償錯誤影像及施加DCT處理錯誤影像 至解f化貧料作為因再量化錯誤的運動補償校正。 85429 200400767 5 · —種用於碼轉換一輸入壓縮視訊位元流至不同位元率的 一輸出壓縮視訊位元流之裝置,包括: 用於接收第一位元率的輸入壓縮視訊位元流之裝置; 用於標示一輸出壓縮視訊位元流的一新目標位元率之 裝置; 用於部份解碼輸入位元流以產生解量化資料之裝置; 用於使用不同量化位準(QP)再量化該解量化資料以產 生再量化資料之裝置;及 用於再編碼該再量化資料以產生輸出壓縮視訊位元流 之裝置。 6·如申請專利範圍第5項之裝置,進一步包括: 裝置用於決定一再量化的適當初始量化位準(Qp); 裝置用於監視輸出壓縮視訊位元流的位元率;及 裝置用於調整量化位準以使輸出壓縮視訊位元流之位 元率較接近相配目標位元率。 7·如申請專利範圍第5項之裝置,進一步包括: 衣置用於直接對輸出壓縮視訊位元流複製不變標頭資 料。 8·如申請專利範圍第5項之裝置,進一步包括: 裝置用於由解量化該再量化資料及從該解量化資料減 去該再量化資料決定再量化錯誤; 裝置用於IDCT處理量化錯誤以產生一相等錯誤影像; 裝置用於根據來自輸入壓縮視訊位元流的運動補償參 數施加運動補償至錯誤影像;及 85429 200400767 裝置用於DCT處理運動補償錯誤影像及施加DCT處理 錯誤影像至解量化資料作為因再量化錯誤的運動補償 正。 、人 9. 同位元率的 一種用於碼轉換一輸入壓縮視訊位元流至不 一輸出壓縮視訊位元流之方法,包招:: 接收一輸入位元流; 從輸入位元流抽取一視訊物件層標頭; 從輸入位元流解量化巨集塊資料; 再量化該解量化巨集塊資料;及 將抽取視訊物件層標頭插入輸出位元流, 巨集塊資料。 u 量化 1 0 ·如申請專利範圍第9項之方法,進一步包括 從輸入位元流抽取一組視訊物件層標頭;及 將抽取的視訊物件層標頭組插入輸出位元汽 U.如申請專利範圍第9項之方法,進—步包括:⑽ 攸鳥11入和元流抽取一視訊物件平面柄卩写·及 將拙取的視訊物件平面標頭插入輪出位元流 12·如申請專利範圍第9項之方法,進一步包括· 決定一再量化的適當初始量化位準(Qp); 監視輸出壓縮視訊位元流的位元率;及 調整量化位準以使輸出壓縮視 近相配目標位元率。
    訊位元流之位元 如申凊專利範圍第9項之方法,進—步包括· 直接從輸入位元流複製不變標頭資^輸出位元流 85429 200400767 14.如申請專利範圍第9項之方法,進一步包括: 由解量化該再量化資料及從該解量化資料減去該再量 化資料決定再量化錯誤; IDCT處理量化錯誤以產生一相等錯誤影像; 根據來自輸入壓縮視訊位元流的運動補償參數施加運 動補償至錯誤影像;及 DCT處理運動補償錯誤影像及施加DCT處理錯誤影像 至解f化資料作為因再量化錯誤的運動補償校正。 1 5 ·如申請專利範圍第9項之方法,進一步包括: 顯示再量化錯誤為8位元符號數; 在儲存該再量化錯誤於一 8位元無符號儲存緩衝器之 前附加一半再量化錯誤間距的偏移至該再量化錯誤;及 在從8位元無符號儲存緩衝器擷取後從該再量化錯誤 減去該偏移。 1 6·如申請專利範圍第9項之方法,進一步包括: 用於編碼為「跳過」的MBs,才是供所有零則至碼轉換 器。 17·如申請專利範圍第16項之方法,進一步包括: 用於具有編碼為「跳過」的MBs的預測v〇p模式,提供 所有零MV值至碼轉換器。 18·如申請專利範圍第9項之方法,進一步包括: 在碼轉換及運動補彳當乡 、、 力硐杈後如果編碼塊圖案全部為零便 作決足,及選擇「跳過」的編碼模式。 19.如申請專利範圍第9項之方法,進一步包括: 85429 200400767 用於預測VOP模式,在碼轉換及運動補償後,如果編碼 塊圖案全邵為零及Μν值全部為零便作決定,及選擇「跳 過」的編碼模式。 ' 20·如申請專利範圍第9項之方法,進一步包括: · 用於原來編碼模式真「制,讲 ^ ^ 八4跳過」的P-VOP,s-νορ及B_V0P ’碼轉換後決定,如果: 編碼塊圖案全部為零;及 Μ V全部為零;及 跳過」編碼模式 進一步包括: 如果兩條件為真,便只選擇 21·如申請專利範圍第9項之方法, 用於P-VOP,其中: 原來編碼模式為「跳過· 輸入MB全部為零; 模式為「正向」;及 MV全部為零; 碼轉換後-決定,如果: 編碼塊圖案全部為零;與 MV全部為零,·及 如果兩條件為真,便u ^ ^卜 、璲擇「跳過」編碼模式 22·如申請專利範圍第9項乏士、冬 "<万法,進一步包括: 用於S-VOP,其令: 輸入MB全邵為零; G M C設定值為零; 碼轉換後決定,如果: 85429 200400767 編碼塊圖案全部為零;及 運動補償全部為零;及 如果兩條件為真,便只選擇「跳過」編碼模式。 23.如申請專利範圍第9項之方法,進一步包括: 用於B-VOP,其中: 輸入MB全部為零; 模式為「直接」;及 MV全部為零; 碼轉換後決定,如果: 編碼塊圖案全部為零; 模式為「直接」;及 MV全部為零; 如果所有三條件為真,便只選擇「跳過」編碼模式。 85429
TW092113354A 2002-05-17 2003-05-16 Method and apparatus for transcoding compressed video bitstreams TW200400767A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/150,269 US20030215011A1 (en) 2002-05-17 2002-05-17 Method and apparatus for transcoding compressed video bitstreams

Publications (1)

Publication Number Publication Date
TW200400767A true TW200400767A (en) 2004-01-01

Family

ID=29419208

Family Applications (1)

Application Number Title Priority Date Filing Date
TW092113354A TW200400767A (en) 2002-05-17 2003-05-16 Method and apparatus for transcoding compressed video bitstreams

Country Status (10)

Country Link
US (1) US20030215011A1 (zh)
EP (1) EP1506677A2 (zh)
JP (1) JP2005526457A (zh)
KR (1) KR100620270B1 (zh)
CN (1) CN1653822A (zh)
AU (1) AU2003237860A1 (zh)
CA (1) CA2485181A1 (zh)
MX (1) MXPA04011439A (zh)
TW (1) TW200400767A (zh)
WO (1) WO2003098938A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10097825B2 (en) 2012-11-21 2018-10-09 Qualcomm Incorporated Restricting inter-layer prediction based on a maximum number of motion-compensated layers in high efficiency video coding (HEVC) extensions

Families Citing this family (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1520431B1 (en) 2002-07-01 2018-12-26 E G Technology Inc. Efficient compression and transport of video over a network
SG140441A1 (en) * 2003-03-17 2008-03-28 St Microelectronics Asia Decoder and method of decoding using pseudo two pass decoding and one pass encoding
US20060251168A1 (en) * 2003-04-04 2006-11-09 Koninklijke Philips Electronics N.V. Video encoding and decoding methods and corresponding devices
US20040210940A1 (en) * 2003-04-17 2004-10-21 Punit Shah Method for improving ranging frequency offset accuracy
JP2006525722A (ja) * 2003-05-06 2006-11-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ符号化及び復号化方法、並びに対応する符号化及び復号化装置
US8218624B2 (en) 2003-07-18 2012-07-10 Microsoft Corporation Fractional quantization step sizes for high bit rates
US10554985B2 (en) 2003-07-18 2020-02-04 Microsoft Technology Licensing, Llc DC coefficient signaling at small quantization step sizes
US7738554B2 (en) 2003-07-18 2010-06-15 Microsoft Corporation DC coefficient signaling at small quantization step sizes
KR100556340B1 (ko) * 2004-01-13 2006-03-03 (주)씨앤에스 테크놀로지 영상 부호화 장치
US7839998B2 (en) * 2004-02-09 2010-11-23 Sony Corporation Transcoding CableCARD
US7397855B2 (en) * 2004-04-14 2008-07-08 Corel Tw Corp. Rate controlling method and apparatus for use in a transcoder
TW200607355A (en) 2004-05-04 2006-02-16 Qualcomm Inc Method and apparatus for motion compensated frame rate up conversion for block-based low bit rate video
US7801383B2 (en) 2004-05-15 2010-09-21 Microsoft Corporation Embedded scalar quantizers with arbitrary dead-zone ratios
KR101320260B1 (ko) * 2004-06-18 2013-10-23 톰슨 라이센싱 비디오 신호 데이터를 인코딩 및 디코딩하기 위한 방법 및 장치
TWI392374B (zh) 2004-07-01 2013-04-01 Qualcomm Inc 於可調節視訊編碼中用以使用框率上升轉換技術之方法與裝置
CN101189882B (zh) 2004-07-20 2012-08-01 高通股份有限公司 用于视频压缩的编码器辅助帧率上变换(ea-fruc)的方法和装置
US8553776B2 (en) 2004-07-21 2013-10-08 QUALCOMM Inorporated Method and apparatus for motion vector assignment
WO2006080655A1 (en) * 2004-10-18 2006-08-03 Samsung Electronics Co., Ltd. Apparatus and method for adjusting bitrate of coded scalable bitsteam based on multi-layer
KR100679022B1 (ko) 2004-10-18 2007-02-05 삼성전자주식회사 계층간 필터링을 이용한 비디오 코딩 및 디코딩방법과,비디오 인코더 및 디코더
US8434116B2 (en) 2004-12-01 2013-04-30 At&T Intellectual Property I, L.P. Device, system, and method for managing television tuners
US8031774B2 (en) * 2005-01-31 2011-10-04 Mediatek Incoropration Video encoding methods and systems with frame-layer rate control
US8422546B2 (en) 2005-05-25 2013-04-16 Microsoft Corporation Adaptive video encoding using a perceptual model
US7908627B2 (en) 2005-06-22 2011-03-15 At&T Intellectual Property I, L.P. System and method to provide a unified video signal for diverse receiving platforms
JP4788250B2 (ja) * 2005-09-08 2011-10-05 ソニー株式会社 動画像信号の符号化装置、動画像信号の符号化方法およびコンピュータ読み取り可能な記録媒体
US20070147496A1 (en) * 2005-12-23 2007-06-28 Bhaskar Sherigar Hardware implementation of programmable controls for inverse quantizing with a plurality of standards
NL1030976C2 (nl) * 2006-01-23 2007-07-24 Ventury Tower Mall Iii Inc Werkwijze en inrichting voor het aanpassen van de grootte van een informatiebestand.
KR100772878B1 (ko) * 2006-03-27 2007-11-02 삼성전자주식회사 비트스트림의 비트율 조절을 위한 우선권 할당 방법,비트스트림의 비트율 조절 방법, 비디오 디코딩 방법 및 그방법을 이용한 장치
US8634463B2 (en) 2006-04-04 2014-01-21 Qualcomm Incorporated Apparatus and method of enhanced frame interpolation in video compression
US8750387B2 (en) 2006-04-04 2014-06-10 Qualcomm Incorporated Adaptive encoder-assisted frame rate up conversion
US7974340B2 (en) 2006-04-07 2011-07-05 Microsoft Corporation Adaptive B-picture quantization control
US7995649B2 (en) 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US8503536B2 (en) 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US8130828B2 (en) 2006-04-07 2012-03-06 Microsoft Corporation Adjusting quantization to preserve non-zero AC coefficients
US8059721B2 (en) 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
US8077775B2 (en) * 2006-05-12 2011-12-13 Freescale Semiconductor, Inc. System and method of adaptive rate control for a video encoder
US7773672B2 (en) * 2006-05-30 2010-08-10 Freescale Semiconductor, Inc. Scalable rate control system for a video encoder
JP4584871B2 (ja) * 2006-06-09 2010-11-24 パナソニック株式会社 画像符号化記録装置および画像符号化記録方法
US20080007649A1 (en) * 2006-06-23 2008-01-10 Broadcom Corporation, A California Corporation Adaptive video processing using sub-frame metadata
US8385424B2 (en) * 2006-06-26 2013-02-26 Qualcomm Incorporated Reduction of errors during computation of inverse discrete cosine transform
US8571340B2 (en) 2006-06-26 2013-10-29 Qualcomm Incorporated Efficient fixed-point approximations of forward and inverse discrete cosine transforms
KR101352979B1 (ko) 2006-07-04 2014-01-23 경희대학교 산학협력단 스케일러블 비디오 인코딩/디코딩 방법 및 그 장치
WO2008004816A1 (en) * 2006-07-04 2008-01-10 Electronics And Telecommunications Research Institute Scalable video encoding/decoding method and apparatus thereof
KR20080004340A (ko) * 2006-07-04 2008-01-09 한국전자통신연구원 영상 데이터의 스케일러블 코딩 방법 및 그 장치
JP4624321B2 (ja) * 2006-08-04 2011-02-02 株式会社メガチップス トランスコーダおよび符号化画像変換方法
US20080043832A1 (en) * 2006-08-16 2008-02-21 Microsoft Corporation Techniques for variable resolution encoding and decoding of digital video
US8773494B2 (en) 2006-08-29 2014-07-08 Microsoft Corporation Techniques for managing visual compositions for a multimedia conference call
US8300698B2 (en) 2006-10-23 2012-10-30 Qualcomm Incorporated Signalling of maximum dynamic range of inverse discrete cosine transform
EP2080377A2 (en) * 2006-10-31 2009-07-22 THOMSON Licensing Method and apparatus for transrating bit streams
US8437397B2 (en) * 2007-01-04 2013-05-07 Qualcomm Incorporated Block information adjustment techniques to reduce artifacts in interpolated video frames
US8238424B2 (en) 2007-02-09 2012-08-07 Microsoft Corporation Complexity-based adaptive preprocessing for multiple-pass video compression
TW200836130A (en) * 2007-02-16 2008-09-01 Thomson Licensing Bitrate reduction method by requantization
US8594187B2 (en) * 2007-03-02 2013-11-26 Qualcomm Incorporated Efficient video block mode changes in second pass video coding
US8498335B2 (en) 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US20080240257A1 (en) * 2007-03-26 2008-10-02 Microsoft Corporation Using quantization bias that accounts for relations between transform bins and quantization bins
US8243797B2 (en) 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
US8189676B2 (en) * 2007-04-05 2012-05-29 Hong Kong University Of Science & Technology Advance macro-block entropy coding for advanced video standards
US8442337B2 (en) 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
US8331438B2 (en) 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
US8189933B2 (en) 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
CN102210152A (zh) 2008-10-06 2011-10-05 Lg电子株式会社 用于处理视频信号的方法和设备
US8275057B2 (en) * 2008-12-19 2012-09-25 Intel Corporation Methods and systems to estimate channel frequency response in multi-carrier signals
KR20100071865A (ko) * 2008-12-19 2010-06-29 삼성전자주식회사 멀티 코어 프로세스 방식의 영상 신호 처리장치에서 영상 프레임 구성 및 복호화 방법과 그 영상 신호 처리장치
US20110080944A1 (en) * 2009-10-07 2011-04-07 Vixs Systems, Inc. Real-time video transcoder and methods for use therewith
US8731152B2 (en) 2010-06-18 2014-05-20 Microsoft Corporation Reducing use of periodic key frames in video conferencing
WO2012050832A1 (en) * 2010-09-28 2012-04-19 Google Inc. Systems and methods utilizing efficient video compression techniques for providing static image data
US8990435B2 (en) * 2011-01-17 2015-03-24 Mediatek Inc. Method and apparatus for accessing data of multi-tile encoded picture stored in buffering apparatus
CN103493489B (zh) 2011-04-14 2016-10-19 杜比实验室特许公司 基于原色分级模型的图像预测
KR101351461B1 (ko) * 2011-08-02 2014-01-14 주식회사 케이티 동영상 전송률 제어 시스템 및 방법, 그리고 동영상 변환 방법
US20130195198A1 (en) * 2012-01-23 2013-08-01 Splashtop Inc. Remote protocol
US9491459B2 (en) * 2012-09-27 2016-11-08 Qualcomm Incorporated Base layer merge and AMVP modes for video coding
US9936196B2 (en) * 2012-10-30 2018-04-03 Qualcomm Incorporated Target output layers in video coding
JP5412588B2 (ja) * 2013-01-30 2014-02-12 株式会社メガチップス トランスコーダ
GB2512829B (en) 2013-04-05 2015-05-27 Canon Kk Method and apparatus for encoding or decoding an image with inter layer motion information prediction according to motion information compression scheme
EP3055998A1 (en) 2013-10-11 2016-08-17 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for video transcoding using mode or motion or in-loop filter information
FR3016764B1 (fr) * 2014-01-17 2016-02-26 Sagemcom Broadband Sas Procede et dispositif de transcodage de donnees video de h.264 vers h.265
US9953660B2 (en) * 2014-08-19 2018-04-24 Nuance Communications, Inc. System and method for reducing tandeming effects in a communication system
CN107038736B (zh) * 2017-03-17 2021-07-06 腾讯科技(深圳)有限公司 一种基于帧率的动画展示方法及终端设备
US10229537B2 (en) * 2017-08-02 2019-03-12 Omnivor, Inc. System and method for compressing and decompressing time-varying surface data of a 3-dimensional object using a video codec
US10692247B2 (en) * 2017-08-02 2020-06-23 Omnivor, Inc. System and method for compressing and decompressing surface data of a 3-dimensional object using an image codec
CN109660825B (zh) * 2017-10-10 2021-02-09 腾讯科技(深圳)有限公司 视频转码方法、装置、计算机设备及存储介质
CN110490810B (zh) * 2019-01-20 2020-06-30 浙江精弘益联科技有限公司 现场大数据动态调整装置
CN110880009B (zh) * 2019-01-20 2020-07-17 浩德科技股份有限公司 现场大数据动态调整方法
US11044477B2 (en) * 2019-12-16 2021-06-22 Intel Corporation Motion adaptive encoding of video
US11582442B1 (en) * 2020-12-03 2023-02-14 Amazon Technologies, Inc. Video encoding mode selection by a hierarchy of machine learning models
CN112866716A (zh) * 2021-01-15 2021-05-28 北京睿芯高通量科技有限公司 一种对视频文件进行同步解封装的方法及其系统
US11587208B2 (en) * 2021-05-26 2023-02-21 Qualcomm Incorporated High quality UI elements with frame extrapolation

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0893027B1 (en) 1996-04-12 2004-08-25 Imedia Corporation Compressed-video distribution system having a statistical multiplexer with transcoders
US6570922B1 (en) * 1998-11-24 2003-05-27 General Instrument Corporation Rate control for an MPEG transcoder without a priori knowledge of picture type
KR100433516B1 (ko) * 2000-12-08 2004-05-31 삼성전자주식회사 트랜스코딩 방법
US6671322B2 (en) * 2001-05-11 2003-12-30 Mitsubishi Electric Research Laboratories, Inc. Video transcoder with spatial resolution reduction

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10097825B2 (en) 2012-11-21 2018-10-09 Qualcomm Incorporated Restricting inter-layer prediction based on a maximum number of motion-compensated layers in high efficiency video coding (HEVC) extensions

Also Published As

Publication number Publication date
KR100620270B1 (ko) 2006-09-13
US20030215011A1 (en) 2003-11-20
JP2005526457A (ja) 2005-09-02
AU2003237860A1 (en) 2003-12-02
AU2003237860A8 (en) 2003-12-02
CN1653822A (zh) 2005-08-10
EP1506677A2 (en) 2005-02-16
KR20050010814A (ko) 2005-01-28
WO2003098938A3 (en) 2004-06-10
CA2485181A1 (en) 2003-11-27
WO2003098938A2 (en) 2003-11-27
MXPA04011439A (es) 2005-02-17

Similar Documents

Publication Publication Date Title
TW200400767A (en) Method and apparatus for transcoding compressed video bitstreams
JP7164728B2 (ja) 参照画像リサンプリングのためのシグナリング
JP6768145B2 (ja) ビデオの符号化および復号
US6081295A (en) Method and apparatus for transcoding bit streams with video data
US10313668B2 (en) Method and device for encoding or decoding an image comprising encoding of decoding information representing prediction modes
US10291934B2 (en) Modified HEVC transform tree syntax
US20160286241A1 (en) Apparatus, a method and a computer program for video coding and decoding
WO2016151195A1 (en) An apparatus, a method and a computer program for video coding and decoding
JP7322171B2 (ja) ビデオ符号化及び復号における最小符号化ブロックサイズの範囲
KR20020045366A (ko) 트랜스코딩 방법 및 이에 적합한 장치
US20080212682A1 (en) Reduced resolution video transcoding with greatly reduced complexity
US11317105B2 (en) Modification of picture parameter set (PPS) for HEVC extensions
JP2022521992A (ja) ビデオコーディングのための方法、装置及びコンピュータプログラム
CN113382259B (zh) 视频解码方法、装置和计算机设备
US8243798B2 (en) Methods and apparatus for scalable video bitstreams
JP2022521519A (ja) ビデオビットストリームにおけるインターレイヤ予測のシグナリング
CN116018782A (zh) 用于音频混合的方法和装置
JP2023504800A (ja) 可逆圧縮及び準可逆圧縮用量子化器
EP2372922A1 (en) System and method for transcoding between scalable and non-scalable video codecs
JP2023521047A (ja) ビデオコーディングのための方法および装置
CA2935303C (en) Conditionally parsed extension syntax for hevc extension processing
JP7322178B2 (ja) マルチレイヤ化映像ストリームにおけるサブレイヤ番号の指示のための方法、装置、及びコンピュータプログラム
JP7377887B2 (ja) ビデオ符号化又はビデオ復号のための方法、装置及びコンピュータプログラム
CN112118452B (zh) 视频解码的方法和装置、计算机设备
CN113497940A (zh) 视频解码方法、装置、计算机设备及存储介质