TW201334552A - 執行視訊寫碼之運動向量預測 - Google Patents

執行視訊寫碼之運動向量預測 Download PDF

Info

Publication number
TW201334552A
TW201334552A TW101149130A TW101149130A TW201334552A TW 201334552 A TW201334552 A TW 201334552A TW 101149130 A TW101149130 A TW 101149130A TW 101149130 A TW101149130 A TW 101149130A TW 201334552 A TW201334552 A TW 201334552A
Authority
TW
Taiwan
Prior art keywords
motion vector
video
candidate motion
motion vectors
scaled
Prior art date
Application number
TW101149130A
Other languages
English (en)
Other versions
TWI535269B (zh
Inventor
jian-le Chen
Muhammed Zeyd Coban
Ye-Kui Wang
Xianglin Wang
Marta Karczewicz
Wei-Jung Chien
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201334552A publication Critical patent/TW201334552A/zh
Application granted granted Critical
Publication of TWI535269B publication Critical patent/TWI535269B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一般而言,本發明描述用於執行視訊寫碼之運動向量預測之技術。包含一處理器之一視訊寫碼器件可執行該等技術。該處理器可經組態以針對視訊資料之一當前區塊而判定複數個候選運動向量以便執行運動向量預測程序,且按比例調整針對該視訊資料之該當前區塊而判定之該複數個候選運動向量中之一或多者以產生一或多個經按比例調整候選運動向量。該處理器接著可經組態以將該等經按比例調整候選運動向量修改為在一指定範圍內。

Description

執行視訊寫碼之運動向量預測
本發明係關於視訊寫碼,且更特定而言,係關於視訊寫碼之運動補償態樣。
本申請案主張2011年12月22日申請之美國臨時申請案第61/579,465號及2012年1月6日申請之美國臨時申請案第61/584,096號的權利,該等臨時申請案中任一者之全文特此係以引用方式併入。
數位視訊能力可併入至廣泛範圍之器件中,該等器件包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、數位相機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲主控台、蜂巢式或衛星無線電電話、視訊電傳會議器件及其類似者。數位視訊器件實施視訊壓縮技術,諸如,由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分(進階視訊寫碼(AVC))定義之標準及此等標準之延伸所描述的技術,以較有效率地傳輸及接收數位視訊資訊。諸如由為MPEG與ITU-T之間的合作者之「聯合合作小組-視訊寫碼」(JCT-VC)開發之高效率視訊寫碼(HEVC)標準的新視訊寫碼標準正被開發。新興HEVC標準有時被稱為H.265,但尚未正式地作出此命名。
一般而言,本發明描述用於將用於一運動向量預測程序 中之運動向量候選者之範圍限定為在一指定範圍內的技術。運動向量預測通常係作為改良運動估計被執行之效率之一方式而用於視訊寫碼中。不是藉由執行通常被稱作「運動估計」之估計而在參考圖框中執行針對匹配於一當前區塊之區塊之一搜尋,而是視訊寫碼器可自為視訊資料之當前區塊之空間或時間相鄰者的區塊判定此等候選運動向量且選擇此等候選運動向量中之一者作為視訊資料之該當前區塊之運動向量預測子。在一些例子中,可按比例調整此等候選運動向量。當選擇一經按比例調整候選運動向量作為該運動向量預測子時,該等技術可使該視訊寫碼器能夠限定此經按比例調整候選運動向量之一水平分量及一垂直分量中之一或多者的範圍。
在一實例中,一種寫碼視訊資料之方法包含:針對該視訊資料之一當前區塊而判定複數個候選運動向量以便執行一運動向量預測程序;按比例調整針對該視訊資料之該當前區塊而判定之該複數個候選運動向量中之一或多者以產生一或多個經按比例調整候選運動向量;及將該等經按比例調整候選運動向量修改為在一指定範圍內。該方法進一步包含:選擇該複數個候選運動向量中之一者作為該視訊資料之該當前區塊之一運動向量預測子;及基於運動向量預測子來寫碼視訊資料之該當前區塊。
在另一實例中,一種經組態以執行一運動向量預測程序以寫碼視訊資料之視訊寫碼器件包含一處理器,該處理器經組態以針對該視訊資料之一當前區塊而判定複數個候選 運動向量以便執行該運動向量預測程序、按比例調整針對該視訊資料之該當前區塊而判定之該複數個候選運動向量中之一或多者以產生一或多個經按比例調整候選運動向量、將該等經按比例調整候選運動向量修改為在一指定範圍內、選擇該複數個候選運動向量中之一者作為該視訊資料之該當前區塊之一運動向量預測子,且基於運動向量預測子來寫碼視訊資料之該當前區塊。
在另一實例中,一種經組態以執行一運動向量預測程序以寫碼視訊資料之視訊寫碼器件包含用於針對該視訊資料之一當前區塊而判定複數個候選運動向量以便執行該運動向量預測程序的構件,及用於按比例調整針對該視訊資料之該當前區塊而判定之該複數個候選運動向量中之一或多者以產生一或多個經按比例調整候選運動向量的構件。該視訊寫碼器件進一步包含用於將該等經按比例調整候選運動向量修改為在一指定範圍內的構件、用於選擇該複數個候選運動向量中之一者作為該視訊資料之該當前區塊之一運動向量預測子的構件,及用於基於運動向量預測子來寫碼視訊資料之該當前區塊的構件。
在另一實例中,一種非暫時性電腦可讀儲存媒體具有儲存於其上之指令,該等指令在被執行時致使一或多個處理器針對視訊資料之一當前區塊而判定複數個候選運動向量以便執行一運動向量預測程序、按比例調整針對該視訊資料之該當前區塊而判定之該複數個候選運動向量中之一或多者以產生一或多個經按比例調整候選運動向量、將該等 經按比例調整候選運動向量修改為在一指定範圍內、選擇該複數個候選運動向量中之一者作為該視訊資料之該當前區塊之一運動向量預測子,且基於運動向量預測子來寫碼視訊資料之該當前區塊。
以下隨附圖式及描述中陳述一或多個實例之細節。其他特徵、目標及優勢將自該描述及該等圖式且自申請專利範圍變得顯而易見。
本發明所描述之技術之實施例使視訊寫碼器(其可表示在此描述中用以指代視訊編碼器及視訊解碼器中之一者或此兩者之術語)能夠在執行運動向量預測程序時將選定候選運動向量之範圍限定為在指定範圍內。換言之,該等技術使視訊寫碼器能夠針對視訊資料之當前區塊而判定候選運動向量之清單(其中此等候選運動向量亦可被稱作「運動向量預測子候選者」且該清單可被稱作「候選者清單」)且在此清單中選擇該等候選運動向量中之一者以表示視訊資料之當前區塊之運動向量預測子(MVP)。視訊寫碼器接著可判定選定候選運動向量是否已被按比例調整。在判定出此選定候選運動向量已被按比例調整後,視訊寫碼器即接著可判定選定候選運動向量之水平分量及/或垂直分量是否分別包括於水平分量值之指定範圍及/或垂直分量值之指定範圍內。此等指定範圍可有效地表示可被稱作水平位移限制及/或垂直位移限制之限制。若不包括於水平分量值之指定範圍及/或垂直分量值之指定範圍內, 則視訊寫碼器接著可截割該等值,使得水平分量值及/或垂直分量值包括於水平分量值之指定範圍及/或垂直分量值之指定範圍內。
以此方式,該等技術可修改可被稱作運動向量預測子候選者截割程序之程序的候選者清單產生程序。舉例而言,視訊寫碼器可截割候選運動向量之垂直分量以使其保持於運動向量範圍之界限內。相似地,視訊寫碼器可截割候選運動向量之水平分量以使其保持於運動向量範圍之界限內。另外,視訊寫碼器可按比例調整運動向量以使其保持於運動向量範圍之界限內。此等技術可應用於中間候選運動向量中之一些或全部,或僅應用於當前視訊區塊之最終選定運動向量預測子。
換言之,當候選者清單之候選運動向量指向位於運動向量位移限制之外的預測區塊時,視訊寫碼器(其亦可被稱作「視訊寫碼器件」)可截割或以其他方式截斷候選運動向量之值。視訊寫碼器接著可基於候選者清單之選定經截割候選運動向量來寫碼當前視訊區塊。
藉由在某些例子中限制或以其他方式限定選定候選運動向量之水平分量值及/或垂直分量值之範圍(諸如,當按比例調整此選定候選運動向量時),該等技術可確保水平運動向量及/或垂直運動向量無需特定數目個以上位元來表達其帶正負號整數值。換言之,通常使用16個位元來表達運動向量之分量值,其為帶正負號整數值。因此,當定義運動向量時,視訊解碼器分配每運動向量分量16個位元。 當視訊解碼器設計係以硬體進行實施時,允許運動向量超過16個位元可顯著地使視訊解碼器設計變複雜,此係因為需要提供額外實體記憶體來儲存彼等運動向量分量,從而需要16個以上位元進行表達。
另外,藉由在某些例子中將運動向量分量之範圍限定為在指定範圍內,該等技術可增進記憶體頻寬之較有效率利用。為了進行說明,倘若視訊資料之圖框之視訊寫碼通常以光柵掃描次序(其讀取次序通常為自頂至底、自左至右)而進行,則限制運動向量之垂直分量可限定運動向量所參考之參考圖框之視訊資料中有多少量需要載入至晶片上記憶體中。在光柵掃描視訊寫碼中,較小運動向量垂直分量可被視為用以限定視訊寫碼器之硬體實施中所需要之晶片上記憶體之量的有效方式。過大運動向量垂直分量可引起如下例子:多個區塊各自參考同一參考圖框之完全不同部分,該等區塊因而要求視訊解碼器在晶片外記憶體與晶片上記憶體之間頻繁地交換該參考圖框之此等不同部分。藉由在某些例子中限定運動向量分量之範圍,該等技術可增進記憶體頻寬之較有效率利用。
圖1為說明實例視訊編碼及解碼系統10之方塊圖,視訊編碼及解碼系統10可經組態以利用本發明所描述的用於在執行運動向量預測程序時限定候選運動向量之範圍之技術。如圖1之實例所示,系統10包括產生經編碼視訊以供目的地器件14解碼之來源器件12。來源器件12可經由通信頻道16而將經編碼視訊傳輸至目的地器件14或可將經編碼 視訊儲存於儲存媒體34或檔案伺服器36上,使得在需要時經編碼視訊可由目的地器件14存取。來源器件12及目的地器件14可包含各種各樣之器件中任一者,包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板電腦、機上盒、電話手機(包括蜂巢式電話或手機及所謂智慧型手機)、電視、相機、顯示器件、數位媒體播放器、視訊遊戲主控台或其類似者。
在許多狀況下,此等器件可經裝備用於無線通信。因此,通信頻道16可包含無線頻道。或者,通信頻道16可包含有線頻道、無線頻道及有線頻道之組合或任何其他類型之通信頻道,或適合於傳輸經編碼視訊資料之通信頻道(諸如,射頻(RF)頻譜或一或多個實體傳輸線)之組合。在一些實例中,通信頻道16可形成以封包為基礎之網路(諸如,區域網路(LAN)、廣域網路(WAN),或諸如網際網路之全域網路)之部分。因此,通信頻道16通常表示用於將視訊資料自來源器件12傳輸至目的地器件14之任何合適通信媒體或不同通信媒體之集體,包括有線媒體或無線媒體之任何合適組合。通信頻道16可包括路由器、交換器、基地台,或可有用於促進自來源器件12至目的地器件14之通信之任何其他設備。
如圖1之實例進一步所示,來源器件12包括視訊來源18、視訊編碼器20、調變器/解調變器22(「數據機22」)及傳輸器24。在來源器件12中,視訊來源18可包括諸如視訊俘獲器件之來源。作為實例,視訊俘獲器件可包括以下各 者中之一或多者:視訊攝影機、含有經先前俘獲視訊之視訊存檔庫、用以自視訊內容提供者接收視訊之視訊饋送介面,及/或用於產生電腦圖形資料作為來源視訊之電腦圖形系統。作為一實例,若視訊來源18為視訊攝影機,則來源器件12及目的地器件14可形成所謂攝影機電話或視訊電話。然而,本發明所描述之技術不限於無線應用或設定,且可應用於包括視訊編碼及/或解碼能力之非無線器件。因此,來源器件12及目的地器件14僅僅為可支援本文所描述之技術之寫碼器件的實例。
視訊編碼器20可編碼經俘獲、經預俘獲或經電腦產生視訊。一旦此經編碼視訊被編碼,視訊編碼器20就可將此經編碼視訊輸出至數據機22。數據機22接著可根據諸如無線通信協定之通信標準來調變經編碼視訊,隨之傳輸器24可將經調變之經編碼視訊資料傳輸至目的地器件14。數據機22可包括經設計用於信號調變之各種混頻器、濾波器、放大器或其他組件。傳輸器24可包括經設計用於傳輸資料之電路,包括放大器、濾波器及一或多個天線。
由視訊編碼器20編碼之經俘獲、經預俘獲或經電腦產生視訊亦可儲存至儲存媒體34或檔案伺服器36上以供稍後擷取、解碼及消費。儲存媒體34可包括藍光光碟、DVD、CD-ROM、快閃記憶體,或用於儲存經編碼視訊之任何其他合適數位儲存媒體。目的地器件14可存取儲存於儲存媒體34或檔案伺服器36上之經編碼視訊、解碼此經編碼視訊以產生經解碼視訊,且播放此經解碼視訊。
檔案伺服器36可為能夠儲存經編碼視訊且將彼經編碼視訊傳輸至目的地器件14的任何類型之伺服器。實例檔案伺服器包括網頁伺服器(例如,用於網站)、FTP伺服器、網路附接式儲存(NAS)器件、本端磁碟機,或能夠儲存經編碼視訊資料且將其傳輸至目的地器件的任何其他類型之器件。來自檔案伺服器36之經編碼視訊資料之傳輸可為串流化傳輸、下載傳輸,或此兩者之組合。目的地器件14可根據包括網際網路連接之任何標準資料連接來存取檔案伺服器36。此連接可包括無線頻道(例如,Wi-Fi連接或無線蜂巢式資料連接)、有線連接(例如,DSL、電纜數據機,等等)、有線頻道及無線頻道兩者之組合,或適合於存取儲存於檔案伺服器上之經編碼視訊資料的任何其他類型之通信頻道。
在圖1之實例中,目的地器件14包括接收器26、數據機28、視訊解碼器30及顯示器件32。目的地器件14之接收器26經由頻道16而接收資訊,且數據機28解調變該資訊以產生用於視訊解碼器30之經解調變位元串流。經由頻道16而傳達之資訊可包括由視訊編碼器20產生以供視訊解碼器30用於解碼關聯經編碼視訊資料之多種語法資訊。此語法亦可與儲存於儲存媒體34或檔案伺服器36上之經編碼視訊資料一起被包括。視訊編碼器20及視訊解碼器30中每一者可形成能夠編碼或解碼視訊資料之各別編碼器-解碼器(CODEC)之部分。
目的地器件14之顯示器件32表示能夠呈現視訊資料以供 檢視者消費的任何類型之顯示器。儘管顯示器件32被展示為與目的地器件14整合,但顯示器件32可與目的地器件14整合或在目的地器件14外部。在一些實例中,目的地器件14可包括整合式顯示器件且亦經組態以與外部顯示器件建立介面連接。在其他實例中,目的地器件14可為顯示器件。一般而言,顯示器件32向使用者顯示經解碼視訊資料,且可包含多種顯示器件中任一者,諸如,液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
本發明通常可指代將語法資訊「用信號發送」至諸如視訊解碼器30之另一器件之視訊編碼器20。然而,應理解,視訊編碼器20可藉由使語法元素與視訊資料之各種經編碼部分相關聯而用信號發送資訊。亦即,視訊編碼器20可藉由將某些語法元素儲存至視訊資料之各種經編碼部分之標頭而「用信號發送」資料。在一些狀況下,此等語法元素可在由視訊解碼器30接收及解碼之前被編碼及儲存(例如,儲存至儲存媒體34或檔案伺服器36)。因此,術語「用信號發送」通常可指代用以解碼經壓縮視訊資料之語法或其他資料之通信,而無論此通信即時地或近即時地發生抑或遍及一時間跨度而發生,諸如,可能在編碼時間將語法元素儲存至媒體時發生,該等語法元素接著可在儲存至此媒體之後由解碼器件在任何時間擷取。
視訊編碼器20及視訊解碼器30可根據諸如目前在開發中之高效率視訊寫碼(HEVC)標準的視訊壓縮標準而操作, 且可遵照HEVC測試模型(HM)。或者,視訊編碼器20及視訊解碼器30可根據諸如ITU-T H.264標準(或者被稱作MPEG-4第10部分(進階視訊寫碼(AVC)))之其他專屬或工業標準或此等標準之延伸而操作。然而,本發明之技術不限於任何特定寫碼標準。其他實例包括MPEG-2及ITU-T H.263。
HM將視訊資料之區塊稱作寫碼單元(CU)。一般而言,CU具有與根據H.264而寫碼之巨集區塊相似的目的,惟CU不具有與H.264之巨集區塊相關聯的大小差別除外。因此,可將一CU分裂成若干子CU。一般而言,本發明中對CU之參考可指代圖像之最大寫碼單元(LCU)或LCU之子CU。舉例而言,一位元串流內之語法資料可定義LCU,LCU在像素之數目方面為最大寫碼單元。可將一LCU分裂成若干子CU,且可將每一子CU分裂成若干子CU。用於一位元串流之語法資料可定義一LCU可被分裂之最大次數,其被稱為最大CU深度。因此,一位元串流亦可定義最小寫碼單元(SCU)。
LCU可與階層式四元樹資料結構相關聯。一般而言,四元樹資料結構包括每CU一個節點,其中根節點對應於LCU。若將一CU分裂成四個子CU,則對應於該CU之節點包括用於對應於該等子CU之四個節點中每一者之參考。四元樹資料結構之每一節點可提供用於對應CU之語法資料。舉例而言,四元樹中之節點可包括分裂旗標,其指示對應於該節點之CU是否被分裂成若干子CU。用於一CU之 語法元素可被遞歸地定義,且可取決於該CU是否被分裂成若干子CU。
未被分裂之CU可包括一或多個預測單元(PU)。一般而言,PU表示對應CU之全部或部分,且包括用於擷取用於PU之參考樣本之資料。舉例而言,當對PU進行框內模式編碼時,PU可包括描述用於PU之框內預測模式之資料。作為另一實例,當對PU進行框間模式編碼時,PU可包括定義用於PU之一或多個運動向量之資料。運動向量通常識別一或多個參考圖框中之同置型CU,其中術語「參考圖框」指代時間上出現於PU被定位之圖框之前或之後的圖框。舉例而言,定義PU的用於CU之資料亦可描述將CU分割成一或多個PU。在CU被未寫碼、被框內預測模式編碼抑或被框間預測模式編碼之間,分割模式可不同。
舉例而言,定義運動向量之資料可描述運動向量之水平分量、運動向量之垂直分量、用於運動向量之解析度(例如,四分之一像素精度或八分之一像素精度)、運動向量所指向之參考圖框、識別經識別參考圖框在當前圖框之前抑或之後的預測方向,及/或用於運動向量之參考清單(例如,清單0或清單1)。或者,定義運動向量之資料可在被稱作運動向量預測子(MVP)之預測子方面描述運動向量。運動向量預測子可包括相鄰PU或時間上同置型PU之運動向量。通常,以已定義方式形成五個候選運動向量之清單(諸如,自具有最大振幅之候選運動向量開始至具有最小振幅之候選運動向量(亦即,待寫碼之當前PU與參考PU之 間的最大或最小位移)而列出候選運動向量,或基於位置(亦即,上方區塊、左側區塊、隅角區塊、時間區塊)而列出候選運動向量),其中五個候選運動向量中之四者為選自四個相鄰PU之空間運動向量且第五候選運動向量為選自參考圖框中之時間上同置型PU之時間上同置型運動向量。
雖然時間候選運動向量通常與當前圖框中之當前部分之運動向量同置於參考圖框之同一部分中,但該等技術應不嚴格地限於同置型時間候選運動向量。取而代之,該等技術可關於任何時間候選運動向量予以實施,而無論該時間候選運動向量是否為同置型。在一些例子中,視訊編碼器可識別未與當前圖框之當前區塊或部分同置之時間候選運動向量,且在執行運動向量預測程序時使用此時間候選運動向量。通常,視訊編碼器可用信號發送出已使用非同置型時間候選運動向量,或在一些例子中,給定上下文可指示出已使用非同置型時間候選運動向量(在此狀況下,視訊編碼器可不用信號發送出是否已選擇非同置型時間候選運動向量作為MVP)。
在形成五個候選運動向量之清單之後,視訊編碼器20可存取該等候選運動向量中每一者以判定哪一候選運動向量提供最好地匹配於經選擇用於編碼視訊之給定速率及失真設定檔的最好速率及失真特性。視訊編碼器20可關於五個候選運動向量中每一者而執行速率-失真最佳化(RDO)程序,從而選擇該等候選運動向量中具有最好RDO結果之候選運動向量作為MVP。或者,視訊編碼器20可選擇儲存至 清單之五個候選運動向量中最好地近似針對當前PU而判定之運動向量的候選運動向量作為MVP。
在任何情況下,視訊編碼器20可使用包含以下各者之資料來指定運動向量:識別五個候選運動向量之清單中該等候選運動向量中之選定者的索引、該運動向量所指向之一或多個參考圖框(常常呈清單形式),及識別預測為單向抑或雙向之預測方向。或者,定義運動向量之資料可僅指定五個候選運動向量之清單中選定候選運動向量之索引而不指定參考圖框及預測方向,此情形向視訊解碼器用信號發送出該等候選運動向量中之選定者待全面地用於當前PU。
除了具有定義一或多個運動向量之一或多個PU以外,CU亦可包括一或多個變換單元(TU)。在使用PU之預測之後,視訊編碼器可演算CU之對應於PU之部分的殘餘值,其中此殘餘值亦可被稱作殘餘資料。可變換、量化及掃描殘餘值。TU未必限於PU之大小。因此,TU可大於或小於用於同一CU之對應PU。在一些實例中,TU之最大大小可為對應CU之大小。本發明亦使用術語「區塊」以指代CU、PU及/或TU中任一者或其組合。
一般而言,經編碼視訊資料可包括預測資料及殘餘資料。視訊編碼器20可在框內預測模式或框間預測模式期間產生預測資料。框內預測通常涉及相對於一圖像之相鄰之經先前寫碼區塊中的參考樣本來預測該同一圖像之一區塊中的像素值。框間預測通常涉及相對於經先前寫碼圖像之資料來預測一圖像之區塊中的像素值。
在框內預測或框間預測之後,視訊編碼器20可演算區塊之殘餘像素值。殘餘值通常對應於區塊之預測像素值資料與區塊之真實像素值資料之間的差。舉例而言,殘餘值可包括指示經寫碼像素與預測性像素之間的差之像素差值。在一些實例中,經寫碼像素可與待寫碼之像素區塊相關聯,且預測性像素可與用以預測經寫碼區塊之一或多個像素區塊相關聯。
為了進一步壓縮一區塊之殘餘值,可將該殘餘值變換成一變換係數集合,該等變換係數將儘可能多之資料(亦被稱為「能量」)壓緊成儘可能少之係數。變換技術可包含離散餘弦變換(DCT)程序或概念上相似程序、整數變換、小波變換,或其他類型之變換。變換將像素之殘餘值自空間域轉換至變換域。變換係數對應於大小通常與原始區塊相同之二維係數矩陣。換言之,僅僅存在與原始區塊中之像素一樣多的變換係數。然而,歸因於變換,變換係數中之許多者可具有等於零之值。
視訊編碼器20接著可量化變換係數以進一步壓縮視訊資料。量化通常涉及將在相對大範圍內之值映射至在相對小範圍內之值,因此縮減表示經量化變換係數所需要之資料之量。更具體而言,可根據量化參數(QP)來應用量化,QP可在LCU層級予以定義。因此,同一層級之量化可應用於與LCU內之CU之不同PU相關聯的TU中之所有變換係數。然而,不是用信號發送QP自身,而是可對LCU用信號發送QP之改變(亦即,差量)。差量QP定義LCU之量化參數相對 於某參考QP(諸如,經先前傳達LCU之QP)的改變。
在量化之後,視訊編碼器20可掃描變換係數,從而自包括經量化變換係數之二維矩陣產生一維向量。視訊編碼器20接著可執行統計無損編碼(其通常係由誤稱「熵編碼」指代)以編碼所得陣列以甚至進一步壓縮資料。一般而言,熵寫碼包含集體地壓縮經量化變換係數序列及/或其他語法資訊之一或多個程序。舉例而言,諸如差量QP、預測向量、寫碼模式、濾波器、偏移或其他資訊之語法元素亦可包括於經熵寫碼位元串流中。接著(例如)經由內容自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)或任何其他統計無損寫碼程序而對經掃描係數連同任何語法資訊進行熵寫碼。
如上文所指出,定義用於PU之運動向量之資料可採取數個形式。視訊編碼器20可實施運動向量可被表達之不同方式以壓縮運動向量資料。視訊編碼器20可實施被稱作「合併模式」之模式以將運動向量表達為將候選運動向量識別為儲存至以已定義方式而建構之候選運動向量之清單的索引。在實施此合併模式之反模式時,視訊解碼器30接收此索引、根據已定義方式來重新建構五個候選運動向量之清單,且選擇該清單中之五個候選運動向量中由該索引指示之候選運動向量作為經解碼之視訊資料之當前區塊的MVP。視訊解碼器30接著將候選運動向量中之選定者具現化為關聯PU之MVP,該PU之解析度與候選運動向量之選定者之解析度相同且該PU指向候選運動向量中之選定者所 指向之同一參考圖框。在實施合併模式時,視訊編碼器20可無需在導出運動向量所必要之完全程度上執行運動估計、無需指定運動向量之水平分量及垂直分量、無需指定運動向量解析度、無需指定運動向量方向(意謂:運動向量指向時間上在當前圖框之前抑或之後的圖框)或無需指定參考圖框索引,藉此潛在地縮減判定運動向量所需要之處理器循環且壓縮運動向量資料。
視訊編碼器20亦可實施自適應性運動向量預測(AMVP)模式,相似於合併模式,AMVP模式包括將運動向量表達為將候選運動向量中之一者識別為MVP的索引。然而,與合併模式相反,視訊編碼器20亦可指定預測方向及參考圖框,從而有效地更動候選運動向量之選定者之此等部分。在實施AMVP模式時,視訊編碼器20可無需在導出運動向量所必要之完全程度上執行運動估計、無需指定運動向量之水平分量及垂直分量且無需指定運動向量解析度,藉此潛在地縮減判定運動向量所需要之處理器循環且壓縮運動向量資料。
通常,前導子視訊寫碼標準至當前所提議標準(HEVC)定義各種極限以約束運動向量垂直分量及水平分量之大小。如上文所指出,此等極限可被定義為將垂直位移及/或水平位移限定至最大值及最小值之範圍。在HEVC中,首先基於此等運動向量分量範圍(通常被表示為「mvrange」)在前導子視訊寫碼標準(諸如,H.264)中之使用來提議及採納此等範圍。然而,新近,關於水平位移及 /或垂直位移之此等範圍自HEVC被刪掉,以便使運動向量能夠指代參考圖框之大體上任何部分。HEVC中亦定義具有長度各自為16個位元之分量值的運動向量,該等分量值通常提供足夠位元以表達針對參考圖框之幾乎任何部分的大運動向量分量值。藉由使運動向量能夠指代參考圖框之大體上任何部分,視訊編碼器可針對參考圖框之引起最小量之殘餘資料的部分而執行較澈底搜尋(此情形為表明視訊資料之當前區塊之較有效率壓縮的另一方式)。
然而,在某些情況下,限制運動向量之範圍可有益。舉例而言,當執行以上運動向量預測程序中之一者(例如,合併模式或AMVP模式)時,運動向量候選者中之一或多者可在添加至候選者清單之前被按比例調整。此經按比例調整運動向量分量接著可超過通常針對每一運動向量分量而定義之16位元長度。當此等經按比例調整運動向量大於16位元長度時,視訊編碼器20可判定出合併模式不可用,或換言之,不能執行合併模式。當執行AMVP模式時可出現此同一問題,此係因為當執行AMVP時可按比例調整運動向量中之一或多者。限制合併模式及AMVP模式中任一者或此兩者之使用可引起壓縮低效率。
根據本發明所描述之技術,視訊編碼器20可針對視訊資料之當前區塊而判定複數個候選運動向量以便執行運動向量預測程序。亦即,視訊編碼器20可識別視訊資料之當前區塊之一或多個相鄰區塊(其中此等相鄰區塊亦可被稱作「視訊資料之候選區塊」或「候選視訊區塊」)。視訊編 碼器20可識別一或多個(且通常為四個)空間相鄰區塊及一或多個(且通常為單一)時間相鄰區塊。下文關於圖6來詳細地展示此等空間相鄰區塊及時間相鄰區塊相對於當前區塊之位置。在識別此等相鄰區塊之後,視訊編碼器20接著可判定與此等相鄰區塊中每一者相關聯之運動向量,其中該等運動向量可表示用於運動向量預測程序之候選運動向量。
在某些例子中,在判定此等運動向量後,視訊編碼器20即可按比例調整針對視訊資料之當前區塊而判定之複數個候選運動向量中之一或多者以產生一或多個經按比例調整候選運動向量。為了進行說明,當執行運動向量預測程序之合併模式時,視訊編碼器20可判定與時間相鄰區塊相關聯之運動向量,其中此時間相鄰區塊指代與視訊資料之當前區塊同置於參考圖框之同一位置中的視訊資料區塊。此參考圖框可與圖像次序計數相關聯,圖像次序計數指代指派至視訊資料之每一圖框之號碼,該號碼識別該圖框相對於其他圖框被顯示的次序。通常,視訊編碼器20可基於視訊資料之同置型區塊所駐存的參考圖框與視訊資料之當前區塊所駐存的當前圖框之間的圖像次序計數之差來按比例調整時間候選運動向量。
作為另一實例,當執行運動向量預測程序之進階運動向量預測(AMVP)模式時,視訊編碼器20可同樣地基於視訊資料之同置型區塊所駐存的參考圖框與視訊資料之當前區塊所駐存的當前圖框之間的圖像次序計數之差來按比例調 整時間候選運動向量。然而,如上文所指出,運動向量預測程序之AMVP模式准許有效地更動候選運動向量之各種態樣。結果,在運動向量預測程序之AMVP模式中,視訊編碼器20可更動與空間候選運動向量相關聯之參考圖框,此情形可引起基於指定(或更動)參考圖框與視訊資料之當前區塊所駐存的當前圖框之間的圖像次序計數之差來按比例調整空間候選運動向量。因此,視訊編碼器20可在執行運動向量預測程序之AMVP模式時按比例調整時間候選運動向量及空間候選運動向量兩者。
視訊編碼器20接著可在選擇複數個候選運動向量中之一者作為當前區塊之MVP之前將經按比例調整候選運動向量中之一或多者之範圍限定為在指定範圍內。換言之,視訊編碼器20可在選擇候選運動向量中之一者作為當前區塊之MVP之前將經按比例調整候選運動向量修改為在指定範圍內。當在選擇候選運動向量中之一者作為當前區塊之MVP之前修改經按比例調整候選運動向量中之一或多者時,視訊編碼器20可修改經按比例調整候選運動向量中每一者以確保此等經按比例調整候選運動向量限定至指定範圍(其亦可被稱作「位移極限」)。作為一實例,指定範圍以四分之一像素單位被指定為[-32768,32767]。
在選擇候選運動向量中之一者作為當前區塊之MVP(且潛在地修改候選運動向量中之選定者)之後,視訊編碼器20接著可使用MVP來編碼視訊資料之當前區塊。亦即,視訊編碼器20可使用MVP以識別參考圖框中之參考區塊且產 生視訊資料之殘餘區塊作為當前區塊與參考區塊之間的差。視訊編碼器20接著可執行上文所指出之變換操作以將視訊資料之此殘餘區塊自空間域變換至頻率域,從而產生變換係數之區塊。視訊編碼器20接下來可量化變換係數、對經量化變換係數進行延行長度編碼,且對經延行長度編碼之經量化變換係數進行熵編碼(其為指代統計無損寫碼之另一方式)。視訊編碼器20可在具有關聯語法元素之位元串流中輸出此經寫碼視訊資料。
視訊解碼器30可接收此位元串流且根據語法元素來解碼該位元串流。視訊解碼器30通常可執行與上文關於視訊編碼器20所描述之操作互逆的操作。亦即,視訊解碼器30可對經編碼視訊資料之每一區塊進行熵解碼、執行反量化以解量化經編碼視訊資料之區塊,且應用反變換以將經編碼視訊資料之經解量化區塊自頻率域變換至空間域。經編碼視訊資料之此經變換區塊可表示殘餘資料之經重新建構版本。視訊解碼器30可自與經編碼視訊資料之當前區塊(其在此例子中可指代殘餘資料之經重新建構版本)相關聯的語法元素判定出將使用運動向量預測程序而導出用於此當前區塊之運動向量。
假定視訊解碼器30判定出將使用運動向量預測程序而導出用於此當前區塊之運動向量,則視訊解碼器30通常接著可執行與上文關於視訊編碼器20所描述之操作相同的操作以導出經編碼視訊資料之當前區塊之運動向量預測子。因此,視訊解碼器30可針對視訊資料之當前區塊而判定複數 個候選運動向量以便執行運動向量預測程序。亦即,視訊解碼器30可識別視訊資料之當前區塊之一或多個相鄰區塊。視訊解碼器30可識別一或多個空間相鄰區塊及一或多個時間相鄰區塊。再次,下文關於圖6來詳細地展示此等空間相鄰區塊及時間相鄰區塊相對於當前區塊之位置。在識別此等相鄰區塊之後,視訊解碼器30接著可判定與此等相鄰區塊中每一者相關聯之運動向量,其中該等運動向量可表示用於運動向量預測程序之候選運動向量。
在上文關於視訊編碼器20所描述之例子中,在判定此等運動向量後,視訊解碼器30即可按比例調整針對視訊資料之當前區塊而判定之複數個候選運動向量中之一或多者以產生一或多個經按比例調整候選運動向量。視訊解碼器30接著可在選擇複數個候選運動向量中之一者作為當前區塊之MVP之前將經按比例調整候選運動向量中之一或多者之範圍限定為在指定範圍內。換言之,視訊解碼器30可在選擇候選運動向量中之一者作為當前區塊之MVP之前將經按比例調整候選運動向量修改為在指定範圍內。當在選擇候選運動向量中之一者作為當前區塊之MVP之前修改經按比例調整候選運動向量中之一或多者時,視訊解碼器30可修改經按比例調整候選運動向量中每一者以確保此等經按比例調整候選運動向量限定至指定範圍(其亦可被稱作「位移極限」)。以此方式,視訊解碼器30可將經按比例調整候選運動向量修改為在指定範圍內。
視訊解碼器30可基於與視訊資料之當前區塊相關聯的一 或多個語法元素(諸如,運動向量預測子索引(「mvp_idx」)語法元素)(其先前在位元串流中由視訊編碼器20指定)來判定將選擇候選運動向量中之哪一者。在使用(例如)此mvp_idx語法元素的情況下,視訊解碼器30可選擇候選運動向量中之一者。視訊解碼器30接著可使用候選運動向量來重新建構視訊資料之當前區塊以識別視訊資料之參考區塊,視訊解碼器30接著將該參考區塊添加至殘餘資料以重新建構視訊資料之當前區塊。視訊解碼器30接著儲存視訊資料之此經重新建構區塊。
以此方式,本發明所描述之技術通常可使視訊寫碼器(例如,視訊編碼器20及視訊解碼器30中任一者或此兩者)能夠修改已被按比例調整之彼等候選運動向量。亦即,該等技術可使此等視訊寫碼器能夠僅修改運動向量預測程序之待按比例調整之彼等候選運動向量,而不修改或以其他方式甚至進一步考慮該等候選運動向量中尚未被按比例調整之候選運動向量。在此方面,該等技術可在修改候選運動向量之全部與不修改候選運動向量中任一者之間提供折衷,使得僅考慮已被按比例調整之彼等候選運動向量以供修改。
關於本發明之實例而描述的用於限定運動向量分量位移之技術可應用於視訊寫碼以支援多種多媒體應用中任一者,諸如,空中電視廣播、有線電視傳輸、衛星電視傳輸、串流化視訊傳輸(例如,經由網際網路)、對數位視訊之編碼以供儲存於資料儲存媒體上、儲存於資料儲存媒體 上之數位視訊之解碼,或其他應用。在一些實例中,系統10可經組態以支援用於諸如視訊串流化、視訊播放、視訊廣播及/或視訊電話之應用之單向或雙向視訊傳輸。
儘管圖1中未圖示,但在一些態樣中,視訊編碼器20及視訊解碼器30可各自與一音訊編碼器及解碼器整合,且可包括適當MUX-DEMUX單元或其他硬體及軟體以處置共同資料串流或分離資料串流中之音訊及視訊兩者之編碼。在適用時,在一些實例中,MUX-DEMUX單元可遵照ITU H.223多工器協定,或諸如使用者資料報協定(UDP)之其他協定。
視訊編碼器20及視訊解碼器30可各自實施為多種合適編碼器電路中任一者,諸如,一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術係部分地以軟體予以實施時,一器件可將用於該軟體之指令儲存於合適的非暫時性電腦可讀媒體中,且使用一或多個處理器而以硬體來執行該等指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中每一者可包括於一或多個編碼器或解碼器中,該一或多個編碼器或解碼器中任一者可整合為各別器件中之組合式編碼器/解碼器(CODEC)之部分。
圖2為說明視訊編碼器20之實例之方塊圖,視訊編碼器20可實施用於指定運動向量預測子之技術。視訊編碼器20可執行視訊圖框內之區塊(包括巨集區塊,或巨集區塊之 分割區或子分割區)之框內寫碼及框間寫碼。框內寫碼依賴於空間預測以縮減或移除給定視訊圖框內的視訊之空間冗餘。框間寫碼依賴於時間預測以縮減或移除視訊序列之鄰近圖框內的視訊之時間冗餘。框內模式(I模式)可指代若干以空間為基礎之壓縮模式中任一者,且諸如單向預測(P模式)或雙向預測(B模式)之框間模式可指代若干以時間為基礎之壓縮模式中任一者。儘管圖2中描繪用於框間模式編碼之組件,但應理解,視訊編碼器20可進一步包括用於框內模式編碼之組件。然而,出於簡潔及清楚起見而未說明此等組件。
如圖2所示,視訊編碼器20接收待編碼之視訊圖框內之當前視訊區塊。在圖2之實例中,視訊編碼器20包括運動補償單元44、運動估計單元42、記憶體64、求和器50、變換單元52、量化單元54及熵編碼單元56。對於視訊區塊重新建構,視訊編碼器20亦包括反量化單元58、反變換單元60及求和器62。亦可包括解區塊濾波器(圖2中未圖示)以濾波區塊邊界以自經重新建構視訊移除方塊效應假影。必要時,解區塊濾波器通常將濾波求和器62之輸出。雖然被描述為包括通常指代隨機存取記憶體(RAM)、動態RAM(DRAM)、靜態RAM(SRAM)、快閃記憶體或其他持續或非持續之以晶片為基礎之儲存媒體的記憶體64,但可利用任何類型之非暫時性電腦可讀媒體,包括硬碟機、光碟機、磁碟機及其類似者。
在編碼程序期間,視訊編碼器20接收待寫碼之視訊圖框 或切片。可將該圖框或切片劃分成多個視訊區塊。運動估計單元42及運動補償單元44相對於一或多個參考圖框中之一或多個區塊來執行經接收視訊區塊之框間預測性寫碼以提供時間壓縮。框內預測單元46亦可相對於與待寫碼之區塊在同一圖框或切片中之一或多個相鄰區塊來執行經接收視訊區塊之框內預測性寫碼以提供空間壓縮。
如圖2之實例進一步所示,視訊編碼器20亦包括模式選擇單元40。模式選擇單元40可(例如)基於誤差結果來選擇寫碼模式(框內模式或框間模式)中之一者,且將所得經框內寫碼區塊或經框間寫碼區塊提供至求和器50以產生殘餘區塊資料且提供至求和器62以重新建構經編碼區塊以用作參考圖框。
運動估計單元42及運動補償單元44可高度地整合,但出於概念目的而被分離地說明。運動估計為產生運動向量之程序,該等運動向量估計視訊區塊之運動。舉例而言,運動向量可指示預測性參考圖框(或其他經寫碼單元)內之預測性區塊相對於當前圖框(或其他經寫碼單元)內經寫碼之當前區塊的位移。預測性區塊為被發現在像素差方面緊密地匹配於待寫碼之區塊的區塊,該像素差可由絕對差總和(SAD)、平方差總和(SSD)或其他差量度判定。運動向量亦可指示巨集區塊之分割區之位移。運動補償可涉及基於由運動估計判定之運動向量來獲取或產生預測性區塊。再次,在一些實例中,運動估計單元42及運動補償單元44可功能上整合。
運動估計單元42藉由比較經框間寫碼圖框之視訊區塊與記憶體64中之參考圖框之視訊區塊來演算經框間寫碼圖框之視訊區塊之運動向量。運動補償單元44亦可內插參考圖框(例如,I圖框或P圖框)之次整數像素。新興HEVC標準(及ITU H.264標準)藉由通常被稱作「清單」之一或多個清單資料結構來儲存參考圖框。因此,儲存於記憶體64中之資料亦可被視為清單。運動估計單元42比較來自記憶體64之一或多個參考圖框(或清單)之區塊與當前圖框(例如,P圖框或B圖框)之待編碼區塊。當記憶體64中之參考圖框包括次整數像素之值時,由運動估計單元42演算之運動向量可指代參考圖框之次整數像素位置。運動估計單元42將經演算運動向量發送至熵編碼單元56及運動補償單元44。由運動向量識別之參考圖框區塊(其可包含CU)可被稱作預測性區塊。運動補償單元44演算參考圖框之預測性區塊之誤差值。
運動補償單元44可基於預測性區塊來演算預測資料。視訊編碼器20藉由自經寫碼之原始視訊區塊減去來自運動補償單元44之預測資料而形成殘餘視訊區塊。求和器50表示執行此減法運算之組件。變換單元52將諸如離散餘弦變換(DCT)或概念上相似變換之變換應用於殘餘區塊,從而產生包含殘餘變換係數值之視訊區塊。變換單元52可執行其他變換,諸如,由H.264標準定義之變換,該等變換概念上相似於DCT。亦可使用小波變換、整數變換、次頻帶變換,或其他類型之變換。在任何狀況下,變換單元52將變 換應用於殘餘區塊,從而產生殘餘變換係數之區塊。該變換可將殘餘資訊自像素值域轉換至諸如頻率域之變換域。量化單元54量化殘餘變換係數以進一步縮減位元率。量化程序可縮減與該等係數中之一些或全部相關聯之位元深度。可藉由調整量化參數來修改量化程度。
在量化之後,熵編碼單元56對經量化變換係數進行熵寫碼。舉例而言,熵編碼單元56可執行內容自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)或另一熵寫碼技術。在由熵編碼單元56進行之熵寫碼之後,可將經編碼視訊傳輸至另一器件或對經編碼視訊進行存檔以供稍後傳輸或擷取。在上下文自適應性二進位算術寫碼之狀況下,上下文可基於相鄰巨集區塊。
在一些狀況下,除了熵寫碼以外,視訊編碼器20之熵編碼單元56或另一單元亦可經組態以執行其他寫碼功能。舉例而言,熵編碼單元56可經組態以判定巨集區塊及分割區之CBP值。又,在一些狀況下,熵編碼單元56可執行巨集區塊或其分割區中之係數之延行長度寫碼。詳言之,熵編碼單元56可應用鋸齒狀掃描或其他掃描型樣以掃描巨集區塊或分割區中之變換係數且編碼為零之延行以供進一步壓縮。熵編碼單元56亦可用適當語法元素來建構標頭資訊以供經編碼視訊位元串流中之傳輸。
反量化單元58及反變換單元60分別應用反量化及反變換以在像素域中重新建構殘餘區塊(例如)以供稍後用作參考區塊。運動補償單元44可藉由將殘餘區塊添加至記憶體64 中之參考圖框儲存區之圖框中之一者的預測性區塊來演算參考區塊。運動補償單元44亦可將一或多個內插濾波器應用於經重新建構殘餘區塊以演算次整數像素值以用於運動估計。求和器62將經重新建構殘餘區塊添加至由運動補償單元44產生之經運動補償預測區塊,以產生經重新建構視訊區塊以供儲存於記憶體64之參考圖框儲存區中。經重新建構視訊區塊可由運動估計單元42及運動補償單元44用作參考區塊以對後續視訊圖框中之區塊進行框間寫碼。
如上文所指出,在一些例子中,運動估計單元42可不演算運動向量,而是判定候選運動向量之清單(例如,所謂「候選者清單」),該等候選運動向量中之四者為空間候選運動向量且該等候選運動向量中之一者為時間候選運動向量。通常,運動估計單元42放棄運動向量演算,以便縮減運動估計之計算複雜性且藉此改良視訊資料可被編碼之速度,同時亦縮減功率消耗。
根據本發明所描述之技術,運動估計單元42可針對視訊資料之當前區塊而判定複數個候選運動向量以便執行運動向量預測程序,且按比例調整針對視訊資料之當前區塊而判定之複數個候選運動向量中之一或多者以產生一或多個經按比例調整候選運動向量。如上文所指出,此按比例調整程序可基於參考圖框之圖像次序計數與當前圖框之圖像次序計數之間的差。更具體而言,當自指向不同參考圖像或圖框之候選運動向量導出運動向量預測子時,運動估計單元42可判定所謂距離按比例調整因子(其在HEVC中可被 表示為「DistScaleFactor」變數)。
在此運動向量按比例調整程序中,運動估計單元42可計算DistScaleFactor,DistScaleFactor可由以下方程式(1)定義:DistScaleFactor=(POCcurr-POCref)/(POCmvp_blk-POCmvp_blk_ref)=tb/td。(1)
在方程式(1)中,POC指代圖像次序計數,其中POCcurr表示當前圖像或圖框之圖像次序計數,POCref指代參考圖框或圖像之圖像次序計數,POCmvp_blk表示具有候選運動向量中之選定者(或換言之,MVP)之候選或相鄰區塊所駐存的圖框或圖像之圖像次序計數,且POCmvp_blk_ref表示MVP所指向之參考區塊所駐存的圖像或圖框之圖像次序計數。因此,方程式(1)中之變數「td」表示區塊MVP_BLK與其參考區塊之間的圖像次序計數差(或換言之,距離),而方程式(1)中之變數「tb」表示當前區塊與其參考區塊之間的POC距離。
運動估計單元42可根據以下方程式(2)來進一步計算被表示為「tx」之按比例調整因子:tx=(16384+Abs(td/2))/td (2)
運動估計單元42接著可根據以下方程式(3)來計算DistScaleFactor:DistScaleFactor=Clip3(-4096,4095,(tbtx+32)>>6) (3)
因此,DistanceScaleFactor可依據tb及tx予以計算,但經截割為在-4096及4095之指定範圍內。在使用此DistScaleFactor的情況下,運動估計單元42可根據以下方 程式(4)來按比例調整候選運動向量中之一或多者:ScaledMV=sign(DistScaleFactor×MV)×((abs(DistScaeFactor×MV)+127))>>8) (4)
在方程式(4)中,ScaledMV表示經按比例調整候選運動向量,「sign」指代保持正負號之函數,「abs」指代計算值之絕對值之函數,且「>>」表示按位元右移。
如上文所指出,基於POC距離之ScaledMV可超過指定範圍(其可被稱作「運動向量範圍」,或者「範圍」),該指定範圍可根據視訊編碼設定檔或層級予以定義。結果,運動估計單元42可執行本發明所描述之技術以將經按比例調整候選運動向量修改為在指定範圍內。此外,運動估計單元42可修改經按比例調整候選運動向量而不修改尚未被按比例調整之其他候選運動向量中任一者。
運動估計單元42可以數個方式修改經按比例調整候選運動向量。舉例而言,運動估計單元42可截割經按比例調整候選運動向量之垂直分量以使其保持於運動向量範圍之界限內。換言之,運動估計單元42可有效地將垂直運動向量值限於最大/最小垂直運動向量分量範圍。
作為另一實例,運動估計單元42可按比例調整經按比例調整候選運動向量以使其保持於運動向量範圍之界限內。為了進行說明,對於具有水平分量(mv_x)及超過垂直運動向量極限之指定範圍之垂直分量(mv_y)的給定經按比例調整運動向量,運動估計單元42可將y分量限於mv_y',mv_y'對應於垂直MV極限。運動估計單元42亦可根據以下 方程式(5)來按比例調整水平分量mv_x:mv_x'=mv_xmv_y'/mv_y (5)
在方程式(5)中,mv_x'表示經按比例調整候選運動向量之經按比例調整水平分量。運動估計單元42可使用除法運算之近似而以各種精度層級來執行被表達為方程式(5)之此按比例調整運算,以產生潛在地具有經修改水平分量mv_x'及經修改垂直分量mv_y'兩者的經修改之經按比例調整運動向量。
儘管上文關於供修改經按比例調整運動向量中之一或多者的數個不同方式進行描述,但當執行運動向量預測程序時可以任何數目個方式執行該等技術以修改候選運動向量。舉例而言,運動估計單元42可在選擇複數個候選運動向量中之一者作為視訊資料之當前區塊之運動向量預測子之前截割經按比例調整候選運動向量。
作為又一實例,運動估計單元42可將經按比例調整候選運動向量之垂直分量截割為在垂直指定範圍內且將經按比例調整候選運動向量之水平分量截割為在水平指定範圍內。在此等例子中,截割運算可遵照以下方程式(6):mvLXA=Clip3(-32768,32767,Sign2(distScaleFactormvLXA)((Abs(distScaleFactormvLXA)+127)>>8)) (6)
在方程式(6)中,截割方程式包括在上文被展示為方程式(4)之按比例調整方程式,從而將經按比例調整運動向量之水平分量及垂直分量中之一者或此兩者截割至-32768至32767之指定範圍。經按比例調整運動向量在方程式(6)中 被表示為「mvLXA」。換言之,指定範圍可以四分之一像素單位被指定為[-32768,32767],其中在一些例子中,此指定範圍可在視訊解碼器及視訊編碼器中之一或多者中被固定及硬寫碼。
在一些例子中,如上文所指出,指定範圍可指定包括垂直位移極限之運動向量位移極限,其中運動估計單元42可截割經按比例調整候選運動向量之垂直分量而使得經按比例調整候選運動向量之垂直分量在垂直位移極限內。
在一些例子中,運動估計單元42不是截割水平分量及垂直分量兩者,而是可僅截割經按比例調整候選運動向量之水平分量。再次,指定範圍可指定包括水平位移極限之運動向量位移極限,且運動估計單元42可截割經按比例調整候選運動向量之水平分量而使得經按比例調整候選運動向量之水平分量在水平位移極限內。如上文所指出,運動估計單元42可截割水平分量或垂直分量中之一者,且接著按比例調整另一未經截割分量(其可為垂直分量且應不限於以上實例),使得經按比例調整候選運動向量由一或多個運動向量位移極限定界。因此,該等技術應不限於上文所描述之實例修改中任一者。
為了選擇候選運動向量中之一者作為運動向量預測子,運動補償單元44接著可針對包括於清單中之每一候選運動向量而識別一參考圖框區塊(其再次可被稱作預測區塊)。運動補償單元44接著可基於針對候選運動向量中每一者而判定之預測性區塊來演算預測資料。視訊編碼器20接著可 判定針對候選運動向量中之對應者而計算之每一預測資料的殘餘資料、變換殘餘資料、量化經轉碼殘餘資料,且接著以上文所描述之方式對經量化殘餘資料進行熵編碼。視訊編碼器20接著可執行反操作以解碼關於在剪除之後剩餘之候選運動向量之教示而產生的此經熵編碼殘餘資料,以再生呈經重新建構視訊區塊之形式的參考資料。模式選擇單元40可分析關於候選運動向量中每一者而產生之經重新建構視訊區塊中每一者以選擇候選運動向量中之一者。模式選擇單元40可經由通常被稱作「速率-失真最佳化」(其通常被縮寫為「RDO」)之程序而選擇候選運動向量中提供最好速率對失真比率之候選運動向量。
RDO通常涉及比較經壓縮以達成某一速率(其通常指代包括經壓縮圖框、切片或區塊之經壓縮視訊資料可被發送的位元率)之經重新建構圖框、切片或區塊與原始圖框、切片或區塊,及在給定速率下判定原始圖框、切片或區塊與經重新建構圖框、切片或區塊之間的失真量。模式選擇單元40可使用達成或試圖達成給定速率之多個不同量度來編碼相同視訊資料,從而關於此等各種量度來執行失真最佳化程序。在此例子中,模式選擇單元40可比較每一經重新建構視訊區塊之RD輸出且選擇在目標速率下提供最小失真之經重新建構視訊區塊。
模式選擇單元40接著可向運動估計單元42指示此選擇,運動估計單元42著手與熵編碼單元56建立介面連接以向熵編碼單元56通知該選擇。通常,運動估計單元42與熵編碼 單元56建立介面連接以指示出運動向量預測連同識別選定候選運動向量之索引被執行。如上文所指出,運動估計單元42可以已定義方式(諸如,藉由最高振幅至最低振幅或最低振幅至最高振幅,或以任何其他已定義方式)配置候選運動向量。或者,運動估計單元42亦可向熵編碼單元56用信號發送候選運動向量配置於此候選者清單中的方式。熵編碼單元56接著可編碼此索引連同可為指示出運動向量預測程序經執行以編碼運動資料所必要之任何其他資訊。熵編碼單元56可在一位元串流中輸出經編碼索引作為語法元素(其可被表示為「mvp_idx」),該位元串流可以上文關於圖1之實例而描述之方式予以儲存或傳輸。以此方式,視訊編碼器20可選擇複數個候選運動向量中之一者作為視訊資料之當前區塊之運動向量預測子且基於運動向量預測子來寫碼視訊資料之當前區塊。
在一些例子中,熵編碼單元56執行被稱作上下文自適應性二進位算術寫碼(CABAC)之熵寫碼的形式。在執行CABAC時,熵編碼單元56可選擇複數個所謂上下文(其為針對不同上下文而指定以便較有效率地壓縮與對應上下文相關聯之視訊資料之不同碼表)中之一者且根據針對選定上下文而定義之碼表來編碼經壓縮殘餘資料。熵編碼單元56可基於上下文資訊來選擇上下文中之一者,上下文資訊可包括在執行運動向量預測時判定之參考索引、獨特運動向量候選者之數目,及在執行運動向量預測時判定之預測方向。
圖3為說明視訊解碼器30之實例之方塊圖,視訊解碼器30解碼經編碼視訊序列。在圖3之實例中,視訊解碼器30包括熵解碼單元70、運動補償單元72、框內預測單元74、反量化單元76、反變換單元78、記憶體82及求和器80。在一些實例中,視訊解碼器30可執行與關於視訊編碼器(諸如,圖1及圖2之實例所示之視訊編碼器20)而描述之編碼遍次大體上互逆的解碼遍次。儘管大體上互逆,但在一些例子中,視訊解碼器30可執行與由視訊編碼器20執行之技術相似的技術。換言之,視訊解碼器30可執行與由視訊編碼器20執行之程序實質上相似的程序。此外,如上文所描述,視訊編碼器20可在執行視訊編碼之程序中執行視訊解碼。為了進行說明,視訊編碼器20之反量化單元58、反變換單元60及求和器62可執行與視訊解碼器30之反量化單元76、反變換單元78及求和器80之操作實質上相似的操作。
如圖3之實例所示,熵解碼單元70接收經編碼位元串流,出於說明之目的,經編碼位元串流被假定為包括識別選定候選運動向量(其中,再次,此等候選運動向量可被稱作候選運動向量或候選運動向量預測子(「候選MVP」))之一元或截斷式一元經寫碼索引。在執行與視訊編碼器20之熵編碼單元56之程序大體上互逆的程序時,熵解碼單元70可接收用於當前PU之語法元素或其他寫碼資料,其指示出運動向量預測程序經執行以判定當前PU之運動向量。回應於此語法元素或其他寫碼資料,熵解碼單元70剖析來自位元串流之運動向量預測子索引(mvp_idx),從而將此運 動向量預測子索引提供至運動補償單元72。熵解碼單元70亦解碼與此運動向量預測子索引相關聯的視訊資料之經編碼區塊,從而將視訊資料之此經編碼區塊提供至反量化單元76。
運動補償單元72擷取鄰近於當前PU之PU之空間候選運動向量及參考圖框中之同置型PU之時間候選運動向量。熵解碼單元70亦可向運動補償單元72提供針對當前PU而識別之參考圖框(通常作為位元串流中之另一語法元素)。或者,運動補償單元72可關於AMVP或合併模式予以組態以自以設定方式(例如,自當前PU所處之當前圖框向後或向前的一個、兩個或任何其他數目)而識別之參考圖框擷取時間候選運動向量。
運動補償單元72接著可建構包括四個空間候選運動向量及時間候選運動向量之候選者清單。在產生此候選者清單時,運動補償單元72可按比例調整針對視訊資料之當前區塊而判定之複數個候選運動向量中之一或多者以產生一或多個經按比例調整候選運動向量。如上文所指出,此按比例調整程序可基於參考圖框之圖像次序計數與當前圖框之圖像次序計數之間的差。此外,基於POC距離之經按比例調整運動向量可超過指定範圍(其可被稱作「運動向量範圍」),該指定範圍可根據視訊編碼設定檔或層級予以定義。結果,運動補償單元72可執行本發明所描述之技術以將經按比例調整候選運動向量修改為在指定範圍內。此外,運動補償單元72可修改經按比例調整候選運動向量而 不修改尚未被按比例調整之其他候選運動向量中任一者。
運動補償單元72可以上文關於圖1、圖2之實例所示的視訊編碼器20之運動估計單元42而描述的任何數目個方式修改經按比例調整候選運動向量。舉例而言,運動補償單元72可截割經按比例調整候選運動向量之垂直分量以使其保持於運動向量範圍之界限內。換言之,運動補償單元72可有效地將垂直運動向量值限於最大/最小垂直運動向量分量範圍。運動補償單元72亦可截割經按比例調整候選運動向量之水平分量以使其保持於運動向量範圍之界限內。換言之,運動補償單元72可有效地將水平運動向量值限於最大/最小水平運動向量分量範圍。
作為另一實例,運動補償單元72可按比例調整經按比例調整候選運動向量以使其保持於運動向量範圍之界限內。為了進行說明,對於具有水平分量(mv_x)及超過垂直運動向量極限之指定範圍之垂直分量(mv_y)的給定經按比例調整運動向量,運動補償單元72可將y分量限於mv_y',mv_y'對應於垂直MV極限。
在任何情況下,在形成此候選者清單之後,運動補償單元72接著自由運動向量預測子索引識別之候選者清單選擇候選運動向量中之一者。對於經框間寫碼區塊,運動補償單元72接著可基於經識別運動向量來產生框間預測資料。運動補償單元72可使用此運動向量以識別儲存至記憶體82之參考圖框中之預測區塊。對於經框內寫碼區塊,框內預測單元74可使用在位元串流中接收之框內預測模式以由空 間鄰近區塊形成預測區塊。反量化單元76反量化(亦即,解量化)提供於位元串流中且由熵解碼單元70解碼之經量化區塊係數。反量化程序可包括習知程序,例如,如由H.264解碼標準定義。反量化程序亦可包括使用由求和器50針對每一巨集區塊而演算之量化參數QPY以判定量化程度,且同樣地判定應被應用之反量化程度。
反變換單元60將反變換(例如,反DCT、反整數變換,或概念上相似反變換程序)應用於變換係數,以便在像素域中產生殘餘區塊。運動補償單元72產生經運動補償區塊,從而可能地基於內插濾波器來執行內插。待用於具有子像素精度之運動估計之內插濾波器的識別符可包括於語法元素中。運動補償單元72可使用如在視訊區塊之編碼期間由視訊編碼器20使用之內插濾波器以演算參考區塊之次整數像素之內插值。運動補償單元72可根據經接收語法資訊以判定由視訊編碼器20使用之內插濾波器,且使用該等內插濾波器以產生預測性區塊。
運動補償單元72使用語法資訊中之一些以判定用以編碼經編碼視訊序列之圖框之CU的大小、描述經編碼視訊序列之圖框之每一CU如何被分割的分割資訊、指示每一CU如何被編碼之模式、用於每一經框間編碼CU之一或多個參考圖框(或清單),及用以解碼經編碼視訊序列之其他資訊。
求和器80對殘餘區塊與由運動補償單元72或框內預測單元產生之對應預測區塊進行求和以形成經解碼區塊。必要 時,亦可應用解區塊濾波器以濾波經解碼區塊,以便移除方塊效應假影。接著將經解碼視訊區塊儲存於記憶體82中之參考圖框儲存區中,參考圖框儲存區在HEVC標準中可被稱作經解碼圖像緩衝區,其提供參考區塊以供後續運動補償且亦產生經解碼視訊以供呈現於顯示器件(諸如,圖1之顯示器件32)上。
在一些例子中,時間候選運動向量可能不可用,諸如,當指定時間候選運動向量之切片丟失(亦即,作為一實例,在經編碼位元串流中未被恢復或接收)時。當此時間候選運動向量不可用時,運動補償單元72可將此時間候選運動向量設定至預設值或以其他方式判定此時間候選運動向量之預設運動向量資訊。在一些例子中,可取決於參考圖框是否被框內寫碼來重新建構時間候選運動向量之此預設運動向量資訊。當參考圖框經判定為被框內寫碼時,運動補償單元72可基於針對與當前圖框中之當前部分同置於參考圖框之同一位置中的參考圖框之部分而判定的空間運動向量來導出預設候選運動向量之預設運動向量資訊。同樣地,時間預測空間候選運動向量中之一或多者可能不可用或丟失,且可基於針對與當前圖框中之當前部分同型於參考圖框之同一位置中的參考圖框之部分而判定的空間運動向量來導出預設候選運動向量之預設運動向量資訊。
如上文所指出,存在兩種類型之運動向量預測:合併模式,及AMVP。對於合併模式,運動補償單元72在判定預設運動資訊時判定運動向量振幅、預測方向及參考索引。 對於AMVP,運動補償單元72判定運動向量振幅,但無需判定預測方向及參考索引,此係因為在用於當前PU之位元串流中分離地用信號發送預測方向及參考索引。因此,運動補償單元72可使預設運動資訊之判定基於為了執行運動向量預測而用信號發送之模式,亦即,對於當前PU,用信號發送之運動向量預測之類型為合併模式抑或AMVP。
圖4為說明在執行本發明所描述之運動向量預測技術之態樣時視訊寫碼器(諸如,圖2之實例所示之視訊編碼器20,及/或圖3之實例所示之視訊解碼器30)之例示性操作的流程圖。最初,首先參考視訊編碼器20,如上文所描述,運動估計單元42可針對對應於當前CU之當前PU而判定空間候選運動向量(90)。再次,如上文所描述,運動估計單元42接下來可自參考圖框中之同置型PU針對當前PU而判定時間候選運動向量(92)。在判定空間候選運動向量及時間候選運動向量中任一者或此兩者時,運動估計單元42可以上文所描述之方式按比例調整該等候選運動向量中之一或多者(94)。另外,運動估計單元42可修改經按比例調整運動向量中之一或多者,如上文所描述(95)。
在修改一或多個經按比例調整運動向量之後,運動估計單元42可形成空間候選運動向量及時間候選運動向量之候選者清單且選擇該等候選運動向量中之一者作為當前PU之MVP(96、98)。如上文所指出,此選擇可涉及視訊編碼器20執行RDO分析,其中接著使用候選運動向量中之選定者以按上文所描述之方式寫碼視訊資料之區塊。熵編碼單元 56可將候選運動向量中之選定者指定為位元串流中之運動向量預測子索引(mvp_idx),藉此使視訊解碼器能夠識別候選運動向量中之選定者。
關於視訊解碼器30,運動補償單元72可執行與上文關於運動估計單元42而描述之操作相似的操作。亦即,如上文所描述,運動補償單元72可針對對應於當前CU之當前PU而判定空間候選運動向量(90)。再次,如上文所描述,運動補償單元72接下來可自參考圖框中之同置型PU針對當前PU而判定時間候選運動向量(92)。在判定空間候選運動向量及時間候選運動向量中任一者或此兩者時,運動補償單元72可以上文所描述之方式按比例調整該等候選運動向量中之一或多者(94)。另外,運動補償單元72可將經按比例調整運動向量中之一或多者修改為在指定範圍內,如上文所描述(95)。
在修改一或多個經按比例調整運動向量之後,運動補償單元72可形成空間候選運動向量及時間候選運動向量之候選者清單且選擇該等候選運動向量中之一者作為當前PU之MVP(96、98)。熵解碼單元70可剖析來自位元串流之運動向量預測子索引(mvp_idx)且將此運動向量預測子索引提供至運動補償單元72以用於選擇候選運動向量中之一者作為當前PU之MVP。
圖5為說明在執行本發明所描述之運動向量預測技術之其他態樣時視訊寫碼器(諸如,圖2之實例所示之視訊編碼器20,及/或圖3之實例所示之視訊解碼器30)之例示性操作 的流程圖。最初,首先參考視訊編碼器20,如上文所描述,運動估計單元42可針對對應於當前CU之當前PU而判定空間候選運動向量(100)。再次,如上文所描述,運動估計單元42接下來可自參考圖框中之同置型PU針對當前PU而判定時間候選運動向量(102)。在判定空間候選運動向量及時間候選運動向量中任一者或此兩者時,運動估計單元42可以上文所描述之方式按比例調整該等候選運動向量中之一或多者(104)。
接下來,運動估計單元42可形成空間候選運動向量及時間候選運動向量之候選者清單且選擇該等候選運動向量中之一者作為當前PU之MVP(106、108)。如上文所指出,此選擇可涉及視訊編碼器20執行RDO分析,其中接著使用候選運動向量中之選定者以按上文所描述之方式寫碼視訊資料之區塊。在執行此RDO分析之前,運動估計單元42可首先判定候選運動向量中之選定者是否已被按比例調整(109)。若未被按比例調整(「否」109),則運動估計單元42在考慮候選運動向量之當前者時可不執行任何額外操作。然而,若被按比例調整(「是」109),則運動估計單元42可以上文所描述之方式將候選運動向量中之選定者修改為在指定範圍內(110)。如上文所指出,熵編碼單元56可將候選運動向量中之選定者指定為位元串流中之運動向量預測子索引(mvp_idx),藉此使視訊解碼器能夠識別候選運動向量中之選定者。
關於視訊解碼器30,如上文所描述,運動補償單元72可 針對對應於當前CU之當前PU而判定空間候選運動向量(100)。再次,如上文所描述,運動補償單元72接下來可自參考圖框中之同置型PU針對當前PU而判定時間候選運動向量(102)。在判定空間候選運動向量及時間候選運動向量中任一者或此兩者時,運動補償單元72可以上文所描述之方式按比例調整該等候選運動向量中之一或多者(104)。
接下來,運動補償單元72可形成空間候選運動向量及時間候選運動向量之候選者清單且選擇該等候選運動向量中之一者作為當前PU之MVP(106、108)。為了選擇候選運動向量中之一者,熵解碼單元70可剖析來自位元串流之運動向量預測子索引(mvp_idx)且將此運動向量預測子索引提供至運動補償單元72以用於選擇候選運動向量中之一者作為當前PU之MVP。運動補償單元72接著可判定候選運動向量中之選定者是否已被按比例調整(109)。若未被按比例調整(「否」109),則運動補償單元72在考慮候選運動向量之當前者時可不執行任何額外操作。然而,若被按比例調整(「是」109),則運動補償單元72可以上文所描述之方式修改候選運動向量中之選定者(110)。
圖6為說明空間相鄰區塊及時間相鄰區塊之概念圖,運動向量預測子候選者係自空間相鄰區塊及時間相鄰區塊被產生以用於運動向量預測模式。在當前HEVC測試模型(HM)中,支援兩種運動向量預測模式:合併模式,及自適應性運動向量預測(AMVP)模式。在任一模式中,視訊編碼器20及視訊解碼器30中每一者產生供針對當前視訊區塊 或PU 112而判定運動向量之同一運動向量預測子候選者清單。在合併模式及AMVP模式中,運動向量預測子候選者可包括當前PU 112之空間相鄰區塊(例如,圖6所說明之相鄰區塊A、B、C、D及E)之運動向量。運動向量預測子候選者亦可包括當前PU 112之同置型區塊114之時間相鄰區塊(例如,圖4所說明之相鄰區塊T1及T2)的運動向量。在一些狀況下,運動向量預測子候選者可包括相鄰區塊中之兩者或兩者以上之組合,例如,兩個或兩個以上運動向量之平均值、中值或加權平均值。
在AMVP模式之狀況下,可產生運動向量預測子候選者清單以包括空間相鄰區塊或時間相鄰區塊之運動向量。視訊編碼器20接著自候選者清單選擇當前PU 112之最準確運動向量預測子候選者。在一實例中,視訊編碼器20可選擇自相鄰區塊中之一者之運動向量產生的運動向量預測子候選者作為當前PU 112之運動向量預測子。在另一實例中,視訊編碼器20可選擇自相鄰區塊中之兩者或兩者以上之運動向量產生的運動向量預測子候選者作為當前PU 112之運動向量預測子。在此狀況下,可將運動向量預測子演算為兩個或兩個以上運動向量之平均值、中值或加權平均值。視訊編碼器20接著判定當前PU 112之運動向量預測子與運動向量之間的運動向量差。視訊編碼器20接著向視訊解碼器30用信號發送當前PU 112之運動向量差及運動向量預測子索引。
視訊解碼器30接收表示經編碼視訊區塊之位元串流,其 包括視訊區塊之運動向量差及運動向量預測子索引。為了解碼視訊區塊,視訊解碼器30以與視訊編碼器20之方式相同的方式產生運動向量預測子候選者清單。視訊解碼器30藉由將當前PU 112的用信號發送之運動向量預測子索引應用於候選者清單來選擇當前PU 112之運動向量預測子。視訊解碼器30接著組合用信號發送之運動向量差與選定運動向量預測子以重新建構當前PU 112之運動向量。視訊解碼器30使用當前PU 112之運動向量來定位參考圖像中之預測性區塊以重新建構經編碼視訊區塊。
在合併模式之狀況下,可產生運動向量預測子候選者清單以包括空間相鄰區塊或時間相鄰區塊中每一者之所有運動資訊,其包括運動向量、參考圖像索引及預測方向。視訊編碼器20接著自候選者清單中之相鄰區塊選擇當前PU 112之最準確運動資訊。代替向視訊解碼器30用信號發送當前PU 112之運動向量差、參考圖像索引及預測方向,視訊編碼器20直接使用相鄰區塊之選定運動資訊作為當前PU 112之最終運動資訊。以此方式,視訊編碼器20向視訊解碼器30僅用信號發送用以指示相鄰區塊之索引,當前PU 112之所有運動資訊應自該相鄰區塊被導出。
視訊解碼器30接收表示經編碼視訊區塊之位元串流,其包括視訊區塊之索引值。為了解碼視訊區塊,視訊解碼器30以與視訊編碼器20之方式相同的方式產生運動向量預測子候選者清單。視訊解碼器30藉由將用信號發送之索引應用於候選者清單以選擇相鄰區塊之運動資訊來判定當前PU 112之所有運動資訊,其包括運動向量、參考圖像索引及預測方向。視訊解碼器30接著使用當前PU 112之運動向量來定位預測性區塊以重新建構經編碼視訊區塊。
在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合予以實施。若以軟體予以實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體進行傳輸。電腦可讀媒體可包括電腦資料儲存媒體或通信媒體兩者,通信媒體包括促進電腦程式自一處至另一處之傳送的任何媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取用於實施本發明所描述之技術之指令、程式碼及/或資料結構的任何可用媒體。作為實例而非限制,此等電腦可讀媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器件、磁碟儲存器件或其他磁性儲存器件、快閃記憶體,或可用以攜載或儲存呈指令或資料結構之形式之所要程式碼且可由電腦存取的任何其他媒體。又,將任何連接適當地稱為電腦可讀媒體。舉例而言,若使用同軸電纜、光纖纜線、雙絞線、數位用戶線(DSL)或諸如紅外線、無線電及微波之無線技術而自網站、伺服器或其他遠端來源傳輸軟體,則同軸電纜、光纖纜線、雙絞線、DSL或諸如紅外線、無線電及微波之無線技術包括於媒體之定義中。如本文所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟性磁碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟用雷射以光學方式再 生資料。以上各者之組合亦應包括於電腦可讀媒體之範疇內。
程式碼可由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效積體或離散邏輯電路之一或多個處理器執行。因此,如本文所使用,術語「處理器」可指代上述結構或適合於實施本文所描述之技術之任何其他結構中任一者。另外,在一些態樣中,可將本文所描述之功能性提供於經組態用於編碼及解碼之專用硬體及/或軟體模組內,或併入於組合式編碼解碼器中。又,該等技術可完全地實施於一或多個電路或邏輯元件中。
本發明之技術可實施於各種各樣之器件或裝置中,該等器件或裝置包括無線手機、積體電路(IC)或IC集合(例如,晶片集)。各種組件、模組或單元在本發明中被描述以強調經組態以執行所揭示技術之器件之功能態樣,但未必要求由不同硬體單元實現。實情為,如上文所描述,各種單元可組合於編碼解碼器硬體單元中,或由包括如上文所描述之一或多個處理器之互操作性硬體單元之集體結合合適軟體及/或韌體而提供。
已描述各種實例。此等及其他實例係在以下申請專利範圍之範疇內。
10‧‧‧視訊編碼及解碼系統
12‧‧‧來源器件
14‧‧‧目的地器件
16‧‧‧通信頻道
18‧‧‧視訊來源
20‧‧‧視訊編碼器
22‧‧‧調變器/解調變器/數據機
24‧‧‧傳輸器
26‧‧‧接收器
28‧‧‧數據機
30‧‧‧視訊解碼器
32‧‧‧顯示器件
34‧‧‧儲存媒體
36‧‧‧檔案伺服器
40‧‧‧模式選擇單元
42‧‧‧運動估計單元
44‧‧‧運動補償單元
46‧‧‧框內預測單元
50‧‧‧求和器
52‧‧‧變換單元
54‧‧‧量化單元
56‧‧‧熵編碼單元
58‧‧‧反量化單元
60‧‧‧反變換單元
62‧‧‧求和器
64‧‧‧記憶體
70‧‧‧熵解碼單元
72‧‧‧運動補償單元
74‧‧‧框內預測單元
76‧‧‧反量化單元
78‧‧‧反變換單元
80‧‧‧求和器
82‧‧‧記憶體
112‧‧‧當前預測單元
114‧‧‧同置型區塊
A‧‧‧相鄰區塊
B‧‧‧相鄰區塊
C‧‧‧相鄰區塊
D‧‧‧相鄰區塊
E‧‧‧相鄰區塊
T1‧‧‧相鄰區塊
T2‧‧‧相鄰區塊
圖1為說明一實例視訊編碼及解碼系統之方塊圖,該視訊編碼及解碼系統可經組態以利用本發明所描述的用於在 執行運動向量預測程序時限定候選運動向量之範圍之技術。
圖2為說明一視訊編碼器之實例之方塊圖,該視訊編碼器可實施本發明所描述的用於限定MVP之範圍之技術。
圖3為說明一視訊解碼器之實例之方塊圖,該視訊解碼器實施本發明所描述之運動向量預測技術。
圖4為說明在執行本發明所描述之運動向量預測技術之態樣時視訊寫碼器之例示性操作的流程圖。
圖5為說明在實施本發明所描述之運動向量預測技術之其他態樣時視訊寫碼器之例示性操作的流程圖。
圖6為說明當前預測性單元(PU)之近鄰PU及時間同置型PU之例示性配置的圖解。

Claims (49)

  1. 一種寫碼視訊資料之方法,該方法包含:針對該視訊資料之一當前區塊而判定複數個候選運動向量以便執行一運動向量預測程序;按比例調整針對該視訊資料之該當前區塊而判定之該複數個候選運動向量中之一或多者以產生一或多個經按比例調整候選運動向量;將該等經按比例調整候選運動向量修改為在一指定範圍內;選擇該複數個候選運動向量中之一者作為該視訊資料之該當前區塊之一運動向量預測子;及基於運動向量預測子來寫碼視訊資料之該當前區塊。
  2. 如請求項1之方法,其中修改該等經按比例調整候選運動向量包含修改該等經按比例調整候選運動向量而不修改尚未被按比例調整之該等其他候選運動向量中任一者。
  3. 如請求項1之方法,其中修改該等經按比例調整候選運動向量包含在選擇該複數個候選運動向量中之一者作為該視訊資料之該當前區塊之一運動向量預測子之前截割該等經按比例調整候選運動向量。
  4. 如請求項1之方法,其中該運動向量預測程序為一合併模式及一進階運動向量預測模式中之一者。
  5. 如請求項1之方法,其中該指定範圍係由一視訊寫碼設定檔或層級定義。
  6. 如請求項1之方法,其中該指定範圍在一視訊解碼器及一視訊編碼器中之一或多者中被固定及硬寫碼。
  7. 如請求項1之方法,其中該指定範圍以四分之一像素單位被指定為[-32768,32767]。
  8. 如請求項1之方法,其中修改該等經按比例調整運動向量包括:將該等經按比例調整候選運動向量之一垂直分量截割為在一垂直指定範圍內;及將該等經按比例調整候選運動向量之一水平分量截割為在一水平指定範圍內。
  9. 如請求項1之方法,其中該指定範圍指定包括一垂直位移極限之一運動向量位移極限,其中該等經按比例調整候選運動向量延伸超出該垂直位移極限,且其中修改該等經按比例調整候選運動向量進一步包含截割該等經按比例調整候選運動向量之一垂直分量而使得該等經按比例調整候選運動向量之該垂直分量在該垂直位移極限內。
  10. 如請求項1之方法,其中該指定範圍指定包括一水平位移極限之一運動向量位移極限,其中該等經按比例調整候選運動向量延伸超出該水平位移極限,且 其中修改該等經按比例調整候選運動向量進一步包含截割該等經按比例調整候選運動向量之一水平分量而使得該等經按比例調整候選運動向量之該水平分量在該水平位移極限內。
  11. 如請求項1之方法,其中修改該等經按比例調整候選運動向量包含按比例調整該等經按比例調整候選運動向量,使得該等經按比例調整候選運動向量由該一或多個運動向量位移極限定界。
  12. 如請求項1之方法,其進一步包含基於視訊資料之該當前區塊的該複數個候選運動向量中之該選定者來針對視訊資料之該當前區塊而判定一運動向量,其中該經判定運動向量識別視訊資料之一預測區塊,其中寫碼視訊資料之該當前區塊包含相對於視訊資料之該預測區塊來解碼視訊資料之該當前區塊。
  13. 如請求項1之方法,其進一步包含基於視訊資料之該當前區塊的該複數個候選運動向量中之該選定者來針對視訊資料之該當前區塊而判定一運動向量,其中該經判定運動向量識別視訊資料之一預測區塊,且其中寫碼視訊資料之該當前區塊包含相對於視訊資料之該預測區塊來編碼視訊資料之該當前區塊。
  14. 如請求項1之方法,其進一步包含:解碼一運動向量預測子索引以針對視訊資料之該當前區塊而識別該複數個候選運動向量中之該選定者以便執行該運動向量預測程序之一進階運動向量預測模式;及 解碼視訊資料之該當前區塊的該複數個候選運動向量中之該選定者與一運動向量之間的一運動向量差以針對視訊資料之該當前區塊而判定一運動向量,其中寫碼視訊資料之該當前區塊包含使用視訊資料之該當前區塊之該經判定運動向量來解碼視訊資料之該當前區塊。
  15. 如請求項1之方法,其進一步包含:解碼一索引以針對視訊資料之該當前區塊而識別該複數個候選運動向量中之該選定者以便執行該運動向量預測程序之一合併模式;及將視訊資料之該當前區塊之一運動向量判定為等效於該複數個候選運動向量中之該選定者,其中寫碼視訊資料之該當前區塊包含使用該視訊資料之該當前區塊之該經判定運動向量來解碼視訊資料之該當前區塊。
  16. 一種經組態以執行一運動向量預測程序以寫碼視訊資料之視訊寫碼器件,該視訊寫碼器件包含:一處理器,其經組態以針對該視訊資料之一當前區塊而判定複數個候選運動向量以便執行該運動向量預測程序、按比例調整針對該視訊資料之該當前區塊而判定之該複數個候選運動向量中之一或多者以產生一或多個經按比例調整候選運動向量、將該等經按比例調整候選運動向量修改為在一指定範圍內、選擇該複數個候選運動向量中之一者作為該視訊資料之該當前區塊之一運動向 量預測子,且基於運動向量預測子來寫碼視訊資料之該當前區塊。
  17. 如請求項16之視訊寫碼器件,其中該處理器經進一步組態以在修改該等經按比例調整候選運動向量時修改該等經按比例調整候選運動向量而不修改尚未被按比例調整之該等其他候選運動向量中任一者。
  18. 如請求項16之視訊寫碼器件,其中該處理器經進一步組態以在修改該等經按比例調整候選運動向量時在選擇該複數個候選運動向量中之一者作為該視訊資料之該當前區塊之一運動向量預測子之前截割該等經按比例調整候選運動向量。
  19. 如請求項16之視訊寫碼器件,其中該運動向量預測程序為一合併模式及一進階運動向量預測模式中之一者。
  20. 如請求項16之視訊寫碼器件,其中該指定範圍係由一視訊寫碼設定檔或層級定義。
  21. 如請求項16之視訊寫碼器件,其中該指定範圍在一視訊解碼器及一視訊編碼器中之一或多者中被固定及硬寫碼。
  22. 如請求項16之視訊寫碼器件,其中該指定範圍以四分之一像素單位被指定為[-32768,32767]。
  23. 如請求項16之視訊寫碼器件,其中該處理器經進一步組態以在修改該等經按比例調整運動向量時將該等經按比例調整候選運動向量之一垂直分量截割為在一垂直指定範圍內,且將該等經按比例調整候選運動向量之一水平 分量截割為在一水平指定範圍內。
  24. 如請求項16之視訊寫碼器件,其中該指定範圍指定包括一垂直位移極限之一運動向量位移極限,其中該等經按比例調整候選運動向量延伸超出該垂直位移極限,且其中該處理器經進一步組態以在修改該等經按比例調整候選運動向量時截割該等經按比例調整候選運動向量之一垂直分量而使得該等經按比例調整候選運動向量之該垂直分量在該垂直位移極限內。
  25. 如請求項16之視訊寫碼器件,其中該指定範圍指定包括一水平位移極限之一運動向量位移極限,其中該等經按比例調整候選運動向量延伸超出該水平位移極限,且其中該處理器經進一步組態以在修改該等經按比例調整候選運動向量時截割該等經按比例調整候選運動向量之一水平分量而使得該等經按比例調整候選運動向量之該水平分量在該水平位移極限內。
  26. 如請求項16之視訊寫碼器件,其中該處理器經進一步組態以在修改該等經按比例調整候選運動向量時按比例調整該等經按比例調整候選運動向量,使得該等經按比例調整候選運動向量由該一或多個運動向量位移極限定界。
  27. 如請求項16之視訊寫碼器件,其中該處理器經進一步組態以基於視訊資料之該當前區塊的該複數個候選運動向量中之該選定者來針對視訊資料之該當前區塊而判定一運動向量,其中該經判定運動向量識別視訊資料之一預測區塊,且其中該處理器經進一步組態以在寫碼視訊資料之該當前區塊時相對於視訊資料之該預測區塊來解碼視訊資料之該當前區塊。
  28. 如請求項16之視訊寫碼器件,其中該處理器經進一步組態以基於視訊資料之該當前區塊的該複數個候選運動向量中之該選定者來針對視訊資料之該當前區塊而判定一運動向量,其中該經判定運動向量識別視訊資料之一預測區塊,且其中該處理器經進一步組態以在寫碼視訊資料之該當前區塊時相對於視訊資料之該預測區塊來編碼視訊資料之該當前區塊。
  29. 如請求項16之視訊寫碼器件,其中該處理器經進一步組態以解碼一運動向量預測子索引以針對視訊資料之該當前區塊而識別該複數個候選運動向量中之該選定者以便執行該運動向量預測程序之一進階運動向量預測模式、解碼視訊資料之該當前區塊的該複數個候選運動向量中之該選定者與一運動向量之間的一運動向量差以針對視 訊資料之該當前區塊而判定一運動向量,且在寫碼視訊資料之該當前區塊時使用視訊資料之該當前區塊之該經判定運動向量來解碼視訊資料之該當前區塊。
  30. 如請求項16之視訊寫碼器件,其中該處理器經進一步組態以解碼一索引以針對視訊資料之該當前區塊而識別該複數個候選運動向量中之該選定者以便執行該運動向量預測程序之一合併模式、將視訊資料之該當前區塊之一運動向量判定為等效於該複數個候選運動向量中之該選定者,且在寫碼視訊資料之該當前區塊時使用該視訊資料之該當前區塊之該經判定運動向量來解碼視訊資料之該當前區塊。
  31. 一種經組態以執行一運動向量預測程序以寫碼視訊資料之視訊寫碼器件,該視訊寫碼器件包含:用於針對該視訊資料之一當前區塊而判定複數個候選運動向量以便執行該運動向量預測程序的構件;用於按比例調整針對該視訊資料之該當前區塊而判定之該複數個候選運動向量中之一或多者以產生一或多個經按比例調整候選運動向量的構件;用於將該等經按比例調整候選運動向量修改為在一指定範圍內的構件;用於選擇該複數個候選運動向量中之一者作為該視訊資料之該當前區塊之一運動向量預測子的構件;及用於基於運動向量預測子來寫碼視訊資料之該當前區塊的構件。
  32. 如請求項31之視訊寫碼器件,其中用於修改該等經按比例調整候選運動向量的該構件包含用於修改該等經按比例調整候選運動向量而不修改尚未被按比例調整之該等其他候選運動向量中任一者的構件。
  33. 如請求項31之視訊寫碼器件,其中用於修改該等經按比例調整候選運動向量的該構件包含用於在選擇該複數個候選運動向量中之一者作為該視訊資料之該當前區塊之一運動向量預測子之前截割該等經按比例調整候選運動向量的構件。
  34. 如請求項31之視訊寫碼器件,其中該指定範圍係由一視訊寫碼設定檔或層級定義。
  35. 如請求項31之視訊寫碼器件,其中該指定範圍在一視訊解碼器及一視訊編碼器中之一或多者中被固定及硬寫碼。
  36. 如請求項31之視訊寫碼器件,其中該指定範圍以四分之一像素單位被指定為[-32768,32767]。
  37. 如請求項31之視訊寫碼器件,其中用於修改該等經按比例調整運動向量的該構件包括:用於將該等經按比例調整候選運動向量之一垂直分量截割為在一垂直指定範圍內的構件;及用於將該等經按比例調整候選運動向量之一水平分量截割為在一水平指定範圍內的構件。
  38. 如請求項31之視訊寫碼器件,其中該指定範圍指定包括一垂直位移極限之一運動向 量位移極限,其中該等經按比例調整候選運動向量延伸超出該垂直位移極限,且其中用於修改該等經按比例調整候選運動向量的該構件進一步包含用於截割該等經按比例調整候選運動向量之一垂直分量而使得該等經按比例調整候選運動向量之該垂直分量在該垂直位移極限內的構件。
  39. 如請求項31之視訊寫碼器件,其中該指定範圍指定包括一水平位移極限之一運動向量位移極限,其中該等經按比例調整候選運動向量延伸超出該水平位移極限,且其中用於修改該等經按比例調整候選運動向量的該構件進一步包含用於截割該等經按比例調整候選運動向量之一水平分量而使得該等經按比例調整候選運動向量之該水平分量在該水平位移極限內的構件。
  40. 一種非暫時性電腦可讀儲存媒體,其具有儲存於其上之指令,該等指令在被執行時致使一或多個處理器:針對視訊資料之一當前區塊而判定複數個候選運動向量以便執行一運動向量預測程序;按比例調整針對該視訊資料之該當前區塊而判定之該複數個候選運動向量中之一或多者以產生一或多個經按比例調整候選運動向量;將該等經按比例調整候選運動向量修改為在一指定範 圍內;選擇該複數個候選運動向量中之一者作為該視訊資料之該當前區塊之一運動向量預測子;且基於運動向量預測子來寫碼視訊資料之該當前區塊。
  41. 如請求項40之非暫時性電腦可讀儲存媒體,其中該等指令在被執行時致使該一或多個處理器在修改該等經按比例調整候選運動向量時修改該等經按比例調整候選運動向量而不修改尚未被按比例調整之該等其他候選運動向量中任一者。
  42. 如請求項40之非暫時性電腦可讀儲存媒體,其中該等指令在被執行時致使該一或多個處理器在修改該等經按比例調整候選運動向量時在選擇該複數個候選運動向量中之一者作為該視訊資料之該當前區塊之一運動向量預測子之前截割該等經按比例調整候選運動向量。
  43. 如請求項40之非暫時性電腦可讀儲存媒體,其進一步具有儲存於其上之指令,該等指令在被執行時致使該一或多個處理器:選擇該複數個候選運動向量中之一者作為該視訊資料之該當前區塊之一運動向量預測子;且基於運動向量預測子來寫碼視訊資料之該當前區塊。
  44. 如請求項40之非暫時性電腦可讀儲存媒體,其中該指定範圍係由一視訊寫碼設定檔或層級定義。
  45. 如請求項40之非暫時性電腦可讀儲存媒體,其中該指定範圍在一視訊解碼器及一視訊編碼器中之一或多者中被 固定及硬寫碼。
  46. 如請求項40之非暫時性電腦可讀儲存媒體,其中該指定範圍以四分之一像素單位被指定為[-32768,32767]。
  47. 如請求項40之非暫時性電腦可讀儲存媒體,其中該等指令在被執行時致使該一或多個處理器在修改該等經按比例調整運動向量時:將該等經按比例調整候選運動向量之一垂直分量截割為在一垂直指定範圍內;且將該等經按比例調整候選運動向量之一水平分量截割為在一水平指定範圍內。
  48. 如請求項40之非暫時性電腦可讀儲存媒體,其中該指定範圍指定包括一垂直位移極限之一運動向量位移極限,其中該等經按比例調整候選運動向量延伸超出該垂直位移極限,且其中該等指令在被執行時致使該一或多個處理器在修改該等經按比例調整候選運動向量時截割該等經按比例調整候選運動向量之一垂直分量而使得該等經按比例調整候選運動向量之該垂直分量在該垂直位移極限內。
  49. 如請求項40之非暫時性電腦可讀儲存媒體,其中該指定範圍指定包括一水平位移極限之一運動向量位移極限,其中該等經按比例調整候選運動向量延伸超出該水平位移極限,且 其中該等指令在被執行時致使該一或多個處理器在修改該等經按比例調整候選運動向量時截割該等經按比例調整候選運動向量之一水平分量而使得該等經按比例調整候選運動向量之該水平分量在該水平位移極限內。
TW101149130A 2011-12-22 2012-12-21 執行視訊寫碼之運動向量預測 TWI535269B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161579465P 2011-12-22 2011-12-22
US201261584096P 2012-01-06 2012-01-06
US13/709,555 US9762904B2 (en) 2011-12-22 2012-12-10 Performing motion vector prediction for video coding

Publications (2)

Publication Number Publication Date
TW201334552A true TW201334552A (zh) 2013-08-16
TWI535269B TWI535269B (zh) 2016-05-21

Family

ID=48654534

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101149130A TWI535269B (zh) 2011-12-22 2012-12-21 執行視訊寫碼之運動向量預測

Country Status (18)

Country Link
US (1) US9762904B2 (zh)
EP (1) EP2795900A1 (zh)
JP (2) JP2015506606A (zh)
KR (1) KR102057350B1 (zh)
CN (1) CN104012096A (zh)
AU (1) AU2012355669B2 (zh)
BR (1) BR112014015056B1 (zh)
CA (1) CA2858979C (zh)
HK (1) HK1197330A1 (zh)
IL (1) IL232776A (zh)
IN (1) IN2014CN04420A (zh)
MY (1) MY167467A (zh)
PH (1) PH12014501244A1 (zh)
RU (1) RU2573227C1 (zh)
SG (2) SG11201402601SA (zh)
TW (1) TWI535269B (zh)
UA (1) UA114617C2 (zh)
WO (1) WO2013096018A1 (zh)

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011146451A1 (en) * 2010-05-20 2011-11-24 Thomson Licensing Methods and apparatus for adaptive motion vector candidate ordering for video encoding and decoding
WO2013032073A1 (ko) 2011-08-29 2013-03-07 주식회사 아이벡스피티홀딩스 Amvp 모드에서의 예측 블록 생성 방법
MX2013014733A (es) * 2011-12-16 2014-02-19 Panasonic Corp Metodo de codificacion de imagenes de video, dispositivo de codificacion de imagenes de video, metodo de decodificacion de imagenes de video, dispositivo de decodificacion de imagenes de video y dispositivo de codificacion/decodificacion de imagenes de video.
EP2806635A4 (en) * 2012-01-18 2015-12-02 Korea Electronics Telecomm METHOD AND DEVICE FOR ENCODING AND DECODING AN IMAGE
US20130235926A1 (en) * 2012-03-07 2013-09-12 Broadcom Corporation Memory efficient video parameter processing
KR101682999B1 (ko) * 2012-04-16 2016-12-20 노키아 테크놀로지스 오와이 비디오 코딩 및 디코딩을 위한 장치, 방법 및 컴퓨터 프로그램
US9313021B2 (en) * 2013-08-29 2016-04-12 National Chiao Tung University Secret communication method with self-authentication capability
AU2013403225B2 (en) 2013-10-14 2018-06-14 Microsoft Technology Licensing, Llc Features of base color index map mode for video and image coding and decoding
EP3058736B1 (en) 2013-10-14 2019-02-27 Microsoft Technology Licensing, LLC Encoder-side options for intra block copy prediction mode for video and image coding
BR112016007151A2 (pt) 2013-10-14 2017-09-12 Microsoft Tech Licensing recursos de modo de predição de cópia intrabloco para codificação e decodificação de vídeo e de imagem
WO2015056566A1 (ja) * 2013-10-15 2015-04-23 ソニー株式会社 画像処理装置および方法
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
WO2015100726A1 (en) 2014-01-03 2015-07-09 Microsoft Corporation Block vector prediction in video and image coding/decoding
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
EP3253059A1 (en) 2014-03-04 2017-12-06 Microsoft Technology Licensing, LLC Block flipping and skip mode in intra block copy prediction
CN105493505B (zh) 2014-06-19 2019-08-06 微软技术许可有限责任公司 统一的帧内块复制和帧间预测模式
US10856009B2 (en) 2014-09-04 2020-12-01 Mediatek Inc. Method of block vector clipping and coding for screen content coding and video coding
RU2679201C2 (ru) 2014-09-30 2019-02-06 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Правила для режимов внутрикадрового прогнозирования, когда активируется волновая параллельная обработка данных
US9992512B2 (en) * 2014-10-06 2018-06-05 Mediatek Inc. Method and apparatus for motion vector predictor derivation
CN106797475B (zh) * 2014-10-08 2019-12-10 联发科技股份有限公司 视频编码方法
US9591325B2 (en) 2015-01-27 2017-03-07 Microsoft Technology Licensing, Llc Special case handling for merged chroma blocks in intra block copy prediction mode
CN106664405B (zh) 2015-06-09 2020-06-09 微软技术许可有限责任公司 用调色板模式对经逸出编码的像素的稳健编码/解码
CN106331722B (zh) 2015-07-03 2019-04-26 华为技术有限公司 图像预测方法和相关设备
US10873760B2 (en) * 2017-04-07 2020-12-22 Futurewei Technologies, Inc. Motion vector (MV) constraints and transformation constraints in video coding
CA3063746A1 (en) * 2017-05-18 2018-11-22 Mediatek, Inc. Method and apparatus of motion vector constraint for video coding
EP3410717A1 (en) * 2017-05-31 2018-12-05 Thomson Licensing Methods and apparatus for candidate list pruning
US10785494B2 (en) * 2017-10-11 2020-09-22 Qualcomm Incorporated Low-complexity design for FRUC
WO2019077197A1 (en) * 2017-10-16 2019-04-25 Nokia Technologies Oy METHOD, APPARATUS AND COMPUTER PROGRAM PRODUCT FOR VIDEO ENCODING AND DECODING
JP6910461B2 (ja) * 2017-10-27 2021-07-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法及び復号方法
KR20200095463A (ko) * 2017-11-01 2020-08-10 브이아이디 스케일, 인크. 병합 모드를 위한 서브-블록 모션 도출 및 디코더측 모션 벡터 정교화
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
WO2019194513A1 (ko) * 2018-04-01 2019-10-10 엘지전자 주식회사 어파인 예측을 이용하여 비디오 신호를 처리하는 방법 및 장치
WO2019199141A1 (ko) * 2018-04-13 2019-10-17 엘지전자 주식회사 비디오 코딩 시스템에서 인터 예측 방법 및 장치
CN108401115A (zh) * 2018-04-28 2018-08-14 北京心领神绘科技有限公司 一种便携图像采集终端的自动修正采集装置及方法
US10873748B2 (en) * 2018-05-12 2020-12-22 Qualcomm Incorporated Storage of high precision motion vectors in video coding
WO2020003274A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Checking order of motion candidates in lut
EP4325861A3 (en) 2018-06-29 2024-03-06 Beijing Bytedance Network Technology Co., Ltd. Interaction between lut and amvp
GB2588006B (en) 2018-06-29 2023-03-22 Beijing Bytedance Network Tech Co Ltd Number of motion candidates in a look up table to be checked according to mode
CN110662054B (zh) 2018-06-29 2023-01-06 北京字节跳动网络技术有限公司 用于视频处理的方法、装置、计算机可读存储介质
WO2020003261A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Selection from multiple luts
KR20240007299A (ko) 2018-06-29 2024-01-16 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 룩업 테이블의 업데이트: fifo, 제약된 fifo
JP7460617B2 (ja) 2018-06-29 2024-04-02 北京字節跳動網絡技術有限公司 Lut更新条件
EP3791586A1 (en) 2018-06-29 2021-03-17 Beijing Bytedance Network Technology Co. Ltd. Concept of using one or multiple look up tables to store motion information of previously coded in order and use them to code following blocks
AU2019292471A1 (en) * 2018-06-30 2021-01-28 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Merge mode-based inter-prediction method and apparatus
WO2020008346A1 (en) 2018-07-02 2020-01-09 Beijing Bytedance Network Technology Co., Ltd. Rules on updating luts
WO2020055169A1 (ko) * 2018-09-11 2020-03-19 김기백 인터 예측을 이용한 영상 부호화/복호화 방법 및 장치
WO2020053798A1 (en) 2018-09-12 2020-03-19 Beijing Bytedance Network Technology Co., Ltd. Conditions for starting checking hmvp candidates depend on total number minus k
US11381807B2 (en) 2018-11-21 2022-07-05 Telefonaktiebolaget Lm Ericsson (Publ) Methods of video picture coding with sub-block merge simplification and related apparatuses
WO2020125755A1 (en) 2018-12-21 2020-06-25 Beijing Bytedance Network Technology Co., Ltd. Motion vector range based on motion vector precision
JP7275286B2 (ja) 2019-01-10 2023-05-17 北京字節跳動網絡技術有限公司 Lut更新の起動
WO2020143824A1 (en) 2019-01-13 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Interaction between lut and shared merge list
JP7201906B2 (ja) * 2019-01-15 2023-01-11 日本電信電話株式会社 参照領域決定装置及びプログラム
CN113330739A (zh) 2019-01-16 2021-08-31 北京字节跳动网络技术有限公司 Lut中的运动候选的插入顺序
WO2020192611A1 (en) 2019-03-22 2020-10-01 Beijing Bytedance Network Technology Co., Ltd. Interaction between merge list construction and other tools
CN112333450B (zh) * 2019-08-05 2023-07-14 腾讯美国有限责任公司 一种视频编解码的方法和装置
US20230224472A1 (en) * 2022-01-12 2023-07-13 Tencent America LLC Motion vector restriction for out-of-frame boundary conditions

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5151784A (en) 1991-04-30 1992-09-29 At&T Bell Laboratories Multiple frame motion estimation
TW321748B (zh) 1994-02-23 1997-12-01 Rca Thomson Licensing Corp
DE69841029D1 (de) 1997-06-25 2009-09-10 Nippon Telegraph & Telephone Bewegungsprädiktive Bildkodierungs- und Bilddekodierungsvorrichtung
US6862372B2 (en) 2001-12-27 2005-03-01 Koninklijke Philips Electronics N.V. System for and method of sharpness enhancement using coding information and local spatial features
US7177356B2 (en) 2002-01-11 2007-02-13 Webtv Networks, Inc. Spatially transcoding a video stream
HUP0301368A3 (en) 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
US8064520B2 (en) 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
BR0318528A (pt) 2003-10-09 2006-09-12 Thomson Licensing processo de derivação de modo direto para encobrimento de erros
US20060120612A1 (en) 2004-12-08 2006-06-08 Sharath Manjunath Motion estimation techniques for video encoding
GB2431798A (en) 2005-10-31 2007-05-02 Sony Uk Ltd Motion vector selection based on integrity
RU2395174C1 (ru) 2006-03-30 2010-07-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для декодирования/кодирования сигнала видео
ES2533765T3 (es) 2006-03-30 2015-04-15 Lg Electronics Inc. Un método y un aparato para descodificar/codificar una señal de video
JP2008067194A (ja) * 2006-09-08 2008-03-21 Toshiba Corp フレーム補間回路、フレーム補間方法、表示装置
US9883202B2 (en) 2006-10-06 2018-01-30 Nxp Usa, Inc. Scaling video processing complexity based on power savings factor
US8213509B2 (en) 2006-10-06 2012-07-03 Calos Fund Limited Liability Company Video coding on parallel processing systems
EP2079242A4 (en) 2006-10-30 2010-11-03 Nippon Telegraph & Telephone METHOD FOR GENERATING PREDICTIVE REFERENCE INFORMATION, DYNAMIC IMAGE ENCODING AND DECODING METHOD, DEVICE THEREOF, PROGRAM THEREOF, AND STORAGE MEDIUM CONTAINING THE PROGRAM
US8265157B2 (en) 2007-02-07 2012-09-11 Lsi Corporation Motion vector refinement for MPEG-2 to H.264 video transcoding
US8160150B2 (en) * 2007-04-10 2012-04-17 Texas Instruments Incorporated Method and system for rate distortion optimization
US8660176B2 (en) 2008-09-26 2014-02-25 Qualcomm Incorporated Resolving geometric relationships among video data units
JP5401071B2 (ja) 2008-10-09 2014-01-29 株式会社Nttドコモ 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、動画像復号プログラム、動画像処理システムおよび動画像処理方法
US8411750B2 (en) 2009-10-30 2013-04-02 Qualcomm Incorporated Global motion parameter estimation using block-based motion vectors
US8879632B2 (en) 2010-02-18 2014-11-04 Qualcomm Incorporated Fixed point implementation for geometric motion partitioning
US9124898B2 (en) 2010-07-12 2015-09-01 Mediatek Inc. Method and apparatus of temporal motion vector prediction
MX2013014733A (es) 2011-12-16 2014-02-19 Panasonic Corp Metodo de codificacion de imagenes de video, dispositivo de codificacion de imagenes de video, metodo de decodificacion de imagenes de video, dispositivo de decodificacion de imagenes de video y dispositivo de codificacion/decodificacion de imagenes de video.

Also Published As

Publication number Publication date
KR102057350B1 (ko) 2019-12-18
WO2013096018A1 (en) 2013-06-27
HK1197330A1 (zh) 2015-01-09
IL232776A (en) 2017-09-28
RU2573227C1 (ru) 2016-01-20
SG11201402601SA (en) 2014-08-28
UA114617C2 (uk) 2017-07-10
PH12014501244B1 (en) 2014-09-15
MY167467A (en) 2018-08-29
BR112014015056B1 (pt) 2022-07-12
KR20140110957A (ko) 2014-09-17
PH12014501244A1 (en) 2014-09-15
BR112014015056A2 (pt) 2017-06-13
US9762904B2 (en) 2017-09-12
AU2012355669A1 (en) 2014-07-24
US20130163668A1 (en) 2013-06-27
JP2015506606A (ja) 2015-03-02
CA2858979C (en) 2020-04-14
JP2018050308A (ja) 2018-03-29
IN2014CN04420A (zh) 2015-09-04
AU2012355669B2 (en) 2017-04-06
EP2795900A1 (en) 2014-10-29
TWI535269B (zh) 2016-05-21
CN104012096A (zh) 2014-08-27
IL232776A0 (en) 2014-07-31
CA2858979A1 (en) 2013-06-27
SG10201605087YA (en) 2016-08-30

Similar Documents

Publication Publication Date Title
TWI535269B (zh) 執行視訊寫碼之運動向量預測
US11252436B2 (en) Video picture inter prediction method and apparatus, and codec
TWI766844B (zh) 針對視訊寫碼使用與位置相關之預測組合之改良視訊幀內預測
TWI705694B (zh) 片級內部區塊複製及其他視訊寫碼改善
KR101574866B1 (ko) 비디오 코딩을 위한 모션 벡터 예측의 수행
AU2012226301B2 (en) Quantized pulse code modulation in video coding
JP2017508346A (ja) ビデオコーディングのための適応的な動きベクトル分解シグナリング
TW201342920A (zh) 在視訊寫碼中用於色度分量之變換單位分割
CN111200735A (zh) 一种帧间预测的方法及装置
CN110868602A (zh) 视频编码器、视频解码器及相应方法
TW201921938A (zh) 具有在用於視訊寫碼之隨機存取組態中之未來參考訊框之可調適圖像群組結構
CN113170141B (zh) 帧间预测方法和相关装置
CN110876057B (zh) 一种帧间预测的方法及装置
US12015780B2 (en) Inter prediction method and apparatus, video encoder, and video decoder
WO2020024275A1 (zh) 一种帧间预测的方法及装置