TW201338549A - 產生額外合併候選者 - Google Patents

產生額外合併候選者 Download PDF

Info

Publication number
TW201338549A
TW201338549A TW101141385A TW101141385A TW201338549A TW 201338549 A TW201338549 A TW 201338549A TW 101141385 A TW101141385 A TW 101141385A TW 101141385 A TW101141385 A TW 101141385A TW 201338549 A TW201338549 A TW 201338549A
Authority
TW
Taiwan
Prior art keywords
candidate
video
candidates
motion information
list
Prior art date
Application number
TW101141385A
Other languages
English (en)
Other versions
TWI544783B (zh
Inventor
Yun-Fei Zheng
Xianglin Wang
Marta Karczewicz
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201338549A publication Critical patent/TW201338549A/zh
Application granted granted Critical
Publication of TWI544783B publication Critical patent/TWI544783B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

在產生用於框間預測視訊寫碼之候選者清單時,視訊寫碼器可在將空間候選者及時間候選者添加至候選者清單時執行修剪操作,而在將人工產生之候選者添加至候選者清單時不執行修剪操作。人工產生之候選者可具有與已在候選者清單中之空間候選者或時間候選者之運動資訊相同的運動資訊。

Description

產生額外合併候選者
本發明係關於視訊寫碼,且更特定而言係關於視訊資料之合併模式預測。
本申請案主張以下各者之權利:2011年11月7日申請之美國臨時申請案第61/556,746號;2011年11月21日申請之美國臨時申請案第61/562,284號;及2011年11月22日申請之美國臨時申請案61/562,940,其中每一者之全部內容以引用的方式併入本文中。
可將數位視訊能力併入於廣泛範圍之器件中,包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、數位相機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲機、蜂巢式或衛星無線電電話、視訊電傳會議器件及其類似者。數位視訊器件實施視訊壓縮技術(諸如,在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分(進階視訊寫碼(AVC))定義之標準、目前在開發中之高效視訊寫碼(HEVC)標準及此等標準之擴展中所描述的視訊壓縮技術)以更有效率地傳輸、接收及儲存數位視訊資訊。
視訊壓縮技術執行空間(圖片內)預測及/或時間(圖片間)預測,以減少或移除視訊序列中固有之冗餘。對於基於區 塊之視訊寫碼,可將視訊切片分割成視訊區塊,視訊區塊亦可被稱作樹型區塊、寫碼單元(CU)及/或寫碼節點。使用關於同一圖片中之相鄰區塊中之參考樣本的空間預測來編碼圖片之框內寫碼(I)切片中的視訊區塊。圖片之框間寫碼(P或B)切片中之視訊區塊可使用關於同一圖片中之相鄰區塊中之參考樣本的空間預測或關於其他參考圖片中之參考樣本的時間預測。圖片可被稱作圖框,且參考圖片可被稱作參考圖框。
本發明描述用於在視訊編碼器處產生供框間預測寫碼使用之候選者清單及用於在視訊解碼器處產生相同候選者清單之技術。視訊編碼器及視訊解碼器可藉由實施用於建構候選者清單之相同技術來產生相同候選者清單。舉例而言,視訊編碼器及視訊解碼器兩者可建構具有相同數目之候選者的清單。視訊編碼器及解碼器可首先考慮空間候選者(例如,同一圖片中之相鄰區塊),接著考慮時間候選者(例如,不同圖片中之候選者),且最後可考慮人工產生之候選者,直至將所要數目之候選者添加至清單為止。根據本發明之技術,可在候選者清單建構期間針對某些類型之候選者利用修剪操作,以便自候選者清單移除重複,而對於其他類型之候選者,可能不使用修剪以便減小寫碼器複雜性。
在一實例中,一寫碼視訊資料之方法包括:判定與一當前視訊圖框之一當前部分相關聯的空間候選者之一集合, 其中空間候選者之該集合對應於該當前視訊圖框的鄰近該當前部分之相鄰部分,且其中該等空間候選者中之每一者具有相關聯之運動資訊;判定與該當前視訊圖框之該當前部分相關聯的一時間候選者,其中該時間候選者對應於一參考視訊圖框之一部分,且其中該時間候選者具有相關聯之運動資訊;基於空間候選者之該集合的一子集及該時間候選者產生一候選者清單;及,回應於該候選者清單包含之候選者少於一指定數目,將一人工產生之候選者添加至該候選者清單,其中該人工產生之候選者具有與該子集之一空間候選者之運動資訊或該時間候選者之運動資訊相同的運動資訊。
在另一實例中,一用於寫碼視訊資料之器件包括一視訊寫碼器,該視訊寫碼器經組態以:判定與一當前視訊圖框之一當前部分相關聯的空間候選者之一集合,其中空間候選者之該集合對應於該當前視訊圖框的鄰近該當前部分之相鄰部分,且其中該等空間候選者中之每一者具有相關聯之運動資訊;判定與該當前視訊圖框之該當前部分相關聯的一時間候選者,其中該時間候選者對應於一參考視訊圖框之一部分,且其中該時間候選者具有相關聯之運動資訊;基於空間候選者之該集合的一子集及該時間候選者產生一候選者清單;及,回應於該候選者清單包含之候選者少於一指定數目,將一人工產生之候選者添加至該候選者清單,其中該人工產生之候選者具有與該子集之一空間候選者之運動資訊或該時間候選者之運動資訊相同的運動資 訊。
在另一實例中,一用於寫碼視訊資料之器件包括:用於判定與一當前視訊圖框之一當前部分相關聯的空間候選者之一集合的構件,其中空間候選者之該集合對應於該當前視訊圖框的鄰近該當前部分之相鄰部分,且其中該等空間候選者中之每一者具有相關聯之運動資訊;用於判定與該當前視訊圖框之該當前部分相關聯之一時間候選者的構件,其中該時間候選者對應於一參考視訊圖框之一部分,且其中該時間候選者具有相關聯之運動資訊;用於基於空間候選者之該集合的一子集及該時間候選者產生一候選者清單的構件;及,用於回應於該候選者清單包含之候選者少於一指定數目而將一人工產生之候選者添加至該候選者清單的構件,其中該人工產生之候選者具有與該子集之一空間候選者之運動資訊或該時間候選者之運動資訊相同的運動資訊。
在另一實例中,一電腦可讀儲存媒體儲存在經執行時使一或多個處理器執行以下操作的指令:判定與一當前視訊圖框之一當前部分相關聯的空間候選者之一集合,其中空間候選者之該集合對應於該當前視訊圖框的鄰近該當前部分之相鄰部分,且其中該等空間候選者中之每一者具有相關聯之運動資訊;判定與該當前視訊圖框之該當前部分相關聯的一時間候選者,其中該時間候選者對應於一參考視訊圖框之一部分,且其中該時間候選者具有相關聯之運動資訊;基於空間候選者之該集合的一子集及該時間候選者 產生一候選者清單;及,回應於該候選者清單包含之候選者少於一指定數目而將一人工產生之候選者添加至該候選者清單,其中該人工產生之候選者具有與該子集之一空間候選者之運動資訊或該時間候選者之運動資訊相同的運動資訊。
一或多個實例之細節陳述於隨附圖式及以下描述中。其他特徵、目標及優勢將自該描述及該等圖式以及自申請專利範圍顯而易見。
視訊編碼器可執行框間預測以減少圖片之間的時間冗餘。如下文所描述,寫碼單元(CU)可具有複數個預測單元(PU)。換言之,複數個PU可屬於CU。當視訊編碼器執行框間預測時,視訊編碼器可傳訊用於PU之運動資訊。PU之運動資訊可包括(例如)參考圖片索引、運動向量及預測方向指示符。運動向量可指示PU之視訊區塊與PU之參考區塊之間的位移。PU之參考區塊可為類似於PU之視訊區塊的參考圖片之一部分。參考區塊可定位於由參考圖片索引及預測方向指示符指示之參考圖片中。
為了減少表示PU之運動資訊所需要之位元的數目,視訊編碼器可根據合併模式或進階運動向量預測(AMVP)程序產生用於PU中之每一者的候選者清單。用於PU之候選者清單中之每一候選者可指示運動資訊。由候選者清單中之一些候選者指示的運動資訊可基於其他PU之運動資訊。若候選者指示指定空間候選者位置或時間候選者位置中之 一者的運動資訊,則本發明可將該候選者稱作「原始」候選者。舉例而言,對於合併模式,可存在五個原始空間候選者位置及一個原始時間候選者位置。在一些實例中,視訊編碼器可藉由組合來自不同原始候選者之部分運動向量、修改原始候選者或僅插入零運動向量作為候選者來產生額外候選者。此等額外候選者不被視為原始候選者且在本發明中可稱作人工產生之候選者。
本發明之技術大體而言係關於用於在視訊編碼器處產生候選者清單之技術及用於在視訊解碼器處產生相同候選者清單之技術。視訊編碼器及視訊解碼器可藉由實施用於建構候選者清單之相同技術來產生相同候選者清單。舉例而言,視訊編碼器及視訊解碼器兩者可建構具有相同數目之候選者(例如,五個候選者)的清單。視訊編碼器及解碼器可首先考慮空間候選者(例如,同一圖片中之相鄰區塊),接著考慮時間候選者(例如,不同圖片中之候選者),且最後可考慮人工產生之候選者直至將所要數目之候選者添加至清單為止。根據本發明之技術,可在候選者清單建構期間針對某些類型之候選者利用修剪操作以便自候選者清單移除重複,而對於其他類型之候選者,可能不使用修剪以便減小寫碼器複雜性。舉例而言,對於空間候選者集合及對於時間候選者,可執行修剪操作以自候選者之清單排除具有重複運動資訊之候選者。然而,當將人工產生之候選者添加至候選者之清單時,可在不對人工產生之候選者執行修剪操作的情況下添加人工產生之候選者。
在產生用於CU之PU的候選者清單之後,視訊編碼器可自候選者清單選擇候選者且在位元串流中輸出候選者索引。選定候選者可為具有產生最緊密地匹配正被寫碼之目標PU之預測子的運動向量之候選者。候選者索引可指示在候選者清單中選定候選者的位置。視訊編碼器亦可基於由PU之運動資訊指示的參考區塊產生用於PU之預測性視訊區塊。可基於由選定候選者指示之運動資訊判定PU之運動資訊。舉例而言,在合併模式中,PU之運動資訊可與由選定候選者指示之運動資訊相同。在AMVP模式中,PU之運動資訊可基於PU之運動向量差及由選定候選者指示之運動資訊判定。視訊編碼器可基於CU之PU的預測性視訊區塊及用於CU之原始視訊區塊產生用於CU之一或多個殘餘視訊區塊。視訊編碼器可接著編碼一或多個殘餘視訊區塊且在位元串流中輸出一或多個殘餘視訊區塊。
位元串流可包括識別PU之候選者清單中之選定候選者的資料。視訊解碼器可基於由PU之候選者清單中之選定候選者指示的運動資訊判定PU之運動資訊。視訊解碼器可基於PU之運動資訊識別用於PU之一或多個參考區塊。在識別PU之一或多個參考區塊之後,視訊解碼器可基於PU之一或多個參考區塊產生用於PU之預測性視訊區塊。視訊解碼器可基於用於CU之PU的預測性視訊區塊及用於CU之一或多個殘餘視訊區塊來重建構用於CU之視訊區塊。
為了易於解釋,本發明可將位置或視訊區塊描述為與CU或PU具有各種空間關係。此描述可解譯為意謂位置或 視訊區塊和與CU或PU相關聯之視訊區塊具有各種空間關係。此外,本發明可將視訊寫碼器當前在寫碼之PU稱作當前PU。本發明可將視訊寫碼器當前在寫碼之CU稱作當前CU。本發明可將視訊寫碼器當前在寫碼之圖片稱作當前圖片。
所附圖式說明實例。由所附圖式中之參考數字指示的元件對應於由以下描述中之相似參考數字指示的元件。在本發明中,具有以序數詞(例如,「第一」、「第二」、「第三」等等)開始之名稱的元件未必暗示元件具有特定次序。實情為,此等序數詞僅用以指代相同或類似類型之不同元件。
圖1係說明可利用本發明之技術之實例視訊寫碼系統10的方塊圖。如本文中所使用描述,術語「視訊寫碼器」一般指代視訊編碼器及視訊解碼器兩者。在本發明中,術語「視訊寫碼」或「寫碼」一般可指代視訊編碼及視訊解碼。
如圖1中所展示,視訊寫碼系統10包括源器件12及目的地器件14。源器件12產生經編碼視訊資料。因此,源器件12可稱作視訊編碼器件。目的地器件14可解碼由源器件12產生之經編碼視訊資料。因此,目的地器件14可稱作視訊解碼器件。源器件12及目的地器件14可為視訊寫碼器件之實例。
源器件12及目的地器件14可包含廣泛範圍之器件,包括桌上型電腦、行動計算器件、筆記型(例如,膝上型)電 腦、平板電腦、機上盒、諸如所謂的「智慧型」手機之電話手機、電視、相機、顯示器件、數位媒體播放器、視訊遊戲機、車用電腦或其類似者。在一些實例中,源器件12及目的地器件14可經配備以用於無線通信。
目的地器件14可經由通道16自源器件12接收經編碼視訊資料。通道16可包含能夠將經編碼視訊資料自源器件12移動至目的地器件14之一類型之媒體或器件。在一實例中,通道16可包含使得源器件12能夠即時地將經編碼視訊資料直接傳輸至目的地器件14的通信媒體。在此實例中,源器件12可根據通信標準(諸如無線通信協定)調變經編碼視訊資料,且可將經調變視訊資料傳輸至目的地器件14。通信媒體可包含無線或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全球網路)的部分。通信媒體可包括路由器、交換器、基地台或促進自源器件12至目的地器件14之通信的其他設備。
在另一實例中,通道16可對應於儲存由源器件12產生之經編碼視訊資料的儲存媒體。在此實例中,目的地器件14可經由磁碟存取或卡存取來存取儲存媒體。儲存媒體可包括多種本端存取之資料儲存媒體,諸如藍光光碟、DVD、CD-ROM、快閃記憶體或用於儲存經編碼視訊資料之其他合適數位儲存媒體。在另一實例中,通道16可包括檔案伺服器或儲存由源器件12產生之經編碼視訊的另一中間儲存器件。在此實例中,目的地器件14可經由串流或下載存取 儲存於檔案伺服器或其他中間儲存器件處之經編碼視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將經編碼視訊資料傳輸至目的地器件14之一類型之伺服器。實例檔案伺服器包括網路伺服器(例如,用於網站)、檔案傳送協定(FTP)伺服器、網路附接儲存(NAS)器件及本端磁碟機。目的地器件14可經由標準資料連接(包括網際網路連接)存取經編碼視訊資料。資料連接之實例類型可包括無線通道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機等)或適合用於存取儲存於檔案伺服器上之經編碼視訊資料之無線通道與有線連接的組合。經編碼視訊資料自檔案伺服器之傳輸可為串流傳輸、下載傳輸,或兩者之組合。
本發明之技術不限於無線應用或設定。該等技術可應用於視訊寫碼以支援多種多媒體應用中之任一者,諸如空中電視廣播、有線電視傳輸、衛星電視傳輸、(例如)經由網際網路之串流視訊傳輸、數位視訊之編碼以供儲存於資料儲存媒體上、儲存於資料儲存媒體上之數位視訊之解碼,或其他應用。在一些實例中,視訊寫碼系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。
在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。在一些狀況下,輸出介面22可包括調變器/解調變器(數據機)及/或傳輸器。在源器件12中,視訊源18可包括諸如視訊俘獲器件之源,諸如視訊攝影機、含有先前俘獲之視訊資料的視訊存檔、自視訊內容提供者接 收視訊資料之視訊饋送介面,及/或用於產生視訊資料之電腦圖形系統,或此等源之組合。
視訊編碼器20可編碼所俘獲、預俘獲或電腦產生之視訊資料。經編碼視訊資料可經由源器件12之輸出介面22直接傳輸至目的地器件14。經編碼視訊資料亦可儲存至儲存媒體或檔案伺服器上以供稍後由目的地器件14存取以用於解碼及/或播放。
在圖1之實例中,目的地器件14包括輸入介面28、視訊解碼器30及顯示器件32。在一些狀況下,輸入介面28可包括接收器及/或數據機。目的地器件14之輸入介面28經由通道16接收經編碼視訊資料。經編碼視訊資料可包括由視訊編碼器20產生之表示視訊資料的多種語法元素。此等語法元素可包括於在通信媒體上傳輸、儲存於儲存媒體上或儲存於檔案伺服器上之經編碼視訊資料內。
顯示器件32可與目的地器件14整合或在目的地器件14外部。在一些實例中,目的地器件14可包括整合顯示器件且亦可經組態以與外部顯示器件介接。在其他實例中,目的地器件14可為顯示器件。一般而言,顯示器件32向使用者顯示經解碼視訊資料。顯示器件32可包含多種顯示器件中之任一者,諸如液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
視訊編碼器20及視訊解碼器30可根據視訊壓縮標準(諸如,目前在開發中的高效視訊寫碼(HEVC)標準)而操作,且可符合HEVC測試模型(HM)。即將到來之HEVC標準的 最近草案(稱作「HEVC工作草案6」或「WD6」)描述於文件JCTVC-H1003,Bross等人之「High efficiency video coding(HEVC)text specification draft 6」(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼之聯合合作小組(JCT-VC)第8次會議:USA,CA,San Jose,2012年2月)中,其於2012年5月1日可自http://phenix.int-evry.fr/jct/doc_end_user/documents/8_San%20Jose/wg11/JCTVC-H1003-v22.zip下載,其全部內容以引用的方式併入本文中。HEVC標準之另一最近草案(稱作「HEVC工作草案7」或「WD7」)描述於文件HCTVC-I1003,Bross等人之「High Efficiency Video Coding(HEVC)Text Specification Draft 7」(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼之聯合合作小組(JCT-VC)第9次會議:Switzerland,Geneva,2012年4月27日至2012年5月7日)中,其於2012年6月5日可自http://phenix.it-sudparis.eu/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v3.zip下載。
或者,視訊編碼器20及視訊解碼器30可根據諸如ITU-T H.264標準或者被稱作MPEG-4第10部分(進階視訊寫碼(AVC))之其他專屬或工業標準或此等標準之擴展而操作。然而,本發明之技術不限於任何特定寫碼標準或技術。視訊壓縮標準及技術之其他實例包括MPEG-2、ITU-T H.263及專屬或開放原始碼壓縮格式(諸如VP8及相關格式)。
儘管未展示於圖1之實例中,但視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當 MUX-DEMUX單元或其他硬體及軟體,以處置共同資料串流或單獨資料串流中之音訊及視訊兩者的編碼。若可適用,則在一些實例中,MUX-DEMUX單元可遵照ITU H.223多工器協定,或諸如使用者資料報協定(UDP)之其他協定。
再次,圖1僅為實例且本發明之技術可應用於視訊寫碼設定(例如,視訊編碼或視訊解碼),其未必包括編碼器件與解碼器件之間的任何資料通信。在其他實例中,資料可被自本端記憶體擷取、經由網路串流傳輸或其類似者。編碼器件可編碼資料且將該資料儲存至記憶體,及/或解碼器件可自記憶體擷取資料且解碼該資料。在許多實例中,編碼及解碼由不與彼此通信而是僅將資料編碼至記憶體及/或自記憶體擷取資料且解碼該資料之器件執行。
視訊編碼器20及視訊解碼器30各自可實施為多種合適電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、硬體或其任何組合。當該等技術部分以軟體實施時,器件可將用於軟體之指令儲存於合適的非暫時性電腦可讀儲存媒體中且可使用一或多個處理器來在硬體中執行指令以執行本發明的技術。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其中任一者可整合為各別器件中之組合編碼器/解碼器(CODEC)的部分。
如上文簡短地提及,視訊編碼器20編碼視訊資料。視訊 資料可包含一或多個圖片。圖片中之每一者為形成視訊之部分的靜態影像。在一些例子中,圖片可稱作視訊「圖框」。當視訊編碼器20編碼視訊資料時,視訊編碼器20可產生位元串流。位元串流可包括形成視訊資料之經寫碼表示的位元序列。位元串流可包括經寫碼圖片及相關聯之資料。經寫碼圖片為圖片之經寫碼表示。
為了產生位元串流,視訊編碼器20可對視訊資料中之每一圖片執行編碼操作。當視訊編碼器20對圖片執行編碼操作時,視訊編碼器20可產生一系列經寫碼圖片及相關聯之資料。相關聯之資料可包括序列參數集、圖片參數集、調適參數集及其他語法結構。序列參數集(SPS)可含有可應用於零或更多個圖片序列之參數。圖片參數集(PPS)可含有可應用於零或更多個圖片之參數。調適參數集(APS)可含有可應用於零或更多個圖片之參數。APS中之參數可為比PPS中之參數更可能改變的參數。
為了產生經寫碼圖片,視訊編碼器20可將圖片分割為視訊區塊。視訊區塊可為二維樣本陣列。視訊區塊中之每一者與樹型區塊相關聯。在一些例子中,樹型區塊可稱作最大寫碼單元(LCU)。HEVC之樹型區塊可寬泛地類似於先前標準(諸如H.264/AVC)之巨集區塊。然而,樹型區塊不一定限於特定大小且可包括一或多個寫碼單元(CU)。視訊編碼器20可使用四分樹分割以將樹型區塊之視訊區塊分割為與CU相關聯之視訊區塊,因此得名「樹型區塊」。
在一些實例中,視訊編碼器20可將圖片分割為複數個切 片。切片中之每一者可包括整數個CU。在一些例子中,切片包含整數個樹型區塊。在其他例子中,切片之邊界可在樹型區塊內。
作為對圖片執行編碼操作之部分,視訊編碼器20可對圖片之每一切片執行編碼操作。當視訊編碼器20對切片執行編碼操作時,視訊編碼器20可產生與切片相關聯之經編碼資料。與切片相關聯之經編碼資料可稱作「經寫碼切片」。
為了產生經寫碼切片,視訊編碼器20可對切片中之每一樹型區塊執行編碼操作。當視訊編碼器20對樹型區塊執行編碼操作時,視訊編碼器20可產生經寫碼樹型區塊。經寫碼樹型區塊可包含表示樹型區塊之經編碼版本的資料。
當視訊編碼器20產生經寫碼切片時,視訊編碼器20可根據光柵掃描次序對切片中之樹型區塊執行編碼操作(亦即,進行編碼)。換言之,視訊編碼器20可以跨越切片中之最頂部列的樹型區塊自作至右進行,接著跨越下一較低列之樹型區塊自左至右進行等等之次序編碼切片之樹型區塊,直至視訊編碼器20已編碼切片中之樹型區塊的每一者為止。
作為根據光柵掃描次序編碼樹型區塊之結果,給定樹型區塊上方及左方之樹型區塊可能已編碼,但給定樹型區塊之下方及右方的樹型區塊尚未編碼。因此,視訊編碼器20可能夠在編碼給定樹型區塊時存取藉由編碼給定樹型區塊之上方及左方之樹型區塊產生的資訊。然而,視訊編碼器 20可能不能在編碼給定樹型區塊時存取藉由編碼給定樹型區塊之下方及右方之樹型區塊產生的資訊。
為了產生經寫碼樹型區塊,視訊編碼器20可遞歸地對樹型區塊之視訊區塊執行四分樹分割以將視訊區塊劃分為逐漸變小之視訊區塊。較小視訊區塊中之每一者可與不同CU相關聯。舉例而言,視訊編碼器20可將樹型區塊之視訊區塊分割為四個同等大小之子區塊,將子區塊中之一或多者分割為四個同等大小之子子區塊等等。已分割CU可為其視訊區塊經分割為與其他CU相關聯之視訊區塊的CU。非分割CU可為其視訊區塊未分割為與其他CU相關聯之視訊區塊的CU。
位元串流中之一或多個語法元素可指示視訊編碼器20可分割樹型區塊之視訊區塊的最大次數。CU之視訊區塊形狀可為正方形的。CU之視訊區塊的大小(亦即,CU之大小)可在8×8像素直至具有64×64像素或更大之最大值之樹型區塊的視訊區塊大小(亦即,樹型區塊之大小)的範圍內。
視訊編碼器20可根據z掃描次序對樹型區塊之每一CU執行編碼操作(亦即,進行編碼)。換言之,視訊編碼器20可以彼次序編碼左上CU、右上CU、左下CU及接著右下CU。當視訊編碼器20對已分割CU執行編碼操作時,視訊編碼器20可根據z掃描次序編碼與已分割CU之視訊區塊之子區塊相關聯的CU。換言之,視訊編碼器20可以彼次序編碼與左上子區塊相關聯之CU、與右上子區塊相關聯之 CU、與左下子區塊相關聯之CU,及接著與右下子區塊相關聯之CU。
作為根據z掃描次序編碼樹型區塊之CU的結果,給定CU上方、左上方、右上方、左方及左下方之CU可能已編碼。給定CU下方或右方之CU尚未編碼。因此,視訊編碼器20可能夠在編碼給定CU時存取藉由編碼與給定CU相鄰之一些CU所產生的資訊。然而,視訊編碼器20可能不能在編碼給定CU時存取藉由編碼與給定CU相鄰之其他CU所產生的資訊。
當視訊編碼器20編碼非分割CU時,視訊編碼器20可產生用於CU之一或多個預測單元(PU)。CU之PU中之每一者可與CU之視訊區塊內的不同視訊區塊相關聯。視訊編碼器20可產生用於CU之每一PU的預測性視訊區塊。PU之預測性視訊區塊可為樣本之區塊。視訊編碼器20可使用框內預測或框間預測以產生用於PU之預測性視訊區塊。
當視訊編碼器20使用框內預測以產生PU之預測性視訊區塊時,視訊編碼器20可基於與PU相關聯之圖片的經解碼樣本來產生PU之預測性視訊區塊。若視訊編碼器20使用框內預測以產生CU之PU的預測性視訊區塊,則CU為框內預測之CU。當視訊編碼器20使用框間預測以產生PU之預測性視訊區塊時,視訊編碼器20可基於不同於與PU相關聯之圖片的一或多個圖片之經解碼樣本來產生PU之預測性視訊區塊。若視訊編碼器20使用框間預測以產生CU之PU的預測性視訊區塊,則CU為框間預測之CU。
此外,當視訊編碼器20使用框間預測以產生用於PU之預測性視訊區塊時,視訊編碼器20可產生用於PU之運動資訊。用於PU之運動資訊可指示PU之一或多個參考區塊。PU之每一參考區塊可為參考圖片內之視訊區塊。參考圖片可為不同於與PU相關聯之圖片的圖片。在一些例子中,PU之參考區塊亦可稱作PU之「參考樣本」。視訊編碼器20可基於PU之參考區塊產生用於PU之預測性視訊區塊。
在視訊編碼器20產生用於CU之一或多個PU的預測性視訊區塊之後,視訊編碼器20可基於用於CU之PU的預測性視訊區塊產生用於CU之殘餘資料。用於CU之殘餘資料可指示用於CU之PU的預測性視訊區塊中之樣本與CU之原始視訊區塊之間的差異。
此外,作為對非分割CU執行編碼操作之部分,視訊編碼器20可對CU之殘餘資料執行遞歸四分樹分割以將CU之殘餘資料分割為與CU之變換單元(TU)相關聯的殘餘資料之一或多個區塊(亦即,殘餘視訊區塊)。CU之每一TU可與不同殘餘視訊區塊相關聯。
視訊寫碼器20可將一或多個變換應用於與TU相關聯之殘餘視訊區塊以產生與TU相關聯之變換係數區塊(亦即,變換係數之區塊)。概念上,變換係數區塊可包含表示變換在頻域中之量值的二維(2D)變換係數矩陣。
在產生變換係數區塊之後,視訊編碼器20可對變換係數區塊執行量化程序。量化一般指代如下程序:量化變換係數以可能地減少用以表示變換係數之資料的量,從而提供 進一步壓縮。量化程序可減少與變換係數中之一些或全部相關聯的位元深度。舉例而言,可在量化期間將n位元變換係數向下捨位至m位元變換係數,其中n大於m
視訊編碼器20可使每一CU與量化參數(QP)值相關聯。與CU相關聯之QP值可判定視訊編碼器20如何量化與CU相關聯之變換係數區塊。視訊編碼器20可藉由調整與CU相關聯之QP值來調整應用於與CU相關聯之變換係數區塊的量化程度。
在視訊編碼器20量化變換係數區塊之後,視訊編碼器20可產生表示經量化變換係數區塊中之變換係數的語法元素集合。視訊編碼器20可將熵編碼操作(諸如上下文自適應性二進位算術寫碼(CABAC)操作)應用於此等語法元素中之一些。
由視訊編碼器20產生之位元串流可包括一系列網路抽象層(NAL)單元。NAL單元中之每一者可為含有NAL單元中之資料之類型的指示及含有該資料之位元組之語法結構。舉例而言,NAL單元可含有表示序列參數集、圖片參數集、經寫碼切片、補充增強資訊(SEI)、存取單元定界符、填充符資料或另一類型之資料的資料。NAL單元中之資料可包括各種語法結構。
視訊解碼器30可接收由視訊編碼器20產生之位元串流。位元串流可包括由視訊編碼器20編碼之視訊資料的經寫碼表示。當視訊解碼器30接收位元串流時,視訊解碼器30可對位元串流執行剖析操作。當視訊解碼器30執行剖析操作 時,視訊解碼器30可自位元串流提取語法元素。視訊解碼器30可基於自位元串流提取之語法元素重建構視訊資料之圖片。基於語法元素重建構視訊資料之程序一般可與由視訊編碼器20執行以產生語法元素之程序互逆。
在視訊解碼器30提取與CU相關聯之語法元素之後,視訊解碼器30可基於語法元素產生用於CU之PU的預測性視訊區塊。另外,視訊解碼器30可反量化與CU之TU相關聯的變換係數區塊。視訊解碼器30可對變換係數區塊執行反變換以重建構與CU之TU相關聯的殘餘視訊區塊。在產生預測性視訊區塊且重建構殘餘視訊區塊之後,視訊解碼器30可基於預測性視訊區塊及殘餘視訊區塊來重建構CU之視訊區塊。以此方式,視訊解碼器30可基於位元串流中之語法元素來重建構CU之視訊區塊。
如上文簡短地描述,視訊編碼器20可使用框間預測以產生用於CU之PU的預測性視訊區塊及運動資訊。在許多例子中,給定PU之運動資訊可能與一或多個附近PU(亦即,其視訊區塊在空間上或時間上在給定PU之視訊區塊附近的PU)之運動資訊相同或類似。因為附近PU經常具有類似運動資訊,所以視訊編碼器20可參考附近PU之運動資訊來編碼給定PU之運動資訊。參考附近PU之運動資訊來編碼給定PU之運動資訊可減少位元串流中指示給定PU之運動資訊所需要的位元之數目。
視訊編碼器20可以各種方式參考附近PU之運動資訊來編碼給定PU之運動資訊。舉例而言,視訊編碼器20可指示 給定PU之運動資訊與附近PU之運動資訊相同。本發明可使用片語「合併模式」來指代指示給定PU之運動資訊與附近PU之運動資訊相同或可自附近PU之運動資訊導出。在另一實例中,視訊編碼器20可計算用於給定PU之運動向量差(MVD)。MVD指示給定PU之運動向量與附近PU之運動向量之間的差。在此實例中,視訊編碼器20可將MVD而非給定PU之運動向量包括於給定PU之運動資訊中。在位元串流中表示MVD比表示給定PU之運動向量所需要的位元少。本發明可使用片語「進階運動向量預測」(AMVP)模式指代藉由使用MVD及識別候選者運動向量之索引值來傳訊給定PU之運動資訊。
為了使用合併模式或AMVP模式來傳訊給定PU之運動資訊,視訊編碼器20可產生用於給定PU之候選者清單。候選者清單可包括一或多個候選者。用於給定PU之候選者清單中之候選者中的每一者可指定運動資訊。由每一候選者指示之運動資訊可包括運動向量、參考圖片索引及預測方向指示符。候選者清單中之候選者可包括「原始」候選者,其中每一者指示不同於給定PU之PU內的指定候選者位置中之一者的運動資訊。
在產生用於PU之候選者清單之後,視訊編碼器20可自用於PU之候選者清單選擇候選者中之一者。舉例而言,視訊編碼器可比較每一候選者與正被寫碼之PU且可選擇具有所要位元率-失真效能之候選者。視訊編碼器20可輸出用於PU之候選者索引。候選者索引可識別選定候選者在候選 者清單中之位置。
此外,視訊編碼器20可基於由PU之運動資訊指示的參考區塊產生用於PU之預測性視訊區塊。可基於由用於PU之候選者清單中的選定候選者指示之運動資訊判定PU之運動資訊。舉例而言,在合併模式中,PU之運動資訊可與由選定候選者指示之運動資訊相同。在AMVP模式中,可基於用於PU之運動向量差(MVD)及由選定候選者指示之運動資訊判定PU之運動資訊。視訊編碼器20可如上文所描述處理用於PU之預測性視訊區塊。
當視訊解碼器30接收到位元串流時,視訊解碼器30可產生用於CU之PU中之每一者的候選者清單。由視訊解碼器30針對PU產生之候選者清單可與由視訊編碼器20針對PU產生之候選者清單相同。自位元串流剖析得到之語法元素可指示在PU之候選者清單中選定候選者的位置。在產生用於PU之候選者清單之後,視訊解碼器30可基於由PU之運動資訊指示的一或多個參考區塊產生用於PU之預測性視訊區塊。視訊解碼器30可基於由用於PU之候選者清單中的選定候選者指示之運動資訊判定PU之運動資訊。視訊解碼器30可基於用於PU之預測性視訊區塊及用於CU之殘餘視訊區塊重建構用於CU之視訊區塊。
圖2係說明經組態以實施本發明之技術之實例視訊編碼器20的方塊圖。圖2係出於解釋之目的而提供且不應視為限制如本發明中寬泛地例證及描述之技術。出於解釋之目的,本發明在HEVC寫碼之內容脈絡中描述視訊編碼器 20。然而,本發明之技術可應用於其他寫碼標準或方法。
在圖2之實例中,視訊編碼器20包括複數個功能組件。視訊編碼器20之功能組件包括預測模組100、殘餘產生模組102、變換模組104、量化模組106、反量化模組108、反變換模組110、重建構模組112、濾波器模組113、經解碼圖片緩衝器114,及熵編碼模組116。預測模組100包括框間預測模組121、運動估計模組122、運動補償模組124及框內預測模組126。在其他實例中,視訊編碼器20可包括更多、更少或不同功能組件。此外,運動估計模組122及運動補償模組124可高度整合,但出於解釋之目的而在圖2之實例中分離地表示。
視訊編碼器20可接收視訊資料。視訊編碼器20可自各種源接收視訊資料。舉例而言,視訊編碼器20可自視訊源18(圖1)或另一源接收視訊資料。視訊資料可表示一系列圖片。為了編碼視訊資料,視訊編碼器20可對圖片中之每一者執行編碼操作。作為對圖片執行編碼操作之部分,視訊編碼器20可對圖片之每一切片執行編碼操作。作為對切片執行編碼操作之部分,視訊編碼器20可對切片中之樹型區塊執行編碼操作。
作為對樹型區塊執行編碼操作之部分,預測模組100可對樹型區塊之視訊區塊執行四分樹分割以將視訊區塊劃分為逐漸變小之視訊區塊。較小視訊區塊中之每一者可與不同CU相關聯。舉例而言,預測模組100可將樹型區塊之視訊區塊分割為四個同等大小之子區塊,將子區塊中之一或 多者分割為四個同等大小之子子區塊等等。
與CU相關聯之視訊區塊的大小可在8×8樣本直至具有64×64樣本或更大的最大值之樹型區塊的大小之範圍內。在本發明中,「N×N」與「N乘N」可互換使用以指就垂直及水平尺寸而言的視訊區塊之樣本尺寸,例如,16×16樣本或16乘16樣本。一般而言,16×16視訊區塊在垂直方向上具有16個樣本(y=16)且在水平方向上具有16個樣本(x=16)。同樣,N×N區塊一般在垂直方向上具有N個樣本且在水平方向上具有N個樣本,其中N表示非負整數值。
此外,作為對樹型區塊執行編碼操作之部分,預測模組100可產生用於樹型區塊之階層式四分樹資料結構。舉例而言,樹型區塊可對應於四分樹資料結構之根節點。若預測模組100將樹型區塊之視訊區塊分割為四個子區塊,則在四分樹資料結構中根節點具有四個子節點。子節點中之每一者對應於與子區塊中之一者相關聯的CU。若預測模組100將子區塊中之一者分割為四個子子區塊,則對應於與子區塊相關聯之CU的節點可具有四個子節點,該等子節點中之每一者對應於與子子區塊中之一者相關聯的CU。
四分樹資料結構之每一節點可含有用於對應樹型區塊或CU之語法資料(例如,語法元素)。舉例而言,四分樹中之節點可包括指示對應於節點之CU的視訊區塊是否被分割(亦即,分裂)為四個子區塊之分裂旗標。用於CU之語法元素可遞歸地定義,且可取決於CU之視訊區塊是否分裂為 子區塊。其視訊區塊未分割之CU可對應於四分樹資料結構中之葉節點。經寫碼樹型區塊可包括基於用於對應樹型區塊之四分樹資料結構的資料。
視訊編碼器20可對樹型區塊之每一非分割CU執行編碼操作。當視訊編碼器20對非分割CU執行編碼操作時,視訊編碼器20產生表示非分割CU之經編碼表示的資料。
作為對CU執行編碼操作之部分,預測模組100可將CU之視訊區塊分割於CU之一或多個PU當中。視訊編碼器20及視訊解碼器30可支援各種PU大小。假定特定CU之大小為2N×2N,視訊編碼器20及視訊解碼器30可支援2N×2N或N×N之PU大小以用於框內預測,及2N×2N、2N×N、N×2N、N×N或類似者之對稱PU大小以用於框間預測。視訊編碼器20及視訊解碼器30亦可支援用於2N×nU、2N×nD、nL×2N及nR×2N之PU大小的非對稱分割以用於框間預測。在一些實例中,預測模組100可執行幾何分割以沿著邊界將CU之視訊區塊分割於CU之PU當中,該邊界不與CU之視訊區塊的邊以直角相交。
框間預測模組121可對CU之每一PU執行框間預測。框間預測可提供時間壓縮。為了對PU執行框間預測,運動估計模組122可產生用於PU之運動資訊。運動補償模組124可基於不同於與CU相關聯之圖片的圖片(亦即,參考圖片)之運動資訊及經解碼樣本來產生用於PU之預測性視訊區塊。在本發明中,經由藉由運動補償模組124產生之預測性視訊區塊而預測的視訊區塊可稱作框間預測之視訊區塊。
切片可為I切片、P切片或B切片。運動估計模組122及運動補償模組124可針對CU之PU執行不同操作,此取決於PU在I切片、P切片抑或B切片中。在I切片中,所有PU經框內預測。因此,若PU在I切片中,則運動估計模組122及運動補償模組124不對PU執行框間預測。
若PU在P切片中,則含有PU之圖片與稱作「清單0」之參考圖片的清單相關聯。清單0中之參考圖片的每一者含有可用於其他圖片之框間預測的樣本。當運動估計模組122關於P切片中之PU執行運動估計操作時,運動估計模組122可在清單0中之參考圖片中搜尋用於PU之參考區塊。PU之參考區塊可為最緊密地對應於PU之視訊區塊中的樣本之樣本集合(例如,樣本之區塊)。運動估計模組122可使用多種量度來判定參考圖片中之樣本集合對應於PU之視訊區塊中的樣本之緊密程度。舉例而言,運動估計模組122可藉由絕對差之總和(SAD)、平方差之總和(SSD)或其他差量度來判定參考圖片中之樣本集合對應於PU之視訊區塊中的樣本之緊密程度。
在識別P切片中之PU的參考區塊之後,運動估計模組122可產生指示清單0中的含有參考區塊之參考圖片之參考索引及指示PU與參考區塊之間的空間位移之運動向量。在各種實例中,運動估計模組122可以不同之精度產生運動向量。舉例而言,運動估計模組122可以四分之一樣本精度、八分之一樣本精度或其他分數樣本精度產生運動向量。在分數樣本精度之狀況下,可自參考圖片中之整數位 置樣本值內插得到參考區塊值。運動估計模組122可輸出參考索引及運動向量作為PU之運動資訊。運動補償模組124可基於由PU之運動資訊識別的參考區塊產生PU之預測性視訊區塊。
若PU位於B切片中,則含有PU之圖片可與稱作「清單0」及「清單1」之兩個參考圖片清單相關聯。在一些實例中,含有B切片之圖片可與為清單0及清單1之組合的清單組合相關聯。
此外,若PU位於B切片中,則運動估計模組122可針對PU執行單向預測或雙向預測。當運動估計模組122針對PU執行單向預測時,運動估計模組122可在清單0或清單1之參考圖片中搜尋用於PU之參考區塊。運動估計模組122可接著產生指示清單0或清單1中的含有參考區塊之參考圖片之參考索引及指示PU與參考區塊之間的空間位移之運動向量。運動估計模組122可輸出參考索引、預測方向指示符及運動向量作為PU之運動資訊。預測方向指示符可指示參考索引指示清單0抑或清單1中之參考圖片。運動補償模組124可基於由PU之運動資訊指示的參考區塊產生PU之預測性視訊區塊。
當運動估計模組122針對PU執行雙向預測時,運動估計模組122可在清單0中之參考圖片中搜尋用於PU之參考區塊且亦可在清單1中之參考圖片中搜尋用於PU之另一參考區塊。運動估計模組122可接著產生指示清單0及清單1中的含有參考區塊之參考圖片之參考索引及指示參考區塊與PU 之間的空間位移之運動向量。運動估計模組122可輸出PU之參考索引及運動向量作為PU之運動資訊。運動補償模組124可基於由PU之運動資訊指示的參考區塊產生PU之預測性視訊區塊。
在一些例子中,運動估計模組122不向熵編碼模組116輸出用於PU之運動資訊的完整集合。實情為,運動估計模組122可參考另一PU之運動資訊來傳訊PU之運動資訊。舉例而言,運動估計模組122可判定PU之運動資訊充分類似於相鄰PU之運動資訊。在此實例中,運動估計模組122可在與PU相關聯之語法結構中指示一值,該值向視訊解碼器30指示PU具有與相鄰PU相同之運動資訊或具有可自相鄰PU導出之運動資訊。在另一實例中,運動估計模組122可在與PU相關聯之語法結構中識別與相鄰PU相關聯之運動候選者及運動向量差(MVD)。MVD指示PU之運動向量和與相鄰PU相關聯之所指示運動候選者的運動向量之間的差。視訊解碼器30可使用所指示運動候選者之運動向量及MVD來判定PU之運動向量。藉由在傳訊第二PU之運動資訊時參考與第一PU相關聯之候選者的運動資訊,視訊編碼器20可能夠使用比傳達運動向量原本所需的位元少的位元來傳訊第二PU之運動資訊。
如下文所描述,框間預測模組121可產生用於CU之每一PU的候選者清單。候選者清單中之一或多者可包括一或多個原始候選者及自原始候選者導出之一或多個額外候選者。
作為對CU執行編碼操作之部分,框內預測模組126可對CU之PU執行框內預測。框內預測可提供空間壓縮。當框內預測模組126對PU執行框內預測時,框內預測模組126可基於同一圖片中之其他PU的經解碼樣本來產生用於PU之預測資料。用於PU之預測資料可包括預測性視訊區塊及各種語法元素。框內預測模組126可對I切片、P切片及B切片中之PU執行框內預測。
為了對PU執行框內預測,框內預測模組126可使用多個框內預測模式來產生用於PU之多個預測資料集合。當框內預測模組126使用框內預測模式來產生用於PU之預測資料集合時,框內預測模組126可在與框內預測模式相關聯之方向及/或梯度上跨越PU之視訊區塊自相鄰PU之視訊區塊延伸樣本。相鄰PU可在PU之上方、右上方、左上方或左方,假定用於PU、CU及樹型區塊之編碼次序為自左至右、自上至下。框內預測模組126可使用各種數目個框內預測模式(例如,33個定向框內預測模式)。在一些實例中,框內預測模式之數目可取決於PU之大小。
預測模組100可自由運動補償模組124針對PU產生之預測資料或由框內預測模組126針對PU產生之預測資料當中選擇用於PU之預測資料。在一些實例中,預測模組100基於預測資料集合之位元率/失真量度來選擇用於PU之預測資料。
若預測模組100選擇由框內預測模組126產生之預測資料,則預測模組100可傳訊用以產生PU之預測資料的框內 預測模式(亦即,選定框內預測模式)。預測模組100可以各種方式傳訊選定框內預測模式。舉例而言,選定框內預測模式可能與相鄰PU之框內預測模式相同。換言之,相鄰PU之框內預測模式可為用於當前PU之最可能模式。因此,預測模組100可產生指示選定框內預測模式與相鄰PU之框內預測模式相同之語法元素。
在預測模組100選擇用於CU之PU的預測資料之後,殘餘產生模組102可藉由自CU之視訊區塊減去CU之PU的預測性視訊區塊來產生用於CU之殘餘資料。CU之殘餘資料可包括對應於CU之視訊區塊中的樣本之不同樣本分量之2D殘餘視訊區塊。舉例而言,殘餘資料可包括對應於CU之PU之預測性視訊區塊中的樣本之明度分量與CU之原始視訊區塊中的樣本之明度分量之間的差之殘餘視訊區塊。另外,CU之殘餘資料可包括對應於CU之PU之預測性視訊區塊中的樣本之色度分量與CU之原始視訊區塊中的樣本之色度分量之間的差之殘餘視訊區塊。
預測模組100可執行四分樹分割以便將CU之殘餘視訊區塊分割為子區塊。每一未劃分殘餘視訊區塊可與CU之不同TU相關聯。與CU之TU相關聯的殘餘視訊區塊之大小及位置可能基於或可能不基於與CU之PU相關聯的視訊區塊之大小及位置。稱作「殘餘四分樹」(RQT)之四分樹結構可包括與殘餘視訊區塊之每一者相關聯的節點。CU之TU可對應於RQT之葉節點。
變換模組104可藉由將一或多個變換應用於與TU相關聯 之殘餘視訊區塊來產生用於CU之每一TU的一或多個變換係數區塊。變換係數區塊中之每一者可為2D變換係數矩陣。變換模組104可將各種變換應用於與TU相關聯之殘餘視訊區塊。舉例而言,變換模組104可將離散餘弦變換(DCT)、方向變換或概念上類似之變換應用於與TU相關聯之殘餘視訊區塊。
在變換模組104產生與TU相關聯之變換係數區塊之後,量化模組106可量化變換係數區塊中之變換係數。量化模組106可基於與CU相關聯之QP值量化與CU之TU相關聯的變換係數區塊。
視訊編碼器20可以各種方式使QP值與CU相關聯。舉例而言,視訊編碼器20可對與CU相關聯之樹型區塊執行位元率-失真分析。在位元率-失真分析中,視訊編碼器20可藉由對樹型區塊執行編碼操作多次而產生樹型區塊之多個經寫碼表示。當視訊編碼器20產生樹型區塊之不同經編碼表示時,視訊編碼器20可使不同QP值與CU相關聯。當給定QP值與樹型區塊的具有最低位元率及失真量度之經寫碼表示中之CU相關聯時,視訊編碼器20可傳訊給定QP值與CU相關聯。
反量化模組108及反變換模組110可分別將反量化及反變換應用於變換係數區塊以自變換係數區塊重建構殘餘視訊區塊。重建構模組112可將經重建構殘餘視訊區塊添加至來自由預測模組100產生之一或多個預測性視訊區塊的對應樣本以產生與TU相關聯之經重建構視訊區塊。藉由以 此方式重建構用於CU之每一TU的視訊區塊,視訊編碼器20可重建構CU之視訊區塊。
在重建構模組112重建構CU之視訊區塊之後,濾波器模組113可執行解區塊操作以減少與CU相關聯之視訊區塊中的區塊假影。在執行一或多個解區塊操作之後,濾波器模組113可將CU之經重建構視訊區塊儲存於經解碼圖片緩衝器114中。運動估計模組122及運動補償模組124可使用含有經重建構視訊區塊之參考圖片來對後續圖片之PU執行框間預測。另外,框內預測模組126可使用經解碼圖片緩衝器114中之經重建構視訊區塊來對與CU在同一圖片中之其他PU執行框內預測。
熵編碼模組116可自視訊編碼器20之其他功能組件接收資料。舉例而言,熵編碼模組116可自量化模組106接收變換係數區塊且可自預測模組100接收語法元素。當熵編碼模組116接收資料時,熵編碼模組116可執行一或多個熵編碼操作以產生經熵編碼資料。舉例而言,視訊編碼器20可對資料執行上下文自適應性可變長度寫碼(CAVLC)操作、CABAC操作、可變-可變(V2V)長度寫碼操作、基於語法之上下文自適應性二進位算術寫碼(SBAC)操作、機率區間分割熵(PIPE)寫碼操作,或另一類型之熵編碼操作。熵編碼模組116可輸出包括經熵編碼資料之位元串流。
作為對資料執行熵編碼操作之部分,熵編碼模組116可選擇上下文模型。若熵編碼模組116正在執行CABAC操作,則上下文模型可指示特定分格(bin)具有特定值之機率 的估計。在CABAC之內容脈絡中,術語「分格」用以指代語法元素之二進位版本的位元。
圖3係說明經組態以實施本發明之技術之實例視訊解碼器30的方塊圖。圖3係出於解釋之目的而提供且不限制本發明中寬泛地例證及描述之技術。出於解釋之目的,本發明在HEVC寫碼之內容脈絡中描述視訊解碼器30。然而,本發明之技術可應用於其他寫碼標準或方法。
在圖3之實例中,視訊解碼器30包括複數個功能組件。視訊解碼器30之功能組件包括熵解碼模組150、預測模組152、反量化模組154、反變換模組156、重建構模組158、濾波器模組159及經解碼圖片緩衝器160。預測模組152包括運動補償模組162及框內預測模組164。在一些實例中,視訊解碼器30可執行解碼遍次,該解碼遍次大體上與關於圖2之視訊編碼器20所描述之編碼遍次互逆。在其他實例中,視訊解碼器30可包括更多、更少或不同功能組件。
視訊解碼器30可接收包含經編碼視訊資料之位元串流。位元串流可包括複數個語法元素。當視訊解碼器30接收位元串流時,熵解碼模組150可對位元串流執行剖析操作。作為對位元串流執行剖析操作之結果,熵解碼模組150可自位元串流提取語法元素。作為執行剖析操作之部分,熵解碼模組150可熵解碼位元串流中之經熵編碼語法元素。預測模組152、反量化模組154、反變換模組156、重建構模組158及濾波器模組159可基於自位元串流提取之語法元素執行產生經解碼視訊資料之重建構操作。
如上文所論述,位元串流可包含一系列NAL單元。位元串流之NAL單元可包括序列參數集NAL單元、圖片參數集NAL單元、SEI NAL單元等等。作為對位元串流執行剖析操作之部分,熵解碼模組150可執行剖析操作,剖析操作提取及熵解碼來自序列參數集NAL單元之序列參數集、來自圖片參數集NAL單元之圖片參數集、來自SEI NAL單元之SEI資料等等。
另外,位元串流之NAL單元可包括經寫碼切片NAL單元。作為對位元串流執行剖析操作之部分,熵解碼模組150可執行剖析操作,剖析操作提取及熵解碼來自經寫碼切片NAL單元之經寫碼切片。經寫碼切片中之每一者可包括切片標頭及切片資料。切片標頭可含有關於切片之語法元素。切片標頭中之語法元素可包括識別與含有切片之圖片相關聯的圖片參數集之語法元素。熵解碼模組150可對經寫碼切片標頭中之語法元素執行熵解碼操作(諸如CABAC解碼操作)以恢復切片標頭。
作為提取來自經寫碼切片NAL單元之切片資料之部分,熵解碼模組150可執行剖析操作,剖析操作提取來自切片資料中之經寫碼CU的語法元素。經提取語法元素可包括與變換係數區塊相關聯之語法元素。熵解碼模組150可接著對語法元素中之一些執行CABAC解碼操作。
在熵解碼模組150對非分割CU執行剖析操作之後,視訊解碼器30可對非分割CU執行重建構操作。為了對非分割CU執行重建構操作,視訊解碼器30可對CU之每一TU執行 重建構操作。藉由針對CU之每一TU執行重建構操作,視訊解碼器30可重建構與CU相關聯之殘餘視訊區塊。
作為對TU執行重建構操作之部分,反量化模組154可反量化(亦即,解量化)與TU相關聯之變換係數區塊。反量化模組154可以類似於針對HEVC提議或由ITU-T H.264寫碼標準定義之反量化程序的方式反量化變換係數區塊。反量化模組154可使用由視訊編碼器20針對變換係數區塊之CU計算的量化參數QP來判定量化程度,且同樣判定供反量化模組154應用之反量化程度。
在反量化模組154反量化變換係數區塊之後,反變換模組156可產生用於與變換係數區塊相關聯之TU的殘餘視訊區塊。反變換模組156可將反變換應用於變換係數區塊以便產生用於TU之殘餘視訊區塊。舉例而言,反變換模組156可將反DCT、反整數變換、反卡忽南-拉維變換(KLT)、反旋轉變換、反定向變換,或另一反變換應用於變換係數區塊。
在一些實例中,反變換模組156可基於來自視訊編碼器20之傳訊判定待應用於變換係數區塊之反變換。在此等實例中,反變換模組156可基於在與變換係數區塊相關聯之樹型區塊的四分樹之根節點處所傳訊變換來判定反變換。在其他實例中,反變換模組156可自一或多個寫碼特性(諸如區塊大小、寫碼模式或其類似者)推斷反變換。在一些實例中,反變換模組156可應用級聯反變換。
若CU之PU係使用框間預測而編碼,則運動補償模組162 可產生用於PU之候選者清單。位元串流可包括識別選定候選者在PU之候選者清單中的位置的資料。在產生用於PU之候選者清單之後,運動補償模組162可基於由PU之運動資訊指示的一或多個參考區塊產生用於PU之預測性視訊區塊。PU之參考區塊可在與該PU不同之時間圖片中。運動補償模組162可基於由PU之候選者清單中的選定候選者指示之運動資訊判定PU之運動資訊。
在一些實例中,運動補償模組162可藉由基於內插濾波器執行內插來改進PU之預測性視訊區塊。待用於具有子樣本精度的運動補償之內插濾波器的識別符可包括於語法元素中。運動補償模組162可在PU之預測性視訊區塊的產生期間使用由視訊編碼器20使用之相同內插濾波器,以計算用於參考區塊之子整數樣本的內插值。運動補償模組162可根據所接收語法資訊來判定由視訊編碼器20使用之內插濾波器,且使用該等內插濾波器來產生經預測視訊區塊。
若PU係使用框內預測編碼,則框內預測模組164可執行框內預測以產生用於PU之預測性視訊區塊。舉例而言,框內預測模組164可基於位元串流中之語法元素判定用於PU之框內預測模式。位元串流可包括框內預測模組164可用以判定PU之框內預測模式之語法元素。
在一些例子中,語法元素可指示框內預測模組164將使用另一PU之框內預測模式來判定當前PU之框內預測模式。舉例而言,當前PU之框內預測模式可能與相鄰PU之框內預測模式相同。換言之,相鄰PU之框內預測模式可為 用於當前PU之最可能模式。因此,在此實例中,位元串流可包括指示PU之框內預測模式與相鄰PU之框內預測模式相同的小語法元素。框內預測模組164可接著基於空間相鄰PU之視訊區塊而使用框內預測模式產生用於PU之預測資料(例如,預測性樣本)。
重建構模組158可在適用時使用與CU之TU相關聯的殘餘視訊區塊及CU之PU的預測性視訊區塊(亦即,框內預測資料或框間預測資料)以重建構CU之視訊區塊。因此,視訊解碼器30可基於位元串流中之語法元素產生預測性視訊區塊及殘餘視訊區塊,且可基於預測性視訊區塊及殘餘視訊區塊產生視訊區塊。
在重建構模組158重建構CU之視訊區塊之後,濾波器模組159可執行一或多個濾波操作以改良總寫碼品質。由濾波器模組159執行之濾波操作的實例可包括解區塊濾波操作、樣本自適應性偏移濾波操作及自適應性迴路濾波操作中之一或多者。在濾波器模組159執行濾波操作之後,視訊解碼器30可將CU之視訊區塊儲存於經解碼圖片緩衝器160中。經解碼圖片緩衝器160可提供參考圖片以用於後續運動補償、框內預測及呈現於顯示器件(諸如圖1之顯示器件32)上。舉例而言,視訊解碼器30可基於經解碼圖片緩衝器160中之視訊區塊對其他CU之PU執行框內預測或框間預測操作。
圖4係說明框間預測模組121之實例組態的概念圖。框間預測模組121可根據多個分割模式將當前CU分割為PU。舉 例而言,框間預測模組121可根據2N×2N、2N×N、N×2N及N×N分割模式將當前CU分割為PU。
框間預測模組121可對PU中之每一者執行整數運動估計(IME)且接著執行分數運動估計(FME)。當框間預測模組121對PU執行IME時,框間預測模組121可在一或多個參考圖片中搜尋用於PU之參考區塊。在找到用於PU之參考區塊之後,框間預測模組121可產生以整數精度指示PU與用於PU之參考區塊之間的空間位移之運動向量。當框間預測模組121對PU執行FME時,框間預測模組121可改進藉由對PU執行IME而產生之運動向量。藉由對PU執行FME而產生之運動向量可具有子整數精度(例如,½像素精度、¼像素精度等)。在產生用於PU之運動向量之後,框間預測模組121可使用用於PU之運動向量以產生用於PU之預測性視訊區塊。
在框間預測模組121使用AMVP模式傳訊PU之運動資訊的一些實例中,框間預測模組121可產生用於PU之候選者清單。候選者清單可包括一或多個原始候選者及自原始候選者導出之一或多個額外候選者。在產生用於PU之候選者清單之後,框間預測模組121可自候選者清單選擇候選者且產生用於PU之運動向量差(MVD)。用於PU之MVD可指示由選定候選者指示之運動向量與使用IME及FME針對PU產生之運動向量之間的差。在此等實例中,框間預測模組121可輸出識別選定候選者在候選者清單中之位置的候選者索引。框間預測模組121亦可輸出PU之MVD。下文詳細 描述之圖6說明實例AMVP操作。
除了藉由對PU執行IME及FME來產生用於PU之運動資訊之外,框間預測模組121亦可對PU中之每一者執行合併操作。當框間預測模組121對PU執行合併操作時,框間預測模組121可產生用於PU之候選者清單。用於PU之候選者清單可包括一或多個原始候選者及自原始候選者導出之一或多個額外候選者。候選者清單中之原始候選者可包括一或多個空間候選者及一時間候選者。空間候選者可指示當前圖片中之其他PU的運動資訊。時間候選者可基於不同於當前圖片之圖片的設在同一位置的PU之運動資訊。時間候選者亦可稱作時間運動向量預測子(TMVP)。
在產生候選者清單之後,框間預測模組121可自候選者清單選擇候選者中之一者。框間預測模組121可(例如)自候選者清單選擇候選者以達成所要經重建構視訊品質及/或壓縮。框間預測模組121可接著基於由PU之運動資訊指示的參考區塊產生用於PU之預測性視訊區塊。在合併模式中,PU之運動資訊可與由選定候選者指示之運動資訊相同。下文描述之圖5係說明實例合併操作之流程圖。
在基於IME及FME產生用於PU之預測性視訊區塊之後及在基於合併操作產生用於PU之預測性視訊區塊之後,框間預測模組121可選擇藉由FME操作產生之預測性視訊區塊或藉由合併操作產生之預測性視訊區塊。在一些實例中,框間預測模組121可基於藉由FME操作產生之預測性視訊區塊及藉由合併操作產生之預測性視訊區塊的位元率/失 真分析來選擇用於PU之預測性視訊區塊。
在框間預測模組121已選擇藉由根據分割模式中之每一者分割當前CU而產生之PU的預測性視訊區塊之後,框間預測模組121可選擇用於當前CU之分割模式。在一些實例中,框間預測模組121可基於藉由根據分割模式中之每一者分割當前CU而產生之PU的選定預測性視訊區塊之位元率/失真分析來選擇用於當前CU之分割模式。框間預測模組121可將與屬於選定分割模式之PU相關聯的預測性視訊區塊輸出至殘餘產生模組102。框間預測模組121可將指示屬於選定分割模式之PU的運動資訊之語法元素輸出至熵編碼模組116。
在圖4之實例中,框間預測模組121包括IME模組180A至180N(統稱為「IME模組180」)、FME模組182A至182N(統稱為「FME模組182」)、合併模組184A至184N(統稱為「合併模組184」)、PU模式決策模組186A至186N(統稱為「PU模式決策模組186」)及CU模式決策模組188。
IME模組180、FME模組182及合併模組184可對當前CU之PU執行IME操作、FME操作及合併操作。圖4之實例將框間預測模組121說明為包括用於CU之每一分割模式之每一PU的單獨IME模組180、FME模組182及合併模組184。在其他實例中,框間預測模組121不包括用於CU之每一分割模式之每一PU的單獨IME模組180、FME模組182及合併模組184。
如圖4之實例中說明,IME模組180A、FME模組182A及 合併模組184A可對藉由根據2N×2N分割模式分割CU而產生之PU執行IME操作、FME操作及合併操作。PU模式決策模組186A可選擇由IME模組180A、FME模組182A及合併模組184A產生之預測性視訊區塊中之一者。
IME模組180B、FME模組182B及合併模組184B可對藉由根據N×2N分割模式分割CU而產生之左PU執行IME操作、FME操作及合併操作。PU模式決策模組186B可選擇由IME模組180B、FME模組182B及合併模組184B產生之預測性視訊區塊中之一者。
IME模組180C、FME模組182C及合併模組184C可對藉由根據N×2N分割模式分割CU而產生之右PU執行IME操作、FME操作及合併操作。PU模式決策模組186C可選擇由IME模組180C、FME模組182C及合併模組184C產生之預測性視訊區塊中之一者。
IME模組180N、FME模組182N及合併模組184可對藉由根據N×N分割模式分割CU而產生之右下PU執行IME操作、FME操作及合併操作。PU模式決策模組186N可選擇由IME模組180N、FME模組182N及合併模組184N產生之預測性視訊區塊中之一者。
PU模式決策模組186可經組態以選擇產生所要經重建構視訊品質及/或所要壓縮比之預測性視訊區塊。PU模式決策模組可(例如)基於多個可能預測性視訊區塊之位元率-失真分析選擇預測性視訊區塊,且選擇針對給定寫碼情形提供最佳位元率-失真取捨的預測性視訊區塊。作為一實 例,對於頻寬受限之應用,PU模式決策模組186可偏向選擇增加壓縮比之預測性視訊區塊,而對於其他應用,PU模式決策模組186可偏向選擇增加經重建構視訊品質之預測性視訊區塊。在PU模式決策模組186選擇用於當前CU之PU的預測性視訊區塊之後,CU模式決策模組188選擇用於當前CU之分割模式且輸出屬於選定分割模式之PU的預測性視訊區塊及運動資訊。
圖5係說明實例合併操作200之流程圖。視訊編碼器(諸如視訊編碼器20)可執行合併操作200。在其他實例中,視訊編碼器可執行不同於合併操作200之合併操作。舉例而言,在其他實例中,視訊編碼器可執行合併操作,其中視訊編碼器執行比合併操作200多、少之步驟或與合併操作200不同之步驟。在其他實例中,視訊編碼器可以不同次序或並行地執行合併操作200之步驟。編碼器亦可對以跳躍模式編碼之PU執行合併操作200。
在視訊編碼器開始合併操作200之後,視訊編碼器可產生用於當前PU之候選者清單(202)。視訊編碼器可以各種方式產生用於當前PU之候選者清單。舉例而言,視訊編碼器可根據下文關於圖8至圖13B描述之實例技術中之一者產生用於當前PU之候選者清單。
如上文簡短地論述,用於當前PU之候選者清單可包括時間候選者。時間候選者可指示設在同一位置的PU之運動資訊。設在同一位置的PU可在空間上與當前PU設在同一位置,但在參考圖片而非當前圖片中。本發明可將包括設 在同一位置的PU之參考圖片稱作相關參考圖片。本發明可將相關參考圖片之參考圖片索引稱作相關參考圖片索引。如上文所描述,當前圖片可與一或多個參考圖片清單(例如,清單0、清單1等)相關聯。參考圖片索引可藉由指示在參考圖片清單之一者中參考圖片之位置來指示參考圖片。在一些實例中,當前圖片可與組合參考圖片清單相關聯。
在一些習知視訊編碼器中,相關參考圖片索引為涵蓋與當前PU相關聯之參考索引源位置的PU之參考圖片索引。在此等習知視訊編碼器中,與當前PU相關聯之參考索引源位置緊接於當前PU左方或緊接於當前PU上方。在本發明中,若與PU相關聯之視訊區塊包括特定位置,則PU可「涵蓋」該特定位置。在此等習知視訊編碼器中,若參考索引源位置不可用,則視訊編碼器可使用零之參考圖片索引。
然而,可存在以下例子:與當前PU相關聯之參考索引源位置在當前CU內。在此等例子中,若PU在當前CU上方或左方,則涵蓋與當前PU相關聯之參考索引源位置的PU可被視為可用。然而,視訊編碼器可需要存取當前CU之另一PU的運動資訊以便判定含有設在同一位置的PU之參考圖片。因此,此等視訊編碼器可使用屬於當前CU之PU的運動資訊(亦即,參考圖片索引)以產生用於當前PU之時間候選者。換言之,此等視訊編碼器可使用屬於當前CU之PU的運動資訊產生時間候選者。因此,視訊編碼器可能 不能並行地產生用於當前PU及涵蓋與當前PU相關聯之參考索引源位置的PU之候選者清單。
根據本發明之技術,視訊編碼器可在不參考任何其他PU之參考圖片索引的情況下明確地設定相關參考圖片索引。此可使得視訊編碼器能夠並行地產生用於當前PU及當前CU之其他PU的候選者清單。因為視訊編碼器明確地設定相關參考圖片索引,所以相關參考圖片索引不基於當前CU之任何其他PU的運動資訊。在視訊編碼器明確地設定相關參考圖片索引之一些實例中,視訊編碼器可始終將相關參考圖片索引設定為固定的預定義預設參考圖片索引(諸如0)。以此方式,視訊編碼器可基於由預設參考圖片索引指示之參考圖框中的設在同一位置的PU之運動資訊產生時間候選者,且可將時間候選者包括於當前CU之候選者清單中。
在視訊編碼器明確地設定相關參考圖片索引之實例中,視訊編碼器可明確地在語法結構(諸如圖片標頭、切片標頭、APS或另一語法結構)中傳訊相關參考圖片索引。在此實例中,視訊編碼器可傳訊用於每一LCU、CU、PU、TU或其他類型之子區塊的相關參考圖片索引。舉例而言,視訊編碼器可傳訊:用於CU之每一PU的相關參考圖片索引等於「1」。
在一些實例(諸如下文參看圖9A至圖9F及圖10A至圖10F描述的實例)中,相關參考圖片索引可經隱含地而非明確地設定。在此等實例中,視訊編碼器可使用由涵蓋當前 CU外部之位置的PU之參考圖片索引指示的參考圖片中之PU的運動資訊產生用於當前CU之PU的候選者清單中之每一時間候選者,即使此等位置並不嚴格地鄰近當前PU亦然。
在產生用於當前PU之候選者清單之後,視訊編碼器可產生與候選者清單中之候選者相關聯的預測性視訊區塊(204)。視訊編碼器可藉由基於所指示候選者之運動資訊判定當前PU之運動資訊及接著基於由當前PU之運動資訊指示的一或多個參考區塊產生預測性視訊區塊來產生與候選者相關聯之預測性視訊區塊。視訊編碼器可接著自候選者清單選擇候選者中之一者(206)。視訊編碼器可以各種方式選擇候選者。舉例而言,視訊編碼器可基於對與候選者相關聯之預測性視訊區塊之每一者的位元率/失真分析來選擇候選者中之一者。
在選擇候選者之後,視訊編碼器可輸出候選者索引(208)。候選者索引可指示在候選者清單中選定候選者的位置。在一些實例中,候選者索引可表示為「merge_idx」。
圖6係說明實例AMVP操作210之流程圖。視訊編碼器(諸如視訊編碼器20)可執行AMVP操作210。圖6僅為AMVP操作之一實例。
在視訊編碼器開始AMVP操作210之後,視訊編碼器可產生用於當前PU之一或多個運動向量(211)。視訊編碼器可執行整數運動估計及分數運動估計以產生用於當前PU之運動向量。如上文所描述,當前圖片可與兩個參考圖片清單 (清單0及清單1)相關聯。若當前PU經單向預測,則視訊編碼器可產生用於當前PU之清單0運動向量或清單1運動向量。清單0運動向量可指示當前PU之視訊區塊與清單0中之參考圖片中之參考區塊之間的空間位移。清單1運動向量可指示當前PU之視訊區塊與清單1中之參考圖片中之參考區塊之間的空間位移。若當前PU經雙向預測,則視訊編碼器可產生用於當前PU之清單0運動向量及清單1運動向量。
在產生用於當前PU之一或多個運動向量之後,視訊編碼器可產生用於當前PU之預測性視訊區塊(212)。視訊編碼器可基於由用於當前PU之一或多個運動向量指示的一或多個參考區塊產生用於當前PU之預測性視訊區塊。
另外,視訊編碼器可產生用於當前PU之候選者清單(213)。視訊寫碼器可以各種方式產生用於當前PU之候選者清單。舉例而言,視訊編碼器可根據下文關於圖8至圖13B描述之實例技術中之一或多者產生用於當前PU之候選者清單。在一些實例中,當視訊編碼器在AMVP操作210中產生候選者清單時,候選者清單可限於兩個候選者。相比之下,當視訊編碼器在合併操作中產生候選者清單時,候選者清單可包括更多候選者(例如,五個候選者)。
在產生用於當前PU之候選者清單之後,視訊編碼器可產生用於候選者清單中之每一候選者的一或多個運動向量差(MVD)(214)。視訊編碼器可藉由判定由候選者指示之運動向量與當前PU之對應運動向量之間的差來產生用於候選者之運動向量差。
若當前PU經單向預測,則視訊編碼器可產生用於每一候選者之單一MVD。若當前PU經雙向預測,則視訊編碼器可產生用於每一候選者之兩個MVD。第一MVD可指示候選者之運動向量與當前PU之清單0運動向量之間的差。第二MVD可指示候選者之運動向量與當前PU之清單1運動向量之間的差。
視訊編碼器可自候選者清單選擇候選者中之一或多者(215)。視訊編碼器可以各種方式選擇一或多個候選者。舉例而言,視訊編碼器可選擇具有最緊密地匹配待編碼之運動向量之相關聯運動向量的候選者,此可減少表示用於候選者之運動向量差所需之位元數目。
在選擇一或多個候選者之後,視訊編碼器可輸出用於當前PU之一或多個參考圖片索引、一或多個候選者索引,及用於一或多個選定候選者之一或多個運動向量差(216)。
在當前圖片與兩個參考圖片清單(清單0及清單1)相關聯,且當前PU經單向預測之例子中,視訊編碼器可輸出用於清單0之參考圖片索引(「ref_idx_l0」)或用於清單1之參考圖片索引(「ref_idx_l1」)。視訊編碼器亦可輸出指示用於當前PU之清單0運動向量之選定候選者在候選者清單中之位置的候選者索引(「mvp_l0_flag」)。或者,視訊編碼器可輸出指示用於當前PU之清單1運動向量之選定候選者在候選者清單中之位置的候選者索引(「mvp_l1_flag」)。視訊編碼器亦可輸出用於當前PU之清單0運動向量或清單1運動向量之MVD。
在當前圖片與兩個參考圖片清單(清單0及清單1)相關聯,且當前PU經雙向預測之例子中,視訊編碼器可輸出用於清單0之參考圖片索引(「ref_idx_l0」)及用於清單1之參考圖片索引(「ref_idx_l1」)。視訊編碼器亦可輸出指示用於當前PU之清單0運動向量之選定候選者在候選者清單中之位置的候選者索引(「mvp_l0_flag」)。另外,視訊編碼器可輸出指示用於當前PU之清單1運動向量之選定候選者在候選者清單中之位置的候選者索引(「mvp_l1_flag」)。視訊編碼器亦可輸出用於當前PU之清單0運動向量的MVD及用於當前PU之清單1運動向量的MVD。
圖7係說明由視訊解碼器(諸如視訊解碼器30)執行之實例運動補償操作220之流程圖。圖7僅為一實例運動補償操作。
當視訊解碼器執行運動補償操作220時,視訊解碼器可接收用於當前PU之選定候選者的指示(222)。舉例而言,視訊解碼器可接收指示選定候選者在當前PU之候選者清單內的位置之候選者索引。
若當前PU之運動資訊係使用AMVP模式編碼且當前PU經雙向預測,則視訊解碼器可接收第一候選者索引及第二候選者索引。第一候選者索引指示用於當前PU之清單0運動向量之選定候選者在候選者清單中的位置。第二候選者索引指示用於當前PU之清單1運動向量之選定候選者在候選者清單中的位置。在一些實例中,單一語法元素可用以識別兩個候選者索引。
另外,視訊解碼器可產生用於當前PU之候選者清單(224)。視訊解碼器可以各種方式產生用於當前PU之此候選者清單。舉例而言,視訊解碼器可使用下文參看圖8至圖15描述之技術來產生用於當前PU之候選者清單。當視訊解碼器產生用於候選者清單之時間候選者時,視訊解碼器可明確地或隱含地設定識別包括設在同一位置的PU之參考圖片的參考圖片索引,如上文關於圖5所描述。
在產生用於當前PU之候選者清單之後,視訊解碼器可基於由用於當前PU之候選者清單中的一或多個選定候選者指示之運動資訊判定當前PU之運動資訊(225)。舉例而言,若當前PU之運動資訊係使用合併模式而編碼,則當前PU之運動資訊可與由選定候選者指示之運動資訊相同。若當前PU之運動資訊係使用AMVP模式而編碼,則視訊解碼器可使用由該或該等選定候選者指示之一或多個運動向量及位元串流中指示之一或多個MVD來重建構當前PU之一或多個運動向量。當前PU之(該或該等)參考圖片索引及(該或該等)預測方向指示符可與該一或多個選定候選者之(該或該等)參考圖片索引及(該或該等)預測方向指示符相同。在判定當前PU之運動資訊之後,視訊解碼器可基於由當前PU之運動資訊指示的一或多個參考區塊產生用於當前PU之預測性視訊區塊(226)。
相對於當前視訊區塊之位置(在AMVP中,加上MVD)使用相鄰區塊之運動資訊。換言之,相鄰區塊之MV指代相對於相鄰區塊之運動。當前區塊之MV指代相對於當前區 塊之運動。因此若當前區塊採用相鄰區塊運動資訊,則所採用MV定義相對於當前區塊(而非所採用之MV所源於的相鄰區塊)之運動。
圖8係說明CU 250及與CU 250相關聯之實例候選者位置252A至252E的概念圖。本發明可將候選者位置252A至252E統稱為候選者位置252。候選者位置252表示與CU 250在同一圖片中之空間候選者。候選者位置252A定位於CU 250左方。候選者位置252B定位於CU 250上方。候選者位置252C定位於CU 250右上方。候選者位置252D定位於CU 250左下方。候選者位置252E定位於CU 250左上方。圖8將用以提供框間預測模組121及運動補償模組162可產生候選者清單之方式的實例。下文將參考框間預測模組121解釋實例,但應理解運動補償模組162可實施相同技術,且因此產生相同候選者清單。
圖9係說明用於根據本發明之技術重建構候選者清單之實例方法的流程圖。將參考包括五個候選者之清單描述圖9之技術,但本文中所描述之技術亦可與具有其他大小之清單一起使用。五個候選者可各自具有合併索引(例如,0至4)。將參考一般視訊寫碼器描述圖9之技術。一般視訊寫碼器可(例如)為視訊編碼器(諸如視訊編碼器20)或視訊解碼器(諸如視訊解碼器30)。
為了根據圖9之實例重建構候選者清單,視訊寫碼器首先考慮四個空間候選者(902)。四個空間候選者可(例如)包括候選者位置252A、252B、252C及252D。四個空間候選 者對應於與當前CU(例如,CU 250)在同一圖片中之四個PU的運動資訊。視訊寫碼器可以特定次序考慮清單中之四個空間候選者。舉例而言,候選者位置252A可被第一個考慮。若候選者位置252A可用,則候選者位置252A可指派至合併索引0。若候選者位置252A不可用,則視訊寫碼器可不將候選者位置252A包括於候選者清單中。候選者位置可出於各種理由而不可用。舉例而言,若候選者位置不在當前圖片內,則候選者位置可能不可用。在另一實例中,若候選者位置經框內預測,則候選者位置可能不可用。在另一實例中,若候選者位置在與當前CU不同之切片中,則候選者位置可能不可用。
在考慮候選者位置252A之後,視訊寫碼器可接下來考慮候選者位置252B。若候選者位置252B可用且不同於候選者位置252A,則視訊寫碼器可將候選者位置252B添加至候選者清單。在此特定上下文中,術語「相同」及「不同」指代與候選者位置相關聯之運動資訊。因此,若兩個候選者位置具有相同運動資訊則被視為相同,且若其具有不同運動資訊則被視為不同。若候選者位置252A不可用,則視訊寫碼器可將候選者位置252B指派至合併索引0。若候選者位置252A可用,則視訊寫碼器可將候選者位置252指派至合併索引1。若候選者位置252B不可用抑或與候選者位置252A相同,則視訊寫碼器跳過候選者位置252B且不將其包括於候選者清單中。
候選者位置252C由視訊寫碼器類似地考慮以供包括於清 單中。若候選者位置252C可用且不與候選者位置252B及252A相同,則視訊寫碼器將候選者位置252C指派至下一可用合併索引。若候選者位置252C不可用抑或並非不同於候選者位置252A及252B中之至少一者,則視訊寫碼器不將候選者位置252C包括於候選者清單中。接下來,視訊寫碼器考慮候選者位置252D。若候選者位置252D可用且不與候選者位置252A、252B及252C相同,則視訊寫碼器將候選者位置252D指派至下一可用合併索引。若候選者位置252D不可用抑或並非不同於候選者位置252A、252B及252C中之至少一者,則視訊寫碼器不將候選者位置252D包括於候選者清單中。儘管以上實例大體上描述個別地考慮候選者252A至252D以供包括於候選者清單中,但在一些實施中,可首先將所有候選者252A至252D添加至候選者清單,稍後自候選者清單移除重複。
在視訊寫碼器考慮前四個空間候選者之後,候選者清單可包括四個空間候選者或清單可包括少於四個空間候選者。若清單包括四個空間候選者(904,是),則視訊寫碼器考慮時間候選者(906)。時間候選者可對應於不同於當前圖片之圖片的設在同一位置的PU之運動資訊。若時間候選者可用且不同於前四個空間候選者,則視訊寫碼器將時間候選者指派至合併索引4。若時間候選者不可用抑或與前四個空間候選者中之一者相同,則視訊寫碼器不將該時間候選者包括於候選者清單中。因此,在視訊寫碼器考慮時間候選者(906)之後,候選者清單可包括五個候選者(區塊902 處考慮之前四個空間候選者及區塊904處考慮之時間候選者)抑或可包括四個候選者(區塊902處考慮之前四個空間候選者)。若候選者清單包括五個候選者(908,是),則視訊寫碼器完成建構清單。
若候選者清單包括四個候選者(908,否),則視訊寫碼器可考慮第五空間候選者(910)。第五空間候選者可(例如)對應於候選者位置252E。若位置252E處之候選者可用且不同於位置252A、252B、252C及252D處之候選者,則視訊寫碼器可將第五空間候選者添加至候選者清單,第五空間候選者經指派至合併索引4。若位置252E處之候選者不可用抑或並非不同於候選者位置252A、252B、252C及252D處之候選者,則視訊寫碼器可不將位置252處之候選者包括於候選者清單中。因此在考慮第五空間候選者(910)之後,清單可包括五個候選者(區塊902處考慮之前四個空間候選者及區塊910處考慮之第五空間候選者)或可包括四個候選者(區塊902處考慮之前四個空間候選者)。
若候選者清單包括五個候選者(912,是),則視訊寫碼器完成產生候選者清單。若候選者清單包括四個候選者(912,否),則視訊寫碼器添加人工產生之候選者(914)直至清單包括五個候選者(916,是)為止。
若在視訊寫碼器考慮前四個空間候選者之後,清單包括少於四個空間候選者(904,否),則視訊寫碼器可考慮第五空間候選者(918)。第五空間候選者可(例如)對應於候選者位置252E。若位置252E處之候選者可用且不同於已包括於 候選者清單中之候選者,則視訊寫碼器可將第五空間候選者添加至候選者清單,第五空間候選者經指派至下一可用合併索引。若位置252E處之候選者不可用抑或並非不同於已包括於候選者清單中的候選者中之一者,則視訊寫碼器可不將位置252E處之候選者包括於候選者清單中。視訊寫碼器可接著考慮時間候選者(920)。若時間候選者可用且不同於已包括於候選者清單中之候選者,則視訊寫碼器可將該時間候選者添加至候選者清單,該時間候選者經指派至下一可用合併索引。若時間候選者不可用抑或並非不同於已包括於候選者清單中的候選者中之一者,則視訊寫碼器可不將該時間候選者包括於候選者清單中。
若在考慮第五空間候選者(區塊918)及時間候選者(區塊920)之後,候選者清單包括五個候選者(922,是),則視訊寫碼器完成產生候選者清單。若候選者清單包括少於五個候選者(922,否),則視訊寫碼器添加人工產生之候選者(914)直至清單包括五個候選者(916,是)為止。
根據本發明之技術,可在空間候選者及時間候選者之後人工產生額外合併候選者以使合併候選者清單之大小固定為合併候選者之指定數目(諸如上文圖9之實例中的五)。額外合併候選者可包括(例如)經組合雙向預測性合併候選者(候選者1)、經縮放雙向預測性合併候選者(候選者2),及零向量合併/AMVP候選者(候選者3)。
圖10展示經組合合併候選者之實例。經組合雙向預測性合併候選者可藉由組合原始合併候選者而產生。詳言之, 原始候選者中之兩個候選者(其具有mvL0及refIdxL0或mvL1及refIdxL1)可用以產生雙向預測性合併候選者。圖10展示經組合雙向預測性合併候選者之實例。在圖10中,兩個候選者包括於原始合併候選者清單中。一候選者之預測類型為清單0單向預測,且另一候選者之預測類型為清單1單向預測。在此實例中,mvL0_A及ref0係自清單0拾取,且mvL1_B及ref0係自清單1拾取,且接著雙向預測性合併候選者(其具有清單0中之mvL0_A及ref0以及清單1中之mvL1_B及ref0)可經產生及檢查其是否不同於已包括於候選者清單中之候選者。若其不同,則視訊寫碼器可將雙向預測性合併候選者包括於候選者清單中。
圖11展示經縮放合併候選者之實例。經縮放雙向預測性合併候選者可藉由縮放原始合併候選者而產生。詳言之,來自原始候選者之一候選者(其可具有mvLX及refIdxLX)可用以產生雙向預測性合併候選者。圖11展示經縮放雙向預測性合併候選者之實例。在圖11之實例中,兩個候選者包括於原始合併候選者清單中。一候選者之預測類型為清單0單向預測,且另一候選者之預測類型為清單1單向預測。在此實例中,mvL0_A及ref0可自清單0拾取,且ref0可複製至清單1中之參考索引ref0'。接著,可藉由縮放具有ref0及ref0'的mvL0_A而計算mvL0'_A。縮放可取決於POC距離。接著,雙向預測性合併候選者(其具有清單0中之mvL0_A及ref0以及清單1中之mvL0'_A及ref0')可經產生及檢查其是否為重複的。若其並非重複的,則可將其添加至 合併候選者清單。
圖12展示零向量合併候選者之實例。零向量合併候選者可藉由組合零向量與可經參考之參考索引而產生。圖12展示零向量合併候選者之實例。若零向量候選者並非重複的,則可將其添加至合併候選者清單。對於每一產生之合併候選者,運動資訊可與清單中之前一候選者的運動資訊比較。在一實例中,若新產生之候選者不同於已包括於候選者清單中之候選者,則將所產生之候選者添加至合併候選者清單。判定候選者是否不同於已包括於候選者清單中之候選者的此程序有時稱作修剪。藉由修剪,每一新產生之候選者可與清單中之現有候選者比較,此可具有高計算成本。在一些例子中,修剪操作可包括比較一或多個新候選者與已在候選者清單中之候選者及不添加為已在候選者清單中之候選者之重複的新候選者。在其他例子中,修剪操作可包括將一或多個新候選者添加至候選者清單及稍後自該清單移除重複候選者。
與先前技術相比,在一些例子中,本發明之技術提供簡化及改良。在一些實例中,本發明之技術包括將修剪操作限於組合之雙向預測候選者,此意謂僅將經組合之雙向預測候選者與清單中之候選者作比較。在此實例中,即使運動資訊與清單中之一些相同,可能亦不比較或修剪所有其他候選者(諸如經縮放雙向預測性候選者、零候選者及mv_offset候選者)。本發明之技術可另外包括移除經縮放雙向預測候選者及不考慮將其包括於候選者清單中。
根據本發明之進一步技術,可添加新候選者(偏移候選者)且將其與零候選者整合以補償由上述簡化引起之任何可能效能損失。可藉由將一些偏移mv添加至現有合併候選者之運動向量而產生偏移候選者。可添加之偏移mv可包括(例如)(4,0)、(-4,0)、(0,4)及(0,-4)。此等偏移值可添加至另一運動向量以產生偏移候選者。亦可使用不同於所展示之偏移值的偏移值。
以下表1展示Mv_offset候選者之實例。作為表1中所展示之實例,前兩個候選者來自空間相鄰區塊及時間相鄰區塊。藉由使現有候選者偏移而產生最後三個候選者。
根據本發明之技術,用於產生mv_offset候選者之程序可包括以下步驟:
1.若現有合併候選者為單向預測候選者,則可藉由將偏移值添加至現有合併候選者之運動向量及複製參考索引來產生基於現有合併候選者的mv_offset候選者,如表1之合併候選者3所展示。
2.若現有合併候選者為雙向預測候選者,則可藉由以下操作來產生基於現有合併候選者的mv_offset候選者:
a.若L0及L1之兩個參考圖框來自當前圖框之同一側(向前或向後),則可藉由將偏移值添加至指向離當前圖框較遠的參考圖框之運動向量來產生mv_offset候選者。見,例如,圖13A。
b.若L0及L1之兩個參考圖框來自當前圖框之不同側,則可藉由將偏移值添加至來自一清單之mv及自來自另一清單之mv減去相同偏移值來產生mv_offset候選者。見,例如,圖13B。
圖13A展示根據以上步驟2(a)產生mv_offset候選者之圖形實例。在圖13A中,兩個參考圖框(在此實例中為N-3及N-2)在當前圖框之同一側。在圖13A中,兩個參考圖框相對於當前圖框向後,但相同技術可用於兩個參考圖框相對於當前圖框向前之例子。參考圖框N-2具有相關聯之運動向量mv1,且參考圖框N-3具有相關聯之運動向量mv2。為了產生人工候選者,將mv_offset添加至指向較遠參考圖框之運動向量,其在圖13A之實例中為參考圖框N-3之mv2。因此,在圖13A之實例中,人工產生之合併候選者為雙向預測候選者,其具有參考圖框N-2之運動資訊及自參考圖框N-3導出之運動資訊(mv2+mv_offset)。
圖13B展示根據以上步驟2(b)產生mv_offset候選者之圖形實例。在圖13B中,一參考圖框(N-1)相對於當前圖框向後,且一參考圖框(N+1)相對於當前圖框向前。參考圖框N-1具有相關聯之運動向量mv1,且參考圖框N+1具有相關聯之運動向量mv2。為了產生人工候選者,將mv_offset添 加至一參考圖框之運動向量且自另一參考圖框之運動向量減去mv_offset。因此,在圖13B之實例中,人工產生之合併候選者為雙向預測候選者,其具有自參考圖框N-1導出之運動資訊及自參考圖框N+1導出之運動資訊。
根據本發明之技術,零候選者可整合至偏移候選者中。在此技術中,可在偏移候選者之前視情況如下添加零候選者:
●若在空間相鄰區塊及時間相鄰區塊中未找到候選者,則在偏移候選者之前添加mv=(0,0)refidx=0。
●若在空間相鄰區塊及時間相鄰區塊中已找到候選者mv=(0,0)refidx=0,則在偏移候選者之前添加mv=(0,0)refidx=1。
根據本發明之額外技術,最後額外合併候選者可包括:
候選者1:組合之雙向預測候選者(具有修剪操作)
候選者2:與零整合之偏移候選者(無修剪操作)由於「候選者2」中之候選者不需要修剪,因此候選者1與2可並行地產生。
圖14係展示本發明中所描述之技術之實例的流程圖。圖14之技術可由視訊寫碼器(諸如視訊編碼器20或視訊解碼器30)執行。視訊解碼器可判定與當前視訊圖框之當前部分相關聯的空間候選者之集合(142)。空間候選者之集合可對應於鄰近當前部分之當前視訊圖框的相鄰部分。每一空間候選者具有相關聯之運動資訊。視訊寫碼器亦可判定與當前視訊圖框之當前部分相關聯的時間候選者(144)。時間 候選者對應於參考視訊圖框之一部分,且時間候選者具有相關聯之運動資訊。
基於空間候選者之集合的子集及時間候選者,視訊寫碼器可產生候選者清單(146)。回應於候選者清單包括之候選者少於最大數目,視訊寫碼器可將人工產生之候選者添加至候選者清單(148)。人工產生之候選者可具有與該子集之空間候選者或時間候選者之運動資訊相同的運動資訊。藉由將具有與已包括於清單中之候選者之運動資訊相同的運動資訊之人工產生之候選者包括於候選者清單中,寫碼器複雜性可減小。
空間候選者之集合可包括具有相同運動資訊之兩個或兩個以上空間候選者,而空間候選者之子集僅包括兩個或兩個以上空間候選者中之一者。因此,藉由移除或修剪空間候選者及包括更多獨特候選者,如藉由(例如)位元率-失真量度量測的視訊寫碼品質可得以改良。修剪空間候選者但不修剪人工產生之候選者的組合可給予提供優良視訊寫碼品質與低複雜性之所要折衷。
在一或多個實例中,所描述之功能可在硬體、軟體、韌體或其任何組合中實施。若在軟體中實施,則功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體而傳輸,且藉由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,通信媒體包括(例如)根據通信協定促進電腦程式自一處傳送至另一處的任何媒 體。以此方式,電腦可讀媒體大體上可對應於(1)非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於實施本發明中所描述之技術的任何可用媒體。電腦程式產品可包括電腦可讀媒體。
藉由實例而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體,或可用以儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取之任何其他媒體。又,任何連接適當地稱為電腦可讀媒體。舉例而言,若使用同軸電纜、光纖纜線、雙絞線、數位用戶線(DSL)或無線技術(諸如紅外線、無線電及微波)而自網站、伺服器或其他遠端源傳輸指令,則同軸電纜、光纖纜線、雙絞線、DSL或無線技術(諸如紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而是針對非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟性磁碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。以上各物之組合亦應包括於電腦可讀媒體之範疇內。
可由諸如一或多個數位信號處理器(DSP)、通用微處理 器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合或離散邏輯電路之一或多個處理器來執行指令。因此,如本文中所使用之術語「處理器」可指代上述結構或適合於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,可將本文中所描述之功能性提供於經組態以用於編碼及解碼之專用硬體及/或軟體模組內,或併入於組合式編碼解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
本發明之技術可在廣泛多種器件或裝置中實施,該等器件或裝置包括無線手機、積體電路(IC)或IC集合(例如,晶片集)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術的器件之功能態樣,但未必要求藉由不同硬體單元來實現。實情為,如上文所描述,可將各種單元組合於編碼解碼器硬體單元中,或藉由互操作性硬體單元(包括如上文所描述之一或多個處理器)之集合結合合適軟體及/或韌體來提供該等單元。
已描述各種實例。此等及其他實例在以下申請專利範圍之範疇內。
10‧‧‧視訊寫碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧通道
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧顯示器件
100‧‧‧預測模組
102‧‧‧殘餘產生模組
104‧‧‧變換模組
106‧‧‧量化模組
108‧‧‧反量化模組
110‧‧‧反變換模組
112‧‧‧重建構模組
113‧‧‧濾波器模組
114‧‧‧經解碼圖片緩衝器
116‧‧‧熵編碼模組
121‧‧‧框間預測模組
122‧‧‧運動估計模組
124‧‧‧運動補償模組
126‧‧‧框內預測模組
150‧‧‧熵解碼模組
152‧‧‧預測模組
154‧‧‧反量化模組
156‧‧‧反變換模組
158‧‧‧重建構模組
159‧‧‧濾波器模組
160‧‧‧經解碼圖片緩衝器
162‧‧‧運動補償模組
164‧‧‧框內預測模組
180A‧‧‧整數運動估計(IME)模組
180B‧‧‧整數運動估計(IME)模組
180C‧‧‧整數運動估計(IME)模組
180N‧‧‧整數運動估計(IME)模組
182A‧‧‧分數運動估計(FME)模組
182B‧‧‧分數運動估計(FME)模組
182C‧‧‧分數運動估計(FME)模組
182N‧‧‧分數運動估計(FME)模組
184A‧‧‧合併模組
184B‧‧‧合併模組
184C‧‧‧合併模組
184N‧‧‧合併模組
186A‧‧‧預測單元(PU)模式決策模組
186B‧‧‧預測單元(PU)模式決策模組
186C‧‧‧預測單元(PU)模式決策模組
186N‧‧‧預測單元(PU)模式決策模組
188‧‧‧寫碼單元(CU)模式決策模組
200‧‧‧合併操作
210‧‧‧進階運動向量預測(AMVP)操作
220‧‧‧運動補償操作
250‧‧‧寫碼單元(CU)
252A‧‧‧候選者位置
252B‧‧‧候選者位置
252C‧‧‧候選者位置
252D‧‧‧候選者位置
252E‧‧‧候選者位置
mv2‧‧‧運動向量
mv2+mv_offset‧‧‧運動資訊
mv3‧‧‧運動向量
N+1‧‧‧參考圖框
N-1‧‧‧參考圖框
N-2‧‧‧參考圖框
N-3‧‧‧參考圖框
圖1係說明可利用本發明之技術之實例視訊寫碼系統的方塊圖。
圖2係說明經組態以實施本發明之技術之實例視訊編碼器的方塊圖。
圖3係說明經組態以實施本發明之技術之實例視訊解碼 器的方塊圖。
圖4係說明框間預測模組之實例組態的方塊圖。
圖5係說明實例合併操作之流程圖。
圖6係說明實例進階運動向量預測(AMVP)操作之流程圖。
圖7係說明由視訊解碼器執行之實例運動補償操作之流程圖。
圖8係說明寫碼單元(CU)及與CU相關聯之實例源位置的概念圖。
圖9係說明實例候選者清單建構操作之流程圖。
圖10展示將經組合候選者添加至合併候選者清單之圖形實例。
圖11展示將經縮放候選者添加至合併候選者清單之圖形實例。
圖12展示將零候選者添加至合併候選者清單之圖形實例。
圖13A及圖13B展示產生mv_offset候選者之圖形實例。
圖14係說明本發明中所描述之技術之實例的流程圖。

Claims (45)

  1. 一種寫碼視訊資料之方法,該方法包含:判定與一當前視訊圖框之一當前部分相關聯的空間候選者之一集合,其中空間候選者之該集合對應於該當前視訊圖框鄰近該當前部分之相鄰部分,且其中該等空間候選者中之每一者具有相關聯之運動資訊;判定與該當前視訊圖框之該當前部分相關聯的一時間候選者,其中該時間候選者對應於一參考視訊圖框之一部分,且其中該時間候選者具有相關聯之運動資訊;基於空間候選者之該集合的一子集及該時間候選者產生一候選者清單;及,回應於該候選者清單包含之候選者少於一指定數目,將一人工產生之候選者添加至該候選者清單,其中該人工產生之候選者具有與該子集之一空間候選者之運動資訊相同或與該時間候選者之運動資訊相同的運動資訊。
  2. 如請求項1之方法,其中空間候選者之該集合包含具有相同運動資訊之兩個或兩個以上空間候選者,且其中空間候選者之該子集僅包括該兩個或兩個以上空間候選者中之一者。
  3. 如請求項1之方法,其中基於空間候選者之該集合的該子集及該時間候選者產生該候選者清單包含:執行一修剪操作以自該候選者清單排除具有重複運動資訊之一候選者。
  4. 如請求項1之方法,其中將該人工產生之候選者添加至 該候選者清單包含:在不對該人工產生之候選者執行一或多個修剪操作的情況下添加該人工產生之候選者。
  5. 如請求項1之方法,其中該人工產生之候選者為一非縮放雙向預測性候選者。
  6. 如請求項1之方法,其中該人工產生之候選者為一零候選者。
  7. 如請求項1之方法,其中該人工產生之候選者為一運動向量偏移候選者。
  8. 如請求項1之方法,其進一步包含:產生一第二人工產生之候選者,其中該人工產生之候選者及該第二人工產生之候選者係並行地產生。
  9. 如請求項1之方法,其進一步包含:使用一合併模式寫碼該當前視訊圖框之該當前部分,其中用於該合併模式之運動資訊係基於該候選者清單而判定。
  10. 如請求項1之方法,其中該方法由一視訊編碼器執行,其中該方法進一步包含:自該候選者清單選擇一候選者及產生指示該選定候選者之一索引的一語法元素。
  11. 如請求項1之方法,其中該方法由一視訊解碼器執行,且其中該方法進一步包含:接收識別來自該候選者清單之一候選者的一語法元素及使用該經識別候選者之運動資訊解碼該當前視訊圖框之該當前部分。
  12. 一種用於寫碼視訊資料之器件,該器件包含:一視訊寫碼器,其經組態以:判定與一當前視訊圖框 之一當前部分相關聯的空間候選者之一集合,其中空間候選者之該集合對應於該當前視訊圖框鄰近該當前部分之相鄰部分,且其中該等空間候選者中之每一者具有相關聯之運動資訊;判定與該當前視訊圖框之該當前部分相關聯的一時間候選者,其中該時間候選者對應於一參考視訊圖框之一部分,且其中該時間候選者具有相關聯之運動資訊;基於空間候選者之該集合的一子集及該時間候選者產生一候選者清單;及,回應於該候選者清單包含之候選者少於一指定數目,將一人工產生之候選者添加至該候選者清單,其中該人工產生之候選者具有與該子集之一空間候選者之運動資訊相同或與該時間候選者之運動資訊相同的運動資訊。
  13. 如請求項12之器件,其中空間候選者之該集合包含具有相同運動資訊之兩個或兩個以上空間候選者,且其中空間候選者之該子集僅包括該兩個或兩個以上空間候選者中之一者。
  14. 如請求項12之器件,其中該視訊寫碼器藉由執行一修剪操作以自該候選者清單排除具有重複運動資訊之一候選者而基於空間候選者之該集合的該子集及該時間候選者產生該候選者清單。
  15. 如請求項12之器件,其中該視訊寫碼器藉由在不對該人工產生之候選者執行一或多個修剪操作的情況下添加該人工產生之候選者來將該人工產生之候選者添加至該候選者清單。
  16. 如請求項12之器件,其中該人工產生之候選者為一非縮放雙向預測性候選者。
  17. 如請求項12之器件,其中該人工產生之候選者為一零候選者。
  18. 如請求項12之器件,其中該人工產生之候選者為一運動向量偏移候選者。
  19. 如請求項12之器件,其中該視訊寫碼器經進一步組態以產生一第二人工產生之候選者,其中該人工產生之候選者及該第二人工產生之候選者係並行地產生。
  20. 如請求項12之器件,其中該視訊寫碼器經進一步組態以使用一合併模式寫碼該當前視訊圖框之該當前部分,其中用於該合併模式之運動資訊係基於該候選者清單而判定。
  21. 如請求項12之器件,其中該視訊寫碼器為一視訊編碼器,且其中該視訊編碼器經組態以自該候選者清單選擇一候選者及產生指示該選定候選者之一索引的一語法元素。
  22. 如請求項12之器件,其中該視訊寫碼器為一視訊解碼器,且其中該視訊解碼器經組態以接收識別來自該候選者清單之一候選者的一語法元素及使用該經識別候選者之運動資訊解碼該當前視訊圖框之該當前部分。
  23. 如請求項12之器件,其中該器件包含以下中之至少一者:一積體電路; 一微處理器;及,一無線通信器件,其包括該視訊寫碼器。
  24. 一種用於寫碼視訊資料之器件,該器件包含:用於判定與一當前視訊圖框之一當前部分相關聯的空間候選者之一集合的構件,其中空間候選者之該集合對應於該當前視訊圖框鄰近該當前部分之相鄰部分,且其中該等空間候選者中之每一者具有相關聯之運動資訊;用於判定與該當前視訊圖框之該當前部分相關聯之一時間候選者的構件,其中該時間候選者對應於一參考視訊圖框之一部分,且其中該時間候選者具有相關聯之運動資訊;用於基於空間候選者之該集合的一子集及該時間候選者產生一候選者清單的構件;及,用於回應於該候選者清單包含之候選者少於一指定數目而將一人工產生之候選者添加至該候選者清單的構件,其中該人工產生之候選者具有與該子集之一空間候選者之運動資訊相同或與該時間候選者之運動資訊相同的運動資訊。
  25. 如請求項24之器件,其中空間候選者之該集合包含具有相同運動資訊之兩個或兩個以上空間候選者,且其中空間候選者之該子集僅包括該兩個或兩個以上空間候選者中之一者。
  26. 如請求項24之器件,其中用於基於空間候選者之該集合的該子集及該時間候選者產生該候選者清單的該構件包 含:用於執行一修剪操作以自該候選者清單排除具有重複運動資訊之一候選者的構件。
  27. 如請求項24之器件,其中用於將該人工產生之候選者添加至該候選者清單的該構件包含:用於在不對該人工產生之候選者執行一或多個修剪操作的情況下添加該人工產生之候選者的構件。
  28. 如請求項24之器件,其中該人工產生之候選者為一非縮放雙向預測性候選者。
  29. 如請求項24之器件,其中該人工產生之候選者為一零候選者。
  30. 如請求項24之器件,其中該人工產生之候選者為一運動向量偏移候選者。
  31. 如請求項24之器件,其進一步包含:用於產生一第二人工產生之候選者的構件,其中該人工產生之候選者及該第二人工產生之候選者係並行地產生。
  32. 如請求項24之器件,其進一步包含:用於使用一合併模式寫碼該當前視訊圖框之該當前部分的構件,其中用於該合併模式之運動資訊係基於該候選者清單而判定。
  33. 如請求項24之器件,其中該器件包含一視訊編碼器,且其中該器件進一步包含:用於自該候選者清單選擇一候選者之構件及用於產生指示該選定候選者之一索引的一語法元素之構件。
  34. 如請求項24之器件,其中該器件包含一視訊解碼器,且其中該器件進一步包含:用於接收識別來自該候選者清單之一候選者之一語法元素的構件及用於使用該經識別候選者之運動資訊解碼該當前視訊圖框之該當前部分的構件。
  35. 一種儲存指令之電腦可讀儲存媒體,該等指令在經執行時使一或多個處理器執行以下操作:判定與一當前視訊圖框之一當前部分相關聯的空間候選者之一集合,其中空間候選者之該集合對應於該當前視訊圖框鄰近該當前部分之相鄰部分,且其中該等空間候選者中之每一者具有相關聯之運動資訊;判定與該當前視訊圖框之該當前部分相關聯的一時間候選者,其中該時間候選者對應於一參考視訊圖框之一部分,且其中該時間候選者具有相關聯之運動資訊;基於空間候選者之該集合的一子集及該時間候選者產生一候選者清單;及,回應於該候選者清單包含之候選者少於一指定數目而將一人工產生之候選者添加至該候選者清單,其中該人工產生之候選者具有與該子集之一空間候選者之運動資訊相同或與該時間候選者之運動資訊相同的運動資訊。
  36. 如請求項35之電腦可讀儲存媒體,其中空間候選者之該集合包含具有相同運動資訊之兩個或兩個以上空間候選者,且其中空間候選者之該子集僅包括該兩個或兩個以上空間候選者中之一者。
  37. 如請求項35之電腦可讀儲存媒體,其中該等指令使該一或多個處理器藉由執行一修剪操作以自該候選者清單排除具有重複運動資訊之一候選者來基於空間候選者之該集合的該子集及該時間候選者產生該候選者清單。
  38. 如請求項35之電腦可讀儲存媒體,其中該等指令使該一或多個處理器在不對該人工產生之候選者執行一或多個修剪操作的情況下將該人工產生之候選者添加至該候選者清單。
  39. 如請求項35之電腦可讀儲存媒體,其中該人工產生之候選者為一非縮放雙向預測性候選者。
  40. 如請求項35之電腦可讀儲存媒體,其中該人工產生之候選者為一零候選者。
  41. 如請求項35之電腦可讀儲存媒體,其中該人工產生之候選者為一運動向量偏移候選者。
  42. 如請求項35之電腦可讀儲存媒體,其儲存在經執行時使該一或多個處理器執行以下操作的其他指令:產生一第二人工產生之候選者,其中該人工產生之候選者及該第二人工產生之候選者係並行地產生。
  43. 如請求項35之電腦可讀儲存媒體,其儲存在經執行時使該一或多個處理器執行以下操作的其他指令:使用一合併模式寫碼該當前視訊圖框之該當前部分,其中用於該合併模式之運動資訊係基於該候選者清單而判定。
  44. 如請求項35之電腦可讀儲存媒體,其中該一或多個處理 器包含一視訊編碼器,其中該電腦可讀儲存媒體儲存其他指令,該等指令在經執行時使該一或多個處理器自該候選者清單選擇一候選者及產生指示該選定候選者之一索引的一語法元素。
  45. 如請求項35之電腦可讀儲存媒體,其中該一或多個處理器包含一視訊解碼器,其中該電腦可讀儲存媒體儲存其他指令,該等指令在經執行時使該一或多個處理器接收識別來自該候選者清單之一候選者的一語法元素及使用該經識別候選者之運動資訊解碼該當前視訊圖框之該當前部分。
TW101141385A 2011-11-07 2012-11-07 寫碼視訊資料之方法、裝置及電腦可讀儲存媒體 TWI544783B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201161556746P 2011-11-07 2011-11-07
US201161562284P 2011-11-21 2011-11-21
US201161562940P 2011-11-22 2011-11-22
US13/669,992 US20130114717A1 (en) 2011-11-07 2012-11-06 Generating additional merge candidates

Publications (2)

Publication Number Publication Date
TW201338549A true TW201338549A (zh) 2013-09-16
TWI544783B TWI544783B (zh) 2016-08-01

Family

ID=48223691

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101141385A TWI544783B (zh) 2011-11-07 2012-11-07 寫碼視訊資料之方法、裝置及電腦可讀儲存媒體

Country Status (17)

Country Link
US (1) US20130114717A1 (zh)
EP (1) EP2777262B1 (zh)
JP (1) JP5908600B2 (zh)
KR (1) KR101626690B1 (zh)
CN (1) CN104126302B (zh)
AU (1) AU2012335887B2 (zh)
BR (1) BR112014010821A8 (zh)
CA (1) CA2853834C (zh)
HK (1) HK1199994A1 (zh)
IL (1) IL232285B (zh)
IN (1) IN2014CN03309A (zh)
MY (1) MY171806A (zh)
RU (1) RU2577779C2 (zh)
SG (1) SG11201401547XA (zh)
TW (1) TWI544783B (zh)
WO (1) WO2013070757A1 (zh)
ZA (1) ZA201404178B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI619374B (zh) * 2016-03-01 2018-03-21 聯發科技股份有限公司 利用仿射運動補償的視訊編碼方法與裝置

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5982734B2 (ja) * 2011-03-11 2016-08-31 ソニー株式会社 画像処理装置および方法
GB2561487B (en) 2011-10-18 2019-01-02 Kt Corp Method for encoding image, method for decoding image, image encoder, and image decoder
MX355319B (es) 2011-11-08 2018-04-16 Kt Corp Método y aparato para exploración de coeficientes con base en el modo de división de la unidad de predicción.
US9491475B2 (en) 2012-03-29 2016-11-08 Magnum Semiconductor, Inc. Apparatuses and methods for providing quantized coefficients for video encoding
US20150085932A1 (en) * 2012-04-24 2015-03-26 Mediatek Inc. Method and apparatus of motion vector derivation for 3d video coding
US9325990B2 (en) 2012-07-09 2016-04-26 Qualcomm Incorporated Temporal motion vector prediction in video coding extensions
GB2511288A (en) * 2013-01-09 2014-09-03 Canon Kk Method, device, and computer program for motion vector prediction in scalable video encoder and decoder
US9392286B2 (en) * 2013-03-15 2016-07-12 Magnum Semiconductor, Inc. Apparatuses and methods for providing quantized coefficients for video encoding
WO2015010226A1 (en) * 2013-07-24 2015-01-29 Qualcomm Incorporated Simplified advanced motion prediction for 3d-hevc
US9948915B2 (en) 2013-07-24 2018-04-17 Qualcomm Incorporated Sub-PU motion prediction for texture and depth coding
US9667996B2 (en) 2013-09-26 2017-05-30 Qualcomm Incorporated Sub-prediction unit (PU) based temporal motion vector prediction in HEVC and sub-PU design in 3D-HEVC
US9762927B2 (en) * 2013-09-26 2017-09-12 Qualcomm Incorporated Sub-prediction unit (PU) based temporal motion vector prediction in HEVC and sub-PU design in 3D-HEVC
US9794575B2 (en) 2013-12-18 2017-10-17 Magnum Semiconductor, Inc. Apparatuses and methods for optimizing rate-distortion costs in video encoding
EP3114839A4 (en) 2014-03-07 2018-02-14 Qualcomm Incorporated Simplified sub-prediction unit (sub-pu) motion parameter inheritence (mpi)
WO2015135473A1 (en) * 2014-03-11 2015-09-17 Mediatek Inc. Method and apparatus of single sample mode for video coding
WO2015149698A1 (en) * 2014-04-01 2015-10-08 Mediatek Inc. Method of motion information coding
US20160373744A1 (en) * 2014-04-23 2016-12-22 Sony Corporation Image processing apparatus and image processing method
JP6472877B2 (ja) * 2014-10-09 2019-02-20 寰發股▲ふん▼有限公司HFI Innovation Inc. 視点合成予測を含む3dまたは多視点映像符号化の方法
WO2016070363A1 (en) * 2014-11-05 2016-05-12 Mediatek Singapore Pte. Ltd. Merge with inter prediction offset
US10200711B2 (en) * 2015-03-27 2019-02-05 Qualcomm Incorporated Motion vector derivation in video coding
CN115002455A (zh) * 2015-06-05 2022-09-02 杜比实验室特许公司 图像编码和解码方法和图像解码设备
EP3355578B1 (en) * 2015-09-24 2020-12-09 LG Electronics Inc. Motion vector predictor derivation and candidate list construction
RU2632127C1 (ru) * 2016-04-07 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и система сравнения видеофайлов
CN116546207A (zh) * 2016-04-08 2023-08-04 韩国电子通信研究院 用于导出运动预测信息的方法和装置
WO2018045944A1 (en) * 2016-09-06 2018-03-15 Mediatek Inc. Methods and apparatuses of candidate set determination for binary-tree splitting blocks
CN117528108A (zh) * 2016-11-28 2024-02-06 英迪股份有限公司 图像编码方法、图像解码方法及用于传送比特流的方法
EP3410717A1 (en) * 2017-05-31 2018-12-05 Thomson Licensing Methods and apparatus for candidate list pruning
US11064217B2 (en) 2017-09-18 2021-07-13 Intellectual Discovery Co., Ltd. Method and apparatus for coding video using merging candidate list according to block division
CN111971966A (zh) 2018-03-30 2020-11-20 韩国电子通信研究院 图像编码/解码方法和设备以及存储比特流的记录介质
WO2019191867A1 (zh) * 2018-04-02 2019-10-10 华为技术有限公司 一种视频编解码方法和装置
CN116668679A (zh) 2018-05-10 2023-08-29 Lg电子株式会社 编解码设备、非暂态计算机可读存储介质和数据发送设备
JP7407741B2 (ja) * 2018-05-16 2024-01-04 華為技術有限公司 ビデオ符号化方法および装置
EP3797516A1 (en) 2018-06-29 2021-03-31 Beijing Bytedance Network Technology Co. Ltd. Interaction between lut and amvp
CN110662057B (zh) 2018-06-29 2022-06-21 北京字节跳动网络技术有限公司 视频处理方法、装置、设备以及存储比特流的方法
EP3791588A1 (en) 2018-06-29 2021-03-17 Beijing Bytedance Network Technology Co. Ltd. Checking order of motion candidates in lut
KR20210024502A (ko) 2018-06-29 2021-03-05 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Hmvp 후보를 병합/amvp에 추가할 때의 부분/풀 프루닝
WO2020003278A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Update of look up table: fifo, constrained fifo
CN110662030B (zh) * 2018-06-29 2022-06-14 北京字节跳动网络技术有限公司 一种视频处理方法和装置
JP7460617B2 (ja) 2018-06-29 2024-04-02 北京字節跳動網絡技術有限公司 Lut更新条件
CN110662056B (zh) 2018-06-29 2022-06-07 北京字节跳动网络技术有限公司 哪个查找表需要更新或不更新
TWI750486B (zh) 2018-06-29 2021-12-21 大陸商北京字節跳動網絡技術有限公司 運動資訊共用的限制
CN110662063B (zh) 2018-06-29 2020-12-15 北京字节跳动网络技术有限公司 视频处理方法、装置和计算机可读存储介质
TWI723444B (zh) * 2018-06-29 2021-04-01 大陸商北京字節跳動網絡技術有限公司 使用一個或多個查找表來按順序存儲先前編碼的運動信息並使用它們來編碼後面的塊的概念
EP4307679A3 (en) 2018-07-02 2024-06-19 Beijing Bytedance Network Technology Co., Ltd. Luts with intra prediction modes and intra mode prediction from non-adjacent blocks
US10904555B2 (en) * 2018-07-11 2021-01-26 Tencent America LLC Method and apparatus for video coding
CN112514383B (zh) * 2018-07-31 2023-12-19 寰发股份有限公司 用于视频编解码的利用运动向量差的合并方法和装置
US11336914B2 (en) * 2018-08-16 2022-05-17 Qualcomm Incorporated History-based candidate list with classification
CN112585972B (zh) 2018-08-17 2024-02-09 寰发股份有限公司 视频编解码的帧间预测方法及装置
WO2020035022A1 (en) * 2018-08-17 2020-02-20 Mediatek Inc. Method and apparatus of simplified merge candidate list for video coding
TW202025760A (zh) 2018-09-12 2020-07-01 大陸商北京字節跳動網絡技術有限公司 要檢查多少個hmvp候選
WO2020052653A1 (zh) * 2018-09-13 2020-03-19 华为技术有限公司 一种预测运动信息的解码方法及装置
CN114125467A (zh) * 2018-09-13 2022-03-01 华为技术有限公司 一种预测运动信息的解码方法及装置
EP4383713A3 (en) 2018-09-21 2024-08-28 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method for encoding/decoding image signal and apparatus therefor
WO2020067700A1 (ko) * 2018-09-24 2020-04-02 김기백 영상 부호화/복호화 방법 및 장치
CN117082259A (zh) * 2018-10-10 2023-11-17 华为技术有限公司 帧间预测方法及装置
CN111418207B (zh) * 2018-11-06 2024-04-19 北京字节跳动网络技术有限公司 依赖块尺寸的对运动信息的存储
SG11202104531TA (en) * 2018-11-08 2021-05-28 Guangdong Oppo Mobile Telecommunications Corp Ltd Video signal encoding and decoding method, and apparatus therefor
CA3118269C (en) 2018-11-08 2023-10-03 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method for encoding/decoding image signal, and apparatus therefor
JP7416781B2 (ja) 2018-11-08 2024-01-17 オッポ広東移動通信有限公司 ビデオ信号符号化/復号方法及びその機器
BR112021008091A2 (pt) 2018-11-08 2021-08-03 Guangdong Oppo Mobile Telecommunications Corp., Ltd. método de codificação e decodificação de sinal de vídeo e aparelho de decodificação de vídeo
CN112997493B (zh) * 2018-11-13 2024-01-05 北京字节跳动网络技术有限公司 用于单一类型运动候选列表的构建方法
WO2020098713A1 (en) * 2018-11-13 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Motion candidate list construction for prediction
CN118200597A (zh) 2018-11-14 2024-06-14 Sk电信有限公司 帧间预测设备和发送比特流的设备
KR20200056272A (ko) * 2018-11-14 2020-05-22 에스케이텔레콤 주식회사 인터 예측 방법 및 이를 이용한 영상 복호화 장치
CN113170191B (zh) 2018-11-16 2022-05-27 寰发股份有限公司 视频编解码的预测方法以及预测装置
WO2020103935A1 (en) 2018-11-22 2020-05-28 Beijing Bytedance Network Technology Co., Ltd. Blending method for inter prediction with geometry partition
WO2020114406A1 (en) 2018-12-03 2020-06-11 Beijing Bytedance Network Technology Co., Ltd. Partial pruning method for inter prediction
US11570430B2 (en) 2018-12-06 2023-01-31 Lg Electronics Inc. Method and device for processing video signal on basis of inter-prediction
WO2020122640A1 (ko) 2018-12-12 2020-06-18 엘지전자 주식회사 히스토리 기반 모션 벡터 예측을 기반으로 비디오 신호를 처리하기 위한 방법 및 장치
CN113261290B (zh) 2018-12-28 2024-03-12 北京字节跳动网络技术有限公司 基于修改历史的运动预测
WO2020141962A1 (ko) * 2019-01-04 2020-07-09 세종대학교산학협력단 영상 부호화/복호화 방법 및 장치
CN113273186A (zh) 2019-01-10 2021-08-17 北京字节跳动网络技术有限公司 Lut更新的调用
CN113383554B (zh) 2019-01-13 2022-12-16 北京字节跳动网络技术有限公司 LUT和共享Merge列表之间的交互
CN113302937B (zh) 2019-01-16 2024-08-02 北京字节跳动网络技术有限公司 运动候选推导
US11140406B2 (en) * 2019-02-20 2021-10-05 Qualcomm Incorporated Signalling for merge mode with motion vector differences in video coding
CN113615193B (zh) 2019-03-22 2024-06-25 北京字节跳动网络技术有限公司 Merge列表构建和其他工具之间的交互
WO2020244571A1 (en) * 2019-06-04 2020-12-10 Beijing Bytedance Network Technology Co., Ltd. Motion candidate list construction using neighboring block information
KR20220016075A (ko) 2019-06-04 2022-02-08 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 모션 후보 리스트 구성 프로세스의 조건부 구현
CN114128295B (zh) 2019-07-14 2024-04-12 北京字节跳动网络技术有限公司 视频编解码中几何分割模式候选列表的构建
CN117596389A (zh) 2019-09-28 2024-02-23 北京字节跳动网络技术有限公司 视频编解码中的几何分割模式
JP7499854B2 (ja) * 2019-12-30 2024-06-14 鴻穎創新有限公司 ビデオデータをコーディングするデバイス及び方法
WO2024010370A1 (ko) * 2022-07-05 2024-01-11 엘지전자 주식회사 양방향 인터 예측에 기반한 영상 부호화/복호화 방법, 비트스트림을 전송하는 방법 및 비트스트림을 저장한 기록 매체

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040001546A1 (en) * 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
GB0500332D0 (en) * 2005-01-08 2005-02-16 Univ Bristol Enhanced error concealment
US8665964B2 (en) * 2009-06-30 2014-03-04 Qualcomm Incorporated Video coding based on first order prediction and pre-defined second order prediction mode
WO2011095260A1 (en) * 2010-02-05 2011-08-11 Telefonaktiebolaget L M Ericsson (Publ) Managing predicted motion vector candidates
US9313526B2 (en) * 2010-02-19 2016-04-12 Skype Data compression for video
US8824558B2 (en) * 2010-11-23 2014-09-02 Mediatek Inc. Method and apparatus of spatial motion vector prediction
CA3101406C (en) * 2011-06-14 2023-05-09 Tammy Lee Method and apparatus for encoding motion information and method and apparatus for decoding same
US9866859B2 (en) * 2011-06-14 2018-01-09 Texas Instruments Incorporated Inter-prediction candidate index coding independent of inter-prediction candidate list construction in video coding
WO2013057359A1 (en) * 2011-10-21 2013-04-25 Nokia Corporation Method for video coding and an apparatus
US9544592B2 (en) * 2012-02-10 2017-01-10 Texas Instruments Incorporated Methods and systems for encoding pictures associated with video data
EP3796651A1 (en) * 2012-05-09 2021-03-24 Sun Patent Trust Method of performing motion vector prediction, encoding and decoding methods, and apparatuses thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI619374B (zh) * 2016-03-01 2018-03-21 聯發科技股份有限公司 利用仿射運動補償的視訊編碼方法與裝置

Also Published As

Publication number Publication date
ZA201404178B (en) 2019-07-31
BR112014010821A2 (pt) 2017-06-13
BR112014010821A8 (pt) 2017-06-20
SG11201401547XA (en) 2014-06-27
IL232285A0 (en) 2014-06-30
IL232285B (en) 2019-03-31
HK1199994A1 (zh) 2015-07-24
TWI544783B (zh) 2016-08-01
CA2853834A1 (en) 2013-05-16
JP5908600B2 (ja) 2016-04-26
CN104126302B (zh) 2017-08-04
CA2853834C (en) 2017-05-30
MY171806A (en) 2019-10-30
EP2777262A1 (en) 2014-09-17
WO2013070757A1 (en) 2013-05-16
RU2014123368A (ru) 2015-12-20
JP2014535249A (ja) 2014-12-25
US20130114717A1 (en) 2013-05-09
KR20140092876A (ko) 2014-07-24
EP2777262B1 (en) 2018-10-17
KR101626690B1 (ko) 2016-06-01
CN104126302A (zh) 2014-10-29
IN2014CN03309A (zh) 2015-10-09
AU2012335887B2 (en) 2016-03-24
RU2577779C2 (ru) 2016-03-20
AU2012335887A1 (en) 2014-05-29

Similar Documents

Publication Publication Date Title
TWI544783B (zh) 寫碼視訊資料之方法、裝置及電腦可讀儲存媒體
US11051034B2 (en) History-based motion vector predictor
CN110915214B (zh) 用于运动向量推导的基于部分重构建的模板匹配
CN107534766B (zh) 于视频译码中针对子块推导运动信息方法、装置
US10887597B2 (en) Systems and methods of determining illumination compensation parameters for video coding
CN111818343B (zh) 将当前图片用作视频译码的参考
US9736489B2 (en) Motion vector determination for video coding
KR102184063B1 (ko) 비디오 코딩을 위한 적응 모션 벡터 해상도 시그널링
US9426463B2 (en) Restriction of prediction units in B slices to uni-directional inter prediction
US9491458B2 (en) Scalable video coding prediction with non-causal information
US20160366416A1 (en) Systems and methods of determining illumination compensation status for video coding
CN111213376A (zh) 使用基于编码结构的候选列表构建对视频数据的运动信息进行编码
JP2019514292A (ja) ビデオコーディングにおけるコロケート参照インデックスのための適合制約
KR20210024165A (ko) 인터 예측 방법 및 장치
KR20160024960A (ko) 심도 지향 인터-뷰 모션 벡터 예측
CN112534820A (zh) 信令通知子预测单元运动矢量预测器
US10194146B2 (en) Device and method for scalable coding of video information

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees