TW202423120A - 採用合併模式進行視頻編解碼的amvp方法和裝置 - Google Patents
採用合併模式進行視頻編解碼的amvp方法和裝置 Download PDFInfo
- Publication number
- TW202423120A TW202423120A TW112126745A TW112126745A TW202423120A TW 202423120 A TW202423120 A TW 202423120A TW 112126745 A TW112126745 A TW 112126745A TW 112126745 A TW112126745 A TW 112126745A TW 202423120 A TW202423120 A TW 202423120A
- Authority
- TW
- Taiwan
- Prior art keywords
- amvp
- target
- candidate
- merge
- merge candidate
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000033001 locomotion Effects 0.000 claims description 99
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 28
- 239000013598 vector Substances 0.000 claims description 24
- 230000009977 dual effect Effects 0.000 claims description 12
- 238000013139 quantization Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 description 10
- 230000002146 bilateral effect Effects 0.000 description 7
- 238000005192 partition Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Abstract
本申請提供了使用簡化的AMVP合併模式或使用具有BCW的AMVP合併模式進行視頻編解碼的方法和裝置。根據其中一種方法,從AMVP候選清單中確定目標AMVP候選者。確定合併候選者清單。根據與合併候選者相關的MV成本,對合併候選者清單中的合併候選者重新排序,形成重新排序的合併候選者清單。從重新排序的合併候選者清單中確定目標合併候選者。根據目標 AMVP 候選者和目標合併候選者生成目標AMVP合併候選者。根據另一種方法,從包括兩個或以上權重對的權重對集中確定目標權重對。根據目標權重對,生成目標AMVP合併候選者,作為目標AMVP候選者和目標合併候選者的加權和。
Description
本申請涉及使用運動估計和運動補償的視頻編解碼。具體地,本申請涉及提高AMVP合併模式性能的方案。
多功能視頻編碼(VVC)是由ITU-T視頻編碼專家組(VCEG)和ISO/IEC移動圖像專家組(MPEG)的聯合視頻專家組(JVET)制定的最新國際視頻編碼標準。該標準已作為ISO標準發佈:ISO/IEC 23090-3:2021,資訊技術—沉浸式媒體的編碼表示--第3部分:多功能視頻編碼(ISO standard: ISO/IEC 23090-3:2021, Information technology - Coded representation of immersive media - Part 3: Versatile video coding),2021年2月發佈。VVC是在其前身HEVC(高效視頻編碼)的基礎上發展起來的,增加了更多的編解碼工具,以提高編解碼效率並處理各種類型的視頻源,包括三維(3D)視頻訊號。
第1A圖示出了一種包含迴圈處理的自我調整幀內/幀間視頻編碼系統。對於幀內預測,預測資料基於當前圖片中先前編解碼的視頻資料而推導出。對於幀間預測112,在編碼器端執行運動估計(ME),並根據ME的結果執行運動補償(MC),以提供自其他圖像和運動資料推導出的預測資料。開關114選擇幀內預測110或幀間預測112,所選的預測資料提供給加法器116以形成預測誤差,也稱為殘差。預測誤差隨後由變換(T)118和量化(Q)120處理。經過變換和量化的殘差再由熵編碼器122進行編碼,以包含在與壓縮視頻資料相對應的視頻位元流中。然後,與變換係數相關的位元流將包含與幀內預測和幀間預測相關的運動和編碼模式等輔助資訊,以及與應用於底層圖像區域的迴圈濾波器相關的參數等其他資訊。如第1A圖所示,與幀內預測110、幀間預測112、和環內濾波器130相關的輔助資訊被提供給熵編碼器122。使用幀間預測模式時,還必須在編碼器端重建一幅或多幅參考圖片。因此,變換和量化後的殘差要經過反量化(IQ)124和反變換(IT)126處理,以恢復殘差。然後在重構(REC)128將殘差加回預測資料136,以重建視頻資料。重建的視頻資料可存儲在參考圖片緩衝器134中,並用於預測其他幀。
如第1A圖所示,輸入的視頻資料在編碼系統中經過一系列處理。來自REC 128的重建視頻資料可能會由於一系列處理過程而受到各種損傷。因此,在重建視頻資料存儲到參考圖像緩衝器134之前,通常會對重建視頻資料應用環內濾波器130,以提高視頻品質。例如,可以使用去塊濾波器(DF)、採樣自我調整偏移(SAO)、和自我調整環路濾波器(ALF)。環路濾波器資訊可能需要包含在位元流中,以便解碼器能正確恢復所需的資訊。因此,環路濾波器資訊也會提供給熵編碼器122,以便納入位元流。在第1A圖中,環內濾波器130在重建樣本存儲到參考圖片緩衝器134之前應用於重建視頻。第1A圖中的系統旨在說明典型視頻轉碼器的示例結構。它可以對應于高效視頻編碼(HEVC)系統、VP8、VP9、H.264、或VVC。
如第1B圖所示,解碼器可以使用與編碼器類似或部分相同的功能塊,然變換118和量化120除外,因為解碼器只需要反量化124和反變換126。解碼器不使用熵編碼器122,而是使用熵解碼器140將視頻位元流解碼為量化變換係數和所需的編碼資訊(如ILPF資訊、幀內預測資訊、和幀間預測資訊)。解碼器側的幀內預測150無需執行模式搜索。相反,解碼器只需根據從熵解碼器140接收到的幀內預測資訊生成幀內預測。此外,對於幀間預測,解碼器只需根據從熵解碼器140接收到的幀間預測資訊執行運動補償(MC 152),而無需進行運動估計。
根據VVC,輸入圖像被分割成不重疊的方形塊區域,稱為CTU(編碼樹單元),類似於HEVC。每個CTU可以劃分為一個或複數個更小的編碼單元(CU)。由此產生的CU分區可以是正方形或矩形。此外,VVC還將CTU劃分為預測單元(PU),作為應用預測過程的單位,如幀內預測、幀間預測等。
與HEVC標準相比,VVC標準採用了各種新的編解碼工具,以進一步提高編解碼效率。在各種新編解碼工具中,與本申請相關的一些編解碼工具綜述如下。
帶
CU
級權重的雙預測(
BCW
)
在HEVC中,雙預測訊號
是通過平均兩個預測訊號
和
生成的,這兩個預測訊號分別來自兩張不同的參考圖片和/或使用兩個不同的運動向量。在VVC中,雙預測模式超出了簡單平均的範圍,允許對兩個預測訊號進行加權平均。
加權平均雙預測允許五個權重,
。對於每個雙預測CU,權重
w可通過以下兩種方式之一確定:1)對於非合併CU,權重指數在運動向量差異後發出訊號;2)對於合併CU,權重指數根據合併候選指數從鄰近塊推斷。BCW僅適用於具有256個或更多亮度樣本的CU(即CU寬度乘以CU高度大於等於256)。對於低延遲圖片,會使用全部5個權重。對於非低延遲圖像,只使用3個權重(
)。編碼器採用快速搜索演算法來查找權重指數,而不會顯著增加編碼器的複雜度。這些演算法概述如下。詳細內容見VTM軟體和JVET-L0646號檔(Yu-Chi Su等,「CE4相關:結合JVET-L0197和JVET-L0296的通用雙預測改進(CE4-related: Generalized bi-prediction improvements combined from JVET-L0197 and JVET-L0296)」,ITU-T SG 16 WP 3和ISO/IEC JTC 1/SC 29 聯合視頻專家組(JVET),第12次會議:中國澳門,2018年10月3-12日,文件:JVET-L0646)。
與AMVR結合使用時,只有在當前圖片為低延遲圖片時,才會有條件地檢查1-pel和4-pel運動向量精度的不等權重。
與仿射結合使用時,只有當仿射模式被選為當前最佳模式時,才會對不等權重執行仿射ME。
當雙預測中的兩張參考圖片相同時,僅有條件地檢查不等權重。
根據當前圖片與其參考圖片之間的圖片順序計數(POC)距離、編碼QP、和時間級別,在滿足特定條件時不會搜索不等權重。
BCW權重指數的編解碼使用一個上下文編解碼分區,然後是旁路編解碼分區。第一個上下文編解碼分區表示是否使用了等權重;如果使用了不等權重,則使用旁路編解碼的附加分區表示使用了哪一個不等權重。
加權預測(WP)是H.264/AVC和HEVC標準支援的一種編解碼工具,用於對有衰減的視頻內容進行有效編解碼。VVC標準也增加了對WP的支援。WP允許在每個參考圖片清單L0和L1中為每個參考圖片設置權重參數(權重和偏移)。然後,在運動補償過程中,相應參考圖像的權重和偏移將被應用。WP和BCW是針對不同類型的視頻內容而設計的。為了避免WP和BCW之間的相互影響(這會使VVC解碼器的設計複雜化),如果一個CU使用WP,則不顯示BCW權重指數,權重
w被推斷為4(即應用等權重)。對於合併CU,權重指數是根據合併候選指數從鄰近塊推斷出來的。這既適用於普通合併模式,也適用於繼承仿射合併模式。對於構建仿射合併模式,仿射運動資訊是根據最多3個塊的運動資訊構建的。使用構建仿射合併模式的CU的BCW指數只需設置為等於第一個控制點MV的BCW指數。
在VVC中,CIIP和BCW不能同時應用於一個CU。當使用CIIP模式對CU進行編碼時,當前CU的BCW指數將設為2(即
w=4表示等權重)。等權重意味著BCW指數的預設值。
雙向光流
(
BDOF
)
雙向光流(BDOF)工具包含在VVC中。BDOF以前稱為BIO,包含在JEM中。與JEM版本相比,VVC中的BDOF更加簡單,所需的計算量大大減少,特別是在乘法次數和乘法器大小方面。
BDOF用於在4×4子塊級別完善CU的雙預測訊號。如果CU滿足以下所有條件,就可以使用BDOF:
CU採用「真正的」雙預測模式編解碼,即兩張參考圖片中的一張按顯示順序排列在當前圖片之前,另一張按顯示順序排列在當前圖片之後
兩張參考圖片到當前圖片的距離(即POC差值)相同
兩張參考圖片都是短期參考圖片
CU不使用仿射模式或SbTMVP合併模式編解碼
CU具有64個以上的亮度樣本
CU高度和CU寬度均大於或等於8個亮度樣本
BCW權重指數表示等權重
當前CU未啟用WP
當前CU未使用CIIP模式
BDOF僅應用於亮度分量。顧名思義,BDOF模式基於光流概念,即假定物體的運動是平滑的。對於每個4×4的子塊,通過最小化L0和L1預測樣本之間的差異來計算運動細化
。然後利用運動細化調整4×4子塊中的雙預測樣本值。
VVC
中的解碼器側運動向量細化(
DMVR
)
為了提高合併模式運動向量的精確度,在VVC中應用了基於雙邊匹配(BM)的解碼器側運動向量細化。在雙邊預測操作中,圍繞參考圖片清單L0 22和參考圖片清單L1 214中的初始MV(232和234),為當前圖片210的當前塊220搜索細化MV。如第2圖所示,根據初始MV(232和234)和當前圖片中當前塊220的位置,確定L0和L1中的同位塊222和224。BM方法計算參考圖片清單L0和清單L1中兩個候選塊(242和244)之間的失真。兩個候選塊(242和244)的位置是通過在兩個初始MV(232和234)上添加兩個相反的偏移量(262和264)來確定的,從而推導出兩個候選MV(252和254)。如第2圖所示,根據初始MV(232或234)周圍的每個候選MV,計算候選塊(242和244)之間的SAD。SAD值最小的候選MV(252或254)成為細化MV,用於生成雙預測訊號。
在VVC中,DMVR的應用受到限制,僅適用於採用以下模式和特徵編解碼的CU:
具有雙預測MV的CU級合併模式
相對於當前圖像,一個參考圖像在過去,另一個參考圖像在未來
兩張參考圖片到當前圖片的距離(即POC差值)相同
兩張參考圖像都是短期參考圖像
CU具有64個以上的亮度樣本
CU高度和CU寬度均大於或等於8個亮度樣本
BCW權重指數表示等權重
當前塊未啟用WP
當前區塊未使用CIIP 模式
通過DMVR流程得到的細化MV用於生成幀間預測樣本,也用於未來圖片編解碼的時序運動向量預測。而原始MV則用於去塊過程,也用於未來CU編解碼的空間運動向量預測。
AMVP合併(AMVP-Merge)模式
在JVET-X0083中(Zhi Zhang等,「EE2:雙邊和範本匹配AMVP合併模式(測試3.3)(EE2: Bilateral and template matching AMVP-merge mode (test 3.3))」,ITU-T SG 16 WP 3和 ISO/IEC JTC 1/SC 29聯合視頻專家組(JVET),第24次會議,電話會議,2021年10月6日至15日,文件:JVET-X0083),提出了AMVP合併模式。在提議的AMVP合併模式中,雙向預測器由一個方向的AMVP預測器和另一個方向的合併預測器組成。
根據JVET-X0083標準,AMVP部分作為常規單向AMVP被發送(即發送參考指數和MVD訊號),如果使用範本匹配(如斷言TM_AMVP),則具有推導MVP指數;如果禁用範本匹配,則發送MVP指數。合併指數不會被發送,合併預測器將從範本或雙邊匹配成本最小的候選者清單中選出。
當所選的合併預測器和AMVP預測器滿足DMVR條件,即相對於當前圖片,至少有一張過去的參考圖片和一張未來的參考圖片,且兩張參考圖片到當前圖片的距離相同時,將以合併MV候選者和AMVP MVP為起點,應用雙邊匹配MV細化。否則,如果啟用了範本匹配功能,範本匹配MV細化將應用於範本匹配成本較高的合併預測器或AMVP預測器。
對於多通道DMVR,AMVP合併模式編解碼塊啟用了第三通道,即8x8子PU BDOF細化。
雖然AMVP合併模式能提高編解碼性能,然這種運動補償模式的計算量相當大。此外,用於MV細化的雙邊匹配演算法會明顯增加系統頻寬,因為該演算法必須訪問雙向參考資料。因此,本申請公開了降低系統頻寬要求和/或進一步提高性能的方案。
本申請公開了使用簡化AMVP合併模式進行視頻編解碼的方法和裝置。該方法包括:接收與當前圖片中的當前塊相關聯的輸入資料;其中,該輸入資料包括用於在編碼器側進行編碼的該當前塊的圖元資料,或用於在解碼器側進行解碼的與該當前塊相關聯的編碼資料;從AMVP(高級運動向量預測)候選者清單中確定目標AMVP候選者;確定合併候選者清單;根據與該合併候選者清單中的合併候選者相關的運動向量(MV)成本,對該合併候選者重新排序,以形成重新排序的合併候選者清單;其中,每個該MV成本是基於包括MV距離的一個或複數個因素來測量的,該MV距離是在該合併候選者清單中的每個候選者和相應映射MV之間測量的;其中,與第一參考圖片相關的每個該候選者被映射到第二參考圖片中的該相應映射MV上;從該重新排序的合併候選者清單中確定目標合併候選者;基於該目標AMVP候選者和該目標合併候選者生成目標AMVP合併候選者;以及使用包括該目標AMVP合併候選者的運動候選者清單對該當前塊進行編碼或解碼。
一些實施例中,MV成本較低的一個或多個該合併候選者在該重新排序的合併候選者清單中向前移動。一些實施例中,MV成本較低的該合併候選者被分配給較小的合併指數。一些實施例中,該一個或複數個因素包括與該第一參考圖片和該第二參考圖片相關聯的參考指數和/或圖片順序計數(POC)。一些實施例中,每個該MV成本是由該一個或複數個因素中至少兩個因素的加權和推導出的。
另一種方法包括:從AMVP候選者清單中確定目標AMVP候選者;從合併候選者清單中確定目標合併候選者;從包括兩個或以上權重對的權重對集中確定目標權重對;根據該目標權重對,以該目標AMVP候選者和該目標合併候選者的加權和生成目標AMVP合併候選者;以及使用包括該目標AMVP合併候選者的運動候選者清單對該當前塊進行編碼或解碼。
一些實施例中,與該目標權重對相關聯的權重指數從該目標合併候選者繼承。一些實施例中,根據範本匹配成本推導出與該目標權重對相關聯的權重指數,該範本匹配成本根據一個AMVP參考塊的第一相鄰範本和一個合併參考塊的第二相鄰範本計算得出。一些實施例中,根據以下的任意一個或複數個:一個AMVP參考圖片和一個合併參考圖片的切片量化參數(QP)、該AMVP參考圖片與該當前圖片之間的圖片順序計數(POC)差值、該合併參考圖片與該當前圖片之間的POC、與該AMVP參考圖片和該合併參考圖片相關聯的參考圖片ID,推導出與該目標權重對相關聯的權重指數。
一些實施例中,在位元流中發出或從位元流中解析出與該目標權重對相關聯的權重指數。
另一種方法包括:接收與當前圖片中的當前塊相關聯的輸入資料;其中,該輸入資料包括用於在編碼器側進行編碼的該當前塊的圖元資料,或用於在解碼器側進行解碼的與該當前塊相關聯的編碼資料;從AMVP(高級運動向量預測)候選者清單中確定目標AMVP候選者;其中,該AMVP候選者清單包括仿射運動候選者;從合併候選者清單中確定目標合併候選者;通過使用一個方向上的該目標AMVP候選者和另一個方向上的該目標合併候選者,為雙預測候選者生成目標AMVP合併候選者;以及使用包括該目標AMVP合併候選者的運動候選者清單對該當前塊進行編碼或解碼。
一些實施例中,該合併候選者清單進一步包括該仿射運動候選者。
一些實施例中,只有當該當前塊大於或小於閾值時,該仿射運動候選者才能被包含在該AMVP候選者清單中。一些實施例中,該閾值對應32x32塊尺寸。一些實施例中,當該仿射運動候選者被允許包含在該AMVP候選者清單中時,該AMVP候選者清單和該合併候選者清單具有相同的運動類型。一些實施例中,該相同的運動類型對應平移運動或基於子塊的運動。
容易理解的是,本申請的元件,如圖式中一般描述和說明的那樣,可以以各種不同的配置進行佈置和設計。因此,以下對本申請的系統和方法的實施例的更詳細描述,如圖式所示,並不是為了限制本申請的範圍,而只是代表本申請的選定實施例。本說明書中提到的「一個實施例」、「一種實施例」、或類似的語言意味著與實施例相關的特定特徵、結構、或特性可包括在本申請的至少一個實施例中。因此,在本說明書各處出現的「在一個實施例中」或「在一種實施例中」的短語並不一定都是指同一個實施例。
此外,所描述的特徵、結構、或特性可以以任何合適的方式組合在一個或複數個實施例中。然而,相關技術領域的通常知識者會認識到,本申請可以在沒有一個或複數個具體細節的情況下實施,也可以用其他方法、元件等實施。在其他情況下,為了避免掩蓋本申請的各個方面,本申請沒有詳細顯示或描述眾所周知的結構或操作。圖式可以更好地理解本申請的圖示實施例,其中相同的部件通篇用相同的數字表示。以下描述僅以舉例的方式進行,只是說明瞭與本申請專利範圍相一致的設備和方法的某些選定實施例。
如前所述,AMVP合併模式的計算量相當大,用於MV細化的雙邊匹配演算法會顯著增加系統頻寬。因此,本申請公開了降低系統頻寬要求和/或進一步提高性能的方案。
方法1:簡化AMVP合併模式下合併候選者清單的重新排序方案
在JVET-X0083中,AMVP合併模式的合併候選者將首先通過雙邊匹配重新排序,然後從重新排序後的前兩名候選者中選擇一個作為AMVP合併模式的最終候選者。一個EP(等概率)分區會被發出訊號,指示哪個候選者被選中。由於AMVP合併過程中合併候選者清單的雙邊匹配重新排序可能需要較高的頻寬,因此建議用其他方法取代這一步。
在一個實施例中,建議使用MV成本對合併候選者清單重新排序。MV成本較低的運動將被前移,並以較小的合併指數表示,其中運動指的是與候選者相關的運動資訊,如運動向量和相應的參考圖片清單和參考圖片指數。例如,一側的MV(即MvL0或MvL1)將根據圖片順序計數(POC)映射到另一側的參考圖片(即L1或L0)。換句話說,映射是相對於當前圖片進行的,以便MV和映射的MV位於當前圖片的兩側。之後,兩個動作之間的絕對距離將被用作MV成本。兩個運動距離越近,MV成本越小。或者,兩個運動距離越遠,MV成本越小。在另一個例子中,不僅可以使用兩個動作之間的距離作為MV成本,還可以考慮兩個參考圖片的參考圖片指數或當前圖片與各自參考圖片之間的POC距離。例如,如果兩個候選者的兩個運動之間的距離相同,則使用兩個參考圖片的參考圖片指數或POC距離進行判定。再例如,可以使用一個以上的標準來重新排序,並通過複數個因素的加權和來計算最終的MV成本。(即兩個運動之間的距離、參考圖片指數、或參考圖片的POC)。再例如,可以使用一個以上的標準來重新排序,並通過分層演算法對它們進行比較。再例如,首先比較兩個運動距離,只有當兩個運動距離相同時,才比較參考圖片指數。
方法
2
:啟用具有
BCW
的
AMVP
合併
在JVET-X0083公開的原始AMVP合併模式中,AMVP預測和合併預測使用默認的等權重合並。在本申請的一個實施例中,建議在AMVP合併模式下支援BCW。BCW指數可以從合併候選者中繼承。在另一個實施例中,BCW指數是基於範本匹配(TM)成本設計的。例如,AMVP合併模式的L0和L1中參考塊的相鄰範本用於計算TM成本。相鄰範本可以是N個上行範本和M個左行範本,其中N和M可以是大於0的任意整數。對於TM成本較大的一側(L0或L1),在雙預測混合時會使用較小的權重。而對於TM成本(L0或L1)較小的另一側,則在雙預測混合中使用較大的權重。再例如,在AMVP合併模式中應用TM細化或其他運動細化過程。在推導出最終的細化運動後,對細化運動測試複數個具有不同權重對的BCW指數。選擇TM成本最低的權重對作為最終權重對。再例如,BCW指數選擇可與TM細化過程或其他運動細化過程一起進行。因此,在運動細化過程中,具有不同權重對的BCW指數會在不同的運動偏移下進行測試。例如,菱形搜索中的每個偏移都要用不同的權重對進行測試。通過這種方法,可以選擇最佳的BCW指數和偏移對。在另一個實施例中,直接向解碼器發送BCW指數訊號,將AMVP合併模式的權重對指示為常規幀間模式。在另一個實施例中,當當前CU的尺寸小於或大於預設閾值時,向解碼器發送BCW指數訊號,以指示AMVP合併模式的權重對。
在另一個實施例中,直接向解碼器發出BCW指數訊號,以指示AMVP合併模式的權重對為常規幀間模式。相應BCW指數的權重對中權重較小的用於AMVP預測器,相應BCW指數的權重對中權重較大的用於合併預測器。或者,也可以以相反的方式設計,即相應BCW指數的權重對中權重較大的用於合併預測器。
在一個實施例中,BCW指數根據當前塊的QP、AMVP參考圖片與合併參考圖片之間的POC差值、與AMVP參考圖片和合併參考圖片相關的參考圖片指數、或它們的任意組合推導出。
方法
3
:啟用具有仿射的
AMVP
合併
在JVET-X0083中公開的原始AMVP合併模式中,如果使用AMVP合併,則仿射模式將被禁用。在一個實施例中,不僅平移運動可用於預測AMVP合併模式的AMVP部分,仿射運動也可用於預測AMVP合併模式的AMVP部分。在另一個實施例中,CU尺寸限制用於決定是否支援AMVP合併的仿射模式。例如,只有當CU的尺寸大於或小於閾值(如32x32)時,才能啟用AMVP合併模式的仿射。在另一個實施例中,不僅平移運動可用於預測AMVP合併模式的合併部分,基於子塊的合併候選(即仿射運動)也可用於預測AMVP合併模式的合併部分。在另一個實施例中,可以進一步限制AMVP合併模式的AMVP部分和合併部分的運動類型必須相同。例如,如果啟用了具有仿射運動候選的AMVP合併模式,那麼AMVP部分和合併部分的運動都是平移運動。又例如,如果啟用了具有仿射運動候選的AMVP合併模式,則AMVP和合併部分中的運動均為基於子塊的運動。
上述提出的任何AMVP合併方法都可以在編碼器和/或解碼器中實現。例如,所提出的任何方法都可以在編碼器的交互編解碼(如第1A圖中的幀間預測112)和/或解碼器的交互編解碼模組(如第1B圖中的MC 152)中實現。或者,所提出的任何方法都可以作為與編碼器和/或解碼器的交互編解碼耦合的電路來實現,從而提供交互編解碼所需的資訊。
第3圖示出了本申請實施例提供的使用簡化AMVP合併模式的視頻編解碼系統的示例性流程圖。流程圖中所示的步驟可作為可在編碼器側的一個或複數個處理器(例如一個或複數個CPU)上執行的程式碼來實現。流程圖中所示的步驟也可以基於硬體來實現,如一個或複數個電子設備或處理器,以執行流程圖中的步驟。根據該方法:在步驟310中,接收與當前圖片中的當前塊相關聯的輸入資料,其中輸入資料包括用於在編碼器側進行編碼的當前塊的圖元資料,或用於在解碼器側進行解碼的與當前塊相關聯的編碼資料。在步驟320中,從AMVP(高級運動向量預測)候選者清單中確定目標AMVP候選者。在步驟330中,確定合併候選者清單。在步驟340中,根據與合併候選者清單中的合併候選者相關的MV成本,對合併候選者重新排序,以形成重新排序的合併候選者清單;其中,每個MV成本是基於包括MV距離的一個或複數個因素來測量的,MV距離是在合併候選者清單中的每個候選者和相應的映射MV之間測量的;其中,與當前圖片一側的第一參考圖片相關的每個候選者被映射到當前圖片另一側的第二參考圖片中的相應映射MV上。在步驟350中,從重新排序的合併候選者清單中確定目標合併候選者。在步驟360中,基於目標AMVP候選者和目標合併候選者生成目標AMVP合併候選者。在步驟370中,使用包括目標AMVP合併候選者的運動候選者清單對當前塊進行編碼或解碼。
第4圖示出了本申請實施例提供的使用具有CU級權重(BCW)的雙預測AMVP合併模式的視頻編碼系統的示例性流程圖。根據該方法:在步驟410中,接收與當前圖片中的當前塊相關聯的輸入資料,其中輸入資料包括用於在編碼器側進行編碼的當前塊的圖元資料,或用於在解碼器側進行解碼的與當前塊相關聯的編碼資料。在步驟420中,從AMVP(高級運動向量預測)候選者清單中確定目標AMVP候選者。在步驟430中,從合併候選者清單中確定目標合併候選者。在步驟440中,從包括兩個或以上權重對的權重對集中確定目標權重對。在步驟450中,根據目標權重對,以目標AMVP候選者和目標合併候選者的加權和生成目標AMVP合併候選者。在步驟460中,使用包括目標AMVP合併候選者的運動候選者清單對當前塊進行編碼或解碼。
第5圖示出了使用具有仿射運動的AMVP合併模式的視頻編碼系統的示例性流程圖。根據該方法:在步驟510中,接收與當前圖片中的當前塊相關聯的輸入資料,其中輸入資料包括用於在編碼器側進行編碼的當前塊的圖元資料,或用於在解碼器側進行解碼的與當前塊相關聯的編碼資料。在步驟520中,從AMVP(高級運動向量預測)候選者清單中確定目標AMVP候選者,其中AMVP候選者清單包括仿射運動候選者。在步驟530中,從合併候選者清單中確定目標合併候選者。在步驟540中,通過使用一個方向上的目標AMVP候選者和另一個方向上的目標合併候選者,為雙預測候選者生成目標AMVP合併候選者。在步驟550中,使用包括目標AMVP合併候選者的運動候選者清單對當前塊進行編碼或解碼。
所示流程圖旨在說明根據本申請進行視頻編碼的一個示例。本領域的通常知識者可以在不脫離本申請精神的前提下修改每個步驟、重新安排步驟、拆分步驟、或合併步驟以實施本申請。在公開的內容中,特定的語法和語義被用來舉例說明本申請的實施例。通常知識者可以在不背離本申請精神的前提下,用等效的語法和語義代替這些語法和語義來實施本申請。
上述描述旨在使本領域的通常知識者能夠在特定應用及其要求的背景下實施本申請。對於本領域的通常知識者來說,對所描述的實施例進行各種修改是顯而易見的,本文所定義的一般原則可應用於其他實施例。因此,本申請無意局限於所示和所描述的特定實施例,而是要賦予本申請與所公開的原則和新穎特徵相一致的最廣泛的範圍。在上述詳細描述中,說明瞭各種具體細節,以提供對本申請的透徹理解。儘管如此,本領域的通常知識者可以理解,本申請是可以實施的。
上述本申請的實施例可以通過各種硬體、軟體代碼、或兩者的組合來實現。例如,本申請的一個實施例可以是集成在視頻壓縮晶片中的電路,也可以是集成在視頻壓縮軟體中的程式碼,以執行本文所述的處理。本申請的一個實施例也可以是在數位訊號處理器(DSP)上執行的程式碼,以執行本文所述的處理。本申請還可能涉及由電腦處理器、數位訊號處理器、微處理器、或現場可程式設計閘陣列(FPGA)執行的一系列功能。通過執行定義本申請所體現的特定方法的機器可讀軟體代碼或固件代碼,這些處理器可被配置為執行本申請的特定任務。軟體代碼或固件代碼可以用不同的程式設計語言和不同的格式或樣式開發。軟體代碼也可以針對不同的目標平臺進行編譯。然而,軟體代碼的不同代碼格式、風格和語言、以及配置代碼以執行符合本申請的任務的其他方法不會脫離本申請的精神和範圍。
本申請可以在不脫離其精神或基本特徵的情況下以其他具體形式體現。所描述的示例在所有方面均應僅視為說明性的而非限制性的。因此,本申請的範圍是由所附的發明申請專利範圍而不是上述描述來說明的。在發明申請專利範圍的含義和等同範圍內的所有變化都應包含在發明申請專利範圍的範圍內。
110:幀內預測
112:幀間預測
114:開關
116:加法器
118:變換
120:量化
122:熵編碼器
124:反量化
126:反變換
128:重構(REC)
130:環內濾波器
134:參考圖片緩衝器
136:預測資料
140:熵解碼器
150:幀內預測
152:運動補償(MC)
210:當前圖片
214,22:參考圖片清單
220:當前塊
222,224:同位塊
232,234:初始MV
242,244:候選塊
252,254:候選MV
262,264:偏移量
310,320,330,340,350,360,370,410,420,430,440,450,460,510,520,530,540,550:步驟
第1A圖示出了一種包含迴圈處理的自我調整幀內/幀間視頻編碼系統。
第1B圖展示了第1A圖中編碼器的相應解碼器。
第2圖示出了VVC中解碼器側運動向量細化(DMVR)的示例。
第3圖示出了本申請實施例提供的使用簡化AMVP合併模式的視頻編解碼系統的示例性流程圖。
第4圖示出了本申請實施例提供的使用具有CU級權重(BCW)的雙預測AMVP合併模式的視頻編碼系統的示例性流程圖。
第5圖示出了使用具有仿射運動的AMVP合併模式的視頻編碼系統的示例性流程圖。
410,420,430,440,450,460:步驟
Claims (19)
- 一種視頻編解碼方法,其改良在於,包括: 接收與當前圖片中的當前塊相關聯的輸入資料;其中,該輸入資料包括用於在編碼器側進行編碼的該當前塊的圖元資料,或用於在解碼器側進行解碼的與該當前塊相關聯的編碼資料; 從AMVP(高級運動向量預測)候選者清單中確定目標AMVP候選者; 確定合併候選者清單; 根據與該合併候選者清單中的合併候選者相關的運動向量(MV)成本,對該合併候選者重新排序,以形成重新排序的合併候選者清單;其中,每個該MV成本是基於包括MV距離的一個或複數個因素來測量的,該MV距離是在該合併候選者清單中的每個候選者和相應映射MV之間測量的;其中,與第一參考圖片相關的每個該候選者被映射到第二參考圖片中的該相應映射MV上; 從該重新排序的合併候選者清單中確定目標合併候選者; 基於該目標AMVP候選者和該目標合併候選者生成目標AMVP合併候選者;以及 使用包括該目標AMVP合併候選者的運動候選者清單對該當前塊進行編碼或解碼。
- 如請求項1所述之方法,其中,MV成本較低的一個或多個該合併候選者在該重新排序的合併候選者清單中向前移動。
- 如請求項1所述之方法,其中,MV成本較低的該合併候選者被分配給較小的合併指數。
- 如請求項1所述之方法,其中,該一個或複數個因素包括與該第一參考圖片和該第二參考圖片相關聯的參考指數和/或圖片順序計數(POC)。
- 如請求項1所述之方法,其中,每個該MV成本是由該一個或複數個因素中至少兩個因素的加權和推導出的。
- 一種視頻編解碼裝置,其改良在於,包括一個或複數個電子電路或處理器,用於: 接收與當前圖片中的當前塊相關聯的輸入資料;其中,該輸入資料包括用於在編碼器側進行編碼的該當前塊的圖元資料,或用於在解碼器側進行解碼的與該當前塊相關聯的編碼資料; 從AMVP(高級運動向量預測)候選者清單中確定目標AMVP候選者; 確定合併候選者清單; 根據與該合併候選者清單中的合併候選者相關的運動向量(MV)成本,對該合併候選者重新排序,以形成重新排序的合併候選者清單;其中,每個該MV成本是基於包括MV距離的一個或複數個因素來測量的,該MV距離是在該合併候選者清單中的每個候選者和相應映射MV之間測量的;其中,與第一參考圖片相關的每個該候選者被映射到第二參考圖片中的該相應映射MV上; 從該重新排序的合併候選者清單中確定目標合併候選者; 基於該目標AMVP候選者和該目標合併候選者生成目標AMVP合併候選者;以及 使用包括該目標AMVP合併候選者的運動候選者清單對該當前塊進行編碼或解碼。
- 一種視頻編解碼方法,其改良在於,包括: 接收與當前圖片中的當前塊相關聯的輸入資料;其中,該輸入資料包括用於在編碼器側進行編碼的該當前塊的圖元資料,或用於在解碼器側進行解碼的與該當前塊相關聯的編碼資料; 從AMVP(高級運動向量預測)候選者清單中確定目標AMVP候選者; 從合併候選者清單中確定目標合併候選者; 從包括兩個或以上權重對的權重對集中確定目標權重對; 根據該目標權重對,以該目標AMVP候選者和該目標合併候選者的加權和生成目標AMVP合併候選者;以及 使用包括該目標AMVP合併候選者的運動候選者清單對該當前塊進行編碼或解碼。
- 如請求項7所述之方法,其中,與該目標權重對相關聯的權重指數從該目標合併候選者繼承。
- 如請求項7所述之方法,其中,根據範本匹配成本推導出與該目標權重對相關聯的權重指數,該範本匹配成本根據一個AMVP參考塊的第一相鄰範本和一個合併參考塊的第二相鄰範本計算得出。
- 如請求項7所述之方法,其中,根據以下的任意一個或複數個:一個AMVP參考圖片和一個合併參考圖片的切片量化參數(QP)、該AMVP參考圖片與該當前圖片之間的圖片順序計數(POC)差值、該合併參考圖片與該當前圖片之間的POC、與該AMVP參考圖片和該合併參考圖片相關聯的參考圖片ID,推導出與該目標權重對相關聯的權重指數。
- 如請求項7所述之方法,其中,在位元流中發出或從位元流中解析出與該目標權重對相關聯的權重指數。
- 一種視頻編解碼裝置,其改良在於,包括一個或複數個電子電路或處理器,用於: 接收與當前圖片中的當前塊相關聯的輸入資料;其中,該輸入資料包括用於在編碼器側進行編碼的該當前塊的圖元資料,或用於在解碼器側進行解碼的與該當前塊相關聯的編碼資料; 從AMVP(高級運動向量預測)候選者清單中確定目標AMVP候選者; 從合併候選者清單中確定目標合併候選者; 從包括兩個或以上權重對的權重對集中確定目標權重對; 根據該目標權重對,以該目標AMVP候選者和該目標合併候選者的加權和生成目標AMVP合併候選者;以及 使用包括該目標AMVP合併候選者的運動候選者清單對該當前塊進行編碼或解碼。
- 一種視頻編解碼方法,其改良在於,包括: 接收與當前圖片中的當前塊相關聯的輸入資料;其中,該輸入資料包括用於在編碼器側進行編碼的該當前塊的圖元資料,或用於在解碼器側進行解碼的與該當前塊相關聯的編碼資料; 從AMVP(高級運動向量預測)候選者清單中確定目標AMVP候選者;其中,該AMVP候選者清單包括仿射運動候選者; 從合併候選者清單中確定目標合併候選者; 通過使用一個方向上的該目標AMVP候選者和另一個方向上的該目標合併候選者,為雙預測候選者生成目標AMVP合併候選者;以及 使用包括該目標AMVP合併候選者的運動候選者清單對該當前塊進行編碼或解碼。
- 如請求項13所述之方法,其中,該合併候選者清單進一步包括該仿射運動候選者。
- 如請求項14所述之方法,其中,只有當該當前塊大於或小於閾值時,該仿射運動候選者才能被包含在該AMVP候選者清單中。
- 如請求項15所述之方法,其中,該閾值對應32x32塊尺寸。
- 如請求項13所述之方法,其中,當該仿射運動候選者被允許包含在該AMVP候選者清單中時,該AMVP候選者清單和該合併候選者清單具有相同的運動類型。
- 如請求項17所述之方法,其中,該相同的運動類型對應平移運動或基於子塊的運動。
- 一種視頻編解碼裝置,其改良在於,包括一個或複數個電子電路或處理器,用於: 接收與當前圖片中的當前塊相關聯的輸入資料;其中,該輸入資料包括用於在編碼器側進行編碼的該當前塊的圖元資料,或用於在解碼器側進行解碼的與該當前塊相關聯的編碼資料; 從AMVP(高級運動向量預測)候選者清單中確定目標AMVP候選者;其中,該AMVP候選者清單包括仿射運動候選者; 從合併候選者清單中確定目標合併候選者; 通過使用一個方向上的該目標AMVP候選者和另一個方向上的該目標合併候選者,為雙預測候選者生成目標AMVP合併候選者;以及 使用包括該目標AMVP合併候選者的運動候選者清單對該當前塊進行編碼或解碼。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/369,672 | 2022-07-28 | ||
WOPCT/CN2023/107654 | 2023-07-17 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202423120A true TW202423120A (zh) | 2024-06-01 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI700922B (zh) | 用於視訊編解碼系統中的子塊運動補償的視訊處理方法和裝置 | |
JP7368554B2 (ja) | Dmvrのためのブロックサイズ制限 | |
CN110809887B (zh) | 用于多参考预测的运动矢量修正的方法和装置 | |
US10999595B2 (en) | Method and apparatus of motion vector prediction or merge candidate derivation for video coding | |
US10979707B2 (en) | Method and apparatus of adaptive inter prediction in video coding | |
WO2017076221A1 (en) | Method and apparatus of inter prediction using average motion vector for video coding | |
CN116915982B (zh) | 用于视频解码的方法、电子设备、存储介质和程序产品 | |
TW202139702A (zh) | 視訊編解碼系統中的視訊處理方法和裝置 | |
TWI729483B (zh) | 視訊編解碼系統的運動向量湊整統一的方法以及裝置 | |
TW202327351A (zh) | 視頻編解碼系統中編解碼模式選擇的方法和裝置 | |
TW202423120A (zh) | 採用合併模式進行視頻編解碼的amvp方法和裝置 | |
US20180249155A1 (en) | Method and apparatus of prediction offset derived based on neighbouring area in video coding | |
WO2024022145A1 (en) | Method and apparatus of amvp with merge mode for video coding | |
WO2024088048A1 (en) | Method and apparatus of sign prediction for block vector difference in intra block copy | |
TWI830334B (zh) | 視頻編解碼系統中低延遲模板匹配的方法和裝置 | |
WO2023221993A1 (en) | Method and apparatus of decoder-side motion vector refinement and bi-directional optical flow for video coding | |
TWI847227B (zh) | 視頻編解碼系統中低延遲模板匹配的方法和裝置 | |
WO2024027784A1 (en) | Method and apparatus of subblock-based temporal motion vector prediction with reordering and refinement in video coding | |
WO2024017061A1 (en) | Method and apparatus for picture padding in video coding | |
WO2023020590A1 (en) | Method and apparatus for hardware-friendly template matching in video coding system | |
WO2023134564A1 (en) | Method and apparatus deriving merge candidate from affine coded blocks for video coding | |
TW202420810A (zh) | 視訊編碼系統中使用模板匹配進行畫面間預測的方法和裝置 | |
TW202410696A (zh) | 使用合併mvd模式降低視頻編碼複雜性的方法和裝置 | |
TW202402059A (zh) | 視訊編解碼方法和裝置 | |
WO2024019764A1 (en) | Method for diversified merge candidate reordering |