TW201826799A - 視訊編碼中用於運動向量符號預測的方法及裝置 - Google Patents
視訊編碼中用於運動向量符號預測的方法及裝置 Download PDFInfo
- Publication number
- TW201826799A TW201826799A TW106140281A TW106140281A TW201826799A TW 201826799 A TW201826799 A TW 201826799A TW 106140281 A TW106140281 A TW 106140281A TW 106140281 A TW106140281 A TW 106140281A TW 201826799 A TW201826799 A TW 201826799A
- Authority
- TW
- Taiwan
- Prior art keywords
- motion vector
- candidate
- current block
- template
- reconstructed
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本發明公開了一種運動向量重構的方法及裝置,其基於一個運動向量預測子和一個運動向量差值。根據本方法,接收與包括當前圖像中的當前塊的視訊序列相關的輸入資料。推導出對應於運動向量差值的所有候選符號對的候選重構運動向量位置,其中利用運動向量差值的一個候選符號對,每個候選重構運動向量位置被推導為運動向量預測子與運動向量差值的第一幅度和第二幅度的向量和。評估用於當前塊的範本與用於每個候選重構運動向量位置的相應範本之間的範本匹配。在所有候選重構運動向量位置中選擇目標候選運動向量位置。使用對應於目標候選運動向量位置的目標候選運動向量,對當前塊進行編碼或者解碼。
Description
本發明要求在2016年11月22日提出的申請號為62/425,172的美國臨時專利申請的優先權。該美國臨時專利申請整體以引用方式併入本文中。
本發明涉及用於視訊編碼的運動向量預測。具體而言,本發明涉及運動向量符號推導或者預測,以提高運動向量編碼的編碼效率。
高效視訊編碼(High-Efficiency Video Coding,HEVC)是一種由關於視訊編碼的聯合合作小組(Joint Collaborative Team on Video Coding,JCT-VC)所開發的新的國際視訊編碼準則。HEVC是基於混合基於塊運動補償DCT樣變換的編碼結構。用於壓縮的基礎單元,稱為編碼單元(coding unit,CU),是2Nx2N方塊,並且每個編碼單元可以被遞迴分割成四個更小編碼單元,直到達到預定義的最小尺寸。每個編碼單元包含一個或複數個預測單元(prediction unit,PU)。
為了實現HEVC中混合編碼結構的最佳編碼效 率,存在兩種預測模式以用於每個預測單元,其是畫面內預測和畫面間預測。對於畫面內預測模式,空間相鄰重構像素可以用於生成方向預測。HEVC中存在多達35種方向。對於畫面間預測模式,時間重構參考資訊框可以用於生成運動補償預測。存在三種不同的模式,包括跳躍(Skip)模式、合併(Merge)模式和畫面間高級運動向量預測(Advanced Motion Vector Prediction,AMVP)模式。
當以畫面間高級運動向量預測模式編碼預測單元時,利用可以與用於推導出運動向量的運動向量預測子(Motion Vector Predictor,MVP)一起使用的傳輸運動向量差值(motion vector difference,MVD),運動補償預測被執行。為了畫面間高級運動向量預測模式中的運動向量預測子,高級運動向量預測方案用於在包括兩個空間運動向量預測子和一個時間運動向量預測子的高級運動向量預測候選集中選擇一運動向量預測子。因此,在高級運動向量預測模式中,用於運動向量預測子的運動向量預測子索引和相應的運動向量差值被需要以被編碼和傳輸。另外,用來指定雙向預測(bi-prediction)與列表0和列表1相關的單預測(uni-prediction)的預測方向和用於每個列表的參考資訊框索引一起,也應被編碼和傳輸。
當以跳躍模式或者合併模式編碼預測單元時,除了所選擇的候選的合併索引之外,沒有運動資訊被傳輸。這是因為跳躍模式和合併模式使用運動推理(motion inference)方法(即MV=MVP+MVD,其中MVD為0),以獲得來自於位於 同位(co-located)圖像中的空間相鄰塊(空間候選)或者時間塊(時間候選)的運動資訊,其中,同位圖像是列表0或列表1中的第一參考圖像,其被發信在切片頭中。在跳躍預測單元的情況中,參考發信也被忽略。為了確定跳躍模式和合併模式的合併索引,合併方案用於在包括四個空間運動向量預測子和一個時間運動向量預測子的合併候選集中選擇一運動向量預測子。
本發明公開了一種運動向量重構的方法及裝置,其在視訊編碼系統中基於一個運動向量預測子和一個運動向量差值。根據本方法,接收與包括當前圖像中的當前塊的視訊序列相關的輸入資料。自輸入資料確定運動向量預測子以用於當前塊。也確定與當前塊相關的運動向量差值的第一幅度和第二幅度。推導出對應於運動向量差值的所有候選符號對的複數個候選重構運動向量位置,其中利用運動向量差值的一個候選符號對,每個候選重構運動向量位置被推導為運動向量預測子與運動向量差值的第一幅度和第二幅度的向量和。確定用於當前塊的範本,其中範本自當前塊的複數個相鄰重構像素形成。評估用於當前塊的範本與用於每個候選重構運動向量位置的相應範本之間的範本匹配。基於包括所有候選重構運動向量位置中的最佳範本匹配的一個或複數個性能準則,在所有候選重構運動向量位置中選擇目標候選運動向量位置。使用對應於範本候選運動向量位置的範本候選運動向量,對當前塊進行編碼或者解碼。
基於包括絕對差之和或者平方差之和的預設準則,評估範本匹配。性能準則還包括包括先前選擇符號對或者先前運動向量預測子的統計的其他解碼器側的資訊。在一個實施例中,若運動向量預測子或者運動向量差值具有分數像素精度,則基於相應範本的複數個附近整數像素位置,評估用於當前塊的範本與用於每個候選重構運動向量位置的相應範本之間的範本匹配。在這種情況中,若用於兩個候選重構運動向量位置的兩個相應範本落入一相同位置,則兩個相應範本的位置被修改以變成分開的。此外,兩個相應範本的位置可以被修改以位於運動向量預測子的左邊和右邊,或者運動向量預測子的上端和下端。
本方法可以包括:基於一個運動向量預測子與一個候選重構運動向量位置之間的距離,修剪一個或複數個候選重構運動向量位置,其中若特定候選重構運動向量位置相比於運動向量預測子更靠近候選運動向量預測子集中的另一個運動向量預測子,則特定候選重構運動向量位置被修剪,並不被評估以用於範本匹配。
透過發信一控制標誌,是否使用目標候選運動向量編碼或者解碼當前塊可以被顯性地開啟或者關閉。可選地,是否使用目標候選運動向量編碼或者解碼當前塊也可以被隱性地開啟或者關閉。例如,基於應用到運動向量差值的第一幅度和第二幅度的互斥或操作的結果,是否使用目標候選運動向量編碼或者解碼當前塊可以被開啟或者關閉。
對應於目標候選運動向量位置的所選擇符號對可 以用作一預測子以用於編碼或者解碼運動向量差值的複數個符號。使用單個二進制位元或者最短碼字,可以編碼對應於運動向量差值的複數個符號等於所選擇符號對的預測命中條件。使用兩個或以上二進制位元,可以編碼對應於運動向量差值的複數個符號不等於所選擇符號對的其他預測條件,其中其他預測條件包括水平翻轉條件、垂直翻轉條件和對角線翻轉條件。生成以用於與當前圖像中的複數個塊相關的複數個預測條件的二值化位元(bins)可以被上下文編碼。
在另一實施例中,若運動向量差值的第一幅度和第二幅度中的任何一個為0,則來自於當前塊的第一單符號可以與來自於另一塊或者來自於另一預測列表中當前塊的第二單符號組合在一起,以形成聯合符號對,並且使用單個二進制位元或者最短碼字,可以編碼對應于第一單符號和第二單符號均被正確預測的預測命中條件。使用兩個或以上二進制位元,可以編碼對應于聯合符號對中的至少一個不被正確預測的複數個其他預測條件,其中複數個其他預測條件包括第一單符號命中且第二單符號沒命中的條件、第一單符號沒命中且第二單符號命中的條件以及第一單符號和第二單符號均沒命中的條件。
本發明的方面還提供了一種非暫時性電腦可讀介質,存儲有複數個程式指令,使得一裝置的處理電路執行基於一個運動向量預測子和一個運動向量差值的運動向量重構的方法。在一些實施例中,接收與包括當前圖像中的當前塊的視訊序列相關的輸入資料。自輸入資料確定運動向量預測子以用 於當前塊。也確定與當前塊相關的運動向量差值的第一幅度和第二幅度。推導出對應於運動向量差值的所有候選符號對的複數個候選重構運動向量位置,其中利用運動向量差值的一個候選符號對,每個候選重構運動向量位置被推導為運動向量預測子與運動向量差值的第一幅度和第二幅度的向量和。確定用於當前塊的範本,其中範本自當前塊的複數個相鄰重構像素形成。評估用於當前塊的範本與用於每個候選重構運動向量位置的相應範本之間的範本匹配。基於包括所有候選重構運動向量位置中的最佳範本匹配的一個或複數個性能準則,在所有候選重構運動向量位置中選擇目標候選運動向量位置。使用對應於範本候選運動向量位置的範本候選運動向量,對當前塊進行編碼或者解碼。
110‧‧‧運動向量差值
210、220‧‧‧範本
214‧‧‧當前塊
410~480‧‧‧步驟
第1圖是基於運動向量預測子和運動向量差值的幅度的運動向量(motion vector,MV)重構的示例。
第2圖是根據本發明的使用範本匹配的用於運動向量差值的符號推導的示例。
第3圖是解碼器側使用諸如候選符號位置與包括當前運動向量預測子和來自於候選運動向量預測子集的另一運動向量預測子的運動向量預測子之間的距離的可用資訊修剪(prun)一個或複數個候選符號位置的示例。
第4圖是根據本發明實施例的視訊編碼系統的示例性流程圖,其中使用範本匹配推導出或者預測出運動向量差值的符號。
以下描述為實施本發明的較佳實施例。本描述用於示出本發明的一般原理,並非用以限定作用。本發明的保護範圍當視所附上的申請專利範圍所界定為准。
當以畫面間高級運動向量預測模式編碼當前塊(或者預測單元)時,運動向量預測子索引和用於X分量和Y分量的兩個運動向量差值被編碼,以表示運動向量。根據HEVC,對於每個運動向量差值,使用上下文自適應二進位算術編碼(Context-Adaptive Binary Arithmetic Coding,CABAC)熵編碼,單獨編碼幅度和符號。由於不同的統計,總是對幅度部分使用上下文位元進行編碼,而對符號部分使用旁路位元(bypass bin)進行編碼(即具有均等概率)。在本發明中,公開了一種方案,以更有效地編碼運動向量差值符號(MVD signs)。
當使用運動向量預測子時,在解碼器側,使用運動向量預測子和運動向量差值重構運動向量。如第1圖所示,由於運動向量差值的符號未知,每個運動向量存在四種可能性。如第1圖所示,absMvdHor和absMvdVer分別是運動向量差值110的X分量和Y分量的絕對值(即幅度)。如本示例所示,如第1圖所示,如果運動向量差值的X分量和Y分量的符號均為正,則使用運動向量預測子加運動向量差值(即MV=MVP+MVD),可以推導出運動向量。如果解碼器可以推斷出正確的符號,則無需在位元流中編碼這些符號。為了正確地執行解碼流程,在編碼器側,也將執行相同的符號推導流程。在第1圖中,標記為運動向量預測子的圓圈表示運動向量預測子 所指向的位置。用不同的符號對(即(+,+),(+,-),(-,+),(-,-))標記的四個圓圈對應於重構運動向量所指向的四個可能的符號位置。在本發明中,為求方便,運動向量差值也可以指具有運動向量差值X分量和運動向量差值Y分量的向量。
在一個實施例中,範本匹配方法用於解碼器推導出正確的符號位置。推導出正確的符號位置的示例如第2圖所示,其中當前塊(即214)的運動向量待解碼。當前塊214的相鄰重構像素用於形成範本(即210)。根據運動向量預測子索引,在解碼器側,可以推導出運動向量預測子。在編碼器側,運動向量預測子將自一候選列表選擇,並且所選擇的運動向量預測子的索引被發信在位元流中。當在解碼器側解碼absMvdHor和absMvdVer時,如用不同符號對標記的四個圓圈所示,重構運動向量的四個可能位置可以被確定。位於每個可能重構運動向量位置(在本發明中也稱為“候選重構運動向量位置”)處的相應範本可以被形成。在第2圖中,示出了用於對應於(-,+)的可能位置的相應範本(即220)。同樣地,用於三個其他可能位置的範本可以被確定。用與用於當前塊的範本相同數量的像素、形狀和距離,相應範本被形成,以為了執行範本匹配。例如,範本210與範本220匹配。在用於所有四個可能位置的匹配結果被確定之後,基於預定準則(例如,絕對值差之和(sum of absolution differences,SAD)或者平方差之和(sum of squared differences,SSD))的最佳匹配位置可以被推斷成最終運動向量差值符號位置。在解碼器側可用的任何其他資訊也可以用於輔助符號推導流程,並提高正確性。例 如,符號位置、運動向量預測子位置等的先前統計可以被使用。
在另一實施例中,用於四個可能符號位置的範本可以被推導出,而無需使用正確的運動向量精度(MV precision)。例如,如果使用四分之一像素精度編碼運動向量,則使用最接近整數位置,可以推導出範本位置。然而,與X方向或Y方向上的“-”符號和“+”符號相關的兩個基於整數的範本位置可以落入到相同位置,特別對於較小的absMvdHor或absMvdVer可能會發生这种情況。如果這些基於整數的範本中的任意兩個落入相同的位置,則約束或者規則可以被使用,以確保兩個範本相互分開的。例如,如果兩個範本落入相同的位置,則一個應位於運動向量預測子的左手邊,另一個應位於運動向量預測子的右手邊。可選地,一個應位於運動向量預測子上端處,另一個應位於運動向量預測子的下端處。
在另一實施例中,解碼器處的可用資訊可以用於提高符號預測推導流程的正確性。第3圖示出了一種示例,其中共存在兩個運動向量預測子(MVP 1和MVP 2),且MVP 1由編碼器使用以用於當前塊。換言之,MVP 2在候選運動向量預測子集中,但不由編碼器選擇以作為用於當前塊的運動向量預測子。在解碼器側,根據自符號位置到這兩個運動向量預測子的相應距離,四個可能運動向量差值符號位置中的一個或複數個可以被修剪。如本示例所示,如果(-,+)位置用於重構運動向量,則得到的運動向量位置將更靠近MVP 2位置,而不是MVP 1位置。因此,符號位置可以被修剪,由於編碼器將偏向符號位置與運動向量預測子位置之間的更短距離(即更小運動 向量差值幅度)。如果(-,+)位置是正確位置,則編碼器將選擇MVP 2而非MVP 1。透過修剪一些符號位置,其可以降低選擇錯誤符號位置的可能性,也降低所需計算,以用於評估範本匹配。
在另一實施例中,使用一個顯性標誌以開啟或者關閉,可以發信符號推導流程。
在另一實施例中,使用隱性方法以開啟或者關閉,可以確定符號推導流程。例如,當運動向量差值的X分量與運動向量差值的Y分量之間的XOR(即互斥或操作)導致偶數數字(即“0”)時,以開啟本流程,否則以關閉。
在另一實施例中,推導符號位置可以使用預測子。使用殘差,真實運動向量差值符號可以被編碼。表1示出了碼字表以使用符號預測子編碼符號殘差的示例。根據碼字表,如果由推導符號流程推斷的預測子與真實運動向量差值符號位置匹配,則僅一個二值化位元(bins)或者二值化位元(即表1中的“0”)需要被編碼。另一方面,原始方法將需要兩個二值化位元(bins)或者二進制位元(bit)(一個用於每個符號)以用於運動向量差值。如果預測子是錯誤的,且真實運動向量差值符號位置與推導符號位置的對角線符號位置匹配(稱為本條件的對角線翻轉(Diagonal flipping)),則需要更多二值化位元或者二進制位元(本示例中的三個)。然而,無論在本符號殘差編碼中使用多少二值化位元或者二進制位元,編碼符號將不再使用具有等概率的旁路位元(bypass bin)。相反,其可以使用具有更有效的自適應概率更新的上下文編碼。表1 也包括水平翻轉預測條件和垂直翻轉預測條件。水平翻轉預測條件指的是真實運動向量差值符號位置與推導的符號位置的水平方向上其他符號位置匹配的條件。垂直翻轉預測條件指的是真實運動向量差值符號位置與推導的符號位置的垂直翻轉方向上其他符號位置匹配的條件。在表1所示的示例中,使用最短碼字,與真實運動向量差值符號位置匹配(即對應於運動向量差值的符號的預測命中條件)的預測子被編碼。
在另一實施例中,當運動向量差值的X分量和Y分量中的任何一個為0時,存在僅一個運動向量差值符號和用於非0分量的兩個可能符號位置。在這種情況中,在表1中,僅一個碼字被需要,以指示預測是命中還是沒命中(即錯過)。表1中的碼字表仍然是可使用的。但是更有效的變形可以被使用。來自於不同預測列表或者不同塊的兩個單符號(single sign)殘差可以被組合成一個,然後使用表2中的碼字表。在這種情景中,如表2所示,碼字表將表示不同的語義。
在另一實施例中,在編碼器側,在模式決策期間,自符號殘差得到的二進制位元可以被考慮,以為了選擇最佳模式。此外,在用於搜索運動向量的運動估計期間,其也可以考慮用於每個運動向量位置的符號殘差二進制位元。換句話說,運動向量不僅生成最佳預測子以用於當前塊,而且形成更少已編碼二值化位元以用於運動向量差值符號殘差。
第4圖示出了根據本發明實施例的視訊編碼系統的示例性流程圖,其中使用範本匹配推導出或者預測運動向量差值的符號。本流程圖以及本發明中的其他流程圖中所示的步驟可以被實現為編碼器側和/或解碼器側的一個或複數個處理器(例如一個或複數個CPU)上可執行的程式碼。本流程圖中所示的步驟也可以基於硬體被實現,例如用於執行該流程圖中步驟的一個或者複數個電子設備或者處理器。根據本方法,在步驟410中,接收與包括當前圖像中的當前塊的視訊序列相關的輸入資料。在解碼器側,輸入資料可以對應於視訊位元流或者用於視訊序列的已壓縮資料。在步驟420中,自輸入資料確定用於當前塊的運動向量預測子。在視訊編碼中已知的是,編碼器可以自候選運動向量預測子集中選擇運動向量預測子並 發信與所選擇的運動向量預測子相關的運動向量預測子索引。解碼器可以根據運動向量預測子索引自候選運動向量預測子集中選擇運動向量預測子。在步驟430中,確定與當前塊相關的運動向量差值的第一幅度和第二幅度。編碼可以自當前運動向量與運動向量預測子之間的差獲得運動向量差值。運動向量差值的幅度被發信在位元流中。解碼器可以自位元流中恢復運動向量差值的幅度。在步驟440中,推導出對應於運動向量差值的所有候選符號對的候選重構運動向量位置,其中每個候選重構運動向量位置利用運動向量差值的一個候選符號對,而被推導為運動向量預測子與運動向量差值的第一幅度和第二幅度的向量和。此相同步驟在編碼器側和解碼器側被執行。在步驟450中,確定用於當前塊的範本,其中範本自當前塊的相鄰重構像素形成。隨後,在步驟460中,執行用於當前塊的範本與用於每個候選重構運動向量位置之間的範本匹配。在步驟470中,基於包括所有候選重構運動向量位置中的最佳目標匹配的一個或複數個性能準則,在所有候選候選重構運動向量位置中選擇目標候選運動向量位置。隨後,在步驟480中,使用對應於目標候選運動向量位置的目標候選運動向量,將編碼和解碼應用到當前塊。
本發明所示的流程圖用於示出根據本發明的視訊編碼的示例。在不脫離本發明的精神的情況下,本領域的通常知識者可以修改每個步驟、重組這些步驟、將一個步驟進行分離或者組合這些步驟來實施本發明。在本發明中,已經使用特定語法和語義來示出不同示例,以實施本發明的實施例。在不 脫離本發明的精神的情況下,透過用等價的語法和語義來替換該語法和語義,本領域的通常知識者可以實施本發明。
上述說明,使得本領域的普通通常知識者能夠在特定應用程式的內容及其需求中實施本發明。對本領域通常知識者來說,所描述的實施例的各種變形將是顯而易見的,並且本文定義的一般原則可以應用於其他實施例中。因此,本發明不限於所示和描述的特定實施例,而是將被賦予與本文所公開的原理和新穎特徵相一致的最大範圍。在上述詳細說明中,說明了各種具體細節,以便透徹理解本發明。儘管如此,將被本領域的通常知識者理解的是,本發明能夠被實踐。
如上所述的本發明的實施例可以在各種硬體、軟體代碼或兩者的結合中實現。例如,本發明的實施例可以是集成在視訊壓縮晶片內的電路,或者是集成到視訊壓縮軟體中的程式代碼,以執行本文所述的處理。本發明的一個實施例也可以是在數位訊號處理器(Digital Signal Processor,DSP)上執行的程式代碼,以執行本文所描述的處理。本發明還可以包括由電腦處理器、數位訊號處理器、微處理器或現場可程式設計閘陣列(field programmable gate array,FPGA)所執行的若干函數。根據本發明,透過執行定義了本發明所實施的特定方法的機器可讀軟體代碼或者韌體代碼,這些處理器可以被配置為執行特定任務。軟體代碼或韌體代碼可以由不同的程式設計語言和不同的格式或樣式開發。軟體代碼也可以被編譯以用於不同的目標平臺。然而,執行本發明的任務的不同的代碼格式、軟體代碼的樣式和語言以及其他形式的配置代碼,不會背離本 發明的精神和範圍。如上所述的本發明的實施例可以在視訊編碼器和視訊解碼器中實施。視訊編碼器和視訊解碼器的元件可以透過硬體元件、被配置為執行存儲在記憶體中的程式指令的一個或複數個處理器或者硬體與處理器的組合來實施。例如,一處理器執行程式指令,以控制接收與包括當前圖像中的當前塊的視訊序列相關的輸入資料。處理器被配置有單個處理核或者複數個處理核。在一些示例中,處理器執行程式指令以執行編碼器和解碼器中一些組件中的功能,以及與處理器電耦接的記憶體用於存儲程式指令,對應於塊的重構圖像的資訊和/或編碼流程或解碼流程期間的中間資料。一些實施例中的記憶體包括非暫時性電腦可讀介質,例如,半導體記憶體或者固態記憶體、隨機訪問記憶體(random access memory,RAM)、唯讀記憶體(read-only memory,ROM)、硬碟、光碟或者其他適當的存儲介質。記憶體也可以是上述列出的非暫時性電腦可讀存儲介質中的兩個或者以上的組合。
本發明可以以不脫離其精神或本質特徵的其他具體形式來實施。所描述的例子在所有方面僅是說明性的,而非限制性的。因此,本發明的範圍由附加的申請專利範圍來表示,而不是前述的描述來表示。申請專利範圍的含義以及相同範圍內的所有變化都應納入其範圍內。
Claims (20)
- 一種運動向量重構的方法,該方法用於視訊編碼系統,基於一個運動向量預測子和一個運動向量差值,該方法包括:接收與包括當前圖像中的當前塊的視訊序列相關的輸入資料;自輸入資料確定運動向量預測子以用於該當前塊;確定與該當前塊相關的運動向量差值的第一幅度和第二幅度;推導出對應於該運動向量差值的所有候選符號對的複數個候選重構運動向量位置,其中利用該運動向量差值的一個候選符號對,每個候選重構運動向量位置被推導為該運動向量預測子與該運動向量差值的該第一幅度和該第二幅度的向量和。確定用於該當前塊的範本,其中該範本自該當前塊的複數個相鄰重構像素形成;評估用於該當前塊的該範本與用於每個候選重構運動向量位置的相應範本之間的範本匹配;基於包括所有候選重構運動向量位置中的最佳範本匹配的一個或複數個性能準則,在所有候選重構運動向量位置中選擇目標候選運動向量位置;以及使用對應於該目標候選運動向量位置的目標候選運動向量,對該當前塊進行編碼或者解碼。
- 如申請專利範圍第1項所述之運動向量重構的方法,其中,基於包括絕對差之和或者平方差之和的預設準則,評估該 範本匹配。
- 如申請專利範圍第1項所述之運動向量重構的方法,其中,該一個或複數個性能準則還包括先前選擇符號對或者先前運動向量預測子的統計的其他解碼器側的資訊。
- 如申請專利範圍第1項所述之運動向量重構的方法,其中,若該運動向量預測子或者該運動向量差值具有分數像素精度,則基於該相應範本的複數個附近整數像素位置,評估用於該當前塊的該範本與用於每個候選重構運動向量位置的該相應範本之間的該範本匹配。
- 如申請專利範圍第4項所述之運動向量重構的方法,其中,若用於兩個候選重構運動向量位置的兩個相應範本落入一相同位置,則該兩個相應範本的位置被修改以變成分開的。
- 如申請專利範圍第5項所述之運動向量重構的方法,其中,該兩個相應範本的位置被修改以位於該運動向量預測子的左邊和右邊,或者該運動向量預測子的上端和下端。
- 如申請專利範圍第1項所述之運動向量重構的方法,其中,還包括:基於一個運動向量預測子與一個候選重構運動向量位置之間的距離,修剪一個或複數個候選重構運動向量位置,其中若特定候選重構運動向量位置相比於該運動向量預測子更靠近候選運動向量預測子集中的另一個運動向量預測子,則該特定候選重構運動向量位置被修剪,並不被評估以用於該範本匹配。
- 如申請專利範圍第1項所述之運動向量重構的方法,其中, 透過發信一控制標誌,是否使用該目標候選運動向量編碼或者解碼該當前塊被顯性地開啟或者關閉。
- 如申請專利範圍第1項所述之運動向量重構的方法,其中,是否使用該目標候選運動向量編碼或者解碼該當前塊被隱性地開啟或者關閉。
- 如申請專利範圍第9項所述之運動向量重構的方法,其中,基於應用到該運動向量差值的該第一幅度和該第二幅度的互斥或操作的結果,是否使用該目標候選運動向量編碼或者解碼該當前塊被開啟或者關閉。
- 如申請專利範圍第1項所述之運動向量重構的方法,其中,對應於該目標候選運動向量位置的所選擇符號對用作一預測子以用於編碼或者解碼該運動向量差值的複數個符號。
- 如申請專利範圍第11項所述之運動向量重構的方法,其中,使用最短碼字,對應於該運動向量差值的該等符號等於該所選擇符號對的預測命中條件被編碼。
- 如申請專利範圍第11項所述之運動向量重構的方法,其中,使用單個二進制位元,對應於該運動向量差值的該等符號等於該所選擇符號對的預測命中條件被編碼。
- 如申請專利範圍第13項所述之運動向量重構的方法,其中,使用兩個或以上二進制位元,對應於該運動向量差值的該等符號不等於該所選擇符號對的複數個其他預測條件被編碼,其中該等其他預測條件包括水平翻轉條件、垂直翻轉條件和對角線翻轉條件。
- 如申請專利範圍第14項所述之運動向量重構的方法,其中, 生成以用於與該當前圖像中的複數個塊相關的複數個預測條件的二值化位元被上下文編碼。
- 如申請專利範圍第1項所述之運動向量重構的方法,其中,若該運動向量差值的該第一幅度和該第二幅度中的任何一個為0,則來自於該當前塊的第一單符號與來自於另一塊或者來自於另一預測列表中該當前塊的第二單符號組合在一起,以形成聯合符號對。
- 如申請專利範圍第16項所述之運動向量重構的方法,其中,使用單個二進制位元或者最短碼字,對應于該第一單符號和該第二單符號均被正確預測的預測命中條件被編碼。
- 如申請專利範圍第16項所述之運動向量重構的方法,其中,使用兩個或以上二進制位元,對應于該聯合符號對中的至少一個不被正確預測的複數個其他預測條件被編碼,其中該等其他預測條件包括第一單符號命中且第二單符號沒命中的條件、第一單符號沒命中且第二單符號命中的條件以及該第一單符號和該第二單符號均沒命中的條件。
- 一種運動向量重構的裝置,該裝置用於視訊編碼系統,基於一個運動向量預測子和一個運動向量差值,該裝置包括一個或複數個電子設備或者處理器,被配置為:接收與包括當前圖像中的當前塊的視訊序列相關的輸入資料;自輸入資料確定運動向量預測子以用於該當前塊;確定與該當前塊相關的運動向量差值的第一幅度和第二幅度; 推導出對應於該運動向量差值的所有候選符號對的複數個候選重構運動向量位置,其中利用該運動向量差值的一個候選符號對,每個候選重構運動向量位置被推導為該運動向量預測子與該運動向量差值的該第一幅度和該第二幅度的向量和。確定用於該當前塊的範本,其中該範本自該當前塊的複數個相鄰重構像素形成;評估用於該當前塊的該範本與用於每個候選重構運動向量位置的相應範本之間的範本匹配;基於包括所有候選重構運動向量位置中的最佳範本匹配的一個或複數個性能準則,在所有候選重構運動向量位置中選擇目標候選運動向量位置;以及使用對應於該目標候選運動向量位置的目標候選運動向量,對該當前塊進行編碼或者解碼。
- 一種非暫時性電腦可讀介質,存儲有複數個程式指令,使得一裝置的處理電路執行基於一個運動向量預測子和一個運動向量差值的運動向量重構的方法,且該方法包括:接收與包括當前圖像中的當前塊的視訊序列相關的輸入資料;自輸入資料確定運動向量預測子以用於該當前塊;確定與該當前塊相關的運動向量差值的第一幅度和第二幅度;推導出對應於該運動向量差值的所有候選符號對的複數個候選重構運動向量位置,其中利用該運動向量差值的一個 候選符號對,每個候選重構運動向量位置被推導為該運動向量預測子與該運動向量差值的該第一幅度和該第二幅度的向量和;確定用於該當前塊的範本,其中該範本自該當前塊的複數個相鄰重構像素形成;評估用於該當前塊的該範本與用於每個候選重構運動向量位置的相應範本之間的範本匹配;基於包括所有候選重構運動向量位置中的最佳範本匹配的一個或複數個性能準則,在所有候選重構運動向量位置中選擇目標候選運動向量位置;以及使用對應於該目標候選運動向量位置的目標候選運動向量,對該當前塊進行編碼或者解碼。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662425172P | 2016-11-22 | 2016-11-22 | |
US62/425,172 | 2016-11-22 | ||
??PCT/CN2017/112140 | 2017-11-21 | ||
PCT/CN2017/112140 WO2018095313A1 (en) | 2016-11-22 | 2017-11-21 | Method and apparatus for motion vector sign prediction in video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201826799A true TW201826799A (zh) | 2018-07-16 |
TWI655864B TWI655864B (zh) | 2019-04-01 |
Family
ID=62196152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106140281A TWI655864B (zh) | 2016-11-22 | 2017-11-21 | 視訊編碼中用於運動向量符號預測的方法及裝置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10701392B2 (zh) |
CN (1) | CN109964484B (zh) |
TW (1) | TWI655864B (zh) |
WO (1) | WO2018095313A1 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10701391B2 (en) * | 2017-03-23 | 2020-06-30 | Qualcomm Incorporated | Motion vector difference (MVD) prediction |
CN118233651A (zh) | 2018-06-07 | 2024-06-21 | 韦勒斯标准与技术协会公司 | 使用自适应运动矢量分辨率的视频信号处理方法及装置 |
TW202025776A (zh) * | 2018-06-19 | 2020-07-01 | 北京字節跳動網絡技術有限公司 | 不具運動向量預測截斷的選擇運動向量差精確度 |
CN110891175B (zh) * | 2018-09-08 | 2023-04-07 | 北京字节跳动网络技术有限公司 | 视频编解码和解码中的仿射模式 |
KR102635047B1 (ko) | 2018-09-19 | 2024-02-07 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 적응적 움직임 벡터 해상도를 가지는 어파인 모드에 대한 구문 재사용 |
WO2020156516A1 (en) | 2019-01-31 | 2020-08-06 | Beijing Bytedance Network Technology Co., Ltd. | Context for coding affine mode adaptive motion vector resolution |
JP7303329B2 (ja) | 2019-04-25 | 2023-07-04 | 北京字節跳動網絡技術有限公司 | 動きベクトルの差に関する制限 |
JP7436527B2 (ja) | 2019-06-25 | 2024-02-21 | 北京字節跳動網絡技術有限公司 | 動きベクトルの差に関する制限 |
CN113676737B (zh) * | 2021-08-02 | 2024-06-28 | 上海影谱科技有限公司 | 一种基于gpu的高效视频编码器及编码方法 |
US20230094825A1 (en) * | 2021-09-28 | 2023-03-30 | Qualcomm Incorporated | Motion vector difference sign prediction for video coding |
US20230132329A1 (en) * | 2021-10-21 | 2023-04-27 | Tencent America LLC | Interdependence Between Adaptive Resolution of Motion Vector Difference and Signaling/Derivation of Motion Vector-Related Parameters |
WO2023131546A1 (en) * | 2022-01-04 | 2023-07-13 | Telefonaktiebolaget Lm Ericsson (Publ) | Motion vector difference derivation |
WO2023207649A1 (en) * | 2022-04-29 | 2023-11-02 | Mediatek Inc. | Method and apparatus for decoder-side motion derivation in video coding system |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101441905B1 (ko) * | 2009-11-18 | 2014-09-24 | 에스케이텔레콤 주식회사 | 후보 예측 움직임 벡터 집합 선택을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 |
US10536701B2 (en) * | 2011-07-01 | 2020-01-14 | Qualcomm Incorporated | Video coding using adaptive motion vector resolution |
US20140079116A1 (en) | 2012-09-20 | 2014-03-20 | Qualcomm Incorporated | Indication of interlaced video data for video coding |
US20140092962A1 (en) | 2012-10-01 | 2014-04-03 | Sony Corporation | Inter field predictions with hevc |
EP2975847A4 (en) | 2013-09-09 | 2017-01-18 | Nec Corporation | Video-encoding device, video-encoding method, and program |
EP2854405A1 (en) * | 2013-09-26 | 2015-04-01 | Thomson Licensing | Method and apparatus for encoding and decoding a motion vector representation in interlaced video using progressive video coding tools |
US10462462B2 (en) * | 2016-09-29 | 2019-10-29 | Qualcomm Incorporated | Motion vector difference coding technique for video coding |
US10979732B2 (en) * | 2016-10-04 | 2021-04-13 | Qualcomm Incorporated | Adaptive motion vector precision for video coding |
-
2017
- 2017-11-21 US US16/462,559 patent/US10701392B2/en active Active
- 2017-11-21 WO PCT/CN2017/112140 patent/WO2018095313A1/en active Application Filing
- 2017-11-21 TW TW106140281A patent/TWI655864B/zh active
- 2017-11-21 CN CN201780069192.3A patent/CN109964484B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
US20190289317A1 (en) | 2019-09-19 |
US10701392B2 (en) | 2020-06-30 |
WO2018095313A1 (en) | 2018-05-31 |
CN109964484B (zh) | 2021-11-09 |
CN109964484A (zh) | 2019-07-02 |
TWI655864B (zh) | 2019-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI655864B (zh) | 視訊編碼中用於運動向量符號預測的方法及裝置 | |
US10257536B2 (en) | Method of temporal derived bi-directional motion vector for motion vector prediciton | |
TWI670966B (zh) | 用於視訊編解碼的適應性雙預測的方法及裝置 | |
TWI660622B (zh) | 用於合併模式或跳過模式推導的視訊編解碼方法和裝置 | |
US10412407B2 (en) | Method and apparatus of inter prediction using average motion vector for video coding | |
US10412406B2 (en) | Method and apparatus for deriving temporal motion vector prediction | |
US10097850B2 (en) | Method and apparatus for removing redundancy in motion vector predictors | |
US20200077088A1 (en) | Method and apparatus of decoder side motion derivation for video coding | |
WO2017118411A1 (en) | Method and apparatus for affine inter prediction for video coding system | |
KR101944289B1 (ko) | 인코딩 방법 및 장치, 디코딩 방법 및 장치, 및 컴퓨터 판독가능 저장 매체 | |
TWI734262B (zh) | 用於視訊編碼之運動向量差值改良式合併方法和裝置 | |
TWI720753B (zh) | 簡化的三角形合併模式候選列表導出的方法以及裝置 | |
US10298951B2 (en) | Method and apparatus of motion vector prediction | |
TW202044841A (zh) | 在視頻編解碼中約束合併標誌信令的方法和裝置 | |
CN111466116B (zh) | 用于视频编解码系统的仿射帧间预测的方法和装置 |