TW202234891A - 允許漂移限制之視訊寫碼概念技術 - Google Patents

允許漂移限制之視訊寫碼概念技術 Download PDF

Info

Publication number
TW202234891A
TW202234891A TW111107381A TW111107381A TW202234891A TW 202234891 A TW202234891 A TW 202234891A TW 111107381 A TW111107381 A TW 111107381A TW 111107381 A TW111107381 A TW 111107381A TW 202234891 A TW202234891 A TW 202234891A
Authority
TW
Taiwan
Prior art keywords
pictures
rasl
video
coding
coding tools
Prior art date
Application number
TW111107381A
Other languages
English (en)
Other versions
TWI821923B (zh
Inventor
羅伯特 史庫濱
克里斯汀 巴特尼克
亞當 維科夫斯基
雅構 夏契茲德拉富恩特
寇尼拉斯 黑爾吉
班加明 布洛斯
湯瑪士 夏以爾
湯瑪士 威剛德
迪特利夫 馬皮
Original Assignee
弗勞恩霍夫爾協會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 弗勞恩霍夫爾協會 filed Critical 弗勞恩霍夫爾協會
Publication of TW202234891A publication Critical patent/TW202234891A/zh
Application granted granted Critical
Publication of TWI821923B publication Critical patent/TWI821923B/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

一種用於自一資料串流解碼一視訊之視訊解碼器經組配以自該資料串流解碼一指示,該指示對於該視訊之一圖像序列為有效的且指示該圖像序列內之RASL圖像以不包括一或多個寫碼工具之一預定集合的一方式經寫碼。

Description

允許漂移限制之視訊寫碼概念技術
發明領域
本申請案係關於適於限制漂移之視訊寫碼及概念。
發明背景
在過去十年中經寫碼視訊之HTTP串流已成為視訊分發的重要路徑,且如今OTT服務提供商可經由公共網際網路接觸到數億使用者。諸如經由HTTP之動態自適應串流(DASH)[1]之標準協定使得服務提供商能夠藉由使伺服器以時間分段的形式以各種位元率提供媒體來將媒體串流傳輸至用戶端。接著,用戶端裝置能夠藉由根據可用的網路頻寬及其以動態及自適應方式的解碼能力在特定區段之所提供變體中進行選擇來下載連續區段以進行連續播放。實務上,內容被提供為由經最佳化位元率階梯生成的多個所謂的表示,其通常涉及多個解析度及保真度,以最佳化特定位元率的感知品質,且藉此最佳化使用者體驗[2]。由於通常使用所謂的封閉圖像組(GOP)寫碼結構對每個區段進行寫碼,而不依賴於較早的區段[2],因此可將下載及解封包化的區段資料串接至一致的位元串流並饋送至解碼器中。與此類封閉的GOP結構相反,使用所謂的開放GOP寫碼結構之區段包含一些圖像,該等圖像使用早期區段中之圖像的框間預測,此有利於寫碼效率。雖然當隨機存取以呈現次序排在第一位的區段時,使用來自早期區段的框間預測之圖像可在沒有播放問題或視覺假影之情況下自輸出中跳過,但當在連續播放期間發生解析度切換時,會出現問題,因為此等圖像在此非無縫切換中被跳過。即使在純位元率切換中,當區段未正確編碼以進行切換時,一些圖像可能會丟失或展現嚴重的視覺假影。
諸如AVC[4]及HEVC[5]等激增的早期編解碼器不提供使用不同解析度的參考圖像所需的參考圖像重新取樣(RPR)功能性。因此,在解析度切換之後,當在此開放的GOP結構下執行時,區段之一些圖像無法被正確解碼,因為來自早期區段的參考圖像在所需解析度下不可用,此導致在自丟棄圖像之區段切換下的非恆定圖框速率播出。在[6]中,作者提出了藉由對HEVC解碼程序進行規範性改變或使用提供RPR功能性的HEVC (SHVC)之激增較少的可擴展性的擴展來克服開放GOP解析度切換問題的方法。然而,迄今為止,可用的解決方案還沒有在HTTP串流中大量採用開放GOP寫碼。
多功能視訊寫碼(VVC)標準[7]之最近定稿的第1版為ITU-T之視訊寫碼專家組及ISO/IEC第29小組委員會(亦被稱作動畫專業團體)合作制定的最新視訊寫碼標準。除了與早期編解碼器相比提供大幅提高的寫碼效率外[8],VVC在最初的Main 10配置文件中亦包括許多應用程式驅動的特徵,諸如RPR。在VVC開發期間,RPR主要在具有低延遲寫碼結構的對話場景之上下文中進行研究[9],其中現實世界對潛時及緩衝區大小的要求對插入經框內寫碼圖像以進行解析度切換的可行性設置了嚴格的限制。
然而,VVC中之RPR亦可為串流域的視訊編碼中之寫碼效率提供實質性的好處。
最好手頭有一個概念,使得能夠在使用諸如VVC之編解碼器的HTTP串流中使用開放GOP解析度切換,其中上述問題不僅發生在RPR方面,而且亦發生在藉由串接與例如不同SNR相關聯的區段來形成視訊位元串流時。
因此,本發明之目標係提供一種視訊寫碼概念,其使得能夠更有效地限制漂移對視訊品質的負面影響,漂移例如由在不同視訊位元串流表示之間的切換下的區段性視訊位元串流形成引起的。
此目標係藉由本申請案之獨立請求項的主題來達成。
發明概要
根據本發明之一第一態樣的實施例提供一種用於自一資料串流解碼一視訊之視訊解碼器,該視訊解碼器經組配以自該資料串流解碼一指示(例如,gci_rasl_pictures_tool_constraint_flag),該指示對於該視訊之一圖像序列為有效的且指示該圖像序列內之RASL圖像以不包括一或多個寫碼工具之一預定集合之一方式來寫碼。舉例而言,該指示可用作一種承諾,使得該解碼器已知,藉由串接在不同空間解析度及/或不同SNR下寫碼之視訊的單獨寫碼的開放GOP版本之開放GOP切換在RASL圖像中不導致過多漂移。其他實施例提供一種用於將一視訊編碼成一資料串流之視訊編碼器,該視訊編碼器經組配以用於將該指示編碼成該資料串流。舉例而言,RASL圖像表示圖像,其按解碼次序在例如CRA之圖像序列中之經框內寫碼圖像之後,但按呈現次序在其之前,且其可使用按解碼次序在經框內寫碼圖像之前的參考圖像。舉例而言,之前的圖像可屬於先前的圖像序列,例如,經框內寫碼圖像可為按寫碼次序之該序列中之第一圖像。由於參考按解碼次序在經框內寫碼圖像之前的圖像,當就包含先前經框內寫碼圖像之視訊的先前區段而言,在經框內寫碼圖像處切換解析度時,可能會出現上文所提及之漂移假影或其他類型的假影。傳信資料串流中之上文所提及之指示可向解碼器保證,相較於先前圖像序列,在圖像序列處之解析度切換在RASL圖像中不涉及過多漂移。因此,該解碼器可基於該指示判定解析度切換是否為有利的。
根據本發明之其他實施例提供一種用於自一資料串流解碼一視訊之視訊解碼器,該視訊解碼器經組配以自該資料串流解碼一指示(例如,使用sps_extra_ph_bit_present_flag及ph_extra_bit,或使用gci_rasl_pictures_tool_contraint_flag),該指示根據該視訊之一圖像序列中之圖像、全域地針對各別圖像或在每切片基礎上指示該各別圖像是否以不包括一或多個寫碼工具之一預定集合之一方式來寫碼,該預定集合包含一基於跨分量線性模型之預測工具(例如,作為一種圖像式指示,其使得有可能查看RASL圖像處之潛力漂移係足夠低的)。其他實施例提供一種用於將一視訊編碼成一資料串流之視訊編碼器,該視訊編碼器經組配以用於將該指示編碼成該資料串流。
較佳實施例之詳細說明
諸圖之以下描述以呈現基於區塊之預測性編解碼器的編碼器及解碼器之描述開始,基於區塊之預測性編解碼器用於對視訊之圖像進行寫碼以便形成可建置本發明之實施例之寫碼框架的實例。參看圖1至圖3描述各別編碼器及解碼器。在下文中,呈現本發明之概念的實施例之描述以及關於此等概念可如何分別建置至圖1及圖2之編碼器及解碼器中的描述,但運用後續圖4及之後描述的實施例亦可用以形成並不根據在圖1及圖2之編碼器及解碼器下層的寫碼框架操作的編碼器及解碼器。
圖1展示用於例示性使用基於變換之殘餘寫碼將圖像A12預測性地寫碼成資料串流A14之設備。使用參考符號A10指示設備或編碼器。圖2展示對應的解碼器A20,亦即經組配以亦使用基於變換之殘餘解碼對來自資料串流A14之圖像A12'進行預測性解碼之設備A20,其中撇號用於指示藉由解碼器A20重建之圖像A12'就藉由預測殘餘信號之量化引入之寫碼耗損而言自最初藉由設備A10編碼之圖像A12偏離。雖然圖1及圖2例示性地使用基於變換之預測殘餘寫碼,但本申請案之實施例不限於此類預測殘餘寫碼。對於參看圖1及圖2所描述之其他細節亦係如此,如將在下文所概述的。
編碼器A10經組配以使預測殘餘信號經受空間至頻譜變換且將由此獲得之預測殘餘信號編碼成資料串流A14。同樣地,解碼器A20經組配以對來自資料串流A14之預測殘餘信號進行解碼且使由此獲得之預測殘餘信號經受頻譜至空間變換。
在內部,編碼器A10可包含生成預測殘餘A24之預測殘餘信號形成器A22,以便量測預測信號A26與原始信號(亦即,與圖像A12)之偏差。預測殘餘信號形成器A22可例如為自原始信號,亦即,自圖像A12減去預測信號之減法器。編碼器A10接著進一步包含變換器A28,該變換器使預測殘餘信號A24經受空間至頻譜變換以獲得譜域預測殘餘信號A24',該譜域預測殘餘信號接著經受藉由亦由編碼器A10包含之量化器A32進行之量化。由此量化之預測殘餘信號A24''經寫碼成位元串流A14。為此,編碼器A10可任擇地包含熵寫碼器A34,該熵寫碼器將經變換及量化之預測殘餘信號熵寫碼成資料串流A14。預測信號A26係基於經編碼成資料串流A14且可自該資料串流解碼之預測殘餘信號A24''由編碼器A10之預測級A36生成。為此,如圖1中所展示,預測級A36可在內部包含:解量化器A38,其對預測殘餘信號A24''進行解量化以便獲得譜域預測殘餘信號A24''',該信號除量化損失以外對應於信號A24';解量化器之後的反變換器A40,其使後一預測殘餘信號A24'''經受反變換,亦即,頻譜至空間變換,以獲得除量化損失以外對應於原始預測殘餘信號A24之預測殘餘信號A24''''。預測級A36之組合器A42接著諸如藉由添加來重組預測信號A26與預測殘餘信號A24'''',以便獲得經重建信號A46,亦即原始信號A12之重建。經重建信號A46可對應於信號A12'。預測級A36之預測模組A44接著藉由使用例如空間預測(亦即,圖像內預測)及/或時間預測(亦即,圖像間預測)基於信號A46生成預測信號A26。
同樣,如圖2中所展示,解碼器A20可在內部由對應於預測級A36並以對應於預測級之方式互連的組件構成。詳言之,解碼器A20之熵解碼器A50可對來自資料串流之經量化譜域預測殘餘信號A24''進行熵解碼,接著以上文參看預測級A36之模組描述的方式互連及協作的解量化器A52、反變換器A54、組合器A56及預測模組A58基於預測殘餘信號A24''恢復經重建信號以使得如圖2中所展示,組合器A56之輸出產生經重建信號,亦即圖像A12'。
儘管上文未特地描述,但易於瞭解,編碼器A10可根據某一最佳化方案諸如以最佳化某一速率及失真相關準則(亦即,寫碼成本)之方式設定一些寫碼參數,其包括例如預測模式、運動參數等等。舉例而言,編碼器A10及解碼器A20以及對應的模組A44、A58可分別地支援諸如框內寫碼模式及框間寫碼模式之不同預測模式。編碼器及解碼器在此等預測模式類型之間切換所藉以的粒度可對應於圖像A12及A12'分別細分成寫碼區段或寫碼區塊。以此等寫碼區段為單位,例如可將圖像細分成經框內寫碼之區塊及經框間寫碼之區塊。經框內寫碼區塊係基於如在下文更詳細地概述的各別區塊之空間已經寫碼/經解碼鄰域來預測。若干框內寫碼模式可存在並經選擇用於各別經框內寫碼區段,包括定向或角度框內寫碼模式,各別區段根據定向或角度框內寫碼模式藉由沿著對各別定向框內寫碼模式具專一性的某一方向將鄰域之樣本值外推成各別經框內寫碼區段而填充。框內寫碼模式可(例如)亦包含一或多個其他模式,諸如:DC寫碼模式,用於各別經框內寫碼區塊的預測根據該DC寫碼模式指派DC值至各別經框內寫碼區段內之全部樣本;及/或平面框內寫碼模式,各別區塊之預測根據該平面框內寫碼模式估算或判定為藉由相對於具有由二維線性函數基於相鄰樣本定義的平面之驅動傾斜及偏移的各別經框內寫碼區塊之樣本位置的二維線性函數描述的樣本值之空間分佈。與其比較,可例如在時間上預測經框間寫碼區塊。對於經框間寫碼區塊,運動向量可在資料串流內經傳信,運動向量指示圖像A12所屬之視訊之先前經寫碼圖像的部分之空間位移,在該空間位移下,對先前經寫碼/經解碼圖像進行取樣以便獲得用於各別經框間寫碼區塊之預測信號。此意謂除了藉由資料串流A14包含的殘餘信號寫碼(諸如表示經量化譜域預測殘餘信號A24''之熵寫碼變換係數層級)之外,資料串流A14可已將其編碼成用於指派寫碼模式至各種區塊的寫碼模式參數、用於區塊中之一些的預測參數(諸如用於經框間寫碼區段之運動參數),及任擇的其他參數(諸如用於控制及傳信圖像A12及A12'分別成區段的細分之參數)。解碼器A20使用此等參數以與編碼器相同之方式細分圖像,從而將相同預測模式指派給區段,且執行相同預測以產生相同預測信號。
圖3說明一方面經重建信號(亦即,經重建圖像A12')與另一方面如在資料串流A14中傳信之預測殘餘信號A24''''及預測信號A26之組合之間的關係。如上文已指示,該組合可為相加。預測信號A26在圖3中說明為圖像區域成使用陰影線說明性指示之經框內寫碼區塊及非陰影說明性指示的經框間寫碼區塊之細分。該細分可為任何細分,諸如圖像區域成正方形區塊或非正方形區塊之列及行之常規細分或來自樹根區塊之圖像A12成多個具有不同大小之葉區塊之多分樹細分,諸如四分樹細分等等,其中圖3中說明其混合,在圖3中,圖像區域首先細分成樹根區塊之列及行,該等樹根區塊接著根據遞歸多分樹細分而另外細分成一或多個葉區塊。
再次,資料串流A14可針對經框內寫碼區塊A80而在其中對框內寫碼模式進行寫碼,該框內寫碼模式將若干所支援框內寫碼模式中之一者指派給各別經框內寫碼區塊A80。對於經框間寫碼區塊A82,資料串流A14可在其中寫碼一或多個運動參數。一般而言,經框間寫碼區塊A82並不限於在時間上寫碼。替代地,經框間寫碼區塊A82可為超出當前圖像A12 (諸如圖像A12所屬的視訊之先前經寫碼圖像,或在編碼器及解碼器分別為可調式編碼器及解碼器之狀況下,另一視圖之圖像或階層式下部層)自身的自先前寫碼部分預測之任何區塊。
圖3中之預測殘餘信號A24''''亦經說明為圖像區域分成區塊A84之細分。此等區塊可被稱作變換區塊,以便將其與寫碼區塊A80及A82區分。實際上,圖3說明編碼器A10及解碼器A20可使用圖像A12及圖像A12'分別成區塊的二種不同的細分,亦即分別成寫碼區塊A80及A82之一個細分,及成變換區塊A84之另一細分。二個細分可為相同的,亦即每一寫碼區塊A80及A82可同時形成變換區塊A84,但圖3說明以下狀況:其中例如,成變換區塊A84之細分形成成寫碼區塊A80、A82之細分之擴展,使得區塊A80及A82中之二個區塊之間的任一邊界與二個區塊A84之間的邊界重疊,或換言之,每一區塊A80、A82與變換區塊A84中之一者重合或與變換區塊A84之群集重合。然而,亦可獨立於彼此判定或選擇細分,使得變換區塊A84可替代地跨越區塊A80、A82之間的區塊邊界。就細分成變換區塊A84而言,類似陳述因此如同關於細分成區塊A80、A82所提出之彼等陳述而成立,亦即,區塊A84可為圖像區域成區塊(具有或不具有成列及行之配置)之常規細分的結果、圖像區域之遞歸多分樹細分的結果,或其組合或任何其他類別之分塊。順便指出,應注意,區塊A80、A82及A84不限於正方形、矩形或任何其他形狀。
圖3進一步說明預測信號A26與預測殘餘信號A24''''之組合直接產生經重建信號A12'。然而,應注意,根據替代性實施例,多於一個預測信號A26可與預測殘餘信號A24''''組合,以產生圖像A12'。
在圖3中,變換區塊A84應具有以下重要性。變換器A28及反變換器A54以此等變換區塊A84為單位執行其變換。舉例而言,許多編解碼器將某種DST或DCT用於所有變換區塊A84。一些編解碼器允許跳過變換,使得對於變換區塊A84中之一些,直接在空間域中對預測殘餘信號進行寫碼。然而,根據下文描述之實施例,編碼器A10及解碼器A20以使得其支援若干變換之方式進行組配。舉例而言,編碼器A10及解碼器A20所支援之變換可包含: ○ DCT-II (或DCT-III),其中DCT代表離散餘弦變換 ○ DST-IV,其中DST代表離散正弦變換 ○DCT-IV ○DST-VII ○恆等變換(IT)
當然,雖然變換器A28將支援此等變換之所有正向變換版本,但解碼器A20或反變換器A54將支援其對應的後向或反向版本: ○反向DCT-II (或反向DCT-III) ○反向DST-IV ○反向DCT-IV ○反向DST-VII ○恆等變換(IT)
後續描述提供關於編碼器A10及解碼器A20可支援哪些變換之更多細節。在任何狀況下,應注意,所支援變換之集合可僅包含一種變換,諸如一種頻譜至空間或空間至頻譜變換。
如上文已概述,已呈現圖1至圖3作為實例,在該實例中可實施下文進一步描述之本發明概念以便形成根據本申請案的編碼器及解碼器之特定實例。就此而言,圖1及圖2之編碼器及解碼器可分別表示下文所描述之編碼器及解碼器的可能實施。然而,圖1及圖2僅僅為實例。然而,根據本申請案之實施例之編碼器可使用下文更詳細地概述之概念來執行圖像A12之基於區塊之編碼,且與圖1之編碼器之不同之處在於例如成區塊A80之細分以不同於圖3中所例示之方式來執行。同樣地,根據本申請案之實施例之解碼器可使用下文進一步所概述之寫碼概念執行自資料串流A14之圖像A12'的基於區塊之解碼,但與例如圖2之解碼器A20之不同之處可在於其不支援框內預測,或在於其以不同於關於圖3所描述之方式將圖像A12'細分成區塊,及/或在於其不在變換域中但在例如空間域中自資料串流A14導出預測殘餘。
如所論述,圖1至圖3僅僅意圖提供視訊編解碼器之粗略概述,本申請案之隨後概述的實施例可基於該粗略概述。舉例而言,VVC為圖1及圖2之視訊解碼器及視訊編碼器可據以定製的視訊編解碼器之實例。
以下描述如以下構造。初步,VVC用作視訊編解碼器環境之實例,並且基於此實例,以下描述提供了關於調查開放GOP寫碼結構的一般寫碼效率影響以及區段切換處的圖像品質影響的實驗報告。再次,稍後描述之實施例不限於VVC,且關於此等實施例論述之寫碼工具不限於關於VVC論述之彼等寫碼工具,但此等實驗及其結果之呈現提供了產生稍後描述之實施例的動機。此外,隨後的描述將提供GOP寫碼結構及分段的概述,接著呈現約束編碼以實現開放GOP切換,例如開放GOP解析度切換,並有效地限制與切換相關聯的漂移。在下文中,呈現了自關於VVC的考慮中出現的本申請案之若干實施例。
下文提供了對用於串流之VVC位元串流及媒體分段內的結構之概述。媒體區段通常僅使用框內寫碼工具與框內隨機存取點(IRAP)圖像對準。IRAP圖像可頻繁地出現在經寫碼視訊位元串流中以允許諸如尋求或快速轉遞之功能性,且亦用作切換點以用於自適應HTTP串流。用於隨選視訊(VoD)串流之系統通常將區段與IRAP圖像週期對準,亦即,IRAP圖像通常置放於區段開始處且所要區段持續時間判定IRAP圖像之間的時間距離。然而,存在其中並非所有媒體區段含有IRAP圖像之使用情況,例如,極低延遲串流,使得小區段可用於傳輸,而無需等待IRAP圖像且因此縮減內容產生側處之潛時。區段大小可取決於目標應用在長度上變化。舉例而言,VoD服務允許玩家建置更大的緩衝區(例如,30秒)來克服吞吐量波動,對於這種情況,高達幾秒(例如,5秒)的區段大小可為合理的設計選擇[3]。然而,需要更嚴格的端對端延遲之實時服務不允許在用戶端側有如此大的緩衝區,且因此需要更頻繁的切換點及1秒或更短的更短區段。
只要解碼延遲要求允許,二個IRAP圖像之間的圖像通常在雙向經預測分層GOP結構中經編碼,其涉及在呈現之前的重定序,因為此結構提供如AVC [10]中所引入之實質性的寫碼效率益處。GOP之層級結構可用於時間可擴展性,其中解碼直至給定層的所有圖像對應於給定的圖框速率,並且為每一圖像指派對應的時間Id (Tid)值,如圖1中針對8個圖像之GOP大小所展示。GOP可經定義為按解碼次序自第一Tid 0圖像直至但不包括以下Tid 0圖像的所有圖像。通常,區段包括取決於IRAP時間段及GOP大小之一或多個GOP結構。在HEVC中,經解碼圖像緩衝區(DBP)中之參考圖像槽之數量允許16個圖像的典型GOP大小,而在VVC中,增加了DPR容量,允許多達32個圖像的分層GOP大小。
按解碼次序在IRAP圖像之後但按呈現次序在其之前的圖像在HEVC中被引入並被稱為前置圖像。其可進一步區分為隨機存取跳過前置(RASL)及隨機存取可解碼前置(RADL)。雖然RADL圖像可僅使用按解碼次序自IRAP圖像開始之參考圖像,但RASL圖像可另外使用在IRAP之前的參考圖像。瞬時隨機存取(IDR)類型之IRAP圖像重設DBP,且可僅具有前置圖像,其為產生所謂的封閉GOP結構之RADL圖像。此外,另一方面,清潔隨機存取(CRA)類型之IRAP圖像不重設DPB。因此,按解碼次序自CRA之前重建的圖像可用作未來圖像的參考,亦即,允許所謂的開放GOP寫碼結構之RASL圖像。與RADL圖像相比,RASL圖像展現出更高的寫碼效率,但當參考圖像不可用時,可能會呈現為不可解碼的,例如在區段開頭的相關聯的IRAP處之隨機存取期間且無需解碼前一個區段。VVC高級語法之更詳細概述可見於[11]中。
圖4說明例如由具有不同解析度之二個連續區段之串接形成視訊資料串流,其中第二區段使用來自第一區段之具有參考圖像的開放GOP寫碼結構。詳言之,經引用參考圖像為圖4中之彼等矩形,箭頭自其出現。箭頭自身說明預測互依性,亦即,其自參考圖像指向引用圖像。每一圖像係與某一時間ID Tid相關聯,且如可看出,寫碼次序與圖像之輸出/呈現次序偏離。如可看出,輸出次序排序9至15之圖像為RASL圖像,其直接地或間接地參考其所屬之自身區段(區段1)之CRA圖像,以及源自前一區段(區段0)之圖像,主要為具有輸出次序排序8之圖像。舉例而言,視訊之區段亦可稱為圖像序列,其可例如包含一個GOP。
當RASL圖像之參考圖像位於前一區段中且串流用戶端在此前一區段之後切換表示時,相較於編碼器側,用戶端解碼器將使用參考圖像之至少部分的不同變型來解碼RASL圖像。此情形在內容未適當地生成之情況下可導致非一致的位元串流,或在經重建RASL圖像中導致顯著失配,且此漂移可傳播至所有RASL圖像直至但不包括相關聯的CRA圖像。在下文中,論述內容之適當生成,其允許使用開放GOP結構,同時在區段切換處維持位元串流一致性且避免原本在切換期間不利於視覺品質之非所需漂移。
當實行開放GOP切換時,VVC中之多個框間預測工具展現不同潛力以引起漂移,且同時,工具使用率受到一致性約束的限制。接下來,吾人在開放GOP解析度切換時分析VVC中之框間預測工具的漂移潛力,且本文中提議一種克服開放GOP解析度切換之嚴重假影同時確保VVC一致性的受約束編碼方法。
關於VVC寫碼工具之漂移潛力,VVC中之第一組寫碼工具可經分類為樣本至樣本預測,例如自VVC之許多前身或VVC中被稱作仿射運動補償(AMC)之最新引入的框間預測模式已知的常規的基於區塊之平移運動補償樣本預測,其將預測區塊分解為較小子區塊,該等子區塊經個別地運動補償以模擬仿射運動補償[12]。使用作為AMC之任擇的組件之光流(PROF)或雙向光流(BDOF)的預測改進為VVC中之最新引入的框間預測工具,其藉由依賴於基於光流之方法來更改經預測樣本以便模擬逐樣本框間預測。當不同表示用作使用此樣本至樣本預測工具之重建的參考時,經重建圖像之視覺品質將傾向於該表示之視覺品質且遠離原始表示之視覺品質。然而,此樣本至樣本預測具有相對較低的引起視覺干擾假影的可能性,但在給定的RASL圖像序列中導致優雅的品質轉變,因為第一視覺品質之預測源樣本藉由殘餘資訊在第二視覺品質下逐漸更新。
圖5例如說明光流工具300及其功能性。展示圖像12內之經框間預測區塊10c。經框間預測區塊10c係與運動向量302相關聯。亦即,針對經框間預測區塊10c在資料串流中傳信運動向量302。運動向量302指示經框間預測區塊10c之平移位移,將在該平移位移下,取樣/複製參考圖像304以便產生經框間預測區塊10c之平移框間預測信號。若光流300將用於經框間預測區塊10c,則光流工具300藉助於基於光流之分析來改良平移框間預測信號。更精確而言,代替僅僅在根據運動向量302位移之區塊10c的佔據面積處取樣參考圖像304,光流工具300使用稍微大於參考圖像304內之圖像10c的佔據面積之面積,亦即面積306,以便針對經框間預測區塊10c判定框間預測信號,亦即藉由檢測面積306內之梯度以便判定經框間預測信號。換言之,可能除了在根據運動向量302位移、落在參考圖像304內之子像素位置處之區塊10c的樣本之狀況下的內插濾波之外,藉由使用光流工具300、藉由使用梯度敏感FIR濾波來判定區塊10c之經框間預測信號之每一樣本。
應注意,雖然圖5僅僅展示一個參考圖像及一個運動向量,但光流工具亦可針對二個參考圖像及二個運動向量執行光流分析,其中圖像12係在二個參考圖像之間且該圖像含有經框間預測區塊10c。
隨後,當描述本申請案之實施例時,光流工具300可形成用於寫碼工具之一個實例,該等寫碼工具經受自編碼排除以避免漂移。因此,根據下文描述之一些實施例,視訊解碼器及/或視訊編碼器支援此光流工具。因為圖1及圖2展示用於視訊解碼器及視訊編碼器之可能實施,所以支援根據圖5之光流工具之根據圖1及圖2的視訊解碼器及編碼器可表示用於本申請案之實施例的例示性基礎。無論如何,關於如何分別在解碼器側及編碼器側決定是否將光流工具300應用於經框間預測區塊10c,存在不同的可能性。舉例而言,光流工具300可為固有應用的寫碼工具。舉例而言,光流工具是否應用於區塊10c可取決於在資料串流中針對區塊10c相對於除光流工具以外的另一寫碼工具傳信之一或多個寫碼選項。甚至替代地,光流工具300可為固有應用的寫碼工具,其中光流工具300是否應用於區塊10c之決策取決於區塊10c之大小。自然地,二種相依性可適用。甚至替代地,光流工具300可為明確應用的寫碼工具,其意謂語法元素經寫碼成資料串流,該資料串流專門地傳信光流工具300是否應用於區塊10c。換言之,此語法元素將特定針對區塊10c。應注意,在僅能夠在工具350之非應用與應用之間切換的意義上,此語法元素可並非旗標或二進位值。實際上,語法元素可為m元語法元素,其中其m個狀態中之一者例如與工具350之應用相關聯。替代地,語法元素可為m元語法元素,其中其m個狀態中之一者例如與工具350之非應用相關聯。
在隨後解釋的實施例中,該編碼器將自RASL圖像之編碼排除諸如光流工具300之某些寫碼工具傳信至解碼器。隨後論述之此傳信不需要充當此等寫碼工具是否可用於某一圖像之區塊或圖像之切片的實際控制。實際上,在下文進一步描述之實施例中呈現之此傳信或指示實際上可作為自編碼器至解碼器之一種額外傳信或承諾:下文進一步論述之此等某些寫碼工具(或僅僅一個寫碼工具)已經自諸如RASL圖像之某些圖像的編碼排除。在後一狀況下,隨後論述之指示或傳信對於資料串流內部之組配信令係冗餘的或作為其補充,該組配信令去啟動某些寫碼工具,使得其不可用於應用於某些圖像或圖像切片內之圖像區塊。該編碼器遵從藉由設定組配信令以及(若適用)與區塊基礎工具應用相關聯的語法元素而給定之保證,因此,亦即使得工具係/不用於例如RASL圖像中。因此,光流工具可為可去啟動寫碼工具,其就其應用於諸如區塊10c之經框間預測區塊而言可藉由資料串流內部之組配資料以圖像或切片為單位去啟動。舉例而言,此組配信令可由切片標頭或圖像標頭包含。是否將會將光流工具300應用於某一經框間預測區塊10c因此將基於組配信令而決定,且僅僅若組配信令針對圖像12 (或圖像12之切片) (經框間預測區塊10c為該圖像之一部分)指示光流工具300經啟動,亦即可用的,則做出關於其上文所描述的應用之顯式傳信或固有決策。
後一情形再次在圖6中描繪,此係因為用於決定是否應用某一寫碼工具之一般可能性係與針對本文中所論述的寫碼工具類似。因此,圖6說明當前經寫碼圖像12以及為圖像12之一部分的區塊10。圖像區塊10僅僅經說明性地描繪,且實際上僅僅為圖像12分割成之一個圖像區塊。區塊10所屬之區塊層級可例如對應於進行框內/框間預測模式決策之區塊,但亦存在其他可能性,諸如區塊小於後面的區塊。已經關於圖3描述用於將圖像12分割成諸如區塊10之區塊的可能實例。圖6中展示代表性寫碼工具350。此寫碼工具實際上是否應用於區塊10可經由以下情形來控制:該應用可取決於如由箭頭352所指示之區塊之大小及/或在資料串流中針對預定區塊10傳信之寫碼選項,諸如係使用框內區塊模式抑或框間區塊模式來寫碼區塊10。在圖6中使用箭頭354來描繪後一相關性。作為區塊大小相關性之替代方案或另外,對對應的基於遞歸多分樹之分割樹的區塊縱橫比或樹分割層級之相關性可適用。寫碼選項可係關於區塊經框內寫碼、區塊經框間寫碼、區塊經雙向預測、區塊藉由等距間隔開且相對置放的參考圖像而經雙向預測等等中之一或多者。二個資訊實體,亦即區塊大小/縱橫比/分裂層級及寫碼選項在資料串流中傳信,亦即藉由關於圖像12分割成包括區塊10之區塊的分割資訊之區塊大小/縱橫比/分裂層級,及特定用於例如區塊10之寫碼選項。代替依賴於隱式區塊層級決策,呈語法元素353形式之顯式信令可用於控制工具350針對區塊10之應用。語法元素將特定針對區塊10,且對於用於工具350之工具決策係特定的。雖然在區塊層級上、在較大層級上進行此應用決策356,但應用決策可另外取決於啟動決策358,其係在較大層級上諸如關於整個圖像12或圖像12沿著圖像12經寫碼成資料串流之區塊寫碼次序所細分成的切片而進行。啟動決策358可由前述組配信令來控制,諸如區塊10所屬之切片之切片標頭中或圖像12之圖像標頭中的設置或諸如圖像參數集之與圖像12相關聯的參數集。並非所有的決策356及358均可適用。其中無一者可適用,然而其中在下文所論述之指示接著將不僅將某一寫碼工具350對某一切片、圖像或RASL圖像的啟動或去啟動指示為一種承諾或冗餘信令,且亦類似於組配信令起作用。
因此,雖然圖6之寫碼工具350可為圖5之光流工具300,但其在圖6中經描繪為表示經受下文進一步論述之編碼器受約束決策的寫碼工具中之任一者。
VVC中之第二組寫碼工具係用於自圖像之語法或樣本的語法(亦即模型參數)預測。類似於其前身,VVC允許在區塊基礎上使用來自所謂的並置參考圖像之時間MV候選者經由時間運動向量預測(TMVP) [13]進行運動向量(MV)預測。藉由在子區塊基礎上引入更細粒度的TMVP變型(SBTMVP)而在VVC中擴展了此特徵,增加了在並置參考圖像中查找對應的運動資訊之位移步驟。
圖7說明時間運動向量預測工具500。此工具500為用於圖6之寫碼工具350的另一實例,及用於下文針對編碼器受約束指示進一步論述之寫碼工具的另一實例。時間運動向量預測工具係用於基於與參考圖像502內之區塊506相關聯的運動向量510針對圖像12之經框間預測區塊10c預測運動向量508。雖然根據圖7之實例,工具500可使用參考圖像502內之並置區塊的運動向量作為預測子508,但工具500首先導出用於區塊10c之位移向量504,諸如空間預測運動向量,且使用此位移向量504來在參考圖像502內定位「並置區塊506」,且此並置區塊506之運動向量510接著用於時間預測運動向量候選者508。此外,圖7說明工具500可操作以僅針對至用於區塊10c之運動向量候選者清單512中之插入來判定時間預測運動向量508,諸如藉由使用在資料串流中針對區塊10c傳信之索引而最終自該清單選擇一個運動向量預測子。替代地,清單512係以產生清單512內之運動向量候選者的某一次序之某一方式來理解,且具有最高排序之運動向量候選者經簡單地最終選取/選擇以用於框間預測區塊10c中。
應注意,圖6之運動向量預測工具應被理解為足夠寬泛以在合併意義上亦涵蓋時間運動向量預測之狀況,亦即自並置區塊提供具有諸如參考圖像索引之其他運動預測設置的運動向量預測子成塊。
關於圖6論述之所有選項可用於工具500以判定工具500實際上是否應用於區塊10c。更精確而言,工具500可為圖6中之寫碼工具350的實例,其中呈語法元素353形式之顯式信令係用於控制工具500對區塊10之應用,亦即,在資料串流中針對區塊10c傳信之索引在清單512中選擇或不選擇TMVP候選者508。若未經選擇,工具500針對區塊10c保持無效,此經解釋為區塊10c之工具500之非應用。然而,經由決策358之在較高層級上之組配信令可用於較全域地去啟動工具500,使得對於駐存在區域(圖像或切片)中之其中工具500經傳信以去啟動的區塊,無論如何以不包括TMVP候選者508之方式理解清單512,且清單索引將不再充當前述區塊層級決策控制。該編碼器可決定使用哪種方式以便遵從經給定至解碼器之任一承諾,以便避免如本文中所教示的RASL圖像中之漂移。
前述第二組中之其他工具之特徵可為樣本至語法預測工具。VVC中之完全新的框間預測工具引入工具為解碼器側運動向量改進(DMVR),其基於二個參考圖像之鏡像性質來改進雙向預測中之MV的準確度,該二個參考圖像與當前圖像具有相同且相反的時間距離。
圖8說明解碼器側運動向量改進工具400。若應用於圖像12之經框間預測區塊10d,則工具400會藉助於藉由使用最佳匹配搜索來改進在資料串流中針對此區塊10d寫碼/傳信之此運動向量402而改良運動向量402以用於對來自參考圖像404之此區塊10d進行框間預測。可在由解碼器及編碼器支援之最高解析度(1/16像素解析度)下執行最佳匹配搜索。經傳信運動向量可具有較低解析度,且僅僅用以「實質上」指示最終由DMVR工具判定之經改進運動向量。關於什麼應與參考圖像匹配以便執行最佳匹配搜索,存在不同可能性。一種可能性將為使用鄰近經框間預測區塊10d之已經解碼部分。此部分將經受使用經傳信運動向量處及周圍之運動向量候選者的運動向量位移,且產生最佳匹配之候選者將經選擇為經改進運動向量。替代地,區塊10d可為經雙向預測區塊,其中存在將藉由工具400改進之一對經傳信運動向量。亦即,在該狀況下,經框間預測區塊10d為經雙向預測區塊。參考圖像可能將在其間具有按呈現次序之圖像12,亦即,參考圖像在時間上置放在圖像12前方及後方。任擇地,二個參考圖像在時間上與圖像12同等地間隔開。工具400甚至可專用於此狀況,亦即工具400將在區塊層級上取決於區塊寫碼選項而固有地經啟動,該等區塊寫碼選項指示將基於與當前圖像10等距間隔開且在其間具有圖像10之參考圖像來雙向預測區塊10d。在彼狀況下,將藉由在包括該對經傳信運動向量及該對經傳信運動向量周圍之運動向量配對候選者當中執行最佳匹配搜索來改進該對經傳信運動向量,其中之一將為向量402。舉例而言,可藉由測試在稱為運動向量配對候選者之部分處取樣的參考圖像之間的相似性來執行最佳匹配搜索。運動向量配對候選者可限於以下運動向量配對候選者:其中用於一個參考圖像之一個運動向量候選者與用於此參考圖像之對應的信號運動向量以與用於另一參考圖像之另一運動向量候選者與用於此另一參考圖像之另一信號運動向量之偏差相反的方式偏離。對於類似性,可使用SAD或SSD。最佳匹配運動向量配對候選者接著將用作信號運動向量之替換406,亦即,用於參考圖像404之向量402將由406替換,且用於另一參考圖像之另一經傳信向量將由運動向量配對候選者之另一向量替換。亦將存在其他可能性。舉例而言,可藉由在經傳信運動向量處及周圍之二個經傳信運動向量處在二個參考圖像中執行經取樣貼片之平均值的最佳匹配搜索來個別地改進經雙向預測區塊10d之二個經傳信運動向量。
關於MVR工具400是否將應用於區塊10d之決策,關於圖6所論述之所有替代方案均可適用。亦即,MVR工具400可為寫碼工具350。
VVC中之另一新工具為跨分量線性模型(CCLM),其允許使用其中模型參數係自經重建明度樣本值導出之線性模型自各別明度分量框內預測區塊之色度分量。線性模型藉助於以下等式將經次取樣明度樣本 rec' L變換成色度預測: P( i, j) = arec' L( i, j ) + b, 其中參數a及b係如下自相鄰明度及色度樣本導出。在 X l X s 分別表示二個最大及二個最小相鄰樣本之平均值且 Y lY s分別表示對應的色度樣本對之平均值之情況下,參數經導出為: a= ( Y l- Y s) / ( X l- X s) b= Y s- aX s
由於參數求導程序僅考慮相鄰樣本值之極值,因此即使在相鄰區塊中之單樣本漂移離群值之狀況下,該程序亦易於發生廣泛漂移。並且,由於線性模型,若a較大,則明度漂移可經放大。對於考慮所有相鄰樣本值的其他框內預測模式,漂移傳播不那麼明顯,且無法經線性地放大。由於此固有的不穩定性,此模式在應用於其中受約束漂移係可接受的應用中時需要特別小心,例如HTTP自適應串流中之開放GOP切換。除此之外,由於在經描述應用之上下文中,該漂移可僅發生在RASL圖框中,亦即運動經預測圖框。若該編碼器決定使用CCLM,亦即框內預測模式,則此通常係由於缺少適當的經運動補償之預測子,此意指高時間活動區。在此類區中,用於開放GOP切換之所預期的重建漂移預期為高的,對所論述的不穩定效應的貢獻甚至更大。
圖9示意性地展示跨分量線性模型工具100之操作模式。相對於應用哪一工具100來展示區塊10a。在組合用於明度之預測信號及殘餘信號內,使用任何類型的預測120且藉由自資料串流解碼122殘餘信號來重建此區塊10a之明度分量。工具100之目的為基於經重建明度分量124來預測色度分量。此係使用線性模型或線性映射106來進行。此線性映射106使用純量線性函數以便基於樣本126之經重建明度分量針對區塊10a之每一樣本126來逐樣本地預測樣本126之色度分量。純量線性函數之線性參數,亦即上文所表示的a及b,係藉由區塊10a之鄰域112中之已經重建樣本的明度及色度分量之統計資料之分析針對區塊10a經區塊全域地判定。詳言之,藉由工具100執行之統計分析124在圖9中在128處指示,且可針對每一分量判定在鄰域112中之經重建樣本內出現的外部明度及色度值。舉例而言,可使用二個最大明度值之平均值,以及二個最小明度值。對於經預測色度分量亦如此。基於所得四個平均值,用於鄰域112內之明度值之跨度及色度值之跨度的量度經判定,且其間的比率係用作用於線性映射106之純量線性函數的斜率。用於明度之最小值的平均值—斜率x,用於色度之最小值之平均值—係用於判定純量線性函數之截距。如此執行之參數求導108產生純量線性函數,且經重建明度分量124之每一明度樣本係用於預測區塊10a內之對應的色度樣本值,藉此產生用於區塊10a之色度分量間預測信號。圖9中未展示但係可能的為,資料串流可具有經寫碼成其的色度殘餘信號,以便針對色度分量C 1及/或C 2來校正色度分量間預測信號。
再次,工具100為用於圖6中之寫碼工具350的另一實例。換言之,寫碼工具是否應用於圖像之區塊10a可根據關於圖6論述之選項中之任一者來決定。值得注意的是,VVC不提供任何用於圖像全域地或至少切片全域地去啟動工具100之手段,但根據稍後描述之一實施例,提議此傳信,藉此避免由工具100引起的有害漂移。更精確而言,工具100可為用於圖6中之寫碼工具350的實例,其中呈語法元素353形式之顯式信令係用於控制工具100對區塊10之應用。語法元素可為例如旗標,其為區塊10打開或關閉工具100。就隨後關於實施例論述之編碼受約束指示的論述而言,存在二種可能性:其可僅向接收者(亦即,解碼器)通知以下事實:用於某一圖像12之所有語法元素353指示工具100之非應用,或其替代地亦可充當組配信令,其關於圖像12去啟動工具100,由此,資料串流將不針對彼圖像12內部之區塊10傳送任何語法元素353。以VVC為例,例如,不存在組配信令,以便以圖像或切片之粒度來去啟動工具100。在VVC中,此組配信令僅用於控制用於一序列圖像之工具100的啟動。因此,RASL式去啟動係不可行的。
又一新的工具經引入至VVC之迴路濾波級,且被稱作明度映射及色度縮放(LMCS),其中色度樣本值使用自明度樣本導出之參數來進行縮放,如圖10中所說明。
此處亦存在色度至明度相關性,但不如在CCLM之狀況下那麼明顯。在該程序之色度縮放部分期間,經變換且經反量化色度殘餘係根據自相鄰虛擬管線資料單元(VPDU)之明度樣本導出的模型參數來縮放。出於管線潛時縮減的目的,CCLM依賴於相鄰VPDU之樣本。然而,在LMCS中,考慮所有相鄰明度樣本,允許平均化VPDU相鄰樣本中之漂移離群值。並且,該等模型參數係用於縮放殘餘信號,其不聚集漂移但經直接傳信。出於彼等原因,工具放大漂移的可能要小得多,但在為受控漂移應用進行編碼時仍應考慮。
圖11中描繪用於LMCS工具200之操作模式。此處之想法為執行明度工具映射212以便在寫碼明度色調標度208而非呈現明度色調標度210中針對預定圖像12執行明度分量預測202及明度分量殘餘解碼204。更精確而言,雖然經重建明度值可在線性標度上在某一位元深度處表示用於圖像12之經重信號的明度分量,但明度色調映射212可使用諸如逐圖像線性色調映射函數或某一其他色調映射函數來將此標度210映射至寫碼標度208上。色調映射函數可在諸如圖像12之圖像參數集的資料串流處傳信。該函數係由編碼器適當地判定。因此,藉由框間預測202針對圖像12之區塊10b獲得的框間預測信號係在於寫碼標度208處與殘餘信號204組合之前經受明度色調映射212,以產生用於圖像12之經重建明度分量。對於經框內預測區塊,使用框間預測206。在寫碼標度208域內執行框內預測。工具200之另一目標為根據明度色調映射212來控制色度分量之量化誤差。亦即,色度分量量化誤差係針對每一區塊個別地經控制,且藉由明度色調映射212來適應明度分量之影響。為此目的,針對圖像12之區塊10b自圖像區塊10b之鄰域222內之圖像12的經重建明度分量之寫碼明度色調標度版本的平均值220來判定色度殘餘縮放因數216。針對圖像區塊10b自資料串流解碼之色度殘餘信號224係根據如此判定之色度殘餘縮放因數216經縮放226,且此縮放係用於針對圖像區塊10b校正228框內色度預測信號230。相較於明度分量,框內色度預測信號230可使用相同預測工具或其子集。藉由使用鄰域222以用於判定平均值220,用於區塊10b之明度及色度分量可並行而非串行地經重建。圖像12之經重建明度及色度分量接著經受反明度色調映射240以產生用於圖像12之經重建最終結果且產生接下來寫碼/解碼圖像之基礎,亦即用作用於此經隨後寫碼/解碼圖像之參考圖像。
關於寫碼工具200,與關於前述圖論述的其他寫碼工具一樣,該註釋亦為有效的,亦即,寫碼工具200為用於圖6之寫碼工具350的實例,且可不使用用於決定此寫碼工具對關於圖6所論述之特定區塊的應用之選項。作為一實例,關於寫碼工具300,可省略逐區塊決策356,但組配信令可用於逐圖像或逐切片地控制應用。
自語法至語法及樣本至語法框間預測工具預測的MV之誤差在後續的樣本至樣本預測工具中導致嚴重假影之可能性相對較高,該等後續的樣本至樣本預測工具使用此等經錯誤預測的MV作為空間或時間MV候選者。此對於在開放GOP切換中展示大多數可見假影之(SB) TMVP以及DMVR尤其有效,此係因為不當運動向量之誤差可能會以不斷增加的量值在後續圖像內傳播。然而,此亦適用於其他預測模型,例如CCLM及/或LMCS,其基於自經重建樣本值導出之參數來實行。圖12說明了在常規開放GOP寫碼中使用32個圖像之GOP大小的一般語法或參數預測誤差對RASL圖像之視覺及客觀品質的影響。顯而易見,RASL圖像在經重建圖像之明度以及色度分量中存在明顯的假影。
開放GOP切換中之第三個問題可能源於在VVC中使用自適應參數集(APS),其攜帶自適應迴路濾波器(ALF)之濾波器係數、具有色度縮放之明度映射(LMCS)之參數及量化縮放清單。因為RASL圖像可指代在各別CRA之前以解碼次序傳輸的APS,該等APS在連續解碼期間係可用的,但在CRA圖像處之隨機存取時不可用,因為在此狀況下丟棄了相關聯的RASL圖像。因此,開放GOP解析度切換可能會導致對缺失APS的引用,此會導致非容錯解碼器崩潰或在使用具有巧合匹配識別符值的錯誤APS之參數時產生視覺假影。類似於語法預測工具,此問題極有可能造成視覺干擾,直至解碼器完全失效。
為了避免在執行開放GOP解析度切換時出現上文所描述的問題,可使用在下文描述之由三個支柱組成的受約束VVC編碼方法。
首先,與CRA相關聯之RASL圖像受約束,使得按解碼次序在CRA之前的圖像不會經選擇為並置參考圖像,來執行語法至語法預測,亦即(SB) TMVP。藉此,與在編碼器側完全相同的參考圖像及運動資訊經使用,並且防止了來自不正確的源運動資訊至較早區段圖像的任何語法預測誤差。在可能的實施中,按解碼次序之第一RASL圖像被限制為僅使用其相關聯的CRA圖像作為並置參考圖像,該參考圖像自然地僅代管零運動向量,而其他RASL圖像可存取按解碼次序之第一RASL圖像及以下圖像的非零時間MV候選者。關於樣本至語法預測工具,DMVR對所有RASL圖像停用,該等RASL圖像具有按解碼次序在相關聯的CRA之前的有效參考圖像。在另一替代方案中,DMVR對所有RASL圖像停用,而不管其參考圖像如何,且在另一替代方案中,DMVR僅對用作以下圖像之並置參考圖像的RASL圖像停用,並且在又一替代方案中,DMVR對所有RASL圖像停用,除了屬於最高時間層且藉此不用作參考之RASL圖像以外。藉此,來自早期區段之參考圖像的錯誤樣本值與其他RASL圖像的編碼器側或受漂移影響的樣本不同,不會導致樣本至語法預測中之誤差。
為了確保區段切換後的VVC一致性,必須針對具有在相關聯的CRA之前的參考圖像之所有RASL圖像限制其他工具,亦即光流相關工具BDOF及PROF的使用被停用。在一替代方案中,為了簡單起見,可能對所有RASL圖像停用BDOF及PROF。另外,視訊內之獨立寫碼子圖像的VVC之新特徵例如適用於360度視埠相關視訊串流,該新特徵必須停用以使用RPR。所有以上工具約束亦為在VVC規範中定義以啟用RPR之一致性約束的一部分。除與VVC中之RPR使用相關聯的一致性約束以外,亦需要其他工具約束,此係因為使用自經重建樣本之參數預測的預測技術亦可產生明顯假影。因此,在吾人之實施中,藉由編碼器側搜尋演算法逐區塊約束來停用CCLM,此係因為當前的VVC語法僅允許逐序列停用,此顯著降低整體寫碼效率。此有效地允許確保編碼器側避免漂移,但若無徹底的低層級剖析,則無法在解碼器上容易地確認。並且,由於啟用但不使用該工具,不必要的位元(亦即用於CCLM使用之寫碼單元層級旗標,諸如cclm_mode_flag或cclm_mode_idx)經發送以傳信不使用其之編碼決策。
其次,亦對於開放GOP寫碼結構,亦即按解碼次序在其相關聯的RASL圖像之前的CRA圖像,用於所有圖像之必要的APS需要存在於該區段內。應注意,對於隨機存取開放GOP串流,此約束並非必要的,且允許RASL圖像指代以位元串流傳輸的按解碼次序在相關聯的CRA圖像之前的APS。由於當在此類CRA圖像處隨機存取此類圖像時,RASL圖像會被丟棄且此引用並非有問題的。並且,當不執行切換時,此類APS在連續解碼中係可用的。然而,此等APS在具有開放GOP切換之串流中可能不可用,且因此需要防止被引用。在吾人之實施中,與ALF、LMCS及量化縮放清單相關的處理係以與封閉GOP寫碼結構類似的方式來重設。
第三,自VVC高層級語法之視角來看,位元串流階梯中之變型的個別編碼必須以協調方式實行,且牢記開放GOP切換之目標在解碼器側。因此,所有區段變型之序列參數集(SPS)需要經對準,使得區段切換不會藉由SPS之改變觸發新的經寫碼層視訊序列之開始。舉例而言,藉由適當協調,SPS將指示位元串流階梯內之最大解析度、匹配區塊大小及色度格式、適當匹配層級指示器及相關約束旗標,諸如gci_no_res_change_in_clvs_constraint_flag、sps_ref_pic_resampling_enabled_flag及sps_res_change_in_clvs_allowed_flag,其具有在解碼器側啟用RPR之使用的適當組配。能力比經指示最大解析度或層級所需的能力低的裝置需要藉由系統機制運用經調節SPS來經服務。
VVC中之RPR已經以受約束方式設計,以限制如自以上工具約束論述而顯而易見的其實施及運行時間複雜性。此複雜性考慮之重要態樣在於當存取RPR使用中之經縮放參考樣本時之記憶體頻寬係可接受的,且相比於無RPR之情況下,並不顯著較高。VVC中之經寫碼圖像伴隨著所謂的縮放窗口,其用於判定二個圖像之間的縮放因數。為了為RPR之記憶體頻寬要求設定一個界限,使用RPR之圖像的縮放窗口與其參考圖像之縮放窗口之間的關係經限制以最多允許八倍放大及二倍縮小。換言之,假設每一縮放窗口匹配其表示之圖像大小,允許當切換為具有八倍高的圖像大小之表示時使用RPR。然而,若圖像大小在每一維度上減少不少於一半,則下切換可能僅使用RPR。
通常,在自適應串流情況中,以漸進性方式來實行上切換,亦即逐漸提高解析度或品質。然而,在下切換時,可能會發生,當播放器之緩衝區不足時,該播放器切換至最低品質以避免緩衝區欠載運行,此意謂下切換可能不會逐步發生。減輕VVC中之RPR的此限制性之一種方式為運用封閉的GOP結構來編碼最低品質表示,使得其可在圖像大小在此類非漸進性下切換事件期間減小至小於一半時用作後背方案。
在下文中,描述實施例,其係關於支援上文所論述之寫碼工具100、200、300、400及500中之一個、更多個或全部之解碼器及編碼器。接下來所描述之解碼器及編碼器可以遵從圖1及圖2之方式來實施。儘管上文已經主要關於解碼器側論述了工具100、200、300、400及500,但顯而易見,對應的工具之描述可轉移至編碼器側上,該差異在於該編碼器將經涉及資訊插入至資料串流中而非自該資料串流對經涉及資訊進行解碼。每一所支援的寫碼工具表示一個寫碼工具350。在區塊基礎上使用顯式語法元素控制353之任一寫碼工具涉及該編碼器在區塊基礎上編碼語法元素及該解碼器自資料串流解碼該語法元素。寫碼工具100可為僅有的使用此顯式區塊基礎語法元素之寫碼工具。其他寫碼工具200、300、400及500可使用固有的區塊基礎應用決策356連同圖像基礎或切片基礎組配信令,以用於完全地去啟動工具。
隨後經解釋實施例係關於一指示或信令,其向該解碼器指示是否已經遵從關於剛提及之一組一或多個寫碼工具之使用的某些編碼約束。該編碼器在資料串流中傳信此指示,且藉由遵從對應的編碼約束來相應地限定其編碼。在區段切換之狀況下,該解碼器又使用該指示且將其解譯為漂移限制性的保證或指示。根據替代性實施例,下文論述之該指示/信令亦可用於實際上去啟動寫碼工具中之一或多者。舉例而言,在VVC中,迄今為止不可能在圖像或切片基礎上去啟動工具100。除了承諾功能之外,下文論述之該指示/信令亦可承擔組配信令之功能,以便關於某些圖像/切片去啟動工具100。用於區塊基礎決策356之區塊基礎語法元素接著可經省略,且未經寫碼成資料串流且未自資料串流解碼。
隨後,呈現組合,其使用經呈現約束之信令以啟用開放GOP解析度切換,亦即,當執行串流切換時,CRA之RASL圖像可運用可接受漂移來解碼,此係因為某些寫碼工具在RASL圖像中係無效的。雖然目前先進技術允許對作為經呈現方法之一部分的工具(例如TMVP、SBTMVP、BDOF、PROF及DMVR)中之一些的此類指示,但在經呈現方法中存在顯著的額外約束,該等約束需要避免來自樣本至語法預測工具(亦即,CCLM及/或LMCS)的嚴重假影。因此,需要具有能夠在位元串流中指示此類工具對於某些圖像(亦即CRA之RASL圖像)無效的編碼器。
VVC具有擴展機制,以向後相容的方式將位元旗標添加至圖像標頭(PH)及切片標頭(SH)語法。出於此目的,各別SPS指示PH或SH語法中之用於此類目的的額外位元之數目,該等額外位元在讀取語法時必須經剖析,且求導係用於將此額外位元指派至旗標或可變值。以下表展示伴隨著各別語義之各別SPS及PH語法。SH語法及語義類似於PH語法及語義。
seq_parameter_set_rbsp( ) { 描述符
    […]   
sps_num_extra_ph_bytes u(2)
for( i = 0; i < (sps_num_extra_ph_bytes * 8 ); i++ )   
sps_extra_ph_bit_present_flag[ i ] u(1)
[…]   
sps _extra _ph _bit _present _flag[ i ]等於1規定第i額外位元存在於引用SPS之PH語法結構中。sps_extra_ph_bit_present_flag[ i ]等於0規定第i額外位元不存在於引用SPS之PH語法結構中。
變數NumExtraPhBits如下導出: NumExtraPhBits = 0 for( i = 0; i < ( sps_num_extra_ph_bytes * 8 ); i++ ) if( sps_extra_ph_bit_present_flag[ i ] )      (1) NumExtraPhBits++
picture_header_structure( ) { 描述符
    […]   
    for( i = 0; i < NumExtraPhBits; i++ )   
        ph_ extra_bit[ i ] u(1)
    […]   
ph_extra_bit[ i ]可具有任一值。符合本說明書之此版本的解碼器應忽略ph_extra_bit[ i ]之存在及值。其值不影響在本說明書之此版本中指定的解碼程序。
未知曉的解碼器可至少正確地剖析位元串流且對其進行正確解碼,而知曉額外位元含義之解碼器可進一步解譯額外位元指示且相應地起作用,例如向用戶端建議串流切換係可能的且無嚴重漂移,此係因為符合根據經呈現方法之約束。同樣地,檔案格式封裝器、HTTP串流伺服器或甚至RTP串流伺服器可在以利用位元串流切換之方式封裝、提供且服務該內容時考慮此位元串流指示。
本發明之實施例將如下在RASL圖像或相關聯的CRA圖像之PH或SH語法的額外位元中攜載經呈現方法之指示。在SPS語義中,藉由sps_extra_ph_bit_present_flag[ i ]之指數i將特定額外位元旗標識別為指示PH/SH額外位元旗標之存在,其指示經呈現方法。舉例而言,PH中之第一額外位元存在可如下藉由第一SPS PH額外位元組之第一SPS PH額外位元(i=0)來識別。
變數ConstraintMethodFlagPresentFlag之值經設定為等於sps_extra_ph_bit_present_flag[ 0 ]。應注意,使用索引0,但可替代地使用另一索引,亦即,sps_extra_ph_bit_present_flag[ i ]當中之位元經選擇以具有以下意義:在所使用的工具方面約束RASL圖像。
在PH語義中,如下導出指示經呈現約束方法之特點的各別變數。
變數ConstrainedRASLFlagEnabledFlag/ConstrainedCRAFlagEnabledFlag之值經設定成等於(ConstraintMethodFlagPresentFlag && ph_extra_bit[ 0 ])。應注意,使用索引0,但取決於由sps_extra_ph_bit_present_flag[ i ]指示之值以及哪一索引用於針對RASL圖像ph_extra_bit[ j ]之約束,PH中之額外旗標中之第j旗標將指示該等約束對於RASL圖像是否為適當的。
替代方案1 (攜載RASL圖像中之信令):當ConstrainedRASLFlagEnabledFlag等於1時,在不使用CCLM之情況下編碼當前圖像。用於BDOF、DMVR、PROF、(SB)TMVP及LMCS之PH/SH控制旗標以及序列層級約束旗標已經在VVC版本1中,而CCLM錯過了具有圖像或切片範疇之控制旗標。
替代方案2 (攜載相關聯的CRA圖像中之信令):當ConstrainedCRAFlagEnabledFlag等於1時,在不使用TOOLSET之情況下編碼與當前圖像相關聯之RASL圖像,其中TOOLSET是指CCLM及/或LMCS及/或BDOF及/或PROF及/或DMVR,及/或RASL圖像不使用在當前圖像(亦即CRA圖像)之前的用於(sb)TMVP之任何並置圖像。
類似於上文之替代性實施例可經建構以用於RASL或CRA圖像之切片的SH信令。
在另一替代實施例中,以上約束如下藉由在具有相同含義之DCI、VPS或SPS中添加一般約束旗標(例如,一般約束資訊語法中之gci_rasl_pictures_tool_constraint_flag或gci_cra_pictures_tool_constraint_flag)而經指示為CVS、CLVS及/或位元串流之性質/約束。
對應於替代方案1:gci_rasl_pictures_tool_constraint_flag等於1規定用於OlsInScope中之所有RASL圖像的ConstrainedRASLFlagEnabledFlag應等於1。gci_rasl_pictures_tool_constraint_flag等於0不施加此類約束。
對應於替代方案2:gci_cra_pictures_tool_constraint_flag等於1規定用於OlsInScope中之所有CRA圖像的ConstrainedCRAFlagEnabledFlag應等於1。gci_cra_pictures_tool_constraint_flag等於0不施加此類約束。
亦即,當設定此一般約束旗標時,在不使用TOOLSET之情況下編碼與CVS、CLVS及/或位元串流中之CRA相關聯的所有RASL圖像—其中TOOLSET係指CCLM及/或LMCS及/或BDOF及/或PROF及/或DMVR,及/或RASL圖像不使用在當前圖像(亦即CRA圖像)之前的用於(sb)TMVP之任何並置圖像。
在另一替代實施例中,以上約束係在PPS擴展語法中指示。與CRA相關聯之RASL圖像可指代PPS,其指示以上約束係有效的,而位元串流之其他圖像確實指代不指示以上約束之PPS。
在另一替代實施例中,以上約束信令係藉由CRA圖像或相關聯的RASL圖像中之SEI訊息或針對圖像之整個經寫碼層視訊序列來實行。
在另一替代實施例中,以上約束信令係用於在寫碼單元層級上有條件地發送CCLM旗標。 在另一替代實施例中,以上約束信令不適用於與CRA相關聯之所有RASL圖像,但考慮到可接受漂移及招致的寫碼效率損失,取決於實際工具,限於RASL圖像之子集:
- DMVR:(與以上描述本文相同):DMVR對具有按解碼次序在相關聯的CRA之前的有效參考圖像之所有RASL圖像停用。應注意,當前圖像可具有:其參考圖像清單(RPL)中之有效參考圖像(實際上用於預測),及非有效參考圖像,其不用於預測當前圖像而是後續(按解碼次序)圖像之樣本或語法,且其因此未準備好自經解碼圖像緩衝區(DPB)移除。在另一替代方案中,DMVR對所有RASL圖像停用,而不管其參考圖像,且在另一替代方案中,DMVR僅對用作用於以下圖像之並置參考圖像的RASL圖像停用,並且在又一替代方案中,DMVR對不屬於最高時間層之RASL圖像停用。可組合該等替代方案。
- BDOF及PROF:對於所有RASL圖像或僅對具有按解碼次序在相關聯的CRA之前的有效參考圖像之RASL圖像停用。
根據一實施例,該指示在資料串流中以SEI訊息之形式來傳信。如上文所提及,SEI訊息對於圖像序列(例如,經寫碼視訊序列,CVS)中之所有圖像可為有效的。例如,SEI訊息可在該序列中傳信。因此,該解碼器可自SEI訊息之存在或自SEI訊息中之指示推斷出該序列中之所有RASL圖像以不包括寫碼工具之預定集合之方式經寫碼。舉例而言,根據此實施例,該組寫碼工具至少包含基於跨分量線性模型之預測工具100及解碼器側運動向量改進工具400。
在下文中,描述上文所描述之發明的其他實施例。
D1.1.  一種用於自一資料串流解碼一視訊之視訊解碼器,其經組配以自該資料串流解碼一指示[例如,gci_rasl_pictures_tool_constraint_flag],該指示對於該視訊之一圖像序列為有效的且指示該圖像序列內之RASL圖像以不包括一或多個寫碼工具之一預定集合來寫碼[例如,作為一種承諾,使得該解碼器已知,藉由串接在不同空間解析度及/或不同SNR下寫碼之該視訊之單獨寫碼的開放GOP版本之開放GOP切換在RASL圖像中不導致過多漂移]。
D1.2.如任一前述實施例D1.#之視訊解碼器,其中一或多個寫碼工具之該集合包含 一基於跨分量線性模型之預測工具(100)。
D1.3.  如實施例D1.2之視訊解碼器,其中,根據該基於跨分量線性模型之預測工具,一圖像區塊(10a)之一色度分量(102)係使用一線性模型(106)自該圖像區塊(10a)之一明度分量(104)來預測,該線性模型之參數係自該圖像區塊之一已經解碼鄰域(112)中之明度及色度極值(110)來判定(108)。
D1.4.  如任一前述實施例D1.#之視訊解碼器,其中一或多個寫碼工具之該集合包含 一明度色調映射及色度殘餘縮放預測工具(200)。
D1.5.  如實施例D1.4之視訊解碼器,其中,根據該明度色調映射及色度殘餘縮放預測工具, 用於一預定圖像(12)之一明度分量預測(202)[例如框間預測]及一明度分量殘餘解碼(204)係以一寫碼明度色調標度(208)來執行,一呈現明度色調標度(210)係藉由一明度色調映射(212)而經映射至該寫碼明度色調標度上,以獲得該預定圖像之一經重建明度分量之一寫碼明度色調標度版本(214), 用於該預定圖像之一圖像區塊(10b)之一色度殘餘縮放因數(216)係自該圖像區塊之一鄰域(222)內之該預定圖像的該經重建明度分量之該寫碼明度色調標度版本之一平均值(220)來判定,且 針對該圖像區塊自該資料串流解碼之一色度殘餘信號(224)係根據該色度殘餘縮放因數而經縮放(226)且用於針對該圖像區塊來校正(228)一框內色度預測信號(230)。
D1.6.  如任一前述實施例D1.#之視訊解碼器,其中一或多個寫碼工具之該集合包含 一光流工具(300)。
D1.7.  如實施例D1.6之視訊解碼器,其中該光流工具係 用於藉助於基於光流之分析來改良一預定經框間預測區塊(10c)之一平移框間預測信號。
D1.8.  如任一前述實施例D1.#之視訊解碼器,其中一或多個寫碼工具之該集合包含 一解碼器側運動向量改進工具(400)。
D1.9.  如實施例D1.8之視訊解碼器,其中該解碼器側運動向量改進工具係 用於藉由在於該資料串流中寫碼之一經傳信運動向量(402)處及周圍之運動向量候選者當中執行一最佳匹配搜索來改進該經傳信運動向量而改良該經傳信運動向量,以用於對來自一參考圖像(404)之一預定經框間預測區塊(10d)進行框間預測。
D1.9a. 如實施例D1.9之視訊解碼器,其中該解碼器側運動向量改進工具經組配以 相對於該參考圖像使用該經框間預測區塊之一已經解碼鄰域來執行該最佳匹配搜索。
D1.9b.   如實施例D1.8之視訊解碼器,其中該解碼器側運動向量改進工具經組配以 藉由在包括在該資料串流中寫碼之一對經傳信運動向量(402)及圍繞該對經傳信運動向量之運動向量配對候選者當中執行一最佳匹配搜索來改進該對經傳信運動向量,以用於對來自在時間上置放在一經預定框間雙向預測區塊(10d)之一圖像前方及後方[按呈現次序]的一對參考圖像(404)之該經預定框間雙向預測區塊(10d)進行框間預測。
D1.10.   如任一前述實施例D1.#之視訊解碼器,其中一或多個寫碼工具之該集合包含 一時間運動向量預測工具(500)。
D1.11. 如實施例D1.10之視訊解碼器,其中根據該時間運動向量預測工具,用於經框間預測區塊之運動向量候選者清單形成包括自一經先前解碼圖像(502)進行運動向量候選者補充。
D1.12.   如實施例D1.11之視訊解碼器,其中根據該時間運動向量預測工具,用於經框間預測區塊之運動向量候選者清單形成包括自由一運動向量預測子(504)指向之該經先前解碼圖像之一區塊(506)進行運動向量候選者補充。
D1.13.   如實施例D1.12之視訊解碼器,其中該運動向量預測子包括一時間運動向量預測子。
D1.14.   如任一前述實施例D1.#之視訊解碼器,其中該指示包括於以下各者中之一者中: 該資料串流之一解碼器能力資訊區段,及 該資料串流之一視訊或序列參數集,及 一補充增強資訊訊息。
D1.15.   如任一前述實施例D1.#之視訊解碼器,其中該指示包含一個位元,其共同地指示相對於該圖像序列內之該等RASL圖像之寫碼,不包括一或多個寫碼工具之該預定集合中之所有寫碼工具。
D1.16.   如任一前述實施例D1.#之視訊解碼器,其中該解碼器經組配以支援參考圖像重新取樣。
D1.17.   如實施例D1.16之視訊解碼器,其中,根據該參考圖像重新取樣,一經框間預測區塊之一參考圖像係經受樣本重新取樣,以便橋接該參考圖像與其中含有該經框間預測區塊之一圖像之間的一縮放窗大小偏差或樣本解析度偏差,以為該經框間預測區塊提供一框間預測信號。
D1.18.   如前述實施例D1.#中任一項之視訊解碼器,其中一或多個寫碼工具之該集合包含[例如,200、300、400、500] 一或多個第一固有應用的寫碼工具,其中之每一者係針對一預定區塊取決於在該資料串流中針對該預定區塊傳信之一或多個寫碼選項而應用,且與除各別另一寫碼工具以外之一另一寫碼工具相關,及/或 一或多個第二固有應用的寫碼工具,其中之每一者係針對一預定區塊取決於該預定區塊之一大小而應用。
D1.19.   如前述實施例D1.#中任一項之視訊解碼器,其中一或多個寫碼工具之該集合包含[例如,100、500] 一或多個明確應用的寫碼工具,其中之每一者係針對一預定區塊取決於經寫碼成該資料串流之一語法元素而應用於該預定區塊,以用於專門地傳信各別寫碼工具對該預定區塊之應用。
D1.20.   如實施例D1.19之視訊解碼器,其中該解碼器經組配以針對該等RASL圖像內之區塊以及針對除該等RASL圖像以外之圖像的區塊自該資料串流解碼該語法元素。
D1.21.   如實施例D1.19之視訊解碼器,其中該解碼器經組配以僅針對除RASL圖像以外之圖像內的區塊自該資料串流解碼該語法元素[例如,藉此節省該等RASL圖像中之位元]。
D1.22.   如前述實施例D1.#中任一項之視訊解碼器,其中該解碼器經組配以支援框內預測區塊解碼模式及框間預測區塊解碼模式。
D1.23.   如前述實施例D1.#中任一項之視訊解碼器,其中該圖像序列 開始於且包括一個CRA圖像,且包含直至—按寫碼次序—且結尾於緊接在一CRA圖像之前的一圖像之圖像,或 包含按寫碼次序為連續的且包含多於一個CRA之圖像。
D1.24.   如前述實施例D1.#中任一項之視訊解碼器,其中一或多個寫碼工具之該集合包含 一或多個可去啟動寫碼工具,其中之每一者就其應用於圖像區塊而言可藉由該資料串流內部之組配信令以圖像或切片為單位而去啟動。
D1.25.   如前述實施例D1.#中任一項之視訊解碼器,其經組配以使用該指示以查看開放GOP切換是否導致持久的漂移。
D1.25a.  如前述實施例D1.#中任一項之視訊解碼器,其經組配以使用該指示來查看開放GOP切換是否導致樣本不匹配,但保持語法及參數設置。
D1.26.   如前述實施例D1.#中任一項之視訊解碼器,其中 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,及/或 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,該等RASL圖像具有參考圖像,該等參考圖像按解碼次序在與其相關聯的一CRA圖像之前,及/或 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,該等RASL圖像用作用於以下圖像之一時間運動向量預測參考圖像,及/或 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,該等RASL圖像不屬於一最高時間層。
D1.27.   如前述實施例D1.#中任一項之視訊解碼器,其中 該指示指示該圖像序列內之該等RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式以一如下方式寫碼使得 對於在一或多個寫碼工具之該預定集合中的一或多個寫碼工具之一第一子集,一第一特性應用於之所有RASL圖像以不包括一或多個寫碼工具之該預定集合中的一或多個寫碼工具之該第一子集的該方式經寫碼,且 對於在一或多個寫碼工具之該預定集合中的一或多個寫碼工具之一第二子集,一第二特性應用於之所有RASL圖像,或所有RASL圖像,以不包括一或多個寫碼工具之該預定集合中的一或多個寫碼工具之該第二子集的該方式經寫碼,該第一子集及該第二子集相互不相交。
D1.28.   如實施例D1.27之視訊解碼器,其中該第一特性及/或該第二特性係選擇: 使參考圖像按解碼次序在與其相關聯的一CRA圖像之前, 充當用於以下圖像之一時間運動向量預測參考圖像,及 不屬於一最高時間層。
D1.29.   如實施例D1.27或更高之視訊解碼器,其中 該第一子集包括一解碼器側運動向量改進工具及一時間運動向量預測工具中之一或多者。
D1.30.   如實施例D1.29之視訊解碼器,其中該第一特性係選自: 使參考圖像按解碼次序在與其相關聯的一CRA圖像之前, 充當用於以下圖像之一時間運動向量預測參考圖像,及 不屬於一最高時間層。
D2.1.  一種用於自一資料串流解碼一視訊之視訊解碼器,其經組配以 自該資料串流解碼一指示[例如,使用sps_extra_ph_bit_present_flag及ph_extra_bit,或使用gci_rasl_pictures_tool_contraint_flag],該指示按該視訊之一圖像序列中之圖像、全域地針對各別圖像或在每切片基礎上指示該各別圖像是否以不包括一或多個寫碼工具之一預定集合之一方式經寫碼,該預定集合包含一基於跨分量線性模型之預測工具[例如作為一種圖像式指示,其使得有可能查看RASL圖像處之潛力漂移係足夠低的]。
D2.2.  如前述實施例D2.#中任一項之視訊解碼器,其中該解碼器經組配以支援框內預測區塊解碼模式及框間預測區塊解碼模式。
D2.3.  如任一前述實施例D2.#之視訊解碼器,其中,根據該基於跨分量線性模型之預測工具, 一圖像區塊之一色度分量係使用一線性模型自該圖像區塊之一明度分量來預測,該線性模型之參數係自該圖像區塊之一已經解碼鄰域中之明度及色度極值來判定。
D2.4.  如任一前述實施例D2.#之視訊解碼器,其中一或多個寫碼工具之該集合進一步包含 一明度色調映射及色度殘餘縮放預測工具。
D2.5.  如實施例D2.4之視訊解碼器,其中,根據該明度色調映射及色度殘餘縮放預測工具, 用於一預定圖像之一明度分量預測及一明度分量殘餘解碼係以一寫碼明度色調標度來執行,一呈現明度色調標度係藉由一明度色調映射經映射至該寫碼明度色調標度上,以獲得該預定圖像之一經重建明度分量之一寫碼明度色調標度版本, 用於該預定圖像之一圖像區塊之一色度殘餘縮放因數係自該圖像區塊之一鄰域內之該預定圖像的該經重建明度分量之該寫碼明度色調標度版本之一平均值來判定,且 針對該圖像區塊自該資料串流解碼之一色度殘餘信號係根據該色度殘餘縮放因數而經縮放,且用於針對該圖像區塊來校正一框內色度預測信號。
D2.6.  如任一前述實施例D2.#之視訊解碼器,其中一或多個寫碼工具之該集合進一步包含 一光流工具。
D2.7.  如實施例D2.6之視訊解碼器,其中該光流工具係 用於藉助於基於光流之分析來改良一預定經框間預測區塊之一平移框間預測信號。
D2.8.  如任一前述實施例D2.#之視訊解碼器,其中一或多個寫碼工具之該集合進一步包含 一解碼器側運動向量改進工具。
D2.9.  如實施例D2.8之視訊解碼器,其中該解碼器側運動向量改進工具係 用於藉由在於該資料串流中寫碼之一經傳信運動向量(402)處及周圍之運動向量候選者當中執行一最佳匹配搜索來改進該經傳信運動向量而改良該經傳信運動向量,以用於對來自一參考圖像(404)之一預定經框間預測區塊(10d)進行框間預測。
D2.9a如實施例D2.9之視訊解碼器,其中該解碼器側運動向量改進工具經組配以 相對於該參考圖像使用該經框間預測區塊之一已經解碼鄰域來執行該最佳匹配搜索。
D2.9b.   如實施例D2.8之視訊解碼器,其中該解碼器側運動向量改進工具經組配以 藉由在包括在該資料串流中寫碼之一對經傳信運動向量(402)及圍繞該對經傳信運動向量之運動向量配對候選者當中執行一最佳匹配搜索來改進該對經傳信運動向量,以用於對來自在時間上置放在一經預定框間雙向預測區塊(10d)之一圖像前方及後方的一對參考圖像(404)之該經預定框間雙向預測區塊(10d)進行框間預測。
D2.10.   如任一前述實施例D2.#之視訊解碼器,其中一或多個寫碼工具之該集合進一步包含 一時間運動向量預測工具。
D2.11. 如實施例D2.10之視訊解碼器,其中根據該時間運動向量預測工具,用於經框間預測區塊之運動向量候選者清單形成包括自一經先前解碼圖像進行運動向量候選者補充。
D2.12.   如實施例D2.11之視訊解碼器,其中根據該時間運動向量預測工具,用於經框間預測區塊之運動向量候選者清單形成包括自由一運動向量預測子指向之該經先前解碼圖像之一區塊進行運動向量候選者補充。
D2.13.   如實施例D2.12之視訊解碼器,其中該運動向量預測子包括一時間運動向量預測子。
D2.14.   如任一前述實施例D1.#之視訊解碼器,其中該指示包括於以下各者中之一者中: 由該圖像序列中之該等圖像引用之一或多個圖像參數集, 該圖像序列中之該等圖像之一圖像標頭,及 該圖像序列中之該等圖像的切片之一切片標頭。
D2.15.   如任一前述實施例D2.#之視訊解碼器,其中該指示包括於以下各者中 由該圖像序列中之該等圖像引用之圖像參數集,其中該等圖像參數集包含:至少一個第一圖像參數集,其指示引用該至少一個第一圖像參數集之圖像以不包括一或多個寫碼工具之該預定集合之一方式經寫碼;及至少一個第二圖像參數集,其指示引用該至少一個第二圖像參數集之圖像以可能使用一或多個寫碼工具之該預定集合之一方式經寫碼,或 由該圖像序列中之該等圖像引用之圖像參數集,其中該等圖像參數集包含:至少一個第一圖像參數集,其指示與引用該至少一個第一圖像參數集之圖像相關聯的RASL圖像以不包括一或多個寫碼工具之該預定集合之一方式經寫碼;及至少一個第二圖像參數集,其指示與引用該至少一個第二圖像參數集之圖像相關聯的RASL圖像以可能使用一或多個寫碼工具之該預定集合之一方式經寫碼。
D2.16.   如實施例D2.15之視訊解碼器,其中該指示包含該等圖像參數集之一延伸語法部分內之一語法元素[例如,使用sps_extra_ph_bit_present_flag及ph_extra_bit]。
D2.17.   如實施例D2.16之視訊解碼器,其中該等圖像參數集之該延伸語法部分之一長度在該資料串流之一序列或視訊參數集中指定。
D2.18.   如任一前述實施例D2.#之視訊解碼器,其中該指示為以下各者之一延伸部分中之一語法元素: 該圖像序列中之該等圖像之一圖像標頭,及/或 該圖像序列中之該等圖像的切片之一切片標頭, 其中該延伸部分之一長度[例如,NumExtraPhBits]係在該資料串流之一圖像或序列或視訊參數集中指示。
D2.18a.  如實施例D2.18之視訊解碼器,其中該語法元素指示 該語法元素所屬[例如,該圖像標頭或切片標頭有關]之一圖像是否以不包括一或多個寫碼工具之該預定集合之一方式經寫碼,或 與該語法元素所屬之該圖像相關聯之RASL圖像是否以不包括一或多個寫碼工具之該預定集合之一方式經寫碼。
D2.19.   如任一前述實施例D2.#之視訊解碼器,其中該解碼器經組配以支援參考圖像重新取樣。
D2.22.   如實施例D2.19之視訊解碼器,其中,根據該參考圖像重新取樣,一經框間預測區塊之一參考圖像係經受樣本重新取樣,以便橋接該參考圖像與其中含有該經框間預測區塊之一圖像之間的一縮放窗大小偏差或樣本解析度偏差,以為該經框間預測區塊提供一框間預測信號。
D2.23.   如前述實施例D2.#中任一項之視訊解碼器,其中一或多個寫碼工具之該集合包含[例如,200、300、400、500] 一或多個第一固有應用的寫碼工具,其中之每一者係針對一預定區塊取決於在該資料串流中針對該預定區塊傳信之一或多個寫碼選項而應用,且與除各別另一寫碼工具以外之一另一寫碼工具相關,及/或 一或多個第二固有應用的寫碼工具,其中之每一者係針對一預定區塊取決於該預定區塊之一大小而應用。
D2.24.   如前述實施例D2.#中任一項之視訊解碼器,其中一或多個寫碼工具之該集合包含[例如,100、500] 一或多個明確應用的寫碼工具,其中之每一者係針對一預定區塊取決於經寫碼成該資料串流之一語法元素而應用於該預定區塊,以用於專門地傳信各別寫碼工具對該預定區塊之應用。
D2.25.   如實施例D2.24之視訊解碼器,其中該解碼器經組配以針對以下各者內之區塊自該資料串流解碼該語法元素:一或多個寫碼工具之該預定集合經傳信以自編碼排除之圖像或切片;及一或多個寫碼工具之該預定集合未經傳信以自編碼排除之圖像或切片。
D2.26.   如實施例D2.24之視訊解碼器,其中該解碼器經組配以僅針對一或多個寫碼工具之該預定集合經傳信以自編碼排除之圖像或切片內的區塊自該資料串流解碼該語法元素。
D2.27.   如前述實施例D2.24或更高中任一項之視訊解碼器,其中該基於跨分量線性模型之預測工具屬於該一或多個一或多個明確應用的寫碼工具。
D2.28.   如前述實施例D2.16或更高中任一項之視訊解碼器,其中該語法元素為一個位元,其共同地指示不包括一或多個寫碼工具之該預定集合中之所有寫碼工具。
D2.29.   如前述實施例D2.#中任一項之視訊解碼器,其中一或多個寫碼工具之該集合包含 一或多個可去啟動寫碼工具,其中之每一者就其應用於圖像區塊而言可藉由該資料串流內部之組配信令以圖像或切片為單位而去啟動。
D2.30.   如前述實施例D2.#中任一項之視訊解碼器,其經組配以使用該指示以查看開放GOP切換是否導致持久的漂移。
D2.30a.  如前述實施例D2.#中任一項之視訊解碼器,其經組配以使用該指示來查看開放GOP切換是否導致樣本不匹配,但保持語法及參數設置。
E1.1.  一種用於將一視訊編碼成一資料串流之視訊編碼器,其經組配以 將一指示[例如,gci_rasl_pictures_tool_constraint_flag]編碼成該資料串流,該指示對於該視訊之一圖像序列為有效的且指示該圖像序列內之RASL圖像以不包括一或多個寫碼工具之一預定集合之一方式經寫碼[例如作為一種承諾,使得該編碼器已知,藉由串接在不同空間解析度及/或不同SNR下寫碼之該視訊之單獨寫碼的開放GOP版本之開放GOP切換在RASL圖像中不導致過多漂移]。
E1.2.  如任一前述實施例E1.#之視訊編碼器,其中一或多個寫碼工具之該集合包含 一基於跨分量線性模型之預測工具(100)。
E1.3.  如E1.2之視訊編碼器,其中,根據該基於跨分量線性模型之預測工具, 一圖像區塊(10a)之一色度分量(102)係使用一線性模型(106)自該圖像區塊(10a)之一明度分量(104)來預測,該線性模型之參數係自該圖像區塊之一已經解碼鄰域(112)中之明度及色度極值(110)來判定(108)。
E1.4.  如任一前述實施例E1.#之視訊編碼器,其中一或多個寫碼工具之該集合包含 一明度色調映射及色度殘餘縮放預測工具(200)。
E1.5.  如實施例E1.4之視訊編碼器,其中,根據該明度色調映射及色度殘餘縮放預測工具, 用於一預定圖像(12)之一明度分量預測(202)[例如框間預測]及一明度分量殘餘編碼(204)係以一寫碼明度色調標度(208)來執行,一呈現明度色調標度(210)係藉由一明度色調映射(212)而經映射至該寫碼明度色調標度上,以獲得該預定圖像之一經重建明度分量之一寫碼明度色調標度版本(214), 用於該預定圖像之一圖像區塊(10b)之一色度殘餘縮放因數(216)係自該圖像區塊之一鄰域(222)內之該預定圖像的該經重建明度分量之該寫碼明度色調標度版本之一平均值(220)來判定,且 針對該圖像區塊在該資料串流中寫碼之一色度殘餘信號(224)係根據該色度殘餘縮放因數而經縮放(226)且用於針對該圖像區塊來校正(228)一框內色度預測信號(230)。
E1.6.  如任一前述實施例E1.#之視訊編碼器,其中一或多個寫碼工具之該集合包含 一光流工具(300)。
E1.7.  如實施例E1.6之視訊編碼器,其中該光流工具係 用於藉助於基於光流之分析來改良一預定經框間預測區塊(10c)之一平移框間預測信號。
E1.8.  如任一前述實施例E1.#之視訊編碼器,其中一或多個寫碼工具之該集合包含 一解碼器側運動向量改進工具(400)。
E1.9.  如實施例E1.8之視訊編碼器,其中該解碼器側運動向量改進工具係 用於藉由在於該資料串流中寫碼之一經傳信運動向量(402)處及周圍之運動向量候選者當中執行一最佳匹配搜索來改進該經傳信運動向量而改良該經傳信運動向量,以用於對來自一參考圖像(404)之一預定經框間預測區塊(10d)進行框間預測。
E1.9a.如實施例E1.9之視訊編碼器,其中該解碼器側運動向量改進工具經組配以 相對於該參考圖像使用該經框間預測區塊之一已經解碼鄰域來執行該最佳匹配搜索。
E1.9b.如實施例E1.8之視訊編碼器,其中該解碼器側運動向量改進工具經組配以 藉由在包括在該資料串流中寫碼之一對經傳信運動向量(402)及圍繞該對經傳信運動向量之運動向量配對候選者當中執行一最佳匹配搜索來改進該對經傳信運動向量,以用於對來自在時間上置放在一經預定框間雙向預測區塊(10d)之一圖像前方及後方的一對參考圖像(404)之該經預定框間雙向預測區塊(10d)進行框間預測。
E1.10. 如任一前述實施例E1.#之視訊編碼器,其中一或多個寫碼工具之該集合包含 一時間運動向量預測工具(500)。
E1.11. 如實施例E1.10之視訊編碼器,其中根據該時間運動向量預測工具,用於經框間預測區塊之運動向量候選者清單形成包括自一經先前解碼圖像(502)進行運動向量候選者補充。
E1.12. 如實施例E1.11之視訊編碼器,其中根據該時間運動向量預測工具,用於經框間預測區塊之運動向量候選者清單形成包括自由一運動向量預測子(504)指向之該經先前編碼圖像之一區塊(506)進行運動向量候選者補充。
E1.13. 如實施例E1.12之視訊編碼器,其中該運動向量預測子包括一時間運動向量預測子。
E1.14. 如任一前述實施例E1.#之視訊編碼器,其中該指示包括於以下各者中之一者中: 該資料串流之一解碼器能力資訊區段,及 該資料串流之一視訊或序列參數集,及 一補充增強資訊訊息。
E1.15. 如任一前述實施例E1.#之視訊編碼器,其中該指示包含一個位元,其共同地指示相對於該圖像序列內之該等RASL圖像之該寫碼,不包括一或多個寫碼工具之該預定集合中之所有寫碼工具。
E1.16.如任一前述實施例E1.#之視訊編碼器,其中該編碼器經組配以支援參考圖像重新取樣。
E1.17. 如實施例E1.16之視訊編碼器,其中,根據該參考圖像重新取樣,一經框間預測區塊之一參考圖像係經受樣本重新取樣,以便橋接該參考圖像與其中含有該經框間預測區塊之一圖像之間的一縮放窗大小偏差或樣本解析度偏差,以為該經框間預測區塊提供一框間預測信號。
E1.18. 如前述實施例E1.#中任一項之視訊編碼器,其中一或多個寫碼工具之該集合包含[例如200、300、400、500] 一或多個第一固有應用的寫碼工具,其中之每一者係針對一預定區塊取決於在該資料串流中針對該預定區塊傳信之一或多個寫碼選項而應用,且與除各別另一寫碼工具以外之一另一寫碼工具相關,及/或 一或多個第二固有應用的寫碼工具,其中之每一者係針對一預定區塊取決於該預定區塊之一大小而應用。
E1.19. 如前述實施例E1.#中任一項之視訊編碼器,其中一或多個寫碼工具之該集合包含[例如100] 一或多個明確應用的寫碼工具,其中之每一者係針對一預定區塊取決於經寫碼成該資料串流之一語法元素而應用於該預定區塊,以用於專門地傳信各別寫碼工具對該預定區塊之應用。
E1.20. 如實施例E1.19之視訊編碼器,其中該編碼器經組配以針對該等RASL圖像內之區塊以及針對除該等RASL圖像以外之圖像的區塊而將該語法元素編碼成該資料串流。
E1.21. 如實施例E1.19之視訊編碼器,其中該編碼器經組配以僅針對除RASL圖像以外之圖像內的區塊將該語法元素編碼成該資料串流[例如,藉此節省該等RASL圖像中之位元]。
E1.22. 如前述實施例E1.#中任一項之視訊編碼器,其中該編碼器經組配以支援框內預測區塊編碼模式及框間預測區塊編碼模式。
E1.23.如前述實施例E1.#中任一項之視訊編碼器,其中該圖像序列 開始於且包括一個CRA圖像,且包含直至-按寫碼次序-且結尾於緊接在一CRA圖像之前的一圖像之圖像,或 包含按寫碼次序為連續的且包含多於一個CRA之圖像。
E1.24. 如前述實施例E1.#中任一項之視訊編碼器,其中一或多個寫碼工具之該集合包含 一或多個可去啟動寫碼工具,其中之每一者就其應用於圖像區塊而言可藉由該資料串流內部之組配信令以圖像或切片為單位而去啟動。
E1.25. 如前述實施例E1.#中任一項之視訊編碼器,其經組配以在將該視訊編碼成該資料串流時遵從作為一編碼約束之指示。
E1.26. 如前述實施例E1.#中任一項之視訊編碼器,其中 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,及/或 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,該等RASL圖像具有參考圖像,該等參考圖像按解碼次序在與其相關聯的一CRA圖像之前,及/或 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,該等RASL圖像用作用於以下圖像之一時間運動向量預測參考圖像,及/或 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,該等RASL圖像不屬於一最高時間層。
E1.27. 如前述實施例E1.#中任一項之視訊編碼器,其中 該指示指示該圖像序列內之該等RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式以一如下方式寫碼使得 對於在一或多個寫碼工具之該預定集合中的一或多個寫碼工具之一第一子集,一第一特性應用於之所有RASL圖像以不包括一或多個寫碼工具之該預定集合中的一或多個寫碼工具之該第一子集的該方式經寫碼,且 對於在一或多個寫碼工具之該預定集合中的一或多個寫碼工具之一第二子集,一第二特性應用於之所有RASL圖像,或所有RASL圖像,以不包括一或多個寫碼工具之該預定集合中的一或多個寫碼工具之該第二子集的該方式經寫碼,該第一子集及該第二子集相互不相交。
E1.28. 如實施例E1.27之視訊編碼器,其中該第一特性及/或該第二特性係選自 使參考圖像按解碼次序在與其相關聯的一CRA圖像之前, 充當用於以下圖像之一時間運動向量預測參考圖像,及 不屬於一最高時間層。
E1.29. 如實施例E1.27或更高之視訊編碼器,其中 該第一子集包括一解碼器側運動向量改進工具及一時間運動向量預測工具中之一或多者。
E1.30. 如實施例E1.29之視訊編碼器,其中該第一特性係選自 使參考圖像按解碼次序在與其相關聯的一CRA圖像之前, 充當用於以下圖像之一時間運動向量預測參考圖像,及 不屬於一最高時間層。
E2.1.  一種用於將一視訊編碼成一資料串流之視訊編碼器,其經組配以 將一指示編碼成該資料串流[例如,使用sps_extra_ph_bit_present_flag及ph_extra_bit,或使用gci_rasl_pictures_tool_contraint_flag],該指示按該視訊之一圖像序列中之圖像、全域地針對各別圖像或在每切片基礎上指示該各別圖像是否以不包括一或多個寫碼工具之一預定集合之一方式經寫碼,該預定集合包含一基於跨分量線性模型之預測工具[例如作為一種圖像式指示,其使得有可能查看RASL圖像處之潛力漂移係足夠低的]。
E2.2.  如前述實施例E2.#中任一項之視訊編碼器,其中該編碼器經組配以支援框內預測區塊編碼模式及框間預測區塊編碼模式。
E2.3.  如任一前述實施例E2.#之視訊編碼器,其中,根據該基於跨分量線性模型之預測工具, 一圖像區塊之一色度分量係使用一線性模型自該圖像區塊之一明度分量來預測,該線性模型之參數係自該圖像區塊之一已經編碼鄰域中之明度及色度極值來判定。
E2.4.  如任一前述實施例E2.#之視訊編碼器,其中一或多個寫碼工具之該集合進一步包含 一明度色調映射及色度殘餘縮放預測工具。
E2.5.  如實施例E2.4之視訊編碼器,其中,根據該明度色調映射及色度殘餘縮放預測工具, 用於一預定圖像之一明度分量預測及一明度分量殘餘編碼係以一寫碼明度色調標度來執行,一呈現明度色調標度係藉由一明度色調映射經映射至該寫碼明度色調標度上,以獲得該預定圖像之一經重建明度分量之一寫碼明度色調標度版本, 用於該預定圖像之一圖像區塊之一色度殘餘縮放因數係自該圖像區塊之一鄰域內之該預定圖像的該經重建明度分量之該寫碼明度色調標度版本之一平均值來判定,且 針對該圖像區塊自該資料串流編碼之一色度殘餘信號係根據該色度殘餘縮放因數而經縮放,且用於針對該圖像區塊來校正一框內色度預測信號。
E2.6.  如任一前述實施例E2.#之視訊編碼器,其中一或多個寫碼工具之該集合進一步包含 一光流工具。
E2.7.  如實施例E2.6之視訊編碼器,其中該光流工具係 用於藉助於基於光流之分析來改良一預定經框間預測區塊之一平移框間預測信號。
E2.8.  如任一前述實施例E2.#之視訊編碼器,其中一或多個寫碼工具之該集合進一步包含 一解碼器側運動向量改進工具。
E2.9.  如實施例E2.8之視訊編碼器,其中該解碼器側運動向量改進工具係 用於藉由在於該資料串流中寫碼之一經傳信運動向量(402)處及周圍之運動向量候選者當中執行一最佳匹配搜索來改進該經傳信運動向量而改良該經傳信運動向量,以用於對來自一參考圖像(404)之一預定經框間預測區塊(10d)進行框間預測。
E2.9a如實施例E2.9之視訊編碼器,其中該解碼器側運動向量改進工具經組配以 相對於該參考圖像使用該經框間預測區塊之一已經解碼鄰域來執行該最佳匹配搜索。
E2.9b. 如實施例E2.8之視訊編碼器,其中該解碼器側運動向量改進工具經組配以 藉由在包括在該資料串流中寫碼之一對經傳信運動向量(402)及圍繞該對經傳信運動向量之運動向量配對候選者當中執行一最佳匹配搜索來改進該對經傳信運動向量,以用於對來自在時間上置放在一經預定框間雙向預測區塊(10d)之一圖像前方及後方的一對參考圖像(404)之該經預定框間雙向預測區塊(10d)進行框間預測。
E2.10. 如任一前述實施例E2.#之視訊編碼器,其中一或多個寫碼工具之該集合進一步包含 一時間運動向量預測工具。
E2.11. 如實施例E2.10之視訊編碼器,其中根據該時間運動向量預測工具,用於經框間預測區塊之運動向量候選者清單形成包括自一經先前編碼圖像進行運動向量候選者補充。
E2.12. 如實施例E2.11之視訊編碼器,其中根據該時間運動向量預測工具,用於經框間預測區塊之運動向量候選者清單形成包括自由一運動向量預測子指向之該經先前編碼圖像之一區塊進行運動向量候選者補充。
E2.13. 如實施例E2.12之視訊編碼器,其中該運動向量預測子包括一時間運動向量預測子。
E2.14. 如任一前述實施例D1.#之視訊編碼器,其中該指示包括於以下各者中之一者中: 由該圖像序列中之該等圖像引用之一或多個圖像參數集, 該圖像序列中之該等圖像之一圖像標頭,及 該圖像序列中之該等圖像的切片之一切片標頭。
E2.15. 如任一前述實施例E2.#之視訊編碼器,其中該指示包括於以下各者中: 由該圖像序列中之該等圖像引用之圖像參數集,其中該等圖像參數集包含:至少一個第一圖像參數集,其指示引用該至少一個第一圖像參數集之圖像以不包括一或多個寫碼工具之該預定集合之一方式經寫碼;及至少一個第二圖像參數集,其指示引用該至少一個第二圖像參數集之圖像以可能使用一或多個寫碼工具之該預定集合之一方式經寫碼,或 由該圖像序列中之該等圖像引用之圖像參數集,其中該等圖像參數集包含:至少一個第一圖像參數集,其指示與引用該至少一個第一圖像參數集之圖像相關聯的RASL圖像以不包括一或多個寫碼工具之該預定集合之一方式經寫碼;及至少一個第二圖像參數集,其指示與引用該至少一個第二圖像參數集之圖像相關聯的RASL圖像以可能使用一或多個寫碼工具之該預定集合之一方式經寫碼。
E2.16. 如實施例E2.15之視訊編碼器,其中該指示包含該等圖像參數集之一延伸語法部分內之一語法元素[例如,使用sps_extra_ph_bit_present_flag及ph_extra_bit]。
E2.17. 如實施例E2.16之視訊編碼器,其中該等圖像參數集之該延伸語法部分之一長度在該資料串流之一序列或視訊參數集中指定。
E2.18. 如任一前述實施例E2.#之視訊編碼器,其中該指示為以下各者之一延伸部分中之一語法元素: 該圖像序列中之該等圖像之一圖像標頭,及/或 該圖像序列中之該等圖像的切片之一切片標頭, 其中該延伸部分之一長度[例如,NumExtraPhBits]係在該資料串流之一圖像或序列或視訊參數集中指示。
E2.18a.  如實施例E2.18之視訊編碼器,其中該語法元素指示 該語法元素所屬[例如,該圖像標頭或切片標頭有關]之一圖像是否以不包括一或多個寫碼工具之該預定集合之一方式經寫碼,或 與該語法元素所屬之該圖像相關聯之RASL圖像是否以不包括一或多個寫碼工具之該預定集合之一方式經寫碼。
E2.19. 如任一前述實施例E2.#之視訊編碼器,其中該編碼器經組配以支援參考圖像重新取樣。
E2.22. 如實施例E2.19之視訊編碼器,其中,根據該參考圖像重新取樣,一經框間預測區塊之一參考圖像係經受樣本重新取樣,以便橋接該參考圖像與其中含有該經框間預測區塊之一圖像之間的一縮放窗大小偏差或樣本解析度偏差,以為該經框間預測區塊提供一框間預測信號。
E2.23.如前述實施例E2.#中任一項之視訊編碼器,其中一或多個寫碼工具之該集合包含[例如200、300、400、500] 一或多個第一固有應用的寫碼工具,其中之每一者係針對一預定區塊取決於在該資料串流中針對該預定區塊傳信之一或多個寫碼選項而應用,且與除各別另一寫碼工具以外之一另一寫碼工具相關,及/或 一或多個第二固有應用的寫碼工具,其中之每一者係針對一預定區塊取決於該預定區塊之一大小而應用。
E2.24. 如前述實施例E2.#中任一項之視訊編碼器,其中一或多個寫碼工具之該集合包含 一或多個明確應用的寫碼工具,其中之每一者係針對一預定區塊取決於經寫碼成該資料串流之一語法元素而應用於該預定區塊,以用於專門地傳信各別寫碼工具對該預定區塊之應用。
E2.25.如實施例E2.24之視訊編碼器,其中該編碼器經組配以針對以下各者內之區塊將該語法元素編碼成該資料串流:一或多個寫碼工具之該預定集合經傳信以自編碼排除之圖像或切片;及一或多個寫碼工具之該預定集合未經傳信以自編碼排除之圖像或切片。
E2.26. 如實施例E2.24之視訊編碼器,其中該編碼器經組配以僅針對一或多個寫碼工具之該預定集合經傳信以自編碼排除之圖像或切片內之區塊將該語法元素編碼成該資料串流。
E2.27. 如前述實施例E2.24或更高中任一項之視訊編碼器,其中該基於跨分量線性模型之預測工具屬於該一或多個一或多個明確應用的寫碼工具。
E2.28. 如前述實施例E2.16或更高中任一項之視訊編碼器,其中該語法元素為一個位元,其共同地指示不包括一或多個寫碼工具之該預定集合中之所有寫碼工具。
E2.29. 如前述實施例E2.#中任一項之視訊編碼器,其中一或多個寫碼工具之該集合包含 一或多個可去啟動寫碼工具,其中之每一者就其應用於圖像區塊而言可藉由該資料串流內部之組配信令以圖像或切片為單位而去啟動。
E2.30. 如前述實施例E2.#中任一項之視訊編碼器,其經組配以在將該視訊編碼成該資料串流時遵從作為一編碼約束之指示。
B1.1.  一種其中編碼有一視訊的資料串流,其包含 一指示[例如,gci_rasl_pictures_tool_constraint_flag],該指示對於該視訊之一圖像序列為有效的且指示該圖像序列內之RASL圖像以不包括一或多個寫碼工具之一預定集合之一方式經寫碼[例如作為一種承諾,使得該編碼器已知,藉由串接在不同空間解析度及/或不同SNR下寫碼之該視訊之單獨寫碼的開放GOP版本之開放GOP切換在RASL圖像中不導致過多漂移]。
B1.2   如實施例B1.1之資料串流,其由一如實施例E1.#中任一項之編碼器產生。
B2.1.  一種其中編碼有一視訊的資料串流,其包含 一指示[例如,使用sps_extra_ph_bit_present_flag及ph_extra_bit,或使用gci_rasl_pictures_tool_contraint_flag],該指示按該視訊之一圖像序列中之圖像、全域地針對各別圖像或在每切片基礎上指示該各別圖像是否以不包括一或多個寫碼工具之一預定集合之一方式經寫碼,該預定集合包含一基於跨分量線性模型之預測工具[例如作為一種圖像式指示,其使得有可能查看RASL圖像處之潛力漂移係足夠低的]。
B2.2   如實施例B2.1之資料串流,其由一如實施例E2.#中任一項之編碼器產生。
M.   一種方法,其由以上解碼器及編碼器中之任一項來執行。
P. 一種電腦程式,其具有一程式碼,該程式碼用於當在一電腦上執行程式時執行如實施例M之方法。
儘管已在設備之上下文中描述一些態樣,但顯而易見的是,此等態樣亦表示對應方法之描述,其中區塊或裝置對應於方法步驟或方法步驟之特徵。類似地,方法步驟之上下文中所描述的態樣亦表示對應設備之對應區塊或項目或特徵的描述。可由(或使用)硬體設備(比如微處理器、可規劃電腦或電子電路)執行方法步驟中之一些或全部。在一些實施例中,可由此類設備執行最重要之方法步驟中之一或多者。
本發明之資料串流可儲存於數位儲存媒體上或可在諸如無線傳輸媒體或有線傳輸媒體(諸如,網際網路)的傳輸媒體上傳輸。
取決於某些實施要求,本發明之實施例可以硬體或以軟體實施。實施可使用數位儲存媒體來執行,該媒體例如軟性磁碟、DVD、Blu-Ray、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,該媒體上儲存有電子可讀控制信號,該等電子可讀控制信號與可規劃電腦系統協作(或能夠協作),使得執行各別方法。因此,數位儲存媒體可為電腦可讀的。
根據本發明之一些實施例包含具有電子可讀控制信號之資料載體,該等電子可讀控制信號能夠與可規劃電腦系統協作,使得執行本文中所描述之方法中之一者。
通常,本發明之實施例可實施為具有程式碼之電腦程式產品,當電腦程式產品在電腦上運行時,該程式碼操作性地用於執行該等方法中之一者。程式碼可例如儲存於機器可讀載體上。
其他實施例包含儲存於機器可讀載體上用於執行本文中所描述之方法中之一者的電腦程式。
換言之,本發明方法之實施例因此為電腦程式,其具有用於在電腦程式於電腦上運行時執行本文中所描述之方法中之一者的程式碼。
因此,本發明方法之另一實施例為包含記錄於其上的,用於執行本文中所描述之方法中的一者的電腦程式之資料載體(或數位儲存媒體,或電腦可讀媒體)。資料載體、數位儲存媒體或記錄媒體通常係有形的及/或非暫時性的。
因此,本發明方法之另一實施例為表示用於執行本文中所描述之方法中的一者之電腦程式之資料串流或信號序列。資料串流或信號序列可例如經組配以經由資料通訊連接(例如,經由網際網路)而傳送。
另一實施例包含處理構件,例如經組配或經調適以執行本文中所描述之方法中的一者的電腦或可規劃邏輯裝置。
另一實施例包含電腦,該電腦具有安裝於其上之用於執行本文中所描述之方法中之一者的電腦程式。
根據本發明之另一實施例包含經組配以(例如電子地或光學地)傳送用以執行本文中所描述之方法中之一者的電腦程式至接收器的設備或系統。舉例而言,接收器可為電腦、行動裝置、記憶體裝置等等。該設備或系統可(例如)包含用於傳送電腦程式至接收器之檔案伺服器。
在一些實施例中,可規劃邏輯裝置(例如,場可規劃閘陣列)可用以執行本文中所描述之方法的功能性中之一些或全部。在一些實施例中,場可規劃閘陣列可與微處理器協作,以便執行本文中所描述之方法中之一者。通常,該等方法較佳地由任一硬體設備執行。
本文中所描述之設備可使用硬體設備或使用電腦或使用硬體設備與電腦之組合來實施。
本文中所描述之設備或本文中所描述之設備的任何組件可至少部分地以硬體及/或以軟體予以實施。
本文中所描述之方法可使用硬體設備或使用電腦或使用硬體設備與電腦的組合來執行。
本文中所描述之方法或本文中所描述之設備的任何組件可至少部分地由硬體及/或軟體執行。
上文所描述的實施例僅說明本發明之原理。應理解,熟習此項技術者將顯而易見對本文中所描述之配置及細節的修改及變化。因此,意圖為僅受到接下來之申請專利範圍之範疇限制,而不受到藉由本文中之實施例之描述及解釋所呈現的具體細節限制。 參考文獻
[1] ISO/IEC JTC 1, Information technology — Dynamic adaptive streaming over HTTP (DASH) — Part 1: Media presentation description and segment formats, ISO/IEC 23009-1, 2012 (and subsequent editions).
[2] J. De Cock, Z. Li, M. Manohara, A. Aaron. "Complexity-based consistent-quality encoding in the cloud." 2016 IEEE International Conference on Image Processing (ICIP). IEEE, 2016
[3] DASH Industry Forum Implementation Guidelines. [Online]. Available: https://dashif.org/guidelines/
[4] ITU-T and ISO/IEC JTC 1, Advanced Video Coding for generic audio-visual services, Rec. ITU-T H.264 and ISO/IEC 14496-10 (AVC), May 2003 (and subsequent editions).
[5] ITU-T and ISO/IEC JTC 1, “High Efficiency Video Coding,” Rec. ITU-T H.265 and ISO/IEC 23008-2 (HEVC), April 2013 (and subsequent editions).
[6] Y. Yan, M. Hannuksela, and H. Li. "Seamless switching of H. 265/HEVC-coded dash representations with open GOP prediction structure." 2015 IEEE International Conference on Image Processing (ICIP). IEEE, 2015.
[7] ITU-T and ISO/IEC JTC 1, “Versatile video coding”, Rec. ITU-T H.266 and ISO/IEC 23090-3 (VVC), August 2020.
[8] V. Baroncini and M. Wien, “VVC verification test report for UHD SDR video content”, doc. JVET-T2020 of ITU-T/ISO/IEC Joint Video Experts Team (JVET), 21th meeting: October 2020.
[9] D. Luo, V. Seregin, W. Wan. “Description of Core Experiment 1 (CE1): Reference picture resampling filters“, doc. JVET-Q2021 of ITU-T/ISO/IEC Joint Video Experts Team (JVET), 15th meeting: July 2019
[10] H. Schwarz, D. Marpe, and T. Wiegand, “Analysis of hierarchical B pictures and MCTF”, ICME 2006, IEEE International Conference on Multimedia and Expo, Toronto, Ontario, Canada, July 2006.
[11] Y.-K. Wang et al., “The High-Level Syntax of the Versatile Video Coding (VVC) Standard”  IEEE Trans. Circuits Syst. Video Technol., in press
[12] H. Yang et al., “Subblock based Motion Derivation and Inter-Prediction Refinement in Versatile Video Coding Standard”, IEEE Trans. Circuits Syst. Video Technol., in press
[13] W.-J. Chien et al., “Motion Vector Coding and Block Merging in Versatile Video Coding Standard”, IEEE Trans. Circuits Syst. Video Technol., in press
10,10a,10b:圖像區塊 10c,10d:預定經框間預測區塊 12:預定圖像 100:跨分量線性模型工具 102:色度分量 104:明度分量 106:線性模型 108:參數求導 110:明度及色度極值 112:已經解碼鄰域 120:任何類型的預測 122:解碼 124:經重建明度分量 126:樣本 128:操作 200:明度色調映射及色度殘餘縮放預測工具 202:明度分量預測 204:明度分量殘餘解碼 206:框間預測 208:寫碼明度色調標度 210:呈現明度色調標度 212:明度色調映射 214:寫碼明度色調標度版本 216:色度殘餘縮放因數 220:平均值 222:鄰域 224:色度殘餘信號 226:縮放 228:校正 230:框內色度預測信號 240:反明度色調映射 300:光流工具 302:運動向量 304:參考圖像 306:面積 350:寫碼工具 352,354:箭頭 353:語法元素 356:應用決策 358:啟動決策 400:解碼器側運動向量改進工具 402:經傳信運動向量 404:參考圖像 406:替換 500:時間運動向量預測工具 502:經先前解碼圖像 504:運動向量預測子 506,A84:區塊 508,510:運動向量 512:運動向量候選者清單 A10:設備或編碼器 A12,A12':圖像 A14:資料串流 A20:解碼器 A22:預測殘餘信號形成器 A24:預測殘餘 A24',A24''':譜域預測殘餘信號 A24'',A24'''':預測殘餘信號 A26:預測信號 A28:變換器 A32:量化器 A34:熵寫碼器 A36:預測級 A38,A52:解量化器 A40,A54:反變換器 A42,A56:組合器 A46:經重建信號 A50:熵解碼器 A58,A44:預測模組 A80:經框內寫碼區塊 A82:經框間寫碼區塊 A84:區塊 C 1,C 2:色度分量
本申請案之有利態樣為附屬請求項之主題。下文中關於圖式描述本申請案之較佳實施例。 圖1說明根據一實施例之視訊編碼器, 圖2說明根據一實施例之視訊解碼器, 圖3說明根據一實施例之基於區塊之殘餘寫碼方案, 圖4說明根據一實施例之包含二個區段之視訊資料串流, 圖5說明根據一實施例之光流工具之操作方案, 圖6說明根據一實施例之用於寫碼工具之應用程式方案, 圖7說明根據一實施例之時間運動向量預測工具之操作方案, 圖8說明根據一實施例之解碼器側運動向量改進工具之操作方案, 圖9說明根據一實施例之跨分量線性模型工具之操作方案, 圖10說明根據一實施例之明度映射及色度縮放工具之操作方案, 圖11說明根據一實施例之明度映射及色度縮放工具之另一操作方案, 圖12說明開放GOP情境中之預測誤差之實例。
A12':圖像
A14:資料串流
A20:解碼器
A24":預測殘餘信號
A50:熵解碼器
A52:解量化器
A54:反變換器
A56:組合器
A58:預測模組

Claims (15)

  1. 一種用於自一資料串流解碼一視訊之視訊解碼器,其經組配以 自該資料串流解碼一指示,該指示對於該視訊之一圖像序列為有效的且指示該圖像序列內之RASL圖像以不包括一或多個寫碼工具之一預定集合的一方式經寫碼。
  2. 如請求項1之視訊解碼器,其中一或多個寫碼工具之該預定集合包含 一基於跨分量線性模型之預測工具(100),及/或 一解碼器側運動向量改進工具(400)。
  3. 如前述請求項中任一項之視訊解碼器,其中該指示包括於一補充增強資訊訊息中。
  4. 如前述請求項中任一項之視訊解碼器,其中該指示包含一個位元,其共同地指示相對於該圖像序列內之該等RASL圖像之寫碼,不包括一或多個寫碼工具之該預定集合中之所有寫碼工具。
  5. 如前述請求項中任一項之視訊解碼器,其中該解碼器經組配以支援參考圖像重新取樣,其中,根據該參考圖像重新取樣,一經框間預測區塊之一參考圖像係經受樣本重新取樣,以便橋接該參考圖像與其中含有該經框間預測區塊之一圖像之間的一縮放窗大小偏差或樣本解析度偏差,以為該經框間預測區塊提供一框間預測信號。
  6. 如前述請求項中任一項之視訊解碼器,其中 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,及/或 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,該等RASL圖像具有參考圖像,該等參考圖像按解碼次序在與其相關聯的一CRA圖像之前,及/或 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,該等RASL圖像用作用於以下圖像之一時間運動向量預測參考圖像,及/或 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,該等RASL圖像不屬於一最高時間層。
  7. 如前述請求項D1.#中任一項之視訊解碼器,其中該指示指示該圖像序列內之該等RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式以一如下方式經寫碼,使得 對於在一或多個寫碼工具之該預定集合中的一或多個寫碼工具之一第一子集,一第一特性應用於之所有RASL圖像以不包括一或多個寫碼工具之該預定集合中的一或多個寫碼工具之該第一子集的該方式經寫碼,且 對於在一或多個寫碼工具之該預定集合中的一或多個寫碼工具之一第二子集,一第二特性應用於之所有RASL圖像,或所有RASL圖像,以不包括一或多個寫碼工具之該預定集合中的一或多個寫碼工具之該第二子集的該方式經寫碼,該第一子集及該第二子集相互不相交。
  8. 一種用於將一視訊編碼成一資料串流之視訊編碼器,其經組配以 將一指示編碼成該資料串流,該指示對於該視訊之一圖像序列為有效的且指示該圖像序列內之RASL圖像以不包括一或多個寫碼工具之一預定集合之一方式經寫碼。
  9. 如請求項8之視訊編碼器,其中一或多個寫碼工具之該預定集合包含 一基於跨分量線性模型之預測工具(100),及 一解碼器側運動向量改進工具(400)。
  10. 如請求項8至9中任一項之視訊編碼器,其中該指示包括於一補充增強資訊訊息中。
  11. 如請求項8至10中任一項之視訊編碼器,其中該指示包含一個位元,其共同地指示相對於該圖像序列內之該等RASL圖像之寫碼,不包括一或多個寫碼工具之該預定集合中之所有寫碼工具。
  12. 如請求項8至11中任一項之視訊編碼器,其中該編碼器經組配以支援參考圖像重新取樣,其中,根據該參考圖像重新取樣,一經框間預測區塊之一參考圖像係經受樣本重新取樣,以便橋接該參考圖像與其中含有該經框間預測區塊之一圖像之間的一縮放窗大小偏差或樣本解析度偏差,以為該經框間預測區塊提供一框間預測信號。
  13. 如請求項8至12中任一項之視訊編碼器,其中 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,及/或 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,該等RASL圖像具有參考圖像,該等參考圖像按解碼次序在與其相關聯的一CRA圖像之前,及/或 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,該等RASL圖像用作用於以下圖像之一時間運動向量預測參考圖像,及/或 該指示指示該圖像序列內之所有RASL圖像以不包括一或多個寫碼工具之該預定集合之該方式經寫碼,該等RASL圖像不屬於一最高時間層。
  14. 一種具有一視訊經編碼成其之資料串流,其包含 一指示,其對於該視訊之一圖像序列為有效的且指示該圖像序列內之RASL圖像以不包括一或多個寫碼工具之一預定集合之一方式經寫碼。
  15. 如請求項14之資料串流,其由一如請求項8至13中任一項之編碼器來產生。
TW111107381A 2021-02-26 2022-03-01 允許漂移限制之視訊寫碼概念技術 TWI821923B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP21159767.9 2021-02-26
EP21159767 2021-02-26

Publications (2)

Publication Number Publication Date
TW202234891A true TW202234891A (zh) 2022-09-01
TWI821923B TWI821923B (zh) 2023-11-11

Family

ID=74867389

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111107381A TWI821923B (zh) 2021-02-26 2022-03-01 允許漂移限制之視訊寫碼概念技術

Country Status (10)

Country Link
US (1) US20240155114A1 (zh)
EP (1) EP4298796A1 (zh)
JP (1) JP2024509680A (zh)
KR (1) KR20230130088A (zh)
CN (1) CN117083862A (zh)
AR (1) AR126316A1 (zh)
AU (1) AU2022225089A1 (zh)
MX (1) MX2023008464A (zh)
TW (1) TWI821923B (zh)
WO (1) WO2022180261A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9402076B2 (en) * 2013-01-07 2016-07-26 Qualcomm Incorporated Video buffering operations for random access in video coding
US11272201B2 (en) * 2019-01-03 2022-03-08 Qualcomm Incorporated Block size restriction for illumination compensation
ES2946163T3 (es) * 2019-05-15 2023-07-13 Huawei Tech Co Ltd Manejo de la herramienta de codificación del refinamiento del vector de movimiento del lado del decodificador (DMVR) para el remuestreo de imágenes de referencia en la codificación de vídeo
CN113826382B (zh) * 2019-05-16 2023-06-20 北京字节跳动网络技术有限公司 视频编解码中的自适应比特深度转换

Also Published As

Publication number Publication date
AU2022225089A1 (en) 2023-07-27
US20240155114A1 (en) 2024-05-09
CN117083862A (zh) 2023-11-17
JP2024509680A (ja) 2024-03-05
WO2022180261A1 (en) 2022-09-01
TWI821923B (zh) 2023-11-11
KR20230130088A (ko) 2023-09-11
AR126316A1 (es) 2023-10-04
MX2023008464A (es) 2023-07-27
EP4298796A1 (en) 2024-01-03

Similar Documents

Publication Publication Date Title
JP6580576B2 (ja) ビデオ情報のスケーラブルコーディングのためのデバイスおよび方法
JP6640102B2 (ja) ビデオコーディングの参照として現在のピクチャを使用すること
TWI504237B (zh) 視訊寫碼中之緩衝預測資料
JP6517213B2 (ja) ビデオ情報のスケーラブルコーディングのためのデバイスおよび方法
CN110719488B (zh) 视频解码的方法和装置、计算机设备及存储介质
KR102127549B1 (ko) 멀티-계층 비디오 코딩에서의 상이한 코덱의 기본 계층의 지원
CN110719469A (zh) 视频编解码方法、设备和存储介质
CN110708541B (zh) 视频解码方法、视频解码器、设备和存储介质
JP2016539545A (ja) ビデオ情報のスケーラブルコーディングのためのデバイスおよび方法
JP6434044B2 (ja) ビデオ情報のスケーラブルコード化のための機器及び方法
JP2017507539A (ja) マルチレイヤコーディングにおいて回復点補足エンハンスメント情報(sei)メッセージと領域リフレッシュ情報seiメッセージとをコーディングするための方法
JP6312838B2 (ja) マルチレイヤコード化においてレイヤ間参照ピクチャセット(RPS)をコード化し、ビットストリーム終端(EoB)ネットワークアクセスレイヤ(NAL)単位をコード化するための方法
CN112655205A (zh) 仿射模型运动矢量的约束
JP2017518704A (ja) マルチレイヤコーデックのためのフルピクチャ順序カウントリセット
CN113841412A (zh) 基于cu的插值滤波器选择的信令
JP2017507546A (ja) マルチレイヤコード化において参照ピクチャセット(rps)をコード化するための方法
TWI821923B (zh) 允許漂移限制之視訊寫碼概念技術
TW202312732A (zh) 用以處理串流情景中移動向量之視訊寫碼概念技術
CN113661702A (zh) 视频编解码的方法和装置