TW202031052A - 用於照明補償模式之刪剪 - Google Patents

用於照明補償模式之刪剪 Download PDF

Info

Publication number
TW202031052A
TW202031052A TW108146274A TW108146274A TW202031052A TW 202031052 A TW202031052 A TW 202031052A TW 108146274 A TW108146274 A TW 108146274A TW 108146274 A TW108146274 A TW 108146274A TW 202031052 A TW202031052 A TW 202031052A
Authority
TW
Taiwan
Prior art keywords
value
block
stored
flag
motion information
Prior art date
Application number
TW108146274A
Other languages
English (en)
Inventor
法迪姆 塞瑞金
錢威俊
馬塔 卡茲維克茲
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW202031052A publication Critical patent/TW202031052A/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

用於處理視訊資料之系統及技術包括用於運動向量候選清單建構之一刪剪程序。被添加至一運動資訊候選清單的一潛在運動資訊候選者之一照明補償旗標可包括與視訊資料之一區塊相關聯之運動資訊,其中該運動資訊可包括一運動向量及一照明補償旗標。可將該運動資訊與該運動資訊候選清單中之所儲存運動資訊進行比較,其中該所儲存運動資訊可包括至少一個所儲存運動向量及相關聯所儲存照明補償旗標。當該運動向量匹配該所儲存運動向量時,該刪剪程序可包括:不將該運動向量添加至該運動資訊候選清單;及基於該照明補償旗標之一值及該所儲存照明補償旗標之一值更新該所儲存照明補償旗標。

Description

用於照明補償模式之刪剪
本申請案係關於視訊寫碼及壓縮。更特定言之,本申請案係關於執行經改良局部照明補償之系統與方法。
許多裝置及系統允許處理並輸出視訊資料以供消耗。數位視訊資料包括大量資料以滿足消費者及視訊提供商提供者之需求。舉例而言,視訊資料之消費者需要具有最優品質(具有高保真度、解析度、圖框速率及其類似者)之視訊。結果,滿足此等需求所需之大量視訊資料對處理及儲存視訊資料之通信網路及裝置造成負擔。
各種視訊寫碼技術可用以壓縮視訊資料。視訊寫碼係根據一或多個視訊寫碼標準執行。舉例而言,視訊寫碼標準包括高效率視訊寫碼(HEVC)、進階視訊寫碼(AVC)、MPEG-2第2部分寫碼(MPEG代表動畫專業團體)、VP9、開放媒體聯盟(AOMedia)視訊1 (AV1)、基本視訊寫碼(EVC)或其類似者。視訊寫碼通常使用利用存在於視訊影像或序列中之冗餘的預測方法(例如,框間預測、框內預測或其類似者)。視訊寫碼技術之重要目標為將視訊資料壓縮成使用較低位元速率之形式,同時避免視訊品質之降級或使視訊品質之降級最小化。隨著不斷演進的視訊服務變得可用,需要具有較佳寫碼效率之編碼技術。
照明補償可用以有效地補償一或多個圖像之間的照明變化。一運動資訊候選清單可儲存運動資訊,其包括用於一圖像之一或多個區塊之運動預測的運動向量及照明補償資訊。在一些實例中,建構該運動資訊候選清單可包括一刪剪程序,其用於避免冗餘資訊被儲存於該運動資訊候選清單中。在一些實施中,本文中描述用於經改良刪剪程序的技術及系統,該等程序可用於建構該運動資訊候選清單。
在一些實施中,儲存於該運動資訊候選清單中之該照明補償資訊可包括一照明補償旗標。可基於該所儲存照明補償旗標之該值針對一圖像之一區塊應用照明補償。在一些實例中,本文中所描述之該等刪剪程序可考慮待添加至該運動資訊候選清單的一潛在運動資訊候選者之一照明補償旗標。該潛在運動資訊候選者可包括與該區塊相關聯之運動資訊。該潛在運動資訊候選者之該運動資訊包括至少一運動向量及一照明補償旗標。在一些實例中,可將該運動資訊與該運動資訊候選清單中之所儲存運動資訊進行比較。該所儲存運動資訊包括至少一所儲存運動向量及一相關聯所儲存照明補償旗標。當該運動向量匹配該所儲存運動向量時,可能不會將該運動向量添加至該運動資訊候選清單,且可基於該照明補償旗標之一值與該所儲存照明補償旗標之一值更新該所儲存照明補償旗標。舉例而言,若該照明補償旗標之該值為該第一值且該所儲存照明補償旗標之該值為一第二值,則該所儲存照明旗標可更新為一第一值。否則,該所儲存照明旗標可能不會更新。在一些實例中,以此方式判定是否更新該所儲存照明補償旗標可引起寫碼效率,同時避免該刪剪程序中之複雜比較技術。
根據至少一個實例,提供一種解碼視訊資料之方法。該方法包括獲得包括視訊資料之一經編碼視訊位元串流。該方法進一步包括判定與該視訊資料之一區塊相關聯之運動資訊,該運動資訊包含至少一運動向量及一照明補償旗標。該方法進一步包括將該運動資訊與一運動資訊候選清單中之所儲存運動資訊進行比較,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標。該方法進一步包括判定該運動向量匹配該所儲存運動向量。該方法進一步包括基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標。
在另一實例中,提供一種用於解碼視訊資料之設備。該裝置包括一記憶體及實施於電路系統中之一處理器。該處理器經組態以且可獲得包括視訊資料之一經編碼視訊位元串流。該處理器經進一步組態以且可判定與該視訊資料之一區塊相關聯之運動資訊,該運動資訊包含至少一運動向量及一照明補償旗標。該處理器經進一步組態以且可將該運動資訊與一運動資訊候選清單中之所儲存運動資訊進行比較,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標。該處理器經進一步組態以且可判定該運動向量匹配該所儲存運動向量。該處理器經進一步組態以且可基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標。
在另一實例中,提供一種上面儲存有指令之非暫時性電腦可讀媒體,該等指令在由一或多個處理器執行時使得該一或多個處理器:獲得包括視訊資料之一經編碼視訊位元串流;判定與該視訊資料之一區塊相關聯之運動資訊,該運動資訊包含至少一運動向量及一照明補償旗標;將該運動資訊與一運動資訊候選清單中之所儲存運動資訊進行比較,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標;判定該運動向量匹配該所儲存運動向量;及基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標。
在另一實例中,提供一種用於解碼視訊資料之設備。該設備包括用於獲得包括視訊資料之一經編碼視訊位元串流的構件。該設備進一步包括用於判定與該視訊資料之一區塊相關聯之運動資訊的構件,該運動資訊包含至少一運動向量及一照明補償旗標。該設備進一步包括用於將該運動資訊與一運動資訊候選清單中之所儲存運動資訊進行比較的構件,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標。該設備進一步包括用於判定該運動向量匹配該所儲存運動向量的構件。該設備進一步包括用於基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標的構件。
根據至少一個實例,提供一種編碼視訊資料之方法。該方法包括獲得視訊資料之一圖像之一當前區塊。該方法進一步包括判定與該視訊資料之一區塊相關聯之運動資訊,該運動資訊包含至少一運動向量及一照明補償旗標。該方法進一步包括將該運動資訊與一運動資訊候選清單中之所儲存運動資訊進行比較,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標。該方法進一步包括判定該運動向量匹配該所儲存運動向量。該方法進一步包括基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標。該方法進一步包括產生包括至少該所儲存運動資訊之一經編碼視訊位元串流。
在另一實例中,提供一種用於編碼視訊資料之設備。該裝置包括一記憶體及實施於電路系統中之一處理器。該處理器經組態以且可獲得視訊資料之一圖像之一當前區塊。該處理器經進一步組態以且可判定與該視訊資料之該區塊相關聯之運動資訊,該運動資訊包含至少一運動向量及一照明補償旗標。該處理器經進一步組態以且可將該運動資訊與一運動資訊候選清單中之一所儲存運動資訊進行比較,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標。該處理器經進一步組態以且可判定該運動向量匹配該所儲存運動向量。該處理器經進一步組態以且可基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標。該處理器經進一步組態以且可產生包括至少該所儲存運動資訊之一經編碼視訊位元串流。
在另一實例中,提供一種上面儲存有指令之非暫時性電腦可讀媒體,該等指令在由一或多個處理器執行時使得該一或多個處理器:獲得包括視訊資料之一經編碼視訊位元串流;判定與該視訊資料之一區塊相關聯之運動資訊,該運動資訊包含至少一運動向量及一照明補償旗標;將該運動資訊與一運動資訊候選清單中之所儲存運動資訊進行比較,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標;判定該運動向量匹配該所儲存運動向量;及基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標。
在另一實例中,提供一種用於編碼視訊資料之設備。該設備包括用於獲得視訊資料之一圖像之一當前區塊的構件。該設備進一步包括用於判定與該視訊資料之一區塊相關聯之運動資訊的構件,該運動資訊包含至少一運動向量及一照明補償旗標。該設備進一步包括用於將該運動資訊與一運動資訊候選清單中之所儲存運動資訊進行比較的構件,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標。該設備進一步包括用於判定該運動向量匹配該所儲存運動向量的構件。該設備進一步包括用於基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標的構件。該設備進一步包括用於產生包括至少該所儲存運動資訊之一經編碼視訊位元串流的構件。
上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣進一步包括:若該照明補償旗標之該值為一第一值且該所儲存照明補償旗標之該值為一第二值,則將該所儲存照明旗標更新為該第一值。
在上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣中,該第一值為一真值且該第二值為一假值。
在上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣中,該第一值為一假值且該第二值為一真值。
在上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣中,若該照明補償旗標之該值為一第一值且該所儲存照明補償旗標之該值為該第一值,則該所儲存照明旗標不被更新。
在上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣中,該第一值為一真值。
在上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣中,該第一值為一假值。
上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣進一步包括:基於該所儲存照明補償旗標之該值判定是否將照明補償應用於該區塊,其中若該所儲存照明補償旗標之該值為一真值,則應用照明補償,且若該所儲存照明補償旗標之該值為一假值,則不應用照明補償。
在上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣中,將照明補償應用於該區塊包含:使用區塊之一或多個相鄰區塊及用於該區塊之框間預測的一參考區塊之一或多個相鄰區塊導出用於該區塊的一或多個照明補償參數。
在上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣中,該區塊之該一或多個相鄰區塊包括該區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者,且其中該參考區塊之該一或多個相鄰區塊包括該參考區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者。
上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣進一步包括:基於該所儲存照明補償旗標之該值為一真值而將照明補償應用於該區塊;及基於應用於該區塊之該照明補償而重建構該區塊之一樣本。
在上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣中,重建構該區塊之該樣本進一步包含應用一殘餘值。
在上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣中,若該照明補償旗標之該值為一第一值且該所儲存照明補償旗標之該值為一第二值,則將該所儲存照明旗標更新為該第一值。
上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣進一步包括:判定用於該所儲存照明補償旗標之一預測值;將該預測值與該照明補償旗標之該值進行比較;基於該比較產生一比較旗標,其中該比較旗標在預測值匹配該照明補償旗標之該值的情況下被設定為一第一值,或在預測值不匹配該照明補償旗標之該值的情況下被設定為一第二值;及基於該比較旗標產生該經編碼視訊位元串流。
在上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣中,基於該比較旗標產生該經編碼視訊位元串流包含將一壓縮演算法應用於該比較旗標。
在上文所描述的用於解碼視訊資料之方法、設備及電腦可讀媒體的一些態樣中,用於該所儲存照明補償旗標之該預測值係基於與該區塊之對應一或多個相鄰區塊相關聯之一或多個照明補償旗標。
上文所描述之方法、設備及電腦可讀媒體的一些態樣進一步包含具有用於捕捉一或多個圖像之一攝影機的一行動裝置。
上文所描述之方法、設備及電腦可讀媒體的一些態樣進一步包含用於顯示一或多個圖像之一顯示器。
此發明內容並不意欲識別所主張標的物之關鍵或基本特徵,亦不意欲單獨使用以確定所主張標的物之範疇。應參考此專利之整個說明書之適當部分、任何或所有圖式及每一申請專利範圍來理解標的物。
在參考以下說明書、申請專利範圍及隨附圖式時,前述內容連同其他特徵及實施例將變得更顯而易見。
相關申請案之交叉參考
本申請案主張2018年12月27日申請的美國臨時申請案第62/785,434號之權益,該申請案以其全部內容且出於所有目的特此以引用之方式併入。
下文提供本發明之某些態樣及實施例。此等態樣及實施例之一些可獨立地應用,且其中之一些可組合地應用,如熟習此項技術者將顯而易見。在以下描述中,出於解釋之目的,闡述眾多特定細節以便提供對本申請案之實施例之透徹理解。然而,將顯而易見的是,可在無此等特定細節之情況下實踐各種實施例。諸圖及描述不意欲為限制性的。
隨後描述僅提供例示性實施例且並不意欲限制本發明的範疇、可應用性或組態。實際上,例示性實施例之隨後描述將為熟習此項技術者提供能夠實施例示性實施例之描述。應理解,可在不背離如所附申請專利範圍中所闡述之本申請案之精神及範疇的情況下對元件之功能及配置做出各種變化。
視訊寫碼裝置實施視訊壓縮技術以高效地編碼及解碼視訊資料。視訊壓縮技術可包括應用不同預測模式(包括空間預測(例如,圖框內預測或框內預測)、時間預測(例如,圖框間預測或框間預測)、層間預測(橫越視訊資料之不同層)及/或其他預測技術)以縮減或移除為視訊序列所固有的冗餘。視訊編碼裝置將原始視訊序列之每一圖像分割成被稱作視訊區塊或寫碼單元(下文更詳細地描述)之矩形區。可使用特定預測模式來編碼此等視訊區塊。
視訊區塊可以一或多種方式分成較小區塊之一或多個群組。區塊可包括寫碼樹型區塊、預測區塊、變換區塊或其他合適區塊。除非另有指定,否則大體上對「區塊」之參考可指此類視訊區塊(例如,寫碼樹型區塊、寫碼區塊、預測區塊、變換區塊或其他適當區塊或子區塊,如將由一般熟習此項技術者所理解。另外,此等區塊中之每一者在本文中亦可互換地稱為「單元」(例如,寫碼樹型單元(CTU)、寫碼單元、預測單元(PU)、變換單元(TU)或其類似者)。在一些情況下,單元可指示經編碼於位元串流中的寫碼邏輯單元,而區塊可指示一程序目標所指向的視訊圖框緩衝器之一部分。
對於框間預測模式,視訊編碼器可搜尋類似於經編碼於定位於另一時間位置中的圖框(或圖像) (被稱作參考圖框或參考圖像)中之區塊的區塊。視訊編碼器可將搜尋限定於自待編碼之區塊之的某一空間位移。可使用包括水平移位分量及垂直移位分量之二維(2D)運動向量來定位最佳匹配。對於框內預測模式,視訊編碼器可基於來自同一圖像內之先前經編碼相鄰區塊的資料使用空間預測技術而形成預測區塊。
視訊編碼器可判定預測誤差。舉例而言,可將預測判定為經編碼區塊與預測區塊中之像素值之間的差。預測誤差亦可被稱作殘餘。視訊編碼器亦可將變換應用於預測誤差(例如,離散餘弦變換(DCT)或其他適合之變換)以產生變換係數。在變換之後,視訊編碼器可量化變換係數。可使用語法元素來表示經量化變換係數及運動向量,且其連同控制資訊一起形成視訊序列之經寫碼表示。在一些情況下,視訊編碼器可熵寫碼語法元素,藉此進一步減少其表示所需之位數目。
視訊解碼器可使用上文所論述之語法元素及控制資訊建構用於解碼當前圖框之預測性資料(例如,預測性區塊)。舉例而言,視訊解碼器可將預測區塊與經壓縮預測誤差相加。視訊解碼器可藉由使用經量化係數而加權變換基底函數來判定經壓縮預測誤差。經重建構圖框與原始圖框之間的差被稱作重建構誤差。
在一些實例中,處理視訊資料之一或多個系統與方法涉及在基於區塊之視訊寫碼中導出或估計照明補償(IC)參數。在一些情況下,視訊編碼器及/或視訊解碼器可執行局部照明補償(LIC)(或照明補償),以有效地寫碼一或多個圖像之間的照明之變化(例如,亮度)。視訊編碼器及/或視訊解碼器可判定用於正編碼或解碼之寫碼區塊或寫碼單元的一或多個IC參數(例如,偏移、一或多個按比例調整因數、移位數目或其他合適IC參數)。IC參數可基於多個參考區塊之樣本、當前區塊之一或多個相鄰區塊之樣本及/或其他資訊而判定。視訊解碼器可利用IC參數及/或其他資料來建構用於解碼當前區塊之預測性資料。
圖1為說明包括編碼裝置104及解碼裝置112之系統100之實例的方塊圖。編碼裝置104可為源裝置之部分,且解碼裝置112可為接收裝置之部分。源裝置及/或接收裝置可包括電子裝置,諸如行動或靜止電話手機(例如,智能型手機、蜂巢式電話或其類似者)、桌上型電腦、膝上型或筆記型電腦、平板電腦、機上盒、電視、相機、顯示裝置、數位媒體播放器、視訊遊戲控制台、視訊串流裝置、網際網路協定(IP)攝影機或任何其他合適的電子裝置。在一些實例中,源裝置及接收裝置可包括用於無線通信之一或多個無線收發器。本文中所描述之寫碼技術適用於各種多媒體應用中之視訊寫碼,包括串流視訊傳輸(例如,經由網際網路)、電視廣播或傳輸、編碼數位視訊以供儲存於資料儲存媒體上、解碼儲存於資料儲存媒體上之數位視訊或其他應用。在一些實例中,系統100可支持單向或雙向視訊傳輸以支援諸如視訊會議、視訊串流、視訊播放、視訊廣播、遊戲及/或視訊電話之應用。
編碼裝置104 (或編碼器)可用以使用視訊寫碼標準或協定編碼視訊資料以產生經編碼視訊位元串流。視訊寫碼標準之實例包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual、ITU-T H.264(亦稱為ISO/IEC MPEG-4 AVC),包括其可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展,及高效視訊寫碼(HEVC)或ITU-T H.265。存在涉及多層視訊寫碼的HEVC之各種擴展,包括範圍及螢幕內容寫碼擴展、3D視訊寫碼(3D-HEVC)及多視圖擴展(MV-HEVC)及可調式擴展(SHVC)。HEVC及其擴展已藉由ITU-T視訊寫碼專家組(VCEG)及ISO/IEC動畫專家組(MPEG)之視訊寫碼聯合協作小組(JCT-VC)以及3D視訊寫碼擴展開發聯合協作小組(JCT-3V)開發。
MPEG及ITU-T VCEG亦已形成聯合探索視訊小組(JVET)以探索用於下一代視訊寫碼標準(稱為多功能視訊寫碼(VVC))之新的視訊寫碼工具。參考軟體稱為VVC測試模型(VTM)。VVC之目標係提供對於現有HEVC標準的壓縮效能之顯著改良,輔助較高品質視訊服務及新興應用(例如,360°全向沉浸式多媒體、高動態範圍(HDR)視訊,以及其他)的部署。VP9、開放媒體聯盟(AOMedia)視訊1 (AV1)及基本視訊寫碼(EVC)為可應用本文中描述之技術的其他視訊寫碼標準。
可使用視訊編解碼器(諸如VTM、VVC、HEVC、AVC及/或其擴展)執行本文中所描述的許多實施例。然而,本文中所描述的技術及系統亦可適用於其他寫碼標準,諸如MPEG、JPEG (或用於靜止影像之其他寫碼標準)、VP9、AV1、其擴展,或已經可用或尚未可用或開發的其他合適寫碼標準。因此,雖然可參考特定視訊寫碼標準描述本文中所描述之技術及系統,但一般熟習此項技術者將瞭解,描述不應解譯為僅適用於彼特定標準。
參看圖1,視訊源102可將視訊資料提供至編碼裝置104。視訊源102可為源裝置之部分,或可為除源裝置以外的裝置之部分。視訊源102可包括視訊捕捉裝置(例如,視訊攝影機、攝影機電話、視訊電話或其類似者)、含有經儲存視訊之視訊存檔、提供視訊資料之視訊服務器或內容提供者、自視訊服務器或內容提供者接收視訊之視訊饋入接口、用於產生電腦圖形視訊資料之電腦圖形系統、此等源之組合或任何其他合適的視訊源。
來自視訊源102之視訊資料可包括一或多個輸入圖像或圖框。圖像或圖框為在一些情況下為視訊之部分的靜態影像。在一些實例中,來自視訊源102之資料可為並非為視訊之一部分的靜態影像。在HEVC、VVC及其他視訊寫碼規範中,視訊序列可包括一系列圖像。圖像可包括三個樣本陣列,指示為SL 、SCb 及SCr 。SL 為明度樣本之二維陣列,SCb 為Cb色度樣本之二維陣列且SCr 為Cr色度樣本之二維陣列。色訊樣本亦可在本文中被稱作「色度(chroma)」樣本。在其他情況下,圖像可為單色的且可僅包括明度樣本陣列。
編碼裝置104之編碼器引擎106(或編碼器)編碼視訊資料以產生經編碼視訊位元串流。在一些實例中,經編碼視訊位元串流(或「視訊位元串流」或「位元串流」)為一系列之一或多個經寫碼視訊序列。經寫碼視訊序列(CVS)包括一系列存取單元(AU),其始於在基礎層中具有隨機存取點圖像且具有某些屬性之AU,直至且不包括在基礎層中具有隨機存取點圖像且具有某些屬性之下一AU。舉例而言,開始CVS的隨機存取點圖像之某些性質可包括等於1之一RASL旗標(例如,NoRaslOutputFlag)。否則,隨機存取點圖像(具有等於0之RASL旗標)不開始CVS。存取單元(AU)包括一或多個經寫碼圖像及對應於共享相同輸出時間之經寫碼圖像的控制資訊。圖像之經寫碼圖塊在位元串流層級經囊封至被稱作網路抽象層(NAL)單元之資料單元中。舉例而言,HEVC視訊位元串流可包括一或多個CVS,該一或多個CVS包括NAL單元。NAL單元中之每一者具有NAL單元標頭。在一個實例中,標頭對於H.264/AVC (除了多層擴展以外)為一個位組且對於HEVC為兩個位組。NAL單元標頭中之語法元素採取經指定位,且因此對所有種類之系統及輸送層可見,諸如輸送串流、即時輸送(RTP)協定、檔案格式以及其他。
兩種類別之NAL單元存在於HEVC標準中,包括視訊寫碼層(VCL) NAL單元及非VCL NAL單元。VCL NAL單元包括經寫碼圖像資料之一個圖塊或圖塊片段(如下描述),且非VCL NAL單元包括關於一或多個經寫碼圖像之控制資訊。在一些狀況下,NAL單元可被稱作封包。HEVC AU包括含有經寫碼圖像資料之VCL NAL單元及對應於經寫碼圖像資料之非VCL NAL單元(若存在)。
NAL單元可含有形成視訊資料之經寫碼表示(諸如,視訊中之圖像的經寫碼表示)的位序列(例如,經編碼視訊位元串流、位元串流之CVS或其類似者)。編碼器引擎106藉由將每一圖像分割成多個圖塊而產生圖像之經寫碼表示。一圖塊獨立於其他圖塊,以使得在不依賴於來自同一圖像內之其他圖塊之資料的情況下寫碼該圖塊中之資訊。一圖塊包括一或多個圖塊片段,該一或多個圖塊片段包括獨立圖塊片段及(若存在)取決於先前圖塊片段之一或多個相關圖塊片段。
在HEVC中,圖塊接著分割成明度樣本及色度樣本之寫碼樹型區塊(CTB)。明度樣本之CTB及色度樣本之一或多個CTB連同樣本之語法被稱為寫碼樹型單元(CTU)。CTU亦可被稱作「樹型區塊」或「最大寫碼單元」(LCU)。CTU為用於HEVC編碼之基本處理單元。CTU可經分裂成具有不同大小之多個寫碼單元(CU)。CU含有被稱為寫碼區塊(CB)之明度及色度樣本陣列。
明度及色度CB可進一步被分裂成預測區塊(PB)。PB為對於框間預測或塊內複本(IBC)預測(在可用或經啟用以供使用時)使用相同運動參數的明度分量或色度分量之樣本之區塊。明度PB及一或多個色度PB以及相關聯語法形成預測單元(PU)。對於框間預測,運動參數集合(例如,一或多個運動向量、參考索引或其類似者)針對每一PU在位元串流中發信,且用於明度PB及一或多個色度PB之框間預測。運動參數亦可被稱作運動資訊。CB亦可分割成一或多個變換區塊(TB)。TB表示色彩分量之樣本的一正方形區塊,殘餘變換(例如在一些情況下相同二維變換)經應用於該區塊以用於寫碼一預測殘餘信號。變換單元(TU)表示明度及色度樣本之TB及對應語法元素。以下更詳細地描述變換寫碼。
CU之大小對應於寫碼模式之大小,且可為正方形形狀。舉例而言,CU之大小可為8×8樣本、16×16樣本、32×32樣本、64×64樣本或達至相應CTU之大小的任何其他適當大小。片語「N×N」在本文中用以指代視訊區塊就垂直及水平尺寸而言的像素尺寸(例如,8像素×8像素)。可按列及行來排列區塊中之像素。在一些實施例中,區塊在水平方向上可不具有與在垂直方向上相同的數目個像素。與CU相關聯之語法資料可描述例如將CU分割成一或多個PU。分割模式可在CU經框內預測模式編碼抑或經框間預測模式編碼之間有所不同。PU可被分割成非正方形形狀。與CU相關聯之語法資料亦可描述(例如)根據CTU將CU分割成一或多個TU。TU可為正方形或非正方形形狀。
根據HEVC標準,可使用變換單元(TU)來執行變換。TU可針對不同CU而變化。可基於給定CU內之PU的大小而對TU設定大小。TU可與PU大小相同或小於PU。在一些實例中,可使用被稱為「殘餘四分樹」(RQT)之四分樹結構將對應於CU之殘餘樣本細分再分成較小單元。RQT之葉節點可對應於TU。可變換與TU相關聯之像素差值以產生變換係數。變換係數可隨後由編碼器引擎106量化。
一旦視訊資料之圖像被分割成CU,編碼器引擎106便使用預測模式來預測每一PU。隨後自原始視訊資料減去預測單元或預測區塊以得到殘餘(如下描述)。對於各CU,可使用語法資料在位元串流內部傳信預測模式。預測模式可包括框內預測(或圖像內預測)或框間預測(或圖像間預測)。框內預測利用圖像內之空間相鄰樣本之間的相關。舉例而言,在使用框內預測之情況下,使用(例如)DC預測以發現PU之平均值、使用平面預測以使平面表面擬合於PU、使用方向預測以自相鄰資料外插或使用任何其他合適類型之預測,自同一圖像中之相鄰影像資料預測每一PU。框間預測使用圖像之間的時間相關性以便導出影像樣本之區塊的運動補償預測。舉例而言,在使用框間預測之情況下,使用運動補償預測自一或多個參考圖像(按輸出次序在當前圖像之前或之後)中之影像資料預測每一PU。可(例如)以在CU層級決定是否使用圖像間預測抑或圖像內預測來寫碼圖像區域。
編碼器引擎106及解碼器引擎116 (如下更詳細地描述)可經組態以根據VVC操作。根據VVC,視訊寫碼器(諸如編碼器引擎106及/或解碼器引擎116)將圖像分割成複數個寫碼樹型單元(CTU)(其中明度樣本之CTB及色度樣本之一或多個CTB以及用於明度及色度樣本之語法被稱作CTU)。視訊寫碼器可根據樹型結構分割CTU,諸如四分樹二元樹型(QTBT)結構或多類型樹型(MTT)結構。QTBT結構移除多個分割類型之概念,諸如HEVC之CU、PU及TU之間的間距。QTBT結構包括兩個層級:根據四分樹分割分割的第一層級,及根據二元樹分割分割的第二層級。QTBT結構之根節點對應於CTU。二元樹之葉節點對應於寫碼單元(CU)。
在MTT分割結構中,區塊可使用四分樹分割、二元樹分割及一或多種類型之三重樹分割來分割。三重樹分割為區塊分裂成三個子區塊的分割。在一些實例中,三重樹分割在不經由中心分隔原始區塊情況下將區塊分成三個子區塊。MTT中之分割類型(例如四分樹、二元樹及三重樹)可為對稱或不對稱的。
在一些實例中,視訊寫碼器可使用單一QTBT或MTT結構以表示明度及色度分量中之每一者,而在其他實例中,視訊寫碼器可使用兩個或大於兩個QTBT或MTT結構,諸如用於明度分量之一個QTBT或MTT結構及用於兩個色度分量之另一QTBT或MTT結構(或用於各別色度分量之兩個QTBT及/或MTT結構)。
視訊寫碼器可經組態以使用根據HEVC之四分樹分割、QTBT分割、MTT分割,或其他分割結構。出於說明之目的,本文中之描述可指QTBT分割。然而,應理解,本發明之技術亦可應用於經組態以使用四分樹分割亦或其他類型之分割的視訊寫碼器。
在一些實例中,圖像之一或多個圖塊被指派圖塊類型。圖塊類型包括I圖塊、P圖塊及B圖塊。I圖塊(框內預測圖框,可獨立解碼)為僅藉由框內預測寫碼之圖像的圖塊,且因此可獨立解碼,此係因為I圖塊僅需要圖框內之資料來預測圖塊之任何預測單元或預測區塊。P圖塊(單向預測圖框)為可藉由框內預測及藉由單向框間預測寫碼之圖像的圖塊。藉由框內預測或框間預測寫碼P圖塊內之每一預測單元或預測區塊。當應用框間預測時,僅藉由一個參考圖像預測該預測單元或預測區塊,且因此參考樣本僅來自一個圖框之一個參考區。B圖塊(雙向預測性圖框)為圖像中可使用框內預測及框間預測(例如,雙向預測或單向預測)寫碼的圖塊。可用兩個參考圖像雙向預測B圖塊之預測單元或預測區塊,其中每一圖像貢獻一個參考區域,且兩個參考區域之樣本集合經加權(例如,使用相等權重或使用不同權重)以產生經雙向預測區塊之預測信號。如上文所解釋,一個圖像之圖塊被獨立寫碼。在一些狀況下,圖像可僅作為一個圖塊而被寫碼。
如上文所提及,圖像內預測使用圖像內之空間相鄰樣本之間的相關性。存在複數個框內預測模式(亦被稱作「框內模式」)。在一些實例中,明度區塊之框內預測包括35種模式,包括平坦模式、DC模式及33個角度模式(例如,對角框內預測模式及鄰近於對角框內預測模式之角度模式)。框內預測之35個模式如下表1中所展示經索引化。在其他實例中,可定義可能不會已表示為33個角度模式的更多個包括預測角之框內模式。在其他實例中,與角度模式相關聯之預測角可能不同於用於HEVC中之彼等預測角。
框內預測模式 相關聯名稱
0 INTRA_PLANAR
1 INTRA_DC
2..34 INTRA_ANGULAR2..INTRA_ANGULAR34
表1-框內預測模式及相關聯名稱之規範
圖像間預測使用圖像之間的時間相關性以便導出影像樣本之區塊的運動補償預測。使用平移運動模型,經先前解碼之圖像(參考圖像)中的區塊之方位係藉由運動向量(Δx,Δy)指示,其中Δx指定水平移位且Δy指定參考區塊相對於當前區塊之方位的垂直移位。在一些情況下,運動向量(
Figure 02_image001
)可處於整數樣本準確度(亦被稱作整數準確度),在此情況下,運動向量指向參考圖框之整數像素網格(或整數像素取樣網格)。在一些情況下,運動向量(Δx,Δy)可具有分數樣本準確度(亦被稱作分數像素準確度或非整數準確度)以更準確地捕捉基礎物件之移動而不限於參考圖框之整數像素網格。運動向量之準確度可由運動向量之量化層級表達。舉例而言,量化層級可為整數準確度(例如,1像素)或分數像素準確度(例如,¼像素、½像素或其他子像素值)。當對應運動向量具有分數樣本準確度時,對參考圖像應用內插以導出預測信號。舉例而言,可對在整數方位處可用之樣本進行濾波(例如,使用一或多個內插濾波器)以估計分數方位處之值。先前經解碼參考圖像由參考圖像清單的參考索引(refIdx)指示至參考圖像清單。運動向量及參考索引可被稱作運動參數。可執行兩種圖像間預測,包括單向預測及雙向預測。
在框間預測使用雙向預測情況下,兩組運動參數(Δx 0 ,y 0 ,refIdx 0 及Δx 1 ,y 1 ,refIdx 1 )用於產生兩個經運動補償之預測(自相同參考圖像或可能自不同參考圖像)。舉例而言,藉由雙向預測,每一預測區塊使用兩個運動補償預測信號,且產生B預測單元。隨後組合兩個運動補償預測以得到最終運動補償預測。舉例而言,可藉由取平均值來組合兩個運動補償預測。在另一實例中,可使用加權預測,在此情況下,不同權重可應用於每一運動補償預測。可用於雙向預測中之參考圖像儲存於兩個分開的清單(表示為清單0及清單1)中。可使用運動估計程序在編碼器處導出運動參數。
在框間預測使用單向預測情況下,一組運動參數(Δx 0 ,y 0 ,refIdx 0 )用以自參考圖像產生經運動補償之預測。舉例而言,藉由單向預測,每一預測區塊使用至多一個經運動補償之預測信號,且產生P預測單元。
PU可包括與預測過程相關之資料(例如,運動參數或其他合適資料)。舉例而言,當使用框內預測編碼PU時,PU可包括描述用於PU之框內預測模式的資料。作為另一實例,當使用框間預測來編碼PU時,PU可包括定義用於PU之運動向量的資料。定義用於PU之運動向量的資料可描述(例如)運動向量之水平分量(∆x )、運動向量之垂直分量(∆y )、用於運動向量之分辨率(例如,整數精度、四分之一像素精度或八分之一像素精度)、運動向量指向之參考圖像、參考索引、用於運動向量之參考圖像清單(例如,清單0、清單1或清單C),或其任何組合。
在使用框內預測及/或框間預測執行預測之後,編碼裝置104可執行變換及量化。舉例而言,在預測之後,編碼器引擎106可計算對應於PU之殘餘值。殘餘值可包含正經寫碼像素之當前區塊(PU)與用以預測當前區塊之預測區塊(例如,當前區塊之經預測版本)之間的像素差。舉例而言,在產生預測區塊(例如,發出框間預測或框內預測)之後,編碼器引擎106可藉由自當前區塊減去由預測單元產生之預測區塊來產生殘餘區塊。殘餘區塊包括量化當前區塊之像素值與預測區塊之像素值之間的差的一組像素差值。在一些實例中,殘餘區塊可表示為二維區塊格式(例如,像素值之二維矩陣或陣列)。在此等實例中,殘餘區塊為像素值之二維表示。
使用區塊變換來變換可在執行預測之後剩餘的任何殘餘資料,此變換可基於離散餘弦變換、離散正弦變換、整數變換、小波變換、其他合適的變換函數或其任何組合。在一些情況下,一或多個區塊變換(例如,大小32×32、16×16、8×8、4×4或其他合適的大小)可應用於每一CU中之殘餘資料。在一些實施例中,TU可用於藉由編碼器引擎106實施的變換及量化程序。給定之具有一或多個PU的CU亦可包括一或多個TU。如下文進一步詳細描述,可使用區塊變換將殘餘值變換成變換係數,且隨後可使用TU來量化且掃描殘餘值以產生用於熵寫碼之串行化變換係數。
在一些實施例中,在使用CU之PU進行框內預測性或框間預測性寫碼之後,編碼器引擎106可計算CU之TU的殘餘資料。PU可包含空間域(或像素域)中之像素資料。在應用區塊變換之後,TU可包含變換域中之係數。如先前所提及,殘餘資料可對應於未經編碼圖像之像素(例如PU)與對應於PU之預測值之間的像素差值。編碼器引擎106可形成包括CU之殘餘資料的TU,且接著可變換TU以產生CU之變換係數。
編碼器引擎106可執行變換係數之量化。量化藉由量化變換係數以減少用以表示係數之資料的量而提供進一步壓縮。舉例而言,量化可減少與係數中之一些或所有相關聯的位深度。在一個實例中,具有n位值之係數可在量化期間經降值捨位為m位值,其中n大於m。
一旦執行量化,經寫碼視訊位元串流便包括經量化變換係數、預測資訊(例如,預測模式、運動向量、區塊向量或其類似者)、分割資訊及諸如其他語法資料之任何其他合適的資料。接著可藉由編碼器引擎106對經寫碼視訊位元串流之不同元素進行熵編碼。在一些實例中,編碼器引擎106可利用預定義掃描次序掃描經量化變換係數以產生可經熵編碼的串行化向量。在一些實例中,編碼器引擎106可執行自適應掃描。在掃描經量化變換係數以形成向量(例如,一維向量)之後,編碼器引擎106可熵編碼向量。舉例而言,編碼器引擎106可使用上下文自適應性可變長度寫碼、上下文自適應性二進位算術寫碼、基於語法之上下文自適應性二進位算術寫碼、機率區間分割熵寫碼或另一合適的熵編碼技術。
如先前所描述,HEVC位元串流包括NAL單元之群組,包括VCL NAL單元及非VCL NAL單元。VCL NAL單元包括形成經寫碼視訊位元串流之經寫碼圖像資料。舉例而言,形成經寫碼視訊位元串流之位序列存在於VCL NAL單元中。除了其他資訊以外,非VCL NAL單元亦可含有具有與經編碼視訊位元串流相關之高層級資訊的參數集。舉例而言,參數集可包括視訊參數集(VPS)、序列參數集(SPS)及圖像參數集(PPS)。參數集之目標之實例包括比特率效率、錯誤復原(error resiliency)及提供系統層接口。每一圖塊參考單一作用中PPS、SPS及VPS以存取解碼裝置112可用於解碼圖塊之資訊。可針對每一參數集寫碼識別符(ID),包括VPS ID、SPS ID及PPS ID。SPS包括SPS ID及VPS ID。PPS包括PPS ID及SPS ID。每一圖塊標頭包括PPS ID。使用ID,可識別針對給定圖塊之作用中參數集。
PPS包括適用於給定圖像中之所有圖塊的資訊。因此,圖像中之所有圖塊參考同一PPS。不同圖像中之圖塊亦可參考同一PPS。SPS包括適用於同一經寫碼視訊序列(CVS)或位元串流中之所有圖像的資訊。如先前所描述,經寫碼視訊序列為一系列存取單元(AU),其始於在基礎層中且具有某些性質(如上文所描述)之隨機存取點圖像(例如,瞬時解碼參考(IDR)圖像或斷鏈存取(BLA)圖像或其他適當的隨機存取點圖像),直至且不包括具有在基礎層中且具有某些性質之隨機存取點圖像的下一AU (或位元串流之末端)。SPS中之資訊可能不在經寫碼視訊序列內在圖像間變化。經寫碼視訊序列中之圖像可使用同一SPS。VPS包括適用於經寫碼視訊序列或位元串流內之所有層的資訊。VPS包括具有適用於全部經寫碼視訊序列之語法元素的語法結構。在一些實施例中,可與經編碼位元串流一起頻帶內傳輸VPS、SPS或PPS。在一些實施例中,可在與含有經寫碼視訊資料之NAL單元分開的傳輸中帶外經傳輸VPS、SPS或PPS。
視訊位元串流亦可包括補充增強資訊(SEI)訊息。舉例而言,SEI NAL單元可為視訊位元串流之部分。在一些狀況下,SEI訊息可含有解碼過程未必需要的資訊。舉例而言,SEI信息中之資訊對於解碼器解碼位元串流之視訊圖像可能並不重要,但解碼器可使用資訊以改良圖像之顯示或處理(例如,經解碼輸出)。SEI訊息中之資訊可為嵌入型後設資料。在一個說明性實例中,SEI訊息中之資訊可由解碼器側實體使用以改良內容之可見性。在一些情況下,某些應用標準可強制此類SEI訊息在位元串流中之存在以使得符合應用標準之所有裝置可達成品質之改良(例如,用於圖框可兼容平面立體3DTV視訊格式之訊框包裝SEI訊息的攜載,其中針對視訊之每一訊框攜載SEI訊息;恢復點SEI訊息之處置;拉移式掃描矩形SEI訊息在DVB中之使用;外加許多其他實例)。
編碼裝置104之輸出110可經由通信鏈路120將組成經編碼視訊位元串流資料之NAL單元發送至接收裝置之解碼裝置112。解碼裝置112之輸入114可接收NAL單元。通信鏈路120可包括由無線網路、有線網路或有線網路與無線網路之組合提供的通道。無線網路可包括任何無線接口或無線接口之組合,且可包括任何適合的無線網路(例如,網際網路或其他廣域網路、基於封包之網路、WiFiTM 、射頻(RF)、UWB、WiFi-Direct、蜂巢式、長期演進(LTE)、WiMaxTM 或其類似者)。有線網路可包括任何有線接口(例如,光纖、以太網路、電力線以太網路、經由同軸電纜之以太網路、數位信號線(DSL)或其類似者)。可使用各種設備來實施有線及/或無線網路,該等設備諸如基地台、路由器、存取點、橋接器、閘道器、交換器或其類似者。可根據通信標準(諸如,無線通信協定)調變經編碼視訊位元串流資料,且將其傳輸至接收裝置。
在一些實例中,編碼裝置104可將經編碼視訊比特流資料儲存於儲存器108中。輸出端110可自編碼器引擎106或自儲存器108擷取經編碼視訊位元串流資料。儲存器108可包括多種分佈式或本端存取之資料儲存媒體中之任一者。舉例而言,儲存器108可包括硬盤機、儲存光盤、快閃記憶體、揮發性或非揮發性記憶體或用於儲存經編碼視訊資料之任何其他合適的數位儲存媒體。儲存器108亦可包括用於儲存參考圖像以供用於框間預測的經解碼圖像緩衝器(DPB)。在另一實例中,儲存器108可對應於檔案服務器或可儲存由源裝置產生之經編碼視訊的另一中間儲存裝置。在此情況下,包括解碼裝置112之接收裝置可經由串流傳輸或下載自儲存裝置存取經儲存視訊資料。檔案服務器可為能夠儲存經編碼視訊資料且將彼經編碼視訊資料傳輸至接收裝置的任何類型之服務器。實例檔案服務器包括網頁服務器(例如,用於網站)、FTP服務器、網路附加儲存(NAS)裝置或本端磁盤機。接收裝置可經由任何標準資料連接(包括網際網路連接)存取經編碼視訊資料。此可包括無線通道(例如,Wi-Fi連接)、有線連接(例如,DSL、電纜數據機等)或適合於存取儲存於檔案服務器上之經編碼視訊資料的兩者之一組合。自儲存器108的經編碼視訊資料之傳輸可為串流傳輸、下載傳輸或其組合。
解碼裝置112之輸入端114接收經編碼視訊比特流資料,且可將視訊比特流資料提供至解碼器引擎116,或提供至儲存器118以供稍後由解碼器引擎116使用。舉例而言,儲存器118可包括用於儲存參考圖像以供用於框間預測的DPB。包括解碼裝置112之接收裝置可經由儲存器108接收待解碼的經編碼視訊資料。可根據通信標準(諸如,無線通信協定)調變經編碼視訊資料,且將其傳輸至接收裝置。用於傳輸經編碼視訊資料的通信媒體可包括任何無線或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全局網路)之部分。通信媒體可包括路由器、交換器、基地台或可能適用於促進自源裝置至接收裝置之通信的任何其他裝備。
解碼器引擎116可藉由熵解碼(例如,使用熵解碼器)且提取組成經編碼視訊資料之一或多個經寫碼視訊序列的元素,來解碼經編碼視訊位元串流資料。解碼器引擎116可接著重新按比例調整經編碼視訊位元串流資料且對經編碼視訊位元串流資料執行反變換。殘餘資料接著傳遞至解碼器引擎116之預測級。解碼器引擎116接著預測像素之區塊(例如PU)。在一些實例中,預測被加至反變換之輸出(殘餘資料)。
解碼裝置112可將經解碼視訊輸出至視訊目的地裝置122,該視訊目的地裝置可包括用於將經解碼視訊資料顯示給內容之消費者的顯示器或其他輸出裝置。在一些態樣中,視訊目的地裝置122可為包括解碼裝置112的接收裝置之部分。在一些態樣中,視訊目的地裝置122可為不同於接收裝置的單獨裝置之部分。
在一些實施例中,視訊編碼裝置104及/或視訊解碼裝置112可分別與音訊編碼裝置及音訊解碼裝置整合。視訊編碼裝置104及/或視訊解碼裝置112亦可包括實施上文所描述之寫碼技術所必要的其他硬體或軟體,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。視訊編碼裝置104及視訊解碼裝置112可整合為各別裝置中之組合式編碼器/解碼器(編解碼器)之部分。下文參看圖11描述編碼裝置104之特定細節的實例。下文參看圖12描述解碼裝置112之特定細節的實例。
圖1中展示之實例系統為在本文中使用的一個說明性實例。用於使用本文中所描述之技術處理視訊資料的技術可藉由任何數位視訊編碼及/或解碼裝置來執行。儘管通常本發明之技術由視訊編碼裝置或視訊解碼裝置來執行,但該等技術亦可由組合式視訊編碼器-解碼器(通常被稱作「編解碼器」)執行。此外,本發明之技術亦可由視訊預處理器執行。源裝置及接收裝置僅為其中源裝置產生經寫碼視訊資料以供傳輸至接收裝置的此類寫碼裝置之實例。在一些實例中,源裝置及接收裝置可以大體上對稱之方式操作,使得該等裝置中之每一者包括視訊編碼及解碼組件。因此,實例系統可支持視訊裝置之間的單向或雙向視訊傳輸,例如用於視訊串流、視訊播放、視訊廣播或視訊電話。
對HEVC標準之擴展包括多視圖視訊寫碼擴展(被稱作MV-HEVC)及可縮放視訊寫碼擴展(被稱作SHVC)。MV-HEVC及SHVC擴展共享分層寫碼之概念,其中不同層包括於經編碼視訊位元串流中。經寫碼視訊序列中之每一層係由唯一層識別符(ID)尋址。層ID可存在於NAL單元之標頭中以識別NAL單元所相關聯之層。在MV-HEVC中,不同層可表示視訊位元串流中之同一場景的不同視圖。在SHVC中,提供表以示不同空間分辨率(或圖像分辨率)不同或不同重建構保真度不同之表示視訊位元串流的不同可調式層。可調式層可包括基層(具有層ID=0)及一或多個增強層(具有層ID=1、2、…n)。基層可符合HEVC之第一版本的設定檔,且表示位元串流中之最低可用層。與基層相比,增強層具有增加之空間分辨率、時間分辨率或圖框速率及/或重建構保真度(或品質)。增強層經階層式組織,且可(或可不)取決於較低層。在一些實例中,可使用單一標準編解碼器來寫碼不同層(例如,使用HEVC、SHVC或其他寫碼標準編碼所有層)。在一些實例中,可使用多標準編碼解碼器來寫碼不同層。舉例而言,可使用AVC來寫碼基層,而可使用對HEVC標準之SHVC及/或MV-HEVC擴展來寫碼一或多個增強層。
一般而言,層包括一組VCL NAL單元及對應的一組非VCL NAL單元。NAL單元被指派特定層ID值。在層可取決於較低層的意義上,層可為階層式的。層集合指表示於位元串流內之獨立的層之集合,意謂在解碼程序中層集合內之層可取決於層集合中之其他層,但並不取決於任何其他層來進行解碼。因此,層集合中之層可形成可表示視訊內容之獨立位元串流。可藉由子位元串流提取程序之操作自另一位元串流獲得層集合中之層的集合。層集合可對應於待在解碼器希望根據某些參數操作時被解碼之層集合。
如上文所描述,對於每一區塊,運動資訊集合(在本文中亦被稱作運動參數)可係可用的。運動資訊集合含有用於前向及後向預測方向之運動資訊。前向及後向預測方向為雙向預測模式之兩個預測方向,在此狀況下,術語「前向」及「後向」不必具有幾何意義。實情為,「前向」及「後向」對應於當前圖像之參考圖像清單0 (RefPicList0或L0)及參考圖像清單1 (RefPicList1或L1)。在一些實例中,當僅有一個參考圖像清單可用於圖像或圖塊時,僅僅RefPicList0係可用的且圖塊之每一區塊的運動資訊始終係前向。
在一些狀況下,運動向量連同其參考索引被用於寫碼程序中(例如,運動補償)。具有相關聯參考索引之此類運動向量表示為單向預測性運動資訊集合。對於每一預測方向,運動資訊可含有參考索引及運動向量。在一些狀況下,為簡單起見,可以假設運動向量自身具有相關聯參考索引的方式參考該運動向量。參考索引用於識別當前參考圖像清單(RefPicList0或RefPicList1)中之參考圖像。運動向量具有提供自當前圖像中之座標方位至藉由參考索引識別的參考圖像中之座標的偏移的水平及垂直分量。舉例而言,參考索引可指示應用於當前圖像中之區塊的特定參考圖像,且運動向量可指示最佳匹配區塊(最佳匹配當前區塊的區塊)在參考圖像中之何處。
圖像次序計數(POC)可用於視訊寫碼標準以識別圖像之顯示次序。雖然存在一個經寫碼視訊序列內之兩個圖像可具有相同POC值的情況,但經寫碼視訊序列內通常不會發生此類情況。當位元串流中存在多個經寫碼視訊序列時,就解碼次序而言,具有同一POC值之圖像可更接近於彼此。圖像之POC值通常用於參考圖像清單建構、如HEVC中之參考圖像集合之導出及運動向量按比例調整。
在H.264/AVC中,每一框間宏區塊(MB)可以四種不同方式分割,包括:一個16×16 MB分區;兩個16×8 MB分區;兩個8×16 MB分區;及四個8×8 MB分區。一個MB中之不同MB分區每一方向可具有不同參考索引值(RefPicList0或RefPicList1)。在一些狀況下,當MB未分割成四個8×8 MB分區時,每一MB分區在每一方向上可具有僅僅一個運動向量。在一些情況下,當MB分割成四個8×8 MB分區時,每一8×8 MB分區可進一步分割成子區塊,在此情況下,每一子區塊在每一方向上可具有不同運動向量。在一些實例中,存在四種自8×8 MB分區得到子區塊的不同方法,包括一個8×8子區塊;兩個8×4子區塊;兩個4×8子區塊;及四個4×4子區塊。每一子區塊在每一方向上可具有不同運動向量。因此,運動向量以等於比子區塊高之位準呈現。
在AVC中,可在B圖塊中,針對跳過及/或直接模式,在MB位準或MB分區位準任一者啟用時間直接模式。對於每一MB分區,與當前區塊之RefPicList1[0]中之當前MB分區同置的區塊之運動向量用以導出運動向量。同置區塊中之每一運動向量可基於POC距離而按比例調整。
亦可在AVC中執行空間直接模式。舉例而言,在AVC中,直接模式亦可自空間相鄰者預測運動資訊。
如上所指出,在HEVC中,圖塊中之最大寫碼單元被稱作寫碼樹型區塊(CTB)。CTB含有四分樹,該四分樹之結點為寫碼單元。CTB之大小根據HEVC主規範可介於16×16至64×64之範圍內。在一些情況下,可支持8×8 CTB大小。寫碼單元(CU)可與CTB具有相同大小,且可小如8×8。在一些情況下,每一寫碼單元運用一個模式進行寫碼。當CU經框間寫碼時,CU可進一步分割成2個或4個預測單元(PU)或可當不應用進一步分割時變為僅一個PU。當一個CU中存在兩個PU時,其可為一半大小的矩形或具有CU之¼或¾大小的兩個矩形。
當CU經框間寫碼時,針對每一PU提供一個運動資訊集合。另外,每一PU經唯一框間預測模式寫碼以導出運動資訊集合。
對於HEVC中之運動預測,存在用於預測單元(PU)之兩個框間預測模式,包括合併模式及進階運動向量預測(AMVP)模式。跳過被視為合併之特殊情況。在AMVP或合併模式中,為多個動作向量預測符維持動作向量(MV)候選清單。當前PU之運動向量(以及合併模式中之參考索引)藉由自MV候選清單獲取一個候選者而產生。
在一些實例中,MV候選清單含有針對合併模式的至多五個候選者及針對AMVP模式的兩個候選者。在其他實例中,不同數目個候選者可包括於針對合併模式及/或AMVP模式的MV候選清單中。合併候選者可含有運動資訊之集合。舉例而言,運動資訊集合可包括對應於參考圖像清單(清單0及清單1兩者)的運動向量及參考索引。若由合併索引來識別合併候選者,則參考圖像用於當前區塊之預測,以及判定相關聯之運動向量。然而,在針對自清單0或清單1的每一潛在預測方向的AMVP模式下,需要明確地將參考索引連同MVP索引發信至MV候選清單,因為AMVP候選者僅含有運動向量。在AMVP模式中,可進一步改進經預測運動向量。
如可自上文看出,合併候選者對應於運動資訊之整個集合,而AMVP候選者僅含有用於特定預測方向之一個運動向量及參考索引。以類似方式自相同空間及時間相鄰區塊導出用於兩個模式之候選者。
在一些實例中,合併模式允許經框間預測PU以自包括選自空間相鄰運動資料方位之群組及兩個時間同置運動資料方位中之一者的運動資料方位的經框間預測PU繼承相同一或多個運動向量、預測方向及一或多個參考圖像索引。對於AMVP模式,PU之一或多個運動向量可關於自藉由編碼器及/或解碼器所建構之AMVP候選清單的一或多個運動向量預測符(MVP)來預測寫碼。在一些情況下,對於PU之單個方向框間預測,編碼器及/或解碼器可產生單個AMVP候選清單。在一些情況下,對於PU之雙向預測,編碼器及/或解碼器可產生兩個AMVP候選清單,一個使用來自前向預測方向的空間及時間相鄰PU之運動資料,且一個使用來自後向預測方向的空間及時間相鄰PU之運動資料。
用於兩個模式之候選者可自空間及/或時間相鄰區塊導出。舉例而言,圖2A及圖2B包括說明HEVC中之空間相鄰候選者之概念圖。圖2A說明用於合併模式之空間相鄰運動向量(MV)候選者。圖2B說明用於AMVP模式之空間相鄰運動向量(MV)候選者。儘管方法自針對合併及AMVP模式不同之區塊產生候選者,但空間MV候選者自特定PU (PU0)之相鄰區塊導出。
在合併模式中,編碼器及/或解碼器可藉由考慮從各種運動資料方位之合併候選者而形成合併候選清單。舉例而言,如圖2A中所展示,可相對於圖2A中之數字0至4所展示之空間相鄰運動資料方位來導出達至四個空間MV候選者。MV候選者可按藉由數字0至4所展示之次序在合併候選清單中排序。舉例而言,方位及次序可包括:左側方位(0)、上方位(1)、右上方位(2)、左下方位(3)及左上方位(4)。
在圖2B中所展示之AVMP模式中,相鄰區塊被分成兩個群組:包括區塊0及1之左群組及包括區塊2、3及4之上群組。對於每一群組,參考與由發信之參考索引指示之相同參考圖像的相鄰區塊中之潛在候選者具有待選擇之最高優先級以形成群組之最終候選者。有可能所有相鄰區塊均不含指向相同參考圖像之運動向量。因此,若無法發現此類候選者,則將按比例調整第一可用候選者以形成最終候選者,因此可補償時間距離差。
圖3A及圖3B包括說明HEVC中之時間運動向量預測的概念圖。時間運動向量預測符(TMVP)候選者在經啟用且可用時在空間運動向量候選者之後被添加至MV候選清單中。對於合併及AMVP模式兩者,TMVP候選者之運動向量導出之程序為相同的。在一些情況下,然而,對於合併模式中之TMVP候選者,目標參考索引可設定成零或可從相鄰區塊之彼索引導出。
TMVP候選者導出之初始區塊位置為如圖3A中展示為區塊「T」之同置PU外部之右下區塊,以補償用以產生空間相鄰候選者之上方及左側區塊之偏差。然而,若彼區塊位於當前CTB (或LCU)列之外部或運動資訊不可用,則區塊被PU之中心區塊所取代。用於TMVP候選者之運動向量係自圖塊層級中所指示之同置圖像之同置PU導出。與AVC中之時間直接模式類似,TMVP候選者之運動向量可經受運動向量按比例調整,其經執行以補償距離差。
運動預測之其他態樣涵蓋於HEVC標準中。舉例而言,合併及AMVP模式之若干其他態樣經涵蓋。一個態樣包括運動向量按比例調整。關於運動向量按比例調整,可假定,在呈現時間中,運動向量之值與圖像之距離成比例。運動向量相關聯兩個圖像——參考圖像及含有運動向量之圖像(即含有圖像)。當利用一運動向量預測另一運動向量時,基於圖像次序計數(POC)值而計算含有圖像與參考圖像之距離。
對於待預測之運動向量,其相關聯之含有圖像及參考圖像可不同。因此,計算新距離(基於POC)。又,基於此等兩個POC距離按比例調整運動向量。對於空間相鄰候選者,用於兩個運動向量之含有圖像為相同的,而參考圖像為不同的。在HEVC中,運動向量調整適用於空間及時間相鄰候選者之TMVP及AMVP兩者。
運動預測之另一態樣包括人工運動向量候選者產生。舉例而言,若運動向量候選清單不完整,則人工運動向量候選者經產生於並插入於該清單之末端直至獲得所有候選者為止。在合併模式中,存在兩個類型之人造MV候選者:僅針對B-圖塊導出之合併候選者及在第一類型並未提供足夠人造候選者的情況下的僅針對AMVP使用之零候選者。對於已在候選清單中且具有必要運動資訊之每一對候選者,藉由參考清單0中之圖像之第一候選者的運動向量與參考清單1中之圖像之第二候選者的運動向量之組合來導出雙向組合運動向量候選者。
存在各種相關運動預測技術。一種預測技術為局部照明補償(LIC)或明度補償。照明補償已經提議用於HEVC。舉例而言,在JCTVC-C041中,提議基於分區之照明補償(PBIC)。不同於啟用及/或停用經加權預測(WP)且在圖塊層級發信WP參數的WP (如下文所描述),PBIC啟用及/或停用照明補償(IC),且在預測單元(PU)層級發信IC參數以處置局部照明變體。在JVET-B0023中,基於區塊之LIC延伸至CU,類似於HEVC中之PU,CU變為在QTBT結構中攜載運動資訊的基本單元。
類似於在下文更詳細描述之經加權預測(WP),按比例調整因數(亦表示為a )及偏移(亦表示為b )用於IC,且移位數固定至6。針對每一PU寫碼IC旗標以指示IC是否適用於當前PU。若IC適用於PU,則IC參數之集合(例如,ab )被發信至解碼器,且用於運動補償。在一些實例中,為節省IC參數上所花費的位,色度分量與明度分量共享縮放因數,且使用固定偏移128。
在3D-HEVC中,IC經啟用用於視圖間預測。不同於WP及顯式地發信IC參數之PBIC,其基於當前CU之相鄰樣本及參考區塊之相鄰樣本導出IC參數。IC僅僅應用於2N×2N分區模式。對於AMVP模式,針對自視圖間參考圖像預測之每一CU發信一個IC旗標。對於合併模式,為了節省位,僅當PU之合併索引不等於0時發信IC旗標。在一些情況下,IC不應用於僅自時間參考圖像預測之CU。
關於IC參數之導出,用於視圖間預測中之線性IC模型展示於方程式(1)中:
Figure 02_image003
,其中
Figure 02_image005
方程式(1)
此處,PUc 為當前PU,(i, j )為PUc 中之像素的座標,(dvx ,dvy )為PUc 之視差向量。p (i ,j )為PUc 之預測,r 為來自相鄰視圖的PU之參考圖像,且ab 為線性IC模型之參數。
為估計PU之參數ab ,使用如圖4A及圖4B中所展示之兩個像素集合。第一像素集合展示於圖4A中,且在當前CU (含有當前PU之CU)之左側行及上方列中包括可用的經重建構相鄰像素。第二像素集合展示於圖4B中,且包括當前CU之參考區塊的對應相鄰像素。當前CU之參考區塊藉由使用當前PU之視差向量而被發現。
Recneig Recrefneig 分別標示當前CU之所使用相鄰像素集合及其參考區塊,且讓2N標示Recneig Recrefneig 中之像素數目。隨後,ab 可經計算為:
Figure 02_image007
方程式(2)
Figure 02_image009
方程式(3)
在一些情況下,僅a 用於線性模型中,且b 始終設定為等於0。在一些情況下,僅使用ba 始終設定為等於1。
在HEVC中,支援經加權預測(WP),在此情況下,按比例調整因數(表示為a )、移位數(表示為s )及偏移(表示為b )用於運動補償。假設參考圖像之方位(x, y)中的像素值為p(x, y),則p'(x, y) = ((a*p(x, y) + (1 << (s-1))) >> s) + b,而非p(x, y)用作運動補償中之預測值。
當WP啟用時,對於當前圖塊之每一參考圖像,發信一旗標以指示WP是否適用於參考圖像。若WP適用於一個參考圖像,則將WP參數之集合(亦即,as b )發送至解碼器,且將其用於自參考圖像之運動補償。在一些實例中,為可撓地打開/關閉明度及色度分量之WP,針對明度及色度分量單獨發信WP旗標及WP參數。在WP中,將WP參數之一個相同集合用於一個參考圖像中之所有像素。
在JEM中,提議局部照明補償(LIC)方法。在JEM中LIC之描述可見於JVET-G1001。關於JVET中之LIC,LIC係基於使用按比例調整因數a 及偏移b 的用於照明變化之線性模型。此LIC針對每一經框間模式寫碼之寫碼單元(CU)自適應性地啟用或停用。當LIC適用於CU時,最小平方差方法用以藉由使用當前CU之相鄰樣本及其對應參考樣本而導出參數ab 。舉例而言,如圖5A及圖5B中所說明,使用CU之經子取樣(2:1子取樣)相鄰樣本及參考圖像中的對應像素(藉由當前CU或子CU之運動資訊所識別)。在一些實例中,針對每一預測方向單獨導出並且應用IC參數。在一些實例中,可針對CU發信照明補償旗標以指示LIC是否適用。在一些實例中,諸如當CU用合併模式進行寫碼時,照明補償旗標可以類似於合併模式中之運動資訊複製的方式自相鄰區塊複製。
根據LIC,明度值(樣本之明度值,或像素)以線性形式在框間預測中進行補償,a *p +b ,其中p 為框間預測中之樣本,a 為按比例調整因數,且b 為偏移。按比例調整因數a 及偏移b 為使用當前區塊之相鄰樣本及參考區塊之相鄰樣本導出的參數(例如,如圖5A及圖5B中所展示),該等參數用於框間預測。舉例而言,可首先使用針對經框間寫碼區塊發信的運動資訊導出框間預測,隨後可導出參數ab ,且接著可執行預測改進。可藉由將當前區塊之相鄰經重建構樣本與用於框間預測之參考區塊的相鄰樣本之間的差最小化來導出參數。在一些情況下,該最小化可使用線性最小平方方法及/或任何其他合適的最小化方法來執行。
圖6為說明當前區塊602之相鄰經重建構樣本及用於單向框間預測的參考區塊604之相鄰樣本的實例的圖式。運動向量MV可針對當前區塊602進行寫碼,其中MV可包括至參考圖像清單之參考索引,及/或用於識別參考區塊604之其他運動資訊。舉例而言,MV可包括提供自當前圖像中之座標方位至藉由參考索引識別之參考圖像中之座標的偏移的水平及垂直分量。
圖7為說明當前區塊702之相鄰經重建構樣本及用於雙向框間預測的第一參考區塊704及第二參考區塊706之相鄰樣本的實例的圖式。在此情況下,兩個運動向量MV0及MV1可針對當前區塊702進行寫碼以分別識別第一參考區塊704及第二參考區塊706。
照明補償(IC)參數可包括偏移、一或多個權重、移位數或其他適合之照明補償參數。權重亦可被稱為按比例調整因數。IC參數可經導出用於框間預測(例如,單向框間預測)。對於雙向框間預測,一或多個權重可包括用於第一參考圖像之第一權重及用於第二參考圖像之第二權重。
在一些實施中,可使用線性最小平方回歸估計雙向預測性運動補償中之LIC參數。在一個實例中,LIC參數之導出可藉由求解成本函數來進行。舉例而言,成本函數可包括使用最小平方函數。舉例而言,可使用來自當前區塊之一或多個相鄰區塊的樣本之子集導出LIC參數。可使用來自當前區塊之相鄰區塊的樣本在當前區塊702中找出可能的照度變化,因為可假定相鄰樣本(相鄰區塊中)與當前樣本(當前區塊702中)之間存在強大相關性。舉例而言,可假定共享相同運動資訊之當前區塊及相鄰區塊應含有極類似照度值。使用相鄰樣本的另一原因在於:當前區塊尚未進行預測,且自當前區塊可能不存在將使用的像素,在此情況下,可使用相鄰樣本(已經重建構)執行當前區塊之運動補償。
在一個說明性實例中,可使用頂部相鄰者、左側相鄰者任一者,或頂部相鄰者及左側相鄰者兩者。舉例而言,可使用來自當前區塊702之頂部相鄰者及左側相鄰者(Ni)的樣本子集、來自第一參考區塊704之頂部相鄰者及左側相鄰者(P0)的像素子集,及來自第二參考區塊706之頂部相鄰者及左側相鄰者(P1)之像素子集導出當前區塊702之IC參數。相鄰區塊P0及P1之樣本可包括對應於相鄰區塊Ni 之相鄰樣本的樣本。在一些情況下,可藉由當前區塊之運動資訊識別用於相鄰區塊P0及P1中之對應樣本。在一個說明性實例中,可經由合併模式或AMVP模式任一者發信運動向量。參考圖像可使用其參考索引識別,其中參考圖像內的參考區塊704及706分別使用運動向量MV0及MV1。
在一些實例中,可執行多於一個導出方法以導出LIC參數。用於在編碼器側導出LIC參數的框間預測引擎或模組之實例可包括圖11中所示之預測處理單元41、運動估計單元42及/或運動補償單元44。用於在解碼器側導出LIC參數的框間預測引擎或模組之實例可包括圖11中所示之預測處理單元81及/或運動補償單元82。在此等實例中,編碼器或其他傳輸器側裝置可向解碼器發信在序列層級(例如,在VPS及/或SPS中)、在圖像層級(例如,在PPS中)、在圖塊層級(例如,在圖塊標頭中)、在CTU層級、在CU層級、在PU層級或其一組合或其他合適發信層級下將使用哪種導出方法。
在一些實例中,可基於相鄰者之多條線及/或行(例如,頂部相鄰者、左側相鄰者、頂部及左側相鄰者兩者或其他相鄰者任一者)計算最小平方解決方案。線及/或行之實例編號(在一些情況中,典型編號)包括一、二、四或任何其他合適數目個列及/或行。可在使用相鄰區塊之多條線及/或行時修改上述成本函數。舉例而言,若區塊為16×16個區塊(16列像素乘16行像素),且若使用來自頂部相鄰區塊的兩條線及來自左側相鄰區塊的兩行,則相鄰區塊Ni 將包括64個樣本(來自左側相鄰區塊的32個樣本及來自頂部相鄰區塊的32個樣本)。在此類實例中,相鄰者P0及P1亦將包括64個樣本。
在一些情況下,將整數定位樣本(或像素)用於LIC參數之導出。在一些情況下,將分數定位樣本用於LIC參數之導出。在一些情況下,整數定位樣本及分數定位樣本兩者皆可使用舉例而言,物件在圖像之間移動的真位移係連續的,且傾向於不遵循視訊序列中的圖像之取樣網格。因為此,可將分數準確性而非整數準確性用於運動向量,從而導致殘餘誤差減低且視訊寫碼器之寫碼效率升高。若運動向量具有分數值,則參考區塊因此需要經內插。舉例而言,用於當前區塊之樣本的運動向量可指向參考區塊中之分數像素方位。分數像素方位指區塊中的分數樣本位置(非整數位置)處的樣本(例如,明度樣本)。此等位置需要藉由內插產生。在一個實例中,當使用分數定位樣本時,可使用參考區塊相鄰者(例如,P0或P1)之經內插或經濾波版本在導出LIC參數時自經重建構像素減少量化誤差。可使用一或多個內插濾波器產生模板之此經內插版本。
在一些實例中,僅僅需要使用明度分量來聯合地優化用於Ref0及Ref1兩者之LIC參數。或者,明度及色度分量兩者可被視為在雙向預測性LIC參數之導出期間。編碼器可向解碼器發信(在參數集中、在SEI訊息中或其他合適發信機制)將LIC應用於色度分量中之一或多者,抑或僅僅將LIC應用於明度分量。
在一些實例中,可在區塊層級在編碼器與解碼器之間發信一或多個旗標,以指示在區塊之預測中是否已應用特定工具(例如,LIC、合併模式外加其他)。舉例而言,可連同用於當前區塊之運動資訊儲存合併模式旗標。可基於合併模式旗標自運動資訊推斷是否已使用合併模式寫碼當前區塊。除合併模式旗標之外,可使用照明補償旗標指示CU已在照明補償得以應用的情況下進行寫碼。當CU用合併模式進行寫碼時,照明補償旗標可以類似於合併模式中之運動資訊複製的方式自相鄰區塊複製。否則,若CU尚未運用合併模式進行寫碼(例如,實際上使用AMVP模式),則可針對CU發信照明補償旗標(或「LIC旗標」)以指示是否應用LIC。
如先前所提及,可將一或多個運動資訊候選清單用於運動預測。舉例而言,可針對合併模式及/或AMVP模式維持運動向量(MV)候選清單。MV候選清單可包括多個MV候選者,其中待包括於MV候選清單中的候選者之數目可基於運動預測模式(例如,合併模式或AMVP模式)。MV候選清單中之每一MV候選者可包括一或多個運動向量、參考索引及/或其他運動資訊,諸如LIC旗標。
在一些實例中,當將新候選者添加或插入至MV候選清單中時可涉及刪剪程序。舉例而言,在一些情況下,來自不同區塊的MV候選者可能包括相同資訊。在此等狀況下,將多個MV候選者之重複運動資訊儲存於MV候選清單中會造成MV候選清單之冗餘及效率減低。在一些實例中,刪剪程序可消除或最小化MV候選清單中之冗餘。舉例而言,刪剪程序可包括將待添加至MV候選清單之潛在MV候選者與已儲存於MV候選清單中之MV候選者進行比較。若基於此比較發現匹配,則可避免將潛在MV候選者添加至MV候選清單。
如先前所提及,運動向量候選者可包括不同類型的運動資訊,諸如運動向量、參考索引、LIC旗標,外加其他。在一些實例中,刪剪程序中之運動資訊比較可包括將包括於MV候選者中之所有運動資訊與MV候選清單中之所儲存MV候選者的對應運動資訊進行比較。在一些實例中,該比較可受限於正比較的一或多種類型之運動資訊,而一些類型之運動資訊可自該比較中排除。
舉例而言,在用於刪剪程序中之運動資訊比較的一些實施中,LIC旗標可包括於運動資訊中以供比較。舉例而言,除將潛在MV候選者之運動向量與MV候選清單中之所儲存MV候選者之運動向量進行比較之外,亦可將潛在MV候選者之LIC旗標與MV候選清單中的所儲存MV候選者之各別LIC旗標進行比較。在此等實例中,若除潛在MV候選者與所儲存MV候選者中之一者之間的運動向量匹配之外,LIC旗標中存在匹配,則潛在MV候選者可經刪剪或排除而不添加至MV候選清單。
在用於刪剪程序中的運動資訊比較之其他實施中,可自用於比較之運動資訊排除LIC旗標。舉例而言,潛在MV候選者之運動向量可與MV候選清單中的所儲存MV候選者之運動向量進行比較,但可自與MV候選清單中的所儲存MV候選者之各別LIC旗標的比較排除潛在MV候選者之LIC旗標。在此等實例中,當潛在MV候選者與所儲存MV候選者中之一者之間存在運動向量之匹配時,潛在MV候選者可經刪剪或排除而不被添加至MV候選清單,而不管潛在MV候選者之LIC旗標是否匹配所儲存MV候選者之LIC旗標(此產生運動向量之匹配)。針對刪剪自運動資訊比較中排除LIC旗標可簡化比較程序,因為較少資訊進行比較。然而,儘管自運動資訊比較中排除LIC旗標可能存在效率增益,但效能有可能降級,如下文所解釋。
在針對刪剪自運動資訊比較中排除LIC旗標的實施之說明性實例中,基於與MV候選清單中之先前所儲存MV候選者的運動向量產生匹配的潛在MV候選者之運動向量,潛在MV候選者可經排除而不被添加至MV候選清單。在此實例中,潛在MV候選者之LIC旗標可失配所儲存MV候選者之LIC旗標。在一實例中,該失配可係基於所儲存MV候選者之LIC旗標為假值,且潛在MV候選者之LIC旗標為真值。由於潛在MV候選者經刪剪,因此所儲存MV候選者保留在MV候選清單中,其中其相關聯LIC旗標具有假值。然而,刪剪含有具有真值之相關聯LIC旗標的潛在MV候選者可意謂,即使照明補償經判定為適用於潛在MV候選者,此判定亦不會暫存於MV候選清單中。此可造成以下情境:當應用照明補償可能已產生較佳效能時,使用所儲存MV候選者的被應用於區塊之運動預測可能不包括照明補償。因此,存在針對刪剪自運動資訊比較中排除LIC旗標可引起效能降級的情況。
本文中描述之系統及技術包括對照明補償之改良。根據一些態樣,描述用於評估待被添加至MV候選清單之MV候選者的實例刪剪程序。在一些實例中,刪剪程序可考慮待被添加至MV候選清單之潛在MV候選者的LIC旗標,同時避免上述效能降級。
圖8為說明使用實例刪剪技術之運動資訊候選清單建構的圖式。運動資訊候選清單800經展示為包括若干所儲存運動資訊候選者801a、801b至801n,其包括所儲存運動向量802a、802b至802n及相關聯所儲存LIC旗標804a、804b至804n。運動資訊候選清單800可在如先前所描述的合併模式、AMVP模式或其他框間預測模式中用於一或多個區塊之運動預測。運動資訊候選清單800可藉由編碼裝置且藉由解碼裝置單獨地產生。舉例而言,運動資訊候選清單800可藉由編碼裝置在編碼區塊時產生,且可藉由解碼裝置在解碼區塊時產生。
舉例而言,在合併模式中,所儲存運動資訊候選者(例如,運動資訊候選者801a)之所儲存運動向量(例如,運動向量802a)可用作區塊之運動向量,其中可基於所儲存運動資訊候選者之相關聯所儲存LIC旗標(例如,與運動向量802a相關聯之LIC旗標804a)針對區塊應用照明補償。在AMVP模式的狀況下,所儲存運動資訊候選者(例如,運動資訊候選者801b)之所儲存運動向量(例如,運動向量802b)可用以預測區塊之運動向量,其中可基於所儲存運動資訊候選者之相關聯所儲存LIC旗標(例如,與運動向量802b相關聯之LIC旗標804b)針對區塊應用照明補償。在一些實例中,運動資訊候選清單800可用以儲存時間運動向量預測符(TMVP)候選者,其中在已添加用於合併或AMVP模式之空間運動向量候選者之後,一或多個TMVP候選者可被添加至運動資訊候選清單800中,如上所述。
因此,運動資訊候選清單800中的所儲存運動資訊候選者(例如,運動資訊候選者801a)之所儲存運動向量(例如,所儲存運動向量802a)可使用任何合適的預測技術用於視訊資料之區塊之運動預測(例如,在合併模式、AMVP模式或其他者中)。相對應地,用於區塊之照明補償可基於運動資訊候選者之相關聯所儲存LIC旗標(例如,LIC旗標804a) 在一些實例中,若所儲存LIC旗標具有真值,則可針對區塊應用照明補償,或若所儲存LIC旗標具有假值,則可針對區塊避免且不執行照明補償。若應用照明補償,則可如上文參看圖7所論述的或使用任何其他合適的技術計算用於區塊之一或多個LIC參數。
在一些實例中,可藉由運用一或多個運動資訊候選者填充運動資訊候選清單800來建立運動資訊候選清單800。如先前所提及,可在將潛在運動資訊候選者添加至運動資訊候選清單800時實施刪剪程序以避免所儲存運動資訊候選者中之冗餘。舉例而言,刪剪程序可用於判定潛在運動資訊候選者810是否可被添加至運動資訊候選清單800。如圖8中所展示,潛在運動資訊候選者810可包括運動向量812及相關聯LIC旗標814。在一些實例中,包括於潛在運動資訊候選者810中的諸如運動向量812及相關聯LIC旗標814之運動資訊可與視訊資料之區塊相關聯。舉例而言,基於潛在運動資訊候選者810添加至運動資訊候選清單800,可將運動向量812及LIC旗標814用於視訊資料之區塊之運動預測。在一些實例中,潛在運動資訊候選者810之運動向量812及相關聯LIC旗標814可被添加至經受如下刪剪程序之運動資訊候選清單800。
在一實例實施中,可將潛在運動資訊候選者810之運動向量812與運動資訊候選清單800之一或多個所儲存運動向量802a至802n進行比較,以判定是否存在匹配。舉例而言,可將所儲存運動向量802a之水平移位(
Figure 02_image011
)及垂直移位(
Figure 02_image013
)(其指示參考區塊相對於當前區塊之方位的方位)與潛在運動資訊候選者810之運動向量812的水平移位(
Figure 02_image011
)及垂直移位(
Figure 02_image013
)進行比較。
在一些實例中,潛在運動資訊候選者810可包括或相關聯於參考索引,其中如先前所描述,該參考索引可指示可用於視訊資料之區塊之運動預測的特定參考圖像。類似地,一或多個所儲存運動向量802a至802n可包括或相關聯於對應一或多個參考索引。在一些實例中,將潛在運動資訊候選者810與一或多個所儲存運動向量802a至802n進行比較可包括將潛在運動資訊候選者810之參考索引與一或多個所儲存運動向量802a至802n之各別一或多個參考索引進行比較。
在一些實例中,潛在運動資訊候選者810亦可包括或相關聯於圖像次序計數(POC),其中如先前所描述,POC可用以識別圖像之顯式次序、參考圖像清單建構、參考圖像集之導出或其他者。類似地,一或多個所儲存運動向量802a至802n可包括或相關聯於對應一或多個POC。在一些實例中,將潛在運動資訊候選者810與一或多個所儲存運動向量802a至802n進行比較可包括將潛在運動資訊候選者810之POC與一或多個所儲存運動向量802a至802n之各別一或多個POC進行比較。
在各種實例中,將潛在運動資訊候選者810與一或多個所儲存運動向量802a至802n進行比較可包括比較任何相關運動資訊,其中該運動資訊可包括運動向量、參考索引、POC或其他者,在一些實例中,若相關運動資訊之比較揭露潛在運動資訊候選者810之運動向量812並不匹配一或多個所儲存運動向量802a至802n中之任一者,則潛在運動資訊候選者810不會被視為待經刪剪之候選者。在判定潛在運動資訊候選者810不被視為待經刪剪之候選者的此等實例中,潛在運動資訊候選者810可被添加至運動資訊候選清單800。
在另一方面,若比較揭露潛在運動資訊候選者810之運動向量812匹配一或多個所儲存運動向量802a至802n中之一者,則潛在運動資訊候選者810被視為待經刪剪之候選者。在說明性實例中,潛在運動資訊候選者810之運動向量812可匹配所儲存運動資訊候選者之所儲存運動向量802k,其中所儲存LIC旗標804k可與所儲存運動向量802k相關聯。在此實例中,潛在運動資訊候選者810可經刪剪。舉例而言,潛在運動資訊候選者810可能不會插入至運動資訊候選清單800中,此係因為運動向量812將隨著匹配已存在於運動資訊候選清單800中之所儲存運動向量802k而冗餘。然而,在實例態樣中,相關聯所儲存LIC旗標804k可基於所儲存LIC旗標804k之值及潛在運動資訊候選者810之LIC旗標814的值進行更新,但潛在運動資訊候選者810可經刪剪。舉例而言,若所儲存LIC旗標804k之值與LIC旗標814之值不同,則可更新相關聯所儲存LIC旗標804k,但若所儲存LIC旗標804k之值與LIC旗標814之值相同,則可不更新。
在一個說明性實例中,所儲存運動資訊候選者之所儲存LIC旗標804k可在潛在運動資訊候選者810之LIC旗標814為第一值的情況下自所儲存第二值經更新為第一值(其中第一值不同於第二值)。舉例而言,若第一值為真值且第二值為假值,則所儲存LIC旗標804k在LIC旗標814為真值的情況下(自先前所儲存的假值)更新為真值。類似地,所儲存LIC旗標804k在LIC旗標814為假值且LIC旗標804k之所儲存第二值為真值的情況下(自先前所儲存的真值)更新為假值。因此,所儲存LIC旗標804k之所儲存值可在其所儲存值不匹配LIC旗標814之值時進行更新。
在另一方面,若所儲存LIC旗標804k之所儲存值匹配LIC旗標814之值,則所儲存LIC旗標804k之所儲存值不更新。舉例而言,若所儲存LIC旗標804k及LIC旗標814之所儲存值皆為真值,則LIC旗標804k保留為其所儲存的真值。類似地,若所儲存LIC旗標804k及LIC旗標814之所儲存值皆為假值,則所儲存LIC旗標804k保留為其所儲存的假值。
如可瞭解,當運動向量802k匹配運動向量812時(亦即,當潛在運動資訊候選者810可經刪剪時),可使用邏輯或函數實施上文的基於所儲存LIC旗標804k之值及LIC旗標814之值更新LIC旗標804k的程序。舉例而言,可使用以下偽程式碼標號說明更新所儲存LIC旗標804k之程序:若(運動向量802k==運動向量812),則所儲存LIC旗標804k=所儲存LIC旗標804k||LIC旗標814。因此,有可能使用合適的函數區塊更新所儲存LIC旗標804k。
在實例態樣中,運動資訊可在兩個裝置之間(例如)自編碼裝置發信至解碼裝置。在一些實例中,在兩個裝置之間發信的運動資訊可包括一或多個LIC旗標。在一些實例中,一或多個LIC旗標可連同用於執行區塊之運動預測的運動資訊一起發信。
在一些實例中,如上文所描述,一或多個所儲存LIC旗標804a至804n可連同所儲存運動向量802a至802n包括於運動資訊候選清單800中。在運動資訊候選清單用於區塊之運動預測(且其中可適用的,照明補償)的此等實例中,可在編碼器及解碼器處單獨地建構運動資訊候選清單。可在編碼器與解碼器之間發信參考運動資訊候選清單之資訊。
舉例而言,在合併模式中,至所儲存運動資訊候選者801a至801n之索引值可自編碼器發信至解碼器(例如,在語法結構中,諸如圖像參數集(PPS)、序列參數集(SPS)、視訊參數集(VPS)、圖塊標頭、在視訊位元串流中或獨立於視訊位元串流發送的補充增強資訊(SEI)訊息,及/或其他發信)。在一些實例中,LIC旗標804a至804n亦可自編碼器發信至解碼器。解碼器可建構運動資訊候選清單,且使用所發信參考或索引自經建構之運動資訊候選清單獲得一或多個運動資訊候選者,以供用於運動預測。舉例而言,解碼裝置112可建構類似於運動資訊候選清單800之運動資訊候選清單,且將來自編索引位置之運動向量及LIC旗標用於區塊之運動預測。
在AMVP模式的狀況下,除參考或索引之外,差或殘餘值亦可經發信為增量。在一些實例中,LIC旗標804a至804n亦可在AMVP模式中自編碼器發信至解碼器。舉例而言,如先前針對AMVP模式所描述,解碼器可建構一或多個運動資訊候選清單,且將增量值應用於使用所發信索引值連同LIC資訊獲得的一或多個運動資訊候選者,其中在執行區塊之運動預測時包括LIC旗標。因此,可針對AMVP模式,在編碼器與解碼器之間發信與運動資訊候選清單中之運動資訊候選者相關的資訊,其包括與可儲存於運動資訊候選清單中之一或多個LIC旗標相關的資訊。
如將瞭解,在兩個裝置之間發信資訊可具有相關聯成本。因此,可能需要在可能的情況下改良發信效率且降低成本。在一些實例中,減少正發信之資訊中的冗餘可造成發信較少資訊及對應的成本節省。在一些實例中,切換功率可為與發信資訊相關聯之成本,其中在不同語法元素、位或符號之間頻繁切換可增大切換功率。因此,降低切換功率亦可幫助降低發信成本。在一些實例中,可使用以下技術中之一或多者來降低與發信LIC旗標(在合併模式、AMVP模式或其他預測模式中)相關聯之發信成本。
在一些實例中,可使用LIC旗標預測符改良LIC旗標之發信。在一些實例中,可使用LIC旗標預測符來預測LIC旗標具有真值抑或假值。可將自LIC旗標預測符獲得的預測值(真或假)與相關聯LIC旗標之實際值進行比較,以得到比較旗標。以此方式,可針對正發信之每一LIC旗標產生一比較旗標。在一些實例中,可發信一或多個比較旗標來代替對應一或多個LIC旗標,其中一或多個比較旗標中之每一者包括相關聯LIC旗標之值是否匹配其預測值的一指示。舉例而言,比較旗標之值「1」可指示相關聯LIC旗標之值匹配其預測值,而比較旗標之值「0」可指示相關聯LIC旗標之值不匹配其預測值。
發信比較旗標而非LIC旗標可改良發信效率。舉例而言,若LIC預測符經組態以預測高層級之準確性,則將存在LIC旗標值匹配其各別經預測值的較高發生率。此意謂可能存在具有值「1」之比較旗標正在發信的較高發生率。在此等狀況下,可使用諸如熵寫碼之壓縮技術或其他寫碼演算法有效地發信複數個重複圖案,諸如正發信的值為「1」之位的串流。因此,基於匹配LIC旗標值之預測值而發信比較旗標可造成發信效率。
在一些實例中,可使用比較旗標來發信與運動資訊候選清單800之一或多個所儲存LIC旗標804a至804n相關的資訊。舉例而言,可應用LIC旗標預測以預測所儲存LIC旗標804a至804n之值。預測可產生可與所儲存LIC旗標804a至804n之實際值進行比較的各別預測值。可基於該等比較產生對應數目個比較旗標,其中針對所儲存LIC旗標804a至804n中之每一者產生一個比較旗標。可發信比較旗標,而非發信與所儲存LIC旗標804a至804n相關的資訊。舉例而言,經編碼位元串流可自編碼裝置104發信至解碼裝置112,其中該等比較旗標可包括於該經編碼位元串流中。藉由應用熵寫碼或其他壓縮演算法,可改良與發信相關於所儲存LIC旗標804a至804n之資訊相關聯的發信效率。
在一些實例中,可使用一個或多個其他LIC旗標獲得用於LIC旗標之LIC旗標預測。舉例而言,用於視訊資料之當前區塊之LIC旗標的LIC旗標預測可基於當前區塊之對應一或多個相鄰區塊的一或多個LIC旗標。舉例而言,當前區塊之一或多個相鄰區塊可包括即時相鄰者,諸如當前區塊之左側相鄰者、頂部相鄰者、右側相鄰者或底部相鄰者。
在一些實例中,若當前區塊之相鄰者區塊中之至少一者具有被設定為第一值的相關聯LIC旗標,則用於當前區塊之LIC旗標的LIC旗標預測符亦可設定為第一值。舉例而言,若第一值為真值,則在當前區塊之即時相鄰者中之至少一者具有被設定為真值的相關聯LIC旗標的情況下,用於當前區塊之LIC旗標的LIC旗標預測值可被設定為真值。否則,用於當前區塊之LIC旗標的LIC旗標預測值可被設定為諸如假值之第二值。
在一些實例中,可判定其相關聯LIC旗標被設定為第一值的相鄰區塊之數目的計數。可藉由將此計數與預定臨限進行比較來獲得用於當前區塊之LIC旗標的LIC旗標預測。舉例而言,若第一值為真值,則可判定其相關聯LIC旗標被設定為真值的相鄰區塊之數目的計數,且可將此計數與預定臨限進行比較。舉例而言,在於當前區塊之LIC旗標預測中考慮當前區塊之四個即時相鄰區塊的狀況下,預定臨限可設定為二、三或四。相對應地,若其LIC旗標被設定為真值的相鄰區塊之數目大於或等於預定臨限,則用於當前區塊之LIC旗標的LIC旗標預測可為真值。否則,用於當前區塊之LIC旗標的LIC旗標預測值可被設定為諸如假值之第二值。
在一些實例中,可基於可用於預測當前區塊之運動資訊的運動資訊候選者判定當前區塊之LIC旗標的LIC旗標預測。舉例而言,諸如運動資訊候選清單800中之所儲存運動資訊候選者的一或多個運動資訊候選者可用於當前區塊之運動預測。如先前所提及,運動資訊候選者可包括各別所儲存LIC旗標804a至804n連同運動向量802a至802n。在此等實例(或其他實例)中,運動資訊候選者之LIC旗標被稱作候選者LIC旗標。在一些實例中,用於當前區塊之LIC旗標的LIC旗標預測符可被設定為用於當前區塊之運動預測的運動資訊候選者之候選者LIC旗標的值。舉例而言,若候選者LIC旗標為真值,則當前區塊之LIC旗標之預測值可被設定為真值。否則,若候選者LIC旗標為假值,則當前區塊之LIC旗標之預測值可被設定為假值。
在一些實例中,可使用用於LIC旗標之基於上下文之模型化的技術改良發信LIC旗標。舉例而言,當LIC旗標自編碼裝置發信至解碼裝置時,LIC旗標可經上下文寫碼,或可將其他基於上下文之模型化應用於旗標。在一些實例中,LIC旗標的基於上下文之模型化可包括將上下文指派至LIC旗標。在一些實例中,所指派上下文可用於基於上下文之寫碼及發信,而非發信LIC旗標自身。舉例而言,待發信的一或多個LIC旗標之上下文可使用上下文寫碼技術進行寫碼,諸如上下文適應性可變長度寫碼、上下文適應性二進位算術編碼、基於語法之上下文適應性二進位算術寫碼、概率區間分割熵寫碼,或另一合適的熵編碼技術。可發信使用基於上下文之寫碼技術進行寫碼的上下文來改良發信效率。
在一些實例中,可使用基於上下文之寫碼來寫碼當前區塊之LIC旗標。舉例而言,可基於當前區塊之一或多個相鄰區塊的LIC旗標值為LIC旗標指派上下文。舉例而言,當前區塊可具有四個即時相鄰區塊,諸如左側相鄰者、上方相鄰者、右側相鄰者及下方相鄰者。在一實例中,若相鄰區塊中之至少一者具有被設定為第一值之相關聯LIC旗標,則可將第一上下文指派至當前區塊之LIC旗標,否則,可將第二上下文指派至當前區塊之LIC旗標。舉例而言,若相鄰區塊中之至少一者具有被設定為真值之相關聯LIC旗標,則可將與真值相關聯之第一上下文指派至當前區塊之LIC旗標,否則,可將與假值相關聯之第二上下文指派至當前區塊之LIC旗標。
在一些實例中,可判定其相關聯LIC旗標具有第一值的相鄰區塊之數目的計數。可將該計數與預定義臨限進行比較,且用於當前區塊之LIC旗標的上下文可係基於該比較。舉例而言,若該計數超過預定義臨限,則可將第一上下文指派至當前區塊之LIC旗標,否則,可將第二上下文指派至當前區塊之LIC旗標。
在一些實例中,可基於當前區塊之大小為當前區塊之LIC旗標指派上下文。舉例而言,可基於一或多個尺寸判定當前區塊之大小,諸如當前區塊之寬度、當前區塊之高度、等於寬度乘以高度的當前區塊之面積,或其他者。在一些實例中,若當前區塊之面積小於或等於預定義值,則可將第一上下文指派至LIC旗標,或若當前區塊之面積大於預定義值,則可將第二上下文指派至LIC旗標。舉例而言,預定義值可包括臨限值N,其中N可被設定為諸如32之值或另一值。
圖9為說明藉由使用運動資訊候選清單解碼視訊資料之程序900之實例的流程圖。在區塊902,程序900包括獲得包括視訊資料之經編碼視訊位元串流。在一些實例中,視訊資料可包括經編碼視訊資料(例如,經編碼視訊位元串流中),諸如當程序900藉由解碼裝置執行時。視訊資料可包括複數個圖像,且該等圖像可劃分成複數個區塊,如先前所描述。視訊資料亦可包括用於圖像及/或區塊之運動資訊,其可用以執行運動補償。
在904,程序900包括判定與視訊資料之區塊相關聯之運動資訊,該運動資訊包含至少運動向量及照明補償旗標。舉例而言,圖8之潛在運動資訊候選者810可包括與視訊資料之區塊相關聯之運動資訊,其中該潛在運動資訊候選者810包括運動向量812及LIC旗標814。
在906,程序900包括將運動資訊與運動資訊候選清單中之所儲存運動資訊進行比較,該所儲存運動資訊包含所儲存運動向量及所儲存照明補償旗標。舉例而言,運動資訊候選清單800可包括一或多個所儲存運動向量802a至802n連同相關聯所儲存LIC旗標804a至804n,如先前所論述。將潛在運動資訊候選者810添加至運動資訊候選清單800可經受刪剪。在刪剪程序之實例實施中,可將潛在運動資訊候選者810與運動資訊候選清單800中之所儲存運動資訊進行比較。舉例而言,一或多個所儲存運動向量802a至802n可包括具有相關聯所儲存LIC旗標804k之所儲存運動向量802k。在一些實例中,比較程序可包括將包括於潛在運動資訊候選者810中之運動資訊與包括具有相關聯所儲存LIC旗標804k之所儲存運動向量802k的所儲存運動資訊進行比較。
在908,程序900包括判定運動向量匹配所儲存運動向量。舉例而言,潛在運動資訊候選者810可在其運動向量812匹配所儲存運動向量802k的情況下經刪剪。在潛在運動資訊候選者810可經刪剪的實例中,運動向量812可經判定以匹配所儲存運動向量802k。
在910,程序900包括基於照明補償旗標之值及所儲存照明補償旗標之值判定是否更新所儲存照明補償旗標。舉例而言,更新運動資訊候選清單800中之所儲存LIC旗標804k可基於所儲存LIC旗標804k之值及潛在運動資訊候選者810之LIC旗標814的值。
在一些實例中,更新所儲存照明補償旗標可包括:若照明補償旗標之值為第一值且所儲存照明補償旗標之值為一第二值,則將所儲存照明旗標更新為第一值。舉例而言,其中第一值為真值且第二值為假值,所儲存LIC旗標804k可在LIC旗標814之值為真值的情況下自先前所儲存假值更新為真值。類似地,其中第一值為假值且第二值為真值,所儲存LIC旗標804k可在LIC旗標814之值為假值的情況下自先前所儲存真值更新為假值。
在一些實例中,若照明補償旗標之值為第一值且所儲存照明補償旗標之值為第一值,則所儲存照明旗標不更新。舉例而言,若所儲存LIC旗標804k之值與潛在運動資訊候選者810中之LIC旗標814的值相同,則運動資訊候選清單800中之所儲存LIC旗標804k不更新。舉例而言,在第一值為真值的情況下,若所儲存LIC旗標804k之值為真值且LIC旗標814為真值,則運動資訊候選清單800中之所儲存LIC旗標804k不更新。類似地,在第一值為假值的情況下,若所儲存LIC旗標804k之值為假值且LIC旗標814為假值,則運動資訊候選清單800中之所儲存LIC旗標804k不更新。
在一些實例中,判定是否將照明補償應用於區塊可基於所儲存照明補償旗標之值,其中若所儲存照明補償旗標之值為真值,則將應用照明補償,且若所儲存照明補償旗標之值為假值,則將不應用照明補償。舉例而言,若所儲存LIC旗標804k之值(如上文所論述的,基於經更新或未更新)為真值,則可將照明補償應用於區塊,否則,照明補償可能不會應用於區塊。
在一些實例中,將照明補償應用於區塊可包括使用區塊之一或多個相鄰區塊及用於區塊之框間預測的參考區塊之一或多個相鄰區塊導出用於區塊的一或多個照明補償參數。舉例而言,如先前所解釋,明度值(樣本之明度值,或像素)可以線性形式在框間預測中進行補償,a *p +b ,其中p 為框間預測中之樣本,a 為按比例調整因數,且b 為偏移。按比例調整因數a 及偏移b 為可使用當前區塊之相鄰樣本及參考區塊之相鄰樣本導出的參數(例如,如圖5A及圖5B中所展示)。在一些實例中,當前區塊之一或多個相鄰區塊可包括當前區塊之頂部相鄰區塊或左側相鄰區塊中的一或多者,且參考區塊之一或多個相鄰區塊可包括參考區塊之頂部相鄰區塊或左側相鄰區塊中的一或多者。
圖10為說明使用運動資訊候選清單編碼視訊資料之程序1000之實例的流程圖。在區塊1002,程序1000包括獲得視訊資料之圖像之當前區塊。視訊資料可包括未經編碼視訊資料。視訊資料可包括複數個圖像,且該等圖像可劃分成複數個區塊,如先前所描述。程序1000可判定用於圖像及/或區塊之運動資訊,其可用以執行運動補償,
在1004,程序1000包括判定與視訊資料之區塊相關聯之運動資訊,該運動資訊包含至少運動向量及照明補償旗標。舉例而言,圖8之潛在運動資訊候選者810可包括與視訊資料之區塊相關聯之運動資訊,其中該潛在運動資訊候選者810包括運動向量812及LIC旗標814。
在1006,程序1000包括將運動資訊與運動資訊候選清單中之所儲存運動資訊進行比較,該所儲存運動資訊包含所儲存運動向量及所儲存照明補償旗標。舉例而言,運動資訊候選清單800可包括一或多個所儲存運動向量802a至802n連同相關聯所儲存LIC旗標804a至804n,如先前所論述。將潛在運動資訊候選者810添加至運動資訊候選清單800可經受刪剪。在刪剪程序之實例實施中,可將潛在運動資訊候選者810與運動資訊候選清單800中之所儲存運動資訊進行比較。舉例而言,一或多個所儲存運動向量802a至802n可包括具有相關聯所儲存LIC旗標804k之所儲存運動向量802k。在一些實例中,比較程序可包括將包括於潛在運動資訊候選者810中之運動資訊與包括具有相關聯所儲存LIC旗標804k之所儲存運動向量802k的所儲存運動資訊進行比較。
在1008,程序1000包括判定運動向量匹配所儲存運動向量。舉例而言,潛在運動資訊候選者810可在其運動向量812匹配所儲存運動向量802k的情況下經刪剪。在潛在運動資訊候選者810可經刪剪的實例中,運動向量812可經判定以匹配所儲存運動向量802k。
在1010,程序1000包括基於照明補償旗標之值及所儲存照明補償旗標之值判定是否更新所儲存照明補償旗標。舉例而言,更新運動資訊候選清單800中之所儲存LIC旗標804k可基於所儲存LIC旗標804k之值及潛在運動資訊候選者810之LIC旗標814的值。
在一些實例中,更新所儲存照明補償旗標可包括:若照明補償旗標之值為第一值且所儲存照明補償旗標之值為一第二值,則將所儲存照明旗標更新為第一值。舉例而言,其中第一值為真值且第二值為假值,所儲存LIC旗標804k可在LIC旗標814之值為真值的情況下自先前所儲存假值更新為真值。類似地,其中第一值為假值且第二值為真值,所儲存LIC旗標804k可在LIC旗標814之值為假值的情況下自先前所儲存真值更新為假值。
在一些實例中,若照明補償旗標之值為第一值且所儲存照明補償旗標之值為第一值,則所儲存照明旗標不更新。舉例而言,若所儲存LIC旗標804k之值與潛在運動資訊候選者810中之LIC旗標814的值相同,則運動資訊候選清單800中之所儲存LIC旗標804k不更新。舉例而言,在第一值為真值的情況下,若所儲存LIC旗標804k之值為真值且LIC旗標814為真值,則運動資訊候選清單800中之所儲存LIC旗標804k不更新。類似地,在第一值為假值的情況下,若所儲存LIC旗標804k之值為假值且LIC旗標814為假值,則運動資訊候選清單800中之所儲存LIC旗標804k不更新。
在1012,程序1000包括產生包括至少所儲存運動資訊之經編碼視訊位元串流。舉例而言,圖11之編碼裝置104可產生且發信包括所儲存運動資訊之經編碼視訊位元串流。在一些實例中,可使用上文所描述的用於改良發信效率之一或多種技術改良發信經編碼視訊位元串流。
舉例而言,可使用LIC旗標預測符改良諸如一或多個所儲存LIC旗標804a至804n之LIC旗標的發信。在一些實例中,可判定用於諸如所儲存LIC旗標804k之所儲存照明補償旗標的預測值,且可將預測值與所儲存LIC旗標804k之值進行比較。可基於該比較產生比較旗標,其中該比較旗標在預測值匹配照明補償旗標之值的情況下被設定為第一值,或在預測值不匹配照明補償旗標之值的情況下被設定為第二值。在一些實例中,可基於該比較旗標產生經編碼視訊位元串流。舉例而言,可使用用於運動資訊候選清單800之一或多個所儲存LIC旗標804a至804n的類似程序產生一或多個比較旗標,且該等比較旗標可替換經編碼位元串流中之所儲存LIC旗標804a至804n。藉由應用熵寫碼或其他壓縮演算法,可改良與發信所儲存LIC旗標804a至804n相關聯的發信效率。
在一些實施中,本文中所描述的程序(或方法)可藉由計算裝置或設備(諸如圖1中展示之系統100)執行。舉例而言,程序可藉由圖1及圖11中展示之編碼裝置104、藉由另一視訊源側裝置或視訊傳輸裝置、藉由圖1及圖12中展示之解碼裝置112及/或藉由另一用戶端側裝置(諸如播放器裝置、顯示器或任何其他用戶端側裝置)執行。在一些情況下,計算裝置或設備可包括處理器、微處理器、微電腦,或經組態以實施本文中所描述的程序之步驟的裝置之其他組件。在一些實例中,計算裝置或設備可包括經組態以捕捉包括視訊圖框之視訊資料(例如,視訊序列)的攝影機。在一些實例中,捕捉視訊資料之攝影機或其他捕捉裝置與計算裝置分離,在此情況下,計算裝置接收或獲得所捕捉視訊資料。計算裝置可進一步包括經組態以傳達視訊資料之網路界面。網路界面可經組態以傳達基於網際網路協定(IP)之資料或其他類型之資料。在一些實例中,計算裝置或設備可包括用於顯示輸出視訊內容(諸如,視訊位元串流之圖像的樣本)之顯示器。
程序可關於邏輯流程圖描述,其操作表示可在硬體、電腦指令或其組合中實施的操作之序列。在電腦指令之上下文中,操作表示儲存於一或多個電腦可讀儲存媒體上之當藉由一或多個處理器執行時執行所敍述之操作的電腦可執行指令。通常,電腦可執行指令包括執行特定功能或實施特定資料類型之例程、程序、對象、組件、邏輯、資料結構及其類似者。描述操作之次序並不意欲被理解為限制,且任何數目個經描述操作可按任何次序及/或與實施程序並行地組合。
另外,程序可在經組態有可執行指令之一或多個電腦系統之控制下執行,且可被實施為共同在一或多個處理器上實行之程式碼(例如,可執行指令、一或多個電腦程序或一或多個應用程序)、藉由硬體實施或其組合。如上文所提及,程式碼可儲存於電腦可讀或機器可讀儲存媒體上,例如,呈包含可由一或多個處理器執行之複數個指令之電腦程序的形式。電腦可讀或機器可讀儲存媒體可為非暫時性的。
本文中所論述之寫碼技術可實施於實例視訊編碼及解碼系統(例如,系統100)中。在一些實例中,系統包括提供稍後由目的地裝置解碼之經編碼視訊資料的源裝置。詳言之,源裝置經由電腦可讀媒體提供視訊資料至目的地裝置。源裝置及目的地裝置可包含廣泛範圍之裝置中的任一者,包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板電腦、機上盒、電話手機(諸如,所謂「智能型」電話)、所謂「智能型」平板、電視、攝影機、顯示裝置、數位媒體播放器、視訊遊戲控制台、視訊串流裝置或其類似者。在一些狀況下,源裝置及目的地裝置可經裝備以用於無線通信。
目的地裝置可經由電腦可讀媒體接收待解碼之經編碼視訊資料。電腦可讀媒體可包含能夠將經編碼視訊資料自源裝置移動至目的地裝置的任何類型之媒體或裝置。在一個實例中,電腦可讀媒體可包含通信媒體以使得源裝置能夠即時地將經編碼視訊資料直接傳輸至目的地裝置。可根據通信標準(諸如,無線通信協定)調變經編碼視訊資料,且將經編碼視訊資料傳輸至目的地裝置。通信媒體可包含任何無線或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全局網路)之部分。通信媒體可包括路由器、交換器、基地台或可用於促進自源裝置至目的地裝置之通信的任何其他裝備。
在一些實例中,經編碼資料可自輸出界面輸出至儲存裝置。類似地,可藉由輸入界面自儲存裝置存取經編碼資料。儲存裝置可包括多種分佈式或本機存取式資料儲存媒體中之任一者,諸如,硬盤機、藍光光盤、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體或用於儲存經編碼視訊資料之任何其他適合數位儲存媒體。在另一實例中,儲存裝置可對應於檔案服務器或可儲存由源裝置產生之經編碼視訊的另一中間儲存裝置。目的地裝置可經由串流傳輸或下載自儲存裝置存取所儲存之視訊資料。檔案服務器可為能夠儲存經編碼視訊資料且將彼經編碼視訊資料傳輸至目的地裝置的任何類型之服務器。實例檔案服務器包括網頁服務器(例如,用於網站)、FTP服務器、網路附加儲存(NAS)裝置或本端磁盤機。目的地裝置可經由任何標準資料連接(包括網際網路連接)來存取經編碼視訊資料。此可包括無線通道(例如,Wi-Fi連接)、有線連接(例如,DSL、電纜數據機等)或適合於存取儲存於檔案服務器上之經編碼視訊資料的兩者之一組合。自儲存裝置的經編碼視訊資料之傳輸可為串流傳輸、下載傳輸或其組合。
本發明之技術不必限於無線應用或設定。該等技術可應用於支援多種多媒體應用中之任一者的視訊寫碼,諸如,空中電視廣播、有線電視傳輸、衛星電視傳輸、網際網路串流視訊傳輸(諸如,經由HTTP動態自適應串流(DASH))、經編碼至資料儲存媒體上之數位視訊、儲存於資料儲存媒體上的數位視訊之解碼或其他應用。在一些實例中,系統可經組態以支援單向或雙向視訊傳輸從而支持諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。
在一個實例中,源裝置包括視訊源、視訊編碼器及輸出界面。目的地裝置可包括輸入接口、視訊解碼器及顯示裝置。源裝置之視訊編碼器可經組態以應用本文中所揭示之技術。在其他實例中,源裝置及目的地裝置可包括其他組件或配置。舉例而言,源裝置可自外部視訊源(諸如,外部攝影機)接收視訊資料。同樣,目的地裝置可與外部顯示裝置介接,而非包括整合式顯示裝置。
以上實例系統僅為一個實例。用於平行地處理視訊資料之技術可由任何數位視訊編碼及/或解碼裝置來執行。儘管本發明之技術通常由視訊編碼裝置執行,但該等技術亦可由視訊編碼器/解碼器(通常被稱為「CODEC」)執行。此外,本發明之技術亦可由視訊預處理器執行。源裝置及目的地裝置僅為源裝置產生經寫碼視訊資料以供傳輸至目的地裝置之此類寫碼裝置的實例。在一些實例中,源裝置及目的地裝置可以大體上對稱之方式操作,使得該等裝置中之每一者包括視訊編碼及解碼組件。因此,實例系統可支持視訊裝置之間的單向或雙向視訊傳輸,例如用於視訊串流、視訊播放、視訊廣播或視訊電話。
視訊源可包括視訊捕捉裝置,諸如視訊攝影機、含有先前捕捉之視訊的視訊存檔及/或用以自視訊內容提供者接收視訊之視訊饋入接口。作為另一替代方案,視訊源可產生基於電腦圖形之資料作為源視訊,或實時視訊、存檔視訊及電腦產生之視訊的組合。在一些狀況下,若視訊源為視訊攝影機,則源裝置及目的地裝置可形成所謂的攝影機電話或視訊電話。然而,如上文所提及,本發明所描述之技術一般可適用於視訊寫碼,且可適用於無線及/或有線應用。在每一狀況下,可由視訊編碼器編碼所捕捉、經預捕捉或電腦產生之視訊。經編碼視訊資訊接著可由輸出界面輸出至電腦可讀媒體上。
如所提到,電腦可讀媒體可包括暫時性媒體,諸如無線廣播或有線網路傳輸;或儲存媒體(亦即,非暫時性儲存媒體),諸如硬盤、隨身碟、緊密光盤、數位視訊光盤、藍光光盤或其他電腦可讀媒體。在一些實例中,網路服務器(圖中未示)可自源裝置接收經編碼視訊資料,且(例如)經由網路傳輸將經編碼視訊資料提供至目的地裝置。類似地,媒體生產設施(諸如,光盤衝壓設施)之計算裝置可自源裝置接收經編碼視訊資料且生產含有經編碼視訊資料之光盤。因此,在各種實例中,電腦可讀媒體可理解為包括各種形式之一或多個電腦可讀媒體。
目的地裝置之輸入接口自電腦可讀媒體接收資訊。電腦可讀媒體之資訊可包括由視訊編碼器定義之語法資訊(其亦由視訊解碼器使用),該語法資訊包括描述區塊及其他經寫碼單元(例如,圖片群組(GOP))之特性及/或處理的語法元素。顯示裝置將經解碼視訊資料顯示給使用者,且可包含多種顯示裝置中之任一者,諸如陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示裝置。已描述本申請案之各種實施例。
編碼裝置104及解碼裝置112之特定細節分別展示於圖11及圖12中。圖11為說明可實施本發明中所描述之技術中之一或多者的實例編碼裝置104之方塊圖。編碼裝置104可(例如)產生本文中所描述之語法結構(例如,VPS、SPS、PPS或其他語法元素之語法結構)。編碼裝置104可執行視訊圖塊內之視訊區塊的框內預測及框間預測寫碼。如先前所描述,框內寫碼至少部分地依賴於空間預測以減少或移除給定視訊圖框或圖像內之空間冗餘。框間寫碼至少部分地依賴於時間預測以減少或移除視訊序列之鄰近或周圍圖框內的時間冗餘。框內模式(I模式)可指若干以空間為基礎之壓縮模式中的任一者。框間模式(諸如,單向預測(P模式)或雙向預測(B模式))可指若干基於時間之壓縮模式中的任一者。
編碼裝置104包括分割單元35、預測處理單元41、濾波器單元63、圖像記憶體64、求和器50、變換處理單元52、量化單元54及熵編碼單元56。預測處理單元41包括運動估計單元42、運動補償單元44及框內預測處理單元46。對於視訊區塊重建構,編碼裝置104亦包括反量化單元58、反變換處理單元60及求和器62。濾波器單元63意欲表示一或多個迴路濾波器,諸如解區塊濾波器、自適應性迴路濾波器(ALF)及樣本自適應性偏移(SAO)濾波器。儘管濾波器單元63在圖11中展示為迴路濾波器,但在其他組態中,濾波器單元63可實施為迴路後濾波器。後處理裝置57可對由編碼裝置104產生之經編碼視訊資料執行額外處理。在一些情況下,本發明之技術可藉由編碼裝置104實施。然而,在其他情況下,本發明之技術中的一或多者可藉由後處理裝置57實施。
如圖11中所展示,編碼裝置104接收視訊資料,且分割單元35將資料分割成視訊區塊。分割亦可包括分割成圖塊、圖塊區段、影像塊或其他較大單元以及(例如)根據LCU及CU之四分樹結構的視訊區塊分割。編碼裝置104通常說明編碼待編碼之視訊圖塊內的視訊區塊之組件。可將圖塊劃分成多個視訊區塊(且可能劃分成被稱作圖像塊之視訊區塊集合)。預測處理單元41可基於誤差結果(例如,寫碼速率及失真等級,或其類似者)選擇複數個可能寫碼模式中之一者(諸如,複數個框內預測寫碼模式中之一者或複數個框間預測寫碼模式中之一者)以用於當前視訊區塊。預測處理單元41可將所得經框內或框間寫碼區塊提供至求和器50以產生殘餘區塊資料,並提供至求和器62以重建構經編碼區塊以用於用作參考圖像。
預測處理單元41內之框內預測處理單元46可執行當前視訊區塊相對於與待寫碼的當前區塊相同之圖框或圖塊中的一或多個相鄰區塊之框內預測寫碼以提供空間壓縮。預測處理單元41內之運動估計單元42及運動補償單元44執行當前視訊區塊相對於一或多個參考圖像中之一或多個預測性區塊之框間預測性寫碼以提供時間壓縮。
運動估計單元42可經組態以根據視訊序列之預定圖案來判定用於視訊圖塊之框間預測模式。預定圖案可將序列中之視訊圖塊指定為P圖塊、B圖塊或GPB圖塊。運動估計單元42及運動補償單元44可高度整合,但為概念目的而分別說明。由運動估計單元42執行之運動估計為產生運動向量之程序,該等運動向量估計視訊區塊之運動。運動向量(例如)可指示當前視訊圖框或圖像內之視訊區塊的預測單元(PU)相對於參考圖像內之預測性區塊的移位。
預測性區塊為就像素差而言被發現緊密地匹配待寫碼的視訊區塊之PU之區塊,該像素差可由絕對差和(SAD)、平方差和(SSD)或其他差度量判定。在一些實例中,編碼裝置104可計算儲存於圖像記憶體64中之參考圖像的次整數像素位置的值。舉例而言,編碼裝置104可內插參考圖像之四分之一像素位置、八分之一像素位置或其他分數像素位置之值。因此,運動估計單元42可執行關於全像素位置及分數像素位置之運動搜尋且輸出具有分數像素精確度之運動向量。
運動估計單元42藉由比較PU之位置與參考圖像的預測性區塊之位置而計算經框間寫碼圖塊中的視訊區塊之PU之運動向量。參考圖像可選自第一參考圖像清單(清單0)或第二參考圖像清單(清單1),該等清單中之每一者識別儲存於參考圖像記憶體64中之一或多個參考圖像。運動估計單元42將所計算之運動向量發送至熵編碼單元56及運動補償單元44。
由運動補償單元44執行之運動補償可涉及基於由運動估計(可能執行內插至子像素精確密度)判定之運動向量而提取或產生預測性區塊。在接收到當前視訊區塊之PU的運動向量之後,運動補償單元44可在一參考圖像清單中找到運動向量所指向之預測性區塊的位置。編碼裝置104藉由自正經寫碼之當前視訊區塊之像素值減去預測性區塊之像素值從而形成像素差值來形成殘餘視訊區塊。像素差形成用於區塊之殘餘資料,且可包括明度及色度差分量兩者。求和器50表示執行此減法運算之一或多個組件。運動補償單元44亦可產生與視訊區塊及視訊圖塊相關聯之語法元素,以供解碼裝置112用於解碼視訊圖塊之視訊區塊。
如上文所描述,作為由運動估計單元42及運動補償單元44所執行之框間預測的替代例,框內預測處理單元46可對當前區塊進行框內預測。特定而言,框內預測處理單元46可判定框內預測模式以用以編碼當前區塊。在一些實例中,框內預測處理單元46可(例如)在單獨編碼遍次期間使用各種框內預測模式編碼當前區塊,且框內預測處理單元46可自經測試模式中選擇適當框內預測模式來使用。舉例而言,框內預測處理單元46可使用對各種所測試框內預測模式之速率-失真分析來計算速率-失真值,且可在所測試模式間選擇具有最佳速率-失真特性之框內預測模式。速率-失真分析大體上判定經編碼區塊與原始未經編碼區塊(其經編碼以產生經編碼區塊)之間的失真(或誤差)量,以及用以產生經編碼區塊之比特率(亦即,位之數目)。框內預測處理單元46可自各種經編碼區塊之失真及速率計算比率以判定哪一框內預測模式展現區塊之最好速率-失真值。
在任何情況下,在選擇用於區塊之框內預測模式後,框內預測處理單元46可將指示用於區塊之所選框內預測模式的資訊提供至熵編碼單元56。熵編碼單元56可編碼指示所選框內預測模式之資訊。編碼裝置104可將各種區塊之編碼上下文之定義以及待用於上下文中之每一者的最可能的框內預測模式、框內預測模式索引表及經修改框內預測模式索引表之指示包括於經傳輸位元串流組態資料中。位元串流組態資料可包括複數個框內預測模式索引表及複數個經修改框內預測模式索引表(亦被稱作碼字映射表)。
在預測處理單元41經由框間預測或框內預測產生當前視訊區塊之預測性區塊之後,編碼裝置104藉由自當前視訊區塊減去預測性區塊而形成殘餘視訊區塊。殘餘區塊中之殘餘視訊資料可包括於一或多個TU中且被應用於變換處理單元52。變換處理單元52使用諸如離散餘弦變換(DCT)或概念上類似變換之變換將殘餘視訊資料變換成殘餘變換係數。變換處理單元52可將殘餘視訊資料自像素域轉換至變換域(諸如,頻域)。
變換處理單元52可將所得變換係數發送至量化單元54。量化單元54對變換係數進行量化以進一步降低比特率。量化處理過程可減小與該等係數中之一些或全部相關聯的位深度。可藉由調整量化參數來修改量化程度。在一些實例中,量化單元54可接著執行對包括經量化變換係數之矩陣的掃描。替代性地,熵編碼單元56可執行掃描。
在量化之後,熵編碼單元56對經量化變換係數進行熵編碼。舉例而言,熵編碼單元56可執行上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、基於語法之上下文自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼技術。在由熵編碼單元56進行熵編碼之後,經編碼位元串流可傳輸至解碼裝置112,或經存檔以供稍後由解碼裝置112傳輸或擷取。熵編碼單元56亦可熵編碼正經寫碼之當前視訊圖塊的運動向量及其他語法元素。
反量化單元58及反變換處理單元60分別應用反量化及反變換以重建構像素域中之殘餘區塊,以供稍後用作參考圖像之參考區塊。運動補償單元44可藉由將殘餘區塊添加至參考圖像清單內之參考圖像中之一者的預測性區塊來計算參考區塊。運動補償單元44亦可將一或多個內插濾波器應用至經重建構殘餘區塊,以計算子整數像素值以用於運動估計中。求和器62將經重建構殘餘區塊添加至由運動補償單元44產生之運動補償預測區塊以產生用於儲存於圖像記憶體64中之參考區塊。參考區塊可由運動估計單元42及運動補償單元44用作參考區塊以框間預測後續視訊圖框或圖像中之區塊。
以此方式,圖11之編碼裝置104表示經組態以執行本文中描述之技術中之任一者的視訊編碼器之實例,包括上文關於圖9及/或圖10所描述之技術。在一些情況下,本發明之技術中之一些亦可藉由後處理裝置57實施。
圖12為說明實例解碼裝置112之方塊圖。解碼裝置112包括熵解碼單元80、預測處理單元81、反量化單元86、反變換處理單元88、求和器90、濾波器單元91及圖像記憶體92。預測處理單元81包括運動補償單元82及框內預測處理單元84。在一些實例中,解碼裝置112可執行大體上與關於來自圖12之編碼裝置104描述的編碼遍次互逆的解碼遍次。
在解碼程序期間,解碼裝置112接收表示由編碼裝置104發送之經編碼視訊圖塊之視訊區塊及相關聯語法元素的經編碼視訊位元串流。在一些實施例中,解碼裝置112可自編碼裝置104接收經編碼視訊位元串流。在一些實施例中,解碼裝置112可自網路實體79 (諸如,服務器、媒體感知網路組件(MANE)、視訊編輯器/編接器(splicer)或經組態以實施上文所描述之技術中之一或多者的其他此類裝置)接收經編碼視訊位元串流。網路實體79可或可不包括編碼裝置104。在網路實體79將經編碼視訊位元串流傳輸至解碼裝置112之前,本發明中所描述之技術中的一些可由網路實體79實施。在一些視訊解碼系統中,網路實體79及解碼裝置112可為獨立裝置之部分,而在其他情況下,關於網路實體79描述之功能性可由包含解碼裝置112之同一裝置執行。
解碼裝置112之熵解碼單元80對位元串流進行熵解碼以產生經量化係數、運動向量及其他語法元素。熵解碼單元80將運動向量及其他語法元素轉遞至預測處理單元81。解碼裝置112可接收以視訊圖塊層級及/或視訊區塊層級接的收語法元素。熵解碼單元80可處理並剖析諸如VPS、SPS及PPS之一或多個參數集中之固定長度語法元素及可變長度語法元素兩者。
當視訊圖塊被寫碼為經框內寫碼(I)圖塊時,預測處理單元81之框內預測處理單元84可基於經發信框內預測模式及來自當前圖框或圖像之先前經解碼區塊的資料而產生當前視訊圖塊之視訊區塊的預測資料。當視訊圖框經寫碼為經框間寫碼圖塊(亦即,B圖塊、P圖塊或GPB圖塊)時,預測處理單元81之運動補償單元82基於自熵解碼單元80接收之運動向量及其他語法元素產生用於當前視訊圖塊之視訊區塊的預測性區塊。可自參考圖像清單內的參考圖像中之一者產生預測性區塊。解碼裝置112可基於儲存於圖像記憶體92中之參考圖像使用預設建構技術來建構參考圖框清單,清單0及清單1。
運動補償單元82藉由剖析運動向量及其他語法元素來判定當前視訊圖塊之視訊區塊的預測資訊,且使用該預測資訊產生用於正經解碼之當前視訊區塊之預測性區塊。舉例而言,運動補償單元82可使用參數集中之一或多個語法元素來判定用於寫碼視訊圖塊之視訊區塊之預測模式(例如,框內預測或框間預測)、框間預測圖塊類型(例如,B圖塊、P圖塊或GPB圖塊)、圖塊之一或多個參考圖像清單之建構資訊、圖塊之每一經框間編碼視訊區塊之運動向量、圖塊之每一經框間寫碼視訊區塊之框間預測狀態,及用以解碼當前視訊圖塊中之視訊區塊的其他資訊。
運動補償單元82亦可執行基於內插濾波器之內插。運動補償單元82可使用如在編碼視訊區塊期間由編碼裝置104使用的內插濾波器來計算參考區塊之子整數像素的內插值。在此狀況下,運動補償單元82可自所接收語法元素判定由編碼裝置104使用之內插濾波器,且可使用內插濾波器來產生預測性區塊。
反量化單元86反量化或解量化位元串流中所提供且由熵解碼單元80解碼之經量化變換係數。反量化程序可包括使用由編碼裝置104針對視訊圖塊中之每一視訊區塊計算的量化參數來判定量化程度及同樣應應用之反量化程度。反變換處理單元88將反變換(例如,反DCT或其他合適的反變換)、反整數變換或概念上類似的反變換過程應用於變換係數以便在像素域中產生殘餘區塊。
在運動補償單元82基於運動向量及其他語法元素而產生當前視訊區塊之預測性區塊之後,解碼裝置112藉由將來自反變換處理單元88之殘餘區塊與由運動補償單元82產生之對應預測性區塊求和而形成經解碼視訊區塊。求和器90表示執行此求和運算之一或多個組件。若需要,亦可使用迴路濾波器(在寫碼迴路中或在寫碼迴路後)以使像素轉變平滑,或以其他方式改良視訊品質。濾波器單元91既定表示一或多個迴路濾波器,諸如解區塊濾波器、自適應性迴路濾波器(ALF)及樣本自適應偏移(SAO)濾波器。儘管濾波器單元91在圖12中展示為迴路濾波器,但在其他組態中,濾波器單元91可實施為後迴路濾波器。給定圖框或圖像中之經解碼視訊區塊隨後儲存於圖像記憶體92中,該圖像記憶體儲存用於後續運動補償之參考圖像。圖像記憶體92亦儲存經解碼視訊以供稍後呈現於顯示裝置(諸如,圖1中所展示之視訊目的地裝置122)上。
以此方式,圖12之解碼裝置112表示經組態以執行本文中描述之技術中之任一者的視訊解碼器之實例,包括上文關於圖9及/或圖10所描述之程序。
如本文所用,術語「電腦可讀媒體」包括(但不限於)攜帶型或非攜帶型儲存裝置、光儲存裝置及能夠儲存、含有或攜載指令及/或資料的各種其他媒體。電腦可讀媒體可包括非暫時性媒體,其中可儲存資料並且不包括載波及/或無線地或經由有線連接傳播之暫時電子信號。非暫時性媒體之實例可包括(但不限於)磁盤或磁帶、諸如緊密光盤(CD)或數位化通用光盤(DVD)之光學儲存媒體、快閃記憶體、記憶體或記憶體裝置。電腦可讀媒體可具有儲存於其上之程式碼及/或機器可執行指令,該等程式碼及/或機器可執行指令可表示程序、函數、子程式、程式、常式、次常式、模組、軟體套件、類別,或指令、資料結構或程式語句之任何組合。一個碼段可藉由傳遞及/或接收資訊、資料、論證、參數或記憶體內容耦接至另一碼段或硬體電路。資訊、論證、參數、資料等可經由包括記憶體共享、訊息傳遞、符記傳遞、網路傳輸或其類似者的任何合適的方式傳遞、轉發或傳輸。
在一些實施例中,電腦可讀儲存裝置、媒體及記憶體可包括含有位元串流及類似者之纜線或無線信號。然而,當提及時,非暫時性電腦可讀儲存媒體明確地排除諸如能量、載波信號、電磁波及信號本身之媒體。
在以上描述中提供特定細節從而提供本文提供之實施例及實例的透徹理解。然而,一般技術者應瞭解,實施例可在無需此等特定細節之情況下實踐。為了解釋之清楚起見,在一些情況下,本發明技術可呈現為包括個別功能區塊,其包括包含軟體或硬體及軟體之組合中所體現的裝置、裝置組件、方法中之步驟或例程的功能區塊。除諸圖中展示及/或本文中所描述的彼等組件以外,可使用額外組件。舉例而言,電路、系統、網路、程序及其他組件可以方塊圖形式展示為組件以免以不必要的細節混淆實施例。在其他情況下,可在無不必要細節之情況下展示熟知電路、程序、演算法、結構及技術以便避免混淆實施例。
個別實施例可在上文描述為描繪為流程圖(flowchart, a flow diagram)、資料流程圖、結構圖或方塊圖的程序或方法。儘管流程圖可能將操作描述為順序程序,但許多操作可並行地或同時加以執行。另外,可重新配置操作之次序。程序在其操作完成時終止,但可具有不包括於圖中之額外步驟。程序可對應於方法、函數、程序、次常式、次程式等。當程序對應於函數時,其終止可對應於函數傳回至呼叫函數或主函數。
可使用儲存或以其他方式可自電腦可讀媒體獲得的電腦可執行指令實施根據上文所描述之實例的程序及方法。此等指令可包括(例如)導致或以其他方式組態通用電腦、專用電腦或處理裝置以執行某一功能或功能群組之指令及資料。可經由網路存取所使用的電腦資源之部分。電腦可執行指令可為(例如)二進位中間格式指令,諸如,組合語言、韌體、原始程式碼等。可用於儲存指令、所使用資訊及/或根據所描述實例之方法期間所產生的資訊之電腦可讀媒體的實例包括磁盤或光盤、快閃記憶體、具備非揮發性記憶體之USB裝置、網路連接儲存裝置等等。
實施根據此等揭示內容之程序及方法的裝置可包括硬體、軟體、韌體、中間軟體、微碼、硬體描述語言或其任何組合,且可採取多種外觀尺寸中之任一者。當以軟體、韌體、中間軟體或微碼實施時,用以執行必要任務之程式碼或碼段(例如,電腦程序產品)可儲存於電腦可讀或機器可讀媒體中。處理器可執行必要任務。外觀尺寸之典型實例包括膝上型電腦、智能型手機、行動電話、平板電腦裝置或其他小外觀尺寸個人電腦、個人數位助理、機架式裝置、獨立式裝置等。本文中所描述之功能性亦可體現於周邊裝置或附加卡。作為進一步之實例,此功能性亦可實施於不同芯片或執行於單一裝置中之不同程序中的電路板上。
該等指令、用於輸送此等指令之媒體、用於實行此等媒體之計算資源,及用於支持此等計算資源之其他結構為用於提供本發明中所描述之功能的實例構件。
在前述描述中,參考其特定實施例描述申請案之態樣,但熟習此項技術者將認識到本申請案不限於此。因此,儘管本文中已詳細描述申請案之說明性實施例,但應理解,本發明概念可以其他方式不同地體現並使用,且所附申請專利範圍意欲解釋為包括除先前技術所限制外的此等變化。上文所描述之申請案之各種特徵及態樣可個別地或聯合地使用。此外,實施例可用於超出本文中所描述之彼等環境及應用的任何數目個環境及應用,而不背離本說明書之更廣精神及範疇。因此,本說明書及圖式被視為說明性而非限定性。出於說明之目的,以特定次序描述方法。應瞭解,在替代實施例中,可以與所描述之次序不同之次序來執行該等方法。
一般技術者將瞭解,在不脫離本說明書之範疇之情況下,本文中所使用之小於(「<」)及大於(「>」)符號或術語可分別用小於或等於(「≤」)及大於或等於(「≥」)符號替換。
在組件被描述為「經組態以」執行某些操作之情況下,可(例如)藉由設計電子電路或其他硬體以執行操作、藉由程序化可程序化電子電路(例如,微處理器或其他適合的電子電路)以執行操作或其任何組合來實現此等組態。
片語「耦接至」指直接地或間接地實體地連接至另一組件之任何組件,及/或直接地或間接地與另一組件(例如經由有線或無線連接及/或其他合適通信接口連接至其他組件)通信的任何組件。
列舉一集合「中之至少一者」及/或一集合之「中之一或多者」的技術方案語言或其他語言指示該集合之一個部件或該集合之多個部件(以任何組合)滿足該技術方案。舉例而言,列舉「A及B中之至少一者」的技術方案語言意謂A、B或A及B。在另一實例中,列舉「A、B及C中之至少一者」的技術方案語言意謂A、B、C或A及B、或A及C、或B及C,或A及B及C。語言一集合「中之至少一者」及/或一集合「中之一或多者」並不將該集合限制為該集合所列出之對象。舉例而言,列舉「A及B中之至少一者」的技術方案語言意謂A、B或A及B,且可另外包括A及B之集合中未列出的對象。
結合本文所揭示之實施例而描述之各種說明性邏輯區塊、模組、電路及演算法步驟可被實施為電子硬體、電腦軟體、韌體或其組合。為了清楚地說明硬體與軟體之此可互換性,各種說明性組件、區塊、模組、電路及步驟已在上文大體按其功能性加以了描述。將此功能性實施為硬體抑或軟體取決於特定應用及強加於整個系統上之設計約束。熟習此項技術者可針對每一特定應用以不同之方式實施所描述功能性,但不應將此等實施決策解譯為導致脫離本申請案之範疇。
本文中所描述之技術亦可實施於電子硬體、電腦軟體、韌體或其任何組合中。此等技術可實施於多種裝置中之任何者中,諸如,通用電腦、無線通信裝置手機或具有多種用途(包括在無線通信裝置手機及其他裝置中之應用)之積體電路裝置。可將描述為模組或組件之任何特徵共同實施於整合式邏輯裝置中或分開實施為離散但可互操作之邏輯裝置。若以軟體實施,則該等技術可至少部分由包含包括當經執行時執行以上描述方法中之一或多者之指令之程式碼的電腦可讀資料儲存媒體實現。電腦可讀資料儲存媒體可形成電腦程序產品之部分,電腦程序產品可包括封裝材料。電腦可讀媒體可包含記憶體或資料儲存媒體,諸如,隨機存取記憶體(RAM),諸如,同步動態隨機存取記憶體(SDRAM)、唯讀記憶體(ROM)、非揮發性隨機存取記憶體(NVRAM)、電可抹除可程序化唯讀記憶體(EEPROM)、快閃記憶體、磁性或光學資料儲存媒體,及其類似者。另外或替代地,該等技術可至少部分由電腦可讀通信媒體實現,電腦可讀通信媒體攜載或傳達呈指令或資料結構形式且可由電腦存取、讀取及/或執行的程式碼,諸如,經傳播的信號或波。
程式碼可由可包括一或多個處理器之處理器執行,諸如,一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合式或離散邏輯電路。此處理器可經組態以執行本發明中所描述之技術中之任一者。通用處理器可為微處理器;但在替代例中,處理器可為任何習知處理器、控制器、微控制器或狀態機。處理器還可實施為計算裝置之組合,例如,DSP與微處理器的組合、多個微處理器、一或多個微處理器結合DSP核心、或任何其他此類組態。因此,如本文中所使用之術語「處理器」可指前述結構中之任一者、前述結構之任何組合或適合於實施本文中所描述之技術的任何其他結構或設備。此外,在一些態樣中,本文中描述之功能性可提供於經組態用於編碼及解碼之專用軟體模組或硬體模組內,或併入於經組合視訊編碼器-解碼器(編碼解碼器)中。
本發明之說明性實例包括:
實例1:一種解碼視訊資料之方法。該方法包括:獲得包括視訊資料之一經編碼視訊位元串流;判定與該視訊資料之一區塊相關聯之運動資訊,該運動資訊包含至少一運動向量及一照明補償旗標;將該運動資訊與一運動資訊候選清單中之所儲存運動資訊進行比較,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標;判定該運動向量匹配該所儲存運動向量;及基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標。
實例2:一種根據實例1之方法:其進一步包含:若該照明補償旗標之該值為一第一值且該所儲存照明補償旗標之該值為一第二值,則將該所儲存照明旗標更新為該第一值。
實例3:一種根據實例1或2中任一者之方法,其中該第一值為一真值且該第二值為一假值。
實例4:一種根據實例1至2中任一者之方法,其中該第一值為一假值且該第二值為一真值。
實例5:一種根據實例1至4中任一者之方法,其中若該照明補償旗標之該值為一第一值且該所儲存照明補償旗標之該值為該第一值,則該所儲存照明旗標不被更新。
實例6:一種根據實例5之方法,其中該第一值為一真值。
實例7:一種根據實例5之方法,其中該第一值為一假值。
實例8:一種根據實例1至7中任一者之方法,其進一步包含基於該所儲存照明補償旗標之該值判定是否將照明補償應用於該區塊,其中若該所儲存照明補償旗標之該值為一真值,則應用照明補償,且若該所儲存照明補償旗標之該值為一假值,則不應用照明補償。
實例9:一種根據實例1至8中任一者之方法,其中將照明補償應用於該區塊包含:使用區塊之一或多個相鄰區塊及用於該區塊之框間預測的一參考區塊之一或多個相鄰區塊導出用於該區塊的一或多個照明補償參數。
實例10:一種根據實例1至9中任一者之方法,其中該區塊之該一或多個相鄰區塊包括該區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者,且其中該參考區塊之該一或多個相鄰區塊包括該參考區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者。
實例11:一種根據實例1至10中任一者之方法,其進一步包含:基於該所儲存照明補償旗標之該值為一真值而將照明補償應用於該區塊;及基於應用於該區塊之該照明補償而重建構該區塊之一樣本。
實例12:一種根據實例1至11中任一者之方法,其中重建構該區塊之該樣本進一步包含應用一殘餘值。
實例13:一種用於解碼視訊資料之設備,該設備包含:一記憶體;及一處理器,其實施於電路系統中且經組態以:獲得包括視訊資料之一經編碼視訊位元串流;判定與該視訊資料之一區塊相關聯之運動資訊,該運動資訊包含至少一運動向量及一照明補償旗標;將該運動資訊與一運動資訊候選清單中之所儲存運動資訊進行比較,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標;判定該運動向量匹配該所儲存運動向量;及基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標。
實例14:一種根據實例13之設備,其中該處理器經進一步組態以:在該照明補償旗標之該值為一第一值且該所儲存照明補償旗標之該值為一第二值的情況下將該所儲存照明旗標更新為該第一值。
實例15:一種根據實例13至14中任一者之設備,其中該第一值為一真值且該第二值為一假值,或該第一值為一假值且該第二值為一真值。
實例16:一種根據實例13至15中任一者之設備,其中在該照明補償旗標之該值為一第一值且該所儲存照明補償旗標之該值為該第一值的情況下,該所儲存照明旗標不被更新。
實例17:一種根據實例13至16中任一者之設備,其中該第一值為一真值或該第一值為一假值。
實例18:一種根據實例13至17中任一者之設備,其中該處理器經進一步組態以:基於該所儲存照明補償旗標之該值判定是否將照明補償應用於該區塊,其中在該所儲存照明補償旗標之該值為一真值的情況下應用照明補償,且在該所儲存照明補償旗標之該值為一假值的情況下不應用照明補償。
實例19:一種根據實例13至18中任一者之設備,其中將照明補償應用於該區塊包含:使用區塊之一或多個相鄰區塊及用於該區塊之框間預測的一參考區塊之一或多個相鄰區塊導出用於該區塊的一或多個照明補償參數。
實例20:一種根據實例13至19中任一者之設備,其中該區塊之該一或多個相鄰區塊包括該區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者,且其中該參考區塊之該一或多個相鄰區塊包括該參考區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者。
實例21:一種根據實例13至20中任一者之設備,其中該處理器經進一步組態以:基於該所儲存照明補償旗標之該值為一真值而將照明補償應用於該區塊;及基於應用於該區塊之該照明補償而重建構該區塊之一樣本。
實例22:一種根據實例13至21中任一者之設備,其中重建構該區塊之該樣本進一步包含應用一殘餘值。
實例23:一種根據實例13至22中任一者之設備,其中該設備包含具有用於捕捉一或多個圖像之一攝影機的一行動裝置。
實例24:一種根據實例13至23中任一者之設備,其進一步包含用於顯示一或多個圖像之一顯示器。
實例25:一種其上儲存有指令之非暫時性電腦可讀取媒體,該等指令在由一或多個處理器執行時,使得該一或多個處理器執行根據實例1至12中任一者之方法中的任一者。舉例而言,該非暫時性電腦可讀取媒體可在其上儲存有指令,該等指令在由一或多個處理器執行時使得該一或多個處理器:獲得包括視訊資料之一經編碼視訊位元串流;判定與該視訊資料之一區塊相關聯之運動資訊,該運動資訊包含至少一運動向量及一照明補償旗標;將該運動資訊與一運動資訊候選清單中之所儲存運動資訊進行比較,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標;判定該運動向量匹配該所儲存運動向量;及基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標。
實例26:一種用於使用根據實例1至12中任一者之方法解碼視訊資料之設備。舉例而言,該設備可包括:用於獲得包括視訊資料之一經編碼視訊位元串流的構件;用於判定與該視訊資料之一區塊相關聯之運動資訊的構件,該運動資訊包含至少一運動向量及一照明補償旗標;用於將該運動資訊與一運動資訊候選清單中之所儲存運動資訊進行比較的構件,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標;用於判定該運動向量匹配該所儲存運動向量的構件;及用於基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標的構件。
實例27:一種編碼視訊資料之方法,其包含:獲得視訊資料之一圖像之一區塊;判定與該視訊資料之該區塊相關聯之運動資訊,該運動資訊包含至少一運動向量及一照明補償旗標;將該運動資訊與一運動資訊候選清單中之一所儲存運動資訊進行比較,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標;判定該運動向量匹配該所儲存運動向量;基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標;及產生包括至少該所儲存運動資訊之一經編碼視訊位元串流。
實例28:一種根據實例27之方法,其中該處理器經進一步組態以:在該照明補償旗標之該值為一第一值且該所儲存照明補償旗標之該值為一第二值的情況下將該所儲存照明旗標更新為該第一值。
實例29:一種如實例27至28中任一者之方法,其中該處理器經進一步組態以:判定用於該所儲存照明補償旗標之一預測值;將該預測值與該照明補償旗標之該值進行比較;基於該比較產生一比較旗標,其中該比較旗標在預測值匹配該照明補償旗標之該值的情況下被設定為一第一值,或在預測值不匹配該照明補償旗標之該值的情況下被設定為一第二值;及基於該比較旗標產生該經編碼視訊位元串流。
實例30:一種如實例27至29中任一者之方法,其中基於該比較旗標產生該經編碼視訊位元串流包含將一壓縮演算法應用於該比較旗標。
實例31:一種如實例27至30中任一者之方法,其中用於該所儲存照明補償旗標之該預測值係基於與該區塊之對應一或多個相鄰區塊相關聯之一或多個照明補償旗標。
實例32:一種包含經組態以儲存視訊資料之一記憶體及經組態根據實例26至31中任一者處理該視訊資料的一處理器的設備。
實例33:一種根據實例32之設備,其中該設備包括一解碼器。
實例34:一種根據實例32至33中任一者之設備,其中該設備包括一編碼器。
實例35:一種根據實例32至34中任一者之設備,其中該設備為一行動裝置。
實例36:一種根據實例32至35中任一者之設備,其中該設備包括經組態以顯示該視訊資料之一顯示器。
實例37:一種根據實例32至36中任一者之設備,其中該設備包括經組態以捕捉一或多個圖像之一攝影機。
實例38:一種其上儲存有指令之電腦可讀媒體,該等指令在由一處理器執行時執行如條項26至31中任一者之方法。
條項1:一種處理視訊資料之方法,該方法包含:獲得該視訊資料及與該視訊資料之一區塊相關聯之運動資訊,該運動資訊包括至少一第一運動資訊候選者及一第二運動資訊候選者;將該第一運動資訊候選者添加至一候選清單;判定該第二運動資訊候選者之一第二照明補償旗標的一第二值不同於該第一運動資訊候選者之一第一照明補償旗標的一第一值;及在該候選清單中,將該第一照明補償旗標自該第一值更新為該第二值。
條項2:一種如條項1之方法,其中不將該第二運動資訊候選者添加至該候選清單。
條項3:一種如條項1至2中任一者之方法,其中該第一照明補償旗標之該第一值等於假,一假值指示照明補償不適用於該區塊,且其中該第二照明補償旗標之該第二值等於真,一真值指示照明補償適用於該區塊。
條項4:一種如條項1至3中任一者之方法,其中該第一運動資訊候選者包括一第一運動向量、一第一索引及該第一照明補償旗標,且其中該第二運動資訊候選者包括一第二運動向量、一第二索引及該第二照明補償旗標。
條項5:一種如條項4之方法,其中該第一運動向量等於該第二運動向量,且其中該第一索引等於該第二索引。
條項6:一種如條項1至5中任一者之方法,其進一步包含對該區塊執行照明補償,其中執行該照明補償包括:導出用於該區塊之一或多個照明補償參數;及將該一或多個照明補償參數應用於該區塊。
條項7:一種如條項6之方法,其中用於該區塊之該一或多個照明補償參數係使用相鄰經重建構樣本導出。
條項8:一種如條項7之方法,其中該相鄰經重建構樣本來自該區塊之一第一相鄰區塊及用於框間預測的一參考區塊之一第二相鄰區塊中之一或多者。
條項9:一種如條項8之方法,其中該第一相鄰區塊包括該區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者,且其中該第二相鄰區塊包括該參考區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者。
條項10:一種如條項8至9中任一者之方法,其中導出用於該區塊之該一或多個照明補償參數包括最小化該第一相鄰區塊之經重建構樣本與該第二相鄰區塊之經重建構樣本之間的一差。
條項11:一種如條項6至10中任一者之方法,其中該一或多個照明補償參數包括該第一照明補償旗標、至少一個按比例調整因數及至少一個偏移。
條項12:一種如條項6至11中任一者之方法,其中對該區塊執行該照明補償產生一照明補償預測符,且進一步包含使用該照明補償預測符解碼該區塊。
條項13:一種如條項6至12中任一者之方法,其進一步包含在一經編碼視訊位元串流中發信該一或多個照明補償參數。
條項14:一種如條項1至12中任一者之方法,其進一步包含在一經編碼視訊位元串流中發信該第一照明補償旗標。
條項15:一種包含經組態以儲存視訊資料之一記憶體及經組態以如條項1至14中任一者處理該視訊資料之一處理器的設備。
條項16:一種如條項15之設備,其中該設備包括一解碼器。
條項17:一種如條項15之設備,其中該設備包括一編碼器。
條項18:一種如條項15至17中任一者之設備,其中該設備為一行動裝置。
條項19:一種如條項15至18中任一者之設備,其中該設備包括經組態以顯示該視訊資料之一顯示器。
條項20:一種如條項15至19中任一者之設備,其中該設備包括經組態以捕捉一或多個圖像之一攝影機。
條項21:一種其上儲存有指令之電腦可讀媒體,該等指令在由一處理器執行時執行如條項1至14中任一者之方法。
條項22:一種處理視訊資料之方法該方法包含:獲得該視訊資料;獲得與該視訊資料之一區塊相關聯之一候選清單,該候選清單包含運動資訊,其包括至少一第一運動資訊候選者,其中該第一運動資訊候選者之一第一照明補償旗標之一第一值包括一第二運動資訊候選者之一第二照明補償旗標之一第二值,此基於該第二值不同於該第一照明補償旗標之一先前值;及使用該候選清單之該運動資訊處理該視訊資料之該區塊。
條項23:一種如條項22之方法,其中該候選清單不包括該第二運動資訊候選者。
條項24:一種如條項22至23中任一者之方法,其中該第一照明補償旗標之該先前值等於假,一假值指示照明補償不適用於該區塊,且其中該第二照明補償旗標之該第二值等於真,一真值指示照明補償適用於該區塊。
條項25:一種如條項22至24中任一者之方法,其中該第一運動資訊候選者包括一第一運動向量、一第一索引及該第一照明補償旗標,且其中該第二運動資訊候選者包括一第二運動向量、一第二索引及該第二照明補償旗標。
條項26:一種如條項25之方法,其中該第一運動向量等於該第二運動向量,且其中該第一索引等於該第二索引。
條項27:一種如條項22至26中任一者之方法,其進一步包含對該區塊執行照明補償,其中執行該照明補償包括:導出用於該區塊之一或多個照明補償參數;及將該一或多個照明補償參數應用於該區塊。
條項28:一種如條項27之方法,其中用於該區塊之該一或多個照明補償參數係使用相鄰經重建構樣本導出。
條項29:一種如條項28之方法,其中該相鄰經重建構樣本來自該區塊之一第一相鄰區塊及用於框間預測的一參考區塊之一第二相鄰區塊中之一或多者。
條項30:一種如條項29之方法,其中該第一相鄰區塊包括該區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者,且其中該第二相鄰區塊包括該參考區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者。
條項31:一種如條項29至30中任一者之方法,其中導出用於該區塊之該一或多個照明補償參數包括最小化該第一相鄰區塊之經重建構樣本與該第二相鄰區塊之經重建構樣本之間的一差。
條項32:一種如條項27至31中任一者之方法,其中該一或多個照明補償參數包括該第一照明補償旗標、至少一個按比例調整因數及至少一個偏移。
條項33:一種如條項27至32中任一者之方法,其中對該區塊執行該照明補償產生一照明補償預測符,且進一步包含使用該照明補償預測符解碼該區塊。
條項34:一種如條項27至33中任一者之方法,其進一步包含在一經編碼視訊位元串流中發信該一或多個照明補償參數。
條項35:一種如條項22至33中任一者之方法,其進一步包含在一經編碼視訊位元串流中發信該第一照明補償旗標。
條項36:一種包含經組態以儲存視訊資料之一記憶體及經組態以如條項22至35中任一者處理該視訊資料之一處理器的設備。
條項37:一種如條項36之設備,其中該設備包括一解碼器。
條項38:一種如條項36之設備,其中該設備包括一編碼器。
條項39:一種如條項36至38中任一者之設備,其中該設備為一行動裝置。
條項40:一種如條項36至39中任一者之設備,其中該設備包括經組態以顯示該視訊資料之一顯示器。
條項41:一種如條項36至40中任一者之設備,其中該設備包括經組態以捕捉一或多個圖像之一攝影機。
條項42:一種其上儲存有指令之電腦可讀媒體,該等指令在由一處理器執行時執行如條項22至35中任一者之方法。
條項43:一種處理視訊資料之方法,該方法包含:獲得該視訊資料,該視訊資料包括至少視訊資料之一區塊;判定用於視訊資料之該區塊的一照明補償旗標預測符,該照明補償旗標預測符指示照明補償是否應用於視訊資料之該區塊;及判定與該照明補償旗標預測符相關聯之一旗標的一值,該值係基於該照明補償旗標預測符與相關聯於視訊資料之該區塊的一照明補償旗標之一比較而判定。
條項44:一種如條項43之方法,其中該照明補償旗標預測符係針對視訊資料之該區塊基於該區塊之一或多個相鄰區塊之一或多個照明補償旗標進行判定。
條項45:一種如條項44之方法,其中判定用於視訊資料之該區塊的該照明補償旗標預測符包括:判定該一或多個相鄰區塊中之至少一者具有等於一第一值之一照明補償旗標;及基於該一或多個相鄰區塊中之該至少一者具有等於該第一值之一照明補償旗標,將該照明補償旗標預測符之一值設定為該第一值。
條項46:一種如條項44之方法,其中判定用於視訊資料之該區塊的該照明補償旗標預測符包括:判定具有等於一第一值之一照明補償旗標的該一或多個相鄰區塊之一數目;判定該數目大於一臨限數目;及基於該數目大於該臨限數目而將該照明補償旗標預測符之一值設定為該第一值。
條項47:一種如條項43之方法,其中該照明補償旗標預測符係針對視訊資料之該區塊基於一運動資訊候選者進行判定。
條項48:一種如條項47之方法,其中判定用於視訊資料之該區塊的該照明補償旗標預測符包括:判定包括於該運動資訊候選者中之一照明補償旗標的一值;及將該照明補償旗標預測符之一值設定為該照明補償旗標之該值。
條項49:一種如條項43至48中任一者之方法,其中判定與該照明補償旗標預測符相關聯之該旗標的該值包括:將該照明補償旗標預測符之一值與相關聯於視訊資料之該區塊的該照明補償旗標之一值進行比較;判定該照明補償旗標預測符之該值是否等於相關聯於視訊資料之該區塊的該照明補償旗標之該值;及基於該照明補償旗標預測符是否等於相關聯於視訊資料之該區塊的該照明補償旗標之該值,設定與該照明補償旗標預測符相關聯之該旗標的該值。
條項50:一種如條項49之方法,其中當該照明補償旗標預測符之該值等於與視訊資料之該區塊相關聯之該照明補償旗標的該值時,與該照明補償旗標預測符相關聯之該旗標的該值被設定為一第一值,且其中當該照明補償旗標預測符之該值不等於與視訊資料之該區塊相關聯之該照明補償旗標的該值時,與該照明補償旗標預測符相關聯之該旗標的該值被設定為一第二值。
條項51:一種如條項43至50中任一者之方法,其進一步包含對該區塊執行照明補償,其中執行該照明補償包括:導出用於該區塊之一或多個照明補償參數;及將該一或多個照明補償參數應用於該區塊。
條項52:一種如條項51之方法,其中用於該區塊之該一或多個照明補償參數係使用相鄰經重建構樣本導出。
條項53:一種如條項52之方法,其中該相鄰經重建構樣本來自該區塊之一第一相鄰區塊及用於框間預測的一參考區塊之一第二相鄰區塊中之一或多者。
條項54:一種如條項53之方法,其中該第一相鄰區塊包括該區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者,且其中該第二相鄰區塊包括該參考區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者。
條項55:一種如條項48至54中任一者之方法,其中導出用於該區塊之該一或多個照明補償參數包括最小化該第一相鄰區塊之經重建構樣本與該第二相鄰區塊之經重建構樣本之間的一差。
條項56:一種如條項46至55中任一者之方法,其中該一或多個照明補償參數包括至少一個按比例調整因數及至少一個偏移。
條項57:一種如條項46至56中任一者之方法,其中對該區塊執行該照明補償產生一照明補償預測符,且進一步包含使用該照明補償預測符解碼該區塊。
條項58:一種如條項46至57中任一者之方法,其進一步包含在一經編碼視訊位元串流中發信該一或多個照明補償參數。
條項59:一種如條項43至57中任一者之方法,其進一步包含在一經編碼視訊位元串流中發信與該照明補償旗標預測符相關聯之該旗標。
條項60:一種包含經組態以儲存視訊資料之一記憶體及經組態以如條項43至59中任一者處理該視訊資料之一處理器的設備。
條項61:一種如條項60之設備,其中該設備包括一解碼器。
條項62:一種如條項60之設備,其中該設備包括一編碼器。
條項63:一種如條項60至62中任一者之設備,其中該設備為一行動裝置。
條項64:一種如條項60至63中任一者之設備,其中該設備包括經組態以顯示該視訊資料之一顯示器。
條項65:一種如條項60至64中任一者之設備,其中該設備包括經組態以捕捉一或多個圖像之一攝影機。
條項66:一種其上儲存有指令之電腦可讀媒體,該等指令在由一處理器執行時執行如條項43至59中任一者之方法。
條項67:一種處理視訊資料之方法,該方法包含:獲得該視訊資料,該視訊資料包括至少視訊資料之一區塊;獲得與視訊資料之該區塊相關聯之一照明補償旗標;及將上下文寫碼應用於該照明補償旗標。
條項68:一種如條項67之方法,其中該上下文寫碼應用於該照明補償旗標係基於該區塊之一或多個相鄰區塊的一或多個照明補償旗標。
條項69:一種如條項68之方法,其中將該上下文寫碼應用於該照明補償旗標包括:判定該一或多個相鄰區塊中之至少一者具有等於一第一值的一照明補償旗標;及基於該一或多個相鄰區塊中之該至少一者具有等於該第一值的一照明補償旗標而將一第一上下文指派至該照明補償旗標。
條項70:一種如條項68之方法,其中將該上下文寫碼應用於該照明補償旗標包括:判定該一或多個相鄰區塊中無一者具有等於一第一值的一照明補償旗標;及基於該一或多個相鄰區塊中之該者中無一者具有等於該第一值的一照明補償旗標而將一第二上下文指派至該照明補償旗標。
條項71:一種如條項68之方法,其中將該上下文寫碼應用於該照明補償旗標包括:判定具有等於一第一值之一照明補償旗標的該一或多個相鄰區塊之一數目;判定該數目大於一臨限數目;及基於該數目大於該臨限數目而將一第一上下文指派至該照明補償旗標。
條項72:一種如條項68之方法,其中將該上下文寫碼應用於該照明補償旗標包括:判定具有等於一第一值之一照明補償旗標的該一或多個相鄰區塊之一數目;判定該數目小於一臨限數目;及基於該數目小於該臨限數目而將一第二上下文指派至該照明補償旗標。
條項73:一種如條項67之方法,其中應用於該照明補償旗標之該上下文寫碼係基於該區塊之一大小。
條項74:一種如條項73之方法,其中該區塊之該大小係基於該區塊之一寬度或一高度中的一或多者。
條項75:一種如條項73至74中任一者之方法,其中該區塊之該大小係基於該區塊之一區域。
條項76:一種如條項73至75中任一者之方法,其中將該上下文寫碼應用於該照明補償旗標包括:判定該區塊之該大小小於一臨限大小;及基於該區塊之該大小小於該臨限大小而將一第一上下文應用於該照明補償旗標。
條項77:一種如條項73至75中任一者之方法,其中將該上下文寫碼應用於該照明補償旗標包括:判定該區塊之該大小大於一臨限大小;及基於該區塊之該大小大於該臨限大小而將一第二上下文應用於該照明補償旗標。
條項78:一種如條項67至77中任一者之方法,其進一步包含對該區塊執行照明補償,其中執行該照明補償包括:導出用於該區塊之一或多個照明補償參數;及將該一或多個照明補償參數應用於該區塊。
條項79:一種如條項78之方法,其中用於該區塊之該一或多個照明補償參數係使用相鄰經重建構樣本導出。
條項80:一種如條項79之方法,其中該相鄰經重建構樣本來自該區塊之一第一相鄰區塊及用於框間預測的一參考區塊之一第二相鄰區塊中之一或多者。
條項81:一種如條項80之方法,其中該第一相鄰區塊包括該區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者,且其中該第二相鄰區塊包括該參考區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者。
條項82:一種如條項48至81中任一者之方法,其中導出用於該區塊之該一或多個照明補償參數包括最小化該第一相鄰區塊之經重建構樣本與該第二相鄰區塊之經重建構樣本之間的一差。
條項83:一種如條項46至82中任一者之方法,其中該一或多個照明補償參數包括至少一個按比例調整因數及至少一個偏移。
條項84:一種如條項46至83中任一者之方法,其中對該區塊執行該照明補償產生一照明補償預測符,且進一步包含使用該照明補償預測符解碼該區塊。
條項85:一種如條項46至84中任一者之方法,其進一步包含在一經編碼視訊位元串流中發信該一或多個照明補償參數。
條項86:一種如條項67至84中任一者之方法,其進一步包含在一經編碼視訊位元串流中發信該經上下文寫碼照明補償旗標。
條項87:一種包含經組態以儲存視訊資料之一記憶體及經組態以如條項67至86中任一者處理該視訊資料之一處理器的設備。
條項88:一種如條項87之設備,其中該設備包括一解碼器。
條項89:一種如條項87之設備,其中該設備包括一編碼器。
條項90:一種如條項87至89中任一者之設備,其中該設備為一行動裝置。
條項91:一種如條項87至90中任一者之設備,其中該設備包括經組態以顯示該視訊資料之一顯示器。
條項92:一種如條項87至91中任一者之設備,其中該設備包括經組態以捕捉一或多個圖像之一攝影機。
條項93:一種其上儲存有指令之電腦可讀媒體,該等指令在由一處理器執行時執行如條項67至86中任一者之方法。
35:分割單元 41:預測處理單元 42:運動估計單元 44:運動補償單元 46:框內預測處理單元 50:求和器 52:變換處理單元 54:量化單元 56:熵編碼單元 57:後處理裝置 58:反量化單元 60:反變換處理單元 62:求和器 63:濾波器單元 64:圖像記憶體 79:網路實體 80:熵解碼單元 81:預測處理單元 82:運動補償單元 84:框內預測處理單元 86:反量化單元 88:反變換處理單元 90:求和器 91:濾波器單元 92:圖像記憶體 100:系統 102:視訊源 104:編碼裝置 106:編碼器引擎 108:儲存器 110:輸出 112:解碼裝置 114:輸入 116:解碼器引擎 118:儲存器 120:通信鏈路 122:視訊目的地裝置 602:當前區塊 604:參考區塊 702:當前區塊 704:第一參考區塊 706:第二參考區塊 800:運動資訊候選清單 801a、801b、801k、801n:所儲存運動資訊候選者 802a、802b、802k、802n:所儲存運動向量 804a、804b、804k、804n:所儲存局部照明補償(LIC)旗標 810:潛在運動資訊候選者 812:運動向量 814:局部照明補償(LIC)旗標 900:程序 902:區塊 904:區塊 906:區塊 908:區塊 910:區塊 1000:程序 1002:區塊 1004:區塊 1006:區塊 1008:區塊 1010:區塊 1012:區塊
下文參考以下圖式詳細描述本申請案之說明性實施例:
圖1為說明根據一些實例之編碼裝置及解碼裝置之實例的方塊圖;
圖2A為說明根據一些實例之用於合併模式之實例空間相鄰運動向量候選者的概念圖;
圖2B為說明根據一些實例之用於進階運動向量預測(AMVP)模式之實例空間相鄰運動向量候選者之概念圖;
圖3A為說明根據一些實例之實例時間運動向量預測符(TMVP)候選者之概念圖;
圖3B為說明根據一些實例之運動向量按比例調整之實例的概念圖;
圖4A為說明根據一些實例的用於估計當前寫碼單元之照明補償(IC)參數的當前寫碼單元之相鄰樣本之實例的概念圖;
圖4B為說明根據一些實例的用於估計當前寫碼單元之IC參數的參考區塊之相鄰樣本之實例的概念圖;
圖5A為說明根據一些實例的用於導出當前寫碼單元之照明補償(IC)參數的當前寫碼單元之相鄰樣本之實例的概念圖;
圖5B為說明根據一些實例的用於導出當前寫碼單元之IC參數的參考區塊之相鄰樣本之實例的概念圖;
圖6為說明根據一些實例的當前區塊之相鄰經重建構樣本及用於單向框間預測之參考區塊之相鄰樣本的實例的概念圖;
圖7為說明根據一些實例的當前區塊之相鄰經重建構樣本及用於雙向框間預測之兩個參考區塊之相鄰樣本的實例的概念圖;
圖8為根據一些實例的說明使用實例刪剪技術之運動資訊候選清單建構的概念圖;
圖9為說明根據一些實施例的包括使用實例刪剪技術建構運動資訊候選清單的解碼視訊資料之程序之實例的流程圖;
圖10為根據一些實施例的說明包括使用實例刪剪技術建構運動資訊候選清單的編碼視訊資料之程序之實例的流程圖;
圖11為說明根據一些實例的實例視訊編碼裝置之方塊圖;
圖12為說明根據一些實例的實例視訊解碼裝置之方塊圖。
800:運動資訊候選清單
801a、801b、801k、801n:所儲存運動資訊候選者
802a、802b、802k、802n:所儲存運動向量
804a、804b、804k、804n:所儲存局部照明補償(LIC)旗標
810:潛在運動資訊候選者
812:運動向量
814:局部照明補償(LIC)旗標

Claims (30)

  1. 一種解碼視訊資料之方法,該方法包含: 獲得包括視訊資料之一經編碼視訊位元串流; 判定與該視訊資料之一區塊相關聯之運動資訊,該運動資訊包含至少一運動向量及一照明補償旗標; 將該運動資訊與一運動資訊候選清單中之所儲存運動資訊進行比較,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標; 判定該運動向量匹配該所儲存運動向量;及 基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標。
  2. 如請求項1之方法,其進一步包含: 若該照明補償旗標之該值為一第一值且該所儲存照明補償旗標之該值為一第二值,則將該所儲存照明旗標更新為該第一值。
  3. 如請求項2之方法,其中該第一值為一真值,且該第二值為一假值。
  4. 如請求項2之方法,其中該第一值為一假值且該第二值為一真值。
  5. 如請求項1之方法,其中若該照明補償旗標之該值為一第一值且該所儲存照明補償旗標之該值為該第一值,則該所儲存照明旗標不被更新。
  6. 如請求項5之方法,其中該第一值為一真值。
  7. 如請求項5之方法,其中該第一值為一假值。
  8. 如請求項1之方法,其進一步包含: 基於該所儲存照明補償旗標之該值判定是否將照明補償應用於該區塊,其中若該所儲存照明補償旗標之該值為一真值,則應用照明補償,且若該所儲存照明補償旗標之該值為一假值,則不應用照明補償。
  9. 如請求項8之方法,其中將照明補償應用於該區塊包含: 使用區塊之一或多個相鄰區塊及用於該區塊之框間預測的一參考區塊之一或多個相鄰區塊導出用於該區塊的一或多個照明補償參數。
  10. 如請求項9之方法,其中該區塊之該一或多個相鄰區塊包括該區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者,且其中該參考區塊之該一或多個相鄰區塊包括該參考區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者。
  11. 如請求項8之方法,其進一步包含: 基於該所儲存照明補償旗標之該值為一真值而將照明補償應用於該區塊;及 基於應用於該區塊之該照明補償而重建構該區塊之一樣本。
  12. 如請求項11之方法,其中重建構該區塊之該樣本進一步包含應用一殘餘值。
  13. 一種用於解碼視訊資料之設備,該設備包含: 一記憶體;及 一處理器,其實施於電路系統中且經組態以執行以下操作: 獲得包括視訊資料之一經編碼視訊位元串流; 判定與該視訊資料之一區塊相關聯之運動資訊,該運動資訊包含至少一運動向量及一照明補償旗標; 將該運動資訊與一運動資訊候選清單中之所儲存運動資訊進行比較,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標; 判定該運動向量匹配該所儲存運動向量;及 基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標。
  14. 如請求項13之設備,其中該處理器經進一步組態以: 在該照明補償旗標之該值為一第一值且該所儲存照明補償旗標之該值為一第二值的情況下,將該所儲存照明旗標更新為該第一值。
  15. 如請求項14之設備,其中該第一值為一真值且該第二值為一假值,或該第一值為一假值且該第二值為一真值。
  16. 如請求項13之設備,其中在該照明補償旗標之該值為一第一值且該所儲存照明補償旗標之該值為該第一值的情況下,該所儲存照明旗標不被更新。
  17. 如請求項16之設備,其中該第一值為一真值或該第一值為一假值。
  18. 如請求項13之設備,其中該處理器經進一步組態以: 基於該所儲存照明補償旗標之該值判定是否將照明補償應用於該區塊,其中在該所儲存照明補償旗標之該值為一真值的情況下應用照明補償,且在該所儲存照明補償旗標之該值為一假值的情況下不應用照明補償。
  19. 如請求項18之設備,其中將照明補償應用於該區塊包含: 使用區塊之一或多個相鄰區塊及用於該區塊之框間預測的一參考區塊之一或多個相鄰區塊導出用於該區塊的一或多個照明補償參數。
  20. 如請求項19之設備,其中該區塊之該一或多個相鄰區塊包括該區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者,且其中該參考區塊之該一或多個相鄰區塊包括該參考區塊之一頂部相鄰區塊或一左側相鄰區塊中之一或多者。
  21. 如請求項18之設備,其中該處理器經進一步組態以: 基於該所儲存照明補償旗標之該值為一真值而將照明補償應用於該區塊;及 基於應用於該區塊之該照明補償而重建構該區塊之一樣本。
  22. 如請求項21之設備,其中重建構該區塊之該樣本進一步包含應用一殘餘值。
  23. 如請求項13之設備,其中該設備包含具有用於捕捉一或多個圖像之一攝影機的一行動裝置。
  24. 如請求項13之設備,其進一步包含用於顯示一或多個圖像之一顯示器。
  25. 一種其上儲存有指令之非暫時性電腦可讀媒體,該等指令在由一或多個處理器執行時使得該一或多個處理器執行以下操作: 獲得包括視訊資料之一經編碼視訊位元串流; 判定與該視訊資料之一區塊相關聯之運動資訊,該運動資訊包含至少一運動向量及一照明補償旗標; 將該運動資訊與一運動資訊候選清單中之所儲存運動資訊進行比較,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標; 判定該運動向量匹配該所儲存運動向量;及 基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標。
  26. 一種用於編碼視訊資料之設備,該設備包含: 一記憶體;及 一處理器,其實施於電路系統中且經組態以執行以下操作: 獲得視訊資料之一圖像之一區塊; 判定與該視訊資料之該區塊相關聯之運動資訊,該運動資訊包含至少一運動向量及一照明補償旗標; 將該運動資訊與一運動資訊候選清單中之一所儲存運動資訊進行比較,該所儲存運動資訊包含一所儲存運動向量及一所儲存照明補償旗標; 判定該運動向量匹配該所儲存運動向量; 基於該照明補償旗標之一值及該所儲存照明補償旗標之一值判定是否更新該所儲存照明補償旗標;及 產生包括至少該所儲存運動資訊之一經編碼視訊位元串流。
  27. 如請求項26之設備,其中該處理器經進一步組態以: 在該照明補償旗標之該值為一第一值且該所儲存照明補償旗標之該值為一第二值的情況下將該所儲存照明旗標更新為該第一值。
  28. 如請求項26之設備,其中該處理器經進一步組態以: 判定用於該所儲存照明補償旗標之一預測值; 將該預測值與該照明補償旗標之該值進行比較; 基於該比較產生一比較旗標,其中該比較旗標在預測值匹配該照明補償旗標之該值的情況下被設定為一第一值,或在預測值不匹配該照明補償旗標之該值的情況下被設定為一第二值;及 基於該比較旗標產生該經編碼視訊位元串流。
  29. 如請求項28之設備,其中基於該比較旗標產生該經編碼視訊位元串流包含將一壓縮演算法應用於該比較旗標。
  30. 如請求項28之設備,其中用於該所儲存照明補償旗標之該預測值係基於與該區塊之對應一或多個相鄰區塊相關聯之一或多個照明補償旗標。
TW108146274A 2018-12-27 2019-12-17 用於照明補償模式之刪剪 TW202031052A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862785434P 2018-12-27 2018-12-27
US62/785,434 2018-12-27
US16/715,069 2019-12-16
US16/715,069 US10887611B2 (en) 2018-12-27 2019-12-16 Pruning for illumination compensation mode

Publications (1)

Publication Number Publication Date
TW202031052A true TW202031052A (zh) 2020-08-16

Family

ID=71123361

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108146274A TW202031052A (zh) 2018-12-27 2019-12-17 用於照明補償模式之刪剪

Country Status (4)

Country Link
US (1) US10887611B2 (zh)
CN (1) CN113228677A (zh)
TW (1) TW202031052A (zh)
WO (1) WO2020139634A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020017910A1 (ko) * 2018-07-18 2020-01-23 한국전자통신연구원 지역 조명 보상을 통한 효과적인 비디오 부호화/복호화 방법 및 장치
CN116076073A (zh) * 2021-09-02 2023-05-05 辉达公司 用于高性能视频编码的硬件编解码器加速器

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2728882B1 (en) * 2011-06-30 2017-11-22 JVC KENWOOD Corporation Image decoding device, image decoding method, and image decoding program
MX353235B (es) * 2011-09-29 2018-01-08 Sharp Kk Star Dispositivo de decodificación de imágenes, método de decodificación de imágenes y dispositivo de codificación de imágenes.
US10200717B2 (en) * 2014-06-19 2019-02-05 Sharp Kabushiki Kaisha Image decoding device, image coding device, and predicted image generation device
US10356416B2 (en) 2015-06-09 2019-07-16 Qualcomm Incorporated Systems and methods of determining illumination compensation status for video coding
KR102477190B1 (ko) * 2015-08-10 2022-12-13 삼성전자주식회사 얼굴 인식 방법 및 장치
MY201069A (en) * 2016-02-05 2024-02-01 Hfi Innovation Inc Method and apparatus of motion compensation based on bi-directional optical flow techniques for video coding
CN116708782A (zh) * 2016-07-12 2023-09-05 韩国电子通信研究院 图像编码/解码方法以及用于该方法的记录介质
US10951912B2 (en) * 2016-10-05 2021-03-16 Qualcomm Incorporated Systems and methods for adaptive selection of weights for video coding
US20190268611A1 (en) * 2018-02-26 2019-08-29 Mediatek Inc. Intelligent Mode Assignment In Video Coding
US20200014919A1 (en) * 2018-07-05 2020-01-09 Tencent America LLC Methods and apparatus for multiple line intra prediction in video compression

Also Published As

Publication number Publication date
WO2020139634A1 (en) 2020-07-02
US20200213600A1 (en) 2020-07-02
CN113228677A (zh) 2021-08-06
US10887611B2 (en) 2021-01-05

Similar Documents

Publication Publication Date Title
TWI826546B (zh) 對以歷史為基礎之運動向量預測器之改良
US10999594B2 (en) Virtual search area for current picture referencing (CPR) and intra block copy (IBC)
US11218694B2 (en) Adaptive multiple transform coding
US11659201B2 (en) Systems and methods for generating scaling ratios and full resolution pictures
TW202037163A (zh) 改善的子劃分內預測
US20200344469A1 (en) Block-based quantized residual domain pulse code modulation assignment for intra prediction mode derivation
JP2019535198A (ja) 補間フィルタを切り替えるシステムおよび方法
US11290743B2 (en) Interaction of illumination compensation with inter-prediction
TW202110178A (zh) 具有可切換濾波器之參考圖像重新取樣
TW202042552A (zh) 用於照明補償之區塊大小限制
JP2018514985A (ja) ビデオデータを処理するためのデバイスおよび方法
CN114982246A (zh) 环路滤波器的自适应舍入
US11917174B2 (en) Decoded picture buffer (DPB) operations and access unit delimiter (AUD)
US11388394B2 (en) Local illumination compensation (LIC) for virtual pipeline data units (VPDUS)
KR20230150284A (ko) 효율적인 비디오 인코더 아키텍처
US11356707B2 (en) Signaling filters for video processing
TW202031052A (zh) 用於照明補償模式之刪剪
TW202315409A (zh) 運動向量(mv)候選重新排序