TW201313026A - 用於視訊寫碼之調適參數組 - Google Patents
用於視訊寫碼之調適參數組 Download PDFInfo
- Publication number
- TW201313026A TW201313026A TW101125682A TW101125682A TW201313026A TW 201313026 A TW201313026 A TW 201313026A TW 101125682 A TW101125682 A TW 101125682A TW 101125682 A TW101125682 A TW 101125682A TW 201313026 A TW201313026 A TW 201313026A
- Authority
- TW
- Taiwan
- Prior art keywords
- aps
- data structure
- aps data
- segments
- video
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
在一實例中,一種視訊解碼器經組態以:將一調適參數組(APS)資料結構儲存於一寫碼器件之一緩衝器中,其中該APS資料結構包括可適用於視訊資料之一或多個片段的傳訊資料;基於該APS資料結構之該傳訊資料解碼該等片段中之至少一者;在解碼該片段後,判定可自該緩衝器移除該APS資料結構;基於該判定自該緩衝器移除該APS資料結構;及在自該緩衝器移除該APS資料結構後解碼該視訊資料之一或多個額外片段。
Description
本發明係關於視訊寫碼。
本申請案主張2011年7月18日申請之美國臨時申請案第61/509,015號、2011年7月25日申請之美國臨時申請案第61/511,477號及2011年9月29日申請之美國臨時申請案第61/540,907號之權利,該等申請案之每一者的全文特此被以引用的方式併入本文中。
可將數位視訊能力併入至廣泛範圍的器件內,包括數位電視、數位直接廣播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、數位相機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲機、蜂巢式或衛星無線電電話、視訊電話會議器件及類似者。數位視訊器件實施視訊壓縮技術,諸如,在由MPEG-2、MPEG-4、ITU-T H.263或ITU-T H.264/MPEG-4第10部分進階視訊寫碼(AVC)定義之標準及此等標準之擴展中描述之技術,以更有效率地傳輸及接收數位視訊資訊。
即將到來的視訊寫碼標準為高效率視訊寫碼(HEVC)標準,「HEVC工作草案7」或「WD7」描述於文獻HCTVC-I1003中Bross等人之「High Efficiency Video Coding(HEVC)Text Specification Draft 7」中,ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之關於視訊寫碼之聯合合作團隊(JCT-VC),第9次會議:瑞士日內瓦,2012年4月27日
至2012年5月7日,在2012年6月25日,該草案可自http://phenix.it-sudparis.eu/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v3.zip下載。另一被稱作「HEVC工作草案6」或「WD6」之HEVC工作草案描述於文獻JCTVC-H1003中Bross等人之「High efficiency video coding(HEVC)text specification draft 6」中,ITU-T SG16WP3及ISO/IEC JTC1/SC29/WG11之關於視訊寫碼之聯合合作團隊(JCT-VC),第8次會議:美國加州San Jose,2012年2月,在2012年6月25日,其可自http://phenix.int-evry.fr/jct/doc_end_user/documents/8_San Jose/wg11/JCTVC-H1003-v22.zip下載。
視訊壓縮技術執行空間預測及/或時間預測以減少或移除視訊序列中所固有的冗餘。對於基於區塊之視訊寫碼,可將視訊圖框或片段分割成區塊。可進一步分割每一區塊。使用關於相鄰區塊之空間預測編碼框內寫碼(I)圖框或片段中之區塊。框間寫碼(P或B)圖框或片段中之區塊可使用關於同一圖框或片段中之相鄰區塊的空間預測或關於先前寫碼之參考圖框之資料的時間預測。
一般而言,本發明描述用於使用用於視訊寫碼之調適參數組來傳訊用於視訊資料之片段的一或多個參數之技術。此外,本發明提供用於判定可自諸如視訊解碼器件的視訊寫碼器件之緩衝器移除調適參數組之記憶體管理技術。以此方式,視訊寫碼器件可避免將過多資料儲存於緩衝器
中,其可改良視訊寫碼器件之記憶體利用。
在一實例中,一種解碼視訊資料之方法包括:將一調適參數組(APS)資料結構儲存於一寫碼器件之一緩衝器中,其中該APS資料結構包括可適用於視訊資料之一或多個片段的傳訊資料;基於該APS資料結構之該傳訊資料解碼該等片段中之至少一者;在解碼該片段後,判定可自該緩衝器移除該APS資料結構;基於該判定自該緩衝器移除該APS資料結構;及在自該緩衝器移除該APS資料結構後解碼該視訊資料之一或多個額外片段。
在另一實例中,一種用於解碼視訊資料之器件包括一視訊解碼器,該視訊解碼器經組態以:將一調適參數組(APS)資料結構儲存於一寫碼器件之一緩衝器中,其中該APS資料結構包括可適用於視訊資料之一或多個片段的傳訊資料;基於該APS資料結構之該傳訊資料解碼該等片段中之至少一者;在解碼該片段後,判定可自該緩衝器移除該APS資料結構;基於該判定自該緩衝器移除該APS資料結構;及在自該緩衝器移除該APS資料結構後解碼該視訊資料之一或多個額外片段。
在另一實例中,一種用於解碼視訊資料之器件包括:用於將一調適參數組(APS)資料結構儲存於一寫碼器件之一緩衝器中之構件,其中該APS資料結構包括可適用於視訊資料之一或多個片段的傳訊資料;用於基於該APS資料結構之該傳訊資料解碼該等片段中之至少一者之構件;用於在解碼該片段後判定可自該緩衝器移除該APS資料結構之
構件;用於基於該判定自該緩衝器移除該APS資料結構之構件;及用於在自該緩衝器移除該APS資料結構後解碼該視訊資料之一或多個額外片段之構件。
在另一實例中,一種電腦可讀儲存媒體具有儲存於其上之指令,該等指令當經執行時使一處理器進行以下操作:將一調適參數組(APS)資料結構儲存於一寫碼器件之一緩衝器中,其中該APS資料結構包括可適用於視訊資料之一或多個片段的傳訊資料;基於該APS資料結構之該傳訊資料解碼該等片段中之至少一者;在解碼該片段後,判定可自該緩衝器移除該APS資料結構;基於該判定自該緩衝器移除該APS資料結構;及在自該緩衝器移除該APS資料結構後解碼該視訊資料之一或多個額外片段。
在另一實例中,一種編碼視訊資料之方法包括:使用一或多個參數編碼視訊資料之一或多個片段之一第一集合;在一調適參數組(APS)資料結構中傳訊該一或多個參數;及不參考該APS資料結構編碼在一或多個片段之該第一集合中之一判定之片段後的該視訊資料之一或多個片段之一第二集合。
在另一實例中,一種用於編碼視訊資料之器件包括一視訊編碼器,該視訊編碼器經組態以:使用一或多個參數編碼視訊資料之一或多個片段之一第一集合;在一調適參數組(APS)資料結構中傳訊該一或多個參數;及不參考該APS資料結構編碼在一或多個片段之該第一集合中之一判定之片段後的該視訊資料之一或多個片段之一第二集合。
在另一實例中,一種用於編碼視訊資料之器件包括:用於使用一或多個參數編碼視訊資料之一或多個片段之一第一集合之構件;用於在一調適參數組(APS)資料結構中傳訊該一或多個參數之構件;及用於不參考該APS資料結構編碼在一或多個片段之該第一集合中之一判定之片段後的該視訊資料之一或多個片段之一第二集合之構件。
在另一實例中,一種電腦可讀儲存媒體具有儲存於其上之指令,該等指令當經執行時使一處理器進行以下操作:使用一或多個參數編碼視訊資料之一或多個片段之一第一集合;在一調適參數組(APS)資料結構中傳訊該一或多個參數;及不參考該APS資料結構編碼在一或多個片段之該第一集合中之一判定之片段後的該視訊資料之一或多個片段之一第二集合。
在隨附圖式及以下描述中闡明了一或多個實例之細節。根據描述及圖式且根據申請專利範圍,其他特徵、目標及優勢將顯而易見。
一般而言,本發明描述用於視訊資料之寫碼之技術。視訊資料通常包括經寫碼之資料及用於傳訊經寫碼之資料之特性的語法資料。經寫碼之資料包括用於形成預測資料之資料,諸如,用於圖框之寫碼單元(CU)的預測單元(PU),以及用於CU之變換單元(TU)的量化變換係數。
一類型之語法資料為自適應迴路濾波器(ALF)係數。在一些情況下,應用濾波器以解碼視訊資料,例如,以將視
訊資料解區塊。當由視訊寫碼器件應用為寫碼程序之部分時,此等濾波器被稱為經「迴路內」應用,因為可將經濾波之資料用作隨後寫碼之視訊資料的參考,亦即,支援預測寫碼。詳言之,可將濾波器資料添加至經解碼圖片緩衝器(DPB),用於在預測寫碼中使用。視訊編碼器可個別地(例如,視訊資料之每個圖框或每個片段個別地)判定用於ALF之濾波器係數,且將該等係數作為語法資料編碼於位元串流中。
另一類型之語法資料為樣本自適應偏移(SAO)參數。殘餘資料指待寫碼之區塊與預測區塊之間的像素差資料。可將殘餘資料自空間域變換至變換域。將變換應用至殘餘資料產生變換係數,可在頻域中表達變換係數,因此,TU可具有表達基頻之一直流(DC)係數,及複數個交流(AC)係數。在一些情況下,用於基頻之係數可由作為語法資料傳訊之一偏移值修改。額外或替代性地,AC係數中之一或多者之值亦可由偏移值修改。可將此等偏移值作為SAO參數加以傳訊。
高效率視訊寫碼(HEVC)已引入調適參數組(APS)資料結構,其傳訊用於視訊資料之一或多個片段的各種參數(諸如,ALF係數及SAO參數)。亦即,APS資料結構可應用於單一片段,或可應用於複數個片段。一片段可使用多個APS,且一APS可應用於一個以上片段。每一APS包括一識別符(ID)值,且片段可藉由傳訊APS之ID來指示該APS應用於該片段。APS之ID值可唯一地識別用於對應的位元
串流之APS。
如在HEVC之工作草案6中定義,APS包括:當sample_adaptive_offset_enabled_flag或adaptive_loop_filter_enabled_flag中之至少一者等於1時,可由一或多個經寫碼之圖片的經寫碼之片段NAL單元參考之參數。最初在解碼程序之操作開始時,不將每一調適參數組RBSP[原始位元組序列有效負載]當作在作用中的。在解碼程序之操作期間的任一給定時刻,將至多一個調適參數組RBSP當作在作用中的,且任一特定調適參數組RBSP之啟動導致先前在作用中之調適參數組RBSP(若有)的去啟動。
當一調適參數組RBSP(具有一特定值aps_id)並不在作用中且其由經寫碼之片段NAL單元參考(使用彼aps_id值)時,其經啟動。此調適參數組RBSP被叫作作用中調適參數組RBSP,直至其由另一調適參數組RBSP之啟動而去啟動為止。具有彼特定aps_id值之調適參數組RBSP應在其啟動前可用於解碼程序。
以上描述闡明於HEVC WD6第67頁處。
如同諸如序列參數組(SPS)及圖片參數組(PPS)之其他參數組資料結構,APS習知地儲存於視訊寫碼器件(例如,視訊解碼器)之緩衝器中,直至經寫碼之視訊序列的末尾。然而,APS包括比SPS及PPS多得多的資料。本發明提供用於比HEVC之習知技術更有效率地處置APS之記憶體管理技術。
在一些實例中,APS包括指示不再需要一或多個先前APS之資料。因此,回應於接收到包括指示不再需要先前APS之資料的當前APS,視訊解碼器可自緩衝器刪除由當前APS指示之先前APS,從而在緩衝器中提供額外空間。
額外或替代性地,每一APS可包括一指示將APS使用一次抑或一次以上之旗標。若僅將APS使用一次,則一旦隨後片段已經解碼,即可刪除該APS。另一方面,若將APS使用一次以上(如由旗標指示),則可針對經解碼之視訊序列中的其餘片段儲存該APS,或儲存該APS直至該APS被指示為不再需要為止,例如,如上文所論述。
作為另一實例,可能存在待在任一時間儲存於緩衝器中的APS之最大數目之顯式指示。若緩衝器包括最大數目個APS且接收到一新的APS,則可自緩衝器移除一APS,例如,按先進先出(FIFO)次序。或者,可按以下方式指派ID值:ID值指示APS的儲存之優先權,且因此當當前儲存了最大數目個APS時,可移除具有低優先權之APS(基於與其他儲存之APS之ID值相比的該APS的ID值)。亦即,編碼器可保證在未來將不需要此等APS,或若需要實質上類似於此等APS之資料,則編碼器將在位元串流之未來區段中提供此資料,使得可安全地移除該等APS。舉例而言,可按漸增方式指派APS之ID值,使得較低ID值指示較低優先權,或可將較大ID值指派給被預見將比其他APS更頻繁地使用之APS。
在一些實例中,可自一或多個先前APS預測一APS之全
部或一部分。舉例而言,該APS可包括以下指示:其ALF係數與第一個先前APS相同,且其SAO參數與第二個先前APS相同。或者,可顯式地傳訊ALF係數或SAO參數中之一者,且可將其他者指示為與先前APS之彼等者相同。在此情況下,與經寫碼之圖片相關聯的APS可受限於僅參考與具有相等或較低temporal_ID值之經寫碼之圖片相關聯的APS,使得子位元串流提取並不阻礙對相依APS之使用。
在一些實例中,APS可僅參考自從上個隨機存取點以來已接收之先前APS。此外,在一些實例中,在隨機存取點後,可自緩衝器移除所有APS。
本發明亦提議一些對HEVC之APS進行某些修改之實例。舉例而言,除了以上論述之語法資料之外或替代以上論述之語法資料,APS可傳訊參考圖片清單修改資料、參考圖片清單組合資料、記憶體管理控制操作語法資料及/或加權預測表中的任何者或所有者。因此,APS可包括包含以下各者中之一或多者的傳訊資料:ALF係數、SAO參數、參考圖片清單修改資料、參考圖片清單組合資料、記憶體管理控制操作語法資料及/或加權預測表。以此方式,經解碼圖片緩衝器管理(例如,經由記憶體管理控制操作(MMCO)語法表及/或加權預測表)亦可包括至APS內。
亦可在APS中傳訊其他片段或圖片層級資訊,諸如,量化矩陣。一般而言,在APS中可存在或不存在任一組資訊。若彼組不存在於一特定APS中,則該APS可參考一不同APS以得到彼組資訊,且一APS可參考多個APS以得到
不同組之資訊。舉例而言,一APS可傳訊SAO參數,但參考第一不同APS以獲得量化矩陣,參考第二不同APS以獲得ALF參數,且甚至參考第三APS以獲得經解碼圖片緩衝器管理及參考圖片清單建構。
圖1為說明可利用用於利用調適參數組(APS)資料結構之技術的一實例視訊編碼及解碼系統10之方塊圖。APS資料結構亦可被稱作調適片段參數組,因為APS通常包括用於片段之參數。如圖1中所示,系統10包括一源器件12,其經由通信頻道16將經編碼之視訊傳輸至目的地器件14。源器件12及目的地器件14可包含廣泛範圍的器件中之任何者。在一些情況下,源器件12及目的地器件14可包含無線通信器件,諸如,無線手機、所謂的蜂巢式或衛星無線電電話或可在通信頻道16上傳達視訊資訊之任何無線器件,在該情況下,通信頻道16為無線的。然而,本發明之關於利用APS資料結構的技術未必限於無線應用或環境。舉例而言,此等技術可應用於空中電視廣播、有線電視傳輸、衛星電視傳輸、網際網路視訊傳輸、經編碼於儲存媒體上的經編碼之數位視訊或其他情形。因此,通信頻道16可包含適合於傳輸或儲存經編碼之視訊資料的無線、有線或儲存媒體之任一組合。
在圖1之實例中,源器件12包括一視訊源18、視訊編碼器20、一調變器/解調變器(數據機)22及一傳輸器24。目的地器件14包括一接收器26、一數據機28、一視訊解碼器30及一顯示器件32。根據本發明,源器件12之視訊編碼器20
可經組態以應用用於利用APS資料結構之技術。在其他實例中,源器件及目的地器件可包括其他組件或配置。舉例而言,源器件12可自外部視訊源18(諸如,外部攝影機)接收視訊資料。同樣地,目的地器件14可與外部顯示器件介面連接,而非包括整合式顯示器件。
圖1之所說明系統10僅為一實例。用於利用APS資料結構之技術可由任一數位視訊編碼及/或解碼器件執行。雖然通常本發明之技術由視訊編碼器件執行,但該等技術亦可由視訊編碼器/解碼器(通常被稱作「CODEC」)執行。此外,本發明之技術亦可由視訊預處理器執行。源器件12及目的地器件14僅為此等寫碼器件之實例,其中源器件12產生用於傳輸至目的地器件14的經寫碼之視訊資料。在一些實例中,器件12、14可以實質上對稱的方式操作使得器件12、14中之每一者包括視訊編碼及解碼組件。因此,系統10可支援視訊器件12、14之間的單程或雙程視訊傳輸,例如,用於視訊串流、視訊播放、視訊廣播或視訊電話。
源器件12之視訊源18可包括視訊捕獲器件,諸如,視訊攝影機、含有先前捕獲之視訊的視訊存檔及/或來自視訊內容提供者之視訊饋入。作為另一替代,視訊源18可產生基於電腦圖形之資料作為源視訊,或實況視訊、存檔視訊與電腦產生之視訊的組合。在一些情況下,若視訊源18為視訊攝影機,則源器件12及目的地器件14可形成所謂的相機電話或視訊電話。然而,如上文提到,本發明中描述之技術一般可適用於視訊寫碼,且可應用於無線及/或有線
應用。在每一情況下,經捕獲之、預捕獲之或電腦產生之視訊可由視訊編碼器20編碼。經編碼之視訊資訊可接著由數據機22根據通信標準加以調變,且經由傳輸器24傳輸至目的地器件14。數據機22可包括各種混頻器、濾波器、放大器或經設計用於信號調變之其他組件。傳輸器24可包括經設計用於傳輸資料之電路,包括放大器、濾波器及一或多個天線。
目的地器件14之接收器26在頻道16上接收資訊,且數據機28解調變資訊。再次地,視訊編碼程序可實施本文中描述的技術中之一或多者以利用APS資料結構。在頻道16上傳達之資訊可包括亦由視訊解碼器30使用的由視訊編碼器20定義之語法資訊,其包括描述區塊及其他經寫碼單元(例如,GOP)之特性及/或處理的語法元素。顯示器件32對使用者顯示經解碼之視訊資料,且可包含各種各樣的顯示器件中之任一者,諸如,陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
在圖1之實例中,通信頻道16可包含任一無線或有線通信媒體,諸如,射頻(RF)頻譜或一或多個實體傳輸線或無線與有線媒體之任何組合。通信頻道16可形成基於封包之網路的部分,諸如,區域網路、廣域網路或全球網路(諸如,網際網路)。通信頻道16通常表示用於將視訊資料自源器件12傳輸至目的地器件14之任何合適的通信媒體或不同通信媒體之集合,包括有線或無線媒體之任一合適組
合。通信頻道16可包括路由器、交換器、基地台或可適用於促進自源器件12至目的地器件14之通信的任一其他設備。在其他實例中,源器件12可將經編碼之資料儲存於儲存媒體上,而非傳輸資料。同樣地,目的地器件14可經組態以自諸如Blu-Ray光碟、DVD光碟、隨身碟或類似者之儲存媒體擷取經編碼之資料。
視訊編碼器20及視訊解碼器30可根據視訊壓縮標準操作,諸如,ITU-T H.264標準,或者被稱作MPEG-4第10部分進階視訊寫碼(AVC)。然而,本發明之技術不限於任一特定寫碼標準。其他實例包括MPEG-2及ITU-T H.263。儘管在圖1中未圖示,但在一些態樣中,視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當MUX-DEMUX單元或其他硬體及軟體,以處置在共同資料串流或分開的資料串流中的音訊及視訊兩者之編碼。若可適用,則MUX-DEMUX單元可遵照ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。
視訊編碼器20及視訊解碼器30各自可實施為各種各樣的合適編碼器電路中之任一者,諸如,一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其任一者可整合為各別相機、電腦、行動器件、用戶器件、廣播器件、機上盒、伺服器或類似者中的組合式編碼器/解碼器(CODEC)之部
分。
當前正在努力開發新的視訊寫碼標準,其當前被稱作高效率視訊寫碼(HEVC)。即將到來的標準也被稱作H.265。標準化努力係基於被稱作HEVC測試模型(HM)的視訊寫碼器件之模型。HM假設與根據(例如)ITU-T H.264/AVC之器件相比的視訊寫碼器件之若干能力。舉例而言,儘管H.264提供九個框內預測編碼模式,但HM提供多達三十四個框內預測編碼模式。
有時被稱作視訊序列之圖片群組(GOP)通常包括一或多個視訊圖片之一系列。GOP可在GOP之標頭、GOP之一或多個圖片之標頭中或在其他處包括語法資料,該語法資料描述包括於GOP中的若干圖片。每一圖片可包括描述各別圖片之編碼模式的圖片語法資料。每一視訊圖片可包括複數個片段,其中每一片段包括一或多個最大寫碼單元(LCU)之一系列。視訊編碼器20通常對一圖片之個別片段內之視訊區塊操作以便編碼視訊資料。一視訊區塊可對應於一區塊或一區塊之一分割區(諸如,LCU或其子CU)。視訊區塊可具有固定或變化的大小,且大小可根據所指定之寫碼標準而不同。
作為一實例,HM支援在各種PU大小下之預測。假定,一特定CU之大小為2N×2N,則HM支援在2N×2N或N×N之PU大小下之框內預測,及在2N×2N、2N×N、N×2N或N×N之對稱的PU大小下之框間預測。HM亦支援在2N×nU、2N×nD、nL×2N及nR×2N之PU大小下之用於框間預測的不
對稱分割。在不對稱分割中,CU之一方向未被分割,而另一方向被分割成25%及75%。對應於25%分割區的CU之部分由「n」接著是「上」、「下」、「左」或「右」之指示來指示。因此,舉例而言,「2N×nU」指在頂部具有2N×0.5N PU且在底部具有2N×1.5N PU的水平分割之2N×2N CU。
在本發明中,「N×N」與「N乘N」可互換使用以指代就垂直及水平尺寸而言的區塊之像素尺寸,例如,16×16個像素或16乘16個像素。一般而言,16×16區塊將在垂直方向上具有16個像素(y=16)且在水平方向上具有16個像素(x=16)。同樣,N×N區塊通常在垂直方向上具有N個像素且在水平方向上具有N個像素,其中N表示非負整數值。區塊中之像素可按列及行排列。此外,區塊未必需要在水平方向上與在垂直方向上具有相同數目個像素。舉例而言,區塊可包含N×M個像素,其中M未必等於N。
HEVC將視訊資料之區塊稱作寫碼單元(CU),其可包括一或多個預測單元(PU)及/或一或多個變換單元(TU)。在位元串流內之語法資料可定義一最大寫碼單元(LCU),就像素之數目而言,其為最大寫碼單元。一般而言,CU具有類似於H.264之巨集區塊的用途,只是CU不具有大小區別。因此,可將CU分裂成子CU。一般而言,本發明中對CU之提及可指代圖片之最大寫碼單元或LCU之子CU。可將LCU分裂成子CU,且每一子CU可進一步分裂成子CU。用於位元串流之語法資料可定義LCU可分裂之最大次數
(被稱作CU深度)。相應地,位元串流亦可定義最小寫碼單元(SCU)。本發明亦使用術語「區塊」來指代CU、PU或TU中之任一者。
LCU可與四元樹資料結構相關聯。一般而言,四元樹資料結構包括每個CU一個節點,其中根節點對應於LCU。若將CU分裂成四個子CU,則對應於該CU之節點包括四個葉節點,其中之每一者對應於子CU中之一者。四元樹資料結構之每一節點可提供用於對應的CU之語法資料。舉例而言,四元樹中之一節點可包括一分裂旗標,其指示對應於該節點之CU是否經分裂成子CU。用於CU之語法元素可被遞歸地定義,且可視該CU是否經分裂成子CU而定。若一CU未經進一步分裂,則其被稱作葉CU。在本發明中,葉CU之4個子CU亦將被稱作葉CU,儘管不存在原始葉CU之顯式分裂。舉例而言,若16×16大小之CU未經進一步分裂,則儘管16×16 CU從未被分裂,四個8×8子CU仍亦將被稱作葉CU。
此外,葉CU之TU亦可與各別四元樹資料結構相關聯。亦即,一葉CU可包括指示將該葉CU分割成TU之方式的四元樹。本發明將指示分割LCU之方式的四元樹稱作CU四元樹,且將指示將葉CU分割成TU之方式的四元樹稱作TU四元樹。TU四元樹之根節點通常對應於葉CU,而CU四元樹之根節點通常對應於LCU。TU四元樹之未經分裂的TU被稱作葉TU。
葉CU可包括一或多個預測單元(PU)。一般而言,PU表
示對應的CU之全部或一部分,且可包括用於擷取用於該PU之參考樣本的資料。舉例而言,當PU經框間模式編碼時,PU可包括定義PU之運動向量的資料。定義運動向量之資料可描述(例如)運動向量之水平分量、運動向量之垂直分量、運動向量之解析度(例如,四分之一像素精確度或八分之一像素精確度)、運動向量指向之參考圖框及/或運動向量之參考清單(例如,清單0或清單1,亦被稱作L0及L1)。定義PU的葉CU之資料亦可描述(例如)CU至一或多個PU之分割。視CU未寫碼、經框內預測模式編碼抑或經框間預測模式編碼而定,分割模式可不同。對於框內寫碼,可與以下描述之葉變換單元相同地處理PU。
葉CU可包括一或多個變換單元(TU)。可使用TU四元樹結構來指定變換單元,如上文所論述。亦即,分裂旗標可指示是否將葉CU分裂成四個變換單元。接著,每一變換單元可進一步分裂成4個子TU。當一TU未進一步分裂時,其可被稱作葉TU。通常,對於框內寫碼,屬於一葉CU之所有葉TU共用同一框內預測模式。亦即,通常應用同一框內預測模式來計算葉CU之所有TU的預測值。對於框內寫碼,視訊編碼器可使用框內預測模式計算每一葉TU之殘值,作為預測值之對應於TU的部分與原始區塊之間的差。可變換、量化及掃描該殘值。對於框間寫碼,視訊編碼器可執行在PU層級下之預測,且可計算每一PU之殘值。可變換、量化及掃描對應於葉CU之殘值。對於框間寫碼,葉TU可比PU大或小。對於框內寫碼,可使PU與一
對應的葉TU設在同一位置。在一些實例中,葉TU之最大大小可為對應的葉CU之大小。
一般而言,本發明分別使用術語CU及TU來指代葉CU及葉TU,除非另有指出。一般而言,本發明之技術係關於變換、量化、掃描及熵編碼CU之資料。作為一實例,本發明之技術包括基於用以預測區塊之框內預測模式選擇用以變換經框內預測之區塊的殘值之變換。本發明亦使用術語「方向變換」或「設計之變換」來指代此種視框內預測模式方向而定之變換。亦即,視訊編碼器可選擇一方向變換來應用於變換單元(TU)。如上文提及,框內預測包括根據一圖片的先前寫碼之CU及TU預測同一圖片的當前CU之TU。更特定言之,視訊編碼器可使用一特定框內預測模式框內預測圖片之當前TU。
根據本發明之技術,視訊編碼器20可使用一或多個參數編碼片段。此等參數可包括下列各者中之任何者或全部:自適應迴路濾波器(ALF)係數、樣本自適應偏移(SAO)參數、圖片清單修改資料、參考圖片清單組合資料、記憶體管理控制操作語法資料、加權預測表及量化矩陣。視訊編碼器20可在APS資料結構中傳訊此等參數及/或資料中之任何者或全部。視訊編碼器20或源器件12之另一元件可形成單獨的包括APS資料結構之視訊寫碼層(VCL)網路抽象層(NAL)單元。因此,VCL NAL單元可包括一APS資料結構,且另一VCL NAL單元可包括用於片段的經寫碼之資料,其中可使用在APS資料結構中傳訊之參數來寫碼該片
段。
若一APS位於一經寫碼之圖片的第一片段前且在該經寫碼之圖片的第一片段與該APS之間不存在片段,則該APS可被叫作與該經寫碼之圖片「相關聯」。此外,在一些實例中,APS可與位元串流中緊接在APS後之片段相關聯。舉例而言,當在位元串流中包括一APS之NAL單元之後緊接著包括一片段之NAL單元時,該APS可與該片段相關聯。一片段可使用多個APS,且一APS可用於多個片段。
視訊編碼器20可藉由在一位元串流之範疇內的唯一識別符來建構用於該位元串流之APS。舉例而言,視訊編碼器20可傳訊用於每一APS資料結構之aps_parameter_set_id值。APS識別符亦可被稱作作為語法元素之「aps_id」。視訊編碼器20可進一步藉由在一片段(例如,片段之標頭)中傳訊APS之識別符(ID)值來指示該片段與該APS資料結構相關聯。在一些實例中,例如,若可按其他方式判定片段與一APS相關聯,諸如,若緊接在該片段前傳訊該APS,則片段不需要包括識別APS之資訊。
根據本發明之技術,視訊編碼器20可提供(亦即,傳訊)指示何時可自諸如視訊解碼器30的視訊解碼器之緩衝器移除APS的資訊。同樣地,根據本發明之技術,視訊解碼器30可經組態以判定何時可移除APS(例如,基於由視訊編碼器20傳訊之資訊),及移除APS。以此方式,可在移除了APS後重新分配視訊解碼器30之由APS消耗的記憶體資源。因此,儘管習知地,參數組資料結構將被儲存直至完
整視訊序列之末尾,但本發明提供了用於傳訊何時自視訊解碼器之記憶體移除諸如APS之參數組資料結構及用於自視訊解碼器之記憶體移除諸如APS之參數組資料結構的技術,其可允許視訊解碼器重新分配記憶體資源且藉此更有效率地操作。
本發明亦提供用於在APS中傳訊某些片段或圖片層級資訊之技術。舉例而言,不同於在片段標頭或圖片標頭中傳訊可適用於多個片段或圖片之資訊,本發明提供用於在APS中傳訊此資料之技術,更特定言之,在一些實例中,此資料可為先前(亦即,在採用本發明之技術前)在圖片參數組中提供之資訊,包括(例如)量化矩陣。此資料可為片段標頭中之資訊,諸如,與記憶體管理控制操作語法表、參考圖片清單及/或加權預測表相關聯的資料。此外,本發明提供用於在多個APS之間重新使用此資料之技術。因此,若隨後APS將包括與先前APS相同的資料,則並非在隨後APS中傳訊共同資料,隨後APS可改為返回參考先前APS。此等技術可藉此減小隨後APS之大小,其可因此減少由每一隨後APS消耗的記憶體之量。亦即,視訊編碼器20僅需要傳訊在隨後APS中不同的資料,且在隨後APS中指示在先前APS中傳訊其他資料。
在框內預測或框間預測寫碼以產生預測資料及殘餘資料後,且在進行任何變換(諸如,離散餘弦變換(DCT))以產生變換係數後,可執行變換係數之量化。量化通常指代變換係數經量化以可能地減少用以表示係數的資料量之程
序。量化程序可減小與該等係數中之一些或所有者相關聯的位元深度。舉例而言,在量化期間可將n位元值降值捨位至m位元值,其中n大於m。
在量化後,可執行經量化之資料之熵寫碼,例如,根據內容自適應可變長度寫碼(CAVLC)、上下文自適應二進位算術寫碼(CABAC)或另一熵寫碼方法。經組態以用於熵寫碼之處理單元或另一處理單元可執行其他處理功能,諸如,量化係數之零延行長度寫碼,及/或語法資訊(諸如,寫碼區塊型樣(CBP)值、區塊類型、寫碼模式、經寫碼之單元(諸如,圖框、片段、區塊或序列)之最大區塊大小或類似者)之產生。
視訊解碼器30可最終自(例如)視訊編碼器20接收一或多個APS資料結構。然而,並非儲存APS資料結構直至經寫碼之視訊序列之末尾,視訊解碼器30可經組態以在到達經寫碼之視訊序列之末尾前移除一或多個APS資料結構。根據本發明之技術,如以下更詳細地論述,視訊解碼器30可組態有關於管理APS資料結構之一或多個記憶體管理技術,例如,APS資料結構在視訊解碼器30之緩衝器中的儲存及移除,如在本發明中所描述。
視訊編碼器20及視訊解碼器30各自可實施為各種各樣的合適編碼器或解碼器電路中之任一者(在適用時),諸如,一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯電路、軟體、硬體、韌體或其任何組合。視訊編碼器20及視
訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其中之任一者可整合為組合式視訊編碼器/解碼器(CODEC)的部分。包括視訊編碼器20及/或視訊解碼器30之裝置可包含積體電路、微處理器及/或無線通信器件(諸如,蜂巢式電話)。
圖2為說明可實施用於利用APS資料結構之技術的視訊編碼器20之一實例之方塊圖。視訊編碼器20可執行在視訊圖框內的區塊(包括區塊或區塊之分割區或子分割區)之框內及框間寫碼。框內編碼依賴於空間預測來減少或移除在給定視訊圖框內的視訊中之空間冗餘。框間寫碼依賴於時間預測來減少或移除視訊序列之鄰近圖框內的視訊中之時間冗餘。框內模式(I模式)可指代若干基於空間之壓縮模式中之任一者,及諸如單向預測(P模式)或雙向預測(B模式)之框間模式可指代若干基於時間之壓縮模式中之任一者。
如圖2中所示,視訊編碼器20接收待編碼的視訊圖框內之一當前視訊區塊。在圖2之實例中,視訊編碼器20包括運動補償單元44、運動估計單元42、框內預測單元46、參考圖框記憶體64、求和器50、變換處理單元52、量化單元54及熵寫碼單元56。為了視訊區塊重建構,視訊編碼器20亦包括反量化單元58、反變換單元60、求和器62及迴路內濾波器66。
在編碼程序期間,視訊編碼器20接收一待寫碼之視訊圖框或片段。可將圖框或片段劃分成多個視訊區塊。運動估計單元42及運動補償單元44執行相對於一或多個參考圖框
中之一或多個區塊的對接收之視訊區塊之框間預測寫碼以提供時間壓縮。框內預測單元46可執行相對於與待寫碼之區塊相同的圖框或片段中之一或多個相鄰區塊的對接收之視訊區塊之框內預測寫碼以提供空間壓縮。
模式選擇單元40可選擇寫碼模式(框內或框間)中之一者,例如,基於誤差結果,且將所得的經框內或框間寫碼之區塊提供至求和器50以產生殘餘區塊資料,且提供至求和器62以重建構經編碼之區塊以用作參考圖框。
運動估計單元42與運動補償單元44可經高度整合,但為了概念上的目的,分開地加以說明。運動估計為產生運動向量之程序,其估計視訊區塊之運動。舉例而言,運動向量可指示在一預測參考圖框(或其他經寫碼之單元)內一預測區塊相對於當前圖框(或其他經寫碼之單元)內正被寫碼之當前區塊的位移。預測區塊為被發現在像素差方面緊密匹配待寫碼之區塊的區塊,像素差可由絕對差之總和(SAD)、平方差之總和(SSD)或其他差量度判定。運動向量亦可指示區塊之一分割區之位移。運動補償可涉及基於由運動估計判定之運動向量而獲取或產生預測區塊。再次地,在一些實例中,可在功能上整合運動估計單元42與運動補償單元44。
運動估計單元42藉由將視訊區塊與參考圖框記憶體64中的參考圖框之視訊區塊比較來計算用於經框間寫碼之圖框之視訊區塊的運動向量。運動補償單元44亦可內插參考圖框之次整數像素,例如,I圖框或P圖框。舉例而言,兩個
清單可包括參考圖框:清單0,其包括具有比正編碼之當前圖框早的顯示次序之參考圖框;及清單1,其包括具有比正編碼之當前圖框晚的顯示次序之參考圖框。因此,可根據此等清單組織儲存於參考圖框記憶體64中之資料。
運動估計單元42將來自參考圖框記憶體64的一或多個參考圖框之區塊與當前圖框(例如,P圖框或B圖框)的待編碼之區塊比較。當參考圖框記憶體64中之參考圖框包括次整數像素之值時,由運動估計單元42計算之運動向量可涉及參考圖框之次整數像素位置。若無次整數像素位置之值儲存於參考圖框記憶體64中,則運動估計單元42及/或運動補償單元44亦可經組態以計算儲存於參考圖框記憶體64中的參考圖框之次整數像素位置之值。運動估計單元42將計算之運動向量發送至熵寫碼單元56及運動補償單元44。由運動向量識別之參考圖框區塊可被稱作預測區塊。
運動補償單元44可基於預測區塊計算預測資料。視訊編碼器20藉由自正寫碼之原始視訊區塊減去來自運動補償單元44之預測資料而形成殘餘視訊區塊。求和器50表示執行此減法運算的該或該等組件。變換處理單元52將變換(諸如,離散餘弦變換(DCT)或概念上類似的變換)應用至殘餘區塊,從而產生包含殘餘變換係數值之視訊區塊。變換處理單元52可執行諸如由H.264標準定義之變換的其他變換,其概念上類似於DCT。亦可使用小波變換、整數變換、子頻帶變換或其他類型之變換。在任一情況下,變換處理單元52將變換應用至殘餘區塊,從而產生殘餘變換係
數之區塊。變換可將殘餘資訊自像素值域轉換至變換域(諸如,頻域)。量化單元54量化殘餘變換係數以進一步減小位元率。量化程序可減小與該等係數中之一些或所有者相關聯的位元深度。可藉由調整量化參數來修改量化之程度。
在量化後,熵寫碼單元56熵寫碼經量化之變換係數及語法元素。舉例而言,熵寫碼單元56可執行內容自適應可變長度寫碼(CAVLC)、上下文自適應二進位算術寫碼(CABAC)或另一熵寫碼技術。在由熵寫碼單元56進行了熵寫碼後,經編碼之視訊可被傳輸至另一器件或被存檔用於稍後傳輸或擷取。在上下文自適應二進位算術寫碼之情況下,上下文可至少部分基於相鄰區塊之資料。
在一些情況下,熵寫碼單元56或視訊編碼器20之另一單元可經組態以除了熵寫碼之外亦執行其他寫碼功能。舉例而言,熵寫碼單元56可經組態以判定區塊及分割區之CBP值。又,在一些情況下,熵寫碼單元56可執行區塊或其分割區中的係數之延行長度寫碼。詳言之,熵寫碼單元56可應用曲折掃描或其他掃描型樣以掃描區塊或分割區中之變換係數且編碼連串的零以用於進一步壓縮。熵寫碼單元56亦可藉由適當語法元素建構標頭資訊以用於在經編碼之視訊位元串流中傳輸。
反量化單元58及反變換單元60分別應用反量化及反變換以重建構像素域中之殘餘區塊,例如,用於稍後用作參考區塊。運動補償單元44可藉由將殘餘區塊加至參考圖框記
憶體64的圖框中之一者之預測區塊來計算參考區塊。運動補償單元44亦可將一或多個內插濾波器應用至經重建構之殘餘區塊以計算用於在運動估計中使用之次整數像素值。求和器62將經重建構之殘餘區塊加至由運動補償單元44產生之經運動補償之預測區塊以產生經重建構之視訊區塊,以用於儲存於參考圖框記憶體64中。經重建構之視訊區塊可由運動估計單元42及運動補償單元44用作參考區塊以框間寫碼隨後視訊圖框中之區塊。
在圖2之實例中,視訊編碼器20亦包括迴路內濾波器66。迴路內濾波器66可執行自適應濾波技術,例如,以將儲存於參考圖框記憶體64中的視訊資料之圖框解區塊。在此實例中,迴路內濾波器66執行自適應濾波。亦即,迴路內濾波器自適應地修改濾波係數(被稱作自適應迴路濾波器(ALF)係數)以改良濾波結果。可在包括使用由迴路內濾波器66使用之ALF係數濾波之區塊的片段之APS中傳訊彼等ALF係數。此外,根據本發明之技術,隨後APS可重新使用先前APS之ALF係數,例如,藉由參考包括待由隨後APS使用之ALF係數的APS之APS ID。以此方式,隨後APS自身不需要直接傳訊ALF係數之值,此可減小隨後APS之大小。
根據本發明之技術,可將相同的ALF係數用於共同片段中之所有區塊。視訊編碼器20可在用於該片段之APS中傳訊ALF係數,且該片段可包括對APS之參考,例如,APS ID之指示。此外,視訊編碼器20可將相同的ALF係數用於
多個不同片段。因此,片段中之每一者可參考同一APS,以使用相同的ALF係數。或者,若使用不同參數寫碼片段之其他態樣,則視訊編碼器20可提供用於此等其他片段之不同APS,以捕獲經傳訊之參數之差異。如下文所論述,視訊編碼器20可在每一APS中提供ALF係數,或視訊編碼器20可包括對包括ALF係數的先前APS之參考(假定視訊編碼器20使用相同的ALF係數寫碼隨後片段)。
變換處理單元52可將樣本自適應偏移(SAO)應用至一或多個變換係數,例如,直流(DC)係數及/或交流(AC)係數。變換處理單元52可將相同的SAO參數應用至片段、圖框、序列、GOP或視訊資料之其他經寫碼單元之TU。根據本發明之技術,視訊編碼器20亦可(額外或替代性地)在APS資料結構中傳訊用於一或多個片段之SAO參數。
量化單元54可使用量化矩陣連同指定量化參數將量化應用於TU之變換係數。量化單元54可將應用矩陣應用至片段、圖框、序列、GOP或視訊資料之其他經寫碼單元。根據本發明之技術,視訊編碼器20亦可(額外或替代性地)在APS資料結構中傳訊用於一或多個片段之量化矩陣。
額外地,或替代性地,視訊編碼器20可在APS資料結構中傳訊其他參數。舉例而言,除了以上論述之其他資料之外或替代以上論述之其他資料,視訊編碼器20可在APS資料結構中傳訊圖片清單修改資料、參考圖片清單組合資料、記憶體管理控制操作語法資料及加權預測表中的任何者或全部。舉例而言,視訊編碼器20可在APS資料結構中
傳訊針對圖片清單修改資料操縱參考圖框記憶體64之方式及/或組合兩個清單(例如,L0及L1)以形成組合式參考圖片清單之方式。
此外,根據本發明之技術,視訊編碼器20可提供指示何時可移除特定APS的資訊。因此,接收此資訊的諸如視訊解碼器30之視訊解碼器可在視訊序列之末尾前刪除APS。作為一實例,APS可保持在作用中,直至傳訊了隨後的APS,在該情況下,可刪除先前APS。因此,視訊編碼器20可藉由僅提供隨後APS來指示可刪除先前APS。
或者,視訊編碼器20可在每一APS中提供指示是否可刪除一或多個先前提供之APS的旗標或其他值。舉例而言,視訊編碼器20可提供指示是否可安全地刪除緊接在前的APS之旗標。作為另一實例,視訊編碼器20可在隨後APS中包括一或多個APS ID值,其中APS ID值指代可安全地刪除之一或多個APS。作為再一實例,視訊編碼器20可在每一APS中包括指示該APS是否需要用於經寫碼之視訊資料之一個以上單元(例如,一個以上片段或一個以上圖片)之旗標。因此,若旗標指示APS僅需要用於一個視訊資料單元,則在寫碼彼單元後,可刪除該APS。
作為又一實例,視訊編碼器20可提供待同時儲存的APS之最大數目之指示。在提供了多於彼數目之APS後,可刪除先前儲存之APS中的一或多者。用於刪除超過所指示數目個APS的APS之策略可為(例如)先進先出(FIFO)。或者,可存在基於APS ID值的用於APS之滑動窗。舉例而言,可
基於重要性來指派APS ID,例如,在將較低值的APS ID值當作比較高值的APS ID值重要之情況下。換言之,若APS之數目超過所指示之最大數目,則可移除具有最高APS ID值之APS,直至儲存的APS之數目達到最大數目。或者,可將較低值之APS ID值當作重要性低於較高值之APS ID值。視訊編碼器20可指派APS ID使得APS ID值始終增大,或可判定一特定APS有可能更重要,且相應地指派APS ID。
視訊編碼器20可經組態以根據時間階層來寫碼資料以獲得時間可擴充性。亦即,視訊編碼器20可將各種時間識別符(時間ID)值指派至圖片。作為一實例,具有時間ID「0」之圖片可用以產生15個圖框每秒(fps)之視訊播放,可與具有時間ID「0」之圖片相結合使用具有時間ID「1」之圖片以產生30 fps之視訊播放,等等。更通常地,具有時間ID「N」之圖片當與具有小於N的時間ID之圖片組合時可用以產生圖框率大於使用具有高達「N-1」的時間ID之圖片的情況但小於使用具有高於N的時間ID之圖片的情況的播放。
視訊編碼器20可使APS與一或多個時間層處之片段或圖片相關聯。因此,視訊編碼器20亦可將時間ID指派至APS。視訊編碼器20可進一步強制執行以下約束:當APS具有N之時間ID時,具有小於N之時間ID的片段並不參考具有N之時間ID的APS。以此方式,若諸如視訊解碼器30之視訊解碼器執行時間可擴充性(在該情況下,視訊解碼
器不接收具有等於或大於N之時間ID的視訊資料),則該視訊解碼器將仍能夠解碼接收之視訊資料。
此外,視訊編碼器20可釋放APS ID值。通常,在已使用了APS ID值後,彼APS ID與其對應的APS相關聯。然而,在已自記憶體移除APS後,視訊編碼器20可使APS ID與包括彼APS ID之APS不相關聯。以此方式,可重新使用該APS ID,例如,在不同APS中。
此外,視訊編碼器20可週期性地清空儲存之APS。舉例而言,在瞬時解碼器再新(IDR)圖片後,視訊編碼器20可假定已自解碼器記憶體清除所有APS。以此方式,在IDR圖片後之圖片及片段可僅參考出現在IDR圖片後之APS。此外,視訊編碼器20可釋放與在IDR圖片前之APS相關聯的APS ID,使得視訊編碼器20可重新使用此等APS ID,而不帶來不確定性。以此方式,此等技術可支援隨機存取,因為視訊解碼器可成功地解碼開始於IDR隨機存取點(RAP)處之視訊位元串流,而無需擷取IDR RAP前之資料,諸如,在IDR RAP前傳訊之APS資料。
如上文所論述,在一些實例中,視訊編碼器20可重新使用APS之間的資料。亦即,若隨後APS包括與先前APS之參數資料相同的參數資料,則隨後APS可僅包括針對彼參數資料的對先前APS之參考,而非重複地傳訊相同的參數資料。舉例而言,若先前APS傳訊ALF係數及SAO參數,且視訊編碼器20使用相同的ALF係數但不同的SAO參數編碼隨後片段,則視訊編碼器20可建構傳訊不同SAO參數、
但包括對先前APS之ALF係數的參考之隨後APS。以此方式,視訊編碼器20可避免重複地在多個APS中傳訊相同的APS參數,其可避免浪費諸如視訊解碼器30之視訊解碼器中的頻寬、儲存空間及緩衝器資源。此外,隨後APS可參考多個不同APS以獲得不同參數。亦即,隨後APS可包括針對第一參數的對第一先前APS的第一參考,及針對第二不同參數的對第二不同APS的第二參考。
以此方式,視訊編碼器20表示經組態以進行以下操作的視訊編碼器之一實例:使用一或多個參數編碼視訊資料之一或多個片段之一第一集合;在一調適參數組(APS)資料結構中傳訊該一或多個參數;及不參考該APS資料結構編碼在一或多個片段之該第一集合中之一判定之片段後的該視訊資料之一或多個片段之一第二集合。
圖3為說明可實施用於利用APS資料結構之技術的視訊解碼器30之一實例之方塊圖。在圖3之實例中,視訊解碼器30包括一熵解碼單元70、運動補償單元72、框內預測單元74、反量化單元76、反變換單元78、包括參考圖框記憶體82之記憶體84、迴路內濾波器86及求和器80。在一些實例中,視訊解碼器30可執行通常與關於視訊編碼器20(圖2)描述之編碼遍次互逆的解碼遍次。運動補償單元72可基於自熵解碼單元70接收之運動向量產生預測資料。
一般而言,如下更詳細地解釋,根據本發明之技術,視訊解碼器30接收APS資料結構且將其儲存於記憶體84中。此外,視訊解碼器30可在對應的視訊序列之末尾前刪除儲
存之APS 88中之一或多者。舉例而言,視訊解碼器30可在接收隨後IDR RAP前刪除儲存之APS 88中之一或多者。同樣,儲存之APS 88可參考一或多個其他儲存之APS 88,使得視訊解碼器30可在解碼單一片段時自儲存之APS 88中的兩者或兩者以上擷取資料。此外,儲存之APS 88可提供關於習知HEVC技術之APS的額外資料,如下文所解釋。
運動補償單元72可使用在位元串流中接收之運動向量識別在記憶體84之參考圖框記憶體82中之參考圖框中的預測區塊。框內預測單元74可使用在位元串流中接收之框內預測模式而根據空間鄰近區塊形成預測區塊。反量化單元76反量化(亦即,解量化)在位元串流中提供且由熵解碼單元70解碼之量化區塊係數。反量化程序可包括習知程序,例如,如由H.264解碼標準定義的程序。反量化程序亦可包括使用由編碼器50針對每一區塊計算之量化參數QPY判定量化之程度,及同樣地,應應用的反量化之程度。根據本發明之技術,反量化單元76可自儲存之APS 88中的一或多者接收一或多個量化矩陣以執行反量化。
反變換單元58將反變換(例如,反DCT、反整數變換或概念上類似之反變換程序)應用至變換係數以便在像素域中產生殘餘區塊。運動補償單元72產生經運動補償之區塊(可能執行基於內插濾波器之內插)。待用於具有次像素精密度之運動估計的內插濾波器之識別符可包括於語法元素中。運動補償單元72可使用如由視訊編碼器20在視訊區塊之編碼期間使用之內插濾波器計算參考區塊之次整數像素
之內插值。運動補償單元72可根據接收之語法資訊(例如,如在APS中所提供)判定由視訊編碼器20使用之內插濾波器,且使用該等內插濾波器產生預測區塊。
運動補償單元72使用語法資訊中之一些判定:用以編碼經編碼視訊序列之圖框的區塊之大小、描述分割經編碼視訊序列之圖框的每一區塊之方式的分割區資訊、指示編碼每一分割區之方式的模式、用於每一框間編碼之區塊或分割區的一或多個參考圖框(及參考圖框清單),及用以解碼經編碼視訊序列的其他資訊。
求和器80將殘餘區塊與由運動補償單元72或框內預測單元產生之對應的預測區塊求和以形成經解碼之區塊。如圖3中所示,可應用由迴路內濾波器86表示之解區塊濾波器以濾波經解碼之區塊,以便移除方塊效應假影。根據本發明之技術,迴路內濾波器86自儲存之APS 88中的一或多者接收ALF係數,且使用該等ALF係數來濾波求和器80之輸出。舉例而言,迴路內濾波器86可自儲存之APS 88中的當前片段對應於的一者(例如,如由在當前片段之片段標頭中傳訊的APS識別符指示)擷取ALF係數。以此方式,視訊解碼器30可以實質上類似於視訊編碼器20之解碼程序(由反量化單元58、反變換單元60、求和器62及迴路內濾波器66(圖2)表示)的方式解碼且濾波視訊區塊。接著將經解碼之視訊區塊儲存於參考圖框記憶體82中,參考圖框記憶體82提供用於隨後運動補償之參考區塊,且亦產生經解碼之視訊以用於在顯示器件(諸如,圖1之顯示器件32)上呈現。
視訊解碼器30可接收由(例如)視訊編碼器20形成之APS資料結構。視訊解碼器30可進一步解碼APS資料結構且將其儲存於諸如記憶體84之記憶體中。儲存之APS 88表示儲存於視訊解碼器30之記憶體84中的APS之實例。然而,應理解,APS未必儲存於與參考圖框記憶體82相同的記憶體中。在一些實例中,當視訊解碼器30剖析APS且將其儲存於記憶體84中時,其可被臨時儲存且接著被移除,例如,在解碼了隨後片段時或當解碼了包括APS對應於的片段的整個相關聯之圖片時。一般而言,視訊解碼器30接收指示何時可自記憶體84移除儲存之APS 88中的一者之資訊,例如,自視訊編碼器20。記憶體84亦可被稱作「緩衝器」,或可包括被配置作為用於儲存根據本發明之技術的APS資料結構之緩衝器的一部分。在一些實例中,熵解碼單元70可將APS資料直接提供至記憶體84。
在一些實例中,可將一旗標添加至APS,該旗標指示此APS顯式地將先前APS中之至少一者標記為不再需要用於未來使用。若藉由此旗標或其他語法元素將儲存之APS 88中的一者標記為不需要,則視訊解碼器30可自記憶體(例如,記憶體84)刪除經標記的經解碼之APS。在一些實例中,就在APS包含之圖片經解碼後將一旗標添加至APS,該旗標指示可能需要儲存之APS 88中的一對應者以用於未來使用。視訊解碼器30可刪除儲存之APS 88中的具有此種指示不需要將該APS用於未來使用之旗標的一或多者,但儲存旗標指示進一步需要該APS之APS。
在一些實例中,視訊解碼器30之組態資料可指定可儲存於記憶體84中的儲存之APS 88之最大數目。待在記憶體84中緩衝的APS之最大數目可在其他參數組中(諸如,在序列參數組或圖片參數組中)傳訊。可將此數目設定為參考圖框之最大數目或經解碼圖片之最大數目。此外,可使用用於APS之自動機制。舉例而言,視訊解碼器30可使用基於APS之ID值的滑動窗。在此實例中,若解碼器緩衝器(例如,記憶體84)中的儲存之APS 88之當前數目等於APS之最大數目,則可自緩衝器移除具有最大數目之ID的APS。在此情況下,可對不常使用之APS指派相對較大的值。在另一實例中,視訊解碼器30可根據先進先出(FIFO)定序機制移除APS。亦即,當自記憶體84移除儲存之APS 88中的一者之時間到來時,儲存之APS 88中的第一個儲存至記憶體84中的APS為第一個被從記憶體84移除之APS。
在一些實例中,可使用用於指派APS之ID值的兩個機制。在一些實例中,APS的ID值始終增大。以此方式,視訊解碼器30可在判定了應刪除儲存之APS 88中的一或多者後移除儲存之APS 88中的接收時間最久的APS。在另一實例中,對被預見將進一步使用之APS指派相對較大的id,且對將不被按解碼次序在當前圖片後之圖片所使用之APS指派相對大的值。以此方式,視訊解碼器30可在判定應刪除儲存之APS 88中的一或多者後刪除具有相對較大的APS ID值之儲存之APS 88。
可添加約束使得與temporal_id等於一特定temporal_id
(TID)的經寫碼之圖片相關聯的任一APS將不被temporal_id小於TID的圖片參考。或者,若在APS之NAL單元標頭中傳訊TID,則約束可指定temporal_ID必須與APS的相關聯之圖片中的其他VCL NAL單元相同,且不應由temporal_id小於特定TID的片段參考。因此,視訊解碼器30可解碼為了執行時間可擴充性之目的而提取之子位元串流,而無需任何額外傳訊資訊。亦即,用於在特定時間層處之片段及圖片的APS之所有傳訊資料將處於彼特定層處或低於彼特定層,使得可確保視訊解碼器30接收到用於彼等片段及圖片之APS資料。
在一些實例中,視訊解碼器30可接收指示APS ID值之釋放的資料。亦即,此資料可指示應釋放一APS ID值,使得可對新的不同APS指派該同一APS ID值。另外或替代性地,視訊解碼器30可經組態使得在任一隨機存取點後,清除解碼器緩衝器(例如,記憶體84)中的所有儲存之APS 88,亦即,被拋棄或以其他方式移除或被標記為自記憶體84移除。亦即,具有比隨機存取點圖片晚的輸出或解碼次序之任一圖片可僅參考與當前圖片相關聯之APS或與按解碼次序在隨機存取點後之圖片相關聯之APS。換言之,在遇到(例如)瞬時解碼器再新(IDR)隨機存取點(RAP)後,視訊解碼器可清除所有儲存之APS 88,且接收IDR RAP後之一新APS。在此等情況下,在解碼對應於IDR RAP之圖片前,視訊解碼器30可能需要等待接收新的APS。
在一些實例中,當前APS可參考緩衝器(例如,記憶體
84)中之一先前APS,亦即,儲存之APS 88中的一者。當前APS可重新使用儲存之APS 88中的由當前APS參考的該APS之APS參數之部分,同時可顯式地傳訊當前APS之其他部分。此外,當前APS可參考仍在緩衝器中之兩個或兩個以上先前APS,例如,以獲得當前APS之不同部分。參考先前儲存之APS的APS之各種實例說明於圖6中且關於圖6加以描述,如下文詳細地解釋。
在一些實例中,亦可在APS中傳訊包括參考圖片清單修改及參考圖片清單組合的有關於參考圖片清單建構之語法表。因此,視訊解碼器30可基於在APS中傳訊之資料組合清單0與清單1以形成組合式清單。類似地,在一些實例中,經解碼圖片緩衝器管理(例如,記憶體管理控制操作(MMCO)語法表及/或加權預測表)亦可包括至APS內。因此,視訊解碼器30可使用此資料判定何時自參考圖框記憶體82移除圖片、執行各種MMCO及/或將權數指派至參考圖框記憶體82之資料(例如,圖片之像素值)。權數可對應於(例如)加權之雙向預測,在該情況下,根據兩個圖片預測一區塊,兩個圖片中之一者的權數比另一者重。亦即,當運動補償單元72計算雙向預測區塊之預測值時,兩個圖片中之一者可比另一者對預測值有更強的影響,如由權數及APS中指示之其他資料所指示。
亦可在APS中傳訊其他片段或圖片層級資訊,諸如,量化矩陣。一般而言,在APS中可存在或不存在任一組資訊。亦即,可在APS中傳訊可應用於一或多個片段的參數
之任一組。若彼組不存在於一特定APS中,則此APS可參考一不同的APS(例如,儲存之APS 88中的先前儲存之一APS)以得到彼組資訊,且一APS可參考多個APS以得到不同組之資訊。舉例而言,一APS可傳訊SAO參數,但參考儲存之APS 88中的第一不同APS以獲得量化矩陣,參考儲存之APS 88中的第二不同APS以獲得ALF參數,且甚至參考儲存之APS 88中的第三APS以獲得經解碼圖片緩衝器管理及參考圖片清單建構資訊。因此,視訊解碼器30可自儲存之APS 88中的一或多者擷取資料以解碼當前片段。
以此方式,視訊解碼器30表示經組態以進行以下操作的視訊解碼器之一實例:將一調適參數組(APS)資料結構儲存於一寫碼器件之一緩衝器中,其中該APS資料結構包括可適用於視訊資料之一或多個片段的傳訊資料;基於該APS資料結構之該傳訊資料解碼該等片段中之至少一者;在解碼該片段後,判定可自該緩衝器移除該APS資料結構;基於該判定自該緩衝器移除該APS資料結構;及在自該緩衝器移除該APS資料結構後解碼該視訊資料之一或多個額外片段。
下表1說明序列參數組(SPS)資料結構之一實例句法(syntactic)結構。在此實例中,SPS資料結構傳訊待儲存於記憶體84中的APS之最大數目。雖然可儲存額外APS(例如,基於視訊解碼器30之實施),但SPS之此資訊指示在已超過了APS資料結構之最大數目後,可安全地拋棄(清除、移除、拋棄、覆寫、標記為不再需要或類似者)一或多個
APS,而不損害位元串流之可解碼性。
在此實例中,max_num_APSs指定可在解碼器緩衝器中緩衝的最大APS數目。在此情況下,(例如,用於視訊解碼器30之組態資料的)MaxNumAPSs可設定至max_num_APSs。
下表2提供APS參數組之語法。
在此實例中,等於1之ref_aps_flag指示用於按解碼次序在當前圖片後之圖片的此APS儲存於解碼器記憶體中。等於0之此旗標指示此APS僅臨時地儲存於記憶體中,且將在完全解碼了相關聯之圖片後被移除。
在此實例中,removal_aps_flag等於1指示當前APS含有
用以自解碼器緩衝器移除至少一APS之顯式傳訊。此值等於0指示當前APS不含有用以自解碼器緩衝器移除APS之顯式傳訊。注意,甚至當此旗標等於0時,在某些自動滑動窗機制之情況下,仍可能發生在緩衝器中的APS之當前數目大於或等於MaxNumAPSs。
在此實例中,num_APS_to_remove_minus1加1指示在解碼當前APS前(或後)將要自解碼器緩衝器移除的APS之數目。
在此實例中,removal_aps_id[i]指定將要自解碼器緩衝器移除的第i個APS之APS參數組id。
或者,可僅在要緩衝當前APS時調用移除程序。表3提供在此實例中APS之語法之一實例組:
根據表3中的省略號之指示,應理解,表3僅表示APS RBSP(原始位元組序列有效負載)之語法元素之一部分。APS RBSP之其他部分可發現於HEVC之WD6中。在再另一實例中,可基於當前APS之APS id傳訊APS id之差量
(delta)值。
視訊解碼器30可在解碼當前APS前或後針對移除程序執行以下解碼程序:
1.若removal_aps_flag等於1,則對於每一removal_aps_id[i](i自0至num_APS_to_remove_minus1(包括性)),若id等於removal_aps_id[i]的APS處於解碼器緩衝器中,則將其移除。
2.若removal_aps_flag等於0,則識別具有最大APS id之已在解碼器緩衝器中的APS,將其移除。
下表4為用於APS的語法之一實例組。提供表4之語法作為在HEVC WD6中定義之語法的替代。
以下提供表4之語法資料之實例的實例語義。特定言之,針對相對於在HEVC WD6中定義之APS RBSP不同的APS RBSP之元素提供語義。以下未論述的其他語法元素之語義可保持與HEVC WD6中所定義者相同。在此實例中,aps_reference_picture_list_construction_flag等於1可
指示是否在當前APS中傳訊了有關於參考圖片清單建構之語法元素。此旗標等於0可指示在片段標頭中傳訊彼等語法元素。
在此實例中,ref_aps_flag等於1可指示APS參數之部分可與先前參考APS相同,且不被傳訊。此值等於0可指示APS不參考id為ref_aps_id之先前APS。
在此實例中,reuse_alf_flag等於1可指示此APS之ALF參數與id為ref_aps_id之參考APS的ALF參數相同。此值等於0可指示在此APS中傳訊ALF參數。當不存在時,推斷reuse_alf_flag為0。
在此實例中,reuse_sao_flag等於1可指示此APS之SAO參數與id為ref_aps_id之參考APS的SAO參數相同。此值等於0可指示在此APS中傳訊SAO參數。當不存在時,可推斷reuse_sao_flag為0。
在此實例中,reuse_lists_flag等於1可指示此APS之有關於參考圖片清單之語法元素與id為ref_aps_id之參考APS的該等語法元素相同。此值等於0可指示在此APS中傳訊該等元素。當不存在時,推斷reuse_lists_flag為0。
在一些實例中,可修改片段標頭以反映由APS資料結構傳訊之資料。舉例而言,下表5提供根據本發明之技術的實例片段標頭。
在一些實例中,ref_const_in_aps_flag為在PPS或SPS中傳訊之旗標,以指示是否可在APS中傳訊有關於參考圖片清單之語法元素。
圖4為說明用於使用APS資料結構編碼視訊資料之一實例方法之流程圖。雖然關於視訊編碼器20之實例加以解釋,但應理解,圖4之方法亦可由其他視訊編碼器件(諸如,轉換編碼器)執行。此外,該方法之某些步驟可省略或按不同次序或並行地執行。
一開始,視訊編碼器20可使用一或多個參數編碼片段(150)。參數可包括ALF係數、SAO參數、圖片清單修改資料、參考圖片清單組合資料、記憶體管理控制操作語法資料、加權預測表及/或量化矩陣或其他此資料中之一或多者。視訊編碼器20可進一步在APS資料結構中傳訊該等參數中之任何者或全部(152)。在一些實例中,假定先前APS先前被輸出至位元串流內且假定儲存於視訊解碼器緩衝器中,APS之參數中之一或多者可參考一或多個先前APS。
視訊編碼器20可進一步提供指示何時可刪除APS的資訊(154)。此可發生在編碼片段及發送APS前,或編碼片段及發送APS後。舉例而言,視訊編碼器20可在隨後APS中傳訊指示可刪除在步驟152中傳訊之APS的旗標或其他語法元素,如上文所論述。或者,視訊編碼器20可傳訊待儲存
於視訊解碼器緩衝器中的APS之最大數目,例如,在SPS資料結構中。在一些實例中,資訊可為隱式的,例如,藉由提供隨後寫碼之圖片為隨機存取點(RAP)之指示。
視訊編碼器20可進一步使用一或多個參數編碼隨後片段(156)。此等參數可與用以編碼步驟150之片段的參數不同。或者,參數可與用以編碼步驟150之片段的參數相同,例如,當假定要刪除在步驟152中傳訊之APS(例如,在隨機存取點後)時。因此,視訊編碼器20可判定是否使用不同參數編碼隨後片段(158)。若視訊編碼器20不使用不同參數編碼隨後片段(158之「否」分支),則視訊編碼器20可在隨後片段之片段標頭中傳訊先前APS之APS ID(166)。另一方面,若視訊編碼器20使用一或多個不同參數編碼隨後片段(158之「是」分支),則視訊編碼器20可在隨後APS中傳訊不同參數(160)。
視訊編碼器20亦可在隨後APS中傳訊對先前APS之參考以獲得共同參數(亦即,在先前APS中傳訊的用以編碼先前片段之參數及用以編碼隨後片段之參數)(162)。此外,視訊編碼器20可在隨後片段標頭中傳訊隨後APS之APS ID值(164)。額外或替代性地,隨後APS可參考兩個或兩個以上先前APS,例如,以獲得隨後APS之不同部分。在步驟152中傳訊之APS及/或步驟158之隨後APS可應用於一或多個片段,且該一或多個片段可參考一或多個APS。此外,如上文所論述,視訊編碼器20可在隨後APS中提供可刪除一或多個先前APS(若其不再需要)之指示。在一些替代實例
中,視訊編碼器20可僅在隨後APS中提供所有參數,而非針對共同參數提供對先前APS之參考。
以此方式,圖4之方法表示包括以下步驟的方法之一實例:使用一或多個參數編碼視訊資料之一或多個片段之一第一集合;在一APS資料結構中傳訊該一或多個參數;及不參考該APS資料結構編碼在一或多個片段之該第一集合中之一判定之片段後的該視訊資料之一或多個片段之一第二集合。
圖5為說明用於使用APS資料結構解碼視訊資料之一實例方法之流程圖。雖然為了解釋之目的關於視訊解碼器30進行描述,但應理解,其他視訊解碼器件亦可執行類似方法。同樣地,該方法之步驟可按不同次序或並行地執行,且可省略某些步驟。
視訊解碼器30可接收用於一片段之一APS資料結構,其中該APS資料結構傳訊用於該片段之一或多個參數(200)。在一些實例中,該APS資料結構傳訊用於複數個片段之參數。視訊解碼器30可使用該APS資料結構解碼片段中之至少一者(202),例如,使用在該APS資料結構中傳訊之參數。此等參數可包括(例如)ALF係數、SAO參數、參考圖片清單修改資料、參考圖片清單組合資料、記憶體管理控制操作語法資料、加權預測表及/或量化矩陣或可為複數個片段或圖片共同之其他額外或替代資料。如上文所論述,APS可包括對其他先前儲存之APS的參考,使得視訊解碼器30可使用一或多個儲存之APS(例如,儲存之APS
88)的資料解碼片段。視訊解碼器30亦可判定何時可移除APS資料結構(204),例如,使用以上描述的技術中之任何者,諸如,包括於APS資料結構中之旗標、隨後APS之接收、經傳訊或以其他方式判定之待儲存於記憶體84中的APS之最大數目、待移除的APS之顯式指示或如上所述之其他技術。
基於可移除APS之判定,視訊解碼器30可移除APS資料結構(206)。在一些實例中,視訊解碼器30未必緊接在判定可移除APS資料結構後即移除APS資料結構,而可僅將APS資料結構標記為不再需要,且在垃圾收集程序期間刪除APS資料結構。視訊解碼器30可在解碼同一視訊序列之片段前自記憶體84移除一或多個APS資料結構(208)。
以此方式,圖5之方法表示包括以下步驟的方法之一實例:將一APS資料結構儲存於一寫碼器件之一緩衝器中,其中該APS資料結構包括可適用於視訊資料之一或多個片段的傳訊資料;基於該APS資料結構之該傳訊資料解碼該等片段中之至少一者;在解碼該片段後,判定可自該緩衝器移除該APS資料結構;基於該判定自該緩衝器移除該APS資料結構;及在自該緩衝器移除該APS資料結構後解碼該視訊資料之一或多個額外片段。
圖6為說明APS資料結構250、260及270之概念圖。在此實例中,APS資料結構250包括ALF係數252、SAO參數254、量化矩陣256及加權語法表258,以及由省略號指示的其他可能資料。因此,視訊編碼器20可已使用ALF係數
252、SAO參數254、量化矩陣256及加權語法表258之資料編碼片段(未圖示)。因此,視訊編碼器20可在判定用以寫碼該片段的ALF係數252、SAO參數254、量化矩陣256及加權語法表258之值後建構APS 250。視訊編碼器20亦可將一ID值(未圖示)指派至APS 250,且可建構該片段之標頭(包括對APS 250之APS ID的參考)。
以此方式,視訊解碼器30可接收APS 250及經寫碼之片段(包括對APS 250之APS ID的參考)。因此,視訊解碼器30可基於在片段標頭中傳訊之APS ID使用APS 250之ALF係數252、SAO參數254、量化矩陣256及加權語法表258解碼該片段。
隨後,視訊編碼器20可使用不同SAO參數及不同加權語法表但使用相同的ALF係數及相同的量化矩陣來編碼片段。相應地,視訊編碼器20可建構不同的APS(例如,APS 260)以傳訊不同參數,但包括對APS 250(在此實例中,先前APS)之參數的參考,使得不需要在不同APS中再生此資料。在此實例中,APS 260包括ALF係數識別符262、SAO參數264、量化矩陣識別符266及加權語法表268。ALF係數識別符262參考APS 250之ALF係數252,且量化矩陣識別符266參考APS 250之量化矩陣256,如由圖6之箭頭指示。視訊編碼器20可進一步對APS 260指派一單獨的APS ID值,且在片段之片段標頭中傳訊此APS ID值。
因此,視訊解碼器30可接收用於APS 260之資料及該片段。基於片段之APS ID值,參考APS 260,視訊解碼器30
可使用APS 260之資料解碼片段。當執行自適應迴路濾波時,視訊解碼器30可判定APS 260之ALF係數識別符262參考ALF係數252。因此,視訊解碼器30可擷取APS 250之ALF係數252以執行針對該片段之自適應迴路濾波。當執行樣本自適應偏移時,視訊解碼器30可自APS 260之SAO參數264擷取資料。當執行量化時,視訊解碼器30可判定量化矩陣識別符266參考APS 250之量化矩陣256,且因此,可擷取APS 250之量化矩陣256的資料。此外,當執行加權時,視訊解碼器30可擷取用於APS 260之加權語法表268的資料。
隨後,視訊編碼器20可使用與在APS 250中所傳訊的ALF係數相同的ALF係數、與在APS 260中所傳訊的SAO參數相同的SAO參數及新的量化矩陣及加權語法表來編碼片段。因此,視訊編碼器20可建構APS 270以包括ALF係數識別符272(參考APS 250之ALF係數252)、SAO參數識別符274(參考SAO參數264)、量化矩陣276及加權語法表278。以此方式,APS 270代表參考兩個單獨的APS以獲得待傳訊之各種參數的APS之一實例。視訊編碼器20可進一步在片段之片段標頭中傳訊用於APS 270之APS ID值。
視訊解碼器30可接收用於APS 270之資料及片段。基於片段標頭之APS ID,視訊解碼器30可判定在APS 270中傳訊之參數將用以解碼該片段。當執行自適應迴路濾波時,視訊解碼器30可判定APS 270之ALF係數識別符272參考ALF係數252。因此,視訊解碼器30可擷取APS 250之ALF
係數252以執行針對該片段的自適應迴路濾波。當執行樣本自適應偏移時,視訊解碼器30可判定SAO參數識別符274參考SAO參數264。因此,視訊解碼器30可自APS 260之SAO參數264擷取資料。當執行量化時,視訊解碼器30可擷取APS 270之量化矩陣276的資料。此外,當執行加權時,視訊解碼器30可擷取APS 270之加權語法表278的資料。
應認識到,視實例而定,本文中描述的技術中之任何者之某些動作或事件可按不同序列執行,可被添加、合併或完全省去(例如,對於該等技術之實踐,並非所有描述之動作或事件皆為必要的)。此外,在某些實例中,動作或事件可(例如)經由多線緒處理、中斷處理或多個處理器同時而非依序執行。
在一或多個實例中,所描述之功能可以硬體、軟體、韌體或其任何組合實施。若以軟體實施,則可將功能作為一或多個指令或程式碼儲存於一電腦可讀媒體上或在一電腦可讀媒體上傳輸,且由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,通信媒體包括促進(例如)根據通信協定將電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體通常可對應於(1)非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取用於實施在本發明中描述的技術之指令、程式碼
及/或資料結構之任何可用媒體。電腦程式產品可包括電腦可讀媒體。
藉由實例而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體或可用以儲存呈指令或資料結構之形式之所要的程式碼且可由電腦存取的任何其他媒體。又,將任何連接恰當地稱為電腦可讀媒體。舉例而言,若使用同軸電纜、光纜、雙絞線、數位用戶線(DSL)或無線技術(諸如紅外線、無線電及微波)而自一網站、伺服器或其他遠端源傳輸指令,則同軸電纜、光纜、雙絞線、DSL或無線技術(諸如紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而是係有關非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光碟、數位影音光碟(DVD)、軟性磁碟及blu-ray光碟,其中磁碟通常以磁性之方式再生資料,而光碟藉由雷射以光學之方式再生資料。以上之組合亦應包括於電腦可讀媒體之範疇內。
指令可由一或多個處理器執行,諸如,一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效積體或離散邏輯電路。因此,如本文中所使用之術語「處理器」可指代前述結構或適合於實施本文中所描述之技術之任何其
他結構中的任一者。此外,在一些態樣中,本文中所描述之功能性可提供於經組態用於編碼及解碼之專用硬體及/或軟體模組內,或被併入組合之編碼解碼器中。同樣,該等技術可完全地實施於一或多個電路或邏輯元件中。
本發明之技術可實施於廣泛的各種各樣之器件或裝置中,包括無線手機、積體電路(IC)或IC之集合(例如,晶片組)。在本發明中描述了各種組件、模組或單元以強調經組態以執行所揭示之技術的器件之功能態樣,但未必需要藉由不同硬體單元實現。相反,如上文所述,各種單元可在編碼解碼器硬體單元中加以組合或由結合合適的軟體及/或韌體之互操作之硬體單元(包括如上文所述之一或多個處理器)之集合提供。
已描述各種實例。此等及其他實例處於下列申請專利範圍之範疇內。
10‧‧‧視訊編碼及解碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧通信頻道
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧調變器/解調變器(數據機)
24‧‧‧傳輸器
26‧‧‧接收器
28‧‧‧數據機
30‧‧‧視訊解碼器
32‧‧‧顯示器件
40‧‧‧模式選擇單元
42‧‧‧運動估計單元
44‧‧‧運動補償單元
46‧‧‧框內預測單元
50‧‧‧求和器
52‧‧‧變換處理單元
54‧‧‧量化單元
56‧‧‧熵寫碼單元
58‧‧‧反量化單元
60‧‧‧反變換單元
62‧‧‧求和器
64‧‧‧參考圖框記憶體
66‧‧‧迴路內濾波器
70‧‧‧熵解碼單元
72‧‧‧運動補償單元
74‧‧‧框內預測單元
76‧‧‧反量化單元
78‧‧‧反變換單元
80‧‧‧求和器
82‧‧‧參考圖框記憶體
84‧‧‧記憶體
86‧‧‧迴路內濾波器
88‧‧‧儲存之APS
250‧‧‧APS資料結構
252‧‧‧ALF係數
254‧‧‧SAO參數
256‧‧‧量化矩陣
258‧‧‧加權語法表
260‧‧‧APS資料結構
262‧‧‧ALF係數識別符
264‧‧‧SAO參數
266‧‧‧量化矩陣識別符
268‧‧‧加權語法表
270‧‧‧APS資料結構
272‧‧‧ALF係數識別符
274‧‧‧SAO參數識別符
276‧‧‧量化矩陣
278‧‧‧加權語法表
圖1為說明可利用用於利用調適參數組(APS)資料結構之技術的一實例視訊編碼及解碼系統之方塊圖。
圖2為說明可實施用於利用APS資料結構之技術的視訊編碼器之一實例之方塊圖。
圖3為說明可實施用於利用APS資料結構之技術的視訊解碼器之一實例之方塊圖。
圖4為說明用於使用APS資料結構編碼視訊資料之一實例方法之流程圖。
圖5為說明用於使用APS資料結構解碼視訊資料之一實
例方法之流程圖。
圖6為說明APS資料結構之各種實例之概念圖。
Claims (59)
- 一種解碼視訊資料之方法,該方法包含:將一調適參數組(APS)資料結構儲存於一寫碼器件之一緩衝器中,其中該APS資料結構包括可適用於視訊資料之一或多個片段的傳訊資料;基於該APS資料結構之該傳訊資料解碼該等片段中之至少一者;在解碼該片段後,判定可自該緩衝器移除該APS資料結構;基於該判定自該緩衝器移除該APS資料結構;及在自該緩衝器移除該APS資料結構後解碼該視訊資料之一或多個額外片段。
- 如請求項1之方法,其中該APS資料結構包括代表該一或多個片段之量化矩陣的資料。
- 如請求項2之方法,其中該APS資料結構包含一包含一組資料之第一APS資料結構,且其中該一或多個片段包含一或多個片段之一第一集合,該方法進一步包含使用該第一APS之該組資料解碼一或多個片段之一第二集合,而不自可適用於一或多個片段之該第二集合的一第二APS資料結構擷取該組資料。
- 如請求項3之方法,其中該組資料包含自適應迴路濾波器(ALF)係數。
- 如請求項2之方法,其中該APS資料結構包括代表用於該一或多個片段的ALF係數中之一或多者之資料。
- 如請求項2之方法,其中該APS資料結構包括代表用於該一或多個片段的一或多個樣本自適應偏移(SAO)參數之資料。
- 如請求項2之方法,其中該APS資料結構包括代表用於該一或多個片段的圖片清單修改資料、參考圖片清單組合資料、記憶體管理控制操作語法資料及加權預測表中之一或多者之資料。
- 如請求項2之方法,其中判定可移除該APS資料結構包含接收指示可移除該APS資料結構之一隨後APS資料結構。
- 如請求項2之方法,其進一步包含接收可儲存於該緩衝器中的APS資料結構之一最大數目之一指示,其中判定可移除該APS資料結構包含判定儲存於該緩衝器中的APS資料結構之數目超過該最大數目。
- 如請求項9之方法,其中移除該APS資料結構包含移除當前儲存於該緩衝器中的該等APS資料結構中之所接收之該第一APS資料結構。
- 如請求項9之方法,其中移除該APS資料結構包含判定用於該APS資料結構之一識別符值指示該APS資料結構在當前儲存於該緩衝器中的該等APS資料結構中具有一最低優先權,及基於該判定移除具有該最低優先權之該APS資料結構。
- 如請求項2之方法,其中該APS資料結構包含一第一APS資料結構,該方法進一步包含: 接收一第二APS資料結構,其中該第二APS資料結構包括指示該第二APS資料結構之至少一部分參考該第一APS資料結構之一對應的部分之資訊;及基於該第二APS資料結構之該資訊,使用該第一APS資料結構之該部分的資料解碼與該第二APS資料結構相關聯之一片段。
- 如請求項12之方法,其進一步包含:接收一第三APS資料結構,其中該第三APS資料結構包括指示該第三APS資料結構之一第一部分參考該第一APS資料結構之一對應的部分及該第三APS資料結構之一第二不同部分參考該第二APS資料結構之一對應的部分之資訊;及基於該第三APS資料結構之該資訊,使用該第一APS資料結構之該部分的資料及該第二APS資料結構之該部分的資料解碼與該第三APS資料結構相關聯之一片段。
- 一種用於解碼視訊資料之器件,該器件包含:一記憶體,其包含一緩衝器;及一視訊解碼器,其經組態以:將一調適參數組(APS)資料結構儲存於該緩衝器中,其中該APS資料結構包括可適用於視訊資料之一或多個片段的傳訊資料;基於該APS資料結構之該傳訊資料解碼該等片段中之至少一者;在解碼該片段後,判定可自該緩衝器移除該APS資料結構;基於該判定自該緩衝器移除該APS資料結構;及在自該緩衝器移除該APS資料結構後解碼該視訊資料 之一或多個額外片段。
- 如請求項14之器件,其中該APS資料結構包括代表該一或多個片段之量化矩陣的資料。
- 如請求項14之器件,其中該APS資料結構包含一包含一組資料之第一APS資料結構,且其中該一或多個片段包含一或多個片段之一第一集合,其中該視訊解碼器經進一步組態以使用該第一APS之該組資料解碼一或多個片段之一第二集合,而不自可適用於一或多個片段之該第二集合的一第二APS資料結構擷取該組資料。
- 如請求項16之器件,其中該組資料包含自適應迴路濾波器(ALF)係數。
- 如請求項14之器件,其中該視訊解碼器件經組態以回應於接收到指示可移除該APS資料結構之一隨後APS資料結構來判定可移除該APS資料結構。
- 如請求項14之器件,其中該視訊解碼器件經組態以接收可儲存於該緩衝器中的APS資料結構之一最大數目之一指示,且其中為了判定可移除該APS資料結構,該視訊解碼器件經組態以判定儲存於該緩衝器中的APS資料結構之數目是否超過該最大數目。
- 如請求項14之器件,其中該APS資料結構包含一第一APS資料結構,且其中該視訊解碼器件經組態以:接收一第二APS資料結構,其中該第二APS資料結構包括指示該第二APS資料結構之至少一部分參考該第一APS資料結構之一對應的部分之資訊;及基於該第二APS資料 結構之該資訊,使用該第一APS資料結構之該部分的資料解碼與該第二APS資料結構相關聯之一片段。
- 一種用於解碼視訊資料之器件,該器件包含:用於將一調適參數組(APS)資料結構儲存於一寫碼器件之一緩衝器中之構件,其中該APS資料結構包括可適用於視訊資料之一或多個片段的傳訊資料;用於基於該APS資料結構之該傳訊資料解碼該等片段中之至少一者之構件;用於在解碼該片段後判定可自該緩衝器移除該APS資料結構之構件;用於基於該判定自該緩衝器移除該APS資料結構之構件;及用於在自該緩衝器移除該APS資料結構後解碼該視訊資料之一或多個額外片段之構件。
- 如請求項21之器件,其中該APS資料結構包括代表該一或多個片段之量化矩陣的資料。
- 如請求項21之器件,其中該APS資料結構包含一包含一組資料之第一APS資料結構,且其中該一或多個片段包含一或多個片段之一第一集合,該器件進一步包含用於使用該第一APS之該組資料解碼一或多個片段之一第二集合而不自可適用於一或多個片段之該第二集合的一第二APS資料結構擷取該組資料之構件。
- 如請求項22之器件,其中該組資料包含自適應迴路濾波器(ALF)係數。
- 如請求項21之器件,其中用於判定可移除該APS資料結構之該構件包含用於接收指示可移除該APS資料結構之一隨後APS資料結構之構件。
- 如請求項21之器件,其進一步包含用於接收可儲存於該緩衝器中的APS資料結構之一最大數目之一指示之構件,其中用於判定可移除該APS資料結構之該構件包含用於判定儲存於該緩衝器中的APS資料結構之數目超過該最大數目之構件。
- 如請求項21之器件,其中該APS資料結構包含一第一APS資料結構,該器件進一步包含:用於接收一第二APS資料結構之構件,其中該第二APS資料結構包括指示該第二APS資料結構之至少一部分參考該第一APS資料結構之一對應的部分之資訊;及用於基於該第二APS資料結構之該資訊,使用該第一APS資料結構之該部分的資料解碼與該第二APS資料結構相關聯之一片段之構件。
- 一種電腦可讀儲存媒體,其具有儲存於其上之指令,該等指令當執行時使一處理器:將一調適參數組(APS)資料結構儲存於一寫碼器件之一緩衝器中,其中該APS資料結構包括可適用於視訊資料之一或多個片段的傳訊資料;基於該APS資料結構之該傳訊資料解碼該等片段中之至少一者;在解碼該片段後,判定可自該緩衝器移除該APS資料 結構;基於該判定自該緩衝器移除該APS資料結構;及在自該緩衝器移除該APS資料結構後解碼該視訊資料之一或多個額外片段。
- 如請求項28之電腦可讀儲存媒體,其中該APS資料結構包括代表該一或多個片段之量化矩陣的資料。
- 如請求項28之電腦可讀儲存媒體,其中該APS資料結構包含一包含一組資料之第一APS資料結構,且其中該一或多個片段包含一或多個片段之一第一集合,該電腦可讀儲存媒體進一步包含使該處理器使用該第一APS之該組資料解碼一或多個片段之一第二集合而不自可適用於一或多個片段之該第二集合的一第二APS資料結構擷取該組資料之指令。
- 如請求項30之電腦可讀儲存媒體,其中該組資料包含自適應迴路濾波器(ALF)係數。
- 如請求項28之電腦可讀儲存媒體,其中使該處理器判定可移除該APS資料結構之該等指令包含使該處理器接收指示可移除該APS資料結構之一隨後APS資料結構之指令。
- 如請求項28之電腦可讀儲存媒體,其進一步包含使該處理器接收可儲存於該緩衝器中的APS資料結構之一最大數目之一指示之指令,其中使該處理器判定可移除該APS資料結構之該等指令包含使該處理器判定儲存於該緩衝器中的APS資料結構之數目超過該最大數目之指 令。
- 如請求項28之電腦可讀儲存媒體,其中該APS資料結構包含一第一APS資料結構,該電腦可讀儲存媒體進一步包含使該處理器進行以下操作之指令:接收一第二APS資料結構,其中該第二APS資料結構包括指示該第二APS資料結構之至少一部分參考該第一APS資料結構之一對應的部分之資訊;及基於該第二APS資料結構之該資訊,使用該第一APS資料結構之該部分的資料解碼與該第二APS資料結構相關聯之一片段。
- 一種編碼視訊資料之方法,該方法包含:使用一或多個參數編碼視訊資料之一或多個片段之一第一集合;在一調適參數組(APS)資料結構中傳訊該一或多個參數;及不參考該APS資料結構編碼在一或多個片段之該第一集合中之一判定之片段後的該視訊資料之一或多個片段之一第二集合。
- 如請求項35之方法,其中在該APS資料結構中傳訊之該一或多個參數包括該一或多個片段之一或多個量化矩陣。
- 如請求項35之方法,其中在該APS資料結構中傳訊之該一或多個參數包括用於該一或多個片段的自適應迴路濾波器(ALF)係數及樣本自適應偏移(SAO)參數中之一或多 者。
- 如請求項35之方法,其中在該APS資料結構中傳訊之該一或多個參數包括用於該一或多個片段的圖片清單修改資料、參考圖片清單組合資料、記憶體管理控制操作語法資料及加權預測表中之一或多者。
- 如請求項35之方法,其中該APS資料結構包含一第一APS資料結構,該方法進一步包含:使用在該第一APS資料結構中傳訊之一或多個參數及未在該第一APS資料結構中傳訊之一或多個參數編碼該視訊資料之一片段,其中該片段出現在一或多個片段之該第一集合中之該判定之片段前;在一第二APS資料結構中傳訊未在該第一APS資料結構中傳訊之該一或多個參數;及在該第二APS資料結構中提供指示該第二APS資料結構之一部分參考該第一APS資料結構之一對應的部分之資訊,其中該對應的部分包含用以編碼該片段的在該第一APS資料結構中傳訊之該一或多個參數。
- 如請求項35之方法,其進一步包含提供指示可在解碼一或多個片段之該第一集合中之該判定之片段前自一視訊解碼器件的一緩衝器移除該APS資料結構之資訊。
- 如請求項40之方法,其中該APS資料結構包含一第一APS資料結構,且其中提供指示可移除該第一APS資料結構之該資訊包含在對應於一或多個片段之該第二集合的一第二APS資料結構中傳訊可移除該第一APS資料結 構。
- 如請求項40之方法,其中一或多個片段之該第一集合正好包含一個片段,且其中提供指示可移除該APS資料結構之資訊包含設定該APS資料結構之一旗標之一值以指示該APS資料結構僅適用於一個片段。
- 如請求項40之方法,其中提供指示可移除該APS資料結構之資訊包含提供等於或大於可儲存於一視訊解碼器件之一緩衝器中的APS資料結構之一最大數目的一數目之隨後APS資料結構。
- 如請求項43之方法,其進一步包含給該APS資料結構指派比該等隨後APS資料結構之優先權值低的一優先權值。
- 一種用於編碼視訊資料之器件,該器件包含一視訊編碼器,該視訊編碼器經組態以:使用一或多個參數編碼視訊資料之一或多個片段之一第一集合;在一調適參數組(APS)資料結構中傳訊該一或多個參數;及不參考該APS資料結構編碼在一或多個片段之該第一集合中之一判定之片段後的該視訊資料之一或多個片段之一第二集合。
- 如請求項45之器件,其中在該APS資料結構中傳訊之該一或多個參數包括該一或多個片段之一或多個量化矩陣。
- 如請求項45之器件,其中在該APS資料結構中傳訊之該一或多個參數包括自適應迴路濾波器(ALF)係數、樣本自適應偏移(SAO)參數、圖片清單修改資料、參考圖片 清單組合資料、記憶體管理控制操作語法資料、加權預測表及量化矩陣中之一或多者。
- 如請求項45之器件,其中該APS資料結構包含一第一APS資料結構,其中該視訊編碼器經進一步組態以:使用在該第一APS資料結構中傳訊之一或多個參數及未在該第一APS資料結構中傳訊之一或多個參數編碼該視訊資料之一片段,其中該片段出現在一或多個片段之該第一集合中之該判定之片段前;在一第二APS資料結構中傳訊未在該第一APS資料結構中傳訊之該一或多個參數;及在該第二APS資料結構中提供指示該第二APS資料結構之一部分參考該第一APS資料結構之一對應的部分之資訊,其中該對應的部分包含用以編碼該片段的在該第一APS資料結構中傳訊之該一或多個參數。
- 如請求項45之器件,其中該視訊編碼器經進一步組態以提供指示可在解碼一或多個片段之該第一集合中之該判定之片段前自一視訊解碼器件的一緩衝器移除該APS資料結構之資訊。
- 一種用於編碼視訊資料之器件,該器件包含:用於使用一或多個參數編碼視訊資料之一或多個片段之一第一集合之構件;用於在一調適參數組(APS)資料結構中傳訊該一或多個參數之構件;及用於不參考該APS資料結構編碼在一或多個片段之該第一集合中之一判定之片段後的該視訊資料之一或多個 片段之一第二集合之構件。
- 如請求項50之器件,其中在該APS資料結構中傳訊之該一或多個參數包括該一或多個片段之一或多個量化矩陣。
- 如請求項50之器件,其中在該APS資料結構中傳訊之該一或多個參數包括自適應迴路濾波器(ALF)係數、樣本自適應偏移(SAO)參數、圖片清單修改資料、參考圖片清單組合資料、記憶體管理控制操作語法資料、加權預測表及量化矩陣中之一或多者。
- 如請求項50之器件,其中該APS資料結構包含一第一APS資料結構,該器件進一步包含:用於使用在該第一APS資料結構中傳訊之一或多個參數及未在該第一APS資料結構中傳訊之一或多個參數編碼該視訊資料之一片段之構件,其中該片段出現在一或多個片段之該第一集合中之該判定之片段前;用於在一第二APS資料結構中傳訊未在該第一APS資料結構中傳訊之該一或多個參數之構件;及用於在該第二APS資料結構中提供指示該第二APS資料結構之一部分參考該第一APS資料結構之一對應的部分之資訊之構件,其中該對應的部分包含用以編碼該片段的在該第一APS資料結構中傳訊之該一或多個參數。
- 如請求項50之器件,其進一步包含用於提供指示可在解碼一或多個片段之該第一集合中之該判定之片段前自一視訊解碼器件的一緩衝器移除該APS資料結構之資訊之 構件。
- 一種電腦可讀儲存媒體,其具有儲存於其上之指令,該等指令當執行時使一處理器:使用一或多個參數編碼視訊資料之一或多個片段之一第一集合;在一調適參數組(APS)資料結構中傳訊該一或多個參數;及不參考該APS資料結構編碼在一或多個片段之該第一集合中之一判定之片段後的該視訊資料之一或多個片段之一第二集合。
- 如請求項55之電腦可讀儲存媒體,其中在該APS資料結構中傳訊之該一或多個參數包括該一或多個片段之一或多個量化矩陣。
- 如請求項55之電腦可讀儲存媒體,其中在該APS資料結構中傳訊之該一或多個參數包括自適應迴路濾波器(ALF)係數、樣本自適應偏移(SAO)參數、圖片清單修改資料、參考圖片清單組合資料、記憶體管理控制操作語法資料、加權預測表及量化矩陣中之一或多者。
- 如請求項55之電腦可讀儲存媒體,其中該APS資料結構包含一第一APS資料結構,該電腦可讀儲存媒體進一步包含使該處理器進行以下操作之指令:使用在該第一APS資料結構中傳訊之一或多個參數及未在該第一APS資料結構中傳訊之一或多個參數編碼該視訊資料之一片段,其中該片段出現在一或多個片段之 該第一集合中之該判定之片段前;在一第二APS資料結構中傳訊未在該第一APS資料結構中傳訊之該一或多個參數;及在該第二APS資料結構中提供指示該第二APS資料結構之一部分參考該第一APS資料結構之一對應的部分之資訊,其中該對應的部分包含用以編碼該片段的在該第一APS資料結構中傳訊之該一或多個參數。
- 如請求項55之電腦可讀儲存媒體,其進一步包含使該處理器提供指示可在解碼一或多個片段之該第一集合中之該判定之片段前自一視訊解碼器件的一緩衝器移除該APS資料結構之資訊之指令。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161509015P | 2011-07-18 | 2011-07-18 | |
US201161511477P | 2011-07-25 | 2011-07-25 | |
US201161540907P | 2011-09-29 | 2011-09-29 | |
US13/548,742 US9277228B2 (en) | 2011-07-18 | 2012-07-13 | Adaptation parameter sets for video coding |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201313026A true TW201313026A (zh) | 2013-03-16 |
Family
ID=47555721
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101125682A TW201313026A (zh) | 2011-07-18 | 2012-07-17 | 用於視訊寫碼之調適參數組 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9277228B2 (zh) |
EP (1) | EP2735149B1 (zh) |
JP (1) | JP5886425B2 (zh) |
KR (1) | KR101548470B1 (zh) |
CN (1) | CN103688547B (zh) |
IN (1) | IN2014MN00007A (zh) |
TW (1) | TW201313026A (zh) |
WO (1) | WO2013012792A2 (zh) |
Families Citing this family (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5761993B2 (ja) | 2010-12-28 | 2015-08-12 | キヤノン株式会社 | アクセスポイント探索装置、アクセスポイントの探索方法、およびプログラム |
CN103748884A (zh) * | 2011-08-30 | 2014-04-23 | 索尼公司 | 图像处理装置和图像处理方法 |
BR112014004797B1 (pt) | 2011-10-17 | 2022-02-15 | Kabushiki Kaisha Toshiba | Método de decodificação |
CN103096047B (zh) * | 2011-11-01 | 2018-06-19 | 中兴通讯股份有限公司 | 一种分片层参数集解码及编码方法和装置 |
JP2014197723A (ja) * | 2012-01-06 | 2014-10-16 | ソニー株式会社 | 画像処理装置および方法 |
CA2870067C (en) * | 2012-04-16 | 2017-01-17 | Nokia Corporation | Video coding and decoding using multiple parameter sets which are identified in video unit headers |
US9979958B2 (en) | 2012-04-20 | 2018-05-22 | Qualcomm Incorporated | Decoded picture buffer processing for random access point pictures in video sequences |
US9516308B2 (en) | 2012-04-27 | 2016-12-06 | Qualcomm Incorporated | Parameter set updates in video coding |
US9736476B2 (en) | 2012-04-27 | 2017-08-15 | Qualcomm Incorporated | Full random access from clean random access pictures in video coding |
US9479776B2 (en) | 2012-07-02 | 2016-10-25 | Qualcomm Incorporated | Signaling of long-term reference pictures for video coding |
US9344717B2 (en) * | 2012-08-06 | 2016-05-17 | Mediatek Inc. | Method and apparatus for sample adaptive offset in a video decoder |
US9516306B2 (en) * | 2013-03-27 | 2016-12-06 | Qualcomm Incorporated | Depth coding modes signaling of depth data for 3D-HEVC |
CN105009585B (zh) | 2013-04-02 | 2018-09-25 | 明达半导体股份有限公司 | 视频处理方法及视频处理装置 |
WO2015053673A1 (en) * | 2013-10-11 | 2015-04-16 | Telefonaktiebolaget L M Ericsson (Publ) | Method and arrangement for video transcoding using mode or motion or in-loop filter information |
US10264272B2 (en) * | 2013-10-15 | 2019-04-16 | Qualcomm Incorporated | Device and method for scalable coding of video information |
US9942560B2 (en) | 2014-01-08 | 2018-04-10 | Microsoft Technology Licensing, Llc | Encoding screen capture data |
US9749642B2 (en) | 2014-01-08 | 2017-08-29 | Microsoft Technology Licensing, Llc | Selection of motion vector precision |
US9774881B2 (en) * | 2014-01-08 | 2017-09-26 | Microsoft Technology Licensing, Llc | Representing motion vectors in an encoded bitstream |
US9031138B1 (en) * | 2014-05-01 | 2015-05-12 | Google Inc. | Method and system to combine multiple encoded videos for decoding via a video docoder |
CN107148778A (zh) * | 2014-10-31 | 2017-09-08 | 联发科技股份有限公司 | 用于视频编码的改进的定向帧内预测方法 |
US9955159B2 (en) * | 2014-10-31 | 2018-04-24 | Google Llc | Multi-video decoding with input switching |
US11563938B2 (en) | 2016-02-15 | 2023-01-24 | Qualcomm Incorporated | Geometric transforms for filters for video coding |
EP3563571A4 (en) * | 2016-12-30 | 2020-02-12 | Telefonaktiebolaget LM Ericsson (publ) | DECODED IMAGE BUFFER MEMORY MANAGEMENT FOR PROCESSING PREDICTION OF CROSS IMAGE DATA |
US10506230B2 (en) * | 2017-01-04 | 2019-12-10 | Qualcomm Incorporated | Modified adaptive loop filter temporal prediction for temporal scalability support |
US11451773B2 (en) * | 2018-06-01 | 2022-09-20 | Qualcomm Incorporated | Block-based adaptive loop filter (ALF) design and signaling |
US11284075B2 (en) * | 2018-09-12 | 2022-03-22 | Qualcomm Incorporated | Prediction of adaptive loop filter parameters with reduced memory consumption for video coding |
US11051017B2 (en) | 2018-12-20 | 2021-06-29 | Qualcomm Incorporated | Adaptive loop filter (ALF) index signaling |
US11477448B2 (en) | 2019-01-25 | 2022-10-18 | Hfi Innovation Inc. | Method and apparatus for non-linear adaptive loop filtering in video coding |
WO2020156534A1 (en) | 2019-02-01 | 2020-08-06 | Beijing Bytedance Network Technology Co., Ltd. | Interactions between in-loop reshaping and intra block copy |
CN113383547A (zh) | 2019-02-01 | 2021-09-10 | 北京字节跳动网络技术有限公司 | 环路整形和帧间编解码工具之间的相互作用 |
KR20230163584A (ko) * | 2019-02-28 | 2023-11-30 | 엘지전자 주식회사 | Aps 시그널링 기반 비디오 또는 영상 코딩 |
WO2020177704A1 (en) * | 2019-03-04 | 2020-09-10 | Beijing Bytedance Network Technology Co., Ltd. | In-loop filtering in video processing |
US20220150481A1 (en) * | 2019-03-07 | 2022-05-12 | Lg Electronics Inc. | Video or image coding based on luma mapping with chroma scaling |
KR102696461B1 (ko) * | 2019-03-11 | 2024-08-21 | 텐센트 아메리카 엘엘씨 | 비디오 비트스트림에서의 적응적 픽처 크기의 시그널링 |
US20220174295A1 (en) * | 2019-03-11 | 2022-06-02 | Lg Electronics Inc. | Luma mapping- and chroma scaling-based video or image coding |
EP3939278A4 (en) * | 2019-03-11 | 2023-03-22 | Tencent America LLC | TILE AND SUB-DIVISION |
CN113574889B (zh) | 2019-03-14 | 2024-01-12 | 北京字节跳动网络技术有限公司 | 环路整形信息的信令和语法 |
WO2020197207A1 (ko) * | 2019-03-23 | 2020-10-01 | 엘지전자 주식회사 | 맵핑을 포함하는 필터링 기반 비디오 또는 영상 코딩 |
WO2020192614A1 (en) * | 2019-03-23 | 2020-10-01 | Beijing Bytedance Network Technology Co., Ltd. | Restrictions on adaptive-loop filtering parameter sets |
TWI739386B (zh) * | 2019-04-11 | 2021-09-11 | 聯發科技股份有限公司 | 具有適應性參數集之適應性迴路濾波器 |
US11368684B2 (en) * | 2019-04-23 | 2022-06-21 | Qualcomm Incorporated | Adaptation parameter sets (APS) for adaptive loop filter (ALF) parameters |
CN113728627B (zh) * | 2019-04-26 | 2023-09-19 | 北京字节跳动网络技术有限公司 | 用于环路内重构的参数的预测 |
US11166033B2 (en) * | 2019-06-06 | 2021-11-02 | Qualcomm Incorporated | Adaptation parameter set in access unit in video coding |
WO2020262922A1 (ko) * | 2019-06-24 | 2020-12-30 | 엘지전자 주식회사 | 루마 맵핑 및 크로마 스케일링 기반 비디오 또는 영상 코딩 |
WO2021006632A1 (ko) * | 2019-07-08 | 2021-01-14 | 엘지전자 주식회사 | 스케일링 리스트 파라미터 기반 비디오 또는 영상 코딩 |
WO2021032747A1 (en) | 2019-08-19 | 2021-02-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Usage of access unit delimiters and adaptation parameter sets |
WO2021045765A1 (en) * | 2019-09-05 | 2021-03-11 | Huawei Technologies Co., Ltd. | Efficient adaptive loop filter parameter signaling in video coding |
GB2590636B (en) * | 2019-12-20 | 2024-01-10 | Canon Kk | High level syntax for video coding and decoding |
MX2022007348A (es) * | 2019-12-20 | 2022-09-23 | Lg Electronics Inc | Metodo y dispositivo de codificacion de imagenes/video con base en prediccion ponderada. |
KR20220097511A (ko) | 2019-12-20 | 2022-07-07 | 엘지전자 주식회사 | 예측 가중 테이블 기반 영상/비디오 코딩 방법 및 장치 |
US11303914B2 (en) * | 2020-01-08 | 2022-04-12 | Tencent America LLC | Method and apparatus for video coding |
JP7415027B2 (ja) | 2020-02-29 | 2024-01-16 | 北京字節跳動網絡技術有限公司 | ハイレベルシンタックス要素のための制約 |
WO2021180164A1 (en) * | 2020-03-11 | 2021-09-16 | Beijing Bytedance Network Technology Co., Ltd. | Transform skip based residual coding |
WO2021197447A1 (en) * | 2020-04-01 | 2021-10-07 | Beijing Bytedance Network Technology Co., Ltd. | Controlling quantization parameter delta signaling |
WO2021204137A1 (en) | 2020-04-07 | 2021-10-14 | Beijing Bytedance Network Technology Co., Ltd. | Clipping operation for reference picture wrap around |
CN115428457A (zh) | 2020-04-09 | 2022-12-02 | 抖音视界有限公司 | 基于颜色格式的自适应参数集的约束 |
CN115486064A (zh) | 2020-04-10 | 2022-12-16 | 抖音视界有限公司 | 标头语法元素和自适应参数集的使用 |
CN115885511A (zh) * | 2020-04-13 | 2023-03-31 | 抖音视界有限公司 | 自适应参数集中的色度语法信令通知 |
WO2021209061A1 (en) | 2020-04-17 | 2021-10-21 | Beijing Bytedance Network Technology Co., Ltd. | Presence of adaptation parameter set units |
CN115769578A (zh) * | 2020-04-20 | 2023-03-07 | 抖音视界有限公司 | 视频编解码中的自适应色彩变换 |
WO2021222036A1 (en) | 2020-04-26 | 2021-11-04 | Bytedance Inc. | Conditional signaling of video coding syntax elements |
JP7540871B2 (ja) | 2020-05-22 | 2024-08-27 | 北京字節跳動網絡技術有限公司 | 一般制約フラグのシグナリング |
WO2021244419A1 (en) | 2020-05-31 | 2021-12-09 | Beijing Bytedance Network Technology Co., Ltd. | Constraint signaling using general constraint information syntax element |
WO2021251744A1 (ko) * | 2020-06-10 | 2021-12-16 | 엘지전자 주식회사 | Aps에 대한 식별자를 시그널링하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 컴퓨터 판독 가능한 기록 매체 |
US20230300350A1 (en) * | 2020-06-10 | 2023-09-21 | Lg Electronics Inc. | Image encoding/decoding method and apparatus for performing sub-bitstream extraction process on basis of maximum time identifier, and computer-readable recording medium storing bitstream |
WO2021256382A1 (ja) * | 2020-06-15 | 2021-12-23 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法、および復号方法 |
WO2021056002A2 (en) * | 2020-12-09 | 2021-03-25 | Futurewei Technologies, Inc. | Media packetization for network qualitative communication |
US20230224465A1 (en) * | 2022-01-13 | 2023-07-13 | Tencent America LLC | Cross-Channel Prediction based on Multiple Prediction Modes |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6181742B1 (en) * | 1998-01-26 | 2001-01-30 | International Business Machines Corporation | Single pass target allocation for video encoding |
US7751628B1 (en) | 2001-12-26 | 2010-07-06 | Reisman Richard R | Method and apparatus for progressively deleting media objects from storage |
US7532670B2 (en) * | 2002-07-02 | 2009-05-12 | Conexant Systems, Inc. | Hypothetical reference decoder with low start-up delays for compressed image and video |
US7852919B2 (en) | 2003-09-07 | 2010-12-14 | Microsoft Corporation | Field start code for entry point frames with predicted first field |
US20060159352A1 (en) | 2005-01-18 | 2006-07-20 | Faisal Ishtiaq | Method and apparatus for encoding a video sequence |
CA2689873A1 (en) * | 2007-06-01 | 2008-12-04 | Research In Motion Limited | Method and apparatus for multi-part interactive compression |
US8265144B2 (en) | 2007-06-30 | 2012-09-11 | Microsoft Corporation | Innovations in video decoder implementations |
US8611435B2 (en) | 2008-12-22 | 2013-12-17 | Qualcomm, Incorporated | Combined scheme for interpolation filtering, in-loop filtering and post-loop filtering in video coding |
US20120230405A1 (en) | 2009-10-28 | 2012-09-13 | Media Tek Singapore Pte. Ltd. | Video coding methods and video encoders and decoders with localized weighted prediction |
-
2012
- 2012-07-13 US US13/548,742 patent/US9277228B2/en not_active Expired - Fee Related
- 2012-07-16 KR KR1020147004071A patent/KR101548470B1/ko not_active IP Right Cessation
- 2012-07-16 EP EP12738005.3A patent/EP2735149B1/en not_active Not-in-force
- 2012-07-16 WO PCT/US2012/046895 patent/WO2013012792A2/en active Application Filing
- 2012-07-16 CN CN201280035481.9A patent/CN103688547B/zh not_active Expired - Fee Related
- 2012-07-16 IN IN7MUN2014 patent/IN2014MN00007A/en unknown
- 2012-07-16 JP JP2014521689A patent/JP5886425B2/ja not_active Expired - Fee Related
- 2012-07-17 TW TW101125682A patent/TW201313026A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
EP2735149B1 (en) | 2015-11-04 |
US9277228B2 (en) | 2016-03-01 |
CN103688547A (zh) | 2014-03-26 |
EP2735149A2 (en) | 2014-05-28 |
KR101548470B1 (ko) | 2015-08-28 |
US20130022104A1 (en) | 2013-01-24 |
WO2013012792A3 (en) | 2013-12-19 |
JP5886425B2 (ja) | 2016-03-16 |
JP2014525197A (ja) | 2014-09-25 |
IN2014MN00007A (zh) | 2015-06-12 |
CN103688547B (zh) | 2017-02-15 |
KR20140056277A (ko) | 2014-05-09 |
WO2013012792A2 (en) | 2013-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2735149B1 (en) | Adaptation parameter sets for video coding | |
TWI495273B (zh) | 於視訊寫碼中自清晰隨機存取圖像之全面隨機存取 | |
KR102250638B1 (ko) | 비디오 정보의 스케일러블 코딩을 위한 디바이스 및 방법 | |
EP2834975B1 (en) | Low-delay video buffering in video coding | |
TWI520591B (zh) | 視訊寫碼中之參數集合更新 | |
KR101743852B1 (ko) | 비디오 코딩에서의 관심 영역들 및 점진적 디코딩 리프레시의 시그널링 | |
TWI521953B (zh) | 用於視訊寫碼之參數集合的指示及啓用 | |
TWI481237B (zh) | 在視訊寫碼中分組經旁路寫碼語法元素 | |
TWI532383B (zh) | 在視訊寫碼中長期參考圖像之隨機存取及發信 | |
JP2022525470A (ja) | ビデオコーディングにおける適応パラメータセット(aps)を用いるブロックベースの適応ループフィルタ(alf) | |
CA2951522C (en) | Extensible design of nesting supplemental enhancement information (sei) messages | |
KR102401406B1 (ko) | 시퀀스 종료 네트워크 추상화 계층 유닛을 사용한 개선된 비디오 코딩 | |
US10264272B2 (en) | Device and method for scalable coding of video information | |
KR101663397B1 (ko) | 가중 예측 파라미터 코딩 | |
TWI559774B (zh) | 具有改善隨機存取點圖像行爲之視訊寫碼 | |
TW201424395A (zh) | 擴展解碼單元定義 | |
KR20170026371A (ko) | 스케일링 가능 비디오 코딩의 비트스트림 준수 제약들 | |
EP3090556A1 (en) | Method for coding recovery point supplemental enhancement information (sei) messages and region refresh information sei messages in multi-layer coding | |
TW201408076A (zh) | 在視訊寫碼中用於量化轉換係數之正負號隱藏技術 | |
KR102312764B1 (ko) | 멀티 계층 코딩에서 레퍼런스 픽처 세트 (rps) 를 코딩하기 위한 방법 |