TWI520591B - 視訊寫碼中之參數集合更新 - Google Patents

視訊寫碼中之參數集合更新 Download PDF

Info

Publication number
TWI520591B
TWI520591B TW102115166A TW102115166A TWI520591B TW I520591 B TWI520591 B TW I520591B TW 102115166 A TW102115166 A TW 102115166A TW 102115166 A TW102115166 A TW 102115166A TW I520591 B TWI520591 B TW I520591B
Authority
TW
Taiwan
Prior art keywords
parameter set
video
bit stream
indicator
image
Prior art date
Application number
TW102115166A
Other languages
English (en)
Other versions
TW201351966A (zh
Inventor
王益魁
Original Assignee
高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 高通公司 filed Critical 高通公司
Publication of TW201351966A publication Critical patent/TW201351966A/zh
Application granted granted Critical
Publication of TWI520591B publication Critical patent/TWI520591B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23614Multiplexing of additional data and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8451Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

視訊寫碼中之參數集合更新 相關申請案
本申請案主張2012年4月27日申請之美國臨時申請案第61/639,823號的權利,該案之全文特此以引用方式併入本文中。
本發明大體而言係關於處理視訊資料。
可將數位視訊能力併入至廣泛範圍之器件中,包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、數位攝影機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲主機、蜂巢式或衛星無線電電話、視訊電話會議器件及其類似者。視訊寫碼標準包括ITU-T H.261、ISO/IEC MPEG-1視覺、ITU-T H.262或ISO/IEC MPEG-2視覺、ITU-T H.263、ISO/IEC MPEG-4視覺及ITU-T H.264(亦被稱為ISO/IEC MPEG-4 AVC),包括其可縮放視訊寫碼(SVC)及多視角視訊寫碼(MVC)擴展。另外,高效率視訊寫碼(HEVC)為由ITU-T視訊寫碼專業團體(VCEG)與ISO/IEC動畫專業團體(MPEG)之關於視訊寫碼之聯合合作團隊(JCT-VC)開發的視訊寫碼標準。視訊器件可藉由實施此等視訊寫碼技術而更有效率地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊寫碼技術包括空間(圖像內)預測及/或時間(圖像間)預測以減少或移除視訊序列中固有之冗餘。對於基於區塊之預測性視訊寫碼, 可將視訊圖塊(例如,視訊圖框或視訊圖框之一部分)分割成視訊區塊,視訊區塊亦可被稱作巨集區塊、樹型區塊、寫碼單元(CU)及/或寫碼節點。可使用相對於圖像中之相鄰區塊中之參考樣本的空間預測來編碼同一圖像之框內寫碼(I)圖塊中之視訊區塊。圖像之框間寫碼(P或B)圖塊中之視訊區塊可使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測或相對於其他參考圖像中之參考樣本之時間預測。圖像可被稱作圖框,且參考圖像可被稱作參考圖框。
空間預測或時間預測導致針對待寫碼區塊之預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。像素亦可被稱作圖像元素、pel,或樣本。根據指向形成預測性區塊之參考樣本之區塊的運動向量及指示經寫碼區塊與預測性區塊之間的差異之殘餘資料來編碼框間寫碼區塊。根據框內寫碼模式及殘餘資料來編碼框內寫碼區塊。為了進行進一步壓縮,可將殘餘資料自像素域變換至變換域,從而引起殘餘變換係數,可接著量化殘餘變換係數。可掃描最初以二維陣列配置之經量化變換係數以便產生變換係數之一維向量,且可應用熵寫碼以達成甚至更多壓縮。
一般而言,本發明描述用以提供關於在位元串流之部分(例如,經寫碼之視訊序列或圖像群組(GOP))中是否可發生參數集合更新之指示的技術。該指示可使視訊解碼器能夠在不執行經儲存參數集合與具有相同識別值的相同類型之新參數集合之間的內容比較的情況下判定是否可發生該經儲存參數集合之更新。參數集合更新包括儲存具有給定識別值的當前參數集合以替換具有相同類型且具有相同識別值的先前參數集合。當不能夠發生參數集合更新時,視訊解碼器可針對位元串流之整個部分儲存且啟動給定類型之單一參數集合。當可發生參數集合更新時,視訊解碼器可自動啟動新參數集合且去啟動給定類型之 經儲存參數集合,或可(例如)藉由執行內容比較來判定是否更新經儲存參數。
指示可包含位元串流層級指示,諸如,包括於位元串流之部分中之語法元素。舉例而言,指示可包含包括於位元串流中之補充增強資訊(SEI)網路抽象層(NAL)單元中的旗標。作為另一實例,指示可包含包括於位元串流中之序列參數集合(SPS)NAL單元中之旗標。在一實例中,技術包括解碼指示在位元串流之部分中是否可更新任何參數集合之旗標。在此狀況下,相同旗標可用於所有類型之參數集合,包括視訊參數集合(VPS)、序列參數集合(SPS)、圖像參數集合(PPS),及/或自適應性參數集合(APS)。詳言之,單一旗標可指示是否可更新位元串流中之參數集合中的任一者。在另一實例中,技術包括解碼若干不同旗標,其中每一者指示在位元串流之部分中是否可更新特定類型之參數集合。
在一實例中,本發明係針對一種解碼視訊資料之方法,該方法包含:解碼指示在一位元串流之一部分中是否可發生一參數集合更新之一指示符,其中一參數集合更新包括儲存一當前參數集合以替換具有一相同類型且具有一相同識別值的一先前參數集合。基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,該方法進一步包含針對該位元串流之整個部分啟動具有一特定識別值的一特定類型之一第一參數集合。
在另一實例中,本發明係針對一種編碼視訊資料之方法,該方法包含:針對一位元串流之一部分編碼具有一特定識別值的一特定類型之一第一參數集合;及編碼指示在該位元串流之該部分中是否可發生一參數集合更新之一指示符,其中一參數集合更新包括儲存一當前參數集合以替換具有一相同類型且具有一相同識別值的一先前參數集合,且其中,基於該指示符指示在該位元串流之該部分中不能夠發生 該參數集合更新,針對該位元串流之整個部分啟動該第一參數集合。
在一另外實例中,本發明係針對一種用於寫碼視訊資料之視訊寫碼器件,該器件包含:一記憶體,其經組態以儲存視訊資料;及一或多個處理器,其經組態以寫碼指示在一位元串流之一部分中是否可發生一參數集合更新之一指示符,其中一參數集合更新包括儲存一當前參數集合以替換具有一相同類型且具有一相同識別值的一先前參數集合。基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,該等器件之該等處理器經進一步組態以針對該位元串流之整個部分啟動具有一特定識別值的一特定類型之一第一參數集合。
在另一實例中,本發明係針對一種用於寫碼視訊資料之視訊寫碼器件,該器件包含:用於寫碼指示在一位元串流之一部分中是否可發生一參數集合更新之一指示符的構件,其中一參數集合更新包括儲存一當前參數集合以替換具有一相同類型且具有一相同識別值的一先前參數集合;及基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,用於針對該位元串流之整個部分啟動具有一特定識別值的一特定類型之一第一參數集合之構件。
在一額外實例中,本發明係針對一種包含用於寫碼視訊資料之指令之電腦可讀媒體,該等指令在經執行時使一或多個處理器寫碼指示在一位元串流之一部分中是否可發生一參數集合更新之一指示符,其中一參數集合更新包括儲存一當前參數集合以替換具有一相同類型且具有一相同識別值的一先前參數集合。基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,該等指令使該處理器針對該位元串流之整個部分啟動具有一特定識別值的一特定類型之一第一參數集合。
在隨附圖式及以下描述中闡述一或多個實例之細節。其他特徵、目標及優點將自該描述及該等圖式以及自申請專利範圍顯而易 見。
10‧‧‧視訊編碼及解碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧電腦可讀媒體
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
29‧‧‧網路實體
30‧‧‧視訊解碼器
32‧‧‧顯示器件
40‧‧‧模式選擇單元
42‧‧‧運動估計單元
44‧‧‧運動補償單元
46‧‧‧框內預測處理單元
48‧‧‧分割單元
50‧‧‧求和器
52‧‧‧變換處理單元
54‧‧‧量化單元
56‧‧‧熵編碼單元
58‧‧‧反量化單元
60‧‧‧反變換處理單元
62‧‧‧求和器
64‧‧‧參考圖像記憶體
70‧‧‧熵解碼單元
72‧‧‧運動補償單元
74‧‧‧框內預測處理單元
76‧‧‧反量化單元
78‧‧‧反變換處理單元
80‧‧‧求和器
82‧‧‧參考圖像記憶體/參考圖框記憶體
100‧‧‧視訊序列
120‧‧‧經寫碼之視訊序列/視訊資料串流
122‧‧‧存取單元(AU)定界符網路抽象層(NAL)單元
124‧‧‧圖像參數集合(PPS)網路抽象層(NAL)單元
126‧‧‧圖塊1網路抽象層(NAL)單元
128‧‧‧圖塊2網路抽象層(NAL)單元
300‧‧‧網路
302‧‧‧伺服器器件
304A‧‧‧路由器件
304B‧‧‧路由器件
306‧‧‧轉碼器件
308‧‧‧用戶端器件
圖1為說明可利用本發明中所描述之技術的實例視訊編碼及解碼系統之方塊圖。
圖2為說明可實施本發明中所描述之技術之實例視訊編碼器的方塊圖。
圖3為說明可實施本發明中所描述之技術之實例視訊解碼器的方塊圖。
圖4為說明根據預測性視訊寫碼技術而寫碼之視訊序列的概念圖。
圖5為說明經寫碼之視訊序列之一實例的概念圖。
圖6為說明判定在位元串流之部分中是否可發生參數集合更新之操作的流程圖。
圖7為說明判定是否可執行自CRA存取單元之隨機存取而不必自先前的不可用的存取單元提取參數集合之操作的流程圖。
圖8為說明形成網路之部分之實例器件集合的方塊圖。
本發明之技術提供關於在位元串流之部分中是否可發生參數集合更新之指示。位元串流之部分可為位元串流之經寫碼之視訊序列或位元串流之經寫碼之視訊序列中之圖像群組(GOP)。該指示可使視訊解碼器能夠在不執行經儲存參數集合與具有相同識別值的相同類型之新參數集合之間的內容比較的情況下判定是否可發生該經儲存參數集合之更新。參數集合更新包括儲存具有給定識別值的當前參數集合以替換具有相同類型且具有相同識別值的先前參數集合。當不能夠發生參數集合更新時,視訊解碼器可針對位元串流之整個部分儲存且啟動給定類型之單一參數集合。當可發生參數集合更新時,視訊解碼器可 自動啟動新參數集合且去啟動給定類型之經儲存參數集合,或可(例如)藉由執行內容比較來判定是否更新經儲存參數。
指示可包含位元串流層級指示,諸如,包括於位元串流之部分中的語法元素。舉例而言,指示可包含包括於位元串流中之補充增強資訊(SEI)網路抽象層(NAL)單元中之旗標。作為另一實例,指示可包含包括於位元串流中之序列參數集合(SPS)NAL單元中之旗標。在一實例中,技術包括解碼指示在位元串流之部分中是否可更新任何參數集合之旗標。在此狀況下,相同旗標可用於所有類型之參數集合,包括視訊參數集合(VPS)、序列參數集合(SPS)、圖像參數集合(PPS),及/或自適應性參數集合(APS)。詳言之,單一旗標可指示是否可更新位元串流中之參數集合中的任一者。在另一實例中,技術包括解碼若干不同旗標,其中每一者指示在位元串流之部分中是否可更新特定類型之參數集合。
圖1為說明可利用本發明中所描述之技術的實例視訊編碼及解碼系統10的方塊圖。如圖1所示,系統10包括源器件12,源器件12提供稍後待由目的地器件14解碼之經編碼視訊資料。詳言之,源器件12經由電腦可讀媒體16將視訊資料提供至目的地器件14。源器件12及目的地器件14可包含廣泛範圍之器件中的任一者,包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板型電腦、機上盒、電話手機(諸如,所謂「智慧型」手機)、所謂「智慧型」平板(smart pad)、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲主機、視訊串流器件,或其類似者。在一些狀況下,源器件12及目的地器件14可經配備以用於無線通信。
目的地器件14可經由電腦可讀媒體16接收待解碼之經編碼視訊資料。電腦可讀媒體16可包含能夠將經編碼之視訊資料自源器件12移至目的地器件14的任何類型之媒體或器件。在一實例中,電腦可讀媒 體16可包含通信媒體以使源器件12能夠將經編碼之視訊資料直接即時傳輸至目的地器件14。可根據通信標準(諸如,無線通信協定)調變經編碼之視訊資料,且將經編碼之視訊資料傳輸至目的地器件14。通信媒體可包含任何無線或有線通信媒體,諸如,射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全球網路)的部分。通信媒體可包括路由器、交換器、基地台,或可用以促進自源器件12至目的地器件14之通信的任何其他設備。
在一些實例中,可將經編碼資料自輸出介面22輸出至儲存器件。類似地,可藉由輸入介面自儲存器件存取經編碼資料。儲存器件可包括多種分散式或本端存取式資料儲存媒體中的任一者,諸如,硬碟機、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體,或用於儲存經編碼之視訊資料之任何其他合適數位儲存媒體。在另外實例中,儲存器件可對應於檔案伺服器或可儲存由源器件12產生之經編碼視訊之另一中間儲存器件。目的地器件14可經由串流傳輸或下載而自儲存器件存取經儲存視訊資料。檔案伺服器可為能夠儲存經編碼之視訊資料且將彼經編碼之視訊資料傳輸至目的地器件14的任何類型之伺服器。實例檔案伺服器包括網頁伺服器(例如,對於網站)、FTP伺服器、網路附接儲存(NAS)器件,或本端磁碟機。目的地器件14可經由包括網際網路連接之任何標準資料連接而存取經編碼之視訊資料。此資料連接可包括適合於存取儲存於檔案伺服器上之經編碼視訊資料的無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機,等等),或兩者之組合。經編碼之視訊資料自儲存器件之傳輸可為串流傳輸、下載傳輸,或其組合。
本發明之技術未必限於無線應用或設定。該等技術可應用於支援多種多媒體應用中的任一者之視訊寫碼,該等多媒體應用諸如,空 中電視廣播、有線電視傳輸、衛星電視傳輸、(例如)作為經由HTTP之動態自適應性串流(DASH)的經由網際網路之串流視訊傳輸、用於儲存於資料儲存媒體上之數位視訊之編碼、儲存於資料儲存媒體上之數位視訊之解碼,或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。
在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。目的地器件14包括輸入介面28、視訊解碼器30及顯示器件32。在其他實例中,源器件及目的地器件可包括其他組件或配置。舉例而言,源器件12可自外部視訊源18(諸如,外部攝影機)接收視訊資料。同樣地,目的地器件14可與外部顯示器件介接,而非包括整合式顯示器件。
圖1之所說明系統10僅僅為一實例。可藉由任何數位視訊編碼及/或解碼器件來執行本發明之技術。儘管大體上該等技術係藉由視訊編碼器件來執行,但該等技術亦可藉由視訊編碼器/解碼器(通常被稱作「編碼解碼器(CODEC)」)來執行。此外,亦可藉由視訊預處理器來執行本發明之技術。源器件12及目的地器件14僅僅為此等寫碼器件之實例,其中源器件12產生供傳輸至目的地器件14之經寫碼視訊資料。在一些實例中,器件12、14可以實質上對稱之方式操作,使得器件12、14中的每一者包括視訊編碼及解碼組件。因此,系統10可支援視訊器件12、14之間的單向或雙向視訊傳輸,例如,用於視訊串流、視訊播放、視訊廣播或視訊電話。
源器件12之視訊源18可包括諸如視訊攝影機之視訊俘獲器件、含有先前經俘獲視訊之視訊存檔,及/或用以自視訊內容提供者接收視訊之視訊饋入介面。作為另外替代例,視訊源18可產生基於電腦圖形之資料作為源視訊,或產生實況視訊、封存視訊及電腦產生之視訊 的組合。在一些狀況下,若視訊源18為視訊攝影機,則源器件12及目的地器件14可形成所謂攝影機電話或視訊電話。然而,如上文所提及,本發明中所描述之技術可大體上適用於視訊寫碼,且可應用於無線及/或有線應用。在每一狀況下,可藉由視訊編碼器20編碼經俘獲、被預俘獲或電腦產生之視訊。可接著藉由輸出介面22將經編碼之視訊資訊輸出至電腦可讀媒體16上。
電腦可讀媒體16可包括暫時性媒體,諸如,無線廣播或有線網路傳輸;或儲存媒體(亦即,非暫時性儲存媒體),諸如,硬碟、隨身碟、光碟、數位影音光碟、藍光光碟或其他電腦可讀媒體。在一些實例中,網路伺服器(圖中未展示)可自源器件12接收經編碼之視訊資料,且(例如)經由網路傳輸將該經編碼之視訊資料提供至目的地器件14。類似地,媒體生產設施(諸如,光碟壓印設施)之計算器件可自源器件12接收經編碼之視訊資料且產生含有該經編碼之視訊資料之光碟。因此,在各種實例中,可將電腦可讀媒體16理解成包括各種形式之一或多個電腦可讀媒體。
目的地器件14之輸入介面28自電腦可讀媒體16接收資訊。電腦可讀媒體16之資訊可包括由視訊編碼器20定義之語法資訊,該語法資訊亦由視訊解碼器30使用,且包括描述區塊及其他經寫碼單元(例如,GOP)之特性及/或處理的語法元素。顯示器件32向使用者顯示經解碼之視訊資料,且可包含多種顯示器件中的任一者,諸如,陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
視訊編碼器20及視訊解碼器30可根據視訊寫碼標準而操作,視訊寫碼標準諸如,作為被稱為聯合視訊團隊(JVT)之集體合作之產物的目前由ITU-T視訊寫碼專業團體(VCEG)及ISO/IEC動畫專業團體(MPEG)之關於視訊寫碼之聯合合作團隊(JCT-VC)開發的高效率視訊 寫碼(HEVC)標準。HEVC標準可符合HEVC測試模型(HM)。在Bross 等人的文件JCTVC-H1003「High efficiency video coding(HEVC)text specification draft 6」(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11 之關於視訊寫碼之聯合合作團隊(JCT-VC),第8次會議:San Jose,California,USA,2012年2月)中描述了被稱作「HEVC工作草案6」或「WD6」的HEVC HM之最新草案。
然而,本發明之技術不限於任何特定寫碼標準。儘管未展示於圖1中,但在一些態樣中,視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當多工器-解多工器(MUX-DEMUX)單元或其他硬體及軟體以處置共同資料串流或分離資料串流中之音訊及視訊兩者的編碼。若適用,則MUX-DEMUX單元可符合ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。
視訊編碼器20及視訊解碼器30可各自實施為多種合適編碼器電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分地在軟體中實施時,一器件可將軟體之指令儲存於合適的非暫時性電腦可讀媒體中,且在硬體中使用一或多個處理器來執行該等指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中的每一者可包括於一或多個編碼器或解碼器中,其中任一者可整合為各別器件中之組合編碼器/解碼器(編碼解碼器)的部分。
JCT-VC正致力於HEVC標準之開發。HEVC標準化努力係基於視訊寫碼器件之演進模型,其被稱作HEVC測試模型(HM)。HM假設相對於現有標準之若干額外能力。舉例而言,H.264提供九個框內預測編碼模式,而HM可提供多達三十三個框內預測編碼模式。
一般而言,HM描述視訊圖框或圖像可劃分成包括明度樣本及色 度樣本兩者之樹型區塊或最大寫碼單元(LCU)之序列。位元串流內之語法資料可定義LCU之大小,LCU就像素之數目而言為最大寫碼單元。圖塊包括按寫碼次序之數個連續樹型區塊。視訊圖框或圖像可分割成一或多個圖塊。每一樹型區塊可根據四分樹而分裂成若干寫碼單元(CU)。一般而言,四分樹資料結構對於每CU包括一個節點,其中根節點對應於樹型區塊。若CU分裂成四個子CU,則對應於該CU之節點包括四個葉節點,該四個葉節點中的每一者對應於該等子CU中之一者。
四分樹資料結構之每一節點可提供對應CU之語法資料。舉例而言,四分樹中之節點可包括分裂旗標,其指示對應於節點之CU是否被分裂成若干子CU。用於CU之語法元素可被遞歸式地定義,且可視CU是否被分裂成子CU而定。若CU不被進一步分裂,則其被稱作葉CU。在本發明中,即使不存在原始葉CU之明確分裂,葉CU之四個子CU亦將被稱作葉CU。舉例而言,若16×16大小之CU不進一步分裂,則儘管16×16CU永不分裂,但四個8×8子CU亦將被稱作葉CU。
除了CU不具有大小區別之外,CU具有類似於H.264標準之巨集區塊之用途。舉例而言,樹型區塊可分裂成四個子節點(亦被稱作子CU),且每一子節點又可為父節點並分裂成另外四個子節點。最後的未分裂之子節點(被稱作四分樹之葉節點)包含一寫碼節點(亦被稱作葉CU)。與經寫碼位元串流相關聯之語法資料可定義樹型區塊可被分裂之最大次數(被稱作最大CU深度),且亦可定義寫碼節點之最小大小。因此,位元串流亦可定義最小寫碼單元(SCU)。本發明使用術語「區塊」指代在HEVC之內容脈絡中之CU、PU或TU中的任一者,或在其他標準之內容脈絡中之類似資料結構(例如,在H.264/AVC中之巨集區塊及其子區塊)。
CU包括一寫碼節點及與該寫碼節點相關聯之若干預測單元(PU) 及變換單元(TU)。CU之大小對應於寫碼節點之大小,且形狀必須為正方形。CU之大小的範圍可自8×8像素直至具有最大64×64像素或大於64×64像素之樹型區塊之大小。每一CU可含有一或多個PU及一或多個TU。與CU相關聯之語法資料可描述(例如)CU至一或多個PU之分割。分割模式可視CU係經跳過或直接模式編碼、經框內預測模式編碼抑或經框間預測模式編碼而不同。PU可被分割成非正方形。與CU相關聯之語法資料亦可描述(例如)將CU根據四分樹分割成一或多個TU。TU之形狀可為正方形或非正方形(例如,矩形)。
HEVC標準允許根據TU之變換,該等變換對於不同CU可不同。通常基於針對經分割LCU所定義之給定CU內之PU的大小而設定TU大小,但可能並非總是如此狀況。TU通常具有與PU相同的大小,或小於PU。在一些實例中,可使用稱為「殘餘四分樹」(RQT)之四分樹結構將對應於CU之殘餘樣本再分成若干較小單元。RQT之葉節點可被稱作變換單元(TU)。可變換與TU相關聯之像素差值以產生可量化之變換係數。
葉CU可包括一或多個預測單元(PU)。一般而言,PU表示對應於對應CU之全部或一部分之空間區域,且可包括用於擷取PU之參考樣本之資料。此外,PU包括與預測有關之資料。舉例而言,當PU經框內模式編碼時,用於PU之資料可包括於殘餘四分樹(RQT)中,殘餘四分樹可包括描述對應於PU之TU之框內預測模式的資料。作為另一實例,當PU經框間模式編碼時,PU可包括定義該PU之一或多個運動向量之資料。定義PU之運動向量之資料可描述(例如)運動向量之水平分量、運動向量之垂直分量、運動向量之解析度(例如,四分之一像素精度或八分之一像素精度)、運動向量所指向的參考圖像,及/或運動向量之參考圖像清單(例如,清單0或清單1)。
具有一或多個PU之葉CU亦可包括一或多個變換單元(TU)。可使 用RQT(亦被稱作TU四分樹結構)指定變換單元,如上文所論述。舉例而言,分裂旗標可指示葉CU是否分裂成四個變換單元。接著,每一變換單元可進一步分裂成另外的子TU。當TU不被進一步分裂時,其可被稱作葉TU。通常,對於框內寫碼,屬於葉CU之所有葉TU共用相同框內預測模式。亦即,一般將相同框內預測模式應用於計算葉CU之所有TU之預測值。對於框內寫碼,視訊編碼器可使用框內預測模式計算每一葉TU之殘餘值,作為對應於TU之CU之部分與原始區塊之間的差。TU未必限於PU之大小。因此,TU可能大於或小於PU。對於框內寫碼,PU可能與相同CU之對應葉TU設在同一位置。在一些實例中,葉TU之最大大小可對應於對應葉CU之大小。
此外,葉CU之TU亦可與被稱作殘餘四分樹(RQT)之各別四分樹資料結構相關聯。亦即,葉CU可包括指示如何將葉CU分割成TU之四分樹。TU四分樹之根節點一般對應於葉CU,而CU四分樹之根節點一般對應於樹型區塊(或LCU)。RQT之不被分裂的TU被稱作葉TU。一般而言,除非另外提及,否則本發明分別使用術語CU及TU來指代葉CU及葉TU。
視訊序列通常包括一系列視訊圖框或圖像。圖像群組(GOP)一般包含視訊圖像中之一系列的一或多者。GOP可在GOP之標頭、圖像中之一或多者之標頭中或在別處包括描述包括於GOP中之圖像數目的語法資料。圖像之每一圖塊可包括描述該各別圖塊之編碼模式的圖塊語法資料。視訊編碼器20通常對個別視訊圖塊內之視訊區塊進行操作,以便編碼視訊資料。視訊區塊可對應於CU內之寫碼節點。視訊區塊可具有固定或變化之大小,且可根據指定寫碼標準而具有不同大小。
作為一實例,HM支援以各種PU大小進行預測。假定特定CU之大小為2N×2N,則HM支援以2N×2N或N×N之PU大小進行框內預測,及以2N×2N、2N×N、N×2N或N×N之對稱PU大小進行框間預測。HM 亦支援以2N×nU、2N×nD、nL×2N及nR×2N之PU大小之不對稱分割以進行框間預測。在不對稱分割中,CU之一方向未被分割,而另一方向被分割成25%及75%。CU之對應於25%分割區之部分由「n」繼之以「上」、「下」、「左」或「右」之指示來指示。因此,例如,「2N×nU」指代被水平分割而具有頂部的2N×0.5N PU及底部的2N×1.5N PU之2N×2N CU。
在本發明中,「N×N」與「N乘N」可互換地使用以指代視訊區塊的在垂直維度與水平維度上之像素尺寸,例如,16×16像素或16乘16像素。一般而言,16x16區塊在垂直方向中將具有16個像素(y=16)且在水平方向中將具有16個像素(x=16)。同樣地,N×N區塊一般在垂直方向上具有N個像素,且在水平方向上具有N個像素,其中N表示非負整數值。可按多列及多行來配置區塊中之像素。另外,區塊未必需要在水平方向上與在垂直方向上具有相同數目個像素。舉例而言,區塊可包含NxM個像素,其中M未必等於N。
在使用CU之PU進行框內預測性或框間預測性寫碼之後,視訊編碼器20可計算CU之TU之殘餘資料。PU可包含描述在空間域(亦被稱作像素域)中產生預測性像素資料之方法或模式的語法資料,且TU可包含在將例如離散餘弦變換(DCT)、整數變換、小波變換或概念上類似之變換的變換應用於殘餘視訊資料之後在變換域中之係數。殘餘資料可對應於未經編碼圖像之像素與對應於PU之預測值之間的像素差。視訊編碼器20可形成包括CU之殘餘資料的TU,且接著變換該等TU以產生CU之變換係數。
在應用任何變換以產生變換係數之後,視訊編碼器20可執行變換係數之量化。量化一般指代如下程序:將變換係數量化以可能地減少用以表示該等係數之資料量,從而提供進一步壓縮。該量化程序可減少與該等係數中之一些或全部相關聯的位元深度。舉例而言,可在 量化期間將n位元值降值捨位至m位元值,其中n大於m
在量化之後,視訊編碼器可掃描變換係數,從而自包括經量化之變換係數之二維矩陣產生一維向量。掃描可經設計成將較高能量(且因此較低頻率)係數置於陣列前部,且將較低能量(且因此較高頻率)係數置於陣列後部。在一些實例中,視訊編碼器20可利用預定義掃描次序來掃描經量化之變換係數,以產生可被熵編碼的串列化向量。在其他實例中,視訊編碼器20可執行自適應性掃描。在掃描經量化之變換係數以形成一維向量之後,視訊編碼器20可(例如)根據上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、基於語法之上下文自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼方法而熵編碼該一維向量。視訊編碼器20亦可熵編碼與經編碼之視訊資料相關聯的語法元素以供視訊解碼器30用於解碼視訊資料。
為了執行CABAC,視訊編碼器20可將上下文模型內之上下文指派給待傳輸之符號。該上下文可能係關於(例如)符號之相鄰值是否為非零。為了執行CAVLC,視訊編碼器20可針對待傳輸之符號選擇一可變長度碼。可建構VLC中之碼字使得相對較短碼對應於更有可能的符號,而較長碼對應於較不可能的符號。以此方式,使用VLC可達成位元節省(與(例如)針對待傳輸之每一符號使用等長度碼字相比較)。可基於指派給符號之上下文而進行機率判定。
視訊編碼器20可進一步在(例如)圖框標頭、區塊標頭、圖塊標頭或GOP標頭中將語法資料(諸如,基於區塊之語法資料、基於圖框之語法資料及基於GOP之語法資料)發送至視訊解碼器30。GOP語法資料可描述各別GOP中的圖框數目,且圖框語法資料可指示用以編碼對應圖框之編碼/預測模式。
視訊編碼器20及視訊解碼器30可各自實施為多種合適編碼器或 解碼器電路中的任一者(在適用時),諸如,一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯電路、軟體、硬體、韌體或其任何組合。視訊編碼器20及視訊解碼器30中的每一者可包括於一或多個編碼器或解碼器中,其中任一者可整合為組合式視訊編碼器/解碼器(編碼解碼器)之部分。包括視訊編碼器20及/或視訊解碼器30之器件可包含積體電路、微處理器及/或無線通信器件(諸如,蜂巢式電話)。
視訊編碼器20及視訊解碼器30可經組態以實施本發明中所描述之技術中之一或多者。作為一實例,視訊編碼器20可經組態以編碼關於在位元串流之部分中是否可發生參數集合更新之指示。視訊解碼器30可經組態以解碼該指示以在不執行經儲存參數集合與具有相同識別值的相同類型之新參數集合之間的內容比較的情況下判定是否可發生該經儲存參數集合之更新。當發生參數集合更新時,視訊解碼器30儲存具有給定識別值之當前參數集合以替換具有相同類型且具有相同識別值的先前參數集合。該指示所應用於之位元串流部分可為位元串流之經寫碼視訊序列或位元串流之經寫碼視訊序列中之GOP。
在一狀況下,指示可包含在位元串流中的語法元素(諸如,旗標),其指示在位元串流之部分中是否可更新任何類型之任何參數集合。在另一狀況下,指示可包含在位元串流中的若干不同旗標,其中每一者指示在位元串流之部分中是否可更新特定類型之參數集合。在任一狀況下,當旗標指示不能夠發生參數集合更新時,視訊解碼器30可針對位元串流之整個部分儲存且啟動給定類型之單一參數集合。在接收到具有與初始參數集合相同的類型且具有與初始參數集合相同的識別值之後續參數集合時,視訊解碼器30可忽略該後續參數集合。相反地,當旗標指示可發生參數集合更新時,視訊解碼器30可自動啟動新參數集合且去啟動給定類型之經儲存參數集合,或可(例如)藉由執 行內容比較來判定是否更新經儲存參數。
作為另一實例,視訊編碼器20可經組態以編碼一指示,該指示係關於在位元串流中執行自特定CRA存取單元的隨機存取是否要求自先前存取單元提取參數集合。視訊解碼器30可經組態以解碼該指示以判定是否需要包括於先前存取單元中之參數集合以執行自特定CRA圖像之隨機存取。在一些狀況下,指示可包含包括於NAL單元有效負載中之語法元素(諸如,旗標),該NAL單元有效負載包括在位元串流中之每一CRA圖像之存取單元中。
CRA存取單元可出現於經寫碼之視訊序列內之任何點處且不清除DPB,此在無較低寫碼效率的情況下提供對位元串流之隨機存取之更多選項。在自CRA圖像進行隨機存取之狀況下,將不解碼按輸出或解碼次序在該CRA圖像之前的所有圖像且該等圖像不可用作參考圖像。為了解碼CRA圖像或按輸出或解碼次序之任何後繼圖像,視訊解碼器可需要提取包括於不可用先前圖像中之一者之存取單元中的一或多個參數集合,此為繁重的操作。根據本發明之一些技術,當旗標指示不需要來自先前存取單元之參數集合以進行自一特定CRA圖像之隨機存取時,視訊解碼器30可判定執行自彼圖像之隨機存取,此係因為不需要提取操作。相反地,當旗標指示需要來自先前存取單元之參數集合以進行自一特定CRA圖像之隨機存取時,視訊解碼器30可判定不執行自彼圖像之隨機存取以便避免提取操作。儘管主要關於CRA圖像予以描述,但技術可類似地用於其他類型之RAP圖像,包括IDR圖像及漸進解碼再新(GDR)圖像。
圖2為說明可實施本發明中所描述之技術的視訊編碼器20之實例的方塊圖。視訊編碼器20可執行視訊圖塊內之視訊區塊之框內寫碼及框間寫碼。框內寫碼依賴於空間預測以減少或移除給定視訊圖框或圖像內之視訊的空間冗餘。框間寫碼依賴於時間預測以減少或移除視訊 序列之鄰近圖框或圖像內之視訊的時間冗餘。框內模式(I模式)可指代若干基於空間之寫碼模式中的任一者。諸如單向預測(P模式)或雙向預測(B模式)之框間模式可指代若干基於時間之寫碼模式中的任一者。
如圖2所示,視訊編碼器20接收待編碼之視訊圖框內之當前視訊區塊。在圖2之實例中,視訊編碼器20包括模式選擇單元40、參考圖像記憶體64、求和器50、變換處理單元52、量化單元54,及熵編碼單元56。模式選擇單元40又包括運動補償單元44、運動估計單元42、框內預測處理單元46,及分割單元48。對於視訊區塊重建構,視訊編碼器20亦包括反量化單元58、反變換處理單元60,及求和器62。
在編碼程序期間,視訊編碼器20接收待寫碼之視訊圖框或圖塊。可將圖框或圖塊劃分成多個視訊區塊。運動估計單元42及運動補償單元44執行所接收之視訊區塊相對於一或多個參考圖框中之一或多個區塊的框間預測性寫碼,以提供時間預測。或者,框內預測處理單元46可執行經接收視訊區塊相對於與待寫碼之區塊處於同一圖框或圖塊中之一或多個相鄰區塊的框內預測性寫碼,以提供空間預測。視訊編碼器20可執行多個寫碼遍次(例如)以選擇用於視訊資料之每一區塊之適當寫碼模式。
此外,分割單元48可基於在先前寫碼遍次中對先前分割方案之評估而將視訊資料之區塊分割成若干子區塊。舉例而言,分割單元48可最初將一圖框或圖塊分割成若干LCU,且基於位元率-失真分析(例如,位元率-失真最佳化)而將該等LCU中的每一者分割成若干子CU。模式選擇單元40可進一步產生指示LCU至子CU之分割的四分樹資料結構。四分樹之葉節點CU可包括一或多個PU及一或多個TU。
模式選擇單元40可選擇寫碼模式(框內或框間)中之一者(例如,基於誤差結果),且將所得經框內或框間寫碼之區塊提供至求和器50 以產生殘餘區塊資料,且提供至求和器62以重建構經編碼區塊以用作參考圖框。模式選擇單元40亦將諸如運動向量、框內模式指示符、分割資訊及其他此類語法資訊之語法元素提供至熵編碼單元56。
運動估計單元42及運動補償單元44可高度整合,但出於概念性目的而對該等單元分別加以說明。由運動估計單元42執行之運動估計為產生運動向量之程序,運動向量估計視訊區塊之運動。舉例而言,運動向量可指示當前視訊圖框或圖像內之視訊區塊之PU相對於參考圖框(或其他經寫碼單元)內之預測性區塊的位移,該預測性區塊係關於當前圖框(或其他經寫碼單元)內的正被寫碼之當前區塊。預測性區塊為被發現在像素差方面與待寫碼之區塊緊密匹配的區塊,可藉由絕對差和(SAD)、平方差和(SSD)或其他差量度來判定像素差。在一些實例中,視訊編碼器20可計算儲存於參考圖像記憶體64(其亦可被稱作經解碼圖像緩衝器(DPB))中之參考圖像之次整數像素位置的值。舉例而言,視訊編碼器20可內插參考圖像之四分之一像素位置、八分之一像素位置或其他分率像素位置的值。因此,運動估計單元42可執行相對於完整像素位置及分率像素位置之運動搜尋,且以分率像素精度輸出運動向量。
運動估計單元42藉由比較框間寫碼圖塊中之視訊區塊的PU之位置與參考圖像之預測性區塊之位置而計算該PU之運動向量。參考圖像可選自第一參考圖像清單(清單0)或第二參考圖像清單(清單1),該等清單中之每一者識別儲存於參考圖像記憶體64中之一或多個參考圖像。運動估計單元42將經計算的運動向量發送至熵編碼單元56及運動補償單元44。
由運動補償單元44執行之運動補償可涉及基於由運動估計單元42判定之運動向量來提取或產生預測性區塊。再次,在一些實例中,運動估計單元42及運動補償單元44可在功能上整合。在接收到當前視 訊區塊之PU之運動向量時,運動補償單元44可在參考圖像清單中之一者中探尋運動向量所指向的預測性區塊。求和器50藉由自正被寫碼之當前視訊區塊的像素值減去預測性區塊之像素值來形成殘餘視訊區塊,從而形成像素差值,如下文所論述。一般而言,運動估計單元42執行相對於明度分量之運動估計,且運動補償單元44將基於明度分量所計算之運動向量用於色度分量及明度分量兩者。模式選擇單元40亦可產生與視訊區塊及視訊圖塊相關聯的語法元素以供視訊解碼器30用於解碼視訊圖塊之視訊區塊。
如上文所描述,作為由運動估計單元42及運動補償單元44執行之框間預測的替代例,框內預測處理單元46可對當前區塊進行框內預測。詳言之,框內預測處理單元46可判定用以編碼當前區塊的框內預測模式。在一些實例中,框內預測處理單元46可(例如)在單獨編碼遍次期間使用各種框內預測模式編碼當前區塊,且框內預測處理單元46(或在一些實例中,模式選擇單元40)可自經測試模式中選擇要使用的適當框內預測模式。
舉例而言,框內預測處理單元46可對於各種經測試之框內預測模式使用位元率-失真分析來計算位元率-失真值,且在經測試模式當中選擇具有最佳位元率-失真特性之框內預測模式。位元率-失真分析大體上判定經編碼區塊與原始未經編碼區塊之間的失真(或誤差)之量以及用以產生經編碼區塊之位元率(亦即,位元數目),該原始未經編碼區塊經編碼以產生該經編碼區塊。框內預測處理單元46可根據各種經編碼區塊之失真及位元率計算比率,以判定哪一框內預測模式針對該區塊展現最佳位元率-失真值。
在選擇區塊之框內預測模式之後,框內預測處理單元46可將指示區塊之選定框內預測模式之資訊提供至熵編碼單元56。熵編碼單元56可編碼指示選定框內預測模式之資訊。視訊編碼器20可在經傳輸之 位元串流中包括組態資料,該組態資料可包括:複數個框內預測模式索引表及複數個經修改之框內預測模式索引表(亦被稱作碼字映射表)、各種區塊之編碼上下文之定義,及將用於該等上下文中的每一者之最有可能的框內預測模式、框內預測模式索引表及經修改之框內預測模式索引表的指示。
視訊編碼器20藉由自正被寫碼之原始視訊區塊減去來自模式選擇單元40之預測資料而形成殘餘視訊區塊。求和器50表示執行此減法運算之一或多個組件。變換處理單元52將諸如離散餘弦變換(DCT)或概念上類似之變換的變換應用於殘餘區塊,從而產生包含殘餘變換係數值之視訊區塊。變換處理單元52可執行概念上類似於DCT之其他變換。亦可使用小波變換、整數變換、子頻帶變換或其他類型之變換。在任何狀況下,變換處理單元52將變換應用於殘餘區塊,從而產生殘餘變換係數之區塊。該變換可將殘餘資訊自像素值域轉換至變換域(諸如,頻域)。變換處理單元52可將所得變換係數發送至量化單元54。量化單元54量化該等變換係數以進一步減小位元率。量化程序可減小與該等係數中之一些或全部相關聯的位元深度。可藉由調整量化參數而修改量化程度。在一些實例中,量化單元54可接著執行對包括經量化之變換係數之矩陣的掃描。或者,熵編碼單元56可執行該掃描。
在量化之後,熵編碼單元56熵寫碼經量化之變換係數。舉例而言,熵編碼單元56可執行上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、基於語法之上下文自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵寫碼技術。在基於上下文之熵寫碼之狀況下,上下文可基於相鄰區塊。在藉由熵編碼單元56進行之熵寫碼之後,可將經編碼位元串流傳輸至另一器件(例如,視訊解碼器30)或經封存以供稍後傳輸或擷取。
反量化單元58及反變換處理單元60分別應用反量化及反變換,以在像素域中重建構殘餘區塊(例如)供稍後用作參考區塊。運動補償單元44可藉由將殘餘區塊添加至參考圖像記憶體64之圖框中之一者的預測性區塊來計算參考區塊。運動補償單元44亦可對該經重建構的殘餘區塊應用一或多個內插濾波器以計算用於在運動估計中使用之次整數像素值。求和器62將經重建構之殘餘區塊加至由運動補償單元44產生之經運動補償的預測區塊,以產生經重建構之視訊區塊以供儲存於參考圖像記憶體64中。
圖2之視訊編碼器20表示經組態以實施本發明中所描述之技術中之一或多者的視訊編碼器之實例。在該等技術之一實例中,視訊編碼器20可經組態以編碼關於在位元串流之部分中是否可發生參數集合更新之指示。該指示可由視訊編碼器20產生以便向視訊解碼器通知是否可發生經儲存參數集合之更新。以此方式,基於該指示,視訊解碼器首先判定在位元串流之部分中究竟是否允許參數集合更新,之後才判定是否實際地執行更新(例如,藉由執行經儲存的作用中參數集合與具有相同識別值的相同類型之新參數集合之間的內容比較)。
在一些狀況下,指示可包含關於是否可更新針對位元串流之部分(例如,經寫碼之視訊序列或GOP)之參數集合中的任一者之單一指示。在此狀況下,相同指示可用於所有類型之參數集合,包括視訊參數集合(VPS)、序列參數集合(SPS)、圖像參數集合(PPS),及/或自適應性參數集合(APS)。在其他狀況下,指示可包含若干不同指示,其中每一者指示在位元串流之部分中是否可更新特定類型之參數集合。指示可為位元串流層級指示(諸如,包括於位元串流之部分中的語法元素)。舉例而言,指示可為包括於位元串流中之補充增強資訊(SEI)網路抽象層(NAL)單元中的語法元素(諸如,旗標)。作為另一實例,指示可為包括於位元串流中之序列參數集合(SPS)NAL單元中的語法 元素(諸如,旗標)。
在其他實例中,指示可為設定檔定義中之要求。在額外實例中,當將視訊位元串流用於基於即時輸送協定(RTP)之傳輸環境(諸如,用於媒體資料輸送之使用RTP的串流或多播)中時,指示可被定義為媒體類型參數且包括於會話描述協定(SDP)中。在此狀況下,指示可用於會話協商階段(亦被稱為能力交換)中。在又其他實例中,指示可被定義為包括於超文本傳送協定(HTTP)串流環境(諸如,DASH)中之媒體呈現描述(MPD)中之串流性質。
在技術之另一實例中,視訊編碼器20可經組態以針對每一CRA圖像編碼關於執行自CRA存取單元對位元串流之隨機存取是否要求自先前存取單元提取參數集合之指示。該指示可由視訊編碼器20產生以便向視訊解碼器通知是否需要包括於先前存取單元中之參數集合以執行自特定CRA存取單元之隨機存取。以此方式,基於該指示,視訊解碼器首先判定自特定CRA存取單元之隨機存取解碼是否要求提取操作,且可藉由選擇供執行隨機存取的不同RAP圖像而避免執行提取操作。該指示對於在HEVC標準中引入之CRA存取單元尤其有用,此係因為CRA圖像可定位於經寫碼之視訊序列內之任何點處且不清除DPB,此在無較低寫碼效率的情況下提供對位元串流之隨機存取之更多選項。
在一些狀況下,指示可包含特定類型之NAL單元,例如,特定類型之SPS、SEI或存取單元定界符NAL單元,其包括於位元串流中之每一CRA圖像之存取單元中。在其他狀況下,指示可包含語法元素(諸如,旗標),其包括於NAL單元有效負載(例如,SPS、SEI或存取單元定界符NAL單元有效負載)中;或包括於NAL單元標頭中,NAL單元標頭包括於位元串流中之每一CRA圖像之存取單元中。在一實例中,指示可包含包括於CRA圖像之存取單元中的SEI NAL單元中之旗標。儘管主要關於CRA圖像予以描述,但視訊編碼器20可針對其他類 型之RAP圖像編碼類似指示,其他類型之RAP圖像包括IDR圖像及漸進解碼再新(GDR)圖像。
圖3為說明解碼經編碼之視訊序列之視訊解碼器30之實例的方塊圖。在圖3之實例中,視訊解碼器30包括熵解碼單元70、運動補償單元72、框內預測處理單元74、反量化單元76、反變換處理單元78、求和器80,及參考圖像記憶體82。在一些實例中,視訊解碼器30可執行大體上與關於視訊編碼器20(圖2)所描述之編碼遍次互逆的解碼遍次。
在解碼程序期間,視訊解碼器30自視訊編碼器20接收經編碼之視訊位元串流,該串流表示經編碼之視訊圖塊之視訊區塊及關聯之語法元素。視訊解碼器30可自網路實體29接收經編碼之視訊位元串流。舉例而言,網路實體29可為串流伺服器、媒體感知網路元件(MANE)、視訊編輯器/接合器、中間網路元件,或經組態以實施上文所描述之技術中之一或多者的其他此類器件。網路實體29可包括經組態以執行本發明之一些技術之外部構件。本發明中所描述之一些技術可在網路實體29將經編碼之視訊位元串流傳輸至視訊解碼器30之前由網路實體29來實施。在一些視訊解碼系統中,網路實體29及視訊解碼器30可為單獨器件之部分,而在其他情況下,關於網路實體29所描述之功能性可藉由包含視訊解碼器30之相同器件來執行。
視訊解碼器30之熵解碼單元70熵解碼位元串流以產生經量化之係數、運動向量或框內預測模式指示符及其他語法元素。熵解碼單元70將運動向量及其他語法元素轉遞至運動補償單元72。視訊解碼器30可在視訊圖塊層級及/或視訊區塊層級處接收語法元素。
當視訊圖塊經寫碼為框內寫碼(I)圖塊時,框內預測處理單元74可基於所傳訊之框內預測模式及來自當前圖框或圖像之先前經解碼區塊的資料而產生當前視訊圖塊之視訊區塊的預測資料。當視訊圖框經 寫碼為框間寫碼(亦即,B或P)圖塊時,運動補償單元72基於自熵解碼單元70接收之運動向量及其他語法元素而產生當前視訊圖塊之視訊區塊之預測性區塊。可自參考圖像清單中之一者內之參考圖像中之一者產生預測性區塊。視訊解碼器30可基於儲存於參考圖框記憶體82(其可被稱作經解碼圖像緩衝器(DPB))中之參考圖像來建構參考圖框清單:清單0及清單1。
運動補償單元72藉由剖析運動向量及其他語法元素而判定當前視訊圖塊之視訊區塊之預測資訊,且使用該預測資訊以產生正被解碼之當前視訊區塊之預測性區塊。舉例而言,運動補償單元72使用一些所接收之語法元素以判定用以寫碼視訊圖塊之視訊區塊之預測模式(例如,框內預測或框間預測)、框間預測圖塊類型(例如,B圖塊或P圖塊)、圖塊之參考圖像清單中之一或多者之建構資訊、圖塊之每一框間編碼視訊區塊之運動向量、圖塊之每一框間寫碼視訊區塊之框間預測狀態,及用以解碼當前視訊圖塊中之視訊區塊之其他資訊。
運動補償單元72亦可基於內插濾波器執行內插。運動補償單元72可使用如由視訊編碼器20在視訊區塊之編碼期間使用的內插濾波器,以計算參考區塊之次整數像素的內插值。在此狀況下,運動補償單元72可自所接收之語法元素判定由視訊編碼器20使用之內插濾波器且使用該等內插濾波器以產生預測性區塊。
反量化單元76將位元串流中所提供且由熵解碼單元70解碼的經量化之變換係數反量化(亦即,解量化)。反量化程序可包括使用由視訊解碼器30針對視訊圖塊中之每一視訊區塊計算之量化參數QPY,以判定量化程度及(同樣)應應用之反量化的程度。反變換處理單元78將反轉換(例如,反DCT、反整數變換或概念上類似之反變換程序)應用於變換係數以便在像素域中產生殘餘區塊。
在運動補償單元72基於運動向量及其他語法元素產生當前視訊 區塊之預測性區塊之後,視訊解碼器30藉由對來自反變換單元78之殘餘區塊與由運動補償單元72產生的對應預測性區塊求和而形成經解碼之視訊區塊。求和器80表示執行此求和運算之(多個)組件。若需要,亦可應用解區塊濾波器來對經解碼區塊濾波以便移除方塊效應假影(blockiness artifact)。其他迴路濾波器(寫碼迴路中抑或寫碼迴路後)亦可用以使像素轉變平滑,或以其他方式改良視訊品質。接著將給定圖框或圖像中之經解碼之視訊區塊儲存於參考圖像記憶體82中,參考圖像記憶體82儲存用於後續運動補償之參考圖像。參考圖框記憶體82亦儲存經解碼之視訊以用於稍後在顯示器件(諸如,圖1之顯示器件32)上呈現。
圖3之視訊解碼器30表示經組態以實施本發明中所描述之技術中之一或多者的視訊解碼器之實例。在該等技術之一實例中,視訊解碼器30可經組態以解碼關於在位元串流之部分中是否可發生參數集合更新之指示。當該指示指示在位元串流之部分中不能夠發生參數集合更新時,視訊解碼器30針對位元串流之整個部分啟動給定類型之初始參數集合。在此狀況下,在接收到具有與初始參數集合相同的類型且具有與初始參數集合相同的識別值之後續參數集合時,視訊解碼器30無需判定是否更新經寫碼之視訊序列之初始參數集合且可忽略後續參數集合。
HEVC HM包括參數集合之概念。參數集合為包括語法元素之語法結構,該等語法元素經組態以指示使視訊解碼器能夠重建構經寫碼之視訊之資訊。可基於由語法元素指示之資訊及預期語法元素在位元串流中改變之頻率而使語法元素包括於特定類型之參數集合中。舉例而言,視訊參數集合(VPS)包括描述經寫碼之視訊序列之總體特性(包括時間子層之間的相依性)之語法元素。序列參數集合(SPS)包括被預期對於圖像序列內之圖像而言保持不變之語法元素(例如,圖像次 序、參考圖像數目及圖像大小)。圖像參數集合(PPS)包括可在序列內在圖像間改變之語法元素(例如,熵寫碼模式、量化參數及位元深度)。自適應性參數集合(APS)包括被預期在序列之圖像內改變之語法元素(例如,區塊大小及解區塊濾波)。
參數集合概念將不頻繁改變之資訊之傳輸與經寫碼之視訊資料之傳輸解耦。在一些實例中,可「頻帶外」傳遞參數集合(亦即,不將其與含有經寫碼視訊資料的單元一起輸送)。可能需要在頻帶外地傳輸參數集合,此係因為相比於資料頻道內之「頻帶內」傳輸,頻帶外傳輸通常更為可靠。在HEVC HM中,每一VPS包括一VPS識別(ID)值,每一SPS包括一SPS ID且參考使用一VPS ID之一VPS,且每一PPS包括一PPS ID且參考使用一SPS ID之一SPS。另外,每一圖塊標頭參考使用一PPS ID之一PPS。
在位元串流中,當具有特定參數集合ID值的特定類型之參數集合具有與具有相同ID值的相同類型之先前參數集合(按位元串流次序或解碼次序)之內容不同的內容時,可更新具有彼特定ID值的特定類型之參數集合。當發生參數集合更新時,視訊解碼器30儲存具有給定ID值之當前參數集合以替換具有相同類型且具有相同ID值的先前參數集合。
當需要特定類型之新參數集合,但已使用所有可能ID值時,可發生參數集合更新。在經接合之位元串流中,即使在未完全利用參數集合ID值空間時亦可發生參數集合更新。位元串流接合指代兩個或兩個以上位元串流或位元串流之部分之組合。第一位元串流可由第二位元串流附加,可能地對該等位元串流中之一者或兩者進行一些修改以產生經接合之位元串流。第二位元串流中之第一經寫碼之圖像亦被稱作接合點。經接合之位元串流中之接合點處的圖像起源自第二位元串流,而經接合之位元串流中之緊接在接合點之前的圖像起源自第一位 元串流。
位元串流通常使用每一類型之幾個參數集合(例如,幾個SPS及幾個PPS),且有時使用每一類型之僅一個參數集合。另外,位元串流中的每一者通常針對不同類型之參數集合中的每一者以最小參數集合ID值0開始。以此方式,若兩個位元串流被接合,則很可能針對特定類型之參數集合之同一ID值(例如,具有ID值0之SPS)由接合點及緊接在該接合點圖像之前的圖像兩者參考,但該兩個參數集合包括不同內容。因此,由該接合點之前的圖像所參考之參數集合需要用由接合點圖像參考的具有相同ID值的相同類型之參數集合更新。在此狀況下,在經接合之位元串流開始時不能夠傳輸該經接合之位元串流之參數集合,且因此,不能夠相對於位元串流之經寫碼視訊序列在頻帶外地傳輸該經接合之位元串流之參數集合。
習知地,為了判定是否應啟動具有特定ID值的任何類型之當前參數集合以更新具有相同ID值之先前參數集合,視訊解碼器比較該當前參數集合之內容與該先前參數集合之內容以判定內容是否不同。當當前參數集合之內容不同於先前參數集合時,視訊解碼器針對位元串流啟動當前參數集合且去啟動先前參數集合。視訊解碼器每當在其接收到具有與較早所接收之參數集合之ID值相同的特定ID值之特定類型之新參數集合時就執行此內容比較。當在頻帶內傳輸參數集合(亦即,與位元串流之經寫碼之視訊序列一起傳輸)時,視訊解碼器可接收該等參數集合之重複傳輸以實現改良的誤差恢復。視訊解碼器接著執行針對每一重複的參數集合之內容比較。此內容比較係不必要的且將計算負擔強加給視訊解碼器。
本發明中所描述之技術提供經組態以指示在位元串流之部分(例如,經寫碼之視訊序列或經寫碼之視訊序列中之GOP)中是否可發生參數集合更新之指示符。當該指示符指示在位元串流之部分中不能夠 發生參數集合更新時,視訊解碼器30僅針對位元串流之整個部分儲存且啟動具有特定ID值之第一參數集合。另外,當指示符指示不能夠發生參數集合更新時,視訊解碼器30將不執行任何參數集合更新,且因此無需比較第一參數集合之內容與具有相同ID值的相同類型之第二參數集合之內容。以此方式,視訊解碼器30可操作,就好像第一參數集合之內容與具有相同ID值的相同類型之任何其他參數集合中所包括的內容等同一樣。
當指示符指示在位元串流之部分中可發生參數集合更新時,視訊解碼器30儲存且啟動具有特定ID值之第一參數集合,但可使用具有相同ID值的相同類型之第二參數集合來更新經儲存之第一參數集合以替換該經儲存之第一參數集合。在一些狀況下,視訊解碼器30可針對位元串流之部分自動啟動第二參數集合,且去啟動第一參數集合。在其他狀況下,視訊解碼器30可比較第一參數集合之內容與第二參數集合之內容。當第二參數集合之內容不同於第一參數集合之內容時,視訊解碼器30針對位元串流之部分啟動第二參數集合,且去啟動第一參數集合。
指示可包含包括於位元串流中的位元串流層級語法元素,諸如,旗標。舉例而言,指示可包含包括於與位元串流中之經寫碼之視訊序列相關聯的一或多個補充增強資訊(SEI)網路抽象層(NAL)單元中之旗標。作為另一實例,指示可包含包括於位元串流中之經寫碼視訊序列之一或多個序列參數集合(SPS)NAL單元中的旗標。
在一實例中,旗標可指示在位元串流之部分中是否可更新任何參數集合。因此,單一旗標可用以指示不同類型之參數集合之更新狀態。在此狀況下,相同旗標可用於所有類型之參數集合,包括VPS、SPS、PPS及/或APS。當旗標等於1時,可更新參數集合。當旗標等於0時,不應更新參數集合,且視訊解碼器30不執行具有相同類型且具 有相同參數集合ID值之參數集合之間的內容比較。當旗標等於0時,內容比較沒有必要,此係因為視訊解碼器30可進行操作就好像具有相同類型且具有相同ID值的參數集合具有相同內容一樣。
在另一實例中,旗標可指示在位元串流之部分中是否可更新特定類型之參數集合。在此狀況下,不同旗標可用於不同類型之參數集合中的每一者,包括VPS、SPS、PPS及/或APS。因此,每一類型之參數集合實際上可具有其自身的用以指示其是否可被更新的旗標。當旗標等於1時,可更新該特定類型之參數集合。當旗標等於0時,不應更新特定類型之參數集合,且視訊解碼器30不執行具有該特定類型且具有相同參數集合ID值之參數集合之間的內容比較。當旗標等於0時,內容比較沒有必要,此係因為視訊解碼器30可進行操作就好像具有該特定類型且具有相同ID值的參數集合具有相同內容一樣。
在另外實例中,旗標可指示在位元串流之部分中是否可更新不同類型之兩個或兩個以上參數集合。在此狀況下,一旗標可用於不同類型之參數集合中之兩者或兩者以上(例如,SPS及PPS),且另一旗標可用於不同類型之參數集合中之一者或一者以上(例如,VPS)。因此,一些類型之參數集合可共用一旗標以指示聯合更新狀態,而其他類型之參數集合可具有個別旗標以指示個別更新狀態。另外,在一些狀況下,指示可包含為具有多個位元之單一語法元素之位元遮罩或碼字,其中每一位元對應於參數集合中之一或多者之更新狀態,或碼字具有特定值以指示不同參數集合之更新狀態之不同組合。
在一些狀況下,關於在位元串流之部分中是否可發生參數集合更新之指示可判定如何將參數集合傳輸至視訊解碼器30。舉例而言,當在位元串流之部分中可發生參數集合更新時,不可相對於位元串流之經寫碼視訊序列在頻帶外地傳輸參數集合,此係因為針對位元串流之不同部分(例如,在經接合之位元串流之接合點圖像處)可發生更 新。
根據該等技術,在一實例中,當指示符指示在位元串流之部分中不能夠發生參數集合更新時,視訊解碼器30可在頻帶外傳輸(亦即,與位元串流之經寫碼視訊序列分離之傳輸)中接收第一參數集合。在此狀況下,因為第一參數集合為針對整個位元串流所啟動之唯一參數集合,所以諸如視訊編碼器20之視訊編碼器可在頻帶外編碼該第一參數集合,使得該第一參數集合與經寫碼之視訊序列資料分離。在另一實例中,當指示符指示在位元串流之部分中不能夠發生參數集合更新時,視訊解碼器30可在頻帶內傳輸(亦即,與位元串流之經寫碼之視訊序列一起之傳輸)中接收第一參數集合,而不比較該第一參數集合之任何重複的傳輸之內容。在此狀況下,當諸如視訊編碼器20之視訊編碼器編碼第一參數集合之重複的傳輸以實現改良的誤差恢復時,視訊解碼器30不執行針對該等重複的參數集合之內容比較。內容比較沒有必要,此係因為根據指示,視訊解碼器30可進行操作就好像具有相同類型且具有相同ID值的參數集合具有相同內容一樣。
在一些實例中,指示可為包括於位元串流中(例如,包括於VPS、SPS、PPS或APS中)之語法元素,諸如,旗標。作為一實例,指示可為包括於經寫碼之視訊序列中之語法元素。作為另一實例,指示可為設定檔定義中之要求。在其他實例中,當將視訊位元串流用於基於即時輸送協定(RTP)之傳輸環境(諸如,使用RTP用於媒體資料輸送之串流或多播)中時,指示可被定義為媒體類型參數且包括於會話描述協定(SDP)中。在此狀況下,指示可用於會話協商階段(亦被稱為能力交換)中。在又其他實例中,指示可被定義為包括於超文本傳送協定(HTTP)串流環境(諸如,DASH)中之媒體呈現描述(MPD)中的串流性質。
在技術之另一實例中,視訊解碼器30可經組態以解碼針對每一 CRA圖像的關於執行自CRA存取單元對位元串流之隨機存取是否要求自先前存取單元提取參數集合之指示。該指示對於在HEVC標準中引入之CRA存取單元尤其有用,此係因為CRA圖像可定位於經寫碼之視訊序列內之任何點處且不清除DPB,此在無較低寫碼效率的情況下提供對位元串流之隨機存取之更多選項。
當該指示指示了不需要來自先前存取單元之參數集合來進行自一特定CRA圖像之隨機存取時,視訊解碼器30可判定在無提取操作的情況下執行自彼CRA圖像之隨機存取。當該指示指示了需要來自先前存取單元之參數集合來進行自一特定CRA圖像之隨機存取時,視訊解碼器30可判定不執行自彼圖像之隨機存取以便避免提取操作。在一些狀況下,視訊解碼器30可解碼針對位元串流之部分(例如,經寫碼之視訊序列)內之若干不同CRA圖像之指示以便識別存取單元,可在不執行參數集合提取操作的情況下執行自該存取單元之隨機存取。以此方式,視訊解碼器30可藉由選擇供執行隨機存取之不同CRA圖像而避免執行提取操作。
隨機存取指代自不為位元串流中之第一經寫碼圖像的經寫碼圖像開始的解碼視訊位元串流。在諸如廣播及串流之許多視訊應用中需要對位元串流之隨機存取,例如,供使用者在不同頻道之間切換、跳轉至視訊之特定部分、用於不同位元串流之接合,或切換至不同位元串流以用於對位元率、圖框速率、空間解析度及其類似者之串流調適。藉由以規則時間間隔將隨機存取圖像或隨機存取點插入至視訊位元串流中來啟用此特徵。瞬時解碼器再新(IDR)圖像可用於隨機存取。IDR圖像開始經寫碼之視訊序列且總是清除經解碼圖像緩衝器(DPB),因此按解碼次序在該IDR圖像之後的圖像不能夠將在該IDR圖像之前解碼的圖像用於參考。因此,依賴於IDR圖像以供隨機存取之位元串流可具有顯著較低寫碼效率。
為了改良寫碼效率,將清晰隨機存取(CRA)圖像之概念引入HEVC HM中。不同於IDR圖像,CRA圖像可定位於經寫碼之視訊序列內之任何點處且不清除DPB,其在無較低寫碼效率的情況下提供對位元串流之隨機存取之更多選項。因為CRA圖像不清除DPB,所以允許按解碼次序在CRA圖像之後但按輸出次序在CRA圖像之前的圖像將在該CRA圖像之前解碼的圖像用於參考。按解碼次序在CRA圖像之後但按輸出次序在CRA圖像之前的圖像被稱作CRA圖像之前導圖像。若解碼自在當前CRA圖像之前的IDR或CRA圖像開始,則可正確地解碼CRA圖像之前導圖像。然而,當發生自當前CRA圖像之隨機存取時,不能夠正確地解碼CRA圖像之前導圖像。因此,通常在隨機存取解碼期間自DPB捨棄前導圖像。為了防止自取決於解碼開始之處可能不可用之參考圖像之誤差傳播,在解碼次序及輸出次序兩方面皆在CRA圖像之後的所有圖像可受約束而不將按解碼次序或輸出次序在該CRA圖像之前的任何圖像(其包括前導圖像)用作參考。
在H.264/AVC標準中藉由復原點SEI訊息來支援類似隨機存取功能性。H.264/AVC解碼器實施可能或可能不支援復原點SEI訊息功能性。在HEVC標準中,以CRA圖像開始之位元串流被認為係符合的位元串流。當位元串流以CRA圖像開始時,該CRA圖像之前導圖像可指代不可用參考圖像,且因此不可解碼。HEVC標準指定開始CRA圖像之前導圖像不被輸出。然而,為了建立位元串流符合性,HEVC標準指定了解碼程序以產生用於解碼非輸出前導圖像的不可用參考圖像。符合的解碼器實施不必須遵循彼解碼程序,只要與自經寫碼視訊序列的開始執行解碼程序之情況相比可產生等同輸出即可。
另外,HEVC標準中之符合的位元串流可能根本不含有IDR圖像,且因此,可含有經寫碼之視訊序列之子集或不完整的經寫碼視訊序列。在HEVC標準中,經寫碼之視訊序列被定義為存取單元序列, 其按解碼次序包括IDR存取單元、繼之以零個或零個以上非IDR存取單元(包括直至(但不包括)任何後續IDR存取單元的所有後續存取單元)。包括於經寫碼之視訊序列中之存取單元對應於視訊序列之圖像。存取單元中的每一者包括一或多個網路抽象層(NAL)單元。HEVC標準定義視訊經寫碼層(VCL)NAL單元及非VCL NAL單元。VCL NAL單元含有圖像之視訊資料之圖塊。非VCL NAL單元含有除了視訊資料圖塊以外的資訊。舉例而言,非VCL NAL單元可含有定界符資料或參數集合,諸如,VPS、SPS或PPS。非VCL NAL單元之另一實例為SEI NAL單元,其可包括由視訊解碼器在解碼位元串流時使用之圖像定時訊息。
當視訊解碼器30執行自包括於位元串流中之CRA圖像之隨機存取時,將不解碼按輸出或解碼次序在該CRA圖像之前的所有圖像且該等圖像不可用作參考圖像。在此狀況下,為了解碼CRA圖像或按輸出或解碼次序之任何後繼圖像,視訊解碼器30可需要提取包括於不可用的先前圖像中之一者之存取單元中的一或多個參數集合,此為繁重的操作。
作為一實例,SPS可包括於位元串流之第一CRA圖像之存取單元中,且SPS不可包括於位元串流之後續第二CRA圖像中。在此狀況下,若執行自第二CRA圖像之隨機存取且所有先前圖像(包括第一CRA圖像)不可用,則SPS亦不可用於解碼第二CRA圖像及位元串流中之任何後續圖像。為了執行自第二CRA圖像之隨機存取,視訊解碼器30需要自不可用的第一CRA圖像提取SPS。
習知地,為了避免提取操作,視訊解碼器可執行貫穿經接收位元串流之檢查以判定將哪些參數集合用於位元串流之不同部分且判定是否可自位元串流中之RAP圖像進行隨機存取。對於視訊解碼器而言,提取操作及位元串流檢查操作皆可為處理器密集型的繁重操作, 且將需要避免此等操作。
本發明之技術提供關於執行自位元串流中的特定CRA存取單元之隨機存取是否要求自先前存取單元提取參數集合之指示。當不需要先前參數集合來進行自特定CRA存取單元之隨機存取時,視訊解碼器30可在無提取操作的情況下執行自彼特定CRA存取單元之隨機存取。相反地,當需要先前參數集合來進行自特定CRA存取單元之隨機存取時,視訊解碼器30不可執行自彼特定CRA存取單元之隨機存取以便避免提取操作。在一些實例中,當需要先前參數集合來進行自特定CRA存取單元之隨機存取時,視訊解碼器30可在自先前存取單元提取參數集合之後執行自彼CRA存取單元之隨機存取。
根據本發明中所描述之技術,可針對每一CRA存取單元在位元串流中包括一指示,該指示用以指示是否需要包括於按輸出或解碼次序的先前存取單元中的參數集合以解碼該CRA存取單元及按輸出或解碼次序之所有後續存取單元。若不需要先前參數集合來進行自一CRA存取單元之隨機存取,則視訊解碼器30可執行自彼存取單元對位元串流之隨機存取,而不依賴於包括於先前存取單元中的任何參數集合NAL單元。以此方式,可簡單地跳過或忽略所有較早NAL單元。
與在上文所闡述之實例中一樣,SPS NAL單元可包括於視訊序列之第一CRA圖像之存取單元中,且SPS NAL單元不可包括於視訊序列之後續第二CRA圖像中。根據本發明中所描述之技術,在第一CRA圖像之存取單元中可包括一指示,該指示用以指示不需要來自按輸出或解碼次序之先前存取單元的參數集合以解碼該第一CRA圖像或按輸出或解碼次序之任何後續圖像。另外,在第二CRA圖像之存取單元中可包括一指示,該指示用以指示需要來自按輸出或解碼次序之先前存取單元的參數集合(亦即,第一CRA圖像之存取單元中的SPS)以解碼該第二CRA圖像或按輸出或解碼次序之任何後續圖像。在此實例中,基 於該等指示,視訊解碼器30可判定執行自第一CRA圖像之隨機存取,但不執行自第二CRA圖像之隨機存取以便避免提取操作。
儘管主要關於CRA圖像予以描述,但本發明之技術可類似地用於其他類型之RAP圖像,包括IDR圖像及漸進解碼再新(GDR)圖像。在一些狀況下,指示可包含包括於經寫碼之視訊序列中之每一IDR或CRA圖像之存取單元中的特定類型之網路抽象層(NAL)單元。在其他狀況下,指示可包含包括於NAL單元有效負載中的語法元素(諸如,旗標),該NAL單元有效負載包括於經寫碼之視訊序列中之每一IDR或CRA圖像之存取單元中。在一實例中,指示可包含包括於CRA圖像之存取單元中的補充增強資訊(SEI)NAL單元中之旗標。
另外,舉例而言,可使用具有相異NAL單元類型的特定類型之SPS來傳訊關於給定圖像之指示。在此實例中,可需要使該特定類型之SPS包括於該圖像之存取單元中的第一NAL單元中,或包括於在存取單元定界符NAL單元(若存在)之後的第一NAL單元中。在另一實例中,可使用具有相異NAL單元類型的特定類型之存取單元定界符或包括於一給定圖像之存取單元中的存取單元定界符NAL單元之有效負載中之旗標來傳訊針對該圖像之指示。在另外實例中,可使用包括於一給定圖像之存取單元中的NAL單元標頭中之旗標來傳訊關於該圖像之指示。另外,可使用特定類型之SEI訊息或SEI訊息中之旗標來傳訊關於給定圖像之指示。在HEVC HM中,SEI訊息可包括於圖像之存取單元中的SEI NAL單元中。
圖4為說明根據預測性視訊寫碼技術而寫碼之視訊序列100的概念圖。如圖4中所說明,視訊序列100包括圖像Pic1至Pic10。根據圖像Pic1至Pic10待顯示之次序來配置且順次地編號該等圖像。如下文中更詳細地描述,輸出或顯示次序未必對應於解碼次序。如圖4中所說明,視訊序列100包括GOP1及GOP2,其中圖像Pic1至Pic5包括於GOP1 中且圖像Pic6至Pic10包括於GOP2中。圖4進一步說明Pic5被分割成圖塊1及圖塊2,其中圖塊1及圖塊2中的每一者包括根據自左至右自上至下光柵掃描之連續LCU。另外,Pic5中之最後LCU被說明為根據四分樹進一步分裂成多個CU。儘管未展示,但圖4中所說明之其他圖像可以類似方式分割成一或多個圖塊。
如下文更詳細地描述,HEVC HM包括兩種類型之圖塊分割方案,即:規則圖塊及熵圖塊。另外,除了圖塊分割方案以外,HM亦包括影像塊(tile)分割方案及波前並行處理(WPP)分割方案。可基於最大傳輸單元(MTU)大小匹配及/或並行處理來選擇及應用分割方案。Pic5之圖塊1及圖塊2或其他圖像中的任一者可為規則圖塊或熵圖塊。另外,在其他實例中,可使用影像塊或WPP來分割Pic1至Pic10中的每一者。
另外,圖4關於視訊序列100之GOP2說明I圖塊、P圖塊及B圖塊的概念。與GOP2中之Pic6至Pic10中的每一者相關聯之箭頭基於由該等箭頭指示之經參考圖像而指示圖像包括I圖塊、P圖塊抑或B圖塊。在視訊序列100中,Pic6及Pic9表示包括I圖塊(亦即,基於圖像自身內之參考的經框內預測圖塊)之圖像,圖像Pic7及Pic10表示包括P圖塊(亦即,基於先前圖像中之參考的經框間預測圖塊)之圖像,且Pic8表示包括B圖塊(亦即,基於先前及後續圖像兩者中之參考的經框間預測圖塊)之圖像。
圖5為說明對應於圖4中所說明之GOP2的經寫碼之視訊序列120之實例的概念圖。HEVC HM將經寫碼之視訊序列定義為存取單元序列,其按解碼次序由瞬時解碼再新(IDR)存取單元、繼之以零個或零個以上非IDR存取單元(包括直至(但不包括)任何後續IDR存取單元的所有後續存取單元)組成。經寫碼圖像為含有圖像之所有樹型區塊的圖像之經寫碼表示。存取單元為在解碼次序上為連續的且表示一個經 寫碼圖像之網路抽象層(NAL)單元之集合。存取單元可包括表示經寫碼圖像之經寫碼圖塊之視訊寫碼層(VCL)NAL單元,及包括定界符資料、參數集合及補充增強資訊(SEI)訊息之非VCL NAL單元。
如圖5中所說明,經寫碼之視訊序列120包括對應於Pic6至Pic10中的每一者之一存取單元。根據解碼次序來順次地配置視訊資料串流120之存取單元。應注意,對應於Pic9之存取單元位於對應於Pic8之存取單元之前。因此,解碼次序不對應於圖4中所說明之輸出次序。在此實例中,輸出次序與解碼次序之間的差異係歸因於Pic8參考Pic9之事實。因此,在可解碼Pic8之前必須解碼Pic9
如圖5中所說明,對應於Pic9之存取單元包括存取單元(AU)定界符NAL單元122、圖像參數集合(PPS)NAL單元124、圖塊1 NAL單元126,及圖塊2 NAL單元128。圖塊1 NAL單元126及圖塊2 NAL單元128各自含有一視訊資料圖塊且為VCL NAL單元之實例。如上文關於圖4所描述,Pic9表示包括I圖塊之圖像。因此,在圖5之實例中,對應於Pic9的存取單元之圖塊1 NAL單元126及圖塊2 NAL單元128中的每一者可表示I圖塊。
非VCL NAL單元包括除了視訊資料圖塊以外的資訊。舉例而言,非VCL可含有定界符資料、參數集合,或SEI訊息。在圖5中所說明之實例中,AU定界符NAL單元122包括用以將對應於Pic9之存取單元相對於對應於Pic7之存取單元定界之資訊。另外,PPS NAL單元124包括圖像參數集合。AU定界符NAL單元122及PPS NAL單元124為非VCL NAL單元之實例。非VCL NAL單元之另一實例為SEI NAL單元。SEI NAL單元可包括圖像定時SEI訊息或緩衝週期SEI訊息,其由視訊解碼器在解碼位元串流時使用。圖像定時SEI訊息可包括指示何時視訊解碼器應開始解碼VCL NAL單元之資訊。緩衝週期SEI訊息可包括經寫碼圖像緩衝器(CPB)移除延遲資訊,其指示何時視訊解碼器應自 CPB移除圖像以避免溢位。
在HEVC HM中,視訊序列、GOP、圖像、圖塊、CU、PU及TU中的每一者可與被定義成指示彼視訊資料結構之視訊寫碼性質的語法元素相關聯。HM進一步使用參數集合概念。參數集合為包括語法元素之語法結構,該等語法元素被定義成指示應用於參考該參數集合之任何視訊資料結構之視訊寫碼性質。HM使用階層式參數集合機制,其中基於預期視訊寫碼性質將改變之頻率而使語法元素包括於某類型之參數集合中。因此,參數集合機制將不頻繁改變之資訊之傳輸與經寫碼之區塊資料之傳輸解耦。在一些應用中,可「頻帶外」地傳遞參數集合(亦即,並不將其與經寫碼之視訊資料一起輸送),此係因為頻帶外傳輸相比於頻帶內傳輸通常更可靠。
HM定義若干不同類型之參數集合,包括視訊參數集合(VPS)、序列參數集合(SPS)、圖像參數集合(PPS)及自適應性參數集合(APS)中之一或多者。位元串流可包括每一類型之若干不同參數集合。特定參數集合係使用參數集合識別符(ID)予以識別。每一VPS包括一VPSID,每一SPS包括一SPS ID且可參考一VPS ID,每一PPS包括一PPS ID且參考一SPS ID,且每一圖塊標頭參考一PPS ID,且可能參考一APS ID。另外,每一緩衝週期補充增強資訊(SEI)訊息亦參考一SPS ID,且可能參考一VPS ID。在此等實例中的每一者中,可使用可變長度無正負號整數指數哥倫布(ue(v))寫碼方法而將參數集合ID寫碼為語法元素。
VPS為包括應用於零個或零個以上完整經寫碼視訊序列的語法元素之語法結構。更特定言之,VPS包括描述經寫碼視訊序列之總體特性的語法元素,該等特性包括設定檔、階層及層級資訊及時間子層之間的相依性。特定VPS係使用經編碼為SPS或SEI訊息中之語法元素之特定VPS ID予以識別。SPS為包括應用於零個或零個以上完整經寫碼 視訊序列的語法元素之語法結構。更特定言之,SPS包括被定義成指示被預期在圖框序列中保持不變之視訊寫碼性質(例如,圖像次序、參考圖框數目及圖像大小)的語法元素。特定SPS係使用經編碼為PPS或SEI訊息中之語法元素之特定SPS ID予以識別。
PPS為包括應用於零個或零個以上完整經寫碼圖像的語法元素之語法結構。更特定言之,PPS包括被定義成指示可在序列內在圖像間改變之視訊寫碼性質(例如,熵寫碼模式、量化參數及位元深度)的語法元素。特定PPS係使用經編碼為圖塊標頭中之語法元素之特定PPS ID予以識別。APS為包括應用於零個或零個以上完整經寫碼圖像的語法元素之語法結構。APS(若經寫碼)可包括被定義成指示相比於PPS中所指示之其他性質改變更頻繁的視訊寫碼性質之語法元素。特定APS係使用經編碼為圖塊標頭中之語法元素之APS ID予以識別。
位元串流接合指代兩個或兩個以上位元串流或位元串流之部分之串接或組合。舉例而言,第一位元串流可由第二位元串流附加,可能地對該等位元串流中之一者或兩者進行一些修改以產生經接合之位元串流。第二位元串流中之第一經寫碼之圖像亦被稱作接合點。因此,在經接合之位元串流中在接合點之後的圖像起源自第二位元串流,而在經接合之位元串流中在接合點之前的圖像起源自第一位元串流。在一些狀況下,位元串流接合器可執行位元串流接合。位元串流接合器可能為輕量型的且不如視訊編碼器智慧。舉例而言,位元串流接合器可能未配備有熵解碼能力及熵編碼能力。位元串流接合可有用於可縮放性應用(例如,針對位元率、圖框速率或空間解析度可縮放性)。
如上文所描述,位元串流可包括每一類型之一或多個不同參數集合,例如,SPS及PPS。特定類型之參數集合係使用參數集合識別符(ID)予以識別。在一些狀況下,視訊解碼器可接收具有特定參數集 合ID的特定類型之參數集合,該參數集合具有與具有相同參數集合ID的相同類型之先前參數集合(按位元串流或解碼次序)之內容不同的內容。在此狀況下,更新具有該特定參數集合ID(例如,SPS 0)的該特定類型之參數集合。參數集合更新包括儲存具有特定參數集合ID的經接收參數集合之內容以替換具有相同類型且具有相同參數集合ID值的先前參數集合。
當需要特定類型之新參數集合,但已使用參數集合ID之所有可能值時,可發生參數集合更新。在經接合之位元串流中,甚至在未完全利用參數集合ID值空間時,亦可發生參數集合更新。位元串流常常僅使用幾個SPS及幾個PPS,或甚至僅僅一個SPS及一個PPS,且使用最小SPS ID值及最小PPS ID值(亦即,0)。因此,當兩個位元串流或位元串流之部分被接合時,很可能地是:起源自第二位元串流之接合點與起源自第一位元串流之緊接在接合點圖像之前的圖像參考同一SPS ID或PPS ID。在此狀況下,由接合點圖像參考之SPS或PPS之內容與由緊接在該接合點圖像之前的圖像參考之SPS或PPS之內容很可能不同。
在SPS參數集合之特定狀況下,當接合點圖像與緊接在該接合點之前的圖像參考同一SPS ID且實際上使用兩個不同SPS時,則在經接合之位元串流中,具有由緊接在該接合點之前的圖像參考之特定SPS ID的SPS係實際上被由該接合點圖像參考之SPS更新。在此狀況下,經接合之位元串流之SPS不能夠置於該經接合之位元串流的開始。儘管上文關於SPS予以描述,但對於VPS、PPS及APS亦是如此情況。已基於在經接合之位元串流中僅存在一個接合點之假定來描述位元串流接合及相關聯之參數集合更新。然而,位元串流可包括多個接合點,且本文所描述之技術可個別地應用於該等接合點中的每一者。
隨機存取指代自不為位元串流中之第一經寫碼圖像的經寫碼圖 像開始解碼視訊位元串流。在諸如廣播及串流之許多視訊應用中,對位元串流之隨機存取係有用的。舉例而言,隨機存取係有用於使使用者在不同頻道之間切換、跳轉至視訊之特定部分,或切換至不同位元串流以用於串流調適(例如,針對位元率、圖框速率或空間解析度可縮放性)。藉由以規則時間間隔多次將隨機存取點(RAP)圖像或存取單元插入至視訊位元串流中來實現隨機存取。
瞬時解碼再新(IDR)圖像可用於對位元串流之隨機存取。IDR圖像開始經寫碼之視訊序列且僅包括經框內預測之圖塊(亦即,I圖塊)。另外,IDR圖像總是清除經解碼圖像緩衝器(DPB)。因此,按解碼次序在IDR之後的圖像不能夠將在該IDR圖像之前解碼之圖像用作參考。因此,依賴於IDR圖像來進行隨機存取之位元串流可具有顯著較低寫碼效率。
為了改良寫碼效率,將清晰隨機存取(CRA)圖像之概念引入HEVC HM中。與IDR圖像一樣,CRA圖像僅包括經框內預測之圖塊,亦即,I圖塊。CRA圖像不同於IDR圖像,此係因為CRA圖像不清除DPB且可位於經寫碼之視訊序列內之任何位置處。因此,允許按解碼次序在CRA圖像之後但按輸出次序在CRA圖像之前的圖像使用在CRA圖像之前解碼之圖像作為參考。按解碼次序在CRA圖像之後但按輸出次序在CRA圖像之前的圖像被稱作關聯於CRA圖像之前導圖像(或CRA圖像之前導圖像)。
若解碼自在當前CRA圖像之前的IDR或CRA圖像開始,則可正確地解碼CRA圖像之前導圖像。然而,當隨機存取自當前CRA圖像開始時,可能不正確地解碼CRA圖像之前導圖像。因此,通常在自當前CRA圖像的隨機存取解碼期間捨棄前導圖像。參看圖4及圖5中所說明之實例,pic9可為CRA圖像且pic8可為pic9之前導圖像。若在pic6處存取GOP2,則可正確地解碼Pic8,但若在Pic9處存取GOP2,則可能不正 確地解碼Pic8。此係歸因於在Pic9處存取GOP2的情況下pic7可能不可用之事實。為了防止自取決於解碼開始之處而不可用之參考圖像之誤差傳播,在解碼次序及輸出次序兩方面皆在CRA圖像之後的所有圖像可受約束而不將按解碼次序或輸出次序在該CRA圖像之前的任何圖像(其包括前導圖像)用作參考。
在HEVC HM中,以CRA圖像開始之位元串流被認為是符合的位元串流。當位元串流以CRA圖像開始時,該CRA圖像之前導圖像可參考不可用的參考圖像,且因此可能不能夠被正確地解碼。然而,HM指定開始CRA圖像之前導圖像不被輸出,因此名稱為「清晰隨機存取」。在圖4及圖5中所說明之實例中,若位元串流在Pic9處開始,則Pic8不被輸出。為了建立位元串流符合性要求,HM指定解碼程序以產生用於解碼非輸出前導圖像的不可用參考圖像。然而,符合的解碼器實施不必遵循彼解碼程序,只要該符合的解碼器可產生與自經寫碼視訊序列的開始執行解碼程序之情況相比等同的輸出即可。
應注意,在H.264/AVC中藉由復原點SEI訊息來支援與HEVC HM中之彼等隨機存取功能性類似的隨機存取功能性。H.264/AVC解碼器實施可能或可能不支援隨機存取功能性。應進一步注意,在HEVC HM中,符合的位元串流可能根本不含有IDR圖像。HM將經寫碼之視訊序列定義為存取單元序列,其按解碼次序由IDR存取單元、繼之以零個或零個以上非IDR存取單元(包括直至(但不包括)任何後續IDR存取單元的所有後續存取單元)組成。因此,不含有IDR圖像之符合的位元串流可含有經寫碼視訊序列之子集或不完整的經寫碼視訊序列。
現在將描述與位元串流中之參數集合更新有關的問題及所提議技術。習知地,為了判定是否執行參數集合更新,解碼器在每當接收到具有特定參數集合ID的特定類型之新參數集合(其具有與相同類型之較早所接收之參數集合之參數集合ID相同的參數集合ID)時就比較 參數集合內容。執行該參數集合比較以驗證該等參數集合是包括相同內容抑或不同內容。基於參數集合是否具有相同內容,解碼器判定是否啟動當前所接收之參數集合且去啟動先前作用中參數集合。在與經寫碼之視訊資料一起在頻帶內傳輸參數集合之狀況下,可重複地傳輸該等參數集合以實現改良的誤差恢復。在此狀況下,解碼器可進行每一重複的參數集合之參數集合內容之比較。進行重複的參數集合之比較可將不必要負擔強加於解碼器上。
本發明描述了可尤其在參數集合更新之狀況下提供對解碼處理資源之更有效率使用的技術。在一實例中,本發明描述視訊處理器件,該視訊處理器件經組態以使用位元串流層級指示符以判定在位元串流之部分中是否可更新參數集合。在一些狀況下,位元串流層級指示可用以指示是否可更新參數集合。該指示可為包括於位元串流中(例如,SPS中)之旗標,且該旗標在所有SPS中可等同。當旗標等於1時,可更新參數集合。當旗標等於0時,不可更新參數集合。在此狀況下,視訊解碼器無需比較具有相同類型且具有相同參數集合ID值的兩個參數集合之內容以判定該等參數集合是否具有相同內容,此係因為當旗標等於0時,不可發生參數集合更新且視訊解碼器進行操作就好像該兩個參數集合具有相同內容一樣。
在其他狀況下,位元串流層級指示可用以指示是否可更新特定類型之參數集合(例如,VPS、SPS、PPS或APS)。該指示可為包括於位元串流中(例如,SPS中)之旗標,且該旗標在所有SPS中可等同。當旗標等於1時,可更新該特定類型之參數集合。當旗標等於0時,不可更新該特定類型之參數集合。在此狀況下,視訊解碼器無需比較具有該特定類型且具有相同參數集合ID值的兩個參數集合之內容以判定該等參數集合是否具有相同內容,此係因為當旗標等於0時,不可發生參數集合更新且視訊解碼器進行操作就好像該兩個參數集合具有相同 內容一樣。當存在三種類型之參數集合(例如,SPS、PPS及APS)時,使用三個此種指示,一種指示用於每一類型之參數集合。
在上文所描述之實例中,指示包括於參數集合中之位元串流層級。在另一實例中,指示可包括於SEI訊息中。在又另一實例中,指示可作為要求而包括於設定檔之定義中。在一些實例中,指示可包括於經寫碼之視訊序列層級處而非位元串流層級處。在其他實例中,指示可不包括於位元串流中,而是在視訊位元串流在會話協商或能力交換階段期間用於基於即時輸送協定(RTP)之傳輸環境(例如,使用RTP用於媒體資料輸送之串流或多播)中時,指示可改為被定義為媒體類型參數且包括於會話描述協定(SDP)中。作為一額外實例,在例如經由HTTP之動態自適應性串流(DASH)之HTTP串流環境中,指示可被定義為包括於媒體呈現描述(MPD)中的串流性質。
現在將描述與在IDR圖像處啟動新參數集合有關的問題及所提議技術。如上文所描述,在許多狀況下,位元串流接合點圖像為IDR圖像。接合點圖像通常具有與經接合之位元串流中之緊接在接合點之前的圖像之視訊特性不同的視訊特性。因此,通常在接合點處需要每一類型之不同參數集合,且比較與接合點圖像相關聯的參數集合之內容是否等同於與先前圖像相關聯的參數集合將為對解碼處理資源之浪費。在此狀況下,可能更有效率地是啟動與接合點圖像相關聯的每一類型之新參數集合,而不比較參數集合內容。另外,當IDR圖像為接合點圖像時,為了避免DPB溢位,可能有必要不輸出在該IDR圖像之前的任何圖像(即使在解碼該IDR圖像時該等圖像尚未被輸出)。
本發明描述了可尤其在位元串流接合點處之參數集合更新的狀況下提供對解碼處理資源之更有效率使用的技術。在一實例中,本發明描述視訊處理器件,該視訊處理器件經組態以自動啟動與經接合之位元串流之接合點圖像相關聯的每一類型之新參數集合。詳言之,在 許多狀況下,位元串流接合點圖像為IDR圖像。根據該等技術,在每一IDR圖像處,視訊解碼器可啟動每一類型之參數集合(且因此,去啟動先前作用中參數集合),即使該新近經啟動之參數集合可能與先前作用中參數集合完全相同(包括參數集合ID值及內容)。在每一IDR圖像處啟動新參數集合之一個潛在缺點在於:可能執行一些不必要的參數集合啟動。
在另一實例中,可針對每一IDR圖像在位元串流中包括用以指示該IDR圖像是否為接合IDR(SIDR)圖像之一指示。在此實例中,當指示SIDR圖像時,視訊解碼器可啟動每一類型之參數集合(且因此,去啟動先前作用中參數集合),即使該新近啟動之參數集合可能與先前作用中參數集合完全相同(包括參數集合ID值及內容)。藉由僅在SIDR圖像處而非在每一IDR圖像處啟動新參數集合,可減少不必要的參數集合啟動。另外,當指示SIDR圖像時,圖像輸出行為可就像如下情況一樣:存在no_output_of_prior_pics_flag且no_output_of_prior_pics_flag等於1,其指示將不輸出在SIDR圖像之前的圖像。no_output_of_prior_pics_flag可能或可能不存在於(例如)圖塊標頭中。在一些狀況下,指示可為特殊的相異NAL單元類型。在其他狀況下,指示可為圖塊標頭、PPS或APS中之圖像層級旗標。
現在將描述與自RAP存取單元對位元串流之全面隨機存取有關的問題及所提議技術。當與經寫碼之視訊資料一起在頻帶內輸送參數集合(亦即,在經寫碼之視訊位元串流中輸送)時,自IDR圖像或CRA圖像之存取單元對位元串流之隨機存取可要求自按解碼次序早於IDR或CRA存取單元的存取單元提取參數集合。當無需自按解碼次序早於IDR或CRA存取單元的存取單元提取參數集合時,通知視訊解碼器以便避免不必要的提取操作將為有利的。
本發明描述可被使用以便尤其在隨機存取之狀況下提供對解碼 處理資源之更有效率使用的技術。在一實例中,本發明描述視訊處理器件,該視訊處理器件經組態以使用位元串流中之一指示以判定是否需要在IDR或CRA存取單元之前的存取單元中之參數集合NAL單元以解碼該IDR或CRA存取單元。詳言之,位元串流可包括針對每一IDR或CRA存取單元之一指示,以指示是否需要在該IDR或CRA存取單元之前的參數集合NAL單元(按位元串流或解碼次序)以解碼該IDR或CRA存取單元及任何後續存取單元(按位元串流或解碼次序)。
若該指示對於一個IDR或CRA存取單元正確,則視訊解碼器可自該IDR或CRA存取單元隨機地存取位元串流,而不依賴於在該IDR或CRA存取單元之前的任何參數集合NAL單元。在此狀況下,可簡單地跳過或忽略所有較早NAL單元。在一實例中,可使用特定類型之SPS(例如,具有相異NAL單元類型)來傳訊針對IDR圖像或CRA圖像之指示,其中SPS可為存取單元之第一NAL單元或在存取單元定界符NAL單元(若存在於存取單元中)之後的第一NAL單元。在另一實例中,可使用特定類型之存取單元定界符來傳訊該指示,該存取單元定界符具有相異存取單元定界符NAL單元類型抑或具有在存取單元定界符NAL單元之NAL單元有效負載內之旗標。在又另一實例中,可使用存取單元中之NAL單元標頭中之旗標來傳訊該指示。作為一額外實例,可使用存取單元中之特定類型之SEI訊息或存取單元中之SEI訊息中之旗標來傳訊該指示。
現在將描述與位元串流中之CRA圖像之前導圖像有關的問題及所提議技術。當位元串流自CRA圖像開始且與該CRA圖像相關聯之前導圖像不存在於視訊解碼器處時,經寫碼圖像緩衝器(CPB)可溢位。因此,可需要應用不同集合之假想參考解碼器(HRD)參數以便避免緩衝器溢位。S.Deshpande等人之「Signaling of CRA Pictures」(第9次會議,Geneva,CH,2012年4月27日至5月7日,文件,JCTVC-I0278(下 文中「Deshpande」))描述了針對CRA圖像之一指示(例如,新NAL單元類型或圖塊標頭中之旗標)以指示是否存在相關聯之前導圖像,使得視訊解碼器可判定將應用哪一HRD參數集合。然而,由Deshpande描述之指示要求外部網路實體(例如,串流伺服器或媒體感知網路元件(MAME))對CRA圖像之NAL單元標頭或圖塊標頭作出改變,此情形對外部網路實體而言可為繁重的或不可能的。
本發明描述可被使用以便避免潛在緩衝器溢位之技術。在一實例中,本發明描述視訊處理器件,該視訊處理器件經組態以使用一指示來判定是否存在與開始位元串流之CRA圖像相關聯的前導圖像。詳言之,在一實例中,當不存在開始位元串流之CRA圖像之前導圖像時,外部網路實體可改變NAL單元類型以將該CRA圖像指示為IDR圖像。在另一實例中,外部網路實體可向視訊解碼器通知與開始位元串流之CRA圖像相關聯的前導圖像之存在或不存在。
外部網路實體可針對基於即時串流協定(RTSP)之串流系統產生RTSP訊息,或產生在基於RTSP之串流及基於會話宣告協定(SAP)之廣播/多播兩者之會話協商期間所發送的會話描述協定(SDP)參數作為靜態組態。在例如經由HTTP之動態自適應性串流(DASH)之HTTP串流中,可藉由如下操作來實現指示:分配不同統一資源定位器(URL)或分配針對CRA圖像及前導圖像具有不同位元組偏移之URL。在此狀況下,因為由視訊解碼器判定是否請求CRA圖像之前導圖像,故視訊解碼器可獨自判定是否存在該等前導圖像。
現在將描述與時間運動向量預測有關的問題及所提議技術。再次參看圖4,Pic6、Pic7及Pic9中的每一者係用作參考圖像。如上文所描述,運動資訊語法元素可識別參考圖像中的預測性視訊區塊之位置以用於當前圖像中之視訊區塊之框間預測。運動預測可指代相對於先前經寫碼視訊區塊之運動資訊(例如,運動向量及參考圖像索引)而定 義給定視訊區塊之運動資訊的程序。舉例而言,運動預測可涉及使用先前經寫碼之CU之運動資訊以產生正被寫碼之當前CU之運動資訊。可應用運動預測以減少傳達當前CU之運動向量所需要的資料量。
運動預測之一個實例為合併模式運動預測。在合併模式運動預測中,自先前經寫碼之相鄰視訊區塊繼承當前CU之運動資訊。運動預測技術可使用索引值以識別相鄰視訊區塊,當前視訊區塊自該相鄰視訊區塊導出其運動資訊。舉例而言,可能的相鄰視訊區塊可包括當前圖像中之鄰近於當前CU(例如,在當前CU上方、下方、左側或右側)之視訊區塊。另外,可能的相鄰視訊區塊亦可包括位於除了當前圖像以外的圖像中之視訊區塊(例如,與時間上鄰近圖像同置之視訊區塊)。當可能的相鄰視訊區塊位於除了當前圖像以外的圖像中時,其被稱作時間運動向量預測(TMVP)。舉例而言,在圖4中所說明之實例中,若Pic8自Pic7繼承運動向量,則此為TMVP。在一些情況下,可有利地是允許一些圖像、圖塊及CU使用TMVP而不允許其他者使用TMVP。
HEVC HM允許逐個圖像地啟用或停用TMVP,且可使用PPS中之旗標enable_temporal_mvp_flag來傳訊TMVP之啟用。如上文所描述,每一圖塊標頭參考使用一特定PPS ID之一特定PPS,且基於該特定PPS中之旗標值而判定針對圖像是否啟用TMVP。舉例而言,當圖塊參考enable_temporal_mvp_flag值等於0的PPS且具有等於0的temporal_id時,調用對DPB中之參考圖像之標記程序。亦即,經解碼圖像緩衝器(DPB)中之所有圖像被標記為「不用於時間運動向量預測」且不允許自較早參考圖像之TMVP。
作為對將enable_temporal_mvp_flag包括於PPS中之替代例,在Lim、Chong Soon等人之「High-level Syntax:Proposed fix on signaling of TMVP disabling flag」(第9次會議,Geneva,CH,2012年 4月27日至5月7日,文件,JCTVC-I0420(在下文中「Lim」))中已描述了在每個P及B圖塊標頭處明確地傳訊enable_temporal_mvp_flag。雖然Lim中所描述之技術移除了對標記程序之需要,且獨立地判定TMVP圖像而非依賴於逐圖像更新,但當經寫碼之視訊序列中之許多圖像或所有圖像不使用TMVP時,Lim中所描述之技術並不有效率。根據Lim中所描述之技術,圖像或序列內之所有P及B圖塊之圖塊標頭皆將包括enable_temporal_mvp_flag,即使該等圖塊皆不使用TMVP亦然。
本發明描述可被使用以便減少每個P及B圖塊標頭之enable_temporal_mvp_flag之傳訊的技術。在一實例中,本發明描述視訊處理器件,該視訊處理器件經組態以識別SPS中之旗標以判定是否啟用時間運動向量預測。詳言之,在一些實例中,可將旗標(例如,enable_temporal_mvp_ps_flag)添加至SPS或PPS中。當在一特定SPS或PPS中此旗標等於0時,enable_temporal_mvp_flag不存在於參考該特定SPS或PPS之任何圖塊標頭中。當在一特定SPS或PPS中此旗標等於1時,enable_temporal_mvp_flag存在於參考該特定SPS或PPS之每一圖塊標頭中。圖塊標頭中之enable_temporal_mvp_flag之語義可與在Lim提議中之語義相同。
現在將描述與位元串流中之經寫碼圖像之參考圖像集合傳訊有關的問題及所提議技術。如上文所描述,除了運動向量以外,運動資訊語法元素亦可包括參考圖像索引。HEVC HM使用基於參考圖像集合(RPS)之機制以管理參考圖像。RPS指代與圖像相關聯的參考圖像集合,其由按解碼次序在相關聯圖像之前的所有參考圖像組成,其可用於相關聯之圖像或按解碼次序在相關聯之圖像之後的任何圖像之框間預測。在HM中,直接傳訊針對每一經寫碼圖像之RPS。用於傳訊RPS之語法元素係包括於SPS及圖塊標頭兩者中。針對一特定經寫碼 之圖像,RPS可為如由圖塊標頭中之旗標所指示或直接在圖塊標頭中傳訊的包括於SPS中之可能的圖像集合中之一者。
每一圖像之RPS包含五個不同的參考圖像清單,其亦被稱作五個RPS子集。五個RPS子集包括:RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr,及RefPicSetLtFoll。RefPicSetStCurrBefore包括在解碼次序及輸出次序兩方面皆在當前圖像之前且可用於當前圖像之框間預測的所有短期參考圖像(STRP)。RefPicSetStCurrAfter係由按解碼次序在當前圖像之前且按輸出次序在當前圖像之後且可用於當前圖像之框間預測的所有短期參考圖像組成。RefPicSetStFoll係由可用於按解碼次序在當前圖像之後的圖像中之一或多者之框間預測且不用於當前圖像之框間預測的所有短期參考圖像組成。RefPicSetLtCurr係由可用於當前圖像之框間預測的所有長期參考圖像(LTRP)組成。RefPicSetLtFoll係由可用於按解碼次序在當前圖像之後的圖像中之一或多者之框間預測且不用於當前圖像之框間預測的所有長期參考圖像組成。
在K.Suehring等人之「Long-term Picture Signaling for error-free environments」(第9次會議,Geneva,CH,2012年4月27日至5月7日,文件,JCTVC-I0112(在下文中「Suehring」))中已描述了藉由至經解碼圖像緩衝器(DPB)中的1)被標記為「用於參考」及2)不包括於短期參考圖像集合中的參考圖像之圖像次序計數(POC)排序清單之索引來識別LTRP。Suehring陳述了在無誤差環境中,LTRP之此傳訊係有效率的。然而,在無誤差環境中,STRP亦可藉由至DPB中之參考圖像之POC排序清單之索引來識別。
本發明描述可用於識別STRP之技術。在一實例中,本發明描述視訊處理器件,該視訊處理器件經組態以藉由至DPB中之參考圖像之POC排序清單之索引來識別STRP。詳言之,在一些實例中,每一 STRP可藉由至DPB中之參考圖像之POC排序清單之索引來識別。在一些狀況下,次序可呈POC值之遞增次序。在其他狀況下,次序可呈POC值之遞減次序。對於第一個經指示之STRP,(例如)使用無正負號整數指數哥倫布(ue(v))寫碼、截斷式整數指數哥倫布(te(v))寫碼或無正負號整數(ue(v))寫碼中之一者來直接寫碼索引。若進行u(v)寫碼,則索引之按位元計之長度為頂值(log2(N)),其中N為DPB中之參考圖像之數目。對於其他經指示之STRP,傳訊當前STRP之索引與先前STRP之索引之間的差。或者,DPB中之參考圖像可分裂成兩個清單。在此實例中,清單中之一者包括POC小於當前圖像之POC的參考圖像且可按POC值之遞減次序排序。清單中之另一者包括POC值大於當前圖像之POC值的參考圖像且可按POC值之遞增次序排序。接著,待包括於短期參考圖像集合中之每一STRP可藉由清單(亦即,兩個清單中之一者)及至彼清單之索引來識別。
現在將描述與影像塊及波前並行處理(WPP)之圖像分割方案之種類前綴資料批次處理有關的問題及所提議技術。如上文所描述,HEVC HM包括四個不同圖像分割方案,即:規則圖塊、熵圖塊、影像塊,及WPP。規則圖塊係與H.264/AVC中之規則圖塊類似。每一規則圖塊囊封於其自有NAL單元中,且停用圖像內預測(例如,框內樣本預測、運動資訊預測、寫碼模式預測)及跨越圖塊邊界之熵寫碼相依性。因此,可獨立於同一圖像內之其他規則圖塊來重建構一規則圖塊(但歸因於迴路濾波操作仍可存在相互相依性)。因為HEVC中之基本單元(亦即,樹型區塊)可具有相對大的大小(例如,樹型區塊可為64×64),所以在HM中包括「精細粒度圖塊」(作為特殊形式之規則圖塊)之概念以允許經由樹型區塊內之圖塊邊界之MTU大小匹配。在圖像參數集合中傳訊圖塊粒度,而仍在圖塊標頭中傳訊精細粒度圖塊之位址。
熵圖塊(類似規則圖塊)破壞熵解碼相依性,但允許圖像內預測(及濾波)跨越熵圖塊邊界。因此,熵圖塊可用作輕量型機制以使熵解碼並行化,而對其他解碼步驟沒有影響。儘管每一熵圖塊囊封於其自有NAL單元中,但其相比於規則圖塊具有短得多的圖塊標頭,此係因為大多數圖塊標頭語法元素不存在且必須自之前的完整圖塊標頭繼承大多數圖塊標頭語法元素。歸因於允許圖像內之相鄰熵圖塊之間的圖像內預測,為了實現圖像內預測所需之處理器間/核心間通信可相當大。不推薦在易發生誤差之環境中將熵圖塊用於MTU大小匹配,此係因為歸因於圖像內預測,一個熵圖塊之損失亦會造成按解碼次序之下一熵圖塊之解碼的失敗。對於在多核心或多CPU架構上執行熵解碼程序但在專用信號處理硬體上執行剩餘解碼功能性的系統架構而言,熵圖塊表現得具有有限用途。
在WPP中,圖像被分割成樹型區塊之若干列。允許熵解碼及預測使用來自其他分割區中之樹型區塊之資料。經由對樹型區塊之列的並行解碼,可能實現並行處理,其中列之解碼之開始被延遲達兩個樹型區塊,以便確保在主體樹型區塊被解碼之前可獲得與在該主體樹型區塊上方且在該主體樹型區塊右側的樹型區塊有關的資料。藉由使用此交錯式開始(其當以圖形方式來表示時看起來像波前),可能藉由高達與圖像含有的樹型區塊列一樣多的處理器/核心進行並行化。HEVC HM包括用以組織不同樹型區塊列之經寫碼位元以便有益於特定數目個並行處理器/核心之機制。舉例而言,偶數編號之樹型區塊列(樹型區塊列0、2、4…)之經寫碼之位元有可能全部在奇數編號之樹型區塊列(樹型區塊列1、3、5…)之經寫碼之位元之前,使得位元串流可由兩個並行處理器/核心解碼,但較早出現之樹型區塊列(例如,樹型區塊列2)之解碼參考較晚出現之樹型區塊列(例如,樹型區塊列1)。與熵圖塊類似,歸因於允許一圖像內之相鄰樹型區塊列之間的圖像內預 測,為了實現圖像內預測所需之處理器間/核心間通信可相當大。相比於不應用WPP分割時之情況,WPP分割不會導致更多NAL單元;因此,WPP不能夠用於MTU大小匹配。
影像塊界定將圖像分割成影像塊行及列之水平邊界及垂直邊界。在按圖像之影像塊光柵掃描之次序解碼下一影像塊之左上樹型區塊之前,樹型區塊之掃描次序被改變成在影像塊內局部的(按影像塊之樹型區塊光柵掃描之次序)。與規則圖塊類似,影像塊破壞圖像內預測相依性以及熵解碼相依性。然而,影像塊無需包括至個別NAL單元內(就此而言與WPP一樣),且因此不能夠用於MTU大小匹配。每一影像塊可由一個處理器/核心處理,且在解碼相鄰影像塊之處理單元之間的進行圖像內預測所需要之處理器間/核心間通信限於傳遞共用圖塊標頭(在一圖塊橫跨一個以上影像塊之狀況下)及對經重建構樣本及後設資料之與迴路濾波相關的共用。因此,與WPP相比,歸因於兩個相鄰分割區之間的圖像內獨立性,影像塊在記憶體頻寬方面為要求較少的。
在HEVC HM中,規則圖塊為可用於並行化且亦在H.264/AVC中可以實際上等同形式使用之唯一工具。基於規則圖塊之並行化不需要很多處理器間或核心間通信(惟在解碼預測性寫碼之圖像時用於運動補償之處理器間或核心間資料共用(其通常比歸因於圖像內預測之處理器間或核心間資料共用繁重得多)除外)。然而,出於相同原因,規則圖塊可需要一些寫碼耗用。另外,規則圖塊(與上文所提及之一些其他分割方案相對照)亦歸因於規則圖塊之圖像內獨立性及每一規則圖塊囊封於其自有NAL單元中而用作用於進行位元串流分割以與MTU大小要求匹配之關鍵機制。在許多狀況下,並行化之目標與MTU大小匹配之目標可對圖像中之圖塊佈局提出矛盾的需求。
為簡單起見,在HM中指定四個不同圖像分割方案之限制。舉例 而言,在HM中,不可同時應用熵圖塊、影像塊及WPP中之任兩者之組合。此外,在HM中,對於每一圖塊及影像塊,必須實現以下條件中之任一者或兩者:1)一圖塊中之所有經寫碼之樹型區塊皆屬於同一影像塊,及2)一影像塊中之所有經寫碼之樹型區塊皆屬於同一圖塊。
已在S.Kanumuri等人的「Category-prefixed data batching for tiles and wavefronts」(第9次會議,Geneva,CH,2012年4月27日至5月7日,文件,JCTVC-I0427(下文中「Kanumuri」))中描述影像塊及WPP之交插資料次序(其亦使兩個入口點傳訊方法之有用性降低)。與Kanumuri中所提議之途徑相關聯的一個問題在於:所支援種類之最大數目為32。然而,有可能存在32個以上WPP子串流(例如,當每一樹型區塊列為一子串流且存在32個以上樹型區塊列時)或32個以上影像塊,且要求知曉每一WPP子串流或影像塊入口點(例如)以用於藉由單核心解碼器按圖像之樹型區塊光柵掃描來處理樹型區塊(剖析且解碼兩者)。此外,Kanumuri中所提議之途徑強加對單核心解碼之負擔,此係因為需要用以合併交插資料之合併程序或在NAL單元之位元串流中來回跳轉(視處理次序而定)。
本發明描述可用以指示是否應用種類前綴資料批次處理之技術。在一實例中,本發明描述視訊處理器件,該視訊處理器件經組態以藉由指示符識別是否應用種類前綴資料批次處理。詳言之,在一些實例中,可將用以指示是否應用種類前綴資料批次處理之指示添加於SPS或PPS中。若指示了不應用種類前綴資料批次處理,則可應用處置影像塊之習知方式。在其他實例中,種類之最大數目可變化,且可在SPS或PPS中傳訊種類之最大數目之值。在另外實例中,可(例如)在SPS或PPS中傳訊影像塊或WPP子串流至種類之映射(亦即,哪些影像塊或WPP子串流屬於各種類)。
圖6為說明判定在位元串流之部分中是否可發生參數集合更新之 操作的流程圖。所說明操作被描述為由來自圖3之視訊解碼器30基於由來自圖2之視訊編碼器20產生之指示來執行。
視訊解碼器30可自視訊編碼器20接收具有一或多個經寫碼之視訊序列之位元串流,該一或多個經寫碼之視訊序列包括表示經寫碼之視訊圖塊及經寫碼之參數集合之多個存取單元。視訊解碼器30解碼被定義成指示在位元串流之部分(諸如,經寫碼之視訊序列中之一者)中是否可發生參數集合更新之旗標(130)。在一實例中,旗標可包括於SEI NAL單元中,該SEI NAL單元包括在經寫碼之視訊序列之至少一存取單元中。在另一實例中,旗標可包括於SPS NAL單元中,該SPS NAL單元包括在經寫碼之視訊序列之至少一存取單元中。
在一些狀況下,旗標可指示在經寫碼之視訊序列中是否可更新任何類型之參數集合,使得僅一個旗標可用於所有類型之參數集合。在其他狀況下,旗標可指示在經寫碼之視訊序列中是否可更新特定類型之參數集合,使得一不同旗標可用於每一類型之參數集合。在又其他狀況下,旗標可指示在經寫碼之視訊序列中是否可更新兩種或兩種以上類型之參數集合,使得一旗標可用以指示該兩種或兩種以上類型之參數集合之更新狀態且另一旗標可用以指示額外類型之參數集合之更新狀態。
視訊解碼器30接著自包括於經寫碼之視訊序列之存取單元中之一者中的參數集合NAL單元解碼具有特定ID值的特定類型之第一參數集合(132)。當旗標指示在經寫碼之視訊序列中不可發生針對特定類型之參數集合的參數集合更新(134之否分支)時,視訊解碼器30針對位元串流之整個部分(亦即,此實例中之經寫碼之視訊序列)啟動第一參數集合(136)。在此狀況下,在解碼了具有與第一參數集合相同的類型且具有與第一參數集合相同的識別值之後續參數集合時,視訊解碼器30無需判定是否更新經寫碼之視訊序列之第一參數集合且可忽略 後續參數集合。因此,視訊解碼器30可進行操作就好像第一參數集合之內容與具有相同ID值的相同類型之任何其他參數集合中所包括的內容等同一樣。
當旗標指示在經寫碼之視訊序列中可發生針對特定類型之參數集合的參數集合更新(134之是分支)時,視訊解碼器30啟動第一參數集合(138)。視訊解碼器30接著自包括於經寫碼之視訊序列之存取單元中之一者中的參數集合NAL單元解碼具有與第一參數集合相同的類型且具有與第一參數集合相同的ID值之第二參數集合(140)。在此狀況下,因為可發生參數集合更新,所以視訊解碼器30判定是否儲存第二參數集合以替換第一參數集合(142)。
在一些狀況下,視訊解碼器30可針對經寫碼之視訊序列自動啟動第二參數集合,且去啟動第一參數集合。在其他狀況下,視訊解碼器30可比較第一參數集合之內容與第二參數集合之內容。當第二參數集合之內容不同於第一參數集合之內容時,視訊解碼器30針對經寫碼之視訊序列啟動第二參數集合,且去啟動第一參數集合。
圖7為說明判定是否可執行自CRA存取單元之隨機存取而不必自先前的不可用存取單元提取參數集合之操作的流程圖。所說明操作被描述為由來自圖3之視訊解碼器30基於由來自圖2之視訊編碼器20產生之指示來執行。
HEVC HM引入CRA圖像以在無較低寫碼效率的情況下提供對位元串流之隨機存取之更多選項,與在使用IDR圖像的情況下發生的一樣。CRA存取單元可定位於經寫碼之視訊序列內之任何點處且不清除經解碼圖像緩衝器(DPB),此允許給定CRA存取單元之前導圖像(亦即,按解碼次序在CRA存取單元之後但按輸出次序在CRA存取單元之前的圖像)將在該CRA存取單元之間解碼的圖像用作參考圖像。然而,僅當隨機存取自在給定CRA存取單元之前解碼的RAP圖像開始 時,才可正確地解碼前導圖像。在隨機存取自特定CRA圖像開始之狀況下,將不解碼按輸出或解碼次序在該CRA圖像之前的所有圖像且該等圖像不可用作參考圖像。為了解碼CRA圖像或按輸出或解碼次序之任何後續存取單元,視訊解碼器30可需要提取包括於不可用的先前圖像中之一者的存取單元中的一或多個參數集合,此為繁重的操作。
視訊解碼器30可自視訊編碼器20接收具有一或多個經寫碼之視訊序列之位元串流,該一或多個經寫碼之視訊序列包括表示經寫碼之視訊圖塊及經寫碼之參數集合之多個存取單元。視訊解碼器30自位元串流之經寫碼之視訊序列解碼一或多個CRA存取單元(150)。視訊解碼器30亦解碼被定義成指示自特定CRA存取單元對位元串流之隨機存取是否要求來自先前的不可用存取單元之參數集合之旗標(152)。在一實例中,旗標可包括於SEI NAL單元中,該SEI NAL單元包括在位元串流之經寫碼之視訊序列中之特定CRA存取單元中。
當旗標指示無需提取來自先前存取單元之參數集合(亦即,不需要提取)以用於進行自特定CRA存取單元之隨機存取時(154之否分支),視訊解碼器30在不執行提取操作的情況下執行自特定CRA存取單元對位元串流之隨機存取(156)。相反地,當旗標指示需要提取來自先前存取單元之參數集合(亦即,需要提取)以用於進行自特定CRA圖像之隨機存取時(154之是分支),視訊解碼器30判定是否按次序執行自特定CRA存取單元對位元串流之隨機存取(158)。在一些狀況下,視訊解碼器30可判定可在不執行提取操作的情況下自另一RAP圖像進行對位元串流之隨機存取,且進一步判定不執行自特定CRA存取單元對位元串流之隨機存取以便避免自先前存取單元提取參數集合。在其他狀況下,視訊解碼器30可判定不可進行自另一RAP圖像對位元串流之隨機存取,且進一步判定在自先前存取單元提取參數集合之後執行自特定CRA存取單元對位元串流之隨機存取。
以此方式,基於該旗標,視訊解碼器30首先判定是否需要提取操作以用於進行自特定CRA存取單元之隨機存取解碼,且可藉由選擇供執行隨機存取的不同RAP圖像而避免執行提取操作。該指示對於CRA存取單元尤其有用,此係因為CRA存取單元可定位於經寫碼之視訊序列內之任何點處且不清除DPB,此在無較低寫碼效率的情況下提供對位元串流之隨機存取之更多選項。
圖8為說明形成網路300之部分之實例器件集合的方塊圖。在此實例中,網路300包括路由器件304A、304B(集體地被稱作「路由器件304」)及轉碼器件306。路由器件304及轉碼器件306意欲表示可形成網路300之部分的少數器件。諸如交換器、集線器、閘道器、防火牆、橋接器及其他此類器件之其他網路器件亦可包括於網路300內。此外,可沿著伺服器器件302與用戶端器件308之間的網路路徑提供額外網路器件。在一些實例中,伺服器器件302可對應於來自圖1之源器件12,而用戶端器件308可對應於來自圖1之目的地器件14。
一般而言,路由器件304實施一或多個路由協定以經由網路300交換網路資料。在一些實例中,路由器件304可經組態以執行代理或快取操作。因此,在一些實例中,亦可將路由器件304稱作代理器件。一般而言,路由器件304執行路由協定以發現經由網路300之路由。藉由執行此等路由協定,路由器件304B可發現自其自身經由路由器件304A至伺服器器件302的網路路由。
本發明之技術可由諸如路由器件304及轉碼器件306之網路器件實施,但亦可由用戶端器件308實施。以此方式,路由器件304、轉碼器件306及用戶端器件308表示經組態以實施本發明中所描述之技術中之一或多者的器件之實例。
在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合予以實施。若以軟體實施,則該等功能可作為一或多個指令或 程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體進行傳輸,且由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,通信媒體包括促進(例如)根據通信協定將電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體一般可對應於(1)非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於實施本發明中所描述之技術的任何可用媒體。電腦程式產品可包括電腦可讀媒體。
藉由實例而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體,或可用以儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取之任何其他媒體。又,任何連接被適當地稱為電腦可讀媒體。舉例而言,若使用同軸電纜、光纖纜線、雙絞線、數位用戶線(DSL)或諸如紅外線、無線電及微波之無線技術而自網站、伺服器或其他遠端源傳輸指令,則同軸電纜、光纖纜線、雙絞線、DSL或諸如紅外線、無線電及微波之無線技術包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而是係針對非暫時性有形儲存媒體。如本文所使用之磁碟及光碟包括光碟(CD)、雷射光碟、光學碟片、數位影音光碟(DVD)、軟性磁碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。以上各者之組合亦應包括於電腦可讀媒體之範疇內。
可由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合或離散邏輯電路之一或多個處理器來執行指令。因此,本文所使用之 術語「處理器」可指代上述結構或適於實施本文所描述之技術的任何其他結構中的任一者。另外,在一些態樣中,可將本文所描述之功能性提供於經組態以用於編碼及解碼之專用硬體及/或軟體模組內,或併入於組合式編碼解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
本發明之技術可在廣泛多種器件或裝置中實施,該等器件或裝置包括無線手機、積體電路(IC)或IC集合(例如,晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術的器件之功能態樣,但未必要求藉由不同硬體單元來實現。更確切而言,如上文所描述,各種單元可組合於編碼解碼器硬體單元中或由交互操作之硬體單元的集合(包括如上文所描述之一或多個處理器)結合合適軟體及/或韌體來提供。
已描述各種實例。此等及其他實例係在以下申請專利範圍之範疇內。

Claims (40)

  1. 一種解碼視訊資料之方法,其包含:解碼指示在裝載該視訊資料之一位元串流之一部分中是否可發生一參數集合更新之一指示符;基於該指示符判定用於該視訊資料之該參數集合更新是否可發生在針對一或多個類型的參數集合之該位元串流的該部分中;及基於該指示符指示在該位元串流之該部分中能夠發生該參數集合更新,基於一特定類型、具有一特定識別值且具有與一先前參數集合不同之內容的一當前參數集合執行用於該視訊資料之該參數集合更新,該先前參數集合係相同特定類型且具有相同特定識別值,或基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,避免基於相同特定類型且具有相同於該先前參數集合之特定識別值的該當前參數集合執行用於該視訊資料之該參數集合更新。
  2. 如請求項1之方法,其中判定是否執行該參數集合更新進一步包含:比較該第二參數集合之內容與該第一參數集合之內容;及基於該第二參數集合之該內容不同於該第一參數集合之該內容,執行該參數集合更新以針對該位元串流之該部分啟動該第二參數集合且去啟動該第一參數集合。
  3. 如請求項1之方法,其中判定是否執行該參數集合更新進一步包含自動執行該參數集合更新以針對該位元串流之該部分啟動該第二參數集合且去啟動該第一參數集合。
  4. 如請求項1之方法,其中該指示符包含針對任何類型之參數集合指示在該位元串流之該部分中是否可發生一參數集合更新之一單一語法元素。
  5. 如請求項1之方法,其中該指示符包含複數個語法元素中之一者,其中該複數個語法元素中的每一者針對一特定類型之參數集合指示在該位元串流之該部分中是否可發生一參數集合更新。
  6. 如請求項1之方法,其中該指示符包含複數個語法元素中之一者,其中該複數個語法元素中之至少一者針對兩種或兩種以上不同類型之參數集合指示在該位元串流之該部分中是否可發生一參數集合更新。
  7. 如請求項1之方法,其進一步包含基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,於該位元串流之該部分之一開始接收一或多個參數集合。
  8. 如請求項1之方法,其進一步包含基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,與該位元串流之一經寫碼之視訊序列分離地在一頻帶外傳輸中接收一或多個參數集合。
  9. 如請求項1之方法,其進一步包含基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,與該位元串流之一經寫碼之視訊序列一起在一頻帶內傳輸中接收一或多個參數集合,而不比較該第一參數集合之任何重複傳輸之內容。
  10. 如請求項1之方法,其中該指示符包含包括於該位元串流之該部分之至少一存取單元的一補充增強資訊(SEI)訊息中之一語法元素。
  11. 如請求項1之方法,其中該指示符包含包括於一序列參數集合 (SPS)網路抽象層(NAL)單元中之一語法元素,該序列參數集合(SPS)網路抽象層(NAL)單元包括在該位元串流之該部分之至少一存取單元中。
  12. 如請求項1之方法,其中該指示符包含如下各者中之一者:包括於該位元串流中之一語法元素、包括於該位元串流之一經寫碼之視訊序列中之一語法元素、一設定檔定義中之一要求、包括於一會話描述協定中之一媒體類型參數,或包括於一超文本傳送協定(HTTP)串流傳輸環境之一媒體呈現描述中之一串流性質。
  13. 如請求項1之方法,其中該位元串流之該部分包含該位元串流之一經寫碼之視訊序列或該位元串流之該經寫碼之視訊序列中的一圖像群組(GOP)中之一者。
  14. 一種編碼視訊資料之方法,其包含:編碼指示在裝載該視訊資料之一位元串流之一部分中是否可發生一參數集合更新之一指示符,其中該指示符指示該參數集合更新是否可發生在針對一或多個類型的參數集合之該位元串流的該部分中,其中基於該指示符指示在該位元串流之該部分中能夠發生該參數集合更新,該指示符通知一視訊解碼器基於一特定類型、具有一特定識別值且具有與一先前參數集合不同之內容的一當前參數集合執行用於該視訊資料之該參數集合更新,該先前參數集合係相同特定類型且具有相同特定識別值,或其中基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,該指示符通知該視訊解碼器避免基於相同特定類型且具有相同於該先前參數集合之特定識別值的該當前參數集合執行用於該視訊資料之該參數集合更新。
  15. 如請求項14之方法,其進一步包含:編碼具有一特定識別值的一特定類型之一第一參數集合;及編碼具有與該第一參數集合相同類型且具有與該第一參數集合相同識別值之一第二參數集合,該第一參數集合係在該第二參數集合之前,其中該指示符指示在該位元串流之該部分中是否可發生該參數集合更新以儲存該第二參數集合以替換該第一參數集合。
  16. 如請求項14之方法,其中該指示符包含針對任何類型之參數集合指示在該位元串流之該部分中是否可發生一參數集合更新之一單一語法元素。
  17. 如請求項14之方法,其中該指示符包含複數個語法元素中之一者,其中該複數個語法元素中的每一者針對一特定類型之參數集合指示在該位元串流之該部分中是否可發生一參數集合更新。
  18. 如請求項14之方法,其中該指示符包含複數個語法元素中之一者,其中該複數個語法元素中之至少一者針對兩種或兩種以上不同類型之參數集合指示在該位元串流之該部分中是否可發生一參數集合更新。
  19. 如請求項14之方法,其進一步包含基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,於該位元串流之該部分之一開始編碼一或多個參數集合。
  20. 如請求項14之方法,其進一步包含基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,與該位元串流之一經寫碼之視訊序列分離地在一頻帶外傳輸中編碼一或多個參數集合。
  21. 如請求項14之方法,其進一步包含基於該指示符指示在該位元 串流之該部分中不能夠發生該參數集合更新,與該位元串流之一經寫碼之視訊序列一起在一頻帶內傳輸中編碼一或多個參數集合。
  22. 如請求項14之方法,其中該指示符包含包括於該位元串流之該部分之至少一存取單元的一補充增強資訊(SEI)訊息中之一語法元素。
  23. 如請求項14之方法,其中該指示符包含包括於一序列參數集合(SPS)網路抽象層(NAL)單元中之一語法元素,該序列參數集合(SPS)網路抽象層(NAL)單元包括在該位元串流之該部分之至少一存取單元中。
  24. 如請求項14之方法,其中該指示符包含如下各者中之一者:包括於該位元串流中之一語法元素、包括於該位元串流之一經寫碼之視訊序列中之一語法元素、一設定檔定義中之一要求、包括於一會話描述協定中之一媒體類型參數,或包括於一超文本傳送協定(HTTP)串流傳輸環境之一媒體呈現描述中之一串流性質。
  25. 如請求項14之方法,其中該位元串流之該部分包含該位元串流之一經寫碼之視訊序列或該位元串流之該經寫碼之視訊序列中的一圖像群組(GOP)中之一者。
  26. 一種用於寫碼視訊資料之視訊寫碼器件,該器件包含:一記憶體,其經組態以儲存視訊資料;及一或多個處理器,其經組態以寫碼一指示在裝載該視訊資料之一位元串流之一部分中是否可發生一參數集合更新之指示符,及基於該指示符指示在該位元串流之該部分中能夠發生該參數集合更新,基於一特定類型、具有一特定識別值且具有與一先前參數集合不同之內容的一當前參數集合執行用於該視訊 資料之該參數集合更新,該先前參數集合係相同特定類型且具有相同特定識別值,或基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,避免基於相同特定類型且具有相同於該先前參數集合之特定識別值的該當前參數集合執行用於該視訊資料之該參數集合更新,其中該指示符指示該參數集合更新是否可發生在針對一或多個類型的參數集合之該位元串流的該部分中。
  27. 如請求項26之器件,其中該等處理器進一步經組態以:比較該當前參數集合之內容與該先前參數集合之內容;及基於該當前參數集合之該內容不同於該先前參數集合之該內容,執行該參數集合更新以針對該位元串流之該部分啟動該當前參數集合且去啟動該先前參數集合。
  28. 如請求項26之器件,其中該等處理器進一步經組態以自動執行該參數集合更新以針對該位元串流之該部分啟動該當前參數集合且去啟動該先前參數集合。
  29. 如請求項26之器件,其中該指示符包含針對任何類型之參數集合指示在該位元串流之該部分中是否可發生一參數集合更新之一單一語法元素。
  30. 如請求項26之器件,其中該指示符包含複數個語法元素中之一者,其中該複數個語法元素中的每一者針對一特定類型之參數集合指示在該位元串流之該部分中是否可發生一參數集合更新。
  31. 如請求項26之器件,其中該指示符包含複數個語法元素中之一者,其中該複數個語法元素中之至少一者針對兩種或兩種以上不同類型之參數集合指示在該位元串流之該部分中是否可發生一參數集合更新。
  32. 如請求項26之器件,其中,基於指示在該位元串流之該部分中不能夠發生該參數集合更新的該指示符,該處理器經組態以於該位元串流之該部分之一開始編碼一或多個參數集合。
  33. 如請求項26之器件,其中基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,該等處理器經組態以與該位元串流之一經寫碼之視訊序列分離地在一頻帶外傳輸中寫碼一或多個參數集合。
  34. 如請求項26之器件,其中基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,該等處理器經組態以與該位元串流之一經寫碼之視訊序列一起在一頻帶內傳輸中寫碼一或多個參數集合。
  35. 如請求項26之器件,其中該指示符包含包括於該位元串流之該部分之至少一存取單元的一補充增強資訊(SEI)訊息中之一語法元素。
  36. 如請求項26之器件,其中該指示符包含包括於一序列參數集合(SPS)網路抽象層(NAL)單元中之一語法元素,該序列參數集合(SPS)網路抽象層(NAL)單元包括在該位元串流之該部分之至少一存取單元中。
  37. 如請求項26之器件,其中該指示符包含如下各者中之一者:包括於該位元串流中之一語法元素、包括於該位元串流之一經寫碼之視訊序列中之一語法元素、一設定檔定義中之一要求、包括於一會話描述協定中之一媒體類型參數,或包括於一超文本傳送協定(HTTP)串流傳輸環境之一媒體呈現描述中之一串流性質。
  38. 如請求項26之器件,其中該位元串流之該部分包含該位元串流之一經寫碼之視訊序列或該位元串流之該經寫碼之視訊序列中 的一圖像群組(GOP)中之一者。
  39. 一種用於寫碼視訊資料之視訊寫碼器件,該器件包含:用於寫碼一指示在裝載該視訊資料之一位元串流之一部分中是否可發生一參數集合更新之指示符的構件,其中該指示符指示該參數集合更新是否可發生在針對一或多個類型的參數集合之該位元串流的該部分中;及用於基於該指示符指示在該位元串流之該部分中能夠發生該參數集合更新,基於一特定類型、具有一特定識別值且具有與一先前參數集合不同之內容的一當前參數集合執行用於該視訊資料之該參數集合更新之構件,該先前參數集合係相同特定類型且具有相同特定識別值,或用於基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,避免基於相同特定類型且具有相同於該先前參數集合之特定識別值的該當前參數集合執行用於該視訊資料之該參數集合更新之構件。
  40. 一種包含用於寫碼視訊資料之指令之電腦可讀媒體,該等指令在經執行時使一或多個處理器:寫碼一指示在裝載該視訊資料之一位元串流之一部分中是否可發生一參數集合更新之指示符,其中該指示符指示該參數集合更新是否可發生在針對一或多個類型的參數集合之該位元串流的該部分中,基於該指示符指示在該位元串流之該部分中能夠發生該參數集合更新,基於一特定類型、具有一特定識別值且具有與一先前參數集合不同之內容的一當前參數集合執行用於該視訊資料之該參數集合更新,該先前參數集合係相同特定類型且具有相同特定識別值,或 基於該指示符指示在該位元串流之該部分中不能夠發生該參數集合更新,避免基於相同特定類型且具有相同於該先前參數集合之特定識別值的該當前參數集合執行用於該視訊資料之該參數集合更新。
TW102115166A 2012-04-27 2013-04-26 視訊寫碼中之參數集合更新 TWI520591B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261639823P 2012-04-27 2012-04-27
US13/870,833 US9516308B2 (en) 2012-04-27 2013-04-25 Parameter set updates in video coding

Publications (2)

Publication Number Publication Date
TW201351966A TW201351966A (zh) 2013-12-16
TWI520591B true TWI520591B (zh) 2016-02-01

Family

ID=48237304

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102115166A TWI520591B (zh) 2012-04-27 2013-04-26 視訊寫碼中之參數集合更新

Country Status (10)

Country Link
US (1) US9516308B2 (zh)
EP (1) EP2842320B1 (zh)
JP (1) JP6117341B2 (zh)
KR (1) KR101789370B1 (zh)
CN (1) CN104380747B (zh)
BR (1) BR112014026745B8 (zh)
ES (1) ES2744235T3 (zh)
HU (1) HUE044984T2 (zh)
TW (1) TWI520591B (zh)
WO (1) WO2013163563A1 (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130279882A1 (en) 2012-04-23 2013-10-24 Apple Inc. Coding of Video and Audio with Initialization Fragments
US9736476B2 (en) 2012-04-27 2017-08-15 Qualcomm Incorporated Full random access from clean random access pictures in video coding
JP6182719B2 (ja) * 2012-06-29 2017-08-23 ヴェロス メディア インターナショナル リミテッドVelos Media International Limited 符号化装置および符号化方法
US9992490B2 (en) 2012-09-26 2018-06-05 Sony Corporation Video parameter set (VPS) syntax re-ordering for easy access of extension parameters
US20140092987A1 (en) * 2012-09-28 2014-04-03 Apple Inc. Entropy coding techniques and protocol to support parallel processing with low latency
JP6274108B2 (ja) * 2012-09-28 2018-02-07 ソニー株式会社 符号化装置および符号化方法
JP6094126B2 (ja) * 2012-10-01 2017-03-15 富士通株式会社 動画像復号装置
KR20150092118A (ko) 2012-11-30 2015-08-12 소니 주식회사 화상 처리 장치 및 방법
JP6164840B2 (ja) * 2012-12-28 2017-07-19 キヤノン株式会社 符号化装置、符号化方法、及びプログラム
US10419778B2 (en) * 2013-01-04 2019-09-17 Sony Corporation JCTVC-L0227: VPS_extension with updates of profile-tier-level syntax structure
US10219006B2 (en) 2013-01-04 2019-02-26 Sony Corporation JCTVC-L0226: VPS and VPS_extension updates
US11418812B2 (en) * 2015-02-11 2022-08-16 Qualcomm Incorporated Placement of parameter sets and sync samples in video coding
US10178403B2 (en) * 2015-06-23 2019-01-08 Qualcomm Incorporated Reference picture list construction in intra block copy mode
EP3412032A1 (en) * 2016-02-02 2018-12-12 Fraunhofer Gesellschaft zur Förderung der Angewand Scene section and region of interest handling in video streaming
CN118784881A (zh) 2016-02-09 2024-10-15 弗劳恩霍夫应用研究促进协会 解码器、编码器、方法、网络设备以及可读存储介质
CA3111617A1 (en) * 2018-08-29 2020-03-05 Sharp Kabushiki Kaisha Video decoding apparatus and video coding apparatus
US10904574B2 (en) * 2018-09-13 2021-01-26 Tencent America LLC Method and device using an out of band end of stream NAL unit in decoding
GB201902829D0 (en) * 2019-03-01 2019-04-17 Canon Kk Method and apparatus for encoding and decoding a video bitsream for merging regions of interest
JP7359871B2 (ja) * 2019-05-06 2023-10-11 華為技術有限公司 ビデオコーディングにおいて新たなコーディングされているビデオシーケンスを開始するピクチャのための前のピクチャの出力
US20220368922A1 (en) * 2019-09-23 2022-11-17 Telefonaktiebolaget Lm Ericsson (Publ) Providing segment presence information
US11418804B2 (en) 2019-12-31 2022-08-16 Tencent America LLC Method for wrap around motion compensation with reference picture resampling
KR20220123717A (ko) 2020-01-12 2022-09-08 후아웨이 테크놀러지 컴퍼니 리미티드 비-직사각형 병합 모드로 가중 예측을 하모나이징하는 방법 및 장치
US20230319280A1 (en) * 2022-04-05 2023-10-05 Qatar Foundation For Education, Science And Community Development Automatic generation of h.264 parameter sets to recover video file fragments
WO2024107026A1 (ko) * 2022-11-19 2024-05-23 엘지전자 주식회사 Nnpfc sei 메시지의 반복을 처리하는 영상 부호화/복호화 방법, 비트스트림을 전송하는 방법 및 비트스트림을 저장한 기록 매체
WO2024107028A1 (ko) * 2022-11-19 2024-05-23 엘지전자 주식회사 영상 부호화/복호화 방법, 비트스트림을 전송하는 방법 및 비트스트림을 저장한 기록 매체
WO2024144314A1 (ko) * 2023-01-01 2024-07-04 엘지전자 주식회사 영상 부호화/복호화 방법, 비트스트림을 전송하는 방법 및 비트스트림을 저장한 기록 매체

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2492751C (en) 2002-07-16 2012-06-12 Nokia Corporation A method for random access and gradual picture refresh in video coding
US7415069B2 (en) 2003-12-09 2008-08-19 Lsi Corporation Method for activation and deactivation of infrequently changing sequence and picture parameter sets
CN1910922B (zh) * 2004-01-30 2013-04-17 松下电器产业株式会社 运动图片编码方法和运动图片解码方法
BRPI0418464B1 (pt) * 2004-02-10 2019-02-05 Thompson Licensing armazenamento de conjuntos de parâmetros de codificação de vídeo avançada (avc) no formato de arquivo avc
US20050254526A1 (en) 2004-05-12 2005-11-17 Nokia Corporation Parameter sets update in streaming applications
JP2006203662A (ja) * 2005-01-21 2006-08-03 Toshiba Corp 動画像符号化装置・復号化装置及び符号化ストリーム生成方法
JP5072893B2 (ja) 2009-03-25 2012-11-14 株式会社東芝 画像符号化方法および画像復号化方法
US9992456B2 (en) 2010-02-24 2018-06-05 Thomson Licensing Dtv Method and apparatus for hypothetical reference decoder conformance error detection
US9131033B2 (en) * 2010-07-20 2015-09-08 Qualcomm Incoporated Providing sequence data sets for streaming video data
US9398308B2 (en) 2010-07-28 2016-07-19 Qualcomm Incorporated Coding motion prediction direction in video coding
CN103299630B (zh) 2011-01-19 2016-10-19 寰发股份有限公司 获取运动矢量预测子的方法和装置
US9008181B2 (en) 2011-01-24 2015-04-14 Qualcomm Incorporated Single reference picture list utilization for interprediction video coding
US20120230430A1 (en) * 2011-03-10 2012-09-13 Stephan Wenger Parameter Set Maintenance in Video Coding
GB2488830B (en) 2011-03-10 2015-07-29 Canon Kk Method and device for encoding image data and method and device for decoding image data
MX337078B (es) 2011-07-02 2016-02-11 Samsung Electronics Co Ltd Metodo y aparato para multiplexar y desmultiplexar datos de video para identificar el estado de reproduccion de los datos de video.
US9277228B2 (en) 2011-07-18 2016-03-01 Qualcomm Incorporated Adaptation parameter sets for video coding
US9351016B2 (en) 2012-04-13 2016-05-24 Sharp Kabushiki Kaisha Devices for identifying a leading picture
KR102094503B1 (ko) 2012-04-15 2020-03-30 삼성전자주식회사 다계층 비디오 부호화 방법 및 장치, 다계층 비디오 복호화 방법 및 장치
US9736476B2 (en) 2012-04-27 2017-08-15 Qualcomm Incorporated Full random access from clean random access pictures in video coding

Also Published As

Publication number Publication date
EP2842320B1 (en) 2019-06-05
WO2013163563A1 (en) 2013-10-31
BR112014026745A2 (pt) 2017-07-11
US9516308B2 (en) 2016-12-06
EP2842320A1 (en) 2015-03-04
KR20150008143A (ko) 2015-01-21
BR112014026745B1 (pt) 2023-04-25
JP6117341B2 (ja) 2017-04-19
ES2744235T3 (es) 2020-02-24
TW201351966A (zh) 2013-12-16
CN104380747B (zh) 2018-02-13
CN104380747A (zh) 2015-02-25
KR101789370B1 (ko) 2017-10-23
HUE044984T2 (hu) 2019-11-28
BR112014026745B8 (pt) 2023-10-17
JP2015515239A (ja) 2015-05-21
US20130294499A1 (en) 2013-11-07

Similar Documents

Publication Publication Date Title
TWI520591B (zh) 視訊寫碼中之參數集合更新
TWI495273B (zh) 於視訊寫碼中自清晰隨機存取圖像之全面隨機存取
TWI556630B (zh) 用於處理視訊資料之方法及器件及電腦可讀取儲存媒體
RU2630181C2 (ru) Маркирование опорных изображений в видеопоследовательностях, имеющих изображения с разорванной ссылкой
KR102148548B1 (ko) 비디오 코딩에서의 동작 포인트들에 대한 계층 식별자들의 시그널링
US9525883B2 (en) Cross-layer alignment of intra random access point pictures
TWI559774B (zh) 具有改善隨機存取點圖像行爲之視訊寫碼
TWI558179B (zh) 對視訊寫碼發信長期參考圖像
RU2617995C2 (ru) Адаптация потоковой передачи на основе изображений чистого произвольного доступа (cra)
TW201515446A (zh) 高效率視訊寫碼擴展中之目標輸出層之選擇
TWI566582B (zh) 用於處理及編碼視訊資料之方法、器件及裝置以及電腦可讀儲存媒體
TW201509171A (zh) 對多層視訊寫碼之層間預測信令之最佳化
JP6779782B2 (ja) Mv−hevcにおけるビュー間依存タイプ
TW201320754A (zh) 支援內側景觀運動預測模式之以多重景觀寫碼為基礎的三維視訊寫碼的編解碼器
TW201406160A (zh) 在視訊寫碼中長期參考圖像之隨機存取及發信