TW201715886A - 多層位元流之檔案中之參數集信令 - Google Patents

多層位元流之檔案中之參數集信令 Download PDF

Info

Publication number
TW201715886A
TW201715886A TW105131114A TW105131114A TW201715886A TW 201715886 A TW201715886 A TW 201715886A TW 105131114 A TW105131114 A TW 105131114A TW 105131114 A TW105131114 A TW 105131114A TW 201715886 A TW201715886 A TW 201715886A
Authority
TW
Taiwan
Prior art keywords
irap
image
sample
track
images
Prior art date
Application number
TW105131114A
Other languages
English (en)
Other versions
TWI676387B (zh
Inventor
王益魁
伏努 亨利
Original Assignee
高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 高通公司 filed Critical 高通公司
Publication of TW201715886A publication Critical patent/TW201715886A/zh
Application granted granted Critical
Publication of TWI676387B publication Critical patent/TWI676387B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本發明提供一種器件,其產生、儲存或獲得一檔案,該檔案遵從該檔案所符合之一檔案格式中指定之一限制。該限制要求:對於每一各別框內隨機存取點(IRAP)圖像,解碼該各別IRAP圖像所需的一參數集在以下中之至少一者中:該各別IRAP圖像之播放軌中適用於該各別IRAP圖像的樣本之一樣本輸入項、用於該各別IRAP圖像之攜載該各別IRAP圖像之層的一參考層的一非對應播放軌之一樣本輸入項、該各別IRAP圖像之樣本,或攜載該參考層之一播放軌中之該各別IRAP圖像之樣本的一依時共置的樣本。

Description

多層位元流之檔案中之參數集信令
本發明係關於視訊編碼及解碼。
數位視訊能力可併入至廣泛範圍之器件中,包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位攝影機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲控制台、蜂巢式或衛星無線電電話、所謂的「智慧型電話」、視訊電話會議器件、視訊串流器件及其類似者。數位視訊器件實施視訊壓縮技術,諸如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分進階視訊寫碼(AVC)所定義之標準、目前正在研發之高效視訊寫碼(HEVC)標準及此等標準之擴展中所描述的彼等視訊壓縮技術。視訊器件可藉由實施此等視訊壓縮技術而更有效地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。 視訊壓縮技術執行空間(圖像內)預測及/或時間(圖像間)預測以減少或移除視訊序列中固有之冗餘。對於基於區塊之視訊寫碼,可將視訊圖塊(亦即,視訊圖框或視訊圖框之部分)分割成視訊區塊。使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測來編碼圖像之經框內寫碼(I)圖塊中之視訊區塊。圖像之經框間寫碼(P或B)圖塊中之視訊區塊可使用相對於同一圖像中之相鄰區塊中的參考樣本的空間預測或相對於其他參考圖像中之參考樣本的時間預測。圖像可被稱作圖框,且參考圖像可被稱作參考圖框。 空間或時間預測產生用於待編碼區塊的預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。經框間編碼區塊係根據指向形成預測性區塊的參考樣本的區塊的運動向量來編碼,且殘餘資料指示經寫碼區塊與預測性區塊之間的差。經框內寫碼區塊係根據框內寫碼模式及殘餘資料來編碼。為了進一步壓縮,可將殘餘資料自像素域變換至變換域,從而產生接著可經量化之殘餘係數。可掃描最初按二維陣列配置的經量化之係數以便產生係數之一維向量,且可應用熵寫碼以達成甚至更多壓縮。 HEVC提供參數集,諸如視訊參數集(VPS)、序列參數集(SPS)及圖像參數集(PPS)。此等參數集包括適用於一或多個經編碼圖像之參數。舉例而言,SPS中之參數可適用於全部序列之編碼圖像。視訊解碼器可需要能夠存取適用於經編碼圖像之參數集以解碼經編碼圖像。在HEVC位元流中,參數集包含於自含有經編碼圖像之經編碼圖塊區段的NAL單元分離之網路抽象層(NAL)單元中。因此,含有經編碼圖像之經編碼圖塊區段的NAL單元可在位元流自含有用於解碼經編碼圖像所需的參數集之NAL單元分離之部分中。 在視訊寫碼之上下文中,隨機存取係指自位元流中之非第一經寫碼圖像的經寫碼圖像解碼位元流。HEVC位元流包括框內隨機存取圖像(IRAP)圖像以便於隨機存取。如其他類型之圖像,視訊解碼器可需要存取適用於IRAP圖像之參數集以解碼IRAP圖像。 用於儲存多層HEVC位元流(亦即,L-HEVC位元流)之檔案格式正在研發中。在檔案格式中,檔案之每一播放軌可包括一系列樣本。播放軌之每一樣本可包括一或多個不同層之依時共置的經編碼圖像。儲存含有L-HEVC位元流之檔案的器件可提取所有L-HEVC位元流或部分L-HEVC位元流且將所提取的資料直接地或間接地提供至視訊解碼器。為便於隨機存取,器件可自含有IRAP圖像之檔案的樣本開始提取部分L-HEVC位元流。因此,儘管器件可能夠將IRAP圖像之經編碼視訊資料提供至視訊解碼器,但若器件無法將用於解碼IRAP圖像所需的參數集提供至視訊解碼器,則視訊解碼器可無法解碼IRAP圖像。對於檔案格式之前述提議無法並未使得器件能夠保證將解碼IRAP圖像所需的參數集提供至視訊解碼器,尤其在器件未經組態以剖析L-HEVC位元流自身之實例中。增加剖析L-HEVC位元流之能力可對器件增加顯著的複雜度並減慢器件之操作。此外,此等前述提議可導致不必要的較大檔案大小。
一種器件產生、儲存或獲得檔案,該檔案遵從該檔案所符合之檔案格式中指定之限制。該限制要求對於每一各別框內隨機存取點(IRAP)圖像,解碼各別IRAP圖像所需的參數集在以下中之至少一者中:該各別IRAP圖像之播放軌中適用於各別IRAP圖像的樣本之樣本輸入項、用於各別IRAP圖像之攜載該各別IRAP圖像之層的參考層的非對應播放軌之樣本輸入項、該各別IRAP圖像之樣本,或攜載該參考層之播放軌中之該各別IRAP圖像之樣本的依時共置的樣本。 在本發明之一個實例中,一種處理視訊資料之方法,該方法包含:獲得多層位元流,該多層位元流包含複數個參數集、視訊資料之複數個IRAP圖像之經編碼表示及視訊資料之複數個非IRAP圖像之經編碼表示;及產生用於儲存多層位元流之檔案,使得檔案遵從該檔案所符合之檔案格式中指定之限制,其中:對於檔案之複數個播放軌中之每一各別播放軌,用於各別播放軌之媒體內容包含各別序列之樣本,對於複數個IRAP圖像中之每一各別IRAP圖像:各別IRAP圖像的層含有各別IRAP圖像且其為多層位元流之一層,各別IRAP圖像的播放軌含有各別IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別IRAP圖像的播放軌,該限制要求解碼各別IRAP圖像所需的複數個參數集中之每一參數集在以下中之至少一者中:該各別IRAP圖像之播放軌中適用於該各別IRAP圖像之樣本的樣本輸入項;用於該各別IRAP圖像的攜載該各別IRAP圖像之層之參考層之非對應播放軌的樣本輸入項,用於該各別IRAP圖像之非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的非對應播放軌中之依時共置的樣本或,當用於各別IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於該各別IRAP圖像之非對應播放軌中之解碼時間小於但最接近於該各別IRAP圖像之樣本的解碼時間的一樣本;各別IRAP圖像的樣本;及該複數個播放軌中攜載該各別IRAP圖像之層之參考層的播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本 。 在另一實例中,本發明描述用於處理視訊資料之器件,該器件包含:一或多個處理電路,其經組態以產生用於儲存多層位元流之檔案,使得檔案遵從該檔案所符合之檔案格式中指定之限制,其中:多層位元流包含複數個參數集、視訊資料之複數個IRAP圖像之經編碼表示及視訊資料之複數個非IRAP圖像之經編碼表示,對於檔案之複數個播放軌中之每一各別播放軌,用於各別播放軌之媒體內容包含各別序列之樣本,對於複數個IRAP圖像中之每一各別IRAP圖像:各別IRAP圖像的層含有各別IRAP圖像且其為多層位元流之一層,各別IRAP圖像的播放軌含有各別IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別IRAP圖像的播放軌,該限制要求解碼各別IRAP圖像所需之複數個參數集中之每一參數集在以下中之至少一者中:該各別IRAP圖像之播放軌中適用於該各別IRAP圖像之樣本的樣本輸入項;用於該各別IRAP圖像的攜載該各別IRAP圖像之層之參考層之非對應播放軌的樣本輸入項,用於該各別IRAP圖像之非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的非對應播放軌中之依時共置的樣本或,當用於各別IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於該各別IRAP圖像之非對應播放軌中之解碼時間小於但最接近於該各別IRAP圖像之樣本的解碼時間的一樣本;各別IRAP圖像的樣本;及該複數個播放軌中攜載該各別IRAP圖像之層之參考層的播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及資料儲存媒體,其經組態以儲存檔案。 在另一實例中,本發明描述處理視訊資料之方法,該方法包含:儲存將多層位元流進行儲存之檔案,該檔案遵從該檔案符合之檔案格式中指定之限制,其中:多層位元流包含複數個參數集、視訊資料之複數個IRAP圖像之經編碼表示及視訊資料之複數個非IRAP圖像之經編碼表示,對於檔案之複數個播放軌中之每一各別播放軌,用於各別播放軌之媒體內容包含各別序列之樣本,對於複數個IRAP圖像中之每一各別IRAP圖像:各別IRAP圖像的層含有各別IRAP圖像且其為多層位元流之一層,各別IRAP圖像的播放軌含有各別IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別IRAP圖像的播放軌,該限制要求用解碼各別IRAP圖像所需之複數個參數集中之每一參數集在以下中之至少一者中:該各別IRAP圖像之播放軌中適用於該各別IRAP圖像之樣本的樣本輸入項;用於該各別IRAP圖像的攜載該各別IRAP圖像之層之參考層之非對應播放軌的樣本輸入項,用於該各別IRAP圖像之非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的非對應播放軌中之依時共置的樣本或,當用於各別IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於該各別IRAP圖像之非對應播放軌中之解碼時間小於但最接近於該各別IRAP圖像之樣本的解碼時間的一樣本;各別IRAP圖像的樣本;及該複數個播放軌中攜載該各別IRAP圖像之層之參考層的播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及將檔案的至少一部分串流至接收器件。 在另一實例中,本發明描述用於處理視訊資料之器件,該器件包含:資料儲存媒體,其經組態以儲存將多層位元流進行儲存之檔案,該檔案遵從該檔案所符合之檔案格式中指定之限制,其中:多層位元流包含複數個參數集、視訊資料之複數個IRAP圖像之經編碼表示及視訊資料之複數個非IRAP圖像之經編碼表示,對於檔案之複數個播放軌中之每一各別播放軌,用於各別播放軌之媒體內容包含各別序列之樣本,對於複數個IRAP圖像中之每一各別IRAP圖像:各別IRAP圖像的層含有各別IRAP圖像且其為多層位元流之一層,各別IRAP圖像的播放軌含有各別IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別IRAP圖像的播放軌,該限制要求解碼各別IRAP圖像所需之複數個參數集中之每一參數集在以下中之至少一者中:各別IRAP圖像之播放軌中適用於該各別IRAP圖像之樣本的樣本輸入項;用於該各別IRAP圖像的攜載該各別IRAP圖像之層之參考層之非對應播放軌的樣本輸入項,用於該各別IRAP圖像之非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之非對應播放軌之樣本輸入項適用於該各別IRAP圖像的非對應播放軌中之依時共置的樣本或,當用於各別IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於該各別IRAP圖像之非對應播放軌中之解碼時間小於但最接近於該各別IRAP圖像之樣本的解碼時間的一樣本;各別IRAP圖像的樣本;及複數個播放軌中攜載該各別IRAP圖像之層之參考層的播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及介面,其經組態以將檔案的至少一部分串流至接收器件。 在另一實例中,本發明描述處理視訊資料之方法,該方法包含:獲得儲存多層位元流之檔案,該檔案遵從該檔案所符合之檔案格式中指定之限制,其中:多層位元流包含複數個參數集、視訊資料之複數個IRAP圖像之經編碼表示及視訊資料之複數個非IRAP圖像之經編碼表示,對於檔案之複數個播放軌中之每一各別播放軌,用於各別播放軌之媒體內容包含各別序列之樣本,對於複數個IRAP圖像中之每一各別IRAP圖像:各別IRAP圖像的層含有各別IRAP圖像且其為多層位元流之一層,各別IRAP圖像的播放軌含有各別IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別IRAP圖像的播放軌,該限制要求解碼各別IRAP圖像所需之複數個參數集中之每一參數集在以下中之至少一者中:該各別IRAP圖像之播放軌中適用於該各別IRAP圖像之樣本的樣本輸入項;用於該各別IRAP圖像的攜載該各別IRAP圖像之層之參考層之非對應播放軌的樣本輸入項,用於該各別IRAP圖像之非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的非對應播放軌中之依時共置的樣本或,當用於各別IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於該各別IRAP圖像之非對應播放軌中之解碼時間小於但最接近於該各別IRAP圖像之樣本的解碼時間的一樣本;各別IRAP圖像的樣本;及該複數個播放軌中攜載該各別IRAP圖像之層之參考層的播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及解碼該檔案中之多層位元流的至少一部分。 在另一實例中,本發明描述用於處理視訊資料之器件,該器件包含:輸入介面,其經組態以獲得儲存多層位元流之檔案,該檔案遵從該檔案所符合之檔案格式中指定之限制,其中:多層位元流包含複數個參數集、視訊資料之複數個IRAP圖像之經編碼表示及視訊資料之複數個非IRAP圖像之經編碼表示,對於檔案之複數個播放軌中之每一各別播放軌,用於各別播放軌之媒體內容包含各別序列之樣本,對於複數個IRAP圖像中之每一各別IRAP圖像:各別IRAP圖像的層含有各別IRAP圖像且其為多層位元流之一層,各別IRAP圖像的播放軌含有各別IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別IRAP圖像的播放軌,該限制要求解碼各別IRAP圖像所需之複數個參數集中之每一參數集在以下中之至少一者中:各別IRAP圖像之播放軌中適用於該各別IRAP圖像之樣本的樣本輸入項;用於該各別IRAP圖像的攜載該各別IRAP圖像之層之參考層之非對應播放軌的樣本輸入項,用於該各別IRAP圖像之非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的非對應播放軌中之依時共置的樣本或,當用於各別IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於該各別IRAP圖像之非對應播放軌中之解碼時間小於但最接近於該各別IRAP圖像之樣本的解碼時間的一樣本;各別IRAP圖像的樣本;及該複數個播放軌中攜載該各別IRAP圖像之層之參考層的播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及一或多個處理電路,其經耦接至輸入介面,該一或多個處理電路經組態以解碼檔案中之多層位元流的至少一部分。 在另一實例中,本發明描述用於處理視訊資料之器件,該器件包含:用於獲得多層位元流之構件,該多層位元流包含複數個參數集、視訊資料之複數個IRAP圖像之經編碼表示及視訊資料之複數個非IRAP圖像之經編碼表示;及用於產生用於儲存多層位元流之檔案以使得該檔案遵從該檔案所符合之檔案格式中指定之限制之構件,其中:對於檔案之複數個播放軌中之每一各別播放軌,用於各別播放軌之媒體內容包含各別序列之樣本,對於複數個IRAP圖像中之每一各別IRAP圖像:各別IRAP圖像的層含有各別IRAP圖像且其為多層位元流之一層,各別IRAP圖像的播放軌含有各別IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別IRAP圖像的播放軌,限制要求解碼各別IRAP圖像所需之複數個參數集中之每一參數集在以下中之至少一者中:該各別IRAP圖像之播放軌中適用於該各別IRAP圖像之樣本的樣本輸入項;用於該各別IRAP圖像的攜載該各別IRAP圖像之層之參考層之非對應播放軌的樣本輸入項,用於該各別IRAP圖像之非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的非對應播放軌中之依時共置的樣本或,當用於各別IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於該各別IRAP圖像之非對應播放軌中之解碼時間小於但最接近於該各別IRAP圖像之樣本的解碼時間的一樣本;各別IRAP圖像的樣本;及複數個播放軌中攜載各別IRAP圖像的層之參考層的播放軌中之各別IRAP圖像的樣本之任何依時共置的樣本。 在另一實例中,本發明描述包含指令之電腦可讀儲存媒體,該等指令在經執行時使器件:獲得多層位元流,該多層位元流包含複數個參數集、視訊資料之複數個IRAP圖像之經編碼表示及視訊資料之複數個非IRAP圖像之經編碼表示;及產生用於儲存多層位元流之檔案以使得檔案遵從該檔案所符合之檔案格式中指定之限制,其中:對於檔案之複數個播放軌中之每一各別播放軌,用於各別播放軌之媒體內容包含各別序列之樣本,對於複數個IRAP圖像中之每一各別IRAP圖像:各別IRAP圖像的層含有各別IRAP圖像且其為多層位元流之一層,各別IRAP圖像的播放軌含有各別IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別IRAP圖像的播放軌,限制要求解碼各別IRAP圖像所需之複數個參數集中之每一參數集在以下中之至少一者中:各別IRAP圖像的播放軌中適用於各別IRAP圖像的樣本之樣本輸入項、用於各別IRAP圖像的攜載各別IRAP圖像的層之參考層之非對應播放軌之樣本輸入項,用於各別IRAP圖像之該非對應播放軌為除複數個播放軌中之各別IRAP圖像的播放軌以外的播放軌,用於該各別IRAP圖像之非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的非對應播放軌中之依時共置的樣本或 當用於各別IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於該各別IRAP圖像之非對應播放軌中之解碼時間小於但最接近於該各別IRAP圖像之樣本的解碼時間的一樣本;各別IRAP圖像的樣本,及複數個播放軌中攜載各別IRAP圖像的層之參考層的播放軌中之各別IRAP圖像的樣本之任何依時共置的樣本。 在另一實例中,本發明描述處理視訊資料之器件,該器件包含:用於儲存將多層位元流進行儲存之檔案之構件,該檔案遵從該檔案符合之檔案格式中指定之限制,其中:多層位元流包含複數個參數集、視訊資料之複數個IRAP圖像之經編碼表示,及視訊資料之複數個非IRAP圖像之經編碼表示,對於檔案之複數個播放軌中之每一各別播放軌,用於各別播放軌之媒體內容包含各別序列之樣本,對於複數個IRAP圖像中之每一各別IRAP圖像:各別IRAP圖像的層含有各別IRAP圖像且其為多層位元流之一層,各別IRAP圖像的播放軌含有各別IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別IRAP圖像的播放軌,限制要求解碼各別IRAP圖像所需之複數個參數集中之每一參數集在以下中之至少一者中:各別IRAP圖像之播放軌中適用於各別IRAP圖像之樣本的樣本輸入項、用於各別IRAP圖像的攜載該各別IRAP圖像之層之參考層之非對應播放軌的樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之非對應播放軌之該樣本輸入項適用於各別IRAP圖像的非對應播放軌中之依時共置的樣本或,當用於各別IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於該各別IRAP圖像之非對應播放軌中之解碼時間小於但最接近於該各別IRAP圖像之樣本的解碼時間的一樣本、各別IRAP圖像的樣本,及複數個播放軌中攜載各別IRAP圖像的層之參考層的播放軌中之各別IRAP圖像的樣本之任何按依時共置的樣本;及用於將檔案的至少一部分串流至接收器件之構件。 在另一實例中,本發明描述經組態以儲存指令之電腦可讀儲存媒體,該等指令在經執行時使器件:儲存將多層位元流進行儲存之檔案,該檔案遵從該檔案符合之檔案格式中指定之限制,其中:多層位元流包含複數個參數集、視訊資料之複數個IRAP圖像之經編碼表示,及視訊資料之複數個非IRAP圖像之經編碼表示,對於檔案之複數個播放軌中之每一各別播放軌,用於各別播放軌之媒體內容包含各別序列之樣本,對於複數個IRAP圖像中之每一各別IRAP圖像:各別IRAP圖像的層含有各別IRAP圖像且其為多層位元流之一層,各別IRAP圖像的播放軌含有各別IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別IRAP圖像的播放軌,限制要求解碼各別IRAP圖像所需之複數個參數集中之每一參數集在以下中之至少一者中:各別IRAP圖像之播放軌中適用於各別IRAP圖像之樣本的樣本輸入項、用於各別IRAP圖像的攜載該各別IRAP圖像之層之參考層之非對應播放軌的樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之非對應播放軌之該樣本輸入項適用於各別IRAP圖像的非對應播放軌中之依時共置的樣本或,當用於各別IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於該各別IRAP圖像之非對應播放軌中之解碼時間小於但最接近於該各別IRAP圖像之樣本的解碼時間的樣本、各別IRAP圖像的樣本,及該複數個播放軌中攜載該各別IRAP圖像之層之參考層的播放軌中之各別IRAP圖像的樣本之任何依時共置的樣本;及將檔案的至少一部分串流至接收器件。 在另一實例中,本發明描述處理視訊資料之器件,該器件包含:用於獲得儲存多層位元流之檔案之構件,該檔案遵從該檔案符合之檔案格式中指定之限制,其中:多層位元流包含複數個參數集、視訊資料之複數個IRAP圖像之經編碼表示,及視訊資料之複數個非IRAP圖像之經編碼表示,對於檔案之複數個播放軌中之每一各別播放軌,各別播放軌之媒體內容包含各別序列之樣本,對於複數個IRAP圖像中之每一各別IRAP圖像:各別IRAP圖像的層含有各別IRAP圖像且其為多層位元流之一層,各別IRAP圖像的播放軌含有各別IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別IRAP圖像的播放軌,限制要求解碼各別IRAP圖像所需之複數個參數集中之每一參數集在以下中之至少一者中:各別IRAP圖像之播放軌中適用於各別IRAP圖像之樣本的樣本輸入項、用於該各別IRAP圖像的攜載該各別IRAP圖像之層之參考層之非對應播放軌的樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之非對應播放軌之樣本輸入項適用於各別IRAP圖像的非對應播放軌中之依時共置的樣本或 當用於各別IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於各別IRAP圖像之非對應播放軌中之一解碼時間小於但最接近於該各別IRAP圖像之樣本的解碼時間的樣本、各別IRAP圖像的樣本,及該複數個播放軌中攜載各別IRAP圖像之層之參考層的播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及用於解碼檔案中之多層位元流的至少一部分之構件。 在另一實例中,本發明描述具有其上儲存有指令的電腦可讀儲存媒體,該等指令在經執行時使器件:獲得儲存多層位元流之檔案,該檔案遵從該檔案符合之檔案格式中指定之限制,其中:多層位元流包含複數個參數集、視訊資料之複數個IRAP圖像之經編碼表示,及視訊資料之複數個非IRAP圖像之經編碼表示,對於檔案之複數個播放軌中之每一各別播放軌,各別播放軌之媒體內容包含各別序列之樣本,對於複數個IRAP圖像中之每一各別IRAP圖像:各別IRAP圖像的層含有各別IRAP圖像且其為多層位元流之一層,各別IRAP圖像的播放軌含有各別IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別IRAP圖像的播放軌,限制要求解碼各別IRAP圖像所需之複數個參數集中之每一參數集在以下中之至少一者中:各別IRAP圖像之播放軌中適用於該各別IRAP圖像的樣本之樣本輸入項、用於該各別IRAP圖像的攜載該各別IRAP圖像之層之一參考層之一非對應播放軌的樣本輸入項,用於各別IRAP圖像之非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之非對應播放軌之樣本輸入項適用於該各別IRAP圖像的非對應播放軌中之依時共置的樣本或,當用於各別IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於各別IRAP圖像之非對應播放軌中之一解碼時間小於但最接近於該各別IRAP圖像之樣本的一解碼時間的樣本、各別IRAP圖像的樣本,及複數個播放軌中攜載該各別IRAP圖像之層之參考層的播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及解碼檔案中之多層位元流的至少一部分。 在隨附圖式及以下描述中闡述本發明之一或多個態樣的細節。本發明中所描述之技術的其他特徵、目標及優點將自描述、圖式及申請專利範圍顯而易見。
本申請案主張2015年10月14日申請之美國臨時專利申請案第62/241,683號之權益,該臨時專利申請案之全部內容以引用之方式併入本文中。 本發明係關於以ISO (國際標準化組織)基礎媒體檔案格式及自其衍生之檔案格式儲存視訊內容。更具體而言,本發明描述尤其當多個播放軌用於儲存多層位元流時用於多層位元流之檔案中之參數集信令之技術。 舉例而言,正研發用於攜載經編碼視訊資料之多層位元流(諸如分層高效視訊寫碼(L-HEVC)位元流)之基於ISO基礎媒體檔案格式之檔案格式。多層位元流包含多個層。每一層包含在不同輸出時間出現的一序列之經編碼圖像。在可調式視訊寫碼之情況下,多層位元流之層可包括基礎層及一或多個增強層。基礎層可不參考增強層中之任一者來解碼。增強層可在空間上或在時間上增強基礎層之圖像。舉例而言,增強層可具有比基礎層高的圖框率。因此,增強層可包括針對輸出時間之經編碼圖像且基礎層不包括針對該輸出時間之經編碼圖像。在多層位元流之第一層包括輸出時間處之經編碼圖像且多層位元流之第二層不包括針對輸出時間之經編碼圖像之情況下,第一層中之經編碼圖像被稱作與第二層中之經編碼圖像未對準。在多視圖視訊寫碼中,多層位元流之層可對應於不同視圖中之經編碼圖像。 符合檔案格式之檔案包含被稱作「邏輯框(box)」之資料結構之集合。檔案之邏輯框可包括媒體資料邏輯框,該等媒體資料邏輯框中之每一者包括一或多個樣本。樣本可包括在同一存取單元中之一或多個經編碼圖像(亦即,具有相同輸出時間)。舉例而言,樣本可包括具有相同輸出時間但在不同層中之經編碼圖像。此外,在ISO基礎媒體檔案格式及其擴展中,術語「樣本」適用於媒體存取單元,諸如視訊存取單元或音訊存取單元。然而,在編解碼器層級,術語「樣本」可適用於像素之色彩分量之值。因此,除非另有明確規定或如將自論述之上下文理解,否則在本發明中提及之「樣本」應理解為係指在檔案格式層級之樣本(亦即,包括同一存取單元之一或多個經編碼圖像之彼等樣本)。 另外,檔案之邏輯框可包括含有用於檔案之播放軌的後設資料之一或多個播放軌邏輯框。舉例而言,播放軌邏輯框可包括樣本表邏輯框。用於播放軌之後設資料包括一或多個樣本描述項。每一樣本與播放軌之樣本描述項中之一者相關聯。由於播放軌之單獨樣本可包括屬於多個層之經編碼圖像且此等層之經編碼圖像可未對準,故播放軌之不同樣本可包括不同數目之經編碼圖像。 各種編解碼器允許位元流包括與經編碼圖像分離但含有解碼經編碼圖像所需的參數之各種類型之參數集。舉例而言,HEVC定義視訊參數集(VPS)、序列參數集(SPS)及圖像參數集(PPS)。在特定情形中,與需要器件能夠在位元流層級解釋參數集相反,可需要使參數集可供器件在檔案層級使用。舉例而言,可需要參數集除了在根據編解碼器編碼之視訊資料位元流(諸如L-HEVC)中編碼之外包括於檔案之後設資料中。舉例而言,能夠在檔案層級解釋參數集可使器件能夠判定解碼器是否能夠解碼儲存於檔案中之特定經編碼圖像。另外,在一些實例中,在檔案之後設資料中具有參數集可藉由使器件能夠處理檔案以將參數集提供至視訊解碼器而有助於隨機存取。 因此,此前提議之限制要求檔案符合以下要求:若樣本含有至少一個如HEVC (亦即,ISO/IEC 23008 -2)中所定義之框內隨機存取點(IRAP)圖像,則解碼在含有樣本中之IRAP圖像的每一層中之IRAP圖像及按解碼次序在其後的圖像所需之每一參數集應包括於攜載存在於此樣本中之層的播放軌之樣本輸入項中抑或包括於該樣本自身中(可能藉由使用提取器)。此外,已經提議,在其他方面(亦即,樣本不含有IRAP圖像),解碼該樣本所需之每一參數集應包括於攜載存在於此樣本之層的播放軌之樣本輸入項中抑或包括於在含有至少一個IRAP圖像的前一樣本之後至該樣本自身的樣本中之任一者中(可能藉由使用提取器),包括在內。提取器係指檔案之另一部分。 然而,可存在關於上述限制之某些問題。舉例而言,所提議之限制不明確且不允許可能需要的情境。本發明中描述之技術可解決關於上述限制之問題。舉例而言,檔案可遵從以下限制而非以上指定之限制。在此實例中,對於檔案中之複數個播放軌中之每一各別播放軌,用於各別播放軌之媒體內容包含各別序列之樣本。對於複數個IRAP圖像中之每一各別IRAP圖像,各別IRAP圖像的層含有各別IRAP圖像且其為多層位元流之一層,各別IRAP圖像的播放軌含有各別IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別IRAP圖像的播放軌。在其他實例中,當相關樣本輸入項之樣本輸入項名稱具有另一值時,限制可適用。在此實例中,限制要求解碼各別IRAP圖像所需的複數個參數集中之每一參數集在以下中之至少一者中: 各別IRAP圖像之播放軌中適用於各別IRAP圖像的樣本之樣本輸入項, 用於各別IRAP圖像的攜載各別IRAP圖像的層之參考層的非對應播放軌之樣本輸入項,用於各別IRAP圖像之非對應播放軌為除複數個播放軌中之各別IRAP圖像的播放軌以外的播放軌,用於各別IRAP圖像之非對應播放軌之樣本輸入項適用於各別IRAP圖像之非對應播放軌中之依時共置的樣本或,當用於各別IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於各別IRAP圖像的非對應播放軌中之解碼時間小於但最接近於各別IRAP圖像之樣本之解碼時間的樣本, 各別IRAP圖像的樣本,及 複數個播放軌中攜載各別IRAP圖像的層之參考層的播放軌中之各別IRAP圖像的樣本之任何依時共置的樣本。 實施此等限制可藉由潛在地減小檔案之大小來增強使用遵從該等限制之檔案之計算器件之功能性,減少檔案之大小可節省此等計算器件之儲存空間及處理資源。舉例而言,如先前所描述,若需要檔案包括解碼含有IRAP圖像之樣本中之每一IRAP圖像所需之參數集或適用於含有IRAP圖像之樣本的樣本輸入項,則檔案可以解碼IRAP圖像所需的參數集之不需要的複本結束。此至少係因為在多層HEVC中,解碼經編碼圖像所需的VPS可適用於多個層中之圖像,該多個層中之兩者或多於兩者可在檔案之複數個不同播放軌中。相比於此前提議之限制,在本發明中提議之限制不需要此VPS之複本存在於複數個播放軌中之每一者之樣本輸入項中或存在於含有VPS所適用的圖像之樣本中。相反,在遵從本發明之限制之檔案中,VPS可存在於少於所有播放軌之樣本或樣本輸入項中,從而潛在地減少檔案中之VPS之複本之數目。 圖1為說明可利用本發明之技術之實例視訊寫碼系統10的方塊圖。如本文所使用,術語「視訊寫碼器」大體上係指視訊編碼器及視訊解碼器兩者。在本發明中,術語「視訊寫碼」或「寫碼」大體上可指視訊編碼或視訊解碼。 視訊寫碼標準包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual、ITU-T H.264或ISO/IEC MPEG-4 AVC,包括其可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展,及高效視訊寫碼(HEVC),亦被稱作ITU-T H.265及ISO/IEC 23008-2,包括其可調式寫碼擴展(亦即,可調式高效視訊寫碼,SHVC)及多視圖擴展(亦即,多視圖高效視訊寫碼,MV-HEVC)。 如圖1所展示,視訊寫碼系統10包括源器件12及目的地器件14。源器件12產生經編碼視訊資料。因此,源器件12可被稱作視訊編碼器件或視訊編碼裝置。目的地器件14可解碼由源器件12產生之經編碼視訊資料。因此,目的地器件14可被稱作視訊解碼器件或視訊解碼裝置。源器件12及目的地器件14可為視訊寫碼器件或視訊寫碼裝置之實例。 源器件12及目的地器件14可包含廣泛範圍之器件,包括桌上型電腦、行動計算器件、筆記型(例如,膝上型)電腦、平板電腦、機上盒、諸如所謂的「智慧型」電話之手持電話、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台、車載電腦或其類似者。 目的地器件14可經由頻道16自源器件12接收經編碼視訊資料。頻道16可包含能夠將經編碼視訊資料自源器件12移動至目的地器件14之一或多個媒體或器件。在一項實例中,頻道16可包含使源器件12能夠即時地將經編碼視訊資料直接傳輸至目的地器件14之一或多個通信媒體。在此實例中,源器件12可根據通信標準(諸如,無線通信協定)調變經編碼視訊資料,且可將經調變視訊資料傳輸至目的地器件14。一或多個通信媒體可包括無線及/或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。一或多個通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或全球網路(例如,網際網路))的部分。一或多個通信媒體可包括路由器、交換器、基地台,或促進自源器件12至目的地器件14之通信的其他設備。 在另一實例中,頻道16可包括儲存由源器件12所產生之經編碼視訊資料的儲存媒體。在此實例中,目的地器件14可經由磁碟存取或卡存取而存取儲存媒體。儲存媒體可包括多種本端存取之資料儲存媒體。資料儲存媒體之實例包括短期記憶體、藍光光碟、DVD、CD-ROM、快閃記憶體或用於儲存經編碼視訊資料之其他合適的數位儲存媒體。 在另一實例中,頻道16可包括儲存由源器件12產生之經編碼視訊資料的檔案伺服器或另一中間儲存器件。在此實例中,目的地器件14可經由串流或下載而存取儲存於檔案伺服器或其他中間儲存器件處之經編碼視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將經編碼視訊資料傳輸至目的地器件14之類型的伺服器。實例檔案伺服器包括網頁伺服器(例如,用於網站)、檔案傳送協定(FTP)伺服器、網路附接儲存(NAS)器件及本端磁碟機。 目的地器件14可經由諸如網際網路連接之標準資料連接存取經編碼視訊資料。資料連接之實例類型可包括適合用於存取儲存於檔案伺服器上之經編碼視訊資料的無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、電纜數據機等)或兩者之組合。經編碼視訊資料自檔案伺服器的傳輸可為串流傳輸、下載傳輸或兩者的組合。 本發明之技術不限於無線應用或設定。該等技術可應用於支援多種多媒體應用(諸如,(例如)經由網際網路之空中電視廣播、有線電視傳輸、衛星電視傳輸、串流視訊傳輸)之視訊寫碼、供儲存於資料儲存媒體上之數位視訊的編碼、儲存於資料儲存媒體上之數位視訊的解碼,或其他應用。在一些實例中,視訊寫碼系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。 圖1中所說明之視訊寫碼系統10僅為實例,且本發明之技術可應用於未必包括編碼器件與解碼器件之間的任何資料通信之視訊寫碼設定(例如,視訊編碼或視訊解碼)。在其他實例中,資料係自本端記憶體擷取,經由網路串流傳輸,或類似者。視訊編碼器件可編碼資料且將資料儲存至記憶體,及/或視訊解碼器件可自記憶體擷取資料並解碼資料。在許多實例中,由彼此不通信但簡單地將資料編碼至記憶體及/或自記憶體擷取且解碼資料之器件來執行編碼及解碼。 在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。在一些實例中,輸出介面22可包括調變器/解調器(數據機)及/或傳輸器。視訊源18可包括例如視訊攝影機之視訊俘獲器件,含有先前所俘獲之視訊資料的視訊封存檔、用以自視訊內容提供者接收視訊資料的視訊饋入介面,及/或用於產生視訊資料之電腦圖形系統,或視訊資料之此等源的組合。 視訊編碼器20可編碼來自視訊源18之視訊資料。在一些實例中,源器件12經由輸出介面22將經編碼視訊資料直接傳輸至目的地器件14。在其他實例中,經編碼視訊資料亦可儲存至儲存媒體上或檔案伺服器上,以供目的地器件14稍後存取以用於解碼及/或播放。 在圖1之實例中,目的地器件14包括輸入介面28、視訊解碼器30及顯示器件32。在一些實例中,輸入介面28包括接收器及/或數據機。輸入介面28可經由頻道16接收經編碼視訊資料。舉例而言,輸入介面28可獲得儲存位元流(諸如多層位元流)之檔案。顯示器件32可與目的地器件14整合或可在目的地器件14外部。大體而言,顯示器件32顯示經解碼視訊資料。顯示器件32可包含多種顯示器件,諸如液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。 本發明可大體上指視訊編碼器20將某一資訊「信令」或「傳輸」至另一器件,諸如視訊解碼器30。術語「信令」或「傳輸」可大體上指用以解碼經壓縮視訊資料之語法元素及/或其他資料的通信。此通信可即時地或接近即時地發生。替代地,此通信可在一時間跨度內發生,諸如此通信可能在編碼時在經編碼位元流中將語法元素儲存至電腦可讀儲存媒體時發生,接著,在儲存至此媒體之後可由解碼器件在任何時間擷取該等語法元素。因此,儘管視訊解碼器30可被稱作「接收」某些資訊,但資訊之接收未必即時或接近即時地發生且可在儲存之後在某一時間處自媒體擷取。 視訊編碼器20及視訊解碼器30各自可實施為多種合適電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、硬體或其任何組合。若在軟體中部分地實施技術,則器件可將用於軟體之指令儲存於合適的非暫時性電腦可讀儲存媒體中,且可在硬體中使用一或多個處理器來執行該等指令以執行本發明之技術。可將前述各者(包括硬體、軟體、硬體與軟體之組合等)中之任一者視為一或多個處理器。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,編碼器或解碼器中之任一者可整合為各別器件中的組合式編碼器/解碼器(編解碼器)之部分。 在一些實例中,視訊編碼器20及視訊解碼器30根據視訊壓縮標準(諸如上文所提及且在HEVC標準中描述的HEVC標準)操作。除基礎HEVC標準之外,存在持續努力產生用於HEVC之可調式視訊寫碼、多視圖視訊寫碼及3D寫碼擴展。在一些實例中,本發明中所描述之技術可應用於經組態以根據其他視訊寫碼標準操作之編碼器及解碼器。 在HEVC及其他視訊寫碼標準中,視訊序列通常包括一系列圖像。圖像亦可被稱作「圖框」。圖像可包括表示為SL , SCb 及SCr 的三個樣本陣列。SL 為明度樣本之二維陣列(亦即,區塊)。SCb 為Cb色訊(chrominance)樣本之二維陣列。SCr 為Cr色訊樣本之二維陣列。色訊樣本在本文中亦可被稱作「色度」樣本。在其他情況下,圖像可為單色的,且可僅包括明度樣本之陣列。 為產生圖像之經編碼表示,視訊編碼器20可產生寫碼樹型單元(CTU)之集合。CTU中之每一者可為明度樣本之寫碼樹型區塊、色度樣本之兩個對應寫碼樹型區塊及用以對寫碼樹型區塊之樣本進行寫碼的語法結構。寫碼樹型區塊可為樣本之N×N區塊。CTU亦可被稱作「樹型區塊」或「最大寫碼單元」(LCU)。HEVC之CTU可廣泛地類似於諸如H.264/AVC的其他標準之巨集區塊。然而,CTU未必限於特定大小,且可包括一或多個寫碼單元(CU)。圖塊可包括在光柵掃描中連續排序之整數數目個CTU。經寫碼圖塊可包含圖塊標頭及圖塊資料。圖塊之圖塊標頭可為包括提供關於圖塊之資訊之語法元素的語法結構。圖塊資料可包括圖塊之經寫碼CTU。 本發明可使用術語「視訊單元」或「視訊區塊」或「區塊」以指代一或多個樣本區塊及用以寫碼樣本之一或多個區塊之樣本的語法結構。視訊單元或區塊之實例類型可包括CTU、CU、PU、變換單元(TU)、巨集區塊、巨集區塊分區等等。在一些情形中,PU之論述可與巨集區塊或巨集區塊分區之論述互換。 為產生經寫碼CTU,視訊編碼器20可對CTU之寫碼樹型區塊遞迴地執行四分樹分割,以將寫碼樹型區塊劃分成寫碼區塊,因此命名為「寫碼樹型單元」。寫碼區塊為樣本之N×N區塊。CU可為圖像的明度樣本之寫碼區塊及色度樣本之兩個對應寫碼區塊,該圖像具有明度樣本陣列、Cb樣本陣列及Cr樣本陣列,及用以對寫碼區塊之樣本進行寫碼的語法結構。視訊編碼器20可將CU之寫碼區塊分割成一或多個預測區塊。預測區塊可為應用相同預測的樣本之矩形(亦即,正方形或非正方形)區塊。CU之預測單元(PU)可為圖像之明度樣本之預測區塊、色度樣本之兩個對應預測區塊及用以對預測區塊樣本進行預測之語法結構。視訊編碼器20可針對CU之每一PU的明度、Cb及Cr預測區塊產生預測性明度、Cb及Cr區塊。 視訊編碼器20可使用框內預測或框間預測以產生PU之預測性區塊。若視訊編碼器20使用框內預測以產生PU之預測性區塊,則視訊編碼器20可基於與PU相關聯之圖像之經解碼樣本而產生PU之預測性區塊。 若視訊編碼器20使用框間預測以產生PU之預測性區塊,則視訊編碼器20可基於除與PU相關聯之圖像之外的一或多個圖像之經解碼樣本而產生PU之預測性區塊。視訊編碼器20可使用單向預測或雙向預測以產生PU之預測性區塊。當視訊編碼器20使用單向預測以產生PU之預測性區塊時,PU可具有單一運動向量(MV)。當視訊編碼器20使用雙向預測以產生PU之預測性區塊時,PU可具有兩個MV。 在視訊編碼器20產生CU之一或多個PU的預測性區塊(例如,預測性明度、Cb及Cr區塊)之後,視訊編碼器20可產生CU之殘餘區塊。CU之殘餘區塊中之每一樣本可指示CU之PU之預測性區塊中的樣本與CU之寫碼區塊中的對應樣本之間的差異。舉例而言,視訊編碼器20可產生CU之明度殘餘區塊。CU之明度殘餘區塊中的每一樣本指示CU之預測性明度區塊中之一者中的明度樣本與CU之原始明度寫碼區塊中的對應樣本之間的差異。另外,視訊編碼器20可產生CU之Cb殘餘區塊。CU之Cb殘餘區塊中之每一樣本可指示CU之預測性Cb區塊中之中一者中的Cb樣本與CU之原始Cb寫碼區塊中之對應樣本之間的差異。視訊編碼器20亦可產生CU之Cr殘餘區塊。CU之Cr殘餘區塊中之每一樣本可指示CU之預測性Cr區塊中之一者中的Cr樣本與CU之原始Cr寫碼區塊中之對應樣本之間的差異。 此外,視訊編碼器20可使用四分樹分割將CU之殘餘區塊(例如,明度、Cb及Cr殘餘區塊)分割成一或多個變換區塊(例如,明度、Cb及Cr變換區塊)。變換區塊可為其上應用相同變換的樣本之矩形區塊。CU之變換單元(TU)可為明度樣本之變換區塊、色度樣本之兩個對應變換區塊及用以對經變換區塊樣本進行變換之語法結構。因此,CU之每一TU可與明度變換區塊、Cb變換區塊及Cr變換區塊相關聯。與TU相關聯之明度變換區塊可為CU之明度殘餘區塊之子區塊。Cb變換區塊可為CU之Cb殘餘區塊之子區塊。Cr變換區塊可為CU之Cr殘餘區塊之子區塊。 視訊編碼器20可將一或多個變換應用至變換區塊以產生TU之係數區塊。係數區塊可為變換係數之二維陣列。變換係數可為純量。舉例而言,視訊編碼器20可將一或多個變換應用至TU之明度變換區塊,以產生TU之明度係數區塊。視訊編碼器20可將一或多個變換應用至TU之Cb變換區塊,以產生TU之Cb係數區塊。視訊編碼器20可將一或多個變換應用至TU之Cr變換區塊,以產生TU之Cr係數區塊。 在產生係數區塊(例如,明度係數區塊、Cb係數區塊或Cr係數區塊)之後,視訊編碼器20可量化係數區塊。量化通常係指變換係數經量化以可能減少用以表示變換係數的資料之量從而提供進一步壓縮之程序。在視訊編碼器20量化係數區塊之後,視訊編碼器20可對指示經量化之變換係數之語法元素進行熵編碼。舉例而言,視訊編碼器20可對指示經量化變換係數之語法元素執行上下文自適應性二進位算術寫碼(CABAC)。視訊編碼器20可在位元流中輸出經熵編碼之語法元素。位元流亦可包括未經熵編碼之語法元素。 視訊編碼器20可輸出包括經熵編碼之語法元素的位元流。位元流可包括形成經寫碼圖像及相關聯資料之表示的位元之序列。位元流可包含網路抽象層(NAL)單元的序列。NAL單元中之每一者包括NAL單元標頭,且囊封原始位元組序列酬載(RBSP)。NAL單元標頭可包括指示NAL單元類型碼之語法元素。由NAL單元之NAL單元標頭指定的NAL單元類型碼指示NAL單元之類型。RBSP可為含有囊封在NAL單元內之整數數目個位元組的語法結構。在一些情況下,RBSP包括零個位元。 不同類型之NAL單元可囊封不同類型之RBSP。舉例而言,第一類型之NAL單元可囊封圖像參數集(PPS)之RBSP,第二類型之NAL單元可囊封經寫碼圖塊之RBSP,第三類型之NAL單元可囊封補充增強資訊(SEI)之RBSP,等等。囊封視訊寫碼資料之RBSP (如與參數集及SEI訊息之RBSP相反)的NAL單元可被稱作視訊寫碼層(VCL) NAL單元。 視訊解碼器30可接收由視訊編碼器20產生之位元流。另外,視訊解碼器30可自位元流獲得語法元素。舉例而言,視訊解碼器30可剖析位元流以解碼來自位元流之語法元素。視訊解碼器30可至少部分地基於自位元流獲得(例如,解碼)之語法元素來重建構視訊資料之圖像。重建構視訊資料之程序可大體上與由視訊編碼器20執行之程序互逆。舉例而言,視訊解碼器30可使用PU之運動向量來判定用於當前CU之PU的預測性樣本塊(亦即,預測性區塊)。另外,視訊解碼器30可逆量化與當前CU之TU相關聯的變換係數區塊。視訊解碼器30可對變換係數區塊執行逆變換以重建構與當前CU之TU相關聯的變換區塊。視訊解碼器30可藉由將當前CU之PU的預測性樣本區塊之樣本添加至當前CU之TU的變換區塊之對應樣本來重建構當前CU之寫碼區塊。藉由重建構圖像之每一CU的寫碼區塊,視訊解碼器30可重建構圖像。 在HEVC中,每一NAL單元包括指示NAL單元之NAL單元類型之語法元素(例如nal_unit_type)。此外,在HEVC中,視訊解碼器30可基於NAL單元之NAL單元類型識別與複數個圖像類型中之一者相關聯之NAL單元。此等圖像類型可包括瞬時解碼再新(IDR)圖像、清潔隨機存取(CRA)圖像、時間子層存取(TSA)圖像、斷鏈存取(BLA)圖像及不為IDR、CRA或TSA圖像之經寫碼圖像。 HEVC及其他視訊寫碼標準提供用於實現至位元流之隨機存取之機制。隨機存取係指自位元流中之非第一經寫碼圖像之經寫碼圖像開始解碼位元流。在諸如廣播及串流之各種視訊應用中可能需要對位元流之隨機存取。對位元流之隨機存取可使得使用者能夠在任何時間調入至程式中,在不同頻道之間切換,跳轉至視訊之特定部分,或切換至不同位元流以用於串流調適(例如位元速率之調適、圖框率之調適、空間解析度之調適等)。將框內隨機存取點(IRAP)圖像以規律的間隔插入至位元流中可實現隨機存取。IRAP圖像之實例類型包括IDR圖像、CRA圖像及BLA圖像。因此,IDR圖像、CRA圖像及BLA圖像共同地被稱作隨機存取點(IRAP)圖像。 IDR圖像僅含有I個圖塊(亦即,僅使用框內預測之圖塊)。IDR圖像可為按解碼次序在位元流中之第一圖像,或可稍後出現在位元流中。每一IDR圖像為CVS之按解碼次序之第一圖像。如HEVC及H.264/AVC中指定之IDR圖像可用於隨機存取。然而,按解碼次序在IDR圖像之後的圖像不能使用在IDR圖像之前解碼的圖像作為參考。因此,依賴於IDR圖像用於隨機存取之位元流與使用額外類型之隨機存取圖像的位元流相比可具有顯著較低的寫碼效率。IDR存取單元為含有IDR圖像之存取單元。 IDR圖像可使解碼程序將所有參考圖像標記為「未用於參考」。由於標記為「未用於參考」之參考圖像可自儲存參考圖像之經解碼圖像緩衝器(DPB)移除,所以IDR圖像可清除DPB。按解碼次序在IDR圖像之後的所有經寫碼圖像可經解碼而無需自按解碼次序先於IDR圖像的任何圖像之框間預測。每一經寫碼視訊序列之按解碼次序的第一圖像為IDR圖像或BLA圖像,或亦為位元流之第一圖像的CRA圖像。當存取單元之經寫碼圖像為IDR圖像時,存取單元可被稱作IDR存取單元。在一些實例中,經寫碼視訊序列為存取單元之序列,該序列包括或按解碼次序由以下各者組成:IDR存取單元,接著係並非NoRaslOutputFlag 等於1之IRAP存取單元之零個或多個存取單元,包括所有後續存取單元,直至但不包括任何後續IDR存取單元。 理想地,以此方式之頻道切換及跳轉應以最小量之延遲進行。可藉由在視訊位元流中以規律的間隔包括隨機存取圖像來實現頻道切換及跳轉。IDR圖像可用於H.264/AVC及HEVC兩者中作為隨機存取圖像。換言之,在H.264/AVC及HEVC兩者中指定之IDR圖像可用於隨機存取。然而,因為IDR圖像開始經寫碼視訊序列且可始終清理DPB,所以按解碼次序在IDR圖像之後的圖像不能將按解碼次序在IDR圖像之前解碼的圖像用於參考。因此,依賴於IDR圖像用於隨機存取之位元流可具有顯著較低的寫碼效率(例如,低6%之寫碼效率)。為改良寫碼效率,HEVC中之CRA圖像可允許按解碼次序在CRA圖像之後但按輸出次序在CRA圖像之前的圖像將在CRA之前解碼之圖像用於參考。 CRA及TSA圖像類型在HEVC中為新的且不可用於H.264/AVC規範中。CRA圖像類型促進自視訊序列之中間之任何隨機存取點(RAP)開始之解碼。將CRA圖像插入視訊序列可比將IDR圖像插入至同一視訊序列中更有效。在HEVC中,自CRA圖像開始之位元流可為協調式位元流。亦即,以CRA圖像開始之位元流之部分可符合HEVC規範。TSA圖像可用以指示有效時間子層切換點。 CRA圖像允許按解碼次序在CRA圖像之後但按輸出次序在CRA圖像之前的圖像將在CRA之前解碼之圖像用於參考。按解碼次序在CRA圖像之後但按輸出次序在CRA圖像之前的圖像被稱作與CRA圖像相關聯之前置圖像(或CRA圖像之前置圖像)。亦即,為了改良寫碼效率,在HEVC中引入CRA圖像以允許按解碼次序在CRA圖像之後但按輸出次序在CRA圖像之前的圖像將在CRA圖像前解碼的圖像用於參考。CRA存取單元為其中經寫碼圖像為CRA圖像之存取單元。 若解碼自IDR圖像或按解碼次序在該CRA圖像前出現之CRA圖像開始,則CRA圖像之前置圖像可正確地解碼。然而,當發生自CRA圖像的隨機存取時,CRA圖像之前置圖像可能不可解碼。因此,視訊解碼器在隨機存取解碼期間通常解碼CRA圖像之前置圖像。為防止自取決於解碼開始處而可能不可用之參考圖像的誤差傳播,按解碼次序及輸出次序兩者在CRA圖像之後的圖像無一者可將按解碼次序或輸出次序在CRA圖像之前的任何圖像(其包括前置圖像)用於參考。 在引入CRA圖像之後,在HEVC中引入斷鏈存取(BLA)圖像,且斷鏈存取(BLA)圖像係基於CRA圖像之概念。BLA圖像通常源自在CRA圖像之位置處拼接的位元流,且在該拼接之位元流中,將拼接點CRA圖像改變至BLA圖像。含有RAP圖像之存取單元在本文中可被稱作RAP存取單元。BLA存取單元為含有一BLA圖像之存取單元。 BLA圖像與CRA圖像之間的一個差異如下。對於CRA圖像,若解碼開始於按解碼次序在CRA圖像前之RAP圖像,則相關聯之前置圖像可正確地解碼。然而,當發生自CRA圖像之隨機存取時(亦即,當解碼自該CRA圖像開始時,或換言之,當該CRA圖像為位元流中之第一圖像時),與CRA圖像相關聯之前置圖像可能不正確地解碼。相比之下,可能不存在與BLA圖像相關聯之前置圖像可解碼之情形,甚至當解碼自按解碼次序在BLA圖像前之RAP圖像開始時。 與特定CRA圖像或特定BLA圖像相關聯的前置圖像中之一些可正確地解碼,甚至當該特定CRA圖像或該特定BLA圖像為位元流中之第一圖像時。此等前置圖像可被稱作可解碼前置圖像(DLP)。其他前置圖像可被稱作不可解碼前置圖像(NLP)。NLP亦可被稱作標示為丟棄(tagged for discard; TFD)圖像。 如上文所描述,本發明中所描述之實例技術係關於媒體檔案格式及基於其衍生之檔案格式。在圖1之實例中,源器件12、目的地器件14及/或頻道16可包括一或多個檔案處理單元34。一或多個處理電路可經組態以執行一或多個檔案處理單元34之功能性。檔案處理單元34可為後處理實體之實例。後處理實體可包括媒體感知網路元件(MANE)、DASH感知網路元件(DANE)、伺服器計算器件、個人計算器件、專用計算器件、商業計算器件、或另一類型之計算器件。後處理實體可為內容遞送網路之一部分。在一些實例中,後處理實體可在源器件12之外部。舉例而言,輸出介面22可輸出至產生如本發明中所描述的檔案格式之後處理實體且將所產生的檔案儲存於如上文所描述之儲存器件或伺服器中。為易於理解,本發明將檔案描述為自此後處理實體所產生。 舉例而言,在圖1之實例中,檔案處理單元34包括檔案產生單元36,其產生囊封由視訊編碼器20產生的位元流或囊封該位元流之部分的一或多個檔案。檔案產生單元36可產生根據本發明之技術的檔案。在一些實例中,檔案產生單元36實施於源器件12中。在此等實例中,檔案產生單元36在概念上可出現於源器件12中之視訊編碼器20與輸出介面22之間。在其他實例中,檔案產生單元36實施於諸如MANE之一或多個其他器件中。在一些實例中,檔案產生單元36為後處理實體之實例。在後處理實體在視訊編碼器20之外部的實例中,後處理實體可為源器件12上之單獨、獨特的單元,或可為輸出介面22之一部分。 此外,檔案處理單元34可包括自檔案提取位元流或其部分之檔案提取單元38。在一些實例中,目的地器件14實施檔案提取單元38。在此等實例中,檔案提取單元38在概念上可出現於目的地器件14中之輸入介面28與視訊解碼器30之間。在其他實例中,一或多個其他器件可實施檔案提取單元38。視訊解碼器30可解碼由檔案提取單元38自檔案提取之位元流。另外,在一些實例中,檔案處理單元34中之一或多者選擇性轉遞含有足夠經編碼視訊資料之檔案之部分以使視訊解碼器30能夠自位元流中之點(除位元流之起點之外)開始解碼視訊資料。 以下為檔案格式及檔案格式標準之進一步描述。檔案格式標準包括ISO基礎媒體檔案格式(ISOBMFF,ISO/IEC 14496-12),及自ISOBMFF衍生之其他格式,包括MPEG-4檔案格式(ISO/IEC 14496-15)、3GPP檔案格式(3GPP TS 26.244)及AVC檔案格式(ISO/IEC 14496-15)。 將ISOBMFF用作用於許多編解碼器囊封格式(諸如,AVC檔案格式)以及用於許多多媒體容器格式(諸如,MPEG-4檔案格式、3GPP檔案格式(3GP)及DVB檔案格式)之基礎。除諸如音訊及視訊之連續媒體之外,諸如影像之靜態媒體以及後設資料可儲存於符合ISOBMFF之檔案中。根據ISOBMFF結構化之檔案可用於許多用途,包括本端媒體檔案播放、遠端檔案之逐步下載、用於經由HTTP之動態自適應串流(DASH)之區段、用於待串流之內容及其封包化指令之容器及接收之即時媒體串流的記錄。 邏輯框可為ISOBMFF中之基本語法結構,包括四字元寫碼邏輯框類型、邏輯框之位元組計數及酬載。ISOBMFF檔案包括或由一序列之邏輯框組成,且邏輯框可含有其他邏輯框。電影邏輯框(「moov」)含有用於存在於檔案中之連續媒體串流之後設資料。可將媒體串流中之每一者在檔案中表示為播放軌。將用於播放軌之後設資料圍封於播放軌邏輯框(「trak」)中,而將播放軌之媒體內容圍封於媒體資料邏輯框(「mdat」)中或直接圍封於單獨檔案中。用於播放軌之媒體內容可包含或由一序列之樣本組成,諸如音訊或視訊存取單元。 ISOBMFF指定以下類型之播放軌:媒體播放軌,其含有基本媒體串流;提示播放軌,其包括媒體傳輸指令或表示接收之封包串流;及計時後設資料播放軌,其包含時間同步之後設資料。儘管原先針對儲存而設計,但已證明ISOBMFF用於串流傳輸(例如,用於逐步下載或DASH)極有價值。為了串流目的,可使用在ISOBMFF中定義之電影片段。 用於每一播放軌之後設資料包括樣本描述項之清單,每一項提供在播放軌中使用之寫碼或囊封格式及處理彼格式需要之初始化資料。播放軌之每一樣本與播放軌之樣本描述項中之一者相關聯。 ISOBMFF實現藉由各種機構指定樣本特有的後設資料。舉例而言,播放軌邏輯框包括樣本表(『stbl』)邏輯框。播放軌之樣本表邏輯框含有樣本表,該樣本表可含有播放軌之媒體樣本之所有時間及資料索引。樣本表包括用於播放軌之特定樣本的樣本輸入項。因此,當器件(諸如實施檔案處理單元34中之一者的器件)正在處理樣本(例如準備解碼樣本之經編碼圖像、轉遞樣本、提取樣本等)時,器件可能夠回顧樣本表邏輯框中之樣本輸入項以判定如何處理樣本。 更具體而言,樣本表邏輯框可包括樣本描述(『stbl』)邏輯框。樣本描述邏輯框可包括關於所使用的寫碼類型之詳細資訊及該解碼所需的任何初始化資訊。為實現此目標,樣本描述邏輯框包括樣本輸入項邏輯框(亦即,樣本輸入項)之集合。以下程式碼定義ISOBMFF中之邏輯框之樣本輸入項及樣本描述邏輯框類。 aligned(8) abstract class SampleEntry (unsigned int(32) format) extends Box(format){ const unsigned int(8)[6] reserved = 0; unsigned int(16) data_reference_index; } aligned(8) class SampleDescriptionBox (unsigned int(32) handler_type) extends FullBox('stsd', version, 0){ int i ; unsigned int(32) entry_count; for (i = 1 ; i <= entry_count ; i++){ SampleEntry(); // an instance of a class derived from SampleEntry } } 在ISOBMFF中,樣本輸入項類為經擴展用於特定媒體類型之抽象類。舉例而言,VisualSampleEntry類擴展SampleEntry類且含有視訊資料之資訊。類似地,AudioSampleEntry類擴展SampleEntry類且含有用於音訊資料之資訊。以下程式碼定義ISOBMFF中之VisualSampleEntry類。 class VisualSampleEntry(codingname) extends SampleEntry (codingname){ unsigned int(16) pre_defined = 0; const unsigned int(16) reserved = 0; unsigned int(32)[3] pre_defined = 0; unsigned int(16) width; unsigned int(16) height; template unsigned int(32) horizresolution = 0x00480000; // 72 dpi template unsigned int(32) vertresolution = 0x00480000; // 72 dpi const unsigned int(32) reserved = 0; template unsigned int(16) frame_count = 1; string[32] compressorname; template unsigned int(16) depth = 0x0018; int(16) pre_defined = -1; // other boxes from derived specifications CleanApertureBox clap; // optional PixelAspectRatioBox pasp; // optional } 此外,VisualSampleEntry類可經擴展用於更加特定之用途,諸如定義用於特定編解碼器之資料。舉例而言,以下程式碼定義擴展VisualSampleEntry類且含有特定於HEVC的資訊之HEVCSampleEntry類。 樣本表邏輯框亦可包括樣本至塊邏輯框(「stsc」)。樣本至塊邏輯框將媒體資料內之樣本分成塊。更具體而言,樣本至塊邏輯框包括輸入項之集合。每一輸入項給出具有相同特徵的塊之游程之第一塊之索引。特定而言,樣本至塊邏輯框包括樣本描述索引(例如sample_description_index)。樣本描述索引為給出描述此塊中之樣本的樣本輸入項之索引之整數。因此,樣本至塊邏輯框可使器件能夠判定哪個樣本輸入項與樣本相關聯。因為樣本描述索引為對樣本輸入項之索引,所以樣本描述索引亦可被稱作「樣本輸入項索引」。 此外,樣本表邏輯框(「stbl」)內之特定邏輯框已經標準化以回應常見需求。舉例而言,同步樣本邏輯框(「stss」)係用以列舉播放軌之隨機存取樣本。樣本分組機制實現根據四字元分組類型將樣本映射成共用指定為檔案中之樣本群組描述項之同一特性的樣本之群組。已在ISOBMFF中指定若干分組類型。 ISOBMFF規格指定適用於DASH之六種類型串流存取點(SAP)。前兩種SAP類型(類型1及2)對應於H.264/AVC及HEVC中之IDR (瞬時解碼器再新)圖像。第三SAP類型(類型3)對應於HEVC中之開放式GOP隨機存取點、BLA(斷鏈存取)或CRA(清潔隨機存取)圖像。第四SAP類型(類型4)對應於GDR隨機存取點。 此外,為便於隨機存取,「Information technology - Coding of audio-visual objects - 第15部分:Carriage of network abstraction layer (NAL) unit structure video in the ISO base media file format」,ISO/IEC FDIS 14496-15:2014(E),文件N15479,(以下稱作N15479),其為最新的草案L-HEVC檔案格式,規定適用於樣本之樣本輸入項包括解碼IRAP圖像所需之參數集或樣本自身包括該參數集。特定而言,(N15479中之)最新的草案L-HEVC檔案格式藉由圍封於標記<emphasis>及</emphasis>中之強調部分在條款9.7.3.1.1中如下指定對參數集之限制: 當樣本輸入項名稱作『lhe1』時,以下各者適用: · 若樣本含有至少一個如ISO/IEC 23008-2中所定義之IRAP圖像,則解碼<emphasis>在含有樣本</emphasis>中之IRAP圖像之每一層中之IRAP圖像及按解碼次序接下來的圖像所需之每一參數集應包括於<emphasis>攜載存在於此樣本</emphasis>中之層的播放軌之樣本輸入項抑或包括於該樣本自身中(可能藉由使用提取器)。 · 否則(樣本不含有IRAP圖像),則解碼該樣本所需之每一參數集應包括於<emphasis>攜載存在於此樣本中之層的播放軌之樣本輸入項</emphasis>抑或包括於自含有至少一個IRAP圖像之前述樣本至該樣本自身之樣本中之任一者中(可能藉由使用提取器),包括在內。 限制之目的係實現自任何IRAP (框內隨機存取圖像)圖像隨機存取層而不需要自較早存取單元搜尋及提取參數集。然而,至少存在關於上述限制之以下問題。第一,不明確哪些圖像確切為「IRAP圖像」。意圖似乎為「樣本中之IRAP圖像」。第二,在第一標題符號項目中包括「及在含有樣本中之IRAP圖像之每一層中之按解碼次序在接下來的圖像」並非必要的,且可未必不允許將此等圖像中之任一者所需要的參數集作為存取單元自身之部分或新的樣本輸入項。限制本質上需要所有參數集在第一樣本中抑或在適用於該等第一樣本之樣本輸入項中。第三,措辭「攜載存在於此樣本中之層的播放軌之樣本輸入項」(在兩個標題符號項目中)暗示本文中之樣本之範疇為整個L-HEVC位元流之整個存取單元,而不僅為播放軌內之子集合。此與條款9.6.1中之樣本定義不一致。第四,以上措辭自身不明確,因為每一播放軌可含有多個樣本輸入項,所以要求應明確地指定此類播放軌之相關樣本輸入項,而非任何樣本輸入項。舉例而言,對於含有所討論之當前樣本的播放軌,相關樣本輸入項為適用於當前樣本之樣本輸入項,而非任何其他樣本輸入項。 以下描述根據本發明之實例技術。該等技術可單獨地或一起應用。對於當前播放軌(亦即,含有所討論之當前樣本之播放軌),可直接將相關樣本輸入項指定為適用於當前樣本之樣本輸入項。對於所涉及之另一播放軌(其例如含有當前播放軌中之層之參考層),一個直接方法為將相關樣本輸入項指定為適用於該另一播放軌中之依時共置的樣本之樣本輸入項(亦即,與當前樣本具有相同解碼時間)。然而,可能在該另一播放軌中不存在此依時共置的樣本。因此,此方法可不(但可能)對於此等情形始終起作用。用於特定播放軌中之特定樣本之依時共置的樣本可經定義為除各別播放軌之外的播放軌中之樣本且與該特定樣本具有相同解碼時間。 為解決此問題,一種實例技術係如下定義依時共置的樣本輸入項之概念。對於攜載同一L-HEVC位元流之不同部分的任何兩個播放軌,可需要兩個播放軌中之樣本輸入項依時對準,亦即,若第一播放軌中之樣本輸入項sampleEntryA適用於解碼時間在T1至T2 (包括在內)之範圍中的第一播放軌中之所有樣本,則解碼時間在相同範圍中之第二播放軌中之所有樣本係指第二播放軌中之一個樣本輸入項sampleEntryB。因此,sampleEntryA及sampleEntryB為依時共置的樣本輸入項。由此,相關樣本輸入項可經指定為該另一播放軌中之依時共置的樣本輸入項。為進一步簡化,可進一步需要所有依時共置的樣本輸入項使用相同之樣本輸入項索引值(亦即,sample_description_index)。此等兩個要求可藉由下者共同地表達:要求在攜載L-HEVC位元流之所有播放軌內,具有相同解碼時間之所有樣本應與相同樣本輸入項索引值相關聯。 因此,為解決部分或所有上列問題,對參數集之限制經提議如下改變: 當樣本輸入項名稱為『lhe1』時,以下各者適用: · 在攜載L-HEVC位元流之所有播放軌內,具有相同解碼時間之所有樣本將與相同樣本輸入項索引值相關聯(亦即,sample_description_index)。對於特定播放軌中之任何特定樣本,另一播放軌中之依時共置的樣本輸入項為與此特定播放軌中之樣本輸入項具有相同樣本輸入項索引之樣本輸入項且適用於此特定樣本,另一播放軌中之依時共置的樣本為與此特定樣本具有相同解碼時間之樣本。 · 對於包含於層中及播放軌之樣本中之IRAP圖像,解碼IRAP圖像所需的每一參數集應包括於以下中之一者中: a. 此播放軌之樣本輸入項且適用於此樣本 b. 攜載此層之參考層的播放軌之依時共置的樣本輸入項 c. 此樣本自身,可能藉由使用提取器 d. 當存在時,攜載此層之參考層的播放軌中之此樣本之依時共置的樣本中之任一者,可能藉由使用提取器 · 對於層中及播放軌之樣本中所含有之非IRAP圖像,解碼該圖像所需的每一參數集應包括於以下中之一者中: a. 此播放軌之樣本輸入項且適用於此樣本 b. 攜載此層之參考層的播放軌之依時共置的樣本輸入項 c. 自含有此層中之IRAP圖像之前一樣本至此樣本自身(包括在內)之此播放軌中之樣本中之任一者,可能藉由使用提取器 d. 當存在時,自含有此層中之IRAP圖像之前一樣本之依時共置的樣本至此樣本之依時共置的樣本(包括在內)之攜載此層之參考層的播放軌中之樣本中之任一者,可能藉由使用提取器 為易於解釋,本發明可將上述限制稱作「本發明之第一實例限制」。本發明之第一實例限制之替代版本要求在每一操作點所需要的所有播放軌內,具有相同解碼時間之所有樣本應與相同樣本輸入項索引值相關聯(亦即,sample_description_index)。 替代地,對參數集之限制經提議如下改變: 當樣本輸入項名稱為『lhe1』時,以下各者適用: · 在攜載L-HEVC位元流之所有播放軌內,對於特定播放軌中之任何特定樣本,另一播放軌中之依時共置的樣本為與此特定樣本具有相同解碼時間之樣本。 · 對於層中及播放軌之樣本中所含有之IRAP圖像,解碼IRAP圖像所需的每一參數集應包括於以者中之一者中: a. 此播放軌之樣本輸入項且適用於此樣本 b. 攜載此層之參考層的第二播放軌之樣本輸入項,其中樣本輸入項適用於第二播放軌中之依時共置的樣本(當存在時)或,當依時共置的樣本不存在時,適用於第二播放軌中之解碼時間小於但最接近於此樣本之解碼時間的樣本 c. 此樣本自身,可能藉由使用提取器 d. 當存在時,攜載此層之參考層的播放軌中之此樣本之依時共置的樣本中之任一者,可能藉由使用提取器 · 對於層中及播放軌之樣本中所含有之非IRAP圖像,解碼圖像所需要的每一參數集應包括於以下中之一者中: a. 此播放軌之樣本輸入項且適用於此樣本 b. 攜載此層之參考層的第二播放軌之樣本輸入項,其中樣本輸入項適用於第二播放軌中之依時共置的樣本(當存在時)或,當依時共置的樣本不存在時,適用於第二播放軌中之解碼時間小於但最接近於此樣本之解碼時間的樣本 c. 自含有此層中之IRAP圖像之前一樣本至此樣本自身(包括在內)之此播放軌中之樣本中之任一者,可能藉由使用提取器 d. 當存在時,自含有此層中之IRAP圖像之前一樣本至此樣本之依時共置的樣本(包括在內)之攜載此層之參考層的播放軌中之樣本中之任一者,可能藉由使用提取器 為易於解釋,本發明可將上述限制稱作「本發明之第二實例限制」。檔案產生單元36可確保檔案以各種方式符合本發明之第一或第二實例限制。舉例而言,在檔案產生單元36應用本發明之第二實例限制之實例中,檔案產生單元36可判定檔案之當前播放軌之當前樣本中所含有之IRAP圖像是否滿足上列條件(b)、(c)或(d)。在此實例中,回應於判定不滿足條件(b)、(c)及(d),檔案產生單元36可包括解碼當前播放軌中適用於當前樣本的樣本輸入項中之IRAP圖像所需的每一參數集之複本。同樣,檔案產生單元36可判定檔案之當前播放軌之當前樣本中所含有之非IRAP圖像是否滿足上列條件(b)、(c)或(d)。在此實例中,回應於判定不滿足條件(b)、(c)及(d),檔案產生單元36可包括解碼當前播放軌中適用於當前樣本的樣本輸入項中之非IRAP圖像所需的每一參數集之複本。 因此,關於本發明之第二實例限制,對於複數個播放軌中之每一各別播放軌,用於各別播放軌之媒體內容包含各別序列之樣本,且各別播放軌之樣本之相關樣本輸入項為各別播放軌中適用於該樣本的樣本輸入項。此外,對於複數個IRAP圖像中之每一各別IRAP圖像,各別IRAP圖像的層含有各別IRAP圖像且其為多層位元流(例如L-HEVC位元流)之一層,各別IRAP圖像的播放軌含有各別IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別IRAP圖像的播放軌。在此實例中,當各別IRAP圖像之相關樣本輸入項之樣本輸入項名稱具有特定值(諸如『lhe1』)時,限制可適用。在其他實例中,當各別IRAP圖像之相關樣本輸入項之樣本輸入項名稱具有另一值時,限制可適用。限制要求解碼各別IRAP圖像所需的複數個參數集中之每一參數集在以下中之至少一者中: 適用於各別IRAP圖像的樣本之各別IRAP圖像的播放軌之樣本輸入項, 用於各別IRAP圖像的攜載各別IRAP圖像的層之參考層之非對應播放軌之樣本輸入項,用於各別IRAP圖像之該非對應播放軌為除複數個播放軌中之各別IRAP圖像的播放軌以外的播放軌,用於該各別IRAP圖像之非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的非對應播放軌中之依時共置的樣本或,當用於各別IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於該各別IRAP圖像之非對應播放軌中之解碼時間小於但最接近於該各別IRAP圖像之樣本的解碼時間的一樣本, 各別IRAP圖像的樣本,及 複數個播放軌中攜載各別IRAP圖像的層之參考層的播放軌中之各別IRAP圖像的樣本之任何依時共置的樣本。 此外,在以上第二實例限制之描述中,解碼特定IRAP圖像所需的第一參數集可藉由存在於特定IRAP圖像的樣本中之一或多個提取器之第一集合參考。類似地,解碼特定IRAP圖像所需的第二參數集可藉由存在於複數個播放軌中攜載該特定IRAP圖像的層之參考層的播放軌中之該特定IRAP圖像之依時共置的樣本中之一或多個提取器之第二集合參考。 在至少一些實例中,本發明之第二實例限制要求:對於複數個非IRAP圖像中之每一各別非IRAP圖像,各別非IRAP圖像的層含有各別非IRAP圖像且其為多層位元流之一層,各別非IRAP圖像的播放軌含有各別非IRAP圖像的樣本,各別IRAP圖像的樣本含有各別IRAP圖像,且複數個播放軌包括各別非IRAP圖像的播放軌。此外,在一些實例中,當各別非IRAP圖像之相關樣本輸入項之樣本輸入項名稱為『lhe1』時,限制可適用。在其他實例中,當各別非IRAP圖像之相關樣本輸入項之樣本輸入項名稱具有另一值時,限制可適用。在此實例中,限制可進一步要求解碼各別非IRAP圖像所需要的參數集中之每一者在以下中之至少一者中: 各別非IRAP圖像的播放軌之適用於各別非IRAP圖像的樣本之樣本輸入項, 用於各別非IRAP圖像的攜載各別非IRAP圖像的層之參考層之非對應播放軌之樣本輸入項,用於各別非IRAP圖像之該非對應播放軌為除複數個播放軌中之各別非IRAP圖像的播放軌以外的播放軌,用於該各別非IRAP圖像之非對應播放軌之該樣本輸入項適用於該各別非IRAP圖像的非對應播放軌中之依時共置的樣本或,當用於各別非IRAP圖像之非對應播放軌中之依時共置的樣本不存在時,適用於各別非IRAP圖像的非對應播放軌中之解碼時間小於但最接近各別非IRAP圖像之樣本之解碼時間的樣本, 在各別非IRAP圖像的層中之前一含有IRAP圖像的樣本之後及直至各別非IRAP圖像的樣本(包括在內)的各別非IRAP圖像的播放軌之任何樣本,及 該複數個播放軌中攜載各別非IRAP圖像之層之任何參考層的任何播放軌的任何樣本,該任何樣本在各別非IRAP圖像之層中的前一含有IRAP圖像之樣本的依時共置樣本之後及直至各別非IRAP圖像之樣本的依時共置樣本(包括在內)。 此外,在以上第二實例限制之描述中,解碼該特定非IRAP圖像所需的第一參數集可藉由存在於該特定非IRAP圖像的樣本中之一或多個提取器之第一集合參考。類似地,解碼特定非IRAP圖像所需要的第二參數集可藉由存在於複數個播放軌中攜載特定非IRAP圖像的層之參考層的播放軌中之該特定非IRAP圖像之依時共置的樣本中之一或多個提取器之第二集合參考。 能夠依賴於本發明之第一實例限制抑或第二實例限制可增強視訊解碼器30執行隨機存取之能力。舉例而言,視訊解碼器30可需要存取特定參數集以自位元流之起點之後的特定點開始解碼位元流。因此,諸如檔案提取單元38之檔案處理單元可能夠根據條件(c)及條件(d)自檔案之樣本判定特定參數集是否已可供視訊解碼器30使用,或根據條件(a)及條件(b)判定是否使用儲存於樣本輸入項中之特定參數集之複本來具體地將特定參數集中之一或多者提供至視訊解碼器30。 在上述本發明之實例限制中,複數個參數集可包括以下中之至少一者:如ISO/IEC 23008-2中所定義之視訊參數集、如ISO/IEC 23008-2中所定義之序列參數集及如ISO/IEC 23008-2中所定義之圖像參數集。在本發明之其他實例中,以上實例中之「小於」之實例在一些或所有情況下改變為「大於」。替代地或另外,在以上實例中之一些或每一者中,「此層之參考層」之所有實例改變為「此播放軌中攜載之層之參考層」。替代地或另外,在以上實例中之一些或每一者中,「含有此層中之IRAP圖像之前一樣本」之所有實例改變為「在此播放軌中含有層中之IRAP圖像之前一樣本」。 此外,在本發明之一些實例中,用於在特定IRAP圖像處隨機存取層之位元流建構程序係經指定的,包括將來自相關樣本輸入項之參數集放置在位元流之開始處並接著按照NAL單元之解碼時間及遞增次序的層ID將來自播放軌之NAL單元放置於存取單元內,並接著指定解碼任何圖像所需的每一參數集必須在該圖像之前構建的位元流中為可用的。 圖2為說明根據本發明之一或多種技術的檔案300之實例結構之方塊圖。檔案300可由諸如檔案產生單元36 (圖1)之檔案處理單元產生。在圖2之實例中,檔案300包括電影邏輯框302及複數個媒體資料邏輯框304。儘管在圖2之實例中說明為在同一檔案中,但在其他實例中,電影邏輯框302及媒體資料邏輯框304可在單獨的檔案中。如上所指示,邏輯框可為由唯一類型識別符及長度定義之物件導向建構區塊。舉例而言,邏輯框可為ISOBMFF中之基本語法結構,包括四字元經寫碼邏輯框類型、邏輯框之位元組計數及酬載。 電影邏輯框302可含有用於檔案300之播放軌之後設資料。用於檔案300之每一播放軌可包含媒體資料之連續串流。媒體資料邏輯框304中之每一者可包括一或多個樣本305A至305N (統稱作「樣本305」)。此外,在圖2之實例中,電影邏輯框302包括播放軌邏輯框306。播放軌邏輯框306可圍封用於檔案300之播放軌的後設資料。在其他實例中,電影邏輯框302可包括用於檔案300之不同播放軌的多個播放軌邏輯框。播放軌邏輯框306包括媒體邏輯框307。媒體邏輯框307可含有聲明關於播放軌內之媒體資料的資訊之物件。媒體框307包括媒體資訊邏輯框308。媒體資訊邏輯框308可含有聲明播放軌之媒體的特徵資訊之物件。媒體資訊邏輯框308包括樣本表邏輯框309。樣本表邏輯框309可指定樣本特有的後設資料。 樣本表邏輯框309可包括樣本描述邏輯框310。另外,樣本表邏輯框309可包括零個或多個SampleToGroup邏輯框及零個或多個SampleGroupDescription邏輯框。在圖2之實例中,樣本表邏輯框309包括SampleToGroup邏輯框312及SampleGroupDescription邏輯框314。在其他實例中,樣本表邏輯框309可包括除樣本描述邏輯框310、SampleToGroup邏輯框312及SampleGroupDescription邏輯框314之外的其他邏輯框,及/或可包括多個SampleToGroup邏輯框及SampleGroupDescription邏輯框。SampleToGroup邏輯框312可將樣本(例如,樣本305中之特定者)映射至一群樣本。SampleGroupDescription邏輯框314可指定由該群樣本(亦即,樣本群組)中之樣本共用的性質。 樣本描述邏輯框310包含用於播放軌之樣本輸入項316之集合。樣本輸入項316之每一各別樣本輸入項適用於播放軌之一或多個樣本。在圖2之實例中,樣本輸入項316之集合包括樣本輸入項316A。如本發明中其他處所描述,根據本發明之技術,對於層中及播放軌之樣本中所含有之IRAP圖像,解碼IRAP圖像所需的每一參數集可包括於播放軌之樣本輸入項中且適用於此樣本。因此,在圖2之實例中,樣本輸入項316A可包括解碼對應於播放軌邏輯框306的播放軌中所含有之IRAP圖像所需的參數集318。 此外,在本發明中之其他處所描述,根據本發明之技術,對於增強層或其他非基礎層中及播放軌之樣本中所含有之IRAP圖像,解碼IRAP圖像所需的每一參數集可包括於攜載該增強層或其他非基礎層的參考層之第二播放軌之樣本輸入項中,其中樣本輸入項適用於第二播放軌中之依時共置的樣本(當存在時)或,當依時共置的樣本不存在時,適用於第二播放軌中之解碼時間小於但最接近於此樣本之解碼時間的樣本。在圖2之實例中,第一播放軌可包括含有IRAP圖像之特定樣本且播放軌邏輯框306可對應於第二播放軌。在此實例中,若樣本輸入項316A適用於第二播放軌中與第一播放軌中之特定樣本依時共置的樣本,或樣本輸入項316A適用於第二播放軌中之解碼時間之小於但最接近於該特定樣本之解碼時間的樣本,則樣本輸入項316A可包括解碼該特定樣本中之IRAP圖像所需的參數集。 此外,如本發明中其他處所描述,對於層中及播放軌之樣本中所含有之非IRAP圖像,解碼圖像所需的每一參數集可在播放軌之樣本輸入項中且適用於此樣本。因此,在圖2之實例中,假定特定樣本包括非IRAP圖像且樣本輸入項316A與該特定樣本在同一播放軌中且適用於該特定樣本,則樣本輸入項316A可包括解碼非IRAP圖像所需的參數集318。 另外,對於層中及播放播放軌之樣本中所含有之非IRAP圖像,解碼該圖像所需的每一參數集可在攜載此層之參考層的第二播放軌之同一樣本輸入項中,其中該樣本輸入項適用於第二播放軌中之依時共置的樣本(當存在時)或,當依時共置的樣本不存在時,適用於第二播放軌中之解碼時間小於但最接近於此樣本之解碼時間的樣本。在圖2之實例中,第一播放軌可包括含有非IRAP圖像之特定樣本且播放軌邏輯框306可對應於第二播放軌。在此實例中,若樣本輸入項316A適用於第二播放軌中之與第一播放軌中之特定樣本依時共置的樣本,或樣本輸入項316A適用於第二播放軌中之解碼時間小於但最接近於該特定樣本之解碼時間的樣本,則樣本輸入項316A可包括解碼該特定樣本中之非IRAP圖像所需的參數集。 另外,如本發明中其他處所描述,根據本發明之技術,對於層中及播放軌之樣本中所含有之IRAP圖像,解碼IRAP圖像所需的每一參數集可包括於樣本自身中。因此,如圖2之實例所展示,媒體資料邏輯框304中之樣本305A可包括一或多個經編碼圖像320及諸如參數集322之一或多個參數集。此外,如本發明中其他處所描述,對於層中及播放軌之樣本中所含有之IRAP圖像,解碼IRAP圖像所需的每一參數集可包括於攜載此層之參考層的播放軌中之此樣本之依時共置的樣本中。因此,在圖2之實例中,特定樣本包括IRAP圖像,該特定樣本在第一播放軌中,且樣本305A在第二播放軌中。在此實例中,樣本305A可包括解碼所需的參數集,且該特定樣本為樣本305A,且該特定樣本為共置的,且第一播放軌為第二播放軌之參考播放播放軌。 如本發明中其他處所描述,對於層中及播放軌之樣本中所含有之非IRAP圖像,用於解碼該圖像所需的每一參數集可包括於自含有此層中之IRAP圖像的前一樣本至此樣本自身(包括在內)之此播放軌中之樣本之任一者中,可能藉由使用提取器。舉例而言,在圖2之實例中,在含有IRAP圖像之前一樣本之後的含有非IRAP圖像的播放軌之任何樣本(例如樣本305A)可包括解碼非IRAP圖像所需的參數集(例如參數集322)。 此外,如本發明中其他處所描述,對於層中及播放軌之樣本中所含有之非IRAP圖像,解碼該圖像所需的每一參數集(若存在)可包括於攜載此層之參考層的播放軌中之樣本中之任一者中,其係可能藉由使用提取器在含有此層中之IRAP圖像之前一樣本之依時共置的樣本之後至此樣本之依時共置的樣本(包括在內)。因此,在圖2之實例中,對於特定層中及第一播放軌之樣本中所含有之非IRAP圖像,若樣本305A在攜載特定層之參考層之播放軌中且樣本305A在與含有IRAP圖像之特定層之樣本共置的樣本之後,則解碼非IRAP圖像所需的每一參數集可包括於樣本305A中。 圖3為說明根據本發明的一或多種技術的檔案450之實例結構之方塊圖。檔案450可由諸如檔案產生單元36 (圖1)之檔案處理單元產生。在圖3之實例中,檔案450包括一或多個電影片段邏輯框452及複數個媒體資料邏輯框454。儘管在圖3之實例中說明為在同一檔案中,但在其他實例中,電影片段邏輯框452及媒體資料邏輯框454可在單獨的檔案中。媒體資料邏輯框454中之每一者可包括一或多個樣本456A至456N (統稱作「樣本456」)。電影片段邏輯框中之每一者對應於電影片段。每一電影片段可包含播放軌片段之集合。可存在每播放軌零個或多個播放軌片段。 在圖3之實例中,電影片段邏輯框452提供關於對應電影片段之資訊。此資訊將先前已處於諸如電影邏輯框302 (圖2)之電影邏輯框中。電影片段邏輯框452可包括播放軌片段邏輯框458。播放軌片段邏輯框458對應於播放軌片段,且提供關於播放軌片段的資訊。 舉例而言,在圖3之實例中,播放軌片段邏輯框458可包括樣本描述邏輯框460、零個或多個SampleToGroup邏輯框及零個或多個SampleGroupDescription邏輯框。在圖3之實例中,播放軌片段邏輯框458含有一或多個SampleToGroup邏輯框462及含有關於對應於播放軌片段邏輯框458之播放軌片段的資訊之一或多個SampleGroupDescription邏輯框464。樣本描述邏輯框460包含用於播放軌片段之樣本輸入項466之集合。樣本輸入項466之每一各別樣本輸入項適用於播放軌之一或多個樣本。在圖3之實例中,樣本輸入項466之集合包括樣本輸入項466A。如圖3之實例中所展示,樣本輸入項466A可包括參數集468。此外,如圖3之實例中所展示,媒體資料邏輯框454中之樣本456A可包括一或多個經編碼圖像470及諸如參數集472之一或多個參數集。本發明中其他處關於解碼IRAP圖像及非IRAP圖像所需的參數集之位置而描述的限制可對於檔案450中之樣本輸入項466及樣本456適用。 圖4為說明實例視訊編碼器20的方塊圖。出於解釋之目的而提供圖4,且不應將其視為對如本發明中廣泛例示及描述之技術的限制。出於解釋之目的,本發明在HEVC寫碼之上下文中描述視訊編碼器20。然而,本發明之技術可適用於其他寫碼標準或方法。 在圖4之實例中,視訊編碼器20包括視訊資料記憶體98、預測處理單位100、殘餘產生單元102、變換處理單元104、量化單元106、逆量化單元108、逆變換處理單元110、重建構單元112、濾波器單元114、經解碼圖像緩衝器116及熵編碼單元118。預測處理單元100包括框間預測處理單元120及框內預測處理單元126。框間預測處理單元120包括運動估計單元及運動補償單元(未展示)。在其他實例中,視訊編碼器20可包括更多、更少或不同功能組件。 視訊資料記憶體98可儲存待由視訊編碼器20之組件編碼的視訊資料。儲存於視訊資料記憶體98中之視訊資料可(例如)自視訊源18 (圖1)獲得。經解碼圖像緩衝器116可為儲存用於由視訊編碼器20在例如以框內或框間寫碼模式編碼視訊資料時使用之參考視訊資料的參考圖像記憶體。視訊資料記憶體98及經解碼圖像緩衝器116可由多種記憶體器件中之任一者形成,諸如,動態隨機存取記憶體(DRAM) (包括同步DRAM (SDRAM))、磁阻式RAM (MRAM)、電阻式RAM (RRAM)或其他類型之記憶體器件。可由同一記憶體器件或單獨記憶體器件提供視訊資料記憶體98及經解碼圖像緩衝器116。在各種實例中,視訊資料記憶體98可與視訊編碼器20之其他組件一起在晶片上,或相對於彼等組件在晶片外。 視訊編碼器20可接收視訊資料。視訊編碼器20可編碼視訊資料之圖像之圖塊中的每一CTU。CTU中之每一者可與圖像的相等大小之明度寫碼樹型區塊(CTB)及對應CTB相關聯。作為編碼CTU之部分,預測處理單位100可執行四分樹分割以將CTU之CTB劃分成逐步較小的區塊。較小區塊可為CU之寫碼區塊。舉例而言,預測處理單元100可將與CTU相關聯的CTB分割成四個相等大小的子區塊,將子區塊中之一或多者分割成四個相等大小的子子區塊,等等。 視訊編碼器20可編碼CTU之CU以產生CU之經編碼表示(亦即,經寫碼CU)。作為編碼CU之部分,預測處理單元100可分割與CU之一或多個PU中的CU相關聯之寫碼區塊。因此,每一PU可與明度預測區塊及對應的色度預測區塊相關聯。視訊編碼器20及視訊解碼器30可支援具有各種大小之PU。如上文所指示,CU的大小可係指CU之明度寫碼區塊的大小且PU之大小可係指PU的明度預測區塊之大小。 框間預測處理單元120可藉由對CU之每一PU執行框間預測而產生用於PU之預測性資料。用於PU之預測性資料可包括PU之一或多個預測性樣本區塊及PU之運動資訊。框內預測處理單元126可藉由對PU執行框內預測而產生用於PU之預測性資料。用於PU之預測性資料可包括PU之預測性樣本區塊及各種語法元素。框內預測處理單元126可對I圖塊、P圖塊及B圖塊中之PU執行框內預測。 預測處理單元100可自由框間預測處理單元120所產生的用於PU之預測性資料或由框內預測處理單元126所產生的用於PU之預測性資料中選擇用於CU之PU的預測性資料。在一些實例中,預測處理單元100基於預測性資料之集合的速率/失真量度而選擇用於CU之PU的預測性資料。所選擇預測性資料之預測性樣本區塊在本文中可被稱作所選擇之預測性樣本區塊。 殘餘產生單元102可基於CU之寫碼區塊(例如,明度、Cb及Cr寫碼區塊)及CU之PU的所選擇預測性樣本區塊(例如,預測性明度、Cb及Cr區塊)產生CU之殘餘區塊(例如,明度、Cb及Cr殘餘區塊)。舉例而言,殘餘產生單元102可產生CU之殘餘區塊,使得殘餘區塊中之每一樣本的值等於CU之寫碼區塊中的樣本與CU之PU之對應所選擇預測性樣本區塊中的對應樣本之間的差。 變換處理單元104可執行分割(例如四分樹分割)以將與CU相關聯之殘餘區塊分割為與CU之TU相關聯之變換區塊。因此,在一些實例中,TU可與明度變換區塊及兩個色度變換區塊相關聯。CU之TU的明度變換區塊及色度變換區塊的大小及位置可或可不基於CU之PU的預測區塊之大小及位置。被稱作「殘餘四分樹」(RQT)之四分樹結構可包括與區域中之每一者相關聯的節點。CU之TU可對應於RQT之葉節點。 藉由將一或多個變換應用至TU之變換區塊,變換處理單元104可產生CU之每一TU的變換係數區塊。變換處理單元104可將各種變換應用於與TU相關聯之變換區塊。舉例而言,變換處理單元104可將離散餘弦變換(DCT)、定向變換或概念上類似之變換應用至變換區塊。在一些實例中,變換處理單元104不將變換應用於變換區塊。在此等實例中,變換區塊可經處理為變換係數區塊。 量化單元106可量化係數區塊中之變換係數。量化程序可減少與變換係數中之一些或所有相關聯的位元深度。逆量化單元108及逆變換處理單元110可分別將逆量化及逆變換應用於係數區塊,以自係數區塊重建構殘餘區塊。重建構單元112可將經重建構之殘餘區塊添加至來自由預測處理單元100產生之一或多個預測性樣本區塊的對應樣本,以產生與TU相關聯的經重建構變換區塊。藉由以此方式重建構CU之每一TU的變換區塊,視訊編碼器20可重建構CU之寫碼區塊。 濾波器單元114可執行一或多個解區塊操作以減少與CU相關聯之寫碼區塊中的區塊假影。經解碼圖像緩衝器116可在濾波器單元114對經重建構之寫碼區塊執行一或多個解區塊操作之後儲存經重建構之寫碼區塊。框間預測處理單元120可使用含有經重建構之寫碼區塊之參考圖像,以對其他圖像之PU執行框間預測。另外,框內預測處理單元126可使用經解碼圖像緩衝器116中之經重建構之寫碼區塊來對與CU位於相同圖像中的其他PU執行框內預測。 熵編碼單元118可自視訊編碼器20之其他功能組件接收資料。舉例而言,熵編碼單元118可自量化單元106接收係數區塊且可自預測處理單元100接收語法元素。熵編碼單元118可對資料執行一或多個熵編碼操作,以產生經熵編碼資料。舉例而言,熵編碼單元118可對資料執行CABAC操作、上下文自適應性可變長度寫碼(CAVLC)操作、可變至可變(V2V)長度寫碼操作、基於語法之上下文自適應性二進位算術寫碼(SBAC)操作、機率區間分割熵(PIPE)寫碼操作、指數哥倫布編碼操作或另一類型之熵編碼操作。視訊編碼器20可輸出包括由熵編碼單元118產生之經熵編碼資料的位元流。舉例而言,位元流可包括表示用於CU之RQT的資料。 除上述作用之外,視訊編碼器20可形成參數集,諸如VPS、PPS及SPS。由視訊編碼器20所形成之參數集可包括表示關於位元流的各種資訊之參數,諸如啟用的寫碼工具、包括於位元流中之多個層、可用於判定何時解碼及輸出位元流之圖像之視訊可用性資訊(VUI)、圖像大小資訊、輪廓-層-位準(PTL)資訊及其他類型之資訊。視訊編碼器20在位元流中可包括指示參數集之資料。 如圖4之實例中所展示,後處理實體(PPE) 119可獲得由視訊編碼器20產生的位元流。PPE 119可為檔案產生單元36 (圖1)之實例。PPE 119可為可處理經編碼視訊資料之視訊實體(諸如檔案產生單元、MANE或拼接/編輯器件)之實例。在一些實例中,PPE 119可為網路實體之實例。在一些視訊編碼系統中,PPE 119及視訊編碼器20可為單獨器件之部分,而在其他實例中,關於PPE 119描述之功能可藉由包含視訊編碼器20之同一器件執行。如上文所描述,PPE 119可經組態以執行上述實例技術(例如根據上述一或多個實例之格式檔案),且(例如目的地器件14、MANE或另一器件之)檔案處理單元可經組態以獲得如藉由PPE 119格式化之檔案。 根據本發明之技術,PPE 119可產生或修改檔案使得檔案符合本發明之第一或第二實例限制。舉例而言,可能需要當前參數集以用於解碼位元流中之當前經寫碼IRAP圖像,當前樣本含有當前經寫碼IRAP圖像,當前樣本在當前播放軌中,且當前經寫碼IRAP圖像在當前層中。在此實例中,PPE 119可確保當前參數集存在於以下各者中:(1)當前樣本,(2)在攜載當前層之參考層的播放軌中且與當前樣本依時共置之樣本,或 (3)在攜載當前層之參考層的任何給定播放軌之樣本輸入項中,其中樣本輸入項適用於給定播放軌中之依時共置的樣本,或給定播放軌中之解碼時間小於但最接近於當前樣本之解碼時間的樣本。在此實例中,若以上不適用,則PPE 119可包括當前播放軌中適用於當前樣本的樣本輸入項中的當前參數集之複本。在一些實例中,PPE 119可始終包括當前播放軌中適用於當前樣本的樣本輸入項中的當前參數集之複本。 類似地,可能需要當前參數集以用於解碼位元流中之當前經寫碼非IRAP圖像,當前樣本含有當前經寫碼非IRAP圖像,當前樣本在當前播放軌中,且當前經寫碼IRAP圖像在當前層中。在此實例中,PPE 119可確保當前參數集存在於以下各者中:(1)在含有當前層中之IRAP圖像之當前播放軌中之前一樣本之後直至且包括當前樣本的當前播放軌之任何樣本,(2)在攜載當前層之參考層的給定播放軌之樣本的範圍中之任何樣本,自給定播放軌之樣本開始的範圍與含有當前層中之IRAP圖像之當前播放軌之前一樣本共置,且繼續至給定播放軌中與當前樣本依時共置的樣本,或 (3)攜載當前層之參考層的任何給定播放軌之樣本輸入項,其中樣本輸入項適用於給定播放軌中與當前樣本共置的樣本,或給定播放軌中之解碼時間小於但最接近於當前樣本之解碼時間的樣本。在此實例中,若以上不適用,則PPE 119可包括適用於當前樣本的當前播放軌之樣本輸入項中的當前參數集之複本。在一些實例中,PPE 119可始終包括適用於當前樣本的當前播放軌之樣本輸入項中的當前參數集之複本。 圖5為說明實例視訊解碼器30的方塊圖。出於解釋之目的而提供圖5,且其並不限制如本發明中所廣泛例示及描述之技術。出於解釋之目的,本發明描述在HEVC寫碼之上下文中的視訊解碼器30。然而,本發明之技術可適用於其他寫碼標準或方法。 在圖5之實例中,視訊解碼器30包括視訊資料記憶體151、熵解碼單元150、預測處理單元152、逆量化單元154、逆變換處理單元156、重建構單元158、濾波器單元160,及經解碼圖像緩衝器162。預測處理單元152包括運動補償單元164及框內預測處理單元166。在其他實例中,視訊解碼器30可包括更多、更少或不同功能組件。 視訊資料記憶體151可儲存待由視訊解碼器30之組件解碼的視訊資料,諸如經編碼視訊位元流。儲存於視訊資料記憶體151中之視訊資料可自(例如)頻道16 (圖1)或藉由存取實體資料儲存媒體來獲得。視訊資料記憶體151可形成儲存來自經編碼視訊位元流之經編碼視訊資料的經寫碼圖像緩衝器(CPB)。經解碼圖像緩衝器162可為儲存用於藉由視訊解碼器30例如以框內或框間寫碼模式解碼視訊資料時使用之參考視訊資料的參考圖像記憶體。視訊資料記憶體151及經解碼圖像緩衝器162可由多種記憶體器件中之任一者形成,諸如,動態隨機存取記憶體(DRAM) (包括同步DRAM (SDRAM))、磁阻式RAM (MRAM)、電阻式RAM (RRAM)或其他類型之記憶體器件。可藉由相同記憶體器件或單獨記憶體器件來提供視訊資料記憶體151及經解碼圖像緩衝器162。在各種實例中,視訊資料記憶體151可與視訊解碼器30之其他組件一起在晶片上,或相對於彼等組件在晶片外。 視訊資料記憶體151 (亦即,CPB)可接收及儲存位元流之經編碼視訊資料(例如,NAL單元)。熵解碼單元150可自視訊資料記憶體151接收經編碼視訊資料(例如,NAL單元),且可剖析NAL單元以解碼語法元素。熵解碼單元150可熵解碼NAL單元中之經熵編碼語法元素。預測處理單元152、逆量化單元154、逆變換處理單元156、重建構單元158及濾波器單元160可基於自位元流獲得(例如,提取)之語法元素而產生經解碼視訊資料。 位元流之NAL單元可包括經寫碼圖塊NAL單元。作為解碼位元流之部分,熵解碼單元150可提取及熵解碼來自經寫碼圖塊NAL單元之語法元素。經寫碼圖塊中之每一者可包括圖塊標頭及圖塊資料。圖塊標頭可含有關於圖塊之語法元素。圖塊標頭中之語法元素可包括識別與含有圖塊之圖像相關聯之PPS的語法元素。PPS又可識別適用於圖像之SPS。SPS又可識別適用於圖像之VPS。 除解碼來自位元流的語法元素以外,視訊解碼器30可對未經分割之CU執行重建構操作。為對未經分割之CU執行重建構操作,視訊解碼器30可對CU之每一TU執行重建構操作。藉由對CU之每一TU執行重建構操作,視訊解碼器30可重建構CU之殘餘區塊。 作為對CU之TU執行重建構操作的部分,逆量化單元154可逆量化(亦即,解量化)與TU相關聯的係數區塊。逆量化單元154可使用與TU之CU相關聯的QP值來判定逆量化單元154應用之量化程度及(同樣地)逆量化程度。亦即,可藉由調整在量化變換係數時使用的QP值來控制壓縮比,亦即,用於表示原始序列及經壓縮序列之位元數目之比率。壓縮比亦可取決於所採用的熵寫碼之方法。 在逆量化單元154逆量化係數區塊之後,逆變換處理單元156可將一或多個逆變換應用於係數區塊以便產生與TU相關聯之殘餘區塊。舉例而言,逆變換處理單元156可將逆DCT、逆整數變換、逆Karhunen-Loeve變換(KLT)、逆旋轉變換、逆定向變換或另一逆變換應用於係數區塊。 若PU係使用框內預測來編碼,則框內預測處理單元166可執行框內預測以產生用於PU之預測性區塊。框內預測處理單元166可使用框內預測模式以基於空間相鄰之PU之預測區塊而產生用於PU之預測性明度、Cb及Cr區塊。框內預測處理單元166可基於自位元流解碼之一或多個語法元素而判定用於PU之框內預測模式。 預測處理單元152可基於自位元流提取之語法元素而建構第一參考圖像清單(RefPicList0)及第二參考圖像清單(RefPicList1)。此外,若使用框間預測來編碼PU,則熵解碼單元150可提取PU之運動資訊。運動補償單元164可基於PU之運動資訊而判定PU之一或多個參考區域。運動補償單元164可基於用於PU之一或多個參考區塊處的樣本區塊而產生用於PU之預測性區塊(例如,預測性明度、Cb及Cr區塊)。 重建構單元158可使用可適用的與CU之TU相關聯的變換區塊(例如,明度、Cb及Cr變換區塊)及CU之PU的預測性區塊(例如,明度、Cb及Cr區塊) (亦即,框內預測資料或框間預測資料)來重建構CU之寫碼區塊(例如,明度、Cb及Cr寫碼區塊)。舉例而言,重建構單元158可將變換區塊(例如,明度、Cb及Cr變換區塊)之樣本添加至預測性區塊(例如,預測性明度、Cb及Cr區塊)之對應樣本,以重建構CU之寫碼區塊(例如,明度、Cb及Cr寫碼區塊)。 濾波器單元160可執行解區塊操作以減少與CU之寫碼區塊(例如,明度、Cb及Cr寫碼區塊)相關聯之區塊假影。視訊解碼器30可將CU之寫碼區塊(例如,明度、Cb及Cr寫碼區塊)儲存於經解碼圖像緩衝器162中。經解碼圖像緩衝器162可提供參考圖像以用於後續運動補償、框內預測及在顯示器件(諸如圖1之顯示器件32)上的呈現。舉例而言,視訊解碼器30可基於經解碼圖像緩衝器162中之區塊(例如,明度、Cb及Cr區塊)而對其他CU之PU執行框內預測或框間預測操作。以此方式,視訊解碼器30可自位元流提取重要係數區塊之變換係數層級,逆量化變換係數層級,將變換應用於變換係數層級以產生變換區塊,至少部分地基於變換區塊產生寫碼區塊,且輸出寫碼區塊以供顯示。 在圖5之實例中,電腦可讀取媒體148包含諸如記憶體、光學光碟、磁碟或計算器件能夠自其讀取資料的其他類型之非暫時性儲存媒體之電腦可讀儲存媒體。在電腦可讀取媒體148包含電腦可讀儲存媒體之一些實例中,電腦可讀儲存媒體形成諸如源器件12 (圖1)、檔案處理單元34 (圖1) (例如檔案提取單元38)中之一或多者、內容遞送網路器件或另一類型之器件之器件之部分。在一些實例中,電腦可讀取媒體148包含電腦可讀通信媒體,諸如光纖、通信電纜、電磁波或計算器件能夠自其讀取資料的其他類型之媒體。 此外,在圖5之實例中,檔案處理單元149自電腦可讀取媒體148接收檔案或檔案之部分。檔案處理單元149可為檔案提取單元38 (圖1)或檔案處理單元34 (圖1)中之另一者之實例。檔案處理單元149可藉由器件(諸如目的地器件14、MANE、內容遞送網路器件或另一類型之器件)之一或多個處理電路來實施。 檔案處理單元149可處理檔案。舉例而言,檔案處理單元149可自檔案獲得NAL單元。在圖5之實例中,藉由視訊解碼器30接收之經編碼視訊位元流可包含自檔案獲得之NAL單元。根據本發明之技術,檔案處理單元149可經組態以依賴於符合本發明之第一或第二實例限制的檔案。舉例而言,若參數集在合適的樣本中不可用,則檔案處理單元149可經組態以將解碼圖像所需的參數集之複本自檔案之樣本輸入項發送至視訊解碼器30。 圖6為說明形成網路200之部分之器件之實例集合的方塊圖。在此實例中,網路200包括路由器件204A、204B (路由器件204)及轉碼器件206。路由器件204及轉碼器件206意欲表示可形成網路200之一部分的少數器件。諸如交換器、集線器、閘道器、防火牆、橋接器及其他此類器件之其他網路器件亦可包括在網路200內。此外,可沿著伺服器器件202與用戶端器件208之間的網路路徑提供額外網路器件。在一些實例中,伺服器器件202可對應於源器件12 (圖1),而用戶端器件208可對應於目的地器件14 (圖1)。 大體而言,路由器件204實施一或多個路由協定以經由網路200交換網路資料。在一些實例中,路由器件404可經組態以執行代理或快取操作。因此,在一些實例中,路由器件204可被稱作代理器件。大體而言,路由器件204執行路由協定以發現經由網路200之路線。藉由執行此類路由協定,路由器件204B可發現自其自身經由路由器件204A至伺服器器件202的網路路線。 本發明之技術可藉由諸如路由器件204及轉碼器件206之網路器件實施,且亦可藉由用戶端器件208實施。以此方式,路由器件204、轉碼器件206及用戶端器件208表示經組態以執行本發明之技術之器件之實例。 圖7為說明根據本發明之技術的器件之實例操作之流程圖。本發明之流程圖作為實例提供。在其他實例中,可執行不同操作或可以不同次序或並行地執行動作。 圖7之操作可藉由諸如源器件12 (圖1)、檔案處理單元34 (圖1)、後處理實體119 (圖4)或另一類型之器件的各種器件執行。在圖7之實例中,該器件獲得多層位元流,其包含複數個參數集、視訊資料之複數個IRAP圖像之經編碼表示及視訊資料之複數個非IRAP圖像之經編碼表示(500)。舉例而言,圖1之源器件12可自視訊編碼器20 (圖1)接收多層位元流。作為另一實例,後處理實體119 (圖4)可自視訊編碼器20 (圖4)接收多層位元流。另外,在圖7之實例中,器件產生用於儲存多層位元流之檔案,使得檔案遵從該檔案所符合之檔案格式中指定之限制(502)。產生檔案可包含將表示檔案之資料儲存至資料儲存媒體。限制可為如上文所描述之本發明之第一或第二實例限制。檔案格式之語法不需要該限制,但關於符合檔案格式之檔案之內容之其他規則需要該限制。 圖8為說明根據本發明之技術的器件之實例操作之流程圖。圖8之操作可由諸如源器件12 (圖1)、檔案處理單元34 (圖1)、後處理實體119 (圖4)、伺服器器件202 (圖6)、轉碼器件206 (圖6)、MANE或另一類型之器件之各種器件執行。 在圖8之實例中,器件儲存將多層位元流進行儲存之檔案(550)。檔案遵從該檔案所符合之檔案格式中指定之限制。舉例而言,限制可為如上文所描述之本發明之第一或第二實例限制。此外,在圖8之實例中,器件可將檔案的至少一部分串流至接收器件(552)。在一些實例中,器件使用DASH或另一串流技術以將檔案串流至接收器件。替代地,器件可將檔案提供至(例如根據DASH)將檔案輸送至接收器件之伺服器器件。接收器件可為多種各種類型之器件中之一者,諸如目的地器件14、用戶端器件208或另一類型之器件。舉例而言,器件可自含有IRAP圖像之樣本開始將檔案之一部分進行串流。 圖9為說明根據本發明之技術的器件之實例操作之流程圖。圖9之操作可由諸如目的地器件14 (圖1)、用戶端器件208 (圖6)或另一類型之器件之各種類型之器件執行。 在圖9之實例中,器件可獲得儲存多層位元流之檔案(600)。檔案遵從該檔案所符合之檔案格式中指定之限制。舉例而言,限制可為如上文所描述之本發明之第一或第二實例限制。此外,在圖9之實例中,器件可解碼檔案中之多層位元流的至少一部分(602)。舉例而言,器件可解碼開始於特定IRAP存取單元(亦即,含有特定IRAP圖像之存取單元)之多層位元流的一部分。 圖10、圖11、圖12及圖13為說明根據本發明之技術的器件存取參數集之實例操作之流程圖。圖10、圖11、圖12及圖13之實例操作可作為圖8之操作之部分執行。舉例而言,器件可基於接收器件之視訊解碼器經組態以自IRAP圖像開始解碼多層位元流之判定將對應於含有IRAP圖像的存取單元之檔案之至少部分進行串流。此外,圖10、圖11、圖12及圖13之實例操作可作為圖9之操作之部分執行。舉例而言,器件可基於器件之視訊解碼器經組態以自多層位元流中之IRAP圖像開始解碼多層位元流之判定來解碼檔案中之多層位元流(602)。 圖10為說明根據本發明之技術的器件使用儲存於樣本輸入項中之參數集之實例操作的流程圖。如圖10之實例中所說明,器件可判定含有IRAP圖像之樣本(650)。舉例而言,器件可基於定義於檔案之播放軌邏輯框中之樣本群組來判定哪些樣本包括IRAP圖像。此外,在圖10之實例中,器件可識別適用於該經判定之樣本之樣本輸入項(652)。舉例而言,器件可基於播放軌之樣本至塊邏輯框判定播放軌之樣本表邏輯框中之哪個樣本輸入項適用於該經判定之樣本。器件可接著自識別之樣本輸入項獲得解碼IRAP圖像所需的參數集(654)。器件可以各種方式使用解碼IRAP圖像所需的參數集。舉例而言,器件可基於參數集判定視訊解碼器30是否經組態以自IRAP圖像開始解碼位元流。舉例而言,在此實例中,器件可判定視訊解碼器30是否經組態以基於VPS中指定之輪廓、層及位準(PTL)資料解碼位元流。在一些實例中,器件可將參數集提供至視訊解碼器30以使視訊解碼器30能夠解碼IRAP圖像。 圖11為說明根據本發明之技術的器件使用儲存於不同播放軌之樣本輸入項中之參數集的實例操作之流程圖。在圖11之實例中,器件可判定含有IRAP圖像之樣本(700)。在此實例中,樣本可在檔案之第一播放軌中。在一些實例中,為判定含有IRAP圖像之樣本,器件可基於定義於檔案之播放軌邏輯框中之樣本群組來判定哪些樣本包括IRAP圖像。此外,在圖11之實例中,器件可識別攜載第一播放軌之參考層的第二播放軌之樣本輸入項(702)。經識別的樣本輸入項可適用於與經判定之第一播放軌之樣本依時共置的第二播放軌之樣本。替代地,當無第二播放軌之樣本與經判定之第一播放軌之樣本依時共置時,經識別的樣本輸入項可適用於第二播放軌中之解碼時間小於但最接近於經判定之第一播放軌之樣本之解碼時間的樣本。舉例而言,器件可使用第二播放軌之樣本至塊邏輯框來判定適用於第二播放軌之樣本的樣本輸入項。 此外,在圖11之實例中,器件可自識別的樣本輸入項獲得解碼IRAP圖像所需的參數集(704)。舉例而言,在此實例中,器件可判定視訊解碼器30是否經組態以基於VPS中指定之PTL資料來解碼位元流。在一些實例中,器件可將參數集提供至視訊解碼器30以使視訊解碼器30能夠解碼IRAP圖像。 圖12為說明根據本發明之技術的器件使用儲存於樣本中之參數集之實例操作的流程圖。如圖12之實例中所說明,器件可判定含有IRAP圖像之樣本(750)。此外,在圖12之實例中,器件可接著自經判定之樣本獲得解碼IRAP圖像所需的參數集(752)。舉例而言,在此實例中,器件可判定視訊解碼器30是否經組態以基於VPS中指定之PTL資料來解碼位元流。在一些實例中,器件可將參數集提供至視訊解碼器30以使視訊解碼器30能夠解碼IRAP圖像。 圖13為說明根據本發明之技術的器件使用儲存於含有參考層之播放軌的樣本中之參數集的實例操作之流程圖。在圖13之實例中,器件可判定含有IRAP圖像之樣本(800)。在此實例中,樣本可在檔案之第一播放軌中。此外,在圖13之實例中,器件可識別攜載第一播放軌之參考層的第二播放軌之依時共置的樣本(802)。此外,在圖13之實例中,器件可自識別的樣本獲得解碼IRAP圖像所需的參數集(804)。舉例而言,在此實例中,器件可判定視訊解碼器30是否經組態以基於VPS中指定之PTL資料來解碼位元流。在一些實例中,器件可將參數集提供至視訊解碼器30以使視訊解碼器30能夠解碼IRAP圖像。 類似於關於圖10、圖11、圖12及圖13描述之彼等者的實例操作可關於非IRAP圖像而提供。然而,解碼通常並自非IRAP圖像開始。此外,在圖12中,就屬於特定層且在特定播放軌之特定樣本中之非IRAP圖像而言,器件可自特定播放軌中之按解碼時間中在含有特定播放軌中之IRAP圖像之前一樣本之後及直至該特定樣本的任何樣本獲得解碼非IRAP圖像所需的參數集。此外,在圖13中,就屬於特定層且在第一播放軌之特定樣本中之非IRAP圖像而言,器件可識別第二播放軌之第一樣本與第二播放軌之第二樣本之間的第二播放軌中之任何樣本。第二播放軌攜載第一播放軌之參考層。在此實例中,第二播放軌之第一樣本為第二播放軌中的與在第一播放軌中且為在含有IRAP圖像之特定樣本之前的第一樣本之樣本依時共置的樣本。第二播放軌之第二樣本與第一播放軌之特定樣本依時共置。 應認識到,取決於實例,本文中所描述之技術中之任一者的某些動作或事件可以不同順序執行、可添加、合併或完全省略(例如,並非所有所描述動作或事件對於該等技術之實踐係必要的)。此外,在某些實例中,可(例如)經由多執行緒處理、中斷處理或多個處理器同時地(而非依序地)執行動作或事件。另外,儘管出於明確性之目的而將本發明之某些方面描述為由單一模組或單元執行,但應理解本發明之技術可由與視訊寫碼器相關聯之單元或模組的組合執行。 出於說明的目的,已關於HEVC標準描述本發明之某些態樣。然而,本發明中所描述之技術可適用於其他視訊寫碼程序,包括尚未開發之其他標準或專屬視訊寫碼程序。 視訊編碼器20 (圖1及圖4)及/或視訊解碼器30 (圖1及圖5)可通常被稱作視訊寫碼器。同樣地,視訊寫碼在適用時可指代視訊編碼或視訊解碼。 儘管在上文描述技術的各種態樣之特定組合,但提供此等組合僅為了說明本發明中所描述的技術之實例。因此,本發明之技術不應限於此等實例組合且可涵蓋本發明中描述之技術的各種態樣之任何可設想組合。 在一或多個實例中,所描述之功能可以硬體、軟體、韌體或其任何組合實施。舉例而言,所描述之功能可由諸如處理電路之一或多個處理器執行。若以軟體實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體傳輸,且由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體,其對應於有形媒體,諸如資料儲存媒體,或包括促進將電腦程式(例如,根據通信協定)自一處傳送至另一處的任何媒體的通信媒體。以此方式,電腦可讀媒體大體可對應於(1)為非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取用於實施本發明中所描述之技術的指令、程式碼及/或資料結構的任何可用媒體。電腦程式產品可包括電腦可讀媒體。 藉由實例而非限制的方式,此類電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器、快閃記憶體或可用以儲存呈指令或資料結構形式之所要程式碼且可由電腦存取的任何其他媒體。此外,任何連接被恰當地稱作電腦可讀媒體。舉例而言,若使用同軸纜線、光纜、雙絞線、數位用戶線(DSL)或無線技術(諸如紅外線、無線電及微波)自網站、伺服器或其他遠端源傳輸指令,則同軸纜線、光纜、雙絞線、DSL或無線技術(諸如紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而實情為關於非暫時性有形儲存媒體。如本文所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位多功能光碟(DVD)、軟碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟用雷射以光學方式再生資料。以上各者的組合亦應包括於電腦可讀媒體之範疇內。 指令可由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效積體或離散邏輯電路之一或多個處理器來執行。因此,如本文中所使用之術語「處理器」可指代前述結構或適合用於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,本文中所描述之功能性可提供於經組態用於編碼及解碼之專用硬體及/或軟體模組內,或併入組合式編解碼器中。此外,該等技術可充分實施於一或多個電路或邏輯元件中。 本發明之技術可在多種器件或裝置中實施,該等器件或裝置包括無線手持機、積體電路(IC)或一組IC(例如,晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術之器件的功能性態樣,但未必需要藉由不同硬體單元來實現。確切而言,如上文所描述,可將各種單元組合於編解碼器硬體單元中,或藉由互操作性硬體單元(包括如上文所描述之一或多個處理器)之集合結合合適之軟體及/或韌體來提供該等單元。 已描述本發明之各種實例。涵蓋所描述之系統、操作或功能之任何組合。此等及其他實例在以下申請專利範圍之範疇內。
10‧‧‧視訊寫碼系統 12‧‧‧源器件 14‧‧‧目的地器件 16‧‧‧頻道 18‧‧‧視訊源 20‧‧‧視訊編碼器 22‧‧‧輸出介面 28‧‧‧輸入介面 30‧‧‧視訊解碼器 32‧‧‧顯示器件 34‧‧‧檔案處理單元 36‧‧‧檔案產生單元 38‧‧‧檔案提取單元 98‧‧‧視訊資料記憶體 100‧‧‧預測處理單元 102‧‧‧殘餘產生單元 104‧‧‧變換處理單元 106‧‧‧量化單元 108‧‧‧逆量化單元 110‧‧‧逆變換處理單元 112‧‧‧重建構單元 114‧‧‧濾波器單元 116‧‧‧經解碼圖像緩衝器 118‧‧‧熵編碼單元 119‧‧‧後處理實體 120‧‧‧框間預測處理單元 126‧‧‧框內預測處理單元 148‧‧‧電腦可讀取媒體 149‧‧‧檔案處理單元 150‧‧‧熵解碼單元 151‧‧‧視訊資料記憶體 152‧‧‧預測處理單元 154‧‧‧逆量化單元 156‧‧‧逆變換處理單元 158‧‧‧重建構單元 160‧‧‧濾波器單元 162‧‧‧經解碼圖像緩衝器 164‧‧‧運動補償單元 166‧‧‧框內預測處理單元 200‧‧‧網路 202‧‧‧伺服器器件 204‧‧‧路由器件 204A‧‧‧路由器件 204B‧‧‧路由器件 206‧‧‧轉碼器件 208‧‧‧用戶端器件 300‧‧‧檔案 302‧‧‧電影邏輯框 304‧‧‧媒體資料邏輯框 305‧‧‧樣本 305A‧‧‧樣本 305N‧‧‧樣本 306‧‧‧播放軌邏輯框 307‧‧‧媒體邏輯框 308‧‧‧媒體資訊邏輯框 309‧‧‧樣本表邏輯框 310‧‧‧樣本描述邏輯框 312‧‧‧SampleToGroup邏輯框 314‧‧‧SampleGroupDescription邏輯框 316‧‧‧樣本輸入項 316A‧‧‧樣本輸入項 318‧‧‧參數集 320‧‧‧經編碼圖像 322‧‧‧參數集 450‧‧‧檔案 452‧‧‧電影片段邏輯框 454‧‧‧媒體資料邏輯框 456‧‧‧樣本 456A‧‧‧樣本 456N‧‧‧樣本 458‧‧‧播放軌片段邏輯框 460‧‧‧樣本描述邏輯框 462‧‧‧SampleToGroup邏輯框 464‧‧‧SampleGroupDescription邏輯框 466‧‧‧樣本輸入項 466A‧‧‧樣本輸入項 468‧‧‧參數集 470‧‧‧經編碼圖像 472‧‧‧參數集 500‧‧‧步驟 502‧‧‧步驟 550‧‧‧步驟 552‧‧‧步驟 600‧‧‧步驟 602‧‧‧步驟 650‧‧‧步驟 652‧‧‧步驟 654‧‧‧步驟 700‧‧‧步驟 702‧‧‧步驟 704‧‧‧步驟 750‧‧‧步驟 752‧‧‧步驟 800‧‧‧步驟 802‧‧‧步驟 804‧‧‧步驟
圖1為說明可利用本發明中描述之技術之實例視訊寫碼系統的方塊圖。 圖2為說明根據本發明之一或多種技術的檔案之實例結構之方塊圖。 圖3為說明根據本發明的一或多種技術的檔案之實例結構之方塊圖。 圖4為說明實例視訊編碼器的方塊圖。 圖5為說明實例視訊解碼器的方塊圖。 圖6為說明形成網路之部分之器件之實例集合的方塊圖。 圖7為說明根據本發明之技術的器件之實例操作之流程圖。 圖8為說明根據本發明之技術的器件之實例操作之流程圖。 圖9為說明根據本發明之技術的器件之實例操作之流程圖。 圖10為說明根據本發明之技術的器件使用儲存於樣本輸入項中之參數集之實例操作的流程圖。 圖11為說明根據本發明之技術的器件使用儲存於不同播放軌之樣本輸入項中之參數集的實例操作之流程圖。 圖12為說明根據本發明之技術的器件使用儲存於樣本中之參數集之實例操作的流程圖。 圖13為說明根據本發明之技術的器件使用儲存於含有參考層之播放軌的樣本中之參數集的實例操作之流程圖。
10‧‧‧視訊寫碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧頻道
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧顯示器件
34‧‧‧檔案處理單元
36‧‧‧檔案產生單元
38‧‧‧檔案提取單元

Claims (54)

  1. 一種處理視訊資料之方法,該方法包含: 獲得一多層位元流,其包含複數個參數集、該視訊資料之複數個框內隨機存取圖像(IRAP)圖像之經編碼表示及該視訊資料之複數個非IRAP圖像之經編碼表示;及 產生用於儲存該多層位元流之一檔案,使得該檔案遵從該檔案所符合之一檔案格式中指定之一限制,其中: 對於該檔案之複數個播放軌之每一各別播放軌,用於該各別播放軌之媒體內容包含一各別序列之樣本, 對於該複數個IRAP圖像中之每一各別IRAP圖像: 該各別IRAP圖像的層含有該各別IRAP圖像且其為該多層位元流之一層,該各別IRAP圖像的播放軌含有該各別IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別IRAP圖像的播放軌, 該限制要求解碼該各別IRAP圖像所需要的該複數個參數集之每一參數集在以下中之至少一者中: 該各別IRAP圖像之播放軌中適用於該各別IRAP圖像之樣本的一樣本輸入項, 用於該各別IRAP圖像的攜載該各別IRAP圖像之層之一參考層之一非對應播放軌的一樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別IRAP圖像之樣本的一解碼時間的一樣本, 該各別IRAP圖像之樣本,及 該複數個播放軌中攜載該各別IRAP圖像之層之一參考層的一播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本。
  2. 如請求項1之方法,其中,對於該複數個IRAP圖像之一特定IRAP圖像,以下中之至少一者: 解碼該特定IRAP圖像所需的一第一參數集藉由存在於該特定IRAP圖像的樣本中之一或多個提取器之一第一集合參考,及 解碼該特定IRAP圖像所需的一第二參數集藉由存在於該複數個播放軌中攜載該特定IRAP圖像之層之一參考層的一播放軌中之該特定IRAP圖像之一依時共置的樣本中之一或多個提取器之一第二集合參考。
  3. 如請求項1之方法,其中,對於該複數個非IRAP圖像中之每一各別非IRAP圖像: 該各別非IRAP圖像的層含有該各別非IRAP圖像且其為該多層位元流之一層,該各別非IRAP圖像的播放軌含有該各別非IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別非IRAP圖像的播放軌,且 該限制進一步需要解碼該各別非IRAP圖像所需的該等參數集中之每一者在以下中之至少一者中: 該各別非IRAP圖像之播放軌中適用於該各別非IRAP圖像的樣本之一樣本輸入項, 用於該各別非IRAP圖像之攜載該各別非IRAP圖像的層之一參考層的一非對應播放軌之一樣本輸入項,用於該各別非IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別非IRAP圖像的播放軌以外的一播放軌,用於該各別非IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別非IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別非IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別非IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別非IRAP圖像之樣本之一解碼時間的一樣本, 該各別非IRAP圖像的播放軌之任何樣本,其在該各別非IRAP圖像的層中之一前一含有IRAP圖像的樣本之後及直至該各別非IRAP圖像的樣本(包括在內),及 該複數個播放軌中攜載該各別非IRAP圖像之層之任何參考層的任何播放軌的任何樣本,其在該各別非IRAP圖像之層中的該前一含有IRAP圖像之樣本的一依時共置樣本之後及直至該各別非IRAP圖像之樣本的一依時共置樣本(包括在內)。
  4. 如請求項3之方法,其中,對於該複數個非IRAP圖像中之一特定非IRAP圖像,以下中之至少一者: 解碼該特定非IRAP圖像所需的一第一參數集藉由存在於該特定非IRAP圖像的播放軌之一樣本中之一或多個提取器之一第一集合參考,該樣本在該特定非IRAP圖像之層中之含有一IRAP圖像之一前一樣本之後直至該特定非IRAP圖像的樣本(包括在內),及 解碼該特定非IRAP圖像所需的一第二參數集藉由存在於攜載該特定非IRAP圖像的層之一參考層的一播放軌中之一樣本中之一或多個提取器的一第二集合參考,該樣本在該特定非IRAP圖像之層中之含有該IRAP圖像之該前一樣本之一依時共置樣本之後直至該特定非IRAP圖像之樣本之一依時共置樣本(包括在內)。
  5. 如請求項1之方法,該複數個參數集包括以下中之至少一者:如ISO/IEC 23008-2中所定義之一視訊參數集、如ISO/IEC 23008-2中所定義之一序列參數集,及如ISO/IEC 23008-2中所定義之一圖像參數集。
  6. 一種用於處理視訊資料之器件,該器件包含: 一或多個處理電路,其經組態以產生用於儲存一多層位元流之一檔案,以使得該檔案遵從該檔案所符合之一檔案格式中指定之一限制,其中: 該多層位元流包含複數個參數集、該視訊資料之複數個框內隨機存取圖像(IRAP)圖像之經編碼表示及該視訊資料之複數個非IRAP圖像之經編碼表示, 對於該檔案之複數個播放軌中之每一各別播放軌,用於該各別播放軌之媒體內容包含一各別序列之樣本,其中用於該各別播放軌之一樣本的一相關樣本輸入項為該各別播放軌中適用於該樣本的一樣本輸入項, 對於該複數個IRAP圖像中之每一各別IRAP圖像: 該各別IRAP圖像的層含有該各別IRAP圖像且其為該多層位元流之一層,該各別IRAP圖像的播放軌含有該各別IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別IRAP圖像的播放軌, 該限制要求解碼該各別IRAP圖像所需的該複數個參數集中之每一參數集在以下中之至少一者中: 該各別IRAP圖像之播放軌中適用於該各別IRAP圖像之樣本的一樣本輸入項, 用於該各別IRAP圖像的攜載該各別IRAP圖像之層之一參考層之一非對應播放軌的一樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別IRAP圖像之樣本的一解碼時間的一樣本, 該各別IRAP圖像的樣本,及 該複數個播放軌中攜載該各別IRAP圖像之層之一參考層的一播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及 一資料儲存媒體,其經耦接至該一或多個處理電路,該資料儲存媒體經組態以儲存該檔案。
  7. 如請求項6之器件,其中,對於該複數個IRAP圖像之一特定IRAP圖像,以下中之至少一者: 解碼該特定IRAP圖像所需的一第一參數集藉由存在於該特定IRAP圖像之樣本中之一或多個提取器之一第一集合參考,及 解碼該特定IRAP圖像所需的一第二參數集藉由存在於該複數個播放軌中攜載該特定IRAP圖像的層之一參考層的一播放軌中之該特定IRAP圖像之一依時共置的樣本中之一或多個提取器之一第二集合參考。
  8. 如請求項6之器件,其中,對於該複數個非IRAP圖像中之每一各別非IRAP圖像: 該各別非IRAP圖像的層含有該各別非IRAP圖像且其為該多層位元流之一層,該各別非IRAP圖像的播放軌含有該各別非IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別非IRAP圖像的播放軌,且 該限制進一步需要解碼該各別非IRAP圖像所需的該等參數集中之每一者在以下中之至少一者中: 該各別非IRAP圖像之播放軌中適用於該各別非IRAP圖像之樣本的一樣本輸入項, 用於該各別非IRAP圖像的攜載該各別非IRAP圖像之層之一參考層之一非對應播放軌的一樣本輸入項,用於該各別非IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別非IRAP圖像之播放軌以外的一播放軌,用於該各別非IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別非IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別非IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別非IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別非IRAP圖像之樣本的一解碼時間的一樣本, 該各別非IRAP圖像的播放軌之任何樣本,其在該各別非IRAP圖像的層中之一前一含有IRAP圖像的樣本之後及直至該各別非IRAP圖像的樣本(包括在內),及 該複數個播放軌中攜載該各別非IRAP圖像之層之任何參考層的任何播放軌的任何樣本,其在該各別非IRAP圖像之層中的該前一含有IRAP圖像之樣本的一依時共置樣本之後及直至該各別非IRAP圖像之樣本的一依時共置樣本(包括在內)。
  9. 如請求項8之器件,其中,對於該複數個非IRAP圖像中之一特定非IRAP圖像,以下中之至少一者: 解碼該特定非IRAP圖像所需的一第一參數集藉由存在於該特定非IRAP圖像的播放軌之一樣本中之一或多個提取器之一第一集合參考,該樣本在該特定非IRAP圖像之層中之含有一IRAP圖像之一前一樣本之後直至該特定非IRAP圖像的樣本(包括在內),及 解碼該特定非IRAP圖像所需的一第二參數集藉由存在於攜載該特定非IRAP圖像的層之一參考層的一播放軌中之一樣本中之一或多個提取器的一第二集合參考,該樣本在該特定非IRAP圖像之層中之含有該IRAP圖像之該前一樣本之一依時共置樣本之後直至該特定非IRAP圖像之樣本之一依時共置樣本(包括在內)。
  10. 如請求項8之器件,該複數個參數集包括以下中之至少一者:如ISO/IEC 23008-2中所定義之一視訊參數集、如ISO/IEC 23008-2中所定義之一序列參數集,及如ISO/IEC 23008-2中所定義之一圖像參數集。
  11. 一種處理視訊資料之方法,該方法包含: 儲存將一多層位元流進行儲存之一檔案,該檔案遵從該檔案符合之一檔案格式中指定之一限制,其中: 該多層位元流包含複數個參數集、該視訊資料之複數個框內隨機存取圖像(IRAP)圖像之經編碼表示及該視訊資料之複數個非IRAP圖像之經編碼表示, 對於該檔案之複數個播放軌中之每一各別播放軌,用於該各別播放軌之媒體內容包含一各別序列之樣本, 對於該複數個IRAP圖像中之每一各別IRAP圖像: 該各別IRAP圖像的層含有該各別IRAP圖像且其為該多層位元流之一層,該各別IRAP圖像的播放軌含有該各別IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別IRAP圖像的播放軌, 該限制要求解碼該各別IRAP圖像所需的該複數個參數集中之每一參數集在以下中之至少一者中: 該各別IRAP圖像之播放軌中適用於該各別IRAP圖像之樣本的一樣本輸入項, 用於該各別IRAP圖像的攜載該各別IRAP圖像之層之一參考層之一非對應播放軌的一樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別IRAP圖像之樣本的一解碼時間的一樣本, 該各別IRAP圖像的樣本,及 該複數個播放軌中攜載該各別IRAP圖像之層之一參考層的一播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及 將該檔案之至少一部分串流至一接收器件。
  12. 如請求項11之方法,其中該複數個播放軌包括一特定播放軌,該方法進一步包含: 判定在該特定播放軌中且含有一特定IRAP圖像之一樣本; 識別適用於該經判定之樣本的一樣本輸入項; 自該識別之樣本輸入項獲得解碼該特定IRAP圖像所需的一參數集;及 基於該參數集判定該接收器件是否經組態以自該特定IRAP圖像開始解碼該多層位元流。
  13. 如請求項11之方法,其中該複數個播放軌包括一第一播放軌及一第二播放軌,該第二播放軌攜載用於該第一播放軌中攜載之一層的一參考層,該方法進一步包含: 判定在該第一播放軌中且含有一特定IRAP圖像之一樣本; 識別該第二播放軌之一樣本輸入項,其中以下中之至少一者: 該經識別之樣本輸入項適用於與該經判定之該第一播放軌之樣本依時共置的該第二播放軌之一樣本,或 當無該第二播放軌之樣本與該經判定之該第一播放軌之樣本依時共置時,該經識別之樣本輸入項適用於該第二播放軌中之一解碼時間小於但最接近於該經判定之該第一播放軌之樣本之一解碼時間之一樣本; 自該識別之樣本輸入項獲得解碼該特定IRAP圖像所需的一參數集;及 基於該參數集判定該接收器件是否經組態以自該IRAP圖像開始解碼該多層位元流。
  14. 如請求項11之方法,其進一步包含: 判定含有一IRAP圖像之一樣本; 自該經判定之樣本獲得解碼該IRAP圖像所需的一參數集;及 基於該等參數集判定該接收器件是否經組態以自該IRAP圖像開始解碼該位元流。
  15. 如請求項11之方法,其中該複數個播放軌包括一第一播放軌及一第二播放軌,該第二播放軌攜載該第一播放軌中攜載之一層的一參考層,該方法進一步包含: 判定含有一IRAP圖像之一樣本,該樣本在該第一播放軌中, 識別該第二播放軌之一依時共置的樣本; 自該經識別之樣本獲得解碼該IRAP圖像所需的一參數集;及 基於該等參數集判定該接收器件是否經組態以自該IRAP圖像開始解碼該位元流。
  16. 如請求項11之方法,其中,對於該複數個IRAP圖像中之一特定IRAP圖像,以下中之至少一者: 解碼該特定IRAP圖像所需的一第一參數集藉由存在於該特定IRAP圖像的樣本中之一或多個提取器之一第一集合參考,及 解碼該特定IRAP圖像所需的一第二參數集藉由存在於該複數個播放軌中攜載該特定IRAP圖像之層之一參考層的一播放軌中之該特定IRAP圖像之一依時共置的樣本中之一或多個提取器之一第二集合參考。
  17. 如請求項11之方法,其中,對於該複數個非IRAP圖像中之每一各別非IRAP圖像: 該各別非IRAP圖像的層含有該各別非IRAP圖像且其為該多層位元流之一層,該各別非IRAP圖像的播放軌含有該各別非IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別非IRAP圖像的播放軌,且 該限制進一步需要解碼該各別非IRAP圖像所需的該等參數集中之每一者在以下中之至少一者中: 該各別非IRAP圖像之播放軌中適用於該各別非IRAP圖像的樣本之一樣本輸入項, 用於該各別非IRAP圖像的攜載該各別非IRAP圖像的層之一參考層的一非對應播放軌之一樣本輸入項,用於該各別非IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別非IRAP圖像的播放軌以外的一播放軌,用於該各別非IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別非IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別非IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別非IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別非IRAP圖像之樣本之一解碼時間的一樣本, 該各別非IRAP圖像的播放軌之任何樣本,其在該各別非IRAP圖像的層中之一前一含有IRAP圖像的樣本之後及直至該各別非IRAP圖像的樣本(包括在內),及 該複數個播放軌中攜載該各別非IRAP圖像之層的任何參考層的任何播放軌的任何樣本,其在該各別非IRAP圖像之層中的該前一含有IRAP圖像之樣本的一依時共置樣本之後及直至該各別非IRAP圖像之樣本的一依時共置樣本(包括在內)。
  18. 如請求項17之方法,其中,對於該複數個非IRAP圖像中之一特定非IRAP圖像,以下中之至少一者: 解碼該特定非IRAP圖像所需的一第一參數集藉由存在於該特定非IRAP圖像的播放軌之一樣本中之一或多個提取器之一第一集合參考,該樣本在該特定非IRAP圖像之層中之含有一IRAP圖像之一前一樣本之後直至該特定非IRAP圖像的樣本(包括在內),及 解碼該特定非IRAP圖像所需的一第二參數集藉由存在於攜載該特定非IRAP圖像的層之一參考層的一播放軌中之一樣本中之一或多個提取器的一第二集合參考,該樣本在該特定非IRAP圖像之層中之含有該IRAP圖像之該前一樣本之一依時共置樣本之後直至該特定非IRAP圖像之樣本之一依時共置樣本(包括在內)。
  19. 如請求項11之方法,該複數個參數集包括以下中之至少一者:如ISO/IEC 23008-2中所定義之一視訊參數集、如ISO/IEC 23008-2中所定義之一序列參數集,及如ISO/IEC 23008-2中所定義之一圖像參數集。
  20. 一種用於處理視訊資料之器件,該器件包含: 一資料儲存媒體,其經組態以儲存將一多層位元流進行儲存之一檔案,該檔案遵從該檔案所符合之一檔案格式中指定之一限制,其中: 該多層位元流包含複數個參數集、該視訊資料之複數個框內隨機存取圖像(IRAP)圖像之經編碼表示及該視訊資料之複數個非IRAP圖像之經編碼表示, 對於該檔案之複數個播放軌中之每一各別播放軌,用於該各別播放軌之媒體內容包含一各別序列之樣本, 對於該複數個IRAP圖像中之每一各別IRAP圖像: 該各別IRAP圖像的層含有該各別IRAP圖像且其為該多層位元流之一層,該各別IRAP圖像的播放軌含有該各別IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別IRAP圖像的播放軌, 該限制要求解碼該各別IRAP圖像所需的該複數個參數集中之每一參數集在以下中之至少一者中: 該各別IRAP圖像之播放軌中適用於該各別IRAP圖像之樣本的一樣本輸入項, 用於該各別IRAP圖像的攜載該各別IRAP圖像之層之一參考層之一非對應播放軌的一樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別IRAP圖像之樣本的一解碼時間的一樣本, 該各別IRAP圖像的樣本,及 該複數個播放軌中攜載該各別IRAP圖像之層之一參考層的一播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及 一介面,其經組態以將該檔案之至少一部分串流至一接收器件。
  21. 如請求項20之器件,其中該複數個播放軌包括一特定播放軌,該器件包含一或多個處理電路,其經組態以: 判定在該特定播放軌中且含有一特定IRAP圖像之一樣本; 識別適用於該經判定之樣本的一樣本輸入項; 自該識別之樣本輸入項獲得解碼該特定IRAP圖像所需的一參數集;及 基於該參數集判定該接收器件是否經組態以自該IRAP圖像開始解碼該多層位元流。
  22. 如請求項20之器件,其中該複數個播放軌包括一第一播放軌及一第二播放軌,該第二播放軌攜載用於該第一播放軌中攜載之一層的一參考層,該器件包含一或多個處理電路,其經組態以: 判定在該第一播放軌中且含有一特定IRAP圖像之一樣本; 識別該第二播放軌之一樣本輸入項,其中以下中之至少一者: 該經識別之樣本輸入項適用於與該經判定之該第一播放軌之樣本依時共置的該第二播放軌之一樣本,或 當無該第二播放軌之樣本與該經判定之該第一播放軌之樣本依時共置時,該經識別之樣本輸入項適用於該第二播放軌中之一解碼時間小於但最接近於該經判定之該第一播放軌之樣本之一解碼時間之一樣本; 自該識別之樣本輸入項獲得解碼該特定IRAP圖像所需的一參數集;及 基於該參數集判定該接收器件是否經組態以自該特定IRAP圖像開始解碼該多層位元流。
  23. 如請求項20之器件,其進一步包含一或多個處理電路,其經組態以執行: 判定含有一IRAP圖像之一樣本; 自該經判定之樣本獲得解碼該IRAP圖像所需的一參數集;及 基於該等參數集判定該接收器件是否經組態以自該IRAP圖像開始解碼該位元流。
  24. 如請求項20之器件,其中該複數個播放軌包括一第一播放軌及一第二播放軌,該第二播放軌攜載該第一播放軌中攜載之一層的一參考層,該器件包含一或多個處理電路,其經組態以: 判定含有一IRAP圖像之一樣本,該樣本在該第一播放軌中, 識別該第二播放軌之一依時共置的樣本; 自該經識別之樣本獲得解碼該IRAP圖像所需的一參數集;及 基於該等參數集判定該接收器件是否經組態以自該IRAP圖像開始解碼該位元流。
  25. 如請求項20之器件,其中,對於該複數個IRAP圖像之一特定IRAP圖像,以下中之至少一者: 解碼該特定IRAP圖像所需的一第一參數集藉由存在於該特定IRAP圖像的樣本中之一或多個提取器之一第一集合參考,及 解碼該特定IRAP圖像所需的一第二參數集藉由存在於該複數個播放軌中攜載該特定IRAP圖像之層之一參考層的一播放軌中之該特定IRAP圖像之一依時共置的樣本中之一或多個提取器之一第二集合參考。
  26. 如請求項20之器件,其中,對於該複數個非IRAP圖像中之每一各別非IRAP圖像: 該各別非IRAP圖像的層含有該各別非IRAP圖像且其為該多層位元流之一層,該各別非IRAP圖像的播放軌含有該各別非IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別非IRAP圖像的播放軌,且 該限制進一步需要解碼該各別非IRAP圖像所需的該等參數集中之每一者在以下中之至少一者中: 該各別非IRAP圖像之播放軌中適用於該各別非IRAP圖像的樣本之一樣本輸入項, 用於該各別非IRAP圖像的攜載該各別非IRAP圖像的層之一參考層的一非對應播放軌之一樣本輸入項,用於該各別非IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別非IRAP圖像的播放軌以外的一播放軌,用於該各別非IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別非IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別非IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別非IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別非IRAP圖像之樣本之一解碼時間的一樣本, 該各別非IRAP圖像的播放軌之任何樣本,其該各別非IRAP圖像的層中之一前一含有IRAP圖像的樣本之後及直至該各別非IRAP圖像的樣本(包括在內),及 該複數個播放軌中攜載該各別非IRAP圖像之層的任何參考層的任何播放軌的任何樣本,該樣本在該各別非IRAP圖像之層中的該前一含有IRAP圖像之樣本的一依時共置樣本之後及直至該各別非IRAP圖像之樣本的一依時共置樣本(包括在內)。
  27. 如請求項26之器件,其中,對於該複數個非IRAP圖像之一特定非IRAP圖像,以下中之至少一者: 解碼該特定非IRAP圖像所需的一第一參數集藉由存在於該特定非IRAP圖像的播放軌之一樣本中之一或多個提取器之一第一集合參考,該樣本在該特定非IRAP圖像之層中之含有一IRAP圖像之一前一樣本之後直至該特定非IRAP圖像的樣本(包括在內),及 解碼該特定非IRAP圖像所需的一第二參數集藉由存在於攜載該特定非IRAP圖像的層之一參考層的一播放軌中之一樣本中之一或多個提取器的一第二集合參考,該樣本在該特定非IRAP圖像之層中之含有該IRAP圖像之該前一樣本之一依時共置樣本之後直至該特定非IRAP圖像之樣本之一依時共置樣本(包括在內)。
  28. 如請求項20之器件,該複數個參數集包括以下中之至少一者:如ISO/IEC 23008-2中所定義之一視訊參數集、如ISO/IEC 23008-2中所定義之一序列參數集,及如ISO/IEC 23008-2中所定義之一圖像參數集。
  29. 一種處理視訊資料之方法,該方法包含: 獲得儲存一多層位元流之一檔案,該檔案遵從該檔案所符合之一檔案格式中指定之一限制,其中: 該多層位元流包含複數個參數集、該視訊資料之複數個框內隨機存取圖像(IRAP)圖像之經編碼表示及該視訊資料之複數個非IRAP圖像之經編碼表示, 對於該檔案之複數個播放軌中之每一各別播放軌,用於該各別播放軌之媒體內容包含一各別序列之樣本, 對於該複數個IRAP圖像中之每一各別IRAP圖像: 該各別IRAP圖像的層含有該各別IRAP圖像且其為該多層位元流之一層,該各別IRAP圖像的播放軌含有該各別IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別IRAP圖像的播放軌, 該限制要求解碼該各別IRAP圖像所需的該複數個參數集中之每一參數集在以下中之至少一者中: 該各別IRAP圖像之播放軌中適用於該各別IRAP圖像之樣本的一樣本輸入項, 用於該各別IRAP圖像的攜載該各別IRAP圖像之層之一參考層之一非對應播放軌的一樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別IRAP圖像之樣本的一解碼時間的一樣本, 該各別IRAP圖像的樣本,及 該複數個播放軌中攜載該各別IRAP圖像之層之一參考層的一播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及 解碼該檔案中之該多層位元流的至少一部分。
  30. 如請求項29之方法,其中獲得該檔案包含逐步下載該檔案。
  31. 如請求項29之方法,其中該複數個播放軌包括一特定播放軌,該方法進一步包含: 判定在該特定播放軌中且含有一特定IRAP圖像之一樣本; 識別適用於該經判定之樣本的一樣本輸入項; 自該識別之樣本輸入項獲得解碼該特定IRAP圖像所需的一參數集;及 基於該參數集判定是否自該IRAP圖像開始解碼該多層位元流。
  32. 如請求項29之方法,其中該複數個播放軌包括一第一播放軌及一第二播放軌,該第二播放軌攜載用於該第一播放軌中攜載之一層的一參考層,該方法進一步包含: 判定在該第一播放軌中且含有一特定IRAP圖像之一樣本; 識別該第二播放軌之一樣本輸入項,其中以下中之至少一者: 該經識別之樣本輸入項適用於與該經判定之該第一播放軌之樣本依時共置的該第二播放軌之一樣本,或 當無該第二播放軌之樣本與該經判定之該第一播放軌之樣本依時共置時,該經識別之樣本輸入項適用於該第二播放軌中之一解碼時間小於但最接近於該經判定之該第一播放軌之樣本之一解碼時間之一樣本; 自該經識別之樣本輸入項獲得解碼該特定IRAP圖像所需的一參數集;及 基於該參數集判定是否自該特定IRAP圖像開始解碼該多層位元流。
  33. 如請求項29之方法,其進一步包含: 判定含有一IRAP圖像之一樣本; 自該經判定之樣本獲得解碼該IRAP圖像所需的一參數集;及 基於該等參數集判定是否自該IRAP圖像開始解碼該位元流。
  34. 如請求項29之方法,其中該複數個播放軌包括一第一播放軌及一第二播放軌,該第二播放軌攜載該第一播放軌中攜載之一層的一參考層,該方法進一步包含: 判定含有一IRAP圖像之一樣本,該樣本在該第一播放軌中, 識別該第二播放軌之一依時共置的樣本; 自該經識別之樣本獲得解碼該IRAP圖像所需的一參數集;及 基於該等參數集判定是否自該IRAP圖像開始解碼該位元流。
  35. 如請求項29之方法,其中,對於該複數個IRAP圖像中之一特定IRAP圖像,以下中之至少一者: 解碼該特定IRAP圖像所需的一第一參數集藉由存在於該特定IRAP圖像的樣本中之一或多個提取器之一第一集合參考,及 解碼該特定IRAP圖像所需的一第二參數集藉由存在於該複數個播放軌中攜載該特定IRAP圖像之層之一參考層的一播放軌中之該特定IRAP圖像之一依時共置的樣本中之一或多個提取器之一第二集合參考。
  36. 如請求項29之方法,其中,對於該複數個非IRAP圖像之每一各別非IRAP圖像: 該各別非IRAP圖像的層含有該各別非IRAP圖像且其為該多層位元流之一層,該各別非IRAP圖像的播放軌含有該各別非IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別非IRAP圖像的播放軌,且 該限制進一步需要解碼該各別非IRAP圖像所需的該等參數集中之每一者在以下中之至少一者中: 該各別非IRAP圖像之播放軌中適用於該各別非IRAP圖像的樣本之一樣本輸入項, 用於該各別非IRAP圖像的攜載該各別非IRAP圖像的層之一參考層的一非對應播放軌之一樣本輸入項,用於該各別非IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別非IRAP圖像的播放軌以外的一播放軌,用於該各別非IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別非IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別非IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別非IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別非IRAP圖像之樣本之一解碼時間的一樣本, 該各別非IRAP圖像的播放軌之任何樣本,其在該各別非IRAP圖像的層中之一前一含有IRAP圖像的樣本之後及直至該各別非IRAP圖像的樣本(包括在內),及 該複數個播放軌中攜載該各別非IRAP圖像之層的任何參考層的任何播放軌的任何樣本,其在該各別非IRAP圖像之層中的該前一含有IRAP圖像之樣本的一依時共置樣本之後及直至該各別非IRAP圖像之樣本的一依時共置樣本(包括在內)。
  37. 如請求項36之方法,其中,對於該複數個非IRAP圖像中之一特定非IRAP圖像,以下中之至少一者: 解碼該特定非IRAP圖像所需的一第一參數集藉由存在於該特定非IRAP圖像的播放軌之一樣本中之一或多個提取器之一第一集合參考,該樣本在該特定非IRAP圖像之層中之含有一IRAP圖像之一前一樣本之後直至該特定非IRAP圖像的樣本(包括在內),及 解碼該特定非IRAP圖像所需的一第二參數集藉由存在於攜載該特定非IRAP圖像的層之一參考層的一播放軌中之一樣本中之一或多個提取器的一第二集合參考,該樣本在該特定非IRAP圖像之層中之含有該IRAP圖像之該前一樣本之一依時共置樣本之後直至該特定非IRAP圖像之樣本之一依時共置樣本(包括在內)。
  38. 如請求項29之方法,該複數個參數集包括以下中之至少一者:如ISO/IEC 23008-2中所定義之一視訊參數集、如ISO/IEC 23008-2中所定義之一序列參數集,及如ISO/IEC 23008-2中所定義之一圖像參數集。
  39. 一種用於處理視訊資料之器件,該器件包含: 一輸入介面,其經組態以獲得儲存一多層位元流之一檔案,該檔案遵從該檔案所符合之一檔案格式中指定之一限制,其中: 該多層位元流包含複數個參數集、該視訊資料之複數個框內隨機存取圖像(IRAP)圖像之經編碼表示及該視訊資料之複數個非IRAP圖像之經編碼表示, 對於該檔案之複數個播放軌之每一各別播放軌,用於該各別播放軌之媒體內容包含一各別序列之樣本, 對於該複數個IRAP圖像中之每一各別IRAP圖像: 該各別IRAP圖像的層含有該各別IRAP圖像且其為該多層位元流之一層,該各別IRAP圖像的播放軌含有該各別IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別IRAP圖像的播放軌, 該限制要求解碼該各別IRAP圖像所需的該複數個參數集中之每一參數集在以下中之至少一者中: 該各別IRAP圖像之播放軌中適用於該各別IRAP圖像之樣本的一樣本輸入項, 用於該各別IRAP圖像的攜載該各別IRAP圖像之層之一參考層之一非對應播放軌的一樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別IRAP圖像之樣本的一解碼時間的一樣本, 該各別IRAP圖像的樣本,及 該複數個播放軌中攜載該各別IRAP圖像之層之一參考層的一播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及 一或多個處理電路,其經耦接至該輸入介面,該一或多個處理電路經組態以解碼該檔案中之該多層位元流的至少一部分。
  40. 如請求項39之器件,其中該輸入介面經組態使得作為獲得該檔案之部分,該輸入介面逐步下載該檔案。
  41. 如請求項39之器件,其中該複數個播放軌包括一特定播放軌,該一或多個處理電路經組態以: 判定在該特定播放軌中且含有一特定IRAP圖像之一樣本; 識別適用於該經判定之樣本的一樣本輸入項; 自該經識別之樣本輸入項獲得解碼該特定IRAP圖像所需的一參數集;及 基於該參數集判定是否自該IRAP圖像開始解碼該多層位元流。
  42. 如請求項39之器件,其中該複數個播放軌包括一第一播放軌及一第二播放軌,該第二播放軌攜載用於該第一播放軌中攜載之一層的一參考層,該器件包含一或多個處理電路,其經組態以: 判定在該第一播放軌中且含有一特定IRAP圖像之一樣本; 識別該第二播放軌之一樣本輸入項,其中以下中之至少一者: 該經識別之樣本輸入項適用於與該經判定之該第一播放軌之樣本依時共置的該第二播放軌之一樣本,或 當無該第二播放軌之樣本與該經判定之該第一播放軌之樣本依時共置時,該經識別之樣本輸入項適用於該第二播放軌中之一解碼時間小於但最接近於該經判定之該第一播放軌之樣本之一解碼時間之一樣本; 自該經識別之樣本輸入項獲得解碼該特定IRAP圖像所需的一參數集;及 基於該參數集判定是否自該特定IRAP圖像開始解碼該多層位元流。
  43. 如請求項39之器件,其中該一或多個處理電路經組態以: 判定含有一IRAP圖像之一樣本; 自該經判定之樣本獲得解碼該IRAP圖像所需的一參數集;及 基於該等參數集判定是否自該IRAP圖像開始解碼該位元流。
  44. 如請求項39之器件,其中該複數個播放軌包括一第一播放軌及一第二播放軌,該第二播放軌攜載該第一播放軌中攜載之一層的一參考層,該一或多個處理電路經組態以: 判定含有一IRAP圖像之一樣本,該樣本在該第一播放軌中, 識別該第二播放軌之一依時共置的樣本; 自該經識別之樣本獲得解碼該IRAP圖像所需的一參數集;及 基於該等參數集判定是否自該IRAP圖像開始解碼該位元流。
  45. 如請求項39之器件,其中,對於該複數個IRAP圖像中之一特定IRAP圖像,以下中之至少一者: 解碼該特定IRAP圖像所需的一第一參數集藉由存在於該特定IRAP圖像的樣本中之一或多個提取器之一第一集合參考,及 解碼該特定IRAP圖像所需的一第二參數集藉由存在於該複數個播放軌中攜載該特定IRAP圖像之層之一參考層的一播放軌中之該特定IRAP圖像之一依時共置的樣本中之一或多個提取器之一第二集合參考。
  46. 如請求項39之器件,其中,對於該複數個非IRAP圖像中之每一各別非IRAP圖像: 該各別非IRAP圖像的層含有該各別非IRAP圖像且其為該多層位元流之一層,該各別非IRAP圖像的播放軌含有該各別非IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別非IRAP圖像的播放軌,且 該限制進一步需要解碼該各別非IRAP圖像所需的該等參數集中之每一者在以下中之至少一者中: 該各別非IRAP圖像之播放軌中適用於該各別非IRAP圖像的樣本之一樣本輸入項, 用於該各別非IRAP圖像的攜載該各別非IRAP圖像的層之一參考層的一非對應播放軌之一樣本輸入項,用於該各別非IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別非IRAP圖像的播放軌以外的一播放軌,用於該各別非IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別非IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別非IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別非IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別非IRAP圖像之樣本之一解碼時間的一樣本, 該各別非IRAP圖像的播放軌之任何樣本,其在該各別非IRAP圖像的層中之一前一含有IRAP圖像的樣本之後及直至該各別非IRAP圖像的樣本(包括在內),及 該複數個播放軌中攜載該各別非IRAP圖像之層的任何參考層的任何播放軌的任何樣本,其在該各別非IRAP圖像之層中的該前一含有IRAP圖像之樣本的一依時共置樣本之後及直至該各別非IRAP圖像之樣本的一依時共置樣本(包括在內)。
  47. 如請求項46之器件,其中,對於該複數個非IRAP圖像中之一特定非IRAP圖像,以下中之至少一者: 解碼該特定非IRAP圖像所需的一第一參數集藉由存在於該特定非IRAP圖像的播放軌之一樣本中之一或多個提取器之一第一集合參考,該樣本在該特定非IRAP圖像之層中之含有一IRAP圖像之一前一樣本之後直至該特定非IRAP圖像的樣本(包括在內),及 解碼該特定非IRAP圖像所需的一第二參數集藉由存在於攜載該特定非IRAP圖像的層之一參考層的一播放軌中之一樣本中之一或多個提取器的一第二集合參考,該樣本在該特定非IRAP圖像之層中之含有該IRAP圖像之該前一樣本之一依時共置樣本之後直至該特定非IRAP圖像之樣本之一依時共置樣本(包括在內)。
  48. 如請求項39之器件,該複數個參數集包括以下中之至少一者:如ISO/IEC 23008-2中所定義之一視訊參數集、如ISO/IEC 23008-2中所定義之一序列參數集,及如ISO/IEC 23008-2中所定義之一圖像參數集。
  49. 一種用於處理視訊資料之器件,該器件包含: 用於獲得一多層位元流之構件,該多層位元流包含複數個參數集、該視訊資料之複數個框內隨機存取圖像(IRAP)圖像之經編碼表示及該視訊資料之複數個非IRAP圖像之經編碼表示;及 用於產生用於儲存該多層位元流之一檔案而使得該檔案遵從該檔案所符合之一檔案格式中指定之一限制的構件,其中: 對於該檔案之複數個播放軌中之每一各別播放軌,用於該各別播放軌之媒體內容包含一各別序列之樣本, 對於該複數個IRAP圖像中之每一各別IRAP圖像: 該各別IRAP圖像的層含有該各別IRAP圖像且其為該多層位元流之一層,該各別IRAP圖像的播放軌含有該各別IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別IRAP圖像的播放軌, 該限制要求解碼該各別IRAP圖像所需的該複數個參數集中之每一參數集在以下中之至少一者中: 該各別IRAP圖像之播放軌中適用於該各別IRAP圖像之樣本的一樣本輸入項, 用於該各別IRAP圖像的攜載該各別IRAP圖像之層之一參考層之一非對應播放軌的一樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別IRAP圖像之樣本的一解碼時間的一樣本, 該各別IRAP圖像的樣本,及 該複數個播放軌中攜載該各別IRAP圖像之層之一參考層的一播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本。
  50. 一種包含指令之電腦可讀儲存媒體,該等指令在執行時使一器件: 獲得一多層位元流,該多層位元流包含複數個參數集、該視訊資料之複數個框內隨機存取圖像(IRAP)圖像之經編碼表示及該視訊資料之複數個非IRAP圖像之經編碼表示;及 產生用於儲存該多層位元流之一檔案,使得該檔案遵從該檔案所符合之一檔案格式中指定之一限制,其中: 對於該檔案之複數個播放軌中之每一各別播放軌,用於該各別播放軌之媒體內容包含一各別序列之樣本, 對於該複數個IRAP圖像中之每一各別IRAP圖像: 該各別IRAP圖像的層含有該各別IRAP圖像且其為該多層位元流之一層,該各別IRAP圖像的播放軌含有該各別IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別IRAP圖像的播放軌, 該限制要求解碼該各別IRAP圖像所需的該複數個參數集中之每一參數集在以下中之至少一者中: 該各別IRAP圖像之播放軌中適用於該各別IRAP圖像的樣本之一樣本輸入項, 用於該各別IRAP圖像的攜載該各別IRAP圖像之層之一參考層之一非對應播放軌的一樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的該非對應播放軌中之一依時共置的樣本或 當用於該各別IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別IRAP圖像之樣本的一解碼時間的一樣本, 該各別IRAP圖像的樣本,及 該複數個播放軌中攜載該各別IRAP圖像之層之一參考層的一播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本。
  51. 一種用於處理視訊資料之器件,該器件包含: 用於儲存將一多層位元流進行儲存之一檔案之構件,該檔案遵從該檔案所符合之一檔案格式中指定之一限制,其中: 該多層位元流包含複數個參數集、該視訊資料之複數個框內隨機存取圖像(IRAP)圖像之經編碼表示及該視訊資料之複數個非IRAP圖像之經編碼表示, 對於該檔案之複數個播放軌中之每一各別播放軌,用於該各別播放軌之媒體內容包含一各別序列之樣本, 對於該複數個IRAP圖像中之每一各別IRAP圖像: 該各別IRAP圖像的層含有該各別IRAP圖像且其為該多層位元流之一層,該各別IRAP圖像的播放軌含有該各別IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別IRAP圖像的播放軌, 該限制要求解碼該各別IRAP圖像所需的該複數個參數集中之每一參數集在以下中之至少一者中: 該各別IRAP圖像之播放軌中適用於該各別IRAP圖像的樣本之一樣本輸入項, 用於該各別IRAP圖像的攜載該各別IRAP圖像的層之一參考層的一非對應播放軌之一樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別IRAP圖像的播放軌以外的一播放軌,用於該各別IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別IRAP圖像之樣本之一解碼時間的一樣本, 該各別IRAP圖像的樣本,及 該複數個播放軌中攜載該各別IRAP圖像之層之一參考層的一播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及 用於將該檔案之至少一部分串流至一接收器件之構件。
  52. 一種經組態以儲存指令的電腦可讀儲存媒體,該等指令在執行時使一器件: 儲存將一多層位元流進行儲存之一檔案,該檔案遵從該檔案所符合之一檔案格式中指定之一限制,其中: 該多層位元流包含複數個參數集、該視訊資料之複數個框內隨機存取圖像(IRAP)圖像之經編碼表示及該視訊資料之複數個非IRAP圖像之經編碼表示, 對於該檔案之複數個播放軌中之每一各別播放軌,用於該各別播放軌之媒體內容包含一各別序列之樣本, 對於該複數個IRAP圖像中之每一各別IRAP圖像: 該各別IRAP圖像的層含有該各別IRAP圖像且其為該多層位元流之一層,該各別IRAP圖像的播放軌含有該各別IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別IRAP圖像的播放軌, 該限制要求解碼該各別IRAP圖像所需的該複數個參數集中之每一參數集在以下中之至少一者中: 該各別IRAP圖像之播放軌中適用於該各別IRAP圖像的樣本之一樣本輸入項, 用於該各別IRAP圖像的攜載該各別IRAP圖像的層之一參考層的一非對應播放軌之一樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別非IRAP圖像的播放軌以外的一播放軌,用於該各別非IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別IRAP圖像之樣本之一解碼時間的一樣本, 該各別IRAP圖像的樣本,及 該複數個播放軌中攜載該各別IRAP圖像之層之一參考層的一播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及 將該檔案之至少一部分串流至一接收器件。
  53. 一種用於處理視訊資料之器件,該器件包含: 用於獲得儲存一多層位元流之一檔案之構件,該檔案遵從該檔案所符合之一檔案格式中指定之一限制,其中: 該多層位元流包含複數個參數集、該視訊資料之複數個框內隨機存取圖像(IRAP)圖像之經編碼表示及該視訊資料之複數個非IRAP圖像之經編碼表示, 對於該檔案之複數個播放軌中之每一各別播放軌,用於該各別播放軌之媒體內容包含一各別序列之樣本, 對於該複數個IRAP圖像中之每一各別IRAP圖像: 該各別IRAP圖像的層含有該各別IRAP圖像且其為該多層位元流之一層,該各別IRAP圖像的播放軌含有該各別IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別IRAP圖像的播放軌, 該限制要求解碼該各別IRAP圖像所需的該複數個參數集中之每一參數集在以下中之至少一者中: 該各別IRAP圖像之播放軌中適用於該各別IRAP圖像的樣本之一樣本輸入項, 用於該各別IRAP圖像的攜載該各別IRAP圖像的層之一參考層的一非對應播放軌之一樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別IRAP圖像的播放軌以外的一播放軌,用於該各別IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別IRAP圖像之樣本之一解碼時間的一樣本, 該各別IRAP圖像的樣本,及 該複數個播放軌中攜載該各別IRAP圖像的層之一參考層的一播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及 用於解碼該檔案中之該多層位元流的至少一部分之構件。
  54. 一種其上儲存有指令的電腦可讀儲存媒體,該等指令在執行時使一器件: 獲得儲存一多層位元流之一檔案,該檔案遵從該檔案所符合之一檔案格式中指定之一限制,其中: 該多層位元流包含複數個參數集、該視訊資料之複數個框內隨機存取圖像(IRAP)圖像之經編碼表示及該視訊資料之複數個非IRAP圖像之經編碼表示, 對於該檔案之複數個播放軌中之每一各別播放軌,用於該各別播放軌之媒體內容包含一各別序列之樣本, 對於該複數個IRAP圖像中之每一各別IRAP圖像: 該各別IRAP圖像的層含有該各別IRAP圖像且其為該多層位元流之一層,該各別IRAP圖像的播放軌含有該各別IRAP圖像的樣本,該各別IRAP圖像的樣本含有該各別IRAP圖像,且該複數個播放軌包括該各別IRAP圖像的播放軌, 該限制要求解碼該各別IRAP圖像所需的該複數個參數集中之每一參數集在以下中之至少一者中: 該各別IRAP圖像之播放軌中適用於該各別IRAP圖像的樣本之一樣本輸入項, 用於該各別IRAP圖像的攜載該各別IRAP圖像之層之一參考層之一非對應播放軌的一樣本輸入項,用於該各別IRAP圖像之該非對應播放軌為除該複數個播放軌中之該各別IRAP圖像之播放軌以外的一播放軌,用於該各別IRAP圖像之該非對應播放軌之該樣本輸入項適用於該各別IRAP圖像的該非對應播放軌中之一依時共置的樣本或,當用於該各別IRAP圖像之該非對應播放軌中之該依時共置的樣本不存在時,適用於該各別IRAP圖像之該非對應播放軌中之一解碼時間小於但最接近於該各別IRAP圖像之樣本的一解碼時間的一樣本, 該各別IRAP圖像的樣本,及 該複數個播放軌中攜載該各別IRAP圖像之層之一參考層的一播放軌中之該各別IRAP圖像的樣本之任何依時共置的樣本;及 解碼該檔案中之該多層位元流的至少一部分。
TW105131114A 2015-10-14 2016-09-26 多層位元流之檔案中之參數集信令 TWI676387B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201562241683P 2015-10-14 2015-10-14
US62/241,683 2015-10-14
US15/274,544 US10306253B2 (en) 2015-10-14 2016-09-23 Signaling of parameter sets in files of multi-layer bitstreams
US15/274,544 2016-09-23

Publications (2)

Publication Number Publication Date
TW201715886A true TW201715886A (zh) 2017-05-01
TWI676387B TWI676387B (zh) 2019-11-01

Family

ID=57104205

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105131114A TWI676387B (zh) 2015-10-14 2016-09-26 多層位元流之檔案中之參數集信令

Country Status (7)

Country Link
US (1) US10306253B2 (zh)
EP (1) EP3363203B1 (zh)
KR (1) KR102057404B1 (zh)
CN (1) CN108141616B (zh)
BR (1) BR112018007540A2 (zh)
TW (1) TWI676387B (zh)
WO (1) WO2017065966A1 (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11197040B2 (en) * 2016-10-17 2021-12-07 Mediatek Inc. Deriving and signaling a region or viewport in streaming media
EP3563571A4 (en) * 2016-12-30 2020-02-12 Telefonaktiebolaget LM Ericsson (publ) DECODED IMAGE BUFFER MEMORY MANAGEMENT FOR PROCESSING PREDICTION OF CROSS IMAGE DATA
CN113196771B (zh) 2018-12-21 2023-12-22 北京字节跳动网络技术有限公司 基于运动矢量精度的运动矢量范围
US11825156B1 (en) * 2020-02-25 2023-11-21 Axon Enterprise, Inc. Computer system for processing multiplexed digital multimedia files
WO2021201598A1 (ko) * 2020-03-31 2021-10-07 엘지전자 주식회사 레이어간 참조 여부에 기반하여 서브 레이어를 결정하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
GB2593897B (en) * 2020-04-06 2024-02-14 Canon Kk Method, device, and computer program for improving random picture access in video streaming
KR102629799B1 (ko) 2020-04-07 2024-01-25 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 상위 레벨 신택스에서의 인터 예측에 대한 시그널링
EP4118825A4 (en) 2020-04-09 2023-08-09 Beijing Bytedance Network Technology Co., Ltd. UNLOCKING SIGNALING IN VIDEO CODING
WO2021204251A1 (en) 2020-04-10 2021-10-14 Beijing Bytedance Network Technology Co., Ltd. Use of header syntax elements and adaptation parameter set
CN115868159A (zh) * 2020-04-17 2023-03-28 抖音视界有限公司 自适应参数集单元的存在
KR20230002447A (ko) 2020-04-26 2023-01-05 바이트댄스 아이엔씨 비디오 코딩 신택스 요소의 조건적 시그널링
WO2021222040A1 (en) * 2020-04-27 2021-11-04 Bytedance Inc. Virtual boundaries in video coding
US11711518B2 (en) 2020-09-17 2023-07-25 Lemon Inc. Decoding capability information storage in video coding
US11770498B2 (en) 2020-09-29 2023-09-26 Lemon Inc. Supplemental enhancement information for multi-layer video streams
US11611752B2 (en) 2020-10-07 2023-03-21 Lemon Inc. Adaptation parameter set storage in video coding
EP4218244A4 (en) * 2020-10-26 2024-03-13 Beijing Bytedance Network Technology Co., Ltd. DECODER CONFIGURATION INFORMATION IN VCP VIDEO ENCODING
WO2023200291A1 (ko) * 2022-04-14 2023-10-19 엘지전자 주식회사 포인트 클라우드 데이터의 전송 장치와 이 전송 장치에서 수행되는 방법 및, 포인트 클라우드 데이터의 수신 장치와 이 수신 장치에서 수행되는 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9357199B2 (en) * 2013-01-04 2016-05-31 Qualcomm Incorporated Separate track storage of texture and depth views for multiview coding plus depth
US9596486B2 (en) * 2013-04-05 2017-03-14 Qualcomm Incorporated IRAP access units and bitstream switching and splicing
US9621919B2 (en) 2013-10-23 2017-04-11 Qualcomm Incorporated Multi-layer video file format designs

Also Published As

Publication number Publication date
EP3363203A1 (en) 2018-08-22
US10306253B2 (en) 2019-05-28
CN108141616A (zh) 2018-06-08
EP3363203B1 (en) 2020-03-04
KR102057404B1 (ko) 2019-12-18
KR20180066098A (ko) 2018-06-18
WO2017065966A1 (en) 2017-04-20
US20170111649A1 (en) 2017-04-20
BR112018007540A2 (pt) 2018-10-23
TWI676387B (zh) 2019-11-01
CN108141616B (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
TWI676387B (zh) 多層位元流之檔案中之參數集信令
TWI777953B (zh) 以高效率視訊寫碼及分層高效率視訊寫碼檔案格式之圖塊分組及樣本之映射
TWI651961B (zh) 於多層位元流檔案格式中操作點取樣群組之對齊
TWI645710B (zh) 多層視訊檔案格式設計
TWI675588B (zh) 於分層視訊檔案格式中之樣本條目及操作點發訊設計
CN108353191B (zh) 用于处理视频数据的方法、装置和计算机可读存储介质
CN110178379B (zh) 以文件格式用信号表示重要视频信息的方法和设备
TWI659319B (zh) 用於在檔案格式中樣本分組發信號之方法及器件
TWI699115B (zh) 用於視訊之改良式限制方案設計
JP2015519807A (ja) ビデオ・ファイルにおけるパラメータ・セットを識別すること
KR20230175242A (ko) Eos 샘플 그룹에 기반한 미디어 파일 생성/수신 방법,장치 및 미디어 파일 전송 방법

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees