TWI651961B - 於多層位元流檔案格式中操作點取樣群組之對齊 - Google Patents

於多層位元流檔案格式中操作點取樣群組之對齊 Download PDF

Info

Publication number
TWI651961B
TWI651961B TW105133286A TW105133286A TWI651961B TW I651961 B TWI651961 B TW I651961B TW 105133286 A TW105133286 A TW 105133286A TW 105133286 A TW105133286 A TW 105133286A TW I651961 B TWI651961 B TW I651961B
Authority
TW
Taiwan
Prior art keywords
track
operation point
sample
file
sampling
Prior art date
Application number
TW105133286A
Other languages
English (en)
Other versions
TW201720148A (zh
Inventor
伏努 亨利
王益魁
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW201720148A publication Critical patent/TW201720148A/zh
Application granted granted Critical
Publication of TWI651961B publication Critical patent/TWI651961B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

一種設備獲得檔案中之一操作點參考播放軌及檔案中之一或多個額外播放軌。無操作點資訊取樣群組係在該等額外播放軌之任一者中傳信。對於該一或多個額外播放軌中之每一各別額外播放軌之每一各別取樣,該設備判定是否將各別取樣考慮為該操作點資訊取樣群組之部分。基於該操作點參考播放軌不含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為在該各別額外播放軌之該各別取樣之前的該操作點參考播放軌中之最後取樣的一操作點資訊取樣群組之部分。

Description

於多層位元流檔案格式中操作點取樣群組之對齊
本發明係關於視訊編碼及解碼。
數位視訊能力可併入至廣泛範圍之裝置中,包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位攝影機、數位記錄裝置、數位媒體播放器、視訊遊戲裝置、視訊遊戲控制台、蜂巢式或衛星無線電電話、所謂的「智慧型電話」、視訊電話會議裝置、視訊串流裝置及其類似者。數位視訊裝置實施視訊壓縮技術,諸如,由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分進階視訊寫碼(AVC)定義之標準、高效率視訊寫碼(HEVC)標準及此等標準之延伸中所描述的技術。視訊裝置可藉由實施此等視訊壓縮技術更有效地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。 視訊壓縮技術執行空間(圖像內)預測及/或時間(圖像間)預測來減少或移除視訊序列中固有之冗餘。對於基於區塊之視訊寫碼,可將視訊圖塊(亦即,視訊圖框或視訊圖框之部分)分割成視訊區塊。圖像之經框內寫碼(I)圖塊中的視訊區塊係使用關於同一圖像中之相鄰區塊中之參考取樣的空間預測來編碼。圖像之框間寫碼(P或B)圖塊中之視訊區塊可使用關於同一圖像中之相鄰區塊中的參考取樣的空間預測或關於其他參考圖像中之參考取樣的時間預測。圖像可被稱作「圖框」。 空間或時間預測導致待寫碼區塊之預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。經框間寫碼區塊係根據指向形成預測性區塊之參考取樣之區塊的運動向量來編碼,且殘餘資料指示經寫碼區塊與預測性區塊之間的差。框內寫碼區塊係根據框內寫碼模式及殘餘資料編碼。為進行進一步壓縮,可將殘餘資料自像素域變換至變換域,從而產生殘餘係數,接著可量化該等殘餘係數。
一般而言,本發明係關於以基於ISO之媒體檔案格式及基於其導出之檔案格式儲存視訊內容。更特定言之,本發明描述用於當檔案內之播放軌的取樣未對齊時界定操作點取樣群組的技術。應注意術語「操作點」在本文件中可互換地使用。 在一個實例中,本發明描述一種處理檔案之方法,該方法包含:獲得檔案中之操作點參考播放軌,其中可供用於檔案中之位元串流的操作點係使用在操作點參考播放軌中傳信的操作點資訊取樣群組在檔案中描述;獲得檔案中之一或多個額外播放軌,其中無操作點資訊取樣群組係在額外播放軌中之任一者中傳信;對於一或多個額外播放軌之每一各別額外播放軌的每一各別取樣,判定是否將各別取樣考慮為操作點資訊取樣群組之部分,其中:基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為操作點資訊取樣群組之部分,且基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分;及執行自位元串流提取操作點之子位元串流提取程序。 在另一實例中,本發明描述一種產生檔案之方法,該方法包含:產生檔案中之操作點參考播放軌,其中產生操作點參考播放軌包含在操作點參考播放軌中傳信描述可供用於檔案中之位元串流的操作點的操作點資訊取樣群組;及產生檔案中之一或多個額外播放軌,其中:無操作點資訊取樣群組係在額外播放軌中之任一者中傳信,基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為操作點資訊取樣群組之部分,且基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分。 在另一實例中,本發明描述一種用於處理檔案之設備,該設備包含:一記憶體,其經組態以儲存檔案;及耦接至該記憶體之一個或多個處理器,該一或多個處理器經組態以:獲得檔案中之操作點參考播放軌,其中可供用於檔案中之位元串流的操作點係使用在操作點參考播放軌中傳信的操作點資訊取樣群組在檔案中描述;獲得檔案中之一或多個額外播放軌,其中無操作點資訊取樣群組係在額外播放軌中之任一者中傳信;對於一或多個額外播放軌之每一各別額外播放軌之每一各別取樣,判定是否將各別取樣考慮為操作點資訊取樣群組之部分,其中:基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為操作點資訊取樣群組之部分,且基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣之操作點資訊取樣群組的部分;及執行自位元串流提取操作點的子位元串流提取程序。 在另一實例中,本發明描述一種用於產生檔案之設備,該設備包含:記憶體,其經組態以儲存檔案;及耦接至該記憶體之一個或多個處理器,該一或多個處理器經組態以:產生檔案中之操作點參考播放軌,其中產生操作點參考播放軌包含在操作點參考播放軌中傳信描述可供用於檔案中之位元串流之操作點的操作點資訊取樣群組;及產生檔案中之一或多個額外播放軌,其中:無操作點資訊取樣群組係在額外播放軌中之任一者中傳信,操作點資訊取樣群組,基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為操作點資訊取樣群組之部分,且基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分。 在另一實例中,本發明描述一種用於處理檔案之設備,該設備包含:用於獲得檔案中之操作點參考播放軌的構件,其中可供用於檔案中之位元串流的操作點係使用在操作點參考播放軌中傳信的操作點資訊取樣群組在檔案中描述;用於獲得檔案中之一或多個額外播放軌的構件,其中無操作點資訊取樣群組係在額外播放軌中之任一者中傳信;用於對於一或多個額外播放軌中之每一各別額外播放軌的每一各別取樣判定是否將各別取樣考慮為操作點資訊取樣群組之部分的構件,其中:基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為操作點資訊取樣群組之部分,且基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分;及用於執行提取操作點之子位元串流提取程序的構件。 在另一實例中,本發明描述一種用於產生檔案之設備,該設備包含:用於產生檔案中之操作點參考播放軌的構件,其中產生操作點參考播放軌包含在操作點參考播放軌中傳信描述可供用於檔案中之位元串流之操作點的操作點資訊取樣群組;及用於產生檔案中之一或多個額外播放軌的構件,其中:無操作點資訊取樣群組係在額外播放軌中之任一者中傳信,基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為操作點資訊取樣群組之部分,且基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分。 在另一實例中,本發明描述一種儲存指令之電腦可讀儲存媒體,該等指令當經執行時使得一個或多個處理器:獲得檔案中之操作點參考播放軌,其中可供用於檔案中之位元串流的操作點係使用在操作點參考播放軌中傳信的操作點資訊取樣群組在檔案中描述;獲得檔案中之一或多個額外播放軌,其中無操作點資訊取樣群組係在額外播放軌中之任一者中傳信;對於一或多個額外播放軌中之每一各別額外播放軌的每一各別取樣,判定是否將各別取樣考慮為操作點資訊取樣群組之部分,其中:基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為操作點資訊取樣群組之部分,且基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分;及執行自位元串流提取操作點的子位元串流提取程序。 在另一實例中,本發明描述一種儲存指令之電腦可讀儲存媒體,該等指令當經執行時使得一個或多個處理器:產生檔案中之操作點參考播放軌,其中產生操作點參考播放軌包含在操作點參考播放軌中傳信描述可供用於檔案中的位元串流之操作點的操作點資訊取樣群組;及產生檔案中之一或多個額外播放軌,其中:無操作點資訊取樣群組係在額外播放軌中之任一者中傳信,操作點資訊取樣群組,基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為操作點資訊取樣群組之部分,且基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分。 在附圖及以下描述中闡述本發明之一或多個實例的細節。其他特徵、目標及優勢自描述、圖式及申請專利範圍將係顯而易見的。
相關申請案 本申請案主張2015年10月14日申請之美國臨時專利申請案第62/241,691號之權益,該臨時專利申請案之全部內容以引用之方式併入本文中。 一般而言,本發明係關於用於產生並處理用於儲存經編碼視訊資料之多層位元串流(諸如分層高效視訊寫碼(L-HEVC)位元串流)的檔案的技術。多層位元串流包含多個層。每一層包含在不同輸出時間發生的一序列之經編碼圖像。在可調式視訊寫碼之情況下,多層位元串流之層可包括基層及一或多個增強層。基層可不參考增強層中之任一者來解碼。增強層可空間地或時間地增強基層之圖像。舉例而言,增強層可比基層具有較高的圖框速率。因此,增強層可包括輸出時間之經編碼圖像且基層不包括該輸出時間之經編碼圖像。在其中多層位元串流之第一層包括輸出時間之經編碼圖像且多層位元串流之第二層不包括輸出時間之經編碼圖像之情況下,第一層中之經編碼圖像被稱為未與第二層中之經編碼圖像對齊。在多視圖視訊寫碼中,多層位元串流之層可對應於不同視圖中之經編碼圖像。 多層位元串流之操作點可由多層位元串流中之一或多個層之集合及最大時間識別符界定。舉例而言,特定操作點可經界定為多層位元串流中之層的完整集合之特定子集及小於或等於多層位元串流中之最大時間識別符的最大時間識別符。可在不解碼多層位元串流之不在操作點中的經編碼圖像的情況下解碼多層位元串流之操作點中之經編碼圖像。 操作點出於多種原因而適用。舉例而言,裝置可選擇將多層位元串流之特定操作點轉遞至用戶端裝置,同時不轉遞多層位元串流之不在操作點中的部分。因此,經轉遞的資料量可減少。此在頻寬限定環境中可係合乎需要的。此外,相同多層位元串流之不同操作點可需要執行不同解碼器能力。因此,若解碼器能夠解碼多層位元串流之第一操作點,但不能夠解碼同一多層位元串流之第二操作點,則發送多層位元串流之在第二操作點中不在第一操作點中的資料可係浪費的。 國際標準組織(ISO)基本媒體檔案格式為用於儲存媒體資料(諸如音訊及視訊資料)的檔案格式。ISO基本媒體檔案格式已經擴展用於特定情境。舉例而言,正在進行擴展ISO基本媒體檔案格式以用於儲存L-HEVC位元串流的努力。在ISO基本媒體檔案格式中,媒體資料可經組織成一或多個播放軌。此外,在ISO基本媒體檔案格式及其擴展中,術語「取樣」適用於媒體存取單元,諸如視訊存取單元或音訊存取單元。然而,在編碼解碼器層級,術語「取樣」可適用於像素之色彩分量之值。視訊存取單元可包括一或多個具有同一輸出時間之經編碼圖像。不同播放軌可包括包含多層位元串流之不同層的經編碼圖像之取樣。在一些情況下,播放軌可包括包含多層位元串流的兩個或大於兩個層之經編碼圖像的取樣。在其他個例中,播放軌可包括僅僅包括多層位元串流之單層之經寫碼圖像的取樣。 ISO基本媒體檔案格式提供用於將取樣分群成「取樣群組」之機構。舉例而言,ISO基本媒體檔案格式係依據被稱作「方塊」(其可在彼此內部巢套)的資料結構而結構化。檔案之方塊可包括用於檔案之播放軌的播放軌方塊。用於播放軌之播放軌方塊包括關於播放軌之後設資料。舉例而言,播放軌方塊可包括包括一組取樣群組描述項的取樣描述方塊,該等項中之每一者包括取樣群組之描述。另外,用於播放軌之播放軌方塊可包括指示播放軌中一組取樣並指定取樣群組描述項方塊中之取樣群組描述項之索引的取樣至群組方塊,藉此指定所指示取樣所屬的取樣群組。 用於L-HEVC之ISO基本媒體檔案格式的擴展的草案提供操作點資訊取樣群組。屬於操作點資訊取樣群組的取樣包括包含操作點之經編碼圖像的取樣。用於操作點資訊取樣群組之取樣群組描述項可指定用於操作點之資訊,諸如,操作點之輸出層集、操作點之最大時間識別符及操作點之設定檔、層次及層級資訊的任何組合。指定檔案中之操作點資訊取樣群組可使得裝置能夠自檔案提取操作點而不需解譯底層經編碼視訊資料(諸如L-HEVC資料)。因此,前述可簡化裝置並增加回應性。 用於L-HEVC的ISO基本媒體檔案格式之擴展的草案指定檔案中之取樣至群方塊及取樣群組描述方塊係包含在用於檔案之僅僅一個播放軌(亦即,操作點參考播放軌)的後設資料中。如上文所提,用於播放軌的播放軌方塊中之取樣至群組方塊指定播放軌中之取樣。然而,亦如上文提及,多層位元串流之層可包括於不同播放軌中且層可包括未對齊之經編碼圖像。因此,用於操作點參考播放軌的播放軌方塊中之取樣至群組方塊可不能夠指示額外播放軌之特定取樣係在操作點資訊取樣群組中。舉例而言,當操作點參考播放軌包括在輸出時間1、3及5之取樣,且額外播放軌包括在輸出時間1、2、3、4、5及6的取樣時,取樣至群組方塊可不能夠指定在輸出時間6之額外播放軌的取樣為操作點取樣群組的部分,儘管在輸出時間6之額外播放軌的取樣中之經編碼圖像恰當地為操作點取樣群組所對應於的操作點之部分。因此,裝置可能能夠恰當地自檔案提取操作點。在本發明中,當播放軌包括屬於取樣群組之取樣時,播放軌可稱為含有取樣群組。 本發明描述解決此問題之各種技術。舉例而言,對於一或多個額外播放軌中之每一各別額外播放軌之每一各別取樣,裝置可判定是否將各別取樣考慮為操作點資訊取樣群組之部分。在此實例中,基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為操作點資訊取樣群組之部分。此外,在此實例中,基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分。因此,在先前段落的實例中,在輸出時間6的額外播放軌之取樣將被考慮為操作點取樣群組之部分。 圖1為說明可利用本發明之技術之實例視訊寫碼系統10的方塊圖。如本文所使用,術語「視訊寫碼器」大體上係指視訊編碼器及視訊解碼器兩者。在本發明中,術語「視訊寫碼」或「寫碼」可大體上係指視訊編碼或視訊解碼。 如圖1中所展示,視訊寫碼系統10包含源裝置12及目的地裝置14。源裝置12產生經編碼視訊資料。因此,源裝置12可被稱作視頻編碼裝置或視訊編碼設備。目的地裝置14可解碼由源裝置12所產生的經編碼視訊資料。因此,目的地裝置14可被稱作視訊解碼裝置或視訊解碼設備。源裝置12及目的地裝置14可為視訊寫碼裝置或視訊寫碼設備之實例。本發明可使用術語「視訊處理裝置」來指代處理視訊資料之裝置。源裝置12及目的地裝置14為視訊處理裝置之實例。其他類型之視訊處理裝置包括多工及解多工媒體資料(諸如MPEG-2資料串流)之裝置。 源裝置12及目的地裝置14可包含廣泛範圍之裝置,該等裝置包括桌上型電腦、行動計算裝置、筆記型(例如,膝上型)電腦、平板電腦、機上盒、諸如所謂的「智慧型」電話之電話手持機、電視、攝影機、顯示裝置、數位媒體播放器、視訊遊戲機、車載電腦或其類似者。 目的地裝置14可經由頻道16自源裝置12接收經編碼的視訊資料。頻道16可包含能夠將經編碼視訊資料自源裝置12移動至目的地裝置14的一或多個媒體或裝置。在一個實例中,頻道16可包含使源裝置12能夠即時地將經編碼視訊資料直接傳輸至目的地裝置14的一或多個通信媒體。在此實例中,源裝置12可根據通信標準(諸如,無線通信協定)調變經編碼視訊資料,且可將經調變視訊資料傳輸至目的地裝置14。一或多個通信媒體可包括無線及/或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。一或多個通信媒體可形成基於封包之網路(諸如區域網路、廣域網路或全球網路(例如,網際網路))的部分。一或多個通信媒體可包括路由器、交換器、基地台,或促進自源裝置12至目的地裝置14之通信的其他設備。 在另一實例中,頻道16可包括儲存由源裝置12產生之經編碼視訊資料的儲存媒體。在此實例中,目的地裝置14可(例如)經由磁碟存取或卡存取而存取儲存媒體。儲存媒體可包括多種本端存取之資料儲存媒體,諸如藍光光碟、DVD、CD-ROM、快閃記憶體,或用於儲存經編碼的視訊資料之其他合適的數位儲存媒體。 在另一實例中,頻道16可包括儲存由源裝置12產生之經編碼視訊資料的檔案伺服器或另一中間儲存裝置。在此實例中,目的地裝置14可經由串流或下載來存取儲存於檔案伺服器或另一中間儲存裝置處的經編碼視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將經編碼視訊資料傳輸至目的地裝置14之類型之伺服器。實例檔案伺服器包括網頁伺服器(例如,用於網站)、檔案傳送協定(FTP)伺服器、網路附接儲存(NAS)裝置及本端磁碟機。檔案伺服器可串流傳輸儲存在根據本發明之技術產生的檔案中之經編碼視訊資料。 目的地裝置14可經由標準資料連接(諸如,網際網路連接)來存取經編碼視訊資料。資料連接之實例類型可包括無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機等),或兩者的適合於存取儲存於檔案伺服器上的經編碼視訊資料的組合。經編碼視訊資料自檔案伺服器的傳輸可為串流傳輸、下載傳輸或兩者的組合。 本發明之技術並不限於無線應用或設定。該等技術可應用於支援多種多媒體應用之視訊寫碼,諸如空中電視廣播、有線電視傳輸、衛星電視傳輸、串流視訊傳輸(例如,經由網際網路)、編碼儲存於資料儲存媒體上之視訊資料、解碼儲存於資料儲存媒體上之視訊資料,或其他應用。在一些實例中,視訊寫碼系統10可經組態以支援單向或雙向視訊傳輸,從而支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。 圖1中所說明之視訊寫碼系統10僅為實例,且本發明之技術可適用於未必包括編碼裝置與解碼裝置之間的任何資料通信的視訊寫碼設定(例如,視訊編碼或視訊解碼)。在其他實例中,資料係自本端記憶體擷取,經由網路串流傳輸,或類似者。視訊編碼裝置可編碼資料且將資料儲存至記憶體,及/或視訊解碼裝置可自記憶體擷取資料且解碼資料。在許多實例中,由彼此不通信但簡單地將資料編碼至記憶體及/或自記憶體擷取且解碼資料之裝置來執行編碼及解碼。 在圖1之實例中,源裝置12包括視訊源18、視訊編碼器20及輸出介面22。在一些實例中,輸出介面22可包括調變器/解調變器(數據機)及/或傳輸器。視訊源18可包括例如視訊攝影機之視訊俘獲裝置、含有先前所俘獲之視訊資料的視訊存檔、用以自視訊內容提供者接收視訊資料之視訊饋入介面,及/或用於產生視訊資料之電腦圖形系統,或視訊資料之此等源的組合。 視訊編碼器20可編碼來自視訊源18之視訊資料。在一些實例中,源裝置12經由輸出介面22直接將經編碼視訊資料傳輸至目的地裝置14。在其他實例中,經編碼視訊資料亦可儲存於儲存媒體上或檔案伺服器上,以稍後供目的地裝置14存取以用於解碼及/或播放。 在圖1之實例中,目的地裝置14包括輸入介面28、視訊解碼器30及顯示裝置32。在一些實例中,輸入介面28包括接收器及/或數據機。輸入介面28可經由頻道16來接收經編碼視訊資料。顯示裝置32可與目的地裝置14整合或可在該目的地裝置14外。大體而言,顯示裝置32顯示經解碼視訊資料。顯示裝置32可包含多種顯示裝置,諸如液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示裝置。 視訊編碼器20及視訊解碼器30各自可實施為各種合適電路系統中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、硬體或其任何組合。若在軟體中部分地實施技術,則裝置可將用於軟體之指令儲存於合適的非暫時性電腦可讀儲存媒體中,且可在硬體中使用一或多個處理器來執行該等指令以執行本發明之技術。可將上述內容(包括硬體、軟體、硬體與軟體之組合等)中之任一者視為一或多個處理器。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,編碼器或解碼器中之任一者可整合為各別裝置中的組合式編碼器/解碼器(編碼解碼器)之部分。 本發明可大體上涉及視訊編碼器20將某一資訊「傳信」或「傳輸」至另一裝置,諸如視訊解碼器30。術語「傳信」或「傳輸」可大體上指用以解碼經壓縮視訊資料之語法元素及/或其他資料的通信。此通信可即時地或近乎即時地發生。替代地,此通信可在一時間跨度內發生,諸如可能在編碼時在經編碼之位元串流中將語法元素儲存至電腦可讀儲存媒體時發生,接著,在儲存至此媒體之後可藉由解碼裝置在任何時間擷取該等語法元素。 此外,在圖1之實例中,視訊寫碼系統10包括檔案產生裝置34。檔案產生裝置34可接收藉由源裝置12產生之經編碼視訊資料。檔案產生裝置34可產生包括該經編碼視訊資料之檔案。目的地裝置14可接收藉由檔案產生裝置34產生的檔案。在各種實例中,源裝置12及/或檔案產生裝置34可包括各種類型之計算裝置。舉例而言,源裝置12及/或檔案產生裝置34可包含視訊編碼裝置、媒體感知網路元件(MANE)、伺服器計算裝置、個人計算裝置、專用計算裝置、商業計算裝置或另一類型計算裝置。在一些實例中,檔案產生裝置34為內容傳遞網路之部分。源裝置12及/或檔案產生裝置34可經由諸如鏈路16之頻道自源裝置12接收經編碼視訊資料。此外,目的地裝置14可經由諸如鏈路16之頻道自檔案產生裝置34接收檔案。檔案產生裝置34可被視為視訊裝置。如圖1之實例中所示,檔案產生裝置34可包含記憶體31,其經組態以儲存含有經編碼視訊內容之檔案。 在一些實例中,源裝置12或另一計算裝置可產生包括經編碼視訊資料之檔案。為易於解釋,本發明可將源裝置12或檔案產生裝置34描述為產生檔案。然而,應理解,一般而言,此等描述適用於計算裝置。 描述於本發明中之技術可與各種視訊寫碼標準一起使用,包括不與特定視訊寫碼標準相關的視訊寫碼技術。視訊寫碼標準之實例包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264 (亦稱為ISO/IEC MPEG-4 AVC),包括其可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展。在一些實例中,視訊編碼器20及視訊解碼器30根據諸如HEVC標準之視訊壓縮標準操作。除基本HEVC標準之外,亦存在持續努力以產生用於HEVC之可調式視訊寫碼、多視圖視訊寫碼及3D寫碼擴展。HEVC、HEVC之多視圖擴展(名為MV-HEVC)及HEVC之可調式擴展(名為SHVC)最近已由ITU-T視訊寫碼專家群(VCEG)及ISO/IEC動畫專家群(MPEG)之視訊寫碼聯合合作小組(JCT-VC)定案。HEVC標準亦可被稱作Rec. ITU-T H .265 | ISO/IEC 23008-2。 ITU-T SG 16 WP 3及ISO/IEC JTC 1/SC 29/WG 11之JCT-VC(日本劄幌之第18次會議,2014年6月30日至2014年7月9日)之題為「草案高效率視訊寫碼(HEVC)版本2、組合之格式範圍延伸(RExt)、可擴展性(SHVC),及多視圖(MV-HEVC)延伸」之HEVC草案規範(JCTVC-R1013_v6) (下文中稱為「JCTVC-R1013」或「Rec.ITU-T H.265 | ISO/IEC 23008-2」)可自http://phenix.int-evry.fr/jct/doc_end_user/documents/18_Sapporo/wg11/JCTVC-R1013-v6.zip獲得。MV-HEVC併入為Rec. ITU-T H.265 | ISO/IEC 23008-2之附錄G。SHVC併入為Rec. ITU-T H.265 | ISO/IEC 23008-2之附錄H。 在HEVC及其他視訊寫碼標準中,視訊序列通常包括一系列圖像。圖像亦可被稱為「圖框」。圖像可包括一或多個取樣陣列。舉例而言,圖像可包括三個取樣陣列,標示為SL 、SCb 及SCr 。SL 為明度取樣之二維陣列(亦即,區塊)。SCb 為Cb色訊(chrominance)取樣之二維陣列。SCr 為Cr色訊取樣之二維陣列。色訊取樣亦可在本文中被稱作「色度」取樣。在其他情況下,圖像可為單色的,且可僅包括亮度取樣陣列。 為了產生圖像之經編碼表示,視訊編碼器20可產生寫碼樹型單元(CTU)之集合。CTU中之每一者可為明度取樣之寫碼樹型區塊、色度取樣之兩個對應寫碼樹型區塊及用於寫碼寫碼樹型區塊之取樣的語法結構。寫碼樹型區塊可為取樣之N×N區塊。CTU亦可被稱作「樹型區塊」或「最大寫碼單元」(LCU)。HEVC之CTU可廣泛地類似於諸如H.264/AVC之其他標準之巨集區塊。然而,CTU未必限於特定大小,且可包括一或多個寫碼單元(CU)。圖塊可包括按掃描次序(諸如,光柵掃描次序)連續排序的整數數目個CTU。在本發明中,術語「經寫碼圖像」或「經編碼圖像」可指含有圖像之所有寫碼樹型單元的圖像之經寫碼表示。 為產生經寫碼CTU,視訊編碼器20可對CTU之寫碼樹型區塊遞迴地執行四分樹分割,以將寫碼樹型區塊劃分成寫碼區塊,因此命名為「寫碼樹型單元」。寫碼區塊為取樣之N×N區塊。CU可為圖像之明度取樣之寫碼區塊及色度取樣之兩個對應寫碼區塊,所述圖像具有明度取樣陣列、Cb取樣陣列及Cr取樣陣列,及用以寫碼寫碼區塊之取樣的語法結構。在單色圖像或具有三個單獨色彩平面之圖像中,CU可包含單一寫碼區塊及用於寫碼該寫碼區塊之取樣的語法結構。 視訊編碼器20可將CU之寫碼區塊分割為一或多個預測區塊。預測區塊可為經應用相同預測的取樣之矩形(亦即,正方形或非正方形)區塊。CU之預測單元(PU)可為圖像之明度取樣之預測區塊,圖像之色度取樣之兩個對應預測區塊,及用以對預測區塊取樣進行預測的語法結構。視訊編碼器20可針對CU之每一PU的明度、Cb及Cr預測區塊產生預測性明度、Cb及Cr區塊。在單色圖像或具有三個單獨色彩平面之圖像中,PU可包含單一預測區塊及用以預測該預測區塊之語法結構。 視訊編碼器20可使用框內預測或框間預測來產生PU之預測性區塊。若視訊編碼器20使用框內預測產生PU之預測性區塊,則視訊編碼器20可基於與PU相關聯之圖像的經解碼取樣產生PU之預測性區塊。若視訊編碼器20使用框間預測以產生PU之預測性區塊,則視訊編碼器20可基於不同於與PU相關聯之圖像的一或多個圖像之經解碼取樣,產生PU之預測性區塊。 在視訊編碼器20產生CU之一或多個PU的預測性區塊之後,視訊編碼器20可產生CU之殘餘區塊。CU之殘餘區塊中之每一取樣指示CU之PU的預測性區塊中之取樣與CU之寫碼區塊中之對應取樣之間的差異。舉例而言,視訊編碼器20可產生CU之明度殘餘區塊。CU之明度殘餘區塊中之每一取樣指示CU之PU之預測性明度區塊中的明度取樣與CU之明度寫碼區塊中的對應取樣之間的差異。另外,視訊編碼器20可產生CU之Cb殘餘區塊。CU之Cb殘餘區塊中的每一取樣可指示CU之PU之預測性Cb區塊中的Cb取樣與CU之Cb寫碼區塊中之對應取樣之間的差異。視訊編碼器20亦可產生CU之Cr殘餘區塊。CU之Cr殘餘區塊中的每一取樣可指示CU之PU之預測性Cr區塊中的Cr取樣與CU之Cr寫碼區塊中之對應取樣之間的差異。 此外,視訊編碼器20可使用四分樹分割以將CU之殘餘區塊分解成一或多個變換區塊。變換區塊可為經應用相同變換的取樣之矩形區塊。CU之變換單元(TU)可為明度取樣之變換區塊、色度取樣之兩個對應變換區塊及用於變換變換區塊取樣之語法結構。因此,CU之每一TU可與明度變換區塊、Cb變換區塊及Cr變換區塊相關聯。與TU相關聯之明度變換區塊可為CU之明度殘餘區塊之子區塊。Cb變換區塊可為CU之Cb殘餘區塊之子區塊。Cr變換區塊可為CU之Cr殘餘區塊的子區塊。在單色圖像或具有三個單獨色彩平面之圖像中,TU可包含單一變換區塊及用於變換該變換區塊之取樣的語法結構。 視訊編碼器20可將一或多個變換應用於TU之變換區塊以產生TU之係數區塊。舉例而言,視訊編碼器20可將一或多個變換應用於TU之明度變換區塊以產生TU之明度係數區塊。視訊編碼器20可將一或多個變換應用至TU之Cb變換區塊以產生TU之Cb係數區塊。視訊編碼器20可將一或多個變換應用至TU之Cr變換區塊以產生TU之Cr係數區塊。係數區塊可為變換係數之二維陣列。變換係數可為純量。 在產生係數區塊之後,視訊編碼器20可量化該係數區塊。量化大體上指變換係數經量化以可能減少用以表示變換係數的資料之量從而提供進一步壓縮之程序。在視訊編碼器20量化係數區塊之後,視訊編碼器20可對指示經量化變換係數之語法元素進行熵編碼。舉例而言,視訊編碼器20可對指示經量化變換係數之語法元素執行上下文適應性二進位算術寫碼(CABAC)。視訊編碼器20可在位元串流中輸出經熵編碼之語法元素。 視訊編碼器20可輸出包括形成經寫碼圖像及相關聯資料之表示的位元序列之位元串流。位元串流可包含網路抽象層(NAL)單元的序列。該等NAL單元中之每一者包括NAL單元標頭且囊封原始位元組序列有效負載(RBSP)。NAL單元標頭可包括指示NAL單元類型碼之語法元素。藉由NAL單元之NAL單元標頭指定的NAL單元類型碼指示NAL單元之類型。RBSP可為含有囊封在NAL單元內之整數數目個位元組的語法結構。在一些情況下,RBSP包括零個位元。 不同類型之NAL單元可囊封不同類型之RBSP。舉例而言,不同類型之NAL單元可囊封視訊參數集(VPS)、序列參數集(SPS)、圖像參數集(PPS)、經寫碼圖塊、補充增強資訊(SEI)等的不同RBSP。舉例而言,第一類型之NAL單元可囊封PPS之RBSP,第二類型之NAL單元可囊封經寫碼圖塊之RBSP,第三類型之NAL單元可囊封補充增強資訊(SEI)之RBSP等。囊封視訊寫碼資料之RBSP(相反於參數集及SEI訊息之RBSP)的NAL單元可被稱作視訊編碼層(VCL)NAL單元。舉例而言,JCTVC-R1013定義術語VCL NAL單元為經寫碼圖塊片段NAL單元及NAL單元之子集的集合術語,該等NAL單元具有分類為JCTVC-R1013中之VCL NAL單元之nal_unit_type之保留值。SEI含有並非自VCL NAL單元解碼經寫碼圖像之取樣必需的資訊。 在圖1之實例中,視訊解碼器30接收由視訊編碼器20產生之位元串流。在一些實例中,視訊解碼器30在目的地裝置14或另一裝置自檔案獲得位元串流之後接收位元串流。另外,視訊解碼器30可剖析位元串流以自位元串流獲得語法元素。視訊解碼器30可至少部分基於自位元串流獲得之語法元素而重建構視訊資料之圖像。重建構視訊資料之程序可大體上與藉由視訊編碼器20執行之程序互逆。舉例而言,視訊解碼器30可使用框內預測或框間預測來判定當前CU之PU之預測性區塊。另外,視訊解碼器30可反量化當前CU之TU之係數區塊。視訊解碼器30可對係數區塊執行反變換,以重建構當前CU之TU的變換區塊。藉由將當前CU之PU的預測性區塊之取樣添加至當前CU之TU的變換區塊之相對應取樣,視訊解碼器30可重建構當前CU之寫碼區塊。藉由重建構圖像之每一CU的寫碼區塊,視訊解碼器30可重建構圖像。 如上文簡要地指出,NAL單元可囊封視訊參數集(VPS)、序列參數集(SPS)、圖像參數集(PPS)之RBSP。VPS為包含適用於零或多個全部經寫碼視訊序列(CVS)之語法元素的語法結構。SPS亦為包含適用於零或多個全部CVS之語法元素的語法結構。SPS可包括識別在SPS在作用中時在作用中的VPS之語法元素。因此,VPS之語法元素可比SPS之語法元素更一般化地可適用。PPS係包含應用於零或多個經寫碼圖像之語法元素的語法結構。PPS可包括識別在PPS在作用中時在作用中的SPS的語法元素。圖塊之圖塊標頭可包括指示在圖塊正被寫碼時在作用中的PPS的語法元素。 術語「存取單元」可用以指對應於相同時間執行個體之圖像集。因此,視訊資料可經概念化為隨時間出現之一系列存取單元。「視圖分量」可為單一存取單元中之視圖的經寫碼表示。在本發明中,「視圖」可係指與相同視圖識別符相關聯之一序列視圖分量。在一些實例中,視圖分量可為紋理視圖分量(亦即,紋理圖像)或深度視圖分量(亦即,深度圖像)。 在MV-HEVC及SHVC中,視訊編碼器可產生包含一系列NAL單元之位元串流。位元串流之不同NAL單元可與位元串流之不同層相關聯。可將層定義為具有相同層識別符的VCL NAL單元及相關聯非VCL NAL單元之集合。層可等效於多視圖視訊寫碼中之視圖。在多視圖視訊寫碼中,層可含有相同層的具有不同時間執行個體之所有視圖分量。每一視圖分量可為屬於特定時間執行個體之特定視圖的視訊場景之經寫碼圖像。在多視圖或3維視訊寫碼之一些實例中,層可含有特定視圖之所有經寫碼深度圖像或特定視圖之經寫碼紋理圖像。在3D視訊寫碼之其他實例中,層可含有特定視圖之紋理視圖分量及深度視圖分量兩者。類似地,在可調式視訊寫碼之內容脈絡中,層通常對應於具有不同於其他層中之經寫碼圖像之視訊特性的經寫碼圖像。此等視訊特性通常包括空間解析度及品質位準(例如,信雜比)。在HEVC及其擴展中,可在一層內藉由將具有特定時間位準之圖像群組定義為一子層來達成時間可調性。 對於位元串流之每一各別層,可在不參考任何較高層中之資料之情況下解碼較低層中之資料。在可調式視訊寫碼中,例如,可在不參考增強層中之資料之情況下解碼基層中之資料。通常,NAL單元可僅囊封單一層之資料。因此,可自位元串流移除囊封位元串流之最高剩餘層之資料的NAL單元而不影響位元串流之剩餘層中之資料的可解碼性。在多視圖寫碼中,較高層可包括額外視圖分量。在SHVC中,較高層可包括信雜比(SNR)增強資料、空間增強資料及/或時間增強資料。在MV-HEVC及SHVC中,若視訊解碼器可在不參考任何其他層之資料之情況下解碼層中的圖像,則該層可被稱為「基層」。基層可符合HEVC基礎規範(例如,Rec. ITU-T H.265 | ISO/IEC 23008-2)。 在可調式視訊寫碼中,不同於基層之層可被稱作「增強層」,且可提供增強自位元串流解碼之視訊資料之視覺品質的資訊。可調式視訊寫碼可增強空間解析度、信雜比(亦即,品質)或時間速率。在可調式視訊寫碼(例如,SHVC)中,「層表示」可為單個存取單元中的空間層之經寫碼表示。為易於解釋,本發明可將視圖分量及/或層表示稱作「視圖分量/層表示」或簡單地稱作「圖像」。 多視圖寫碼支援視圖間預測。視圖間預測類似於HEVC中所使用的框間預測,且可使用相同語法元素。然而,當視訊寫碼器對當前視訊單元(諸如,PU)執行視圖間預測時,視訊寫碼器20可將與當前視訊單元在相同之存取單元中但處於不同視圖中的圖像用作參考圖像。相反地,習知框間預測僅將不同存取單元中的圖像用作參考圖像。 在多視圖寫碼中,若視訊解碼器(例如,視訊解碼器30)可無需參考任何其他視圖中之圖像而解碼視圖中的圖像,則該視圖可被稱作「基礎視圖」。當對非基礎視圖中之一者中的圖像進行寫碼時,視訊寫碼器(諸如視訊編碼器20或視訊解碼器30)可在圖像與視訊寫碼器當前正寫碼的圖像處於不同視圖中但在同一時間執行個體(亦即,存取單元)內時將圖像添加至參考圖像清單中。類似於其他框間預測參考圖像,視訊寫碼器可在參考圖像清單之任何位置處插入視圖間預測參考圖像。 舉例而言,NAL單元可包括標頭(亦即,NAL單元標頭)及有效負載(例如,RBSP)。NAL單元標頭可包括nuh_reserved_zero_6bits語法元素,該等nuh_reserved_zero_6bits語法元素亦可被稱作nuh_layer_id語法元素。具有指定不同值的nuh_layer_id語法元素的NAL單元屬於位元串流之不同「層」。因此,在多視圖寫碼、MV-HEVC、SVC或SHVC中,NAL單元之nuh_layer_id語法元素指定NAL單元之層識別符(亦即,層ID)。若NAL單元涉及多視圖寫碼、MV-HEVC或SHVC中之基層,則NAL單元之nuh_layer_id語法元素等於0。可在不參考位元串流之任何其他層中之資料的情況下解碼位元串流之基層中的資料。若NAL單元不涉及多視圖寫碼、MV-HEVC或SHVC中之基層,則nuh_layer_id語法元素可具有非零值。在多視圖寫碼中,位元串流之不同層可對應於不同視圖。在SVC或SHVC中,不同於基層之層可被稱為「增強層」,且可提供增強自位元串流解碼的視訊資料之視覺品質的資訊。 此外,可在不參考相同層內之其他圖像的情況下解碼層內的一些圖像。因此,可從位元串流移除囊封一層的某些圖像之資料的NAL單元而不影響該層中之其他圖像的可解碼性。移除囊封此等圖像之資料的NAL單元可能會降低位元串流的圖框速率。可在不參考層內其他圖像的情況下解碼的層內圖像之子集可在本文中被稱作「子層」或「時間子層」。 NAL單元可包括temporal_id語法元素。NAL單元之temporal_id語法元素指定NAL單元之時間識別符。NAL單元之時間識別符識別與NAL單元相關聯之時間子層。因此,位元串流之每一時間子層可與不同時間識別符相關聯。若第一NAL單元之時間識別符小於第二NAL單元之時間識別符,則可在不參考由第二NAL單元囊封之資料的情況下解碼由第一NAL單元囊封之資料。 位元串流可與複數個操作點相關聯。在一些實例中,位元串流之每一操作點可與層識別符之集合(亦即,nuh_reserved_zero_6bits值之集合)及時間識別符相關聯。可將層識別符之集合表示為OpLayerIdSet,且可將時間識別符表示為TemporalID。若NAL單元之層識別符在操作點之層識別符集合中且NAL單元之時間識別符小於或等於操作點之時間識別符,則NAL單元與操作點相關聯。因此,操作點可為藉由子位元串流提取程序之操作而自另一位元串流產生的位元串流,其中另一位元串流、目標最高TemporalId及目標層識別符清單作為至子位元串流提取程序的輸入。操作點可包括與操作點相關聯之每一NAL單元。操作點不包括不與操作點相關聯的VCL NAL單元。 輸出層集合(OLS)為由VPS中指定的層集合中之一者之層組成的層之集合,其中層集合中之一或多個層經指示為輸出層。特定言之,layer_set_idx_for_ols_minus1[i]語法元素加1指定第i輸出層集合之索引。等於1之output_layer_flag[i][j]語法元素指定第i OLS中之第j層為輸出層。等於0之output_layer_flag[i][j]語法元素指定第i OLS中之第j層並非輸出層。 HEVC及其他視訊寫碼標準指定設定檔、層次和層級。設定檔、層次及層級指定對位元串流的限定且因此指定對解碼位元串流所需的能力的限制。設定檔、層次和層級亦可用以指示個別解碼器實施之間的互操作性點。每一設定檔指定由符合彼設定檔的所有視訊解碼器支援的演算法特徵和限制的子集。不需要視訊編碼器利用設定檔中支援的所有特徵。 層次的每一層級可指定對語法元素及變數可具有之值的限制的集合。層次和層級定義之同一集合可與所有設定檔一起使用,但個別實施可支援不同層次且支援層次內用於每一所支援設定檔的不同層級。對於任何給定設定檔,層次的層級可大體上對應於特定解碼器處理負載和記憶體能力。視訊解碼器的能力可在對符合特定設定檔、層次及層級之約束的視訊串流進行解碼的能力方面經指定。對於每一此設定檔,亦可表達針對彼設定檔所支援的層次及層級。一些視訊解碼器可能不能夠解碼特定設定檔、層次或層級。 在HEVC中,設定檔、層次和層級可由語法結構profile_tier_level( )語法結構傳信。profile_tier_level( )語法結構可包括於VPS及/或SPS中。profile_tier_level( )語法結構可包括general_profile_idc語法元素、general_tier_flag語法元素及general_level_idc語法元素。general_level_idc語法元素可指示CVS符合的設定檔。general_tier_flag語法元素可指示用於general_level_idc語法元素之解譯的層次上下文。general_level_idc語法元素可指示CVS符合的層級。可保留此等語法元素之其他值。 視訊解碼器的能力可在對符合設定檔、層次及層級之約束的視訊串流進行解碼的能力方面經指定。對於每一此類設定檔,亦可表達針對彼設定檔支援的層次和層級。在一些實例中,視訊解碼器並不推斷在HEVC中指定的值之間的general_profile_idc語法元素的保留值指示指定設定檔之間的中間能力。然而,視訊解碼器可推斷與在HEVC中指定的值之間的general_tier_flag語法元素之特定值相關聯的general_level_idc語法元素的保留值指示層次的指定層級之間的中間能力。 檔案格式標準包括ISO基本媒體檔案格式(ISOBMFF,ISO/IEC 14496-12),及自ISOBMFF導出之其他格式,包括MPEG-4檔案格式(ISO/IEC 14496-15)、3GPP檔案格式(3GPP TS 26.244)及AVC檔案格式(ISO/IEC 14496-15)。ISO/IEC 14496-12及14496-15之新版本的草案本文可分別在http://phenix.int-evry.fr/mpeg/doc_end_user/documents/111_Geneva/wg11/w15177-v6-w15177.zip及http://phenix.int-evry.fr/mpeg/doc_end_user/documents/ 112_Warsaw/wg11/w15479-v2-w15479.zip處得到。 將ISOBMFF用作用於許多編碼解碼器囊封格式(諸如,AVC檔案格式)以及用於許多多媒體容器格式(諸如,MPEG-4檔案格式、3GPP檔案格式(3GPP)及DVB檔案格式)之基礎。儘管最初針對儲存而設計,但ISOBMFF已證明對於串流傳輸(例如,用於逐漸下載或DASH)極有價值。為了串流傳輸目的,可使用在ISOBMFF中定義之電影片段。 除諸如音訊及視訊之連續媒體之外,諸如影像之靜態媒體以及後設資料亦可儲存於符合ISOBMFF之檔案中。根據ISOBMFF結構化之檔案可用於許多用途,包括本端媒體檔案播放、遠端檔案之逐漸下載、用於經由HTTP之動態自適應串流傳輸(DASH)之區段、用於待串流傳輸之內容及其封包化指令之容器及接收之即時媒體串流的記錄。 方塊為ISOBMFF中之基本語法結構。方塊包括四字元寫碼方塊類型、方塊之位元組計數及有效負載。ISOBMFF檔案由一序列之方塊組成,且方塊可含有其他方塊。電影方塊(「moov」)含有存在於檔案中之用於連續媒體串流的後設資料,每一媒體串流在檔案中表示為播放軌。將用於播放軌之後設資料圍封於播放軌方塊(「trak」)中,而將播放軌之媒體內容圍封於媒體資料方塊(「mdat」)中或直接圍封於單獨檔案中。播放軌之媒體內容可包含或由一序列之取樣組成,諸如音訊或視訊存取單元。 ISOBMFF指定以下類型之播放軌:媒體播放軌,其含有基本媒體串流;提示播放軌,其包括媒體傳輸指令或表示接收之封包串流;及計時後設資料播放軌,其包含時間同步之後設資料。每一播放軌之後設資料包括取樣描述項之清單,每一項提供在播放軌中使用之寫碼或囊封格式及對於處理彼格式需要之初始化資料。每一取樣與播放軌之取樣描述項中之一者相關聯。 ISOBMFF實現藉由各種機構指定取樣特定後設資料。舉例而言,播放軌方塊包括取樣表(『stbl』)方塊。播放軌之取樣表方塊含有取樣表,該取樣表含有播放軌之媒體取樣之所有時間及資料索引。取樣表包括用於播放軌之特定取樣的取樣項。播放軌之取樣可包括識別適用於取樣之取樣項的語法元素。因此,當裝置處理取樣(例如,準備解碼取樣之經編碼圖像,轉遞取樣,提取取樣,等)時,裝置可能夠往回參考取樣表方塊中之取樣項以判定如何處理取樣。 更特定而言,取樣表方塊可包括取樣描述(『stbl』)方塊。取樣描述方塊可包括關於所使用的寫碼類型之詳細資訊,及彼解碼所需的任何初始化資訊。為實現此目標,取樣描述方塊包括一組取樣項方塊(亦即,取樣項)。以下程式碼定義ISOBMFF中之方塊之取樣項及取樣描述方塊類別。 aligned(8) abstract class SampleEntry (unsigned int(32) format) extends Box(format){ const unsigned int(8)[6] reserved = 0; unsigned int(16) data_reference_index; } aligned(8) class SampleDescriptionBox (unsigned int(32) handler_type) extends FullBox('stsd', version, 0){ int i ; unsigned int(32) entry_count; for (i = 1 ; i <= entry_count ; i++){ SampleEntry(); // an instance of a class derived from SampleEntry } } 在ISOBMFF中,取樣項類別為被擴展用於特定媒體類型之抽象類別。舉例而言,VisualSampleEntry類別擴展SampleEntry類別且含有用於視訊資料之資訊。類似地,AudioSampleEntry類別擴展SampleEntry類別且含有用於音訊資料之資訊。以下程式碼定義ISOBMFF中之AudioSampleEntry類別。 class VisualSampleEntry(codingname) extends SampleEntry (codingname){ unsigned int(16) pre_defined = 0; const unsigned int(16) reserved = 0; unsigned int(32)[3] pre_defined = 0; unsigned int(16) width; unsigned int(16) height; template unsigned int(32) horizresolution = 0x00480000; // 72 dpi template unsigned int(32) vertresolution = 0x00480000; // 72 dpi const unsigned int(32) reserved = 0; template unsigned int(16) frame_count = 1; string[32] compressorname; template unsigned int(16) depth = 0x0018; int(16) pre_defined = -1; // other boxes from derived specifications CleanApertureBox clap; // optional PixelAspectRatioBox pasp; // optional } 此外,VisualSampleEntry類別可被擴展用於更加特定之用途,諸如定義用於特定編碼解碼器之資料。舉例而言,以下程式碼定義擴展VisualSampleEntry類別且含有特定針對於HEVC的資訊之HEVCSampleEntry類別。 class HEVCSampleEntry() extends VisualSampleEntry ('hvc1' or 'hev1'){ HEVCConfigurationBox config; MPEG4BitRateBox (); // optional MPEG4ExtensionDescriptorsBox (); // optional Box extra_boxes[]; // optional } 如上述程式碼中所示,HEVCSampleEntry類別包括HEVCConfigurationBox類別之執行個體。HEVCConfigurationBox包括HEVCDecoderConfigurationRecord類別之執行個體。HEVCDecoderConfigurationRecord類別之執行個體可包括指定解碼器可用以解碼含有HEVCDecoderConfigurationRecord之執行個體的取樣項適用於的取樣中之經寫碼圖像的資訊的語法元素。 此外,LHEVCSampleEntry類別已經定義,其擴展VisualSampleEntry類別並含有特定針對於L-HEVC之資訊。LHEVCSampleEntry可用於不與HEVC相容的播放軌中。舉例而言,若檔案之播放軌僅包括多層位元串流之基層,則播放軌可包括HEVCSampleEntry類別之執行個體。然而,在此實例中,檔案之攜載多層位元串流之其他層的其他播放軌可包括LHEVCSampleEntry類別之執行個體。如在以下程式碼中所示,LHEVCSampleEntry類別包括LHEVCConfigurationBox之執行個體,且LHEVCConfigurationBox包括LHEVCDecoderConfigurationRecord方塊。 class LHEVCConfigurationBox extends Box('lhvC') { LHEVCDecoderConfigurationRecord() LHEVCConfig; } class HEVCLHVCSampleEntry() extends HEVCSampleEntry() { LHEVCConfigurationBox lhvcconfig; } // Use this if track is not HEVC compatible class LHEVCSampleEntry() extends VisualSampleEntry ('lhv1', or 'lhe1') { LHEVCConfigurationBox lhvcconfig; MPEG4ExtensionDescriptorsBox (); // optional } 取樣表方塊(「stbl」)內之特定方塊已經標準化以回應普通需求。舉例而言,同步取樣方塊(「stss」)用以列舉播放軌之隨機存取取樣。取樣分群機構實現根據四字元分群類型將取樣映射成共用指定為檔案中之取樣群組描述項之同一性質的取樣之群組。已在ISOBMFF中指定若干分群類型。 另一實例取樣群組為層資訊(「linf」)取樣群組。用於層資訊取樣群組之取樣群組描述項包含播放軌含有的層及子層之清單。含有層之經寫碼圖像的播放軌之每一取樣可為播放軌之『linf』取樣群組的部分。在播放軌的取樣群組描述方塊中可存在一或多個『linf』取樣群組項。然而,可要求存在包括L-HEVC資料之每一播放軌的一個『linf』取樣群組描述項。以下提供用於『linf』取樣群組之取樣群組描述項的語法及語義。9.8.2.2 語法 class LayerInfoGroupEntry extends VisualSampleGroupEntry ('linf')) { unsigned int (2) reserved; unsigned int (6) num_layers_in_track; for (i=0; i<num_layers_in_track; i++) { unsigned int (4) reserved; unsigned int (6) layer_id; unsigned int (3) min_sub_layer_id; unsigned int (3) max_sub_layer_id; } }9.8.2.3 語義 num_layers_in_track:與此取樣群組相關聯的此播放軌之任一取樣中攜載的層之數目。 layer_id:用於相關聯取樣中攜載的層之層ID。此欄位之執行個體應在循環中按遞升次序。 min_sub_layer_id:用於播放軌內的層中之子層之最小TemporalId值。 1. max_sub_layer_id:用於播放軌內的層中之子層之最大TemporalId值。 2. 使layerList為在此播放軌中攜載的層的層ID及在其他播放軌中攜載並藉由在此播放軌中攜載之層直接或間接參考的層的層ID之清單。layerList中之層ID係按層ID值之遞升次序而定序。舉例而言,假設此播放軌攜載具有層ID 4及5的層且其參考具有等於0及1之層ID的層,則與此播放軌相關聯的layerList為{0、1、4、5}。 ISOBMFF規格指定適用於DASH之六種類型串流存取點(SAP)。前兩種SAP類型(類型1及2)對應於H.264/AVC及HEVC中之瞬時解碼再新(IDR)圖像。第三SAP類型(類型3)對應於開放圖像群組(GOP)隨機存取點,因此對應於HEVC中之斷鏈存取(BLA)或清潔隨機存取(CRA)圖像。第四SAP類型(類型4)對應於GDR隨機存取點。 在用於以檔案格式儲存L-HEVC層的14496-15之當前草案規範中,使用在攜載位元串流的播放軌中之一者中傳信的操作點(『oinf』)取樣群組描述可供用於檔案中之位元串流的操作點之清單。操作點取樣群組亦可在本文中稱為「操作點資訊取樣群組」。應用程式可藉由遵循『oref』播放軌參考而發現彼播放軌。為簡單起見,含有『oinf』取樣群組之播放軌亦稱作『oref』播放軌。儘管僅僅在一個播放軌中傳信『oinf』取樣群組,但在用於儲存L-HEVC層之14496-15的當前草案規範中,『oinf』取樣群組之範圍涵蓋攜載L-HEVC寫碼資料之所有播放軌。使用取樣群組傳信操作點之清單具有一結果以使得操作點之清單可不涵蓋在時間維度中之整個位元串流。可呈現大於一個『oinf』取樣群組且每一取樣群組包括不同取樣集合。 圖2為說明『oinf』取樣群組之涵蓋的實例之概念圖。圖2說明根據用於儲存L-HEVC層之14496-15的當前草案規範之兩個『oinf』取樣群組(40及42)的涵蓋。如圖2的實例中所示,取樣群組40及取樣群組42各自包括播放軌01、播放軌02及播放軌03中之取樣。在圖2的實例中,播放軌01包括基層(BL)。播放軌02包括基本串流EL1,其可含有一或多個層。播放軌03包括基本串流EL2,其可含有一或多個額外層。在圖2的實例中,每一各別加陰影矩形對應於單一各別取樣。播放軌01為圖2中之『oref』播放軌。在其他實例中,除攜載基層之播放軌以外的播放軌可為『oref』播放軌。操作點參考播放軌之每一各別取樣及額外播放軌之每一各別取樣包含包含對應於同一時間執行個體之一或多個經編碼圖像的各別存取單元。 傳信操作點之上述技術可在不同播放軌中之取樣未對齊時具有問題,因為對於一些存取單元(或一些解碼時間執行個體),在一些播放軌中存在但在其他播放軌中不存在NAL單元。由於在檔案層級處使用取樣群組傳信操作點,因此在時間維度中,取樣群組可僅僅包括存在於含有取樣群組的播放軌中之取樣,或至多具有在某些範圍內之解碼時間的取樣。因此,在其他播放軌中可存在具有在可藉由特定播放軌中之取樣群組清楚地指定的範圍外的解碼時間之取樣。在以下本文中描述問題之細節。 舉例而言,當位元串流中之層的圖框或圖像速率不同,且EL係在與BL不同之播放軌中攜載時,在攜載EL之播放軌中存在未由任一『oinf』取樣群組涵蓋的取樣,且在攜載EL之播放軌中可存在不在『oinf』取樣群組中之任一者的解碼時間範圍內的取樣。舉例而言,當EL之圖框速率為BL之圖框速率的雙倍時,在攜載EL的播放軌中存在未由任何『oinf』取樣群組涵蓋的取樣。 圖3說明在播放軌含有具有不同圖框或圖像速率之層時出現的實例問題。在圖3的實例中,位元串流包括基層及一或多個增強層。操作點參考播放軌(亦即,『oref』播放軌)含有基層且一或多個額外播放軌之每一各別播放軌含有一或多個增強層之各別增強層。特別地,在圖3中,播放軌01含有基層且播放軌02含有增強層(圖3中表示為EL1)。 在圖3的實例中,檔案包括第一『oinf』取樣群組46及第二『oinf』取樣群組48。在自一個『oinf』至另一個『oinf』取樣群組之分群轉換點處,具有在第一『oinf』取樣群組之最後取樣與第二『oinf』取樣群組之第一取樣之間的解碼時間的播放軌02中之取樣50不具有在播放軌01中之在時間上共置之取樣,且不屬於任一『oinf』取樣群組。 因此,在圖3的實例及其他實例中,使用在操作點參考播放軌(例如,圖3中之播放軌01)中傳信的第一操作點資訊取樣群組(例如,圖3中之『oinf』取樣群組46)在檔案中描述可用於檔案中之位元串流中的操作點。第一操作點資訊取樣群組包含操作點參考播放軌中之第一組取樣。此外,操作點參考播放軌含有包含在操作點參考播放軌中之第二組取樣的第二操作點取樣群組。在此實例中,在操作點參考播放軌中不存在在於第一組取樣中之具有最近解碼時間的取樣(例如,圖3中之取樣52)與在第二組取樣中之具有最早解碼時間的取樣(例如,圖3中之取樣54)之解碼時間之間的解碼時間發生的取樣。此外,在一或多個額外播放軌中的特定額外播放軌(例如,圖3中之播放軌02)中存在具有在第一組取樣中的具有最近解碼時間之取樣與在第二組取樣中的具有最早解碼時間之取樣的解碼時間之間的解碼時間的一或多個取樣(例如,圖3中之取樣50)。在一些情況下,特定額外播放軌(例如,圖3中之播放軌02)與操作點參考播放軌相比具有較高圖框速率。 藉由遵循『oref』播放軌參考發現含有『oinf』取樣群組的指定之『oref』播放軌的事實具有以下結果:對於可含有『oinf』取樣群組之全部位元串流可存在僅僅一個播放軌,此係由於在播放軌標頭中指定播放軌參考後不可改變播放軌參考。歸因於可含有『oinf』取樣群組的播放軌之此固定指定及『oinf』取樣群組可僅僅包括存在於含有『oinf』取樣群組的播放軌中之取樣的事實,若『oref』播放軌中在某時間週期中不存在取樣,則除『oref』播放軌以外的播放軌中之一些取樣可不屬於任一『oinf』取樣群組。 圖4說明在『oref』播放軌在某時間週期中不具有取樣時出現的實例問題。在圖4的實例中,檔案包括第一『oinf』取樣群組56及第二『oinf』取樣群組58。如圖4之實例中所示,在『oref』播放軌處不存在取樣的時間週期處,除『oref』播放軌以外的播放軌中之所有取樣60不屬於任一『oinf』取樣群組。另外,如圖4中所示,不存在在播放軌02中具有『oinf』取樣群組的可能性,此係由於在藉由播放軌標頭中之『oref』播放軌參考指定『oref』播放軌後不可改變『oref』播放軌。 本發明提出用以解決上述問題之若干技術。技術中之一些可獨立地應用,且其中之一些可組合地應用。出於除解決上述問題以外的原因,技術可為有益的。 根據本發明之第一技術,以下可應用於並非『oref』播放軌的播放軌中之取樣: a.除『oref』播放軌以外的播放軌中之取樣為與『oref』播放軌中之其在時間上共置的取樣相同的『oinf』取樣群組之部分。對於播放軌中之特定取樣,另一播放軌中之在時間上共置之取樣為具有與此特定取樣之解碼時間相同的解碼時間之取樣。 b.若除『oref』播放軌以外的播放軌中之取樣spA 不具有『oref』播放軌中之在時間上共置取樣,則取樣被視為在spA 之前的『oref』播放軌中的最後取樣之『oinf』取樣群組之部分。此程序可遞迴地應用。或者或另外,在此情況下取樣被視為在spA 之後的『oref』播放軌中之第一取樣之『oinf』取樣群組的部分。 藉由應用上文陳述,圖3的取樣50包括於『oinf』取樣群組46中,此係由於取樣50係在除『oref』播放軌(亦即,播放軌01)以外的播放軌(亦即,播放軌02)中且不具有在『oref』播放軌中之在時間上共置取樣。因此,取樣50被考慮為在取樣50之前的最後取樣(亦即,取樣52)的『oinf』取樣群組之部分。類似地,在圖4之取樣中,取樣60係在除『oref』播放軌(亦即,播放軌01)以外的播放軌(亦即,播放軌02)中且不具有在『oref』播放軌中之在時間上共置取樣。因此,取樣60被考慮為在取樣60之前的『oref』播放軌之最後取樣的『oinf』取樣群組之部分。 因此,在第一技術之實例中,諸如源裝置12、檔案產生裝置34或另一裝置之裝置可產生檔案中之操作點參考播放軌。一般而言,產生播放軌可包含將資料(諸如播放軌之取樣及/或播放軌之後設資料)儲存至檔案中。作為產生操作點參考播放軌之部分,裝置可在操作點參考播放軌中傳信描述可供用於檔案中之位元串流的操作點的操作點資訊取樣群組。一般而言,傳信取樣群組可包含在檔案中儲存指示取樣群組之取樣的取樣至群組方塊及描述取樣群組之取樣群組描述項。此外,裝置可產生檔案中之一或多個額外播放軌。無操作點資訊取樣群組係在額外播放軌之任一者中傳信。此外,基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為操作點資訊取樣群組之部分。基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分。 類似地,在第一技術之實例中,諸如目的地裝置14、MANE或另一裝置之裝置可獲得檔案中之操作點參考播放軌。獲得資料(諸如操作點參考播放軌)可包含讀取資料,剖析資料或以其他方式執行某一動作以得到、獲取或擁有資料。使用在操作點參考播放軌中傳信的操作點資訊取樣群組在檔案中描述可供用於檔案中之位元串流的操作點。此外,裝置可獲得檔案中之一或多個額外播放軌。無操作點資訊取樣群組係在額外播放軌之任一者中傳信。對於一或多個額外播放軌中之每一各別額外播放軌之每一各別取樣,裝置可判定是否將各別取樣考慮為操作點資訊取樣群組之部分。基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為操作點資訊取樣群組之部分。基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分。此外,在一些實例中,裝置可執行自位元串流提取操作點的子位元串流提取程序。 下文描述第一技術之實例實施。在整個本發明中,至當前L-HEVC檔案格式(例如,用於14496-15之當前草案規範)的插入係圍封在<ins>…</ins>標籤(例如,<ins>經添加文字</ins>)中,且所移除文字係圍封在<dlt>…</dlt>標籤(例如,<dlt>經刪除文字</dlt>)中。9.8.1 操作點資訊取樣群組9.8.1.1 定義 方塊類型:『oinf』 容器:『oref』類型參考播放軌之SampleGroupDescriptionBox(『sgpd』) 必選:在L-HEVC位元串流之一個且僅僅一個播放軌中為是 數量:一或多個『oinf』取樣群組項 藉由使用操作點資訊取樣群組(『oinf』)將給定取樣相關之不同操作點及其構造通知應用程式。每一操作點係關於輸出層集、最大T-ID值及設定檔、層級及層次傳信。所有此資訊係由『oinf』取樣群組捕獲。除此等資訊以外,此取樣群組亦提供層之間的依賴性資訊、在L-HEVC位元串流中寫碼的可調性之類型,及有關於給定可調性類型之任一特定層的尺寸識別符。 對於L-HEVC位元串流之所有播放軌,在此集合中應僅僅存在攜載『oinf』取樣群組之一個播放軌。L-HEVC位元串流之所有播放軌應具有對攜載『oinf』取樣群組之播放軌的類型『oref』之播放軌參考。 當若干VPS存在於L-HEVC位元串流中時,可需要聲明若干操作點資訊取樣群組。對於其中呈現單一VPS的更普通情況,建議使用定義於ISO/IEC 14496-12中的預設取樣群組機構且在播放軌取樣表中包括操作點資訊取樣群組,而非在每一播放軌片段中聲明操作點資訊取樣群組。 <ins>對於播放軌中之特定取樣,另一播放軌中之在時間上共置之取樣為具有與此特定取樣之解碼時間相同的解碼時間之取樣。 對於除『oref』播放軌以外的播放軌,以下適用: - 除『oref』播放軌以外的播放軌中之取樣為與『oref』播放軌中之其在時間上共置的取樣相同的『oinf』取樣群組之部分。 - 若除『oref』播放軌以外的播放軌中之取樣spA 不具有『oref』播放軌中之在時間上共置取樣,則取樣被考慮為在spA之前的『oref』播放軌中的最後取樣之『oinf』取樣群組的部分。此程序可遞迴地適用。</ins> 根據本發明之第二技術,含有『oinf』取樣群組之播放軌係在層資訊(『linf』)取樣群組中指示,而非使用『oref』播放軌參考以解析含有『oinf』取樣群組之播放軌。此可允許『oinf』取樣群組在不同時間週期中存在於不同播放軌中。 舉例而言,參看圖4,用於播放軌01及播放軌02之取樣群組描述方塊可各自包括各別『linf』取樣群組描述項,該等『linf』取樣群組描述項包括指定含有與播放軌01及播放軌02相關聯之『oinf』取樣群組的播放軌之各別播放軌識別符的各別『oinf』播放軌識別符元素。此外,在圖4中,用於播放軌02的『linf』取樣群組描述項中之『oinf』播放軌識別符元素可指示播放軌02包括『oinf』取樣群組。因此,播放軌02之『oinf』取樣群組可包括取樣56。然而,若第一播放軌中之每一取樣與第二播放軌中之各別取樣對齊且『oinf』取樣群組經定義用於第二播放軌,則與『oinf』取樣群組直接定義於第一播放軌中相比,第一播放軌參考第二播放軌之『oinf』取樣群組可更高效。 因此,在第二技術之實例中,諸如源裝置12或另一裝置之裝置可產生檔案中之第一播放軌。在此實例中,第一播放軌含有用於層資訊取樣群組的取樣群組描述項。另外,在此實例中,裝置產生檔案中之第二播放軌。第二播放軌含有列舉可供用於檔案中之位元串流的操作點之操作點資訊取樣群組的取樣群組描述項。在此實例中,裝置可使用第一播放軌中指示的資料以將第二播放軌識別為含有用於操作點資訊取樣群組之取樣群組描述項。 在第二技術之另一實例中,諸如目的地裝置14或另一裝置之裝置獲得檔案中之第一播放軌。第一播放軌含有用於層資訊取樣群組之取樣群組描述項。另外,裝置獲得檔案中之第二播放軌。在此實例中,第二播放軌含有列舉可供用於檔案中之位元串流之操作點的操作點資訊取樣群組之取樣群組描述項。此外,在此實例中,裝置可使用第一播放軌中指示的資料以將第二播放軌識別為含有用於操作點資訊取樣群組之取樣群組描述項。 在第三技術中,『oinf』取樣群組及『linf』取樣群組在時間上對齊,以使得屬於同一『oinf』取樣群組之取樣亦屬於同一『linf』取樣群組。舉例而言,建構在上文所描述的第二技術上,對檔案格式的要求或約束條件可為:對於每一屬於『linf』取樣群組lA的在播放軌tA中之取樣sA及屬於『linf』取樣群組lB的在播放軌tB中的取樣sB(其中sA及sB在時間上共置),在播放軌tA中且亦屬於『linf』取樣群組lA的取樣sC在時間上與在播放軌tB中之取樣sD共置,則取樣sD必須屬於『linf』取樣群組lB。此外,對檔案格式的要求或約束條件可為:對於每一屬於『oref』取樣群組oA的在播放軌tA中之取樣sA及屬於『oref』取樣群組oB的在播放軌tB中之取樣sB(其中sA及sB在時間上共置),在播放軌tA中且亦屬於『oref』取樣群組oA的取樣sC在時間上與在播放軌tB中之取樣sD共置,則取樣sD必須屬於『oref』取樣群組oB。 因此,在第三技術之實例中,諸如源裝置12或另一裝置之裝置可產生檔案中之第一播放軌。在此實例中,第一播放軌含有用於層資訊取樣群組的取樣群組描述項。另外,在此實例中,裝置產生檔案中之第二播放軌。在此實例中,第二播放軌含有列舉可供用於檔案中之位元串流之操作點的操作點資訊取樣群組之取樣群組描述項。在此實例中,層資訊取樣群組及操作點資訊取樣群組在時間上對齊以使得屬於操作點資訊取樣群組之取樣亦屬於同一層資訊取樣群組。 類似地,在第三技術之實例中,諸如目的地裝置14或另一裝置之裝置可獲得檔案中之第一播放軌。在此實例中,第一播放軌含有用於層資訊取樣群組的取樣群組描述項。另外,在此實例中,裝置獲得檔案中之第二播放軌。在此實例中,第二播放軌含有列舉可供用於檔案中之位元串流之操作點的操作點資訊取樣群組之取樣群組描述項。在此實例中,層資訊取樣群組及操作點資訊取樣群組在時間上對齊以使得屬於操作點資訊取樣群組之取樣亦屬於同一層資訊取樣群組。 下文展示用於實施上文所描述第二及第三技術的14496-15之當前草案規範的變化。 9.8.1 操作點資訊取樣群組9.8.1.1 定義 方塊類型:『oinf』 容器:『oref』類型參考播放軌之SampleGroupDescriptionBox(『sgpd』) 必選:在L-HEVC位元串流之一個且僅僅一個播放軌中為是 數量:一或多個『oinf』取樣群組項 藉由使用操作點資訊取樣群組(『oinf』)將給定取樣相關之不同操作點及其構造通知應用程式。每一操作點係關於輸出層集、最大T-ID值及設定檔、層級及層次傳信。所有此等資訊係由『oinf』取樣群組捕獲。除此等資訊以外,此取樣群組亦提供層之間的依賴性資訊、在L-HEVC位元串流中寫碼的可調性之類型,及有關於給定可調性類型之任一特定層的尺寸識別符。 <dlt>對於L-HEVC位元串流之所有播放軌,在此集合中應僅僅存在攜載『oinf』取樣群組之一個播放軌。L-HEVC位元串流之所有播放軌應具有對攜載『oinf』取樣群組之播放軌的類型『oref』之播放軌參考。</dlt> <ins>攜載『oinf』取樣群組之播放軌係藉由在層資訊(『linf』)取樣群組中傳信的oinf_track_id 欄位識別。『linf』取樣群組與『oinf』取樣群組在時間上對齊,以使得屬於同一『oinf』取樣群組的取樣亦屬於同一『linf』取樣群組。</ins> 當若干VPS存在於L-HEVC位元串流中時,可需要聲明若干操作點資訊取樣群組。對於其中呈現單一VPS的更普通情況,建議使用定義於ISO/IEC 14496-12中的預設取樣群組機構且在播放軌取樣表中包括操作點資訊取樣群組,而非在每一播放軌片段中聲明操作點資訊取樣群組。9.8.2 層資訊取樣群組9.8.2.1 定義 方塊類型:『linf』 容器:SampleGroupDescriptionBox(『sgpd』) 必選:每一L-HEVC播放軌中為是 數量:一或多個『linf』取樣群組項 播放軌攜載的層及子層之清單係在層資訊取樣群組中傳信。每一L-HEVC播放軌應攜載『linf』取樣群組。9.8.2.2 語法 class LayerInfoGroupEntry extends VisualSampleGroupEntry ('linf')) { unsigned int (2) reserved; unsigned int (6) num_layers_in_track; for (i=0; i<num_layers_in_track; i++) { unsigned int (4) reserved; unsigned int (6) layer_id; unsigned int (3) min_sub_layer_id; unsigned int (3) max_sub_layer_id; } <ins>unsigned int (32) oinf_track_id;</ins> }9.8.2.3 語義 num_layers_in_track:與此取樣群組相關聯的此播放軌之任一取樣中攜載的層之數目。 layer_id:用於相關聯取樣中攜載的層之層ID。此欄位之執行個體應在循環中按遞升次序。 min_sub_layer_id:用於播放軌內的層中之子層之最小TemporalId值。 max_sub_layer_id:用於播放軌內的層中之子層之最大TemporalId值。 <ins>oinf_track_id:含有相關聯『oinf』取樣群組的播放軌之播放軌ID。</ins> 在第四技術中,「虛設」取樣項可經產生用於播放軌。「虛設」取樣項並不適用於播放軌中之任一取樣,且可含有可僅僅由含有取決於此播放軌中之層的層的一些其他播放軌使用的參數集。在一些實例中,「虛設」取樣項包括描述操作點的資訊或指向在『oinf』方塊中傳信之操作點的索引值。因此,在圖4的實例中,用於播放軌01之取樣表方塊可包括「虛設」取樣項且解譯檔案之裝置可在解譯播放軌02時參考播放軌01之「虛設」取樣項。 在第四技術之實例中,諸如源裝置12或另一裝置之裝置產生檔案中之一或多個播放軌。另外,在此實例中,裝置產生檔案中之額外播放軌。在此實例中,額外播放軌含有不適用於額外播放軌中之任一取樣的特定取樣項。在此實例中,特定取樣項含有可僅僅由含有取決於額外播放軌中之層的層的一或多個播放軌使用的參數集。 類似地,在第四技術之實例中,諸如目的地裝置14或另一裝置之裝置獲得檔案中之一或多個播放軌。另外,在此實例中,裝置獲得檔案中之額外播放軌。在此實例中,額外播放軌含有不適用於額外播放軌中之任一取樣的特定取樣項。此外,在此實例中,特定取樣項含有可僅僅由含有取決於額外播放軌中之層的層的一或多個播放軌使用的參數集。 在第五技術中,操作點之清單不經由取樣群組傳信。實際上,操作點之清單係在『oref』播放軌內的其自身方塊(例如,『oinf』方塊)中傳信。舉例而言,如上文所提,播放軌之取樣表方塊可包括含有關於播放軌之各別取樣之資訊的取樣項。在用於L-HEVC之ISO基本媒體檔案格式的擴展之草案中,取樣項可包括LHEVCDecoderConfigurationRecord類別之執行個體。根據第五技術之實例,每一播放軌之取樣項可包括至『oinf』方塊中傳信的操作點之清單的索引之清單。取樣項中之操作點的清單為適用於取樣項適用於的取樣的操作點之清單。 因此,在第五技術之實例中,作為產生檔案之部分,裝置(例如,源裝置12或另一裝置)可在含有指定列舉可供用於檔案中之位元串流的操作點的操作點資訊取樣群組之取樣群組描述項的播放軌內之方塊中傳信操作點之清單。在此實例中,方塊屬於的類型之方塊僅僅經指定用於含有指定操作點資訊取樣群組的取樣群組描述項。類似地,在第五技術之另一實例中,作為產生檔案之部分,裝置(例如,目的地裝置14或另一裝置)可在含有指定列舉可供用於檔案中之位元串流的操作點的操作點資訊取樣群組之取樣群組描述項的播放軌內之方塊中獲得操作點之清單。在此實例中,方塊屬於的類型之方塊僅僅經指定用於含有指定操作點取樣群組的取樣群組描述項。 下文展示用於實施第五技術的14496-15之當前草案規範的實例變化。9.6.3 解碼器組態記錄 當定義於條款8.3.3.1中的解碼器組態記錄用於可解譯為L-HEVC或HEVC串流的串流時,HEVC解碼器組態記錄應適用於HEVC相容基層,且應僅僅含有解碼HEVC基層所需要的參數集。 LHEVCDecoderConfigurationRecord的語法如下: aligned(8) class LHEVCDecoderConfigurationRecord { unsigned int(8) configurationVersion = 1; bit(4) reserved = '1111'b; unsigned int(12) min_spatial_segmentation_idc; bit(6) reserved = '111111'b; unsigned int(2) parallelismType; bit(2) reserved = '11'b; bit(3) numTemporalLayers; bit(1) temporalIdNested; unsigned int(2) lengthSizeMinusOne; unsigned int(8) numOfArrays; for (j=0; j < numOfArrays; j++) { bit(1) array_completeness; unsigned int(1) reserved = 0; unsigned int(6) NAL_unit_type; unsigned int(16) numNalus; for (i=0; i< numNalus; i++) { unsigned int(16) nalUnitLength; bit(8*nalUnitLength) nalUnit; } } <ins>unsigned int(16) numOfAvailableOPs; for (j=0; j < numOfAvailableOPs; j++) { unsigned int(16) op_idx;</ins>} } LHEVCDecoderConfigurationRecord及HEVCDecoderConfigurationRecord共同的欄位之語義保持不變。 注意,播放軌可表示大於一個輸出層集。 注意,對於包括於播放軌中之每一輔助圖像層,建議在nalUnit內包括含有聲明性SEI訊息(諸如,用於深度輔助圖像層之深度表示資訊SEI訊息)之SEI NAL單元,指定輔助圖像層之特性。 <ins> num_operating_points:給出適用於此取樣項適用於的取樣的操作點之數目。 Op_idx:給出至在『oinf』方塊中傳信之操作點之清單的索引。</ins> 本發明提出若干技術。此等技術中之一些可獨立地應用,且其中之一些可組合地應用。 用於產生或處理檔案的本發明之技術可藉由源裝置12、目的地裝置14或另一裝置執行。舉例而言,裝置可自源裝置12接收經編碼視訊資料並基於經編碼視訊資料產生檔案。類似地,裝置可接收並處理檔案。此裝置可將來自檔案之經編碼視訊資料提供至目的地裝置14。 圖5為說明實例視訊編碼器20之方塊圖。圖5係出於解釋的目的而提供且不應視為本發明中廣泛例示及描述之該等技術的限制。出於解釋之目的,本發明在HEVC寫碼之上下文中描述視訊編碼器20。然而,本發明之技術可適用於其他寫碼標準或方法。 在圖5之實例中,視訊編碼器20包括預測處理單元100、視訊資料記憶體101、殘餘產生單元102、變換處理單元104、量化單元106、反量化單元108、反變換處理單元110、重建構單元112、濾波器單元114、經解碼圖像緩衝器116及熵編碼單元118。預測處理單元100包括框間預測處理單元120及框內預測處理單元126。框間預測處理單元120包括運動估計單元及運動補償單元(未圖示)。在其他實例中,視訊編碼器20可包括較多、較少或不同功能之組件。 視訊資料記憶體101可儲存待由視訊編碼器20之組件編碼的視訊資料。可(例如)自視訊源18獲得儲存於視訊資料記憶體101中之視訊資料。經解碼圖像緩衝器116可為儲存用於由視訊編碼器20在編碼視訊資料(例如,以框內或框間寫碼模式)時使用之參考視訊資料的參考圖像記憶體。視訊資料記憶體101及經解碼圖像緩衝器116可由多種記憶體裝置中之任一者形成,諸如,動態隨機存取記憶體(DRAM)(包括同步DRAM(SDRAM))、磁阻式RAM(MRAM)、電阻式RAM(RRAM)或其他類型之記憶體裝置。可藉由相同記憶體裝置或單獨記憶體裝置來提供視訊資料記憶體101及經解碼圖像緩衝器116。在各種實例中,視訊資料記憶體101可與視訊編碼器20之其他組件一起在晶片上,或相對於彼等組件在晶片外。 視訊編碼器20接收視訊資料。視訊編碼器20可編碼視訊資料之圖像之圖塊中的每一CTU。CTU中之每一者可與相等大小之明度寫碼樹型區塊(CTB)及圖像之對應CTB相關聯。作為編碼CTU之部分,預測處理單元100可執行四分樹分割以將CTU之CTB劃分成逐漸較小的區塊。更小區塊可為CU之寫碼區塊。舉例而言,預測處理單元100可將與CTU相關聯的CTB分割成四個相等大小的子區塊,將子區塊中之一或多者分割成四個相等大小的子子區塊,等等。 視訊編碼器20可編碼CTU之CU以產生該等CU之經編碼表示(亦即,經寫碼CU)。作為編碼CU之部分,預測處理單元100可在CU之一或多個PU中分割與CU相關聯之寫碼區塊。因此,每一PU可與明度預測區塊及對應的色度預測區塊相關聯。框間預測處理單元120可藉由對CU之每一PU執行框間預測而產生PU之預測性資料。用於PU之預測性資料可包括PU之預測性區塊及PU之運動資訊。框內預測處理單元126可藉由對PU執行框內預測而產生用於PU之預測性資料。PU之預測性資料可包括PU之預測性區塊及各種語法元素。框內預測處理單元126可對I圖塊、P圖塊及B圖塊中之PU執行框內預測。 預測處理單元100可自由框間預測處理單元120產生的PU之預測性資料或由框內預測處理單元126產生的PU之預測性資料當中選擇CU之PU的預測性資料。在一些實例中,預測處理單元100基於數組預測性資料之速率/失真量度而選擇用於CU之PU的預測性資料。選定之預測性資料的預測性區塊在本文中可被稱作選定之預測性區塊。殘餘產生單元102可基於CU之寫碼區塊及CU的PU之選定預測性區塊而產生CU之殘餘區塊。 變換處理單元104可執行四分樹分割以將與CU相關聯之剩餘區塊分割成與CU之TU相關聯的變換區塊。TU可與明度變換區塊及兩個色度變換區塊相關聯。CU之TU之明度及色度變換區塊的大小及位置可或可不基於CU之PU之預測區塊的大小及位置。 變換處理單元104可藉由將一或多個變換應用於TU之變換區塊而產生CU之每一TU的變換係數區塊。變換處理單元104可將各種變換應用於與TU相關聯的變換區塊。舉例而言,變換處理單元104可將離散餘弦變換(DCT)、定向變換或概念上類似之變換應用於變換區塊。在一些實例中,變換處理單元104並不將變換應用於變換區塊。在此等實例中,變換區塊可經處理為變換係數區塊。 量化單元106可量化係數區塊中之變換係數。量化程序可減少與變換係數中之一些或全部相關聯的位元深度。 反量化單元108及反變換處理單元110可分別將反量化及反變換應用於係數區塊,以自係數區塊重建構殘餘區塊。重建構單元112可將經重建構之殘餘區塊添加至來自由預測處理單元100所產生之一或多個預測性區塊的對應取樣,以產生與TU相關聯的經重建構變換區塊。藉由以此方式重建構CU之每一TU的變換區塊,視訊編碼器20可重建構CU之寫碼區塊。 濾波器單元114可執行一或多個解區塊操作以減少與CU相關聯之寫碼區塊中的區塊假影。在濾波器單元114對經重建構寫碼區塊執行一或多個解區塊操作之後,經解碼圖像緩衝器116可儲存經重建構寫碼區塊。框間預測處理單元120可使用含有經重建構寫碼區塊之參考圖像,以對其他圖像之PU執行框間預測。另外,框內預測處理單元126可使用經解碼圖像緩衝器116中之經重建構寫碼區塊,以對與CU在相同之圖像中的其他PU執行框內預測。 熵編碼單元118可自視訊編碼器20的其他功能組件接收資料。舉例而言,熵編碼單元118可自量化單元106接收係數區塊,並可自預測處理單元100接收語法元素。熵編碼單元118可對資料執行一或多個熵編碼操作以產生經熵編碼的資料。舉例而言,熵編碼單元118可對資料執行CABAC操作、上下文自適應性可變長度寫碼(CAVLC)操作、可變至可變(V2V)長度寫碼操作、基於語法之上下文自適應性二進位算術寫碼(SBAC)操作、概率區間分割熵(PIPE)寫碼操作、指數哥倫布編碼操作或另一類型之熵編碼操作。視訊編碼器20可輸出包括由熵編碼單元118產生的經熵編碼之資料的位元串流。舉例而言,位元串流可包括表示CU之RQT的資料。 此外,在圖5的實例中,檔案處理單元128可獲得由視訊編碼器20產生的位元串流。檔案處理單元128可藉由裝置(諸如源裝置12、檔案產生裝置34、內容遞送網路裝置或另一類型裝置)之一個或多個處理器實施。檔案處理單元128可產生儲存由視訊編碼器20產生之位元串流的檔案。電腦可讀媒體130可接收由檔案處理單元128產生的檔案。在一些實例中,電腦可讀媒體130包含諸如記憶體、光學光碟、磁碟或計算裝置能夠自其讀取資料的其他類型之非暫時性儲存媒體之電腦可讀儲存媒體。在其中電腦可讀媒體130包含電腦可讀儲存媒體的一些實例中,電腦可讀儲存媒體可形成裝置(諸如源裝置12、檔案產生裝置34、內容遞送網路裝置或另一類型裝置)之部分。在一些實例中,電腦可讀媒體130包含電腦可讀通信媒體,諸如光纖、通信電纜、電磁波或計算裝置能夠自其讀取資料的其他類型之媒體。 根據本發明之技術,檔案處理單元128可產生檔案中之操作點參考播放軌。作為產生操作點參考播放軌之部分,檔案處理單元128可在操作點參考播放軌中傳信描述可供用於檔案中之位元串流的操作點的操作點資訊取樣群組。另外,作為產生檔案之部分,檔案處理單元128可產生檔案中之一或多個額外播放軌。在此實例中,無操作點資訊取樣群組係在額外播放軌中之任一者中傳信。此外,基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,檔案處理單元128可將各別額外播放軌中之各別取樣考慮為操作點資訊取樣群組之部分。此外,基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,檔案處理單元128可將各別額外播放軌中之各別取樣考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分。 圖6為說明實例視訊解碼器30之方塊圖。圖6係出於解釋的目的而提供且不對如本發明中廣泛例示及描述之技術進行限制。出於解釋之目的,本發明在HEVC寫碼之內容脈絡中描述視訊解碼器30。然而,本發明之技術可適用於其他寫碼標準或方法。 在圖6之實例中,視訊解碼器30包括熵解碼單元150、視訊資料記憶體151、預測處理單元152、反量化單元154、反變換處理單元156、重建構單元158、濾波器單元160,及經解碼圖像緩衝器162。預測處理單元152包括運動補償單元164及框內預測處理單元166。在其他實例中,視訊解碼器30可包括較多、較少或不同的功能組件。 視訊資料記憶體151可儲存待由視訊解碼器30之組件解碼的視訊資料(諸如,經編碼視訊位元串流)。可(例如)自頻道16(例如,自本端視訊源,諸如攝影機)、經由視訊資料之有線或無線網路通信,或藉由存取實體資料儲存媒體獲得儲存於視訊資料記憶體151中之視訊資料。視訊資料記憶體151可形成儲存來自經編碼視訊位元串流之經編碼視訊資料的經寫碼圖像緩衝器(CPB)。經解碼圖像緩衝器162可為儲存用於由視訊解碼器30在解碼視訊資料(例如,以框內或框間寫碼模式)時使用的參考視訊資料之參考圖像記憶體。視訊資料記憶體151及經解碼圖像緩衝器162可由多種記憶體裝置中之任一者形成,諸如動態隨機存取記憶體(DRAM)(包括同步DRAM(SDRAM))、磁阻式RAM(MRAM)、電阻式RAM(RRAM)或其他類型之記憶體裝置。可藉由同一記憶體裝置或單獨記憶體裝置提供視訊資料記憶體151及經解碼圖像緩衝器162。在各種實例中,視訊資料記憶體151可與視訊解碼器30之其他組件一起在晶片上,或相對於彼等組件而言在晶片外。 視訊資料記憶體151接收並儲存位元串流之經編碼視訊資料(例如,NAL單元)。熵解碼單元150可自CPB接收經編碼視訊資料(例如,NAL單元)且剖析NAL單元以獲得語法元素。熵解碼單元150可對NAL單元中之經熵編碼語法元素進行熵解碼。預測處理單元152、反量化單元154、反變換處理單元156、重建構單元158及濾波器單元160可基於自位元串流提取之語法元素而產生經解碼視訊資料。熵解碼單元150可執行大體上與熵編碼單元118之彼程序互逆的程序。 除自位元串流獲得語法元素之外,視訊解碼器30可對未經分割之CU執行重建構操作。為對CU執行重建構操作,視訊解碼器30可對CU之每一TU執行重建構操作。藉由對CU之每一TU執行重建構操作,視訊解碼器30可重建構CU之殘餘區塊。 作為對CU之TU執行重建構操作的部分,反量化單元154可反量化(亦即,解量化)與TU相關聯的係數區塊。在反量化單元154對係數區塊進行反量化之後,反變換處理單元156可將一或多個逆變換應用於係數區塊以便產生與TU相關聯之殘餘區塊。舉例而言,反變換處理單元156可將反DCT、反整數變換、反Karhunen-Loeve變換(KLT)、反旋轉變換、反定向變換或另一反變換應用於係數區塊。 若使用框內預測編碼PU,則框內預測處理單元166可執行框內預測以產生PU之預測性區塊。框內預測處理單元166可使用框內預測模式來基於取樣空間相鄰區塊產生PU之預測性區塊。框內預測處理單元166可基於自位元串流獲得的一或多個語法元素判定用於PU之框內預測模式。 若使用框間預測編碼PU,則熵解碼單元150可判定PU之運動資訊。運動補償單元164可基於PU之運動資訊而判定一或多個參考區塊。運動補償單元164可基於一或多個參考區塊產生PU之預測性區塊(例如,預測性明度、Cb及Cr區塊)。 重建構單元158可使用CU之TU之變換區塊(例如,明度、Cb及Cr變換區塊)及CU之PU之預測性區塊(例如,明度、Cb及Cr區塊)(亦即,可適用之框內預測資料或框間預測資料)來重建構CU之寫碼區塊(例如,明度、Cb及Cr寫碼區塊)。舉例而言,重建構單元158可將變換區塊(例如,明度、Cb及Cr變換區塊)之取樣添加至預測性區塊(例如,明度、Cb及Cr預測性區塊)之對應取樣,以重建構CU之寫碼區塊(例如,明度、Cb及Cr寫碼區塊)。 濾波器單元160可執行解區塊操作以減少與CU之寫碼區塊相關聯的區塊假影。視訊解碼器30可將CU之寫碼區塊儲存於經解碼圖像緩衝器162中。經解碼圖像緩衝器162可提供參考圖像以用於後續運動補償、框內預測及在顯示裝置(諸如,圖1之顯示裝置32)上之呈現。舉例而言,視訊解碼器30可基於經解碼圖像緩衝器162中之區塊對其他CU之PU執行框內預測或框間預測操作。 在圖6的實例中,電腦可讀媒體148包含諸如記憶體、光學光碟、磁碟或計算裝置能夠自其讀取資料的其他類型之非暫時性儲存媒體之電腦可讀儲存媒體。在其中電腦可讀媒體148包含電腦可讀儲存媒體的一些實例中,電腦可讀儲存媒體可形成裝置(諸如源裝置12、檔案產生裝置34、內容遞送網路裝置或另一類型裝置)之部分。在一些實例中,電腦可讀媒體148包含電腦可讀通信媒體,諸如光纖、通信電纜、電磁波或計算裝置能夠自其讀取資料的其他類型之媒體。 此外,在圖6之實例中,檔案處理單元149自電腦可讀媒體148接收檔案或檔案之部分。檔案處理單元149可藉由裝置(諸如目的地裝置14、MANE、內容遞送網路裝置或另一類型裝置)的一個或多個處理器實施。 檔案處理單元149可處理檔案。舉例而言,檔案處理單元149可自檔案獲得NAL單元。在圖6之實例中,藉由視訊解碼器30接收之經編碼視訊位元串流可包含自檔案獲得之NAL單元。 根據本發明之技術,檔案處理單元149可獲得檔案中之操作點參考播放軌。使用在操作點參考播放軌中傳信的操作點資訊取樣群組在檔案中描述可供用於檔案中之位元串流的操作點。此外,檔案處理單元149可獲得檔案中之一或多個額外播放軌。無操作點資訊取樣群組係在額外播放軌之任一者中傳信。此外,對於一或多個額外播放軌中之每一各別額外播放軌之每一各別取樣,檔案處理單元149可判定是否將各別取樣考慮為操作點資訊取樣群組之部分。基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,檔案處理單元149可將各別額外播放軌中之各別取樣考慮為操作點資訊取樣群組之部分。基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,檔案處理單元149可將各別額外播放軌中之各別取樣考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分。此外,檔案處理單元149可執行自位元串流提取操作點的子位元串流提取程序。 圖7為說明根據本發明之一或多種技術的檔案300之實例結構之方塊圖。檔案300可藉由各種裝置產生及處理,諸如源裝置12(圖1)、檔案產生裝置34(圖1)、目的地裝置14(圖1)、檔案處理單元128(圖5)、MANE、內容遞送網路裝置或其他類型之裝置或單元。在圖7之實例中,檔案300包括電影方塊302及複數個媒體資料方塊304。儘管在圖7之實例中說明為在同一檔案中,但在其他實例中,電影方塊302及媒體資料方塊304可在分開的檔案中。如上所指示,方塊可為由唯一類型識別符及長度定義之物件導向式建構區塊。舉例而言,方塊可為ISOBMFF中之基本語法結構,包括四字元寫碼方塊類型、方塊之位元組計數及有效負載。 電影方塊302可含有用於檔案300之播放軌的後設資料。檔案300之每一播放軌可包含媒體資料之連續串流。媒體資料方塊304中之每一者可包括一或多個取樣305。取樣305中之每一者可包含音訊或視訊存取單元。如在本發明中其他處所描述,在多視圖寫碼(例如,MV-HEVC及3D-HEVC)及可調式視訊寫碼(例如,SHVC)中,每一存取單元可包含多個經寫碼圖像。舉例而言,存取單元可包括用於每一層之一或多個經寫碼圖像。 此外,在圖7之實例中,電影方塊302包括播放軌方塊306。播放軌方塊306可圍封用於檔案300之播放軌的後設資料。在其他實例中,電影方塊302可包括用於檔案300之不同播放軌的多個播放軌方塊。播放軌方塊306包括媒體方塊307。媒體方塊307可含有聲明關於播放軌內之媒體資料之資訊的所有物件。媒體方塊307包括一媒體資訊方塊308。媒體資訊方塊308可含有聲明播放軌之媒體之特性資訊的所有物件。媒體資訊方塊308包括一取樣表方塊309。取樣表方塊309可指定取樣特定後設資料。取樣表方塊309可包括零或多個SampleToGroup方塊及零或多個SampleGroupDescription方塊。 在圖7的實例中,取樣表方塊309可包括取樣描述方塊310。另外,取樣表方塊309可包括零或多個SampleToGroup方塊及零或多個SampleGroupDescription方塊。特別地,在圖7之實例中,取樣表方塊309包括SampleToGroup方塊311及SampleGroupDescription方塊312。在其他實例中,取樣表方塊309可包括除取樣描述方塊310、SampleToGroup方塊311及SampleGroupDescription方塊312之外的其他方塊,及/或可包括多個SampleToGroup方塊及SampleGroupDescription方塊。SampleToGroup方塊311可將取樣(例如,取樣305中之特定者)映射至一群取樣。SampleGroupDescription方塊312可指定由該群取樣(亦即,取樣群組)中之取樣共用的性質。取樣描述方塊310包含用於播放軌之一組取樣項315。取樣(例如,取樣305中的一者)可包括將取樣項315中之一者指示為適用於取樣的語法元素。 此外,在圖7的實例中,SampleToGroup方塊311包括grouping_type語法元素313(亦即,分群類型語法元素)、entry_count語法元素316(亦即,項計數語法元素)及一或多個取樣群組項318。Grouping_type語法元素313為識別取樣分群之類型(亦即,用以形成取樣群組之準則),且將其連結至具有相同分群類型值之取樣群組描述表的整數。在一些實例中,對於一播放軌,具有grouping_type語法元素313之同一值的SampleToGroup方塊311應至多出現一次。 Entry_count語法元素316指示取樣群組項318之數目。取樣群組項318中之每一者包括一sample_count語法元素324(亦即,取樣計數語法元素)及一group_description_index語法元素326(亦即,群組描述索引語法元素)。Sample_count語法元素324可指示與含有sample_count語法元素324之取樣群組項相關聯的取樣之數目。Group_description_index語法元素326可在SampleGroupDescription方塊(例如,SampleGroupDescription方塊312)內識別含有與含有group_description_index語法元素326之取樣群組項相關聯的取樣之描述的群組描述項。Group_description_index語法元素326可介於1至SampleGroupDescription方塊312中之取樣群組項之數目的範圍內。具有值0之Group_description_index語法元素326指示取樣並非藉由grouping_type語法元素313指示的類型之群組的成員。 另外,在圖7的實例中,SampleGroupDescription方塊312包括grouping_type語法元素328、entry_count語法元素330及一或多個群組描述項332。Grouping_type語法元素328為識別與SampleGroupDescription方塊312相關聯的SampleToGroup方塊(例如,SampleToGroup方塊311)的整數。Entry_count語法元素330指示SampleGroupDescription方塊中的群組描述項332之數目。群組描述項332中之每一者可包括取樣群組之描述。舉例而言,群組描述項332可包括用於『oinf』取樣群組之取樣群組描述項。 根據本發明之第一技術,基於檔案300之操作點參考播放軌含有在時間上與檔案300的額外播放軌中之各別取樣共置的取樣,解譯檔案300的裝置可將各別額外播放軌中之各別取樣考慮為由在SampleGroupDescription方塊312中之群組描述項332中的取樣群組描述項描述的操作點資訊取樣群組之部分。此外,基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,裝置可將各別額外播放軌中之各別取樣考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分。 圖8為說明根據本發明的一或多種技術的檔案450之實例結構之概念圖。檔案450可藉由各種裝置產生及處理,諸如源裝置12(圖1)、檔案產生裝置34(圖1)、目的地裝置14(圖1)、檔案處理單元149(圖6)、MANE、內容遞送網路裝置或其他類型之裝置或單元。在圖8之實例中,檔案450包括一或多個電影片段方塊452及複數個媒體資料方塊454。儘管在圖8之實例中說明為在同一檔案中,但在其他實例中電影片段方塊452及媒體資料方塊454可在分開的檔案中。媒體資料方塊454中之每一者可包括一或多個取樣456。電影片段方塊中之每一者對應於一電影片段。每一電影片段可包含一組播放軌片段。可存在每播放軌零個或多個播放軌片段。 在圖8之實例中,電影片段方塊452提供關於對應電影片段之資訊。此資訊先前處於電影方塊(諸如電影方塊302)中。電影片段方塊452可包括一播放軌片段方塊458。播放軌片段方塊458對應於一播放軌片段,且提供關於播放軌片段的資訊。 舉例而言,在圖8之實例中,播放軌片段方塊458可包括含有關於對應於播放軌片段方塊458之播放軌片段的資訊的一或多個SampleToGroup方塊462及一或多個SampleGroupDescription方塊464。 此外,在圖8之實例中,播放軌片段方塊458可包括取樣描述方塊460,零或多個SampleToGroup方塊及零或多個SampleGroupDescription方塊。在圖8的實例中,播放軌片段方塊458含有含有關於對應於播放軌片段方塊458之播放軌片段之資訊的SampleToGroup方塊462及SampleGroupDescription方塊464。 取樣描述方塊460包含用於播放軌片段之一組取樣項466。取樣項466之每一各別取樣項適用於播放軌之一或多個取樣。在圖8之實例中,該組取樣項466包括取樣項466A。 SampleToGroup方塊462包括grouping_type語法元素470(亦即,分群類型語法元素)、entry_count語法元素474(亦即,項計數語法元素)及一或多個取樣群組項476。取樣群組項476中之每一者包括一sample_count語法元素482(亦即,取樣計數語法元素)及一group_description_index語法元素484(亦即,群組描述索引語法元素)。Grouping_type語法元素470、entry_count語法元素474、sample_count語法元素482及group_description_index 484可具有與關於圖7之實例描述的對應語法元素相同的語義。 另外,在圖8的實例中,SampleGroupDescription方塊464包括grouping_type語法元素486、entry_count語法元素488及一或多個群組描述項490。Grouping_type語法元素486、entry_count語法元素488及群組描述項490可具有與關於圖7之實例描述的對應語法元素及結構相同的語義。舉例而言,群組描述項332可包括用於『oinf』取樣群組之取樣群組描述項。 根據本發明之第一技術,基於檔案450之操作點參考播放軌含有在時間上與檔案450的額外播放軌中之各別取樣共置的取樣,解譯檔案450的裝置可將各別額外播放軌中之各別取樣考慮為由在SampleGroupDescription方塊464中之群組描述項490中的取樣群組描述項描述的操作點資訊取樣群組之部分。此外,基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,裝置可將各別額外播放軌中之各別取樣考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分。 圖9為說明根據本發明的一或多種技術的包括虛設取樣項之檔案500的實例結構之方塊圖。檔案500可藉由各種裝置產生及處理,諸如源裝置12(圖1)、檔案產生裝置34(圖1)、目的地裝置14(圖1)、檔案處理單元128(圖5)、MANE、內容遞送網路裝置或其他類型之裝置或單元。在圖9的實例中,檔案500可包括電影方塊502、含有取樣505之媒體資料方塊504、播放軌方塊506、媒體方塊507、媒體資訊方塊508及含有取樣描述方塊510、SampleToGroup方塊511及SampleGroupDescription方塊512之取樣表方塊509。此外,在圖9的實例中,取樣描述方塊510可包括取樣項515A至515N(統稱為「取樣項515」)。此等方塊可具有類似於上文關於圖7之實例所描述的對應方塊的結構及語義。然而,根據本發明之第四實例技術,取樣描述方塊510可包括虛設取樣項518。虛設取樣項518不適用於對應於播放軌方塊506的播放軌之任一取樣,但可含有僅僅藉由含有取決於對應於播放軌方塊506的播放軌中之層的層之其他播放軌使用的參數集。舉例而言,虛設取樣項518可包括資訊描述操作點。類似於圖8中提供之實例的實例可出現於取樣描述方塊460包括虛設取樣項之處。 圖10為說明根據本發明之一或多種技術的其中取樣項包括操作點索引的檔案550之實例結構的方塊圖。檔案550可藉由各種裝置產生及處理,諸如源裝置12(圖1)、檔案產生裝置34(圖1)、目的地裝置14(圖1)、檔案處理單元128(圖5)、MANE、內容遞送網路裝置或其他類型之裝置或單元。在圖10的實例中,檔案550可包括電影方塊552、含有取樣555之媒體資料方塊554、播放軌方塊556、媒體方塊557、媒體資訊方塊558及含有取樣描述方塊560、SampleToGroup方塊561及SampleGroupDescription方塊562之取樣表方塊559。此外,在圖10的實例中,取樣描述方塊560可包括取樣項555A至555N(統稱為「取樣項555」)。此等方塊可具有類似於上文關於圖7之實例所描述的對應方塊的結構及語義。 此外,在一些實例中,取樣項565可包括LHEVCDecoderConfigurationRecord類別之執行個體。舉例而言,在圖10的實例中,取樣項565A可包括LHEVCDecoderConfigurationRecord 568。根據上文所描述的本發明之第五實例技術,LHEVCDecoderConfigurationRecord 568可包括一或多個操作點索引語法元素570(例如,op_idx)。每一各別操作點索引語法元素給出在『oinf』方塊中傳信的操作點之清單的索引。因此,裝置可能夠基於取樣之取樣項判定取樣所含有的經編碼圖像之操作點。類似於圖8中提供之實例的實例可出現於取樣項446包括操作點索引之處。 圖11為說明根據本發明之技術的用於處理檔案之裝置的實例操作之流程圖。本發明之流程圖作為實例提供。在其他實例中,可執行不同動作或可以不同次序或並行執行動作。圖11之實例可藉由各種類型之裝置執行,諸如源裝置12(圖1)、檔案產生裝置34(圖1)、檔案處理單元128(圖5)、檔案伺服器、串流裝置、MANE或另一類型裝置或單元。 在圖11的實例中,裝置產生檔案中之操作點參考播放軌(600)。產生播放軌可包含產生包括指示屬於播放軌的取樣之資料的播放軌方塊。作為產生操作點參考播放軌之部分,裝置可在操作點參考播放軌中傳信描述可供用於檔案中之位元串流的操作點的操作點資訊取樣群組(602)。在一些實例中,裝置可編碼視訊資料以產生位元串流。另外,在圖11的實例中,裝置可產生檔案中之一或多個額外播放軌(604)。在圖11之實例中,無操作點資訊取樣群組係在額外播放軌中之任一者中傳信。此外,基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為操作點資訊取樣群組之部分。基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分。 此外,如圖11之實例中所示,在一些實例中,作為傳信操作點資訊取樣群組之部分,裝置可產生檔案中之取樣群組描述方塊(606),諸如SampleGroupDescription方塊312或SampleGroupDescription方塊464。取樣群組描述方塊包括指定用於操作點之輸出層集、用於操作點之最大時間識別符、及用於操作點之設定檔、層級及層次傳信的取樣群組描述項(例如,群組描述項332或490中的一者)。此外,裝置可產生檔案中之指定操作點資訊取樣群組中之一組取樣及指定取樣群組描述方塊中之取樣群組描述項之索引的取樣至群組方塊(例如,SampleToGroup方塊311、462)(608)。 圖12為說明根據本發明之技術的用於處理檔案之裝置的實例操作之流程圖。圖12之實例可藉由各種類型之裝置執行,諸如目的地裝置14、檔案產生裝置、檔案伺服器、串流裝置、MANE或另一類型裝置。 在圖12的實例中,裝置可獲得檔案中之操作點參考播放軌(650)。使用在操作點參考播放軌中傳信的操作點資訊取樣群組在檔案中描述可供用於檔案中之位元串流的操作點。此外,在圖12的實例中,裝置可獲得檔案中之一或多個額外播放軌(652)。無操作點資訊取樣群組係在額外播放軌之任一者中傳信。 對於一或多個額外播放軌中之每一各別額外播放軌之每一各別取樣,裝置可判定是否將各別取樣考慮為操作點資訊取樣群組之部分(654)。基於操作點參考播放軌含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為操作點資訊取樣群組之部分。基於操作點參考播放軌不含有在時間上與各別額外播放軌中之各別取樣共置的取樣,各別額外播放軌中之各別取樣被考慮為在各別額外播放軌之各別取樣之前的操作點參考播放軌中之最後取樣的操作點資訊取樣群組之部分。 此外,在圖12的實例中,裝置可執行自位元串流提取操作點的子位元串流提取程序(656)。在一些實例中,裝置可傳輸含有經提取操作點之經編碼圖像的取樣而不傳輸不含有經提取操作點之經編碼圖像的位元串流之取樣。在一些實例中,裝置可產生儲存含有經提取操作點之經編碼圖像的取樣的新檔案而不在檔案中儲存含有經提取操作點之經編碼圖像的取樣。在一些實例中,裝置可解碼操作點之視訊資料。舉例而言,裝置可使用視訊編碼解碼器(諸如L-HEVC)解碼操作點之經編碼圖像。 此外,如圖12之實例中所說明,在一些實例中,作為獲得操作點參考播放軌之部分,裝置可自檔案獲得取樣群組描述方塊(658),諸如SampleGroupDescription方塊312或SampleGroupDescription方塊464。取樣群組描述方塊包括指定用於操作點之輸出層集、用於操作點之最大時間識別符、及用於操作點之設定檔、層級及層次傳信的取樣群組描述項(例如,群組描述項332或490中的一者)。另外,裝置可自檔案獲得指定操作點資訊取樣群組中之一組取樣及指定取樣群組描述方塊中之取樣群組描述項之索引的取樣至群組方塊(例如,SampleToGroup方塊311、462)(660)。 應理解,本文所描述之所有技術可單獨地或以組合方式使用。應認識到,取決於實例,本文中所描述之技術中之任一者的某些動作或事件可以不同序列執行,可新增、合併或完全省略該等動作或事件(例如,並非所有所描述動作或事件對於該等技術之實踐皆係必要的)。此外,在某些實例中,可(例如)經由多線緒處理、中斷處理或多個處理器同時而非依序執行動作或事件。另外,雖然出於清晰之目的,本發明之某些態樣經描述為藉由單一模組或單元執行,但應理解本發明之技術可藉由與視訊寫碼器相關聯之單元或模組之組合來執行。處理電路可以各種方式耦接至資料儲存媒體。舉例而言,處理電路可經由內部裝置互連件、有線或無線網路連接或另一通信媒體耦接至資料儲存媒體。 出於說明的目的,已關於HEVC標準描述本發明之某些態樣。然而,本發明中所描述之技術可適用於其他視訊寫碼程序,包括尚未開發之其他標準或專屬視訊寫碼程序。 視訊編碼器20(圖1及圖5)及/或視訊解碼器30(圖1及圖6)可通常被稱作視訊寫碼器。同樣地,視訊寫碼可指視訊編碼或視訊解碼(在適用時)。 雖然在上文描述技術的各種態樣之特定組合,但提供此等組合僅為了說明本發明中描述的技術之實例。因此,本發明之技術不應限於此等實例組合且可涵蓋本發明中描述之技術的各種態樣之任何可設想組合。 在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體實施,則功能可作為一或多個指令或程式碼而在一電腦可讀媒體上儲存或傳輸,且由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體(其包括(例如)根據通信協定促進電腦程式自一處傳送至另一處的任何媒體)。以此方式,電腦可讀媒體大體可對應於(1)為非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取用於實施本發明中所描述之技術的指令、程式碼及/或資料結構的任何可用媒體。電腦程式產品可包括電腦可讀媒體。 藉由實例而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存裝置、快閃記憶體或可用於儲存呈指令或資料結構形式之所要程式碼且可由電腦存取的任何其他媒體。並且,任何連接被恰當地稱為電腦可讀媒體。舉例而言,若使用同軸電纜、光纜、雙絞線、數位用戶線(DSL)或無線技術(諸如紅外線、無線電及微波)自網站、伺服器或其他遠端源傳輸指令,則同軸電纜、光纜、雙絞線、DSL或無線技術(諸如紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而是實際上有關非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟碟和藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟使用雷射以光學方式再生資料。以上各者之組合亦應包括於電腦可讀媒體之範圍內。 可由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合式或離散邏輯電路之一或多個處理器來執行指令。因此,如本文中所使用之術語「處理器」可指上述結構或適合於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,本文中所描述之功能性可提供於經組態用於編碼及解碼之專用硬體及/或軟體模組內,或併入組合式編碼解碼器中。此外,該等技術可完全實施於一或多個電路或邏輯元件中。 本發明之技術可在多種裝置或設備中實施,該等裝置或設備包括無線手機、積體電路(IC)或IC集合(例如,晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術之裝置的功能態樣,但未必要求由不同硬體單元來實現。確切而言,如上文所描述,可將各種單元組合於編碼解碼器硬體單元中,或藉由互操作性硬體單元(包括如上文所描述之一或多個處理器)之集合結合合適之軟體及/或韌體來提供該等單元。 已描述各種實例。此等及其他實例係在以下申請專利範圍之範疇內。
10‧‧‧視訊寫碼系統
12‧‧‧源裝置
14‧‧‧目的地裝置
16‧‧‧頻道
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
31‧‧‧記憶體
32‧‧‧顯示裝置
34‧‧‧檔案產生裝置
40‧‧‧取樣群組
42‧‧‧取樣群組
46‧‧‧第一『oinf』取樣群組
48‧‧‧第二『oinf』取樣群組
50‧‧‧取樣
52‧‧‧取樣
54‧‧‧取樣
56‧‧‧第一『oinf』取樣群組
58‧‧‧第二『oinf』取樣群組
60‧‧‧取樣
100‧‧‧預測處理單元
101‧‧‧視訊資料記憶體
102‧‧‧殘餘產生單元
104‧‧‧變換處理單元
106‧‧‧量化單元
108‧‧‧反量化單元
110‧‧‧反變換處理單元
112‧‧‧重建構單元
114‧‧‧濾波器單元
116‧‧‧經解碼圖像緩衝器
118‧‧‧熵編碼單元
120‧‧‧框間預測處理單元
126‧‧‧框內預測處理單元
128‧‧‧檔案處理單元
130‧‧‧電腦可讀媒體
148‧‧‧電腦可讀媒體
149‧‧‧檔案處理單元
150‧‧‧熵解碼單元
151‧‧‧視訊資料記憶體
152‧‧‧預測處理單元
154‧‧‧反量化單元
156‧‧‧反變換處理單元
158‧‧‧重建構單元
160‧‧‧濾波器單元
162‧‧‧經解碼圖像緩衝器
164‧‧‧運動補償單元
166‧‧‧框內預測處理單元
300‧‧‧檔案
302‧‧‧電影方塊
304‧‧‧媒體資料方塊
305‧‧‧取樣
306‧‧‧播放軌方塊
307‧‧‧媒體方塊
308‧‧‧媒體資訊方塊
309‧‧‧取樣表方塊
310‧‧‧取樣描述方塊
311‧‧‧SampleToGroup方塊
312‧‧‧SampleGroupDescription方塊
313‧‧‧grouping_type語法元素
315‧‧‧取樣項
315A‧‧‧取樣項
316‧‧‧entry_count語法元素
318‧‧‧取樣群組項
324‧‧‧sample_count語法元素
326‧‧‧group_description_index語法元素
328‧‧‧grouping_type語法元素
330‧‧‧entry_count語法元素
332‧‧‧群組描述項
450‧‧‧檔案
452‧‧‧電影片段方塊
454‧‧‧媒體資料方塊
456‧‧‧取樣
458‧‧‧播放軌片段方塊
460‧‧‧取樣描述方塊
462‧‧‧SampleToGroup方塊
464‧‧‧SampleGroupDescription方塊
466‧‧‧一組取樣項
466A‧‧‧取樣項
470‧‧‧grouping_type語法元素
474‧‧‧entry_count語法元素
476‧‧‧取樣群組項
482‧‧‧sample_count語法元素
484‧‧‧group_description_index語法元素
486‧‧‧grouping_type語法元素
488‧‧‧entry_count語法元素
490‧‧‧群組描述項
500‧‧‧檔案
502‧‧‧電影方塊
504‧‧‧媒體資料方塊
505‧‧‧取樣
506‧‧‧播放軌方塊
507‧‧‧媒體方塊
508‧‧‧媒體資訊方塊
509‧‧‧取樣表方塊
510‧‧‧取樣描述方塊
511‧‧‧SampleToGroup方塊
512‧‧‧SampleGroupDescription方塊
515A‧‧‧取樣項
515N‧‧‧取樣項
518‧‧‧虛設取樣項
550‧‧‧檔案
552‧‧‧電影方塊
554‧‧‧媒體資料方塊
555‧‧‧取樣
556‧‧‧播放軌方塊
557‧‧‧媒體方塊
558‧‧‧媒體資訊方塊
559‧‧‧取樣表方塊
560‧‧‧取樣描述方塊
561‧‧‧SampleToGroup方塊
562‧‧‧SampleGroupDescription方塊
565‧‧‧取樣項
565A‧‧‧取樣項
568‧‧‧LHEVCDecoderConfigurationRecord
570‧‧‧操作點索引語法元素
圖1為說明可利用本發明中描述之技術之實例視訊寫碼系統的方塊圖。 圖2為說明『oinf』取樣群組之涵蓋的實例之概念圖。 圖3為說明在處理不同圖框速率之播放軌時的實例『oinf』取樣群組問題之概念圖。 圖4為說明在處理某一時間週期中在『sbas』中無取樣時之實例『oinf』取樣群組問題的概念圖。 圖5為說明實例視訊編碼器的方塊圖。 圖6為說明實例視訊解碼器的方塊圖。 圖7為說明根據本發明之一或多種技術的檔案之實例結構之方塊圖。 圖8為說明根據本發明的一或多種技術的檔案之實例結構之概念圖。 圖9為說明根據本發明的一或多種技術的包括虛設取樣項之檔案的實例結構之方塊圖。 圖10為說明根據本發明之一或多種技術的其中取樣項包括操作點索引的檔案之實例結構的方塊圖。 圖11為說明根據本發明之技術的用於處理檔案之裝置的實例操作之流程圖。 圖12為說明根據本發明之技術的用於處理檔案之裝置的實例操作之流程圖。

Claims (32)

  1. 一種處理一檔案的方法,該方法包含:獲得該檔案中之一操作點參考播放軌,其中可供用於該檔案中之一位元串流的一操作點係使用在該操作點參考播放軌中傳信的一操作點資訊取樣群組在該檔案中描述;獲得該檔案中之一或多個額外播放軌,其中無操作點資訊取樣群組係在該等額外播放軌中之任一者中傳信;對於該一或多個額外播放軌中之每一各別額外播放軌之每一各別取樣,判定是否將該各別取樣考慮為該操作點資訊取樣群組之部分,其中:基於該操作點參考播放軌含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為該操作點資訊取樣群組之部分,及基於該操作點參考播放軌不含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為在該各別額外播放軌之該各別取樣之前的該操作點參考播放軌中之最後取樣的一操作點資訊取樣群組之部分;及執行自該位元串流提取該操作點的一子位元串流提取程序。
  2. 如請求項1之方法,其中獲得該操作點參考播放軌包含:自該檔案獲得一取樣群組描述方塊,其中該取樣群組描述方塊包括指定用於該操作點之一輸出層集、用於該操作點之一最大時間識別符,及用於該操作點之設定檔、層級及層次傳信的一取樣群組描述項;及自該檔案獲得指定該操作點資訊取樣群組中之一組取樣並指定該取樣群組描述方塊中之該取樣群組描述項之一索引的一取樣至群組方塊。
  3. 如請求項1之方法,其中:該操作點資訊取樣群組為一第一操作點資訊取樣群組,該第一操作點資訊取樣群組包含該操作點參考播放軌中之第一組取樣,該操作點參考播放軌含有包含在該操作點參考播放軌中之第二組取樣的一第二操作點取樣群組,在該操作點參考播放軌中無取樣發生於該第一組取樣中之具有一最近解碼時間的一取樣與在該第二組取樣中之具有一最早解碼時間的一取樣之一解碼時間之間的一解碼時間處,及該一或多個額外播放軌中之一特定額外播放軌中存在一或多個取樣具有在該第一組取樣中之具有該最近解碼時間的該取樣與在該第二組取樣中之具有該最早解碼時間的該取樣之該解碼時間之間的解碼時間。
  4. 如請求項3之方法,其中該特定額外播放軌與該操作點參考播放軌相比具有一較高圖框速率。
  5. 如請求項1之方法,其中:該位元串流包括一基層及一或多個增強層,該操作點參考播放軌含有該基層,且該一或多個額外播放軌中之每一各別播放軌含有該一或多個增強層中之一各別增強層。
  6. 如請求項1之方法,其進一步包含以下各者中的至少一者:在提取該操作點之後,解碼該操作點之視訊資料,或傳輸該檔案之含有該操作點之經編碼圖像的取樣而不傳輸該檔案之不含有該操作點之經編碼圖像的取樣。
  7. 如請求項1之方法,其中該操作點參考播放軌之每一各別取樣及該等額外播放軌之每一各別取樣包含包含對應於同一時間執行個體之一或多個經編碼圖像的一各別存取單元。
  8. 一種產生一檔案之方法,該方法包含:產生該檔案中之一操作點參考播放軌,其中產生該操作點參考播放軌包含在該操作點參考播放軌中傳信描述可供用於該檔案中之一位元串流的一操作點之一操作點資訊取樣群組;及產生該檔案中之一或多個額外播放軌,其中:無操作點資訊取樣群組係在該等額外播放軌中之任一者中傳信,基於該操作點參考播放軌含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為該操作點資訊取樣群組之部分,及基於該操作點參考播放軌不含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為在該各別額外播放軌之該各別取樣之前的該操作點參考播放軌中之最後取樣的一操作點資訊取樣群組之部分。
  9. 如請求項8之方法,其中產生該操作點參考播放軌包含:在該檔案中產生一取樣群組描述方塊,其中該取樣群組描述方塊包括指定用於該操作點之一輸出層集、用於該操作點之一最大時間識別符,及用於該操作點之設定檔、層級及層次傳信的一取樣群組描述項;及在該檔案中產生指定該操作點資訊取樣群組中之一組取樣並指定該取樣群組描述方塊中之該取樣群組描述項之一索引的一取樣至群組方塊。
  10. 如請求項8之方法,其中:該操作點資訊取樣群組為一第一操作點資訊取樣群組,該第一操作點資訊取樣群組包含該操作點參考播放軌中之第一組取樣,該操作點參考播放軌含有包含在該操作點參考播放軌中之第二組取樣的一第二操作點取樣群組,在該操作點參考播放軌中無取樣發生於該第一組取樣中之具有一最近解碼時間的一取樣與在該第二組取樣中之具有一最早解碼時間的一取樣之一解碼時間之間的一解碼時間處,及該一或多個額外播放軌中之一特定額外播放軌中存在一或多個取樣具有在該第一組取樣中之具有該最近解碼時間的該取樣與在該第二組取樣中之具有該最早解碼時間的該取樣之該解碼時間之間的解碼時間。
  11. 如請求項10之方法,其中該特定額外播放軌與該操作點參考播放軌相比具有一較高圖框速率。
  12. 如請求項8之方法,其中:該位元串流包括一基層及一或多個增強層,該操作點參考播放軌含有該基層,且該一或多個額外播放軌中之每一各別播放軌含有該一或多個增強層中之一各別增強層。
  13. 如請求項8之方法,其進一步包含:編碼視訊資料以產生該位元串流。
  14. 如請求項8之方法,其中該操作點參考播放軌之每一各別取樣及該等額外播放軌之每一各別取樣包含包含對應於同一時間執行個體之一或多個經編碼圖像的一各別存取單元。
  15. 一種用於處理一檔案之設備,該設備包含:一記憶體,其經組態以儲存該檔案;及一個或多個處理器,其耦接至該記憶體,該一或多個處理器經組態以:獲得該檔案中之一操作點參考播放軌,其中可供用於該檔案中之一位元串流的一操作點係使用在該操作點參考播放軌中傳信的一操作點資訊取樣群組在該檔案中描述;獲得該檔案中之一或多個額外播放軌,其中無操作點資訊取樣群組係在該等額外播放軌中之任一者中傳信;對於該一或多個額外播放軌中之每一各別額外播放軌之每一各別取樣,判定是否將該各別取樣考慮為該操作點資訊取樣群組之部分,其中:基於該操作點參考播放軌含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為該操作點資訊取樣群組之部分,及基於該操作點參考播放軌不含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為在該各別額外播放軌之該各別取樣之前的該操作點參考播放軌中之最後取樣的一操作點資訊取樣群組之部分;及執行自該位元串流提取該操作點的一子位元串流提取程序。
  16. 如請求項15之設備,其中該一或多個處理器經組態以使得,作為獲得該操作點參考播放軌之部分,該一或多個處理器:自該檔案獲得一取樣群組描述方塊,其中該取樣群組描述方塊包括指定用於該操作點之一輸出層集、用於該操作點之一最大時間識別符,及用於該操作點之設定檔、層級及層次傳信的一取樣群組描述項;及自該檔案獲得指定該操作點資訊取樣群組中之一組取樣並指定該取樣群組描述方塊中之該取樣群組描述項之一索引的一取樣至群組方塊。
  17. 如請求項15之設備,其中:該操作點資訊取樣群組為一第一操作點資訊取樣群組,該第一操作點資訊取樣群組包含該操作點參考播放軌中之第一組取樣,該操作點參考播放軌含有包含在該操作點參考播放軌中之第二組取樣的一第二操作點取樣群組,在該操作點參考播放軌中無取樣發生於該第一組取樣中之具有一最近解碼時間的一取樣與在該第二組取樣中之具有一最早解碼時間的一取樣之一解碼時間之間的一解碼時間處,及該一或多個額外播放軌中之一特定額外播放軌中存在一或多個取樣具有在該第一組取樣中之具有該最近解碼時間的該取樣與在該第二組取樣中之具有該最早解碼時間的該取樣之該解碼時間之間的解碼時間。
  18. 如請求項17之設備,其中該特定額外播放軌與該操作點參考播放軌相比具有一較高圖框速率。
  19. 如請求項15之設備,其中:該位元串流包括一基層及一或多個增強層,該操作點參考播放軌含有該基層,且該一或多個額外播放軌中之每一各別播放軌含有該一或多個增強層中之一各別增強層。
  20. 如請求項15之設備,其中該一或多個處理器經進一步組態以執行以下各者中之至少一者:在提取該操作點之後,解碼該操作點之視訊資料,或轉遞該操作點而不轉遞該位元串流之未經提取操作點。
  21. 如請求項15之設備,其中該操作點參考播放軌之每一各別取樣及該等額外播放軌之每一各別取樣包含包含對應於同一時間執行個體之一或多個經編碼圖像的一各別存取單元。
  22. 一種用於產生一檔案之設備,該設備包含:一記憶體,其經組態以儲存該檔案;及一個或多個處理器,其耦接至該記憶體,該一或多個處理器經組態以:產生該檔案中之一操作點參考播放軌,其中該一或多個處理器經組態以使得,作為產生該操作點參考播放軌之部分,該一或多個處理器在該操作點參考播放軌中傳信描述可供用於該檔案中之一位元串流的一操作點之一操作點資訊取樣群組;及產生該檔案中之一或多個額外播放軌,其中:無操作點資訊取樣群組係在該等額外播放軌中之任一者中傳信,該操作點資訊取樣群組,基於該操作點參考播放軌含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為該操作點資訊取樣群組之部分,及基於該操作點參考播放軌不含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為在該各別額外播放軌之該各別取樣之前的該操作點參考播放軌中之最後取樣的一操作點資訊取樣群組之部分。
  23. 如請求項22之設備,其中該一或多個處理器經組態以使得,作為產生該操作點參考播放軌之部分,該一或多個處理器:在該檔案中產生一取樣群組描述方塊,其中該取樣群組描述方塊包括指定用於該操作點之一輸出層集、用於該操作點之一最大時間識別符,及用於該操作點之設定檔、層級及層次傳信的一取樣群組描述項;及在該檔案中產生指定該操作點資訊取樣群組中之一組取樣並指定該取樣群組描述方塊中之該取樣群組描述項之一索引的一取樣至群組方塊。
  24. 如請求項22之設備,其中:該操作點資訊取樣群組為一第一操作點資訊取樣群組,該第一操作點資訊取樣群組包含該操作點參考播放軌中之第一組取樣,該操作點參考播放軌含有包含在該操作點參考播放軌中之第二組取樣的一第二操作點取樣群組,在該操作點參考播放軌中無取樣發生於該第一組取樣中之具有一最近解碼時間的一取樣與在該第二組取樣中之具有一最早解碼時間的一取樣之一解碼時間之間的一解碼時間處,及該一或多個額外播放軌中之一特定額外播放軌中存在一或多個取樣具有在該第一組取樣中之具有該最近解碼時間的該取樣與在該第二組取樣中之具有該最早解碼時間的該取樣之該解碼時間之間的解碼時間。
  25. 如請求項24之設備,其中該特定額外播放軌與該操作點參考播放軌相比具有一較高圖框速率。
  26. 如請求項22之設備,其中:該位元串流包括一基層及一或多個增強層,該操作點參考播放軌含有該基層,且該一或多個額外播放軌中之每一各別播放軌含有該一或多個增強層中之一各別增強層。
  27. 如請求項22之設備,其中該一或多個處理器經進一步組態以編碼視訊資料以產生該位元串流。
  28. 如請求項22之設備,其中該操作點參考播放軌之每一各別取樣及該等額外播放軌之每一各別取樣包含包含對應於同一時間執行個體之一或多個經編碼圖像的一各別存取單元。
  29. 一種用於處理一檔案之設備,該設備包含:用於獲得該檔案中之一操作點參考播放軌的構件,其中可供用於該檔案中之一位元串流的一操作點係使用在該操作點參考播放軌中傳信的一操作點資訊取樣群組在該檔案中描述;用於獲得該檔案中之一或多個額外播放軌的構件,其中無操作點資訊取樣群組係在該等額外播放軌中之任一者中傳信;一或多個處理器,其經組態以用於對於該一或多個額外播放軌中之每一各別額外播放軌之每一各別取樣,判定是否將該各別取樣考慮為該操作點資訊取樣群組之部分,其中:基於該操作點參考播放軌含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為該操作點資訊取樣群組之部分,及基於該操作點參考播放軌不含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為在該各別額外播放軌之該各別取樣之前的該操作點參考播放軌中之最後取樣的一操作點資訊取樣群組之部分;及用於執行提取該操作點的一子位元串流提取程序的構件。
  30. 一種用於產生一檔案之設備,該設備包含:用於產生該檔案中之一操作點參考播放軌的構件,其中用於產生該操作點參考播放軌的該構件包含用於在該操作點參考播放軌中傳信描述可供用於該檔案中之一位元串流之一操作點的一操作點資訊取樣群組的構件;及用於產生該檔案中之一或多個額外播放軌的構件,其中:無操作點資訊取樣群組係在該等額外播放軌中之任一者中傳信,基於該操作點參考播放軌含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為該操作點資訊取樣群組之部分,及基於該操作點參考播放軌不含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為在該各別額外播放軌之該各別取樣之前的該操作點參考播放軌中之最後取樣的一操作點資訊取樣群組之部分。
  31. 一種非暫態儲存指令的電腦可讀儲存媒體,該等指令當經執行時,使得一或多個處理器進行以下操作:獲得該檔案中之一操作點參考播放軌,其中可供用於該檔案中之一位元串流的一操作點係使用在該操作點參考播放軌中傳信的一操作點資訊取樣群組在該檔案中描述;獲得該檔案中之一或多個額外播放軌,無操作點資訊取樣群組係在該等額外播放軌中之任一者中傳信;對於該一或多個額外播放軌中之每一各別額外播放軌之每一各別取樣,判定是否將該各別取樣考慮為該操作點資訊取樣群組之部分,其中:基於該操作點參考播放軌含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為該操作點資訊取樣群組之部分,及基於該操作點參考播放軌不含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為在該各別額外播放軌之該各別取樣之前的該操作點參考播放軌中之最後取樣的一操作點資訊取樣群組之部分;及執行自該位元串流提取該操作點的一子位元串流提取程序。
  32. 一種非暫態儲存指令的電腦可讀儲存媒體,該等指令當經執行時,使得一或多個處理器進行以下操作:產生該檔案中之一操作點參考播放軌,其中產生該操作點參考播放軌包含在該操作點參考播放軌中傳信描述可供用於該檔案中之一位元串流的一操作點之一操作點資訊取樣群組;及產生該檔案中之一或多個額外播放軌,其中:無操作點資訊取樣群組係在該等額外播放軌中之任一者中傳信,該操作點資訊取樣群組,基於該操作點參考播放軌含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為該操作點資訊取樣群組之部分,及基於該操作點參考播放軌不含有在時間上與該各別額外播放軌中之該各別取樣共置的一取樣,該各別額外播放軌中之該各別取樣被考慮為在該各別額外播放軌之該各別取樣之前的該操作點參考播放軌中之最後取樣的一操作點資訊取樣群組之部分。
TW105133286A 2015-10-14 2016-10-14 於多層位元流檔案格式中操作點取樣群組之對齊 TWI651961B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201562241691P 2015-10-14 2015-10-14
US62/241,691 2015-10-14
US15/293,092 US10034010B2 (en) 2015-10-14 2016-10-13 Alignment of operation point sample group in multi-layer bitstreams file format
US15/293,092 2016-10-13

Publications (2)

Publication Number Publication Date
TW201720148A TW201720148A (zh) 2017-06-01
TWI651961B true TWI651961B (zh) 2019-02-21

Family

ID=57227101

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105133286A TWI651961B (zh) 2015-10-14 2016-10-14 於多層位元流檔案格式中操作點取樣群組之對齊

Country Status (10)

Country Link
US (1) US10034010B2 (zh)
EP (1) EP3363205B1 (zh)
JP (1) JP6506474B2 (zh)
KR (1) KR101951615B1 (zh)
CN (1) CN108141617B (zh)
AU (1) AU2016340116B2 (zh)
BR (1) BR112018007529B1 (zh)
ES (1) ES2813908T3 (zh)
TW (1) TWI651961B (zh)
WO (1) WO2017066617A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10291923B2 (en) * 2016-05-24 2019-05-14 Qualcomm Incorporated Mapping of tile grouping and samples in HEVC and L-HEVC file formats
US11197040B2 (en) * 2016-10-17 2021-12-07 Mediatek Inc. Deriving and signaling a region or viewport in streaming media
JP7090730B2 (ja) * 2018-04-05 2022-06-24 キヤノン株式会社 ファイル内に画像をカプセル化するための方法及び装置
WO2020125754A1 (en) 2018-12-21 2020-06-25 Beijing Bytedance Network Technology Co., Ltd. Motion vector derivation using higher bit-depth precision
US20220247991A1 (en) * 2019-06-28 2022-08-04 Sony Group Corporation Information processing apparatus, information processing method, reproduction processing device, and reproduction processing method
CN114424561B (zh) * 2019-09-24 2023-10-20 华为技术有限公司 不允许不必要的层包括在多层视频码流中
JP2023504097A (ja) * 2019-11-29 2023-02-01 中興通訊股▲ふん▼有限公司 マルチビュービデオ処理方法および装置
KR20220163474A (ko) * 2020-04-03 2022-12-09 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 비디오 코딩을 위한 파일 포맷 개념
GB2597642B (en) * 2020-06-16 2023-08-02 Canon Kk Method, device, and computer program for encapsulating media data into a media file
US11750815B2 (en) 2020-09-17 2023-09-05 Lemon, Inc. Versatile video coding track coding
KR20220037379A (ko) 2020-09-17 2022-03-24 레몬 인크. 비디오 동작 포인트 레코드 신택스 및 시맨틱스
US11671627B2 (en) 2020-09-17 2023-06-06 Lemon Inc. Operating point entity group signaling in coded video
WO2022060192A1 (ko) * 2020-09-17 2022-03-24 엘지전자 주식회사 출력 계층 세트 정보를 시그널링하는 미디어 파일 생성/수신 방법, 장치 및 미디어 파일을 저장한 컴퓨터 판독 가능한 기록 매체
US20230379481A1 (en) * 2020-09-22 2023-11-23 Lg Electronics Inc. Media file generation/reception method and device for signaling operating point information and output layer set information, and computer-readable recording medium in which media file is stored
US20230336783A1 (en) * 2020-09-29 2023-10-19 Lg Electronics Inc. Method and device for generating/receiving media file including output layer set information, and method for transmitting media file
US11611752B2 (en) 2020-10-07 2023-03-21 Lemon Inc. Adaptation parameter set storage in video coding
US20240040169A1 (en) * 2020-12-21 2024-02-01 Lg Electronics Inc. Media file processing method and device therefor
US20240031622A1 (en) * 2020-12-21 2024-01-25 Lg Electronics Inc. Media file processing method and device

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140023138A1 (en) * 2012-07-20 2014-01-23 Qualcomm Incorporated Reusing parameter sets for video coding
US20150016532A1 (en) * 2013-07-12 2015-01-15 Qualcomm Incorporated Selection of target output layers in high efficiency video coding extensions
US20150110473A1 (en) * 2013-10-23 2015-04-23 Qualcomm Incorporated Multi-layer video file format designs
WO2015059194A1 (en) * 2013-10-22 2015-04-30 Canon Kabushiki Kaisha Method, device, and computer program for encapsulating scalable partitioned timed media data

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070022215A1 (en) * 2005-07-19 2007-01-25 Singer David W Method and apparatus for media data transmission
AU2012203922A1 (en) 2005-07-19 2012-07-26 Apple Inc. Method and apparatus for media data transmission
AU2007287222A1 (en) * 2006-08-24 2008-02-28 Nokia Corporation System and method for indicating track relationships in media files
RU2492585C2 (ru) * 2008-07-16 2013-09-10 Нокиа Корпорейшн Способ и устройство для группирования треков и подмножеств треков
US8719309B2 (en) * 2009-04-14 2014-05-06 Apple Inc. Method and apparatus for media data transmission
GB2469563B (en) 2009-04-14 2011-11-16 Apple Inc Method and apparatus for media data transmission
US20130097334A1 (en) * 2010-06-14 2013-04-18 Thomson Licensing Method and apparatus for encapsulating coded multi-component video
US8930562B2 (en) * 2010-07-20 2015-01-06 Qualcomm Incorporated Arranging sub-track fragments for streaming video data
WO2013157308A1 (ja) * 2012-04-20 2013-10-24 ソニー株式会社 画像処理装置及び画像処理方法
RU2654051C1 (ru) * 2013-01-18 2018-05-16 Кэнон Кабусики Кайся Способ, устройство и компьютерная программа для инкапсуляции сегментированных синхронизированных мультимедийных данных
GB2512829B (en) * 2013-04-05 2015-05-27 Canon Kk Method and apparatus for encoding or decoding an image with inter layer motion information prediction according to motion information compression scheme
GB2516825B (en) * 2013-07-23 2015-11-25 Canon Kk Method, device, and computer program for encapsulating partitioned timed media data using a generic signaling for coding dependencies

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140023138A1 (en) * 2012-07-20 2014-01-23 Qualcomm Incorporated Reusing parameter sets for video coding
US20150016532A1 (en) * 2013-07-12 2015-01-15 Qualcomm Incorporated Selection of target output layers in high efficiency video coding extensions
WO2015059194A1 (en) * 2013-10-22 2015-04-30 Canon Kabushiki Kaisha Method, device, and computer program for encapsulating scalable partitioned timed media data
US20150110473A1 (en) * 2013-10-23 2015-04-23 Qualcomm Incorporated Multi-layer video file format designs

Also Published As

Publication number Publication date
BR112018007529A2 (pt) 2018-10-23
JP2018530967A (ja) 2018-10-18
KR101951615B1 (ko) 2019-02-22
WO2017066617A1 (en) 2017-04-20
AU2016340116A1 (en) 2018-04-12
US20170111650A1 (en) 2017-04-20
EP3363205A1 (en) 2018-08-22
BR112018007529B1 (pt) 2023-12-26
CN108141617A (zh) 2018-06-08
TW201720148A (zh) 2017-06-01
KR20180068979A (ko) 2018-06-22
AU2016340116B2 (en) 2019-07-18
CN108141617B (zh) 2019-07-16
JP6506474B2 (ja) 2019-04-24
ES2813908T3 (es) 2021-03-25
EP3363205B1 (en) 2020-05-27
US10034010B2 (en) 2018-07-24

Similar Documents

Publication Publication Date Title
TWI651961B (zh) 於多層位元流檔案格式中操作點取樣群組之對齊
TWI676387B (zh) 多層位元流之檔案中之參數集信令
TWI645721B (zh) 多層視訊檔案格式設計
EP3363204B1 (en) Support of random access and switching of layers and sub-layers in multi-layer video files
TWI675588B (zh) 於分層視訊檔案格式中之樣本條目及操作點發訊設計
TW201737711A (zh) 在高效率視頻寫碼及分層高效率視頻寫碼檔案格式之頻塊分組的改良
KR101906136B1 (ko) Hevc 확장들의 캐리지를 위한 동작 포인트들의 시그널링
US20230319374A1 (en) Method and device for creating/receiving media file containing layer information, and media file transfer method
JP2024513512A (ja) Eosサンプルグループに基づくメディアファイル生成/受信方法及び装置、並びにメディアファイル伝送方法
CN116868575A (zh) 生成/接收包括nal单元信息的媒体文件的方法和装置及发送媒体文件的方法