TWI699994B - 在高效率視頻寫碼及分層高效率視頻寫碼檔案格式之頻塊分組的改良 - Google Patents
在高效率視頻寫碼及分層高效率視頻寫碼檔案格式之頻塊分組的改良 Download PDFInfo
- Publication number
- TWI699994B TWI699994B TW106110370A TW106110370A TWI699994B TW I699994 B TWI699994 B TW I699994B TW 106110370 A TW106110370 A TW 106110370A TW 106110370 A TW106110370 A TW 106110370A TW I699994 B TWI699994 B TW I699994B
- Authority
- TW
- Taiwan
- Prior art keywords
- frequency
- syntax element
- frequency block
- block set
- file
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Processing Or Creating Images (AREA)
Abstract
本發明揭示一種裝置,該裝置產生一檔案中之一網路抽象層(NAL)單元映射項方塊。該NAL單元映射項方塊使NAL單元與一頻塊集相關聯,該頻塊集包括一當前圖像經分割成之複數個頻塊中之兩個或多於兩個頻塊。由該頻塊集覆蓋之該當前圖像之一區可為非矩形的。另外,該裝置產生該檔案中之一頻塊集群組項。該頻塊集群組項包括一水平偏移、一垂直偏移、一寬度及一高度。該水平偏移規定覆蓋該頻塊集中之頻塊之一最小矩形區之一左上方像素之一水平偏移。該垂直偏移規定該最小矩形區之該左上方像素之一垂直偏移。該寬度規定該最小矩形區之一寬度。該高度規定該最小矩形區之一高度。
Description
本發明係關於視頻寫碼及用於經寫碼之視頻資料的檔案格式。
數位視頻能力可併入至廣泛範圍之裝置中,包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位攝像機、數位記錄裝置、數位媒體播放器、視頻遊戲裝置、視頻遊戲主機、蜂巢式或衛星無線電電話、所謂「智慧型電話」、視頻電話會議裝置、視頻串流化處理裝置及其類似者。數位視頻裝置實施視頻壓縮技術,諸如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分、進階視頻寫碼(AVC)、ITU-T H.265/高效率視頻寫碼(HEVC)所定義之標準及此等標準之延伸中所描述之彼等技術。視頻裝置可藉由實施此等視頻壓縮技術而更高效地傳輸、接收、編碼、解碼及/或儲存數位視頻資訊。 視頻壓縮技術執行空間(圖像內)預測及/或時間(圖像間)預測以減少或移除視頻序列中固有的冗餘。針對基於區塊之視頻寫碼,可將視頻圖塊(亦即,視頻圖框或視頻圖框之一部分)分割成視頻區塊,該等視頻區塊亦可被稱作樹區塊、寫碼單元(CU)及/或寫碼節點。圖像之圖框內寫碼(I)圖塊中之視頻區塊係使用關於同一圖像中之相鄰區塊中之參考樣本的空間預測來編碼。圖像之圖框間寫碼(P或B)圖塊中之視頻區塊可使用關於關於同一圖像中之相鄰區塊中之參考樣本之空間預測或關於其他參考圖像中之參考樣本之時間預測。圖像可被稱作圖框,且參考圖像可被稱作參考圖框。
本發明之一或多個態樣係關於呈檔案格式之視頻內容的儲存。舉例而言,本發明之技術可改良HEVC及分層HEVC (L-HEVC,亦簡稱為LHEVC)檔案格式之頻塊的分組之處置。 在一個實例中,本發明描述一種用於儲存視頻資料之方法,該方法包含:藉由一檔案產生裝置,接收一位元串流,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區;藉由該檔案產生裝置,產生一檔案中之一網路抽象層(NAL)單元映射項方塊,該NAL單元映射項方塊使該位元串流之NAL單元與一頻塊集相關聯,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;及藉由該檔案產生裝置,產生該檔案中之一頻塊集群組項,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度。 在另一實例中,本發明描述一種處理儲存經編碼視頻資料之一檔案之方法,該方法包含:藉由一檔案處理裝置,獲得一檔案中之一網路抽象層(NAL)單元映射項方塊,該NAL單元映射項方塊使一位元串流之NAL單元與一頻塊集相關聯,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;藉由該檔案處理裝置,獲得該檔案中之一頻塊集群組項,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度;及基於該水平偏移語法元素、該垂直偏移語法元素、該寬度語法元素及該高度語法元素而處理該頻塊集。 在另一實例中,本發明描述一種用於產生用於儲存視頻資料之一檔案之裝置,該裝置包含:一記憶體,其經組態以儲存用於儲存視頻內容之一檔案;及一或多個處理器,其經組態以:接收一位元串流,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區;產生該檔案中之一網路抽象層(NAL)單元映射項方塊,該NAL單元映射項方塊使該位元串流之NAL單元與一頻塊集相關聯,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;及產生該檔案中之一頻塊集群組項,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度。 在另一實例中,本發明描述一種用於處理儲存經編碼視頻資料之一檔案之裝置,該裝置包含:一記憶體,其經組態以儲存用於儲存視頻內容之一檔案;及一或多個處理器,其經組態以:獲得一檔案中之一網路抽象層(NAL)單元映射項方塊,該NAL單元映射項方塊使一位元串流之NAL單元與一頻塊集相關聯,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;獲得該檔案中之一頻塊集群組項,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度;及基於該水平偏移語法元素、該垂直偏移語法元素、該寬度語法元素及該高度語法元素而處理該頻塊集。 在另一實例中,本發明描述一種用於產生用於儲存視頻資料之一檔案之裝置,該裝置包含:用於接收一位元串流的構件,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區;用於產生一檔案中之一網路抽象層(NAL)單元映射項方塊的構件,該NAL單元映射項方塊使該位元串流之NAL單元與一頻塊集相關聯,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;及用於產生該檔案中之一頻塊集群組項的構件,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度。 在另一實例中,本發明描述一種用於處理儲存經編碼視頻資料之一檔案之裝置,該裝置包含:用於獲得一檔案中之一網路抽象層(NAL)單元映射項方塊的構件,該NAL單元映射項方塊使一位元串流之NAL單元與一頻塊集相關聯,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;用於獲得該檔案中之一頻塊集群組項的構件,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度;及用於基於該水平偏移語法元素、該垂直偏移語法元素、該寬度語法元素及該高度語法元素而處理該頻塊集的構件。 在另一實例中,本發明描述一種電腦可讀資料儲存媒體,其上儲存有指令,該等指令在經執行時組態一裝置以:接收一位元串流,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區;產生一檔案中之一網路抽象層(NAL)單元映射項方塊,該NAL單元映射項方塊使該位元串流之NAL單元與一頻塊集相關聯,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;及產生該檔案中之一頻塊集群組項,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度。 在另一實例中,本發明描述一種電腦可讀資料儲存媒體,其上儲存有指令,該等指令在經執行時組態一裝置以:藉由一檔案處理裝置,獲得一檔案中之一網路抽象層(NAL)單元映射項方塊,該NAL單元映射項方塊使一位元串流之NAL單元與一頻塊集相關聯,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;藉由該檔案處理裝置,獲得該檔案中之一頻塊集群組項,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度;及基於該水平偏移語法元素、該垂直偏移語法元素、該寬度語法元素及該高度語法元素而處理該頻塊集。 下文的隨附圖式及描述中闡明本發明之一或多個實例之細節。根據描述、圖式以及申請專利範圍將明瞭其他特徵、目的及優點。
本申請案主張在2016年3月30日提出申請之美國臨時專利申請案62/315,575之權益,該美國臨時申請案之全部內容以引用的方式併入本文中。 國際標準組織(ISO)基礎媒體檔案格式(ISOBMFF)及自ISO基礎媒體檔案格式導出之檔案格式經設計用於視頻內容之儲存。ISOBMFF已經擴展以與各種視頻編碼標準(諸如H.265、高效率視頻寫碼(HEVC)、H.264/AVC及其他視頻編碼標準)一起工作。 圖像可經分割成稱作「頻塊」之矩形區。在一些情況中,可能期望僅讀取一系列圖像之特定頻塊之網路抽象層(NAL)單元。舉例而言,可能期望傳輸包括圖像之上半部之經編碼區塊之NAL單元而不傳輸包括圖像之下半部之經編碼區塊之NAL單元。然而,ISOBMFF格式之擴展部分中之機制具有可能降低自檔案存取特定於頻塊及頻塊集之資訊的效率的數個問題。本發明之技術可改良存取此資訊之效率。 舉例而言,檔案產生裝置可接收包括形成視頻資料之經編碼圖像之表示的位元序列之位元串流。在此實例中,視頻資料之圖像包括當前圖像,該當前圖像經分割成複數個頻塊,且該複數個頻塊中之每一各別頻塊為各別矩形區。此外,在此實例中,檔案產生裝置可產生檔案中之NAL單元映射項方塊。NAL單元映射項方塊可使位元串流之NAL單元與頻塊集相關聯。頻塊集包括當前圖像經分割成之複數個頻塊中之兩個或多於兩個頻塊。此外,在一些情況中,由頻塊集中之頻塊覆蓋之當前圖像之一區的形狀並非矩形。另外,在此實例中,檔案產生裝置可產生檔案中之頻塊集群組項。在此實例中,頻塊集群組項包括識別頻塊集之一群組識別符語法元素。頻塊集群組項可包括水平偏移語法元素、垂直偏移語法元素、寬度語法元素及高度語法元素。水平偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之水平偏移。垂直偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之垂直偏移。寬度語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之寬度。高度語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之高度。 圖1為說明可使用本發明中所描述之技術之實例性視頻編碼及解碼系統10的方塊圖。如圖1中所展示,系統10包括源裝置12,該源裝置產生欲稍後由目的地裝置14進行解碼的經編碼視頻資料。源裝置12及目的地裝置14可包含廣泛範圍之裝置中之任一者,包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板電腦、機上盒、電話手機(諸如,所謂「智慧型」電話)、所謂「智慧型」板、電視機、相機、顯示裝置、數位媒體播放器、視頻遊戲主機、視頻串流化裝置,或其類似者。在一些狀況中,源裝置12及目的地裝置14可經配備以用於無線通信。因此,源裝置12及目的地裝置14可被視為無線通信裝置。源裝置12及目的地裝置14可被視為視頻裝置。 在圖1之實例中,源裝置12包括視頻源18、視頻編碼器20及輸出接口22。在一些狀況下,輸出接口22可包括調變器/解調變器(數據機)及/或傳輸器。在源裝置12中,視頻源18可包括來源,諸如視頻捕獲裝置(例如,視頻相機)、含有先前所捕獲視頻之視頻封存、用以接收來自視頻內容提供商之視頻之視頻饋送介面,及/或用於產生電腦圖形資料作為源視頻之電腦圖形系統,或此等來源之組合。然而,本發明中所描述之技術通常可應用於視頻寫碼,且可應用於無線及/或有線應用。 視頻編碼器20可對所捕獲、預捕獲或電腦產生視頻進行編碼。源裝置12可經由源裝置12之輸出接口22將經編碼視頻資料直接傳輸至目的地裝置14。經編碼視頻資料亦可(或替代地)被儲存在儲存裝置33上供由目的地裝置14或其他裝置稍後存取以用於解碼及/或播放。 目的地裝置14包括輸入介面28、視頻解碼器30及顯示裝置32。此外,在圖1之實例中,目的地裝置14包括儲存媒體29及檔案剖析單元31。在一些狀況下,輸入接口28可包括接收器及/或數據機。目的地裝置14之輸入介面28可經由鏈路16接收經編碼視頻資料。經由鏈路16通信或提供在儲存裝置33上之經編碼視頻資料可包括由視頻編碼器20產生供由視頻解碼器(諸如,視頻解碼器30)用於對視頻資料進行解碼之各種語法元素。此等語法元素可與在通信媒體上傳輸之經編碼視頻資料一起被包括,被儲存在儲存媒體上,或儲存在檔案伺服器上。 檔案剖析單元31可獲得檔案並以各種方式處理檔案。例如,檔案剖析單元31可剖析檔案以自檔案獲得資訊。因此,實施檔案剖析單元31之裝置可被稱作檔案處理裝置。儘管展示為目的地裝置14之部分,但檔案剖析單元31可與目的地裝置14分離。舉例而言,檔案剖析單元31可實施於網路裝置中,諸如媒體感知網路元件(MANE)、內容遞送網路裝置或另一類型之網路實體。 顯示裝置32可與目的地裝置14整合或可在目的地裝置14外部。在一些實例中,目的地裝置14可包括整合式顯示裝置且亦可經組態以與外部顯示裝置介接。在其他實例中,目的地裝置14可為顯示裝置。一般而言,顯示裝置32向使用者顯示經解碼視頻資料,且可包含各種顯示裝置中之任一者,諸如液晶顯示器(LCD)、等離子顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示裝置。 視頻編碼器20及視頻解碼器30各自可實施為各種適合編碼器電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任一組合。當技術部分地以軟體實施時,裝置可將用於軟體之指令儲存在合適的非暫時性電腦可讀媒體中且在硬體中使用一或多個處理器來執行指令以執行本發明的技術。視頻編碼器20及視頻解碼器30中之每一者可被包括在一或多個編碼器或解碼器中,其中之任一者可整合為各別裝置中之組合式視頻編碼/解碼器(CODEC)之部分。 本發明可通常係指「發信」某一資訊,諸如語法元素。術語「發信」可通常係指用於解碼經編碼視頻資料之語法元素及/或其他資料之通信。此通信可即時或近即時發生。替代地,此通信可在一時間跨度中發生,諸如可當在編碼時將語法元素儲存至電腦可讀儲存媒體在位元串流中時發生,該等語法元素然後可在被儲存至此媒體之後的任何時間由解碼裝置擷取。 目的地裝置14可接收待經由鏈路16解碼之經編碼視頻資料。鏈路16可包含能夠將經編碼視頻資料自源裝置12移動至目的地裝置14之任何類型之媒體或裝置。在一個實例中,鏈路16可包含通信媒體以使得源裝置12能夠即時地將經編碼視頻資料直接發射至目的地裝置14。可根據通信標準(例如,無線通信協定)來調變經編碼視頻資料,並將其傳輸至目的地裝置14。通信媒體可包含任何無線或有線通信媒體,例如,射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路之部分,諸如區域網路、廣域網路或諸如網際網路之全球網路。通信媒體可包括路由器、交換器、基地台或可用於促進自源裝置12至目的地裝置14之通信的任何其他設備。 替代地,輸出介面22可將經編碼資料輸出至儲存裝置33。類似地,輸入介面28可儲存經編碼資料儲存裝置33。儲存裝置33可包括各種分佈式或本端存取資料儲存媒體中之任何者,諸如硬碟機、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶器或任何其他適於儲存經編碼視頻資料之數位儲存媒體。在又一實例中,儲存裝置33可對應於檔案伺服器或可保持由源裝置12產生之經編碼視頻之另一中間儲存裝置。目的地裝置14可經由串流化或下載自儲存裝置33存取所儲存視頻資料。檔案伺服器可為能夠儲存經編碼視頻資料且將該經編碼視頻資料傳輸至目的地裝置14之任何類型之伺服器。實例性檔案伺服器包括web伺服器(例如,用於網站)、檔案傳送協定(FTP)伺服器、網路附加儲存(NAS)裝置或本端磁碟機。目的地裝置14可經由任何標準資料連接(包括網際網路連接)來存取經編碼視頻資料。此可包括無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機等等),或適於存取儲存於檔案伺服器上之經編碼視頻資料之兩者的組合。來自儲存裝置33之經編碼視頻資料之傳輸可為串流化傳輸、下載傳輸或其組合。 本發明之技術未必限於無線應用或設置。該等技術可應用於支援各種多媒體應用中之任何者之視頻寫碼,諸如空中傳輸電視廣播、有線電視傳輸、衛星電視傳輸、串流化視頻傳輸(例如,經由網際網路),對數位視頻資料進行編碼以用於儲存在資料儲存媒體上、對儲存於資料儲存媒體上之數位視頻資料解碼或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視頻傳輸以支援諸如視頻串流化、視頻播放、視頻廣播及/或視頻電話之應用。 此外,在圖1之實例中,視頻寫碼系統10包括檔案產生裝置34。檔案產生裝置34可接收由源裝置12產生之經編碼視頻資料。檔案產生裝置34可產生包括經編碼視頻資料之檔案。目的地裝置14可接收由檔案產生裝置34產生之檔案。在各種實例中,檔案產生裝置34可包括各種類型之計算裝置。舉例而言,檔案產生裝置34可包含視頻編碼裝置、媒體感知網路元件(MANE)、伺服器計算裝置、個人計算裝置、特殊用途計算裝置、商業計算裝置或另一類型之計算裝置。在一些實例中,檔案產生裝置34為內容遞送網路之部分。在一些實例中,檔案產生裝置34經實施為源裝置12之部分。檔案產生裝置34可經由諸如鏈路16之頻道自源裝置12接收經編碼視頻資料。此外,目的地裝置14可經由諸如鏈路16之頻道自檔案產生裝置34接收檔案。檔案產生裝置34可被視為視頻裝置。如圖1之實例中所展示,檔案產生裝置34可包含記憶體36,該記憶體經組態以儲存含有經編碼視頻內容之檔案。在一些實例中,檔案產生裝置34可實施於電路或硬體電路與軟體之組合中。 在其他實例中,源裝置12或另一計算裝置可產生包括經編碼視頻資料之檔案。然而,為便於闡釋,本發明將檔案產生裝置34描述為產生檔案。然而,應理解,對產生檔案之檔案產生裝置34之描述通常適用於計算裝置。 在一些實例中,MANE、伺服器或其他類型之裝置可包含經組態以儲存根據本發明之技術產生之檔案的記憶體。此裝置可處理檔案(例如,藉由自檔案獲得語法元素)並將所獲得語法元素用於各種用途,諸如用於將檔案內之特定內容轉發至另一裝置(諸如目的地裝置14)。 視頻編碼器20及視頻解碼器30可根據視頻壓縮標準(諸如高效率視頻寫碼(HEVC)標準或其擴展)操作。HEVC標準亦可被稱作ISO/IEC 23008-2。HEVC之設計已由ITU-T視頻寫碼專家組(VCEG)及ISO/IEC動畫專家組(MPEG)之視頻寫碼聯合協作團隊(JCT-VC)完成。視頻編碼器20及視頻解碼器30可根據此等標準或其他標準中之一或多者操作。此等其他視頻寫碼標準包括ITU-TH.261、ISO/IEC MPEG-1可視化、ITU-T H.262或ISO/IEC MPEG-2可視化、ITU-TH.263、ISO/IEC MPEG-4可視化、ITU-T H.264或ISO/IEC MPEG-4 AVC,包括其可縮放視頻寫碼(SVC)及多視圖視頻寫碼(MVC)擴展。 替代地,視頻編碼器20及視頻解碼器30可根據其他專有或行業標準(諸如ITU-T H.264標準(替代地被稱作MPEG-4,第10部分高級視頻編碼(AVC))或此等標準的擴展)操作。然而,本發明之技術並不限於任何特定寫碼標準。視頻壓縮標準之其他實例包括ITU-T H.261、ISO/IEC MPEG-1可視化、ITU-T H.262或ISO/IEC MPEG-2可視化、ITU-T H.263、ISO/IEC MPEG-4可視化及ITU-T H.264(亦被稱作ISO/IEC MPEG-4 AVC),包括其可縮放視頻寫碼(SVC)及多視圖視頻寫碼(MVC)擴展。 一般而言,在HEVC中,視頻圖框或圖像可被劃分成包括亮度樣本及色度樣本兩者之樹區塊或最大寫碼單元(LCU)序列。樹區塊亦可被稱作寫碼樹單元(CTU)。樹區塊具有與H.264/AVC標準之巨集區塊相似之用途。圖塊包括呈寫碼次序之多個連續樹區塊。視頻圖框或圖像可分割成一或多個圖塊。每一樹區塊可根據四元樹拆分成寫碼單元(CU) 。舉例而言,樹區塊作為四元樹之根節點可被拆分成四個子節點,且每一子節點又可為父節點且被拆分成另外四個子節點。最終不可拆分之子節點(作為四元樹之葉節點)包含寫碼節點,亦即,經寫碼視頻區塊。與經寫碼位元串流相關聯之語法資料可定義樹區塊可拆分之最大次數,且亦可定義寫碼節點之最小尺寸。 CU包括寫碼節點及與寫碼節點相關聯之預測單元(PU)及變換單元(TU)。CU之尺寸對應於寫碼節點之尺寸且必須為正方形形狀。CU之尺寸的範圍可介於自8×8個像素直至具有最大64×64個像素或更大的CTU之尺寸。每一CU可含有一或多個PU及一或多個TU。例如,與CU相關聯之語法資料可描述將CU分割成一或多個PU。分割模式可在CU為跳躍模式編碼或直接模式編碼、圖框內預測模式編碼或圖框間預測模式編碼之間不同。PU可被分割成非正方形形狀。舉例而言,與CU相關聯之語法資料亦可描述根據四元樹將CU分割成一或多個TU。TU的形狀可為正方形或非正方形。 HEVC標準允許根據TU而變換,該等TU可針對不同CU而不同。TU之尺寸通常係基於針對所分割LCU定義之給定CU內之PU尺寸而定,但狀況可能並非始終如此。TU之尺寸通常與PU相同或小於PU。在一些實例中,可使用稱作「殘餘四元樹」(RQT)之四元樹結構將對應於CU之殘餘樣本細分成較小單元。RQT之葉節點可被稱作TU。可變換與TU相關聯之像素差值以產生可經量化之變換係數。 一般而言,PU包括與預測程序相關之資料。舉例而言,當PU係圖框內模式編碼時,PU可包括描述PU之圖框內預測模式之資料。作為另一實例,當PU為圖框間模式編碼時,PU可包括定義關於PU之一或多個運動向量之資料。定義關於PU之運動向量之資料可(例如)描述運動向量之水平分量、運動向量之垂直分量、運動向量之解析度(例如,四分之一像素精度或八分之一像素精度)、運動向量指向之參考圖像,及/或運動向量之參考圖像清單(例如,清單0、清單1)。 一般而言,TU用於變換及量化程序。具有一或多個PU之給定CU亦可包括一或多個TU。在預測之後,視頻編碼器20可計算對應於PU之殘餘值。殘餘值包含像素差值,該等像素差值可經變換成變換係數、經量化,及使用TU掃描以產生用於熵寫碼之串列變換係數。本發明通常使用術語「視頻區塊」來指代CU之寫碼節點(亦即,寫碼區塊)。在一些特定狀況下,本發明亦可使用術語「視頻區塊」來指代樹區塊,亦即,LCU或CU,其包括寫碼節點及PU以及TU。 視頻序列通常包括一系列視頻圖框或圖像。圖像之每一圖塊可包括描述各別圖塊之編碼節點之圖框語法資料。視頻編碼器20通常在個別視頻圖塊內之視頻區塊上操作以便對視頻資料進行編碼。視頻區塊可對應於CU內之寫碼節點。視頻區塊可具有固定或變化尺寸,且其尺寸可根據規定之寫碼標準而不同。 在使用CU之PU進行圖框內預測或圖框間預測寫碼之後,視頻編碼器20可計算關於CU之TU的殘餘資料。PU可在空間域(亦被稱作像素域)中包含像素資料且TU可在應用變換(例如,離散餘弦變換(DCT)、整數變換、小波變換或概念上類似於殘餘視頻資料之變換)之後在變換域中包含係數。殘差資料可對應於未經編碼圖像之像素與對應於PU之預測值之間的像素差。視頻編碼器20可形成包括關於CU之殘差資料之TU,且接著變換TU以產生關於CU之變換係數。 在用以產生變換係數之任何變換之後,視頻編碼器20可執行變換係數之量化。量化通常係指其中將變換係數量化以可能減少用於表示係數之資料之量,從而提供進一步壓縮之程序。量化程序可減少與係數中之一些或全部相關聯之位元深度。 在掃描經量化變換係數以形成單維向量之後,視頻編碼器20可(例如)根據上下文自適應可變長度寫碼(CAVLC)、上下文自適應二進位算法寫碼(CABAC)、基於語法之上下文自適應二進位算法編碼(SBAC)、概率區間分割熵(PIPE)寫碼或另一熵編碼方法對單維向量進行熵編碼。視頻編碼器20亦可對與在解碼視頻資料中供由視頻解碼器30使用之經編碼視頻資料相關聯之語法元素進行熵編碼。 視頻編碼器20可輸出包括形成經寫碼圖像及相關聯資料之表示的位元序列之位元串流。術語「位元串流」可為用於指代網路抽象層(NAL)單元串流(例如,NAL單元序列)或位元組串流(例如,如HEVC標準之附件B規定之含有起始碼首碼及NAL單元之NAL單元串流之囊封)之集合術語。NAL單元為語法結構,含有該NAL單元中之資料之類型的指示以及含有呈視情況穿插有仿真阻止位元(emulation prevention bit)的原始位元組序列有效負載(RBSP)形式的彼資料之位元組。NAL單元中之每一者可包括NAL單元標頭且可囊封RBSP。NAL單元標頭可包括指示NAL單元類型碼之語法元素。由NAL單元之NAL單元標頭規定之NAL單元類型碼指示NAL單元之類型。RBSP可為含有囊封在NAL單元內之整數個位元組之語法結構。在一些情況中,RBSP包括零位元。 不同類型之NAL單元可囊封不同類型之RBSP。例如,第一類型之NAL單元可囊封圖像參數集(PPS)之RBSP,第二類型之NAL單元可囊封圖塊區段之RBSP,第三類型之NAL單元可囊封互補增強資訊(SEI)之RBSP,等等。囊封視頻寫碼資料之RBSP(與參數集及SEI訊息之RBSP相反)之NAL單元可被稱作視頻寫碼層(VCL)NAL單元。除VCL NAL單元外之NAL單元可被稱作非VCL NAL單元。含有參數集(例如,視頻參數集(VPS)、序列參數集(SPS)、PPS,或其他類型之參數集)之NAL單元可被稱作參數集NAL單元。 本發明可將囊封區段圖塊之RBSP之NAL單元稱作為經寫碼圖塊NAL單元。如HEVC中所定義,圖塊區段為在頻塊掃描中連續排序且含於單個NAL單元中之整數個CTU。相比而言,在HEVC中,圖塊可為一個獨立圖塊區段及同一存取單元內在下一獨立圖塊區段(若存在)之前的所有隨後的依賴圖塊區段(若存在)中所含之整個數目個CTU。獨立圖塊區段為圖塊區段標頭之語法元素之值並非自前一圖塊區段之值推斷出的圖塊區段。依賴圖塊區段為圖塊區段標頭之一些語法元素之值係自解碼次序中之前一獨立圖塊區段之值推斷出的圖塊區段。經寫碼圖塊NAL單元之RBSP可包括圖塊區段標頭及圖塊資料。圖塊區段標頭為含有關於圖塊區段中所表示之第一或全部CTU之資料元素之經寫碼圖塊區段之一部分。圖塊標頭為獨立圖塊區段之圖塊區段標頭,該獨立圖塊區段為當前圖塊區段或在解碼次序中在當前依賴圖塊區段之前的最新獨立圖塊區段。 視頻解碼器30可接收由視頻編碼器20產生之位元串流。另外,視頻解碼器30可剖析位元串流以自位元串流獲得語法元素。視頻解碼器30可至少部分地基於自位元串流獲得之語法元素來重建構視頻資料之圖像。用以重建構視頻資料之程序可通常與由視頻編碼器20執行之程序互逆。舉例而言,視頻解碼器30可使用PU之運動向量來判定用於當前CU之PU之預測性區塊。另外,視頻解碼器30可反量化當前CU之TU之係數區塊。視頻解碼器30可對係數區塊執行反變換以重建構當前CU之TU之變換區塊。視頻解碼器30可藉由將用於當前CU之PU之預測性區塊之樣本添加至當前CU之TU之變換區塊之對應樣本來重建構當前CU之寫碼區塊。藉由重建構用於圖像之每一CU之寫碼區塊,視頻解碼器30可重建構圖像。 如上文所論述,視頻編碼器20可產生包含一系列NAL單元之位元串流。在多層視頻寫碼中,位元串流之不同NAL單元可與位元串流之不同層相關聯。層可被定義為一組具有相同層識別符之VCL NAL單元及相關聯非VCL NAL單元。舉例而言,NAL單元可包括標頭(亦即,NAL單元標頭)及有效負載(例如,RBSP)。NAL單元標頭可包括層識別符語法元素(例如,HEVC中之nuh_layer_id語法元素)。具有規定不同值之層識別符語法元素之NAL單元屬於位元串流之不同「層」。因此,在多層寫碼(例如,MV-HEVC、SVC或SHVC)中,NAL單元之層識別符語法元素規定NAL單元之層識別符(亦即,層ID)。 層可等效於多視圖視頻寫碼中之視圖。在多視圖視頻寫碼中,層可含有同一層之所有視圖分量,視圖分量具有不同時間執行個體(例如,不同輸出時間)。在多層視頻寫碼中,術語「存取單元」可指對應於同一時間執行個體之圖像之集合。舉例而言,存取單元中之所有圖像可具有相同輸出時間。因此,「視圖分量」可為單個存取單元中之視圖之經編碼表示。 在一些實例中,視圖分量可包含紋理視圖分量(亦即,紋理圖像)或深度視圖分量(亦即,深度圖像)。在多視圖視頻寫碼之一些實例中,層含有特定視圖之經寫碼深度圖像或特定視圖之經寫碼紋理圖像,但不含深度圖像及紋理圖像兩者。在多視圖視頻寫碼之其他實例中,層含有特定視圖之紋理視圖分量及深度視圖分量兩者。 在可縮放視頻寫碼之上下文中,層通常對應於具有不同於其他層中之經寫碼圖像之視頻特性之經寫碼圖像。此等視頻特性通常包括空間解析度及品質位準(例如,信雜比)。 針對位元串流之每一各別層,無需參考任何較高層中之資料即可對較低層中之資料進行解碼。在可縮放視頻寫碼中,例如,無需參考增強層中之資料即可對基礎層中之資料進行解碼。一般而言,NAL單元可僅囊封單個層之資料。因此,囊封位元串流之最高剩餘層(例如,與最高層識別符相關聯之層)之資料之NAL單元可自位元串流移除,而不影響位元串流之剩餘層中之資料之可解碼性。在多層視頻寫碼中,若視頻解碼器無需參考任何其他層之資料即可對層中之圖像進行解碼,則該層可被稱作「基礎層」。在HEVC及其他視頻寫碼規範中,若NAL單位在基礎層中,則該NAL單元之層識別符等於0。若NAL單元在多層寫碼中不與基礎層相關,則NAL單元之層識別符可具有非零值。 在可縮放視頻寫碼中,除基礎層外之層可被稱作「增強層」且可提供增強自位元串流解碼之視頻資料之視覺品質之資訊。可縮放視頻寫碼可增強空間解析度、信雜比(亦即,品質)或時間速率。 多層視頻寫碼可支援層間預測。層間預測類似於HEVC及其他視頻寫碼規範中所使用之圖框間預測,且可使用相同語法元素。然而,當視頻寫碼器對當前視頻單元(諸如PU)執行層間預測時,視頻寫碼器可使用與當前視頻單元在同一存取單元中、但在不同層中之圖像作為參考圖像。相比而言,習知圖框間預測僅使用不同存取單元中之圖像作為參考圖像。當對非基礎層中之一者中之圖像進行寫碼時,若圖像在不同層中,但在與視頻寫碼器當前正寫碼之圖像在同一時間執行個體(亦即,存取單元)內,則視頻寫碼器可將該圖像添加至參考圖像清單中。 此外,可在無需參考同一層內之其他圖像之情況下將層內之一些圖像解碼。因此,可將囊封層之某些圖像之資料之NAL單元自位元串流移除而不影響層中之其他圖像之可解碼性。將囊封此等圖像之資料之NAL單元移除可降低位元串流之圖框速率。可在無需參考層內之其他圖像之情況解碼之層內之圖像子集可在本文中被稱作「子層」、「時間層」或「時間子層」。因此,可藉由將具有特定時間位準之圖像群組定義為子層(亦即,時間層)來在一個層內實現時間可縮放性。 NAL單元可包括時間識別符(例如,HEVC中之temporal_id)語法元素。NAL單元之時間識別符語法元素規定NAL單元之時間識別符。NAL單元之時間識別符識別NAL單元與其相關聯之時間子層。因此,位元串流之每一時間子層可與不同時間識別符相關聯。若第一NAL單元之時間識別符小於第二NAL單元之時間識別符,則可在無需參考由第二NAL單元囊封之資料之情況下解碼由第一NAL單元囊封之資料。 位元串流可與複數個操作點相關聯。在一些實例中,位元串流之每一操作點可與層識別符集(例如,nuh_layer_id值集)及一時間識別符相關聯。層識別符集可標示為OpLayerIdSet且時間識別符可標示為TemporalID。若NAL單元之層識別符在操作點之層識別符集中且NAL單元之時間識別符小於或等於操作點之時間識別符,NAL單元與操作點相關聯。因此,操作點可為藉由子位元串流提取程序之操作自另一位元串流形成之位元串流,其中另一位元串流、目標最高TemporalId及目標層識別符清單作為子位元串流提取程序之輸入。操作點可包括與操作點相關聯之每一NAL單元。安置點不包括不與操作點相關聯之VCL NAL單元。 現在將簡略地論述檔案格式及檔案格式標準。檔案格式標準包括ISO基本媒體檔案格式(「資訊技術—視聽物件寫碼—第12部分:ISO基本媒體檔案格式(Information technology — Coding of audio-visual objects — Part 12: ISO base media file format),」 ISO/IEC 14496-12,2015年2月20日第五版,下文中為「ISO/IEC 14996-12」) 及自ISOBMFF導出之其他檔案格式標準,包括MPEG-4檔案格式(「ISO/IEC 14496-14」「資訊技術—視聽物件寫碼—第14部分:MP4檔案格式(Information technology — Coding of audio-visual objects — Part 14: MP4 file format)」,ISO/IEC 14496-14,2003年11月15日第一版,下文中為「ISO/IEC 14496-14」),3GPP檔案格式(3GPP TS 26.244)及關於基於網路抽象層(NAL)單元之視頻壓縮之檔案格式(「資訊技術—視聽物件寫碼—第15部分:ISO基本媒體檔案格式之網路抽象層(NAL)單元結構化視頻之載送」ISO/IEC 14496-15:2014(E),下文中為「ISO/IEC 14996-15」)。因此,ISO/IEC 14496-12規定ISO基本媒體檔案格式。其他文件擴展ISO基本媒體檔案格式用於特定應用。舉例而言,ISO/IEC 14496-15描述ISO基本媒體檔案格式之NAL單元結構化視頻之載送。H.264/AVC及HEVC以及其擴展為NAL單元結構化視頻之實例。ISO/IEC 14496-15包括描述H.264/AVC NAL單元之載送的章節。另外,ISO/IEC 14496-15之第8章描述HEVC NAL單元之載送。因此,ISO/IEC 14496-15之第8章被認為描述HEVC檔案格式。在第114屆MPEG會議之後,基於自數個國家機構接收的評論,製備含有將應用於新版本之ISO/IEC 14496-15規範草案的對ISO/IEC 14496-15之一些改變之處置文件。此處置文件被稱作「MPEG輸出文件N15297。」 ISOBMFF用作諸多編解碼囊封格式(諸如AVC檔案格式)以及諸多多媒體容器格式(諸如,MPEG-4檔案格式、3GPP檔案格式(3GP)及DVB檔案格式)之基礎。除連續媒體(諸如音訊及視頻)外,靜態媒體(諸如影像以及後設資料)亦可被儲存在符合於ISOBMFF之檔案中。根據ISOBMFF結構化之檔案可用於諸多用途,包括本端媒體檔案播放,遠端檔案之漸進式下載、用於經由HTTP之動態自適性串流(DASH)之區段、用於欲串流化之內容及其封包指令之容器,及對所接收即時媒體串流之記錄。因此,儘管起初經設計用於儲存,但ISOBMFF已證明對串流(例如,對漸進式下載或DASH)有價值。出於串流化目的,可使用ISOBMFF中定義之影片片段。除連續媒體(諸如音訊及視頻)外,靜態媒體(諸如影像以及後設資料)亦可被儲存在符合於ISOBMFF之檔案中。 符合HEVC檔案格式之檔案可包含稱作方塊之一系列物件。方塊可為由唯一類型識別符及長度定義之物件導向建構區塊。方塊為ISOBMFF中之基礎語法結構且可包括四字元寫碼方塊類型、方塊之位元組計數及有效負載。換言之,方塊可為包含寫碼方塊類型、方塊之位元組計數及有效負載之語法結構。在一些情況中,符合HEVC檔案格式之檔案中之所有資料可被含在方塊內且未在方塊中之檔案中可能不存在任何資料。因此,ISOBMFF檔案由方塊序列組成,且方塊可含有其他方塊。舉例而言,方塊之有效負載可包括一或多個額外方塊。圖8及圖9 (在本發明之別處詳細地描述)根據本發明之一或多種技術展示檔案內之實例性方塊。 符合ISOBMFF之檔案可包括各種類型之方塊。例如,符合ISOBMFF之檔案可包括檔案類型方塊、媒體資料方塊、電影方塊、電影片段方塊等等。在此實例中,檔案類型方塊包括檔案類型及相容性資訊。媒體資料方塊可含有樣本(例如,經寫碼圖像)。電影方塊(「moov」)含有關於存在於檔案中之連續媒體串流之後設資料。連續媒體串流在檔案中可表示為音軌。舉例而言,電影方塊可含有關於電影之後設資料(例如,樣本之間的邏輯及定時關係,且亦含有樣本之位置的指標)。電影方塊可包括數個類型之子方塊。電影方塊中之子方塊可包括一或多個音軌方塊。音軌方塊可包括關於電影之個別音軌之資訊。音軌方塊可包括規定單個音軌之整個資訊之音軌標頭方塊。另外,音軌方塊可包括含有媒體資訊方塊之媒體方塊。媒體資訊方塊可包括含有音軌中之媒體樣本之資料索引之樣本表方塊。樣本表方塊中之資訊可用於及時定位樣本,且針對音軌之樣本中之每一者,判定樣本之類型、大小、容器及至彼容器之偏移。因此,關於音軌之後設資料經封圍於音軌方塊(「trak」)中,而音軌之媒體內容經封圍於媒體資料方塊(「mdat」)中或直接封圍於單獨檔案中。音軌之媒體內容包含樣本序列(諸如音訊或視頻存取單元)或由樣本序列(諸如音訊或視頻存取單元)組成。 ISOBMFF規定以下類型之音軌:媒體音軌,其含有基礎媒體串流;提示音軌,其包括媒體傳輸指令或表示所接收封包串流;及定時後設資料音軌,其包含時間同步後設資料。關於每一音軌之後設資料包括樣本描述項清單,每一樣本描述項提供音軌中所使用之編碼或囊封格式及用於處理彼格式所需要之初始化資料。每一樣本與音軌之樣本描述項中之一者相關聯。 ISOBMFF實現藉助各種機制規定樣本特定後設資料。樣本表方塊(「stbl」)內之特定方塊已經標準化以對共同需求做出回應。樣本表方塊含有樣本表,該樣本表含有音軌中之媒體樣本之所有時間及資料索引。使用樣本表方塊中之表,可能及時定位樣本,判定其類型(例如,I圖框或非I圖框),且判定其尺寸、容器及至彼容器中之偏移。 例如,同步樣本方塊(「stss」)為樣本表方塊內之方塊。使用同步樣本方塊來列舉音軌之隨機存取樣本。本發明可係指由同步樣本方塊列舉為同步樣本之樣本。在另一實例中,樣本分組機制實現將根據四字元分組類型之樣本映射至共用與檔案中之樣本群組描述項相同之所規定性質的樣本群組中。ISOBMFF中已規定數種分組類型。 ISOBMFF規範規定供DASH使用之六種類型之串流存取點(SAP)。前兩種SAP類型(類型1及2)對應於H.264/AVC及HEVC中之IDR圖像。第三種SAP類型(類型3)對應於開放圖像群組(GOP)隨機存取點,因此HEVC中之中斷鏈結存取(BLA)或乾淨隨機存取(CRA)圖像。第四SAP類型(類型4)對應於漸進解碼再新(GDR)隨機存取點。 電影片段方塊為頂級方塊。每一電影片段方塊提供原本先前在電影方塊中之資訊。電音片段方塊可含有一或多個音軌片段(「traf」)方塊。電影片段內存在一組音軌片段,每音軌零或多個音軌片段。音軌片段又含有零個或多個音軌行程(track run),每一音軌行程記載彼音軌之樣本之連續行程。舉例而言,每一音軌行程可含有在某一次序(諸如解碼次序)上為連續之圖像之樣本。音軌片段方塊在14496-12規範中經定義且包含關於一或多個音軌片段之後設資料。舉例而言,音軌片段方塊可包括音軌片段標頭方塊,該音軌片段標頭方塊指示音軌ID、基本資料偏移、樣本描述索引、預設樣本持續時間、預設樣本尺寸及預設樣本旗標。音軌片段方塊可包括一或多個音軌片段行程方塊,每一音軌片段行程方塊記載音軌的一組連續樣本。舉例而言,音軌片段方塊可包括語法元素,該等語法元素指示樣本計數、資料偏移、樣本旗標、樣本持續時間、樣本尺寸、樣本合成時間偏移,等等。在此等結構內,諸多欄位為選用的且可為預設的。 樣本表方塊可包括一或多個SampleToGroup方塊及一或多個樣本群組描述方塊(亦即,SampleGroupDescription方塊)。在本發明中,SampleToGroup方塊可被稱作「樣本分組方塊」且SampleGroupDescription方塊可被稱作「樣本群組描述方塊」。一般而言,SampleToGroup方塊包括定義一或多個樣本群組之語法元素。在本發明中,樣本之群組亦可被稱作「樣本群組」或「樣本分組」。此外,一般而言,SampleGroupDescription方塊包括樣本群組之描述。 SampleToGroup方塊可用於判定樣本所屬於之樣本群組連同樣本群組之相關聯描述。換言之,SampleToGroup方塊可指示樣本所屬於之群組。SampleToGroup方塊可具有「sbgp」之方塊類型。SampleToGroup方塊可包括分組類型元素(例如,grouping_type)。在一些情況中,在本發明中,方塊之元素亦可被稱作語法元素。分組類型元素可為識別樣本分組之類型(亦即,用於形成樣本群組之準則)之整數。此外,SampleToGroup方塊可包括一或多個項(亦即,樣本群組項)。SampleToGroup方塊中之每一樣本群組項可與音軌中之一系列不同的不重疊的連續樣本相關聯。每一樣本群組項可指示樣本計數元素(例如,sample_count)及群組描述索引元素(例如,group_description_index)。樣本群組項之樣本計數元素可指示與樣本群組項相關聯之樣本之數目。換言之,樣本群組項之樣本計數元素可為給出具有相同樣本群組描述之連續樣本之數目的整數。群組描述索引元素可在SampleGroupDescription方塊內識別含有與樣本群組項相關聯之樣本之描述的群組描述項。多個樣本群組項之群組描述索引元素可識別同一SampleGroupDescription方塊。 SampleGroupDescription方塊亦包括分組類型語法元素。當SampleToGroup方塊與SampleGroupDescription方塊之分組類型語法元素匹配時,SampleToGroup方塊與SampleGroupDescription方塊被認為彼此對應。SampleGroupDescription方塊包括一或多個群組描述項。SampleGroupDescription方塊中之每一各別群組描述項包括各別樣本群組之描述。SampleToGroup方塊中之群組描述索引識別對應的SampleGroupDescription方塊中之對應的群組描述項。 舉例而言,SampleToGroup方塊可具有第一樣本群組項,該第一樣本群組項包括具有等於5之值的樣本計數語法元素及具有等於3之值之群組描述索引。因此,在此實例中,五個連續樣本屬於由對應的SampleGroupDescription方塊中之具有索引3之群組描述項描述之樣本群組。在此實例中,SampleToGroup方塊可具有第二樣本群組項,該第二樣本群組項包括具有等於4之值的樣本計數語法元素及具有等於2之值之群組描述索引。因此,在此實例中,下四個連續樣本屬於由對應的SampleGroupDescription方塊中之具有索引2之樣本群組描述項描述之樣本群組。 在關於檔案格式之L-HEVC層之儲存之ISO/IEC 14496-15中,使用在載送位元串流之音軌中之一者發信號之操作點(「oinf」)樣本群組來描述可用於檔案中之位元串流之操作點清單。操作點樣本群組在本文中亦可被稱作「操作點資訊樣本群組」。應用程式可藉由遵循「oref」音軌參考來發現含有「oinf」樣本群組之音軌。為簡潔起見,含有「oinf」樣本群組之音軌亦被稱作「oref」音軌。儘管在一個音軌中僅發信「oinf」樣本群組,但在關於L-HEVC層之儲存之ISO/IEC 14496-15中,「oinf」樣本群組之範疇涵蓋載送L-HEVC寫碼資料之所有音軌。使用樣本群組發送操作點清單具有使得操作點清單可不涵蓋時間維度中之整個位元串流的結果。可存在超過一個「oinf」樣本群組且每一樣本群組包括一組不同的樣本。 另一實例性樣本群組為層資訊(「linf」)樣本群組。層資訊樣本群組之樣本群組描述項包含音軌含有之層及子層之清單。含有層之經寫碼圖像之音軌之每一實例可為音軌之「linf」樣本群組之部分。在音軌之樣本群組描述方塊中可存在一或多個「linf」樣本群組項。然而,可能要求針對包括L-HEVC資料之每一堆疊存在一個「linf」樣本群組描述項。下文提供關於「linf」樣本群組之樣本群組描述項之語法及語意。9.8.2.2 語法
class LayerInfoGroupEntry extends VisualSampleGroupEntry ('linf')) { unsigned int (2) reserved; unsigned int (6) num_layers_in_track; for (i=0; i<num_layers_in_track; i++) { unsigned int (4) reserved; unsigned int (6) layer_id; unsigned int (3) min_sub_layer_id; unsigned int (3) max_sub_layer_id; } }9.8.2.3 語意
num_layers_in_track:在與此樣本群組相關聯之此音軌之任何樣本中載送之層之數目。 layer_id:在相關聯樣本中載送之層的層ID。此欄位之例子在迴圈中應為遞增次序。 min_sub_layer_id:音軌內之層中之子層的最小TemporalId值。 1. max_sub_layer_id:音軌內之層中之子層的最大TemporalId值。 2. 假設layerList為在此音軌中載送之層的層ID以及在其他音軌中載送且由在此音軌中載送之層直接或間接地參考之層之層ID的清單。layerList中之層ID係以層ID值之遞增次序排序。例如,假定此音軌載送具有層ID 4及5之層且其參考具有等於0及1之層ID,則與此堆疊相關聯之layerList為{0, 1, 4, 5}。 如HEVC之章節3.160中所描述,頻塊為將樹區塊寫碼在圖像之特定頻塊行及特定頻塊列內之矩形區。HEVC頻塊不與同一寫碼圖像中之其他HEVC頻塊具有寫碼相依性但可與先前寫碼圖像之其他HEVC頻塊具有寫碼相依性或可經獨立地解碼。圖2為說明實例性頻塊及圖塊的概念圖。在圖2之實例中,圖像40具有64個亮度CTB,每一亮度CTB表示為小正方形。此外,圖像40具有由垂直頻塊邊界50及水平頻塊邊界52分離之四個頻塊42、44、46、48。頻塊42及44形成第一頻塊列且頻塊46及48形成第二不同頻塊列。此外,頻塊42及46形成第一頻塊行且頻塊48及50形成第二不同頻塊行。頻塊邊界在圖2中表示為粗線。 在圖2之實例中,即使頻塊42中之CTB毗鄰於頻塊46中之CTB,頻塊46中之任何CTB仍不可能相依於頻塊42中之CTB,頻塊行係具有等於圖像之高度的高度及由語法元素(例如,在圖像參數集中)規定之寬度之寫碼樹區塊之矩形區。頻塊列係具有由語法元素(例如,在圖像參數集中)規定之高度及等於圖像之寬度的寬度的寫碼樹區塊之矩形區。 圖像40具有八個圖塊區段54、56、58、60、62、64、66及68。在圖2之實例中,圖塊區段邊界用虛線指示。此外,在圖2之實例中,具有陰影CTB之圖塊區段為獨立圖塊區段且具有白CTB之圖塊區段為依賴圖塊區段。在HEVC中,圖塊區段之每一寫碼區塊被含在圖塊區段之NAL單元中。此外,在HEVC中,NAL單元不包括多個圖塊區段之寫碼區塊。 在圖2之實例中,CTB中之每一者之數目指示CTB之寫碼次序。如圖2中所展示,頻塊邊界可改變圖像40中之CTB之寫碼次序。舉例而言,在不存在頻塊邊界50及52之情況下,視頻寫碼器可在對圖像40中之下一較低CTB列之任何CTB進行寫碼之前對在圖像40中之完整CTB列中之全部CTB進行寫碼 如HEVC之章節6.3.1中所描述,與圖塊不同,頻塊始終為矩形。頻塊始終含有整數個寫碼樹單元,且可由含在多於一個圖塊中之寫碼樹單元組成。類似地,圖塊可包含含在多於一個頻塊中之CTU或由CTU組成。此外,如HEVC之章節6.3.1中所描述,針對每一圖塊及頻塊應滿足以下條件中之一者或兩者:(1)圖塊中之所有寫碼樹單元屬於同一頻塊;且(2)頻塊中之所有CTU屬於同一圖塊。另外,針對每一圖塊區段及頻塊應滿足以下條件中之一者或兩者:(1)圖塊區段中之所有CTU屬於同一頻塊;且(2)頻塊中之所有CTU屬於同一圖塊。 存在與判定編解碼器(例如,HEVC)層級處關於頻塊之資訊相反獲得檔案層級處關於頻塊之資訊係有用的之情景。例如,在圖2中,假定頻塊46及48對應於新聞廣播之底部處之水平滾動字幕(crawl)而頻塊42及44含有新聞主播之影像。在此實例中,水平滾動字幕可包括關於其他新聞之文字、體育比分、學校關閉、股票報價,等等。在此實例中,可能期望僅串流化包括新聞主播之影像之圖像40之部分而不串流化水平滾動字幕。在將視頻串流化至具有小螢幕之裝置(諸如智慧型電話或智慧型手錶)時,以此方式減少視頻之串流化內容可為所期望的。同時,相同視頻之完整版本(其包括頻塊46及48)可經串流化至裝置用於在較大螢幕(諸如電視機)上呈現。 因此,ISO/IEC 14496-15描述用於描述及操縱檔案層級處之頻塊之工具。特定而言,ISO/IEC 14496-15之章節10.1定義頻塊區及頻塊集之概念。頻塊區為包括一或多個頻塊之矩形區。舉例而言,在圖2之實例中,頻塊42及44可形成頻塊區;頻塊42及46可形成頻塊區,頻塊44及48可形成頻塊區,頻塊46及48可形成頻塊區,且頻塊42、44、46及48可形成頻塊區。經寫碼於單個圖塊中之數個頻塊可分組為頻塊之集,稱作頻塊集。舉例而言,在圖2之實例中,頻塊集可由頻塊42、頻塊46及頻塊48組成。然而,在圖2之實例中,頻塊42、頻塊46及頻塊48無法形成頻塊區,此係因為頻塊42、46及48並非單個矩形區。 頻塊集可用於表示跨越數個HEVC頻塊之關注區。例如,頻塊集可由頻塊42、44及46組成。在此實例中,頻塊42、44及46可對應於直播視頻串流而頻塊48包括在諸多圖像上方為靜態之圖像。 此外,如ISO/IEC 14496-15之章節10.1中所描述,使用SampleGroupDescription方塊描述頻塊區及頻塊集。換言之,在ISO/IEC 14496-15之章節10.1中,SampleGroupDescription方塊可規定頻塊區及頻塊集。更具體而言,使用TileRegionGroupEntry樣本描述群組描述視頻音軌之頻塊區。使用TileSetGroupEntry樣本描述群組描述頻塊集。頻塊區可為多個頻塊集之成員。TileSetGroupEntry可用於定義:一組頻塊區,具有或不具有寫碼相依性;一組HEVC頻塊,其由一或數個NAL單元寫碼,例如圖塊中之多個HEVC頻塊;及多個頻塊區之間的寫碼相依性。 個別NALU可與以下相關聯: 頻塊區(亦即,當HEVC頻塊經寫碼為圖塊集時) 頻塊集(亦即,當圖塊含有用於數個HEVC頻塊之寫碼區塊時)。 樣本、NAL單元(NALU)、頻塊區及頻塊集之間的相關聯可經由SampleToGroup及NALUMapEntry方塊進行。 在ISO/IEC 14496-15中,NALUMapEntry方塊具有以下語法: class NALUMapEntry() extends VisualSampleGroupEntry ('nalm') { unsigned int(6) reserved = 0; unsigned int(1) large_size; unsigned int(1) rle; if (large_size) { unsigned int(16) entry_count; } else { unsigned int(8) entry_count; } for (i=1; i<= entry_count; i++) { if (rle) { if (large_size) { unsigned int(16) NALU_start_number; } else { unsigned int(8) NALU_start_number; } } unsigned int(16) groupID; } } 此外,ISO/IEC 14496-15如下定義NALUMapEntry方塊之語意: large_size指示音軌樣本中之NAL單元項之數目係以8位元抑或16位元表示。 rle指示是(1)否(0)使用行程長度編碼來將groupID指派至NAL單元。 entry_count規定映射中之項之數目。應注意,當rle等於1時,entry_count對應於連續NAL單元與相同群組相關聯之行程之數目。當rle等於0時,entry_count表示NAL單元之總數目。 NALU_start_number為與groupID相關聯之當前行程中之第一NALU之樣本中之基於1之NALU索引。 groupID指示對應的可縮放、多視圖頻塊區或頻塊集群組項,如樣本群組描述中所指示。若groupID為0,無任何群組與此等經識別NALU相關聯。 每一樣本描述群組經指派唯一識別符,稱作groupID。此識別符可用於使用ScalableNALUMapEntry或NALUMapEntry樣本描述群組將NAL單元與對應的頻塊區或頻塊集相關聯。頻塊區及頻塊集共用相同的groupID命名空間,由基本HEVC層定範疇。亦即,在ISO/IEC 14496-15中,在具有相同基礎層之任何音軌中不應存在具有相同groupID之兩個頻塊區或頻塊集。 如上文所述,NALUMapEntry方塊包括rle語法元素及entry_count語法元素。rle語法元素指示是否使用行程長度編碼來將groupID指派至NAL單元。在NALUMapEntry方塊之上下文中,行程為經指派相同groupID之一系列連續NAL單元。當使用行程長度編碼來將groupID指派至NAL單元時,NALUMapEntry方塊包括關於每一各別行程之各別NALU_start_number語法元素。例如,假定自具有索引2之NAL單元開始之一組六個連續NAL單元經指派等於11之groupID。在此實例中,NALUMapEntry方塊可包括指示等於2之值之第一NALU_start_number語法元素,後續接著具有等於11之值之groupID語法元素,後續接著等於8之第二NALU_start_number語法元素。因此,在此實例中,解譯含有NALUMapEntry方塊之檔案之裝置,諸如檔案剖析單元31 (圖1)可判定自索引2至索引7之NAL單元經指派等於11之groupID。 ISO/IEC 14496-15如下規定TileRegionGroupEntry方塊之語法: class TileRegionGroupEntry() extends VisualSampleGroupEntry ('trif') { unsigned int(16) groupID; unsigned int(2) independent_flag; unsigned int(1) full_picture; unsigned int(1) filtering_disabled; unsigned int(4) reserved=0; if (!full_picture) { unsigned int(16) horizontal_offset; unsigned int(16) vertical_offset; } unsigned int(16) region_width; unsigned int(16) region_height; } ISO/IEC 14496-15如下規定TileRegionGroupEntry方塊之語意: groupID為由此群組描述之頻塊區之唯一識別符。值0經保留供專用於「nalm」方塊。 independent_flag規定此頻塊區與當前圖像中及同一層之參考圖像中之其他頻塊區之間的寫碼相依性。頻塊間相依性(若存在)藉助於TileSetGroupEntry中之dependency_list指示。此旗標取以下值: - 若independent_flag等於0,此頻塊區與相同圖像或先前圖像中之其他頻塊之間的寫碼相依性係在頻塊集層級或未知層級描述。 - 若independent_flag等於1,則此頻塊區與任何參考圖像中之具有不同groupID之其他頻塊區或頻塊集之間無任何時間相依性,但在此頻塊與參考圖像中之具有相同groupID之頻塊區之間可能存在寫碼相依性。 - 若independent_flag等於2,則此頻塊區與參考圖像中之任何其他頻塊之間不存在任何寫碼相依性。 - 保留值3。 full_picture在經設定時指示此頻塊區實際上為完整圖像,在此狀況下region_width及region_height應設定為層亮度尺寸,且independent_flag應設定為1。上述情形允許使用參考具有設定為1的full_picture
參數之「trif」樣本群組的「tsif」樣本群組來表達層之頻塊與非頻塊層之間的相依性。 filtering_disable在經設定時指示此頻塊區上無任何解碼後篩選操作需要存取毗鄰於此頻塊區之像素,亦即,頻塊區之位元準確重建構係可能的而無需解碼毗鄰之頻塊。 horizontal_offset及vertical_offset分別給出基本區之亮度樣本中之由頻塊區表示之矩形區之左上方像素相對於圖像之左上方像素之水平及垂直偏移。 region_width及region_height分別給出基本區之亮度樣本中由頻塊區表示之矩形矩形區之寬度及高度。 此外,ISO/IEC 14496-15如下規定TileSetGroupEntry方塊之語法: class TileSetGroupEntry() extends VisualSampleGroupEntry ('tsif') { unsigned int(16) groupID; int(1) area_description; int(2) dependency_list; int (5) reserved; if (area_description==0) { unsigned int(16) tile_count; for (i=1; i<= tile_count; i++){ unsigned int(16) tileGroupID; } } else { unsigned int(16) topLeftTileGroupId; unsigned int(16) bottomRightTileGroupId; } if ((dependency_list==1) || (dependency_list==3)) { unsigned int(16) dependency_tile_count; for (i=1; i<= dependency_tile_count; i++){ unsigned int(16) dependencyTileGroupID; } if (dependency_list==3) { unsigned int(16) irap_dependency_tile_count; for (i=1; i<= irap_dependency_tile_count; i++){ unsigned int(16) irap_dependencyTileGroupID; } } else if (dependency_list==2) { unsigned int(16) topLeftDependencyTileGroupId; unsigned int(16) bottomRightDependencyTileGroupId; } } ISO/IEC 14496-15如下規定TileSetGroupEntry方塊之語意: groupID為由此群組描述之頻塊集之唯一識別符。值0經保留供專用於「nalm」方塊。 area_description指示頻塊集經表達為由左上角及右下角描述之矩形區域。 dependency_list指示給出此頻塊集之依賴頻塊區或頻塊集之清單。若經設定為零,則此意味著此集之頻塊與此集外部之頻塊之間不存在任何時間寫碼相依性。此確保僅解碼該集及該相依性清單之頻塊係可能的而無需解碼其他頻塊。若設定為1或3,則dependency_list經提供作為依賴頻塊之識別符清單。若設定為2,則dependency_list表達為由依賴頻塊形成之限界方塊。若設定為3,針對其中樣本為針對此HEVC層定義之隨機存取樣本之狀況給出頻塊區或頻塊集相依性之額外清單。 tile_count給出此頻塊集中定義之頻塊之數目。 tileGroupID指示屬於此頻塊集之頻塊區groupID值(如由TileRegionGroupEntry定義)或頻塊集groupID值(如由TileSetGroupEntry定義)。 topLeftTileGroupId指示此頻塊集之左上頻塊GroupID值。 bottomRightTileGroupId指示此頻塊集之右下頻塊groupID值。 dependency_tile_count指示相依性清單中之頻塊區或頻塊集之數目。 dependencyTileGroupID給出此頻塊集相依於之頻塊區(如由TileRegionGroupEntry所定義)或頻塊集(如由TileSetGroupEntry所定義之識別符。 irap_dependency_tile_count及irap_dependencyTileGroupID規定在此頻塊所屬於之樣本為針對此HEVC層所定義之隨機存取樣本時此頻塊集相依於之頻塊區或頻塊集清單。 topLeftDependencyTileGroupId指示此頻塊集相依於之區域之左上頻塊區或頻塊集groupID值。 bottomRightDependencyTileGroupId指示此頻塊集相依於之區域之右下頻塊區或頻塊集groupID值。 頻塊區可定義無孔洞之矩形區域。若非矩形之頻塊集經寫碼在單個HEVC圖塊中,則可將該頻塊集分解成不同矩形頻塊區且經由頻塊集描述,指示對相關頻塊區之相依性。可接著將此圖塊之NAL單元映射至頻塊集,但不應映射至頻塊區。 當與電影片段一起使用時,可藉由在音軌片段方塊中定義新SampleGroupDescription方塊,針對電影片段之持續時間定義TileRegionGroupEntry及TileSetGroupEntry,如在ISO/IEC 14496-12之第8.9.4條中所定義。然而,在具有與已定義之TileRegionGroupEntry或TileSetGroupEntry相同groupID之的音軌片段中不應存在任何TileRegionGroupEntry或TileSetGroupEntry。 在用於樣本與頻塊區之間的映射之上文所描述技術中可產生某些問題。換言之,上文關於操縱檔案層級之頻塊所描述之工具具有數種缺陷。例如,頻塊區可被認為頻塊之集合,而頻塊集可被認為頻塊區之集合且亦為頻塊之集合。為判定構成特定頻塊區之頻塊,可簡單地檢查NALUMapEntry。然而,為判定構成特定頻塊集之頻塊,諸如檔案剖析單元31之裝置首先必須檢查經列舉作為頻塊集之部分之頻塊區之清單且接著仍必須檢查NALUMapEntry以查看是否存在亦為頻塊集之部分之額外頻塊。此配置可使得頻塊區、頻塊集與NALUMapEntry之間的關係複雜化。此外,頻塊區與頻塊集之間當前似乎無概念區別,惟除頻塊區必須為矩形形狀,而頻塊集可為任何形狀。當頻塊集之tile_reg_count之值等於0時,頻塊集基本上為頻塊區。因此,可期望NALUMapEntry、頻塊區及頻塊集之簡化。 在ISO/IEC 14496-15之章節8.4.8中,在HEVC之上下文中,子樣本經定義為: 為將子樣本資訊方塊(ISO/IEC 14496-12之8.7.7)用於HEVC串流中,基於下文所規定之子樣本資訊方塊之旗標欄位之值定義子樣本。此方塊之存在為選用的;然而,若存在於含有HEVC資料之音軌中,方塊中之「codec_specific_parameters」欄位應具有此處定義之語意。 flags如下規定在此方塊中給出之子樣本資訊之類型: 0: 基於NAL單元之子樣本。子樣本含有一或多個連續NAL單元。 1: 基於解碼單元之子樣本。子樣本含有恰好一個解碼單元。 2: 基於頻塊之子樣本。子樣本含有一個頻塊及含有該頻塊之VCL NAL單元之相關聯的非VCL NAL單元(若存在),或含有一或多個非VCL NAL單元。 3: 基於CTU列之子樣本。子樣本含有圖塊內之一個CTU列及含有該CTU列之VCL NAL單元之相關聯的非VCL NAL單元(若存在),或含有一或多個非VCL NAL單元。當entropy_coding_sync_enabled_flag等於0時不應使用此類型之子樣本資訊。 4: 基於圖塊之子樣本。子樣本含有一個圖塊(其中每一圖塊可含有一或多個圖塊區段,圖塊區段中之每一者為NAL單元)及相關聯非VCL NAL單元(若存在),或含有一或多個非VCL NAL單元。 另外,在上文所描述之技術中可產生與將子樣本中之頻塊映射至頻塊區相關之問題。在MPEG輸出文件N15297 (對ISO/IEC 14496-15之評論之處置)中,同意允許對TileRegionGroupEntry應用於之頻塊的基於子樣本之識別。為支援上述情形,TileRegionGroupEntry之語法在MPEG輸出文件N15297中經修改,如下文文字中所展示。在下文及貫穿本發明之文字中,「<insert>」與「</insert>」符號之間的文字對應於新增或經修改之現有文字(例如,<insert>新增文字</insert>),而經移除之文字在「<delete>」與「</delete>」符號之間(例如,<delete>經刪除文字</delete>)。 class TileRegionGroupEntry() extends VisualSampleGroupEntry ('trif') { <delete>unsigned int(16) groupID;</delete> unsigned int(2) independent_flag; [Ed. (YK): Name it independent_idc.] unsigned int(1) full_picture; unsigned int(1) filtering_disabled; <insert>unsigned int(1) nalu_flag;</insert> unsigned int(<insert>34
</insert>) reserved=0; <insert>if (nalu_flag) unsigned int(16) groupID; else unsigned int(16) subsample_id;</insert> if (!full_picture) { unsigned int(16) horizontal_offset; unsigned int(16) vertical_offset; } unsigned int(16) region_width; unsigned int(16) region_height; } groupID為由此群組描述之頻塊區之唯一識別符。值0經保留供專用於「nalm」方塊。 independent_flag規定此頻塊區與當前圖像中及同一層之參考圖像中之其他頻塊區之間的寫碼相依性。頻塊間相依性(若存在)藉助於TileSetGroupEntry中之dependency_list指示。此旗標取以下值: - 若independent_flag等於0,此頻塊區與相同圖像或先前圖像中之其他頻塊之間的寫碼相依性係在頻塊集層級或未知層級描述。 - 若independent_flag等於1,則此頻塊區與任何參考圖像中之具有不同groupID之其他頻塊區或頻塊集之間無任何時間相依性,但在此頻塊與參考圖像中之具有相同groupID之頻塊區之間可能存在寫碼相依性。 - 若independent_flag等於2,則此頻塊區與參考圖像中之任何其他頻塊之間不存在任何寫碼相依性。 - 保留值3。 full_picture在經設定時指示此頻塊區實際上為完整圖像,在此狀況下region_width及region_height應設定為層亮度尺寸,且independent_flag應設定為1。上述情形允許使用參考具有設定為1的full_picture
參數之「trif」樣本群組的「tsif」樣本群組來表達層之頻塊與非頻塊層之間的相依性。 nalu_flag等於0規定頻塊區係以基於頻塊之子樣本為基礎而規定。nalu_flag等於1規定頻塊區係以「nalm」樣本分組之groupID值為基礎而規定。 subsample_id為經映射之樣本之子樣本資訊之基於1之索引,如旗標等於2 (基於頻塊之子樣本)之情況下SubSampleInformationBox中所指示。 MPEG輸出文件N15297中採用之TileRegionGroupEntry之改變具有兩個問題。首先,當nalu_flag等於0時,頻塊區群組不使用NALUMapEntry,此意指所有樣本與頻塊區群組相關聯,此係因為TileRegionGroupEntry不具有其自己之SampleToGroup方塊。因此,為使對頻塊之此基於子樣本識別起作用,暗示限制使得音軌中之所有樣本必須具有相同NAL單元且亦必須具有相同頻塊結構。換言之,音軌中之所有樣本必須以相同方式分割成圖塊及頻塊。 其次,僅具有一個語法元素subsample_id意指NAL單元內之僅恰好一個頻塊可為特定頻塊區群組之部分。在期望在包括在頻塊區中之NAL單元中具有一個以上頻塊時,此發信將無效率,此係因為必須定義稍後將由頻塊集分群組之更多頻塊區。 舉例而言,圖3為說明其中NAL單元包括多個頻塊之實例的概念圖。特定來說,圖像80具有由頻塊邊界90、92分離之四個頻塊82、84、86及88。圖塊區段94包括CTU 1至40。圖塊區段96、98、100包括CTU 41至64。圖塊區段之每一經編碼CTU被包括在圖塊區段之NAL單元中。在圖3之實例中,可能期望在頻塊區中包括有頻塊82及84。在MPEG輸出文件N15297中,subsample_id語法元素指示圖像中之sub-sample(例如,頻塊)中之哪一者為頻塊區之部分。舉例而言,subsample_id語法元素等於0可指示頻塊區群組中之每一圖像之第一頻塊與TileRegionGroupEntry方塊相關聯。由於在TileRegionGroupEntry方塊中僅存在一個subsample_id語法元素,因此在與TileRegionGroupEntry方塊相關聯之頻塊區群組中可包括每圖像僅一個頻塊。因此,為到達包括頻塊82及84之樣本群組,可產生兩個TileRegionGroupEntry方塊,每一TileRegionGroupEntry方塊包括指示頻塊82、84中之不同者之subsample_id語法元素。另外,將需要產生提及兩個TileRegionGroupEntry方塊之TileSetGroupEntry方塊。 此外,在上文所描述技術中可產生與頻塊區及頻塊集層間相依性有關之問題。舉例而言,MPEG輸出文件N15927描述與頻塊區及頻塊集中之相依性資訊之發信有關之數個改變。特定而言,MPEG輸出文件N15927中同意以下改變: a) 同意將名稱independent_flag改變成independent_idc。 b) 同意在independent_idc之值等於2時以編輯方式編輯其語意。 c) 同意在所有狀況下使用等於0之dependency_list之發信並移除與等於1及2之dependency_list相關之語法及語意。 儘管上述同意點可改良頻塊區及頻塊集相依性發信,但甚至在併入彼等同意點之修改之後,仍未解決以下問題。特定來說,頻塊區及頻塊集之當前頻塊相依性發信在存在層間相依性時並不起作用。例如,如上文所述,ISO/IEC 14496-15規定,在dependency_list語法元素「經設定為零時,此意味著來自此集之頻塊與在此集外部之頻塊之間不存在任何時間寫碼相依性。此確保僅解碼該集及該相依性清單之頻塊係可能的而無需解碼其他頻塊。」然而,ISO/IEC 14496-15中並未指示關於頻塊之間的視圖間寫碼相依性的內容。 此外,在上文所描述技術中可產生與圖像層級及上部層級非VCL NAL單元相關之某些問題。舉例而言,在上文所描述技術中,在ISO/IEC 14496-15中,NALUMapEntry提供自NAL單元至頻塊區群組或頻塊集群組之映射。存在一種特殊狀況,即當NAL單元經指派等於0之groupID時,此意指該NAL單元不與任何頻塊區或頻塊集群組相關聯。然而,並不清楚應為非VCL NAL單元指派哪一groupID,尤其全局應用於圖像之所有VCL NAL單元(例如參數集)之非VCL NAL單元。針對此等非VCL NAL單元,似乎無法將其映射至groupID 0,此係因為對每一頻塊區或頻塊集群組之處理將需要該等非VCL NAL單元,且可將該等非VCL NAL單元指派至特定頻塊區或頻塊集,將使得其不可由其他頻塊區或頻塊集使用。 為解決上述問題及缺陷,描述以下技術。下文所描述之技術可以獨立地方式應用或可以任何可行組合應用。 如所提及,頻塊區與頻塊集之間的關係可能過度複雜。根據本發明之技術,為解決此問題,將頻塊區概念合併至頻塊集概念中。換言之,頻塊區之概念及頻塊集之概念經合併。在頻塊區及頻塊集之概念合併之此等實例中,術語頻塊區及頻塊集可互換使用。此外,在頻塊區及頻塊集之概念合併之實例中,頻塊集群組項(例如,TileSetGroupEntry方塊)及頻塊區群組項(例如,TileRegionGroupEntry方塊)之論述可互換。因此,在此等實例中,可將TileSetGroupEntry方塊或TileRegionGroupEntry方塊自用於定義檔案之語法消除,且TileRegionGroupEntry方塊之論述可應用於TileRegionGroupEntry方塊,或反之亦然。 此外,可發信語法元素以指示由頻塊集中之頻塊覆蓋之區是否為矩形形狀。因此,在此實例中,檔案產生裝置34可在檔案中之頻塊集群組項中包括指示由頻塊集中之頻塊覆蓋之區是否為矩形形狀的語法元素(例如,rectangular_flag)。類似地,檔案剖析單元31可自檔案中之頻塊集群組項內獲得指示由頻塊集中之頻塊覆蓋之區是否為矩形形狀的語法元素(例如,rectangular_flag)。在此實例中,檔案剖析單元31可基於語法元素而處理頻塊集。舉例而言,基於TileSetGroupEntry中指示由頻塊集中之頻塊覆蓋之區為矩形之語法元素,且可能基於TileSetGroupEntry中指示頻塊集之位置及尺寸之語法元素,檔案剖析單元31可判定頻塊集對應於待輸出以用於顯示之所要區。因此,在此實例中,檔案剖析單元31,作為處理頻塊集之部分,可自檔案提取頻塊集之頻塊並傳輸所提取頻塊。舉例而言,檔案剖析單元31可自檔案提取頻塊集之頻塊之VCL NAL單元並將所提取VCL NAL單元輸出至視頻解碼器(例如,視頻解碼器30)以進行解碼,而不會將未提取VCL NAL單元輸出至視頻解碼器。 如上文所述,TileRegionGroupEntry方塊(如ISO/IEC 14496-15中所定義)包括horizontal_offset語法元素及vertical_offset語法元素。horizontal_offset語法元素及vertical_offset語法元素指示由與TileRegionGroupEntry方塊相關聯之頻塊區表示之矩形區之左上方像素之偏移。TileRegionGroupEntry方塊在與TileRegionGroupEntry方塊相關聯之頻塊區不對應於完整圖像之情況下僅包括horizontal_offset語法元素及vertical_offset語法元素。此外,TileRegionGroupEntry方塊(如ISO/IEC 14496-15中所定義)包括指示與TileRegionGroupEntry方塊相關聯之矩形區之寬度及高度之region_width語法元素及region_height語法元素。 根據本發明之技術,偏移資訊(亦即,水平及垂直偏移)及由頻塊集中之頻塊覆蓋之區的寬度與高度(例如,region_width及region_height)之語法及語意可被修改。例如,始終發信水平偏移、垂直偏移、寬度及高度之資訊。舉例而言,在此實例中無論頻塊區是抑或不是完整圖像皆發信水平偏移及垂直偏移,而非僅在頻塊區並非完整圖像時才發信水平偏移及垂直偏移。在此實例中,偏移語法元素及高度與寬度語法元素之語意可經調整使得此等語法元素之語意描述覆蓋頻塊集中之所有頻塊之最小矩形區域。最小矩形區域為封圍頻塊集之所有頻塊之最小可能矩形區域。 因此,在此實例中,檔案產生裝置34可無論頻塊區是否為完整圖像皆在檔案中包括以下各者中之至少一者:水平偏移語法元素(例如,horizontal_offset)及垂直偏移語法元素(例如,vertical_offset)。在此實例中,水平偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之水平偏移。在此實例中,垂直偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之垂直偏移。因此,檔案剖析單元31可無論頻塊區是否為完整圖像皆自檔案獲得以下各者中之至少一者:水平偏移語法元素及垂直偏移語法元素。在此實例中,水平偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之水平偏移。垂直偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之垂直偏移。在此實例中,樣本群組描述方塊可包括包含頻塊集群組項之群組描述項。 圖4為根據本發明之一或多種技術說明包括由含有頻塊集122之最小矩形區域124限界之頻塊集122之實例圖像120的概念圖。如圖4之實例中所展示,頻塊集122包括配置成四列之十七個頻塊。頻塊之前三個列具有四個頻塊且頻塊之底部列具有五個頻塊。因此,頻塊122並非矩形的。假設每一頻塊為10個單位寬及10個單位高,寬度語法元素可指示值50且高度語法元素可指示值40。 在一些實例中,僅在由頻塊集中之頻塊覆蓋之區為矩形形狀之情況下才發信水平偏移、垂直偏移、寬度及高度的資訊。在此實例中,關於並非矩形形狀之頻塊集之位置及尺寸資訊可能不可獲得。 在另一實例中,檔案產生裝置34可僅在由頻塊集中之頻塊覆蓋之區為矩形形狀之情況下才包括以下各者中之至少一者:水平偏移語法元素(例如,horizontal_offset)及垂直偏移語法元素(例如,vertical_offset)。在此實例中,水平偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之最上方像素之水平偏移,且垂直偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之垂直偏移。類似地,檔案剖析單元31可僅在由頻塊集中之頻塊覆蓋之區為矩形形狀才自檔案獲得以下各者中之至少一者:水平偏移語法元素(例如,horizontal_offset)及垂直偏移語法元素(例如,vertical_offset)。在此實例中,水平偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之水平偏移。垂直偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之垂直偏移。在此實例中,樣本群組描述方塊可包括包含頻塊集群組項之群組描述項。 如上文所述,TileSetGroupEntry方塊(如MPEG輸出文件N15297中所定義)包括independent_idc語法元素。然而,如上文所描述,頻塊區及頻塊集之頻塊相依性發信在存在層間相依性時在MPEG輸出文件N15297中並不起作用。因此,根據本發明之實例,為簡化頻塊區及頻塊集之概念,將語法元素independent_idc改變成具有以下值之旗標(例如,independent_flag):旗標之一個狀態指示「無時間相依性」。旗標之另一狀態指示「可存在或可不存在時間相依性」。 因此,在此實例中,檔案產生裝置34可在檔案中發信旗標(例如,independent_flag)。在此實例中,具有第一值之旗標指示無時間相依性,具有不同的第二值之旗標指示允許時間相依性。此外,在此實例中,檔案剖析單元31可自檔案獲得旗標且可基於語法元素而處理頻塊集。例如,當旗標指示不存在對頻塊集之時間相依性,視頻解碼器不需要另一層之VCL NAL單元來解碼頻塊集之VCL NAL單元。因此,基於指示不存在對頻塊集之時間相依性之檔案,檔案剖析單元31可提取並輸出頻塊集之VCL NAL單元而無需進一步判定頻塊集之VCL NAL單元相依於之層及VCL NAL單元。 在本發明之一些實例中,為解決與將子樣本中之檔案映射至上文所描述之頻塊區相關之問題,將用於子樣本中之頻塊之映射機制添加至NALUMapEntry方塊,而非映射至TileRegionGroupEntry方塊中。舉例而言,可將迴圈添加至NALUMapEntry方塊以發信關於NAL單元中之每一子樣本之groupID語法元素。因此,在此實例中,針對NAL單元中之不同子樣本可能與不同groupID相關聯,且針對NAL單元中之所有子樣本亦可能與相同groupID相關聯。 因此,在此實例中,檔案產生裝置34可在檔案中之NALUMapEntry中包括關於NAL單元中之每一各別子樣本之各別群組識別符語法元素(例如,groupID)。在此實例中,各別群組識別符語法元素可指示對應於各別子樣本之頻塊集項(例如,TileRegionGroupEntry方塊或TileSetGroupEntry方塊)。類似地,檔案剖析單元31可自檔案中之NALUMapEntry中獲得關於NAL單元中之每一各別子樣本之各別群組識別符語法元素(例如,groupID)。各別群組識別符語法元素可指示對應於各別子樣本之頻塊集項(例如,TileRegionGroupEntry方塊或TileSetGroupEntry方塊)。頻塊集項對應於頻塊集。檔案剖析單元31可處理頻塊集。例如,在圖2中,圖塊區段94之VCL NAL單元包括頻塊82之經編碼CTU、頻塊84及頻塊86之一些經編碼CTU。在此實例中,檔案中之NALUMapEntry可針對VCL NAL單元包括用於頻塊82、84及86中之每一者之各別群組識別符。因此,若所要輸出為頻塊82及84,則檔案剖析單元31可基於在NALUMapEntry中發信之groupID語法元素而判定VCL NAL單元包括用於頻塊82及頻塊84之經編碼CTU。因此,在此實例中,檔案剖析單元31可自檔案提取VCL NAL單元。檔案剖析單元31可將所提取VCL NAL單元輸出至視頻解碼器(諸如視頻解碼器30 (圖1))用於解碼。 此外,在ISO/IEC 14496-15中,NALUMapEntry方塊包括rle語法元素及NALU_start_number語法元素。在一些實例中,NALUMapEntry中之由語法元素rle及NALU_start_number實施之行程長度寫碼機制經移除以用於簡化且用於使其與ScalableNALUMapEntry及SubSampleInformationBox相一致。 根據用以解決上文關於將子樣本中之頻塊映射至頻塊區所描述之問題的本發明之實例,在TileRegionGroupEntry中,規定用以指示可將NAL單元中之多於一個子樣本(亦即,頻塊)映射至頻塊集的機制。在一些實例中,上述情形可藉由具有subsample_id語法元素迴圈(類似於新增至NALUMapEntry中之上文所提及迴圈)而進行。在其他實例中,指示將NAL單元中之一個以上子樣本映射至頻塊集可藉由其他手段(諸如具有32個位元)完成,針對該32個位元,每一位元表示NAL單元內之一個頻塊,其中設定為1之位元意指對應頻塊為頻塊集之部分,而設定為0之位元意指對應頻塊並非頻塊集之部分。舉例而言,值0100 0001 0000 0000 0000 0000 0000 0001可指示NAL單元中之第二、第八及第32頻塊在頻塊集中。 因此,在此實例中,檔案產生裝置34可在檔案中之視覺樣本群組項(例如,TileRegionGroupEntry方塊或TileSetGroupEntry方塊)中針對NAL單元中之每一各別子樣本包括具有複數個位元之子樣本識別符語法元素(例如,subsample_id)。在此實例中,複數個位元包括對應於NAL單元內之不同頻塊之位元。此外,在此實例中,對應於NAL單元中之頻塊之位元指示頻塊是否為頻塊集之部分。類似地,檔案剖析單元31可自檔案中之視覺樣本群組項針對NAL單元中之每一各別子樣本獲得具有複數個位元之子樣本識別符語法元素(例如,subsample_id)。複數個位元包括對應於NAL單元內之不同頻塊之位元且對應於NAL單元中之頻塊之位元指示頻塊是否為頻塊集之部分。檔案剖析單元31可處理頻塊集。例如,在圖2中,圖塊區段94之VCL NAL單元包括頻塊82之經編碼CTU、頻塊84及頻塊86之一些經編碼CTU。在此實例中,檔案中之NALUMapEntry可針對VCL NAL單元包括等於1100 0000 0000 0000 0000 0000 0000 0000之語法元素以指示VCL NAL單元中之前兩個頻塊(亦即,頻塊82及頻塊84)包括在頻塊集中。因此,若所要輸出為頻塊82及84,則檔案剖析單元31可基於在NALUMapEntry中發信之groupID語法元素而判定VCL NAL單元包括用於頻塊82及頻塊84之經編碼CTU。因此,在此實例中,檔案剖析單元31可自檔案提取VCL NAL單元。檔案剖析單元31可將所提取VCL NAL單元輸出至視頻解碼器(諸如視頻解碼器30 (圖1))用於解碼。 本發明之技術可解決關於頻塊區及頻塊集層間相依性之上文所描述之問題。舉例而言,在一個實例中,頻塊集具有層特定範疇,亦即,每一層具有其特有頻塊集發信。換言之,在此實例中,為頻塊集之部分之所有頻塊必須屬於同一層之圖像。因此,為頻塊集之部分之每一頻塊屬於同一層之圖像。例如,位元串流可具有兩個層:層0及層1。在此實例中,可針對層0發信第一TileSetGroupEntry且可針對層1發信第二TileSetGroupEntry。在此實例中,第一TileSetGroupEntry不提及層1中之頻塊,且第二TileSetGroupEntry不提及層0中之頻塊。 此外,在一些實例中,另外在頻塊集描述項(例如,TileSetGroupEntry、TileRegionGroupEntry方塊)中發信指示頻塊集所屬於之層之層ID的新語法元素。因此,在此實例中,檔案產生裝置34可在檔案之頻塊集描述項中發信指示頻塊集所屬於之層之層識別符之語法元素(例如,layerID)。例如,位元串流可包括層0及層1。在此實例中,語法元素可指示層0之層識別符以指示頻塊集屬於層0。類似地,檔案剖析單元31可自檔案之頻塊集描述項獲得指示頻塊集所屬於之層之層識別符的語法元素。在此實例中,檔案剖析單元31可基於語法元素處理頻塊集。例如,檔案剖析單元31可使用語法元素來判定頻塊集描述項對應於特定層,作為判定哪些VCL NAL單元包括所要頻塊集之經編碼區塊(例如,CTU)之部分。在此實例中,若由語法元素指示之層識別符指示特定層,則檔案剖析單元31可使用頻塊集描述項中之資訊來判定頻塊集描述項是否對應於所要頻塊群組。此外,若頻塊集描述項對應於所要頻塊群組,則檔案剖析單元31可提取指派至由頻塊集描述項規定之groupID之VCL NAL單元。 在一些實例中,覆蓋不同層中之相同區(亦即,並置區)之頻塊集具有相同頻塊集ID。舉例而言,圖5為說明覆蓋不同層中之相同區域之頻塊集的概念圖。在圖5之實例中,圖像130、132為第一層(L0)且圖像134、136在第二層(L1)中。此外,在圖5之實例中,圖像130、136在第一存取單元(T0)中且圖像132、134在第二存取單元(T1)中。圖像130、132、134、136中之每一者包括由較小正方形指示之九個頻塊。如上文所提及,根據本發明之實例,存在用於每一層之TileSetGroupEntry方塊(例如,用於L0之TileSetGroupEntry方塊及用於L1之單獨TileSetGroupEntry方塊)。用於L0之頻塊集中之頻塊及用於L1之頻塊集中之頻塊以陰影示出。因此,在圖5之實例中,用於L0之頻塊集中之頻塊與用於L1之頻塊集中之頻塊共置,用於L0之頻塊集之頻塊集ID與用於L1之頻塊集之頻塊集ID相同。 另外,在此實例中,檔案產生裝置34可在檔案之頻塊集群組項中發信或以其他方式包括描述與頻塊集所屬於之層之相依性的相依性資訊(例如,dependency_list,dependency_tile_count,dependencyTileGroupID)。另外,在此實例中,檔案剖析單元31可自檔案之頻塊集群組項內獲得描述與頻塊集所屬於之層之相依性的相依性資訊。在此實例中,檔案剖析單元31可基於語法元素及相依性資訊處理頻塊集。例如,檔案剖析單元31可使用當前頻塊集群組項中之相依性資訊來識別具有對應於依賴層(亦即,頻塊集所屬於之層相依於之層)之語法元素(例如,layerID語法元素)及具有規定與當前片框架腳架群組項之groupID相同之值之語法元素(例如,groupID語法元素)的頻塊集群組項。在此實例中,檔案剖析單元31可接著識別在依賴層中之每一者中含有頻塊群組之經寫碼區塊之VCL NAL單元。 此外,如在MPEG輸出文件N15297中所定義,TileRegionGroupEntry方塊中之independent_idc語法元素規定當前圖像與同一層中之參考圖像中之頻塊區與其他頻塊區之間的寫碼相依性。根據本發明之實例,針對TileSetGroupEntry方塊,相依性資訊(例如,基於語法元素independent_idc)描述頻塊集所屬於之層內之相依性。換言之,TileSetGroupEntry方塊可包括指示相依性資訊之一或多個語法元素。 在一些實例中,針對層間相依性資訊,使用在「oinf」及「linf」樣本群組中發信之層相依性。舉例而言,操作點之「oinf」樣本群組描述方塊可包括針對操作點之每一各別層指示操作點之哪些其他層(若存在)為各別層之參考層的語法元素。用於層之「linf」樣本群組描述方塊可包括指示層之參考層的語法元素。因此,在此實例中,檔案剖析單元31可替代地使用「oinf」及/或「linf」樣本群組來判定層相依性,而非指示頻塊集群組項中之層相依性(例如,使用dependency_list語法元素、dependency_tile_count語法元素及dependencyTileGroupID語法元素,如上文所描述)。 在用以解決上文關於頻塊區及頻塊集層間相依性所描述之問題之本發明之一些實例性技術中,頻塊區並未合併至頻塊集中。換言之,維持頻塊區及頻塊集之單獨概念。在此些實例中,以下可應用: a. 頻塊區經規定為層特定的。 b. 另外,在頻塊區描述項(亦即,TileRegionGroupEntry)中發信指示頻塊區所屬於之層之層ID之語法元素。 c. 覆蓋不同層中之相同區(亦即,並置區)之頻塊區可具有相同頻塊區ID。 d. 針對TileRegionGroupEntry,相依性資訊(例如,基於當前語法元素independent_idc)描述頻塊區所屬於之層內之相依性。 e. 針對層間相依性資訊,使用在「oinf」及「linf」樣本群組中發信之層相依性。 因此,在此實例中,檔案產生裝置34可在檔案之頻塊區群組項(例如,TileRegionGroupEntry方塊)中發信指示頻塊區所屬於之層之層識別符之語法元素(例如,layerID)。另外,在此實例中,檔案產生裝置34可在檔案之頻塊區群組項中發信描述與頻塊區所屬於之層之相依性的相依性資訊(例如,基於independent_idc語法元素)。同樣地,檔案剖析單元31可自檔案中之頻塊區描述項(例如,TileRegionGroupEntry方塊)獲得指示頻塊區所屬於之層之層識別符的語法元素(例如,layer ID)。另外,在此實例中,檔案剖析單元31可自檔案之頻塊區群組項內獲得描述與頻塊區所屬於之層之相依性的相依性資訊。檔案剖析單元31可基於語法元素及相依性資訊處理頻塊集。檔案剖析單元31可根據本發明中別處之對應之實例而處理頻塊集。 根據本發明之一些實例,「頻塊集」之定義被改變使得「頻塊集」意指在無需存在並非該集之部分之其他頻塊之情況下可解碼之一或多個完整HEVC頻塊之集,且頻塊可但非必需在解碼次序中為連續的。換言之,為頻塊集之部分之頻塊集為頻塊集內受約束之運動(未必在每一頻塊自身內)使得在無需參考並非頻塊集之部分之頻塊的情況下對頻塊進行寫碼。例如,視頻寫碼器可僅使用與用於運動預測之頻塊在時間上並置之參考圖像中之頻塊中之區塊。在此定義之情況下,現有資訊(諸如隨機存取群組方塊、同步群組方塊或NAL單元標頭資訊)可用於推斷對頻塊集之時間相依性。因此,在此實例中,未必在TileSetGroupEntry中發信此資訊。舉例而言,可能未必在TileSetGroupEntry中發信dependency_list語法元素、dependency_tile_count語法元素或dependencyTileGroupID語法元素。 根據本發明之技術,為解決上文關於圖像層級及上部層級非VCL NAL單元所描述之問題,提議除groupID 0外亦具有特殊groupID值以指示與所有頻塊區或頻塊級相關聯之NAL單元。例如,若NALUMapEntry方塊將等於0之groupID指派至NAL單元,則NAL單元不與任何群組相關聯。在此實例中,若NALUMapEntry方塊將等於1之groupID指派至NAL單元,則NAL單元為非VCL NAL單元,且處理經指派大於1之groupID之任何群組可能需要NAL單元。在其他實例中,處理其他群組可能需要經指派具有除1外之值的groupID之NAL單元。 因此,在此實例中,檔案產生裝置34可在檔案之NALUMapEntry中包括群組識別符語法元素(例如,groupID)。在此實例中,具有等於0之值的群組識別符語法元素指示NAL單元或子樣本並不與任何群組相關聯,且具有等於1之值之群組識別符語法元素指示NAL單元為處理具有大於1之群組識別符語法元素之任何群組可能需要之非VCL NAL單元,且具有大於1之值之群組識別符語法元素指示對應的頻塊集群組集項。類似地,檔案剖析單元31可自檔案之NALUMapEntry獲得群組識別符語法元素(例如,groupID)。具有等於0之值的群組識別符語法元素指示NAL單元或子樣本並不與任何群組相關聯,具有等於1之值之群組識別符語法元素指示NAL單元為處理具有大於1之群組識別符語法元素之任何群組可能需要之非VCL NAL單元,且具有大於1之值之群組識別符語法元素指示對應的頻塊集群組集項。在此實例中,檔案剖析單元31可處理頻塊集。例如,檔案剖析單元31可使用NALUMapEntry來識別經指派等於1之群組識別符之NAL單元連同經指派與所要頻塊集相關聯之群組識別符之NAL單元。此外,在此實例中,檔案剖析單元31可自檔案提取所識別NAL單元且輸出所提取NAL單元(例如,至視頻解碼器,諸如視頻解碼器30 (圖1))。 在各種實例中,裝置(諸如MANE)可處理(例如,基於各種語法元素)頻塊集。此處理可包含各種動作,諸如自檔案提取頻塊。此外,此處理可包含傳輸所提取頻塊(例如,至視頻解碼器,目的地裝置14,等)。舉例而言,可能期望僅傳輸圖像之頻塊集,但不傳輸圖像之剩餘頻塊。在僅對應於頻塊集之圖像之部分含有經更新內容之狀況下,或在其他情況中,錯誤校正可能期望上述情形。 圖6為說明可實施本發明中所描述之技術之實例性視頻編碼器20的方塊圖。視頻編碼器20表示經組態以產生可使用本發明中所描述之檔案格式技術儲存之視頻資料之視頻寫碼器之實例。視頻編碼器20可經組態以輸出單個視圖、多個視圖、可縮放、3D及其他類型之視頻資料。視頻編碼器20可經組態以將經寫碼視頻資料輸出至後處理實體200。後處理實體200意欲表示可能處理來自視頻編碼器20之經編碼視頻資料之視頻實體(諸如MANE或拼接/編輯裝置)之實例。在一些情況中,後處理實體200可為網路實體之實例。在一些視頻編碼系統中,後處理實體200及視頻編碼器20可為單獨裝置之部分,而在其他情況中,關於後處理實體200所描述之功能性可由包含視頻編碼器20之相同裝置執行。後處理實體200可為視頻裝置。在一些實例中,後處理實體200可與圖1之檔案產生裝置34相同。 根據本發明之技術,後處理實體200可產生用於儲存由視頻編碼器20產生之經寫碼視頻內容之檔案。後處理實體200可根據本發明之技術中之任一者產生檔案。 視頻編碼器20可在視頻圖塊內執行對視頻區塊之圖框內及圖框間編碼。圖框內-編碼依賴於空間預測以減少或移除給定視頻圖框或圖像內之視頻中之空間冗餘。圖框間編碼依賴於時間預測以減少或移除視頻序列之毗鄰圖框或圖像內之視頻中之時間冗餘。圖框內模式(I模式)可係指數個基於空間之壓縮模式中之任一者。圖框間模式(例如,單向預測(P模式)或雙向預測(B模式))可係指數個基於時間之壓縮模式中之任一者。 在圖6之實例中,視頻編碼器20包括分割單元202、預測處理單元204、濾波器單元206、參考圖像記憶體208、求和器210、變換處理單元212、量化單元214及熵編碼單元216。預測處理單元204包括運動估計單元218、運動補償單元220及圖框內預測處理單元222。為了視頻區塊重建構,視頻編碼器20亦包括反量化單元224、反變換處理單元226及求和器228。濾波器單元206意欲表示一或多個環路濾波器,諸如,解塊濾波器、自適應環路濾波器(ALF),及/或樣本自適應偏移(SAO)濾波器。儘管濾波器單元206在圖6中經展示為環路內濾波器,但在其他組態中,濾波器單元206可實施為後環路濾波器。 視頻編碼器20之視頻資料記憶體230可儲存待由視頻編碼器20之組件編碼之視頻資料。例如,可自視頻源18獲得儲存在視頻資料記憶體230中之視頻資料。參考圖像記憶體208可為儲存參考視頻資料供用於由視頻編碼器20 (例如以圖框內或圖框間寫碼模式)編碼視頻資料之參考圖像記憶體。視頻資料記憶體230及參考圖像記憶體208可由各種記憶體裝置中之任一者形成,諸如,動態隨機存取記憶體(DRAM),包括同步DRAM (SDRAM)、磁阻式RAM (MRAM)、電阻式RAM (RRAM)或其他類型之記憶體裝置。視頻資料記憶體230及參考圖像記憶體208可由相同記憶體裝置或單獨記憶體裝置提供。在各種實例中,視頻資料記憶體230可與視頻編碼器20之其他組件在晶片上,或相對於彼等組件在晶片外。 如圖6中所展示,視頻編碼器20接收視頻資料,且分割單元202將資料分割成視頻區塊。此分割亦可包括分割成圖塊或其他較大單元,以及視頻區塊分割,例如根據LCU及CU之四元樹結構。視頻編碼器20通常說明待編碼之視頻圖塊內之編碼視頻區塊之的組件。圖塊可被劃分成多個視頻區塊。預測處理單元204可基於誤差結果(例如,寫碼速率及失真水平)針對當前視頻區塊選擇複數個可能寫碼模式中之一者,諸如複數個圖框內寫碼模式中之一者或複數個圖框間寫碼模式中之一者。預測處理單元204可將所得圖框內或圖框間經寫碼區塊提供至加法器210以產生殘餘區塊資料及加法器228以重建構經編碼區塊供用作參考圖像。 預測處理單元204內之圖框內預測處理單元222可相對於與待寫碼之當前塊相同之圖框或圖塊中之一或多個相鄰區塊執行當前視頻區塊之圖框內預測寫碼以提供空間壓縮。預測處理單元204內之運動估計單元218及運動補償單元220相對於一或多個參考圖像中之一或多個預測性區塊執行對當前視頻區塊之圖框間預測寫碼以提供時間壓縮。 運動估計單元218可經組態以根據視頻序列之預定圖案而判定視頻圖塊之圖框間預測模式。預定圖案可將序列中之視頻圖塊指定為P圖塊、B圖塊或GPB圖塊。運動估計單元218及運動補償單元220可高度整合,但出於概念目的予以單獨說明。由運動估計單元218執行之運動估計為產生運動向量之程序,該等運動向量估計視頻區塊之運動。舉例而言,運動向量可指示當前視頻圖框或圖像內之視頻區塊之PU相對於參考圖像內之預測性區塊的位移。 預測性區塊為經發現在像素差方面接近匹配待寫碼之視頻區塊之PU的區塊,該像素差可藉由以下各項來確定:絕對差值和(SAD)、平方差值和(SSD)或其他差值度量。在一些實例中,視頻編碼器20可計算儲存在參考圖像記憶體208中之參考圖像之分段整數(sub-integer)像素位置之值。例如,視頻編碼器20可內插參考圖像的四分之一像素位置、八分之一像素位置或其他分數像素位置的值。因此,運動估計單元218可相對於全像素位置及分數像素位置執行運動搜尋且輸出具有分數像素精度之運動向量。 運動估計單元218藉由將圖框間寫碼圖塊中之視頻區塊之PU的位置與參考圖像之預測性區塊的位置進行比較來計算該PU之運動向量。參考圖像可選自第一參考圖像清單(清單0)或第二參考圖像清單(清單1),該清單中之每一者識別儲存在參考圖像記憶體208中之一或多個參考圖像。運動估計單元218將可自其判定所計算運動向量的語法元素發送至熵編碼單元216及運動補償單元220。 由運動補償單元220執行之運動補償可涉及:基於由運動估計判定之運動向量而提取或產生預測性區塊,可能對子像素精度執行插值。在接收到關於當前視頻區塊之PU之運動向量時,運動補償單元220可將運動向量指向之預測性區塊定位於參考圖像清單中之一者中。視頻編碼器20可藉由將預測性區塊之像素值自所寫碼之當前視頻區塊之像素值減去從而形成像素差值來形成殘餘視頻區塊。像素差值形成區塊之殘餘資料,且可包括明度及色度差分量兩者。加法器210表示執行此減法運算之(多個)組件。運動補償單元220亦可產生與在解碼視頻圖塊之視頻區塊中供視頻解碼器30使用之視頻區塊及視頻圖塊相關聯之語法元素。 圖框內預測處理單元222可圖框內預測當前區塊,作為由運動估計單元218及運動補償單元220執行之圖框間預測之替代方案,如上文所描述。例如,圖框內預測處理單元222可判定圖框內預測模式以用於對當前區塊進行編碼。在一些實例中,圖框內預測處理單元222可(例如)在單獨編碼步驟期間使用各種圖框內預測模式來對當前區塊進行編碼,且圖框內預測處理單元222可自所測試模式選擇適當圖框內預測模式來使用。舉例而言,圖框內預測處理單元222可針對各種所測試圖框內預測模式使用速率失真分析來計算速率失真值,且在所測試模式中可選擇具有最佳速率失真特性之圖框內預測模式。速率失真分析通常判定經編碼區塊與原始未經編碼區塊(其經編碼以產生經編碼區塊)之間的失真(或錯誤)量,以及用於產生經編碼區塊之位元率(即,位元之數目)。圖框內預測處理單元222可依據各種經編碼區塊之失真及速率來計算比率以判定哪一圖框內預測模式展現區塊之最佳速率失真值。 在任何狀況下,在針對區塊選擇圖框內預測模式之後,圖框內預測處理單元222可將指示區塊之所選擇圖框內預測模式之資訊提供至熵編碼單元216。熵編碼單元216可根據本發明之技術對指示所選擇圖框內預測模式之資訊進行編碼。視頻編碼器20可在所傳輸位元串流組態資料(其可包括複數個圖框內預測模式索引表及複數個經修改圖框內預測模式索引表(亦被稱作碼字映射表))中包括用於各種區塊之編碼上下文之定義,及用於該等上下文中之每一者之最可能圖框內預測模式、圖框內預測模式索引表及經修改圖框內預測模式索引表之指示。 在預測處理單元204經由圖框間預測或圖框內預測產生關於當前視頻區塊之預測性區塊之後,視頻編碼器20可藉由將預測性區塊自當前視頻區塊減去來形成殘餘視頻區塊。殘餘區塊中之殘餘視頻資料可被包括在一或多個TU中且應用於變換處理單元212。變換處理單元212使用變換(諸如,離散餘弦變換(DCT)或概念上類似變換)將殘餘視頻資料變換成殘餘變換係數。變換處理單元212可將來自像素域之殘餘視頻資料轉換成變換域,諸如,頻域。 變換處理單元212可將所得變換係數發送到量化單元214。量化單元214將變換係數量化以進一步減小位元率。量化過程可減小與係數中之一些或全部相關聯之位元深度。量化程度可藉由調整量化參數來修改。在一些實例中,量化單元214可接著對包括經量化變換係數之矩陣執行掃描。替代地,熵編碼單元216可執行掃描。 在量化之後,熵編碼單元216對表示經量化變換係數之語法元素進行熵編碼。舉例而言,熵編碼單元216可執行上下文自適應可變長度寫碼(CAVLC)、上下文自適應二進位算法寫碼(CABAC)、基於語法的上下文自適應二進位算法寫碼(SBAC)、概率區間分割熵(PIPE)寫碼或另一熵編碼方法或技術。在由熵編碼單元216進行之熵編碼之後,可將經編碼位元串流傳輸視頻解碼器30或封存以供稍後由視頻解碼器30進行傳輸或擷取。熵編碼單元216亦可對用於正寫碼之當前視頻圖塊之運動向量及其他語法元素進行熵編碼。 反量化單元224及反變換處理單元226分別應用反量化及反變換以重建構像素域中之殘餘區塊以供稍後用作參考圖像之參考區塊。運動補償單元220可藉由將殘餘區塊添加至參考圖像清單中之一者內之參考圖像中之一者之預測性區塊來計算參考區塊。運動補償單元220亦可將一或多個內插濾波器器應用於經重建構殘餘區塊以計算供用於運動估計之分段整數像素值。加法器228可將經重建構的殘餘區塊加入至由運動補償單元220產生之運動補償預測性區塊以產生參考區塊以儲存在參考圖像記憶體208中。參考區塊可由運動估計單元218及運動補償單元220用作參考區塊以對隨後視頻圖框或圖片中之區塊進行圖框間預測。 在一些實例中,後處理實體200產生用於儲存視頻內容(諸如由視頻編碼器20產生之位元串流)之檔案。例如,後處理實體200可接收位元串流,該位元串流包括形成視頻資料之經編碼圖像之表示的位元序列。在此實例中,視頻資料之圖像包括當前圖像,該當前圖像經分割成複數個頻塊,且該複數個頻塊中之每一各別頻塊為各別矩形區。此外,在此實例中,後處理實體200可產生檔案中之NAL單元映射項方塊(例如,NALUMapEntry)。NAL單元映射項方塊使位元串流之NAL單元與頻塊集相關聯。在此實例中,頻塊集可包括當前圖像經分割成之複數個頻塊中之兩個或多於兩個頻塊。在一些情況中,由頻塊集中之頻塊覆蓋之當前圖像之區的形狀並非矩形。此外,在此實例中,後處理實體200產生檔案中之頻塊集群組項。該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素。此外,在此實例中,該頻塊集項方塊包括水平偏移語法元素、垂直偏移語法元素、寬度語法元素及高度語法元素。水平偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之水平偏移。垂直偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之垂直偏移。寬度語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之寬度。高度語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之高度。 圖7為說明可實施本發明中所描述之技術之實例性視頻解碼器30的方塊圖。圖7之視頻解碼器30表示經組態以解碼可使用本發明中所描述之檔案格式技術儲存之視頻資料之視頻記錄器之實例。 視頻解碼器30可經組態以解碼單個視圖、多個視圖、可縮放、3D及其他類型之視頻資料。在圖7之實例中,視頻解碼器30包括熵解碼單元250、預測處理單元252、反量化單元254、反變換處理單元256、求和器258、濾波器單元260及參考圖像記憶體262。預測處理單元252包括運動補償單元264及圖框內預測處理單元266。視頻解碼器30可在一些實例中,執行通常與自圖6關於視頻編碼器20所描述之編碼步驟互逆之解碼步驟。 經寫碼圖像緩衝器(CPB) 268可接收並儲存位元串流之經寫碼視頻資料(例如,NAL單元)。可經由視頻資料之有線或無線網路通信或藉由存取實體資料儲存媒體(例如)自圖1之鏈路16 (例如,自本端視頻源(諸如相機))獲得儲存在CPB 268中之視頻資料。CPB 268可形成儲存來自經編碼視頻位元串流之經編碼視頻資料之視頻資料記憶體。參考圖像記憶體262可為儲存參考視頻資料供用於由視頻編碼器30(例如以圖框內或圖框間寫碼模式)解碼視頻資料之參考圖像記憶體。CPB 268及參考圖像記憶體262可由各種記憶體裝置中之任一者形成,諸如動態隨機存取記憶體(DRAM),包括同步DRAM (SDRAM)、磁阻式RAM (MRAM)、電阻式RAM (RRAM)或其他類型之記憶體裝置。CPB 268及參考圖像記憶體262可由相同記憶體裝置或單獨記憶體裝置提供。在各種實例中,CPB 268可與視頻解碼器30之其他組件在晶片上,或相對於彼等組件在晶片外。 在解碼程序期間,視頻解碼器30自視頻編碼器20接收表示經編碼視頻圖塊之視頻區塊之經編碼視頻位元串流及相關聯語法元素。在圖7之實例中,視頻解碼器30可自檔案剖析單元270接收經編碼視頻位元串流,該檔案剖析單元剖析檔案以提取經寫碼視頻位元串流。在一些實例中,檔案剖析單元270可接收來自網路實體272之檔案。網路實體272可(例如)為伺服器、MANE、視頻編輯器/拼接器或經組態以實施上文所描述之技術中之一或多者之其他此類裝置。網路實體272可或可不包括視頻編碼器,諸如視頻編碼器20。本發明中所描述之技術中之一些可在網路實體272將經編碼視頻位元串流傳輸至視頻解碼器30之前由網路實體272實施。在一些視頻解碼系統中,網路實體272及視頻解碼器30可為單獨裝置之部分,而在其他情況中,關於網路實體272所描述之功能性可由包含視頻解碼器30之相同裝置執行。網路實體272可被視為視頻裝置。此外,在一些實例中,網路實體272為圖1之檔案產生裝置34。檔案剖析單元270可實施為目的地裝置14之部分或與目的地裝置分離之裝置。在一些實例中,網路實體272及檔案剖析單元270係由同一裝置實施。 在圖7之實例中,檔案剖析單元270可獲得檔案中之NAL單元映射項方塊。在此實例中,NAL單元映射項方塊使位元串流之NAL單元與頻塊集相關聯。位元串流包括形成視頻資料之經編碼圖像之表示的位元序列。在此實例中,視頻資料之圖像包括當前圖像,該當前圖像經分割成複數個頻塊,且該複數個頻塊中之每一各別頻塊為各別矩形區。此外,在此實例中,頻塊集包括當前圖像經分割成之複數個頻塊中之兩個或多於兩個頻塊。在一些情況中,由頻塊集中之頻塊覆蓋之當前圖像之一區的形狀可能並非矩形。在此實例中,檔案剖析單元270可獲得檔案中之頻塊集群組項(例如,TileSetGroupEntry、TileRegionGroupEntry)。頻塊集群組項包括識別該頻塊集之一群組識別符語法元素。此外,頻塊集群組項包括水平偏移語法元素、垂直偏移語法元素、寬度語法元素及高度語法元素。水平偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之水平偏移。垂直偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之垂直偏移。寬度語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之寬度。高度語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之高度。此外,在此實例中,檔案剖析單元270可基於水平偏移語法元素、垂直偏移語法元素、寬度語法元素,及高度語法元素而處理頻塊集。例如,檔案剖析單元270可使用水平偏移語法元素、垂直偏移語法元素、寬度語法元素及高度語法元素來判定對應於頻塊集群組項之頻塊集是否為所要頻塊集。此外,在此實例中,若對應於頻塊集群組項之頻塊集為所要頻塊集,則檔案剖析單元270可使用NAL單元映射項方塊來識別與所要頻塊集相關聯之位元串流之NAL單元。檔案剖析單元270可將所識別NAL單元轉發至視頻解碼器30以進行解碼。所要頻塊集可由在檔案剖析單元270外部之來源規定,檔案剖析單元270可基於解碼視頻資料之裝置(例如,目的地裝置14)之資料而判定所要頻塊集,檔案剖析單元270可基於其他因素(諸如頻寬)來判定所要頻塊集,及/或檔案剖析單元270可以其他方式判定所要頻塊集。 視頻解碼器30之熵解碼單元250對位元串流之特定語法元素進行熵解碼以產生量化係數、運動向量及其他語法元素。熵解碼單元250將運動向量及其他語法元素轉發至預測處理單元252。視頻解碼器30可接收視頻圖塊等級及/或視頻區塊等級之語法元素。 在視頻圖塊被寫碼為圖框內寫碼(I)圖塊時,預測處理單元252之圖框內預測處理單元266可基於來自當前圖框或圖像之先前經解碼區塊之所發信圖框內預測模式及資料來產生關於當前視頻圖塊之視頻區塊的預測資料。當視頻圖框被寫碼為圖框間寫碼(亦即,B或P)圖塊時,預測處理單元252之運動補償單元264基於自熵解碼單元250接收之運動向量及其他語法元素來產生當前視頻圖塊之視頻區塊之預測性區塊。可由參考圖像清單內之參考圖像中之一者產生預測性區塊。視頻解碼器30可基於參考圖像記憶體262中所儲存之參考圖像來使用預設構造技術構造參考圖框清單(清單0及清單1)。 運動補償單元264藉由判定運動向量及獲得其他語法元素來判定當前視頻圖塊之視頻區塊之預測資訊,且使用預測資訊來產生所解碼之當前視頻區塊之預測性區塊。舉例而言,運動補償單元264使用所接收之語法元素中之一些來判定用於對視頻圖塊之視頻區塊進行寫碼之預測模式(例如,圖框內或圖框間預測)、在圖框間預測之狀況下之圖框間預測圖塊類型(例如,B圖塊或P圖塊)、關於圖塊之參考圖像清單中之一或多者之構造資訊、關於圖塊之每一圖框間編碼視頻區塊之運動向量、關於圖塊之每一圖框間寫碼視頻區塊之圖框間預測狀態及用以對當前視頻圖塊中之視頻區塊進行解碼的其他資訊。 運動補償單元264亦可基於內插濾波器執行內插。運動補償單元264可使用如在對視頻區塊進行編碼期間由視頻編碼器20所使用之內插濾波器來計算參考區塊之分段整數像素的內插值。在此狀況下,運動補償單元264可依據所接收語法元素來判定由視頻編碼器20所使用之內插濾波器且使用內插濾波器來產生預測性區塊。 反量化單元254使在位元串流中提供且由熵解碼單元250解碼之經量化變換係數反量化,亦即,解-量化。反量化程序可包括使用視頻圖塊中之每一視頻區塊之由視頻編碼器20計算之量化參數來判定量化之程度及同樣地應該應用之反量化之程度。反變換單元256將反變換(例如,反DCT、反整數變換或概念上類似反變換過程)應用於變換係數以便在像素域中產生殘差區塊。 在運動補償單元264基於運動向量及其他語法元素來產生當前視頻區塊之預測性區塊之後,視頻解碼器30藉由對來自反變換處理單元256之殘餘區塊與由運動補償單元264產生之對應預測性區塊求和來形成經解碼之視頻區塊。加法器258表示執行此加法運算之(多個)組件。若期望,則亦可使用環路濾波器(在寫碼環路中或在寫碼環路之後)來平滑像素過渡,或以其他方式改進視頻品質。濾波器單元260意欲表示一或多個環路濾波器,諸如,解塊濾波器、自適應環路濾波器(ALF),及/或樣本自適應偏移(SAO)濾波器。儘管濾波器單元260在圖7中經展示為環路內濾波器,但在其他組態中,濾波器單元260可實施為後環路濾波器。接著將給定圖框或圖像中之經解碼視頻區塊儲存在參考圖像記憶體262中,該參考圖像記憶體儲存用於後續運動補償之參考圖像。參考圖像記憶體262亦儲存用於稍後在顯示裝置(例如,圖1之顯示裝置32)上呈現之經解碼視頻資料。因此,參考圖像記憶體262可為經組態以儲存視頻資料之一或多個資料儲存媒體之實例。 在此章節提供在本發明中別處所描述之本發明之技術之實例性細節之論述。如上文所述,「<insert>」與「</insert>」符號之間的文字對應於新增或經修改之現有文字(例如,<insert>新增文字</insert>),而經移除之文字在「<delete>」與「</delete>」符號之間(例如,<delete>經刪除文字</delete>)。 如上文所指示,根據本發明之實例,提議將頻塊區概念合併至頻塊集概念。以下文字描述此實例之實施細節。特定而言,在與TileRegionGroupEntry方塊合併之後的TileSetGroupEntry方塊之語法及語意可如下定義: class TileSetGroupEntry() extends VisualSampleGroupEntry ('tsif') { unsigned int(16) groupID;<insert>
unsigned int(6) layerID; int (2) reserved; unsigned int(1) rectangular_flag; unsigned int(2) independent_idc; unsigned int(1) filtering_disabled; int (3) reserved; unsigned int(16) horizontal_offset; unsigned int(16) vertical_offset; unsigned int(16) region_width; unsigned int(16) region_height;</insert><delete>
int(2) dependency_list; int (5) reserved; if ((dependency_list==1) || (dependency_list==3)) { unsigned int(16) dependency_tile_count; for (i=1; i<= dependency_tile_count; i++){ unsigned int(16) dependencyTileGroupID; } if (dependency_list==3) { unsigned int(16) irap_dependency_tile_count; for (i=1; i<= irap_dependency_tile_count; i++){ unsigned int(16) irap_dependencyTileGroupID; } } else if (dependency_list==2) { unsigned int(16) topLeftDependencyTileGroupId; unsigned int(16) bottomRightDependencyTileGroupId; }</delete>
} groupID為頻塊集之識別符。值0經保留供專用於「nalm」方塊。 <insert>layerID為頻塊集單元所屬於之層之識別符。 rectangular_flag指示由頻塊集中之頻塊覆蓋之區域是否為矩形形狀。 independent_idc規定此頻塊集與當前圖像中及同一層之參考圖像中之其他頻塊集之間的寫碼相依性。層間相依性(若存在)由「linf」及/或「oinf」樣本群組指示。若gidA等於gidB且lidB為lidA之參考層(如由「linf」及/或「oinf」樣本群組指示),則具有groupID gidA及layerID lidA之頻塊集具有對具有groupID gidB及layerID lidB之另一頻塊集之層間相依性。 independent_idc之值如下: - 若independent_idc等於0,此頻塊集與相同圖像或先前圖像中之其他頻塊之間的寫碼相依性係未知的。 - 若independent_idc等於1,則在此頻塊集與任何參考圖像中之具有不同groupID之其他頻塊集之間不存在時間相依性,但可在同一頻塊集內之不同圖像之頻塊之間存在時間寫碼相依性。 - 若independent_idc等於2,則此頻塊集中之頻塊與參考圖像中之任何其他頻塊之間不存在任何時間相依性。 - 保留值3。</insert> filtering_disabled在經設定時指示此頻塊區上無任何解碼後篩選操作需要存取毗鄰於此頻塊區之像素,亦即,頻塊區之位元準確重建構係可能的而無需解碼毗鄰之頻塊。 <insert>horizontal_offset規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素在基本區(其為整個圖像)之亮度樣本相對於圖像之左上方像素之水平偏移。 vertical_offset規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素在基本區之亮度樣本相對於圖像之左上方像素之垂直偏移。 region_width規定基本區之亮度樣本中覆蓋頻塊集中之頻塊之最小矩形區之寬度。 region_height規定基本區之亮度樣本中覆蓋頻塊集中之頻塊之最小矩形區之高度。</insert> 因此,在上文之實例性文字中,頻塊集具有層特定範疇。此外,作為產生頻塊集群組項(例如,TileSetGroupEntry)之部分,檔案產生裝置34可在頻塊集群組項中包括描述頻塊集所屬於之層內之相依性之相依性資訊(例如,independent_idc)。例如,檔案產生裝置34可在頻塊集群組項中包括規定頻塊集與當前圖像中及頻塊集所屬於之層之參考圖像中之其他頻塊集之間的寫碼相依性的特定語法元素(例如,independent_idc)。在此實例中,檔案產生裝置34可在檔案中之層資訊樣本群組(例如「linf」樣本群組)或檔案中之操作點資訊樣本群組(例如「oinf」樣本群組)中指示層相依性。在一些實例中,特定語法元素為旗標(例如,independent_flag)。在此等實例中,旗標具有恰好兩個狀態,旗標之第一狀態指示無時間相依性,旗標之第二狀態指示可存在或可不存在時間相依性。類似地,在一些實例中,檔案剖析單元31可自頻塊集群組項內獲得規定頻塊集與當前圖像中及頻塊集所屬於之層之參考圖像中之其他頻塊集之間的寫碼相依性的特定語法元素。另外,在此實例中,檔案剖析單元31可基於檔案中之層資訊樣本群組或檔案中之操作點資訊樣本群組而判定層間相依性。在此實例中,檔案剖析單元31可基於水平偏移語法元素、垂直偏移語法元素、寬度語法元素,高度語法元素及層間相依性而藉由處理頻塊集來處理頻塊集。 當由頻塊集中之頻塊覆蓋之區不具有矩形形狀時,藉由horizontal_offset、vertical_offset、region_width及region_height描述最小矩形區域,如圖4之實例中所展示。此外,與上文致使覆蓋不同層中之並置區之頻塊集具有相同頻塊集ID且可在「oinf」及「linf」樣本群組中發信層相依性之實例一致,如上文之文字中所闡明之independent_idc語法元素之語意包括: 層間相依性(若存在)由「linf」及/或「oinf」樣本群組指示。若gidA等於gidB且lidB為lidA之參考層(如由「linf」及/或「oinf」樣本群組指示),則具有groupID gidA及layerID lidA之頻塊集具有對具有groupID gidB及layerID lidB之另一頻塊集之層間相依性。 在一些實例中,在上文所提出之修改之後,independent_idc語法元素之僅兩個值具有有意義用途;該兩個值為:具有等於1或2之值之independent_idc語法元素。換言之,具有等於0之值之independent_idc語法元素之值不具有任何有意義用途。因此,independent_idc語法元素可簡化為旗標而非指示符。因此,independent_idc語法元素可由1位元組成,與兩個位元不同。旗標之兩個狀態可規定為「無時間相依性」及「可具有或可不具有時間相依性」。檔案編排器(例如,檔案產生裝置34)可始終能夠使用後者作為選項,藉此實現由具有在上述語意中定義之值0之independent_idc語法元素實現之意義。 在另一實例中,在與TileRegionGroupEntry方塊合併之後的TileSetGroupEntry方塊之語法及語意可如下定義: class TileSetGroupEntry() extends VisualSampleGroupEntry ('tsif') { unsigned int(16) groupID;<insert>
unsigned int(6) layerID; int (2) reserved; int(2) dependency_list; unsigned int(1) rectangular_flag; unsigned int(2) independent_idc; unsigned int(1) filtering_disabled; int (1) reserved; if (rectangular_flag == 1) { unsigned int(16) horizontal_offset; unsigned int(16) vertical_offset; unsigned int(16) region_width; unsigned int(16) region_height; }</insert> <delete>
int(2) dependency_list; int (5) reserved; if ((dependency_list==1) || (dependency_list==3)) { unsigned int(16) dependency_tile_count; for (i=1; i<= dependency_tile_count; i++){ unsigned int(16) dependencyTileGroupID; } if (dependency_list==3) { unsigned int(16) irap_dependency_tile_count; for (i=1; i<= irap_dependency_tile_count; i++){ unsigned int(16) irap_dependencyTileGroupID; } } else if (dependency_list==2) { unsigned int(16) topLeftDependencyTileGroupId; unsigned int(16) bottomRightDependencyTileGroupId; }</delete>
} 上文所展示之TileSetGroupEntry方塊之兩個實例性經修改語法不同之處在於TileSetGroupEntry方塊之第二經修改語法包括「rectangular_flag」語法元素且僅在「rectangular_flag」語法元素等於1之情況下包括「horizontal_offset」、「vertical_offset」、「region_width」及「region_height」語法元素。「rectangular_flag」語法元素指示對應於TileSetGroupEntry方塊之頻塊集是否為矩形。上述情形與上文關於僅在由頻塊集中之頻塊覆蓋之區為矩形形狀之情況下才發信水平偏移、垂直偏移、寬度及高度的資訊之實例一致。 如上文所論述,本發明之特定實例將子樣本中之頻塊之映射機制添加至NALUMapEntry而非TileRegionGroupEntry。以下文字提供根據此等實例提供額外實例性細節。 class NALUMapEntry() extends VisualSampleGroupEntry ('nalm') { unsigned int(6) reserved = 0; unsigned int(1) large_size;<insert>
unsigned int(1) nalu_flag;</insert> <delete>
unsigned int(1) rle;</delete>
if (large_size) { unsigned int(16) entry_count; } else { unsigned int(8) entry_count; }<delete>
for (i=1; i<= entry_count; i++) {</delete> <insert>
for (i=0; i < entry_count; i++) {</insert> <delete>
if (rle) { if (large_size) { unsigned int(16) NALU_start_number; } else { unsigned int(8) NALU_start_number; } }</delete> <insert>
for (j=0; j < subsample_count; j++) {</insert>
unsigned int(16) groupID;<insert>
}</insert>
} } large_size指示音軌樣本中之NAL單元項之數目係以8位元抑或16位元表示。 <insert>nalu_flag指示是否將每一NAL單元映射至至多一個頻塊集。當nalu_flag等於1時,subsample_count之值經設定為1,否則,subsample_count之值經設定等於在flags等同於2之情況下SubSampleInformationBox中之對應的subsample_count值(基於頻塊之子樣本)。</insert> <delete>rle指示是(1)否(0)使用行程長度編碼來將groupID指派至NAL單元。</delete> entry_count規定映射中之項之數目。<delete>應注意,當rle等於1時,entry_count對應於連續NAL單元與相同群組相關聯之行程之數目。當rle等於0時,entry_count表示NAL單元之總數目。 NALU_start_number為與groupID相關聯之當前行程中之第一NALU之樣本中之基於1之NALU索引。</delete> groupID指示對應的<delete>可縮放、多視圖</delete>頻塊區或頻塊集<delete>群組</delete>項,如樣本群組描述中所指示。若為0,無任何群組與此等所識別NALU相關聯。 此外,如上文所述,在本發明之一些實例中,將NALUMapEntry方塊中之行程長度編碼機制移除。將行程長度編碼機制自NALUMapEntry方塊移除對應於上文所展示之經修正NALUMapEntry方塊中以下內容: <delete>rle指示是(1)否(0)使用行程長度編碼來將groupID指派至NAL單元。</delete> entry_count規定映射中之項之數目。<delete>應注意,當rle等於1時,entry_count對應於連續NAL單元與相同群組相關聯之行程之數目。當rle等於0時,entry_count表示NAL單元之總數目。 NALU_start_number為與groupID相關聯之當前行程中之第一NALU之樣本中之基於1之NALU索引。</delete> … <delete>for (i=1; i < entry_count; i++) {</delete> … <delete>if (rle) { if (large_size) { unsigned int(16) NALU_start_number; } else { unsigned int(8) NALU_start_number; } }</delete> NALUMapEntry之以下語法及語意展示用以實施本發明中別處所描述之各種實例之ISO/IEC 14496-15之改變的實例。 class NALUMapEntry() extends VisualSampleGroupEntry ('nalm') { unsigned int(6) reserved = 0; unsigned int(1) large_size;<insert>
unsigned int(1) nalu_flag;</insert> <delete>
unsigned int(1) rle;</delete>
if (large_size) { unsigned int(16) entry_count; } else { unsigned int(8) entry_count; }<insert>
if (nalu_flag = 1) {</insert> <delete>
for (i=1; i < entry_count; i++) {</delete>
<insert>for (i=0; i < entry_count; i++) {</insert><delete>
if (rle) { if (large_size) { unsigned int(16) NALU_start_number; } else { unsigned int(8) NALU_start_number; } }</delete>
unsigned int(16) groupID; }<insert>
} else { for (i=0; i < entry_count; i++) { unsigned int(16) subsample_count; for (j = 0; j < subsample_count; j++) { unsigned int(16) groupID; if (groupID > 1) { unsigned int(16) subsample_idx; } } } }</insert>
} large_size指示音軌樣本中之NAL單元項之數目係以8位元抑或16位元表示。 <insert>nalu_flag指示是否將每一NAL單元映射至至多一個頻塊區或頻塊集。當nalu_flag等於1時,將每一NAL單元映射至至多一個頻塊區或頻塊集。當nalu_flag等於0時,可將每一NAL單元映射至多於一個頻塊區或頻塊集。</insert> <delete>rle指示是(1)否(0)使用行程長度編碼來將groupID指派至NAL單元。</delete> entry_count規定映射中之項之數目。<delete>應注意,當rle等於1時,entry_count對應於連續NAL單元與相同群組相關聯之行程之數目。當rle等於0時,entry_count表示NAL單元之總數目。 NALU_start_number為與groupID相關聯之當前行程中之第一NALU之樣本中之基於1之NALU索引。</delete> <insert>subsample_count規定NAL單元中存在之子樣本之數目。</insert> 大於1之groupID指示對應的<delete>可縮放、多視圖</delete>頻塊區或頻塊集群組項,如樣本群組描述中所指示。若為0,<insert>NAL單元或子樣本並不與任何群組相關聯</insert> <delete>無任何群組與此等經修改NALU相關聯</delete><insert>;另外,若為1,則NAL單元為非VCL NAL單元且可被需要用於處理具有大於1之groupID之任何群組。 subsample_idx將基於0之索引規定至映射樣本中之子樣本,如SubSampleInformationBox中所指示。</insert> 如上文所述,在本發明之一些實例中,可將迴圈添加至NALUMapEntry方塊以發信關於NAL單元中之每一子樣本之groupID語法元素。此迴圈對應於上文所展示之經修正NALUMapEntry方塊中之以下迴圈: for (j = 0; j < subsample_count; j++) { unsigned int(16) groupID; if (groupID > 1) { unsigned int(16) subsample_idx; } } 此外,如上文所述,在本發明之一些實例中,特殊groupID值指示與所有頻塊區或頻塊集相關聯之NAL單元。亦即,當nalu_flag等於1時,NALUMapEntry方塊可包括一系列groupID語法元素。該系列groupID語法元素中之每一各別groupID語法元素對應於各別NAL單元且指示對應NAL單元之群組識別符。在上文之實例性文字中,等於1之groupID語法元素指示對應之NAL單元為非VCL NAL單元且可被需要用於處理具有大於1之groupID之任何群組,且因此與所有頻塊集相關聯。此特殊groupID之使用可解決ISO/IEC 14496-15中關於如何將groupID值指派至非VCL NAL單元之問題。在上述之文字中,groupID語法元素之語意經更正以規定經指派1之groupID之NAL單元為非VCL NAL單元。在其他實例中,除1外之值可用於指示非VCL NAL單元。 圖8為根據本發明之一或多個技術說明檔案300之實例性結構的概念圖。在圖8之實例中,檔案300包括電影方塊302及複數個媒體資料方塊304。儘管在圖8之實例中經說明為在相同檔案中,但在其他實例中,電影方塊302及媒體資料方塊304可在單獨檔案中。如上文所指示,方塊可為由唯一類型識別符及長度定義之物件導向建構區塊。例如,方塊可為ISOBMFF中之基礎語法結構,包括四字元寫碼方塊類型、方塊之位元組計數及有效負載。 電影方塊302可含有關於檔案300之音軌之後設資料。檔案300之每一音軌可包含媒體資料之連續串流。媒體資料方塊304中之每一者可包括一或多個樣本305。樣本305中之每一者可包含音訊或視頻存取單元。如本發明中別處所描述,每一存取單元可在多視圖寫碼(例如,MV-HEVC及3D-HEVC)及可縮放視頻寫碼(例如,SHVC)中包含多個經寫碼圖像。舉例而言,存取單元可針對每一層包括一或多個經寫碼圖像。 此外,在圖8之實例中,電影方塊302包括音軌方塊306。音軌方塊306可封圍關於檔案300之音軌之後設資料。在其他實例中,電影方塊302可包括用於檔案300之不同音軌之多個音軌方塊。音軌方塊306包括媒體方塊307。媒體方塊307可含有宣告關於音軌內之媒體資料之資訊之所有物件。媒體方塊307包括媒體資訊方塊308。媒體資訊方塊308可含有宣告音軌之媒體之特性資訊之所有物件。媒體資訊方塊308包括樣本表方塊309。樣本表方塊309可規定樣本特定後設資料。 在圖8之實例中,樣本表方塊309包括至少一個SampleToGroup方塊310、SampleGroupDescription方塊312及SampleGroupDescription方塊314。在其他實例中,除SampleToGroup方塊310、SampleGroupDescription方塊312及SampleGroupDescription方塊314外,樣本表方塊309亦可包括其他方塊,及/或可包括多個SampleToGroup方塊及SampleGroupDescription方塊。SampleToGroup方塊310可將樣本(例如,樣本305中之特定者)映射至樣本群組。SampleGroupDescription方塊312及SampleGroupDescription方塊314可規定由樣本群組(亦即,樣本群組)中之樣本共用之性質。 此外,在圖8之實例中,SampleToGroup方塊310包括grouping_type語法元素319 (亦即,分組類型語法元素)、entry_count語法元素315 (亦即,項計數語法元素)及一或多個樣本群組項316。Entry_count語法元素315指示樣本群組項316之數目。樣本群組項316中之每一者包括sample_count語法元素317 (亦即,樣本計數語法元素)及group_description_index語法元素318 (亦即,群組描述索引語法元素)。Sample_count語法元素317可指示與含有sample_count語法元素317之樣本群組項相關聯之樣本之數目。Group_description_index語法元素318可在SampleGroupDescription方塊(例如,SampleGroupDescription方塊312、SampleGroupDescription方塊314)內識別含有與含有group_description_index語法元素318之樣本群組項相關聯之樣本之描述之群組描述項。 另外,在圖8之實例中,SampleGroupDescription方塊312包括grouping_type語法元素320、entry_count語法元素322及一或多個頻塊集群組項324。頻塊集群組項324中之每一者為樣本群組項之例子。若SampleToGroup方塊之群組類型語法元素(例如,SampleToGroup方塊310之grouping_type語法元素319)規定匹配grouping_type語法元素320之值的值,則SampleToGroup方塊對應於SampleGroupDescription方塊。Entry_count語法元素322指示SampleGroupDescription方塊中之頻塊集群組項324之數目。圖10 (在本發明中別處詳細描述)說明頻塊集群組項之實例性內容。 此外,在圖8之實例中,SampleGroupDescription方塊314包括grouping_type語法元素326、entry_count語法元素328及一或多個NAL單元映射項330。NAL單元映射項330中之每一者為樣本群組項之例子。Entry_count語法元素328指示SampleGroupDescription方塊314中之NAL單元映射項330之數目。在一些實例中,群組識別符語法元素402具有指示NAL單元與所有頻塊集(例如,層之所有頻塊集)相關聯之值(例如,1)。 圖9為根據本發明之一或多個技術說明檔案350之實例性結構的概念圖。在圖9之實例中,檔案350包括一或多個電影片段方塊352及複數個媒體資料方塊354。儘管在圖9之實例中經說明為在相同檔案中,但在其他實例中,電影片段方塊352及媒體資料方塊354可在單獨檔案中。媒體資料方塊354中之每一者可包括一或多個樣本356。樣本356中之一些或全部可包含視頻內容之各別圖像。電影片段方塊中之每一者對應於電影片段。每一電影片段可包含音軌片段集。每音軌可存在零或更多個音軌片段。 在圖9之實例中,電影片段方塊352提供關於對應電影片段之資訊。電影片段方塊352可包括音軌片段方塊358。音軌片段方塊358對應於音軌片段且提供關於音軌片段之資訊。 例如,在圖9之實例中,音軌片段方塊358可包括SampleToGroup方塊362、SampleGroupDescription方塊364及SampleGroupDescription方塊366。SampleToGroup方塊362及SampleGroupDescription方塊364、366含有關於對應於音軌片段方塊358之音軌片段之資訊。除SampleToGroup方塊362及SampleGroupDescription方塊364、366外,音軌片段方塊358亦可包括一或多個SampleToGroup方塊及一或多個SampleGroupDescription方塊。此外,在圖9之實例中,SampleToGroup方塊362包括grouping_type語法元素370 (亦即,分組類型語法元素)、entry_count語法元素371 (亦即,項計數語法元素)及一或多個樣本群組項372。Entry_count語法元素371指示樣本群組項372之數目。樣本群組項372中之每一者包括sample_count語法元素373 (亦即,樣本計數語法元素)及group_description_index語法元素374 (亦即,群組描述索引語法元素)。Sample_count語法元素373可指示與含有sample_count語法元素373之樣本群組項相關聯之樣本之數目。Group_description_index語法元素374可在SampleGroupDescription方塊(例如,SampleGroupDescription方塊364)內識別含有與含有group_description_index語法元素374之樣本群組項相關聯之樣本之描述之群組描述項。 另外,在圖9之實例中,SampleGroupDescription方塊364包括grouping_type語法元素380、entry_count語法元素382及一或多個頻塊集群組項384。頻塊集群組項中之每一者為群組描述項之例子。Entry_count語法元素382指示SampleGroupDescription方塊364中之頻塊集群組項384之數目。 此外,在圖9之實例中,SampleGroupDescription方塊366包括grouping_type語法元素386、entry_count語法元素388及一或多個NAL單元映射項390。NAL單元映射項390中之每一者為樣本群組項之例子。Entry_count語法元素388指示SampleGroupDescription方塊366中之NAL單元映射項390之數目。 在圖8或圖9中,TileRegionGroupEntry擴展VisualSampleGroupEntry。如14496-12之章節8.9.3.2中所描述,VisualSampleGroupEntry為SampleGroupDescriptionEntry類別之擴展。因此,在一些實例中,TileSetGroupEntry類別(亦即,TileSetGroupEntry方塊)之例子可為群組描述項中之不同者。 圖10為根據本發明之一或多個技術說明頻塊集項群組400的概念圖。如圖10之實例中所說明,頻塊集群組項400可包括群組識別符(例如,groupID)語法元素402、水平偏移(例如,horizontal_offset)語法元素404、垂直偏移(例如,vertical_offset)語法元素406、寬度(例如,region_width)語法元素408,及高度(例如,region_height)語法元素410。群組識別符語法元素402識別頻塊集。 水平偏移語法元素404規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之水平偏移。垂直偏移語法元素406規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之垂直偏移。寬度語法元素408規定覆蓋頻塊集中之頻塊之最小矩形區之寬度。寬度語法元素410規定覆蓋頻塊集中之頻塊之最小矩形區之高度。 在一些實例中,頻塊集群組項400亦可包括相依性資訊412。相依性資訊412可描述頻塊集所屬於之層內之相依性。舉例而言,相依性資訊412可描述識別頻塊集組項400應用於之樣本之時間子層的時間識別符。在一些實例中,相依性資訊412包含規定頻塊集與當前圖像中及頻塊集所屬於之層之參考圖像中之其他頻塊集之間的寫碼相依性的特定語法元素(例如,independent_idc、independent_flag)。 圖11為根據本發明之技術說明用於產生與儲存視頻資料之檔案的程序之實例的流程圖。本發明之流程圖經提供作為實例。其他處理可包括更多、更少或不同動作。此外,在一些情況中,可以不同次序或並行地執行動作。此外,本發明參考檔案產生裝置34描述圖11。然而,其他裝置可能夠執行圖11之程序。 在圖11之實例中,檔案產生裝置34可接收一位元串流,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列(450)。例如,檔案產生裝置34之記憶體可自網路介面、磁碟或其他媒體接收位元串流。視頻資料之圖像包括當前圖像。將當前圖像分割成複數個頻塊。複數個頻塊之每一各別頻塊為各別矩形區。例如,可將當前圖像分割成四個等大小頻塊,每一頻塊為矩形區,如圖2及圖3之實例中所展示。 另外,在圖11之實例中,檔案產生裝置34產生檔案中之NAL單元映射項方塊(例如,NALUMapEntry) (452)。舉例而言,檔案產生裝置34可儲存表示檔案中之NAL單元映射項方塊之資料。NAL單元映射項方塊使位元串流之NAL單元與頻塊集相關聯。頻塊集包括當前圖像經分割成之複數個頻塊中之一或多個頻塊。舉例而言,如在圖4之實例中所展示,頻塊集可包括當前圖像經分割成之複數個頻塊中之兩個或多於兩個頻塊。在一些情況中,由頻塊集中之頻塊覆蓋之當前圖像之區(例如,圖4中之區域124)的形狀並非矩形。在一些情況中,由頻塊集中之頻塊覆蓋之當前圖像之區的形狀為矩形。 此外,在圖11之實例中,檔案產生裝置34產生檔案中之頻塊集群組項(例如,TileSetGroupEntry、TileRegionGroupEntry) (454)。舉例而言,檔案產生裝置34可儲存表示檔案中之頻塊集群組項方塊之資料。頻塊集群組項可包括識別該頻塊集之一群組識別符語法元素。此外,頻塊集項包括水平偏移語法元素(例如,horizontal_offset)、垂直偏移語法元素(例如,vertical_offset)、寬度語法元素(例如,region_width)及高度語法元素(例如,region_height)。水平偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之水平偏移。垂直偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之垂直偏移。寬度語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之寬度。高度語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之高度。 此外,在一個實例中,檔案產生裝置34可產生檔案中之第二NAL單元映射項方塊。在此實例中,第二NAL單元映射項方塊可包括群組識別符語法元素。此外,在此實例中,第二NAL單元映射項方塊之群組識別符語法元素具有指示NAL單元與所有頻塊集相關聯之值(例如,1或另一值)。如本發明彼處所描述,檔案處理裝置(例如,實施檔案剖析單元31 (圖1)之裝置)可使用第二NAL單元映射項來識別非VCL NAL單元,該非VCL NAL單元可包括解碼包括頻塊集之VCL NAL單元所需要之資料。 圖12為根據本發明之技術說明用於處理儲存經編碼視頻資料之檔案的程序之實例的流程圖。參考檔案剖析單元31闡釋圖12之實例程序。然而,其他裝置或單元可執行圖12之實例性程序。 在圖12之實例中,檔案剖析裝置31獲得檔案中之NAL單元映射項方塊(例如,NALUMapEntry) (500)。舉例而言,檔案剖析單元31可自檔案讀取NAL單元映射項方塊。NAL單元映射項方塊使位元串流之NAL單元與頻塊集相關聯。舉例而言,如本發明中別處所描述,NAL單元映射項方塊可包括指示藉以映射NAL單元之頻塊集的語法元素(例如,groupID)語法元素。位元串流包括形成視頻資料之經編碼圖像之表示的位元序列。視頻資料之圖像包括當前圖像。將當前圖像分割成複數個頻塊。舉例而言,語法元素(例如,HEVC中之num_tile_columns_minus1、num_tile_rows_minus1、uniform_spacing_flag,等等)可規定如何將當前圖像分割成頻塊。複數個頻塊之每一各別頻塊為各別矩形區。頻塊集包括當前圖像經分割成之複數個頻塊中之一或多個頻塊。舉例而言,如在圖4之實例中所展示,頻塊集可包括當前圖像經分割成之複數個頻塊中之兩個或多於兩個頻塊。在一些情況中,由頻塊集中之頻塊覆蓋之當前圖像之區(例如,圖4中之區域124)的形狀並非矩形。在一些情況中,由頻塊集中之頻塊覆蓋之當前圖像之區的形狀為矩形。 此外,在圖12之實例中,檔案剖析單元31獲得檔案中之頻塊集群組項(例如,TileSetGroupEntry、TileRegionGroupEntry) (502)。頻塊集群組項包括識別該頻塊集之一群組識別符語法元素。頻塊集項包括水平偏移語法元素(例如,horizontal_offset)、垂直偏移語法元素(例如,vertical_offset)、寬度語法元素(例如,region_width)及高度語法元素(例如,region_height)。水平偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之水平偏移。垂直偏移語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之左上方像素之垂直偏移。寬度語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之寬度。高度語法元素規定覆蓋頻塊集中之頻塊之最小矩形區之高度。 另外,在圖12之實例中,檔案剖析單元31基於水平偏移語法元素、垂直偏移語法元素、寬度語法元素,及高度語法元素而處理頻塊集(504)。檔案剖析單元31可以各種方式處理頻塊集。例如,檔案剖析單元31可自檔案提取頻塊集之頻塊並傳輸所提取頻塊。舉例而言,檔案剖析單元31可判定(例如,基於頻塊集之位置及大小)頻塊集是否對應於欲加以顯示之所要區。若如此,檔案剖析單元31可使用NAL單元映射項方塊來判定包括頻塊集之經編碼區塊之NAL單元。檔案剖析單元31可接著提取所判定NAL單元。 此外,在一個實例中,檔案剖析單元31可自檔案獲得第二NAL單元映射項方塊。第二NAL單元映射項方塊可包括群組識別符語法元素。此外,在此實例中,具有特定值(例如,1或另一值)之第二NAL單元映射項方塊之群組識別符語法元素(例如,groupID)指示NAL單元與所有頻塊集相關聯。在此實例中,基於第二NAL單元映射項方塊之群組識別符語法元素具有指示NAL單元與所有頻塊集相關聯之值,檔案剖析單元31可自檔案提取NAL單元。此外,在一些情況中,檔案剖析單元31可傳輸NAL單元。 在一或多個實例中,所描述之功能可以硬體、軟體、韌體或其任一組合來實施。若以軟體實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體進行傳輸,且由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體,其對應於諸如資料儲存媒體之有形媒體,或包括促進(例如)根據通信協定將電腦程式自一個位置傳送至另一位置之任一媒體的通信媒體。以此方式,電腦可讀媒體通常可對應於(1)非暫時性之有形電腦可讀儲存媒體或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取用於實施本發明中所描述之技術之指令、程式碼及/或資料結構之任何可用媒體。電腦程式產品可包括電腦可讀媒體。 藉由實例之方式且非限制性,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光學磁碟儲存裝置、磁碟儲存裝置或其他磁性儲存裝置、快閃記憶體或可用於以指令或資料結構之形式儲存所要程式碼且可由電腦存取之其他媒體。此外,可將任何連接適當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纖纜線、雙絞線、數位用戶線(DSL)或諸如紅外線、無線電及微波等無線技術從網站、伺服器或其他遠端源傳輸指令,則該同軸纜線、光纖纜線、雙絞線、DSL或諸如紅外線、無線電及微波等無線技術皆包括於媒體之定義中。然而,應理解電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,但替代地針對非暫時性、有形儲存媒體。如本文中所使用,磁碟及光碟包括:緊密光碟(CD)、雷射光碟、光學光碟、數位多功能光碟(DVD)、軟碟及藍光光碟,其中磁碟通常以磁性方式再現資料,而光碟藉由雷射以光學方式再現資料。上述各項的組合亦應包括在電腦可讀媒體的範疇內。 指令可由一或多個處理器執行,諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效積體或離散邏輯電路。因此,如本文中所使用之術語「處理器」可係指前述結構或適於實施本文中所描述之技術之任何其他結構中之任一者。另外,在一些方面中,本文中所描述之功能性可提供在經組態以用於編碼及解碼或併入於組合式編解碼器中的專用硬體及/或軟體模組內。此外,技術可以一或多個電路或邏輯元件來完全實施。 本發明之技術可以廣泛各種裝置或裝備(包括無線手機、積體電路(IC)或IC組(例如,晶片組))實施。各種組件、模組或單元在本發明中經描述以強調經組態以執行所揭示技術之裝置的功能態樣,而未必需要由不同硬體單元實現。確切而言,如上文所描述,各種單元可以編解碼硬體單元組合或藉由交互操作硬體單元(包括如上文所描述之一或多個處理器)的集合結合適合軟體及/或韌體提供。 已描述各種實例。此等及其他實例在以下申請專利範圍之範疇內。
10‧‧‧視頻編碼及解碼系統12‧‧‧源裝置14‧‧‧目的地裝置16‧‧‧鏈路18‧‧‧視頻源20‧‧‧視頻編碼器22‧‧‧輸出接口28‧‧‧輸入介面29‧‧‧儲存媒體30‧‧‧視頻解碼器31‧‧‧檔案剖析單元32‧‧‧顯示裝置33‧‧‧儲存裝置34‧‧‧檔案產生裝置36‧‧‧記憶體40‧‧‧圖像42‧‧‧頻塊44‧‧‧頻塊46‧‧‧頻塊48‧‧‧頻塊50‧‧‧垂直頻塊邊界/頻塊52‧‧‧水平頻塊邊界54‧‧‧圖塊區段56‧‧‧圖塊區段58‧‧‧圖塊區段60‧‧‧圖塊區段62‧‧‧圖塊區段64‧‧‧圖塊區段66‧‧‧圖塊區段68‧‧‧圖塊區段80‧‧‧圖像82‧‧‧頻塊84‧‧‧頻塊86‧‧‧頻塊88‧‧‧頻塊90‧‧‧頻塊邊界92‧‧‧頻塊邊界94‧‧‧圖塊區段96‧‧‧圖塊區段98‧‧‧圖塊區段100‧‧‧圖塊區段120‧‧‧圖像122‧‧‧頻塊集/頻塊124‧‧‧最小矩形區域130‧‧‧圖像132‧‧‧圖像134‧‧‧圖像136‧‧‧圖像200‧‧‧後處理實體202‧‧‧分割單元204‧‧‧預測處理單元206‧‧‧濾波器單元208‧‧‧參考圖像記憶體210‧‧‧求和器212‧‧‧變換處理單元214‧‧‧量化單元216‧‧‧熵編碼單元218‧‧‧運動估計單元220‧‧‧運動補償單元222‧‧‧圖框內預測處理單元224‧‧‧反量化單元226‧‧‧反變換處理單元228‧‧‧求和器230‧‧‧視頻資料記憶體250‧‧‧熵解碼單元252‧‧‧預測處理單元254‧‧‧反量化單元256‧‧‧反變換處理單元258‧‧‧求和器260‧‧‧濾波器單元262‧‧‧參考圖像記憶體264‧‧‧運動補償單元266‧‧‧圖框內預測處理單元268‧‧‧經寫碼圖像緩衝器(CPB)270‧‧‧檔案剖析單元272‧‧‧網路實體300‧‧‧檔案302‧‧‧電影方塊304‧‧‧媒體資料方塊305‧‧‧樣本306‧‧‧音軌方塊307‧‧‧媒體方塊308‧‧‧媒體資訊方塊309‧‧‧樣本表方塊310‧‧‧SampleToGroup方塊312‧‧‧SampleGroupDescription方塊314‧‧‧SampleGroupDescription方塊315‧‧‧entry_count語法元素316‧‧‧樣本群組項317‧‧‧sample_count語法元素318‧‧‧group_description_index語法元素319‧‧‧grouping_type語法元素320‧‧‧grouping_type語法元素322‧‧‧entry_count語法元素324‧‧‧頻塊集群組項326‧‧‧grouping_type語法元素328‧‧‧entry_count語法元素330‧‧‧網路抽象層(NAL)單元映射項350‧‧‧檔案352‧‧‧電影片段方塊354‧‧‧媒體資料方塊356‧‧‧樣本358‧‧‧音軌片段方塊362‧‧‧SampleToGroup方塊364‧‧‧SampleGroupDescription方塊366‧‧‧SampleGroupDescription方塊370‧‧‧grouping_type語法元素371‧‧‧entry_count語法元素372‧‧‧樣本群組項373‧‧‧sample_count語法元素374‧‧‧group_description_index語法元素380‧‧‧grouping_type語法元素382‧‧‧entry_count語法元素384‧‧‧頻塊集群組項386‧‧‧grouping_type語法元素388‧‧‧entry_count語法元素390‧‧‧網路抽象層(NAL)單元映射項400‧‧‧頻塊集項群組402‧‧‧群組識別符語法元素404‧‧‧水平偏移語法元素406‧‧‧垂直偏移語法元素408‧‧‧寬度語法元素410‧‧‧高度語法元素412‧‧‧相依性資訊450‧‧‧步驟452‧‧‧步驟454‧‧‧步驟500‧‧‧步驟502‧‧‧步驟504‧‧‧步驟L0‧‧‧第一層L1‧‧‧第二層T0‧‧‧第一存取單元T1‧‧‧第二存取單元
圖1為說明可使用本發明中所描述之技術之實例性視頻編碼及解碼系統的方塊圖。 圖2為說明實例性頻塊及圖塊的概念圖。 圖3為說明其中網路抽象層(NAL)單元包括多個頻塊之實例的概念圖。 圖4為根據本發明之一或多種技術說明包括由含有頻塊集之最小矩形區域限界之頻塊集之實例性圖像的概念圖。 圖5為說明覆蓋不同層中之相同區域之頻塊集的概念圖。 圖6為說明可實施本發明中所描述之技術之實例性視頻編碼器的方塊圖。 圖7為說明可實施本發明中所描述之技術之實例性視頻解碼器的方塊圖。 圖8為根據本發明之一或多個技術說明檔案之實例性結構的概念圖。 圖9為根據本發明之一或多個技術說明檔案之實例性結構的概念圖。 圖10為根據本發明之一或多個技術說明頻塊集項群組的概念圖。 圖11為根據本發明之技術說明用於產生與儲存視頻資料之檔案的程序之實例的流程圖。 圖12為根據本發明之技術說明用於處理儲存經編碼視頻資料之檔案的程序之實例的流程圖。
400‧‧‧頻塊集項群組
402‧‧‧群組識別符語法元素
404‧‧‧水平偏移語法元素
406‧‧‧垂直偏移語法元素
408‧‧‧寬度語法元素
410‧‧‧高度語法元素
412‧‧‧相依性資訊
Claims (30)
- 一種用於儲存視頻資料之方法,該方法包含:藉由一檔案產生裝置,接收一位元串流,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區;藉由該檔案產生裝置,產生一檔案中之一網路抽象層(NAL)單元映射項方塊,該NAL單元映射項方塊使該位元串流之NAL單元與一頻塊集相關聯,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;及藉由該檔案產生裝置,產生該檔案中之一頻塊集群組項(tile set group entry),該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之該等頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且 該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度。
- 如請求項1之方法,其中該頻塊集具有一層特定範疇(layer-specific scope)。
- 如請求項2之方法,其中產生該頻塊集群組項包含:在該頻塊集群組項中包括描述該頻塊集所屬於之一層內之相依性的相依性資訊。
- 如請求項3之方法,其中:在該頻塊集群組項中包括該相依性資訊包含:在該頻塊集群組項中包括規定該頻塊集與該當前圖像中及該頻塊集所屬於之該層之參考圖像中之其他頻塊集之間的寫碼相依性的一特定語法元素,且該方法進一步包含:在該檔案中之一層資訊樣本群組或該檔案中之一操作點資訊樣本群組中指示層間相依性。
- 如請求項4之方法,其中該特定語法元素為一旗標,其中該旗標具有恰好兩個狀態,該第一旗標之一第一狀態指示無時間相依性,且該旗標之一第二狀態指示可存在或可不存在時間相依性。
- 如請求項1之方法,其中該NAL單元映射項方塊為一第一NAL單元映射項方塊,該方法進一步包含: 產生該檔案中之一第二NAL單元映射項方塊,該第二NAL單元映射項方塊包括一群組識別符語法元素,該第二NAL單元映射項方塊之該群組識別符語法元素具有指示一NAL單元與所有頻塊集相關聯之一值。
- 一種處理儲存經編碼視頻資料之一檔案之方法,該方法包含:藉由一檔案處理裝置,獲得一檔案中之一網路抽象層(NAL)單元映射項方塊,該NAL單元映射項方塊使一位元串流之NAL單元與一頻塊集相關聯,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;藉由該檔案處理裝置,獲得該檔案中之一頻塊集群組項,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之該等頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區 之一高度;及基於該水平偏移語法元素、該垂直偏移語法元素、該寬度語法元素及該高度語法元素而處理該頻塊集。
- 如請求項7之方法,其中處理該頻塊集包含:自該檔案提取該頻塊集之該等頻塊;及傳輸該等所提取頻塊。
- 如請求項7之方法,其中該頻塊集具有一層特定範疇。
- 如請求項9之方法,其中:獲得該頻塊集群組項包含:自該頻塊集群組項內獲得描述該頻塊集所屬於之一層內之相依性的相依性資訊,且處理該頻塊集包含:基於該水平偏移語法元素、該垂直偏移語法元素、該寬度語法元素、該高度語法元素及該相依性資訊而處理該頻塊集。
- 如請求項10之方法,其中:獲得該頻塊集群組項中之該相依性資訊包含:自該頻塊集群組項內獲得規定該頻塊集與該當前圖像中及該頻塊集所屬於之該層之參考圖像中之其他頻塊集之間的寫碼相依性的一特定語法元素,該方法進一步包含:基於該檔案中之一層資訊樣本群組或該檔案中之一操作點資訊樣本群組而判定層間相依性,且處理該頻塊集包含:基於該水平偏移語法元素、該垂直偏移語法元 素、該寬度語法元素、該高度語法元素及該層間相依性而處理該頻塊集。
- 如請求項11之方法,其中該特定語法元素為一旗標,其中該旗標具有恰好兩個狀態,該第一旗標之一第一狀態指示無時間相依性,且該旗標之一第二狀態指示可存在或可不存在時間相依性。
- 如請求項7之方法,其中該NAL單元映射項方塊為一第一NAL單元映射項方塊,該方法進一步包含:自該檔案獲得一第二NAL單元映射項方塊,該第二NAL單元映射項方塊包括一群組識別符語法元素,該第二NAL單元映射方塊之該群組識別符語法元素具有指示一NAL單元與所有頻塊集相關聯之一值;及基於該第二NAL單元映射項方塊之該群組識別符語法元素具有指示該NAL單元與所有頻塊集相關聯之該值:自該檔案提取該NAL單元;及傳輸該NAL單元。
- 一種用於產生用於儲存視頻資料之一檔案之裝置,該裝置包含:一記憶體,其經組態以儲存用於儲存視頻內容之一檔案;及在電路中實施之一或多個處理器,該一或多個處理器經組態以:接收一位元串流,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區; 產生該檔案中之一網路抽象層(NAL)單元映射項方塊,該NAL單元映射項方塊使該位元串流之NAL單元與一頻塊集相關聯,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;及產生該檔案中之一頻塊集群組項,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之該等頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度。
- 如請求項14之裝置,其中該頻塊集具有一層特定範疇。
- 如請求項15之裝置,其中該一或多個處理器經組態以使得,作為產生該頻塊集群組項之部分,該一或多個處理器:在該頻塊集群組項中包括描述該頻塊集所屬於之一層內之相依性的 相依性資訊。
- 如請求項16之裝置,其中:該一或多個處理器經組態以使得,作為在該頻塊集群組項中包括該相依性資訊之部分,該一或多個處理器在該頻塊集群組項中包括規定該頻塊集與該當前圖像中及該頻塊集所屬於之該層之參考圖像中之其他頻塊集之間的寫碼相依性的一特定語法元素,且該一或多個處理器經進一步組態以在該檔案中之一層資訊樣本群組或該檔案中之一操作點資訊樣本群組中指示層間相依性。
- 如請求項17之裝置,其中該特定語法元素為一旗標,其中該旗標具有恰好兩個狀態,該第一旗標之一第一狀態指示無時間相依性,該旗標之一第二狀態指示可存在或可不存在時間相依性。
- 如請求項14之裝置,其中該NAL單元映射項方塊為一第一NAL單元映射項方塊,該一或多個處理器經進一步組態以:產生該檔案中之一第二NAL單元映射項方塊,該第二NAL單元映射項方塊包括一群組識別符語法元素,該第二NAL單元映射項方塊之該群組識別符語法元素具有指示一NAL單元與所有頻塊集相關聯之一值。
- 一種用於處理儲存經編碼視頻資料之一檔案之裝置,該裝置包含:一記憶體,其經組態以儲存用於儲存視頻內容之一檔案;及在電路中實施之一或多個處理器,該一或多個處理器經組態以: 獲得一檔案中之一網路抽象層(NAL)單元映射項方塊,該NAL單元映射項方塊使一位元串流之NAL單元與一頻塊集相關聯,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;獲得該檔案中之一頻塊集群組項,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之該等頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度;及基於該水平偏移語法元素、該垂直偏移語法元素、該寬度語法元素及該高度語法元素而處理該頻塊集。
- 如請求項20之裝置,其中該一或多個處理器經組態以使得,作為處理該頻塊集之部分,該一或多個處理器:自該檔案提取該頻塊集之該等頻塊;及傳輸該等所提取頻塊。
- 如請求項21之裝置,其中該頻塊集具有一層特定範疇。
- 如請求項22之裝置,其中:該一或多個處理器經組態以使得,作為獲得該頻塊集群組項之部分,該一或多個處理器自該頻塊集群組項內獲得描述該頻塊集所屬於之一層內之相依性的相依性資訊,且該一或多個處理器經組態以使得,作為處理該頻塊集之部分,該一或多個處理器基於該水平偏移語法元素、該垂直偏移語法元素、該寬度語法元素、該高度語法元素及該相依性資訊而處理該頻塊集。
- 如請求項23之裝置,其中:該一或多個處理器經組態以使得,作為獲得該頻塊集群組項中之該相依性資訊之部分,該一或多個處理器自該頻塊集群組項內獲得規定該頻塊集與該當前圖像中及該頻塊集所屬於之該層之參考圖像中之其他頻塊集之間的寫碼相依性的一特定語法元素,該一或多個處理器經進一步組態以基於該檔案中之一層資訊樣本群組或該檔案中之一操作點資訊樣本群組而判定層間相依性,且該一或多個處理器經組態以使得,作為處理該頻塊集之部分,該一 或多個處理器基於該水平偏移語法元素、該垂直偏移語法元素、該寬度語法元素、該高度語法元素及該層間相依性而處理該頻塊集。
- 如請求項24之裝置,其中該特定語法元素為一旗標,其中該旗標具有恰好兩個狀態,該第一旗標之一第一狀態指示無時間相依性,該旗標之一第二狀態指示可存在或可不存在時間相依性。
- 如請求項20之裝置,其中該頻塊集群組項為一第一頻塊集群組項,該一或多個處理器經進一步組態以:自該檔案獲得一第二NAL單元映射項方塊,該第二NAL單元映射項方塊包括一群組識別符語法元素,該第二NAL單元映射方塊之該群組識別符語法元素具有指示一NAL單元與所有頻塊集相關聯之一值;及基於該第二NAL單元映射項方塊之該群組識別符語法元素具有指示該NAL單元與所有頻塊集相關聯之該值:自該檔案提取該NAL單元;及傳輸該NAL單元。
- 一種用於產生用於儲存視頻資料之一檔案之裝置,該裝置包含:用於接收一位元串流的構件,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區;用於產生一檔案中之一網路抽象層(NAL)單元映射項方塊的構件, 該NAL單元映射項方塊使該位元串流之NAL單元與一頻塊集相關聯,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;及用於產生該檔案中之一頻塊集群組項的構件,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之該等頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度。
- 一種用於處理儲存經編碼視頻資料之一檔案之裝置,該裝置包含:用於獲得一檔案中之一網路抽象層(NAL)單元映射項方塊的構件,該NAL單元映射項方塊使一位元串流之NAL單元與一頻塊集相關聯,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區,該頻塊集包括該當前圖像 經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;用於獲得該檔案中之一頻塊集群組項的構件,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之該等頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度;及用於基於該水平偏移語法元素、該垂直偏移語法元素、該寬度語法元素及該高度語法元素而處理該頻塊集的構件。
- 一種非暫時性之電腦可讀資料儲存媒體,其上儲存有指令,該等指令在經執行時組態一裝置以:接收一位元串流,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區; 產生一檔案中之一網路抽象層(NAL)單元映射項方塊,該NAL單元映射項方塊使該位元串流之NAL單元與一頻塊集相關聯,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;及產生該檔案中之一頻塊集群組項,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之該等頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度。
- 一種非暫時性之電腦可讀資料儲存媒體,其上儲存有指令,該等指令在經執行時組態一裝置以:藉由一檔案處理裝置,獲得一檔案中之一網路抽象層(NAL)單元映射項方塊,該NAL單元映射項方塊使一位元串流之NAL單元與一頻塊集相關聯,該位元串流包括形成該視頻資料之經編碼圖像之一表示的一位元序列,該視頻資料之該等圖像包括一當前圖像,該當前圖像經分割成複數 個頻塊,該複數個頻塊中之每一各別頻塊為一各別矩形區,該頻塊集包括該當前圖像經分割成之該複數個頻塊中之兩個或多於兩個頻塊,由該頻塊集中之該等頻塊覆蓋之該當前圖像之一區的形狀並非矩形;藉由該檔案處理裝置,獲得該檔案中之一頻塊集群組項,該頻塊集群組項包括識別該頻塊集之一群組識別符語法元素,該頻塊集群組項包括一水平偏移語法元素、一垂直偏移語法元素、一寬度語法元素及一高度語法元素,該水平偏移語法元素規定覆蓋該頻塊集中之該等頻塊之一最小矩形區之一左上方像素之一水平偏移,該垂直偏移語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之該左上方像素之一垂直偏移,該寬度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一寬度,且該高度語法元素規定覆蓋該頻塊集中之該等頻塊之該最小矩形區之一高度;及基於該水平偏移語法元素、該垂直偏移語法元素、該寬度語法元素及該高度語法元素而處理該頻塊集。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662315575P | 2016-03-30 | 2016-03-30 | |
US62/315,575 | 2016-03-30 | ||
US15/470,148 US10419768B2 (en) | 2016-03-30 | 2017-03-27 | Tile grouping in HEVC and L-HEVC file formats |
US15/470,148 | 2017-03-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201737711A TW201737711A (zh) | 2017-10-16 |
TWI699994B true TWI699994B (zh) | 2020-07-21 |
Family
ID=59961332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106110370A TWI699994B (zh) | 2016-03-30 | 2017-03-28 | 在高效率視頻寫碼及分層高效率視頻寫碼檔案格式之頻塊分組的改良 |
Country Status (10)
Country | Link |
---|---|
US (1) | US10419768B2 (zh) |
EP (1) | EP3437327B1 (zh) |
JP (1) | JP6690010B2 (zh) |
KR (1) | KR102102554B1 (zh) |
CN (1) | CN108886642B (zh) |
BR (1) | BR112018069708A2 (zh) |
CA (1) | CA3015942C (zh) |
ES (1) | ES2781307T3 (zh) |
TW (1) | TWI699994B (zh) |
WO (1) | WO2017172783A1 (zh) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10148969B2 (en) * | 2015-02-11 | 2018-12-04 | Qualcomm Incorporated | Of sample entry and operation point signalling in a layered video file format |
US10535114B2 (en) * | 2015-08-18 | 2020-01-14 | Nvidia Corporation | Controlling multi-pass rendering sequences in a cache tiling architecture |
GB2550604A (en) * | 2016-05-24 | 2017-11-29 | Canon Kk | Method, device, and computer program for encapsulating and parsing timed media data |
KR102488330B1 (ko) * | 2017-10-09 | 2023-01-12 | 노키아 테크놀로지스 오와이 | 비디오 코딩 및 디코딩을 위한 장치, 방법 및 컴퓨터 프로그램 |
WO2019195037A1 (en) | 2018-04-03 | 2019-10-10 | Futurewei Technologies, Inc. | Bitstream signaling of error mitigation in sub-picture bitstream based viewport dependent video coding |
US10803628B2 (en) | 2018-06-03 | 2020-10-13 | Apple Inc. | Bounding path techniques |
EP3811613A2 (en) | 2018-06-21 | 2021-04-28 | Telefonaktiebolaget LM Ericsson (publ) | Flexible tile partitions |
WO2019243534A1 (en) | 2018-06-21 | 2019-12-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Tile shuffling for 360 degree video decoding |
CN118509586A (zh) | 2018-06-21 | 2024-08-16 | 瑞典爱立信有限公司 | 视频编码中具有子图块的图块分区 |
GB2575074B (en) * | 2018-06-27 | 2022-09-28 | Canon Kk | Encapsulating video content with an indication of whether a group of tracks collectively represents a full frame or a part of a frame |
US11290728B2 (en) * | 2018-07-02 | 2022-03-29 | Nokia Technologies Oy | Method and apparatus for tile-relative addressing in video coding |
HUE066947T2 (hu) * | 2018-09-14 | 2024-09-28 | Huawei Tech Co Ltd | Feldarabolás és csempézés a videokódolásban |
CN112703734A (zh) * | 2018-09-14 | 2021-04-23 | Vid拓展公司 | 用于灵活网格区域的方法和装置 |
EP3707904A1 (en) | 2018-10-02 | 2020-09-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Encoding and decoding pictures based on tile group id |
BR112021010326A2 (pt) * | 2018-11-30 | 2021-08-24 | Sharp Kabushiki Kaisha | Método de decodificar dados de vídeo, método de codificar dados de vídeo e dispositivo para decodificar dados de vídeo |
AU2019392557A1 (en) * | 2018-12-04 | 2021-06-24 | Interdigital Vc Holdings, Inc. | Tile group partitioning |
CN115665410A (zh) | 2018-12-17 | 2023-01-31 | 华为技术有限公司 | 视频译码中用于光栅扫描分块组和矩形分块组的分块组分配 |
US11272178B2 (en) * | 2018-12-20 | 2022-03-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Video encoding and decoding |
US11140403B2 (en) | 2018-12-20 | 2021-10-05 | Tencent America LLC | Identifying tile from network abstraction unit header |
US11477445B2 (en) * | 2018-12-28 | 2022-10-18 | Hfi Innovation Inc. | Methods and apparatuses of video data coding with tile grouping |
US12113997B2 (en) * | 2019-01-22 | 2024-10-08 | Tencent America LLC | Method for tile group identification |
CN113273217A (zh) | 2019-02-03 | 2021-08-17 | 北京字节跳动网络技术有限公司 | 非对称四叉树分割 |
US11889085B2 (en) * | 2019-03-08 | 2024-01-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods providing encoding/decoding of dependent/independent partitions and related devices |
AU2020237053B2 (en) * | 2019-03-11 | 2022-12-15 | Tencent America LLC | Tile and sub-picture partitioning |
EP3861722A4 (en) | 2019-03-11 | 2022-07-06 | Tencent America LLC | ADAPTIVE FRAME SIZE SIGNALING IN A VIDEO BITSTREAM |
MX2021014278A (es) * | 2019-05-23 | 2022-02-03 | Vid Scale Inc | Corrientes de nube de puntos basadas en video. |
JP7492542B2 (ja) | 2019-06-20 | 2024-05-29 | エックスリス、コーポレーション | 映像信号の符号化/復号化方法及びそのための装置 |
WO2020256615A1 (en) * | 2019-06-21 | 2020-12-24 | Telefonaktiebolaget Lm Ericsson (Publ) | Video coding layer up-switching indication |
WO2021002142A1 (ja) * | 2019-07-04 | 2021-01-07 | ソニー株式会社 | 情報処理装置、情報処理方法、再生処理装置及び再生処理方法 |
US11363307B2 (en) * | 2019-08-08 | 2022-06-14 | Hfi Innovation Inc. | Video coding with subpictures |
US12081753B2 (en) * | 2019-09-27 | 2024-09-03 | Sk Telecom Co., Ltd. | Method and apparatus for acquiring information about sub-units split from picture |
MX2022010699A (es) * | 2020-02-28 | 2022-11-10 | Huawei Tech Co Ltd | Un decodificador y métodos correspondientes para informacion de particionamiento de imagenes de señales para segmentos. |
EP3972279A1 (en) | 2020-09-17 | 2022-03-23 | Lemon Inc. | Subpicture track referencing and processing |
US20220086385A1 (en) * | 2020-09-17 | 2022-03-17 | Lemon Inc. | Profile, tier, level and general constraints indication in coded video |
EP3972273A1 (en) * | 2020-09-17 | 2022-03-23 | Lemon Inc. | Handling of non-vcl nal units in picture unit construction |
US11683529B2 (en) | 2020-09-17 | 2023-06-20 | Lemon Inc. | Operational point sample group in coded video |
KR20230124964A (ko) * | 2020-12-15 | 2023-08-28 | 엘지전자 주식회사 | 레이어 정보를 포함하는 미디어 파일 생성/수신 방법,장치 및 미디어 파일 전송 방법 |
CN116724555A (zh) * | 2020-12-21 | 2023-09-08 | Lg电子株式会社 | 媒体文件处理方法及其装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140003491A1 (en) * | 2012-07-02 | 2014-01-02 | Qualcomm Incorporated | Video parameter set for hevc and extensions |
US20140301464A1 (en) * | 2013-04-08 | 2014-10-09 | Microsoft Corporation | Control data for motion-constrained tile set |
US20160029091A1 (en) * | 2013-01-18 | 2016-01-28 | Canon Kabushiki Kaisha | Method of displaying a region of interest in a video stream |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY151920A (en) * | 2007-02-14 | 2014-07-31 | Photint Venture Group Inc | Fuzzy protection of visual content |
JP6214235B2 (ja) * | 2012-07-02 | 2017-10-18 | キヤノン株式会社 | ファイル生成方法、ファイル生成装置、及びプログラム |
KR102296853B1 (ko) * | 2013-07-12 | 2021-09-01 | 소니그룹주식회사 | 화상 복호 장치 및 방법 |
WO2015009108A1 (ko) * | 2013-07-18 | 2015-01-22 | 삼성전자 주식회사 | 비디오 포멧 파라미터 전달을 사용하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치 |
CN105900401B (zh) * | 2014-01-07 | 2020-03-06 | 佳能株式会社 | 用于对层间依赖性进行编码的方法、装置和计算机程序 |
US9998765B2 (en) * | 2014-07-16 | 2018-06-12 | Qualcomm Incorporated | Transport stream for carriage of video coding extensions |
-
2017
- 2017-03-27 US US15/470,148 patent/US10419768B2/en active Active
- 2017-03-28 CN CN201780018727.4A patent/CN108886642B/zh active Active
- 2017-03-28 JP JP2018550780A patent/JP6690010B2/ja active Active
- 2017-03-28 CA CA3015942A patent/CA3015942C/en active Active
- 2017-03-28 TW TW106110370A patent/TWI699994B/zh active
- 2017-03-28 KR KR1020187027899A patent/KR102102554B1/ko active IP Right Grant
- 2017-03-28 BR BR112018069708A patent/BR112018069708A2/pt unknown
- 2017-03-28 ES ES17720270T patent/ES2781307T3/es active Active
- 2017-03-28 EP EP17720270.2A patent/EP3437327B1/en active Active
- 2017-03-28 WO PCT/US2017/024560 patent/WO2017172783A1/en active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140003491A1 (en) * | 2012-07-02 | 2014-01-02 | Qualcomm Incorporated | Video parameter set for hevc and extensions |
US20160029091A1 (en) * | 2013-01-18 | 2016-01-28 | Canon Kabushiki Kaisha | Method of displaying a region of interest in a video stream |
US20140301464A1 (en) * | 2013-04-08 | 2014-10-09 | Microsoft Corporation | Control data for motion-constrained tile set |
Also Published As
Publication number | Publication date |
---|---|
KR102102554B1 (ko) | 2020-04-20 |
JP2019511173A (ja) | 2019-04-18 |
US20170289556A1 (en) | 2017-10-05 |
CA3015942A1 (en) | 2017-10-05 |
US10419768B2 (en) | 2019-09-17 |
CN108886642A (zh) | 2018-11-23 |
JP6690010B2 (ja) | 2020-04-28 |
CN108886642B (zh) | 2021-05-14 |
TW201737711A (zh) | 2017-10-16 |
EP3437327B1 (en) | 2019-12-25 |
EP3437327A1 (en) | 2019-02-06 |
BR112018069708A2 (pt) | 2019-02-05 |
KR20180127997A (ko) | 2018-11-30 |
ES2781307T3 (es) | 2020-09-01 |
WO2017172783A1 (en) | 2017-10-05 |
CA3015942C (en) | 2021-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI699994B (zh) | 在高效率視頻寫碼及分層高效率視頻寫碼檔案格式之頻塊分組的改良 | |
US10298938B2 (en) | Sample entry and operation point signalling in a layered video file format | |
CN107750458B (zh) | 视频编码方法、编解码装置及介质 | |
US10291923B2 (en) | Mapping of tile grouping and samples in HEVC and L-HEVC file formats | |
TWI763669B (zh) | 分開之檔案軌中之序列結束及位元流結束網路提取層(nal)單元 | |
TWI645710B (zh) | 多層視訊檔案格式設計 | |
US10349067B2 (en) | Handling of end of bitstream NAL units in L-HEVC file format and improvements to HEVC and L-HEVC tile tracks |