TW201842785A - 作為分隔符及可定址之資源識別符之區段類型 - Google Patents

作為分隔符及可定址之資源識別符之區段類型 Download PDF

Info

Publication number
TW201842785A
TW201842785A TW107111995A TW107111995A TW201842785A TW 201842785 A TW201842785 A TW 201842785A TW 107111995 A TW107111995 A TW 107111995A TW 107111995 A TW107111995 A TW 107111995A TW 201842785 A TW201842785 A TW 201842785A
Authority
TW
Taiwan
Prior art keywords
cmaf
fragments
value
styp
header
Prior art date
Application number
TW107111995A
Other languages
English (en)
Inventor
湯瑪士 史塔克漢莫
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW201842785A publication Critical patent/TW201842785A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • H04L65/612Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for unicast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23614Multiplexing of additional data and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4348Demultiplexing of additional data and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本發明提供一種用於處理媒體資料之實例裝置,其經組態以:剖析包括該媒體資料之一位元串流,該位元串流係根據共同媒體應用格式(CMAF)而格式化;在該剖析期間偵測該位元串流之一CMAF播放軌檔案的一檔案類型(FTYP)值;判定該CMAF播放軌檔案之一CMAF標頭以該FTYP值開始;及處理在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段。該裝置可另外經組態以:偵測該位元串流中之一或多個區段類型(STYP)值;判定該一或多個STYP值中之每一者對應於該等CMAF片段中之一各別者的一開始;及處理自該對應STYP值開始的該等CMAF片段中之每一者。

Description

作為分隔符及可定址之資源識別符之區段類型
本發明係關於媒體資料之儲存及輸送。
數位媒體能力可併入至廣泛範圍的裝置中,包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、數位攝影機、數位記錄裝置、數位媒體播放器、視訊遊戲裝置、視訊遊戲控制台、蜂巢式或衛星無線電電話、視訊電話會議裝置及類似者。數位視訊裝置實施視訊壓縮技術,諸如描述於由MPEG-2、MPEG-4、ITU-T H.263或ITU-T H.264/MPEG-4、第10部分、進階視訊寫碼(AVC)、ITU-T H.265 (亦參考高效率視訊寫碼(HEVC))及此類標準之擴展所定義的標準中之彼等技術,從而更為有效地傳輸且接收數位視訊資訊。 在媒體資料已編碼之後,可將媒體資料封包化以用於傳輸或儲存。可以將媒體資料組譯成符合多種標準中之任一者的視訊檔案,該等標準諸如國際標準化組織(ISO)基本媒體檔案格式及其擴展,諸如AVC。
一般而言,本發明描述使用資料類型(例如區段類型及/或檔案類型)作為分隔符、類型指示符及遞送指示符的技術。此等技術可允許以撓性簡單方式使用此等資料類型以提供此等指示中之任一者或所有。以此方式,所產生內容可用於不同遞送及/或消耗環境中,並且允許如下文更詳細地論述之封裝。 在一個實例中,一種處理媒體資料之方法包括:藉由實施於電路系統中之一處理器剖析根據共同媒體應用格式(CMAF)格式化之包括資料的一位元串流;藉由該處理器及在該剖析期間,偵測該位元串流之一CMAF播放軌檔案的一檔案類型(FTYP)值;藉由該處理器判定該CMAF播放軌檔案之一CMAF標頭以該FTYP值開始;及藉由該處理器處理在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段。 在另一實例中,一種用於處理媒體資料之裝置包括:一記憶體,其用於儲存媒體資料;及一或多個處理器,其實施於電路系統中且經組態以:剖析包括該媒體資料之一位元串流,該位元串流係根據共同媒體應用格式(CMAF)格式化;在該剖析期間偵測該位元串流之一CMAF播放軌檔案的一檔案類型(FTYP)值;判定該CMAF播放軌檔案之一CMAF標頭以該FTYP值開始;及處理在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段。 在另一實例中,一種用於處理媒體資料之裝置包括:用於剖析根據共同媒體應用格式(CMAF)格式化之包括資料之一位元串流的構件;用於在該剖析期間偵測該位元串流之一CMAF播放軌檔案的一檔案類型(FTYP)值的構件;用於判定該CMAF播放軌檔案之一CMAF標頭以該FTYP值開始的構件;及用於處理在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段的構件。 在另一實例中,一種電腦可讀儲存媒體(其可為非暫時性)在其上儲存有指令,該等指令當經執行時致使一處理器執行以下操作:剖析根據共同媒體應用格式(CMAF)格式化之包括資料之一位元串流;在該剖析期間偵測該位元串流之一CMAF播放軌檔案的一檔案類型(FTYP)值;判定該CMAF播放軌檔案之一CMAF標頭以該FTYP值開始;及處理在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段。 在另一實例中,一種產生包括媒體資料之一位元串流的方法包括:藉由實施於電路系統中之一處理器產生一CMAF播放軌檔案之一共同媒體應用格式(CMAF)標頭;藉由該處理器設定指示該CMAF標頭之開始的該CMAF標頭之一檔案類型(FTYP)值的一值;藉由該處理器於在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段中囊封媒體資料之一或多個樣本;及藉由該處理器產生包括該CMAF標頭及該CMAF播放軌檔案之一位元串流,該一或多個CMAF片段在該CMAF播放軌檔案中之該CMAF標頭之後。 在另一實例中,一種用於產生包括媒體資料之一位元串流的裝置包括:一記憶體,其經組態以儲存媒體資料;及一或多個處理器,其實施於電路系統中且經組態以:藉由實施於電路系統中之一處理器產生該媒體資料之一CMAF播放軌檔案的一共同媒體應用格式(CMAF)標頭;設定指示該CMAF標頭之開始的該CMAF標頭之一檔案類型(FTYP)值的一值;於在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段中囊封該媒體資料之一或多個樣本;及產生包括該CMAF標頭及該CMAF播放軌檔案之一位元串流,該一或多個CMAF片段在該CMAF播放軌檔案中之該CMAF標頭之後。 在另一實例中,一種用於產生包括媒體資料之一位元串流的裝置包括:用於產生一CMAF播放軌檔案的一共同媒體應用格式(CMAF)標頭的構件;用於設定指示該CMAF標頭之開始的該CMAF標頭之一檔案類型(FTYP)值的一值的構件;用於於在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段中囊封媒體資料之一或多個樣本的構件;及用於產生包括該CMAF標頭及該CMAF播放軌檔案之一位元串流的構件,該一或多個CMAF片段在該CMAF播放軌檔案中之該CMAF標頭之後。 在另一實例中,一種電腦可讀儲存媒體(其可為非暫時性)在其上儲存有指令,該等指令在經執行時致使一處理器執行以下操作:產生一CMAF播放軌檔案之一共同媒體應用格式(CMAF)標頭;設定指示該CMAF標頭之開始的該CMAF標頭之一檔案類型(FTYP)值的一值;於在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段中囊封媒體資料之一或多個樣本;及產生包括該CMAF標頭及該CMAF播放軌檔案之一位元串流,該一或多個CMAF片段在該CMAF播放軌檔案中之該CMAF標頭之後。 在以下隨附圖式及描述中闡述一或多個實例之細節。其他特徵、目標及優點將自實施方式及圖式以及申請專利範圍而顯而易見。
相關申請案 本申請案主張2017年4月4日申請之美國臨時申請案第62 /481 ,594 號之權利,該申請案之全部內容以引用的方式併入本文中。 一般而言,本發明描述使用資料類型(例如區段類型及/或檔案類型)作為分隔符、類型指示符及遞送指示符的技術。 HTTP動態自適應串流(DASH)描述使用區段作為媒體資料(例如具有唯一統一資源定位符(URL)之檔案)的可遞送容器。區段具有由「區段類型」或「styp」語法要素描述的類型。檔案亦具有由「檔案類型」或「ftyp」語法要素描述的檔案類型。此等語法要素可形成根據例如ISO基本媒體檔案格式(ISO BMFF)或ISO BMFF之擴展的檔案格式資訊之部分。 符合ISO BMFF或ISO BMFF之擴展的檔案可進一步包括根據共同媒體應用格式(CMAF)格式化的媒體資料。CMAF內容用於不同階段:在內容準備階段、在遞送層級,及在內容消耗階段(例如,用於至接收裝置之介面,諸如媒體源擴展(MSE)介面)。 一般而言,在無資訊清單檔案(諸如DASH媒體呈現描述(MPD))的情況下識別CMAF資料結構。在內容準備之後,分隔符通常包括於位元組串流/檔案中以識別CMAF資料結構。在遞送層級處,經遞送對象之類型應係可識別的。對於播放引擎之介面(諸如MSE),資料結構可經識別以用於提取,例如,允許播放及跨越不同CMAF播放軌切換。一般而言,CMAF資料結構之識別應係簡單的,且遵循CMAF結構。 本發明之技術可應用於符合根據以下各者中之任一者囊封之視訊資料的視訊檔案:ISO基本媒體檔案格式、可縮放視訊寫碼(SVC)檔案格式、進階視訊寫碼(AVC)檔案格式、第三代合作夥伴計劃(3GPP)檔案格式及/或多視圖視訊寫碼(MVC)檔案格式或其他類似視訊檔案格式。 在HTTP串流中,頻繁使用之操作包括HEAD、GET及部分GET。HEAD操作擷取與給定的統一資源定位符(URL)或統一資源名稱(URN)相關聯之檔案的標頭,但不擷取與URL或URN相關聯之有效負載。GET操作擷取與給定URL或URN相關聯之整個檔案。部分GET操作接收位元組範圍作為輸入參數且擷取檔案之連續數目個位元組,其中位元組之數目對應於所接收位元組範圍。因此,可提供電影片段以用於HTTP串流,此係因為部分GET操作能夠得到一或多個個別的電影片段。在電影片段中,可能存在不同播放軌之若干播放軌片段。在HTTP串流中,媒體呈現可為用戶端可存取之資料之結構化集合。用戶端可請求且下載媒體資料資訊以向使用者呈現串流服務。 在使用HTTP串流來串流3GPP資料之實例中,可能存在多媒體內容之視訊及/或音訊資料的多個表示。如下文所解釋,不同表示可對應於不同寫碼特性(例如,視訊寫碼標準之不同設定檔或層級)、不同寫碼標準或寫碼標準之擴展(諸如多視圖及/或可縮放擴展)或不同位元速率。此等表示之資訊清單可在媒體呈現描述(MPD)資料結構中定義。媒體呈現可對應於HTTP串流用戶端裝置可存取之資料的結構化集合。HTTP串流用戶端裝置可請求且下載媒體資料資訊以向用戶端裝置之使用者呈現串流服務。媒體呈現可在MPD資料結構中描述,MPD資料結構可包括MPD之更新。 媒體呈現可含有一或多個週期之序列。每一週期可延長,直至下一週期開始為止,或在最後一個週期的情況下,直至媒體呈現結束為止。每一週期可含有針對同一媒體內容之一或多個表示。表示可為音訊、視訊、計時文字或其他此類資料之數個替代性經編碼版本中之一者。表示可因編碼類型而異(例如,對於視訊資料,因位元速率、剖析度及/或編碼解碼器而異,及對於音訊資料,因位元速率、語言及/或編碼解碼器而異)。術語表示可用以指代經編碼音訊或視訊資料的對應於多媒體內容之特定週期且以特定方式編碼之部分。 特定週期之表示可指派至由MPD中之屬性(其指示表示所屬之調適集)指示之群組。同一調適集中之表示通常被視為彼此之替代,此係因為用戶端裝置可在此等表示之間動態地且順暢地切換,例如執行寬頻調適。舉例而言,特定週期之視訊資料之每一表示可指派至同一調適集,以使得可選擇該等表示中之任一者進行解碼以呈現對應週期之多媒體內容的媒體資料(諸如視訊資料或音訊資料)。在一些實例中,一個週期內之媒體內容可由來自群組0 (若存在)之一個表示來表示,或由來自每一非零群組的至多一個表示之組合來表示。週期之每一表示之時序資料可相對於該週期之開始時間來表達。 一表示可包括一或多個區段。每一表示可包括初始化區段,或表示之每一區段可自初始化。當存在時,初始化區段可含有用於存取表示之初始化資訊。大體而言,初始化區段不含有媒體資料。區段可由識別符唯一地參考,識別符諸如統一資源定位符(URL)、統一資源名稱(URN)或統一資源識別符(URI)。MPD可為每一區段提供識別符。在一些實例中,MPD亦可提供呈範圍屬性之形式的位元組範圍,該等範圍屬性可對應於可由URL、URN或URI存取之檔案內之區段的資料。 可選擇不同表示以用於大體上同時擷取不同類型之媒體資料。舉例而言,用戶端裝置可選擇音訊表示、視訊表示及計時文字表示,自該等表示擷取區段。在一些實例中,用戶端裝置可選擇特定調適集以用於執行頻寬調適。亦即,用戶端裝置可選擇包括視訊表示之調適集、包括音訊表示之調適集及/或包括計時文字之調適集。替代地,用戶端裝置可選擇用於特定類型媒體(例如視訊)之調適集,且直接選擇用於其他類型之媒體(例如音訊及/或計時文字)的表示。 圖1為說明實施用於經由網路而串流媒體資料之技術之實例系統10的方塊圖。在此實例中,系統10包括內容準備裝置20、伺服器裝置60及用戶端裝置40。用戶端裝置40及伺服器裝置60藉由網路74以通信方式耦接,網路74可包含網際網路。在一些實例中,內容準備裝置20與伺服器裝置60亦可藉由網路74或另一網路耦接,或可直接以通信方式耦接。在一些實例中,內容準備裝置20及伺服器裝置60可包含相同裝置。 在圖1之實例中,內容準備裝置20包含音訊源22及視訊源24。音訊源22可包含(例如)麥克風,其產生表示待藉由音訊編碼器26編碼之所俘獲音訊資料的電信號。替代地,音訊源22可包含儲存媒體(其儲存先前記錄之音訊資料)、音訊資料產生器(諸如電腦化之合成器)或任何其他音訊資料源。視訊源24可包含:視訊攝影機,其產生待藉由視訊編碼器28編碼之視訊資料;儲存媒體,其編碼有先前記錄之視訊資料;視訊資料產生單元,諸如電腦圖形源;或任何其他視訊資料源。內容準備裝置20未必在所有實例中均以通信方式耦接至伺服器裝置60,而可將多媒體內容儲存至由伺服器裝置60讀取之單獨媒體。 原始音訊及視訊資料可包含類比或數位資料。類比資料在由音訊編碼器26及/或視訊編碼器28編碼之前可被數位化。音訊源22可在說話參與者說話時自說話參與者獲得音訊資料,且視訊源24可同時獲得說話參與者之視訊資料。在其他實例中,音訊源22可包含包含所儲存之音訊資料的電腦可讀儲存媒體,且視訊源24可包含包含所儲存之視訊資料的電腦可讀儲存媒體。以此方式,本發明中所描述之技術可應用於實況、串流、即時音訊及視訊資料或經存檔、預先記錄之音訊及視訊資料。 對應於視訊圖框之音訊圖框通常為含有藉由音訊源22俘獲(或產生)之音訊資料的音訊圖框,音訊資料同時伴隨含於視訊圖框內的藉由視訊源24俘獲(或產生)之視訊資料。舉例而言,當說話參與者通常藉由說話而產生音訊資料時,音訊源22俘獲音訊資料,且視訊源24同時(亦即,在音訊源22正俘獲音訊資料之同時)俘獲說話參與者之視訊資料。因此,音訊圖框可在時間上對應於一或多個特定視訊圖框。因此,對應於視訊圖框之音訊圖框大體上對應於同時俘獲到音訊資料及視訊資料且音訊圖框及視訊圖框分別包含同時俘獲到之音訊資料及視訊資料的情形。 在一些實例中,音訊編碼器26可對每一經編碼音訊圖框中表示記錄經編碼音訊圖框之音訊資料之時間的時戳進行編碼,且類似地,視訊編碼器28可對每一經編碼視訊圖框中表示記錄經編碼視訊圖框之視訊資料之時間的時戳進行編碼。在此等實例中,對應於視訊圖框之音訊圖框可包含:包含時戳之音訊圖框及包含同一時戳之視訊圖框。內容準備裝置20可包括內部時鐘,音訊編碼器26及/或視訊編碼器28可根據該內部時鐘產生時戳,或音訊源22及視訊源24可使用該內部時鐘以分別使音訊資料及視訊資料與時戳相關聯。 在一些實例中,音訊源22可向音訊編碼器26發送對應於記錄音訊資料之時間的資料,且視訊源24可向視訊編碼器28發送對應於記錄視訊資料之時間的資料。在一些實例中,音訊編碼器26可對經編碼音訊資料中之序列識別符進行編碼以指示經編碼音訊資料之相對時間排序,但未必指示記錄音訊資料之絕對時間,且類似地,視訊編碼器28亦可使用序列識別符來指示經編碼視訊資料之相對時間排序。類似地,在一些實例中,序列識別符可映射或以其他方式與時戳相關。 音訊編碼器26通常產生經編碼音訊資料之串流,而視訊編碼器28產生經編碼視訊資料之串流。每一個別資料串流(不論音訊或視訊)可被稱作基本串流。基本串流為表示之單一的經數位寫碼(可能經壓縮)之分量。舉例而言,表示之經寫碼視訊或音訊部分可為基本串流。基本串流可在被囊封於視訊檔案內之前被轉換成封包化基本串流(PES)。在相同表示內,可使用串流ID來區分屬於一個基本串流的PES封包與屬於其他基本串流的PES封包。基本串流之資料之基本單元為封包化基本串流(PES)封包。因此,經寫碼視訊資料通常對應於基本視訊串流。類似地,音訊資料對應於一或多個各別基本串流。 許多視訊寫碼標準(諸如,ITU-T H.264/AVC及即將來臨的高效視訊寫碼(HEVC)標準)界定無誤差位元串流之語法、語義及解碼過程,該等無誤差位元串流中之任一者符合特定設定檔或層級。視訊寫碼標準通常並不指定編碼器,但編碼器具有保證所產生之位元串流對於解碼器而言係標準相容之任務。在視訊寫碼標準之上下文中,「設定檔」對應於演算法、特徵或工具及施加至演算法、特徵或工具之限制的子集。如(例如)H.264標準所定義,「設定檔」為由H.264標準指定的整個位元串流語法之子集。「層級」對應於解碼器資源消耗,諸如解碼器記憶體及計算之限制,該等限制係關於圖像剖析度、位元速率及區塊處理速率。設定檔可用profile_idc (設定檔指示符)值發信,而層級可用level_idc (層級指示符)值發信。 舉例而言,H.264標準認為,在由給定設定檔之語法所強加的界限內,仍然可能需要編碼器及解碼器之效能有較大變化,此取決於位元串流中之語法要素(諸如,經解碼圖像之指定大小)所取的值。H.264標準進一步認為,在許多應用中,實施能夠處理特定設定檔內之語法之所有假設使用的解碼器既不實際又不經濟。因此,H.264標準將「層級」定義為強加於位元串流中之語法要素之值的約束之指定集。此等約束可為對值的簡單限制。替代地,此等約束可呈對值之算術組合(例如,圖像寬度乘以圖像高度乘以每秒解碼的圖像數目)之約束的形式。H.264標準進一步規定,個別實施對於每一所支援設定檔可支援不同層級。 符合設定檔之解碼器一般支援設定檔中所定義之所有特徵。舉例而言,作為寫碼特徵,B圖像寫碼在H.264/AVC之基線設定檔不被支援,但在H.264/AVC之其他設定檔中被支援。符合一層級之解碼器應能夠對不需要超出該層級中所定義之限制的資源之任何位元串流進行解碼。設定檔及層級之定義可對可解釋性有幫助。舉例而言,在視訊傳輸期間,可針對整個傳輸工作階段協商及同意一對設定檔定義及層級定義。更具體言之,在H.264/AVC中,層級可定義對於需要處理之巨集區塊的數目、經解碼圖像緩衝器(DPB)大小、經寫碼圖像緩衝器(CPB)大小、垂直運動向量範圍、每兩個連續MB的運動向量之最大數目及B區塊是否可具有小於8×8像素之子巨集區塊分區的限制。以此方式,解碼器可判定解碼器是否能夠適當地對位元串流進行解碼。 在圖1之實例中,內容準備裝置20之囊封單元30自視訊編碼器28接收包含經寫碼視訊資料之基本串流且自音訊編碼器26接收包含經寫碼音訊資料之基本串流。在一些實例中,視訊編碼器28及音訊編碼器26可各自包括用於自經編碼資料形成PES封包之封包化器。在其他實例中,視訊編碼器28及音訊編碼器26可各自與用於自經編碼資料形成PES封包之相應封包化器介接。在另外其他實例中,囊封單元30可包括用於自經編碼音訊及視訊資料形成PES封包之封包化器。 視訊編碼器28可以多種方式對多媒體內容之視訊資料進行編碼,從而以各種位元速率且以各種特性產生多媒體內容之不同表示,該等特性諸如像素剖析度、圖框速率、對各種寫碼標準之符合性、對各種寫碼標準之各種設定檔及/或設定檔層級之符合性、具有一或多個視圖之表示(例如,對於二維或三維播放)或其他此類特性。如本發明中所使用,表示可包含音訊資料、視訊資料、文字資料(例如,用於封閉字幕)或其他此類資料中之一者。表示可包括諸如音訊基本串流或視訊基本串流之基本串流。每一PES封包可包括stream_id,該stream_id 識別PES封包所屬之基本串流。囊封單元30負責將基本串流組譯成各種表示之視訊檔案(例如,區段)。 囊封單元30自音訊編碼器26及視訊編碼器28接收表示之基本串流的PES封包且自該等PES封包形成對應的網路抽象層(NAL)單元。寫碼視訊區段可經組織成NAL單元,其提供「網路友好」視訊表示定址應用程式,諸如視訊電話、儲存器、廣播或串流。NAL單元可分類為視訊寫碼層(VCL)NAL單元及非VCL NAL單元。VCL單元可含有核心壓縮引擎,且可包括區塊、巨集區塊及/或圖塊層級資料。其他NAL單元可為非VCL NAL單元。在一些實例中,一個時間執行個體中之經寫碼圖像(通常呈現為初級經寫碼圖像)可含於存取單元中,該存取單元可包括一或多個NAL單元。 非VCL NAL單元可尤其包括參數集NAL單元及SEI NAL單元。參數集可含有序列層級標頭資訊(在序列參數集(SPS)中)及不頻繁改變的圖像層級標頭資訊(在圖像參數集(PPS)中)。對於參數集(例如,PPS及SPS),不頻繁改變的資訊不需要關於每一序列或圖像重複,因此可改良寫碼效率。此外,使用參數集可實現重要標頭資訊之帶外傳輸,從而避免對於用於抗誤碼之冗餘傳輸的需要。在帶外傳輸實例中,參數集NAL單元可在與其他NAL單元(諸如,SEI NAL單元)不同之頻道上傳輸。 補充增強資訊(SEI)可含有對於對來自VCL NAL單元之經寫碼圖像樣本進行解碼並非必需的資訊,但可輔助與解碼、顯示、抗誤碼及其他目的相關的過程。SEI訊息可含於非VCL NAL單元中。SEI訊息為一些標準規範之標準化部分,且因此對於標準相容之解碼器實施並非始終係必選的。SEI訊息可為序列層級SEI訊息或圖像層級SEI訊息。某一序列層級資訊可含於SEI訊息中,諸如SVC之實例中的可性資訊SEI訊息,及MVC中之視圖可縮放性資訊SEI訊息。此等實例SEI訊息可傳達關於例如操作點之提取及操作點之特性的資訊。另外,囊封單元30可形成資訊清單檔案,諸如描述表示之特性的媒體呈現描述符(MPD)。囊封單元30可根據可延伸標示語言(XML)來格式化MPD。 囊封單元30可向輸出介面32提供多媒體內容之一或多個表示的資料以及資訊清單檔案(例如,MPD)。輸出介面32可包含網路介面或用於對儲存媒體進行寫入之介面,諸如通用串流匯流排(USB)介面、CD或DVD寫入器或燒錄器、至磁性或快閃儲存媒體之介面,或用於儲存或傳輸媒體資料之其他介面。囊封單元30可向輸出介面32提供多媒體內容之表示中之每一者的資料,該輸出介面可經由網路傳輸或儲存媒體向伺服器裝置60發送該資料。在圖1之實例中,伺服器裝置60包括儲存各種多媒體內容64之儲存媒體62,每一多媒體內容64包括各別資訊清單檔案66及一或多個表示68A至68N (表示68)。在一些實例中,輸出介面32亦可將資料直接發送至網路74。 在一些實例中,表示68可分成若干調適集。亦即,表示68之各種子集可包括各別共同特性集合,諸如編碼解碼器、設定檔及層級、剖析度、視圖數目、區段之檔案格式、可識別待與待解碼及呈現之表示及/或音訊資料(例如,由揚聲器發出)一起顯示的文字之語言或其他特性的文字類型資訊、可描述調適集中之表示之場景的攝影機角度或真實世界攝影機視角的攝影機角度資訊、描述對於特定觀眾之內容適合性的分級資訊,或其類似資訊。 資訊清單檔案66可包括指示對應於特定調適集之表示68之子集以及該等調適集之共同特性的資料。資訊清單檔案66亦可包括表示調適集之個別表示的個別特性(諸如位元速率)之資料。以此方式,調適集可提供簡化的網路頻寬調適。調適集中之表示可使用資訊清單檔案66之調適集要素的子代要素來指示。 伺服器裝置60包括請求處理單元70及網路介面72。在一些實例中,伺服器裝置60可包括複數個網路介面。此外,伺服器裝置60之特徵中之任一者或全部可在內容遞送網路之其他裝置(諸如,路由器、橋接器、代理裝置、交換器或其他裝置)上實施。在一些實例中,內容遞送網路之中間裝置可快取多媒體內容64之資料,且包括大體上符合伺服器裝置60之彼等組件之組件。一般而言,網路介面72經組態以經由網路74發送及接收資料。 請求處理單元70經組態以自用戶端裝置(諸如,用戶端裝置40)接收對儲存媒體62之資料的網路請求。舉例而言,請求處理單元70可實施超文字傳送協定(HTTP)版本1.1,如RFC 2616中R.Fielding等人於1999年6月在網路工作群小組, IETF的「Hypertext Transfer Protocol - HTTP/1.1」中所描述。亦即,請求處理單元70可經組態以接收HTTP GET或部分GET請求,且回應於該等請求而提供多媒體內容64之資料。請求可例如使用區段之URL來指定表示68中之一者的區段。在一些實例中,該等請求亦可指定區段之一或多個位元組範圍,從而包含部分GET請求。請求處理單元70可經進一步組態以服務於HTTP HEAD請求以提供表示68中之一者之區段的標頭資料。在任何情況下,請求處理單元70可經組態以處理該等請求以向請求裝置(諸如用戶端裝置40)提供所請求之資料。 另外或替代地,請求處理單元70可經組態以經由諸如eMBMS之廣播或多播協定遞送媒體資料。內容準備裝置20可以與所描述之方式大體上相同的方式產生DASH區段及/或子區段,但伺服器裝置60可使用eMBMS或另一廣播或多播網路傳送協定來遞送此等區段或子區段。舉例而言,請求處理單元70可經組態以自用戶端裝置40接收多播群組加入請求。亦即,伺服器裝置60可向用戶端裝置(包括用戶端裝置40)公告與多播群組相關聯之網際網路協定(IP)位址,其與特定媒體內容(例如,實況事件之廣播)相關聯。用戶端裝置40轉而可提交加入多播群組之請求。此請求可遍及網路74 (例如,構成網路74之路由器)傳播,以使得促使該等路由器將去往與多播群組相關聯之IP位址的訊務導向至訂用的用戶端裝置(諸如用戶端裝置40)。 如圖1之實例中所說明,多媒體內容64包括資訊清單檔案66,該資訊清單檔案66可對應於媒體呈現描述(MPD)。資訊清單檔案66可含有不同替代表示68 (例如,具有不同品質之視訊服務)的描述,且該描述可包括例如編碼解碼器資訊、設定檔值、層級值、位元速率及表示68之其他描述性特性。用戶端裝置40可擷取媒體呈現之MPD以判定如何存取表示68之區段。 詳言之,擷取單元52可擷取用戶端裝置40之組態資料(未展示)以判定視訊解碼器48之解碼能力及視訊輸出端44之再現能力。組態資料亦可包括由用戶端裝置40之使用者選擇的語言偏好中之任一者或全部、對應於由用戶端裝置40之使用者設定的深度偏好之一或多個攝影機視角及/或由用戶端裝置40之使用者選擇的分級偏好。舉例而言,擷取單元52可包含網頁瀏覽器或媒體用戶端,其經組態以提交HTTP GET及部分GET請求。擷取單元52可對應於由用戶端裝置40之一或多個處理器或處理單元(未展示)執行的軟體指令。在一些實例中,關於擷取單元52所描述的功能性之全部或部分可在硬體或硬體、軟體及/或韌體之組合中實施,其中可提供必需的硬體以執行軟體或韌體之指令。 擷取單元52可將用戶端裝置40之解碼及再現能力與由資訊清單檔案66之資訊所指示之表示68的特性進行比較。擷取單元52可最初擷取資訊清單檔案66之至少一部分以判定表示68之特性。舉例而言,擷取單元52可請求描述一或多個調適集之特性的資訊清單檔案66之一部分。擷取單元52可選擇具有用戶端裝置40之寫碼及再現能力可滿足的特性之表示68之子集(例如調適集)。擷取單元52可接著判定調適集中之表示的位元速率,判定網路頻寬之當前可用量,且自具有網路頻寬可滿足之位元速率的表示中之一者擷取區段。 一般而言,較高位元速率表示可產生較高品質之視訊播放,而較低位元速率表示可在可用網路頻寬減少時提供足夠品質之視訊播放。因此,當可用網路頻寬相對高時,擷取單元52可自相對高位元速率之表示擷取資料,而當可用網路頻寬較低時,擷取單元52可自相對低位元速率之表示擷取資料。以此方式,用戶端裝置40可經由網路74串流傳輸多媒體資料,同時亦適應網路74之改變的網路頻寬可用性。 另外或可替代地,擷取單元52可經組態以根據諸如eMBMS或IP多播之廣播或多播網路協定來接收資料。在此等實例中,擷取單元52可提交加入與特定媒體內容相關聯之多播網路群組的請求。在加入多播群組之後,擷取單元52可在另外請求未發出至伺服器裝置60或內容準備裝置20的情況下接收多播群組之資料。擷取單元52可提交當不再需要多播群組之資料時離開多播群組的請求,例如停止播放或將頻道改變至不同多播群組。 網路介面54可接收經選定表示之區段的資料且將該資料提供至擷取單元52,擷取單元52又可將該等區段提供至解囊封單元50。解囊封單元50可將視訊檔案之要素解囊封成組成性PES串流,解封包化該等PES串流以擷取經編碼資料,且取決於經編碼資料為音訊串流抑或視訊串流之部分(例如,如由串流之PES封包標頭所指示)而將經編碼資料發送至音訊解碼器46或視訊解碼器48。音訊解碼器46解碼經編碼音訊資料,且將經解碼音訊資料發送至音訊輸出端42,而視訊解碼器48解碼經編碼視訊資料,且將經解碼視訊資料發送至視訊輸出端44,經解碼視訊資料可包括串流之複數個視圖。 視訊編碼器28、視訊解碼器48、音訊編碼器26、音訊解碼器46、囊封單元30、擷取單元52及解囊封單元50各自可實施為適用的多種合適處理電路系統中之任一者,合適處理電路系統諸如一或多個微處理器、數位信號處理器(DSP)、特定應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯電路系統、軟體、硬體、韌體或其任何組合。視訊編碼器28及視訊解碼器48中之每一者可包括於一或多個編碼器或解碼器中,編碼器或解碼器中之任一者可經整合為組合式視訊編碼器/解碼器(CODEC)之部分。同樣地,音訊編碼器26及音訊解碼器46中之每一者可包括於一或多個編碼器或解碼器中,編碼器或解碼器中之任一者可經整合為組合式CODEC之部分。包括視訊編碼器28、視訊解碼器48、音訊編碼器26、音訊解碼器46、囊封單元30、擷取單元52及/或解囊封單元50的設備可包含積體電路、微處理器及/或無線通信裝置,諸如蜂巢式電話。 用戶端裝置40、伺服器裝置60及/或內容準備裝置20可經組態以根據本發明之技術操作。出於實例之目的,本發明關於用戶端裝置40及伺服器裝置60描述此等技術。然而,應理解,替代伺服器裝置60 (或除此之外),內容準備裝置20可經組態以執行此等技術。 囊封單元30可形成NAL單元,該等NAL單元包含識別NAL所屬之節目的標頭,以及有效負載,例如音訊資料、視訊資料或描述NAL單元對應於的輸送或節目串流的資料。舉例而言,在H.264/AVC中,NAL單元包括1位元組標頭及不同大小之有效負載。在有效負載中包括視訊資料之NAL單元可包含各種粒度層級之視訊資料。舉例而言,NAL單元可包含視訊資料區塊、複數個區塊、視訊資料之圖塊或視訊資料之整個圖像。囊封單元30可自視訊編碼器28接收呈基本串流之PES封包之形式的經編碼視訊資料。囊封單元30可使每一基本串流與對應程式相關聯。 囊封單元30亦可組譯來自複數個NAL單元之存取單元。一般而言,存取單元可包含用於表示視訊資料之圖框以及對應於該圖框之音訊資料(當此音訊資料可用時)的一或多個NAL單元。存取單元通常包括一個輸出時間執行個體之所有NAL單元,例如,一個時間執行個體之所有音訊及視訊資料。舉例而言,若每一視圖具有20圖框每秒(fps)之圖框速率,則每一時間執行個體可對應於0.05秒之時間間隔。在此時間間隔期間,可同時再現相同存取單元(相同時間執行個體)之所有視圖的特定圖框。在一個實例中,存取單元可包含一個時間執行個體中之經寫碼圖像,其可呈現為初級經寫碼圖像。 因此,存取單元可包含共同時間執行個體之所有音訊圖框及視訊圖框,例如對應於時間X 之所有視圖。本發明亦將特定視圖之經編碼圖像稱為「視圖分量」。亦即,視圖分量可包含在特定時間針對特定視圖的經編碼圖像(或圖框)。因此,存取單元可被定義為包含共同時間執行個體之所有視圖分量。存取單元之解碼次序未必需要與輸出或顯示次序相同。 媒體呈現可包括媒體呈現描述(MPD),該媒體呈現描述可含有不同替代表示(例如,具有不同品質之視訊服務)的描述,且該描述可包括例如編碼解碼器資訊、設定檔值及層級值。MPD為資訊清單檔案(諸如資訊清單檔案66)之一個實例。用戶端裝置40可擷取媒體呈現之MPD以判定如何存取各種呈現之電影片段。電影片段可位於視訊檔案之電影片段邏輯框(moof邏輯框)中。 資訊清單檔案66 (其可包含(例如)MPD)可公告表示68之區段之可用性。亦即,MPD可包括指示表示68中之一者之第一區段變得可用時之掛鐘時間的資訊,以及指示表示68內之區段之持續時間的資訊。以此方式,用戶端裝置40之擷取單元52可基於開始時間以及在特定區段之前的區段之持續時間而判定何時每一區段可用。 在囊封單元30已基於所接收之資料將NAL單元及/或存取單元組譯成視訊檔案之後,囊封單元30將視訊檔案傳遞至輸出介面32以用於輸出。在一些實例中,囊封單元30可將視訊檔案儲存在本端,或經由輸出介面32而將視訊檔案發送至遠端伺服器,而非將視訊檔案直接發送至用戶端裝置40。輸出介面32可包含(例如)傳輸器、收發器、用於寫入資料至電腦可讀媒體之裝置,諸如光碟機、磁性媒體驅動器(例如軟碟機)、通用串列匯流排(USB)埠、網路介面或其他輸出介面。輸出介面32將視訊檔案輸出至電腦可讀媒體,諸如傳輸信號、磁性媒體、光學媒體、記憶體、隨身碟或其他電腦可讀媒體。 網路介面54可經由網路74接收NAL單元或存取單元,且經由擷取單元52將NAL單元或存取單元提供至解囊封單元50。解囊封單元50可將視訊檔案之要素解囊封成組成性PES串流,解封包化該等PES串流以擷取經編碼資料,且取決於經編碼資料為音訊串流抑或視訊串流之部分(例如,如由串流之PES封包標頭所指示)而將經編碼資料發送至音訊解碼器46或視訊解碼器48。音訊解碼器46解碼經編碼音訊資料,且將經解碼音訊資料發送至音訊輸出端42,而視訊解碼器48解碼經編碼視訊資料,且將經解碼視訊資料發送至視訊輸出端44,經解碼視訊資料可包括串流之複數個視圖。 根據本發明之技術,囊封單元30可出於多種目的而使用單一類型之發信,例如,內容準備階段、遞送層級及/或內容消耗階段中之任一者或全部。同樣,擷取單元52可出於此等目的中之任一者或全部而使用此單一類型之發信。 在一個實例中,單一類型之發信為包括充當一或多個CMAF播放軌之識別符之值的檔案類型(ftyp)邏輯框。因此,囊封單元30可設定ftyp邏輯框之值,且擷取單元52可讀取ftyp邏輯框之值。另外,請求處理單元70亦可讀取ftyp邏輯框之值。此等組件可在內容準備、遞送及/或內容消耗中之任一者或全部期間使用ftyp邏輯框之值。 另外或替代地,單一類型發信可為包括充當一或多個CMAF播放軌之識別符之值的區段類型(styp)邏輯框。styp邏輯框可充當用以識別CMAF片段及/或組塊之邊界的分隔符、用於CMAF資料結構之識別符、用於DASH區段(或用於其他網路串流技術之區段)之識別符,及/或充當用於處理需求之識別符。因此,囊封單元30可指定用於表示CMAF片段及/或區段之組塊的邊界中之任一者或全部、用於區段之CMAF資料結構之識別符、用於DASH區段之識別符及/或用於區段之媒體資料的處理需求之識別符的區段之一或多個styp邏輯框的值。一般而言,styp邏輯框係可選的且可或可不使用,以避免具有後向相容性及額外負擔的問題。 以下表1表示根據本發明之技術的類型值之實例「品牌」,包括每一品牌類型之位置及實例符合性需求: 1 以下表2至表6表示可根據本發明之技術使用的額外實例資料結構: 2 CMAF 播放軌檔案 3 CMAF 標頭 4 CMAF 區段 5 CMAF 片段 6 CMAF 組塊 關於遞送及消耗,在一些實例中,ftyp及styp提供類型之相容性的指示及可如何使用類型的指示。邏輯框可在對象之開始處,且因此易於發現並剖析(例如藉由擷取單元52及/或解囊封單元50)。多個相容性類型可用於發信不同類型。邏輯框之類型亦可曝露為使用設定檔參數之網際網路媒體類型,且例如用於HTTP情況(例如用於DASH串流或其他HTTP串流技術)。此可實現不同分佈模式。 關於使用類型作為分隔符,類型值可定界片段中之組塊、定界區段及播放軌檔案中之片段,及/或定界範圍以提供適當解譯。分隔符(例如類型值)亦可表示類型,以便接收元件(例如擷取單元52及/或解囊封單元50)判定包括於組塊、片段、區段、播放軌檔案或其類似者中的資料(例如媒體資料)之類型。無後續欄位之索引係必要的,且因此此等技術可支援即時處理。 圖2為更詳細地說明圖1之擷取單元52之組件之實例集合的方塊圖。在此實例中,擷取單元52包括eMBMS中間軟體單元100、DASH用戶端110及媒體應用程式112。 在圖2之實例中,eMBMS中間軟體單元100進一步包括eMBMS接收單元106、快取記憶體104及伺服器單元102。在此實例中,eMBMS接收單元106經組態以經由eMBMS接收資料,例如,根據T. Paila等人在「FLUTE—File Delivery over Unidirectional Transport」(網路工作小組,RFC 6726,2012年11月)中所描述的單向傳送檔案遞送(FLUTE),可於http://tools.ietf.org/html/rfc6726獲得。亦即,eMBMS接收單元106可經由廣播而自(例如)伺服器裝置60 (其可充當BM-SC)接收檔案。 當eMBMS中間軟體單元100接收檔案之資料時,eMBMS中間軟體單元可將所接收之資料儲存於快取記憶體104中。快取記憶體104可包含電腦可讀儲存媒體,諸如快閃記憶體、硬碟、RAM或任何其他合適的儲存媒體。 本端伺服器單元102可充當DASH用戶端110之伺服器。舉例而言,本端伺服器單元102可將MPD檔案或其他資訊清單檔案提供至DASH用戶端110。本端伺服器單元102可公告MPD檔案中之區段的可用性時間,以及可擷取該等區段之超連結。此等超連結可包括對應於用戶端裝置40之本端主機位址首碼(例如,IPv4之127.0.0.1)。以此方式,DASH用戶端110可使用HTTP GET或部分GET請求向本端伺服器單元102請求區段。舉例而言,對於可自連結http://127.0.0.1/rep1/seg3獲得之區段,DASH用戶端110可建構包括針對http://127.0.0.1/rep1/seg3之請求的HTTP GET請求,且將請求提交至本端伺服器單元102。本端伺服器單元102可自快取記憶體104擷取所請求之資料且回應於此等請求而將資料提供至DASH用戶端110。 圖3為說明實例多媒體內容120之要素的概念圖。多媒體內容120可對應於多媒體內容64 (圖1),或對應於儲存於儲存媒體62中之另一多媒體內容。在圖3之實例中,多媒體內容120包括媒體呈現描述(MPD) 122及複數個表示124A至124N (表示124)。表示124A包括可選標頭資料126及區段128A至128N (區段128),而表示124N包括可選標頭資料130及區段132A至132N (區段132)。為了方便起見,使用字母N來指定表示124中之每一者中的最後一個電影片段。在一些實例中,表示124之間可存在不同數目之電影片段。 MPD 122可包含與表示124分隔之資料結構。MPD 122可對應於圖1之資訊清單檔案66。同樣,表示124可對應於圖2之表示68。一般而言,MPD 122可包括通常描述表示124之特性的資料,諸如寫碼及再現特性、調適集、MPD 122所對應之設定檔、文字類型資訊、攝影機角度資訊、分級資訊、特技模式資訊(例如,指示包括時間子序列之表示的資訊)及/或用於擷取遠端週期(例如,用於在播放期間將針對性廣告插入至媒體內容中)之資訊。 標頭資料126 (當存在時)可描述區段128之特性,例如隨機存取點(RAP,其亦被稱作串流存取點(SAP))之時間位置、區段128中之哪一者包括隨機存取點、與區段128內之隨機存取點之位元組偏移、區段128之統一資源定位符(URL),或區段128之其他態樣。標頭資料130 (當存在時)可描述區段132之類似特性。另外或替代地,此等特性可完全包括於MPD 122內。 區段128、132包括一或多個經寫碼視訊樣本,其中之每一者可包括視訊資料之圖框或圖塊。區段128之經寫碼視訊樣本中之每一者可具有類似特性,例如,高度、寬度及頻寬要求。此類特性可藉由MPD 122之資料來描述,儘管此資料在圖3之實例中未說明。MPD 122可包括如3GPP規範所描述之特性,並且添加了本發明中所描述的發信資訊中之任一者或全部。 區段128、132中之每一者可與唯一的統一資源定位符(URL)相關聯。因此,區段128、132中之每一者可使用串流網路協定(諸如,DASH)來獨立地擷取。以此方式,諸如用戶端裝置40之目的地裝置可使用HTTP GET請求來擷取區段128或132。在一些實例中,用戶端裝置40可使用HTTP部分GET請求來擷取區段128或132之特定位元組範圍。 圖4為說明實例視訊檔案150之要素的方塊圖,該實例視訊檔案可對應於表示之區段,諸如圖3之區段114、124中之一者。區段128、132中之每一者可包括大體上符合圖4之實例中所說明之資料之佈置的資料。視訊檔案150可稱為囊封一區段。如上所述,根據ISO基本媒體檔案格式及其擴展的視訊檔案將資料儲存於一系列對象(稱為「邏輯框」)中。在圖4之實例中,視訊檔案150包括檔案類型(FTYP)邏輯框152、電影(MOOV)邏輯框154、區段索引(sidx)邏輯框162、電影片段(MOOF)邏輯框164及電影片段隨機存取(MFRA)邏輯框166。儘管圖4表示視訊檔案之實例,但應理解,根據ISO基本媒體檔案格式及其擴展,其他媒體檔案可包括其他類型之媒體資料(例如,音訊資料、計時文字資料或其類似者),其在結構上類似於媒體檔案150之資料。 檔案類型(FTYP)邏輯框152通常描述視訊檔案150之檔案類型。檔案類型邏輯框152可包括識別描述視訊檔案150之最佳用途之規範的資料。檔案類型邏輯框152可替代地置放在MOOV邏輯框154、電影片段邏輯框164及/或MFRA邏輯框166之前。 在一些實例中,區段(諸如,視訊檔案150)可包括在FTYP邏輯框152之前的MPD更新邏輯框(未展示)。MPD更新邏輯框可包括指示對應於包括視訊檔案150之表示之MPD待更新的資訊,以及用於更新MPD之資訊。舉例而言,MPD更新邏輯框可提供待用以更新MPD之資源的URI或URL。作為另一實例,MPD更新邏輯框可包括用於更新MPD之資料。在一些實例中,MPD更新邏輯框可緊接在視訊檔案150之區段類型(STYP)邏輯框(未展示)之後,其中STYP邏輯框可定義視訊檔案150之區段類型。在下文更詳細地論述之圖7提供關於MPD更新邏輯框之額外資訊。 在圖4之實例中,MOOV邏輯框154包括電影標頭(MVHD)邏輯框156、播放軌(TRAK)邏輯框158及一或多個電影延伸(MVEX)邏輯框160。一般而言,MVHD邏輯框156可描述視訊檔案150之一般特性。舉例而言,MVHD邏輯框156可包括描述視訊檔案150何時最初建立、視訊檔案150何時經最後修改、視訊檔案150之時間標度、視訊檔案150之播放持續時間的資料,或通常描述視訊檔案150之其他資料。 TRAK邏輯框158可包括視訊檔案150之播放軌的資料。TRAK邏輯框158可包括播放軌標頭(TKHD)邏輯框,其描述對應於TRAK邏輯框158之播放軌的特性。在一些實例中,TRAK邏輯框158可包括經寫碼視訊圖像,而在其他實例中,播放軌之經寫碼視訊圖像可包括於電影片段164中,其可由TRAK邏輯框158及/或sidx邏輯框162之資料參考。 在一些實例中,視訊檔案150可包括一個以上播放軌。相應地,MOOV邏輯框154可包括數個TRAK邏輯框,其等於視訊檔案150中之播放軌之數目。TRAK邏輯框158可描述視訊檔案150之對應播放軌之特性。舉例而言,TRAK邏輯框158可描述對應播放軌之時間及/或空間資訊。當囊封單元30 (圖3)包括視訊檔案(諸如,視訊檔案150)中之參數集播放軌時,類似於MOOV邏輯框154之TRAK邏輯框158的TRAK邏輯框可描述參數集播放軌之特性。囊封單元30可在描述參數集播放軌之TRAK邏輯框內發信序列層級SEI訊息存在於參數集播放軌中。 MVEX邏輯框160可描述對應電影片段164之特性,例如,發信視訊檔案150除包括於MOOV邏輯框154 (若存在)內之視訊資料之外亦包括電影片段164。在串流視訊資料之上下文中,經寫碼視訊圖像可包括於電影片段164中而非包括於MOOV邏輯框154中。相應地,所有經寫碼視訊樣本可包括於電影片段164中,而非包括於MOOV邏輯框154中。 MOOV邏輯框154可包括數個MVEX邏輯框160,其等於視訊檔案150中之電影片段164之數目。MVEX邏輯框160中之每一者可描述電影片段164中之對應電影片段之特性。舉例而言,每一MVEX邏輯框可包括電影延伸標頭邏輯框(MEHD)邏輯框,其描述電影片段164中的對應電影片段之時間持續時間。 如上文所指出,囊封單元30可儲存視訊樣本中之序列資料集,其並不包括實際經寫碼視訊資料。視訊樣本可大體上對應於存取單元,其為特定時間執行個體下之經寫碼圖像之表示。在AVC之上下文中,經寫碼圖像包括一或多個VCL NAL單元及其他相關聯非VCL NAL單元(諸如,SEI訊息),該等VCL NAL單元含有用以構造存取單元之所有像素的資訊。相應地,囊封單元30可包括電影片段164中之一者中之序列資料集,其可包括序列層級SEI訊息。囊封單元30可進一步發信存在於電影片段164中之一者中的序列資料集及/或序列層級SEI訊息存在於對應於電影片段164中之一者的MVEX邏輯框160中之一者內。 SIDX邏輯框162為視訊檔案150之可選要素。意即,符合3GPP檔案格式或其他此等檔案格式之視訊檔案未必包括SIDX邏輯框162。根據3GPP檔案格式之實例,SIDX邏輯框可用以識別區段(例如,含於視訊檔案150內之區段)之子區段。3GPP檔案格式將子區段定義為「具有一或多個對應媒體資料邏輯框及含有藉由電影片段邏輯框引用之資料的媒體資料邏輯框的一或多個連續電影片段邏輯框之自含式集合,必須跟在電影片段邏輯框之後,並在含有關於同一播放軌之資訊的下一個電影片段邏輯框之前」。3GPP檔案格式亦指示SIDX邏輯框「含有對由邏輯框記錄之(子)區段之子區段參考的序列。所參考的子區段在呈現時間上鄰接。類似地,由區段索引邏輯框參考之位元組始終在區段內鄰接。所參考大小給出所參考材料中之位元組之數目的計數」。 SIDX邏輯框162通常提供表示包括於視訊檔案150中之區段之一或多個子區段的資訊。舉例而言,此資訊可包括子區段開始及/或結束之播放時間、子區段之位元組偏移、子區段是否包括(例如,開始於)串流存取點(SAP)、SAP之類型(例如,SAP為瞬時解碼器再新(IDR)圖像、清潔隨機存取(CRA)圖像、斷鏈存取(BLA)圖像或其類似者)、在子區段中SAP之位置(就播放時間及/或位元組偏移而言)及其類似者。 電影片段164可包括一或多個經寫碼視訊圖像。在一些實例中,電影片段164可包括一或多個圖像群組(GOP),其中之每一者可包括數個經寫碼視訊圖像,例如圖框或圖像。另外,如上文所描述,在一些實例中,電影片段164可包括序列資料集。電影片段164中之每一者可包括電影片段標頭邏輯框(MFHD,圖4中未展示)。MFHD邏輯框可描述對應電影片段之特性,諸如電影片段之序號。電影片段164可按序號次序包括於視訊檔案150中。在一些實例中,電影片段164中之一或多者可例如根據如上文所論述之表3放在CMAF標頭之前。此外,CMAF區段可包括一或多個CMAF片段,其中之每一者可包括一或多個可選邏輯框、電影片段邏輯框及媒體資料邏輯框。 MFRA邏輯框166可描述視訊檔案150之電影片段164內的隨機存取點。此可輔助執行特技模式,諸如執行對由視訊檔案150囊封之區段內之特定時間位置(亦即,播放時間)的尋找。在一些實例中,MFRA邏輯框166通常係可選的且無需包括於視訊檔案中。同樣,用戶端裝置(諸如用戶端裝置40)未必需要參考MFRA邏輯框166來對視訊檔案150之視訊資料進行正確解碼及顯示。MFRA邏輯框166可包括數個播放軌片段隨機存取(TFRA)邏輯框(未展示),其等於視訊檔案150之播放軌之數目,或在一些實例中等於視訊檔案150之媒體播放軌(例如,非暗示播放軌)之數目。 在一些實例中,電影片段164可包括一或多個串流存取點(SAP),諸如IDR圖像。同樣地,MFRA邏輯框166可提供對SAP在視訊檔案150內之位置的指示。相應地,視訊檔案150之時間子序列可由視訊檔案150之SAP形成。時間子序列亦可包括其他圖像,諸如取決於SAP之P圖框及/或B圖框。時間子序列之圖框及/或圖塊可配置於區段內,以使得時間子序列的取決於子序列之其他圖框/圖塊之圖框/圖塊可被恰當地解碼。舉例而言,在資料之階層式配置中,用於其他資料之預測的資料亦可包括於時間子序列中。 圖5為說明實例CMAF片段200之概念圖。圖5之CMAF片段200可對應於圖4之電影片段164中的一者。CMAF片段200可符合上述表5。CMAF片段(諸如CMAF片段200)可為藉由CMAF編碼、CMAF遞送及CMAF播放器處置的最小切換單元。 在圖5之實例中,CMAF片段200包括零或多個可選邏輯框202、電影片段(moof)邏輯框204及媒體資料(mdat)邏輯框206。可選邏輯框202係用虛線勾勒以指示可選邏輯框202係可選的。圖5之可選邏輯框202可包括區段類型邏輯框、生產者參考時間邏輯框及/或DASH事件訊息邏輯框中之無一者、任一者或全部。 MDAT邏輯框206包括隨機存取媒體樣本208A至208C (隨機存取媒體樣本208),其可對應於一或多個經寫碼視訊串流(CVS)。MDAT邏輯框206的第一樣本(例如,序數第一樣本)(例如隨機存取媒體樣本208A)之解碼時間210可由可包括於moof邏輯框204中的播放軌片段解碼時間(tfdt)邏輯框指示。詳言之,tfdt邏輯框可包括於moof邏輯框204之播放軌片段(traf)邏輯框中,且可指示播放軌片段基本媒體解碼時間。 在一些實例中,諸如CMAF片段200之CMAF片段符合以下約束: 1. 與相關聯CMAF標頭組合的每一CMAF片段在其被獨立地存取時應含有待解碼、解密及顯示的足夠後設資料。除了所指定CMAF播放軌及媒體設定檔約束之外,若CMAF片段在運用其相關聯CMAF標頭處理時不能被解碼,則CMAF播放軌係非符合性。舉例而言,若樣本群組及樣本群組描述用以發信加密密鑰變化,則SampleGroupDescriptionBox及SampleToGroupBox需要存在於TrackFragmentBox中以使CMAF片段可隨機存取及解密。 2. CMAF片段MovieFragmentBox可放在其他邏輯框(包括一或多個SegmentTypeBox、ProducerReferenceTimeBox及/或DASHEventMessageBox)之前。(對於關於事件訊息之更多資訊,參見ISO/IEC 23000-19之7.4.5及附錄E)。 3. CMAF播放軌中之每一CMAF片段應具有至少一秒之持續時間,其中播放軌之第一及最後片段可能例外。 圖6為說明實例CMAF播放軌220之概念圖。在此實例中,CMAF播放軌220包括CMAF標頭222及CMAF片段230A、230B (CMAF片段230)。CMAF片段230中之每一者包括零或多個可選邏輯框、moof邏輯框及mdat邏輯框之各別集合。舉例而言,CMAF片段230A包括可選邏輯框224A、moof邏輯框226A及mdat邏輯框228A,而CMAF片段230B包括可選邏輯框224B、moof邏輯框226B及mdat邏輯框228B。以此方式,CMAF片段230中之每一者可通常包括類似於圖5之CMAF片段200之要素的要素。圖6之CMAF播放軌220可包括於視訊檔案(諸如圖4之視訊檔案150)內,其中CMAF標頭222可對應於圖4之ftyp邏輯框152及moov邏輯框154,且CMAF片段230可在圖4之電影片段164的開頭處開始。CMAF播放軌200通常可符合上述表2。 根據本發明之技術,CMAF標頭222可在NL 0處包括ftyp值,如上文所論述並如表3之實例中所示。亦即,圖1之內容準備裝置20可至少部分設定ftyp值以指示CMAF標頭222之開始。同樣,圖1之用戶端裝置40(例如圖1之擷取單元52)可藉由剖析包括CMAF播放軌220之位元串流及偵測ftyp值而判定CMAF標頭222之位置。作為回應,擷取單元52可判定CMAF片段230在CMAF標頭222之後(例如圖4之ftyp邏輯框152及moov邏輯框154),潛在地亦在一或多個介入sidx邏輯框(諸如sidx邏輯框162(圖4))之後。 此外,CMAF片段230中之每一者可包括表示CMAF片段230是對應於例如對應moof邏輯框226A、226B (moof邏輯框226)中之僅僅CMAF片段、CMAF區段抑或CMAF組塊的styp值。因此,擷取單元52可根據各別moof邏輯框226中之各別CMAF片段的styp之值判定CMAF片段230中之一者是為僅僅CMAF片段、CMAF組塊抑或CMAF區段。 舉例而言,內容準備裝置20 (圖1)可指派「cmfl」之值至CMAF片段230中的對應一者之moof邏輯框226中的一者之styp要素以指示CMAF片段230中之一者包括CMAF組塊,指派「cmff」之值以指示CMAF片段230中之一者僅僅為CMAF片段,或指派「cmfs」之值以指示CMAF片段230中之一者包括於CMAF區段中。同樣,擷取單元52可判定當moof邏輯框226中的一者之styp要素具有「cmfl」之值時CMAF片段230中之一者包括CMAF組塊,當moof邏輯框226中的一者之styp要素具有「cmff」之值時CMAF片段僅僅為CMAF片段,或當moof邏輯框226中的一者之styp要素具有「cmfs」之值時CMAF片段包括於CMAF區段中。 圖7為說明實例CMAF區段240之概念圖。圖7之CMAF區段240可在CMAF標頭之後(例如如圖6中所示)包括於CMAF播放軌檔案內。CMAF區段240可符合上述表4。 在圖7的實例中,CMAF區段240包括兩個實例CMAF片段250A、250B (CMAF片段250)。CMAF片段250中之每一者包括零或多個可選邏輯框、moof邏輯框及mdat邏輯框之各別集合。舉例而言,CMAF片段250A包括可選邏輯框244A、moof邏輯框246A及mdat邏輯框248A,而CMAF片段250B包括可選邏輯框244B、moof邏輯框246B及mdat邏輯框248B。以此方式,CMAF片段250中之每一者可通常包括類似於圖5之CMAF片段200之要素的要素。圖7之CMAF區段240可包括於視訊檔案(諸如圖4之視訊檔案150)內,其中CMAF片段250可在圖4之電影片段164的開頭處開始。 根據本發明之技術,內容準備裝置20(圖1)可指派「cmfs」之值至CMAF片段250A之moof邏輯框246A的styp值以指示CMAF片段250A包括於CMAF區段240內並表示CMAF區段240之開始。同樣,圖1之擷取單元52可回應於判定CMAF片段250A之moof邏輯框246A的styp值具有「cmfs」之值而判定CMAF片段250A表示CMAF區段240之開始。 圖8A及圖8B為說明實例CMAF片段及CMAF組塊之概念圖。詳言之,圖8A說明僅僅CMAF片段260之實例。亦即,CMAF片段260包括moof邏輯框262、mdat邏輯框264,及經寫碼視訊序列樣本266A至266L(經寫碼視訊序列樣本266)。圖8B說明包括CMAF組塊272A至272D (CMAF組塊272)之CMAF片段270之實例。CMAF組塊272中之每一者可符合上述表6。亦即,在此實例中,CMAF組塊272中之每一者包括各別moof邏輯框274A至274D (moof邏輯框274)、mdat邏輯框276A至276D (mdat邏輯框276),及各別經寫碼視訊序列樣本278A至278L (經寫碼視訊序列樣本276)。 如所示,CMAF組塊272可包括於CMAF片段270 (如上文所論述,其可包括於CMAF播放軌及/或CMAF區段內)內。在一個實例中,CMAF組塊為藉由CMAF編碼、CMAF遞送及CMAF播放器處置的最小原子單元。藉由將CMAF片段270分成CMAF組塊272,例如,如圖8B中所示,經寫碼視訊序列樣本278之媒體資料可比圖8A之經寫碼視訊序列樣本266的媒體資料更頻繁地輸出。亦即,圖1之內容準備裝置20(例如)可在各別編碼器輸出時間280A至280D (編碼器輸出時間280)處輸出CMAF組塊272中之每一者。相比之下,內容準備裝置20可在編碼器輸出時間268處輸出整個CMAF片段260。以此方式,使用CMAF組塊(諸如CMAF組塊272)可減小用於串流服務之輸送媒體資料的潛時。 CMAF組塊272可根據本發明之技術標記為具有在各別moof邏輯框274中的「cmfl」之styp值。亦即,內容準備裝置20可指定各別moof邏輯框274中的「cmfl」之值。同樣,擷取單元52可基於各別moof邏輯框274中之「cmfl」的值判定CMAF片段270包括CMAF組塊272。擷取單元52亦可藉由剖析CMAF片段270及偵測各別moof邏輯框274之styp值的「cmfl」之值而判定CMAF組塊272中之每一者的開始。 在一些實例中,CMAF組塊可符合以下約束: 1. CMAF片段應包括各自含有一個MovieFragmentBox(繼而含有其參考之樣本的一或多個MediaDataBox)的一或多個ISO基本媒體區段[ISOBMFF、8.16]。 2. CMAF片段應含有如ISO/IEC 23000-19之7.5.14中所指定約束的MovieFragmentHeaderBox。‎ 3. 每一TrackFragmentBox應含有一個TrackFragmentBaseMediaDecodeTimeBox。 4. CMAF片段中之所有媒體樣本應由TrackRunBox中之相對於MovieFragmentBox之第一位元組的位元組偏移定址(參見[ISOBMFF]8.8.4)。 5. CMAF組塊MovieFragmentBox可放在其他邏輯框(包括SegmentTypeBox、一或多個ProducerReferenceTimeBox及/或DASHEventMessageBox)之前。(對於關於事件訊息之更多資訊,參見7.4.5及附錄E)。 圖9為說明根據本發明之技術之實例系統300的概念圖。在此實例中,系統300分成四個邏輯部分:資訊清單部分、內容提供部分、遞送部分,及平台及播放器部分。資訊清單部分及內容提供部分通常可對應於圖1之內容準備裝置20,遞送部分可對應於圖1之伺服器裝置60,且平台及播放器部分可對應於圖1之用戶端裝置40。 在圖9的實例中,系統300之資訊清單部分包括DASH MPD 302、HTTP實況串流(HLS)M3U8播放清單304及應用程式306。DASH MPD 302參考CMAF內容308,其包括於系統300之內容提供部分中。CMAF內容308經提供至內容遞送網路(CDN)310,其提供廣播及/或多播服務作為系統300之遞送部分的部分。系統300之平台及播放器部分的各種平台及播放器可自CDN 310接收媒體資料,諸如單獨HTTP實況串流(HLS)播放器312、用於接收HLS作為HTML-5視訊標籤的裝置314、單獨DASH播放器316、用於接收DASH作為HTML-5視訊標籤的裝置318,及/或HTML-5基於MSE類型3播放器320。本發明之技術通常可支援一種類型發信用於根據此等實例使用情況中之任一者或全部組態的裝置。 圖10為說明在使用HTML-5應用程式設計介面(API)338之WAVE應用程式336內之在平台332、內容334及應用程式336之間的實例分解330的概念圖,平台、內容及應用中之每一者可使用根據本發明之技術的資料。WAVE裝置平台334可具有可經由HTML-5 API 338存取用於應用程式336的一組能力及詳細編碼解碼器能力。WAVE內容332可在WAVE應用程式336內之WAVE裝置平台334上播放。WAVE應用程式336可使用WAVE平台裝置334之能力用於媒體服務。 圖11為說明實例邏輯框序列及CMAF組塊350之容納的概念圖。在此實例中,下部邏輯框指示在上方邏輯框中之容納。亦即,CMAF組塊包括區段類型(「styp」)邏輯框352、生產者參考時間(「prft」)事件(「emsg」)354、電影片段(「moof」)邏輯框356,及媒體資料(「mdat」)邏輯框。Moof邏輯框356又包括電影片段標頭(「mfhd」)邏輯框360、保護特定標頭(「pssh」)邏輯框362,及播放軌片段(「traf」)邏輯框364。含於如圖11中所示之traf邏輯框364中的邏輯框之序列為一個實例。在此實例中,邏輯框364包括播放軌片段標頭(「tfhd」)邏輯框370、播放軌片段運行(「trun」)邏輯框372、樣本加密(「senc」)邏輯框374、樣本輔助資訊大小(「saiz」)邏輯框376、樣本輔助資訊偏移(「saio」)邏輯框378、樣本至群組(「sbgp」)邏輯框380,及樣本群組描述(「sgpd」)邏輯框382。用虛線輪廓展示的邏輯框(諸如styp邏輯框352、prtf emsg 354及pssh邏輯框362)可係可選的。在一些實例中,當使用加密時有條件地要求如底部列中所示之traf邏輯框364的特定邏輯框。 在一個實例中,含有CMAF片段之初始樣本的任一CMAF組塊或CMAF片段將符合CMAF區段品牌「cmff」且該品牌應在「styp」中發信。 CMAF標頭、CMAF片段及CMAF組塊可經封裝並稱為用於儲存及遞送之CMAF可定址媒體對象,如CMAF媒體對象模型之章節6.7中所描述。每一CMAF可定址媒體對象可藉由外部規範(例如MPEG DASH)稱為資源。 CMAF標頭、CMAF組塊及CMAF片段可藉由簡單變換方式用為CMAF可定址資源,該等簡單變換方式例如: · 直接地, · 藉由串接CMAF片段及作為CMAF區段發送,及/或 · 藉由串接CMAF標頭與所有CMAF片段,可能添加SegmentIndexBox。 在CMAF片段模式中,CMAF標頭可用為可定址對象。在此模式中,CMAF片段可直接用為CMAF可定址媒體對象。 在CMAF區段模式中,CMAF區段可如上文(例如關於表4及圖7)所論述而使用。CMAF區段可經定義為含有按呈現次序之一或多個完整CMAF片段的CMAF可定址媒體對象。在一些實例中: 1. CMAF區段可含有按解碼次序定序的分成多個電影片段的每一CMAF片段之樣本。 2. CMAF區段可包括在每一CMAF片段之第一MovieFragmentBox之前的SegmentTypeBox。SegmentTypeBox可包括CMAF區段品牌「cmfs」,及在CMAF播放軌之CMAF標頭之FileTypeBox中列出的任何compatible_brands。 在CMAF組塊模式中,CMAF標頭可用為可定址對象。在此模式中,每一CMAF片段可包括於一或多個CMAF組塊中。CMAF組塊可直接用為CMAF可定址媒體對象。初始CMAF可包括兩個CMAF區段品牌(「cmff」及「cmfl」),以發信與CMAF片段之初始部分以及CMAF組塊的相容性。非初始CMAF組塊可包括CMAF區段品牌「cmfl」以發信與此區段格式之相容性。 CMAF播放軌檔案可為經定義為儲存為ISO BMFF檔案中之單一播放軌的CMAF播放軌的CMAF可定址媒體對象,其中第一CMAF片段baseMediaDecodeTime等於零。CMAF標頭及所有CMAF片段可包括於單一CMAF播放軌檔案中。在一些實例中,CMAF播放軌檔案符合以下約束: 1. 額外邏輯框(諸如SegmentIndexBoxes)可存在於CMAF標頭與第一CMAF片段之間。 2. 若SegmentIndexBoxes存在,則SegmentIndexBox中參考的每一subsegment應為含於CMAF播放軌檔案中之單一CMAF片段。 3. 含於CMAF片段中之Emsg及prtf邏輯框經維持於播放軌檔案中。若emsg或prtf經維持用於CMAF片段,則SegmentIndexBox應參考CMAF片段之開始,亦即,prtf或任一emsg之較早者。 4. 視訊CMAF播放軌檔案可含有偏移編輯清單以藉由減去藉由使用使用正組成偏移值之v0 TrackRunBox添加的任一組成延遲,而將第一呈現樣本之最早呈現時間調整至為零之baseMediaDecodeTime以將視訊圖框自解碼次序重排序至呈現次序。參見ISO/IEC 23000-19之7.5.12。 5. 使用負組成偏移之v1 TrackRunBox可用於將每一CMAF片段中之最早呈現之視訊樣本的組成時間調整成其BaseMediaDecodeTime,且將CMAF播放軌檔案中之最早視訊樣本調整成零,而不使用偏移編輯清單。 圖12為說明根據本發明之技術產生位元串流的實例方法之流程圖。關於內容準備裝置20 (圖1)解釋圖12之方法。然而,應理解,其他裝置可經組態以執行此方法或類似方法。舉例而言,伺服器裝置60可執行圖12之方法的一些或所有步驟。 最初,音訊編碼器26及視訊編碼器28(圖1)編碼媒體資料(分別,諸如音訊資料或視訊資料),以形成媒體資料之經編碼樣本。囊封單元30 (圖1)接著接收媒體資料之經編碼樣本並根據本發明之技術產生包括根據CMAF格式化之經編碼樣本的位元串流。特定言之,囊封單元30產生CMAF播放軌檔案之CMAF標頭(400)。囊封單元30可根據上述表3產生CMAF標頭。舉例而言,囊封單元30可設定在CMAF標頭之開始處的CMAF標頭之檔案類型(ftyp)值(402)。囊封單元30亦可產生CMAF標頭之電影(moov)邏輯框,例如,包括圖4之moov邏輯框154的要素。 囊封單元30接著可在各別CMAF片段中囊封經編碼媒體樣本(404)。在各種實例中,CMAF片段可對應於僅僅CMAF片段、包括於CMAF區段中之CMAF片段或包括CMAF組塊之CMAF片段。相應地,囊封單元30可設定在CMAF片段之開始處的區段類型(styp)值,以指示CMAF片段之開始及CMAF片段之類型(例如,僅僅CMAF片段、CMAF區段或CMAF組塊)。如上文所提及,值「cmfs」可表示CMAF區段,值「cmff」可表示僅僅CMAF片段,且值「cmfl」可表示CMAF組塊。囊封單元30可設定CMAF片段之各別moof邏輯框中的styp值。 囊封單元30接著可產生包括CMAF標頭及CMAF片段之位元串流(408),並發送該位元串流至用戶端裝置(410),諸如用戶端裝置40 (圖1)。在一些實例中,內容準備裝置20可發送位元串流至伺服器裝置60,伺服器裝置60接著可發送位元串流至用戶端裝置40。 以此方式,圖12之方法表示產生位元串流之方法的實例,該方法包括:藉由實施於電路系統中之一處理器產生一CMAF播放軌檔案之一共同媒體應用格式(CMAF)標頭;藉由該處理器設定指示該CMAF標頭之開始的該CMAF標頭之一檔案類型(FTYP)值的一值;藉由該處理器於在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段中囊封媒體資料之一或多個樣本;及藉由該處理器產生包括該CMAF標頭及該CMAF播放軌檔案之一位元串流,該一或多個CMAF片段在該CMAF播放軌檔案中之該CMAF標頭之後。 圖13為說明根據本發明之技術處理媒體資料的方法之實例的流程圖。關於圖1之用戶端裝置40解釋圖13之方法。然而,應理解其他裝置可經組態以執行根據本發明之技術的此方法或類似方法。 最初,用戶端裝置40之擷取單元52 (圖1)剖析包括CMAF播放軌檔案之位元串流(420)。應理解擷取單元52最初可向例如伺服器裝置60或內容準備裝置20(圖1)請求位元串流。當剖析位元串流時,擷取單元52可偵測CMAF播放軌檔案之檔案類型(ftyp)值(422)。如上述表3中所示,ftyp值可在CMAF播放軌檔案之CMAF標頭之開始處。相應地,擷取單元52可判定CMAF標頭以ftyp值開始(424)。擷取單元52可進一步判定CMAF標頭之其餘部分(例如moov邏輯框)在ftyp值之後。 因此,擷取單元52可判定CMAF播放軌檔案之一或多個CMAF片段在CMAF標頭(及任何sidx邏輯框(若存在),例如,如上述表2中及圖4中所示)之後。特定言之,擷取單元52可繼續剖析在CMAF標頭之後的位元串流並偵測在CMAF標頭之後的一或多個區段類型(styp)值(426)。擷取單元52可偵測CMAF片段之各別moof邏輯框中的styp值。根據本發明之技術,擷取單元52可判定styp值中之每一者表示對應CMAF片段之開始。此外,擷取單元52可自各別styp值判定CMAF片段之類型。如上文所論述,在一些實例中,用於styp之值「cmfs」可表示CMAF區段,用於styp之值「cmff」可表示僅僅CMAF片段,且用於styp之值「cmfl」可表示CMAF組塊。 因此,擷取單元52可根據styp值處理在各別styp值處開始之對應CMAF片段(428)。舉例而言,擷取單元52可判定是否僅僅CMAF片段在styp值之後,是否一或多個CMAF片段待預期作為CMAF區段之部分(例如如圖7中所示),或CMAF片段是否包括一或多個CMAF組塊(例如如圖8B中所示)。 以此方式,圖13之方法表示處理媒體資料之方法的實例,該方法包括:藉由實施於電路系統中之一處理器剖析根據共同媒體應用格式(CMAF)格式化之包括資料的一位元串流;藉由該處理器及在該剖析期間,偵測用於該位元串流之一CMAF播放軌檔案的一檔案類型(FTYP)值;藉由該處理器判定該CMAF播放軌檔案之一CMAF標頭以該FTYP值開始;及藉由該處理器處理在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段。 在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合來實施。若實施於軟體中,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體進行傳輸,且由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體(其包括(例如)根據通信協定促進電腦程式自一處傳送至另一處的任何媒體)。以此方式,電腦可讀媒體通常可對應於(1)非暫時性之有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取用於實施本發明中所描述之技術之指令、程式碼及/或資料結構的任何可用媒體。電腦程式產品可包括電腦可讀媒體。 藉由實例而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存裝置、快閃記憶體或可用於儲存呈指令或資料結構形式之所要程式碼且可由電腦存取的任何其他媒體。而且,任何連接被恰當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纖纜線、雙絞線、數位用戶線(DSL)或諸如紅外線、無線電及微波之無線技術,自網站、伺服器或其他遠端源來傳輸指令,則同軸纜線、光纖纜線、雙絞線、DSL或諸如紅外線、無線電及微波之無線技術包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而實情為關於非暫時性有形儲存媒體。如本文中所使用之磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位多功能光碟(DVD)、軟碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟用雷射以光學方式再生資料。以上各者的組合亦應包括於電腦可讀媒體之範疇內。 可由一或多個處理器執行指令,該一或多個處理器諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效之整合或離散邏輯電路系統。因此,如本文中所使用之術語「處理器」可指上述結構或適合於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,本文所描述之功能可經提供於經組態以供編碼及解碼或併入於經組合編碼解碼器中之專用硬體及/或軟體模組內。此外,該等技術可完全實施於一或多個電路或邏輯元件中。本發明之技術可實施於多種裝置或設備中,包括無線手機、積體電路(IC)或IC集合(例如晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術之裝置的功能態樣,但未必要求由不同硬體單元來實現。確切而言,如上文所描述,各種單元可與合適的軟體及/或韌體一起組合於編碼解碼器硬體單元中或由互操作性硬體單元之集合提供,硬件單元包括如上文所描述之一或多個處理器。 各種實例已予以描述。此等及其他實例在以下申請專利範圍之範疇內。
10‧‧‧系統
20‧‧‧內容準備裝置
22‧‧‧音訊源
24‧‧‧視訊源
26‧‧‧音訊編碼器
28‧‧‧視訊編碼器
30‧‧‧囊封單元
32‧‧‧輸出介面
40‧‧‧用戶端裝置
42‧‧‧音訊輸出端
44‧‧‧視訊輸出端
46‧‧‧音訊解碼器
48‧‧‧視訊解碼器
50‧‧‧解囊封單元
52‧‧‧擷取單元
54‧‧‧網路介面
60‧‧‧伺服器裝置
62‧‧‧儲存媒體
64‧‧‧多媒體內容
66‧‧‧資訊清單檔案
68A‧‧‧表示
68N‧‧‧表示
70‧‧‧請求處理單元
72‧‧‧網路介面
74‧‧‧網路
100‧‧‧eMBMS中間軟體單元
102‧‧‧伺服器單元
104‧‧‧快取記憶體
106‧‧‧eMBMS接收單元
110‧‧‧DASH用戶端
112‧‧‧媒體應用程式
120‧‧‧實例多媒體內容
122‧‧‧媒體呈現描述(MPD)
124A‧‧‧表示
124N‧‧‧表示
126‧‧‧標頭資料
128A‧‧‧區段
128B‧‧‧區段
128N‧‧‧區段
130‧‧‧標頭資料
132A‧‧‧區段
132B‧‧‧區段
132N‧‧‧區段
150‧‧‧視訊檔案
152‧‧‧檔案類型(FTYP)邏輯框
154‧‧‧電影(MOOV)邏輯框
156‧‧‧電影標頭(MVHD)邏輯框
158‧‧‧播放軌(TRAK)邏輯框
160‧‧‧電影延伸(MVEX)邏輯框
162‧‧‧區段索引(sidx)邏輯框
164‧‧‧電影片段(MOOF)邏輯框
166‧‧‧電影片段隨機存取(MFRA)邏輯框
200‧‧‧CMAF片段
202‧‧‧可選邏輯框
204‧‧‧電影片段(moof)邏輯框
206‧‧‧媒體資料(mdat)邏輯框
208A‧‧‧隨機存取媒體樣本
208B‧‧‧隨機存取媒體樣本
208C‧‧‧隨機存取媒體樣本
210‧‧‧解碼時間
220‧‧‧實例CMAF播放軌
222‧‧‧CMAF標頭
224A‧‧‧可選邏輯框
224B‧‧‧可選邏輯框
226A‧‧‧moof邏輯框
226B‧‧‧moof邏輯框
228A‧‧‧mdat邏輯框
228B‧‧‧mdat邏輯框
230A‧‧‧CMAF片段
230B‧‧‧CMAF片段
240‧‧‧CMAF區段
244A‧‧‧可選邏輯框
244B‧‧‧可選邏輯框
246A‧‧‧moof邏輯框
246B‧‧‧moof邏輯框
248A‧‧‧mdat邏輯框
248B‧‧‧mdat邏輯框
250A‧‧‧CMAF片段
250B‧‧‧CMAF片段
260‧‧‧CMAF片段
262‧‧‧moof邏輯框
264‧‧‧mdat邏輯框
266A‧‧‧經寫碼視訊序列樣本
266B‧‧‧經寫碼視訊序列樣本
266C‧‧‧經寫碼視訊序列樣本
266D‧‧‧經寫碼視訊序列樣本
266E‧‧‧經寫碼視訊序列樣本
266F‧‧‧經寫碼視訊序列樣本
266G‧‧‧經寫碼視訊序列樣本
266H‧‧‧經寫碼視訊序列樣本
266I‧‧‧經寫碼視訊序列樣本
266J‧‧‧經寫碼視訊序列樣本
266K‧‧‧經寫碼視訊序列樣本
266L‧‧‧經寫碼視訊序列樣本
268‧‧‧編碼器輸出時間
270‧‧‧CMAF片段
272A‧‧‧CMAF組塊
272B‧‧‧CMAF組塊
272C‧‧‧CMAF組塊
272D‧‧‧CMAF組塊
274A‧‧‧moof邏輯框
274B‧‧‧moof邏輯框
274C‧‧‧moof邏輯框
274D‧‧‧moof邏輯框
276A‧‧‧mdat邏輯框
276B‧‧‧mdat邏輯框
276C‧‧‧mdat邏輯框
276D‧‧‧mdat邏輯框
278A‧‧‧經寫碼視訊序列樣本
278B‧‧‧經寫碼視訊序列樣本
278C‧‧‧經寫碼視訊序列樣本
278D‧‧‧經寫碼視訊序列樣本
278E‧‧‧經寫碼視訊序列樣本
278F‧‧‧經寫碼視訊序列樣本
278G‧‧‧經寫碼視訊序列樣本
278H‧‧‧經寫碼視訊序列樣本
278I‧‧‧經寫碼視訊序列樣本
278J‧‧‧經寫碼視訊序列樣本
278K‧‧‧經寫碼視訊序列樣本
278L‧‧‧經寫碼視訊序列樣本
280A‧‧‧編碼器輸出時間
280B‧‧‧編碼器輸出時間
280C‧‧‧編碼器輸出時間
280D‧‧‧編碼器輸出時間
300‧‧‧系統
302‧‧‧HTTP動態自適應串流(DASH)媒體呈現描述(MPD)
304‧‧‧HTTP實況串流(HLS)M3U8播放清單
306‧‧‧應用程式
308‧‧‧CMAF內容
310‧‧‧內容遞送網路(CDN)
312‧‧‧單獨HTTP實況串流(HLS)播放器及/或320)接收媒體資料
314‧‧‧用於接收HLS作為HTML-5視訊標籤的裝置
316‧‧‧單獨DASH播放器
318‧‧‧用於接收DASH作為HTML-5視訊標籤的裝置
320‧‧‧HTML-5基於MSE類型3播放器
330‧‧‧實例分解
332‧‧‧WAVE內容
334‧‧‧WAVE裝置平台
336‧‧‧WAVE應用程式
338‧‧‧HTML-5 API
350‧‧‧CMAF組塊
352‧‧‧區段類型(「styp」)邏輯框
354‧‧‧生產者參考時間(「prft」)事件(「emsg」)
356‧‧‧電影片段(「moof」)邏輯框
358‧‧‧媒體資料(「mdat」)邏輯框
360‧‧‧電影片段標頭(「mfhd」)邏輯框
362‧‧‧保護特定標頭(「pssh」)邏輯框
364‧‧‧播放軌片段(「traf」)邏輯框
370‧‧‧播放軌片段標頭(「tfhd」)邏輯框
372‧‧‧播放軌片段運行(「trun」)邏輯框
374‧‧‧樣本加密(「senc」)邏輯框
376‧‧‧樣本輔助資訊大小(「saiz」)邏輯框
378‧‧‧樣本輔助資訊偏移(「saio」)邏輯框
380‧‧‧樣本至群組(「sbgp」)邏輯框
382‧‧‧樣本群組描述(「sgpd」)邏輯框
400‧‧‧步驟
402‧‧‧步驟
404‧‧‧步驟
406‧‧‧步驟
408‧‧‧步驟
410‧‧‧步驟
420‧‧‧步驟
422‧‧‧步驟
424‧‧‧步驟
426‧‧‧步驟
428‧‧‧步驟
圖1為說明實施用於經由網路而串流媒體資料之技術之實例系統的方塊圖。 圖2為更詳細地說明圖1之擷取單元之組件之實例集合的方塊圖。 圖3為說明實例多媒體內容之要素的概念圖。 圖4為說明實例視訊檔案之要素的方塊圖,該實例視訊檔案可對應於表示之區段。 圖5為說明實例共同媒體應用格式(CMAF)片段之概念圖。 圖6為說明實例CMAF播放軌之概念圖。 圖7為說明實例CMAF區段之概念圖。 圖8A及圖8B為說明實例CMAF組塊之概念圖。 圖9為說明根據本發明之技術之實例系統的概念圖。 圖10為說明在使用HTML-5 API之WAVE應用程式內之在平台、內容及應用程式之間的實例分解的概念圖,平台、內容及應用程式中之每一者可使用根據本發明之技術的資料。 圖11為說明實例邏輯框序列及CMAF組塊之容納的概念圖。 圖12為說明根據本發明之技術產生位元串流的實例方法之流程圖。 圖13為說明根據本發明之技術處理媒體資料的方法之實例的流程圖。

Claims (44)

  1. 一種處理媒體資料之方法,該方法包含: 藉由實施於電路系統中之一處理器剖析根據共同媒體應用格式(CMAF)格式化的包括資料之一位元串流; 藉由該處理器及在該剖析期間偵測該位元串流之一CMAF播放軌檔案的一檔案類型(FTYP)值; 藉由該處理器判定該CMAF播放軌檔案之一CMAF標頭以該FTYP值開始;及 藉由該處理器處理在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段。
  2. 如請求項1之方法,其中處理該一或多個CMAF片段包含: 偵測該位元串流中之一或多個區段類型(STYP)值; 判定該一或多個STYP值中之每一者對應於該等CMAF片段中之一各別者的一開始;及 處理自該對應STYP值開始的該等CMAF片段中之每一者。
  3. 如請求項2之方法,其進一步包含: 判定該等CMAF片段中之一對應者的該等STYP值中之至少一者具有指示該等CMAF片段中之該對應者包括一CMAF組塊的一值;及 回應於判定該等STYP值中之該至少一者具有指示該等CMAF片段中之該對應者包括該CMAF組塊的該值而處理該CMAF組塊。
  4. 如請求項3之方法,其中該等STYP值中之該至少一者的該值包含「cmfl」。
  5. 如請求項2之方法,其進一步包含: 判定該等CMAF片段中之一對應者的該等STYP值中之至少一者具有指示該等CMAF片段中之該對應者包括於該CMAF播放軌檔案之一CMAF區段中的一值;及 回應於判定該等STYP值中之該至少一者具有指示該等CMAF片段中之該對應者包括於該CMAF區段中的該值而處理該CMAF區段。
  6. 如請求項5之方法,其中該等STYP值中之該至少一者的該值包含「cmfs」。
  7. 如請求項5之方法,其中處理該CMAF區段包含處理包括於該CMAF區段中之一或多個CMAF片段。
  8. 如請求項2之方法,其進一步包含: 判定該等STYP值中之至少一者包含「cmff」;及 回應於判定該等STYP值中之該至少一者包含「cmff」,將緊隨該等STYP值中之該至少一者的該位元串流之資料處理為對應於該等CMAF片段中之該對應者的樣本。
  9. 如請求項1之方法,其中處理該一或多個CMAF片段包含回應於偵測到該FTYP值而判定在該CMAF標頭之後的資料表示該一或多個CMAF片段。
  10. 一種用於處理媒體資料之裝置,該裝置包含: 一記憶體,其用於儲存媒體資料;及 一或多個處理器,其實施於電路系統中且經組態以: 剖析包括該媒體資料之一位元串流,該位元串流係根據共同媒體應用格式(CMAF)而格式化; 在該剖析期間,偵測該位元串流之一CMAF播放軌檔案的一檔案類型(FTYP)值; 判定該CMAF播放軌檔案之一CMAF標頭以該FTYP值開始;及 處理在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段。
  11. 如請求項10之裝置,其中為了處理該一或多個CMAF片段,該一或多個處理器經組態以執行以下操作: 偵測該位元串流中之一或多個區段類型(STYP)值; 判定該一或多個STYP值中之每一者對應於該等CMAF片段中之一各別者的一開始;及 處理自該對應STYP值開始的該等CMAF片段中之每一者。
  12. 如請求項11之裝置,其中該一或多個處理器經進一步組態以執行以下操作: 判定該等CMAF片段中之一對應者的該等STYP值中之至少一者具有指示該等CMAF片段中之該對應者包括一CMAF組塊的一值;及 回應於判定該等STYP值中之該至少一者具有指示該等CMAF片段中之該對應者包括該CMAF組塊的該值而處理該CMAF組塊。
  13. 如請求項12之裝置,其中該等STYP值中之該至少一者的該值包含「cmfl」。
  14. 如請求項11之裝置,其中該一或多個處理器經進一步組態以執行以下操作: 判定該等CMAF片段中之一對應者的該等STYP值中之至少一者具有指示該等CMAF片段中之該對應者包括於該CMAF播放軌檔案之一CMAF區段中的一值;及 回應於判定該等STYP值中之該至少一者具有指示該等CMAF片段中之該對應者包括於該CMAF區段中的該值而處理該CMAF區段。
  15. 如請求項14之裝置,其中該等STYP值中之該至少一者的該值包含「cmfs」。
  16. 如請求項14之裝置,其中該一或多個處理器經組態以處理包括於該CMAF區段中之一或多個CMAF片段。
  17. 如請求項11之裝置,其中該一或多個處理器經進一步組態以執行以下操作: 判定該等STYP值中之至少一者包含「cmff」;及 回應於判定該等STYP值中之該至少一者包含「cmff」,將緊隨該等STYP值中之該至少一者的該位元串流之資料處理為對應於該等CMAF片段中之該對應者的樣本。
  18. 如請求項10之裝置,其中該一或多個處理器經組態以回應於偵測到該FTYP值而判定在該CMAF標頭之後的資料表示該一或多個CMAF片段。
  19. 一種用於處理媒體資料之裝置,該裝置包含: 用於剖析根據共同媒體應用格式(CMAF)格式化之包括資料的一位元串流的構件; 用於在該剖析期間,偵測該位元串流之一CMAF播放軌檔案之一檔案類型(FTYP)值的構件; 用於判定該CMAF播放軌檔案之一CMAF標頭以該FTYP值開始的構件;及 用於處理在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段的構件。
  20. 如請求項19之裝置,其中該用於處理該一或多個CMAF片段的構件包含: 用於偵測該位元串流中之一或多個區段類型(STYP)值的構件; 用於判定該一或多個STYP值中之每一者對應於該等CMAF片段中之一各別者之一開始的構件;及 用於處理自該對應STYP值開始的該等CMAF片段中之每一者的構件。
  21. 如請求項20之裝置,其中該用於處理該等CMAF片段中之每一者的構件包含: 用於當該一或多個CMAF片段中之第一CMAF片段的對應STYP值具有「cmfs」之一值時將該等第一CMAF片段處理為包括於各別CMAF區段中的構件; 用於當該一或多個CMAF片段中之第二CMAF片段的對應STYP值具有「cmff」之一值時處理該等第二CMAF片段之樣本的構件;及 用於當該一或多個CMAF片段中之第三CMAF片段的對應STYP值具有「cmfl」之一值時將該等第三CMAF片段處理為包括各別CMAF組塊的構件。
  22. 一種上面儲存有指令之電腦可讀儲存媒體,該等指令在經執行時致使一處理器執行以下操作: 剖析根據共同媒體應用格式(CMAF)格式化之包括資料的一位元串流; 在該剖析期間,偵測該位元串流之一CMAF播放軌檔案的一檔案類型(FTYP)值; 判定該CMAF播放軌檔案之一CMAF標頭以該FTYP值開始;及 處理在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段。
  23. 如請求項22之電腦可讀儲存媒體,其中致使該處理器處理該一或多個CMAF片段的該等指令包含致使該處理器執行以下操作之指令: 偵測該位元串流中之一或多個區段類型(STYP)值; 判定該一或多個STYP值中之每一者對應於該等CMAF片段中之一各別者的一開始;及 處理自該對應STYP值開始的該等CMAF片段中之每一者。
  24. 如請求項23之電腦可讀儲存媒體,其中致使該處理器處理該等CMAF片段中之每一者的該等指令包含致使該處理器執行以下操作之指令: 當該一或多個CMAF片段中之第一CMAF片段的對應STYP值具有「cmfs」之一值時將該等第一CMAF片段處理為包括於各別CMAF區段中; 當該一或多個CMAF片段中之第二CMAF片段的對應STYP值具有「cmff」之一值時處理該等第二CMAF片段之樣本;及 當該一或多個CMAF片段中之第三CMAF片段的對應STYP值具有「cmfl」之一值時將該等第三CMAF片段處理為包括各別CMAF組塊。
  25. 一種產生包括媒體資料之一位元串流的方法,該方法包含: 藉由實施於電路系統中之一處理器產生一CMAF播放軌檔案之一共同媒體應用格式(CMAF)標頭; 藉由該處理器設定指示該CMAF標頭之開始的該CMAF標頭之一檔案類型(FTYP)值的一值; 藉由該處理器將媒體資料之一或多個樣本囊封於在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段中;及 藉由該處理器產生包括該CMAF標頭及該CMAF播放軌檔案之一位元串流,該一或多個CMAF片段在該CMAF播放軌檔案中之該CMAF標頭之後。
  26. 如請求項25之方法,其進一步包含: 判定該等CMAF片段中之每一者的類型;及 根據對應經判定之類型而設定該等CMAF片段中之每一者的區段類型(STYP)值,該等STYP值以該等對應CMAF片段開始。
  27. 如請求項26之方法, 其中判定類型包含判定該等CMAF片段中之至少一者包括一CMAF組塊;及 將用於該等CMAF片段中之該至少一者的該STYP值設定成指示該等CMAF片段中之該至少一者包括該CMAF組塊的一值。
  28. 如請求項27之方法,其中設定該STYP值包含將該STYP值設定成「cmfl」。
  29. 如請求項26之方法, 其中判定類型包含判定該等CMAF片段中之至少一者僅僅包含一CMAF片段;及 將用於該等CMAF片段中之該至少一者的該STYP值設定成指示該等CMAF片段中之該至少一者僅僅包含該CMAF片段的一值。
  30. 如請求項29之方法,其中設定該STYP值包含將該STYP值設定成「cmff」。
  31. 如請求項26之方法, 其中判定類型包含判定該等CMAF片段中之至少一者包括於一CMAF區段中;及 將用於該等CMAF片段中之該至少一者的該STYP值設定成指示該等CMAF片段中之該至少一者包括於該CMAF區段中的一值。
  32. 如請求項31之方法,其中設定該STYP值包含將該STYP值設定成「cmfs」。
  33. 一種產生包括媒體資料之一位元串流的裝置,該裝置包含: 一記憶體,其經組態以儲存媒體資料;及 一或多個處理器,其實施於電路系統中且經組態以: 藉由實施於電路系統中之一處理器產生該媒體資料之一CMAF播放軌檔案的一共同媒體應用格式(CMAF)標頭; 設定指示該CMAF標頭之開始的該CMAF標頭之一檔案類型(FTYP)值之一值; 在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段中囊封該媒體資料之一或多個樣本;及 產生包括該CMAF標頭及該CMAF播放軌檔案之一位元串流,該一或多個CMAF片段在該CMAF播放軌檔案中之該CMAF標頭之後。
  34. 如請求項33之裝置,其中該一或多個處理器經進一步組態以執行以下操作: 判定該等CMAF片段中之每一者的類型;及 根據對應經判定之類型而設定該等CMAF片段中之每一者的區段類型(STYP)值,該等STYP值以該等對應CMAF片段開始。
  35. 如請求項34之裝置,其中該一或多個處理器經組態以執行以下操作: 判定該等CMAF片段中之至少一者包括一CMAF組塊;及 將用於該等CMAF片段中之該至少一者的該STYP值設定成指示該等CMAF片段中之該至少一者包括該CMAF組塊的一值。
  36. 如請求項35之裝置,其中該一或多個處理器經組態以將用於該等CMAF片段中之該至少一者的該STYP值設定成「cmfl」。
  37. 如請求項34之裝置,其中該一或多個處理器經組態以執行以下操作: 判定該等CMAF片段中之至少一者僅僅包含一CMAF片段;及 將用於該等CMAF片段中之該至少一者的該STYP值設定成指示該等CMAF片段中之該至少一者僅僅包含該CMAF片段的一值。
  38. 如請求項37之裝置,其中該一或多個處理器經組態以將用於該等CMAF片段中之該至少一者的該STYP值設定成「cmff」。
  39. 如請求項34之裝置,其中該一或多個處理器經組態以執行以下操作: 判定該等CMAF片段中之至少一者包括於一CMAF區段中;及 將用於該等CMAF片段中之該至少一者的該STYP值設定成指示該等CMAF片段中之該至少一者包括於該CMAF區段中的一值。
  40. 如請求項34之裝置,其中該一或多個處理器經組態以將用於該等CMAF片段中之該至少一者的該STYP值設定成「cmfs」。
  41. 一種產生包括媒體資料之一位元串流的裝置,該裝置包含: 用於產生一CMAF播放軌檔案之一共同媒體應用格式(CMAF)標頭的構件; 用於設定指示該CMAF標頭之開始的該CMAF標頭之一檔案類型(FTYP)值之一值的構件; 用於在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段中囊封媒體資料之一或多個樣本的構件;及 用於產生包括該CMAF標頭及該CMAF播放軌檔案之一位元串流的構件,該一或多個CMAF片段在該CMAF播放軌檔案中之該CMAF標頭之後。
  42. 如請求項之裝置41,其進一步包含: 用於判定該等CMAF片段中之每一者的類型的構件;及 用於根據對應經判定之類型而設定該等CMAF片段中之每一者之區段類型(STYP)值的構件,該等STYP值以該等對應CMAF片段開始。
  43. 一種上面儲存有指令之電腦可讀儲存媒體,該等指令在經執行時致使一處理器執行以下操作: 產生一CMAF播放軌檔案之一共同媒體應用格式(CMAF)標頭; 設定指示該CMAF標頭之開始的該CMAF標頭之一檔案類型(FTYP)值之一值; 在該CMAF播放軌檔案之該CMAF標頭之後的一或多個CMAF片段中囊封媒體資料之一或多個樣本;及 產生包括該CMAF標頭及該CMAF播放軌檔案之一位元串流,該一或多個CMAF片段在該CMAF播放軌檔案中之該CMAF標頭之後。
  44. 如請求項43之電腦可讀儲存媒體,其進一步包含致使該處理器執行以下操作之指令: 判定該等CMAF片段中之每一者的類型;及 根據對應經判定之類型而設定該等CMAF片段中之每一者的區段類型(STYP)值,該等STYP值以該等對應CMAF片段開始。
TW107111995A 2017-04-04 2018-04-03 作為分隔符及可定址之資源識別符之區段類型 TW201842785A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201762481594P 2017-04-04 2017-04-04
US62/481,594 2017-04-04
US15/943,399 US10924822B2 (en) 2017-04-04 2018-04-02 Segment types as delimiters and addressable resource identifiers
US15/943,399 2018-04-02

Publications (1)

Publication Number Publication Date
TW201842785A true TW201842785A (zh) 2018-12-01

Family

ID=63670215

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107111995A TW201842785A (zh) 2017-04-04 2018-04-03 作為分隔符及可定址之資源識別符之區段類型

Country Status (7)

Country Link
US (4) US10924822B2 (zh)
EP (1) EP3607754A1 (zh)
CN (1) CN110447234B (zh)
BR (1) BR112019020629A2 (zh)
SG (1) SG11201907668PA (zh)
TW (1) TW201842785A (zh)
WO (1) WO2018187318A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10924822B2 (en) 2017-04-04 2021-02-16 Qualcomm Incorporated Segment types as delimiters and addressable resource identifiers
US11695817B2 (en) * 2019-03-20 2023-07-04 Qualcomm Incorporated Methods and apparatus to facilitate using a streaming manifest including a profile indication
CN112399189B (zh) * 2019-08-19 2022-05-17 腾讯科技(深圳)有限公司 延时输出控制方法、装置、系统、设备及介质
EP4062649A2 (en) * 2019-11-20 2022-09-28 Dolby International AB Methods and devices for personalizing audio content
WO2021105370A1 (en) * 2019-11-28 2021-06-03 Dolby International Ab Methods and devices for providing personalized audio to a user
US11546406B2 (en) * 2020-04-13 2023-01-03 Tencent America LLC Media systems and methods including mixed event message tracks
US20230224502A1 (en) * 2020-06-09 2023-07-13 Telefonaktiebolaget Lm Ericsson (Publ) Providing semantic information with encoded image data
US11765444B2 (en) * 2020-07-01 2023-09-19 Qualcomm Incorporated Streaming media data including an addressable resource index track
EP4009649A1 (en) * 2020-12-03 2022-06-08 Anevia Method for media stream processing and apparatus for implementing the same
EP4009650A1 (en) * 2020-12-03 2022-06-08 Anevia Method for media stream processing and apparatus for implementing the same
US11818189B2 (en) * 2021-01-06 2023-11-14 Tencent America LLC Method and apparatus for media streaming
US11784787B2 (en) 2022-02-01 2023-10-10 Synamedia Limited Streaming with low latency encryption ready packaging
US11750865B1 (en) * 2022-04-08 2023-09-05 CodeShop, B.V. Method and system for synchronization of adaptive streaming transcoder and packager outputs
US20230412669A1 (en) * 2022-06-15 2023-12-21 Microsoft Technology Licensing, Llc Self-driven adaptive upload
WO2024006291A1 (en) * 2022-06-29 2024-01-04 Bytedance, Inc. Edrap in dash based on ari track
US20240022792A1 (en) * 2022-07-12 2024-01-18 Tencent America LLC Method for bandwidth switching by cmaf and dash clients using addressable resource index tracks and events

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080070471A (ko) * 2007-01-26 2008-07-30 엘지전자 주식회사 파일 포맷을 구성하는 방법과 상기 파일 포맷을 가지는파일을 포함한 디지털 방송 신호를 처리하는 장치 및 방법
US8489702B2 (en) * 2007-06-22 2013-07-16 Apple Inc. Determining playability of media files with minimal downloading
US8755672B2 (en) * 2007-06-26 2014-06-17 Lg Electronics Inc. Media file format based on, method and apparatus for reproducing the same, and apparatus for generating the same
KR101530713B1 (ko) * 2008-02-05 2015-06-23 삼성전자주식회사 영상 파일을 생성하고 표시하기 위한 장치 및 방법
WO2010123248A2 (ko) 2009-04-20 2010-10-28 엘지전자 주식회사 P2p 전송 방식에 의한 iptv 스트리밍 서비스를 전송하는 방법 및 p2p 전송 방식에 의한 iptv 스트리밍 서비스를 수신하는 방법.
KR101739272B1 (ko) * 2011-01-18 2017-05-24 삼성전자주식회사 멀티미디어 스트리밍 시스템에서 컨텐트의 저장 및 재생을 위한 장치 및 방법
KR101814798B1 (ko) * 2011-01-26 2018-01-04 삼성전자주식회사 입체영상 처리 장치 및 방법
WO2011100901A2 (zh) * 2011-04-07 2011-08-25 华为技术有限公司 媒体内容的传输处理方法、装置与系统
US9042449B2 (en) * 2011-09-29 2015-05-26 Avvasi Inc. Systems and methods for dynamic transcoding of indexed media file formats
KR101965374B1 (ko) * 2013-01-18 2019-04-03 캐논 가부시끼가이샤 비디오 데이터의 재생 방법 및 비디오 데이터를 재생하기 위한 디바이스
JP2014230055A (ja) * 2013-05-22 2014-12-08 ソニー株式会社 コンテンツ供給装置、コンテンツ供給方法、プログラム、およびコンテンツ供給システム
GB2516826B (en) 2013-07-23 2016-06-22 Canon Kk Method, device and computer program for encapsulating partitioned timed media data by creating tracks to be independently encapsulated in at least one media f
KR101779435B1 (ko) * 2014-01-03 2017-09-18 엘지전자 주식회사 방송 신호를 송신하는 장치, 방송 신호를 수신하는 장치, 방송 신호를 송신하는 방법 및 방송 신호를 수신하는 방법
KR20160142327A (ko) * 2014-04-30 2016-12-12 엘지전자 주식회사 방송 전송 장치, 방송 수신 장치, 방송 전송 장치의 동작 방법 및 방송 수신 장치의 동작 방법
KR102191878B1 (ko) * 2014-07-04 2020-12-16 삼성전자주식회사 멀티미디어 시스템에서 미디어 패킷을 수신하는 방법 및 장치
US10291561B2 (en) * 2015-02-09 2019-05-14 Nokia Technologies Oy Apparatus, a method and a computer program for image coding and decoding
US10270823B2 (en) 2015-02-10 2019-04-23 Qualcomm Incorporated Low latency video streaming
JP6868802B2 (ja) * 2015-08-03 2021-05-12 パナソニックIpマネジメント株式会社 送信方法、受信方法、送信装置及び受信装置
US10306308B2 (en) * 2015-12-15 2019-05-28 Telefonaktiebolaget Lm Ericsson (Publ) System and method for media delivery using common mezzanine distribution format
US10136146B1 (en) * 2016-03-23 2018-11-20 Amazon Technologies, Inc. Metadata optimizations for encoding of media content
US20180103271A1 (en) 2016-10-10 2018-04-12 Qualcomm Incorporated Systems and methods for signaling missing or corrupted video data
US11290755B2 (en) 2017-01-10 2022-03-29 Qualcomm Incorporated Signaling data for prefetching support for streaming media data
US10999605B2 (en) 2017-01-10 2021-05-04 Qualcomm Incorporated Signaling of important video information in file formats
WO2018154381A1 (en) * 2017-02-24 2018-08-30 Telefonaktiebolaget Lm Ericsson (Publ) System and method for watermarking of media segments using sample variants for normalized encryption (svne)
US10924822B2 (en) 2017-04-04 2021-02-16 Qualcomm Incorporated Segment types as delimiters and addressable resource identifiers

Also Published As

Publication number Publication date
BR112019020629A2 (pt) 2020-04-22
US11924526B2 (en) 2024-03-05
US20210127182A1 (en) 2021-04-29
SG11201907668PA (en) 2019-10-30
EP3607754A1 (en) 2020-02-12
US10924822B2 (en) 2021-02-16
US11223883B2 (en) 2022-01-11
US20230328337A1 (en) 2023-10-12
WO2018187318A1 (en) 2018-10-11
US20220116691A1 (en) 2022-04-14
CN110447234A (zh) 2019-11-12
CN110447234B (zh) 2021-12-17
US20180288500A1 (en) 2018-10-04
US11706502B2 (en) 2023-07-18

Similar Documents

Publication Publication Date Title
US11706502B2 (en) Segment types as delimiters and addressable resource identifiers
US20230283863A1 (en) Retrieving and accessing segment chunks for media streaming
TWI714602B (zh) 超級本文傳輸協定(http)上動態自適應串流(dash)客戶經驗品質度量之中間軟體傳遞
TW201830974A (zh) 對於用於串流媒體資料之預取支持之資料發信
TW202037177A (zh) 用於串流媒體資料之服務描述
KR102434300B1 (ko) 샘플 엔트리들 및 랜덤 액세스
JP2017528022A (ja) ネットワークを介して交換されたファイルのためのエラー処理
TW201909007A (zh) 使用用於檔案格式邏輯框之一通用描述符處理媒體資料
CN109644282B (zh) 用于媒体数据流式处理的补充增强信息轨迹的系统级发信
TW201947937A (zh) 用於資訊清單檔案中之網路串流之媒體資料之發信丟失區段
TW201743614A (zh) 樣本條目及隨機存取
TWI820227B (zh) 用於媒體資料之網路串流之初始化集合
CN114430911A (zh) 在dash分段的再同步点处的随机存取
US20210306703A1 (en) Determination of availability of chunks of data for network streaming media data
TW202337225A (zh) 用於適應性流送的動態解析度改變提示
CN114430909A (zh) 用于自适应比特率组播的修复机制