TWI774744B - 在使用mime類型參數之網路視頻串流中發信重要視頻資訊 - Google Patents

在使用mime類型參數之網路視頻串流中發信重要視頻資訊 Download PDF

Info

Publication number
TWI774744B
TWI774744B TW107110573A TW107110573A TWI774744B TW I774744 B TWI774744 B TW I774744B TW 107110573 A TW107110573 A TW 107110573A TW 107110573 A TW107110573 A TW 107110573A TW I774744 B TWI774744 B TW I774744B
Authority
TW
Taiwan
Prior art keywords
data
representation
video
track
media
Prior art date
Application number
TW107110573A
Other languages
English (en)
Other versions
TW201841512A (zh
Inventor
益魁 王
湯瑪士 史塔克漢莫
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW201841512A publication Critical patent/TW201841512A/zh
Application granted granted Critical
Publication of TWI774744B publication Critical patent/TWI774744B/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • H04N21/25833Management of client data involving client hardware characteristics, e.g. manufacturer, processing or storage capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4621Controlling the complexity of the content stream or additional data, e.g. lowering the resolution or bit-rate of the video stream for a mobile client with a small screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4825End-user interface for program selection using a list of items to be played back in a given order, e.g. playlists
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Graphics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本發明係關於一種用於擷取媒體資料之實例裝置,該實例裝置包括一或多個處理器,其經組態以:擷取一資訊清單檔案,該資訊清單檔案指定針對一媒體呈現之至少一個表示的資料,其中該資訊清單檔案包括指定用於該至少一個表示之一或多個編解碼器的資料;自該資訊清單檔案提取指定該一或多個編解碼器之該資料,該資料包括表示該至少一個表示之一播放軌之一樣本項類型碼的一第一元素及表示用於該播放軌之一受約束方案之一受約束方案類型碼的一第二元素,其中該第一元素表示使用該受約束方案之該樣本項類型碼;及基於該第一元素及該第二元素擷取該至少一個表示之該媒體資料。

Description

在使用MIME類型參數之網路視頻串流中發信重要視頻資訊
本發明係關於經編碼媒體資料之輸送。
數位視頻能力可併入至廣泛範圍的裝置中,該等裝置包括數位電視、數位直播系統、無線廣播系統、個人數位助理(personal digital assistant,PDA)、膝上型或桌上型電腦、數位攝像機、數位記錄裝置、數位媒體播放器、視頻遊戲裝置、視頻遊戲控制台、蜂巢式或衛星無線電電話、視頻電話會議裝置及類似者。數位視頻裝置實施視頻壓縮技術,諸如描述於由MPEG-2、MPEG-4、ITU-T H.263或ITU-T H.264/MPEG-4第10部分「進階視頻寫碼(Advanced Video Coding,AVC)」、ITU-T H.265 (亦參考高效率視頻寫碼(High Efficiency Video Coding ,HEVC))及此類標準之擴展中所定義的標準中之彼等技術,從而更有效地傳輸且接收數位視頻資訊。 在已編碼視頻(及其他媒體資料)資料之後,視頻資料可經封包化以供傳輸或儲存。可將視頻資料組譯成符合多種標準中之任一者的視頻檔案,該等標準係諸如國際標準化組織(International Organization for Standardization,ISO)基本媒體檔案格式及其擴展,諸如AVC。
一般而言,本發明描述用於發信關於以下各者之重要視頻資訊的技術:高動態範圍(high dynamic range,HDR)、廣色域(wide colour gamut,WCG)視頻、虛擬實境/全向/360度視頻、經圖框封裝視頻、具有顯示定向改變之視頻、使用ISO基本媒體檔案格式(ISO base media file format,ISOBMFF)之受約束方案特徵儲存的視頻,及使用需要專用後解碼顯現處理以提供所要視覺體驗的其他特徵之視頻。特定言之,描述各種實例MIME類型參數,其可在高位準系統發信訊息主體中曝露此重要視頻資訊,例如,經由HTTP的動態自適應串流傳輸(dynamic adaptive streaming over HTTP,DASH)媒體呈現描述(media presentation description,MPD)檔案(或其他此類資訊清單檔案),使得重要視頻資訊可方便地藉由諸如DASH用戶端之應用程式用戶端存取,以做出內容拒斥/選擇/接受/請求決策。即,DASH用戶端可使用此資訊以選擇恰當媒體資料集合(例如,恰當的DASH表示),其中當該用戶端裝置能夠解碼及顯現該媒體資料(例如,用戶端裝置包括能夠解碼包括在DASH表示中之該媒體資料之視頻解碼器)時,該媒體資料可被視為「恰當的」。 在一個實例中,一種擷取媒體資料之方法包括:擷取指定針對一媒體呈現之至少一個表示之資料的一資訊清單檔案,其中該資訊清單檔案包括指定針對該至少一個表示之一或多個編解碼器的資料;自該資訊清單檔案提取指定該一或多個編解碼器之該資料,該提取操作包括:提取表示該至少一個表示之一播放軌之一樣本項類型碼的一第一元素,其中該第一元素表示播放軌包括使用一受約束方案儲存之視訊資料;及提取表示針對該播放軌之該受約束方案之一受約束方案類型碼的一第二元素;以及基於該第一元素及該第二元素擷取該至少一個表示之該媒體資料。 在另一實例中,一種用於擷取媒體資料之裝置包括經組態以儲存媒體資料之記憶體;及一或多個處理器,其在電路中實施且經組態以:擷取指定針對一媒體呈現之至少一個表示之資料的一資訊清單檔案,其中該資訊清單檔案包括指定針對該至少一個表示之一或多個編解碼器之資料;自該資訊清單檔案提取指定該一或多個編解碼器之該資料,該資料包括表示該至少一個表示之一播放軌之一樣本項類型碼的一第一元素及表示針對該播放軌之一受約束方案之一受約束方案類型碼的一第二元素,其中該第一元素表示該播放軌包括使用該受約束方案儲存之視頻資料;以及基於第一元素及第二元素擷取該至少一個表示的媒體資料。 在另一實例中,一種用於擷取媒體資料之裝置包括:用於擷取一資訊清單檔案之構件,該資訊清單檔案指定針對一媒體呈現之至少一個表示之資料,其中該資訊清單檔案包括指定針對該至少一個表示之一或多個編解碼器的資料;用於自該資訊清單檔案提取指定該一或多個編解碼器之該資料的構件,該構件包括:用於提取表示該至少一個表示之一播放軌之一樣本項類型碼之一第一元素的構件,其中該第一元素表示該播放軌包括使用一受約束方案儲存之視頻資料;及用於提取一第二元素之構件,該第二元素表示針對該播放軌之該受約束方案之一受約束方案類型碼;及用於基於該第一元素及該第二元素擷取該至少一個表示的媒體資料之構件。 在另一實例中,一種諸如非暫時性電腦可讀儲存媒體之電腦可讀儲存媒體上面已儲存有指令,該等指令在被執行時致使一處理器以:擷取指定針對一媒體呈現之至少一個表示之資料的一資訊清單檔案,其中該資訊清單檔案包括指定針對該至少一個表示之一或多個編解碼器的資料;自該資訊清單檔案提取指定該一或多個編解碼器之該資料,該等指令包括致使該處理器執行以下操作之指令:提取表示該至少一個表示之一播放軌之一樣本項類型碼的一第一元素,其中該第一元素表示該播放軌包括使用一受約束方案儲存之視頻資料;及提取一第二元素,該第二元素表示針對該播放軌之該受約束方案之一受約束方案類型碼;以及基於該第一元素及該第二元素擷取該至少一個表示的媒體資料。 在以下隨附圖式及描述中闡述一或多個實例之細節。其他特徵、目標及優點將自該描述及圖式以及自申請專利範圍為顯而易見。
本申請案要求2017年3月27日申請之美國臨時申請案第62/477,350號之權益,該申請案之整個內容據此以引用的方式併入。 一般而言,本發明描述用於發信關於以下各者之重要視頻資訊的技術:高動態範圍(HDR)、廣色域(WCG)視頻、虛擬實境/全向/360度視頻、經圖框封裝視頻、具有顯示定向改變之視頻、使用ISO基本媒體檔案格式(ISOBMFF)之受約束方案特徵儲存之視頻,及使用需要專用後解碼顯現處理以提供所要視覺體驗之其他特徵的視頻。特定言之,描述各種實例MIME類型參數,其可在高層級系統發信訊息主體中曝露此等重要視頻資訊,例如,經由HTTP之動態自適應串流傳輸(DASH)媒體呈現描述(MPD)檔案(或其他此等資訊清單檔案),使得重要視頻資訊可適宜地藉由應用程式用戶端存取,諸如DASH用戶端,以做出內容拒斥/選擇/接受/請求決策。即,DASH用戶端可使用此資訊來選擇恰當媒體資料組(例如,恰當DASH表示),其中當該用戶端裝置能夠解碼及顯現該媒體資料(例如,用戶端裝置包括能夠解碼包括在DASH表示中之該媒體資料之視頻解碼器)時,該媒體資料可被視為「恰當的」。 舉例而言,本發明揭露發信關於使用受約束方案儲存之視頻、HDR/WCG視頻、VR/全向/360視頻、經圖框封裝視頻及具有顯示定向改變之視頻的重要視頻資訊之若干實例方法,使得該重要視頻資訊可藉由諸如DASH用戶端之應用程式用戶端方便地存取,以做出內容拒斥/選擇/接受/請求決策。可獨立地或以任何組合執行此等方法中之一或多者。 在本文獻之上下文中,「重要視頻資訊」包括可用於內容選擇之視頻資訊,例如,選擇視頻播放軌或其部分以供消耗。 視頻寫碼標準包括ITU-T H.261;ISO/IEC MPEG-1 Visual;ITU-T H.262或ISO/IEC MPEG-2 Visual;ITU-T H.263;ISO/IEC MPEG-4 Visual;ITU-T H.264或ISO/IEC MPEG-4 AVC,包括其可調式視頻寫碼(Scalable Video Coding,SVC)及多視圖視頻寫碼(Multiview Video Coding,MVC)擴展;及亦被稱作ITU-T H.265及ISO/IEC 23008-2之高效率視頻寫碼(High-Efficiency Video Coding,HEVC),包括其可調式寫碼擴展(亦即,可調式高效率視頻寫碼,SHVC)及多視圖擴展(亦即,多視圖高效率視頻寫碼,MV-HEVC)。 AVC及HEVC兩者支援藉由圖框封裝配置SEI信息指示之圖框封裝視頻。HEVC亦支援藉由分段矩形圖框封裝配置SEI訊息指示的不同類型之圖框封裝視頻。對於此等經圖框封裝視頻,解碼器側應應用專用解除封裝轉換以在顯示之前分離視頻位元串流中表示之兩個視圖的分量。 AVC及HEVC亦支援藉由顯示定向SEI訊息指示之視頻內容,對於該視頻內容,解碼器側應在顯示之前對經裁切之經解碼圖像應用旋轉及/或翻轉轉換。此視頻亦被稱作具有顯示定向改變之視頻。 本發明之技術可應用於符合根據以下各者中之任一者囊封之視頻資料的視頻檔案:ISO基本媒體檔案格式、可調式視頻寫碼(SVC)檔案格式、進階視頻寫碼(AVC)檔案格式、第三代合作夥伴計劃(3GPP)檔案格式及/或多視圖視頻寫碼(MVC)檔案格式或其他類似視頻檔案格式。 檔案格式標準包括ISO基本媒體檔案格式(ISOBMFF、ISO/IEC 14496-12),及自ISOBMFF衍生的其他標準,包括MPEG-4檔案格式(ISO/IEC 14496-15)、3GPP檔案格式(3GPP TS 26.244)及用於AVC及HEVC族之視頻編解碼器的檔案格式(ISO/IEC 14496-15)。ISO/IEC 14496-12及14496-15之草案本文可分別在http://phenix.int-evry.fr/mpeg/doc_end_user/documents/111_Geneva/wg11/w15177-v6-w15177.zip及http://wg11.sc29.org/doc_end_user/documents/ 115_Geneva/wg11/w16169-v2-w16169.zip處獲得。 將ISOBMFF用作諸如AVC檔案格式之許多編解碼器囊封格式以及諸如MPEG-4檔案格式、3GPP檔案格式(3GP)及DVB檔案格式之許多多媒體容器格式的基礎。 除諸如音訊及視頻之連續媒體之外,諸如影像之靜態媒體以及後設資料可儲存於符合ISOBMFF之檔案中。根據ISOBMFF結構化之檔案可用於許多用途,包括本端媒體檔案播放、遠端檔案之漸進式下載、針對經由HTTP之動態自適應串流傳輸(DASH)之區段、用於待串流傳輸之內容及其封包化指令之容器及接收到之即時媒體串流的記錄。 方塊為ISOBMFF中之基本語法結構,包括經四字元寫碼之方塊類型、方塊之位元組計數及有效負載。ISOBMFF檔案由一系列方塊組成,且方塊可含有其他方塊。電影方塊(「moov」)含有用於存在於檔案中之連續媒體串流的後設資料,每一媒體串流在檔案中表示為播放軌。將針對播放軌之後設資料圍封於播放軌方塊(「trak」)中,而將播放軌之媒體內容圍封於媒體資料方塊(「mdat」)中或直接圍封於單獨檔案中。針對播放軌之媒體內容由一系列樣本諸如若干音訊或視頻存取單元組成。 ISOBMFF指定以下類型之播放軌:媒體播放軌,其含有基本媒體串流;提示播放軌,其包括媒體傳輸指令或表示接收到之封包串流;及定時後設資料播放軌,其包含經時間同步之後設資料。 儘管最初針對儲存而設計,但ISOBMFF已證明為可極有價值地用於串流傳輸,例如,用於漸進式下載或DASH。為了串流傳輸目的,可使用在ISOBMFF中定義之電影片段。 每一播放軌之後設資料包括樣本描述項之清單,每一項提供在播放軌中使用之寫碼或囊封格式及處理彼格式需要之初始化資料。各樣本係與播放軌之樣本描述項中之一者相關聯。 ISOBMFF使得能夠用各種機構指定樣本特定後設資料。樣本表方塊內之特定方塊(「stbl」)已經標準化以對共同需要做出回應。舉例而言,同步樣本方塊(「stss」)用以列舉播放軌之隨機存取樣本。樣本分組機構使得能夠根據四字元分組類型將樣本映射成共用指定為檔案中之樣本群組描述項的相同性質的樣本群組。已在ISOBMFF中指定若干分組類型。 高動態範圍(HDR)及廣色域(WCG)資訊可使用定義於ISOBMFF規範之條款12.1.5中之ColourInformationBox發信。舉例而言,colour_type可設定為等於「nclx」,其指示最重要的HDR/WCG資訊係攜載於欄位colour_primaries、transfer_characteristics、matrix_coefficients及full_range_flag中。 ISOBMFF指定受約束方案設計。ISOBMFF中之受約束方案設計係用於處置檔案創作者需要對播放器或顯現器進行某些動作之情形以使得播放器能夠簡單地檢視檔案以找尋顯現位元串流之此等要求,且使舊版播放器停止解碼並顯現需要進一步處理之檔案。機構適用於任何類型之視頻編解碼器。 機構類似於內容保護轉換,從而指示經加密或囊封之媒體,其中樣本項隱藏於通用樣本項「encv」、「enca」等後方。用於受約束視頻之類似機構使用具有通用樣本項「resv」之轉換。方法在內容應僅由可正確地呈現內容之播放器解碼時可予以應用。 受約束方案在ISOBMFF規範之條款8.15.1至8.15.3中指定。 ISOBMFF規範之條款8.15.4定義用於圖框封裝視頻之特定受約束方案類型。 ISO/IEC 23009-1中指定之經由HTTP的動態自適應串流傳輸(DASH)係用於HTTP (自適應)串流傳輸應用程式之標準。其主要指定亦被稱作資訊清單之媒體呈現描述(MPD)之格式,及媒體區段格式。MPD描述在伺服器上可得到的媒體且在所關注之媒體時間使DASH用戶端自主地下載媒體版本。 用於基於DASH之HTTP串流傳輸的典型程序包括以下步驟: 1) DASH用戶端獲得串流傳輸內容例如電影的MPD。MPD包括關於串流傳輸內容的不同替代性表示之資訊,例如,位元速率、視頻解析度、圖框速率、音訊語言;以及HTTP資源之URL (初始化區段及媒體區段)。 2) 基於MPD中之資訊及DASH用戶端之本端資訊,例如,網路頻寬、解碼/顯示能力及使用者偏好,用戶端一次一個區段(或其部分,例如,局部區段)地請求所要表示。 3) 當該DASH用戶端偵測到網路頻寬改變時,該DASH用戶端請求具有具較好匹配位元速率之不同表示的區段,理想地自以隨機存取點開始的區段開始。 在HTTP串流傳輸「作業階段」期間,為對使用者請求作出回應以反向搜尋過去的位置或前向搜尋未來位置,該DASH用戶端請求開始於接近使用者請求之位置且理想地開始於隨機存取點之過去區段或未來區段。使用者亦可請求快速轉遞內容,其可藉由請求足以解碼僅經框內寫碼視頻圖像或僅視頻串流之臨時子集的資料來實現。 在諸如DASH之HTTP串流傳輸中,頻繁使用之操作包括HEAD、GET及部分GET。HEAD操作擷取檔案的與給定的統一資源定位符(uniform resource locator,URL)或統一資源名稱(uniform resource name ,URN)相關聯之標頭而不擷取與URL或URN相關聯之有效負載。GET操作擷取與給定URL或URN相關之整個檔案。部分GET操作接收位元組範圍作為輸入參數且擷取檔案之連續數目個位元組,其中位元組之數目對應於所接收位元組範圍。因此,可提供電影片段以用於HTTP串流傳輸,此係因為部分GET操作可得到一或多個個別的電影片段。在電影片段中,可存在不同播放軌之若干播放軌片段。在HTTP串流傳輸中,媒體呈現可為用戶端可存取之資料的結構化集合。用戶端可請求且下載媒體資料資訊以向使用者呈現串流傳輸服務。 在使用HTTP串流傳輸來串流傳輸3GPP資料之實例中,可能存在針對多媒體內容之視頻及/或音訊資料的多個表示。如下文所解釋,不同表示可對應於不同寫碼特性(例如,視頻寫碼標準之不同設定檔或層級)、不同寫碼標準或寫碼標準之擴展(諸如多視圖及/或可調式擴展)或不同位元速率。此等表示之資訊清單可在媒體呈現描述(MPD)資料結構中定義。媒體呈現可對應於對於HTTP串流傳輸用戶端裝置可存取之資料的結構化集合。HTTP串流傳輸用戶端裝置可請求且下載媒體資料資訊以向用戶端裝置之使用者呈現串流傳輸服務。媒體呈現可以MPD資料結構描述,MPD資料結構可包括MPD之更新。 媒體呈現可含有一或多個時段之序列。每一時段可延伸直至下一時段開始,或在最後一時段情況下直至媒體呈現結束。每一時段可含有針對同一媒體內容之一或多個表示。表示可為音訊、視頻、定時文字或其他此類資料之數個替代性編碼版本中之一者。表示可因編碼類型而不同,例如,對於視頻資料而言因位元速率、解析度及/或編解碼器而不同,且對於音訊資料因位元速率、語言及/或編解碼器而不同。術語表示可用以指經編碼音訊或視頻資料的對應於特定時段之多媒體內容且以特定方式編碼的部分。 特定時段之表示可指派給由MPD中之屬性指示之群組,該MPD指示表示屬於之適配集。同一適配集中之表示通常被視為彼此之替代例,在於用戶端裝置可在此等表示之間動態且無縫地切換,以例如執行頻寬適配。舉例而言,特定時段之視頻資料之每一表示可指派給同一適配集,以使得可選擇該等表示中之任一者以供解碼以呈現對應時段之多媒體內容的媒體資料,諸如視頻資料或音訊資料。在一些實例中,一個時段內之媒體內容可由來自群組0 (若存在)之一個表示來表示,或由來自每一非零群組的至多一個表示之組合來表示。時段之每一表示之時序資料可相對於該時段之開始時間來表達。 一表示可包括一或多個區段。每一表示可包括初始化區段,或表示之每一區段可自初始化。當存在時,初始化區段可含有用於存取表示之初始化資訊。大體而言,初始化區段不含有媒體資料。區段可由諸如統一資源定位符(URL)、統一資源名稱(URN)或統一資源識別符(uniform resource identifier ,URI)之識別符唯一地提及。MPD可為每一區段提供識別符。在一些實例中,MPD亦可提供呈範圍屬性之形式的位元組範圍,該等範圍屬性可對應於由URL、URN或URI可存取之檔案內之區段的資料。 可選擇不同表示以大體上同時擷取不同類型之媒體資料。舉例而言,用戶端裝置可選擇擷取區段所自的音訊表示、視頻表示及定時文字表示。在一些實例中,用戶端裝置可選擇特定調適集以用於執行頻寬適配。即,用戶端裝置可選擇包括視頻表示之適配集、包括音訊表示之適配集及/或包括定時文字之適配集。替代地,用戶端裝置可選擇針對特定類型媒體(例如,視頻)之適配集,且直接選擇針對其他類型之媒體(例如,音訊及/或定時文字)之表示。 虛擬實境(virtual reality,VR)係虛擬地呈現於藉由自然及/或合成影像之顯現及與沉浸使用者之移動相關的聲音產生的非實體世界中從而允許與彼世界交互的能力。在諸如頭戴式顯示器(head mounted display,HMD)之顯現裝置的最新進展及VR視頻(常常亦稱作360度視頻)產生的情況下,可給予顯著體驗品質。VR應用程式包括遊戲、訓練、教育、運動視頻、線上購物、視頻娛樂等。 典型VR系統可包括如下組件及步驟: 1) 攝影機集合,其通常包括指向不同方向且理想地全體涵蓋該攝影機集合周圍之所有視點的多個個別攝影機。 2) 影像拼接,其中藉由多個個別攝影機拍攝的視頻圖像在時域中予以同步並在空間域中予以拼接以形成球形視頻,但映射至矩形格式,諸如球形展開(如世界地圖)或立體圖。 3) 呈映射矩形格式之視頻係使用視頻編解碼器例如 H.265/HEVC或H.264/AVC來編碼/壓縮。 4) 壓縮視頻位元串流可以一媒體格式儲存及/或囊封,且經由網路被傳輸(可能僅涵蓋使用者可見之區域的子集)至接收器。 5) 接收器接收可能以一格式囊封之視頻位元串流或其部分,且發送經解碼視頻信號或其部分至顯現裝置。 6) 顯現裝置可為例如HMD,其可追蹤頭部移動及甚至眼部運動時刻,且顯現視頻之對應部分,使得將沉浸式體驗遞送至使用者。 全向媒體應用程式格式(OMAF)正藉由MPEG開發以定義允許全向媒體應用程式之媒體應用程式格式,從而集中於具有360度視頻及關聯音訊的VR應用程式。OMAF指定投影方法之清單,該等方法可用於將球形或360°視頻轉換成二維矩形視頻,繼之以如何使用ISO基本媒體檔案格式(ISOBMFF)儲存全向媒體及關聯後設資料及如何使用經由HTTP之動態自適應串流傳輸(DASH)囊封、發信及串流傳輸全向媒體,以及最終哪些視頻及音訊編解碼器以及媒體寫碼組態可用於壓縮及播放全向媒體信號。 OMAF意欲標準化為ISO/IEC 23000-20,且被稱作OMAF委員會草案(Committee Draft,CD)之草案規範在http://wg11.sc29.org/doc_end_user/ documents/117_Geneva /wg11/w16636.zip處可得到。 OMAF CD之條款7.1界定用於VR/全向/360視頻之特定受約束方案類型,「odvd」。OMAF CD指定,當scheme_type等於「odvd」時,方案資訊方塊(「schi」)需要含有ProjectedOmnidirectionalVideoBox (「povd」)或FisheyeOmnidirectionalVideoBox (「fovd」)。OMAF CD指定含有ProjectionFormatBox之「povd」方塊,其攜載geometry_type及projection_type。按OMAF CD,geometry_type可例如指示球形幾何形狀,且projection_type可指示球形展開投影、立方圖投影或某其他投影類型。此等資訊段對於內容選擇用途皆係重要的。 DASH規範包括MPD屬性@mimeType及@codecs之定義,該兩者可在適配集、表示或子表示之層級上輸送。 @mimeType屬性在DASH規範之條款5.3.7.2中定義如下:
Figure 107110573-A0304-0001
此外,在DASH規範之條款7.3.1中,@mimeType屬性之語義對於基於ISOBMFF之媒體呈現闡明如下: 「各表示之@mimeType屬性應根據RFC 4337設置。額外參數可根據RFC 6381添加。」 @codecs屬性在DASH規範之條款5.3.7.2中定義如下:
Figure 107110573-A0304-0002
ISO/IEC 14496-15之條款E界定用於AVC、HEVC及其擴展之「codecs」參數。 根據ISO/IEC 14496-15之條款E及RFC 6381,「codecs」參數係可選MIME類型參數。然而,ISO/IEC 14496-15及RFC 6381並不清楚「codecs」參數是否可作為@mimeType屬性之部分輸送。 如RFC 6381中所指定,「codecs」參數係單個值或值的經逗點分離之清單,其中各值由一或多個經點分離(例如,句點定界)元素構成。第一元素之名稱空間係由MIME類型判定。各後續元素之名稱空間係由前一元素判定。對於ISOBMFF,「codecs」參數值之第一元素係樣本描述項四字元碼。 關於HDR/WCG視頻、VR/全向/360視頻、圖框封裝視頻、具有顯示定向改變之視頻及使用受約束方案儲存之視頻的發信的現有設計可遭遇如下問題: 1) 缺少指示受約束方案之使用之機制,以及MIME類型參數中例如針對VR/全向/360視頻及圖框封裝視頻的所使用之受約束方案之一些重要細節。此外,如下問題(question/issue)並不明顯。 a. DASH用戶端如何處置含有未辨識可選參數之@mimeType ? 忽略未辨識部分且採取剩餘部分,如同未辨識部分未曾存在一般?或忽略整個適配集/表示/子表示(亦即,不嘗試請求/處理含有此@mimeType屬性之適配集/表示/子表示)? i.後者似乎更有意義。 ii. RFC 4337/RFC 6381對此為靜默的。此應在某處清楚地指定,較佳地在對RFC 6381之更新中指定(其順便更新RFC 4337)。 b.針對使用受約束方案儲存之視頻的「codecs」參數應為何? c.使用之受約束方案應藉由「codecs」參數指示,抑或是藉由不同/單獨MIME類型參數指示?若「codecs」參數與在界定/具有針對使用之受約束方案之指示的額外可選MIME類型參數同時不使用受約束方案情況下的彼參數相同,存在回溯相容性問題? 2) 對於具顯示定向改變之視頻,缺失專用受約束方案,且上述第一問題亦適用。 3) 缺少包括針對HDR/WCG視頻之重要視頻資訊作為MIME類型參數之部分的機制。 圖1為說明實例系統10之方塊圖,該實例系統實施用於經由網路串流傳輸媒體資料之技術。在此實例中,系統10包括內容準備裝置20、伺服器裝置60及用戶端裝置40。用戶端裝置40及伺服器裝置60藉由網路74以通信方式耦接,該網路74可包含網際網路。在一些實例中,內容準備裝置20與伺服器裝置60亦可藉由網路74或另一網路耦接,或可直接以通信方式耦接。在一些實例中,內容準備裝置20及伺服器裝置60可包含同一裝置。 在圖1之實例中,內容準備裝置20包含音訊源22及視頻源24。音訊源22可例如包含麥克風,其產生表示待藉由音訊編碼器26編碼之所俘獲音訊資料的電信號。替代地,音訊源22可包含儲存先前記錄之音訊資料的儲存媒體、諸如電腦化之合成器之音訊資料產生器或任何其他音訊資料源。視頻源24可包含:視頻攝影機,其產生待藉由視頻編碼器28編碼之視頻資料;儲存媒體,其編碼有先前記錄之視頻資料;視頻資料產生單元,諸如電腦圖形源;或任何其他視頻資料源。內容準備裝置20不必在所有實例中均以通信方式耦接至伺服器裝置60,而是可將多媒體內容儲存至由伺服器裝置60讀取之單獨媒體。 原始音訊及視頻資料可包含類比或數位資料。類比資料在藉由音訊編碼器26及/或視頻編碼器28編碼之前可被數位化。音訊源22可在說話參與者正在說話時自說話參與者獲得音訊資料,且視頻源24可同時獲得說話參與者之視頻資料。在其他實例中,音訊源22可包含電腦可讀儲存媒體,該電腦可讀媒體包含所儲存之音訊資料;且視頻源24可包含電腦可讀儲存媒體,該電腦可讀儲存媒體包含所儲存之視頻資料。以此方式,本發明中所描述之技術可應用於實況、串流傳輸、即時音訊及視頻資料,或應用至所存檔的、預先記錄的音訊及視頻資料。 對應於視頻圖框之音訊訊框通常為同時含有藉由音訊源22俘獲(或產生)之音訊資料與含有於視頻圖框內的藉由視頻源24俘獲(或產生)之視頻資料的音訊訊框。舉例而言,當說話參與者通常藉由說話而產生音訊資料時,音訊源22俘獲音訊資料,且視頻源24同時(即,在音訊源22正俘獲音訊資料的同時)俘獲說話參與者之視頻資料。因此,音訊訊框在時間上可對應於一或多個特定視頻圖框。因此,對應於視頻圖框之音訊訊框大體上對應於同時俘獲音訊資料及視頻資料且音訊訊框及視頻圖框分別包含同時俘獲到的音訊資料及視頻資料的情形。 在一些實例中,音訊編碼器26可對每一經編碼音訊訊框中之時戳進行編碼,該時戳表示記錄經編碼音訊訊框之音訊資料的時間;且類似地,視頻編碼器28可對每一經編碼視頻圖框中的時戳進行編碼,該時戳表示記錄經編碼視頻圖框的視頻資料之時間。在此等實例中,對應於視頻圖框之音訊訊框可包含:包含時戳之音訊訊框及包含相同時戳之視頻圖框。內容準備裝置20可包含內部時脈,音訊編碼器26及/或視頻編碼器28可以根據該內部時脈產生時戳,或音訊源22及視頻源24可以使用該內部時脈來分別使音訊資料及視頻資料與時戳相關聯。 在一些實例中,音訊源22可向音訊編碼器26發送對應於記錄音訊資料之時刻的資料,且視頻源24可向視頻編碼器28發送對應於記錄視頻資料之時刻的資料。在一些實例中,音訊編碼器26可對經編碼音訊資料中的序列識別符進行編碼以指示經編碼音訊資料之相對時間排序,但未必指示記錄音訊資料之絕對時間,且類似地,視頻編碼器28亦可使用序列識別符來指示經編碼視頻資料之相對時間排序。類似地,在一些實例中,序列識別符可經映射或以其他方式與時戳相關。 音訊編碼器26通常產生經編碼音訊資料之串流,而視頻編碼器28產生經編碼視頻資料之串流。每一個別資料串流(不論是音訊抑或視頻)可被稱作基本串流。基本串流為表示之單個經數位寫碼(可能經壓縮)之分量。舉例而言,表示之經寫碼視頻或音訊部分可為基本串流。基本串流可在被囊封於視頻檔案內之前被轉換成封包化基本串流(packetized elementary stream,PES)。在同一表示內,可使用串流ID來區分屬於一個基本串流之PES封包與其他PES封包。基本串流之資料之基本單位為封包化基本串流(PES)封包。因此,經寫碼視頻資料大體對應於基本視頻串流。類似地,音訊資料對應於一或多個各別基本串流。 諸如ITU-T H.264/AVC及ITU-T H.265/高效率視頻寫碼(HEVC)之許多視頻寫碼標準界定針對無錯誤位元串流之語法、語義及解碼程序,該等無錯誤位元串流中之任一者符合特定設定檔或層級。視頻寫碼標準通常並不指定編碼器,但編碼器具有保證所產生之位元流對於解碼器而言係標準相容的任務。在視頻寫碼標準之上下文中,「設定檔」對應於演算法、特徵或工具及應用至演算法、特徵或工具之約束的子集。舉例而言,如由H.264標準所定義,「設定檔」為由H.264標準指定的整個位元串流語法之子集。「層級」對應於解碼器資源消耗諸如解碼器記憶體及計算之限制,該等限制係關於圖像解析度、位元速率及區塊處理速率。設定檔可用profile_idc (設定檔指示符)值發信,而層級可用level_idc (層級指示符)值發信。 舉例而言,H.264標準認識到,在由給定設定檔之語法所強加的界限內,仍然有可能要求編碼器及解碼器之效能的大變化,該大變化取決於位元串流中由語法元素獲取的值,諸如經解碼圖像之指定大小。H.264標準進一步認識到,在許多應用中,實施能夠處置特定設定檔內之語法之所有假設使用的解碼器既不實際又不經濟。因此,H.264標準將「層級」定義為強加於位元串流中之語法元素之值的約束之指定集合。此等約束可為對值的簡單限制。替代地,此等約束可呈對值之算術組合(例如,圖像寬度乘以圖像高度乘以每秒解碼之圖像的數目)之約束的形式。H.264標準進一步規定,個別實施可支援針對每一所支援設定檔的不同層級。 符合設定檔之解碼器一般支援設定檔中所定義之所有特徵。舉例而言,作為寫碼特徵,B圖像寫碼在H.264/AVC之基線設定檔中不被支援,但在H.264/AVC之其他設定檔中支援。符合一層級之解碼器應能夠對不需要超出該層級中所界定之限制的資源之任何位元串流進行解碼。設定檔及層級之界定可對可解釋性有幫助。舉例而言,在視頻傳輸期間,可針對整個傳輸工作階段協商及同意一對設定檔定義及層級定義。更具體言之,在H.264/AVC中,層級可界定關於以下各者之限制:需要處理之巨集區塊的數目、經解碼圖像緩衝器(decoded picture buffer,DPB)大小、經寫碼圖像緩衝器(coded picture buffer,CPB)大小、垂直運動向量範圍、每兩個連續MB的運動向量之最大數目,及B區塊是否可具有小於8×8個像素之子巨集區塊分區。以此方式,解碼器可判定解碼器是否能夠正確地對位元串流進行解碼。 在圖1之實例中,內容準備裝置20之囊封單元30自視頻編碼器28接收包含經寫碼視頻資料之基本串流且自音訊編碼器26接收包含經寫碼音訊資料之基本串流。在一些實例中,視頻編碼器28及音訊編碼器26可各自包括用於自經編碼資料形成PES封包之封包化器。在其他實例中,視頻編碼器28及音訊編碼器26可各自與用於自經編碼資料形成PES封包之各別封包化器介接。在另外其他實例中,囊封單元30可包括用於自經編碼音訊及視頻資料形成PES封包之封包化器。 視頻編碼器28可以多種方式對多媒體內容之視頻資料進行編碼,從而產生呈各種位元速率且具有各種特性之多媒體內容的不同表示,該等特性係諸如像素解析度、圖框速率、對各種寫碼標準之符合性、對各種寫碼標準之各種設定檔及/或設定檔層級之符合性、具有一或多個視圖之表示(例如,對於二維或三維播放)或其他此類特性。如本發明中所使用,表示可包含音訊資料、視頻資料、文本資料(例如,用於封閉字幕)或其他此資料中之一者。表示可包括諸如音訊基本串流或視頻基本串流之基本串流。每一PES封包可包括stream_id,其識別PES封包屬於之基本串流。囊封單元30負責將基本串流組譯成各種表示之視頻檔案(例如,區段)。 囊封單元30自音訊編碼器26及視頻編碼器28接收表示之基本串流的PES封包且自該等PES封包形成對應網路抽象層(network abstraction layer,NAL)單元。寫碼視頻區段可經組織成NAL單元,其提供「網路友好」視頻表示,從而定址諸如視頻電話、儲存、廣播或串流傳輸的應用程式。NAL單元可分類為視頻寫碼層(Video Coding Layer,VCL) NAL單元及非VCL NAL單元。VCL單元可含有核心壓縮引擎,且可包括區塊、巨集區塊及/或圖塊層級資料。其他NAL單元可為非VCL NAL單元。在一些實例中,一個時間執行個體中之通常呈現為初級經寫碼圖像的經寫碼圖像可含有於存取單元中,該存取單元可包括一或多個NAL單元。 非VCL NAL單元可包括參數集NAL單元及SEI NAL單元外加其他。參數集可含有序列層級標頭資訊(在序列參數集(sequence parameter set,SPS)中)及不頻繁地改變的圖像層級標頭資訊(在圖像參數集(picture parameter set,PPS)中)。在參數集(例如,PPS及SPS)之情況下,不頻繁地改變之資訊不需要針對每一序列或圖像重複,因此可改良寫碼效率。此外,使用參數集可實現重要標頭資訊之頻帶外傳輸,從而避免對於錯誤復原(error resilience)之冗餘傳輸的需要。在頻帶外傳輸實例中,參數集NAL單元可在與其他NAL單元諸如 SEI NAL單元不同之頻道上傳輸。 補充增強資訊(Supplemental Enhancement Information,SEI)可含有對於對來自VCL NAL單元之經寫碼圖像樣本進行解碼不必要的資訊,但可輔助與解碼、顯示、錯誤復原及其他目的相關的程序。SEI訊息可含有於非VCL NAL單元中。SEI訊息為一些標準規範之標準化部分,且因此對於標準相容之解碼器實施並非始終係必選的。SEI訊息可為序列層級SEI訊息或圖像層級SEI訊息。某一序列層級資訊可含有於SEI訊息中,諸如SVC之實例中SEI訊息中的可調性資訊,及MVC中SEI訊息中的視圖可調性資訊。此等實例SEI訊息可傳達關於例如操作點之提取及操作點之特性的資訊。另外,囊封單元30可形成資訊清單檔案,諸如描述表示之特性的媒體呈現描述符(media presentation descriptor,MPD)。囊封單元30可根據可延伸標記語言(extensible markup language,XML)格式化MPD。 囊封單元30可向輸出介面32提供多媒體內容之一或多個表示的資料以及資訊清單檔案(例如,MPD)。輸出介面32可包含網路介面或用於對儲存媒體進行寫入之介面,諸如通用串列匯流排(universal serial bus,USB)介面、CD或DVD寫入器或燒錄器、至磁性或快閃儲存媒體之介面,或用於儲存或傳輸媒體資料之其他介面。囊封單元30可向輸出介面32提供多媒體內容之表示中之每一者的資料,該輸出介面可經由網路傳輸或儲存媒體向伺服器裝置60發送該資料。在圖1之實例中,伺服器裝置60包括儲存各種多媒體內容64之儲存媒體62,每一多媒體內容64包括各別資訊清單檔案66及一或多個表示68A至68N (表示68)。在一些實例中,輸出介面32亦可將資料直接發送至網路74 。 在一些實例中,表示68可被分成若干調適集。即,表示68之各種子集可包括諸如以下各者之特性的各別共同集合:編解碼器、設定檔及層級、解析度、視圖數目、區段之檔案格式、可識別待與表示一起顯示的文字之語言或其他特性的文字類型資訊及/或待解碼及呈現(例如,由揚聲器呈現)之音訊資料、可描述適配集中之表示之場景的攝影機角度或真實世界攝影機視角的攝影機角度資訊、描述對於特定觀眾之內容適合性的分級資訊,或類似資訊。 資訊清單檔案66可包括指示表示68之對應於特定適配集之子集以及該等適配集之共同特性的資料。資訊清單檔案66亦可包括表示適配集之個別表示的個別特性諸如位元速率之資料。以此方式,適配集可提供簡化的網路頻寬適配。適配集中之表示可使用資訊清單檔案66之適配集元素的子代元素來指示。 伺服器裝置60包括請求處理單元70及網路介面72。在一些實例中,伺服器裝置60可包括複數個網路介面。此外,伺服器裝置60之特徵中之任一者或全部可在內容遞送網路之其他裝置諸如路由器、橋接器、代理裝置、交換器或其他裝置上實施。在一些實例中,內容遞送網路之中間裝置可快取多媒體內容64之資料,且包括大體上符合伺服器裝置60之彼等組件的組件。一般而言,網路介面72經組態以經由網路74發送及接收資料。 請求處理單元70經組態以自用戶端裝置諸如用戶端裝置40接收對儲存媒體62之資料的網路請求。舉例而言,請求處理單元70可實施如RFC 2616中描述的超文字傳送協定(HTTP)版本1.1,即「Hypertext Transfer Protocol - HTTP/1.1」(R.Fielding等人,網路工作群組,IETF,1999年6月)。即,請求處理單元70可經組態以接收HTTP GET或部分GET請求,且回應於該等請求而提供多媒體內容64之資料。請求可例如使用區段之URL指定表示68中之一者的區段。在一些實例中,該等請求亦可指定區段之一或多個位元組範圍,因此包含部分GET請求。請求處理單元70可經進一步組態以服務HTTP HEAD請求以提供表示68中之一者之區段的標頭資料。在任何情況下,請求處理單元70可經組態以處理該等請求以向請求裝置諸如用戶端裝置40提供所請求之資料。 另外或替代性地,請求處理單元70可經組態以經由諸如eMBMS之廣播或多播協定而遞送媒體資料。內容準備裝置20可以與所描述方式大體上相同的方式產生DASH區段及/或子區段,但伺服器裝置60可使用eMBMS或另一廣播或多播網路輸送協定來遞送此等區段或子區段。舉例而言,請求處理單元70可經組態以自用戶端裝置40接收多播群組加入請求。即,伺服器裝置60可向用戶端裝置包括用戶端裝置40廣告與多播群組相關聯之網際網路協定(Internet protocol,IP)位址,該等用戶端裝置與特定媒體內容(例如,實況事件之廣播)相關聯。用戶端裝置40又可提交加入多播群組之請求。此請求可遍及網路74例如構成網路74之路由器傳播,以使得致使該等路由器將目的地為與多播群組相關聯之IP位址的訊務導向至訂用用戶端裝置諸如用戶端裝置40。 如圖1之實例中所說明,多媒體內容64包括資訊清單檔案66,該資訊清單檔案66可對應於媒體呈現描述(MPD)。資訊清單檔案66可含有不同替代性表示68 (例如,具有不同品質之視頻服務)的描述,且該描述可包括例如編解碼器資訊、設定檔值、層級值、位元速率及表示68之其他描述性特性。用戶端裝置40可擷取媒體呈現之MPD以判定如何存取表示68之區段。 詳言之,擷取單元52可擷取用戶端裝置40之組態資料(圖中未示)以判定視頻解碼器48之解碼能力及視頻輸出44之顯現能力。組態資料亦可包括以下各者中之任一者或全部:由用戶端裝置40之使用者選擇的語言偏好、對應於由用戶端裝置40之使用者設定的深度偏好之一或多個攝影機視角,及/或由用戶端裝置40之使用者選擇的分級偏好。舉例而言,擷取單元52可包含網頁瀏覽器或媒體用戶端,其經組態以提交HTTP GET及部分GET請求。擷取單元52可對應於由用戶端裝置40之一或多個處理器或處理單元(圖中未示)執行的軟體指令。在一些實例中,關於擷取單元52所描述的功能性之全部或部分可以硬體或硬體、軟體及/或韌體之組合實施,其中可提供必需的硬體以執行軟體或韌體之指令。 擷取單元52可將用戶端裝置40之解碼及顯現能力與由資訊清單檔案66之資訊所指示之表示68的特徵進行比較。擷取單元52可最初擷取清單檔案66之至少一部分以判定表示68之特性。舉例而言,擷取單元52可請求資訊清單檔案66之描述一或多個調適集之特性的一部分。擷取單元52可選擇表示68之子集(例如,適配集),其具有可藉由用戶端裝置40之寫碼及顯現能力滿足之特性。擷取單元52可接著判定針對適配集中之表示的位元速率,判定網路頻寬之當前可用量,且自具有由網路頻寬可滿足之位元速率的表示中之一者擷取區段。 一般而言,較高位元速率表示可產生較高品質之視頻播放,而較低位元速率表示可在可用網路頻寬減少時提供足夠品質之視頻播放。因此,當可用網路頻寬相對高時,擷取單元52可自相對高位元速率之表示擷取資料,而當可用網路頻寬為低時,擷取單元52可自相對低位元速率之表示擷取資料。以此方式,用戶端裝置40可經由網路74串流傳輸多媒體資料,同時亦適應網路74之改變的網路頻寬可用性。 另外或替代地,擷取單元52可經組態以根據諸如eMBMS或IP多播之廣播或多播網路協定來接收資料。在此等實例中,擷取單元52可提交加入與特定媒體內容相關聯之多播網路群組的請求。在加入多播群組之後,擷取單元52可在另外請求未發佈至伺服器裝置60或內容準備裝置20的情況下接收多播群組之資料。當不再需要多播群組之資料時,擷取單元52可提交離開多播群組的請求,例如停止播放或將通道改變至不同多播群組。 網路介面54可接收經選定表示之區段的資料且將該資料提供至擷取單元52,擷取單元52又可將該等區段提供至解囊封單元50。解囊封單元50可將視頻檔案之元素解囊封成構成性PES串流,解封包化該等PES串流以擷取經編碼資料,且取決於經編碼資料為音訊串流抑或視頻串流之部分而將經編碼資料發送至音訊解碼器46或視頻解碼器48,例如,如由串流之PES封包標頭所指示。音訊解碼器46對經編碼音訊資料進行解碼,且向音訊輸出42發送經解碼音訊資料;而視頻解碼器48對經編碼視頻資料進行解碼,且向視頻輸出44發送經解碼視頻資料,該經解碼視頻資料可包括串流的複數個視圖。 視頻編碼器28、視頻解碼器48、音訊編碼器26、音訊解碼器46、囊封單元30、擷取單元52及解囊封單元50在適用時各自可實施為多種合適處理電路系統中之任一者,合適處理電路系統係諸如一或多個微處理器、數位信號處理器(digital signal processor,DSP)、特殊應用積體電路(application specific integrated circuit,ASIC)、場可程式化閘陣列(field programmable gate array,FPGA)、離散邏輯電路、軟體、硬體、韌體或其任何組合。視頻編碼器28及視頻解碼器48中之每一者可包括於一或多個編碼器或解碼器中,編碼器或解碼器中之任一者可經整合為組合式視頻編碼器/解碼器(編解碼器,CODEC)之部分。同樣地,音訊編碼器26及音訊解碼器46中之每一者可包括於一或多個編碼器或解碼器中,編碼器或解碼器中之任一者可經整合為組合式CODEC之部分。包括視頻編碼器28、視頻解碼器48、音訊編碼器26、音訊解碼器46、囊封單元30、擷取單元52及/或解囊封單元50的設備可包含積體電路、微處理器及/或無線通信裝置,諸如蜂巢式電話。 用戶端裝置40、伺服器裝置60及/或內容準備裝置20可經組態以根據本發明之技術操作。出於實例之目的,本發明關於用戶端裝置40及伺服器裝置60描述此等技術。然而,應理解,替代伺服器裝置60 (或除該伺服器裝置之外),內容準備裝置20可經組態以執行此等技術。 囊封單元30可形成NAL單元,該等NAL單元包含識別NAL單元屬於之程式的標頭,以及有效負載,例如音訊資料、視頻資料或描述NAL單元對應於的輸送或程式串流的資料。舉例而言,在H.264/AVC中,NAL單元包括1位元組標頭及具有變化大小之有效負載。在有效負載中包括視頻資料之NAL單元可包含各種粒度位準之視頻資料。舉例而言,NAL單元可包含視頻資料區塊、複數個區塊、視頻資料之圖塊或視頻資料之整個圖像。囊封單元30可自視頻編碼器28接收呈基本串流之PES封包之形式的經編碼視頻資料。囊封單元30可使每一基本串流與對應程式相關聯。 囊封單元30亦可組譯來自複數個NAL單元之存取單元。一般而言,存取單元可包含一或多個NAL單元,其用於表示視頻資料之圖框以及音訊資料,該音訊資料對應於此音訊資料可用時的圖框。存取單元大體上包括用於一個輸出時間執行個體之全部NAL單元,例如,用於一時間執行個體之全部音訊及視頻資料。舉例而言,若每一視圖具有20個圖框/秒(frames per second,fps)之圖框速率,則每一時間執行個體可對應於0.05秒之時間間隔。在此時間間隔期間,可同時顯現同一存取單元(同一時間執行個體)之所有視圖的特定圖框。在一個實例中,存取單元可包含一個時間執行個體中之經寫碼圖像,其可表示為主要經寫碼圖像。 因此,存取單元可包含共同時間執行個體之所有音訊訊框及視頻圖框,例如對應於時刻X之所有視圖。本發明亦將特定視圖之經編碼圖像稱為「視圖分量」。即,視圖分量可包含特定時間針對特定視圖的經編碼圖像(或圖框)。因此,存取單元可界定為包含共同時間執行個體之所有視圖分量。存取單元之解碼次序未必與輸出或顯示次序相同。 媒體呈現可包括媒體呈現描述(MPD),該媒體呈現描述可含有不同替代性表示(例如,具有不同品質之視頻服務)的描述,且該描述可包括例如編解碼器資訊、設定檔值及層級值。MPD為資訊清單檔案諸如資訊清單檔案66之一個實例。用戶端裝置40可擷取媒體呈現之MPD以判定如何存取各種呈現之電影片段。電影片段可位於視頻檔案之電影片段方塊(moof方塊)中。 資訊清單檔案66 (其可包含例如MPD)可廣告表示68之區段之可用性。即,MPD可包括指示表示68中之一者之第一區段變得可用時之掛鐘時間的資訊,以及指示表示68內之區段之持續時間的資訊。以此方式,用戶端裝置40之擷取單元52可基於開始時間以及在特定區段之前的區段之持續時間而判定每一區段可用的時間。 在囊封單元30已基於所接收之資料將NAL單元及/或存取單元組譯成視頻檔案之後,囊封單元30將視頻檔案傳遞至輸出介面32以供輸出。在一些實例中,囊封單元30可本端地儲存視頻檔案,或經由輸出介面32將視頻檔案發送至遠端伺服器,而非將視頻檔案直接發送至用戶端裝置40。舉例而言,輸出介面32可包含傳輸器,收發器,用於寫入資料至電腦可讀媒體諸如光碟機、磁性媒體驅動器(例如,軟碟機)之裝置,通用串列匯流排(USB)埠、網路介面或其他輸出介面。輸出介面32將視頻檔案輸出至電腦可讀媒體,諸如傳輸信號、磁性媒體、光學媒體、記憶體、隨身碟或其他電腦可讀媒體。 網路介面54可經由網路74接收NAL單元或存取單元,且經由擷取單元52將NAL單元或存取單元提供至解囊封單元50。解囊封單元50可將視頻檔案之元素解囊封成構成性PES串流,解封包化該等PES串流以擷取經編碼資料,且取決於經編碼資料為音訊串流抑或例如如由串流之PES封包標頭所指示的視頻串流之部分而將經編碼資料發送至音訊解碼器46或視頻解碼器48。音訊解碼器46對經編碼音訊資料進行解碼,且向音訊輸出42發送經解碼音訊資料;而視頻解碼器48對經編碼視頻資料進行解碼,且向視頻輸出44發送經解碼視頻資料,該經解碼視頻資料可包括串流的複數個視圖。 圖2為更詳細地說明圖1之擷取單元52之組件之實例集合的方塊圖。在此實例中,擷取單元52包括eMBMS中間軟體單元100、DASH用戶端110及媒體應用程式112。 在此實例中,eMBMS中間軟體單元100進一步包括eMBMS接收單元106、快取記憶體104及伺服器單元102。在此實例中,eMBMS接收單元106經組態以例如根據單向輸送檔案傳遞(File Delivery over Unidirectional Transport,FLUTE)經由eMBMS接收資料,該單向輸送檔案傳遞描述於可於http://tools.ietf.org/html/rfc6726獲得的T.Paila等人的「FLUTE-File Delivery over Unidirectional Transport」 (網路工作群組,RFC 6726,2012年11月)中。即,eMBMS接收單元106可經由廣播而自例如可充當BM-SC的伺服器裝置60接收檔案。 當eMBMS中間軟體單元100接收檔案之資料時,eMBMS中間軟體單元可將所接收之資料儲存於快取記憶體104中。快取記憶體104可包含電腦可讀儲存媒體,諸如快閃記憶體、硬碟、RAM或任何其他合適的儲存媒體。 本端伺服器單元102可充當DASH用戶端110之伺服器。舉例而言,本端伺服器單元102可將MPD檔案或其他資訊清單檔案提供至DASH用戶端110。本端伺服器單元102可廣告MPD檔案中之區段之可用性時間,以及可擷取該等區段之超連結。此等超連結可包括對應於用戶端裝置40之本機主機位址首碼(例如,針對IPv4之127.0.0.1)。以此方式,DASH用戶端110可使用HTTP GET或部分GET請求向本端伺服器單元102請求區段。舉例而言,對於可自鏈接http://127.0.0.1/rep1/seg3獲得之區段,DASH用戶端110可構建包括針對http://127.0.0.1/rep1/seg3之請求的HTTP GET請求,且將該請求提交至本端伺服器單元102。本端伺服器單元102可自快取記憶體104擷取所請求之資料,且回應於此等請求而將資料提供至DASH用戶端110。 根據本發明之技術,囊封單元30可發信且擷取單元52可接收關於使用受約束方案儲存之視頻資料、HDR/WCG視頻、VR/全向/360視頻、圖框封裝視頻及具有顯示定向改變之視頻中的任一者或全部之重要視頻資訊,使得重要視頻資訊可藉由應用程式用戶端諸如DASH用戶端方便地存取,以做出內容拒斥/選擇/接受/請求決策。如上文所指出,重要視頻資訊可包括可用於內容選擇之資訊,例如,藉由擷取單元52選擇視頻播放軌或其部分以供消耗。 本發明之技術可克服上述問題。舉例而言,為解決第一問題,囊封單元30及擷取單元52可經組態以對「@codecs」使用新格式,其中包括受約束方案之使用之指示。在一個實例中,「@codecs」參數之值定義如下,使得被認為對於視頻重要之全部資訊包括於「codecs」參數中。在此實例中,「@codecs」參數之第一元素係使用受約束方案之播放軌之樣本項類型碼(即,該播放軌根據受約束方案儲存諸如視頻資料之媒體資料),例如,「resv」。在此實例中,第二元素係受約束方案類型碼,例如,用於圖框封裝視頻之「stvi」,及用於全向視頻的「odvd」。 替代地,對於全向視頻,第二元素為用於經投影全向視頻之「povd」或用於超廣角全向視頻的「fovd」。替代地,對於經投影全向視頻,第二元素指示投影類型,例如,用於球形展開投影之「erp」,或用於立方圖投影的「cmp」。 包括特定類型之受約束方案之重要細節的更多資訊可包括於該資訊清單檔案之後續元素中。舉例而言,若第二元素係「odvd」,則第三元素存在且係用於經投影全向視頻之「povd」或用於超廣角全向視頻的「fovd」。替代地,若第二元素係「odvd」及第三元素係「povd」,則第四元素存在且指示投影類型,例如,用於球形展開投影之「erp」或用於立方圖投影的「cmp」。舉例而言,球形展開經投影全向視頻之「codecs」參數之值的起始四個元素可為「resv.odvd.povd.erp」。 上述元素可進一步跟隨有如ISO/IEC 14496-15之條款E中所定義之「codecs」參數值之常見元素。舉例而言,符合HEVC、漸進式、非封裝、主設定檔、主要階層及層級3.1之球形展開經投影全向視頻之「codecs」參數值可為「resv.odvd.povd.erp.hev1.1.6.L93.B0」。 以此方式,囊封單元30可發信且擷取單元52可接收例如資訊清單檔案66內如上文所論述的值「resv」、「stvi」、「odvd」、「povd」、「fovd」、「erp」或「cmp」中之任何或全部作為「@codecs」參數之部分。此外,擷取單元52可基於針對表示68之資訊清單檔案66中發信之@codecs參數之該等值以及視頻解碼器48之能力來判定待擷取之表示68中之一者。 在第二替代實例中,「codecs」參數值被定義如下,使得被認為是對於視頻重要之資訊中的一些包括於「codecs」參數中,而被認為對於視頻是重要的資訊之更多細節包括於不同MIME類型參數中。在此實例中,@codecs參數之第一元素係使用受約束方案之播放軌之樣本項類型碼,亦即,「resv」。在此實例中,第二元素可為受約束方案類型碼,例如,用於圖框封裝視頻之「stvi」及用於全向視頻的「odvd」。替代地,對於全向視頻,第二元素可為用於經投影全向視頻之「povd」或用於超廣角全向視頻的「fovd」。 以上兩個元素可進一步跟隨有如ISO/IEC 14496-15之條款E中所定義之「codecs」參數值之常見元素。舉例而言,符合HEVC、漸進式、非封裝、主設定檔、主要階層及層級3.1之球形展開經投影全向視頻之「codecs」參數值可為「resv.odvd.hev1.1.6.L93.B0」。替代地,以上視頻之「codecs」參數值可為「resv.povd.hev1.1.6.L93.B0」。替代地,以上視頻之「codecs」參數值可為「resv.erp.hev1.1.6.L93.B0」。 除了上文所論述之「codecs」參數之新格式之外,亦可使用含有特定類型之受約束方案之更多細節的新的可選MIME類型參數。此等可選MIME類型參數之格式與「codecs」參數相似,亦即,其可為單個值或經逗點分離值清單,其中經逗點分離清單中之各值包括一或多個經點分離(例如,句點定界)元素,且各元素之名稱空間可由前述元素判定。作為一個實例,可選MIME類型參數「odvdinfo」可含有全向視頻之更多細節。根據此實例,對於「odvdinfo」值,第一元素可為用於經投影全向視頻之「povd」或用於超廣角全向視頻的「fovd」,且在「povd」之前一情況下,第二元素存在且指示投影類型,例如,用於球形展開投影之「erp」或用於立方圖投影的「cmp」。可添加更多元素以含有更多資訊。替代地,作為另一實例,可選MIME類型參數「fpvdinfo」可含有圖框封裝視頻的更多細節。舉例而言,「fpvdinfo」可包括對應於如ISOBMFF規範之條款8.15.4.2中所定義之stereo_scheme及stereo_indication_type之元素。 作為另一實例,為解決第二問題(其可結合以上解決第一問題之技術中的任一個執行),囊封單元30及擷取單元52可經組態以使用指示表示之播放軌攜載具有顯示定向改變之視頻資料的新受約束方案類型。舉例而言,4字元碼「vdoc」可指示對應播放軌攜載具有顯示定向改變之視頻。 在一個實例中,不提供關於顯示定向改變之進一步資訊,且SchemeInformationBox在RestrictedSchemeInfoBox中可能不存在。在另一替代方案中,旋轉及翻轉中之任一者抑或其兩者係進一步藉由SchemeInformationBox中含有的新方塊指示。舉例而言,此新方塊可包括名為display_orientation_change_type之欄位,其中值0指示應用旋轉及翻轉兩者,值1指示僅應用旋轉,且值2指示僅應用翻轉。因此,囊封單元30可基於對應播放軌包括旋轉及/或翻轉之任一者抑或兩者而設定display_orientation_change_type欄位之值,且擷取單元52可判定表示68中之一者之播放軌是否包括顯示定向改變,且若包括,則自欄位之值判定改變是否包括旋轉及/或翻轉之任一者或兩者。 此外,亦可應用如上文所定義之針對「codecs」參數之新格式。舉例而言,具有顯示定向該改變的符合HEVC、漸進式、非封裝、主設定檔、主要階層及層級3.1的「codecs」參數之值可為「resv.vdoc.hev1.1.6.L93.B0」。類似地,如同以上實例之若干替代例以便,諸如display_orientation_change_type之某更多資訊可包括於「codecs」參數值之第三元素中,且剩餘元素可另外依序下推一個元素。 作為另一實例,為解決第三問題(其可結合以上解決第一問題之技術及/或以上解決第二問題之技術中的任一個執行),囊封單元30及擷取單元52可經組態以使用可選MIME類型參數「hdrinfo」,其可含有HDR/WCG視頻之重要資訊。此可選MIME類型參數之格式可為單個值或經逗點分離(例如,句點定界)值清單,其中各值包括一或多個經點分離元素。舉例而言,「hdrinfo」參數值可含有呈「元素1.元素2.元素3.元素4」之形式的四個欄位,其中四個元素1至4可分別為欄位colour_primaries、transfer_characteristics、matrix_coeffs及full_range_flag之十六進制表示,如ISOBMFF規範之條款12.1.5中所定義。 圖3為說明實例多媒體內容120之元素的概念圖。多媒體內容120可對應於多媒體內容64 (圖1)或儲存於儲存媒體62中之另一多媒體內容。在圖3之實例中,多媒體內容120包括媒體呈現描述(MPD) 122及複數個表示124A至124N (表示124)。表示124A包括可選標頭資料126及區段128A至128N (區段128),而表示124N包括可選標頭資料130及區段132A至132N (區段132)。為方便起見,使用字母N來指明表示124中之每一者中的最後一個電影片段。在一些實例中,表示124之間可存在不同數目個電影片段。 MPD 122可包含與表示124分離開之資料結構。MPD 122可對應於圖1之資訊清單檔案66。同樣,表示124可對應於圖2之表示68。一般而言,MPD 122可包括大體上描述表示124之特性的資料,諸如寫碼及顯現特性、調適集、MPD 122對應之設定檔、文本類型資訊、攝影機角度資訊、分級資訊、特技模式資訊(例如,指示包括時間子序列之表示的資訊)及/或用於擷取遠端時段(例如,用於在播放期間至媒體內容中之目標性廣告插入)之資訊。 當存在時,標頭資料126可描述區段128之特性,例如隨機存取點(RAP,其亦被稱作串流存取點(stream access point,SAP))之時間位置、區段128中之哪一者包括隨機存取點、至區段128內之隨機存取點之位元組偏移、區段128之統一資源定位符(URL),或區段128之其他態樣。當存在時,標頭資料130可描述區段132之相似特性。另外或替代地,此等特性可完全包括於MPD 122內。 區段128、132包括一或多個經寫碼視頻樣本,該等視頻樣本中之每一者可包括視頻資料之圖框或圖塊。區段128之經寫碼視頻樣本中之每一者可具有類似特性,例如,高度、寬度及頻寬要求。此類特性可藉由MPD 122之資料來描述,儘管此資料在圖3之實例中未說明。MPD 122可包括如3GPP規範所描述之特性,其中添加有本發明中所描述的發信資訊中之任一者或全部。 區段128、132中之每一者可與唯一統一資源定位符(URL)相關聯。因此,區段128、132中之每一者可使用串流傳輸網路協定諸如DASH來獨立地擷取。以此方式,諸如用戶端裝置40之目的地裝置可使用HTTP GET請求來擷取區段128或132。在一些實例中,用戶端裝置40可使用HTTP部分GET請求來擷取區段128或132之特定位元組範圍。 根據本發明之技術,MPD 122可包括上文所論述之各種實例MIME類型資訊中之任一者或全部。舉例而言,MPD 122 可包括如上文所論述之@codecs參數,其例如可指示使用受約束方案之播放軌之樣本項類型碼、受約束方案類型碼及額外資訊,例如,針對全向視頻、投影類型或類似者之額外資訊。另外或替代地,MPD 122可包括指示顯示定向改變是否應用於表示124A至124N中之一者之資訊,且若是,則包括指示顯示定向改變之一類型(例如,旋轉及/或翻轉之任一者或兩者)的資訊。另外或替代地,顯示定向改變資訊可在標頭資料126、130及/或區段128、132之任何或全部之標頭資料中提供。另外或替代地,如上文所論述,MPD 122、標頭資料126、130及/或區段128、132之任何或全部之標頭資料可含有HDR/WCG視頻之重要資訊。 圖4為說明實例視頻檔案150之元素的方塊圖,實例視頻檔案可對應於表示之區段,諸如圖3之區段114、124中的一者。區段128、132中之每一者可包括大體上符合圖4之實例中所說明之資料之配置的資料。視頻檔案150可據稱為囊封區段。如上文所述,根據ISO基本媒體檔案格式及其擴展的視頻檔案將資料儲存於被稱為「方塊」之一系列對象中。在圖4之實例中,視頻檔案150包括檔案類型(FTYP)方塊152、電影(MOOV)方塊154、區段索引(sidx)方塊162、電影片段(MOOF)方塊164及電影片段隨機存取(MFRA)方塊166。儘管圖4表示視頻檔案之實例,但應理解,根據ISO基本媒體檔案格式及其擴展,其他媒體檔案可包括其他類型之媒體資料(例如,音訊資料、定時文本資料或其類似者),其在結構上類似於媒體檔案150之資料。 檔案類型(FTYP)方塊152通常描述視頻檔案150之檔案類型。檔案類型方塊152可包括識別規範的資料,該規範描述視頻檔案150之最佳用途。檔案類型方塊152可替代地置放在MOOV方塊154、電影片段方塊164及/或MFRA方塊166之前。 在一些實例中,諸如視頻檔案150之區段可包括在FTYP方塊152之前的MPD更新方塊(圖中未示)。MPD更新方塊可包括指示對應於包括視頻檔案150之表示之MPD將更新的資訊,以及用於更新MPD之資訊。舉例而言,MPD更新方塊可提供待用以更新MPD之資源的URI或URL。作為另一實例,MPD更新方塊可包括用於更新MPD之資料。在一些實例中,MPD更新方塊可緊接在視頻檔案150之區段類型(STYP)方塊(未圖示)之後,其中STYP方塊可定義視頻檔案150之區段類型。在下文更詳細地論述之圖7提供關於MPD更新方塊之額外資訊。 在圖4之實例中,MOOV方塊154包括電影標頭(MVHD)方塊156、播放軌(TRAK)方塊158及一或多個電影延伸(MVEX)方塊160。一般而言,MVHD方塊156可描述視頻檔案150之一般特性。舉例而言,MVHD方塊156可包括描述視頻檔案150最初產生之時間、視頻檔案150經最後修改之時間、視頻檔案150之時序表、視頻檔案150之播放之持續時間的資料,或大體上描述視頻150之其他資料。 TRAK方塊158可包括視頻檔案150之播放軌的資料。TRAK方塊158可包括播放軌標頭(track header,TKHD)方塊,其描述對應於TRAK方塊158之播放播放軌的特性。在一些實例中,TRAK方塊158可包括經寫碼視頻圖像,而在其他實例中,播放軌之經寫碼視頻圖像可包括於電影片段164中,其可由TRAK方塊158及/或sidx方塊162之資料參考。 在一些實例中,視頻檔案150可包括一個以上播放軌。因此,MOOV方塊154可包括一數目個TRAK方塊,該數目等於視頻檔案150中之播放軌之數目。TRAK方塊158可描述視頻檔案150之對應播放軌之特性。舉例而言,TRAK方塊158可描述相對應播放軌之時間及/或空間資訊。當囊封單元30 (圖3)包括視頻檔案諸如視頻檔案150中之參數集播放軌時,類似於MOOV方塊154之TRAK方塊158的TRAK方塊可描述參數集播放軌之特性。囊封單元30可在描述參數集播放軌之TRAK方塊內發信序列層級SEI訊息存在於參數集播放軌中。 MVEX方塊160可描述對應電影片段164之特性,例如以發信視頻檔案150除包括在MOOV方塊154 (若存在)內之視頻資料之外亦包括電影片段164。在串流傳輸視頻資料的內容背景中,經寫碼視頻圖像可包括於電影片段164中,而非包括於MOOV方塊154中。因此,所有經寫碼視頻樣本可包括於電影片段164中,而非包括於MOOV方塊154中。 MOOV方塊154可包括一數目個MVEX方塊160,該數目等於視頻檔案150中之電影片段164的數目。MVEX方塊160中之每一者可描述電影片段164中之對應電影片段之特性。舉例而言,每一MVEX方塊可包括電影延伸標頭方塊(MEHD)方塊,其描述電影片段164中的對應電影片段之持續時間。 如上文所指出,囊封單元30可儲存視頻樣本中之序列資料集,其並不包括實際經寫碼視頻資料。視頻樣本可大體上對應於存取單元,該存取單元為特定時間執行個體下之經寫碼圖像之表示。在AVC之內容背景下,經寫碼圖像包括:一或多個VCL NAL單元,其含有用以建構存取單元之所有像素的資訊;及其他相關聯非VCL NAL單元,諸如SEI訊息。因此,囊封單元30可包括電影片段164中之一者中之序列資料集,其可包括序列層級SEI訊息。囊封單元30可進一步發信序列資料集及/或序列級SEI訊息之存在,如存在於電影片段164中的MVEX方塊160中之一者內的一者中一般,該MVEX方塊160中之一者對應於電影片段164中的該一者。 SIDX方塊162為視頻檔案150之可選元素。即,符合3GPP檔案格式或其他此等檔案格式之視頻檔案未必包括SIDX方塊162。根據3GPP檔案格式之實例,SIDX方塊可用以識別區段(例如,含有於視頻檔案150內之區段)的子區段。3GPP檔案格式將子區段定義為「具有一或多個對應媒體資料方塊及含有藉由電影片段方塊參考之資料的媒體資料方塊的一或多個連續電影片段方塊之自含式集合必須跟在電影片段方塊之後,並在含有關於同一播放軌之資訊的下一個電影片段方塊之前」。3GPP檔案格式亦指示SIDX方塊「含有對由方塊記錄之(子)區段之子片段的參考之序列。所參考之子區段在呈現時間上為連續的。相似地,由區段索引方塊參考之位元組始終在區段內鄰接。所參考大小給出所參考材料中之位元組之數目的計數」。 SIDX方塊162大體上提供表示包括於視頻檔案150中之區段之一或多個子區段的資訊。舉例來說,此資訊可包括子區段開始及/或結束之播放時間、子區段之位元組偏移、子區段是否包括(例如,開始於)串流存取點(stream access point,SAP)、SAP之類型(例如,SAP是否為瞬時解碼器再新(instantaneous decoder refresh,IDR)圖像、清潔隨機存取(clean random access,CRA)圖像、斷鏈存取(broken link access,BLA)圖像或其類似者)、子區段中SAP之位置(就播放時間及/或位元組偏移而言)及其類似者。 電影片段164可包括一或多個經寫碼視頻圖像。在一些實例中,電影片段164可包括一或多個圖像群組(group of pictures,GOP),圖像中之每一者可包括數個經寫碼視頻圖像,例如圖框或圖像。另外,如上文所描述,在一些實例中,電影片段164可包括序列資料集。電影片段164中之每一者可包括電影片段標頭方塊(MFHD,圖4中未展示)。MFHD方塊可描述對應電影片段之特性,諸如電影片段之序號。電影片段164可按序號次序包括於視頻檔案150中。 MFRA方塊166可描述視頻檔案150之電影片段164內的隨機存取點。此可輔助執行特技模式,諸如執行對由視頻檔案150囊封之區段內之特定暫態位置(亦即,播放時間)的尋找。在一些實例中,MFRA方塊166通常係可選的且無需包括於視頻檔案中。同樣,用戶端裝置諸如用戶端裝置40未必需要參考MFRA方塊166來對視頻檔案150之視頻資料進行正確解碼及顯示。MFRA方塊166可包括一數目個播放軌片段隨機存取(track fragment random access,TFRA)方塊(圖中未示),該數目等於視頻檔案150之播放軌之數目或在一些實例中等於視頻檔案150之媒體播放軌(例如,非提示播放軌)之數目。 在一些實例中,電影片段164可包括一或多個串流存取點(SAP),諸如IDR圖像。同樣,MFRA方塊166可提供對SAP在視頻檔案150內之位置的指示。因此,視頻檔案150之時間子序列可由視頻檔案150之SAP形成。時間子序列亦可包括其他圖像,諸如取決於SAP之P圖框及/或B圖框。時間子序列之圖框及/或圖塊可配置於區段內,以使得時間子序列的取決於子序列之其他圖框/圖塊之圖框/圖塊可被恰當地解碼。舉例而言,在資料之階層式配置中,用於其他資料之預測的資料亦可包括於時間子序列中。 如上文所論述,根據本發明之技術,MOOV方塊154可包括一或多個方塊(諸如SchemeInformationBox及/或RestrictedSchemeInfoBox),其指示旋轉及/或翻轉中之任一者或兩者是否應用至包括於電影片段164中之視頻資料。如上文所論述,另外或替代地,MOOV方塊154可含有HDR/WCG視頻之重要資訊。 同樣,視頻檔案150之播放軌之視頻資料可根據受約束方案諸如全向視頻、經圖框封裝視頻或類似者儲存。如上文所論述,資訊清單檔案諸如MPD可包括指示播放軌之視頻資料之受約束方案。 圖5為說明根據本發明之技術之實例方法的流程圖。圖5之方法闡述為由圖1之用戶端裝置40之擷取單元52執行,但應理解其他裝置可經組態以執行此方法或類似方法。 最初,擷取單元52擷取資訊清單檔案(180)。該資訊清單檔案可對應於圖1之資訊清單檔案66。舉例而言,該資訊清單檔案可為媒體呈現描述(MPD)。根據本發明之技術,該資訊清單檔案可包括資料,該資料指定用於一或多個表示例如圖1之表示68中之一或多者的一或多個編解碼器。 擷取單元52可接著提取指定一或多個編解碼器之資料。詳言之,根據本發明之技術,擷取單元52可自資訊清單檔案提取樣本項類型碼(182)。樣本項類型碼可係針對對應於該資訊清單檔案之表示中之一者的播放軌。如上文所論述,樣本項類型碼可包含「resv」以指示播放軌使用受約束方案儲存視頻資料。 擷取單元52可接著自資訊清單檔案提取受約束方案類型碼(184)。舉例而言,若播放軌之視頻資料使用經圖框封裝視頻方案儲存,則擷取單元52可自針對播放軌之資訊清單檔案提取「stvi」,從而指示播放軌使用經圖框封裝視頻方案儲存視頻資料。作為另一實例,擷取單元52可回應於自針對播放軌之資訊清單檔案提取「odvd」,判定播放軌之視頻資料係使用全向視頻方案儲存。作為又一實例,「fovd」可指示播放軌之視頻資料係使用超廣角全向視頻資料儲存,「erp」針對球形展開投影方案,或「cmp」針對立方圖投影方案。 儘管圖5說明提取兩個元素之實例,但應理解擷取單元52可提取例如呈句點或逗點定界格式的額外元素。在一些實例中,擷取單元52可提取一或多個@codecs參數之值集合,其中@codecs參數之該等值可為元素之各別句點定界清單。舉例而言,擷取單元52可提取針對播放軌之「resv.odvd.povd.erp」,且判定「resv」指示播放軌包括使用受約束方案儲存之視頻資料,「odvd」指示視頻資料係全向視頻資料,「povd」指示視頻資料係經投影全向視頻資料,且「erp」指示視頻資料經球形展開投影。 此外,如上文所論述,擷取單元52可自該資訊清單檔案提取不同MIME類型參數之額外元素。舉例而言,MIME類型參數可為「odvdinfo」。舉例而言,額外元素可為「povd」、「fovd」、「erp」、「cmp」或類似者。另外或替代地,MIME類型參數可為「fpvdinfo」以指定經圖框封裝視頻資訊,諸如立體方案及/或立體指示類型。 擷取單元52可接著使用經提取碼擷取媒體資料(186)。舉例而言,擷取單元52可擷取例如被視頻解碼器48及視頻輸出44(圖1)支援之方案的視頻資料,且亦避免擷取並不被視頻解碼器48及視頻輸出44支援之方案之視頻資料。舉例而言,若視頻解碼器48能夠解碼且視頻輸出44能夠顯示全向格式之視頻資料,則擷取單元52可搜尋針對一表示之資訊清單檔案,該資訊清單包括使用全向視頻方案儲存視頻資料之播放軌,例如,「resv.odvd」。同樣,若視頻解碼器48不能夠解碼圖框封裝視頻資料,則擷取單元52可避免擷取在該資訊清單檔案中指示為具有「針對@codecs參數之resv.stvi」之播放軌的視頻資料。 以此方式,圖5之方法表示一種方法之實例,該方法包括:擷取指定針對一媒體呈現之至少一個表示之資料的一資訊清單檔案,其中該資訊清單檔案包括指定針對該至少一個表示之一或多個編解碼器的資料;自該資訊清單檔案提取指定該一或多個編解碼器之該資料,該提取操作包括:提取表示該至少一個表示之一播放軌之一樣本項類型碼的一第一元素,其中該第一元素表示播放軌包括使用一受約束方案儲存之視頻資料;及提取表示針對該播放軌之該受約束方案之一受約束方案類型碼的一第二元素;及基於該第一元素及該第二元素擷取該至少一個表示之資料。 在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體進行傳輸,且藉由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體,其對應於諸如資料儲存媒體之有形媒體,或通信媒體,該通信媒體包括例如根據通信協定促進電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體通常可對應於(1)係非暫時性之有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取用於實施本發明中所描述之技術的指令、程式碼及/或資料結構的任何可用媒體。電腦程式產品可包括電腦可讀媒體。 作為實例且非限制,此類電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存裝置、快閃記憶體或可用以儲存呈指令或資料結構形式之所要程式碼且可由電腦存取的任何其他媒體。又,任何連接被恰當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纜、雙絞線、數位用戶線(digital subscriber line,DSL)或諸如紅外線、無線電及微波之無線技術自網站、伺服器或其他遠端源傳輸指令,則同軸纜線、光纜、雙絞線、DSL或諸如紅外線、無線電及微波之無線技術包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而實情為係針對非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(compact disc,CD)、雷射光碟、光學光碟、數位多功能光碟(digital versatile disc,DVD)、軟碟及藍光光碟,其中磁碟通常以磁性方式再現資料,而光碟用雷射以光學方式再現資料。以上各者的組合亦應包括於電腦可讀媒體之範疇內。 指令可藉由諸如一或多個數位信號處理器(digital signal processor,DSP)、通用微處理器、特殊應用積體電路(application specific integrated circuit,ASIC)、場可程式化邏輯陣列(field programmable logic array,FPGA)或其他等效積體或離散邏輯電路之一或多個處理器來執行。因此,如本文中所使用之術語「處理器」可指前述結構或適於實施本文中所描述之技術的任何其他結構中之任一者。此外,在一些態樣中,本文所描述之功能性可設置於經組態以供編碼及解碼或併入於經組合編解碼器中之專用硬體及/或軟體模組內。再者,該等技術可完全實施於一或多個電路或邏輯元件中。 本發明之技術可實施於廣泛之多種裝置或設備中,包括無線手持機、積體電路(integrated circuit,IC)或IC集合(例如,晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術之裝置的功能態樣,但未必要求由不同硬體單元來實現。確切而言,如上文所描述,各種單元可與合適的軟體及/或韌體一起組合於編解碼器硬體單元中或由互操作性硬體單元之集合提供,硬體單元包括如上文所描述之一或多個處理器。 各種實例已予以描述。此等及其他實例在以下申請專利範圍之範疇內。
10‧‧‧系統20‧‧‧內容準備裝置22‧‧‧音訊源24‧‧‧視頻源26‧‧‧音訊編碼器28‧‧‧視頻編碼器30‧‧‧囊封單元32‧‧‧輸出介面40‧‧‧用戶端裝置42‧‧‧音訊輸出44‧‧‧視頻輸出46‧‧‧音訊解碼器48‧‧‧視頻解碼器50‧‧‧解囊封單元52‧‧‧擷取單元54‧‧‧網路介面60‧‧‧伺服器裝置62‧‧‧儲存媒體64‧‧‧多媒體內容66‧‧‧資訊清單檔案68A‧‧‧表示68N‧‧‧表示70‧‧‧請求處理單元72‧‧‧網路介面74‧‧‧網路100‧‧‧eMBMS中間軟體單元102‧‧‧本端伺服器單元104‧‧‧快取記憶體106‧‧‧eMBMS接收單元110‧‧‧經由HTTP之動態自適應串流傳輸用戶端112‧‧‧媒體應用程式120‧‧‧多媒體內容122‧‧‧媒體呈現描述124A‧‧‧表示124N‧‧‧表示126‧‧‧標頭資料128A‧‧‧區段128B‧‧‧ 區段128N‧‧‧區段130‧‧‧標頭資料132A‧‧‧區段132B‧‧‧區段132N‧‧‧區段150‧‧‧視頻檔案152‧‧‧檔案類型方塊154‧‧‧電影方塊156‧‧‧電影標頭方塊158‧‧‧播放軌方塊160‧‧‧電影延伸方塊162‧‧‧片段索引方塊164‧‧‧電影片段166‧‧‧電影片段隨機存取方塊180‧‧‧擷取資訊清單檔案182‧‧‧自資訊清單檔案提取樣本項類型碼184‧‧‧自資訊清單檔案提取受約束方案類型碼186‧‧‧使用經提取碼擷取媒體資料
圖1為說明實施用於經由網路而串流傳輸媒體資料之技術的實例系統之方塊圖。 圖2為更詳細地說明圖1之擷取單元之組件之實例集合的方塊圖。 圖3為說明實例多媒體內容之元素的概念圖。 圖4為說明實例視頻檔案之元素的方塊圖,該實例視頻檔案可對應於表示之區段。 圖5為說明根據本發明之技術之實例方法的流程圖。
180‧‧‧擷取資訊清單檔案
182‧‧‧自資訊清單檔案提取樣本項類型碼
184‧‧‧自資訊清單檔案提取受約束方案類型碼
186‧‧‧使用經提取碼擷取媒體資料

Claims (41)

  1. 一種擷取媒體資料之方法,該方法包含:擷取一資訊清單檔案,該資訊清單檔案指定針對一媒體呈現之至少一個表示的資料,其中該資訊清單檔案包括指定用於該至少一個表示之一或多個編解碼器之資料,該至少一個表示包括一或多個包括媒體資料之媒體檔案,該資訊清單檔案係與該至少一個表示相分離,該資訊清單檔案不包括媒體資料;自該資訊清單檔案提取指定該一或多個編解碼器之該資料,該提取操作包括:提取表示該至少一個表示之一播放軌之一樣本項類型碼的一第一元素,其中該第一元素表示該播放軌包括使用一受約束方案儲存之視頻資料;及提取一第二元素,其表示針對該播放軌之該受約束方案之一受約束方案類型碼;及基於該第一元素及該第二元素擷取該至少一個表示的包括該媒體資料之該一或多個媒體檔案。
  2. 如請求項1之方法,其中提取指定該一或多個編解碼器之該資料包含:提取針對一或多個@codecs參數之一第一值集合,其中針對該等@codecs參數之該等值包含元素之各別句點定界清單,該句點定界清單包括該第一元素及該第二元素;及 提取一第二值集合,該第二值集合包含來自一不同MIME類型參數之針對該等@codecs參數的額外資訊。
  3. 如請求項2之方法,其中該額外資訊包含指示受約束方案之一特定類型的資訊。
  4. 如請求項2之方法,其中該不同MIME類型參數包含「odvdinfo」,且其中提取該第二值集合包含提取「povd」、「fovd」、「erp」或「cmp」中之至少一者。
  5. 如請求項4之方法,其進一步包含判定該至少一個表示之該播放軌包含視頻資料,該視頻資料:當該受約束方案類型碼包含「povd」時包括經投影全向視頻資料;當該受約束方案類型碼包含「fovd」時包括超廣角全向視頻資料;當該受約束方案類型碼包含「erp」時包括球形展開經投影全向視頻資料;或當該受約束方案類型碼包含「cmp」時包括立方圖經投影全向視頻資料。
  6. 如請求項2之方法,其中該額外資訊包含指示經圖框封裝視頻資料之一特定類型的資訊。
  7. 如請求項6之方法,其中該不同MIME類型參數包含「fpvdinfo」。
  8. 如請求項6之方法,其中該特定類型之經圖框封裝之視頻資料包含對應於stereo_scheme及stereo_indication_type之元素。
  9. 如請求項1之方法,其進一步包含:接收針對該播放軌之一MIME類型參數「hdrinfo」的一或多個值,針對該MIME類型參數之該等值包括針對該播放軌之高動態範圍(HDR)或廣色域(WCG)視頻資料中之至少一者的資訊,其中擷取該至少一個表示之該媒體資料包含基於針對該MIME類型參數之該等值擷取該播放軌的媒體資料。
  10. 如請求項9之方法,其中該一或多個值係針對該MIME類型參數「hdrinfo」的一單個值。
  11. 如請求項9之方法,其中該一或多個值係針對該MIME類型參數「hdrinfo」之一經逗點分離值清單,該經逗點分離清單中之該等值中之每一者包含一單個元素或一經點分離之元素清單。
  12. 如請求項11之方法,其中該經逗點分離清單中之該等值中之至少一者包含一經點分離之元素清單,該等元素包含HDR或WCG欄位的十六進制表示,該等HDR或WCG欄位包括colour_primaries、transfer_characteristics、matrix_coeffs及full_range_flag。
  13. 如請求項1之方法,其中該資訊清單檔案包含一經由HTTP之動態自適應串流傳輸(DASH)媒體呈現描述(MPD)。
  14. 如請求項1之方法,其中該資訊清單檔案指定針對包括該至少一個表示之複數個表示的資料,該資料包括指定針對該複數個表示中之每一者之一或多個編解碼器的資料。
  15. 如請求項14之方法,其進一步包含回應於判定一用戶端裝置包括符合該樣本項類型碼及該方案類型碼之一視頻編解碼器而選擇該至少一個表示。
  16. 如請求項1之方法,其中該表示包含複數個區段,該等區段中之每一者包含一可個別擷取之檔案,該檔案係與一唯一統一資源定位符(URL)相關聯。
  17. 如請求項1之方法,其中擷取該至少一個表示之該媒體資料包含使用一HTTP GET請求擷取該表示之一區段或使用一HTTP部分GET請求擷取該表示之一局部區段中的至少一者。
  18. 如請求項1之方法,其中該樣本項類型碼包含「resv」。
  19. 如請求項1之方法,其中該受約束方案類型碼包含「stvi」、「odvd」、「povd」、「fovd」、「erp」或「cmp」中之至少一者。
  20. 如請求項19之方法,其進一步包含判定該至少一個表示之該播放軌包含視頻資料,該視頻資料:當該受約束方案類型碼包含「stvi」時包括經圖框封裝視頻資料;當該受約束方案類型碼包含「odvd」時包括全向視頻資料;當該受約束方案類型碼包含「povd」時包括經投影全向視頻資料;當該受約束方案類型碼包含「fovd」時包括超廣角全向視頻資料;當該受約束方案類型碼包含「erp」時包括球形展開經投影全向視頻資料;或當該受約束方案類型碼包含「cmp」時包括經立方圖投影全向視頻資料。
  21. 如請求項1之方法,其中提取指定該一或多個編解碼器之該資料進一步包含回應於判定該受約束方案類型碼包含「odvd」而提取一第三元素,該第三元素表示針對該播放軌之全向視頻資料之一類型。
  22. 如請求項21之方法,其進一步包含判定該至少一個表示之該播放軌包含視頻資料,該視頻資料:當該第三元素包含「povd」之一值時包括經投影全向視頻資料;或當該受約束方案類型碼包含「fovd」時包括超廣角全向視頻資料。
  23. 如請求項21之方法,其中提取指定該一或多個編解碼器之該資料進一步包含回應於判定該第三元素包含「povd」之一值而提取指示一投影 類型之一第四元素。
  24. 如請求項23之方法,其進一步包含回應於判定該播放軌之該視頻資料包含經投影全向視頻資料而判定該經投影全向視頻資料:當該第四元素具有「erp」之一值時包含一球形展開投影;或當該第四元素具有「cmp」之一值時包含一立方圖投影。
  25. 如請求項1之方法,其中提取指定該一或多個編解碼器之該資料包含提取在該第一元素及該第二元素之後的複數個元素。
  26. 如請求項1之方法,其中提取指定該一或多個編解碼器之該資料包含提取針對一或多個@codecs參數之值,其中針對該等@codecs參數之該等值包含元素之各別句點定界清單。
  27. 如請求項1之方法,其進一步包含提取資料,該資料指定該播放軌包括具有顯示定向改變之視頻資料,其中該播放軌包括在該至少一個表示之一媒體檔案中,且其中擷取該至少一個表示之該媒體資料包含基於指定該播放軌包括具有該等顯示定向改變之該視頻資料之該資料擷取該播放軌的媒體資料。
  28. 如請求項27之方法,其中指定該播放軌包括具有該等顯示定向改變之該視頻資料的該資料包含針對該播放軌之一受約束方案類型的一「vdoc」值。
  29. 如請求項27之方法,其中提取包含自針對該播放軌之一RestrictedSchemeInfoBox提取針對該受約束方案類型之該值。
  30. 如請求項27之方法,其進一步包含回應於判定該播放軌包括具有該等顯示定向改變之該視頻資料,自一SchemeInformationBox提取指示該等顯示定向改變是否包括旋轉或翻轉中之任一者或兩者的資料。
  31. 如請求項30之方法,進一步包含:當該SchemeInformationBox具有為0的一值時,判定該等顯示定向改變包括旋轉及翻轉兩者;當該SchemeInformationBox具有為1的一值時,判定該等顯示定向改變包括旋轉;或當該SchemeInformationBox具有為2的一值時,判定該等顯示定向改變包括翻轉。
  32. 一種用於擷取媒體資料之裝置,該裝置包含:一記憶體,其經組態以儲存媒體資料;及一或多個處理器,其實施於電路中且經組態以:擷取指定針對一媒體呈現之至少一個表示之資料的一資訊清單檔案,其中該資訊清單檔案包括指定針對該至少一個表示之一或多個編解碼器之資料,該至少一個表示包括一或多個包括媒體資料之媒體檔案,該資訊清單檔案係與該至少一個表示相分離,該資訊清單 檔案不包括媒體資料;自該資訊清單檔案提取指定該一或多個編解碼器之該資料,該資料包括:表示該至少一個表示之一播放軌之一樣本項類型碼的一第一元素,其中該第一元素表示該播放軌包括使用一受約束方案儲存之視頻資料;及表示針對該播放軌之該受約束方案之一受約束方案類型碼的一第二元素;及基於該第一元素及該第二元素擷取該至少一個表示的包括該媒體資料之該一或多個媒體檔案。
  33. 如請求項32之裝置,其中為了提取指定該一或多個編解碼器之該資料,該一或多個處理器經組態以:提取針對一或多個@codecs參數之一第一值集合,其中針對該等@codecs參數之該等值包含元素之各別句點定界清單;及自一不同MIME類型參數提取一第二值集合,該等值包含針對該等@codecs參數之額外資訊。
  34. 如請求項33之裝置,其中該不同MIME類型參數包含「odvdinfo」,且其中提取該第二值集合包含提取「povd」、「fovd」、「erp」或「cmp」中之至少一者,且其中該一或多個處理器進一步經組態以判定該至少一個表示之該播放軌包含視頻資料,該視頻資料:當該受約束方案類型碼包含「povd」時包括經投影全向視頻資料;當該受約束方案類型碼包含「fovd」時包括超廣角全向視頻資料;當該受約束方案類型碼包含「erp」時包括球形展開經投影全向視頻 資料;或當該受約束方案類型碼包含「cmp」時包括立方圖經投影全向視頻資料。
  35. 如請求項33之裝置,其中該額外資訊包含指示經圖框封裝視頻資料之一特定類型的資訊,其中該不同MIME類型參數包含「fpvdinfo」,且其中該特定類型之經圖框封裝視頻資料包含對應於stereo_scheme及stereo_indication_type的元素。
  36. 如請求項32之裝置,其中該一或多個處理器進一步經組態以接收針對該播放軌之一MIME類型參數「hdrinfo」的一或多個值,針對該MIME類型參數之該等值包括針對該播放軌之高動態範圍(HDR)或廣色域(WCG)視頻資料中之至少一者的資訊,其中為擷取該至少一個表示之該媒體資料,該一或多個處理器經組態以基於針對該MIME類型參數之該等值擷取該播放軌的媒體資料。
  37. 如請求項36之裝置,其中該一或多個值包含針對該MIME類型參數「hdrinfo」之一單個值或針對該MIME類型參數「hdrinfo」之一經逗點分離值清單中之一者,該經逗點分離清單中之該等值中之每一者包含一單個元素或元素之一經點分離清單。
  38. 如請求項32之裝置,其中該資訊清單檔案包含一經由HTTP之動態自適應串流傳輸(DASH)媒體呈現描述(MPD)。
  39. 如請求項32之裝置,其中該裝置包含以下各者中之至少一者:一積體電路;一微處理器;或一無線通信裝置。
  40. 一種用於擷取媒體資料之裝置,該裝置包含:用於擷取指定針對一媒體呈現之至少一個表示之資料的一資訊清單檔案之構件,其中該資訊清單檔案包括指定針對該至少一個表示之一或多個編解碼器之資料,該至少一個表示包括一或多個包括媒體資料之媒體檔案,該資訊清單檔案係與該至少一個表示相分離,該資訊清單檔案不包括媒體資料;用於自該資訊清單檔案提取指定該一或多個編解碼器之該資料之構件,該構件包括:用於提取表示該至少一個表示之一播放軌之一樣本項類型碼的一第一元素之構件,其中該第一元素表示該播放軌包括使用一受約束方案儲存之視頻資料;及用於提取一第二元素之構件,該第二元素表示針對該播放軌之該受約束方案之一受約束方案類型碼;及用於基於該第一元素及該第二元素擷取該至少一個表示的包括該媒體資料之該一或多個媒體檔案之構件。
  41. 一種上面儲存有指令之電腦可讀儲存媒體,該等指令在執行時使得 一處理器進行以下操作:擷取指定針對一媒體呈現之至少一個表示之資料的一資訊清單檔案,其中該資訊清單檔案包括指定針對該至少一個表示之一或多個編解碼器的資料,該至少一個表示包括一或多個包括媒體資料之媒體檔案,該資訊清單檔案係與該至少一個表示相分離,該資訊清單檔案不包括媒體資料;自該資訊清單檔案提取指定該一或多個編解碼器之該資料,該資料包括致使該處理器執行以下操作之指令:提取表示該至少一個表示之一播放軌之一樣本項類型碼的一第一元素,其中該第一元素表示該播放軌包括使用一受約束方案儲存之視頻資料;及提取一第二元素,其表示針對該播放軌之該受約束方案之一受約束方案類型碼;及基於該第一元素及該第二元素擷取該至少一個表示的包括該媒體資料之該一或多個媒體檔案。
TW107110573A 2017-03-27 2018-03-27 在使用mime類型參數之網路視頻串流中發信重要視頻資訊 TWI774744B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201762477350P 2017-03-27 2017-03-27
US62/477,350 2017-03-27
US15/935,553 US10805650B2 (en) 2017-03-27 2018-03-26 Signaling important video information in network video streaming using mime type parameters
US15/935,553 2018-03-26

Publications (2)

Publication Number Publication Date
TW201841512A TW201841512A (zh) 2018-11-16
TWI774744B true TWI774744B (zh) 2022-08-21

Family

ID=63583790

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107110573A TWI774744B (zh) 2017-03-27 2018-03-27 在使用mime類型參數之網路視頻串流中發信重要視頻資訊

Country Status (9)

Country Link
US (1) US10805650B2 (zh)
EP (1) EP3603096A1 (zh)
KR (1) KR102614207B1 (zh)
CN (1) CN110431850B (zh)
AU (2) AU2018244288A1 (zh)
BR (1) BR112019019836A2 (zh)
SG (1) SG11201907574YA (zh)
TW (1) TWI774744B (zh)
WO (1) WO2018183300A1 (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102277267B1 (ko) * 2017-03-29 2021-07-14 엘지전자 주식회사 360 비디오를 전송하는 방법, 360 비디오를 수신하는 방법, 360 비디오 전송 장치, 360 비디오 수신 장치
BR112019024597A2 (pt) * 2017-05-30 2020-06-09 Sony Corp aparelho e método de processamento de imagem, programa para fazer com que um computador execute processamento, e, aparelho e método de geração de arquivo
US10630994B2 (en) * 2017-06-28 2020-04-21 Agora Lab, Inc. Specific operation prediction in video compression
KR102646649B1 (ko) 2018-06-29 2024-03-13 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Lut에서의 모션 후보들의 검사 순서
KR20210024502A (ko) 2018-06-29 2021-03-05 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Hmvp 후보를 병합/amvp에 추가할 때의 부분/풀 프루닝
WO2020003284A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Interaction between lut and amvp
CN115134599A (zh) 2018-06-29 2022-09-30 抖音视界有限公司 更新查找表(lut)的条件
WO2020003270A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Number of motion candidates in a look up table to be checked according to mode
CN110662059B (zh) 2018-06-29 2021-04-20 北京字节跳动网络技术有限公司 使用查找表存储先前编码的运动信息并用其编码后续块的方法和装置
WO2020003261A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Selection from multiple luts
CN114845108A (zh) 2018-06-29 2022-08-02 抖音视界(北京)有限公司 查找表的更新:fifo、约束的fifo
JP7181395B2 (ja) 2018-07-02 2022-11-30 北京字節跳動網絡技術有限公司 イントラ予測モードを有するルックアップテーブルおよび非隣接ブロックからのイントラモード予測
TWI820211B (zh) 2018-09-12 2023-11-01 大陸商北京字節跳動網絡技術有限公司 取決於總數減去k的開始檢查hmvp候選的條件
CN111083484B (zh) 2018-10-22 2024-06-28 北京字节跳动网络技术有限公司 基于子块的预测
CN111083489B (zh) 2018-10-22 2024-05-14 北京字节跳动网络技术有限公司 多次迭代运动矢量细化
WO2020098643A1 (en) 2018-11-12 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Simplification of combined inter-intra prediction
CN117319644A (zh) 2018-11-20 2023-12-29 北京字节跳动网络技术有限公司 基于部分位置的差计算
CN113170093B (zh) 2018-11-20 2023-05-02 北京字节跳动网络技术有限公司 视频处理中的细化帧间预测
WO2020143741A1 (en) 2019-01-10 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Invoke of lut updating
CN113383554B (zh) 2019-01-13 2022-12-16 北京字节跳动网络技术有限公司 LUT和共享Merge列表之间的交互
WO2020147772A1 (en) 2019-01-16 2020-07-23 Beijing Bytedance Network Technology Co., Ltd. Motion candidates derivation
WO2020177756A1 (en) 2019-03-06 2020-09-10 Beijing Bytedance Network Technology Co., Ltd. Size dependent inter coding
WO2020192611A1 (en) 2019-03-22 2020-10-01 Beijing Bytedance Network Technology Co., Ltd. Interaction between merge list construction and other tools
CN115190317A (zh) 2019-04-02 2022-10-14 抖音视界有限公司 解码器侧运动矢量推导
US11388427B2 (en) * 2020-01-09 2022-07-12 Qualcomm Incorporated Multiple decoder interface for streamed media data
US11711518B2 (en) 2020-09-17 2023-07-25 Lemon Inc. Decoding capability information storage in video coding
US11611752B2 (en) 2020-10-07 2023-03-21 Lemon Inc. Adaptation parameter set storage in video coding
CN115529491B (zh) * 2022-01-10 2023-06-06 荣耀终端有限公司 一种音视频解码的方法、音视频解码的装置以及终端设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120201521A1 (en) * 2009-10-20 2012-08-09 Telefonaktiebolaget L M Ericsson (Publ) Provision of Supplemental Processing Information

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3220281A1 (en) 2009-11-04 2017-09-20 Amotech Co., Ltd. System and method for media content streaming
US9621617B2 (en) * 2012-02-28 2017-04-11 Telefonaktiebolaget Lm Ericsson (Publ) Method and server for sending a data stream to a client and method and client for receiving a data stream from a server
EP3257216B1 (en) * 2015-02-11 2021-01-27 Expway Method of handling packet losses in transmissions based on dash standard and flute protocol

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120201521A1 (en) * 2009-10-20 2012-08-09 Telefonaktiebolaget L M Ericsson (Publ) Provision of Supplemental Processing Information

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Byeongdoo Choi, Ye-Kui Wang, Miska M. Hannuksela, "WD on ISO/IEC 23000-20 Omnidirectional Media Application Format", June 2016, Geneva, Switzerland
Gellens R. et. al. "The Codecs and Profiles Parameters for Bucket Media Types draft-gellens-mime-bucket-bis-03.txt", March 4, 2011.;Byeongdoo Choi, Ye-Kui Wang, Miska M. Hannuksela, "WD on ISO/IEC 23000-20 Omnidirectional Media Application Format", June 2016, Geneva, Switzerland *

Also Published As

Publication number Publication date
AU2023200083A1 (en) 2023-02-09
WO2018183300A1 (en) 2018-10-04
TW201841512A (zh) 2018-11-16
US10805650B2 (en) 2020-10-13
KR20190132464A (ko) 2019-11-27
EP3603096A1 (en) 2020-02-05
BR112019019836A2 (pt) 2020-04-22
CN110431850B (zh) 2022-02-01
AU2018244288A1 (en) 2019-09-12
SG11201907574YA (en) 2019-10-30
US20180278971A1 (en) 2018-09-27
CN110431850A (zh) 2019-11-08
AU2023200083B2 (en) 2024-07-04
KR102614207B1 (ko) 2023-12-14

Similar Documents

Publication Publication Date Title
TWI774744B (zh) 在使用mime類型參數之網路視頻串流中發信重要視頻資訊
CN110089122B (zh) 用于检索媒体数据的方法、媒体装置及计算机可读存储媒体
JP2019521583A (ja) イメージ中の最も関心のある領域の高度なシグナリング
TWI703854B (zh) 用於在經由超文本傳輸協定(http)之動態自適應串流(dash)中之魚眼虛擬實境視訊之增強的高階發信號
JP2019521584A (ja) Httpを介した動的適応型ストリーミングにおけるバーチャルリアリティビデオのシグナリング
CN110832872B (zh) 使用用于文件格式方框的通用描述符处理媒体数据
TWI711303B (zh) 用於魚眼虛擬實境視訊之增強的高階發信號
CN111034203A (zh) 处理具有动态逐区封装的全向媒体
CN110870323B (zh) 使用全向媒体格式处理媒体数据
TW202027512A (zh) 用於媒體資料之網路串流之初始化集合
KR102654999B1 (ko) 강화된 영역별 패킹 및 뷰포트 독립적 hevc 미디어 프로파일

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent