CN106664299A - 基于超文本传输协议媒体流的媒体呈现导览方法和相关装置 - Google Patents
基于超文本传输协议媒体流的媒体呈现导览方法和相关装置 Download PDFInfo
- Publication number
- CN106664299A CN106664299A CN201580038222.5A CN201580038222A CN106664299A CN 106664299 A CN106664299 A CN 106664299A CN 201580038222 A CN201580038222 A CN 201580038222A CN 106664299 A CN106664299 A CN 106664299A
- Authority
- CN
- China
- Prior art keywords
- guide
- visitors
- media presentation
- media
- video adaptation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 151
- 230000006978 adaptation Effects 0.000 claims description 1134
- 230000000153 supplemental effect Effects 0.000 claims description 73
- 239000012634 fragment Substances 0.000 claims description 51
- 230000009471 action Effects 0.000 claims description 39
- 239000012141 concentrate Substances 0.000 claims description 31
- 230000000295 complement effect Effects 0.000 claims description 30
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 10
- 230000007727 signaling mechanism Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 9
- 239000013589 supplement Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000005728 strengthening Methods 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000003860 storage Methods 0.000 description 5
- LEGNTRAAJFCGFF-UHFFFAOYSA-N 2-(diazomethyl)-9h-fluorene Chemical compound C1=CC=C2C3=CC=C(C=[N+]=[N-])C=C3CC2=C1 LEGNTRAAJFCGFF-UHFFFAOYSA-N 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
- H04L65/764—Media network packet handling at the destination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/40—Network security protocols
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/231—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
- H04N21/23109—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion by placing content in organized collections, e.g. EPG data repository
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/262—Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
- H04N21/26283—Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for associating distribution time parameters to content, e.g. to generate electronic program guide data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
- H04N21/42206—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
- H04N21/42208—Display device provided on the remote control
- H04N21/42209—Display device provided on the remote control for displaying non-command information, e.g. electronic program guide [EPG], e-mail, messages or a second television channel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/482—End-user interface for program selection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/482—End-user interface for program selection
- H04N21/4825—End-user interface for program selection using a list of items to be played back in a given order, e.g. playlists
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/61—Network physical structure; Signal processing
- H04N21/6106—Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
- H04N21/6125—Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via Internet
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/63—Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
- H04N21/643—Communication protocols
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/63—Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
- H04N21/643—Communication protocols
- H04N21/64322—IP
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8549—Creating video summaries, e.g. movie trailer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/858—Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot
- H04N21/8586—Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot by using a URL
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Security & Cryptography (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Transfer Between Computers (AREA)
Abstract
基于超文本传输协议媒体流的提供导览媒体呈现的方法和相关装置。一种基于超文本传输协议媒体流的媒体呈现导览方法,可包括:客户端获取导览媒体呈现的媒体呈现描述,其中,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;所述客户端根据所述导览媒体呈现的媒体呈现描述获取所述N个导览单元中的K个导览单元;所述客户端呈现所述K个导览单元,所述K个导览单元中的每个导览单元指向一个主媒体呈现,其中,K个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。本发明实施例的方案有利于在基于HTTP的媒体流服务场景下支持视频导览,进而提高用户体验。
Description
本发明涉及数据传输领域,具体涉及基于超文本传输协议媒体流的媒体呈现导览方法和相关装置。
基于超文本传输协议(HTTP,Hyper Text Transfer Protocol)媒体流的多媒体业务正日益发展,甚至挑战了传统的广播电视的地位。不过传统电视中一些业务,基于HTTP的媒体流服务还不支持,视频导览就是其中一项,这不能不说是一个缺憾。
发明内容
本发明提供了基于超文本传输协议媒体流的提供导览媒体呈现的方法和相关装置,以期能在基于HTTP的媒体流服务场景下支持视频导览,进而提高用户体验。
本发明实施例第一方面提供一种基于超文本传输协议媒体流的媒体呈现导览方法,可包括:
客户端获取导览媒体呈现的媒体呈现描述,其中,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;
所述客户端根据所述导览媒体呈现的媒体呈现描述获取所述N个导览单元中的K个导览单元;
所述客户端呈现所述K个导览单元,所述K个导览单元中的每个导览单元指向一个主媒体呈现,其中,K个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
结合第一方面,在第一方面的第一种可能的实施方式中,所述导览媒体呈现的媒体呈现描述不同于所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。
结合第一方面的第一种可能的实施方式,在第一方面的第二种可能的实施
方式中,所述K个导览单元中的每个导览单元以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。
结合第一方面,在第一方面的第三种可能的实施方式中,所述导览媒体呈现的媒体呈现描述与所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述被聚合形成了一个聚合媒体呈现描述。
结合第一方面的第三种可能的实施方式,在第一方面的第四种可能的实施方式中,所述K个导览单元中的每个导览单元以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
结合第一方面或第一方面的第一种至第四种可能的实施方式中的任意一种可能的实施方式,在第一方面的第五种可能的实施方式中,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量。
结合第一方面的第五种可能的实施方式,在第一方面的第六种可能的实施方式中,所述K个导览单元中的不同导览单元所包括的视频分量为K个视频适配集中的不同视频适配集中的媒体表达,其中,所述K个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述K个视频适配集中的不同视频适配集之间具有选择相容性。
结合第一方面的第六种可能的实施方式,在第一方面的第七种可能的实施方式中,所述K个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述K个适配集中的任意一个适配集,所述音频分量适配集与所述K个视频适配集之间具有选择相容性;
或者,
所述K个导览单元中的不同导览单元所包括的音频分量为K个音频适配集中的不同音频适配集中的媒体表达,其中,所述K个音频适配集中的不同音频适配集之间具有选择互斥性。
结合第一方面的第七种可能的实施方式,在第一方面的第八种可能的实施方式中,所述音频适配集元素中的媒体表达元素,包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
结合第一方面的第八种可能的实施方式,在第一方面的第九种可能的实施方式中,包含相同区域说明的媒体表达元素所描述的媒体表达之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。
结合第一方面的第八种可能的实施方式或第一方面的第九种可能的实施方式,在第一方面的第十种可能的实施方式中,所述区域说明为SRD空间关系描述。
结合第一方面的第七种至第十种可能的实施方式中的任意一种可能的实施方式,在第一方面的第十一种可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括K个视频适配集元素,所述K个视频适配集元素与所述K个视频适配集之间一一对应;其中,所述K个视频适配集元素中包括描述子元素Ci,所述K个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别schemeIdUri属性均相同。
结合第一方面的第十一种可能的实施方式,在第一方面的第十二种可能的实施方式中,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。
结合第一方面的第十一种可能的实施方式,在第一方面的第十三种可能的实施方式中,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色。
结合第一方面的第十二种可能的实施方式或第一方面的第十三种可能的实施方式,在第一方面的第十四种可能的实施方式中,所述描述子元素Ci为作用说明Role元素或者基本属性EssentialProptery元素或者补充属性SupplementalProptery元素。
结合第一方面的第十四种可能的实施方式,在第一方面的第十五种可能的实施方式中,若描述子元素Ci为作用说明Role元素,则所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称相同、方法识别schemeIdUri属性相同,且参数value属性相同。
结合第一方面的第四种至第十五种可能的实施方式中的任意一种可能的
实施方式,在第一方面的第十六种可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括所述K个视频适配集元素,所述K个视频适配集元素与K个视频适配集之间一一对应,
其中,所述K个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I为所述K个视频适配集中任意一个视频适配集。
结合第一方面的第十六种可能的实施方式,在第一方面的第十七种可能的实施方式中,
所述指针由所述视频适配集元素VI的属性承载。
结合第一方面的第十七种可能的实施方式,在第一方面的第十八种可能的实施方式中,所述指针由所述视频适配集元素VI的xlink:href属性承载。
结合第一方面的第十六种可能的实施方式,在第一方面的第十九种可能的实施方式中,
所述指针由所述视频适配集元素VI中的基本属性EssentialProptery元素或补充属性SupplementalProperty元素承载。
结合第一方面的第十六种可能的实施方式,在第一方面的第二十种可能的实施方式中,所述指针由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或所述指针由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
结合第一方面的第二十种可能的实施方式,在第一方面的第二十一种可能的实施方式中,所述指针由所述视频适配集元素VI中的EssentialProptery元素的value属性承载,或者所述指针由所述视频适配集元素VI之中的SupplementalProperty元素的value属性承载。
结合第一方面的第十六种可能的实施方式,在第一方面的第二十二种可能的实施方式中,
所述指针由所述视频适配集元素VI中的虚拟媒体表达Representation元素
的属性承载,或,所述指针由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符BaseURL元素。
结合第一方面的第十六种可能的实施方式,在第一方面的第二十三种可能的实施方式中,所述指针由所述视频适配集元素VI中的媒体呈现指向ReferencedMediaPresentation元素来承载。
结合第一方面或第一方面的第一种至第二十三种可能的实施方式中的任意一种可能的实施方式,在第一方面的第二十四种可能的实施方式中,
所述导览媒体呈现的时间结构不依赖于所述导览媒体呈现中的所述K个导览单元所指向的主媒体呈现的时间结构。
结合第一方面或第一方面的第一种至第二十四种可能的实施方式中的任意一种可能的实施方式,在第一方面的第二十五种可能的实施方式中,所述方法还包括:在关注焦点停留在所述K个导览单元中的导览单元i的情况下,所述客户端呈现所述导览单元i的音频分量。
结合第一方面或第一方面的第一种至第二十五种可能的实施方式中的任意一种可能的实施方式,在第一方面的第二十六种可能的实施方式中,所述方法还包括:在所述K个导览单元中的导览单元i被选择的情况下,所述客户端获取所述导览单元i所指向的主媒体呈现。
本发明实施例第二方面提供一种基于超文本传输协议媒体流的媒体呈现导览方法,包括:
确定导览媒体呈现包括的N个导览单元;
生成导览媒体呈现的媒体呈现描述,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;所述N个导览单元中的每个导览单元指向一个主媒体呈现,其中,所述N个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
结合第二方面,在第二方面的第一种可能的实施方式中,所述导览媒体呈现的媒体呈现描述不同于所述K个导览单元中的每个导览单元所指向主媒体
呈现的媒体呈现描述。
结合第二方面的第一种可能的实施方式,在第二方面的第二种可能的实施方式中,所述N个导览单元中的每个导览单元以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。
结合第二方面,在第二方面的第三种可能的实施方式中,所述导览媒体呈现的媒体呈现描述与所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述被聚合形成了一个聚合媒体呈现描述。
结合第二方面的第三种可能的实施方式,在第二方面的第四种可能的实施方式中,所述N个导览单元中的每个导览单元以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
结合第二方面或第二方面的第一种至第四种可能的实施方式中的任意一种可能的实施方式,在第二方面的第五种可能的实施方式中,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量。
结合第二方面的第五种可能的实施方式,在第二方面的第六种可能的实施方式中,所述N个导览单元中的不同导览单元所包括的视频分量为N个视频适配集中的不同视频适配集中的媒体表达,其中,所述N个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述N个视频适配集中的不同视频适配集之间具有选择相容性。
结合第二方面的第六种可能的实施方式,在第二方面的第七种可能的实施方式中,所述N个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述N个适配集中的任意一个适配集,所述音频分量适配集与所述N个视频适配集之间具有选择相容性;
或者,
所述N个导览单元中的不同导览单元所包括的音频分量为N个音频适配集中的不同音频适配集中的媒体表达,其中,所述N个音频适配集中的不同音频适配集之间具有选择互斥性。
结合第二方面的第七种可能的实施方式,在第二方面的第八种可能的实施
方式中,所述音频适配集元素中的媒体表达元素,包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
结合第二方面的第八种可能的实施方式,在第二方面的第九种可能的实施方式中,包含相同区域说明的媒体表达元素所描述的媒体表达之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。
结合第二方面的第八种可能的实施方式或第二方面的第九种可能的实施方式,在第二方面的第十种可能的实施方式中,所述区域说明为SRD空间关系描述。
结合第二方面的第七种至第十种可能的实施方式中的任意一种可能的实施方式,在第二方面的第十一种可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括N个视频适配集元素,所述N个视频适配集元素与所述N个视频适配集之间一一对应;其中,所述N个视频适配集元素中包括描述子元素Ci,所述N个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别schemeIdUri属性均相同。
结合第二方面的第十一种可能的实施方式,在第二方面的第十二种可能的实施方式中,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。
结合第二方面的第十一种可能的实施方式,在第二方面的第十三种可能的实施方式中,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色。
结合第二方面的第十二种可能的实施方式或第二方面的第十三种可能的实施方式,在第二方面的第十四种可能的实施方式中,所述描述子元素Ci为作用说明Role元素或者基本属性EssentialProptery元素或者补充属性SupplementalProptery元素。
结合第二方面的第十四种可能的实施方式,在第二方面的第十五种可能的实施方式中,若描述子元素Ci为作用说明Role元素,则所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称相同、方法识别
schemeIdUri属性相同,且参数value属性相同。
结合第二方面的第四种至第十五种可能的实施方式中的任意一种可能的实施方式,在第二方面的第十六种可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括所述N个视频适配集元素,所述N个视频适配集元素与N个视频适配集之间一一对应,
其中,所述N个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I为所述N个视频适配集中任意一个视频适配集。
结合第二方面的第十六种可能的实施方式,在第二方面的第十七种可能的实施方式中,
所述指针由所述视频适配集元素VI的属性承载。
结合第二方面的第十七种可能的实施方式,在第二方面的第十八种可能的实施方式中,所述指针由所述视频适配集元素VI的xlink:href属性承载。
结合第二方面的第十六种可能的实施方式,在第二方面的第十九种可能的实施方式中,
所述指针由所述视频适配集元素VI中的基本属性EssentialProptery元素或补充属性SupplementalProperty元素承载。
结合第二方面的第十六种可能的实施方式,在第二方面的第二十种可能的实施方式中,所述指针由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或所述指针由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
结合第二方面的第二十种可能的实施方式,在第二方面的第二十一种可能的实施方式中,所述指针由所述视频适配集元素VI中的EssentialProptery元素的value属性承载,或者所述指针由所述视频适配集元素VI之中的SupplementalProperty元素的value属性承载。
结合第二方面的第十六种可能的实施方式,在第二方面的第二十二种可能
的实施方式中,
所述指针由所述视频适配集元素VI中的虚拟媒体表达Representation元素的属性承载,或,所述指针由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符BaseURL元素。
结合第二方面的第十六种可能的实施方式,在第二方面的第二十三种可能的实施方式中,所述指针由所述视频适配集元素VI中的媒体呈现指向ReferencedMediaPresentation元素来承载。
结合第二方面或第二方面的第一种至第二十三种可能的实施方式中的任意一种可能的实施方式,在第二方面的第二十四种可能的实施方式中,
所述导览媒体呈现的时间结构不依赖于所述导览媒体呈现中的所述N个导览单元所指向的主媒体呈现的时间结构。
本发明第三方面提供一种客户端,包括:
第一获取单元,用于获取导览媒体呈现的媒体呈现描述,其中,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;
第二获取单元,用于根据所述导览媒体呈现的媒体呈现描述获取所述N个导览单元中的K个导览单元;
呈现单元,用于呈现所述K个导览单元,所述K个导览单元中的每个导览单元指向一个主媒体呈现,其中,K个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
结合第三方面,在第三方面的第一种可能的实施方式中,所述导览媒体呈现的媒体呈现描述不同于所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。
结合第三方面的第一种可能的实施方式,在第三方面的第二种可能的实施方式中,所述K个导览单元中的每个导览单元以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。
结合第三方面,在第三方面的第三种可能的实施方式中,所述导览媒体呈
现的媒体呈现描述与所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述被聚合形成了一个聚合媒体呈现描述。
结合第三方面的第三种可能的实施方式,在第三方面的第四种可能的实施方式中,所述K个导览单元中的每个导览单元以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
结合第三方面或第三方面的第一种至第四种可能的实施方式中的任意一种可能的实施方式,在第三方面的第五种可能的实施方式中,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量。
结合第三方面的第五种可能的实施方式,在第三方面的第六种可能的实施方式中,所述K个导览单元中的不同导览单元所包括的视频分量为K个视频适配集中的不同视频适配集中的媒体表达,其中,所述K个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述K个视频适配集中的不同视频适配集之间具有选择相容性。
结合第三方面的第六种可能的实施方式,在第三方面的第七种可能的实施方式中,所述K个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述K个适配集中的任意一个适配集,所述音频分量适配集与所述K个视频适配集之间具有选择相容性;
或者,
所述K个导览单元中的不同导览单元所包括的音频分量为K个音频适配集中的不同音频适配集中的媒体表达,其中,所述K个音频适配集中的不同音频适配集之间具有选择互斥性。
结合第三方面的第七种可能的实施方式,在第三方面的第八种可能的实施方式中,所述音频适配集元素中的媒体表达元素,包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
结合第三方面的第八种可能的实施方式,在第三方面的第九种可能的实施方式中,包含相同区域说明的媒体表达元素所描述的媒体表达之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。
结合第三方面的第八种可能的实施方式或第三方面的第九种可能的实施方式,在第三方面的第十种可能的实施方式中,所述区域说明为SRD空间关系描述。
结合第三方面的第七种至第十种可能的实施方式中的任意一种可能的实施方式,在第三方面的第十一种可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括K个视频适配集元素,所述K个视频适配集元素与所述K个视频适配集之间一一对应;其中,所述K个视频适配集元素中包括描述子元素Ci,所述K个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别schemeIdUri属性均相同。
结合第三方面的第十一种可能的实施方式,在第三方面的第十二种可能的实施方式中,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。
结合第三方面的第十一种可能的实施方式,在第三方面的第十三种可能的实施方式中,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色。
结合第三方面的第十二种可能的实施方式或第三方面的第十三种可能的实施方式,在第三方面的第十四种可能的实施方式中,所述描述子元素Ci为作用说明Role元素或者基本属性EssentialProptery元素或者补充属性SupplementalProptery元素。
结合第三方面的第十四种可能的实施方式,在第三方面的第十五种可能的实施方式中,若描述子元素Ci为作用说明Role元素,则所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称相同、方法识别schemeIdUri属性相同,且参数value属性相同。
结合第三方面的第四种至第十五种可能的实施方式中的任意一种可能的实施方式,在第三方面的第十六种可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括所述K个视频适配集元素,所述K个视频适配集元素与K个视频适配集之间一一对应,
其中,所述K个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I为所述K个视频适配集中任意一个视频适配集。
结合第三方面的第十六种可能的实施方式,在第三方面的第十七种可能的实施方式中,
所述指针由所述视频适配集元素VI的属性承载。
结合第三方面的第十七种可能的实施方式,在第三方面的第十八种可能的实施方式中,所述指针由所述视频适配集元素VI的xlink:href属性承载。
结合第三方面的第十六种可能的实施方式,在第三方面的第十九种可能的实施方式中,
所述指针由所述视频适配集元素VI中的基本属性EssentialProptery元素或补充属性SupplementalProperty元素承载。
结合第三方面的第十六种可能的实施方式,在第三方面的第二十种可能的实施方式中,所述指针由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或所述指针由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
结合第三方面的第二十种可能的实施方式,在第三方面的第二十一种可能的实施方式中,所述指针由所述视频适配集元素VI中的EssentialProptery元素的value属性承载,或者所述指针由所述视频适配集元素VI之中的SupplementalProperty元素的value属性承载。
结合第三方面的第十六种可能的实施方式,在第三方面的第二十二种可能的实施方式中,
所述指针由所述视频适配集元素VI中的虚拟媒体表达Representation元素的属性承载,或,所述指针由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符BaseURL元素。
结合第三方面的第十六种可能的实施方式,在第三方面的第二十三种可能的实施方式中,所述指针由所述视频适配集元素VI中的媒体呈现指向ReferencedMediaPresentation元素来承载。
结合第三方面或第三方面的第一种至第二十三种可能的实施方式中的任意一种可能的实施方式,在第三方面的第二十四种可能的实施方式中,
所述导览媒体呈现的时间结构不依赖于所述导览媒体呈现中的所述K个导览单元所指向的主媒体呈现的时间结构。
结合第三方面或第三方面的第一种至第二十四种可能的实施方式中的任意一种可能的实施方式,在第三方面的第二十五种可能的实施方式中,所述呈现单元还用于,在关注焦点停留在所述K个导览单元中的导览单元i的情况下,呈现所述导览单元i的音频分量。
结合第三方面或第三方面的第一种至第二十五种可能的实施方式中的任意一种可能的实施方式,在第三方面的第二十六种可能的实施方式中,所述呈现单元还用于,在所述K个导览单元中的导览单元i被选择的情况下,获取所述导览单元i所指向的主媒体呈现。
本发明第四方面提供一种媒体呈现导览装置,包括:
确定单元,用于确定导览媒体呈现包括的N个导览单元;
生成单元,用于生成导览媒体呈现的媒体呈现描述,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;所述N个导览单元中的每个导览单元指向一个主媒体呈现,所述N个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
结合第四方面,在第四方面的第一种可能的实施方式中,所述导览媒体呈现的媒体呈现描述不同于所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。
结合第四方面的第一种可能的实施方式,在第四方面的第二种可能的实施方式中,所述N个导览单元中的每个导览单元以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。
结合第四方面,在第四方面的第三种可能的实施方式中,所述导览媒体呈现的媒体呈现描述与所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述被聚合形成了一个聚合媒体呈现描述。
结合第四方面的第三种可能的实施方式,在第四方面的第四种可能的实施方式中,所述N个导览单元中的每个导览单元以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
结合第四方面或第四方面的第一种至第四种可能的实施方式中的任意一种可能的实施方式,在第四方面的第五种可能的实施方式中,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量。
结合第四方面的第五种可能的实施方式,在第四方面的第六种可能的实施方式中,所述N个导览单元中的不同导览单元所包括的视频分量为N个视频适配集中的不同视频适配集中的媒体表达,其中,所述N个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述N个视频适配集中的不同视频适配集之间具有选择相容性。
结合第四方面的第六种可能的实施方式,在第四方面的第七种可能的实施方式中,所述N个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述N个适配集中的任意一个适配集,所述音频分量适配集与所述N个视频适配集之间具有选择相容性;
或者,
所述N个导览单元中的不同导览单元所包括的音频分量为N个音频适配集中的不同音频适配集中的媒体表达,其中,所述N个音频适配集中的不同音频适配集之间具有选择互斥性。
结合第四方面的第七种可能的实施方式,在第四方面的第八种可能的实施方式中,所述音频适配集元素中的媒体表达元素,包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
结合第四方面的第八种可能的实施方式,在第四方面的第九种可能的实施方式中,包含相同区域说明的媒体表达元素所描述的媒体表达之间具有关联关
系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。
结合第四方面的第八种可能的实施方式或第四方面的第九种可能的实施方式,在第四方面的第十种可能的实施方式中,所述区域说明为SRD空间关系描述。
结合第四方面的第七种至第十种可能的实施方式中的任意一种可能的实施方式,在第四方面的第十一种可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括N个视频适配集元素,所述N个视频适配集元素与所述N个视频适配集之间一一对应;其中,所述N个视频适配集元素中包括描述子元素Ci,所述N个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别schemeIdUri属性均相同。
结合第四方面的第十一种可能的实施方式,在第四方面的第十二种可能的实施方式中,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。
结合第四方面的第十一种可能的实施方式,在第四方面的第十三种可能的实施方式中,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色。
结合第四方面的第十二种可能的实施方式或第四方面的第十三种可能的实施方式,在第四方面的第十四种可能的实施方式中,所述描述子元素Ci为作用说明Role元素或者基本属性EssentialProptery元素或者补充属性SupplementalProptery元素。
结合第四方面的第十四种可能的实施方式,在第四方面的第十五种可能的实施方式中,若描述子元素Ci为作用说明Role元素,则所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称相同、方法识别schemeIdUri属性相同,且参数value属性相同。
结合第四方面的第四种至第十五种可能的实施方式中的任意一种可能的实施方式,在第四方面的第十六种可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括所述N个视频适配集元素,所述N个视频适配集元素与N
个视频适配集之间一一对应,
其中,所述N个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I为所述N个视频适配集中任意一个视频适配集。
结合第四方面的第十六种可能的实施方式,在第四方面的第十七种可能的实施方式中,
所述指针由所述视频适配集元素VI的属性承载。
结合第四方面的第十七种可能的实施方式,在第四方面的第十八种可能的实施方式中,所述指针由所述视频适配集元素VI的xlink:href属性承载。
结合第四方面的第十六种可能的实施方式,在第四方面的第十九种可能的实施方式中,
所述指针由所述视频适配集元素VI中的基本属性EssentialProptery元素或补充属性SupplementalProperty元素承载。
结合第四方面的第十六种可能的实施方式,在第四方面的第二十种可能的实施方式中,所述指针由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或所述指针由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
结合第四方面的第二十种可能的实施方式,在第四方面的第二十一种可能的实施方式中,所述指针由所述视频适配集元素VI中的EssentialProptery元素的value属性承载,或者所述指针由所述视频适配集元素VI之中的SupplementalProperty元素的value属性承载。
结合第四方面的第十六种可能的实施方式,在第四方面的第二十二种可能的实施方式中,
所述指针由所述视频适配集元素VI中的虚拟媒体表达Representation元素的属性承载,或,所述指针由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模
版元素、媒体片段列表元素和基础统一资源定位符BaseURL元素。
结合第四方面的第十六种可能的实施方式,在第四方面的第二十三种可能的实施方式中,所述指针由所述视频适配集元素VI中的媒体呈现指向ReferencedMediaPresentation元素来承载。
结合第四方面或第四方面的第一种至第二十三种可能的实施方式中的任意一种可能的实施方式,在第四方面的第二十四种可能的实施方式中,
所述导览媒体呈现的时间结构不依赖于所述导览媒体呈现中的所述N个导览单元所指向的主媒体呈现的时间结构。
本发明第五方面提供一种客户端,包括:
处理器和存储器;
其中,所述处理器通过调用所述存储器中的代码或指令以用于,获取导览媒体呈现的媒体呈现描述,其中,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;根据所述导览媒体呈现的媒体呈现描述获取所述N个导览单元中的K个导览单元;呈现所述K个导览单元,所述K个导览单元中的每个导览单元指向一个主媒体呈现,其中,K个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
结合第五方面,在第五方面的第一种可能的实施方式中,所述导览媒体呈现的媒体呈现描述不同于所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。
结合第五方面的第一种可能的实施方式,在第五方面的第二种可能的实施方式中,所述K个导览单元中的每个导览单元以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。
结合第五方面,在第五方面的第三种可能的实施方式中,所述导览媒体呈现的媒体呈现描述与所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述被聚合形成了一个聚合媒体呈现描述。
结合第五方面的第三种可能的实施方式,在第五方面的第四种可能的实施方式中,所述K个导览单元中的每个导览单元以引用所述聚合媒体呈现描述
中的呈现元素的方式来指向一个主媒体呈现。
结合第五方面或第五方面的第一种至第四种可能的实施方式中的任意一种可能的实施方式,在第五方面的第五种可能的实施方式中,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量。
结合第五方面的第五种可能的实施方式,在第五方面的第六种可能的实施方式中,所述K个导览单元中的不同导览单元所包括的视频分量为K个视频适配集中的不同视频适配集中的媒体表达,其中,所述K个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述K个视频适配集中的不同视频适配集之间具有选择相容性。
结合第五方面的第六种可能的实施方式,在第五方面的第七种可能的实施方式中,所述K个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述K个适配集中的任意一个适配集,所述音频分量适配集与所述K个视频适配集之间具有选择相容性;
或者,
所述K个导览单元中的不同导览单元所包括的音频分量为K个音频适配集中的不同音频适配集中的媒体表达,其中,所述K个音频适配集中的不同音频适配集之间具有选择互斥性。
结合第五方面的第七种可能的实施方式,在第五方面的第八种可能的实施方式中,所述音频适配集元素中的媒体表达元素,包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
结合第五方面的第八种可能的实施方式,在第五方面的第九种可能的实施方式中,包含相同区域说明的媒体表达元素所描述的媒体表达之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。
结合第五方面的第八种可能的实施方式或第五方面的第九种可能的实施方式,在第五方面的第十种可能的实施方式中,所述区域说明为SRD空间关系描述。
结合第五方面的第七种至第十种可能的实施方式中的任意一种可能的实
施方式,在第五方面的第十一种可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括K个视频适配集元素,所述K个视频适配集元素与所述K个视频适配集之间一一对应;其中,所述K个视频适配集元素中包括描述子元素Ci,所述K个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别schemeIdUri属性均相同。
结合第五方面的第十一种可能的实施方式,在第五方面的第十二种可能的实施方式中,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。
结合第五方面的第十一种可能的实施方式,在第五方面的第十三种可能的实施方式中,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色。
结合第五方面的第十二种可能的实施方式或第五方面的第十三种可能的实施方式,在第五方面的第十四种可能的实施方式中,所述描述子元素Ci为作用说明Role元素或者基本属性EssentialProptery元素或者补充属性SupplementalProptery元素。
结合第五方面的第十四种可能的实施方式,在第五方面的第十五种可能的实施方式中,若描述子元素Ci为作用说明Role元素,则所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称相同、方法识别schemeIdUri属性相同,且参数value属性相同。
结合第五方面的第四种至第十五种可能的实施方式中的任意一种可能的实施方式,在第五方面的第十六种可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括所述K个视频适配集元素,所述K个视频适配集元素与K个视频适配集之间一一对应,
其中,所述K个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I为所述K个视频适配集中任意一个视频适配集。
结合第五方面的第十六种可能的实施方式,在第五方面的第十七种可能的
实施方式中,
所述指针由所述视频适配集元素VI的属性承载。
结合第五方面的第十七种可能的实施方式,在第五方面的第十八种可能的实施方式中,所述指针由所述视频适配集元素VI的xlink:href属性承载。
结合第五方面的第十六种可能的实施方式,在第五方面的第十九种可能的实施方式中,
所述指针由所述视频适配集元素VI中的基本属性EssentialProptery元素或补充属性SupplementalProperty元素承载。
结合第五方面的第十六种可能的实施方式,在第五方面的第二十种可能的实施方式中,所述指针由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或所述指针由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
结合第五方面的第二十种可能的实施方式,在第五方面的第二十一种可能的实施方式中,所述指针由所述视频适配集元素VI中的EssentialProptery元素的value属性承载,或者所述指针由所述视频适配集元素VI之中的SupplementalProperty元素的value属性承载。
结合第五方面的第十六种可能的实施方式,在第五方面的第二十二种可能的实施方式中,
所述指针由所述视频适配集元素VI中的虚拟媒体表达Representation元素的属性承载,或,所述指针由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符BaseURL元素。
结合第五方面的第十六种可能的实施方式,在第五方面的第二十三种可能的实施方式中,所述指针由所述视频适配集元素VI中的媒体呈现指向ReferencedMediaPresentation元素来承载。
结合第五方面或第五方面的第一种至第二十三种可能的实施方式中的任
意一种可能的实施方式,在第五方面的第二十四种可能的实施方式中,
所述导览媒体呈现的时间结构不依赖于所述导览媒体呈现中的所述K个导览单元所指向的主媒体呈现的时间结构。
结合第五方面或第五方面的第一种至第二十四种可能的实施方式中的任意一种可能的实施方式,在第五方面的第二十五种可能的实施方式中,所述方法处理器还用于,在关注焦点停留在所述K个导览单元中的导览单元i的情况下,所述客户端呈现所述导览单元i的音频分量。
结合第五方面或第五方面的第一种至第二十五种可能的实施方式中的任意一种可能的实施方式,在第五方面的第二十六种可能的实施方式中,所述方法处理器还用于,在所述K个导览单元中的导览单元i被选择的情况下,所述客户端获取所述导览单元i所指向的主媒体呈现。
本发明实施例第六方面提供一种媒体呈现导览装置,包括:
处理器和存储器;
其中,所述处理器通过调用所述存储器中的代码或指令以用于确定导览媒体呈现包括的N个导览单元;生成导览媒体呈现的媒体呈现描述,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;所述N个导览单元中的每个导览单元指向一个主媒体呈现,所述N个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
结合第六方面,在第六方面的第一种可能的实施方式中,所述导览媒体呈现的媒体呈现描述不同于所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。
结合第六方面的第一种可能的实施方式,在第六方面的第二种可能的实施方式中,所述N个导览单元中的每个导览单元以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。
结合第六方面,在第六方面的第三种可能的实施方式中,所述导览媒体呈现的媒体呈现描述与所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述被聚合形成了一个聚合媒体呈现描述。
结合第六方面的第三种可能的实施方式,在第六方面的第四种可能的实施方式中,所述N个导览单元中的每个导览单元以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
结合第六方面或第六方面的第一种至第四种可能的实施方式中的任意一种可能的实施方式,在第六方面的第五种可能的实施方式中,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量。
结合第六方面的第五种可能的实施方式,在第六方面的第六种可能的实施方式中,所述N个导览单元中的不同导览单元所包括的视频分量为N个视频适配集中的不同视频适配集中的媒体表达,其中,所述N个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述N个视频适配集中的不同视频适配集之间具有选择相容性。
结合第六方面的第六种可能的实施方式,在第六方面的第七种可能的实施方式中,所述N个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述N个适配集中的任意一个适配集,所述音频分量适配集与所述N个视频适配集之间具有选择相容性;
或者,
所述N个导览单元中的不同导览单元所包括的音频分量为N个音频适配集中的不同音频适配集中的媒体表达,其中,所述N个音频适配集中的不同音频适配集之间具有选择互斥性。
结合第六方面的第七种可能的实施方式,在第六方面的第八种可能的实施方式中,所述音频适配集元素中的媒体表达元素,包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
结合第六方面的第八种可能的实施方式,在第六方面的第九种可能的实施方式中,包含相同区域说明的媒体表达元素所描述的媒体表达之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。
结合第六方面的第八种可能的实施方式或第六方面的第九种可能的实施方式,在第六方面的第十种可能的实施方式中,所述区域说明为SRD空间关
系描述。
结合第六方面的第七种至第十种可能的实施方式中的任意一种可能的实施方式,在第六方面的第十一种可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括N个视频适配集元素,所述N个视频适配集元素与所述N个视频适配集之间一一对应;其中,所述N个视频适配集元素中包括描述子元素Ci,所述N个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别schemeIdUri属性均相同。
结合第六方面的第十一种可能的实施方式,在第六方面的第十二种可能的实施方式中,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。
结合第六方面的第十一种可能的实施方式,在第六方面的第十三种可能的实施方式中,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色。
结合第六方面的第十二种可能的实施方式或第六方面的第十三种可能的实施方式,在第六方面的第十四种可能的实施方式中,所述描述子元素Ci为作用说明Role元素或者基本属性EssentialProptery元素或者补充属性SupplementalProptery元素。
结合第六方面的第十四种可能的实施方式,在第六方面的第十五种可能的实施方式中,若描述子元素Ci为作用说明Role元素,则所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称相同、方法识别schemeIdUri属性相同,且参数value属性相同。
结合第六方面的第四种至第十五种可能的实施方式中的任意一种可能的实施方式,在第六方面的第十六种可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括所述N个视频适配集元素,所述N个视频适配集元素与N个视频适配集之间一一对应,
其中,所述N个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I为所述N个视
频适配集中任意一个视频适配集。
结合第六方面的第十六种可能的实施方式,在第六方面的第十七种可能的实施方式中,
所述指针由所述视频适配集元素VI的属性承载。
结合第六方面的第十七种可能的实施方式,在第六方面的第十八种可能的实施方式中,所述指针由所述视频适配集元素VI的xlink:href属性承载。
结合第六方面的第十六种可能的实施方式,在第六方面的第十九种可能的实施方式中,
所述指针由所述视频适配集元素VI中的基本属性EssentialProptery元素或补充属性SupplementalProperty元素承载。
结合第六方面的第十六种可能的实施方式,在第六方面的第二十种可能的实施方式中,所述指针由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或所述指针由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
结合第六方面的第二十种可能的实施方式,在第六方面的第二十一种可能的实施方式中,所述指针由所述视频适配集元素VI中的EssentialProptery元素的value属性承载,或者所述指针由所述视频适配集元素VI之中的SupplementalProperty元素的value属性承载。
结合第六方面的第十六种可能的实施方式,在第六方面的第二十二种可能的实施方式中,
所述指针由所述视频适配集元素VI中的虚拟媒体表达Representation元素的属性承载,或,所述指针由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符BaseURL元素。
结合第六方面的第十六种可能的实施方式,在第六方面的第二十三种可能的实施方式中,所述指针由所述视频适配集元素VI中的媒体呈现指向
ReferencedMediaPresentation元素来承载。
结合第六方面或第六方面的第一种至第二十三种可能的实施方式中的任意一种可能的实施方式,在第六方面的第二十四种可能的实施方式中,
所述导览媒体呈现的时间结构不依赖于所述导览媒体呈现中的所述N个导览单元所指向的主媒体呈现的时间结构。
本发明第七方面提供一种通信系统,包括:
客户端和与所述客户端通信连接的内容服务器;
其中,所述客户端,用于从内容服务器获取导览媒体呈现的媒体呈现描述,其中,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;根据所述导览媒体呈现的媒体呈现描述从内容服务器获取所述N个导览单元中的K个导览单元;呈现所述K个导览单元,所述K个导览单元中的每个导览单元指向一个主媒体呈现,其中,K个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
结合第七方面,在第七方面的第一种可能的实施方式中,所述导览媒体呈现的媒体呈现描述不同于所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。
结合第七方面的第一种可能的实施方式,在第七方面的第二种可能的实施方式中,所述K个导览单元中的每个导览单元以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。
结合第七方面,在第七方面的第三种可能的实施方式中,所述导览媒体呈现的媒体呈现描述与所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述被聚合形成了一个聚合媒体呈现描述。
结合第七方面的第三种可能的实施方式,在第七方面的第四种可能的实施方式中,所述K个导览单元中的每个导览单元以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
结合第七方面或第七方面的第一种至第四种可能的实施方式中的任意一种可能的实施方式,在第七方面的第五种可能的实施方式中,所述N个导览
单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量。
结合第七方面的第五种可能的实施方式,在第七方面的第六种可能的实施方式中,所述K个导览单元中的不同导览单元所包括的视频分量为K个视频适配集中的不同视频适配集中的媒体表达,其中,所述K个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述K个视频适配集中的不同视频适配集之间具有选择相容性。
结合第七方面的第六种可能的实施方式,在第七方面的第七种可能的实施方式中,所述K个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述K个适配集中的任意一个适配集,所述音频分量适配集与所述K个视频适配集之间具有选择相容性;
或者,
所述K个导览单元中的不同导览单元所包括的音频分量为K个音频适配集中的不同音频适配集中的媒体表达,其中,所述K个音频适配集中的不同音频适配集之间具有选择互斥性。
结合第七方面的第七种可能的实施方式,在第七方面的第八种可能的实施方式中,所述音频适配集元素中的媒体表达元素,包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
结合第七方面的第八种可能的实施方式,在第七方面的第九种可能的实施方式中,包含相同区域说明的媒体表达元素所描述的媒体表达之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。
结合第七方面的第八种可能的实施方式或第七方面的第九种可能的实施方式,在第七方面的第十种可能的实施方式中,所述区域说明为SRD空间关系描述。
结合第七方面的第七种至第十种可能的实施方式中的任意一种可能的实施方式,在第七方面的第十一种可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括K个视频适配集元素,所述K个视频适配集元素与所述K个视频适配集之间一一对应;其中,所述K个视频适配集元素中包括描述子元
素Ci,所述K个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别schemeIdUri属性均相同。
结合第七方面的第十一种可能的实施方式,在第七方面的第十二种可能的实施方式中,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。
结合第七方面的第十一种可能的实施方式,在第七方面的第十三种可能的实施方式中,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色。
结合第七方面的第十二种可能的实施方式或第七方面的第十三种可能的实施方式,在第七方面的第十四种可能的实施方式中,所述描述子元素Ci为作用说明Role元素或者基本属性EssentialProptery元素或者补充属性SupplementalProptery元素。
结合第七方面的第十四种可能的实施方式,在第七方面的第十五种可能的实施方式中,若描述子元素Ci为作用说明Role元素,则所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称相同、方法识别schemeIdUri属性相同,且参数value属性相同。
结合第七方面的第四种至第十五种可能的实施方式中的任意一种可能的实施方式,在第七方面的第十六种可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括所述K个视频适配集元素,所述K个视频适配集元素与K个视频适配集之间一一对应,
其中,所述K个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I为所述K个视频适配集中任意一个视频适配集。
结合第七方面的第十六种可能的实施方式,在第七方面的第十七种可能的实施方式中,
所述指针由所述视频适配集元素VI的属性承载。
结合第七方面的第十七种可能的实施方式,在第七方面的第十八种可能的
实施方式中,所述指针由所述视频适配集元素VI的xlink:href属性承载。
结合第七方面的第十六种可能的实施方式,在第七方面的第十九种可能的实施方式中,
所述指针由所述视频适配集元素VI中的基本属性EssentialProptery元素或补充属性SupplementalProperty元素承载。
结合第七方面的第十六种可能的实施方式,在第七方面的第二十种可能的实施方式中,所述指针由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或所述指针由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
结合第七方面的第二十种可能的实施方式,在第七方面的第二十一种可能的实施方式中,所述指针由所述视频适配集元素VI中的EssentialProptery元素的value属性承载,或者所述指针由所述视频适配集元素VI之中的SupplementalProperty元素的value属性承载。
结合第七方面的第十六种可能的实施方式,在第七方面的第二十二种可能的实施方式中,
所述指针由所述视频适配集元素VI中的虚拟媒体表达Representation元素的属性承载,或,所述指针由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符BaseURL元素。
结合第七方面的第十六种可能的实施方式,在第七方面的第二十三种可能的实施方式中,所述指针由所述视频适配集元素VI中的媒体呈现指向ReferencedMediaPresentation元素来承载。
结合第七方面或第七方面的第一种至第二十三种可能的实施方式中的任意一种可能的实施方式,在第七方面的第二十四种可能的实施方式中,
所述导览媒体呈现的时间结构不依赖于所述导览媒体呈现中的所述K个导览单元所指向的主媒体呈现的时间结构。
可以看出,本实施例的技术方案中,由于K个导览单元中的每个导览单元可以分别指向一个主媒体呈现,这样就相当于在导览单元和主媒体呈现之间引入的一定的关联关系,这使得在所述K个导览单元的导览单元i被选择的情况下,所述客户端可获取与导览单元i指向的主媒体呈现j的媒体呈现描述,进而可以根据所述主媒体呈现j的媒体呈现描述获取所述主媒体呈现j进行呈现,可见这有利于实现导览媒体呈现和主媒体呈现之间的较灵活切换,进而实现在基于HTTP的媒体流服务场景下支持视频导览,进而有利于提升用户的高品质体验。
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1-a为本发明实施例提供的一种媒体呈现描述的架构示意图;
图1-b为本发明实施例提供的一种基于HTTP媒体流的媒体呈现导览方法的流程示意图;
图1-c为本发明实施例提供的一种单个媒体呈现的时间结构的示意图;
图1-d为本发明实施例提供的一种多个媒体呈现的时间结构的示意图;
图1-e和1-f为本发明实施例提供的一种编码得到导览单元的媒体表达的示意图;
图1-g为本发明实施例提供的另一种多个媒体呈现的时间结构的示意图;
图1-h为本发明实施例提供的另一种多个媒体呈现的时间结构的示意图;
图1-i为本发明实施例提供的一种合成得到导览媒体呈现的示意图;
图1-j为本发明实施例提供的一种客户端解码输出导览单元的视频分量的示意图;
图1-k为本发明实施例提供的一种客户端解码输出导览单元的音频分量的示意图;
图2为本发明实施例提供的另一种基于HTTP媒体流的媒体呈现导览方法的流程示意图;
图3-a为本发明实施例提供的另一种基于HTTP媒体流的媒体呈现导览方法的流程示意图;
图3-b为本发明实施例提供的一种网络架构的示意图;
图4为本发明实施例提供的一种客户端的示意图;
图5为本发明实施例提供的另一种客户端的示意图;
图6为本发明实施例提供的一种服务器的示意图;
图7为本发明实施例提供的另一种服务器的示意图;
图8为本发明实施例提供的一种通信系统的示意图。
本发明实施例提供了基于超文本传输协议媒体流的媒体呈现导览方法和相关装置,以期能在基于HTTP的媒体流服务场景下支持视频导览,进而提高用户体验。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包括。例如包括了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于更好的理解本发明实施例的技术方案,下面先进行一些可能相关技术的介绍。
在传统的模拟电视服务中,用户可以通过在不同频道之间切换来寻找其感兴趣频道,然后停留在感兴趣频道上。在数字电视服务中,可以提供电子节目导航(EPG,Electronic Program Guide),EPG实际上是一个列表,EPG包含不同频道的节目和时间等诸如此类的信息,用户可通过EPG寻找感兴趣的电
视频道,然后从EPG频道切换到该频道。实践发现,以图形化方式提供的导览业务对用户更友好,易于用户使用。
在导览业务以导览单元代表一个电视频道。导览单元和它所代表的电视频道一样,可以有不同的媒体分量,如:视频,音频等。图形化的导览业务以多个小画幅的图像(动态的图像序列或者静态的图片)的形式呈现一组导览单元的视频。用户可在多个小画幅的图像中进行浏览,改变关注的导览单元,用户甚至可以听到当前关注的导览单元的音频。用户选择某个导览单元就可以切换到该导览单元对应的频道。
随着技术的发展,特别是宽带通信和微处理器,个人设备的通信能力和功能越来越强大,通过互联网的在线流服务传送多媒体的应用越来越广泛。基于HTTP的自适应流服务成为多媒体流服务的主流技术,代表性了这一领域的最新发展。苹果(Apple)公司的HTTP流服务(HLS,HTTP Live Streaming)、微软(Microsoft)公司的平滑流服务(SS,Smooth Streaming),动态图像专家组(MPEG,Moving Picture Experts Group)的基于HTTP的动态自适应媒体流(DASH,Dynamic Adaptative Streaming Over HTTP)都是这一技术的不同形式。MPEG的DASH标准是由MPEG制订的标准化技术,有望得到广泛的采用,从而改变割裂的市场格局。
遗憾的是,现在的基于HTTP的媒体流服务不能支持导览业务。现有基于HTTP的媒体流服务只适用于一个媒体呈现(媒体呈现是DASH标准中使用的术语,概念上大致相当于一个电视频道),而导览业务服务于多个媒体呈现,是一个跨多个媒体呈现的业务。本发明旨在解决基于HTTP的媒体流服务对导览业务的支持。虽然本发明引用DASH标准中的术语作为叙述和实施例的基础,但本发明的方法并不限于DASH标准,而可适用于多种基于HTTP的媒体流服务。
可选的,本发明的一些实施例的技术方案例如可以是根据如下的一些DASH规范及其增补修订:
ISO/IEC 23009-1:Part 1:Media presentation description and segment formats,2nd Edition,2014。
ISO/IEC 23009-1:2014/FDAM 1。
Part 1:Media presentation description and segment formats。
AMENDMENT 1:High Profile and Availability Time Synchronization Extended profiles and time synchronization,ISO/IEC 23009-1:2014/FDAM 1Part 1:Media presentation description and segment formats。
ISO/IEC 23009-1:2014/DAM 2。
Part 1:Media presentation description and segment formats。
AMENDMENT 2:Spatial Relationship Description,Generalized URL parameters and other extensions。
在DASH标准中,一项媒体内容编码为多个版本,各个版本有不同的特性,如码率,这些版本在DASH中称为媒体表达(Representation),它们代表相同的媒体内容,从内容呈现(观看/播放)的角度彼此具有替代性。一个媒体表达在时间上分割为可访问的单位——通常长度为若干秒,称为媒体片段或者媒体子片段(一个媒体片段可以在逻辑上划分为媒体子片段)。另外还有一个初始化片段,它只包含有元数据而没有媒体数据。下文中,媒体片段,初始化片段都称为片段(Segment)。媒体表达存储在内容服务器——HTTP服务器上供客户端获取,而片段是客户端能够通过统一资源定位符(URL,Uniform Resource Locator)访问的最小单位。媒体呈现描述(MPD,Media Presentation Description)是一个扩展标记语言(XML,extensible Markup Language)文件,它包含了客户端所需要的元数据,描述了媒体表达的特性以及如何从服务器上获取媒体表达,包括:媒体表达的码率,分辨率,视频图像的长宽比,媒体表达包含的片段的URL等。基于MPD中的信息,客户端可构造HTTP URL以从内容服务器请求媒体表达中的媒体片段,在媒体片段边界可以切换到其他的媒体表达以适应可用带宽的变化。
基于HTTP的自适应媒体流服务允许一个媒体呈现中内容特性的变化,例如媒体编码方式的改变。在DASH标准中,这是通过所谓“内容段落(Period)”这一概念来实现的,Period用于内容的拼接,比如前一个内容段落是新闻节目,下一个内容段落是广告。一个媒体呈现包括一个或者多个内容段落(Period),
这些内容段落在时间上是顺序的,一个内容段落的开始意味着相比前一个内容段落有某些变化,例如内容的变化,例如可从新闻节目到体育节目,从体育节目到电影节目、从电影节目到广告、从广告到综艺节目等等;内容的编码方式的变化,例如可从H.264编码方案转变为H.265编码方案;媒体表达数量的变化,例如可增加或者减少媒体表达;内容分量的变化,例如可增加中文的音频表达等等。当客户端遇到一个新的内容段落的开始,客户端工作条件发生了变化,可能要重新初始化。
在一个内容段落中,包含相同媒体内容和媒体分量的媒体表达的集合称为适配集,一个适配集至少包含一个媒体表达,一个适配集中的媒体表达具有相互替代性。不同的适配集之间可能是相容或者相斥的。
总结以上所述,媒体呈现可包含一个或多个时间上顺序的内容段落,每个内容段落包含一个或者多个适配集(Adaptation Set)。其中每个适配集(Adaptation Set)包含一个或者多个媒体表达(Representation)。其中一个媒体表达包含一个或者多个片段(Segment)。
媒体呈现描述具有和媒体呈现相似的层次化结构,如图1-a所示。以上介绍的媒体呈现的概念在媒体呈现描述中可用一个XML元素表示,媒体呈现元素包括一个或多个内容段落(Period)元素,每个内容段落(Period)元素包含一个或多个适配集(AdaptationSet)元素。每个适配集(AdaptationSet)元素包含一个或多个媒体表达(Representation)元素。
媒体呈现对应于媒体呈现描述中的媒体呈现描述元素,媒体呈现中的一个内容段落对应于媒体呈现描述中的一个内容段落元素,媒体呈现中的一个适配集对应于媒体呈现描述中的一个适配集元素,媒体呈现中的一个媒体表达对应于媒体呈现描述中的一个媒体表达元素,以此类推。
下面介绍基于HTTP媒体流的媒体呈现导览方法。
其中,导览业务服务于多个媒体呈现,为在一组媒体呈现中进行选择提供方便,是一个跨多个媒体呈现的业务。导览业务所服务的多个媒体呈现称为该导览业务的成员媒体呈现,简称成员媒体呈现或者主媒体呈现。
在本发明实施例的技术方案中,导览业务可实现为一个媒体呈现(即导览
媒体呈现),导览媒体呈现独立于它的成员媒体呈现。导览业务和它的成员媒体呈现分别由各自的媒体呈现描述来说明。其中,如果导览业务服务于N个媒体呈现,那么有N+1个媒体呈现和相应的N+1个媒体呈现描述,在导览业务中,每个成员媒体呈现对应于导览媒体呈现的一个导览单元,代表该成员媒体呈现。导览业务和它的成员媒体呈现分别由各自的媒体呈现描述说明。一个导览单元代表一个媒体呈现,它可能包括多个媒体分量,典型的例如:视频分量(也可称视频媒体表达),音频分量(也可称音频媒体表达)。一个导览单元的视频是一个小画幅的图像,代表一个媒体呈现。导览单元的视频通常是从它所代表的媒体呈现的视频分量裁剪而来的,即画面的一部分,导览单元呈现质量(例如分辨率和/或帧率等)低于主媒体呈现,导览单元的音频来自主媒体呈现的音频。在本发明中,一个导览单元的视频实现为一个或多个媒体表达(在一些示例中以一个为例)。
参见图1-b,图1-b为本发明的一个实施例提供的一种基于HTTP媒体流的媒体呈现导览方法的流程示意图。如图1-b所示,本发明的一个实施例提供的一种基于HTTP媒体流的媒体呈现导览方法可以包括:
101、客户端(Client)获取导览媒体呈现的媒体呈现描述。
其中,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元。
其中,客户端(Client)可从内容服务器或其它设备获取导览媒体呈现的媒体呈现描述。
其中,所述N为大于1的整数。
其中,所述N例如可等于7、2、3、4、5、8、11、15、20、25、30或者其他值。
其中,所述客户端可为DASH客户端或具有DASH客户端逻辑功能的其他客户端或基于HTTP的媒体流服务的其他客户端。
其中,所述客户端例如可以为个人电脑,手机,平板电脑,电视机或机顶盒等。
其中,导览媒体呈现可看成是一种特殊的媒体呈现。
102、所述客户端根据所述导览媒体呈现的媒体呈现描述获取所述N个导览单元中的K个导览单元。
其中,所述K为小于或等于所述N的正整数。
其中,所述K例如可等于1、2、3、4、5、8、11、15、20、25、30或者其他值。
其中,K个导览单元可与K个逻辑呈现单元(逻辑呈现单元例如可为导览窗口)一一对应,即K个导览单元中的每个导览单元可由不同的逻辑呈现单元来呈现。
103、所述客户端呈现所述K个导览单元。
所述K个导览单元中的每个导览单元指向一个主媒体呈现。K个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
其中,所述K个导览单元中的每个导览单元可指向一个主媒体呈现。
其中,K个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。也就是说,导览单元的媒体表达的呈现质量低于导览单元所表示的主媒体呈现的呈现质量。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述可以不同于所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。即,所述导览媒体呈现可具有独立的媒体呈现描述,K个导览单元中的每个导览单元所指向主媒体呈现亦可具有独立的且不同于所述导览媒体呈现的媒体呈现描述的媒体呈现描述。例如K个导览单元指向了K个主媒体呈现,而K个主媒体呈现分别具有对应的媒体呈现描述,即K个媒体呈现描述,而导览媒体呈现的媒体呈现描述不同于这K个媒体呈现描述中的任意一个,即导览媒体呈现可由第K+1个媒体呈现描述。
此外,在本发明另一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述与所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述可被聚合形成了一个聚合媒体呈现描述(也可称超级媒体呈现描述)。即可利用一个聚合媒体呈现描述(可称超级媒体呈现描述)来描述导览媒体呈现和
导览媒体呈现所指向的主媒体呈现。超级媒体呈现描述的引入有利于增强导览媒体呈现和所导览的主媒体呈现之间的关联关系。
在实际应用中,导览单元指向主媒体呈现的方式可以很灵活,导览单元可以直接指向主媒体呈现,也可以间接的指向主媒体呈现。
举例来说,所述K个导览单元中的每个导览单元可以以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。当然,导览单元亦可通过其他的直接指向或间接指向的方式来指向主媒体呈现。例如,所述导览媒体呈现的媒体呈现描述与所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述可被聚合形成了一个聚合媒体呈现描述。这种情况下,所述K个导览单元中的每个导览单元可以以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
可选的,在本发明的一些可能的实施方式中,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量,进一步的,导览单元还可包括字幕分量或其他类型的媒体分量。
本发明通过媒体呈现描述(如DASH标准中的MPD),提供了导览业务的信令机制。媒体呈现描述可告知客户端一个导览业务由哪些导览单元组成,导览单元的分量,导览单元和导览业务的成员媒体呈现之间的关系,导览单元视频分量之间的关系,导览单元的音频分量之间的关系,导览单元的音频分量和视频分量之间的关系等。
可选的,在本发明一些可能实施方式中,所述K个导览单元中的不同导览单元所包括的视频分量为K个视频适配集中的不同视频适配集中的媒体表达,其中,所述K个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述K个视频适配集中的不同视频适配集之间具有选择相容性。例如,所述K个导览单元中导览单元i所包括的视频分量可归属于K个视频适配集中的视频适配集Ci,所述K个导览单元中导览单元j所包括的视频分量可归属于K个视频适配集中的视频适配集Cj,其中,视频适配集Cj和视频适配集Ci为所述K个视频适配集中的两个不同的视频适配集。导览单
元j和导览单元i可为K个导览单元中的任意两个导览单元。
其中,所谓选择相容性,表示这些对象可同时被选择,例如若K个视频适配集中的不同视频适配集之间具有选择相容性,则表示可同时选择K个视频适配集中的多个视频适配集中的媒体表达。
所谓选择互斥性,表示这些对象不支持同时被选择,例如若所述K个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,表示不支持同时选择1个视频适配集中的多个媒体表达,例如假设K个视频适配集中的视频适配集I包括10个多个媒体表达,若视频适配集中的媒体表达之间具有选择互斥性,那么每次只能选择10个媒体表达中的其中1个,而不能同时选择该10个媒体表达中的多个。
可选的,在本发明的一些可能实施方式中,所述K个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述K个视频适配集中的任意一个适配集,所述音频分量适配集与所述K个视频适配集之间具有选择相容性。例如,假设音频适配集包括20个多个媒体表达,若音频适配集中的媒体表达之间具有选择互斥性,那么每次只能选择20个多个媒体表达中的其中1个,而不能同时选择该30个媒体表达中的多个。
可选的,在本发明的另一些可能的实施方式中,所述K个导览单元中的不同导览单元所包括的音频分量为K个音频适配集中的不同音频适配集中的媒体表达,其中,所述K个音频适配集中的不同音频适配集之间具有选择互斥性。
可选的,在本发明的一些可能的实施方式中,所述音频适配集元素中的媒体表达元素,可以包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
可选的,在本发明一些可能实施方式中,包含相同区域说明的媒体表达元素所描述的媒体表达(representation)之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。例如媒体表达元素i所描述的媒体表达为媒体表达ri,媒体表达元素j所描述的媒体表达为媒体表达rj,若媒体表达元素i与媒体表达元素j包含相同区域说明,那么可以表示
媒体表达ri与媒体表达rj之间具有关联关系。
可选的,在本发明一些可能实施方式中,媒体表达元素i和适配集元素ci包含相同区域说明,那么也可能说明媒体表达元素i所描述的媒体表达与适配集元素ci所描述的适配集中的各媒体表达之间具有关联关系,例如媒体表达元素i可为音频媒体表达,而适配集元素ci所描述的适配集中的媒体表达可为视频媒体表达。
可选的,在本发明的一些可能的实施方式中,所述区域说明可为空间关系描述(SRD)。当然,所述区域说明亦可为其他类型的可用于描述位置区域的说明信息。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括K个视频适配集元素,所述K个视频适配集元素与所述K个视频适配集之间一一对应。
其中,所述K个视频适配集元素中包括描述子元素Ci,所述K个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件例如可为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别(schemeIdUri)属性均相同。
可选的,在本发明的一些可能的实施方式中,所述描述子元素Ci可描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。或者,所述描述子元素Ci可描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色,角色例如可能是主要、补充、字幕或翻译配音等。
可选的,在本发明的一些可能的实施方式中,所述描述子元素Ci例如可为基本属性(EssentialProptery)元素或者补充属性(SupplementalProptery)元素或作用说明(Role)元素或者其他元素。
可选的,在本发明的一些可能的实施方式中,若描述子元素Ci为作用说明Role元素,则所述设定共性条件可为视频适配集元素所包括的描述子元素Ci的元素名称可相同、方法识别schemeIdUri属性可相同,且参数(value)属性可相同。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括所述K个视频适配集元素,所述K个视频适配集元素与K个视频适配集之间一一对应。其中,所述K个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I可为所述K个视频适配集中任意一个视频适配集。
其中,可根据场景需要来确定所述指针在视频适配集元素VI中承载位置。
例如,所述指针可由所述视频适配集元素VI的属性承载。
具体例如,所述指针可由所述视频适配集元素VI的xlink:href属性或其它属性承载。
又例如,所述指针可由所述视频适配集元素VI中的EssentialProptery元素或SupplementalProperty元素承载。
具体例如,所述指针可由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或者所述指针可由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者,所述指针可由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针可由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
具体例如,所述指针可由所述视频适配集元素VI中的EssentialProptery元素的value属性或其它属性承载,或所述指针可由所述视频适配集元素VI之中的SupplementalProperty元素的value属性或其它属性承载。
又例如,所述指针可由所述视频适配集元素VI中的虚拟Representation元素的属性承载,或所述指针可由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符(BaseURL)元素。
又举例来说,所述指针也可由所述视频适配集元素VI中的媒体呈现指向(ReferencedMediaPresentation)元素来承载。ReferencedMediaPresentation元素是新扩展的一种元素,也就是说,可以利用所述视频适配集元素VI中的新扩展出的元素来承载所述指针,所述视频适配集元素VI中新扩展出的承载所
述指针的元素的名称并不限于ReferencedMediaPresentation,也可以为其它的元素名称。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的时间结构可不依赖于所述导览媒体呈现中的所述K个导览单元所指向的主媒体呈现的时间结构。其中,导览单元的音频可以是通过对主媒体呈现的音频进行编码而得到,导览单元的视频可以是通过对主媒体呈现的视频进行编码而得到,这可使得导览单元的时间结构和主媒体呈现的时间结构之间没有相关性。
下面结合附图来举例媒体呈现的时间结构。
下面结合附图1-c和图1-d来举例媒体呈现的时间结构。
附图1-c举例示出了一个媒体呈现的时间结构,媒体呈现包括连续的若干个Period。
附图1-d举例示出了多个媒体呈现的时间结构,每个媒体呈现包括连续的若干个Period。但是多个媒体呈现之间的时间结构不同,例如Period的边界未对齐等。其中,媒体呈现在时间上是顺序的,媒体呈现描述也描述顺序的时间结构,而描述多个并发的媒体呈现的非顺序的时间结构超过了传统媒体呈现描述的能力。
本发明实施例中可通过对每个导览单元指向的主媒体呈现的媒体表达(音频和视频等)重新进行编码处理来得到导览单元的媒体表达,也就是说,每个导览单元指向的主媒体呈现的媒体表达和导览单元的媒体表达是独立的。并且,各每个导览单元的媒体表达是独立的,同一导览单元的音频分量和视频分量也是独立的。因此可不受到导览单元的媒体呈现的媒体表达不受到对应主媒体呈现的媒体表达的Period安排的影响。图1-e和图1-f示出了内容服务器对导览单元指向的主媒体呈现的视频媒体表达和音频媒体表达进行编码的方式示例。
图1-g示出了导览媒体呈现的N个导览单元的媒体呈现的Period安排的一种示例。其中,导览媒体呈现的N个导览单元的媒体呈现的Period安排是对齐的。图1-h示出了当新增一个导览单元时,新增的导览单元的与其他导览单元的媒体呈现的Period安排是对齐的。
图1-i示出了内容服务器利用各导览单元指向的主媒体呈现的媒体呈现描
述来得到导览媒体呈现的媒体呈现描述的方式示例。当然,内容服务器亦可通过其他方式来获得导览媒体呈现的媒体呈现描述。
图1-j和图1-k示出了客户端选择K个导览单元进行呈现的示例。N个导览单元中的K个导览单元的视频媒体表达将被解码呈现,而K个导览单元的音频媒体表达中的高亮导览单元的音频媒体表达将被解码呈现。当然,客户端可基于导览媒体呈现的媒体呈现描述和用户指令来选择K个导览单元进行呈现的具体方式。
可选的,在本发明的一些可能的实施方式中,所述方法还包括:在关注焦点停留在所述K个导览单元中的导览单元i的情况下,所述客户端呈现所述导览单元i的音频分量。
可选的,在本发明的一些可能的实施方式中,所述方法还包括:在所述K个导览单元中的导览单元i被选择的情况下,所述客户端获取所述导览单元i所指向的主媒体呈现。进一步的,所述客户端还可呈现所述导览单元i所指向的主媒体呈现。
可以看出,本实施例的技术方案中,由于K个导览单元中的每个导览单元可以分别指向一个主媒体呈现,这样就相当于在导览单元和主媒体呈现之间引入的一定的关联关系,这使得在所述K个导览单元的导览单元i被选择的情况下,所述客户端可获取与导览单元i指向的主媒体呈现j的媒体呈现描述,进而可以根据所述主媒体呈现j的媒体呈现描述获取所述主媒体呈现j进行呈现,可见这有利于实现导览媒体呈现和主媒体呈现之间的较灵活切换,进而实现在基于HTTP的媒体流服务场景下支持视频导览,进而有利于提升用户的高品质体验。
本发明实施例的技术方案有利于使得导览业务更具有灵活性,本发明可以实现个性化的导览业务,例如可以在客户端配置导览业务,如:一个导览页面/窗口中显示的导览单元的数目,导览单元的组合,导览单元的呈现位置和顺序等等均可在客户端配置,这有利于极大地方便了导览业务在多样化的不同的设备上的使用。如:移动电话终端,平板电脑,他们的的能力各异——显示器件尺寸,分辨率,计算能力等。
另一方面,是提高了通信带宽使用的有效性。在以往的电视服务中,所有的媒体流,包括导览单元流和主媒体流以广播方式一起传送到终端(电视机或机顶盒),传送所有的媒体流对于媒体流服务是不可能的,因为一个客户端能够使用的带宽是有限的,比广播系统中少得多。另外,用户往往只会用到一部分导览单元,或者,因为用户的兴趣,比如用户只对体育类节目感兴趣,或者终端的通信能力,或者用户找到了要看的节目频道,不在继续使用导览,很多导览单元是不需要传送的。本发明中,导览单元可只在客户端需要时发生传送,这样也有利于避免不必要的带宽占用。
参见图2,图2为本发明的另一个实施例提供的另一种基于HTTP媒体流的媒体呈现导览方法的流程示意图。如图2所示,本发明的另一个实施例提供的一种基于HTTP媒体流的媒体呈现导览方法可以包括:
201、确定导览媒体呈现包括的N个导览单元。
202、生成导览媒体呈现的媒体呈现描述,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;所述N个导览单元中的每个导览单元指向一个主媒体呈现,其中,所述N个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
其中,本发明实施例的执行主体可以是内容服务器或其他设备。内容服务器可存储导览媒体呈现的媒体呈现描述,并可将其提供给客户端。
其中,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元。
其中,客户端(Client)可从内容服务器或其它设备获取导览媒体呈现的媒体呈现描述。
其中,所述N为大于1的整数。
其中,所述N例如可等于7、2、3、4、5、8、11、15、20、25、30或者其他值。
其中,所述客户端可为DASH客户端或具有DASH客户端逻辑功能的其他客户端或基于HTTP的媒体流服务的其他客户端。
其中,所述客户端例如可以为个人电脑,手机,平板电脑,电视机或机顶盒等。
其中,导览媒体呈现可看成是一种特殊的媒体呈现。
可以看出,本实施例的技术方案中,导览媒体呈现的媒体呈现描述所描述的导览媒体呈现包括的N个导览单元,由于N个导览单元中的每个导览单元可以分别指向一个主媒体呈现,这样就相当于在导览单元和主媒体呈现之间引入的一定的关联关系,这使得客户端在所述N个导览单元的导览单元i被选择的情况下,所述客户端可获取与导览单元i指向的主媒体呈现j的媒体呈现描述,进而可以根据所述主媒体呈现j的媒体呈现描述获取所述主媒体呈现j进行呈现,可见这中方案为实现导览媒体呈现和主媒体呈现之间的较灵活切换奠定了基础,进而为实现在基于HTTP的媒体流服务场景下支持视频导览奠定了基础。
其中,N个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。也就是说,导览单元的媒体表达的呈现质量低于导览单元所表示的主媒体呈现的呈现质量。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述可以不同于所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。即,所述导览媒体呈现可具有独立的媒体呈现描述,N个导览单元中的每个导览单元所指向主媒体呈现亦可具有独立的且不同于所述导览媒体呈现的媒体呈现描述的媒体呈现描述。例如N个导览单元指向了N个主媒体呈现,而N个主媒体呈现分别具有对应的媒体呈现描述,即N个媒体呈现描述,而导览媒体呈现的媒体呈现描述不同于这N个媒体呈现描述中的任意一个,即导览媒体呈现可由第K+1个媒体呈现描述。
此外,在本发明另一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述与所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述可被聚合形成了一个聚合媒体呈现描述(也可称超级媒体呈现描述)。即可利用一个聚合媒体呈现描述(可称超级媒体呈现描述)来描述导览媒体呈现和导览媒体呈现所指向的主媒体呈现。超级媒体呈现描述的引入有利于增强导览
媒体呈现和所导览的主媒体呈现之间的关联关系。
在实际应用中,导览单元指向主媒体呈现的方式可以很灵活,导览单元可以直接指向主媒体呈现,也可以间接的指向主媒体呈现。
举例来说,所述N个导览单元中的每个导览单元可以以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。当然,导览单元亦可通过其他的直接指向或间接指向的方式来指向主媒体呈现。例如,所述导览媒体呈现的媒体呈现描述与所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述可被聚合形成了一个聚合媒体呈现描述。这种情况下,所述N个导览单元中的每个导览单元可以以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
可选的,在本发明的一些可能的实施方式中,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量,进一步的,导览单元还可包括字幕分量或其他类型的媒体分量。
本发明通过媒体呈现描述(如DASH标准中的MPD),提供了导览业务的信令机制。媒体呈现描述可告知客户端一个导览业务由哪些导览单元组成,导览单元的分量,导览单元和导览业务的成员媒体呈现之间的关系,导览单元视频分量之间的关系,导览单元的音频分量之间的关系,导览单元的音频分量和视频分量之间的关系等。
可选的,在本发明一些可能实施方式中,所述N个导览单元中的不同导览单元所包括的视频分量为N个视频适配集中的不同视频适配集中的媒体表达,其中,所述N个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述N个视频适配集中的不同视频适配集之间具有选择相容性。例如,所述N个导览单元中导览单元i所包括的视频分量可归属于N个视频适配集中的视频适配集Ci,所述N个导览单元中导览单元j所包括的视频分量可归属于N个视频适配集中的视频适配集Cj,其中,视频适配集Cj和视频适配集Ci为所述N个视频适配集中的两个不同的视频适配集。导览单元j和导览单元i可为N个导览单元中的任意两个导览单元。
其中,所谓选择相容性,表示这些对象可同时被选择,例如若N个视频适配集中的不同视频适配集之间具有选择相容性,则表示可同时选择N个视频适配集中的多个视频适配集中的媒体表达。
所谓选择互斥性,表示这些对象不支持同时被选择,例如若所述N个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,表示不支持同时选择1个视频适配集中的多个媒体表达,例如假设N个视频适配集中的视频适配集I包括10个多个媒体表达,若视频适配集中的媒体表达之间具有选择互斥性,那么每次只能选择10个媒体表达中的其中1个,而不能同时选择该10个媒体表达中的多个。
可选的,在本发明的一些可能实施方式中,所述N个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述N个视频适配集中的任意一个适配集,所述音频分量适配集与所述N个视频适配集之间具有选择相容性。例如,假设音频适配集包括20个多个媒体表达,若音频适配集中的媒体表达之间具有选择互斥性,那么每次只能选择20个多个媒体表达中的其中1个,而不能同时选择该30个媒体表达中的多个。
可选的,在本发明的另一些可能的实施方式中,所述N个导览单元中的不同导览单元所包括的音频分量为N个音频适配集中的不同音频适配集中的媒体表达,其中,所述N个音频适配集中的不同音频适配集之间具有选择互斥性。
可选的,在本发明的一些可能的实施方式中,所述音频适配集元素中的媒体表达元素,可以包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
可选的,在本发明一些可能实施方式中,包含相同区域说明的媒体表达元素所描述的媒体表达(representation)之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。例如媒体表达元素i所描述的媒体表达为媒体表达ri,媒体表达元素j所描述的媒体表达为媒体表达rj,若媒体表达元素i与媒体表达元素j包含相同区域说明,那么可以表示媒体表达ri与媒体表达rj之间具有关联关系。
可选的,在本发明一些可能实施方式中,媒体表达元素i和适配集元素ci包含相同区域说明,那么也可能说明媒体表达元素i所描述的媒体表达与适配集元素ci所描述的适配集中的各媒体表达之间具有关联关系,例如媒体表达元素i可为音频媒体表达,而适配集元素ci所描述的适配集中的媒体表达可为视频媒体表达。
可选的,在本发明的一些可能的实施方式中,所述区域说明可为空间关系描述(SRD)。当然,所述区域说明亦可为其他类型的可用于描述位置区域的说明信息。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括N个视频适配集元素,所述N个视频适配集元素与所述N个视频适配集之间一一对应。
其中,所述N个视频适配集元素中包括描述子元素Ci,所述N个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件例如可为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别(schemeIdUri)属性均相同。
可选的,在本发明的一些可能的实施方式中,所述描述子元素Ci可描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。或者,所述描述子元素Ci可描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色,角色例如可能是主要、补充、字幕或翻译配音等。
可选的,在本发明的一些可能的实施方式中,所述描述子元素Ci例如可为基本属性(EssentialProptery)元素或者补充属性(SupplementalProptery)元素或作用说明(Role)元素或者其他元素。
可选的,在本发明的一些可能的实施方式中,若描述子元素Ci为作用说明Role元素,则所述设定共性条件可为视频适配集元素所包括的描述子元素Ci的元素名称可相同、方法识别schemeIdUri属性可相同,且参数(value)属性可相同。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈
现描述中包括所述N个视频适配集元素,所述N个视频适配集元素与N个视频适配集之间一一对应。其中,所述N个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I可为所述N个视频适配集中任意一个视频适配集。
其中,可根据场景需要来确定所述指针在视频适配集元素VI中承载位置。
例如,所述指针可由所述视频适配集元素VI的属性承载。
具体例如,所述指针可由所述视频适配集元素VI的xlink:href属性或其它属性承载。
又例如,所述指针可由所述视频适配集元素VI中的EssentialProptery元素或SupplementalProperty元素承载。
具体例如,所述指针可由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或者所述指针可由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者,所述指针可由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针可由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
具体例如,所述指针可由所述视频适配集元素VI中的EssentialProptery元素的value属性或其它属性承载,或所述指针可由所述视频适配集元素VI之中的SupplementalProperty元素的value属性或其它属性承载。
又例如,所述指针可由所述视频适配集元素VI中的虚拟Representation元素的属性承载,或所述指针可由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符(BaseURL)元素。
又举例来说,所述指针也可由所述视频适配集元素VI中的媒体呈现指向(ReferencedMediaPresentation)元素来承载。ReferencedMediaPresentation元素是新扩展的一种元素,也就是说,可以利用所述视频适配集元素VI中的新扩展出的元素来承载所述指针,所述视频适配集元素VI中新扩展出的承载所述指针的元素的名称并不限于ReferencedMediaPresentation,也可以为其它的
元素名称。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的时间结构可不依赖于所述导览媒体呈现中的所述N个导览单元所指向的主媒体呈现的时间结构。其中,导览单元的音频可以是通过对主媒体呈现的音频进行编码而得到,导览单元的视频可以是通过对主媒体呈现的视频进行编码而得到,这可使得导览单元的时间结构和主媒体呈现的时间结构之间没有相关性。
为便于更好的理解和实施本发明实施例的上述方案,下面结合一些具体的应用场景进行举例说明。
参见图3-a和图3-b,图3-a为本发明的另一实施例提供的一种基于HTTP流媒体的提供导览媒体呈现的方法的流程示意图。图3-a所示基于HTTP流媒体的提供导览媒体呈现的方法可基于图3-b所示网络架构来具体实施。图3-b所示网络架构中主要包括DASH Client和内容服务器等。
如图3-a所示,本发明的另一个实施例提供的一种基于HTTP流媒体的提供导览媒体呈现的方法可以包括:
301、DASH客户端从内容服务器获取导览媒体呈现的媒体呈现描述。
其中,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元。
其中,所述N为大于1的整数。
其中,所述N例如可等于7、2、3、4、5、8、11、15、20、25、30或者其他值。
其中,所述DASH客户端例如可以为个人电脑,手机,平板电脑,电视机或机顶盒等。
302、DASH客户端根据所述导览媒体呈现的媒体呈现描述从内容服务器获取所述N个导览单元中的K个导览单元。
其中,所述K为小于或等于所述N的正整数。
其中,所述K例如可等于1、2、3、4、5、8、11、15、20、25、30或者其他值。
其中,K个导览单元可与K个逻辑呈现单元一一对应,即K个导览单元
中的每个导览单元可由不同的逻辑呈现单元来呈现。
303、DASH客户端呈现所述K个导览单元。
其中,所述K个导览单元中的每个导览单元可指向一个主媒体呈现。
其中,K个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。也就是说,导览单元的媒体表达的呈现质量低于导览单元所表示的主媒体呈现的呈现质量。
304、在所述K个导览单元中的导览单元i被选择的情况下,DASH客户端从内容服务器获取所述导览单元i所指向的主媒体呈现的媒体呈现描述。
305、DASH客户端基于所述主媒体呈现的媒体呈现描述,从内容服务器获取所述主媒体呈现。
306、DASH客户端呈现所述导览单元i所指向的主媒体呈现。
其中,K个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。也就是说,导览单元的媒体表达的呈现质量低于导览单元所表示的主媒体呈现的呈现质量。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述可以不同于所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。即,所述导览媒体呈现可具有独立的媒体呈现描述,K个导览单元中的每个导览单元所指向主媒体呈现亦可具有独立的且不同于所述导览媒体呈现的媒体呈现描述的媒体呈现描述。例如K个导览单元指向了K个主媒体呈现,而K个主媒体呈现分别具有对应的媒体呈现描述,即K个媒体呈现描述,而导览媒体呈现的媒体呈现描述不同于这K个媒体呈现描述中的任意一个,即导览媒体呈现可由第K+1个媒体呈现描述。
此外,在本发明另一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述与所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述可被聚合形成了一个聚合媒体呈现描述(也可称超级媒体呈现描述)。即可利用一个聚合媒体呈现描述(可称超级媒体呈现描述)来描述导览媒体呈现和导览媒体呈现所指向的主媒体呈现。超级媒体呈现描述的引入有利于增强导览媒体呈现和所导览的主媒体呈现之间的关联关系。
在实际应用中,导览单元指向主媒体呈现的方式可以很灵活,导览单元可以直接指向主媒体呈现,也可以间接的指向主媒体呈现。
举例来说,所述K个导览单元中的每个导览单元可以以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。当然,导览单元亦可通过其他的直接指向或间接指向的方式来指向主媒体呈现。例如,所述导览媒体呈现的媒体呈现描述与所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述可被聚合形成了一个聚合媒体呈现描述。这种情况下,所述K个导览单元中的每个导览单元可以以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
可选的,在本发明的一些可能的实施方式中,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量,进一步的,导览单元还可包括字幕分量或其他类型的媒体分量。
本发明通过媒体呈现描述(如DASH标准中的MPD),提供了导览业务的信令机制。媒体呈现描述可告知客户端一个导览业务由哪些导览单元组成,导览单元的分量,导览单元和导览业务的成员媒体呈现之间的关系,导览单元视频分量之间的关系,导览单元的音频分量之间的关系,导览单元的音频分量和视频分量之间的关系等。
可选的,在本发明一些可能实施方式中,所述K个导览单元中的不同导览单元所包括的视频分量为K个视频适配集中的不同视频适配集中的媒体表达,其中,所述K个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述K个视频适配集中的不同视频适配集之间具有选择相容性。例如,所述K个导览单元中导览单元i所包括的视频分量可归属于K个视频适配集中的视频适配集Ci,所述K个导览单元中导览单元j所包括的视频分量可归属于K个视频适配集中的视频适配集Cj,其中,视频适配集Cj和视频适配集Ci为所述K个视频适配集中的两个不同的视频适配集。导览单元j和导览单元i可为K个导览单元中的任意两个导览单元。
其中,所谓选择相容性,表示这些对象可同时被选择,例如若K个视频
适配集中的不同视频适配集之间具有选择相容性,则表示可同时选择K个视频适配集中的多个视频适配集中的媒体表达。
所谓选择互斥性,表示这些对象不支持同时被选择,例如若所述K个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,表示不支持同时选择1个视频适配集中的多个媒体表达,例如假设K个视频适配集中的视频适配集I包括10个多个媒体表达,若视频适配集中的媒体表达之间具有选择互斥性,那么每次只能选择10个媒体表达中的其中1个,而不能同时选择该10个媒体表达中的多个。
可选的,在本发明的一些可能实施方式中,所述K个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述K个视频适配集中的任意一个适配集,所述音频分量适配集与所述K个视频适配集之间具有选择相容性。例如,假设音频适配集包括20个多个媒体表达,若音频适配集中的媒体表达之间具有选择互斥性,那么每次只能选择20个多个媒体表达中的其中1个,而不能同时选择该30个媒体表达中的多个。
可选的,在本发明的另一些可能的实施方式中,所述K个导览单元中的不同导览单元所包括的音频分量为K个音频适配集中的不同音频适配集中的媒体表达,其中,所述K个音频适配集中的不同音频适配集之间具有选择互斥性。
可选的,在本发明的一些可能的实施方式中,所述音频适配集元素中的媒体表达元素,可以包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
可选的,在本发明一些可能实施方式中,包含相同区域说明的媒体表达元素所描述的媒体表达(representation)之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。例如媒体表达元素i所描述的媒体表达为媒体表达ri,媒体表达元素j所描述的媒体表达为媒体表达rj,若媒体表达元素i与媒体表达元素j包含相同区域说明,那么可以表示媒体表达ri与媒体表达rj之间具有关联关系。
可选的,在本发明一些可能实施方式中,媒体表达元素i和适配集元素ci
包含相同区域说明,那么也可能说明媒体表达元素i所描述的媒体表达与适配集元素ci所描述的适配集中的各媒体表达之间具有关联关系,例如媒体表达元素i可为音频媒体表达,而适配集元素ci所描述的适配集中的媒体表达可为视频媒体表达。
可选的,在本发明的一些可能的实施方式中,所述区域说明可为空间关系描述(SRD)。当然,所述区域说明亦可为其他类型的可用于描述位置区域的说明信息。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括K个视频适配集元素,所述K个视频适配集元素与所述K个视频适配集之间一一对应。
其中,所述K个视频适配集元素中包括描述子元素Ci,所述K个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件例如可为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别(schemeIdUri)属性均相同。
可选的,在本发明的一些可能的实施方式中,所述描述子元素Ci可描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。或者,所述描述子元素Ci可描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色,角色例如可能是主要、补充、字幕或翻译配音等。
可选的,在本发明的一些可能的实施方式中,所述描述子元素Ci例如可为基本属性(EssentialProptery)元素或者补充属性(SupplementalProptery)元素或作用说明(Role)元素或者其他元素。
可选的,在本发明的一些可能的实施方式中,若描述子元素Ci为作用说明Role元素,则所述设定共性条件可为视频适配集元素所包括的描述子元素Ci的元素名称可相同、方法识别schemeIdUri属性可相同,且参数(value)属性可相同。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括所述K个视频适配集元素,所述K个视频适配集元素与K个视
频适配集之间一一对应。其中,所述K个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I可为所述K个视频适配集中任意一个视频适配集。
其中,可根据场景需要来确定所述指针在视频适配集元素VI中承载位置。
例如,所述指针可由所述视频适配集元素VI的属性承载。
具体例如,所述指针可由所述视频适配集元素VI的xlink:href属性或其它属性承载。
又例如,所述指针可由所述视频适配集元素VI中的EssentialProptery元素或SupplementalProperty元素承载。
具体例如,所述指针可由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或者所述指针可由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者,所述指针可由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针可由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
具体例如,所述指针可由所述视频适配集元素VI中的EssentialProptery元素的value属性或其它属性承载,或所述指针可由所述视频适配集元素VI之中的SupplementalProperty元素的value属性或其它属性承载。
又例如,所述指针可由所述视频适配集元素VI中的虚拟Representation元素的属性承载,或所述指针可由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符(BaseURL)元素。
又举例来说,所述指针也可由所述视频适配集元素VI中的媒体呈现指向(ReferencedMediaPresentation)元素来承载。ReferencedMediaPresentation元素是新扩展的一种元素,也就是说,可以利用所述视频适配集元素VI中的新扩展出的元素来承载所述指针,所述视频适配集元素VI中新扩展出的承载所述指针的元素的名称并不限于ReferencedMediaPresentation,也可以为其它的元素名称。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的时间结构可不依赖于所述导览媒体呈现中的所述K个导览单元所指向的主媒体呈现的时间结构。其中,导览单元的音频可以是通过对主媒体呈现的音频进行编码而得到,导览单元的视频可以是通过对主媒体呈现的视频进行编码而得到,这可使得导览单元的时间结构和主媒体呈现的时间结构之间没有相关性。
可以看出,本实施例的技术方案中,由于K个导览单元中的每个导览单元可以分别指向一个主媒体呈现,这样就相当于在导览单元和主媒体呈现之间引入的一定的关联关系,这使得在所述K个导览单元的导览单元i被选择的情况下,DASH客户端可获取与导览单元i指向的主媒体呈现j的媒体呈现描述,进而可以根据所述主媒体呈现j的媒体呈现描述获取所述主媒体呈现j进行呈现,可见这有利于实现导览媒体呈现和主媒体呈现之间的较灵活切换,进而实现在基于HTTP的媒体流服务场景下支持视频导览,进而有利于提升用户的高品质体验。
在导览服务中,各个导览单元的视频是平行和并列的,多个导览单元的视频呈现在用户设备的显示屏或者一个窗口,而音频则是互斥的,任何时间只能有一个导览单元的音频被选择和播放,该导览单元的视频画面正是用户的关注焦点所在。导览业务需要相应的信令机制支持。信令告知客户端一个导览业务由哪些导览单元组成,导览单元的分量,导览单元和导览业务的成员媒体呈现之间的关系,导览单元视频分量之间的关系,导览单元的音频分量之间的关系,导览单元的音频分量和视频分量之间的关系。导览业务的信令通过导览媒体呈现的描述文件来表示,实现为描述文件中的一些元素,表达上述媒体分量的媒体表达之间的各种关系。
以下提供了多种使用不同的工具实现导览业务的信令的实施例,例子中的导览业务服务于16个成员媒体呈现。这些MPD示例可以是根据如下的一些DASH规范及其增补修订:
ISO/IEC 23009-1:Part 1:Media presentation description and segment formats,2nd Edition,2014。
ISO/IEC 23009-1:2014/FDAM 1。
Part 1:Media presentation description and segment formats。
AMENDMENT 1:High Profile and Availability Time Synchronization Extended profiles and time synchronization,ISO/IEC 23009-1:2014/FDAM 1Part 1:Media presentation description and segment formats。
ISO/IEC 23009-1:2014/DAM 2。
Part 1:Media presentation description and segment formats。
AMENDMENT 2:Spatial Relationship Description,Generalized URL parameters and other extensions。
为方便起见,每个示例并不是完整的MPD,而是为了说明本发明相关的特点而截取的MPD片段。
示例场景S1、在示例场景S1中示例了导览业务的一种信令机制,告知客户端一个导览业务由哪些导览单元组成,导览单元的分量,导览单元和导览业务的成员媒体呈现之间的关系,导览单元视频分量之间的关系,导览单元的音频分量之间的关系,导览单元的音频分量和视频分量之间的关系。
在这个例子中,用途描述子(Role)元素用于各个适配集元素,包括视频适配集元素和音频适配集元素。这样,适配集元素包含用途描述子(Role)元素,且该描述子元素的参数为“主要成分”(main)的适配集是相容的,可以一起被客户端选择。对于视频,多个视频适配集中的媒体表达——不同的导览单元的视频媒体表达可以一起被选择,在客户端上呈现。对于音频,只有一个音频媒体表达被选择,对应于一个导览单元。
导览单元(的视频)和它所代表的主媒体呈现是通过该导览单元的视频适配集元素的属性表达的,具体地,是属性@xlink:href,该属性本质上是一个指针,用它指向一个远端的主媒体呈现的媒体呈现描述。因为该指向元素不是适配集元素,所以该指向的元素未被嵌入到导览媒体呈现描述中(MPD的数据模型是层次化的,一个元素只包含比其更低级类型的元素,不包含比其更高级类型的元素),这可以用@xlink:show来表述。
现在的DASH标准规范中,@xlink:href指向的元素是和该属性所在的元素的类型一致的,即,如果该属性在适配集元素层次上,它指向的元素是适配
集元素类型。本发明中,扩展了该属性指向元素的类型,用它指向一个媒体呈现。不同于现有规范的另外一点在于,适配集元素既有远端的元素(该属性指向一个远端元素)又包含本地的媒体表达,这在现有DASH规范中是不成立的。
音频媒体表达中通过关联信令建立和同一导览单元的视频媒体表达的关联关系,具体的,通过@associationId属性引用所关联的视频媒体表达的标识——@id的值,@associationType可以不出现,表示未知的关联关系,或者增加一种关联关系的定义,如“伴随(accompany)”。
媒体呈现描述的元素在语义上的差异反映在客户端的行为上。客户端选择多个在导览业务中相同地位的媒体表达,地位是有媒体表达所属的适配集元素中的用途描述子(Role)元素说明,如:用途描述子元素的参数都是main,表明适配集中的媒体表达是媒体呈现中的主要成分。客户端选择多个导览单元的视频媒体表达,从内容服务器请求这些媒体表达的片段,经过处理,一起呈现给用户。诸如这些事情:选择几个视频适配集(视频媒体表达),以什么顺序呈现它们,呈现的位置布局,呈现方式(动态图像序列)等,都是可以由客户端决定的。决定可以根据用户的指令,用户对客户端的配置,客户端的能力等作出。
当用户的关注焦点停留在一个导览单元的视频画面,客户端选择该导览单元的音频媒体表达,获取该音频媒体表达的片段,播放音频。
当用户选择一个导览单元的视频画面,表示要观看对应的主媒体呈现时,客户端切换到主媒体呈现。切换过程可包括以下步骤:客户端首先根据导览单元中的指针,获取主媒体呈现的媒体呈现描述,第二步解析主媒体呈现的媒体呈现描述,选择合适的媒体表达;第三步,从某一时间位置加入主媒体呈现,这实际是定位操作(seeking)。如果导览业务是为直播的媒体呈现服务,那么这一时间位置是发生切换的媒体内容的时间位置,即中断导览业务时间位置。
下面给出示例场景S1中的一个可能的MPD示例。
示例场景S2。在示例场景S2中示例了导览业务的一种信令机制,场景S2示例出了MPD用于表示导览业务的组成。导览说明方法带有一个通用资源识别符(Universal Resource Identifier)作为参数,其中,该通用资源识别符用于指向一个媒体呈现,实际上通过指向这个媒体呈现的媒体呈现描述来指向这个媒体呈现。
为该方法定义一个方法标识,如:urn:mpeg:dash:mosaic:2011。如果基本属性描述子(EssentialProperty),补充属性描述子(SupplementalProperty)的@schemeId取值为该方法标识,可表示包含该描述子的元素:适配集或者媒体表达,是导览业务的组成部分,该描述子的属性@value就是导览业务说明方法的参数,指向主媒体呈现的媒体呈现描述的通用资源识别符。
下面给出示例场景S2中的一个可能的MPD示例。
示例场景S3
示例场景S3中,一个视频适配集(对应于一个导览单元)有两个媒体表达。其中一个是虚拟的媒体表达,不含有任何的片段,而指向导览单元所代表的主媒体呈现,实际上通过指向这个媒体呈现的媒体呈现描述来指向这个媒体呈现。这种情况下,片段的模板不出现在适配集元素层次上,而出现在实际的媒体表达元素中。
下面给出示例场景S3中的一个可能的MPD示例。
示例场景S4
示例场景S4中考虑到严格地与现有DASH中的媒体呈现描述保持兼容可能导致模糊和歧义,如一个被引用的远端单元只在被解析之后才可能知道它的类型,因为一个远端单元只是一个XML对象,它的类型可能是一个媒体呈现描述类型,也可能是一个时间段或者一个适配集。如果放松兼容性限制,在媒体呈现描述中引入一个新的元素说明表示引用一个媒体表达,这样就可以避免歧义。该元素可以归属于不同层级的父元素,如适配集,媒体表达。示例场景S4的例子中媒体呈现引用(ReferencedMediaPresentation)就是一种具体的实现方式。
下面给出示例场景S4中的一个可能的MPD示例。
示例场景S5
示例场景S5中给出了聚合媒体呈现描述的例子。聚合媒体呈现描述是MPD,是MPD的超集。它描述了多个并行的媒体呈现,包括成员媒体呈现和导览媒体呈现。聚合媒体呈现描述中引入了呈现元素,它可以是一个远端的元素,指向一个媒体呈现描述,或者是一个嵌入的媒体呈现描述。
下面的举例中,成员媒体呈现的媒体呈现描述是远端元素,而导览媒体呈现是本地的,是嵌入的媒体呈现描述。
下面给出示例场景S5中的一个可能的MPD示例。
可以理解,上述示例的MPD只为举例说明,本发明实施例的技术方案并不受上述举例的限制。
本发明实施例还提供用于实施上述方案的相关装置。
参见图4,本发明实施例提供一种客户端400,可包括:
第一获取单元410,用于获取导览媒体呈现的媒体呈现描述,其中,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;
第二获取单元420,用于根据所述导览媒体呈现的媒体呈现描述获取所述N个导览单元中的K个导览单元;
呈现单元430,用于呈现所述K个导览单元,所述K个导览单元中的每个导览单元指向一个主媒体呈现,其中,K个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述可以不同于所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。即,所述导览媒体呈现可具有独立的媒体呈现描述,K个导览单元中的每个导览单元所指向主媒体呈现亦可具有独立的且不同于所述导览媒体呈现的媒体呈现描述的媒体呈现描述。例如K个导览单元指向了K个主媒体呈现,而K个主媒体呈现分别具有对应的媒体呈现描述,即K个媒体呈现描述,而导览媒体呈现的媒体呈现描述不同于这K个媒体呈现描述中的任意一个,即导览媒体呈现可由第K+1个媒体呈现描述。
此外,在本发明另一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述与所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描
述可被聚合形成了一个聚合媒体呈现描述(也可称超级媒体呈现描述)。即可利用一个聚合媒体呈现描述(可称超级媒体呈现描述)来描述导览媒体呈现和导览媒体呈现所指向的主媒体呈现。超级媒体呈现描述的引入有利于增强导览媒体呈现和所导览的主媒体呈现之间的关联关系。
在实际应用中,导览单元指向主媒体呈现的方式可以很灵活,导览单元可以直接指向主媒体呈现,也可以间接的指向主媒体呈现。
举例来说,所述K个导览单元中的每个导览单元可以以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。当然,导览单元亦可通过其他的直接指向或间接指向的方式来指向主媒体呈现。例如,所述导览媒体呈现的媒体呈现描述与所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述可被聚合形成了一个聚合媒体呈现描述。这种情况下,所述K个导览单元中的每个导览单元可以以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
可选的,在本发明的一些可能的实施方式中,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量,进一步的,导览单元还可包括字幕分量或其他类型的媒体分量。
本发明通过媒体呈现描述(如DASH标准中的MPD),提供了导览业务的信令机制。媒体呈现描述可告知客户端一个导览业务由哪些导览单元组成,导览单元的分量,导览单元和导览业务的成员媒体呈现之间的关系,导览单元视频分量之间的关系,导览单元的音频分量之间的关系,导览单元的音频分量和视频分量之间的关系等。
可选的,在本发明一些可能实施方式中,所述K个导览单元中的不同导览单元所包括的视频分量为K个视频适配集中的不同视频适配集中的媒体表达,其中,所述K个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述K个视频适配集中的不同视频适配集之间具有选择相容性。例如,所述K个导览单元中导览单元i所包括的视频分量可归属于K个视频适配集中的视频适配集Ci,所述K个导览单元中导览单元j所包括的
视频分量可归属于K个视频适配集中的视频适配集Cj,其中,视频适配集Cj和视频适配集Ci为所述K个视频适配集中的两个不同的视频适配集。导览单元j和导览单元i可为K个导览单元中的任意两个导览单元。
其中,所谓选择相容性,表示这些对象可同时被选择,例如若K个视频适配集中的不同视频适配集之间具有选择相容性,则表示可同时选择K个视频适配集中的多个视频适配集中的媒体表达。
所谓选择互斥性,表示这些对象不支持同时被选择,例如若所述K个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,表示不支持同时选择1个视频适配集中的多个媒体表达,例如假设K个视频适配集中的视频适配集I包括10个多个媒体表达,若视频适配集中的媒体表达之间具有选择互斥性,那么每次只能选择10个媒体表达中的其中1个,而不能同时选择该10个媒体表达中的多个。
可选的,在本发明的一些可能实施方式中,所述K个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述K个视频适配集中的任意一个适配集,所述音频分量适配集与所述K个视频适配集之间具有选择相容性。例如,假设音频适配集包括20个多个媒体表达,若音频适配集中的媒体表达之间具有选择互斥性,那么每次只能选择20个多个媒体表达中的其中1个,而不能同时选择该30个媒体表达中的多个。
可选的,在本发明的另一些可能的实施方式中,所述K个导览单元中的不同导览单元所包括的音频分量为K个音频适配集中的不同音频适配集中的媒体表达,其中,所述K个音频适配集中的不同音频适配集之间具有选择互斥性。
可选的,在本发明的一些可能的实施方式中,所述音频适配集元素中的媒体表达元素,可以包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
可选的,在本发明一些可能实施方式中,包含相同区域说明的媒体表达元素所描述的媒体表达(representation)之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。例如媒体表达元素i
所描述的媒体表达为媒体表达ri,媒体表达元素j所描述的媒体表达为媒体表达rj,若媒体表达元素i与媒体表达元素j包含相同区域说明,那么可以表示媒体表达ri与媒体表达rj之间具有关联关系。
可选的,在本发明一些可能实施方式中,媒体表达元素i和适配集元素ci包含相同区域说明,那么也可能说明媒体表达元素i所描述的媒体表达与适配集元素ci所描述的适配集中的各媒体表达之间具有关联关系,例如媒体表达元素i可为音频媒体表达,而适配集元素ci所描述的适配集中的媒体表达可为视频媒体表达。
可选的,在本发明的一些可能的实施方式中,所述区域说明可为空间关系描述(SRD)。当然,所述区域说明亦可为其他类型的可用于描述位置区域的说明信息。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括K个视频适配集元素,所述K个视频适配集元素与所述K个视频适配集之间一一对应。
其中,所述K个视频适配集元素中包括描述子元素Ci,所述K个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件例如可为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别(schemeIdUri)属性均相同。
可选的,在本发明的一些可能的实施方式中,所述描述子元素Ci可描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。或者,所述描述子元素Ci可描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色,角色例如可能是主要、补充、字幕或翻译配音等。
可选的,在本发明的一些可能的实施方式中,所述描述子元素Ci例如可为基本属性(EssentialProptery)元素或者补充属性(SupplementalProptery)元素或作用说明(Role)元素或者其他元素。
可选的,在本发明的一些可能的实施方式中,若描述子元素Ci为作用说明Role元素,则所述设定共性条件可为视频适配集元素所包括的描述子元素
Ci的元素名称可相同、方法识别schemeIdUri属性可相同,且参数(value)属性可相同。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括所述K个视频适配集元素,所述K个视频适配集元素与K个视频适配集之间一一对应。其中,所述K个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I可为所述K个视频适配集中任意一个视频适配集。
其中,可根据场景需要来确定所述指针在视频适配集元素VI中承载位置。
例如,所述指针可由所述视频适配集元素VI的属性承载。
具体例如,所述指针可由所述视频适配集元素VI的xlink:href属性或其它属性承载。
又例如,所述指针可由所述视频适配集元素VI中的EssentialProptery元素或SupplementalProperty元素承载。
具体例如,所述指针可由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或者所述指针可由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者,所述指针可由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针可由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
具体例如,所述指针可由所述视频适配集元素VI中的EssentialProptery元素的value属性或其它属性承载,或所述指针可由所述视频适配集元素VI之中的SupplementalProperty元素的value属性或其它属性承载。
又例如,所述指针可由所述视频适配集元素VI中的虚拟Representation元素的属性承载,或所述指针可由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符(BaseURL)元素。
又举例来说,所述指针也可由所述视频适配集元素VI中的媒体呈现指向(ReferencedMediaPresentation)元素来承载。ReferencedMediaPresentation元
素是新扩展的一种元素,也就是说,可以利用所述视频适配集元素VI中的新扩展出的元素来承载所述指针,所述视频适配集元素VI中新扩展出的承载所述指针的元素的名称并不限于ReferencedMediaPresentation,也可以为其它的元素名称。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的时间结构可不依赖于所述导览媒体呈现中的所述K个导览单元所指向的主媒体呈现的时间结构。其中,导览单元的音频可以是通过对主媒体呈现的音频进行编码而得到,导览单元的视频可以是通过对主媒体呈现的视频进行编码而得到,这可使得导览单元的时间结构和主媒体呈现的时间结构之间没有相关性。
可选的,在本发明的一些可能的实施方式中,所述呈现单元还用于在关注焦点停留在所述K个导览单元中的导览单元i的情况下,呈现所述导览单元i的音频分量。
可选的,在本发明的一些可能的实施方式中,所述呈现单元还用于在所述K个导览单元中的导览单元i被选择的情况下,获取所述导览单元i所指向的主媒体呈现。进一步的,所述客户端还可呈现所述导览单元i所指向的主媒体呈现。
其中,所述客户端400例如可以为个人电脑,手机,平板电脑,电视机或机顶盒等。
可以理解的是,本实施例的客户端400的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。其中,客户端400可用于实施上述实施例提供的任意一种基于超文本传输协议媒体流的媒体呈现导览方法。
可以看出,本实施例的技术方案中,由于K个导览单元中的每个导览单元可以分别指向一个主媒体呈现,这样就相当于在导览单元和主媒体呈现之间引入的一定的关联关系,这使得在所述K个导览单元的导览单元i被选择的情况下,所述客户端400可获取与导览单元i指向的主媒体呈现j的媒体呈现描述,进而可以根据所述主媒体呈现j的媒体呈现描述获取所述主媒体呈现j进行呈现,可见这有利于实现导览媒体呈现和主媒体呈现之间的较灵活切换,进
而实现在基于HTTP的媒体流服务场景下支持视频导览,进而有利于提升用户的高品质体验。
参见图5,本发明实施例提供的一种客户端500,可包括:
处理器502和存储器503。其中,处理器502和存储器503通过总线501耦合连接。
所述处理器502通过调用所述存储器503中的代码或指令以用于,获取导览媒体呈现的媒体呈现描述,其中,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;根据所述导览媒体呈现的媒体呈现描述获取所述N个导览单元中的K个导览单元;呈现所述K个导览单元,所述K个导览单元中的每个导览单元指向一个主媒体呈现,其中,K个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述可以不同于所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。即,所述导览媒体呈现可具有独立的媒体呈现描述,K个导览单元中的每个导览单元所指向主媒体呈现亦可具有独立的且不同于所述导览媒体呈现的媒体呈现描述的媒体呈现描述。例如K个导览单元指向了K个主媒体呈现,而K个主媒体呈现分别具有对应的媒体呈现描述,即K个媒体呈现描述,而导览媒体呈现的媒体呈现描述不同于这K个媒体呈现描述中的任意一个,即导览媒体呈现可由第K+1个媒体呈现描述。
此外,在本发明另一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述与所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述可被聚合形成了一个聚合媒体呈现描述(也可称超级媒体呈现描述)。即可利用一个聚合媒体呈现描述(可称超级媒体呈现描述)来描述导览媒体呈现和导览媒体呈现所指向的主媒体呈现。超级媒体呈现描述的引入有利于增强导览媒体呈现和所导览的主媒体呈现之间的关联关系。
在实际应用中,导览单元指向主媒体呈现的方式可以很灵活,导览单元可以直接指向主媒体呈现,也可以间接的指向主媒体呈现。
举例来说,所述K个导览单元中的每个导览单元可以以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。当然,导览单元亦可通过其他的直接指向或间接指向的方式来指向主媒体呈现。例如,所述导览媒体呈现的媒体呈现描述与所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述可被聚合形成了一个聚合媒体呈现描述。这种情况下,所述K个导览单元中的每个导览单元可以以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
可选的,在本发明的一些可能的实施方式中,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量,进一步的,导览单元还可包括字幕分量或其他类型的媒体分量。
本发明通过媒体呈现描述(如DASH标准中的MPD),提供了导览业务的信令机制。媒体呈现描述可告知客户端一个导览业务由哪些导览单元组成,导览单元的分量,导览单元和导览业务的成员媒体呈现之间的关系,导览单元视频分量之间的关系,导览单元的音频分量之间的关系,导览单元的音频分量和视频分量之间的关系等。
可选的,在本发明一些可能实施方式中,所述K个导览单元中的不同导览单元所包括的视频分量为K个视频适配集中的不同视频适配集中的媒体表达,其中,所述K个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述K个视频适配集中的不同视频适配集之间具有选择相容性。例如,所述K个导览单元中导览单元i所包括的视频分量可归属于K个视频适配集中的视频适配集Ci,所述K个导览单元中导览单元j所包括的视频分量可归属于K个视频适配集中的视频适配集Cj,其中,视频适配集Cj和视频适配集Ci为所述K个视频适配集中的两个不同的视频适配集。导览单元j和导览单元i可为K个导览单元中的任意两个导览单元。
其中,所谓选择相容性,表示这些对象可同时被选择,例如若K个视频适配集中的不同视频适配集之间具有选择相容性,则表示可同时选择K个视频适配集中的多个视频适配集中的媒体表达。
所谓选择互斥性,表示这些对象不支持同时被选择,例如若所述K个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,表示不支持同时选择1个视频适配集中的多个媒体表达,例如假设K个视频适配集中的视频适配集I包括10个多个媒体表达,若视频适配集中的媒体表达之间具有选择互斥性,那么每次只能选择10个媒体表达中的其中1个,而不能同时选择该10个媒体表达中的多个。
可选的,在本发明的一些可能实施方式中,所述K个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述K个视频适配集中的任意一个适配集,所述音频分量适配集与所述K个视频适配集之间具有选择相容性。例如,假设音频适配集包括20个多个媒体表达,若音频适配集中的媒体表达之间具有选择互斥性,那么每次只能选择20个多个媒体表达中的其中1个,而不能同时选择该30个媒体表达中的多个。
可选的,在本发明的另一些可能的实施方式中,所述K个导览单元中的不同导览单元所包括的音频分量为K个音频适配集中的不同音频适配集中的媒体表达,其中,所述K个音频适配集中的不同音频适配集之间具有选择互斥性。
可选的,在本发明的一些可能的实施方式中,所述音频适配集元素中的媒体表达元素,可以包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
可选的,在本发明一些可能实施方式中,包含相同区域说明的媒体表达元素所描述的媒体表达(representation)之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。例如媒体表达元素i所描述的媒体表达为媒体表达ri,媒体表达元素j所描述的媒体表达为媒体表达rj,若媒体表达元素i与媒体表达元素j包含相同区域说明,那么可以表示媒体表达ri与媒体表达rj之间具有关联关系。
可选的,在本发明一些可能实施方式中,媒体表达元素i和适配集元素ci包含相同区域说明,那么也可能说明媒体表达元素i所描述的媒体表达与适配集元素ci所描述的适配集中的各媒体表达之间具有关联关系,例如媒体表达
元素i可为音频媒体表达,而适配集元素ci所描述的适配集中的媒体表达可为视频媒体表达。
可选的,在本发明的一些可能的实施方式中,所述区域说明可为空间关系描述(SRD)。当然,所述区域说明亦可为其他类型的可用于描述位置区域的说明信息。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括K个视频适配集元素,所述K个视频适配集元素与所述K个视频适配集之间一一对应。
其中,所述K个视频适配集元素中包括描述子元素Ci,所述K个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件例如可为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别(schemeIdUri)属性均相同。
可选的,在本发明的一些可能的实施方式中,所述描述子元素Ci可描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。或者,所述描述子元素Ci可描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色,角色例如可能是主要、补充、字幕或翻译配音等。
可选的,在本发明的一些可能的实施方式中,所述描述子元素Ci例如可为基本属性(EssentialProptery)元素或者补充属性(SupplementalProptery)元素或作用说明(Role)元素或者其他元素。
可选的,在本发明的一些可能的实施方式中,若描述子元素Ci为作用说明Role元素,则所述设定共性条件可为视频适配集元素所包括的描述子元素Ci的元素名称可相同、方法识别schemeIdUri属性可相同,且参数(value)属性可相同。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括所述K个视频适配集元素,所述K个视频适配集元素与K个视频适配集之间一一对应。其中,所述K个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适
配集I可为所述K个视频适配集中任意一个视频适配集。
其中,可根据场景需要来确定所述指针在视频适配集元素VI中承载位置。
例如,所述指针可由所述视频适配集元素VI的属性承载。
具体例如,所述指针可由所述视频适配集元素VI的xlink:href属性或其它属性承载。
又例如,所述指针可由所述视频适配集元素VI中的EssentialProptery元素或SupplementalProperty元素承载。
具体例如,所述指针可由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或者所述指针可由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者,所述指针可由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针可由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
具体例如,所述指针可由所述视频适配集元素VI中的EssentialProptery元素的value属性或其它属性承载,或所述指针可由所述视频适配集元素VI之中的SupplementalProperty元素的value属性或其它属性承载。
又例如,所述指针可由所述视频适配集元素VI中的虚拟Representation元素的属性承载,或所述指针可由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符(BaseURL)元素。
又举例来说,所述指针也可由所述视频适配集元素VI中的媒体呈现指向(ReferencedMediaPresentation)元素来承载。ReferencedMediaPresentation元素是新扩展的一种元素,也就是说,可以利用所述视频适配集元素VI中的新扩展出的元素来承载所述指针,所述视频适配集元素VI中新扩展出的承载所述指针的元素的名称并不限于ReferencedMediaPresentation,也可以为其它的元素名称。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的时间结构可不依赖于所述导览媒体呈现中的所述K个导览单元所指向的主媒体呈现
的时间结构。其中,导览单元的音频可以是通过对主媒体呈现的音频进行编码而得到,导览单元的视频可以是通过对主媒体呈现的视频进行编码而得到,这可使得导览单元的时间结构和主媒体呈现的时间结构之间没有相关性。
可选的,在本发明的一些可能的实施方式中,所述处理器还用于在关注焦点停留在所述K个导览单元中的导览单元i的情况下,呈现所述导览单元i的音频分量。
可选的,在本发明的一些可能的实施方式中,所述处理器还用于在所述K个导览单元中的导览单元i被选择的情况下,获取所述导览单元i所指向的主媒体呈现。进一步的,所述客户端还可呈现所述导览单元i所指向的主媒体呈现。
其中,所述客户端500例如可以为个人电脑,手机,平板电脑,电视机或机顶盒等。
可以理解的是,本实施例的客户端500的的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。其中,客户端500可用于实施上述实施例提供的任意一种基于超文本传输协议媒体流的媒体呈现导览方法。
可以看出,本实施例的技术方案中,由于K个导览单元中的每个导览单元可以分别指向一个主媒体呈现,这样就相当于在导览单元和主媒体呈现之间引入的一定的关联关系,这使得在所述K个导览单元的导览单元i被选择的情况下,所述客户端500可获取与导览单元i指向的主媒体呈现j的媒体呈现描述,进而可以根据所述主媒体呈现j的媒体呈现描述获取所述主媒体呈现j进行呈现,可见这有利于实现导览媒体呈现和主媒体呈现之间的较灵活切换,进而实现在基于HTTP的媒体流服务场景下支持视频导览,进而有利于提升用户的高品质体验。
参见图6,本发明实施例提供一种服务器600,可包括:
确定单元610,用于确定导览媒体呈现包括的N个导览单元。
生成单元620,用于生成导览媒体呈现的媒体呈现描述,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为
大于1的整数;所述N个导览单元中的每个导览单元指向一个主媒体呈现,所述N个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
其中,N个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。也就是说,导览单元的媒体表达的呈现质量低于导览单元所表示的主媒体呈现的呈现质量。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述可以不同于所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。即,所述导览媒体呈现可具有独立的媒体呈现描述,N个导览单元中的每个导览单元所指向主媒体呈现亦可具有独立的且不同于所述导览媒体呈现的媒体呈现描述的媒体呈现描述。例如N个导览单元指向了N个主媒体呈现,而N个主媒体呈现分别具有对应的媒体呈现描述,即N个媒体呈现描述,而导览媒体呈现的媒体呈现描述不同于这N个媒体呈现描述中的任意一个,即导览媒体呈现可由第K+1个媒体呈现描述。
此外,在本发明另一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述与所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述可被聚合形成了一个聚合媒体呈现描述(也可称超级媒体呈现描述)。即可利用一个聚合媒体呈现描述(可称超级媒体呈现描述)来描述导览媒体呈现和导览媒体呈现所指向的主媒体呈现。超级媒体呈现描述的引入有利于增强导览媒体呈现和所导览的主媒体呈现之间的关联关系。
在实际应用中,导览单元指向主媒体呈现的方式可以很灵活,导览单元可以直接指向主媒体呈现,也可以间接的指向主媒体呈现。
举例来说,所述N个导览单元中的每个导览单元可以以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。当然,导览单元亦可通过其他的直接指向或间接指向的方式来指向主媒体呈现。例如,所述导览媒体呈现的媒体呈现描述与所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述可被聚合形成了一个聚合媒体呈现描述。这种情况下,所述N个导览单元中的每个导览单元可以以引用所述聚合媒体呈现描述中的呈现
元素的方式来指向一个主媒体呈现。
可选的,在本发明的一些可能的实施方式中,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量,进一步的,导览单元还可包括字幕分量或其他类型的媒体分量。
本发明通过媒体呈现描述(如DASH标准中的MPD),提供了导览业务的信令机制。媒体呈现描述可告知客户端一个导览业务由哪些导览单元组成,导览单元的分量,导览单元和导览业务的成员媒体呈现之间的关系,导览单元视频分量之间的关系,导览单元的音频分量之间的关系,导览单元的音频分量和视频分量之间的关系等。
可选的,在本发明一些可能实施方式中,所述N个导览单元中的不同导览单元所包括的视频分量为N个视频适配集中的不同视频适配集中的媒体表达,其中,所述N个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述N个视频适配集中的不同视频适配集之间具有选择相容性。例如,所述N个导览单元中导览单元i所包括的视频分量可归属于N个视频适配集中的视频适配集Ci,所述N个导览单元中导览单元j所包括的视频分量可归属于N个视频适配集中的视频适配集Cj,其中,视频适配集Cj和视频适配集Ci为所述N个视频适配集中的两个不同的视频适配集。导览单元j和导览单元i可为N个导览单元中的任意两个导览单元。
其中,所谓选择相容性,表示这些对象可同时被选择,例如若N个视频适配集中的不同视频适配集之间具有选择相容性,则表示可同时选择N个视频适配集中的多个视频适配集中的媒体表达。
所谓选择互斥性,表示这些对象不支持同时被选择,例如若所述N个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,表示不支持同时选择1个视频适配集中的多个媒体表达,例如假设N个视频适配集中的视频适配集I包括10个多个媒体表达,若视频适配集中的媒体表达之间具有选择互斥性,那么每次只能选择10个媒体表达中的其中1个,而不能同时选择该10个媒体表达中的多个。
可选的,在本发明的一些可能实施方式中,所述N个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述N个视频适配集中的任意一个适配集,所述音频分量适配集与所述N个视频适配集之间具有选择相容性。例如,假设音频适配集包括20个多个媒体表达,若音频适配集中的媒体表达之间具有选择互斥性,那么每次只能选择20个多个媒体表达中的其中1个,而不能同时选择该30个媒体表达中的多个。
可选的,在本发明的另一些可能的实施方式中,所述N个导览单元中的不同导览单元所包括的音频分量为N个音频适配集中的不同音频适配集中的媒体表达,其中,所述N个音频适配集中的不同音频适配集之间具有选择互斥性。
可选的,在本发明的一些可能的实施方式中,所述音频适配集元素中的媒体表达元素,可以包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
可选的,在本发明一些可能实施方式中,包含相同区域说明的媒体表达元素所描述的媒体表达(representation)之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。例如媒体表达元素i所描述的媒体表达为媒体表达ri,媒体表达元素j所描述的媒体表达为媒体表达rj,若媒体表达元素i与媒体表达元素j包含相同区域说明,那么可以表示媒体表达ri与媒体表达rj之间具有关联关系。
可选的,在本发明一些可能实施方式中,媒体表达元素i和适配集元素ci包含相同区域说明,那么也可能说明媒体表达元素i所描述的媒体表达与适配集元素ci所描述的适配集中的各媒体表达之间具有关联关系,例如媒体表达元素i可为音频媒体表达,而适配集元素ci所描述的适配集中的媒体表达可为视频媒体表达。
可选的,在本发明的一些可能的实施方式中,所述区域说明可为空间关系描述(SRD)。当然,所述区域说明亦可为其他类型的可用于描述位置区域的说明信息。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈
现描述中包括N个视频适配集元素,所述N个视频适配集元素与所述N个视频适配集之间一一对应。
其中,所述N个视频适配集元素中包括描述子元素Ci,所述N个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件例如可为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别(schemeIdUri)属性均相同。
可选的,在本发明的一些可能的实施方式中,所述描述子元素Ci可描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。或者,所述描述子元素Ci可描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色,角色例如可能是主要、补充、字幕或翻译配音等。
可选的,在本发明的一些可能的实施方式中,所述描述子元素Ci例如可为基本属性(EssentialProptery)元素或者补充属性(SupplementalProptery)元素或作用说明(Role)元素或者其他元素。
可选的,在本发明的一些可能的实施方式中,若描述子元素Ci为作用说明Role元素,则所述设定共性条件可为视频适配集元素所包括的描述子元素Ci的元素名称可相同、方法识别schemeIdUri属性可相同,且参数(value)属性可相同。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括所述N个视频适配集元素,所述N个视频适配集元素与N个视频适配集之间一一对应。其中,所述N个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I可为所述N个视频适配集中任意一个视频适配集。
其中,可根据场景需要来确定所述指针在视频适配集元素VI中承载位置。
例如,所述指针可由所述视频适配集元素VI的属性承载。
具体例如,所述指针可由所述视频适配集元素VI的xlink:href属性或其它属性承载。
又例如,所述指针可由所述视频适配集元素VI中的EssentialProptery元素
或SupplementalProperty元素承载。
具体例如,所述指针可由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或者所述指针可由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者,所述指针可由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针可由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
具体例如,所述指针可由所述视频适配集元素VI中的EssentialProptery元素的value属性或其它属性承载,或所述指针可由所述视频适配集元素VI之中的SupplementalProperty元素的value属性或其它属性承载。
又例如,所述指针可由所述视频适配集元素VI中的虚拟Representation元素的属性承载,或所述指针可由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符(BaseURL)元素。
又举例来说,所述指针也可由所述视频适配集元素VI中的媒体呈现指向(ReferencedMediaPresentation)元素来承载。ReferencedMediaPresentation元素是新扩展的一种元素,也就是说,可以利用所述视频适配集元素VI中的新扩展出的元素来承载所述指针,所述视频适配集元素VI中新扩展出的承载所述指针的元素的名称并不限于ReferencedMediaPresentation,也可以为其它的元素名称。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的时间结构可不依赖于所述导览媒体呈现中的所述N个导览单元所指向的主媒体呈现的时间结构。其中,导览单元的音频可以是通过对主媒体呈现的音频进行编码而得到,导览单元的视频可以是通过对主媒体呈现的视频进行编码而得到,这可使得导览单元的时间结构和主媒体呈现的时间结构之间没有相关性。
可以理解的是,本实施例的服务器600的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。其中,服务器600可用于实施上述实施例提供的任意一
种基于超文本传输协议媒体流的媒体呈现导览方法。
其中,服务器600可为内容服务器或其他服务器。
可以看出,本实施例的技术方案中,服务器600生成的导览媒体呈现的媒体呈现描述所描述的导览媒体呈现包括的N个导览单元,由于N个导览单元中的每个导览单元可以分别指向一个主媒体呈现,这样就相当于在导览单元和主媒体呈现之间引入的一定的关联关系,这使得客户端在所述N个导览单元的导览单元i被选择的情况下,所述客户端可获取与导览单元i指向的主媒体呈现j的媒体呈现描述,进而可以根据所述主媒体呈现j的媒体呈现描述获取所述主媒体呈现j进行呈现,可见这中方案为实现导览媒体呈现和主媒体呈现之间的较灵活切换奠定了基础,进而为实现在基于HTTP的媒体流服务场景下支持视频导览奠定了基础。
参见图7,本发明实施例提供的一种服务器700,可包括:
处理器702和存储器703。其中,处理器702和存储器703通过总线701耦合连接。
所述处理器702通过调用所述存储器703中的代码或指令以用于,确定导览媒体呈现包括的N个导览单元;生成导览媒体呈现的媒体呈现描述,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;所述N个导览单元中的每个导览单元指向一个主媒体呈现,所述N个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
其中,N个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。也就是说,导览单元的媒体表达的呈现质量低于导览单元所表示的主媒体呈现的呈现质量。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述可以不同于所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。即,所述导览媒体呈现可具有独立的媒体呈现描述,N个导览单元中的每个导览单元所指向主媒体呈现亦可具有独立的且不同于所述导览
媒体呈现的媒体呈现描述的媒体呈现描述。例如N个导览单元指向了N个主媒体呈现,而N个主媒体呈现分别具有对应的媒体呈现描述,即N个媒体呈现描述,而导览媒体呈现的媒体呈现描述不同于这N个媒体呈现描述中的任意一个,即导览媒体呈现可由第K+1个媒体呈现描述。
此外,在本发明另一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述与所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述可被聚合形成了一个聚合媒体呈现描述(也可称超级媒体呈现描述)。即可利用一个聚合媒体呈现描述(可称超级媒体呈现描述)来描述导览媒体呈现和导览媒体呈现所指向的主媒体呈现。超级媒体呈现描述的引入有利于增强导览媒体呈现和所导览的主媒体呈现之间的关联关系。
在实际应用中,导览单元指向主媒体呈现的方式可以很灵活,导览单元可以直接指向主媒体呈现,也可以间接的指向主媒体呈现。
举例来说,所述N个导览单元中的每个导览单元可以以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。当然,导览单元亦可通过其他的直接指向或间接指向的方式来指向主媒体呈现。例如,所述导览媒体呈现的媒体呈现描述与所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述可被聚合形成了一个聚合媒体呈现描述。这种情况下,所述N个导览单元中的每个导览单元可以以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
可选的,在本发明的一些可能的实施方式中,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量,进一步的,导览单元还可包括字幕分量或其他类型的媒体分量。
本发明通过媒体呈现描述(如DASH标准中的MPD),提供了导览业务的信令机制。媒体呈现描述可告知客户端一个导览业务由哪些导览单元组成,导览单元的分量,导览单元和导览业务的成员媒体呈现之间的关系,导览单元视频分量之间的关系,导览单元的音频分量之间的关系,导览单元的音频分量和视频分量之间的关系等。
可选的,在本发明一些可能实施方式中,所述N个导览单元中的不同导览单元所包括的视频分量为N个视频适配集中的不同视频适配集中的媒体表达,其中,所述N个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述N个视频适配集中的不同视频适配集之间具有选择相容性。例如,所述N个导览单元中导览单元i所包括的视频分量可归属于N个视频适配集中的视频适配集Ci,所述N个导览单元中导览单元j所包括的视频分量可归属于N个视频适配集中的视频适配集Cj,其中,视频适配集Cj和视频适配集Ci为所述N个视频适配集中的两个不同的视频适配集。导览单元j和导览单元i可为N个导览单元中的任意两个导览单元。
其中,所谓选择相容性,表示这些对象可同时被选择,例如若N个视频适配集中的不同视频适配集之间具有选择相容性,则表示可同时选择N个视频适配集中的多个视频适配集中的媒体表达。
所谓选择互斥性,表示这些对象不支持同时被选择,例如若所述N个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,表示不支持同时选择1个视频适配集中的多个媒体表达,例如假设N个视频适配集中的视频适配集I包括10个多个媒体表达,若视频适配集中的媒体表达之间具有选择互斥性,那么每次只能选择10个媒体表达中的其中1个,而不能同时选择该10个媒体表达中的多个。
可选的,在本发明的一些可能实施方式中,所述N个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述N个视频适配集中的任意一个适配集,所述音频分量适配集与所述N个视频适配集之间具有选择相容性。例如,假设音频适配集包括20个多个媒体表达,若音频适配集中的媒体表达之间具有选择互斥性,那么每次只能选择20个多个媒体表达中的其中1个,而不能同时选择该30个媒体表达中的多个。
可选的,在本发明的另一些可能的实施方式中,所述N个导览单元中的不同导览单元所包括的音频分量为N个音频适配集中的不同音频适配集中的媒体表达,其中,所述N个音频适配集中的不同音频适配集之间具有选择互斥性。
可选的,在本发明的一些可能的实施方式中,所述音频适配集元素中的媒体表达元素,可以包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
可选的,在本发明一些可能实施方式中,包含相同区域说明的媒体表达元素所描述的媒体表达(representation)之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。例如媒体表达元素i所描述的媒体表达为媒体表达ri,媒体表达元素j所描述的媒体表达为媒体表达rj,若媒体表达元素i与媒体表达元素j包含相同区域说明,那么可以表示媒体表达ri与媒体表达rj之间具有关联关系。
可选的,在本发明一些可能实施方式中,媒体表达元素i和适配集元素ci包含相同区域说明,那么也可能说明媒体表达元素i所描述的媒体表达与适配集元素ci所描述的适配集中的各媒体表达之间具有关联关系,例如媒体表达元素i可为音频媒体表达,而适配集元素ci所描述的适配集中的媒体表达可为视频媒体表达。
可选的,在本发明的一些可能的实施方式中,所述区域说明可为空间关系描述(SRD)。当然,所述区域说明亦可为其他类型的可用于描述位置区域的说明信息。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括N个视频适配集元素,所述N个视频适配集元素与所述N个视频适配集之间一一对应。
其中,所述N个视频适配集元素中包括描述子元素Ci,所述N个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件例如可为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别(schemeIdUri)属性均相同。
可选的,在本发明的一些可能的实施方式中,所述描述子元素Ci可描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。或者,所述描述子元素Ci可描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现
的角色,角色例如可能是主要、补充、字幕或翻译配音等。
可选的,在本发明的一些可能的实施方式中,所述描述子元素Ci例如可为基本属性(EssentialProptery)元素或者补充属性(SupplementalProptery)元素或作用说明(Role)元素或者其他元素。
可选的,在本发明的一些可能的实施方式中,若描述子元素Ci为作用说明Role元素,则所述设定共性条件可为视频适配集元素所包括的描述子元素Ci的元素名称可相同、方法识别schemeIdUri属性可相同,且参数(value)属性可相同。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的媒体呈现描述中包括所述N个视频适配集元素,所述N个视频适配集元素与N个视频适配集之间一一对应。其中,所述N个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I可为所述N个视频适配集中任意一个视频适配集。
其中,可根据场景需要来确定所述指针在视频适配集元素VI中承载位置。
例如,所述指针可由所述视频适配集元素VI的属性承载。
具体例如,所述指针可由所述视频适配集元素VI的xlink:href属性或其它属性承载。
又例如,所述指针可由所述视频适配集元素VI中的EssentialProptery元素或SupplementalProperty元素承载。
具体例如,所述指针可由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或者所述指针可由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者,所述指针可由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针可由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
具体例如,所述指针可由所述视频适配集元素VI中的EssentialProptery元素的value属性或其它属性承载,或所述指针可由所述视频适配集元素VI之中的SupplementalProperty元素的value属性或其它属性承载。
又例如,所述指针可由所述视频适配集元素VI中的虚拟Representation
元素的属性承载,或所述指针可由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符(BaseURL)元素。
又举例来说,所述指针也可由所述视频适配集元素VI中的媒体呈现指向(ReferencedMediaPresentation)元素来承载。ReferencedMediaPresentation元素是新扩展的一种元素,也就是说,可以利用所述视频适配集元素VI中的新扩展出的元素来承载所述指针,所述视频适配集元素VI中新扩展出的承载所述指针的元素的名称并不限于ReferencedMediaPresentation,也可以为其它的元素名称。
可选的,在本发明的一些可能的实施方式中,所述导览媒体呈现的时间结构可不依赖于所述导览媒体呈现中的所述N个导览单元所指向的主媒体呈现的时间结构。其中,导览单元的音频可以是通过对主媒体呈现的音频进行编码而得到,导览单元的视频可以是通过对主媒体呈现的视频进行编码而得到,这可使得导览单元的时间结构和主媒体呈现的时间结构之间没有相关性。
可以理解的是,本实施例的服务器700的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。其中,服务器700可用于实施上述实施例提供的任意一种基于超文本传输协议媒体流的媒体呈现导览方法。
其中,服务器700可为内容服务器或其他服务器。
可以看出,本实施例的技术方案中,服务器700生成的导览媒体呈现的媒体呈现描述所描述的导览媒体呈现包括的N个导览单元,由于N个导览单元中的每个导览单元可以分别指向一个主媒体呈现,这样就相当于在导览单元和主媒体呈现之间引入的一定的关联关系,这使得客户端在所述N个导览单元的导览单元i被选择的情况下,所述客户端可获取与导览单元i指向的主媒体呈现j的媒体呈现描述,进而可以根据所述主媒体呈现j的媒体呈现描述获取所述主媒体呈现j进行呈现,可见这中方案为实现导览媒体呈现和主媒体呈现之间的较灵活切换奠定了基础,进而为实现在基于HTTP的媒体流服务场景下
支持视频导览奠定了基础。
参见图8,本发明实施例还提供一种通信系统,可包括:
客户端810和与所述客户端通信连接的内容服务器820;
其中,所述客户端810,用于从内容服务器820获取导览媒体呈现的媒体呈现描述,其中,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;根据所述导览媒体呈现的媒体呈现描述从内容服务器820获取所述N个导览单元中的K个导览单元;呈现所述K个导览单元,所述K个导览单元中的每个导览单元指向一个主媒体呈现,其中,K个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
其中,所述客户端810例如可为上述实施例提供的任意一种客户端。
上述装置和系统内的各模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任意一种方法的部分或全部步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可能可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或者一些特征可以忽略
或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明各个实施例上述方法的全部或部分步骤。其中,而前述的存储介质可包括:U盘、移动硬盘、磁碟、光盘、只读存储器(ROM,Read-Only Memory)或者随机存取存储器(RAM,Random Access Memory)等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (104)
- 一种基于超文本传输协议媒体流的媒体呈现导览方法,其特征在于,包括:客户端获取导览媒体呈现的媒体呈现描述,其中,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;所述客户端根据所述导览媒体呈现的媒体呈现描述获取所述N个导览单元中的K个导览单元;所述客户端呈现所述K个导览单元,所述K个导览单元中的每个导览单元指向一个主媒体呈现,其中,K个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
- 根据权利要求1所述的方法,其特征在于,所述导览媒体呈现的媒体呈现描述不同于所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。
- 根据权利要求2所述的方法,其特征在于,所述K个导览单元中的每个导览单元以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。
- 根据权利要求1所述的方法,其特征在于,所述导览媒体呈现的媒体呈现描述与所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述被聚合形成了一个聚合媒体呈现描述。
- 根据权利要求4所述的方法,其特征在于,所述K个导览单元中的每个导览单元以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
- 根据权利要求1至5任一项所述的方法,其特征在于,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量。
- 根据权利要求6所述的方法,其特征在于,所述K个导览单元中的不同导览单元所包括的视频分量为K个视频适配集中的不同视频适配集中的媒 体表达,其中,所述K个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述K个视频适配集中的不同视频适配集之间具有选择相容性。
- 根据权利要求7所述的方法,其特征在于,所述K个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述K个适配集中的任意一个适配集,所述音频分量适配集与所述K个视频适配集之间具有选择相容性;或者,所述K个导览单元中的不同导览单元所包括的音频分量为K个音频适配集中的不同音频适配集中的媒体表达,其中,所述K个音频适配集中的不同音频适配集之间具有选择互斥性。
- 根据权利要求8所述的方法,其特征在于,所述音频适配集元素中的媒体表达元素,包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
- 根据权利要求9所述的方法,其特征在于,包含相同区域说明的媒体表达元素所描述的媒体表达之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。
- 根据权利要求9或10所述的方法,其特征在于,所述区域说明为SRD空间关系描述。
- 根据权利要求7至11任一项所述的方法,其特征在于,所述导览媒体呈现的媒体呈现描述中包括K个视频适配集元素,所述K个视频适配集元素与所述K个视频适配集之间一一对应;其中,所述K个视频适配集元素中包括描述子元素Ci,所述K个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别schemeIdUri属性均相同。
- 根据权利要求12所述的方法,其特征在于,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达 为导览媒体呈现的组成部分。
- 根据权利要求12所述的方法,其特征在于,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色。
- 根据权利要求13或14所述的方法,其特征在于,所述描述子元素Ci为作用说明Role元素或者基本属性EssentialProptery元素或者补充属性SupplementalProptery元素。
- 根据权利要求15所述的方法,其特征在于,若描述子元素Ci为作用说明Role元素,则所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称相同、方法识别schemeIdUri属性相同,且参数value属性相同。
- 根据权利要求5至16任一项所述的方法,其特征在于,所述导览媒体呈现的媒体呈现描述中包括所述K个视频适配集元素,所述K个视频适配集元素与K个视频适配集之间一一对应,其中,所述K个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I为所述K个视频适配集中任意一个视频适配集。
- 根据权利要求17所述的方法,其特征在于,所述指针由所述视频适配集元素VI的属性承载。
- 根据权利要求18所述的方法,其特征在于,所述指针由所述视频适配集元素VI的xlink:href属性承载。
- 根据权利要求17所述的方法,其特征在于,所述指针由所述视频适配集元素VI中的基本属性EssentialProptery元素或补充属性SupplementalProperty元素承载。
- 根据权利要求17所述的方法,其特征在于,所述指针由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或所述指针由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所 述指针由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
- 根据权利要求21所述的方法,其特征在于,所述指针由所述视频适配集元素VI中的EssentialProptery元素的value属性承载,或者所述指针由所述视频适配集元素VI之中的SupplementalProperty元素的value属性承载。
- 根据权利要求17所述的方法,其特征在于,所述指针由所述视频适配集元素VI中的虚拟媒体表达Representation元素的属性承载,或,所述指针由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符BaseURL元素。
- 根据权利要求17所述的方法,其特征在于,所述指针由所述视频适配集元素VI中的媒体呈现指向ReferencedMediaPresentation元素来承载。
- 根据权利要求1至24任意一项所述的方法,其特征在于,所述导览媒体呈现的时间结构不依赖于所述导览媒体呈现中的所述K个导览单元所指向的主媒体呈现的时间结构。
- 根据权利要求1至25任意一项所述的方法,其特征在于,在关注焦点停留在所述K个导览单元中的导览单元i的情况下,所述客户端呈现所述导览单元i的音频分量。
- 根据权利要求1至26任意一项所述的方法,其特征在于,所述方法还包括:在所述K个导览单元中的导览单元i被选择的情况下,所述客户端获取所述导览单元i所指向的主媒体呈现。
- 一种基于超文本传输协议媒体流的媒体呈现导览方法,其特征在于,包括:确定导览媒体呈现包括的N个导览单元;生成导览媒体呈现的媒体呈现描述,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;所述N个导览单元中的每个导览单元指向一个主媒体呈现,其中,所述N个导览 单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
- 根据权利要求28所述的方法,其特征在于,所述导览媒体呈现的媒体呈现描述不同于所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。
- 根据权利要求29所述的方法,其特征在于,所述N个导览单元中的每个导览单元以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。
- 根据权利要求28所述的方法,其特征在于,所述导览媒体呈现的媒体呈现描述与所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述被聚合形成了一个聚合媒体呈现描述。
- 根据权利要求31所述的方法,其特征在于,所述N个导览单元中的每个导览单元以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
- 根据权利要求28至32任一项所述的方法,其特征在于,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量。
- 根据权利要求33所述的方法,其特征在于,所述N个导览单元中的不同导览单元所包括的视频分量为N个视频适配集中的不同视频适配集中的媒体表达,其中,所述N个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述N个视频适配集中的不同视频适配集之间具有选择相容性。
- 根据权利要求34所述的方法,其特征在于,所述N个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述N个适配集中的任意一个适配集,所述音频分量适配集与所述N个视频适配集之间具有选择相容性;或者,所述N个导览单元中的不同导览单元所包括的音频分量为N个音频适配 集中的不同音频适配集中的媒体表达,其中,所述N个音频适配集中的不同音频适配集之间具有选择互斥性。
- 根据权利要求35所述的方法,其特征在于,所述音频适配集元素中的媒体表达元素,包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
- 根据权利要求36所述的方法,其特征在于,包含相同区域说明的媒体表达元素所描述的媒体表达之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。
- 根据权利要求36或37所述的方法,其特征在于,所述区域说明为SRD空间关系描述。
- 根据权利要求34至38任一项所述的方法,其特征在于,所述导览媒体呈现的媒体呈现描述中包括N个视频适配集元素,所述N个视频适配集元素与所述N个视频适配集之间一一对应;其中,所述N个视频适配集元素中包括描述子元素Ci,所述N个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称和方法识别schemeIdUri属性均相同。
- 根据权利要求39所述的方法,其特征在于,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。
- 根据权利要求39所述的方法,其特征在于,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色。
- 根据权利要求40或41所述的方法,其特征在于,所述描述子元素Ci为作用说明Role元素或者基本属性EssentialProptery元素或者补充属性SupplementalProptery元素。
- 根据权利要求42所述的方法,其特征在于,若描述子元素Ci为作用说明Role元素,则所述设定共性条件为视频适配 集元素所包括的描述子元素Ci的元素名称相同、方法识别schemeIdUri属性相同,且参数value属性相同。
- 根据权利要求32至43任一项所述的方法,其特征在于,所述导览媒体呈现的媒体呈现描述中包括所述N个视频适配集元素,所述N个视频适配集元素与N个视频适配集之间一一对应,其中,所述N个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I为所述N个视频适配集中任意一个视频适配集。
- 根据权利要求44所述的方法,其特征在于,所述指针由所述视频适配集元素VI的属性承载。
- 根据权利要求45所述的方法,其特征在于,所述指针由所述视频适配集元素VI的xlink:href属性承载。
- 根据权利要求44所述的方法,其特征在于,所述指针由所述视频适配集元素VI中的基本属性EssentialProptery元素或补充属性SupplementalProperty元素承载。
- 根据权利要求44所述的方法,其特征在于,所述指针由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或所述指针由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
- 根据权利要求48所述的方法,其特征在于,所述指针由所述视频适配集元素VI中的EssentialProptery元素的value属性承载,或者所述指针由所述视频适配集元素VI之中的SupplementalProperty元素的value属性承载。
- 根据权利要求44所述的方法,其特征在于,所述指针由所述视频适配集元素VI中的虚拟媒体表达Representation元素的属性承载,或,所述指针由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符BaseURL元素。
- 根据权利要求44所述的方法,其特征在于,所述指针由所述视频适配集元素VI中的媒体呈现指向ReferencedMediaPresentation元素来承载。
- 根据权利要求28至51任意一项所述的方法,其特征在于,所述导览媒体呈现的时间结构不依赖于所述导览媒体呈现中的所述N个导览单元所指向的主媒体呈现的时间结构。
- 一种客户端,其特征在于,包括:第一获取单元,用于获取导览媒体呈现的媒体呈现描述,其中,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于1的整数;第二获取单元,用于根据所述导览媒体呈现的媒体呈现描述获取所述N个导览单元中的K个导览单元;呈现单元,用于呈现所述K个导览单元,所述K个导览单元中的每个导览单元指向一个主媒体呈现,其中,K个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
- 根据权利要求53所述的客户端,其特征在于,所述导览媒体呈现的媒体呈现描述不同于所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。
- 根据权利要求54所述的客户端,其特征在于,所述K个导览单元中的每个导览单元以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。
- 根据权利要求53所述的客户端,其特征在于,所述导览媒体呈现的媒体呈现描述与所述K个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述被聚合形成了一个聚合媒体呈现描述。
- 根据权利要求56所述的客户端,其特征在于,所述K个导览单元中的每个导览单元以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
- 根据权利要求53至57任一项所述的客户端,其特征在于,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每 个导览单元包括音频分量和视频分量。
- 根据权利要求58所述的客户端,其特征在于,所述K个导览单元中的不同导览单元所包括的视频分量为K个视频适配集中的不同视频适配集中的媒体表达,其中,所述K个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述K个视频适配集中的不同视频适配集之间具有选择相容性。
- 根据权利要求59所述的客户端,其特征在于,所述K个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述K个适配集中的任意一个适配集,所述音频分量适配集与所述K个视频适配集之间具有选择相容性;或者,所述K个导览单元中的不同导览单元所包括的音频分量为K个音频适配集中的不同音频适配集中的媒体表达,其中,所述K个音频适配集中的不同音频适配集之间具有选择互斥性。
- 根据权利要求60所述的客户端,其特征在于,所述音频适配集元素中的媒体表达元素,包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
- 根据权利要求61所述的客户端,其特征在于,包含相同区域说明的媒体表达元素所描述的媒体表达之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。
- 根据权利要求61或62所述的客户端,其特征在于,所述区域说明为SRD空间关系描述。
- 根据权利要求58至63任一项所述的客户端,其特征在于,所述导览媒体呈现的媒体呈现描述中包括K个视频适配集元素,所述K个视频适配集元素与所述K个视频适配集之间一一对应;其中,所述K个视频适配集元素中包括描述子元素Ci,所述K个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称和客户端识别schemeIdUri 属性均相同。
- 根据权利要求64所述的客户端,其特征在于,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。
- 根据权利要求64所述的客户端,其特征在于,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色。
- 根据权利要求65或66所述的客户端,其特征在于,所述描述子元素Ci为作用说明Role元素或者基本属性EssentialProptery元素或者补充属性SupplementalProptery元素。
- 根据权利要求67所述的客户端,其特征在于,若描述子元素Ci为作用说明Role元素,则所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称相同、客户端识别schemeIdUri属性相同,且参数value属性相同。
- 根据权利要求57至68任一项所述的客户端,其特征在于,所述导览媒体呈现的媒体呈现描述中包括所述K个视频适配集元素,所述K个视频适配集元素与K个视频适配集之间一一对应,其中,所述K个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I为所述K个视频适配集中任意一个视频适配集。
- 根据权利要求69所述的客户端,其特征在于,所述指针由所述视频适配集元素VI的属性承载。
- 根据权利要求70所述的客户端,其特征在于,所述指针由所述视频适配集元素VI的xlink:href属性承载。
- 根据权利要求70所述的客户端,其特征在于,所述指针由所述视频适配集元素VI中的基本属性EssentialProptery元素或补充属性SupplementalProperty元素承载。
- 根据权利要求70所述的客户端,其特征在于,所述指针由所述视频 适配集元素VI之中的EssentialProptery元素中的子元素承载,或所述指针由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
- 根据权利要求73所述的客户端,其特征在于,所述指针由所述视频适配集元素VI中的EssentialProptery元素的value属性承载,或者所述指针由所述视频适配集元素VI之中的SupplementalProperty元素的value属性承载。
- 根据权利要求70所述的客户端,其特征在于,所述指针由所述视频适配集元素VI中的虚拟媒体表达Representation元素的属性承载,或,所述指针由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模版元素、媒体片段列表元素和基础统一资源定位符BaseURL元素。
- 根据权利要求70所述的客户端,其特征在于,所述指针由所述视频适配集元素VI中的媒体呈现指向ReferencedMediaPresentation元素来承载。
- 根据权利要求53至76任意一项所述的客户端,其特征在于,所述导览媒体呈现的时间结构不依赖于所述导览媒体呈现中的所述K个导览单元所指向的主媒体呈现的时间结构。
- 根据权利要求53至77任意一项所述的客户端,其特征在于,所述呈现单元还用于,在关注焦点停留在所述K个导览单元中的导览单元i的情况下,呈现所述导览单元i的音频分量。
- 根据权利要求53至78任意一项所述的客户端,其特征在于,所述呈现单元还用于,在所述K个导览单元中的导览单元i被选择的情况下,获取所述导览单元i所指向的主媒体呈现。
- 一种服务器,其特征在于,包括:确定单元,用于确定导览媒体呈现包括的N个导览单元;生成单元,用于生成导览媒体呈现的媒体呈现描述,所述导览媒体呈现的媒体呈现描述描述了所述导览媒体呈现包括的N个导览单元,所述N为大于 1的整数;所述N个导览单元中的每个导览单元指向一个主媒体呈现,所述N个导览单元中的导览单元i所指向的主媒体呈现的呈现质量高于所述导览单元i的呈现质量。
- 根据权利要求80所述的服务器,其特征在于,所述导览媒体呈现的媒体呈现描述不同于所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述。
- 根据权利要求81所述的服务器,其特征在于,所述N个导览单元中的每个导览单元以指向媒体呈现描述的方式来指向该媒体呈现描述所描述的主媒体呈现。
- 根据权利要求80所述的服务器,其特征在于,所述导览媒体呈现的媒体呈现描述与所述N个导览单元中的每个导览单元所指向主媒体呈现的媒体呈现描述被聚合形成了一个聚合媒体呈现描述。
- 根据权利要求82所述的服务器,其特征在于,所述N个导览单元中的每个导览单元以引用所述聚合媒体呈现描述中的呈现元素的方式来指向一个主媒体呈现。
- 根据权利要求80至84任一项所述的服务器,其特征在于,所述N个导览单元中的每个导览单元包括视频分量,或者所述N个导览单元中的每个导览单元包括音频分量和视频分量。
- 根据权利要求85所述的服务器,其特征在于,所述N个导览单元中的不同导览单元所包括的视频分量为N个视频适配集中的不同视频适配集中的媒体表达,其中,所述N个视频适配集中的任意一个视频适配集中的媒体表达之间具有选择互斥性,所述N个视频适配集中的不同视频适配集之间具有选择相容性。
- 根据权利要求86所述的服务器,其特征在于,所述N个导览单元包括的音频分量为音频适配集中的媒体表达,所述音频适配集不同于所述N个适配集中的任意一个适配集,所述音频分量适配集与所述N个视频适配集之间具有选择相容性;或者,所述N个导览单元中的不同导览单元所包括的音频分量为N个音频适配集中的不同音频适配集中的媒体表达,其中,所述N个音频适配集中的不同音频适配集之间具有选择互斥性。
- 根据权利要求87所述的服务器,其特征在于,所述音频适配集元素中的媒体表达元素,包含其所描述的媒体表达在导览媒体呈现中的关联区域的区域说明。
- 根据权利要求88所述的服务器,其特征在于,包含相同区域说明的媒体表达元素所描述的媒体表达之间具有关联关系,或者,包含相同区域说明的适配集元素所描述的适配集之间具有关联关系。
- 根据权利要求88或89所述的服务器,其特征在于,所述区域说明为SRD空间关系描述。
- 根据权利要求86至90任一项所述的服务器,其特征在于,所述导览媒体呈现的媒体呈现描述中包括N个视频适配集元素,所述N个视频适配集元素与所述N个视频适配集之间一一对应;其中,所述N个视频适配集元素中包括描述子元素Ci,所述N个视频适配集元素中的满足设定共性条件视频适配集元素所描述的视频适配集之间具有选择相容性,所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称和服务器识别schemeIdUri属性均相同。
- 根据权利要求91所述的服务器,其特征在于,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素所描述的视频适配集中的媒体表达为导览媒体呈现的组成部分。
- 根据权利要求91所述的服务器,其特征在于,所述描述子元素Ci描述了包括该描述子元素Ci的视频适配集元素对应的视频适配集中的媒体表达在导览媒体呈现的角色。
- 根据权利要求92或93所述的服务器,其特征在于,所述描述子元素Ci为作用说明Role元素或者基本属性EssentialProptery元素或者补充属性SupplementalProptery元素。
- 根据权利要求94所述的服务器,其特征在于,若描述子元素Ci为作用说明Role元素,则所述设定共性条件为视频适配集元素所包括的描述子元素Ci的元素名称相同、服务器识别schemeIdUri属性相同,且参数value属性相同。
- 根据权利要求84至95任一项所述的服务器,其特征在于,所述导览媒体呈现的媒体呈现描述中包括所述N个视频适配集元素,所述N个视频适配集元素与N个视频适配集之间一一对应,其中,所述N个视频适配集元素中的与视频适配集I对应的视频适配集元素VI包括用于指向一个主媒体呈现的指针,所述视频适配集I为所述N个视频适配集中任意一个视频适配集。
- 根据权利要求96所述的服务器,其特征在于,所述指针由所述视频适配集元素VI的属性承载。
- 根据权利要求95所述的服务器,其特征在于,所述指针由所述视频适配集元素VI的xlink:href属性承载。
- 根据权利要求96所述的服务器,其特征在于,所述指针由所述视频适配集元素VI中的基本属性EssentialProptery元素或补充属性SupplementalProperty元素承载。
- 根据权利要求96所述的服务器,其特征在于,所述指针由所述视频适配集元素VI之中的EssentialProptery元素中的子元素承载,或所述指针由所述视频适配集元素VI中的EssentialProptery元素的属性承载;或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素中的子元素承载,或者所述指针由所述视频适配集元素VI中的SupplementalProperty元素的属性承载。
- 根据权利要求100所述的服务器,其特征在于,所述指针由所述视频适配集元素VI中的EssentialProptery元素的value属性承载,或者所述指针由所述视频适配集元素VI之中的SupplementalProperty元素的value属性承载。
- 根据权利要求96所述的服务器,其特征在于,所述指针由所述视频适配集元素VI中的虚拟媒体表达Representation元素的属性承载,或,所述指针由所述视频适配集元素VI中的虚拟Representation元素中的子元素承载,其中,所述虚拟Representation元素不包括媒体片段模 版元素、媒体片段列表元素和基础统一资源定位符BaseURL元素。
- 根据权利要求96所述的服务器,其特征在于,所述指针由所述视频适配集元素VI中的媒体呈现指向ReferencedMediaPresentation元素来承载。
- 根据权利要求80至103任意一项所述的服务器,其特征在于,所述导览媒体呈现的时间结构不依赖于所述导览媒体呈现中的所述N个导览单元所指向的主媒体呈现的时间结构。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2015/073148 WO2016127440A1 (zh) | 2015-02-15 | 2015-02-15 | 基于超文本传输协议媒体流的媒体呈现导览方法和相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106664299A true CN106664299A (zh) | 2017-05-10 |
CN106664299B CN106664299B (zh) | 2020-01-17 |
Family
ID=56615026
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580038222.5A Active CN106664299B (zh) | 2015-02-15 | 2015-02-15 | 基于超文本传输协议媒体流的媒体呈现导览方法和相关装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20170374122A1 (zh) |
EP (1) | EP3249873B1 (zh) |
JP (1) | JP6478357B2 (zh) |
KR (1) | KR101919726B1 (zh) |
CN (1) | CN106664299B (zh) |
WO (1) | WO2016127440A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016133296A1 (ko) * | 2015-02-16 | 2016-08-25 | 엘지전자 주식회사 | 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법 |
WO2018173874A1 (ja) * | 2017-03-24 | 2018-09-27 | ソニー株式会社 | コンテンツ提供システムおよびコンテンツ提供方法、並びにプログラム |
CN112585646A (zh) * | 2018-09-03 | 2021-03-30 | 三星电子株式会社 | 用于对媒体执行编辑操作的方法与系统 |
US11895173B2 (en) * | 2022-01-07 | 2024-02-06 | Avago Technologies International Sales Pte. Limited | Gapped and/or subsegmented adaptive bitrate streams |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102055789A (zh) * | 2009-11-09 | 2011-05-11 | 华为技术有限公司 | 实现基于http的流媒体业务的方法、系统和网络设备 |
CN102055773A (zh) * | 2009-11-09 | 2011-05-11 | 华为技术有限公司 | 实现基于http的流媒体业务的方法、系统和网络设备 |
US20120110201A1 (en) * | 2010-11-01 | 2012-05-03 | Research In Motion Limited | Method and apparatus for updating http content descriptions |
CN102473159A (zh) * | 2009-11-04 | 2012-05-23 | 华为技术有限公司 | 媒体内容流播的系统和方法 |
CN102812683A (zh) * | 2010-02-19 | 2012-12-05 | 瑞典爱立信有限公司 | 用于在http流传输中进行自适应的方法和装置 |
CA2916878A1 (en) * | 2013-07-19 | 2015-01-22 | Sony Corporation | Information processing device and method |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102137137B (zh) * | 2010-09-17 | 2013-11-06 | 华为技术有限公司 | 基于http流的媒体内容动态插播方法、装置及系统 |
KR102331705B1 (ko) * | 2011-10-13 | 2021-12-01 | 삼성전자주식회사 | 멀티미디어 서비스 송수신 방법 및 장치 |
EP2793479A4 (en) * | 2011-12-12 | 2015-07-01 | Lg Electronics Inc | DEVICE AND METHOD FOR RECEIVING MULTIMEDIA CONTENT |
US10616297B2 (en) * | 2012-07-09 | 2020-04-07 | Futurewei Technologies, Inc. | Content-specific identification and timing behavior in dynamic adaptive streaming over hypertext transfer protocol |
EP3018909A4 (en) * | 2013-07-02 | 2017-02-22 | Sony Corporation | Content provision device, content provision method, program, terminal device, and content provision system |
TR201818950T4 (tr) * | 2013-07-02 | 2019-01-21 | Saturn Licensing Llc | İçerik sağlama cihazı, içerik sağlama yöntemi, program, terminal cihazı ve içerik sağlama sistemi. |
CN109842613B (zh) * | 2013-07-12 | 2021-11-19 | 佳能株式会社 | 用于提供和接收媒体数据的方法和装置以及存储介质 |
EP2962467A1 (en) * | 2013-07-19 | 2016-01-06 | Huawei Technologies Co., Ltd. | Metadata information signaling and carriage in dynamic adaptive streaming over hypertext transfer protocol |
KR20160077067A (ko) * | 2013-10-30 | 2016-07-01 | 소니 주식회사 | 송신 장치, 송신 방법, 수신 장치, 및 수신 방법 |
CN103974147A (zh) * | 2014-03-07 | 2014-08-06 | 北京邮电大学 | 一种基于mpeg-dash协议的带有码率切换控制和静态摘要技术的在线视频播控系统 |
-
2015
- 2015-02-15 EP EP15881602.5A patent/EP3249873B1/en active Active
- 2015-02-15 CN CN201580038222.5A patent/CN106664299B/zh active Active
- 2015-02-15 WO PCT/CN2015/073148 patent/WO2016127440A1/zh active Application Filing
- 2015-02-15 KR KR1020177025344A patent/KR101919726B1/ko active IP Right Grant
- 2015-02-15 JP JP2017542417A patent/JP6478357B2/ja active Active
-
2017
- 2017-08-15 US US15/677,436 patent/US20170374122A1/en not_active Abandoned
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102473159A (zh) * | 2009-11-04 | 2012-05-23 | 华为技术有限公司 | 媒体内容流播的系统和方法 |
CN102055789A (zh) * | 2009-11-09 | 2011-05-11 | 华为技术有限公司 | 实现基于http的流媒体业务的方法、系统和网络设备 |
CN102055773A (zh) * | 2009-11-09 | 2011-05-11 | 华为技术有限公司 | 实现基于http的流媒体业务的方法、系统和网络设备 |
CN102812683A (zh) * | 2010-02-19 | 2012-12-05 | 瑞典爱立信有限公司 | 用于在http流传输中进行自适应的方法和装置 |
US20120110201A1 (en) * | 2010-11-01 | 2012-05-03 | Research In Motion Limited | Method and apparatus for updating http content descriptions |
CA2916878A1 (en) * | 2013-07-19 | 2015-01-22 | Sony Corporation | Information processing device and method |
Also Published As
Publication number | Publication date |
---|---|
JP6478357B2 (ja) | 2019-03-06 |
EP3249873A1 (en) | 2017-11-29 |
CN106664299B (zh) | 2020-01-17 |
WO2016127440A1 (zh) | 2016-08-18 |
JP2018510552A (ja) | 2018-04-12 |
EP3249873B1 (en) | 2018-09-12 |
US20170374122A1 (en) | 2017-12-28 |
KR101919726B1 (ko) | 2018-11-16 |
EP3249873A4 (en) | 2017-11-29 |
KR20170116116A (ko) | 2017-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7698263B2 (en) | Providing a lateral search | |
Rao et al. | Techniques and standards for image, video, and audio coding | |
CN101382867B (zh) | 视频播放交互方法与终端 | |
CN109168026A (zh) | 即时视频显示方法、装置、终端设备及存储介质 | |
CA2992471A1 (en) | Media production system with score-based display feature | |
CN101764974A (zh) | 多节目预览iptv电子节目单的实现方法及系统 | |
CN113329267B (zh) | 一种视频播放方法、装置、终端设备及存储介质 | |
CN100477799C (zh) | 一种提高电视终端设备数字字幕数据处理效率的方法 | |
CN106664299A (zh) | 基于超文本传输协议媒体流的媒体呈现导览方法和相关装置 | |
CN106792102A (zh) | 机顶盒端首页多个视频同步播放的方法及机顶盒 | |
CN103067747A (zh) | 一种互动数字电视的显示方式 | |
CN106792103A (zh) | 机顶盒端首页小窗口展现多个推荐位图的方法及机顶盒 | |
US20200099987A1 (en) | Systems and methods for displaying a live video stream in a graphical user interface | |
CN104935595A (zh) | 内容项聚合方法和相关装置及通信系统 | |
CN118093899A (zh) | 一种人工智能个人多媒体存储设备及其播放系统、方法 | |
CN102681977A (zh) | 提供阅读服务的方法、内容提供服务器和系统 | |
CN106537930A (zh) | 多媒体流业务呈现方法和相关装置及相关系统 | |
CN105491455A (zh) | 一种节目信息展示方法及用户设备 | |
CN106162380A (zh) | 一种在线视频调用方法及系统 | |
Black et al. | A compendium of robust data structures | |
CN101221752B (zh) | Iptv系统实现个性卡拉ok业务的方法、装置及系统 | |
KR100622645B1 (ko) | 임베디드 시스템 상의 mpeg-4 장면 렌더링에서의 객체교체와 속성 변환 장치 및 방법 | |
CN106899866B (zh) | 一种关联多媒体内容个性化呈现信息的描述方法 | |
CN116886673A (zh) | 多媒体处理流程的确定方法、装置、电子设备及存储介质 | |
Liu et al. | Semi-automatic creation of graphically-rich mobile Television services and applications using an XHTML browser and J2ME |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |