CN113767608A - 用于基于http的动态自适应流传输的基于会话的信息 - Google Patents

用于基于http的动态自适应流传输的基于会话的信息 Download PDF

Info

Publication number
CN113767608A
CN113767608A CN202080032296.9A CN202080032296A CN113767608A CN 113767608 A CN113767608 A CN 113767608A CN 202080032296 A CN202080032296 A CN 202080032296A CN 113767608 A CN113767608 A CN 113767608A
Authority
CN
China
Prior art keywords
request
sbd
session
client
dash
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080032296.9A
Other languages
English (en)
Other versions
CN113767608B (zh
Inventor
伊拉吉·索达加
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent America LLC
Original Assignee
Tencent America LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent America LLC filed Critical Tencent America LLC
Publication of CN113767608A publication Critical patent/CN113767608A/zh
Application granted granted Critical
Publication of CN113767608B publication Critical patent/CN113767608B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • H04L65/612Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for unicast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1101Session protocols
    • H04L65/1108Web based protocols, e.g. webRTC
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本公开的各方面提供了接收会话的媒体数据的方法、装置和非易失性计算机可读介质。一种装置包括处理电路,所述处理电路通过基于会话的描述(SBD)客户端接收包括多个键值对的SBD文件。所述处理电路通过所述SBD客户端从基于超文本传输协议的动态自适应流传输(DASH)访问客户端接收第一请求,所述第一请求用于请求与所述多个键值对之一相关联的值。所述处理电路响应于所述第一请求,通过所述SBD客户端向所述DASH访问客户端发送与所述多个键值对之一相关联的所述值,所述值由所述DASH访问客户端包括在发送到内容服务器的第二请求中。

Description

用于基于HTTP的动态自适应流传输的基于会话的信息
通过引用并入本文
本申请要求于2020年9月22日提交的、申请号为17/028,286、名称为“用于基于HTTP的动态自适应流传输的基于会话的信息”的美国专利申请的优先权,其要求于2019年9月30日提交的、申请号为62/908,260、名称为“用于基于会话的DASH操作的基于会话的描述的通用定时模型、数据模型和层次结构”的美国临时申请的优先权。在先申请的全部公开内容通过引用整体并入本文。
技术领域
本公开描述了总体上涉及用于基于超文本传输协议的动态自适应流传输(DASH)的基于会话的信息的实施例。
背景技术
本文所提供的背景描述旨在总体上呈现本公开的背景。在背景技术部分以及本说明书的各个方面中所描述的目前已署名的发明人的工作所进行的程度,并不表明其在本公开提交时作为现有技术,且从未明示或暗示其被承认为本公开的现有技术。
运动图像专家组(MPEG)已开始在基于超文本传输协议的动态自适应流传输(DASH)的标准中加入一个新的部分,以用于基于会话的DASH操作。虽然媒体呈现描述(MPD)文件对于所有客户端都是通用的,但是客户端也可以获取边文件(side file),例如基于会话的描述(SBD)文件,其为客户端提供指令,以使MPD特定于会话。然而,在当前设计中,MPD文件中仍然携带一些SBD特定信息。此外,SBD是针对每个应用专门设计的(例如,使用取证水印(forensic watermarking))并且不够通用,无法解决其他应用。
发明内容
本公开的各方面提供了接收会话的媒体数据的装置。一种装置包括处理电路,所述处理电路通过基于会话的描述(SBD)客户端接收包括多个键值对的SBD文件。所述处理电路通过所述SBD客户端从基于超文本传输协议的动态自适应流传输(DASH)访问客户端接收第一请求,所述第一请求用于请求与所述多个键值对之一相关联的值。所述处理电路响应于所述第一请求,通过所述SBD客户端向所述DASH访问客户端发送与所述多个键值对之一相关联的所述值,所述值由所述DASH访问客户端包括在发送到内容服务器的第二请求中。
在实施例中,根据所述SBD文件将所述会话划分为会话时间线中的一个或多个子会话,所述一个或多个子会话中的每一个与所述会话时间线中的不同时段相关联。
在实施例中,所述SBD文件包括第一定时属性和第二定时属性,所述第一定时属性指示所述会话的开始时间,所述第二定时属性指示所述一个或多个子会话之一的从所述会话的开始时间的开始时间偏移。
在实施例中,所述SBD文件包括循环属性,所述循环属性指示当启用所述循环属性时,所述会话被重复。
在实施例中,所述SBD文件包括所述一个或多个子会话之一的标识属性。
在实施例中,所述第二请求是片段请求、媒体呈现描述更新请求和可扩展标记语言(XML)链接语言(XLINK)请求中的一个。
在实施例中,当所述第二请求是所述片段请求时,与所述多个键值对之一相关联的所述值指示媒体类型和适配集中的一个。
在实施例中,所述处理电路根据所述第一请求的定时和所述第一请求的顺序中的一个发送与所述多个键值之一相关联的所述值。
在实施例中,与所述多个键值之一相关联的所述值包括在所述第二请求的统一资源定位符(URL)的查询和所述第二请求的超文本传输协议(HTTP)头中的一个中。
在实施例中,所述SBD文件包括类型属性,所述类型属性指示所述SBD文件的类型是静态类型和动态类型中的一种。
本公开的各方面提供了接收会话的媒体数据的方法。在一种方法中,基于会话的描述(SBD)客户端接收包括多个键值对的SBD文件。所述SBD客户端从基于超文本传输协议的动态自适应流传输(DASH)访问客户端接收第一请求,所述第一请求用于请求与所述多个键值对之一相关联的值。响应于所述第一请求,所述SBD客户端向所述DASH访问客户端发送与所述多个键值对之一相关联的所述值,所述值由所述DASH访问客户端包括在发送到内容服务器的第二请求中。
本公开的各方面还提供了非易失性计算机可读介质,用于存储指令,当所述指令由用于接收会话的媒体数据的计算机执行时,使所述计算机执行所述接收会话的媒体数据的方法的任意一种或组合。
附图说明
根据以下详细描述和附图,所公开的主题的其他特征、性质和各种优点将进一步明确,其中:
图1示出了根据本公开实施例的示例性的基于会话的基于超文本传输协议的动态自适应流传输(DASH)系统。
图2示出了根据本公开实施例的另一示例性的基于会话的DASH系统。
图3示出了根据本公开实施例的示例性的分层的基于会话的描述(SBD)数据模型。
图4A和4B示出了根据本公开实施例的静态SBD和动态SBD的示例性定时模型。
图5A和4B示出了根据本公开实施例的SBD的示例性时间线和顺序线元素。
图6示出了根据一些实施例的概述过程示例的流程图。
图7是根据实施例的计算机系统的示意图。
具体实施方式
I.基于超文本传输协议的动态自适应流传输(DASH)和媒体呈现描述(MPD,MediaPresentation Description)
基于超文本传输协议的动态自适应流传输(DASH)是一种自适应比特率流传输技术,它能够使用超文本传输协议(HTTP)基础设施,例如web服务器、内容分发网络(CDN)、各种代理和缓存等,来实现媒体内容的流传输。DASH支持从DASH服务器到DASH客户端的点播和直播,并允许DASH客户端控制流传输会话,使得DASH服务器不需要在大规模部署中处理额外的流适配管理负载。DASH还允许DASH客户端从各种DASH服务器选择流传输,从而进一步实现网络的负载平衡,以利于DASH客户端。DASH提供不同媒体轨道之间的动态切换,例如,通过改变比特率来适应网络条件。
在DASH中,媒体呈现描述(MPD)文件为DASH客户端提供信息,以便通过从DASH服务器下载媒体片段来自适应地流传输媒体内容。MPD文件可以碎片化并部分交付,以减少会话启动延迟。MPD文件还可以在流传输会话期间更新。在一些示例中,MPD文件支持内容可访问性特征、评级和相机视图的表示。DASH还支持多视图和可缩放编码内容的交付。
MPD文件可以包含一个或多个时段(period)的序列。该一个或多个时段中的每一个可以由MPD文件中的时段元素定义。MPD文件可以包括MPD的availableStartTime属性和一个或多个时段的开始(start)属性。对于具有动态类型的媒体呈现(例如,用于直播服务),时段的开始属性和MPD属性availableStartTime的和以及媒体片段的持续时间可以以协调世界时(UTC)格式指示该时段的可用时间,特别是对应时段中的每个呈现的第一个媒体片段。对于具有静态类型的媒体呈现(例如,用于点播服务),第一个时段的开始属性可以为0。对于其它任何时段,开始属性可以指定对应时段的开始时间相对于第一个时段的开始时间之间的时间偏移。每个时段可以延长到下一时段的开始,或者如果是最后一个时段,则可以延长到媒体呈现的结束。时段开始时间可以是精确的,并反映因为播放先前所有时段的媒体而产生的实际定时。
每个时段可以包含一个或多个适配集,并且每个适配集可以包含相同媒体内容的一个或多个呈现。呈现可以是音频或视频数据的多个可选已编码版本中的一个。多个呈现可以因编码类型而不同,例如因比特率、分辨率、和/或视频数据的编解码器以及比特率、和/或音频数据的编解码器而不同。术语呈现可用于指代与多媒体内容的特定时段相对应并以特定方式编码的一段已编码音频或视频数据。
可以将特定时段的适配集分配给由MPD文件中的组属性指示的组。通常认为同一组中的适配集是相互可替代的。例如,可以将特定时段的视频数据的每个适配集分配给同一组,使得可以选择任何一个适配集进行解码,以显示对应时段的多媒体内容的视频数据。在一些示例中,一个时段内的媒体内容可以由来自组0的一个适配集(如果存在)来呈现,或由来自每个非零组的至多一个适配集的组合来呈现。时段的每个呈现的定时数据可以相对于时段的开始时间来表示。
一个呈现可以包括一个或多个片段。每个呈现可以包括初始化片段,或者呈现的每个片段可以是自初始化的。当存在时,初始化片段可以包含用于访问该呈现的初始化信息。在一些情况下,初始化片段不包含媒体数据。一个片段可以由标识符唯一地引用,例如统一资源定位符(URL)、统一资源名称(URN)或统一资源标识符(URI)。MPD文件可以为每个片段提供标识符。在一些示例中,MPD文件还可以以范围属性的形式提供字节范围,该字节范围可以对应于URL、URN或URI可访问的文件内的片段的数据。
每个呈现还可以包括一个或多个媒体组件,其中每个媒体组件可以对应于一个单独媒体类型的已编码版本,例如音频、视频或定时文本(例如,用于隐藏式字幕)。媒体组件可以是跨一个呈现内的连续媒体片段的边界时间连续的。
在一些实施例中,DASH客户端可以从DASH服务器访问和下载MPD文件。也就是说,DASH客户端可以检索MPD文件,以用于发起实时会话。基于MPD文件,对于每个选定的呈现,DASH客户端可以做出多个决定,包括确定服务器上可用的最新片段,确定下一片段和可能的未来片段的片段可用性开始时间,确定何时开始播放该片段以及从该片段中的哪个时间线开始播放,以及确定何时获取/取得新的MPD文件。一旦播放了服务,客户端就可以跟踪直播服务与其自己的播放之间的漂移,该漂移需要检测和补偿。
II.基于会话的DASH操作和基于会话的描述(SBD)
应注意,MPD文件对于所有DASH客户端可以是通用的。为了使MPD文件特定于DASH客户端的会话,运动图像专家组(MPEG)提供了基于会话的DASH操作。在基于会话的DASH操作中,DASH客户端可以接收一个边文件,例如基于会话的描述(SBD)文件,该文件为DASH客户端提供指令,以自定义每个会话和可能的每个客户端的MPD文件。然而,在一些相关示例中,基于会话的DASH操作是特定于应用的。也就是说,对于每个新的应用,都需要新的SBD格式。
本公开提供了一种通用SBD格式,其可以为所有基于会话的应用提供单一的解决方案。
图1示出了根据本公开实施例的示例性的基于会话的DASH操作架构(100)。在基于会话的DASH操作架构(100)中,MPD文件从DASH服务器(101)(例如,内容服务器)发送到DASH客户端(102)。DASH客户端(102)可以基于MPD文件从DASH服务器(101)接收媒体片段。此外,DASH客户端(102)可以从DASH服务器(101)或第三方(例如会话控制器)接收SBD文件。
根据本公开的各方面,SBD文件可以包括多个时间范围和对应的键值对(或名称值对)以及附加元数据。SBD文件可以通过例如URL在MPD文件中引用。SBD文件可用于定制DASH客户端(102)接收的MPD文件,使其特定于DASH客户端(102)的会话。例如,SBD文件可以允许将特定于会话的元素添加到片段URL,而无需生成唯一的每个会话MPD。
图2示出了根据本公开的实施例的另一示例性的基于会话的DASH操作架构(200)。在基于会话的DASH操作架构(200)中,多媒体内容由内容生成设备(201)(例如,智能手机)准备和生成,该内容生成设备(201)可以包括音频源(例如,麦克风)和视频源(例如,摄像机)。多媒体内容可以由内容生成设备(201)存储或发送到可以存储各种多媒体内容的内容服务器(202)。内容服务器(202)可以从客户端设备(例如DASH访问客户端(203))接收对多媒体内容的一个或多个媒体片段的请求。多媒体内容由MPD文件描述,MPD文件可以由内容服务器(202)存储和更新,并且由包括DASH访问客户端(203)的客户端设备访问,以获取媒体片段。
例如,会话客户端)发送用于访问SBD文件的请求,该请求由SBD客户端(204)接收并且包括用于当前会话的多个时间范围和对应的键值对。例如,DASH访问客户端(203)可以向SBD客户端(204)发送键名和时间范围,然后SBD客户端(204)解析该键名和时间范围,并向DASH访问客户端(203)返回与该键名和时间范围对应的值。DASH访问客户端(203)可以将该值包括在片段URL的查询中,当片段请求是HTTP GET请求或部分GET请求时,可以将该值发送到内容服务器(202),以请求特定于会话的媒体片段。
应注意,SBD客户端(204)可以从不同的会话控制器(例如会话控制器(205)和会话控制器(206))接收多个SBD文件。
根据本公开的各方面,内容服务器(202)(例如,DASH服务器)的任何或所有功能可以在内容交付网络(CDN,content delivery network)的一个或多个设备上实现,例如路由器、网桥、代理设备、交换机或其它设备。内容服务器(202)可以包括请求处理单元,其被配置为从客户端设备(例如,DASH访问客户端(203))接收网络请求。例如,该请求处理单元可以被配置为接收HTTP GET请求或部分GET请求,并且响应于该请求提供多媒体内容的数据。该请求可以使用片段的URL来指定该片段。在一些示例中,该请求还可以指定片段的一个或多个字节范围,从而包括部分GET请求。请求处理单元可以进一步被配置为服务于HTTPHEAD请求,以提供片段的头数据。
在一些实施例中,内容生成设备(201)和内容服务器(202)可以通过无线网络或有线网络耦合,或者可以直接通信耦合。
在一些实施例中,内容生成设备(201)和内容服务器(202)可以包括在同一设备中。
在一些实施例中,内容服务器(202)和会话控制器(205)-(206)可以包括在同一设备中。
在一些实施例中,内容服务器(202)和DASH访问客户端(203)可以通过无线网络或有线网络耦合。
在一些实施例中,SBD客户端(204)和会话控制器(205)-(206)可以通过无线网络或有线网络耦合,或者可以直接通信耦合。
在一些实施例中,DASH访问客户端(203)和SBD客户端(204)可以包括在同一设备中。
图3示出了根据本公开实施例的示例性的分层SBD数据模型(300)。在可以用JavaScript对象表示法(JSON)实现的分层SBD数据模型(300)中,SBD文件可以包括一个或多个时段。每个时段具有一个或多个请求类型元素。请求的类型可以包括片段请求、MPD更新请求和可扩展标记语言(XML)链接语言(XLINK)请求。每个请求类型都可以有一个范围,该范围可以定义为媒体类型或适配集,也可以同时定义为媒体类型和适配集。在每个范围内,多个键值对中的每一个都可以与时间线(timeline)和/或顺序线(orderline)相关联。最后,查询/头扩展可以定义这些键值对的添加位置。
特别地,SBD文件可以包括可用性开始时间属性,例如SBD@availabilityStartTime。SBD可用性开始时间属性可选地为会话的开始提供挂钟时间上的锚点(anchor)。SBD可用性开始时间属性SBD@availabilityStartTime可以类似于MPD可用性开始时间属性MPD@availabilityStartTime,但它是会话的锚点。SBD@availabilityStartTime可以为动态MPD提供锚点。
此外,一个会话可以包括一个或多个时段。与MPD类似,会话时段可以定义会话时间线中的持续时间。在SBD文件中,每个时段都可以有一个开始属性,例如@start,以指示从SBD@availabilityStartTime的开始时间偏移。会话可能有回绕的可能性,这意味着在最后一个时段结束时,如果设置了回绕元素,例如SBD@wrap,则会话会回绕并且继续第一个时段。会话中的每个时段都可以有一个时段标识符,例如period@id,用于标识相应的时段。对于给定的SBD文件,每个period@id可以具有一个唯一值。
每个时段都可以具有定制信息,用于MPD文件中的以下一个或多个请求,例如片段请求、MPD更新请求和/或XLINK请求。可以进一步为一个或多个媒体类型和/或一个或多个适配集指定片段请求。
单个请求的定制可以根据基于时间的分配(其基于请求的定时)和基于顺序的分配(其基于请求的顺序)中的一种来进行。每个请求中的定制可以包括:在URL请求的查询和/或一个或多个HTTP头扩展中添加补充信息,例如一个或多个键值对。
此外,SBD可以是静态的或动态的,并且如果SBD是动态的,则可以进行更新。
图4A和4B示出了根据本公开实施例的静态SBD和动态SBD的示例性定时模型。在图4A中,SBD的类型是静态的(例如,SBD@type=static),并且当MPD@type=static时,SBD的定时模型与MPD的定时模型类似,不同之处在于SBD可以回绕,这意味着在完成时段2(P2)后,SBD可以返回到时段0(P0)并重新开始。在图4B中,SBD的类型是动态的(例如,SBD@type=dynamic),当MPD@type=dynamic时,SBD的定时模型与MPD的定时模型类似。然而,SBD可以再次回绕,这意味着在P2结束时,P0将继续,依此类推。
应注意,SBD中的时段可以与MPD时段对齐,也可以不与MPD时段对齐。在SBD中设置时段的原因是能够在SBD中插入或替换时段,从而为MPD会话的不同持续时间启用不同的基于会话的操作。
图5A和5B示出了根据本公开实施例的SBD的示例性时间线和顺序线元素。在图5A中,时间线元素将时间线划分为各种持续时间,在每个持续时间中,一个或多个分配被添加到URL的查询中或作为头扩展。每个时间线可以以类似于MPD文件中的SegmentTimeline的方式构建。例如,S元素显示了一个持续时间,S@t是S元素的(可选)开始时间,@d是元素的持续时间,@v包括要为相应持续时间内发生的请求添加的一个或多个键值对,@r表示该S元素的重复次数。在图5B中,顺序线元素定义了要添加到每个请求的键值对的顺序。例如,O元素显示了一个顺序,O@t是O元素的(可选)开始时间,@v包括要为相应顺序中发生的请求添加的一个或多个键值对,@r表示该O元素的重复次数。
根据本公开的各方面,DASH客户端(102)可以从MPD文件中URL指示的位置下载SBD文件,解析SBD文件JSON对象并构建时间线/顺序线表。然后,DASH客户端(102)可以在时间线/顺序线表中找到用于请求(子)片段的匹配行以及匹配行中的SBD描述符中列出的每个键的对应值,并利用SBD描述符中定义的键的顺序来构建查询,并将该查询添加到片段请求中。
SBD文件可以使用XML和/或JSON来实现。对于XML实现,可以使用与MPD和时段类似或相同的XML结构。MPD和时段的XML结构中的一些元素和属性,例如UrlQueryInfoType和ExtendedUrlInfoType,可以用于SBD的XML结构中。对于JSON实现,可以使用图3所示的分层数据模型。
在实施例中,DASH访问客户端(203)可以接收MPD文件,并将MPD文件中的URL地址传递给SBD客户端(204)。SBD客户端(204)可以从URL地址下载键值对象并构建时间线/顺序线表。DASH客户端(203)可以向SBD客户端(204)发送键和(子)片段的定时或顺序,SBD客户端(204)计算所请求的(子)片段的定时或顺序,并在时间线/顺序线表中找到与所请求的(子)片段的定时或顺序相匹配的行。然后,SBD客户端在匹配行的键值对中找到与DASH客户端(203)发送的键匹配的匹配键名,并将与匹配键名对应的值返回到DASH客户端(203)。DASH客户端(203)可以将该值(或key=value)添加到(子)片段请求中使用的片段URL的查询的末尾或者作为HTTP头扩展。
根据本公开的各方面,提供了一种通用的独立于应用的方法,用于描述基于会话的DASH操作。该方法允许将基于会话的信息应用于各种应用。基于会话的操作的所有信息都包括在SBD文件中,并且MPD文件中不包含任何信息。基于会话的操作可以用静态或动态时间线来描述。动态时间线可以更新。可以规定针对片段请求、MPD更新请求和XLINK请求中的一个或多个和/或任何组合的各种操作。这些操作可以应用于一个或多个媒体类型和/或适配集或其组合。这些操作可以根据请求的时间线或顺序线进行规定,并具有回绕功能,允许SBD以重复模式继续。该方法可以以类似于MPD XML格式的XML格式来实现,或者以可以实现分层数据模型的JSON格式来实现。
III.流程图
图6示出了根据本公开实施例的概述过程(600)的流程图。在各种实施例中,过程(600)由处理电路执行,例如DASH客户端(102)中的处理电路、DASH访问客户端(203)中的处理电路、SBD客户端(204)中的处理电路等。在一些实施例中,过程(600)以软件指令实现,因此当处理电路执行该软件指令时,处理电路执行过程(600)。过程(600)开始于(S610),其中过程(600)通过SBD客户端接收包括多个键值对的SBD文件。然后,过程(600)进行到步骤(S620)。
在步骤(S620),过程(600)通过所述SBD客户端从DASH访问客户端接收第一请求,所述第一请求用于请求与所述多个键值对之一相关联的值。然后,过程(600)进行到步骤(S630)。
在步骤(S630),过程(600)响应于所述第一请求,通过所述SBD客户端向所述DASH访问客户端发送与所述多个键值对之一相关联的所述值,所述值由所述DASH访问客户端包括在发送到内容服务器的第二请求中。然后,过程(600)结束。
在实施例中,根据所述SBD文件将所述会话划分为会话时间线中的一个或多个子会话,所述一个或多个子会话中的每一个与所述会话时间线中的不同时段相关联。
在实施例中,所述SBD文件包括第一定时属性和第二定时属性,所述第一定时属性指示所述会话的开始时间,所述第二定时属性指示所述一个或多个子会话之一的从所述会话的开始时间的开始时间偏移。
在实施例中,所述SBD文件包括循环属性,所述循环属性指示当启用所述循环属性时,所述会话被重复。
在实施例中,所述SBD文件包括所述一个或多个子会话之一的标识属性。
在实施例中,所述第二请求是片段请求、MPD更新请求和XLINK请求中的一个。
在实施例中,当所述第二请求是所述片段请求时,与所述多个键值对之一相关联的所述值指示媒体类型和适配集中的一个。
在实施例中,所述处理电路根据所述第一请求的定时和所述第一请求的顺序中的一个发送与所述多个键值之一相关联的所述值。
在实施例中,与所述多个键值之一相关联的所述值包括在所述第二请求的URL的查询和所述第二请求的HTTP头中的一个中。
在实施例中,所述SBD文件包括类型属性,所述类型属性指示所述SBD文件的类型是静态类型和动态类型中的一种。
IV.计算机系统
上述技术可以通过计算机可读指令实现为计算机软件,并且物理地存储在一个或多个计算机可读介质中。例如,图7示出了计算机系统(700),其适于实现所公开主题的某些实施例。
所述计算机软件可通过任何合适的机器代码或计算机语言进行编码,通过汇编、编译、链接等机制创建包括指令的代码,所述指令可由一个或多个计算机中央处理单元(CPU),图形处理单元(GPU)等直接执行或通过译码、微代码等方式执行。
所述指令可以在各种类型的计算机或其组件上执行,包括例如个人计算机、平板电脑、服务器、智能手机、游戏设备、物联网设备等。
图7所示的用于计算机系统(700)的组件本质上是示例性的,并不用于对实现本公开实施例的计算机软件的使用范围或功能进行任何限制。也不应将组件的配置解释为与计算机系统(700)的示例性实施例中所示的任一组件或其组合具有任何依赖性或要求。
计算机系统(700)可以包括某些人机界面输入设备。这种人机界面输入设备可以通过触觉输入(如:键盘输入、滑动、数据手套移动)、音频输入(如:声音、掌声)、视觉输入(如:手势)、嗅觉输入(未示出),对一个或多个人类用户的输入做出响应。所述人机界面设备还可用于捕获某些媒体,气与人类有意识的输入不必直接相关,如音频(例如:语音、音乐、环境声音)、图像(例如:扫描图像、从静止影像相机获得的摄影图像)、视频(例如二维视频、包括立体视频的三维视频)。
人机界面输入设备可包括以下中的一个或多个(仅绘出其中一个):键盘(701)、鼠标(702)、触控板(703)、触摸屏(710)、数据手套(未示出)、操纵杆(705)、麦克风(706)、扫描仪(707)和照相机(708)。
计算机系统(700)还可以包括某些人机界面输出设备。这种人机界面输出设备可以通过例如触觉输出、声音、光和嗅觉/味觉来刺激一个或多个人类用户的感觉。这样的人机界面输出设备可包括触觉输出设备(例如通过触摸屏(710)、数据手套(未示出)或操纵杆(705)的触觉反馈,但也可以有不用作输入设备的触觉反馈设备)、音频输出设备(例如,扬声器(709)、耳机(未示出))、视觉输出设备(例如,包括阴极射线管屏幕、液晶屏幕、等离子屏幕、有机发光二极管屏的屏幕(710),其中每一个都具有或没有触摸屏输入功能、每一个都具有或没有触觉反馈功能——其中一些可通过诸如立体画面输出的手段输出二维视觉输出或三维以上的输出;虚拟现实眼镜(未示出)、全息显示器和放烟箱(未示出))以及打印机(未示出)。这些视觉输出设备(例如触摸屏(710))可以通过图形适配器(750)连接到系统总线(748)。
计算机系统(700)还可以包括人可访问的存储设备及其相关介质,如包括具有CD/DVD的高密度只读/可重写式光盘(CD/DVD ROM/RW)(720)或类似介质(721)的光学介质、拇指驱动器(722)、可移动硬盘驱动器或固体状态驱动器(723),诸如磁带和软盘(未示出)的传统磁介质,诸如安全软件保护器(未示出)等的基于ROM/ASIC/PLD的专用设备,等等。
本领域技术人员还应当理解,结合所公开的主题使用的术语“计算机可读介质”不包括传输介质、载波或其它瞬时信号。
计算机系统(700)还可以包括通往一个或多个通信网络(755)的网络接口(754)。例如,该一个或多个通信网络(755)可以是无线的、有线的、光学的。该一个或多个通信网络(755)还可为局域网、广域网、城域网、车载网络和工业网络、实时网络、延迟容忍网络等等。该一个或多个通信网络(755)的示例还包括以太网、无线局域网、蜂窝网络(GSM、3G、4G、5G、LTE等)等局域网、电视有线或无线广域数字网络(包括有线电视、卫星电视、和地面广播电视)、车载和工业网络(包括CANBus)等等。某些网络通常需要外部网络接口适配器,用于连接到某些通用数据端口或外围总线(749)(例如,计算机系统(700)的USB端口);其它系统通常通过连接到如下所述的系统总线集成到计算机系统(700)的核心(例如,以太网接口集成到PC计算机系统或蜂窝网络接口集成到智能电话计算机系统)。通过使用这些网络中的任何一个,计算机系统(700)可以与其它实体进行通信。所述通信可以是单向的,仅用于接收(例如,无线电视),单向的仅用于发送(例如CAN总线到某些CAN总线设备),或双向的,例如通过局域或广域数字网络到其它计算机系统。上述的每个网络和网络接口可使用某些协议和协议栈。
上述的人机界面设备、人可访问的存储设备以及网络接口可以连接到计算机系统(700)的核心(740)。
核心(740)可包括一个或多个中央处理单元(CPU)(741)、图形处理单元(GPU)(742)、以现场可编程门阵列(FPGA)(743)形式的专用可编程处理单元、用于特定任务的硬件加速器(744)等。这些设备以及只读存储器(ROM)(745)、随机存取存储器(746)、内部大容量存储器(例如内部非用户可存取硬盘驱动器、固态硬盘等)(747)等可通过系统总线(748)进行连接。在某些计算机系统中,可以以一个或多个物理插头的形式访问系统总线(748),以便可通过额外的中央处理单元、图形处理单元等进行扩展。外围装置可直接附接到核心的系统总线(748),或通过外围总线(749)进行连接。外围总线的体系结构包括外部外围组件互联PCI、通用串行总线USB等。
CPU(741)、GPU(742)、FPGA(743)和加速器(744)可以执行某些指令,这些指令组合起来可以构成上述计算机代码。该计算机代码可以存储在ROM(745)或RAM(746)中。过渡数据也可以存储在RAM(746)中,而永久数据可以存储在例如内部大容量存储器(747)中。通过使用高速缓冲存储器可实现对任何存储器设备的快速存储和检索,高速缓冲存储器可与一个或多个CPU(741)、GPU(742)、大容量存储器(747)、ROM(745)、RAM(746)等紧密关联。
所述计算机可读介质上可具有计算机代码,用于执行各种计算机实现的操作。介质和计算机代码可以是为本公开的目的而特别设计和构造的,也可以是计算机软件领域的技术人员所熟知和可用的介质和代码。
作为实施例而非限制,具有体系结构(700)的计算机系统,特别是核心(740),可以作为处理器(包括CPU、GPU、FPGA、加速器等)提供执行包含在一个或多个有形的计算机可读介质中的软件的功能。这种计算机可读介质可以是与上述的用户可访问的大容量存储器相关联的介质,以及具有非易失性的核心(740)的特定存储器,例如核心内部大容量存储器(747)或ROM(745)。实现本公开的各种实施例的软件可以存储在这种设备中并且由核心(740)执行。根据特定需要,计算机可读介质可包括一个或一个以上存储设备或芯片。该软件可以使得核心(740)特别是其中的处理器(包括CPU、GPU、FPGA等)执行本文所述的特定过程或特定过程的特定部分,包括定义存储在RAM(746)中的数据结构以及根据软件定义的过程来修改这种数据结构。另外或作为替代,计算机系统可以提供逻辑硬连线或以其它方式包含在电路(例如,加速器(744))中的功能,该电路可以代替软件或与软件一起运行以执行本文所述的特定过程或特定过程的特定部分。在适当的情况下,对软件的引用可以包括逻辑,反之亦然。在适当的情况下,对计算机可读介质的引用可包括存储执行软件的电路(如集成电路(IC)),包含执行逻辑的电路,或两者兼备。本公开包括任何合适的硬件和软件组合。
虽然本公开已对多个示例性实施例进行了描述,但实施例的各种变更、排列和各种等同替换均属于本公开的范围内。因此应理解,本领域技术人员能够设计多种系统和方法,所述系统和方法虽然未在本文中明确示出或描述,但其体现了本公开的原则,因此属于本公开的精神和范围之内。

Claims (20)

1.一种接收会话的媒体数据的方法,其特征在于,所述方法包括:
基于会话的描述SBD客户端接收包括多个键值对的SBD文件;
所述SBD客户端从基于超文本传输协议的动态自适应流传输DASH访问客户端接收第一请求,所述第一请求用于请求与所述多个键值对之一相关联的值;以及
响应于所述第一请求,所述SBD客户端向所述DASH访问客户端发送与所述多个键值对之一相关联的所述值,所述值由所述DASH访问客户端包括在发送到内容服务器的第二请求中。
2.根据权利要求1所述的方法,其特征在于,根据所述SBD文件将所述会话划分为会话时间线中的一个或多个子会话,所述一个或多个子会话中的每一个与所述会话时间线中的不同时段相关联。
3.根据权利要求2所述的方法,其特征在于,所述SBD文件包括第一定时属性和第二定时属性,所述第一定时属性指示所述会话的开始时间,所述第二定时属性指示所述一个或多个子会话之一的从所述会话的开始时间的开始时间偏移。
4.根据权利要求1所述的方法,其特征在于,所述SBD文件包括循环属性,所述循环属性指示当启用所述循环属性时,所述会话被重复。
5.根据权利要求2所述的方法,其特征在于,所述SBD文件包括所述一个或多个子会话之一的标识属性。
6.根据权利要求1所述的方法,其特征在于,所述第二请求是片段请求、媒体呈现描述更新请求和可扩展标记语言XML链接语言XLINK请求中的一个。
7.根据权利要求6所述的方法,其特征在于,当所述第二请求是所述片段请求时,与所述多个键值对之一相关联的所述值指示媒体类型和适配集中的一个。
8.根据权利要求1所述的方法,其特征在于,所述发送包括:
根据所述第一请求的定时和所述第一请求的顺序中的一个发送与所述多个键值之一相关联的所述值。
9.根据权利要求1所述的方法,其特征在于,与所述多个键值之一相关联的所述值包括在所述第二请求的统一资源定位符URL的查询和所述第二请求的超文本传输协议HTTP头中的一个中。
10.根据权利要求1所述的方法,其特征在于,所述SBD文件包括类型属性,所述类型属性指示所述SBD文件的类型是静态类型和动态类型中的一种。
11.一种接收会话的媒体数据的装置,其特征在于,所述装置包括处理电路,被配置为:
基于会话的描述SBD客户端接收包括多个键值对的SBD文件;
所述SBD客户端从基于超文本传输协议的动态自适应流传输DASH访问客户端接收第一请求,所述第一请求用于请求与所述多个键值对之一相关联的值;以及
响应于所述第一请求,所述SBD客户端向所述DASH访问客户端发送与所述多个键值对之一相关联的所述值,所述值由所述DASH访问客户端包括在发送到内容服务器的第二请求中。
12.根据权利要求11所述的装置,其特征在于,根据所述SBD文件将所述会话划分为会话时间线中的一个或多个子会话,所述一个或多个子会话中的每一个与所述会话时间线中的不同时段相关联。
13.根据权利要求12所述的装置,其特征在于,所述SBD文件包括第一定时属性和第二定时属性,所述第一定时属性指示所述会话的开始时间,所述第二定时属性指示所述一个或多个子会话之一的从所述会话的开始时间的开始时间偏移。
14.根据权利要求11所述的装置,其特征在于,所述SBD文件包括循环属性,所述循环属性指示当启用所述循环属性时,所述会话被重复。
15.根据权利要求12所述的装置,其特征在于,所述SBD文件包括所述一个或多个子会话之一的标识属性。
16.根据权利要求11所述的装置,其特征在于,所述第二请求是片段请求、媒体呈现描述更新请求和可扩展标记语言XML链接语言XLINK请求中的一个。
17.根据权利要求16所述的装置,其特征在于,当所述第二请求是所述片段请求时,与所述多个键值对之一相关联的所述值指示媒体类型和适配集中的一个。
18.根据权利要求11所述的装置,其特征在于,所述发送包括:
根据所述第一请求的定时和所述第一请求的顺序中的一个发送与所述多个键值之一相关联的所述值。
19.根据权利要求11所述的装置,其特征在于,与所述多个键值之一相关联的所述值包括在所述第二请求的统一资源定位符URL的查询和所述第二请求的超文本传输协议HTTP头中的一个中。
20.一种非易失性计算机可读存储介质,其特征在于,用于存储指令,当所述指令由用于接收会话的媒体数据的计算机执行时,使所述计算机执行:
基于会话的描述SBD客户端接收包括多个键值对的SBD文件;
所述SBD客户端从基于超文本传输协议的动态自适应流传输DASH访问客户端接收第一请求,所述第一请求用于请求与所述多个键值对之一相关联的值;以及
响应于所述第一请求,所述SBD客户端向所述DASH访问客户端发送与所述多个键值对之一相关联的所述值,所述值由所述DASH访问客户端包括在发送到内容服务器的第二请求中。
CN202080032296.9A 2019-09-30 2020-09-28 接收会话的媒体数据的方法、装置和非易失性计算机可读介质 Active CN113767608B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962908260P 2019-09-30 2019-09-30
US62/908,260 2019-09-30
US17/028,286 2020-09-22
US17/028,286 US11425187B2 (en) 2019-09-30 2020-09-22 Session-based information for dynamic adaptive streaming over HTTP
PCT/US2020/053034 WO2021067174A1 (en) 2019-09-30 2020-09-28 Session-based information for dynamic adaptive streaming over http

Publications (2)

Publication Number Publication Date
CN113767608A true CN113767608A (zh) 2021-12-07
CN113767608B CN113767608B (zh) 2023-06-30

Family

ID=75162289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080032296.9A Active CN113767608B (zh) 2019-09-30 2020-09-28 接收会话的媒体数据的方法、装置和非易失性计算机可读介质

Country Status (6)

Country Link
US (1) US11425187B2 (zh)
EP (1) EP4038861A4 (zh)
JP (1) JP7297086B2 (zh)
KR (1) KR102495551B1 (zh)
CN (1) CN113767608B (zh)
WO (1) WO2021067174A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11228796B2 (en) * 2020-01-07 2022-01-18 Tencent America LLC Pattern addressing for session-based dash operations
US11470136B2 (en) * 2020-10-07 2022-10-11 Tencent America LLC URL customization using the session-based dash operations
US11588870B2 (en) 2021-04-21 2023-02-21 Tencent America LLC W3C media extensions for processing DASH and CMAF inband events along with media using process@append and process@play mode
US11895172B2 (en) 2021-04-21 2024-02-06 Tencent America LLC Session-based description URL customization using the session-based DASH operations
US11943305B2 (en) * 2022-07-20 2024-03-26 Bentley Systems, Incorporated Workspace databases

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104429093A (zh) * 2012-07-09 2015-03-18 华为技术有限公司 超文本传输协议动态自适应流媒体客户端行为框架和会话管理实施
CN105794160A (zh) * 2014-01-06 2016-07-20 英特尔公司 用于dash的客户端/服务器信令命令
CN107113460A (zh) * 2015-01-08 2017-08-29 高通股份有限公司 针对空中广播媒体数据的会话描述信息
CN107211032A (zh) * 2015-02-11 2017-09-26 Vid拓展公司 用于http动态自适应流媒体(dash)中的一般化http头的系统和方法
CN107409234A (zh) * 2015-03-04 2017-11-28 高通股份有限公司 基于lct利用dash格式的基于文件格式的流式传输

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090136218A1 (en) * 2006-08-14 2009-05-28 Vmedia Research, Inc. Multimedia presentation format
CN105594219B (zh) 2014-07-31 2019-08-20 Lg 电子株式会社 用于广播信号的发射/接收处理的设备和方法
GB2534849A (en) 2015-01-28 2016-08-10 Canon Kk Client-driven push of resources by a server device
US20190215729A1 (en) 2018-03-15 2019-07-11 Intel Corporation Session description protocol mechanisms for signaling radio access network capabilities in multimedia telephony sessions

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104429093A (zh) * 2012-07-09 2015-03-18 华为技术有限公司 超文本传输协议动态自适应流媒体客户端行为框架和会话管理实施
CN105794160A (zh) * 2014-01-06 2016-07-20 英特尔公司 用于dash的客户端/服务器信令命令
CN107113460A (zh) * 2015-01-08 2017-08-29 高通股份有限公司 针对空中广播媒体数据的会话描述信息
CN107211032A (zh) * 2015-02-11 2017-09-26 Vid拓展公司 用于http动态自适应流媒体(dash)中的一般化http头的系统和方法
CN107409234A (zh) * 2015-03-04 2017-11-28 高通股份有限公司 基于lct利用dash格式的基于文件格式的流式传输

Also Published As

Publication number Publication date
KR102495551B1 (ko) 2023-02-06
JP7297086B2 (ja) 2023-06-23
JP2022525740A (ja) 2022-05-19
EP4038861A1 (en) 2022-08-10
EP4038861A4 (en) 2023-11-01
WO2021067174A1 (en) 2021-04-08
CN113767608B (zh) 2023-06-30
US20210099510A1 (en) 2021-04-01
KR20210100166A (ko) 2021-08-13
US11425187B2 (en) 2022-08-23

Similar Documents

Publication Publication Date Title
CN113767608B (zh) 接收会话的媒体数据的方法、装置和非易失性计算机可读介质
CN113748659B (zh) 接收会话的媒体数据的方法、装置和非易失性计算机可读介质
JP7177285B2 (ja) メディアデータを受信するための方法、装置、およびプログラム
US11930064B2 (en) Query signaling in media presentation description
CN113661680B (zh) 用于接收媒体内容的媒体数据的处理方法和装置
CN115299022A (zh) 基于http的动态自适应流传输的方法和装置
JP2022526162A (ja) セッションベースdash動作のためのパターン指定
CN113364728B (zh) 媒体内容接收方法、装置、存储介质和计算机设备
JP7387209B2 (ja) Http上の動的適応ストリーミングのための方法および装置
JP2023520757A (ja) Httpを介した動的適応ストリーミングのための方法および装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant