CN106576182A - 视频质量提升 - Google Patents

视频质量提升 Download PDF

Info

Publication number
CN106576182A
CN106576182A CN201580044972.3A CN201580044972A CN106576182A CN 106576182 A CN106576182 A CN 106576182A CN 201580044972 A CN201580044972 A CN 201580044972A CN 106576182 A CN106576182 A CN 106576182A
Authority
CN
China
Prior art keywords
media content
segmentation
expression
mpd
media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580044972.3A
Other languages
English (en)
Other versions
CN106576182B (zh
Inventor
Y·哈桑
M·里恩
O·奥伊曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of CN106576182A publication Critical patent/CN106576182A/zh
Application granted granted Critical
Publication of CN106576182B publication Critical patent/CN106576182B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/762Media network packet handling at the source 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26258Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for generating a list of items to be played back in a given order, e.g. playlist, or scheduling item distribution according to such list
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/61Network physical structure; Signal processing
    • H04N21/6106Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
    • H04N21/6131Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via a mobile phone network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/643Communication protocols
    • H04N21/64322IP
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6581Reference data, e.g. a movie identifier for ordering a movie or a product identifier in a home shopping application
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Graphics (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了用于支持超文本传输协议(DASH)上的动态自适应流的技术。可以在网络设备处确定质量度量,其针对在媒体呈现描述(MPD)文件中所描述的定义的表示中的多个媒体内容分段中的每一个。可以在所定义的表示中识别媒体内容分段,其中所确定的质量度量低于所选择的阈值。所识别的媒体内容分段可以被来自在MPD文件中所描述的不同表示的相应媒体内容分段替换,以形成修改的MPD文件,其中对应的媒体内容分段的质量度量大于所选择的阈值,以便提供所定义的表示中的媒体内容分段的基本上恒定质量的回放。

Description

视频质量提升
背景技术
多媒体服务的增长,包括流传输和对话服务,是推动新移动宽带技术和标准发展的关键驱动力之一。数字视频内容越来越多地在移动设备中消费。在日常生活中,在移动设备上广泛使用了许多视频应用。例如,在线视频流包括诸如YouTube和Hulu的流行服务。视频录制和视频会议包括诸如Skype和Google环聊等服务。2011年,YouTube拥有超过1万亿个全球观看次数。10%的观看次数通过手机或平板电脑访问。随着越来越多的智能手机、平板电脑和其他移动计算设备被购买,其用于视频记录和视频会议的用途将大大增加。随着对多媒体服务的此类高消费需求以及媒体压缩和无线网络基础设施的发展,对增强未来蜂窝和移动宽带系统的多媒体服务能力并向消费者提供高质量的体验(QoE)是有意义的,从而确保在任意时间使用任何设备和技术从任何位置无处不在地访问视频内容和服务。
附图简述
遵循结合附图的详细描述,本公开的特征和优点将显而易见,附图通过示例的方式一起示出了本公开的特征;以及其中:
图1示出了根据示例的媒体呈现描述(MPD)元数据文件配置的框图;
图2示出了根据示例的超文本传输协议(HTTP)流的框图;
图3示出了根据示例的用于基于超文本传输协议(基于HTTP的)视频流的能量表征感知无线电接入网络(RAN)架构的框图;
图4是根据示例的在超文本传输协议(DASH)媒体呈现描述(MPD)文件生成过程的动态自适应流的图;
图5示出了根据示例的媒体内容分段的表示内的媒体内容分段之间的质量变化;
图6是根据示例的包括MPD后处理技术的在超文本传输协议(DASH)媒体呈现描述(MPD)文件生成过程的动态自适应流的图;
图7描绘根据示例的可操作以支持超文本传输协议(DASH)上的动态自适应流的网络设备的电路的功能;
图8描绘了根据示例的用于支持超文本传输协议(DASH)上的动态自适应流的方法的流程图;
图9描绘根据示例的可操作以支持超文本传输协议(DASH)的动态自适应流的网络设备的电路的功能;以及
图10说明根据实例的无线设备(例如,UE)的图。
现在将参考所示的示例性实施例,并且本文将使用特定语言来描述所示的示例性实施例。然而,应当理解,因此不意图限制本发明的范围。
具体实施方式
在公开和描述本发明之前,应当理解,本发明不限于本文公开的具体结构、工艺步骤或材料,而是扩展到其等同物,如通常那些相关领域的技术人员将认识到的。还应当理解,本文使用的术语仅用于描述具体示例的目的,而不意在限制。不同附图中的相同附图标号表示相同的元件。在流程图和过程中提供的数字是为了清楚地说明步骤和操作而提供的,并且不一定指示特定的顺序或序列。
示例实施例
下面提供了技术实施例的初始概述,并且然后在后面进一步详细地描述具体的技术实施例。该初始概述旨在帮助读者更快地理解本技术,但不旨在确定该技术的关键特征或基本特征,也不旨在限制所要求保护的主题的范围。
描述了一种用于在媒体呈现描述(MPD)文件中的媒体内容分段的表示内对类似质量的媒体内容分段进行分组的技术。例如,MPD文件能够以第一表示(例如,以相对高的比特率的表示)描述第一组媒体内容文件。另外,MPD文件能够以第二表示(例如,以相对低的比特率的表示)来描述第二组媒体内容文件。该表示能够涉及在定义的质量水平和/或定义的比特率的一组媒体内容文件。能够针对同一表示内的多个媒体内容分段中的每一个确定质量度量(例如,具有相对低比特率的媒体内容分段)。能够识别具有低于所选阈值的质量度量的媒体内容分段。例如,在表示中的十个媒体内容分段的组中,媒体内容分段中的一个能够具有相对较低的质量(如一个媒体内容分段的质量度量低于所选择的阈值所证明的)。具有低于所选阈值的质量度量的表示中的媒体内容分段能够用其他媒体内容分段替换。例如,具有低于所选择的平均值的质量度量的媒体内容分段能够被来自不同表示的对应的媒体内容分段替换。不同的表示能够包括以相对较高的比特率的一组媒体内容文件。与正被替换的媒体内容分段相比,对应的媒体内容分段能够来自基本相同的媒体时间范围。结果,用于表示的媒体内容分段都能够具有相对类似的质量水平(尽管比特率在媒体内容分段之间能够稍微变化)。能够生成修改的MPD以包括具有相对类似的质量水平的媒体内容分段。修改的MPD能够被传送到客户端,其中修改的MPD能够在客户端提供基本上恒定的媒体内容分段的质量回放。
在替代配置中,具有低于所选阈值的质量度量的表示中的媒体内容分段能够被重新编码。重新编码媒体内容分段能够提高质量水平,使得重新编码的媒体内容分段的质量度量可以高于所选择的阈值。可以生成修改的MPD以包括重新编码的媒体内容分段。结果,表示中的媒体内容分段(即,被重新编码的媒体内容分段和未被重新编码的媒体内容分段)可以具有相对类似的质量水平。
超文本传输协议(HTTP)自适应流(HAS)可以用作互联网视频的多媒体传递的形式。基于HTTP的传递可以提供可靠性和部署简单性,这是由于HTTP和HTTP的底层协议,包括传输控制协议(TCP)/互联网协议(IP)的广泛采用。基于HTTP的传递可以通过避免网络地址转换(NAT)和防火墙穿越问题来实现简单和轻松的流服务。基于HTTP的传递或流传输还可以提供使用标准HTTP服务器和缓存而不是专用流服务器的能力。基于HTTP的传递可以由于服务器侧上的最小或减少的状态信息而提供可扩展性。
当使用HAS来传送互联网多媒体内容时,在移动设备上操作的视频客户端可以经配置以通过使用HTTP GET或部分GET命令,从视频服务器选择和请求适当的视频表示级别来执行在速率适配中的主要角色,以从指定的资源诸如多媒体服务器检索数据。视频客户端在开始回放流式多媒体内容诸如音频或视频之前首先将缓冲器建立到某一水平。该阶段被称为启动阶段。此后,客户端开始缓冲的多媒体内容的回放。在客户端设备处的多媒体回放的质量和分辨率取决于可用的链路带宽。视频客户端通常仅基于较高层吞吐量估计,诸如HTTP级视频流吞吐量或基于传输控制协议(TCP)吞吐量来估计可用的链路带宽。
当网络条件(即,网络变化性)的波动降低与多媒体内容相关联的通信数据速率时,在高移动性环境中的多媒体流可能是具有挑战性的。当过载网络引起通信数据速率降低时,终端用户体验质量(QoE)也可以降低。例如,在移动设备处接收的多媒体内容可以具有较小的分辨率或质量,和/或当在过载网络上提供时,多媒体内容可以周期性地中断或暂停。
在有限资源的移动网络中使用基于渐进式下载的流技术可能是不希望的,因为低效的带宽利用率和差的终端用户体验质量。如下面进一步详细讨论的,基于超文本传输协议(HTTP)的流服务,诸如HTTP上的动态自适应流(DASH)可以用于解决基于渐进式下载的流传输的弱点。
流传输到客户端,诸如用户设备(UE)的多媒体内容可以包括多个多媒体内容分段。多媒体内容分段可以各自包含表示多媒体内容的不同质量等级的不同编码版本。不同的编码版本可以允许客户端无缝地适应变化的网络条件。例如,当网络条件良好(即,网络条件高于预定的阈值)时,客户端可以请求具有较高视频质量的多媒体内容分段。当网络条件差(即,网络条件低于预定的阈值)时,客户端可以请求具有较低视频质量的多媒体内容分段。结果,当网络条件差并且可以减少自适应媒体流被中断的可能性时,客户端仍然能够接收多媒体内容分段(虽然质量较低)。
在DASH中,客户端可以选择具有最高比特率的多媒体内容分段,使得可以及时在客户端下载多媒体内容分段以用于媒体回放,而不会在媒体回放中引起再缓冲事件。换句话说,客户端可以不选择如此高的多媒体内容分段,使得自适应媒体流被周期性地中断,以便在客户端处恢复媒体回放之前将媒体内容的一部分缓存或预加载到客户端上。在一个示例中,不利的网络条件可以降低媒体内容流的质量。不利的网络条件可以包括覆盖零点、突然的带宽变化、数据包丢失、实质的延迟变化等。虽然自适应流技术可以在计算可用吞吐量时并且基于可用吞吐量确定适当的流比特率时考虑当前网络条件,但是在突然的网络变化和/或不利的网络条件期间,可能无法保证客户端处的流畅的媒体播放。
因此,为了在客户端维持自适应媒体流的期望的体验质量,客户端的计划路线和沿着计划路线的当前网络条件可以用于在客户端策略地缓存多媒体内容分段,从而引起更流畅的媒体播放和客户端增强的体验质量。客户端可以选择计划的路线(即,客户端即将开始的地理路线)。当在计划路线上行进时,客户端可以是流媒体内容(例如,电影)。在一个示例中,客户端可以包括位于移动车辆内的移动设备或车辆的计算设备。客户端可以从频道信息数据库(CID)接收计划路线的当前网络条件。当前网络条件可以包括沿着计划路线的某些位置(例如,隧道、桥梁、远程区域),其具有低于预定阈值的对应网络条件。客户端可以从媒体内容服务器请求媒体内容的附加媒体内容分段(例如,电影的附加分段),然后将附加媒体内容分段存储在高速缓存中。当客户端到达沿着具有低于预定阈值的网络条件的计划路线的位置时,客户端可以回放存储在高速缓存中的媒体内容。结果,即使在沿着计划路线的当前网络条件下降到低于预定阈值的时间期间,也可以在客户端处基本上提供连续媒体回放。
无线多媒体标准
已经开发了多种多媒体标准以使多媒体能够向移动计算设备、从移动计算设备或在移动计算设备之间传送。例如,在流视频中,第三代合作伙伴计划(3GPP)已经开发了技术规范(TS)26.234(例如版本11.0.0),其基于用于请求式单播流或直播内容的实时流传输协议(RTSP),描述分组交换流服务(PSS)。此外,在3GPP TS 26.247(例如版本11.0.0)中描述了基于超文本传输协议(HTTP)的流传输服务,包括渐进式下载和通过HTTP的动态自适应流(DASH)。基于3GPP的多媒体广播和多播服务(MBMS)规范TS 26.346(例如版本11.0.0)规定了用于多播/广播内容分发的流传输和下载技术。由此,诸如用户设备(UEs)的基于DASH/PSS/MBMS的移动计算设备在UE设备处解码和呈现流传输的视频。在所有这些规范中强制支持3GPP TS 26.244(例如版本11.0.0)中的3GP文件格式,以支持文件下载和基于HTTP的流使用情况。
在3GPP TS 26.114(例如11.0.0)中提供用于会话视频通信诸如视频会议的标准的一个示例。该标准描述了IMS上的多媒体电话服务(MTSI),其允许基于网际协议(IP)多媒体子系统(IMS)的网络传递高级多媒体会话服务和内容。IMS在3GPP TS 26.140(例如,Rel.2011.0.0)中被标准化。基于MTSI的发射机UE终端可以捕获并记录视频,然后通过3GPP网络将视频传送到基于MTSI的接收机UE终端。然后,接收机UE终端可以解码并呈现视频。3GPP TS 26.140还使得能够使用多媒体共享服务(MMS)进行视频共享,其中提供对3GP文件格式的支持。
上述标准被提供作为可以用于向多媒体设备、从多媒体设备和/或在多媒体设备之间传送多媒体文件的无线多媒体标准的示例。这些示例不旨在限制。附加的标准可用于提供流视频、会话视频或视频共享。
流媒体标准
在本发明的实施例的上下文中提供了HTTP流的更详细的解释,更具体地,本文提供了DASH标准。该详细的解释并不旨在限制。如将在前面的段落中进一步解释的,本发明的实施例可以用于通过使得移动设备或者与移动设备通信的服务器能够有效地向移动设备,从移动设备和/或在移动设备之间传送多媒体,以选择和/或传送具有期望的能量特性的多媒体。可以使用标准化或非标准化的通信方案来传送多媒体。
超文本传输协议(HTTP)流传输可以用作互联网视频的多媒体传递的形式。在HTTP流传输中,多媒体文件可以被分割成一个或多个分段并且使用HTTP协议传递到客户端。基于HTTP的传递可以提供可靠性和部署简单性,这是由于HTTP和HTTP两者的底层协议,包括传递控制协议(TCP)/互联网协议(IP)的广泛采用。基于HTTP的传递可以通过避免网络地址转换(NAT)和防火墙穿越问题来实现简化的流服务。基于HTTP的传递或流传输还可以提供使用标准HTTP服务器和缓存而不是专用流服务器的能力。基于HTTP的传递可以由于服务器侧上的最小或减少的状态信息而提供可扩展性。HTTP流技术的示例可以包括MicrosoftIIS平滑流、Apple HTTP实时流和Adobe HTTP动态流。
DASH是标准化的HTTP流传输协议。如图1所示,DASH可以为媒体呈现描述(MPD)元数据文件102规定不同的格式,其提供关于存储在服务器中的媒体内容表示的结构和不同版本的信息以及分段格式。MPD元数据文件包含关于媒体播放器的初始化和媒体分段的信息(例如,媒体播放器可以查看初始化分段以确定容器格式和媒体定时信息),以确保将分段映射到用于切换的媒体呈现时间线以及具有其他表示的同步呈现。DASH技术也已被其他组织标准化,诸如运动图像专家组(MPEG)、开放IPTV论坛(OIPF)和混合广播宽带电视(HbbTV)。
DASH客户端可以由通过一系列HTTP请求响应事务下载分段来接收多媒体内容。DASH可以在移动设备可用的带宽改变时在媒体内容的不同比特率表示之间提供动态切换的能力。因此,DASH可以允许快速适应变化的网络和无线链路条件、用户偏好和设备能力,诸如显示分辨率、采用的中央处理单元(CPU)的类型、可用的存储器资源等。DASH的动态适配可以为用户提供更好的体验质量(QoE),其具有比其他流协议更短的启动延迟和更少的再缓冲事件。
在DASH中,媒体呈现描述(MPD)元数据102可以提供关于存储在web/媒体服务器212中的媒体内容表示的结构和不同版本的信息,如图2所示。在图1所示的示例中,MPD元数据在时间上被划分为具有预定长度的周期,诸如在该示例中为60秒。每个周期可以包括多个适配集合104。每个适配集合可以用多个编码替换提供关于一个或多个媒体分量的信息。例如,本示例中的适配集合0可以包括各种不同编码的音频替换,诸如不同的比特率、单声道、立体声、环绕声等。除了在周期ID上为多媒体呈现提供不同质量的音频之外,适配集合还可以包括不同语言的音频。在适配集合中提供的不同替换被称为表示106。
在图1中,适配集合1被示出为以不同的比特率,诸如5兆比特每秒(Mbps)、2Mbps、500千比特每秒(kbps)或特技模式提供视频。特技模式可以用于多媒体流文件中的位置的搜索、快进、倒回或其他改变。此外,视频还可以以不同的格式获得,诸如二维(2D)视频或三维(3D)视频。每个表示106可以包括分段信息108。分段信息可以包括初始化信息110和实际媒体分段数据112。在该示例中,MPEG 4(MP4)文件从服务器流传输到移动设备。虽然在该示例中使用MP4,但是可以使用各种不同的编解码器,如前所述。
适配集合中的多媒体可以进一步划分为更小的分段。在图1的示例中,适配集合1的60秒视频段进一步分为每个15秒的四个子段112。这些示例并不旨在限定。适配集合和每个媒体段或子段的实际长度取决于媒体的类型、系统要求、潜在的干扰类型等。实际媒体段或子段可以具有小于一秒到几分钟长的长度。
如图2所示,MPD元数据信息可以被传送到客户端220,诸如移动设备。移动设备可以是经配置以接收和显示流媒体的无线设备。在一个实施例中,移动设备可以仅执行该功能的一部分,诸如接收流媒体,然后将其传送到另一设备或显示设备以进行呈现。移动设备可以经配置以运行客户端220。客户端可以使用HTTP GET 240消息或一系列部分GET消息来请求分段。客户端可以控制流会话,诸如管理准时请求和段序列的流畅播出,或者潜在地调整比特率或其他属性,以对无线链路、设备状态或用户偏爱的改变做出反应。
图2示出了基于DASH的流传输框架。网络/媒体服务器212中的媒体编码器214可以将来自音频/视频输入210的输入媒体编码为用于存储或流传输的格式。媒体分段器216可以用于将输入媒体分离成一系列段232,其可以被提供给网络服务器218。客户端220可以使用发送到web服务器(例如,HTTP服务器)的HTTP GET消息234来请求分段中的新数据。
例如,客户端220的网络浏览器222可以使用HTTP GET消息240请求多媒体内容。网络服务器218可以向客户端提供用于多媒体内容的MPD 242。MPD可以用于传达每个分段的索引和分段的相应位置,如相关联的元数据信息252所示。网络浏览器可以根据MPD 242逐段地从服务器分段拉取媒体,如236所示。例如,网络浏览器可以使用HTTP GET URL(frag1req)244请求第一分段。统一资源定位符(URL)或通用资源定位符可以用于告诉网络服务器哪个分段客户端将要请求254。网络服务器可以提供第一片段(即,分段1 246)。对于后续分段,网络浏览器可以使用HTTP GET URL(frag i req)248请求段i,其中i是分段的整数索引。结果,网络服务器可以提供分段i 250。可以经由媒体解码器/播放器224将分段呈现给客户端。
图3示出了在向诸如UE 336的移动设备上操作的3GPP客户端338,提供多媒体内容的HTTP服务器310之间的多媒体内容312的流程。HTTP服务器可以与公共或专用网络322(或因特网)交界,其与无线广域网(WWAN)的核心网络324通信。在一个实施例中,WWAN可以是基于3GPP LTE的网络或基于IEEE 802.16的网络(即802.16-2009)。核心网络可以经由无线电接入网络(RAN)332访问诸如演进分组系统(EPS)之类的无线网络330。RAN 332可以经由节点(例如,演进型节点B(eNB)334)向在UE 336上操作的客户端提供多媒体内容。
HTTP服务器310可以耦合到频道信息数据库350。该频道信息数据库350可以包括用于多个地理位置的当前网络条件。多个地理位置可以包括特定的道路、街道、邻居、地理区域、桥梁、隧道等。当前网络条件可以基于对多个地理位置的当前网络条件的实时监视。因此,由于当前网络条件的变化,信道信息数据库350可以被动态地更新。另选地,可以基于多个地理位置的历史网络状况信息来推断当前网络状况。在又一示例中,可以使用众包网络条件信息来确定当前网络条件。
在DASH中,可以以不同的表示(例如,对应于质量水平)存储媒体内容。每个表示可以包括可以由客户端(例如,移动设备)请求的媒体内容分段的列表。关于每个表示的不同表示和媒体内容分段的列表的信息可以在MPD中编译并由客户端下载,并且基于MPD,客户端可以从服务器请求不同的媒体内容分段。
在一个示例中,可以对DASH格式的内容和相关联的MPD文件,即,清单文件执行各种后处理操作,以便处理由编码过程引入的质量变化。视频内容特性经常基于内容的性质而改变,这是编码器不能总是产生一致的质量,并且同时产生具有一定的指定比特率的比特流的一个原因。例如,具有相对大量运动的快速变化的场景,诸如在运动视频剪辑中可能难以以一致的质量编码,因此编码数据的质量可能显着波动。作为另一示例,场景之间的转变可能难以在不引入某一水平的质量变化的情况下进行编码。另一方面,编码慢变化场景可以用较少的质量变化来编码,因为使用相对较少数量的位来表示这些场景。
许多商业编码器(或视频编解码器)产生具有可变质量水平的编码媒体内容分段。视频代码是实现数字视频的压缩或解压缩的设备或软件。视频编解码器的一些示例包括H.265或运动图像专家组(MPEG)-H高效率视频编码(HEVC)、H.264或MPEG-4高级视频编码(AVC)或H.263/MPEG-4部分2。
图4是超文本传输协议(DASH)媒体呈现描述(MPD)文件生成过程的示例性动态自适应流的图。在一些示例中,DASH MPD文件生成过程可以发生在内容传递网络(CDN)或运营商网络中的服务器(例如,边缘服务器)处。可以在服务器接收输入视频。输入视频可以包括媒体内容,诸如体育比赛或新闻广播。在服务器处所接收的媒体内容可以包括单个文件(例如,2小时新闻事件的文件)。另外,输入视频可以是原始的未压缩视频信号。在框402中,可以对媒体内容执行视频/音频编码处理。视频编码(或视频转码)过程可以将媒体内容组织成与网络播放器和移动设备兼容的数字格式。换句话说,媒体内容可以经历视频编码过程以将媒体内容转换成在各种设备上可观看的格式。视频编解码器的示例可以包括H.265、H.264、Windows媒体视频(WMV)等。音频编解码器的示例包括MPEG-1或MPEG-2音频层III(MP3)和Windows媒体音频(WMA)。在框404中,可以执行视频多路复用处理以将音频内容和视频内容彼此交错。
在框406中,媒体内容(具有交错的视频和音频)可以经历分割处理。换句话说,媒体内容可以被分割成多个媒体内容分段。例如,每个媒体内容分段可以是0.5秒长、1秒长、2秒长等。在步骤408中,可以生成描述媒体内容分段的DASH MPD。可以对由内容提供商指定的每个比特率重复DASH MPD文件生成处理。因此,MPD可以包含针对给定比特率的多个表示。比特率可以不同于一个表示到另一个表示(例如,500千比特/秒、1000千比特/秒、1500千比特/秒),以便提供自适应媒体内容流。DASH MPD可以被传送到客户端,并且客户端可以使用DASH MPD以从服务器请求特定媒体内容分段从而在客户端处进行回放。
图5在示出了媒体内容分段的表示内的媒体内容分段之间的示例性质量变化。如图5所示,典型表示的质量水平通常可以保持恒定,但可以包括表示中的较高质量和较低质量的异常。由于可变比特率编码的性质、正被编码的媒体内容以及视频编码过程所采用的不同编码技术,从编码、复用和分割过程(如图4所示)得到的媒体内容分段可以在质量水平上变化(例如,与其他媒体内容分段相比,特定媒体内容分段可以具有更大或更小的质量水平)。换句话说,对未压缩视频信号进行编码的处理可能引起质量变化。
在一个示例中,可以使用相同的编码技术对视频内容中的快速移动场景和视频内容中的慢速移动场景进行编码。然而,由于用于快速移动场景的相对大量的比特数以及用于慢速移动场景的相对低的比特数,快速移动场景可以具有比慢速移动场景低的质量,即使两个场景都是在相同的表示中。对于具有不同支持的比特率的客户端,从一个媒体内容分段到另一个媒体内容分段的质量变化可以被客户端注意到。换句话说,客户端的用户可以注意到不同场景或帧之间的质量水平的变化,从而潜在地造成差的用户体验。
图6是包括MPD后处理技术的超文本传输协议(DASH)媒体呈现描述(MPD)文件生成过程的示例性动态自适应流的图。在一些示例中,具有MPD后处理技术的DASH MPD文件生成过程可以发生在内容传递网络(CDN)或运营商网络中的服务器(例如,边缘服务器)处。可以在服务器接收输入视频。输入视频可以包括媒体内容,诸如体育比赛或新闻广播。在框602中,可以对媒体内容执行视频/音频编码处理。在框604中,可以执行视频多路复用处理以使音频内容和视频内容彼此交错。在框606中,视频内容和音频内容(或媒体内容流)可以经历分割处理。换句话说,媒体内容流可以被分割成多个媒体内容分段。在步骤608中,可以生成描述媒体内容分段的DASH MPD。在步骤610中,可以在DASH MPD上执行MPD后处理技术。表示内的类似质量的媒体内容分段可以被分组在一起并且用于创建修改的MPD 620。在一个示例中,MPD后处理技术可以在DASH编码器处而不是在视频编解码器处执行。
可以例如使用质量测量工具614来比较每个表示中的每个媒体内容分段的质量度量。质量度量可以是用于判断媒体内容分段的质量水平的客观标准或主观标准。一般来说,媒体内容质量(或视频质量)是指在原始视频内容与视频内容通过视频发射或处理系统(例如,视频编码器)之后,所感知的视频退化的正式测量或非正式测量。换句话说,质量度量可以测量原始视频信号之间的差异,其通常被认为是高质量(由于原始视频信号未被压缩)和编码(或以其他方式被变换)的视频信号。用于评估数字视频处理系统(例如,视频编解码器)的质量的一种技术是,计算原始视频信号和通过视频处理系统的信号之间的信噪比(SNR)和峰值信噪比(PNSR)。PSNR是常用的客观视频质量度量。其他质量度量可以包括视频质量(PEVQ)、结构相似性(SSIM)和Czenakowski距离(CZD)的感知评估。可以将质量度量分配给每个媒体内容分段,或者另选地,每个媒体内容分段可以被划分为媒体内容子分段,并且每个媒体内容子分段可以被分配质量度量。
可以将每个媒体内容分段的质量度量与该同一表示中的其他媒体内容分段进行比较。如果表示中的媒体内容分段具有与表示中的其他媒体内容分段基本类似的质量,则媒体内容分段不受影响。当媒体内容分段中的每一个的质量度量超过所选择的质量阈值612时,媒体内容分段可以不受影响。在一些示例中,所选择的质量阈值612可以由服务器或用户设备(UE)确定。
如果表示中的媒体内容分段低于所选择的质量阈值612,则可以在表示中替换这些媒体内容分段。例如,这些媒体内容分段可以被来自在MPD文件中描述的不同表示的相应媒体内容分段替换。在一些示例中,不同的表示可以包括以相对较高的比特率或相对较低的比特率的一组媒体内容文件。对应的媒体内容分段的质量度量可以大于所选择的质量阈值612。相应的媒体内容分段可以来自不同表示中的基本相同的媒体时间范围。结果,用于表示的媒体内容分段可以具有基本类似的质量。可以生成修改的MPD 620以包括媒体内容分段,每个具有相对类似的质量水平。修改的MPD 620可以被传送到客户端,其中修改的MPD可以在客户端提供媒体内容分段的基本上恒定质量的回放。可以向客户端提供具有质量上的最小时间变化的媒体内容的表示。因此,客户端可以访问给定的表示并且在回放期间体验稳定的质量和减少的质量波动量。
作为非限制性示例,2秒媒体内容分段可以对应于2:11:22(即,两个小时、十一分钟和二十二秒)到2:11:24的视频时间码。2秒媒体内容分段可以包括在4.5兆比特每秒(Mbps)的视频流中。2秒媒体内容分段的质量度量可被确定为低于质量阈值612。来自较高表示的对应媒体内容分段(例如,在5.3Mbps视频流中具有2:11:22至2:11:24的视频时间码的2秒媒体内容分段)可以用降低的质量来替换2秒的媒体内容分段。因此,具有类似质量(尽管不同的比特率)的媒体内容分段可以在表示中被分组在一起。媒体内容分段可以被混合和匹配,以便实现所有基本上具有相同质量水平的表示中的一组媒体内容分段。
在一个示例中,被分组在一起的媒体内容分段可以具有类似的质量水平,但是具有不同的比特率。例如,相对较高比特率的媒体内容分段可以与相对较低比特率的媒体内容分段混合(即使质量水平基本上类似)。当媒体内容分段的比特率具有较小的波动时,客户端可以更有效地操作。因此,对于客户端可能期望最小量的比特率波动。另一方面,具有不同质量水平的段对于客户端的用户可能是不期望的。因此,可以在实现稳定的比特率和实现稳定的视频质量之间进行权衡或折衷。
在另选的配置中,具有低于所选质量阈值612的质量度量的表示中的媒体内容分段可以被重新编码。例如,可以使用不同的编码器配置来重新编码媒体内容分段。可使用视频编解码器(例如,H.264)或音频编解码器(例如,MP3)来重新编码媒体内容分段。重新编码媒体内容分段可以提高质量水平,使得重新编码的媒体内容分段的质量度量可以高于质量阈值612。换句话说,媒体内容分段可以被重新编码,并且可以确定重新编码的媒体内容分段的质量度量。如果质量度量现在高于质量阈值612,则重新编码的媒体内容分段可以包括在MPD中。结果,表示中的媒体内容分段(即,被重新编码的媒体内容分段和未被重新编码的媒体内容分段两者)可以具有相对类似的质量水平。
在一个示例中,可以针对特定设备类型(或目标设备)生成修改的MPD 612,因为质量阈值612可以取决于用户正在使用的设备的类型。例如,与6英寸显示屏相比,高分辨率12英寸显示屏可以具有更大数量的像素,因此,在6英寸显示屏上具有可接受质量的视频可能是不可接受的12寸显示屏。因此,对于具有已知能力(例如,屏幕尺寸、屏幕分辨率)的给定目标设备,可以对该特定目标设备执行MPD后处理。对于每种设备类型,可以在DASH级别重新编码媒体内容。用于电视的媒体内容可以与用于智能手机或平板计算机的媒体内容不同地被编码。在一个示例中,订阅高级订阅计划的客户端能够访问针对该特定客户端编码的媒体内容。
在另一示例中,MD后处理可以用于通过使用现有表示的组合来创建媒体内容的新表示,但是具有更适合于特定客户端的新比特率值。例如,可以组合用于500Kbps表示的媒体内容分段和用于1000Kbps表示的媒体内容分段(即,相同媒体内容),以创建媒体内容的750Kbps表示,而不必对媒体内容进行转码。
另一示例提供可操作以支持超文本传输协议(DASH)上的动态自适应流的网络设备的电路的功能700,如图6的流程图所示。功能可以实现为方法,或者功能可以作为机器上的指令被执行,其中指令包括在至少一个计算机可读介质或一个非暂时性机器可读存储介质上。该电路可以经配置以在媒体呈现描述(MPD)文件中所描述的定义的表示中识别多个媒体内容分段,如在框710中。该电路可以经配置以确定在MPD文件中所描述的定义的表示中的多个媒体内容分段中的每一个的质量度量,如在框720中。该电路可以经配置以识别定义的表示中的媒体内容分段,其中所确定的质量度量低于所选的阈值,如在框730中。此外,该电路可以经配置以用来自在MPD文件中所描述的不同表示的相应媒体内容分段替换所识别的媒体内容分段,以形成修改的MPD文件,其中相应的媒体内容分段的质量度量大于所选择的阈值,以便在定义的表示中提供媒体内容分段的基本上恒定质量的回放,如在框740中。
在一个示例中,该电路可以进一步经配置以将修改的MPD文件传送到支持DASH的客户端设备。在另一示例中,该电路还可以经配置以生成用于特定设备类型的修改的MPD。在又一示例中,网络设备位于内容传递网络(CDN)中或运营商网络中。
在一个方面,该电路可以进一步经配置以使用比特率参数或质量参数中的至少一个来识别媒体内容分段的质量度量。在另一方面,相对于定义的表示中的媒体内容分段,相应的媒体内容分段来自不同表示中的基本相同的媒体时间范围。在又一方面,该电路可以进一步经配置以在所定义的表示中重新编码媒体内容分段,其中所确定的质量度量低于所选阈值,使得重新编码的媒体内容分段的所确定的质量度量高于所选阈值。
另一个示例提供了一种用于支持超文本传输协议(DASH)上的动态自适应流的方法800,如图6的流程图所示。该方法可以作为机器上的指令来执行,其中指令包括在至少一个计算机可读介质或一个非暂时性机器可读存储介质上。该方法可以包括在网络设备处确定质量度量的操作,其针对在媒体呈现描述(MPD)文件中所描述的定义的表示中的多个媒体内容分段中的每一个,如在框810中。该方法可以包括在所定义的表示中识别媒体内容分段的操作,其中所确定的质量度量低于所选择的阈值,如在框820中。该方法可以包括用来自在MPD文件中所描述的不同表示的相应的媒体内容分段,替换所识别的媒体内容分段的操作,以形成修改的MPD文件,其中相应的媒体内容分段的质量度量大于所选择的阈值,以便提供所定义的表示中的媒体内容分段的基本上恒定质量的回放,如在框830中。
在一个示例中,该方法可以包括将修改的MPD文件从网络设备传送到支持DASH的客户端设备的操作。在另一示例中,该方法可以包括在网络设备处从用户设备(UE)接收用于质量度量的所选阈值的操作。在又一示例中,该方法可以包括为特定设备类型生成修改的MPD的操作。
在一种配置中,网络设备位于内容传递网络(CDN)或运营商网络中。在另一种配置中,该方法还包括使用比特率参数或质量参数中的至少一个来识别媒体内容分段的质量度量。在又一种配置中,相比于所定义的表示中的媒体内容分段,相应的媒体内容分段来自不同表示中的基本相同的媒体时间范围。另外,该方法可以包括在所定义的表示中重新编码媒体内容分段的操作,其中所确定的质量度量低于所选择的阈值,使得重新编码的媒体内容分段的所确定的质量度量高于所选择的阈值。
另一示例提供可操作以支持超文本传输协议(DASH)上的动态自适应流的网络设备的电路的功能900,如图6的流程图所示。该功能可以被实现为方法,或者该功能可以作为机器上的指令来执行,其中指令被包括在至少一个计算机可读介质或一个非暂时性机器可读存储介质上。该电路可以经配置以识别在媒体呈现描述(MPD)文件中所描述的定义的表示中的多个媒体内容分段,如在框910中。该电路可以经配置以确定在MPD文件中所描述的定义的表示中的多个媒体内容分段中的每一个的质量度量,如在框920中。该电路可以经配置以识别所定义的表示中的媒体内容分段,其中所确定的质量度量低于所选阈值,如在框930中。该电路可进一步经配置以在所定义的表示中重新编码该媒体内容分段,其中所确定的质量度量低于所选阈值,使得重新编码的媒体内容分段的所确定的质量度量高于所选择的阈值,如在框940中。此外,该电路可以进一步经配置以生成修改的MPD以包括重新编码的媒体内容分段,以便提供所定义的表示中的媒体内容分段的基本上恒定质量的回放,如在框950中。
在一个示例中,该电路可以进一步经配置以将修改的MPD文件传送到支持DASH的客户端设备。在另一示例中,该电路还可以经配置以生成用于特定设备类型的修改的MPD。在又一示例中,网络设备位于内容传递网络(CDN)中或运营商网络中。
在一个方面,该电路可以进一步经配置以使用比特率参数或质量参数中的至少一个来识别媒体内容分段的质量度量。在另一方面,该电路可以进一步经配置以用来自在MPD文件中所描述的不同表示的相应媒体内容分段,替换所识别的媒体内容分段,以形成修改的MPD文件,其中相应媒体内容分段的质量度量大于所选择的阈值。在又一方面,相比于所定义的表示中的媒体内容分段,相应的媒体内容分段来自不同表示中的基本上相同的媒体时间范围。
图10提供了无线设备的示例图示,诸如用户设备(UE)、移动站(MS)、移动无线设备、移动通信设备、平板电脑、手机或其他类型的无线设备。该无线设备可以包括经配置以与节点或传输站通信的一个或多个天线,诸如基站(BS)、演进节点B(eNB)、基带单元(BBU)、远程无线电头端(RRH)、远程无线电设备(RRE)、中继站(RE)、远程无线电单元(RRU)、中央处理模块(CPM)或其他类型的无线广域网(WWAN)接入点。该无线设备可以经配置以使用包括3GPP LTE、WiMAX、高速分组接入(HSPA)、蓝牙和WiFi的至少一个无线通信标准进行通信。该无线设备可以使用用于每个无线通信标准的单独天线或者用于多个无线通信标准的共享天线进行通信。该无线设备可以在无线局域网(WLAN)、无线个域网(WPAN)和/或WWAN中进行通信。
图10还提供了麦克风和一个或多个扬声器的图示,其可以用于来自无线设备的音频输入和输出。显示屏可以是液晶显示器(LCD)屏,或其他类型的显示屏诸如有机发光二极管(OLED)显示器。该显示屏可以经配置以触摸屏。该触摸屏可以使用电容、电阻或另一类型的触摸屏技术。应用处理器和图形处理器可以耦合到内部存储器以提供处理能力和显示能力。非易失性存储器端口也可以用于向用户提供数据输入/输出选项。非易失性存储器端口还可以用于扩展无线设备的存储器能力。键盘可以与无线设备集成或无线地连接到无线设备以提供附加的用户输入。还可以使用触摸屏来提供虚拟键盘。
各种技术或其某些方面或部分可以采取体现在有形介质中的程序代码(即,指令)的形式,诸如软盘、光盘只读存储器(CD-ROM)、硬盘驱动器、非暂时性计算机可读存储介质或任何其它机器可读存储介质,其中当程序代码被加载到诸如计算机的机器中并由机器执行时,该机器成为用于实践各种技术的装置。电路可以包括硬件、固件、程序代码、可执行代码、计算机指令和/或软件。非暂时性计算机可读存储介质可以是不包括信号的计算机可读存储介质。在可编程计算机上执行程序代码的情况下,计算设备可以包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件)、至少一个输入设备和至少一个输出设备。易失性和非易失性存储器和/或存储元件可以是随机存取存储器(RAM)、可擦除可编程只读存储器(EPROM)、闪存驱动器、光驱动器、磁硬盘驱动器、固态驱动器或用于存储电子数据的其他介质。节点和无线设备还可以包括收发器模块(即收发器)、计数器模块(即计数器)、处理模块(即处理器)和/或时钟模块(即时钟)或定时器模块(即定时器)。可以实现或利用本文所描述的各种技术的一个或多个程序可以使用应用编程接口(API)、可重用控制等。此类程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,如果需要,程序可以以汇编或机器语言实现。在任何情况下,语言可以是编译语言或解释语言,并且与硬件实现结合。
应当理解,在本说明书中所描述的许多功能单元已经被标记为模块,以便更具体地强调其实现独立性。例如,模块可以被实现为包括定制的超大规模集成(VLSI)电路或门阵列、现成的半导体(诸如逻辑芯片、晶体管或其他分立组件)的硬件电路。模块还可以在诸如现场可编程门阵列、可编程阵列逻辑、可编程逻辑器件等的可编程硬件设备中实现。
模块还可以在用于由各种类型的处理器执行的软件中实现。可执行代码的识别的模块可以例如包括计算机指令的一个或多个物理框或逻辑框,其可以例如被组织为对象、过程或功能。然而,所识别的模块的可执行体不需要物理地位于一起,而是可以包括存储在不同位置的不同指令,当逻辑地连接在一起时,其包括模块并实现模块的所述目的。
实际上,可执行代码的模块可以是单个指令或许多指令,并且甚至可以分布在几个不同的代码段上,在不同的程序之间,以及跨几个存储器设备。类似地,操作数据可以在模块内被识别和示出,并且可以以任何合适的形式体现并组织在任何合适类型的数据结构内。该操作数据可以被收集为单个数据集,或者可以分布在不同的位置,包括在不同的存储设备上,并且可以至少部分地仅作为电子信号存在于系统或网络上。该模块可以是被动的或主动的,包括可操作以执行所需功能的代理。
贯穿本说明书对“示例”或“示例性”的引用是指结合示例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,贯穿本说明书的各个地方出现的短语“在示例中”或词语“示例性”不一定都指代相同的实施例。
如本文所使用的,为了方便起见,可以在公共列表中呈现多个项目、结构元件、组成元件和/或材料。然而,这些列表应被解释为列表的每个成员被分别地识别为单独的和唯一的成员。因此,仅基于其在共同组中的呈现而没有相反指示,不应将该列表的单个成员解释为相同列表的任何其他成员的实际上的等同物。另外,本文中可以参考本发明的各种实施例和示例以及其各种组件的替代。应当理解,此类实施例、示例和替代不被解释为彼此的实际上的等同物,而是被认为是本发明的单独的和自主的表示。
此外,所描述的特征、结构或特性可以以任何合适的方式组合在一个或多个实施例中。在下面的描述中,提供了许多具体细节,诸如布局、距离、网络示例等的示例,以提供对本发明的实施例的透彻理解。然而,相关领域的技术人员将认识到,可以在没有一个或多个具体细节的情况下或者利用其他方法、组件、布局等来实现本发明。在其他情况下,公知的结构、材料或操作未详细示出或描述以避免模糊本发明的方面。
虽然前述示例在一个或多个特定应用中说明了本发明的原理,但是对于本领域普通技术人员来说,显然可以在形式、用途和实施细节上进行多种修改,而不需要在不脱离本发明的原理和概念的情况下实施创造性的教导。因此,除了由下面阐述的权利要求之外,不意在限制本发明。

Claims (22)

1.一种可操作以支持超文本传输协议(DASH)上的动态自适应流的网络设备,所述网络设备具有电路,其经配置以:
识别在媒体呈现描述(MPD)文件中所描述的定义的表示中的多个媒体内容分段;
确定在所述MPD文件中所描述的所述定义的表示中的所述多个媒体内容分段中的每一个的质量度量;
识别所述定义的表示中的媒体内容分段,其中确定的质量度量低于选择的阈值;以及
用来自在所述MPD文件中所描述的不同表示的相应媒体内容分段替换识别的媒体内容分段,以形成修改的MPD文件,其中所述对应的媒体内容分段的所述质量度量大于选择的阈值,以便提供所述定义的表示中的所述媒体内容分段的基本上恒定质量的回放。
2.根据权利要求1所述的电路,其进一步经配置以将所述修改的MPD文件传送到支持DASH的客户端设备。
3.根据权利要求1所述的电路,其进一步经配置以针对特定设备类型生成所述修改的MPD。
4.根据权利要求1所述的电路,其中所述网络设备位于内容传递网络(CDN)中或运营商网络中。
5.根据权利要求1所述的电路,其进一步经配置以使用比特率参数或质量参数中的至少一个来识别所述媒体内容分段的所述质量度量。
6.根据权利要求1所述的电路,其中所述相应媒体内容分段相比于在所述定义的表示中的所述媒体内容分段,来自所述不同的表示中的基本相同的媒体时间范围。
7.根据权利要求1所述的电路,其进一步经配置以在所述定义的表示中重新编码所述媒体内容分段,其中确定的质量度量低于选择的阈值,使得重新编码的媒体内容片断的确定的质量度量高于选择的阈值。
8.一种用于支持超文本传输协议(DASH)上的动态自适应流的方法,所述方法包括:
在网络设备处确定质量度量,其针对在媒体呈现描述(MPD)文件中所描述的定义的表示中的多个媒体内容分段中的每一个;
识别所述定义的表示中的媒体内容分段,其中确定的质量度量低于选择的阈值;以及
用来自在所述MPD文件中所描述的不同表示的相应媒体内容分段来替换识别的媒体内容分段,以形成修改的MPD文件,其中所述对应的媒体内容分段的所述质量度量大于选择的阈值,以便提供所述定义的表示中的所述媒体内容分段的基本上恒定质量的回放。
9.根据权利要求8所述的方法,其进一步包括将所述修改的MPD文件从所述网络设备传送到支持DASH的客户端设备。
10.根据权利要求8所述的方法,其进一步包括在所述网络设备处从用户设备(UE)接收所述质量度量的所述选择的阈值。
11.根据权利要求8所述的方法,其进一步包括为特定设备类型生成所述修改的MPD。
12.根据权利要求8所述的方法,其中所述网络设备位于内容传递网络(CDN)中或运营商网络中。
13.根据权利要求8所述的方法,其进一步包括使用比特率参数或质量参数中的至少一个来识别所述媒体内容分段的所述质量度量。
14.根据权利要求8所述的方法,其中所述相应媒体内容分段相比于所述定义的表示中的所述媒体内容分段,来自所述不同表示中的基本相同的媒体时间范围。
15.根据权利要求8所述的方法,其进一步包括在所述定义的表示中重新编码所述媒体内容分段,其中确定的质量度量低于选择的阈值,使得重新编码的媒体内容分段的确定的质量度量高于选择的阈值。
16.一种可操作以支持超文本传输协议(DASH)上的动态自适应流的网络设备,所述网络设备具有电路,其经配置以:
识别在媒体呈现描述(MPD)文件中所描述的定义的表示中的多个媒体内容分段;
确定在所述MPD文件中所描述的所述定义的表示中的所述多个媒体内容分段中的每一个的质量度量;
识别所述定义的表示中的媒体内容分段,其中所述确定的质量度量低于选择的阈值;
在所述定义的表示中重新编码所述媒体内容分段,其中确定的质量度量低于选择的阈值,使得所述重新编码的媒体内容分段的确定的质量度量高于选择的阈值;以及
生成修改的MPD以包括重新编码的媒体内容分段,以便提供所述定义的表示中的所述媒体内容分段的基本上恒定质量的回放。
17.根据权利要求16所述的电路,其进一步经配置以将所述修改的MPD文件传送到支持DASH的客户端设备。
18.根据权利要求16所述的电路,其进一步经配置以针对特定设备类型生成所述修改的MPD。
19.根据权利要求16所述的电路,其中所述网络设备位于内容传递网络(CDN)中或运营商网络中。
20.根据权利要求16所述的电路,其进一步经配置以使用比特率参数或质量参数中的至少一个来识别所述媒体内容分段的所述质量度量。
21.根据权利要求16所述的电路,其进一步经配置以用来自在所述MPD文件中所描述的不同表示的相应媒体内容分段来替换所述识别的媒体内容分段,以形成所述修改的MPD文件,其中所述对应的媒体内容分段的所述质量度量大于所述选择的阈值。
22.根据权利要求21所述的电路,其中所述对应的媒体内容分段相比于在所述定义的表示中的所述媒体内容分段,来自所述不同的表示中的基本相同的媒体时间范围。
CN201580044972.3A 2014-09-23 2015-08-26 支持超文本传输协议上的动态自适应流的设备和方法 Active CN106576182B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/494,192 US9894130B2 (en) 2014-09-23 2014-09-23 Video quality enhancement
US14/494,192 2014-09-23
PCT/US2015/046947 WO2016048558A1 (en) 2014-09-23 2015-08-26 Video quality enhancement

Publications (2)

Publication Number Publication Date
CN106576182A true CN106576182A (zh) 2017-04-19
CN106576182B CN106576182B (zh) 2020-05-05

Family

ID=54140652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580044972.3A Active CN106576182B (zh) 2014-09-23 2015-08-26 支持超文本传输协议上的动态自适应流的设备和方法

Country Status (10)

Country Link
US (1) US9894130B2 (zh)
EP (1) EP3198877A1 (zh)
JP (1) JP6337350B2 (zh)
KR (1) KR102266325B1 (zh)
CN (1) CN106576182B (zh)
BR (1) BR112017003469A2 (zh)
CA (1) CA2957215A1 (zh)
RU (1) RU2658642C1 (zh)
TW (1) TWI590632B (zh)
WO (1) WO2016048558A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105306969A (zh) * 2015-09-02 2016-02-03 越亮传奇科技股份有限公司 一种流媒体自适应处理系统及方法
CN114731451A (zh) * 2019-11-21 2022-07-08 西娜媒体有限公司 使用边缘计算系统的视频内容流比特率选择以改进用户体验
US11412283B1 (en) 2021-04-27 2022-08-09 City University Of Hong Kong System and method for adaptively streaming video

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3860130A1 (en) * 2013-08-16 2021-08-04 bitmovin GmbH Apparatus and method for constant quality optimization for adaptive streaming
KR102009124B1 (ko) * 2014-01-29 2019-08-08 코닌클리즈케 케이피엔 엔.브이. 이벤트 스트리밍 프레젠테이션 확립
WO2016059060A1 (en) 2014-10-14 2016-04-21 Koninklijke Kpn N.V. Managing concurrent streaming of media streams
WO2016133296A1 (ko) * 2015-02-16 2016-08-25 엘지전자 주식회사 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법
US20160249092A1 (en) * 2015-02-24 2016-08-25 Layer3 TV, Inc. System and method for digital video recording backfill
FR3034943B1 (fr) * 2015-04-07 2017-04-14 Streamroot Inc Procede de lecture en continu sur un equipement client d'un contenu diffuse au sein d'un reseau pair a pair
US10567816B2 (en) * 2015-04-30 2020-02-18 Comcast Cable Communications, Llc Delivering content
US11109101B1 (en) * 2015-05-13 2021-08-31 T-Mobile Usa, Inc. Apparatus, system, and method for ABR segment pull DVR
EP3387835A1 (en) 2015-12-11 2018-10-17 VID SCALE, Inc. Scheduling multiple-layer video segments
US10432690B1 (en) * 2016-06-03 2019-10-01 Amazon Technologies, Inc. Manifest partitioning
CA3030827C (en) * 2016-07-14 2021-08-24 Arris Enterprises Llc Quality tagging in adaptive bitrate technologies
JP6891497B2 (ja) * 2017-01-06 2021-06-18 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
JPWO2018173876A1 (ja) * 2017-03-24 2020-01-30 ソニー株式会社 コンテンツ処理装置およびコンテンツ処理方法、並びにプログラム
US10484308B2 (en) 2017-03-31 2019-11-19 At&T Intellectual Property I, L.P. Apparatus and method of managing resources for video services
US10819763B2 (en) 2017-03-31 2020-10-27 At&T Intellectual Property I, L.P. Apparatus and method of video streaming
US10362080B2 (en) * 2017-04-25 2019-07-23 At&T Intellectual Property I, L.P. Methods, systems, and devices for video streaming adaptation using control theoretic approach
US20180343468A1 (en) * 2017-05-26 2018-11-29 Comcast Cable Communications, Llc Dynamic Encoding Using Remote Encoding Profiles
EP3451672A1 (en) * 2017-08-29 2019-03-06 Nokia Solutions and Networks Oy Method and device for video content encoding optimisation in adaptive streaming systems
US20190166170A1 (en) * 2017-11-29 2019-05-30 Comcast Cable Communications, Llc Video Streaming Delivery
US10728180B2 (en) 2018-08-21 2020-07-28 At&T Intellectual Property I, L.P. Apparatus, storage medium and method for adaptive bitrate streaming adaptation of variable bitrate encodings
JP7161103B2 (ja) * 2018-10-25 2022-10-26 日本電信電話株式会社 通信システム、ネットワーク側装置、伝送機能変更方法及びプログラム
US11044185B2 (en) 2018-12-14 2021-06-22 At&T Intellectual Property I, L.P. Latency prediction and guidance in wireless communication systems
US10887660B2 (en) * 2018-12-27 2021-01-05 Comcast Cable Communications, Llc Collaborative media quality determination
JP2022518234A (ja) * 2019-01-17 2022-03-14 ブライトコーブ インコーポレイテッド 最適なマルチコーデックabrラダー設計
US11184648B2 (en) * 2019-08-30 2021-11-23 Rovi Guides, Inc. Systems and methods for providing content during reduced streaming quality
US11374776B2 (en) * 2019-09-28 2022-06-28 Intel Corporation Adaptive dataflow transformation in edge computing environments
US11973991B2 (en) * 2019-10-11 2024-04-30 International Business Machines Corporation Partial loading of media based on context
KR102193806B1 (ko) * 2020-03-27 2020-12-22 연진선 Ar 콘텐츠의 실시간 분산 송출시스템
KR20220012740A (ko) * 2020-07-23 2022-02-04 삼성전자주식회사 통신 시스템에서 컨텐츠의 송수신을 제어하기 위한 방법 및 장치
US11483472B2 (en) * 2021-03-22 2022-10-25 International Business Machines Corporation Enhancing quality of multimedia
US11533427B2 (en) * 2021-03-22 2022-12-20 International Business Machines Corporation Multimedia quality evaluation
US11716531B2 (en) 2021-03-22 2023-08-01 International Business Machines Corporation Quality of multimedia
US11716214B2 (en) * 2021-07-19 2023-08-01 Verizon Patent And Licensing Inc. Systems and methods for dynamic audiovisual conferencing in varying network conditions
US11895173B2 (en) * 2022-01-07 2024-02-06 Avago Technologies International Sales Pte. Limited Gapped and/or subsegmented adaptive bitrate streams

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102130936A (zh) * 2010-08-17 2011-07-20 华为技术有限公司 一种在动态http流传输方案中支持时移回看的方法和装置
US20130042015A1 (en) * 2011-08-12 2013-02-14 Cisco Technology, Inc. Constant-Quality Rate-Adaptive Streaming
CN103368940A (zh) * 2012-04-09 2013-10-23 英特尔公司 媒体内容的组合单播-多播/广播流的体验质量报告
US20140013375A1 (en) * 2012-07-09 2014-01-09 Futurewei Technologies, Inc. Dynamic Adaptive Streaming over Hypertext Transfer Protocol Client Behavior Framework and Implementation of Session Management
CN103596065A (zh) * 2012-08-03 2014-02-19 英特尔公司 装置定向能力交换信令和多媒体内容的服务器适应性修改
WO2014113710A1 (en) * 2013-01-18 2014-07-24 Huawei Technologies. Co., Ltd Method and apparatus for performing adaptive streaming on media contents
CN103959733A (zh) * 2011-06-30 2014-07-30 高通股份有限公司 用于单播或广播/多播服务的动态自适应流送代理
CN103973662A (zh) * 2013-02-06 2014-08-06 华为技术有限公司 流媒体请求方法及控制器
US20140281556A1 (en) * 2013-03-14 2014-09-18 Qualcomm Incorporated Media presentation description verification

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1908303A4 (en) * 2005-07-01 2011-04-06 Sonic Solutions METHOD, DEVICE AND SYSTEM FOR USE IN MULTIMEDIA SIGNAL CODING
US20130290492A1 (en) * 2009-06-12 2013-10-31 Cygnus Broadband, Inc. State management for video streaming quality of experience degradation control and recovery using a video quality metric
CA2784233C (en) * 2010-01-18 2017-05-16 Telefonaktiebolaget L M Ericsson (Publ) Methods and arrangements for http media stream distribution
US9456015B2 (en) * 2010-08-10 2016-09-27 Qualcomm Incorporated Representation groups for network streaming of coded multimedia data
WO2013004260A1 (en) * 2011-07-07 2013-01-10 Telefonaktiebolaget L M Ericsson (Publ) Network-capacity optimized adaptive http streaming
US9112942B2 (en) * 2011-07-15 2015-08-18 Shmuel Ur Dynamic modification of media streams' quality
TWI610554B (zh) * 2012-07-10 2018-01-01 Vid衡器股份有限公司 無線傳輸/接收單元中內容切換/品質驅動切換的方法
US9125073B2 (en) 2012-08-03 2015-09-01 Intel Corporation Quality-aware adaptive streaming over hypertext transfer protocol using quality attributes in manifest file
JP6270873B2 (ja) * 2013-01-15 2018-01-31 華為技術有限公司Huawei Technologies Co.,Ltd. メディアコンテンツの適応型ストリーミングのための品質情報の使用
US20140254659A1 (en) * 2013-03-11 2014-09-11 Mediatek Inc. Video coding method using at least evaluated visual quality and related video coding apparatus
US9402107B2 (en) * 2013-03-15 2016-07-26 Time Warner Cable Enterprises Llc Apparatus and methods for delivery of multicast and unicast content in a content delivery network
WO2014158264A1 (en) 2013-03-29 2014-10-02 Intel IP Corporation Quality-aware rate adaptation techniques for dash streaming
CN104105012B (zh) * 2013-04-03 2018-04-20 华为技术有限公司 流媒体的片段准备方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102130936A (zh) * 2010-08-17 2011-07-20 华为技术有限公司 一种在动态http流传输方案中支持时移回看的方法和装置
CN103959733A (zh) * 2011-06-30 2014-07-30 高通股份有限公司 用于单播或广播/多播服务的动态自适应流送代理
US20130042015A1 (en) * 2011-08-12 2013-02-14 Cisco Technology, Inc. Constant-Quality Rate-Adaptive Streaming
CN103368940A (zh) * 2012-04-09 2013-10-23 英特尔公司 媒体内容的组合单播-多播/广播流的体验质量报告
US20140013375A1 (en) * 2012-07-09 2014-01-09 Futurewei Technologies, Inc. Dynamic Adaptive Streaming over Hypertext Transfer Protocol Client Behavior Framework and Implementation of Session Management
CN103596065A (zh) * 2012-08-03 2014-02-19 英特尔公司 装置定向能力交换信令和多媒体内容的服务器适应性修改
WO2014113710A1 (en) * 2013-01-18 2014-07-24 Huawei Technologies. Co., Ltd Method and apparatus for performing adaptive streaming on media contents
CN103973662A (zh) * 2013-02-06 2014-08-06 华为技术有限公司 流媒体请求方法及控制器
US20140281556A1 (en) * 2013-03-14 2014-09-18 Qualcomm Incorporated Media presentation description verification

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105306969A (zh) * 2015-09-02 2016-02-03 越亮传奇科技股份有限公司 一种流媒体自适应处理系统及方法
CN114731451A (zh) * 2019-11-21 2022-07-08 西娜媒体有限公司 使用边缘计算系统的视频内容流比特率选择以改进用户体验
US11412283B1 (en) 2021-04-27 2022-08-09 City University Of Hong Kong System and method for adaptively streaming video

Also Published As

Publication number Publication date
JP2017533607A (ja) 2017-11-09
KR20170032431A (ko) 2017-03-22
RU2658642C1 (ru) 2018-06-22
TWI590632B (zh) 2017-07-01
TW201622393A (zh) 2016-06-16
CN106576182B (zh) 2020-05-05
JP6337350B2 (ja) 2018-06-06
US20160088054A1 (en) 2016-03-24
KR102266325B1 (ko) 2021-06-18
BR112017003469A2 (pt) 2017-12-05
WO2016048558A1 (en) 2016-03-31
CA2957215A1 (en) 2016-03-31
US9894130B2 (en) 2018-02-13
EP3198877A1 (en) 2017-08-02

Similar Documents

Publication Publication Date Title
CN106576182A (zh) 视频质量提升
US11038944B2 (en) Client/server signaling commands for dash
CN105075214B (zh) 用于提供多媒体自适应流传输的方法和设备
JP6498741B2 (ja) 目標メディアコンテンツの配信
JP6455741B2 (ja) ビデオの向きの調整(cvo)を伴うストリーミング
CN107005727A (zh) 媒体内容流
US9351020B2 (en) On the fly transcoding of video on demand content for adaptive streaming
CN104956631B (zh) 用于执行链路感知自适应流传输的设备和方法
CN104604286A (zh) 用于流式传输和对话服务的能量感知多媒体自适应
CN107079177B (zh) 用于媒体内容质量信息的携带的装置及存储介质
CN107210999A (zh) 链路感知流送自适应
Abdullah et al. Survey of transportation of adaptive multimedia streaming service in internet
Stockhammer MPEG's Dynamic Adaptive Streaming over HTTP (DASH)–Enabling Formats for Video Streaming over the Open Internet
Kim et al. Adaptive video streaming over http
dos Santos Nunes CASHED: Cloud-Assisted Adaptive and Scalable Video Streaming for Heterogeneous End-User Devices

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1234236

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant