CN114514752A - 用于交互式播放dash内容的应用程序预期交互式选择信息 - Google Patents
用于交互式播放dash内容的应用程序预期交互式选择信息 Download PDFInfo
- Publication number
- CN114514752A CN114514752A CN202180005485.1A CN202180005485A CN114514752A CN 114514752 A CN114514752 A CN 114514752A CN 202180005485 A CN202180005485 A CN 202180005485A CN 114514752 A CN114514752 A CN 114514752A
- Authority
- CN
- China
- Prior art keywords
- time period
- user interface
- period
- client
- periods
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002452 interceptive effect Effects 0.000 title description 12
- 238000000034 method Methods 0.000 claims abstract description 52
- 230000003993 interaction Effects 0.000 claims abstract description 21
- 238000010586 diagram Methods 0.000 claims description 24
- 230000015654 memory Effects 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 230000033001 locomotion Effects 0.000 description 19
- 230000006835 compression Effects 0.000 description 11
- 238000007906 compression Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 5
- 230000001934 delay Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000001339 gustatory effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
- H04N21/2353—Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/63—Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
- H04N21/643—Communication protocols
- H04N21/64322—IP
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/61—Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
- H04L65/612—Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for unicast
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/262—Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
- H04N21/26291—Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for providing content or additional data updates, e.g. updating software modules, stored at the client
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/44029—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display for generating different versions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47205—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for manipulating displayed content, e.g. interacting with MPEG-4 objects, editing locally
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47217—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/63—Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
- H04N21/633—Control signals issued by server directed to the network components or client
- H04N21/6332—Control signals issued by server directed to the network components or client directed to client
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/658—Transmission by the client directed to the server
- H04N21/6587—Control parameters, e.g. trick play commands, viewpoint selection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8541—Content authoring involving branching, e.g. to different story endings
Abstract
包括一种方法和装置,其包括计算机代码,被配置为使一个或多个处理器执行:提供要流传输到客户端的视频内容的媒体呈现描述MPD事件和媒体片段;控制所述客户端基于所述MPD事件提供用户界面,并包括多个选择选项和每个选择选项的交互数据;以及通过所述用户界面,基于所述多个选择选项中的至少一个选择更新MPD数据。
Description
相关申请的交叉引用
本申请要求于2021年4月28日提交的、申请号为17/242,863的美国专利申请的优先权,其要求于2020年6月23日提交的、申请号为63/042,946的美国临时申请的优先权,其内容通过引用明确地整体并入本申请。
技术领域
本公开涉及用于交互式播放的基于HTTP的动态自适应流传输(DASH)事件。
背景技术
在MPEG DASH中,一个清单可能仅表示一个故事情节,即使可以更新清单以更改故事情节,故事地图也需要由应用程序在清单之外维护。
如果故事地图中的连接使用媒体呈现描述(MPD)事件来传递,则故事情节可以更改为用户选择,以便基于在播放呈现之后的特定时刻选择的用户决定来继续呈现。
在DASH中,如果要使用一个时段来更新清单,在该时段期间、接近该时段或该时段结束时,应用程序请求用户选择,以确定使用新的时段来更新清单,从而相应地执行故事,那么存在一个技术问题:由于所有内容都可以是点播的并且所有时段元素都可以存储在远程服务器中,所以即使通过基于用户选择顺序地添加时段来创建动态清单,也可以在每个时段结束时进行回调以更新清单。根据网络参数(例如,如果用户选择较早发生,则可能发生的关于未使用的缓冲的延迟,以及关于至少在相应的选择时由于缺乏对用户的视觉引导而受到阻碍的用户选择的实用性的延迟),这在技术上可能是有问题的。
发明内容
为了解决一个或多个不同的技术问题,本公开提供了减少网络开销和服务器计算开销的技术方案,同时提供了将各种操作应用于已解决元素的选项,以便在使用这些操作时,可以改进故事情节视频的一些实用性和技术提供。
包括一种方法和装置,包括存储器,被配置为存储计算机程序代码;以及一个或多个处理器,被配置为访问所述计算机程序代码,并按照所述计算机程序代码的指示操作。所述计算机程序代码包括:提供代码,被配置为使所述至少一个处理器提供要流传输到客户端的视频内容的媒体呈现描述(MPD)事件和媒体片段;控制代码,被配置为使所述至少一个处理器控制所述客户端基于所述MPD事件提供用户界面,并包括多个选择选项和每个选择选项的交互数据;以及更新代码,被配置为使所述至少一个处理器通过所述用户界面,基于所述多个选择选项中的至少一个选择更新MPD数据,其中,所述多个选择选项中的每一个分别指示所述视频内容的多个故事情节的多个时段中的不同时段,以及所述控制所述客户端提供所述用户界面包括:在所述多个故事情节的至少一个其它时段的至少一个完整播放之前提供所述用户界面,所述至少一个其它时段在所述多个时段中的不同时段之前。
根据示例性实施例,所述提供所述MPD事件包括:向所述客户端提供故事地图,所述故事地图标识所述视频内容的所述一个其它时段、所述多个时段中的不同时段和至少一个稍后时段,以及所述故事地图指示在所述多个时段中的不同时段之前调度所述一个其它时段进行流传输,在所述视频内容的所述至少一个稍后时段之前调度所述多个时段中的不同时段进行流传输。
根据示例性实施例,所述一个其它时段、所述多个时段中的不同时段和所述至少一个稍后时段中的至少一个包括与所述一个其它时段、所述多个时段中的不同时段和所述至少一个稍后时段中的至少另一个不同的持续时间。
根据示例性实施例,所述控制所述客户端提供所述用户界面包括:控制所述用户界面显示所述故事地图的至少一部分,以及所述故事地图的所述部分包括所述一个其它时段的指示和所述多个时段中的不同时段的指示。
根据示例性实施例,所述控制所述客户端提供所述用户界面包括:控制所述用户界面标识在所述一个其它时段的指示和所述多个时段中的不同时段的指示之间的点处的所述至少一个选择的位置。
根据示例性实施例,所述控制所述用户界面显示所述故事地图的至少一部分包括:基于连接图显示所述故事地图的至少一部分,所述连接图包括列表,所述列表包括所述一个其它时段、所述多个时段中的不同时段和所述至少一个稍后时段中的每一个;所述连接图还包括:用于从所述一个其它时段到所述多个时段中的不同时段的每个连接的第一相应标识符,以及所述连接图还包括:用于从所述多个时段中的不同时段中的至少一个到所述至少一个稍后时段的至少一个连接的第二相应标识符。
根据示例性实施例,所述控制所述客户端提供所述用户界面包括:控制所述用户界面显示整个故事地图,所述整个故事地图包括所述一个其它时段的指示、所述多个时段中的不同时段的指示和所述至少一个稍后时段的指示。
根据示例性实施例,所述控制所述客户端提供所述用户界面包括:控制所述用户界面标识在所述一个其它时段的指示和所述多个时段中的不同时段的指示之间的点处的所述至少一个选择的位置,以及所述控制所述客户端提供所述用户界面进一步包括:控制所述用户界面标识在所述多个时段中的不同时段的指示中的至少一个指示与所述至少一个稍后时段的指示之间的点处的另一选择的位置。
根据示例性实施例,所述控制所述用户界面显示所述整个故事地图包括:基于连接图显示所述整个故事地图,所述连接图包括列表,所述列表包括所述一个其它时段、所述多个时段中的不同时段和所述至少一个稍后时段中的每一个;所述连接图还包括:用于从所述一个其它时段到所述多个时段中的不同时段的每个连接的第一相应标识符,以及所述连接图还包括:用于从所述多个时段中的不同时段中的至少一个到所述至少一个稍后时段的至少一个连接的第二相应标识符。
根据示例性实施例,所述客户端是基于HTTP的动态自适应流传输(DASH)客户端。
附图说明
根据以下详细描述和附图,所公开的主题的其他特征、性质和各种优点将进一步明确,其中:
图1是根据实施例的简化示意图。
图2是根据实施例的简化示意图。
图3是根据实施例的关于解码器的简化框图。
图4是根据实施例的关于编码器的简化框图。
图5是根据实施例的简化框图。
图6是根据实施例的简化示意图。
图7是根据实施例的简化流程图。
图8是根据实施例的简化示意图。
图9A是根据实施例的简化示意图。
图9B是根据实施例的简化示意图。
图10是根据实施例的示意图。
具体实施方式
下面讨论的建议功能可以单独使用或以任何顺序组合使用。此外,实施例可以由处理电路(例如,一个或多个处理器或一个或多个集成电路)来实施。在一个示例中,该一个或多个处理器执行存储在非易失性计算机可读介质中的程序。
图1示出了根据本公开实施例的通信系统100的简化框图。通信系统100可以包括通过网络105互联的至少两个终端装置102和103。对于单向数据传输,第一终端装置103可在本地位置对视频数据进行编码,以通过网络105传输到另一终端装置102。第二终端装置102可从网络105接收另一终端装置的已编码视频数据,对已编码视频数据进行解码并显示恢复的视频数据。单向数据传输在媒体服务等应用中是较常见的。
图1示出了支持已编码视频的双向传输的第二对终端装置101和104,所述双向传输可例如在视频会议期间发生。对于双向数据传输,每个终端装置101和104可对在本地位置采集的视频数据进行编码,以通过网络105传输到另一终端装置。每个终端装置101和104还可接收由另一终端装置传输的已编码视频数据,且可对所述已编码视频数据进行解码并在本地显示设备上显示恢复的视频数据。
在图1中,终端装置101、102、103和104可为服务器、个人计算机和智能手机,但本公开的原理不限于此。本公开的实施例适用于膝上型计算机、平板电脑、媒体播放器和/或专用视频会议设备。网络105表示在终端装置101、102、103和104之间传送已编码视频数据的任何数目的网络,包括例如有线和/或无线通信网络。通信网络105可在电路交换和/或分组交换信道中交换数据。代表性网络包括电信网络、局域网、广域网和/或互联网。出于本讨论的目的,除非在下文中有所解释,否则网络105的架构和拓扑对于本公开的操作来说可能是无关紧要的。
作为所公开主题的应用实施例,图2示出了视频解码器和编码器在流式传输环境中的放置方式。所公开的主题可同等地适用于其它支持视频的应用,包括例如视频会议、数字TV、在包括CD、DVD、存储棒等的数字介质上存储压缩视频等等。
流式传输系统可包括采集子系统203,所述采集子系统可包括诸如数码相机等视频源201,所述视频源创建例如未压缩的视频样本流213。较于已编码的视频比特流,样本流213可以被强调为高数据量的视频样本流,并且可以由耦接到相机201的编码器202处理。编码器202可包括硬件、软件或软硬件组合以实现或实施如下文更详细地描述的所公开主题的各方面。相较于样本流,已编码的视频比特流204可以被强调为较低数据量,并且可以存储在流式传输服务器205上以供将来使用。一个或多个流式传输客户端212和207可访问流式传输服务器205以检索已编码的视频比特流204的副本208和206。客户端212可包括视频解码器211。视频解码器211对已编码的视频比特流的传入副本208进行解码,且产生可在显示器209或另一呈现装置(未示出)上呈现的输出视频样本流210。在一些流式传输系统中,可以根据某些视频编解码/压缩标准对视频比特流204、206和208进行编码。这些标准的示例在上文中已提及并在本文中进一步描述。
图3是根据本发明实施例的视频解码器300的功能框图。
接收器302可接收将由视频解码器300解码的一个或多个已编码视频序列;在同一实施例或另一实施例中,一次接收一个已编码视频序列,其中每个已编码视频序列的解码独立于其它已编码视频序列。可从信道301接收已编码视频序列,所述信道可以是通向存储已编码的视频数据的存储装置的硬件/软件链路。接收器302可接收已编码的视频数据以及其它数据,例如,可转发到它们各自的使用实体(未标示)的已编码音频数据和/或辅助数据流。接收器302可将已编码视频序列与其它数据分开。为了防止网络抖动,缓冲存储器303可耦接在接收器302与熵解码器/解析器304(此后称为“解析器”)之间。当接收器302从具有足够带宽和可控性的存储/转发装置或从等时同步网络接收数据时,也可能不需要配置缓冲存储器303,或可以将所述缓冲存储器做得较小。当然,为了在互联网等分组网络上使用,也可能需要缓冲存储器303,所述缓冲存储器可相对较大且可有利地具有自适应性大小。
视频解码器300可包括解析器304以根据熵编码视频序列重建符号313。这些符号的类别包括用于管理视频解码器300的操作的信息,以及用以控制诸如显示器312的显示装置的潜在信息,所述显示装置不是解码器的组成部分,但可耦接到解码器。用于显示装置的控制信息可以是辅助增强信息(Supplementary Enhancement Information,SEI消息)或视频可用性信息(Video Usability Information,VUI)的参数集片段(未标示)的形式。解析器304可对接收到的已编码视频序列进行解析/熵解码。已编码视频序列的编解码可根据视频编解码技术或标准进行,且可遵循本领域技术人员公知的原理,包括可变长度编解码、霍夫曼编解码(Huffman coding)、具有或不具有上下文灵敏度的算术编解码等等。解析器304可基于对应于群组的至少一个参数,从已编码视频序列提取用于视频解码器中的像素的子群中的至少一个子群的子群参数集。子群可包括图片群组(Group of Pictures,GOP)、图片、图块(tile)、切片(slice)、宏块、编码单元(Coding Unit,CU)、块、变换单元(TransformUnit,TU)、预测单元(Prediction Unit,PU)等等。熵解码器/解析器还可从已编码视频序列提取信息,例如变换系数、量化器参数值、运动矢量等等。
解析器304可对从缓冲存储器303接收的视频序列执行熵解码/解析操作,从而创建符号313。解析器304可以接收编码数据,并选择性地解码特定符号313。此外,解析器304可以确定是否将特定符号313提供给运动补偿预测单元306、缩放器/逆变换单元305、帧内预测单元307或环路滤波器311。
取决于已编码视频图片或一部分已编码视频图片(例如:帧间图片和帧内图片、帧间块和帧内块)的类型以及其它因素,符号313的重建可涉及多个不同单元。涉及哪些单元以及涉及方式可由解析器304从已编码视频序列解析的子群控制信息控制。为了简洁起见,未描述解析器304与下文的多个单元之间的此类子群控制信息流。
除已经提及的功能块以外,视频解码器300可在概念上细分成如下文所描述的数个功能单元。在商业约束下运行的实际实施中,这些单元中的许多单元彼此紧密交互并且可以至少部分地彼此集成。然而,出于描述所公开的主题的目的,概念上细分成下文的功能单元是适当的。
第一单元是缩放器/逆变换单元305。缩放器/逆变换单元305从解析器304接收作为符号313的量化变换系数以及控制信息,包括使用哪种变换方式、块大小、量化因子、量化缩放矩阵等。缩放器/逆变换单元305可输出包括样本值的块,所述样本值可输入到聚合器310中。
在一些情况下,缩放器/逆变换单元305的输出样本可属于帧内编码块;即:不使用来自先前重建的图片的预测性信息,但可使用来自当前图片的先前重建部分的预测性信息的块。此类预测性信息可由帧内图片预测单元307提供。在一些情况下,帧内图片预测单元307采用从(部分重建的)当前图片309提取的周围已重建的信息生成大小和形状与正在重建的块相同的块。在一些情况下,聚合器310基于每个样本,将帧内预测单元307生成的预测信息添加到由缩放器/逆变换单元305提供的输出样本信息中。
在其它情况下,缩放器/逆变换单元305的输出样本可属于帧间编码和潜在运动补偿块。在此情况下,运动补偿预测单元306可访问参考图片存储器308以提取用于预测的样本。在根据符号313对提取的样本进行运动补偿之后,这些样本可由聚合器310添加到缩放器/逆变换单元的输出(在这种情况下被称作残差样本或残差信号),从而生成输出样本信息。运动补偿预测单元从参考图片存储器内的地址获取预测样本可受到运动矢量控制,且所述运动矢量以所述符号313的形式而供运动补偿预测单元使用,所述符号313例如是包括X、Y和参考图片分量。运动补偿还可包括在使用子样本精确运动矢量时,从参考图片存储器提取的样本值的内插、运动矢量预测机制等等。
聚合器310的输出样本可在环路滤波器单元311中被各种环路滤波技术采用。视频压缩技术可包括环路内滤波器技术,所述环路内滤波器技术受控于包括在已编码视频比特流中的参数,且所述参数作为来自解析器304的符号313可用于环路滤波器单元311。然而,视频压缩技术还可响应于在解码已编码图片或已编码视频序列的先前(按解码次序)部分期间获得的元信息,以及响应于先前重建且经过环路滤波的样本值。
环路滤波器单元311的输出可以是样本流,所述样本流可输出到显示装置312以及存储在参考图片存储器557,以用于后续的帧间图片预测。
一旦完全重建,某些已编码图片就可用作参考图片以用于将来预测。一旦已编码图片被完全重建,且已编码图片(通过例如解析器304)被识别为参考图片,则当前图片309可变为参考图片存储器308的一部分,且可在开始重建后续已编码图片之前重新分配新的当前图片存储器。
视频解码器300可根据例如ITU-T H.265标准中记录的预定视频压缩技术执行解码操作。在已编码视频序列遵循在视频压缩技术文献或标准、特别是配置文件中所规定的视频压缩技术或标准的语法的意义上,已编码视频序列可符合所使用的视频压缩技术或标准指定的语法。对于合规性,还要求已编码视频序列的复杂度处于视频压缩技术或标准的层级所限定的范围内。在一些情况下,层级限制最大图片大小、最大帧率、最大重建取样率(以例如每秒兆(mega)个样本为单位进行测量)、最大参考图片大小等等。在一些情况下,由层级设定的限制可通过假想参考解码器(Hypothetical Reference Decoder,HRD)规范和在已编码视频序列中用信号表示的HRD缓冲器管理的元数据来进一步限定。
在实施例中,接收器302可连同已编码视频一起接收附加(冗余)数据。所述附加数据可以是已编码视频序列的一部分。所述附加数据可由视频解码器300用以对数据进行适当解码和/或较准确地重建原始视频数据。附加数据可呈例如时间、空间或信噪比(signalnoise ratio,SNR)增强层、冗余切片、冗余图片、前向纠错码等形式。
图4是根据本公开实施例的视频编码器400的功能框图。
视频编码器400可从视频源401(并非该编码器的一部分)接收视频样本,所述视频源可采集将由视频编码器400编码的视频图像。
视频源401可提供将由视频编码器(303)编码的呈数字视频样本流形式的源视频序列,所述数字视频样本流可具有任何合适位深度(例如:8位、10位、12位……)、任何色彩空间(例如BT.601Y CrCB、RGB……)和任何合适取样结构(例如Y CrCb 4:2:0、Y CrCb 4:4:4)。在媒体服务系统中,视频源401可以是存储先前已准备的视频的存储装置。在视频会议系统中,视频源401可以为采集本地图像信息作为视频序列的相机。可将视频数据提供为多个单独的图片,当按顺序观看时,这些图片被赋予运动。图片自身可构建为空间像素阵列,其中取决于所用的取样结构、色彩空间等,每个像素可包括一个或多个样本。本领域技术人员可以容易地理解像素和样本之间的关系。下文侧重于描述样本。
根据实施例,视频编码器400可实时或在由应用所要求的任何其它时间约束下,将源视频序列的图片编码且压缩成已编码视频序列410。施行适当的编码速度是控制器402的一个功能。控制器控制如下文所描述的其它功能单元且在功能上耦接到这些单元。为了简洁起见,图中未标示耦接。由控制器设置的参数可包括速率控制相关参数(例如,图片跳过、量化器、率失真优化技术的λ值等)、图片大小、图片群组(group of pictures,GOP)布局,最大运动矢量搜索范围等。本领域技术人员可以容易地识别控制器402的其他功能,因为它们可能属于针对特定系统设计而优化的视频编码器400。
一些视频编码器以本领域技术人员容易识别为“编码环路”方式进行操作。作为简单的描述,编码环路可包括编码器402(下文称为“源编码器(source coder)”,其负责基于待编码的输入图片和参考图片创建符号)的编码部分、和嵌入于视频编码器400中的(本地)解码器406。“本地”解码器406以类似于(远程)解码器创建样本数据的方式重建符号以创建样本数据(因为在所公开的主题所考虑的视频压缩技术中,符号与已编码视频码流之间的任何压缩是无损的)。将重建的样本流输入到参考图片存储器405。由于符号流的解码产生与解码器位置(本地或远程)无关的位精确结果,因此参考图片存储器中的内容在本地编码器与远程编码器之间也是按比特位精确对应的。换句话说,编码器的预测部分“看到”的参考图片样本与解码器将在解码期间使用预测时所“看到”的样本值完全相同。这种参考图片同步性基本原理(以及在例如因信道误差而无法维持同步性的情况下产生的漂移)是本领域技术人员公知的。
“本地”解码器406的操作可与已在上文结合图3详细描述的“远程”解码器300相同。然而,另外简要参考图4,当符号可用且熵编码器408和解析器304能够无损地将符号编码/解码为已编码视频序列时,视频解码器300的熵解码部分(包括信道301、接收器302、缓冲存储器303和解析器304)可能无法完全在本地解码器406中实施。
此时可以观察到,除存在于解码器中的解析/熵解码之外的任何解码器技术,也必定以基本上相同的功能形式存在于对应的编码器中。对编码器技术的描述可以简写,因为它们与全面描述的解码器技术互逆。仅在某些区域中需要更详细的描述,并且在下文提供。
作为操作的一部分,源编码器403可执行运动补偿预测编码。参考来自视频序列中被指定为“参考帧”的一个或多个先前已编码帧,所述运动补偿预测编码对输入帧进行预测性编码。以此方式,编码引擎407对输入帧的像素块与参考帧的像素块之间的差异进行编码,所述参考帧可被选作所述输入帧的预测参考。
本地视频解码器406可基于源编码器403创建的符号,对可指定为参考帧的帧的已编码视频数据进行解码。编码引擎407的操作可以有利地为有损过程。当已编码视频数据可在视频解码器(图4中未示)处被解码时,重建的视频序列通常可以是带有一些误差的源视频序列的副本。本地视频解码器406复制解码过程,所述解码过程可由视频解码器对参考帧执行,且可使重建的参考帧存储在参考图片存储器405中。以此方式,编码器400可在本地存储重建的参考帧的副本,所述副本与将由远端视频解码器获得的重建参考帧具有共同内容(不存在传输误差)。
预测器404可针对编码引擎407执行预测搜索。即,对于将要编码的新帧,预测器404可在参考图片存储器405中搜索可作为所述新图片的适当预测参考的样本数据(作为候选参考像素块)或某些元数据,例如参考图片运动矢量、块形状等。预测器404可基于样本块逐像素块操作,以找到合适的预测参考。在一些情况下,根据预测器404获得的搜索结果,可确定输入图片可具有从参考图片存储器405中存储的多个参考图片取得的预测参考。
控制器402可管理视频编码器403的编码操作,包括例如设置用于对视频数据进行编码的参数和子群参数。
可在熵编码器408中对所有上述功能单元的输出进行熵编码。熵编码器可根据例如霍夫曼编码、可变长度编码、算术编码等本领域技术人员公知的技术对各种功能单元生成的符号进行无损压缩,从而将所述符号转换成已编码视频序列。
传输器409可缓冲由熵编码器408创建的已编码视频序列,从而为通过通信信道411进行传输做准备,所述通信信道可以是通向将存储已编码的视频数据的存储装置的硬件/软件链路。传输器409可将来自视频编码器403的已编码视频数据与要传输的其它数据合并,所述其它数据例如是已编码音频数据和/或辅助数据流(未示出来源)。
控制器402可管理视频编码器400的操作。在编码期间,控制器405可以为每个已编码图片分配某一已编码图片类型,但这可能影响可应用于相应的图片的编码技术。例如,通常可将图片分配为以下任一种图片类型。
帧内图片(I图片),其可以是不将序列中的任何其它帧用作预测源就可被编码和解码的图片。一些视频编解码器容许不同类型的帧内图片,包括例如独立解码器刷新(Independent Decoder Refresh,IDR)图片。本领域技术人员知道I图片的那些变体以及它们各自的应用和特征。
预测性图片(P图片),其可以是可使用帧内预测或帧间预测进行编码和解码的图片,所述帧内预测或帧间预测使用至多一个运动矢量和参考索引来预测每个块的样本值。
双向预测性图片(B图片),其可以是可使用帧内预测或帧间预测进行编码和解码的图片,所述帧内预测或帧间预测使用至多两个运动矢量和参考索引来预测每个块的样本值。类似地,多个预测性图片可使用多于两个参考图片和相关联元数据以用于重建单个块。
源图片通常可在空间上细分成多个样本块(例如,4×4、8×8、4×8或16×16个样本的块),且逐块进行编码。这些块可参考其它(已编码)块进行预测编码,根据应用于块的相应图片的编码分配来确定所述其它块。举例来说,I图片的块可进行非预测编码,或所述块可参考同一图片的已经编码的块来进行预测编码(空间预测或帧内预测)。P图片的像素块可参考一个先前编码的参考图片通过空间预测或通过时域预测进行非预测编码。B图片的块可参考一个或两个先前编码的参考图片通过空间预测或通过时域预测进行非预测编码。
视频编码器400可根据例如ITU-T H.265建议书的预定视频编码技术或标准执行编码操作。在操作中,视频编码器400可执行各种压缩操作,包括利用输入视频序列中的时间和空间冗余的预测编码操作。因此,已编码视频数据可符合所用视频编码技术或标准指定的语法。
在实施例中,传输器409可传输附加数据和已编码的视频。源编码器403可以包括诸如已编码视频序列的一部分的此类数据。附加数据可包括时间/空间/SNR增强层、冗余图片和切片等其它形式的冗余数据、SEI消息、VUI参数集片段等。
图5示出了根据示例性实施例的简化框图500,其中包括内容服务器502、客户端503和用户界面501。如下所述,客户端503将一个或多个选择回调(selection callback)511传送到内容服务器502,并且如下所述,内容服务器502以媒体呈现描述(MPD)更新512和一个或多个媒体片段513来进行响应。
例如,根据图5的示例性实施例,内容服务器502向DASH客户端(例如客户端503)提供初始MPD和MPD更新512以及媒体片段513,并且每当客户端503接收到作为MPD更新512的一部分的故事情节(storyline)事件时,客户端503都可以将该事件在用户界面501显示,以将其提供给用户,使得当用户决定选择时,用户界面501通知客户端503,并且客户端503将该选择、一个或多个选择回调511提供给内容服务器502,使得内容服务器502相应地更新MPD。这些实施例在本文中表示DASH流传输中的交互式故事情节的架构,如下文进一步所描述的。
此外,可以针对MPD故事情节事件流(EventStream)定义这样的故事情节事件,使得MPD故事情节事件可以是在故事地图中携带一个或多个选择点的MPD事件,如下所述,并且事件方案可以用schemeIdUri来标识,例如“urn:mpeg:dash:manifest-storyline-event:2020”,并且每个时段(period)仅允许一个事件流(EventStream)元素携带这些事件,这些事件将在其@schemeIdUri中使用该URI。客户端503可以忽略事件流的@value,即可以不为这样的事件流定义子方案。
此外,可以针对这种MPD故事情节事件流的事件元素进一步定义这样的故事情节事件,以便包括连接元素,如下表1所示(支持播放列表事件的扩展的事件语义):
表1
此外,根据示例性实施例,还可以存在互连元素,该互连元素包括或由一组链接组成,这些链接示出了如下表2(播放列表语义)中的连接:
表2
作为示例,图6、8、9A和9B中的任何一个中的P0时段的故事情节事件的连接元素、互连元素可以由以下示例性情况之一来表示:
示例性情况A
<Interconnection@to="1"@data="Bill kills Alice">
<Interconnection@to="2"@data="Bill kisses Alice">
<Interconnection@to="3"@data="Bill misses Alice">
或
示例性情况B
<Interconnection@from="0"@to="1"@data="Bill kills Alice">
<Interconnection@from="0"@to="2"@data="Bill kisses Alice">
<Interconnection@from="0"@to="3"@data="Bill misses Alice">
根据示例性实施例,一个或多个互连元素可以包括在一个故事情节事件中,多个连接元素可以提供当前会话的部分或整个故事地图,其中只有当前时段元素结束时的互连图可以在事件的持续时间期间处于活动状态以供选择,如下面进一步所描述的。例如,参见图6、8、9A和9B,即使在某一时间只有选择S0处于活动状态以供选择,地图600、800、900A和900B中的任何一个都可以根据各种标准而显示给客户端,这些标准例如可以被预先确定为用户和/或服务器设置。
这样,在用户在用户界面501做出选择之后,客户端503通过选择回调511向事件元素定义的URL地址发出HTTP GET请求,并且所选的时段@to值可以包含在该请求的查询参数中。因此,根据示例性实施例,在内容服务器502处,可以基于用户选择来更新清单,其中该用户选择可在带外或使用所述回调函数来提供。
图6是根据实施例的地图600,其中示出了各种故事地图MPD片段,例如片段时段P0,其在选择点S0处分割为片段时段P1、P2和P3,其中时段P1、P2和P3的持续时间(由长度指示)可以不同;当然,根据相应的MPD片段,这些片段中的一个或多个可以具有相同的持续时间。此外,片段时段P1可以在选择点S1处分割为片段时段P4和P5,其中片段时段P5和P2可以合并为片段时段P6,片段时段P4、P6和P3可以合并为片段时段P7。所述片段时段P1-P7的持续时间可以相同,也可以不同。
也就是说,在图6中,故事从时段P0开始,其中时段P0在选择点S0处结束时,故事可以进入时段P1、P2或P3,每个时段至少有一些相对不同的内容,并且可以具有不同的持续时间。在时段P1结束时和在选择点S1处,如图6所示,故事具有时段P4或时段P5的选项(choice)。所示的故事时段P6和P7的其余部分发生在各个分支合并之后。当然,各个分支不一定需要合并。根据示例性实施例,可以将每个选择点处的选项的数量设置为两个或更多。而且,每个分支的持续时间可以不必相等,并且可能会合并持续时间相同和不同的任何分支。此外,根据示例性实施例,故事可以具有一个或多个终点。如图6所示,可以认为,时段P7可以是在播放其MPD片段之后结束故事的终点。
根据示例性实施例,这种故事可以根据具有交互数据的丰富连接图(例如,表3(具有交互数据的连接图的示例))来定义,该交互数据不仅可以提供时段之间的连接,而且可以提供关于连接到时段的交互信息,其中,这种地图可以被描述为示例表3:
表3
如本示例表3所示,与图5一样,每个连接支路To不仅具有到一个或多个时段的连接,而且具有与该连接相关联的交互数据(IDX),其中此类交互数据可以取决于连接(从和到),而不是仅取决于连接到时段。也就是说,根据示例性实施例,例如用于从P2连接到P6的交互数据是ID26,这可能不同于用于从P5连接到P6的交互数据,其为ID56。交互信息可以在选择窗口的开始处,例如在图6中的S0和/或S1处,从内容服务器502传递到客户端503处的应用程序,从而传递到用户界面501,以便应用程序可以处理该数据,以用于直接显示给用户或者用于获取关于用户界面501的用户的附加信息。根据示例性实施例,交互数据的语法可以是不透明的,或者不直接显示给客户端502。
图7示出了示例性流程图700,其中,在S701,一个过程可以通过在S702将媒体片段数据从服务器(例如内容服务器502)流传输到客户端设备(例如客户端503)开始,在S703(与S702并行或串行),检查服务器是否已向客户端设备提供故事情节事件作为一个或多个MPD更新的一部分。如果在S703确定将这样的故事情节事件提供给客户端设备,则在S704,可以基于例如从服务器提供的上表3的丰富连接图来确定地图信息,并且如果确定了如图6所示的这样的地图信息,则在S705,还可以根据示例性实施例确定是否隐藏或以其它方式修改所述地图信息,例如与图6相比的图8、9A和9B所示。基于S705处的这种确定(其可以根据从用户界面提供给客户端的预设用户设置,或根据从服务器提供给客户端的预设服务器设置),可以向用户显示例如图6、8、9A和9B中任何一个中的地图。例如,参见图6,在S706,可以通过客户端503和用户界面501中的一个或多个向用户显示地图600,在S706,用户可以分别或同时输入选择S0和S1中的一个或多个,使得基于该用户输入,通过用户界面501,可以基于选择S0来选择时段P1、P2和P3中的一个,并且如果选择了P1,则可以在选择S1处选择P4和P5中的一个。例如,在这样的实施例中,在进行S0选择之后,然后在S708,可以确定沿着在选择S0处选择的一个或多个时段中的任何一个是否存在另一个选择点,例如选择S1。如果是,则该过程可以返回到S706,否则,该过程可以进行到S702,以基于用户做出的一个或多个选择继续或以其它方式开始流传输。
相反,参见图8中的示例性地图800,其类似于图6中的地图600,除了根据实施例,例如图7中的S705,可以通过所述预设用户和/或服务器设置来确定,通过以彼此相等的大小显示时段P0-P7中的每个时段的大小来隐藏时段P0-P7的持续时间部分。或者,参见图9A及其示例地图900A,其中仅有与时间上的第一选择有关的时段,例如选择S0,以及此后的相应时段P1-P3。也就是说,尽管故事情节可以与地图600中的故事情节相同,但是地图900A示出了向用户输出的实施例,其中至少最初仅显示紧接在选择S0之后的时段P1-P3,而隐藏其它时段P4-P7,并且还可以如上文关于S705所述来确定此类信息。类似地,在图9B的地图900B处,与图8一样,在S705处,可以通过所述预设用户和/或服务器设置来确定,通过以与图9A的地图900A相比彼此相等的大小显示时段P0-P3中的每个时段的大小来隐藏时段P0-P3的持续时间部分。
根据示例性实施例,例如在S707,每个选择可能需要在紧接之前的时段完成之前进行。例如,在S0处的选择可能需要在时段P0完成之前进行,或者在一些实施例中,在时段P0开始之前进行。
因此,本申请的示例性实施例通过提供使用MPD事件的选择选项并针对每个可能的选择使用附加的交互数据,来实现技术方案,由此该应用程序在用户界面上显示各种选择选项之前可以使用数据或使用信息来获得附加数据。这样,该技术优点除了允许更新故事地图之外,还允许例如在用户选择界面处向用户提供任何即将到来的选项、部分故事地图或整个故事地图。这样的示例性实施例解决了至少在地图被逐个选择地传递时存在的技术缺点,使得客户端一次仅看到一个选择,而不是更完整的或整个的地图。此外,实际的时段@id也可以对客户端隐藏,而服务器仍然保持为任何所选的时段和/或多个时段提供数据的可操作性。这样,可以通过每个事件(包括过去和将来的连接)来更新地图,并且该事件可以提供允许用户进行选择的开始时间和持续时间(即,事件活动时段)。此外,事件活动持续时间可以在转换到下一时段之前进行设置,在这样的实施例中,客户端可以有足够的时间来缓冲内容并具有连续播放,否则可能由于例如网络延迟或播放中间的用户选择延迟而无法实现连续播放。此外,根据示例性实施例,客户端可以存储地图以及所有时段,并相应地构建用于播放的交互式本地MPD。
因此,根据示例性实施例,存在一种用于传递交互式故事情节流传输内容的方法,其中在特定时刻向用户提供选择,以在所提供的选项中选择选项来改变故事方向,其中MPD事件用于传达每个时段的选择选项以及每个选项的交互数据,其中事件可在实际转换之前的任何持续时间被激活,因此,为客户端提供足够的时间来缓冲所选择的下一时段并且在没有中断或重新缓冲的情况下播放内容,其中可以为故事地图每个事件提供一个选项。或者,可以提供任意数量的选择,或者可以在任意事件中提供整个故事地图,其中故事地图或其多个部分可以根据每个或某些事件进行更新,其中事件可以提供选项,即它们对应的时段对DASH客户端隐藏,其中MPD在每个时段结束时通过添加用户选择的时段来更新。
这种方法可以进一步包括:逐步或一步(如果完全提供)构建故事地图,并存储相应的时段,因此能够构建整个交互式故事情节,并在本地制造MPD更新,而无需联系MPD的服务器,并且在播放交互式故事时仅流传输媒体内容。
通过该方法,应用程序获得交互数据以及每个选项,并且可以使用该数据构建交互式应用程序,其中交互数据可以是文本,也可以是二进制数据的base64编码,因此可以包括图像、图形、图形交换格式(GIF)、表情符号(similies)、头像、动画或甚至是程序数据,应用程序可以使用这些数据在用户界面中显示与用户的交互。
根据示例性实施例,这种方法利用关于选择的交互信息来丰富故事地图及其边缘。在选择窗口期间提供该信息之后,应用程序可以使用该信息向用户显示该信息或其部分信息,以提供信息或视觉指导来帮助其选择,或进一步处理交互信息以在选择过程期间提供丰富的用户交互。交互信息可以是文本、图像、动画、程序或用于构建丰富的应用程序的组合。
上述技术可以通过计算机可读指令实现为计算机软件,并且物理地存储在一个或多个计算机可读介质中或通过具体配置的一个或多个硬件处理器来实现。例如,图10示出了计算机系统1000,其适于实现所公开主题的某些实施例。
所述计算机软件可通过任何合适的机器代码或计算机语言进行编码,通过汇编、编译、链接等机制创建包括指令的代码,所述指令可由计算机中央处理单元(CPU),图形处理单元(GPU)等直接执行或通过译码、微代码等方式执行。
所述指令可以在各种类型的计算机或其组件上执行,包括例如个人计算机、平板电脑、服务器、智能手机、游戏设备、物联网设备等。
图10所示的用于计算机系统1000的组件本质上是示例性的,并不用于对实现本公开实施例的计算机软件的使用范围或功能进行任何限制。也不应将组件的配置解释为与计算机系统1000的示例性实施例中所示的任一组件或其组合具有任何依赖性或要求。
计算机系统1000可以包括某些人机界面输入设备。这种人机界面输入设备可以通过触觉输入(如:键盘输入、滑动、数据手套移动)、音频输入(如:声音、掌声)、视觉输入(如:手势)、嗅觉输入(未示出),对一个或多个人类用户的输入做出响应。所述人机界面设备还可用于捕获某些媒体,气与人类有意识的输入不必直接相关,如音频(例如:语音、音乐、环境声音)、图像(例如:扫描图像、从静止影像相机获得的摄影图像)、视频(例如二维视频、包括立体视频的三维视频)。
人机界面输入设备可包括以下中的一个或多个(仅绘出其中一个):键盘1001、鼠标1002、触控板1003、触摸屏1010、操纵杆1005、麦克风1006、扫描仪1008、照相机1007。
计算机系统1000还可以包括某些人机界面输出设备。这种人机界面输出设备可以通过例如触觉输出、声音、光和嗅觉/味觉来刺激一个或多个人类用户的感觉。这样的人机界面输出设备可包括触觉输出设备(例如通过触摸屏1010或操纵杆1005的触觉反馈,但也可以有不用作输入设备的触觉反馈设备)、音频输出设备(例如,扬声器1009、耳机(未示出))、视觉输出设备(例如,包括阴极射线管屏幕、液晶屏幕、等离子屏幕、有机发光二极管屏的屏幕1010,其中每一个都具有或没有触摸屏输入功能、每一个都具有或没有触觉反馈功能——其中一些可通过诸如立体画面输出的手段输出二维视觉输出或三维以上的输出;虚拟现实眼镜(未示出)、全息显示器和放烟箱(未示出))以及打印机(未示出)。
计算机系统1000还可以包括人可访问的存储设备及其相关介质,如包括具有CD/DVD1011的高密度只读/可重写式光盘(CD/DVD ROM/RW)1020或类似介质的光学介质、拇指驱动器1022、可移动硬盘驱动器或固体状态驱动器1023,诸如磁带和软盘(未示出)的传统磁介质,诸如安全软件保护器(未示出)等的基于ROM/ASIC/PLD的专用设备,等等。
本领域技术人员还应当理解,结合所公开的主题使用的术语“计算机可读介质”不包括传输介质、载波或其它瞬时信号。
计算机系统1000还可以包括通往一个或多个通信网络1098的接口1099。例如,网络1098可以是无线的、有线的、光学的。网络1098还可为局域网、广域网、城域网、车载网络和工业网络、实时网络、延迟容忍网络等等。网络1098的示例还包括以太网、无线局域网、蜂窝网络(GSM、3G、4G、5G、LTE等)等局域网、电视有线或无线广域数字网络(包括有线电视、卫星电视、和地面广播电视)、车载和工业网络(包括CANBus)等等。某些网络1098通常需要外部网络接口适配器,用于连接到某些通用数据端口或外围总线(1050和1051)(例如,计算机系统1000的USB端口);其它系统通常通过连接到如下所述的系统总线集成到计算机系统1000的核心(例如,以太网接口集成到PC计算机系统或蜂窝网络接口集成到智能电话计算机系统)。通过使用这些网络1098中的任何一个,计算机系统1000可以与其它实体进行通信。所述通信可以是单向的,仅用于接收(例如,无线电视),单向的仅用于发送(例如CAN总线到某些CAN总线设备),或双向的,例如通过局域或广域数字网络到其它计算机系统。上述的每个网络和网络接口可使用某些协议和协议栈。
上述的人机界面设备、人可访问的存储设备以及网络接口可以连接到计算机系统1000的核心1040。
核心1040可包括一个或多个中央处理单元(CPU)1041、图形处理单元(GPU)1042、图形适配器1017、以现场可编程门阵列(FPGA)1043形式的专用可编程处理单元、用于特定任务的硬件加速器1044等。这些设备以及只读存储器(ROM)1045、随机存取存储器1046、内部大容量存储器(例如内部非用户可存取硬盘驱动器、固态硬盘等)1047等可通过系统总线1048进行连接。在某些计算机系统中,可以以一个或多个物理插头的形式访问系统总线1048,以便可通过额外的中央处理单元、图形处理单元等进行扩展。外围装置可直接附接到核心的系统总线1048,或通过外围总线1051进行连接。外围总线的体系结构包括外围组件互联PCI、通用串行总线USB等。
CPU 1041、GPU 1042、FPGA 1043和加速器1044可以执行某些指令,这些指令组合起来可以构成上述计算机代码。该计算机代码可以存储在ROM 1045或RAM 1046中。过渡数据也可以存储在RAM 1046中,而永久数据可以存储在例如内部大容量存储器1047中。通过使用高速缓冲存储器可实现对任何存储器设备的快速存储和检索,高速缓冲存储器可与一个或多个CPU 1041、GPU 1042、大容量存储器1047、ROM 1045、RAM 1046等紧密关联。
所述计算机可读介质上可具有计算机代码,用于执行各种计算机实现的操作。介质和计算机代码可以是为本公开的目的而特别设计和构造的,也可以是计算机软件领域的技术人员所熟知和可用的介质和代码。
作为实施例而非限制,具有体系结构的计算机系统1000,特别是核心1040,可以作为处理器(包括CPU、GPU、FPGA、加速器等)提供执行包含在一个或多个有形的计算机可读介质中的软件的功能。这种计算机可读介质可以是与上述的用户可访问的大容量存储器相关联的介质,以及具有非易失性的核心1040的特定存储器,例如核心内部大容量存储器1047或ROM 1045。实现本公开的各种实施例的软件可以存储在这种设备中并且由核心1040执行。根据特定需要,计算机可读介质可包括一个或一个以上存储设备或芯片。该软件可以使得核心1040特别是其中的处理器(包括CPU、GPU、FPGA等)执行本文所述的特定过程或特定过程的特定部分,包括定义存储在RAM 1046中的数据结构以及根据软件定义的过程来修改这种数据结构。另外或作为替代,计算机系统可以提供逻辑硬连线或以其它方式包含在电路(例如,加速器1044)中的功能,该电路可以代替软件或与软件一起运行以执行本文所述的特定过程或特定过程的特定部分。在适当的情况下,对软件的引用可以包括逻辑,反之亦然。在适当的情况下,对计算机可读介质的引用可包括存储执行软件的电路(如集成电路(IC)),包含执行逻辑的电路,或两者兼备。本公开包括任何合适的硬件和软件组合。
虽然本公开已对多个示例性实施例进行了描述,但实施例的各种变更、排列和各种等同替换均属于本公开的范围内。因此应理解,本领域技术人员能够设计多种系统和方法,所述系统和方法虽然未在本文中明确示出或描述,但其体现了本公开的原则,因此属于本公开的精神和范围之内。
Claims (20)
1.一种用于视频流传输的方法,其特征在于,所述方法包括:
提供要流传输到客户端的视频内容的媒体呈现描述MPD事件和媒体片段;
控制所述客户端基于所述MPD事件提供用户界面,并包括多个选择选项和每个选择选项的交互数据;以及
通过所述用户界面,基于所述多个选择选项中的至少一个选择更新MPD数据,
其中,所述多个选择选项中的每一个分别指示所述视频内容的多个故事情节的多个时段中的不同时段,以及
所述控制所述客户端提供所述用户界面包括:在所述多个故事情节的至少一个其它时段的至少一个完整播放之前提供所述用户界面,所述至少一个其它时段在所述多个时段中的不同时段之前。
2.根据权利要求1所述的方法,其特征在于,
所述提供所述MPD事件包括:向所述客户端提供故事地图,所述故事地图标识所述视频内容的所述一个其它时段、所述多个时段中的不同时段和至少一个稍后时段,以及
所述故事地图指示在所述多个时段中的不同时段之前调度所述一个其它时段进行流传输,在所述视频内容的所述至少一个稍后时段之前调度所述多个时段中的不同时段进行流传输。
3.根据权利要求2所述的方法,其特征在于,
所述一个其它时段、所述多个时段中的不同时段和所述至少一个稍后时段中的至少一个包括与所述一个其它时段、所述多个时段中的不同时段和所述至少一个稍后时段中的至少另一个不同的持续时间。
4.根据权利要求3所述的方法,其特征在于,
所述控制所述客户端提供所述用户界面包括:控制所述用户界面显示所述故事地图的至少一部分,以及
所述故事地图的所述部分包括所述一个其它时段的指示和所述多个时段中的不同时段的指示。
5.根据权利要求4所述的方法,其特征在于,
所述控制所述客户端提供所述用户界面包括:控制所述用户界面标识在所述一个其它时段的指示和所述多个时段中的不同时段的指示之间的点处的所述至少一个选择的位置。
6.根据权利要求3所述的方法,其特征在于,
所述控制所述用户界面显示所述故事地图的至少一部分包括:基于连接图显示所述故事地图的至少一部分,
所述连接图包括列表,所述列表包括所述一个其它时段、所述多个时段中的不同时段和所述至少一个稍后时段中的每一个;
所述连接图还包括:用于从所述一个其它时段到所述多个时段中的不同时段的每个连接的第一相应标识符,以及
所述连接图还包括:用于从所述多个时段中的不同时段中的至少一个到所述至少一个稍后时段的至少一个连接的第二相应标识符。
7.根据权利要求3所述的方法,其特征在于,
所述控制所述客户端提供所述用户界面包括:控制所述用户界面显示整个故事地图,
所述整个故事地图包括所述一个其它时段的指示、所述多个时段中的不同时段的指示和所述至少一个稍后时段的指示。
8.根据权利要求7所述的方法,其特征在于,
所述控制所述客户端提供所述用户界面包括:控制所述用户界面标识在所述一个其它时段的指示和所述多个时段中的不同时段的指示之间的点处的所述至少一个选择的位置,以及
所述控制所述客户端提供所述用户界面进一步包括:控制所述用户界面标识在所述多个时段中的不同时段的指示中的至少一个指示与所述至少一个稍后时段的指示之间的点处的另一选择的位置。
9.根据权利要求8所述的方法,其特征在于,
所述控制所述用户界面显示所述整个故事地图包括:基于连接图显示所述整个故事地图,
所述连接图包括列表,所述列表包括所述一个其它时段、所述多个时段中的不同时段和所述至少一个稍后时段中的每一个;
所述连接图还包括:用于从所述一个其它时段到所述多个时段中的不同时段的每个连接的第一相应标识符,以及
所述连接图还包括:用于从所述多个时段中的不同时段中的至少一个到所述至少一个稍后时段的至少一个连接的第二相应标识符。
10.根据权利要求1所述的方法,其特征在于,所述客户端是基于HTTP的动态自适应流传输DASH客户端。
11.一种用于视频流传输的装置,其特征在于,所述装置包括:
至少一个存储器,用于存储计算机程序代码;
至少一个处理器,被配置为访问所述计算机程序代码,并按照所述计算机程序代码的指示操作,所述计算机程序代码包括:
提供代码,被配置为使所述至少一个处理器提供要流传输到客户端的视频内容的媒体呈现描述MPD事件和媒体片段;
控制代码,被配置为使所述至少一个处理器控制所述客户端基于所述MPD事件提供用户界面,并包括多个选择选项和每个选择选项的交互数据;以及
更新代码,被配置为使所述至少一个处理器通过所述用户界面,基于所述多个选择选项中的至少一个选择更新MPD数据,
其中,所述多个选择选项中的每一个分别指示所述视频内容的多个故事情节的多个时段中的不同时段,以及
所述控制所述客户端提供所述用户界面包括:在所述多个故事情节的至少一个其它时段的至少一个完整播放之前提供所述用户界面,所述至少一个其它时段在所述多个时段中的不同时段之前。
12.根据权利要求11所述的装置,其特征在于,
所述提供所述MPD事件包括:向所述客户端提供故事地图,所述故事地图标识所述视频内容的所述一个其它时段、所述多个时段中的不同时段和至少一个稍后时段,以及
所述故事地图指示在所述多个时段中的不同时段之前调度所述一个其它时段进行流传输,在所述视频内容的所述至少一个稍后时段之前调度所述多个时段中的不同时段进行流传输。
13.根据权利要求12所述的装置,其特征在于,
所述一个其它时段、所述多个时段中的不同时段和所述至少一个稍后时段中的至少一个包括与所述一个其它时段、所述多个时段中的不同时段和所述至少一个稍后时段中的至少另一个不同的持续时间。
14.根据权利要求13所述的装置,其特征在于,
所述控制所述客户端提供所述用户界面包括:控制所述用户界面显示所述故事地图的至少一部分,以及
所述故事地图的所述部分包括所述一个其它时段的指示和所述多个时段中的不同时段的指示。
15.根据权利要求14所述的装置,其特征在于,
所述控制所述客户端提供所述用户界面包括:控制所述用户界面标识在所述一个其它时段的指示和所述多个时段中的不同时段的指示之间的点处的所述至少一个选择的位置。
16.根据权利要求13所述的装置,其特征在于,
所述控制所述用户界面显示所述故事地图的至少一部分包括:基于连接图显示所述故事地图的至少一部分,
所述连接图包括列表,所述列表包括所述一个其它时段、所述多个时段中的不同时段和所述至少一个稍后时段中的每一个;
所述连接图还包括:用于从所述一个其它时段到所述多个时段中的不同时段的每个连接的第一相应标识符,以及
所述连接图还包括:用于从所述多个时段中的不同时段中的至少一个到所述至少一个稍后时段的至少一个连接的第二相应标识符。
17.根据权利要求13所述的装置,其特征在于,
所述控制所述客户端提供所述用户界面包括:控制所述用户界面显示整个故事地图,
所述整个故事地图包括所述一个其它时段的指示、所述多个时段中的不同时段的指示和所述至少一个稍后时段的指示。
18.根据权利要求17所述的装置,其特征在于,
所述控制所述客户端提供所述用户界面包括:控制所述用户界面标识在所述一个其它时段的指示和所述多个时段中的不同时段的指示之间的点处的所述至少一个选择的位置,以及
所述控制所述客户端提供所述用户界面进一步包括:控制所述用户界面标识在所述多个时段中的不同时段的指示中的至少一个指示与所述至少一个稍后时段的指示之间的点处的另一选择的位置。
19.根据权利要求18所述的装置,其特征在于,
所述控制所述用户界面显示所述整个故事地图包括:基于连接图显示所述整个故事地图,
所述连接图包括列表,所述列表包括所述一个其它时段、所述多个时段中的不同时段和所述至少一个稍后时段中的每一个;
所述连接图还包括:用于从所述一个其它时段到所述多个时段中的不同时段的每个连接的第一相应标识符,以及
所述连接图还包括:用于从所述多个时段中的不同时段中的至少一个到所述至少一个稍后时段的至少一个连接的第二相应标识符。
20.一种非易失性计算机可读介质,用于存储程序,所述程序使计算机执行一个过程,所述过程包括:
提供要流传输到客户端的视频内容的媒体呈现描述MPD事件和媒体片段;
控制所述客户端基于所述MPD事件提供用户界面,并包括多个选择选项和每个选择选项的交互数据;以及
通过所述用户界面,基于所述多个选择选项中的至少一个选择更新MPD数据,
其中,所述多个选择选项中的每一个分别指示所述视频内容的多个故事情节的多个时段中的不同时段,以及
所述控制所述客户端提供所述用户界面包括:在至少一个完整播放之前提供所述用户界面。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063042946P | 2020-06-23 | 2020-06-23 | |
US63/042,946 | 2020-06-23 | ||
US17/242,863 | 2021-04-28 | ||
US17/242,863 US11570517B2 (en) | 2020-06-23 | 2021-04-28 | Application intended interactive selection information for interactive playback of dash content |
PCT/US2021/034540 WO2021262386A1 (en) | 2020-06-23 | 2021-05-27 | Application intended interactive selection information for interactive playback of dash content |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114514752A true CN114514752A (zh) | 2022-05-17 |
Family
ID=79022208
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180005485.1A Pending CN114514752A (zh) | 2020-06-23 | 2021-05-27 | 用于交互式播放dash内容的应用程序预期交互式选择信息 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11570517B2 (zh) |
EP (1) | EP4018623A4 (zh) |
JP (1) | JP7378616B2 (zh) |
KR (1) | KR20220065824A (zh) |
CN (1) | CN114514752A (zh) |
WO (1) | WO2021262386A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11418649B1 (en) * | 2021-08-20 | 2022-08-16 | MBTE Holdings Sweden AB | Inbound and outbound communication session and call control |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104081785A (zh) * | 2011-09-07 | 2014-10-01 | 高通股份有限公司 | 来自多个源的多媒体数据的流式传输 |
CN104396270A (zh) * | 2013-07-02 | 2015-03-04 | 华为技术有限公司 | 一种流媒体处理的方法、装置及系统 |
US9082092B1 (en) * | 2012-10-01 | 2015-07-14 | Google Inc. | Interactive digital media items with multiple storylines |
CN109792546A (zh) * | 2016-09-30 | 2019-05-21 | 英国电讯有限公司 | 观看者重视度自适应比特率传送 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060064733A1 (en) * | 2004-09-20 | 2006-03-23 | Norton Jeffrey R | Playing an audiovisual work with dynamic choosing |
US9009619B2 (en) * | 2012-09-19 | 2015-04-14 | JBF Interlude 2009 Ltd—Israel | Progress bar for branched videos |
US9426196B2 (en) | 2013-01-04 | 2016-08-23 | Qualcomm Incorporated | Live timing for dynamic adaptive streaming over HTTP (DASH) |
US9477380B2 (en) * | 2013-03-15 | 2016-10-25 | Afzal Amijee | Systems and methods for creating and sharing nonlinear slide-based mutlimedia presentations and visual discussions comprising complex story paths and dynamic slide objects |
US9444863B2 (en) | 2013-06-06 | 2016-09-13 | Intel Corporation | Manager for DASH media streaming |
WO2016127862A1 (zh) | 2015-02-13 | 2016-08-18 | 上海交通大学 | 一种关联多媒体内容个性化呈现的实现方法及应用 |
US10582265B2 (en) * | 2015-04-30 | 2020-03-03 | JBF Interlude 2009 LTD | Systems and methods for nonlinear video playback using linear real-time video players |
US11172005B2 (en) | 2016-09-09 | 2021-11-09 | Nokia Technologies Oy | Method and apparatus for controlled observation point and orientation selection audiovisual content |
-
2021
- 2021-04-28 US US17/242,863 patent/US11570517B2/en active Active
- 2021-05-27 CN CN202180005485.1A patent/CN114514752A/zh active Pending
- 2021-05-27 JP JP2022528102A patent/JP7378616B2/ja active Active
- 2021-05-27 WO PCT/US2021/034540 patent/WO2021262386A1/en unknown
- 2021-05-27 KR KR1020227012892A patent/KR20220065824A/ko not_active Application Discontinuation
- 2021-05-27 EP EP21828963.5A patent/EP4018623A4/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104081785A (zh) * | 2011-09-07 | 2014-10-01 | 高通股份有限公司 | 来自多个源的多媒体数据的流式传输 |
US9082092B1 (en) * | 2012-10-01 | 2015-07-14 | Google Inc. | Interactive digital media items with multiple storylines |
CN104396270A (zh) * | 2013-07-02 | 2015-03-04 | 华为技术有限公司 | 一种流媒体处理的方法、装置及系统 |
CN109792546A (zh) * | 2016-09-30 | 2019-05-21 | 英国电讯有限公司 | 观看者重视度自适应比特率传送 |
Non-Patent Citations (2)
Title |
---|
EL ASSAL KARIM等: "Viewport-driven DASH media playback for interactive storytelling", PROCEEDINGS OF THE 10TH ACM MULTIMEDIA SYSTEMS CONFERENCE, pages 304 - 307 * |
EMMANUEL THOMAS (TNO)等: "[OMAF] DASH signalling for OMAF Viewpoint switch", HTTP://PHENIX.INT-EVRY.FR/MPEG/DOC_END_USER/DOCUMENTS/129_BRUSSELS/WG11/M51635-V1-M51635-DASHSIGNALLINGFOROMAFVIEWPOINTSWITCH.ZIP M51635 - DASH SIGNALLING FOR OMAF VIEWPOINT SWITCH.DOCX, pages 1 - 6 * |
Also Published As
Publication number | Publication date |
---|---|
US20210400353A1 (en) | 2021-12-23 |
KR20220065824A (ko) | 2022-05-20 |
JP2023501664A (ja) | 2023-01-18 |
JP7378616B2 (ja) | 2023-11-13 |
EP4018623A4 (en) | 2022-10-05 |
US11570517B2 (en) | 2023-01-31 |
WO2021262386A1 (en) | 2021-12-30 |
EP4018623A1 (en) | 2022-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113826387A (zh) | 在编码视频流中进行分层随机访问的方法 | |
CN114641976B (zh) | 用于流式传输媒体内容的方法、设备和计算机可读介质 | |
JP7378616B2 (ja) | Dashコンテンツのインタラクティブ再生のための用途を意図したインタラクティブな選択情報 | |
CN113994686A (zh) | 点云编码的数据单元和参数集设计 | |
JP7407308B2 (ja) | セッションベースdash動作を使用したセッションベース記述urlのカスタマイズ | |
EP4026274B1 (en) | Bandwidth cap signaling using combo-index segment track in media streaming | |
KR102623398B1 (ko) | 인-매니페스트 업데이트 이벤트 | |
CN114073084A (zh) | 在视频码流中有效发信号通知图片大小和分区信息的方法和装置 | |
JP7345669B2 (ja) | セッションベースのdash動作を使用したurlカスタマイズ | |
JP7434561B2 (ja) | Mpd有効期限処理モデル | |
US20230222823A1 (en) | Method for annotating vvc subpictures in dash |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40070656 Country of ref document: HK |