CN106657257B - 产生用于交互式多媒体应用程序的音视频的方法和装置 - Google Patents

产生用于交互式多媒体应用程序的音视频的方法和装置 Download PDF

Info

Publication number
CN106657257B
CN106657257B CN201610965029.2A CN201610965029A CN106657257B CN 106657257 B CN106657257 B CN 106657257B CN 201610965029 A CN201610965029 A CN 201610965029A CN 106657257 B CN106657257 B CN 106657257B
Authority
CN
China
Prior art keywords
video clip
user
streaming video
user input
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610965029.2A
Other languages
English (en)
Other versions
CN106657257A (zh
Inventor
郭荣昌
杨昇龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yobeta Co.,Ltd.
Original Assignee
Yobeta Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US14/932,252 external-priority patent/US9635073B1/en
Application filed by Yobeta Co ltd filed Critical Yobeta Co ltd
Publication of CN106657257A publication Critical patent/CN106657257A/zh
Application granted granted Critical
Publication of CN106657257B publication Critical patent/CN106657257B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8166Monomedia components thereof involving executable data, e.g. software
    • H04N21/8173End-user applications, e.g. Web browser, game
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4781Games
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1083In-session procedures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/401Support for services or applications wherein the services involve a main real-time session and one or more additional parallel real-time or time sensitive sessions, e.g. white board sharing or spawning of a subconference
    • H04L65/4015Support for services or applications wherein the services involve a main real-time session and one or more additional parallel real-time or time sensitive sessions, e.g. white board sharing or spawning of a subconference where at least one of the additional parallel sessions is real time or time sensitive, e.g. white board sharing, collaboration or spawning of a subconference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/762Media network packet handling at the source 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/131Protocols for games, networked simulations or virtual reality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2181Source of audio or video content, e.g. local disk arrays comprising remotely distributed storage units, e.g. when movies are replicated over a plurality of video servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234309Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2387Stream processing in response to a playback request from an end-user, e.g. for trick-play
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47202End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4825End-user interface for program selection using a list of items to be played back in a given order, e.g. playlists
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/61Network physical structure; Signal processing
    • H04N21/6106Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
    • H04N21/6125Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8543Content authoring using a description language, e.g. Multimedia and Hypermedia information coding Expert Group [MHEG], eXtensible Markup Language [XML]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8545Content authoring for generating interactive applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8547Content authoring involving timestamps for synchronizing content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/858Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot
    • H04N21/8586Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot by using a URL

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Business, Economics & Management (AREA)
  • Library & Information Science (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明公开一种在视频串流中实现的交互式应用程序的方法、装置和计算机程序产品,通过储存和撷取串流视频剪辑以及相关的元数据,用以实现交互式应用程序的方法、装置和计算机程序产品。

Description

产生用于交互式多媒体应用程序的音视频的方法和装置
技术领域
本发明涉及一种交互式应用程序的方法,特别涉及一种在视频串流中实现的交互式应用程序的方法。
背景技术
交互式应用程序,如游戏,可以是计算密集的。特别是对于某些种类的互动是应用程序,如交互式多媒体应用,这种高运算负载的主要组成是需要产生视频或音频以响应用户的输入。此外,负载会随着用户数量加成,因为相同的影像和声音可能需要针对给定应用的每个多个用户中分别产生。.
当这样的应用程序设置于服务器,例如基于云的服务器,结果可能需要大量的服务器,而其取得、更新和维持都是昂贵的。
在托管(hosting)计算密集的交互式应用程序,如游戏,需要较佳的解决方案。
发明内容
本发明的实施例将多媒体计算机程序转换输出为一系列的串流视频剪辑,其可以通过由网络数据中心(IDCs)和内容发送网络(CDN)组成的视频串流基础设施在全球分发。
此外,在一些实施例中,视频剪辑以元数据标记方便播放,元数据可以包括,例如,标识符和触发信息。标识符可以是每个视频剪辑的唯一标识符,触发信息可以指定标识符下个播放的剪辑,可能是当前用户输入或其他条件的函数。
一般来说,本发明的实施例包括视频剪辑产生过程和交互式播放程序。
在产生过程中,用户(或者在一些变形,仿真的,机器人用户)与传统的交互式计算机程序互动。在响应用户的互动,计算机程序产生原始视频和音频数据,储存用户输入或其他事件触发产生的特定视频和音频数据,与触发条件相关的特定视频和音频数据之后转换为串流视频剪辑。该剪辑以元数据标记,包括例如ID、触发条件或播放事件,以及长度。在一些实施例,该剪辑之后经由内容发送网络传送到选定的网络数据中心以支持一个或多个交互式应用程序。
在播放过程中,在某些实施例,例如支持交互式游戏播放的实施例,播放第一个视频剪辑。在第一视频剪辑播放结束时(或在一些实施例,在第一视频剪辑播放期间的任何时间),参考元数据以识别触发条件或将触发下个视频剪辑播放的条件。在侦测到触发条件(例如用户按下某个按钮)时,播放下个视频剪辑。以这种方式继续播放直到基于最后的触发条件播放最后的视频剪辑。
在一些实施例中,播放发生在服务器中,如基于云的串流服务器,而内容从服务器串流到用户。在其他的实施例,在播放时,内容经由CDN和IDC串流到用户。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
附图说明
图1是根据本发明实施例的分布式主从式计算机系统支持交互式实时多媒体应用程序的方框图;
图2是视频串流基础设施包括内容发送网络(CDN)和多个网络数据中心 (IDCs)的方框图,通过本发明的实施例来分发视频剪辑;
图3是其根据本发明实施例,描述交互式视频剪辑产生和播放系统的图;
图4是根据本发明实施例的视频剪辑产生和播放程序的流程图;
图5是根据本发明实施例,描述视频剪辑的图结构组。
具体实施方式
本发明实施例提供多媒体信息的产生和播放,如用于交互式实时媒体应用程序的串流视频剪辑。
圖1是根据本发明实施例,分布式主从式计算机系统1000支持交互式实时多媒体应用程序的方框图。计算机系统1000包括一个或多个服务器计算机 101和一个或多个用户设备103通过计算机程序产品131配置。计算机程序131 可以在暂时性的或非暂时性的计算机可读取介质提供;然而,在特定实施例中,他是在非暂时性计算机可读取介质中提供,如持续性的(如,非挥发性)储存,挥发性内存(如,随机存取内存),或各种其他已知的非暂时性计算机可读取介质。
用户设备103包括中央处理器单元(CPU)120、内存122和储存空间121. 用户设备103也包括输入和输出(I/O)子系统(图中未单独示出)(包括如显示器或触控显示器、键盘、d-pad、轨迹球、触摸板、操作杆、麦克风、和/ 或其他用户接口设备和相关联的控制器电路和/或软件)。用户设备103可以包括任何类型,可以提供媒体内容的电子设备。一些例子包括桌面计算机和可携式电子设备如移动电话、智能型手机、多媒体播放器、电子阅读器、平板/触摸板、笔记本电脑或膝上型PCs、智能电视、智能手表、头戴式显示器和其他通讯设备。
服务器计算机101包括中央处理单元CPU110、储存空间111和内存112(并可包括I/O子系统,未单独示出)。服务器计算机101可以是能够托管计算机产品131的任何计算机设备,用来与一个或多个客户端计算机通讯,例如,用户设备103,通过网络,例如网络102(如,网络)。服务器计算机101经由网络与一个或多个客户端计算机通讯,并且可以采用协议如网络协议组 (TCP/IP)、超文本传送协议(HTTP)或HTTPS、实时协议,或其他协议。
内存112和122可以包括任何已知的计算机内存设备。储存空间111和 121可以包括任何已知的储存空间设备。
尽管未示出,内存112和122和/或储存空间111和121也可以包括任何可通过服务器计算机101和用户设备103存取的数据储存设备,诸如,可移动或可携式的任何内存(如,闪存或外接硬盘),或任何由第三方托管的数据储存空间(如云端储存空间),并且不限于此。
用户设备103和服务器计算机101经由网络102存取和通讯。网络102 包括有线和无线连接,包括广域网(WANs)和蜂巢式网络或任何其他类型作为设备间通讯使用的计算机网络。
在所示实施例中,计算机程序产品131实际上代表计算机程序产品或计算机程序产品部分组成,用来在个别的服务器101和用户设备103上执行。计算机程序产品131的部分装入内存112组成服务器101,遵照本文进一步描述的发明要求,记录并播放交互式串流视频剪辑。串流视频剪辑播放到,例如,用户设备103,其支持接收串流视频,例如经由具有HTML5功能的浏览器。
图2显示视频串流基础设施的一个例子,通过本发明的实施例使用以分发视频剪辑。如图所示,视频串流基础设施2000包括内容发送网络(CDN)200 和网络数据中心(IDCs)210-260。
媒体文件201最初储存在文件储存空间202,媒体文件201之后经由 CDN200分发到IDCs 210-260。在文件分发后,每个个别的IDC具有分发媒体文件的本地副本。个别的本地副本之后储存为媒体文件副本211-261。每个 IDC 210-260之后服务串流媒体,如视频,到个别IDC地理邻近区域的用户,以响应用户的请求。媒体文件副本211-261可以周期性的更新。
在本发明的一些实施例,使用视频串流基础设施2000分发由本文公开的发明过程产生的视频剪辑。也就是说,例如,本发明的视频剪辑作为媒体文件 201储存在文件储存空间202,之后经由CDN 200分发到IDCs 210-260,在那里他们可以用于作为串流视频播放给用户。
在其他实施例,本发明视频剪辑直接从,例如,一个或多个服务器,如基于云的服务器分发,而不使用视频串流基础设施2000。
图3是一个系统3000的高阶方框图,其用来产生和储存用元数据标记的交互式视频剪辑,并用来分发交互式视频到用户设备,根据本发明的实施例。系统3000可以被实现为硬件模块或软件模块,或硬件和软件模块的组合。在部分实施例,系统3000的至少一部分包括在服务器运行的软件,如服务器101。
在所示的实施例中,除了产生和储存以元数据标记的交互式视频剪辑,系统3000执行附加的相关功能。例如,在该实施例系统3000还能够回放预先储存的视频剪辑,并且能够响应用户的互动传输串流视频给用户,而不需要将视频首次储存如视频剪辑。在替代实施例中,这些一个或多个功能可以通过单独或多个系统提供。
在图3,计算机程序310可以是,例如,交互式多媒体应用程序。例如,计算机程序310可以是游戏应用程序。计算机程序310产生输出程序320响应输入程序330。
在一些实施例,输出程序320包括原始视频和音频输出,在一些实施例,输出程序320包括视频渲染结果。
在一些实施例,输入程序330包括基于用户输入互动指示的控制信息,如用户按下按钮,选择列表上的项目或键入命令。这样的用户输入互动可以源自输入接口设备350,输入接口设备可以是与用户设备相关的接口设备,如用户设备103。特定用户设备相关的接口设备可以包括操作杆、鼠标、触控屏幕等。在一些实施例,输入接口设备350可以与远程用户设备103并列,并与其他系统的组件经由网络通讯。虽然标记为「接口设备」,但是本领域技术人员将了解输入设备/组件如接口设备350可以,在特定实施例中,包括输入组件被建置于,即,部分的,用户设备103中(例如触控屏幕、按钮等),而不是从用户设备103分离并插入用户设备103中。
在一些实施例中,输入接口设备350是「机器人」实体,产生一连串仿真真实使用者行为的输入序列。这样的机器人实体可以用来「训练」系统,并且使其产生许多(或甚至全部)输出程序320可能的情况。以这种方式「训练」系统3000的目的可以是,例如,使其产生并储存每个与输出程序320相关视频剪辑的至少一个副本。
应用程序互动容器340提供运行环境运行计算机程序310。在本发明的实施例中,应用程序互动容器340侦测并截取通过输入接口设备350产生的用户输入,并以输入程序330的形式,传递拦截的用户输入到计算机程序310。
应用程序互动容器340还截取原始视频和音频产生为输出程序320,并且利用计算机程序视频处理平台360的服务将原始视频和音频转换串流视频格式,然后将转换的视频和音频作为一个或多个视频片段或剪辑370储存在数据库390。每个剪辑代表响应特定触发条件的音频和视频输出程序(或播放事件),其中一组可能的触发条件包括,例如,输入程序330的特定项目。在一些实施例,原始视频和音频转换为多媒体封装格式,在一些实施例,原始视频和音频被转换为称为MPEG2-传输串流(MPEG2-TS)的格式。
随着视频剪辑370的产生,他们也以一组属性380标记(这里也称作「元数据」),组成,例如,剪辑ID、播放事件和长度。元数据380中的属性与相关联的对应的视频剪辑370储存于数据库390。储存的剪辑370可以用于将来的播放,储存的、标记视频剪辑370可以由相同或不同的用户再次使用。潜在地,给定的剪辑370可以通过数千个用户以计算机程序310在共享服务器或服务器组上互动而被再次使用。
例如,下一次出现给定的播放事件(基于,例如,来自特定用户输入的侦测,从相同用户或不同用户),可以播放以该事件标记的储存的视频剪辑370,从而避免需要重新产生对应的原始视频和音频。对于一些应用程序,这可以导致计算机处理能力的显著节省。见下面的播放过程说明,以得到进一步的细节。
如上所述,在所示实施例中,系统3000也可以回放预先储存的视频剪辑。例如,基于用户经由输入接口设备350的互动,使输入程序330、计算机程序 310可以确定特定具有对应到用户互动的元数据380的预先储存剪辑370,其是有效的并且适合响应用户的互动。然后匹配的剪辑370可以从储存空间和串流中撷取,例如,根据多媒体封存格式,如MPEG2-TS,到用户设备103。
如上所述,在所示实施例中,系统3000也可以串流视频给用户以响应用户互动,即使视频当前未被储存为串流视频剪辑370,例如,基于用户经由输入接口设备350互动使输入程序330、计算机程序310可以确定特定视频输出是适合响应用户互动,但没有对应的剪辑370可以使用。所需的视频可以之后通过计算机程序310产出作为原始输出视频320。应用程序互动容器340之后截取输出程序320并且,利用计算机程序视频处理平台360的服务,将原始视频转换为流格式,根据,例如,多媒体封装格式,如MPEG2-TS,并将串流视频发送给用户设备103。有利地,串流视频可以同时被记录、封装为视频剪辑370,并与适当的元数据380储存以作为将来使用。
图4显示产出、储存和播放互动视频剪辑及相关的元数据的过程4000,根据本发明的实施例。在一些实施例,过程4000也支持其他相关的功能,如,例如,在没有首次储存视频作为视频剪辑下,串流视频给用户。
在步骤410,计算机程序在服务器,如服务器101启动。服务器可以是,例如,基于云的服务器。服务器可以是,例如,游戏服务器。计算机程序可以是,例如,交互式多媒体应用程序,如,例如,游戏应用程序。
在步骤420,该过程监控用户输入。
在决策框430,如果没有侦测到用户输入,过程返回到步骤420并继续监控用户输入。若侦测到用户输入,则控制移转到决策框440。
在决策框440,若具有匹配元数据的预先储存视频剪辑存在(即,元数据对应用户输入),控制移转到步骤450,预先储存视频剪辑串流到用户。然后控制返回到步骤420,并且该过程继续监控用户输入。
如果,在决策框440,没有发现具匹配元数据的预先储存剪辑,控制移转到步骤460。在步骤460,来自输出程序响应用户输入的视频片段串流到用户。同时,视频片段被记录用来作为对应视频剪辑的创建准备。在步骤470,记录的视频以串流形式被封装到视频剪辑。例如,流格式可以是多媒体封装格式如 MPEG2-TS。
在步骤480,产生与视频剪辑相关的元数据(例如,剪辑ID,播放事件或触发、长度)。
在步骤490,视频剪辑和相关的元数据储存作为将来使用,例如,当遇到与对应剪辑储存元数据的启动装置时,视频剪辑可以通过播放程序在将来使用。通过使用储存的视频剪辑,播放程序可以避免计算机程序需要重新产生对应储存视频剪辑的视频片段。
视频片段可以继续被记录,封装到流格式的片段中,并与相关的元数据储存直到,例如,游戏结束。
注意,程序4000在服务器运行的情况下,例如基于云的服务器,其实际上可以同时处理多个用户,可能许多用户。在这样的情况下,完全可能的是,给定的视频片段已经被记录、封装并储存为视频剪辑370,与对应的元数据380 在先前用户与程序4000的交互过程中。在这种情况下,不应该需要再次记录对应的片段,相反地,视频剪辑可以从先前储存的剪辑系列中撷取,基于元数据,其可以包括唯一的ID。
图5显示视频剪辑和相关元数据的图形结构化例子组5000,根据本发明实施例使用在播放程序。这些剪辑可以是,例如,从图3的系统3000和/或通过图4的程序4000产生的视频剪辑370和相关的元数据380。在播放程序,视频剪辑370从服务器串流,如服务器计算机101或与网络数据中心相关的服务器,如IDC210。视频剪辑370在用户设备接收并观看,如用户设备103,其具有适当的功能,如支持HTML5的浏览器。
每个交互式多媒体应用程序或应用程序的部分,可能与相似于视频剪辑组 5000形式的播放视频剪辑组相关,也称作元数据播放列表,例如,多级别游戏的每个级别可以有他自己的元数据播放列表。如上所述,关于每个视频剪辑 370的元数据被学习作为响应真实或「机器人」用户输入的执行应用程序,因此,同时,元数据播放列表也学习,这是因为元数据播放列表是视频剪辑370 的集合,根据元数据380连接,针对特定的应用程序或应用程序的部分。
在图5的例子中,视频剪辑由圆圈表示,每个具有一个ID。例如,视频剪辑510以ID=A标记。箭头表示「播放事件」或触发条件使播放程序5000 依箭头方向前进,例如,若视频剪辑520正在播放而按钮X被按下,视频剪辑 520的播放停止而视频剪辑530开始。若,另一方面,当视频剪辑520正在播放,用户选择「项目2」,程序转而改变到视频剪辑540。若视频剪辑530正在播放而按钮Y被按下,程序转换并播放视频剪辑550。若视频剪辑540正在播放而用户滑动到「目标Z」,则程序转换并播放视频剪辑560。若视频剪辑 560或550任一个正在播放而从麦克风(「MIC」)接收到音频命令「提交」,程序转换并开始播放视频剪辑570。说明稍微不同种类的触发,当视频剪辑510 完成播放时,程序自动前进到标记A’的视频剪辑,即视频剪辑520。
可选地,可以采用快取机制帮助视频剪辑的平滑播放。
在本发明的部分实施例,从服务器传送到用户设备的视频,是混合预先计算的视频(储存和再次播放的视频剪辑)和实时产生的视频串流(尚未储存为具有元数据的视频剪辑的视频)。
在上面的描述中,参考串流多媒体封装格式,如MPEG2-TS。应当理解,本发明的实施例不限于MPEG2-TS,而是可以采用各种各样串流封装格式的任何一种,包含但不限于3GP、ASF、AVI、DVR-MS、Flash Video(FLV,F4V)、 IFF、Matroska(MKV)、MJ2、QuickTime文件格式、MPEG节目串流、MP4、Ogg 和RM(RealMedia封装)。实施例在没有标准化封装格式下的运作也是被预期的。
尽管上面已经描述了一些示例性实施例,但本技术领域人员将了解,在不脱离本发明的精神和范围的情况下,许多修改和变化是可能的。因此,所有这些修改和变化是预期包含在发明请求的范围内。

Claims (12)

1.一种用于产生使用于交互式多媒体应用程序的视频和音频的方法,其特征在于,包括,在一个或多个计算机连接到一网络:
监控需要一视频或音频响应的用户输入;
在遇到要求视频或音频响应的一第一用户的输入,播放与所述第一用户的输入相关的一第一储存串流视频剪辑;
读取与所述第一储存串流视频剪辑相关的一第一元数据组,其中所述第一元数据组包括一第二用户的输入的播放事件;以及
当遇到所述第二用户的输入,播放由所述第一元数据组确定的一第二储存串流视频剪辑。
2.根据权利要求1所述的方法,其特征在于,所述第一储存串流视频剪辑和第二储存串流视频剪辑被串流到连接到所述网络的一用户设备。
3.根据权利要求1所述的方法,其特征在于,所述第一储存串流视频剪辑和第二储存串流视频剪辑被串流到通过一网络数据中心的一服务器连接到一内容发送网络的一用户设备。
4.根据权利要求1所述的方法,其特征在于,还包括:
遇到一第三用户的输入,
确定所述第三用户的输入没有对应到一预先储存的视频剪辑,
基于所述第三用户的输入串流一视频片段到一用户,以及
储存所述视频片段为一第三储存串流视频剪辑,连同基于至少部分所述第三用户的输入的元数据。
5.根据权利要求1所述的方法,其特征在于,所述第一用户的输入和第二用户的输入源自一远程用户设备。
6.根据权利要求1所述的方法,其特征在于,所述第一用户的输入和第二用户的输入源自一仿真机器人实体。
7.根据权利要求1所述的方法,其特征在于,所述第一储存串流视频剪辑和第二储存串流视频剪辑格式符合MPEG2-TS。
8.根据权利要求4所述的方法,还包括其特征在于,所述第三储存串流视频剪辑,基于由各个用户提供的用户输入播放到多个不同用户。
9.一种用于产生使用于交互式多媒体应用程序的视频和音频的装置,其特征在于,包括:
用于监控需要一视频或音频响应的用户输入的模块;
用于在遇到要求视频或音频响应的一第一用户的输入,播放与所述第一用户的输入相关的一第一储存串流视频剪辑的模块;
用于读取与所述第一储存串流视频剪辑相关的一第一元数据组的模块,其中所述第一元数据组包括一第二用户的输入的播放事件;以及
用于当遇到所述第二用户的输入,播放由所述第一元数据组确定的一第二储存串流视频剪辑的模块。
10.根据权利要求9所述的装置,其特征在于,所述第一储存串流视频剪辑和第二储存串流视频剪辑格式符合MPEG2-TS。
11.根据权利要求9所述的装置,其特征在于,元数据包括一剪辑ID。
12.一种非暂时性计算机可读介质,所述非暂时性计算机可读介质上存有计算机程序,其特征在于,所述计算机程序被处理器执行时实现以下步骤:
监控要求一视频或音频响应的用户输入;
当遇到要求一视频或音频响应的一第一用户的输入,播放与所述第一用户的输入相关的一第一储存串流视频剪辑;
读取与所述第一储存串流视频剪辑相关的一第一元数据组,其中所述第一元数据组包括一第二用户的输入的播放事件;以及
当遇到所述第二用户的输入,播放由所述第一元数据组确定的一第二储存串流视频剪辑。
CN201610965029.2A 2015-11-04 2016-11-04 产生用于交互式多媒体应用程序的音视频的方法和装置 Active CN106657257B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US14/932,252 US9635073B1 (en) 2015-11-04 2015-11-04 Interactive applications implemented in video streams
US14/932,252 2015-11-04
US15/095,987 2016-04-11
US15/095,987 US20170127150A1 (en) 2015-11-04 2016-04-11 Interactive applications implemented in video streams

Publications (2)

Publication Number Publication Date
CN106657257A CN106657257A (zh) 2017-05-10
CN106657257B true CN106657257B (zh) 2020-09-29

Family

ID=58637598

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201610963010.4A Pending CN106658211A (zh) 2015-11-04 2016-11-04 在视频串流中实现的交互式应用程序
CN201610965029.2A Active CN106657257B (zh) 2015-11-04 2016-11-04 产生用于交互式多媒体应用程序的音视频的方法和装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201610963010.4A Pending CN106658211A (zh) 2015-11-04 2016-11-04 在视频串流中实现的交互式应用程序

Country Status (4)

Country Link
US (1) US20170127150A1 (zh)
JP (2) JP2017103760A (zh)
CN (2) CN106658211A (zh)
TW (2) TWI634482B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3538329A4 (en) * 2016-11-10 2020-08-19 Warner Bros. Entertainment Inc. SOCIAL ROBOT WITH ENVIRONMENTAL CONTROL FUNCTION
US10966001B2 (en) 2018-04-05 2021-03-30 Tvu Networks Corporation Remote cloud-based video production system in an environment where there is network delay
US11463747B2 (en) 2018-04-05 2022-10-04 Tvu Networks Corporation Systems and methods for real time control of a remote video production with multiple streams
US11212431B2 (en) 2018-04-06 2021-12-28 Tvu Networks Corporation Methods and apparatus for remotely controlling a camera in an environment with communication latency
JP7278850B2 (ja) * 2018-05-04 2023-05-22 株式会社ユビタス ビデオランダムアクセスメモリにおけるマルチソースメディアをオーバーレイするシステム及び方法
CN109951743A (zh) * 2019-03-29 2019-06-28 上海哔哩哔哩科技有限公司 弹幕信息处理方法、系统及计算机设备
US11438672B2 (en) * 2019-10-14 2022-09-06 Palantir Technologies Inc. Systems and methods for generating, analyzing, and storing data snippets
CN111632373B (zh) * 2020-05-30 2021-05-28 腾讯科技(深圳)有限公司 一种启动游戏的方法、装置及计算机可读存储介质
CN114339109A (zh) * 2021-12-24 2022-04-12 中电福富信息科技有限公司 一种基于跨存储资源跨网络跨文件的录像级联方法
CN115509671B (zh) * 2022-11-21 2023-12-05 北京世纪好未来教育科技有限公司 互动课件播放方法、装置、设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100359949C (zh) * 2004-03-26 2008-01-02 美国博通公司 一种用于发送和接收视频信息的方法及其系统
CN102461161A (zh) * 2009-05-08 2012-05-16 谷歌公司 在基于web的媒体中经由广告标记的内容联合
CN103581731A (zh) * 2012-07-18 2014-02-12 阿里巴巴集团控股有限公司 视频信息获取的方法及客户端、服务器
CN104221391A (zh) * 2012-04-23 2014-12-17 汤姆逊许可公司 同位体辅助的视频分发
CN104350741A (zh) * 2012-06-29 2015-02-11 国际商业机器公司 用于传送的视频的递增准备

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003532164A (ja) * 2000-05-03 2003-10-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コンテンツ情報の処理を制御する方法
JP3878650B2 (ja) * 2003-02-28 2007-02-07 松下電器産業株式会社 記録媒体、再生装置、記録方法、プログラム、再生方法。
US8842175B2 (en) * 2004-03-26 2014-09-23 Broadcom Corporation Anticipatory video signal reception and processing
WO2006050135A1 (en) * 2004-10-29 2006-05-11 Eat.Tv, Inc. System for enabling video-based interactive applications
US20060230428A1 (en) * 2005-04-11 2006-10-12 Rob Craig Multi-player video game system
WO2007060600A1 (en) * 2005-11-23 2007-05-31 Koninklijke Philips Electronics N.V. Method and apparatus for playing video
US8613024B2 (en) * 2005-12-13 2013-12-17 United Video Properties, Inc. Cross-platform predictive popularity ratings for use in interactive television applications
US7873982B2 (en) * 2006-06-22 2011-01-18 Tivo Inc. Method and apparatus for creating and viewing customized multimedia segments
JP4008951B2 (ja) * 2006-12-04 2007-11-14 株式会社東芝 メタデータストリームを再生するための装置及びプログラム
US8631453B2 (en) * 2008-10-02 2014-01-14 Sony Corporation Video branching
TW201025110A (en) * 2008-12-17 2010-07-01 Novafora Inc Method and apparatus for generation, distribution and display of interactive video content
EP2290982A1 (en) * 2009-08-25 2011-03-02 Alcatel Lucent Method for interactive delivery of multimedia content, content production entity and server entity for realizing such a method
JP5577415B2 (ja) * 2010-02-22 2014-08-20 ドルビー ラボラトリーズ ライセンシング コーポレイション ビットストリームに埋め込まれたメタデータを用いたレンダリング制御を備えるビデオ表示
JP5488180B2 (ja) * 2010-04-30 2014-05-14 ソニー株式会社 コンテンツ再生装置、制御情報提供サーバ、及びコンテンツ再生システム
JP2012004645A (ja) * 2010-06-14 2012-01-05 Nec Corp 3dコンテンツ配信システム、3dコンテンツ配信方法および3dコンテンツ配信プログラム
JP6210684B2 (ja) * 2010-10-01 2017-10-11 サターン ライセンシング エルエルシーSaturn Licensing LLC 情報処理装置、情報処理方法、及びプログラム
US8665345B2 (en) * 2011-05-18 2014-03-04 Intellectual Ventures Fund 83 Llc Video summary including a feature of interest
US9437247B2 (en) * 2011-11-14 2016-09-06 Apple Inc. Preview display for multi-camera media clips
JP2013140542A (ja) * 2012-01-06 2013-07-18 Toshiba Tec Corp 情報表示装置、情報配信装置およびプログラム
US8948568B2 (en) * 2012-07-31 2015-02-03 Google Inc. Customized video
US9566505B2 (en) * 2012-12-27 2017-02-14 Sony Interactive Entertainment America Llc Systems and methods for generating and sharing video clips of cloud-provisioned games
EP2775731A1 (en) * 2013-03-05 2014-09-10 British Telecommunications public limited company Provision of video data

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100359949C (zh) * 2004-03-26 2008-01-02 美国博通公司 一种用于发送和接收视频信息的方法及其系统
CN102461161A (zh) * 2009-05-08 2012-05-16 谷歌公司 在基于web的媒体中经由广告标记的内容联合
CN104221391A (zh) * 2012-04-23 2014-12-17 汤姆逊许可公司 同位体辅助的视频分发
CN104350741A (zh) * 2012-06-29 2015-02-11 国际商业机器公司 用于传送的视频的递增准备
CN103581731A (zh) * 2012-07-18 2014-02-12 阿里巴巴集团控股有限公司 视频信息获取的方法及客户端、服务器

Also Published As

Publication number Publication date
US20170127150A1 (en) 2017-05-04
CN106658211A (zh) 2017-05-10
JP2017103760A (ja) 2017-06-08
JP2017098948A (ja) 2017-06-01
TW201719393A (zh) 2017-06-01
TW201720175A (zh) 2017-06-01
TWI634482B (zh) 2018-09-01
CN106657257A (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
CN106657257B (zh) 产生用于交互式多媒体应用程序的音视频的方法和装置
US9635073B1 (en) Interactive applications implemented in video streams
US9767195B2 (en) Virtualized hosting and displaying of content using a swappable media player
US9485305B2 (en) API platform that includes server-executed client-based code
US9473548B1 (en) Latency reduction in streamed content consumption
CN102298947B (zh) 一种用于在多媒体播放器间进行播放切换的方法与设备
US11736749B2 (en) Interactive service processing method and system, device, and storage medium
US20090070673A1 (en) System and method for presenting multimedia content and application interface
US9055193B2 (en) System and method of a remote conference
US9578395B1 (en) Embedded manifests for content streaming
JP2019533233A (ja) メディア記憶
WO2017080167A1 (zh) 第三方视频推送方法和系统
CN113424553A (zh) 用于响应于用户选择而推进交互式媒体项目的重放的技术
WO2020125381A1 (zh) 用于生成信息的方法和装置
US9912746B2 (en) Content distribution system
WO2022117028A1 (zh) 基于游戏直播的主播输入操作分享与显示方法、及设备
CN109462777B (zh) 视频热度更新方法、装置、终端及存储介质
US9313255B2 (en) Directing a playback device to play a media item selected by a controller from a media server
CN103686247A (zh) 基于同/异步的视频分发方法和系统
CN108881281A (zh) 一种故事机的播放方法、装置、系统、设备及存储介质
WO2023217106A1 (zh) 视频播放方法及装置
KR102369525B1 (ko) 원격 접속을 위한 장치, 시스템 및 방법
KR102399661B1 (ko) 원격 접속을 위한 장치 및 방법
CN115065866B (zh) 一种视频生成方法、装置、设备及存储介质
US20240340326A1 (en) Playback aware video packaging

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1238014

Country of ref document: HK

TA01 Transfer of patent application right

Effective date of registration: 20200826

Address after: 5 / F, YM Park, No.18, No.3, zhierdingmu, Tokyo, Japan

Applicant after: Yobeta Co.,Ltd.

Address before: Cayman Islands Grand Cayman 1112-KY1 2804 box floor 4 square Wei Hui Qi Lou

Applicant before: British Cayman Islands Business Units Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant