CN108924643A - 一种流媒体的生成方法、装置、服务器和存储介质 - Google Patents

一种流媒体的生成方法、装置、服务器和存储介质 Download PDF

Info

Publication number
CN108924643A
CN108924643A CN201810958714.1A CN201810958714A CN108924643A CN 108924643 A CN108924643 A CN 108924643A CN 201810958714 A CN201810958714 A CN 201810958714A CN 108924643 A CN108924643 A CN 108924643A
Authority
CN
China
Prior art keywords
streaming media
audio
interface
image
interactively
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810958714.1A
Other languages
English (en)
Inventor
李江峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Bud Nursery Education Technology Co Ltd
Original Assignee
Shanghai Bud Nursery Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Bud Nursery Education Technology Co Ltd filed Critical Shanghai Bud Nursery Education Technology Co Ltd
Priority to CN201810958714.1A priority Critical patent/CN108924643A/zh
Publication of CN108924643A publication Critical patent/CN108924643A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/443OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB
    • H04N21/4438Window management, e.g. event handling following interaction with the user interface
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Abstract

本发明实施例公开了一种流媒体的生成方法、装置、服务器和存储介质。该方法包括:获取待生成流媒体的各张图像和各段音频;根据各张图像的图像信息和各段音频的音频信息,确定多个流媒体片段,其中,流媒体片段包括至少一张图像和/或至少一段音频;根据各流媒体片段的图像信息和/或音频信息,确定交互位置和交互方式,并于交互位置处,插入与交互方式对应的交互输入界面;基于与交互输入界面对应的交互处理逻辑,根据交互输入界面和各流媒体片段,生成流媒体。本发明实施例的技术方案,生成的流媒体可以实现与用户的输入式交互功能,并且无需特定播放器进行播放,提高了用户体验。

Description

一种流媒体的生成方法、装置、服务器和存储介质
技术领域
本发明实施例涉及流媒体处理技术,尤其涉及一种流媒体的生成方法、装置、服务器和存储介质。
背景技术
随着网络的普及和商用化,大量的视频或音频等流媒体业务被广泛应用,比如用于课程辅导、培训课程等学习型的流媒体。
目前,越来越多的人们喜欢在网上观看视频等流媒体来学习知识。通常,传统的流媒体都是顺序单向播放的,即用户只能通过暂停、快进、倒退等方式在单一数据流上进行操作。可见,传统的流媒体无法实现与用户的交互,也无法根据用户的学习情况来调整播放的流媒体内容,从而降低了用户体验,并极大的限制了流媒体业务的应用范围。
在现有技术中,可以通过利用封闭式格式的视频文件来实现与用户进行交互的需求,但这种视频文件必须在特定的播放器中才能播放,无法实现零成本转换,使得播放并不便捷。
发明内容
本发明实施例提供了一种流媒体的生成方法、装置、服务器和存储介质,以实现与用户的输入式交互功能,并且无需特定播放器进行播放,提高了用户体验。
第一方面,本发明实施例提供了一种流媒体的生成方法,包括:
获取待生成流媒体的各张图像和各段音频;
根据所述各张图像的图像信息和所述各段音频的音频信息,确定多个流媒体片段,其中,所述流媒体片段包括至少一张图像和/或至少一段音频;
根据各所述流媒体片段的图像信息和/或音频信息,确定交互位置和交互方式,并于所述交互位置处,插入与所述交互方式对应的交互输入界面;
基于与所述交互输入界面对应的交互处理逻辑,根据所述交互输入界面和各所述流媒体片段,生成流媒体。
第二方面,本发明实施例还提供了一种流媒体的生成装置,包括:
图像音频获取模块,用于获取待生成流媒体的各张图像和各段音频;
流媒体片段确定模块,用于根据所述各张图像的图像信息和所述各段音频的音频信息,确定多个流媒体片段,其中,所述流媒体片段包括至少一张图像和/或至少一段音频;
交互输入界面确定模块,用于根据各所述流媒体片段的图像信息和/或音频信息,确定交互位置和交互方式,并于所述交互位置处,插入与所述交互方式对应的交互输入界面;
流媒体生成模块,用于基于与所述交互输入界面对应的交互处理逻辑,根据所述交互输入界面和各所述流媒体片段,生成流媒体。
第三方面,本发明实施例还提供了一种服务器,所述服务器包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的流媒体的生成方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所述的流媒体的生成方法。
本发明实施例通过根据各张图像的图像信息和各段音频的音频信息,确定用于生成流媒体的多个流媒体片段;根据各流媒体片段的图像信息和/或音频信息,确定交互位置和交互方式,并于交互位置处,插入与交互方式对应的交互输入界面;基于与交互输入界面对应的交互处理逻辑,根据交互输入界面和各流媒体片段,生成流媒体,从而可以通过流媒体中的各个交互输入界面与用户进行输入式交互,以根据用户的输入信息确定将要播放的流媒体片段。并且生成的流媒体中没有进行图像和音频的整合,从而无需特定播放器进行播放,大大提高了用户体验。
附图说明
图1是本发明实施例一提供的一种流媒体的生成方法的流程图;
图2是本发明实施例二提供的一种流媒体的生成装置的结构示意图;
图3是本发明实施例三提供的一种服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种流媒体的生成方法的流程图,本实施例可适用于生成与用户进行输入式交互的流媒体的情况,尤其是可以将生成的流媒体应用于教学场景中,同时也可以应用于其他需要与用户进行交互的场景中。该方法可以由流媒体的生成装置来执行,该装置可以由软件和/或硬件的方式来实现,集成于数据处理服务器中。该方法具体包括以下步骤:
S110、获取待生成流媒体的各张图像和各段音频。
其中,流媒体可以是指通过网络传输的音频或者视频。本实施例中的流媒体可以是指以教学为目的的学习型音频或者视频,如教学课件、课程辅导、培训课程等。本实施例可以通过对一个或多个原有视频进行还原,从而获取原有视频中的每张图像和每段音频,其中原有视频是指没有输入式交互功能的传统流媒体或者视频文件;也可以针对某一教学内容或教学目的来直接获取生成流媒体需要的所有图像和音频。本实施例对待生成流媒体中的图像和音频的数量不进行限定。
S120、根据各张图像的图像信息和各段音频的音频信息,确定多个流媒体片段,其中,流媒体片段包括至少一张图像和/或至少一段音频。
其中,每张图像的图像信息可以包括但不限于图像内容信息和图像播放时长。每段音频的音频信息可以包括但不限于音频内容信息和音频播放时长。本实施例中的图像播放轨道和音频播放轨道是相互独立的两个轨道。流媒体片段可以是指对获取的所有图像和所有音频进行划分而确定的音频或视频片段。流媒体片段的数量是由所有图像的图像信息和所有音频的音频信息确定的。
可选的,S120包括:根据各张图像的图像内容信息和各段音频的音频内容信息,对各张图像和各段音频进行划分和排序,确定多个流媒体片段以及各流媒体片段中各张图像和各段音频对应的起始时刻和结束时刻。
其中,根据图像内容信息和音频内容信息,可以对获取的所有图像和所有音频进行内容划分,并对划分后每组中的图像和音频按照内容进行排序,确定每组中的每张图像和每段音频的先后播放顺序和播放时长。将排序后的一组确定为一个流媒体片段。根据流媒体片段中的每张图像和每段音频的先后播放顺序和播放时长,可以确定流媒体片段中每张图像和每段音频的起始时刻和结束时刻,以便于播放流媒体片段。可选的,对于流媒体片段中连贯的图像或者音频,当前图像或者当前音频的结束时刻与下一图像或下一音频的起始时刻相同,从而在连贯的图像或音频之间可以只确定起始时刻或者结束时刻,以提高处理效率。示例性的,若在获取的所有图像和所有音频中,只有两张图像和一段音频是在讲解加法运算,则将这两张图像和这段音频确定为一个流媒体片段,并确定该流媒体片段中这两张图像和这段音频的起始时刻和结束时刻,同理,对剩余的其他图像和音频也进行内容划分和排序,从而确定其他的流媒体片段。
S130、根据各流媒体片段的图像信息和/或音频信息,确定交互位置和交互方式,并于交互位置处,插入与交互方式对应的交互输入界面。
其中,本实施例中的交互位置是指用于插入交互输入界面的位置,从而可以通过交互输入界面与用户进行输入式交互。交互方式是指流媒体与用户进行交互的方式。可选的,交互方式可以包括但不限于选项方式、填空方式、移动多媒体元素方式和语音方式。交互输入界面可以是根据交互方式和交互位置处流媒体片段内容生成的用于与用户进行交互的界面,比如需要用户回答的交互问题界面。交互输入界面可以以浮层窗体的方式显示在播放界面中,以接收用户的输入信息。示例性的,若交互方式为选项方式,则生成与交互位置对应的交互问题,并且可以在交互输入界面中针对该交互问题设置两个或两个以上选项框,以使用户可以通过选择选项框进行作答;若交互方式为填空方式,则可以在交互输入界面中根据交互问题设置填空框,以接收用户在填空框中的输入信息;若交互方式为移动多媒体元素方式,则可以在交互输入界面中设置多个文字框和多个图像框,以使用户通过移动文字框或者图像框来对文字和图像进行匹配;若交互方式为语音方式,则可以通过交互输入界面控制录音器等设备开启来获取用户输入的语音信息。
需要注意的是,本实施例中根据各流媒体片段的图像信息和/或音频信息,确定的交互位置可以为一个或多个。若存在多个交互位置,则需要确定每个交互位置对应的交互方式,以及每个交互位置处需要插入的交互输入界面。其中,每个交互位置对应的交互方式可以相同,也可以不同,根据业务需求和流媒体片段内容信息确定。本实施例中在每个交互位置处均需要插入一个交互输入界面,从而交互位置的数量与交互输入界面的数量相同。
可选的,S130包括:根据各流媒体片段的图像信息和/或音频信息,于各流媒体片段中确定交互流媒体片段以及与交互流媒体片段对应的交互方式;将交互流媒体片段的结束位置确定为交互位置,并于交互位置处,插入与交互方式对应的交互输入界面。
其中,可以根据每个流媒体片段的图像内容信息和/或音频内容信息,来判断每个流媒体片段是否为交互流媒体片段,其中交互流媒体片段是指需要设置交互输入界面,以与用户进行交互的流媒体片段。示例性的,若某一流媒体片段为讲解加法运算的视频片段,则可以通过设置交互问题界面以检验观看者是否掌握所讲解的加法运算,此时将该流媒体片段设置为交互流媒体片段。若某一流媒体片段是对一个问题进行解析的视频片段,则该流媒体片段不需要与用户进行交互,此时该流媒体片段不是交互流媒体片段。本实施例可以根据交互流媒体片段的内容信息和业务需求,设置该交互流媒体片段对应的交互方式,该交互方式可以是选项方式、填空方式、移动多媒体元素方式和语音方式中的任一种。将交互流媒体片段的结束位置确定为一个交互位置,并在该交互位置后插入与交互流媒体片段的交互方式对应的一个交互输入界面。也就是说,将交互流媒体片段的结束位置确定为交互输入界面的起始位置,即将交互流媒体片段中最后一张图像或最后一段音频的结束时刻作为交互输入界面的起始时刻,从而使得交互流媒体片段播放完毕后,可以立即播放交互输入界面。本实施例中确定的交互流媒体片段也可以为一个或多个,并且交互流媒体片段与交互位置是一一对应关系。
S140、基于与交互输入界面对应的交互处理逻辑,根据交互输入界面和各流媒体片段,生成流媒体。
其中,交互处理逻辑可以是指对用户在交互输入界面中可能输入的交互输入信息进行处理的逻辑。可选的,交互处理逻辑可以是但不限于变更分支逻辑和判断对错逻辑。根据每个交互输入界面的交互处理逻辑,可以在所有流媒体片段中确定每个交互输入界面对应的至少两个流媒体片段,从而生成流媒体。本实施例是根据图像和音频等基本多媒体元素生成的流媒体,并且在生成过程中,没有将图像和音频进行整合,从而使得生成的流媒体并不是一个具有封闭式格式的视频文件,因此无需特定播放器进行播放。本实施例中生成的流媒体可以在任意一个HTML(HyperText Markup Language,超级文本标记语言)网页浏览器中进行播放,使得播放更加便捷,提高了用户体验。
可选的,S140包括:根据交互输入界面中的各个交互输入信息,于各流媒体片段中,确定交互输入界面对应的至少两个分支流媒体片段;建立交互输入界面中的各个交互输入信息与各个分支流媒体片段的对应关系。
其中,交互输入信息是指用户可能在交互输入界面上输入的信息。示例性的,若交互输入界面中存在四个选项A、B、C和D供用户进行选择,则表明该交互输入界面对应四个交互输入信息,分别为A、B、C和D对应的选项内容信息。若某个交互输入界面的交互处理逻辑为判断对错逻辑,则表明该交互输入界面对应两个分支流媒体片段,分别为正确流媒体片段和错误流媒体片段,此时在所有的流媒体片段中,选择该交互输入界面对应的正确流媒体片段和错误流媒体片段,并建立每个交互输入信息与每个分支流媒体片段的对应关系。示例的,当某个交互输入界面中选项A为正确选项,选项B、C和D为错误选项,则建立选项A与正确流媒体片段的对应关系,以及选项B、C和D与错误流媒体片段的对应关系,以使用户在输入A时可以播放正确流媒体片段,输入B、C和D时可以播放错误流媒体片段,其中错误流媒体片段可以是用于提示用户输入错误并提醒重新输入的音频片段。若某个交互输入界面的交互处理逻辑为变更分支逻辑,则根据交互输入界面中交互输入信息的个数,在所有流媒体片段中,选择该交互输入界面中每个交互输入信息对应的分支流媒体片段,并建立每个交互输入信息与分支流媒体片段的对应关系,从而可以根据用户输入的交互输入信息确定用户选择的分支流媒体片段。
可选的,在生成流媒体之后,还包括:于网页浏览器上播放流媒体。
其中,本实施例生成的流媒体可以在任意一个浏览器的HTML网页中播放,无需特定播放器,实现了零成本转换。
可选的,于网页浏览器上播放流媒体,包括:
当网页浏览器播放至流媒体的交互输入界面时,显示并暂停交互输入界面;当接收到用户于交互输入界面上输入的用户信息时,根据预设对应关系确定与用户信息对应的分支流媒体片段,并播放分支流媒体片段。
其中,在网页浏览器播放流媒体时,可以通过边传边播的方式播放流媒体,以减小存储空间;也可以将流媒体预先从后台服务器中加载至浏览器中,以加快交互速度。若采用边传边播的方式播放流媒体,则浏览器需要与后台服务器进行实时交互,即先将当前需要播放的流媒体片段传输至浏览器中,当浏览器播放至当前流媒体片段对应的交互输入界面时,显示该交互输入界面,并自动暂停在该交互输入界面上,等待用户输入信息,当接收到输入的用户信息时,将用户信息发送至后台服务器,后台服务器根据预设对应关系确定该用户信息对应的分支流媒体片段,并将该分支流媒体片段发送至浏览器中,浏览器继续播放该分支流媒体片段,若该分支流媒体片段也对应一个交互输入界面,则播放该交互输入界面时暂停,等待用户的再次输入,同理,接收并继续播放后台服务器再次发送的分支流媒体片段;若该分支流媒体片段没有对应交互输入界面,则表示播放结束,此时停止播放。若将流媒体预先从后台服务器加载至浏览器中,则浏览器播放至某个交互输入界面时,可以直接在浏览器上根据用户在交互输入界面上输入的用户信息以及预设对应关系,确定与用户信息对应的分支流媒体片段,并播放该分支流媒体片段,避免了浏览器与后台服务器之间的交互过程,从而加快了用户与流媒体之间的交互速度。
需要注意的是,本实施例中的流媒体可以根据用户在交互输入界面上输入的用户信息,对后续播放的流媒体片段进行调整,使得播放的流媒体可以更好的满足用户的个性化需求,大大提高了用户体验。
本发明实施例通过根据各张图像的图像信息和各段音频的音频信息,确定用于生成流媒体的多个流媒体片段;根据各流媒体片段的图像信息和/或音频信息,确定交互位置和交互方式,并于交互位置处,插入与交互方式对应的交互输入界面;基于与交互输入界面对应的交互处理逻辑,根据交互输入界面和各流媒体片段,生成流媒体,从而可以通过流媒体中的各个交互输入界面与用户进行输入式交互,以根据用户的输入信息确定将要播放的流媒体片段。并且生成的流媒体中没有进行图像和音频的整合,从而无需特定播放器进行播放,大大提高了用户体验。
实施例二
图2为本发明实施例二提供的一种流媒体的生成装置的结构示意图,本实施例可适用于生成与用户进行输入式交互的流媒体的情况,该装置包括:图像音频获取模块210、流媒体片段确定模块220、交互输入界面确定模块230和流媒体生成模块240。
其中,图像音频获取模块210,用于获取待生成流媒体的各张图像和各段音频;流媒体片段确定模块220,用于根据各张图像的图像信息和各段音频的音频信息,确定多个流媒体片段,其中,流媒体片段包括至少一张图像和/或至少一段音频;交互输入界面确定模块230,用于根据各流媒体片段的图像信息和/或音频信息,确定交互位置和交互方式,并于交互位置处,插入与交互方式对应的交互输入界面;流媒体生成模块240,用于基于与交互输入界面对应的交互处理逻辑,根据交互输入界面和各流媒体片段,生成流媒体。
可选的,流媒体片段确定模块220,具体用于:
根据各张图像的图像内容信息和各段音频的音频内容信息,对各张图像和各段音频进行划分和排序,确定多个流媒体片段以及各流媒体片段中各张图像和各段音频对应的起始时刻和结束时刻。
可选的,交互输入界面确定模块230,具体用于:
根据各流媒体片段的图像信息和/或音频信息,于各流媒体片段中确定交互流媒体片段以及与交互流媒体片段对应的交互方式;
将交互流媒体片段的结束位置确定为交互位置,并于交互位置处,插入与交互方式对应的交互输入界面。
可选的,交互方式包括选项方式、填空方式、移动多媒体元素方式和语音方式。
可选的,流媒体生成模块240,具体用于:
根据交互输入界面中的各个交互输入信息,于各流媒体片段中,确定交互输入界面对应的至少两个分支流媒体片段;
建立交互输入界面中的各个交互输入信息与各个分支流媒体片段的对应关系。
可选的,该装置还包括:
网页浏览器,用于在生成流媒体之后,于网页浏览器上播放流媒体。
可选的,网页浏览器具体用于:
当播放至流媒体的交互输入界面时,显示并暂停交互输入界面;当接收到用户于交互输入界面上输入的用户信息时,根据预设对应关系确定与用户信息对应的分支流媒体片段,并播放分支流媒体片段。
上述流媒体的生成装置可执行本发明任意实施例所提供的流媒体的生成方法,具备执行流媒体的生成方法相应的功能模块和有益效果。
实施例三
图3是本发明实施例三提供的一种服务器的结构示意图。参见图3,该服务器包括:
一个或多个处理器310;
存储器320,用于存储一个或多个程序;
当一个或多个程序被一个或多个处理器310执行,使得一个或多个处理器310实现如上述实施例中任一实施例提出的流媒体的生成方法。
图3中以一个处理器310为例;服务器中的处理器310和存储器320可以通过总线或其他方式连接,图3中以通过总线连接为例。
存储器320作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的流媒体的生成方法对应的程序指令/模块(例如,流媒体的生成装置中的图像音频获取模块210、流媒体片段确定模块220、交互输入界面确定模块230和流媒体生成模块240)。处理器310通过运行存储在存储器320中的软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述的流媒体的生成方法。
存储器320主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器320可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器320可进一步包括相对于处理器310远程设置的存储器,这些远程存储器可以通过网络连接至服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本实施例提出的服务器与上述实施例提出的流媒体的生成方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例具备执行流媒体的生成方法相同的有益效果。
实施例四
本实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所述的流媒体的生成方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
上述实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间的相同或相似的部分互相参见即可。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种流媒体的生成方法,其特征在于,包括:
获取待生成流媒体的各张图像和各段音频;
根据所述各张图像的图像信息和所述各段音频的音频信息,确定多个流媒体片段,其中,所述流媒体片段包括至少一张图像和/或至少一段音频;
根据各所述流媒体片段的图像信息和/或音频信息,确定交互位置和交互方式,并于所述交互位置处,插入与所述交互方式对应的交互输入界面;
基于与所述交互输入界面对应的交互处理逻辑,根据所述交互输入界面和各所述流媒体片段,生成流媒体。
2.根据权利要求1所述的方法,其特征在于,根据所述各张图像的图像信息和所述各段音频的音频信息,确定多个流媒体片段,包括:
根据所述各张图像的图像内容信息和所述各段音频的音频内容信息,对各张图像和各段音频进行划分和排序,确定多个流媒体片段以及各所述流媒体片段中各张图像和各段音频对应的起始时刻和结束时刻。
3.根据权利要求1所述的方法,其特征在于,根据各所述流媒体片段的图像信息和/或音频信息,确定交互位置和交互方式,并于所述交互位置处,插入与所述交互方式对应的交互输入界面,包括:
根据各所述流媒体片段的图像信息和/或音频信息,于各所述流媒体片段中确定交互流媒体片段以及与所述交互流媒体片段对应的交互方式;
将所述交互流媒体片段的结束位置确定为交互位置,并于所述交互位置处,插入与所述交互方式对应的交互输入界面。
4.根据权利要求1所述的方法,其特征在于,所述交互方式包括选项方式、填空方式、移动多媒体元素方式和语音方式。
5.根据权利要求1所述的方法,其特征在于,基于与所述交互输入界面对应的交互处理逻辑,根据所述交互输入界面和各所述流媒体片段,生成流媒体,包括:
根据所述交互输入界面中的各个交互输入信息,于各所述流媒体片段中,确定所述交互输入界面对应的至少两个分支流媒体片段;
建立所述交互输入界面中的各个交互输入信息与各个分支流媒体片段的对应关系。
6.根据权利要求1-5任一项所述的方法,其特征在于,在生成所述流媒体之后,还包括:
于网页浏览器上播放所述流媒体。
7.根据权利要求6所述的方法,其特征在于,于网页浏览器上播放所述流媒体,包括:
当网页浏览器播放至所述流媒体的交互输入界面时,显示并暂停交互输入界面;
当接收到用户于所述交互输入界面上输入的用户信息时,根据预设对应关系确定与所述用户信息对应的分支流媒体片段,并播放所述分支流媒体片段。
8.一种流媒体的生成装置,其特征在于,包括:
图像音频获取模块,用于获取待生成流媒体的各张图像和各段音频;
流媒体片段确定模块,用于根据所述各张图像的图像信息和所述各段音频的音频信息,确定多个流媒体片段,其中,所述流媒体片段包括至少一张图像和/或至少一段音频;
交互输入界面确定模块,用于根据各所述流媒体片段的图像信息和/或音频信息,确定交互位置和交互方式,并于所述交互位置处,插入与所述交互方式对应的交互输入界面;
流媒体生成模块,用于基于与所述交互输入界面对应的交互处理逻辑,根据所述交互输入界面和各所述流媒体片段,生成流媒体。
9.一种服务器,其特征在于,所述服务器包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的流媒体的生成方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的流媒体的生成方法。
CN201810958714.1A 2018-08-22 2018-08-22 一种流媒体的生成方法、装置、服务器和存储介质 Pending CN108924643A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810958714.1A CN108924643A (zh) 2018-08-22 2018-08-22 一种流媒体的生成方法、装置、服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810958714.1A CN108924643A (zh) 2018-08-22 2018-08-22 一种流媒体的生成方法、装置、服务器和存储介质

Publications (1)

Publication Number Publication Date
CN108924643A true CN108924643A (zh) 2018-11-30

Family

ID=64405743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810958714.1A Pending CN108924643A (zh) 2018-08-22 2018-08-22 一种流媒体的生成方法、装置、服务器和存储介质

Country Status (1)

Country Link
CN (1) CN108924643A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109785687A (zh) * 2019-01-31 2019-05-21 北京谦仁科技有限公司 一种用于在线视频教学的数据处理方法、装置及系统
CN111369990A (zh) * 2020-02-13 2020-07-03 北京达佳互联信息技术有限公司 音频播放方法、装置、终端、服务器及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104093079A (zh) * 2014-05-29 2014-10-08 腾讯科技(深圳)有限公司 基于多媒体节目的交互方法、终端、服务器和系统
CN106331743A (zh) * 2015-07-03 2017-01-11 上海尚恩华科网络科技股份有限公司 一种基于音频水印的视频交互的系统及方法
CN106507189A (zh) * 2016-11-01 2017-03-15 热波(北京)网络科技有限责任公司 一种基于vr视频的人机交互方法及系统
US20170171621A1 (en) * 2015-12-09 2017-06-15 Le Holdings (Beijing) Co., Ltd. Method and Electronic Device for Information Processing
CN107736033A (zh) * 2015-06-30 2018-02-23 微软技术许可有限责任公司 用于交互式视频体验的分层交互式视频平台
CN108124187A (zh) * 2017-11-24 2018-06-05 互影科技(北京)有限公司 交互视频的生成方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104093079A (zh) * 2014-05-29 2014-10-08 腾讯科技(深圳)有限公司 基于多媒体节目的交互方法、终端、服务器和系统
CN107736033A (zh) * 2015-06-30 2018-02-23 微软技术许可有限责任公司 用于交互式视频体验的分层交互式视频平台
CN106331743A (zh) * 2015-07-03 2017-01-11 上海尚恩华科网络科技股份有限公司 一种基于音频水印的视频交互的系统及方法
US20170171621A1 (en) * 2015-12-09 2017-06-15 Le Holdings (Beijing) Co., Ltd. Method and Electronic Device for Information Processing
CN106507189A (zh) * 2016-11-01 2017-03-15 热波(北京)网络科技有限责任公司 一种基于vr视频的人机交互方法及系统
CN108124187A (zh) * 2017-11-24 2018-06-05 互影科技(北京)有限公司 交互视频的生成方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
黄天云: "《视频流量分析与QoS管理》", 31 March 2013 *
黑面: "《单反龙之卷 主题摄影实践攻略 第2版》", 31 December 2014 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109785687A (zh) * 2019-01-31 2019-05-21 北京谦仁科技有限公司 一种用于在线视频教学的数据处理方法、装置及系统
CN109785687B (zh) * 2019-01-31 2021-11-16 北京谦仁科技有限公司 一种用于在线视频教学的数据处理方法、装置及系统
CN111369990A (zh) * 2020-02-13 2020-07-03 北京达佳互联信息技术有限公司 音频播放方法、装置、终端、服务器及存储介质

Similar Documents

Publication Publication Date Title
CN112714330B (zh) 基于连麦直播的礼物赠送方法、装置及电子设备
US8307396B2 (en) Systems and methods for producing processed media content
KR20110082062A (ko) 보조 오디오/비디오 콘텐츠를 제공하는 방법, 장치 및 시스템
CN102638708A (zh) 用于增强特殊播放功能的系统和方法
CN104683852B (zh) 处理广播信息的方法和设备
CN104837037B (zh) 一种视频轮播单的生成方法及装置
US20220210514A1 (en) System and process for collaborative digital content generation, publication, distribution, and discovery
CN112954390B (zh) 视频处理方法、装置、存储介质及设备
CN106465069A (zh) 用于基于认证的媒体内容输入推荐媒体内容的协作者的方法、系统和媒体
US9930094B2 (en) Content complex providing server for a group of terminals
CN109326154A (zh) 一种通过语音识别引擎进行人机互动教学的方法
CN108924643A (zh) 一种流媒体的生成方法、装置、服务器和存储介质
CN101232611A (zh) 图像处理设备及其方法
JPWO2005006748A1 (ja) メディア再生装置
JP2008096482A (ja) 受信端末、ネットワーク学習支援システム、受信方法およびネットワーク学習支援方法
CN111787259B (zh) 一种视频录制方法、装置、电子设备及存储介质
KR101198091B1 (ko) 학습 콘텐츠 서비스 제공 방법 및 시스템
CN108833983A (zh) 播放数据获取方法、装置、设备以及存储介质
Roe The evolution of animated documentary
CN112312163A (zh) 视频生成方法、装置、电子设备及存储介质
CN101286274A (zh) 一种供盲人使用的数字视频的自动讲解系统
Francombe et al. Producing audio drama content for an array of orchestrated personal devices
US20220150290A1 (en) Adaptive collaborative real-time remote remediation
US20130262293A1 (en) Variable charging of audience member temporal viewing of a live video chat performance
CN113645470A (zh) 视频播放方法、设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181130