CN112153418A

CN112153418A - 流媒体生成方法、装置、终端及服务器

Info

Publication number: CN112153418A
Application number: CN201910561703.4A
Authority: CN
Inventors: 陈羽飞; 耿军; 杨昌源; 马春阳; 王建光; 刘奎龙; 单利民; 戚亚骏; 张建毅
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2019-06-26
Filing date: 2019-06-26
Publication date: 2020-12-29

Abstract

本申请实施例提供一种流媒体生成方法、装置、终端及服务器。其中，获取目标对象的内容描述页；识别所述内容描述页中的至少一个图片至少一个文本；确定所述至少一个图片与所述至少一个文本之间的图文对应关系；按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体。本申请实施例提供的技术方案提高了流媒体制作效率，降低了流媒体制作成本。

Description

流媒体生成方法、装置、终端及服务器

技术领域

本申请实施例涉及计算机应用技术领域，尤其涉及一种流媒体生成方法、装置、终端及服务器。

背景技术

随着多媒体技术的发展，通过流媒体，如视频等对相关对象进行宣传已成为目前常用方式，特别是在电子商务领域中，为了更好的营销商品，吸引顾客，可以为商品制作相应流媒体，以流媒体方式介绍商品相关信息。

相较于传统的在商品的内容描述页中以图片和文字方式介绍商品相关信息的方式，由于流媒体在单位时间内可以传达更多信息且具有更佳的展示效果，能够吸引更多顾客，因此有助于提高商品转化率。

但是，目前，对商品进行介绍的需要由商家自主拍摄提供，因此，制作周期和制作成本都很高。

发明内容

本申请实施例提供一种流媒体生成方法、装置、终端及服务器，用以解决现有技术中流媒体制作周期长、制作成本高的技术问题。

第一方面，本申请实施例中提供了一种流媒体生成方法，包括：

获取目标对象的内容描述页；

识别所述内容描述页中的至少一个图片和至少一个文本；

确定所述至少一个图片与所述至少一个文本之间的图文对应关系；

按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体。

第二方面，本申请实施例中提供了一种流媒体生成方法，包括：

检测针对目标对象的流媒体制作操作；

向服务端发送流媒体制作请求，以供所述服务端获取目标对象的内容描述页，识别所述内容描述页中的至少一个图片及至少一个文本，以及所述至少一个图片与所述至少一个文本之间的图文对应关系，并按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体。

第三方面，本申请实施例中提供了一种流媒体生成方法，包括：

获取目标商品的内容描述页；

识别所述内容描述页中的至少一个图片及至少一个文本；

按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标商品对应的目标流媒体。

第四方面，本申请实施例中提供了一种流媒体生成方法，包括：

检测针对目标商品的流媒体制作操作；

向服务端发送流媒体制作请求，以供所述服务端获取目标商品的内容描述页，识别所述内容描述页中的至少一个图片及至少一个文本，以及所述至少一个图片与所述至少一个文本之间的图文对应关系，并按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成所述目标商品的目标流媒体。

第五方面，本申请实施例中提供了一种流媒体生成装置，包括：

页面获取模块，用于获取目标对象的内容描述页；

图文识别模块，用于识别所述内容描述页中的至少一个图片及至少一个文本；

关系确定模块，用于确定所述至少一个图片与所述至少一个文本之间的图文对应关系；

流媒体生成模块，用于按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体。

第六方面，本申请实施例中提供了一种流媒体生成装置，包括：

操作检测模块，用于检测针对目标对象的流媒体制作操作；

请求发送模块，用于向服务端发送流媒体制作请求，以供所述服务端获取目标对象的内容描述页，识别所述内容描述页中的至少一个图片及至少一个文本，以及所述至少一个图片与所述至少一个文本之间的图文对应关系，并按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体。

第七方面，本申请实施例中提供了一种服务器，包括处理组件以及存储组件；

所述存储组件存储一个或多个计算机指令；所述一个或多个计算机指令用以被所述处理组件调用执行；

所述处理组件用于：

获取目标对象的内容描述页；

识别所述内容描述页中的至少一个图片及至少一个文本；

第八方面，本申请实施例中提供了一种终端，包括处理组件以及存储组件；

所述处理组件用于：

获取目标对象的内容描述页；

识别所述内容描述页中的至少一个图片及至少一个文本；

第九方面，本申请实施例中提供了一种终端，包括处理组件以及存储组件；

所述处理组件用于：

检测针对目标对象的流媒体制作操作；

本申请实施例中，获取目标对象的内容描述页；识别所述内容描述页中的至少一个图片及至少一个文本；确定所述至少一个图片与所述至少一个文本之间的图文对应关系；按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体。通过本申请实施例，基于内容描述页可以自动生成流媒体，无需进行拍摄获得，可以提高流媒体制作效率，降低流媒体制作成本。

本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本申请提供的一种流媒体生成方法一个实施例的流程图；

图2示出了本申请提供的一种流媒体生成方法又一个实施例的流程图；

图3示出了本申请实施例在一个实际应用中的内容描述页的一种示意图；

图4示出了本申请提供的一种流媒体生成方法又一个实施例的流程图；

图5示出了本申请实施例在一个实际应用中的客户端显示界面的一种示意图；

图6示出了本申请提供的一种流媒体生成方法又一个实施例的流程图；

图7示出了本申请提供的一种流媒体生成方法又一个实施例的流程图；

图8示出了本申请提供的一种流媒体生成装置一个实施例的结构示意图；

图9示出了本申请提供的一种服务器一个实施例的结构示意图；

图10示出了本申请提供的一种流媒体生成装置又一个实施例的结构示意图；

图11示出了本申请提供的一种终端一个实施例的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

在本申请的说明书和权利要求书及上述附图中的描述的一些流程中，包含了按照特定顺序出现的多个操作，但是应该清楚了解，这些操作可以不按照其在本文中出现的顺序来执行或并行执行，操作的序号如101、102等，仅仅是用于区分开各个不同的操作，序号本身不代表任何的执行顺序。另外，这些流程可以包括更多或更少的操作，并且这些操作可以按顺序执行或并行执行。需要说明的是，本文中的“第一”、“第二”等描述，是用于区分不同的消息、设备、模块等，不代表先后顺序，也不限定“第一”和“第二”是不同的类型。

本申请实施例的技术方案可以应用于通过流媒体方式对任意对象进行推广或宣传等的应用场景中，其中，本文所指对象可以是指通过电子商务平台进行销售的商品等，当然，也可以是指其它网上业务平台提供的产品等。此外，本文中的对象在网上业务平台中存在对象的内容描述页，内容描述页中包括对象图片以及以文字形式表述的对象描述信息等，如对象名称、对不同对象图片的介绍信息等。以对象为商品为例，内容描述页也即为商品的内容描述页，在进行网上购物时，顾客通常通过浏览商品的内容描述页来进一步了解商品，商品的内容描述页中可以包括商品的主体图片及细节图片等等，以及结合一个或多个图片进行相应描述的文字内容等。流媒体可以是指视频、电子相册或者其它可以以动画效果展示图文信息的媒体格式等。

现有技术中，以视频为例，视频需要由对象提供者进行视频拍摄获得，制作方式周期长且制作成本也比较高。发明人经过研究发现，内容描述页中是以图片及文字来描述对象的详细介绍信息，其包含了对象所需宣传或推广的所有关键信息，只是内容描述页需要用户花费一定时间进行逐一阅读才可以了解商品，那么是否可以利用内容描述页中的图片和/或文字构成的文本，来生成流媒体，据此，发明人提出了本申请的技术方案，在本申请实施例，首先获取目标对象的内容描述页，之后识别所述内容描述页中的至少一个图片及至少一个文本，并确定所述至少一个图片与所述至少一个文本之间的图文对应关系；从而按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体，使得可以以流媒体方式对目标对象进行介绍，通过本申请实施例的技术方案，基于内容描述页可以自动生成流媒体，无需进行拍摄获得，可以提高流媒体制作效率，降低流媒体制作成本。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

图1为本申请实施例提供的一种流媒体生成方法一个实施例的流程图，该方法可以包括以下几个步骤：

101：获取目标对象的内容描述页。

其中，目标对象可以是指任意一个对象，在电子商务场景中，对象可以是指商品(在电子商务平台展示的虚拟商品，并在用户交易成功之后，配送对应的实际商品)。

可选地，本实施例的技术方案可以由服务端执行，可以是在接收到针对目标对象的流媒体制作请求之后，获取目标对象的内容描述页。

该流媒体制作请求中可以包括所述目标对象的对象标识，从而基于该对象标识可以查找对应的内容描述页。

此外，该流媒体制作请求中还可以是包括所述内容描述页的页面链接地址，从而基于该页面链接地址，可以获取其索引的该内容描述页。

该流媒体制作请求可以是由客户端响应于用户针对目标对象的流媒体制作操作而生成并发送的。

客户端可以输出流媒体制作提示信息，以提示用户进行流媒体制作等。

当然，本实施例的技术方案也可以由客户端执行，因此获取目标对象的内容描述页可以包括：

检测用户针对目标对象的流媒体制作操作，生成流媒体制作请求；

响应该流媒体制作请求，获取目标对象的内容描述页。

客户端可以是从服务端中获取目标对象的内容描述页。

102：识别所述内容描述页中的至少一个图片和/或至少一个文本。

其中，识别所述内容描述页中的至少一个图片和/或至少一个文本以包括：

识别所述内容描述页中的至少一个图片；

识别所述内容描述页中的至少一个文本；

或者，

识别所述内容描述页中的至少一个图片以及至少一个文本。

在内容描述页中可能包括多个图片以及由文字形成的多个文本等，因此，通过对内容描述页进行识别，可以定位得到内容描述页中的图片和/或文本等。

其中，可以具体通过图片识别模型定位内容描述页中的图片区域以及文本区域，对文本区域可以采用OCR(Optical Character Recognition，光学字符识别)技术识别文本内容等。

其中，图片识别模型可以利用预先标注图片区域及文本区域的样本内容描述页进行训练获得，图片识别模型可以为深度学习模型或者其它神经网络模型等。

103：基于所述至少一个图片和/或所述至少一个文本，生成与所述目标对象对应的目标流媒体。

可选地，流媒体可以视频，当然也可以是指电子相册或者具有动画效果的媒体格式等。

在本实施例中，通过对内容描述页进行识别即可以自动生成流媒体，无需进行拍摄获得，可以提高流媒体制作效率，降低流媒体制作成本。

结合上文描述可知，识别所述内容描述页中的至少一个图片和/或至少一个文本以包括：

识别所述内容描述页中的至少一个图片。

因此，所述基于所述至少一个图片和/或所述至少一个文本，生成与所述目标对象对应的目标流媒体包括：

基于所述至少一个图片，生成与所述目标对象对应的目标流媒体。

可选地，可以是将该至少一个图片进行编码转换为流媒体格式，从而得到目标流媒体。该流媒体格式例如可以是指视频格式，从而可以得到目标视频。

此外，识别所述内容描述页中的至少一个图片和/或至少一个文本以包括：

识别所述内容描述页中的至少一个文本。

因此，所述基于所述至少一个图片和/或所述至少一个文本，生成与所述目标对象对应的目标流媒体可以包括：

将所述至少一个文本转换形成一个或多个图片；

基于所述一个或多个图片，生成所述目标对象对应的目标流媒体。

该一个或多个图片用以展示该至少一个文本，图片底色可以为与文本颜色形成对比效果的颜色等。

可选地，可以是将该一个或多个图片进行编码转换为流媒体格式，从而得到目标流媒体。

此外，发明人在研究中发现，虽然将内容描述页面中对象对应的图片，通过编码来生成流媒体，这样可以大大缩减制作周期，但是这种流媒体中只包含图片，其传达的信息有限，如果再由用户提供与图片相匹配的文本，也是比较繁琐的。

而基于文本生成的流媒体中，仅传达了文本信息，用户无法确定对象外观，其传达的信息也是有限的。

因此，如图2所示，发明人提出了本申请的又一个实施例的流媒体生成方法，可以包括如下几个步骤：

201：获取目标对象的内容描述页。

202：识别所述内容描述页中的至少一个图片和至少一个文本。

203：确定所述至少一个图片与所述至少一个文本之间的图文对应关系。

204：按照所述图文对应关系，基于所述至少一个图片和/或所述至少一个文本，生成与所述目标对象对应的目标流媒体。

识别出内容描述页中的至少一个图片以及至少一个文本之后，可以确定该至少一个图片与至少一个文本之间的图文对应关系，也即确定每个图片所对应的文本。该图文对应关系即包括每一个图片与每一个文本的对应关系等。

其中，图文对应关系的确定可以有多种可能实现方式，在下面实施例中会详细进行介绍。

通过本实施例，确定图文对应关系之后，即可以按照所述图文对应关系，基于至少一个图片以及至少一个文本，生成目标流媒体，使得输出该目标流媒体时，在每一个图片的展示时间内，可以展示其对应的文本，图片对应的文本作为图片的宣传文案，可以提高流媒体传递信息的准确度以及丰富度。保证了流媒体内容丰富程度，使得用户可以从目标流媒体中获取更多目标对象的关键信息

可选地，可以将该至少一个图片、以及该至少一个图片分别对应的文本，进行编码转换为流媒体格式，从而得到目标流媒体。

其中，内容描述页通常是按照一定内容排版方式进行图片和文本编辑之后获得。内容排版方式规定了图片与文本的对应关系。因此，作为一种可选的实现方式，所述确定所述至少一个图片与所述至少一个文本的图文对应关系可以包括：

识别所述内容描述页的内容排版方式；

按照所述内容排版方式规定的图片与文本对应关系，确定所述至少一个图片与所述至少一个文本之间的图文对应关系。

内容排版方式中可以包括图片及文本的布局方式、排列顺序等等，比如图片与文本上下布局方式，如从上到下排列三张图片，位于三张图片下边布局三张图片对应的文本；或者图片与文本左右布局方式，如左边布局图片、右边布局图片对应的文本等。以对象为商品为例，如图3所示的商品的内容描述页的部分示意图中，可知，在该部分示意图中，图片与文本为上下布局关系，页面从上到下，先展示一张图片301，再展示该图片301对应的文本302等。当然在一个内容描述页中，每个图片及其对应的文本可能有多种布局方式。

基于内容排版方式规定的图片与文本对应关系，即可以确定该至少一个图片与该至少一个文本之间的图文对应关系。

在某些实施例中，所述识别所述内容描述页的内容排版模式可以包括：

利用排版识别模型识别所述内容描述页的内容排版方式；

其中，所述排版识别模型预先基于样本对象的内容描述页及所述样本对象的内容描述的内容排版方式训练获得。具体可以是将样本对象的内容描述页作为模型的输入，所述样本对象的内容描述的内容排版方式作为模型的标签进行训练获得。

该排版识别模型可以采用神经网络模型等实现。

作为又一种可选的实现方式，所述确定所述至少一个图片与所述至少一个文本的图文对应关系包括：

利用关系识别模型确定所述至少一个图片与所述至少一个文本的图文对应关系；

其中，所述关系识别模型预先基于样本对象的内容描述页的图片与文本，以及图片与文本的对应关系训练获得。具体，可以是将样本对象的内容描述页的图片与文本作为模型的输入、图片与文本的对应关系作为模型的标签进行训练。

该关系识别模型可以采用神经网络模型等实现。

此外，在又一种可选的实现方式，内容描述页若为基于用户提供的对象图片以及描述文本自动生成时，内容描述页中的图片与文本的对应关系是预先知道的，因此，确定所述至少一个图片与所述至少一个文本之间的图文对应关系可以是从数据库中查找获得所述内容描述页中的至少一个图片与所述至少一个文本之间的图文对应关系。

由于内容描述页中的文本可能文字数量太多，导致无法再流媒体中进行展示等，因此，在某些实施例中，所述按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体可以包括：

对所述至少一个图片分别对应的文本提取关键信息，获得所述至少一个图片分别对应的文案内容；

基于所述至少一个图片以及所述至少一个图片分别对应的文案内容，生成所述目标对象的目标流媒体。

其中，对文本提取关键信息可以采用关键词提取模型实现，该关键词提取模型可以为主题模型(topic model)，例如LDA(Latent Dirichlet Allocation，文档主体生成模型)。当然也可以通过TF-IDF(term frequency–inverse document frequency)技术，进行统计获得等。

当然，关键信息提取还可以采用其它方式实现，目前已有比较成熟的关键信息提取方式，在此将不再重复赘述。

在某些实施例中，所述获取目标对象的内容描述页可以包括：

接收用户输入的目标对象的页面链接地址；

获取所述页面链接地址索引的内容描述页。

其中，流媒体生成方法由服务端执行时，该用户输入的目标对象的页面链接地址可以是客户端发送的，携带在流媒体制作请求中。

当然，若流媒体生成方法由客户端执行时，则用户输入的目标对象的页面链接地址即是客户端检测用户输入操作获得。

在某些实施例中，所述按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体可以包括：

基于所述至少一个图片在所述内容描述页中的排版顺序，确定所述至少一个图片的排列顺序；

按照所述排列顺序，将所述至少一个图片及各自对应的文本编码生成目标流媒体。

该排列顺序即为该至少一个图片在目标流媒体中的出现顺序。

可选地，该排列顺序可以与排版顺序相同。

按照图片尺寸要求，对所述至少一个图片分别进行剪裁；

将剪裁获得的至少一个图片及各自对应的文本编码生成目标流媒体。

其中，该图片尺寸要求可以由用户提供的，可以是通过客户端提供的。

该图片尺寸要求例如可以包括1:1；4:3；16:9等等。

按照流媒体时间要求，确定所述至少一个图片的展现时长以及动画效果；

按照所述展现时长以及所述动画效果，将所述至少一个图片以及各自对应的文本编码生成目标流媒体。

该动画效果例如可以是从一个方向到另一个方向逐渐展示等等，使得在展示每一个图片时可以呈现动画特效。

其中，流媒体时间要求可以是用户提供的，可以是通过客户端提供的。

其中，该流媒体时间要求可以规定目标流媒体的总时长，基于该总时长以及该至少一个图片的数量，可以通过平均计算获得每一个图片的展现时长。

当然，该流媒体时间要求也可以规定每个图片的展现时长等。

确定所述至少一个文本在各自对应图片中的展现效果；

按照所述展现效果，将所述至少一个图片以及各自对应的文本编码生成目标流媒体。

该展现效果例如可以包括在图片中的展示位置，如中间位置、右上角或左下角等，还可以包括文本字体的颜色和/或大小，还可以包括文本在对应图片中的动画效果，例如从一个方向到另一个方向逐渐展示等等，使得文本展示呈现动画特效等。

确定音频数据；

按照所述图文对应关系，基于所述至少一个图片、所述至少一个文本以及所述音频数据，生成与所述目标对象对应的目标流媒体。

可选地，该音乐数据可以为用户通过客户端提供，或者根据用户通过客户端提供的音乐类型确定的，该音乐类型例如可以包括舒缓、动感、自然等。

服务端可以通过客户端提供多种音乐类型供用户选择，以便于可以基于用户选择的音乐类型，确定对应的音频数据。

通过加入音频数据，使得目标流媒体更具吸引力。

由上文描述可知，可以对至少一个图片进行剪裁、提取文本关键信息、确定至少一个图片的出现顺序、确定至少一个图片的展现时长、确定至少一个图片的动画效果、还可以确定至少一个文本在各自对应图片中的展现效果等不同操作。在实际应用中，生成目标流媒体时，可以对至少一个图片以及至少一个文本执行上述一个或多个操作，为了提供高质量流媒体，可以执行上述所有操作等，因此，在某些实施例中，所述按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体可以包括：

按照图片尺寸要求，对所述至少一个图片分别进行剪裁；

基于所述至少一个图片的排版顺序，确定所述至少一个图片的排列顺序；

确定所述至少一个文本在各自对应图片中的展现效果；

按照所述出现顺序、所述展示时长、所述动画效果以及所述展现效果，将剪裁获得的至少一个图片及各自对应的文案内容编码生成目标流媒体。

本申请实施例中，生成的目标流媒体可以发布至特定业务平台以实现对目标对象的推广等，当然也可以供用户进行下载传播等。

因此，在某些实施例中，所述方法还可以包括：

生成所述目标流媒体的下载地址；

向用户提供所述下载地址，其中，所述下载地址用于下载获得所述目标流媒体。

此外，可选地，生成的目标流媒体可以发送至客户端，以由客户端输出，实现用户预览目的。因此，在某些实施例中，所述方法还可以包括：

将所述目标流媒体发送至客户端，以供客户端输出所述目标流媒体；

接收到所述客户端的确认请求，生成所述目标流媒体的下载地址；

发送所述下载地址至客户端，以供客户端输出所述下载地址；其中，所述下载地址用于下载获得所述目标流媒体。

也即用户预览目标流媒体之后，若觉得满意可以通过客户端触发确定请求。在客户端中可以展示确认控件等，客户端检测到针对确认控件的确认操作，则可以生成确定请求并发送确定请求至服务端。

此外，用户若对目标流媒体不满意，还可以进行编辑，因此，在某些实施例中，所述将所述目标流媒体发送至客户端，以供客户端输出所述目标流媒体之后，所述还可以包括：

接收所述客户端发送的编辑请求；

按照所述编辑请求中的编辑要求，对所述目标流媒体进行更新。

其中，编辑要求中可以包括对图片尺寸、对文本的展现效果、对音频数据、对流媒体总时长等不同需求。

通过客户端可以展示编辑控件，若检测到用户对编辑控件的编辑操作，可以在客户端中展示编辑界面，在编辑界面中用户可以提供编辑要求。当然，在编辑界面中可以分别展示图片尺寸、文本展现效果、音频数据、流媒体总时长和/或图片动画效果的多个选项以供用户选择。

当然，若流媒体生成方法由客户端执行，则客户端生成目标流媒体之后，还可以输出所述目标流媒体；接收到所述客户端的确认请求，生成所述目标流媒体的下载地址；并输出所述下载地址。

此外，客户端输出所述目标流媒体之后，还可以检测用户的编辑操作，确定用户提供的编辑要求；按照所述编辑请求中的编辑要求，对所述目标流媒体进行更新。

此外，为了为用户提供更优质服务，所述将所述目标流媒体发送至客户端，以供所述客户端输出所述目标流媒体之后，所述方法还可以包括：

通过所述客户端输出所述目标流媒体的支付提示信息；所述支付提示信息用户提示用户进行支付。

所述接收到所述客户端的确认请求，生成所述目标流媒体的下载地址可以包括：

接收到所述客户端发送的确认请求，以及检测支付成功时，生成所述目标流媒体的下载地址。

当然，也可以是在接收到所述客户端发送的确认请求之后，首先通过所述客户端输出所述目标流媒体的支付提示信息；所述支付提示信息用户提示用户进行支付；从而响应于支付成功消息，再生成所述目标流媒体的下载地址。

其中，支付提示信息中可以包括包含支付链接地址的信息载体等，该信息载体例如可以为二维码等图形，用户通过第三方支付客户端扫描二维码调用第三方支付系统进行在线支付等。

当然，作为其它可选方式，客户端响应于针对支付提示信息的触控操作，可以直接调用第三方支付系统进行在线支付等。

图4为本申请实施例提供的一种流媒体生成方法又一个实施例的流程图，本实施例的技术方案由客户端执行，该方法可以包括以下几个步骤：

401：检测针对目标对象的流媒体制作操作。

402：向服务端发送流媒体制作请求。

所述服务端可以获取目标对象的内容描述页，识别所述内容描述页中的至少一个图片及至少一个文本，以及所述至少一个图片与所述至少一个文本之间的图文对应关系，并按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体。

在某些实施例中，所述检测针对目标对象的流媒体制作操作可以包括：

检测用户输入的所述目标对象的页面链接地址；

所述向服务端发送流媒体制作请求可以包括：

向服务端发送包括所述页面链接地址的流媒体制作请求；其中，所述页面链接地址用于获取其索引的内容描述页。

在某些实施例中，所述方法还可以包括：

接收服务端发送的流媒体制作提示信息；

输出所述流媒体制作提示信息；该流媒体制作提示信息用于提示用户制作流媒体，可选地，可以是提示用户输入页面链接地址以用于制作流媒体等。

在某些实施例中，所述方法还可以包括：

检测用户提供的流媒体制作要求；

所述向服务端发送流媒体制作请求包括：

向服务端发送包括所述流媒体制作要求的流媒体制作请求；其中，所述服务端具体是按照所述流媒体制作请求，基于所述至少一个图片及各自对应的文本，生成所述目标流媒体。

其中，该流媒体制作要求中可以包括图片尺寸要求、流媒体时间要求、以及音频类型中的一个或多个等。

该流媒体制作要求可以由用户在客户端输出的特定输入框中输入，或者客户端可以提供多种不同的流媒体制作要求以供用户选择等。

为了方便理解。如图5示出了客户端提供的显示界面的一种界面示意图，在该显示界面中可以包括流媒体制作提示信息501，此外还可以包括输入框控件502以接收用户输入的页面链接地址等。此外，还可以提供不同流媒体制作要求的选项503，以供用户进行选择等。

用户通过触控显示界面中的制作控件504，执行流媒体制作操作，即可以触发流媒体制作请求。

在某些实施例中，所述方法还可以包括：

接收所述服务端发送的所述目标流媒体；

输出所述目标流媒体。

通过输出目标流媒体可以供用户浏览查看目标流媒体是否符合自身需求等。

在某些实施例中，输出所述目标流媒体之后，所述方法还可以包括：

响应于针对所述目标流媒体的确认操作，向服务端发送确认请求，以供服务端响应所述确认请求，生成所述目标流媒体的下载地址；

接收所述服务端发送的所述下载地址；

输出所述下载地址。

其中，服务端接收到确认请求之后，可以将目标流媒体进行保存，并基于目标流媒体的保存位置生成下载地址。

其中，基于该下载地址即可以下载所述目标流媒体至本地保存。

因此，在某些实施例中，所述方法还可以包括：

检测基于所述下载地址触发的下载请求；

从所述服务端下载所述目标流媒体至本地保存。

此外，用户还可以对目标流媒体进行编辑操作，以便于进一步的优化流媒体。因此，在某些实施例中，输出所述目标流媒体之后，所述方法还可以包括：

响应于针对所述目标流媒体的编辑操作，输出所述目标流媒体的编辑界面；

基于用户在所述编辑界面提供的编辑要求，生成编辑请求；

发送所述编辑请求至所述服务端，以供所述服务端按照所述编辑要求，对所述目标流媒体进行更新。

可选地，在编辑界面中可以输出不同编辑要求以供用户进行选择等。

编辑要求可以包括图片尺寸要求、流媒体时间要求、音频类型、以及输入文本等中的一个或多个。也即用户可以对目标流媒体中的图片尺寸、流媒体时间、音频数据、和/或每个图片对应展示的文本等进行调整或更新等。

此外，在某些实施例中，输出所述目标流媒体之后，还可以包括：

输出支付提示信息；

响应于针对所述支付提示信息的支付操作，调用第三方支付系统进行在线支付；

向服务端发送支付成功消息。

其中，服务端接收到针对目标流媒体的确认请求，且接收到支付成功消息之后，可以再生成下载地址。

在一个实际应用中，本申请实施例的技术方案可以应用于电子商务场景中，用以对商品进行推广或宣传等场景中，生成的目标流媒体可以发布至商品主图页中进行展示等。商品主图页是指包括商品主要图片以及基本信息的页面等。在电子商务场景中，目标对象也即是指目标商品，内容描述页也即是指商品的内容描述页。参见图6以及图7分别从服务端以及客户端角度对目标对象为目标商品时的流媒体生成流程进行了简要描述，其它相同或相应步骤可以具体上述图1或图3所示实施例中所述。当然，可以理解的是，图6所示的流媒体生成方法也可以由客户端执行，以降低服务端的处理压力等。

如图6所示，为本申请提供的一种流媒体生成方法又一个实施例的流程图，该方法可以包括以下几个步骤：

601：获取目标商品的内容描述页。

602：识别所述内容描述页中的至少一个图片及至少一个文本。

603：确定所述至少一个图片与所述至少一个文本之间的图文对应关系。

604：按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标商品对应的目标流媒体。

在某些实施例中，所述方法还可以包括：

接收到针对所述目标流媒体的发布请求，将所述目标流媒体发布至商品主图页。

如图7所示，为本申请提供的一种流媒体生成方法又一个实施例的流程图，该方法可以包括以下几个步骤：

701：检测针对目标商品的流媒体制作操作。

702：向服务端发送流媒体制作请求，以供所述服务端获取目标商品的内容描述页，识别所述内容描述页中的至少一个图片及至少一个文本，以及所述至少一个图片与所述至少一个文本之间的图文对应关系，并按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成所述目标商品的目标流媒体。

图8为本申请实施例提供的一种流媒体生成装置一个实施例的结构示意图，该装置可以包括：

页面获取模块801，用于获取目标对象的内容描述页；

图文识别模块802，用于识别所述内容描述页中的至少一个图片及至少一个文本；

关系确定模块803，用于确定所述至少一个图片与所述至少一个文本之间的图文对应关系；

流媒体生成模块803，用于按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体。在某些实施例中，所述关系确定模块具体用于识别所述内容描述页的内容排版方式；按照所述内容排版方式规定的图片与文本对应关系，确定所述至少一个图片与所述至少一个文本之间的图文对应关系。

在某些实施例中，所述关系确定模块识别所述内容描述页的内容排版方式具体是利用排版识别模型识别所述内容描述页的内容排版方式；

其中，所述排版识别模型预先基于样本对象的内容描述页及所述内容描述的内容排版方式训练获得。

在某些实施例中，所述关系确定模块具体用于利用关系识别模型确定所述至少一个图片与所述至少一个文本的图文对应关系；

其中，所述关系识别模型预先基于样本对象的内容描述页中的图片与文本，以及图片与文本的对应关系训练获得。

在某些实施例中，所述流媒体生成模块具体用于对所述至少一个图片分别对应的文本提取关键信息，获得所述至少一个图片分别对应的文案内容；基于所述至少一个图片以及所述至少一个图片分别对应的文案内容，生成所述目标对象的目标流媒体。

在某些实施例中，所述页面获取模块具体用于接收用户输入的目标对象的页面链接地址；获取所述页面链接地址索引的内容描述页。

在某些实施例中，所述流媒体生成模块具体用于基于所述至少一个图片在所述内容描述页中的排版顺序，确定所述至少一个图片的排列顺序；按照所述排列顺序，将所述至少一个图片及各自对应的文本编码生成目标流媒体。

在某些实施例中，所述流媒体生成模块具体用于确定音频数据；按照所述图文对应关系，基于所述至少一个图片、所述至少一个文本以及所述音频数据，生成与所述目标对象对应的目标流媒体。

在某些实施例中，所述流媒体生成模块具体用于按照图片尺寸要求，对所述至少一个图片分别进行剪裁；基于所述至少一个图片的排版顺序，确定所述至少一个图片的排列顺序；按照流媒体时间要求，确定所述至少一个图片的展现时长以及动画效果；确定所述至少一个文本在各自对应图片中的展现效果；对所述至少一个图片分别对应的文本提取关键信息，获得所述至少一个图片分别对应的文案内容；按照所述出现顺序、所述展示时长、所述动画效果以及所述展现效果，将剪裁获得的至少一个图片及各自对应的文案内容编码生成目标流媒体。

在某些实施例中，所述装置还可以包括：

地址生成模块，用于将所述目标流媒体发送至客户端，以供所述客户端输出所述目标流媒体；接收到所述客户端的确认请求，生成所述目标流媒体的下载地址；发送所述下载地址至客户端，以供客户端输出所述下载地址；其中，所述下载地址用于下载获得所述目标流媒体。

在某些实施例中，所述装置还可以包括：

流媒体更新模块，用于接收所述客户端发送的编辑请求；按照所述编辑请求中的编辑要求，对所述目标流媒体进行更新。

本申请技术方案应用于电子商务场景中时，所述页面获取模块即具体用于获取目标商品的内容描述页；

所述图文识别模块具体用于识别所述内容描述页中的至少一个图片及至少一个文本；

所述关系确定模块具体用于确定所述至少一个图片与所述至少一个文本之间的图文对应关系；

所述流媒体生成模块具体用于按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标商品对应的目标流媒体。

图8所述的流媒体生成装置可以执行图2所示实施例所述的流媒体生成方法，其实现原理和技术效果不再赘述。对于上述实施例中的流媒体生成装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

在一个可能的设计中，图8所示的流媒体生成装置可以实现为服务器，如图9所示，该服务器可以包括存储组件901以及处理组件902；

所述存储组件901存储一条或多条计算机指令，其中，所述一条或多条计算机指令供所述处理组件902调用执行。

所述处理组件用于：

获取目标对象的内容描述页；

识别所述内容描述页中的至少一个图片及至少一个文本；

其中，处理组件902可以包括一个或多个处理器来执行计算机指令，以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

存储组件901被配置为存储各种类型的数据以支持在终端的操作。存储组件可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

当然，服务器必然还可以包括其他部件，例如输入/输出接口、通信组件等。

输入/输出接口为处理组件和外围接口模块之间提供接口，上述外围接口模块可以是输出设备、输入设备等。

通信组件被配置为便于服务器和其他设备之间有线或无线方式的通信等。

本申请实施例还提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被计算机执行时可以实现上述图1所示实施例的流媒体生成方法。

此外，在又一个可能的设计中，图8所示的流媒体生成装置还可以实现为终端，也即用户侧设备，因此，该终端可以包括处理组件以及存储组件；

所述处理组件用于：

获取目标对象的内容描述页；

识别所述内容描述页中的至少一个图片及至少一个文本；

可选地，处理组件获取目标对象的内容描述页可以包括：

检测针对目标对象的流媒体制作操作，生成流媒体制作请求；

响应所述流媒体制作请求，获取所述目标对象的内容描述页。

通过由终端执行流媒体生成方案，可以降低服务器处理压力等。

图10为本申请实施例提供的一种流媒体生成装置又一个实施例的结构示意图，该装置可以包括：

操作检测模块1001，用于检测针对目标对象的流媒体制作操作；

请求发送模块1002，用于向服务端发送流媒体制作请求，以供所述服务端获取目标对象的内容描述页，识别所述内容描述页中的至少一个图片及至少一个文本，以及所述至少一个图片与所述至少一个文本之间的图文对应关系，并按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体。

在某些实施例中，所述操作检测模块具体用于检测用户输入的所述目标对象的页面链接地址；

所述请求发送模块具体用于向服务端发送包括所述页面链接地址的流媒体制作请求；其中，所述页面链接地址用于获取其索引的内容描述页。

在某些实施例中，所述装置还可以包括：

要求检测模块，用于检测用户提供的流媒体制作要求；

所述请求发送模块具体用于向服务端发送包括所述流媒体制作要求的流媒体制作请求；其中，所述服务端具体是按照所述流媒体制作请求，基于所述至少一个图片及各自对应的文本，生成所述目标流媒体。

在某些实施例中，所述装置还可以包括：

流媒体输出模块，用于接收所述服务端发送的所述目标流媒体；输出所述目标流媒体。

在某些实施例中，所述装置还可以包括：

流媒体确认模块，用于响应于针对所述目标流媒体的确认操作，向服务端发送确认请求，以供服务端响应所述确认请求，生成所述目标流媒体的下载地址；接收所述服务端发送的所述下载地址；输出所述下载地址。

在某些实施例中，所述装置还可以包括：

流媒体编辑请求模块，用于响应于针对所述目标流媒体的编辑操作，输出所述目标流媒体的编辑界面；基于用户在所述编辑界面提供的编辑要求，生成编辑请求；发送所述编辑请求至所述服务端，以供所述服务端按照所述编辑要求，对所述目标流媒体进行更新。

本申请技术方案应用于电子商务场景中时，操作检测模块即具体用于检测针对目标商品的流媒体制作操作；

请求发送模块具体用于向服务端发送流媒体制作请求，以供所述服务端获取目标商品的内容描述页，识别所述内容描述页中的至少一个图片及至少一个文本，以及所述至少一个图片与所述至少一个文本之间的图文对应关系，并按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标商品对应的目标流媒体。

图10述的流媒体生成装置可以执行图3所示实施例所述的流媒体生成方法，其实现原理和技术效果不再赘述。对于上述实施例中的流媒体生成装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

在一个可能的设计中，图10所示实施例的流媒体生成装置可以实现为终端，如图11所示，该终端可以包括存储组件1101以及处理组件1102；

所述存储组件1101存储一条或多条计算机指令，其中，所述一条或多条计算机指令供所述处理组件1102调用执行。

所述处理组件1102用于：

检测针对目标对象的流媒体制作操作；

可选地，该终端还可以包括一显示组件，所述处理组件用于通过所述显示组件提供一显示界面；

所述处理组件检测针对目标对象的流媒体制作操作可以是在所述显示界面检测针对目标对象的流媒体制作操作。

其中，处理组件1102可以包括一个或多个处理器来执行计算机指令，以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

存储组件1101被配置为存储各种类型的数据以支持在终端的操作。存储组件可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

显示组可以为电致发光(EL)元件、液晶显示器或具有类似结构的微型显示器、或者视网膜可直接显示或类似的激光扫描式显示器。

当然，终端必然还可以包括其他部件，例如输入/输出接口、通信组件等。

通信组件被配置为便于终端和其他设备之间有线或无线方式的通信等。

本申请实施例还提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被计算机执行时可以实现上述图4所示实施例的流媒体生成方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种流媒体生成方法，其特征在于，包括：

获取目标对象的内容描述页；

识别所述内容描述页中的至少一个图片和至少一个文本；

2.根据权利要求1所述的方法，其特征在于，所述确定所述至少一个图片与所述至少一个文本的图文对应关系包括：

识别所述内容描述页的内容排版方式；

3.根据权利要求2所述的方法，其特征在于，所述识别所述内容描述页的内容排版模式包括：

利用排版识别模型识别所述内容描述页的内容排版方式；

其中，所述排版识别模型预先基于样本对象的内容描述页及所述对象内容描述的内容排版方式训练获得。

4.根据权利要求1所述的方法，其特征在于，所述确定所述至少一个图片与所述至少一个文本的图文对应关系包括：

5.根据权利要求1所述的方法，其特征在于，所述按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体包括：

6.根据权利要求1所述的方法，其特征在于，所述获取目标对象的内容描述页包括：

接收用户输入的目标对象的页面链接地址；

获取所述页面链接地址索引的内容描述页。

7.根据权利要求1所述的方法，其特征在于，所述按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体包括：

8.根据权利要求1所述的方法，其特征在于，所述按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体包括：

确定音频数据；

9.根据权利要求1所述的方法，其特征在于，所述按照所述图文对应关系，基于所述至少一个图片及所述至少一个文本，生成与所述目标对象对应的目标流媒体包括：

按照图片尺寸要求，对所述至少一个图片分别进行剪裁；

确定所述至少一个文本在各自对应图片中的展现效果；

10.根据权利要求1所述的方法，其特征在于，还包括：

将所述目标流媒体发送至客户端，以供所述客户端输出所述目标流媒体；

11.根据权利要求10所述的方法，其特征在于，所述将所述目标流媒体发送至客户端，以供客户端输出所述目标流媒体之后，所述方法还包括：

接收所述客户端发送的编辑请求；

12.一种流媒体生成方法，其特征在于，包括：

检测针对目标对象的流媒体制作操作；

13.根据权利要求12所述的方法，其特征在于，所述检测针对目标对象的流媒体制作操作包括：

检测用户输入的所述目标对象的页面链接地址；

所述向服务端发送流媒体制作请求包括：

14.根据权利要求12所述的方法，其特征在于，还包括：

检测用户提供的流媒体制作要求；

所述向服务端发送流媒体制作请求包括：

15.根据权利要求12所述的方法，其特征在于，还包括：

接收所述服务端发送的所述目标流媒体；

输出所述目标流媒体。

16.根据权利要去15所述的方法，其特征在于，还包括：

接收所述服务端发送的所述下载地址；

输出所述下载地址。

17.根据权利要求15所述的方法，其特征在于，还包括：

基于用户在所述编辑界面提供的编辑要求，生成编辑请求；

18.一种流媒体生成方法，其特征在于，包括：

获取目标商品的内容描述页；

识别所述内容描述页中的至少一个图片及至少一个文本；

19.一种流媒体生成方法，其特征在于，包括：

检测针对目标商品的流媒体制作操作；

20.一种流媒体生成装置，其特征在于，包括：

页面获取模块，用于获取目标对象的内容描述页；

21.一种流媒体生成装置，其特征在于，包括：

操作检测模块，用于检测针对目标对象的流媒体制作操作；

22.一种服务器，其特征在于，包括处理组件以及存储组件；

所述处理组件用于：

获取目标对象的内容描述页；

识别所述内容描述页中的至少一个图片及至少一个文本；

23.一种终端，其特征在于，包括处理组件以及存储组件；

所述处理组件用于：

获取目标对象的内容描述页；

识别所述内容描述页中的至少一个图片及至少一个文本；

24.一种终端，其特征在于，包括处理组件以及存储组件；

所述处理组件用于：

检测针对目标对象的流媒体制作操作；