WO2022143253A1

WO2022143253A1 - 视频生成方法、装置、设备及存储介质

Info

Publication number: WO2022143253A1
Application number: PCT/CN2021/139606
Authority: WO
Inventors: 王俊强; 郑紫阳; 关伟鸿; 吕海涛; 林婉铃; 叶佳莉; 林伟文; 李杨; 张展尘; 曾颖雯; 车欣
Original assignee: 北京字跳网络技术有限公司
Priority date: 2020-12-31
Filing date: 2021-12-20
Publication date: 2022-07-07
Also published as: CN112866798A; EP4243427A4; EP4243427A1; CN112866798B; JP2023553622A; US20230317117A1

Abstract

本公开涉及一种视频生成方法、装置、设备及存储介质，其中，该方法包括：在获取到用户配置的视频主题以及视频制作指令时，根据视频制作指令获取用户图像以及与视频主题匹配的多个视频模板，通过将用户图像嵌入至少部分视频模板的预留位置上，使得用户图像与视频模板上的情景素材结合生成至少一个视频，并通过获取至少一个视频中的待发布的视频，将待发布的视频发布到预设的视频播放平台上。本公开实施例可以实现在视频制作过程中只要将用户图像嵌入到多个视频模板中就能够一次生成至少一个个视频的效果，不需要用户重复拍摄，并且预先设计好情景素材不但能够帮助用户更好的表达主题内容，提高视频的质量和趣味性，还能够降低对用户拍摄能力的要求。

Description

视频生成方法、装置、设备及存储介质

本公开要求于2020年12月31日提交中国国家知识产权局、申请号为202011626264.X、发明名称为“视频生成方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本公开实施例涉及视频处理技术领域，尤其涉及一种视频生成方法、装置、设备及存储介质。

背景技术

相关技术提供的视频应用可以为用户提供拍摄和分享视频的功能。随着越来越多的用户通过视频应用拍摄或分享视频，如何提高用户拍摄的视频的质量，简化用户的拍摄操作，提高视频拍摄的趣味性是当前亟需解决的问题。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本公开实施例提供了一种视频生成方法、装置、设备及存储介质。

本公开实施例的第一方面提供了一种视频生成方法，该方法包括：

获取用户配置的视频主题以及视频制作指令；根据视频制作指令，获取用户图像，以及与视频主题相匹配的多个视频模板，其中，视频模板中包括预设的情景素材和用户图像的预留位置；将用户图像嵌入到所述多个视频模板中的至少部分视频模板的预留位置上，使得用户图像分别与该些视频模板上的情景素材结合生成至少一个视频，获取该些视频中的待发布的视频，将待发布的视频发布到预设的视频播放平台上。

本公开实施例的第二方面提供了一种视频生成装置，该装置包括：

第一获取模块，用于获取用户配置的视频主题以及视频制作指令；

第二获取模块，用于根据视频制作指令，获取用户图像，以及与视频主题相匹配的多个视频模板，其中，视频模板中包括预设的情景素材和用户图像的预留位置；

视频生成模块，用于将用户图像嵌入到所述多个视频模板中的至少部分视频模板的预留位置上，使得用户图像分别与这些视频模板上的情景素材结合生成至少一个个视频；

第三获取模块，用于获取至少一个视频中待发布的视频；

发布模块，用于将待发布的视频发布到预设的视频播放平台上。

本公开实施例的第三方面提供了一种终端设备，该终端设备包括存储器和处理器，其中，存储器中存储有计算机程序，当计算机程序被处理器执行时，处理器可以执行上述第一方面的方法。

本公开实施例的第四方面提供了一种计算机可读存储介质，该存储介质中存储有计算机程序，当该计算机程序被处理器执行时，使得处理器可以执行上述第一方面的方法。

本公开实施例提供的技术方案与现有技术相比具有如下优点：

本公开实施例，在获取到用户配置的视频主题以及视频制作指令时，根据视频制作指令获取用户图像，以及与视频主题相匹配的多个视频模板，通过将用户图像嵌入至少部分视频模板的预留位置上，使得用户图像与被嵌入的视频模板上的情景素材进行结合生成至少一个视频，并通过获取至少一个视频中的待发布的视频，将待发布的视频发布到预设的视频播放平台上。本公开实施例提供的方案针对每个主题预先设置多个视频模板，同时在视频模板中预先设计好相应的情景素材并在视频模板中预留用户图像的嵌入位置，这样在视频制作过程中只要将用户图像嵌入到多个视频模板中就能够一次生成至少一个视频，不需要用户重复拍摄，简化了用户操作，提高了视频生成效率和用户体验，并且预先设计好情景素材不但能够帮助用户更好的表达主题内容(比如用户的心情)，提高视频的质量和趣味性，还能够降低对用户拍摄能力的要求，帮助用户更好表达所要表达的主题，提高了用户制作视频的积极性，另外对于视频消费者来说，视频质量的提高也能够提升观看体验。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的一种视频生成方法的流程图；

图2为本公开实施例提供的一种视频模板的显示界面的示意图；

图3为本公开实施例提供的一种用户图像拍摄界面的示意图图；

图4为本公开实施例提供的一种第一显示界面的显示示意图；

图5为本公开实施例提供的一种第三显示界面的显示示意图；

图6为本公开实施例提供的一种交互界面的显示示意图；

图7为本公开实施例提供的另一种视频生成方法的流程图；

图8为本公开实施例提供的一种显示有心情配置按键的用户信息界面的显示示意图；

图9为本公开实施例提供的一种心情配置界面的显示示意图；

图10为本公开实施例提供的一种心情设置的流程图；

图11为本公开实施例提供一种第二显示界面的显示示意图；

图12为本公开实施例提供的一种视频发布界面的显示示意图；

图13为本公开实施例提供的另一种视频生成方法的流程图；

图14为本公开实施例提供的一种视频生成装置的结构示意图；

图15为本公开实施例提供的一种终端设备的结构示意图。

具体实施方式

为了能够更清楚地理解本公开的上述目的、特征和优点，下面将对本公开的方案进行进一步描述。需要说明的是，在不冲突的情况下，本公开的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本公开，但本公开还可以采用其他不同于在此描述的方式来实施；显然，说明书中的实施例只是本公开的一部分实施例，而不是全部的实施例。

图1为本公开实施例提供的一种视频生成方法的流程图，本公开实施例可以适用于如何基于用户图像便捷生成用户需求视频的情况。该视频生成方法可以由视频生成装置执行，该装置可以采用软件和/或硬件实现，并可集成在任意的终端设备上，例如移动终端、平板电脑等。并且，该视频生成装置可以作为独立的应用程序实现，也可以作为功能模块集成在视频交互应用中。

如图1所示，本公开实施例提供的视频生成方法可以包括：

S101、获取用户配置的视频主题以及视频制作指令。

其中，视频制作指令用于指示终端设备为用户生成需求视频。以视频交互应用为例，视频交互应用的预设界面中包括用于触发视频制作指令的控件或按键，用户可以通过触控该控件或按键触发视频制作指令。其中，在保证可以实现较好的应用交互性以及为用户提供较高的使用体验的基础上，该预设界面可以是视频交互应用中的任意界面，例如视频交互应用的主界面或者用户信息界面等，控件或按键在预设界面的显示位置也可以根据设计需求而定。

本公开实施例提及的视频主题用于对视频模板进行分类或者用于对待生成的视频进行分类，例如视频主题的类型可以包括用户心情(指用户在虚拟社交空间中呈现的心情状态)系列、恋爱系列、办公系列等。不同类型的视频主题对应不同的视频模板。并且，在每个类型的视频主题下，针对不同的主题子分类，还可以对视频模板进一步进行细分。例如，用户心情对应的子分类可以包括但不限于：开心、悲伤、生气、嫉妒等，每个子分类下又可以对应多个视频模板。用户可以在触发视频制作指令之前，配置需求的视频主题，也可以在完成视频主题的配置之前，触发视频制作指令。

S102、根据视频制作指令，获取用户图像，以及与视频主题相匹配的多个视频模板，其中，视频模板中包括预设的情景素材和用户图像的预留位置。

在本公开实施例中，获取的用户图像可以是用户当前拍摄的图像，也可以是根据用户的图像选择操作或上传操作，从用户相册中获取的已有图像，本公开实施例对此不作具体限定，即本公开实施例的技术方案针对任意来源的用户图像均具有广泛的适用性。用户图像是指包括人脸的任意图像。

关于用户图像和视频模板的获取顺序，本公开实施例不作具体限定。示例性的，可以在获取到与用户配置的视频主题相匹配的多个(指至少两个)视频模板之后获取用户图像，还可以在获取用户图像之后获取与用户配置的视频主题相匹配的多个视频模板。

以获取用户当前拍摄的图像为例，获取用户图像包括：输出拍摄界面；获取用户基于拍摄界面拍摄得到的用户图像。其中，该拍摄界面可以是由视频制作指令的触发界面切换进入，也可以是由视频模板的显示界面切换进入，并且，视频制作指令的触发界面或者视频模板的显示界面上均可以显示用于引导用户进入拍摄界面的提示信息，以提升界面交互性，提高用户体验。

图2为本公开实施例提供的一种视频模板的显示界面的示意图，图3为本公开实施例提供的一种用户图像拍摄界面的示意图。如图2所示，该显示界面上显示有用于引导用户进入拍摄界面的提示信息“去拍照”，用户通过触控按键21，即可进入图3所示的用户图像拍摄界面。图3所示的用户图像拍摄界面上显示有拍摄控件31，同时显示有用于引导用户拍摄的提示信息“正对屏幕，尽量让面部填满人脸框”。

在一种实施方式中，获取用户图像之后，本公开实施例提供的方法还可以基于预设模型对用户图像上的用户表情进行调整，以使用户表情与用户配置的视频主题相匹配。其中，预设模型是预先训练的具有调整图像上的人物表情功能的模型。在一种实施方式中，预设模型的训练过程可以包括：获取样本用户图像以及表情调整后的目标样本图像，该目标样本图像与预设主题相匹配；将样本用户图像作为模型训练的输入，将目标样本图像作为模型训练的输出，训练得到预设模型。关于预设模型训练过程中采用的具体算法，本公开实施例不作具体限定，可以根据训练需求而定。

在本公开实施例中，通过利用预设模型对用户图像上的用户表情进行调整，可以优化用户表情的显示效果，确保最终生成的视频与用户配置的主题相匹配。同时，还可以降低对用户拍摄能力的要求，即使用户图像上的用户表情与主题不匹配，也无需更换用户图像，实现了对用户图像的智能化调整。

S103、将用户图像嵌入到多个视频模板中的至少部分视频模板的预留位置上，使得用户图像分别与至少部分视频模板上的情景素材结合生成至少一个视频。

将用户图像嵌入到多个视频模板的预留位置的过程中，可以按照预设策略将用户图像嵌入每个视频模板的预留位置上，也可以按照预设策略将用户图像嵌入到部分视频模板的预留位置上。其中，该预设策略可以包括但不限于：根据用户对视频模板的选择操作，将用户图像嵌入到用户选择的视频模板的预留位置上；或者，根据终端设备的当前性能信息，将用户图像嵌入到预设数量的视频模板的预留位置上，该预设数量根据终端设备的当前性能信息确定，终端设备的当前性能越高，则预设数量的取值可以越大。具体的，在得到用户图像之后，可以利用人脸识别技术，识别用户图像上的人脸区域，然后将人脸区域与视频模板的预留位置区域进行融合。

示例性一，针对在获取到与视频主题相匹配的多个视频模板之后获取用户图像的情况，可以在获取到与用户配置的视频主题相匹配的多个视频模板后，将多个视频模板进行显示。根据用户对视频模板的选择操作，确定至少一个目标模板。然后获取用户图像，将用户图像嵌入到至少一个目标模板的预留位置上，生成用户需求的视频。

示例性二，针对在获取用户图像之后获取与用户配置的视频主题相匹配的多个视频模板的情况，在获取用户图像之后，可以直接将用户图像分别嵌入到每个视频模板的预留位置上或者将用户图像分别嵌入到部分视频模板的预留位置上，生成至少一个视频，进而用户可以从中选择需求的视频。

生成的至少一个视频可以全部存储在设备本地，也可以根据用户的视频选择操作，将用户选择的视频存储在设备本地。

S104、获取至少一个视频中待发布的视频。

其中，本实施例中所称的待发布的视频可以理解为用户从上述生成的至少一个视频中选中的视频。也可以理解为基于用户从上述获取到的多个视频模板中选中的模板生成的视频。比如，在一种实施方式中，在获取到多个视频模板之后，还可以包括向用户展示该多个视频模板，使得用户从该些视频模板中选择至少一个视频模板作为目标模板的步骤。在此步骤的基础上，用户可以从已选择的目标模板中继续选择一个或多个模板，并将用户图像嵌入该些模板后生成的视频作为待发布的视频。或者，在用户从多个与视频主题匹配的视频模板中选中至少一个视频模板作为目标模板后，还可以先将获取到的用户图像嵌入该些目标模板中，生成至少一个视频，然后，再将生成的至少一个视频显示给用户，以使用户从该些视频中选择待发布的视频。例如，在一个示例中，可以通过预设的第一显示界面对基于目标模板成的视频进行显示，用户可以在第一显示界面上选择要发布的视频，同时，第一显示界面上还可以包括第一按键；该第一按键用于用户触发视频发布指令，第一按键在第一显示界面上的位置可以根据界面布局而定；当第一按键被触发时，用户选择的视频被发布到预设的视频播放平台上。比如，图4是本公开实施例提供的一种第一显示界面的显示示意图，如图4所示，第一显示界面可以采用列表形式展示生成的视频，并且支持用户的左右滑动，切换当前界面显示的视频；如果当前显示的视频即为焦点视频(即被选中的视频)，用户可以通过触控第一按键41，触发焦点视频的发布操作。也就是说，在本实施例中待发布的视频可以是用户从基于目标模板生成的视频中选中的视频，也可以是基于用户从目标模板中选中的模板生成的视频。

S105、将待发布的视频发布到预设的视频播放平台上。

本公开实施例提供的方案针对每个视频主题预先设置多个视频模板，在视频模板中预先设计好相应的情景素材并在视频模板中预留用户图像的嵌入位置(即将用户的人脸信息与视频模板进行融合)，这样在视频制作过程中只要将用户图像嵌入到多个视频模板中就能够一次生成至少一个视频，不需要用户重复拍摄，简化了用户操作。解决了现有方案中在为用户生成至少一个视频时需要用户重复拍摄图像的问题，提高了视频生成效率和用户体验。并且预先设计好情景素材不但能够帮助用户更好的表达主题内容，提高视频的质量和趣味性。还能够降低对用户拍摄能力的要求，帮助用户更好表达所要表达的主题，即使用户图像的拍摄质量欠佳，基于视频模板也可以为用户生成高质量的视频，提高了用户制作视频的积极性，解决了现有方案中用户图像的拍摄质量直接影响生成的视频质量的问题。另外对于视频消费者来说，视频质量的提高也能够提升观看体验。

在一种实施方式中，本公开实施例提供的方法还包括：

在第三显示界面上向用户展示预设的视频播放平台上的视频，其中，该视频也是通过上述图1实施例的方法生成得到的视频。

在本公开实施例中，第三显示界面上可以包括第一图标；当检测到用户对第三显示界面上的第一图标执行了预设的触控操作时，向用户提供用于与视频的发布者进行互动的交互界面；

基于在交互界面上检测到的针对预设选项的操作生成交互信息，并将交互信息发送给视频的发布者。

其中，交互界面上的预设选项至少可以包括如下一种：用于发消息的选项、打招呼的选项以及查看视频发布记录的选项。通过该些选项可以但不限于触发向视频发布者发消息、打招呼以及查看视频发布者的视频发布记录(例如用于表达用户历史心情的视频)等操作。交互界面可以采用叠加显示在第三显示界面上的形式实现；或者，交互界面也可以采用由第三显示界面切换进入的新界面实现；或者，交互界面还可以采用由第三显示界面切换进入新界面后，叠加显示在该新界面上的形式实现。其中，该新界面可以视频发布者的用户信息界面，进而第一图标可以是视频发布者的用户头像图标，当前用户触控第一图标后，除了可以触发交互界面的显示外，如果视频发布者不是用户的关注对象，还可以实现用户对视频发布者的关注。第一图标在第三显示界面的显示位置可以基于页面设计确定，第一图标的形状也可以灵活确定。

在交互界面上，支持用户的触控操作或者信息输入操作，从而根据用户的触控操作或者信息输入操作生成交互信息，例如交互界面上可以显示预先设置的交互语句，根据用户对交互语句的选择操作，将用户选择的语句作为需要发送至视频发布者的交互信息。交互信息可以在生成之后，即自动触发向视频发布者的发送操作，也可以在收到用户触发的发送指令再进行发送。示例性的，交互界面上可以显示确定按键和取消按键，确定按键用于用户触发发送指令，取消按键用于用户触发取消发送指令。本公开实施例中，通过由用于播放视频的第三显示界面切换至交互界面，实现了用户与视频发布者的灵活互动，丰富了用户之间的交互实现方式，使得交互方式更加灵活。

图5是本公开实施例提供的一种第三显示界面的显示示意图，即视频播放界面，第三显示界面上显示有第一图标51，用户触控第一图标51之后，终端设备可以显示交互界面。图6是本公开实施例提供的一种交互界面的显示示意图。具体的，该交互界面采用由第三显示界面切换进入视频发布者的用户信息界面后，叠加显示在该视频发布者的用户信息界面上的形式实现。如图6所示，交互界面上支持发消息、打招呼、查看对方的历史发布视频记录。需要说明的是，图6作为示例，交互界面上支持的每种交互功能分别以独立交互界面的形式实现，应当理解，交互界面上支持的多种交互功能还可以集成显示。此外，交互界面上还可以显示其他的信息，例如用户当前配置的视频主题等，具体如用户当前配置的心情，以及用户的账户名称等，具体可以根据界面设计进行调整，本公开实施例不作具体限定。

图7为本公开实施例提供的另一种视频生成方法的流程图，基于上述技术方案进一步优化与扩展，并可以与上述各个可选实施方式进行结合。并且，图7具体以视频主题是指用户设置的心情为例，对本公开实施例的技术方案进行示例性说明。

如图7所示，本公开实施例提供的视频生成方法包括：

S201、接收用户触发的心情配置指令。

示例性的，用户可以通过视频交互应用提供的用户信息界面上的心情配置按键来触发心情配置指令。心情配置指令可以用于指示终端设备显示心情配置界面。

S202、根据心情配置指令，输出心情配置界面。

其中，心情配置界面上包括用于分享心情的按键；在用户触发按键时，接收到用户的视频制作指令。

图8是本公开实施例提供的一种显示有心情配置按键的用户信息界面的显示示意图。如图8所示，在用户图标81的右下角处显示有心情配置按键82；用户触控心情配置按键82之后，终端设备显示心情配置界面。该心情配置界面可以包括一个界面，用户根据界面上显示的心情图标选择当前心情后，可以通过触控用于分享心情的按键，触发视频制作指令。该心情配置界面也可以包括心情选择子界面(显示有多个心情图标)和心情配置显示子界面，用于分享心情的按键可以显示在心情配置显示子界面上，此时，用户触控心情配置按键82之后，终端设备首先显示心情选择子界面，检测到用户完成心情选择操作后，切换显示心情配置显示子界面。心情配置界面可以采用叠加显示在用户信息界面上的形式实现，也可以采用由用户信息界面切换进入的新界面的形式实现。

图9是本公开实施例提供的一种心情配置界面的显示示意图，具体的心情配置界面叠加显示在用户信息界面上，并包括心情选择子界面和心情配置显示子界面，心情配置显示子界面上显示有用于分享心情的按键91。当用户在心情选择子界面选择当前心情后，例如用户选择当前心情：超级开心，终端设备可以根据用户对心情图标的选择操作，自动切换显示心情配置显示子界面，然后用户通过触控按键91，触发视频制作指令。图9中所显示的心情配置界面的界面布局、心情图标的样式和心情图标的显示数量，仅作为一种示例，在实际应用中可以根据需求进行灵活设计，本公开实施例不作具体限定。并且，在心情配置界面上，具体例如心情配置显示子界面上，还可以显示用户图标、心情配置成功的提示信息。

S203、获取用户在心情配置界面上配置的心情。

S204、接收到用户的视频制作指令。

其中，视频制作指令由用户触控心情配置界面上用于分享心情的按键后触发。

S205、根据视频制作指令，获取与用户配置的心情相匹配的多个视频模板，其中，视频模板中包括预设的情景素材和用户图像的预留位置。

S206、在第二显示界面上对多个视频模板进行显示，以使用户从多个视频模板中选择至少一个视频模板作为目标模板。

S207、获取用户图像。

其中，第二显示界面上包括第三按键，在用户触发第三按键时执行获取用户图像的步骤。在一种实施方式中，第二显示界面上还包括用于引导用户触发第三按键进入拍摄界面的提示信息。

作为一种示例，第二显示界面的显示示意图可以参考图2，终端设备根据用户在第二显示界面的选择操作，确定至少一个目标模板；然后根据用户对第二显示界面的第三按键(例如图2中所示的“去拍照”按键21)的触控操作，切换进入拍摄界面，获取用户基于拍摄界面拍摄得到的用户图像。

S208、将用户图像嵌入到目标模板的预留位置上，使得用户图像与目标模板上的情景素材结合生成至少一个视频。

在一种实施方式中，将用户图像嵌入到多个视频模板中的至少部分视频模板的预留位置上，包括：采用用户图像替换目标模板中的预设图像。其中，该预设图像是指在视频模板生成过程中，预先设置的包含样本用户的人脸区域的图像，例如卡通人物图像。利用人脸识别技术识别出用户图像上的人脸后，将用户图像上的人脸区域替换目标模板中预设图像上的人脸区域，从而生成至少一个视频。通过用户图像替换目标模板中预设图像，提高了利用用户图像一次性生成多个视频的便捷性。

生成至少一个视频后，终端设备可以根据用户对至少一个视频的选择操作，将用户选择的焦点视频发布到预设的视频播放平台上。

根据本公开实施例的技术方案，通过根据用户的心情配置指令，显示心情配置界面，并获取用户在心情配置界面上配置的心情，接收到用户的视频制作指令后，获取与用户配置的心情相匹配的多个视频模板，并对多个视频模板进行显示，然后根据用户对视频模板的选择操作，确定至少一个目标模板，最后将用户图像嵌入至少一个目标模板中，同时生成至少一个用于表征用户心情的视频，实现了在视频制作过程中只要将用户图像嵌入到至少一个目标模板中就能够一次生成至少一个视频的效果，生成不同的视频过程中完全不需要用户重复拍摄图像，简化了用户操作，提高了用户体验，并且视频模板中预先设计好的情景素材不但能够帮助用户更好的表达当前的心情，提高视频的质量和趣味性，还能够降低对用户拍摄能力的要求，即使用户图像的拍摄质量欠佳，基于视频模板也可以为用户生成高质量的视频，提高了用户制作视频的积极性，另外对于视频消费者来说，视频质量的提高也能够提升观看体验。

在上述技术方案的基础上，在一种实施方式中，接收到用户的视频制作指令之后，本公开实施例提供的方法还包括：

判断用户在预设时长内的心情分享次数是否超过预设阈值；

其中，若是，则输出用于指示不能执行本次心情分享的提示信息；

若否，则执行根据视频制作指令，获取用户图像以及与用户配置的主题相匹配的多个视频模板的操作。

其中，根据预设时长的取值，来设置预设阈值的取值，预设时长取值越大，相应的，预设阈值的取值可以越大。例如，预设时长取值为24小时，预设阈值可以取值为1，即表示用户每天只能进行一次心情分享。通过对用户在预设时长内的心情分享次数进行有效控制，可以缓解对视频播放平台的资源消耗，避免预设时长内视频播放平台接收的心情分享请求过多而导致平台功能瘫痪、视频播放平台对其他请求的响应能力降低，进而影响用户的视频分享体验的现象。

图10是本公开实施例提供的一种心情设置的流程图，用于对本公开实施例进行示例性说明，不应理解为对本公开实施例的具体限定。如图10所示，该心情设置过程可以包括：终端设备根据用户在心情配置界面上对心情图标的选择操作，确认用户选中的某个心情；终端设备检测用户当前是否有心情状态，如果否，则将用户选中的心情设置当前心情，如果是，则将用户当前选择的新心情覆盖当前心情；在接收到用户的视频制作指令之后，检测用户今日是否发布过心情视频，如果是，则出现提示，提示今日不能发布心情视频，如果否，则用户可以发布心情视频，即终端设备可以执行根据视频制作指令，获取与用户配置的心情相匹配的多个视频模板，并对获取到的多个视频模板进行显示，以使用户从多个视频模板中选择至少一个目标模板，其中，当目标模板中包括用户的历史图像(即过去插入到目标模板中的用户图像)时，若接收到用户的发布指令，则将用户从目标模板中选择的某个模板上的视频发布到预设的视频播放平台上，并结束本次视频制作。若接收到用户的拍摄指令，则执行获取用户图像的操作，通过采用获取到的用户图像替换目标模板中的历史图像来生成视频。当目标模板中不包括用户的历史图像时，则直接根据用户的拍摄指令拍摄用户图像，并将拍摄得到的用户图像嵌入目标模板的预留位置上生成视频。

本实施例通过将包含用户历史图像的视频模板展示给用户，当用户选择某个已包含历史图像的模板进行发布时，可以直接将历史图像和该模板结合后生成的视频发布到预设的视频播放平台上，提高了视频发布的效率。

图11是本公开实施例提供一种第二显示界面的显示示意图。如图11所示，具体以用户配置的“超级开心”的心情为例，当前显示的视频模板为用户选择的包括用户历史图像的一个目标模板，用户触控第二显示界面上的第二按键111，触发针对目标模板上的视频的发布操作。即如果用户在历史视频的制作过程中，使用当前目标模板制作了历史视频，则当用户再次选择当前目标模板时，可以直接将当前目标模板上的历史视频作为当前视频，以心情主题为例，用于表达用户历史心情的历史视频可以作为表达用户当前心情的视频(即当前心情与历史心情相同)，并发布至视频播放平台，从而提高用户视频的分享效率。

图12是本公开实施例提供的一种视频发布界面的显示示意图。用户触控第二显示界面上的第二按键，触发针对目标模板上的视频的发布操作后，终端设备可以切换进入视频发布界面，如图12所示，用户完成发布信息的编辑操作后，可以触控发布按键1202，将待发布的视频发布至视频播放平台。同时，视频发布界面上还可以包括草稿箱按键1201，用户触控该草稿箱按键1201后，可以将待发布的视频存储在草稿箱内。当下一次发布视频时，可以直接将草稿箱内存储的视频进行发布，或者基于草稿箱内的视频进行编辑操作，有助于提高视频分享效率。

图13为本公开实施例提供的另一种视频生成方法的流程图，用于对本公开实施例进行示例性说明，不应理解为对本公开实施例的具体限定。如图13所示，该视频生成方法可以包括：在确定用户可以进行视频发布，并获取与用户配置的心情相匹配的多个视频模板后，终端设备确定用户是否是新用户，该新用户是指在当前时间之前没有将人脸图像嵌入任何视频模板生成专属视频的用户；如果是，在用户点击视频模板的显示界面上的“去拍照”按键，进入人脸拍摄界面(即前述用户图像拍摄界面)，获取用户在人脸拍摄界面拍摄得到的用户人脸图像；然后将用户人脸图像与多个视频素材(即视频模板)进行融合处理，得到带有用户人脸的至少一个视频；最后，根据用户在生成的至少一个视频中的选择操作，确定待发布的视频，并进行发布；针对用户不是新用户的情况，即用户在当前时间之前已经生成过带有用户人脸图像的视频，则可以根据用户的发布指令直接将用户选择的某个已融合人脸图像的视频模板上的视频发布到预设的视频播放平台上。若之前已经生成过带有用户人脸图像的视频，但是用户仍旧触发了拍摄指令，那么仍旧会进入人脸拍摄界面，并将用户人脸图像与多个视频素材(即视频模板)进行融合处理，得到带有用户人脸的至少一个视频。

图14为本公开实施例提供的一种视频生成装置1400的结构示意图，该装置可以采用软件和/或硬件实现，并可集成在任意的终端设备上。

如图14所示，本公开实施例提供的视频生成装置1400可以包括第一接收模块1401、第一获取模块1402和视频生成模块1403，其中：

第一获取模块1401，用于获取用户配置的视频主题以及视频制作指令；

第二获取模块1402，用于根据视频制作指令，获取用户图像，以及与视频主题相匹配的多个视频模板，其中，视频模板中包括预设的情景素材和用户图像的预留位置；

视频生成模块1403，用于将用户图像嵌入到多个视频模板中的至少部分视频模板的预留位置上，使得用户图像分别与至少部分视频模板上的情景素材结合生成至少一个视频；

第三获取模块1404，用于获取至少一个视频中待发布的视频；

第一发布模块1405，用于将待发布的视频发布到预设的视频播放平台上。

在一种可能的实现方式中，待发布的视频包括用户从所述至少一个视频中选择的视频，或者基于用户从所述多个视频模板中选择的模板生成的视频。

在一种可能的实现方式中，视频主题包括用户在心情配置界面上配置的心情。

在一种可能的实现方式中，本公开实施例提供的视频生成装置1400还包括：

心情分享次数确定模块，用于判断用户在预设时长内的心情分享次数是否超过预设阈值；

提示信息输出模块，用于若是，则输出用于指示心情分享次数超限的提示信息；

第一获取模块1402具体用于，若否，则执行根据视频制作指令，获取用户图像以及与用户配置的视频主题相匹配的多个视频模板的操作。

在一种可能的实现方式中，第一获取模块1402具体用于：

在获取到与用户配置的视频主题相匹配的多个视频模板之后获取用户图像。

第二显示模块，用于向用户展示多个视频模板，以使用户从多个视频模板中选择至少一个视频模板作为目标模板。

第二发布模块，用于在目标模板的预留位置上包括用户的历史图像，且接收到用户的发布指令时，将用户从目标模板中选择的模板的视频发布到预设的视频播放平台上，并结束本次视频制作。

视频生成模块，用于在接收到用户的拍摄指令时，执行获取用户图像的操作，并在将用户图像嵌入到多个视频模板中的至少部分视频模板的预留位置上的操作中，将目标模板中的历史图像替换为所述用户图像。

表情调整模块，用于基于预设模型对用户图像上的用户表情进行调整，以使用户表情与用户配置的视频主题相匹配。

视频播放模块，用于在显示界面上播放视频播放平台上的视频，其中，该视频播放平台上的视频是指基于上述视频模板生成的视频；

交互界面显示模块，当在显示界面上检测到预设的触控操作时，提供用于与视频的发布者进行互动的交互界面；

交互信息发送模块，用于基于用户对交互界面上的选项的操作生成交互信息，并将交互信息发送给视频的发布者，交互界面上的选项至少包括如下一种：用于发消息的选项、用于打招呼的选项以及查看视频发布记录的选项。

本公开实施例所提供的视频生成装置可执行本公开实施例所提供的任意视频生成方法，具备执行方法相应的功能模块和有益效果。本公开装置实施例中未详尽描述的内容可以参考本公开任意方法实施例中的描述。

图15为本公开实施例提供的一种终端设备的结构示意图。如图15所示，终端设备1500包括一个或多个处理器1501和存储器1502。

处理器1501可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制终端设备1500中的其他组件以执行期望的功能。

存储器1502可以包括一个或多个计算机程序产品，计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器1501可以运行程序指令，以实现本公开实施例提供的任意视频生成方法，还可以实现其他期望的功能。在计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。

在一个示例中，终端设备1500还可以包括：输入装置1503和输出装置1504，这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

此外，该输入装置1503还可以包括例如键盘、鼠标等等。

该输出装置1504可以向外部输出各种信息，包括确定出的距离信息、方向信息等。该输出装置1504可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图15中仅示出了该终端设备1500中与本公开有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，终端设备1500还可以包括任何其他适当的组件。

除了上述方法和设备以外，本公开的实施例还可以是计算机程序产品，其包括计算机程序指令，计算机程序指令在被处理器运行时使得处理器执行本公开实施例所提供的任意视频生成方法。

计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码，程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户终端设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户终端设备上部分在远程终端设备上执行、或者完全在远程终端设备或服务器上执行。

此外，本公开的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，计算机程序指令在被处理器运行时使得处理器执行本公开实施例所提供的任意视频生成方法。

计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本公开的具体实施方式，使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下，在其它实施例中实现。因此，本公开将不会被限制于本文所述的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

一种视频生成方法，其特征在于，包括：

获取用户配置的视频主题以及视频制作指令；

根据所述视频制作指令，获取用户图像，以及与所述视频主题相匹配的多个视频模板，其中，所述视频模板中包括预设的情景素材和用户图像的预留位置；

将所述用户图像嵌入到所述多个视频模板中的至少部分视频模板的预留位置上，使得所述用户图像分别与所述至少部分视频模板上的情景素材结合生成至少一个视频；

获取所述至少一个视频中待发布的视频；

将所述待发布的视频发布到预设的视频播放平台上。
根据权利要求1所述的方法，其特征在于，所述待发布的视频包括所述用户从所述至少一个视频中选择的视频，或者基于所述用户从所述多个视频模板中选择的模板生成的视频。
根据权利要求1所述的方法，其特征在于，所述视频主题包括用户在心情配置界面上配置的心情。
根据权利要求3所述的方法，其特征在于，所述获取用户配置的视频主题以及视频制作指令之后，所述方法还包括：

判断所述用户在预设时长内的心情分享次数是否超过预设阈值；

其中，若是，则输出用于指示心情分享次数超限的提示信息；

若否，则执行所述根据所述视频制作指令，获取用户图像以及与所述视频主题相匹配的多个视频模板的步骤。
根据权利要求1所述的方法，其特征在于，所述根据所述视频制作指令，获取用户图像，以及与视频主题相匹配的多个视频模板，包括：

在获取到与所述主题相匹配的多个视频模板之后获取用户图像。
根据权利要求5所述的方法，其特征在于，在获取到与所述视频主题相匹配的多个视频模板之后，所述方法还包括：

向用户展示所述多个视频模板，以使用户从所述多个视频模板中选择至少一个视频模板作为目标模板；

在所述目标模板的预留位置上包括所述用户的历史图像时，若接收到所述用户的发布指令，则将所述用户从所述目标模板中选择的模板的视频发布到预设的视频播放平台上，并结束本次视频制作；

若接收到用户的拍摄指令，则执行所述获取用户图像的操作，并在所述将所述用户图像嵌入到所述多个视频模板中的至少部分视频模板的预留位置上的操作中，将所述目标模板中的所述历史图像替换为所述用户图像。
根据权利要求1-6中任一项所述的方法，其特征在于，所述获取用户图像之后，所述方法还包括：

基于预设模型对所述用户图像上的用户表情进行调整，以使所述用户表情与所述视频主题相匹配。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

在显示界面上播放所述视频播放平台上的视频，其中，所述视频播放平台上的视频是指基于所述视频模板生成的视频；

当在所述显示界面上检测到预设的触控操作时，提供用于与视频的发布者进行互动的交互界面；

基于在所述交互界面上检测到的针对预设选项的操作生成交互信息，并将所述交互信息发送给所述发布者，所述预设选项至少包括如下一种：用于发消息的选项、用于打招呼的选项以及查看视频发布记录的选项。
一种视频生成装置，其特征在于，包括：

第一获取模块，用于获取用户配置的视频主题以及视频制作指令；

第二获取模块，用于根据所述视频制作指令，获取用户图像，以及与所述视频主题相匹配的多个视频模板，其中，所述视频模板中包括预设的情景素材和用户图像的预留位置；

视频生成模块，用于将所述用户图像嵌入到所述多个视频模板中的至少部分视频模板的预留位置上，使得所述用户图像分别与所述至少部分视频模板上的情景素材结合生成至少一个视频；

第三获取模块，用于获取所述至少一个视频中待发布的视频；

第一发布模块，用于将所述待发布的视频发布到预设的视频播放平台上。
一种终端设备，其特征在于，包括存储器和处理器，其中，所述存储器中存储有计算机程序，当所述计算机程序被所述处理器执行时，所述处理器执行权利要求1-8中任一项所述的视频生成方法。
一种计算机可读存储介质，其特征在于，所述存储介质中存储有计算机程序，当所述计算机程序被处理器执行时，所述处理器执行权利要求1-8中任一项所述的视频生成方法。