CN116347009A

CN116347009A - 视频生成方法及电子设备

Info

Publication number: CN116347009A
Application number: CN202310209599.9A
Authority: CN
Inventors: 许集润
Original assignee: Honor Device Co Ltd
Current assignee: Honor Device Co Ltd
Priority date: 2023-02-24
Filing date: 2023-02-24
Publication date: 2023-06-27
Anticipated expiration: 2043-02-24
Also published as: CN116347009B

Abstract

本申请提供了一种视频生成方法及电子设备。该方法包括：响应于接收到视频生成请求，显示第一界面，第一界面上显示有多个图片和/或视频；接收用户在第一界面上选择目标图片和/或目标视频的操作；对目标图片和/或目标视频中的每个图片或视频帧，分别按照预设检测算法进行检测，得到检测结果；对目标图片和/或目标视频进行场景检测，根据场景检测结果确定目标图片和/或目标视频对应的目标主题；将检测结果符合第一条件的目标图片和/或目标视频帧，按照与目标主题相符合的目标视频模板，生成第一视频并显示。本实施例能够对图片和视频自动进行剪辑，快速生成剪辑视频，满足用户的剪辑需求。

Description

视频生成方法及电子设备

技术领域

本申请涉及终端设备领域，尤其涉及一种视频生成方法及电子设备。

背景技术

当前，拍照功能已经成为电子设备最重要的功能之一。利用电子设备的拍照功能，人们可以随时随地拍照，给人们的生活提供了便利。

对于记录生活中美好瞬间的照片与视频，人们通常希望分享给好友或者分享到社交平台。然而，利用电子设备的相机功能拍照得到的照片和视频，并不都是用户所需要的。并且，用户还需要对想要分享的照片和视频进行人工剪辑，这既浪费了用户的时间，又对用户的剪辑技能有一定的要求。

发明内容

为了解决上述技术问题，本申请提供一种视频生成方法及电子设备，能够对图片和视频自动进行剪辑，快速生成剪辑视频，满足用户的剪辑需求。

第一方面，本申请提供一种视频生成方法。该方法应用于电子设备，电子设备包括媒体中台、硬件抽象层HAL、位于HAL中的一键大片相关算法模块、芯算平台，媒体中台与HAL之间设置有第一私有化通路，一键大片相关算法模块中设置有与芯算平台连接的第一接口，该方法包括：媒体中台响应于接收到视频生成请求，显示第一界面，第一界面上显示有多个图片和/或视频；媒体中台接收用户在第一界面上选择目标图片和/或目标视频的操作，通过第一私有化通路将目标图片和/或目标视频发送给一键大片相关算法模块，一键大片相关算法模块通过第一接口将目标图片和/或目标视频发送给芯算平台；一键大片相关算法模块对目标图片和/或目标视频中的每个图片或视频帧，分别按照第一预设检测算法进行检测，得到第一检测结果；芯算平台对目标图片和/或目标视频中的每个图片或视频帧，分别按照第二预设检测算法进行检测，得到第二检测结果；芯算平台通过第一接口将第二检测结果发送给一键大片相关算法模块，一键大片相关算法模块通过第一私有化通路将第一检测结果和第二检测结果发送给媒体中台；一键大片相关算法模块对目标图片和/或目标视频进行场景检测，根据场景检测结果确定目标图片和/或目标视频对应的目标主题，通过第一私有化通路将目标主题发送给媒体中台；媒体中台将检测结果符合第一条件的目标图片和/或目标视频帧，按照与目标主题相符合的目标视频模板，生成第一视频并显示，检测结果包括第一检测结果和第二检测结果。这样，能够对图片和视频自动进行剪辑，快速生成剪辑视频，满足用户的剪辑需求。

根据第一方面，将检测结果符合第一条件的目标图片和/或目标视频帧，按照与目标主题相符合的目标视频模板，生成第一视频并显示之前，还包括：媒体中台从预设的视频模板库中，查找与目标主题匹配的第一视频模板，将第一视频模板作为与目标主题相符合的目标视频模板，视频模板库中存储有视频模板与主题的对应关系。这样，可以根据目标主题自动选择相应画面风格的视频模板。

根据第一方面，将检测结果符合第一条件的目标图片和/或目标视频帧，按照与目标主题相符合的目标视频模板，生成第一视频并显示之前，还包括：媒体中台接收用户在预设的视频模板库中选择第二视频模板的操作，将第二视频模板作为与目标主题相符合的目标视频模板。这样，用户可以根据自身需求选择喜欢的画面风格的视频模板，满足用户的个性化需求。

根据第一方面，将检测结果符合第一条件的目标图片和/或目标视频帧，按照与目标主题相符合的目标视频模板，生成第一视频并显示之前，还包括：一键大片相关算法模块根据图片或视频帧的检测结果确定图片或视频帧的第一评价分值；一键大片相关算法模块根据第一评价分值确定检测结果是否符合第一条件，第一条件为检测结果对应的图片或视频帧为第一评价分值最高的设定数量个图片和/或视频帧。。

根据第一方面，图片或视频帧的第一评价分值等于第一预设检测算法和第一预设检测算法中各检测算法对应的第二评价分值的加权和。

根据第一方面，第一预设检测算法和第一预设检测算法包括质量检测算法和图像感知算法。

根据第一方面，质量检测算法包括如下检测算法中的任意一个或多个：抖动检测算法；色彩检测算法；亮度检测算法；清晰度检测算法。

根据第一方面，质量检测算法包括如下检测算法中的任意一个或多个：美学评分算法；动作检测算法；人脸检测算法；笑脸检测算法；儿童检测算法；场景检测算法；分镜检测算法。

根据第一方面，根据场景检测结果确定目标图片和/或目标视频对应的目标主题，包括：一键大片相关算法模块基于场景检测结果进行主题推理，得到目标图片和/或目标视频对应的目标主题。

根据第一方面，响应于接收到视频生成请求，显示第一界面，第一界面上显示有多个图片和/或视频，包括：接收用户对图库中第一功能选项的选择操作，生成视频生成请求；显示第一界面，第一界面为图库中显示图片和/或视频列表的界面。

第二方面，本申请提供一种电子设备，包括：存储器和处理器，存储器与处理器耦合；存储器存储有程序指令，当程序指令由处理器执行时，使得电子设备执行第一方面任意一项的视频生成方法。

第三方面，本申请提供一种计算机可读存储介质，包括计算机程序，当计算机程序在电子设备上运行时，使得电子设备执行前述的第一方面任意一项的视频生成方法。

附图说明

图1为示例性示出的电子设备100的结构示意图；

图2为示例性示出的本申请实施例的电子设备100的软件结构框图；

图3为示例性示出的本实施例中视频生成方法的时序示意图；

图4为示例性示出的本实施例中视频生成过程对图片和视频帧的处理过程示意图；

图5为示例性示出的本实施例中视频生成方法的流程示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。

本申请实施例的说明书和权利要求书中的术语“第一”和“第二”等是用于区别不同的对象，而不是用于描述对象的特定顺序。例如，第一目标对象和第二目标对象等是用于区别不同的目标对象，而不是用于描述目标对象的特定顺序。

在本申请实施例中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

在本申请实施例的描述中，除非另有说明，“多个”的含义是指两个或两个以上。例如，多个处理单元是指两个或两个以上的处理单元；多个系统是指两个或两个以上的系统。

本申请实施例中的视频生成方法可以应用于手机、平板等电子设备。该电子设备的结构可以如图1所示。

图1为示例性示出的电子设备100的结构示意图。应该理解的是，图1所示电子设备100仅是电子设备的一个范例，并且电子设备100可以具有比图中所示的更多的或者更少的部件，可以组合两个或多个的部件，或者可以具有不同的部件配置。图1中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。

请参见图1，电子设备100可以包括：处理器110，内部存储器121，通用串行总线(universal serial bus，USB)接口130，充电管理模块140，电源管理模块141，电池142，天线1，天线2，移动通信模块150，无线通信模块160，音频模块170，扬声器170A，受话器170B，麦克风170C，耳机接口170D，传感器模块180，指示器192，摄像头193等。

处理器110可以包括一个或多个处理单元，例如：处理器110可以包括应用处理器(application processor，AP)，调制解调处理器，图形处理器(graphics processingunit，GPU)，图像信号处理器(image signal processor，ISP)，控制器，存储器，视频编解码器，数字信号处理器(digital signal processor，DSP)，基带处理器，和/或神经网络处理器(neural-network processing unit，NPU)等。其中，不同的处理单元可以是独立的器件，也可以集成在一个或多个处理器中。

其中，控制器可以是电子设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号，产生操作控制信号，完成取指令和执行指令的控制。

处理器110中还可以设置存储器，用于存储指令和数据。在一些实施例中，处理器110中的存储器为高速缓冲存储器。

电子设备100通过GPU，显示屏194，以及应用处理器等实现显示功能。GPU为图像处理的微处理器，连接显示屏194和应用处理器。GPU用于执行数学和几何计算，用于图形渲染。处理器110可包括一个或多个GPU，其执行程序指令以生成或改变显示信息。

显示屏194用于显示图像，视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display，LCD)，有机发光二极管(organic light-emittingdiode，OLED)等。在一些实施例中，电子设备100可以包括1个或N个显示屏194，N为大于1的正整数。

电子设备100可以通过ISP，摄像头193，视频编解码器，GPU，显示屏194以及应用处理器等实现拍摄功能。

ISP用于处理摄像头193反馈的数据。例如，拍照时，打开快门，光线通过镜头被传递到摄像头感光元件上，光信号转换为电信号，摄像头感光元件将所述电信号传递给ISP处理，转化为肉眼可见的图像。ISP还可以对图像的噪点，亮度，肤色进行算法优化。ISP还可以对拍摄场景的曝光，色温等参数优化。在一些实施例中，ISP可以设置在摄像头193中。

摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device，CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor，CMOS)光电晶体管。感光元件把光信号转换成电信号，之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB，YUV等格式的图像信号。在一些实施例中，电子设备100可以包括1个或N个摄像头193，N为大于1的正整数。

数字信号处理器用于处理数字信号，除了可以处理数字图像信号，还可以处理其他数字信号。例如，当电子设备100在频点选择时，数字信号处理器用于对频点能量进行傅里叶变换等。

视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样，电子设备100可以播放或录制多种编码格式的视频，例如：动态图像专家组(moving picture experts group，MPEG)1，MPEG2，MPEG3，MPEG4等。

其中，电子设备100的软件系统可以采用分层架构、事件驱动架构、微核架构、微服务架构，或云架构。本申请实施例以分层架构的安卓(Android)系统为例，示例性说明电子设备100的软件结构。

图2为示例性示出的本申请实施例的电子设备100的软件结构框图。

电子设备100的分层架构将软件分成若干个层，每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中，Android系统可以包括应用程序层、应用程序框架层、系统库以及内核层等。

应用程序层可以包括一系列应用程序包。

如图2所示，应用程序包可以包括相机，日历，短信息、图库，通话，视频等应用程序。

其中，图库应用中包括视频编辑APP，视频编辑APP中包括媒体中台模块。视频编辑APP、媒体中台模块、以及后续的硬件抽象层中的一键大片相关算法模块和芯算平台模块，用于实施本实施例的视频生成方法，这些模块的详细功能请参见本文后续实施例中的说明。

如图2所示，应用程序框架层可以包括窗口管理器，内容提供器，资源管理器，电话管理器，视图系统等。

窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小，判断是否有状态栏，锁定屏幕，截取屏幕等。

内容提供器用来存放和获取数据，并使这些数据可以被应用程序访问。所述数据可以包括视频，图像，音频，拨打和接听的电话，浏览历史和书签，电话簿等。

视图系统包括可视控件，例如显示文字的控件，显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如，包括短信通知图标的显示界面，可以包括显示文字的视图以及显示图片的视图。

电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通，挂断等)。

资源管理器为应用程序提供各种资源，比如本地化字符串，图标，图片，布局文件，视频文件等等。

安卓运行时(Android Runtime)包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。

核心库包含两部分：一部分是java语言需要调用的功能函数，另一部分是安卓的核心库。

应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理，堆栈管理，线程管理，安全和异常的管理，以及垃圾回收等功能。

如图2所示，硬件抽象层可以包括一键大片相关算法模块和芯算平台模块。

内核层是硬件和软件之间的层。

如图2所示，内核层可以包括音频驱动、显示驱动、蓝牙驱动、摄像头驱动、传感器驱动等模块。

可以理解的是，图2示出的软件结构中的层以及各层中包含的部件，并不构成对电子设备100的具体限定。在本申请另一些实施例中，电子设备100可以包括比图示更多或更少的层，以及每个层中可以包括更多或更少的部件，本申请不做限定。

下面以电子设备是手机为例，结合图3、图4和图5对本申请实施例进行详细说明。可以理解的是，以下示例同样适用于其他类型电子设备(例如平板)的场景。

图3为示例性示出的本实施例中视频生成方法的时序示意图。图4为示例性示出的本实施例中视频生成过程对图片和视频帧的处理过程示意图。图5为示例性示出的本实施例中视频生成方法的流程示意图。

请参见图3，本实施例中：

媒体中台运行在视频编辑APP中；

HAL与媒体中台之间设置有一条私有化通路(本文中将该通路称为CameraResource)，利用私有化接口，实现脱离camera系统架构的芯算平台的对上能力接口(init、process、deinit、registerListener、unregisterListener)。

HAL集成算法通路，新增算法接口(init、process、deinit)，其中，接口process可以包括setOpt、imgAnalyse、Framepush、Reset、getTheme、Stop、getPerformance、calFramesSameShotProb等，这些接口用于与芯算平台进行通信。这些新增算法接口可以设置在一键大片相关算法中。这样，本实施例就可以利用芯算平台执行算法，大幅提高处理速度，因为芯算平台的处理速度远快于HAL中软件的处理速度。

其中，各接口的作用可以如下：

setOpt用于设置视频分析参数；

imgAnalyse用于图像/单帧分析评分，输出人脸的位置及个数和是否有笑脸，场景类别等；

Framepush用于将图片及视频中的帧信息送到算法进行处理；

Reset用于视频评分算法重置，清空算法历史状态，用户未退出一键成片功能重新使用功能时调用；

getTheme用于所有用户上传的视频或者图像运行算法处理之后，上报本次主题；

Stop用于强制停止当前计算，同时返回当前的计算结果；

Getperformance用于获取单帧/多帧分析接口的处理速度；

calFramesSameShotProb用于计算是否是同一张图片，分析图片的置信度。

请参见图4，本实施例的整体视频生成流程可以包括：

第一步，用户输入多个视频和图片。如果是视频，则还需要进行抽帧。

第二步，对帧(即抽取的视频帧)或图片进行基础质量检测(例如抖动检测、色彩检测、亮度检测和清晰度检测)和图像感知算法分析(例如美学评分、动作检测、人脸检测、笑脸检测、儿童检测、场景检测和分镜检测(图4中未示出，图4中的图像感知中可以进一步包括分镜检测))。

第三步，根据基础质量检测结果和图像感知算法结果对处理的每一帧进行打分。

第四步，根据约束条件进行高光片段选择，最终输出高光片段

第五步，图片相对于视频，不进行抖动检测、动作检测、分镜检测。

第六步，根据视频帧和图片的场景检测结果，进行主题推理得到所有输入的主题。

然后，就可以根据主题选择对应的视频模板，生成视频了。图4中，主题推理之后的“主题”处理中可以根据主题选择对应的视频模板。

例如，在一个示例中，媒体中台中可以预设视频模板库，视频模板库中存储有视频模板与主题的对应关系。媒体中台可以从预设的视频模板库中，查找与推理出的主题匹配的视频模板，将该第一视频模板作为与推理出的主题相符合的目标视频模板。

例如，在另一个示例中，用户可以选择在预设的视频模板库中选择视频模板。媒体中台接收用户在预设的视频模板库中选择视频模板的操作，将用户选择的视频模板作为与所推理出的主题相符合的目标视频模板。并且，在根据前一个示例自动选出目标视频模板后，用户也可以手动更换视频模板。

不同视频模板具有不同的画面风格，通过根据主题选择视频模板，可以实现画面风格调整(例如转场、滤镜等)。画面风格例如可以包括特效、音乐等。

下面通过一个示例对本实施例的视频生成方法作进一步详细说明。需要说明的是，在以下对图5的描述中，HAL与媒体中台之间通过上述私有化通路进行通信，例如传递消息，一键大片相关算法模块与芯算平台之间通过上述新增算法接口进行通信，例如传递消息。芯算平台为电子设备中的硬件芯片。

本实施例中，由一键大片相关算法模块执行数据量较小的算法，由芯算平台执行数据量较大的算法，这样，可以利用芯算平台的强大算力，提高视频生成方法流程的整体速度。当然，图5中的算法在一键大片相关算法模块和芯算平台中的分配为示例性说明，并不用于对本实施例进行限制，在其他实施例中，可以采用其他的分配方式，例如，将所有算法都由芯算平台执行。

请参见图5，本实施例中，视频生成方法的流程可以包括如下步骤：

S501、用户在图库应用中选择一键大片功能。

电子设备检测到用户在图库应用中选择一键大片功能的操作，媒体中台即认为接收到视频生成请求。

接收到视频生成请求后，用于执行视频生成方法的各个模块进行初始化，以申请资源。

并且，在接收到视频生成请求后，电子设备会从显示一键大片功能选项的界面跳转到照片界面，照片界面上显示图片、视频等。其中，照片界面的可以在步骤S504完成之后显示。

S502、媒体中台进行初始化。

通过本步骤的初始化，可以为媒体中台申请到内存资源。

S503、H AL进行初始化。

通过本步骤的初始化，可以为HAL申请到内存资源。。

S504、一键大片相关算法模块进行初始化。

通过本步骤的初始化，可以为一键大片相关算法模块申请到内存资源。。

S505、用户在图库的图片和视频中选择图片a和视频b。

媒体中台接收到对图片a和视频b的选择操作，确认以图片a和视频b为基础生成VLOG。

本步骤对应图3中的时序①。

需要说明的是，图3中的时序①至⑤对应一个图片或一个视频帧的处理过程，本实施例中以图片a的处理过程为例对图3中的时序①至⑤进行说明。视频帧的处理过程时序与图片的处理过程时序相同，本实施例不再赘述。

S506、媒体中台对图片a进行解码，将解码后的图片a发送给HAL。

本步骤之后的步骤中所述的图片a指解码后的图片a。

S507、HAL将图片a发送给一键大片相关算法模块。

S5081、一键大片相关算法模块对图片a分别进行亮度检测、色彩检测和美学分析，得到第一检测结果。

步骤S506至S5081对应图3中的时序②。

请参见图4，对图片和视频帧的检测可以包括质量检测和图像感知。

其中，质量检测可以包括如下检测中的任意一个或多个：

抖动检测、色彩检测、亮度检测、清晰度检测，每种检测都是按照相应的检测算法进行的，例如，抖动检测是按照抖动检测算法进行检测的，色彩检测是按照色彩检测算法进行检测的，亮度检测是按照亮度检测算法进行检测的，清晰度检测是按照清晰度检测算法进行检测的。

其中，图像感知可以包括如下中的任意一个或多个：

美学评分、动作检测、人脸检测、笑脸检测、儿童检测、场景检测、分镜检测，相应的算法分别为美学评分算法、动作检测算法、人脸检测算法、笑脸检测算法、儿童检测算法、场景检测算法、分镜检测算法。

需要说明的是，尽管图4列出了多种质量检测算法和图像感知算法，但是，图片或视频帧不需要经过图4中所列的所有质量检测和图像感知。

例如，本实施例中，在进行质量检测时，对图片的质量检测不包括抖动检测。在进行图像感知时，对图片的图像感知不包括动作检测。

本实施例中，在进行质量检测时，对从视频中抽取的视频帧的图像感知不包括分镜检测。

S5082、一键大片相关算法模块向芯算平台发送对图片a进行清晰度检测、人脸检测、笑脸检测、儿童检测、场景检测的计算请求。该请求中可以包括图片a。

步骤S5082对应图3中的时序③。

S5083、芯算平台向一键大片相关算法模块返回图片a的包括清晰度检测、人脸检测、笑脸检测、儿童检测、场景检测的第二检测结果。

步骤S5083对应图3中的时序④。

S509、一键大片相关算法模块向HAL返回图片a的所有检测结果。

步骤S509至S510对应图3中的时序⑤。

本步骤中，一键大片相关算法模块向HAL返回的检测结果包括图片a的亮度检测、色彩检测、美学分析、清晰度检测、人脸检测、笑脸检测、儿童检测、场景检测的检测结果，即前述的第一检测结果和第二检测结果的合集。

S510、HAL向媒体中台返回图片a的所有检测结果。

S511、媒体中台对视频b进行解码，将解码后的视频b发送给HAL。

S512、HAL从视频b中抽取视频帧，并将抽取的视频帧发送给一键大片相关算法模块。

对于抽取的多个视频帧中的每个视频帧，可以分别执行步骤5131-51331的处理。

S5131、一键大片相关算法模块对视频帧分别进行亮度检测、色彩检测、美学分析和抖动检测，得到第三检测结果。

S5132、一键大片相关算法模块向芯算平台发送对视频帧进行清晰度检测、人脸检测、笑脸检测、儿童检测、场景检测、动作检测的计算请求。

S5133、芯算平台向一键大片相关算法模块返回视频帧的包括清晰度检测、人脸检测、笑脸检测、儿童检测、场景检测、动作检测的第四检测结果。

S514、一键大片相关算法模块向HAL返回视频帧的所有检测结果。

本步骤中，一键大片相关算法模块向HAL返回的检测结果包括视频帧的亮度检测、色彩检测、美学分析、抖动检测、清晰度检测、人脸检测、笑脸检测、儿童检测、场景检测、动作检测的检测结果，即前述的第三检测结果和第四检测结果的合集。

S515、HAL向媒体中台返回视频帧的所有检测结果。

S516、一键大片相关算法模块对本次处理过的所有图片和视频帧分别进行打分，根据图片和视频帧的分值确定高光片段。

本步骤对应图4中的的“帧打分”处理和“高光片段选择”处理。需要说明的是，图4中的“帧打分”不只是指对视频帧进行打分，也可以是对图片进行打分。

其中，打分的标准可以是预先设置好的。例如，对于每一项检测的检测结果进行打分，再将所有检测的检测结果的分值之和或者平均值作为最终打分。

其中，高光片段指分值高的图片或视频帧。例如，可以取分值最高的设定数量个图片和/或视频帧为高光片段。例如，设定数量可以为1或大于1。

S517、一键大片相关算法模块向HAL返回高光片段。

S518、HAL向媒体中台返回高光片段。

S519、媒体中台向HAL发送获取主题的请求。

S520、HAL向一键大片相关算法模块转发获取主题的请求。

S521、一键大片相关算法模块根据已获得的各图片和视频帧的场景检测结果投票。

这里，投票的意思为：根据场景检测结果确定图片a和视频b的主题。

S522、一键大片相关算法模块向HAL返回主题。

S523、HAL向媒体中台返回主题。

上述步骤S519至S523对应图4中的“主题推理”处理。

这样，媒体中台在获取了高光片段和主题后，将可以按照与主题相符合的目标视频模板，生成视频日志VLOG，并可以将该VLOG显示在电子设备屏幕上。

其中，目标视频模板可以按照如下方式获取：一是自动推荐，二是用户主动选择。

本实施例中，可以预先设置视频模板，存储在视频模板库中，视频模板库中存储有视频模板与主题的对应关系。

这样，当获取到主题后，就可以从预设的视频模板库中，查找与主题匹配的第一视频模板，作为与获取的主题相符合的目标视频模板。可见，本实施例，能够根据画面的场景主题(人物、风景、美食、儿童、宠物、运动、旅行)自动推荐符合内容的视频模板。

本实施例中，进入一键大片后的内部界面上可以显示视频模板的功能选项，用户也可以通过该该功能选项从视频模板库中主动选择喜欢的视频模板，并将选择的模板作为与获取的主题相符合的目标视频模板。

S524、媒体中台将高光片段，按照与主题相符合的目标视频模板，生成VLOG并显示。

S525、媒体中台向HAL发送重置参数的请求。

其中，重置参数用于清空前述步骤中的参数，为下一次执行视频生成方法做准备。

S526、HAL向一键大片相关算法模块转发重置参数的请求。

S5271、一键大片相关算法模块重置自身的全局变量。

S5272、一键大片相关算法模块重置芯算平台的全局变量。

S528、用户执行退出一键大片的操作，媒体中台接收到退出一键大片的指令。

S529、媒体中台将退出一键大片的指令发送给HAL。

S530、HAL接收到退出一键大片的指令，向一键大片相关算法模块发送销毁指令。

销毁指令用于销毁什么数据？

S5311、一键大片相关算法模块销毁相关数据。

这里，销毁的相关数据例如可以为前述步骤中的图片、视频等信息，为下一次执行视频生成方法做准备。

S5312、一键大片相关算法模块销毁芯算平台的中相关数据。

本实施例的视频生成方法，可以应用于用户的各种剪辑需求。例如如下的场景：

场景1：录制了一个段大于1分钟的视频后，用户希望裁剪出视频中精彩时刻并增加特效和音乐，生成一段短视频。

场景2：用户选择多段图片和视频，生成一段配有音乐，标题和特效的短视频。

本实施例的视频生成方法，能够对图片和视频自动进行剪辑，满足用户的剪辑需求。并且，本实施例，还可以利用芯算平台的算力，大幅度提高处理速度，实现快速生成剪辑视频，给用户更好的使用体验。

本申请实施例还提供一种电子设备，该电子设备包括存储器和处理器，存储器与处理器耦合，存储器存储有程序指令，当程序指令由所述处理器执行时，使得电子设备前述电子设备所执行的视频生成方法。

可以理解的是，电子设备为了实现上述功能，其包含了执行各个功能相应的硬件和/或软件模块。结合本文中所公开的实施例描述的各示例的算法步骤，本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以结合实施例对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本实施例还提供一种计算机存储介质，该计算机存储介质中存储有计算机指令，当该计算机指令在电子设备上运行时，使得电子设备执行上述相关方法步骤实现上述实施例中的视频生成方法。

本实施例还提供了一种计算机程序产品，当该计算机程序产品在计算机上运行时，使得计算机执行上述相关步骤，以实现上述实施例中的视频生成方法。

另外，本申请实施例还提供一种装置，这个装置具体可以是芯片，组件或模块，该装置可包括相连的处理器和存储器；其中，存储器用于存储计算机执行指令，当装置运行时，处理器可执行存储器存储的计算机执行指令，以使芯片执行上述各方法实施例中的视频生成方法。

其中，本实施例提供的电子设备、计算机存储介质、计算机程序产品或芯片均用于执行上文所提供的对应的方法，因此，其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果，此处不再赘述。

通过以上实施方式的描述，所属领域的技术人员可以了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个装置，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是一个物理单元或多个物理单元，即可以位于一个地方，或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

本申请各个实施例的任意内容，以及同一实施例的任意内容，均可以自由组合。对上述内容的任意组合均在本申请的范围之内。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

结合本申请实施例公开内容所描述的方法或者算法的步骤可以硬件的方式来实现，也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成，软件模块可以被存放于随机存取存储器(Random Access Memory，RAM)、闪存、只读存储器(Read Only Memory，ROM)、可擦除可编程只读存储器(Erasable Programmable ROM，EPROM)、电可擦可编程只读存储器(Electrically EPROM，EEPROM)、寄存器、硬盘、移动硬盘、只读光盘(CD-ROM)或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本申请实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质，其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。

Claims

1.一种视频生成方法，其特征在于，应用于电子设备，所述电子设备包括媒体中台、硬件抽象层HAL、位于所述HAL中的一键大片相关算法模块、芯算平台，所述媒体中台与所述HAL之间设置有第一私有化通路，所述一键大片相关算法模块中设置有与所述芯算平台连接的第一接口，所述方法包括：

所述媒体中台响应于接收到视频生成请求，显示第一界面，所述第一界面上显示有多个图片和/或视频；所述媒体中台接收用户在所述第一界面上选择目标图片和/或目标视频的操作，通过所述第一私有化通路将所述目标图片和/或所述目标视频发送给所述一键大片相关算法模块，所述一键大片相关算法模块通过所述第一接口将所述目标图片和/或所述目标视频发送给所述芯算平台；

所述一键大片相关算法模块对所述目标图片和/或所述目标视频中的每个图片或视频帧，分别按照第一预设检测算法进行检测，得到第一检测结果；所述芯算平台对所述目标图片和/或所述目标视频中的每个图片或视频帧，分别按照第二预设检测算法进行检测，得到第二检测结果；

所述芯算平台通过所述第一接口将所述第二检测结果发送给所述一键大片相关算法模块，所述一键大片相关算法模块通过所述第一私有化通路将所述第一检测结果和所述第二检测结果发送给所述媒体中台；

所述一键大片相关算法模块对所述目标图片和/或所述目标视频进行场景检测，根据场景检测结果确定所述目标图片和/或所述目标视频对应的目标主题，通过所述第一私有化通路将所述目标主题发送给所述媒体中台；

所述媒体中台将检测结果符合第一条件的目标图片和/或目标视频帧，按照与所述目标主题相符合的目标视频模板，生成第一视频并显示，所述检测结果包括所述第一检测结果和所述第二检测结果。

2.根据权利要求1所述的方法，其特征在于，将检测结果符合第一条件的目标图片和/或目标视频帧，按照与所述目标主题相符合的目标视频模板，生成第一视频并显示之前，还包括：

所述媒体中台从预设的视频模板库中，查找与所述目标主题匹配的第一视频模板，将所述第一视频模板作为与所述目标主题相符合的目标视频模板，所述视频模板库中存储有视频模板与主题的对应关系。

3.根据权利要求1所述的方法，其特征在于，将检测结果符合第一条件的目标图片和/或目标视频帧，按照与所述目标主题相符合的目标视频模板，生成第一视频并显示之前，还包括：

所述媒体中台接收用户在预设的视频模板库中选择第二视频模板的操作，将所述第二视频模板作为与所述目标主题相符合的目标视频模板。

4.根据权利要求1所述的方法，其特征在于，将检测结果符合第一条件的目标图片和/或目标视频帧，按照与所述目标主题相符合的目标视频模板，生成第一视频并显示之前，还包括：

所述一键大片相关算法模块根据图片或视频帧的检测结果确定图片或视频帧的第一评价分值；

所述一键大片相关算法模块根据所述第一评价分值确定检测结果是否符合第一条件，所述第一条件为检测结果对应的图片或视频帧为第一评价分值最高的设定数量个图片和/或视频帧。

5.根据权利要求4所述的方法，其特征在于，图片或视频帧的第一评价分值等于所述第一预设检测算法和所述第一预设检测算法中各检测算法对应的第二评价分值的加权和。

6.根据权利要求1所述的方法，其特征在于，所述第一预设检测算法和所述第一预设检测算法包括质量检测算法和图像感知算法。

7.根据权利要求6所述的方法，其特征在于，所述质量检测算法包括如下检测算法中的任意一个或多个：

抖动检测算法；

色彩检测算法；

亮度检测算法；

清晰度检测算法。

8.根据权利要求6所述的方法，其特征在于，所述质量检测算法包括如下检测算法中的任意一个或多个：

美学评分算法；

动作检测算法；

人脸检测算法；

笑脸检测算法；

儿童检测算法；

场景检测算法；

分镜检测算法。

9.根据权利要求1所述的方法，其特征在于，根据场景检测结果确定所述目标图片和/或所述目标视频对应的目标主题，包括：

所述一键大片相关算法模块基于场景检测结果进行主题推理，得到所述目标图片和/或所述目标视频对应的目标主题。

10.根据权利要求1所述的方法，其特征在于，响应于接收到视频生成请求，显示第一界面，所述第一界面上显示有多个图片和/或视频，包括：

接收用户对图库中第一功能选项的选择操作，生成视频生成请求；

显示第一界面，所述第一界面为所述图库中显示图片和/或视频列表的界面。

11.一种电子设备，其特征在于，包括：

存储器和处理器，所述存储器与所述处理器耦合；

所述存储器存储有程序指令，当所述程序指令由所述处理器执行时，使得所述电子设备执行如权利要求1至10任一项所述的视频生成方法。

12.一种计算机可读存储介质，包括计算机程序，其特征在于，当所述计算机程序在电子设备上运行时，使得所述电子设备执行如权利要求1至10任一项所述的视频生成方法。