CN116137672A - 视频生成方法、装置、设备、存储介质及程序产品 - Google Patents
视频生成方法、装置、设备、存储介质及程序产品 Download PDFInfo
- Publication number
- CN116137672A CN116137672A CN202111371809.1A CN202111371809A CN116137672A CN 116137672 A CN116137672 A CN 116137672A CN 202111371809 A CN202111371809 A CN 202111371809A CN 116137672 A CN116137672 A CN 116137672A
- Authority
- CN
- China
- Prior art keywords
- video
- score
- effect
- determining
- impact force
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 230000000694 effects Effects 0.000 claims abstract description 470
- 238000009877 rendering Methods 0.000 claims abstract description 120
- 230000007704 transition Effects 0.000 claims abstract description 30
- 230000008451 emotion Effects 0.000 claims description 32
- 238000000605 extraction Methods 0.000 claims description 26
- 238000012216 screening Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000000007 visual effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000036651 mood Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44016—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请实施例提供一种视频生成方法、装置、设备、存储介质及程序产品,该方法包括:获取至少两段视频;确定至少两段视频对应的特征信息;根据特征信息和预先存储的多个渲染效果,确定待添加效果组合;渲染效果为动画、特效或转场;根据至少两段视频和待添加效果组合,生成目标视频。本申请实施例提供一种视频生成方法、装置、设备、存储介质及程序产品用于提高目标视频的丰富性。
Description
技术领域
本申请涉及视频生成技术领域,尤其涉及一种视频生成方法、装置、设备、存储介质及程序产品。
背景技术
目前,电子设备可以将多段视频合成一个视频。
在相关技术中,电子设备中可以按照视频剪辑应用程序,用户可以通过视频剪辑应用程序从至少一个原始视频中剪辑得到多段视频,并通过视频剪辑应用程序将多段视频合成一个视频。
在上述相关技术中,通过视频剪辑应用程序将多段视频合成一个视频,使得合成的视频的丰富性较差。
发明内容
本申请实施例提供一种视频生成方法、装置、设备、存储介质及程序产品,用以解决将多段视频合成一段视频之后,合成视频的丰富性较差问题。
第一方面,本申请实施例提供一种视频生成方法,包括:
获取至少两段视频;
确定至少两段视频对应的特征信息;
根据特征信息和预先存储的多个渲染效果,确定待添加效果组合;渲染效果为动画、特效或转场;
根据至少两段视频和待添加效果组合,生成目标视频。
可选地,至少两段视频对应的特征信息包括以下至少一种:
每段视频对应的视频局部特征,视频局部特征包括视频冲击力、视频运动快慢、视频入方向或视频出方向中的至少一种;
至少两段视频对应的视频类型;
从至少两段视频中提取的至少两帧图像的第一全局特征和第一局部特征,第一全局特征包括图像情绪、图像风格、图像场景中的至少一种,第一局部特征包括每帧图像对应的局部特征,每帧图像对应的局部特征包括图像情绪、图像风格、图像场景中的至少一种;
与至少两段视频匹配的音乐的第二全局特征和第二局部特征,第二全局特征包括音乐情绪、音乐曲风或音乐主题中的至少一种,第二局部特征包括音乐中每个段视频对应的音乐片段的副歌点、乐句乐段点和节拍点中的至少一种。
可选地,确定每段视频对应的视频局部特征,包括:
采用视频特征提取模型,分别对至少两段视频进行特征提取,得到每段视频对应的视频局部特征。
可选地,确定至少两段视频对应的视频类型,包括:
响应于对至少一个预设视频类型中目标视频类型的选择操作,将目标视频类型确定为至少两段视频对应的视频类型。
可选地,确定从至少两段视频中提取的至少两帧图像的第一全局特征和第一局部特征,包括:
对至少两段视频进行抽帧处理,得到至少两帧图像;
采用预先存储的图像特征提取模型,对至少两帧图像进行特征提取,得到第一全局特征和第一局部特征。
可选地,确定与至少两帧图像匹配的音乐的第二全局特征和第二局部特征,包括:
采用预先存储的配乐算法,对音乐进行特征提取,得到第二全局特征和第二局部特征。
可选地,特征信息中包括:每段视频对应的视频局部特征、视频类型、第一全局特征、第一局部特征、第二全局特征和第二局部特征;
根据特征信息和预先存储的多个渲染效果,确定待添加效果组合,包括:
根据第一全局特征和第二全局特征,对多个渲染效果进行全局过滤筛选处理,得到多个第一待选效果;
对多个第一待选效果进行类型匹配筛选处理,得到与视频类型匹配的多个第二待选效果;
针对每段视频,根据第一局部特征中视频对应的图像的局部特征,对多个第二待选效果进行局部过滤筛选处理,得到多个第三待选效果,并根据视频对应的视频局部特征,确定多个第三待选效果在视频下各自对应的属性得分,将多个第三待选效果中属性得分大于或等于第一阈值的效果,确定为视频对应的至少一个第四待选效果;
根据每段视频各自对应的至少一个第四待选效果,确定至少一个渲染组合;
根据第一局部特征、第二局部特征和至少一个渲染组合,确定待添加效果组合。
可选地,视频局部特征包括视频冲击力、视频运动快慢、视频入方向和视频出方向;
根据视频对应的视频局部特征,确定多个第三待选效果各自对应的属性得分,包括:
根据视频的视频冲击力和每个第三待选效果对应的冲击力,确定每个第三待选效果对应的冲击力得分;
根据视频的视频运动快慢和每个第三待选效果对应的运动快慢,确定每个第三待选效果对应的运动得分;
根据视频的视频入方向和每个第三待选效果对应的入方向,确定每个第三待选效果对应的入方向得分;
根据视频的视频出方向和每个第三待选效果对应的出方向,确定每个第三待选效果对应的出方向得分;
针对每个第三待选效果,将第三待选效果对应的冲击力得分、运动得分、入方向得分和出方向得分乘积,确定为第三待选效果对应的属性得分。
可选地,根据视频的视频冲击力和每个第三待选效果对应的冲击力,确定每个第三待选效果对应的冲击力得分,包括:
针对每个第三待选效果,获取视频冲击力的第一冲击力得分、以及第三待选效果对应的冲击力的第二冲击力得分;根据第一冲击力得分和第二冲击力得分,确定第三待选效果对应的冲击力得分。
可选地,根据视频的视频运动快慢和每个第三待选效果对应的运动快慢,确定每个第三待选效果对应的运动得分,包括:
针对每个第三待选效果,判断第三待选效果对应的运动快慢是否为预设快慢;
若是,则将第一预设得分,确定为第三待选效果对应的运动得分;
否则,获取视频运动快慢对应的第一运动得分、以及第三待选效果对应的运动快慢对应的第二运动得分,并根据第一运动得分和第二运动得分,确定第三待选效果对应的运动得分。
可选地,根据视频的视频入方向和每个第三待选效果对应的入方向,确定每个第三待选效果对应的入方向得分,包括:
针对每个第三待选效果,判断视频入方向和第三待选效果对应的入方向是否相反;
若相反,则将第二预设得分,确定为第三待选效果对应的入方向得分;
否则,将第三预设得分,确定为第三待选效果对应的入方向得分。
可选地,根据视频的视频出方向和每个第三待选效果对应的出方向,确定每个第三待选效果对应的出方向得分,包括:
针对每个第三待选效果,判断视频出方向和第三待选效果对应的出方向是否相反;
若相反,则将第四预设得分,确定为第三待选效果对应的出方向得分;
否则,将第五预设得分,确定为第三待选效果对应的出方向得分。
可选地,根据至少两段视频和待添加效果组合,生成目标视频,包括:
根据至少两段视频、待添加效果组合和音乐,生成目标视频。
第二方面,本申请实施例提供一种视频生成装置,包括:
获取视频模块,用于获取至少两段视频;
确定特征模块,用于确定至少两段视频对应的特征信息;
确定效果模块,用于根据特征信息和预先存储的多个渲染效果,确定待添加效果组合;渲染效果为动画、特效或转场;
生成视频模块,用于根据至少两段视频和待添加效果组合,生成目标视频。
可选地,至少两段视频对应的特征信息包括以下至少一种:
每段视频对应的视频局部特征,视频局部特征包括视频冲击力、视频运动快慢、视频入方向或视频出方向中的至少一种;
至少两段视频对应的视频类型;
从至少两段视频中提取的至少两帧图像的第一全局特征和第一局部特征,第一全局特征包括图像情绪、图像风格、图像场景中的至少一种,第一局部特征包括每帧图像对应的局部特征,每帧图像对应的局部特征包括图像情绪、图像风格、图像场景中的至少一种;
与至少两段视频匹配的音乐的第二全局特征和第二局部特征,第二全局特征包括音乐情绪、音乐曲风或音乐主题中的至少一种,第二局部特征包括音乐中每个段视频对应的音乐片段的副歌点、乐句乐段点和节拍点中的至少一种。
可选地,确定特征模块具体用于:采用视频特征提取模型,分别对至少两段视频进行特征提取,得到每段视频对应的视频局部特征。
可选地,确定特征模块具体用于:响应于对至少一个预设视频类型中目标视频类型的选择操作,将目标视频类型确定为至少两段视频对应的视频类型。
可选地,确定特征模块具体用于:对至少两段视频进行抽帧处理,得到至少两帧图像;
采用预先存储的图像特征提取模型,对至少两帧图像进行特征提取,得到第一全局特征和第一局部特征。
可选地,确定特征模块具体用于:采用预先存储的配乐算法,对音乐进行特征提取,得到第二全局特征和第二局部特征。
可选地,特征信息中包括:每段视频对应的视频局部特征、视频类型、第一全局特征、第一局部特征、第二全局特征和第二局部特征;
确定效果模块具体用于:
根据第一全局特征和第二全局特征,对多个渲染效果进行全局过滤筛选处理,得到多个第一待选效果;
对多个第一待选效果进行类型匹配筛选处理,得到与视频类型匹配的多个第二待选效果;
针对每段视频,根据第一局部特征中视频对应的图像的局部特征,对多个第二待选效果进行局部过滤筛选处理,得到多个第三待选效果,并根据视频对应的视频局部特征,确定多个第三待选效果在视频下各自对应的属性得分,将多个第三待选效果中属性得分大于或等于第一阈值的效果,确定为视频对应的至少一个第四待选效果;
根据每段视频各自对应的至少一个第四待选效果,确定至少一个渲染组合;
根据第一局部特征、第二局部特征和至少一个渲染组合,确定待添加效果组合。
可选地,视频局部特征包括视频冲击力、视频运动快慢、视频入方向和视频出方向;
确定效果模块具体用于:
根据视频的视频冲击力和每个第三待选效果对应的冲击力,确定每个第三待选效果对应的冲击力得分;
根据视频的视频运动快慢和每个第三待选效果对应的运动快慢,确定每个第三待选效果对应的运动得分;
根据视频的视频入方向和每个第三待选效果对应的入方向,确定每个第三待选效果对应的入方向得分;
根据视频的视频出方向和每个第三待选效果对应的出方向,确定每个第三待选效果对应的出方向得分;
针对每个第三待选效果,将第三待选效果对应的冲击力得分、运动得分、入方向得分和出方向得分乘积,确定为第三待选效果对应的属性得分。
可选地,确定效果模块具体用于:针对每个第三待选效果,获取视频冲击力的第一冲击力得分、以及第三待选效果对应的冲击力的第二冲击力得分;根据第一冲击力得分和第二冲击力得分,确定第三待选效果对应的冲击力得分。
可选地,确定效果模块具体用于:针对每个第三待选效果,判断第三待选效果对应的运动快慢是否为预设快慢;
若是,则将第一预设得分,确定为第三待选效果对应的运动得分;
否则,获取视频运动快慢对应的第一运动得分、以及第三待选效果对应的运动快慢对应的第二运动得分,并根据第一运动得分和第二运动得分,确定第三待选效果对应的运动得分。
可选地,确定效果模块具体用于:针对每个第三待选效果,判断视频入方向和第三待选效果对应的入方向是否相反;
若相反,则将第二预设得分,确定为第三待选效果对应的入方向得分;
否则,将第三预设得分,确定为第三待选效果对应的入方向得分。
可选地,确定效果模块具体用于:针对每个第三待选效果,判断视频出方向和第三待选效果对应的出方向是否相反;
若相反,则将第四预设得分,确定为第三待选效果对应的出方向得分;
否则,将第五预设得分,确定为第三待选效果对应的出方向得分。
可选地,确定效果模块具体用于:根据至少两段视频、待添加效果组合和音乐,生成目标视频。
第三方面,本申请实施例提供一种电子设备,包括:处理器,以及与处理器通信连接的存储器;
存储器存储计算机执行指令;
处理器执行存储器存储的计算机执行指令,以实现如第一方面任一项的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如第一方面任一项的方法。
第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面任一项的方法。
本申请实施例提供一种视频生成方法、装置、设备、存储介质及程序产品,该方法包括:获取至少两段视频;确定至少两段视频对应的特征信息;根据特征信息和预先存储的多个渲染效果,确定待添加效果组合;渲染效果为动画、特效或转场;根据至少两段视频和待添加效果组合,生成目标视频。在上述方法中,根据特征信息和预先存储的多个渲染效果,确定待添加效果组合;渲染效果为动画、特效或转场,使得待添加效果组合中的渲染效果与至少两段视频相匹配。进一步地,根据至少两段视频和待添加效果组合,生成目标视频,使得目标视频具有渲染效果,从而提高目标视频的丰富性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的应用场景示意图;
图2为本申请实施例提供的视频生成方法的流程图;
图3为本申请实施例提供的确定待添加效果组合的方法流程图;
图4为本申请实施例提供的一种确定待添加效果组合的循环方法流程图;
图5为本申请实施例提供的视频生成装置的结构示意图;
图6为本申请实施例提供的电子设备的硬件示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
首先对本申请涉及的专业术语进行解释。
动画,指对一帧图像的形变和位移的效果。
转场,指两帧图像之间切换的效果。
特效,指对图像做一些粒子特效或者明暗色彩变化。
接着现有技术进行说明。在现有技术中,用户可以通过视频剪辑应用程序从至少一个原始视频中剪辑得到多段视频,并通过视频剪辑应用程序将多段视频合成一个视频,使得合成的视频的丰富性较差。
在本申请中,为了提高合成的视频的丰富性,发明人想到,采用多段视频和渲染效果,生成目标视频,使得合成视频具有上述渲染效果,从而提高合成视频的丰富性。
下面结合图1对本申请涉及的应用场景进行说明,具体的,请参见图1。
图1为本申请实施例提供的应用场景示意图。如图1所示,包括:至少两段视频、以及目标视频。例如,至少两段视频包括视频1、视频2和视频3。
在本申请中,通过至少两段视频的特征信息和预先存储的多个渲染效果,确定待添加效果组合,并根据至少两段视频和待添加效果组合,生成目标视频,由于待添加效果组合中包括渲染效果,因此可以使得目标视频具有渲染效果,从而提高目标视频的丰富性。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图2为本申请实施例提供的视频生成方法的流程图。如图2所示,该方法包括:
S201,获取至少两段视频。
可选地,本申请实施例的执行主体为电子设备,也可以为设置在电子设备中的视频生成装置,该视频生成装置可以通过软件和/或硬件的结合来实现。
电子设备可以是个人数字助理(Personal Digital Assistant,PDA)、用户设备(User Device or User Equipment)、平板电脑、台式电脑,摄像机、录像机等设备。
可选地,至少两段视频可以为用户通过视频剪辑软件从至少一个原始视频中剪辑得到,也可以为用户通过摄像设备拍摄得到。
S202,确定至少两段视频对应的特征信息。
可选地,至少两段视频对应的特征信息包括以下至少一种:
每段视频对应的视频局部特征;
至少两段视频对应的视频类型;
从至少两段视频中提取的至少两帧图像的第一全局特征和第一局部特征;
与至少两段视频匹配的音乐的第二全局特征和第二局部特征。
视频局部特征包括视频冲击力、视频运动快慢、视频入方向或视频出方向中的至少一种。可选地,
视频类型为一般类型、舞蹈、颜值、电商或游戏中的任意一种。
第一全局特征为至少两帧图像中所有图像综合的特征,第一局部特征为至少两帧图像中每帧图像的特征。
第一全局特征包括图像情绪、图像风格、图像场景中的至少一种。
第一局部特征包括每帧图像对应的局部特征。每帧图像对应的局部特征包括图像情绪、图像风格、图像场景中的至少一种。
例如图像情绪包括预设表1中的Tm1、Tm2、Tm3、Tm4等。例如图像风格包括预设表2中的Tf1、Tf3等。例如图像风格包括预设表3中的Tf1、Tf3等。
第二全局特征包括音乐情绪、音乐曲风或音乐主题中的至少一种。
例如音乐情绪包括预设表4中的Me1、Me2等。例如音乐曲风包括预设表5中的Mf1、Mf2等。例如音乐主题包括预设表6中的Mt1、Mt2、Mt3等。
第二局部特征包括音乐中每个段视频对应的音乐片段的副歌点、乐句乐段点和节拍点中的至少一种。
可选地,确定每段视频对应的视频局部特征,包括:采用视频特征提取模型,分别对至少两段视频进行特征提取,得到每段视频对应的视频局部特征。
可选地,确定至少两段视频对应的视频类型,包括:响应于对至少一个预设视频类型中目标视频类型的选择操作,将目标视频类型确定为至少两段视频对应的视频类型。目标视频类型为一般类型、舞蹈、颜值、电商或游戏中的任意一种。
可选地,确定从至少两段视频中提取的至少两帧图像的第一全局特征和第一局部特征,包括:对至少两段视频进行抽帧处理,得到至少两帧图像;采用预先存储的图像特征提取模型,对至少两帧图像进行特征提取,得到第一全局特征和第一局部特征。
可选地,对至少两段视频进行抽帧处理,得到至少两帧图像,包括:分别从每段视频中抽取Z帧图像,将从每段视频中抽取的Z帧图像,确定为至少两帧图像。其中,Z为大于或等于1的整数。
可选地,确定与至少两帧图像匹配的音乐的第二全局特征和第二局部特征,包括:采用预先存储的配乐算法,对音乐进行特征提取,得到第二全局特征和第二局部特征。
可选地,音乐可以为用户选定的,也可以为采用预设音乐匹配模型对至少两帧图像和多个待选音乐进行处理得到的。
S203,根据特征信息和预先存储的多个渲染效果,确定待添加效果组合;渲染效果为动画、特效或转场。
其中,多个渲染效果中可以包括多个动画、多个转场、多个特效。
可选地,可以通过如下2种方式(方式10和方式20),待添加效果组合。
方式10,当至少两段视频对应的特征信息包括每段视频对应的视频局部特征和至少两段视频对应的视频类型时,S203具体包括:
在多个渲染效果中确定与视频类型匹配的多个第三待选效果;
根据每段视频对应的视频局部特征,确定每个第三待选效果的第六得分;
将多个第三待选效果中第六得分最高的动画、转场、特效,组合成待添加效果组合。
可选地,在多个渲染效果中,与视频类型不匹配的渲染效果可以为通过人工标注得到。
可选地,可以根据如下方法确定每个第三待选效果的第六得分,包括:
当视频对应的视频局部特征包括视频冲击力、视频运动快慢、视频入方向和视频出方向时,针对每个视频:根据视频的视频冲击力和每个第三待选效果对应的冲击力,确定每个第三待选效果对应的冲击力得分;根据视频的视频运动快慢和每个第三待选效果对应的运动快慢,确定每个第三待选效果对应的运动得分;根据视频的视频入方向和每个第三待选效果对应的入方向,确定每个第三待选效果对应的入方向得分;根据视频的视频出方向和每个第三待选效果对应的出方向,确定每个第三待选效果对应的出方向得分;
针对每个第三待选效果,将第三待选效果在每段视频下的冲击力得分、运动得分、入方向得分和出方向得分乘积,确定为第三待选效果对应的第六得分。
例如,当多个第三待选效果包括M1和M2,至少两段视频包括P1和P2时,
针对P1,根据P1的视频冲击力和M1与M2各自对应的冲击力,确定M1与M2各自对应的冲击力得分;根据P1的视频运动快慢和M1与M2各自对应的运动快慢,确定M1与M2各自对应的运动得分;根据P1的视频入方向和M1与M2各自对应的入方向,确定M1与M2各自对应的入方向得分;根据P1的视频出方向和M1与M2各自对应的出方向,确定M1与M2各自对应的出方向得分;
针对P2,根据P2的视频冲击力和M1与M2各自对应的冲击力,确定M1与M2各自对应的冲击力得分;根据P2的视频运动快慢和M1与M2各自对应的运动快慢,确定M1与M2各自对应的运动得分;根据P2的视频入方向和M1与M2各自对应的入方向,确定M1与M2各自对应的入方向得分;根据P2的视频出方向和M1与M2各自对应的出方向,确定M1与M2各自对应的出方向得分;
将M1在P1下的冲击力得分、运动得分、入方向得分、出方向得分,与M1在P2下的冲击力得分、运动得分、入方向得分、出方向得分乘积,确定为M1对应的第六得分;
将M2在P1下的冲击力得分、运动得分、入方向得分、出方向得分,与M2在P2下的冲击力得分、运动得分、入方向得分、出方向得分乘积,确定为M2对应的第六得分。
可选地,针对每个第三待选效果,可以通过如下可行的方式101,确定第三待选效果对应的冲击力得分。
方式101,获取视频冲击力的第一冲击力得分、以及第三待选效果对应的冲击力的第二冲击力得分;根据第一冲击力得分和第二冲击力得分,确定第三待选效果对应的冲击力得分。
可选地,视频冲击力和渲染效果的冲击力可以为强、中强、中、中弱或弱。
可选地,强、中强、中、中弱或弱依次对应的得分例如可以为:5、4、3、2、1(或者1、2、3、4、5,还可以为其他值,此处不再详述)。
例如,当视频冲击力为强时,第一冲击力得分为5,当第三待选效果对应的冲击力为弱时,第二冲击力得分为1。
可选地,可以根据第三待选效果的标识,从预设表8中获取第三待选效果对应的冲击力的第二冲击力得分(即冲击力的初始得分O4)。
具体的,可以通过如下可行的公式1,确定第三待选效果对应的冲击力得分:
其中,S1为第三待选效果对应的冲击力得分,pi为第一冲击力得分,pj为第二冲击力得分,e为自然常数。
可选地,针对每个第三待选效果,可以通过如下可行的方式102,确定第三待选效果对应的运动得分。
方式102,判断第三待选效果对应的运动快慢是否为预设快慢;
若是,则将第一预设得分,确定为第三待选效果对应的运动得分;
否则,获取视频运动快慢对应的第一运动得分、以及第三待选效果对应的运动快慢对应的第二运动得分,并根据第一运动得分和第二运动得分,确定第三待选效果对应的运动得分。
可选地,视频运动快慢可以为快、中或慢。渲染效果的运动快慢可以为快、中、慢或不限。可选地,上述预设快慢可以为不限。
可选地,快、中或慢依次对应的得分例如可以为:3、2、1(或者1、2、3,还可以为其他值,此处不再详述)。例如,当视频运动快慢为快时,第一运动得分为3,当第三待选效果对应的运动快慢为慢时,第二运动得分为1。
具体的,可以通过如下公式2,确定第三待选效果对应的运动得分:
其中,S2为第三待选效果对应的运动得分,A为第一预设得分,di为第一运动得分,dj为第二运动得分。可选地,A可以为1,还可以为其他值。
可选地,针对每个第三待选效果,可以通过如下可行的方式103,确定第三待选效果对应的入方向得分。
方式103,判断视频入方向和第三待选效果对应的入方向是否相反;
若相反,则将第二预设得分,确定为第三待选效果对应的入方向得分;
否则,将第三预设得分,确定为第三待选效果对应的入方向得分。
具体的,可以通过如下公式3,确定第三待选效果对应的入方向得分:
其中,S3为第三待选效果对应的入方向得分,B为第二预设得分,C为第三预设得分。例如,B可以为0,还可以为其他值。例如,C可以为1,还可以为其他值。
可选地,针对每个第三待选效果,可以通过如下方式104,确定第三待选效果对应的出方向得分。
方式104,判断视频出方向和第三待选效果对应的出方向是否相反;
若相反,则将第四预设得分,确定为第三待选效果对应的出方向得分;
否则,将第五预设得分,确定为第三待选效果对应的出方向得分。
具体的,可以通过如下公式4,确定第三待选效果对应的出方向得分:
其中,S4为第三待选效果对应的出方向得分,D为第四预设得分,E为第五预设得分。例如,D可以为0,还可以为其他值。例如,E可以为1,还可以为其他值。
方式20,当至少两段视频对应的特征信息包括每段视频对应的视频局部特征时,S203具体包括:
根据每段视频对应的视频局部特征,确定多个渲染效果中每个渲染效果的第五得分;
将多个渲染效果中第五得分最高的动画、转场、特效,组合成待添加效果组合。
其中,根据每段视频对应的视频局部特征,确定多个渲染效果中每个渲染效果的第五得分的方法,与根据每段视频对应的视频局部特征,确定每个第三待选效果的第六得分的方法相同,此处不再赘述。
S204,根据至少两段视频和待添加效果组合,生成目标视频。
可选地,可以通过如下2种(包括方式11和方式21)方式生成目标视频。
方式11,当至少两段视频对应的特征信息中不包括与至少两段视频匹配的音乐的第二全局特征和第二局部特征时,根据至少两段视频和待添加效果组合,生成目标视频。
方式21,当至少两段视频对应的特征信息中包括与至少两段视频匹配的音乐的第二全局特征和第二局部特征时,根据至少两段视频、待添加效果组合和音乐,生成目标视频。
可选地,待添加效果组合中可以包括至少两段视频中每段视频各自对应的至少一个渲染效果,也可以包括至少两段视频(例如5段视频)中至少一段视频(例如3段视频)各自对应的至少一个渲染效果。至少一个渲染效果包括动画、特效或转场中的至少一种。
需要说明的是,至少两段视频中可以存在无任何对应渲染效果的视频。
例如,当待添加效果组合中包括每段视频各自对应的至少一个渲染效果时,
针对方式11,根据至少两段视频和待添加效果组合,生成目标视频,包括:按照待添加效果组合中每段视频各自对应的至少一个渲染效果,依次播放至少两段视频,以生成目标视频;
针对方式21,根据至少两段视频、待添加效果组合和音乐,生成目标视频,包括:按照待添加效果组合中每段视频各自对应的至少一个渲染效果,依次播放至少两段视频,并播放音乐,以生成目标视频。
在图2实施例提供的视频生成方法中,根据特征信息和预先存储的多个渲染效果,确定待添加效果组合;渲染效果为动画、特效或转场,使得待添加效果组合中的渲染效果与至少两段视频相匹配。进一步地,根据至少两段视频和待添加效果组合,生成目标视频,使得目标视频具有渲染效果,从而提高目标视频的丰富性。
在上述任意实施例的基础上,当至少两段视频对应的特征信息包括每段视频对应的视频局部特征,至少两段视频对应的视频类型、第一全局特征、第一局部特征、第二全局特征和第二局部特征时,本申请还提供一种根据特征信息和预先存储的多个渲染效果,确定待添加效果组合的方法,具体的,请参见图3实施例。
图3为本申请实施例提供的确定待添加效果组合的方法流程图。如图3所示,该方法包括:
S301,根据第一全局特征和第二全局特征,对多个渲染效果进行全局过滤筛选处理,得到多个第一待选效果。
例如,当第一全局特征包括图像情绪、图像风格、图像场景,第二全局特征包括音乐情绪、音乐曲风、音乐主题时,S301具体可以包括:
针对每个渲染效果,根据渲染效果的标识,从预设表1中获取图像情绪对应的初始得分O1,从预设表2中获取图像风格对应的初始得分O1、从预设表3中获取图像场景对应的初始得分O1;将图像情绪、图像风格、图像场景各自对应的初始得分O1之和,确定为渲染效果对应的得分V1;将多个渲染效果中得分V1大于或等于第二阈值的效果,确定为中间渲染效果;
针对每个中间渲染效果,根据中间渲染效果的标识,从预设表4中获取音乐情绪对应的初始得分O2,从预设表5中获取音乐曲风对应的初始得分O2,从预设表6中获取音乐主题对应的初始得分O2;将音乐情绪、音乐曲风、音乐主题各自对应的初始得分O2之和,确定为中间渲染效果对应的得分V2;将多个中间渲染效果中得分V2大于或等第三阈值的效果,确定为多个第一待选效果。
预设表1
标识 | 类型 | Tm1 | Tm2 | …… |
J1 | 特效 | A11 | A12 | …… |
J2 | 动画 | A21 | A22 | …… |
J3 | 转场 | A31 | A32 | …… |
…… | …… | …… | …… | …… |
预设表2
标识 | 类型 | Tf1 | Tf2 | …… |
J1 | 特效 | B11 | B12 | …… |
J2 | 动画 | B21 | B22 | …… |
J3 | 转场 | B31 | B32 | …… |
…… | …… | …… | …… | …… |
预设表3
标识 | 类型 | Tt1 | Tt2 | …… |
J1 | 特效 | C11 | C12 | …… |
J2 | 动画 | C21 | C22 | …… |
J3 | 转场 | C31 | C32 | …… |
…… | …… | …… | …… | …… |
预设表4
标识 | 类型 | Me1 | Me2 | …… |
J1 | 特效 | D11 | D12 | …… |
J2 | 动画 | D21 | D22 | …… |
J3 | 转场 | D31 | D32 | …… |
…… | …… | …… | …… | …… |
预设表5
标识 | 类型 | Mf1 | Mf 2 | …… |
J1 | 特效 | E11 | E12 | …… |
J2 | 动画 | E21 | E22 | …… |
J3 | 转场 | E31 | E32 | …… |
…… | …… | …… | …… | …… |
预设表6
标识 | 类型 | Mt1 | Mt2 | …… |
J1 | 特效 | F11 | F12 | …… |
J2 | 动画 | F21 | F22 | …… |
J3 | 转场 | F31 | F32 | ...... |
…… | …… | …… | …… | …… |
在预设表1-6中,A11~A32、B11~B32、C11~C32均为初始得分O1,D11~D32、E11~E32、F11~F32均为初始得分O2。
S302,对多个第一待选效果进行类型匹配筛选处理,得到与视频类型匹配的多个第二待选效果。
可选地,可以通过如下2种方式(包括方式31和方式32)得到与视频类型匹配的多个第二待选效果。
方式31,多个第一待选效果可以具有预先设定的效果类型,可以判断视频类型和效果类型是否匹配,若是,将则将具有与视频类型匹配的效果类型的第一待选效果确定为与视频类型匹配的多个第二待选效果。
方式32,在多个第一待选效果中删除人工标注的与视频类型不匹配的效果,得到与视频类型匹配的多个第二待选效果。
S303,针对每段视频,根据第一局部特征中视频对应的图像的局部特征,对多个第二待选效果进行局部过滤筛选处理,得到多个第三待选效果,并根据视频对应的视频局部特征,确定多个第三待选效果在视频下各自对应的属性得分,将多个第三待选效果中属性得分大于或等于第一阈值的效果,确定为视频对应的至少一个第四待选效果。
例如,当至少两段视频包括P1和P2时,针对P1执行S303,得到P1对应的至少一个第四待选效果;针对P2执行S303,得到P2对应的至少一个第四待选效果。
下面以P1、P1对应于一帧图像(从P1中抽取一帧图像T1)为例,对根据第一局部特征中T1的局部特征,对多个第二待选效果进行局部过滤筛选处理,得到多个第三待选效果进行说明。
当T1的局部特征包括图像情绪、图像风格和图像场景时,针对每个第二待选效果,根据第二待选效果的标识,从预设表1中获取图像情绪对应的初始得分O1,从预设表2中获取图像风格对应的初始得分O1,从预设表3中获取图像场景对应的初始得分O1,将图像情绪、图像风格、图像场景各自对应的初始得分O1之和,确定为第二待选效果在T1下的得分V3;
将多个第二待选效果中得分V3大于或等于第四阈值的效果,确定为多个第三待选效果。
可选地,当视频局部特征包括视频冲击力、视频运动快慢、视频入方向和视频出方向时,根据视频对应的视频局部特征,确定多个第三待选效果各自对应的属性得分,包括:
根据视频的视频冲击力和每个第三待选效果对应的冲击力,确定每个第三待选效果对应的冲击力得分S1;
根据视频的视频运动快慢和每个第三待选效果对应的运动快慢,确定每个第三待选效果对应的运动得分S2;
根据视频的视频入方向和每个第三待选效果对应的入方向,确定每个第三待选效果对应的入方向得分S3;
根据视频的视频出方向和每个第三待选效果对应的出方向,确定每个第三待选效果对应的出方向得分S4;
针对每个第三待选效果,将第三待选效果对应的冲击力得分S1、运动得分S2、入方向得分S3和出方向得分S4乘积,确定为第三待选效果在视频下对应的属性得分。
可选地,针对每个第三待选效果,可以通过上述方式101,确定第三待选效果对应的冲击力得分;可以通过上述方式102,确定第三待选效果对应的运动得分;可以通过上述方式103,确定第三待选效果对应的入方向得分;可以通过上述方式104,确定第三待选效果对应的出方向得分。
S304,根据每段视频各自对应的至少一个第四待选效果,确定至少一个渲染组合。
可选地,可以通过如下2种方式(包括方式41和方式42)确定至少一个渲染组合。
方式41,对每段视频各自对应的至少一个第四待选效果进行组合,得到至少一个渲染组合。
方式42,将每段视频各自对应的至少一个第四待选效果组成效果集合;
针对效果集合中标识相同的U个第四待选效果,从效果集合中删除标识相同的U-1个第四待选效果,得到待选集合;对待选集合中的第四待选效进行组合,得到至少一个渲染组合。
在上述方式41和方式42中,每个渲染组合中包括一个动画、一个转场和一个特效。至少一个渲染组合存在不同。例如至少一个渲染组合包括组合1和组合2时,组合1和组合2存在不同。
例如,当效果集合中包括标识为J1的2个第四待选效果、标识为J2的3个第四待选效果和标识为J3的2个第四待选效果时,从效果集合中删除标识为J1的1个(2-1)第四待选效果、标识为J2的2个(3-1)第四待选效果、标识为J3的1个(2-1)第四待选效果,得到待选集合。
S305,根据第一局部特征、第二局部特征和至少一个渲染组合,确定待添加效果组合。
当第一局部特征包括至少两帧图像各自对应的图像情绪、图像风格和图像场景;第二局部特征包括音乐中至少两帧图像各自对应的音乐片段的副歌点、乐句乐段点和节拍点时,S305包括:
S3051,根据至少两帧图像中的第一帧图像对应的第二图像情绪、第二图像风格和第二图像场景,以及第一帧图像对应的音乐片段的副歌点、乐句乐段点和节拍点,对至少一个渲染组合进行筛选,得到N个待选初始组合。
其中,N为大于或等于1的整数。
根据第一帧图像对应的图像情绪、图像风格和图像场景,以及第一帧图像对应的音乐片段的副歌点、乐句乐段点和节拍点,确定每个渲染组合各自对应的组合得分;将至少一个渲染组合中组合得分大于或等于第五阈值的N个渲染组合,确定为N个待选初始组合。
针对每个渲染组合,根据第一帧图像对应的图像情绪、图像风格和图像场景,以及第一帧图像对应的音乐片段的副歌点、乐句乐段点和节拍点,确定渲染组合各自对应的组合得分,包括:
根据渲染组合中每个渲染效果的标识,从预设表7中获取副歌点、乐句乐段点和节拍点各自对应的初始得分O3;根据渲染组合中每个渲染效果的标识,获取每个渲染效果对应的得分V2(计算得分V2的方法请参见上述S301);将副歌点、乐句乐段点和节拍点各自对应的初始得分O3,以及每个渲染效果对应的得分V2,确定为音乐匹配得分;
根据渲染组合中每个渲染效果的标识,从预设表1中获取图像情绪对应的初始得分O1,从预设表2中获取图像风格的初始得分O1,从预设表3中获取图像场景的初始得分O1;确定图像情绪对应的初始得分O1、图像风格的初始得分O1、图像场景的初始得分O1之和;获取上述和,与上述S303中得到的S1、S2、S3、S4的乘积;将上述乘积与预设系统的乘积,确定为图像匹配得分;
根据渲染组合中每个渲染效果的标识和每个渲染效果对应的属性,确定图像内部得分;
将上述音乐匹配得分、图像匹配得分、图像内部得分,确定为渲染组合的组合得分。
上述属性可以包括入方向、冲击力、运动快慢和出方向中的任意至少一种。
例如,当每个渲染效果对应的属性包括入方向和冲击力时,图像内部得分等于入方向匹配得分和视觉冲击力得分之和。
其中,入方向匹配得分可以通过如下方法确定:根据渲染组合中每个渲染效果的标识,从预设列表8中获取每个渲染效果对应的入方向的初始得分O4;根据渲染组合中每两个渲染效果对应的入方向的初始得分O4,计算每两个渲染效果对应的相似度(例如余弦相似度);将每两个渲染效果对应的相似度之和,确定为入方向匹配得分。
其中,视觉冲击力得分可以通过如下方法确定:根据渲染组合中每个渲染效果的标识,在预设列表8中获取每个渲染效果对应的视觉冲击力的第二冲击力得分;根据渲染组合中每两个渲染效果对应的冲击力的第二冲击力得分,确定每两个渲染效果对应的冲击力差异得分;(可选地,冲击力差异得分可以通过如下公式:-β*|X1-X2|;其中,β为预设值,-为负号,*为乘号,X1为两个渲染效果中一个渲染效果对应的冲击力的第二冲击力得分,X2为两个渲染效果中另一个渲染效果对应的冲击力的第二冲击力得分,||为绝对值);将每两个渲染效果对应的冲击力差异得分之和,确定为视觉冲击力得分;
预设表7
标识 | 类型 | 副歌点 | 乐句乐段点 | 节拍点 |
J1 | 动画 | G11 | G12 | G13 |
J2 | 动画 | G21 | G22 | G23 |
J3 | 转场 | G31 | G32 | G33 |
…… | …… | …… | …… | …… |
预设表8
标识 | 类型 | 入方向 | 冲击力 | …… |
J1 | 动画 | H11 | H12 | …… |
J2 | 动画 | H21 | H22 | …… |
J3 | 转场 | H31 | H32 | …… |
…… | …… | …… | …… | …… |
在预设表7-8中,G11~G33为初始得分O3,H11~H33为初始得分O4。
S3052,根据N个待选初始组合和至少一个渲染组合,确定M个第m-1待选组合,M等于N与至少一个渲染组合的总数量的乘积;根据第m帧图像对应的第二图像情绪、第二图像风格和第二图像场景,以及第m帧图像对应的音乐片段的副歌点、乐句乐段点和节拍点,对M个第m-1待选组合进行筛选,确定N个第m待选组合,并将N个第m待选组合作为新的N个待选初始组合,m加1,并重复执行此步骤,直至到达至少两帧图像中的最后一帧图像,并将最后一帧图像对应的待选组合确定为待添加效果组合。
m为大于或等于2的整数。m的初始值为2。
需要说明的是,针对至少两帧图像中除第一帧图像之外的其他图像依次重复执行S3052。下面结合图4对S3052的具体执行方法进行说明。
图4为本申请实施例提供的一种确定待添加效果组合的循环方法流程图。如图4所示,该方法包括:
S401,根据N个待选初始组合和至少一个渲染组合,确定M个第m-1待选组合。
M等于N与L的乘积。其中,L为至少一个渲染组合的总数量。
S402,根据第m帧图像对应的图像情绪、图像风格和图像场景,和第m帧图像对应的音乐片段的副歌点、乐句乐段点和节拍点,对M个第m-1待选组合进行筛选,确定N个第m待选组合。
m的初始值为2。
S403,判断m是否大于至少两帧图像的总数量。
若否,则执行S404,否则执行S405。
S404,将N个第m待选组合作为新的N个待选初始组合,并将m加1,重复执行S401~S403。
S405,将N个第m待选组合中组合得分最大的第m待选组合,确定为待添加效果组合。
需要说明的是,在执行S405时,表示第m帧图像为最后一帧图像,此时,N个第m待选组合中组合得分最大的第m待选组合为最后一帧图像对应的待选组合。
针对N个第m待选组合中的每个第m待选组合,第m待选组合对应的组合得分等于音乐匹配得分、图像匹配得分、内部组合分数、组合匹配得分之和。
其中,音乐匹配得分、图像匹配得分的确定方法请参见上述S3051中音乐匹配得分、图像匹配得分的确定方法,此处不再赘述。
其中,内部组合分数等于方向匹配得分与视觉冲击力得分之和。
其中,方向匹配得分、视觉冲击力得分的确定方法请参见上述S3051中方向匹配得分、视觉冲击力得分的确定方法,此处不再赘述。
下面以至少两帧图像包括第一帧图像和第二帧图像,第m待选组合中包括第一帧图像的动画、转场、特效,和第二帧图像的动画、转场、特效为例,对确定组合匹配得分进行说明。
根据第m待选组合中每个渲染效果的标识,在预设表8中确定每个渲染效果对应的入方向的初始得分O4和视频冲击力的初始得分O4;
计算第一帧图像的动画对应的入方向的初始得分O4和第二帧图像的动画对应的入方向的初始得分O4的第一余弦相似度;
计算第一帧图像的转场对应的入方向的初始得分O4和第二帧图像的转场对应的入方向的初始得分O4的第二余弦相似度;
计算第一帧图像的特效对应的入方向的初始得分O4和第二帧图像的特效对应的入方向的初始得分O4的第三余弦相似度;
根据第一帧图像的动画对应的视频冲击力的初始得分O4和第二帧图像的动画对应的视频冲击力的初始得分O4,确定冲击力差异得分Y1;
根据第一帧图像的转场对应的视频冲击力的初始得分O4和第二帧图像的转场对应的视频冲击力的初始得分O4,确冲击力差异得分Y2;
根据第一帧图像的特效对应的视频冲击力的初始得分O4和第二帧图像的特效对应的视频冲击力的初始得分O4,确定冲击力差异得分Y3;
将第一余弦相似度、第二余弦相似度、第三余弦相似度、确定冲击力差异得分Y1、冲击力差异得分Y2、冲击力差异得分Y2、冲击力差异得分Y3之和确定为组合匹配得分。
其中,冲击力差异得分Y1、冲击力差异得分Y2、冲击力差异得分Y3的确定方法,与上述S3051中每两个渲染效果对应的冲击力差异得分的确定方法相似,此处不再赘述。
图5为本申请实施例提供的视频生成装置的结构示意图。如图5所示,视频生成装置10包括:
获取视频模块101,用于获取至少两段视频;
确定特征模块102,用于确定至少两段视频对应的特征信息;
确定效果模块103,用于根据特征信息和预先存储的多个渲染效果,确定待添加效果组合;渲染效果为动画、特效或转场;
生成视频模块104,用于根据至少两段视频和待添加效果组合,生成目标视频。
本申请实施例提供的视频生成装置10可以执行上述任意实施例中所示的方法,其实现原理以及有益效果类似,此处不再进行赘述。
可选地,至少两段视频对应的特征信息包括以下至少一种:
每段视频对应的视频局部特征,视频局部特征包括视频冲击力、视频运动快慢、视频入方向或视频出方向中的至少一种;
至少两段视频对应的视频类型;
从至少两段视频中提取的至少两帧图像的第一全局特征和第一局部特征,第一全局特征包括图像情绪、图像风格、图像场景中的至少一种,第一局部特征包括每帧图像对应的局部特征,每帧图像对应的局部特征包括图像情绪、图像风格、图像场景中的至少一种;
与至少两段视频匹配的音乐的第二全局特征和第二局部特征,第二全局特征包括音乐情绪、音乐曲风或音乐主题中的至少一种,第二局部特征包括音乐中每个段视频对应的音乐片段的副歌点、乐句乐段点和节拍点中的至少一种。
可选地,确定特征模块102具体用于:采用视频特征提取模型,分别对至少两段视频进行特征提取,得到每段视频对应的视频局部特征。
可选地,确定特征模块102具体用于:响应于对至少一个预设视频类型中目标视频类型的选择操作,将目标视频类型确定为至少两段视频对应的视频类型。
可选地,确定特征模块102具体用于:对至少两段视频进行抽帧处理,得到至少两帧图像;
采用预先存储的图像特征提取模型,对至少两帧图像进行特征提取,得到第一全局特征和第一局部特征。
可选地,确定特征模块102具体用于:采用预先存储的配乐算法,对音乐进行特征提取,得到第二全局特征和第二局部特征。
可选地,特征信息中包括:每段视频对应的视频局部特征、视频类型、第一全局特征、第一局部特征、第二全局特征和第二局部特征;
确定效果模块103具体用于:
根据第一全局特征和第二全局特征,对多个渲染效果进行全局过滤筛选处理,得到多个第一待选效果;
对多个第一待选效果进行类型匹配筛选处理,得到与视频类型匹配的多个第二待选效果;
针对每段视频,根据第一局部特征中视频对应的图像的局部特征,对多个第二待选效果进行局部过滤筛选处理,得到多个第三待选效果,并根据视频对应的视频局部特征,确定多个第三待选效果在视频下各自对应的属性得分,将多个第三待选效果中属性得分大于或等于第一阈值的效果,确定为视频对应的至少一个第四待选效果;
根据每段视频各自对应的至少一个第四待选效果,确定至少一个渲染组合;
根据第一局部特征、第二局部特征和至少一个渲染组合,确定待添加效果组合。
可选地,视频局部特征包括视频冲击力、视频运动快慢、视频入方向和视频出方向;
确定效果模块103具体用于:
根据视频的视频冲击力和每个第三待选效果对应的冲击力,确定每个第三待选效果对应的冲击力得分;
根据视频的视频运动快慢和每个第三待选效果对应的运动快慢,确定每个第三待选效果对应的运动得分;
根据视频的视频入方向和每个第三待选效果对应的入方向,确定每个第三待选效果对应的入方向得分;
根据视频的视频出方向和每个第三待选效果对应的出方向,确定每个第三待选效果对应的出方向得分;
针对每个第三待选效果,将第三待选效果对应的冲击力得分、运动得分、入方向得分和出方向得分乘积,确定为第三待选效果对应的属性得分。
可选地,确定效果模块103具体用于:针对每个第三待选效果,获取视频冲击力的第一冲击力得分、以及第三待选效果对应的冲击力的第二冲击力得分;根据第一冲击力得分和第二冲击力得分,确定第三待选效果对应的冲击力得分。
可选地,确定效果模块103具体用于:针对每个第三待选效果,判断第三待选效果对应的运动快慢是否为预设快慢;
若是,则将第一预设得分,确定为第三待选效果对应的运动得分;
否则,获取视频运动快慢对应的第一运动得分、以及第三待选效果对应的运动快慢对应的第二运动得分,并根据第一运动得分和第二运动得分,确定第三待选效果对应的运动得分。
可选地,确定效果模块103具体用于:针对每个第三待选效果,判断视频入方向和第三待选效果对应的入方向是否相反;
若相反,则将第二预设得分,确定为第三待选效果对应的入方向得分;
否则,将第三预设得分,确定为第三待选效果对应的入方向得分。
可选地,确定效果模块103具体用于:针对每个第三待选效果,判断视频出方向和第三待选效果对应的出方向是否相反;
若相反,则将第四预设得分,确定为第三待选效果对应的出方向得分;
否则,将第五预设得分,确定为第三待选效果对应的出方向得分。
可选地,确定效果模块103具体用于:根据至少两段视频、待添加效果组合和音乐,生成目标视频。
本申请实施例提供的视频生成装置10可以执行上述任意实施例中所示的方法,其实现原理以及有益效果类似,此处不再进行赘述。
图6为本申请实施例提供的电子设备的硬件示意图。如图6所示,电子设备20可以包括:收发器201、存储器202、处理器203。
收发器201可以包括:发射器和/或接收器。
发射器还可称为发送器、发射机、发送端口或发送接口等类似描述。
接收器还可称为接收器、接收机、接收端口或接收接口等类似描述。
示例性地,收发器201、存储器202、处理器203各部分之间通过总线204相互连接。
存储器202用于存储计算机执行指令;
处理器203用于执行存储器202存储的计算机执行指令,使得处理器203执行上述视频生成方法。
本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当计算机执行指令被处理器执行时实现上述任意方法实施例中的方法。
本申请实施例还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时,可实现上述任意方法实施例中的方法。
实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一可读取存储器中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储器(存储介质)包括:只读存储器(read-only memory,ROM)、RAM、快闪存储器、硬盘、固态硬盘、磁带(magnetic tape)、软盘(floppy disk)、光盘(optical disc)及其任意组合。
本申请实施例是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理单元以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理单元执行的指令产生用于实现在流程图一个流程或至少一个流程和/或方框图一个方框或至少一个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或至少一个流程和/或方框图一个方框或至少一个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或至少一个流程和/或方框图一个方框或至少一个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请实施例的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
在本申请中,术语“包括”及其变形可以指非限制性的包括;术语“或”及其变形可以指“和/或”。本本申请中术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。本申请中,“至少一个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。
Claims (17)
1.一种视频生成方法,其特征在于,包括:
获取至少两段视频;
确定所述至少两段视频对应的特征信息;
根据所述特征信息和预先存储的多个渲染效果,确定待添加效果组合;所述渲染效果为动画、特效或转场;
根据所述至少两段视频和所述待添加效果组合,生成目标视频。
2.根据权利要求1所述的方法,其特征在于,所述至少两段视频对应的特征信息包括以下至少一种:
每段视频对应的视频局部特征,所述视频局部特征包括视频冲击力、视频运动快慢、视频入方向或视频出方向中的至少一种;
所述至少两段视频对应的视频类型;
从所述至少两段视频中提取的至少两帧图像的第一全局特征和第一局部特征,所述第一全局特征包括图像情绪、图像风格、图像场景中的至少一种,所述第一局部特征包括每帧图像对应的局部特征,所述每帧图像对应的局部特征包括图像情绪、图像风格、图像场景中的至少一种;
与所述至少两段视频匹配的音乐的第二全局特征和第二局部特征,所述第二全局特征包括音乐情绪、音乐曲风或音乐主题中的至少一种,所述第二局部特征包括所述音乐中每个段视频对应的音乐片段的副歌点、乐句乐段点和节拍点中的至少一种。
3.根据权利要求2所述的方法,其特征在于,确定所述每段视频对应的视频局部特征,包括:
采用视频特征提取模型,分别对所述至少两段视频进行特征提取,得到每段视频对应的视频局部特征。
4.根据权利要求2所述的方法,其特征在于,确定所述至少两段视频对应的视频类型,包括:
响应于对至少一个预设视频类型中目标视频类型的选择操作,将所述目标视频类型确定为所述至少两段视频对应的视频类型。
5.根据权利要求2所述的方法,其特征在于,确定从所述至少两段视频中提取的至少两帧图像的第一全局特征和第一局部特征,包括:
对所述至少两段视频进行抽帧处理,得到所述至少两帧图像;
采用预先存储的图像特征提取模型,对所述至少两帧图像进行特征提取,得到所述第一全局特征和所述第一局部特征。
6.根据权利要求2所述的方法,其特征在于,确定与所述至少两帧图像匹配的音乐的第二全局特征和第二局部特征,包括:
采用预先存储的配乐算法,对所述音乐进行特征提取,得到所述第二全局特征和第二局部特征。
7.根据权利要求2-6任一项所述的方法,其特征在于,所述特征信息中包括:每段视频对应的视频局部特征、视频类型、所述第一全局特征、所述第一局部特征、所述第二全局特征和所述第二局部特征;
所述根据所述特征信息和预先存储的多个渲染效果,确定待添加效果组合,包括:
根据所述第一全局特征和所述第二全局特征,对所述多个渲染效果进行全局过滤筛选处理,得到多个第一待选效果;
对所述多个第一待选效果进行类型匹配筛选处理,得到与所述视频类型匹配的多个第二待选效果;
针对所述每段视频,根据所述第一局部特征中所述视频对应的图像的局部特征,对所述多个第二待选效果进行局部过滤筛选处理,得到多个第三待选效果,并根据所述视频对应的视频局部特征,确定所述多个第三待选效果在所述视频下各自对应的属性得分,将所述多个第三待选效果中属性得分大于或等于第一阈值的效果,确定为所述视频对应的至少一个第四待选效果;
根据所述每段视频各自对应的至少一个第四待选效果,确定所述至少一个渲染组合;
根据所述第一局部特征、所述第二局部特征和所述至少一个渲染组合,确定所述待添加效果组合。
8.根据权利要求7所述的方法,其特征在于,所述视频局部特征包括视频冲击力、视频运动快慢、视频入方向和视频出方向;
所述根据所述视频对应的视频局部特征,确定所述多个第三待选效果各自对应的属性得分,包括:
根据所述视频的视频冲击力和每个第三待选效果对应的冲击力,确定每个第三待选效果对应的冲击力得分;
根据所述视频的视频运动快慢和每个第三待选效果对应的运动快慢,确定每个第三待选效果对应的运动得分;
根据所述视频的视频入方向和每个第三待选效果对应的入方向,确定每个第三待选效果对应的入方向得分;
根据所述视频的视频出方向和每个第三待选效果对应的出方向,确定每个第三待选效果对应的出方向得分;
针对每个第三待选效果,将所述第三待选效果对应的冲击力得分、运动得分、入方向得分和出方向得分乘积,确定为所述第三待选效果对应的属性得分。
9.根据权利要求8所述的方法,其特征在于,所述根据所述视频的视频冲击力和每个第三待选效果对应的冲击力,确定所述每个第三待选效果对应的冲击力得分,包括:
针对所述每个第三待选效果,获取所述视频冲击力的第一冲击力得分、以及所述第三待选效果对应的冲击力的第二冲击力得分;根据所述第一冲击力得分和所述第二冲击力得分,确定所述第三待选效果对应的冲击力得分。
10.根据权利要求8所述的方法,其特征在于,所述根据所述视频的视频运动快慢和每个第三待选效果对应的运动快慢,确定每个第三待选效果对应的运动得分,包括:
针对所述每个第三待选效果,判断所述第三待选效果对应的运动快慢是否为预设快慢;
若是,则将第一预设得分,确定为所述第三待选效果对应的运动得分;
否则,获取所述视频运动快慢对应的第一运动得分、以及第三待选效果对应的运动快慢对应的第二运动得分,并根据所述第一运动得分和所述第二运动得分,确定所述第三待选效果对应的运动得分。
11.根据权利要求8所述的方法,其特征在于,所述根据所述视频的视频入方向和所述每个第三待选效果对应的入方向,确定所述每个第三待选效果对应的入方向得分,包括:
针对所述每个第三待选效果,判断所述视频入方向和所述第三待选效果对应的入方向是否相反;
若相反,则将第二预设得分,确定为所述第三待选效果对应的入方向得分;
否则,将第三预设得分,确定为所述第三待选效果对应的入方向得分。
12.根据权利要求8所述的方法,其特征在于,所述根据所述视频的视频出方向和所述每个第三待选效果对应的出方向,确定所述每个第三待选效果对应的出方向得分,包括:
针对所述每个第三待选效果,判断所述视频出方向和所述第三待选效果对应的出方向是否相反;
若相反,则将第四预设得分,确定为所述第三待选效果对应的出方向得分;
否则,将第五预设得分,确定为所述第三待选效果对应的出方向得分。
13.根据权利要求2-6任一项所述的方法,其特征在于,所述根据所述至少两段视频和所述待添加效果组合,生成目标视频,包括:
根据所述至少两段视频、所述待添加效果组合和所述音乐,生成所述目标视频。
14.一种视频生成装置,其特征在于,包括:
获取视频模块,用于获取至少两段视频;
确定特征模块,用于确定所述至少两段视频对应的特征信息;
确定效果模块,用于根据所述特征信息和预先存储的多个渲染效果,确定待添加效果组合;所述渲染效果为动画、特效或转场;
生成视频模块,用于根据所述至少两段视频和所述待添加效果组合,生成目标视频。
15.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-13任一项所述的方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-13任一项所述的方法。
17.一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-13任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111371809.1A CN116137672A (zh) | 2021-11-18 | 2021-11-18 | 视频生成方法、装置、设备、存储介质及程序产品 |
PCT/SG2022/050838 WO2023091089A2 (zh) | 2021-11-18 | 2022-11-18 | 视频生成方法、装置、设备、存储介质及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111371809.1A CN116137672A (zh) | 2021-11-18 | 2021-11-18 | 视频生成方法、装置、设备、存储介质及程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116137672A true CN116137672A (zh) | 2023-05-19 |
Family
ID=86334339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111371809.1A Pending CN116137672A (zh) | 2021-11-18 | 2021-11-18 | 视频生成方法、装置、设备、存储介质及程序产品 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN116137672A (zh) |
WO (1) | WO2023091089A2 (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107770457B (zh) * | 2017-10-27 | 2020-01-21 | 维沃移动通信有限公司 | 一种视频制作方法及移动终端、计算机可读存储介质 |
CN109275028B (zh) * | 2018-09-30 | 2021-02-26 | 北京微播视界科技有限公司 | 视频获取方法、装置、终端和介质 |
CN109688463B (zh) * | 2018-12-27 | 2020-02-18 | 北京字节跳动网络技术有限公司 | 一种剪辑视频生成方法、装置、终端设备及存储介质 |
CN110913271B (zh) * | 2019-11-29 | 2022-01-18 | Oppo广东移动通信有限公司 | 视频处理方法、移动终端及非易失性计算机可读存储介质 |
CN112188117B (zh) * | 2020-08-29 | 2021-11-16 | 上海量明科技发展有限公司 | 视频合成方法、客户端及系统 |
-
2021
- 2021-11-18 CN CN202111371809.1A patent/CN116137672A/zh active Pending
-
2022
- 2022-11-18 WO PCT/SG2022/050838 patent/WO2023091089A2/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023091089A3 (zh) | 2023-08-03 |
WO2023091089A2 (zh) | 2023-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020024958A1 (zh) | 用于生成视频摘要的方法和系统 | |
CN111836118B (zh) | 视频处理方法、装置、服务器及存储介质 | |
CN110677718B (zh) | 一种视频识别方法和装置 | |
CN105718861A (zh) | 一种识别视频流数据类别的方法及装置 | |
CN110348358B (zh) | 一种肤色检测系统、方法、介质和计算设备 | |
WO2008150109A1 (en) | Method of processing moving picture and apparatus thereof | |
CN109413510A (zh) | 视频摘要生成方法和装置、电子设备、计算机存储介质 | |
CN114222179B (zh) | 虚拟形象视频合成方法及设备 | |
JP6917788B2 (ja) | 要約映像生成装置及びプログラム | |
CN116611491A (zh) | 目标检测模型的训练方法、装置、电子设备和存储介质 | |
CN113239855B (zh) | 一种视频检测方法、装置、电子设备以及存储介质 | |
JP5644505B2 (ja) | 照合加重情報抽出装置 | |
CN116137672A (zh) | 视频生成方法、装置、设备、存储介质及程序产品 | |
KR102217414B1 (ko) | 4d 영화 이펙트 자동 생성장치 | |
CN110708619B (zh) | 一种智能设备的词向量训练方法及装置 | |
CN116645513A (zh) | 水印提取方法、模型训练方法、装置、电子设备及介质 | |
CN113225488A (zh) | 一种视频处理方法、装置、电子设备及存储介质 | |
CN115423780A (zh) | 基于图像质量的关键帧提取方法、装置、电子设备及介质 | |
CN115310277A (zh) | 模型训练的方法、系统、设备及存储介质 | |
CN116152393A (zh) | 视频生成方法、装置、设备及存储介质 | |
CN112598074A (zh) | 图像处理方法及装置、计算机可读存储介质和电子设备 | |
CN113194333A (zh) | 视频剪辑方法、装置、设备及计算机可读存储介质 | |
CN106375769B (zh) | 图像特征搜索方法和装置、存储介质及处理器 | |
WO2019224947A1 (ja) | 学習装置、画像生成装置、学習方法、画像生成方法及びプログラム | |
JP2009049667A (ja) | 情報処理装置、その処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |