CN113364999A - 视频生成方法、装置、电子设备及存储介质 - Google Patents

视频生成方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113364999A
CN113364999A CN202110605572.2A CN202110605572A CN113364999A CN 113364999 A CN113364999 A CN 113364999A CN 202110605572 A CN202110605572 A CN 202110605572A CN 113364999 A CN113364999 A CN 113364999A
Authority
CN
China
Prior art keywords
video
matching
segments
matched
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110605572.2A
Other languages
English (en)
Other versions
CN113364999B (zh
Inventor
叶小瑜
金梦
刘旭东
张梦馨
李�杰
王昊
赵俊
袁肇豪
钱立未
唐小辉
张宏伟
张玕
柳逸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202110605572.2A priority Critical patent/CN113364999B/zh
Publication of CN113364999A publication Critical patent/CN113364999A/zh
Application granted granted Critical
Publication of CN113364999B publication Critical patent/CN113364999B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/265Mixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本公开关于一种视频生成方法、装置、电子设备及存储介质。所述方法包括:通过获取用于视频生成的原始视频以及视频匹配素材;视频匹配素材包括多个匹配片段;响应于用于生成视频的触发指令,从原始视频中获取与各匹配片段匹配的视频片段,对多个视频片段进行拼接,生成候选视频;根据候选视频以及视频匹配素材生成目标视频,目标视频在播放过程中展示的视频画面与视频匹配素材相匹配。本公开相比于传统技术中需要对视频进行人工剪辑,通过匹配片段进行视频拼接的方式可以减少操作的繁琐性,从而提高视频生成的效率。

Description

视频生成方法、装置、电子设备及存储介质
技术领域
本公开涉及多媒体技术领域,尤其涉及一种视频生成方法、装置、电子设备及存储介质。
背景技术
随着多媒体技术的发展,出现了一种视频生成技术,通过对原始的视频素材进行裁剪,并加入与该原始视频素材内容相关的剪辑元素,例如文字或者配乐等,从而可以生成一个剪辑元素与原始视频素材高度相关的剪辑视频。
相关技术中,目前的视频生成都需要进行对原始的视频素材进行人工剪辑,并根据剪辑元素选择相适应的视频剪辑片段,因此,目前的视频生成方法,视频生成的效率较低。
发明内容
本公开提供一种视频生成方法、装置、电子设备及存储介质,以至少解决相关技术中视频生成效率较低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种视频生成方法,包括:
获取用于视频生成的原始视频以及视频匹配素材;所述视频匹配素材包括多个匹配片段;
响应于用于生成视频的触发指令,从所述原始视频中获取与各匹配片段匹配的视频片段,对多个视频片段进行拼接,生成候选视频;
根据所述候选视频以及所述视频匹配素材生成目标视频,所述目标视频在播放过程中展示的视频画面与视频匹配素材相匹配。
在一示例性实施例中,所述对多个视频片段进行拼接,包括:获取各匹配片段在所述多个匹配片段中的播放顺序;按照所述播放顺序,对所述各匹配片段匹配的视频片段进行拼接。
在一示例性实施例中,所述视频片段中对应有匹配标签;所述从所述原始视频中获取与各匹配片段匹配的视频片段,包括:获取各匹配片段的内容信息;根据所述内容信息,确定各匹配片段对应的素材标签;从所述原始视频中获取各匹配片段匹配的视频片段,该视频片段的匹配标签与该匹配片段的素材标签匹配。
在一示例性实施例中,所述视频匹配素材包括文本素材、音频素材中至少一种;所述根据所述候选视频以及所述视频匹配素材生成目标视频之后,还包括:获取所述文本素材和/或所述音频素材中各匹配片段对应的文字内容;响应于针对所述目标视频的播放指令,播放所述目标视频,并在展示的视频画面中,显示所述各匹配片段对应的文字内容。
在一示例性实施例中,所述对多个视频片段进行拼接,生成候选视频,包括:当所述匹配片段匹配有多个视频片段时,基于所述匹配片段匹配的多个视频片段,对所述各匹配片段匹配的视频片段进行拼接,生成多个候选视频;所述根据所述候选视频以及所述视频匹配素材生成目标视频,包括:根据所述多个候选视频以及所述视频匹配素材生成多个目标视频,展示所述多个目标视频。
在一示例性实施例中,所述展示所述多个目标视频之后,还包括:响应于针对所述多个目标视频的选择指令,展示针对选中的目标视频的编辑页面;基于所述编辑页面获取针对所述选中的目标视频配置的调整信息,在检测到针对所述选中的目标视频的调整指令时,响应于所述调整指令,根据所述调整信息对所述选中的目标视频的视频效果进行调节。
在一示例性实施例中,所述调整信息包括用于调节视频音量的音量调整信息、用于调节视频显示文字样式的文字样式调整信息的至少一种;所述响应于所述调整指令,根据所述调整信息对所述选中的目标视频的视频效果进行调节,包括:响应于所述调整指令,获取所述音量调整信息对应的目标音量,将所述目标视频的播放音量设置为所述目标音量;和/或响应于所述调整指令,获取所述文字样式调整信息对应的目标样式,将所述目标视频的文字展示样式调整为所述目标样式。
在一示例性实施例中,所述根据所述候选视频以及所述视频匹配素材生成目标视频,包括:获取用于生成所述目标视频的视频附加素材;根据所述候选视频、所述视频匹配素材以及所述视频附加素材生成所述目标视频。
根据本公开实施例的第二方面,提供一种视频生成装置,包括:
视频素材获取单元,被配置为执行获取用于视频生成的原始视频以及视频匹配素材;所述视频匹配素材包括多个匹配片段;
视频片段拼接单元,被配置为执行响应于用于生成视频的触发指令,从所述原始视频中获取与各匹配片段匹配的视频片段,对多个视频片段进行拼接,生成候选视频;
目标视频生成单元,被配置为执行根据所述候选视频以及所述视频匹配素材生成目标视频,所述目标视频在播放过程中展示的视频画面与视频匹配素材相匹配。
在一示例性实施例中,所述视频片段拼接单元,进一步被配置为执行获取各匹配片段在所述多个匹配片段中的播放顺序;按照所述播放顺序,对所述各匹配片段匹配的视频片段进行拼接。
在一示例性实施例中,所述视频片段中对应有匹配标签;所述视频片段拼接单元,进一步被配置为执行获取各匹配片段的内容信息;根据所述内容信息,确定各匹配片段对应的素材标签;从所述原始视频中获取各匹配片段匹配的视频片段,该视频片段的匹配标签与该匹配片段的素材标签匹配。
在一示例性实施例中,所述视频匹配素材包括文本素材、音频素材中至少一种;所述视频生成装置,还包括:文字内容显示单元,被配置为执行获取所述文本素材和/或所述音频素材中各匹配片段对应的文字内容;响应于针对所述目标视频的播放指令,播放所述目标视频,并在展示的视频画面中,显示所述各匹配片段对应的文字内容。
在一示例性实施例中,所述视频片段拼接单元,进一步被配置为执行当所述匹配片段匹配有多个视频片段时,基于所述匹配片段匹配的多个视频片段,对所述各匹配片段匹配的视频片段进行拼接,生成多个候选视频;所述目标视频生成单元,进一步被配置为执行根据所述多个候选视频以及所述视频匹配素材生成多个目标视频,展示所述多个目标视频。
在一示例性实施例中,所述视频生成装置,还包括:视频效果调节单元,被配置为执行响应于针对所述多个目标视频的选择指令,展示针对选中的目标视频的编辑页面;基于所述编辑页面获取针对所述选中的目标视频配置的调整信息,在检测到针对所述选中的目标视频的调整指令时,响应于所述调整指令,根据所述调整信息对所述选中的目标视频的视频效果进行调节。
在一示例性实施例中,所述调整信息包括用于调节视频音量的音量调整信息、用于调节视频显示文字样式的文字样式调整信息的至少一种;所述视频效果调节单元,进一步被配置为执行响应于所述调整指令,获取所述音量调整信息对应的目标音量,将所述目标视频的播放音量设置为所述目标音量;以及响应于所述调整指令,获取所述文字样式调整信息对应的目标样式,将所述目标视频的文字展示样式调整为所述目标样式。
在一示例性实施例中,所述目标视频生成单元,进一步被配置为执行获取用于生成所述目标视频的视频附加素材;根据所述候选视频、所述视频匹配素材以及所述视频附加素材生成所述目标视频。
根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面中任一项实施例所述的视频生成方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如第一方面中任一项实施例所述的视频生成方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面中任一项实施例所述的视频生成方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
通过获取用于视频生成的原始视频以及视频匹配素材;视频匹配素材包括多个匹配片段;响应于用于生成视频的触发指令,从原始视频中获取与各匹配片段匹配的视频片段,对多个视频片段进行拼接,生成候选视频;根据候选视频以及视频匹配素材生成目标视频,目标视频在播放过程中展示的视频画面与视频匹配素材相匹配。本公开通过从原始视频中得到与视频匹配素材中匹配片段对应的多个视频片段,并对多个视频片段进行拼接,得到候选视频,从而利用候选视频以及视频匹配素材生成目标视频,相比于传统技术中需要对视频进行人工剪辑,通过匹配片段进行视频拼接的方式可以减少操作的繁琐性,从而提高视频生成的效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种视频生成方法的流程图。
图2是根据一示例性实施例示出的对多个视频片段进行拼接的流程图。
图3是根据一示例性实施例示出的获取与各匹配片段匹配的视频片段的流程图。
图4是根据一示例性实施例示出的对选中的目标视频的视频效果进行调节的流程图。
图5是根据一示例性实施例示出的用户录入原始数据的界面示意图。
图6是根据一示例性实施例示出的用户对视频进行二次调整的界面示意图。
图7是根据一示例性实施例示出的一种视频生成装置的框图。
图8是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序,本公开所涉及的数据(包括但不限于用于展示的数据、分析的数据、制作素材的数据等),均为经用户授权或者经过各方充分授权的数据。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种视频生成方法的流程图,如图1所示,视频生成方法用于终端中,包括以下步骤。
在步骤S101中,终端获取用于视频生成的原始视频以及视频匹配素材;视频匹配素材包括多个匹配片段。
其中,终端可以是但不限于是各种安装有上述多媒体客户端的个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,原始视频指的是未经过剪辑加工处理的视频素材,而视频匹配素材则指的是用于实现与原始视频进行视频匹配的素材,可以是用于匹配的文字,音频或者配乐等等,该视频匹配素材可以包括多个片段,例如文字素材可以包括多个文字片段,音频素材则可以包括多个音频片段等等。具体来说,当用户需要生成某个视频时,首先可以将用于生成视频的素材上传至终端,该素材可以包括原始的视频素材,以及用于对原始的视频素材进行匹配的视频匹配素材。
在步骤S102中,终端响应于用于生成视频的触发指令,从原始视频中获取与各匹配片段匹配的视频片段,对多个视频片段进行拼接,生成候选视频。
视频片段是终端对原始视频进行剪切后得到的片段,终端在接收原始视频后,则可以对得到的原始视频进行剪切,从而得到多个视频片段,候选视频则指的是终端对剪切后的视频片段再次进行拼接后生成的视频。具体来说,当用户向终端上传视频素材后,可以通过点击在终端的显示页面中携带的某个触发控件的方式,触发用于生成视频的触发指令,终端则可以对该指令进行响应,从原始视频剪切的片段中,找到与视频匹配素材中每一个个匹配片段分别对应的视频片段,并对视频片段进行拼接,从而生成与视频匹配素材对应的候选视频。
在步骤S103中,终端根据候选视频以及视频匹配素材生成目标视频,目标视频在播放过程中展示的视频画面与视频匹配素材相匹配。
目标视频指的是终端对用于生成视频的触发指令进行响应,从而生成的视频,终端在对视频片段进行拼接得到候选视频后,则可以利用候选视频以及视频匹配素材生成最终的目标视频,使得该目标视频在播放过程中展示的视频画面,可以和视频匹配素材相匹配。例如:视频匹配素材可以是某段上传的音频,那么目标视频在在播放过程中展示的视频画面则可以和上传音频的音频内容匹配,而如果视频匹配素材为上传的某段配乐时,那么目标视频在在播放过程中展示的视频画面则可以和上传配乐的配乐风格或者节奏相匹配。
上述视频生成方法中,通过终端获取用于视频生成的原始视频以及视频匹配素材;视频匹配素材包括多个匹配片段;响应于用于生成视频的触发指令,从原始视频中获取与各匹配片段匹配的视频片段,对多个视频片段进行拼接,生成候选视频;根据候选视频以及视频匹配素材生成目标视频,目标视频在播放过程中展示的视频画面与视频匹配素材相匹配。本公开通过终端从未经剪辑的原始视频中得到与用于对原始视频的视频片段进行匹配的视频匹配素材中,如用于匹配的音乐或者文字等,得到视频匹配素材中各匹配片段对应的多个视频片段,可以是用于匹配的音乐中各音乐片段匹配的视频片段,或者是用于匹配的文字中各文字片段匹配的视频片段等等,并对多个视频片段进行拼接,得到候选视频,从而利用候选视频以及视频匹配素材生成目标视频,相比于传统技术中需要对视频进行人工剪辑,通过匹配片段进行视频拼接的方式可以减少操作的繁琐性,从而提高视频生成的效率。同时,利用视频匹配素材匹配原始视频的方式,进而拼接生成候选视频,可以提高生成的目标视频中视频内容与视频匹配素材之间的相关程度。
在一示例性实施例中,如图2所示,步骤S102可以进一步包括:
在步骤S201中,终端获取各匹配片段在多个匹配片段中的播放顺序。
播放顺序指的是每一个匹配片段在生成的目标视频中的顺序,由于视频匹配素材可以由多个匹配片段组成,该播放顺序可以是和每一个匹配片段在视频匹配素材的组成顺序相同。终端可以得到每一个匹配片段在视频匹配素材中的组成顺序,从而得到每一个匹配片段对应的播放顺序。
在步骤S202中,按照播放顺序,对各匹配片段匹配的视频片段进行拼接。
之后,终端则可以找到每一个匹配片段匹配的视频片段,并按照步骤S201中得到的播放顺序,将上述匹配的视频片段进行拼接,从而生成一段候选视频。
例如,视频匹配素材可以由匹配片段A、匹配片段B以及匹配片段C组成,其中视频匹配素材的组成顺序为匹配片段A到匹配片段B再到匹配片段C,那么播放顺序也可以设置为匹配片段A到匹配片段B再到匹配片段C的顺序。同时,原始视频剪切后得到的视频片段可以包括视频片段A、视频片段B、视频片段C以及视频片段D,并且匹配片段A匹配的视频片段可以是视频片段A,匹配片段B匹配的视频片段可以是视频片段B,匹配片段C匹配的视频片段可以是视频片段D,那么则可以按照视频片段A到视频片段B再到视频片段D的顺序,将上述视频片段进行拼接,得到候选视频。
本实施例中,终端可以按照视频匹配素材中各匹配片段的播放顺序,对匹配的视频片段进行拼接,从而可以保证生成的候选视频可以和视频匹配素材相匹配,提高生成的视频的连贯性以及视频素材与视频之间的相关性。
在一示例性实施例中,视频片段中对应有匹配标签,如图3所示,步骤S102可以进一步包括:
在步骤S301中,终端获取各匹配片段的内容信息;
在步骤S302中,终端根据内容信息,确定各匹配片段对应的素材标签。
其中,内容信息指的是每一个匹配片段描述的内容信息,例如视频匹配素材可以是某一段文字,那么内容信息则可以指的是组成该段文字的各种文字片段的内容,视频匹配素材也可以是一个音频文件,那么内容信息则可以是组成该音频文件的多个音频片段的音频内容。素材标签则指的是用于标注视频匹配素材中各匹配片段的标注信息,该标签则可以是终端根据匹配片段的内容信息识别得到。具体来说,终端可以读取每一个匹配片段对应的内容信息,并基于每一个匹配片段的内容信息,得到每一个匹配片段的素材标签。
在步骤S303中,终端从原始视频中获取各匹配片段匹配的视频片段,该视频片段的匹配标签与该匹配片段的素材标签匹配。
最后,终端则可以利用步骤S302中得到的每一个匹配片段对应的素材标签,与原始视频中剪切得到的视频片段对应的匹配标签进行匹配,该匹配标签可以是用于标注原始视频中各视频片段的标注信息,可以由用户针对上传的原始视频进行人工标注,也可以是终端通过类似机器识别等技术自动获取各视频片段的标注信息,从而终端可以将匹配标签与素材标签匹配的视频片段,作为该素材标签对应的匹配片段匹配的视频片段,进而实现从原始视频中得到每一个匹配片段匹配的视频片段。
上述实施例中,终端可以通过将视频片段对应的匹配标签,与匹配片段的素材标签之间进行匹配,实现了视频片段与匹配片段之间的匹配,从而可以提高视频片段与匹配片段之间匹配的效率以及匹配的准确性。
在一示例性实施例中,视频匹配素材包括文本素材、音频素材中至少一种;步骤S103之后,还可以包括:终端获取文本素材和/或音频素材中各匹配片段对应的文字内容;响应于针对目标视频的播放指令,播放所述目标视频,并在展示的视频画面中,显示各匹配片段对应的文字内容。
本实施例中,视频匹配素材可以是由文字组成的文本素材,也可以是某个录音文件或者配音文件组成的音频素材,在终端生成目标视频后,还可以得到该文字素材中各匹配片段,即文字片段对应的文字内容,或者该音频素材中每一个音频片段对应的文字内容,例如终端可以对音频素材中的每一个音频片段进行音频识别,从而得到每一个音频片段对应的文字内容。
之后,当用户需要对目标视频进行播放时,则可以对生成的目标视频触发相应的播放指令,例如用户可以在终端的显示界面上点击生成的目标视频对应的播放按钮,从而触发针对该目标视频的播放指令,终端则可以对播放指令进行响应,对目标视频进行播放,并且在视频播放展示的视频画面中,将匹配片段对应的文字内容按照匹配片段在视频播放进度中的相应位置上显示。例如匹配片段A对应的视频播放进度为播放进度A,那么在视频播放至播放进度A时,终端则可以将匹配片段A对应的文字内容进行显示,作为匹配片段A对应的字幕进行显示。
本实施例中,当视频匹配素材为文本素材或者音频素材时,终端还可以将视频匹配素材中各匹配片段的文字内容在播放的视频画面中展示,实现了在生成的目标视频中展示字幕的效果。
在一示例性实施例中,步骤S102可以进一步包括:当匹配片段匹配有多个视频片段时,终端基于匹配片段匹配的多个视频片段,对各匹配片段匹配的视频片段进行拼接,生成多个候选视频;步骤S103可以进一步包括:终端根据多个候选视频以及视频匹配素材生成多个目标视频,展示多个目标视频。
由于终端从原始视频中得到的视频片段可以是多个,因此有可能出现某一个匹配片段存在有多个与之匹配的视频片段,那么此时终端还可以基于得到的多个的视频片段,分别与其他匹配片段匹配的视频片段进行拼接,从而生成多个候选视频,之后,终端还可以根据生成的多个的候选视频,利用多个候选视频以及视频匹配素材生成多个目标视频,并在终端上将多个目标视频进行展示。
例如:原始视频中包含的视频片段可以包括:视频片段A、视频片段B、视频片段C以及视频片段D,如果视频匹配素材包括的匹配片段包括匹配片段A以及匹配片段B,且与匹配片段A匹配的视频片段为视频片段A以及视频片段B,与匹配片段B匹配的视频片段为视频片段C,那么终端则可以生成由视频片段A与视频片段C拼接而成的候选视频,以及生成由视频片段B与视频片段C拼接而成的候选视频。或者与匹配片段A匹配的视频片段为视频片段A以及视频片段B,与匹配片段B匹配的视频片段为视频片段C以及视频片段D,那么终端则可以生成由视频片段A与视频片段C拼接而成的候选视频、由视频片段A与视频片段D拼接而成的候选视频、由视频片段B与视频片段C拼接而成的候选视频,以及由视频片段B与视频片段D拼接而成的候选视频。
本实施例中,如果存在与匹配片段匹配的视频片段的数量为多个的情况,终端可以生成多个目标视频并展示,从而可以一次生成多个目标视频,进一步提高视频的生成效率。
在一示例性实施例中,如图4所示,终端展示多个目标视频之后,还可以包括:
在步骤S401中,终端响应于针对多个目标视频的选择指令,展示针对选中的目标视频的编辑页面。
其中,编辑页面是用于用户对视频的视频效果进行编辑的页面,当用户需要对生成的目标视频的视频效果进行编辑时,则可以通过打开该目标视频对应的编辑页面的方式,对视频效果进行调整。具体来说,用户可以通过终端首先对生成并展示的多个目标视频进行选择操作,可以是点击或者长按等方式,触发选择指令,终端则可以对该选择指令进行响应,找到该选择指令选中的目标视频,并在终端上展示选中的目标视频对应的编辑页面。
在步骤S402中,终端基于编辑页面获取针对选中的目标视频配置的调整信息,在检测到针对选中的目标视频的调整指令时,响应于调整指令,根据调整信息对选中的目标视频的视频效果进行调节。
之后,用户则可以在显示的编辑页面中录入针对选中的目标视频的视频配置的调整信息,录入完成后,则可以通过如点击确定按钮等方式触发相应的调整指令,终端则可以对该调整指令进行响应,利用录入的调整信息对选中的目标视频展示的视频效果进行调节。
本实施例中,用户还可以在终端生成目标视频后,对目标视频的视频效果进行调整,可以提高生成的目标视频的展示效果。
进一步地,调整信息包括用于调节视频音量的音量调整信息、用于调节视频显示文字样式的文字样式调整信息的至少一种;步骤S402可以进一步包括:响应于调整指令,终端获取音量调整信息对应的目标音量,将目标视频的播放音量设置为目标音量;和/或终端响应于调整指令,获取文字样式调整信息对应的目标样式,将目标视频的文字展示样式调整为目标样式。
音量调整信息是用于调整目标视频播放音量的调整信息,在终端生成目标视频后,用户还可以对视频的播放音量进行调整。具体来说,用户可以通过编辑页面将音量调整信息录入终端,并触发相应的调整指令后,终端则可以对该调整指令进行响应,将音量调整信息对应的音量大小作为目标音量,并将目标视频的播放音量设置为目标音量。
而文字样式调整信息则是用于调整目标视频显示文字的文字样式的调整信息。如果生成的目标视频中显示有文字,用户还可以对视频中显示文字的文字样式进行调整。具体来说,与音量调节的方式类似,用户可以通过编辑页面将文字样式调整信息录入终端,并触发调整指令,终端则可以将文字样式调整信息对应的文字样式作为目标样式,并将目标视频中显示文字的文字样式设置为目标样式。
本实施例中,用户可以对生成的目标视频的音量以及显示的文字样式进行调整,从而可以进一步提高生成的目标视频的展示效果。
在一示例性实施例中,步骤S103可以进一步包括:终端获取用于生成目标视频的视频附加素材;根据候选视频、视频匹配素材以及视频附加素材生成所述目标视频。
视频附加素材指的是用于改变生成的目标视频的视频效果的附加素材,例如可以包括用于设置视频显示封面的封面素材,用于播放视频背景音乐的背景音乐素材,用于视频宣传的宣传文案素材或者改变视频尾帧显示画面的尾帧素材等等,在用户生成目标视频之前,还可以将上述素材作为视频附加素材录入至终端中,终端在生成目标视频时,则可以读取上述视频附加素材,并利用候选视频、视频匹配素材以及视频附加素材生成目标视频。
本实施例中,用户还可以通过录入视频附加素材的方式,对生成的目标视频进行个性化的附加设置,从而可以提高生成视频的质量以及生成视频的多样性。
在一示例性实施例中,提供了一种智能剪辑批量生成视频的方法,该方法可以应用于将语音素材,或者,创意剧本等作为视频的脚本,把相关的原始素材做裁剪,重新拼接到一起,并添加字幕配音等元素从而生成的剪辑视频中。该方法基于产品的原始素材及语音内容,机器识别后智能剪辑,批量生成高质量的视频,如:宣传视频、广告视频等,视频中可以包括如下内容:
字幕\配音:可语音转文字或文字转语音,智能添加字幕、机器人声等。
素材剪辑:基于原始素材中,用户标注的标签及机器智能识别的元素标签,与语音内容对应的语音标签做匹配,智能选择和语音片段匹配的原始素材片段并对原始素材片段进行剪辑,生成与语音文案高相关度的视频。
宣传文案:用户可以设置宣传文案作为广告语,系统会自动套用多种样式搭配,常驻在视频中。
具体来说,本公开可以通过如下步骤实现:
1、用户录入原始数据,如图5所示,该过程可以包括:
上传原始素材:可编辑描述,也可通过机器智能识别;
选择生成视频的类型:系统剪辑时,会根据视频类型搭配背景音乐、剪辑策略;配音/字幕:用户可直接输入文本,系统可智能生成仿真人声语音;用户也可选择直接上传配音文件,系统可智能识别成字幕;
宣传文案:如可输入两行宣传文案;
其他设置:配乐、封面、尾帧。
2、用户点击【智能生成】,系统将批量生成视频,用户可以对视频进行二次调整,如图6所示,并对二次调整的内容实时预览:
音量调整;
字幕样式调整:可使用设计师配置好的样式,也可以自定义;
宣传文案样式调整。
应该理解的是,虽然图1-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-4中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
上述实施例中,基于机器识别、用户标注,把用户上传的原始素材与语音文案做匹配,实现了智能剪辑成多个高质量高相关性视频,语音文案支持人工输入,也支持语音转文字;配音支持文字智能生成语音,也支持用户自己上传,另外,通过智能配乐、添加特效,机器生成的视频还支持二次调整,能提高生产视频质量与多样性。
图7是根据一示例性实施例示出的一种视频生成装置的框图。参照图7,该装置包括视频素材获取单元701,视频片段拼接单元702和目标视频生成单元703。
视频素材获取单元701,被配置为执行获取用于视频生成的原始视频以及视频匹配素材;视频匹配素材包括多个匹配片段;
视频片段拼接单元702,被配置为执行响应于用于生成视频的触发指令,从原始视频中获取与各匹配片段匹配的视频片段,对多个视频片段进行拼接,生成候选视频;
目标视频生成单元703,被配置为执行根据候选视频以及视频匹配素材生成目标视频,目标视频在播放过程中展示的视频画面与视频匹配素材相匹配。
在一示例性实施例中,视频片段拼接单元702,进一步被配置为执行获取各匹配片段在多个匹配片段中的播放顺序;按照播放顺序,对各匹配片段匹配的视频片段进行拼接。
在一示例性实施例中,视频片段中对应有匹配标签;视频片段拼接单元702,进一步被配置为执行获取各匹配片段的内容信息;根据内容信息,确定各匹配片段对应的素材标签;从原始视频中获取各匹配片段匹配的视频片段,该视频片段的匹配标签与该匹配片段的素材标签匹配。
在一示例性实施例中,视频匹配素材包括文本素材、音频素材中至少一种;视频生成装置,还包括:文字内容显示单元,被配置为执行获取文本素材和/或音频素材中各匹配片段对应的文字内容;响应于针对目标视频的播放指令,播放所述目标视频,并在展示的视频画面中,显示各匹配片段对应的文字内容。
在一示例性实施例中,视频片段拼接单元,进一步被配置为执行当匹配片段匹配有多个视频片段时,基于匹配片段匹配的多个的视频片段,对各匹配片段匹配的视频片段进行拼接,生成多个候选视频;目标视频生成单元703,进一步被配置为执行根据多个候选视频以及视频匹配素材生成多个目标视频,展示多个目标视频。
在一示例性实施例中,视频生成装置,还包括:视频效果调节单元,被配置为执行响应于针对多个目标视频的选择指令,展示针对选中的目标视频的编辑页面;基于编辑页面获取针对选中的目标视频配置的调整信息,在检测到针对选中的目标视频的调整指令时,响应于调整指令,根据调整信息对选中的目标视频的视频效果进行调节。
在一示例性实施例中,调整信息包括用于调节视频音量的音量调整信息、用于调节视频显示文字样式的文字样式调整信息的至少一种;视频效果调节单元,进一步被配置为执行响应于调整指令,获取音量调整信息对应的目标音量,将目标视频的播放音量设置为目标音量;以及响应于调整指令,获取文字样式调整信息对应的目标样式,将目标视频的文字展示样式调整为目标样式。
在一示例性实施例中,目标视频生成单元703,进一步被配置为执行获取用于生成目标视频的视频附加素材;根据候选视频、视频匹配素材以及视频附加素材生成目标视频。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8是根据一示例性实施例示出的一种用于视频生成的设备800的框图。例如,设备800可以是移动电话、计算机、数字广播终端、消息收发设备、游戏控制台、平板设备、医疗设备、健身设备、个人数字助理等。
参照图8,设备800可以包括以下一个或多个组件:处理组件802、存储器804、电源组件806、多媒体组件808、音频组件810、输入/输出(I/O)的接口812、传感器组件814以及通信组件816。
处理组件802通常控制设备800的整体操作,诸如与显示、电话呼叫、数据通信、相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在设备800上操作的任何应用程序或方法的指令、联系人数据、电话簿数据、消息、图片、视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、快闪存储器、磁盘或光盘。
电源组件806为设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为设备800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为设备800的显示器和小键盘,传感器组件814还可以检测设备800或设备800一个组件的位置改变,用户与设备800接触的存在或不存在,设备800方位或加速/减速和设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器、陀螺仪传感器、磁传感器、压力传感器或温度传感器。
通信组件816被配置为便于设备800和其他设备之间有线或无线方式的通信。设备800可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器804,上述指令可由设备800的处理器820执行以完成上述方法。例如,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时上任一项实施例所述的视频生成方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种视频生成方法,其特征在于,包括:
获取用于视频生成的原始视频以及视频匹配素材;所述视频匹配素材包括多个匹配片段;
响应于用于生成视频的触发指令,从所述原始视频中获取与各匹配片段匹配的视频片段,对多个视频片段进行拼接,生成候选视频;
根据所述候选视频以及所述视频匹配素材生成目标视频,所述目标视频在播放过程中展示的视频画面与视频匹配素材相匹配。
2.根据权利要求1所述的方法,其特征在于,所述对多个视频片段进行拼接,包括:
获取各匹配片段在所述多个匹配片段中的播放顺序;
按照所述播放顺序,对所述各匹配片段匹配的视频片段进行拼接。
3.根据权利要求2所述的方法,其特征在于,所述视频片段中对应有匹配标签;
所述从所述原始视频中获取与各匹配片段匹配的视频片段,包括:
获取各匹配片段的内容信息;
根据所述内容信息,确定各匹配片段对应的素材标签;
从所述原始视频中获取各匹配片段匹配的视频片段,该视频片段的匹配标签与该匹配片段的素材标签匹配。
4.根据权利要求1所述的方法,其特征在于,所述视频匹配素材包括文本素材、音频素材中至少一种;
所述根据所述候选视频以及所述视频匹配素材生成目标视频之后,还包括:
获取所述文本素材和/或所述音频素材中各匹配片段对应的文字内容;
响应于针对所述目标视频的播放指令,播放所述目标视频,并在展示的视频画面中,显示所述各匹配片段对应的文字内容。
5.根据权利要求1所述的方法,其特征在于,所述对多个视频片段进行拼接,生成候选视频,包括:
当所述匹配片段匹配有多个视频片段时,基于所述匹配片段匹配的多个视频片段,对所述各匹配片段匹配的视频片段进行拼接,生成多个候选视频;
所述根据所述候选视频以及所述视频匹配素材生成目标视频,包括:
根据所述多个候选视频以及所述视频匹配素材生成多个目标视频,展示所述多个目标视频。
6.根据权利要求5所述的方法,其特征在于,所述展示所述多个目标视频之后,还包括:
响应于针对所述多个目标视频的选择指令,展示针对选中的目标视频的编辑页面;
基于所述编辑页面获取针对所述选中的目标视频配置的调整信息,在检测到针对所述选中的目标视频的调整指令时,响应于所述调整指令,根据所述调整信息对所述选中的目标视频的视频效果进行调节。
7.一种视频生成装置,其特征在于,包括:
视频素材获取单元,被配置为执行获取用于视频生成的原始视频以及视频匹配素材;所述视频匹配素材包括多个匹配片段;
视频片段拼接单元,被配置为执行响应于用于生成视频的触发指令,从所述原始视频中获取与各匹配片段匹配的视频片段,对多个视频片段进行拼接,生成候选视频;
目标视频生成单元,被配置为执行根据所述候选视频以及所述视频匹配素材生成目标视频,所述目标视频在播放过程中展示的视频画面与视频匹配素材相匹配。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的视频生成方法。
9.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至6中任一项所述的视频生成方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的视频生成方法。
CN202110605572.2A 2021-05-31 2021-05-31 视频生成方法、装置、电子设备及存储介质 Active CN113364999B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110605572.2A CN113364999B (zh) 2021-05-31 2021-05-31 视频生成方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110605572.2A CN113364999B (zh) 2021-05-31 2021-05-31 视频生成方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113364999A true CN113364999A (zh) 2021-09-07
CN113364999B CN113364999B (zh) 2022-12-27

Family

ID=77530623

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110605572.2A Active CN113364999B (zh) 2021-05-31 2021-05-31 视频生成方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113364999B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115460455A (zh) * 2022-09-06 2022-12-09 上海硬通网络科技有限公司 一种视频剪辑方法、装置、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080077866A1 (en) * 2006-09-20 2008-03-27 Adobe Systems Incorporated Media system with integrated clip views
CN109963166A (zh) * 2017-12-22 2019-07-02 上海全土豆文化传播有限公司 在线视频编辑方法和装置
CN111711855A (zh) * 2020-05-27 2020-09-25 北京奇艺世纪科技有限公司 视频生成方法及装置
CN112004163A (zh) * 2020-08-31 2020-11-27 北京市商汤科技开发有限公司 视频生成方法及装置、电子设备和存储介质
CN112541353A (zh) * 2020-12-24 2021-03-23 北京百度网讯科技有限公司 视频生成方法、装置、设备和介质
CN112579826A (zh) * 2020-12-07 2021-03-30 北京字节跳动网络技术有限公司 视频显示及处理方法、装置、系统、设备、介质
CN112822563A (zh) * 2019-11-15 2021-05-18 北京字节跳动网络技术有限公司 生成视频的方法、装置、电子设备和计算机可读介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080077866A1 (en) * 2006-09-20 2008-03-27 Adobe Systems Incorporated Media system with integrated clip views
CN109963166A (zh) * 2017-12-22 2019-07-02 上海全土豆文化传播有限公司 在线视频编辑方法和装置
CN112822563A (zh) * 2019-11-15 2021-05-18 北京字节跳动网络技术有限公司 生成视频的方法、装置、电子设备和计算机可读介质
CN111711855A (zh) * 2020-05-27 2020-09-25 北京奇艺世纪科技有限公司 视频生成方法及装置
CN112004163A (zh) * 2020-08-31 2020-11-27 北京市商汤科技开发有限公司 视频生成方法及装置、电子设备和存储介质
CN112579826A (zh) * 2020-12-07 2021-03-30 北京字节跳动网络技术有限公司 视频显示及处理方法、装置、系统、设备、介质
CN112541353A (zh) * 2020-12-24 2021-03-23 北京百度网讯科技有限公司 视频生成方法、装置、设备和介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115460455A (zh) * 2022-09-06 2022-12-09 上海硬通网络科技有限公司 一种视频剪辑方法、装置、设备及存储介质
CN115460455B (zh) * 2022-09-06 2024-02-09 上海硬通网络科技有限公司 一种视频剪辑方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN113364999B (zh) 2022-12-27

Similar Documents

Publication Publication Date Title
CN110929054B (zh) 多媒体信息应用界面显示方法及装置、终端、介质
CN109151537B (zh) 视频处理方法、装置、电子设备及存储介质
CN105845124B (zh) 音频处理方法及装置
CN109413478B (zh) 视频编辑方法、装置、电子设备及存储介质
CN110602394A (zh) 一种视频拍摄方法、装置及电子设备
WO2022160674A1 (zh) 用于作品编辑提示的方法和装置
CN110677734B (zh) 视频合成方法、装置、电子设备及存储介质
KR20160132808A (ko) 오디오정보식별방법 및 장치
US20220084313A1 (en) Video processing methods and apparatuses, electronic devices, storage mediums and computer programs
CN112738618B (zh) 视频录制方法、装置及电子设备
CN110636382A (zh) 在视频中添加可视对象的方法、装置、电子设备及存储介质
CN113411516B (zh) 视频处理方法、装置、电子设备及存储介质
CN111918131A (zh) 视频生成方法及装置
CN112543368A (zh) 视频处理方法、视频播放方法、装置及存储介质
CN110719530A (zh) 一种视频播放方法、装置、电子设备及存储介质
CN113111220A (zh) 视频处理方法、装置、设备、服务器及存储介质
CN111736746A (zh) 多媒体资源的处理方法、装置、电子设备及存储介质
CN113364999B (zh) 视频生成方法、装置、电子设备及存储介质
CN113988021A (zh) 内容互动方法、装置、电子设备及存储介质
CN113905192A (zh) 一种字幕编辑方法、装置、电子设备及存储介质
CN113157972A (zh) 视频封面文案的推荐方法、装置、电子设备及存储介质
CN112764636A (zh) 视频处理方法、装置、电子设备和计算机可读存储介质
CN117119260A (zh) 视频的控制处理方法及装置
CN112396675A (zh) 图像处理方法、装置及存储介质
CN113709571B (zh) 视频展示方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant