CN114339446A - 音视频编辑方法、装置、设备、存储介质及程序产品 - Google Patents

音视频编辑方法、装置、设备、存储介质及程序产品 Download PDF

Info

Publication number
CN114339446A
CN114339446A CN202111621666.5A CN202111621666A CN114339446A CN 114339446 A CN114339446 A CN 114339446A CN 202111621666 A CN202111621666 A CN 202111621666A CN 114339446 A CN114339446 A CN 114339446A
Authority
CN
China
Prior art keywords
fade
editing
edited
audio
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111621666.5A
Other languages
English (en)
Other versions
CN114339446B (zh
Inventor
刘桂华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202111621666.5A priority Critical patent/CN114339446B/zh
Publication of CN114339446A publication Critical patent/CN114339446A/zh
Application granted granted Critical
Publication of CN114339446B publication Critical patent/CN114339446B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本公开提供了一种音视频编辑方法、装置、电子设备、计算机可读存储介质及计算机程序产品,涉及多媒体数据、数据编辑等媒体云领域。该方法包括:根据音视频编辑请求确定待编辑素材和对待编辑素材的编辑方式;响应于编辑方式包括增加淡入/淡出特效,确定与待编辑素材对应的淡入/淡出步长;响应于编辑方式包括修改素材的播放倍速,确定与待编辑素材对应的设定播放倍速;按设定播放倍速和淡入/淡出步长对待编辑素材进行编辑,得到作为编辑结果的目标音视频。该方法通过先确定淡入/淡出步长、根据步长自行确定淡入/淡出特效的总时长,可以较好的适应对素材播放倍率的编辑需求,提升了音视频编辑的便捷性。

Description

音视频编辑方法、装置、设备、存储介质及程序产品
技术领域
本公开涉及数据处理技术领域,具体涉及多媒体数据、数据编辑等媒体云领域,尤其涉及一种音视频编辑方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术
随着电子信息技术的发展,在各式平台上观看各类视频已逐渐称为常见的获取信息和娱乐的方式。
区别于通过本地大型编辑工具对音视频素材进行编辑的方式,在线的非线性编辑工具可以通过浏览器为用户提供更加轻量级、更编辑的音视频编辑方式。
发明内容
本公开实施例提出了一种音视频编辑方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
第一方面,本公开实施例提出了一种音视频编辑方法,包括:根据音视频编辑请求确定待编辑素材和对待编辑素材的编辑方式;响应于编辑方式包括增加淡入/淡出特效,确定与待编辑素材对应的淡入/淡出步长;响应于编辑方式包括修改素材的播放倍速,确定与待编辑素材对应的设定播放倍速;按设定播放倍速和淡入/淡出步长对待编辑素材进行编辑,得到作为编辑结果的目标音视频;其中,按淡入/淡出步长呈现的淡入/淡出特效的实际时长受设定播放倍速的影响。
第二方面,本公开实施例提出了一种音视频编辑装置,包括:待编辑素材及编辑方式确定单元,被配置成根据音视频编辑请求确定待编辑素材和对待编辑素材的编辑方式;淡入/淡出步长确定单元,被配置成响应于编辑方式包括增加淡入/淡出特效,确定与待编辑素材对应的淡入/淡出步长;设定播放倍速确定单元,被配置成响应于编辑方式包括修改素材的播放倍速,确定与待编辑素材对应的设定播放倍速;音视频编辑单元,被配置成按设定播放倍速和淡入/淡出步长对待编辑素材进行编辑,得到作为编辑结果的目标音视频;其中,按淡入/淡出步长呈现的淡入/淡出特效的实际时长受设定播放倍速的影响。
第三方面,本公开实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现如第一方面中任一实现方式描述的音视频编辑方法。
第四方面,本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行时能够实现如第一方面中任一实现方式描述的音视频编辑方法。
第五方面,本公开实施例提供了一种包括计算机程序的计算机程序产品,该计算机程序在被处理器执行时能够实现如第一方面中任一实现方式描述的音视频编辑方法。
本公开提供了一种新的音视频编辑方式,为实现淡入/淡出特效,采用了先确定淡入/淡出步长、然后使淡入/淡出的总时长根据步长自行确定的方式,不仅规避了传统方式采用定时器来实现存在的各种问题,还可以较好的适应对素材播放倍率的调整,即按淡入/淡出步长呈现的淡入/淡出特效的实际时长将一并受到设定播放倍速的影响,提升了音视频编辑的便捷性。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开可以应用于其中的示例性系统架构;
图2为本公开实施例提供的一种音视频编辑方法的流程图;
图3为本公开实施例提供的一种淡入/淡出步长确定方法的流程图;
图4为本公开实施例提供的另一种淡入/淡出步长确定方法的流程图;
图5为本公开实施例提供的另一种音视频编辑方法的流程图;
图6为本公开实施例提供的一种音视频编辑装置的结构框图;
图7为本公开实施例提供的一种适用于执行音视频编辑方法的电子设备的结构示意图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
图1示出了可以应用本公开的音视频编辑方法、装置、电子设备及计算机可读存储介质的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103和服务器105上可以安装有各种用于实现两者之间进行信息通讯的应用,例如浏览器应用、文件传输类应用、即时通讯类应用等。
终端设备101、102、103和服务器105可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等;当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中,其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器;服务器为软件时,可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。
服务器105通过内置的各种应用可以提供各种服务,以可以为远端用户提供在线音视频编辑服务的音视频编辑类应用为例,服务器105在运行该音视频编辑类应用时可实现如下效果:首先,通过网络104接收终端设备101、102、103传入的音视频编辑请求;然后,根据该音视频编辑请求确定待编辑素材和对待编辑素材的编辑方式;接下来,当发现该编辑方式中包括增加淡入/淡出特效时,确定与待编辑素材对应的淡入/淡出步长;同时,当发现编辑方式中包括修改素材的播放倍速时,确定与待编辑素材对应的设定播放倍速;最后,按设定播放倍速和淡入/淡出步长对待编辑素材进行编辑,得到作为编辑结果的目标音视频;其中,按淡入/淡出步长呈现的淡入/淡出特效的实际时长受设定播放倍速的影响。
进一步的,服务器105还可以向终端设备101、102、103返回该目标音视频的下载地址。
需要指出的是,待编辑素材除可以从终端设备101、102、103通过网络104获取到之外,也可以通过各种方式预先存储在服务器105本地。因此,当服务器105检测到本地已经存储有这些数据时,可选择直接从本地获取这些数据,在此种情况下,示例性系统架构100也可以不包括终端设备101、102、103和网络104。
由于实现音视频素材的编辑需要占用较多的运算资源和较强的运算能力,因此本公开后续各实施例所提供的音视频编辑方法一般由拥有较强运算能力、较多运算资源的服务器105来执行,相应地,音视频编辑装置一般也设置于服务器105中。但同时也需要指出的是,在终端设备101、102、103也具有满足要求的运算能力和运算资源时,终端设备101、102、103也可以通过其上安装的音视频编辑类应用完成上述本交由服务器105做的各项运算,进而输出与服务器105同样的结果。尤其是在同时存在多种具有不同运算能力的终端设备的情况下,但音视频编辑类应用判断所在的终端设备拥有较强的运算能力和剩余较多的运算资源时,可以让终端设备来执行上述运算,从而适当减轻服务器105的运算压力,相应的,音视频编辑装置也可以设置于终端设备101、102、103中。在此种情况下,示例性系统架构100也可以不包括服务器105和网络104。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
请参考图2,图2为本公开实施例提供的一种音视频编辑方法的流程图,其中流程200包括以下步骤:
步骤201:根据音视频编辑请求确定待编辑素材和对待编辑素材的编辑方式;
本步骤旨在由音视频编辑方法的执行主体(例如图1所示的服务器105)确定作为编辑对象的待编辑素材,以及如何对待编辑素材进行编辑的编辑方式。具体的,待编辑素材和编辑方式可以从用户终端(例如图1所示的终端设备101、102、103)发来的音视频编辑请求中提取或解析得到。
其中,待编辑素材可以直接包含在音视频编辑请求中,也可以将能够获取到待编辑素材的网络地址或链接包含在音视频编辑请求中,另外,当没有明确指定待编辑素材时,也可以通过给出对素材的筛选标准、需求,以便上述执行主体在素材库中将满足要求的素材确定为待编辑素材。
步骤202:响应于编辑方式包括增加淡入/淡出特效,确定与待编辑素材对应的淡入/淡出步长;
在步骤201的基础上,本步骤旨在由上述执行主体根据包含于编辑方式中的增加淡入/淡出特效的需求,确定与待编辑素材对应的淡入/淡出步长。
其中,淡入/淡出步长可以具体拆分为:淡入步长和淡出步长,而淡入和淡出又可以根据素材类型再细分为:针对音频的淡入和淡出,和针对图像的淡入和淡出。
具体的,音频的淡入实际上指的是音量从起始值(通常为0分贝,在存在环境音时也可以为环境音的音量)增加至音频素材的实际音量的过程,音频的淡出实际上指的是音量从音频素材的实际音量逐渐减小至终止值(通常为0分贝,在存在环境音时也可以为环境音的音量)的过程;图像的淡入则实际上指的是画面从原画面(例如空白画面或全黑画面)逐渐过渡至图像素材的实际画面的过程,图像的淡出则实际上指的是画面从图像素材的实际画面逐渐过渡至终止画面(例如空白画面或全黑画面)的过程。
而淡入/淡出步长则指的是单位时间内音量的增加值/减小值和画面的透明度变化值,例如每40毫秒增加/减小3分贝,每50毫秒增加/减小20个单位的像素点色值等。
应当理解的是,淡入特效的起始参数和淡出特效的终止参数是明确的,因此在确定待编辑素材和淡入/淡出步长的情况下,淡入/淡出特效的实际时长将随之确定,且随待编辑素材的音量或图像的实际参数和所确定出的淡入/淡出步长动态的变化。
例如音视频编辑请求指示对一个音频素材添加淡出特效,已知该音频素材最后1秒的音量为72分贝,而确定出的淡出步长为每50毫秒减小9分贝,那么将音频素材将经过8次、均匀的音量递减,最终通过4秒的总长完成音频的淡出。
步骤203:响应于编辑方式包括修改素材的播放倍速,确定与待编辑素材对应的设定播放倍速;
在步骤201的基础上,本步骤在旨在由上述执行主体根据包含于编辑方式中的修改素材的播放倍速的需求,确定与待编辑素材对应的设定播放倍速。
本公开将不进行播放倍速修改的默认播放倍速称为正常播放倍速,以便于区别对播放倍速进行修改后的设定播放倍速。正常播放倍速通常被定义为“1.0”,而播放倍速的修改可简单分为两类:加速和减速,加速则是需要在相同的真实世界时间内完成更多素材内容的播放,以“1.25”倍速为例,原按照“1.0”正常播放倍速需要10分钟才能播放完的视频,此时将仅需要8分钟即可播放完成,也就是说在“1.25”倍速下,1分钟将播放原来需要1.25分钟才能播放完的视频内容。减速则正好相反,以“0.8”倍速为例,原按照“1.0”正常播放倍速需要10分钟就能播放完的视频,此时将需要12分钟才能播放完成。
步骤204:按设定播放倍速和淡入/淡出步长对待编辑素材进行编辑,得到作为编辑结果的目标音视频。
在步骤202和步骤203的基础上,本步骤旨在由上述执行主体同时根据设定播放倍速和淡入/淡出步长,来对待编辑素材进行编辑,以最终得到作为编辑结果的目标音视频。
应当理解的是,由于是采用先确定淡入/淡出步长、进而根据步长自行确定淡入/淡出特效总时长的方式,使得基于时间的实现方式可以很好的一同受到播放倍速调整的影响,进而使得对播放倍速的调整可以于增加的淡入/淡出特效并存。
本公开实施例提供的音视频编辑方法,提供了一种新的音视频编辑方式,为实现淡入/淡出特效,采用了先确定淡入/淡出步长、然后使淡入/淡出的总时长根据步长自行确定的方式,不仅规避了传统方式采用定时器来实现存在的各种问题,还可以较好的适应对素材播放倍率的调整,即按淡入/淡出步长呈现的淡入/淡出特效的实际时长将一并受到设定播放倍速的影响,提升了音视频编辑的便捷性。
为更好的理解步骤202确定出淡入/淡出步长的原理和方式,本实施例还通过图3和图4提供了两种不同的实现方式,分别从不同的考虑角度入手。其中,图3所示的流程300包括以下步骤:
步骤301:确定待编辑素材的总时长;
其中,该总时长为待编辑素材中素材本身的时长,而不包括淡入/淡出特效的部分。
步骤302:确定与总时长对应的淡入/淡出步长;
本实施例出于待编辑素材的淡入/淡出步长(即淡入/淡出特效部分)应当匹配于待编辑素材的素材总时长(即非淡入/淡出特效部分)的考虑,提供了上述方案。因为淡入/淡出步长的大小极大程度上决定了淡入/淡出特效的特效时长,若待编辑素材的素材总时长本身较短,那么其淡入/淡出步长的大小也不应使对应的特效时长的时长较长,而是应当匹配于素材总时长。例如当素材总时长为20秒时,应当结合素材的实际音量或实际画面像素点色值,将淡入/淡出步长设置在使特效时长不长于总时长的1/4的大小,以提供合理的特效观感。
区别于图3,图4所示的流程400包括以下步骤:
步骤401:确定待编辑素材的素材类型和内容类型;
其中,素材类型用于区分待编辑素材为纯音频素材、纯图像素材以及同时包含音频素材和图像素材的混合素材;内容类型则根据素材所表达的内容进行划分,以音频类素材为例,根据音频内容可以划分出:歌曲类、讲故事类、对话类等多种类型。
步骤402:确定与素材类型和内容类型对应的淡入/淡出步长;
本实施例出于待编辑素材的淡入/淡出步长应当匹配于素材类型和内容类型的考虑,提供了上述实现方案,以尽可能的结合素材类型和内容类型来全面的考虑淡入/淡出特效的施加效果,而不是无论何种素材都按照固定的淡入/淡出步长来实现淡入/淡出特效。
在上述任意实施例的基础上,考虑到有些场景下,设定播放倍速的作用对象主要为待编辑素材的素材主体部分,而并不是在开始或结束部分施加的淡入/淡出特效部分。出于这种考虑,本实施例还通过图5提供了另一种音视频编辑方法,流程500包括如下步骤:
步骤501:确定设定播放倍速与正常播放倍速间的播放倍速差;
假定设定播放倍速为“1.25”,那么其与“1.0”的正常播放倍速间的播放倍速差为+0.25(区别于“-0.25”)。
步骤502:根据播放倍速差确定淡入/淡出特效的受播放倍速影响程度;
出于设定播放倍速的作用对象主要为待编辑素材的素材主体部分的考虑,针对淡入/淡出特效部分的受播放倍速影响程度通常与播放倍速差称反比,即播放倍速差与正常播放倍速的差别越大(指播放倍速差的绝对值),受播放倍速影响程度就越小,从而突出播放倍速调整的对象。
例如当设定播放倍速为“1.50”时,淡入/淡出特效的受播放倍速影响程度可以仅为“50%”,即原先“+0.5”倍的加速在针对淡入/淡出特效时仅产生一半的加速效果,即“+0.25”倍。
步骤503:响应于受播放倍速影响程度为不完全受影响,按设定播放倍速编辑待编辑素材的非淡入/淡出特效部分,得到对原始素材内容进行编辑后的第一编辑结果;
步骤504:按与受播放倍速影响程度对应的实际播放倍速,编辑待编辑素材的淡入/淡出特效部分,得到对特效部分进行编辑后的第二编辑结果;
针对受播放倍速影响程度为不完全受影响(即并未完全继承针对素材主体内容的播放倍速调整)的情况,上述执行主体旨在按设定播放倍速编辑待编辑素材的非淡入/淡出特效部分,得到对原始素材内容进行编辑后的第一编辑结果,而按与受播放倍速影响程度对应的实际播放倍速,编辑待编辑素材的淡入/淡出特效部分,得到对特效部分进行编辑后的第二编辑结果。即对素材主体部分和淡入/淡出特效部分采用了不同的播放倍速进行编辑。
步骤505:拼接第一编辑结果和第二编辑结果,得到目标音视频。
出于设定播放倍速的作用对象主要为待编辑素材的素材主体部分,而并不是在开始或结束部分施加的淡入/淡出特效部分的想法,本实施例通过步骤501-步骤505具体提供了一种实现方案,以对素材主体部分和淡入/淡出特效部分按不同的播放倍速进行编辑,以最终得到可凸显倍速调整重点的目标音视频。
在上述任意实施例的基础上,若预设时段的待编辑素材仅包括音频素材,为避免单纯的无图像画面给用户带来的不良视频观感,还可以利用语音识别技术确定音频素材的音频内容,并推送与音频内容匹配的图像素材,并向视频编辑者发起是否采用的问询,以自动生成既有音频又有图像的视频,从而提升用户的观感、提升视频的完播率。
为加深理解,本公开还结合一个具体应用场景,给出了一套完整、具体的实现方案,该应用场景下存在服务器A,服务器A为远端用户提供在线的音视频编辑服务:
1)用户X通过浏览器向提供在线音视频编辑服务的网站Y发送了音视频编辑请求;
2)服务器A作为网站Y的后端,从接收到的音视频编辑请求中提取出一个8秒的短视频素材、增加淡入特效的第一编辑需求、针对换装部分(4-6秒)的播放倍速调整为“0.8”倍;
3)服务器A通过读取该短视频素材上附加的标签得知,该短视频素材为自拍的换装短视频,并读取预先设定的视频内容与淡入步长的对应关系,将淡入步长设定为每25毫秒渐变20%(此时渐变的20%包括音量渐变和像素点色值渐变),并通过编辑得到淡入特效部分;
4)服务器A将短视频的4-6秒的播放倍速修改为“0.8”倍,并通过编辑得到正常速部分和慢速部分;
5)服务器A按淡入特效部分、1-4秒的正常速部分、4-6秒的慢速部分、6-8秒的正常速部分依次进行拼接,得到目标音视频;
6)服务器A将目标音视频的下载链接提供给用户X。
进一步参考图6,作为对上述各图所示方法的实现,本公开提供了一种音视频编辑装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例的音视频编辑装置600可以包括:待编辑素材及编辑方式确定单元601、淡入/淡出步长确定单元602、设定播放倍速确定单元603、音视频编辑单元604。其中,待编辑素材及编辑方式确定单元601,被配置成根据音视频编辑请求确定待编辑素材和对待编辑素材的编辑方式;淡入/淡出步长确定单元602,被配置成响应于编辑方式包括增加淡入/淡出特效,确定与待编辑素材对应的淡入/淡出步长;设定播放倍速确定单元603,被配置成响应于编辑方式包括修改素材的播放倍速,确定与待编辑素材对应的设定播放倍速;音视频编辑单元604,被配置成按设定播放倍速和淡入/淡出步长对待编辑素材进行编辑,得到作为编辑结果的目标音视频;其中,按淡入/淡出步长呈现的淡入/淡出特效的实际时长受设定播放倍速的影响。
在本实施例中,音视频编辑装置600中:待编辑素材及编辑方式确定单元601、淡入/淡出步长确定单元602、设定播放倍速确定单元603、音视频编辑单元604的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-204的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,淡入/淡出步长确定单元602可以被进一步配置成:
确定待编辑素材的总时长;
确定与总时长对应的淡入/淡出步长。
在本实施例的一些可选的实现方式中,淡入/淡出步长确定单元602可以被进一步配置成:
确定待编辑素材的素材类型和内容类型;
确定与素材类型和内容类型对应的淡入/淡出步长。
在本实施例的一些可选的实现方式中,音视频编辑装置600还可以包括:
播放倍速差确定单元,被配置成确定设定播放倍速与正常播放倍速间的播放倍速差;
受播放倍速影响程度确定单元,被配置成根据播放倍速差确定淡入/淡出特效的受播放倍速影响程度;
对应的,音视频编辑单元604可以被进一步配置成:
响应于受播放倍速影响程度为不完全受影响,按设定播放倍速编辑待编辑素材的非淡入/淡出特效部分,得到对原始素材内容进行编辑后的第一编辑结果;
按与受播放倍速影响程度对应的实际播放倍速,编辑待编辑素材的淡入/淡出特效部分,得到对特效部分进行编辑后的第二编辑结果;
拼接第一编辑结果和第二编辑结果,得到目标音视频。
在本实施例的一些可选的实现方式中,音视频编辑装置600还可以包括:
音频内容识别单元,被配置成响应于预设时段的待编辑素材仅包括音频素材,利用语音识别技术确定音频素材的音频内容;
配图推送及采用问询单元,被配置成推送与音频内容匹配的图像素材,并发起采用问询。
本实施例作为对应于上述方法实施例的装置实施例存在,本实施例提供的音视频编辑装置,提供了一种新的音视频编辑方式,为实现淡入/淡出特效,采用了先确定淡入/淡出步长、然后使淡入/淡出的总时长根据步长自行确定的方式,不仅规避了传统方式采用定时器来实现存在的各种问题,还可以较好的适应对素材播放倍率的调整,即按淡入/淡出步长呈现的淡入/淡出特效的实际时长将一并受到设定播放倍速的影响,提升了音视频编辑的便捷性。
根据本公开的实施例,本公开还提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现上述任意实施例所描述的音视频编辑方法。
根据本公开的实施例,本公开还提供了一种可读存储介质,该可读存储介质存储有计算机指令,该计算机指令用于使计算机执行时能够实现上述任意实施例所描述的音视频编辑方法。
根据本公开的实施例,本公开还提供了一种计算机程序产品,该计算机程序在被处理器执行时能够实现上述任意实施例所描述的音视频编辑方法。
图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如音视频编辑方法。例如,在一些实施例中,音视频编辑方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的音视频编辑方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行音视频编辑方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(VPS,Virtual Private Server)服务中存在的管理难度大,业务扩展性弱的缺陷。
本公开实施例提供了一种新的音视频编辑方式,为实现淡入/淡出特效,采用了先确定淡入/淡出步长、然后使淡入/淡出的总时长根据步长自行确定的方式,不仅规避了传统方式采用定时器来实现存在的各种问题,还可以较好的适应对素材播放倍率的调整,即按淡入/淡出步长呈现的淡入/淡出特效的实际时长将一并受到设定播放倍速的影响,提升了音视频编辑的便捷性。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (13)

1.一种音视频编辑方法,包括:
根据音视频编辑请求确定待编辑素材和对所述待编辑素材的编辑方式;
响应于所述编辑方式包括增加淡入/淡出特效,确定与所述待编辑素材对应的淡入/淡出步长;
响应于所述编辑方式包括修改素材的播放倍速,确定与所述待编辑素材对应的设定播放倍速;
按所述设定播放倍速和所述淡入/淡出步长对所述待编辑素材进行编辑,得到作为编辑结果的目标音视频;其中,所述按所述淡入/淡出步长呈现的淡入/淡出特效的实际时长受所述设定播放倍速的影响。
2.根据权利要求1所述的方法,其中,所述确定与所述待编辑素材对应的淡入/淡出步长,包括:
确定所述待编辑素材的总时长;
确定与所述总时长对应的淡入/淡出步长。
3.根据权利要求1所述的方法,其中,所述确定与所述待编辑素材对应的淡入/淡出步长,包括:
确定所述待编辑素材的素材类型和内容类型;
确定与所述素材类型和所述内容类型对应的淡入/淡出步长。
4.根据权利要求1所述的方法,还包括:
确定所述设定播放倍速与正常播放倍速间的播放倍速差;
根据播放倍速差确定所述淡入/淡出特效的受播放倍速影响程度;
对应的,所述按所述设定播放倍速和所述淡入/淡出步长对所述待编辑素材进行编辑,得到作为编辑结果的目标音视频,包括:
响应于所述受播放倍速影响程度为不完全受影响,按所述设定播放倍速编辑所述待编辑素材的非所述淡入/淡出特效部分,得到对原始素材内容进行编辑后的第一编辑结果;
按与所述受播放倍速影响程度对应的实际播放倍速,编辑所述待编辑素材的淡入/淡出特效部分,得到对特效部分进行编辑后的第二编辑结果;
拼接所述第一编辑结果和所述第二编辑结果,得到所述目标音视频。
5.根据权利要求1-4任一项所述的方法,还包括:
响应于预设时段的待编辑素材仅包括音频素材,利用语音识别技术确定所述音频素材的音频内容;
推送与所述音频内容匹配的图像素材,并发起采用问询。
6.一种音视频编辑装置,包括:
待编辑素材及编辑方式确定单元,被配置成根据音视频编辑请求确定待编辑素材和对所述待编辑素材的编辑方式;
淡入/淡出步长确定单元,被配置成响应于所述编辑方式包括增加淡入/淡出特效,确定与所述待编辑素材对应的淡入/淡出步长;
设定播放倍速确定单元,被配置成响应于所述编辑方式包括修改素材的播放倍速,确定与所述待编辑素材对应的设定播放倍速;
音视频编辑单元,被配置成按所述设定播放倍速和所述淡入/淡出步长对所述待编辑素材进行编辑,得到作为编辑结果的目标音视频;其中,所述按所述淡入/淡出步长呈现的淡入/淡出特效的实际时长受所述设定播放倍速的影响。
7.根据权利要求6所述的装置,其中,所述淡入/淡出步长确定单元被进一步配置成:
确定所述待编辑素材的总时长;
确定与所述总时长对应的淡入/淡出步长。
8.根据权利要求6所述的装置,其中,所述淡入/淡出步长确定单元被进一步配置成:
确定所述待编辑素材的素材类型和内容类型;
确定与所述素材类型和所述内容类型对应的淡入/淡出步长。
9.根据权利要求6所述的装置,还包括:
播放倍速差确定单元,被配置成确定所述设定播放倍速与正常播放倍速间的播放倍速差;
受播放倍速影响程度确定单元,被配置成根据播放倍速差确定所述淡入/淡出特效的受播放倍速影响程度;
对应的,所述音视频编辑单元被进一步配置成:
响应于所述受播放倍速影响程度为不完全受影响,按所述设定播放倍速编辑所述待编辑素材的非所述淡入/淡出特效部分,得到对原始素材内容进行编辑后的第一编辑结果;
按与所述受播放倍速影响程度对应的实际播放倍速,编辑所述待编辑素材的淡入/淡出特效部分,得到对特效部分进行编辑后的第二编辑结果;
拼接所述第一编辑结果和所述第二编辑结果,得到所述目标音视频。
10.根据权利要求6-9任一项所述的装置,还包括:
音频内容识别单元,被配置成响应于预设时段的待编辑素材仅包括音频素材,利用语音识别技术确定所述音频素材的音频内容;
配图推送及采用问询单元,被配置成推送与所述音频内容匹配的图像素材,并发起采用问询。
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的音视频编辑方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的音视频编辑方法。
13.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1-5中任一项所述音视频编辑方法的步骤。
CN202111621666.5A 2021-12-28 2021-12-28 音视频编辑方法、装置、设备、存储介质及程序产品 Active CN114339446B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111621666.5A CN114339446B (zh) 2021-12-28 2021-12-28 音视频编辑方法、装置、设备、存储介质及程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111621666.5A CN114339446B (zh) 2021-12-28 2021-12-28 音视频编辑方法、装置、设备、存储介质及程序产品

Publications (2)

Publication Number Publication Date
CN114339446A true CN114339446A (zh) 2022-04-12
CN114339446B CN114339446B (zh) 2024-04-05

Family

ID=81015091

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111621666.5A Active CN114339446B (zh) 2021-12-28 2021-12-28 音视频编辑方法、装置、设备、存储介质及程序产品

Country Status (1)

Country Link
CN (1) CN114339446B (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101496090A (zh) * 2005-08-29 2009-07-29 索尼株式会社 盘写作中用于交互图形数据的特效
US20110011244A1 (en) * 2009-07-20 2011-01-20 Apple Inc. Adjusting a variable tempo of an audio file independent of a global tempo using a digital audio workstation
CN102314317A (zh) * 2011-09-09 2012-01-11 深圳市同洲电子股份有限公司 控制多媒体淡入淡出效果的方法和装置
US20120293636A1 (en) * 2011-05-19 2012-11-22 Comcast Cable Communications, Llc Automatic 3-Dimensional Z-Axis Settings
CN105959792A (zh) * 2016-04-28 2016-09-21 宇龙计算机通信科技(深圳)有限公司 播放控制方法、装置以及系统
CN106331824A (zh) * 2016-08-31 2017-01-11 杭州当虹科技有限公司 一种以可变速率播放流媒体视频文件的方法
CN108965397A (zh) * 2018-06-22 2018-12-07 中央电视台 云端视频编辑方法及装置、编辑设备及存储介质
CN110198486A (zh) * 2019-05-28 2019-09-03 上海哔哩哔哩科技有限公司 一种预览视频素材的方法、计算机设备及可读存储介质
CN110430450A (zh) * 2019-08-02 2019-11-08 北京奇艺世纪科技有限公司 一种视频定位的方法、装置及电子设备
CN110603537A (zh) * 2016-12-20 2019-12-20 时光机资本有限公司 增强的内容跟踪系统和方法
CN112514409A (zh) * 2018-07-19 2021-03-16 格雷斯诺特公司 基于控制信息修正替换内容的播放
CN112712815A (zh) * 2020-12-22 2021-04-27 努比亚技术有限公司 基于软件的pop音的抑制方法、终端以及计算机可读介质
CN113411669A (zh) * 2021-06-16 2021-09-17 浙江大华技术股份有限公司 一种视频特效处理方法及装置
CN113411674A (zh) * 2021-02-08 2021-09-17 腾讯科技(深圳)有限公司 视频的播放控制方法、装置、电子设备及存储介质
CN113709521A (zh) * 2021-09-18 2021-11-26 物芯智能科技有限公司 一种根据视频内容自动匹配背景的系统
CN113810783A (zh) * 2020-06-15 2021-12-17 腾讯科技(深圳)有限公司 一种富媒体文件处理方法、装置、计算机设备及存储介质

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101496090A (zh) * 2005-08-29 2009-07-29 索尼株式会社 盘写作中用于交互图形数据的特效
US20110011244A1 (en) * 2009-07-20 2011-01-20 Apple Inc. Adjusting a variable tempo of an audio file independent of a global tempo using a digital audio workstation
US20120293636A1 (en) * 2011-05-19 2012-11-22 Comcast Cable Communications, Llc Automatic 3-Dimensional Z-Axis Settings
CN102314317A (zh) * 2011-09-09 2012-01-11 深圳市同洲电子股份有限公司 控制多媒体淡入淡出效果的方法和装置
CN105959792A (zh) * 2016-04-28 2016-09-21 宇龙计算机通信科技(深圳)有限公司 播放控制方法、装置以及系统
WO2017185451A1 (zh) * 2016-04-28 2017-11-02 宇龙计算机通信科技(深圳)有限公司 播放控制方法、装置以及系统
CN106331824A (zh) * 2016-08-31 2017-01-11 杭州当虹科技有限公司 一种以可变速率播放流媒体视频文件的方法
CN110603537A (zh) * 2016-12-20 2019-12-20 时光机资本有限公司 增强的内容跟踪系统和方法
CN108965397A (zh) * 2018-06-22 2018-12-07 中央电视台 云端视频编辑方法及装置、编辑设备及存储介质
CN112514409A (zh) * 2018-07-19 2021-03-16 格雷斯诺特公司 基于控制信息修正替换内容的播放
CN110198486A (zh) * 2019-05-28 2019-09-03 上海哔哩哔哩科技有限公司 一种预览视频素材的方法、计算机设备及可读存储介质
CN110430450A (zh) * 2019-08-02 2019-11-08 北京奇艺世纪科技有限公司 一种视频定位的方法、装置及电子设备
CN113810783A (zh) * 2020-06-15 2021-12-17 腾讯科技(深圳)有限公司 一种富媒体文件处理方法、装置、计算机设备及存储介质
CN112712815A (zh) * 2020-12-22 2021-04-27 努比亚技术有限公司 基于软件的pop音的抑制方法、终端以及计算机可读介质
CN113411674A (zh) * 2021-02-08 2021-09-17 腾讯科技(深圳)有限公司 视频的播放控制方法、装置、电子设备及存储介质
CN113411669A (zh) * 2021-06-16 2021-09-17 浙江大华技术股份有限公司 一种视频特效处理方法及装置
CN113709521A (zh) * 2021-09-18 2021-11-26 物芯智能科技有限公司 一种根据视频内容自动匹配背景的系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
冯小燕;张丽莉;张梦思;白瑞娟;: "MOOC视频播放速度对认知加工影响的实验研究", 现代教育技术, no. 02 *
曹永冬 , 王小兵: "用Swish 2.0制作片头动画", 电子与电脑, no. 09 *

Also Published As

Publication number Publication date
CN114339446B (zh) 2024-04-05

Similar Documents

Publication Publication Date Title
EP4087258A1 (en) Method and apparatus for displaying live broadcast data, and device and storage medium
US11417341B2 (en) Method and system for processing comment information
CN112860944B (zh) 视频渲染方法、装置、设备、存储介质及计算机程序产品
EP3866481A1 (en) Audio/video switching method and apparatus, and computer device and readable storage medium
CN112866809B (zh) 视频处理方法、装置、电子设备及可读存储介质
CN113672748A (zh) 多媒体信息播放方法及装置
CN108052575A (zh) 文件扫描方法、设备及存储介质
CN112532785B (zh) 图像显示方法、装置、电子设备以及存储介质
CN114416012A (zh) 音频续播方法及装置
CN112929728A (zh) 一种视频渲染方法、装置、系统、电子设备及存储介质
CN114339446B (zh) 音视频编辑方法、装置、设备、存储介质及程序产品
CN113411661B (zh) 用于记录信息的方法、装置、设备、存储介质及程序产品
CN114125498A (zh) 视频数据处理方法、装置、设备以及存储介质
CN109859293B (zh) 用于安卓设备的动画多状态切换方法和装置
CN114153542A (zh) 投屏方法、装置、电子设备及计算机可读存储介质
CN107484006A (zh) 一种界面处理方法、机顶盒及存储介质
CN113923479A (zh) 音视频剪辑方法和装置
CN113923477A (zh) 视频处理方法、装置、电子设备以及存储介质
CN114071192A (zh) 信息获取方法、终端、服务器、电子设备以及存储介质
CN113852835A (zh) 直播音频处理方法、装置、电子设备以及存储介质
CN113556575A (zh) 用于压缩数据的方法、装置、设备、介质和产品
CN113873323A (zh) 视频播放方法、装置、电子设备和介质
CN113627363B (zh) 视频文件的处理方法、装置、设备以及存储介质
CN113490045B (zh) 针对直播视频的特效添加方法、装置、设备及存储介质
CN116980638A (zh) 视频弹幕生成方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant