CN115734007A - 视频剪辑方法、装置、介质及视频处理系统 - Google Patents
视频剪辑方法、装置、介质及视频处理系统 Download PDFInfo
- Publication number
- CN115734007A CN115734007A CN202211159005.XA CN202211159005A CN115734007A CN 115734007 A CN115734007 A CN 115734007A CN 202211159005 A CN202211159005 A CN 202211159005A CN 115734007 A CN115734007 A CN 115734007A
- Authority
- CN
- China
- Prior art keywords
- video
- user
- face
- segments
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
Abstract
本申请公开了一种视频剪辑方法、装置、介质及视频处理系统,该方法首先对待剪辑视频进行分割得到多个视频段,确定用户在每个视频段中的拍摄效果,依据拍摄效果从多个视频段中确定候选视频段,最后依据用户对候选视频段的选取结果生成目标视频,能够降低对用户参与活动的视频进行剪辑的成本并提高剪辑效率。
Description
技术领域
本申请涉及视频处理技术领域,特别涉及一种视频剪辑方法、装置、介质及视频处理系统。
背景技术
随着网络带宽的提高和移动终端的普及,人们拍摄视频并上传到网络平台进行分享越来越方便,并且人们对这方面的需求也越来越多。通常,人们进行户外体育运动或游园观赏等娱乐活动的时候,会想得到自己在活动参与过程中的精彩视频集锦。
目前,视频锦集的生成通常需要专业制作团队进行制作,例如对游玩过程中进行跟拍的视频进行后期视频制作,这一方面会导致游客花费的经济成本较高,另一方面人工制作视频集锦的耗时较大,并且人工进行视频制作的效率较低。
需要说明的是,本背景技术部分中公开的信息仅用于理解本申请构思的背景技术,并且因此,它可以包含不构成现有技术的信息。
发明内容
本申请的第一个目的在于提出一种视频剪辑方法,能够降低对用户参与活动的视频进行剪辑的成本并提高剪辑效率。
本申请的第二个目的在于提出一种计算机可读存储介质。
本申请的第三个目的在于提出一种视频剪辑装置。
本申请的第四个目的在于提出一种视频处理系统。
为达上述目的,本申请第一方面实施例提出了一种视频剪辑方法,所述方法包括:对待剪辑视频进行分割得到多个视频段;确定用户在每个所述视频段中的拍摄效果;依据所述拍摄效果从所述多个视频段中确定候选视频段;依据用户对所述候选视频段的选取结果生成目标视频。
根据本申请实施例提出的视频剪辑方法,能够将用户在特定场地内进行人类活动(如娱乐活动)的视频进行剪辑,自动从完整视频挑选出拍摄效果较好的视频段供用户进行选择,并将用户选出的视频进行合成,最终得到用户活动视频的剪辑,过程中无需人工参与制作,提高了剪辑效率并降低了剪辑成本。
根据本申请的一个实施例,在对待剪辑视频进行分割得到多个视频段之前,所述方法还包括:通过视频采集设备自动对目标区域进行拍摄得到所述待剪辑视频。
根据本申请的一个实施例,对待剪辑视频进行分割得到多个视频段,包括:对所述待剪辑视频进行切片,得到传输流形式的多个视频文件。
根据本申请的一个实施例,在对所述待剪辑视频进行切片时,是按预设间隔时间对所述待剪辑视频进行切片。
根据本申请的一个实施例,确定用户在每个所述视频段中的拍摄效果,包括:对每个所述视频段进行抽帧采样,得到多个采样图像;对所述采样图像进行用户人脸识别;依据人脸识别的结果确定用户在每个所述视频段中的拍摄效果。
根据本申请的一个实施例,在对所述采样图像进行用户人脸识别之前,所述方法还包括:获取用户的人脸图像作为人脸识别的基准。
根据本申请的一个实施例,依据人脸识别的结果确定用户在每个所述视频段中的拍摄效果,包括:依据所述采样图像的人脸识别结果对所述视频段进行评分,得到所述视频段的分数,其中,所述人脸识别的识别项包括用户的人脸出现次数、人脸尺寸、人脸位置和人脸表情中的一项或多项;依据每个所述视频段的分数确定每个所述视频段中的拍摄效果。
根据本申请的一个实施例,依据用户对所述候选视频段的选取结果生成目标视频,包括:接收用户对所述候选视频段的选取结果确定兴趣视频段;接收用户对所述兴趣视频段之间的转场效果的选择结果;依据所述转场效果的选择结果对所述兴趣视频段进行拼接,得到目标视频。
为达上述目的,本申请第二方面实施例提出了一种计算机可读存储介质,所述计算机可读存储介质上存储有视频剪辑程序,该视频剪辑程序被处理器执行时实现如上述实施例中的视频剪辑方法。
为达上述目的,本申请第三方面实施例提出了一种视频剪辑装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的视频剪辑程序,所述处理器执行所述视频剪辑程序时,实现如上述实施例中的视频剪辑方法。
为达上述目的,本申请第四方面实施例提出了一种视频处理系统,包括:视频采集设备和流媒体服务器,所述视频采集设备用于对目标区域进行拍摄,并将拍摄得到的视频流传输至所述流媒体服务器,所述流媒体服务器依据接收到的视频流生成待剪辑视频,对所述待剪辑视频进行分割得到多个视频段,确定用户在每个所述视频段中的拍摄效果,依据所述拍摄效果从所述多个视频段中确定候选视频段,依据用户对所述候选视频段的选取结果生成目标视频。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
图1是本申请一个实施例的视频剪辑方法的流程示意图。
图2是本申请一个实施例的视频剪辑装置的结构框图。
图3是本申请一个实施例的视频处理系统的结构框图。
具体实施方式
下面详细描述本申请的实施例,下文描述的实施例的示例在附图中示出,其中相同或类似的标号自始至终表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的视频剪辑方法、装置、介质及视频处理系统。
请参阅图1,本申请实施例中的视频剪辑方法包括以下步骤100至步骤400。
S100,对待剪辑视频进行分割得到多个视频段。
待剪辑视频是对用户参与的活动场景进行拍摄后得到的视频流数据,该视频可以是用户自行拍摄得到的,例如用户参加游园观赏活动时的自拍视频,该视频也可以是由设置在特定活动场地且机位固定的摄像机拍摄得到的,例如设置在马拉松比赛赛道沿途的多个摄像机对特定赛道区域拍摄的视频,其中主要拍摄对象为参赛选手。同时,该视频可以是以用户为对象进行跟踪拍摄得到的,例如上述游园活动的自拍视频,该视频也可以是以特定活动场地为对象进行固定拍摄得到的,例如设置在露天音乐会会场的摄像机在音乐会过程中对会场拍摄的视频,其中主要拍摄对象为歌迷。
为了将视频制作成与用户关联度比较大且表现用户活动情况的效果较好的目标视频,因此先对待剪辑视频进行分割,将分割后得到的视频段作为剪辑的依据。具体的,在获取到待剪辑视频后,可以将待剪辑视频上传到流媒体服务器,由流媒体服务器对待剪辑视频进行视频分割。
S200,确定用户在每个视频段中的拍摄效果。
假设对待剪辑视频分割后得到多个视频段,则可能有的视频段中主要出现的是活动场地的背景物,有的视频段中主要出现的是其他人物对象,有的视频段因为光线不好因此画面较暗,还有的视频段中主要是用户在活动场地参与活动时的画面,因此,不同的视频段中对于不同用户来说拍摄效果可能是不同的。并且,待剪辑视频中出现的人物对象可能会有多个,这些人物对象均可以成为用户,例如预订了视频剪辑服务的人物对象即为用户,而没有预订视频剪辑服务的人物对象则不是用户。
例如某一视频段v的画面中出现了用户A和用户B,其中用户A距离镜头较近且画面内容为A的赏花画面,用户B距离镜头较远且画面内容为B的喝水画面,则用户A在视频段v中的拍摄效果较好,用户B在视频段v中的拍摄效果一般。若待剪辑视频中还出现了用户C,但视频段v的画面中未包含C,则用户C在视频段v中的拍摄效果较差。对于其他的视频段可依此类推确定出拍摄效果。
S300,依据拍摄效果从多个视频段中确定候选视频段。
具体的,在上述分割得到的多个视频段中,将拍摄效果最好的多个视频段选取出来作为候选视频段,在有多个用户时,候选视频段是区分用户的,不同用户的候选视频段可能不同。候选视频段是由程序和算法对所有视频段自动进行运算和处理后选取出来的,可以由流媒体服务器进行本步骤中的运算和处理以及步骤200中拍摄效果的确定。
S400,依据用户对候选视频段的选取结果生成目标视频。
在流媒体服务器选取出候选视频段后,可以通过手机APP或小程序或设置在活动场地处的自助服务机将关于用户的候选视频段展示给该用户,用户可以根据自己的审美或期望在这些候选视频段中选取出感兴趣的视频段,即兴趣视频段。具体的,用户可以在APP或小程序或自助服务机登陆服务界面,播放关于自身的候选视频段,从中选取处兴趣视频段。
在用户选取出兴趣视频段之后,通过对这些兴趣视频段进行合并得到关于该用户在活动场地参与活动的视频,即目标视频。具体的,手机APP或小程序或自助服务机可以将用户选取出的兴趣视频的ID信息上传至流媒体服务器,流媒体服务器依据ID信息从自身存储的候选视频段中识别出兴趣视频段,并对兴趣视频段进行合并。
下面以小型露天草原音乐节的视频剪辑为例进行说明。该音乐节会场外围设置有一台固定机位的摄像机,摄像区域为台下的观众区,观众区为参加音乐节的顾客的活动场所,共计五十人参加音乐节,节目包括有演唱者献唱、观众跟唱、观众跳舞等多个环节,在节目开始后,摄像机开始录制视频直到节目结束,共拍摄了两个小时,并实时将拍摄的视频流数据传输到流媒体服务器进行存储,得到时长为两小时的待剪辑视频。观众A和观众B在音乐节开始之前预订了视频剪辑服务,而观众C在音乐节结束之后要求提供视频剪辑服务,因此流媒体服务器会将待剪辑视频进行分割,每5秒分割一个视频段,得到720个视频段,然后分别对用户A、用户B和用户C在720个视频段的拍摄效果进行确定,其中对于该三个用户分别确定出的拍摄效果较好的候选视频段数量分别为68个、104个和77个,然后该三个用户分别通过手机观看对应自身的这些视频段,全都各自相应的视频段中选取出了15个兴趣视频段,将选取结果告知流媒体服务器,流媒体服务器分别将该三个用户选取的兴趣视频段进行合并,得到该三个用户在音乐节活动现场的视频锦集。
根据本申请实施例提出的视频剪辑方法,能够将用户在特定场地内进行人类活动(如娱乐活动)的视频进行剪辑,自动从完整视频挑选出拍摄效果较好的视频段供用户进行选择,并将用户选出的视频进行合成,最终得到用户活动视频的剪辑,过程中无需人工参与制作,提高了剪辑效率并降低了剪辑成本。
在一些实施例中,在步骤100的对待剪辑视频进行分割得到多个视频段之前,可以先通过视频采集设备自动对目标区域进行拍摄得到待剪辑视频。
继续以小型露天草原音乐节为例,由于潜在用户(观众和歌迷)的活动区域为会场的台下区域(台上为主持人和演唱者的活动区域),因此目标区域为会场台下区域,在目标区域的四周设置有多台摄像机,例如在目标区域的周向均布八个视频采集设备,从不同方向对目标区域进行视频采集,视频采集设备采用摄像机,摄像机的机位可以是固定的或者是随轨道移动的。通过八台摄像机自动对目标区域进行拍摄并实时向流媒体服务器传送八路视频流,流媒体服务器由此得到待剪辑视频。
可以理解的是,在采用多台摄像机进行拍摄时,每台摄像机采集的视频流数据的ID不同,例如各摄像机采用不同的Stream ID,以便于流媒体服务器能够区分不同摄像机上传的视频流数据并分别进行存储。
通过摄像机自动对目标区域进行拍摄,能够将所有潜在用户在目标区域中的活动表现完全录制下来,并且能够满足任一需求视频锦集服务的用户,针对具有需求的用户分别进行视频锦集的剪辑和制作,相比于预约专业的拍摄团队在游玩过程中进行跟拍来说,降低了用户成本,并且能够在参与活动的人数较多导致难以对同一活动内的多个用户的拍摄时,通过自动拍摄和自动剪辑来满足多个用户的视频锦集制作需求。
在一些实施例中,步骤100的对待剪辑视频进行分割得到多个视频段,具体可以包括以下步骤110。
S110,对待剪辑视频进行切片,得到传输流形式的多个视频文件。
传输流(Transport Stream,TS流)是将视频的多个组成部分按照它们之间的互相关系进行组织并加入各组成部分关系描述和视频组成信息,并进一步封装成传输包后的码流。因此在流媒体服务器开始接收到摄像机上传的视频流之后,接收到的视频流即为待剪辑视频,此时即可以开始实时将视频流转换为传输流并进行切片,在摄像机结束拍摄和上传后,流媒体服务器得到多个TS格式的视频文件。流媒体服务器也可以先对摄像机上传的视频流进行存储得到完整的待剪辑视频,并在摄像机结束拍摄和上传后,再对存储的待剪辑视频进行切片得到多个TS格式的视频文件。切片得到的视频文件可以被存储于流媒体服务器的存储模块中。通过将待剪辑视频转化成TS格式,以便于进行视频切片。
在一些实施例中,在步骤110中对待剪辑视频进行切片时,是按预设间隔时间对待剪辑视频进行切片。
预设间隔时间可以是3秒或者其他时间,因此每个通过切片得到的视频文件的时长不小于预设间隔时间。另外,可以将关键帧(I帧)作为每次进行切片时的首帧,例如从视频流的初始帧或上一次切片位置开始计时,在达到预设间隔时间后,开始确定下一个出现的关键帧的位置,当确定出该关键帧时,从该关键帧处进行切片,得到本次切片的视频段。
在一些实施例中,步骤200中确定用户在每个视频段中的拍摄效果,具体可以包括以下步骤210至步骤230。
S210,对每个视频段进行抽帧采样,得到多个采样图像。
假设视频分割后得到600个视频段,每个视频段时长均为5秒,其中每个视频段包含150帧的视频帧,则可以按照预设间隔帧数或者预设的间周期进行抽帧。预设间隔帧数可以设置为30帧或其他数量,则对任一视频段进行采样得到的采样图像为5个,共3000个;预设的间周期可以设置为1秒,则对任一视频段进行采样得到的采样图像同样为5个,共3000个。具体的,抽帧采样可以由流媒体服务器的中央处理器完成,中央处理器读取存储模块中的切片视频文件并通过FFMPEG命令进行抽帧,并将抽帧后得到的采样图像与相应的视频段进行关联和绑定,并将采样图像存储于存储模块中。
S220,对采样图像进行用户人脸识别。
对每个需求视频剪辑服务的用户分别进行采样图像的人脸识别,从中识别出用户的人脸和人脸的用户名称,其中,用户名称可以由姓名音频全拼加多位随机数组成。人脸识别的方式可以是,先进行人脸特征点提取,然后根据特征点对人脸进行对齐,从对齐后的人脸中提取人脸特征并与用户人脸进行特征值比对,从而从视频图像中截取出用户人脸区域。
假设有三个用户,则需要对3000个采样图像中的每个采样图像分别进行三个用户的人脸识别,从而得到每个采样图像的人脸识别结果,每个用户分别对应3000个识别结果。具体的,中央处理器可以将采样图像发送至流媒体服务器的人脸识别模块进行识别,并记录返回的识别结果,并将识别结果与相应的采样图像进行关联和绑定。
S230,依据人脸识别的结果确定用户在每个视频段中的拍摄效果。
每个视频段对应5个采样图像,因此对于一个用户来说,每个视频段对应5个识别结果。若视频段v1的5个识别结果中均包含有用户A的人脸,并且人脸占据了画面的主要部分,则对于用户A来说,视频段v1的拍摄效果较好;若视频段v2的5个识别结果中只有1个包含有用户A的人脸,并且人脸只占据了画面的很小部分,则对于用户A来说,视频段v2的拍摄效果较差;若视频段v2的5个识别结果中有4个包含有用户B的人脸,并且人脸占据了画面的主要部分,则对于用户B来说,视频段v2的拍摄效果较好;若视频段v3的5个识别结果中既未包含用户A的人脸也未包含用户B的人脸,则对于用户A和B来说,视频段v3的拍摄效果均较差。
在一些实施例中,在步骤220的对采样图像进行用户人脸识别,先获取用户的人脸图像作为人脸识别的基准。
若用户在音乐节开始之前预订了视频拍摄剪辑服务,则可以在音乐节开始之前就对预订服务的用户进行人脸采集,得到用户不同视角下的人脸图像,以便于在活动结束后进行人脸识别和比较。若用户在音乐节结束之后要求提供视频拍摄剪辑服务,则可以在音乐节结束之后自行上传人脸图像。具体的,用户可以通过自己的手机摄像头进行拍照并通过APP或小程序上传至人脸识别模块,也可以在活动现场通过自助服务机配备的摄像头进行拍照并由自助服务机自行上传至人脸识别模块。
在一些实施例中,步骤230中确定用户在每个视频段中的拍摄效果的方式,具体可以包括以下步骤231至步骤233。
S231,依据采样图像的人脸识别结果对视频段进行评分,得到视频段的分数,其中,人脸识别的识别项包括用户的人脸出现次数、人脸尺寸、人脸位置和人脸表情中的一项或多项。
人脸位置可以为从画面左上角作为坐标原点进行归一化的结果,人脸尺寸可以为归一化的长和宽,人脸表情可以包括微笑、恐惧、愤怒、悲伤和中性。
若视频段v1的5个识别结果中均包含有用户A的人脸,即人脸出现次数为5次,其中4次的人脸占据画面的占比相对较大、位于画面中心区域附近且表情为开心,则对于用户A来说,视频段v1的评分较高,拍摄效果较好;若视频段v1的5个识别结果中有3个包含有用户A的人脸,即人脸出现次数为3次,其中2次人脸占据画面的占比相对较大但均位于画面中心区域之外且表情为开心,则对于用户A来说,视频段v1的评分中等,拍摄效果一般;若视频段v1的5个识别结果中有2个包含有用户A的人脸,即人脸出现次数为2次,该2次人脸占据画面的占比相对较小且均位于画面中心区域之外且面无表情,则对于用户A来说,视频段v1的评分较低,拍摄效果较差。
S232,依据每个视频段的分数确定每个视频段中的拍摄效果。
分数越高,则视频段的拍摄效果越好,其中,对于一个视频段来说,在视频段包含的采样图像中,用户人脸出现次数越多,人脸尺寸越大,人脸越靠近画面中心区域,人脸表情越积极,则评分越高;用户人脸出现次数越少,人脸尺寸越小,人脸越靠近画面边缘区域,人脸表情越消极,则评分越低。
具体的,可以为人脸识别结果的所有识别项分配权重,例如在采用所有识别项进行评分时,人脸出现次数、人脸尺寸、人脸位置、人脸表情的权重依次为4、1、2、3,然后先对采样图像进行关于用户A的评分,例如得到每个识别项的评分分数,将评分分数乘以相应权重,得到用户A在采样图像的评分分数,依此类推得到一个视频段的所有采样图像的评分分数,然后将这些评分分数的平均值作为该视频段的分数。
在一些实施例中,步骤231中对视频段进行评分的方式,具体可以包括以下步骤:首先确定待剪辑视频包含所有采样图像中每个采样图像的人脸识别结果,然后对所有采样图像中各个识别项进行识别结果的统计,得到统计结果,之后依据统计结果为各识别项分配权重,最后依据权重和各识别项的识别结果对视频段进行评分。
具体的,人脸识别结果的识别项的权重可以在所有视频段的所有采样图像的人脸识别结果确定出来之后进行设置。例如,在待剪辑视频的所有3000个采样图像中进行用户A的人脸识别后,先不进行采样图像的评分,而是先对各识别项的识别结果数量进行统计。
以人脸识别次数为例,假设在所有的N(此时N=3000)个采样图像中,有n个采样图像中均被识别出包含有用户A的人脸,则人脸识别次数识别项的识别结果数量为n,若n与N的比值大于第一比例阈值(例如90%),则说明该用户的人脸会很大概率出现在采样图像中,因此无需重点关注是否有用户人脸出现,可以下调人脸出现次数的权重,相当于变相提高其他识别项的权重。
对于人脸尺寸,可以设置第二尺寸阈值和第二比例阈值,并统计人脸尺寸大于第二尺寸阈值的采样图像数量,第二尺寸阈值可以设置为采样图像面积的八分之一,若人脸尺寸大于第二尺寸阈值的采样图像数量m2与n的比值大于第二比例阈值(例如70%),则说明人脸在图像中的占据面积普遍较大,因此无需重点关注人脸尺寸,可以下调人脸尺寸的权重。其中,人脸尺寸识别项的识别结果数量为m2。
对于人脸位置,可以设置中心区域和第三比例阈值,并统计人脸位置位于中心区域的采样图像数量,中心区域可以设置为位于采样图像中心的面积为采样图像面积三分之一的长方形区域,若人脸位置完全位于中心区域的采样图像数量m3与n的比值大于第三比例阈值(例如70%),则说明人脸在图像中的出现位置普遍靠近中心位置,因此无需重点关注人脸位置,可以下调人脸位置的权重。其中,人脸位置识别项的识别结果数量为m3。
对于人脸表情,可以设置第四比例阈值,并统计各类不同人脸表情的对应的采样图像数量,人脸表情的种类可以分为积极、中性和消极,例如笑容表情为积极表情,无表情为中性表情,皱眉表情为消极表情,若积极的人脸表情对应的采样图像数量m4与n的比值大于第四比例阈值(例如80%),则说明用户大部分时候均展现出积极表情,因此无需重点关注人脸表情,可以下调人脸表情的权重。其中,人脸表情识别项的识别结果数量为m4。
上述四个识别项的权重在下调时可以从一个默认权重开始下调,而默认权重可以预设为上述的4、1、2、3权重分配。同时,采样图像数量之间的比值超出相应的比例阈值越多,则可以将相应识别项的权重下调的越多。
假设通过对上述四个识别项的识别结果数量进行统计后,发现n与N的比值大于第一比例阈值,且m4与n的比值大于第四比例阈值,则四个识别项的权重可以从上述的4、1、2、3被调整为2、1、2、2。
确定出各识别项的权重后,将各视频段包含的采样图像的识别项识别结果与权重相乘,得到各视频段的评分。例如视频段v1包含的5个采样图像中,用户A的人脸识别次数为5次,人脸尺寸大于第二尺寸阈值的次数为3次,人脸位置位于中心区域的次数为2次,人脸表情为积极表情的次数为3次,则视频段v1的评分为:2*5+1*3+2*2+2*3=23。评分最高的多个视频段即为确定出的候选视频段,具体可以将评分最高的前W个视频段作为候选视频段,其中W为预设数量阈值,也可以将评分高于G的视频段作为候选视频段,其中G为预设分数阈值。
通过对权重进行调节,使得候选视频段的选取更加合理,选取出的视频段包含的内容画面的表现效果更好,给用户提供更加能够符合用户期望的视频段。
在一些实施例中,步骤400中生成目标视频的方式,具体可以包括以下步骤410至步骤430。
S510,接收用户对候选视频段的选取结果确定兴趣视频段。
S520,接收用户对兴趣视频段之间的转场效果的选择结果。
S530,依据转场效果的选择结果对兴趣视频段进行拼接,得到目标视频。
在确定出的多个候选视频段后,可以通过手机APP或小程序向用户发出提示,指示用户访问流媒体服务器查看各候选视频段,从点选其中心仪的候选视频段,同时还未用户提供了多种不同的转场特效,使得用户能够按照自身的期望来定制视频段的衔接样式,之后流媒体服务器会按照用户指定的转场特效生成用户在参加音乐节时的视频锦集。可以理解的是,用户也可以通过自助服务机对候选视频段进行浏览和选取,自助服务机包含交互显示单元,用于供用户进行交互操作以及对视频的显示。
另外,本申请的实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有视频剪辑程序,该视频剪辑程序被处理器执行时实现如上述实施例中的视频剪辑方法。
根据本申请实施例提出的计算机可读存储介质,能够将用户在特定场地内进行人类活动(如娱乐活动)的视频进行剪辑,自动从完整视频挑选出拍摄效果较好的视频段供用户进行选择,并将用户选出的视频进行合成,最终得到用户活动视频的剪辑,过程中无需人工参与制作,提高了剪辑效率并降低了剪辑成本。
另外,请参阅图2,本申请实施例还提出了一种视频剪辑装置10,包括存储器11、处理器12及存储在存储器11上并可在处理器12上运行的视频剪辑程序,处理器12执行视频剪辑程序时,实现如本申请实施例中的视频剪辑方法。
根据本申请实施例提出的视频剪辑装置,能够将用户在特定场地内进行人类活动(如娱乐活动)的视频进行剪辑,自动从完整视频挑选出拍摄效果较好的视频段供用户进行选择,并将用户选出的视频进行合成,最终得到用户活动视频的剪辑,过程中无需人工参与制作,提高了剪辑效率并降低了剪辑成本。
另外,请参阅图3,本申请实施例还提出了一种视频处理系统20,包括视频采集设备21和流媒体服务器22,视频采集设备21用于对目标区域进行拍摄,并将拍摄得到的视频流传输至流媒体服务器22,视频采集设备21可以采用摄像机。流媒体服务器22依据接收到的视频流生成待剪辑视频,对待剪辑视频进行分割得到多个视频段,确定用户在每个视频段中的拍摄效果,依据拍摄效果从多个视频段中确定候选视频段,依据用户对候选视频段的选取结果生成目标视频。
根据本申请实施例提出的视频处理系统,能够将用户在特定场地内进行人类活动(如娱乐活动)的视频进行剪辑,自动从完整视频挑选出拍摄效果较好的视频段供用户进行选择,并将用户选出的视频进行合成,最终得到用户活动视频的剪辑,过程中无需人工参与制作,提高了剪辑效率并降低了剪辑成本。
在一些实施例中,视频采集设备21自动对目标区域进行拍摄得到待剪辑视频。可以理解的是,在采用多个视频采集设备21进行拍摄时,每个视频采集设备21采集的视频流数据的ID不同,以便于流媒体服务器22能够区分不同视频采集设备21上传的视频流数据并通过存储模块分别进行存储。
在一些实施例中,流媒体服务器22对待剪辑视频进行分割得到多个视频段的方式,具体可以包括:对待剪辑视频进行切片,得到传输流形式的多个视频文件。
可以理解的是,流媒体服务器22在进行视频分割时,会将分割后得到的视频文件存入默认配置的切片目录,若有多个视频采集设备21上传视频流,则会配置相应数量的多个切片目录来分别存放各视频采集设备21的视频文件。由于流媒体服务器22主要用于播放实时数据(例如实况转播),因此在数据队列中,新缓存入队列数据会导致之前缓存只队列的数据被丢弃,从而减小对存储方面的要求,因此若数据队列的缓存空间较小,则可以在视频文件存入默认配置的视频目录后,立即将这些视频文件转存至另外的目录下,例如转存至切片根目录下,避免视频文件被丢弃和删除。
在一些实施例中,流媒体服务器22在对待剪辑视频进行切片时,是按预设间隔时间对待剪辑视频进行切片。
在一些实施例中,流媒体服务器22确定用户在每个视频段中的拍摄效果的方式,具体可以包括:对每个视频段进行抽帧采样,得到多个采样图像;通过流媒体服务器22的人脸识别模块对采样图像进行用户人脸识别;依据人脸识别的结果确定用户在每个视频段中的拍摄效果。
可以理解的是,流媒体服务器22在进行抽帧时,会将得到的采样图片存储在图片目录下,供人脸识别时使用。
在一些实施例中,在流媒体服务器22对采样图像进行用户人脸识别之前,先获取用户的人脸图像作为人脸识别的基准。
在一些实施例中,流媒体服务器22依据人脸识别的结果确定用户在每个视频段中的拍摄效果的方式,具体可以包括:依据采样图像的人脸识别结果对视频段进行评分,得到视频段的分数,其中,人脸识别的识别项包括用户的人脸出现次数、人脸尺寸、人脸位置和人脸表情中的一项或多项;依据每个视频段的分数确定每个视频段中的拍摄效果。
在一些实施例中,流媒体服务器22对视频段进行评分的方式,具体可以包括以下步骤:首先确定待剪辑视频包含所有采样图像中每个采样图像的人脸识别结果,然后对所有采样图像中各个识别项进行识别结果的统计,得到统计结果,之后依据统计结果为各识别项分配权重,最后依据权重和各识别项的识别结果对视频段进行评分。
在一些实施例中,流媒体服务器22依据用户对候选视频段的选取结果生成目标视频的方式,具体可以包括:接收用户对候选视频段的选取结果确定兴趣视频段;接收用户对兴趣视频段之间的转场效果的选择结果;依据转场效果的选择结果对兴趣视频段进行拼接,得到目标视频。
具体的,用户在开始选择候选视频段时,首先登陆选择界面,预览候选视频段,然后选取候选视频段,再选择转场特效,以便于让视频段的拼接点之间更平滑,比如选择淡入淡出效果。然后流媒体服务器22通过转场特效进行视频段拼接,生成新的视频。之后用户还可以对生成的新视频进行预览,若确认对该视频满意,则流媒体服务器22可以将该视频发送给用户,用户可以对该视频剪辑进行下载,若对该视频不满意,则可以返回并重新选取视频段和转场特效。
需要说明的是,本申请实施例的视频处理系统的实施例中未披露的细节,请参照本申请实施例中的视频剪辑方法实施例所披露的细节,此处不再赘述。
需要说明的是,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备以及计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。
Claims (11)
1.一种视频剪辑方法,其特征在于,所述方法包括:
对待剪辑视频进行分割得到多个视频段;
确定用户在每个所述视频段中的拍摄效果;
依据所述拍摄效果从所述多个视频段中确定候选视频段;
依据用户对所述候选视频段的选取结果生成目标视频。
2.根据权利要求1所述的方法,其特征在于,在对待剪辑视频进行分割得到多个视频段之前,所述方法还包括:
通过视频采集设备自动对目标区域进行拍摄得到所述待剪辑视频。
3.根据权利要求1所述的方法,其特征在于,对待剪辑视频进行分割得到多个视频段,包括:
对所述待剪辑视频进行切片,得到传输流形式的多个视频文件。
4.根据权利要求3所述的方法,其特征在于,在对所述待剪辑视频进行切片时,是按预设间隔时间对所述待剪辑视频进行切片。
5.根据权利要求1或3或4所述的方法,其特征在于,确定用户在每个所述视频段中的拍摄效果,包括:
对每个所述视频段进行抽帧采样,得到多个采样图像;
对所述采样图像进行用户人脸识别;
依据人脸识别的结果确定用户在每个所述视频段中的拍摄效果。
6.根据权利要求5所述的方法,其特征在于,在对所述采样图像进行用户人脸识别之前,所述方法还包括:
获取用户的人脸图像作为人脸识别的基准。
7.根据权利要求5所述的方法,其特征在于,依据人脸识别的结果确定用户在每个所述视频段中的拍摄效果,包括:
依据所述采样图像的人脸识别结果对所述视频段进行评分,得到所述视频段的分数,其中,所述人脸识别的识别项包括用户的人脸出现次数、人脸尺寸、人脸位置和人脸表情中的一项或多项;
依据每个所述视频段的分数确定每个所述视频段中的拍摄效果。
8.根据权利要求1所述的方法,其特征在于,依据用户对所述候选视频段的选取结果生成目标视频,包括:
接收用户对所述候选视频段的选取结果确定兴趣视频段;
接收用户对所述兴趣视频段之间的转场效果的选择结果;
依据所述转场效果的选择结果对所述兴趣视频段进行拼接,得到目标视频。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有视频剪辑程序,该视频剪辑程序被处理器执行时实现如权利要求1-8中任一项所述的视频剪辑方法。
10.一种视频剪辑装置,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的视频剪辑程序,所述处理器执行所述视频剪辑程序时,实现如权利要求1-8中任一项所述的视频剪辑方法。
11.一种视频处理系统,其特征在于,包括:视频采集设备和流媒体服务器,所述视频采集设备用于对目标区域进行拍摄,并将拍摄得到的视频流传输至所述流媒体服务器,所述流媒体服务器依据接收到的视频流生成待剪辑视频,对所述待剪辑视频进行分割得到多个视频段,确定用户在每个所述视频段中的拍摄效果,依据所述拍摄效果从所述多个视频段中确定候选视频段,依据用户对所述候选视频段的选取结果生成目标视频。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211159005.XA CN115734007B (zh) | 2022-09-22 | 2022-09-22 | 视频剪辑方法、装置、介质及视频处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211159005.XA CN115734007B (zh) | 2022-09-22 | 2022-09-22 | 视频剪辑方法、装置、介质及视频处理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115734007A true CN115734007A (zh) | 2023-03-03 |
CN115734007B CN115734007B (zh) | 2023-09-01 |
Family
ID=85293270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211159005.XA Active CN115734007B (zh) | 2022-09-22 | 2022-09-22 | 视频剪辑方法、装置、介质及视频处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115734007B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116543796A (zh) * | 2023-07-06 | 2023-08-04 | 腾讯科技(深圳)有限公司 | 一种音频处理方法、装置及计算机设备、存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050254782A1 (en) * | 2004-05-14 | 2005-11-17 | Shu-Fang Hsu | Method and device of editing video data |
CN109819338A (zh) * | 2019-02-22 | 2019-05-28 | 深圳岚锋创视网络科技有限公司 | 一种视频自动剪辑方法、装置及便携式终端 |
CN109889920A (zh) * | 2019-04-16 | 2019-06-14 | 威比网络科技(上海)有限公司 | 网络课程视频剪辑方法、系统、设备及存储介质 |
CN110996169A (zh) * | 2019-07-12 | 2020-04-10 | 北京达佳互联信息技术有限公司 | 剪辑视频的方法、装置、电子设备及计算机可读存储介质 |
CN111614899A (zh) * | 2020-05-15 | 2020-09-01 | 高斯贝尔数码科技股份有限公司 | 一种基于人脸识别的定制化视频内容产生方法和系统 |
CN112347941A (zh) * | 2020-11-09 | 2021-02-09 | 南京紫金体育产业股份有限公司 | 基于5g mec的运动视频集锦智能生成和分发方法 |
CN112445935A (zh) * | 2020-11-25 | 2021-03-05 | 开望(杭州)科技有限公司 | 一种基于内容分析的视频精选合集的自动生成方法 |
CN113822136A (zh) * | 2021-07-22 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 视频素材图像的选择方法、装置、设备及存储介质 |
CN114780795A (zh) * | 2022-05-07 | 2022-07-22 | 济南博观智能科技有限公司 | 一种视频素材筛选方法、装置、设备及介质 |
CN114897749A (zh) * | 2022-04-01 | 2022-08-12 | 南京苏艾科软件技术有限公司 | 一种基于高清摄像头采集的小视频自动制作方法 |
-
2022
- 2022-09-22 CN CN202211159005.XA patent/CN115734007B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050254782A1 (en) * | 2004-05-14 | 2005-11-17 | Shu-Fang Hsu | Method and device of editing video data |
CN109819338A (zh) * | 2019-02-22 | 2019-05-28 | 深圳岚锋创视网络科技有限公司 | 一种视频自动剪辑方法、装置及便携式终端 |
CN109889920A (zh) * | 2019-04-16 | 2019-06-14 | 威比网络科技(上海)有限公司 | 网络课程视频剪辑方法、系统、设备及存储介质 |
CN110996169A (zh) * | 2019-07-12 | 2020-04-10 | 北京达佳互联信息技术有限公司 | 剪辑视频的方法、装置、电子设备及计算机可读存储介质 |
CN111614899A (zh) * | 2020-05-15 | 2020-09-01 | 高斯贝尔数码科技股份有限公司 | 一种基于人脸识别的定制化视频内容产生方法和系统 |
CN112347941A (zh) * | 2020-11-09 | 2021-02-09 | 南京紫金体育产业股份有限公司 | 基于5g mec的运动视频集锦智能生成和分发方法 |
CN112445935A (zh) * | 2020-11-25 | 2021-03-05 | 开望(杭州)科技有限公司 | 一种基于内容分析的视频精选合集的自动生成方法 |
CN113822136A (zh) * | 2021-07-22 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 视频素材图像的选择方法、装置、设备及存储介质 |
CN114897749A (zh) * | 2022-04-01 | 2022-08-12 | 南京苏艾科软件技术有限公司 | 一种基于高清摄像头采集的小视频自动制作方法 |
CN114780795A (zh) * | 2022-05-07 | 2022-07-22 | 济南博观智能科技有限公司 | 一种视频素材筛选方法、装置、设备及介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116543796A (zh) * | 2023-07-06 | 2023-08-04 | 腾讯科技(深圳)有限公司 | 一种音频处理方法、装置及计算机设备、存储介质 |
CN116543796B (zh) * | 2023-07-06 | 2023-09-15 | 腾讯科技(深圳)有限公司 | 一种音频处理方法、装置及计算机设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115734007B (zh) | 2023-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108769801B (zh) | 短视频的合成方法、装置、设备及存储介质 | |
US8121462B2 (en) | Video edition device and method | |
CN108718417B (zh) | 直播间预览图标的生成方法、装置、服务器及存储介质 | |
WO2020199303A1 (zh) | 直播视频集锦的生成方法、装置、服务器及存储介质 | |
JP3250467B2 (ja) | 映像要約方法および映像表示方法 | |
CN109905782B (zh) | 一种控制方法及装置 | |
Luo et al. | Towards extracting semantically meaningful key frames from personal video clips: from humans to computers | |
CN103024447B (zh) | 一种同时同地拍摄的多视频移动端剪辑云端合成方法及服务器 | |
EP1182584A2 (en) | Method and apparatus for video skimming | |
US20030081937A1 (en) | Summarization of video content | |
US20050155053A1 (en) | Summarization of sumo video content | |
EP1403786A2 (en) | Automated event content processing method and system | |
JP4253139B2 (ja) | フレーム情報記述方法、フレーム情報生成装置及び方法、映像再生装置及び方法並びに記録媒体 | |
CN111083138A (zh) | 短视频制作系统、方法、电子设备及可读存储介质 | |
CN1645357A (zh) | 用于识别视频内容和记录视频的装置、方法和计算机产品 | |
JP2012070283A (ja) | 映像処理装置、方法、及び映像処理システム | |
US20040264939A1 (en) | Content-based dynamic photo-to-video methods and apparatuses | |
CN113067994B (zh) | 一种视频录制方法及电子设备 | |
US8619150B2 (en) | Ranking key video frames using camera fixation | |
JP2010232814A (ja) | 映像編集プログラムおよび映像編集装置 | |
CN115734007B (zh) | 视频剪辑方法、装置、介质及视频处理系统 | |
JP3728775B2 (ja) | 動画像の特徴場面検出方法及び装置 | |
CN108449623B (zh) | 抓取物体的控制方法、服务器和目标客户端 | |
CN105814905A (zh) | 用于使使用信息在装置与服务器之间同步的方法和系统 | |
CN112287771A (zh) | 用于检测视频事件的方法、装置、服务器和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |