CN117714903A - 一种基于跟拍的视频合成方法、装置及电子设备 - Google Patents

一种基于跟拍的视频合成方法、装置及电子设备 Download PDF

Info

Publication number
CN117714903A
CN117714903A CN202410168691.XA CN202410168691A CN117714903A CN 117714903 A CN117714903 A CN 117714903A CN 202410168691 A CN202410168691 A CN 202410168691A CN 117714903 A CN117714903 A CN 117714903A
Authority
CN
China
Prior art keywords
image
frame
distance value
target object
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410168691.XA
Other languages
English (en)
Other versions
CN117714903B (zh
Inventor
罗彬�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Tangmi Technology Co ltd
Original Assignee
Chengdu Tangmi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Tangmi Technology Co ltd filed Critical Chengdu Tangmi Technology Co ltd
Priority to CN202410168691.XA priority Critical patent/CN117714903B/zh
Publication of CN117714903A publication Critical patent/CN117714903A/zh
Application granted granted Critical
Publication of CN117714903B publication Critical patent/CN117714903B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)

Abstract

本发明涉及一种基于跟拍的视频合成方法、装置及电子设备,属于图像处理技术领域,该方法包括:获取跟拍设备对目标对象进行跟拍后所采集的视频流;其中,视频流中包括N帧连续的图像;N为正整数;对N帧连续的图像进行图像填充处理,以扩大每帧图像的尺寸;对处理后的N帧连续的图像进行裁剪,以使目标对象始终位于裁剪后的每帧图像的中心区域;对裁剪后的图像进行合成,形成目标视频流。通过上述填充裁剪合成的方式,能够使得目标视频流中目标对象一直处于中心位置,提高跟拍目标对象的显示效果,同时,也可以降低画面的抖动,使得画面效果更加流畅和稳定。

Description

一种基于跟拍的视频合成方法、装置及电子设备
技术领域
本发明涉及图像处理技术领域,尤其是一种基于跟拍的视频合成方法、装置及电子设备。
背景技术
跟拍,可以分为主动跟拍和被动跟拍;主动跟拍即拍摄者手持摄影机跟踪运动对象进行拍摄,而被动跟拍则由摄像机通过配置的云台等设备实现对运动对象的跟踪拍摄。
发明人在实际研究中发现,在跟拍的过程中,无论是主动跟拍还是被动跟拍,摄像机在跟随人物或者物体的运动的过程中会存在一定的延迟,进而导致拍摄的画面存在抖动。
具体的,采用主动跟拍时,拍摄者无法保证百分之百与运动对象的运动同步,则可能运动对象已经运动一段距离后,拍摄者才跟拍到,此时拍摄到的画面就会使得画面中于运动对象已远离画面中心位置,即画面抖动很大,甚至可能运动对象已经脱离画面。
具体的,采用被动跟拍时,当跟拍对象为猫时,猫由静止到运动的过程中,所拍摄的多帧画面会存在抖动。因为,猫在动之后,摄影机才会跟着动,那么,摄影机的响应节点与猫从静止到运动的时间节点存在一定的间隔,进而导致拍摄的多帧画面存在抖动。
发明内容
为解决上述现有技术问题,本发明提供一种基于跟拍的视频合成方法、装置及电子设备。
第一方面,本申请提供一种基于跟拍的视频合成方法,包括:获取跟拍设备对目标对象进行跟拍后所采集的视频流;其中,所述视频流中包括N帧连续的图像;N为正整数;对所述N帧连续的图像进行图像填充处理,以扩大每帧图像的尺寸;对处理后的N帧连续的图像进行裁剪,以使所述目标对象始终位于裁剪后的每帧图像的中心区域;对裁剪后的图像进行合成,形成目标视频流。
可选地,针对处理后的每帧图像,对该帧图像进行裁剪,包括:获取该帧图像中的关键像素点;其中,所述关键像素点为该帧图像中的目标对象上的像素点;将该帧图像中的关键像素点与前一帧图像中的关键像素点进行对齐;基于对齐后的该帧图像以及裁剪尺寸,对该帧图像进行裁剪。
可选地,通过如下步骤,获取所述裁剪尺寸:计算每帧图像中的目标对象距离该帧图像的四个图像边缘的四个目标距离值;其中,每个目标距离值表征该目标对象与对应的一个图像边缘的最小距离值;遍历所述N帧连续的图像中的计算的四个目标距离值,确定出第一距离值、第二距离值、第三距离值以及第四距离值;其中,所述第一距离值为所述N帧连续的图像中的目标对象距离第一图像边缘的最小距离值;所述第二距离值为所述N帧连续的图像中的目标对象距离第二图像边缘的最小距离值;所述第三距离值为所述N帧连续的图像中的目标对象距离第三图像边缘的最小距离值;所述第四距离值为所述N帧连续的图像中的目标对象距离第四图像边缘的最小距离值;基于所述第一距离值,所述第二距离值、所述第三距离值以及所述第四距离值确定所述裁剪尺寸。
可选地,所述裁剪尺寸为设定固定值;当在目标帧图像中的目标对象距离所述目标帧图像的边缘不满足所述裁剪尺寸时,所述方法还包括:获取所述目标帧图像之前的第一预设帧数的图像,和/或获取所述目标帧图像之后的第二预设帧数的图像;基于所述目标帧图像之前的第一预设帧数的图像,和/或获取所述目标帧图像之后的第二预设帧数的图像,对所述目标帧图像边缘缺失的图像信息进行补全,以使所述目标帧图像的边缘满足所述裁剪尺寸。
可选地,所述获取该帧图像中的关键像素点,包括:对该帧图像中的目标对象进行框选,获取所述目标对象对应的框选区域;其中,所述框选区域为矩形;基于所述框选区域确定所述目标对象的中心像素点;其中,所述中心像素点为所述关键像素点。
可选地,针对每帧图像,对该帧图像进行图像填充处理,包括:将该帧图像进行放大,并将该帧图像中的每个原始像素点之间新增的像素点通过近邻插值的方式确定像素值;或将该帧图像进行放大,并将该帧图像中的每个原始像素点之间新增的像素点通过线性差值的方式确定像素值;其中,放大的倍数为该帧图像的原始宽度的两倍至四倍,或放大的倍数为该帧图像的原始宽度的两倍至四倍。
可选地,在对所述N帧连续的图像帧进行图像填充处理之前,所述方法还包括:对所述N帧连续的图像帧进行快速傅里叶变换滤波,滤除每帧图像中的高频信息。
可选地,所述跟拍设备所采集的视频流中的每帧图像帧的尺寸大于所述跟拍设备的屏幕所显示的画面尺寸;或所述跟拍设备采用广角镜头对所述目标对象进行跟拍采集得到所述视频流。
第二方面,本申请提供一种基于跟拍的视频合成装置,包括:获取模块,用于获取跟拍设备对目标对象进行跟拍后所采集的视频流;其中,所述视频流中包括N帧连续的图像;N为正整数;填充模块,用于对所述N帧连续的图像进行图像填充处理,以扩大每帧图像的尺寸;裁剪模块,用于对处理后的N帧连续的图像进行裁剪,以使所述目标对象始终位于裁剪后的每帧图像的中心区域;合成模块,用于对裁剪后的图像进行合成,形成目标视频流。
第三方面,本申请提供一种电子设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的程序,所述处理器执行所述程序时实现如上述第一方面任一项所述的方法。
本发明的有益效果包括:本申请提供一种基于跟拍的视频合成方法,首先,获取跟拍设备对目标对象进行跟拍后所采集的视频流,然后对N帧连续的图像进行图像填充处理,以扩大每帧图像的尺寸,再对处理后的N帧连续的图像进行裁剪,以使目标对象始终位于裁剪后的每帧图像的中心区域;最后对裁剪后的图像进行合成,即可形成目标视频流。通过上述填充裁剪合成的方式,能够使得目标视频流中目标对象一直处于中心位置,提高跟拍目标对象的显示效果,同时,也可以降低画面的抖动,使得画面效果更加流畅和稳定。
附图说明
图1为本发明所提供的一种基于跟拍的视频合成方法的步骤流程图;
图2为本发明所提供的一帧裁剪后的图像的示意图;
图3为本发明所提供的另一种基于跟拍的视频合成方法的步骤流程图;
图4为本发明所提供的一帧包含目标对象的图像的示意图;
图5为本发明所提供的一种基于跟拍的视频合成装置的模块框图;
图6为本发明所提供的一种电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请。然而,本领域的技术人员应当清楚,在没有这些具体细节的其他方式中也可以实现本申请。在其他情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
发明人在实际研究中发现,在跟拍的过程中,无论是主动跟拍还是被动跟拍,摄像机在跟随人物或者物体的运动的过程中会存在一定的延迟,进而导致拍摄的画面存在抖动。
具体的,采用主动跟拍时,拍摄者无法保证百分之百与运动对象的运动同步,则可能运动对象已经运动一段距离后,拍摄者才跟拍到,此时拍摄到的画面就会使得画面中于运动对象已远离画面中心位置,即画面抖动很大,甚至可能运动对象已经脱离画面。
具体的,采用被动跟拍时,当跟拍对象为猫时,猫由静止到运动的过程中,所拍摄的多帧画面会存在抖动。因为,猫在动之后,摄影机才会跟着动,那么,摄影机的响应节点与猫从静止到运动的时间节点存在一定的间隔,进而导致拍摄的多帧画面存在抖动。
请参阅图1,本申请提供一种基于跟拍的视频合成方法,包括:步骤101~步骤104。
步骤101:获取跟拍设备对目标对象进行跟拍后所采集的视频流。
其中,视频流中包括N帧连续的图像;N为正整数。目标对象可以是人物、动物或者物体。在这里,物体可以为具备移动性的物体,比如车辆、扫地机器人等。
需要说明的是,本申请可以应用于上述跟拍设备中,也可以应用于其他电子设备中,比如可以应用于计算机、笔记本电脑等,电子设备中可以配置有视频合成软件,或者裁剪软件,以执行本申请所提供的基于跟拍的视频合成方法。
即,获取跟拍设备对目标对象进行跟拍后所采集的视频流可以是跟拍设备自身,也可以是跟拍设备对目标对象进行跟拍后采集得到视频流之后,将视频流传输至其他电子设备进行后期的视频合成。
步骤102:对N帧连续的图像进行图像填充处理,以扩大每帧图像的尺寸。
在获取到视频流之后,对视频流中的每帧图像进行填充处理,以扩大每帧图像的尺寸。
需要说明的是,这里的图像的尺寸指的是图像的像素尺寸,即图像的尺寸的长度与宽度均以像素为单位。
比如,每帧图像的原始尺寸为800*480,将每帧图像进行填充处理,进而得到扩大后的尺寸为1920*1080的图像。
步骤103:对处理后的N帧连续的图像进行裁剪,以使目标对象始终位于裁剪后的每帧图像的中心区域。
然后,再对图像填充处理后的每帧图像进行裁剪,以使目标对象始终位于裁剪后的每帧图像的中心区域。
需要说明的是,上述的中心区域可以指的裁剪后的每帧图像中与图像的中心像素点存在重叠的区域。
具体的,中心区域的中心像素点还可以与该帧图像的中心像素点重合。
如图2所示,在通过上述步骤即可得到裁剪后的图像20,其中,裁剪后的图像20中目标对象202位于中心区域203中。该中心区域203的中心像素点与裁剪后的图像20的中心像素点重合,即在图像中像素点203处重合。
步骤104:对裁剪后的图像进行合成,形成目标视频流。
最后,将N帧裁剪后的图像进行合成,以得到目标视频流。在目标视频流中,目标对象始终会位于视频画面的中心,并且目标对象移动在移动过程画面也更加流畅丝滑。
综上,本申请提供一种基于跟拍的视频合成方法,首先,获取跟拍设备对目标对象进行跟拍后所采集的视频流,然后对N帧连续的图像进行图像填充处理,以扩大每帧图像的尺寸,再对处理后的N帧连续的图像进行裁剪,以使目标对象始终位于裁剪后的每帧图像的中心区域;最后对裁剪后的图像进行合成,即可形成目标视频流。通过上述填充裁剪合成的方式,能够使得目标视频流中目标对象一直处于中心位置,提高跟拍目标对象的显示效果,同时,也可以降低画面的抖动,使得画面效果更加流畅和稳定。
下面对上述效果进行详细描述:
在采用基于跟拍过程中,当跟拍对焦为移动的人、动物或者物体(后文统称为“移动体”)时,移动体在从静止状态到移动后,跟拍设备才会随之移动;换句话说,移动体已经开始动了,跟拍设备才开始移动。即,跟拍设备的移动响应节点与猫从静止到运动的时间节点存在一定的间隔。又或者,移动体在由运动到静止后,跟拍设备才会随之停止;换句话说,移动体已经停止运动了,跟拍设备由于惯性、脉冲控制等原因还会移动一小段距离才停止。即,摄影机的静止响应节点与猫从运动到静止的时间节点存在一定的间隔。可知,跟拍过程中,跟拍设备存在超前或者滞后的跟拍状态,进而使得在移动体运动状态的切换过程中,所拍摄的移动体的位置出现前后偏差。比如,期望是移动体始终位于画面的中心,但是,由于移动从静止到运动时,跟拍设备响应慢了,导致移动体已经移动到画面的左侧了(而非画面的中心),进而大大降低了跟拍的显示效果。而本申请中,通过一种裁剪的方式,能够使得最终合成的视频流中目标对象始终位于图像的中心区域,进而提高了针对目标对象的跟拍的画面显示效果,避免目标对象在图像中出现一会偏左、一会偏右的画面。
通过前述分析可知,由于跟拍设备存在超前或者滞后的跟拍状态,那么必然会存在图像的抖动问题,即,画面显示的不连贯性。即,此处的抖动是由于跟拍设备自身所带来的抖动。而发明人在研究中发现,如果直接对N帧连续的图像进行图像,那么相当于像素点级别的裁剪,比如,一排一排的丢掉像素点,但是,人的眼睛是感受得到一个像素的差别的,即,对于前后两帧图像,如果前一帧图像左边第一排像素,但是为了对齐,后一帧图像这第一排像素又保留,可能会导致前后两帧存在一点细微的偏差,进而带来抖动,即,此处的抖动是直接对原图进行裁剪所带来的抖动。因此,为了克服上述两种抖动,本申请提供了一种亚像素级的裁剪,先将N帧连续的图像进行图像填充处理,以扩大每帧图像的尺寸,然后,在对填充处理后的图像进行裁剪。进而使得裁剪的对象并非针对的是原来的像素点。比如,处理前的图像中的一个像素点,可能对应处理后的图像中的9个像素点,那么在裁剪的时候,可能只会涉及到将其中的6个像素点裁剪掉,而剩下的3个像素点仍然能够保留处理前的图像中的一个像素点的像素信息,进而使得裁剪后,能够降低直接将原图中像素裁剪所带来的抖动问题。
可见,本申请所提供的基于亚像素级的裁剪方式,既能够有效降低由于跟拍设备自身所带来的抖动,也能够一定程度上削减对于像素级的裁剪所带来的抖动问题。
可选地,针对处理后的每帧图像,对该帧图像进行裁剪,包括:获取该帧图像中的关键像素点;其中,关键像素点为该帧图像中的目标对象上的像素点;将该帧图像中的关键像素点与前一帧图像中的关键像素点进行对齐;基于对齐后的该帧图像以及裁剪尺寸,对该帧图像进行裁剪。
即,在这里,将目标对象上的像素点作为关键像素点(即参考像素点),进而通过关键像素点将前后两帧图像进行对齐。
其中,关键像素点可以是预设的也可以是通过识别计算得到,比如关键像素点可以是人物的眼睛,也可以是动物的身体上的某一点,本申请不作限定。
请参阅图3,可选地,上述的裁剪尺寸可以通过如下步骤,确定:包括:步骤301~步骤303。
步骤301:计算每帧图像中的目标对象距离该帧图像的四个图像边缘的四个目标距离值。
其中,每个目标距离值表征该目标对象与对应的一个图像边缘的最小距离值。即,图像包括上下左右四个图像边缘,确定出目标对象与每个图像边缘之间的最小距离值,得到四个目标距离值。
示例性的,请参考图4,计算图像40中的猫距离四个图像边缘的最小距离值,即可得到目标距离值A、目标距离值B、目标距离值C和目标距离值D。需要说明的是,目标距离值A是猫与图像40左侧边缘的最小距离值,目标距离值B是猫与图像40上侧边缘的最小距离值,目标距离C是猫与图像40右侧边缘的最小距离值,目标距离D是猫与图像40下侧边缘的最小距离值。
步骤302:遍历N帧连续的图像中的计算的四个目标距离值,确定出第一距离值、第二距离值、第三距离值以及第四距离值。
其中,第一距离值为N帧连续的图像中的目标对象距离第一图像边缘的最小距离值;第二距离值为N帧连续的图像中的目标对象距离第二图像边缘的最小距离值;第三距离值为N帧连续的图像中的目标对象距离第三图像边缘的最小距离值;第四距离值为N帧连续的图像中的目标对象距离第四图像边缘的最小距离值。
换言之,上述步骤为遍历所有的图像,进而确定出所有图像中,目标对象距离图像左侧边缘的最小距离值,目标对象距离图像上侧边缘的最小距离值,目标对象距离图像右侧边缘的最小距离值以及目标对象距离图像下侧边缘的最小距离值。
步骤303:基于第一距离值,第二距离值、第三距离值以及第四距离值确定裁剪尺寸。
最后,即可基于第一距离值,第二距离值、第三距离值以及第四距离值确定裁剪尺寸。在这里,可以再次对相对的两个距离值进行比较,进而以相对的两个距离值中较小的距离值作为基准。
示例性的,第一距离值对应目标对象距离图像左侧边缘的最小距离值,第二距离值对应目标对象距离图像右侧边缘的最小距离值,第三距离值对应目标对象距离图像上侧边缘的最小距离值,第四距离值对应目标对象距离图像下侧边缘的最小距离值。则,第一距离值和第二距离值为相对的两个距离值,第三距离值和第四距离值为相对的两个距离值。假设,第一距离值为400、第二距离值为500、第三距离值为200、第四距离值为300。
由于第一距离值小于第二距离值,第三距离值小于第四距离值,则最终确定的裁剪尺寸的宽度为400*2=800,最终确定的裁剪尺寸的高度为200*2=400。
可见,通过上述方式,能够以所有图像作为参考,确定出合理地裁剪尺寸,进而避免裁剪过程出现信息缺失的问题。
可选地,裁剪尺寸还可以是设定固定值,比如800*480、1280*720、1920*1080等等。
当在目标帧图像中的目标对象距离目标帧图像的边缘不满足上述裁剪尺寸(设定固定值)时,该方法还包括:获取目标帧图像之前的第一预设帧数的图像,和/或获取目标帧图像之后的第二预设帧数的图像;基于目标帧图像之前的第一预设帧数的图像,和/或获取目标帧图像之后的第二预设帧数的图像,对目标帧图像边缘缺失的图像信息进行补全,以使目标帧图像的边缘满足裁剪尺寸。
换言之,当目标帧图像中,针对目标对象的裁剪无法满足设定固定值时,比如,目标对象离左侧边缘的距离很近,小于设定固定值中宽度的一半,则可以通过前后预设帧数的图像的图像信息来补全目标帧图像的边缘。
上述的第一预设帧数以及第二帧数可以根据实际情况进行确定,比如,在目标帧图像之前的第3帧图像才发现可以用于补全的图像信息,则第一预设帧数为3。又比如,在目标帧图像之后的第1帧图像就发现可以用于补全的图像信息,则第二预设帧数为1。
可见,通过该方式,以保证后续裁剪过程的有效进行,同时由于用户对于边缘信息并不关注,因此,通过信息补全的方式并不会对画面的显示带来明显差异。
可选地,上述步骤获取该帧图像中的关键像素点,还可以具体包括:对该帧图像中的目标对象进行框选,获取目标对象对应的框选区域;其中,框选区域为矩形;基于框选区域确定目标对象的中心像素点;其中,中心像素点为关键像素点。
即,本申请提供一种动态关键像素点的确定方式,对每帧图像中的目标对象均进行框选,然后获取其对应的框选区域,然后一框选区域的中心像素点,确定为目标对象所对应的关键像素点,通过该方式,能够进一步地保证目标对象所在的区域为整个图像的中心区域。
可选地,针对每帧图像,对该帧图像进行图像填充处理,可以采用近邻插值的方式进行处理,具体的,该方式包括:将该帧图像进行放大,并将该帧图像中的每个原始像素点之间新增的像素点通过近邻插值的方式确定像素值;其中,放大的倍数为该帧图像的原始宽度的两倍至四倍,或放大的倍数为该帧图像的原始宽度的两倍至四倍。
需要说明的是,近邻插值的方式为将已知的像素点的数值赋予最近的像素点。比如,原始像素点的像素值为20,则在其周围的新增的像素点的像素值也为20。通过上述放大,则可以将原来一个原始像素点放大为四个至十六个。
综上,本申请采用近邻插值的方式进行图像填充处理,一来,通过近邻插值的方式计算量较小,二来通过放大的倍数控制为该帧图像的原始宽度的两倍至四倍,或放大的倍数为该帧图像的原始宽度的两倍至四倍,既不会过大的增加计算量,又能够保证后续裁剪具备较好的效果,降低画面抖动。
可选地,针对每帧图像,对该帧图像进行图像填充处理,还可以采用线性插值的方式进行处理,具体的,该方式包括:将该帧图像进行放大,并将该帧图像中的每个原始像素点之间新增的像素点通过线性差值的方式确定像素值;其中,放大的倍数为该帧图像的原始宽度的两倍至四倍,或放大的倍数为该帧图像的原始宽度的两倍至四倍。
需要说明的是,线性插值的方式为将已知的像素点作为端点通过线性方式计算增加的像素点的像素值。比如,像素点A的像素值为10、像素点B的像素值为19,则在像素点A和像素点B中间新增的两个像素点的像素值分别为13和16。需要说明的是,上述仅作为举例。
综上,本申请采用线性插值的方式进行图像填充处理,一来,通过线性插值的方式使得画面像素点之间过渡效果更好,二来通过放大的倍数控制为该帧图像的原始宽度的两倍至四倍,或放大的倍数为该帧图像的原始宽度的两倍至四倍,既不会过大的增加计算量,又能够保证后续裁剪具备较好的效果,降低画面抖动。
可选地,在对N帧连续的图像帧进行图像填充处理之前,该方法还包括:对N帧连续的图像帧进行快速傅里叶变换(Fast Fourier Transform,FFT)滤波,滤除每帧图像中的高频信息。
需要说明的是,图像中的高频信息是指的图像强度(亮度/灰度)变化剧烈的地方,即,可以理解为图像中的边缘(轮廓)。而在本申请中的图像填充、裁剪等过程并不关注图像这些细节,因此,在对图像进行填充、裁剪等过程之前,可以先进行快速傅里叶变换滤波,滤除每帧图像中的高频信息,进而降低后续计算量。
可选地,跟拍设备所采集的视频流中的每帧图像帧的尺寸大于跟拍设备的屏幕所显示的画面尺寸。
换言之,针对某些跟拍设备,其真实的拍摄所采集的画面尺寸大于其自身屏幕所显示画面尺寸。那么,本申请所提供的基于跟拍的视频合成方法,在通过裁剪后,依然能够使得最终呈现的目标视频流中的画面尺寸保持原来的显示尺寸。并且,由于真实的拍摄采集的画面尺寸大于其自身屏幕所显示画面尺寸,那么其裁剪的过程相当于是将大画幅的图像进行拖动的过程,以使目标对象始终位于屏幕所显示的画面的中心。
可选地,跟拍设备采用广角镜头对目标对象进行跟拍采集得到视频流。
即,通过广角镜头能够获取到大场景的图像,有利于后续对图像的裁剪合成。
请参阅图5,本申请还提供一种基于跟拍的视频合成装置50,包括:
获取模块501,用于获取跟拍设备对目标对象进行跟拍后所采集的视频流;其中,所述视频流中包括N帧连续的图像;N为正整数;
填充模块502,用于对所述N帧连续的图像进行图像填充处理,以扩大每帧图像的尺寸;
裁剪模块503,用于对处理后的N帧连续的图像进行裁剪,以使所述目标对象始终位于裁剪后的每帧图像的中心区域;
合成模块504,用于对裁剪后的图像进行合成,形成目标视频流。
可选地,针对处理后的每帧图像,裁剪模块503还具体用于获取该帧图像中的关键像素点;其中,所述关键像素点为该帧图像中的目标对象上的像素点;将该帧图像中的关键像素点与前一帧图像中的关键像素点进行对齐;基于对齐后的该帧图像以及裁剪尺寸,对该帧图像进行裁剪。
可选地,裁剪模块503还具体用于计算每帧图像中的目标对象距离该帧图像的四个图像边缘的四个目标距离值;其中,每个目标距离值表征该目标对象与对应的一个图像边缘的最小距离值;遍历所述N帧连续的图像中的计算的四个目标距离值,确定出第一距离值、第二距离值、第三距离值以及第四距离值;其中,所述第一距离值为所述N帧连续的图像中的目标对象距离第一图像边缘的最小距离值;所述第二距离值为所述N帧连续的图像中的目标对象距离第二图像边缘的最小距离值;所述第三距离值为所述N帧连续的图像中的目标对象距离第三图像边缘的最小距离值;所述第四距离值为所述N帧连续的图像中的目标对象距离第四图像边缘的最小距离值;基于所述第一距离值,所述第二距离值、所述第三距离值以及所述第四距离值确定所述裁剪尺寸。
可选地,所述裁剪尺寸为设定固定值;当在目标帧图像中的目标对象距离所述目标帧图像的边缘不满足所述裁剪尺寸时,裁剪模块503还具体用于获取所述目标帧图像之前的第一预设帧数的图像,和/或获取所述目标帧图像之后的第二预设帧数的图像;基于所述目标帧图像之前的第一预设帧数的图像,和/或获取所述目标帧图像之后的第二预设帧数的图像,对所述目标帧图像边缘缺失的图像信息进行补全,以使所述目标帧图像的边缘满足所述裁剪尺寸。
可选地,裁剪模块503还具体用于对该帧图像中的目标对象进行框选,获取所述目标对象对应的框选区域;其中,所述框选区域为矩形;基于所述框选区域确定所述目标对象的中心像素点;其中,所述中心像素点为所述关键像素点。
可选地,针对每帧图像,填充模块502还具体用于将该帧图像进行放大,并将该帧图像中的每个原始像素点之间新增的像素点通过近邻插值的方式确定像素值;或将该帧图像进行放大,并将该帧图像中的每个原始像素点之间新增的像素点通过线性差值的方式确定像素值;其中,放大的倍数为该帧图像的原始宽度的两倍至四倍,或放大的倍数为该帧图像的原始宽度的两倍至四倍。
可选地,该装置还包括预处理模块。预处理模块用于在对所述N帧连续的图像帧进行图像填充处理之前,对所述N帧连续的图像帧进行快速傅里叶变换滤波,滤除每帧图像中的高频信息。
可选地,所述跟拍设备所采集的视频流中的每帧图像帧的尺寸大于所述跟拍设备的屏幕所显示的画面尺寸;或所述跟拍设备采用广角镜头对所述目标对象进行跟拍采集得到所述视频流。
请参阅图6,本申请还提供一种电子设备60。包括:
该电子设备60包括:至少一个处理器601、存储器602、存储在存储器602中并可在至少一个处理器601上运行的程序603,处理器601执行程序603时实现上述方法步骤。
该电子设备60可是个人计算机,笔记本电脑等等,该电子设备60还可以是摄像设备本身。当电子设备60是个人计算机时,个人计算机与摄像设备电连接或者通信连接。
处理器601、存储器602。本领域技术人员可以理解,图6仅仅是电子设备60的举例,并不构成对电子设备60的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
上述电子设备60用于执行上述基于跟拍的视频合成方法,或配置有上述基于跟拍的视频合成装置50。
本领域技术人员可以理解,图6仅仅是电子设备60的举例,并不构成对电子设备60的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路 (Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以是电子设备60的内部存储单元,例如电子设备60的内存。存储器也可以是电子设备60的外部存储设备,例如电子设备60上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,电子设备60还可以既包括电子设备60的内部存储单元也包括外部存储设备。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法基于同一构思,其具体功能及带来的技术效果,具体可参见方法部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法中的对应过程,在此不再赘述。
本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法中的步骤。
本申请提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/电子设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
本申请中,对各个部分的描述都各有侧重,某部分中没有详述或记载的部分,可以参见其他部分的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的描述的各示例的单元及算法步骤,能够以电子硬件,或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请中,应该理解到,所揭露的装置/网络设备和方法,可以通过其他的方式实现。例如,以上所描述的装置/网络设备仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其他的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本方案的目的。
以上所述仅用以说明本申请的技术方案,而非对其限制;本领域的普通技术人员应当理解:其依然可以对前述各部分所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于跟拍的视频合成方法,其特征在于,包括:
获取跟拍设备对目标对象进行跟拍后所采集的视频流;其中,所述视频流中包括N帧连续的图像,N为正整数;
对所述N帧连续的图像进行图像填充处理,以扩大每帧图像的尺寸;
对处理后的N帧连续的图像进行裁剪,以使所述目标对象始终位于裁剪后的每帧图像的中心区域;
对裁剪后的图像进行合成,形成目标视频流。
2.根据权利要求1所述的基于跟拍的视频合成方法,其特征在于,针对处理后的每帧图像,对该帧图像进行裁剪,包括:
获取该帧图像中的关键像素点;其中,所述关键像素点为该帧图像中的目标对象上的像素点;
将该帧图像中的关键像素点与前一帧图像中的关键像素点进行对齐;
基于对齐后的该帧图像以及裁剪尺寸,对该帧图像进行裁剪。
3.根据权利要求2所述的基于跟拍的视频合成方法,其特征在于,通过如下步骤,获取所述裁剪尺寸:
计算每帧图像中的目标对象距离该帧图像的四个图像边缘的四个目标距离值;其中,每个目标距离值表征该目标对象与对应的一个图像边缘的最小距离值;
遍历所述N帧连续的图像中的计算的四个目标距离值,确定出第一距离值、第二距离值、第三距离值以及第四距离值;其中,所述第一距离值为所述N帧连续的图像中的目标对象距离第一图像边缘的最小距离值;所述第二距离值为所述N帧连续的图像中的目标对象距离第二图像边缘的最小距离值;所述第三距离值为所述N帧连续的图像中的目标对象距离第三图像边缘的最小距离值;所述第四距离值为所述N帧连续的图像中的目标对象距离第四图像边缘的最小距离值;
基于所述第一距离值,所述第二距离值、所述第三距离值以及所述第四距离值确定所述裁剪尺寸。
4.根据权利要求2所述的基于跟拍的视频合成方法,其特征在于,所述裁剪尺寸为设定固定值;当在目标帧图像中的目标对象距离所述目标帧图像的边缘不满足所述裁剪尺寸时,所述方法还包括:
获取所述目标帧图像之前的第一预设帧数的图像,和/或获取所述目标帧图像之后的第二预设帧数的图像;
基于所述目标帧图像之前的第一预设帧数的图像,和/或获取所述目标帧图像之后的第二预设帧数的图像,对所述目标帧图像边缘缺失的图像信息进行补全,以使所述目标帧图像的边缘满足所述裁剪尺寸。
5.根据权利要求2所述的基于跟拍的视频合成方法,其特征在于,所述获取该帧图像中的关键像素点,包括:
对该帧图像中的目标对象进行框选,获取所述目标对象对应的框选区域;其中,所述框选区域为矩形;
基于所述框选区域确定所述目标对象的中心像素点;其中,所述中心像素点为所述关键像素点。
6.根据权利要求1所述的基于跟拍的视频合成方法,其特征在于,针对每帧图像,对该帧图像进行图像填充处理,包括:
将该帧图像进行放大,并将该帧图像中的每个原始像素点之间新增的像素点通过近邻插值的方式确定像素值;或
将该帧图像进行放大,并将该帧图像中的每个原始像素点之间新增的像素点通过线性差值的方式确定像素值;
其中,放大的倍数为该帧图像的原始宽度的两倍至四倍,或放大的倍数为该帧图像的原始宽度的两倍至四倍。
7.根据权利要求1所述的基于跟拍的视频合成方法,其特征在于,在对所述N帧连续的图像进行图像填充处理之前,所述方法还包括:
对所述N帧连续的图像进行快速傅里叶变换滤波,滤除每帧图像中的高频信息。
8.根据权利要求1所述的基于跟拍的视频合成方法,其特征在于,所述跟拍设备所采集的视频流中的每帧图像帧的尺寸大于所述跟拍设备的屏幕所显示的画面尺寸;或
所述跟拍设备采用广角镜头对所述目标对象进行跟拍采集得到所述视频流。
9.一种基于跟拍的视频合成装置,其特征在于,包括:
获取模块,用于获取跟拍设备对目标对象进行跟拍后所采集的视频流;其中,所述视频流中包括N帧连续的图像;N为正整数;
填充模块,用于对所述N帧连续的图像进行图像填充处理,以扩大每帧图像的尺寸;
裁剪模块,用于对处理后的N帧连续的图像进行裁剪,以使所述目标对象始终位于裁剪后的每帧图像的中心区域;
合成模块,用于对裁剪后的图像进行合成,形成目标视频流。
10.一种电子设备,其特征在于,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8任一项所述的方法。
CN202410168691.XA 2024-02-06 2024-02-06 一种基于跟拍的视频合成方法、装置及电子设备 Active CN117714903B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410168691.XA CN117714903B (zh) 2024-02-06 2024-02-06 一种基于跟拍的视频合成方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410168691.XA CN117714903B (zh) 2024-02-06 2024-02-06 一种基于跟拍的视频合成方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN117714903A true CN117714903A (zh) 2024-03-15
CN117714903B CN117714903B (zh) 2024-05-03

Family

ID=90161136

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410168691.XA Active CN117714903B (zh) 2024-02-06 2024-02-06 一种基于跟拍的视频合成方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN117714903B (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060115922A1 (en) * 2004-09-22 2006-06-01 Fuji Photo Film Co., Ltd. Photo movie creating method, apparatus, and program
CN1791221A (zh) * 2005-12-29 2006-06-21 北京中星微电子有限公司 一种基于动态图像实现视频编码防抖的方法及编码器
US7595841B1 (en) * 2005-07-01 2009-09-29 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Video image stabilization and registration—plus
CN104331900A (zh) * 2014-11-25 2015-02-04 湖南科技大学 Ccd摄像机标定中角点亚像素定位方法
CN105307569A (zh) * 2013-06-05 2016-02-03 皇家飞利浦有限公司 用于显示目标的第一图像和第二图像的方法和设备
US9305362B1 (en) * 2014-02-28 2016-04-05 Xilinx, Inc. Image stabilization
US20160112638A1 (en) * 2014-10-15 2016-04-21 Microsoft Corporation Video stabilization using padded margin pixels
CN110068572A (zh) * 2019-04-02 2019-07-30 佛山科学技术学院 基于光学投影层析正弦图标定旋转中心的方法及装置
WO2020007717A1 (en) * 2018-07-02 2020-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for block-based predictive video decoding
CN113518243A (zh) * 2020-04-10 2021-10-19 Tcl科技集团股份有限公司 一种图像处理方法及装置
CN113536866A (zh) * 2020-04-22 2021-10-22 华为技术有限公司 一种人物追踪显示方法和电子设备
CN114390188A (zh) * 2020-10-22 2022-04-22 华为技术有限公司 一种图像处理方法和电子设备
US20220164920A1 (en) * 2020-11-20 2022-05-26 Xiaomi Technology (Wuhan) Co., Ltd. Method for processing image, electronic equipment, and storage medium
US20220270343A1 (en) * 2019-08-31 2022-08-25 Huawei Technologies Co., Ltd. Video image processing method and apparatus
CN115334249A (zh) * 2022-10-17 2022-11-11 成都唐米科技有限公司 基于运动重心的跟焦方法、系统及摄像系统
CN116659646A (zh) * 2023-05-29 2023-08-29 华能新能源盘州市风力发电有限公司 一种基于机器视觉的风机叶片振动检测方法及装置

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060115922A1 (en) * 2004-09-22 2006-06-01 Fuji Photo Film Co., Ltd. Photo movie creating method, apparatus, and program
US7595841B1 (en) * 2005-07-01 2009-09-29 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Video image stabilization and registration—plus
CN1791221A (zh) * 2005-12-29 2006-06-21 北京中星微电子有限公司 一种基于动态图像实现视频编码防抖的方法及编码器
CN105307569A (zh) * 2013-06-05 2016-02-03 皇家飞利浦有限公司 用于显示目标的第一图像和第二图像的方法和设备
US9305362B1 (en) * 2014-02-28 2016-04-05 Xilinx, Inc. Image stabilization
US20160112638A1 (en) * 2014-10-15 2016-04-21 Microsoft Corporation Video stabilization using padded margin pixels
CN104331900A (zh) * 2014-11-25 2015-02-04 湖南科技大学 Ccd摄像机标定中角点亚像素定位方法
WO2020007717A1 (en) * 2018-07-02 2020-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for block-based predictive video decoding
CN110068572A (zh) * 2019-04-02 2019-07-30 佛山科学技术学院 基于光学投影层析正弦图标定旋转中心的方法及装置
US20220270343A1 (en) * 2019-08-31 2022-08-25 Huawei Technologies Co., Ltd. Video image processing method and apparatus
CN113518243A (zh) * 2020-04-10 2021-10-19 Tcl科技集团股份有限公司 一种图像处理方法及装置
CN113536866A (zh) * 2020-04-22 2021-10-22 华为技术有限公司 一种人物追踪显示方法和电子设备
CN114390188A (zh) * 2020-10-22 2022-04-22 华为技术有限公司 一种图像处理方法和电子设备
US20220164920A1 (en) * 2020-11-20 2022-05-26 Xiaomi Technology (Wuhan) Co., Ltd. Method for processing image, electronic equipment, and storage medium
CN115334249A (zh) * 2022-10-17 2022-11-11 成都唐米科技有限公司 基于运动重心的跟焦方法、系统及摄像系统
CN116659646A (zh) * 2023-05-29 2023-08-29 华能新能源盘州市风力发电有限公司 一种基于机器视觉的风机叶片振动检测方法及装置

Also Published As

Publication number Publication date
CN117714903B (zh) 2024-05-03

Similar Documents

Publication Publication Date Title
EP3328055B1 (en) Control method, control device and electronic device
US8508599B2 (en) Motion vector detection apparatus, motion vector detection method, and image capturing apparatus
US20120057786A1 (en) Image processing apparatus, image processing method, image pickup apparatus, and storage medium storing image processing program
US8472747B2 (en) Image composition device, image composition method, and storage medium storing program
US20110085027A1 (en) Image processing device and method, and program
JP2003219225A (ja) 動体画像監視装置
JP2004288100A (ja) 撮像装置及び移動体カメラ
US11538175B2 (en) Method and apparatus for detecting subject, electronic device, and computer readable storage medium
JP5655291B2 (ja) 電子カメラ
CN110691192B (zh) 图像处理方法、装置、存储介质及电子设备
CN110084765B (zh) 一种图像处理方法、图像处理装置及终端设备
US20220345628A1 (en) Method for image processing, electronic device, and storage medium
KR20180102639A (ko) 화상 처리 장치, 화상 처리 방법, 화상 처리 프로그램 및 기억 매체
CN115052104A (zh) 图像处理方法、电子装置及非易失性计算机可读存储介质
CN110677585A (zh) 目标检测框的输出方法、装置、终端及存储介质
JPS63166370A (ja) 画像動き補正装置
KR101321974B1 (ko) 옵티컬 플로우를 이용한 이동물체 영상합성 방법
CN117714903B (zh) 一种基于跟拍的视频合成方法、装置及电子设备
KR20150024733A (ko) 왜곡제거장치 및 방법
JP2017162141A (ja) 画像識別システム及びその制御装置、並びに画像識別方法
CN103632131B (zh) 用于提取对象的设备和方法
CN109598195B (zh) 一种基于监控视频的清晰人脸图像处理方法与装置
JP5300413B2 (ja) 動きベクトル検出装置及び動きベクトル検出方法及び撮像装置及びプログラム
CN110602410A (zh) 一种图像处理方法、装置、航拍相机及存储介质
CN109995985B (zh) 基于机器人的全景图像拍摄方法、装置及机器人

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant