CN106454013A - 一种基于粒子滤波的视频稳定方法 - Google Patents
一种基于粒子滤波的视频稳定方法 Download PDFInfo
- Publication number
- CN106454013A CN106454013A CN201610860302.5A CN201610860302A CN106454013A CN 106454013 A CN106454013 A CN 106454013A CN 201610860302 A CN201610860302 A CN 201610860302A CN 106454013 A CN106454013 A CN 106454013A
- Authority
- CN
- China
- Prior art keywords
- particle
- frame
- delta
- motion compensation
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/144—Movement detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/68—Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
- H04N23/681—Motion detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/21—Circuitry for suppressing or minimising disturbance, e.g. moiré or halo
Abstract
本发明提出了一种基于粒子滤波的视频稳定方法,不需要进行单独的运动估计,而是把运动估计和运动补偿都归纳进一个粒子滤波的框架下,直接通过粒子加权的方式获得运动补偿向量。本发明提出的方法复杂度小,能够有效的对视频进行稳定补偿,适用于车载、船载、机载等摄像系统。
Description
技术领域
本发明属于图像处理技术领域,涉及图像的稳定处理,特指一种基于粒子滤波的视频稳定方法。
背景技术
摄像系统已广泛应用在舰船的光电设备、无人机的侦察系统以及侦察车的监视系统等领域中。在实际应用中,摄像平台的不稳定会造成摄像机存在随机抖动,这种随机抖动使得拍摄的画面不稳定、模糊。拍摄得到的这种不稳定的图像会使观察者产生疲劳感,从而导致误判和漏判。为了克服摄像系统的这种缺点,需要对摄像系统进行稳像处理。
电子稳像是综合电子、计算机、图像处理等技术为一体的新一代实现图像序列稳定的技术。现有的电子稳像系统都是分为两部分:运动估计模块和运动补偿模块。运动估计模块是利用运动估计相关算法处理视频序列,计算出视频序列相邻两帧的全局运动矢量。运动补偿模块则从全局运动矢量中分离出抖动矢量,利用图像处理的方法对图像的像素点进行处理,补偿掉抖动矢量,然后获得稳定视频序列。
为了获得准确的运动估计矢量,往往采用比较耗时的特征匹配法;然后再通过运动滤波对运动估计矢量进行分离,整个系统处理时间较长,很难满足一些实时处理系统的需要。
发明内容
针对现有电子稳像方法的不足,本发明提出一种基于粒子滤波的视频稳定方法。本发明不再进行单独的运动估计,而是把运动估计和运动补偿都归纳进一个粒子滤波的框架下,直接通过粒子加权的方式获得运动补偿向量。
为实现上述技术目的,本发明的技术方案是,
一种基于粒子滤波的视频稳定方法,包括以下步骤:
(1)对于视频序列图像{Pn(x,y)|n=1,2,…N},采用下述模型表示视频序列图像中相邻两帧图像的映射关系:
其中(xn,yn)表示第n帧的一个像素点所在的位置坐标,(xn+1,yn+1)是其对应的第n+1帧的像素点所在的位置坐标,(Δx,Δy)为运动补偿参数。
选取粒子数量M,本发明中选取M=100;每个粒子的都有一个权重记为每个粒子的初始权重均设为1/M,每个粒子对应的运动补偿参数为对所有的粒子进行初始化:
其中ε为[-1,1]内的随机数,每个粒子对应的运动补偿参数的初始值(Δxinit,Δyinit)均取0,b是一个常数,表示单帧补偿范围,本发明b取值为30。根据公式(2),可以获得M个粒子的在第一帧的初始取值(也即状态)。
(2)对每个粒子进行状态预测,考虑摄像机的实际扫描状态,故构造线性离散系统模型作为状态转移方程:
其中G1、G2分别是一维高斯噪声。从上述公式可以看到,第n帧图像的粒子是第n-1帧图像粒子的一阶方程。
从第n帧(n≥2)开始,根据公式(3),获得M个粒子在对应的运动补偿参数上新的取值(也即状态)。
(3)然后对每个粒子进行观测,观察每个粒子所代表的可能状态和真实状态之间的相似程度,接近真实状态的粒子赋予较大的权值,反之权值较小。
任取M个粒子中一个粒子为例说明本发明的具体求得相似程度和权重的步骤。
a.从第n-1帧图像里面随机选择5幅大小为50×50的子图像{Hi(x,y)|i=1,2,…5},从这5幅子图像中间最终选取一幅梯度信息最大的子图像用于后续处理。其中本发明提出的梯度信息的计算步骤如下:
其中 是卷积运算,TH是二值化的阈值,这里取值为5。
{θi(x,y)|i=1,2,…,5}是一个二值化图像,其中非零像素代表梯度信息,因此在这5幅子图像中选择非零像素数量最多的那幅,假定为θi0(x,y),那么对应的Hi0(x,y)就是梯度信息最大的子图像。
b.根据当前的粒子计算第n-1帧的子图像Hi0(x,y)在第n帧对应的子图像,这里记为H′i0(x,y)。
根据公式(1),分别将子图像Hi0(x,y)在第n-1帧图像上四个顶点坐标平移就可以得到其在第n帧图像上的四个顶点的坐标位置,也即得到对应的子图像H′i0(x,y)。
c.通过直方图计算Hi0(x,y)和H′i0(x,y)的相似度。
为了简化计算,将空间划分成32份,分别计算Hi0(x,y)和H′i0(x,y)的直方图,记为HistA和HistB。HistA和HistB均为长度为32的一维的向量,然后我们采用欧式距离计算它们的相似度:
d.根据相似度计算观察概率密度其中δ是个常数。
e.更新当前粒子的权重:
对于100个粒子都进行上述操作,计算出新的权重,然后再进行归一化得到最终权重
(4)当前帧(也即第n帧)所期望的运动补偿参数可以用每个粒子的加权和来表示:
(5)为解决粒子退化的问题,避免大量的计算浪费在权值小的粒子上,对粒子进行重新采样,复制权重较大的粒子,剔除权重较小的粒子。具体做法如下:定义两个阈值ε1和ε2,其中ε1>ε2,ε1和ε2分别表示粒子权值的大小范围,当某个粒子的权值小于阈值ε2时,需要在权值大于ε1的粒子中任意选择粒子替换该权值小于阈值ε2的粒子,并给该粒子赋予1/M的初始权重;对所有权值小于阈值ε2的粒子都进行替换后,对M个粒子的权重进行归一化,作为第n帧的最终粒子信息。实质上就是,把权重较小的粒子用一个权重较大的粒子进行替换,并给于一个新的初始权重。
计算完第n帧的运动补偿参数(Δxn,Δyn)和粒子信息后,然后转到步骤(2),开始计算第n+1帧的运动补偿参数(Δxn+1,Δyn+1)和粒子信息。这样从第2帧开始,每一帧都通过步骤(2)-步骤(5)计算出对应的运动补偿参数{(Δxn,Δyn)|n=2,…,N}。
最后根据每一帧的运动补偿参数对视频图像进行稳定,以第n帧为例,通过累加获得第n帧相对于第1帧的运动补偿:
根据对第n帧图像进行平移,获得稳定视频序列图像。
本发明提出了一种基于粒子滤波的视频稳定方法,不需要进行单独的运动估计,而是把运动估计和运动补偿都归纳进一个粒子滤波的框架下,直接通过粒子加权的方式获得运动补偿向量。本发明提出的方法复杂度小,能够有效的对视频进行稳定补偿,适用于车载、船载、机载等摄像系统。
附图说明
图1为本发明的流程图;
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
作为一个滤波工具,粒子滤波器具有较好的平滑性、收敛性和鲁棒性,能逼近状态的最优估计,且使用于任何非线性非高斯的动态系统。因此本发明提出了一种基于粒子滤波的视频稳定方法,采用粒子滤波作为整体框架,把运动估计和运动补偿结合成一个有机的整体。
如图1所示,本发明包括如下步骤:
(1)对于视频序列图像{Pn(x,y)|n=1,2,…N},本发明采用下述模型表示相邻两帧图像的映射关系:
其中(xn,yn)表示第n帧的一个像素点所在的位置坐标,(xn+1,yn+1)是其对应的第n+1帧的像素点所在的位置坐标,(Δx,Δy)为运动补偿参数。
根据精度和速度要求确定粒子的数量M,经过实验论证,本实施例选取粒子数量M=100。每个粒子的都有一个权重记为每个粒子的初始权重均设为1/M,每个粒子对应的运动补偿参数为对所有的粒子进行初始化:
其中ε为[-1,1]内的随机数,每个粒子对应的运动补偿参数的初始值(Δxinit,Δyinit)均取0,b是一个常数,表示单帧补偿范围,这里取值30。
根据公式2,获得100个粒子的在第一帧的初始取值(也即状态)。
(2)根据粒子滤波框架,对每个粒子进行状态预测,考虑摄像机的实际扫描状态,故构造线性离散系统模型作为状态转移方程:
其中G1、G2分别是一维高斯噪声。从上述公式可以看到,第n帧图像的粒子是第n-1帧图像粒子的一阶方程。
从第n帧(n≥2)开始,根据公式3,获得100个粒子在两个参数上新的取值(也即状态)。
(3)然后对每个粒子进行观测,观察每个粒子所代表的可能状态和真实状态之间的相似程度,接近真实状态的粒子赋予较大的权值,反之权值较小。
下面任取其中的一个粒子为例说明本发明的具体求得相似程度和权重的步骤。
a.从第n-1帧图像里面随机选择5幅大小为50×50的子图像{Hi(x,y)|i=1,2,…5},从中间最终选取一幅梯度信息最大的子图像用于后续处理。其中本发明提出的梯度信息的计算步骤如下:
其中 是卷积运算,TH是二值化的阈值,这里取值为5。
{θi(x,y)|i=1,2,…,5}是一个二值化图像,其中非零像素代表梯度信息,因此在这5幅图像中选择非零像素数量最多的那幅,假定为θi0(x,y),那么对应的Hi0(x,y)就是梯度信息最大的子图像。
b、根据当前的粒子计算第n-1帧的子图像Hi0(x,y)在第n帧对应的子图像,这里记为H′i0(x,y)。
根据公式1,分别将子图像Hi0(x,y)在第n-1帧图像上四个顶点坐标平移就可以得到其在第n帧图像上的四个顶点的坐标位置,也即得到对应的子图像H′i0(x,y)。
c.通过直方图计算Hi0(x,y)和H′i0(x,y)的相似度。
为了简化计算,将空间划分成32份,分别计算Hi0(x,y)和H′i0(x,y)的直方图,记为HistA和HistB。HistA和HistB均为长度为32的一维的向量,然后采用欧式距离计算它们的相似度:
d.根据相似度计算观察概率密度其中δ是个常数。
e.更新当前粒子的权重:
对于100个粒子都进行上述操作,计算出新的权重,然后再进行归一化得到最终权重
(4)当前帧(也即第n帧)所期望的运动补偿参数可以用每个粒子的加权和来表示:
(5)为解决粒子退化的问题,避免大量的计算浪费在权值小的粒子上,对粒子进行重新采样,复制权重较大的粒子,剔除权重较小的粒子。具体做法如下:
定义两个阈值ε1和ε2,其中ε1>ε2,ε1和ε2分别表示粒子权值的大小范围,当某个粒子的权值小于阈值ε2时,需要在权值大于ε1的粒子中任意选择粒子替换该权值小于阈值ε2的粒子,并给该粒子赋予1/M的初始权重;对所有权值小于阈值ε2的粒子都进行替换后,对M个粒子的权重进行归一化,作为第n帧的最终粒子信息。实质上就是,把权重较小的粒子用一个权重较大的粒子进行替换,并给于一个新的初始权重。
定义一个阈值,当某个粒子的权值小于该阈值就删掉,然后复制一个权重较大的粒子,并给该粒子赋予1/M的初始权重。判断完所有粒子后,对100个粒子(包括原有权重较大的粒子和新复制的粒子)的权重进行归一化,作为第n帧的最终粒子信息。
计算完第n帧的运动补偿参数(Δxn,Δyn)和粒子信息后,然后转到步骤(2),开始计算第n+1帧的运动补偿参数(Δxn+1,Δyn+1)和粒子信息。这样从第2帧开始,每一帧都通过步骤(2)-步骤(5)计算出对应的运动补偿参数{(Δxn,Δyn)|n=2,…,N}。
最后根据每一帧的运动补偿参数对视频图像进行稳定,以第n帧为例,通过累加获得第n帧相对于第1帧的运动补偿:
根据对第n帧图像进行平移,获得稳定视频序列图像。
以上包含了本发明优选实施例的说明,这是为了详细说明本发明的技术特征,并不是想要将发明内容限制在实施例所描述的具体形式中,依据本发明内容主旨进行的其他修改和变型也受本专利保护。本发明内容的主旨是由权利要求书所界定,而非由实施例的具体描述所界定。
Claims (5)
1.一种基于粒子滤波的视频稳定方法,其特征在于,包括以下步骤:
(1)对于视频序列图像{Pn(x,y)|n=1,2,…N},采用下述模型表示视频序列图像中相邻两帧图像的映射关系:
其中(xn,yn)表示第n帧的一个像素点所在的位置坐标,(xn+1,yn+1)是其对应的第n+1帧的像素点所在的位置坐标,(Δx,Δy)为运动补偿参数;
选取粒子数量M,每个粒子的都有一个权重记为每个粒子的初始权重均设为1/M,每个粒子对应的运动补偿参数为对所有的粒子进行初始化:
其中ε为[-1,1]内的随机数,每个粒子对应的运动补偿参数的初始值(Δxinit,Δyinit)均取0,b是一个常数,表示单帧补偿范围;
根据公式(2),可以获得M个粒子的在第一帧的初始取值;
(2)对每个粒子进行状态预测,考虑摄像机的实际扫描状态,故构造线性离散系统模型作为状态转移方程:
其中G1、G2分别是一维高斯噪声;
从第n帧开始,其中n≥2,根据公式(3),获得M个粒子在对应的运动补偿参数上新的取值;
(3)然后对每个粒子进行观测,观察每个粒子所代表的可能状态和真实状态之间的相似程度,接近真实状态的粒子赋予较大的权值,反之权值较小;
(4)当前帧即第n帧所期望的运动补偿参数可以用每个粒子的加权和来表示;
(5)对粒子进行重新采样,复制权重较大的粒子,剔除权重较小的粒子,做法如下:定义两个阈值ε1和ε2,其中ε1>ε2,ε1和ε2分别表示粒子权值的大小范围,当某个粒子的权值小于阈值ε2时,需要在权值大于ε1的粒子中任意选择一个进行替换,并给该粒子赋予1/M的初始权重;对所有权值小于阈值ε2的粒子都进行替换后,对M个粒子的权重进行归一化,作为第n帧的最终粒子信息;
计算完第n帧的运动补偿参数(Δxn,Δyn)和粒子信息后,然后转到步骤(2),开始计算第n+1帧的运动补偿参数(Δxn+1,Δyn+1)和粒子信息;这样从第2帧开始,每一帧都通过步骤(2)-步骤(5)计算出对应的运动补偿参数{(Δxn,Δyn)|n=2,…,N};
最后根据每一帧的运动补偿参数对视频图像进行稳定,以第n帧为例,通过累加获得第n帧相对于第1帧的运动补偿:
根据对第n帧图像进行平移,获得稳定视频序列图像。
2.根据权利要求1所述的基于粒子滤波的视频稳定方法,其特征在于,步骤(1)中,选取粒子数量M=100。
3.根据权利要求1所述的基于粒子滤波的视频稳定方法,其特征在于,步骤(1)中,公式(2)中的b取值为30。
4.根据权利要求1、2或3所述的基于粒子滤波的视频稳定方法,其特征在于,步骤(3)中,任取M个粒子中的一粒子其相似似程度和权重的获得方法如下:
a.从第n-1帧图像里面随机选择5幅大小为50×50的子图像{Hi(x,y)|i=1,2,…5},从这5幅子图像中间选取一幅梯度信息最大的子图像;其中梯度信息的计算方法如下:
其中 是卷积运算,TH是二值化的阈值;
{θi(x,y)|i=1,2,…,5}是一个二值化图像,其中非零像素代表梯度信息,因此在这5幅子图像中选择非零像素数量最多的那幅,假定为θi0(x,y),那么其所对应的Hi0(x,y)就是梯度信息最大的子图像;
b.根据当前的粒子计算第n-1帧的子图像Hi0(x,y)在第n帧对应的子图像,这里记为Hi′0(x,y);
根据公式(1),分别将子图像Hi0(x,y)在第n-1帧图像上四个顶点坐标平移就可以得到其在第n帧图像上的四个顶点的坐标位置,也即得到对应的子图像Hi′0(x,y);
c.通过直方图计算Hi0(x,y)和Hi′0(x,y)的相似度;
将空间划分成32份,分别计算Hi0(x,y)和Hi′0(x,y)的直方图,记为HistA和HistB;
HistA和HistB均为长度为32的一维的向量,然后采用欧式距离计算两者的相似度:
d.根据相似度计算观察概率密度其中δ是个常数;
e.更新当前粒子的权重:
对于100个粒子都进行步骤a至e的操作,计算出新的权重,然后再进行归一化得到最终权重
5.根据权利要求4所述的基于粒子滤波的视频稳定方法,其特征在于,步骤(4)中,当前帧即第n帧所期望的运动补偿参数用每个粒子的加权和来表示,如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610860302.5A CN106454013B (zh) | 2016-09-28 | 2016-09-28 | 一种基于粒子滤波的视频稳定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610860302.5A CN106454013B (zh) | 2016-09-28 | 2016-09-28 | 一种基于粒子滤波的视频稳定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106454013A true CN106454013A (zh) | 2017-02-22 |
CN106454013B CN106454013B (zh) | 2019-04-05 |
Family
ID=58169815
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610860302.5A Active CN106454013B (zh) | 2016-09-28 | 2016-09-28 | 一种基于粒子滤波的视频稳定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106454013B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101951465A (zh) * | 2010-05-19 | 2011-01-19 | 上海稳像信息技术有限公司 | 基于概率运动滤波的实时视频稳像方法 |
CN101951464A (zh) * | 2010-05-19 | 2011-01-19 | 上海稳像信息技术有限公司 | 基于积分图特征块匹配的实时视频稳像方法 |
US8400619B1 (en) * | 2008-08-22 | 2013-03-19 | Intelligent Automation, Inc. | Systems and methods for automatic target tracking and beam steering |
-
2016
- 2016-09-28 CN CN201610860302.5A patent/CN106454013B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8400619B1 (en) * | 2008-08-22 | 2013-03-19 | Intelligent Automation, Inc. | Systems and methods for automatic target tracking and beam steering |
CN101951465A (zh) * | 2010-05-19 | 2011-01-19 | 上海稳像信息技术有限公司 | 基于概率运动滤波的实时视频稳像方法 |
CN101951464A (zh) * | 2010-05-19 | 2011-01-19 | 上海稳像信息技术有限公司 | 基于积分图特征块匹配的实时视频稳像方法 |
Non-Patent Citations (4)
Title |
---|
JUNLAN YANG, DAN SCHONFELD, CHONG CHEN: "Online Video Stabilization Based on Particle Filters", 《2006 INTERNATIONAL CONFERENCE ON IMAGE PROCESSING》 * |
MASOUD MOHAMMADI, MAHM OOD FATHI, MOHSEN SORYANI: "A new decoder side video stabilization using particle filter", 《 2011 18TH INTERNATIONAL CONFERENCE ON SYSTEMS, SIGNALS AND IMAGE PROCESSING》 * |
姚军,蒋晓瑜: "使用粒子滤波器实现电子稳像", 《光学精密工程》 * |
邓艳秀: "基于粒子滤波的电子稳像技术研究", 《中国优秀硕士学位论文全文数据库》 * |
Also Published As
Publication number | Publication date |
---|---|
CN106454013B (zh) | 2019-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110532871A (zh) | 图像处理的方法和装置 | |
DE102018117813A1 (de) | Zeitlich stabile Datenrekonstruktion mit einem externen rekurrenten neuronalen Netzwerk | |
DE102020125197A1 (de) | Feinkörnige objektsegmentierung in video mit tiefen merkmalen und graphischen mehrebenenmodellen | |
Wang et al. | A review of image super-resolution approaches based on deep learning and applications in remote sensing | |
US20170278302A1 (en) | Method and device for registering an image to a model | |
CN111091503A (zh) | 基于深度学习的图像去失焦模糊方法 | |
Ma et al. | PID controller-guided attention neural network learning for fast and effective real photographs denoising | |
Elad et al. | Image denoising: The deep learning revolution and beyond—a survey paper | |
CN109472757B (zh) | 一种基于生成对抗神经网络的图像去台标方法 | |
US20210248467A1 (en) | Data and compute efficient equivariant convolutional networks | |
DE102021119722A1 (de) | Feingranulare pro-vektor-skalierung für neuronale netzwerkquantisierung | |
WO2020150077A1 (en) | Camera self-calibration network | |
CN115797571A (zh) | 3d风格化场景的新视角合成方法 | |
CN113378721B (zh) | 一种基于对称和局部判别的生成对抗人脸校正方法及系统 | |
CN110910456A (zh) | 基于Harris角点互信息匹配的立体相机动态标定算法 | |
CN116848555A (zh) | 使用在潜在变量上调节的几何感知神经网络渲染场景的新图像 | |
CN105791659A (zh) | 图像处理方法和电子设备 | |
Zhang et al. | Low-illumination image enhancement in the space environment based on the DC-WGAN algorithm | |
CN117058606A (zh) | 一种x射线图像违禁品检测方法 | |
Halder et al. | Model-free prediction of atmospheric warp based on artificial neural network | |
CN106454013A (zh) | 一种基于粒子滤波的视频稳定方法 | |
Romanuke | Two-layer perceptron for classifying flat scaled-turned-shifted objects by additional feature distortions in training | |
Liu et al. | Image superresolution reconstruction via granular computing clustering | |
Peng et al. | PDRF: progressively deblurring radiance field for fast scene reconstruction from blurry images | |
CN112634136B (zh) | 一种基于图像特征快速拼接的图像超分辨率方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |