CN111667511A

CN111667511A - 一种在动态视频中提取背景的方法、装置和系统

Info

Publication number: CN111667511A
Application number: CN202010563011.6A
Authority: CN
Inventors: 胡凯
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2020-06-19
Filing date: 2020-06-19
Publication date: 2020-09-15
Anticipated expiration: 2040-06-19
Also published as: CN111667511B

Abstract

本发明公开了一种在动态视频中提取背景的方法，包括：采用光流法获得视频包含的每帧图片的光流运动水平，建立反映整个视频光流运动水平的直方图，利用阈值法对直方图进行截取，去除视频包含的每帧图片中运动速度快的物体所在的像素；对处理后的每帧图片，采用高斯混合模型，计算每个像素的最可能的高斯分布，将每个像素最有可能的高斯分布的中心值，作为输出，其中，针对视频中每个位置，处理后的图片所包含的有效像素总数均满足预设要求。本发明能够从一系列运动视频中，自动区分背景(包括有静态背景和动态背景)、前景，然后从中提取出一张没有运动物体的纯背景图片。

Description

一种在动态视频中提取背景的方法、装置和系统

技术领域

本发明涉及图像处理技术领域，具体而言涉及一种在动态视频中提取背景的方法、装置和系统。

背景技术

在很多电影、纪念、风景区中，往往需要拍摄一张纯背景的图片，或者是想拍摄一张只有自己和背景的照片，但是在这样的游人众多的地方，几乎是不可能拍摄出一张能够没有别人的照片。

如果有一种算法，在相机固定的前提下，能够在视频中，一是自动把背景(包括静态背景和动态背景，动态背景例如随风摇曳的竹林、喷泉)与运动的物体区分开来，拼凑成纯背景的照片，二是自动提醒提取的完成度，那么就可以很好的让拍摄者在人员密集处拍摄出背景的照片，特别是当拍摄者自己保持不动的情况下，可以被理解成背景，成为一张在人员密集处拍摄出来只有自己和背景的照片。

查阅现有的专利、论文，最为相关的是申请号为201510844031.X的《一种用于视频分析中背景建模方法》的专利，该专利利用了PBAS算法和高斯混合模型，分析了前景和背景，并用提取了背景。但是该算法明显只是适合于没有移动人员运动的情况，不适合在人员密集处拍摄出只有自己和背景的照片的目标。因此，亟需针对包含移动人员或物体(如车辆等) 的情况，提出一种可以从动态视频中提取背景(包含处于静态的自己)的方法。

发明内容

本发明针对现有技术中的不足，提供一种在动态视频中提取背景的方法、装置和系统，能够从一系列运动视频中，自动区分背景(包括有静态背景和动态背景)、前景，然后从中提取出一张没有运动物体的纯背景图片。

为实现上述目的，本发明采用以下技术方案：

一种在动态视频中提取背景的方法，所述方法包括：

S1，采用光流法获得视频包含的每帧图片的光流运动水平，建立反映整个视频光流运动水平的直方图，利用阈值法对直方图进行截取，去除视频包含的每帧图片中运动速度快的物体所在的像素；

S2，对处理后的每帧图片，采用高斯混合模型，计算每个像素的最可能的高斯分布，将每个像素最有可能的高斯分布的中心值，作为输出，其中，针对视频中每个位置，处理后的图片所包含的有效像素总数均满足预设要求。

为优化上述技术方案，采取的具体措施还包括：

进一步地，步骤S1中，所述去除视频包含的每帧图片中运动速度快的物体所在的像素的过程包括以下步骤：

S11，用光流法计算并获得视频中每帧图片的光流值；

S12，以光流值大小为横坐标，以整个视频中相同光流值的像素数量为纵坐标，建立反映整个视频光流运动水平的直方图；

S13，采用阈值法对直方图进行截取，将大于T1的光流运动的视频中位置的像素全部删除。

进一步地，步骤S13中，阈值法的阈值采用大津法计算获得。

进一步地，所述方法还包括：

S14，统计视频中每个位置的像素剩下的没有被删除的个数，如果同一个位置的像素在不同帧里少于T2个有效值，那么认定为1个不合格像素，无法进一步使用高斯模型判断；

S15，实时统计不合格像素的个数N2，根据下述公式计算拍摄进度C：

C＝(N3-N2)/N3

式中，N3为相机的拍摄图片的总像素个数；

S15，将计算得到的拍摄进度展示给用户。

进一步地，所述方法还包括：

若视频所包含的图片全部处理结束后，拍摄进度未满足预设进度要求，则继续拍摄图片，直至进度满足预设进度要求。

进一步地，步骤S2中，对处理后的每帧图片，采用高斯混合模型，计算每个像素的最可能的高斯分布，将每个像素最有可能的高斯分布的中心值，作为输出的过程包括以下步骤：

S21，假定图像像素点红R、绿G、蓝B三色通道相互独立并具有相同的方差；对于随机变量X的观测数据集{x₁,x₂,...,x_N}，x_t＝(R_t,G_t,B_t)为t时刻像素的样本，其中t＝1～N，则单个采样点x_t其服从的混合高斯分布概率密度函数：

其中，K为高斯分布的数量，其中i＝1～K，η(x_t,μ_(i,t),τ_(i,t))是第t时刻的第i个高斯分布的参数，μ_(i,t)是其均值，τ_(i,t)是其协方差矩阵，

是其方差，I是三维单位矩阵，w_(i,t)是第t 时刻的第i个高斯分布的权重；

S22，每个新像素值X_t同当前K个模型按下式进行比较，直到找到匹配新像素值的分布模型，即同该模型的均值偏差在2.5个σ以内：

|X_t-μ_(i,t-1)|≤2.5σ

式中，σ为标准差；

S23，各个模式权值按如下公式更新，其中α是学习速率，对于匹配的模式M_(k,t)＝1，否则M_(k,t)＝0，对各个模式的权重进行归一化处理：

w_(k,t)＝(1-α)*w_(k,t-1)+α*M_k,t；

S24，未匹配模式的均值μ与标准差σ不变，匹配模式的参数按照如下公式进行更新：

ρ＝α*η(X_t(μ_k,σ_k))

μ_t＝(1-ρ)*μ_t-1+ρ*X_t

S25，如果步骤S21中没有匹配到任何模式，那么权重最小的模式被替换，即该模式的均值为当前像素值，标准差为初始较大值，权重为较小值；

S26，各个模式以w/α²为标准，降序排列，即权重大且标准差小的模式排列靠前；

S27，提取每个像素排序第一的模式作为对应像素的高斯分布；

S28，用每个模式的中心值μ替代对应的像素，取整后，形成一幅图像，作为输出。

本发明还提及一种在动态视频中提取背景的装置，所述装置包括快速运动物体去除模块和动静态背景中心值计算模块；

所述快速运动物体去除模块用于采用光流法获得视频包含的每帧图片的光流运动水平，建立反映整个视频光流运动水平的直方图，利用阈值法对直方图进行截取，去除视频包含的每帧图片中运动速度快的物体所在的像素；

所述动静态背景中心值计算模块用于对处理后的每帧图片，采用高斯混合模型，计算每个像素的最可能的高斯分布，将每个像素最有可能的高斯分布的中心值，作为输出，其中，针对视频中每个位置，处理后的图片所包含的有效像素总数均满足预设要求。

进一步地，所述装置还包括进度统计模块；

所述进度统计模块针对视频中每个位置，实时统计处理后的图片所包含的有效像素的个数，如果同一个位置的像素在不同帧里少于T2个有效值，那么认定为1个不合格像素；

根据不合格像素总数和相机拍摄图片的总像素个数计算得到当前进度值：

C＝(N3-N2)/N3

式中，N3为相机的拍摄图片的总像素个数，N2为不合格像素的个数。

本发明还提及一种在动态视频中提取背景的系统，所述系统包括：

(1)相机，用于采集拍摄视频；

(2)视频处理模块，用于将拍摄视频分解呈一定量的图片帧；

(3)如前所述的在动态视频中提取背景的装置，用于对视频处理模块分解得到的图片帧进行处理，输出提取背景后的图像。

本发明的有益效果是：

(1)在相机固定的前提下，能够在视频中，自动将背景(包括静态背景和动态背景)与运动的物体区分开来，拼凑成纯背景的照片。

(2)自动提醒提取的完成度，使用户掌握处理进程，让拍摄者在人员密集处顺利拍摄出背景照片。

(3)当拍摄者自己保持不动的情况下，可以被理解成背景，成为一张在人员密集处拍摄出来只有自己和背景的照片，充分满足用户的拍摄需求。

附图说明

图1是本发明的在动态视频中提取背景的方法流程图。

图2是本发明的具体实施例二中原始图片和光流图片的关系示意图。

具体实施方式

现在结合附图对本发明作进一步详细的说明。

需要注意的是，发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语，亦仅为便于叙述的明了，而非用以限定本发明可实施的范围，其相对关系的改变或调整，在无实质变更技术内容下，当亦视为本发明可实施的范畴。

具体实施例一

结合图1，本发明提及一种在动态视频中提取背景的方法，所述方法包括：

S1，采用光流法获得视频包含的每帧图片的光流运动水平，建立反映整个视频光流运动水平的直方图，利用阈值法对直方图进行截取，去除视频包含的每帧图片中运动速度快的物体所在的像素。

在相机固定的前提下，本发明所提及的在动态视频中提取背景的方法，基于光流法和高斯混合模型，先采用光流法获得每张图片的光流运动水平，然后用统计整个视频中的光流运动水平的直方图，然后用阈值法进行截取，从而去掉整个视频中运动速度快的物体，即人来人往的图片部分。然后再对剩下的视频中，采用高斯混合模型，计算每个像素的最可能的高斯分布。最后把每个像素最有可能的高斯分布的中心值，作为输出。

其整体过程包括有：基于光流法去除视频中快速运动物体；基于高斯混合模型的动静态背景中心值计算。

步骤一、基于光流法去除视频中快速运动物体，其作用在于去掉视频中运动速度快的物体，即在视频中，去除每张图片中人来人往的像素。其步骤包括有：

步骤1-1，用光流法计算并获得视频中每帧图片的光流值；

步骤1-2，以光流值大小为横坐标，以整个视频中相同光流值的像素数量为纵坐标，建立一个整个视频中光流运动水平的直方图；

步骤1-3，采用阈值法进行截取，把大于T1的光流运动的视频中的位置的像素全部删除。阈值法的阈值可以采用人工设置，也可以采用大津法进行计算获得。这样就获得一个基本上每帧图片中删除掉快速运动物体的视频。

步骤1-4，统计视频中每个位置的像素剩下的没有被删除的个数，如果一个像素在不同帧里少于T2个有效值，那么认定为1个不合格像素，无法进一步使用高斯模型判断，假设不合格像素共计为N2。假设相机的拍摄图片的像素为N3，其拍摄进度就为(N3-N2)/N3，从而提示使用者等待进度。等待完成后，进入基于高斯混合模型的动静态背景中心值计算的模块。

步骤二、基于高斯混合模型的动静态背景中心值计算，其作用是对于前述步骤获得的视频中，即扣掉每张图片中人来人往的像素的视频中，对于每帧每个位置的像素，均采用高斯混合模型，计算每个像素的最可能的高斯分布，然后获得其高斯分布的中心值，作为每个像素最有可能的值，作为输出。从而达到本发明的目的。需要强调的是，在基于光流法去除视频中快速运动物体的模块中，其每帧中删除掉的内容不参与本步骤计算。

混合高斯模型判断前后景的原理是，基于像素样本统计信息的背景表示方法，利用像素在较长时间内大量样本值的概率密度等统计信息(如模式数量、每个模式的均值和标准差) 表示背景，然后使用统计差分(如3σ原则)进行目标像素判断，可以对复杂动态背景进行建模，计算量较大。

在混合高斯背景模型中，认为像素之间的颜色信息互不相关，对各像素点的处理都是相互独立的。对于视频图像中的每一个像素点，其值在序列图像中的变化可看作是不断产生像素值的随机过程，即用高斯分布来描述每个像素点的颜色呈现规律(单模态(单峰)，多模态 (多峰))。

对于多峰高斯分布模型，图像的每一个像素点按不同权值的多个高斯分布的叠加来建模，每种高斯分布对应一个可能产生像素点所呈现颜色的状态，各个高斯分布的权值和分布参数随时间更新。当处理彩色图像时，假定图像像素点红R、绿G、蓝B三色通道相互独立并具有相同的方差。对于随机变量X的观测数据集{x₁,x₂,...,x_N}，x_t＝(R_t,G_t,B_t)为t时刻像素的样本，其中t＝1～N，则单个采样点x_t其服从的混合高斯分布概率密度函数：

是其方差，I是三维单位矩阵，w_(i,t)是第t 时刻的第i个高斯分布的权重。

因此，步骤二的详细的算法流程为：

步骤2-1，每个新像素值X_t同当前K个模型按下式进行比较，直到找到匹配新像素值的分布模型，即同该模型的均值偏差在2.5个σ以内。

|X_t-μ_(i,t-1)|≤2.5σ。

步骤2-2，各个模式权值按如下公式更新，其中α是学习速率，对于匹配的模式M_(k,t)＝1，否则M_(k,t)＝0，然后各个模式的权重进行归一化。

w_(k,t)＝(1-α)*w_(k,t-1)+α*M_k,t。

步骤2-3，未匹配模式的均值μ与标准差σ不变，匹配模式的参数按照如下公式进行更新：

ρ＝α*η(X_t|(μ_k,σ_k))

μ_t＝(1-ρ)*μ_t-1+ρ*X_t

步骤2-4，如果步骤2-1中没有匹配到任何模式，那么权重最小的模式被替换，即该模式的均值为当前像素值，标准差为初始较大值，权重为较小值。

步骤2-5，各个模式根据w/α²为标准，降序排列，即权重大且标准差小的模式排列靠前。

经典的混合高斯模型剩下的步骤还包括有选择背景等内容，在本发明中，由于已经通过基于光流法去除视频中快速运动物体的模块，实现了去除快速运动的内容，所以不需要这些步骤。本发明只提取每个像素的最优可能值，改为选择为只选择在步骤2-5排序为第1的高斯模式作为每个像素的模式，然后用该模式的中心值(平均值)μ作为输出。

步骤2-6，提取每个像素排序第1的模式作为该像素的高斯分布。

步骤2-7，用该模式的中心值(平均值)μ替代该像素，取整后，形成一幅图像，作为输出。

具体实施例二

下面结合附图1、2，进一步介绍本发明内容。

本发明基于现有的人工智能、机器视觉技术，提出了一款能够在一段人来人往的视频中，提取出背景(包括静态背景和动态背景)的算法，在拍摄者保持不动的情况下，可以在人员密集处拍摄出只有自己和背景的照片。

在相机固定的前提下，该算法基于光流法和高斯混合模型，先采用光流法获得每张图片的光流运动运动水平，然后用统计整个视频中的光流运动水平的直方图，然后用阈值法进行截取，从而去掉整个视频中运动速度快的物体，即人来人往的图片。然后再对剩下的视频中，采用高斯混合模型，计算每个像素的最可能的高斯分布。最后把每个像素最有可能的高斯分布的中心值，作为输出。

本发明还提及一种在动态视频中提取背景的装置，所述装置包括快速运动物体去除模块和动静态背景中心值计算模块。

所述快速运动物体去除模块用于采用光流法获得视频包含的每帧图片的光流运动水平，建立反映整个视频光流运动水平的直方图，利用阈值法对直方图进行截取，去除视频包含的每帧图片中运动速度快的物体所在的像素。

一、快速运动物体去除模块的作用是在于去掉视频中运动速度快的物体，即在视频中，去除每张图片中人来人往的像素。其步骤包括有：

步骤1-1，用光流法计算并获得视频中每帧图片的光流值。

如图2所示，本实施例中，采用的是800*600(图2中的每个大平行四边形中的格子代表像素)的像素值的固定摄像头，每秒30帧，共计拍摄60秒，即1800帧(图2中上面的、每个大的平行四边形代表原始的每帧图片)。采用的光流法为Lucas-Kanade光流法，那么就可以得到除了第1帧外，1799帧使用光流法计算得到光流值的图片(图2中下面的、每个大的平行四边形代表的光流法得到的光流值的每帧图片)。

本实施例中，把步骤1-1的全部光流值归一化到1～10个等级，作为横坐标，然后计算 1799*800*600个像素中每个等级的个数，作为每个等级的纵坐标。从而得到一个整个视频中光流运动水平的直方图。

本实施例中，既可以采用大津法进行自动阈值判断，也可以采用大于T1的阈值法截取，T1值也可以由使用者自主设定，本实施例中，采用的T1为3，即在1799张图片中删除所有 4～10等级光流速度的像素值，这样在每帧图像中可能形成一个个的空洞。

本实施例中，即为1799帧图片中，N3＝800*600的个像素，计算每个像素原有的每帧值，即1799个值，通过步骤1-3保留下来的值的个数，设置T2为20，如果1799个值中，被删除后，剩下的值低于20，那么判定为不合格像素。假设N3＝800*600个像素中，在1799帧里面，有100个像素保留的像素值低于20，那么此刻进度即为：

(N3-N2)/N3＝(800*600-100)/(800*600)。

如果进度不满足要求，那么就继续拍摄图片，直至满足进度要求100％。应当理解，此处 T1和T2的取值仅为其中的一个例子，用户可以根据自身需求任意设置。

二、动静态背景中心值计算模块的作用是对于步骤1-3获得的视频中，即扣掉每张图片中人来人往的像素的视频中，对于每帧每个位置的像素，均采用高斯混合模型，计算每个像素的最可能的高斯分布，然后获得其高斯分布的中心值，作为每个像素最有可能的值，作为输出。从而达到本算法的目的。需要强调的是，在基于光流法去除视频中快速运动物体的模块中，其每帧中删除掉的内容不参与本模块计算。

本实施例中，在本模块输入的图像是步骤1-4处理后，假设800*600个像素全部合格的视频，该视频为1799帧，其内容为原始拍摄的图片，不是光流图片，这1799帧图片，为删除掉光流值等级大于等于4的的像素值的含有很多空洞的图片，这些被删除掉的空洞不参与进一步的基于高斯混合模型的动静态背景中心值计算的模块的计算。

本实施例中，K被设置为5。一开始5组高斯分布的参数η(x_t,μ_(i,t),τ_(i,t))都是由第一张图片设定的，在施行的过程中，再不断改变的。它们的一开始的平均值μ_(i,t)均是第一张图片的像素值，它们的方差

默认第一次时设置为36个像素值，因此它们的其协方差矩阵τ_(i,t)即为：

动静态背景中心值计算模块的详细的算法流程为：

步骤2-1，每个新像素值X_t同当前K个模型按下式进行比较，直到找到匹配新像素值的分布模型，即同该模型的均值偏差在2.5个σ以内：

|X_t-μ_(i,t-1)|≤2.5σ。

本实施例中，K被设置为4，即共计有5个模型。

w_(k,t)＝(1-α)*w_(k,t-1)+α*M_k,t

本实施例中，学习速率α被设置为0.01。

ρ＝α*η(X_t|(μ_k,σ_k))

μ_t＝(1-ρ)*μ_t-1+ρ*X_t

通过实现本发明，我们可以在相机固定的前提下，能够在视频中，一是自动把背景(包括静态背景和动态背景)与运动的物体区分开来，拼凑成纯背景的照片，二是自动提醒提取的完成度，那么就可以很好的让拍摄者在人员密集处拍摄出背景的照片，而当拍摄者自己保持不动的情况下，可以被理解成背景，成为一张在人员密集处拍摄出来只有自己和背景的照片。

以上仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，应视为本发明的保护范围。