WO2015117464A1

WO2015117464A1 - 一种视频图像处理装置和方法

Info

Publication number: WO2015117464A1
Application number: PCT/CN2014/091796
Authority: WO
Inventors: 王溢
Original assignee: 中兴通讯股份有限公司
Priority date: 2014-08-20
Filing date: 2014-11-20
Publication date: 2015-08-13
Also published as: CN105357575A

Abstract

本发明提供了一种视频图像处理装置和方法，其中方法包括：将视频图像文件中的视频图像转化为RGB格式的序列图像；对所述序列图像进行统计，得到每一个像素每个颜色通道的颜色值的分布模型；对通过分布模型判断该像素为背景像素，或者判断该像素为非背景像素；若所述像素被标记为背景像素的像素，则对像素颜色值不进行处理；若所述像素被标记为非背景像素的像素，则利用与所述分布模型相关的值来替代该像素值。

Description

一种视频图像处理装置和方法

技术领域

本发明涉及通讯技术领域，尤其涉及一种视频图像处理装置和方法。

背景技术

随着智能终端的普及，用户对智能终端上的应用要求也越来越多样化，手机摄像头的像素也越来越高，手机自带相机大有取代传统相机的趋势。

随着手机相机功能的日趋强大，越来越多的人外出旅行游玩已经用手机替代了传统的照相机，摄像机。因为手机轻便快捷，而且随着手机处理器性能的提升，照片和视频的后处理功能可以直接集成在手机中，使得用户可以很便捷的使用手机完成、甚至超越以前传统相机所能完成的功能。

手机拍摄视频中经常会遇到这类问题：就是在环境内容非常复杂的场景中拍摄到的视频中经常碰到所需要突出表现的内容被其他内容影响，遮挡等问题。比如：在车水马龙的街道上拍摄人物视频，经常被过往的车辆影响，再比如在一个旅游景点前面拍摄一段景物视频，经常被来回走动的人影响。从这类复杂环境中剔除掉不需要的运动物体，保留我们需要的背景图像是一个非常强烈的需求。如果可以通过算法让手机自动识别并得到我们需要的静止背景，将非常好的满足用户的这类需求。

发明内容

为了克服现有技术中存在的技术问题，本发明实施例提供了一种视频图像处理装置和方法。

本发明实施例提供了一种视频图像处理方法，包括步骤：

将视频图像文件中的视频图像转化为RGB格式的序列图像；

对所述序列图像进行统计，得到所述序列图像中的每一个像素每个颜色通道的颜色值的分布模型；

通过所述分布模型标记所述序列图像中的像素为背景像素，或者标记所述序列图像中的像素为非背景像素；

若所述像素被标记为背景像素，则对像素颜色值不做处理；若所述像素被标记为非背景像素，则利用与所述分布模型相关的值来替代该像素值。

在一个实施例中，所述的视频图像处理方法中，将视频图像文件中的视频图像转化为RGB格式的序列图像步骤包括：

将视频图像文件按一定的大小分成多个数据块，并将所述多个数据块读入缓冲区；

将每个数据块中的视频图像文件根据压缩标准将视频流和音频流分开；

根据视频压缩格式标准对所述视频流进行解码；

将解码后的视频图像格式转换成RGB格式。

在一个实施例中，所述的视频图像处理方法中，对所述序列图像的一段进行统计，得到每个像素每个颜色通道的颜色值的分布模型步骤具体包括：

得到所述序列像素中当前时刻当前像素的测量概率；

根据当前像素一小邻域内的相邻像素得到当前像素当前颜色值的自信息；

计算当前像素颜色值发生的概率。

在一个实施例中，所述的视频图像处理方法中，通过所述分布模型标记所述序列图像中的像素为背景像素，或者标记所述序列图像中的像素为非背景像素步骤包括：

计算当前像素的修正自信息；

给出假设检验的置信水平；

通过与置信水平的比较，判断当前像素的颜色值是否符合分布模型的统计规律，如果当前像素的颜色值符合分布模型的统计规律，则判断该像素为背景像素，否则判断该像素为非背景像素。

在一个实施例中，所述的视频图像处理方法中，若所述当前像素被标记为背景像素，像素颜色值不做处理；所述当前像素被标记为非背景像素，则利用与所述分布模型相关的值来替代该像素值步骤之后，该方法还包括步骤：

显示输出背景像素和非背景像素的图像。

本发明实施例还提供了一种视频图像处理装置，包括：

预处理模块，配置为将视频图像文件中的视频图像转化为RGB格式的序列图像；

像素统计建模模块，配置为对所述序列图像进行统计，得到所述序列图像中的每一个像素每个颜色通道的颜色值的分布模型；

像素值假设检验模块，通过所述分布模型标记所述序列图像中的像素为背景像素，或者标记所述序列图像中的像素为非背景像素；

背景分割模块，配置为处理被标记的像素，确定所述像素被标记为背景像素，则对像素颜色值不做处理；确定所述像素被标记为非背景像素，则利用与所述分布模型相关的值来替代该像素值。

在一个实施例中，所述的视频图像处理装置中，所述预处理模块包括：

视频文件读入模块，配置为将视频图像文件按一定的大小分成多个数据块，并将所述多个数据块读入缓冲区；

音视频流分离模块，配置为将每个数据块中的视频图像文件根据压缩标准将视频流和音频流分开；

视频解码模块，配置为根据视频压缩格式标准对所述视频流进行解码；

图像格式统一转换模块，配置为将解码后的视频图像格式换成RGB格式。

在一个实施例中，所述的视频图像处理装置中，所述像素统计建模模块具体配置为：

得到所述序列像素中当前时刻当前像素的测量概率；

计算当前像素颜色值发生的概率。

在一个实施例中，所述的视频图像处理装置中，所述像素值假设检验模块具体配置为：

计算当前像素的修正自信息；

给出假设检验的置信水平；

在一个实施例中，所述的视频图像处理装置中，所述视频图像处理装置还包括：

显示模块，配置为显示输出背景像素和非背景像素的图像。

本发明实施例的有益效果是：本发明实施例的视频图像处理方法，通过对视频图像文件中进行处理，自动识别并剔除掉序列图像中的运动前景，输出给用户显示的视频则是去掉了运动干扰的纯净背景的图像序列。满足了用户需要静止的背景剔除运动背景的需要。

附图说明

图1表示本发明实施例中视频图像处理方法的主要流程图；

图2表示本发明实施例中视频图像处理方法的详细流程图；

图3表示本发明实施例中视频图像处理方法中对像素统计建模的详细流程图；

图4表示本发明实施例中视频图像处理方法中对像素值假设检验的详细流程图；

图5表示本发明实施例中视频图像处理装置的主要模块组成图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图及具体实施例对本发明进行详细描述。

参照图1所示，本发明实施例提供了一种视频图像处理方法，包括：

步骤1，将视频图像文件中的视频图像转化为RGB格式的序列图像；

步骤2，对所述序列图像进行统计，得到每一个像素每个颜色通道的颜色值的分布模型；

步骤3，通过所述分布模型，标记所述序列图像中的像素为背景像素，或者标记所述序列图像中的像素为非背景像素；

步骤4，若被标记为背景像素的像素，像素颜色值不做改变；被标记为非背景像素的像素，则利用一关于所述分布模型的值来替代该像素值。

参照图2所示，本发明实施例视频图像处理方法的详细流程如下：将视频图像文件(包括视频流)按一定大小分成多个数据块，并将所述多个数据块读入缓冲区，将每个数据块中的视频图像文件根据压缩标准将视频流和音频流分开，其中纯音频流做正常的处理。将其中的视频流进行解码后，格式换成RGB格式；对所述序列图像的一段进行统计，得到每一个像素每个颜色通道的颜色值的分布模型；对所述序列图像中的每一个像素每个颜色通道的颜色值做统计学上的假设检验，如果当前像素的颜色值符合分布模型的统计规律，则判断该像素为背景像素，否则判断该像素为非背景像素；若被标记为背景像素的像素，像素颜色值不做改变；被标记为非背景像素的像素，则利用一关于所述分布模型的值来替代该像素值。将背景像素和非背景像素都进行显示输出。

其中，将视频图像文件中的视频图像转化为RGB格式的序列图像步骤包括：将视频图像文件按一定的数据块大小读入缓冲区；将每个数据块中的视频图像文件根据压缩标准将视频流和音频流分开；根据视频压缩格式标准对所述视频流进行解码；将解码后的视频图像格式换成RGB格式；包括显示输出被标记为背景像素的图像的步骤。实现过程基本上也已经标准化，只不过是不同的终端具体实现的时候，缓冲区的大小，解码的方案(软件解码还是硬件解码)有所差异，涉及图像格式的转换，也就是通过不同格式之间的标准对应关系做矩阵变化就可以实现。本发明在此地方就不在累赘。

对所述序列图像的一段进行统计，得到每个像素每个颜色通道的颜色值的分布模型步骤具体包括：得到所述序列像素中当前时刻当前像素的测量概率；根据当前像素一小邻域内的相邻像素得到当前像素当前颜色值的自信息；计算当前像素颜色值发生的概率。

参照图3所示，像素统计建模的具体实现如下：

设当前像素前N帧的颜色值组成的样本序列为{x₁,x₂...x_i...x_N}，其中x_i为第i帧，当前像素的颜色值向量，由于统一采用RBG格式的图像，那么x_i就是三维的向量，可以表示为x_i＝(r_i,g_i,b_i),其中r_i,g_i,b_i分别表示红绿蓝三-个颜色通道的颜色值。根据统计学中的参数估计方法，可以得到像素当前时刻t的量测x_t的概率p(x_t)可以由下式得到。

另外式中，α_i为权重系数，K_σ(x_t-x_i)为像素颜色值的分布函数，σ为窗半径，像素颜色值的分布函数可以选为均匀分布，正态分布，三角分布，二项分布等等。

序列图像中某个点的像素值受到光线，摄像机轻微抖动，运动物体干扰等，显而易见均匀分布，三角分布，二项分布等都不太适合描述像素颜色值的分布，正态分布则可以比较好的描述像素颜色值的分布规律。正态分布规律下68.268949％的面积在平均数左右的一个标准差范围内。95.449974％的面积在平均数左右两个标准差2σ的范围内。99.730020％的面积在平均数左右三个标准差3σ的范围内。99.993666％的面积在平均数左右四个标准差4σ的范围内。对于序列图像中固定的某一个像素而言，其颜色值显然是在某一个标准差的范围内来回波动，如果光线，抖动等影响忽略，那么颜色值就是固定的一个值，即就是正态分布的均值。

经过以上过程可以得到像素x的当前时刻量测的概率。设y为像素x的一个小邻域内的任意一个像素，该小邻域满足dis(x,y)≤δ,其中dis(x,y)为x和y两个像素点在图像中的空间距离，δ为一个常数。同理我们可以得到像素y当前像素颜色值发生的概率p(y_t)和利用像素y的样本来估计像素x的当前像素颜色值发生的概率p(x_t|B_y)。用p(x_t|B_y)去除p(x_t)，然后再去对数得到I(x_t；y)。将其称为像素x的邻域像素y对像素x的信息贡献。

由于对于像素x来说满足dis(x,y)≤δ的像素y有好多个，不妨计为m个，对于x的m个邻域像素中的每一个像素我们都能得到一个I(x_t；y)，从而对于像素x就得到了m个I(x_t；y)，将这m个值简化的记为I₁,I₂...I_m。

根据信息论中的知识可以得到像素x的当前颜色值为x_t这一随机事件的自信息：

I_x＝-log₂p(x_t) (2-2)

其中，I_x表示了像素x的当前颜色值为x_t这一随机事件的不确定性，根据上式，I_x越大，表示像素x的当前颜色值为x_t这一随机事件的概率越小，概率越小，说明当前颜色值越不符合像素颜色值分布模型，则越有可能是非背景。

定义像素x的当前颜色值为x_t这一随机事件的修正自信息：

其中式中，β为一个系数。

至此，像素颜色值的分布模型建立完成。

接着，通过所述分布模型标记所述序列图像中的像素为背景像素，或者标记所述序列图像中的像素为非背景像素。

本发明实施例中，通过所述分布模型标记序列像素中的图像具体是：对所述序列图像中的每一个像素每个颜色通道的的颜色值做统计学上的假设检验，如果当前像素的颜色值符合分布模型的统计规律，则判断该像素为背景像素，否则判断该像素为非背景像素。

通过所述分布模型标记所述序列图像中的像素为背景像素，或者标记所述序列图像中的像素为非背景像素步骤包括：计算当前像素的修正自信息；给出假设检验的置信水平；通过与置信水平的比较，判断当前像素的颜色值是否符合分布模型的统计规律，如果当前像素的颜色值符合分布模型的统计规律，则判断该像素为背景像素，否则判断该像素为非背景像素。

参照图4所示，通过分布模型标记序列图像中的像素步骤具体实施如下：

统计学中的假设检验可以用来检验某一随机变量是否服从某种概率分布的假设，然后利用样本资料采用一定的统计方法计算出有关检验的统计量，依据一定的概率原则，以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异，是否应当接受原假设选择的一种检验方法。用到本发明实施例中，就是我们得到像素值的颜色分布模型之后，对于序列图像中当前帧的某一个像素的颜色值，都可以检验该颜色值是否以某一个很大的概率符合这个模型，只有以很大的概率符合这个模型时，则可以认为该像素在当前帧中没有被非背景干扰，是背景像素。假设检验时预先设定的检验水准取为0.05等比较小的一个值，其意思就是当检验假设为真，但被错误地拒绝的概率为0.05。放在本发明实施例中，就是说当前像素值以95％的概率是符合像素颜色值分布模型的，由此则可判定该像素很高的概率是背景像素。由此可以设置95％为区分背景像素和前景像素的分割概率，当然该概率值也可以随着实际场景的复杂程度改变而改变。具体选择方法就是实际场景越复杂，则正态分布模型的方差越大，该概率值选择应该越小。总之，设置一个概率阈值用来检验当前像素是否符合分布模型。

对标记后的像素，进行背景分隔处理，若当前像素被标记为背景像素，像素颜色值不做处理；当前像素被标记为非背景像素，则利用一关于所述分布模型的值来替代该像素值。

本发明实施例中，使用分布模型的均值进行代替，也可以使用一关于分布模型的其他的值作为替代像素值。

背景分割的具体实现如下：

根据假设检验模块的概率阈值，可以用来区分当前像素是否符合分布模型。根据公式，我们可以将概率阈值对应为I′_x的阈值I_th。

如果I′_x≥I_th则认为像素x为非背景，否则认为像素x为背景。I_th为用户给出的分割阈值。

本发明实施例综合考虑了像素本身的信息和邻域像素信息对中心像素的影响，用二者的联合来进行背景区域的分离。如果图像中存在一个像素点x不考虑邻域信息被认为成非背景即I_x比较大，而用它的邻域内的像素来判断都认为该像素点是背景，即p(x_t)远小于p(x_t|B_y)，从而得到的I₁,I₂...I_m都小于零，从而就得到I′_x要小于I_x，则可能会使I′_x小于I_th从而将该像素判断为背景。因为周围都是背景像素，中心像素为非背景时，很大程度上该中心像素点都是噪声，更贴合实际场景，使得判断更准确。

被标记为背景的像素，像素颜色值不做改变。如果是非背景，说明该像素在当前帧中是运动干扰，则利用一关于分布模型的值来替代该该像素值，从而达到去取干扰的目的。

至此，则可以智能的逐帧逐像素的进行背景和非背景的区分，输出给用户显示的视频则是去掉了运动干扰的纯净背景的图像序列。

参照图5所示，本发明实施例提供了一种视频图像处理装置，包括：

预处理模块100，配置为将视频图像文件中的视频图像转化为RGB格式的序列图像；

像素统计建模模块200，配置为对所述序列图像进行统计，得到每一个像素每个颜色通道的颜色值的分布模型；

像素值假设检验模块300，配置为通过分布模型标记所述序列图像中的像素为背景像素，或者标记所述序列图像中的像素为非背景像素；

背景分割模块400，配置为处理被标记的像素，若被标记为背景像素的像素，像素颜色值不做改变；被标记为非背景像素的像素，则利用与所述分布模型相关的值来替代该像素值。

预处理模块包括：视频文件读入模块，配置为将视频图像文件按一定的大小分成多个数据块，将多个数据块读入缓冲区；

图像格式统一转换模块，配置为将解码后的视频图像格式换成RGB格式。视频文件读入模块、音视频流分离模块和视频解码模块在很多带视频功能的终端上都已经成为了标准化模块。实现过程基本上也已经标准化，只不过是不同的终端具体实现的时候，缓冲区的大小，解码的方案(软件解码还是硬件解码)有所差异，本发明在此地方就不在累赘，图像格式统一转换模块涉及图像格式的转换，也就是通过不同格式之间的标准对应关系做矩阵变化就可以实现。

所述像素统计建模模块具体配置为：得到所述序列像素中当前时刻当前像素的测量概率；根据当前像素一小邻域内的相邻像素得到当前像素当前颜色值的自信息；计算前像素颜色值发生的概率。

像素值假设检验模块具体配置为：计算当前像素的修正自信息；给出假设检验的置信水平；判断当前像素的颜色值是否符合分布模型的统计规律，如果当前像素的颜色值符合分布模型的统计规律，则判断该像素为背景像素，否则判断该像素为非背景像素。

视频图像处理装置还包括显示模块，配置为显示输出被背景像素和非背景像素的图像。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。

Claims

一种视频图像处理方法，该方法包括：

将视频图像文件中的视频图像转化为RGB格式的序列图像；

对所述序列图像进行统计，得到所述序列图像中的每一个像素每个颜色通道的颜色值的分布模型；

通过所述分布模型标记所述序列图像中的像素为背景像素，或者标记所述序列图像中的像素为非背景像素；

若所述像素被标记为背景像素，则对像素颜色值不进行处理；若所述像素被标记为非背景像素，则利用与所述分布模型相关的值来替代该像素值。
如权利要求1所述的视频图像处理方法，其中，所述将视频图像文件中的视频图像转化为RGB格式的序列图像，包括：

将视频图像文件按大小分成多个数据块，并将所述多个数据块读入缓冲区；

将每个数据块中的视频图像文件根据压缩标准将视频流和音频流分开；

根据视频压缩格式标准对所述视频流进行解码；

将解码后的视频图像格式转换成RGB格式。
如权利要求1所述的视频图像处理方法，其中，所述对所述序列图像进行统计，得到每个像素每个颜色通道的颜色值的分布模型，包括：

得到所述序列像素中当前时刻当前像素的测量概率；

根据当前像素一小邻域内的相邻像素得到当前像素当前颜色值的自信息；

计算当前像素颜色值发生的概率。
如权利要求1所述的视频图像处理方法，其中，所述通过所述分布模型标记所述序列图像中的像素为背景像素，或者标记所述序列图像中的像素为非背景像素，包括：

计算当前像素的修正自信息；

给出假设检验的置信水平；

通过与置信水平的比较，判断当前像素的颜色值是否符合分布模型的统计规律，如果当前像素的颜色值符合分布模型的统计规律，则判断该像素为背景像素，否则判断该像素为非背景像素。
如权利要求1所述的视频图像处理方法，其中，所述利用与所述分布模型相关的值来替代该像素值之后，该方法还包括：

显示输出背景像素和非背景像素的图像。
一种视频图像处理装置，该装置包括：

预处理模块，配置为将视频图像文件中的视频图像转化为RGB格式的序列图像；

像素统计建模模块，配置为对所述序列图像进行统计，得到所述序列图像中的每一个像素每个颜色通道的颜色值的分布模型；

像素值假设检验模块，通过所述分布模型标记所述序列图像中的像素为背景像素，或者标记所述序列图像中的像素为非背景像素；

背景分割模块，配置为处理被标记的像素，确定所述当前像素被标记为背景像素，则对像素颜色值不进行处理；确定所述当前像素被标记为非背景像素，则利用与所述分布模型相关的值来替代该像素值。
如权利要求6所述的视频图像处理装置，其中，所述预处理模块包括：

视频文件读入模块，配置为将视频图像文件按大小分成多个数据块，并将所述多个数据块读入缓冲区；

音视频流分离模块，配置为将每个数据块中的视频图像文件根据压缩标准将视频流和音频流分开；

视频解码模块，配置为根据视频压缩格式标准对所述视频流进行解码；

图像格式统一转换模块，配置为将解码后的视频图像格式转换成RGB格式。
如权利要求6所述的视频图像处理装置，其中，所述像素统计建模模块，配置为：

得到所述序列像素中当前时刻当前像素的测量概率；

根据当前像素一小邻域内的相邻像素得到当前像素当前颜色值的自信息；

计算当前像素颜色值发生的概率。
如权利要求6所述的视频图像处理装置，其中，所述像素值假设检验模块，配置为：

计算当前像素的修正自信息；

给出假设检验的置信水平；

通过与置信水平的比较，判断当前像素的颜色值是否符合分布模型的统计规律，如果当前像素的颜色值符合分布模型的统计规律，则判断该像素为背景像素，否则判断该像素为非背景像素。
如权利要求6所述的视频图像处理装置，其中，所述视频图像处理装置还包括：

显示模块，配置为显示输出背景像素和非背景像素的图像。