CN104243994B

CN104243994B - 一种实时运动感知图像增强的方法

Info

Publication number: CN104243994B
Application number: CN201410500982.0A
Authority: CN
Inventors: 孔令波
Original assignee: Xiamen Yealink Network Technology Co Ltd
Current assignee: Xiamen Yilian Communication Technology Co ltd
Priority date: 2014-09-26
Filing date: 2014-09-26
Publication date: 2017-06-27
Anticipated expiration: 2034-09-26
Also published as: CN104243994A

Abstract

本发明提供一种实时运动感知图像增强的方法，适用于视频会议系统，将前景、背景分离算法与图像编码器相结合，通过前景、背景分离算法获取图像的前景区域、背景区域和前景区域运动向量，并传输给图像编码器，增加了图像编码器先验知识，图像编码器根据当前编码宏块所处不同区域采用不同的策略进行编码。本发明的优点是：通过降低图像编码器的计算量，减少了图像编码器的性能消耗，又提高了图像编码器运动搜索的准确性，进而有效地提升了编码图像的质量。

Description

一种实时运动感知图像增强的方法

技术领域

本发明涉及视频编码领域，更具体地说，涉及一种实时运动感知图像增强、提升运动图像编码质量的方法。

背景技术

在视频编码领域，针对静态图像编码效率高，编码图像质量好，但是针对动态图像或者动态内容，在同等带宽条件下，编码效果较静态图像有一定差距，并且带宽越低，差异越明显。当前视频编码系统基本采用原始编码器的策略，针对新的一帧待编码图像没有任何先验知识，一般以图像宏块(一般是16*16的像素块)为单位，通过运动搜索(MotionEstimation)手段来判断该宏块是否运动，计算量大，并且过于局限于局部信息，部分情况下搜索匹配效果较差，影响编码图像质量。

混合高斯模型就是使用多个（基本为3到5个）高斯模型来表征图像中各个像素点的特征,在新一帧图像获得后更新混合高斯模型,用当前图像中的每个像素点与混合高斯模型匹配,如果成功则判定该点为背景点, 否则为前景点。

目前存在的相关技术，比如2014-05-14公开的，公开号为103796028A的中国发明《一种视频编码中基于图像信息的运动搜索方法和装置》，其特征在于，所述方法包括：先对当前待编码图像进行前、背景性质划分，得到该图像的前、背景信息；再根据所述前景信息对前景区域采用高复杂度搜索方法，根据所述背景信息对背景区域采用低复杂度搜索方法。与该发明相比，本发明方法对前景信息和量化信息进行了不同的量化控制，有效提升了图像编码的整体效果，且本发明使用图像前景运动向量信息作为运动搜索的起始点，增加了编码器先验知识，从而进一步提升了运动搜索的准确性。

再如2013-06-26公开的，公开号为103179402A的中国发明《一种视频压缩编码与解码方法及其装置》，其特征在于，所述方法包括；实时建立视频的背景模型，并根据背景模型对背景视频进行压缩编码；检测前景运动目标，保存前景运动目标的相关信息，并根据检测到的前景运动目标对前景视频数据进行压缩编码；将所述压缩编码后的背景视频数据和前景视频数据融合后解码进行视频播放。该发明对前景、背景分别编码，并且解码端对两部分信息进行融合与解码操作，需要配对编码和解码系统，应用范围受限，而本发明方法仅仅使用前、背景信息对整幅图像进行编码，最终输出为一路码流，不需要解码端的任何处理，通用性更好。

发明内容

本发明要解决的技术问题，在于提供一种实时运动感知图像增强的方法，将前景、背景分离算法与图像编码器相结合，通过前景、背景分离算法获取图像的前景区域以及背景区域信息，并且将该信息传输给图像编码器，图像编码器对不同区域采用不同策略进行编码，从而提升总体编码图像的质量。

本发明要解决的技术问题是这样实现的：一种实时运动感知图像增强的方法，适用于视频会议系统，所述方法包括如下步骤：

步骤10、根据实际场景及需求动态调节图像的帧率，并对其中分辨率较高的图像进行缩小操作，降低图像的分辨率，这样可以减少系统性能的消耗；

步骤11、对经过步骤10处理后的图像建立混合高斯模型，判别所述图像的背景点与前景点，作为输出的背景信息和前景信息；

步骤12、提取步骤11输出的所述前景信息，对所述前景信息进行聚类操作，从而得到前景区域，然后剔除较小的前景区域；

步骤13、利用卡尔曼滤波算法（所述卡尔曼滤波算法是一种最优化自回归数据处理算法，它是现有的公开算法）在所述前景区域内进行目标跟踪，得到前景区域的运动向量；

步骤14、将所述前景信息、背景信息和前景区域的运动向量作为图像的先验知识传递给图像编码器进行运动搜索和量化控制；

步骤15、进行图像编码。

进一步的，所述聚类操作是通过八邻域连通搜索算法（所述八邻域连通搜索算法是以一像素点为中心，搜索它的八个领域点作为一个连通区域的现有公开算法）对以像素为单位的前景信息进行处理，获得与每个像素点连通的矩形区域的集合作为前景区域。

进一步的，所述剔除较小的前景区域是采用噪声滤波的方式，设定一个滤波阈值，滤除低于该滤波阈值的前景区域。

进一步的，所述运动搜索是，图像编码器根据判断当前编码宏块所在区域进行不同位置的运动搜索：若当前编码宏块处于背景区域，则以当前位置作为起始点进行运动搜索，若当前编码宏块处于前景区域，则以所述前景区域的运动向量作为起始点进行运动搜索，这样进一步提升了运动搜索的准确性。

进一步的，所述量化控制是，图像编码器根据判断当前编码宏块所在区域来调整区域的量化参数：若当前编码宏块处于背景区域，则调整背景区域的量化参数比当前编码宏块邻域的量化参数大，若当前编码宏块处于前景区域，则调整前景区域的量化参数比当前编码宏块邻域的量化参数小，且所述背景区域的量化参数与当前编码宏块邻域的量化参数、所述前景区域的量化参数与当前编码宏块邻域的量化参数的差值范围均由图像编码器性能决定；根据不同区域调整相应的量化参数，可以有效提升编码图像的整体效果。

与现有技术相比，本发明具有如下优点：

1、前景、背景分离算法与图像编码器结合，获取准确的前景信息以及背景信息，增加了图像编码器先验知识，即根据当前编码宏块所处前景区域或者背景区域，为图像编码器提供不同的量化控制策略，进而提升编码图像质量；

2、通过前景、背景分离算法获得前景区域的运动向量，提高图像编码器运动搜索的准确性，进而可以降低图像编码器的计算量（通常编码器的运动搜索模块性能耗费占整个编码器性能耗费的60%以上），特别是针对大分辨率编码系统（例如1080P编码）很有意义。

附图说明

下面参照附图结合实施例对本发明作进一步的说明。

图1为本发明方法执行流程图。

具体实施方式

请参阅图1，本发明一种实时运动感知图像增强的方法，此方法适用于视频会议系统，包括如下步骤：

步骤12、提取步骤11输出的所述前景信息，对所述前景信息进行聚类操作，从而得到前景区域覆盖范围并剔除覆盖范围过小的前景区域；

步骤13、利用卡尔曼滤波算法在所述前景区域的覆盖范围内进行目标跟踪，得到前景区域的运动向量；

步骤15、进行图像编码。

所述步骤10至步骤13作为前景、背景分离算法的整体，得到前景信息、背景信息和前景区域的运动向量传递给图像编码器，增加了图像编码器先验知识，进而有利于提升编码图像质量。

所述聚类操作是通过八邻域连通搜索算法对以像素为单位的前景信息进行处理，获得与每个像素点连通的矩形区域的集合作为前景区域；例如，以一像素点为中心，可以取与该像素点邻近的上、下、左、右、左上、左下、右上、右下共八个像素点围成一个连通的矩形区域。

所述剔除覆盖范围过小的前景区域是采用噪声滤波的方式，根据实际场景设定一个滤波阈值，滤除低于该滤波阈值的前景区域，例如，在视频会议系统中，可以设定滤波阈值为图像总像素数目的5%。

所述运动搜索是，图像编码器根据判断当前编码宏块所在区域进行不同位置的运动搜索：若当前编码宏块处于背景区域，则以当前位置作为起始点进行运动搜索，若当前编码宏块处于前景区域，则以所述前景区域的运动向量作为起始点进行运动搜索，这样可以进一步提升运动搜索的准确性。

所述量化控制是，图像编码器根据判断当前编码宏块所在区域来调整区域的量化参数：若当前编码宏块处于背景区域，则调整背景区域的量化参数比当前编码宏块邻域的量化参数大，若当前编码宏块处于前景区域，则调整前景区域的量化参数比当前编码宏块邻域的量化参数小，且所述背景区域的量化参数与当前编码宏块邻域的量化参数、所述前景区域的量化参数与当前编码宏块邻域的量化参数的差值范围均由图像编码器性能决定；以h.264编码器为例，所述差值范围最大不能超过4；根据当前编码宏块所处不同区域调整相应的量化参数，可以有效提升编码图像的整体效果。

本发明方法适用于视频会议系统，但不局限于视频会议系统，还可以应用在其它动态图像处理的过程，既能减少图像编码器性能消耗，又能有效提升编码图像的质量，通用性更好。

虽然以上描述了本发明的具体实施方式，但是熟悉本技术领域的技术人员应当理解，我们所描述的具体的实施例只是说明性的，而不是用于对本发明的范围的限定，熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化，都应当涵盖在本发明的权利要求所保护的范围内。

Claims

1.一种实时运动感知图像增强的方法，适用于视频会议系统，其特征在于：所述方法包括如下步骤：

步骤10、根据实际场景及需求动态调节图像的帧率，并对其中分辨率较高的图像进行缩小操作，降低图像的分辨率；

步骤13、利用卡尔曼滤波算法在所述前景区域内进行目标跟踪，得到前景区域的运动向量；

步骤15、进行图像编码。

2.根据权利要求1所述的一种实时运动感知图像增强的方法，其特征在于：所述聚类操作是通过八邻域连通搜索算法对以像素为单位的前景信息进行处理，获得与每个像素点连通的矩形区域的集合作为前景区域。

3.根据权利要求1所述的一种实时运动感知图像增强的方法，其特征在于：所述剔除较小前景区域是采用噪声滤波的方式，设定一个滤波阈值，滤除低于该滤波阈值的前景区域。

4.根据权利要求1所述的一种实时运动感知图像增强的方法，其特征在于：所述运动搜索是，图像编码器根据判断当前编码宏块所在区域进行不同位置的运动搜索：若当前编码宏块处于背景区域，则以当前位置作为起始点进行运动搜索，若当前编码宏块处于前景区域，则以所述前景区域的运动向量作为起始点进行运动搜索。

5.根据权利要求1所述的一种实时运动感知图像增强的方法，其特征在于：所述量化控制是，图像编码器根据判断当前编码宏块所在区域来调整区域的量化参数：若当前编码宏块处于背景区域，则调整背景区域的量化参数比当前编码宏块邻域的量化参数大，若当前编码宏块处于前景区域，则调整前景区域的量化参数比当前编码宏块邻域的量化参数小，且所述背景区域的量化参数与当前编码宏块邻域的量化参数、所述前景区域的量化参数与当前编码宏块邻域的量化参数的差值范围均由图像编码器性能决定。