CN103796028B - 一种视频编码中基于图像信息的运动搜索方法 - Google Patents

一种视频编码中基于图像信息的运动搜索方法 Download PDF

Info

Publication number
CN103796028B
CN103796028B CN201410067035.7A CN201410067035A CN103796028B CN 103796028 B CN103796028 B CN 103796028B CN 201410067035 A CN201410067035 A CN 201410067035A CN 103796028 B CN103796028 B CN 103796028B
Authority
CN
China
Prior art keywords
search
background
foreground
information
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410067035.7A
Other languages
English (en)
Other versions
CN103796028A (zh
Inventor
田永鸿
赵龙
黄铁军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN201410067035.7A priority Critical patent/CN103796028B/zh
Publication of CN103796028A publication Critical patent/CN103796028A/zh
Application granted granted Critical
Publication of CN103796028B publication Critical patent/CN103796028B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种视频编码中基于图像信息的运动搜索方法和装置,属于数字媒体处理技术领域中的视频编码技术,包括图像前背景性质划分模块、背景区域搜索模块、前景区域搜索模块;对当前待编码图像进行前、背景性质划分,得到该图像的前、背景信息;对于前景区域和背景区域,分别采用高复杂度搜索方法及低复杂度搜索方法;本发明的益处在于:利用背景建模所生成的背景,可以将编码图像中划分为前景区域和背景区域。对当前图像某区域进行编码时,可以利用其前背景信息设计运动搜索方法,在保证编码质量不显著下降的前提下减小运动搜索的复杂度。

Description

一种视频编码中基于图像信息的运动搜索方法
技术领域
本发明涉及一种视频编码中基于图像信息的运动搜索方法和装置,属于数字媒体处理技术领域中的视频编码技术。
背景技术
视频编码中为在参考图像中找到同当前图像编码区域差异最小的区域,需要进行运动搜索。然而由于搜索范围大,导致运动搜索复杂度高,增加了视频编码中运动估计模块的复杂度。
运动搜索加速的目标是在编码性能不显著下降的前提下减少运动搜索的次数,以达到降低搜索复杂度的目的。在视频中,编码图像可划分为前景和背景,其中背景静态,同时前景运动幅度大。当前运动搜索方法中,对于编码图像所有区域采用相同的搜索方法,导致对视频中的背景区域进行了大量不必要的搜索,且在前景区域没有进行精细的搜索以达到提高编码性能的作用。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种视频编码中基于图像信息的运动搜索方法和装置。
为了实现上述发明目的,本发明提出了一种视频编码中基于图像信息的运动搜索方法,包括如下步骤:
步骤1)对当前待编码图像进行前景区域和背景区域性质划分,得到该图像的前景信息和背景信息;
步骤2)根据前景信息,对前景区域采用高复杂度搜索方法;根据背景信息,对背景区域采用低复杂度搜索方法。
所述步骤1)还包括:采用基于背景建模的划分方法,首先对视频进行背景建模,然后利用建模的背景图像同当前待编码图像的差异进行前景区域和背景区域性质划分;将当前待编码图像待划分区域同背景图像对应区域的绝对差值和与预设的阈值进行比较,小于这一阈值为背景区域,大于这一阀值为前景区域,同时,保留当前待编码图像的前景信息和背景信息;当前待编码图像作为后续图像运动搜索的参考图像时,当前待编码图像的前景信息和背景信息作为后续图像运动搜索的参考信息;或者采用基于图像分割的划分方法对前景区域和背景区域进行性质划分。
所述步骤2)还包括:
背景区域采用低复杂度的搜索方法,限制搜索范围并采用简单的搜索模式;
前景区域采用高复杂度的搜索方法,采用更大的搜索范围及复杂的搜索模式。
对于背景区域,搜索范围限定为只对运动矢量为零的点进行搜索,或减小搜索窗的大小,将搜索窗大小设置为1x1进行小范围搜索;所采用的搜索模式可选择四步搜索模式、单菱形搜索模式、非迭代的搜索模式。
四步搜索模式为:第一步,在5x5的搜索窗中搜索分布为正方形的9个点。如果最优匹配点在中心,则转到第四步。第二步,以该最优匹配点为中心,在5x5搜索窗上按第一步搜索模式搜索未被搜索的点。如果新的最优匹配点在中心,则转到第四步;否则,进行第三步。第三步,按照第二步的模式进行迭代搜索。第四步,以最优匹配点为中心,在3x3的搜索窗中搜索未被搜索的点,得到的最优匹配点为最终结果。
菱形搜索模式为,搜索点的分布为菱形分布。
非迭代的搜索模式为,所设计的搜索模式中,当最优匹配点不为中心点时,不以最优匹配点为新的中心进行迭代搜索,搜索只顺序进行。
对于前景区域高复杂度的搜索方法,采用多菱形搜索模式、矩形搜索模式、十字搜索模式,并可进行多模式组合搜索与迭代搜索。
多菱形搜索模式为,搜索点分布为多层菱形。矩形搜索模式为搜索点分布为矩形。十字搜索模式为搜索点分布为十字形。
多模式组合搜索为,将不同搜索点的分布模型结合起来而形成的搜索模式,以此模式进行搜索。
迭代搜索为在搜索模式中,当搜索得到的最优匹配点不是中心点时,将该最优匹配点作为新的中心点,迭代使用该搜索模式进行搜索,直到最优匹配点为中心点为止。
对于前景区域,采用多菱形搜索模式、矩形搜索模式、十字搜索模式,并可进行多模式组合搜索与迭代搜索;其中,多模式组合搜索是指将多菱形搜索模式,矩形搜索模式等搜索模式组合进行搜索的搜索模式;迭代搜索是指在搜索模式中,当搜索得到的最优匹配点不是中心点时,将该最优匹配点作为新的中心点,迭代使用该搜索模式进行搜索,直到最优匹配点为中心点为止。
利用被搜索区域和当前待编码区域对应的待匹配像素的前景信息和背景信息进行匹配;当前景信息和背景信息得到匹配的像素点数大于预设的阈值时,则对所述被搜索区域进行搜索。
一种视频编码中基于图像前、背景性质的运动搜索装置,包括:
图像前景和背景性质划分模块,对当前待编码图像所有区域进行前景和背景的性质划分,得到整幅图像的前景和背景的性质信息,然后根据待编码区域前景和背景的性质,进入不同的搜索模块。
背景区域搜索模块,在背景区域搜索中采用低复杂度的搜索方法进行搜索;
前景区域搜索模块,在前景区域搜索中,采用高复杂度的搜索方法进行搜索,当该区域同参考图像中的被搜索区域前背景信息不匹配时,终止搜索过程,跳过该被搜索区域,进行参考图像中后续被搜索区域的搜索。
图像前景和背景性质划分模块采用基于背景建模的划分方法,首先对视频进行背景建模,然后利用建模的背景图像同当前待编码图像的差异进行前景区域和背景区域性质划分;将当前待编码图像待划分区域同背景图像对应区域的绝对差值和与预设的阈值进行比较,小于这一阈值为背景区域,大于这一阀值为前景区域,同时,保留当前待编码图像的前景信息和背景信息;当前待编码图像作为后续图像运动搜索的参考图像时,当前待编码图像的前景信息和背景信息作为后续图像运动搜索的参考信息;或者采用基于图像分割的划分方法对前景区域和背景区域进行性质划分。
背景区域搜索模块的搜索范围限定为只对运动矢量为零的点进行搜索,或将搜索窗大小设置为1x1进行小范围搜索;所采用的搜索模式可选择四步搜索模式、单菱形搜索模式、非迭代的搜索模式;输出为该背景区域的运动矢量。
前景区域搜索模块采用多菱形搜索模式、矩形搜索模式、十字搜索模式,并可进行多模式组合搜索与迭代搜索;同时,利用被搜索区域和当前待编码区域对应的待匹配像素的前景信息和背景信息进行匹配;当前景信息和背景信息得到匹配的像素点数大于预设的阈值时,则对所述被搜索区域进行搜索。
本发明的益处在于:利用背景建模所生成的背景,可以将编码图像中划分为前景区域和背景区域。对当前图像某区域进行编码时,可以利用其前背景信息设计运动搜索方法,在保证编码质量不显著下降的前提下减小运动搜索的复杂度。
附图说明
图1为本发明搜索方法的流程图;
图2为本发明的前景区域运动搜索策略图;
图3为本发明搜索装置的模块示意图。
具体实施方式
当结合附图考虑时,通过参照下面的详细描述,能够更完整更好地理解本发明以及容易得知其中许多伴随的优点,但此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1:如图1至图3所示,首先选取一定数量待编码视频图像进行背景建模,得到背景图像。对于当前编码图像,根据背景图像判断当前区域是否为背景区域。如果为背景区域,则采用背景区域搜索策略;如果是前景区域,则采用前景区域搜索策略。获得运动矢量后,进行运动补偿,图像压缩,图像重建等后续编码过程。其中可用作参考图像的重建图像用于后续图像的运动搜索的参考图像,对应的参考图像的前背景信息用作前景运动搜索策略的参考信息。
区域前背景性质划分准则为,以4x4块为小单元,同背景进行绝对差值和运算,当绝对差值和大于160时,判断该4x4块为前景小单元,否则为背景小单元。以8x8块为前背景划分的基本单位,包含4个4x4小单元,当4个小单元都为背景小单元时,该8x8块为背景块;否则为前景块。
对于当前块,根据其包含8x8前景块的数目确定其为前景区域或背景区域。当包含8x8前景块数目大于预设的阈值时,其为前景块;否则为背景块。
背景块运动矢量搜索策略为,将该区域的运动矢量设置为(0, 0)。
前景块运动矢量搜索策略如图2所示,分为以下三步,
(1)多菱形搜索。以半径为1,2,4,8,16进行菱形搜索,得到最小块失真点。
(2)如果该最小块失真点为中心点,则终止多菱形搜索,进行第(3)步;否则以该最小块失真点为新的中心点,进行第(1)步。
(3)以(2)步所得最小块失真点为中心,进行11x11的中心对称矩形搜索得到的最小块失真点即为最优点。
对前景块按以上步骤进行搜索时,利用参考图像的前背景信息,对于每一次搜索,比较当前块的4个角点的前背景性质和参考帧中搜索块的4个角点的前背景性质,设置阈值T=1,如果相同角点对的个数小于T,则认为该搜索块与当前块在前背景性质上不匹配,则不进行搜索运算,跳过该搜索块。
该实例测试基于高性能视频编码(HEVC)平台,对比参考方法为HEVC参考软件HM12.0的快速搜索方法,编码性能用BD-rate 表示,搜索复杂度由该方法的搜索点数与参考方法的搜索点数的比值表示。实验结果如表1和表2。
表1
序列 搜索点数百分比 节省百分比
bank-sd 31.4% 68.52%
campus-sd 43.02% 56.98%
classover-sd 21.18% 78.82%
crossroad-sd 60.56% 39.44%
office-sd 69.82% 30.18%
overbridge-sd 41.12% 58.88%
intersection-hd 51.43% 48.57%
mainroad-hd-15.Cut 19.55% 80.45%
SD 44.53% 55.47%
HD 35.49% 64.51%
AVERAGE 42.27% 57.73%
表2
由表2可以得出,平均编码性能保持不变,搜索点数平均有 57.73%的节省,实现了在编码性能保持不变的前提下节省编码复杂度的目标。
按照以上描述,设计了一种基于图像前背景性质的运动搜索方法。
以上对本发明所提供的一种视频编码中基于图像信息的运动搜索方法和装置进行了详细介绍,以上参照附图对本申请的示例性的实施方案进行了描述。本领域技术人员应该理解,上述实施方案仅仅是为了说明的目的而所举的示例,而不是用来进行限制,凡在本申请的教导和权利要求保护范围下所作的任何修改、等同替换等,均应包含在本申请要求保护的范围内。

Claims (1)

1.一种视频编码中基于图像信息的运动搜索方法,其特征在于包括如下步骤:
步骤1)对当前待编码图像进行前景区域和背景区域性质划分,得到该图像的前景信息和背景信息;
步骤2)根据前景信息,对前景区域采用高复杂度搜索方法;根据背景信息,对背景区域采用低复杂度搜索方法;
所述步骤1)还包括:采用基于背景建模的划分方法,首先对视频进行背景建模,然后利用建模的背景图像同当前待编码图像的差异进行前景区域和背景区域性质划分;将当前待编码图像待划分区域同背景图像对应区域的绝对差值和与预设的阈值进行比较,小于这一阈值为背景区域,大于这一阀值为前景区域,同时,保留当前待编码图像的前景信息和背景信息;当前待编码图像的前景信息和背景信息作为后续图像运动搜索的参考信息;
其中区域前背景性质划分准则为,以4x4块为小单元,同背景进行绝对差值和运算,当绝对差值和大于160时,判断该4x4块为前景小单元,否则为背景小单元;以8x8块为前背景划分的基本单位,包含4个4x4小单元,当4个小单元都为背景小单元时,该8x8块为背景块;否则为前景块;对于当前块,根据其包含8x8前景块的数目确定其为前景区域或背景区域;当包含8x8前景块数目大于预设的阈值时,其为前景块;否则为背景块;
所述步骤2)还包括:
背景区域采用低复杂度的搜索方法,限制搜索范围并采用简单的搜索模式;
前景区域采用高复杂度的搜索方法,采用更大的搜索范围及复杂的搜索模式;
对于背景区域,减小搜索窗的大小,进行小范围搜索;所采用的搜索模式可选择运动矢量置零模式、四步搜索模式、单菱形搜索模式、非迭代的搜索模式;
对于前景区域,采用多菱形搜索模式、矩形搜索模式、十字搜索模式,并可进行多模式组合搜索与迭代搜索;其中,多模式组合搜索是指将多菱形搜索模式,矩形搜索模式等搜索模式组合进行搜索的搜索模式;迭代搜索是指在搜索模式中,当搜索得到的最优匹配点不是中心点时,将该最优匹配点作为新的中心点,迭代使用该搜索模式进行搜索,直到最优匹配点为中心点为止;
其中如果为背景区域,则采用背景区域搜索策略,背景块运动矢量搜索策略,将该区域的运动矢量设置为(0,0);
如果是前景区域,则采用前景区域搜索策略;
采用多模式组合搜索与迭代搜索,分为以下三个步骤,
步骤A、多菱形搜索;以半径为1,2,4,8,16进行菱形搜索,得到最小块失真点;
步骤B、如果该最小块失真点为中心点,则终止多菱形搜索,进行第步骤C、否则以该最小块失真点为新的中心点,进行步骤A;
步骤C、以步骤B所得最小块失真点为中心,进行11x11的中心对称矩形搜索得到的最小块失真点即为最优点;
对前景块按以上步骤进行搜索时,利用参考图像的前背景信息,对于每一次搜索,比较当前块的4个角点的前背景性质和参考帧中搜索块的4个角点的前背景性质,设置阈值T=1,如果相同角点对的个数小于T,则认为该搜索块与当前块在前背景性质上不匹配,则不进行搜索运算,跳过该搜索块;
还包括:利用被搜索区域和当前待编码区域对应的待匹配像素的前景信息和背景信息进行匹配;当前景信息和背景信息得到匹配的像素点数大于预设的阈值时,则对所述被搜索区域进行搜索。
CN201410067035.7A 2014-02-26 2014-02-26 一种视频编码中基于图像信息的运动搜索方法 Expired - Fee Related CN103796028B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410067035.7A CN103796028B (zh) 2014-02-26 2014-02-26 一种视频编码中基于图像信息的运动搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410067035.7A CN103796028B (zh) 2014-02-26 2014-02-26 一种视频编码中基于图像信息的运动搜索方法

Publications (2)

Publication Number Publication Date
CN103796028A CN103796028A (zh) 2014-05-14
CN103796028B true CN103796028B (zh) 2017-09-29

Family

ID=50671247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410067035.7A Expired - Fee Related CN103796028B (zh) 2014-02-26 2014-02-26 一种视频编码中基于图像信息的运动搜索方法

Country Status (1)

Country Link
CN (1) CN103796028B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104243994B (zh) * 2014-09-26 2017-06-27 厦门亿联网络技术股份有限公司 一种实时运动感知图像增强的方法
CN107426567B (zh) * 2017-05-19 2019-11-15 西安电子科技大学 基于编码顺序已知图像集的多参考图像确定方法
CN112203095B (zh) * 2020-12-04 2021-03-09 腾讯科技(深圳)有限公司 视频运动估计方法、装置、设备及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6842483B1 (en) * 2000-09-11 2005-01-11 The Hong Kong University Of Science And Technology Device, method and digital video encoder for block-matching motion estimation
CN101479766A (zh) * 2006-07-10 2009-07-08 丰田自动车株式会社 目标检测设备、方法及程序
CN101715139A (zh) * 2009-11-16 2010-05-26 南京邮电大学 立体图像中基于互补掩盖方式的多模式误码掩盖方法
CN101754022A (zh) * 2008-12-01 2010-06-23 三星电子株式会社 低复杂度的运动估计方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090062049A (ko) * 2007-12-12 2009-06-17 삼성전자주식회사 영상 데이터 압축 전처리 방법 및 이를 이용한 영상 데이터압축 방법과, 영상 데이터 압축 시스템
CN101742325A (zh) * 2008-11-11 2010-06-16 北京中星微电子有限公司 一种视频编码的方法和编码器
CN102291577A (zh) * 2010-06-21 2011-12-21 北京中星微电子有限公司 一种计算宏块运动向量的方法及装置
CN102075757B (zh) * 2011-02-10 2013-08-28 北京航空航天大学 通过边界检测作为运动估计参考的视频前景对象编码方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6842483B1 (en) * 2000-09-11 2005-01-11 The Hong Kong University Of Science And Technology Device, method and digital video encoder for block-matching motion estimation
CN101479766A (zh) * 2006-07-10 2009-07-08 丰田自动车株式会社 目标检测设备、方法及程序
CN101754022A (zh) * 2008-12-01 2010-06-23 三星电子株式会社 低复杂度的运动估计方法
CN101715139A (zh) * 2009-11-16 2010-05-26 南京邮电大学 立体图像中基于互补掩盖方式的多模式误码掩盖方法

Also Published As

Publication number Publication date
CN103796028A (zh) 2014-05-14

Similar Documents

Publication Publication Date Title
Li et al. An efficient deep convolutional neural networks model for compressed image deblocking
CN102088606B (zh) 基于稀疏表示的去块效应方法
CN102800094A (zh) 一种快速彩色图像分割方法
CN107145870B (zh) 一种视频中人脸的识别系统
CN105469353B (zh) 水印图像的嵌入方法和装置及提取方法和装置
CN105763881A (zh) 利用图像非局部结构相似性特征的视频编码图像滤波方法
CN103796028B (zh) 一种视频编码中基于图像信息的运动搜索方法
CN102184533A (zh) 基于非局部约束的全变分图像去模糊方法
CN104992419A (zh) 基于jnd因子的超像素高斯滤波预处理方法
CN110324617A (zh) 图像处理方法及装置
CN105704498A (zh) 逆离散余弦变换的方法及装置、视频编/解码方法及框架
CN1608380A (zh) 估计图像序列中的主要运动的方法
CN111080723B (zh) 基于Unet网络的图像元素分割方法
CN102254305B (zh) 基于三字典块匹配的图像复原方法
CN110418142A (zh) 一种基于视频感兴趣区域的编码方法、装置、存储介质
Zhang et al. Hardware implementation for haze removal with adaptive filtering
Yang et al. Efficient screen content intra coding based on statistical learning
WO2023203509A1 (en) Image data compression method and device using segmentation and classification
Ma et al. Pavement cracks detection based on FDWT
CN103139557B (zh) 一种视频编码中的运动估计方法及系统
Shi et al. Edge detector based fast level decision algorithm for intra prediction of HEVC
JP2005073280A (ja) 圧縮動画像の動き客体分割方法
CN102202217A (zh) 一种jpeg编码方法和设备
Lu et al. A new non-local video denoising scheme using low-rank representation and total variation regularization
CN108200442B (zh) 一种基于神经网络的hevc帧内编码单元划分方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170929

Termination date: 20210226

CF01 Termination of patent right due to non-payment of annual fee