CN101742325A - 一种视频编码的方法和编码器 - Google Patents
一种视频编码的方法和编码器 Download PDFInfo
- Publication number
- CN101742325A CN101742325A CN 200810226462 CN200810226462A CN101742325A CN 101742325 A CN101742325 A CN 101742325A CN 200810226462 CN200810226462 CN 200810226462 CN 200810226462 A CN200810226462 A CN 200810226462A CN 101742325 A CN101742325 A CN 101742325A
- Authority
- CN
- China
- Prior art keywords
- hunting zone
- search precision
- background area
- interest
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000008569 process Effects 0.000 abstract description 3
- 230000033001 locomotion Effects 0.000 description 28
- 239000013598 vector Substances 0.000 description 7
- 230000003068 static effect Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013144 data compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明提供一种视频编码的方法和编码器,方法包括:步骤一,将待编码的画面分为关注区域和背景区域;步骤二,在编码过程中,为所述关注区域分配第一编码资源,为所述背景区域分配第二编码资源,所述第一编码资源多于所述第二编码资源。本发明能够优化视频编码的性能,降低搜索的计算复杂度,解决现有技术不能根据实际需要对图像的不同区域进行区别编码的技术问题。
Description
技术领域
本发明涉及视频处理技术,特别是涉及一种视频编码的方法和编码器。
背景技术
帧间预测编码是利用视频图像帧间的相关性,即时间相关性,来达到图像压缩的目的,其广泛用于普通电视、会议电视、视频电话、高清晰度电视的压缩编码。采用帧间预测编码不直接传送当前帧的像素值,而是传送x和其前一帧或后一帧的对应像素x′之间的差值,可以达到更高的数据压缩比。
具有运动补偿的帧间预测编码是视频压缩的关键技术之一,在实际实现时其经常采用的运动估值方法是块匹配法。它将图像划分为许多子块,并认为子块内所有像素的位移量是相同的,这意味着将每个子块视为一个“运动物体”。对于某一时间t,图像帧中的某一子块如果在另一时间t-t1的帧中可以找到若干与其十分相似的子块,则称其中最为相似的子块为匹配块,并认为该匹配块是时间t-t1的帧中相应子块位移的结果。位移矢量由两帧中相应子块的坐标决定。
现有的视频编码方案,在做帧间预测时,一般都在参考帧中找到一个搜索区域,将当前帧的宏块在该区域中进行运动搜索,找到最佳匹配位置。搜索区域的大小一般是固定的,例如±32像素。按照这样的参数配置的编码器,在对图象中每个宏块做运动搜索时,从参考帧中选取的搜索区域都是相同大小的。搜索区域越大,搜索时需要的计算量越大。据估算,运动搜索的计算量,约占视频编码计算量的50~80%,因此如何降低搜索的计算复杂度,已经成为优化视频编码性能的一个重要课题。
如图1所示,中心的M×N像素大小的矩形,表示当前帧中的一个宏块;外围的大矩形表示在参考帧中对应的运动搜索区域,其尺寸为宽M+2Rx像素,高N+2Ry像素。运动搜索一般是按SAD(Sum of Absolute Difference,残差绝对值求和)最小的准则寻找最佳匹配位置。SAD的计算公式如下:
上式中,fk表示当前帧的宏块,fk-1表示参考帧中的搜索区域。
在视频监控领域,经常会遇到的场景是:背景是静止的,只有前景一部分区域是运动的,例如ATM自动取款机中安装的监控摄像机,画面中只有操作者是运动的。如何针对这种普遍出现的应用情况,降低搜索的计算复杂度,优化视频编码的性能,是有待解决的一个重要问题。
发明内容
本发明实施例的目的是提供一种视频编码的方法和编码器,能够优化视频编码的性能,降低搜索的计算复杂度,解决现有技术不能根据实际需要对图像的不同区域进行区别编码的技术问题。
为了实现上述目的,一方面,提供了一种视频编码的方法,包括:
步骤一,将待编码的画面分为关注区域和背景区域;
步骤二,在编码过程中,为所述关注区域分配第一编码资源,为所述背景区域分配第二编码资源,所述第一编码资源多于所述第二编码资源。
优选地,上述的方法中,所述步骤二具体包括:在编码过程中,对所述关注区域的宏块采用第一搜索精度,对所述背景区域的宏块采用第二搜索精度,所述第一搜索精度高于所述第二搜索精度;和/或,对所述关注区域的宏块采用第一搜索范围,对所述背景区域的宏块采用第二搜索范围,所述第一搜索范围大于所述第二搜索范围。
优选地,上述的方法中,在所述步骤一之前,还包括:预留编码器的配置接口,通过所述配置接口修改所述关注区域和所述背景区域的范围,通过所述配置接口修改所述第一搜索精度、所述第二搜索精度、所述第一搜索范围和所述第二搜索范围。
优选地,上述的方法中,所述第一搜索精度为四分之一或二分之一像素,所述第二搜索精度为整像素。
优选地,上述的方法中,所述第一搜索范围为±32像素,所述第二搜索范围为±16像素。
本发明的另一个方面,提供一种视频编码的编码器,包括:
划分单元,用于:将待编码的画面分为关注区域和背景区域;
编码单元,用于:在编码过程中,对所述关注区域的宏块采用第一搜索精度,对所述背景区域的宏块采用第二搜索精度,所述第一搜索精度高于所述第二搜索精度;和/或,对所述关注区域的宏块采用第一搜索范围,对所述背景区域的宏块采用第二搜索范围,所述第一搜索范围大于所述第二搜索范围。
优选地,上述的编码器中,还包括:
配置接口,用于:修改所述关注区域和所述背景区域的范围,修改所述第一搜索精度、所述第二搜索精度、所述第一搜索范围和所述第二搜索范围
优选地,上述的编码器中,所述第一搜索精度为四分之一或二分之一像素,所述第二搜索精度为整像素。
优选地,上述的编码器中,所述第一搜索范围为±32像素,所述第二搜索范围为±16像素。
本发明实施例至少存在以下技术效果:
1)对背景区域选用较差的搜索精度,可以大大节省编码器的插值、匹配等运算量,降低功耗。
2)背景区域进行视频编码时,对于帧间运动估计选用较小的搜索范围。因为背景区域一般都处于静止,出现运动目标的概率较小,对这样的区域选用较小的搜索范围,可以大大节省编码器的运算量,降低功耗。另外,这样得到的运动向量值会集中分布于以0为中心的更小的范围,有利于节省熵编码后的码字长度。
3)采用本发明实施例的方法所编出来的视频码流,不需要修改解码器就可以顺利解码。
附图说明
图1为现有技术进行运动搜索的示意图;
图2为本发明实施例提供的方法的步骤流程图;
图3为本发明实施例提供的亚像素级运动搜索的示意图;
图4为本发明实施例提供的编码器的结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对具体实施例进行详细描述。
图2为本发明实施例提供的方法的步骤流程图,如图所示,本发明实施例视频编码的方法包括:
步骤101,将待编码的画面分为关注区域和背景区域;
步骤102,在编码过程中,优先为所述关注区域分配资源(为所述关注区域分配第一编码资源,为所述背景区域分配第二编码资源,所述第一编码资源多于所述第二编码资源)。
其中步骤102可以具体包括两大部分。
第一部分:
所述步骤102具体包括:在编码过程中,对所述关注区域的宏块采用第一搜索精度,对所述背景区域的宏块采用第二搜索精度,所述第一搜索精度高于所述第二搜索精度。
实际上,很多视频编码已经支持到亚像素级运动估计,例如mpeg4,有的甚至支持到四分之一像素级的运动估计,例如H.264。图3显示了亚像素级运动搜索:图3中,*号表示整像素级的点,即参考图象中原始的点;#号表示亚像素级的点,即通过原始像点插值得到的点。运动搜索不仅在整像素级的点上进行匹配,也同样会在亚像素级的点上进行匹配,找到更佳的运动向量。
亚像素点的插值方法,依不同的视频编码标准而有不同,表1为亚像素点的插值表,典型的插值过程如下:
表1
*A | #b | *B |
#a | #e | #d |
*C | #c | *D |
本发明在背景区域进行视频编码时,帧间运动估计选用较差的搜索精度。对感兴趣的关注区域进行视频编码时,选用较高的搜索精度。背景区域选用较差的搜索精度,可以大大节省编码器的插值、匹配等运算量,降低功耗。另外,采用这种方案编出来的视频码流,不需要修改解码器就可以顺利解码。
第二部分:
步骤102可以包括:所述关注区域的宏块采用第一搜索范围,对所述背景区域的宏块采用第二搜索范围,所述第一搜索范围大于所述第二搜索范围。这是因为:
背景区域因为各种噪声的干扰,按SAD最小的准则找到的“最佳”匹配位置,已经不能反映场景中实际景物的运动情况。例如,在监控画面中,虽然背景中没有任何运动目标,但各个宏块在做运动搜索时却仍然得到了非零的运动向量。这些运动向量仍然需要进行熵编码,占用编码后的码字,从而增大视频编码文件的大小,或增加视频传输的码率。
本发明在背景区域进行视频编码时,对于帧间运动估计选用较小的搜索范围,感兴趣的关注区域进行视频编码时,选用较大的搜索范围。因为背景区域一般都处于静止,出现运动目标的概率较小,对这样的区域选用较小的搜索范围,可以大大节省编码器的运算量,降低功耗。另外,这样得到的运动向量值会集中分布于以0为中心的更小的范围,有利于节省熵编码后的码字长度。
此外,在所述步骤101之前,还包括:
预留编码器的配置接口,通过所述配置接口修改所述关注区域和所述背景区域的范围,通过所述配置接口修改所述第一搜索精度、所述第二搜索精度、所述第一搜索范围和所述第二搜索范围。所述第一搜索精度可选择为四分之一或二分之一像素,所述第二搜索精度为整像素。所述第一搜索范围可选择为±32像素,所述第二搜索范围为±16像素。
图4为本发明实施例提供的编码器的结构图。对应以上方法,本发明实施例还提供的视频编码的编码器如图4所示,包括:
划分单元201,用于:将待编码的画面分为关注区域和背景区域;
编码单元202,用于:在编码过程中,对所述关注区域的宏块采用第一搜索精度,对所述背景区域的宏块采用第二搜索精度,所述第一搜索精度高于所述第二搜索精度;和/或,对所述关注区域的宏块采用第一搜索范围,对所述背景区域的宏块采用第二搜索范围,所述第一搜索范围大于所述第二搜索范围。
还包括:配置接口单元203,用于:修改所述关注区域和所述背景区域的范围,修改所述第一搜索精度、所述第二搜索精度、所述第一搜索范围和所述第二搜索范围
因此,配置接口允许管理员对编码器进行相应的设置,包括感兴趣区域(关注区域),背景区域的定义,感兴趣区域运动搜索精度和搜索范围的设定,背景区域运动搜索精度和搜索范围的设定,等等。
在编码器中,对一个宏块进行帧间预测时,先查找该宏块所属的区域类型,并根据该区域所设定的运动搜索精度,进行运动搜索的计算。例如,在某个实施例中,对感兴趣区域进行四分之一像素精度的运动搜索,而对背景区域则只进行整像素精度的运动搜索。
在编码器中,对一个宏块进行帧间预测时,可查找该宏块所属的区域类型,并根据该区域所设定的运动搜索范围的值,到参考帧中取出相应的搜索区域进行计算。
由上可知,本发明实施例至少存在以下优势:
1)对背景区域选用较差的搜索精度,可以大大节省编码器的插值、匹配等运算量,降低功耗。
2)背景区域进行视频编码时,对于帧间运动估计选用较小的搜索范围。因为背景区域一般都处于静止,出现运动目标的概率较小,对这样的区域选用较小的搜索范围,可以大大节省编码器的运算量,降低功耗。另外,这样得到的运动向量值会集中分布于以0为中心的更小的范围,有利于节省熵编码后的码字长度。
3)采用本发明实施例的方法所编出来的视频码流,不需要修改解码器就可以顺利解码。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (9)
1.一种视频编码的方法,其特征在于,包括:
步骤一,将待编码的画面分为关注区域和背景区域;
步骤二,在编码过程中,为所述关注区域分配第一编码资源,为所述背景区域分配第二编码资源,所述第一编码资源多于所述第二编码资源。
2.根据权利要求1所述的方法,其特征在于,所述步骤二具体包括:
在编码过程中,对所述关注区域的宏块采用第一搜索精度,对所述背景区域的宏块采用第二搜索精度,所述第一搜索精度高于所述第二搜索精度;和/或,对所述关注区域的宏块采用第一搜索范围,对所述背景区域的宏块采用第二搜索范围,所述第一搜索范围大于所述第二搜索范围。
3.根据权利要求2所述的方法,其特征在于,在所述步骤一之前,还包括:
预留编码器的配置接口,通过所述配置接口修改所述关注区域和所述背景区域的范围,通过所述配置接口修改所述第一搜索精度、所述第二搜索精度、所述第一搜索范围和所述第二搜索范围。
4.根据权利要求2所述的方法,其特征在于,所述第一搜索精度为四分之一或二分之一像素,所述第二搜索精度为整像素。
5.根据权利要求2所述的方法,其特征在于,所述第一搜索范围为±32像素,所述第二搜索范围为±16像素。
6.一种视频编码的编码器,其特征在于,包括:
划分单元,用于:将待编码的画面分为关注区域和背景区域;
编码单元,用于:在编码过程中,对所述关注区域的宏块采用第一搜索精度,对所述背景区域的宏块采用第二搜索精度,所述第一搜索精度高于所述第二搜索精度;和/或,对所述关注区域的宏块采用第一搜索范围,对所述背景区域的宏块采用第二搜索范围,所述第一搜索范围大于所述第二搜索范围。
7.根据权利要求6所述的编码器,其特征在于,还包括:
配置接口,用于:修改所述关注区域和所述背景区域的范围,修改所述第一搜索精度、所述第二搜索精度、所述第一搜索范围和所述第二搜索范围
8.根据权利要求6所述的编码器,其特征在于,所述第一搜索精度为四分之一或二分之一像素,所述第二搜索精度为整像素。
9.根据权利要求6所述的编码器,其特征在于,所述第一搜索范围为±32像素,所述第二搜索范围为±16像素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810226462 CN101742325A (zh) | 2008-11-11 | 2008-11-11 | 一种视频编码的方法和编码器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810226462 CN101742325A (zh) | 2008-11-11 | 2008-11-11 | 一种视频编码的方法和编码器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101742325A true CN101742325A (zh) | 2010-06-16 |
Family
ID=42465096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200810226462 Pending CN101742325A (zh) | 2008-11-11 | 2008-11-11 | 一种视频编码的方法和编码器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101742325A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102291577A (zh) * | 2010-06-21 | 2011-12-21 | 北京中星微电子有限公司 | 一种计算宏块运动向量的方法及装置 |
CN103561268A (zh) * | 2010-12-29 | 2014-02-05 | 中国移动通信集团公司 | 视频监控图像编码方法及装置 |
CN103796028A (zh) * | 2014-02-26 | 2014-05-14 | 北京大学 | 一种视频编码中基于图像信息的运动搜索方法和装置 |
CN106454348A (zh) * | 2015-08-05 | 2017-02-22 | 中国移动通信集团公司 | 一种视频编解码方法和装置 |
CN108628436A (zh) * | 2017-03-23 | 2018-10-09 | 宏达国际电子股份有限公司 | 电子装置、显示方法以及非暂态计算机可读取储存媒体 |
-
2008
- 2008-11-11 CN CN 200810226462 patent/CN101742325A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102291577A (zh) * | 2010-06-21 | 2011-12-21 | 北京中星微电子有限公司 | 一种计算宏块运动向量的方法及装置 |
CN103561268A (zh) * | 2010-12-29 | 2014-02-05 | 中国移动通信集团公司 | 视频监控图像编码方法及装置 |
CN103796028A (zh) * | 2014-02-26 | 2014-05-14 | 北京大学 | 一种视频编码中基于图像信息的运动搜索方法和装置 |
CN106454348A (zh) * | 2015-08-05 | 2017-02-22 | 中国移动通信集团公司 | 一种视频编解码方法和装置 |
CN106454348B (zh) * | 2015-08-05 | 2019-08-13 | 中国移动通信集团公司 | 一种视频编解码方法和装置 |
CN108628436A (zh) * | 2017-03-23 | 2018-10-09 | 宏达国际电子股份有限公司 | 电子装置、显示方法以及非暂态计算机可读取储存媒体 |
CN108628436B (zh) * | 2017-03-23 | 2021-01-29 | 宏达国际电子股份有限公司 | 电子装置、显示方法以及非暂态计算机可读取储存媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10547873B2 (en) | System and method for providing real-time super-resolution for compressed videos | |
CN107347159B (zh) | 一种对视频位流进行编解码的方法、设备 | |
CN102783149B (zh) | 用于视频译码的适应性运动分辨率 | |
US11102501B2 (en) | Motion vector field coding and decoding method, coding apparatus, and decoding apparatus | |
US10506249B2 (en) | Segmentation-based parameterized motion models | |
CN101406056A (zh) | 减少数字视频编码器中的内预测和模式判决处理中的计算的方法 | |
CN106034236B (zh) | 一种hevc编码最佳参考帧的选择方法、装置及编码器 | |
CN102918839B (zh) | 用于视频编码的功率高效的运动估计技术 | |
CN103039074A (zh) | Gpb帧中的双向运动向量的联合译码 | |
CN104041045A (zh) | 用于视频译码的二次边界滤波 | |
US20140056353A1 (en) | Video encoding method and a video encoding apparatus using the same | |
US9883200B2 (en) | Method of acquiring neighboring disparity vectors for multi-texture and multi-depth video | |
CN101449588A (zh) | 用于视频压缩的空间稀疏性诱导瞬时预测 | |
CN101755464A (zh) | 基于行的视频码率控制和压缩 | |
CN109379594A (zh) | 视频编码压缩方法、装置、设备和介质 | |
CN101431675A (zh) | 一种像素运动估计方法和装置 | |
CN101742325A (zh) | 一种视频编码的方法和编码器 | |
US10681374B2 (en) | Diversified motion using multiple global motion models | |
CN106060539A (zh) | 一种低传输带宽的视频编码方法 | |
CN101945281B (zh) | 视频编码的滤波方法及装置 | |
CN108810549B (zh) | 一种面向低功耗的流媒体播放方法 | |
Kerfa et al. | An efficient algorithm for fast block matching motion estimation using an adaptive threshold scheme | |
CN103491371A (zh) | 基于分层的编码方法、装置和设备 | |
CN111327901A (zh) | 视频编码方法、装置、存储介质及编码设备 | |
CN102291577A (zh) | 一种计算宏块运动向量的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20100616 |