CN105245896A - Hevc并行运动补偿方法及装置 - Google Patents
Hevc并行运动补偿方法及装置 Download PDFInfo
- Publication number
- CN105245896A CN105245896A CN201510647960.1A CN201510647960A CN105245896A CN 105245896 A CN105245896 A CN 105245896A CN 201510647960 A CN201510647960 A CN 201510647960A CN 105245896 A CN105245896 A CN 105245896A
- Authority
- CN
- China
- Prior art keywords
- parallel
- module
- motion compensation
- hevc
- tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及视频编解码技术领域,公开了一种HEVC并行运动补偿方法及装置。该方法包括步骤:接收待处理图像,由GPU对所述待处理图像进行预处理;将预处理后的所述待处理图像分割为多个分块,对各分块并行实施运动补偿计算;对所述运动补偿计算的结果进行树形收敛后发送给CPU进行补偿选取。本发明实施例提供了一种HEVC并行运动补偿方法及装置,其技术方案通过将压缩过程中运算量最大的运动补偿模块单独提炼出来,利用显卡并行运算能力,相对应地设计独立的可并行处理的运动估计算方法,形成了独立的并行处理的运动补偿模块,从而大幅减少编码过程中运动估计时间,从而提升编码性能。
Description
技术领域
本发明涉及视频编解码技术领域,特别涉及一种HEVC并行运动补偿方法及装置。
背景技术
HEVC(HighEfficiencyVideoCoding,高效率视频编码)自2013年1月起正式成为新的国际视频压缩标准,用于替代H.264及之前的视频压缩算法。HEVC相对于H.264压缩算法,在保证画质不变的情况下,带宽可以节省40%-50%,故采用该标准可有效提高视频传输速度和效率,或是在现有网络条件下提高视频内容质量。随着显示设备的硬件水平的发展,在后续4K、3D等超大分辨率、超清画质的显示需求下,HEVC在带宽上的优势将使其成为视频传输的唯一选择。
但是现有的HEVC标准仍存在一些制约其发展和普及的缺陷:首先,超高的画质压缩比导致算法较为复杂,计算性能需求相对H.264成倍增加;其次,HEVC虽然考虑了并行处理结构,但现有标准的并行处理仅在瓦片(tiles,又称区块)、去块滤波和波前并行处理(WPP,Wave-frontParallelProcessing)这三个方面进行了设计,实际可以节省的运算能力有限,并不能完全解决性能问题;此外,现有HEVC只能采用软解码实现,针对HEVC设计的单独DSP解码芯片尚未推出,方案实现过于依赖处理器能力且会占据过多的计算资源,实际编解码效率不佳。因此,虽然已成为国际标准和共识,目前视频行业也都在朝着HEVC方向推进,但受限于上述编码性能的缺陷以及缺少在线视频播放技术(比如flash等)的支持,HEVC技术的实际普及和推进速度较慢。
发明内容
基于现有技术的缺陷,本发明的目的是提供一种HEVC并行运动补偿方法及装置,以进一步挖掘现有硬件的潜力,提高HEVC编码效率,提升视频编解码处理的实际性能和效率。
根据本发明的一个方面,提供了一种HEVC并行运动补偿方法,包括步骤:
接收待处理图像,由GPU对所述待处理图像进行预处理;
将预处理后的所述待处理图像分割为多个分块,对各分块并行实施运动补偿计算;
对所述运动补偿计算的结果进行树形收敛后发送给CPU进行补偿选取。
优选地,所述预处理包括采用内插补值方式实现的抽样优化。
优选地,所述内插补值根据不同的运动补偿精度要求采用半像素、1/4像素或1/8像素插值。
优选地,所述分割为多级分割;所述并行实施针对所述多级分割中各个级别的分块进行。
优选地,所述树形收敛采用四叉树进行。
根据本发明的另一个方面,还提供了一种HEVC并行运动补偿装置,包括:
预处理模块,用于接收待处理图像,由GPU对所述待处理图像进行预处理;
运动补偿模块,用于将预处理后的所述待处理图像分割为多个分块,对各分块并行实施运动补偿计算;
结果选取模块,用于对所述运动补偿计算的结果进行树形收敛后发送给CPU进行补偿选取。
优选地,所述预处理模块包括:抽样优化模块,用于采用内插补值方式实现抽样优化。
优选地,所述抽样优化模块包括:插值模块,用于根据不同的运动补偿精度要求采用半像素、1/4像素或1/8像素插值。
优选地,所述运动补偿模块包括:
分割模块,用于进行多级分割;
并行处理模块,用于对所述多级分割中各个级别的分块进行并行处理。
优选地,所述结果选取模块包括:四叉树形收敛模块,用于采用四叉树进行所述树形收敛。
本发明实施例提供了一种HEVC并行运动补偿方法及装置,其技术方案通过将压缩过程中运算量最大的运动补偿模块单独提炼出来,利用显卡并行运算能力,相对应地设计独立的可并行处理的运动估计算方法,形成了独立的并行处理的运动补偿模块,从而大幅减少编码过程中运动估计时间,从而提升编码性能。
附图说明
图1是本发明一个实施例中HEVC并行运动补偿方法的基本流程示意图;
图2是本发明一个实施例中HEVC并行运动补偿装置的模块结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
现有HEVC技术过于依赖于处理器性能,仅有的少量并行优化并不能实际提升视频处理性能。本发明实施例的技术方案针对压缩过程中运算量最大的运动补偿过程,利用显卡的运算能力来实现运动补偿的并行处理,从而大幅提升了编码性能和效率。如图1所示,在本方面实施例中,HEVC并行运动补偿方法包括步骤:
S1、接收待处理图像,由GPU对所述待处理图像进行预处理;
S2、将预处理后的所述待处理图像分割为多个分块,对各分块并行实施运动补偿计算;
S3、对所述运动补偿计算的结果进行树形收敛后发送给CPU进行补偿选取。
其中,步骤S1中,所述预处理包括:平滑处理、边缘检测和抽样优化等操作。其中,所述抽样优化采用内插补值方式实现,优选地,根据不同的运动补偿精度要求,所述内插补值可采用半像素、1/4像素或1/8像素插值。
步骤S2中,所述分割为多级分割。其中,在HEVC视频编解码过程中,一帧图像首先通过边缘分割可独立形成条带(Slice)、条带片段(SliceSegment)或瓦片(tiles),条带通常由多个条带片段组成,条带片段亦可独立存在,瓦片必须为矩形块,而条带或条带片段可为任意形状。其次,采用树形编码单元(CTU,CodingTreeUnit)对条带、条带片段或瓦片进行处理,此时进一步对亮度和色度分量分割为树形编码块(CTB,CodingTreeBlock),CTB是一帧中像素组织的基本结构。HEVC支持16×16以上的宏块,故CTB通常为64×64,32×32或16×16,通常分块越大编码效率越高。CTB又进一步被分割为编码块(CB,CodingBlock),以CTB为根进行四叉树分割(即一次分割产生四个小块),直至到达叶子节点CB,CB及相关语法构成编码单元(CU,CodingUnit)。CB又可进一步分割为预测块(PB,PredictionBlock)和变换块(TB,TransformBlock),并构成相应的预测单元(PU,PredictionUnit)和变换单元(TU,TransformUnit);PU用于进行帧内或为帧间预测,TU用于预测残差以进行空域块变换和量化。PU大小从64×64到4×4不等,PU的分割可采用对称分割或不对称分割;优选地,PU使用两个参考块进行编码,即双预测编码,大小限制为8×4或4×8以节省存储带宽。TU的尺寸可能为32×32,16×16,8×8或4×4。
特别地,在HEVC标准中仅支持基于瓦片的并行处理,而本发明实施例中,所述并行实施运动补偿计算可针对所述多级分割中各个级别的分块进行并行处理。优选地,对进行运动估计(ME,MotionEstimate)的分块进行并行处理;其中,ME主要负责划分、搜索运动矢量和参考图像信息,将当前编码块与预测到的图像块做差,得到残差信息,对残差信息进行变换和量化操作。因此,本发明实施例除支持瓦片并行处理之外,还支持CTB、CB、PB和TB级别的并行处理,其中包括了矢量搜索算法的并行化、参考宏块之间的并行化、相似度匹配的并行化和差值算法的并行化。
最后,步骤S3中,所述树形收敛为四叉树形收敛,四叉树形收敛与前述四叉树分割相对应,每四个叶子结点的小块进行收敛直到根节点。所述补偿选取包括:将编码控制信息、编码模式信息和残差信息通过熵编码转化成码流。
如图2所示,本发明实施例还同时提供了一种HEVC并行运动补偿装置1,包括:
预处理模块101,用于接收待处理图像,由GPU对所述待处理图像进行预处理;
运动补偿模块102,用于将预处理后的所述待处理图像分割为多个分块,对各分块并行实施运动补偿计算;
结果选取模块103,用于对所述运动补偿计算的结果进行树形收敛后发送给CPU进行补偿选取。
本领域相关技术人员可以理解,与上述方法一一对应地,本发明实施例的装置中也同时存在与各方法步骤相对应的各功能模块,在此不再一一赘述。在实际应用中,上述HEVC并行运动补偿装置可以是独立的计算设备,也可以是由计算设备加载的独立功能单元(比如GPU、硬解码器、协处理器等),还可以是计算设备直接实现的虚拟/实体单元(比如管理GPU的程序单元、IP核、指令集等)。同样,装置中的各模块均可由位于计算设备中的中央处理器CPU、微处理器MPU、数字信号处理器DSP或现场可编程门阵列FPGA等实现,上述装置及模块的实现手段不应视为对本发明具体实施方式的限制。
本发明实施例提供了一种HEVC并行运动补偿方法及装置,其技术方案通过将压缩过程中运算量最大的运动补偿模块单独提炼出来,利用显卡并行运算能力,相对应地设计独立的可并行处理的运动估计算方法,形成了独立的并行处理的运动补偿模块,从而大幅减少编码过程中运动估计时间,从而提升编码性能。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (10)
1.一种HEVC并行运动补偿方法,其特征在于,所述方法包括步骤:
接收待处理图像,由GPU对所述待处理图像进行预处理;
将预处理后的所述待处理图像分割为多个分块,对各分块并行实施运动补偿计算;
对所述运动补偿计算的结果进行树形收敛后发送给CPU进行补偿选取。
2.根据权利要求1所述的方法,其特征在于,所述预处理包括采用内插补值方式实现的抽样优化。
3.根据权利要求2所述的方法,其特征在于,所述内插补值根据不同的运动补偿精度要求采用半像素、1/4像素或1/8像素插值。
4.根据权利要求1所述的方法,其特征在于,所述分割为多级分割;所述并行实施针对所述多级分割中各个级别的分块进行。
5.根据权利要求1所述的方法,其特征在于,所述树形收敛采用四叉树进行。
6.一种HEVC并行运动补偿装置,其特征在于,所述装置包括:
预处理模块,用于接收待处理图像,由GPU对所述待处理图像进行预处理;
运动补偿模块,用于将预处理后的所述待处理图像分割为多个分块,对各分块并行实施运动补偿计算;
结果选取模块,用于对所述运动补偿计算的结果进行树形收敛后发送给CPU进行补偿选取。
7.根据权利要求6所述的装置,其特征在于,所述预处理模块包括:
抽样优化模块,用于采用内插补值方式实现抽样优化。
8.根据权利要求7所述的装置,其特征在于,所述抽样优化模块包括:
插值模块,用于根据不同的运动补偿精度要求采用半像素、1/4像素或1/8像素插值。
9.根据权利要求6所述的装置,其特征在于,所述运动补偿模块包括:
分割模块,用于进行多级分割;
并行处理模块,用于对所述多级分割中各个级别的分块进行并行处理。
10.根据权利要求6所述的装置,其特征在于,所述结果选取模块包括:
四叉树形收敛模块,用于采用四叉树进行所述树形收敛。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510647960.1A CN105245896A (zh) | 2015-10-09 | 2015-10-09 | Hevc并行运动补偿方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510647960.1A CN105245896A (zh) | 2015-10-09 | 2015-10-09 | Hevc并行运动补偿方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105245896A true CN105245896A (zh) | 2016-01-13 |
Family
ID=55043348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510647960.1A Pending CN105245896A (zh) | 2015-10-09 | 2015-10-09 | Hevc并行运动补偿方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105245896A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105744283A (zh) * | 2016-02-05 | 2016-07-06 | 南京云岩信息科技有限公司 | 并行视频编码的三维波前并行处理方法 |
CN105959704A (zh) * | 2016-04-29 | 2016-09-21 | 珠海全志科技股份有限公司 | 反量化反变换方法及装置、hevc解码方法及设备 |
CN106878737A (zh) * | 2017-03-02 | 2017-06-20 | 西安电子科技大学 | 高效视频编码中的运动估计加速方法 |
CN108259912A (zh) * | 2018-03-28 | 2018-07-06 | 天津大学 | 一种分像素运动估计的并行实现方法 |
CN108495138A (zh) * | 2018-03-28 | 2018-09-04 | 天津大学 | 一种基于gpu的整像素运动估计方法 |
WO2018166535A1 (zh) * | 2017-03-17 | 2018-09-20 | 山东科技大学 | 一种基于编码时间预测模型的负载均衡方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102497550A (zh) * | 2011-12-05 | 2012-06-13 | 南京大学 | H.264编码中运动补偿插值的并行加速方法及装置 |
CN103297777A (zh) * | 2013-05-23 | 2013-09-11 | 广州高清视信数码科技股份有限公司 | 一种用于加速视频编码速度的方法及装置 |
CN103414896A (zh) * | 2013-07-30 | 2013-11-27 | 复旦大学 | 一种基于多核实现的运动估计方法 |
CN103747262A (zh) * | 2014-01-08 | 2014-04-23 | 中山大学 | 一种基于gpu的运动估计方法 |
CN104125466A (zh) * | 2014-07-10 | 2014-10-29 | 中山大学 | 一种基于gpu的hevc并行解码方法 |
CN104159123A (zh) * | 2014-08-11 | 2014-11-19 | 哈尔滨工业大学深圳研究生院 | 一种适合于硬件实现的hevc运动估计方法 |
US20140341288A1 (en) * | 2013-05-14 | 2014-11-20 | Mediatek Inc. | Video encoding method and apparatus for determining size of parallel motion estimation region based on encoding related information and related video decoding method and apparatus |
CN104469488A (zh) * | 2014-12-29 | 2015-03-25 | 北京奇艺世纪科技有限公司 | 视频解码方法及系统 |
-
2015
- 2015-10-09 CN CN201510647960.1A patent/CN105245896A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102497550A (zh) * | 2011-12-05 | 2012-06-13 | 南京大学 | H.264编码中运动补偿插值的并行加速方法及装置 |
US20140341288A1 (en) * | 2013-05-14 | 2014-11-20 | Mediatek Inc. | Video encoding method and apparatus for determining size of parallel motion estimation region based on encoding related information and related video decoding method and apparatus |
CN103297777A (zh) * | 2013-05-23 | 2013-09-11 | 广州高清视信数码科技股份有限公司 | 一种用于加速视频编码速度的方法及装置 |
CN103414896A (zh) * | 2013-07-30 | 2013-11-27 | 复旦大学 | 一种基于多核实现的运动估计方法 |
CN103747262A (zh) * | 2014-01-08 | 2014-04-23 | 中山大学 | 一种基于gpu的运动估计方法 |
CN104125466A (zh) * | 2014-07-10 | 2014-10-29 | 中山大学 | 一种基于gpu的hevc并行解码方法 |
CN104159123A (zh) * | 2014-08-11 | 2014-11-19 | 哈尔滨工业大学深圳研究生院 | 一种适合于硬件实现的hevc运动估计方法 |
CN104469488A (zh) * | 2014-12-29 | 2015-03-25 | 北京奇艺世纪科技有限公司 | 视频解码方法及系统 |
Non-Patent Citations (1)
Title |
---|
仝明亮: "《基于GPU的H.265视频并行编码设计与实现》", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105744283A (zh) * | 2016-02-05 | 2016-07-06 | 南京云岩信息科技有限公司 | 并行视频编码的三维波前并行处理方法 |
CN105744283B (zh) * | 2016-02-05 | 2019-02-22 | 南京云岩信息科技有限公司 | 并行视频编码的三维波前并行处理方法 |
CN105959704A (zh) * | 2016-04-29 | 2016-09-21 | 珠海全志科技股份有限公司 | 反量化反变换方法及装置、hevc解码方法及设备 |
CN105959704B (zh) * | 2016-04-29 | 2019-04-05 | 珠海全志科技股份有限公司 | 反量化反变换方法及装置、hevc解码方法及设备 |
CN106878737A (zh) * | 2017-03-02 | 2017-06-20 | 西安电子科技大学 | 高效视频编码中的运动估计加速方法 |
CN106878737B (zh) * | 2017-03-02 | 2019-10-08 | 西安电子科技大学 | 高效视频编码中的运动估计加速方法 |
WO2018166535A1 (zh) * | 2017-03-17 | 2018-09-20 | 山东科技大学 | 一种基于编码时间预测模型的负载均衡方法 |
CN108259912A (zh) * | 2018-03-28 | 2018-07-06 | 天津大学 | 一种分像素运动估计的并行实现方法 |
CN108495138A (zh) * | 2018-03-28 | 2018-09-04 | 天津大学 | 一种基于gpu的整像素运动估计方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2684200C2 (ru) | Способ и устройство для кодирования вектора при кодировании и декодировании видео | |
CN107241605B (zh) | 视频编码器以及视频编码方法 | |
CN105245896A (zh) | Hevc并行运动补偿方法及装置 | |
TWI445411B (zh) | 在譯碼單元之視頻譯碼中執行局部運動向量推導之方法與相應裝置 | |
EP2942961A1 (en) | Methods for encoding/decoding of video using common merging candidate set of asymmetric partitions | |
KR20180019688A (ko) | 픽처 예측 방법 및 픽처 예측 장치 | |
CN107409218A (zh) | 使用块分割的快速视频编码方法 | |
US10306255B2 (en) | Image decoding device, image decoding method, and integrated circuit | |
CN106170093B (zh) | 一种帧内预测性能提升编码方法 | |
CN103975599A (zh) | 图像编码以及解码方法、装置、程序 | |
US20180199058A1 (en) | Video encoding and decoding method and device | |
CN101755462A (zh) | 图像编码装置以及图像编码方法 | |
KR102273670B1 (ko) | 움직임 보상 정보를 수정하는 데이터 처리 시스템과 데이터 처리 방법 | |
CN104519367A (zh) | 视频解码处理装置及其操作方法 | |
CN104883566A (zh) | 一种适用于hevc标准的帧内预测块大小划分的快速算法 | |
US20150063455A1 (en) | Methods and apparatuses for predicting depth quadtree in three-dimensional video | |
JP7279084B2 (ja) | イントラ予測のための方法及び装置 | |
CN116723328A (zh) | 一种视频编码方法、装置、设备及存储介质 | |
CN103327340B (zh) | 一种整数搜索方法及装置 | |
CN105376586A (zh) | 一种适用于hevc标准中整数运动估计的三级流水线硬件架构 | |
KR102234712B1 (ko) | 영상 부호화 방법과 복호화 방법 및 이를 이용한 영상 부호화 장치와 복호화 장치 | |
Asif et al. | Exploiting MB level parallelism in H. 264/AVC encoder for multi-core platform | |
KR101819138B1 (ko) | Hevc 부호화기를 위한 병합 모드의 연산량 감소 방법 | |
US10743009B2 (en) | Image processing apparatus and image processing method | |
CN104602026A (zh) | 一种适用于hevc标准下编码器中全复用的重建环路结构 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200519 Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province Applicant after: Alibaba (China) Co.,Ltd. Address before: 200082, A-7 building, Mecca Plaza, 688 Dalian Road, Shanghai, Yangpu District Applicant before: Transmission network technology (Shanghai) Co., Ltd |
|
TA01 | Transfer of patent application right | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160113 |
|
RJ01 | Rejection of invention patent application after publication |