CN107135392B - 基于异步模式的hevc运动搜索并行方法 - Google Patents

基于异步模式的hevc运动搜索并行方法 Download PDF

Info

Publication number
CN107135392B
CN107135392B CN201710263957.9A CN201710263957A CN107135392B CN 107135392 B CN107135392 B CN 107135392B CN 201710263957 A CN201710263957 A CN 201710263957A CN 107135392 B CN107135392 B CN 107135392B
Authority
CN
China
Prior art keywords
search
lcu
thread
gpu
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710263957.9A
Other languages
English (en)
Other versions
CN107135392A (zh
Inventor
肖嵩
宋红丹
谭飞杨
田间
刘文兵
杜建超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Electronic Science and Technology
Original Assignee
Xian University of Electronic Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Electronic Science and Technology filed Critical Xian University of Electronic Science and Technology
Priority to CN201710263957.9A priority Critical patent/CN107135392B/zh
Publication of CN107135392A publication Critical patent/CN107135392A/zh
Application granted granted Critical
Publication of CN107135392B publication Critical patent/CN107135392B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于异步模式的HEVC运动搜索并行方法,主要解决HEVC编码复杂度高、实时性差的问题。其实现步骤为:1)将CPU划分为第一线程和第二线程;2)第一线程对GPU进行调度:首先根据运动矢量的情况将LCU划分为运动缓慢、中等、剧烈的三类,然后根据LCU的类型选择搜索模板并开辟GPU线程,再计算LCU的初始搜索点,完成对最大编码单元LCU内各个预测单元匹配块的并行计算:3)第二线程调用第一线程的结果数据完成编码。本发明通过GPU多线程实现了HEVC运动搜索的并行计算,并通过CPU多线程实现了CPU和GPU的异步模式,大幅度降低了编码时间,可用于对视频编码标准HEVC的优化。

Description

基于异步模式的HEVC运动搜索并行方法
技术领域
本发明属于视频压缩编码领域,特别涉及一种运动搜索并行方法,可用于对视频编码标准HEVC的优化。
背景技术
随着视频应用的多样性和视频高清化趋势,对视频压缩效率的要求越来越高。2010年4月ITU-T VCEG和ISO/IEC MPEG联合成立JCT-VC联合协作小组,着手开始制定了新一代的视频编码标准H.265/HEVC。并确定了HEVC的其核心目标是在H.264/AVC HighProfile的基础上,将压缩效率提高一倍,即在保证相同的视频图像质量的前提下,视频流的码率减少50%。随之带来的是编码复杂度的大幅度提升,普遍认为HEVC的编码复杂度是H.264/AVC的8倍以上。HEVC编码标准的高复杂度使得其编码时间大大提升,远不能达到实时编码,给其应用推广带来了巨大的挑战。为此,如何在不影响图像质量和码率的前提下实现快速编码成为亟待解决的问题。
大连理工大学张维龙在2016年发表的硕士论文“HEVC关键模块并行算法的设计与基于GPU的实现”中,针对16x16的预测单元实现了HEVC运动搜索算法的CUDA优化,该方法在对TZSearch算法做并行优化的过程中,每次只对一个预测单元中的搜索点进行并行计算,而且在优化过程中存在很多分支判断,导致CUDA的并行计算量并不是很高。对于1080P的图像平均加速比只有11倍左右。
北京邮电大学徐荣飞在2013年发表的硕士论文“HEVC编解码算法的CUDA优化”中,对运动估计模块进行了优化,论文在搜索点起始点的选取前一帧LCU中所有分块的运动矢量的平均值,对不同的视频序列采取相同的搜索模板,导致搜索精度有所下降,特别是对运动较为剧烈的视频序列进行编码时,会对图像质量和码率带来较大的影响。
南京邮电大学仝明亮在2014年发表的硕士论文“基于GPU的H.265视频并行编码设计与实现”中,对全搜索算法进行了CUDA优化,由于全搜索算法本身搜索点数比快速算法多很多,故在此基础上做并行优化,编码时间并没有得到很好的改善。
发明内容
本发明针对以上问题,提供了一种基于异步模式的HEVC运动搜索的并行方法,在对图像压缩效率和图像质量影响较小的情况下,大幅度降低编码时间。
为达到上述目的,本发明技术方案包括如下:
1.一种基于异步模式的HEVC运动搜索并行方法,其特征在于包括:
(1)将CPU划分两个线程,即第一线程和第二线程;
(2)第一线程对GPU进行调度,完成最大编码单元LCU内各个预测单元匹配块的并行计算:
2a)获取第二线程在前一帧编码过程中计算的第i-1帧的第n个LCU块的所有预测单元运动矢量的平均值MVi-1(n)与第i-2帧的第n个LCU块的所有预测单元运动矢量的平均值MVi-2(n)的差值△(MVi-1(n)),其中i表示当前帧图像,i-1表示前一帧图像,i-2表示当前帧之前的第二帧图像;
2b)根据差值△(MVi-1(n))的模长d(△(MVi-1(n))),将LCU划分为运动平缓,运动中等和运动剧烈的a,b,c三类,并为不同类别的LCU选择不同的搜索模板,根据LCU的搜索模板再划分GPU线程;
2c)计算LCU搜索点的起始位置:
2d)计算每个搜索位置的LCU块中每个4x4像素块的绝对误差和SAD4×4(x,y),其中,x、y分别是运动矢量的水平分量和垂直分量;
2e)通过4x4像素块的绝对误差和SAD4×4(x,y)值,计算LCU中各个预测单元PU的绝对误差和SADM×N(x,y)值,其中M、N表示像素块的大小,M、N的取值范围从4到64变化;
2f)将2e)的结果数据从GPU显存中拷贝到CPU内存,并存放到缓存队列中;
(3)第二线程通过缓存队列调用第一线程的结果数据,完成编码器的编码。
本发明与现有技术相比具有以下优点:
1、本发明通过增加起始搜索点的计算和搜索模板的自适应选择,去除运动搜索过程中LCU内各个预测单元的数据依赖关系,实现了LCU内各个预测单元的并行计算,并通过设计CPU多线程实现CPU与GPU计算的异步模式,大幅度降低了编码时间。
2、本发明根据前两帧运动矢量的平均值的差值将LCU划分为运动平缓,运动中等和运动剧烈的a,b,c三类,并根据LCU的运动状态动态为不同类别的LCU选择不同的搜索模板,提高了运动搜索的准确性。
3、本发明根据前两帧对应位置的LCU内的各个PU的运动矢量的平均值确定每个LCU的运动搜索点的起始位置,提高了搜索精度。
附图说明
图1是本发明的实现总流程;
图2是本发明中第一线程对GPU进行调度的子流程图;
图3是本发明中运动搜索中对四种基本搜索模板的搜索位置示意图;
图4是本发明中计算各个预测单元绝对误差和的示意图。
具体实施方式
以下参照附图对本发明的实例及效果进行详细的描述:
参照图1,发明的实现步骤如下:
步骤1:将CPU划分为两个线程。
在视频编码过程中,通过C运行时库的_beginthreadex在CPU端开辟两个线程对数据进行处理,即将CPU划分为第一线程和第二线程,其中:
第一线程首先获取当前帧和参考帧信息,并将参考帧信息拷贝到GPU显存,然后将每帧图像划分为互不重叠的最大编码单元LCU,对每个LCU的预测单元进行处理,即计算最大编码单元LCU内各个预测单元的匹配值,执行步骤2;
第二线程作为主线程,通过第一线程调用GPU对运动搜索匹配块进行计算,然后在运动搜索模块调用第一线程的结果数据,进行视频序列的编码,执行步骤3。
步骤2:第一线程计算最大编码单元LCU内各个预测单元的匹配值。
参照图2,本步骤的具体实现如下:
2a)初始化并行计算所需要的运动矢量信息:
首先,获取第i-1帧的第n个LCU块的所有预测单元运动矢量的平均值MVi-1(n);
接着,获取第i-2帧的第n个LCU块的所有预测单元运动矢量的平均值MVi-2(n);
然后,计算MVi-1(n)和MVi-2(n)的差值△(MVi-1(n)):
△(MVi-1(n))=MVi-1(n)-MVi-2(n);
其中i表示当前帧图像,i-1表示前一帧图像,i-2表示当前帧之前的第二帧图像,最后,计算△(MVi-1(n))的模长d(△(MVi-1(n))):
d(△(MVi-1(n)))=|△(MVi-1(n)))|=|MVi-1(n)-MVi-2(n)|;
2b)为不同类别的LCU确定不同的搜索模板,并确定GPU的线程划分:
2b1)根据差值△(MVi-1(n))的模长d(△(MVi-1(n))),将LCU划分为运动平缓,运动中等和运动剧烈的a,b,c三类,并按照如下标准对LCU进行划分:
若d(△(MVi-1(n)))≥0且d(△(MVi-1(n)))<2,则将LCU划分为运动平缓类a;
若d(△(MVi-1(n)))≥2且d(△(MVi-1(n)))<5,则将LCU划分为运动平缓类b;
若d(△(MVi-1(n)))≥5,则将LCU划分为运动平缓类c;
2b2)根据LCU的类别选择搜索模板:
若LCU为a类,则选择a类搜索模板,该a类模板的搜索点集中在搜索起始点附近,搜索点数为λa=100;
若LCU为b类,则选择b类搜索模板,该b类模板的搜索点分布处于a类和c类两种模板之间,搜索点数λb=128;
若LCU为c类,则选择c类搜索模板,该c类模板的搜索点的分布较为分散,搜索点数λc=128。
根据不同类别的LCU搜索模板的搜索点的分布特征,参照图3的四种基本搜索模板的搜索位置示意图,描述a、b、c三类不同的LCU搜索模板的组成,得到搜索模板的搜索点位置分布,如表1所示,其中,图3(a)是4点搜索模板,图3(b)是8点搜索模板,图3(c)是12点搜索模板,图3(d)是16点搜索模板。
表1不同类型的LCU搜索模板中搜索点的分布
2b3)根据搜索模板划分GPU线程:
根据搜索模板的搜索点的个数对GPU线程进行划分,GPU的线程划分包括对线程网格Grid的划分和对线程块Block的划分,即首先将每个线程网格划分为多个线程块,再将每个线程块划分为多个线程,其中:
对线程网格Grid的划分,是将每个线程网格划分为λi*N个线程块,其中λi为LCU搜索点的个数,N为当前帧的参考帧的个数;
对线程块Block的划分,是每个线程块划分为16*16个线程,其中每个线程计算一个4x4的像素块的绝对误差和,一个64x64大小的LCU有个4x4像素块;
2c)计算LCU块的在不同情况下的起始搜索位置MVstart
若当前帧的前一帧者不存在,即不存在MVi-1(n)的值时,则MVstart=(0,0);
若当前帧之前的第二帧不存在,即不存在Δ(MVi-1(n))的值,则MVstart=MVi-1(n);
在其他情况下,
2d)按照如下公式计算LCU中每个4x4像素块的绝对误差和SAD4×4(x,y):
其中,M、N均表示像素块的大小,M=4,N=4,fi和fi-1分别代表当前图像和参考图像的像素值,x、y分别是运动矢量的水平分量和垂直分量;
2e)计算LCU中各个预测单元的绝对误差和:
参照图4,本步骤是根据4x4像素块的绝对误差和SAD4×4(x,y)值,计算LCU中各个预测单元的绝对误差和SADM×N(x,y)值,其中M、N表示像素块的大小,M、N的取值范围从4到64变化,具体步骤如下:
首先,根据两个相邻的4x4像素块的绝对误差和SAD4×4(x,y)值,计算4x8,8x4像素块的绝对误差和,再根据两个相邻4x8像素块的绝对误差和计算8x8像素块的绝对误差和;
接着,根据8x8像素块绝对误差和分别计算8x16像素块和16x8像素块绝对误差和,再根据两个8x16像素块的绝对误差和计算16x16像素块的绝对误差和;
以此类推,计算16x16,16x32,32x16,32x32,32x64,64x32,64x64各个不同尺寸的像素块的绝对误差和SADM×N(x,y)值,得到并行计算的结果数据;
2f)将并行计算的结果数据,即2e)的结果数据从GPU显存中拷贝到CPU内存,并将结果数据存放到缓存队列中。
步骤3:第二线程利用第一线程的结果数据,进行编码。
第二线程作为主线程,首先将运动搜索模块的匹配值的计算交由第一线程进行计算,接着在编码过程中运行到运动估计时,调用第一线程的结果数据,进行编码。
本发明的效果可以通过以下实验进行进一步说明:
1.实验条件和对象:
硬件仿真平台CPU处理器是Intel(R)Core(TM)i3-3220@3.30GHZ,操作系统是64位的Windows10,GPU型号是NVIDIA GeForce GTX 960,开发工具是Microsoft Visual studio2013和CUDA 7.5;
本实验采用HEVC测试模型HM16.6,选用配置文件encoder_lowdelay_P_main.cfg,其中,令FEN=0、AMP=0,对运动搜索并行方法和原始算法进行测试。
2.实验内容和结果:
用本发明方法和现有的原始算法分别对四种不同分辨率的多组视频序列进行测试,测试结果如表2。
表2基于异步模式的HEVC运动搜索并行方法实验结果
表2中,Y-PSNR表示本发明的Y分量的峰值信噪比与原始算法的差值,码率(%)表示本发明方法的码率与原始方法的差值与原始方法比值,加速比表示本发明方法与原始方法的比值;
从表2可以看出,本发明与原始算法进行比较,峰值信噪比Y-PSNR平均降低了0.029dB,码率平均提高1.627%,平均速度提高了18.465倍。
实验结果表明,本发明在对图像质量和码率影响很小的情况下,取得了很好的模块加速比。

Claims (4)

1.一种基于异步模式的HEVC运动搜索并行方法,其特征在于包括:
(1)将CPU划分两个线程,即第一线程和第二线程;
(2)第一线程对GPU进行调度,完成最大编码单元LCU内各个预测单元匹配块的并行计算:
2a)获取第二线程在前一帧编码过程中计算的第i-1帧的第n个LCU块的所有预测单元运动矢量的平均值MVi-1(n)与第i-2帧的第n个LCU块的所有预测单元运动矢量的平均值MVi-2(n)的差值Δ(MVi-1(n)),表示如下:
Δ(MVi-1(n))=MVi-1(n)-MVi-2(n),
其中i表示当前帧图像,i-1表示前一帧图像,i-2表示当前帧之前的第二帧图像;
2b)根据差值Δ(MVi-1(n))的模长d(Δ(MVi-1(n))),表示如下:
d(Δ(MVi-1(n)))=|Δ(MVi-1(n)))|=|MVi-1(n)-MVi-2(n)|,
将LCU划分为运动平缓,运动中等和运动剧烈的a,b,c三类,并为不同类别的LCU选择不同的搜索模板,根据LCU的搜索模板再划分GPU线程;
2c)计算LCU搜索点的起始位置:
2d)计算每个搜索位置的LCU块中每个4x4像素块的绝对误差和SAD4×4(x,y),表示如下:
其中,M、N表示像素块的大小,即M=4,N=4,fi(m,n)和fi-1(m+x,n+y)分别代表当前图像和参考图像的像素值,x、y分别是运动矢量的水平分量和垂直分量;
2e)通过4x4像素块的绝对误差和SAD4×4(x,y)值,计算LCU中各个预测单元PU的绝对误差和SADM×N(x,y)值,其中M、N表示像素块的大小,M、N的取值范围从4到64变化;
2f)将2e)的结果数据从GPU显存中拷贝到CPU内存,并存放到缓存队列中;
(3)第二线程通过缓存队列调用第一线程的结果数据,完成编码器的编码,即将编码过程中运动搜索中预测块的计算,通过第一线程调用GPU进行数据计算,然后通过第二线程调用GPU运算结果进行编码。
2.根据权利要求1所述的方法,其中步骤2b)中将LCU划分为运动平缓,运动中等和运动剧烈的a,b,c三类,按如下条件划分:
若d(Δ(MVi-1(n)))≥0且d(Δ(MVi-1(n)))<2,则将LCU划分为运动平缓类a;
若d(Δ(MVi-1(n)))≥2且d(Δ(MVi-1(n)))<5,则将LCU划分为运动平缓类b;
若d(Δ(MVi-1(n)))≥5,则将LCU划分为运动平缓类c。
3.根据权利要求1所述的方法,其中步骤2b)中为不同类别的LCU分配不同的搜索模板,并划分GPU线程,按如下步骤进行:
2b1)根据如下条件选择搜索模板:
若LCU为a类,则选择a类搜索模板,该a类模板的搜索点集中在搜索起始点附近,搜索点数为λa=100;
若LCU为b类,则选择b类搜索模板,该b类模板的搜索点分布处于a类和c类两种模板之间,搜索点数λb=128;
若LCU为c类,则选择c类搜索模板,该c类模板的搜索点的分布较为分散,搜索点数λc=128;
2b2)按照搜索模板搜索点的个数,将GPU划分为λi*N大小的线程网格Grid和16*16大小的线程块Block;其中N为参考帧的个数,i表示搜索模板的类别。
4.根据权利要求1所述的方法,其中步骤2e)根据4x4像素块的绝对误差和SAD4×4(x,y)值,计算LCU中各个预测单元PU的绝对误差和SADM×N(x,y),按如下步骤进行:
首先,根据两个相邻的4x4像素块的SAD4×4(x,y)值,计算4x8,8x4像素块的绝对误差和,再根据两个相邻4x8像素块的绝对误差和计算8x8像素块的绝对误差和,
接着,根据8x8像素块分别计算8x16像素块和16x8像素块绝对误差和,再根据两个8x16像素块的绝对误差和计算16x16像素块的绝对误差和;
以此类推,计算16x16,16x32,32x16,32x32,32x64,64x32,64x64各个不同尺寸的像素块的绝对误差和SADM×N(x,y)值。
CN201710263957.9A 2017-04-21 2017-04-21 基于异步模式的hevc运动搜索并行方法 Active CN107135392B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710263957.9A CN107135392B (zh) 2017-04-21 2017-04-21 基于异步模式的hevc运动搜索并行方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710263957.9A CN107135392B (zh) 2017-04-21 2017-04-21 基于异步模式的hevc运动搜索并行方法

Publications (2)

Publication Number Publication Date
CN107135392A CN107135392A (zh) 2017-09-05
CN107135392B true CN107135392B (zh) 2019-12-10

Family

ID=59716770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710263957.9A Active CN107135392B (zh) 2017-04-21 2017-04-21 基于异步模式的hevc运动搜索并行方法

Country Status (1)

Country Link
CN (1) CN107135392B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110213591B (zh) * 2018-03-07 2023-02-28 腾讯科技(深圳)有限公司 一种视频运动估计方法、装置及存储介质
CN109391816B (zh) * 2018-10-26 2020-11-03 大连理工大学 基于cpu+gpu异构平台实现hevc中熵编码环节的并行处理方法
CN110691246B (zh) * 2019-10-31 2022-04-05 北京金山云网络技术有限公司 视频编码方法、装置及电子设备
CN112104871B (zh) * 2020-11-13 2021-03-02 腾讯科技(深圳)有限公司 一种数据编码方法、装置以及计算机可读存储介质
CN113365081B (zh) * 2021-05-27 2023-02-07 深圳市杰理微电子科技有限公司 视频编码中运动估计优化方法与装置
CN114827614B (zh) * 2022-04-18 2024-03-22 重庆邮电大学 一种实现lcevc视频编码优化的方法
CN115474060B (zh) * 2022-10-31 2023-01-17 中南大学 一种hevc并行加速编码方法、系统、设备及存储介质
CN116506628B (zh) * 2023-06-27 2023-10-24 苇创微电子(上海)有限公司 一种基于像素块的编码预测器方法、编码系统及编码装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2192781A2 (en) * 2008-11-28 2010-06-02 Thomson Licensing Method for video decoding supported by graphics processing unit
CN102547289A (zh) * 2012-01-17 2012-07-04 西安电子科技大学 基于gpu并行实现的快速运动估计方法
CN103237222A (zh) * 2013-05-07 2013-08-07 河海大学常州校区 多模式搜索的运动估计方法
CN103747262A (zh) * 2014-01-08 2014-04-23 中山大学 一种基于gpu的运动估计方法
CN104994394A (zh) * 2015-05-04 2015-10-21 北京大学 编码器运动估算方法及装置
CN105516728A (zh) * 2015-12-15 2016-04-20 华中科技大学 一种H.265/HEVC中8x8子宏块的并行帧内预测方法
CN105516726A (zh) * 2015-11-27 2016-04-20 传线网络科技(上海)有限公司 视频编码的运动补偿匹配方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120177119A1 (en) * 2011-01-07 2012-07-12 Sony Corporation Faster motion estimation in an avc software encoder using general purpose graphic process units (gpgpu)

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2192781A2 (en) * 2008-11-28 2010-06-02 Thomson Licensing Method for video decoding supported by graphics processing unit
CN102547289A (zh) * 2012-01-17 2012-07-04 西安电子科技大学 基于gpu并行实现的快速运动估计方法
CN103237222A (zh) * 2013-05-07 2013-08-07 河海大学常州校区 多模式搜索的运动估计方法
CN103747262A (zh) * 2014-01-08 2014-04-23 中山大学 一种基于gpu的运动估计方法
CN104994394A (zh) * 2015-05-04 2015-10-21 北京大学 编码器运动估算方法及装置
CN105516726A (zh) * 2015-11-27 2016-04-20 传线网络科技(上海)有限公司 视频编码的运动补偿匹配方法和系统
CN105516728A (zh) * 2015-12-15 2016-04-20 华中科技大学 一种H.265/HEVC中8x8子宏块的并行帧内预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HEVC编解码算法的CUDA优化;徐荣飞;《中国优秀硕士学位论文全文数据库 信息科技辑》;20131130;全文 *

Also Published As

Publication number Publication date
CN107135392A (zh) 2017-09-05

Similar Documents

Publication Publication Date Title
CN107135392B (zh) 基于异步模式的hevc运动搜索并行方法
TWI445411B (zh) 在譯碼單元之視頻譯碼中執行局部運動向量推導之方法與相應裝置
CN111050168B (zh) 仿射预测方法及其相关装置
CN107046645A (zh) 图像编解码方法及装置
US20150208094A1 (en) Apparatus and method for determining dct size based on transform depth
KR20090096143A (ko) 움직임 예측을 통한 부호화 시스템 및 움직임 예측을 통한부호화 방법
CN105812804A (zh) 一种确定rdoq过程中最优量化值的方法及装置
CN104811729B (zh) 一种视频多参考帧编码方法
Zhu et al. An improved inter-frame prediction algorithm for video coding based on fractal and H. 264
CN101621696A (zh) 允许分数视频运动估计和双向视频运动估计的选择性使用
US20190279330A1 (en) Watermark embedding method and apparatus
Hu et al. Fvc: An end-to-end framework towards deep video compression in feature space
Zhao et al. A dynamic slice control scheme for slice-parallel video encoding
CN104883566A (zh) 一种适用于hevc标准的帧内预测块大小划分的快速算法
Gao et al. IVP: An intelligent video processing architecture for video streaming
CN101083769A (zh) 处理n比特视频数据的编/解码器和编/解码方法
Xiao et al. A multi-grained parallel solution for HEVC encoding on heterogeneous platforms
CN110149512A (zh) 帧间预测加速方法、控制装置、电子装置、计算机存储介质及设备
Gao et al. An intelligent video processing architecture for edge-cloud video streaming
JP2010045690A (ja) 動画像符号化装置および動画像符号化方法
Van et al. Fast motion estimation for closed-loop HEVC transrating
CN101268623B (zh) 用于创建可变形状区块的方法和装置
WO2023245460A1 (en) Neural network codec with hybrid entropy model and flexible quantization
Huo et al. Unified cross-component linear model in VVC based on a subset of neighboring samples
CN106101731B (zh) 图像无损压缩方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant