CN102572415B - 在可重构处理器上映射和实现的运动补偿算法的方法 - Google Patents

在可重构处理器上映射和实现的运动补偿算法的方法 Download PDF

Info

Publication number
CN102572415B
CN102572415B CN2010105938053A CN201010593805A CN102572415B CN 102572415 B CN102572415 B CN 102572415B CN 2010105938053 A CN2010105938053 A CN 2010105938053A CN 201010593805 A CN201010593805 A CN 201010593805A CN 102572415 B CN102572415 B CN 102572415B
Authority
CN
China
Prior art keywords
carry out
predictive mode
array
sub
configuration information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2010105938053A
Other languages
English (en)
Other versions
CN102572415A (zh
Inventor
刘雷波
耿同生
尹首一
魏少军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Pango Microsystems Co Ltd
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN2010105938053A priority Critical patent/CN102572415B/zh
Publication of CN102572415A publication Critical patent/CN102572415A/zh
Application granted granted Critical
Publication of CN102572415B publication Critical patent/CN102572415B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供了一种在可重构处理器上映射和实现的运动补偿算法的方法,包括:步骤101,算法的软硬件划分,采用嵌入式处理器进行软件执行,PE阵列进行硬件执行;步骤102,根据预测模式及宏块的分割模式对配置信息进行划分并编写;步骤103,根据宏块的分割方式对PE阵列进行划分,嵌入式处理器提供相应的配置组序列号,PE阵列进行计算。本发明的在可重构处理器上映射和实现的运动补偿算法的方法,能够减少配置可重构阵列的时间,减少数据通信代价以及提高算法的并行性。

Description

在可重构处理器上映射和实现的运动补偿算法的方法
技术领域
本发明涉及视频图像处理方法,特别是涉及一种在可重构处理器上映射和实现的运动补偿算法的方法。
背景技术
在计算机技术与应用的发展历程中,人们对计算性能的追求是无止境的。传统上性能的获得有两种方式:一是ASIC(Application SpecificIntegrated Circuit即专用集成电路)方式,针对特定的计算任务设计专用的集成电路。这种方法具有很高的执行速度和运算精度,但功能单一,灵活性差,要想实现不同的算法必须重新设计集成电路,开发成本和周期都很高;在现在深亚微米的工艺条件下,随着特征尺寸缩小,设计难度加大,制造成本飞速增加。当需要多种不同功能时,需要使用多种ASIC,给电路板级设计带来困难。另一种是GPP(General Purpose Processor即通用指令集处理器)方式。该方法灵活高,通过编写软件指令就可改变系统的功能。但指令的串行执行以及指令集的有限性、有限的运算单元、存储器带宽等限制使得GPP的性能、功耗等并不理想。
由于新一代媒体处理要求高处理能力、低功耗和高灵活性,另一方面,媒体标准的多样化,未来标准的可扩展性要求,通用处理器以及固定的专用芯片无法实现这些方面的统一,而可重构的媒体处理则可以很好的实现要求,故可重构处理器为媒体处理提供了新的发展方向。
可重构处理器主要由嵌入式处理器、PE阵列以及内存访问控制器、总线仲裁器等组成。其中,嵌入式处理器主要负责系统控制和进行小规模的,不规则的数据运算;PE阵列主要负责进行大规模的、高度并行的数据运算,是可重构处理器的核心运算单元。在嵌入式处理器的控制下,PE阵列的功能和结构可以进行重新配置。经过重新配置以后,PE阵列即转化成为类似于硬线连接(Hardwired)的逻辑,具备硬线连接逻辑(例如ASIC)的绝大多数优秀特征(如高性能、低功耗等)。PE阵列的这种特性,集中体现了“可重构”的理念,是可重构处理器与其他类型处理器,如依靠指令实现可编程(从而可以实现不同功能)的CPU和DSP,的最本质区别。
视频压缩算法(如H.264,MPEG2等)有两种类型的计算:一种是不可并行的计算(可由可重构处理器中的嵌入式处理器负责),其计算中控制和数据相关性强,有较多的转移分支;另一种则是可并行计算(可由可重构处理器中的PE阵列负责),可以归纳为基于块和宏块的并发操作、规则的数据依赖关系以及计算复杂度的高度集中三个方面。其中,具有并行计算特点的算法的计算量占整个编解码中的绝大多数,以H264帧间预测的所采用的MC(Motion Compensation即运动补偿算法)最具有代表性。经过标准测试码流(foreman)评定,H.264 HiP(High Profile)解码算法中MC占其比例的52%。故此,如果MC算法的执行效率,对于解码H.264HiP 1080P30帧/秒的实现具有很高的意义。
当前的可重构架构的实现方案中,如M.K.A.Ganesan“H.264Decoder at HD Resolution on a Coarse Grain Dynamically ReconfigurableArchitecture”in Field Programmable Logic and Applications,2007.FPL2007.(XPP PACT架构),只是集中研究了MC算法中计算密集型任务部分,而并没有涉及MC算法的整体实现。一个典型算法在可重构类型的处理器上实现主要由三个子任务构成:配置可重构阵列(66%),数据通信(27%),计算(7%)。由此可见,计算只占整体运行时间很少的一部分。另外,不论是在当前的可重构实现方案还是ASIC实现方案中,如S.Z.Wang,″A new motion compensation design for H.264/AVC decoder,″in 2005 IeeeInternational Symposium on Circuits and Systems,都没有深入挖掘算法的并行性。使得数据传输的带宽非常大,计算效率不高。
故在算法的实现的过程中,如何最大限度的挖掘程序间的并行性,动态协调PE阵列和嵌入式处理器的关系(软硬件划分),使之以较低的配置代价(时间代价与空间代价),最小的能耗代价,达到最优的实现结果,是算法实现的核心问题。
发明内容
本发明所要解决的技术问题是提供一种在可重构处理器上映射和实现的运动补偿算法的方法,能够减少配置可重构阵列的时间,减少数据通信代价以及提高算法的并行性。
为了解决上述问题,本发明公开了一种在可重构处理器上映射和实现的运动补偿算法的方法,包括以下步骤:
步骤101,算法的软硬件划分,采用嵌入式处理器进行软件执行,PE阵列进行硬件执行;
步骤102,根据预测模式及宏块的分割模式对配置信息进行划分并编写;
步骤103,根据宏块的分割方式对PE阵列进行划分,嵌入式处理器提供相应的配置组序列号,PE阵列进行计算。
进一步地,所述采用嵌入式处理器进行软件执行包括以下步骤:
选择参考帧;
解码并计算运动向量值,并对向量值进行编码;
控制PE阵列的配置功能。
进一步地,所述预测模式为单向预测,采用PE阵列进行硬件执行包括以下步骤:
内插像素计算-以1/4为精度进行亮度的内插操作,以1/8为精度进行色度的内插操作。
进一步地,所述预测模式为双向预测,采用PE阵列进行硬件执行包括以下步骤:
内插像素计算-以1/4为精度进行亮度的内插操作,以1/8为精度进行色度的内插操作;
加权平均运算。
进一步地,所述根据预测模式及宏块的分割模式对配置信息进行划分并编写包括以下步骤:
对亮度配置信息的划分,包括以下子步骤:
C1,根据预测模式判断是否需要进行转置操作,如果需要,则进行步骤C2,反之,则进行步骤C3;
C2,进行转置操作;
C3,进行6抽头滤波的第一步操作;
C4,判断是否需要进行四舍五入操作,如果需要,则进行四舍五入;反之,则进行步骤C5;
C5,根据预测模式判断,是否需要进行6抽头滤波的第二步操作,如果需要,则进行步骤C6,反之,则返回步骤C2;
C6,进行6抽头滤波的第二步操作;
对色度配置信息的划分,包括以下子步骤:
D1,根据子块的分割方式,对子块所有的数据,进行乘法操作;
D2,根据子块的分割方式,对D1步骤得到的数据进行加权相加;
根据划分的亮度及色度配置信息进行编码。
进一步地,所述对亮度配置信息的划分在子步骤C6之后,还包括以下子步骤:
C7,根据预测模式判断是否进行转置操作,若是,则返回步骤C2,反之,则进行步骤C8;
C8,根据预测模式判断是否进行加权求平均操作,若是,则根据流水操作,并发处理及最大限度减少重复数据传输的要求,进行配置实现。
进一步地,所述方法还包括:
步骤104,判断是否是双向预测,如果是,则进行步骤105,反之,则结束操作;
步骤105,则采用第二次预测设定的配置信息重复步骤103得到第二次预测数据;
步骤106,将两次预测得到的数据进行加权求平均,得到最终值。
进一步地,C1步骤中,如果预测模式满足y=0或x=2中其中一个条件,则该预测模式不需要进行转置操作。
进一步地,C1步骤中需要进行转置操作的预测模式包括:(2,0)、(1,0)、(3,0)、(1,1)、(1,3)、(3,1)、(3,3)、(2,1)、(2,3)。
进一步地,C5步骤中,需要进行6抽头滤波的第二步操作的预测模式包括:(0,2)、(0,1)、(0,3)、(2,0)、(1,0)、(3,0)、(1,1)、(1,3)、(3,1)、(3,3)。
进一步地,C7步骤中需要进行转置操作的预测模式包括:(1,1)、(1,3)、(3,1)、(3,3)、(2,0)、(1,0)、(3,0)、(2,2)、(1,2)、(3,2);C8步骤中需要进行加权平均操作的预测模式包括:(1,1)、(1,3)、(3,1)、(3,3)、(2,1)、(2,3)、(0,1)、(0,3)、(1,0)、(3,0)、(1,2)、(3,2)。
与现有技术相比,本发明具有以下优点:
本发明的在可重构处理器上映射和实现的运动补偿算法的方法中,对于子块大小固定,子块的预测模式固定的情况下,具体的执行步骤是固定的,利用数据之间的并行性及可重构阵列,将操作步骤进行划分,也即是将具体的操作步骤分配到不同的配置信息上。采用并行流水操作,一套配置信息通过流水并行尽量完成一个子块内所有数据的一种类型的操作,如6抽头滤波的一步操作等,这样就可以减少一个子块内的数据进行同一操作而使得配置信息的不断切换,以减少配置信息的切换,另外采用流水操作,也可以提高执行效率。
进一步地,由于H.264帧间预测是利用已编码视频帧/场和基于块的运动补偿的预测模式。其块尺寸范围很广泛(从16×16到4×4),每个宏块(16×16像素)可以4种方式分割:一个16×16,两个16×8,两个8×16,四个8×8其运动补偿也相应有四种。而8×8模式的每个子宏块还可以四种方式分割:一个8×8,两个4×8或两个8×4及4个4×4。更进一步,每个子块色度都有16种预测模式,亮度有64种预测模式。
在宏块(16x16)的不同位置,子块大小相同,预测模式相同的情况下,其计算操作步骤相同,故不用严格按照块的分割方式从左到右从上到下来进行计算,可采用变换子块的执行次序,使得子块并行,以此来减少配置信息的切换次数,已达到减少配置信息操作时间的目的
附图说明
图1是本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例一的流程图;
图2是本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例二的流程图;
图3是本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例中单向预测类型的宏块的分割方式及预测模式分布图;
图4是本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例中的预测模式配置信息的划分流程图;
图5是本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例中的亮度的宏块分割方式及PE阵列划分的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例一,包括以下步骤:
步骤101,算法的软硬件划分,采用嵌入式处理器进行软件执行,PE阵列进行硬件执行。
其中,软件执行包括以下步骤:
A1,选择参考帧。宏块的不同子块对应于不同的参考帧位置,需要分别计算。
A2,解码并计算运动向量值,并对向量值进行编码,使之变成配置信息组的索引号。
A3,控制PE16x16阵列(Processing Element,阵列处理单元)的配置功能。通过选择相应的配置信息来配置PE阵列,使PE阵列完成不同功能。
前述三个方面计算中数据相关性较强且具有较多的转移分支,因此采用嵌入式处理器进行操作。
进一步地,硬件执行包括以下步骤:
B1,内插像素计算-以1/4为精度进行亮度的内插操作,以1/8为精度进行色度的内插操作。
B2,加权平均运算。
需要说明的是,对于硬件执行方面,若单向预测只用完成步骤B1,双向预测需要完成步骤B1和B2。
步骤102,根据预测模式及宏块的分割模式对配置信息进行划分并编写。
配置信息是由预测模式以及宏块的分割模式所决定,计算复杂度差别很大,但是最基本的操作是相同的-6抽头滤波(亮度),4抽头滤波(色度)。另外,计算步骤在同一子块内部是相同的,行与行之间,列与列之间是相对独立的运算。具体的,对配置信息进行划分并编写包括以下步骤:
步骤1021,对亮度配置信息的划分。
亮度配置信息的划分包括以下步骤:
C1,根据预测模式判断是否进行转置操作,如果需要,则进行步骤C2,反之,则进行步骤C3。
C2,进行转置操作,并将数据存储到PE8x8阵列(Processing Element8x8即8x8阵列处理单元,将PE16x16分成4个PE8x8)内部的存储单元中后进行步骤C3。
C3,进行6抽头滤波的第一步操作,并将中间数据存储到PE8x8阵列内部的存储单元中。
C4,判断是否需要进行四舍五入操作,如果需要则进行四舍五入操作,反之,则直接进行步骤C5。
C5,根据预测模式判断,是否需要进行6抽头滤波的第二步操作,若是,则进行步骤C6,反之,则返回步骤C2。
C6,进行6抽头滤波的第二步操作。此步操作需要根据预测模式选择对应于不同的参数配置。
C7,根据预测模式判断是否进行转置操作,若是,则返回步骤C2,反之,则进行步骤C8。
C8,根据预测模式判断是否进行加权求平均操作,若是,则根据流水操作,并发处理及最大限度减少重复数据传输的要求,进行配置实现。
其中,C1步骤中,进行转置操作的是为了将列数据操作通过转置后变成行操作,行操作可以减少重复数据的传输以及使操作规整化,因此如果预测模式满足y=0或x=2中其中一个条件,则该预测模式不需要进行列方向的滤波,即不需要进行转置操作,因此,如果预测模式为:(2,0)、(1,0)、(3,0)、(1,1)、(1,3)、(3,1)、(3,3)、(2,1)、(2,3)的其中一种,则需要进行转置操作。
C2步骤中,在进行转置操作时,还可以根据数据的不同规模对转置操作进行修正。
C3步骤中,将6抽头滤波分成两个操作步骤,这是因为PE8x8内部计算单元的限制,同时为了实现最大限度流水并行操作。另外,因为在某些预测模式中,6抽头滤波操作并不需要进行第二步的运算。
C4步骤中增加判断是否进行四舍五入操作的原因是保证块大小相同、但预测模式不同情况下,6抽头滤波的两步操作相同,以减少配置信息的套数来节省存储空间。其中,如果预测模式为(1,2)、(3,2)、(2,1)(2,3)、(2,2)的其中一种,则需要进行四舍五入操作。需要说明的是,对于某些已经判断是否需要进行四舍五入操作的预测模式,若在后续步骤中需要返回C2步骤进行转置操作后,则可以跳过C4步骤,无需进行第二次是否需要四舍五入操作的判断。
C5步骤中,对于比较简单的预测模式,如(y,x)=(0,2)-以1/4为精度,只需要进行步骤C1到C6即可。对于较为复杂的操作如(y,x)=(2,1)等,则需要进行前述的所有操作。其中,如果预测模式为(0,2)、(0,1)、(0,3)、(2,0)、(1,0)、(3,0)、(1,1)、(1,3)、(3,1)、(3,3)的其中一种,则需要进行6抽头滤波的第二步操作的预测模式。
C7步骤中,如果预测模式为(1,1)、(1,3)、(3,1)、(3,3)、(2,0)、(1,0)、(3,0)、(2,2)、(1,2)、(3,2)的其中一种,则需要进行转置操作。
C8步骤中,如果预测模式为(1,1)、(1,3)、(3,1)、(3,3)、(2,1)、(2,3)、(0,1)、(0,3)、(1,0)、(3,0)、(1,2)、(3,2)的其中一种,则需要进行加权平均操作。
步骤1022,对色度配置信息的划分。
对色度配置信息的划分包括以下步骤:
D1,根据子块的分割方式,对子块所有的数据,按照4抽头滤波的要求,对所有像素点进行乘法操作。采用此种方式可以减少冗余数据的传输,并将中间数据存储。
D2,根据子块的分割方式,对前一步骤得到的数据进行加权相加。
其中,宏块的色度成分为相应亮度的一半(水平和垂直各一半)。色度块采用和亮度块同样的分割模式,只是尺寸减半(水平和垂直方向都减半)。例如8x8的亮度块相应色度块尺寸为4x4。
步骤1023,根据划分的亮度及色度配置信息进行编码。
如果预测模式固定,则相应的配置信息的操作也固定,可将最终所得到的配置信息及中间数据的存取操作固定下来,连接成配置信息组,并且进行编码,则嵌入式处理器只需提供给PE阵列配置组编号,PE阵列则可查到相应的配置。
进一步地,即使有些操作是固定的,配置信息中同样存在动态可变因素,如有些配置参数的选取,一套配置信息的循环次数等,这些可由嵌入式处理器根据具体实例情况进行调配。
步骤103,根据宏块的分割方式对PE阵列进行划分,嵌入式处理器提供相应的配置组序列号,PE阵列进行计算。
具体操作如下:
E1,根据宏块的分割方式对PE16x16阵列进行划分。其中,最小划分单元是PE8x8。
E2,判断宏块的各个子块,将子块大小相同,预测模式相同的子块合并到同一个PE8x8中,其余的子块按照原始的宏块分割方式和位置分配到剩下的几个PE8x8中。
E3,嵌入式处理器提供相应的配置组序号进行配置,PE阵列进行计算。其中,先进行亮度的计算,然后进行色度的计算。
本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例中,对于子块大小固定,子块的预测模式固定的情况下,具体的执行步骤是固定的,利用数据之间的并行性及可重构阵列,将操作步骤进行划分,也即是将具体的操作步骤分配到不同的配置信息上。采用并行流水操作,一套配置信息通过流水并行尽量完成一个子块内所有数据的一种类型的操作,如6-抽头滤波的一步操作等,这样就可以减少一个子块内的数据进行同一操作而使得配置信息的不断切换,以减少配置信息的切换,另外采用流水操作,也可以提高执行效率。
由于H.264帧间预测是利用已编码视频帧/场和基于块的运动补偿的预测模式。其块尺寸范围很广泛(从16×16到4×4),每个宏块(16×16像素)可以4种方式分割:一个16×16,两个16×8,两个8×16,四个8×8其运动补偿也相应有四种。而8×8模式的每个子宏块还可以四种方式分割:一个8×8,两个4×8或两个8×4及4个4×4。更进一步,每个子块色度都有16种预测模式,亮度有64种预测模式。
在宏块(16x16)的不同位置,子块大小相同,预测模式相同的情况下,其计算操作步骤相同,故不用严格按照块的分割方式从左到右从上到下来进行计算,可采用变换子块的执行次序,使得子块并行,以此来减少配置信息的切换次数,已达到减少配置信息操作时间的目的。
参照图2,示出本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例二,进一步地,在实施例一的基础上还包括以下步骤:
步骤104,判断是否是双向预测,如果是,则进行步骤105,反之,则结束操作;
步骤105,采用第二次预测设定的配置信息重复步骤103得到第二次预测数据;
步骤106,将两次预测得到的数据进行加权求平均,得到最终值。
下面结合具体实例对本发明的在可重构处理器上映射和实现的运动补偿算法的方法进行详细的说明。
参照图3,示出一个单向预测类型的宏块(16x16)的分割方式及预测模式分布图。其中(2,1),(1,1),(0.,2),(0,1)代表不同的色度预测模式,亮度预测模式并未画出,主要原因是色度的64个位置的预测模式,对于与相同块大小操作均相同,只是配置的参数(64组参数)不同。
在算法的软硬件划分时,软件执行方面需要进行的操作是:择参考帧。Block0,block1,block3是8x8模式的子块,其每个子块对应于不同的参考帧或者是同一参考帧不同位置,block2是8x8模式下的4x4子块,每个4x4子块对应于同一参考帧的不同位置,故需要逐个计算。
解码并计算运动向量值,并对向量值进行编码。对预测模式(2,1)的8x8子块进行编码使之成为9;对预测模式(0,1)的8x8子块进行编码使之成为1,以此类推,分别对4个4x4子块对应的预测模式进行编码。(1,1)编码成为5,(2,1)编码成为9,(0,2)编码成为2。
注意:4x4子块,同8x8子块的即使第一步编码结果相同,由于其属于不同的分割模式,使得对应的配置信息组也是不同的,需要在第一步编码完成后,增加分块模式基数(子块8x8基数为0,子块4x4基数为16)。
硬件执行方面需要进行的操作则是由配置信息决定,具体配置信息如下:对应的宏块分割方式以及预测模式,需要对8x8模式子块的(2,1),(1,1)两种预测模式进行配置,对4x4子块的(1,1),(2,1),(0,2)进行相应的配置信息编写。
由于模式较多,此处选择较为复杂的8x8模式子块(2,1)预测模式进行说明,其他的预测模式于此相似。
参照图4,8x8模式子块(2,1)预测模式的亮度划分步骤如下:
经过判断得知,需要先将参考数据进行转置操作,转置完后,将数据暂存。
进行6抽头滤波第一步操作,得到数据组1,中间数据暂存。
对数据组1的数据进行四舍五入操作得到数组2。
经判断,数据组1和数据组2都需要进行转置操作,转置后,得到数据组3和数据组4,将数据组暂存。
对转置后的数据组4进行6抽头滤波的第一步操作,得到的数据组5暂存,并且此处得到的数据不需要转置处理。
进行6抽头滤波的第二步操作,此处将数据组3与数据组5的数据同时进行操作,得到数据组6和数据组7,都是8x8数据组。
经过判断可知此处不需要转置运算,需要进行加权求平均操作。
对得到的两套8x8的数据组6和7进行加权求平均操作得到最终值。
8x8模式子块(2,1)预测模式的色度划分步骤如下:
首先对4x4色度块(对应于8x8亮度块),进行4抽头滤波的第一步操作,并将中间数据暂存。
采用不同的参数,对前一步得到的数据进行加权求平均操作。
对2x2色度块亦采用同样的操作,但因为数据规模较小,可以将两步合并成一步操作,以减少配置信息的套数,及中间数据的传输。
参照图5,然后将PE阵列(16x16)进行划分,分成4个PE8x8。
针对于亮度,由于8x8模式子块其block0与block3预测模式相同,可将其合并,对并且通过嵌入式处理器对配置信息的动态可变部分进行调控。其具体实现分到PE16x16阵列左上角PE8x8。
Block1分到PE16x16阵列右上角PE8x8。
将4x4子块中预测模式相同的两个子块进行合并,具体实现分到PE16x16阵列(左下角PE8x8)
4x4子块的剩余两个子块分配到PE16x16阵列右下角PE8x8。
针对于色度,则按照子块的分割模式,以8x8分割方式为基本单位,分配到对应的4个PE8x8上。
因为此示例是单向预测,所以可以直接跳到结束位置。
以上对本发明所提供的在可重构处理器上映射和实现的运动补偿算法的方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (11)

1.一种在可重构处理上映射和实现的运动补偿算法的方法,其特征在于,包括以下步骤: 
步骤101,算法的软硬件划分,采用嵌入式处理器进行软件执行,PE阵列进行硬件执行;所述软件执行包括:对选择的参考帧进行解码编码计算,根据计算结果控制PE阵列的配置功能; 
所述硬件执行包括:内插像素计算,或者,内插像素计算以及加权平均运算; 
步骤102,根据预测模式及宏块的分割模式对配置信息进行划分并编写; 
步骤103,根据宏块的分割方式对PE阵列进行划分,嵌入式处理器提供相应的配置组序列号,PE阵列进行计算。 
2.如权利要求1所述的方法,其特征在于,所述采用嵌入式处理器进行软件执行包括以下步骤: 
选择参考帧; 
解码并计算运动向量值,并对向量值进行编码; 
控制PE阵列的配置功能。 
3.如权利要求2所述的方法,其特征在于,所述预测模式为单向预测,采用PE阵列进行硬件执行包括以下步骤: 
内插像素计算—以1/4为精度进行亮度的内插操作,以1/8为精度进行色度的内插操作。 
4.如权利要求2所述的方法,其特征在于,所述预测模式为双向预测,采用PE阵列进行硬件执行包括以下步骤: 
内插像素计算—以1/4为精度进行亮度的内插操作,以1/8为精度进行色度的内插操作; 
加权平均运算。 
5.如权利要求1所述的方法,其特征在于,所述根据预测模式及宏块的分割模式对配置信息进行划分并编写包括以下步骤: 
对亮度配置信息的划分,包括以下子步骤: 
C1,根据预测模式判断是否需要进行转置操作,如果需要,则进行步骤C2,反之,则进行步骤C3; 
C2,进行转置操作; 
C3,进行6抽头滤波的第一步操作; 
C4,判断是否需要进行四舍五入操作,如果需要,则进行四舍五入;反之,则进行步骤C5; 
C5,根据预测模式判断,是否需要进行6抽头滤波的第二步操作,如果需要,则进行步骤C6,反之,则返回步骤C2; 
C6,进行6抽头滤波的第二步操作; 
对色度配置信息的划分,包括以下子步骤: 
D1,根据子块的分割方式,对子块所有的数据,进行乘法操作; 
D2,根据子块的分割方式,对D1步骤得到的数据进行加权相加;根据划分的亮度及色度配置信息进行编码。 
6.如权利要求5所述的方法,其特征在于,所述对亮度配置信息的划分在子步骤C6之后,还包括以下子步骤: 
C7,根据预测模式判断是否进行转置操作,若是,则返回步骤C2,反之,则进行步骤C8; 
C8,根据预测模式判断是否进行加权求平均操作,若是,则根据流水操作,并发处理及最大限度减少重复数据传输的要求,进行配置实现。 
7.如权利要求1所述的方法,其特征在于,所述方法还包括: 
步骤104,判断是否是双向预测,如果是,则进行步骤105,反之,则结束操作; 
步骤105,则采用第二次预测设定的配置信息重复步骤103得到第二次预测数据; 
步骤106,将两次预测得到的数据进行加权求平均,得到最终值。 
8.如权利要求5所述的方法,其特征在于,C1步骤中,如果预测模式满足y=0或x=2中其中一个条件,则该预测模式不需要进行转置操作。 
9.如权利要求5所述的方法,其特征在于,C1步骤中需要进行转置操 作的预测模式包括:(2,0)、(1,0)、(3,0)、(1,1)、(1,3)、(3,1)、(3,3)、(2,1)、(2,3)。 
10.如权利要求5所述的方法,其特征在于,C5步骤中,需要进行6抽头滤波的第二步操作的预测模式包括:(0,2)、(0,1)、(0,3)、(2,0)、(1,0)、(3,0)、(1,1)、(1,3)、(3,1)、(3,3)。 
11.如权利要求6所述的方法,其特征在于,C7步骤中需要进行转置操作的预测模式包括:(1,1)、(1,3)、(3,1)、(3,3)、(2,0)、(1,0)、(3,0)、(2,2)、(1,2)、(3,2);C8步骤中需要进行加权平均操作的预测模式包括:(1,1)、(1,3)、(3,1)、(3,3)、(2,1)、(2,3)、(0,1)、(0,3)、(1,0)、(3,0)、(1,2)、(3,2)。 
CN2010105938053A 2010-12-17 2010-12-17 在可重构处理器上映射和实现的运动补偿算法的方法 Active CN102572415B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105938053A CN102572415B (zh) 2010-12-17 2010-12-17 在可重构处理器上映射和实现的运动补偿算法的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105938053A CN102572415B (zh) 2010-12-17 2010-12-17 在可重构处理器上映射和实现的运动补偿算法的方法

Publications (2)

Publication Number Publication Date
CN102572415A CN102572415A (zh) 2012-07-11
CN102572415B true CN102572415B (zh) 2013-12-04

Family

ID=46416730

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105938053A Active CN102572415B (zh) 2010-12-17 2010-12-17 在可重构处理器上映射和实现的运动补偿算法的方法

Country Status (1)

Country Link
CN (1) CN102572415B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984560B (zh) * 2014-05-30 2017-09-19 东南大学 基于大规模粗粒度嵌入式可重构系统及其处理方法
CN109445752B (zh) * 2018-10-10 2019-10-15 西安交通大学 一种并行计算的系统
CN110381321B (zh) * 2019-08-23 2021-08-31 西安邮电大学 一种用于运动补偿的插值计算并行实现方法
CN112286864B (zh) * 2020-12-24 2021-06-04 北京清微智能科技有限公司 加速可重构处理器运行的稀疏化数据处理方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101366283A (zh) * 2006-01-11 2009-02-11 高通股份有限公司 具有精细粒度空间可缩放性的视频编码
CN101677405A (zh) * 2008-09-19 2010-03-24 香港科技大学 针对压缩视频的基于转码的鲁棒性流媒体技术和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9357233B2 (en) * 2008-02-26 2016-05-31 Qualcomm Incorporated Video decoder error handling

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101366283A (zh) * 2006-01-11 2009-02-11 高通股份有限公司 具有精细粒度空间可缩放性的视频编码
CN101677405A (zh) * 2008-09-19 2010-03-24 香港科技大学 针对压缩视频的基于转码的鲁棒性流媒体技术和系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
一种可重构的H_264帧内预测硬件结构;吴斌 等;《微计算机信息》;20091231;第25卷(第1-3期);第286-287、301页 *
于苏东 等.循环在可重构处理器上的软硬件划分技术.《电视技术》.2009,第33卷(第10期),第21-23、40页.
吴斌 等.一种可重构的H_264帧内预测硬件结构.《微计算机信息》.2009,第25卷(第1-3期),第286-287、301页.
循环在可重构处理器上的软硬件划分技术;于苏东 等;《电视技术》;20091231;第33卷(第10期);第21-23、40页 *

Also Published As

Publication number Publication date
CN102572415A (zh) 2012-07-11

Similar Documents

Publication Publication Date Title
CN103004210B (zh) 用于视频编码的低复杂度帧内预测
CN102547289B (zh) 基于gpu并行实现的快速运动估计方法
CN102055981B (zh) 用于视频编码器的去块滤波器及其实现方法
CN101854540B (zh) 用于应用h.264视频编码标准的帧内预测方法及装置
CN102263947A (zh) 图像运动估计的方法及系统
CN102088603B (zh) 用于视频编码器的熵编码器及其实现方法
CN102572415B (zh) 在可重构处理器上映射和实现的运动补偿算法的方法
CN109495743B (zh) 一种基于异构多处理平台的并行化视频编码方法
CN101729893B (zh) 基于软硬件协同处理的mpeg多格式兼容解码方法及其装置
CN102811346B (zh) 编码模式选择方法和系统
CN102043886A (zh) 集成电路下层硬件映射方法、数据控制流时序约束方法及装置
CN103873874A (zh) 一种基于可编程并行处理器的全搜索运动估计方法
CN102572430B (zh) 一种基于可重构技术的h.264去块滤波算法的实现方法
Hameed et al. Understanding sources of ineffciency in general-purpose chips
CN102054108A (zh) 集成电路下层硬件映射方法、时空图压缩方法及装置
CN102238386B (zh) 画面序列编码与重构方法、序列的编码数据流
CN102340668B (zh) 一种基于可重构技术的mpeg2亮度插值的实现方法
CN102148990A (zh) 一种运动矢量预测装置和方法
CN102054107B (zh) 集成电路下层硬件映射方法、时空图生成方法及装置
Rodríguez-Sánchez et al. Reducing complexity in H. 264/AVC motion estimation by using a GPU
Kim et al. MESIP: A configurable and data reusable motion estimation specific instruction-set processor
Rodríguez-Sánchez et al. A fast GPU-based motion estimation algorithm for H. 264/AVC
Doan et al. Multi-asip based parallel and scalable implementation of motion estimation kernel for high definition videos
CN102075762B (zh) 用于视频编码器的帧间预测电路及其实现方法
Dasu et al. Reconfigurable media processing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: WUXI APPLICATION TECHNOLOGY RESEARCH INSTITUTE OF

Free format text: FORMER OWNER: TSINGHUA UNIVERSITY

Effective date: 20141219

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100084 HAIDIAN, BEIJING TO: 214072 WUXI, JIANGSU PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20141219

Address after: 214072, A3 building, No. 777 West Building Road, Binhu District, Jiangsu, Wuxi 4, China

Patentee after: WUXI RESEARCH INSTITUTE OF APPLIED TECHNOLOGIES, TSINGHUA UNIVERSITY

Address before: 100084 Tsinghua Yuan, Beijing, Haidian District

Patentee before: Tsinghua University

ASS Succession or assignment of patent right

Owner name: SHENZHEN PANGO MICROSYSTEMS CO., LTD.

Free format text: FORMER OWNER: WUXI APPLICATION TECHNOLOGY RESEARCH INSTITUTE OF TSINGHUA UNIVERSITY

Effective date: 20150617

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150617

Address after: 518057 Guangdong city of Shenzhen province high tech Industrial Park Road eight South South technology Howare Technology Building 16

Patentee after: SHENZHEN PANGO MICROSYSTEMS CO., LTD.

Address before: 214072, A3 building, No. 777 West Building Road, Binhu District, Jiangsu, Wuxi 4, China

Patentee before: WUXI RESEARCH INSTITUTE OF APPLIED TECHNOLOGIES, TSINGHUA UNIVERSITY

C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: 518057 Guangdong city of Shenzhen province high tech Industrial Park Road eight South South technology Howare Technology Building 16

Patentee after: Shenzhen Pango Microsystems Co., Ltd.

Address before: 518057 Guangdong city of Shenzhen province high tech Industrial Park Road eight South South technology Howare Technology Building 16

Patentee before: SHENZHEN PANGO MICROSYSTEMS CO., LTD.