CN101370143B - 图像的运动估计方法及装置 - Google Patents
图像的运动估计方法及装置 Download PDFInfo
- Publication number
- CN101370143B CN101370143B CN 200810211301 CN200810211301A CN101370143B CN 101370143 B CN101370143 B CN 101370143B CN 200810211301 CN200810211301 CN 200810211301 CN 200810211301 A CN200810211301 A CN 200810211301A CN 101370143 B CN101370143 B CN 101370143B
- Authority
- CN
- China
- Prior art keywords
- estimation
- computing unit
- unit array
- data
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明实施例公开了一种图像的运动估计方法及装置,涉及视频图像压缩领域,解决了现有运动估计器无法同时满足执行效率和灵活性的问题。本实施例通过运动估计控制器来执行控制操作,而由运动估计计算单元阵列完成计算操作的操作,这样的分工可以提高计算操作和控制操作的执行效率,并且由于计算操作和控制操作可以通过相应指令实现,并且指令可以通过编程得到,这样就提高了其灵活性,能够适用多种运动估计算法。本实施例主要用于各种运动估计器中。
Description
技术领域
本发明涉及多媒体技术领域,尤其涉及一种图像的运动估计方法及装置。
背景技术
在现有的视频编码方法中,大都采用以宏块为单位的运动估计(MotionEstimation,ME)来实现帧间压缩。ME的主要功能是:对当前帧图像中的一个被编码像素块,在参考帧图像中的一个指定窗口中搜索与之相差最小的像素块,作为最佳匹配。运动估计中要得到两个值:一个是被编码的像素块相对于参考帧中最佳匹配像素块的位置偏移,即运动矢量MV(Motion Vector);另一个是被编码像素块与匹配像素块的残差绝对值之和SAD(Sum of AbsoluteDifference)。运动估计算法作为视频编码的核心算法,其计算量一般占整个编码系统的60%至80%,因此,这部分执行效率直接关系到整个编码芯片的性能。
其中,计算SAD是为了得到SAD最小的最佳匹配点,而MV是在得到最佳匹配点后用来定位最佳匹配点的,这样就可以准确地找到最佳匹配点,以便获取并存储最佳匹配点对应的最佳匹配块的数据。
目前运动估计算法主要包括:早期的三步法、二维对数法、新三步法、四步法、梯度下降法、基于菱形的搜索算法、基于运动场预测的自适应搜索算法(PMVFAST),以及非对称十字型多层次六边形格点搜索算法(UMHexagonS)。
现有技术对于运动估计算法的具体执行包括如下方案:
第一、完全通过ASIC(Application Specific Intergrated Circuits,专用集成电路)执行运动估计算法,基于ASIC实现的运动估计器主要包括:运动估计控制器、PE-Array SAD Tree(SAD树形计算逻辑阵列)、Comparator TreeArray(比较树形阵列)、参考块/当前块寄存器阵列。
上述完全通过ASIC执行运动估计算法由于集成电路的固定,在具体实现运动估计时灵活性较差,而且一般情况下只能支持一种运动估计算法。
第二、通过可编程处理器来实现,典型的可编程处理器有两类:一是通用可编程处理器,如各种工作站和个人电脑的中央处理器;二是专用可编程处理器,如数字信号处理器(DSP)。可编程处理器优势在于执行的指令可通过程序编译生成,使得执行方法灵活,理论上可以支持所有运动估计算法。
由于运动估计的算法运算量巨大,这对可编程处理器的处理性能要求较高,针对目前的可编程处理器而言,采用这种执行方法的运动估计器计算性能有限,在具体运动估计的计算时需要较长的计算周期,无法满足多路SD(Standard Definition,标准清晰度)或者高清编码的需求。
发明内容
本发明的实施例提供一种图像的运动估计方法及装置,能够灵活地执行多种运动估计算法,并且具有较高的执行效率。
一种图像的运动估计方法,包括:
接收运动估计的操作序列,该操作序列包含控制操作和计算操作;
将计算操作按行配置到运动估计计算单元阵列,或按列配置到运动估计计算单元阵列;
通过运动估计控制器执行所述控制操作;
通过运动估计计算单元阵列按照所配置的方式执行所述计算操作,所述运动估计计算单元阵列执行计算操作的操作对象包括当前图像数据和搜索窗数据。
一种图像的运动估计装置,包括:
运动估计控制器,用于接收运动估计的操作序列,执行所述操作序列中的控制操作,并将所述操作序列中的计算操作配置到运动估计计算单元阵列;
配置存储器,用于接收所述计算操作,并将该计算操作按行配置到运动估计计算单元阵列,或按列配置到运动估计计算单元阵列;
运动估计计算单元阵列,用于以需要进行运动估计的图像数据为操作对象按照所配置的方式执行所述计算操作,所述需要进行运动估计的图像数据包括当前图像数据和搜索窗数据。
本发明实施例提供的图像的运动估计方法及装置,在执行运动估计的算法时,由运动估计控制器处理控制操作,由运动估计计算单元处理计算操作,由于运动估计控制器和运动估计计算单元阵列的专有性,所以其执行效率较高,能够发挥运动估计控制器和运动估计计算单元的优势,缩短运动估计的周期。
同时,由于本发明实施例中的操作序列可以通过具体指令来实现,而指令是可以通过编程得到的,这样就使得本实施例具有较高的灵活性,相对于完全通过集成电路来实现运动估计而言,本实施例具有较高的灵活性,能够适用多种运动估计算法。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1中图像的运动估计方法流程图;
图2为本发明实施例1中图像的运动估计装置框图;
图3为本发明实施例2中图像的运动估计方法流程图;
图4为本发明实施例2中图像的运动估计装置框图;
图5为本发明实施例2中运动估计计算单元阵列的框图;
图6为本发明实施例2中计算单元的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
本实施例提供一种图像的运动估计方法,在提高运动估计算法的执行效率的同时,使其能够适应更多的运动估计算法,如图1所示,该估计方法包括:
101、接收运动估计的操作序列,该操作序列包含控制操作和计算操作,一般情况下,所述的操作序列是由编译器编译程序代码得到的操作,在某些情况下也可以是直接输入的操作序列。
102、通过运动估计计算单元阵列执行所述计算操作,所述运动估计计算单元阵列执行计算操作的操作对象为当前图像数据和搜索窗数据,其中的计算操作包括绝对值差操作、累加操作和数据移位操作等等。
通常运动估计算法包括两部分操作,一部分是运算密集型的操作,如求绝对值差、和累加操作、数据移位等等,另一类是控制密集型的操作,如条件跳转、比较操作等等。我们可以将控制密集型的操作由运动估计控制器执行,而将运算密集型的操作由运动估计计算单元阵列执行。
本实施例中通过运动估计控制器执行所述控制操作,这里的控制操作是指控制密集型的操作操作,如循环操作、迭代操作、比较操作等等。即:将控制密集型的操作映射到运动估计控制器,本实施例的运动估计控制器可以选择mini RSIC(小型的精简指令集运算),具备足够的灵活性,足以应付各类控制操作。
对应于上述图像的运动估计方法,本实施例还提供一种图像的运动估计装置,如图2所示,该装置包括:运动估计控制器21和运动估计计算单元阵列22。
其中,运动估计控制器21用于接收运动估计的操作序列,该操作序列是通过编译器编译完成的,或者是直接输入的,然后由该运动估计控制器21执行所述操作序列中的控制操作,并将所述操作序列中的计算操作配置到运动估计计算单元阵列22;所述运动估计计算单元阵列22用于以需要进行运动估计的图像数据为操作对象执行所述计算操作,其中需要进行运动估计的图像数据为需要编码的当前图像数据以及搜索窗数据。
本实施例在执行运动估计的算法时,由运动估计控制器处理控制操作,由运动估计计算单元处理计算操作,由于运动估计控制器和运动估计计算单元阵列的专有性,所以其执行效率要高于软件实现,并且能够发挥运动估计控制器和运动估计计算单元的优势,缩短运动估计的周期。并且,由于本发明实施例中的操作序列具体可以通过指令实现,而指令是可以通过编程得到的,这样就使得本实施例具有较高的灵活性,相对于完全通过集成电路来实现运动估计而言,本实施例具有较高的灵活性,能够适用多种运动估计算法。
实施例2:
本实施例提供一种图像的运动估计方法,由于运动估计主要得到的数据包括:运动矢量MV,被编码像素块与匹配像素块的残差绝对值之和SAD;而运动矢量是在得到最佳匹配点之后,直接计算被编码像素块和最佳匹配点对应的匹配像素块之间的位置之差,而最佳匹配点是通过计算并比较SAD得到的,所以本实施例以计算SAD,并比较SAD以得到最佳匹配点为例,具体说明本实施例中图像的运动估计方法。最佳匹配点是最佳匹配块上的一个像素点,例如最佳匹配块的最左上角的点,以此点为原点,可以确定例如8*8块大小的像素块。
如图3所示,以一次运动估计为例,该估计方法包括如下步骤:
301、接收运动估计的操作序列,该操作序列包含控制操作和计算操作,一般情况下,所述的操作序列是由编译器编译程序代码得到的操作,在某些情况下也可以是直接输入的操作序列。
302、按照阵列形式缓冲当前图像数据和搜索窗数据,其中的当前图像数据就是需要编码的像素块,而搜索窗数据就是匹配像素块。
303、将缓冲后的当前图像数据和搜索窗数据输入到运动估计计算单元阵列,以便运动估计计算单元阵列计算SAD。
上述步骤302将当前图像数据和搜索窗数据按照阵列形式缓冲,所谓阵列形式的缓冲是指允许将多个数据并行地输入到缓存器,而且缓存器也是按照并行输入的顺序缓存上述数据的。主要有如下效果:一、将数据缓冲可以在一段时间内缓冲较多的数据,之后的处理过程中可以不再占用数据总线,使得数据总线能够分时复用,减少了布线开销;二、使得当运动估计时数据载入与运动估计能够并行,避免因数据载入而造成运动估计计算单元阵列的空闲。
304、将所述计算操作按行配置到运动估计计算单元阵列,或者按列配置到运动估计计算单元阵列。在某些情况下,可以将多个计算操作分别按行或者按列配置到运动估计计算单元阵列,以便运动估计计算单元阵列执行该计算操作,例如:求绝对值差操作、累加操作和数据移位操作。
运动估计计算单元阵列通过计算当前图像数据和搜索窗数据的SAD,并将该SAD通过移位送到运动估计控制器。对于一个给定的运动估计算法,先将其中的SAD计算、移位操作提取出来,写在一个配置程序中(每个独立的计算操作叫做配置字),并保存在片上的配置存储器上。算法执行时,需要将配置存储器中的配置字配置给运动估计计算单元阵列,配置字被译码后,运动估计计算阵列即完成对应操作。
305、通过运动估计控制器执行所述控制操作,这里的控制操作是指控制密集型的的操作操作,如循环操作、迭代操作、比较操作等等,即:将控制密集型的操作映射到运动估计控制器。
因为运动估计过程会搜索很多个点,每个点都会有一个对应的SAD值,本实施例中运动估计控制器通过执行比较操作比较所有的SAD,保存其中SAD值最小的像素块的运动矢量。
由于需要处理的图像数据较多,需要不断地按照阵列形式缓冲当前图像数据和搜索窗数据,同时,运动估计控制器和运动估计计算单元同时执行相应操作,如果运动估计控制器再次收到运动估计计算单元阵列的SAD值,则再次通过比较操作得出其中SAD值最小的像素块的运动矢量;并在后得到的像素块的SAD值小于之前保存的像素块的SAD值时,利用本次SAD值最小的像素块的运动矢量覆盖掉之前保存的像素块的运动矢量;否则放弃本次得到的像素块的运动矢量。
306、当一个宏块的运动估计计算完毕后,需要保存最佳匹配点对应的像素块,一般称该像素块为匹配像素块,而通过上述步骤得到的像素块既为匹配像素块,所以,本实施例中需要在运动估计控制器中保存运动矢量对应的像素块。
在具体实施时,可以先将该像素块的数据按照阵列缓冲,并将缓冲后的数据通过运动估计计算单元阵列的移位操作保存到数据存储器。
对应于上述实施例,本实施例提供一种图像的运动估计装置,如图4所示,该图像的运动估计装置包括:运动估计控制器41、运动估计计算单元阵列42、配置存储器43、阵列缓冲器44和数据存储器45。
运动估计控制器41用于接收运动估计的操作序列,执行所述操作序列中的控制操作,并将所述操作序列中的计算操作配置到运动估计计算单元阵列;
本实施例中运动估计控制器41通过将配置字从配置存储器传送给运动估计计算单元阵列42完成一次配置;并通过比较运动估计计算单元阵列42计算出的SAD值得到最佳匹配点;然后通过执行其中控制数据传输的控制操作,存储最佳匹配点的数据。
运动估计计算单元阵列42用于以需要进行运动估计的图像数据为操作对象执行所述计算操作。在本实施例中,运动估计计算单元阵列42主要完成SAD值的计算,如图5所示,该计算单元阵列由N x N个计算单元421、累加器422以及译码器423组成。
计算单元之间采用二维网格互连,如图6所示,每个计算单元包括:第一寄存器61、第二寄存器62、输入选择器63和计算模块64。
其中,第一寄存器61用于存储当前图像数据,该第一寄存器只存储一个像素的数据;第二寄存器62用于存储参考图像数据,该第二寄存器62也只存储一个像素的数据;计算模块64用于从第一寄存器获取当前图像数据,从第二寄存器获取参考图像数据,并计算所述当前图像数据和参考图像数据的绝对值差。其中参考图像数据可以通过输入选择器63输入,该输入选择器63用于选择相邻计算单元输出的参考图像数据输入到第二寄存器62,为了该输入选择器63能够选择相邻计算单元输出的参考图像数据,本实施例中的第二寄存器62还用于向相邻计算单元输出其存储的参考图像数据;输入选择器63还可以选择搜索窗数据输入到第二寄存器62。
由于输入选择器能够选择相邻计算单元输出的参考图像数据,所以,该运动估计计算单元这列支持如下操作:lshft(左移操作)、rshft(右移操作)、ushft(上移操作)、dshft(下移操作),邻近通信指绝对值差计算单元支持上下左右通信,主要是为了实现预测块数据的快速移位。输入选择器63还可以选择搜索窗数据输入到第二寄存器62,本实施例还需要支持load操作(从数据缓冲器载入数据到运动估计计算单元),将数据输入到所有绝对值差计算单元中的第二寄存器62,其目的是将当前图像和搜索窗数据载入到绝对值差计算单元。
在计算模块64计算出绝对值差后,将绝对值差送入累加器422,通过累加器422累加所述的绝对值差得到最终的SAD值。
在上述运动估计计算单元阵列的计算中,需要用到当前图像数据和搜索窗数据,在具体实施时,本实施例还可以包括当前图像数据存储器46用于存储当前图像数据,以及搜索窗数据存储器47用于存储搜索窗数据。通过阵列缓冲器44缓冲所述当前图像数据和搜索窗数据,并在运动估计控制的控制下将缓冲的当前图像数据和搜索窗数据传输到运动估计计算单元阵列,其中当前图像数据是传输到第一寄存器61,搜索窗数据是通过运动估计计算单元阵列输入选择器63传输到第二寄存器62。
在本实施例中,计算操作是从运动估计控制器41配置到运动估计计算单元阵列42的。在实际运用时,可以通过配置存储器43完成上述操作,配置存储器43是存放配置程序(配置字的集合,一个配置字对应一次配置操作)的地方,该配置存储器43包括行配置存储器431和列配置存储器432,在配置字的每个执行周期,配置存储器将相应的配置按列或按行配置到运动估计计算单元阵列,然后运动估计计算单元阵列执行相应的操作。具体操作为:该配置存储器43从运动估计控制器41中接收需要配置的计算操作,然后将计算操作按行配置到运动估计计算单元阵列42,或按列配置到运动估计计算单元阵列42。配置存储器43接收到的配置程序是一个配置字的集合,而该配置存储器的每一行和每一列都可以完成配置字的配置,在每个执行周期,配置存储器43将相应的配置字按列或按行传送到运动估计计算单元阵列42。本实施例中,运动估计计算单元阵列通过译码器423将所述计算操作的配置字译码成其本身可执行的操作,对应于配置存储器,该译码器423也包括行译码器和列译码器。
因为运动估计过程会搜索很多个点,每个点都会有一个对应的SAD值,运动估计计算单元阵列42将计算所得的SAD值移送给运动估计控制器41,由运动估计控制器41对所有SAD值进行比较,最佳匹配点对应的像素块就是SAD值最小的像素块,并由运动估计控制器41控制将最佳匹配点对应像素块的图像数据存储到数据存储器45。由于最佳匹配点对应像素块中包括的多个像素,而这些像素在搜索窗存储器的存储顺序可能与数据存储器45的可用存储空间相错位,即:最佳匹配点对应像素块的图像数据在搜索窗存储器中不是按照字节对齐的,所以,本实施需要先从该数据载入数据到阵列缓冲器44上,然后通过运动估计计算阵列执行移位操作,使得最佳匹配点最左上点按照字节对齐,最后将移位后的数据按行写入数据存储器45,将字节对齐后再存储不会出现数据存储器45的存储的两段数据之间出现没有利用的存储空间,能够节约存储空间,。
上述方法中运动估计器的工作过程为:运动估计控制器载入配置程序到配置存储器,然后将当前图像和待搜的搜索窗数据分别载入到运动估计计算单元阵列的阵列缓冲器上,接着运动估计控制器控制配置存储器将配置字配置给运动估计计算阵列,运动估计计算阵列收到配置字并对配置字译码后,即开始计算,完成一次操作。如果执行的是SAD计算操作,则将计算所得的SAD值移出交给运动估计控制器,因为运动估计过程会搜索很多个点,每个点都会有一个对应的SAD值,本实施例中运动估计控制器通过执行比较操作比较所有的SAD,保存其中SAD值最小的像素块的运动矢量。
以上描述的实施例中,由于运动估计计算单元阵列按照配置存储器中的配置字进行操作,这样可以通过改变其中的配置字提高该图像的运动估计装置的灵活性,使其适用更多的运动估计算法。
上述的运动估计计算单元阵列支持类MIMD(多指令多数据流,MultipleInstruction Multiple Data)计算模型。因为单纯的SIMD(单指令多数据流,Single Instruction Multiple Data)由一个控制部件为所有的计算单元提供程序,所有计算单元执行同样的指令,但当程序只需一部分计算单元操作时,系统的利用率就降低了。而在本实施例的运动估计器中,运动估计计算单元阵列受配置存储器控制,这样可以采取积极的措施提高整个系统的灵活性。
关于提高系统灵活性的具体说明如下:由于运动估计计算单元阵列分为独立的N行N列,同行或者同列中所有的计算单元共享一样的配置数据,完成相同的操作,但每个计算单元操作的数据是不同的,提高了计算的效率,有利于多个同样的计算操作并行执行。不同行或不同列的配置是相互独立的,这样整个计算阵列有更好的灵活性。如果需要完成的计算量较小,可以控制一部分计算单元工作,另一部分计算单元不工作,用于控制执行计算操作时的功耗。
本发明实施例主要用在各种运动估计器中,执行相应的运动估计算法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (8)
1.一种图像的运动估计方法,其特征在于,包括:
接收运动估计的操作序列,该操作序列包含控制操作和计算操作;
将计算操作按行配置到运动估计计算单元阵列,或按列配置到运动估计计算单元阵列;
通过运动估计控制器执行所述控制操作;
通过运动估计计算单元阵列按照所配置的方式执行所述计算操作,所述运动估计计算单元阵列执行计算操作的操作对象包括当前图像数据和搜索窗数据。
2.根据权利要求1所述的图像的运动估计方法,其特征在于,该方法还包括:存储执行所述计算操作得出的数据。
3.根据权利要求1所述的图像的运动估计方法,其特征在于,所述当前图像数据和搜索窗数据按照阵列形式缓冲后输入到运动估计计算单元阵列。
4.一种图像的运动估计装置,其特征在于,包括:
运动估计控制器,用于接收运动估计的操作序列,执行所述操作序列中的控制操作,并将所述操作序列中的计算操作配置到运动估计计算单元阵列;
配置存储器,用于接收所述计算操作,并将该计算操作按行配置到运动估计计算单元阵列,或按列配置到运动估计计算单元阵列;
运动估计计算单元阵列,用于以需要进行运动估计的图像数据为操作对象按照所配置的方式执行所述计算操作,所述需要进行运动估计的图像数据包括当前图像数据和搜索窗数据。
5.根据权利要求4所述的图像的运动估计装置,其特征在于,还包括:
阵列缓冲器,用于缓冲所述当前图像数据和搜索窗数据,并在运动估计控制器的控制下将缓冲的当前图像数据和搜索窗数据传输到运动估计计算单元阵列。
6.根据权利要求4所述的图像的运动估计装置,其特征在于,所述运动估计计算单元阵列将计算结果发送到运动估计控制器,所述运动估计控制器根据所述计算结果得出当前图像的最佳匹配点,并控制运动估计计算单元阵列接收所述最佳匹配点的数据;
所述图像的运动估计装置还包括:
数据存储器,用于存储运动估计计算单元阵列接收到的最佳匹配点的数据。
7.根据权利要求4至6中任意一项所述的图像的运动估计装置,其特征在于,所述运动估计计算单元阵列中的每个计算单元包括:
第一寄存器,用于存储当前图像数据;
第二寄存器,用于存储参考图像数据,并向相邻计算单元输出该参考图像数据;
输入选择器,用于选择相邻计算单元输出的参考图像数据输入到第二寄存器,或者选择搜索窗数据输入到第二寄存器;
计算模块,用于计算所述当前图像数据和参考图像数据的绝对值差;
所述运动估计计算单元阵列还包括:
累加器,用于累加所述绝对值差。
8.根据权利要求7所述的图像的运动估计装置,其特征在于,所述运动估计计算单元阵列还包括:译码器,用于将所述计算操作译码成该运动估计计算单元阵列可执行的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810211301 CN101370143B (zh) | 2008-09-17 | 2008-09-17 | 图像的运动估计方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810211301 CN101370143B (zh) | 2008-09-17 | 2008-09-17 | 图像的运动估计方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101370143A CN101370143A (zh) | 2009-02-18 |
CN101370143B true CN101370143B (zh) | 2011-07-20 |
Family
ID=40413727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200810211301 Active CN101370143B (zh) | 2008-09-17 | 2008-09-17 | 图像的运动估计方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101370143B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102340617B (zh) * | 2010-07-14 | 2014-06-11 | 奇景光电股份有限公司 | 运动估算及运动补偿电路 |
CN103873874B (zh) * | 2014-02-19 | 2017-06-06 | 同观科技(深圳)有限公司 | 一种基于可编程并行处理器的全搜索运动估计方法 |
-
2008
- 2008-09-17 CN CN 200810211301 patent/CN101370143B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN101370143A (zh) | 2009-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1157956C (zh) | 运动估计器 | |
US6868123B2 (en) | Programmable motion estimation module with vector array unit | |
CN109684267B (zh) | Slam运算装置和方法 | |
CN113220630B (zh) | 一种硬件加速器的可重构阵列优化方法及自动调优方法 | |
US12106098B2 (en) | Semiconductor device | |
WO2022046051A1 (en) | Deep neural networks compiler for a trace-based accelerator | |
WO2008007038A1 (en) | Data dependency scoreboarding | |
TW201901483A (zh) | 執行雙輸入值絕對值及加總運算的電路 | |
CN101438598B (zh) | 用于产生两个独立绝对差和的指令 | |
CN102340668B (zh) | 一种基于可重构技术的mpeg2亮度插值的实现方法 | |
CN101370143B (zh) | 图像的运动估计方法及装置 | |
CN1112654C (zh) | 图像处理装置 | |
JP3676237B2 (ja) | データ処理装置及び演算器 | |
CN102054107B (zh) | 集成电路下层硬件映射方法、时空图生成方法及装置 | |
Hinrichs et al. | A 1.3-GOPS parallel DSP for high-performance image-processing applications | |
Kim et al. | MESIP: A configurable and data reusable motion estimation specific instruction-set processor | |
CN100469146C (zh) | 视频图像运动补偿装置 | |
CN115482456A (zh) | 一种yolo算法的高能效fpga加速架构 | |
US20120027262A1 (en) | Block Matching In Motion Estimation | |
CN110555520A (zh) | 执行卷积操作的方法、相应的处理装置及电子设备 | |
CN113630601B (zh) | 一种仿射运动估计方法、装置、设备及存储介质 | |
CN111915014B (zh) | 人工智能指令的处理方法及装置、板卡、主板和电子设备 | |
CN111832713B (zh) | 一种基于行缓冲Linebuffer的并行计算方法及计算设备 | |
US20130315314A1 (en) | Block matching in motion estimation | |
CN101166272B (zh) | 补差点数据储存方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |