CN104238994A - 一种提高协处理器运算效率的方法 - Google Patents
一种提高协处理器运算效率的方法 Download PDFInfo
- Publication number
- CN104238994A CN104238994A CN201410440429.2A CN201410440429A CN104238994A CN 104238994 A CN104238994 A CN 104238994A CN 201410440429 A CN201410440429 A CN 201410440429A CN 104238994 A CN104238994 A CN 104238994A
- Authority
- CN
- China
- Prior art keywords
- data
- vector
- computing
- correlation
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Complex Calculations (AREA)
Abstract
本发明公开了一种提高协处理器运算效率的方法。该方法向协处理器中开辟的向量数据存储空间不再是一整块内存,而是由n个N长度的存储块组成的存储块阵列。这样的内存结构可在一个时钟内同时对n个存储块进行读操作,一次读出n个数据。当数据进入协处理器时,协处理器根据存储块阵列的结构,将数据写入存储块阵列中,每当完成一个完整向量数据的接收,则产生一次互相关使能信号,启动数据准备逻辑电路。在上述高效内存结构下,数据准备逻辑电路可以实现一个时钟周期即准备好互相关向量,提供给互相关运算电路,支持该运算电路的流水化计算。这样就可使得协处理器在接收数据、准备数据的同时进行数据的互相关计算。
Description
技术领域
本发明涉及计算机硬件方法设计领域,具体是一种提高协处理器运算效率的方法。
背景技术
在图像处理、模式识别和信息搜索等众多领域,都需要对协处理器中的多个一维向量进行相关匹配运算,以考查向量间的相关性。常用的相关运算有绝对差、均方差和积相关等多种,在实际中会根据具体应用,从精度、效率和通用性三个方面来衡量以选择较优的算法。虽然相关算法有所不同,但归根结底都是两个向量对应点的遍历计算。对于一个有N个n点向量的集合,向量互相关(两两相关)需要进行次运算(运算次数是O(N2)级),同时相关运算本身也较为复杂,所以一维向量互相关是运算密集的算法,运算量较大,在实时性要求严格的领域都需要通过FPGA实现算法协处理器来辅助计算。
对于N个n点一维向量的互相关算法来说,传统按部就班的设计方法和工作流程如下(参见图1):
(1)外部处理单元将N个向量(第一向量、第二向量、……、第N向量,共N×n个点数据)发送给协处理器,协处理器接收到向量数据并保存在预先开辟的一整块足够大的内存空间中;
(2)协处理器完成所有N个向量的数据接收和存储后启动互相关运算流程。互相关运算流程中包括数据准备和互相关运算两个步骤。其中数据准备是将要进行互相关运算的两个向量缓存到运算缓存区A和运算缓存区B;而互相关运算本身则是成熟的硬件电路,实现对运算缓存区A和运算缓存区B中的数据进行相关运算,能够流水化计算;
(3)在数据准备时,协处理中的数据准备逻辑电路首先从内存中读取第一向量缓存到运算缓存区A,再读取第二向量缓存到运算缓存区B,再将运算缓存区A中的第一向量与运算缓存区B中的第二向量进行互相关运算;
(4)协处理器完成步骤(3)的互相关运算后读取第三向量缓存到运算缓存区B,再将运算缓存区A中的第一向量与运算缓存区B中的第三向量进行互相关运算。以此类推,即可完成第一向量与第N向量的互相关运算;
(5)再从内存空间读取第二向量缓存到运算缓存区A,再读取第三向量缓存到运算缓存区B,将运算缓存区A中的第二向量与运算缓存区B中的第三向量进行互相关运算,后续按照(4)中步骤再依次完成第二向量与第四向量、第五向量到第N向量的互相关运算;
(6)按向量顺序重复步骤(5),完成后续所有向量的两两互相关运算。
以上传统设计的不足在于数据接收与运算顺序进行。一方面在完成全部向量数据接收后才启动运算,一定程度上浪费了时间;另一方面,由于每次数据准备工作需要将协处理器内存中数据缓存到缓存区,直接的内存数据读取操作较慢(即读一个向量的n个点数据要n个硬件时钟周期),这就使得协处理器一直处于数据准备→运算→数据准备→运算……的顺序流程中,即无法并行工作,也无法发挥互相关电路的流水计算能力,极大的降低了协处理器的运算效率。
发明内容
针对现有技术的不足,本发明拟解决的技术问题是:设计一种提高协处理器运算效率的方法。该方法向协处理器中开辟的向量数据存储空间不再是一整块内存,而是由n个N长度的存储块组成的存储块阵列。这样的内存结构可在一个时钟内同时对n个存储块进行读操作,一次读出n个数据。当数据进入协处理器时,协处理器根据存储块阵列的结构,将数据写入存储块阵列中,每当完成一个完整向量数据的接收,则产生一次互相关使能信号,启动数据准备逻辑电路。在上述高效内存结构下,数据准备逻辑电路可以实现一个时钟周期即准备好互相关向量,提供给互相关运算电路,支持该运算电路的流水化计算。这样就可使得协处理器在接收数据、准备数据的同时进行数据的互相关计算。
本发明解决所述技术问题的技术解决方案是:设计一种提高协处理器运算效率的方法,所述协处理器包括存储块阵列、存储块阵列电路、数据准备逻辑电路、运算缓存区A、运算缓存区B和互相关运算电路;所述存储块阵列分别与存储块阵列电路和数据准备逻辑电路相连接,所述存储块阵列电路分别与存储块阵列和数据准备逻辑电路相连接,所述数据准备逻辑电路相连接分别与存储块阵列、存储块阵列电路、运算缓存区A、运算缓存区B和互相关运算电路相连接,所述运算缓存区A分别与数据准备逻辑电路和互相关运算电路相连接,所述运算缓存B分别与数据准备逻辑电路和互相关运算电路相连接,所述互相关运算电路分别与数据准备逻辑电路、运算缓存区A和运算缓存区B相连接;其特征在于具体步骤如下:
(1)外部串行数据发送给协处理器,按照如下方式保存到协处理器存储块阵列中:将N个向量存储到协处理器的n个存储块中,每个向量包含n个数据,第一向量中的n个数据(D1、D2、……、Dn)进入后依次保存到第一存储块的第一地址处、第二存储块的第一地址处、……、第n存储块的第一地址处;第二向量中的n个数据进入后依次保存到第一存储块的第二地址处、第二存储块的第二地址处、……、第n存储块的第二地址处;以此类推完成N个向量数据的存储;
(2)在进行步骤(1)的数据存储过程中,当完成第一向量的n个数据存储后没有特殊操作,协处理器继续接收数据;但当第二向量的n个数据都进入协处理器并完成存储时,协处理器存储块阵列电路会产生一个互相关使能信号;后续每当一个向量,即第二向量到第N向量的n个数据都进入协处理器并完成存储时,存储块阵列电路都会产生一个互相关使能信号;
(3)存储块阵列电路发送的互相关使能信号使数据准备逻辑电路启动;数据准备逻辑电路首先从存储块阵列中读取最后进入协处理器并完成存储的第M向量,所述M的取值范围是2≤M≤N,放到运算缓存区A中,再读取第一向量到运算缓存区B,同时向互相关运算电路给出运算使能信号,启动互相关运算电路,计算运算缓存区A和运算缓存区B中两个向量的互相关;
(4)在电路设计时序上紧随步骤(3),数据准备逻辑电路按时钟依次再读取第二向量、第三向量、……、第M-1向量到运算缓存区B,以连续的数据流支持互相关运算电路的计算流水,流水化的计算第M向量与第一向量、第二向量、……、第M-1向量的互相关;
(5)完成步骤(4)中的工作后,数据准备逻辑电路判断是否有新的产生于步骤(2)中的互相关使能信号,如果没有,则挂起数据准备逻辑电路和互相关运算电路,等待新的互相关使能信号;一旦数据准备逻辑电路获取新的互相关使能信号,则按照步骤(3)、步骤(4)完成新进入协处理器的第M+1向量与第一向量、第二向量、……、第M向量的互相关运算;
(6)重复上述步骤直至完成所有N个向量的两两互相关运算,由互相关运算电路将最终的计算结果输出,从而完成提高协处理器运算效率。
与现有技术相比,本发明的有益效果是:
(1)数据存储空间不再是一整块内存,而是由n个N长度的存储块组成的存储块阵列,提高了向量数据的读取效率;
(2)在协处理器接收向量数据的同时对向量开展互相关运算,不用等到所有数据接收完,提高了协处理器的运算效率;
(3)通过设计数据管理维护逻辑,实现了高速的向量数据准备,支持了互相关运算模块的流水化计算要求,进一步提高了协处理器的运算效率和内部性能和内部性能。
附图说明
图1是传统的一维向量互相关电路设计算法工作流程图;
图2是本发明提高协处理器运算效率的方法设计的存储块阵列及向量数据存储方法示意图;
图3是本发明提高协处理器运算效率的方法的方法流程图;
图4是本发明提高协处理器运算效率的方法一种实施例设计的存储块阵列及向量数据存储方法示意图;
图5是本发明提高协处理器运算效率的方法一种实施例的方法流程图;
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明设计的一种提高协处理器运算效率的方法,该方法向协处理器中开辟的向量数据存储空间不再是一整块内存,而是由n个N长度的存储块组成的存储块阵列(参见图2)。这样的内存结构可在一个时钟内同时对n个存储块进行读操作,一次读出n个数据。当数据进入协处理器时,协处理器根据存储块阵列的结构,将数据写入存储块阵列中,每当完成一个完整向量数据的接收,则产生一次互相关使能信号,启动数据准备逻辑电路。在上述高效内存结构下,数据准备逻辑电路可以实现一个时钟周期即准备好互相关向量,提供给互相关运算电路,支持该运算电路的流水化计算。这样就可使得协处理器在接收数据、准备数据的同时进行数据的互相关计算。
本发明设计的一种提高协处理器运算效率的方法,所述协处理器包括数据准备逻辑电路、存储块阵列、存储块阵列电路、运算缓存区A、运算缓存区B和互相关运算电路;所述存储块阵列分别与存储块阵列电路和数据准备逻辑电路相连接,所述存储块阵列电路分别与存储块阵列和数据准备逻辑电路相连接,所述数据准备逻辑电路相连接分别与存储块阵列、存储块阵列电路、运算缓存区A、运算缓存区B和互相关运算电路相连接,所述运算缓存区A分别与数据准备逻辑电路和互相关运算电路相连接,所述运算缓存B分别与数据准备逻辑电路和互相关运算电路相连接,所述互相关运算电路分别与数据准备逻辑电路、运算缓存区A和运算缓存区B相连接;具体步骤如下(参见图3):
(1)外部串行数据发送给协处理器,按照如下方式保存到协处理器存储块阵列中:将N个向量存储到协处理器的n个存储块中,每个向量包含n个数据,第一向量中的n个数据(D1、D2、……、Dn)进入后依次保存到第一存储块的第一地址处、第二存储块的第一地址处、……、第n存储块的第一地址处;第二向量中的n个数据进入后依次保存到第一存储块的第二地址处、第二存储块的第二地址处、……、第n存储块的第二地址处;以此类推完成N个向量数据的存储;
(2)在进行步骤(1)的数据存储过程中,当完成第一向量的n个数据存储后没有特殊操作,协处理器继续接收数据;但当第二向量的n个数据都进入协处理器并完成存储时,协处理器存储块阵列电路会产生一个互相关使能信号;后续每当一个向量,即第二向量到第N向量的n个数据都进入协处理器并完成存储时,存储块阵列电路都会产生一个互相关使能信号;
(3)存储块阵列电路发送的互相关使能信号使数据准备逻辑电路启动;数据准备逻辑电路首先从存储块阵列中读取最后进入协处理器并完成存储的第M向量,所述M的取值范围是2≤M≤N,放到运算缓存区A中,再读取第一向量到运算缓存区B,同时向互相关运算电路给出运算使能信号,启动互相关运算电路,计算运算缓存区A和运算缓存区B中两个向量的互相关;
(4)在电路设计时序上紧随步骤(3),数据准备逻辑电路按时钟依次再读取第二向量、第三向量、……、第M-1向量到运算缓存区B,以连续的数据流支持互相关运算电路的计算流水,流水化的计算第M向量与第一向量、第二向量、……、第M-1向量的互相关;
(5)完成步骤(4)中的工作后,数据准备逻辑电路判断是否有新的产生于步骤(2)中的互相关使能信号,如果没有,则挂起数据准备逻辑电路和互相关运算电路,等待新的互相关使能信号;一旦数据准备逻辑电路获取新的互相关使能信号,则按照步骤(3)、步骤(4)完成新进入协处理器的第M+1向量与第一向量、第二向量、……、第M向量的互相关运算;
(6)重复上述步骤直至完成所有N个向量的两两互相关运算,由互相关运算电路将最终的计算结果输出,从而完成提高协处理器运算效率。
实施例1
本发明设计的一种提高协处理器运算效率的方法,以10个向量,每个向量包括6个数据为例,具体实施方式包括以下步骤(参见图4、图5):
(1)外部串行数据发送给协处理器,按照如下方式保存到协处理器存储块阵列中:将10个向量存储到协处理器的6个存储块中,每个向量包含6个数据,第一向量中的6个数据(D1、D2、D3、D4、D5、D6)进入后依次保存到第一存储块的第一地址处、第二存储块的第一地址处、……、第六存储块的第一地址处;第二向量中的6个数据进入后依次保存到第一存储块的第二地址处、第二存储块的第二地址处、……、第六存储块的第二地址处;以此类推完成十个向量数据的存储;
(2)在进行步骤(1)的数据存储过程中,当完成第一向量的6个数据存储后没有特殊操作,协处理器继续接收数据。但当第二向量的6个数据都进入协处理器并完成存储时,协处理器存储块阵列电路会产生一个互相关使能信号;后续每当一个向量的6个数据都进入协处理器并完成存储时,存储块阵列电路都会产生一个互相关使能信号;
(3)存储块阵列电路发送的互相关使能信号使数据准备逻辑电路启动。数据准备逻辑电路首先从存储块阵列中读取最后进入协处理器并完成存储的第六向量(以第六向量为例),放到运算缓存区A中,再读取第一向量到运算缓存区B,同时向互相关运算电路给出运算使能信号,启动互相关运算电路,计算运算缓存区A和运算缓存区B中两个向量的互相关;
(4)在电路设计时序上紧随步骤(3),数据准备逻辑电路按时钟依次再读取第二向量、第三向量、……、第五向量到运算缓存区B,以连续的数据流支持互相关运算电路的计算流水,流水化的计算第六向量与第一向量、第二向量、……、第五向量的互相关;
(5)完成步骤(4)中的工作后,第七向量按照此方法进入协处理器,产生新的互相关使能信号,数据准备逻辑电路判断有新的产生于步骤(2)中的互相关使能信号,按照步骤(3)、步骤(4)完成新进入协处理器的第七向量与第一向量、第二向量、……、第六向量的互相关运算;
(6)重复上述步骤直至完成所有十个向量的两两互相关运算,由互相关运算电路将最终的计算结果输出,从而完成提高协处理器运算效率。
Claims (1)
1.一种提高协处理器运算效率的方法,所述协处理器包括存储块阵列、存储块阵列电路、数据准备逻辑电路、运算缓存区A、运算缓存区B和互相关运算电路;所述存储块阵列分别与存储块阵列电路和数据准备逻辑电路相连接,所述存储块阵列电路分别与存储块阵列和数据准备逻辑电路相连接,所述数据准备逻辑电路相连接分别与存储块阵列、存储块阵列电路、运算缓存区A、运算缓存区B和互相关运算电路相连接,所述运算缓存区A分别与数据准备逻辑电路和互相关运算电路相连接,所述运算缓存B分别与数据准备逻辑电路和互相关运算电路相连接,所述互相关运算电路分别与数据准备逻辑电路、运算缓存区A和运算缓存区B相连接;其特征在于具体步骤如下:
(1)外部串行数据发送给协处理器,按照如下方式保存到协处理器存储块阵列中:将N个向量存储到协处理器的n个存储块中,每个向量包含n个数据,第一向量中的n个数据(D1、D2、……、Dn)进入后依次保存到第一存储块的第一地址处、第二存储块的第一地址处、……、第n存储块的第一地址处;第二向量中的n个数据进入后依次保存到第一存储块的第二地址处、第二存储块的第二地址处、……、第n存储块的第二地址处;以此类推完成N个向量数据的存储;
(2)在进行步骤(1)的数据存储过程中,当完成第一向量的n个数据存储后没有特殊操作,协处理器继续接收数据;但当第二向量的n个数据都进入协处理器并完成存储时,协处理器存储块阵列电路会产生一个互相关使能信号;后续每当一个向量,即第二向量到第N向量-的n个数据都进入协处理器并完成存储时,存储块阵列电路都会产生一个互相关使能信号;
(3)存储块阵列电路发送的互相关使能信号使数据准备逻辑电路启动;数据准备逻辑电路首先从存储块阵列中读取最后进入协处理器并完成存储的第M向量,所述M的取值范围是2≤M≤N,放到运算缓存区A中,再读取第一向量到运算缓存区B,同时向互相关运算电路给出运算使能信号,启动互相关运算电路,计算运算缓存区A和运算缓存区B中两个向量的互相关;
(4)在电路设计时序上紧随步骤(3),数据准备逻辑电路按时钟依次再读取第二向量、第三向量、……、第M-1向量到运算缓存区B,以连续的数据流支持互相关运算电路的计算流水,流水化的计算第M向量与第一向量、第二向量、……、第M-1向量的互相关;
(5)完成步骤(4)中的工作后,数据准备逻辑电路判断是否有新的产生于步骤(2)中的互相关使能信号,如果没有,则挂起数据准备逻辑电路和互相关运算电路,等待新的互相关使能信号;一旦数据准备逻辑电路获取新的互相关使能信号,则按照步骤(3)、步骤(4)完成新进入协处理器的第M+1向量与第一向量、第二向量、……、第M向量的互相关运算;
(6)重复上述步骤直至完成所有N个向量的两两互相关运算,由互相关运算电路将最终的计算结果输出,从而完成提高协处理器运算效率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410440429.2A CN104238994B (zh) | 2014-09-01 | 2014-09-01 | 一种提高协处理器运算效率的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410440429.2A CN104238994B (zh) | 2014-09-01 | 2014-09-01 | 一种提高协处理器运算效率的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104238994A true CN104238994A (zh) | 2014-12-24 |
CN104238994B CN104238994B (zh) | 2017-07-04 |
Family
ID=52227147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410440429.2A Active CN104238994B (zh) | 2014-09-01 | 2014-09-01 | 一种提高协处理器运算效率的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104238994B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112558921A (zh) * | 2020-12-23 | 2021-03-26 | 广东高云半导体科技股份有限公司 | 一种实现互相关运算的装置及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1912170A1 (fr) * | 2006-10-10 | 2008-04-16 | Criteo | Dispositif informatique de corrélation propagative |
CN102411773A (zh) * | 2011-07-28 | 2012-04-11 | 中国人民解放军国防科学技术大学 | 面向向量处理器的去均值归一化积相关系数的向量化实现方法 |
CN102999476A (zh) * | 2011-09-09 | 2013-03-27 | 中国航天科工集团第三研究院第八三五七研究所 | 一种二维矩阵匹配方法及电路 |
CN103475616A (zh) * | 2013-08-26 | 2013-12-25 | 北京握奇数据系统有限公司 | 一种并行帧同步检测方法及系统 |
CN103839219A (zh) * | 2012-11-26 | 2014-06-04 | 中国航天科工集团第三研究院第八三五七研究所 | 一种应用于8位灰度图像匹配的高性能并行乘加电路 |
CN102655424B (zh) * | 2011-03-04 | 2014-08-13 | 中兴通讯股份有限公司 | 一种多天线均衡系统的矩阵分解方法和装置 |
-
2014
- 2014-09-01 CN CN201410440429.2A patent/CN104238994B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1912170A1 (fr) * | 2006-10-10 | 2008-04-16 | Criteo | Dispositif informatique de corrélation propagative |
CN102655424B (zh) * | 2011-03-04 | 2014-08-13 | 中兴通讯股份有限公司 | 一种多天线均衡系统的矩阵分解方法和装置 |
CN102411773A (zh) * | 2011-07-28 | 2012-04-11 | 中国人民解放军国防科学技术大学 | 面向向量处理器的去均值归一化积相关系数的向量化实现方法 |
CN102999476A (zh) * | 2011-09-09 | 2013-03-27 | 中国航天科工集团第三研究院第八三五七研究所 | 一种二维矩阵匹配方法及电路 |
CN103839219A (zh) * | 2012-11-26 | 2014-06-04 | 中国航天科工集团第三研究院第八三五七研究所 | 一种应用于8位灰度图像匹配的高性能并行乘加电路 |
CN103475616A (zh) * | 2013-08-26 | 2013-12-25 | 北京握奇数据系统有限公司 | 一种并行帧同步检测方法及系统 |
Non-Patent Citations (4)
Title |
---|
PD KRISHNAJITH A,ET AL.,: "Optimizing I-O cost and managing memory for composition vector method based on correlation matrix calculation in bioinformatics", 《CURRENT BIOINFORMATICS》 * |
ULI FECHNER,ET AL,M: "Comparison of correlation vector methods for ligand-based similarity searching", 《JOURNAL OF COMPUTER-AIDED MOLECULAR DESIGN》 * |
YU Z G,ET AL.,: "Research article Whole-proteome phylogeny of large dsDNA viruses and parvoviruses through a composition vector method related to dynamical language model", 《BMC EVOLUTIONARY BIOLOGY》 * |
彭蒸蒸,等: "基于FPGA的信号互相关运算器研究", 《微计算机信息》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112558921A (zh) * | 2020-12-23 | 2021-03-26 | 广东高云半导体科技股份有限公司 | 一种实现互相关运算的装置及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104238994B (zh) | 2017-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8959135B2 (en) | Data structure for tiling and packetizing a sparse matrix | |
TW201802668A (zh) | 可中斷及可重啟矩陣乘法指令、處理器、方法和系統 | |
CN103336758A (zh) | 一种稀疏矩阵的存储方法CSRL及基于该方法的SpMV实现方法 | |
CN106446134B (zh) | 基于谓词规约和代价估算的局部多查询优化方法 | |
CN106055308A (zh) | 用于低能加速器处理器架构的设备 | |
Sano et al. | Scalable streaming-array of simple soft-processors for stencil computations with constant memory-bandwidth | |
CN102736898A (zh) | 一种适用于多核cpu的矢量数据并行绘制方法和装置 | |
CN103984560A (zh) | 基于大规模粗粒度嵌入式可重构系统及其处理方法 | |
CN103970720A (zh) | 基于大规模粗粒度嵌入式可重构系统及其处理方法 | |
CN102279818A (zh) | 支持有限共享的向量数据访存控制方法及向量存储器 | |
CN104391813A (zh) | 一种嵌入式数据安全系统用soc芯片 | |
US20150347654A1 (en) | Extracting system architecture in high level synthesis | |
CN103814372A (zh) | 快速最小值和最大值搜索指令 | |
CN105701294B (zh) | 实现芯片复杂工程修改的方法及系统 | |
CN104266657A (zh) | 基于cpu和mic协同计算的最短路径规划并行化方法 | |
CN106796532A (zh) | 用于电子设备的虚拟传感器中枢 | |
CN106484532B (zh) | 面向sph流体模拟的gpgpu并行计算方法 | |
CN104238994A (zh) | 一种提高协处理器运算效率的方法 | |
CN102739258A (zh) | 一种计算循环冗余校验码的方法及装置 | |
CN101561833B (zh) | 专用指令集处理器的设计方法 | |
CN102855120B (zh) | 超长指令字vliw的处理器和处理方法 | |
CN102386935A (zh) | 维特比译码方法及维特比译码器 | |
CN102375801A (zh) | 一种多核处理器存储系统装置及方法 | |
CN102542525B (zh) | 一种信息处理设备以及信息处理方法 | |
CN103942035B (zh) | 处理指令的方法、编译器及指令处理器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20180404 Address after: 300308 Tianjin District of Dongli City Airport Economic Zone bonded Road No. 357 Patentee after: TIANJIN JINHANG INSTITUTE OF COMPUTING TECHNOLOGY Address before: 300308 Tianjin District of Dongli City Airport Economic Zone bonded Road No. 357 Patentee before: NO.8357 Research Institute of the Third Academy of China Aerospace Science & Industry Corp. |
|
TR01 | Transfer of patent right |