CN105426161A - 一种power指令集向量协处理器的译码电路 - Google Patents
一种power指令集向量协处理器的译码电路 Download PDFInfo
- Publication number
- CN105426161A CN105426161A CN201510777046.9A CN201510777046A CN105426161A CN 105426161 A CN105426161 A CN 105426161A CN 201510777046 A CN201510777046 A CN 201510777046A CN 105426161 A CN105426161 A CN 105426161A
- Authority
- CN
- China
- Prior art keywords
- instruction
- class
- coprocessor
- fixed point
- effective
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006073 displacement reaction Methods 0.000 claims description 24
- 239000003550 marker Substances 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 7
- 238000000151 deposition Methods 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000000034 method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 229910052754 neon Inorganic materials 0.000 description 1
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30036—Instructions to perform operations on packed data, e.g. vector, tile or matrix operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline, look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline, look ahead using a plurality of independent parallel functional units
- G06F9/3887—Concurrent instruction execution, e.g. pipeline, look ahead using a plurality of independent parallel functional units controlled by a single instruction for multiple data lanes [SIMD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8007—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
Abstract
一种POWER指令集向量协处理器的译码电路,第一判断器的输入端连接主处理器的输出端接收指令,判断指令是否为有效指令;第一设置器的输出连接主处理器的输入端,向主处理器反馈指令是有效还是无效,并在收到第一判断器的有效指令信息时,将向量协处理器指令有效标志位置为高,否则为低,发给第二判断器;第二判断器的输入端连接主处理器的输出端,当接收第一设置器的有效信息后判断指令所属的功能执行单元及功能单元所需操作数的数据来源,并送入第二设置器;第二设置器根据第二判断器的判断结果将相应的控制信号及指令所要读取的操作数交给不同的功能执行单元。本发明使功能单元在识别所接收指令的具体指令类型时所需的判断逻辑更为简单。
Description
技术领域
本发明涉及一种译码电路。特别是涉及一种POWER指令集向量协处理器的译码电路。
背景技术
SIMD(SingleInstructionMultipleData)是一种实现数据级并行的技术,对多个数据执行相同的操作。SIMD技术的关键是在一条单独的指令中同时执行多个运算操作,以增加处理器的吞吐量,这一特点使得SIMD技术特别适合于多媒体应用等数据密集型运算。现在主流的处理器都有其SIMD指令子集,如X86的MMX或SSE,ARM的NEON指令子集,PowerPC的Altivec指令子集等。在现代的多核处理器中,处理器上的每个核通常都会配有一个专属的SIMD协处理器,也称为VectorCoprocessor(VP)。作为协处理器整体性能的关键部分,传统协处理器的一级译码电路对每条指令的全部指令位进行校验后产生该指令所对应功能单元的使能信号和指令类型信号,相应的功能单元二级译码电路在经由一级译码电路产生的使能信号为高时对指令类型信号进行译码,产生相应的控制信号。整个译码过程相当于一个先编码、再译码的过程,从而造成资源的浪费以及功耗的增加。
发明内容
本发明所要解决的技术问题是,提供一种能够在使用组合逻辑来识别指令时,所需要的组合逻辑的数量达到最小,从而降低系统功耗的POWER指令集向量协处理器的译码电路。
本发明所采用的技术方案是:一种POWER指令集向量协处理器的译码电路,包括有依次连接的第一判断器、第一设置器、第二判断器和第二设置器,其中,
所述第一判断器的输入端连接主处理器的输出端,用于接收来自主处理器的指令,并且判断所述指令是否为有效的向量协处理器指令,并将判断结果发送给第一设置器;
所述第一设置器的输出还连接主处理器的输入端,用于向主处理器反馈主处理器所发的指令是一条有效的向量协处理器指令,还是一条无效的向量协处理器指令的信息;当第一设置器得到第一判断器的判断结果为当前指令是一条有效的向量协处理器指令时,将向量协处理器指令有效标志位置为高,否则将向量协处理器指令有效标志位置为低,并将协处理器指令有效标志位置为高和为低的信息发送给第二判断器;
所述第二判断器的输入端还连接主处理器的输出端接收主处理器的指令,当第二判断器收到第一设置器发过来的协处理器指令有效标志位置为高的信息时,判断主处理器的指令所属的功能执行单元及功能单元所需操作数的数据来源,并将判断结果送入第二设置器;
所述第二设置器根据第二判断器的判断结果将相应的控制信号及指令所要读取的操作数交给不同的功能执行单元。
当所述第一设置器将协处理器指令有效标志位不为高,则表示当前译码指令是一条非向量协处理器有效指令,该指令无法由向量协处理器执行。
当主处理器的指令是一条无效的向量协处理器指令,则向量协处理器流水线停滞,等待主处理器发送一条新的向量协处理器有效指令,直到第一判断器判断接收到主处理器发送的向量协处理器指令为有效的向量协处理器指令后,将向量协处理器指令有效标志位置为高。
所述第二设置器为了使在使用组合逻辑来识别指令时,所需要的组合逻辑的数量能达到最小,只将必要的指令位发送给功能单元,而无需发送冗余的指令位。
所述第二判断器所判断的全部向量协处理器指令包括:仿存类指令、置换类指令、简单定点类指令、复杂定点类指令和浮点类指令,其中仿存类指令指读写内存和特殊寄存器类指令;置换类指令指完成置换操作的单周期定点类指令;简单定点类指令指单周期完成的算术定点类指令;复杂定点类指令指多周期完成的算术定点类指令;浮点类指令指多周期完成的算术浮点类指令。
第二设置器将仿存类指令送入功能单元中用于执行仿存类指令的仿存单元,将置换类指令送入功能单元中用于执行置换类指令的置换单元,将简单定点类指令送入功能单元中用于执行简单定点类指令的简单定点单元,将复杂定点类指令送入功能单元中用于执行复杂定点类指令的复杂定点单元,将浮点类指令送入功能单元中用于执行浮点类指令的浮点单元。
所述第二判断器接收主处理器的一条指令是32位向量协处理器有效指令的第26位为1,则所述的指令为一条VA格式指令,对于VA格式指令,根据指令的第28-30位判断所述指令类型,当所述指令的第28-30位为111时,所述指令为浮点类指令;当所述指令的第28-30位为101或110时,所述指令为置换类指令;否则,所述指令为复杂定点类指令。
所述第二判断器接收主处理器的一条指令是32位向量协处理器有效指令的第26位为0,则所述指令为一条VC格式指令、或VX格式指令,或X格式指令,则根据所述指令的第21、24、25、28-30位共同判断所述指令的指令类型,当所述指令的第28-30位为000、001或011时,所述指令为简单定点类指令;当所述指令的第28-30位为100时,所述指令为复杂定点类指令;当所述指令的第28-30位为110或111时,所述指令为置换类指令;当所述指令的第28-30位为101时,根据所述指令的第21位判断指令类型,若第21位为1,则所述指令为简单定点类指令,若第21位为0,则所述指令为浮点类指令;当所述指令的第28-30位为010时,根据所述指令的21、24、25位判断指令类型,若第21、24、25位为011,则所述指令为置换类指令,否则,所述指令为简单定点类指令。
当经由第二判断器判断所接收的一条指令为简单定点功能单元指令时,第二设置器将指令的第21-25,28-30位共8位送往简单定点功能单元;当经由第二判断器判断所接收的一条指令为复杂定点功能单元指令时,第二设置器将指令的第21-26,28-31位共10位送往复杂定点功能单元;当经由第二判断器判断所接收的一条指令为浮点类指令时,第二设置器将指令的第22-25,26,31位共6位或指令的第22-25,29,31位共6位送往浮点功能单元;当经由第二判断器判断所接收的一条指令为置换类指令时,第二设置器将指令的第21-26,29,30位共8位或指令的第21-26,30,31位共8位送往置换单元;当经由第二判断器判断所接收的一条指令为仿存类指令时,第二设置器将指令的第22-25,30位共5位送往仿存单元。
本发明的一种POWER指令集向量协处理器的译码电路,使在使用组合逻辑来识别一条指令所属的功能单元和操作数的数据来源时,所需要的组合逻辑的数量能达到最小,不仅降低了译码电路的硬件开销,提高了译码电路和功能单元间信号传输的稳定性,也使功能单元在识别所接收指令的具体指令类型时所需的判断逻辑更为简单。
附图说明
图1是本发明的整体构成框图。
图中
100:向量协处理器译码电路110:第一判断器
120:第一设置器130:第二判断器
140:第二设置器150:仿存单元
160:置换单元170:简单定点单元
180:复杂定点单元190:浮点单元
具体实施方式
下面结合实施例和附图对本发明的一种POWER指令集向量协处理器的译码电路做出详细说明。
如图1所示,本发明的一种POWER指令集向量协处理器的译码电路,包括有依次连接的第一判断器110、第一设置器120、第二判断器130和第二设置器140,其中,
所述第一判断器110的输入端连接主处理器200的输出端,用于接收来自主处理器200的指令,并且判断所述指令是否为有效的向量协处理器指令,并将判断结果发送给第一设置器120;
所述第一设置器120的输出还连接主处理器200的输入端,用于向主处理器200反馈主处理器200所发的指令是一条有效的向量协处理器指令,还是一条无效的向量协处理器指令的信息;当第一设置器120得到第一判断器110的判断结果为当前指令是一条有效的向量协处理器指令时,将向量协处理器指令有效标志位置为高,否则将向量协处理器指令有效标志位置为低,并将协处理器指令有效标志位置为高和为低的信息发送给第二判断器(130);
所述第二判断器130的输入端还连接主处理器200的输出端接收主处理器200的指令,当第二判断器130收到第一设置器120发过来的协处理器指令有效标志位置为高的信息时,判断主处理器200的指令所属的功能执行单元及功能单元所需操作数的数据来源,并将判断结果送入第二设置器140;
所述第二设置器140根据第二判断器130的判断结果将相应的控制信号及指令所要读取的操作数交给不同的功能执行单元。所述第二设置器140为了使在使用组合逻辑来识别指令时,所需要的组合逻辑的数量能达到最小,降低系统功耗,只将必要的指令位发送给功能单元,而无需发送冗余的指令位。所述必要的指令位,是指一条指令中用于识别一条指令所属功能单元所必须的位。
当所述第一设置器120将协处理器指令有效标志位不为高,则表示当前译码指令是一条非向量协处理器有效指令(包括POWER指令集之外的指令和非向量协处理器专属指令),该指令无法由向量协处理器执行。
当主处理器200的指令是一条无效的向量协处理器指令,则向量协处理器流水线停滞,等待主处理器200发送一条新的向量协处理器有效指令,直到第一判断器110判断接收到主处理器发送的向量协处理器指令为有效的向量协处理器指令后,将向量协处理器指令有效标志位置为高。
所述第二判断器130所判断的全部向量协处理器指令包括:仿存类指令、置换类指令、简单定点类指令、复杂定点类指令和浮点类指令,其中仿存类指令指读写内存和特殊寄存器类指令;置换类指令指完成置换操作的单周期定点类指令;简单定点类指令指单周期完成的算术定点类指令如定点加减法指令及浮点比大小、浮点求最值指令;复杂定点类指令指多周期完成的算术定点类指令如定点乘法指令;浮点类指令指多周期完成的算术浮点类指令如浮点加减法。
第二设置器140将仿存类指令送入功能单元中用于执行仿存类指令的仿存单元150,将置换类指令送入功能单元中用于执行置换类指令的置换单元160,将简单定点类指令送入功能单元中用于执行简单定点类指令的简单定点单元170,将复杂定点类指令送入功能单元中用于执行复杂定点类指令的复杂定点单元180,将浮点类指令送入功能单元中用于执行浮点类指令的浮点单元190。
所述第二判断器130接收主处理器200的一条指令是32位向量协处理器有效指令的第26位(最高位为第0位,最低位为第31位,共32位)为1,则所述的指令为一条VA格式指令,对于VA格式指令,根据指令的第28-30位判断所述指令类型,当所述指令的第28-30位为111时,所述指令为浮点类指令;当所述指令的第28-30位为101或110时,所述指令为置换类指令;否则,所述指令为复杂定点类指令。
所述第二判断器130接收主处理器200的一条指令是32位向量协处理器有效指令的第26位为0,则所述指令为一条VC格式指令、或VX格式指令,或X格式指令,则根据所述指令的第21、24、25、28-30位共同判断所述指令的指令类型,当所述指令的第28-30位为000、001或011时,所述指令为简单定点类指令;当所述指令的第28-30位为100时,所述指令为复杂定点类指令;当所述指令的第28-30位为110或111时,所述指令为置换类指令;当所述指令的第28-30位为101时,根据所述指令的第21位判断指令类型,若第21位为1,则所述指令为简单定点类指令,若第21位为0,则所述指令为浮点类指令;当所述指令的第28-30位为010时,根据所述指令的21、24、25位判断指令类型,若第21、24、25位为011,则所述指令为置换类指令,否则,所述指令为简单定点类指令。
当经由第二判断器130判断所接收的一条指令为简单定点功能单元指令时,第二设置器140将指令的第21-25,28-30位共8位送往简单定点功能单元170;当经由第二判断器130判断所接收的一条指令为复杂定点功能单元指令时,第二设置器140将指令的第21-26,28-31位共10位送往复杂定点功能单元180;当经由第二判断器130判断所接收的一条指令为浮点类指令时,第二设置器140将指令的第22-25,26,31位共6位或指令的第22-25,29,31位共6位送往浮点功能单元190;当经由第二判断器130判断所接收的一条指令为置换类指令时,第二设置器140将指令的第21-26,29,30位共8位或指令的第21-26,30,31位共8位送往置换单元160;当经由第二判断器130判断所接收的一条指令为仿存类指令时,第二设置器140将指令的第22-25,30位共5位送往仿存单元150。
在经由第二设置器140发送相应指令位后,在功能执行单元的仿存单元150、置换单元160、简单定点功能单元170、复杂定点功能单元180、浮点功能单元190中会判断一条指令的具体指令类型,并产生相应的控制信号。
本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种POWER指令集向量协处理器的译码电路,其特征在于,包括有依次连接的第一判断器(110)、第一设置器(120)、第二判断器(130)和第二设置器(140),其中,
所述第一判断器(110)的输入端连接主处理器(200)的输出端,用于接收来自主处理器(200)的指令,并且判断所述指令是否为有效的向量协处理器指令,并将判断结果发送给第一设置器(120);
所述第一设置器(120)的输出还连接主处理器(200)的输入端,用于向主处理器(200)反馈主处理器(200)所发的指令是一条有效的向量协处理器指令,还是一条无效的向量协处理器指令的信息;当第一设置器(120)得到第一判断器(110)的判断结果为当前指令是一条有效的向量协处理器指令时,将向量协处理器指令有效标志位置为高,否则将向量协处理器指令有效标志位置为低,并将协处理器指令有效标志位置为高和为低的信息发送给第二判断器(130);
所述第二判断器(130)的输入端还连接主处理器(200)的输出端接收主处理器(200)的指令,当第二判断器(130)收到第一设置器(120)发过来的协处理器指令有效标志位置为高的信息时,判断主处理器(200)的指令所属的功能执行单元及功能单元所需操作数的数据来源,并将判断结果送入第二设置器(140);
所述第二设置器(140)根据第二判断器(130)的判断结果将相应的控制信号及指令所要读取的操作数交给不同的功能执行单元。
2.根据权利要求1所述的一种POWER指令集向量协处理器的译码电路,其特征在于,当所述第一设置器(120)将协处理器指令有效标志位不为高,则表示当前译码指令是一条非向量协处理器有效指令,该指令无法由向量协处理器执行。
3.根据权利要求1所述的一种POWER指令集向量协处理器的译码电路,其特征在于,当主处理器(200)的指令是一条无效的向量协处理器指令,则向量协处理器流水线停滞,等待主处理器(200)发送一条新的向量协处理器有效指令,直到第一判断器(110)判断接收到主处理器发送的向量协处理器指令为有效的向量协处理器指令后,将向量协处理器指令有效标志位置为高。
4.根据权利要求1所述的一种POWER指令集向量协处理器的译码电路,其特征在于,所述第二设置器(140)为了使在使用组合逻辑来识别指令时,所需要的组合逻辑的数量能达到最小,只将必要的指令位发送给功能单元,而无需发送冗余的指令位。
5.根据权利要求1所述的一种POWER指令集向量协处理器的译码电路,其特征在于,所述第二判断器(130)所判断的全部向量协处理器指令包括:仿存类指令、置换类指令、简单定点类指令、复杂定点类指令和浮点类指令,其中仿存类指令指读写内存和特殊寄存器类指令;置换类指令指完成置换操作的单周期定点类指令;简单定点类指令指单周期完成的算术定点类指令;复杂定点类指令指多周期完成的算术定点类指令;浮点类指令指多周期完成的算术浮点类指令。
6.根据权利要求1所述的一种POWER指令集向量协处理器的译码电路,其特征在于,第二设置器(140)将仿存类指令送入功能单元中用于执行仿存类指令的仿存单元(150),将置换类指令送入功能单元中用于执行置换类指令的置换单元(160),将简单定点类指令送入功能单元中用于执行简单定点类指令的简单定点单元(170),将复杂定点类指令送入功能单元中用于执行复杂定点类指令的复杂定点单元(180),将浮点类指令送入功能单元中用于执行浮点类指令的浮点单元(190)。
7.根据权利要求1所述的一种POWER指令集向量协处理器的译码电路,其特征在于,所述第二判断器(130)接收主处理器(200)的一条指令是32位向量协处理器有效指令的第26位为1,则所述的指令为一条VA格式指令,对于VA格式指令,根据指令的第28-30位判断所述指令类型,当所述指令的第28-30位为111时,所述指令为浮点类指令;当所述指令的第28-30位为101或110时,所述指令为置换类指令;否则,所述指令为复杂定点类指令。
8.根据权利要求1所述的一种POWER指令集向量协处理器的译码电路,其特征在于,所述第二判断器(130)接收主处理器(200)的一条指令是32位向量协处理器有效指令的第26位为0,则所述指令为一条VC格式指令、或VX格式指令,或X格式指令,则根据所述指令的第21、24、25、28-30位共同判断所述指令的指令类型,当所述指令的第28-30位为000、001或011时,所述指令为简单定点类指令;当所述指令的第28-30位为100时,所述指令为复杂定点类指令;当所述指令的第28-30位为110或111时,所述指令为置换类指令;当所述指令的第28-30位为101时,根据所述指令的第21位判断指令类型,若第21位为1,则所述指令为简单定点类指令,若第21位为0,则所述指令为浮点类指令;当所述指令的第28-30位为010时,根据所述指令的21、24、25位判断指令类型,若第21、24、25位为011,则所述指令为置换类指令,否则,所述指令为简单定点类指令。
9.根据权利要求1所述的一种POWER指令集向量协处理器的译码电路,其特征在于,当经由第二判断器(130)判断所接收的一条指令为简单定点功能单元指令时,第二设置器(140)将指令的第21-25,28-30位共8位送往简单定点功能单元(170);当经由第二判断器(130)判断所接收的一条指令为复杂定点功能单元指令时,第二设置器(140)将指令的第21-26,28-31位共10位送往复杂定点功能单元(180);当经由第二判断器(130)判断所接收的一条指令为浮点类指令时,第二设置器(140)将指令的第22-25,26,31位共6位或指令的第22-25,29,31位共6位送往浮点功能单元(190);当经由第二判断器(130)判断所接收的一条指令为置换类指令时,第二设置器(140)将指令的第21-26,29,30位共8位或指令的第21-26,30,31位共8位送往置换单元(160);当经由第二判断器(130)判断所接收的一条指令为仿存类指令时,第二设置器(140)将指令的第22-25,30位共5位送往仿存单元(150)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510777046.9A CN105426161B (zh) | 2015-11-12 | 2015-11-12 | 一种power指令集向量协处理器的译码电路 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510777046.9A CN105426161B (zh) | 2015-11-12 | 2015-11-12 | 一种power指令集向量协处理器的译码电路 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105426161A true CN105426161A (zh) | 2016-03-23 |
CN105426161B CN105426161B (zh) | 2017-11-07 |
Family
ID=55504392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510777046.9A Expired - Fee Related CN105426161B (zh) | 2015-11-12 | 2015-11-12 | 一种power指令集向量协处理器的译码电路 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105426161B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110928577A (zh) * | 2019-11-14 | 2020-03-27 | 中国人民解放军国防科技大学 | 一种带异常返回的向量存储指令的执行方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040030862A1 (en) * | 2002-08-09 | 2004-02-12 | Paver Nigel C. | Multimedia coprocessor control mechanism |
CN1997962A (zh) * | 2004-06-25 | 2007-07-11 | 皇家飞利浦电子股份有限公司 | 指令处理电路 |
US7403964B2 (en) * | 2002-10-22 | 2008-07-22 | Broadcom Corporation | Galois field multiplier array for use within a finite field arithmetic unit |
CN101751244A (zh) * | 2010-01-04 | 2010-06-23 | 清华大学 | 微处理器 |
CN101916180A (zh) * | 2010-08-11 | 2010-12-15 | 中国科学院计算技术研究所 | Risc处理器中执行寄存器类型指令的方法和其系统 |
CN102750133A (zh) * | 2012-06-20 | 2012-10-24 | 中国电子科技集团公司第五十八研究所 | 支持simd的32位三发射的数字信号处理器 |
CN102945148A (zh) * | 2012-09-26 | 2013-02-27 | 中国航天科技集团公司第九研究院第七七一研究所 | 一种并行指令集的实现方法 |
-
2015
- 2015-11-12 CN CN201510777046.9A patent/CN105426161B/zh not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040030862A1 (en) * | 2002-08-09 | 2004-02-12 | Paver Nigel C. | Multimedia coprocessor control mechanism |
US7403964B2 (en) * | 2002-10-22 | 2008-07-22 | Broadcom Corporation | Galois field multiplier array for use within a finite field arithmetic unit |
CN1997962A (zh) * | 2004-06-25 | 2007-07-11 | 皇家飞利浦电子股份有限公司 | 指令处理电路 |
CN101751244A (zh) * | 2010-01-04 | 2010-06-23 | 清华大学 | 微处理器 |
CN101916180A (zh) * | 2010-08-11 | 2010-12-15 | 中国科学院计算技术研究所 | Risc处理器中执行寄存器类型指令的方法和其系统 |
CN102750133A (zh) * | 2012-06-20 | 2012-10-24 | 中国电子科技集团公司第五十八研究所 | 支持simd的32位三发射的数字信号处理器 |
CN102945148A (zh) * | 2012-09-26 | 2013-02-27 | 中国航天科技集团公司第九研究院第七七一研究所 | 一种并行指令集的实现方法 |
Non-Patent Citations (1)
Title |
---|
赵福发 等: "一种基于PowerPC的安全SoC设计", 《计算机工程与科学》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110928577A (zh) * | 2019-11-14 | 2020-03-27 | 中国人民解放军国防科技大学 | 一种带异常返回的向量存储指令的执行方法 |
CN110928577B (zh) * | 2019-11-14 | 2021-11-05 | 中国人民解放军国防科技大学 | 一种带异常返回的向量存储指令的执行方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105426161B (zh) | 2017-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10503505B2 (en) | Read and write masks update instruction for vectorization of recursive computations over independent data | |
US10514912B2 (en) | Vector multiplication with accumulation in large register space | |
EP4276609A2 (en) | Systems and methods for performing 16-bit floating-point matrix dot product instructions | |
CN100541422C (zh) | 用于执行具有取整和移位的组合型高位乘法的方法和装置 | |
US8645669B2 (en) | Cracking destructively overlapping operands in variable length instructions | |
US20120060016A1 (en) | Vector Loads from Scattered Memory Locations | |
US20060190700A1 (en) | Handling permanent and transient errors using a SIMD unit | |
CN101488084A (zh) | 执行屏蔽加载和存储操作的指令和逻辑 | |
EP3757769A1 (en) | Systems and methods to skip inconsequential matrix operations | |
JP2017107579A (ja) | リードマスク及びライトマスクにより制御されるベクトル移動命令 | |
CN101916180A (zh) | Risc处理器中执行寄存器类型指令的方法和其系统 | |
US20130151822A1 (en) | Efficient Enqueuing of Values in SIMD Engines with Permute Unit | |
TW201732570A (zh) | 用於聚合集中及跨步的系統、裝置及方法 | |
CN108415882B (zh) | 利用操作数基础系统转换和再转换的向量乘法 | |
WO2012151331A1 (en) | Methods and apparatus for constant extension in a processor | |
EP3716054A2 (en) | Interleaved pipeline of floating-point adders | |
WO2014105057A1 (en) | Instruction to reduce elements in a vector register with strided access pattern | |
US10437562B2 (en) | Apparatus and method for processing sparse data | |
CN101539852B (zh) | 用于执行条件存储指令的方法、处理器和信息处理设备 | |
CN104156195A (zh) | 扩展双精度的80位浮点处理单元在处理器中的集成系统及方法 | |
CN108292228B (zh) | 用于基于通道的步进收集的系统、设备和方法 | |
CN102141903B (zh) | 用于16/32位混合指令的对称编码装置与译码装置 | |
CN104216681A (zh) | 一种cpu指令处理方法和处理器 | |
CN105426161A (zh) | 一种power指令集向量协处理器的译码电路 | |
CN101216755B (zh) | Risc处理器及其浮点寄存器的非对齐访存方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20171107 Termination date: 20201112 |
|
CF01 | Termination of patent right due to non-payment of annual fee |