CN102495719B - 一种向量浮点运算装置及方法 - Google Patents

一种向量浮点运算装置及方法 Download PDF

Info

Publication number
CN102495719B
CN102495719B CN201110421015.1A CN201110421015A CN102495719B CN 102495719 B CN102495719 B CN 102495719B CN 201110421015 A CN201110421015 A CN 201110421015A CN 102495719 B CN102495719 B CN 102495719B
Authority
CN
China
Prior art keywords
floating
point operation
vector
operand
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110421015.1A
Other languages
English (en)
Other versions
CN102495719A (zh
Inventor
王东琳
王惠娟
张志伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Silang Technology Co ltd
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN201110421015.1A priority Critical patent/CN102495719B/zh
Publication of CN102495719A publication Critical patent/CN102495719A/zh
Application granted granted Critical
Publication of CN102495719B publication Critical patent/CN102495719B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/30036Instructions to perform operations on packed data, e.g. vector, tile or matrix operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Complex Calculations (AREA)
  • Advance Control (AREA)

Abstract

本发明公开了一种向量浮点运算装置及方法,该向量浮点运算装置包括N个标量运算单元、指令译码单元、数据分发单元、结果收集单元以及标志位更新逻辑单元,其中N的大小可以根据设计而定,支持向量-向量,向量-标量间的多种运算。本发明的向量浮点运算装置及方法具有设计简单高效,扩展性和可重构性好,并行性高等优点。

Description

一种向量浮点运算装置及方法
技术领域
本发明涉及微处理器内的浮点运算技术领域,涉及微处理器向量浮点部件的加/减运算通路及与其相关的操作的处理,确切地说,是涉及一种向量浮点运算装置及方法。
背景技术
计算机发展的主要目的是为了满足大型科学计算的需求,随着科学计算对计算机性能需求的不断增长计算机技术也迅速发展起来。向量类运算在数字信号算法中具有非常重要的地位,传统处理器通过标量的操作实现现代信号处理算法中大量的向量运算。由于芯片主频已经达到极限,以标量为计算单位的单核处理器很难满足性能要求。
因此,在硬件结构上设计支持向量处理,增加向量运算部件,在硬件体系结构层次实现对向量处理的支持在很大程度上能够改进向量类运算的运算速度,减少运算时间,增加数字信号处理的吞吐量,以在数字信号处理领域,比如现代雷达信号处理,星载卫星图像处理,高清电视等,满足处理大量数据的高实时性、高速和高可靠性要求。
2004年3月17日公开的申请号为01131568.7的中国发明专利《微处理器向量处理方法》,发明人:王志英等,公开了一种微处理向量处理方法,在满足硬件实现简单、功耗低、成本低的前提下实现微处理器向量处理。该发明利用微处理器原有的流水线结构,设计向量指令集,增加向量寄存器和向量控制逻辑,在译码阶段增加对向量指令的译码支持,用硬件执行循环过程,利用标量流水线功能部件和控制信号,实现微处理器对向量处理的支持。该种结构实现简单,但是进行循环以实现向量运算的方法使得运算速度较低,不能满足高实时性、高速和高可靠性的要求。
2011年8月31日公开申请号为200910241614.8的中国发明专利《浮点向量乘加运算装置和方法》,发明人:胡伟武等,公开了一种浮点向量乘加运算装置和方法。该装置包括一个乘法选择单元,n个乘法单元和n个加法单元。其中,乘数选择单元用于根据第四源操作数的值m,选择第二源操作数浮点向量的第m+1部分输出到n个乘法单元,m≤n-1;乘法单元用于将所选择的第二源操作数浮点向量的第m+1部分与第三源操作数浮点向量的n个部分分别进行相乘操作,并将相乘操作的运算结果输出到相应的n个加法单元;加法单元用于将相乘操作运算结果的n个部分和第一远操作数浮点向量的n个部分分别进行加法操作,得到乘加结果。该发明提出了一种向量乘加的装置及方法,但是对于其他类型的向量运算并没有给出设计和实现方法,应用范围比较窄。
2010年11月25日公开的申请号为201010559406.5的中国发明专利《一种可扩展向量运算簇》,发明人:陈书明等,公开了一种可扩展向量运算簇,包括向量处理阵列、支持压缩指令的向量译码器、用于存放多种数据类型的局部向量寄存器文件/累加器以及支持行列访问的矩阵寄存器文件,所述向量处理阵列包括2~64个同构向量处理单元,所述每个向量处理单元拥有独立的局部向量寄存器文件/累加器并共享矩阵寄存器;所述局部向量寄存器文件/累加器和矩阵寄存器文件提供指令操作的数据来源和目的。该发明统一执行流水对应的功能部件共享相同的数据通路,带来的问题就是需引入旁路以及互锁机制,设计相对复杂。
2007年6月20日公开的申请号为200610063927.5的中国发明专利《用于矢量处理的可扩展并行流水线浮点单元》,发明人:D.多诺夫里奥等,公开了一种为矢量处理执行浮点运算的技术,输入对来捕获多个矢量输入,电镀漆跟配所述矢量输入,多个浮点流水线根据对所述调度器分配的矢量输入的标量分量的运算来产生浮点结果。仲裁器和组装单元仲裁输出部件的使用并组装所述浮点结果以写入所述输出部件。该种技术支持异步方式进行处理,这样计算的结果可能会不同步,从而需设计复杂的仲裁机制以避免死锁现象的发生。
通过上面分析可知,向量运算在当今的数字信号处理领域非常普遍,高速有效而且代价比较小的向量运算设计非常重要,而基于标量运算部件设计实现向量运算单元是一种可行的设计方法。如何基于标量运算单元设置和构建简单高效可重构的向量运算单元是本发明所要研究的主要内容。
发明内容
(一)要解决的技术问题
有鉴于此,本发明的主要目的在于提出一种基于标量运算单元实现可重构向量浮点运算单元的方法和装置,以实现向量与向量间运算以及向量与标量间运算。
(二)技术方案
为达到上述目的,本发明提供了一种向量浮点运算装置,用于实现向量与标量以及向量与向量之间的各种浮点运算,包括:
指令译码单元11,用于对接收自外部的指令进行译码,得到操作类型信息、舍入方式信息、向量-向量或向量-标量的操作指示信息,将操作类型信息和舍入方式信息输出给向量浮点运算核心单元13,将操作类型信息输出给标志位更新逻辑单元14,将向量-向量或者向量-标量的操作指示信息输出给数据分发单元12;
数据分发单元12,用于接收外部输入的512位宽的第一操作数和第二操作数,并根据指令译码单元11提供的操作指示信息确定进行分发的数据,将第一操作数和第二操作数分发给向量浮点运算核心单元13;
向量浮点运算核心单元13,用于接收来自指令译码单元11提供的操作类型信息和舍入方式信息,以及数据分发单元12提供的第一操作数和第二操作数,并且根据操作类型信息和舍入方式信息并行的对数据进行处理,得到计算结果信息,将该计算结果信息分别输出给标志位更新逻辑单元14和结果收集单元15;
标志位更新逻辑单元14,用于根据指令译码单元11提供的操作类型信息,以及向量浮点运算核心单元13提供的计算结果信息进行标志位的更新;以及
结果收集单元15,用于对接收自向量浮点运算核心单元13的计算结果信息进行收集和整理,输出512位宽的向量浮点运算结果。
为达到上述目的,本发明还提供了一种利用向量浮点运算装置进行向量浮点运算的方法,包括:
指令译码单元11对接收自外部的指令进行译码,得到操作类型信息、舍入方式信息、向量-向量或向量-标量的操作指示信息,将操作类型信息和舍入方式信息输出给向量浮点运算核心单元13,将操作类型信息输出给标志位更新逻辑单元14,将向量-向量或者向量-标量的操作指示信息输出给数据分发单元12;
数据分发单元12接收外部输入的第一操作数和第二操作数,并根据指令译码单元11提供的操作指示信息确定进行分发的数据,将第一操作数和第二操作数分发给向量浮点运算核心单元13;
向量浮点运算核心单元13接收来自指令译码单元11提供的操作类型信息和舍入方式信息,以及数据分发单元12提供的第一操作数和第二操作数,并且根据操作类型信息和舍入方式信息并行的对数据进行处理,得到计算结果信息,将该计算结果信息分别输出给标志位更新逻辑单元14和结果收集单元15;
标志位更新逻辑单元14根据指令译码单元11提供的操作类型信息,以及向量浮点运算核心单元13提供的计算结果信息进行标志位的更新;以及
结果收集单元15对接收自向量浮点运算核心单元13的计算结果信息进行收集和整理,输出向量浮点运算结果。
(三)有益效果
本发明提供的向量浮点运算装置及方法,该向量浮点运算装置包括N个标量运算单元、指令译码单元、数据分发单元、结果收集单元以及标志位更新逻辑单元,其中N的大小可以根据设计而定,支持向量-向量,向量-标量间的多种运算。本发明的向量浮点运算装置及方法具有设计简单高效,扩展性和可重构性好,并行性高等优点。
附图说明
图1是依照本发明实施例采用16个32位标量浮点运算单元实现的512位向量浮点运算装置的结构示意图;
图2是依照本发明实施例利用图1所示的512位向量浮点运算装置进行向量浮点运算的方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。本领域的技术人员可以利用本实施例及其他实施例在不背离本发明范围的前提下进行改变。所以,下面的描述不是限制性的,本发明的范围由所附权利要求定义。
本发明的装置包括:N个标量运算单元,指令译码单元,数据分发单元,结果收集单元以及计算状态标志位更新单元,其中N为大于1的自然数,其大小可以根据设计而定,具有高度可重构性,一般可以为4、8、16或32等。在具体实施方式中的实施例中,取N=16,由16个32位浮点标量运算单元实现512位的向量浮点运算单元。
图1示出依照本发明实施例采用16个32位标量浮点运算单元实现的512位向量浮点运算装置10的结构示意图,该向量浮点运算装置10用于实现向量与标量,向量与向量间的各种浮点运算。该向量浮点运算装置包括:指令译码单元11、数据分发单元12、向量浮点运算核心单元13(由16个标量浮点运算单元组成)、标志位更新逻辑单元14和结果收集单元15。
其中,指令译码单元11,用于对接收自外部的指令进行译码,得到操作类型信息、舍入方式信息、向量-向量或向量-标量的操作指示信息,将操作类型信息和舍入方式信息输出给向量浮点运算核心单元13,将操作类型信息输出给标志位更新逻辑单元14,将向量-向量或者向量-标量的操作指示信息输出给数据分发单元12。
数据分发单元12用于接收外部输入的512位宽的第一操作数和第二操作数,并根据指令译码单元11提供的操作指示信息确定进行分发的数据,将第一操作数和第二操作数分别分发给向量浮点运算核心单元13中的16个同构的标量浮点运算单元,以进行并行向量浮点运算。
向量浮点运算核心单元13包括16个同构的标量浮点运算单元,其中每个单元都由两级流水实现,其分别接收来自指令译码单元11提供的操作类型信息和舍入方式信息,以及数据分发单元12提供的第一操作数和第二操作数,并且根据操作类型信息和舍入方式信息并行的对数据进行处理,得到相应的计算结果信息,将该计算结果信息分别输出给标志位更新逻辑单元14和结果收集单元15。
标志位更新逻辑单元14根据指令译码单元11提供的操作类型信息,以及向量浮点运算核心单元13中的16个标量浮点运算单元的计算结果信息进行标志位的更新,进行更新的标志位包括:零标志(AZ),下溢标志(AU),负数标志(AN),上溢标志(AV),无效标志(AI),浮点标志(AF)。当16个标量浮点运算单元中产生为0的计算结果时,AZ置1;当16个标量浮点运算单元的计算结果中存在小于输出格式所能表示的最小值时,AU置1;当16个标量浮点运算单元的计算结果中存在负数时,AN置1;当16个标量浮点运算部件的计算结果中存在上溢的结果时,AV置1;当输入操作数是无效数,或者符号相反的两个无穷值相加,或者符号相同的两个无穷值相减,或者浮点转定点时发生溢出,或者对无穷值进行浮点转定点转换时,AI置1;当最近一次运算为浮点运算时,AF置1。
结果收集单元15,用于对接收自向量浮点运算核心单元13中的16个标量浮点运算单元的计算结果信息进行收集和整理,输出512位宽的向量浮点运算结果,完成整个向量浮点运算的计算。
基于图1所示的依照本发明实施例采用16个32位标量浮点运算单元实现的512位向量浮点运算装置的结构示意图,图2示出了依照本发明实施例利用图1所示的512位向量浮点运算装置进行向量浮点运算的方法流程图,该方法包括以下步骤:
步骤21,指令译码单元11对接收自外部的指令进行译码,得到操作类型信息、舍入方式信息、向量-向量或向量-标量的操作指示信息,将操作类型信息和舍入方式信息输出给向量浮点运算核心单元13,将操作类型信息输出给标志位更新逻辑单元14,将向量-向量或者向量-标量的操作指示信息输出给数据分发单元12。
步骤22,数据分发单元12接收外部输入的512位宽的第一操作数和第二操作数,并根据指令译码单元11提供的操作指示信息确定进行分发的数据,将第一操作数和第二操作数分别分发给向量浮点运算核心单元13中的16个同构的标量浮点运算单元。
步骤23,向量浮点运算核心单元13中的16个同构的标量浮点运算单元,分别接收来自指令译码单元11提供的操作类型信息和舍入方式信息,以及数据分发单元12提供的第一操作数和第二操作数,并且根据操作类型信息和舍入方式信息并行的对数据进行处理,得到相应的计算结果信息,将该计算结果信息分别输出给标志位更新逻辑单元14和结果收集单元15。
步骤24,标志位更新逻辑单元14根据指令译码单元11提供的操作类型信息,以及向量浮点运算核心单元13中的16个标量浮点运算单元的计算结果信息进行标志位的更新,可更新的标志位包括:零标志,下溢标志,负数标志,上溢标志,无效标志和浮点标志。
步骤25,结果收集单元15对接收自向量浮点运算核心单元13中的16个标量浮点运算单元的计算结果信息进行收集和整理,输出512位宽的向量浮点运算结果,完成整个向量浮点运算的计算。
本发明采用多个标量浮点运算单元,外加:指令译码单元,数据分发单元,标志位更新逻辑单元以及结果收集单元实现对向量浮点并行运算的支持,结构简单,其中标量浮点运算单元的个数并不限于本发明实施例中提及的16个,其个数可以根据实际应用需要进行选取,可复用性高,是一种简单高效的设计方法。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种向量浮点运算装置,用于实现向量与标量以及向量与向量之间的各种浮点运算,其特征在于,包括:
指令译码单元(11),用于对接收自外部的指令进行译码,得到操作类型信息、舍入方式信息、向量-向量或向量-标量的操作指示信息,将操作类型信息和舍入方式信息输出给向量浮点运算核心单元(13),将操作类型信息输出给标志位更新逻辑单元(14),将向量-向量或者向量-标量的操作指示信息输出给数据分发单元(12);
数据分发单元(12),用于接收外部输入的512位宽的第一操作数和第二操作数,并根据指令译码单元(11)提供的操作指示信息确定进行分发的数据,将第一操作数和第二操作数分发给向量浮点运算核心单元(13);
向量浮点运算核心单元(13),用于接收来自指令译码单元(11)提供的操作类型信息和舍入方式信息,以及数据分发单元(12)提供的第一操作数和第二操作数,并且根据操作类型信息和舍入方式信息并行的对数据进行处理,得到计算结果信息,将该计算结果信息分别输出给标志位更新逻辑单元(14)和结果收集单元(15);其中,所述向量浮点运算核心单元(13)包括N个同构的标量浮点运算单元,其中每个标量浮点运算单元都由多级流水实现;
标志位更新逻辑单元(14),用于根据指令译码单元(11)提供的操作类型信息,以及向量浮点运算核心单元(13)提供的计算结果信息进行标志位的更新;以及
结果收集单元(15),用于对接收自向量浮点运算核心单元(13)的计算结果信息进行收集和整理,输出512位宽的向量浮点运算结果。
2.根据权利要求1所述的向量浮点运算装置,其特征在于,所述N为大于1的自然数。
3.根据权利要求1所述的向量浮点运算装置,其特征在于,所述数据分发单元(12)将第一操作数和第二操作数分发给向量浮点运算核心单元(13),是将第一操作数和第二操作数分别分发给向量浮点运算核心单元(13)中的N个同构的标量浮点运算单元,以进行并行向量浮点运算。
4.根据权利要求1所述的向量浮点运算装置,其特征在于,所述向量浮点运算核心单元(13)接收来自指令译码单元(11)提供的操作类型信息和舍入方式信息,以及数据分发单元(12)提供的第一操作数和第二操作数,并且根据操作类型信息和舍入方式信息并行的对数据进行处理,得到计算结果信息,是向量浮点运算核心单元(13)中的N个同构的标量浮点运算单元分别接收来自指令译码单元(11)提供的操作类型信息和舍入方式信息,以及数据分发单元(12)提供的第一操作数和第二操作数,并且根据操作类型信息和舍入方式信息并行的对数据进行处理,得到计算结果信息。
5.根据权利要求1所述的向量浮点运算装置,其特征在于,所述标志位更新逻辑单元(14)进行标志位的更新时,进行更新的标志位包括:零标志AZ、下溢标志AU、负数标志AN、上溢标志AV、无效标志AI和浮点标志AF。
6.根据权利要求4所述的向量浮点运算装置,其特征在于,
当N个标量浮点运算单元中产生为0的计算结果时,零标志AZ置1;
当N个标量浮点运算单元的计算结果中存在小于输出格式所能表示的最小值时,下溢标志AU置1;
当N个标量浮点运算单元的计算结果中存在负数时,负数标志AN置1;
当N个标量浮点运算单元的计算结果中存在上溢的结果时,上溢标志AV置1;
当输入操作数是无效数,或者符号相反的两个无穷值相加,或者符号相同的两个无穷值相减,或者浮点转定点时发生溢出,或者对无穷值进行浮点转定点转换时,无效标志AI置1;
当最近一次运算为浮点运算时,浮点标志AF置1。
7.一种利用权利要求1至6中任一项所述的向量浮点运算装置进行向量浮点运算的方法,其特征在于,包括:
指令译码单元(11)对接收自外部的指令进行译码,得到操作类型信息、舍入方式信息、向量-向量或向量-标量的操作指示信息,将操作类型信息和舍入方式信息输出给向量浮点运算核心单元(13),将操作类型信息输出给标志位更新逻辑单元(14),将向量-向量或者向量-标量的操作指示信息输出给数据分发单元(12);
数据分发单元(12)接收外部输入的第一操作数和第二操作数,并根据指令译码单元(11)提供的操作指示信息确定进行分发的数据,将第一操作数和第二操作数分发给向量浮点运算核心单元(13);
向量浮点运算核心单元(13)接收来自指令译码单元(11)提供的操作类型信息和舍入方式信息,以及数据分发单元(12)提供的第一操作数和第二操作数,并且根据操作类型信息和舍入方式信息并行的对数据进行处理,得到计算结果信息,将该计算结果信息分别输出给标志位更新逻辑单元(14)和结果收集单元(15);其中,所述向量浮点运算核心单元(13)包括N个同构的标量浮点运算单元,其中每个标量浮点运算单元都由多级流水实现;
标志位更新逻辑单元(14)根据指令译码单元(11)提供的操作类型信息,以及向量浮点运算核心单元(13)提供的计算结果信息进行标志位的更新;以及
结果收集单元(15)对接收自向量浮点运算核心单元(13)的计算结果信息进行收集和整理,输出向量浮点运算结果。
8.根据权利要求7所述的方法,其特征在于,所述N为大于1的自然数。
9.根据权利要求7所述的方法,其特征在于,所述数据分发单元(12)将第一操作数和第二操作数分发给向量浮点运算核心单元(13),是将第一操作数和第二操作数分别分发给向量浮点运算核心单元(13)中的N个同构的标量浮点运算单元,以进行并行向量浮点运算。
10.根据权利要求7所述的方法,其特征在于,所述向量浮点运算核心单元(13)接收来自指令译码单元(11)提供的操作类型信息和舍入方式信息,以及数据分发单元(12)提供的第一操作数和第二操作数,并且根据操作类型信息和舍入方式信息并行的对数据进行处理,得到计算结果信息,是向量浮点运算核心单元(13)中的N个同构的标量浮点运算单元分别接收来自指令译码单元(11)提供的操作类型信息和舍入方式信息,以及数据分发单元(12)提供的第一操作数和第二操作数,并且根据操作类型信息和舍入方式信息并行的对数据进行处理,得到计算结果信息。
11.根据权利要求7所述的方法,其特征在于,所述标志位更新逻辑单元(14)进行标志位的更新时,进行更新的标志位包括:零标志AZ、下溢标志AU、负数标志AN、上溢标志AV、无效标志AI和浮点标志AF。
12.根据权利要求11所述的方法,其特征在于,
当N个标量浮点运算单元中产生为0的计算结果时,零标志AZ置1;
当N个标量浮点运算单元的计算结果中存在小于输出格式所能表示的最小值时,下溢标志AU置1;
当N个标量浮点运算单元的计算结果中存在负数时,负数标志AN置1;
当N个标量浮点运算单元的计算结果中存在上溢的结果时,上溢标志AV置1;
当输入操作数是无效数,或者符号相反的两个无穷值相加,或者符号相同的两个无穷值相减,或者浮点转定点时发生溢出,或者对无穷值进行浮点转定点转换时,无效标志AI置1;
当最近一次运算为浮点运算时,浮点标志AF置1。
CN201110421015.1A 2011-12-15 2011-12-15 一种向量浮点运算装置及方法 Active CN102495719B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110421015.1A CN102495719B (zh) 2011-12-15 2011-12-15 一种向量浮点运算装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110421015.1A CN102495719B (zh) 2011-12-15 2011-12-15 一种向量浮点运算装置及方法

Publications (2)

Publication Number Publication Date
CN102495719A CN102495719A (zh) 2012-06-13
CN102495719B true CN102495719B (zh) 2014-09-24

Family

ID=46187548

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110421015.1A Active CN102495719B (zh) 2011-12-15 2011-12-15 一种向量浮点运算装置及方法

Country Status (1)

Country Link
CN (1) CN102495719B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9916130B2 (en) * 2014-11-03 2018-03-13 Arm Limited Apparatus and method for vector processing
CN104598196A (zh) * 2014-12-30 2015-05-06 杭州中天微系统有限公司 一种浮点处理装置及方法
CN105278913A (zh) * 2015-01-14 2016-01-27 北京国睿中数科技股份有限公司 实现向量浮点基2指数对数计算的装置
CN105302772A (zh) * 2015-01-14 2016-02-03 北京国睿中数科技股份有限公司 浮点复数向量第一级fft计算方法及系统
CN104615808B (zh) * 2015-01-19 2018-07-03 北京思朗科技有限责任公司 一种待测试硬件运算部件的测试方法及参考模型装置
CN105528191B (zh) * 2015-12-01 2017-04-12 中国科学院计算技术研究所 数据累加装置、方法及数字信号处理装置
CN111176608A (zh) * 2016-04-26 2020-05-19 中科寒武纪科技股份有限公司 一种用于执行向量比较运算的装置和方法
CN107315575B (zh) * 2016-04-26 2020-07-31 中科寒武纪科技股份有限公司 一种用于执行向量合并运算的装置和方法
CN107688466B (zh) * 2016-08-05 2020-11-03 中科寒武纪科技股份有限公司 一种运算装置及其操作方法
CN107480770B (zh) * 2017-07-27 2020-07-28 中国科学院自动化研究所 可调节量化位宽的神经网络量化与压缩的方法及装置
CN109961136B (zh) * 2017-12-14 2020-05-19 中科寒武纪科技股份有限公司 集成电路芯片装置及相关产品
CN109960673B (zh) * 2017-12-14 2020-02-18 中科寒武纪科技股份有限公司 集成电路芯片装置及相关产品
CN112230994A (zh) * 2017-12-15 2021-01-15 安徽寒武纪信息科技有限公司 一种计算方法及相关产品
SG11202007272QA (en) * 2018-02-02 2020-08-28 Charles Stark Draper Laboratory Inc Systems and methods for policy execution processing
CN108595149B (zh) * 2018-04-28 2021-05-04 天津芯海创科技有限公司 可重构乘加运算装置
CN111290789B (zh) * 2018-12-06 2022-05-27 上海寒武纪信息科技有限公司 运算方法、装置、计算机设备和存储介质
CN111290788B (zh) * 2018-12-07 2022-05-31 上海寒武纪信息科技有限公司 运算方法、装置、计算机设备和存储介质
US11366663B2 (en) 2018-11-09 2022-06-21 Intel Corporation Systems and methods for performing 16-bit floating-point vector dot product instructions
CN110069240B (zh) * 2019-04-30 2021-09-03 北京探境科技有限公司 定点与浮点数据计算方法及装置
CN110221808B (zh) * 2019-06-03 2020-10-09 深圳芯英科技有限公司 向量乘加运算的预处理方法、乘加器及计算机可读介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0607988A1 (en) * 1993-01-22 1994-07-27 Matsushita Electric Industrial Co., Ltd. Program controlled processor
CN102012893A (zh) * 2010-11-25 2011-04-13 中国人民解放军国防科学技术大学 一种可扩展向量运算簇

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3940542B2 (ja) * 2000-03-13 2007-07-04 株式会社ルネサステクノロジ データプロセッサ及びデータ処理システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0607988A1 (en) * 1993-01-22 1994-07-27 Matsushita Electric Industrial Co., Ltd. Program controlled processor
CN102012893A (zh) * 2010-11-25 2011-04-13 中国人民解放军国防科学技术大学 一种可扩展向量运算簇

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Feasibility of Floating-Point Arithmetic in Reconfigurable Computing Systems;I. Sahin等;《In Presented at 3rd Military and Aerospace Programmable Logic Devices (MAPLD) Conference》;20001231;第1-7页 *
I. Sahin等.Feasibility of Floating-Point Arithmetic in Reconfigurable Computing Systems.《In Presented at 3rd Military and Aerospace Programmable Logic Devices (MAPLD) Conference》.2000,第1-7页.
王桐.高性能浮点DSP中ALU的研究与设计.《万方学位论文电子数据库》.2006,第10-42页.
闵银皮 等.多线程向量浮点部件的验证方法.《第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)》.2011,第119-123页. *
高性能浮点DSP中ALU的研究与设计;王桐;《万方学位论文电子数据库》;20060613;第10-42页 *

Also Published As

Publication number Publication date
CN102495719A (zh) 2012-06-13

Similar Documents

Publication Publication Date Title
CN102495719B (zh) 一种向量浮点运算装置及方法
Gong et al. MALOC: A fully pipelined FPGA accelerator for convolutional neural networks with all layers mapped on chip
CN110036369B (zh) 一种计算方法及相关产品
CN108268278B (zh) 具有可配置空间加速器的处理器、方法和系统
US11029958B1 (en) Apparatuses, methods, and systems for configurable operand size operations in an operation configurable spatial accelerator
Dongarra et al. High-performance computing systems: Status and outlook
CN111868702A (zh) 用于可配置空间加速器中的远程存储器访问的装置、方法和系统
CN109597646A (zh) 具有可配置空间加速器的处理器、方法和系统
CN104112053A (zh) 一种面向图像处理的可重构架构平台设计方法
Fan et al. Stream processing dual-track CGRA for object inference
CN112148647A (zh) 用于存储器接口电路仲裁的装置、方法和系统
CN112148664A (zh) 用于可配置空间加速器中的时间复用的装置、方法和系统
CN101021832A (zh) 支持局部寄存和条件执行的64位浮点整数融合运算群
CN102360281B (zh) 用于微处理器的多功能定点乘加单元mac运算装置
Lou et al. RV-CNN: Flexible and efficient instruction set for CNNs based on RISC-V processors
CN106951394A (zh) 一种可重构定浮点通用fft处理器
Abdelhamid et al. A highly-efficient and tightly-connected many-core overlay architecture
CN106873942B (zh) 结构量计算机的msd乘法计算的方法
Tortorella et al. RedMule: A mixed-precision matrix–matrix operation engine for flexible and energy-efficient on-chip linear algebra and TinyML training acceleration
CN116484886A (zh) 高精度雷达信号运算芯片的数据处理架构和运算芯片系统
CN106168941B (zh) 一种支持复数乘法的fft蝶形运算硬件实现电路
CN102129495B (zh) 一种降低可重构算子阵列结构功耗的方法
Heysters et al. A reconfigurable function array architecture for 3G and 4G wireless terminals
Yunfu et al. Design and implementation of R4-MSD square root algorithm in ternary optical computer
CN103677735B (zh) 一种数据处理装置及数字信号处理器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20171211

Address after: 102412 Beijing City, Fangshan District Yan Village Yan Fu Road No. 1 No. 11 building 4 layer 402

Patentee after: Beijing Si Lang science and Technology Co.,Ltd.

Address before: 100190 Zhongguancun East Road, Beijing, No. 95, No.

Patentee before: Institute of Automation, Chinese Academy of Sciences

TR01 Transfer of patent right
CP03 Change of name, title or address

Address after: 201306 building C, No. 888, Huanhu West 2nd Road, Lingang New District, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai

Patentee after: Shanghai Silang Technology Co.,Ltd.

Address before: 102412 room 402, 4th floor, building 11, No. 1, Yanfu Road, Yancun Town, Fangshan District, Beijing

Patentee before: Beijing Si Lang science and Technology Co.,Ltd.

CP03 Change of name, title or address