CN108733412A

CN108733412A - 一种运算装置和方法

Info

Publication number: CN108733412A
Application number: CN201710256445.XA
Authority: CN
Inventors: 不公告发明人
Original assignee: Shanghai Cambricon Information Technology Co Ltd
Current assignee: Shanghai Cambricon Information Technology Co Ltd
Priority date: 2017-04-19
Filing date: 2017-04-19
Publication date: 2018-11-02
Anticipated expiration: 2037-04-19
Also published as: CN108733412B

Abstract

本公开是关于一种运算装置和方法，装置包括，输入输出模块，控制器模块，运算器模块和存储模块。其中，输入输出模块用于数据的输入、输出和输入输出数据的存储；控制器模块将运算指令译码为控制信号，以控制其它各模块完成操作；运算器模块用于完成数据的四则运算、逻辑运算、移位操作和求补运算；存储模块用于指令和数据的暂存。本公开的优点在于能准确高效地执行复合标量指令。

Description

一种运算装置和方法

技术领域

本公开涉及指令集和指令集执行方法及实现，具体涉及一种支持复合标量指令的装置和运算方法，可用于图像处理，数字处理，智能设备和片上网络数据运算等。

背景技术

随着大数据时代的来临，复合标量指令被越来越多地运用于各种场合，准确、高效地执行复合标量指令具有重大意义。在现代智能芯片中，标量指令在各类算法中有着广泛的应用。

传统的标量指令通过操作码来区分浮点指令和定点指令，如定点加法指令和浮点加法指令的操作码不同，这种方式使得指令集和译码逻辑变得复杂。

另一种方法是通过在数据上附加一个用硬件解释的表示类型的标志位，用来区分指令所用的数据是浮点还是定点，这种方法并没有减少指令集的大小，并且一般只适用于操作数为立即数的情形，也可以在数据中加入标志位，这样就增加了存储所需的空间。

公开内容

(一)要解决的技术问题

鉴于上述问题，本公开在研究复合标量指令的基础上，提供一种复合标量指令、一种支持复合标量指令的装置，以及一种复合标量指令的执行方法，用以解决上述技术问题中的至少之一。

(二)技术方案

本公开是通过以下技术方案实现的：

一种支持复合标量指令的装置，包括控制器模块、存储模块和运算器模块，其中：

所述存储模块，用于存储复合标量指令和数据，所述数据有一种以上的类型，不同类型的数据存储于存储模块中不同的地址内；

所述控制器模块，用于从存储模块读取复合标量指令并译码为控制信号；

所述运算器模块，用于接收控制信号，从所述存储模块读取数据，根据读取数据的地址判断数据类型，并对数据进行运算。

优选地，所述数据包括初始数据和中间数据；所述装置还包括输入输出模块，所述输入输出模块将所述初始数据和复合标量指令传输给所述存储模块；所述运算器模块将运算的中间结果存储至存储模块，将最终结果传输给所述输入输出模块。

优选地，所述复合标量指令是将浮点指令和定点指令统一起来的指令，包括操作码域、操作数地址域和目的地址域，在译码时不区分指令类型，在运算时根据操作数地址域中的地址来确定数据类型；

其中，所述操作码域中存储的操作码用于区分不同类型的操作，所述操作数地址域用于区分操作数的类型，所述目的地址域为运算结果存储的地址。

优选地，所述不同类型的数据包括浮点数据和定点数据；所述存储模块包括寄存器堆、RAM和/或ROM；所述不同的地址包括不同的RAM地址和/或不同的寄存器号。

优选地，所述运算器模块通过读取数据所用的RAM地址或寄存器号来判断所读取的数据为浮点数据或定点数据。

一种复合标量指令，包括操作码域、操作数地址域和目的地址域；

所述操作码域中存储的操作码用于区分不同类型的操作，所述操作数地址域用于区分操作数的类型，所述目的地址域为运算结果存储的地址。

优选地，所述操作数地址域包括RAM地址、寄存器号或立即数；所述目的地址域包括RAM地址或寄存器号。

优选地，当操作数地址域所储存的是立即数时，所述复合标量指令还包括数据类型标志位，以区分浮点数据和定点数据。

优选地，读取数据采用多种寻址方式时，所述复合标量指令还包括寻址方式标志位；所述多种寻址方式包括寄存器寻址、寄存器间接寻址、RAM寻址和立即数寻址。

一种复合标量指令的执行方法，包括以下步骤：

S1：将不同类型的数据存储于不同的地址内；

S2：将复合标量指令译码为控制信号；

S3：根据控制信号读取操作数据，根据读取操作数据的地址判断操作数据的类型，对操作数据进行运算；

S4：将运算结果存储于对应类型的地址内。

(三)有益效果

(1)本公开提供的复合标量指令，是一种将浮点指令和定点指令统一起来的指令，在较大程度上统一了浮点指令和定点指令，在译码阶段不对指令的种类做区分，在具体计算时才根据操作数地址域中的地址来确定操作数是浮点数据还是定点数据，简化了指令的译码逻辑，也使得指令集变得更为精简；

(2)本公开提供的支持复合标量指令的装置，为复合标量指令提供了高效的执行环境；

(3)本公开提供的复合标量指令的执行方法，能够准确高效地执行复合标量指令。

附图说明

图1是本公开实施例提供的运算装置的结构示意图；

图2(a)是本公开实施例提供的一种存储模块RAM组织形式示例图；

图2(b)是本公开实施例提供的一种存储模块寄存器堆组织形式示例图；

图3(a)是本公开实施例提供的复合标量指令示例图；

图3(b)是本公开实施例提供的采用寄存器寻址时复合标量指令示例图；

图3(c)是本公开实施例提供的采用寄存器间接寻址时复合标量指令示例图；

图3(d)是本公开实施例提供的采用立即数寻址时复合标量指令示例图；

图3(e)是本公开实施例提供的采用RAM寻址时复合标量指令示例图；

图4是本公开实施例提供的支持复合标量指令的运算方法流程图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本公开作进一步的详细说明。

实施例1

图1是本公开实施例提供的支持复合标量指令装置的结构示意图，如图1所示，装置包括控制器模块110、存储模块120、运算器模块130和输入输出模块140。

控制器模块110，用于从存储模块读取指令并存储于本地的指令队列中，再将指令队列中的指令译码为控制信号以控制存储模块、运算器模块和输入输出模块的行为。

存储模块120，包括寄存器堆、RAM和ROM等存储器件，用于保存指令、操作数等不同数据。操作数包括浮点数据和定点数据，存储器模块将浮点数据和定点数据存储于不同的地址所对应的空间，如不同的RAM地址或不同的寄存器号，从而可以通过地址和寄存器号来判断读取的数据是浮点数还是定点数。

运算器模块130，可以对浮点数据和定点数据进行四则运算、逻辑运算、移位操作和求补运算等操作，其中，四则运算包括加、减、乘和除四种运算操作；逻辑运算包括与、或、非和异或四种运算操作。运算器模块接收控制器模块的控制信号后，可以通过读取操作数所在的地址或寄存器号来判断所读取的是浮点类型的数据还是定点类型的数据，运算器模块从存储模块读取操作数据并进行对应的运算，运算的中间结果存在存储模块中，将最终运算结果存储至输入输出模块。

输入输出模块140，可以用于输入输出数据的存储和传输，在初始化时，输入输出模块将初始的输入数据和编译好的复合标量指令存储至存储模块中，运算结束后，接收运算器模块传输的最终运算结果，此外，输入输出模块还可以从存储器中读取编译指令所需的信息，以供计算机编译器将程序编译为各种指令。

由此可见，本公开实施例1提供的支持复合标量指令的装置，为复合标量指令提供了高效的执行环境。

图2(a)和(b)是本公开实施例提供的一种存储模块组织形式示例图。存储模块将浮点数据和定点数据存储于不同的地址所对应的空间，如不同的地址或不同的寄存器号，从而可以通过地址和寄存器号来判断读取的数据是浮点数还是定点数。

在本实施例中，本公开使用由起始地址为0000H，终止地址为3FFFH的RAM和16个寄存器组成的寄存器堆所构成的存储模块为例，展示如何将浮点数的存储与定点数的存储分离。如图2(a)所示，在RAM中，定点数据只存储在地址为0000H到1FFFH的RAM单元中，而浮点数据只存储在2000H到3FFFH的RAM单元中，指令可以存储在任意RAM单元中，也可以将指令集中不变的信息存储在ROM中。如图2(b)所示，在寄存器堆中，定点数据只存在0至7号寄存器中，浮点数据只存在8到15号寄存器中。当寄存器里存储的值为RAM地址时，0至7号寄存器用于存储定点数据的RAM地址，8至15号寄存器用于存储浮点数据的RAM地址。

实施例2

图3(a)是本公开实施例所提供的复合标量指令示例图。如图3(a)所示，每一条指令拥有操作码域、操作数地址域(或立即数)和目标地址域，操作码域包括操作码，操作数地址域包括源操作数地址1和源操作数地址2，表示各源操作数的存储地址，目标地址域为操作数运算结果的存储地址：

操作码域用于区分不同类型的操作，如加法、减法、乘法和除法等，但不用于区分操作数的类型。

操作数地址域中可能包含RAM地址、寄存器号和立即数。存储浮点数据和定点数据所用的RAM地址和寄存器号不同，因而能用地址域来区分浮点操作数和定点操作数。当操作数地址域所储存的是立即数时，还需要一个运算器模块可识别的数据类型标志位来区分浮点操作数和定点操作数。

目标地址域可以是RAM地址，也可以是寄存器号。该地址域应与操作数类型相对应，即将浮点操作数的运算结果存入浮点数据对应的存储单元；将定点操作数的运算结果存入定点数据对应的存储单元。

由此可见，本公开提供的复合标量指令，是一种将浮点指令和定点指令统一起来的指令，在较大程度上统一了浮点指令和定点指令，在译码阶段不对指令的类型做区分，在具体计算时才根据操作数地址域中的读取操作数的地址来确定操作数是浮点数据还是定点数据，简化了指令的译码逻辑，也使得指令集变得更为精简。

另外，针对本公开提供的复合标量指令，若采用多种寻址方式，则还需增加确定寻址方式的标志位。

例如，采用图2所示的存储模块组织结构，加法指令的操作码为0001，采用多种寻址方式时，复合标量指令的组成如下述图3(b)至图3(e)所示：

图3(b)是本公开实施例提供的采用寄存器寻址时复合标量指令示例图，如图3(b)所示，当采用寄存器寻址时，寻址方式标志位为01，源操作数1和源操作数2分别存在源操作数1寄存器号和源操作数2寄存器号所对应的寄存器中，编号0至7的寄存器中存储的是定点数据，编号8至15的寄存器中存储的是浮点数据；

图3(c)是本公开实施例提供的采用寄存器间接寻址时复合标量指令示例图，如图3(c)所示，当采用寄存器间接寻址时，寻址方式标志位为10，源操作数1和源操作数2在RAM中的地址分别存在源操作数1寄存器号和源操作数2寄存器号所对应的寄存器中，其中定点数据的RAM地址(0000H至1FFFH)存于0至7号寄存器中；浮点数据的RAM地址(2000H至3FFFH)存于8至15号寄存器中。目标地址域存储目标寄存器号或者目标RAM地址。定点数据存于地址在0000H至1FFFH范围内的RAM单元中；浮点数据存于地址在2000H至3FFFH范围内的RAM单元中。

图3(d)是本公开实施例提供的采用立即数寻址时复合标量指令示例图，如图3(d)所示，若操作数地址域的数据为两个立即数，则寻址方式标志位为00，在寻址方式标志位和操作数地址域之间还设置有数据类型标志位，当立即数为定点类型时，该数据类型标志位为0；当立即数为浮点类型时，该数据类型标志位为1。

图3(e)是本公开实施例提供的采用RAM寻址时复合标量指令示例图，如图3(e)所示，若操作数地址域为RAM地址，则寻址方式标志位为11。源操作数1和源操作数2分别存在RAM地址对应的RAM单元中。其中，定点数据存在RAM地址0000H至1FFFH对应的RAM单元中；浮点数据存在RAM地址2000H至3FFFH对应的RAM单元中。

在采用以上各寻址方式的相关指令中，目标地址域存储目标寄存器号或者目标RAM地址。定点数据存于0至7号寄存器或者地址在0000H至1FFFH范围内的RAM单元中；浮点数据存于8至15号寄存器或者地址在2000H至3FFFH范围内的RAM单元中。

实施例3

图4是本公开实施例提供的支持复合标量指令的运算方法流程图，如图4所示，本公开实施例提供一种支持复合标量指令的运算方法，利用上述支持复合标量指令装置进行数据运算，具体包括以下步骤：

S1：将不同类型的数据存储于不同的地址内。

存储器模块将浮点数据和定点数据存储于不同的地址所对应的空间，如不同的RAM地址或不同的寄存器号。

S2：将复合标量指令译码为控制信号。

控制器模块向存储模块发送输入输出(IO)指令，从存储模块中读取复合标量指令，并存入本地指令队列。控制器模块从本地指令队列中读取复合标量指令，并译码为控制信号。

S3：根据控制信号读取操作数据，并根据读取操作数据的地址判断操作数据的类型，对操作数据进行运算。

运算器模块收到来自控制器模块的控制信号后，可以通过读取操作数地址域来判断所读取的是浮点类型的数据还是定点类型的数据。若操作数是立即数，则根据数据类型标志位判断操作数类型并计算；若操作数来自RAM或寄存器，则根据RAM地址或寄存器号来判断操作数类型，从存储模块读取操作数并进行对应的运算。

S4：将运算结果存储于对应类型的地址内。

控制器模块向运算器模块发送IO指令，运算器模块将运算结果传输至存储模块或输入输出模块。

从上述实施例3可以看出，本公开提供的复合标量指令的执行方法，能够准确高效地执行复合标量指令。

以上所述的具体实施例，对本公开的目的、技术方案和有益效果进行了进一步详细说明，应理解的是，以上所述仅为本公开的具体实施例而已，并不用于限制本公开，凡在本公开的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

1.一种支持复合标量指令的装置，其特征在于，包括控制器模块、存储模块和运算器模块，其中：

2.如权利要求1所述的支持复合标量指令的装置，其特征在于，

所述数据包括初始数据和中间数据；

所述装置还包括输入输出模块，所述输入输出模块将所述初始数据和复合标量指令传输给所述存储模块；

所述运算器模块将运算的中间结果存储至存储模块，将最终结果传输给所述输入输出模块。

3.如权利要求1或2所述的支持复合标量指令的装置，其特征在于，所述复合标量指令是将浮点指令和定点指令统一起来的指令，包括操作码域、操作数地址域和目的地址域，在译码时不区分指令类型，在运算时根据操作数地址域中的地址来确定数据类型；

4.如权利要求1-3任一项所述的支持复合标量指令的装置，其特征在于，

所述不同类型的数据包括浮点数据和定点数据；

所述存储模块包括寄存器堆、RAM和/或ROM；

所述不同的地址包括不同的RAM地址和/或不同的寄存器号。

5.如权利要求4所述的支持复合标量指令的装置，其特征在于，所述运算器模块通过读取数据所用的RAM地址或寄存器号来判断所读取的数据为浮点数据或定点数据。

6.一种复合标量指令，其特征在于，包括操作码域、操作数地址域和目的地址域；

7.如权利要求6所述的复合标量指令，其特征在于，

所述操作数地址域包括RAM地址、寄存器号或立即数；

所述目的地址域包括RAM地址或寄存器号。

8.如权利要求6或7所述的复合标量指令，其特征在于，当操作数地址域所储存的是立即数时，所述复合标量指令还包括数据类型标志位，以区分浮点数据和定点数据。

9.如权利要求6至8任一项所述的复合标量指令，其特征在于，

读取数据采用多种寻址方式时，所述复合标量指令还包括寻址方式标志位；

所述多种寻址方式包括寄存器寻址、寄存器间接寻址、RAM寻址和立即数寻址。

10.一种复合标量指令的执行方法，其特征在于，包括以下步骤：

S1：将不同类型的数据存储于不同的地址内；

S2：将复合标量指令译码为控制信号；

S4：将运算结果存储于对应类型的地址内。