CN108733352B

CN108733352B - 支持向量排序的装置、方法及应用

Info

Publication number: CN108733352B
Application number: CN201710279834.4A
Authority: CN
Inventors: 不公告发明人
Original assignee: Shanghai Cambricon Information Technology Co Ltd
Current assignee: Shanghai Cambricon Information Technology Co Ltd
Priority date: 2017-04-25
Filing date: 2017-04-25
Publication date: 2021-06-11
Anticipated expiration: 2037-04-25
Also published as: CN108733352A

Abstract

本公开涉及支持向量排序的装置、方法和应用，其中装置包括数据存储单元、运算模块、控制单元和数据输出单元，其中，数据存储单元，用于存储向量排序指令、待排序的数据向量以及排序向量的中间结果；控制单元，获取所述向量排序指令；运算模块，用于将待排序的数据向量或排序向量的中间结构排序为由小到大的向量或由大到小的向量，排序运算所采用的方法可以配置；数据输出单元，用于存储排序后的向量。

Description

支持向量排序的装置、方法及应用

技术领域

本公开涉及向量运算领域，更具体地涉及支持向量排序指令的装置、和方法，以及相应装置的应用。

背景技术

向量排序，作为一种基本的运算类型，广泛应用于各种领域。例如，在数据库中，根据某一属性值进行排序；在人工神经网络对样本进行分类预测时，根据样本属于各分类的概率求解前k最大概率对应的类型时，需要计算出的各个分类概率进行排序，挑选出前k大的概率对应的类型。

传统的向量排序方法是在通用处理器上通过特定的算法进行运算，可以采用的方式大致有冒泡排序、选择排序、快速排序、归并排序和二分排序。采用软件方式在通用处理器上进行排序过程中，相关操作串行执行，很难利用排序算法的可并行性，运算速度较慢，同时，向量排序算法会被分成译码成一系列的指令序列，译码的开销也很大。

公开内容

有鉴于此，本公开的目的在于，提供一种支持向量排序指令的装置、方法及应用，以解决以上所述的至少一项技术问题。

根据本公开的一方面，提供一种支持向量排序的装置，包括数据存储单元、运算模块、控制单元和数据输出单元，其中，

数据存储单元，用于存储向量排序指令、待排序的数据向量以及排序向量的中间结果；

控制单元，获取所述向量排序指令，并向运算模块输入进行运算的微指令，并控制运算模块将运算结果写入到数据输出单元中；

运算模块，用于根据微指令设置排序规则，将待排序的数据向量或排序向量的中间结构排序为由小到大的向量或由大到小的向量，形成与待排序的数据向量等长度的排序后的向量；

数据输出单元，用于存储排序后的向量。

根据本公开另一方面，提供一种步骤1，控制单元3从数据存储单元1中获取所要执行的指令，单元根据指令的操作码判断指令的类型，若指令为排序指令，转到步骤5，否则，转到步骤2执行；

步骤2，控制单元3控制运算模块2从数据存储单元1中获取执行操作所需的源数据，并将其送入到第二运算子模块22；

步骤3，控制单元3控制第二运算子模块22根据指令内容完成相应的运算，获取运算结果；

步骤4，控制单元3控制第二运算子模块22将运算结果根据指令中目的操作数的地址写入到数据输出单元4中，运算终止；

步骤5，控制单元3根据向量排序的类型、待排序向量的长度，排序指令的源操作数源地址、目的操作数地址，生成向量排序所需要的微指令，并将微指令送至运算模块2；

步骤6，运算模块2从数据存储单元1中获取待排序向量或排序中间结果，根据微指令对待排序向量或排序中间结果进行排序操作；若排序得到的为中间结果，则将中间结果写回到数据存储单元1原地址处，重复执行步骤6；否则，排序得到的为最后结果，将排序后的结果根据排序指令提供的目的操作数地址写回到数据输出单元4中，操作结束。

根据本公开的再一方面，提供一种使用以上装置进行神经网络运算的方法，其中所述待排序的数据向量为预处理阶段测试数据特征矩阵对应的特征值向量和分类结果的概率向量。

本公开的装置可以通过冒泡排序、选择排序、快速排序、归并排序、二分排序等排序方法进行向量排序。其中本装置可以实现向量运算，可以充分利用排序方法的可并行性，该装置支持的向量排序指令中存在向量长度域用于指明待排序向量的长度，待排序向量的长度可变，排序方法可以配置。

附图说明

图1示意性示出了本公开实施例的向量排序指令的格式；

图2示意性示出了本公开实施例的支持向量排序指令的装置的整体结构；

图3示意性示出了本公开实施例的向量排序运算的流程图。

图4示意性示出了本公开实施例的向量归并排序运算的流程图。

图5示意性示出了本公开实施例的通过指令配置的方式动态选择排序方法完成向量排序运算的流程图。

图6示意性示出了本公开实施例的支持向量排序指令的装置的归并排序部分的第一运算子模块的结构示意图；

图7示意性示出了本公开实施例的数据归并单元的结构示意图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本公开作进一步的详细说明。

在本说明书中，下述用于描述本公开原理的各种实施例只是说明，不应该以任何方式解释为限制公开的范围。参照附图的下述描述用于帮助全面理解由权利要求及其等同物限定的本公开的示例性实施例。下述描述包括多种具体细节来帮助理解，但这些细节应认为仅仅是示例性的。因此，本领域普通技术人员应认识到，在不背离本公开的范围和精神的情况下，可以对本文中描述的实施例进行多种改变和修改。此外，为了清楚和简洁起见，省略了公知功能和结构的描述。此外，贯穿附图，相同参考数字用于相似功能和操作。

根据本公开的基本构思，提供一种支持向量排序指令的装置，该装置可以完成向量排序功能。其中本装置可以实现向量运算，可以充分利用排序方法的可并行性。该装置支持的向量排序指令中存在向量长度域用于指明待排序向量的长度，待排序向量的长度可变。

图1示意性示出了本公开实施例的向量排序指令的格式，其中可包括:

操作码OP，长度为k位，内容为b₁b₂…b_k,用于指明该指令所做的操作为向量排序操作，若指令的前k位不与b₁b₂…b_k一致，则表明指令表示其他运算操作；

向量地址SRC，长度为q位，当操作码为b₁b₂…b_k时，表示待排序向量在数据存储单元中的地址；

向量地址DST，长度为q位，当操作码为b₁b₂…b_k时，表示排序后的向量在数据输出单元中的地址；

向量长度LEN,长度为r位，当操作码为b₁b₂…b_k时，表示待排序向量的长度；

排序类型，长度为1或多位，当操作码为b₁b₂…b_k时，若排序类型的最高位为0，表示由小到大进行排序。若排序类型的最高位为1，表示由大到小进行排序。若排序类型域的长度为m(m>1)位，排序类型的低m-1位指明排序指令所采用的排序方法。

图2示意性示出了本公开实施例的支持向量排序指令的装置的整体结构。其中包括：

数据存储单元1，用于向控制单元3提供运算指令和向运算模块2提供运算操作的源操作数。如果进行的运算为非向量排序指令，则数据存储单元1将源操作数提供给运算模块2的第二运算子模块22，如果进行的运算为向量排序指令，则数据存储单元1将根据控制传递的信号将指定地址长度的源操作数提供给向量排序子模块21，并存储向量排序子模块21运算后的中间结果，再将存储的中间结果提供给第一运算子模块21，循环多次，直到第一运算子模块21运算得到已排序的向量。

运算模块2，用于根据控制单元3发出的信号从数据存储单元1中读取源操作数，并执行相应的运算，将运算结果写入到数据输出单元4中。其中运算模块2由向量排序子模块21和第二运算子模块22两部分构成。若由控制单元3发出的运算信号为非向量排序信号，则由第二运算子模块22完成相应的运算，并将运算结果写入到数据输出单元4中。若有控制单元3发出的运算信号为向量排序信号，则向量排序子模块21根据控制单元3发出的微指令进行向量排序运算。排序过程中，向量排序子模块21根据设置的输入数据地址和长度从数据存储单元1中读取原始数据向量或者排序得到的中间结果，若排序运算得到的是中间结果，写回到数据存储单元1中，若排序运算得到的是最终结果，则将数据向量写入到数据输出单元4中。

可选的，向量排序子模块21可以完成向量归并排序。可选的，向量排序子模块21可以通过指令配置的方式动态选择排序方法完成向量排序运算。

控制单元3，用于从数据存储单元1中读取运算操作指令，并根据指令中的操作码，生成对应的微指令，发送给运算模块2进行相关运算。控制单元3判断待执行指令为是否为排序指令，若待执行指令为非排序指令，根据指令中的源操作数、向量长度等信息控制运算模块2从数据存储单元1中读取源操作数，通过其它运算子模块22运算得到结果，并将结果写入数据输出单元4的目的操作数地址dst处。若待执行指令为排序指令，则根据排序指令的源操作数地址和长度控制向量排序子模块21从数据存储单元1中读取源操作数，完成向量排序运算以及将中间运算结果写回到数据存储单元1中或将最终结果写入输出单元4中。

可选的，还包括数据输出单元4，用于接收运算模块2运算得到的结果。运算模块2运算得到的结果会根据指令中目的操作数地址dst写入到数据输出单元4中的dst处。

图3示意性示出了本公开实施例的向量排序运算的流程图，方法包括：

步骤1，控制单元3从数据存储单元1中获取所要执行的指令，单元根据指令的操作码判断指令的类型，若指令为排序指令，转到步骤5，否则，转到步骤2执行；

步骤4，控制单元3控制第二运算子模块22将运算结果根据指令中目的操作数的地址写入到数据输出单元4中，运算终止。

步骤5，控制单元3根据向量排序的类型、待排序向量的长度，排序指令的源操作数源地址、目的操作数地址，生成向量排序所需要的微指令，并将微指令送至运算模块2。

步骤6，运算模块2从数据存储单元1中获取待排序向量或排序中间结果，根据微指令对待排序向量或排序中间结果进行排序操作。若排序得到的为中间结果，则将中间结果写回到数据存储单元1原地址处，重复执行步骤6；否则，排序得到的为最后结果，将排序后的结果根据排序指令提供的目的操作数地址写回到数据输出单元4中，操作结束。

可选的，向量排序子模块21可以完成向量归并排序。

图4示意性示出了本公开实施例的向量归并排序运算的流程图。对应的操作流程如下:

步骤5，控制单元3根据向量排序指令中的排序类型设置运算模块的第一运算子模块21中向量归并单元的归并方式，初始化归并次数i为1；

步骤6，在第i次归并待排序向量或中间结果时，控制单元3根据排序指令提供的源操作数地址从数据存储单元1中获取待排序向量或排序中间结果，将待排序向量或排序中间结果按顺序分成

份,除最后一份外，每个向量长度为2^i-1，其中m和n分别为待排序向量的长度和向量归并单元的数量，按顺序编号

然后，将编号为2*j-1、2*j(j>0)的向量分配给第((j-1)mod n)+1个向量归并单元进行处理，若归并次数

则将归并次数加一，并将处理后的排序中间结果写回到数据存储单元1原地址中，若归并次数

只存在分配后的两份待排序向量，经第一个向量归并单元归并后，得到的向量为已排序向量，控制单元3控制第一运算子模块21将排序后的结果根据排序指令提供的目的操作数地址写入到数据输出单元4中，操作结束。

可选的，向量排序子模块21可以通过指令配置的方式动态选择排序方法完成向量排序运算。

图5示意性示出了本公开实施例的通过指令配置的方式动态选择排序方法完成向量排序运算的流程图。对应的操作流程如下:

步骤5，控制单元3根据排序指令中的排序类型域选择对运算模块数据向量进行排序操作所采用的方法，包括但不局限于冒泡排序、选择排序、快速排序、归并排序、二分排序等；

步骤6，控制单元3根据向量排序的类型、待排序向量的长度，排序指令的源操作数源地址、目的操作数地址，生成向量排序所需要的微指令，并将微指令送至运算模块2。

步骤7，运算模块2从数据存储单元1中获取待排序向量或排序中间结果，根据微指令对待排序向量或排序中间结果进行排序操作。若排序得到的为中间结果，则将中间结果写回到数据存储单元1原地址处，重复执行步骤7；否则，排序得到的为最后结果，将排序后的结果根据排序指令提供的目的操作数地址写回到数据输出单元4中，操作结束。

图7示意性示出了本公开实施例的数据归并单元的结构示意图；

如图所示，数据归并单元中包括控制信号CTRL，输入向量D_1和D_2，输出数据为OUT。其中，CTRL用于设置数据归并单元的操作类型和指明输入向量D_1和D_2的长度len_1和len_2，可选类型为0和1，类型0表示数据归并单元根据向量由小到大的顺序进行归并，类型1表示数据归并单元根据向量由大到小的顺序进行归并，若其中一个输入向量的长度为0时，则直接输出另一个向量。比如，当向量D_1和D_2且操作类型为0分别为2、4、6、8和3、3、5、9时，归并的过程如下：

步骤1：

D_1：2 4 6 7 len_1:4

D_2：3 3 8 9 len_2:4

输出向量：2

步骤2：

D_1：4 6 7 len_1:3

D_2：3 3 8 9 len_2:4

输出向量：2 3

步骤3：

D_1：4 6 7 len_1:3

D_2：3 8 9 len_2:3

输出向量：2 3 3

步骤4：

D_1：4 6 7 len_1:3

D_2：8 9 len_2:2

输出向量：2 3 3 4

步骤5：

D_1：6 7 len_1:2

D_2：8 9 len_2:2

输出向量：2 3 3 4 6

步骤6：

D_1：7 len_1:1

D_2：8 9 len_2:2

输出向量：2 3 3 4 6 7

步骤7：

D_1： len_1:0

D_2：8 9 len_2:2

输出向量：2 3 3 4 6 7 8 9

向量归并结束。

对于向量排序指令(sort_op,src,dst,9,0)，假设数据存储单元1地址src开始，连续存放的9个数据分别为9、1、5、3、4、2、6、8、7，向量归并单元数量为2。根据排序类型的最高位，进行由小到大的排序，根据排序类型的低m-1位全0，进行排序的类型为归并排序。在运算过程，每次每个向量归并单元对应输入的向量、地址以及输出地址如下所示：

第一次合并：

合并后的向量为1 9 3 5 2 4 6 8 7；

第二次合并：

合并后的向量为1 3 5 9 2 4 6 8 7；

第三次合并：

合并后的向量为：1 2 3 4 5 6 7 8 7

第四次合并：

合并后的向量为：1 2 3 4 5 6 7 7 8，并将其送入到数据输出单元4中。

各功能单元/模块都可以是硬件，比如该硬件可以是电路，包括数字电路，模拟电路等等。硬件结构的物理实现包括但不局限于物理器件，物理器件包括但不局限于晶体管，忆阻器等等。所述计算装置中的计算模块可以是任何适当的硬件处理器，比如CPU、GPU、FPGA、DSP和ASIC等等。所述存储单元可以是任何适当的磁存储介质或者磁光存储介质，比如RRAM，DRAM，SRAM，EDRAM,HBM,HMC等等。

以上所述的具体实施例，对本公开的目的、技术方案和有益效果进行了进一步详细说明，应理解的是，以上所述仅为本公开的具体实施例而已，并不用于限制本公开，凡在本公开的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

1.一种支持向量排序的装置，包括数据存储单元、运算模块、控制单元和数据输出单元，其中，

数据存储单元，用于存储运算指令、待排序的数据向量以及排序向量的中间结果，其中，所述运算指令包括：操作码OP、向量地址SRC、向量地址DST、向量长度LEN和排序类型；

控制单元，获取所述运算指令，根据所述操作码OP判断所述运算指令是否为向量排序指令，若是，根据所述向量排序指令的排序类型、向量长度LEN、向量地址SRC、向量地址DST生成向量排序所需要的微指令，并向运算模块输入进行运算的微指令，并控制运算模块将运算结果写入到数据输出单元中；

运算模块，用于根据微指令设置排序规则，所述运算模块的多个运算子模块并发执行，若排序得到的为中间结果，则将中间结果写回所述向量地址SRC，继续进行排序操作，将待排序的数据向量或排序向量的中间结果排序为由小到大的向量或由大到小的向量，形成与待排序向量等向量长度LEN的排序后的向量，并将排序后的结果根据排序指令提供的向量地址DST写入到数据输出单元；

数据输出单元，用于存储排序后的向量；

所述排序类型域的长度为m(m>1)位时，排序类型的低m-1位指明排序指令所采用的排序方法。

2.根据权利要求1所述的装置，其特征在于，还包括：

数据输出单元，用于接收并输出排序后的向量。

3.根据权利要求1所述的装置，其特征在于，所述排序规则包括冒泡排序、选择排序、快速排序、归并排序和/或二分排序规则。

4.根据权利要求3所述的装置，其特征在于，所述排序规则为归并排序规则。

5.根据权利要求4所述的装置，其特征在于，所述运算模块包括由n个向量归并单元构成的第一运算子模块，其中，n为大于等于2的自然数，第一运算子模块每次从数据存储单元中读取不大于2n个已经归并的子向量或者有序子向量，然后进行归并，转存入数据存储单元中，直到已经归并的子向量的长度等于待排序的数据向量长度，形成排序后的向量。

6.根据权利要求1-4任一所述的装置，其特征在于，所述运算模块还包括进行非向量排序的第二运算子模块，第二运算子模块用以完成除向量排序外的运算操作。

7.根据权利要求1所述的装置，其特征在于：

所述操作码OP长度为k位，内容为b₁b₂…b_k，用于指明该指令所做的操作为向量排序操作，若指令的前k位不与b₁b₂…b_k一致，则表明指令表示其他运算操作。

8.根据权利要求1所述的装置，其特征在于：

所述向量地址SRC长度为q位，当操作码为b₁b₂…b_k时，表示待排序向量在数据存储单元中的地址。

9.根据权利要求1所述的装置，其特征在于：

所述向量地址DST长度为q位，当操作码为b₁b₂…b_k时，表示排序后的向量在数据输出单元中的地址。

10.根据权利要求1所述的装置，其特征在于：

所述向量长度LEN长度为r位，当操作码为b₁b₂…b_k时，表示待排序向量的长度。

11.根据权利要求1所述的装置，其特征在于：

所述排序类型长度为1或多位，当操作码为b₁b₂…b_k时，若排序类型的最高位为0，表示由小到大进行排序；若排序类型的最高位为1，表示由大到小进行排序。

12.一种应用权利要求1-11任一所述装置进行向量排序方法，其特征在于包括：

通过数据存储单元存储运算指令，待排序的数据向量以及排序向量的中间结果，所述运算指令包括：操作码OP、向量地址SRC、向量地址DST、向量长度LEN和排序类型；

通过控制单元获取所述运算指令，根据所述操作码OP判断所述运算指令是否为向量排序指令，若是，根据所述向量排序指令的排序类型、向量长度LEN、向量地址SRC、向量地址DST生成向量排序所需要的微指令，并向运算模块输入进行运算的微指令，并控制运算模块将运算结果写入到数据输出单元中；

通过运算模块，根据微指令设置排序规则，所述运算模块的多个运算子模块并发执行，若排序得到的为中间结果，则将中间结果写回所述向量地址SRC，继续进行排序操作，将待排序的数据向量或排序向量的中间结构排序为由小到大的向量或由大到小的向量，形成与待排序向量等向量长度LEN的排序后的向量，并将排序后的结果根据排序指令提供的向量地址DST写入到数据输出单元；

13.根据权利要求12所述的方法，其特征在于，还包括：

通过数据输出单元接收并输出排序后的向量。

14.根据权利要求12所述的方法，其特征在于，所述排序规则包括冒泡排序、选择排序、快速排序、归并排序和/或二分排序规则。

15.根据权利要求14所述的方法，其特征在于，所述排序规则为归并排序规则。

16.根据权利要求12所述的方法，其特征在于：

17.根据权利要求12所述的方法，其特征在于：

18.根据权利要求12所述的方法，其特征在于：

19.根据权利要求12所述的方法，其特征在于：

20.根据权利要求19所述的方法，其特征在于：

21.一种向量排序方法，其特征在于包括：

控制单元从数据存储单元中获取所要执行的指令，控制单元根据指令的操作码判断指令的类型，其中，所述指令包括：操作码、排序指令的源操作数源地址、目的操作数地址、待排序向量的长度和排序的类型；

若控制单元根据指令的操作码判断指令的类型为非排序指令，控制单元控制运算模块从数据存储单元中获取执行操作所需的源数据，并将其送入到第二运算子模块；

控制单元控制第二运算子模块根据指令内容完成相应的运算，获取运算结果；

控制单元控制第二运算子模块将运算结果根据指令中目的操作数的地址写入到数据输出单元中，运算终止；

若控制单元根据指令的操作码判断指令的类型为排序指令，控制单元根据向量排序的类型、待排序向量的长度，排序指令的源操作数源地址、目的操作数地址，生成向量排序所需要的微指令，并将微指令送至运算模块；

运算模块从数据存储单元中获取待排序向量或排序中间结果，根据微指令对待排序向量或排序中间结果进行排序操作；若排序得到的为中间结果，则将中间结果写回到数据存储单元原地址处，继续进行排序操作；否则，排序得到的为最后结果，将排序后的结果根据排序指令提供的目的操作数地址写回到数据输出单元中，操作结束；所述运算模块的多个运算子模块并发执行；

22.根据权利要求21所述的方法，其特征在于，所述向量排序的类型为归并排序。

23.根据权利要求22所述的方法，其特征在于，运算模块从数据存储单元中获取待排序向量或排序中间结果，根据微指令对待排序向量或排序中间结果进行排序操作，具体为：

初始化归并次数i为1；

通过多个向量归并单元进行计算，设定