WO2023104143A1

WO2023104143A1 - 向量混洗方法、处理器及电子设备

Info

Publication number: WO2023104143A1
Application number: PCT/CN2022/137500
Authority: WO
Inventors: 汪文祥
Original assignee: 龙芯中科技术股份有限公司
Priority date: 2021-12-10
Filing date: 2022-12-08
Publication date: 2023-06-15
Also published as: CN114297138B; CA3240618A1; CN114297138A

Abstract

本申请提供一种向量混洗方法、处理器及电子设备。方法包括：接收指令，指令包括：寄存器标识和混洗参数；寄存器标识包括源寄存器标识和目的寄存器标识；源寄存器标识用于表征源寄存器，源寄存器为存储执行向量混洗操作时被操作的源元素的寄存器；目的寄存器标识用于表征目的寄存器，目的寄存器为存储执行向量混洗操作后得到的目标元素的寄存器；混洗参数用于指示对源元素执行向量混洗操作时所依据的参数；执行指令，以根据混洗参数对从源寄存器获取的源元素执行向量混洗操作，并获取向量混洗操作后的目标元素；将目标元素写入目的寄存器。本申请能够通过一条指令，实现特定功能的向量混洗操作，提高了特定功能的执行效率。

Description

向量混洗方法、处理器及电子设备

本申请要求于2021年12月10日提交中国专利局、申请号为202111508098.8、申请名称为“向量混洗方法、处理器及电子设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，特别是涉及一种向量混洗方法、处理器及电子设备。

背景技术

随着多媒体应用的发展，处理器越来越多的计算任务都来自于数字图像处理领域，基于图像的应用成为服务器、桌面计算机、个人移动设备也即嵌入式设备中不可忽视的工作负载。针对数字图像处理软件的实际情况，对指令集架构进行更新，在处理器中加入对应用中常用操作的指令支持，是处理器发展的一个主要方向，同时也是处理器针对特定应用提升性能的简单且有效的方法，因此越来越多的处理器中增加了单指令多数据流(Single Instruction Multiple Data，SIMD)结构，以支持规则数据集合上的同种操作。

目前，SIMD处理器中普遍引入了混洗指令，不同的混洗指令能够满足不同的需求，而在现有技术方案中，在实现特定功能的向量混洗操作时，需要多条指令实现一系列的操作，操作方式较为复杂，且降低了特定功能的执行效率。

发明内容

本申请提供了一种向量混洗方法、处理器及电子设备，以解决现有技术中需要多条指令实现一系列操作，操作方式较为复杂，降低了特定功能的执行效率的问题。

为了解决上述问题，本申请公开了一种向量混洗方法，所述方法包括：

接收指令，所述指令包括：寄存器标识和混洗参数；其中，所述寄存器标识包括源寄存器标识和目的寄存器标识；所述源寄存器标识用于表征源寄存器，所述源寄存器为存储执行向量混洗操作时被操作的源元素的寄存器；所述目的寄存器标识用于表征目的寄存器，所述目的寄存器为存储执行所述向量混洗操作后得到的目标元素的寄存器；所述混洗参数用于指示对所述源元素执行向量混洗操作时所依据的参数；

执行所述指令，以根据所述混洗参数对从所述源寄存器获取的源元素执行向量混洗操作，并获取所述向量混洗操作后的目标元素；

将所述目标元素写入所述目的寄存器。

为了解决上述问题，本申请公开了一种处理器，包括：

多个向量寄存器，所述多个向量寄存器包括源寄存器与目标寄存器，源寄存器用于存储数据元素；

译码单元，用于译码向量混洗指令；其中，所述向量混洗指令包括：寄存器标识和混洗参数，所述寄存器标识包括源寄存器标识和目的寄存器标识；

执行单元，响应于所述向量混洗指令，根据所述混洗参数对从所述源寄存器获取的源元素执行向量混洗操作，并获取所述向量混洗操作后的目标元素，并将所述目标元素写入所述目的寄存器。

为了解决上述问题，本申请公开了一种电子设备，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行上述一个或多个所述的向量混洗方法。

与现有技术相比，本申请包括以下优点：

本申请实施例提供的向量混洗方法、处理器及电子设备，通过在指令中添加寄存器标识和混洗参数，结合混洗参数可以对源寄存器内获取的元素执行向量混洗操作，因此，通过一条指令即可实现特定功能的向量混洗操作，无需通过多条执行混洗操作的指令实现特定功能，提高了特定功能的执行效率。

附图说明

图1为本申请实施例一提供的一种向量混洗方法的步骤流程图；

图2为本申请实施例二提供的一种向量混洗方法的步骤流程图；

图3为本申请实施例三提供的一种向量混洗方法的步骤流程图；

图4为本申请实施例四提供的一种向量混洗方法的步骤流程图；

图5为本申请实施例五提供的一种向量混洗方法的步骤流程图；

图6为本申请实施例六提供的一种向量混洗方法的步骤流程图；

图7为本申请实施例提供的一种处理器的结构框图；

图8为本申请实施例提供的一种电子设备的结构框图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请作进一步详细的说明。

本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体，而不必然意味着限定特定的顺序或先后次序，除非另外注明(Unless otherwise indicated)。应该理解这样使用的用语在适当情况下可以互换，例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。

虽然下面的实施例是参照一种处理器来描述的，但是其他实施例适用于其他类型的集成电路和逻辑设备。可以更容易地将本申请的上述技术和教导应用于其他类型的电路或半导体设备，它们会因更高的流水线吞吐率和改进的性能而受益。本申请的实施例适用于执行数据操纵的任何处理器或机器。但是，本申请不限于执行256位、128位、64位、32位或16位数据操作的处理器或机器，而是适用于在其中需要操作组合型数据的任何处理器和机器。

在下面的描述中，为了解释的目的，给出了大量具体细节，以提供对本申请的透彻理解。然而，本领域内的技术人员应该认识到这些具体细节对实时本申请来说并不是必需的。在其它情况下，没有详细地给出一些公知的电学结构和电路，以免不必要地混淆本申请。另外，下面的描述提供了多个示例，并且附图示出了各种示例以用于说明。然而，这些示例不应当被理解成限制性的，因为它们只是用来提供本申请的一些示例，而不是用来提供对本申请的所有可能实现的穷举。

虽然下面的例子描述了在执行单元的上下文中的指令处理和分发，但是本申请的其他实施例可以以软件的形式被实现。在一个实施例中，本申请的方法表现为机器可执行指令。所述指令可以被用于使得用这些指令编程的通用或专用处理器执行本申请的步骤。本申请的步骤可以由包含用于执行所述步骤的硬布线逻辑的专用硬件组件，或由被编程的计算机组件和定制硬件组件的任何组合来执行。这些软件可以存储在系统中的存储器内。

实施例一

参照图1，示出了本申请实施例提供的一种向量混洗方法的步骤流程图。

本申请实施例提供的向量混洗方法，其执行主体可以是CPU(Central Processing Unit，中央处理器)，包括以下步骤：

步骤101：接收指令，所述指令包括：寄存器标识和混洗参数。

本申请实施例中，指令是指用于执行向量混洗操作的指令，且该指令为供CPU执行的指令。

在执行向量混洗操作时，可以由CPU接收用于执行向量混洗操作的指令，在该指令中包含有寄存器标识和混洗参数。

其中，寄存器标识可以包括：源寄存器标识和目的寄存器标识，源寄存器标识用于表征源寄存器，该源寄存器为存储执行向量混洗操作时被操作的源元素的寄存器；该混洗操作执行时的被操作源元素可以为源寄存器中存储的所有数据，也可以为源寄存器中存储的部分数据。目的寄存器标识用于表征目的寄存器，该目的寄存器为存储执行向量混洗操作后得到的目标元素的寄存器。

在本示例中，源寄存器的数量可以为一个，也可以为两个，即源元素来源于一个或两个寄存器，具体地，对于源寄存器的数量可以根据业务需求而定，本申请实施例对此不加以限制。

混洗参数可以用于指示对源元素执行向量混洗操作时所依据的参数，在本示例中，混洗参数可以包括：索引值和操作码等参数；可选地，索引值通过立即数的方式呈现；操作码为通过二进制方式表示的代码，或者操作码为可以转换为二进制代码的标识符。

在接收到指令之后，执行步骤102。

步骤102：执行所述指令，以根据所述混洗参数对从所述源寄存器获取的源元素执行向量混洗操作，并获取所述向量混洗操作后的目标元素。

其中，目标元素是指在对源寄存器中的元素执行向量混洗操作之后得到的元素。

本申请实施例中，在CPU接收到用于执行向量混洗操作的指令之后，可以由CPU执行该指令，以根据混洗参数对从源寄存器获取的源元素执行向量混洗操作，并获取执行向量混洗操作后的目标元素。

步骤103：将所述目标元素写入所述目的寄存器。

本申请实施例中，在获取到向量混洗操作后的目标元素之后，可以将目标元素写入目的寄存器。

可选地，根据混洗参数获取源元素，以执行向量混洗操作，获取目标元素的方法包括：根据向量混洗操作所需要的源元素在源寄存器内的位置信息和所述向量混洗操作所需要的源元素数量，从源寄存器中选取源元素，以将选取的所有源元素作为目标元素，具体地，可以结合下述具体实现方式进行详细描述。

在本申请的一种具体实现方式中，上述步骤102可以包括：

子步骤A1：根据所述混洗参数，确定源元素在所述源寄存器中的位置信息和所述向量混洗操作所需要的源元素数量；其中，选取的所述源元素的数量为一个或多个。

本申请实施例中，混洗参数中包含可以用于指示源元素在源寄存器中的位置信息和源元素数量的参数。

在CPU接收到用于执行向量混洗操作的指令之后，可以对该指令进行解析，以解析得到指令中包含的混洗参数。

在解析得到指令中包含的混洗参数之后，可以根据混洗参数确定向量混洗操作所需要的源元素在源寄存器中的位置信息和所述向量混洗操作所需要的源元素数量，其中，选取的源元素的数量可以为一个，也可以为多个，在后续的示例中，以多个为例进行说明。

在根据混洗参数确定出源元素在源寄存器中的位置信息和源元素数量之后，执行子步骤A2。

子步骤A2：根据确定的所述位置信息和源元素数量，从所述源寄存器中选取源元素。

在根据混洗参数确定出源元素在源寄存器中的位置信息和源元素数量时，从源寄存器中选取源元素。

在根据确定的位置信息和源元素数量从源寄存器中选取源元素之后，执行子步骤A3。

子步骤A3：将所有所述选取的源元素确定为目标元素。

在根据确定的位置信息和源元素数量从源寄存器中选取源元素之后，可以将所有选取的源元素作为目标元素，以写入目的寄存器内。

在本申请实施例中，混洗参数可以包括索引值和操作码，通过索引值和操作码以选取源元素，具体地，可以结合下述具体实现方式进行详细描述。

可选地，所述索引值用于指示所述向量混洗操作所需要的每一个源元素在所述源寄存器中的位置信息；所述操作码用于表征对所述源寄存器和目的寄存器所进行的操作，上述子步骤A2可以包括：

子步骤B1：根据所述索引值和所述操作码，确定获取源元素的选取规则。

在本申请实施例中，选取规则是指用于从源寄存器内读取源元素的约束条件。

在获取到混洗参数之后，可以根据混洗参数中包含的索引值和操作码确定出从源寄存器获取源元素的选取规则。具体地，可以分为以下两种情况：

第一种情况、在索引值的数量与源元素的数量不相同时，可以根据索引值的数量确定对源元素进行分组的方式，并根据该分组的方式和操作码确定出获取源元素的选取规则，即先将源寄存器内源元素进行分组，如以N个相邻源元素为一组，然后按照索引值从分组元素内获取源元素的选取规则；通常情况下，N为四，当然，N也可以根据源寄存器的位数等具体应用场景来确定，在此不再赘述。

第二种情况、在索引值的数量与源元素的数量相同时，可以根据操作码确定出获取源元素的选取规则。

在根据索引值和操作码确定出获取源元素的选取规则之后，执行子步骤B2。

子步骤B2：从源寄存器中，按照所述选取规则，分别获取每个索引值所指示的源元素。

在根据索引值和操作码确定出获取源元素的选取规则之后，可以按照选取规则从源寄存器中分别获取每个索引值所指示的源元素。

在实际应用中，CPU通过向量混洗指令的操作码，即可确定索引值的数量与源元素的数量是否相同，即CPU根据操作码即可确定源元素的分组情况和选取规则。

可选地，索引值和目的寄存器中地址之间存在预设对应关系。可选地，将目标元素写入所述目的寄存器中所述立即数对应的位置，即为从目的寄存器中确定索引值对应的位置，将源元素依次存储在确定的位置上。具体地，任一源元素通过确定的索引值获取，将该源元素写入与该确定的索引值存在对应关系的目的寄存器中的地址上；示例性地，源元素A通过索引值ui8[1:0]获取(其中ui8代表立即数，该立即数ui8为表示一组数据的索引值，ui8[1:0]代表该立即数的最低2比特所构成的数)，而索引值ui8[1:0]对应目的寄存器中一组地址中的最低位地址，此时将获取地源元素A作为一个目标元素写入目的寄存器中最低位地址上。作为举例，立即数ui8为包括8比特的一组数据，利用立即数ui8构造4个索引值，ui8的每2比特所构成数作为一个索引值。而这些索引值在ui8中的位置或序号，则指示或暗示了由索引值所获取的源元素应当被搬移到目的寄存器的元素位置。例如，索引值ui8[7:6]是ui8中的第4个索引值，那么其对应的源操作数将被写入目的寄存器的第4个元素位置。类似地，当ui8[n:n-1]是ui8中的第(n+1)/2个索引值，那么其对应的源操作数将被写入目的寄存器的第n个元素位置。可以理解地，立即数中可包括其他数量的索引值，相应地立即数中的第i个索引值所对应的源操作数将被写入目的寄存器的第i个元素位置，i为正整数。

现有技术中，在实现SHUF指令(一种混洗指令)时，该一条混洗指令可以根据混洗模式的设置，得到不同功能的混洗效果；该混洗模式由应用需求决定，通常可以通过其他至少一条指令调用混洗模式，并将该混洗模式传输至上述混洗指令中，或者，可以将混洗模式添加至内存中，在上述混洗指令执行过程中，通过访问内存获取该混洗模式。由此可见，现有技术中需要多条指令或者访存的方式，实现不同混洗模式的混洗指令，无论是多条指令方式，还是访存的方式，都大大增加了混洗指令实现时整个CPU系统的开销；基于现有技术中存在的技术问题，本申请实施例中，通过在指令中增加混洗参数(操作码和索引值)，不同的混洗参数能够实现不同混洗模式的混洗指令，进而无需使用多条指令实现数据混洗，也无需通过访存获取混洗模式，使得通过一条混洗指令能够实现数据混洗操作，有效降低了系统开销。

由于索引值可以通过立即数来实现，操作码可以通过二进制方式表示的代码实现，或者操作码为可以转换为二进制代码的标识符实现，因此，结合实施例一中包含操作码和索引值的向量混洗指令的实现方法，通过以下具体实施例二至实施例六详细描述包含不同操作码的向量混洗指令的具体处理方式。

实施例二

在本申请的一种具体实现方式中，所述操作码为第一操作码，且所述索引值的数量与所述源元素的数量不同；如图2所示，向量混洗指令的处理方式可以包括：

步骤201：接收指令，所述指令包括：寄存器标识和混洗参数。

本申请实施例中，指令的含义和指令包含的参数如实施例一所述，在此不再赘述。

可选地，源寄存器的数量为一个，即源元素来自一个寄存器。

可选地，混洗参数包括索引值和操作码；其中，索引值通过立即数的形式实现；操作码通过可以转化为二进制代码的标识符的形式实现，且操作码为第一操作码。

可选地，指令格式为“操作码目的寄存器，源寄存器，立即数”。根据该指令格式，在具体实现中，指令可以表示为“[X]VS.{B/H/W}vd,vj,ui8”；[X]VS为第一操作码中的指令名称，[X]为可选项，用于区分不同位数的寄存器，{B/H/W}为第一操作码中的数据类型，B表示数据类型为字节，H表示数据类型为半字，W表示数据类型为字，[X]VS.{B/H/W}为标识符形式的第一操作码；vd表示目的寄存器，vj表示源寄存器，ui8表示立即数。示例性地，VS.{B/H/W}为可以转化为二进制形式的第一操作码，如将[X]VS.B转换为01110011100100二进制形式的第一操作码。此外，立即数可以为一组数据，如可以通过立即数ui8的不同位ui8[1:0]、ui8[3:2]、ui8[5:4]和ui8[7:6]表达针对寄存器中不同位置的索引值。

步骤202：执行所述指令，根据所述操作码和所述索引值，将所述源寄存器中每N1个相邻元素构成一组元素组；其中，所述元素的数据类型为字节、半字、字中的任一种，N1为大于0的正整数。

本申请实施例中，在索引值的数量与源元素的数量不相同时，可以将源寄存器中每N1个相邻元素构成一组元素组，该相邻元素的数据类型可以为字节、半字、字中的任一种，例如，可以将源寄存器内每四个相邻的字元素构成一组元素组等。其中，索引值的数量与源元素的数量不相同时，将源寄存器中每N1个相邻元素构成一组元素组，该相邻元素的数据类型可以为字节、半字、字中的任一种，从元素组中选择源元素，N1为大于0的正整数等多个条件确定为选取规则。例如，N1也是索引值的数量，从而即使索引值的数量少于源元素的数量，根据N1和源元素的数量差距，对源元素进行分组，使得索引值的数量等于每组内的源元素的数量，使得每个索引值同组内的源元素一一对应。

其中，相邻元素为源寄存器中位置依次相邻的元素，相邻多个元素组中的元素地址存在部分相同或者完全不同，该元素地址即为元素在寄存器中的位置信息。在相邻多个元素组之间存在相同位置信息的元素时，每两个相邻元素组之间相同位置信息元素的数量最大值为N1-1。进一步地，相邻元素为源寄存器中交叉相邻的元素。示例性地，当操作码为第一操作码时，数据类型为字节、半字或者字，假设源寄存器中包含八个元素，分别为元素A1、元素A2、元素A3、元素A4、元素A5、元素A6、元素A7、元素A8，上述元素的位置信息为按照示出顺序依次相邻，N1＝4；其中，N1个元素可以为依次相邻的元素，也可以为交叉相邻的元素；例如，当N1为四，假设源寄存器中包含八个元素，分别为元素A1、元素A2、元素A3、元素A4、元素A5、元素A6、元素A7、元素A8时，N1个元素可以为如元素A2～A5，也可以为元素A1、元素A3、元素A5、元素A7交叉相邻的元素。

基于上述实施例，将所述源寄存器中每N1个相邻元素构成一组元素组，包含两种情况：

第一种情况、将元素A1～A4构成一组元素组，将元素A5～A8构成另外一组元素组，两个元素组之间没有相同位置信息的元素；

第二种情况、将元素A1～A4构成一组元素组，将元素A2～A5构成另一组元素组，两个元素组之间有三个相同位置信息的元素(即为元素A2、元素A3和元素A4)。除此之外，还可以选择元素A3～A6作为另一组元素组、或者选择元素A4～A7作为另一组元素组；只要满足每两个相邻元素组之间相同位置信息的元素的数量最大值为N1-1，在此不再赘述。

可选地，在被划分的多个元素组中，每个元素组内包含的元素的数据类型相同，不同元素组内包含的元素的数据类型相同。例如，被划分的元素组包括：元素组1、元素组2和元素组3；其中，元素组1、元素组2和元素组3中包含的元素的数据类型均为字节；或者，元素组1、元素组2和元素组3中包含的元素的数据类型均为半字；或者，元素组1、元素组2和元素组3中包含的元素的数据类型均为字。

进一步地，不同的元素组使用相同的索引值，或者，不同的元素组使用不完全相同的索引值，示例性地，当不同的元素组使用相同的索引值时，元素组1至元素组4均使用相同的索引值ui8；当不同的元素组使用不完全相同的索引值时，元素组1和元素组2使用ui8a作为索引值选取源元素，元素组3和元素组4使用ui8b作为索引值选取源元素，ui8a和ui8b表示ui8中不同的位置，且两者表示不同取值的索引值。

在又一个例子中，多个元素组中，元素组内的各元素的数据类型相同，但不同元素组(如元素组1的元素与元素组2)内的元素具有不同的数据类型。进一步地，各元素组的元素数量相同或不同。例如，在元素组1具有4个元素，元素组2具有2个元素，而相同的立即数ui8为元素组1提供4个索引值，而为元素组2提供2个索引值。

可以理解地，上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例，不作为对本申请实施例的唯一限制。

在将源寄存器中每N1个相邻元素构成一组元素组之后，执行步骤203。

步骤203：将每个元素组中元素确定为初始源元素。

本申请实施例中，在将源寄存器中每N1个相邻元素构成一组元素组之后，可以将每个元素组中元素确定为初始源元素。初始源元素是指用于选取源元素的初始元素。

在将每个元素组的元素确定为初始源元素之后，执行步骤204。

步骤204：从所述初始源元素中分别获取每个索引值所指示的源元素；从每个所述元素组中选取的源元素的数量为n1个。

本申请实施例中，在确定初始源元素之后，可以从初始源元素中分别获取每个立即数所指示的源元素，即按照立即数从元素组内选取对应的源元素。从每个元素组内选取的源元素的数量为n1个，n1为大于0的正整数。

可选地，立即数和每一组元素组中的元素位置之间存在预设对应关系；该元素位置可以为元素地址，也可以为元素在元素组中的序列位，序列位表示元素在元素组中的位置编号。

可选地，从所述初始源元素中分别获取每个立即数所指示的源元素，即为从每一个元素组中，分别获取立即数对应的元素位置上的元素，将获取的元素确定为源元素。其中，不同元素组中选取的源元素数量相同。

在具体实现中，当操作码为第一操作码，N1＝4，数据类型为字节、半字、或者字时，每个元素组中包含的初始源元素个数相同，均为四个，从每个元素组中选取立即数对应的源元素；n1为4；N1＝n1。例如，当立即数表示元素地址3时，则从每个元素组中选取地址为3的元素，将选取的所有元素确定为源元素；再如，当立即数表示序列位为3时，从每个元素组中选取从首个元素起依次向后第三个元素，将选取的所有元素确定为源元素。

可选地，N1可以与n1相等或者不相等；当N1＝n1时，可以不执行步骤204，而直接将步骤203每个元素组中的元素作为选取的元素。

进一步地，从每个元素组中选取的源元素的数量为四个，源元素的数据类型为字节、半字、或者字；通常情况下，选取的每个源元素的数据类型相同。

步骤205：将选取的源元素确定为目标元素，并将目标元素写入所述目的寄存器中所述索引值对应的位置。

本申请实施例中，立即数和目的寄存器中地址之间存在预设对应关系。可选地，将目标元素写入所述目的寄存器中所述立即数对应的位置，即为从目的寄存器中确定立即数对应的位置，将源元素依次存储在确定的位置上。

进一步地，在一种可行的方案中，可以在步骤201和步骤202之间增加创建中间向量的步骤；具体来说，在根据确定的所述位置信息和源元素数量，从所述源寄存器中选取源元素之前，创建中间向量；所述中间向量包含至少一个中间向量参数，所述中间向量参数数量与所述目标元素的数量相等。基于创建的中间向量，在步骤204之后，即从所述源寄存器中选取源元素之后，将所述选取的每一个源元素分别存储至所述中间向量中的相应中间向量参数中；其中，所述中间向量参数和选取的源元素存在一一对应关系；步骤205即为，根据所述立即数，将每一个所述中间向量参数中的内容写入至所述目的寄存器的相应位置。

可选地，所述中间向量可以根据源寄存器创建；其中，可以根据源寄存器的类型等创建中间向量。

可选地，所述中间向量中的中间向量参数数量和目标元素数量相同，且根据索引值，目的寄存器中每个目标元素的位置与中间向量中每个中间向量参数存在预设对应关系；在源元素分组的情况下，根据所述立即数，将每一个所述中间向量参数中的内容写入至所述目的寄存器的相应位置，即为，设置参数i，i表示常量，i的取值范围为0～n-1，n由寄存器位数和数据类型决定；根据N1和i，确定中间向量中每个中间向量参数所索引的源寄存器中的源元素；对i进行自0至n-1的遍历取值，同时将中间向量中不同索引值对应的源元素写入目标寄存器该索引对应的目标元素位置。具体地，用[N1i]、[N1i+1]、[N1i+2]……[N1i+N1-1]分别表示不同位置，中间向量可以表示为“中间向量＝{VR[源寄存器].数据类型[N1i+N1-1]，……VR[源寄存器].数据类型[N1i]}”；其中，i表示常量，i的取值范围为0～n，n由寄存器位数和数据类型决定，如当寄存器位数为128位，数据类型为字节时，i为4；当寄存器位数为128位，数据类型为半字时，i为2；当寄存器位数为128位，数据类型为字时，i为1。

基于上述中间向量的方案，示例性地，对于第一操作码为VS.B，vj为源寄存器，创建中间向量vec0＝{VR[vj].B[4i+3],VR[vj].B[4i+2],VR[vj].B[4i+1],VR[vj].B[4i]}；其中，VR[vj].B[4i+3]、VR[vj].B[4i+2]、VR[vj].B[4i+1]、VR[vj].B[4i]均为中间向量参数；i表示常量，[4i+0]、[4i+1]、[4i+2]和[4i+3]则表示寄存器中的四个连续位置；i的取值范围为0～3。将每一个所述中间向量参数中的内容写入至所述目的寄存器vd的相应位置，可以表示为：

VR[vd].B[4i+0]＝vec0.B[ui8[1:0]]

VR[vd].B[4i+1]＝vec0.B[ui8[3:2]]

VR[vd].B[4i+2]＝vec0.B[ui8[5:4]]

VR[vd].B[4i+3]＝vec0.B[ui8[7:6]]

其中，ui8[1:0]、ui8[3:2]、ui8[5:4]和ui8[7:6]均为立即数，表示中间向量对应的索引值；具体来讲，由立即数ui8的最低两位(ui8[1:0])表达第一个目标元素在中间向量中的索引，由立即数ui8的第三位和第四位(ui8[3:2])表达第二个目标元素在中间向量中的索引，由立即数ui8的第五位和第六位(ui8[5:4])表达第三个目标元素在中间向量中的索引，由立即数ui8的第七位和第八位(ui8[7:6])表达第四个目标元素在中间向量中的索引。

同理，当数据类型为半字和字时，中间向量和索引方式同上述示例；当操作码的指令名称为XVS.{B/H/W}时，将需要两个中间向量实现向量混洗操作。示例性地，当第一操作码为XVS.B时，中间向量如下所示:

vec0＝{VR[vj].B[4i+3],VR[vj].B[4i+2],VR[vj].B[4i+1],VR[vj].B[4i]}

vec1＝{VR[vj].B[4i+19],VR[vj].B[4i+18],VR[vj].B[4i+17],VR[vj].B[4i+16]}

其中，中间向量为vec0和vec1；VR[vj].B[4i+3]、VR[vj].B[4i+2]、VR[vj].B[4i+1]、VR[vj].B[4i]为中间向量vec0的中间向量参数，VR[vj].B[4i+19]、VR[vj].B[4i+18]、VR[vj].B[4i+17]、VR[vj].B[4i+16]为中间向量vec1的中间向量参数；B表示数据类型为字节；i表示元素在寄存器中的位置，[4i+0]、[4i+1]、[4i+2]和[4i+3]表示寄存器中的四个连续位置的元素，以及[4i+16]、[4i+17]、[4i+18]和[4i+19]表示寄存器中的四个连续位置的元素。

示例性地，当第一操作码为XVS.B，数据类型为字节，N1为4时，向量混洗指令“XVS.B vd,vj,ui8”表示从向量寄存器vj中读取四个相邻字节元素构成一组元素进行混洗，然后将得到的结果写入向量寄存器vd内；第一操作码为VS.H，数据类型为半字，N1为4时，向量混洗指令“VS.H vd,vj,ui8”表示从向量寄存器vj中读取四个相邻半字元素构成一组元素进行混洗，然后将得到的结果写入向量寄存器vd内；第一操作码为VS.W，数据类型为字，N1为4时，向量混洗指令“VS.W vd,vj,ui8”表示从向量寄存器vj中读取四个相邻字元素构成一组元素进行混洗，然后将得到的结果写入向量寄存器vd内。

可以理解地，上述示例仅是为了更好地理解本申请的技术方案而列举的示例，不作为对本申请实施例的唯一限制。

本申请实施例中，在向量混洗指令中添加混洗参数，混洗参数包括索引值和操作码，根据索引值和操作码实现了源操作数和索引值数量不同情况下的混洗操作；由此可见，采用本申请技术方案，通过一条向量混洗指令，实现了源操作数和索引值数量不同情况下的混洗操作，无需增加其他指令传递混洗模式，也无需通过访存的方式获取混洗模式，从而有效降低了系统开销，提高了向量混洗操作的执行效率。

实施例三

在本申请的一种具体实现方式中，所述操作码为第二操作码，且所述索引值的数量与所述源元素的数量相同；如图3所示，向量混洗指令的处理方式可以包括：

步骤301：接收指令，所述指令包括：寄存器标识和混洗参数。

本申请实施例中，指令的含义和指令包含的参数如实施例一和实施例二所述，在此不再赘述。

可选地，源寄存器的数量为两个，即源元素来自两个不同的寄存器；当所述源寄存器数量为多个时，所有所述源寄存器中每一个源寄存器标识均与所述目的寄存器标识不同；或者，当所述源寄存器数量为多个时，所有所述源寄存器中存在一个源寄存器标识与所述目的寄存器标识相同。

可选地，混洗参数包括索引值和操作码；其中，索引值通过立即数的形式实现；操作码通过可以转化为二进制代码的标识符的形式实现，且操作码为第二操作码。示例性地，当操作码为第二操作码时，源寄存器包括第一源寄存器和第二源寄存器，且目的寄存器即为第一源寄存器或第二源寄存器。

可选地，指令格式为“操作码目的寄存器，源寄存器，立即数”。根据该指令格式，在具体实现中，指令可以表示为“[X]VS.D vd,vj,ui8”；[X]VS为第二操作码中的指令名称，D为第二操作码中的数据类型，D表示数据类型为双字，[X]VS.D为标识符形式的第二操作码；vd表示目的寄存器，vj和vd表示源寄存器，ui8表示立即数。示例性地，VS.D可以转化为二进制形式的第二操作码，如将VS.D转换为01110011100111二进制形式的第二操作码。此外，立即数可以为一组数据，如可以通过立即数ui8的不同位ui8[1:0]、ui8[3:2]、ui8[5:4]和ui8[7:6]表达索引值。

步骤302：执行所述指令，根据所述操作码和所述索引值，在所述源寄存器中，分别从每N2位的M _N2个元素中获取每个索引值所指示的源元素；其中，所述元素的数据类型为双字；每N2位的M _N2个元素中选取的源元素的数量为n2个，N2、M _N2和n2均为大于0的正整数。

本申请实施例中，索引值的数量与源元素的数量是相同的，操作码为第二操作码，将从每N2位的M _N2个元素中获取每个索引值所指示的源元素，元素的数据类型为双字，每N2位的M _N2个元素中选取的源元素的数量为n2个，N2、M _N2和n2均为大于0的正整数等条件确定为选取规则。

可选地，索引值分别和每个源寄存器中的元素位置之间存在预设对应关系；该元素位置可以为元素地址。在所述源寄存器中，分别从每N2位的M _N2个元素中获取每个索引值所指示的源元素，即为在第一源寄存器中，分别从每N2位的M _N2个元素中获取每个索引值所指示的第一源元素，以及在第二源寄存器中，分别从每N2位的M _N2个元素中获取每个索引值所指示的第二源元素；将第一源元素和第二源元素确定为最终选取的源元素。其中，M _n2个元素可以为依次相邻的元素，也可以为交叉相邻的元素；例如，当M _n2为四，假设源寄存器中包含八个元素，分别为元素A1、元素A2、元素A3、元素A4、元素A5、元素A6、元素A7、元素A8时，M _n4个元素可以为如元素A2～A5，也可以为元素A1、元素A3、元素A 5、元素A7交叉相邻的元素。

示例性地，当第二操作数为[X]VS.D时，M2为128，M _N2为四，n2为2。

在具体实现中，源寄存器的数量为两个，即第一源寄存器和第二源寄存器，在所述源寄存器中，分别从每N2位的M _N2个元素中获取每个索引值所指示的源元素，包括：在第一源寄存器中，从每N2位的M _N2’个元素中获取第一索引值(如ui8[1:0])所指示的源元素；以及在第一源寄存器中，从每N2位的M _N2’个元素中获取第二索引值(如ui8[3:2])所指示的源元素；其中，M _N2’为M _N2的一半；从第一源寄存器中选取的源元素数量为n2/2，从第二源寄存器中选取的源元素数量为n2/2。当源寄存器的数量为多个时，每个源寄存器通过立即数不同的位进行向量混洗，即不同源寄存器对应的立即数中的位不同；通过立即数的哪些位进行索引根据具体情况而定，在此不再赘述。

步骤303：将选取的源元素确定为目标元素，并将目标元素写入所述目的寄存器中所述索引值对应的位置。

进一步地，在一种可行的方案中，可以在步骤301和步骤302之间增加创建中间向量的步骤；具体来说，在根据确定的所述位置信息和源元素数量，从所述源寄存器中选取源元素之前，创建中间向量；所述中间向量包含至少一个中间向量参数，当存在元素组时，所述中间向量参数数量与所述元素组的数量相等；当不存在元素组时，所述中间向量参数数量与所述源元素的数量相等。基于创建的中间向量，在步骤302之后，即从所述源寄存器中选取源元素之后，将所述选取的每一个源元素分别存储至所述中间向量中的相应中间向量参数中；其中，所述中间向量参数和选取的源元素存在一一对应关系；步骤303即为，根据所述立即数，将每一个所述中间向量参数中的内容写入至所述目的寄存器的相应位置。其中，创建中间向量的方法同实施例二，在此不再赘述。

可选地，根据所述立即数，将每一个所述中间向量参数中的内容写入至所述目的寄存器的相应位置，即为，针对每一个所述中间向量参数均执行如下操作：将该中间向量参数中的内容，写入至该中间向量参数对应的索引值所指示的目的寄存器中的位置。

基于上述中间向量的方案，示例性地，对于第二操作码为VS.D，指令格式为VS.Dvd,vj,ui8，vj和vd为源寄存器，创建中间向量vec0＝{VR[vj],VR[vd]}，将每一个所述中间向量参数中的内容写入至所述目的寄存器vd的相应位置，可以表示为：

VR[vd].D[0]＝vec0.D[ui8[1:0]]

VR[vd].D[1]＝vec0.D[ui8[3:2]]

其中，ui8[1:0]、ui8[3:2]均为立即数，表示寄存器对应的索引值；具体来讲，由立即数ui8的最低两位(ui8[1:0])表达第一个目标元素在源寄存器中的索引，由立即数ui8的第三位和第四位(ui8[3:2])表达第二个目标元素在源寄存器中的索引。

当第二操作码为XVS.D时，将需要两个中间向量实现向量混洗操作。示例性地，中间向量如下所示：

vec0＝{XR[xj][127:0],XR[xd][127:0]}

vec1＝{XR[xj][255:128],XR[xd][255:128]}

其中，中间向量为vec0和vec1；XR[xj][127:0],XR[xd][127:0]表示vec0的中间向量参数，XR[xj][255:128],XR[xd][255:128]表示vec1的中间向量参数；D表示数据类型为双字，64比特宽。

示例性地，当第二操作码为VS.D，数据类型为双字，N2为128，M _N2为四，n2为2时，向量混洗指令“VS.D vd,vj,ui8”表示分别对向量寄存器vj和向量寄存器vd每128位中的四个双字元素中按照立即数内容选择出两个双字元素，所得到的结果写入到向量寄存器vd对应的128位内；当第二操作码为XVS.D，数据类型为双字，N2为128，M _N2为四，n2为2时，向量混洗指令“XVS.D vd,vj,ui8”表示分别从向量寄存器xj和向量寄存器xd每128位中的四个双字元素中按照立即数内容读取两个双字元素，然后将读取的双字元素写入xd对应的128位内。

本申请实施例中，两个源寄存器中存在一个源寄存器和目的寄存器相同，即存在一个寄存器既为源寄存器，又为目的寄存器；采用上述技术方案，每一次执行混洗指令，都可将目的寄存器中一半元素进行覆盖，可以应用在需要执行相应操作的软件应用场景中。

本申请实施例中，在向量混洗指令中添加混洗参数，混洗参数包括索引值和操作码，根据索引值和操作码实现了源操作数和索引值数量相同、且数据类型为双字、寄存器为128位情况下的混洗操作；由此可见，采用本申请技术方案，通过一条向量混洗指令，实现了源操作数和索引值数量不同、且数据类型为双字情况下的混洗操作，无需增加其他指令传递混洗模式，也无需通过访存的方式获取混洗模式，从而有效降低了系统开销，提高了向量混洗操作的执行效率。

实施例四

在本申请的一种具体实现方式中，所述操作码为第三操作码，所述索引值包括第一索引值、第二索引值、第三索引值和第四索引值，所述第一索引值、第二索引值、第三索引值和第四索引值分别索引相同或不同的位置；如图4所示，向量混洗指令的处理方式可以包括：

步骤401：接收指令，所述指令包括：寄存器标识和混洗参数。

本申请实施例中，指令的含义和指令包含的参数如实施例一、实施例二和实施例三所述，在此不再赘述。

可选地，混洗参数包括索引值和操作码；其中，索引值通过立即数的形式实现；操作码通过可以转化为二进制代码的标识符的形式实现，且操作码为第三操作码。示例性地，当操作码为第三操作码时，源寄存器包括第一源寄存器和第二源寄存器，且目的寄存器即为第一源寄存器或第二源寄存器。

可选地，指令格式为“操作码目的寄存器，源寄存器，立即数”。根据该指令格式，在具体实现中，指令可以表示为“[X]VP.W vd/xd,vj/xj,ui8”；[X]VP为第三操作码中的指令名称，W为第三操作码中的数据类型，W表示数据类型为字，[X]VP.W为标识符形式的第三操作码；vd/xd表示目的寄存器，vj和vd表示源寄存器(或者xj和xd表示源寄存器)，ui8表示立即数。示例性地，VP.W为可以转化为二进制形式的第三操作码，如将VP.W转换为01110011111001二进制形式的第三操作码。此外，立即数可以为一组数据，如可以通过立即数ui8的不同位ui8[1:0]、ui8[3:2]、ui8[5:4]和ui8[7:6]表达索引值。

步骤402：执行所述指令，根据所述操作码和所述索引值，在所述第一源寄存器中，分别从每N3位的M _N3个元素中获取第一索引值和第二索引值所指示的源元素；在所述第二源寄存器中，分别从每N3位的M _N3个元素中获取第三索引值和第四索引值所指示的源元素。

其中，所述元素的数据类型为字；每N3位的M _N3个元素中选取的源元素的数量为n3个，N3、M _N3和n3均为大于0的正整数。

本申请实施例中，索引值包括四个索引值，分别为：第一索引值、第二索引值、第三索引值和第四索引值，第一索引值、第二索引值、第三索引值和第四索引值分别索引不同的位置。当源寄存器的数量为多个时，每个源寄存器通过立即数不同的位进行向量混洗，即不同源寄存器对应的立即数中的位不同；通过立即数的哪些位进行索引根据具体情况而定，在此不再赘述。示例性地，当第三操作码为[X]VP.W时，第一索引值为ui8[1:0]，第二索引值为ui8[3:2]，第三索引值为ui8[5:4]，第四索引值为ui8[7:6]。

此外，索引值的数量与源元素的数量相同；将从每N3位的M _N3个元素中获取每个索引值所指示的源元素，所述元素的数据类型为字，每N3位的M _N3个元素中选取的源元素的数量为n3个，N3、M _N3和n3均为大于0的正整数等条件确定为选取规则。其中，M _n3个元素可以为依次相邻的元素，也可以为交叉相邻的元素；例如，当M _n3为四，假设源寄存器中包含八个元素，分别为元素A1、元素A2、元素A3、元素A4、元素A5、元素A6、元素A7、元素A8时，M _n4个元素可以为如元素A2～A5，也可以为元素A1、元素A3、元素A 5、元素A7交叉相邻的元素。

可选地，索引值分别和每个源寄存器中的元素位置之间存在预设对应关系；该元素位置可以为元素地址。在所述源寄存器中，分别从每N3位的M _N3个元素中获取每个索引值所指示的源元素，即为在所述第一源寄存器中，分别从每N3位的M _N3个元素中获取第一索引值和第二索引值所指示的源元素；以及在所述第二源寄存器中，分别从每N3位的M _N3个元素中获取第三索引值和第四索引值所指示的源元素。

示例性地，当第三操作码为[X]VP.W时，N3为128，M _N3为四，n3为2。

在源寄存器中分别从每N3位的M _N3个元素中获取每个索引值所指示的源元素之后，执行步骤403和步骤404。

步骤403：将所述第一索引值指示的源元素确定为第一目标元素，并将第二索引值指示的源元素确定为第二目标元素。

本申请实施例中，将从第一源寄存器中选取的第一索引值指示的源元素确定为第一目标元素，并将从第一源寄存器中选取的第二索引值指示的源元素确定为第二目标元素。

步骤404：将所述第三索引值指示的源元素确定为第三目标元素，并将第四索引值指示的源元素确定为第四目标元素。

本申请实施例中，将从第二源寄存器中选取的第三索引值指示的源元素确定为第三目标元素，并将从第二源寄存器中选取的第四索引值指示的源元素确定为第四目标元素。

本申请实施例中，步骤403和步骤404可以为同时执行的步骤，也可以为先后执行的步骤，先后顺序不加约束；在全部执行完毕步骤403和步骤404后，执行步骤405。

步骤405：将所述第一目标元素和所述第二目标元素写入到所述目的寄存器中的第一位置；并将所述第三目标元素和所述第四目标元素写入到所述目的寄存器中的第二位置。

本申请实施例中，当操作码为第三操作码时，在获取到第一目标元素、第二目标元素、第三目标元素和第四目标元素之后，可以将第一目标元素和第二目标元素写入到目的寄存器中的第一位置，并将第三目标元素和第四目标元素写入到目的寄存器的第二位置。

示例性地，当第三操作码为VP.W/XVP.W(两者简写为[X]VP.W)，数据类型为字，N3为128，M _N3为四，n3为2时，向量混洗指令“[X]VP.W vd,vj,ui8”表示将ui8[1:0]和ui8[3:2]值作为索引值，从向量寄存器vj/xj中每128位中的四个字元素中各选择出两个分别写入到向量寄存器vd/xd对应128位的第0个和第1个字元素中；将ui8[5:4]和ui8[7:6]值作为索引值，从向量寄存器vd/xd每128位中的四个字元素中各选择出两个分别写入到向量寄存器vd/xd对应128位的第2个和第3个字元素中。

本申请实施例中，在向量混洗指令中添加混洗参数，混洗参数包括索引值和操作码，根据索引值和操作码实现了源操作数和索引值数量相同、且数据类型为字情况下的混洗操作；由此可见，采用本申请技术方案，通过一条向量混洗指令，实现了源操作数和索引值数量相同、且数据类型为字情况下的混洗操作，无需增加其他指令传递混洗模式，也无需通过访存的方式获取混洗模式，从而有效降低了系统开销，提高了向量混洗操作的执行效率。

实施例五

在本申请的一种具体实现方式中，所述操作码为第四操作码，且所述索引值的数量与所述源元素的数量相同；如图5所示，向量混洗指令的处理方式可以包括：

步骤501：接收指令，所述指令包括：寄存器标识和混洗参数。

本申请实施例中，指令的含义和指令包含的参数如实施例一至实施例四所述，在此不再赘述。

可选地，混洗参数包括索引值和操作码；其中，索引值通过立即数的形式实现；操作码通过可以转化为二进制代码的标识符的形式实现，且操作码为第四操作码。

可选地，指令格式为“操作码目的寄存器，源寄存器，立即数”。根据该指令格式，在具体实现中，指令可以表示为XVP.D xd,xj,ui8；XVP为第四操作码中的指令名称，D为第四操作码中的数据类型，D表示数据类型为双字，XVP.D为标识符形式的第四操作码；xd表示目的寄存器，xj表示源寄存器，ui8表示立即数。示例性地，XVP.D可以转化为二进制形式的第四操作码，如将XVP.D转换为01110111111010二进制形式的第四操作码。此外，立即数可以为一组数据，如可以通过立即数ui8的不同位ui8[1:0]、ui8[3:2]、ui8[5:4]和ui8[7:6]表达索引值。

步骤502：执行所述指令，根据所述操作码和所述立即数，在所述源寄存器中，分别从M _n4个元素中获取每个索引值所指示的源元素；其中，所述元素的数据类型为双字；选取的源元素的数量为n4个，所述M _n4和n4均为大于0的正整数。

本申请实施例中，操作码为第四操作码，第四操作码可以用于指示从源寄存器内获取双字数据类型的元素。索引值的数量与源元素的数量相同；将从M _n4个元素中获取每个索引值所指示的源元素，所述元素的数据类型为双字，选取的源元素的数量为n4个，所述M _n4和n4均为大于0的正整数等多个条件确定为选取规则。其中，M _n4个元素可以为依次相邻的元素，也可以为交叉相邻的元素；例如，当M _n4为四，假设源寄存器中包含八个元素，分别为元素A1、元素A2、元素A3、元素A4、元素A5、元素A6、元素A7、元素A8时，M _n4个元素可以为如元素A2～A5，也可以为元素A1、元素A3、元素A5、元素A7交叉相邻的元素。

可选地，索引值分别和每个源寄存器中的元素位置之间存在预设对应关系；该元素位置可以为元素地址。根据该第四操作码和索引值确定出选取规则之后，可以在源寄存器中，分别从M _n4个元素中获取每个索引值所指示的源元素，获取的源元素的数据类型为双字，选取的源元素的数量为n4个，M _n4和n4均为大于0的正整数。

示例性地，当第四操作码为XVP.D时，M _n4为四，n4为4。

步骤503：将选取的源元素确定为目标元素，并将目标元素写入所述目的寄存器中所述索引值对应的位置。

示例性地，当第四操作码为XVP.D，数据类型为双字，M _n4为四，n4为4时，向量混洗指令“XVP.D xd,xj,ui8”表示将ui8[1:0]、ui8[3:2]、ui8[5:4]、ui8[7:6]值作为索引值，从向量寄存器xj中的四个双字元素中选择每一个索引值所指示的源元素，并将源元素依次写入到向量寄存器xd的四个双字元素中。

本申请实施例中，在向量混洗指令中添加混洗参数，混洗参数包括索引值和操作码，根据索引值和操作码实现了源操作数和索引值数量相同、且数据类型为双字、寄存器为256位情况下的混洗操作；由此可见，采用本申请技术方案，通过一条向量混洗指令，实现了源操作数和索引值数量相同、且数据类型为双字、寄存器为256位情况下的混洗操作，无需增加其他指令传递混洗模式，也无需通过访存的方式获取混洗模式，从而有效降低了系统开销，提高了向量混洗操作的执行效率。

实施例六

在本申请的一种具体实现方式中，所述操作码为第五操作码，所述索引值包括第一索引值和第三索引值，所述第一索引值和第三索引值分别索引不同的位置；所述源寄存器包括第一源寄存器和第二源寄存器；如图6所示，向量混洗指令的处理方式可以包括：

步骤601：接收指令，所述指令包括：寄存器标识和混洗参数。

本申请实施例中，指令的含义和指令包含的参数如实施例一至实施例五所述，在此不再赘述。

可选地，混洗参数包括索引值和操作码；其中，索引值通过立即数的形式实现；操作码通过可以转化为二进制代码的标识符的形式实现，且操作码为第五操作码。示例性地，当操作码为第五操作码时，源寄存器包括第一源寄存器和第二源寄存器，且目的寄存器即为第一源寄存器或第二源寄存器。

可选地，指令格式为“操作码目的寄存器，源寄存器，立即数”。根据该指令格式，在具体实现中，指令可以表示为XVP.Q vd/xd,vj/xj,ui8；XVP为第五操作码中的指令名称，Q为第五操作码中的数据类型，Q表示数据类型为四字，XVP.Q为标识符形式的第五操作码；xd表示目的寄存器，xj和xd表示源寄存器，ui8表示立即数。示例性地，XVP.Q可以转化为二进制形式的第五操作码，如将XVP.Q转换为01110111111011二进制形式的第五操作码。此外，立即数可以为一组数据，如可以通过立即数ui8的不同位ui8[1:0]、ui8[5:4]表达索引值。

步骤602：执行所述指令，根据所述操作码和所述立即数，在所述第一源寄存器中，从M _n5个元素中获取第一索引值所指示的第一源元素；以及，在所述第二源寄存器中，从M _n5个元素中获取第二索引值所指示的第二源元素；其中，所述元素的数据类型为四字；选取的源元素的数量为n5个，n5为大于0的正整数。

本申请实施例中，操作码可以为第五操作码，该第五操作码可以用于指示从源寄存器内获取数据类型为四字的元素。索引值包括两个索引值，分别为：第一索引值和第三索引值，第一索引值和第三索引值分别索引不同的位置；第一索引值和第三索引值分别表示同一立即数的不同位，如第一索引值表示立即数ui8的低位，第三索引值表示立即数ui8的高位，此外，第一索引值还可以表示立即数ui8的最低两位，第三索引值还可以表示立即数ui8的次低两位。示例性地，当第五操作码为XVP.Q时，第一索引值为ui8[1:0]，第三索引值为ui8[5:4]。当源寄存器的数量为多个时，每个源寄存器通过立即数不同的位进行向量混洗，即不同源寄存器对应的立即数中的位不同；通过立即数的哪些位进行索引根据具体情况而定，在此不再赘述。

此外，索引值的数量与源元素的数量相同；将在所述第一源寄存器中，从M _n5个元素中获取第一索引值所指示的第一源元素，在所述第二源寄存器中，从M _n5个元素中获取第二索引值所指示的第二源元素，所述元素的数据类型为四字，选取的源元素的数量为n5个，n5为大于0的正整数等多个条件确定为选取规则。其中，M _n5个元素可以为依次相邻的元素，也可以为交叉相邻的元素；例如，当M _n5为四，假设源寄存器中包含八个元素，分别为元素A1、元素A2、元素A3、元素A4、元素A5、元素A6、元素A7、元素A8时，M _n5个元素可以为如元素A2～A5，也可以为元素A1、元素A3、元素A5、元素A7交叉相邻的元素。

可选地，索引值分别和每个源寄存器中的元素位置之间存在预设对应关系；该元素位置可以为元素地址。在根据第五操作码和索引值确定出选取规则之后，可以在第一源寄存器中从M _n5个元素中获取第一索引值所指示的第一源元素，并在第二源寄存器中从M _n5个元素中获取第二索引值所指示的第二源元素。从第一源寄存器中选取的源元素数量为n3/2，从第二源寄存器中选取的源元素数量为n3/2。当源寄存器的数量为多个时，每个源寄存器通过立即数不同的位进行向量混洗，即不同源寄存器对应的立即数中的位不同；通过立即数的哪些位进行索引根据具体情况而定，在此不再赘述。

示例性地，当第五操作码为XVP.Q时，M _N5为两，n3为2。

在获取第一源元素和第二源元素之后，执行步骤603。

步骤603：分别将第一源元素和第二源源元素确定为目标元素，写入所述目的寄存器的相应位置。

本申请实施例中，当操作码为第五操作码时，在获取第一源元素和第二源元素之后，可以将第一源元素确定为目标元素写入目的寄存器的第一位置，将第二源元素确定为目标元素以写入目的寄存器的第二位置。第一位置和第二位置分别由索引值确定。

示例性地，当第五操作码为XVP.Q，数据类型为四字，M _N5为两，n3为2时，向量混洗指令“XVP.Q xd,xj,ui8”表示根据ui8[1:0]、ui8[5:4]值，从向量寄存器xj的两个四字元素中选择一个源元素，并从向量寄存器xd的两个四字元素中选择一个源元素，将选取的两个源元素按照索引值写入到向量寄存器xd的两个四字元素中。

本申请实施例中，在向量混洗指令中添加混洗参数，混洗参数包括索引值和操作码，根据索引值和操作码实现了源操作数和索引值数量相同、且数据类型为四字情况下的混洗操作；由此可见，采用本申请技术方案，通过一条向量混洗指令，实现了源操作数和索引值数量相同、且数据类型为四字情况下的混洗操作，无需增加其他指令传递混洗模式，也无需通过访存的方式获取混洗模式，从而有效降低了系统开销，提高了向量混洗操作的执行效率。

实施例七

参照图7，示出了本申请实施例提供的一种处理器的结构示意图。

如图7所示，该处理器可以包括：

多个向量寄存器，所述多个向量寄存器包括源寄存器72与目标寄存器74，源寄存器71用于存储数据元素；

译码单元71，用于译码向量混洗指令；其中，所述向量混洗指令包括：寄存器标识和混洗参数，所述寄存器标识包括源寄存器标识和目的寄存器标识；

执行单元73，响应于所述向量混洗指令，根据所述混洗参数对从所述源寄存器71获取的源元素执行向量混洗操作，并获取所述向量混洗操作后的目标元素，并将所述目标元素写入所述目的寄存器74。

可选地，指令存储在指令存储器70中。

可选地，所述执行单元73，根据所述混洗参数，确定所述源元素在所述源寄存器71中的位置信息和源元素数量；其中，选取的所述源元素的数量为一个或多个；根据确定的所述位置信息和源元素数量，从所述源寄存器中选取源元素；将所有所述选取的源元素确定为目标元素。

可选地，所述混洗参数包括索引值和操作码；所述索引值用于指示向量混洗操作所需要的每一个源元素在所述源寄存器中的位置信息；所述操作码用于表征对所述源寄存器和目的寄存器所进行的操作；

所述执行单元73，根据所述索引值和所述操作码，确定获取源元素的选取规则；从源寄存器71中，按照所述选取规则，分别获取每个索引值所指示的源元素。

可选地，所述执行单元73，当所述索引值的数量与所述源元素的数量不同时，根据所述索引值的数量，确定对所述源元素进行分组的方式，并根据所述分组的方式和所述操作码，确定所述选取规则；当所述索引值的数量与所述源元素的数量相同时，根据所述操作码，确定所述选取规则。

可选地，所述执行单元73，将所述源寄存器中每N1个相邻元素构成一组元素组；其中，所述元素的数据类型为字节、半字、字中的任一种；N1为大于0的正整数；将每个元素组中元素确定为初始源元素；从所述初始源元素中分别获取每个索引值所指示的源元素；从每个所述元素组中选取的源元素的数量为n1个。

可选地，所述相邻元素为所述源寄存器中位置依次相邻的元素，相邻多个元素组中的元素地址存在部分相同或者完全不同；

其中，每个元素组中包含的元素的数据类型相同；不同元素组中包含的元素的数据类型相同或不同。

可选地，所述操作码为第二操作码，且所述索引值的数量与所述源元素的数量相同；

所述执行单元73，在所述源寄存器中，分别从每N2位的M _N2个元素中获取每个索引值所指示的源元素；其中，所述元素的数据类型为双字；每N2位的M _N2个元素中选取的源元素的数量为n2个，N2、M _N2和n2均为大于0的正整数。

可选地，所述执行单元73，创建中间向量；所述中间向量包含至少一个中间向量参数，当存在元素组时，所述中间向量参数数量与所述元素组的数量相等；当不存在元素组时，所述中间向量参数数量与所述源元素的数量相等；将所述选取的每一个源元素分别存储至所述中间向量中的相应中间向量参数中；其中，所述中间向量参数和选取的源元素存在一一对应关系；根据所述混洗参数，将每一个所述中间向量参数中的内容写入至所述目的寄存器的相应位置。

可选地，所述操作码为第三操作码；所述索引值包括第一索引值、第二索引值、第三索引值和第四索引值，所述第一索引值、第二索引值、第三索引值和第四索引值分别索引不同的位置；所述源寄存器包括第一源寄存器和第二源寄存器；

所述执行单元73，在所述源寄存器71中，分别从每N3位的M _N3个元素中获取第一索引值和第二索引值所指示的源元素；以及，在所述第二源寄存器中，分别从每N3位的M _N3个元素中获取第三索引值和第四索引值所指示的源元素；其中，所述元素的数据类型为字；每N3位的M _N3个元素中选取的源元素的数量为n3个，N3、M _N3和n3均为大于0的正整数；将所述第一索引值指示的源元素确定为第一目标元素，并将第二索引值指示的源元素确定为第二目标元素；以及将所述第三索引值指示的源元素确定为第三目标元素，并将第四索引值指示的源元素确定为第四目标元素；将所述第一目标元素和所述第二目标元素写入到所述目的寄存器中的第一位置；并将所述第三目标元素和所述第四目标元素写入到所述目的寄存器中的第二位置。

可选地，所述操作码为第四操作码；

所述执行单元73，在所述源寄存器中，分别从M _n4个元素中获取每个索引值所指示的源元素；其中，所述元素的数据类型为双字；选取的源元素的数量为n4个，所述M _n4和n4均为大于0的正整数。

可选地，所述操作码为第五操作码；所述索引值包括第一索引值和第三索引值，所述第一索引值和第三索引值分别索引不同的位置；所述源寄存器包括第一源寄存器和第二源寄存器；

所述执行单元73，在所述第一源寄存器中，从M _n5个元素中获取第一索引值所指示的第一源元素；以及，在所述第一源寄存器中，从M _n5个元素中获取第三索引值所指示的第二源元素；其中，所述元素的数据类型为四字；选取的源元素的数量为n5个，n5为大于0的正整数；分别将第一源元素和第二源源元素确定为目标元素，写入所述目的寄存器的相应位置。

可选地，所述源寄存器数量为一个或多个，所述目的寄存器数量为一个；

当所述源寄存器数量为一个时，所述源寄存器标识与所述目的寄存器标识可以相同或不同；

当所述源寄存器数量为多个时，所有所述源寄存器中每一个源寄存器标识均与所述目的寄存器标识不同；或者，当所述源寄存器数量为多个时，所有所述源寄存器中存在一个源寄存器标识与所述目的寄存器标识相同。

本申请实施例提供的处理器，通过在指令中添加寄存器标识和混洗参数，结合混洗参数可以对源寄存器内获取的元素执行向量混洗操作，因此，通过一条指令即可实现特定功能的向量混洗操作，无需通过多条执行混洗操作的指令实现特定功能，提高了特定功能的执行效率。

实施例八

如图8所示，电子设备可以包括以下一个或多个组件：处理组件802，存储器804，电源组件806，多媒体组件808，音频组件810，输入/输出(I/O)的接口812，传感器组件814，以及通信组件816。

处理组件802通常控制电子设备的整体操作，诸如与显示，数据通信，相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理部件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在电子设备的操作。这些数据的示例包括用于在电子设备上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件806为电子设备的各种组件提供电力。电源组件806可以包括电源管理系统，一个或多个电源，及其他与为终端800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述电子设备和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当终端处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为电子设备800提供各个方面的状态评估。例如，传感器组件814可以检测到电子设备800的打开/关闭状态，组件的相对定位，例如所述组件为终端的显示器和小键盘，传感器组件814还可以检测终端或终端一个组件的位置改变，用户与电子设备接触的存在或不存在，电子设备方位或加速/减速和电子设备的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于电子设备和其他设备之间有线或无线方式的通信。电子设备可以接入基于通信标准的无线网络，如WiFi，2G/3G/4G/5G，或它们的组合。在一个示例性实施例中，通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信部件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，电子设备可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述向量混洗方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由电子设备的处理器820执行以完成上述向量混洗方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本申请实施例的电子设备用于实现前述多个方法实施例中相应的向量混洗方法，并且具有相应的方法实施的有益效果，在此不再赘述。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上对本申请所提供的一种向量混洗方法、处理器及电子设备进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

在此提供的算法和显示不与任何特定计算机、电子系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本申请也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本申请的内容，并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本申请的示例性实施例的描述中，本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本申请的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本申请的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本申请实施例的浏览器客户端设备中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

一种向量混洗方法，所述方法包括：

接收指令，所述指令包括：寄存器标识和混洗参数；其中，所述寄存器标识包括源寄存器标识和目的寄存器标识；所述源寄存器标识用于表征源寄存器，所述源寄存器为存储执行向量混洗操作时被操作的源元素的寄存器；所述目的寄存器标识用于表征目的寄存器，所述目的寄存器为存储执行所述向量混洗操作后得到的目标元素的寄存器；所述混洗参数用于指示对所述源元素执行向量混洗操作时所依据的参数；

执行所述指令，以根据所述混洗参数对从所述源寄存器获取的源元素执行向量混洗操作，并获取所述向量混洗操作后的目标元素；

将所述目标元素写入所述目的寄存器。
根据权利要求1所述的方法，其特征在于，根据所述混洗参数对从所述源寄存器获取的源元素执行向量混洗操作，并获取所述向量混洗操作后的目标元素，包括：

根据所述混洗参数，确定向量混洗操作所需要的所述源元素在所述源寄存器中的位置信息和源元素数量；其中，选取的所述源元素的数量为一个或多个；

根据确定的所述位置信息和源元素数量，从所述源寄存器中选取源元素；

将所有所述选取的源元素确定为目标元素。
根据权利要求2所述的方法，其特征在于，所述混洗参数包括索引值和操作码；所述索引值用于指示向量混洗操作所需要的每一个源元素在所述源寄存器中的位置信息；所述操作码用于表征对所述源寄存器和目的寄存器所进行的操作；

所述根据确定的所述位置信息和源元素数量，从所述源寄存器中选取源元素，包括：

根据所述索引值和所述操作码，确定获取源元素的选取规则；

从源寄存器中，按照所述选取规则，分别获取每个索引值所指示的源元素。
根据权利要求3所述的方法，其特征在于，所述根据所述索引值和所述操作码，确定获取源元素的选取规则，包括：

当所述索引值的数量与所述源元素的数量不同时，根据所述索引值的数量，确定对所述源元素进行分组的方式，并根据所述分组的方式和所述操作码，确定所述选取规则；

当所述索引值的数量与所述源元素的数量相同时，根据所述操作码，确定所述选取规则。
根据权利要求4所述的方法，其特征在于，所述操作码为第一操作码，且所述索引值的数量与所述源元素的数量不同；

所述从源寄存器中，按照所述选取规则，分别获取每个索引值所指示的源元素，包括：

将所述源寄存器中每N1个相邻元素构成一组元素组；其中，所述元素的数据类型为字节、半字、字中的任一种；N1为大于0的正整数；

将每个元素组中元素确定为初始源元素；

从所述初始源元素中分别获取每个索引值所指示的源元素；从每个所述元素组中选取的源元素的数量为n1个。
根据权利要求5所述的方法，其特征在于，所述相邻元素为所述源寄存器中位置依次相邻的元素，相邻多个元素组中的元素地址存在部分相同或者完全不同；

其中，每个元素组中包含的元素的数据类型相同；不同元素组中包含的元素的数据类型相同或不同。
根据权利要求4所述的方法，其特征在于，所述操作码为第二操作码，且所述索引值的数量与所述源元素的数量相同；

所述从源寄存器中，按照所述选取规则，分别获取每个索引值所指示的源元素，包括：

在所述源寄存器中，分别从每N2位的M _N2个元素中获取每个索引值所指示的源元素；其中，所述元素的数据类型为双字；每N2位的M _N2个元素中选取的源元素的数量为n2个，N2、M _N2和n2均为大于0的正整数。
根据权利要求5-7任一项所述的方法，其特征在于，所述根据确定的所述位置信息和源元素数量，从所述源寄存器中选取源元素之前，还包括：

创建中间向量；所述中间向量包含至少一个中间向量参数，当存在元素组时，所述中间向量参数数量与所述元素组的数量相等；当不存在元素组时，所述中间向量参数数量与所述源元素的数量相等；

从所述源寄存器中选取源元素，包括：

将所述选取的每一个源元素分别存储至所述中间向量中的相应中间向量参数中；其中，所述中间向量参数和选取的源元素存在一一对应关系；

将所述目标元素写入所述目的寄存器，包括：

根据所述混洗参数，将每一个所述中间向量参数中的内容写入至所述目的寄存器的相应位置。
根据权利要求4所述的方法，其特征在于，所述操作码为第三操作码；所述索引值包括第一索引值、第二索引值、第三索引值和第四索引值，所述第一索引值、第二索引值、第三索引值和第四索引值分别索引不同的位置；所述源寄存器包括第一源寄存器和第二源寄存器；

所述从源寄存器中，按照所述选取规则，分别获取每个索引值所指示的源元素，包括：

在所述第一源寄存器中，分别从每N3位的M _N3个元素中获取第一索引值和第二索引值所指示的源元素；以及

在所述第二源寄存器中，分别从每N3位的M _N3个元素中获取第三索引值和第四索引值所指示的源元素；其中，所述元素的数据类型为字；每N3位的M _N3个元素中选取的源元素的数量为n3个，N3、M _N3和n3均为大于0的正整数；

所述将所述目标元素写入所述目的寄存器，包括：

将所述第一索引值指示的源元素确定为第一目标元素，并将第二索引值指示的源元素确定为第二目标元素；以及

将所述第三索引值指示的源元素确定为第三目标元素，并将第四索引值指示的源元素确定为第四目标元素；

将所述第一目标元素和所述第二目标元素写入到所述目的寄存器中的第一位置；并将所述第三目标元素和所述第四目标元素写入到所述目的寄存器中的第二位置。
根据权利要求4所述的方法，其特征在于，所述操作码为第四操作码；

所述从源寄存器中，按照所述选取规则，分别获取每个索引值所指示的源元素，包括：

在所述源寄存器中，分别从M _n4个元素中获取每个索引值所指示的源元素；其中，所述元素的数据类型为双字；选取的源元素的数量为n4个，所述M _n4和n4均为大于0的正整数。
根据权利要求4所述的方法，其特征在于，所述操作码为第五操作码；所述索引值包括第一索引值和第三索引值，所述第一索引值和第三索引值分别索引不同的位置；所述源寄存器包括第一源寄存器和第二源寄存器；

所述从源寄存器中，按照所述选取规则，分别获取每个索引值所指示的源元素，包括：

在所述第一源寄存器中，从M _n5个元素中获取第一索引值所指示的第一源元素；以及，在所述第二源寄存器中，从M _n5个元素中获取第三索引值所指示的第二源元素；其中，所述元素的数据类型为四字；选取的源元素的数量为n5个，n5为大于0的正整数；

所述将所述目标元素写入所述目的寄存器，包括：

分别将第一源元素和第二源源元素确定为目标元素，写入所述目的寄存器的相应位置。
根据权利要求1-11任一项所述的方法，其特征在于，所述源寄存器数量为一个或多个，所述目的寄存器数量为一个；

当所述源寄存器数量为一个时，所述源寄存器标识与所述目的寄存器标识不同；

当所述源寄存器数量为多个时，所有所述源寄存器中每一个源寄存器标识均与所述目的寄存器标识不同；或者，当所述源寄存器数量为多个时，所有所述源寄存器中存在一个源寄存器标识与所述目的寄存器标识相同。
一种处理器，包括：

多个向量寄存器，所述多个向量寄存器包括源寄存器与目标寄存器，源寄存器用于存储数据元素；

译码单元，用于译码向量混洗指令；其中，所述向量混洗指令包括：寄存器标识和混洗参数，所述寄存器标识包括源寄存器标识和目的寄存器标识；

执行单元，响应于所述向量混洗指令，根据所述混洗参数对从所述源寄存器获取的源元素执行向量混洗操作，并获取所述向量混洗操作后的目标元素，并将所述目标元素写入所述目的寄存器。
根据权利要求13所述的处理器，其特征在于，

所述执行单元，根据所述混洗参数，确定所述源元素在所述源寄存器中的位置信息和源元素数量；其中，选取的所述源元素的数量为一个或多个；根据确定的所述位置信息和源元素数量，从所述源寄存器中选取源元素；将所有所述选取的源元素确定为目标元素。
根据权利要求14所述的处理器，其特征在于，所述混洗参数包括索引值和操作码；所述索引值用于指示向量混洗操作所需要的每一个源元素在所述源寄存器中的位置信息；所述操作码用于表征对所述源寄存器和目的寄存器所进行的操作；

所述执行单元，根据所述索引值和所述操作码，确定获取源元素的选取规则；从源寄存器中，按照所述选取规则，分别获取每个索引值所指示的源元素。
根据权利要求15所述的处理器，其特征在于，

所述执行单元，当所述索引值的数量与所述源元素的数量不同时，根据所述索引值的数量，确定对所述源元素进行分组的方式，并根据所述分组的方式和所述操作码，确定所述选取规则；当所述索引值的数量与所述源元素的数量相同时，根据所述操作码，确定所述选取规则。
根据权利要求16所述的处理器，其特征在于，所述操作码为第一操码，且所述索引值的数量与所述源元素的数量不同；

所述执行单元，将所述源寄存器中每N1个相邻元素构成一组元素组；其中，所述元素的数据类型为字节、半字、字中的任一种；N1为大于0的正整数；将每个元素组中元素确定为初始源元素；从所述初始源元素中分别获取每个索引值所指示的源元素；从每个所述元素组中选取的源元素的数量为n1个。
根据权利要求17所述的处理器，其特征在于，所述相邻元素为所述源寄存器中位置依次相邻的元素，相邻多个元素组中的元素地址存在部分相同或者完全不同；

其中，每个元素组中包含的元素的数据类型相同；不同元素组中包含的元素的数据类型相同或不同。
根据权利要求16所述的处理器，其特征在于，所述操作码为第二操作码，且所述索引值的数量与所述源元素的数量相同；

所述执行单元，在所述源寄存器中，分别从每N2位的M _N2个元素中获取每个索引值所指示的源元素；其中，所述元素的数据类型为双字；每N2位的M _N2个元素中选取的源元素的数量为n2个，N2、M _N2和n2均为大于0的正整数。
根据权利要求17-19任一项所述的处理器，其特征在于，

所述执行单元，创建中间向量；所述中间向量包含至少一个中间向量参数，当存在元素组时，所述中间向量参数数量与所述元素组的数量相等；当不存在元素组时，所述中间向量参数数量与所述源元素的数量相等；将所述选取的每一个源元素分别存储至所述中间向量中的相应中间向量参数中；其中，所述中间向量参数和选取的源元素存在一一对应关系；根据所述混洗参数，将每一个所述中间向量参数中的内容写入至所述目的寄存器的相应位置。
根据权利要求16所述的处理器，其特征在于，所述操作码为第三操作码；所述索引值包括第一索引值、第二索引值、第三索引值和第四索引值，所述第一索引值、第二索引值、第三索引值和第四索引值分别索引不同的位置；所述源寄存器包括第一源寄存器和第二源寄存器；

所述执行单元，在所述源寄存器中，分别从每N3位的M _N3个元素中获取第一索引值和第二索引值所指示的源元素；以及，在所述第二源寄存器中，分别从每N3位的M _N3个元素中获取第三索引值和第四索引值所指示的源元素；其中，所述元素的数据类型为字；每N3位的M _N3个元素中选取的源元素的数量为n3个，N3、M _N3和n3均为大于 0的正整数；将所述第一索引值指示的源元素确定为第一目标元素，并将第二索引值指示的源元素确定为第二目标元素；以及将所述第三索引值指示的源元素确定为第三目标元素，并将第四索引值指示的源元素确定为第四目标元素；将所述第一目标元素和所述第二目标元素写入到所述目的寄存器中的第一位置；并将所述第三目标元素和所述第四目标元素写入到所述目的寄存器中的第二位置。
根据权利要求16所述的处理器，其特征在于，所述操作码为第四操作码；

所述执行单元，在所述源寄存器中，分别从M _n4个元素中获取每个索引值所指示的源元素；其中，所述元素的数据类型为双字；选取的源元素的数量为n4个，所述M _n4和n4均为大于0的正整数。
根据权利要求16所述的处理器，其特征在于，所述操作码为第五操作码；所述索引值包括第一索引值和第三索引值，所述第一索引值和第三索引值分别索引不同的位置；所述源寄存器包括第一源寄存器和第二源寄存器；

所述执行单元，在所述第一源寄存器中，从M _n5个元素中获取第一索引值所指示的第一源元素；以及，在所述第一源寄存器中，从M _n5个元素中获取第三索引值所指示的第二源元素；其中，所述元素的数据类型为四字；选取的源元素的数量为n5个，n5为大于0的正整数；分别将第一源元素和第二源源元素确定为目标元素，写入所述目的寄存器的相应位置。
根据权利要求13-23任一项所述的处理器，其特征在于，所述源寄存器数量为一个或多个，所述目的寄存器数量为一个；

当所述源寄存器数量为一个时，所述源寄存器标识与所述目的寄存器标识不同；

当所述源寄存器数量为多个时，所有所述源寄存器中每一个源寄存器标识均与所述目的寄存器标识不同；或者，当所述源寄存器数量为多个时，所有所述源寄存器中存在一个源寄存器标识与所述目的寄存器标识相同。
一种电子设备，其特征在于，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行如权利要求1-12中一个或多个所述的向量混洗方法。