WO2023104145A1 - 向量移位方法、处理器及电子设备 - Google Patents
向量移位方法、处理器及电子设备 Download PDFInfo
- Publication number
- WO2023104145A1 WO2023104145A1 PCT/CN2022/137506 CN2022137506W WO2023104145A1 WO 2023104145 A1 WO2023104145 A1 WO 2023104145A1 CN 2022137506 W CN2022137506 W CN 2022137506W WO 2023104145 A1 WO2023104145 A1 WO 2023104145A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- shift operation
- shift
- operation result
- vector
- source
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Executing Machine-Instructions (AREA)
- Advance Control (AREA)
Abstract
一种向量移位方法、处理器及电子设备。所述方法包括:接收指令,该指令包括:寄存器标识和移位参数(101);寄存器标识包括源寄存器标识和目的寄存器标识;源寄存器标识用于表征源寄存器,源寄存器为存储执行向量移位操作时被操作的源元素的寄存器;目的寄存器标识用于表征目的寄存器,目的寄存器为存储执行向量移位操作后得到的目标元素的寄存器;移位参数用于指示对源元素执行向量移位操作时所依据的规则;执行指令,根据移位参数对从源寄存器获取的源元素执行向量移位操作,并获取向量移位操作后的目标元素(102);将目标元素写入目的寄存器(103)。该方法能够通过一条指令实现特定功能的向量移位操作,提高了特定功能的执行效率。
Description
本申请要求于2021年12月10日提交中国专利局、申请号为202111509173.2、申请名称为“向量移位方法、处理器及电子设备”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本申请涉及计算机技术领域,特别是涉及一种向量移位方法、处理器及电子设备。
随着多媒体应用的发展,处理器越来越多的计算任务都来自于数字图像处理领域,基于图像的应用成为服务器、桌面计算机、个人移动设备也即嵌入式设备中不可忽视的工作负载。针对数字图像处理软件的实际情况,对指令系统架构进行更新,在处理器中加入对应用中常用操作的指令支持,是处理器发展的一个主要方向,同时也是处理器针对特定应用提升性能的简单且有效的方法,因此越来越多的处理器中增加了单指令多数据流(Single Instruction Multiple Data,SIMD)结构,以支持规则数据集合上的同种操作。
目前,SIMD处理器中普遍引入了移位指令,不同的移位指令能够满足不同的需求,而在现有技术方案中,在实现特定功能的向量移位操作时,需要多条指令实现一系列的操作,操作方式较为复杂,且降低了特定功能的执行效率。
发明内容
本申请提供了一种向量移位方法、处理器及电子设备,以解决现有技术中需要多条指令实现向量位移操作,操作方式较为复杂,降低了特定功能的执行效率的问题。
为了解决上述问题,本申请公开了一种向量移位方法,所述方法包括:
接收指令,所述指令包括:寄存器标识和移位参数;其中,所述寄存器标识包括源寄存器标识和目的寄存器标识;所述源寄存器标识用于表征源寄存器,所述源寄存器为存储执行向量移位操作时被操作的源元素的寄存器;所述目的寄存器标识用于表征目的寄存器,所述目的寄存器为存储执行所述向量移位操作后得到的目标元素的寄存器;所述移位参数用于指示对所述源元素执行向量移位操作时所依据的规则;
执行所述指令,以根据所述移位参数对从所述源寄存器获取的源元素执行向量移位操作,并获取所述向量移位操作后的目标元素;
将所述目标元素写入所述目的寄存器。
为了解决上述问题,本申请公开了一种处理器,包括:
多个向量寄存器,所述多个向量寄存器包括源寄存器与目的寄存器,源寄存器用于存储数据元素;
指令译码单元,用于译码向量移位指令;其中,所述向量移位指令包括:寄存器标识和移位参数,所述寄存器标识包括:源寄存器标识和目的寄存器标识,所述源寄存器标识用于表征源寄存器,所述目的寄存器标识用于表征目的寄存器;
执行单元,响应于所述向量移位指令,根据所述移位参数对从所述源寄存器获取的源元素执行向量移位操作,获取所述向量移位操作后的目标元素,并将所述目标元素写入所述目的寄存器。
为了解决上述问题,本申请公开了一种电子设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行上述一个或多个所述的向量移位方法。
与现有技术相比,本申请包括以下优点:
本申请实施例提供的向量移位方法、处理器及电子设备,通过在向量移位指令中添加寄存器标识和移位参数,通过寄存器标识指示存储执行向量移位操作时被操作的源元素的寄存器,以及存储执行向量移位操作后得到的目标元素的寄存器,并通过移位参数指示对源元素执行向量移位操作时所依据的规则,从而能够通过一条指令,即可实现特定功能的向量移位操作,无需通过多条指令实现特定功能的向量移位操作,操作方式简单,且提高了特定功能的执行效率。
图1是根据本申请实施例一的一种向量移位方法的步骤流程图;
图2是根据本申请实施例的一种目标元素获取方法的步骤流程图;
图3是根据本申请实施例的一种移位运算结果获取方法的步骤流程图;
图4是根据本申请实施例的一种目标元素存储方法的步骤流程图;
图5是根据本申请实施例二的一种向量移位方法的步骤流程图;
图6是根据本申请实施例三的一种向量移位方法的步骤流程图;
图7是根据本申请实施例四的一种向量移位方法的步骤流程图;
图8是根据本申请实施例五的一种处理器的结构框图;
图9是根据本申请实施例六的一种电子设备的结构框图。
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
应当理解,本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。
虽然下面的实施例是参照一种处理器来描述的,但是其他实施例适用于其他类型的集成电路和逻辑设备。可以更容易地将本申请的上述技术和教导应用于其他类型的电路或半导体设备,它们会因更高的流水线吞吐率和改进的性能而受益。本申请的实 施例适用于执行数据操纵的任何处理器或机器。但是,本申请不限于执行256位、128位、64位、32位或16位数据操作的处理器或机器,而是适用于在其中需要操作组合型数据的任何处理器和机器。
在下面的描述中,为了解释的目的,给出了大量具体细节,以提供对本申请的透彻理解。然而,本领域内的技术人员应该认识到这些具体细节对实时本申请来说并不是必需的。在其它情况下,没有详细地给出一些公知的电学结构和电路,以免不必要地混淆本申请。另外,下面的描述提供了多个示例,并且附图示出了各种示例以用于说明。然而,这些示例不应当被理解成限制性的,因为它们只是用来提供本申请的一些示例,而不是用来提供对本申请的所有可能实现的穷举。
虽然下面的例子描述了在执行单元的上下文中的指令处理和分发,但是本申请的其他实施例可以以软件的形式被实现。在一个实施例中,本申请的方法表现为机器可执行指令。所述指令可以被用于使得用这些指令编程的通用或专用处理器执行本申请的步骤。本申请可被作为计算机程序产品或软件来提供,所述产品或软件可包括机器或计算机可读介质,及其上存储有可用来对计算机(或其他电子设备)编程以执行根据本申请的处理器的指令。或者,本申请的步骤可以由包含用于执行所述步骤的硬布线逻辑的专用硬件组件,或由被编程的计算机组件和定制硬件组件的任何组合来执行。这些软件可以存储在系统中的存储器内。
本申请实施例提供的向量移位方法,其执行主体可以是CPU(Central Processing Unit,中央处理器)。
实施例一
参照图1,示出了本申请实施例一的一种向量移位方法的步骤流程图,向量移位过程包括以下步骤:
步骤101:接收指令,所述指令包括:寄存器标识和移位参数。
本申请实施例中,指令是指用于执行向量移位操作的指令,且该指令为供处理器执行的指令;指令包括寄存器标识和移位参数。所述寄存器标识包括源寄存器标识和目的寄存器标识;所述源寄存器标识用于表征源寄存器,所述源寄存器为存储执行向量移位操作时被操作的源元素的寄存器;所述目的寄存器标识用于表征目的寄存器,所述目的寄存器为存储执行所述向量移位操作后得到的目标元素的寄存器;所述移位参数用于指示对所述源元素执行向量移位操作时所依据的规则。
可选地,源寄存器的数量可以为一个,也可以为两个,即源元素来源于一个或两个寄存器,具体地,对于源寄存器的数量可以根据业务需求而设置,本申请实施例对此不加以限制。
可选地,对接收的指令进行译码,获取该指令中包含的移位参数;该移位参数用于指示对源元素执行向量移位操作时所依据的规则,在本示例中,移位参数可以包括移位量和操作码等参数。可选地,操作码为通过二进制方式表示的代码,或者操作码为可以转换为二进制代码的标识符。
在对指令进行译码后,执行步骤102。
步骤102:执行所述指令,以根据所述移位参数对从所述源寄存器获取的源元素执行向量移位操作,并获取所述向量移位操作后的目标元素。
本申请实施例中,在CPU接收到用于执行向量移位操作的指令之后,可以由CPU执行该指令,以根据移位参数对从源寄存器内获取的源元素执行向量移位操作,并获取到向量移位操作后的目标元素。
在获取到执行向量移位操作后的目标元素之后,执行步骤103。
步骤103:将所述目标元素写入所述目的寄存器。
本申请实施例中,在获取到向量移位操作后的目标元素之后,可以将目标元素写入目的寄存器。
可选地,可以根据移位参数确定移位量和移位运算规则,并根据移位量和移位运算规则执行向量移位操作,具体地,可以结合下述具体实现方式进行详细描述。
参照图2,示出了本申请实施例提供的一种目标元素获取方法的步骤流程图,该目标元素获取过程包括以下步骤:
步骤201:根据所述移位参数,确定移位量和移位运算规则;其中,所述执行向量移位操作的源元素为至少一个。
本申请实施例中,源寄存器的数量可以为一个,也可以为多个,目的寄存器的数量为一个,源寄存器标识与目的寄存器标识相同或不相同;源元素的数据类型为半字、字、双字、四字中的任一种。移位量可以用于指示执行向量移位运算时被操作源元素的移位位数;移位量来自于立即数或者移位量寄存器,立即数为移位参数中的由操作码定义的参数,立即数的取值可以参考源元素的数据类型,数据类型由上述操作码定义,移位量寄存器为用于存储移位量的寄存器;当移位量来自于移位量寄存器时,移位量为一组数据,如移位量可以通过包含不同位表达针对不同源元素的移位情况。移位运算规则是指对源元素要执行的一种或多种运算。
在根据移位参数确定出移位量和移位运算规则之后,执行步骤202。
步骤202:根据所述移位量和所述移位运算规则,对所述源寄存器中的源元素执行相应的移位运算,生成移位运算结果。
本申请实施例中,移位运算规则是指用于对源寄存器内的元素进行移位操作方法和/或约束条件。
在根据移位量和移位运算规则对源寄存器中的源元素执行相应的移位运算生成移位运算结果之后,执行步骤203。
步骤203:将所述移位运算结果确定为目标元素。
本申请实施例中,在移位参数中可以包括操作码,该操作码可以用于指示从源寄存器内选取源元素,以及目标元素在目的寄存器中的存储方式,具体地向量移位运算过程可以结合下述实现方式进行详细描述。
参照图3,示出了本申请实施例提供的一种移位运算结果生成方法的步骤流程图,该移位运算结果生成过程包括以下步骤:
步骤301:根据所述操作码,从所述源寄存器中选取执行所述向量移位运算的源元素,并将选取的所述源元素确定为被操作数。
本申请实施例中,移位参数可以包括移位量和操作码。移位量可以用于指示执行向量移位运算时被操作源元素的移位位数。操作码可以用于表征对源寄存器中源元素和目的寄存器中目标元素所执行的移位运算规则。
可选地,所述指令格式为“操作码目的寄存器,源寄存器,移位量”。示例性地,所述指令可以表示为“[X]VSSR.{B.H/H.W/W.D/D.Q/BU.H/HU.W/WU.D/DU.Q}vd/xd,vj/xj,ui”;其中,[X]VSSR表示操作码中的指令名称,[X]为可选项,根据寄存器的类型确定,{B.H/H.W/W.D/D.Q/BU.H/HU.W/WU.D/DU.Q}中“.”之前部分表示操作码中目标元素的数据类型,“.”之后部分表示操作码中源元素的数据类型,B表示字节,H表示半字,W表示字,D表示双字,Q表示四字,U表示无符号;vd/xd表示目的寄存器,vj/xj表示源寄存器,同时,vd/xd还可以同时表示源寄存器,vj和vd为位数相同的寄存器,xj和xd为位数相同的寄存器;ui表示立即数,即立即数即为移位量。示例性地,所述指令还可以表示为“[X]VSSR.{B.H/H.W/W.D/D.Q/BU.H/HU.W/WU.D/DU.Q}vd/xd,vj/xj,vk/xk”;其中,[X]VSSR、{B.H/H.W/W.D/D.Q/BU.H/HU.W/WU.D/DU.Q}、vd/xd和vj/xj表示的含义同上一示例,vk/xk表示移位量寄存器。
在根据操作码从源寄存器中选取执行向量移位元素的源元素并将选取的源元素确定为被操作数之后,执行步骤302。
步骤302:根据所述操作码,对所述被操作数执行相应的移位运算,生成移位运算结果。
本申请实施例中,在确定被操作数之后,可以根据操作码对被操作数执行相应的移位运算,以生成移位运算结果,该移位运算结果中包含的元素即为目标元素。
在生成移位运算结果之后,执行步骤401。
参照图4,示出了本申请实施例提供的一种目标元素存储方法的步骤流程图,该目标元素存储过程包括以下步骤:
步骤401:根据所述操作码,确定所述目标元素在所述目的寄存器中的存储方式。
在本申请实施例中,存储方式是指将目标元素存储至目的寄存器的规则。可选地,存储方式主要表示目标元素存储至目的寄存器的位置规则;示例性地,存储方式可以包括将目标元素中的高半部分数据存储至目的寄存器该目标元素所在位置的高半部分,或者,将目标元素中的低半部分数据存储至目的寄存器该目标元素所在位置的低半部分,或者,将目标元素中指定范围数据存储至目的寄存器该目标元素所在位置的指定地址范围内。
在根据操作码确定出目标元素在目的寄存器中的存储方式之后,执行步骤402。
步骤402:按照所述存储方式,将所述目标元素存储至所述目的寄存器中。
本申请实施例中,在获取到移位运算结果之后,可以将移位运算结果确定为目标元素,在根据操作码确定出目标元素在目的寄存器中的存储方式之后,可以将目标元素存储至目的寄存器中。
现有技术中,若于实现向量移位操作,需要根据向量移位需求,通过多条指令实现向量移位;向量移位需求根据实际应用确定。例如,向量移位需求为针对两个向量寄存器中被操作数右移截断至半宽,那么至少需要两条右移指令、两条截断指令和一条饱和至半宽指令才能实现该向量移位需求。本申请实施例中,实现了包含移位参数的指令,不同的移位参数能够实现不同移位需求,进而采用一条移位指令能够实现多种向量移位需求有效降低了系统开销,提高了特定功能向量移位的执行效率。
下面通过实施例二至实施例四详细描述不同操作码和不同移位量情况下的向量移位指令实现过程。
实施例二
本申请实施例中,操作码可以为第一类型向量操作码,源寄存器包括第一源寄存器和第二源寄存器;可以通过第一类型向量操作码从源寄存器内获取源元素,并对源元素执行向量移位操作,如图5所示,向量移位指令的处理方式可以包括:
步骤501:接收指令,所述指令包括:寄存器标识和移位参数。
本申请实施例中,指令的含义和指令包含的参数如实施例一所述,在此不再赘述。
可选地,源寄存器的数量为两个,即源元素来自两个不同的寄存器;当所述源寄存器数量为多个时,所有所述源寄存器中每一个源寄存器标识均与所述目的寄存器标识不同;或者,当所述源寄存器数量为多个时,所有所述源寄存器中存在一个源寄存器标识与所述目的寄存器标识相同。
可选地,对接收的指令进行译码,获取该指令中包含的移位参数;该移位参数用于指示对源元素执行向量移位操作时所依据的规则,在本示例中,移位参数可以包括移位量和操作码等参数。
步骤502:根据所述移位参数,确定移位量和移位运算规则。
本申请实施例中,所述执行向量移位操作的源元素为至少一个,所述移位量为立即数,所述移位运算规则为操作码,所述操作码为第一类型向量操作码;所述立即数为大于等于0的正整数。
可选地,所述第一类型向量操作码为通过二进制方式表示的代码,或者操作码为可以转换为二进制代码的标识符。指令格式为“操作码目的寄存器,源寄存器,移位量”。当所述操作码为第一类型向量操作码时,在具体实现中,指令可以表示为“VSSR第一类型.{B.H/H.W/W.D/D.Q/BU.H/HU.W/WU.D/DU.Q}vd,vj,ui第一类型”;VSSR第一类型为第一类型向量操作码中的指令名称,{B.H/H.W/W.D/D.Q/BU.H/HU.W/WU.D/DU.Q}为第一类型操作码中用于指示源元素和目标元素的数据类型的参数,B表示字节,H表示半字,W表示字,D表示双字,Q表示四字,U表示无符号;vd同时表示目的寄存器和源寄存器,vj表示源寄存器;ui第一类型表示当操作码为第一类型向量操作码时,指令中包含的立即数。示例性地,VSSR第一类型1.B.H为可以转换为二进制形式的第一类型向量操作码,如将VSSR第一类型1.B.H转换为011100110101000001二进制形式的第一类型向量操作码。
进一步地,ui第一类型由操作码定义,ui第一类型的取值可以参考源元素和目标元素的数据类型;该ui第一类型为处于预设范围内(即为ui第一类型∈[最小值,最大值])的参数,即ui第一类型的最小值根据源元素和目标元素的数据类型来确定,ui第一类型的最大值为无穷大。示例性地,当第一类型向量操作码为VSSR第一类型1.B.H时,ui第一类型最小值为ui4;当第一类型向量操作码为VSSR第一类型1.H.W时,ui第一类型最小值为ui5;当第一类型向量操作码为VSSR第一类型1.W.D时,ui第一类型最小值为ui6;当第一类型向量操作码为VSSR第一类型1.D.Q时,ui第一类型最小值为ui7;当第一类型向量操作码为VSSR第一类型1.BU.H时,ui第一类型最 小值为ui4;当第一类型向量操作码为VSSR第一类型1.HU.W时,ui第一类型最小值为ui5;当第一类型向量操作码为VSSR第一类型1.WU.D时,ui第一类型最小值为ui6;当第一类型向量操作码为VSSR第一类型1.DU.Q时,ui第一类型最小值为ui7。由此可见,当源元素数据类型为半字,且目标元素数据类型为字节时,ui第一类型∈[ui4,无穷大];当源元素数据类型为字,且目标元素数据类型为半字时,ui第一类型∈[ui5,无穷大];当源元素数据类型为双字,且目标元素数据类型为字时,ui第一类型∈[ui6,无穷大];当源元素数据类型为四字,且目标元素数据类型为双字时,ui第一类型∈[ui7,无穷大];其中,该目标元素可以为无符号数,也可以为有符号数。
在根据移位参数确定出移位量和移位运算规则之后,执行步骤503。
步骤503:根据所述第一类型向量操作码,将第一源寄存器中的所有源元素确定为一被操作数,将第二源寄存器中的所有源元素确定为另一被操作数。
本申请实施例中,根据所述第一类型向量操作码,可以将第一源寄存器中的全部元素作为源元素,或者将第一源寄存器中的部分元素作为源元素;也可以将第二源寄存器中的全部元素作为源元素,或者将第二源寄存器中的部分元素作为源元素。示例性地,第一源寄存器为寄存器vd,第二源寄存器为寄存器vj,可以将第一寄存器vd中的所有元素确定为源元素,同时将第二寄存器vj中的元素确定为源元素,并将第一源寄存器中所有的源元素确定为一被操作数,同时,将第二源寄存器中所有的源元素确定为另一被操作数。
可选地,分别从第一源寄存器和第二源寄存器中选取的源元素数据类型相同,且源元素的数据类型为半字、字、双字、四字中的任一种。
在根据第一类型向量操作码,将所述第一源寄存器中得到的源元素所述第二源寄存器确定为被操作数;之后,执行步骤504。
步骤504:根据所述第一类型向量操作码,将所述第一源元素和所述第二源元素拼接后,生成第一拼接向量。
本申请实施例中,将第一源寄存器中的被操作数和第二源寄存器中的被操作数左右拼接后,生成第一拼接向量;其中,第一源寄存器中的被操作数和第二源寄存器中的被操作数进行左右拼接的位置设置,根据指令中源寄存器标识的位置确定,即当第一源寄存器标识为指令中紧随第一类型向量操作码的源寄存器标识,第二源寄存器标识为指令中位于第一源寄存器标识之后的源寄存器标识时,第一源寄存器中的被操作数位于左侧,第二源寄存器中的被操作数位于右侧,生成第一拼接向量;当第二源寄存器标识为指令中紧随第一类型向量操作码的源寄存器标识,第一源寄存器标识为指令中位于第一源寄存器标识之后的源寄存器标识时,第二源寄存器中的被操作数位于左侧,第一源寄存器中的被操作数位于右侧,生成第一拼接向量。示例性地,当指令格式为“第一类型向量操作码vd,vj,立即数”时,表示第一源寄存器为vd,第二源寄存器为vj,目的寄存器为vd,那么第一源寄存器中的所有源元素整体视为一被操作数,记为被操作数vd,第二源寄存器中的所有源操作数整体被视为另一被操作数,记为被操作数数vj,第一拼接向量为“被操作数vd被操作数vj”。
可选地,第一源寄存器中的被操作数和第二源寄存器中的被操作数还可以元素为单位进行交叉拼接,生成第一拼接向量;其中,在交叉拼接时,在源寄存器中位置信 息相同的源元素为一组进行交叉,不同组在第一拼接向量中的位置根据源元素的地址从高到低依次排列;不同寄存器中每两个元素为一组进行拼接时的左右位置设置,根据指令中源寄存器标识的位置确定,此处与上例相同,在此不再赘述。
示例性地,第一源寄存器中的被操作数包括“源元素1(位置信息为a)、源元素2(位置信息为b)和源元素3(位置信息为c)”,第二源寄存器中的被操作数为“源元素4(位置信息为a)、源元素5(位置信息为b)和源元素6(位置信息为c)”,假设第一源元素所对应的源寄存器标识位于指令中左侧的位置,第二源元素所对应的源寄存器标识位于指令中右侧的位置,左侧和右侧为两个源寄存器位置标识的相对位置;将两个被操作数进行左右拼接得到的结果可以为“源元素1源元素2源元素3源元素4源元素5源元素6”;或者,将位置信息同为a的源元素1和源元素4视为一组进行交叉拼接,将位置信息同为b的源元素2和源元素5视为一组进行交叉拼接,将位置信息同为c的源元素3和源元素6视为一组进行交叉拼接,最终得到的第一拼接向量为“源元素1源元素4源元素2源元素5源元素3源元素6”。
可选地,若第一为N位,第二源寄存器中的被操作数为N位,则第一拼接向量为2N位;N为大于0的正整数。第一源寄存器中的被操作数的位数可以根据第一源寄存器中包含的元素与该元素数据类型对应的比特位确定;第二源寄存器中的被操作数的位数可以根据第二源寄存器中包含的元素与该元素数据类型对应的比特位确定。
在生成第一拼接向量之后,执行步骤505。
步骤505:根据所述立即数,对所述第一拼接向量中每个源元素均进行移位舍入饱和至半宽操作,生成第一初始移位运算结果。
本申请实施例中,第一拼接向量中包含多个元素(源元素);根据立即数,对第一拼接向量中每个元素均进行移位舍入饱和至半宽操作,移位量即为立即数,以生成第一初始移位运算结果;其中,移位操作为右移操作;所述移位操作包括逻辑移位和算术移位;饱和至半宽表示对被处理数据,按照其数据位宽减半后的二进制数据所能表达的取值范围进行数值饱和处理,处理后的数据与处理前的宽度相关;可选地,处理后的数据仍保留与处理前的宽度的倍数(如1/2)。
可选地,对所述第一拼接向量中每个源元素均进行移位,每个元素的移位量相同,均为立即数。示例性地,如果第一拼接向量包含元素1、元素2和元素3,移位量为ui4,那么对第一拼接向量进行移位即为分别对元素1移位ui4位,对元素2移位ui4位,对元素3移位ui4位;元素包含多个位,对元素进行右移即为将元素中每一位向右移动预设位,舍弃元素中右移出的位数,并在元素中左侧空余的位置上设置指定值;其中,该预设位和指定值都是根据具体情况设置的值。
可选地,对第一拼接向量中每个源元素均进行移位舍入操作包含四种舍入情况:向偶舍入、向零舍入、向上舍入和向下舍入。较佳地,对第一拼接向量进行移位舍入操作为,对第一拼接向量进行移位向上舍入操作。
可选地,针对任意一元素x,其位数为2N,移位量为sa,对该元素x执行逻辑右移舍入饱和至半宽操作,包括:
第一步,根据移位量,得到运算结果A;具体来说,当移位量为0时,得到的运算结果A即为元素x;当移位量为大于0的整数时,设置中间运算结果,该中间运算 结果的低位为元素x的自sa位至第2N-1位数据、剩余sa位的高位均为0,该中间运算结果的位数为2N;将中间运算结果与元素x的sa-1位进行相加,得到运算结果A。其中,N为大于0的正整数,sa为立即数。
第二步,获取运算结果的值,将该值和指定数据进行比较,根据比较结果得到最终运算结果。具体来说,比较运算结果A的值和2N-1的大小,若运算结果A大于2N-1,则最终运算结果为N位均为1的数据;否则,最终运算结果为运算结果A的第0位至第N-1位。元素x为有符号向量或者无符号向量。
可选地,针对任意一元素x,其位数为2N,移位量为sa,对该元素x执行算术右移舍入饱和至半宽操作,包括:
第一步,根据移位量,得到运算结果A;具体来说,当移位量为0时,得到的运算结果A即为元素x;当移位量为大于0的整数时,设置中间运算结果,该中间运算结果的低位为元素x的自sa位至第2N-1位数据、剩余sa位的高位均为元素x中2N-1位的数据,该中间运算结果的位数为2N;将中间运算结果A与元素x的sa-1位进行相加,得到运算结果A。其中,N为大于0的正整数,sa为立即数。
第二步,获取运算结果的值,将该值和指定数据进行比较,根据比较结果得到最终运算结果。具体来说,分别比较运算结果A的值和2N-1的大小,以及运算结果A的值和-2N-1的大小;若运算结果A大于2N-1,则最终运算结果为最高位为0,其余低位为1,最终运算结果的位数为N;若运算结果A小于-2N-1,则最终运算结果为最高位为1,其余低位为0,最终运算结果的位数为N;若运算结果A小于2N-1且大于-2N-1,则最终运算结果为运算结果A的第0位至第N-1位,最终运算结果的位数为N。
其中,上述对舍入后数据饱和至半宽包括对舍入后数据有符号饱和至半宽和对舍入后数据无符号饱和至半宽。
结合本申请实施例,上述示例中的最终运算结果即为本申请实施例中的第一初始移位运算结果中的元素,运算结果A即为本申请实施例中的第一拼接向量中的元素。
在根据立即数将第一拼接向量进行移位舍入饱和至半宽操作生成第一初始移位运算结果之后,执行步骤506。
步骤506:对所述第一初始移位运算结果执行取位操作,生成移位运算结果。
本申请实施例中,所述取位操作包括对所述第一初始移位运算结果中包含的每个元素均取连续低半部分数据,对所述第一初始移位运算结果中包含的每个元素均取连续高半部分数据,对所述第一初始移位运算结果中包含的每个元素均取中间连续指定位元素数据,对所述第一初始移位运算结果中包含的每个元素均取非连续指定位数据中的任意一种。
在对第一初始移位运算结果执行取位操作生成移位运算结果之后,执行步骤507。
步骤507:将所述移位运算结果中的元素作为目标元素,依次写入所述目的寄存器中。
本申请实施例中,目标元素的数据类型根据源元素的数据类型确定;可选地,目标元素的数据类型所对应比特位数为源元素数据类型所对应比特位数的一半。示例性地,当源元素的数据类型为半字时,目标元素的数据类型为字节;当源元素的数据类型为字时,目标元素的数据类型为半字;当源元素的数据类型为双字时,目标元素的 数据类型为字;当源元素的数据类型为四字时,目标元素的数据类型为双字。源元素可以为有符号数据,也可以为无符号数据。
可选地,在确定目标元素之后,将目标元素依次写入目的寄存器的方式,包括:确定每个目标元素在第一初始移位运算结果中的位置信息;将目标元素依次写入目的寄存器中与该目标元素对应的位置信息相匹配的位置。其中,该位置信息表示元素在第一初始移位运算结果中的顺序;将目标元素依次写入目的寄存器中与该目标元素对应的位置信息相匹配的位置,即为,将目标元素从高位到低位依次写入目的寄存器中第N/2-1位至第0位的位置,或者将目标元素从低位到高位依次写入目的寄存器中第0位至第N/2-1的位置。
结合本申请实施例中根据第一类型向量操作码获取目标元素的过程,第一类型向量操作码还可以包括四种(即第一向量操作码、第二向量操作码、第三向量操作码和第四第一类型向量操作码),以分别指示不同的向量移位操作,具体地,可以结合下述四种具体实现方式进行详细描述。
在本申请的第一种具体实现方式中,所述第一类型向量操作码为第一向量操作码,具体地处理方式可以包括:
子步骤A1:根据所述立即数,对所述第一拼接向量中每个源元素均进行逻辑右移舍入有符号饱和至半宽操作,生成第一初始移位运算结果。
本申请实施例中,第一类型向量操作码可以为第一向量操作码,该第一向量操作码可以用于指示对第一拼接向量进行逻辑右移舍入有符号饱和至半宽操作;所述第一拼接向量为2N位,N为大于0的正整数,较佳地,N为128位。
可选地,逻辑右移是指不考虑符号位的元素移动方式,即元素每右移一位,最高位补一位0即可。有符号饱和是指针对16位的数按照8位的数有符号值的范围(-128到+127)进行饱和。半宽是指位宽段的一半。针对任意一向量,执行逻辑右移有符号饱和至半宽操作的过程前文已经描述,在此不再赘述。
当第一类型向量操作码为第一向量操作码时,可以根据立即数对第一拼接向量中每个源元素均进行逻辑右移舍入有符号饱和至半宽操作,以生成第一初始移位运算结果。
子步骤A2:分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
本申请实施例中,在生成第一初始移位运算结果之后,可以分别选取第一初始移位运算结果包含的每个元素中连续低半部分数据,并将选取操作后的连续低半部分元素确定为移位运算结果。
可选地,当第一源寄存器中包含的第一源元素和第二源元素均为N/2位,第二源寄存器中包含的第三源元素和第四源元素为N/2位时,第一初始移位运算结果为N位,则移位运算结果即为第一初始移位运算结果自第0位至第N/2-1位所表示的数据。
进一步地,对移位运算结果中每个目标元素分别取低半部分,依次写入目的寄存器中每个目标元素分别对应的存储位置。示例性地,第一源寄存器为向量寄存器vd,第二源寄存器为向量寄存器vj,向量寄存器vd中包含第一源元素和第二源元素,向量寄存器vj包含第三源元素和第四源元素,第一源元素、第二源元素、第三源元素和 第四源元素的位数均为N/2,通过向量移位指令可以将第一源元素和第二源元素左右拼接在一起形成一个2N(2N=256)位向量,分别对该向量中每个源元素进行逻辑右移舍入有符号饱和至半宽操作,移位量来自于立即数,针对第一源元素的移位结果取低半部分元素作为一目标元素、针对第二源元素的移位结果取低半部分元素作为一目标元素、针对第三源元素的移位结果取低半部分元素作为一目标元素、针对第四源元素的移位结果取低半部分元素作为一目标元素依次写入向量寄存器vd中。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。
在本申请的第二种具体实现方式中,所述第一类型向量操作码为第二向量操作码,具体地处理方式可以包括:
子步骤B1:根据所述立即数,对所述第一拼接向量中每个源元素均进行算术右移舍入有符号饱和至半宽操作,生成第一初始移位运算结果。
本申请实施例中,第一类型向量操作码可以为第二向量操作码,第二向量操作码可以用于指示对第一拼接向量进行算术右移舍入有符号饱和至半宽操作;所述第一拼接向量为2N位,N为大于0的正整数,较佳地,N为128位。
可选地,算术右移是指需要考虑符号位的元素移动方式,即元素每右移一位,若符号位为1,则在左边最高位补1,否则,在左边最高位补0。有符号饱和和半宽含义与前文描述相同,在此不再赘述。针对任意一向量,执行算术右移有符号饱和至半宽操作的过程前文已经描述,在此不再赘述。
当第一类型向量操作码为第三向量操作码时,可以根据立即数对第一拼接向量中每个源元素均进行算术右移舍入有符号饱和至半宽操作,以生成第一初始移位运算结果。
在根据立即数将第一拼接向量进行算术右移舍入有符号饱和至半宽操作生成第一初始移位运算结果之后,执行子步骤B2。
子步骤B2:分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
本申请实施例中,在生成第一初始移位运算结果之后,可以分别选取第一初始移位运算结果包含的每个元素中连续低半部分数据,并将选取操作后的连续低半部分元素确定为移位运算结果。
可选地,当第一源寄存器中包含的第一源元素和第二源元素均为N/2位,第二源寄存器中包含的第三源元素和第四源元素均为N/2位时,第一初始移位运算结果为N位,则移位运算结果即为第一初始移位运算结果自第0位至第N/2-1位所表示的数据。
进一步地,对移位运算结果中每个目标元素分别取低半部分,依次写入目的寄存器中每个目标元素分别对应的存储位置。示例性地,第一源寄存器为向量寄存器vd,第二源寄存器为向量寄存器vj,向量寄存器vd中包含第一源元素和第二源元素,向量寄存器vj包含第三源元素和第四源元素,第一源元素、第二源元素、第三源元素和第四源元素的位数均为N/2,通过向量移位指令可以将第一源元素和第二源元素左右拼接在一起形成一个2N(2N=256)位向量,分别对该向量中每个源元素进行算术右移舍入有符号饱和至半宽操作,移位量来自于立即数,针对第一源元素的移位结果取低 半部分元素作为一目标元素、针对第二源元素的移位结果取低半部分元素作为一目标元素、针对第三源元素的移位结果取低半部分元素作为一目标元素、针对第四源元素的移位结果取低半部分元素作为一目标元素依次写入向量寄存器vd中。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。
在本申请的第三种具体实现方式中,所述第一类型向量操作码为第三向量操作码,具体地处理方式可以包括:
子步骤C1:根据所述立即数,对所述第一拼接向量中每个源元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第一初始移位运算结果。
本申请实施例中,第一类型向量操作码可以为第三向量操作码,第三向量操作码可以用于指示将第一拼接向量进行逻辑右移舍入无符号饱和至半宽操作;所述第一拼接向量为2N位,N为大于0的正整数,较佳地,N为128位。
可选地,舍入无符号饱和是指针对16位的数按照8位的数有符号值的范围(0~255)进行饱和。逻辑右移和饱和至半宽含义与前文描述相同,在此不再赘述。针对任意一向量,执行逻辑右移无符号饱和至半宽操作的过程前文已经描述,在此不再赘述。
当第一类型向量操作码为第三向量操作码时,可以根据立即数对第一拼接向量中每个源元素均进行逻辑右移舍入无符号饱和至半宽操作,以生成第一初始移位运算结果。
在根据立即数将第一拼接向量进行逻辑右移舍入无符号饱和至半宽操作生成第一初始移位运算结果之后,执行子步骤C2。
子步骤C2:分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
本申请实施例中,在生成第一初始移位运算结果之后,可以分别选取第一初始移位运算结果包含的每个元素中连续低半部分数据,并将选取操作后的连续低半部分元素确定为移位运算结果。
可选地,当第一源寄存器中包含的第一源元素和第二源元素均为N/2位,第二源寄存器中包含的第三源元素和第四源元素均为N/2位时,第一初始移位运算结果为N位,则移位运算结果即为第一初始移位运算结果自第0位至第N/2-1位所表示的数据。
进一步地,对移位运算结果中每个目标元素分别取低半部分,依次写入目的寄存器中每个目标元素分别对应的存储位置。示例性地,第一源寄存器为向量寄存器vd,第二源寄存器为向量寄存器vj,向量寄存器vd中包含第一源元素和第二源元素,向量寄存器vj包含第三源元素和第四源元素,第一源元素、第二源元素、第三源元素和第四源元素的位数均为N/2,通过向量移位指令可以将第一源元素和第二源元素左右拼接在一起形成一个2N(2N=256)位向量,分别对该向量中每个源元素进行逻辑右移舍入无符号饱和至半宽操作,移位量来自于立即数,针对第一源元素的移位结果取低半部分元素作为一目标元素、针对第二源元素的移位结果取低半部分元素作为一目标元素、针对第三源元素的移位结果取低半部分元素作为一目标元素、针对第四源元素的移位结果取低半部分元素作为一目标元素依次写入向量寄存器vd中。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示 例,不作为对本申请实施例的唯一限制。
在本申请的第四种具体实现方式中,所述第一类型向量操作码为第四第一类型向量操作码,具体地处理方式可以包括:
子步骤D1:根据所述立即数,对所述第一拼接向量中每个源元素均进行算术右移舍入无符号饱和至半宽操作,生成第一初始移位运算结果。
本申请实施例中,第一类型向量操作码可以为第四第一类型向量操作码,第四第一类型向量操作码可以用于指示对第一拼接向量进行算术右移舍入无符号饱和至半宽操作;所述第一拼接向量为2N位,N为大于0的正整数,较佳地,N为128位。
可选地,算术右移、舍入、半宽含义与前文描述相同,在此不再赘述。逻辑右移和饱和至半宽含义与前文描述相同,在此不再赘述。针对任意一向量,执行算术右移无符号饱和至半宽操作的过程前文已经描述,在此不再赘述。
当第一类型向量操作码为第四第一类型向量操作码时,可以根据立即数对第一拼接向量中每个源元素均进行算术右移舍入无符号饱和至半宽操作,以生成第一初始移位运算结果。
在根据立即数将第一拼接向量进行算术右移舍入无符号饱和至半宽操作生成第一初始移位运算结果之后,执行子步骤D2。
子步骤D2:分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
本申请实施例中,在生成第一初始移位运算结果之后,可以选取第一初始移位运算结果包含的每个元素中连续低半部分数据,并将选取操作后的连续低半部分元素确定为移位运算结果。
可选地,当第一源寄存器中包含的第一源元素和第二源元素均为N/2位,第二源寄存器中包含的第三源元素和第四源元素均为N/2位时,第一初始移位运算结果为N位,则移位运算结果即为第一初始移位运算结果自第0位至第N/2-1位所表示的数据。
进一步地,对移位运算结果中每个目标元素分别取低半部分,依次写入目的寄存器中每个目标元素分别对应的存储位置。示例性地,第一源寄存器为向量寄存器vd,第二源寄存器为向量寄存器vj,向量寄存器vd中包含第一源元素和第二源元素,向量寄存器vj包含第三源元素和第四源元素,第一源元素、第二源元素、第三源元素和第四源元素的位数均为N/2,通过向量移位指令可以将第一源元素和第二源元素左右拼接在一起形成一个2N(2N=256)位向量,分别对该向量中每个源元素进行算术右移舍入无符号饱和至半宽操作,移位量来自于立即数,针对第一源元素的移位结果取低半部分元素作为一目标元素、针对第二源元素的移位结果取低半部分元素作为一目标元素、针对第三源元素的移位结果取低半部分元素作为一目标元素、针对第四源元素的移位结果取低半部分元素作为一目标元素依次写入向量寄存器vd中。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。
采用本申请技术方案,通过执行包含第一向量操作码和立即数的指令,实现了两个源元素的逻辑移位舍入有符号饱和至半宽等一系列操作;通过执行包含第二向量操作码和立即数的指令,实现了两个源元素的算术移位舍入有符号饱和至半宽等一系列 操作;通过执行包含第三向量操作码和立即数的指令,实现了两个源元素的逻辑移位舍入无符号饱和至半宽等一系列操作;通过执行包含第四第一类型向量操作码和立即数的指令,实现了两个源元素的算术移位舍入无符号饱和至半宽等一系列操作。因而,采用本发明技术方案,能够通过不同的移位参数实现不同的移位需求,进而采用一条移位指令能够实现多种向量移位需求有效降低了系统开销,提高了特定功能向量移位的执行效率。
实施例三
本申请实施例中,操作码可以为第二类型向量操作码,源寄存器包括第一源寄存器和第二源寄存器;该第二类型向量操作码可以用于指示分别在第一源寄存器和第二源寄存器中执行选取操作,并执行相应的向量移位操作,如图6所示,向量移位指令的处理方法可以包括:
步骤601:接收指令,所述指令包括:寄存器标识和移位参数。
本申请实施例中,指令的含义和指令包含的参数如实施例一和实施例二所述,在此不再赘述。
可选地,源寄存器的数量为两个,即源元素来自两个不同的寄存器;当所述源寄存器数量为多个时,所有所述源寄存器中每一个源寄存器标识均与所述目的寄存器标识不同;或者,当所述源寄存器数量为多个时,所有所述源寄存器中存在一个源寄存器标识与所述目的寄存器标识相同。相较于实施例二来讲,本申请实施例中源寄存器和目的寄存器的位数均为实施例二中所述源寄存器和目的寄存器位数的2倍;示例性地,若本申请实施例中源寄存器的位数为256位,则实施例二中源寄存器的位数为128位。
可选地,对接收的指令进行译码,获取该指令中包含的移位参数;该移位参数用于指示对源元素执行向量移位操作时所依据的规则,在本示例中,移位参数可以包括移位量和操作码等参数。
步骤602:根据所述移位参数,确定移位量和移位运算规则。
本申请实施例中,所述执行向量移位操作的源元素为至少一个,所述移位量为立即数,所述移位运算规则为操作码,所述操作码为第二类型向量操作码;所述立即数为大于等于0的正整数。
可选地,所述第二类型向量操作码为通过二进制方式表示的代码,或者操作码为可以转换为二进制代码的标识符。指令格式为“操作码目的寄存器,源寄存器,移位量”。当所述操作码为第二类型向量操作码时,在具体实现中,指令可以表示为“XVSSR第二类型.{B.H/H.W/W.D/D.Q/BU.H/HU.W/WU.D/DU.Q}xd,xj,ui第二类型”;XVSSR第二类型为第二类型向量操作码中的指令名称,{B.H/H.W/W.D/D.Q/BU.H/HU.W/WU.D/DU.Q}为第二操作码中用于指示源元素和目标元素的数据类型的参数,B表示字节,H表示半字,W表示字,D表示双字,Q表示四字;U表示无符号;xd同时表示目的寄存器和源寄存器,xj表示源寄存器;ui第二类型表示当操作码为第二类型向量操作码时,指令中包含的立即数。示例性地,XVSSR第二类型1.B.H为可以转换为二进制形式的第二类型向量操作码,如将XVSSR第二类型 1.B.H转换为011101110101000001二进制形式的第二类型向量操作码。
进一步地,ui第二类型为根据源元素和目标元素的数据类型来定义的参数;该ui第二类型的取值范围,取值方式均与实施例二中ui第一类型相同,在此不再赘述。
在根据移位参数确定出移位量和移位运算规则之后,执行步骤603。
步骤603:根据所述第二类型向量操作码,分别在第一源寄存器和第二源寄存器中执行选取操作,得到第一被操作数和第二被操作数。
本申请实施例中,根据所述第二类型向量操作码,在第一源寄存器执行选取操作,得到第一被操作数,以及在第二源寄存器中执行选取操作,得到第二被操作数;其中,第一被操作数和第二被操作数数据类型相同,且第一被操作数中源元素和第二被操作数中元素的数据类型为半字、字、双字、四字中的任一种。
可选地,所述选取操作包括对所述第一源寄存器和第二源寄存器中每个元素均选取连续低半部分数据、对所述第一源寄存器和第二源寄存器中每个元素均选取连续高半部分数据、对所述第一源寄存器和第二源寄存器中每个元素均选取中间连续指定位数据、对所述第一源寄存器寄存器和第二源寄存器中每个元素均选取非连续指定位数据中的任意一种。
可选地,对第一源寄存器和对第二源寄存器执行的选取操作相同。示例性地,例如,对第一源寄存器执行选取操作即为分别从第一源寄存器包含的每个元素中选取连续低半部分数据,同时对第二源寄存器执行选取操作即为分别对第二源寄存器包含的每个元素中选取连续低半部分元素;又如,对第一源寄存器执行选取操作即为分别从第一源寄存器包含的每个元素中选取连续高半部分元素,同时分别对第二源寄存器执行选取操作即为对第二源寄存器包含的每个元素中选取连续高半部分元素;再如,分别对第一源寄存器执行选取操作即为从第一源寄存器包含的每个元素中选取连续中间指定位元素,同时分别对第二源寄存器包含的每个元素中执行选取操作即为对第二源寄存器选取连续中间指定位元素;还如,分别对第一源寄存器执行选取操作即为从第一源寄存器包含的每个元素中选取非连续指定位元素,同时分别对第二源寄存器执行选取操作即为对第二源寄存器包含的每个元素中选取非连续指定位元素。
在根据第二类型向量操作码分别在第一源寄存器和第二源寄存器中执行选取操作,得到第一被操作数和第二被操作数之后,执行步骤604。
步骤604:将所述第一源寄存器中除所述第一被操作数之外的数据确定为第三被操作数,将所述第二源寄存器中除所述第二被操作数之外的数据确定为第四被操作数。
本申请实施例中,第三被操作数和第四被操作数数据类型与第一被操作数和第二被操作数相同,且第三被操作数中源元素和第四被操作数中元素的数据类型为半字、字、双字、四字中的任一种。
可选地,将第一源寄存器中除第一被操作数之外的数据确定为第三被操作数,并将第二源寄存器中除第二被操作数之外的数据确定为第四被操作数。示例性地,当第一被操作数为第一源寄存器包含的每个元素中连续低半部分的数据时,第三被操作数为第一源寄存器包含的每个元素中连续高半部分的数据;同理,第二被操作数为第一源寄存器每个元素中连续低半部分的元素,第四被操作数为第一源寄存器包含的每个元素中连续高半部分的元素。
在得到第一被操作数、第二被操作数、第三被操作数和第四被操作数之后,执行步骤605。
步骤605:将所述第一被操作数和第二被操作数进行拼接后,生成第二拼接向量,以及将第三被操作数和第四被操作数进行拼接后,生成第三拼接向量。
本申请实施例中,将第一被操作数和第二被操作数左右拼接后,生成第二拼接向量;其中,第一被操作数和第二被操作数进行左右拼接的位置设置,根据指令中源寄存器标识的位置确定,即当第一源寄存器标识为指令中紧随第二类型向量操作码的源寄存器标识,第二源寄存器标识为指令中位于第一源寄存器标识之后的源寄存器标识时,由于第一被操作数来自第一源寄存器,第二被操作数来自第二源寄存器,因而第一被操作数位于左侧,第二被操作数位于右侧,生成第二拼接向量;当第二源寄存器标识为指令中紧随第二类型向量操作码的源寄存器标识,第一源寄存器标识为指令中位于第一源寄存器标识之后的源寄存器标识时,由于第一被操作数来自第一源寄存器,第二被操作数来自第二源寄存器,因而第二被操作数位于左侧,第一被操作数位于右侧,生成第二拼接向量。示例性地,当指令格式为“第二类型向量操作码vd,vj,立即数”时,表示第一源寄存器为vd,第二源寄存器为vj,目的寄存器为vd,那么第一被操作数来自vd(记为第一被操作数vd),第二源元素来自vj(记为第二被操作数vj),第二拼接向量为“第一被操作数vd第二被操作数vj”;同理,当指令格式为“第二类型向量操作码vd,vj,立即数”时,表示第二源寄存器为vd,第一源寄存器为vj,目的寄存器为vd,那么第二被操作数来自vd(记为第二源元素vd),第一被操作数来自vj(记为第一源元素vj),第二拼接向量为“第一被操作数vj第二被操作数vd”。关于第三被操作数和第四被操作数生成第三拼接向量的方式与上述第一被操作数和第二被操作数生成第二拼接向量的方式相同,在此不再赘述。
可选地,第一被操作数和第二被操作数还可以以元素为单位进行交叉拼接,生成第二拼接向量,其中,在交叉拼接时,在源寄存器中地址相同的源元素为一组进行交叉,不同组在第二拼接向量中的位置根据源元素的地址从高到低依次排列;分别来自两个不同寄存器中一个元素为一组进行拼接时的左右位置设置,根据指令中源寄存器标识的位置确定,此处与上例相同,在此不再赘述。示例性地,第一被操作数包括“源元素1(地址为a)、源元素2(地址为b)和源元素3(地址为c)”,第二被操作数为“源元素4(地址为a)、源元素5(地址为b)和源元素6(地址为c)”,将地址同为a的源元素1和源元素4视为一组进行交叉拼接,将地址同为b的源元素2和源元素5视为一组进行交叉拼接,将地址同为c的源元素3和源元素6视为一组进行交叉拼接,假设第一源元素所对应的源寄存器标识位于指令中左侧的位置,第二源元素所对应的源寄存器标识位于指令中右侧的位置,最终得到的第二拼接向量为“源元素1源元素4源元素2源元素5源元素3源元素6”。关于第三被操作数和第四被操作数生成第三拼接向量的方式与该第一被操作数和第二被操作数生成第二拼接向量的方式相同,在此不再赘述。
可选地,若第一被操作数总位数为N位,第二被操作数总位数为N位,则第二拼接向量为2N位;同理,若第三被操作数总位数为N位,第四被操作数总位数为N位,则第三拼接向量为2N位;N为大于0的正整数。第一被操作数的总位数可以根据其包 含的各个元素与该元素数据类型对应的比特位确定;第二被操作数的总位数可以根据其包含的各个元素与该元素数据类型对应的比特位确定。
在得到第二拼接向量和第三拼接向量之后,执行步骤606。
步骤606:根据所述立即数,对所述第二拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第二初始移位运算结果;并根据所述立即数,对所述第三拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第三初始移位运算结果。
本申请实施例中,第二拼接向量中包含多个元素;根据立即数,将第二拼接向量进行移位舍入饱和至半宽操作,即为,将第二拼接向量中的每个元素均执行移位舍入饱和至半宽操作,移位量即为立即数,以生成第二初始移位运算结果;同理,第三拼接向量中包含多个元素;根据立即数,将第三拼接向量进行移位舍入饱和至半宽操作,即为,将第三拼接向量中的每个元素均执行移位舍入饱和至半宽操作,移位量即为立即数,以生成第三初始移位运算结果。其中,移位操作为右移操作;所述移位操作包括逻辑移位和算术移位。
可选地,将所述第二拼接向量进行移位,包括:对第二拼接向量中每一个元素进行移位操作,移位量即为立即数,即每个元素移位量相同,均为立即数。示例性地,如果第二拼接向量包含元素1、元素2和元素3,移位量为ui4,那么对第一拼接向量进行移位即为分别对元素1移位ui4位,对元素2移位ui4位,对元素3移位ui4位。
可选地,将所述第三拼接向量进行移位,包括:对第三拼接向量中每一个元素进行移位操作,移位量即为立即数,即每个元素移位量相同,均为立即数。示例性地,如果第三拼接向量包含元素4、元素5和元素6,移位量为ui4,那么对第三拼接向量进行移位即为分别对元素4移位ui4位,对元素5移位ui4位,对元素6移位ui4位。
可选地,对第二拼接向量/第三拼接向量进行移位舍入操作包含四种舍入情况:向偶舍入、向零舍入、向上舍入和向下舍入。较佳地,对第二拼接向量/第三拼接向量进行移位舍入操作为,对第二拼接向量/第三拼接向量进行移位向上舍入操作。
针对第二拼接向量/第三拼接向量进行逻辑右移舍入饱和至半宽操作的方法与实施例二中描述的方式相同,在此不再赘述;同理,针对第二拼接向量/第三拼接向量进行算术右移舍入饱和至半宽操作的方法与实施例二中描述的方式相同,在此不再赘述。
在生成第二初始移位运算结果和第三初始移位运算结果之后,执行步骤607。
步骤607:对所述第二初始移位运算结果执行取位操作,生成第一移位运算结果;以及,对所述第三初始移位运算结果执行取位操作,生成第二移位运算结果。
本申请实施例中,所述执行取位操作包括对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取连续低半部分数据、对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取连续高半部分数据、对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取中间连续指定位数据、对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取非连续指定位数据中的任意一种。
在生成第一移位运算结果和第二移位运算结果之后,执行步骤608和步骤609。
步骤608:根据所述第一移位运算结果的取位操作位置,将所述第一移位运算结 果写入所述目的寄存器相应的存储位置。
步骤609:根据所述第二移位运算结果的取位操作位置,将所述第二移位运算结果写入所述目的寄存器相应的存储位置。
本申请实施例中,将第一移位运算结果和第二移位运算结果中的元素作为目标元素,写入目的寄存器相应的存储位置。
可选地,目标元素的数据类型根据源元素的数据类型确定;可选地,目标元素的数据类型所对应比特位数为源元素数据类型所对应比特位数的一半。示例性地,当源元素的数据类型为半字时,目标元素的数据类型为字节;当源元素的数据类型为字时,目标元素的数据类型为半字;当源元素的数据类型为双字时,目标元素的数据类型为字;当源元素的数据类型为四字时,目标元素的数据类型为双字。源元素可以为有符号数据,也可以为无符号数据。
可选地,在确定目标元素之后,将目标元素依次写入目的寄存器的方式,包括:确定每个目标元素在第二移位运算结果和第三移位运算结果中的位置信息;将目标元素依次写入目的寄存器中与该目标元素对应的位置信息相匹配的位置。其中,该位置信息表示元素在第二移位运算结果和第三移位运算结果中的顺序;将目标元素依次写入目的寄存器中与该目标元素对应的位置信息相匹配的位置,即为,确定每个目标元素在目的寄存器中的存储位置;针对每个目标元素,将来自第二移位运算结果的目标元素存储至该目标元素所在存储位置的高半部分,将来自第三移位运算结果的目标元素存储至该目标元素所在存储位置的低半部分;或者,针对每个目标元素,将来自第二移位运算结果的目标元素存储至该目标元素所在存储位置的低半部分,将来自第三移位运算结果的目标元素存储至该目标元素所在存储位置的高半部分。
结合本申请实施例中根据第二类型向量操作码获取目标元素的过程,第二类型向量操作码可以包括:第五向量操作码、第六向量操作码、第七向量操作码和第八向量操作码,以分别指示不同的向量移位操作,具体地,可以结合下述具体实现方式进行详细描述。
本申请实施例的第一种具体实现方式中,所述第二类型向量操作码为第五向量操作码,所述第一被操作数为所述第一源寄存器中每个元素的连续低半部分数据;所述第二被操作数为所述第二源寄存器中每个元素的连续低半部分数据;所述第三被操作数为第一源寄存器中每个元素的连续高半部分数据;所述第四被操作数为第二源寄存器中每个元素的连续高半部分数据,具体地处理方式可以包括:
子步骤E1:根据所述立即数,对所述第二拼接向量中每个元素均进行逻辑右移舍入有符号饱和至半宽操作,生成第二初始移位运算结果;以及根据所述立即数,对所述第三拼接向量中每个元素均进行逻辑右移舍入有符号饱和至半宽操作,生成第三初始移位运算结果。
本申请实施例中,第二类型向量操作码可以为第五向量操作码,该第五向量操作码可以用于指示对第二拼接向量执行逻辑右移舍入有符号饱和至半宽操作和每个元素中数据选取操作,以及用于指示对第三拼接向量执行逻辑右移舍入有符号饱和至半宽操作和每个元素中数据选取操作;所述第二拼接向量和第三拼接向量均为2N位,N为大于0的正整数,较佳地,N为128位。逻辑右移、舍入、半宽、有符号饱和的定义 与实施例二相同,逻辑右移舍入有符号饱和至半宽操作的过程与实施例二相同,在此不再赘述。
在生成第二初始移位运算结果和第三初始移位运算结果之后,执行子步骤E2。
子步骤E2:分别选取所述第二初始移位运算结果包含的每个元素中连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并分别选取所述第三初始移位运算结果包含的每个元素中连续高半部分数据,将选取的所述数据确定为第二移位运算结果。
本申请实施例中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素。
在得到第一移位运算结果和第二移位运算结果之后,执行子步骤E3和子步骤E4。
子步骤E3:将所述第一移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的低半部分。
子步骤E4:将所述第二移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的高半部分。
可选地,当第一被操作数的总位数为N位,第二被操作数的总位数为N位时,第二初始移位运算结果为N位,则第二移位运算结果即为第二初始移位运算结果自第0位至第N/2-1位所表示的数据。示例性地,第一源寄存器为向量寄存器xd,第二源寄存器为向量寄存器xj,将xd中每个元素的低半部分数据作为第一被操作数,将xj中每个元素的低半部分数据作为第二被操作数,通过向量移位指令可以将第一被操作数和第二被操作数左右拼接在一起形成一个2N(2N=256)位向量,分别对该向量中每个元素进行逻辑右移舍入有符号饱和至半宽操作,移位量来自于立即数,对第一初始移位运算结果中包含的每个元素均取低半部分后,将每个取低半部分操作后的元素作为第一目标元素,分别写入向量寄存器xd中每个第一目标元素所在位置的低半部分中。其中,第一被操作数中源元素和第二被操作数中源元素的数据类型为半字、字、双字、四字任一种情况,第一被操作数中源元素和第二被操作数中源元素数据类型相同;对应于上述源元素的数据类型,写入向量寄存器xd中目标元素的数据类型为字节、半字、字、双字,关于源元素数据类型和目标元素数据类型之前的对应关系在前文中已经描述,在此不再赘述。
可选地,当第三被操作数的总位数为N位,第四被操作数的总位数为N位时,第三初始移位运算结果为N位,则第三移位运算结果即为第三初始移位运算结果自第N/2位至第N-1位所表示的数据。示例性地,第一源寄存器为向量寄存器xd,第二源寄存器为向量寄存器xj,将xd中每个元素的高半部分数据作为第三被操作数,将xj中每个元素的高半部分数据作为第四被操作数,通过向量移位指令可以将第三被操作数和第四被操作数左右拼接在一起形成一个2N(2N=256)位向量,分别对该向量中每个元素进行逻辑右移舍入有符号饱和至半宽操作,移位量来自于立即数,对第二初始移位运算结果中包含的每个元素均取高半部分后,将每个取高半部分操作后的元素作为第二目标元素,分别写入向量寄存器xd中每个第二目标元素所在位置的高半部分中。其中,第三被操作数中源元素和第四被操作数中源元素的数据类型为半字、字、双字、四字任一种情况,第三被操作数中源元素和第四被操作数中源元素数据类型相同;对 应于上述源元素的数据类型,写入向量寄存器xd中目标元素的数据类型为字节、半字、字、双字,关于源元素数据类型和目标元素数据类型之前的对应关系在前文中已经描述,在此不再赘述。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。
本申请实施例的第二种具体实现方式中,所述第二类型向量操作码为第六向量操作码;所述第一被操作数为所述第一源寄存器中每个元素的连续低半部分数据;所述第二被操作数为所述第二源寄存器中每个元素的连续高半部分数据;所述第三被操作数为第一源寄存器中每个元素的连续高半部分数据;所述第四被操作数为第二源寄存器中每个元素的连续高半部分数据;具体地处理方式可以包括:
子步骤F1:根据所述立即数,对所述第二拼接向量中每个元素均进行算术右移舍入有符号饱和至半宽操作,生成第二初始移位运算结果;以及根据所述立即数,对所述第三拼接向量中每个元素均进行算术右移舍入有符号饱和至半宽操作,生成第三初始移位运算结果。
本申请实施例中,第二类型向量操作码可以为第六向量操作码,该第六向量操作码可以用于指示第二拼接向量执行算术右移舍入有符号饱和至半宽操作和每个元素中数据选取操作,以及用于指示第三拼接向量执行算术右移舍入有符号饱和至半宽操作和元素选取操作;所述第二拼接向量和第三拼接向量均为2N位,N为大于0的正整数,较佳地,N为128位。算术右移、舍入、半宽、有符号饱和的定义与实施例二相同,算术右移舍入有符号饱和至半宽操作的过程与实施例二相同,在此不再赘述。
在生成第二初始移位运算结果和第三初始移位运算结果之后,执行子步骤F2。
子步骤F2:分别选取所述第二初始移位运算结果包含的每个元素中连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并选取所述第三初始移位运算结果包含的每个元素中连续高半部分数据,将选取的所述数据确定为第二移位运算结果。
本申请实施例中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素。
在得到第一移位运算结果和第二移位运算结果之后,执行子步骤F3和子步骤F4。
子步骤F3将所述第一移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的低半部分。
子步骤F4:将所述第二移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的高半部分。
可选地,当第一被操作数的总位数为N位,第二被操作数的总位数为N位时,第二初始移位运算结果为N位,则第二移位运算结果即为第二初始移位运算结果自第0位至第N/2-1位所表示的数据。示例性地,第一源寄存器为向量寄存器xd,第二源寄存器为向量寄存器xj,将xd中每个元素的低半部分数据作为第一被操作数,将xj中每个元素的低半部分数据作为第二被操作数,通过向量移位指令可以将第一被操作数和第二被操作数左右拼接在一起形成一个2N(2N=256)位向量,分别对该向量中每个元素进行算术右移舍入有符号饱和至半宽操作,移位量来自于立即数,对第一初始移位运算结果中包含的每个元素均取低半部分后,将每个取低半部分操作后的元素作为 第一目标元素,分别写入向量寄存器xd中每个第一目标元素所在位置的低半部分中。其中,第一被操作数中源元素和第二被操作数中源元素的数据类型为半字、字、双字、四字任一种情况,第一被操作数中源元素和第二被操作数中源元素数据类型相同;对应于上述源元素的数据类型,写入向量寄存器xd中目标元素的数据类型为字节、半字、字、双字,关于源元素数据类型和目标元素数据类型之前的对应关系在前文中已经描述,在此不再赘述。
可选地,当第三被操作数的总位数为N位,第四被操作数的总位数为N位时,第三初始移位运算结果为N位,则第三移位运算结果即为第三初始移位运算结果自第N/2位至第N-1位所表示的数据。示例性地,第一源寄存器为向量寄存器xd,第二源寄存器为向量寄存器xj,将xd中每个元素的高半部分数据作为第三被操作数,将xj中每个元素的高半部分数据作为第四被操作数,通过向量移位指令可以将第三被操作数和第四被操作数左右拼接在一起形成一个2N(2N=256)位向量,分别对该向量中每个元素进行算术右移舍入有符号饱和至半宽操作,移位量来自于立即数,对第二初始移位运算结果中包含的每个元素均取高半部分后,将每个取高半部分操作后的元素作为第二目标元素,分别写入向量寄存器xd中每个第二目标元素所在位置的高半部分中。其中,第三被操作数中源元素和第四被操作数中源元素的数据类型为半字、字、双字、四字任一种情况,第三被操作数中源元素和第四被操作数中源元素数据类型相同;对应于上述源元素的数据类型,写入向量寄存器xd中目标元素的数据类型为字节、半字、字、双字,关于源元素数据类型和目标元素数据类型之前的对应关系在前文中已经描述,在此不再赘述。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。
本申请实施例的第三种具体实现方式中,所述第二类型向量操作码为第七向量操作码;所述第一被操作数为所述第一源寄存器中每个元素的连续低半部分数据;所述第二被操作数为所述第二源寄存器中每个元素的连续低半部分数据;所述第三被操作数为第一源寄存器中每个元素的连续高半部分数据;所述第四被操作数为第二源寄存器中每个元素的连续高半部分数据;具体地处理方式可以包括:
子步骤G1:根据所述立即数,对所述第二拼接向量中每个元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第二初始移位运算结果;以及,根据所述立即数,对所述第三拼接向量中每个元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第三初始移位运算结果
本申请实施例中,第二类型向量操作码可以为第七向量操作码,该第七向量操作码可以用于指示对第二拼接向量执行逻辑右移舍入无符号饱和至半宽操作和每个元素中数据选取操作,以及用于指示对第三拼接向量执行逻辑右移舍入无符号饱和至半宽操作和每个元素中数据选取操作;所述第二拼接向量和第三拼接向量均为2N位,N为大于0的正整数,较佳地,N为128位。逻辑右移、舍入、半宽的定义与实施例二相同,逻辑右移舍入无符号饱和至半宽操作的过程与实施例二相同,在此不再赘述。
在生成第二初始移位运算结果和第三初始移位运算结果之后,执行子步骤G2。
子步骤G2:分别选取所述第二初始移位运算结果包含的每个元素中连续低半部分 数据,将选取的所述数据确定为第一移位运算结果;并选取所述第三初始移位运算结果包含的每个元素中连续高半部分数据,将选取的所述数据确定为第二移位运算结果。
本申请实施例中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素。
在确定出第一移位运算结果和第二移位运算结果之后,执行子步骤G3和子步骤G4。
子步骤G3:将所述第一移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的低半部分。
子步骤G4:将所述第二移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的高半部分。
可选地,当第一被操作数的总位数为N位,第二被操作数的总位数为N位时,第二初始移位运算结果为N位,则第二移位运算结果即为第二初始移位运算结果自第0位至第N/2-1位所表示的数据。示例性地,第一源寄存器为向量寄存器xd,第二源寄存器为向量寄存器xj,将xd中每个元素的低半部分数据作为第一被操作数,将xj中每个元素的低半部分数据作为第二被操作数,通过向量移位指令可以将第一被操作数和第二被操作数左右拼接在一起形成一个2N(2N=256)位向量,分别对该向量中每个元素进行逻辑右移舍入无符号饱和至半宽操作,移位量来自于立即数,对第一初始移位运算结果中包含的每个元素均取低半部分后,将每个取低半部分操作后的元素作为第一目标元素,分别依次写入向量寄存器xd中每个第一目标元素所在位置的低半部分中。其中,第一被操作数中源元素和第二被操作数中源元素的数据类型为半字、字、双字、四字任一种情况,第一被操作数中源元素和第二被操作数中源元素数据类型相同;对应于上述源元素的数据类型,写入向量寄存器xd中目标元素的数据类型为字节、半字、字、双字,关于源元素数据类型和目标元素数据类型之前的对应关系在前文中已经描述,在此不再赘述。
可选地,当第三被操作数的总位数为N位,第四被操作数的总位数为N位时,第三初始移位运算结果为N位,则第三移位运算结果即为第三初始移位运算结果自第N/2位至第N-1位所表示的数据。示例性地,第一源寄存器为向量寄存器xd,第二源寄存器为向量寄存器xj,将xd中每个元素的高半部分数据作为第三被操作数,将xj中每个元素的高半部分数据作为第四被操作数,通过向量移位指令可以将第三被操作数和第四被操作数左右拼接在一起形成一个2N(2N=256)位向量,分别对该向量中每个元素进行逻辑右移舍入无符号饱和至半宽操作,移位量来自于立即数,对第二初始移位运算结果中包含的每个元素均取高半部分后,将每个取高半部分操作后的元素作为第二目标元素,分别写入向量寄存器xd中每个第二目标元素所在位置的高半部分中。其中,第三被操作数中源元素和第四被操作数中源元素的数据类型为半字、字、双字、四字任一种情况,第三被操作数中源元素和第四被操作数中源元素数据类型相同;对应于上述源元素的数据类型,写入向量寄存器xd中目标元素的数据类型为字节、半字、字、双字,关于源元素数据类型和目标元素数据类型之前的对应关系在前文中已经描述,在此不再赘述。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示 例,不作为对本申请实施例的唯一限制。
本申请实施例的第四种具体实现方式中,所述第二类型向量操作码为第八向量操作码;所述第一被操作数为所述第一源寄存器中每个元素的连续低半部分数据;所述第二被操作数为所述第二源寄存器中每个元素的连续低半部分数据;所述第三被操作数为第一源寄存器中每个元素的连续高半部分数据;所述第四被操作数为第二源寄存器中每个元素的连续高半部分数据;具体地处理方式可以包括:
子步骤H1:根据所述立即数,对所述第二拼接向量中诶个元素均进行算术右移舍入无符号饱和至半宽操作,生成第二初始移位运算结果;根据所述立即数,对所述第三拼接向量中每个元素均进行算术右移舍入无符号饱和至半宽操作,生成第三初始移位运算结果。
本申请实施例中,第二类型向量操作码可以为第八向量操作码。该第八向量操作码可以用于指示第二拼接向量执行算术右移舍入无符号饱和至半宽操作和每个元素中数据选取选取操作,以及用于指示第三拼接向量执行算术右移舍入无符号饱和至半宽操作和每个元素中数据选取选取操作;所述第二拼接向量和第三拼接向量为2N位,N为大于0的正整数,较佳地,N为128位。算术右移、舍入、半宽的定义与实施例二相同,算术右移舍入无符号饱和至半宽操作的过程与实施例二相同,在此不再赘述。
在生成第二初始移位运算结果和第三初始移位运算结果之后,执行子步骤H2。
子步骤H2:分别选取所述第二初始移位运算结果包含的每个元素中连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并分别选取所述第三初始移位运算结果包含的每个元素中连续高半部分数据,将选取的所述数据确定为第二移位运算结果。
本申请实施例中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素。
在得到第一移位运算结果和第二移位运算结果之后,执行子步骤H3和子步骤H4。
子步骤H3:将所述第一移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的低半部分。
子步骤H4:将所述第二移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的高半部分。
可选地,当第一被操作数的总位数为N位,第二被操作数的总位数为N位时,第二初始移位运算结果为N位,则第二移位运算结果即为第二初始移位运算结果自第0位至第N/2-1位所表示的数据。示例性地,第一源寄存器为向量寄存器xd,第二源寄存器为向量寄存器xj,将xd中每个元素的低半部分数据作为第一被操作数,将xj中每个元素的低半部分数据作为第二被操作数,通过向量移位指令可以将第一被操作数和第二被操作数左右拼接在一起形成一个2N(2N=256)位向量,分别对该向量中每个元素进行算术右移舍入无符号饱和至半宽操作,移位量来自于立即数,对第一初始移位运算结果中包含的每个元素均取低半部分后,将每个取低半部分操作后的元素作为第一目标元素,分别写入向量寄存器xd中每个第一目标元素所在位置的低半部分中。其中,第一被操作数中源元素和第二被操作数中源元素的数据类型为半字、字、双字、四字任一种情况,第一被操作数中源元素和第二被操作数中源元素数据类型相同;对 应于上述源元素的数据类型,写入向量寄存器xd中目标元素的数据类型为字节、半字、字、双字,关于源元素数据类型和目标元素数据类型之前的对应关系在前文中已经描述,在此不再赘述。
可选地,当第三被操作数的总位数为N位,第四被操作数的总位数为N位时,第三初始移位运算结果为N位,则第三移位运算结果即为第三初始移位运算结果自第N/2位至第N-1位所表示的数据。示例性地,第一源寄存器为向量寄存器xd,第二源寄存器为向量寄存器xj,将xd中每个元素的高半部分数据作为第三被操作数,将xj中每个元素的高半部分数据作为第四被操作数,通过向量移位指令可以将第三被操作数和第四被操作数左右拼接在一起形成一个2N(2N=256)位向量,分别对该向量中每个元素进行算术右移舍入无符号饱和至半宽操作,移位量来自于立即数,对第二初始移位运算结果中包含的每个元素均取高半部分后,将每个取高部分操作后的元素作为第二目标元素,分别写入向量寄存器xd中每个第二目标元素所在位置的高半部分中。其中,第三被操作数中源元素和第四被操作数中源元素的数据类型为半字、字、双字、四字任一种情况,第三被操作数中源元素和第四被操作数中源元素数据类型相同;对应于上述源元素的数据类型,写入向量寄存器xd中目标元素的数据类型为字节、半字、字、双字,关于源元素数据类型和目标元素数据类型之前的对应关系在前文中已经描述,在此不再赘述。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。
采用本申请技术方案,通过执行包含第五向量操作码和立即数的指令,实现了两个宽位源元素的逻辑移位舍入有符号饱和至半宽等一系列操作;通过执行包含第六向量操作码和立即数的指令,实现了两个宽位源元素的算术移位舍入有符号饱和至半宽等一系列操作;通过执行包含第七向量操作码和立即数的指令,实现了两个宽位源元素的逻辑移位舍入无符号饱和至半宽等一系列操作;通过执行包含第八向量操作码和立即数的指令,实现了两个宽位源元素的算术移位舍入无符号饱和至半宽等一系列操作。因而,采用本发明技术方案,能够通过不同的移位参数实现不同的移位需求,进而采用一条移位指令能够实现多种向量移位需求有效降低了系统开销,提高了特定功能向量移位的执行效率。
实施例四
本申请实施例中,所述操作码为第三类型向量操作码,所述源寄存器为第一源寄存器,该第二类型向量操作码可以用于指示分别在第一源寄存器中执行选取操作,并执行相应的向量移位操作,如图7所示,向量移位指令的处理方法可以包括:
步骤701:接收指令,所述指令包括:寄存器标识和移位参数。
本申请实施例中,指令的含义和指令包含的参数如实施例一至实施例三所述,在此不再赘述。
可选地,源寄存器的数量为一个,即所有源元素来自同一个源寄存器;目的寄存器的数量为一个;源寄存器和目的寄存器相同或不同。较佳地,第一源寄存器的位数为128位或256位。
可选地,对接收的指令进行译码,获取该指令中包含的移位参数;该移位参数用于指示对源元素执行向量移位操作时所依据的规则,在本示例中,移位参数可以包括移位量和操作码等参数。
步骤702:根据所述移位参数,确定移位量和移位运算规则。
本申请实施例中,所述执行向量移位操作的源元素为至少一个;所述移位量来自移位量寄存器,所述移位运算规则为操作码,所述操作码为第三类型向量操作码;所述移位量寄存器中包含的每个元素移位量为大于等于0的正整数。
可选地,所述第三类型向量操作码为通过二进制方式表示的代码,或者操作码为可以转换为二进制代码的标识符。指令格式为“操作码目的寄存器,源寄存器,移位量”。当所述操作码为第三类型向量操作码时,在具体实现中,指令表示为“[X]VSSR第三类型.{B.H/H.W/W.D/BU.H/HU.W/WU.D}vd/xd,vj/xj,vk第三类型/xk第三类型”;[X]VSSR第三类型为第三类型向量操作码中的指令名称,{B.H/H.W/W.D/BU.H/HU.W/WU.D}为第二操作码中用于指示源元素和目标元素的数据类型的参数,B表示字节,H表示半字,W表示字,D表示双字;vd/xd同时表示目的寄存器和源寄存器,vj/xj表示源寄存器;vk第三类型/vk第三类型表示当操作码为第三类型向量操作码时,指令中包含的移位量寄存器标识,该移位量寄存器包含的二进制为一个数组,数组中包含的参数数量和目标元素的数量相同,且数据中包含的参数相同或不同。示例性地,VSSR第三类型1.B.H为可以转换为二进制形式的第三类型向量操作码,如将VSSR第三类型1.B.H转换为01110001000000001二进制形式的第三类型向量操作码。
在根据移位参数确定出移位量和移位运算规则之后,执行步骤703。
步骤703:根据所述第三类型向量操作码,在所述第一源寄存器中执行选取操作,得到第五被操作数。
本申请实施例中,所述选取操作包括对所述第一源寄存器中每个元素均选取连续低半部分元素、对所述第一源寄存器中每个元素均选取连续高半部分元素、对所述第一源寄存器中每个元素均选取中间连续指定位元素、对所述第一寄存器中每个元素均选取非连续指定位元素的任意一种。其中,第五被操作数中源元素的数据类型为半字、字、双字中的任一种。
可选地,第一源寄存器中包括2N位数据,该2N位数据可以对应多个半字元素、字元素、或者双字元素;在所述第一源寄存器中执行选取操作,得到第五被操作数,包括:将所述第一源寄存器中每M位数据为一组数据组,每个数据组包含至少一个源元素;并将所有数据组所对应的所有源元素确定为第五被操作数;其中,M和N均为大于0的正整数,M≤N;源元素和数据的对应关系,根据源元素的数据类型和数据比特位之间的转换关系确定。
可选地,不同的数据组之间不存在地址相同的数据,或者,不同的数据组之间存在部分地址相同的数据;其中,所述地址为第一源寄存器中数据在该第一源寄存器中的位置信息,在该第一源寄存器中,每个数据的地址唯一标识。
较佳地,N为M的倍数。示例性地,N=128,M=128,第一源寄存器包括256位数据,则将第一源寄存器中数据每128位为一组,共划分为两组(第一数据组和第二数据组),第一数据组为第一源寄存器中第0~127位数据,第二数据组为第一源寄存器 中第128~255位数据,第一数据组和第二数据组之间无地址相同的数据;若源元素的数据类型为半字,则第一数据组包含8个半字源元素;若源元素的数据类型为字,则第一数据组包含4个字源元素;若源元素的数据类型为双字,则第一数据组包含2个双字源元素。
在根据第三类型向量操作码对第一源寄存器执行选取操作得到第五被操作数之后,执行步骤704。
步骤704:根据所述第三类型向量操作码和所述移位量,对所述第五被操作数进行移位舍入饱和至半宽操作,生成第四初始移位运算结果。
本申请实施例中,移位量来自移位量寄存器,该移位量寄存器中存储的内容可以为一组数据,该组数据包含多个移位值,每个移位值分别针对第五被操作数中每个源元素,不同源元素的移位值可以相同,也可以不同,移位值的数量与第五被操作数的源元素数量相同;或者,移位值的数量与第四初始移位运算结果相同。
可选地,当移位值的数量与第五被操作数的源元素数量相同时,每一个移位值对应第五被操作数中的一个源元素,第五被操作数中的每个源元素,根据移位量,进行移位舍入饱和至半宽操作,生成第四初始移位运算结果。示例性地,第五被操纵数中包括源元素1、源元素2、源元素3和源元素4,移位量寄存器中包含四个移位值(移位值1、移位值2、移位值3和移位值4),源元素1对应的移位量为移位值1,源元素2对应的移位量为移位值2,源元素3对应的移位量为移位值3,源元素4对应的移位量为移位值4,则源元素1根据移位值1进行移位,源元素2根据移位值2进行移位,源元素3根据移位值3进行移位,源元素4根据移位值4进行移位。
可选地,当移位值的数量与第四初始移位运算结果相同时,根据移位值的数量,对第五被操作数划分为多组元素组,使元素组数量与移位值的数量相同,即每一个移位值对应一个元素组,第五被操作数中的每个源元素,根据其所在元素组对应的移位量,进行移位舍入饱和至半宽操作,生成第四初始移位运算结果。示例性地,第五被操纵数中包括源元素1、源元素2、源元素3和源元素4,移位量寄存器中包含四个移位值(移位值1和移位值2),源元素1和源元素2组成第一元素组,第一元素组对应的移位量为移位值1,源元素3和源元素4组成第二元素组,第二元素组对应的移位量为移位值2,则源元素1和源元素2根据移位值1进行移位,源元素3和源元素4根据移位值2进行移位。
在生成第四初始移位运算结果之后,执行步骤705。
步骤705:对所述第四初始移位运算结果执行取位操作,生成移位运算结果。
本申请实施例中,所述取位操作包括对所述第四初始移位运算结果取连续低半部分元素、对所述第四初始移位运算结果取连续高半部分元素、对所述第四初始移位运算结果中取中间连续指定位元素、对所述第四初始移位运算结果中取非连续指定位元素中的任意一种。
在生成移位运算结果之后,执行步骤706。
步骤706:将所述移位运算结果中的数据,依次写入所述目的寄存器中的相应位置。
本申请实施例中,在生成移位运算结果之后,可以确定移位运算结果中的每个数 据分别对应的目标元素,将每个数据依次写入目的寄存器中每个目标元素存储位置。
可选地,目标元素的数据类型根据源元素的数据类型确定;可选地,目标元素的数据类型所对应比特位数为源元素数据类型所对应比特位数的一半。示例性地,当源元素的数据类型为半字时,目标元素的数据类型为字节;当源元素的数据类型为字时,目标元素的数据类型为半字;当源元素的数据类型为双字时,目标元素的数据类型为字。源元素可以为有符号数据,也可以为无符号数据。
可选地,在确定目标元素之后,将目标元素依次写入目的寄存器的方式,包括:确定每个目标元素在移位运算结果的位置信息;将目标元素依次写入目的寄存器中与该目标元素对应的位置信息相匹配的位置。其中,该位置信息表示元素在移位运算结果中的顺序;将目标元素依次写入目的寄存器中与该目标元素对应的位置信息相匹配的位置,即为,将目标元素从高位到低位依次写入目的寄存器中第N/2-1位至第0位的位置,或者将目标元素从低位到高位依次写入目的寄存器中第0位至第N/2-1的位置。
在将移位运算结果中的元素作为目标元素依次写入目的寄存器中之后,执行步骤707。
步骤707:根据所述第三类型向量操作码,设置所述目的寄存器中未写入所述数据位置的值。
在将移位运算结果中的数据依次写入目的寄存器中相应位置之后,可以根据第三类型向量操作码,设置目的寄存器中未写入数据位置的值。
结合本申请实施例中根据第三类型向量操作码获取目标元素的过程,第三类型向量操作码可以包括第九向量操作码、第十向量操作码、第十一向量操作码和第十二向量操作码,以分别指示不同的向量移位操作。具体地,可以结合下述具体实现方式进行详细描述。
在本申请实施例的第一种具体实现方式中,所述第三类型向量操作码为第九向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素,具体地处理方法可以包括:
子步骤K1:根据所述移位量,将所述第五被操作数进行逻辑右移舍入有符号饱和至半宽操作,生成第四初始移位运算结果。
本申请实施例中,在得到第九向量操作码之后,可以根据移位量将第五被操作数包含的每个元素进行逻辑右移舍入有符号饱和至半宽操作,以生成第四初始移位运算结果;其中,移位量来自移位量寄存器。
可选地,第一源寄存器中包括2N位数据,该2N位数据可以对应多个半字元素、字元素、或者双字元素;在所述第一源寄存器中执行选取操作,得到第五被操作数,包括:将所述第一源寄存器中每M位数据为一组数据组,并将每个数据组所对应的所有源元素确定为第五被操作数。根据所述移位量,将所述第五被操作数包含的每个元素进行逻辑右移舍入有符号饱和至半宽操作,生成第四初始移位运算结果,包括:确定第五被操作数中每个源元素对应于移位量寄存器中的移位值,分别根据每个源元素对应的移位值,对每个源元素执行逻辑右移舍入有符号饱和至半宽操作,得到第四初始移位运算结果。
进一步地,逻辑右移、舍入、半宽、有符号饱和的定义与实施例二相同,逻辑右移舍入有符号饱和至半宽操作的过程与实施例二相同,在此不再赘述。
在生成第四初始移位运算结果之后,执行子步骤K2。
子步骤K2:分别选取所述第四初始移位运算结果中包含每个元素的连续低半部分数据,将选取操作后的元素确定为移位运算结果。
本申请实施例中,在生成第四初始移位运算结果之后,可以分别选取第四初始移位运算结果中每个元素的连续低半部分数据,并将选取操作后每个元素的连续低半部分数据确定为移位运算结果。
在得到移位运算结果之后,执行子步骤K3。
子步骤K3:根据预设值对目的寄存器中的存储位置进行划分,生成多个存储区。
本申请实施例中,预设值是指用于对向量寄存器内的存储位置进行划分的值,预设值即为目标元素占据的数据比特位宽,对于预设值的具体数值可以根据业务需求而定,本申请实施例对此不加以限制。较佳地,该预设值为一个值,根据该预设值划分的每个存储区大小相同(每个存储区存储的数据比特位宽相同)。
在生成多个存储区之后,执行子步骤K4。
子步骤K4:将所述移位运算结果中的数据,依次写入每个存储区的低半部分。
本申请实施例中,当第五被操作数为M位时,第四初始移位运算结果为M/2位,则移位运算结果为第四初始移位运算结果中自第0位至第M/4-1位所表示的数据。示例性地,第一源寄存器为向量寄存器xj,第一源寄存器为2M,将xj中每M位对应的源元素作为第五被操作数,通过向量移位指令可以将第五被操作数包含的每M位中各个源元素进行逻辑右移舍入有符号饱和至半宽操作,得到第四初始移位运算结果;移位量来自于移位量寄存器;第四初始移位运算结果中对每个元素取低半部分作为每个目标元素的低半部分依次写入向量寄存器xd的每M位目标元素的低半部分中,且该每M位中每个目标元素的高半部分数据置0。其中,第五被操作数中源元素的数据类型为半字、字、双字任一种情况;对应于上述源元素的数据类型,写入向量寄存器xd中目标元素的数据类型为字节、半字、字,关于源元素数据类型和目标元素数据类型之前的对应关系在前文中已经描述,在此不再赘述。
在将移位运算结果中的数据依次写入每个存储区的低半部分之后,执行子步骤K5。
子步骤K5:分别将每个存储区中未写入数据位置的值置零。
本申请实施例中,在将移位运算结果作中的元素为目标元素依次写入每个存储区的低半部分之后,可以分别将每个存储区中未写入目标元素位置的值置零。
示例性地,第一源寄存器为vj/xj,第三类型向量操作码为第九向量操作码,则执行向量移位指令,即为,对第一源寄存器vj/xj中每128位中每个源元素进行逻辑右移舍入有符号饱和至半宽操作,将移位结果中每个元素取低半部分依次写入目的寄存器vd/xd中每128位每个目标元素的低半部分,目的寄存器的每128位中每个目标元素的高半部分置0;每个元素的移位量来自移位量寄存器vk/xk,源元素的数据类型为半字、字、双字中的任一种。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。
本申请实施例的第二种具体实现方式中,所述第三类型向量操作码为第十向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素,具体地处理方式可以包括:
子步骤M1:根据所述移位量,将所述第五被操作数进行算术右移舍入有符号饱和至半宽操作,生成第四初始移位运算结果。
本申请实施例中,在得到第十向量操作码之后,可以根据移位量将第五被操作数包含的每个元素进行算术右移舍入有符号饱和至半宽操作,以生成第四初始移位运算结果;其中,移位量来自移位量寄存器。
可选地,第一源寄存器中包括2N位数据,该2N位数据可以对应多个半字元素、字元素、或者双字元素;在所述第一源寄存器中执行选取操作,得到第五被操作数,包括:将所述第一源寄存器中每M位数据为一组数据组,并将每个数据组所对应的所有源元素确定为第五被操作数。根据所述移位量,将所述第五被操作数包含的每个元素进行算术右移舍入有符号饱和至半宽操作,生成第四初始移位运算结果,包括:确定第五被操作数中每个源元素对应于移位量寄存器中的移位值,分别根据每个源元素对应的移位值,对每个源元素执行算术右移舍入有符号饱和至半宽操作,得到第四初始移位运算结果。
进一步地,算术右移、舍入、半宽、有符号饱和的定义与实施例二相同,算术右移舍入有符号饱和至半宽操作的过程与实施例二相同,在此不再赘述。
在生成第四初始移位运算结果之后,执行子步骤M2。
子步骤M2:分别选取所述第四初始移位运算结果中包含每个元素的连续低半部分数据,将选取操作后的元素确定为移位运算结果。
本申请实施例中,在生成第四初始移位运算结果之后,可以从第四初始移位运算结果中分别选取每个元素的连续低半部分数据,并将选取操作后每个元素的连续低半部分数据确定为移位运算结果。
在得到移位运算结果之后,执行子步骤M3。
子步骤M3:根据预设值对目的寄存器中的存储位置进行划分,生成多个存储区。
本申请实施例中,预设值是指用于对目的寄存器中的存储位置进行区域划分的数值,预设值即为目标元素占据的数据比特位宽,对于预设值的具体数值可以根据业务需求而定,本申请实施例对此不加以限制。较佳地,该预设值为一个值,根据该预设值划分的每个存储区大小相同(每个存储区存储的数据比特位宽相同)。
在根据预设值对目的寄存器中的存储位置进行划分生成多个存储区之后,执行子步骤M4。
子步骤M4:将所述移位运算结果中的数据,依次写入每个存储区的低半部分。
本申请实施例中,在生成多个存储区以及得到移位运算结果之后,可以将移位运算结果中的元素作为目标元素,依次写入每个存储区的低半部分。
可选地,当第五被操作数为M位时,第四初始移位运算结果为M/2位,则移位运算结果为第四初始移位运算结果中自第0位至第M/4-1位所表示的数据。示例性地,第一源寄存器为向量寄存器xj,第一源寄存器为2M,将xj中每M位对应的源元素作为第五被操作数,通过向量移位指令可以将第五被操作数包含的每M位中各个源元素 进行算术右移舍入有符号饱和至半宽操作,得到第四初始移位运算结果;移位量来自于移位量寄存器;第四初始移位运算结果中对每个元素取低半部分作为每个目标元素依次写入向量寄存器xd的每M位的每个目标元素的低半部分中,且该每M位中每个目标元素的高半部分数据置0。其中,第五被操作数中源元素的数据类型为半字、字、双字任一种情况;对应于上述源元素的数据类型,写入向量寄存器xd中目标元素的数据类型为字节、半字、字,关于源元素数据类型和目标元素数据类型之前的对应关系在前文中已经描述,在此不再赘述。
在将移位运算结果中的数据依次写入每个存储区的低半部分之后,执行子步骤子步骤M5。
子步骤M5:分别将每个存储区中未写入所述数据位置的值置零。
本申请实施例中,在将移位运算结果中的元素作为目标元素依次写入每个存储区的低半部分之后,可以分别将每个存储区中未写入目标元素位置的值置为0。
示例性地,第一源寄存器为vj/xj,第三类型向量操作码为第九向量操作码,则执行向量移位指令,即为,对第一源寄存器vj/xj中每128位中每个源元素进行算术右移舍入有符号饱和至半宽操作,将移位结果中每个元素取低半部分依次写入目的寄存器vd/xd中每128位每个目标元素的低半部分,目的寄存器的每128位中每个目标元素的高半部分置0;每个元素的移位量来自移位量寄存器vk/xk,源元素的数据类型为半字、字、双字中的任一种。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。
在本申请实施例的第三种具体实现方式中,所述第三类型向量操作码为第十一向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素;具体地处理方式可以包括:
子步骤N1:根据所述移位量,将所述第五被操作数进行逻辑右移舍入无符号饱和至半宽操作,生成第四初始移位运算结果。
在本申请实施例中,在得到第十一向量操作码之后,可以根据移位量将第五被操作数包含的每个元素进行逻辑右移舍入无符号饱和至半宽操作,以生成第四初始移位运算结果;其中,移位量来自移位量寄存器。
可选地,第一源寄存器中包括2N位数据,该2N位数据可以对应多个半字元素、字元素、或者双字元素;在所述第一源寄存器中执行选取操作,得到第五被操作数,包括:将所述第一源寄存器中每M位数据为一组数据组,并将每个数据组所对应的所有源元素确定为第五被操作数。根据所述移位量,将所述第五被操作数包含的每个元素进行逻辑右移舍入无符号饱和至半宽操作,生成第四初始移位运算结果,包括:确定第五被操作数中每个源元素对应于移位量寄存器中的移位值,分别根据每个源元素对应的移位值,对每个源元素执行逻辑右移舍入无符号饱和至半宽操作,得到第四初始移位运算结果。
进一步地,逻辑右移、舍入、半宽的定义与实施例二相同,逻辑右移舍入无符号饱和至半宽操作的过程与实施例二相同,在此不再赘述。
在根据移位量将第五被操作数进行逻辑右移舍入无符号饱和至半宽操作生成第四 初始移位运算结果之后,执行子步骤N2。
子步骤N2:分别选取所述第四初始移位运算结果中包含每个元素的连续低半部分数据,将选取操作后的元素确定为移位运算结果。
本申请实施例中,在生成第四初始移位运算结果之后,可以从第四初始移位运算结果中分别选取每个元素的连续低半部分数据,并将选取每个元素的连续低半部分数据确定为移位运算结果。
在得到移位运算结果之后,执行子步骤N3。
子步骤N3:根据预设值对目的寄存器中的存储位置进行划分,生成多个存储区。
本申请实施例中,预设值是指用于对目的寄存器中的存储位置进行区域划分的值,预设值即为目标元素占据的数据比特位宽,对于预设值的具体数值可以根据业务需求而定,本申请实施例对此不加以限制。较佳地,该预设值为一个值,根据该预设值划分的每个存储区大小相同(每个存储区存储的数据比特位宽相同)。
在生成多个存储区之后,执行子步骤N4。
子步骤N4:将所述移位运算结果中的数据,依次写入每个存储区的低半部分。
本申请实施例中,在生成多个存储区,且得到移位运算结果之后,可以将移位运算结果中的元素作为目标元素,依次写入每个存储区的低半部分。
可选地,当第五被操作数为M位时,第四初始移位运算结果为M/2位,则移位运算结果为第四初始移位运算结果中自第0位至第M/4-1位所表示的数据。示例性地,第一源寄存器为向量寄存器xj,第一源寄存器为2M,将xj中每M位对应的源元素作为第五被操作数,通过向量移位指令可以将第五被操作数包含的每M位中各个源元素进行逻辑右移舍入无符号饱和至半宽操作,得到第四初始移位运算结果;移位量来自于移位量寄存器;第四初始移位运算结果中对每个元素取低半部分作为每个目标元素依次写入向量寄存器xd的每M位的每个目标元素的低半部分中,且该每M位中每个目标元素的高半部分数据置0。其中,第五被操作数中源元素的数据类型为半字、字、双字任一种情况;对应于上述源元素的数据类型,写入向量寄存器xd中目标元素的数据类型为字节、半字、字,关于源元素数据类型和目标元素数据类型之前的对应关系在前文中已经描述,在此不再赘述。
在将移位运算结果中的数据依次写入每个存储区的低半部分之后,执行子步骤N5。
子步骤N5:分别将每个存储区中未写入所述数据位置的值置零。
在将移位运算结果中的元素作为目标元素依次写入每个存储区的低半部分之后,可以分别将每个存储区中未写入目标元素位置的值置零。
示例性地,第一源寄存器为vj/xj,第三类型向量操作码为第九向量操作码,则执行向量移位指令,即为,对第一源寄存器vj/xj中每128位中每个源元素进行逻辑右移舍入无符号饱和至半宽操作,将移位结果中每个元素取低半部分依次写入目的寄存器vd/xd中每128位每个目标元素的低半部分,目的寄存器的每128位中每个目标元素的高半部分置0;每个元素的移位量来自移位量寄存器vk/xk,源元素的数据类型为半字、字、双字中的任一种。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。
在本申请的第四种具体实现方式中,所述第三类型向量操作码为第十二向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素;具体地处理方式可以包括:
子步骤S1:根据所述移位量,将所述第五被操作数进行算术右移舍入无符号饱和至半宽操作,生成第四初始移位运算结果。
在本申请实施例中,在得到第十二向量操作码之后,可以根据移位量将第五被操作数包含的每个元素进行算术右移舍入无符号饱和至半宽操作,以生成第四初始移位运算结果;其中,移位量来自移位量寄存器。
在生成第四初始移位运算结果之后,执行子步骤S2。
子步骤S2:分别选取所述第四初始移位运算结果中包含每个元素的连续低半部分数据,将选取操作后的元素确定为移位运算结果。
本申请实施例中,在生成第四初始移位运算结果之后,可以选取第四初始移位运算结果中分别选取每个元素的连续低半部分瞬狙,并将选取每个元素的连续低半部分数据确定为移位运算结果。
可选地,第一源寄存器中包括2N位数据,该2N位数据可以对应多个半字元素、字元素、或者双字元素;在所述第一源寄存器中执行选取操作,得到第五被操作数,包括:将所述第一源寄存器中每M位数据为一组数据组,并将每个数据组所对应的所有源元素确定为第五被操作数。根据所述移位量,将所述第五被操作数进行算术右移舍入无符号饱和至半宽操作,生成第四初始移位运算结果,包括:确定第五被操作数中每个源元素对应于移位量寄存器中的移位值,分别根据每个源元素对应的移位值,对每个源元素执行算术右移舍入无符号饱和至半宽操作,得到第四初始移位运算结果。
进一步地,算术右移、舍入、半宽、有符号饱和的定义与实施例二相同,算术右移舍入无符号饱和至半宽操作的过程与实施例二相同,在此不再赘述。
在得到移位运算结果之后,执行子步骤S3。
子步骤S3:根据预设值对目的寄存器中的存储位置进行划分,生成多个存储区。
本申请实施例中,预设值是指用于对目的寄存器中的存储位置进行区域划分的数值,预设值即为目标元素占据的数据比特位宽,对于预设值的具体数值可以根据业务需求而定,本申请实施例对此不加以限制。较佳地,该预设值为一个值,即根据该预设值划分的每个存储区大小相同(每个存储区存储的数据比特位宽相同)。
在生成多个存储区之后,执行子步骤S4。
子步骤S4:将所述移位运算结果中的数据,依次写入每个存储区的低半部分。
本申请实施例中,在生成多个存储区,且得到移位运算结果之后,可以将移位运算结果中的元素作为目标元素依次写入每个存储区的低半部分。
可选地,当第五被操作数为M位时,第四初始移位运算结果为M/2位,则移位运算结果为第四初始移位运算结果中自第0位至第M/4-1位所表示的数据。示例性地,第一源寄存器为向量寄存器xj,第一源寄存器为2M,将xj中每M位对应的源元素作为第五被操作数,通过向量移位指令可以将第五被操作数包含的每M位中各个源元素进行算术右移舍入无符号饱和至半宽操作,得到第四初始移位运算结果;移位量来自于移位量寄存器;第四初始移位运算结果中对每个元素取低半部分作为每个目标元素 依次写入向量寄存器xd的每M位的每个目标元素低半部分中,且该每M位中每个目标元素的高半部分数据置0。其中,第五被操作数中源元素的数据类型为半字、字、双字任一种情况;对应于上述源元素的数据类型,写入向量寄存器xd中目标元素的数据类型为字节、半字、字,关于源元素数据类型和目标元素数据类型之前的对应关系在前文中已经描述,在此不再赘述。
在将移位运算结果中的数据依次写入每个存储区的低半部分之后,执行子步骤S5。
子步骤S5:分别将每个存储区中未写入所述数据位置的值置零。
在将移位运算结果中的元素作为目标元素依次写入每个存储区的低半部分之后,可以分别将每个存储区中未写入目标元素位置的值置为0。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。
采用本申请技术方案,通过执行包含第九向量操作码和移位量的指令,实现了两个源元素的逻辑移位舍入有符号饱和至半宽等一系列操作;通过执行包含第十向量操作码和移位量的指令,移位量来自寄存器,实现了两个源元素的算术移位舍入有符号饱和至半宽等一系列操作;通过执行包含第十一向量操作码和移位量的指令,实现了两个源元素的逻辑移位舍入无符号饱和至半宽等一系列操作;通过执行包含第十二向量操作码和移位量的指令,实现了两个源元素的算术移位舍入无符号饱和至半宽等一系列操作。因而,采用本发明技术方案,能够通过不同的移位参数实现不同的移位需求,进而采用一条移位指令能够实现多种向量移位需求有效降低了系统开销,提高了特定功能向量移位的执行效率。
实施例五
参照图8,示出了本申请实施例二的一种处理器的结构框图。
如图8所示,处理器可以包括:
多个向量寄存器,所述多个向量寄存器包括源寄存器81与目的寄存器82,源寄存器用于存储执行向量移位操作时被操作的源元素;
指令译码单元83,用于译码向量移位指令;其中,所述向量移位指令包括:寄存器标识和移位参数,所述寄存器标识包括:源寄存器标识和目的寄存器标识,所述源寄存器标识用于表征源寄存器81,所述目的寄存器标识用于表征目的寄存器82;
执行单元84,响应于所述向量移位指令,根据所述移位参数对从所述源寄存器81获取的源元素执行向量移位操作,获取所述向量移位操作后的目标元素,并将所述目标元素写入所述目的寄存器82。
优选地,所述执行单元84,根据所述移位参数,确定移位量和移位运算规则;其中,所述执行向量移位操作的源元素为至少一个;根据所述移位量和所述移位运算规则,对所述源寄存器中的源元素执行相应的移位运算,生成移位运算结果;将所述移位运算结果确定为目标元素。
优选地,所述移位参数包括移位量和操作码;所述移位量用于指示执行所述向量移位运算时被操作源元素的移位位数;所述操作码用于表征对所述源寄存器中源元素和目的寄存器中目标元素所执行的移位运算规则;
所述执行单元84,根据所述操作码,从所述源寄存器中选取执行所述向量移位运算的源元素,并将选取的所述源元素确定为被操作数;以及根据所述操作码,对所述被操作数执行相应的移位运算,生成移位运算结果;根据所述操作码,确定所述目标元素在所述目的寄存器中的存储方式;按照所述存储方式,将所述目标元素存储至所述目的寄存器中。
优选地,所述移位量为立即数;所述源寄存器包括第一源寄存器和第二源寄存器。
优选地,所述操作码为第一类型向量操作码;
所述执行单元84,根据所述第一类型向量操作码,将第一源寄存器中的所有源元素确定为一被操作数,并将第二源寄存器中的所有源元素确定为被操作数;
根据所述第一类型向量操作码,将所述第一源寄存器中的被操作数和所述第二源寄存器中的被操作数拼接后,生成第一拼接向量;
根据所述立即数,对所述第一拼接向量中每个源元素均进行移位舍入饱和至半宽操作,生成第一初始移位运算结果;
对所述第一初始移位运算结果执行取位操作,生成移位运算结果;其中,所述取位操作包括对所述第一初始移位运算结果中包含的每个元素均取连续低半部分数据,对所述第一初始移位运算结果中包含的每个元素均取连续高半部分数据,对所述第一初始移位运算结果中包含的每个元素均取中间连续指定位元素数据,对所述第一初始移位运算结果中包含的每个元素均取非连续指定位数据中的任意一种。
优选地,所述第一类型向量操作码为第一向量操作码;
所述执行单元84,根据所述立即数,对所述第一拼接向量中每个源元素进行逻辑右移舍入有符号饱和至半宽操作,生成第一初始移位运算结果;
分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
优选地,所述第一类型向量操作码为第二向量操作码;
所述执行单元84,根据所述立即数,对所述第一拼接向量中每个源元素均进行算术右移舍入有符号饱和至半宽操作,生成第一初始移位运算结果;
分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
优选地,所述第一类型向量操作码为第三向量操作码;
所述执行单元84,根据所述立即数,对所述第一拼接向量中每个源元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第一初始移位运算结果;
分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
优选地,所述第一类型向量操作码为第四向量操作码;
所述执行单元84,根据所述立即数,对所述第一拼接向量中每个源元素进行算术右移舍入无符号饱和至半宽操作,生成第一初始移位运算结果;
分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
优选地,所述操作码为第二类型向量操作码;
所述执行单元84,根据所述第二类型向量操作码,分别在第一源寄存器和第二源寄存器中执行选取操作,得到第一被操作数和第二被操作数;其中,所述选取操作包括对所述第一源寄存器和第二源寄存器中每个元素均选取连续低半部分数据、对所述第一源寄存器和第二源寄存器中每个元素均选取连续高半部分数据、对所述第一源寄存器和第二源寄存器中每个元素均选取中间连续指定位数据、对所述第一源寄存器寄存器和第二源寄存器中每个元素均选取非连续指定位数据中的任意一种;并
将所述第一源寄存器中除所述第一被操作数之外的数据确定为第三被操作数,将所述第二源寄存器中除所述第二被操作数之外的数据确定为第四被操作数;
将所述第一被操作数和第二被操作数进行拼接后,生成第二拼接向量,以及将第三被操作数和第四被操作数进行拼接后,生成第三拼接向量;其中,所述第二拼接向量和所述第三拼接向量中包含元素的数据类型均为半字、字、双字、四字中的任一种;
根据所述立即数,对所述第二拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第二初始移位运算结果;并根据所述立即数,对所述第三拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第三初始移位运算结果;
对所述第二初始移位运算结果执行取位操作,生成第一移位运算结果;以及,对所述第三初始移位运算结果执行取位操作,生成第二移位运算结果;其中,所述执行取位操作包括对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取连续低半部分数据、对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取连续高半部分数据、对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取中间连续指定位数据、对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取非连续指定位数据中的任意一种;
根据所述第一移位运算结果的取位操作位置,将所述第一移位运算结果写入所述目的寄存器相应的存储位置;并
根据所述第二移位运算结果的取位操作位置,将所述第二移位运算结果写入所述目的寄存器相应的存储位置。
优选地,所述第二类型向量操作码为第五向量操作码;所述第一被操作数为所述第一源寄存器中每个元素连续低半部分组成的数据;所述第二被操作数为所述第二源寄存器中每个元素连续低半部分组成的数据;所述第三被操作数为第一源寄存器中每个元素连续高半部分组成的数据;所述第四被操作数为第二源寄存器中每个元素连续高半部分组成的数据;
所述执行单元84,根据所述立即数,对所述第二拼接向量中每个元素均进行逻辑右移舍入有符号饱和至半宽操作,生成第二初始移位运算结果;以及根据所述立即数,对所述第三拼接向量中每个元素均进行逻辑右移舍入有符号饱和至半宽操作,生成第三初始移位运算结果;
分别选取所述第二初始移位运算结果中包含的每个元素的连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并分别选取所述第三初始移位运算结果中包含的每个元素的连续高半部分数据,将选取的所述数据确定为第二移位运算结果; 其中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素;
将所述第一移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的低半部分;
将所述第二移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的高半部分。
优选地,所述第二类型向量操作码为第六向量操作码;所述第一被操作数为所述第一源寄存器中每个元素连续低半部分组成的数据;所述第二被操作数为所述第二源寄存器中每个元素连续低半部分组成的数据;所述第三被操作数为第一源寄存器中每个元素连续高半部分组成的数据;所述第四被操作数为第二源寄存器中每个元素连续高半部分组成的元素;
所述执行单元,根据所述立即数,将所述第二拼接向量中每个元素均进行算术右移舍入有符号饱和至半宽操作,生成第二初始移位运算结果;以及根据所述立即数,将所述第三拼接向量中每个元素均进行算术右移舍入有符号饱和至半宽操作,生成第三初始移位运算结果;
分别选取所述第二初始移位运算结果中包含的每个元素的连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并分别选取所述第三初始移位运算结果中包含的每个元素的连续高半部分数据,将选取的所述数据确定为第二移位运算结果;其中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素;
将所述第一移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的低半部分;
将所述第二移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的高半部分。
优选地,所述第二类型向量操作码为第七向量操作码;所述第一被操作数为所述第一源寄存器中每个元素连续低半部分组成的数据;所述第二被操作数为所述第二源寄存器中每个元素连续低半部分组成的数据;所述第三被操作数为第一源寄存器中每个元素连续高半部分组成的数据;所述第四被操作数为第二源寄存器中每个元素连续高半部分组成的数据;
所述执行单元84,根据所述立即数,对所述第二拼接向量中每个元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第二初始移位运算结果;以及
根据所述立即数,对所述第三拼接向量中每个元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第三初始移位运算结果;
分别选取所述第二初始移位运算结果中包含的每个元素的连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并分别选取所述第三初始移位运算结果中包含的每个元素的连续高半部分数据,将选取的所述数据确定为第二移位运算结果;其中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素;
将所述第一移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器 中每个第一目标元素所在位置的低半部分;
将所述第二移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的高半部分。
优选地,所述第二类型向量操作码为第八向量操作码;所述第一被操作数为所述第一源寄存器中每个元素连续低半部分组成的数据;所述第二被操作数为所述第二源寄存器中每个元素连续低半部分组成的数据;所述第三被操作数为第一源寄存器中每个元素连续高半部分组成的数据;所述第四被操作数为第二源寄存器中每个元素连续高半部分组成的数据;
所述执行单元84,根据所述立即数,对所述第二拼接向量中每个元素均进行算术右移舍入无符号饱和至半宽操作,生成第二初始移位运算结果;以及
根据所述立即数,对所述第三拼接向量中每个元素均进行算术右移舍入无符号饱和至半宽操作,生成第三初始移位运算结果;
分别选取所述第二初始移位运算结果中包含的每个元素的连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并分别选取所述第三初始移位运算结果中包含的每个元素的连续高半部分数据,将选取的所述数据确定为第二移位运算结果;;其中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素;
将所述第一移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的低半部分;
将所述第二移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的高半部分。
优选地,所述指令还包括移位量寄存器标识,所述移位量寄存器标识用于表征移位量寄存器,所述移位量寄存器为存储移位量的寄存器。
优选地,所述操作码为第三类型向量操作码;所述源寄存器包括第一源寄存器;
所述执行单元,根据所述第三类型向量操作码,在所述第一源寄存器中执行选取操作,得到第五被操作数;其中,所述选取操作包括对所述第一源寄存器中每个元素均选取连续低半部分数据、对所述第一源寄存器中每个元素均选取连续高半部分数据、对所述第一源寄存器中每个元素均选取中间连续指定位数据、对所述第一源寄存器中每个元素均选取非连续指定位数据的任意一种;
根据所述第三类型向量操作码和所述移位量,对所述第五被操作数进行移位舍入饱和至半宽操作,生成第四初始移位运算结果;
对所述第四初始移位运算结果执行取位操作,生成移位运算结果;其中,所述取位操作包括分别对所述第四初始移位运算结果包含的每个元素中取连续低半部分数据、分别对所述第四初始移位运算结果包含的每个元素中取连续高半部分数据、分别对所述第四初始移位运算结果包含的每个元素中取中间连续指定位数据、分别对所述第四初始移位运算结果包含的每个元素中取非连续指定位数据中的任意一种;
将所述移位运算结果中的数据,依次写入所述目的寄存器中的相应位置;并
根据所述第三类型向量操作码,设置所述目的寄存器中未写入所述数据位置的值。
优选地,所述第三类型向量操作码为第九向量操作码,所述第五被操作数为所述 第一源寄存器中任意连续的源元素;
所述执行单元84,根据所述移位量,对所述第五被操作数包含的每个元素均进行逻辑右移舍入有符号饱和至半宽操作,生成第四初始移位运算结果;
分别选取所述第四初始移位运算结果中包含每个元素的连续低半部分元素,将选取操作后的元素确定为移位运算结果;
根据预设值对目的寄存器中的存储位置进行划分,并确定每个目标元素的存储区;
将所述移位运算结果中的数据,依次写入每个存储区的低半部分;并
分别将每个存储区中未写入所述数据位置的值置零。
优选地,所述第三类型向量操作码为第十向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素;
所述执行单元84,根据所述移位量,对所述第五被操作数包含的每个元素均进行算术右移舍入有符号饱和至半宽操作,生成第四初始移位运算结果;
分别选取所述第四初始移位运算结果中包含每个元素的连续低半部分元素,将选取操作后的元素确定为移位运算结果;
根据预设值对目的寄存器中的存储位置进行划分,确定每个目标元素的存储区;
将所述移位运算结果中的数据,依次写入每个存储区的低半部分;并
分别将每个存储区中未写入所述数据位置的值置零。
优选地,根据权利要求16所述的方法,所述第三类型向量操作码为第十一向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素;
所述执行单元84,根据所述移位量,对所述第五被操作数包含的每个元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第四初始移位运算结果;
选取所述第四初始移位运算结果中包含的每个元素的连续低半部分元素,将选取操作后的元素确定为移位运算结果;
根据预设值对目的寄存器中的存储位置进行划分,确定每个目标元素的存储区;
将所述移位运算结果中的数据,依次写入每个存储区的低半部分;并
分别将每个存储区中未写入所述数据位置的值置零。
优选地,所述第三类型向量操作码为第十二向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素;
所述执行单元84,根据所述移位量,对所述第五被操作数包含的每个元素均进行算术右移舍入无符号饱和至半宽操作,生成第四初始移位运算结果;
分别选取所述第四初始移位运算结果中包含每个元素的连续低半部分元素,将选取操作后的元素确定为移位运算结果;
根据预设值对目的寄存器中的存储位置进行划分,去顶每个目标元素的存储区;
将所述移位运算结果中的数据,依次写入每个存储区的低半部分;并
分别将每个存储区中未写入所述数据位置的值置零。
优选地,所述源寄存器数量为一个或多个,所述目的寄存器数量为一个;所述源寄存器标识与所述目的寄存器标识相同或不同。
优选地,所述源寄存器数量为多个,所述目的寄存器数量为一个;
所有所述源寄存器中每一个源寄存器标识均与所述目的寄存器标识不同;或者, 所有所述源寄存器中存在一个源寄存器标识与所述目的寄存器标识相同。
实施例六
参照图9,示出了本申请实施例五的一种用于执行向量移位操作的电子设备的结构示意图。
如图9所示,电子设备可以包括以下一个或多个组件:处理组件902,存储器904,电源组件906,多媒体组件908,音频组件910,输入/输出(I/O)的接口912,传感器组件914,以及通信组件916。
处理组件902通常控制电子设备的整体操作,诸如与显示,数据通信,相机操作和记录操作相关联的操作。处理元件302可以包括一个或多个处理器920来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理部件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。
存储器904被配置为存储各种类型的数据以支持在电子设备的操作。这些数据的示例包括用于在电子设备上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件906为电子设备的各种组件提供电力。电源组件906可以包括电源管理系统,一个或多个电源,及其他与为终端900生成、管理和分配电力相关联的组件。
多媒体组件908包括在所述电子设备和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当电子设备处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(MIC),当终端处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中,音频组件910还包括一个扬声器,用于输出音频信号。
I/O接口912为处理组件902和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件914包括一个或多个传感器,用于为电子设备900提供各个方面的状 态评估。例如,传感器组件914可以检测到电子设备900的打开/关闭状态,组件的相对定位,例如所述组件为终端的显示器和小键盘,传感器组件914还可以检测终端或终端一个组件的位置改变,用户与电子设备接触的存在或不存在,电子设备方位或加速/减速和电子设备的温度变化。传感器组件914可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件916被配置为便于电子设备和其他设备之间有线或无线方式的通信。电子设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件916还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述向量移位方法。
本申请实施例的电子设备用于实现前述多个方法实施例中相应的使用指令执行向量移位的方法,并且具有相应的方法实施的有益效果,在此不再赘述。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本申请所提供的一种向量移位方法、处理器、电子设备及可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
在此提供的算法和显示不与任何特定计算机、电子系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图: 即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本申请实施例的浏览器客户端设备中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (45)
- 一种向量移位方法,其特征在于,所述方法包括:接收指令,所述指令包括:寄存器标识和移位参数;其中,所述寄存器标识包括源寄存器标识和目的寄存器标识;所述源寄存器标识用于表征源寄存器,所述源寄存器为存储执行向量移位操作时被操作的源元素的寄存器;所述目的寄存器标识用于表征目的寄存器,所述目的寄存器为存储执行所述向量移位操作后得到的目标元素的寄存器;所述移位参数用于指示对所述源元素执行向量移位操作时所依据的规则;执行所述指令,以根据所述移位参数对从所述源寄存器获取的源元素执行向量移位操作,并获取所述向量移位操作后的目标元素;将所述目标元素写入所述目的寄存器。
- 根据权利要求1所述的方法,其特征在于,根据所述移位参数对从所述源寄存器获取的源元素执行向量移位操作,并获取所述向量移位操作后的目标元素,包括:根据所述移位参数,确定移位量和移位运算规则;其中,所述执行向量移位操作的源元素为至少一个;根据所述移位量和所述移位运算规则,对所述源寄存器中的源元素执行相应的移位运算,生成移位运算结果;将所述移位运算结果中元素确定为目标元素。
- 根据权利要求2所述的方法,其特征在于,所述移位参数包括移位量和操作码;所述移位量用于指示执行所述向量移位运算时被操作源元素的移位位数;所述操作码用于表征对所述源寄存器中源元素和目的寄存器中目标元素所执行的移位运算规则;根据所述移位量和所述移位运算规则,对所述源寄存器中的源元素执行相应的移位运算,生成移位运算结果,包括:根据所述操作码,从所述源寄存器中选取执行所述向量移位运算的源元素,并将选取的所述源元素确定为被操作数;以及根据所述操作码,对所述被操作数执行相应的移位运算,生成移位运算结果;将所述移位运算结果中元素确定为目标元素之后,将所述目标元素写入所述目的寄存器,包括:根据所述操作码,确定所述目标元素在所述目的寄存器中的存储方式;按照所述存储方式,将所述目标元素存储至所述目的寄存器中。
- 根据权利要求3所述的方法,其特征在于,所述移位量为立即数;所述源寄存器包括第一源寄存器和第二源寄存器。
- 根据权利要求4所述的方法,其特征在于,所述操作码为第一类型向量操作码;根据所述操作码,从所述源寄存器中选取执行所述向量移位运算的源元素,并将选取的所述源元素确定为被操作数,包括:根据所述第一类型向量操作码,将第一源寄存器中的所有源元素确定为一被操作数,并将第二源寄存器中的所有源元素确定为被操作数;根据所述操作码,对所述被操作数执行相应的移位运算,生成移位运算结果,包括:根据所述第一类型向量操作码,将所述第一源寄存器中的被操作数和所述第二源 寄存器中的被操作数拼接后,生成第一拼接向量;根据所述立即数,对所述第一拼接向量中每个源元素均进行移位舍入饱和至半宽操作,生成第一初始移位运算结果;对所述第一初始移位运算结果执行取位操作,生成移位运算结果;其中,所述取位操作包括对所述第一初始移位运算结果中包含的每个元素均取连续低半部分数据,对所述第一初始移位运算结果中包含的每个元素均取连续高半部分数据,对所述第一初始移位运算结果中包含的每个元素均取中间连续指定位元素数据,对所述第一初始移位运算结果中包含的每个元素均取非连续指定位数据中的任意一种。
- 根据权利要求5所述的方法,其特征在于,所述第一类型向量操作码为第一向量操作码;根据所述立即数,对所述第一拼接向量中每个源元素均进行移位舍入饱和至半宽操作,生成第一初始移位运算结果,包括:根据所述立即数,对所述第一拼接向量中每个源元素均进行逻辑右移舍入有符号饱和至半宽操作,生成第一初始移位运算结果;对所述第一初始移位运算结果执行取位操作,生成移位运算结果,包括:分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
- 根据权利要求5所述的方法,其特征在于,所述第一类型向量操作码为第二向量操作码;根据所述立即数,对所述第一拼接向量中每个源元素均进行移位舍入饱和至半宽操作,生成第一初始移位运算结果,包括:根据所述立即数,对所述第一拼接向量中每个源元素均进行算术右移舍入有符号饱和至半宽操作,生成第一初始移位运算结果;对所述第一初始移位运算结果执行取位操作,生成移位运算结果,包括:分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
- 根据权利要求5所述的方法,其特征在于,所述第一类型向量操作码为第三向量操作码;根据所述立即数,对所述第一拼接向量中每个源元素均进行移位舍入饱和至半宽操作,生成第一初始移位运算结果,包括:根据所述立即数,对所述第一拼接向量中每个源元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第一初始移位运算结果;对所述第一初始移位运算结果执行取位操作,生成移位运算结果,包括:分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
- 根据权利要求5所述的方法,其特征在于,所述第一类型向量操作码为第四第一类型向量操作码;根据所述立即数,对所述第一拼接向量中每个源元素进行移位舍入饱和至半宽操作,生成第一初始移位运算结果,包括:根据所述立即数,对所述第一拼接向量中每个源元素进行算术右移舍入无符号饱和至半宽操作,生成第一初始移位运算结果;对所述第一初始移位运算结果执行取位操作,生成移位运算结果,包括:分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
- 根据权利要求4所述的方法,其特征在于,所述操作码为第二类型向量操作码;根据所述操作码,从所述源寄存器中选取执行所述向量移位运算的源元素,并将选取的所述源元素确定为被操作数,包括:根据所述第二类型向量操作码,分别在第一源寄存器和第二源寄存器中执行选取操作,得到第一被操作数和第二被操作数;其中,所述选取操作包括对所述第一源寄存器和第二源寄存器中每个元素均选取连续低半部分数据、对所述第一源寄存器和第二源寄存器中每个元素均选取连续高半部分数据、对所述第一源寄存器和第二源寄存器中每个元素均选取中间连续指定位数据、对所述第一源寄存器和第二源寄存器中每个元素均选取非连续指定位数据中的任意一种;并将所述第一源寄存器中除所述第一被操作数之外的数据确定为第三被操作数,将所述第二源寄存器中除所述第二被操作数之外的数据确定为第四被操作数;根据所述操作码,对所述被操作数执行相应的移位运算,生成移位运算结果,包括:将所述第一被操作数和第二被操作数进行拼接后,生成第二拼接向量,以及将第三被操作数和第四被操作数进行拼接后,生成第三拼接向量;其中,所述第二拼接向量和所述第三拼接向量中包含元素的数据类型均为半字、字、双字、四字中的任一种;根据所述立即数,对所述第二拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第二初始移位运算结果;并根据所述立即数,对所述第三拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第三初始移位运算结果;对所述第二初始移位运算结果执行取位操作,生成第一移位运算结果;以及,对所述第三初始移位运算结果执行取位操作,生成第二移位运算结果;其中,所述执行取位操作包括对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取连续低半部分数据、对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取连续高半部分数据、对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取中间连续指定位数据、对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取非连续指定位数据中的任意一种;按照所述存储方式,将所述目标元素存储至确定的存储位置,包括:根据所述第一移位运算结果的取位操作位置,将所述第一移位运算结果写入所述目的寄存器相应的存储位置;并根据所述第二移位运算结果的取位操作位置,将所述第二移位运算结果写入所述目的寄存器相应的存储位置。
- 根据权利要求10所述的方法,其特征在于,所述第二类型向量操作码为第五向量操作码;所述第一被操作数为所述第一源寄存器中每个元素连续低半部分组成的数据;所述第二被操作数为所述第二源寄存器中每个元素连续低半部分组成的数据;所述第三被操作数为第一源寄存器中每个元素连续高半部分组成的数据;所述第四被操作数为第二源寄存器中每个元素连续高半部分组成的数据;根据所述立即数,对所述第二拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第二初始移位运算结果;并根据所述立即数,对所述第三拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第三初始移位运算结果,包括:根据所述立即数,对所述第二拼接向量中每个源元素均进行逻辑右移舍入有符号饱和至半宽操作,生成第二初始移位运算结果;以及根据所述立即数,对所述第三拼接向量中每个源元素均进行逻辑右移舍入有符号饱和至半宽操作,生成第三初始移位运算结果;对所述第二初始移位运算结果执行取位操作,生成第二移位运算结果;以及,对所述第三初始移位运算结果执行取位操作,生成第三移位运算结果,包括:分别选取所述第二初始移位运算结果中包含的每个元素的连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并分别选取所述第三初始移位运算结果中包含的每个元素的连续高半部分数据,将选取的所述数据确定为第二移位运算结果;其中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素;根据所述第一移位运算结果的取位操作位置,将所述第一移位运算结果写入所述目的寄存器相应的存储位置,包括:将所述第一移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的低半部分;根据所述第二移位运算结果的取位操作位置,将所述第二移位运算结果写入所述目的寄存器相应的存储位置,包括:将所述第二移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的高半部分。
- 根据权利要求10所述的方法,其特征在于,所述第二类型向量操作码为第六向量操作码;所述第一被操作数为所述第一源寄存器中每个元素连续低半部分组成的数据;所述第二被操作数为所述第二源寄存器中每个元素连续低半部分组成的数据;所述第三被操作数为第一源寄存器中每个元素连续高半部分组成的数据;所述第四被操作数为第二源寄存器中每个元素连续高半部分组成的元素;根据所述立即数,对所述第二拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第二初始移位运算结果;并根据所述立即数,对所述第三拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第三初始移位运算结果,包括:根据所述立即数,将所述第二拼接向量中每个源元素均进行算术右移舍入有符号饱和至半宽操作,生成第二初始移位运算结果;以及根据所述立即数,将所述第三拼接向量中每个源元素均进行算术右移舍入有符号饱和至半宽操作,生成第三初始移位运算结果;对所述第二初始移位运算结果执行取位操作,生成第二移位运算结果;以及,对所述第三初始移位运算结果执行取位操作,生成第三移位运算结果,包括:分别选取所述第二初始移位运算结果中包含的每个元素的连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并分别选取所述第三初始移位运算结果中包含的每个元素的连续高半部分数据,将选取的所述数据确定为第二移位运算结果;其中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素;根据所述第一移位运算结果的取位操作位置,将所述第一移位运算结果写入所述目的寄存器相应的存储位置,包括:将所述第一移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的低半部分;根据所述第二移位运算结果的取位操作位置,将所述第二移位运算结果写入所述目的寄存器相应的存储位置,包括:将所述第二移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的高半部分。
- 根据权利要求10所述的方法,其特征在于,所述第二类型向量操作码为第七向量操作码;所述第一被操作数为所述第一源寄存器中每个元素连续低半部分组成的数据;所述第二被操作数为所述第二源寄存器中每个元素连续低半部分组成的数据;所述第三被操作数为第一源寄存器中每个元素连续高半部分组成的数据;所述第四被操作数为第二源寄存器中每个元素连续高半部分组成的数据;根据所述立即数,对所述第二拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第二初始移位运算结果;并根据所述立即数,对所述第三拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第三初始移位运算结果,包括:根据所述立即数,对所述第二拼接向量中每个源元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第二初始移位运算结果;以及根据所述立即数,对所述第三拼接向量中每个源元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第三初始移位运算结果;对所述第二初始移位运算结果执行取位操作,生成第二移位运算结果;以及,对所述第三初始移位运算结果执行取位操作,生成第三移位运算结果,包括:分别选取所述第二初始移位运算结果中包含的每个元素的连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并分别选取所述第三初始移位运算结果中包含的每个元素的连续高半部分数据,将选取的所述数据确定为第二移位运算结果;其中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素;根据所述第一移位运算结果的取位操作位置,将所述第一移位运算结果写入所述目的寄存器相应的存储位置,包括:将所述第一移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的低半部分;根据所述第二移位运算结果的取位操作位置,将所述第二移位运算结果写入所述 目的寄存器相应的存储位置,包括:将所述第二移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的高半部分。
- 根据权利要求10所述的方法,其特征在于,所述第二类型向量操作码为第八向量操作码;所述第一被操作数为所述第一源寄存器中每个元素连续低半部分组成的数据;所述第二被操作数为所述第二源寄存器中每个元素连续低半部分组成的数据;所述第三被操作数为第一源寄存器中每个元素连续高半部分组成的数据;所述第四被操作数为第二源寄存器中每个元素连续高半部分组成的数据;根据所述立即数,对所述第二拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第二初始移位运算结果;并根据所述立即数,对所述第三拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第三初始移位运算结果,包括:根据所述立即数,对所述第二拼接向量中每个源元素均进行算术右移舍入无符号饱和至半宽操作,生成第二初始移位运算结果;以及根据所述立即数,对所述第三拼接向量中每个源元素均进行算术右移舍入无符号饱和至半宽操作,生成第三初始移位运算结果;对所述第二初始移位运算结果执行取位操作,生成第二移位运算结果;以及,对所述第三初始移位运算结果执行取位操作,生成第三移位运算结果,包括:分别选取所述第二初始移位运算结果中包含的每个元素的连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并分别选取所述第三初始移位运算结果中包含的每个元素的连续高半部分数据,将选取的所述数据确定为第二移位运算结果;;其中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素;根据所述第一移位运算结果的取位操作位置,将所述第一移位运算结果写入所述目的寄存器相应的存储位置,包括:将所述第一移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的低半部分;根据所述第二移位运算结果的取位操作位置中包含的每个第一目标元素,分别将所述第二移位运算结果写入所述目的寄存器相应的存储位置,包括:将所述第二移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的高半部分。
- 根据权利要求3所述的方法,其特征在于,所述指令还包括移位量寄存器标识,所述移位量寄存器标识用于表征移位量寄存器,所述移位量寄存器为存储移位量的寄存器。
- 根据权利要求15所述的方法,其特征在于,所述操作码为第三类型向量操作码;所述源寄存器包括第一源寄存器;根据所述操作码,从所述源寄存器中选取执行所述向量移位运算的源元素,并将选取的所述源元素确定为被操作数,包括:根据所述第三类型向量操作码,在所述第一源寄存器中执行选取操作,得到第五被操作数;其中,所述选取操作包括对所述第一源寄存器中每个元素均选取连续低半 部分数据、对所述第一源寄存器中每个元素均选取连续高半部分数据、对所述第一源寄存器中每个元素均选取中间连续指定位数据、对所述第一源寄存器中每个元素均选取非连续指定位数据的任意一种;根据所述操作码,对所述被操作数执行相应的移位运算,生成移位运算结果,包括:根据所述第三类型向量操作码和所述移位量,对所述第五被操作数进行移位舍入饱和至半宽操作,生成第四初始移位运算结果;对所述第四初始移位运算结果执行取位操作,生成移位运算结果;其中,所述取位操作包括分别对所述第四初始移位运算结果包含的每个元素中取连续低半部分数据、分别对所述第四初始移位运算结果包含的每个元素中取连续高半部分数据、分别对所述第四初始移位运算结果包含的每个元素中取中间连续指定位数据、分别对所述第四初始移位运算结果包含的每个元素中取非连续指定位数据中的任意一种;按照所述存储方式,将所述目标元素存储至所述目的寄存器中,包括:将所述移位运算结果中的数据,依次写入所述目的寄存器中的相应位置;并根据所述第三类型向量操作码,设置所述目的寄存器中未写入所述数据位置的值。
- 根据权利要求16所述的方法,其特征在于,所述第三类型向量操作码为第九向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素;根据所述第三类型向量操作码和所述移位量,对所述第五被操作数进行移位舍入饱和至半宽操作,生成第四初始移位运算结果,包括:根据所述移位量,对所述第五被操作数包含的每个元素均进行逻辑右移舍入有符号饱和至半宽操作,生成第四初始移位运算结果;对所述第四初始移位运算结果执行取位操作,生成移位运算结果,包括:分别选取所述第四初始移位运算结果中包含每个元素的连续低半部分元素,将选取操作后的元素确定为移位运算结果;将所述移位运算结果中的数据,依次写入所述目的寄存器中的相应位置;并根据所述第三类型向量操作码,设置所述目的寄存器中未写入所述数据位置的值,包括:根据预设值对目的寄存器中的存储位置进行划分,并确定每个目标元素的存储区;将所述移位运算结果中的数据,依次写入每个存储区的低半部分;并分别将每个存储区中未写入所述数据位置的值置零。
- 根据权利要求16所述的方法,其特征在于,所述第三类型向量操作码为第十向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素;根据所述第三类型向量操作码和所述移位量,对所述第五被操作数进行移位舍入饱和至半宽操作,生成第四初始移位运算结果,包括:根据所述移位量,对所述第五被操作数包含的每个元素均进行算术右移舍入有符号饱和至半宽操作,生成第四初始移位运算结果;对所述第四初始移位运算结果执行取位操作,生成移位运算结果,包括:分别选取所述第四初始移位运算结果中包含每个元素的连续低半部分元素,将选取操作后的元素确定为移位运算结果;将所述移位运算结果中的数据,依次写入所述目的寄存器中的相应位置;并根据 所述第三类型向量操作码,设置所述目的寄存器中未写入所述数据位置的值,包括:根据预设值对目的寄存器中的存储位置进行划分,确定每个目标元素的存储区;将所述移位运算结果中的数据,依次写入每个存储区的低半部分;并分别将每个存储区中未写入所述数据位置的值置零。
- 根据权利要求16所述的方法,其特征在于,所述第三类型向量操作码为第十一向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素;根据所述第三类型向量操作码和所述移位量,对所述第五被操作数进行移位舍入饱和至半宽操作,生成第四初始移位运算结果,包括:根据所述移位量,对所述第五被操作数包含的每个元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第四初始移位运算结果;对所述第四初始移位运算结果执行取位操作,生成移位运算结果,包括:选取所述第四初始移位运算结果中包含的每个元素的连续低半部分元素,将选取操作后的元素确定为移位运算结果;将所述移位运算结果中的数据,依次写入所述目的寄存器中的相应位置;并根据所述第三类型向量操作码,设置所述目的寄存器中未写入所述数据位置的值,包括:根据预设值对目的寄存器中的存储位置进行划分,确定每个目标元素的存储区;将所述移位运算结果中的数据,依次写入每个存储区的低半部分;并分别将每个存储区中未写入所述数据位置的值置零。
- 根据权利要求16所述的方法,其特征在于,所述第三类型向量操作码为第十二向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素;根据所述第三类型向量操作码和所述移位量,对所述第五被操作数进行移位舍入饱和至半宽操作,生成第四初始移位运算结果,包括:根据所述移位量,对所述第五被操作数包含的每个元素均进行算术右移舍入无符号饱和至半宽操作,生成第四初始移位运算结果;对所述第四初始移位运算结果执行取位操作,生成移位运算结果,包括:分别选取所述第四初始移位运算结果中包含每个元素的连续低半部分元素,将选取操作后的元素确定为移位运算结果;将所述移位运算结果中的数据,依次写入所述目的寄存器中的相应位置;并根据所述第三类型向量操作码,设置所述目的寄存器中未写入所述数据位置的值,包括:根据预设值对目的寄存器中的存储位置进行划分,去顶每个目标元素的存储区;将所述移位运算结果中的数据,依次写入每个存储区的低半部分;并分别将每个存储区中未写入所述数据位置的值置零。
- 根据权利要求1-3、16-20任一项所述的方法,其特征在于,所述源寄存器数量为一个或多个,所述目的寄存器数量为一个;所述源寄存器标识与所述目的寄存器标识相同或不同。
- 根据权利要求1-15任一项所述的方法,其特征在于,所述源寄存器数量为多个,所述目的寄存器数量为一个;所有所述源寄存器中每一个源寄存器标识均与所述目的寄存器标识不同;或者,所有所述源寄存器中存在一个源寄存器标识与所述目的寄存器标识相同。
- 一种处理器,其特征在于,包括:多个向量寄存器,所述多个向量寄存器包括源寄存器与目的寄存器,源寄存器用于存储执行向量移位操作时被操作的源元素;指令译码单元,用于译码向量移位指令;其中,所述向量移位指令包括:寄存器标识和移位参数,所述寄存器标识包括:源寄存器标识和目的寄存器标识,所述源寄存器标识用于表征源寄存器,所述目的寄存器标识用于表征目的寄存器;执行单元,响应于所述向量移位指令,根据所述移位参数对从所述源寄存器获取的源元素执行向量移位操作,获取所述向量移位操作后的目标元素,并将所述目标元素写入所述目的寄存器。
- 根据权利要求23所述的处理器,其特征在于,所述执行单元,根据所述移位参数,确定移位量和移位运算规则;其中,所述执行向量移位操作的源元素为至少一个;根据所述移位量和所述移位运算规则,对所述源寄存器中的源元素执行相应的移位运算,生成移位运算结果;将所述移位运算结果确定为目标元素。
- 根据权利要求24所述的处理器,其特征在于,所述移位参数包括移位量和操作码;所述移位量用于指示执行所述向量移位运算时被操作源元素的移位位数;所述操作码用于表征对所述源寄存器中源元素和目的寄存器中目标元素所执行的移位运算规则;所述执行单元,根据所述操作码,从所述源寄存器中选取执行所述向量移位运算的源元素,并将选取的所述源元素确定为被操作数;以及根据所述操作码,对所述被操作数执行相应的移位运算,生成移位运算结果;根据所述操作码,确定所述目标元素在所述目的寄存器中的存储方式;按照所述存储方式,将所述目标元素存储至所述目的寄存器中。
- 根据权利要求25所述的处理器,其特征在于,所述移位量为立即数;所述源寄存器包括第一源寄存器和第二源寄存器。
- 根据权利要求26所述的处理器,其特征在于,所述操作码为第一类型向量操作码;所述执行单元,根据所述第一类型向量操作码,将第一源寄存器中的所有源元素确定为一被操作数,并将第二源寄存器中的所有源元素确定为被操作数;根据所述第一类型向量操作码,将所述第一源寄存器中的被操作数和所述第二源寄存器中的被操作数拼接后,生成第一拼接向量;根据所述立即数,对所述第一拼接向量中每个源元素均进行移位舍入饱和至半宽操作,生成第一初始移位运算结果;对所述第一初始移位运算结果执行取位操作,生成移位运算结果;其中,所述取位操作包括对所述第一初始移位运算结果中包含的每个元素均取连续低半部分数据,对所述第一初始移位运算结果中包含的每个元素均取连续高半部分数据,对所述第一初始移位运算结果中包含的每个元素均取中间连续指定位元素数据,对所述第一初始移位运算结果中包含的每个元素均取非连续指定位数据中的任意一种。
- 根据权利要求27所述的处理器,其特征在于,所述第一类型向量操作码为第 一向量操作码;所述执行单元,根据所述立即数,对所述第一拼接向量中每个源元素进行逻辑右移舍入有符号饱和至半宽操作,生成第一初始移位运算结果;分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
- 根据权利要求27所述的处理器,其特征在于,所述第一类型向量操作码为第二向量操作码;所述执行单元,根据所述立即数,对所述第一拼接向量中每个源元素均进行算术右移舍入有符号饱和至半宽操作,生成第一初始移位运算结果;分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
- 根据权利要求27所述的处理器,其特征在于,所述第一类型向量操作码为第三向量操作码;所述执行单元,根据所述立即数,对所述第一拼接向量中每个源元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第一初始移位运算结果;分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
- 根据权利要求27所述的处理器,其特征在于,所述第一类型向量操作码为第四向量操作码;所述执行单元,根据所述立即数,对所述第一拼接向量中每个源元素进行算术右移舍入无符号饱和至半宽操作,生成第一初始移位运算结果;分别选取所述第一初始移位运算结果包含的每个元素中连续低半部分数据,将选取操作后的所述元素确定为移位运算结果。
- 根据权利要求26所述的处理器,其特征在于,所述操作码为第二类型向量操作码;所述执行单元,根据所述第二类型向量操作码,分别在第一源寄存器和第二源寄存器中执行选取操作,得到第一被操作数和第二被操作数;其中,所述选取操作包括对所述第一源寄存器和第二源寄存器中每个元素均选取连续低半部分数据、对所述第一源寄存器和第二源寄存器中每个元素均选取连续高半部分数据、对所述第一源寄存器和第二源寄存器中每个元素均选取中间连续指定位数据、对所述第一源寄存器寄存器和第二源寄存器中每个元素均选取非连续指定位数据中的任意一种;并将所述第一源寄存器中除所述第一被操作数之外的数据确定为第三被操作数,将所述第二源寄存器中除所述第二被操作数之外的数据确定为第四被操作数;将所述第一被操作数和第二被操作数进行拼接后,生成第二拼接向量,以及将第三被操作数和第四被操作数进行拼接后,生成第三拼接向量;其中,所述第二拼接向量和所述第三拼接向量中包含元素的数据类型均为半字、字、双字、四字中的任一种;根据所述立即数,对所述第二拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第二初始移位运算结果;并根据所述立即数,对所述第三拼接向量中每个元素均进行移位舍入饱和至半宽操作,生成第三初始移位运算结果;对所述第二初始移位运算结果执行取位操作,生成第一移位运算结果;以及,对所述第三初始移位运算结果执行取位操作,生成第二移位运算结果;其中,所述执行取位操作包括对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取连续低半部分数据、对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取连续高半部分数据、对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取中间连续指定位数据、对所述第二初始移位运算结果中包含的每个元素和所述第三初始移位运算结果中包含的每个元素均取非连续指定位数据中的任意一种;根据所述第一移位运算结果的取位操作位置,将所述第一移位运算结果写入所述目的寄存器相应的存储位置;并根据所述第二移位运算结果的取位操作位置,将所述第二移位运算结果写入所述目的寄存器相应的存储位置。
- 根据权利要求32所述的处理器,其特征在于,所述第二类型向量操作码为第五向量操作码;所述第一被操作数为所述第一源寄存器中每个元素连续低半部分组成的数据;所述第二被操作数为所述第二源寄存器中每个元素连续低半部分组成的数据;所述第三被操作数为第一源寄存器中每个元素连续高半部分组成的数据;所述第四被操作数为第二源寄存器中每个元素连续高半部分组成的数据;所述执行单元,根据所述立即数,对所述第二拼接向量中每个元素均进行逻辑右移舍入有符号饱和至半宽操作,生成第二初始移位运算结果;以及根据所述立即数,对所述第三拼接向量中每个元素均进行逻辑右移舍入有符号饱和至半宽操作,生成第三初始移位运算结果;分别选取所述第二初始移位运算结果中包含的每个元素的连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并分别选取所述第三初始移位运算结果中包含的每个元素的连续高半部分数据,将选取的所述数据确定为第二移位运算结果;其中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素;将所述第一移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的低半部分;将所述第二移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的高半部分。
- 根据权利要求32所述的处理器,其特征在于,所述第二类型向量操作码为第六向量操作码;所述第一被操作数为所述第一源寄存器中每个元素连续低半部分组成的数据;所述第二被操作数为所述第二源寄存器中每个元素连续低半部分组成的数据;所述第三被操作数为第一源寄存器中每个元素连续高半部分组成的数据;所述第四被操作数为第二源寄存器中每个元素连续高半部分组成的元素;所述执行单元,根据所述立即数,将所述第二拼接向量中每个元素均进行算术右移舍入有符号饱和至半宽操作,生成第二初始移位运算结果;以及根据所述立即数,将所述第三拼接向量中每个元素均进行算术右移舍入有符号饱和至半宽操作,生成第 三初始移位运算结果;分别选取所述第二初始移位运算结果中包含的每个元素的连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并分别选取所述第三初始移位运算结果中包含的每个元素的连续高半部分数据,将选取的所述数据确定为第二移位运算结果;其中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素;将所述第一移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的低半部分;将所述第二移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的高半部分。
- 根据权利要求32所述的处理器,其特征在于,所述第二类型向量操作码为第七向量操作码;所述第一被操作数为所述第一源寄存器中每个元素连续低半部分组成的数据;所述第二被操作数为所述第二源寄存器中每个元素连续低半部分组成的数据;所述第三被操作数为第一源寄存器中每个元素连续高半部分组成的数据;所述第四被操作数为第二源寄存器中每个元素连续高半部分组成的数据;所述执行单元,根据所述立即数,对所述第二拼接向量中每个元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第二初始移位运算结果;以及根据所述立即数,对所述第三拼接向量中每个元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第三初始移位运算结果;分别选取所述第二初始移位运算结果中包含的每个元素的连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并分别选取所述第三初始移位运算结果中包含的每个元素的连续高半部分数据,将选取的所述数据确定为第二移位运算结果;其中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素;将所述第一移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的低半部分;将所述第二移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的高半部分。
- 根据权利要求32所述的处理器,其特征在于,所述第二类型向量操作码为第八向量操作码;所述第一被操作数为所述第一源寄存器中每个元素连续低半部分组成的数据;所述第二被操作数为所述第二源寄存器中每个元素连续低半部分组成的数据;所述第三被操作数为第一源寄存器中每个元素连续高半部分组成的数据;所述第四被操作数为第二源寄存器中每个元素连续高半部分组成的数据;所述执行单元,根据所述立即数,对所述第二拼接向量中每个元素均进行算术右移舍入无符号饱和至半宽操作,生成第二初始移位运算结果;以及根据所述立即数,对所述第三拼接向量中每个元素均进行算术右移舍入无符号饱和至半宽操作,生成第三初始移位运算结果;分别选取所述第二初始移位运算结果中包含的每个元素的连续低半部分数据,将选取的所述数据确定为第一移位运算结果;并分别选取所述第三初始移位运算结果中 包含的每个元素的连续高半部分数据,将选取的所述数据确定为第二移位运算结果;;其中,根据所述第一移位运算结果中包含的数据确定至少一个第一目标元素,根据所述第二移位运算结果中包含的元素确定至少一个第二目标元素;将所述第一移位运算结果中包含的每个第一目标元素,分别写入所述目的寄存器中每个第一目标元素所在位置的低半部分;将所述第二移位运算结果中包含的每个第二目标元素,分别写入所述目的寄存器中每个第二目标元素所在位置的高半部分。
- 根据权利要求25所述的处理器,其特征在于,所述指令还包括移位量寄存器标识,所述移位量寄存器标识用于表征移位量寄存器,所述移位量寄存器为存储移位量的寄存器。
- 根据权利要求37所述的处理器,其特征在于,所述操作码为第三类型向量操作码;所述源寄存器包括第一源寄存器;所述执行单元,根据所述第三类型向量操作码,在所述第一源寄存器中执行选取操作,得到第五被操作数;其中,所述选取操作包括对所述第一源寄存器中每个元素均选取连续低半部分数据、对所述第一源寄存器中每个元素均选取连续高半部分数据、对所述第一源寄存器中每个元素均选取中间连续指定位数据、对所述第一源寄存器中每个元素均选取非连续指定位数据的任意一种;根据所述第三类型向量操作码和所述移位量,对所述第五被操作数进行移位舍入饱和至半宽操作,生成第四初始移位运算结果;对所述第四初始移位运算结果执行取位操作,生成移位运算结果;其中,所述取位操作包括分别对所述第四初始移位运算结果包含的每个元素中取连续低半部分数据、分别对所述第四初始移位运算结果包含的每个元素中取连续高半部分数据、分别对所述第四初始移位运算结果包含的每个元素中取中间连续指定位数据、分别对所述第四初始移位运算结果包含的每个元素中取非连续指定位数据中的任意一种;将所述移位运算结果中的数据,依次写入所述目的寄存器中的相应位置;并根据所述第三类型向量操作码,设置所述目的寄存器中未写入所述数据位置的值。
- 根据权利要求38所述的处理器,其特征在于,所述第三类型向量操作码为第九向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素;所述执行单元,根据所述移位量,对所述第五被操作数包含的每个元素均进行逻辑右移舍入有符号饱和至半宽操作,生成第四初始移位运算结果;分别选取所述第四初始移位运算结果中包含每个元素的连续低半部分元素,将选取操作后的元素确定为移位运算结果;根据预设值对目的寄存器中的存储位置进行划分,并确定每个目标元素的存储区;将所述移位运算结果中的数据,依次写入每个存储区的低半部分;并分别将每个存储区中未写入所述数据位置的值置零。
- 根据权利要求38所述的处理器,其特征在于,所述第三类型向量操作码为第十向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素;所述执行单元,根据所述移位量,对所述第五被操作数包含的每个元素均进行算术右移舍入有符号饱和至半宽操作,生成第四初始移位运算结果;分别选取所述第四初始移位运算结果中包含每个元素的连续低半部分元素,将选取操作后的元素确定为移位运算结果;根据预设值对目的寄存器中的存储位置进行划分,确定每个目标元素的存储区;将所述移位运算结果中的数据,依次写入每个存储区的低半部分;并分别将每个存储区中未写入所述数据位置的值置零。
- 根据权利要求38所述的处理器,其特征在于,所述第三类型向量操作码为第十一向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素;所述执行单元,根据所述移位量,对所述第五被操作数包含的每个元素均进行逻辑右移舍入无符号饱和至半宽操作,生成第四初始移位运算结果;选取所述第四初始移位运算结果中包含的每个元素的连续低半部分元素,将选取操作后的元素确定为移位运算结果;根据预设值对目的寄存器中的存储位置进行划分,确定每个目标元素的存储区;将所述移位运算结果中的数据,依次写入每个存储区的低半部分;并分别将每个存储区中未写入所述数据位置的值置零。
- 根据权利要求38所述的处理器,其特征在于,所述第三类型向量操作码为第十二向量操作码,所述第五被操作数为所述第一源寄存器中任意连续的源元素;所述执行单元,根据所述移位量,对所述第五被操作数包含的每个元素均进行算术右移舍入无符号饱和至半宽操作,生成第四初始移位运算结果;分别选取所述第四初始移位运算结果中包含每个元素的连续低半部分元素,将选取操作后的元素确定为移位运算结果;根据预设值对目的寄存器中的存储位置进行划分,去顶每个目标元素的存储区;将所述移位运算结果中的数据,依次写入每个存储区的低半部分;并分别将每个存储区中未写入所述数据位置的值置零。
- 根据权利要求23-25、38-42任一项所述的处理器,其特征在于,所述源寄存器数量为一个或多个,所述目的寄存器数量为一个;所述源寄存器标识与所述目的寄存器标识相同或不同。
- 根据权利要求23-37任一项所述的处理器,其特征在于,所述源寄存器数量为多个,所述目的寄存器数量为一个;所有所述源寄存器中每一个源寄存器标识均与所述目的寄存器标识不同;或者,所有所述源寄存器中存在一个源寄存器标识与所述目的寄存器标识相同。
- 一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行如权利要求1-22中一个或多个所述的向量移位方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111509173.2A CN114296798A (zh) | 2021-12-10 | 2021-12-10 | 向量移位方法、处理器及电子设备 |
CN202111509173.2 | 2021-12-10 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2023104145A1 true WO2023104145A1 (zh) | 2023-06-15 |
Family
ID=80967637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2022/137506 WO2023104145A1 (zh) | 2021-12-10 | 2022-12-08 | 向量移位方法、处理器及电子设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114296798A (zh) |
WO (1) | WO2023104145A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114296798A (zh) * | 2021-12-10 | 2022-04-08 | 龙芯中科技术股份有限公司 | 向量移位方法、处理器及电子设备 |
CN115617400B (zh) * | 2022-12-20 | 2023-03-21 | 杭州加速科技有限公司 | 一种寄存器匹配方法及装置 |
CN117573065B (zh) * | 2024-01-17 | 2024-04-16 | 青岛本原微电子有限公司 | 一种处理器多功能移位运算装置及运算方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6088782A (en) * | 1997-07-10 | 2000-07-11 | Motorola Inc. | Method and apparatus for moving data in a parallel processor using source and destination vector registers |
CN104011673A (zh) * | 2011-12-30 | 2014-08-27 | 英特尔公司 | 向量频率压缩指令 |
CN110221807A (zh) * | 2019-06-06 | 2019-09-10 | 龙芯中科(合肥)技术有限公司 | 数据移位方法、装置、设备及计算机可读存储介质 |
CN114296798A (zh) * | 2021-12-10 | 2022-04-08 | 龙芯中科技术股份有限公司 | 向量移位方法、处理器及电子设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2540939B (en) * | 2015-07-31 | 2019-01-23 | Advanced Risc Mach Ltd | An apparatus and method for performing a splice operation |
CN107729989B (zh) * | 2017-07-20 | 2020-12-29 | 安徽寒武纪信息科技有限公司 | 一种用于执行人工神经网络正向运算的装置及方法 |
US20190196820A1 (en) * | 2017-12-21 | 2019-06-27 | Intel Corporation | Apparatus and method for right shifting packed quadwords and extracting packed doublewords |
CN111813447B (zh) * | 2019-04-12 | 2022-11-08 | 杭州中天微系统有限公司 | 一种数据拼接指令的处理方法和处理装置 |
-
2021
- 2021-12-10 CN CN202111509173.2A patent/CN114296798A/zh active Pending
-
2022
- 2022-12-08 WO PCT/CN2022/137506 patent/WO2023104145A1/zh unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6088782A (en) * | 1997-07-10 | 2000-07-11 | Motorola Inc. | Method and apparatus for moving data in a parallel processor using source and destination vector registers |
CN104011673A (zh) * | 2011-12-30 | 2014-08-27 | 英特尔公司 | 向量频率压缩指令 |
CN110221807A (zh) * | 2019-06-06 | 2019-09-10 | 龙芯中科(合肥)技术有限公司 | 数据移位方法、装置、设备及计算机可读存储介质 |
CN114296798A (zh) * | 2021-12-10 | 2022-04-08 | 龙芯中科技术股份有限公司 | 向量移位方法、处理器及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN114296798A (zh) | 2022-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2023104145A1 (zh) | 向量移位方法、处理器及电子设备 | |
US20220353070A1 (en) | Instructions and logic to provide simd sm4 cryptographic block cipher functionality | |
JP5918287B2 (ja) | 演算マスクのマスクされていない要素をコンソリデートする命令処理装置、方法、システム、及びプログラム | |
JP2018500653A (ja) | ベクトルブロードキャストおよびxorand論理命令のための装置および方法 | |
US9772850B2 (en) | Morton coordinate adjustment processors, methods, systems, and instructions | |
JP2016527650A (ja) | ベクトルポピュレーションカウント機能性を提供する方法、装置、命令、およびロジック | |
KR102472894B1 (ko) | 벡터 패킹된 투플 교차 비교 기능을 제공하기 위한 방법, 장치, 명령어들 및 로직 | |
TW201123008A (en) | Method and apparatus for performing a shift and exclusive or operation in a single instruction | |
KR102283947B1 (ko) | 사차원 모턴 좌표 변환 프로세서, 방법, 시스템 및 명령어 | |
JP6074511B2 (ja) | プロセッサ、方法、データプロセッシングシステム、および装置 | |
CN105204820B (zh) | 用于提供通用gf(256)simd加密算术功能的指令和逻辑 | |
JP2017529597A (ja) | ビット群インターリーブプロセッサ、方法、システムおよび命令 | |
KR20160001623A (ko) | 범용 gf(256) simd 암호용 산술 기능성을 제공하는 명령어 및 로직 | |
US20080077772A1 (en) | Method and apparatus for performing select operations | |
WO2023104143A1 (zh) | 向量混洗方法、处理器及电子设备 | |
US8572147B2 (en) | Method for implementing a bit-reversed increment in a data processing system | |
KR102307103B1 (ko) | Simd sm4 암호화 블록 암호 기능성을 제공하는 명령어 및 로직 | |
JP2018503890A (ja) | ベクトル水平論理命令のための装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22903564 Country of ref document: EP Kind code of ref document: A1 |