CN101986262A - 基于模式偏移的混洗开关矩阵压缩方法 - Google Patents

基于模式偏移的混洗开关矩阵压缩方法 Download PDF

Info

Publication number
CN101986262A
CN101986262A CN 201010559286 CN201010559286A CN101986262A CN 101986262 A CN101986262 A CN 101986262A CN 201010559286 CN201010559286 CN 201010559286 CN 201010559286 A CN201010559286 A CN 201010559286A CN 101986262 A CN101986262 A CN 101986262A
Authority
CN
China
Prior art keywords
shuffle
shuffle mode
current
mode
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010559286
Other languages
English (en)
Other versions
CN101986262B (zh
Inventor
陈海燕
刘胜
陈书明
万江华
刘衡竹
陈跃跃
刘仲
张凯
刘祥远
李振涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN 201010559286 priority Critical patent/CN101986262B/zh
Publication of CN101986262A publication Critical patent/CN101986262A/zh
Application granted granted Critical
Publication of CN101986262B publication Critical patent/CN101986262B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种基于模式偏移的混洗开关矩阵压缩方法,其步骤为,步骤1:预设SF_Table为存储混洗模式的表;对当前混洗请求的数据粒度设置为交叉开关支持的最小数据粒度,按照当前粒度索引法进行压缩;步骤2:判断当前混洗请求压缩后的混洗模式与混洗模式表中的某一个表项是否存在模式偏移关系,如果是,跳转至步骤3,否则跳转至步骤4;步骤3:保持混洗模式表不变,在当前混洗指令中增加对应的混洗模式地址信息和相对偏移信息,然后处理下一个混洗请求;步骤4:将当前混洗模式添加到混洗模式表中,在当前混洗指令中增加对应的混洗模式地址信息和相对偏移信息,处理下一个混洗请求。本发明具有简单、操作简便、适用范围广、能够提高压缩效率等优点。

Description

基于模式偏移的混洗开关矩阵压缩方法
技术领域
本发明主要涉及采用单指令流多数据流(Single Instruction stream Multiple Data streams,SIMD)技术的通用处理器或数字信号处理器(Digital Signal Processor,DSP)领域,特指一种应用于SIMD或DSP中的混洗开关矩阵压缩方法。
背景技术
以子字并行和向量技术为代表的SIMD技术在解决媒体处理和无线通信等数据运算密集型应用中具有很大的优势,因而得到了广泛的应用和发展,受到了处理器特别是DSP的青睐。混洗单元主要负责SIMD部件各个处理单元寄存器之间数据的交互,是制约并行的处理单元性能发挥的关键部件。
混洗单元的硬件主体结构一般有以下三种方式,分别为交叉开关(Crossbar)、多级网络和完全混洗-交换网络。这三种结构当中Crossbar的灵活性最强,多级网络次之,完全混洗-交换网络最差;完全混洗-交换网络的硬件实现开销最小且扩展性也比较好,多级网络次之,Crossbar最差。由于嵌入式应用需要的混洗模式的多样性,Crossbar的使用最为广泛,本发明所论述的方法也以混洗单元的硬件结构为Crossbar为背景。
在以Crossbar为主要硬件结构的混洗单元中,混洗模式是和控制控制Crossbar中每个开关节点断开或导通的01值组成的矩阵是一一对应的。将控制Crossbar中每个开关节点断开或导通的01值组成的矩阵称之为开关矩阵,用户在执行混洗指令时(或之前)必须直接或间接告诉Crossbar本次混洗所需要的开关矩阵。由于开关矩阵本身的数据量比较大,需要对其进行压缩,一方面,这种压缩是非常必要的,开关矩阵的数据量和SIMD数据通路的宽度的平方成正比,随着SIMD数据通路的宽度的增加,开关矩阵的数据量会急剧膨胀;另一方面,必须要考虑到解压时电路的复杂性,宜采用比较简单的压缩-解压技术,以便在关键路径延时和压缩效率方面进行折衷。
一个应用程序所需要的所有混洗模式在程序执行之前都是确定的,在程序的预处理阶段需要对混洗请求做一些额外的工作,以便在执行某一条混洗指令时能够访问到正确的混洗模式,一般采用混洗模式表记录应用程序所需要的混洗模式,同时对每个混洗请求标识其混洗模式在混洗模式表的表项地址。在应用程序执行前,需要提前将混洗模式表中的数据加载到存储器中,以便供混洗指令使用。
传统的混洗单元和混洗指令中,一般采用最小数据粒度索引法来进行压缩。图1 是采用最小数据粒度索引法的开关矩阵压缩流程示意图:首先对当前混洗请求的数据粒度设置为Crossbar支持的最小数据粒度,然后按照当前粒度索引法(图4所描述的方法)对当前请求的开关矩阵进行压缩,接着判断压缩后的混洗模式是否与混洗模式表中保存的某一个混洗模式完全相同,如果相同则在当前的混洗指令当中增加地址信息(该地址指向混洗模式表中与当前混洗模式相同的表项的地址);如果不同,则在混洗模式表中将当前混洗模式添加进去,并在当前的混洗指令中增加指向当前表项的地址。循环处理,直到所有的混洗请求都处理完毕。
以摩托罗拉公司为设计主体的AltiVec指令集为例,在AltiVec指令集中,向量的宽度为128 bits(16个字节),且混洗的最小数据粒度为8 bits,AltiVec指令集中的混洗指令VPERM使用了一个向量寄存器(128bit)表示混洗模式,该向量寄存器共分为16个域(每一个8 bits),分别指示目标向量寄存器的每一个字节分别来自源向量寄存器中的哪一个字节(即每一个域表示了开关矩阵中的一行),类似的还有飞利浦公司的EVP处理器的SHF指令。
这种最小数据粒度索引法的开关矩阵压缩方法在目前的向量处理器中使用比较广泛,但这种方法并未考虑一个应用程序中不同混洗请求之间的模式偏移关系,对于混洗模式存在偏移关系的混洗请求的混洗模式是分别存储的,造成了整个应用程序的混洗指令的开关矩阵的压缩率较低。
发明内容
本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种原理简单、操作简便、适用范围广、能够增大相同容量的混洗模式存储器中包含的有效混洗模式的数、提高程序中混洗请求开关矩阵的压缩效率的基于模式偏移的混洗开关矩阵压缩方法,同时其解压逻辑增加的逻辑量不大,对现有关键路径延时影响较小。
为解决上述技术问题,本发明采用以下技术方案:
一种基于模式偏移的混洗开关矩阵压缩方法,其特征在于步骤为:
步骤1:预设SF_Table为存储混洗模式的表;对当前混洗请求的数据粒度设置为交叉开关支持的最小数据粒度,按照当前粒度索引法进行压缩;
步骤2:判断当前混洗请求压缩后的混洗模式与混洗模式表中的某一个表项是否存在模式偏移关系,如果是,跳转至步骤3,否则跳转至步骤4;
步骤3:保持混洗模式表不变,在当前混洗指令中增加对应的混洗模式地址信息和相对偏移信息,然后处理下一个混洗请求;
步骤4:将当前混洗模式添加到混洗模式表中,在当前混洗指令中增加对应的混洗模式地址信息和相对偏移信息,然后处理下一个混洗请求。
作为本发明的进一步改进:
所述步骤1的详细流程为:
设最终的混洗模式为SF,则SF共有N个域,每个域的位数1+log2N,用SF_i[j]表示混洗模式第i域的第j位,其中0≤i≤N-1,0≤j≤log2N,对于每个混洗请求的开关矩阵的压缩过程如下:
1.1. 设置变量i=0;
1.2. 查看开关矩阵的第i行,若Xi,0=Xi,1=…=Xi,N-2=Xi,N-1=0,则SF_i[log2N]=1,并且SF_i[log2N-1:0]=0;否则SF_i[log2N]=0,设置j=0并且转至步骤1.3;
1.3. 如果Xi,j=1,则设置SF_i[log2N-1:0]=j,并转至步骤1.5,否则转至步骤1.4;
1.4. j=j+1,并转至步骤1.3;
1.5. i=i+1,若i≤N-1,则跳至步骤1.2,否则压缩完毕,得到的SF_0,SF_1,…,SF_N-1即为压缩后的混洗模式。
所述步骤2的详细流程为:
2.1. 读取SF_Table中的第一个表项,并赋值给变量SF_temp,并且设置变量q=1;
2.2. 将SF_temp按照1+log2N的粒度循环左移q位,并将移位后的值记为SF_temp’,如果SF_temp’=SF,则转至步骤3;否则,转至2.3;
2.3 .q=q+1,如果q=N,则跳至步骤2.4;否则跳至步骤2.2;
2.4. 如果当前表项不是SF_Table中的最后一个表项,则读取SF_Table中的下一个表项,记为SF_temp,设置q=1,并跳至步骤2.2;否则跳至步骤4。
所述步骤3中,是在混洗指令增加对应的混洗模式地址Addr和相对偏移Q,其中,Addr指向当前所读取的SF_Table中的表项,Q=q,然后处理下一个混洗请求,并转至步骤1。
所述步骤4中,是将当前混洗请求的混洗模式添加到SF_Table中,并在混洗指令增加对应的混洗模式地址Addr和相对偏移Q,其中Addr指向新增加的表项在SF_Table中的位置,Q=0,然后处理下一个混洗请求,并转至步骤1。
与现有技术相比,本发明的优点在于:
1.本发明的混洗开关矩阵压缩方法,能够有效地提高混洗模式存储器的利用率,使存储混洗模式的存储器得到充分的利用;
2. 应用本发明后,同一个应用程序的需要的混洗模式的数量减少,使得加载混洗模式的数据量变小,减少了功耗; 
3. 解压电路简单,对关键路径延时影响较小。应用本发明提出方法,解压电路只需在传统方法的译码电路基础上增加小规模的移位逻辑,硬件复杂度不大。
4、综上所述,本发明提出的方法能够有效地压缩开关矩阵的容量,提高混洗模式存储器的利用率,并且对现有解压电路的影响不大,为向量处理器混洗指令和混洗单元的接口设计提供了新的思路。
附图说明
 图1 是采用最小数据粒度索引法的压缩流程示意图;  
图2 是本发明提出的基于模式偏移的混洗开关矩阵压缩方法的流程示意图;
图3 是本发明的第二步判断当前混洗请求的压缩后的混洗模式SF与SF_Table的某一个表项是否存在模式偏移关系的算法流程示意图;
图4 是传统的最小数据粒度索引法和本发明提出的基于模式偏移的混洗开关矩阵压缩方法中共有的子算法——当前粒度索引法的流程示意图;
图5 是存在模式偏移关系的多个混洗请求采用最小数据粒度索引法的开关矩阵压缩过程示意图;
图6 是存在模式偏移关系的多个混洗请求采用采用本发明提出的方法的开关矩阵压缩过程示意图。
具体实施方式
以下将结合说明书附图和具体实施例对本发明做进一步详细说明。
如图2所示,为本发明基于模式偏移的混洗开关矩阵压缩方法的流程示意图。本发明提出的方法和传统的方法最大的不同就是,将当前混洗请求的开关矩阵压缩后的混洗模式添加到混洗模式表时,判断当前混洗模式与混洗模式表中表项是否存在模式偏移关系,而传统的方法是不做上述判断的。
本发明在程序的预处理阶段,设置一个混洗模式表,对于每个混洗请求首先按照最小数据粒度索引法进行压缩,然后将压缩后的混洗模式和混洗模式表中已有的混洗模式进行模式偏移匹配,如果能够匹配,则不增加混洗模式表的表项,而仅仅更改当前混洗指令的表达方式,如果不能够匹配,则在混洗模式表中增加一条新的表项并更新当前混洗指令的表达方式。
假设处理器的数据通路总宽度为W bits,最小数据粒度为G bits,Crossbar的规模的为N*N,且每个端口的宽度为G bits(这里的W和G均为2的整数次幂,且N=W/G),则每一个混洗请求的混洗模式在初始时为一个N*N的开关矩阵,设初始时的开关矩阵为X,且其中每一个元素的数值为Xi,j(1≤i≤N-1, 1≤j≤N-1),设SF_Table为存储混洗模式的表。
本发明具体的流程如下:
步骤1:对当前混洗请求的数据粒度设置为Crossbar支持的最小数据粒度,按照当前粒度索引法进行压缩;
步骤2:判断当前混洗请求压缩后的混洗模式与混洗模式表中的某一个表项是否存在模式偏移关系,如果是,跳转至步骤3,否则跳转至步骤4;
步骤3:保持混洗模式表不变,在当前混洗指令中增加对应的混洗模式地址信息和相对偏移信息,然后处理下一个混洗请求;
步骤4:将当前混洗模式添加到混洗模式表中,在当前混洗指令中增加对应的混洗模式地址信息和相对偏移信息,然后处理下一个混洗请求。
图3 是本发明的步骤2判断当前混洗请求的压缩后的混洗模式SF与SF_Table的某一个表项是否存在模式偏移关系的算法流程示意图:
2.1 读取混洗模式表SF_Table的第一个表项,并赋值给变量SF_temp,同时将变量q设置为1;
2.2 将SF_temp按照1+ log2N的粒度循环左移q位,并将得到数值记为SF_temp’,比较SF和SF_temp’的数值,如果相等,则说明当前混洗请求和SF_Table中的当前表项存在模式偏移关系,偏移量为q,跳转至图2所描述的步骤3;否则,跳至2.3;
2.3 将q自增1,判断q是否等于N,如果不相等,则跳至2.2;否则,转至2.4;
2.4 判断当前表项是否是SF_Table中的最后一个表项,是则跳转转至图2所描述的步骤4;否则,读取SF_Table中的下一个表项,并赋值给SF_temp,将q设置为1,跳转至2.2.
图4 是传统的最小数据粒度索引法和本发明提出的基于模式偏移的混洗开关矩阵压缩方法中共有的子算法——当前粒度索引法的流程示意图:
1.1 将变量i设置为0;
1.2 判断当前数据粒度的开关矩阵的第i行的元素是否全部为0,如果是则将最终混洗模式SF的第i域的最高位SF_i[log2n]赋值为1,其余位置SF_i[log2n-1:0]赋值为0,并且跳转至1.4,否则将SF_i[log2n]赋值为0,设置变量j为0,并且跳转至1.3;
1.3 判断当前数据粒度的开关矩阵的第i行第j列的元素是否为1,若是则将SF_i[log2n-1:0]赋值为j,并跳转至1.4,否则将j自增1,并转至1.3;
1.4 将i自增1;并判断i是否小于当前数据粒度的开关矩阵的规模n,若是,则跳转至1.2,继续压缩开关矩阵的下一行元素,否则压缩完毕,得到的SF_0,SF_1,…,SF_n-1即为最终的混洗模式。
从上面的流程可以看出,本发明提出的方法是对传统的基于最小粒度的索引方法的改进,在本发明中需要判断当前混洗请求的混洗模式和混洗模式表中的表项是否存在模式偏移关系,而传统的方法只用判断当前混洗请求的混洗模式和混洗模式表中的表项是否相等。
针对本发明的基于模式偏移的开关矩阵压缩方法,本发明提出了如下混洗指令SHUF (Addr), Q, VRi, VRj. 其中Addr标识对应的混洗模式在存储器中的地址(在具体实现时,也可以不设置Addr,这时默认对应的混洗模式存在某个寄存器中,程序员需要提前将混洗模式搬移到这个寄存器中);Q标识当前的请求混洗模式与Addr标识的(或默认的)混洗模式之间的偏移关系,即将Addr标识的(或默认的)混洗模式左移Q位才能得到当前的混洗模式;VRi和VRj分别标识混洗操作的源操作数所在寄存器编号和目的操作数所在的寄存器编号。
本发明提出的方法在混洗指令在执行时,只需要先将混洗模式进行规模较小移位处理,然后再进行传统方法所需的译码处理即可驱动Crossbar对输入数据进行重排布,因而对关键路径延时影响很小。
如图5所示,为存在模式偏移关系的多个混洗请求采用最小数据粒度索引法的开关矩阵压缩过程示意图:图中Ai(0≤i≤7)和Bi(0≤i≤7)均为8bits的数据,Crossbar网络的规模为8*8,且每个端口的宽度为8bits,假设当前混洗模式表共有两个表项,即表项0和表项1.
混洗a将A0A1A2A3A4A5A6A7混洗为A3A2A5A4A0A1A7A6,混洗b将B0B1B2B3B4B5B6B7混洗为B5B4B0B1B7B6B3B2.两者的开关矩阵按照图4所描述的方法进行压缩得到:
0011_0010_0101_0100_0000_0001_0111_0110和0101_0100_0000_0001_0111_0110_0011_0010
在传统的方法中由于混洗a的混洗模式和混洗模式表中的第0表项和第1表项不相同,所以将混洗a的混洗模式加入混洗模式表中,作为表项2,并将混洗a的指令的地址信息标记为2(图中虚折线所示);同理,由于混洗b的混洗模式和混洗模式表中的第0表项、第1表项、第2表项均不相同,所以将混洗b的混洗模式加入混洗模式表中,作为表项3,并将混洗b的指令的地址信息标记为3(图中实折线所示)。
如图6所示,为存在模式偏移关系的多个混洗请求采用本发明提出的方法的开关矩阵压缩过程示意图:图中的示例和图5中的示例完全相同,不同的是,在混洗a的混洗模式加入混洗模式表之后,处理混洗b的混洗请求时,发现其混洗模式与混洗模式表的第2表项,存在模式偏移关系,且偏移量为2,这时就不需要将混洗b的混洗模式加入到混洗模式表中,只需要将混洗b的混洗指令的地址信息设置为2,偏移信息设置为2即可。图中的实折线指示混洗a的处理过程,虚折线指示混洗b的处理过程,椭圆线标识的为混洗指令的偏移信息域。由于本发明考虑了混洗模式之间的模式偏移,本示例中节省了一个混洗模式表项。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (5)

1.一种基于模式偏移的混洗开关矩阵压缩方法,其特征在于步骤为:
步骤1:预设SF_Table为存储混洗模式的表;对当前混洗请求的数据粒度设置为交叉开关支持的最小数据粒度,按照当前粒度索引法进行压缩;
步骤2:判断当前混洗请求压缩后的混洗模式与混洗模式表中的某一个表项是否存在模式偏移关系,如果是,跳转至步骤3,否则跳转至步骤4;
步骤3:保持混洗模式表不变,在当前混洗指令中增加对应的混洗模式地址信息和相对偏移信息,然后处理下一个混洗请求;
步骤4:将当前混洗模式添加到混洗模式表中,在当前混洗指令中增加对应的混洗模式地址信息和相对偏移信息,然后处理下一个混洗请求。
2.根据权利要求1所述的基于模式偏移的混洗开关矩阵压缩方法,其特征在于所述步骤1的详细流程为:
设最终的混洗模式为SF,则SF共有N个域,每个域的位数1+log2N,用SF_i[j]表示混洗模式第i域的第j位,其中0≤i≤N-1,0≤j≤log2N,对于每个混洗请求的开关矩阵的压缩过程如下:
1.1 设置变量i=0;
1.2 查看开关矩阵的第i行,若Xi,0=Xi,1=…=Xi,N-2=Xi,N-1=0,则SF_i[log2N]=1,并且SF_i[log2N-1:0]=0;否则SF_i[log2N]=0,设置j=0并且转至步骤1.3;
1.3 如果Xi,j=1,则设置SF_i[log2N-1:0]=j,并转至步骤1.5,否则转至步骤1.4;
1.4 j=j+1,并转至步骤1.3;
1.5 i=i+1,若i≤N-1,则跳至步骤1.2,否则压缩完毕,得到的SF_0,SF_1,…,SF_N-1即为压缩后的混洗模式。
3.根据权利要求1所述的基于模式偏移的混洗开关矩阵压缩方法,其特征在于所述步骤2的详细流程为:
2.1 读取SF_Table中的第一个表项,并赋值给变量SF_temp,并且设置变量q=1;
2.2 将SF_temp按照1+log2N的粒度循环左移q位,并将移位后的值记为SF_temp’,如果SF_temp’=SF,则转至步骤3;否则,转至2.3;
2.3 q=q+1,如果q=N,则跳至步骤2.4;否则跳至步骤2.2;
2.4 如果当前表项不是SF_Table中的最后一个表项,则读取SF_Table中的下一个表项,记为SF_temp,设置q=1,并跳至步骤2.2;否则跳至步骤4。
4.根据权利要求1所述的基于模式偏移的混洗开关矩阵压缩方法,其特征在于:所述步骤3中,是在混洗指令增加对应的混洗模式地址Addr和相对偏移Q,其中,Addr指向当前所读取的SF_Table中的表项,Q=q,然后处理下一个混洗请求,并转至步骤1。
5.根据权利要求1所述的基于模式偏移的混洗开关矩阵压缩方法,其特征在于:所述步骤4中,是将当前混洗请求的混洗模式添加到SF_Table中,并在混洗指令增加对应的混洗模式地址Addr和相对偏移Q,其中Addr指向新增加的表项在SF_Table中的位置,Q=0,然后处理下一个混洗请求,并转至步骤1。
CN 201010559286 2010-11-25 2010-11-25 基于模式偏移的混洗开关矩阵压缩方法 Active CN101986262B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010559286 CN101986262B (zh) 2010-11-25 2010-11-25 基于模式偏移的混洗开关矩阵压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010559286 CN101986262B (zh) 2010-11-25 2010-11-25 基于模式偏移的混洗开关矩阵压缩方法

Publications (2)

Publication Number Publication Date
CN101986262A true CN101986262A (zh) 2011-03-16
CN101986262B CN101986262B (zh) 2013-01-16

Family

ID=43710611

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010559286 Active CN101986262B (zh) 2010-11-25 2010-11-25 基于模式偏移的混洗开关矩阵压缩方法

Country Status (1)

Country Link
CN (1) CN101986262B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103189837A (zh) * 2011-10-18 2013-07-03 松下电器产业株式会社 混洗模式生成电路、处理器、混洗模式生成方法、命令
CN103959240A (zh) * 2011-12-15 2014-07-30 英特尔公司 使用混洗表和掩码存储表经由矢量指令优化程序循环的方法
TWI502506B (zh) * 2011-12-15 2015-10-01 Intel Corp 經由使用混洗表及混合表之向量指令以最佳化程式迴路的方法
CN105022609A (zh) * 2015-08-05 2015-11-04 浪潮(北京)电子信息产业有限公司 一种数据混洗方法和数据混洗单元
CN106716384A (zh) * 2015-01-15 2017-05-24 华为技术有限公司 一种数据混洗的装置及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1409520A (zh) * 2001-09-26 2003-04-09 深圳市中兴通讯股份有限公司上海第二研究所 一种提高端到端服务质量的编码方法
CN1581725A (zh) * 2003-08-07 2005-02-16 三星电子株式会社 在双时空发送分集系统中确定混洗模式的方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1409520A (zh) * 2001-09-26 2003-04-09 深圳市中兴通讯股份有限公司上海第二研究所 一种提高端到端服务质量的编码方法
CN1581725A (zh) * 2003-08-07 2005-02-16 三星电子株式会社 在双时空发送分集系统中确定混洗模式的方法和装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103189837A (zh) * 2011-10-18 2013-07-03 松下电器产业株式会社 混洗模式生成电路、处理器、混洗模式生成方法、命令
US9292286B2 (en) 2011-10-18 2016-03-22 Panasonic Intellectual Property Management Co., Ltd. Shuffle pattern generating circuit, processor, shuffle pattern generating method, and instruction sequence
CN103189837B (zh) * 2011-10-18 2016-12-28 松下知识产权经营株式会社 混洗模式生成电路、处理器、混洗模式生成方法、命令
CN103959240A (zh) * 2011-12-15 2014-07-30 英特尔公司 使用混洗表和掩码存储表经由矢量指令优化程序循环的方法
TWI502506B (zh) * 2011-12-15 2015-10-01 Intel Corp 經由使用混洗表及混合表之向量指令以最佳化程式迴路的方法
CN103959240B (zh) * 2011-12-15 2017-05-17 英特尔公司 使用混洗表和掩码存储表经由矢量指令优化程序循环的方法
CN106716384A (zh) * 2015-01-15 2017-05-24 华为技术有限公司 一种数据混洗的装置及方法
CN105022609A (zh) * 2015-08-05 2015-11-04 浪潮(北京)电子信息产业有限公司 一种数据混洗方法和数据混洗单元

Also Published As

Publication number Publication date
CN101986262B (zh) 2013-01-16

Similar Documents

Publication Publication Date Title
CN101986262B (zh) 基于模式偏移的混洗开关矩阵压缩方法
JP5680697B2 (ja) スカラー/ベクトル命令を使用したデータ処理システムおよび方法
CN100390729C (zh) 利用规格字段指令编码的处理器
CN101238454B (zh) 包括复数短乘法器和独立的矢量加载单元的具有集群式simd微体系结构的可编程数字信号处理器
CN102053816A (zh) 具有开关矩阵存储器的数据混洗单元及其混洗方法
EP1046983B1 (en) VLIW processor and program code compression device and method
CN101299185A (zh) 一种基于cisc结构的微处理器构架及指令实现方式
CN104395876B (zh) 没有算术和逻辑单元的计算机处理器和系统
US20130054546A1 (en) Hardware-based array compression
CN101346694B (zh) 用于处理器中的算术逻辑和移位装置
CN1532686B (zh) 处理器以及由处理器为矩阵处理使用两组寄存器的方法
WO2000054145A1 (en) Efficient microprocessor architecture
CN104756069A (zh) 元素选择单元及其中的方法
CN101303651B (zh) 业务处理方法及采用该方法的用户设备
CN102436393A (zh) 任务处理装置
CN112307431B (zh) 一种vdsp、数据处理方法及通讯设备
CN102629238A (zh) 支持向量条件访存的方法和装置
CN102073479B (zh) 基于数据粒度的混洗开关矩阵压缩方法
CN101470600B (zh) 一种超长指令字处理的方法和装置
CN105915325B (zh) 载波聚合中载波参数的设置方法、装置及移动终端
US7340591B1 (en) Providing parallel operand functions using register file and extra path storage
US7581086B2 (en) Digital signal processor
WO2007057828A2 (en) Processing system and method for executing instructions
US20050278504A1 (en) System capable of dynamically arranging coprocessor number
JP6259361B2 (ja) プログラマブルデバイスおよびその制御方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant