CN106021171A - 一种基于大规模粗粒度可重构处理器的sm4-128的密钥扩展实现方法及系统 - Google Patents

一种基于大规模粗粒度可重构处理器的sm4-128的密钥扩展实现方法及系统 Download PDF

Info

Publication number
CN106021171A
CN106021171A CN201610299347.XA CN201610299347A CN106021171A CN 106021171 A CN106021171 A CN 106021171A CN 201610299347 A CN201610299347 A CN 201610299347A CN 106021171 A CN106021171 A CN 106021171A
Authority
CN
China
Prior art keywords
computing
data
reconfigurable
row
reconfigurable processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610299347.XA
Other languages
English (en)
Inventor
杨锦江
闵婧
申艾麟
尹玲
李兆奇
明畅
葛伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University - Wuxi Institute Of Technology Integrated Circuits
Original Assignee
Southeast University - Wuxi Institute Of Technology Integrated Circuits
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University - Wuxi Institute Of Technology Integrated Circuits filed Critical Southeast University - Wuxi Institute Of Technology Integrated Circuits
Priority to CN201610299347.XA priority Critical patent/CN106021171A/zh
Publication of CN106021171A publication Critical patent/CN106021171A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7867Architectures of general purpose stored program computers comprising a single central processing unit with reconfigurable architecture
    • G06F15/7871Reconfiguration support, e.g. configuration loading, configuration switching, or hardware OS
    • G06F15/7882Reconfiguration support, e.g. configuration loading, configuration switching, or hardware OS for self reconfiguration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/70Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer
    • G06F21/71Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure computing or processing of information
    • G06F21/72Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure computing or processing of information in cryptographic circuits

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Storage Device Security (AREA)

Abstract

本发明公开了一种基于大规模粗粒度可重构处理器的SM4‑128的密钥扩展实现方法及系统,该系统包括可重构处理器、微处理器、系统总线;所述可重构计算阵列包括可重构计算阵列块,可重构计算阵列块包括可重构阵列运算行、写端口运算行选择器、读端口运算行选择器;所述微处理器通过系统总线分别与配置控制模块的配置与控制接口,可重构处理器的输入先入先出寄存器组连接,所述输入先入先出寄存器组连接可重构计算阵列,可重构计算阵列连接输出端连接可重构处理器,输出端连接可重构处理器通过系统总线与微处理器连接。本发明针对SM4‑128密钥扩展方法,通过将多轮迭代在可重构处理器中部分展开和中间结果数据缓存的方式进行优化和加速。

Description

一种基于大规模粗粒度可重构处理器的SM4-128的密钥扩展实现 方法及系统
技术领域
本发明涉及嵌入式可重构系统领域,尤其涉及一种应用于通信、加密等领域的基于大规模粗粒度嵌入式可重构系统及其处理方法。
背景技术
通用处理器与专用集成电路(ASIC)是传统的计算机系统结构领域的两大主流方法。然而,随着应用领域对系统的性能、能耗、上市时间等指标需求的不断提高,这两种传统计算模式的弊端就暴露出来。
通用处理器方法适用范围广,但是计算效率低,专用集成电路虽然可以提高计算速度和计算效率,满足性能需求,但是ASIC器件的灵活性很差。
为了在灵活性和计算效率之间实现很好的权衡,可重构计算(reconfigurable computing)技术应运而生。可重构计算是当前计算机系统结构领域的发展趋势之一,它的架构介于通用处理器和ASIC之间,并且综合了二者长处。它通过对可重构设备进行配置,可以使之由一个通用的计算平台转化为一个专用的硬件系统,以完成具体的计算任务,相当于计算任务同时在时间和空间上展开,显示出了应用的灵活性和很高的计算性能。此外,可重构计算技术还具有系统能耗低、可靠性高、上市时间短等优势。这些优势使得可重构计算技术在各个应用领域尤其是嵌入式应用领域有着广阔的应用前景。很多在嵌入式领域中的主流应用,例如多媒体应用、加/解密应用以及通信应用等都非常适合利用可重构计算技术实现。当前的可重构计算技术主要还是用于尖端技术领域中的计算平台,但随着可重构逻辑器件成本逐渐降低,运行时可重构计算技术不断完善,我们有理由相信可重构计算技术具备的种种优势会使其在更多的领域里大有作为。
目前国内外已研究有多重可重构系统,如ReMAP,AsAP,DRP等。但是,这些阵列的互联方式较为简单,在SM4-128方法的运算中需要大量的中间数据存储以及较多的轮数,因此运算的效率和速度较低。传统的可重构计算系统在SM4-128的运算效率与运算周期方面存在较大问题。
发明内容
为了克服现有技术中存在的不足,本发明的目的是提供一种基于大规模粗粒度可重构处理器的SM4-128的密钥扩展实现方法及系统,利用可重构技术的并行性处理、运算模块独立可配置等优点,在支持一定的灵活性的同时,通过提高对SM4-128密钥扩展的并行度以及优化流水线等方法以实现SM4-128密钥扩展的高效运算。
为实现上述目的,本发明采用的技术方案为:
一种基于大规模粗粒度可重构处理器的SM4-128的密钥扩展系统,包括可重构处理器、微处理器、系统总线;
其中,所述可重构处理器包括配置控制模块、输入先入先出寄存器组、输出先入先出寄存器组、通用寄存器堆、可重构计算阵列;
所述配置控制模块包括依次连接的配置与控制接口、配置存储器、配置解析模块,配置控制模块的输出端连接可重构处理器;
所述可重构计算阵列包括可重构计算阵列块,可重构计算阵列块包括可重构阵列运算行、写端口运算行选择器、读端口运算行选择器;所述可重构阵列运算行的输出端连接写端口运算行选择器的输入端,写端口运算行选择器的输出端连接通用寄存器堆;所述读端口运算行选择器的输入端接入通用寄存器堆,读端口运算行选择器的输出端连接可重构阵列运算行;
其中,所述可重构阵列运算行包括算术逻辑单元、查找表单元、比特置换网络、字节置换网络以及数据输入单元和数据输出单元;
所述微处理器通过系统总线分别与配置控制模块的配置与控制接口,可重构处理器的输入先入先出寄存器组连接,所述输入先入先出寄存器组连接可重构计算阵列,可重构计算阵列连接输出端连接可重构处理器,输出端连接可重构处理器通过系统总线与微处理器连接;
其中,通过分析SM4-128密钥扩展的特征来确定SM4-128密钥扩展的运算流程,将多轮的SM4-128密钥扩展运算展开成一幅数据流图映射到可重构处理器中,通过多幅数据流图最终完成SM4-128密钥扩展的整个运算;
微处理器通过系统总线发送明文数据给可重构处理器,可重构处理器将明文数据存入输入先入先出寄存器组,并在最终计算完成后输出密文数据到输出先入先出寄存器组,并发送中断信号,最终由微处理器读出输出至输出先入先出寄存器组中的数据。
首先对配置控制模块中的配置存储器进行初始化,微处理器将所需要的配置信息通过配置与控制接口发送到配置存储器中,然后通过配置解析模块解析配置存储器,实现对计算阵列的配置、启动以及切换操作。
进一步的,所述的可重构处理器有M个可重构计算阵列块、1个通用寄存器堆、1个输入先入先出寄存器组和1个输出先入先出寄存器组,其中M取整数;其中M个可重构计算阵列块通过一个1个通用寄存器堆互相进行数据的储存、读取和传递;且多个可重构计算阵列块中相邻的两个可重构计算阵列块通过数据输入单元和数据输出单元连接;第一个可重构计算阵列块通过第一个可重构阵列运算行的数据输入单元与输入先入先出寄存器组相连,同时第M个可重构计算阵列块通过最后一个可重构阵列运算行的数据输出单元与输出先入先出寄存器组相连。作为优选方案,可重构处理器有10个可重构计算阵列块.
进一步的,所述的每个可重构计算阵列块包括N个可重构阵列运算行和1个读端口运算行选择器和1个写端口运算行选择器,其中N取整数;其每N个可重构阵列运算行共享1个通用寄存器堆的读端口和写端口;在SM4-128密钥扩展运算中可重构阵列运算行通过通用寄存器堆读出各种缓冲数据如CK[i],K[i]以及各种临时的消息摘要,其中CK[i]为32比特的固定参数,K[i]为32比特的扩展密钥,同时向通用寄存器堆写入消息摘要的每轮计算的中间值以及缓冲数据CK[i]及K[i],这些缓冲数据被其他可重构计算阵列读出用于下一轮计算。作为优选方案,可重构阵列块包括4个可重构阵列运算行。
进一步的,所述的可重构阵列运算行包括X1个数据输入单元,X2个数据输出单元,X3个字节置换网络,X4个比特置换网络和X5个8位算术逻辑单元,X6个查找表单元,其中X1,X2,X3,X4,X5和X6均取整数;数据经过数据输入单元,由选择器通过读取并解析不同的配置信息来选择数据流入的字节置换网络和比特置换网络;字节置换网络与比特置换网络的输出分为X5个8位的数据分别固定对应于X5个8位算术逻辑单元,并行运算X5/4组SM4-128密钥扩展数据;每个算术逻辑单元使用数据选择器选择任意三个置换网络的输出作为其输入;数据输出单元暂存算术逻辑单元的结果并读取配置信息决定将数据输出到先入先出寄存器组、下一个可重构阵列运算行或通用寄存器堆。
进一步的,所述算术逻辑单元及显示查找表可实现异或运算、与运算、直通输出、查表操作等运算操作;同时每个算术逻辑单元有最多3个输入和最多2个输出,其中算术逻辑单元执行上述运算操作的同时,支持任选一个输入作为输出;每4个8位的算术逻辑单元通过进位端口连接成为1个32位的算术逻辑单元;每4个可重构阵列运算行共享一个显示查找表,来实现查表操作。
进一步的,该系统的密钥扩展流程包括如下6个步骤,对于32个32比特的扩展密钥,对(1)中的操作执行一次后,对(2)~(6)步骤顺序操作并循环32次,即可得到rk[i](其中0≤i≤31):
(1)密钥初始化:通过加密密钥MK[i]及系统参数FK[i]进行异或操作得到K[i],(其中0≤i≤3).对每个i值,MK[i]及对应FK[i]进行异或操作,得到K[i]。每32比特的MK[i]与FK[i]在算术逻辑单元中执行MK[i]+FK[i]的异或操作,并将计算结果存入通用寄存器中;
(2)生成m[i]:数据输入单元将K[i+1],K[i+2],K[i+3]载入可重构运算单元行中,在经过字节置换网络进行移位后,再对K[i+1],K[i+2],K[i+3]三者进行异或操作,将结果m[i]输出至缓存单元中;
(3)生成t[i]:数据输入单元将CK[i]及缓存单元中的数据m[i]载入可重构运算单元行中,在经过字节置换网络后,在逻辑运算单元中对CK[i]及m[i]进行异或操作,将结果t[i]存入缓存单元中;
(4)查表操作:数据输入单元将t[i]从缓存单元中载入至可重构运算单元行中。t[i]在通过字节置换网络后,在显示查找表中对t[i]进行查表操作,得到B[i],并将B[i]存入缓存单元中;
(5)线性变换:数据输入单元将B[i]从缓存单元中载入至可重构阵列单元行中。B[i]在经过比特置换网络后,生成中间数据B1[i],B2[i],将B1[i],B2[i],B[i]三者进行异或操作,生成T[i],并将T[i]存入缓存单元;
(6)生成rk[i]:数据输入单元将T[i]从缓存单元中载入至可重构阵列单元行中,对T[i]及K[i]进行异或操作,得到K[i+4],即rk[i]。
一种基于大规模粗粒度可重构处理器的SM4-128密钥扩展实现方法,包括以下步骤:
(1)分析SM4-128密钥扩展的计算特点,并归纳出数据流图;
(2)确定数据流图之后,针对可重构处理器的硬件特点,在了解其各寄存器、运算器以及各功能模块的作用机制的情况下配置可重构处理器,并生成配置信息;
(3)通过微处理器将配置信息以及所需要的各种初始数据存入相应的存储器中;
(4)最后微处理器启动可重构处理器,并将配置信息及数据发送给可重构处理器;
(5)当可重构处理器完成当前任务后,发送中断信号。
有益效果:本发明基于大规模粗粒度动态可重构处理器,通过10个可重构阵列块包含多个运算单元,借助通用寄存器堆提高SM4-128算法的运算并行度,在具有一定灵活性的同时,提高SM4-128方法的运算效率,尽可能的减少运算周期。
附图说明
图1为本发明的基于大规模粗粒度嵌入式可重构系统处理器框图;
图2a-图2d为一个可重构阵列块的运算流图,共同构成本发明中SM4-128密钥扩展方法运算流图。
具体实施方式
下面结合附图对本发明作更进一步的说明。
如图1所示为一种基于大规模粗粒度可重构处理器的SM4-128的密钥扩展系统,包括可重构处理器、微处理器、系统总线;
其中,所述可重构处理器包括配置控制模块、输入先入先出寄存器组、输出先入先出寄存器组、通用寄存器堆、可重构计算阵列;
所述配置控制模块包括依次连接的配置与控制接口、配置存储器、配置解析模块,配置控制模块的输出端连接可重构处理器;
所述可重构计算阵列包括可重构计算阵列块,可重构计算阵列块包括可重构阵列运算行、写端口运算行选择器、读端口运算行选择器;所述可重构阵列运算行的输出端连接写端口运算行选择器的输入端,写端口运算行选择器的输出端连接通用寄存器堆;所述读端口运算行选择器的输入端接入通用寄存器堆,读端口运算行选择器的输出端连接可重构阵列运算行;
其中,所述可重构阵列运算行包括算术逻辑单元、查找表单元、比特置换网络、字节置换网络以及数据输入单元和数据输出单元;
所述微处理器通过系统总线分别与配置控制模块的配置与控制接口,可重构处理器的输入先入先出寄存器组连接,所述输入先入先出寄存器组连接可重构计算阵列,可重构计算阵列连接输出端连接可重构处理器,输出端连接可重构处理器通过系统总线与微处理器连接;
其中,通过分析SM4-128密钥扩展的特征来确定SM4-128密钥扩展的运算流程,将多轮的SM4-128密钥扩展运算展开成一幅数据流图映射到可重构处理器中,通过多幅数据流图最终完成SM4-128密钥扩展的整个运算;
微处理器通过系统总线发送明文数据给可重构处理器,可重构处理器将明文数据存入输入先入先出寄存器组,并在最终计算完成后输出密文数据到输出先入先出寄存器组,并发送中断信号,最终由微处理器读出输出至输出先入先出寄存器组中的数据。
首先对配置控制模块中的配置存储器进行初始化,微处理器将所需要的配置信息通过配置与控制接口发送到配置存储器中,然后通过配置解析模块解析配置存储器,实现对计算阵列的配置、启动以及切换操作。
可重构处理器有M个可重构计算阵列块、1个通用寄存器堆、1个输入先入先出寄存器组和1个输出先入先出寄存器组,其中M取整数;其中M个可重构计算阵列块通过一个1个通用寄存器堆互相进行数据的储存、读取和传递;且多个可重构计算阵列块中相邻的两个可重构计算阵列块通过数据输入单元和数据输出单元连接;第一个可重构计算阵列块通过第一个可重构阵列运算行的数据输入单元与输入先入先出寄存器组相连,同时第M个可重构计算阵列块通过最后一个可重构阵列运算行的数据输出单元与输出先入先出寄存器组相连。作为优选方案,可重构处理器有10个可重构计算阵列块.
每个可重构计算阵列块包括N个可重构阵列运算行和1个读端口运算行选择器和1个写端口运算行选择器,其中N取整数;其每N个可重构阵列运算行共享1个通用寄存器堆的读端口和写端口;在SM4-128密钥扩展运算中可重构阵列运算行通过通用寄存器堆读出各种缓冲数据如CK[i],K[i]以及各种临时的消息摘要,其中CK[i]为32比特的固定参数,K[i]为32比特的扩展密钥,同时向通用寄存器堆写入消息摘要的每轮计算的中间值以及缓冲数据CK[i]及K[i],这些缓冲数据被其他可重构计算阵列读出用于下一轮计算。作为优选方案,可重构阵列块包括4个可重构阵列运算行。
可重构阵列运算行包括X1个数据输入单元,X2个数据输出单元,X3个字节置换网络,X4个比特置换网络和X5个8位算术逻辑单元,X6个查找表单元,其中X1,X2,X3,X4,X5和X6均取整数;数据经过数据输入单元,由选择器通过读取并解析不同的配置信息来选择数据流入的字节置换网络和比特置换网络;字节置换网络与比特置换网络的输出分为X5个8位的数据分别固定对应于X5个8位算术逻辑单元,并行运算X5/4组SM4-128密钥扩展数据;每个算术逻辑单元使用数据选择器选择任意三个置换网络的输出作为其输入;数据输出单元暂存算术逻辑单元的结果并读取配置信息决定将数据输出到先入先出寄存器组、下一个可重构阵列运算行或通用寄存器堆。
算术逻辑单元及显示查找表可实现异或运算、与运算、直通输出、查表操作等运算操作;同时每个算术逻辑单元有最多3个输入和最多2个输出,其中算术逻辑单元执行上述运算操作的同时,支持任选一个输入作为输出;每4个8位的算术逻辑单元通过进位端口连接成为1个32位的算术逻辑单元;每4个可重构阵列运算行共享一个显示查找表,来实现查表操作。
该系统的密钥扩展流程包括如下6个步骤对于32个32比特的扩展密钥,对(1)中的操作执行一次后,对(2)~(6)步骤顺序操作并循环32次,即可得到rk[i](其中0≤i≤31):
(1)密钥初始化:通过加密密钥MK[i]及系统参数FK[i]进行异或操作得到K[i],(其中0≤i≤3).对每个i值,MK[i]及对应FK[i]进行异或操作,得到K[i]。每32比特的MK[i]与FK[i]在算术逻辑单元中执行MK[i]+FK[i]的异或操作,并将计算结果存入通用寄存器中;
(2)生成m[i]:数据输入单元将K[i+1],K[i+2],K[i+3]载入可重构运算单元行中,在经过字节置换网络进行移位后,再对K[i+1],K[i+2],K[i+3]三者进行异或操作,将结果m[i]输出至缓存单元中;
(3)生成t[i]:数据输入单元将CK[i]及缓存单元中的数据m[i]载入可重构运算单元行中,在经过字节置换网络后,在逻辑运算单元中对CK[i]及m[i]进行异或操作,将结果t[i]存入缓存单元中;
(4)查表操作:数据输入单元将t[i]从缓存单元中载入至可重构运算单元行中。t[i]在通过字节置换网络后,在显示查找表中对t[i]进行查表操作,得到B[i],并将B[i]存入缓存单元中;
(5)线性变换:数据输入单元将B[i]从缓存单元中载入至可重构阵列单元行中。B[i]在经过比特置换网络后,生成中间数据B1[i],B2[i],将B1[i],B2[i],B[i]三者进行异或操作,生成T[i],并将T[i]存入缓存单元;
(6)生成rk[i]:数据输入单元将T[i]从缓存单元中载入至可重构阵列单元行中,对T[i]及K[i]进行异或操作,得到K[i+4],即rk[i]。
一种基于大规模粗粒度可重构处理器的SM4-128密钥扩展实现方法,包括以下步骤:
(1)分析SM4-128密钥扩展的计算特点,并归纳出数据流图;
(2)确定数据流图之后,针对可重构处理器的硬件特点,在了解其各寄存器、运算器以及各功能模块的作用机制的情况下配置可重构处理器,并生成配置信息;
(3)通过微处理器将配置信息以及所需要的各种初始数据存入相应的存储器中;
(4)最后微处理器启动可重构处理器,并将配置信息及数据发送给可重构处理器;
(5)当可重构处理器完成当前任务后,发送中断信号。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种等同变换,这些等同变换均属于本发明的保护范围。

Claims (7)

1.一种基于大规模粗粒度可重构处理器的SM4-128的密钥扩展系统,其特征在于:包括可重构处理器、微处理器、系统总线;
其中,所述可重构处理器包括配置控制模块、输入先入先出寄存器组、输出先入先出寄存器组、通用寄存器堆、可重构计算阵列;
所述配置控制模块包括依次连接的配置与控制接口、配置存储器、配置解析模块,配置控制模块的输出端连接可重构处理器;
所述可重构计算阵列包括可重构计算阵列块,可重构计算阵列块包括可重构阵列运算行、写端口运算行选择器、读端口运算行选择器;所述可重构阵列运算行的输出端连接写端口运算行选择器的输入端,写端口运算行选择器的输出端连接通用寄存器堆;所述读端口运算行选择器的输入端接入通用寄存器堆,读端口运算行选择器的输出端连接可重构阵列运算行;
其中,所述可重构阵列运算行包括算术逻辑单元、查找表单元、比特置换网络、字节置换网络以及数据输入单元和数据输出单元;
所述微处理器通过系统总线分别与配置控制模块的配置与控制接口,可重构处理器的输入先入先出寄存器组连接,所述输入先入先出寄存器组连接可重构计算阵列,可重构计算阵列连接输出端连接可重构处理器,输出端连接可重构处理器通过系统总线与微处理器连接;
其中,通过分析SM4-128密钥扩展的特征来确定SM4-128密钥扩展的运算流程,将多轮的SM4-128密钥扩展运算展开成一幅数据流图映射到可重构处理器中,通过多幅数据流图最终完成SM4-128密钥扩展的整个运算;
微处理器通过系统总线发送明文数据给可重构处理器,可重构处理器将明文数据存入输入先入先出寄存器组,并在最终计算完成后输出密文数据到输出先入先出寄存器组,并发送中断信号,最终由微处理器读出输出至输出先入先出寄存器组中的数据。
2.如权利要求1所述的基于大规模粗粒度可重构处理器的SM4-128的密钥扩展系统,其特征在于:所述的可重构处理器有M个可重构计算阵列块、1个通用寄存器堆、1个输入先入先出寄存器组和1个输出先入先出寄存器组,其中M取整数;其中M个可重构计算阵列块通过一个1个通用寄存器堆互相进行数据的储存、读取和传递;且多个可重构计算阵列块中相邻的两个可重构计算阵列块通过数据输入单元和数据输出单元连接;第一个可重构计算阵列块通过第一个可重构阵列运算行的数据输入单元与输入先入先出寄存器组相连,同时第M个可重构计算阵列块通过最后一个可重构阵列运算行的数据输出单元与输出先入先出寄存器组相连。
3.如权利要求2所述的基于大规模粗粒度可重构处理器的SM4-128的密钥扩展系统,其特征在于:所述的每个可重构计算阵列块包括N个可重构阵列运算行和1个读端口运算行选择器和1个写端口运算行选择器,其中N取整数;其每N个可重构阵列运算行共享1个通用寄存器堆的读端口和写端口;在SM4-128密钥扩展运算中可重构阵列运算行通过通用寄存器堆读出各种缓冲数据如CK[i],K[i]以及各种临时的消息摘要,其中CK[i]为32比特的固定参数,K[i]为32比特的扩展密钥,同时向通用寄存器堆写入消息摘要的每轮计算的中间值以及缓冲数据CK[i]及K[i],这些缓冲数据被其他可重构计算阵列读出用于下一轮计算。
4.如权利要求3所述的基于大规模粗粒度可重构处理器的SM4-128的密钥扩展系统,其特征在于:所述的可重构阵列运算行包括X1个数据输入单元,X2个数据输出单元,X3个字节置换网络,X4个比特置换网络和X5个8位算术逻辑单元,X6个查找表单元,其中X1,X2,X3,X4,X5和X6均取整数;数据经过数据输入单元,由选择器通过读取并解析不同的配置信息来选择数据流入的字节置换网络和比特置换网络;字节置换网络与比特置换网络的输出分为X5个8位的数据分别固定对应于X5个8位算术逻辑单元,并行运算X5/4组SM4-128密钥扩展数据;每个算术逻辑单元使用数据选择器选择任意三个置换网络的输出作为其输入;数据输出单元暂存算术逻辑单元的结果并读取配置信息决定将数据输出到先入先出寄存器组、下一个可重构阵列运算行或通用寄存器堆。
5.如权利要求4所述的基于大规模粗粒度可重构处理器的SM4-128的密钥扩展系统,其特征在于:所述算术逻辑单元及显示查找表可实现异或运算、与运算、直通输出、查表操作等运算操作;同时每个算术逻辑单元有最多3个输入和最多2个输出,其中算术逻辑单元执行上述运算操作的同时,支持任选一个输入作为输出;每4个8位的算术逻辑单元通过进位端口连接成为1个32位的算术逻辑单元;每4个可重构阵列运算行共享一个显示查找表,来实现查表操作。
6.如权利要求1-5任一所述的基于大规模粗粒度可重构处理器的SM4-128的密钥扩展系统,其特征在于:该系统的密钥扩展流程包括如下6个步骤,对于32个32比特的扩展密钥,对(1)中的操作执行一次后,对(2)~(6)步骤顺序操作并循环32次,即可得到rk[i](其中0≤i≤31):
(1)密钥初始化:通过加密密钥MK[i]及系统参数FK[i]进行异或操作得到K[i],(其中0≤i≤3).对每个i值,MK[i]及对应FK[i]进行异或操作,得到K[i]。每32比特的MK[i]与FK[i]在算术逻辑单元中执行MK[i]+FK[i]的异或操作,并将计算结果存入通用寄存器中;
(2)生成m[i]:数据输入单元将K[i+1],K[i+2],K[i+3]载入可重构运算单元行中,在经过字节置换网络进行移位后,再对K[i+1],K[i+2],K[i+3]三者进行异或操作,将结果m[i]输出至缓存单元中;
(3)生成t[i]:数据输入单元将CK[i]及缓存单元中的数据m[i]载入可重构运算单元行中,在经过字节置换网络后,在逻辑运算单元中对CK[i]及m[i]进行异或操作,将结果t[i]存入缓存单元中;
(4)查表操作:数据输入单元将t[i]从缓存单元中载入至可重构运算单元行中。t[i]在通过字节置换网络后,在显示查找表中对t[i]进行查表操作,得到B[i],并将B[i]存入缓存单元中;
(5)线性变换:数据输入单元将B[i]从缓存单元中载入至可重构阵列单元行中。B[i]在经过比特置换网络后,生成中间数据B1[i],B2[i],将B1[i],B2[i],B[i]三者进行异或操作,生成T[i],并将T[i]存入缓存单元;
(6)生成rk[i]:数据输入单元将T[i]从缓存单元中载入至可重构阵列单元行中,对T[i]及K[i]进行异或操作,得到K[i+4],即rk[i]。
7.一种基于大规模粗粒度可重构处理器的SM4-128密钥扩展实现方法,其特征在于:包括以下步骤:
(1)分析SM4-128密钥扩展的计算特点,并归纳出数据流图;
(2)确定数据流图之后,针对可重构处理器的硬件特点,在了解其各寄存器、运算器以及各功能模块的作用机制的情况下配置可重构处理器,并生成配置信息;
(3)通过微处理器将配置信息以及所需要的各种初始数据存入相应的存储器中;
(4)最后微处理器启动可重构处理器,并将配置信息及数据发送给可重构处理器;
(5)当可重构处理器完成当前任务后,发送中断信号。
CN201610299347.XA 2016-05-06 2016-05-06 一种基于大规模粗粒度可重构处理器的sm4-128的密钥扩展实现方法及系统 Pending CN106021171A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610299347.XA CN106021171A (zh) 2016-05-06 2016-05-06 一种基于大规模粗粒度可重构处理器的sm4-128的密钥扩展实现方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610299347.XA CN106021171A (zh) 2016-05-06 2016-05-06 一种基于大规模粗粒度可重构处理器的sm4-128的密钥扩展实现方法及系统

Publications (1)

Publication Number Publication Date
CN106021171A true CN106021171A (zh) 2016-10-12

Family

ID=57099023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610299347.XA Pending CN106021171A (zh) 2016-05-06 2016-05-06 一种基于大规模粗粒度可重构处理器的sm4-128的密钥扩展实现方法及系统

Country Status (1)

Country Link
CN (1) CN106021171A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108717402A (zh) * 2018-05-16 2018-10-30 清华大学 用于可重构处理系统的存储器和可重构处理系统
CN109218008A (zh) * 2017-07-05 2019-01-15 北京同方微电子有限公司 一种针对sm4密钥扩展算法的模板攻击方法
CN110321162A (zh) * 2019-07-01 2019-10-11 无锡沐创集成电路设计有限公司 基于粗粒度可重构计算单元的present加密算法实现方法及系统
CN112350819A (zh) * 2020-10-23 2021-02-09 四川九洲电器集团有限责任公司 一种全流水线sms4加解密方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1635731A (zh) * 2003-12-27 2005-07-06 海信集团有限公司 可重构密码协处理器电路
US20090254516A1 (en) * 2008-04-07 2009-10-08 Krishnan Meiyyappan Accessing data in a column store database based on hardware compatible indexing and replicated reordered columns
CN103076849A (zh) * 2012-12-26 2013-05-01 无锡江南计算技术研究所 可重构微服务器系统
CN104933008A (zh) * 2015-06-24 2015-09-23 东南大学 可重构系统和可重构阵列结构及其应用
CN105335331A (zh) * 2015-12-04 2016-02-17 东南大学 一种基于大规模粗粒度可重构处理器的sha256实现方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1635731A (zh) * 2003-12-27 2005-07-06 海信集团有限公司 可重构密码协处理器电路
US20090254516A1 (en) * 2008-04-07 2009-10-08 Krishnan Meiyyappan Accessing data in a column store database based on hardware compatible indexing and replicated reordered columns
CN103076849A (zh) * 2012-12-26 2013-05-01 无锡江南计算技术研究所 可重构微服务器系统
CN104933008A (zh) * 2015-06-24 2015-09-23 东南大学 可重构系统和可重构阵列结构及其应用
CN105335331A (zh) * 2015-12-04 2016-02-17 东南大学 一种基于大规模粗粒度可重构处理器的sha256实现方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109218008A (zh) * 2017-07-05 2019-01-15 北京同方微电子有限公司 一种针对sm4密钥扩展算法的模板攻击方法
CN109218008B (zh) * 2017-07-05 2023-12-19 紫光同芯微电子有限公司 一种针对sm4密钥扩展算法的模板攻击方法
CN108717402A (zh) * 2018-05-16 2018-10-30 清华大学 用于可重构处理系统的存储器和可重构处理系统
CN110321162A (zh) * 2019-07-01 2019-10-11 无锡沐创集成电路设计有限公司 基于粗粒度可重构计算单元的present加密算法实现方法及系统
CN112350819A (zh) * 2020-10-23 2021-02-09 四川九洲电器集团有限责任公司 一种全流水线sms4加解密方法及系统

Similar Documents

Publication Publication Date Title
CN105912501B (zh) 一种基于大规模粗粒度可重构处理器的sm4-128加密算法实现方法及系统
CN105335331B (zh) 一种基于大规模粗粒度可重构处理器的sha256实现方法及系统
CN114238204B (zh) 可重构并行处理
CN110321162B (zh) 基于粗粒度可重构计算单元的present加密算法实现方法及系统
CN105975251B (zh) 一种基于粗粒度可重构架构的des算法轮迭代系统及迭代方法
US20110153707A1 (en) Multiplying and adding matrices
CN104982051B (zh) 用于加速无线安全算法的装置、方法和系统
CN110059493B (zh) 基于粗粒度可重构计算单元的skinny-128-128加密算法实现方法及系统
US7689541B1 (en) Reordering data using a series of offsets
CN100536390C (zh) 一种椭圆曲线密码协处理器
CN106021171A (zh) 一种基于大规模粗粒度可重构处理器的sm4-128的密钥扩展实现方法及系统
CN104933008A (zh) 可重构系统和可重构阵列结构及其应用
US20170052789A1 (en) Instruction for fast zuc algorithm processing
Feldmann et al. F1: A fast and programmable accelerator for fully homomorphic encryption (extended version)
US7624107B1 (en) Radix sort algorithm for graphics processing units
KR20190028426A (ko) Simd 아키텍처에서 레인 셔플을 위한 셔플러 회로
EP3623940A2 (en) Systems and methods for performing horizontal tile operations
CN103761072A (zh) 一种粗粒度可重构层次化的阵列寄存器文件结构
CN104756069A (zh) 元素选择单元及其中的方法
US20210241806A1 (en) Streaming access memory device, system and method
CN106155979B (zh) 一种基于粗粒度可重构架构的des算法密钥扩展系统及扩展方法
US11165428B1 (en) Circuits and methods for updating lookup tables
CN109672524B (zh) 基于粗粒度可重构架构的sm3算法轮迭代系统及迭代方法
CN103235717B (zh) 具有多态指令集体系结构的处理器
CN112613080A (zh) 一种面向轻量级分组密码算法的可重构阵列单元及阵列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161012

RJ01 Rejection of invention patent application after publication