CN111064567B

CN111064567B - 一种sidh特殊域快速模乘方法

Info

Publication number: CN111064567B
Application number: CN201910947892.9A
Authority: CN
Inventors: 刘伟强; 倪子颖; 倪健
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2019-09-30
Filing date: 2019-09-30
Publication date: 2022-04-08
Anticipated expiration: 2039-09-30
Also published as: CN111064567A

Abstract

本发明提出一种SIDH中特殊域快速模乘方法，该方法通过设置基数

将乘数A和B表示成以R为基数的展开式；将运算A·B(mod p)转化为计算：

本发明多次使用对2移位操作，再利用数学公式将大数化小，简化运算步骤，使得运算速度相较于之前大大提高。

Description

一种SIDH特殊域快速模乘方法

技术领域

本发明涉及SIDH中特殊域模乘计算领域，尤其是一种SIDH特殊域快速模乘方法。

背景技术

由于量子计算机的研究愈发深入，量子计算机的出现只是时间问题。当量子计算机出现后现有加密方式如RSA加密和ECC(椭圆曲线加密)将失效，因此后量子密码应运而生。

在现有的后量子密码中，主要有格加密、代码加密、哈希加密和超奇异同源点Diffie-Hellman(SIDH)等。相对比其他的加密方式，SIDH密钥交换协议有着公钥秘钥长度短的优势。2011年，Jao和Deo等人首先提出了SIDH密钥交换协议。该协议中的建议使用模数为

但是由于同源计算的方便，主流的实现方案中采用模数为p＝f·2^al^b-1。SIDH密钥交换协议一直存在计算速度慢和占用资源较大的缺点。而作为算法最底层的模乘算法若对于速度和资源有所提升会对整个SIDH密钥交换协议的实现进行提升。

发明内容

发明目的：为解决上述技术问题，本发明提出一种SIDH特殊域快速模乘方法。

技术方案：本发明提出一种SIDH特殊域快速模乘方法，在基本不增加资源的情况下，加快模乘的运算速度和提升模乘的运行频率，该方法包括SIDH单个模乘的计算步骤：

(1)记SIDH中单个模乘计算公式为：A·B(mod p)，设置基数

将乘数A和B表示成以R为基数的展开式：

A＝a₁R+a₂

B＝b₁R+b₂

其中，p为素数域，

l表示一个小的素数，a和b可以为任意数，用于调节加密等级，f为将p调节为素数的参数，A和B为素数域p中的任意两个元素，a₁、a₂分别表示用R截取的操作数A的高半段和低半段，b₁、b₂表示用R截取的操作数B的高半段和低半段；

(2)计算得到A·B(mod p)，包括依次执行步骤(2-1)至(2-7)：

(2-1)C表示为A和B相乘的积，C用R表示为：

C＝c₁·R+c₂

式中，c₁、c₂为系数变量；

(2-2)计算a₁b₁、a₁b₂、a₂b₁、a₂b₂，计算中间变量r₁＝a₁b₁mod 2^a、

再计算r₁R；

(2-3)计算

(2-4)计算c₁＝q₁+(a₁b2+a₂b₁)mod 2^a+r₁Rmod 2^a；

(2-5)对c₂进行Barrett约减，约减结果记为r，即c₂＝r，约减的商记为q，计算c₁＝c₁+q；

(2-6)计算c₁＝c₁ mod 2^a；

(2-7)计算

从而得到A·B(mod p)的结果。

有益效果：与现有技术相比，本发明具有以下优势：

本发明可以节省计算中加法运算和减法运算的次数，从而提升计算速度。在硬件实现的时候，当硬件资源消耗基本不变的情况下，将SIDH模乘器的吞吐率提升40％且频率提升两倍。

附图说明

图1为本发明的原理图；

图2为Barrett约减算法原理图；

图3为Barrett除法算法原理图；

图4为现有的SIDH中特殊结构域的模乘计算FFM1算法原理图；

图5为现有的SIDH中特殊结构域的模乘计算FFM2算法原理图；

图6为本发明中乘法操作的硬件结构图；

图7为本发明的整体流水线硬件结构图。

具体实施方式

下面结合附图对本发明作更进一步的说明。

一、现有技术说明

图4和图5所示为现有的SIDH中特殊结构域的模乘计算原理图，下面首先介绍现有的SIDH中两种特殊结构域的模乘计算原理。

(1)FFM1算法：假定p＝2·2^a3^b-1，其中a和b为偶数，通过基R′表示法，可以将素数域p中的任一元素(即所有小于p的非负整数)A表示成如下形式，其中R′＝2^a/23^b/2，

A＝a₁R′²+a₂R′+a₃，a₁∈0，1，a₂，a₃∈[0，R′) (1)

若a₁＝1，则A可以表示成A′：

A′＝a₂′R′+a₃′，a₂′，a₃′∈[0，R) (2)

其中a_i′(a₂′或a₃′)通过计算a_i′＝R′-1-a_i′得到。

式中，a₁、a₂、a₃、a₂′、a₃′均为系数。

将p中的任意两个元素A和B均通过基R′表示且进行公式(2)变换，那么A′.B′(modp)的结果C′为：

C′＝a₂′b₂′·R′²+(a₂′b₃′+a₃′b₂′)·R′+a₃′b₃′ (3)

由于p＝2·2^a3^b-1，可以得到R′²＝2^-1(mod p)，因为不确定a₂′b₂′的奇偶性，所以a₂′b₂′·R′²可表示为如下形式：

其中，符号

表示向下取整。

则公式(2)可以重新写成如下形式：

由于不能保证A和B同时大于R′²，计算结果需要修正，修正公式如下：

在公式(4)中，最后得到的系数c₂′和c₃′是在[0，R′²)范围之内，而不是在基R′示法中要求的[0，R′)范围之内，因此，需要对c₂′和c₃′作进一步化简。

对c₂′和c₃′的化简采用了Barrett约减算法，Barrett约减算法如图2所示：

由欧几里得除法原理，如果两个正数a和b相除，则存在商q和余数r使a＝q·b+r成立，其中r∈[0，b-1]，即a＝r(mod b)。这样得到余数的方式需要通过一次除法操作，但是在硬件中，除法操作是一个很耗费资源和时间的操作。但是对于除数是一个常数来说，Barrett约减算法是一个很巧妙的方法。Barrett约减算法先将1/b使用移位和多次乘法取代，变换过程如下：

由于近似得到的误差可以由公式e＝1/b-x/2^k表示。此外，k需要满足公式k＝log₂(a)以保证最终的结果的正确。

对c₂′和c₃′的化简需要除以基R′，而R′＝2^a/23^b/2，因此可以将R′分开进行除法。对2^a/2的除法只需要进行移位操作即可，而对于3^b/²需要使用Barrett约减算法。Barrett除法的具体流程见图3。

FFM2：假定p＝f·2^a3^b-1，由于p+1＝f·2^a3^b，A和B的乘积C对p取余可以表示如下：

C≡q·(p+1)+r≡qp+q+r≡(q+r)mod p (7)

则可以先将A和B的乘积C求出，再利用Barrett除法和公式(7)进行化简。但是(q+r)∈[0，2p)，需要对结果进行一次减法操作。

同理假定p＝f·2^a3^b+1，A和B的乘积C对p取余可以表示如下：

C≡q·(p-1)+r≡qp-q+r≡(r-q)mod p (8)

由于(r-q)∈[-p，p)，需要对结果进行一次加法操作。具体操作见图5所示。

至此，我们可以得到完成SIDH中模乘A·B(mod p)的两种计算过程。

二、本发明技术方案的说明

假定

设置基数

将乘数A表示成以R为基数的展开式：

若乘数B也满足以上条件，则乘积C表示为：

C＝a₁b₁·R²+(a₂b₁+a₁b₂)·R+a₁b₁ (10)

由于a₂b₁+a₁b₂小于2p，通过2^a将其分割成两段，可以得到：

同理，a₁b₁也可以分割成两部分，但是不同的是，a₁b₁高位分割后的基数是R，低位的基数是R²，低位的基数过大需要进一步处理。令m＝(a₁b₁)(mod 2^a)·R²，即a₁b₁·R²分割后的低位。将R²中的一个因子R与(a₁b₁)(mod 2^a)相乘得到一个新的数，该数不大于2p，可以使用2^a继续将其分割成两段。因此，公式(10)可以转换成如下：

此时计算C就可以得到A·B(mod p)，计算A·B(mod p)的步骤为：

(1)C表示为A和B相乘的积，C用R表示为：

C＝c₁·R+c₂

式中，c₁、c₂为系数变量；

(2)计算a₁b₁、a₁b₂、a₂b₁、a₂b₂，计算中间变量r₁＝a₁b₁mod 2^a、

且计算r₁R；

(3)计算

(4)计算c₁＝q₁+(a₁b₂+a₂b₁)mod 2^a+r₁R mod 2^a；

(5)对c₂进行Barrett约减，约减结果记为r，即c₂＝r，约减的商记为q，计算c₁＝c₁+q；

(6)计算c₁＝c₁ mod 2^a；

(7)计算

从而得到A·B(mod p)的结果。

与现有的SIDH中的特殊域模乘计算方法相比，本发明大量减少了加法和减法操作。此外，本发明将乘法集中，使得其更利于硬件实现。与FFM2算法相比，本发明利用的化简公式与其相同，但是只进行了一次Barrett约减算法，且减少了运算过程中的乘加运算的位数。在输入相同位数的乘数时，本发明所需要的乘加位数仅仅只有FFM2算法的一半。

三、本发明的硬件实现

为进一步说明本发明的技术方案及技术效果，本实施例提供了一个可以用于实现本发明的硬件结构，如图6和图7所示。在本发明中，有9个N/6位乘法器，7个进位保存器加法器(CSA)加法器和2个N位加法器。整个设计由有限状态机控制。K＝a为移位操作的位数，将N′取值为a和b中较大数的位数。由于计算一次N位加法的时间延时约等于计算一次N/6×N/6乘法的时间延时，因此将N′增加位数直至其可以整除6，得到N。

本发明完成一次模乘运算需要进行四个阶段的运算。在第一个阶段使用9个

位DSP乘法器，7个进位保存器加法器(CSA)加法器和2个N位加法器完成步骤(2)中的a₁b₁、a₁b₂、a₂b₁、a₂b₂和r₁R五次乘法(r₁＝a₁b₁mod 2^a和

在硬件电路中直接截取可得)；第二个阶段使用两个N位加法器根据步骤(3)和(4)将第一阶段计算的五个乘法积拆分相加得到未化简的c₁和c₂；第三个阶段完成步骤(5)中的Barrett约减算法中的两次乘法将c₂约减和约减产生的进位q，且使用N位加法器将q与c₁相加；最后一个阶段为最终的调整阶段，通过步骤(6)和步骤(7)使用N位加法器对结果进行调整得到最终的结果。

本发明的结构使用所有的器件构成一个N×N乘法器，当乘法器不工作时使用其中的两个N位加法器完成加法操作。本结构使用8个周期计算一次N×N乘法。在第一周期使用9个N/6位乘法器得到一次N/2×N/2乘法的所有部分积。每个乘法器在前四个计算周期内分别输入操作数A和B的六分之一数据，得到其部分积。第二个周期使用一个缓冲层将第一个周期得到9个数据保存，同时将第一周期得到最后一个部分积的后N/6位继续存储以减少CSA加法器的位数；第三个周期使用7个CSA加法器将9个部分积相加，最后输出两个和；第四个周期使用一个N位加法器得到一个N/2×N/2乘法的结果。这样使用四个周期进行一个N/2×N/2乘法。若将前四个周期进行流水线设计，那么在第五个周期时就可以得到第二个N/2×N/2乘法的结果。因此，在后四个阶段只使用一个N位的加法器，该加法器在每个周期内将上周期的加法和与新产生的N/2×N/2乘法结果相加，得到的结果中将不在参与运算的低N/2位结果进行保存，以保证每次加法的位宽都是N。

算法第一阶段需要进行五次N/2×N/2乘法操作，如果将五次乘法操作进行流水线设计将进一步减少运算周期。本发明使用六级流水线设计，使用32个周期完成五次N/2×N/2乘法运算。具体流程见图7。

由于步骤5中的Barrett约减算法的两次乘法结果是相关的，因此乘法的流水线结构不能用于Barrett约减算法。此外，Barrett约减算法中会有两个减法。第一个是2N位的减法，第二个是N位的减法。减法可以由操作数的补码相加来完成，N位减法中的减数是一个常数可以直接预制其补码使用加法器得到相减的结果。2N位的减法中相减得到结果最大位数也小于N位，因此其减数和被减数的高N位是相同的，只需要对后N位进行补码相加。在结构中不再使用减法器也使得资源消耗降低。

本实施例利用Vivado2016.4在Kintex-7FPGA(xc7k325tffg900-2)上构建了上述硬件结构，并选取模数p＝2.2³⁸⁶3²⁴²-1。

将本实施例的参数结果与现有技术的参数结果进行比对，比对的结果如表1所示：

表1

方法	FFs	LUTs	DSP48s	频率MHz)	时钟(s)	总时间(μs)
							FFM1	9675	16629	122	55	64	1.16
FFM2	11632	33051	529	25	28	1.12
							本发明	11201	12198	144	110	75	0.68

从表中可以看出，本实施例的电路结构频率为110MHz，完成一次特殊域模乘所需时钟数为75个，总时间为0.68。在资源消耗基本不增加的情况下，运行时间相比减少了40％，且频率增加了一倍。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种SIDH特殊域快速模乘方法，其特征在于，包括9个N/6位乘法器，7个进位保存器加法器和2个N位加法器；该方法包括：

阶段一：记SIDH中单个模乘计算公式为：C＝A·B(mod p)，设置基数

将乘数A和B表示成以R为基数的展开式：

A＝a₁R+a₂

B＝b₁R+b₂

其中，p为素数域，

l表示一个小的素数，a和b可以为任意数，用于调节加密等级，f为将p调节为素数的参数，A和B为素数域p中的任意两个元素，a₁、a₂分别表示操作数A的前R位和除了前R位以外的后半段，b₁、b₂表示操作数B的前R位和除了前R位以外的后半段；

使用9个N/6位乘法器、7个进位保存器加法器和2个N位加法器完成a₁b₁、a₁b₂、a₂b₁、a₂b₂和r₁R五次乘法，r₁＝a₁b₁mod 2^a；

阶段二：使用2个N位加法器将第一阶段计算的五个乘法积拆分相加得到未化简的c₁和c₂：c₁＝q₁+(a₁b₂+a₂b₁)mod 2^a+r₁R mod 2^a，

其中，c₁、c₂为系数变量，C＝c₁·R+c₂；

阶段三：对c₂进行Barrett约减，约减的余数记为r，即c₂＝r，约减的商记为q，使用其中一个N位加法器将q与c₁相加；

阶段四：使用另一个N位加法器计算c₁＝c₁ mod 2^a；最后计算

从而得到结果C：C＝c₁·R+c₂。