CN110865794A

CN110865794A - 用于数据安全通信的并行模乘方法

Info

Publication number: CN110865794A
Application number: CN201911005389.8A
Authority: CN
Inventors: 王晖
Original assignee: Tianjin Jinhang Computing Technology Research Institute
Current assignee: Tianjin Jinhang Computing Technology Research Institute
Priority date: 2019-10-22
Filing date: 2019-10-22
Publication date: 2020-03-06

Abstract

本发明属于据安全通信技术领域，具体涉及一种用于数据安全通信的并行模乘方法。与现有技术相比较，本发明在保持有限域基本运算逻辑完整的情况下，相比于传统的蒙哥马利算法，理论速度得到了很大的提升。随着密码安全的发展，越来越需要并行的速度、更快的方法来实现有限域基本运算，本方案给出的并行模乘方法可以充分发挥出软硬件密码应用平台的性能。这对基于本方法构建的密码实现方案有极大的性能提升，尤其是在密码算法需要硬件实现的场景下，越来越多的方案对速度有较高的要求，所以如何利用好硬件实现平台，提高效率越来越重要的。而本方法将是一个很好的选择，将会为密码安全软硬件实现发展提供更好的保障。

Description

用于数据安全通信的并行模乘方法

技术领域

本发明属于据安全通信技术领域，具体涉及一种用于数据安全通信的并行模乘方法。

背景技术

在数据通信领域，密码安全技术能够保证数据的完整性和真实性，并影响着整个通信系统的执行效率。有限域下的基本运算是构成数据安全通信加解密技术的基石，其中大整数乘法取模(模乘)运算，形如c≡a×b mod p，是基数据安全通信双方加解密操作的核心运算技术，针对模乘的优化特别是效率优化对数据安全通信系统的构建意义重大。

1985年美国数学家蒙哥马利最早提出了一种规避除法运算的模乘方法：蒙哥马利模乘。该方法的设计思路是通过一个易于计算的剩余系，将模乘中对特定模数(即有限域的特征值p)的取模转换成对蒙哥马利常数r的取模。当蒙哥马利常数r设定为2的n次方时，取模操作就转换为了容易实现的移位操作，加快了模乘的运行速度。其计算输入为乘数A,B，模数N，蒙哥马利系数r^-1，其中，r＝2^k，其中， k＝log₂N，算法能够计算出蒙哥马利模乘结果A*B*r^-1mod N。

蒙哥马利模乘中A，B，N皆为k比特的二进制数，运行过程只包括加减、乘法操作和移位取模操作。移位操作的实现非常简单，而且几乎不占用硬件资源，相较于使用除法，蒙哥马利算法的运算复杂度大大降低。

但是由于蒙哥马利模乘的预计算包括了模逆运算的步骤，其结果比直接模乘多了个r^-1的乘积项：R≡A×B×r^-1mod N。因此利用 Montgomery算法实现模乘还需对操作数进行转换，即进行蒙哥马利域的转换，对输入参数A，B，N，t，其中t＝r²modN，需要计算 A'＝Mont(A,t,N)，B'＝Mont(B,t,N)，R'＝Mont(A',B',N)，最后需要多计算一步R＝Mont(R',1,N)，将结果转换出蒙哥马利域。

因此，在提高数据安全通信运算中有限域下大整数模乘运算实现速度，充分发挥软硬件实现方案中的计算资源提高系统计算能力方面，目前还存在较大的提升需求。

发明内容

(一)要解决的技术问题

本发明要解决的技术问题是：为了提高数据安全通信运算中有限域下大整数模乘运算实现速度，为了充分发挥软硬件实现方案中的计算资源提高系统计算能力，如何提供一种基于蒙哥马利模乘的并行模乘方法。要求该方法在保证模乘正确性的情况下，通过优化模乘运算步骤和方法提高算法的并行性，以满足日益增长的数据安全通信对密码安全应用方案的速度需求。

(二)技术方案

为解决上述技术问题，本发明提供一种用于数据安全通信的并行模乘方法，所述并行模乘方法将两个操作乘数输入A，B都拆分为 (w₀,w₂,……w_r)多比特位的表示形式，进行逐字扫描运算；将乘法和约减操作分布在同一内循环之内，模乘运算就被分解为r-bit×r-bit乘法器能够实现的操作。

其中，所述并行模乘方法针对256位的大数模乘，其模乘运算被分解为r-bit×r-bit乘法器能够实现的操作，其中r取值为64。

其中，所述并行模乘方法包括如下步骤：

步骤1：设置存放模乘结果的数R＝0，将操作数A拆分为 (A₀,A₁,A₂,A₃)，操作数B拆分为(B₀,B₁,B2,B₃)，模数N也拆分为 (N₀,N1,N₂,N3)；

步骤2：拆分出四个无数据依赖的乘法，t₀到t₃分别存放计算结果：t₀＝B₀A₀mod2^r，t₁＝B₁A₀mod2^r，t₂＝B₂A₀mod2^r，t₃＝B₃A₀mod2^r；

步骤3：对于计数值i从0到3执行以下步骤，P_i0到P_i3存放计算结果：{P_i0＝A₀B_i，P_i1＝A₁B_i，P_i2＝A₂B_i，P_i3＝A₃B_i}；

同样本步骤的四个乘法操作无数据依赖，可进行全部并行化运行；

步骤4：对于计数值i从0到3执行以下步骤，s_i0到s_i3存放计算结果：{s_i0＝N₀t_i，s_i1＝N₁t_i，s_i2＝N₂t_i，s_i3＝N₃t_i}；

步骤5：计算临时计算结果变量的累加和：R＝∑(p_ij+s_ij)2^(i+j)r；

其中，i＝0,1,2,3；j＝0,1,2,3；

步骤6：如果R>N，则进行计算R＝R-N；

步骤7：最后，得到模乘运算的结果：R。

其中，所述步骤2中，四个乘法可进行并行化运算，64位乘法运算的并行能够将运算时间减少为之前1/4。

其中，所述方法通过将蒙哥马利模乘的操作数进行拆分重排，避免了原模乘运算各步间的数据依赖。

其中，所述方法中，每步运算均可由4个64-bit乘法器并行执行，运算的结果作为模乘的部分积在步骤5中统一进行压缩。

其中，该方法同时也兼顾了系统对256-bit大数乘法和大数加法的运算需求，对于非取模运算同样能通过数据拆分并行执行。

其中，该基于蒙哥马利模乘的并行模乘方法，能够设计出具有较高并行性的密码加解密应用产品加速器，满足加密系统运算单元对计算速度和硬件资源的要求。

(三)有益效果

与现有技术相比较，本发明提出一种用于数据安全通信的并行模乘方法，在保持有限域基本运算逻辑完整的情况下，相比于传统的蒙哥马利算法，理论速度得到了很大的提升。随着密码安全的发展，越来越需要并行的速度、更快的方法来实现有限域基本运算，本方案给出的并行模乘方法可以充分发挥出软硬件密码应用平台的性能。这对基于本方法构建的密码实现方案有极大的性能提升，尤其是在密码算法需要硬件实现的场景下，越来越多的方案对速度有较高的要求，所以如何利用好硬件实现平台，提高效率越来越重要的。而本方法将是一个很好的选择，将会为密码安全软硬件实现发展提供更好的保障。

由此，为了提高数据安全通信运算中有限域下大整数模乘运算实现速度，为了充分发挥软硬件实现方案中的计算资源提高系统计算能力，本发明提供一种基于蒙哥马利模乘的并行模乘方法。该方法在保证模乘正确性的情况下，通过优化模乘运算步骤和方法提高算法的并行性，以满足日益增长的数据安全通信对密码安全应用方案的速度需求。

具体实施方式

为使本发明的目的、内容、和优点更加清楚，下面结合实施例，对本发明的具体实施方式作进一步详细描述。

加解密系统的速度由模乘技术的性能决定。因此，针对大数乘法取模运算进一步优化蒙哥马利模乘方法并使其能够在有限的硬件资源条件下运行就成了模乘方法优化的重要方向。蒙哥马利模乘已经衍生出了许多改进的版本。这些方法大都是以原始蒙哥马利模乘为基础，通过相应的优化策略而得出。

本方法提出的所述并行模乘方法将两个操作乘数输入A，B都拆分为(w₀,w₂,……w_r)多比特位的表示形式，进行逐字扫描运算；将乘法和约减操作分布在同一内循环之内，模乘运算就被分解为r-bit× r-bit乘法器能够实现的操作。(本方法的方法为256位大数模乘，所以r取值为64)，具有明显的速度和面积上的优势。所述并行模乘方法针对256位的大数模乘，其模乘运算被分解为r-bit×r-bit乘法器能够实现的操作，其中r取值为64。

所述的用于数据安全通信的并行模乘方法，可通过软硬件技术实现部署于数据安全通信系统中。

所述并行模乘方法包括如下步骤：

步骤2：拆分出四个无数据依赖的乘法，t₀到t₃分别存放计算结果：t₀＝B₀A₀mod2^r，t₁＝B₁A₀mod2^r，t₂＝B₂A₀mod2^r，t₃＝B₃A₀mod2^r，此步骤中四个乘法可进行并行化运算，64位乘法运算的并行能够将运算时间减少为之前1/4；

其中，i＝0,1,2,3；j＝0,1,2,3；

步骤6：如果R>N，则进行计算R＝R-N；

步骤7：最后，得到模乘运算的结果：R。

所述方法通过将蒙哥马利模乘的操作数进行拆分重排，避免了原模乘运算各步间的数据依赖。所述方法中，每步运算均可由4个64-bit 乘法器并行执行，运算的结果作为模乘的部分积在步骤5中统一进行压缩。

该方法同时也兼顾了系统对256-bit大数乘法和大数加法的运算需求，对于非取模运算同样能通过数据拆分并行执行。

该基于蒙哥马利模乘的并行模乘方法，能够设计出具有较高并行性的密码加解密应用产品加速器，满足加密系统运算单元对计算速度和硬件资源的要求。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种用于数据安全通信的并行模乘方法，其特征在于，所述并行模乘方法将两个操作乘数输入A，B都拆分为(w₀,w₂,……w_r)多比特位的表示形式，进行逐字扫描运算；将乘法和约减操作分布在同一内循环之内，模乘运算就被分解为r-bit×r-bit乘法器能够实现的操作。

2.如权利要求1所述的用于数据安全通信的并行模乘方法，其特征在于，所述并行模乘方法针对256位的大数模乘，其模乘运算被分解为r-bit×r-bit乘法器能够实现的操作，其中r取值为64。

3.如权利要求1所述的用于数据安全通信的并行模乘方法，其特征在于，所述并行模乘方法包括如下步骤：

步骤1：设置存放模乘结果的数R＝0，将操作数A拆分为(A₀,A₁,A₂,A₃)，操作数B拆分为(B₀,B₁,B2,B₃)，模数N也拆分为(N₀,N1,N₂,N3)；

步骤2：拆分出四个无数据依赖的乘法，t₀到t₃分别存放计算结果：t₀＝B₀A₀ mod 2^r，t₁＝B₁A₀ mod 2^r，t₂＝B₂A₀ mod 2^r，t₃＝B₃A₀ mod 2^r；

其中，i＝0,1,2,3；j＝0,1,2,3；

步骤6：如果R>N，则进行计算R＝R-N；

步骤7：最后，得到模乘运算的结果：R。

4.如权利要求1所述的用于数据安全通信的并行模乘方法，其特征在于，所述步骤2中，四个乘法可进行并行化运算，64位乘法运算的并行能够将运算时间减少为之前1/4。

5.如权利要求1所述的用于数据安全通信的并行模乘方法，其特征在于，所述方法通过将蒙哥马利模乘的操作数进行拆分重排，避免了原模乘运算各步间的数据依赖。

6.如权利要求1所述的用于数据安全通信的并行模乘方法，其特征在于，所述方法中，每步运算均可由4个64-bit乘法器并行执行，运算的结果作为模乘的部分积在步骤5中统一进行压缩。

7.如权利要求1所述的用于数据安全通信的并行模乘方法，其特征在于，该方法同时也兼顾了系统对256-bit大数乘法和大数加法的运算需求，对于非取模运算同样能通过数据拆分并行执行。

8.如权利要求1所述的用于数据安全通信的并行模乘方法，其特征在于，该基于蒙哥马利模乘的并行模乘方法，能够设计出具有较高并行性的密码加解密应用产品加速器，满足加密系统运算单元对计算速度和硬件资源的要求。