CN106339641A - 一种基于图像处理器的加密方法及系统 - Google Patents
一种基于图像处理器的加密方法及系统 Download PDFInfo
- Publication number
- CN106339641A CN106339641A CN201610847096.4A CN201610847096A CN106339641A CN 106339641 A CN106339641 A CN 106339641A CN 201610847096 A CN201610847096 A CN 201610847096A CN 106339641 A CN106339641 A CN 106339641A
- Authority
- CN
- China
- Prior art keywords
- shared drive
- calculation
- drive variable
- result
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/70—Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer
- G06F21/71—Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure computing or processing of information
- G06F21/72—Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure computing or processing of information in cryptographic circuits
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multi Processors (AREA)
Abstract
本发明公开了一种基于图像处理器的加密方法及系统,通过GPU对共享内存变量进行初始化,得到各个共享内存变量;根据得到的各个共享内存变量,启用共享内存变量计算,得到计算结果;将计算结果写入到全局存储器中。这样就充分利用了GPU的处理速度,使得RSA的加密速度得到显著提升。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种基于图像处理器的加密方法及系统。
背景技术
RSA是目前最有影响力的公钥加密算法,它能够抵抗到目前为止已知的绝大多数密码攻击,但是,现有技术的RSA加密算法实现都是通过CPU,基于CPU上的加密运算都未能完全使用现阶段的计算资源,从而导致加密计算速度的较慢。
发明内容
本发明实施例提供了一种基于图像处理器的加密方法及系统,用以解决现有技术中RSA加密计算速度的较慢的问题。
其具体的技术方案如下:
一种基于图像处理器的加密方法,所述方法包括:
对共享内存变量进行初始化,得到各个共享内存变量;
根据得到的各个共享内存变量,启用共享内存变量计算,得到计算结果;
将所述计算结果写入到全局存储器中。
可选的,在对共享内存变量进行初始化,得到各个共享内存变量之前,所述方法还包括:
获取对每个共享内存变量的定义参数;
将每个共享内存变量的定义参数存储在指定位置。
可选的,根据得到的各个共享内存变量,启用共享内存变量计算,得到计算结果,包括:
将得到的各个共享内存变量代入到指定运算公式中,得到各个共享内存变量对应的项计算结果;
将所有的项计算结果作为所述计算结果。
可选的,将所述计算结果写入到全局存储器中,包括:
调取指定数据写入算法;
按照所述指定数据写入算法将所述计算结果写入到所述全局存储器。
一种基于图像处理器的加密系统,所述系统包括:
初始化模块,用于对共享内存变量进行初始化,得到各个共享内存变量;
运算模块,用于根据得到的各个共享内存变量,启用共享内存变量计算,得到计算结果;
写入模块,用于将所述计算结果写入到全局存储器中。
可选的,所述系统还包括:
定义模块,用于获取对每个共享内存变量的定义参数;将每个共享内存变量的定义参数存储在指定位置。
可选的,所述运算模块,具体用于将得到的各个共享内存变量代入到指定运算公式中,得到各个共享内存变量对应的项计算结果;将所有的项计算结果作为所述计算结果。
可选的,所述写入模块调取指定数据写入算法;按照所述指定数据写入算法将所述计算结果写入到所述全局存储器。
在本发明实施例中,通过GPU对共享内存变量进行初始化,得到各个共享内存变量;根据得到的各个共享内存变量,启用共享内存变量计算,得到计算结果;将计算结果写入到全局存储器中。这样就充分利用了GPU的处理速度,使得RSA的加密速度得到显著提升。
附图说明
图1为本发明实施例中一种基于图像处理器的加密方法的流程图;
图2为本发明实施例中一种基于图像处理器的加密系统的结构示意图。
具体实施方式
本发明实施例中提供了一种基于图像处理器的加密方法,该方法对共享内存变量进行初始化,得到各个共享内存变量;根据得到的各个共享内存变量,启用共享内存变量计算,得到计算结果;将计算结果写入到全局存储器中。这样就充分利用了图像处理器(英文:Graphics Processing Unit,简称:GPU)的处理速度,使得RSA的加密速度得到显著提升。
下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解,本发明实施例以及实施例中的具体技术特征只是对本发明技术方案的说明,而不是限定,在不冲突的情况下,本发明实施例以及实施例中的具体技术特征可以相互组合。
如图1所示为本发明实施例中一种基于图像处理器的加密方法的流程图,该方法包括:
S101,对共享内存变量进行初始化,得到各个共享内存变量;
S102,根据得到的各个共享内存变量,启用共享内存变量计算,得到计算结果;
S103,将所述计算结果写入到全局存储器中。
具体来讲,在执行S101之前,首先需要对每个共享内存变量的参数定义,在本发明实施例中可以通过如下方式来定义参数:
_shared_int ys[l+1][blockDim.x];
_shared_int ss[l+1][blockDim.x];
_shared_int cs[blockDim.x];
其中,ys,ss,cs分别表示操作数,block-Dim.x表示每个线程所包含的线程数目。在得到定义的参数之后,将每个共享内存变量的定义参数存储在指定位置。
在运算启动时,首先需要对各个共享内存变量进行初始化,此处可以通过如下方式来对共享内存变量进行初始化:
其中,y,s,c对应的共享变量,threadIdx.x表示当前线程的索引号,column为当前操作数在所有操作数当中的索引,其值为blockIdx.x*blockDim.x+threadIdx.x,blockIdx.x表示当前线程块在线程网格中的索引;_syncthreads表示在共享内存初始化后设置的同步点。
通过上述的过程可以对共享内存变量进行初始化,在初始化完成之后,将得到的各个共享内存变量代入到指定运算公式中,得到各个共享内存变量对应的项计算结果,将所有的项计算结果作为最终的计算结果,该计算过程可以通过如下的方式实现:
FMA表示乘累加操作的低32位运算结果,HIGH32表示运算结果的高32位,而LOW32表示运算结果的低32位。
通过上述的方式可以得到最终的计算结果,最后调取指定数据写入算法;按照指定数据写入算法将计算结果写入到所述全局存储器,具体可以通过如下方式实现:
for(int i=0;i<=1;i++){
s[i][column]=ss[i][threadIdx.x];
}
在本发明实施例中,通过GPU对共享内存变量进行初始化,得到各个共享内存变量;根据得到的各个共享内存变量,启用共享内存变量计算,得到计算结果;将计算结果写入到全局存储器中。这样就充分利用了GPU的处理速度,使得RSA的加密速度得到显著提升。
对应本发明实施例中一种基于图像处理器的加密方法,本发明实施例中还提供了一种基于图像处理器的加密系统,如图2所示为本发明实施例中一种基于图像处理器的加密系统的结构示意图,该系统包括:
初始化模块201,用于对共享内存变量进行初始化,得到各个共享内存变量;
运算模块202,用于根据得到的各个共享内存变量,启用共享内存变量计算,得到计算结果;
写入模块203,用于将所述计算结果写入到全局存储器中。
进一步,在本发明实施例中,该系统还包括:
定义模块,用于获取对每个共享内存变量的定义参数;将每个共享内存变量的定义参数存储在指定位置。
进一步,在本发明实施例中,所述运算模块202,具体用于将得到的各个共享内存变量代入到指定运算公式中,得到各个共享内存变量对应的项计算结果;将所有的项计算结果作为所述计算结果。
进一步,在本发明实施例中,所述写入模块203,具体用于调取指定数据写入算法;按照所述指定数据写入算法将所述计算结果写入到所述全局存储器。
尽管已描述了本申请的优选实施例,但本领域内的普通技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (8)
1.一种基于图像处理器的加密方法,其特征在于,所述方法包括:
对共享内存变量进行初始化,得到各个共享内存变量;
根据得到的各个共享内存变量,启用共享内存变量计算,得到计算结果;
将所述计算结果写入到全局存储器中。
2.如权利要求1所述的方法,其特征在于,在对共享内存变量进行初始化,得到各个共享内存变量之前,所述方法还包括:
获取对每个共享内存变量的定义参数;
将每个共享内存变量的定义参数存储在指定位置。
3.如权利要求1所述的方法,其特征在于,根据得到的各个共享内存变量,启用共享内存变量计算,得到计算结果,包括:
将得到的各个共享内存变量代入到指定运算公式中,得到各个共享内存变量对应的项计算结果;
将所有的项计算结果作为所述计算结果。
4.如权利要求1所述的方法,其特征在于,将所述计算结果写入到全局存储器中,包括:
调取指定数据写入算法;
按照所述指定数据写入算法将所述计算结果写入到所述全局存储器。
5.一种基于图像处理器的加密系统,其特征在于,所述系统包括:
初始化模块,用于对共享内存变量进行初始化,得到各个共享内存变量;
运算模块,用于根据得到的各个共享内存变量,启用共享内存变量计算,得到计算结果;
写入模块,用于将所述计算结果写入到全局存储器中。
6.如权利要求5所述的系统,其特征在于,所述系统还包括:
定义模块,用于获取对每个共享内存变量的定义参数;将每个共享内存变量的定义参数存储在指定位置。
7.如权利要求5所述的系统,其特征在于,所述运算模块,具体用于将得到的各个共享内存变量代入到指定运算公式中,得到各个共享内存变量对应的项计算结果;将所有的项计算结果作为所述计算结果。
8.如权利要求5所述的系统,其特征在于,所述写入模块,具体用于调取指定数据写入算法;按照所述指定数据写入算法将所述计算结果写入到所述全局存储器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610847096.4A CN106339641A (zh) | 2016-09-23 | 2016-09-23 | 一种基于图像处理器的加密方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610847096.4A CN106339641A (zh) | 2016-09-23 | 2016-09-23 | 一种基于图像处理器的加密方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106339641A true CN106339641A (zh) | 2017-01-18 |
Family
ID=57840191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610847096.4A Pending CN106339641A (zh) | 2016-09-23 | 2016-09-23 | 一种基于图像处理器的加密方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106339641A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN201681397U (zh) * | 2009-12-18 | 2010-12-22 | 燕山大学 | C/s架构下基于gpu的会计电子文档加密系统及装置 |
CN102298522A (zh) * | 2011-09-13 | 2011-12-28 | 四川卫士通信息安全平台技术有限公司 | 一种使用gpu实现sha-1算法的方法 |
CN202394238U (zh) * | 2011-08-22 | 2012-08-22 | 珠海网博信息科技有限公司 | 一种利用图形处理器并行计算的高速加解密系统 |
CN103490877A (zh) * | 2013-09-05 | 2014-01-01 | 北京航空航天大学 | 基于cuda的aria对称分组密码算法并行化方法 |
CN103632104A (zh) * | 2013-10-17 | 2014-03-12 | 江苏科技大学 | 一种大数据环境下动态数据的并行加解密方法 |
US20140304505A1 (en) * | 2013-03-15 | 2014-10-09 | William Johnson Dawson | Abstraction layer for default encryption with orthogonal encryption logic session object; and automated authentication, with a method for online litigation |
CN104615583A (zh) * | 2015-01-27 | 2015-05-13 | 上海联影医疗科技有限公司 | 基于gpu平台实现数据处理的方法和装置 |
CN105490802A (zh) * | 2015-11-27 | 2016-04-13 | 桂林电子科技大学 | 基于gpu的改进sm4并行加解密通信方法 |
-
2016
- 2016-09-23 CN CN201610847096.4A patent/CN106339641A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN201681397U (zh) * | 2009-12-18 | 2010-12-22 | 燕山大学 | C/s架构下基于gpu的会计电子文档加密系统及装置 |
CN202394238U (zh) * | 2011-08-22 | 2012-08-22 | 珠海网博信息科技有限公司 | 一种利用图形处理器并行计算的高速加解密系统 |
CN102298522A (zh) * | 2011-09-13 | 2011-12-28 | 四川卫士通信息安全平台技术有限公司 | 一种使用gpu实现sha-1算法的方法 |
US20140304505A1 (en) * | 2013-03-15 | 2014-10-09 | William Johnson Dawson | Abstraction layer for default encryption with orthogonal encryption logic session object; and automated authentication, with a method for online litigation |
CN103490877A (zh) * | 2013-09-05 | 2014-01-01 | 北京航空航天大学 | 基于cuda的aria对称分组密码算法并行化方法 |
CN103632104A (zh) * | 2013-10-17 | 2014-03-12 | 江苏科技大学 | 一种大数据环境下动态数据的并行加解密方法 |
CN104615583A (zh) * | 2015-01-27 | 2015-05-13 | 上海联影医疗科技有限公司 | 基于gpu平台实现数据处理的方法和装置 |
CN105490802A (zh) * | 2015-11-27 | 2016-04-13 | 桂林电子科技大学 | 基于gpu的改进sm4并行加解密通信方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8090756B2 (en) | Method and apparatus for generating trigonometric results | |
US10169072B2 (en) | Hardware for parallel command list generation | |
US9600235B2 (en) | Technique for performing arbitrary width integer arithmetic operations using fixed width elements | |
US9829956B2 (en) | Approach to power reduction in floating-point operations | |
CN110008009B (zh) | 在运行时绑定常量以提高资源利用率 | |
US8760455B2 (en) | Restart index that sets a topology | |
US11061741B2 (en) | Techniques for efficiently performing data reductions in parallel processing units | |
US8850436B2 (en) | Opcode-specified predicatable warp post-synchronization | |
US9383968B2 (en) | Math processing by detection of elementary valued operands | |
US20140173606A1 (en) | Streaming processing of short read alignment algorithms | |
US20220014363A1 (en) | Combined post-quantum security utilizing redefined polynomial calculation | |
US20150193203A1 (en) | Efficiency in a fused floating-point multiply-add unit | |
US20140189329A1 (en) | Cooperative thread array granularity context switch during trap handling | |
CN117785480A (zh) | 处理器、归约计算方法及电子设备 | |
US9928033B2 (en) | Single-pass parallel prefix scan with dynamic look back | |
CN103544729A (zh) | 一种动画数据处理方法及系统 | |
CN106934757B (zh) | 基于cuda的监控视频前景提取加速方法 | |
US9465575B2 (en) | FFMA operations using a multi-step approach to data shifting | |
US20220374207A1 (en) | Applications of and techniques for quickly computing a modulo operation by a mersenne or a fermat number | |
CN106339641A (zh) | 一种基于图像处理器的加密方法及系统 | |
CN105094746A (zh) | 一种椭圆曲线密码的点加/点倍的实现方法 | |
Sugano et al. | Parallel implementation of morphological processing on cell/BE with OpenCV interface | |
US8275821B2 (en) | Area efficient transcendental estimate algorithm | |
US9411724B2 (en) | Method and apparatus for a partial-address select-signal generator with address shift | |
US11630667B2 (en) | Dedicated vector sub-processor system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170118 |
|
RJ01 | Rejection of invention patent application after publication |