CN111523140B - 签名文档的加密方法、装置、训练方法、存储介质及设备 - Google Patents
签名文档的加密方法、装置、训练方法、存储介质及设备 Download PDFInfo
- Publication number
- CN111523140B CN111523140B CN202010329672.2A CN202010329672A CN111523140B CN 111523140 B CN111523140 B CN 111523140B CN 202010329672 A CN202010329672 A CN 202010329672A CN 111523140 B CN111523140 B CN 111523140B
- Authority
- CN
- China
- Prior art keywords
- signature
- document
- information
- characteristic information
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000012549 training Methods 0.000 title claims abstract description 66
- 239000011159 matrix material Substances 0.000 claims description 36
- 238000013507 mapping Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000013478 data encryption standard Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000007639 printing Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6209—Protecting access to data via a platform, e.g. using keys or access control rules to a single file or object, e.g. in a secure envelope, encrypted and accessed using a key, or with access control rules appended to the object itself
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2107—File encryption
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioethics (AREA)
- Document Processing Apparatus (AREA)
- Storage Device Security (AREA)
Abstract
本申请提供一种签名文档的加密方法、装置、训练方法、存储介质及设备,方法包括:获得包含数字签名的签名文档;根据所述签名文档的内容和所述数字签名,对所述签名文档进行再次加密。通过签名文档的内容和签名文档的数字签名,对经过数字签名的签名文档进行二次加密,可以进一步提高签名文档的安全性。
Description
技术领域
本申请涉及数据加密技术领域,具体而言,涉及一种签名文档的加密方法、装置、训练方法、存储介质及设备。
背景技术
数字签名(又称公钥数字签名)是只有信息的发送者才能产生且他人无法伪造的一段数字串,这段数字串同时也是对信息的发送者发送信息真实性的一个有效证明。传统的数字签名算法有RSA(一种非对称加密算法)、ElGamal(基于迪菲-赫尔曼密钥交换的非对称加密算法)、Fiat-Shamir(一种零知识身份识别协议)、Guillou-Quisquarter(一种身份认证方案)、Schnorr(一种基于离散对数难题的知识证明机制)、Ong-Schnorr-Shamir(基于身份方案首次存在性证明)数字签名算法、DES/DSA(DES,Data Encryption Standard,一种对称加密算法;DSA,Digital Signature Algorithm,是Schnorr和ElGamal签名算法的变种),椭圆曲线数字签名算法和有限自动机数字签名算法等。
现有的数字签名的加密方法,安全性有待进一步提高,以保证签名文档的安全性。
发明内容
本申请实施例的目的在于提供一种签名文档的加密方法、装置、训练方法、存储介质及设备,以进一步提高签名文档的安全性。
为了实现上述目的,本申请的实施例通过如下方式实现:
第一方面,本申请实施例提供一种签名文档的加密方法,包括:获得包含数字签名的签名文档;根据所述签名文档的内容和所述数字签名,对所述签名文档进行再次加密。
在本申请实施例中,根据签名文档的内容和签名文档的数字签名,对经过数字签名的签名文档进行二次加密,可以进一步提高签名文档的安全性。
结合第一方面,在第一方面的第一种可能的实现方式中,所述根据所述签名文档的内容和所述数字签名,对所述签名文档进行再次加密,包括:根据所述签名文档的内容,确定出所述签名文档的N个语句信息,其中,所述签名文档的内容包括所述签名文档的文本内容,以及所述签名文档的标题信息、公司信息和时间信息中的一种或多种,N大于零;根据所述N个语句信息,确定出所述签名文档的文档特征信息;根据所述数字签名,确定出所述签名文档的签名特征信息;根据所述文档特征信息和所述签名特征信息,确定出所述签名文档的唯一编码,并根据所述唯一编码对所述签名文档进行再次加密。
在该实现方式中,通过确定出签名文档的语句信息,进一步确定出签名文档的文档特征信息,以及,根据数字签名确定出签名文档的签名特征信息,进一步基于文档特征信息和签名特征信息确定出签名文档的唯一编码,对签名文档进行再次加密。这样既可以避免签名文档的内容(例如语句、标题时间等信息)被篡改而引起的风险,也能够避免因数字签名被篡改而引起的风险,从而进一步提高签名文档的安全性。即在现有数字签名加密方法的基础上,进一步加密,加强数字签名的安全性,保证数字签名为特定的文档(签名文档)服务,难以被盗用、滥用,而签名文档的内容在签名后难以被篡改,因此能够改善现有加密方法容易被攻击的情况。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述根据所述N个语句信息,确定出所述签名文档的文档特征信息,包括:将每个语句信息进行拆分,得到与该语句信息对应的k个词语,其中,k大于零,且不同语句信息对应的k的取值相同或不同;根据所述k个词语,确定出该语句信息对应的语句特征信息;根据所述N个语句信息对应的N个所述语句特征信息,确定出所述签名文档的文档特征信息。
在该实现方式中,通过将每个语句信息进行拆分,得到对应过海语句信息的k个词语,以确定出该语句信息对应的语句特征信息,这样的语句特征信息可以反映语句信息的内容(词语)。而进一步根据N个语句信息对应的N个语句特征信息,确定出签名文档的文档特征信息,这样的文档特征信息可以反映签名文档中每个语句的词语,在签名文档的内容发生篡改(例如,篡改了一个词语)时,能够有效检测出来,从而提升签名文档的安全性。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,所述根据所述k个词语,确定出该语句信息对应的语句特征信息,包括:根据所述k个词语,确定出该语句信息对应的邻接矩阵,其中,所述邻接矩阵用于表征词语间的汉语依存句法关系;对所述k个词语进行独热编码,并根据所述邻接矩阵,提取所述k个词语之间的相关性信息,以确定出该语句信息对应的语句特征信息。
在该实现方式中,通过汉语依存句法对语句信息中的词语进行分析,构建对应的邻接矩阵,并通过对词语的独热编码,提取词语之间的相关性信息,从而可以准确地得到语句信息对应的语句特征信息,有利于实现对签名文档的再次加密的稳定性。
结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,所述根据所述N个语句信息对应的N个语句特征信息,确定出所述签名文档的文档特征信息,包括:将所述N个语句特征信息映射到第一空间,以确定出第一集合,以及,将所述N个语句特征信息映射到第二空间,以确定出第二集合,所述第一空间与所述第二空间不同;计算所述第一集合和所述第二集合的相似度,并根据所述相似度确定出不同语句特征信息之间的权重矩阵;根据所述权重矩阵,确定出不同语句特征信息之间的关联性信息;将所述关联性信息进行非线性转换,以确定出所述签名文档的文档特征信息。
在该实现方式中,通过将语句特征信息映射到不同空间,以计算映射到不同空间后语句特征信息的相似度,得到不同语句之间的权重矩阵,以确定出不同语句特征信息之间的关联性信息,从而确定出签名文档的文档特征信息。这样能够准确地实现对文档特征信息的确定,有利于再次加密的稳定性。
结合第一方面的第一种可能的实现方式,在第一方面的第五种可能的实现方式中,根据所述数字签名,确定出所述签名文档的签名特征信息,包括:将包含所述数字签名的签名图片裁剪为预设大小;对裁剪后的所述签名图片进行数字化处理,以确定出所述签名文档的所述签名特征信息。
通过对包含数字签名的签名图片裁剪为预设大小,并进行数字化处理,可以准确而稳定地确定出签名文档的签名特征信息,有利于对签名文档的再次加密的稳定性。
第二方面,本申请实施例提供一种签名文档的加密模型的训练方法,包括:将包含数字签名的签名文档转换为第一图片,将根据所述签名文档执行第一方面的第一种至第五种可能的实现方式中任一项所述的签名文档的加密方法而确定出的唯一编码作为水印打在所述第一图片上,加入加密模型的真实类别训练集;更改所述签名文档的内容并转换为第二图片,并将所述第二图片加入所述加密模型的虚假类别训练集;根据所述真实类别训练集和所述虚假类别训练集训练所述加密模型。
通过将执行签名文档的加密方法而得到的唯一编码,加入模型的真实类别训练集,而将更改后的签名文档执行签名文档的加密方法(或者其他加密方法)而得到的唯一编码加入模型的虚假类别训练集,可以对模型进行有效的训练,从而提升签名文档的加密模型的稳定性和准确性。
第三方面,本申请实施例提供一种签名文档的加密装置,包括:获得模块,用于获得包含数字签名的签名文档;加密模块,用于根据所述签名文档的内容和所述数字签名,对所述签名文档进行再次加密。
第四方面,本申请实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如第一方面或第一方面可能的实现方式中任一项所述的签名文档的加密方法,或者实现如第二方面所述的签名文档的加密模型的训练方法。
第五方面,本申请实施例提供一种电子设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,所述程序指令被处理器加载并执行时实现如第一方面或第一方面可能的实现方式中任一项所述的签名文档的加密方法,或者,实现如第二方面所述的签名文档的加密模型的训练方法。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种签名文档的加密方法的流程图。
图2为本申请实施例提供的一种签名文档的加密模型的训练逻辑示意图。
图3为本申请实施例提供的一种签名文档的加密模型的训练方法的流程图。
图4为本申请实施例提供的一种签名文档的加密装置的结构框图。
图5为本申请实施例提供的一种电子设备的结构框图。
图标:10-签名文档的加密装置;11-获得模块;12-加密模块;20-电子设备;21-存储器;22-通信模块;23-总线;24-处理器。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
图1为本申请实施例提供的一种签名文档的加密方法的流程图,在本实施例中,签名文档的加密方法可以包括步骤S11和步骤S12。
为了进一步提升数据加密的安全性,可以执行步骤S11。
步骤S11:获得包含数字签名的签名文档。
在本实施例中,获得包含数字签名的签名文档的方式,可以是获取已经进行了数字签名的签名文档,也可以是运行签名文档的加密方法的设备对需要进行加密的原始文档(例如投标书、论文等文档)进行数字签名,以获得包含数字签名的签名文档。
为了方便说明,本实施例中签名文档以包含一页文档为例进行说明,后续对涉及到多页文档的签名文档,将另行说明,此处不作限定。
在本实施例中,进行数字签名的方式多种多样,例如,RSA、ElGamal、Fiat-Shamir、Guillou-Quisquarter、Schnorr、Ong-Schnorr-Shamir数字签名算法、DES/DSA、椭圆曲线数字签名算法和有限自动机数字签名算法等,本申请实施例中不具体限定使用何种数字签名算法对原始文档进行数字签名,可以根据实际需要进行选择。
获得包含数字签名的签名文档后,可以执行步骤S12。
步骤S12:根据所述签名文档的内容和所述数字签名,对所述签名文档进行再次加密。
在本实施例中,为了进一步提高签名文档的安全性,可以对根据签名文档的内容和签名文档的数字签名,对经过数字签名的签名文档进行再次加密。其中,签名文档的内容可以包括签名文档的文档内容,也可以包括签名文档的标题信息、公司信息(以投标书为例)和时间信息中的一种或多种,当然,也可以包括其他的信息,例如,文档为论文时,可以包括院校信息、发表人信息、发送时间等,可以根据实际需要进行选取(选择一种或多种),此处不作限定。
通过签名文档的内容、签名文档的数字签名对签名文档进行再次加密,可以避免因签名文档的内容/数字签名被篡改而带来的风险(在发生篡改时,可以得知经再次加密后的签名文档已经被篡改,从而起到提示作用,有利于用户尽早采取应对措施),从而提升签名文档的安全性。
在本实施例中,可以基于签名文档的内容中的语句信息而确定出签名文档的文档特征信息,基于数字签名确定出签名文档的签名特征信息,并结合文档特征信息和签名特征信息确定出签名文档的唯一编码,使用唯一编码对签名文档进行再次加密。这样的方式可以进一步提升加密方法的安全性(可以在签名文档内容中的语句信息发生篡改时,有效识别出再次加密后的签名文档被篡改,从而提升安全性)。本实施例中将以此种加密方式为例进行说明,但不应视为对本申请的限定,在其他一些可实现的方式中,还可以采用其他的方式,例如将语句信息结合该语句信息的长度(字数),一个段落的长度(语句数量,语句长度等)对签名文档的签名特征信息进行确定,此处不作限定。
示例性的,可以根据签名文档的内容,确定出签名文档的N个语句信息。例如,对签名文档的文档内容,根据标点符号进行分割,确定出M个语句;可以采用正则表达式,从签名文档中提取出标题信息、公司信息、时间信息等与文档相关的信息,与基于文档内容确定出的M个语句拼接组合成N个语句信息:
S=[S1,S2,…Si,…SN],··············(1)
其中,Si表示第i个语句信息,而M,N均为大于零的自然数,且N大于等于M。
确定出N个语句信息后,可以根据N个语句信息,确定出签名文档的文档特征信息。
示例性的,可以将每个语句信息进行拆分,得到与该语句信息对应的k个词语,其中,k大于零,且不同语句信息对应的k的取值可以相同或不同。例如,利用分词工具将语句信息Si拆分为k个词语:
其中,表示拆分第i个语句信息中得到的第j个词语,而j,k均为大于零的自然数,且k大于等于j。
确定出语句信息对应的k个词语后,可以根据k个词语,确定出该语句信息对应的语句特征信息。
示例性的,可以根据k个词语,确定出该语句信息对应的邻接矩阵,其中,邻接矩阵用于表征词语间的汉语依存句法关系,且维度为k。具体的,可以根据汉语依存句法(例如主谓关系、动宾关系、并列关系等)对语句中的k个词语进行分析,将语句转换为网络图,并基于转换得到的网络图构建邻接矩阵A。构建方式可以为:
A=(amn)k×k,··············(3)
其中,k表示矩阵维度,m、n为1到k之间的整数,amn表示矩阵中第m行第n列的元素。
确定出该语句信息对应的邻接矩阵后,可以对k个词语进行独热编码,并根据邻接矩阵,提取k个词语之间的相关性信息,以确定出该语句信息对应的语句特征信息。
示例性的,仍以第i个语句信息为例,通过以下公式:
A%=A+Ik,··············(7)
其中,σ表示激活函数,D表示矩阵A%的度值矩阵,Ik表示k维的单位矩阵,W1、W2、b1和b2表示可训练参数(即这些参数可动态更新,例如,模型的训练参数)。
根据公式(5)至(7),可以确定出一个语句信息的语句特征信息。而对N个语句信息中每个语句信息进行处理,可以确定出对应N个语句信息的语句特征信息,即:
S’=[S’1,S’2,…,S’i,…,S’N],········(8)
其中,S’i表示第i个语句特征信息,即第i个语句信息对应的语句特征信息。
确定出N个语句信息对应的N个语句特征信息后,可以进一步确定出签名文档的文档特征信息。
示例性的,可以将N个语句特征信息映射到第一空间,以确定出第一集合,以及,将N个语句特征信息映射到第二空间,以确定出第二集合,第一空间与第二空间为不同的空间。例如,将S’分别映射到第一空间和第二空间中,可以得到:
S”=S’*W3,··············(9)
S”’=S’*W4,··············(10)
其中,S”表示第一集合,S”’表示第二集合,W3、W3表示训练参数。
确定出第一集合和第二集合后,可以计算第一集合和第二集合的相似度,并根据相似度确定出不同语句特征信息之间的权重矩阵。
示例性的,可以根据公式(11),确定出权重矩阵:
C=softmax((S”)T*S”’),··············(11)
其中,C表示权重矩阵,softmax表示将计算得到的值转化为对应权重,T表示转置。
确定出权重矩阵后,可以根据权重矩阵,确定出不同语句特征信息之间的关联性信息。示例性的,可以通过公式(12)确定出不同语句特征信息之间的关联性信息:
Z=C*S’,··············(12)
其中,Z表示不同语句特征信息之间的关联性信息。
确定出关联性信息后,可以进一步确定出签名文档的文档特征信息。
示例性的,可以将关联性信息进行非线性转换,以确定出签名文档的文档特征信息。例如,可以通过以下公式:
V=σ(Z*W5+b3),··············(13)
其中,σ表示激活函数,V表示文档特征信息,W5、b3表示训练参数。
以上,是确定签名文档的文档特征信息的一种示例性的方式。通过这样的方式确定出的文档特征信息,来源于签名文档的内容,而基于其中的语句、词语确定文档特征信息,这样的文档特征信息可以反映签名文档中每个语句的词语,在签名文档的内容发生篡改(例如,篡改了一个词语)时,能够有效检测出来,从而提升签名文档的安全性。而通过汉语依存句法对语句信息中的词语进行分析,构建对应的邻接矩阵,并通过对词语的独热编码,提取词语之间的相关性信息,从而可以准确地得到语句信息对应的语句特征信息,有利于实现对签名文档的再次加密的稳定性。另外,将语句特征信息映射到不同空间,以计算映射到不同空间后语句特征信息的相似度,得到不同语句之间的权重矩阵,以确定出不同语句特征信息之间的关联性信息,从而确定出签名文档的文档特征信息。这样能够准确地实现对文档特征信息的确定,有利于再次加密的稳定性。
当然,以上介绍的实现方式,不应视为对本申请的限定,也可以有其他的实现方式(例如在进行语句特征信息的提取过程中,还可以采用别的方式提取语句的特征,例如提取词语关键字的向量特征),此处不作一一介绍,以实际需要为准。
在本实施例中,还可以基于签名文档的数字签名,确定出对应的签名特征信息。
示例性的,可以将包含数字签名的签名图片裁剪为预设大小,并对裁剪后的签名图片进行数字化处理,以确定出签名文档的签名特征信息。
具体的,可以确定出签名文档的数字签名的签名图片,将包含该数字签名的签名图片进行裁剪,得到长宽为l×w大小的图片,而后进行数字化处理,得到对应的签名特征信息P。
确定出签名文档的文档特征信息和签名特征信息后,可以根据文档特征信息和签名特征信息,确定出签名文档的唯一编码,并根据唯一编码对签名文档进行再次加密。
示例性的,可以将签名文档(此处及以上的签名文档是以一页文档为例)的文档特征信息V和签名特征信息P组合拉伸为一维数据H,然后进行非线性变换(例如经过一次非线性变换),生成对应签名文档的唯一编码。
具体的,可参阅以下公式:
Zc=tanh(W4H+b4),··············(14)
其中,Zc表示唯一编码,c表示压缩后的维度,tanh表示激活函数。
在本实施例中,确定出的唯一编码可以为隐藏水印,通过将唯一编码以隐藏水印的方式添加在签名文档中,从而有利于加强数字签名的安全性,保证数字签名为特定文档(签名文档)服务,难以被盗用、滥用,而签名文档的关键信息内容在签名后难以被篡改,可以进一步改善现有加密方法容易被攻击的情况。
具体的,可以将签名文档转换为图片并将唯一编码Zc作为水印打印在图片上,得到图片/>即实现对签名文档的再次加密。其中,α×β表示图片的长宽。
另外,对于签名文档中包含多页文档的情况,此处进行简要介绍。
对于包含多页文档的签名文档(每页签名文档中均包含对应的数字签名),可以采用前文所述的签名文档的加密方法应用于包含一页文档的签名文档时的方法,确定出每一页文档对应的文档特征信息和签名特征信息:
V=[V1,V2,…,Vi,…,VX],··············(15)
其中,Vi为签名文档中第i页文档的文档特征信息,为签名文档中第i页文档的签名特征信息。
而根据每一页文档对应的文档特征信息和签名特征信息,可以确定出该页文档对应的唯一编码(具体确定唯一编码的方式可以参阅前文,此处不再赘述),对该页文档进行再次加密。
在本实施例中,可以建立签名文档的加密模型,以高效运行签名文档的加密方法,但不作为限定。
为了保证签名文档的加密模型的准确性和稳定性,可以对签名文档的加密模型进行训练。请参阅图2,图2为本申请实施例提供的一种签名文档的加密模型的训练逻辑示意图。
在本实施例中,签名文档的加密模型可以包括加密子模型和鉴别子模型,其中,加密子模型用于对签名文档进行再次加密,鉴别子模型可以用于对数字签名的合法性进行鉴别。
签名文档的加密模型的训练逻辑为:将包含数字签名的签名文档输入到加密子模型中,而加密子模型可以对签名文档进行再次加密,输出添加隐藏水印(基于签名文档的内容和数字签名生成的唯一编码)的加密文档。而鉴别子模型可以对输入的文档进行数字签名的合法性鉴别,以鉴别加密文档的数字签名是否合法。当然,输入鉴别子模型的文档中可以包括加密后的签名文档和假文档(例如对签名文档进行篡改后加密的文档),鉴别子模型可以对输入的文档的数字签名进行合法性鉴别。以及,鉴别子模型可以根据鉴别结果对签名文档的加密模型(包括加密子模型和鉴别子模型)的参数进行更新,以提升签名文档的加密模型的准确性和稳定性。
为了进一步提升签名文档的加密模型的准确性和稳定性,可以对签名文档的加密模型采用以下方式进行训练。
请参阅图3,图3为本申请实施例提供的一种签名文档的加密模型的训练方法的流程图。在本实施例中,签名文档的加密模型的训练方法可以包括步骤S21、步骤S22和步骤S23。
为了对签名文档的加密模型进行训练,可以执行步骤S21。
步骤S21:将包含数字签名的签名文档转换为第一图片,将根据所述签名文档执行签名文档的加密方法而确定出的唯一编码作为水印打在所述第一图片上,加入加密模型的真实类别训练集。
在本实施例中,可以将签名文档转换为第一图片并将根据签名文档执行签名文档的加密方法而确定出的唯一编码Zc作为水印打印在第一图片/>上,得到图片将图片/>加入加密模型的真实类别训练集。其中,真实类别训练集中的训练样本,均为在未篡改签名文档的内容和数字签名的条件下,通过签名文档的加密方法对签名文档进行再次加密而得到的加密后的签名文档。
以及,为了提升对签名文档的加密模型的训练效果,需要提供虚假类别训练集,对签名文档的加密模型进行训练,从而使得签名文档的加密模型能够更准确地鉴别输入的文档的数字签名是否合法。因此,可以执行步骤S22。
步骤S22:更改所述签名文档的内容并转换为第二图片,并将所述第二图片加入所述加密模型的虚假类别训练集。
在本实施例中,可以随机更改签名文档的中的文字,生成第二图片并将所述第二图片/>加入加密模型的虚假类别训练集。其中,虚假类别训练集中为对签名文档进行篡改后得到的训练样本。篡改签名文档的方式多种多样,因此,虚假类别训练集中的训练样本可以多种多样,不作具体限定。例如更改签名文档中的内容而得到的图片,或者对签名文档中的文档内容、标题信息、时间信息等中的一个或多个进行更改后得到的第二图片等。
确定出签名文档的加密模型的真实类别训练集和虚假类别训练集后,可以执行步骤S23。
步骤S23:根据所述真实类别训练集和所述虚假类别训练集训练所述加密模型。
在本实施例中,可以将真实类别训练集中的训练样本和虚假类别训练集中的训练样本作为签名文档的加密模型的输入,以训练模型。
示例性的,可以将训练样本输入到鉴别子模型中,而鉴别子模型可以基于以下公式,对输入的文档(训练样本)进行鉴别:
s(i,j)=∑m∑nx(i+m,j+m)k(m,n),········(17)
其中,x表示模型输入,k表示卷积核,s(i,j)表示经过卷积操作后对应位置元素值。
而后,可以将卷积后的输出(即s(i,j))输入到最大池化层中,得到池化后的输出,并将池化后的输出拉伸为一维特征输入到全连接层中。具体的,可以通过以下公式实现:
min maxL(E,D)=log(D(x))+log(1-D(E(x’))),····(19)
其中,W5、b3表示训练参数,σ表示激活函数,D(·)表示鉴别子模型,E(·)表示加密子模型,x表示鉴别子模型的输入,x’表示加密子模型的输入,表示签名文档特征真假的概率。
而后,可以交替更新加密子模型和鉴别子模型,使得由加密子模型再次加密的签名文档(即真实类别训练集中的训练样本)被鉴别为合法文档,而虚假类别训练集中的训练样本(假文档)被鉴别为非法文档。
通过将执行签名文档的加密方法而得到的唯一编码并加密后的签名文档,加入模型的真实类别训练集,而将更改后的签名文档执行签名文档的加密方法(或者其他加密方法)而得到的唯一编码并加密后的签名文档加入模型的虚假类别训练集,可以对模型进行有效的训练,从而提升签名文档的加密模型的稳定性和准确性。
请参阅图4,基于同一发明构思,本申请实施例中还提供一种签名文档的加密装置10,包括:获得模块11,用于获得包含数字签名的签名文档;加密模块12,用于根据所述签名文档的内容和所述数字签名,对所述签名文档进行再次加密。
在本实施例中,所述加密模块12,具体用于根据所述N个语句信息,确定出所述签名文档的文档特征信息;根据所述数字签名,确定出所述签名文档的签名特征信息;根据所述文档特征信息和所述签名特征信息,确定出所述签名文档的唯一编码,并根据所述唯一编码对所述签名文档进行再次加密。
在本实施例中,所述加密模块12,具体用于将每个语句信息进行拆分,得到与该语句信息对应的k个词语,其中,k大于零,且不同语句信息对应的k的取值相同或不同;根据所述k个词语,确定出该语句信息对应的语句特征信息;根据所述N个语句信息对应的N个所述语句特征信息,确定出所述签名文档的文档特征信息。
在本实施例中,所述加密模块12,具体用于根据所述k个词语,确定出该语句信息对应的邻接矩阵,其中,所述邻接矩阵用于表征词语间的汉语依存句法关系;对所述k个词语进行独热编码,并根据所述邻接矩阵,提取所述k个词语之间的相关性信息,以确定出该语句信息对应的语句特征信息。
在本实施例中,所述加密模块12,具体用于将所述N个语句特征信息映射到第一空间,以确定出第一集合,以及,将所述N个语句特征信息映射到第二空间,以确定出第二集合,第一空间与所述第二空间不同;计算所述第一集合和所述第二集合的相似度,并根据所述相似度确定出不同语句特征信息之间的权重矩阵;根据所述权重矩阵,确定出不同语句特征信息之间的关联性信息;将所述关联性信息进行非线性转换,以确定出所述签名文档的文档特征信息。
在本实施例中,所述加密模块12,具体用于将包含所述数字签名的签名图片裁剪为预设大小;对裁剪后的所述签名图片进行数字化处理,以确定出所述签名文档的所述签名特征信息。
本申请实施例还提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现本实施例中所述的签名文档的加密方法,或者实现本实施例中所述的签名文档的加密模型的训练方法。
以及,请参阅图5,图5为本申请实施例提供的一种电子设备20的结构框图。在本实施例中,电子设备20可以为服务器,例如网络服务器、云服务器、多个服务器构成的服务器集群等;电子设备20也可以为终端,例如智能手机、平板电脑、个人电脑等,此处不作限定。
示例性的,电子设备20可以包括:通过网络与外界连接的通信模块22、用于执行程序指令的一个或多个处理器24、总线23、不同形式的存储器21,例如,磁盘、ROM(Read-OnlyMemory,只读存储器)、或RAM(Random Access Memory,随机存取存储器),或其任意组合。其中,存储器21、通信模块22和处理器24之间通过总线23连接。
示例性的,存储器21中存储有程序。处理器24可以从存储器21调用并运行这些程序,从而便可以通过运行程序而执行签名文档的加密方法,或者执行签名文档的加密模型的训练方法。
综上所述,本申请实施例提供一种签名文档的加密方法、装置、训练方法、存储介质及设备,方法包括:获得包含数字签名的签名文档;根据所述签名文档的内容和所述数字签名,对所述签名文档进行再次加密。通过签名文档的内容和签名文档的数字签名,对经过数字签名的签名文档进行二次加密,可以进一步提高签名文档的安全性。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (7)
1.一种签名文档的加密方法,其特征在于,包括:
获得包含数字签名的签名文档;
根据所述签名文档的内容和所述数字签名,对所述签名文档进行再次加密,包括:根据所述签名文档的内容,确定出所述签名文档的N个语句信息,其中,所述签名文档的内容包括所述签名文档的文本内容,以及所述签名文档的标题信息、公司信息和时间信息中的一种或多种,N大于零;
根据所述N个语句信息,确定出所述签名文档的文档特征信息,包括:
将每个语句信息进行拆分,得到与该语句信息对应的k个词语,
其中,k大于零,且不同语句信息对应的k的取值相同或不同;
根据所述k个词语,确定出该语句信息对应的语句特征信息;
根据所述N个语句信息对应的N个所述语句特征信息,确定出所述签名文档的文档特征信息,包括:
将所述N个语句特征信息映射到第一空间,以确定出第一集合,以及,将所述N个语句特征信息映射到第二空间,以确定出第二集合,所述第一空间与所述第二空间不同;计算所述第一集合和所述第二集合的相似度,并根据所述相似度确定出不同语句特征信息之间的权重矩阵;
根据所述权重矩阵,确定出不同语句特征信息之间的关联性信息;
将所述关联性信息进行非线性转换,以确定出所述签名文档的文档特征信息;
根据所述数字签名,确定出所述签名文档的签名特征信息;
根据所述文档特征信息和所述签名特征信息,确定出所述签名文档的唯一编码,并根据所述唯一编码对所述签名文档进行再次加密。
2.根据权利要求1所述的签名文档的加密方法,其特征在于,所述根据所述k个词语,确定出该语句信息对应的语句特征信息,包括:
根据所述k个词语,确定出该语句信息对应的邻接矩阵,其中,所述邻接矩阵用于表征词语间的汉语依存句法关系;
对所述k个词语进行独热编码,并根据所述邻接矩阵,提取所述k个词语之间的相关性信息,以确定出该语句信息对应的语句特征信息。
3.根据权利要求1所述的签名文档的加密方法,其特征在于,根据所述数字签名,确定出所述签名文档的签名特征信息,包括:
将包含所述数字签名的签名图片裁剪为预设大小;
对裁剪后的所述签名图片进行数字化处理,以确定出所述签名文档的所述签名特征信息。
4.一种签名文档的加密模型的训练方法,其特征在于,包括:
将包含数字签名的签名文档转换为第一图片,将根据所述签名文档执行权利要求1至3中任一项所述的签名文档的加密方法而确定出的唯一编码作为水印打在所述第一图片上,加入加密模型的真实类别训练集;
更改所述签名文档的内容并转换为第二图片,并将所述第二图片加入所述加密模型的虚假类别训练集;
根据所述真实类别训练集和所述虚假类别训练集训练所述加密模型。
5.一种签名文档的加密装置,其特征在于,包括:
获得模块,用于获得包含数字签名的签名文档;
加密模块,用于根据所述签名文档的内容和所述数字签名,对所述签名文档进行再次加密;
加密模块,具体用于根据所述签名文档的内容,确定出所述签名文档的N个语句信息,其中,所述签名文档的内容包括所述签名文档的文本内容,以及所述签名文档的标题信息、公司信息和时间信息中的一种或多种,N大于零;根据所述N个语句信息,确定出所述签名文档的文档特征信息;具体用于将每个语句信息进行拆分,得到与该语句信息对应的k个词语,其中,k大于零,且不同语句信息对应的k的取值相同或不同;根据所述k个词语,确定出该语句信息对应的语句特征信息;根据所述N个语句信息对应的N个所述语句特征信息,确定出所述签名文档的文档特征信息,具体用于将所述N个语句特征信息映射到第一空间,以确定出第一集合,以及,将所述N个语句特征信息映射到第二空间,以确定出第二集合,所述第一空间与所述第二空间不同;计算所述第一集合和所述第二集合的相似度,并根据所述相似度确定出不同语句特征信息之间的权重矩阵;根据所述权重矩阵,确定出不同语句特征信息之间的关联性信息;将所述关联性信息进行非线性转换,以确定出所述签名文档的文档特征信息;根据所述数字签名,确定出所述签名文档的签名特征信息;根据所述文档特征信息和所述签名特征信息,确定出所述签名文档的唯一编码,并根据所述唯一编码对所述签名文档进行再次加密。
6.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至3中任一项所述的签名文档的加密方法,或者实现如权利要求4所述的签名文档的加密模型的训练方法。
7.一种电子设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,其特征在于:所述程序指令被处理器加载并执行时实现如权利要求1至3中任一项所述的签名文档的加密方法,或者,实现如权利要求4所述的签名文档的加密模型的训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010329672.2A CN111523140B (zh) | 2020-04-23 | 2020-04-23 | 签名文档的加密方法、装置、训练方法、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010329672.2A CN111523140B (zh) | 2020-04-23 | 2020-04-23 | 签名文档的加密方法、装置、训练方法、存储介质及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111523140A CN111523140A (zh) | 2020-08-11 |
CN111523140B true CN111523140B (zh) | 2024-02-23 |
Family
ID=71903309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010329672.2A Active CN111523140B (zh) | 2020-04-23 | 2020-04-23 | 签名文档的加密方法、装置、训练方法、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111523140B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7024558B1 (en) * | 1999-11-24 | 2006-04-04 | Fujitsu Limited | Apparatus and method for authenticating digital signatures and computer-readable recording medium thereof |
CN104320257A (zh) * | 2014-10-22 | 2015-01-28 | 李名选 | 电子档案验证方法及装置 |
CN107766324A (zh) * | 2017-09-25 | 2018-03-06 | 浙江大学 | 一种基于深度神经网络的文本一致性分析方法 |
CN108257197A (zh) * | 2016-12-28 | 2018-07-06 | 航天信息股份有限公司 | 一种用于在电子文档分页处设置骑缝章的方法及系统 |
CN108880859A (zh) * | 2018-05-23 | 2018-11-23 | 北京五八信息技术有限公司 | 升级文件的配置方法、装置、服务器、终端及存储介质 |
CN109756344A (zh) * | 2019-03-01 | 2019-05-14 | 广联达科技股份有限公司 | 一种文档的数字签名及其验证方法和装置 |
CN110287309A (zh) * | 2019-06-21 | 2019-09-27 | 深圳大学 | 快速提取文本摘要的方法 |
CN110309306A (zh) * | 2019-06-19 | 2019-10-08 | 淮阴工学院 | 一种基于wsd层级记忆网络的文档建模分类方法 |
CN110430192A (zh) * | 2019-08-06 | 2019-11-08 | 北京握奇数据股份有限公司 | 一种文件加解密的方法、系统、控制器及存储介质 |
WO2019223103A1 (zh) * | 2018-05-22 | 2019-11-28 | 平安科技(深圳)有限公司 | 文本相似度的获取方法、装置、终端设备及介质 |
CN110931137A (zh) * | 2018-09-19 | 2020-03-27 | 京东方科技集团股份有限公司 | 机器辅助对话系统、方法及装置 |
-
2020
- 2020-04-23 CN CN202010329672.2A patent/CN111523140B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7024558B1 (en) * | 1999-11-24 | 2006-04-04 | Fujitsu Limited | Apparatus and method for authenticating digital signatures and computer-readable recording medium thereof |
CN104320257A (zh) * | 2014-10-22 | 2015-01-28 | 李名选 | 电子档案验证方法及装置 |
CN108257197A (zh) * | 2016-12-28 | 2018-07-06 | 航天信息股份有限公司 | 一种用于在电子文档分页处设置骑缝章的方法及系统 |
CN107766324A (zh) * | 2017-09-25 | 2018-03-06 | 浙江大学 | 一种基于深度神经网络的文本一致性分析方法 |
WO2019223103A1 (zh) * | 2018-05-22 | 2019-11-28 | 平安科技(深圳)有限公司 | 文本相似度的获取方法、装置、终端设备及介质 |
CN108880859A (zh) * | 2018-05-23 | 2018-11-23 | 北京五八信息技术有限公司 | 升级文件的配置方法、装置、服务器、终端及存储介质 |
CN110931137A (zh) * | 2018-09-19 | 2020-03-27 | 京东方科技集团股份有限公司 | 机器辅助对话系统、方法及装置 |
CN109756344A (zh) * | 2019-03-01 | 2019-05-14 | 广联达科技股份有限公司 | 一种文档的数字签名及其验证方法和装置 |
CN110309306A (zh) * | 2019-06-19 | 2019-10-08 | 淮阴工学院 | 一种基于wsd层级记忆网络的文档建模分类方法 |
CN110287309A (zh) * | 2019-06-21 | 2019-09-27 | 深圳大学 | 快速提取文本摘要的方法 |
CN110430192A (zh) * | 2019-08-06 | 2019-11-08 | 北京握奇数据股份有限公司 | 一种文件加解密的方法、系统、控制器及存储介质 |
Non-Patent Citations (1)
Title |
---|
基于改进的TF-IDF算法及共现词的主题词抽取算法;公冶小燕;林培光;任威隆;张晨;张春云;;南京大学学报(自然科学)(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111523140A (zh) | 2020-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kamaruddin et al. | A review of text watermarking: theory, methods, and applications | |
CN111783875B (zh) | 基于聚类分析的异常用户检测方法、装置、设备及介质 | |
Hakak et al. | Approaches for preserving content integrity of sensitive online Arabic content: A survey and research challenges | |
CN111814466A (zh) | 基于机器阅读理解的信息抽取方法、及其相关设备 | |
WO2023065632A1 (zh) | 数据脱敏方法、数据脱敏装置、设备及存储介质 | |
Khadam et al. | Text data security and privacy in the internet of things: threats, challenges, and future directions | |
Al-Wesabi | A Hybrid Intelligent Approach for Content Authentication and Tampering Detection of Arabic Text Transmitted via Internet. | |
Kaur et al. | An existential review on text watermarking techniques | |
Jain et al. | Adversarial Detection Avoidance Attacks: Evaluating the robustness of perceptual hashing-based client-side scanning | |
Hakak et al. | A framework for authentication of digital Quran | |
Al-Wesabi | Proposing high-smart approach for content authentication and tampering detection of Arabic text transmitted via internet | |
CN104239753B (zh) | 云存储环境下文本文档的篡改检测方法 | |
Al-Wesabi | Entropy-Based Watermarking Approach for Sensitive Tamper Detection of Arabic Text. | |
Alanazi et al. | Involving spaces of unicode standard within irreversible Arabic text steganography for practical implementations | |
Kuvonchbek | Method Authentication of Objects Information Communication | |
JP2997483B2 (ja) | 検証用データ生成装置 | |
Zhang et al. | Coverless video steganography based on audio and frame features | |
CN111475690B (zh) | 字符串的匹配方法和装置、数据检测方法、服务器 | |
CN111523140B (zh) | 签名文档的加密方法、装置、训练方法、存储介质及设备 | |
CN110097258B (zh) | 一种用户关系网络建立方法、装置及计算机可读存储介质 | |
CN112099870A (zh) | 文档处理方法、装置、电子设备及计算机可读存储介质 | |
Alginahi et al. | A zero-watermarking verification approach for Quranic verses in online text documents | |
CN112989044A (zh) | 文本分类方法、装置、设备及存储介质 | |
Kazmi et al. | Unihach: unicode and hash function supported with counting and frequency recurrence of Arabic characters for Quranic text watermarking | |
KR102566991B1 (ko) | 핑거프린트를 이용한 전자간인 서비스 제공 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20201215 Address after: 310000 5-6 / F, no.378 Fengqi Road, Xiacheng District, Hangzhou City, Zhejiang Province Applicant after: MATERIAL BRANCH, STATE GRID ZHEJIANG ELECTRIC POWER Co.,Ltd. Address before: Unit 1104, Gongshu District, Hangzhou, Zhejiang Province Applicant before: Zhou Ting |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |