CN112258376B - 一种加密文档的处理方法及系统 - Google Patents

一种加密文档的处理方法及系统 Download PDF

Info

Publication number
CN112258376B
CN112258376B CN202011125610.6A CN202011125610A CN112258376B CN 112258376 B CN112258376 B CN 112258376B CN 202011125610 A CN202011125610 A CN 202011125610A CN 112258376 B CN112258376 B CN 112258376B
Authority
CN
China
Prior art keywords
document
encrypted
information
original
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011125610.6A
Other languages
English (en)
Other versions
CN112258376A (zh
Inventor
时修文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank of China
Original Assignee
Agricultural Bank of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank of China filed Critical Agricultural Bank of China
Priority to CN202011125610.6A priority Critical patent/CN112258376B/zh
Publication of CN112258376A publication Critical patent/CN112258376A/zh
Application granted granted Critical
Publication of CN112258376B publication Critical patent/CN112258376B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Technology Law (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明公开了一种加密文档的处理方法及系统,将原始涉密文档的每一页作为一个文档图像,基于电子文档的数字化特征或纸质文档的黑白颜色分布特征,从多维角度对每个文档图像包含的文档内容进行加密,生成包含加密信息的数字水印,通过将数字水印嵌入至原始涉密文档中得到加密文档,并根据原始涉密文档的使用频率确定加密文档的加密级别,当接收到对加密文档的操作指令时,根据操作指令中包含的身份标识确定操作者是否具有对加密文档执行操作指令中包含的操作内容的操作权限,只有验证通过后,操作者才可以对加密文档进行操作。因此,本发明有效解决了涉密文档被泄密和篡改的问题。

Description

一种加密文档的处理方法及系统
技术领域
本发明涉及文档加密技术领域,更具体的说,涉及一种加密文档的处理方法及系统。
背景技术
现有技术中在对涉密文档进行加密处理时,通常只在涉密文档的页眉处手工标识加密级别,涉密文档的不同加密级别,对应不同权限的查看人员。
由于现有技术仅是在涉密文档的书面上标注加密级别来实现加密,因此,无法对操作人员(比如,历史阅读人员和编辑人员,等)进行分类识别,从而导致涉密文档存在被泄密和被篡改的安全隐患。
发明内容
有鉴于此,本发明公开一种加密文档的处理方法及系统,以解决涉密文档被泄密和篡改的问题。
一种加密文档的处理方法,包括:
获取原始涉密文档;
将所述原始涉密文档的每一页作为一个文档图像,基于电子文档的数字化特征或纸质文档的黑白颜色分布特征,从多维角度对每个所述文档图像包含的文档内容进行加密,生成包含加密信息的数字水印;
将所述数字水印嵌入至所述原始涉密文档中得到加密文档,并标注所述加密文档的加密级别,其中,所述加密级别由基于所述原始涉密文档与相关文档之间的关联关系所确定的所述原始涉密文档的使用频率决定;
获取对所述加密文档的操作指令;
基于所述身份标识判断所述操作员是否具有对所述加密文档执行所述操作内容的操作权限;
如果是,则对所述加密文档进行解密得到解密文档,根据所述操作指令,对所述解密文档进行相应的操作,并记录所有的操作步骤和操作内容。
可选的,基于电子文档的数字化特征对每个所述文档图像包含的文档内容进行加密的过程具体包括:
采用小波变换获得所述文档图像的频域信息;
在所述频域信息内嵌入水印信息得到目标频域信息;
对所述目标频域信息进行小波逆变换,将所述目标频域信息转换为对应的时域图像,并将所述时域图像作为所述原始涉密文档中对应页的加密信息,得到所述数字水印。
可选的,基于纸质文档的黑白颜色分布特征对每个所述文档图像包含的文档内容进行加密的过程具体包括:
采用随机序列函数从每个所述文档图像中提取出行列信息;
从所述行列信息的每行文字中分别提取出一串黑白间隔的字符串;
将所有的所述字符串再次通过所述随机序列函数进行重组,得到一个二维的黑白相间图像,并将所述黑白相间图像作为所述原始涉密文档中对应页的加密信息,得到所述数字水印。
可选的,所述加密级别的确定过程为:
根据所述原始涉密文档与相关文档之间的关联关系,确定所述原始涉密文档的使用频率;根据预先存储的文档使用频率与加密级别之间的对应关系,确定所述加密级别。
可选的,所述将所述数字水印嵌入至所述原始涉密文档中得到加密文档,并标注所述加密文档的加密级别,具体包括:
从所述原始涉密文档中提取出目标关键字信息;
将所述目标关键字信息和所述数字水印进行结合生成身份标识信息;
将所述身份标识信息嵌入至所述原始涉密文档中,得到所述加密文档,并标注所述加密文档的加密级别。
一种加密文档的处理系统,包括:
第一获取单元,用于获取原始涉密文档;
加密单元,用于将所述原始涉密文档的每一页作为一个文档图像,基于电子文档的数字化特征或纸质文档的黑白颜色分布特征,从多维角度对每个所述文档图像包含的文档内容进行加密,生成包含加密信息的数字水印;
嵌入单元,用于将所述数字水印嵌入至所述原始涉密文档中得到加密文档,并标注所述加密文档的加密级别,其中,所述加密级别由基于所述原始涉密文档与相关文档之间的关联关系所确定的所述原始涉密文档的使用频率决定;
第二获取单元,用于获取对所述加密文档的操作指令;
判断单元,用于基于所述身份标识判断所述操作员是否具有对所述加密文档执行所述操作内容的操作权限;
解密单元,用于在所述判断单元判断为是的情况下,对所述加密文档进行解密得到解密文档,根据所述操作指令,对所述解密文档进行相应的操作,并记录所有的操作步骤和操作内容。
可选的,所述加密单元具体用于:
采用小波变换获得所述文档图像的频域信息;
在所述频域信息内嵌入水印信息得到目标频域信息;
对所述目标频域信息进行小波逆变换,将所述目标频域信息转换为对应的时域图像,并将所述时域图像作为所述原始涉密文档中对应页的加密信息,得到所述数字水印。
可选的,所述加密单元具体还用于:
采用随机序列函数从每个所述文档图像中提取出行列信息;
从所述行列信息的每行文字中分别提取出一串黑白间隔的字符串;
将所有的所述字符串再次通过所述随机序列函数进行重组,得到一个二维的黑白相间图像,并将所述黑白相间图像作为所述原始涉密文档中对应页的加密信息,得到所述数字水印。
可选的,还包括:
加密级别确定单元,用于根据所述原始涉密文档与相关文档之间的关联关系,确定所述原始涉密文档的使用频率;根据预先存储的文档使用频率与加密级别之间的对应关系,确定所述加密级别。
可选的,所述嵌入单元具体用于:
从所述原始涉密文档中提取出目标关键字信息;
将所述目标关键字信息和所述数字水印进行结合生成身份标识信息;
将所述身份标识信息嵌入至所述原始涉密文档中,得到所述加密文档,并标注所述加密文档的加密级别。
从上述的技术方案可知,本发明公开了一种加密文档的处理方法及系统,将原始涉密文档的每一页作为一个文档图像,基于电子文档的数字化特征或纸质文档的黑白颜色分布特征,从多维角度对每个文档图像包含的文档内容进行加密,生成包含加密信息的数字水印,通过将数字水印嵌入至原始涉密文档中得到加密文档,并根据原始涉密文档的使用频率确定加密文档的加密级别,当接收到对加密文档的操作指令时,根据操作指令中包含的身份标识确定操作者是否具有对加密文档执行操作指令中包含的操作内容的操作权限,如果是,则对加密文档进行解密得到解密文档,并根据操作指令对解密文档进行相应的操作,记录所有的操作步骤和操作内容。本发明基于电子文档的数字化特征或纸质文档的黑白颜色分布特征实现了对原始涉密文档的自动加密,当操作者对加密文档进行操作时,本发明会对操作的操作权限进行识别和验证,只有验证通过后,操作者才可以对加密文档进行操作,从而有效解决了涉密文档被泄密和篡改的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据公开的附图获得其他的附图。
图1为本发明实施例公开的一种加密文档的处理方法流程图;
图2为本发明实施例公开的一种将数字水印嵌入至原始涉密文档中得到加密文档的方法流程图;
图3为本发明实施例公开的一种加密文档的处理系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种加密文档的处理方法及系统,将原始涉密文档的每一页作为一个文档图像,基于电子文档的数字化特征或纸质文档的黑白颜色分布特征,从多维角度对每个文档图像包含的文档内容进行加密,生成包含加密信息的数字水印,通过将数字水印嵌入至原始涉密文档中得到加密文档,并根据原始涉密文档的使用频率确定加密文档的加密级别,当接收到对加密文档的操作指令时,根据操作指令中包含的身份标识确定操作者是否具有对加密文档执行操作指令中包含的操作内容的操作权限,如果是,则对加密文档进行解密得到解密文档,并根据操作指令对解密文档进行相应的操作,记录所有的操作步骤和操作内容。本发明基于电子文档的数字化特征或纸质文档的黑白颜色分布特征实现了对原始涉密文档的自动加密,当操作者对加密文档进行操作时,本发明会对操作的操作权限进行识别和验证,只有验证通过后,操作者才可以对加密文档进行操作,从而有效解决了涉密文档被泄密和篡改的问题。
另外,由于本发明记录了所有对加密文档的操作步骤和操作内容,从而实现了对涉密文档从生成到销毁全流程的追踪,能够对涉密文档的泄密过程进行追踪溯源,从而提高了涉密文档的安全性。
参见图1,本发明实施例公开的一种加密文档的处理方法流程图,该方法包括:
步骤S101、获取原始涉密文档;
步骤S102、将所述原始涉密文档的每一页作为一个文档图像,基于电子文档的数字化特征或纸质文档的黑白颜色分布特征,从多维角度对每个所述文档图像包含的文档内容进行加密,生成包含加密信息的数字水印;
其中,基于电子文档的数字化特征对每个所述文档图像包含的文档内容进行加密的过程如下:
采用小波变换获得所述文档图像的频域信息;
在所述频域信息内嵌入水印信息得到目标频域信息;
对所述目标频域信息进行小波逆变换,将所述目标频域信息转换为对应的时域图像,并将所述时域图像作为所述原始涉密文档中对应页的加密信息,得到所述数字水印。
本发明通过将原始涉密文档的每一页的文档图像转换为时域图像,实现了在原始涉密文档的每一页的文档图像中,以视觉上无差异的形式附加加密信息,从而使得剪切、涂改和加噪声等对于涉密文档的攻击,无法改变数字水印的加密信息,使得数字水印具有更高的隐蔽性和抗破坏性。
基于纸质文档的黑白颜色分布特征对每个所述文档图像包含的文档内容进行加密的过程如下:
采用随机序列函数从每个所述文档图像中提取出行列信息;
从所述行列信息的每行文字中分别提取出一串黑白间隔的字符串;
将所有的所述字符串再次通过所述随机序列函数进行重组,得到一个二维的黑白相间图像,并将所述黑白相间图像作为所述原始涉密文档中对应页的加密信息,得到所述数字水印。
本发明基于纸质文档的黑白颜色分布特征,对每个原始涉密文档中每一页对应的文档图像进行了归一化动态水印的构建。由于原始涉密文档中每一页的内容均不相同,因此得到的黑白相间图像能够唯一表征源文档的身份信息。
步骤S103、将所述数字水印嵌入至所述原始涉密文档中得到加密文档,并标注所述加密文档的加密级别;
其中,所述加密级别:由基于所述原始涉密文档与相关文档之间的关联关系所确定的所述原始涉密文档的使用频率决定。
也即,加密级别与原始涉密文档的使用频率相关,具体对应关系依据实际需要而定,本发明在此不做限定。
其中,所述加密级别的确定过程为:
根据所述原始涉密文档与相关文档之间的关联关系,确定所述原始涉密文档的使用频率;根据预先存储的文档使用频率与加密级别之间的对应关系,确定所述加密级别。
在实际应用中,获取加密文档的过程可以包括:将所述原始涉密文档的每一页作为一个文档图像,通过FFT(Fast Fourier Transform,快速傅立叶变换)算法获取所述文档图像的文档频谱,对所述文档频谱进行加密,得到加密频谱,将所述加密频谱采用IFFT(逆快速傅立叶变换)算法嵌入所述原始涉密文档的对应页中,得到加密文档。
步骤S104、获取对所述加密文档的操作指令;
当工作人员需要对加密文档进行操作时,本发明还会对工作人员的操作权限进行判定,并对工作人员的操作内容进行记录。
其中,操作内容包括但不限于:打印、修改和查看,等等。
操作指令中包含有操作员的身份标识,比如,操作员的工号,以及对加密文档的操作内容。
步骤S105、基于所述身份标识判断所述操作员是否具有对所述加密文档执行所述操作内容的操作权限,如果是,则执行步骤S106;
需要说明的是,本发明中针对与加密级别对应的操作内容以及具有对应操作权限的身份标识预先进行了存储,因此,基于操作员的身份标识,即可确定该操作员是否具有对加密文档执行所述操作内容的操作权限。
当步骤S105判断为否时,输出不具有对操作内容进行操作权限的提示信息,或者对非法操作及时进行告警。
步骤S106、对所述加密文档进行解密得到解密文档,根据所述操作指令,对所述解密文档进行相应的操作,并记录所有的操作步骤和操作内容。
综上可知,本发明公开的加密文档的处理方法,将原始涉密文档的每一页作为一个文档图像,基于电子文档的数字化特征或纸质文档的黑白颜色分布特征,从多维角度对每个文档图像包含的文档内容进行加密,生成包含加密信息的数字水印,通过将数字水印嵌入至原始涉密文档中得到加密文档,并根据原始涉密文档的使用频率确定加密文档的加密级别,当接收到对加密文档的操作指令时,根据操作指令中包含的身份标识确定操作者是否具有对加密文档执行操作指令中包含的操作内容的操作权限,如果是,则对加密文档进行解密得到解密文档,并根据操作指令对解密文档进行相应的操作,记录所有的操作步骤和操作内容。本发明基于电子文档的数字化特征或纸质文档的黑白颜色分布特征实现了对原始涉密文档的自动加密,当操作者对加密文档进行操作时,本发明会对操作的操作权限进行识别和验证,只有验证通过后,操作者才可以对加密文档进行操作,从而有效解决了涉密文档被泄密和篡改的问题。
另外,由于本发明记录了所有对加密文档的操作步骤和操作内容,从而实现了对涉密文档从生成到销毁全流程的追踪,对于额外拷贝、私自篡改等违规操作进行实时监控,能够对涉密文档的泄密过程进行追踪溯源,从而提高了涉密文档的安全性。
为能够实时掌握原始涉密文档从生成加密文档到加密文档打印销毁的全部流程,本发明还利用数字水印的加密特性,使用机器学习技术生成唯一标识文档的隐式标签,以使加密文档具有很好的安全保密性和历史行为的可追溯性,并根据数字水印的使用频率,调整对应的加密文档的加密级别。
因此,为进一步优化上述实施例,参见图2,本发明实施例公开的一种将数字水印嵌入至原始涉密文档中得到加密文档的方法流程图,也即,步骤S103具体还可以包括:
步骤S201、从所述原始涉密文档中提取出目标关键字信息;
具体的,首先提取原始涉密文档中的关键字信息,基于各个关键字信息识别原始涉密文档中逻辑语义关系,将全称和简称进行统一,并进行指代分析,替换文本中的你我它等代词。
其次整合文档信息的关联情况,去除冗余信息。原始涉密文档中文字的与、或、非等关联词,描述了文字之间的相互关系,同样文档中文字的距离位置也是表征了语义上的近似程度。假设有公司内部数据库信息的话,可以从中检索出文档中提及的人员、单位等属性的详细信息,对其加以分析可以提高构建涉密评级网络的准确性。
然后对原始涉密文档的特征信息进行相似度计算,并将计算得到的相似度存储到涉密评级网络中。利用前几步构建的概念框架,将原始涉密文档中的关键词进行关联细化,得到目标关键字信息。例如对于同样的三个关键词水、茶杯、铅笔,水和茶杯的逻辑近似程度大于水和铅笔、茶杯和铅笔。
步骤S202、将所述目标关键字信息和所述数字水印进行结合生成身份标识信息;
其中,身份标识信息也即唯一标识文档的隐式标签。
步骤S203、将所述身份标识信息嵌入至所述原始涉密文档中,得到所述加密文档,并标注所述加密文档的加密级别。
本发明中,当需要对加密文档以纸质形式进行打印时,将待打印的加密文档扫面至服务端,由服务端校验纸质版的加密文档是否被篡改,并基于对加密文档的历史行为信息,确定对加密文档是否进行了多次非法拷贝,如果加密文档被篡改和/或进行了多次非法拷贝,则及时输出告警信息,提醒系统管理员进行风险行为的监测。
需要说明的是,当处理电子板的加密文档时,服务端将自动进行加密处理,将加密文档传输至电脑、手机等访问端,访问端对加密文档进行解密,并且校验解密文档的完整性,当解密文档确认无误后才可安全阅读。
当原始涉密文档为纸质版时,通过扫描和傅里叶变换得到原始涉密文档的频域信息,将该频域信息与源电子文档的频域信息相减,得到差值频域信息,对差值频域信息进行傅里叶逆变换,以便确定数字水印信息是否完整,从而判断出纸质的原始涉密文档是否被其他人员进行了非法篡改。
本发明对加密文档进行解密得到解密文档的过程具体包括:
利用水印频谱对所述加密文档进行解密,得到解密文档。
需要说明的是,还可以将解密文档加密为加密文档,具体过程如下:
从解密文档中提取出的重构特征图像,对重构特征图像进行二维快速傅里叶变换,得到重构特征频谱,同样地将加密文档中的数字水印进行变换得到频域信息,将数字水印的频域信息分配到重构特征频谱的各个频率区间上,得到叠加频谱信息,将叠加频谱信息进行傅里叶逆变换得到了加密后的纸质版文档。
与上述方法实施例相对应,本发明还公开了一种加密文档的处理系统。
参见图3,本发明实施例公开的一种加密文档的处理系统的结构示意图,该系统包括:
第一获取单元301,用于获取原始涉密文档;
加密单元302,用于将所述原始涉密文档的每一页作为一个文档图像,基于电子文档的数字化特征或纸质文档的黑白颜色分布特征,从多维角度对每个所述文档图像包含的文档内容进行加密,生成包含加密信息的数字水印;
当基于电子文档的数字化特征对每个所述文档图像包含的文档内容进行加密时,加密单元302具体可以用于:
采用小波变换获得所述文档图像的频域信息;
在所述频域信息内嵌入水印信息得到目标频域信息;
对所述目标频域信息进行小波逆变换,将所述目标频域信息转换为对应的时域图像,并将所述时域图像作为所述原始涉密文档中对应页的加密信息,得到所述数字水印。
本发明通过将原始涉密文档的每一页的文档图像转换为时域图像,实现了在原始涉密文档的每一页的文档图像中,以视觉上无差异的形式附加加密信息,从而使得剪切、涂改和加噪声等对于涉密文档的攻击,无法改变数字水印的加密信息,使得数字水印具有更高的隐蔽性和抗破坏性。
当基于纸质文档的黑白颜色分布特征对每个所述文档图像包含的文档内容进行加密时,加密单元302具体具体还可以用于:
采用随机序列函数从每个所述文档图像中提取出行列信息;
从所述行列信息的每行文字中分别提取出一串黑白间隔的字符串;
将所有的所述字符串再次通过所述随机序列函数进行重组,得到一个二维的黑白相间图像,并将所述黑白相间图像作为所述原始涉密文档中对应页的加密信息,得到所述数字水印。
嵌入单元303,用于将所述数字水印嵌入至所述原始涉密文档中得到加密文档,并标注所述加密文档的加密级别,其中,所述加密级别由基于所述原始涉密文档与相关文档之间的关联关系所确定的所述原始涉密文档的使用频率决定;
也即,加密级别与原始涉密文档的使用频率相关,具体对应关系依据实际需要而定,本发明在此不做限定。
其中,所述加密级别的确定过程为:
根据所述原始涉密文档与相关文档之间的关联关系,确定所述原始涉密文档的使用频率;根据预先存储的文档使用频率与加密级别之间的对应关系,确定所述加密级别。
在实际应用中,获取加密文档的过程可以包括:将所述原始涉密文档的每一页作为一个文档图像,通过FFT(Fast Fourier Transform,快速傅立叶变换)算法获取所述文档图像的文档频谱,对所述文档频谱进行加密,得到加密频谱,将所述加密频谱采用IFFT(逆快速傅立叶变换)算法嵌入所述原始涉密文档的对应页中,得到加密文档。
第二获取单元304,用于获取对所述加密文档的操作指令;
当工作人员需要对加密文档进行操作时,本发明还会对工作人员的操作权限进行判定,并对工作人员的操作内容进行记录。
其中,操作内容包括但不限于:打印、修改和查看,等等。
操作指令中包含有操作员的身份标识,比如,操作员的工号,以及对加密文档的操作内容。
判断单元305,用于基于所述身份标识判断所述操作员是否具有对所述加密文档执行所述操作内容的操作权限;
需要说明的是,本发明中针对与加密级别对应的操作内容以及具有对应操作权限的身份标识预先进行了存储,因此,基于操作员的身份标识,即可确定该操作员是否具有对加密文档执行所述操作内容的操作权限。
解密单元306,用于在所述判断单元305判断为是的情况下,对所述加密文档进行解密得到解密文档,根据所述操作指令,对所述解密文档进行相应的操作,并记录所有的操作步骤和操作内容。
综上可知,本发明公开的加密文档的处理系统,将原始涉密文档的每一页作为一个文档图像,基于电子文档的数字化特征或纸质文档的黑白颜色分布特征,从多维角度对每个文档图像包含的文档内容进行加密,生成包含加密信息的数字水印,通过将数字水印嵌入至原始涉密文档中得到加密文档,并根据原始涉密文档的使用频率确定加密文档的加密级别,当接收到对加密文档的操作指令时,根据操作指令中包含的身份标识确定操作者是否具有对加密文档执行操作指令中包含的操作内容的操作权限,如果是,则对加密文档进行解密得到解密文档,并根据操作指令对解密文档进行相应的操作,记录所有的操作步骤和操作内容。本发明基于电子文档的数字化特征或纸质文档的黑白颜色分布特征实现了对原始涉密文档的自动加密,当操作者对加密文档进行操作时,本发明会对操作的操作权限进行识别和验证,只有验证通过后,操作者才可以对加密文档进行操作,从而有效解决了涉密文档被泄密和篡改的问题。
另外,由于本发明记录了所有对加密文档的操作步骤和操作内容,从而实现了对涉密文档从生成到销毁全流程的追踪,对于额外拷贝、私自篡改等违规操作进行实时监控,能够对涉密文档的泄密过程进行追踪溯源,从而提高了涉密文档的安全性。
为能够实时掌握原始涉密文档从生成加密文档到加密文档打印销毁的全部流程,本发明还利用数字水印的加密特性,使用机器学习技术生成唯一标识文档的隐式标签,以使加密文档具有很好的安全保密性和历史行为的可追溯性,并根据数字水印的使用频率,调整对应的加密文档的加密级别。
因此,为进一步优化上述实施例,嵌入单元303具体可以用于:
从所述原始涉密文档中提取出目标关键字信息;
将所述目标关键字信息和所述数字水印进行结合生成身份标识信息;
将所述身份标识信息嵌入至所述原始涉密文档中,得到所述加密文档,并标注所述加密文档的加密级别。
具体的,首先提取原始涉密文档中的关键字信息,基于各个关键字信息识别原始涉密文档中逻辑语义关系,将全称和简称进行统一,并进行指代分析,替换文本中的你我它等代词。
其次整合文档信息的关联情况,去除冗余信息。原始涉密文档中文字的与、或、非等关联词,描述了文字之间的相互关系,同样文档中文字的距离位置也是表征了语义上的近似程度。假设有公司内部数据库信息的话,可以从中检索出文档中提及的人员、单位等属性的详细信息,对其加以分析可以提高构建涉密评级网络的准确性。
然后对原始涉密文档的特征信息进行相似度计算,并将计算得到的相似度存储到涉密评级网络中。利用前几步构建的概念框架,将原始涉密文档中的关键词进行关联细化,得到目标关键字信息。例如对于同样的三个关键词水、茶杯、铅笔,水和茶杯的逻辑近似程度大于水和铅笔、茶杯和铅笔。
本发明中,当需要对加密文档以纸质形式进行打印时,将待打印的加密文档扫面至服务端,由服务端校验纸质版的加密文档是否被篡改,并基于对加密文档的历史行为信息,确定对加密文档是否进行了多次非法拷贝,如果加密文档被篡改和/或进行了多次非法拷贝,则及时输出告警信息,提醒系统管理员进行风险行为的监测。
需要说明的是,当处理电子板的加密文档时,服务端将自动进行加密处理,将加密文档传输至电脑、手机等访问端,访问端对加密文档进行解密,并且校验解密文档的完整性,当解密文档确认无误后才可安全阅读。
当原始涉密文档为纸质版时,通过扫描和傅里叶变换得到原始涉密文档的频域信息,将该频域信息与源电子文档的频域信息相减,得到差值频域信息,对差值频域信息进行傅里叶逆变换,以便确定数字水印信息是否完整,从而判断出纸质的原始涉密文档是否被其他人员进行了非法篡改。
为进一步优化上述实施例,处理系统还可以包括:
加密级别确定单元,用于根据所述原始涉密文档与相关文档之间的关联关系,确定所述原始涉密文档的使用频率;根据预先存储的文档使用频率与加密级别之间的对应关系,确定所述加密级别。
本发明对加密文档进行解密得到解密文档的过程具体包括:
利用水印频谱对所述加密文档进行解密,得到解密文档。
需要说明的是,还可以将解密文档加密为加密文档,具体过程如下:
从解密文档中提取出的重构特征图像,对重构特征图像进行二维快速傅里叶变换,得到重构特征频谱,同样地将加密文档中的数字水印进行变换得到频域信息,将数字水印的频域信息分配到重构特征频谱的各个频率区间上,得到叠加频谱信息,将叠加频谱信息进行傅里叶逆变换得到了加密后的纸质版文档。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (6)

1.一种加密文档的处理方法,其特征在于,包括:
获取原始涉密文档;
将所述原始涉密文档的每一页作为一个文档图像,基于电子文档的数字化特征或纸质文档的黑白颜色分布特征,从多维角度对每个所述文档图像包含的文档内容进行加密,生成包含加密信息的数字水印;
将所述数字水印嵌入至所述原始涉密文档中得到加密文档,并标注所述加密文档的加密级别,其中,所述加密级别由基于所述原始涉密文档与相关文档之间的关联关系所确定的所述原始涉密文档的使用频率决定;
获取对所述加密文档的操作指令,所述操作指令包括操作员的身份标识;
基于所述身份标识判断所述操作员是否具有对所述加密文档执行操作内容的操作权限;
如果是,则对所述加密文档进行解密得到解密文档,根据所述操作指令,对所述解密文档进行相应的操作,并记录所有的操作步骤和操作内容;
基于纸质文档的黑白颜色分布特征对每个所述文档图像包含的文档内容进行加密的过程具体包括:
采用随机序列函数从每个所述文档图像中提取出行列信息;
从所述行列信息的每行文字中分别提取出一串黑白间隔的字符串;
将所有的所述字符串再次通过所述随机序列函数进行重组,得到一个二维的黑白相间图像,并将所述黑白相间图像作为所述原始涉密文档中对应页的加密信息,得到所述数字水印;
所述将所述数字水印嵌入至所述原始涉密文档中得到加密文档,并标注所述加密文档的加密级别,具体包括:
从所述原始涉密文档中提取出目标关键字信息;
将所述目标关键字信息和所述数字水印进行结合生成身份标识信息;
将所述身份标识信息嵌入至所述原始涉密文档中,得到所述加密文档,并标注所述加密文档的加密级别。
2.根据权利要求1所述的处理方法,其特征在于,基于电子文档的数字化特征对每个所述文档图像包含的文档内容进行加密的过程具体包括:
采用小波变换获得所述文档图像的频域信息;
在所述频域信息内嵌入水印信息得到目标频域信息;
对所述目标频域信息进行小波逆变换,将所述目标频域信息转换为对应的时域图像,并将所述时域图像作为所述原始涉密文档中对应页的加密信息,得到所述数字水印。
3.根据权利要求1所述的处理方法,其特征在于,所述加密级别的确定过程为:
根据所述原始涉密文档与相关文档之间的关联关系,确定所述原始涉密文档的使用频率;根据预先存储的文档使用频率与加密级别之间的对应关系,确定所述加密级别。
4.一种加密文档的处理系统,其特征在于,包括:
第一获取单元,用于获取原始涉密文档;
加密单元,用于将所述原始涉密文档的每一页作为一个文档图像,基于电子文档的数字化特征或纸质文档的黑白颜色分布特征,从多维角度对每个所述文档图像包含的文档内容进行加密,生成包含加密信息的数字水印;
嵌入单元,用于将所述数字水印嵌入至所述原始涉密文档中得到加密文档,并标注所述加密文档的加密级别,其中,所述加密级别由基于所述原始涉密文档与相关文档之间的关联关系所确定的所述原始涉密文档的使用频率决定;
第二获取单元,用于获取对所述加密文档的操作指令,所述操作指令包括操作员的身份标识;
判断单元,用于基于所述身份标识判断所述操作员是否具有对所述加密文档执行操作内容的操作权限;
解密单元,用于在所述判断单元判断为是的情况下,对所述加密文档进行解密得到解密文档,根据所述操作指令,对所述解密文档进行相应的操作,并记录所有的操作步骤和操作内容;
所述加密单元具体还用于:
采用随机序列函数从每个所述文档图像中提取出行列信息;
从所述行列信息的每行文字中分别提取出一串黑白间隔的字符串;
将所有的所述字符串再次通过所述随机序列函数进行重组,得到一个二维的黑白相间图像,并将所述黑白相间图像作为所述原始涉密文档中对应页的加密信息,得到所述数字水印;
所述嵌入单元具体用于:
从所述原始涉密文档中提取出目标关键字信息;
将所述目标关键字信息和所述数字水印进行结合生成身份标识信息;
将所述身份标识信息嵌入至所述原始涉密文档中,得到所述加密文档,并标注所述加密文档的加密级别。
5.根据权利要求4所述的处理系统,其特征在于,所述加密单元具体用于:
采用小波变换获得所述文档图像的频域信息;
在所述频域信息内嵌入水印信息得到目标频域信息;
对所述目标频域信息进行小波逆变换,将所述目标频域信息转换为对应的时域图像,并将所述时域图像作为所述原始涉密文档中对应页的加密信息,得到所述数字水印。
6.根据权利要求4所述的处理系统,其特征在于,还包括:
加密级别确定单元,用于根据所述原始涉密文档与相关文档之间的关联关系,确定所述原始涉密文档的使用频率;根据预先存储的文档使用频率与加密级别之间的对应关系,确定所述加密级别。
CN202011125610.6A 2020-10-20 2020-10-20 一种加密文档的处理方法及系统 Active CN112258376B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011125610.6A CN112258376B (zh) 2020-10-20 2020-10-20 一种加密文档的处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011125610.6A CN112258376B (zh) 2020-10-20 2020-10-20 一种加密文档的处理方法及系统

Publications (2)

Publication Number Publication Date
CN112258376A CN112258376A (zh) 2021-01-22
CN112258376B true CN112258376B (zh) 2024-04-12

Family

ID=74244120

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011125610.6A Active CN112258376B (zh) 2020-10-20 2020-10-20 一种加密文档的处理方法及系统

Country Status (1)

Country Link
CN (1) CN112258376B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113065154B (zh) * 2021-03-19 2023-12-29 深信服科技股份有限公司 一种文档检测方法、装置、设备和存储介质
CN113067832B (zh) * 2021-03-29 2022-01-21 郑州铁路职业技术学院 基于区块链和人工智能的通讯数据加密方法
CN114065239A (zh) * 2021-11-08 2022-02-18 清远市中盛合力网络科技有限公司 一种电子档案建档方法、系统、计算机设备和存储介质
CN116089363B (zh) * 2023-04-04 2023-09-01 联宝(合肥)电子科技有限公司 数据处理方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6101602A (en) * 1997-12-08 2000-08-08 The United States Of America As Represented By The Secretary Of The Air Force Digital watermarking by adding random, smooth patterns
CN101686294A (zh) * 2009-08-10 2010-03-31 北京立思辰新技术有限公司 嵌入式文件信息安全管理系统
CN102547254A (zh) * 2010-11-26 2012-07-04 中国科学院声学研究所 一种基于水印和加密的数字视频图像版权保护方法及系统
CN103136718A (zh) * 2013-03-13 2013-06-05 上海理工大学 抗几何变换的实用彩色图数字水印技术
CN104517045A (zh) * 2013-09-26 2015-04-15 上海中移通信技术工程有限公司 数字文档保护方法及系统
CN106611400A (zh) * 2016-05-31 2017-05-03 四川用联信息技术有限公司 一种密文图像的可逆水印算法
CN109829269A (zh) * 2018-12-26 2019-05-31 平安科技(深圳)有限公司 基于电子印章验证电子文档的方法、装置及系统
CN111784556A (zh) * 2020-06-23 2020-10-16 中国平安人寿保险股份有限公司 在图像中添加数字水印的方法、装置、终端及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6101602A (en) * 1997-12-08 2000-08-08 The United States Of America As Represented By The Secretary Of The Air Force Digital watermarking by adding random, smooth patterns
CN101686294A (zh) * 2009-08-10 2010-03-31 北京立思辰新技术有限公司 嵌入式文件信息安全管理系统
CN102547254A (zh) * 2010-11-26 2012-07-04 中国科学院声学研究所 一种基于水印和加密的数字视频图像版权保护方法及系统
CN103136718A (zh) * 2013-03-13 2013-06-05 上海理工大学 抗几何变换的实用彩色图数字水印技术
CN104517045A (zh) * 2013-09-26 2015-04-15 上海中移通信技术工程有限公司 数字文档保护方法及系统
CN106611400A (zh) * 2016-05-31 2017-05-03 四川用联信息技术有限公司 一种密文图像的可逆水印算法
CN109829269A (zh) * 2018-12-26 2019-05-31 平安科技(深圳)有限公司 基于电子印章验证电子文档的方法、装置及系统
CN111784556A (zh) * 2020-06-23 2020-10-16 中国平安人寿保险股份有限公司 在图像中添加数字水印的方法、装置、终端及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于字体颜色的文本数字水印算法;刘豪 等;计算机工程;31(15);129-131 *

Also Published As

Publication number Publication date
CN112258376A (zh) 2021-01-22

Similar Documents

Publication Publication Date Title
CN112258376B (zh) 一种加密文档的处理方法及系统
Shih Digital watermarking and steganography: fundamentals and techniques
CN1930578B (zh) 使用从材料单元的至少一个结构特征获取的数字签名来保护敏感信息的直接读取以及读取受保护的敏感信息的方法
EP1078312B1 (en) Apparatus for making and apparatus for reading a digital watermark and method of making and reading a digital watermark
US6970259B1 (en) Systems and methods for forgery detection and deterrence of printed documents
EP1075757B1 (en) Digital authentication with analog documents
US20190005268A1 (en) Universal original document validation platform
Hakak et al. Preserving content integrity of digital holy Quran: Survey and open challenges
Dittmann et al. Combining digital watermarks and collusion secure fingerprints for digital images
EP2355001A2 (en) Document authentication data embedding method and apparatus
US20080301464A1 (en) Two-dimensional bar code for ID card
US7548665B2 (en) Method, systems, and media for identifying whether a machine readable mark may contain sensitive data
Guru et al. Digital watermarking classification: a survey
CN111340676A (zh) 图像水印的嵌入方法、识别方法、装置及电子设备
KR102114391B1 (ko) 전산화된 기록물의 보안출력 시스템 및 방법
KR100918301B1 (ko) 전자문서의 이력 관리와 저장 유도가 가능한 전자문서관리시스템
Das et al. Digital forensic enabled image authentication using least significant bit (lsb) with tamper localization based hash function
JP2007011560A (ja) 帳票データ管理システム
Yadav Study of Information Hiding Techniques and their Counterattacks
CN107862210A (zh) 加密处理方法、系统和计算机设备
Khadam et al. Data aggregation and privacy preserving using computational intelligence
JP2008090407A (ja) 説明履歴管理システム
EP1739951A1 (en) Individual rendering of logos to track document leakage
Salleh et al. Application of 2D barcode in hardcopy document verification system
Rohith et al. A Comprehensive Exploration of Advancements and Applications of Digital Watermarking

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant