CN109670281A - 电子文档的处理方法和装置 - Google Patents

电子文档的处理方法和装置 Download PDF

Info

Publication number
CN109670281A
CN109670281A CN201710960469.3A CN201710960469A CN109670281A CN 109670281 A CN109670281 A CN 109670281A CN 201710960469 A CN201710960469 A CN 201710960469A CN 109670281 A CN109670281 A CN 109670281A
Authority
CN
China
Prior art keywords
information
bit string
watermark information
string fragment
information bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710960469.3A
Other languages
English (en)
Inventor
亓文法
郭宗明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University
Priority to CN201710960469.3A priority Critical patent/CN109670281A/zh
Publication of CN109670281A publication Critical patent/CN109670281A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Technology Law (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提供一种电子文档的处理方法和装置,其中,该方法包括:获取待嵌入到电子文档中的水印信息序列,其中,水印信息序列中包括水印信息位串碎片,水印信息位串碎片表征了电子文档的溯源信息,且水印信息位串碎片为被安全保护处理过的水印信息位串碎片;设定与各水印信息位串碎片分别对应的载体字符组合,其中,载体字符组合中包括电子文档中的至少一个字符,字符为用于嵌入水印信息位串碎片的字符;针对每一个载体字符组合,通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,以得到嵌入了溯源信息的电子文档,一旦电子文档被泄露出去之后,可以确认出电子文档的溯源信息,进行责任认定。

Description

电子文档的处理方法和装置
技术领域
本发明涉及文档处理技术领域,尤其涉及一种电子文档的处理方法和装置。
背景技术
随着信息化水平的不断提高,电子文档已经称为重要的信息化载体,电子文档具有成本低、使用易、通信快、发布广的优点。
现有技术中,电子文档的种类,常见的有微软公司的办公文字处理软件OfficeWord、便携式文档格式(Portable Document Format,简称PDF)等。很多的单位和个人,都会采用没有加密的电子文档进行信息的传输和交流;对于没有加密的电子文档,可以通过邮件、U盘、刻盘等各种方式进行传播。
然而现有技术中,在没有加密的电子文档被传递的时候,不会将没有加密的电子文档的溯源信息加到电子文档中,溯源信息例如有电子文档是由谁在什么时间在哪台设备上创建的,以及电子文档被谁在什么时间在哪台设备上浏览过等等。从而,不能对没有加密的电子文档进行溯源,进而一旦电子文档被泄露出去之后,无法确认电子文档的溯源信息,不能进行责任认定。
发明内容
本发明提供一种电子文档的处理方法和装置,用以解决不能对没有加密的电子文档进行溯源的问题。
一方面,本发明提供一种电子文档的处理方法,包括:
获取待嵌入到电子文档中的水印信息序列,其中,所述水印信息序列中包括至少一个水印信息位串碎片,所述水印信息位串碎片表征了所述电子文档的溯源信息,且所述水印信息位串碎片为被安全保护处理过的水印信息位串碎片;
设定与各水印信息位串碎片分别对应的载体字符组合,其中,所述载体字符组合中包括所述电子文档中的至少一个字符,所述字符为用于嵌入水印信息位串碎片的字符;
针对每一个所述载体字符组合,通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,以得到嵌入了溯源信息的电子文档。
另一方面,本发明提供一种电子文档的处理装置,包括:
获取模块,用于获取待嵌入到电子文档中的水印信息序列,其中,所述水印信息序列中包括至少一个水印信息位串碎片,所述水印信息位串碎片表征了所述电子文档的溯源信息,且所述水印信息位串碎片为被安全保护处理过的水印信息位串碎片;
设定模块,用于设定与各水印信息位串碎片分别对应的载体字符组合,其中,所述载体字符组合中包括所述电子文档中的至少一个字符,所述字符为用于嵌入水印信息位串碎片的字符;
嵌入模块,用于针对每一个所述载体字符组合,通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,以得到嵌入了溯源信息的电子文档。
本发明提供通过获取待嵌入到电子文档中的水印信息序列,其中,水印信息序列中包括至少一个水印信息位串碎片,水印信息位串碎片表征了电子文档的溯源信息,且水印信息位串碎片为被安全保护处理过的水印信息位串碎片;设定与各水印信息位串碎片分别对应的载体字符组合,其中,载体字符组合中包括电子文档中的至少一个字符,字符为用于嵌入水印信息位串碎片的字符;针对每一个载体字符组合,通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,以得到嵌入了溯源信息的电子文档。进而通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,可以将电子文档的溯源信息添加到电子文档中,进而可以获知没有加密的电子文档的溯源信息,对没有加密的电子文档进行溯源,一旦电子文档被泄露出去之后,可以确认出电子文档的溯源信息,进行责任认定;并且由于水印信息位串碎片为被安全保护处理过,进而将水印信息位串碎片添加到电子文档之后,水印信息位串碎片不会被轻易获取到。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本申请实施例提供的一种电子文档的处理方法的流程示意图;
图2为本申请实施例提供的另一种电子文档的处理方法的流程示意图;
图3为本发明实施例提供的一种电子文档的处理装置的结构示意图;
图4为本发明实施例提供的另一种电子文档的处理装置的结构示意图;
图5是根据一示例性实施例示出的一种终端设备的框图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
随着信息化水平的不断提高和业务应用增多,电子文档作为传统纸质文档的信息化载体,在各行各业被广泛的应用,例如,用户可以会用Word类型的电子文档进行文件传输和信息交流。随着电子文档被广泛应用,对于电子文档的溯源追踪的需求也越来越迫切,尤其在国家重要的部门,一些机密文件会被传播出去,在机密的电子文档截获之后,需要确定这些电子文档的溯源信息,即电子文档的创建者的信息、电子文档的创建时间、电子文档创建于什么设备上、电子文档的阅览者的信息、电子文档的阅览时间、电子文档被阅览者于什么设备上进行阅览或存储。
可以采用本申请中实施例提供的方法和装置,解决上述问题,进而实现对没有加密的电子文档进行溯源。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
图1为本申请实施例提供的一种电子文档的处理方法的流程示意图。如图1所示,该方法包括:
步骤101、获取待嵌入到电子文档中的水印信息序列,其中,水印信息序列中包括至少一个水印信息位串碎片,水印信息位串碎片表征了电子文档的溯源信息,且水印信息位串碎片为被安全保护处理过的水印信息位串碎片。
在本实施例中,具体地,可以通过插件机制,去截获电子文档的操作命令,例如,对于Word类型的电子文档,可以通过VSTO(Visual Studio Tools for Office)的插件机制来截获Word类型的电子文档的操作命令。然后,当电子文档被编辑保存、或者被关闭的时候,插件会自动获取待嵌入到电子文档中的水印信息序列,其中,待嵌入到电子文档中的水印信息序列为待隐藏到电子文档中的水印信息,在水印信息序列中包括至少一个水印信息位串碎片,水印信息位串碎片表征了电子文档的溯源信息,且水印信息位串碎片为被安全保护处理过的水印信息位串碎片。
电子文档的溯源信息包括电子文档的密级、保密期限、知悉范围、创建者信息、文档浏览时间、计算机物理地址(Media Access Control,简称MAC)地址以及当前文档的中文名为消息摘要算法第五版(Message Digest Algorithm MD5,简称MD5)摘要值等。
步骤102、设定与各水印信息位串碎片分别对应的载体字符组合,其中,载体字符组合中包括电子文档中的至少一个字符,字符为用于嵌入水印信息位串碎片的字符。
在本实施例中,具体的,可以根据预设规则或者随机的确定出与每一个水印信息位串碎片分别对应的载体字符组合,其中,每一个所述载体字符组合中包括了多个字符,且字符都是电子文档中的待嵌入水印信息位串碎片的字符。
步骤103、针对每一个载体字符组合,通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,以得到嵌入了溯源信息的电子文档。
在本实施例中,具体的,每一个载体字符组合都具有排版格式属性信息,排版格式属性信息例如有颜色信息、或者字符间距信息、或者字符缩放信息、或者不可见字符信息、或者全/半角标点符号信息等等。其中,颜色信息又具体包括字符颜色、边框颜色和下划线颜色信息等。
针对于每一个载体字符组合,可以根据当前载体字符组合的排版格式属性信息,将与当前载体字符组合对应的水印信息位串碎片嵌入到当前载体字符组合中,进而可以得到嵌入了水印信息位串碎片的当前载体字符组合。在对每一个载体字符组合执行这一过程之后,由于水印信息位串碎片表征了电子文档的溯源信息,最后可以得到嵌入了溯源信息的电子文档。
本实施例通过获取待嵌入到电子文档中的水印信息序列,其中,水印信息序列中包括至少一个水印信息位串碎片,水印信息位串碎片表征了电子文档的溯源信息,且水印信息位串碎片为被安全保护处理过的水印信息位串碎片;设定与各水印信息位串碎片分别对应的载体字符组合,其中,载体字符组合中包括电子文档中的至少一个字符,字符为用于嵌入水印信息位串碎片的字符;针对每一个载体字符组合,通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,以得到嵌入了溯源信息的电子文档。进而通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,可以将电子文档的溯源信息添加到电子文档中,进而可以获知没有加密的电子文档的溯源信息,对没有加密的电子文档进行溯源,一旦电子文档被泄露出去之后,可以确认出电子文档的溯源信息,进行责任认定;并且由于水印信息位串碎片为被安全保护处理过,进而将水印信息位串碎片添加到电子文档之后,水印信息位串碎片不会被轻易获取到。
图2为本申请实施例提供的另一种电子文档的处理方法的流程示意图。如图2所示,该方法包括:
201、获取初始水印信息序列,其中,初始水印信息序列中包括电子文档的溯源信息。
在本实施例中,具体的,可以通过插件机制,去截获电子文档的操作命令,例如,对于Word类型的电子文档,可以通过VSTO的插件机制来截获Word类型的电子文档的操作命令。然后,当电子文档被编辑保存、或者被关闭的时候,插件会自动获取到初始水印信息序列。其中,初始水印信息序列为水印信息位串w,该水印信息位串w表征了电子文档的溯源信息,溯源信息例如有电子文档的创建者的信息、电子文档的创建时间、电子文档创建于什么设备上、电子文档的阅览者的信息、电子文档的阅览时间、电子文档被阅览者于什么设备上进行阅览或存储。
其中,水印信息序列为二进制位串序列,其长度记为Length,例如Length为512位。
202、根据预设的密钥和预设的校验码,对初始水印信息序列进行安全保护处理,生成安全保护处理后的初始水印信息序列。
在本实施例中,具体的,已经预设了密钥和校验码,可以根据密钥和校验码,对初始水印信息序列进行安全保护处理,进而生成安全保护处理后的初始水印信息序列。其中,的安全保护处理可以为加密处理等方式。在得到安全保护处理后的初始水印信息序列之后,在安全保护处理后的初始水印信息序列中具有校验码,并且校验码需要一定的存储空间,即需要牺牲初始水印信息序列中的一部分空间存储校验码、或通过辅助信息来存储校验码。
203、将安全保护处理后的初始水印信息序列,划分为多个水印信息位串碎片。
在本实施例中,具体的,可以得到为多个水印信息位串碎片。可知,水印信息位串碎片表征了电子文档的溯源信息,且水印信息位串碎片为被安全保护处理过的水印信息位串碎片。由于不可能在电子文档的一个字符上嵌入整片水印信息序列中,所以将安全保护处理后的初始水印信息序列,划分为多个水印信息位串碎片,进而多个水印信息位串碎片可以被分别嵌入在多个字符上,即最后可以将水印信息序列分别嵌入到多个字符上,在提取水印信息序列的时候,可以按一定顺序将这些水印信息位串碎片组合起来。
204、针对于每一个水印信息位串碎片,在水印信息位串碎片中添加碎片位置信息,得到待嵌入到电子文档中的水印信息序列,其中,碎片位置信息表征了水印信息位串碎片在待嵌入到电子文档中的水印信息序列中的位置,待嵌入到电子文档中的水印信息序列中包括至少一个水印信息位串碎片。
在本实施例中,具体的,在每个水印信息位串碎片中插入额外的位串信息,用于标识水印信息位串碎片在待嵌入到电子文档中的水印信息序列中的位置,该额外的位串信息也称作碎片位置信息。在对每一个水印信息位串碎片中插入额外的位串信息之后,就得到一个新的水印信息序列,该新的水印信息序列也就是嵌入到电子文档中的水印信息序列,可知,待嵌入到电子文档中的水印信息序列中包括至少一个添加了碎片位置信息的水印信息位串碎片。
具体来说,若某个水印信息位串碎片错误或丢失,则影响整个水印信息序列的恢复。进而需要确定出各水印信息位串碎片的顺序,可以标定每片水印信息位串碎片在整个待嵌入到电子文档中的水印信息序列中的位置,并结合冗余嵌入方法在电子文档中重复嵌入待嵌入到电子文档中的水印信息序列。提取时若发现某块水印信息位串碎片丢失或同一位置的水印信息位串碎片有所差异,则可采用投票策略决定采用哪一个水印信息位串碎片。
标定水印信息位串碎片的位置需要额外的嵌入空间,可牺牲一部分原有水印空间来存储碎片位置信息。假设整个安全保护处理后的初始水印信息序列的长度为length(w)bits,每个水印信息位串碎片空间为s bits,则嵌入一次安全保护处理后的初始水印信息序列需要round(length(w)/s)个水印信息位串碎片。若每个水印信息位串碎片空间分出pbits来存储碎片位置信息,则p应为满足如下关系的最小值:2p×(s-p)≥length(w),进而所需水印信息位串碎片的个数为round(length(w)/(s-p))。
205、获取各水印信息位串碎片的标识信息,其中,标识信息中包括了起始字符位置信息和结束字符位置信息,或者,标识信息表征待嵌入了水印信息位串碎片的载体字符组合;其中,载体字符组合中包括电子文档中的至少一个字符,字符为用于嵌入水印信息位串碎片的字符。
在可选的一种实施方式中,在Microsoft Office办公文档中,标识信息被设置在以下任一信息中:电子文档的标签、电子文档的可变Variables属性、不可见字符、排列Range对象。
在本实施例中,具体的,为了提高水印信息的实时嵌入的效率,很多情况不能将电子文档的全部字符作为载体字符,载体字符指的是用于嵌入水印信息位串碎片的字符。因此,需要事先指定载体字符的位置,即需要确定嵌有水印信息位串碎片的载体字符在电子文档中所处的位置。标定载体字符位置在嵌入水印前或者嵌入水印时进行,目的是为了提取水印时去除相关干扰水印信息,定位真正嵌入了水印的载体字符。
具体来说,首先已经预设了每一个水印信息位串碎片的标识信息;标识信息中包括了起始字符位置信息和结束字符位置信息,进而与起始字符位置信息和结束字符位置信息对应的字符为载体字符组合;或者,标识信息表征待嵌入了水印信息位串碎片的载体字符组合,即可以根据标识信息确定哪些载体字符组合需要被嵌入了水印信息位串碎片。
206、针对每一个水印信息位串碎片,根据水印信息位串碎片的标识信息,确定与水印信息位串碎片的标识信息对应的载体字符组合。
在本实施例中,具体的,由于每一个水印信息位串碎片的标识信息标识出了载体字符组合,进而可以依据每一个水印信息位串碎片的标识信息,确定与每一个水印信息位串碎片的标识信息对应的载体字符组合。
207、针对每一个水印信息位串碎片,确定与水印信息位串碎片的标识信息对应的载体字符组合,为每一个水印信息位串碎片对应的载体字符组合。
在本实施例中,具体的,在步骤206之后,就可以针对每一个水印信息位串碎片,步骤206确定出的载体字符组合,就是与水印信息位串碎片对应的载体字符组合。
标识信息被设置在以下任一信息中:电子文档的标签、电子文档的可变Variables属性、不可见字符、排列Range对象。举例来说,在Word类型的电子文档中,这四种方式可以如下。
举例来说,标识信息被设置在电子文档的标签中的时候,可以借助于Word的书签功能,在嵌入水印信息位串碎片的载体字符组合处生成一个书签,该书签用于标定连续嵌入水印信息位串碎片的起始字符位置和结束字符位置。
或者,举例来说,标识信息被设置在电子文档的Variables属性中的时候,Variables属性是Word类型的电子文档的内置属性,Variables属性可用来存储字符串值,Variables属性只能通过编程修改,不易被普通用户察觉。可以将连续嵌入水印信息位串碎片的起始字符和结束字符在电子文档所有字符中所处的序号,存储到Variables属性中,提取时便可根据这个序号找到相应的载体字符组合。
或者,举例来说,标识信息被设置在不可见字符中的时候,可在连续嵌入水印信息位串碎片的起始字符和结束字符处,分别插入两个不可见字符,后续在提取水印时先通过脚本代码找到这两个不可见字符。
或者,举例来说,标识信息被设置在Range对象中的时候,可以例如Range对象的一些特殊属性,如Range.NoProofing等,这类属性只能通过编程修改,不能通过人机交互界面修改。由于Word类型的电子文档在编辑的时候,自动继承上一个字符的所有属性的特点,因此若通过编程将某个字符的Range.NoProofing从默认值0改为1,则在此字符后添加的字符的Range.NoProofing值也会为1;因此不能简单地根据Range.NoProofing值为0还是1来判定此字符是否为嵌入水印信息位串碎片的字符。在本申请中,可以将Range.NoProofing设定为00或01,在Range.NoProofing为00的时候,说明当前字符上没有被嵌入水印信息位串碎片,在Range.NoProofing为01的时候,说明当前字符上被嵌入水印信息位串碎片。
208、针对每一个水印信息位串碎片,根据预设的排版格式属性数据库,其中,排版格式属性数据库中包括与不同的水印信息位串碎片对应的排版格式属性调整信息,确定水印信息位串碎片的排版格式属性调整信息。
在本实施例中,具体的,已经预设了排版格式属性数据库,在该排版格式属性数据库中包括与不同的水印信息位串碎片对应的排版格式属性调整信息。进而可以去确定出每一个水印信息位串碎片的排版格式属性调整信息。
在可选的一种实施方式中,排版格式属性信息为颜色信息,则排版格式属性数据库为颜色数据库;或者,排版格式属性信息为字符间距信息,则排版格式属性数据库为字符间距数据库;或者,排版格式属性信息为字符缩放信息,则排版格式属性数据库为字符缩放数据库;或者,排版格式属性信息为不可见字符信息,则排版格式属性数据库为不可见字符数据库;或者,排版格式属性信息为全/半角标点符号信息,则排版格式属性数据库为全/半角标点符号数据库。
209、针对每一个载体字符组合,通过修改载体字符组合的初始的排版格式属性信息、以及与载体字符组合对应的水印信息位串碎片的排版格式属性调整信息,确定载体字符组合的最终的排版格式属性信息。
在本实施例中,具体的,针对每一个载体字符组合,将载体字符组合的初始的排版格式属性信息、与排版格式属性调整信息进行结合,得到最终的排版格式属性信息。
2010、针对每一个载体字符组合,根据最终的排版格式属性信息调整载体字符组合的排版格式,以将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,以得到嵌入了溯源信息的电子文档。
在本实施例中,具体的,针对每一个载体字符组合,依据载体字符组合的最终的排版格式属性信息,去调整载体字符组合中各字符的排版格式,例如调整载体字符组合中各字符的颜色、字符间距、字符缩放等,进而将与载体字符组合对应的水印信息位串碎片嵌入到了载体字符组合中。在对每一个载体字符组合进行了以上处理之后,就将待嵌入到电子文档中的水印信息序列嵌入到了电子文档中,进而得到嵌入了溯源信息的电子文档。
举例来说,排版格式属性信息为颜色信息,颜色信息可以是以下的任意一种:字符颜色、下划线颜色和字符边框颜色。可以采用本申请中的基于颜色信息修改字符的排版格式属性的算法,算法如下所示。从原理上来说,根据人眼视觉细胞对颜色敏感度的理论,人眼对绿色最敏感.对红色次之,而对蓝色最不敏感;根据这一理论及对Word类型的电子文档中,字符颜色数据结构的分析,在保证嵌入了秘密信息的字符之后,字符颜色的改变不能被人眼察觉的情况下,达到较高的隐藏率。从而,可以对需要嵌入秘密信息的载体字符、即需要嵌入水印信息位串碎片的载体字符同时置换字符红绿蓝(Red green blue,简称RGB)颜色值中RGB低位的值,R分量改变最低1位比特位,G分量改变最低1位比特位,B分量改变最低2位比特位,这样每个载体字符可实现4位二进制数的隐藏。在Word类型的电子文档中的每一个字符,具有三个颜色属性值可利用,分别是字符颜色Font.Color、下划线颜色Font.UnderlineColor、字符边框颜色Font.Borders(wdBorderTop).Color,这些值都用一个32位有符号整数表示;这个32位整数的二进制表示串从低到高依次为R分量、G分量和B分量,每个分量各8位。除此之外的最高8位是一个特殊字节,为有限的几个值,通常全取0。另外,字符阴影前景颜色Font.Shading.ForegroundPatternColor也可用来嵌入水印信息,可在[0,224-1]范围内任意设置此值而不影响字符的外观,即不会被人眼察觉;但前提是Font.Shading.Texture为0,即阴影无纹理的情况下,进而任意设置阴影的前景色都不会改变字符显示效果;在默认情况下,每个字符的Font.Shading.Texture都为0;Font.Shading.ForegroundPatternColor都为-16777216,表示“自动颜色”,实质上值为0(黑色);Font.Shading.BackgroundPatternColor都为-16777216,表示“自动颜色”,实质上值为16777215(白色)。
具体来说,可以采用规则1,将水印信息位串碎片嵌入到载体字符组合中。在RGB颜色模型中,改变R分量最低1位比特位,改变G分量最低1位比特位,改变B分量最低2位比特位,这4个比特位就代表4bits的水印信息。如果将字符颜色、下划线颜色与字符边框颜色都利用上,则一个字符可嵌水印量为12bits。由于在水印信息位串碎片中嵌入了碎片位置信息,会牺牲一部分嵌入空间,如果前面提到1个字符的颜色空间有12bits可用来嵌水印,则可将这12bits分出一部分来标定碎片位置信息,具体分出多少bit要视水印信息序列的长度而定。在本申请中,若需要嵌入512bits的水印信息序列,则对于每一个水印信息位串碎片,需要分出7bits来标定碎片位置信息,其余5bits可用来嵌水印信息位串碎片,即将512bits的水印信息序列添加3bits的0以补足515bits,然后分成103份,每份5bits,嵌入一遍水印信息序列所需的字符个数为103个。
举例来说,排版格式属性信息为字符间距信息,可以采用单个字符隐藏1bit水印信息,这里的水印信息指的是水印信息位串碎片;在Word类型的电子文档中字符间距默认值为0,最小步长为0.05磅,人眼很难察觉到1磅以下的距离变化,因此可以利用字符间距小数点后第二位的0和5变化来嵌入水印信息位串碎片。
具体来说,可以采用规则2,将水印信息位串碎片嵌入到载体字符组合中。当间距小数点后第二位为0时代表二进制水印信息序列中的0;当间距小数点后第二位为5时代表二进制水印序列中的1;可以看到,这样定义后的一个字符的水印信息位串碎片的嵌入量为1bit。比如当某个字符间距为1磅时表示嵌入了1bit的值为0的水印信息位串碎片,为0.05磅时表示嵌入了1bit的值为1的水印信息位串碎片。若水印信息序列长度length(w)为512,则需要至少512个字符作为载体;同时由于前面定义的颜色信息的算法中,已经使得电子文档中每个字符默认为已嵌入水印信息位串碎片,因此需要选择一部分字符来6嵌入真正意义上的水印信息序列。
可以采用以下两种方法来实现嵌入。第一种为:确定了每一个载体字符组合的嵌入起始字符位置和结束字符位置,认为标定区间内的字符间距嵌入了水印信息位串碎片,标定区间外的字符间距不包含水印信息位串碎片。第二种为:对电子文档中所有字符进行分组,每组代表二进制水印信息序列中的一位,映射到同一组的字符嵌入相同的1bit水印信息位串碎片,需要的载体字符组合的总组数应等于length(w)。
举例来说,排版格式属性信息为字符间距信息,可以采用单个字符隐藏4bit水印信息。这种情况下,由于实验发现1磅以下的距离变化不易被察觉,而Word类型的电子文档的字符间距最小步长为0.05磅,因此字符间距调整空间较大,调整值可以0.05的间隔分布在[0,1)的区间上,共有20个值,分别是0.00、0.05、0.10、0.15…..0.90、0.95。在保持字符间距整数部分不变的前提下,改变字符间距小数部分为上述20个值中任意一个,因此可选择16个值来表示4bits的水印信息。
举例来说,排版格式属性信息为字符间距信息,可以采用规则3,将水印信息位串碎片嵌入到载体字符组合中:当字符间距小数点后两位为0.05时代表表二进制水印信息序列0000,为0.10时代表0001,为0.15时代表0010等;这样一个字符可以嵌入4bit的信息;可以采用表1所示的字符间距与水印信息位串碎片的对应关系,设定与不同水印信息位串碎片对应的字符间距。
表1字符间距与水印信息位串碎片的对应关系
字符间距的小数点后两位 代表的水印信息位串碎片
0.05 0000
0.10 0001
0.15 0010
0.20 0100
0.25 1000
0.30 0011
0.35 0110
0.40 1100
0.45 0101
0.50 1010
0.55 1001
0.60 0111
0.65 1110
0.70 1101
0.75 1011
0.80 1111
若水印信息序列长度length(w)为512,则需要的载体字符组合的总组数为length(w)/4组,当length(w)=512时,载体字符组合的总组数为128。即划分的组数越少,每个载体字符组合中的字符数越多,字符映射情况可能越均衡。
举例来说,排版格式属性信息为字符缩放信息。在Word类型的电子文档中字符缩放默认值为100%,最小步长为1%,并且对字体类型为“宋体or黑体or楷体”、字号为“小四or五号or初号”条件下的单个字符进行缩放的时候,可以确定出在字符初始缩放值为100%的前提下,改变缩放值为[100%,112%]区间中13个值中任意一个时不容易引人察觉,即人眼不可察觉字符间距的变;而在字符初始缩放值为任意百分比的前提下,只改变缩放值小数点后第二位为5,其余部分保持不变,也不容易引人注意。基于以上原理,可以采用规则4,将水印信息位串碎片嵌入到载体字符组合中:当字符缩放值小数点后第二位为5时,代表二进制水印信息序列中的1,即代表水印信息位串碎片中的1;当字符缩放值小数点后第二位不为5时,代表二进制水印序列中的0,即代表水印信息位串碎片中的0。可以确定,1个字符的水印嵌入量为1bit,举例来说,某个字符初始缩放值为1,即100%,则当改变该字符的缩放值为1.05时,表示嵌入了1bit的值为1的水印信息位串碎片,进而提取水印时发现其缩放值为1.07,则表示此时嵌入的1bit水印信息位串碎片的值为0。在嵌入和提取算法上,与基于字符间距的“单个字符隐藏1bit水印信息”方法相同。
2011、根据预设的与排版格式属性信息对应的反向规则,识别嵌入了溯源信息的电子文档中的各水印信息位串碎片。
在本实施例中,具体的,根据各水印信息位串碎片的标识信息,确定嵌入了水印信息位串碎片的载体字符组合。然后对各载体字符组合进行识别,具体来说,可以依据预设的与排版格式属性信息对应的反向规则,去对各载体字符组合进行识别。
例如,针对每一个载体字符组合,确定出载体字符组合的最终的排版格式属性信息,该最终的排版格式属性信息为电子文档中载体字符的排版格式;然后,通过修改载体字符组合的最终的排版格式属性信息、以及与载体字符组合对应的水印信息位串碎片的排版格式属性调整信息,确定出载体字符组合的初始的排版格式属性信息;然后,根据预设的排版格式属性数据库,确定出与排版格式属性调整信息对应的水印信息位串碎片。对每一个载体字符组合执行以上过程,进而识别出各水印信息位串碎片。
2012、根据各水印信息位串碎片,确定电子文档的溯源信息。
在本实施例中,具体的,由于各水印信息位串碎片表征了溯源信息,进而可以确定出电子文档的溯源信息。
举例来说,若在步骤208-2010中,排版格式属性信息为颜色信息,采用了本申请中的基于颜色信息修改字符的排版格式属性的算法。则在提取水印信息序列的时候,首先需要根据各水印信息位串碎片的标识信息,找到各载体字符组合的位置,即找到嵌入水印的字符位置,进而确定出了各载体字符组合;然后提取12bits的水印信息位串碎片,按嵌入时的方法计算其中7bits信息的值,代表此水印信息位串碎片在整个水印信息序列中的位置,然后提取其余5bits的信息作为候选;因为此前水印已冗余嵌入,因此需要通过投票策略来最终确定载体字符组合的位置上的水印信息位串碎片,具体来说,是由于已经在电子文档中多次嵌入了水印信息序列,进而需要采用投票策略来最终确定载体字符组合的位置上的水印信息位串碎片;最后将这些水印信息位串碎片,依次组合成水印信息w,然后,根据预设的与排版格式属性信息对应的反向规则,识别出各水印信息位串碎片中的溯源信息。
举例来说,若在步骤208-2010中,排版格式属性信息为字符信息,可以采用以下两种方法来实现嵌入和提取:第一种为,确定了每一个载体字符组合的嵌入起始字符位置和结束字符位置,认为标定区间内的字符间距嵌入了水印信息位串碎片,标定区间外的字符间距不包含水印信息位串碎片。进而在提取水印时可以找到标定标记,再对标定区间内的字符进行水印提取;可以根据预先加入的校验码去验证提取的水印是否有效。第二种为:对电子文档中所有字符进行分组,每组代表二进制水印信息序列中的一位,映射到同一组的字符嵌入相同的1bit水印信息位串碎片,需要的载体字符组合的总组数应等于length(w);进而在提取水印时,可以按嵌入水印时的分组方法先对电子文档中所有字符进行分组,然后提取各字符水印信息位串碎片,之后采用投票方法确定各组代表的1bit水印信息位串碎片。这种方法对抵抗文档内容的部分增加、删除及修改攻击比较有效,要求分组方法的均衡性好。
本实施例通过获取初始水印信息序列,其中,初始水印信息序列中包括电子文档的溯源信息;根据预设的密钥和预设的校验码,对初始水印信息序列进行安全保护处理,生成安全保护处理后的初始水印信息序列;将安全保护处理后的初始水印信息序列,划分为多个水印信息位串碎片;针对于每一个水印信息位串碎片,在水印信息位串碎片中添加碎片位置信息,得到待嵌入到电子文档中的水印信息序列,其中,碎片位置信息表征了水印信息位串碎片在待嵌入到电子文档中的水印信息序列中的位置;获取各水印信息位串碎片的标识信息,其中,标识信息中包括了起始字符位置信息和结束字符位置信息,或者,标识信息表征待嵌入了水印信息位串碎片的载体字符组合;针对每一个水印信息位串碎片,根据水印信息位串碎片的标识信息,确定与水印信息位串碎片的标识信息对应的载体字符组合;针对每一个水印信息位串碎片,确定与水印信息位串碎片的标识信息对应的载体字符组合,为每一个水印信息位串碎片对应的载体字符组合;针对每一个水印信息位串碎片,根据预设的排版格式属性数据库,其中,排版格式属性数据库中包括与不同的水印信息位串碎片对应的排版格式属性调整信息,确定水印信息位串碎片的排版格式属性调整信息;针对每一个载体字符组合,通过修改载体字符组合的初始的排版格式属性信息、以及与载体字符组合对应的水印信息位串碎片的排版格式属性调整信息,确定载体字符组合的最终的排版格式属性信息;针对每一个载体字符组合,根据最终的排版格式属性信息调整载体字符组合的排版格式,以将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中。进而通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,可以将电子文档的溯源信息添加到电子文档中,进而可以获知没有加密的电子文档的溯源信息,对没有加密的电子文档进行溯源,一旦电子文档被泄露出去之后,可以确认出电子文档的溯源信息,进行责任认定;并且由于水印信息位串碎片为被安全保护处理过,进而将水印信息位串碎片添加到电子文档之后,水印信息位串碎片不会被轻易获取到;并且,由于对电子文档的字符的颜色、字符间距、字符缩放、不可见字符、全/半角标点符号进行调整,进而水印信息位串碎片在电子文档中是不可见的,即表征了溯源信息的水印信息是不可见的。
图3为本发明实施例提供的一种电子文档的处理装置的结构示意图,如图3所示,本实施例的装置可以包括:
获取模块31,用于获取待嵌入到电子文档中的水印信息序列,其中,水印信息序列中包括至少一个水印信息位串碎片,水印信息位串碎片表征了电子文档的溯源信息,且水印信息位串碎片为被安全保护处理过的水印信息位串碎片;
设定模块32,用于设定与各水印信息位串碎片分别对应的载体字符组合,其中,载体字符组合中包括电子文档中的至少一个字符,字符为用于嵌入水印信息位串碎片的字符;
嵌入模块33,用于针对每一个载体字符组合,通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,以得到嵌入了溯源信息的电子文档。
本实施例的电子文档的处理装置可执行本发明实施例提供的一种电子文档的处理方法,其实现原理相类似,此处不再赘述。
本实施例通过获取待嵌入到电子文档中的水印信息序列,其中,水印信息序列中包括至少一个水印信息位串碎片,水印信息位串碎片表征了电子文档的溯源信息,且水印信息位串碎片为被安全保护处理过的水印信息位串碎片;设定与各水印信息位串碎片分别对应的载体字符组合,其中,载体字符组合中包括电子文档中的至少一个字符,字符为用于嵌入水印信息位串碎片的字符;针对每一个载体字符组合,通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,以得到嵌入了溯源信息的电子文档。进而通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,可以将电子文档的溯源信息添加到电子文档中,进而可以获知没有加密的电子文档的溯源信息,对没有加密的电子文档进行溯源,一旦电子文档被泄露出去之后,可以确认出电子文档的溯源信息,进行责任认定;并且由于水印信息位串碎片为被安全保护处理过,进而将水印信息位串碎片添加到电子文档之后,水印信息位串碎片不会被轻易获取到。
图4为本发明实施例提供的另一种电子文档的处理装置的结构示意图,如图4所示,本实施例的装置中,获取模块31,包括:
第一获取子模块311,用于获取初始水印信息序列,其中,初始水印信息序列中包括电子文档的溯源信息;
处理子模块312,用于根据预设的密钥和预设的校验码,对初始水印信息序列进行安全保护处理,生成安全保护处理后的初始水印信息序列;
划分子模块313,用于将安全保护处理后的初始水印信息序列,划分为多个水印信息位串碎片;
添加子模块314,用于针对于每一个水印信息位串碎片,在水印信息位串碎片中添加碎片位置信息,得到待嵌入到电子文档中的水印信息序列,其中,碎片位置信息表征了水印信息位串碎片在待嵌入到电子文档中的水印信息序列中的位置。
设定模块32,包括:
第二获取子模块321,用于获取各水印信息位串碎片的标识信息,其中,标识信息中包括了起始字符位置信息和结束字符位置信息,或者,标识信息表征待嵌入了水印信息位串碎片的载体字符组合;
第一确定子模块322,用于针对每一个水印信息位串碎片,根据水印信息位串碎片的标识信息,确定与水印信息位串碎片的标识信息对应的载体字符组合;
第二确定子模块323,用于针对每一个水印信息位串碎片,确定与水印信息位串碎片的标识信息对应的载体字符组合,为每一个水印信息位串碎片对应的载体字符组合。
标识信息被设置在以下任一信息中:
电子文档的标签、电子文档的可变Variables属性、不可见字符、排列Range对象。
嵌入模块33,包括:
第三确定子模块331,用于针对每一个水印信息位串碎片,根据预设的排版格式属性数据库,其中,排版格式属性数据库中包括与不同的水印信息位串碎片对应的排版格式属性调整信息,确定水印信息位串碎片的排版格式属性调整信息;
第四确定子模块332,用于针对每一个载体字符组合,通过修改载体字符组合的初始的排版格式属性信息、以及与载体字符组合对应的水印信息位串碎片的排版格式属性调整信息,确定载体字符组合的最终的排版格式属性信息;
调整子模块333,用于针对每一个载体字符组合,根据最终的排版格式属性信息调整载体字符组合的排版格式,以将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中。
排版格式属性信息为颜色信息,则排版格式属性数据库为颜色数据库;
或者,排版格式属性信息为字符间距信息,则排版格式属性数据库为字符间距数据库;
或者,排版格式属性信息为字符缩放信息,则排版格式属性数据库为字符缩放数据库;
或者,排版格式属性信息为不可见字符信息,则排版格式属性数据库为不可见字符数据库;
或者,排版格式属性信息为全/半角标点符号信息,则排版格式属性数据库为全/半角标点符号数据库。
本实施例提供的装置,还包括:
识别模块41,用于嵌入模块33在针对每一个载体字符组合,通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,以得到嵌入了溯源信息的电子文档之后,根据预设的与排版格式属性信息对应的反向规则,识别嵌入了溯源信息的电子文档中的各水印信息位串碎片;
确定模块42,用于根据各水印信息位串碎片,确定电子文档的溯源信息。
本实施例的电子文档的处理装置可执行本发明实施例提供的另一种电子文档的处理方法,其实现原理相类似,此处不再赘述。
本实施例通过获取初始水印信息序列,其中,初始水印信息序列中包括电子文档的溯源信息;根据预设的密钥和预设的校验码,对初始水印信息序列进行安全保护处理,生成安全保护处理后的初始水印信息序列;将安全保护处理后的初始水印信息序列,划分为多个水印信息位串碎片;针对于每一个水印信息位串碎片,在水印信息位串碎片中添加碎片位置信息,得到待嵌入到电子文档中的水印信息序列,其中,碎片位置信息表征了水印信息位串碎片在待嵌入到电子文档中的水印信息序列中的位置;获取各水印信息位串碎片的标识信息,其中,标识信息中包括了起始字符位置信息和结束字符位置信息,或者,标识信息表征待嵌入了水印信息位串碎片的载体字符组合;针对每一个水印信息位串碎片,根据水印信息位串碎片的标识信息,确定与水印信息位串碎片的标识信息对应的载体字符组合;针对每一个水印信息位串碎片,确定与水印信息位串碎片的标识信息对应的载体字符组合,为每一个水印信息位串碎片对应的载体字符组合;针对每一个水印信息位串碎片,根据预设的排版格式属性数据库,其中,排版格式属性数据库中包括与不同的水印信息位串碎片对应的排版格式属性调整信息,确定水印信息位串碎片的排版格式属性调整信息;针对每一个载体字符组合,通过修改载体字符组合的初始的排版格式属性信息、以及与载体字符组合对应的水印信息位串碎片的排版格式属性调整信息,确定载体字符组合的最终的排版格式属性信息;针对每一个载体字符组合,根据最终的排版格式属性信息调整载体字符组合的排版格式,以将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中。进而通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,可以将电子文档的溯源信息添加到电子文档中,进而可以获知没有加密的电子文档的溯源信息,对没有加密的电子文档进行溯源,一旦电子文档被泄露出去之后,可以确认出电子文档的溯源信息,进行责任认定;并且由于水印信息位串碎片为被安全保护处理过,进而将水印信息位串碎片添加到电子文档之后,水印信息位串碎片不会被轻易获取到;并且,由于对电子文档的字符的颜色、字符间距、字符缩放、不可见字符、全/半角标点符号进行调整,进而水印信息位串碎片在电子文档中是不可见的,即表征了溯源信息的水印信息是不可见的。
图5是根据一示例性实施例示出的一种终端设备的框图,该设备可以是移动终端,计算机,数字广播终端,消息收发设备,个人数字助理等。
装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当该存储介质中的指令由终端设备的处理器执行时,使得终端设备能够执行上述电子文档的处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims (13)

1.一种电子文档的处理方法,其特征在于,包括:
获取待嵌入到电子文档中的水印信息序列,其中,所述水印信息序列中包括至少一个水印信息位串碎片,所述水印信息位串碎片表征了所述电子文档的溯源信息,且所述水印信息位串碎片为被安全保护处理过的水印信息位串碎片;
设定与各水印信息位串碎片分别对应的载体字符组合,其中,所述载体字符组合中包括所述电子文档中的至少一个字符,所述字符为用于嵌入水印信息位串碎片的字符;
针对每一个所述载体字符组合,通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,以得到嵌入了溯源信息的电子文档。
2.根据权利要求1所述的方法,其特征在于,所述获取待嵌入到电子文档中的水印信息序列,包括:
获取初始水印信息序列,其中,所述初始水印信息序列中包括所述电子文档的溯源信息;
根据预设的密钥和预设的校验码,对所述初始水印信息序列进行安全保护处理,生成安全保护处理后的初始水印信息序列;
将所述安全保护处理后的初始水印信息序列,划分为多个水印信息位串碎片;
针对于每一个水印信息位串碎片,在水印信息位串碎片中添加碎片位置信息,得到所述待嵌入到电子文档中的水印信息序列,其中,所述碎片位置信息表征了水印信息位串碎片在所述待嵌入到电子文档中的水印信息序列中的位置。
3.根据权利要求1所述的方法,其特征在于,所述设定与各水印信息位串碎片分别对应的载体字符组合,包括:
获取各水印信息位串碎片的标识信息,其中,所述标识信息中包括了起始字符位置信息和结束字符位置信息,或者,所述标识信息表征待嵌入水印信息位串碎片的载体字符组合;
针对每一个水印信息位串碎片,根据水印信息位串碎片的标识信息,确定与水印信息位串碎片的标识信息对应的载体字符组合;
针对每一个水印信息位串碎片,确定与水印信息位串碎片的标识信息对应的载体字符组合,为每一个水印信息位串碎片对应的载体字符组合。
4.根据权利要求3所述的方法,其特征在于,所述标识信息被设置在以下任一信息中:
电子文档的标签、电子文档的可变Variables属性、不可见字符、排列Range对象。
5.根据权利要求1所述的方法,其特征在于,所述针对每一个所述载体字符组合,通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,包括:
针对每一个水印信息位串碎片,根据预设的排版格式属性数据库,其中,所述排版格式属性数据库中包括与不同的水印信息位串碎片对应的排版格式属性调整信息,确定水印信息位串碎片的排版格式属性调整信息;
针对每一个载体字符组合,通过修改载体字符组合的初始的排版格式属性信息、以及与载体字符组合对应的水印信息位串碎片的排版格式属性调整信息,确定载体字符组合的最终的排版格式属性信息;
针对每一个载体字符组合,根据所述最终的排版格式属性信息调整载体字符组合的排版格式,以将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中。
6.根据权利要求5所述的方法,其特征在于,所述排版格式属性信息为颜色信息,则所述排版格式属性数据库为颜色数据库;
或者,所述排版格式属性信息为字符间距信息,则所述排版格式属性数据库为字符间距数据库;
或者,所述排版格式属性信息为字符缩放信息,则所述排版格式属性数据库为字符缩放数据库;
或者,所述排版格式属性信息为不可见字符信息,则所述排版格式属性数据库为不可见字符数据库;
或者,所述排版格式属性信息为全/半角标点符号信息,则所述排版格式属性数据库为全/半角标点符号数据库。
7.根据权利要求1-6任一项所述的方法,其特征在于,在针对每一个所述载体字符组合,通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,以得到嵌入了溯源信息的电子文档之后,包括:
根据预设的与排版格式属性信息对应的反向规则,识别所述嵌入了溯源信息的电子文档中的各水印信息位串碎片;
根据所述各水印信息位串碎片,确定所述电子文档的溯源信息。
8.一种电子文档的处理装置,其特征在于,包括:
获取模块,用于获取待嵌入到电子文档中的水印信息序列,其中,所述水印信息序列中包括至少一个水印信息位串碎片,所述水印信息位串碎片表征了所述电子文档的溯源信息,且所述水印信息位串碎片为被安全保护处理过的水印信息位串碎片;
设定模块,用于设定与各水印信息位串碎片分别对应的载体字符组合,其中,所述载体字符组合中包括所述电子文档中的至少一个字符,所述字符为用于嵌入水印信息位串碎片的字符;
嵌入模块,用于针对每一个所述载体字符组合,通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,以得到嵌入了溯源信息的电子文档。
9.根据权利要求8所述的装置,其特征在于,所述获取模块,包括:
第一获取子模块,用于获取初始水印信息序列,其中,所述初始水印信息序列中包括所述电子文档的溯源信息;
处理子模块,用于根据预设的密钥和预设的校验码,对所述初始水印信息序列进行安全保护处理,生成安全保护处理后的初始水印信息序列;
划分子模块,用于将所述安全保护处理后的初始水印信息序列,划分为多个水印信息位串碎片;
添加子模块,用于针对于每一个水印信息位串碎片,在水印信息位串碎片中添加碎片位置信息,得到所述待嵌入到电子文档中的水印信息序列,其中,所述碎片位置信息表征了水印信息位串碎片在所述待嵌入到电子文档中的水印信息序列中的位置。
10.根据权利要求8所述的装置,其特征在于,所述设定模块,包括:
第二获取子模块,用于获取各水印信息位串碎片的标识信息,其中,所述标识信息中包括了起始字符位置信息和结束字符位置信息,或者,所述标识信息表征待嵌入了水印信息位串碎片的载体字符组合;
第一确定子模块,用于针对每一个水印信息位串碎片,根据水印信息位串碎片的标识信息,确定与水印信息位串碎片的标识信息对应的载体字符组合;
第二确定子模块,用于针对每一个水印信息位串碎片,确定与水印信息位串碎片的标识信息对应的载体字符组合,为每一个水印信息位串碎片对应的载体字符组合。
11.根据权利要求8所述的装置,其特征在于,所述嵌入模块,包括:
第三确定子模块,用于针对每一个水印信息位串碎片,根据预设的排版格式属性数据库,其中,所述排版格式属性数据库中包括与不同的水印信息位串碎片对应的排版格式属性调整信息,确定水印信息位串碎片的排版格式属性调整信息;
第四确定子模块,用于针对每一个载体字符组合,通过修改载体字符组合的初始的排版格式属性信息、以及与载体字符组合对应的水印信息位串碎片的排版格式属性调整信息,确定载体字符组合的最终的排版格式属性信息;
调整子模块,用于针对每一个载体字符组合,根据所述最终的排版格式属性信息调整载体字符组合的排版格式,以将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中。
12.根据权利要求11所述的装置,其特征在于,所述排版格式属性信息为颜色信息,则所述排版格式属性数据库为颜色数据库;
或者,所述排版格式属性信息为字符间距信息,则所述排版格式属性数据库为字符间距数据库;
或者,所述排版格式属性信息为字符缩放信息,则所述排版格式属性数据库为字符缩放数据库;
或者,所述排版格式属性信息为不可见字符信息,则所述排版格式属性数据库为不可见字符数据库;
或者,所述排版格式属性信息为全/半角标点符号信息,则所述排版格式属性数据库为全/半角标点符号数据库。
13.根据权利要求8-12任一项所述的装置,其特征在于,所述装置,还包括:
识别模块,用于所述嵌入模块在针对每一个所述载体字符组合,通过修改载体字符组合的排版格式属性信息,将与载体字符组合对应的水印信息位串碎片嵌入到载体字符组合中,以得到嵌入了溯源信息的电子文档之后,根据预设的与排版格式属性信息对应的反向规则,识别所述嵌入了溯源信息的电子文档中的各水印信息位串碎片;
确定模块,用于根据所述各水印信息位串碎片,确定所述电子文档的溯源信息。
CN201710960469.3A 2017-10-16 2017-10-16 电子文档的处理方法和装置 Pending CN109670281A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710960469.3A CN109670281A (zh) 2017-10-16 2017-10-16 电子文档的处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710960469.3A CN109670281A (zh) 2017-10-16 2017-10-16 电子文档的处理方法和装置

Publications (1)

Publication Number Publication Date
CN109670281A true CN109670281A (zh) 2019-04-23

Family

ID=66139347

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710960469.3A Pending CN109670281A (zh) 2017-10-16 2017-10-16 电子文档的处理方法和装置

Country Status (1)

Country Link
CN (1) CN109670281A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110110540A (zh) * 2019-05-13 2019-08-09 成都中医药大学 一种基于excel文件的信息隐写方法及装置
CN111177666A (zh) * 2019-12-30 2020-05-19 北京天威诚信电子商务服务有限公司 基于脆弱水印的司法文书防伪防篡改方法及系统
CN111400670A (zh) * 2020-03-06 2020-07-10 全球能源互联网研究院有限公司 一种水印添加方法、装置、设备及存储介质
CN113688598A (zh) * 2021-08-24 2021-11-23 吉林亿联银行股份有限公司 一种pdf文件处理方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1924925A (zh) * 2006-09-28 2007-03-07 北京理工大学 一种文档数字水印嵌入方法
JP2009278181A (ja) * 2008-05-12 2009-11-26 Canon Inc 電子透かし情報埋め込み装置及び方法、並びに、電子透かし情報抽出装置及び方法
CN102930186A (zh) * 2012-10-30 2013-02-13 南京信息工程大学 一种基于属性样式变换的oox文档数字水印方法
CN103049682A (zh) * 2013-01-28 2013-04-17 上海理工大学 一种基于字符间距编码的双重水印嵌入的文本水印方法
CN103500296A (zh) * 2013-09-29 2014-01-08 北京溯源鸿业科技有限公司 一种文本文档中数字水印的嵌入方法和装置
CN104346321A (zh) * 2013-07-31 2015-02-11 北大方正集团有限公司 一种文本中数字水印信息的嵌入和提取方法及装置
CN104850765A (zh) * 2014-02-19 2015-08-19 中国移动通信集团福建有限公司 一种水印处理方法、装置及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1924925A (zh) * 2006-09-28 2007-03-07 北京理工大学 一种文档数字水印嵌入方法
JP2009278181A (ja) * 2008-05-12 2009-11-26 Canon Inc 電子透かし情報埋め込み装置及び方法、並びに、電子透かし情報抽出装置及び方法
CN102930186A (zh) * 2012-10-30 2013-02-13 南京信息工程大学 一种基于属性样式变换的oox文档数字水印方法
CN103049682A (zh) * 2013-01-28 2013-04-17 上海理工大学 一种基于字符间距编码的双重水印嵌入的文本水印方法
CN104346321A (zh) * 2013-07-31 2015-02-11 北大方正集团有限公司 一种文本中数字水印信息的嵌入和提取方法及装置
CN103500296A (zh) * 2013-09-29 2014-01-08 北京溯源鸿业科技有限公司 一种文本文档中数字水印的嵌入方法和装置
CN104850765A (zh) * 2014-02-19 2015-08-19 中国移动通信集团福建有限公司 一种水印处理方法、装置及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110110540A (zh) * 2019-05-13 2019-08-09 成都中医药大学 一种基于excel文件的信息隐写方法及装置
CN111177666A (zh) * 2019-12-30 2020-05-19 北京天威诚信电子商务服务有限公司 基于脆弱水印的司法文书防伪防篡改方法及系统
CN111400670A (zh) * 2020-03-06 2020-07-10 全球能源互联网研究院有限公司 一种水印添加方法、装置、设备及存储介质
CN111400670B (zh) * 2020-03-06 2023-12-15 全球能源互联网研究院有限公司 一种水印添加方法、装置、设备及存储介质
CN113688598A (zh) * 2021-08-24 2021-11-23 吉林亿联银行股份有限公司 一种pdf文件处理方法及系统

Similar Documents

Publication Publication Date Title
CN109670281A (zh) 电子文档的处理方法和装置
US9331856B1 (en) Systems and methods for validating digital signatures
US10755375B2 (en) Systems and methods for steganography based on text fonts
US9160719B2 (en) Hiding ciphertext using a linguistics algorithm with dictionaries
US8578473B2 (en) Systems and methods for information security using one-time pad
US9652704B2 (en) Method of providing content transmission service by using printed matter
US7793108B2 (en) Method of creating password schemes for devices
CN107239713B (zh) 一种敏感内容数据信息防护方法和系统
AU2013101034A4 (en) Registration and authentication of computing devices using a digital skeleton key
US10922435B2 (en) Image encryption method, image viewing method, system, and terminal
WO2016107024A1 (zh) 一种信息保护、显示方法、信息保护、显示装置及终端
CN113206737A (zh) 语音通信加密方法、解密方法及其装置
CN110659512A (zh) 图片管理方法、装置、终端及存储介质
KR101281574B1 (ko) 광학코드 암호화 방법
CN104023332A (zh) 一种电子终端及其短信加密、解密方法
TW201743233A (zh) 終端設備密碼解鎖方法、裝置和終端設備
CN103714297A (zh) 用于保护终端中的数据的设备和方法
WO2016057161A1 (en) Text-based thumbnail generation
US20150286843A1 (en) Method and system for modular digital watermarking of electronic files
CN111222611B (zh) 一种基于颜色的堆叠式三维码编码方法、编码装置、解码方法、解码装置以及存储介质
CN109408652A (zh) 一种图片搜索方法、装置及设备
CN101488172A (zh) 文档笔迹加解密方法及其应用终端
EP2068321A2 (en) Forgery-proof digital sound recording device
CN107992768A (zh) 一种信息保护的方法、终端设备及存储介质
KR102108192B1 (ko) 워터마크 삽입 방법, 장치 및 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230331

Address after: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Applicant after: Peking University

Address before: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Applicant before: Peking University

Applicant before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Applicant before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

TA01 Transfer of patent application right