CN102968596A - 一种基于删除标记的oox文档数字水印方法 - Google Patents

一种基于删除标记的oox文档数字水印方法 Download PDF

Info

Publication number
CN102968596A
CN102968596A CN2012104247540A CN201210424754A CN102968596A CN 102968596 A CN102968596 A CN 102968596A CN 2012104247540 A CN2012104247540 A CN 2012104247540A CN 201210424754 A CN201210424754 A CN 201210424754A CN 102968596 A CN102968596 A CN 102968596A
Authority
CN
China
Prior art keywords
document
oox
watermark
property value
xml file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012104247540A
Other languages
English (en)
Inventor
付章杰
孙星明
周璐
束建钢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN2012104247540A priority Critical patent/CN102968596A/zh
Publication of CN102968596A publication Critical patent/CN102968596A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提出了一种基于删除标记的OOX文档数字水印方法,通过向OOX文本文档包中主文档部件增加删除修改标识符的方法,把水印信息嵌入到OOX文档中去,使得水印信息与文档的格式信息相结合,提高了水印的鲁棒性和嵌入容量,可有效的抵抗“删除文本内容”、“编辑”、“另存为”、“清除格式”等针对文本内容的攻击。因此,本发明所提出的基于删除标记的OOX文档数字水印方案为OOX文本内容认证与版权保护提供了新的关键技术,改进了数字水印技术一直存在的鲁棒性差的问题,为数字水印技术的进一步推广应用提供了理论基础和方法支持。

Description

一种基于删除标记的OOX文档数字水印方法
技术领域
本发明属于计算机文本版权保护技术领域,尤指一种基于删除标记的OOX文档数字水印方法。
背景技术
Office Open XML(OOX)格式是Microsoft公司发布的office2007-2010产品所采用的新格式标准,它是互联网上最流行的文本格式之一。OOX文档发布以来,它的使用范围和使用频率急速增加,很多企事业单位的重要机密文件资料都是以这种新文本文档格式保存的,并在互联网上进行传播。不法分子未经同意大量复制甚至篡改他人的文本资料,并宣称拥有版权。这给相关单位和个人带来了极大的损失。面对日益严峻的信任危机,迫切需要行之有效的文本版权保护技术,辅助人们鉴定文本版权的真正所有者,打击盗版以及未经授权的篡改,确保公共信息秩序、打击犯罪、维护司法公正和新闻诚信。文本数字水印技术是近年发展起来的文本安全新技术,在版权保护、泄密追踪等方面有广阔的应用前景。
文本是信息交流的一种重要手段,由于它可以承载水印的冗余信息非常有限,并且容易受到攻击,所以对文本水印的研究相对较少,且都没有研究如何保护OOX格式文档的版权。我们提出了一种基于删除标记的OOX文档数字水印方法,通过向OOX文本文档包中有关部件增加删除修改标识符的方法,把水印信息嵌入到有关部件中去,可有效保护OOX格式文档的版权。
基于删除标记的OOX文档数字水印方法是在OOX文档包的主文档部件中实现的,在ZIP程序中打开一个正常的OOX文档即可看到这些部件。
每一个电子文档都不可避免的被编辑很多次直到最终版本的形成。这些修改编辑行为包括删除、插入、格式修改等。针对OOX格式文档的每一次修改行为都会产生一定的痕迹,这些痕迹会被主文档等部件中的修改标识符(Revision Identifiers)及其属性值所记录。属性w:rsidP,w:rsidR,w:rsidRPr,w:rsidRDefault和w:rsidDel就是修改标识符。这些修改标识符是由w:p元素或w:r元素所定义的,它们的属性值是由随机的8位16进制数组成的。其中w:rsidDel叫做删除修改标识符,一般不出现在主文档部件中。
删除修改标识符w:rsidDel可以被添加到主文档部件的w:r元素中,其属性值能用来隐藏编码后的水印信息,这种变化不会影响文档的使用。一般来说,绝大多数修改标识符属性值的前两位都是以“00”开头的,最后6位是随机产生的。因此,水印信息经编码转换为16进制数后可以嵌入到删除修改标识符属性值的最后6位中去。每一个w:r元素可添加一个删除修改标识符,即可隐藏6位16进制数,即24位水印信息。
发明内容
本发明提出了一种基于删除标记的OOX文档数字水印方法,通过向OOX文本文档包中有关部件增加删除修改标识符的方法,把水印信息嵌入到有关部件中去,使得水印信息与文档的格式信息相结合,提高了水印的鲁棒性和嵌入容量,可有效的抵抗针对文本内容的攻击,从而实现了一种有效的OOX文档版权保护方法。
为解决以上技术问题,本发明采用如下方案:
一种基于删除标记的OOX文档数字水印方法,所述方法包括水印嵌入方法和水印提取方法,分别包括下列步骤:
水印嵌入方法具体步骤为:
(1)首先读取OOX格式文档包中的主文档部件document.xml文件,并提取出所述document.xml文件中的各个节点下的元素、属性和属性值;
(2)针对每一段落,提取w:r元素,然后将删除修改标识符w:rsidDel以及6位16进制的水印信息添加到w:r元素中;
(3)重复步骤(2)直到所有水印信息嵌入完成;
(4)添加已嵌入水印的主文档部件document.xml到原OOX文档包中;
水印提取方法步骤为:
(5)首先读取OOX格式文档包中的主文档部件document.xml文件,并提取出所述document.xml文件中的各个节点下的元素、属性和属性值;
(6)针对每一段落,提取w:r元素,并提取w:r元素中的删除修改标识符w:rsidDel属性值的后六位;
(7)重复步骤(6)直到所有w:r元素中的删除修改标识符w:rsidDel属性值提取完成,即水印信息提取完成。
本发明的有益效果:本发明实施例针对OOX格式文本文档提出了一种基于删除标记的OOX文档数字水印方法,通过向OOX文本文档包中主文档部件增加删除修改标识符的方法,把水印信息嵌入到OOX文档中去,使得水印信息与文档的格式信息相结合,提高了水印的鲁棒性和嵌入容量,可有效的抵抗“删除文本内容”、“编辑”、“另存为”、“清除格式”等针对文本内容的攻击。因此,本发明所提出的基于删除标记的OOX文档数字水印方案为OOX文本内容认证与版权保护提供了新的关键技术,改进了数字水印技术一直存在的鲁棒性差的问题,为数字水印技术的进一步推广应用提供了理论基础和方法支持。
附图说明
图1为水印嵌入前的主文档部件“document.xml”中的部分代码。
图2为水印嵌入后的主文档部件“document.xml”中的部分代码。
图3水印嵌入流程图。
图4水印提取流程图。
具体实施方式
为使本发明的目的、技术方案更加清晰,下面结合附图对本发明实施例所提出的基于删除标记的OOX文档数字水印算法进行详细说明。
OOX格式文档的每一次修改行为都会产生一定的痕迹,这些痕迹会被主文档等部件中的修改标识符(Revision Identifiers)及其属性值所记录。如图1所示,w:rsidP,w:rsidR,w:rsidRPr,w:rsidRDefault就是修改标识符。这些修改标识符是由w:p元素或w:r元素所定义的,它们的属性值是由随机的8位16进制数组成。图1是嵌入水印前的主文档部件“document.xml”中的部分代码,图2是嵌入水印后的主文档部件“document.xml”中的部分代码,其中w:rsidDel叫做删除修改标识符。
基于添加删除修改标识符的数字水印嵌入算法流程如图3,步骤如下:
输入:原始载体文档D,原始水印信息M,私钥k;输出:隐写文档S;
步骤1:利用私钥k和非对称加密算法RSA,对原始水印信息进行加密,得到加密后的水印信息I':I'=E(k,I),并将之转换为16进制编码H=H1H2...Hi...;
步骤2:计算H的16进制编码长度len(H),并将len(H)转换为16进制数据附加在H前面得到A′;
步骤3:利用XML文档解析技术,从原始载体文档D的ZIP包中读取主文档部件“document.xml”的所有内容给C:C=C1C2...Ci...;读取setting部件的所有内容给G:G=G1G2...Gi...;
步骤4:从C:C=C1C2...Ci...中提取一对run元素“<w:r></w:r>”给R;
步骤5:增加一个删除修改标识符及其属性值到R中;
步骤6:从H=H1H2...Hi...中读取6位16进制信息,替换步骤5增加的删除修改标识符属性值的后六位;
步骤7:如果所有的run元素“<w:r></w:r>”都增加了删除修改标识符,而水印信息还没有嵌完,则向setting部件G:G=G1G2...Gi...中增加一个修改标识符rsid及其属性值,该属性值的前4位16进制数都用“0”代替,并从H=H1H2...Hi...中读取4位16进制信息,替换所述修改标识符rsid属性值的后4位;
步骤8:向setting部件G:G=G1G2...Gi...中增加一个文档变量属性docVar,并读取8位16进制水印信息来作为其属性值;
步骤9:重复步骤4到步骤8,直到编码后的水印信息完全嵌入为止。
基于冗余属性的数字水印提取算法流程如图4,步骤如下:
输入:含水印信息文档S,私钥k;输出:水印信息M;
步骤10:利用XML文档解析技术,从含水印信息文档S的ZIP包中读取主文档部件“document.xml”的所有内容给C:C=C1C2...Ci...;读取setting部件的所有内容给G:G=G1G2...Gi...;
步骤11:依次读取run元素中含有的删除修改标识符属性值的后六位16进制数给M;
步骤12:读取setting部件G:G=G1G2...Gi...中的以“0000”开头的修改标识符及其属性值,并把该属性值的后四位数据增加到M中;
步骤13:读取setting部件G:G=G1G2...Gi...中的以rsid开头的文档变量,并把该变量的属性值信息赋给M;
步骤14:重复步骤12到步骤13,直到所有的数字水印信息被提取出来;
步骤15:利用私钥k和非对称加密算法RSA,对水印信息M进行解密,得到解密后的信息I:I=D(k,I′)。
以上所述实施例,仅为本发明较佳的具体实施方式。但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (1)

1.一种基于删除标记的OOX文档数字水印方法,其特征在于,所述方法包括水印嵌入方法和水印提取方法,分别包括下列步骤:
水印嵌入方法具体步骤为:
(1)首先读取OOX格式文档包中的主文档部件document.xml文件,并提取出所述document.xml文件中的各个节点下的元素、属性和属性值;
(2)针对所述document.xml文件每一段落,提取w:r元素,然后将删除修改标识符w:rsidDel以及6位16进制的水印信息添加到w:r元素中;
(3)重复步骤(2)直到所有水印信息完全嵌入所述document.xml文件中;
(4)添加已嵌入水印的主文档部件document.xml到原OOX文档包中;
水印提取方法步骤为:
(5) 首先读取OOX格式文档包中的主文档部件document.xml文件,并提取出所述document.xml文件中的各个节点下的元素、属性和属性值;
(6) 针对所述document.xml文件每一段落,提取w:r元素,并提取w:r元素中的删除修改标识符w:rsidDel属性值的后六位;
(7)重复步骤(6)直到所有w:r元素中的删除修改标识符w:rsidDel属性值提取完成,即水印信息提取完成。
CN2012104247540A 2012-10-30 2012-10-30 一种基于删除标记的oox文档数字水印方法 Pending CN102968596A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012104247540A CN102968596A (zh) 2012-10-30 2012-10-30 一种基于删除标记的oox文档数字水印方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012104247540A CN102968596A (zh) 2012-10-30 2012-10-30 一种基于删除标记的oox文档数字水印方法

Publications (1)

Publication Number Publication Date
CN102968596A true CN102968596A (zh) 2013-03-13

Family

ID=47798732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012104247540A Pending CN102968596A (zh) 2012-10-30 2012-10-30 一种基于删除标记的oox文档数字水印方法

Country Status (1)

Country Link
CN (1) CN102968596A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046159A (zh) * 2015-06-18 2015-11-11 中国科学院信息工程研究所 基于修改标识符的oox文本文档隐私信息检测方法
CN106203135A (zh) * 2016-07-04 2016-12-07 中国科学院信息工程研究所 一种针对rsid隐藏信息的无源检测方法
CN111027080A (zh) * 2019-11-26 2020-04-17 中国人民解放军战略支援部队信息工程大学 基于ooxml复合文档源文件数据区位置排列次序的信息隐藏方法及系统
CN111223545A (zh) * 2020-01-08 2020-06-02 智业软件股份有限公司 电子病历痕迹保留的方法
CN112667576A (zh) * 2020-12-22 2021-04-16 珠海豹趣科技有限公司 水印内容处理方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040034602A1 (en) * 2002-08-16 2004-02-19 Quicksilver Technology, Inc. Method and apparatus for watermarking binary computer code
CN101105832A (zh) * 2007-08-13 2008-01-16 浙江工业大学 基于(t,n)门限的关系型数据库水印嵌入及提取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040034602A1 (en) * 2002-08-16 2004-02-19 Quicksilver Technology, Inc. Method and apparatus for watermarking binary computer code
CN101105832A (zh) * 2007-08-13 2008-01-16 浙江工业大学 基于(t,n)门限的关系型数据库水印嵌入及提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周莉等: "一种基于XML文档的数字水印方案", 《湖南大学学报(自然科学版)》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046159A (zh) * 2015-06-18 2015-11-11 中国科学院信息工程研究所 基于修改标识符的oox文本文档隐私信息检测方法
CN105046159B (zh) * 2015-06-18 2018-04-03 中国科学院信息工程研究所 基于修改标识符的oox文本文档隐私信息检测方法
CN106203135A (zh) * 2016-07-04 2016-12-07 中国科学院信息工程研究所 一种针对rsid隐藏信息的无源检测方法
CN106203135B (zh) * 2016-07-04 2019-07-16 中国科学院信息工程研究所 一种针对rsid隐藏信息的无源检测方法
CN111027080A (zh) * 2019-11-26 2020-04-17 中国人民解放军战略支援部队信息工程大学 基于ooxml复合文档源文件数据区位置排列次序的信息隐藏方法及系统
CN111223545A (zh) * 2020-01-08 2020-06-02 智业软件股份有限公司 电子病历痕迹保留的方法
CN112667576A (zh) * 2020-12-22 2021-04-16 珠海豹趣科技有限公司 水印内容处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN100447812C (zh) 一种文档数字水印嵌入方法
CN103049682B (zh) 一种基于字符间距编码的双重水印嵌入的文本水印方法
CN102968596A (zh) 一种基于删除标记的oox文档数字水印方法
Zhang Digital watermarking technology: A review
CN104850765A (zh) 一种水印处理方法、装置及系统
CN102622562A (zh) 基于pdf交叉引用表的pdf文件信息嵌入和提取方法
CN102646179A (zh) 一种基于pdf文件体的pdf文件信息嵌入和提取方法
Zhang et al. A novel robust text watermarking for word document
CN105512523A (zh) 一种匿名化的数字水印嵌入和提取方法
CN102930186A (zh) 一种基于属性样式变换的oox文档数字水印方法
CN101527030A (zh) 基于边信息的安全水印方法
CN102073978A (zh) 利用不规则区域分割的数字图像认证与恢复方法及系统
CN102158768B (zh) 基于mp4文件封装格式的视频认证水印嵌入和提取方法
CN101847250B (zh) 一种基于dct变换的矢量地图数据盲水印方法
CN103559251A (zh) 基于信息隐藏的数据安全保护方法
CN104376236A (zh) 基于伪装学的方案自适应数字水印嵌入方法及提取方法
CN101430786B (zh) 基于视觉感知特性的矢量地图无损数据隐藏方法
CN101989324A (zh) 一种基于计算机与移动存储设备的信息安全系统
Pal et al. Odd-even embedding scheme based modified reversible watermarking technique using Blueprint
Malalla et al. A novel approach for Arabic text steganography based on the “BloodGroup” text hiding method
Singla et al. A Hash Based Approach for secure image stegnograpgy using canny edge detection method
CN102930187A (zh) 一种基于属性顺序变换的oox文档数字水印方法
Cheng et al. A robust text digital watermarking algorithm based on fragments regrouping strategy
Jaseena et al. An invisible zero watermarking algorithm using combined image and text for protecting text documents
CN102999712A (zh) 多媒体的水印制作和提取方法及系统、及多媒体发布系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130313