CN110008663A - 一种用于pdf文档保护和分发跟踪的信息快速嵌入和提取的方法 - Google Patents

一种用于pdf文档保护和分发跟踪的信息快速嵌入和提取的方法 Download PDF

Info

Publication number
CN110008663A
CN110008663A CN201811613481.8A CN201811613481A CN110008663A CN 110008663 A CN110008663 A CN 110008663A CN 201811613481 A CN201811613481 A CN 201811613481A CN 110008663 A CN110008663 A CN 110008663A
Authority
CN
China
Prior art keywords
pdf document
character string
information
embedded
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811613481.8A
Other languages
English (en)
Other versions
CN110008663B (zh
Inventor
陆哲明
归加琪
郁发新
罗雪雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Kiel Technology Co.,Ltd.
Original Assignee
Hangzhou Kilby Blockchain Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Kilby Blockchain Technology Ltd filed Critical Hangzhou Kilby Blockchain Technology Ltd
Priority to CN201811613481.8A priority Critical patent/CN110008663B/zh
Publication of CN110008663A publication Critical patent/CN110008663A/zh
Application granted granted Critical
Publication of CN110008663B publication Critical patent/CN110008663B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Technology Law (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Document Processing Apparatus (AREA)
  • Storage Device Security (AREA)

Abstract

本发明公开了一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法,包括第一PDF文档、第一重嵌入信息和分发跟踪嵌入信息,第一重嵌入信息对第一PDF文档处理后形成版权保护文档;分发跟踪嵌入信息包括多重嵌入信息,其对版权保护文档进行信息嵌入,形成多重嵌入,确认分发跟踪发送者和购买者;通过嵌入方法和提取方法分别对第一PDF文档进行正向和反向处理处理,即提取方法是嵌入方法的逆处理;本发明提供一种简单快速有效的多重信息隐藏的一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法。

Description

一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的 方法
技术领域
本发明涉及信息隐藏技术领域,更具体的说,它涉及一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法。
背景技术
PDF(Portable Document Format)是一种跨平台、跨媒体的开放式电子文档格式,被广泛应用于印刷出版、电子出版和网络出版中。PDF文件以PostScript语言图象模型为基础,无论在哪种打印机上都可保证精确的颜色和准确的打印效果,即PDF会忠实地再现原稿的每一个字符、颜色以及图象。Adobe公司设计PDF文件格式的目的是为了支持跨平台上的,多媒体集成的信息出版和发布,尤其是提供对网络信息发布的支持。正是由于 PDF文件的种种优点,它逐渐成为出版业中的新宠。相对其它电子文档,PDF凭借其诸多优点,如:跨平台性、体积小、优异的阅读体验、支持超链接、高安全性等,已经成为最主要的电子出版物载体。同时PDF已经在各企业、政府机构和教育工作者中广为使用,以期提高生产率、简化文档交换、省却纸张流程。
随着互联网时代的不断发展,数字时代已经到来,传统单纯纸质的出版产业也在不断革新,电子出版物已成为出版行业新的发展方向无论是出于环保节能的目的还是为了适应目前快速的电子化办公环境,电子出版物都处于越来越有竞争力的地位。数字水印技术作为保护数字产品知识版权的有力手段,近年来也在飞速发展。所谓数字水印技术指将一些具有特定意义的标识信息通过某种手段直接或者间接的嵌入到数字载体中,不影响载体的使用价值,且不易被发现和修改。载体中的数字水印信息可作为版权归属的有力证明,为打击盗版,维护数字出版产业的健康发展提供技术保证。目前大部分数字出版商都会选择PDF文件作为出版物发行格式,因此,依托数字水印技术,研究制定一套灵活、适应性强的PDF数字水印版权保护系统是非常有前景的。目前在数字水印研究领域算法的研究主要是针对图像水印,在图像领域数字水印成果喜人,水印算法种类繁多、而且也较为深入,而在声音领域、视频领域、文本领域,数字水印的研究发展较慢,尤其是针对文本的数字水印,由于文本载体固有的特点,其冗余信息容量极小,因此针对文本的数字水印研究一直是处于相对滞后的状态。
目前针对PDF水印技术的主流算法主要分为三类:基于PDF文档格式编码算法、基于PDF文档属性编码算法和基于PDF文档内容编码算法。第一类算法的最新代表性算法主要有新建对象算法和参照表空白字符算法,这两种最新算法的隐蔽性、鲁棒性及容量取得了较好的效果,但新建对象算法PDF内部复杂的对象流关系容易造成文档崩溃;而参照表空白字符算法局限于PDF1.5 以下版本使用。第二类算法的最新代表性算法主要有特征编码、字移编码、行移编码,这些算法的容量不高且算法复杂。第三类算法的代表性算法是基于汉字语法语义的算法,但它对文档进行了可见性破坏且算法容量有限。总的来看,目前缺乏容量、鲁棒性、隐蔽性三者达到较好平衡的PDF水印算法,并且算法速度不够快,都没有考虑多重嵌入来同时达到版权保护和分发跟踪的目的。
发明内容
本发明克服了现有技术的不足,提供一种简单快速有效的多重信息隐藏的一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法。
本发明的技术方案如下:
一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法,包括第一PDF文档、第一重嵌入信息和分发跟踪嵌入信息,第一重嵌入信息对第一PDF文档处理后形成版权保护文档;分发跟踪嵌入信息包括多重嵌入信息,其对版权保护文档进行信息嵌入,形成多重嵌入,确认分发跟踪发送者和购买者;通过嵌入方法和提取方法分别对第一PDF文档进行正向和反向处理处理,即提取方法是嵌入方法的逆处理;其中嵌入方法具体步骤如下:
101)输入步骤:输入嵌入参数、第一PDF文档和第一字符串;其中嵌入参数包括置乱密钥、字符串长度、嵌入第几重、嵌入方案、嵌入页码选择方式、嵌入位置信息;第一PDF文档即为原始PDF文档;第一字符串为待嵌入的秘密信息;
102)加密步骤:根据嵌入参数中的置乱密钥,对第一字符串进行加密处理得到第二字符串;
103)标识步骤:根据嵌入参数中的嵌入第几重,对第二字符串前缀标识得到第三字符串;
104)嵌入步骤:根据嵌入参数中的嵌入方案将第三字符串嵌入到第一PDF文档中,得到第二PDF文档;
105)输出步骤:输出第二PDF文档,并安全地输出和保存嵌入参数,即水印提取码,以便提供准确信息给水印信息提取端。
进一步的,嵌入方案具体如下:根据嵌入参数在第一PDF文档中的指定位置插入第一文本框,指定位置包括页码和位置;在第一文本框中写入第三字符串;将第一文本框中的字体颜色设置为背景颜色,得到第二文本框;存储含有第二文本框的PDF文档,得到第二PDF文档。
进一步的,嵌入方案具体如下:由二进制方式读取第一PDF文档,并定位到文件末尾;在文件末尾写入第三字符串;存储修改后的第一PDF文档得到第二PDF文档。
进一步的,置乱密钥为第一字符串进行加密处理得到第二字符串,具体包括:首先根据置乱密钥生成混沌序列,由混沌序列对第一字符串进行置乱处理,得到第二字符串。
进一步的,包括秘密信息嵌入装置,其包括输入单元、字符串置乱单元、水印字符串生成单元、水印信息嵌入单元、输出单元、嵌入模块;
输入单元用于输入嵌入参数、输入第一PDF文档、输入第一字符串;
字符串置乱单元根据嵌入参数中的置乱密钥对第一字符串进行加密处理得到第二字符串;
水印字符串生成单元根据嵌入参数中的嵌入第几重在第二字符串前面加上前缀标识,得到第三字符串;
水印信息嵌入单元,根据嵌入参数中的嵌入方案选择相应的嵌入模块将第三字符串嵌入到第一PDF文档中,得到第二PDF文档;
输出单元,用于输出第二PDF文档以及安全地输出和保存嵌入参数,即水印提取码,以便提供给水印信息提取端。
进一步的,秘密信息嵌入装置还包括嵌入电子设备,其包括处理器和存储器;存储器用于存储嵌入方法的程序,处理器用于运行存储于存储器中的嵌入方法的程序。
进一步的,包括秘密信息提取装置,其包括输入单元、字符串提取单元、字符串剥离单元、秘密信息重构单元;
输入单元用于输入水印提取码和输入第二PDF文档,其中水印提取码包括置乱密钥、字符串长度、嵌入第几重、嵌入方案、嵌入页码选择方式、嵌入位置;
字符串提取单元根据水印提取码中的嵌入方案选择相应的提取模块从第二PDF文档提取出第一PDF文档;
字符串剥离单元,根据水印提取码中的嵌入第几重把第三字符串中的前缀标识剥离,得到指定长度的第二字符串;
秘密信息重构单元,根据水印提取码中的置乱密钥对第二字符串进行反置乱处理,得到第一字符串即嵌入的秘密信息。
进一步的,所述秘密信息重构单元,具体处理如下:首先使用水印提取码中的置乱密钥产生混沌序列;用生成的混沌序列,对第二字符串进行反置乱处理得到第一字符串。
进一步的,秘密信息提取装置还包括提取电子设备,其包括处理器和存储器;存储器用于存储提取方法的程序,处理器用于运行存储于存储器中的提取方法的程序。
本发明相比现有技术优点在于:本发明申请提出针对PDF文件版权保护和分发跟踪的一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法,解决缺乏容量、鲁棒性、隐蔽性三者达到较好平衡的PDF水印方法,并且方法速度够快,充分考虑多重嵌入来同时达到版权保护和分发跟踪的目的。
附图说明
图1是本发明以四重嵌入为例的总体功能示意图。
图2是本发明的一种秘密信息嵌入方法的流程图。
图3是本发明的一种秘密信息提取方法的流程图。
图4是本发明的一种秘密信息嵌入装置的示意图。
图5是本发明的一种嵌入电子设备的示意图。
图6是本发明的一种秘密信息提取装置的示意图。
图7是本发明的一种提取电子设备的示意图。
具体实施方式
下面详细描述本发明的实施方式,其中自始至终相同或类似的标号表示相同或类似的元件或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明而不能作为对本发明的限制。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科技术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样的定义,不会用理想化或过于正式的含义来解释。
下面结合附图和具体实施方式对本发明进一步说明。
PDF的文件结构(即物理结构)包括四个部分:文件头(Header)、文件体(Body)、交叉引用表(Cross-reference Table)和文件尾(Trailer)。文件头指明了该文件所遵从PDF规范的版本号,它出现在PDF文件的第一行。文件体(Body)由一系列的PDF间接对象组成。这些间接对象构成了PDF文件的具体内容如字体、页面、图像等等。交叉引用表则是为了能对间接对象进行随机存取而设立的一个间接对象地址索引表。文件尾声明了交叉引用表的地址,指明文件体的根对象(Catalog),还保存了加密等安全信息。根据文件尾提供的信息,PDF的应用程序可以找到交叉引用表和整个PDF文件的根对象,从而控制整个PDF文件。因此本方案充分考虑了PDF文件的格式,提供一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法。
如图1至图7所示,一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法,包括第一PDF文档、第一重嵌入信息和分发跟踪嵌入信息,第一重嵌入信息对第一PDF文档处理后形成版权保护文档;分发跟踪嵌入信息包括多重嵌入信息,其对版权保护文档进行信息嵌入,形成多重嵌入,确认分发跟踪发送者和购买者;通过嵌入方法和提取方法分别对第一PDF文档进行正向和反向处理处理,即提取方法是嵌入方法的逆处理。
具体以嵌入四重秘密信息为例,其中每一重都在嵌入参数的作用下,选择嵌入相应的信息:如版权水印、第一级指纹、第二级指纹或第三级指纹。版权水印即第一重用于版权保护,用CP000前缀来标识;第一级指纹即第二重是用于跟踪第一级分发,通常针对第一级分销商,用FP100前缀来标识;第二级指纹即第三重是用于跟踪第二级分发,通常针对第二级分销商,用FP200前缀来标识;第三级指纹即第四重是用于跟踪第三级分发,通常针对最终用户,用FP300前缀来标识。当然,根据需要,可选的,最终获得的含水印PDF文档可以经历如下四种可能:第一种可能,只嵌入了版权水印;第二种可能,嵌入了版权水印和第一级数字指纹(尤其针对第一级就直接分发到最终用户的情况);第三种可能,嵌入了版权水印、第一级数字指纹和第二级数字指纹(尤其针对通过第一级分销就到达最终用户的情况);第四种可能,嵌入了版权水印和三级数字指纹。
其中嵌入方法具体步骤如下:
101)输入步骤:输入嵌入参数、第一PDF文档和第一字符串。其中嵌入参数包括置乱密钥、字符串长度、嵌入第几重、嵌入方案、嵌入页码选择方式、嵌入位置等参数信息。第一PDF文档即为原始PDF文档。第一字符串为待嵌入的秘密信息。
嵌入参数中的置乱密钥用于对第一字符串进行加密。第一字符串根据嵌入第几重而含义不一样,若为0,表示第一重,代表版权水印;若为1,表示第二重,代表第一级数字指纹;若为2,表示第三重,代表第二级数字指纹;若为3,表示第四重,代表第三级数字指纹。
字符串长度和嵌入方案可以作为控制嵌入的第一层密钥。字符串长度指的就是第一字符串的长度。嵌入方案分为两种,0表示嵌入方案一,1表示嵌入方案二。若选择嵌入方案一,则后面的嵌入页码选择方式和嵌入位置相当于控制嵌入的第二层密钥;嵌入页码选择方式为0,代表每一页都嵌,选择方式为n(n大于0),则表示隔n页嵌入一页。若选择嵌入方案二,则嵌入页码选择方式为-1,嵌入位置也设为(-1,-1),即嵌入页码和嵌入位置无意义。
102)加密步骤:根据嵌入参数中的置乱密钥,对第一字符串进行加密处理得到第二字符串。置乱密钥为第一字符串进行加密处理得到第二字符串,具体包括:首先根据置乱密钥生成混沌序列,由混沌序列对第一字符串进行置乱处理,得到第二字符串。
其中,所述第一字符串,指待嵌入到第一PDF文档中的原始版权信息或指纹信息,如某个公司的公司名、某个员工的员工编号或其他标识信息。生成的第二字符串可以隐藏嵌入到第一PDF文档中,不会影响原文档的使用价值,也不易被探知和再次修改。但该字符串可以被生产方识别和辨认。通过这些嵌入在PDF文档中的水印信息,可以达到确认版权所有者和跟踪分发者或购买者的目的。
为了提高水印嵌入的安全性,将第一字符串转换成第二字符串的一种实现方式如下:基于置乱密钥利用logistics映射后生成一个混沌序列;基于生成的混沌序列对第一字符串进行置乱,就可得到第二字符串。
103)标识步骤:根据嵌入参数中的嵌入第几重,对第二字符串前缀标识得到第三字符串。
前缀标识和嵌入第几重的关系如下:第一重对应CP000、第二重对应第一级数字指纹FP100、第三重对应第二级数字指纹FP200、第四重对应第三级数字指纹FP300。加上前缀的目的是区分不同的嵌入过程,便于提取时可以根据前缀判断嵌入的信息代表何意义。
104)嵌入步骤:根据嵌入参数中的嵌入方案将第三字符串嵌入到第一PDF文档中,得到第二PDF文档。嵌入方案具体采用两种,方案一:根据嵌入参数在第一PDF文档中的指定位置插入第一文本框,指定位置包括页码和位置。在第一文本框中写入第三字符串。将第一文本框中的字体颜色设置为背景颜色,得到第二文本框。存储含有第二文本框的PDF文档,得到第二PDF文档。
方案二:由二进制方式读取第一PDF文档,并定位到文件末尾。在文件末尾写入第三字符串。存储修改后的第一PDF文档得到第二PDF文档。
其中核心处理方法用JAVA编写(Java端),而登录信息参数输入平台用C++编写的(C端),然后用Socket通信将两者关联起来,从而实现了PDF文档的水印嵌入和隐藏。以方案一为例
首先将C端输入的参数信息写到一个news.txt中,txt文档每行含义:参数1(第一PDF文档输入路径);参数2(第二PDF文档输出路径),参数3(待嵌入的第二字符串),参数4(6位置乱密钥),参数5(14位嵌入码)。
然后建立Socket通信,将C端作为客户端,Java端作为服务器,C端向Java端发送“please check the new txt”,Java端接收到这个信息,去访问news.txt中的参数数据。
接着Java端通过读取txt文档中的信息,拿到第二字符串以及第二PDF文档输出路径,并根据14位嵌入码中的参数1和参数2,去确定嵌入文本框在PDF文档页面上的x, y坐标,同时根据参数3去确定隔多少页嵌入、参数4用来确认嵌入后的PDF文档是否加密。
然后,在选定的各页的相应位置插入文本框,将加了前缀的第三字符串写入文本框中,然后设置字体颜色与背景颜色一致。
最后,根据第二PDF文档的输出路径,将含水印PDF文档保存到这个路径得到第二PDF文档。
105)输出步骤:输出第二PDF文档,并安全地输出和保存嵌入参数,即水印提取码,以便提供准确信息给水印信息提取端。
为了让水印信息提取端能够获得所述嵌入参数(包括置乱密钥、嵌入的字符串长度等其他嵌入参数),可以将这些信息提供给水印信息提取端。将嵌入参数提供给水印信息提取端,可以采用两种方式,一种方式是将所述嵌入参数以单独消息的形式发送至水印提取端;另一种方式是以水印信息提取端和水印信息嵌入端预先约定的方式,将所述嵌入参数提供给水印信息提取端。
如图3所示,提取方法与嵌入方法反向具体过程如下:
在步骤S301中,输入水印提取码(里面包括置乱密钥、字符串长度、嵌入第几重、嵌入方案、嵌入页码选择方式、嵌入位置等参数)、输入第三PDF文档即嵌入方法中生成的第二PDF文档;
第三PDF文档指的是可以待提取水印的PDF文档。水印提取码中的置乱密钥用于对第五字符串进行解密,即对应嵌入方法中的第二字符串的解密。第五字符串根据嵌入第几重而含义不一样,若为0,表示第一重,代表版权水印;若为1,表示第二重,代表第一级数字指纹;若为2,表示第三重,代表第二级数字指纹;若为3,表示第四重,代表第三级数字指纹。字符串长度和嵌入方案可以作为控制提取的第一层密钥。字符串长度指的就是第六字符串的长度。嵌入方案分为两种,0表示应采用提取方案一;1表示应采用提取方案二。若嵌入方案为0,则后面的嵌入页码选择方式和嵌入位置相当于控制提取的第二层密钥。嵌入页码选择方式为0,代表每一页都可以提取,选择方式为n(n大于0),则表示隔n页可以提取。若嵌入方案二为1,则嵌入页码和嵌入位置可以忽略。
在步骤S302中,根据水印提取码中的嵌入方案选择相应的提取方案从第三PDF文档提取出第四字符串,即对应嵌入方法中的第三字符串;
这里,同样需要解释如何用程序实现这个过程。因为PDF水印技术主要挑战在于大部分操作PDF的库是Java的,C++的操作库比较少,所以直接用C++去实现PDF算法比较困难。在本发明,给出了一种解决方案,即核心算法在JAVA中编写(Java端),而界面平台用C++的(C端),然后用Socket通信将两者关联起来,从而实现了PDF文档的水印提取。以提取方案一为例,具体可以描述如下:
首先,将C端输入的提取参数信息写到一个news.txt中。
然后,建立Socket通信,将C端作为客户端,Java端作为服务器,C端向Java端发送“please check the new txt”,Java端接收到这个信息,去访问news.txt中的参数数据。
接着,Java端通过读取txt文档中的信息,拿到待提取水印的第三PDF文档路径。
随后,根据14位提取码去确认嵌入的水印是第几重(CP,FP1,FP2,FP3),遍历全PDF文档的内容,根据对应的标识头信息(CP000,FP100,FP200,FP300)以及字符串长度提取第四字符串。
然后,将提取的第四字符串,写入到news.txt文档的参数3中,其他参数保持原来状态。向C端程序发送消息(Success:提取成功, Error:提取失败)
最后,C端接收到“Success”消息后去访问news.txt,提取出里面的第四字符串。
在步骤S303中,根据水印提取码中的嵌入第几重把第四字符串中的前缀标识剥离得到指定长度(等于水印提取码中的字符串长度)的第五字符串,嵌入方法中的第二字符串;
这里,前缀标识和嵌入第几重的关系如下:第一重对应CP000、第二重对应第一级数字指纹FP100、第三重对应第二级数字指纹FP200、第四重对应第三级数字指纹FP300。
在步骤S304中,根据水印提取码中的置乱密钥对第五字符串进行反置乱处理,得到第六字符串,即嵌入方法中的第一字符串;输出第六字符串,即为需要提取的秘密信息。
这里可以首先使用水印提取码中的置乱密钥产生混沌序列。然后基于生成的混沌序列,对所述第五字符串进行反置乱处理得到第六字符串。综上信息提取方法,处理速度很快,满足快速检测水印的需要。
本方案还包括秘密信息嵌入装置,其包括输入单元、字符串置乱单元、水印字符串生成单元、水印信息嵌入单元、输出单元、嵌入模块。
输入单元用于输入嵌入参数(包括置乱密钥、字符串长度、嵌入第几重、嵌入方案、嵌入页码选择方式、嵌入位置等参数)、输入第一PDF文档、输入第一字符串。
字符串置乱单元根据嵌入参数中的置乱密钥对第一字符串进行加密处理得到第二字符串。
水印字符串生成单元根据嵌入参数中的嵌入第几重在第二字符串前面加上前缀标识(四重分别对应版权水印CP000、第一级数字指纹FP100、第二级数字指纹FP200、第三级数字指纹FP300),得到第三字符串。
水印信息嵌入单元,根据嵌入参数中的嵌入方案(嵌入方案一和嵌入方案二)选择相应的嵌入模块将第三字符串嵌入到第一PDF文档中,得到第二PDF文档。
输出单元,用于输出第二PDF文档以及安全地输出和保存嵌入参数,即水印提取码,以便提供给水印信息提取端。
嵌入方案一对应的嵌入模块包括:在第一PDF文档中的各指定页码的指定位置(页码和位置由嵌入参数决定)插入第一文本框;在各第一文本框写入第三字符串;将字体颜色设置为背景颜色,得到各指定页码的第二文本框;存储含有第二文本框的PDF文档,得到第二PDF文档。
嵌入方案二对应的嵌入模块包括:按二进制方式读取第一PDF文档,定位到文件末尾;在文件末尾写入第三字符串;存储修改后的PDF文档得到第二PDF文档。
秘密信息嵌入装置还包括嵌入电子设备,其包括处理器和存储器。存储器用于存储嵌入方法的程序,处理器用于运行存储于存储器中的嵌入方法的程序。
本方案包括秘密信息提取装置,其包括输入单元、字符串提取单元、字符串剥离单元、秘密信息重构单元。
输入单元用于输入水印提取码和输入第二PDF文档,其中水印提取码包括置乱密钥、字符串长度、嵌入第几重、嵌入方案、嵌入页码选择方式、嵌入位置等参数信息。
字符串提取单元根据水印提取码中的嵌入方案选择相应的提取模块从第二PDF文档提取出第一PDF文档。
字符串剥离单元,根据水印提取码中的嵌入第几重把第三字符串中的前缀标识剥离,得到指定长度的第二字符串。
秘密信息重构单元,根据水印提取码中的置乱密钥对第二字符串进行反置乱处理,得到第一字符串即嵌入的秘密信息。
其中具体实现过程与提取方法相同不在赘述。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (9)

1.一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法,其特征在于,包括第一PDF文档、第一重嵌入信息和分发跟踪嵌入信息,第一重嵌入信息对第一PDF文档处理后形成版权保护文档;分发跟踪嵌入信息包括多重嵌入信息,其对版权保护文档进行信息嵌入,形成多重嵌入,确认分发跟踪发送者和购买者;通过嵌入方法和提取方法分别对第一PDF文档进行正向和反向处理处理,即提取方法是嵌入方法的逆处理;其中嵌入方法具体步骤如下:
101)输入步骤:输入嵌入参数、第一PDF文档和第一字符串;其中嵌入参数包括置乱密钥、字符串长度、嵌入第几重、嵌入方案、嵌入页码选择方式、嵌入位置信息;第一PDF文档即为原始PDF文档;第一字符串为待嵌入的秘密信息;
102)加密步骤:根据嵌入参数中的置乱密钥,对第一字符串进行加密处理得到第二字符串;
103)标识步骤:根据嵌入参数中的嵌入第几重,对第二字符串前缀标识得到第三字符串;
104)嵌入步骤:根据嵌入参数中的嵌入方案将第三字符串嵌入到第一PDF文档中,得到第二PDF文档;
105)输出步骤:输出第二PDF文档,并安全地输出和保存嵌入参数,即水印提取码,以便提供准确信息给水印信息提取端。
2. 根据权利要求 1 所述的一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法,其特征在于:嵌入方案具体如下:根据嵌入参数在第一PDF文档中的指定位置插入第一文本框,指定位置包括页码和位置;在第一文本框中写入第三字符串;将第一文本框中的字体颜色设置为背景颜色,得到第二文本框;存储含有第二文本框的PDF文档,得到第二PDF文档。
3. 根据权利要求 1 所述的一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法,其特征在于:嵌入方案具体如下:由二进制方式读取第一PDF文档,并定位到文件末尾;在文件末尾写入第三字符串;存储修改后的第一PDF文档得到第二PDF文档。
4. 根据权利要求 1 所述的一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法,其特征在于:置乱密钥为第一字符串进行加密处理得到第二字符串,具体包括:首先根据置乱密钥生成混沌序列,由混沌序列对第一字符串进行置乱处理,得到第二字符串。
5. 根据权利要求 1所述的一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法,其特征在于:包括秘密信息嵌入装置,其包括输入单元、字符串置乱单元、水印字符串生成单元、水印信息嵌入单元、输出单元、嵌入模块;
输入单元用于输入嵌入参数、输入第一PDF文档、输入第一字符串;
字符串置乱单元根据嵌入参数中的置乱密钥对第一字符串进行加密处理得到第二字符串;
水印字符串生成单元根据嵌入参数中的嵌入第几重在第二字符串前面加上前缀标识,得到第三字符串;
水印信息嵌入单元,根据嵌入参数中的嵌入方案选择相应的嵌入模块将第三字符串嵌入到第一PDF文档中,得到第二PDF文档;
输出单元,用于输出第二PDF文档以及安全地输出和保存嵌入参数,即水印提取码,以便提供给水印信息提取端。
6. 根据权利要求 5所述的一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法,其特征在于:秘密信息嵌入装置还包括嵌入电子设备,其包括处理器和存储器;存储器用于存储嵌入方法的程序,处理器用于运行存储于存储器中的嵌入方法的程序。
7. 根据权利要求 1 所述的一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法,其特征在于:包括秘密信息提取装置,其包括输入单元、字符串提取单元、字符串剥离单元、秘密信息重构单元;
输入单元用于输入水印提取码和输入第二PDF文档,其中水印提取码包括置乱密钥、字符串长度、嵌入第几重、嵌入方案、嵌入页码选择方式、嵌入位置;
字符串提取单元根据水印提取码中的嵌入方案选择相应的提取模块从第二PDF文档提取出第一PDF文档;
字符串剥离单元,根据水印提取码中的嵌入第几重把第三字符串中的前缀标识剥离,得到指定长度的第二字符串;
秘密信息重构单元,根据水印提取码中的置乱密钥对第二字符串进行反置乱处理,得到第一字符串即嵌入的秘密信息。
8.根据权利要求7所述的一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法,其特征在于,所述秘密信息重构单元,具体处理如下:首先使用水印提取码中的置乱密钥产生混沌序列;用生成的混沌序列,对第二字符串进行反置乱处理得到第一字符串。
9.根据权利要求7所述的一种用于PDF文档保护和分发跟踪的信息快速嵌入和提取的方法,其特征在于,秘密信息提取装置还包括提取电子设备,其包括处理器和存储器;存储器用于存储提取方法的程序,处理器用于运行存储于存储器中的提取方法的程序。
CN201811613481.8A 2018-12-27 2018-12-27 一种用于pdf文档保护和分发跟踪的信息快速嵌入和提取的方法 Active CN110008663B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811613481.8A CN110008663B (zh) 2018-12-27 2018-12-27 一种用于pdf文档保护和分发跟踪的信息快速嵌入和提取的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811613481.8A CN110008663B (zh) 2018-12-27 2018-12-27 一种用于pdf文档保护和分发跟踪的信息快速嵌入和提取的方法

Publications (2)

Publication Number Publication Date
CN110008663A true CN110008663A (zh) 2019-07-12
CN110008663B CN110008663B (zh) 2020-12-08

Family

ID=67165326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811613481.8A Active CN110008663B (zh) 2018-12-27 2018-12-27 一种用于pdf文档保护和分发跟踪的信息快速嵌入和提取的方法

Country Status (1)

Country Link
CN (1) CN110008663B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116707934A (zh) * 2023-06-20 2023-09-05 甘肃省地震局(中国地震局兰州地震研究所) 一种基于无线传感网络的数据加密传送方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005124137A (ja) * 2004-06-23 2005-05-12 Canon Inc 文章処理装置、及び制御方法
CN102646179A (zh) * 2012-02-27 2012-08-22 中山大学 一种基于pdf文件体的pdf文件信息嵌入和提取方法
CN204991130U (zh) * 2015-08-04 2016-01-20 北京金石威视科技发展有限公司 一种用于文档追踪的数字水印便携存储装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005124137A (ja) * 2004-06-23 2005-05-12 Canon Inc 文章処理装置、及び制御方法
CN102646179A (zh) * 2012-02-27 2012-08-22 中山大学 一种基于pdf文件体的pdf文件信息嵌入和提取方法
CN204991130U (zh) * 2015-08-04 2016-01-20 北京金石威视科技发展有限公司 一种用于文档追踪的数字水印便携存储装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ADNAN M. ALATTAR ET AL: "Watermarking Electronic Text Documents Containing Justified Paragraphs and Irregular Line Spacing", 《PROCEEDINGS OF SPIE》 *
张桂红 等: "多重数字水印技术", 《科技广场》 *
张薇: "基于 Office档的多重文本水印技术", 《信息与电脑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116707934A (zh) * 2023-06-20 2023-09-05 甘肃省地震局(中国地震局兰州地震研究所) 一种基于无线传感网络的数据加密传送方法
CN116707934B (zh) * 2023-06-20 2023-10-24 甘肃省地震局(中国地震局兰州地震研究所) 一种基于无线传感网络的数据加密传送方法

Also Published As

Publication number Publication date
CN110008663B (zh) 2020-12-08

Similar Documents

Publication Publication Date Title
Kamaruddin et al. A review of text watermarking: theory, methods, and applications
Gutub et al. A novel Arabic text steganography method using letter points and extensions
Shirali-Shahreza et al. A new approach to Persian/Arabic text steganography
US5920878A (en) Method for hiding a binary encoded message in an electronic document by modulating the case of the characters in a case-insensitive markup language
US6868405B1 (en) Copy detection for digitally-formatted works
Roy et al. A novel approach to format based text steganography
US7555138B2 (en) Method and apparatus for digital watermarking for the electronic literary macramé
Banerjee et al. Novel text steganography through special code generation
Changder et al. Linguistic approach for text steganography through Indian text
Mir Copyright for web content using invisible text watermarking
Alginahi et al. An enhanced Kashida-based watermarking approach for increased protection in Arabic text-documents based on frequency recurrence of characters
Memon et al. EVALUATION OF STEGANOGRAPHY FOR URDU/ARABIC TEXT.
Alkawaz et al. Concise analysis of current text automation and watermarking approaches
Kumar et al. Recent trends in text steganography with experimental study
CN113918895A (zh) 一种文本文档溯源追踪的方法
CN110008663A (zh) 一种用于pdf文档保护和分发跟踪的信息快速嵌入和提取的方法
Chaudhary et al. Text steganography based on feature coding method
CN109800547B (zh) 一种用于word文档保护和分发跟踪的信息快速嵌入和提取的方法
Kaushik et al. Zero-width text steganography in cybercrime attacks
Jaiswal et al. Implementation of a new technique for web document protection using unicode
Jusoh et al. A review of arabic text steganography: past and present
Khan et al. Polish text steganography method using letter points and extension
Chroni et al. Watermarking PDF documents using various representations of self-inverting permutations
Tiwari et al. A novel steganographic methodology for high capacity data hiding in executable files
Usop et al. A Review of Digital Watermarking Techniques, Characteristics and Attacks in Text Documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 808, Building 8, Yunchuang Gagu R&D Center, No. 428 Zhiqiang Road, Xihu District, Hangzhou City, Zhejiang Province, 310000

Patentee after: Hangzhou Kiel Technology Co.,Ltd.

Address before: 310030 room 609, building 5, No. 3, Xiyuan Third Road, Sandun Town, Xihu District, Hangzhou City, Zhejiang Province

Patentee before: HANGZHOU KILBY BLOCKCHAIN TECHNOLOGY Ltd.