CN113343186A - Docx文档的隐形水印嵌入方法、装置、电子设备及存储介质 - Google Patents

Docx文档的隐形水印嵌入方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113343186A
CN113343186A CN202110860355.8A CN202110860355A CN113343186A CN 113343186 A CN113343186 A CN 113343186A CN 202110860355 A CN202110860355 A CN 202110860355A CN 113343186 A CN113343186 A CN 113343186A
Authority
CN
China
Prior art keywords
file
docx
document
watermark
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110860355.8A
Other languages
English (en)
Inventor
刘攀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhixiang Technology Co Ltd
Original Assignee
Beijing Zhixiang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhixiang Technology Co Ltd filed Critical Beijing Zhixiang Technology Co Ltd
Priority to CN202110860355.8A priority Critical patent/CN113343186A/zh
Publication of CN113343186A publication Critical patent/CN113343186A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Technology Law (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Abstract

本发明提出了一种DOCX文档的隐形水印嵌入方法、装置、电子设备及存储介质。根据本发明的DOCX文档的隐形水印嵌入方法,包括:解压DOCX文件,读取word/rel/document.xml.rels文件,获取无冲突关系ID并关联隐藏水印文件;读取word/Document.xml获取文档段落信息,并在段落内插入隐藏水印的引用。本发明针对原生文件内容可以随时被别人篡改,管控不当可能造成私密数据丢失无法查证,给用户数据带来很多安全隐患的问题。通过在DOCX文件中嵌入隐形水印,隐形水印可以在用户无感的情况下生成水印,在文件流转过程中携带水印,当发生泄露需要溯源时可以读取水印信息。相对其他隐形水印的嵌入方法大幅降低读取和写入的成本。

Description

DOCX文档的隐形水印嵌入方法、装置、电子设备及存储介质
技术领域
本发明涉及软件处理技术领域,尤其涉及一种DOCX文档的隐形水印嵌入方法、装置、电子设备及存储介质。
背景技术
在特定的环境中,想要追踪docx文档文件并获取到文件的流转途径,想要对文件精准定位和溯源等操作。由于原生文件内容可以随时被别人篡改,管控不当可能造成私密数据丢失无法查证,给用户数据带来很多安全隐患。隐形水印可以在用户无感的情况下生成水印,在文件流转过程中携带水印。当发生泄露需要溯源时可以读取水印信息。
发明内容
本发明要解决的技术问题是如何在DOCX文档生成嵌入隐形水印,本发明提出了一种DOCX文档的隐形水印嵌入方法、装置、电子设备及存储介质。
根据本发明实施例的DOCX文档的隐形水印嵌入方法,包括:
解压DOCX文件,读取word/rel/document.xml.rels文件,获取无冲突关系ID并关联隐藏水印文件;
读取word/Document.xml获取文档段落信息,并在段落内插入隐藏水印的引用。
根据本发明的一些实施例,在解压所述DOCX文件之前,所述方法还包括:
解压zip文件,若解压文件中存在word/Document.xml且内容为XML格式,则判定文件为DOCX文件。
在本发明的一些实施例中,在段落内插入所述隐藏水印之前,所述方法还包括:
保存用户访问信息的二维码图片生成所述隐形水印文件。
根据本发明的一些实施例,所述用户访问信息包括:用户名,访问时间,硬件时间,文件创建时间,流转记录及KPI签名。
根据本发明实施例的DOCX文档的隐形水印嵌入装置,包括:
解压模块,用于解压DOCX文件,读取word/rel/document.xml.rels文件,获取无冲突关系ID并关联隐藏水印文件;
嵌入模块,用于读取word/Document.xml获取文档段落信息,并在段落内插入隐藏水印的引用。
根据本发明的一些实施例,所述嵌入装置还包括:
识别模块,用于解压zip文件,若解压文件中存在word/Document.xml且内容为XML格式,则判定文件为DOCX文件。
在本发明的一些实施例中,所述嵌入装置还包括:
水印生成模块,用于保存用户访问信息的二维码图片生成所述隐形水印文件。
根据本发明的一些实施例,所述用户访问信息包括:用户名,访问时间,硬件时间,文件创建时间,流转记录及KPI签名。
根据本发明实施例的电子设备,至少包括存储器、处理器,所述存储器上存储有计算机程序,所述处理器在执行所述存储器上的计算机程序时实现如上述所述的DOCX文档的隐形水印嵌入方法的步骤。
根据本发明实施例的计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的DOCX文档的隐形水印嵌入方法的步骤。
本发明提出的DOCX文档的隐形水印嵌入方法、装置、电子设备及存储介质具有如下有益效果:
本发明针对原生文件内容可以随时被别人篡改,管控不当可能造成私密数据丢失无法查证,给用户数据带来很多安全隐患的问题。通过在DOCX文件中嵌入隐形水印,隐形水印可以在用户无感的情况下生成水印,在文件流转过程中携带水印,当发生泄露需要溯源时可以读取水印信息。相对其他隐形水印的嵌入方法大幅降低读取和写入的成本。
附图说明
图1为根据本发明实施例的DOCX文档的隐形水印嵌入方法流程图;
图2为根据本发明实施例的DOCX文档的隐形水印嵌入方法流程框图;
图3为根据本发明实施例的嵌入方法中获取无冲突ID并关联隐形水印文示意图;
图4为根据本发明实施例的嵌入方法中生成二维码图片隐形水印示意图;
图5为根据本发明实施例的在DOCX文件中引用水印文件示意图;
图6为根据本发明实施例的DOCX文档的隐形水印嵌入装置示意图。
附图标记:
嵌入装置100,
识别模块10,水印生成模块20,解压模块30,嵌入模块40。
具体实施方式
为更进一步阐述本发明为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本发明进行详细说明如后。
本发明中说明书中对方法流程的描述及本发明说明书附图中流程图的步骤并非必须按步骤标号严格执行,方法步骤是可以改变执行顺序的。而且,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
如图1所示,根据本发明实施例的DOCX文档的隐形水印嵌入方法,包括:
S120,解压DOCX文件,读取word/rel/document.xml.rels文件,获取无冲突关系ID并关联隐藏水印文件;
如图3所示,解压DOCX文件后,读取word/rel/document.xml.rels文件,获取与DOCX文件已有ID无冲突关系的ID,并将该无冲突关系的ID关联隐藏水印文件。
S140,读取word/Document.xml获取文档段落信息,并在段落内插入隐藏水印的引用。需要说明的是,可以在DOCX文件的所有段落中嵌入隐藏水印,当然也可以仅在DOCX文件的部分段落中嵌入隐藏水印。
根据本发明的一些实施例,在解压所述DOCX文件之前,所述方法还包括:
解压zip文件,若解压文件中存在word/Document.xml且内容为XML格式,则判定文件为DOCX文件。可以理解的是,在对DOCX文档进行隐形水印的嵌入时,首先需要识别文件是否为DOCX格式文件。本实施例中,通过读取文件通过文件头识别格式为zip文件,并解压word/Document.xml文件。如果文件可以被解压并且存在word/Document.xml,并且其内容为XML格式,则认为该文件为DOCX文件格式。
在本发明的一些实施例中,在段落内插入隐藏水印之前,方法还包括:保存用户访问信息的二维码图片生成隐形水印文件。其中,用户访问信息包括:用户名,访问时间,硬件时间,文件创建时间,流转记录及KPI签名。
也就是说,隐形水印文件可以采用保存有用户名、访问时间、硬件时间、文件创建时间、流转记录及KPI签名等用户访问信息的二维码图片。由此,可以通过DOCX文件携带的隐形水印追踪DOCX文件的流转路径。
如图6所示,根据本发明实施例的DOCX文档的隐形水印嵌入装置100,包括:解压模块30和嵌入模块40。
其中,解压模块30用于解压DOCX文件,读取word/rel/document.xml.rels文件,获取无冲突关系ID并关联隐藏水印文件。
嵌入模块40用于读取word/Document.xml获取文档段落信息,并在段落内插入隐藏水印的引用。
根据本发明的一些实施例,如图6所示,嵌入装置100还包括:识别模块10,用于解压zip文件,若解压文件中存在word/Document.xml且内容为XML格式,则判定文件为DOCX文件。
在本发明的一些实施例中,嵌入装置100还包括:水印生成模块20,水印生成模块20用于保存用户访问信息的二维码图片生成隐形水印文件。其中,用户访问信息包括:用户名,访问时间,硬件时间,文件创建时间,流转记录及KPI签名。
根据本发明实施例的电子设备,至少包括存储器、处理器,存储器上存储有计算机程序,处理器在执行存储器上的计算机程序时实现如上述的DOCX文档的隐形水印嵌入方法的步骤,包括:
A110,解压zip文件,若解压文件中存在word/Document.xml且内容为XML格式,则判定文件为DOCX文件;
A120,保存用户访问信息的二维码图片,以生成隐形水印文件;
A130,解压DOCX文件,读取word/rel/document.xml.rels文件,获取无冲突关系ID并关联隐藏水印文件;
S140,读取word/Document.xml获取文档段落信息,并在段落内插入隐藏水印的引用。由此,可以在DOCX文件的预设段落中完成隐藏水印的嵌入。
根据本发明实施例的计算机存储介质,计算机存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述的DOCX文档的隐形水印嵌入方法的步骤,包括:
A110,解压zip文件,若解压文件中存在word/Document.xml且内容为XML格式,则判定文件为DOCX文件;
A120,保存用户访问信息的二维码图片,以生成隐形水印文件;
A130,解压DOCX文件,读取word/rel/document.xml.rels文件,获取无冲突关系ID并关联隐藏水印文件;
S140,读取word/Document.xml获取文档段落信息,并在段落内插入隐藏水印的引用。由此,可以在DOCX文件的预设段落中完成隐藏水印的嵌入。
本发明提出的DOCX文档的隐形水印嵌入方法、装置、电子设备及存储介质具有如下有益效果:
本发明针对原生文件内容可以随时被别人篡改,管控不当可能造成私密数据丢失无法查证,给用户数据带来很多安全隐患的问题。通过在DOCX文件中嵌入隐形水印,隐形水印可以在用户无感的情况下生成水印,在文件流转过程中携带水印,当发生泄露需要溯源时可以读取水印信息。而且,相对其他隐形水印的嵌入方法,本发明可大幅降低读取和写入的成本。
下面参照附图以一个具体的实施例详细描述根据本发明的DOCX文档的隐形水印嵌入方法及嵌入装置。值得理解的是,下述描述仅是示例性描述,而不应理解为对本发明的具体限制。
本发明是一种用于OFFICE 2007及以上版本的WORD文档格式嵌入隐形水印方法及装置,该嵌入方法及装置可以解决问题如下:
1、终端应用轻量化,不依赖任何第三方SDK操作WORD文档。
2、解决普通文本水印容易被破坏,由于水印信息随机嵌入在文件段落中。即使删除部分段落也不会影响水印读取,并且存储信息量较少的问题。
3、实现隐形水印的方式新颖,利用二维码能存储信息的功能,为每个WORD文档贴上一张隐形的名片,即隐形水印。
为了实现上述目的,本发明提出了一种针对DOCX文件解压缩操作的压缩包文件和解压缩后生成水印并嵌入的方法,步骤如下:
S1,识别文件格式,读取文件通过文件头识别格式为zip文件,并解压word/Document.xml文件。如果文件可以被解压并且存在word/Document.xml并且其内容为XML格式,则认为该文件为DOCX文件格式;
S2,生成水印,水印信息以二维码(QRCODE)存储,保存用户访问信息,其中包括用户名,访问时间,硬件信息,文件创建时间,流转记录,PKI签名;
S3,DOCX文件嵌入水印过程,解压DOCX文件读取word/rel/document.xml.rels文件,获取无冲突关系ID并关联二维码图片文件。读取word/document.xml获取文档全部段落信息,并随即在段落内插入隐藏的水印二维码的引用;
其中,如图3-图5所示,步骤S3具体包括:
S3a,解压DOCX文件读取word/rel/document.xml.rels文件,获取无冲突关系ID并关联二维码图片文件;
S3b,生成二维码水印文件;
S3c,主文档添加水印文件引用,防止文档信息被篡改影响水印的追踪;
S3d,文档压缩生成DOCX文件。
S4,文件过滤驱动获取进程发出的文件创建,读,写请求。文件操作事件被触发后,驱动通知监控进程将文件路径发送给S1识别其是否为DOCX文档格式,如果是则S2生成水印并进入监控文件操作,如果该文件正在被某进程操作则监控程序等待进程退出后S3将水印信息写入文件;
S5、文件水印嵌入成功后,重新压缩DOCX文件并替换掉原文件。当文件流转和发布时会携带水印信息,整个流程中用户无感。
综上所述,本发明针对原生文件内容可以随时被别人篡改,管控不当可能造成私密数据丢失无法查证,给用户数据带来很多安全隐患的问题。通过在DOCX文件中嵌入隐形水印,隐形水印可以在用户无感的情况下生成水印,在文件流转过程中携带水印,当发生泄露需要溯源时可以读取水印信息。相对其他隐形水印的嵌入方法大幅降低读取和写入的成本。
通过具体实施方式的说明,应当可对本发明为达成预定目的所采取的技术手段及功效得以更加深入且具体的了解,然而所附图示仅是提供参考与说明之用,并非用来对本发明加以限制。

Claims (10)

1.一种DOCX文档的隐形水印嵌入方法,其特征在于,包括:
解压DOCX文件,读取word/rel/document.xml.rels文件,获取无冲突关系ID并关联隐藏水印文件;
读取word/Document.xml获取文档段落信息,并在段落内插入隐藏水印的引用。
2.根据权利要求1所述的DOCX文档的隐形水印嵌入方法,其特征在于,在解压所述DOCX文件之前,所述方法还包括:
解压zip文件,若解压文件中存在word/Document.xml且内容为XML格式,则判定文件为DOCX文件。
3.根据权利要求1所述的DOCX文档的隐形水印嵌入方法,其特征在于,在段落内插入所述隐藏水印之前,所述方法还包括:
保存用户访问信息的二维码图片生成所述隐藏水印文件。
4.根据权利要求3所述的DOCX文档的隐形水印嵌入方法,其特征在于,所述用户访问信息包括:用户名,访问时间,硬件时间,文件创建时间,流转记录及KPI签名。
5.一种DOCX文档的隐形水印嵌入装置,其特征在于,包括:
解压模块,用于解压DOCX文件,读取word/rel/document.xml.rels文件,获取无冲突关系ID并关联隐藏水印文件;
嵌入模块,用于读取word/Document.xml获取文档段落信息,并在段落内插入隐藏水印的引用。
6.根据权利要求5所述的DOCX文档的隐形水印嵌入装置,其特征在于,所述嵌入装置还包括:
识别模块,用于解压zip文件,若解压文件中存在word/Document.xml且内容为XML格式,则判定文件为DOCX文件。
7.根据权利要求5所述的DOCX文档的隐形水印嵌入装置,其特征在于,所述嵌入装置还包括:
水印生成模块,用于保存用户访问信息的二维码图片生成所述隐藏水印文件。
8.根据权利要求7所述的DOCX文档的隐形水印嵌入装置,其特征在于,所述用户访问信息包括:用户名,访问时间,硬件时间,文件创建时间,流转记录及KPI签名。
9.一种电子设备,至少包括存储器、处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器在执行所述存储器上的计算机程序时实现权利要求1至4中任一项所述的DOCX文档的隐形水印嵌入方法的步骤。
10.一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的DOCX文档的隐形水印嵌入方法的步骤。
CN202110860355.8A 2021-07-29 2021-07-29 Docx文档的隐形水印嵌入方法、装置、电子设备及存储介质 Pending CN113343186A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110860355.8A CN113343186A (zh) 2021-07-29 2021-07-29 Docx文档的隐形水印嵌入方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110860355.8A CN113343186A (zh) 2021-07-29 2021-07-29 Docx文档的隐形水印嵌入方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113343186A true CN113343186A (zh) 2021-09-03

Family

ID=77480408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110860355.8A Pending CN113343186A (zh) 2021-07-29 2021-07-29 Docx文档的隐形水印嵌入方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113343186A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117093965A (zh) * 2023-10-20 2023-11-21 江苏省测绘资料档案馆 一种基础测绘成果全流程追踪系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140049802A1 (en) * 2012-08-17 2014-02-20 Samsung Electronics Co., Ltd System and method for digital analysis of authenticity and integrity of documents using portable devices
CN111030963A (zh) * 2018-10-09 2020-04-17 华为技术有限公司 文档追踪方法、网关设备及服务器

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140049802A1 (en) * 2012-08-17 2014-02-20 Samsung Electronics Co., Ltd System and method for digital analysis of authenticity and integrity of documents using portable devices
CN111030963A (zh) * 2018-10-09 2020-04-17 华为技术有限公司 文档追踪方法、网关设备及服务器

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RYANJJ_: "导出word文档生成docx格式 添加水印", 《CSDN网站,HTTPS://BLOG.CSDN.NET/QQ_36068521/ARTICLE/DETAILS/103670890》 *
李兵兵等: "基于ZIP 文档格式的信息隐藏方法", 《计算机工程》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117093965A (zh) * 2023-10-20 2023-11-21 江苏省测绘资料档案馆 一种基础测绘成果全流程追踪系统及方法
CN117093965B (zh) * 2023-10-20 2024-03-12 江苏省测绘资料档案馆 一种基础测绘成果全流程追踪系统及方法

Similar Documents

Publication Publication Date Title
CN111191414B (zh) 一种页面水印生成方法、识别方法、装置、设备及存储介质
CN111008923B (zh) 水印嵌入和水印提取方法、装置和设备
CN110674477A (zh) 一种基于电子文件密级标识的文档溯源方法和装置
JP5371289B2 (ja) 情報処理装置、データ処理方法、プログラム
US20050053258A1 (en) System and method for watermarking a document
US12079323B2 (en) Tampering detection method and apparatus and non-transitory computer-readable storage medium
CN112579958B (zh) 网页转换方法、装置、计算机设备及可读存储介质
CN112800398A (zh) 一种对pdf文件流转的追踪方法
CN108646988B (zh) 文档打印方法和系统
CN113343186A (zh) Docx文档的隐形水印嵌入方法、装置、电子设备及存储介质
US7586641B2 (en) System for certifying whether printed material corresponds to original
CN112100685A (zh) 一种检验检测电子报告的加密与防篡改处理方法
US9128935B2 (en) Method and apparatus for providing interoperability between flat and interactive digital forms using machine-readable codes
CN110874456B (zh) 水印嵌入和水印提取方法、装置及数据处理方法
US20150278162A1 (en) Retention of content in converted documents
CN115795417B (zh) 一种ooxml文档的溯源方法、装置、电子设备及存储介质
CN107730432B (zh) 图片处理方法及应用服务器
KR101870245B1 (ko) 오프라인 문서 추적 방법 및 문서 추적 시스템
CN105786415A (zh) 一种文件打印的加密方法及装置
CN112417828B (zh) 一种针对国产操作系统添加水印标签的方法
US8576049B2 (en) Document authentication and identification
CN112417390A (zh) 文件处理方法、装置、设备及存储介质
KR102226706B1 (ko) 문서 파일에 포함된 멀티미디어 콘텐츠를 이용한 데이터 은닉 장치 및 이를 위한 방법
KR102562480B1 (ko) 패턴 기반 은닉부호 삽입장치 및 방법
KR102425613B1 (ko) 스테가노그라피를 이용한 협업 도구에서의 파일 이력 추적 시스템 및 그 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210903