CN114741717B - 基于ooxml文档的隐藏信息嵌入和提取方法 - Google Patents

基于ooxml文档的隐藏信息嵌入和提取方法 Download PDF

Info

Publication number
CN114741717B
CN114741717B CN202210667465.7A CN202210667465A CN114741717B CN 114741717 B CN114741717 B CN 114741717B CN 202210667465 A CN202210667465 A CN 202210667465A CN 114741717 B CN114741717 B CN 114741717B
Authority
CN
China
Prior art keywords
hidden information
component
specified component
attribute value
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210667465.7A
Other languages
English (en)
Other versions
CN114741717A (zh
Inventor
田辉
鲁国峰
郭玉刚
张志翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei High Dimensional Data Technology Co ltd
Original Assignee
Hefei High Dimensional Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei High Dimensional Data Technology Co ltd filed Critical Hefei High Dimensional Data Technology Co ltd
Priority to CN202210667465.7A priority Critical patent/CN114741717B/zh
Publication of CN114741717A publication Critical patent/CN114741717A/zh
Application granted granted Critical
Publication of CN114741717B publication Critical patent/CN114741717B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/106Enforcing content protection by specific content processing
    • G06F21/1066Hiding content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Multimedia (AREA)
  • Technology Law (AREA)
  • Document Processing Apparatus (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明特别涉及一种基于OOXML文档的隐藏信息嵌入和提取方法,其中嵌入方法包括如下步骤:将OOXML文档解析成xml格式的文件;搜索指定组件对应的xml文件;若搜索到该指定组件对应的xml文件,则在指定组件的标题属性值中写入待嵌入的隐藏信息;若未搜索到该指定组件对应的xml文件,则创建新的指定组件,并在新的指定组件的标题属性值中写入待嵌入的隐藏信息,同时隐藏该新的指定组件。这里通过解析OOXML文档中的指定组件,然后通过将指定组件的标题属性值替换为待嵌入的隐藏信息,指定组件的标题属性值只是用于区分不同的组件,这种修改不会被查阅文档的人所发觉,具有非常好的隐蔽性,达到了对信息进行隐藏的目的。

Description

基于OOXML文档的隐藏信息嵌入和提取方法
技术领域
本发明涉及信息隐藏技术领域,特别涉及一种基于OOXML文档的隐藏信息嵌入和提取方法。
背景技术
隐写术是关于信息隐藏,即不让计划的接收者之外的任何人知道信息的传递事件(而不只是信息的内容)的一门技巧与科学。隐写术英文作“Steganography”,来源于约翰尼斯·特里特米乌斯一本看上去是有关黑魔法,实际上是讲密码学与隐写术的一本书Steganographia中。此书书名来源于希腊语,意为“隐秘书写”。
想要隐藏明文信息,一般有两种方案来实现,第一种是通过对明文信息加密,使得明文信息转换成另外的不可读信息,第二种是隐写,就是将要隐藏的明文信息嵌入到其他的载体中。对于第二种方案,由于嵌入隐藏信息时,对其他载体的修改非常小,一般不会影响到其他载体本身信息的展示。对于第三方来说,对明文加密,很容易被发现;对信息进行隐写,则很难被发现。因此,隐写的方案从行为上来说就非常的安全。
目前,最低有效位(LBS)算法,是利用人类视觉的一个特点,通过将载体的二进制低位替换为密文,从而实现信息的隐写,这个主要是针对图片或视频的。还有针对频域的隐写技术,即通过将图片变换到频域,然后写入隐藏信息,再变换回来。还有诸如此类的其他隐写算法,这些隐写算法多针对图片或视频,对于文档来说,很少见成熟的隐写算法,能够方便的将信息隐藏在文档中。
发明内容
本发明的第一个目的在于提供一种基于OOXML文档的隐藏信息嵌入方法,可以方便的将待嵌入信息写入到文档中。
为实现以上目的,本发明采用的技术方案为:一种基于OOXML文档的隐藏信息嵌入方法,包括如下步骤:将OOXML文档解析成xml格式的文件;搜索指定组件对应的xml文件;若搜索到该指定组件对应的xml文件,则在指定组件的标题属性值中写入待嵌入的隐藏信息;若未搜索到该指定组件对应的xml文件,则创建新的指定组件,并在新的指定组件的标题属性值中写入待嵌入的隐藏信息,同时隐藏该新的指定组件。
与现有技术相比,本发明存在以下技术效果:这里通过解析OOXML文档中的指定组件,然后通过将指定组件的标题属性值替换为待嵌入的隐藏信息,指定组件的标题属性值只是用于区分不同的组件,它不会改变文档的内容,也不会在文档的显示界面展示,因此,这种修改不会被查阅文档的人所发觉,具有非常好的隐蔽性,达到了对信息进行隐藏的目的。
本发明的第二个目的在于提供一种基于OOXML文档的隐藏信息嵌入系统,可以方便的将待嵌入信息写入到文档中。
为实现以上目的,本发明采用的技术方案为:一种基于OOXML文档的隐藏信息嵌入系统,包括:编码单元,用于将待嵌入的信息编码成指定组件的标题属性值;组件查询单元,用于查询指定组件是否存在;组件创建单元,用于在没有指定组件时创建新的指定组件;信息嵌入单元,用于将编码单元输出的标题属性值写入到查询到的指定组件或新建的指定组件中;组件隐藏单元,用于隐藏新建的指定组件。
与现有技术相比,本发明存在以下技术效果:通过设置编码单元,方便将待嵌入信息编码成标题属性值的格式,这样后续写入就很容易,同时,通过设置组件查询单元、组件创建单元以及组件隐藏单元,可以方便的对组件进行操作,设置信息嵌入单元可方便的将信息嵌入到组件中,通过设置这些单元,可以更方便独立的实现信息的隐藏,并且可以根据需要修改相应的单元模块。
本发明的第三个目的在于提供一种基于OOXML文档的隐藏信息提取方法,可以方便的提取文档中嵌入的信息。
为实现以上目的,本发明采用的技术方案为:一种基于OOXML文档的隐藏信息提取方法,包括如下步骤:将OOXML文档解析成xml格式的文件;搜索指定组件对应的xml文件;读取搜索到的指定组件对应的xml文件中的标题属性值;对读取到的标题属性值进行解码后得到嵌入的隐藏信息。
与现有技术相比,本发明存在以下技术效果:与隐藏信息的嵌入方法相对应,我们只需要按照设定的步骤提取相应组件的标题属性值即可方便的提取到隐藏的信息,并且,这里不涉及复杂的计算,提取过程非常的迅速、可靠。
附图说明
图1是隐藏信息嵌入流程图;
图2是隐藏信息嵌入系统框图;
图3是隐藏信息提取流程图。
具体实施方式
下面结合图1至图3,对本发明做进一步详细叙述。
OOXML是由微软公司为Office 2007产品开发的技术规范,现已成为国际文档格式标准,兼容前国际标准开放文档格式和中国文档标准“标文通”(外语简称:UOF);于2006年12月成为ECMA标准。由于其具有诸多优点,已被广泛使用,我们常用的后缀为docx、xlsx、pptx的文档都属于OOXML文档。
参阅图1,本发明公开了一种基于OOXML文档的隐藏信息嵌入方法,包括如下步骤:将OOXML文档解析成xml格式的文件;搜索指定组件对应的xml文件;若搜索到该指定组件对应的xml文件,则在指定组件的标题属性值中写入待嵌入的隐藏信息;若未搜索到该指定组件对应的xml文件,则创建新的指定组件,并在新的指定组件的标题属性值中写入待嵌入的隐藏信息,同时隐藏该新的指定组件。这里通过解析OOXML文档中的指定组件,然后通过将指定组件的标题属性值替换为待嵌入的隐藏信息,指定组件的标题属性值只是用于区分不同的组件,它不会改变文档的内容,也不会在文档的显示界面展示,因此,这种修改不会被查阅文档的人所发觉,具有非常好的隐蔽性,达到了对信息进行隐藏的目的。同时,这种隐写方法鲁棒性高,抗编辑、另存为、复制攻击。
指定组件的标题,可以是name、title、descr等标签,在更多未开发的其他组件中,可能还会以其他的标签当成标题,不管是何种标签,只要等同于标题,修改后不会对组件的显示产生影响就可以进行属性值的修改。
这里说的指定组件可以有很多种选择,我们在选择指定组件时,满足以下两个条件中任一个都可以:其一,该组件能够进行隐藏,这样我们就可以将需要嵌入的信息写入该组件以后,再将该组件隐藏起来,不被人察觉;其二,该组件对应的内容中具有冗余位置,本案中选择的是组件的标题属性值,可以进行信息嵌入并且嵌入后不会影响该组件的显示内容,这样,我们可以在该组件对应内容的冗余位置嵌入隐藏信息。当然,如果能够同时满足上述两个条件的组件,则更加合适。本发明中优选地,所述的指定组件为图表组件和/或表格组件,对于xlsx文档来说,一般用图表组件,即各种柱形图、折线图、饼图等图表,对于pptx文档来说,可以用图表组件,也可以用表格组件,或者两个都用。当然,随着技术的发展,OOXML文档中可能会出现其他更多的组件,如果他们满足上述提及的条件,也可以实现隐藏信息的嵌入。
为了方便后续的提取,区分隐藏信息和正常的指定组件标题属性值,我们可以在隐藏信息前添加标识码或者将隐藏信息重复2或3次后再进行嵌入。比如,我们待嵌入的信息为“EB220020”,嵌入的位置为某个组件的title标签中,嵌入后效果如下:(1)title="000000EB220020",其中前面的6个0为标识码;(2)title="EB220020EB220020EB220020",其中,重复次数为3。这两种方式都有利于后续隐藏信息的提取。
进一步地,想要实现指定组件的隐藏,我们有很多可实现方案。本实施例中,所述新的指定组件通过如下任一方式进行隐藏:方式一:调整指定组件的位置,使其位于可视界面以外,比如对于表格文档而言,当组件的位置为负值时,则该指定组件在表格显示界面中不可见;方式二:调整指定组件的大小,使其尺寸缩小至最小,这样该指定组件虽然存在,但由于其特别小,视觉效果上接近于隐形;方式三:调整指定组件的颜色,使其透明。一般来说,方案二和方案三会结合在一起使用,即:既缩小其尺寸,又调节组件的颜色,这样可以充分保证该指定组件的隐形效果。
参阅图2,本发明还公开了一种基于OOXML文档的隐藏信息嵌入系统,包括:编码单元,用于将待嵌入的信息编码成指定组件的标题属性值;组件查询单元,用于查询指定组件是否存在;组件创建单元,用于在没有指定组件时创建新的指定组件;信息嵌入单元,用于将编码单元输出的标题属性值写入到查询到的指定组件或新建的指定组件中;组件隐藏单元,用于隐藏新建的指定组件。通过设置编码单元,方便将待嵌入信息编码成标题属性值的格式,这样后续写入就很容易,同时,通过设置组件查询单元、组件创建单元以及组件隐藏单元,可以方便的对组件进行操作,设置信息嵌入单元可方便的将信息嵌入到组件中,通过设置这些单元,可以更方便独立的实现信息的隐藏,并且可以根据需要修改相应的单元模块。各单元所执行的功能与前述方法的差不多,这里就不再详细赘述。
参阅图3,本发明还公开了一种基于OOXML文档的隐藏信息提取方法,包括如下步骤:将OOXML文档解析成xml格式的文件;搜索指定组件对应的xml文件;读取搜索到的指定组件对应的xml文件中的标题属性值;对读取到的标题属性值进行解码后得到嵌入的隐藏信息。与隐藏信息的嵌入方法相对应,我们只需要按照设定的步骤提取相应组件的标题属性值即可方便的提取到隐藏的信息,并且,这里不涉及复杂的计算,提取过程非常的迅速、可靠。
需要注意的是,隐藏信息的提取和嵌入是相互对应的。比如隐藏信息在嵌入的时候,在隐藏信息前面加了6个0,那么我们只提取前面有6个0的标题属性值并且将标题属性值去掉6个0后输出;比如隐藏信息在嵌入的时候,重复了2或3次,那么我们只提取重复多次的标题属性值并且将提取到的标题属性值也要去掉重复内容后输出。
本发明还公开了一种计算机可读存储介质和一种电子设备。其中,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如前所述的基于OOXML文档的隐藏信息嵌入方法或者实现如前所述的基于OOXML文档的隐藏信息提取方法。一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序时,实现如前所述的基于OOXML文档的隐藏信息嵌入方法或者实现如前所述的基于OOXML文档的隐藏信息提取方法。

Claims (8)

1.一种基于OOXML文档的隐藏信息嵌入方法,其特征在于:包括如下步骤:
将OOXML文档解析成xml格式的文件;
搜索指定组件对应的xml文件;
若搜索到该指定组件对应的xml文件,则在指定组件的标题属性值中写入待嵌入的隐藏信息;
若未搜索到该指定组件对应的xml文件,则创建新的指定组件,并在新的指定组件的标题属性值中写入待嵌入的隐藏信息,同时隐藏该新的指定组件。
2.如权利要求1所述的基于OOXML文档的隐藏信息嵌入方法,其特征在于:所述的指定组件为图表组件和/或表格组件。
3.如权利要求1所述的基于OOXML文档的隐藏信息嵌入方法,其特征在于:所述新的指定组件通过如下任一方式进行隐藏:
方式一:调整指定组件的位置,使其位于可视界面以外;
方式二:调整指定组件的大小,使其尺寸缩小至最小;
方式三:调整指定组件的颜色,使其透明。
4.如权利要求1所述的基于OOXML文档的隐藏信息嵌入方法,其特征在于:所述在指定组件的标题属性值中写入待嵌入的隐藏信息包括:在隐藏信息前添加标识码或者将隐藏信息重复2或3次后再进行嵌入。
5.一种基于OOXML文档的隐藏信息嵌入系统,其特征在于:包括
编码单元,用于将待嵌入的信息编码成指定组件的标题属性值;
组件查询单元,用于查询指定组件是否存在;
组件创建单元,用于在没有指定组件时创建新的指定组件;
信息嵌入单元,用于将编码单元输出的标题属性值写入到查询到的指定组件或新建的指定组件中;
组件隐藏单元,用于隐藏新建的指定组件。
6.一种基于OOXML文档的隐藏信息提取方法,其特征在于:包括如下步骤:
将OOXML文档解析成xml格式的文件;
搜索指定组件对应的xml文件;
读取搜索到的指定组件对应的xml文件中的标题属性值;
对读取到的标题属性值进行解码后得到嵌入的隐藏信息。
7.一种计算机可读存储介质,其特征在于:其上存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1-4中任一项所述的基于OOXML文档的隐藏信息嵌入方法或者实现如权利要求6所述的基于OOXML文档的隐藏信息提取方法。
8.一种电子设备,其特征在于:包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-4中任一项所述的基于OOXML文档的隐藏信息嵌入方法或者实现如权利要求6所述的基于OOXML文档的隐藏信息提取方法。
CN202210667465.7A 2022-06-14 2022-06-14 基于ooxml文档的隐藏信息嵌入和提取方法 Active CN114741717B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210667465.7A CN114741717B (zh) 2022-06-14 2022-06-14 基于ooxml文档的隐藏信息嵌入和提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210667465.7A CN114741717B (zh) 2022-06-14 2022-06-14 基于ooxml文档的隐藏信息嵌入和提取方法

Publications (2)

Publication Number Publication Date
CN114741717A CN114741717A (zh) 2022-07-12
CN114741717B true CN114741717B (zh) 2022-09-06

Family

ID=82288157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210667465.7A Active CN114741717B (zh) 2022-06-14 2022-06-14 基于ooxml文档的隐藏信息嵌入和提取方法

Country Status (1)

Country Link
CN (1) CN114741717B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116126349B (zh) * 2023-04-18 2023-06-27 合肥高维数据技术有限公司 Ooxml文档夹带检测方法、存储介质和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111259202A (zh) * 2020-01-10 2020-06-09 西宁宁光工程咨询有限公司 一种文档结构化数据嵌入方法及系统
US10706160B1 (en) * 2017-08-25 2020-07-07 Intuit Inc. Methods, systems, and articles of manufacture for protecting data in an electronic document using steganography techniques
JP2020149628A (ja) * 2019-03-15 2020-09-17 エヌ・ティ・ティ・コミュニケーションズ株式会社 情報処理装置、情報処理方法およびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096787B (zh) * 2009-12-14 2013-06-05 南京信息工程大学 一种基于word2007文本切分的信息隐藏方法及其装置
CN102930187A (zh) * 2012-10-30 2013-02-13 南京信息工程大学 一种基于属性顺序变换的oox文档数字水印方法
CN105046159B (zh) * 2015-06-18 2018-04-03 中国科学院信息工程研究所 基于修改标识符的oox文本文档隐私信息检测方法
CN109993681B (zh) * 2019-04-10 2023-07-07 兰州大学 一种基于颜色属性值变换的oox格式文档的数字水印方法
CN114036561A (zh) * 2021-11-17 2022-02-11 深圳集智数字科技有限公司 信息隐藏、信息获取方法、装置、存储介质及电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10706160B1 (en) * 2017-08-25 2020-07-07 Intuit Inc. Methods, systems, and articles of manufacture for protecting data in an electronic document using steganography techniques
JP2020149628A (ja) * 2019-03-15 2020-09-17 エヌ・ティ・ティ・コミュニケーションズ株式会社 情報処理装置、情報処理方法およびプログラム
CN111259202A (zh) * 2020-01-10 2020-06-09 西宁宁光工程咨询有限公司 一种文档结构化数据嵌入方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DOCX文档解析及隐藏信息提取算法;秦志红;《信息科技辑》;20211110;全文 *

Also Published As

Publication number Publication date
CN114741717A (zh) 2022-07-12

Similar Documents

Publication Publication Date Title
US5761686A (en) Embedding encoded information in an iconic version of a text image
EP1410619B1 (en) Method of invisibly embedding and hiding data into soft-copy text documents
US5765176A (en) Performing document image management tasks using an iconic image having embedded encoded information
Taha et al. A high capacity algorithm for information hiding in Arabic text
US5699427A (en) Method to deter document and intellectual property piracy through individualization
CN102393892B (zh) 一种word文档版权保护的方法
US20040001606A1 (en) Watermark fonts
US20050053258A1 (en) System and method for watermarking a document
Lee et al. A new approach to covert communication via PDF files
Shirali-Shahreza et al. Arabic/Persian text steganography utilizing similar letters with different codes
CN101645061A (zh) 一种以文本信息为载体的信息隐藏方法
Gutub et al. Utilizing diacritic marks for Arabic text steganography
CN109785222B (zh) 一种用于网页的信息快速嵌入和提取的方法
CN114741717B (zh) 基于ooxml文档的隐藏信息嵌入和提取方法
CN102027526A (zh) 使用间距编码在文本文档中嵌入隐秘数据的方法和系统
Stojanov et al. A new property coding in text steganography of Microsoft Word documents
US20150278162A1 (en) Retention of content in converted documents
CN102385680A (zh) 一种word文档的防篡改保护方法
Sharma et al. A study of steganography based data hiding techniques
TW200941424A (en) Method and system for embedding covert data in text document using character rotation
Lin et al. A copyright protection scheme based on PDF
Tiwari et al. A novel methodology for data hiding in PDF files
CN104517259A (zh) 彩色文本文件中数字水印的嵌入方法和装置
Cheng et al. A robust text digital watermarking algorithm based on fragments regrouping strategy
US8576049B2 (en) Document authentication and identification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant