CN109785222B - 一种用于网页的信息快速嵌入和提取的方法 - Google Patents

一种用于网页的信息快速嵌入和提取的方法 Download PDF

Info

Publication number
CN109785222B
CN109785222B CN201910042435.5A CN201910042435A CN109785222B CN 109785222 B CN109785222 B CN 109785222B CN 201910042435 A CN201910042435 A CN 201910042435A CN 109785222 B CN109785222 B CN 109785222B
Authority
CN
China
Prior art keywords
embedding
character string
watermark
webpage
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910042435.5A
Other languages
English (en)
Other versions
CN109785222A (zh
Inventor
陆哲明
归加琪
郁发新
罗雪雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Kiel Technology Co.,Ltd.
Original Assignee
Hangzhou Kilby Blockchain Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Kilby Blockchain Technology Ltd filed Critical Hangzhou Kilby Blockchain Technology Ltd
Priority to CN201910042435.5A priority Critical patent/CN109785222B/zh
Publication of CN109785222A publication Critical patent/CN109785222A/zh
Application granted granted Critical
Publication of CN109785222B publication Critical patent/CN109785222B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种用于网页的信息快速嵌入和提取的方法,包括第一网页、嵌入信息,嵌入信息包括多重嵌入信息,其对第一网页进行信息嵌入,形成多重嵌入,进行信息隐藏和安全处理;通过嵌入方法和提取方法分别对第一网页进行正向处理和反向处理,即提取方法是嵌入方法的逆处理。

Description

一种用于网页的信息快速嵌入和提取的方法
技术领域
本发明涉及信息隐藏技术领域,更具体的说,它涉及一种用于网页的信息快速嵌入和提取的方法。
背景技术
信息隐藏就是将秘密信息隐藏于另一非保密载体中,依附于该载体进行传递,以不引起检查者的注意。它可以用来解决信息时代面临的版权保护、交易跟踪、内容真伪鉴别、保密通信等问题,在现代社会中扮演着越来越重要的角色。根据非保密载体的不同,信息隐藏分为不同的类型,网页信息隐藏是其中的一种。但相对于图像、音频、视频等载体的信息隐藏技术,网页信息隐藏技术的研究成果较少。网页信息隐藏是以网页作为载体和传播方式的信息隐藏,是网页和信息隐藏技术相结合的产物。通过将需要在网页中传输的重要信息隐藏为秘密信息的形式,可以提高网页传递的安全性能;同时,由于网络上信息众多,信息更新较快,也使得信息隐藏更具有隐蔽性和安全性。从结构上看,网页主要由数据信息和超文本语言(HTML)定义的标记两部分组成,因此,在网页上进行信息隐藏可以有2种策略,一种是在标记中隐藏信息,一种则是在数据元素中隐藏信息。
网页通过网络浏览器解析HTML语言形成,网页在网络上传输时,浏览者并不能直接看到源代码,浏览到的是经过网络浏览器解析后的内容。基于标记的网页信息隐藏就是根据网页的这一特征,通过根据秘密信息修改HTML文件的语法和标记,使其在修改前后解析的内容相同来达到隐藏目的。目前,国内外的研究主要集中在基于网页标记进行信息隐藏,该方法易于实现,但由于标记文件较小,其隐藏容量也非常有限。
作为传播信息的载体,网页中不仅包含标记,还包含文本、图像、音频、动画和视频等各种多媒体数据,也即网页数据元素,实际上越来越多的信息量出现在网页内容上(例如视频网站等),网页内容的安全问题逐渐成为了热点问题。基于数据的网页信息隐藏技术选取网页中某一多媒体数据作为隐藏载体,通过使隐藏前后数据元素的视觉效果不变来达到信息隐藏的目的,相对于基于标记的信息隐藏方法,基于数据进行信息隐藏的隐藏容量要大得多。
总的来看,与网页技术的发展相比,网页信息隐藏技术的发展相对落后。基于标记的网页信息隐藏算法实现简单,但隐藏容量有限,无法完成大数据量秘密信息的隐藏,这也正是阻碍该算法实际应用的瓶颈。相比之下,基于数据的网页信息隐藏可以实现大数据量秘密信息的隐藏,但由于通信双方需要事先约定载体数据元素,从而使算法的灵活性欠佳;同时,基于数据元素的隐藏算法往往比基于标记的隐藏算法复杂,当秘密信息数据量较小时,若仍采用基于数据的隐藏方法则会降低实现效率。基于上述分析可知,网页信息隐藏领域急需一种普适性好的、可根据网页特点在网页的标记或数据中嵌入秘密信息的多重冗余嵌入方法。
发明内容
本发明克服了现有技术的不足,提供一种简单快速有效的多重信息隐藏的一种用于网页的信息快速嵌入和提取的方法及其装置。
本发明的技术方案如下:
一种用于网页的信息快速嵌入和提取的方法,包括第一网页、嵌入信息,嵌入信息包括多重嵌入信息,其对第一网页进行信息嵌入,形成多重嵌入,进行信息隐藏和安全处理;通过嵌入方法和提取方法分别对第一网页进行正向处理和反向处理,即提取方法是嵌入方法的逆处理;其中嵌入方法具体步骤如下:
101)输入步骤:输入第一网页、时间戳、第一字符串、嵌入参数;其中嵌入参数包括置乱密钥、第一字符串长度、嵌入模块、筛选图片宽度阈值、筛选图片高度阈值、DCT系数位置、加权系数信息;第一字符串为待嵌入的秘密信息;
102)时间戳步骤:在第一字符串后面加上时间戳得到第二字符串;
103)加密步骤:根据嵌入参数中的置乱密钥,对第二字符串进行加密处理得到第三字符串;
104)嵌入步骤:根据嵌入参数中的嵌入模块选择嵌入方案,将第三字符串嵌入到第一网页,得到第二网页;
105)输出步骤:输出第二网页,并安全地输出和保存嵌入参数,即水印提取码,以便提供准确信息给水印信息提取端。
进一步的,嵌入方案具体如下:输入第一网页和第三字符串;将第三字符串转化为二值表示,得到第一水印比特序列;在第一水印比特序列前部加上信息头标识位,得到第二水印比特序列;
遍历第一网页中的所有图像,根据图片宽度阈值和图片高度阈值的限制,筛选出一系列图像作为载体;以图像水印嵌入方法将第二水印比特序列嵌入到所选的每幅图像中,得到第二网页。
进一步的,图像水印嵌入方法采用修改DCT系数进行嵌入,针对每幅图像的具体嵌入如下:
将第一图像表示成YCbCr格式,选择Y分量进行嵌入,Cb分量和Cr分量不变;对Y分量进行8*8分块和DCT变换,得到一系列8*8系数矩阵;第二水印比特序列中的若干位数字,对应每一系数矩阵的若干系数,若干系数由嵌入参数中的DCT系数位置所指定;根据一定的规则修改每个图像水印位置中的相应系数,直到所有水印嵌完;
将修改后的各系数矩阵通过DCT反变换,组合得到修改后的Y分量;修改的Y分量和保持不变的Cb分量和Cr分量组合在一起,转换成第一图像的图像格式后保存,得到第二图像;用第二图像覆盖第一图像。
进一步的,水印嵌入方法以混合加权嵌入方法将第一图像嵌入到所选的每幅图像中,具体嵌入如下:
根据第一图像的长和宽,利用模板匹配方法,找到第一图像中的最暗区域;保持第一图像其他区域不变,基于嵌入参数中的加权系数,将第一图像中的最暗区域和第一图像进行加权相加,得到第二图像;用第二图像覆盖第一图像。
进一步的,将第三字符串转化为二值图像,得到第一水印图像;将第一水印图像拷贝到第一网页的关联文件夹下;用记事本或其他文本编辑软件打开第一网页,并查找最后一个</body>标记;在该标记下一行写入"<script>var WM=document.createElement("img");WM.alt="WM000";WM.setAttribute("src","****");WM.style.position="fixed";WM.style.display="none";WM.style.top=0+"px";WM.style.left=0+"px";WM.style.zIndex=100000;document.body.appendChild(WM);</script>";其中WM000是水印标记;****是指第一水印图像的路径;保存网页得到第二网页。
进一步的,将第三字符串转化为十六进制的第四字符串;用记事本或其他文本编辑软件打开第一网页,并寻找合适的随机行;在这一行中插入<div style="display:none"></div><div>WM000********</div>;其中WM000是水印标记;********是第四字符串;保存网页得到第二网页。
进一步的,置乱密钥为第二字符串进行加密处理得到第三字符串,具体包括:首先根据置乱密钥生成混沌序列,由混沌序列对第二字符串进行置乱处理,得到第三字符串。
另一方面,本发明还提供了一种用于网页的信息快速嵌入和提取的装置,用于执行上述的方法,包括秘密信息嵌入装置,其包括输入单元、水印字符串生成单元、水印信息嵌入单元、输出单元、嵌入模块;
输入单元,用于输入第一网页、第一字符串、嵌入参数;嵌入参数包括置乱密钥、第一字符串长度、嵌入模式、筛选图片宽度阈值、筛选图片高度阈值、DCT系数位置、加权系数信息;
水印字符串生成单元,在第一字符串后面加上时间戳得到第二字符串,根据嵌入参数中的置乱密钥对第二字符串进行加密处理得到第三字符串;
水印信息嵌入单元,根据嵌入参数中的嵌入模块利用相应的一个或多个嵌入方案将第三字符串嵌入到第一网页中,得到第二网页;
输出单元,用于输出第二网页以及安全地输出和保存嵌入参数,即水印提取码,便提供给水印信息提取端。
进一步的,秘密信息嵌入装置还包括嵌入电子设备,其包括处理器和存储器;存储器用于存储嵌入方法的程序,处理器用于运行存储于存储器中的嵌入方法的程序。
进一步的,包括秘密信息提取装置,其包括输入单元、字符串提取单元、字符串反置乱单元、字符串剥离单元、秘密信息重构单元;
输入单元用于输入水印提取码和第二网页,其中水印提取码包括置乱密钥、第一字符串长度、嵌入模式、筛选图片宽最小值、筛选图片高最小值、DCT系数位置、加权系数;
字符串提取单元根据水印提取码中的嵌入方案选择相应的提取模块从第二网页提取出第五字符串和第一网页;
字符串反置乱单元,根据水印提取码中的置乱密钥对第五字符串进行反置乱处理,得到第六字符串;
字符串剥离单元,根据水印提取码中的第一字符串长度剥离掉时间戳,得到第七字符串,时间戳作为时间证明;
秘密信息重构单元,比较各个提取方案提取出的第七字符串,得到最终的第八字符串作为提取的秘密信息;
秘密信息提取装置还包括提取电子设备,其包括处理器和存储器;存储器用于存储提取方法的程序,处理器用于运行存储于存储器中的提取方法的程序。
本发明相比现有技术优点在于:本发明可以根据网页的特点进行多重冗余嵌入,以确保从网页标记中或网页数据中能至少提取出一个有效的秘密信息。还包括用于网页保护的秘密信息多重冗余嵌入方法、装置、电子设备及存储设备,通过至多采用四个嵌入方案在网页中冗余嵌入字符串,提高了嵌入普适性(对不同特性的网页都可以嵌入)、字符串的存活能力和鲁棒性。经实验验证,这些改动对网页文件没有视觉影响,满足不可见性和隐蔽性。
附图说明
图1是本发明的一种秘密信息嵌入方法的流程图。
图2是本发明的一种秘密信息提取方法的流程图。
图3是本发明的一种秘密信息嵌入装置的示意图。
图4是本发明的一种嵌入电子设备的示意图。
图5是本发明的一种秘密信息提取装置的示意图。
图6是本发明的一种提取电子设备的示意图。
具体实施方式
下面详细描述本发明的实施方式,其中自始至终相同或类似的标号表示相同或类似的元件或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明而不能作为对本发明的限制。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科技术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样的定义,不会用理想化或过于正式的含义来解释。
下面结合附图和具体实施方式对本发明进一步说明。
如图1至图6所示,一种用于网页的信息快速嵌入和提取的方法,包括第一网页、嵌入信息,嵌入信息包括多重嵌入信息,其对第一网页进行信息嵌入,形成多重嵌入,进行信息隐藏和安全处理;通过嵌入方法和提取方法分别对第一网页进行正向处理和反向处理,即提取方法是嵌入方法的逆处理。
根据网页的特点进行多重冗余嵌入,以确保从网页标记中或网页数据中能至少提取出一个有效的秘密信息。本方法最多采用四个嵌入方案,而且每个方案独立。各方案的取舍取决于鲁棒性安全性需要和文档特点。对于安全性鲁棒性要求高的场合,尽量用四个方案进行四重冗余嵌入。对于安全性鲁棒性要求不高时,可以根据情况选择只嵌一重、只嵌两重或只嵌三重。对于含有大量标记和大量图片的网页,可以嵌入四重。对于不含图片但含有大量标记的或者只有图片但标记很少的,可以根据情况选择只嵌一重、只嵌两重或只嵌三重。四种嵌入方案中,涉及到的初始秘密信息以字符串形式给出,即待嵌入的秘密信息是相同的字符串(第一字符串),在第一字符串后面加上时间戳得到含时间戳的字符串(第二字符串),对第二字符串进行加密处理得到加密的含时间戳字符串(第三字符串)。最终获得的含水印网页文档可以经历如下15种可能:用数字0-14表示,分别代表如下组合:
0:只用嵌入方案一;1:只用嵌入方案二;2:只用嵌入方案三;3:只用嵌入方案四;
4:用嵌入方案一加二;5:用嵌入方案一加三;6:用嵌入方案一加四;
7:用嵌入方案二加三;8:用嵌入方案二加四;9:用嵌入方案三加四;
10:用嵌入方案一加二加三;11:用嵌入方案一加二加四;
12:用嵌入方案一加三加四;13:用嵌入方案二加三加四;14:四个方案都用。
这里把待嵌入秘密信息的网页称为第一网页,而把含水印的网页称为第二网页。
其中嵌入方法具体步骤如下:
101)输入步骤:输入第一网页、时间戳、第一字符串、嵌入参数;其中嵌入参数包括置乱密钥、第一字符串长度、嵌入模块、筛选图片宽度阈值、筛选图片高度阈值、DCT系数位置、加权系数信息;第一字符串为待嵌入的秘密信息。
嵌入参数中的置乱密钥用于对后面产生的第二字符串进行加密。参数筛选图片宽度阈值和筛选图片高度阈值,将在嵌入模块中的嵌入方案一和嵌入方案二中使用。DCT系数位置在嵌入方案一中使用,而加权系数在嵌入方案二中使用。
102)时间戳步骤:第一字符串,指待嵌入到第一网页中的版权信息或指纹信息,如某个公司的公司名、某个员工的员工编号或其他标识信息。对第一字符串加时间戳生成第二字符串的目的是证明网页创建或移交的时间。
103)加密步骤:根据嵌入参数中的置乱密钥,对第二字符串进行加密处理得到第三字符串;生成的第三字符串可以隐藏嵌入到第一网页中,不会影响原文档的使用价值,也不易被探知和再次修改。但该字符串可以被生产方识别和辨认。通过这些嵌入在Word文档中的水印信息,可以达到确认版权所有者和跟踪分发者或购买者的目的。
为了提高水印嵌入的安全性,将第二字符串转换成第三字符串的一种实现方式如下:基于置乱密钥利用logistics映射后生成一个混沌序列;基于生成的混沌序列对第二字符串进行置乱,就可得到第三字符串。
104)嵌入步骤:根据嵌入参数中的嵌入模块选择嵌入方案,将第三字符串嵌入到第一网页,得到第二网页。这个过程涉及到四种可选的嵌入方案。
嵌入方案一:要求网页中含有一幅或多幅其宽和高分别超过嵌入参数中指定的筛选图片宽度阈值和筛选图片高度阈值的图片。将第三字符串冗余地嵌入到这些图片中,具体如下:
输入第一网页和第三字符串;将第三字符串转化为二值表示,得到第一水印比特序列;在第一水印比特序列前部加上信息头标识位(一般以20个0作为标识位),得到第二水印比特序列。其中信息头标识位是为了在水印提取时能够校验该幅图片是否嵌入了水印,若没有检测到15个以上的0,说明这幅图片没有嵌入字符串,可以省去后续提取,节省提取时间。
遍历第一网页中的所有图像,根据图片宽度阈值和筛选图片高度阈值的限制,选出一系列图像作为载体。以合适的图像水印嵌入方法将第二水印比特序列嵌入到所选的每幅图像中,得到第二网页。
嵌入方法选用修改DCT系数,其能够实现盲提取的任意方法嵌入,针对每幅图像(第一图像)的嵌入如下:将第一图像表示成YCbCr格式,选择Y分量进行嵌入,Cb分量和Cr分量不变;对Y分量进行8*8分块DCT变换,得到一系列8*8系数矩阵;第二水印比特序列中的若干位数字,对应每一系数矩阵的若干系数,若干系数由嵌入参数中的DCT系数位置所指定。根据一定的规则修改每个图像水印位置中的相应系数,直到所有水印嵌完。选系数由嵌入参数中的DCT系数位置指定,通常选择中频系数,假设把8*8DCT系数用之字形排序,位置从0-63分别表示从直流到低频到高频,通常可以选择位置处在5-10之间系数,并且修改的DCT个数不要超过4个为好,也就是每个8*8DCT系数块最多嵌入4比特水印。
将修改后的各系数矩阵通过DCT反变换,组合在一起获得修改后的Y分量;修改的Y分量和保持不变的Cb分量和Cr分量组合在一起,转换成第一图像的图像格式后保存,得到第二图像;用第二图像覆盖第一图像。这里选用Y分量的目的是增加本方法的实用性和鲁棒性,不管灰度图像还是彩色图像。选用8*8分块DCT的目的是与JPEG压缩标准兼容。
嵌入方案二:同样要求网页中含有一幅或多幅其宽和高分别超过嵌入参数中指定的筛选图片宽度阈值和筛选图片高度阈值的图片。将字符串以图片的形式与选出的网页中的图片的最暗区域进行加权混合,具体如下:
输入第一网页和第三字符串;将第三字符串转化为二值图像,得到第一水印图像;这里的一种实现方法就是用程序自动将字符串以黑字写到白底的图片中并保存为二值BMP图像即可。根据图片宽度阈值和筛选图片高度阈值的限制,遍历第一网页中的所有图像,选出一系列图像作为载体;以混合加权嵌入方法将第一水印图像嵌入到所选的每幅图像中;得到第二网页。
混合加权嵌入方法将第一水印图像嵌入到所选的每幅图像中,针对每幅图像(第一图像)的嵌入如下:根据第一水印图像的长和宽,利用模板匹配算法,找到第一图像中的最暗区域;保持第一图像其他区域不变,基于嵌入参数中的加权系数,将第一图像中的最暗区域和第一水印图像进行加权相加,得到第二图像。用第二图像覆盖第一图像。这里加权系数由嵌入参数指定,通常水印图片占20%以下,网页图片占80%。
嵌入方案一和嵌入方案二所选择的图片最好相互独立,以减少嵌入同一图片时嵌入方案二对嵌入方案一的干扰。
嵌入方案三:要求网页包含足够多的标记,也就是说用记事本或其他文本编辑软件打开时里面具有足够多的文本,这样增加一些内容不足以引起注意,其是将字符串以图片形式写入网页中但将它设置为不可见,具体如下:将第三字符串转化为二值图像,得到第一水印图像,这里的一种实现方法就是用程序自动将字符串以黑字写到白底的图片中并保存为二值BMP图像即可。将第一水印图像拷贝到第一网页的关联文件夹下;用记事本或其他文本编辑软件打开第一网页,并查找最后一个</body>标记;在该标记下一行写入"<script>var WM=document.createElement("img");WM.alt="WM000";WM.setAttribute("src","****");WM.style.position="fixed";WM.style.display="none";WM.style.top=0+"px";WM.style.left=0+"px";WM.style.zIndex=100000;document.body.appendChild(WM);</script>";保存网页得到第二网页。其中里面WM000是水印标记,****是指第一水印图像的路径。
嵌入方案四:要求网页包含足够多的标记,也就是说用记事本或其他文本编辑软件打开时里面具有足够多的文本,这样增加一些内容不足以引起注意,其是将字符串以十六进制形式写入网页中,具体如下:将第三字符串转化为十六进制的第四字符串;用记事本或其他文本编辑软件打开第一网页,并寻找合适的随机一行;在这一行中插入<div style="display:none"></div><div>WM000********</div>,保存网页得到第二网页。其中WM000是水印标记,而********代表第四字符串。
105)输出步骤:输出第二网页,并安全地输出和保存嵌入参数,即水印提取码,以便提供准确信息给水印信息提取端。
为了让水印信息提取端能够获得所述嵌入参数和额外参数,可以将这些信息提供给水印信息提取端。将所述嵌入参数和额外参数提供给水印信息提取端,可以采用两种方式:一种方式是将所述嵌入参数和额外参数以单独消息的形式发送至水印提取端;另一种方式是以水印信息提取端和水印信息嵌入端预先约定的方式将所述嵌入参数和额外参数提供给水印信息提取端。本方法以通过存储水印提取码的方式来提供。
本申请首先输入第一网页、第一字符串、嵌入参数;然后在第一字符串后面加上时间戳得到第二字符串;然后根据嵌入参数中的置乱密钥对第二字符串进行加密处理得到第三字符串;随后根据嵌入参数中的嵌入模式利用相应的一个或多个嵌入方案将第三字符串嵌入到第一网页中,得到第二网页;最后输出第二网页,安全地输出和保存嵌入参数,即水印提取码,以便提供给水印信息提取端。该方法采用了冗余嵌入,各方案互相独立,对网页视觉效果无影响;由于进行了多方案冗余嵌入,提高了适用性,并具有较好的隐蔽性和安全性。
如图2所示,提取方法与嵌入方法反向具体过程如下:
在步骤S201中,输入水印提取码(里面包括置乱密钥、第一字符串长度、嵌入模式、筛选图片宽度阈值、筛选图片高度阈值、DCT系数位置、加权系数等参数)、输入第三网页即嵌入方法中生成的第二网页。
第三网页指的是可以待提取水印的网页。水印提取码中的置乱密钥用于对第四字符串进行解密,即对应嵌入方法中的第三字符串的解密。
提取模式与嵌入过程的含义相同,提取模式一样一共有15种,用数字0-14表示,分别代表提取时的方案组合:
0:只能用提取方案一;1:只能用提取方案二;2:只能用提取方案三;3:只能用提取方案四;4:可用提取方案一加二;5:可用提取方案一加三;6:可用提取方案一加四;7:可用提取方案二加三;8:可用提取方案二加四;9:可用提取方案三加四;10:可用提取方案一加二加三;11:可用提取方案一加二加四;12:可用提取方案一加三加四;13:可用提取方案二加三加四;14:四个方案都可用。
其中参数筛选图片宽最小值和筛选图片高最小值将在提取方案一和提取方案二中使用。DCT系数位置在提取方案一中使用,而加权系数在提取方案二中使用。提取无误时,第一字符串长度指的就是第六字符串的长度。第六字符串对应嵌入方法中的第一字符串的长度。
在步骤S202中,根据水印提取码中的嵌入方案选择相应的提取方案从第三网页中提取出第四字符串。具体的提取方法如下:
提取方案一:其与嵌入方案一相对应,输入第三网页,遍历第三网页中的所有图像,根据水印提取码中的大于图片宽度阈值和图片高度阈值的图片,选出符合要求的图像作为待检图像载体。从每幅待检图像载体中按照前述图像水印嵌入方法对应的提取方法提取第三水印比特序列即对应嵌入方案一中的第二水印比特序列;其中与前述修改DCT系数嵌入方法对应的盲提取方法,针对每幅待检图像载体(第三图像)的提取如下:将第三图像表示成YCbCr格式,选择Y分量进行提取;对Y分量进行8*8分块DCT变换得到一系列8*8系数矩阵;根据嵌入的逆过程从每一个系数矩阵中的由水印提取码中的DCT系数位置所指定的若干系数中提取出对应的若干水印位,直到得到给定数目的水印位;将所有水印位组合成第三水印比特序列。
判断所有第三水印比特序列的前20比特,筛选出含有15个以上0的第三水印比特序列,得到一组第四水印比特序列;对这些第四水印比特序列进行平均并去掉前20比特,得到第五水印比特序列,即对应嵌入方案一中的第一水印比特序列;将第五水印比特序列转化为字符串,得到第四字符串。
提取方法二:与嵌入方案二相对应,输入第三网页;遍历第三网页中的所有图像,根据水印提取码中的筛选大于图片宽度阈值和图片高度阈值的图像,选出符合要求的图像作为待检图像载体;对每幅待检图像载体进行基于LOG对数的图像增强处理;从增强结果中观察增强后的待检图像载体里的字符串信息,得到第四字符串。这里基于LOG对数的图像增强处理就是指将图片的每个像素进行LOG对数的运算,观察运算结果中展示的字符串信息。
提取方法三:与水印嵌入方案三相对应,输入第三网页;用记事本或其他文本编辑软件打开第三网页并寻找字符串WM000,若找不到,则说明没有水印嵌入,退出;否则,继续下一步;(3)找到"WM.style.position="fixed";WM.style.display="none";(4)将"WM.style.position="fixed";WM.style.display="none";"替换成"WM.style.position="fixed";"将网页另存为第四网页;利用网页浏览器打开第四网页,可观察网页里的二值图像;将该二值图像利用文字识别软件或人工观察转化为第四字符串。
提取方法四:与水印嵌入方案四相对应,输入第三网页;用记事本或其他文本编辑软件打开第三网页;寻找字符串WM000,若没有则说明没有水印嵌入,退出;否则继续,提取字符串WM000后面给定长度的字符串,得到十六进制的第四字符串;将第四字符串还原并替换原第四字符串。
在步骤S203中,根据水印提取码中的置乱密钥对第四字符串进行反置乱处理,得到第五字符串;从第五字符串中根据水印提取码中的第一字符串长度剥离掉时间戳,得到第六字符串。
这里可以首先使用水印提取码中的置乱密钥产生混沌序列,然后基于生成的混沌序列,对所述第四字符串进行反置乱处理得到第五字符串。
在步骤S204中,比较由各个提取方案提取出的第六字符串,基于少数服从多数原则,得到最终的第七字符串。输出第七字符串,作为提取的秘密信息。输出时间戳,作为时间证明。
由于可能采用了多种冗余嵌入方案,可以根据各种提取结果,综合出最终结果。若某个方案提取出来的字符串已经很清晰,则可以忽略其他方案的提取结果。对于提取失败的方案,也直接忽略。综上信息提取方法,处理速度很快,满足快速检测水印的需要。
本方案还提供了一种用于网页的信息快速嵌入和提取的装置,用于执行上述的方法,包括秘密信息嵌入装置,其包括输入单元、水印字符串生成单元、水印信息嵌入单元、输出单元、嵌入模块。
输入单元用于输入第一网页、第一字符串、嵌入参数。
水印字符串生成单元,用于在第一字符串后面加上时间戳得到第二字符串,根据嵌入参数中的置乱密钥对第二字符串进行加密处理得到第三字符串。具体的基于嵌入参数中的置乱密钥生成一个混沌序列;基于生成的混沌序列对所述第二字符串进行置乱处理,得到第三字符串。
水印信息嵌入单元,根据嵌入参数中的嵌入模式利用相应的一个或多个嵌入方案将第三字符串嵌入到第一网页中,得到第二网页。
输出单元,用于输出第二网页以及安全地输出和保存嵌入参数,即水印提取码,以便提供给水印信息提取端。
嵌入模式与嵌入方法一一对应,生成多个嵌入模式。
秘密信息嵌入装置还包括嵌入电子设备,其包括处理器和存储器。存储器用于存储嵌入方法的程序,处理器用于运行存储于存储器中的嵌入方法的程序。
秘密信息提取装置,其包括输入单元、字符串提取单元、字符串剥离单元、字符串反置乱单元、秘密信息重构单元。
输入单元用于输入水印提取码和第二网页,其中水印提取码包括置乱密钥、第一字符串长度、嵌入模式、筛选图片宽最小值、筛选图片高最小值、DCT系数位置、加权系数等参数;
字符串提取单元,用于根据水印提取码中的嵌入模式,采用一种或多种嵌入方案对应的提取方案从第三网页中独立地提取出第四字符串;
字符串反置乱单元,用于根据水印提取码中的置乱密钥对第四字符串进行反置乱处理,得到第五字符串;
字符串剥离单元,用于从第五字符串中根据水印提取码中的第一字符串长度剥离掉时间戳,得到第六字符串;
秘密信息重构单元,用于比较由各个提取方案提取出的第六字符串,基于少数服从多数原则,得到最终的第七字符串。输出第七字符串,作为提取的秘密信息。输出时间戳,作为时间证明。
秘密信息提取装置还包括提取电子设备,其包括处理器和存储器;存储器用于存储提取方法的程序,处理器用于运行存储于存储器中的提取方法的程序。
其中具体实现过程与提取方法相同不在赘述。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (9)

1.一种用于网页的信息快速嵌入和提取的方法,其特征在于,包括第一网页、嵌入信息,嵌入信息包括多重嵌入信息,其对第一网页进行信息嵌入,形成多重嵌入,进行信息隐藏和安全处理;通过嵌入方法和提取方法分别对第一网页进行正向处理和反向处理,即提取方法是嵌入方法的逆处理;其中嵌入方法具体步骤如下:
101)输入步骤:输入第一网页、时间戳、第一字符串、嵌入参数;其中嵌入参数包括置乱密钥、第一字符串长度、嵌入模块、筛选图片宽度阈值、筛选图片高度阈值、DCT系数位置、加权系数信息;第一字符串为待嵌入的秘密信息;
102)时间戳步骤:在第一字符串后面加上时间戳得到第二字符串;
103)加密步骤:根据嵌入参数中的置乱密钥,对第二字符串进行加密处理得到第三字符串;
104)嵌入步骤:根据嵌入参数中的嵌入模块选择嵌入方案,将第三字符串嵌入到第一网页,得到第二网页;
嵌入方案包括嵌入方案一和嵌入方案二;
嵌入方案一具体如下:输入第一网页和第三字符串;将第三字符串转化为二值表示,得到第一水印比特序列;在第一水印比特序列前部加上信息头标识位,得到第二水印比特序列;遍历第一网页中的所有图像,根据图片宽度阈值和图片高度阈值的限制,筛选出一系列图像作为载体;根据利用DCT系数位置的图像水印嵌入方法将第二水印比特序列嵌入到所选的每幅图像中,得到第二网页;
嵌入方案二具体如下:输入第一网页和第三字符串;将第三字符串转化为二值表示,得到第一水印比特序列;在第一水印比特序列前部加上信息头标识位,得到第二水印比特序列;遍历第一网页中的所有图像,根据图片宽度阈值和图片高度阈值的限制,筛选出一系列图像作为载体;根据利用加权系数信息的图像水印嵌入方法将第二水印比特序列嵌入到所选的每幅图像中,得到第二网页;
105)输出步骤:输出第二网页,并安全地输出和保存嵌入参数,即水印提取码,以便提供准确信息给水印信息提取端。
2.根据权利要求1所述的一种用于网页的信息快速嵌入和提取的方法,其特征在于:利用DCT系数位置的图像水印嵌入方法具体采用修改DCT系数进行嵌入,针对每幅图像的具体嵌入如下:
将第一图像表示成YCbCr格式,选择Y分量进行嵌入,Cb分量和Cr分量不变;对Y分量进行8*8分块和DCT变换,得到一系列8*8系数矩阵;第二水印比特序列中的若干位数字,对应每一系数矩阵的若干系数,若干系数由嵌入参数中的DCT系数位置所指定;根据一定的规则修改每个图像水印位置中的相应系数,直到所有水印嵌完;
将修改后的各系数矩阵通过DCT反变换,组合得到修改后的Y分量;修改的Y分量和保持不变的Cb分量和Cr分量组合在一起,转换成第一图像的图像格式后保存,得到第二图像;用第二图像覆盖第一图像。
3.根据权利要求1所述的一种用于网页的信息快速嵌入和提取的方法,其特征在于:利用加权系数信息的图像水印嵌入方法以混合加权嵌入方法将第一图像嵌入到所选的每幅图像中,具体嵌入如下:
根据第一图像的长和宽,利用模板匹配方法,找到第一图像中的最暗区域;保持第一图像其他区域不变,基于嵌入参数中的加权系数,将第一图像中的最暗区域和第一图像进行加权相加,得到第二图像;用第二图像覆盖第一图像。
4. 根据权利要求 1 所述的一种用于网页的信息快速嵌入和提取的方法,其特征在于:嵌入方案还包括嵌入方案三,具体如下:
将第三字符串转化为二值图像,得到第一水印图像;将第一水印图像拷贝到第一网页的关联文件夹下;用记事本或其他文本编辑软件打开第一网页,并查找最后一个</body>标记;在该标记下一行写入"<script> var WM=document.createElement("img");WM.alt="WM000";WM.setAttribute("src","****"); WM.style.position="fixed";WM.style.display= "none"; WM.style.top = 0 + "px"; WM.style.left = 0 + "px";WM.style.zIndex = 100000; document.body.appendChild(WM); </script>";其中WM000是水印标记;****是指第一水印图像的路径;保存网页得到第二网页。
5. 根据权利要求 1所述的一种用于网页的信息快速嵌入和提取的方法,其特征在于:嵌入方案还包括嵌入方案四,具体如下:
将第三字符串转化为十六进制的第四字符串;用记事本或其他文本编辑软件打开第一网页,并寻找合适的随机行;在这一行中插入<div style = "display:none"></div> <div> WM000********</div>;其中WM000是水印标记;********是第四字符串;保存网页得到第二网页。
6. 根据权利要求 1所述的一种用于网页的信息快速嵌入和提取的方法,其特征在于:置乱密钥为第二字符串进行加密处理得到第三字符串,具体包括:首先根据置乱密钥生成混沌序列,由混沌序列对第二字符串进行置乱处理,得到第三字符串。
7.一种用于网页的信息快速嵌入和提取的装置,其特征在于:用于实现权利要求1至6中任意一项的一种用于网页的信息快速嵌入和提取的方法,包括秘密信息嵌入装置,其包括输入单元、水印字符串生成单元、水印信息嵌入单元、输出单元、嵌入模块;
输入单元,用于输入第一网页、第一字符串、嵌入参数;嵌入参数包括置乱密钥、第一字符串长度、嵌入模式、筛选图片宽度阈值、筛选图片高度阈值、DCT系数位置、加权系数信息;
水印字符串生成单元,在第一字符串后面加上时间戳得到第二字符串,根据嵌入参数中的置乱密钥对第二字符串进行加密处理得到第三字符串;
水印信息嵌入单元,根据嵌入参数中的嵌入模块利用相应的一个或多个嵌入方案将第三字符串嵌入到第一网页中,得到第二网页;
输出单元,用于输出第二网页以及安全地输出和保存嵌入参数,即水印提取码,便提供给水印信息提取端。
8.根据权利要求7所述的一种用于网页的信息快速嵌入和提取的装置,其特征在于:秘密信息嵌入装置还包括嵌入电子设备,其包括处理器和存储器;存储器用于存储嵌入方法的程序,处理器用于运行存储于存储器中的嵌入方法的程序。
9. 根据权利要求 7或8 所述的一种用于网页的信息快速嵌入和提取的装置,其特征在于:包括秘密信息提取装置,其包括输入单元、字符串提取单元、字符串反置乱单元、字符串剥离单元、秘密信息重构单元;
输入单元用于输入水印提取码和第二网页,其中水印提取码包括置乱密钥、第一字符串长度、嵌入模式、筛选图片宽最小值、筛选图片高最小值、DCT系数位置、加权系数;
字符串提取单元根据水印提取码中的嵌入方案选择相应的提取模块从第二网页提取出第五字符串和第一网页;
字符串反置乱单元,根据水印提取码中的置乱密钥对第五字符串进行反置乱处理,得到第六字符串;
字符串剥离单元,根据水印提取码中的第一字符串长度剥离掉时间戳,得到第七字符串,时间戳作为时间证明;
秘密信息重构单元,比较各个提取方案提取出的第七字符串,得到最终的第八字符串作为提取的秘密信息;
秘密信息提取装置还包括提取电子设备,其包括处理器和存储器;存储器用于存储提取方法的程序,处理器用于运行存储于存储器中的提取方法的程序。
CN201910042435.5A 2019-01-17 2019-01-17 一种用于网页的信息快速嵌入和提取的方法 Active CN109785222B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910042435.5A CN109785222B (zh) 2019-01-17 2019-01-17 一种用于网页的信息快速嵌入和提取的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910042435.5A CN109785222B (zh) 2019-01-17 2019-01-17 一种用于网页的信息快速嵌入和提取的方法

Publications (2)

Publication Number Publication Date
CN109785222A CN109785222A (zh) 2019-05-21
CN109785222B true CN109785222B (zh) 2023-06-02

Family

ID=66500879

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910042435.5A Active CN109785222B (zh) 2019-01-17 2019-01-17 一种用于网页的信息快速嵌入和提取的方法

Country Status (1)

Country Link
CN (1) CN109785222B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188553B (zh) * 2019-05-29 2022-07-12 华南师范大学 基于大数据和动态环境的信息隐藏方法和机器人系统
CN110191111B (zh) * 2019-05-29 2021-12-03 华南师范大学 基于大数据和函数验证的信息隐藏方法和机器人系统
CN110489943B (zh) * 2019-07-15 2020-07-28 贝壳找房(北京)科技有限公司 页面水印防篡改方法和系统
CN112749294B (zh) * 2019-10-29 2023-10-31 腾讯科技(深圳)有限公司 页面隐藏文案识别方法、装置、计算机设备和存储介质
CN112017099B (zh) * 2020-09-03 2023-12-15 山东省计算中心(国家超级计算济南中心) 一种程序代码在图像中隐藏、解析的方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050400A (zh) * 2014-06-27 2014-09-17 西南交通大学 一种基于控制符编码隐写的网页链接保护方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7685426B2 (en) * 1996-05-07 2010-03-23 Digimarc Corporation Managing and indexing content on a network with image bookmarks and digital watermarks
US6272556B1 (en) * 1996-07-01 2001-08-07 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for migrating a client-server application (#5)
CN1222815A (zh) * 1997-12-09 1999-07-14 日本电气株式会社 在数字传输中不改变数据结构的防复制电路
AU5027200A (en) * 1999-05-20 2000-12-12 Intensifi, Inc. Method and apparatus for access to, and delivery of, multimedia information
US20050271246A1 (en) * 2002-07-10 2005-12-08 Sharma Ravi K Watermark payload encryption methods and systems
US20110055585A1 (en) * 2008-07-25 2011-03-03 Kok-Wah Lee Methods and Systems to Create Big Memorizable Secrets and Their Applications in Information Engineering
US8751800B1 (en) * 2011-12-12 2014-06-10 Google Inc. DRM provider interoperability
EP2975534A1 (en) * 2014-07-14 2016-01-20 X and Me Technology AG Method and device for secure browsing
CN107590397A (zh) * 2017-09-19 2018-01-16 广州酷狗计算机科技有限公司 一种显示内嵌网页的方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050400A (zh) * 2014-06-27 2014-09-17 西南交通大学 一种基于控制符编码隐写的网页链接保护方法

Also Published As

Publication number Publication date
CN109785222A (zh) 2019-05-21

Similar Documents

Publication Publication Date Title
CN109785222B (zh) 一种用于网页的信息快速嵌入和提取的方法
Chang et al. A watermarking-based image ownership and tampering authentication scheme
US8189863B1 (en) Watermarking digital documents
Yin et al. Reversible data hiding in encrypted images based on pixel prediction and multi-MSB planes rearrangement
Sion et al. On watermarking numeric sets
US20050053258A1 (en) System and method for watermarking a document
CN102831570B (zh) 可在浏览器上定位篡改位置的网页水印生成与认证方法
CN115114598A (zh) 水印生成、水印用于文件追溯的方法及装置
Hadmi et al. A robust and secure perceptual hashing system based on a quantization step analysis
Yaghobi et al. Text steganography in webometrics
Ni et al. Pinpoint authentication watermarking based on a chaotic system
CN114386103A (zh) 秘密信息隐藏方法、秘密信息提取方法及传输系统
Sonnleitner A robust watermarking approach for large databases
Lee et al. Secret communication through web pages using special space codes in HTML files
Banik et al. Review on steganography in digital media
Castiglione et al. Hiding Information into OOXML Documents: New Steganographic Perspectives.
Cao et al. Approaches to obtaining fingerprints of steganography tools which embed message in fixed positions
CN104765986B (zh) 一种基于隐写术的代码保护及还原方法
Pan et al. A lossless watermarking scheme for halftone image authentication
Jaiswal et al. Implementation of a new technique for web document protection using unicode
Sharma et al. A study of steganography based data hiding techniques
Lin et al. A data hiding scheme on word documents using multiple-base notation system
Kuribayashi et al. StealthPDF: Data hiding method for PDF file with no visual degradation
CN110008663B (zh) 一种用于pdf文档保护和分发跟踪的信息快速嵌入和提取的方法
Boulesnane et al. A New Steganography Technique Based on Dotted Arabic Letters Features

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 808, Building 8, Yunchuang Gagu R&D Center, No. 428 Zhiqiang Road, Xihu District, Hangzhou City, Zhejiang Province, 310000

Patentee after: Hangzhou Kiel Technology Co.,Ltd.

Address before: 310030 room 609, building 5, No. 3, Xiyuan Third Road, Sandun Town, Xihu District, Hangzhou City, Zhejiang Province

Patentee before: HANGZHOU KILBY BLOCKCHAIN TECHNOLOGY Ltd.