CN106777061A - 基于网页文本和图像的信息隐藏系统、方法及提取方法 - Google Patents
基于网页文本和图像的信息隐藏系统、方法及提取方法 Download PDFInfo
- Publication number
- CN106777061A CN106777061A CN201611138751.5A CN201611138751A CN106777061A CN 106777061 A CN106777061 A CN 106777061A CN 201611138751 A CN201611138751 A CN 201611138751A CN 106777061 A CN106777061 A CN 106777061A
- Authority
- CN
- China
- Prior art keywords
- binary
- hiding
- image
- hidden
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/84—Mapping; Conversion
- G06F16/88—Mark-up to mark-up conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明涉及信息隐藏和信息提取技术,其公开了一种基于网页文本和图像的信息隐藏系统、方法及提取方法,解决传统技术中HTML标签隐藏信息量小、容易被发现的问题。在本发明中信息隐藏方法包括:A、将需要进行隐藏的明文转换为二进制;B、统计转换为二进制后的位数,将位数隐藏在图像模块中;C、将经过二进制转换后的明文隐藏在HTML文本模块中。本发明适用于信息隐藏和提取。
Description
技术领域
本发明涉及信息隐藏和信息提取技术,具体涉及一种基于网页文本和图像的信息隐藏系统、方法及信息提取方法。
背景技术
信息隐藏针对不同的载体,分为文本、图像、音频和视频等信息隐藏技术,而随着网站的快速发展,HTML被广泛应用,可以通过HTML标签来隐藏信息,但HTML的冗余量很小,所以能隐藏的信息很少,而且单一文本信息隐藏很容易被发现。
发明内容
本发明所要解决的技术问题是:提出一种基于网页文本和图像的信息隐藏系统、方法及提取方法,解决传统技术中HTML标签隐藏信息量小、容易被发现的问题。
本发明解决其技术问题所采用的技术方案是:
基于网页文本和图像的信息隐藏系统,包括二进制转换模块、图像模块和HTML文本模块;
所述二进制转换模块,用于将需要隐藏的明文信息转换为二进制;
所述图像模块,用于隐藏明文信息的数量,即通过统计将明文信息转换为二进制后的位数,将位数隐藏在图像模块中;
所述HTML文本模块,用于隐藏明文信息,即将经过二进制转换后的明文隐藏在HTML模块中。
作为进一步优化,所述将位数隐藏在图像模块中的方法是:
先取图像前8个图像元素用来隐藏二进制位数的大小,然后从第9个图像元素开始隐藏明文二进制的位数:得到每个像素元素三个字节数,用每个字节数来隐藏一个二进制数,当需要隐藏的二进制数是1时,将对应字节的最低位变成奇数,当需要隐藏的二进制数是0时,将对应字节的最低位变成偶数。
作为进一步优化,所述将经过二进制转换后的明文隐藏在HTML模块中的方法是:
HTML标签首字母大写代表1,小写代表0;
属性“”里后有空格代表1,无空格代表0;
属性“”里前有空格代表1,无空格代表0;
标签结束符/>前有空格代表1,无空格代表0。
此外,本发明还提供了一种基于网页文本和图像的信息隐藏方法,其包括以下步骤:
A、将需要进行隐藏的明文转换为二进制;
B、统计转换为二进制后的位数,将位数隐藏在图像模块中;
C、将经过二进制转换后的明文隐藏在HTML文本模块中。
作为进一步优化,步骤B中,所述将位数隐藏在图像模块中的方法是:
先取图像前8个图像元素用来隐藏二进制位数的大小,然后从第9个图像元素开始隐藏明文二进制的位数:得到每个像素元素三个字节数,用每个字节数来隐藏一个二进制数,当需要隐藏的二进制数是1时,将对应字节的最低位变成奇数,当需要隐藏的二进制数是0时,将对应字节的最低位变成偶数。
作为进一步优化,步骤C中,所述将经过二进制转换后的明文隐藏在HTML文本模块中的方法是:
如果需要隐藏的二进制数是1,对应HTML标签首字母大写,属性“”里后有空格,属性“”里前有空格,标签结束符/>前有空格;
如果需要隐藏的二进制数是0,对应HTML标签首字母小写,属性“”里后无空格,属性“”里前无空格,标签结束符/>前无空格。
另外,本发明还提供了基于网页文本和图像的信息提取方法,其包括以下步骤:
A、从图形模块中获取隐藏信息的二进制位数;
B、根据获取的二进制位数从HTML文本模块中获取二进制码的明文;
C、将二进制码的明文转换为明文的原文。
本发明的有益效果是:同时利用HTML标签和属性来提高HTML文本的信息隐藏量并且通过文本隐藏信息,通过图像隐藏信息数量,来提高信息隐藏的安全性。
附图说明
图1为基于网页文本和图像的信息隐藏方法流程图;
图2为基于网页文本和图像的信息提取方法流程图。
具体实施方式
本发明旨在提出一种基于网页文本和图像的信息隐藏系统、方法及提取方法,解决传统技术中HTML标签隐藏信息量小、容易被发现的问题。在本发明中,充分利用了HTML标签的特性和图像的特性共同隐藏信息:
HTML标签的特性:标签里字母大小不影响网页,属性引号里前后和标签结束符前有无空格也不影响网页,所以本发明通过HTML标签里首字母大小写,属性引号里有无空格和标签结束符前有无空格来隐藏信息,这样大大提高了HTML文本的信息隐藏量。
图像的特性:图像是由很多图像元素组成,每个图像元素由三个字节表示红、绿、蓝,改变三个字节的最低一位数值在视觉上很难被发现,所以用图像隐藏信息的总量,通过图像中提取的信息总量再去HTML文本中找信息的位数,这样有更好的隐蔽性,因为必须同时得到图像和HTML文本中的信息,才能得到明文。因而,本发明设计基于网页的HTML文本和图片的混合信息隐藏方案,能够让HTML有更好的隐藏量,而且有更好的隐藏性。
本发明基于网页文本和图像的信息隐藏系统,包括二进制转换模块、图像模块和HTML文本模块;
所述二进制转换模块,用于将需要隐藏的明文信息转换为二进制;由于不管是HTML文本还是更改图像元素最低位数值,都是需要二进制判断,所以需要将原文的文字、数字等转换成二进制。
所述图像模块,用于隐藏明文信息的数量,即通过统计将明文信息转换为二进制后的位数,将位数隐藏在图像模块中:先取图像前8个图像元素用来隐藏二进制位数的大小,然后从第九个图像元素开始隐藏原文二进制的位数。每个元素的三个字节中,最低位是奇数代表1,最低位是偶数代表0。
所述HTML文本模块,用于隐藏明文信息,即将经过二进制转换后的明文隐藏在HTML模块中:HTML标签首字母大写代表1,小写代表0。属性“”里后有空格代表1,无空格代表0。属性“”里前有空格代表1,无空格代表0。标签结束符/>前有空格代表1,无空格代表0。
如图1所示,本实施例中的基于网页文本和图像的信息隐藏方法包括:
1、首先拿到需要隐藏的明文,将明文信息转换成二进制。
2、统计明文二进制长度位数为a,需要将a转换成二进制隐藏于图像中,统计二进制a的长度位数为b,将b隐藏于图像的前8个图像元素,从图像的第九个元素开始隐藏二进制数a。隐藏规则:得到每个像素元素三个字节数,用每个字节数来隐藏一个二进制数,当需要隐藏的二进制数是1时,将对应字节的最低位变成奇数,当需要隐藏的二进制数是0时,将对应字节的最低位变成偶数。
3、将二进制明文信息隐藏于HTML文本中。隐藏规则:如果需要隐藏的二进制数是1时对应HTML标签首字母大写,属性“”里后有空格,属性“”里前有空格,标签结束符/>前有空格。如果需要隐藏的二进制数是0时对应HTML标签首字母小写,属性“”里后无空格,属性“”里前无空格,标签结束符/>前无空格。
如图2所示,本实施例中的基于网页文本和图像的信息提取方法包括:
1、首先拿到网页中的图像,通过分析图像中前8个图像元素得到明文二进制位数a的长度位数b,假如明文二进制数位数a为17,因为17的二进制数为10001,所以b为5。由b从图像第9个图像元素开始得到明文二进制位数a。
2、由明文二进制位数a从网页的HTML文本中得到二进制明文;
3、将二进制明文转换成明文原文。
需要说明的是,本发明要求保护的技术方案包含但不仅限于上述实施例,本领域技术人员在本发明的上述实施例的描述下所作出的等同修改/替换均未脱离本发明的保护范围。
Claims (7)
1.基于网页文本和图像的信息隐藏系统,其特征在于,包括二进制转换模块、图像模块和HTML文本模块;
所述二进制转换模块,用于将需要隐藏的明文信息转换为二进制;
所述图像模块,用于隐藏明文信息的数量,即通过统计将明文信息转换为二进制后的位数,将位数隐藏在图像模块中;
所述HTML文本模块,用于隐藏明文信息,即将经过二进制转换后的明文隐藏在HTML模块中。
2.如权利要求1所述的基于网页文本和图像的信息隐藏系统,其特征在于,所述将位数隐藏在图像模块中的方法是:
先取图像前8个图像元素用来隐藏二进制位数的大小,然后从第9个图像元素开始隐藏明文二进制的位数:得到每个像素元素三个字节数,用每个字节数来隐藏一个二进制数,当需要隐藏的二进制数是1时,将对应字节的最低位变成奇数,当需要隐藏的二进制数是0时,将对应字节的最低位变成偶数。
3.如权利要求1所述的基于网页文本和图像的信息隐藏系统,其特征在于,所述将经过二进制转换后的明文隐藏在HTML模块中的方法是:
HTML标签首字母大写代表1,小写代表0;
属性“”里后有空格代表1,无空格代表0;
属性“”里前有空格代表1,无空格代表0;
标签结束符/>前有空格代表1,无空格代表0。
4.基于网页文本和图像的信息隐藏方法,其特征在于,包括以下步骤:
A、将需要进行隐藏的明文转换为二进制;
B、统计转换为二进制后的位数,将位数隐藏在图像模块中;
C、将经过二进制转换后的明文隐藏在HTML文本模块中。
5.如权利要求4所述的基于网页文本和图像的信息隐藏方法,其特征在于,步骤B中,所述将位数隐藏在图像模块中的方法是:
先取图像前8个图像元素用来隐藏二进制位数的大小,然后从第9个图像元素开始隐藏明文二进制的位数:得到每个像素元素三个字节数,用每个字节数来隐藏一个二进制数,当需要隐藏的二进制数是1时,将对应字节的最低位变成奇数,当需要隐藏的二进制数是0时,将对应字节的最低位变成偶数。
6.如权利要求4所述的基于网页文本和图像的信息隐藏方法,其特征在于,步骤C中,所述将经过二进制转换后的明文隐藏在HTML文本模块中的方法是:
如果需要隐藏的二进制数是1,对应HTML标签首字母大写,属性“”里后有空格,属性“”里前有空格,标签结束符/>前有空格;
如果需要隐藏的二进制数是0,对应HTML标签首字母小写,属性“”里后无空格,属性“”里前无空格,标签结束符/>前无空格。
7.基于网页文本和图像的信息提取方法,其特征在于,包括以下步骤:
A、从图形模块中获取隐藏信息的二进制位数;
B、根据获取的二进制位数从HTML文本模块中获取二进制码的明文;
C、将二进制码的明文转换为明文的原文。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611138751.5A CN106777061B (zh) | 2016-12-12 | 2016-12-12 | 基于网页文本和图像的信息隐藏系统、方法及提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611138751.5A CN106777061B (zh) | 2016-12-12 | 2016-12-12 | 基于网页文本和图像的信息隐藏系统、方法及提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106777061A true CN106777061A (zh) | 2017-05-31 |
CN106777061B CN106777061B (zh) | 2020-04-07 |
Family
ID=58875528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611138751.5A Active CN106777061B (zh) | 2016-12-12 | 2016-12-12 | 基于网页文本和图像的信息隐藏系统、方法及提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106777061B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112115681A (zh) * | 2020-08-26 | 2020-12-22 | 广州锦行网络科技有限公司 | 一种用于webshell的隐藏代码的方法及系统 |
CN115174757A (zh) * | 2022-06-08 | 2022-10-11 | 广州鲁邦通智能科技有限公司 | 一种表单信息提交方法、读取方法及处理系统 |
CN117173000A (zh) * | 2023-09-08 | 2023-12-05 | 广州市科帕电子科技有限公司 | 一种基于四进制编码的信息隐藏方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103501400A (zh) * | 2013-10-16 | 2014-01-08 | 广西师范大学 | 基于抛物线插值图像的可逆信息隐藏方法 |
CN103679051A (zh) * | 2013-12-31 | 2014-03-26 | 天津书生软件技术有限公司 | 一种文件隐藏方法 |
CN104915409A (zh) * | 2015-06-03 | 2015-09-16 | 浙江大学城市学院 | 基于html标签属性序列的信息隐藏及提取方法 |
-
2016
- 2016-12-12 CN CN201611138751.5A patent/CN106777061B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103501400A (zh) * | 2013-10-16 | 2014-01-08 | 广西师范大学 | 基于抛物线插值图像的可逆信息隐藏方法 |
CN103679051A (zh) * | 2013-12-31 | 2014-03-26 | 天津书生软件技术有限公司 | 一种文件隐藏方法 |
CN104915409A (zh) * | 2015-06-03 | 2015-09-16 | 浙江大学城市学院 | 基于html标签属性序列的信息隐藏及提取方法 |
Non-Patent Citations (1)
Title |
---|
莫佳: "一种基于HTML文本的信息隐藏算法设计与实现", 《山东理工大学学学报(自然科学版)》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112115681A (zh) * | 2020-08-26 | 2020-12-22 | 广州锦行网络科技有限公司 | 一种用于webshell的隐藏代码的方法及系统 |
CN115174757A (zh) * | 2022-06-08 | 2022-10-11 | 广州鲁邦通智能科技有限公司 | 一种表单信息提交方法、读取方法及处理系统 |
CN117173000A (zh) * | 2023-09-08 | 2023-12-05 | 广州市科帕电子科技有限公司 | 一种基于四进制编码的信息隐藏方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106777061B (zh) | 2020-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104182750B (zh) | 一种在自然场景图像中基于极值连通域的中文检测方法 | |
CN105574572B (zh) | 一种彩色二维码的生成方法 | |
US9705761B2 (en) | Opinion information display system and method | |
CN104598577B (zh) | 一种网页正文的提取方法 | |
CN106777061A (zh) | 基于网页文本和图像的信息隐藏系统、方法及提取方法 | |
CN105630817B (zh) | 一种电子发票内容解析的方法及系统 | |
CN109492177B (zh) | 一种基于网页语义结构的网页分块方法 | |
CN102096787B (zh) | 一种基于word2007文本切分的信息隐藏方法及其装置 | |
CN106227808A (zh) | 一种去除邮件干扰信息的方法以及垃圾邮件判定方法 | |
CN102799592A (zh) | 富文本文档的解析方法和系统 | |
US20120193424A1 (en) | Method of encoding and decoding data on a matrix code symbol | |
CN113761202A (zh) | 一种将非结构金融Excel表格映射到数据库的优化系统 | |
CN104391993A (zh) | 一种识别网页编码方法及系统 | |
CN105740355B (zh) | 基于聚集文本密度的网页正文提取方法及装置 | |
US7878413B2 (en) | Method for the dual coding of information on physical media and in a computerized format (DOTEM) | |
CN107562480A (zh) | 一种pos机多国语言的实现方法及其系统 | |
CN110110326B (zh) | 一种基于主题信息的文本切割方法 | |
CN107145591A (zh) | 一种基于标题的网页有效元数据内容提取方法 | |
CN103593332A (zh) | 于嵌入式设备处理字符串的方法 | |
CN103136453A (zh) | 文档操作题的自动组卷方法和自动阅卷方法 | |
CN105677718B (zh) | 文字检索方法及装置 | |
CN105681246A (zh) | 一种验证码的实现方法 | |
CN106406560A (zh) | 桌面操作系统中机械工程字符矢量字体输出方法和系统 | |
CN107222583A (zh) | 一种融合结构化数据和非结构化数据的数据传输方法 | |
CN107943760B (zh) | Pdf文档编辑的字体优化方法、装置、终端设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |