CN106777061A - 基于网页文本和图像的信息隐藏系统、方法及提取方法 - Google Patents

基于网页文本和图像的信息隐藏系统、方法及提取方法 Download PDF

Info

Publication number
CN106777061A
CN106777061A CN201611138751.5A CN201611138751A CN106777061A CN 106777061 A CN106777061 A CN 106777061A CN 201611138751 A CN201611138751 A CN 201611138751A CN 106777061 A CN106777061 A CN 106777061A
Authority
CN
China
Prior art keywords
binary
hiding
image
hidden
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611138751.5A
Other languages
English (en)
Other versions
CN106777061B (zh
Inventor
王益
常清雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN201611138751.5A priority Critical patent/CN106777061B/zh
Publication of CN106777061A publication Critical patent/CN106777061A/zh
Application granted granted Critical
Publication of CN106777061B publication Critical patent/CN106777061B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion
    • G06F16/88Mark-up to mark-up conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及信息隐藏和信息提取技术,其公开了一种基于网页文本和图像的信息隐藏系统、方法及提取方法,解决传统技术中HTML标签隐藏信息量小、容易被发现的问题。在本发明中信息隐藏方法包括:A、将需要进行隐藏的明文转换为二进制;B、统计转换为二进制后的位数,将位数隐藏在图像模块中;C、将经过二进制转换后的明文隐藏在HTML文本模块中。本发明适用于信息隐藏和提取。

Description

基于网页文本和图像的信息隐藏系统、方法及提取方法
技术领域
本发明涉及信息隐藏和信息提取技术,具体涉及一种基于网页文本和图像的信息隐藏系统、方法及信息提取方法。
背景技术
信息隐藏针对不同的载体,分为文本、图像、音频和视频等信息隐藏技术,而随着网站的快速发展,HTML被广泛应用,可以通过HTML标签来隐藏信息,但HTML的冗余量很小,所以能隐藏的信息很少,而且单一文本信息隐藏很容易被发现。
发明内容
本发明所要解决的技术问题是:提出一种基于网页文本和图像的信息隐藏系统、方法及提取方法,解决传统技术中HTML标签隐藏信息量小、容易被发现的问题。
本发明解决其技术问题所采用的技术方案是:
基于网页文本和图像的信息隐藏系统,包括二进制转换模块、图像模块和HTML文本模块;
所述二进制转换模块,用于将需要隐藏的明文信息转换为二进制;
所述图像模块,用于隐藏明文信息的数量,即通过统计将明文信息转换为二进制后的位数,将位数隐藏在图像模块中;
所述HTML文本模块,用于隐藏明文信息,即将经过二进制转换后的明文隐藏在HTML模块中。
作为进一步优化,所述将位数隐藏在图像模块中的方法是:
先取图像前8个图像元素用来隐藏二进制位数的大小,然后从第9个图像元素开始隐藏明文二进制的位数:得到每个像素元素三个字节数,用每个字节数来隐藏一个二进制数,当需要隐藏的二进制数是1时,将对应字节的最低位变成奇数,当需要隐藏的二进制数是0时,将对应字节的最低位变成偶数。
作为进一步优化,所述将经过二进制转换后的明文隐藏在HTML模块中的方法是:
HTML标签首字母大写代表1,小写代表0;
属性“”里后有空格代表1,无空格代表0;
属性“”里前有空格代表1,无空格代表0;
标签结束符/>前有空格代表1,无空格代表0。
此外,本发明还提供了一种基于网页文本和图像的信息隐藏方法,其包括以下步骤:
A、将需要进行隐藏的明文转换为二进制;
B、统计转换为二进制后的位数,将位数隐藏在图像模块中;
C、将经过二进制转换后的明文隐藏在HTML文本模块中。
作为进一步优化,步骤B中,所述将位数隐藏在图像模块中的方法是:
先取图像前8个图像元素用来隐藏二进制位数的大小,然后从第9个图像元素开始隐藏明文二进制的位数:得到每个像素元素三个字节数,用每个字节数来隐藏一个二进制数,当需要隐藏的二进制数是1时,将对应字节的最低位变成奇数,当需要隐藏的二进制数是0时,将对应字节的最低位变成偶数。
作为进一步优化,步骤C中,所述将经过二进制转换后的明文隐藏在HTML文本模块中的方法是:
如果需要隐藏的二进制数是1,对应HTML标签首字母大写,属性“”里后有空格,属性“”里前有空格,标签结束符/>前有空格;
如果需要隐藏的二进制数是0,对应HTML标签首字母小写,属性“”里后无空格,属性“”里前无空格,标签结束符/>前无空格。
另外,本发明还提供了基于网页文本和图像的信息提取方法,其包括以下步骤:
A、从图形模块中获取隐藏信息的二进制位数;
B、根据获取的二进制位数从HTML文本模块中获取二进制码的明文;
C、将二进制码的明文转换为明文的原文。
本发明的有益效果是:同时利用HTML标签和属性来提高HTML文本的信息隐藏量并且通过文本隐藏信息,通过图像隐藏信息数量,来提高信息隐藏的安全性。
附图说明
图1为基于网页文本和图像的信息隐藏方法流程图;
图2为基于网页文本和图像的信息提取方法流程图。
具体实施方式
本发明旨在提出一种基于网页文本和图像的信息隐藏系统、方法及提取方法,解决传统技术中HTML标签隐藏信息量小、容易被发现的问题。在本发明中,充分利用了HTML标签的特性和图像的特性共同隐藏信息:
HTML标签的特性:标签里字母大小不影响网页,属性引号里前后和标签结束符前有无空格也不影响网页,所以本发明通过HTML标签里首字母大小写,属性引号里有无空格和标签结束符前有无空格来隐藏信息,这样大大提高了HTML文本的信息隐藏量。
图像的特性:图像是由很多图像元素组成,每个图像元素由三个字节表示红、绿、蓝,改变三个字节的最低一位数值在视觉上很难被发现,所以用图像隐藏信息的总量,通过图像中提取的信息总量再去HTML文本中找信息的位数,这样有更好的隐蔽性,因为必须同时得到图像和HTML文本中的信息,才能得到明文。因而,本发明设计基于网页的HTML文本和图片的混合信息隐藏方案,能够让HTML有更好的隐藏量,而且有更好的隐藏性。
本发明基于网页文本和图像的信息隐藏系统,包括二进制转换模块、图像模块和HTML文本模块;
所述二进制转换模块,用于将需要隐藏的明文信息转换为二进制;由于不管是HTML文本还是更改图像元素最低位数值,都是需要二进制判断,所以需要将原文的文字、数字等转换成二进制。
所述图像模块,用于隐藏明文信息的数量,即通过统计将明文信息转换为二进制后的位数,将位数隐藏在图像模块中:先取图像前8个图像元素用来隐藏二进制位数的大小,然后从第九个图像元素开始隐藏原文二进制的位数。每个元素的三个字节中,最低位是奇数代表1,最低位是偶数代表0。
所述HTML文本模块,用于隐藏明文信息,即将经过二进制转换后的明文隐藏在HTML模块中:HTML标签首字母大写代表1,小写代表0。属性“”里后有空格代表1,无空格代表0。属性“”里前有空格代表1,无空格代表0。标签结束符/>前有空格代表1,无空格代表0。
如图1所示,本实施例中的基于网页文本和图像的信息隐藏方法包括:
1、首先拿到需要隐藏的明文,将明文信息转换成二进制。
2、统计明文二进制长度位数为a,需要将a转换成二进制隐藏于图像中,统计二进制a的长度位数为b,将b隐藏于图像的前8个图像元素,从图像的第九个元素开始隐藏二进制数a。隐藏规则:得到每个像素元素三个字节数,用每个字节数来隐藏一个二进制数,当需要隐藏的二进制数是1时,将对应字节的最低位变成奇数,当需要隐藏的二进制数是0时,将对应字节的最低位变成偶数。
3、将二进制明文信息隐藏于HTML文本中。隐藏规则:如果需要隐藏的二进制数是1时对应HTML标签首字母大写,属性“”里后有空格,属性“”里前有空格,标签结束符/>前有空格。如果需要隐藏的二进制数是0时对应HTML标签首字母小写,属性“”里后无空格,属性“”里前无空格,标签结束符/>前无空格。
如图2所示,本实施例中的基于网页文本和图像的信息提取方法包括:
1、首先拿到网页中的图像,通过分析图像中前8个图像元素得到明文二进制位数a的长度位数b,假如明文二进制数位数a为17,因为17的二进制数为10001,所以b为5。由b从图像第9个图像元素开始得到明文二进制位数a。
2、由明文二进制位数a从网页的HTML文本中得到二进制明文;
3、将二进制明文转换成明文原文。
需要说明的是,本发明要求保护的技术方案包含但不仅限于上述实施例,本领域技术人员在本发明的上述实施例的描述下所作出的等同修改/替换均未脱离本发明的保护范围。

Claims (7)

1.基于网页文本和图像的信息隐藏系统,其特征在于,包括二进制转换模块、图像模块和HTML文本模块;
所述二进制转换模块,用于将需要隐藏的明文信息转换为二进制;
所述图像模块,用于隐藏明文信息的数量,即通过统计将明文信息转换为二进制后的位数,将位数隐藏在图像模块中;
所述HTML文本模块,用于隐藏明文信息,即将经过二进制转换后的明文隐藏在HTML模块中。
2.如权利要求1所述的基于网页文本和图像的信息隐藏系统,其特征在于,所述将位数隐藏在图像模块中的方法是:
先取图像前8个图像元素用来隐藏二进制位数的大小,然后从第9个图像元素开始隐藏明文二进制的位数:得到每个像素元素三个字节数,用每个字节数来隐藏一个二进制数,当需要隐藏的二进制数是1时,将对应字节的最低位变成奇数,当需要隐藏的二进制数是0时,将对应字节的最低位变成偶数。
3.如权利要求1所述的基于网页文本和图像的信息隐藏系统,其特征在于,所述将经过二进制转换后的明文隐藏在HTML模块中的方法是:
HTML标签首字母大写代表1,小写代表0;
属性“”里后有空格代表1,无空格代表0;
属性“”里前有空格代表1,无空格代表0;
标签结束符/>前有空格代表1,无空格代表0。
4.基于网页文本和图像的信息隐藏方法,其特征在于,包括以下步骤:
A、将需要进行隐藏的明文转换为二进制;
B、统计转换为二进制后的位数,将位数隐藏在图像模块中;
C、将经过二进制转换后的明文隐藏在HTML文本模块中。
5.如权利要求4所述的基于网页文本和图像的信息隐藏方法,其特征在于,步骤B中,所述将位数隐藏在图像模块中的方法是:
先取图像前8个图像元素用来隐藏二进制位数的大小,然后从第9个图像元素开始隐藏明文二进制的位数:得到每个像素元素三个字节数,用每个字节数来隐藏一个二进制数,当需要隐藏的二进制数是1时,将对应字节的最低位变成奇数,当需要隐藏的二进制数是0时,将对应字节的最低位变成偶数。
6.如权利要求4所述的基于网页文本和图像的信息隐藏方法,其特征在于,步骤C中,所述将经过二进制转换后的明文隐藏在HTML文本模块中的方法是:
如果需要隐藏的二进制数是1,对应HTML标签首字母大写,属性“”里后有空格,属性“”里前有空格,标签结束符/>前有空格;
如果需要隐藏的二进制数是0,对应HTML标签首字母小写,属性“”里后无空格,属性“”里前无空格,标签结束符/>前无空格。
7.基于网页文本和图像的信息提取方法,其特征在于,包括以下步骤:
A、从图形模块中获取隐藏信息的二进制位数;
B、根据获取的二进制位数从HTML文本模块中获取二进制码的明文;
C、将二进制码的明文转换为明文的原文。
CN201611138751.5A 2016-12-12 2016-12-12 基于网页文本和图像的信息隐藏系统、方法及提取方法 Active CN106777061B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611138751.5A CN106777061B (zh) 2016-12-12 2016-12-12 基于网页文本和图像的信息隐藏系统、方法及提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611138751.5A CN106777061B (zh) 2016-12-12 2016-12-12 基于网页文本和图像的信息隐藏系统、方法及提取方法

Publications (2)

Publication Number Publication Date
CN106777061A true CN106777061A (zh) 2017-05-31
CN106777061B CN106777061B (zh) 2020-04-07

Family

ID=58875528

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611138751.5A Active CN106777061B (zh) 2016-12-12 2016-12-12 基于网页文本和图像的信息隐藏系统、方法及提取方法

Country Status (1)

Country Link
CN (1) CN106777061B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115681A (zh) * 2020-08-26 2020-12-22 广州锦行网络科技有限公司 一种用于webshell的隐藏代码的方法及系统
CN115174757A (zh) * 2022-06-08 2022-10-11 广州鲁邦通智能科技有限公司 一种表单信息提交方法、读取方法及处理系统
CN117173000A (zh) * 2023-09-08 2023-12-05 广州市科帕电子科技有限公司 一种基于四进制编码的信息隐藏方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103501400A (zh) * 2013-10-16 2014-01-08 广西师范大学 基于抛物线插值图像的可逆信息隐藏方法
CN103679051A (zh) * 2013-12-31 2014-03-26 天津书生软件技术有限公司 一种文件隐藏方法
CN104915409A (zh) * 2015-06-03 2015-09-16 浙江大学城市学院 基于html标签属性序列的信息隐藏及提取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103501400A (zh) * 2013-10-16 2014-01-08 广西师范大学 基于抛物线插值图像的可逆信息隐藏方法
CN103679051A (zh) * 2013-12-31 2014-03-26 天津书生软件技术有限公司 一种文件隐藏方法
CN104915409A (zh) * 2015-06-03 2015-09-16 浙江大学城市学院 基于html标签属性序列的信息隐藏及提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
莫佳: "一种基于HTML文本的信息隐藏算法设计与实现", 《山东理工大学学学报(自然科学版)》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115681A (zh) * 2020-08-26 2020-12-22 广州锦行网络科技有限公司 一种用于webshell的隐藏代码的方法及系统
CN115174757A (zh) * 2022-06-08 2022-10-11 广州鲁邦通智能科技有限公司 一种表单信息提交方法、读取方法及处理系统
CN117173000A (zh) * 2023-09-08 2023-12-05 广州市科帕电子科技有限公司 一种基于四进制编码的信息隐藏方法及系统

Also Published As

Publication number Publication date
CN106777061B (zh) 2020-04-07

Similar Documents

Publication Publication Date Title
CN104182750B (zh) 一种在自然场景图像中基于极值连通域的中文检测方法
CN105574572B (zh) 一种彩色二维码的生成方法
US9705761B2 (en) Opinion information display system and method
CN104598577B (zh) 一种网页正文的提取方法
CN106777061A (zh) 基于网页文本和图像的信息隐藏系统、方法及提取方法
CN105630817B (zh) 一种电子发票内容解析的方法及系统
CN109492177B (zh) 一种基于网页语义结构的网页分块方法
CN102096787B (zh) 一种基于word2007文本切分的信息隐藏方法及其装置
CN106227808A (zh) 一种去除邮件干扰信息的方法以及垃圾邮件判定方法
CN102799592A (zh) 富文本文档的解析方法和系统
US20120193424A1 (en) Method of encoding and decoding data on a matrix code symbol
CN113761202A (zh) 一种将非结构金融Excel表格映射到数据库的优化系统
CN104391993A (zh) 一种识别网页编码方法及系统
CN105740355B (zh) 基于聚集文本密度的网页正文提取方法及装置
US7878413B2 (en) Method for the dual coding of information on physical media and in a computerized format (DOTEM)
CN107562480A (zh) 一种pos机多国语言的实现方法及其系统
CN110110326B (zh) 一种基于主题信息的文本切割方法
CN107145591A (zh) 一种基于标题的网页有效元数据内容提取方法
CN103593332A (zh) 于嵌入式设备处理字符串的方法
CN103136453A (zh) 文档操作题的自动组卷方法和自动阅卷方法
CN105677718B (zh) 文字检索方法及装置
CN105681246A (zh) 一种验证码的实现方法
CN106406560A (zh) 桌面操作系统中机械工程字符矢量字体输出方法和系统
CN107222583A (zh) 一种融合结构化数据和非结构化数据的数据传输方法
CN107943760B (zh) Pdf文档编辑的字体优化方法、装置、终端设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant