CN107045612A - 一种网页数据的加密方法 - Google Patents

一种网页数据的加密方法 Download PDF

Info

Publication number
CN107045612A
CN107045612A CN201710043269.1A CN201710043269A CN107045612A CN 107045612 A CN107045612 A CN 107045612A CN 201710043269 A CN201710043269 A CN 201710043269A CN 107045612 A CN107045612 A CN 107045612A
Authority
CN
China
Prior art keywords
character block
dictionary
dimensional matrix
character
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710043269.1A
Other languages
English (en)
Inventor
李进斌
牛超群
蒋宁宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Several Ocean Technology Co Ltd
Original Assignee
Anhui Several Ocean Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Several Ocean Technology Co Ltd filed Critical Anhui Several Ocean Technology Co Ltd
Priority to CN201710043269.1A priority Critical patent/CN107045612A/zh
Publication of CN107045612A publication Critical patent/CN107045612A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Storage Device Security (AREA)

Abstract

本发明提供了一种网页数据的加密方法,包括:将待处理的字符数据分割为字符块,为字符块匹配包括字符块的字典数据库,生成由字典数据库中字典字符块随机分布的二维矩阵图片,并记录字符块在二维矩阵图片中的坐标位置;根据二维矩阵图片和坐标位置,在网页中显示字符块组成的图片。本方案能够防止识别工具对图片形式的数据的破解。

Description

一种网页数据的加密方法
技术领域
本发明涉及数据加密技术领域,尤其涉及一种网页数据的加密方法。
背景技术
随着互联网的迅猛发展,网页信息的数量呈现出爆发式增长。在数以亿计的网页中,沉淀出许多有价值的信息数据。
在互联网这个开放的平台中,有价值的数据可以通过搜索引擎和网络爬虫等技术而被有效提取,但同时也面临着被采集的风险。对于一些具有版权或具隐私性的数据来说,未经允许的采集属非法行为,或涉及不正当的商业竞争。
基于这种对自有信息的防采集诉求,很多网站加强了网页构造的复杂化和对数据的加密程度,比如增加验证码,屏蔽和限制IP访问等。但是这些较为普通的防采集机制很快就可能会被破解,所以网页数据的防采集不得不整合出更加有效的应对方法。
在众多方法中,将字符信息转化为图片形式展示的方法能够应对一些网络爬虫的解析,但是却无法避免利用识别工具对图片进行识别从而转化为文字或字符的高级破解情况。
发明内容
有鉴于此,本发明要解决的技术问题是提供一种网页数据的加密方法,能够防止识别工具对图片形式的数据的破解。
本发明的技术方案是这样实现的:
一种网页数据的加密方法,包括:
将待处理的字符数据分割为字符块,为字符块匹配包括字符块的字典数据库,生成由字典数据库中字典字符块随机分布的二维矩阵图片,并记录字符块在二维矩阵图片中的坐标位置;
根据二维矩阵图片和坐标位置,在网页中显示字符块组成的图片。
优选的,还包括:
设置包括不同类型的字典字符块的字典数据库;
为字符块匹配包括字符块的字典数据库包括:判断字符块类型,根据字符块类型为字符块匹配包括字符块的字典数据库。
优选的,还包括:
生成二维矩阵图片的调用地址,对调用地址进行加密设置,对二维矩阵图片和调用地址进行过期失效设置。
优选的,还包括:
设置字典白名单;
字符块存在于字典白名单时,生成基于二维矩阵图片的CSS Class文件(Cascading Style Sheets class,层叠样式表类文件),并生成CSS Class文件的调用地址。
优选的,根据二维矩阵图片的调用地址获取二维矩阵图片,根据坐标位置或CSSClass文件的位置信息在网页中显示字符块组成的图片。
优选的,在将待处理的字符数据分割为字符块之后,还包括:
根据网页的显示需要,为字符块匹配适应的格式。
本发明提出的网页数据的加密方法,通过将待处理的字符数据分割成字符块,并为字符块匹配包括字符块的字典数据库,将字典数据库中字典字符块随机生成图片,从而生成的图片为字典字符块无序组成,解析的规律性很低,从而识别工具无法破解图片形式的数据。
附图说明
图1为本发明实施例提出的网页数据的加密方法的流程图;
图2为本发明另一个实施例提出的网页数据的加密方法的流程图;
图3为二维矩阵图;
图4为CSS Class位置信息图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提出了一种网页数据的加密方法,包括以下步骤:
步骤101:将待处理的字符数据分割为字符块,为字符块匹配包括字符块的字典数据库,生成由字典数据库中字典字符块随机分布的二维矩阵图片,并记录字符块在二维矩阵图片中的坐标位置;
步骤102:根据二维矩阵图片和坐标位置,在网页中显示字符块组成的图片。
可见,本发明实施例提出的网页数据的加密方法,通过将待处理的字符数据分割成字符块,并为字符块匹配包括字符块的字典数据库,将字典数据库中字典字符块随机生成图片,从而生成的图片为字典字符块无序组成,解析的规律性很低,从而识别工具无法破解图片形式的数据。
在本发明的一个优选实施例中,在步骤101之前,还包括:
设置包括不同类型的字典字符块的字典数据库;
为字符块匹配包括字符块的字典数据库:判断字符块类型,根据字符块类型为字符块匹配包括字符块的字典数据库。
在本发明的一个优选实施例中,在步骤101之后,还包括:
生成二维矩阵图片的调用地址,对调用地址进行加密设置,对二维矩阵图片和调用地址进行过期失效设置。
在本实施例中,通过加密设置和过期失效设置,降低页面被采集的可能性。
在本发明的一个优选实施例中,在步骤101之前,还包括:
设置字典白名单;
字符块存在于字典白名单时,生成基于二维矩阵图片的CSS Class文件,并生成CSS Class文件的调用地址。
步骤102包括:
根据二维矩阵图片的调用地址获取二维矩阵图片,根据坐标位置或CSS Class文件的位置信息在网页中显示字符块组成的图片。
通过对存在于字典白名单的字典字符块生成基于二维矩阵图片的CSS Class文件,浏览器可以随机根据坐标位置或CSS Class文件的位置信息在网页中显示字符块组成的图片,从而增加了采集的难度。
在本发明的一个优选实施例中,在将待处理的字符数据分割为字符块之后,还包括:
根据网页的显示需要,为字符块匹配适应的格式。
如图2所示,在本发明另一实施例提出了一种网页数据的加密方法,包括以下步骤:
步骤201:设置不同类型的字典字符块的字典数据库和字典白名单。
详细的,字符块可以有多种字符类型,比如文字、字母、数字和符号等类型。可以设置包括52个大小写字母的字母字典字符块及包括0-9的十个数字的数字字典字符块。
同时,可以选取部分字符设置为字典白名单。
步骤202:将待处理的字符数据分割为字符块,根据网页的显示需要,为字符块匹配适应的格式。
为使页面请求时不因过多的图片缓存而影响响应速度,可以选择一些关键性的信息作为待处理数据。
在进行待处理的字符数据分割时,可以对字符进行矩形分割。举例来说,需要处理的字符数据内容是一个邮箱地址:dzz*h*@1**.com,可以根据页面的展示需求,将每一个字符等宽分割为width:8px(pixel,像素);height:16px的字符块。
同时为了满足网页的显示需求,可以生成适应的文字字体、样式、颜色、字号、背景色,行高。
步骤203:为字符块匹配包括字符块的字典数据库,生成由字典数据库中字典字符块随机分布的二维矩阵图片。
详细的,邮箱地址所包含的信息有英文、数字和符号,所以为之匹配52个大小写英文字母、10个数字、及7个常用符号的字典字符块。
字典字符块随机分布填充为二维矩阵图片的行,为使纵坐标具有可变性,可以如图3所示随机配置10行。那么二维矩阵图片的大小即为width:552px;height:160px。
其中,二维矩阵图片中,字典字符块在每一行中的分布位置是随机的,行数也是可以随机设置的,借此确保坐标位置的横纵双向随机性以提高加密效果。
另外,当多个字典数据库包括字符块时,可以选择字典数据块数量最少的一个字典数据库进行匹配。
步骤204:记录字符块在二维矩阵图片中的坐标位置,生成二维矩阵图片的调用地址,对调用地址进行加密设置,对二维矩阵图片和调用地址进行过期失效设置;字符块存在于字典白名单时,同时生成基于二维矩阵图片的CSS Class文件,并生成CSS Class文件的调用地址。
详细的,保存二维矩阵图片后,记录字符块对应的字典字符块在二维矩阵图片中的坐标位置;当字符块存在于字典白名单时,生成并记录基于二维矩阵图片的CSS Class文件。
一个网页请求可能会包含多个需要处理的字符块,为了节省服务器资源和加快浏览器的渲染速度,在同一个网页请求中处理的字符块将共用同一个二维矩阵图片,同一个CSS Class文件。
调用地址可以使用AES(一种高级的区块加密标准)对称加密,密钥长度64位,且二维矩阵图片与调用地址均过期失效。
举例来说,存在于白名单的字符块不仅具备如background-position:-160px-16px的坐标描述,还具备了形式如map-a1f35f172fffd0afe63a8b1dda53d5c6的CSS Class位置信息,从而不仅能够以位置坐标描述找到字符块,还可以通过CSS Class位置信息找到对应的字符块,再次降低字符块拾取的规律性。
步骤205:根据二维矩阵图片的调用地址获取二维矩阵图片,根据坐标位置或CSSClass文件的位置信息在网页中显示字典字符块组成的图片。
浏览器根据调用地址获取二维矩阵图片后,根据坐标位置或CSS Class文件的位置信息在网页中显示字典字符块组成的图片。其中,以坐标位置呈现还是CSS Class位置信息呈现是随机的。
以一次浏览器访问为例,字符块d随机显示为图4所示的CSS Class位置信息,依次往下,字符块z显示的位置为width:-16px;height:-64px。最后,字符块m显示的位置为:width:-264px;height:-64px。
最终网页的浏览器呈现的就是图片化展示的信息,而服务器端返回的文件就呈现出无理论规律的加密状态,大大降低页面被采集的可能性。
综上所述,本发明实施例至少可以实现如下效果:
在本发明实施例中,通过将待处理的字符数据分割成字符块,并为字符块匹配包括字符块的字典数据库,将字典数据库中字典字符块随机生成图片,从而生成的图片为字典字符块无序组成,解析的规律性很低,从而识别工具无法破解图片形式的数据。
在本发明实施例中,通过加密设置和过期失效设置,降低页面被采集的可能性。
在本发明实施例中,通过生成基于二维矩阵图片的CSS Class文件,浏览器可以随机根据坐标位置或CSS Class文件的位置信息在网页中显示字符块组成的图片,从而增加了工具识别和采集的难度。
在本发明实施例中,二维矩阵图片中,字符块和在每一行中的分布位置是随机的,行数也是可以随机设置的,从而可以确保坐标位置的横纵双向随机性以提高加密效果。
在本发明实施例中,在同一个网页请求中处理的字符块共用同一个二维矩阵图片,同一个CSS Class文件,从而节省服务器资源,加快浏览器的渲染速度。
在本发明实施例中,采用随机加混合的策略,而不是非同步的多图片下载缓存,从而可以不影响网页的读取速度。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (6)

1.一种网页数据的加密方法,其特征在于,包括以下步骤:
步骤1:将待处理的字符数据分割为字符块,为所述字符块匹配包括所述字符块的字典数据库,生成由所述字典数据库中字典字符块随机分布的二维矩阵图片,并记录所述字符块在所述二维矩阵图片中的坐标位置;
步骤2:根据所述二维矩阵图片和所述坐标位置,在网页中显示所述字符块组成的图片。
2.如权利要求1所述的网页数据的加密方法,其特征在于,在所述步骤1之前,还包括:
设置包括不同类型的字典字符块的字典数据库;
所述为所述字符块匹配包括所述字符块的字典数据库包括:判断所述字符块类型,根据所述字符块类型为所述字符块匹配包括所述字符块的字典数据库。
3.如权利要求1所述的网页数据的加密方法,其特征在于,在所述步骤1之后,还包括:
生成所述二维矩阵图片的调用地址,对所述调用地址进行加密设置,对所述二维矩阵图片和所述调用地址进行过期失效设置。
4.如权利要求3所述的网页数据的加密方法,其特征在于,在所述步骤1之前,还包括:
设置字典白名单;
所述字符块存在于所述字典白名单时,生成基于所述二维矩阵图片的CSS Class文件,并生成所述CSS Class文件的调用地址。
5.如权利要求4所述的网页数据的加密方法,其特征在于,所述步骤2包括:
根据所述二维矩阵图片的调用地址获取所述二维矩阵图片,根据所述坐标位置或所述CSS Class文件的位置信息在网页中显示所述字符块组成的图片。
6.如权利要求1-5任一项所述的网页数据的加密方法,其特征在于,在所述将待处理的字符数据分割为字符块之后,还包括:
根据网页的显示需要,为所述字符块匹配适应的格式。
CN201710043269.1A 2017-01-19 2017-01-19 一种网页数据的加密方法 Pending CN107045612A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710043269.1A CN107045612A (zh) 2017-01-19 2017-01-19 一种网页数据的加密方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710043269.1A CN107045612A (zh) 2017-01-19 2017-01-19 一种网页数据的加密方法

Publications (1)

Publication Number Publication Date
CN107045612A true CN107045612A (zh) 2017-08-15

Family

ID=59543966

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710043269.1A Pending CN107045612A (zh) 2017-01-19 2017-01-19 一种网页数据的加密方法

Country Status (1)

Country Link
CN (1) CN107045612A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112769787A (zh) * 2020-12-29 2021-05-07 深圳一科互联有限公司 一种网站系统网络安全反爬虫计算方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880874A (zh) * 2012-09-29 2013-01-16 重庆新媒农信科技有限公司 字符识别方法和字符识别器
CN104281626A (zh) * 2013-07-12 2015-01-14 阿里巴巴集团控股有限公司 基于图片化处理的网页展示方法及网页展示装置
US8955126B2 (en) * 2004-02-17 2015-02-10 Microsoft Corporation Tiered object-related trust decisions
CN105577684A (zh) * 2016-01-25 2016-05-11 北京京东尚科信息技术有限公司 防爬虫抓取的方法、服务端、客户端和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8955126B2 (en) * 2004-02-17 2015-02-10 Microsoft Corporation Tiered object-related trust decisions
CN102880874A (zh) * 2012-09-29 2013-01-16 重庆新媒农信科技有限公司 字符识别方法和字符识别器
CN104281626A (zh) * 2013-07-12 2015-01-14 阿里巴巴集团控股有限公司 基于图片化处理的网页展示方法及网页展示装置
CN105577684A (zh) * 2016-01-25 2016-05-11 北京京东尚科信息技术有限公司 防爬虫抓取的方法、服务端、客户端和系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112769787A (zh) * 2020-12-29 2021-05-07 深圳一科互联有限公司 一种网站系统网络安全反爬虫计算方法及装置

Similar Documents

Publication Publication Date Title
US20200042837A1 (en) Detecting, redacting, and scoring confidential information in images
US9864482B2 (en) Method of navigating through digital content
US20120042236A1 (en) Integrated document viewer
US9984046B2 (en) Font delivery system and font delivery method
CN104021133B (zh) 用于让服务器保持混乱的数据的装置和方法
US9870358B2 (en) Augmented reading systems
US20120260108A1 (en) Font encryption and decryption system and method
US20150186662A1 (en) Method and apparatus for input verification
Hine et al. New deepfake regulations in China are a tool for social stability, but at what cost?
CN109543454A (zh) 一种反爬虫方法及相关设备
CN103647767A (zh) 一种网站信息的展示方法和装置
CN101183458B (zh) 图片验证码生成方法和图片验证码生成装置
CN113515928B (zh) 电子文本生成方法、装置、设备及介质
US9886564B2 (en) Server system, communication system, communication terminal device, program, recording medium, and communication method
CN113536757A (zh) 一种基于参数模板的电子合同生成签署方法、装置及系统
CN111859853A (zh) 基于随机字体的网页文本加密与解密方法
CN109933751A (zh) 图文绘制方法、装置、计算机可读存储介质和计算机设备
CN107045612A (zh) 一种网页数据的加密方法
US9442898B2 (en) Electronic document that inhibits automatic text extraction
KR20200001342A (ko) 개체를 렌더링하는 웹 전자 문서 편집 장치 및 이의 동작 방법
CN116028901A (zh) 一种嵌入水印的方法、装置、设备及存储介质
JP2002236701A (ja) 段階的情報表示方法
CN114091080A (zh) 一种字幕文件加密解密方法、系统、存储介质及电子设备
CN109684417B (zh) 数据展示方法及装置、存储介质和处理器
CN111736939A (zh) 一种页面自适应调整方法、装置、存储介质及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170815

RJ01 Rejection of invention patent application after publication