CN113360930A - 一种实现前后端字符相异加密方法及处理终端 - Google Patents
一种实现前后端字符相异加密方法及处理终端 Download PDFInfo
- Publication number
- CN113360930A CN113360930A CN202110723305.5A CN202110723305A CN113360930A CN 113360930 A CN113360930 A CN 113360930A CN 202110723305 A CN202110723305 A CN 202110723305A CN 113360930 A CN113360930 A CN 113360930A
- Authority
- CN
- China
- Prior art keywords
- character
- character data
- target area
- rule
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000009877 rendering Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Storage Device Security (AREA)
Abstract
本发明公开一种实现前后端字符相异加密方法及处理终端,所述方法包括如下步骤:步骤1:获取前端目标区域的字符数据;步骤2:将所述字符数据按预设字符编码规则与字符编码进行重新映射,得到加密字符数据,将加密字符数据替换所述前端目标区域的字符数据。本发明仅利用字体库即可实现前后端字符相异,无需建模等数据处理,成本低廉,易于推广,实现与采用反爬虫技术同样的反爬虫技术效果。
Description
技术领域
本发明涉及字符加密技术领域,具体涉及一种实现前后端字符相异加密方法及处理终端。
背景技术
常规特别小型网站的网页上字符往往可以通过爬虫技术轻松抓取到,爬虫技术可以轻松地抓取到网页上的明文信息。例如网页上的商品价格、手机号码、电子邮箱、文字文案等。为了防止这些字符内容被爬虫技术所抓取,往往会采用反爬虫技术来封禁抓取方IP而避免被爬虫抓取到内容。但采用反爬虫技术往往较为复杂,需要基于分析爬虫行为来建立模型,涉及到大量数据处理,投入较多成本,对于常规特别小型的网站,显得得不偿失。为此需要采用不同于反爬虫且更简单实现爬虫的技术方案,可以同样达到反爬虫效果。
发明内容
针对现有技术的不足,本发明的目的之一提供一种实现前后端字符相异加密方法,其能够解决前端显示字符和后端实际字符相异的问题;
本发明的目的之二提供一种处理终端,其能够解决前端显示字符和后端实际字符相异的问题;
实现本发明的目的之一的技术方案为:一种实现前后端字符相异加密方法,包括如下步骤:
步骤1:获取前端目标区域的字符数据;
步骤2:将所述字符数据按预设字符编码规则与字符编码进行重新映射,得到加密字符数据,将加密字符数据替换所述前端目标区域的字符数据。
进一步地,将所述字符数据按预设字符编码规则与字符编码进行重新映射的具体实现,包括以下步骤:
将用于渲染所述目标区域的字符数据的现有通用字符编码规则进行随机打乱,随机打乱的字符编码规则相异于现有通用字符编码规则,随机打乱的字符编码规则作为所述预设字符编码规则,
其中,现有通用字符编码规则存储在前端的字体库中,通用字符编码规则是指任何一方均可将字符编码解析出与前端目标区域所显示相同的字符数据。
进一步地,所述前端目标区域为网页,获取网页的ttf文件,将ttf文件转换为SVG文件,对SVG文件中的所有unicode随机打乱,并存储随机打乱后的unicode,随机打乱后的unicode作为所述预设字符编码规则,
将存储有随机打乱后的unicode的SVG文件再次转换为ttf文件,网页通过css样式表的@font-face参数引用转换后的ttf文件,实现所述重新映射。
实现本发明目的之二的技术方案为:一种处理终端,其包括,存储器,用于存储程序指令;
处理器,用于运行所述程序指令,以执行所述实现前后端字符相异加密方法中的步骤。
本发明的有益效果为:本发明仅利用字体库即可实现前后端字符相异,无需建模等数据处理,成本低廉,易于推广,实现与采用反爬虫技术同样的反爬虫技术效果。
附图说明
图1为本发明的流程示意图;
图2为本发明一种处理终端的结构示意图。
具体实施方式
下面,结合附图以及具体实施方案,对本发明做进一步描述。
如图1所示,一种实现前后端字符相异加密方法,包括如下步骤:
步骤1:获取前端目标区域的字符数据。
前端可以是PC端的网页,也可以是移动端的APP,当然还可以是其他可通过超链接实现内容访问的终端。
以网页为例,人眼所看到网页上的字符数据实质上是计算机通过字符编码显示对应图形。例如,字符数据为数字0,人眼看到的是计算机通过字符编码显示出的一个图形符号“0”,该图形符号“0”会被人的大脑认定为数字0,从而实现前端显示字符0,而图形符号“0”有一个对应的字符编码,计算机识别出该字符编码就知道需要显示该图形符号。
现有的在计算机(包括PC、移动终端等具有处理文字能力终端)的字符编码是一个统一通用规则,对常用计算机而言,有一套对应的统一字符编码规则。因此,爬虫技术一旦抓取到字符编码,也即根据该统一字符编码规则能够获前端当前的网页内容,实现网页内容抓取。也即,爬虫抓取的是后端的字符编码,而字符编码映射到前端的则显示该字符编码所对应的图形,也即显示对应的字符。所谓后端的字符编码通常也即是网页源代码中的字符。
需要说明的是,这里的字符数据和字符本质上是同一个对象,字符数据更多是指具有一个或多个字符构成的字符集合,是一堆数据,而字符就是指我们的文字或符号等内容。
步骤2:将所述字符数据按预设字符编码规则与字符编码进行重新映射,得到加密字符数据,将加密字符数据替换所述前端目标区域的字符数据。通过加密字符数据替换到原先按统一字符编码的字符数据,从而能够实现前端显示的字符与后端采用现有统一字符编码规则所对应的字符不相符,当爬虫技术抓取到后端的字符编码,按现有统一字符编码规则进行解析出的字符与前端显示的字符相异,从而使得爬虫抓取到的内容无意义,达到反爬虫效果。
其中,将所述字符数据按预设字符编码规则进行重新映射的具体实现,包括以下步骤:
将前端存储的字体库中的用于渲染所述字符数据的字符编码规则随机打乱或人为调整相异于原先的统一通用字符编码规则,得到的字符编码规则作为所述预设字符编码规则。例如,数字0、1、2、3、4在字体库采用现有的字符编码规则,对应的字符编码依次为0x30、0x31、0x32、0x33、0x34,也即有0x3=>0、0x31=>1、0x32=>2、0x33=>3、0x34=>4。也即,原先的统一通用字符编码规则是现有通用字符编码规则,任何一方一旦获得字符编码后,可将字符编码后解析出前端目标区域所显示的字符数据,也即解析出的字符数据与前端显示的字符数据相同。
现将字符编码规则随机打乱或人为调整后,得到新的字符编码规则是这样的:数字0、1、2、3、4对应的字符编码依次为0x34、0x33、0x32、0x31、0x30。
因此,按新的字符编码规得到加密字符数据替换掉目标区域的字符数据后,在前端网页上仍然显示为“01234”,但后端,也即爬虫技术抓取到的字符编码则为“0x30、0x31、0x32、0x33、0x34”,采用现有统一通用字符编码规则对这些字符编码解析出来的字符则是“43210”。也即爬虫技术复制出来的是字符编码“0x30、0x31、0x32、0x33、0x34”,当将这些字符编码粘贴出来的时候,则会按通用的同一字符编码规则件显示,显示的是“43210”。这样抓取到的字符数据变得毫无用处,从而实现采用反爬虫技术同样的反爬虫技术效果,且无需建模等数据处理,仅利用字体库即可实现前后端字符相异,成本低廉,能够在小型网站进行大规模推广。
具体到前端网页上,前端网页的字体库通常采用ttf文件,ttf文件存储了字符编码和所需要显示字符图像之间的编码规则,也即是字符编码和字符之间的映射关系。将ttf文件转换为SVG文件,对SVG文件中的所有unicode(中文为统一码)随机打乱,并存储随机打乱后的unicode,随机打乱后的unicode也即是作为所述预设字符编码规则。然后将存储有随机打乱后的unicode的SVG文件再次转换为ttf文件,前端网页(html)通过css样式表的@font-face参数引用转换后的ttf文件,实现所述重新映射,网页即可按随机打乱后的unicode渲染出对应的字符,从而使得前端显示的字符与后端字符编码无法按现有统一的字符编码规则进行渲染,从而达到加密效果,爬虫技术无法通过抓取还原出真实显示的字符数据。
如图2所示,本发明还涉及实现前后端字符相异加密方法的实体实现处理终端100,其包括,
存储器101,用于存储程序指令;
处理器102,用于运行所述程序指令,以执行所述实现前后端字符相异加密方法中的步骤。
本说明书所公开的实施例只是对本发明单方面特征的一个例证,本发明的保护范围不限于此实施例,其他任何功能等效的实施例均落入本发明的保护范围内。对于本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及变形,而所有的这些改变以及变形都应该属于本发明权利要求的保护范围之内。
Claims (4)
1.一种实现前后端字符相异加密方法,其特征在于,包括如下步骤:
步骤1:获取前端目标区域的字符数据;
步骤2:将所述字符数据按预设字符编码规则与字符编码进行重新映射,得到加密字符数据,将加密字符数据替换所述前端目标区域的字符数据。
2.根据权利要求1所述的实现前后端字符相异加密方法,其特征在于,将所述字符数据按预设字符编码规则与字符编码进行重新映射的具体实现,包括以下步骤:
将用于渲染所述目标区域的字符数据的现有通用字符编码规则进行随机打乱,随机打乱的字符编码规则相异于现有通用字符编码规则,随机打乱的字符编码规则作为所述预设字符编码规则,
其中,现有通用字符编码规则存储在前端的字体库中,通用字符编码规则是指任何一方均可将字符编码解析出与前端目标区域所显示相同的字符数据。
3.根据权利要求1所述的实现前后端字符相异加密方法,其特征在于,所述前端目标区域为网页,获取网页的ttf文件,将ttf文件转换为SVG文件,对SVG文件中的所有unicode随机打乱,并存储随机打乱后的unicode,随机打乱后的unicode作为所述预设字符编码规则,
将存储有随机打乱后的unicode的SVG文件再次转换为ttf文件,网页通过css样式表的@font-face参数引用转换后的ttf文件,实现所述重新映射。
4.一种处理终端,其特征在于,其包括,
存储器,用于存储程序指令;
处理器,用于运行所述程序指令,以执行如权利要求1-3任一项所述的实现前后端字符相异加密方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110723305.5A CN113360930A (zh) | 2021-06-28 | 2021-06-28 | 一种实现前后端字符相异加密方法及处理终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110723305.5A CN113360930A (zh) | 2021-06-28 | 2021-06-28 | 一种实现前后端字符相异加密方法及处理终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113360930A true CN113360930A (zh) | 2021-09-07 |
Family
ID=77536910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110723305.5A Pending CN113360930A (zh) | 2021-06-28 | 2021-06-28 | 一种实现前后端字符相异加密方法及处理终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113360930A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115567318A (zh) * | 2022-11-08 | 2023-01-03 | 广州市保伦电子有限公司 | 一种密码加密与解密方法及终端 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100023751A1 (en) * | 2008-07-24 | 2010-01-28 | Alibaba Group Holding Limited | System and method for preventing web crawler access |
CN109977685A (zh) * | 2019-03-21 | 2019-07-05 | 古联(北京)数字传媒科技有限公司 | 网页内容加密方法,加密装置及系统 |
CN110990799A (zh) * | 2018-09-28 | 2020-04-10 | 北京国双科技有限公司 | 一种反爬虫的数据处理方法、装置、系统及存储介质 |
CN111898152A (zh) * | 2020-05-07 | 2020-11-06 | 北京五八信息技术有限公司 | 一种页面展示方法、电子设备及存储介质 |
CN112422543A (zh) * | 2020-11-09 | 2021-02-26 | 建信金融科技有限责任公司 | 反爬虫方法和装置 |
-
2021
- 2021-06-28 CN CN202110723305.5A patent/CN113360930A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100023751A1 (en) * | 2008-07-24 | 2010-01-28 | Alibaba Group Holding Limited | System and method for preventing web crawler access |
CN110990799A (zh) * | 2018-09-28 | 2020-04-10 | 北京国双科技有限公司 | 一种反爬虫的数据处理方法、装置、系统及存储介质 |
CN109977685A (zh) * | 2019-03-21 | 2019-07-05 | 古联(北京)数字传媒科技有限公司 | 网页内容加密方法,加密装置及系统 |
CN111898152A (zh) * | 2020-05-07 | 2020-11-06 | 北京五八信息技术有限公司 | 一种页面展示方法、电子设备及存储介质 |
CN112422543A (zh) * | 2020-11-09 | 2021-02-26 | 建信金融科技有限责任公司 | 反爬虫方法和装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115567318A (zh) * | 2022-11-08 | 2023-01-03 | 广州市保伦电子有限公司 | 一种密码加密与解密方法及终端 |
CN115567318B (zh) * | 2022-11-08 | 2023-05-16 | 广东保伦电子股份有限公司 | 一种密码加密与解密方法及终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108595583B (zh) | 动态图表类页面数据爬取方法、装置、终端及存储介质 | |
Zhang et al. | Viscode: Embedding information in visualization images using encoder-decoder network | |
US9471550B2 (en) | Method and apparatus for document conversion with font metrics adjustment for format compatibility | |
US20080059612A1 (en) | Variable length file header apparatus and system | |
CN111695518B (zh) | 结构化文档信息标注的方法、装置及电子设备 | |
WO2019246294A1 (en) | Methods, devices and systems for data augmentation to improve fraud detection | |
CN111222611B (zh) | 一种基于颜色的堆叠式三维码编码方法、编码装置、解码方法、解码装置以及存储介质 | |
CN112035706A (zh) | 编码、解码方法、计算机设备及可读存储介质 | |
CN111145202B (zh) | 模型生成方法、图像处理方法、装置、设备及存储介质 | |
CN111859210B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN113360930A (zh) | 一种实现前后端字符相异加密方法及处理终端 | |
CN110069907A (zh) | 基于数字水印的大数据溯源方法及系统 | |
CN112749639B (zh) | 模型训练方法、装置、计算机设备和存储介质 | |
US20150278162A1 (en) | Retention of content in converted documents | |
US20130024765A1 (en) | Processing rich text data for storing as legacy data records in a data storage system | |
CN112464180A (zh) | 页面截图外发管控方法、系统、电子设备及存储介质 | |
CN116774973A (zh) | 数据渲染方法、装置、计算机设备及存储介质 | |
CN102467490A (zh) | 一种字体数据的处理方法及装置 | |
CN110781185B (zh) | 一种文本文件内容像素化转换及还原方法 | |
CN112069549B (zh) | 一种在Bootstrap-table插件导出表格时图片下载方法及系统 | |
CN114756794A (zh) | 一种网页信息反泄密方法及装置 | |
CN117597702A (zh) | 缩放无关的水印提取 | |
CN113343663A (zh) | 一种票据结构化方法及装置 | |
CN111581921B (zh) | 一种文本编辑的方法、装置、计算机存储介质及终端 | |
CN117876203B (zh) | 一种金融领域基于字符字号的文本水印方法及系统、设备及可存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: No. 56 Nanli East Road, Shiqi Town, Panyu District, Guangzhou City, Guangdong Province, 510000 Applicant after: Guangdong Baolun Electronics Co.,Ltd. Address before: No.19 Chuangyuan Road, Zhongcun street, Panyu District, Guangzhou, Guangdong 510000 Applicant before: GUANGZHOU ITC ELECTRONIC TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210907 |
|
RJ01 | Rejection of invention patent application after publication |