CN112818199A - 网页访问方法、装置、计算机设备及存储介质 - Google Patents
网页访问方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN112818199A CN112818199A CN202110121055.8A CN202110121055A CN112818199A CN 112818199 A CN112818199 A CN 112818199A CN 202110121055 A CN202110121055 A CN 202110121055A CN 112818199 A CN112818199 A CN 112818199A
- Authority
- CN
- China
- Prior art keywords
- target
- parameter
- index
- interface address
- webpage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 239000012634 fragment Substances 0.000 claims description 18
- 230000011218 segmentation Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请涉及通信安全技术领域,公开了一种网页访问方法、装置、计算机设备及存储介质,所述网页访问方法包括:响应于用户访问目标网页的访问请求,从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址;根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数;根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据;根据所述多个目标参数数据生成参数索引;对所述参数索引进行编码得到编码索引;通过所述第二接口地址根据所述编码索引访问所述目标网页。本申请实现了对网页的安全访问,提高了网页访问的安全性和效率。
Description
技术领域
本申请涉及通信安全技术领域,尤其涉及一种网页访问方法、装置、计算机设备及存储介质。
背景技术
互联网金融是传统金融机构与互联网企业利用互联网技术和信息通信技术实现资金融通、支付、投资和信息中介服务的新型金融业务模式。在互联网金融的运作模式中,加入了网页跳转环节,方便了用户进行访问其他的网页,从而完成相应的金融事项流程。但是网页跳转环节中涉及了数据交互传递,在网页访问过程中存在一定的安全隐患。
因此,如何解决网页访问过程中的安全隐患成为目前亟待解决技术问题。
发明内容
鉴于以上内容,有必要提出一种网页访问方法、装置、计算机设备及存储介质,能够解决网页访问过程中的安全隐患,提高网页访问过程的安全性。
本申请的第一方面提供了一种网页访问方法,所述网页访问方法包括:
响应于用户访问目标网页的访问请求,从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址;
根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数;
根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据;
根据所述多个目标参数数据生成参数索引;
对所述参数索引进行编码得到编码索引;
通过所述第二接口地址根据所述编码索引访问所述目标网页。
根据本申请的一个可选的实施例,所述对所述参数索引进行编码得到编码索引包括:
确定所述目标网页的参数长度;
根据所述参数长度对所述参数索引进行分割,得到多个参数子索引;
计算每个参数子索引中的参数的哈希值;
根据所述哈希值编码对应的参数子索引,得到编码子索引;
对多个所述编码子索引进行拼接,得到编码索引。
根据本申请的一个可选的实施例,所述方法还包括:
预先设置节点类型对应的节点权重;
获取所述目标网页对应的页面描述性文本,并生成所述页面描述性文本对应的页面树结构;
对所述页面树结构进行逐层遍历,确定每个字段对应的节点类型;
根据每个字段对应的节点类型和所述节点类型对应的节点权重,确定每个字段对应的权重;
根据字段对应的权重生成字段权重对照表。
根据本申请的一个可选的实施例,所述根据所述多个目标参数数据生成参数索引包括:
提取所述多个目标参数数据中的目标字段;
根据预设的字段权重对照表确定每个目标字段的权重值;
将权重值大于权重阈值的目标字段对应的字段值作为第一索引词;
将权重值小于或等于所述权重阈值的目标字段对应的字段值作为第二索引词;
将目标参数数据中的非目标字段对应的字段值对进行字符转换生成字符串;
根据所述第一索引词、所述第二索引词和所述字符串生成参数索引。
根据本申请的一个可选的实施例,所述根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数包括:
计算所述页面树结构中每个节点对应的节点饱和度;
将节点饱和度小于预设饱和阈值的节点确定为目标节点;
确定所述目标节点对应的多个目标参数,并将所述多个目标参数作为访问所述目标网页的多个目标需求参数。
根据本申请的一个可选的实施例,所述从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址包括:
获取所述访问请求的请求报文;
从配置标签库中获取地址信息对应的报文分割标识符;
基于所述报文分割标识符对所述请求报文进行分割,得到地址片段;
基于语义解析,从所述地址片段中得到第一接口地址和第二接口地址。
根据本申请的一个可选的实施例,所述根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据包括:
从所述第一接口地址中获取所述访问请求对应的用户身份;
获取所述用户身份对应的Token;
提取所述Token中的多个字段;
将每个字段与每个目标需求参数进行匹配;
将与所述目标需求参数匹配成功的字段确定为目标字段;
将所述Token中所述目标字段对应的字段值,作为所述目标需求参数对应的目标参数数据。
本申请的第二方面提供了一种网页访问装置,所述装置包括:
地址提取模块,用于响应于用户访问目标网页的访问请求,从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址;
参数确定模块,用于根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数;
数据获取模块,用于根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据;
索引生成模块,用于根据所述多个目标参数数据生成参数索引;
编码处理模块,用于对所述参数索引进行编码得到编码索引;
网页访问模块,用于通过所述第二接口地址根据所述编码索引访问所述目标网页。
本申请的第三方面提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序时实现如上述的网页访问方法。
本申请的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述的网页访问方法。
本申请实施例公开了一种网页访问方法、装置、计算机设备及存储介质,响应于用户访问目标网页的访问请求,从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址;根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数,通过第二接口地址确定所述目标网页的多个目标需求参数,提高了目标需求参数的准确率;根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据;根据所述多个目标参数数据生成参数索引,通过对目标参数数据建立参数索引,提高了目标参数数据的传输速率,方便管理和调取所述目标参数数据;对所述参数索引进行编码得到编码索引,通过对参数索引进行编码,缩短了索引的长度,避免了因索引过长导致的访问失败,同时也进一步提高了网页访问的安全性;通过所述第二接口地址,根据所述编码索引访问所述目标网页。本申请通过第二接口地址确定访问网页需要的目标需求参数,然后从第一接口地址中拉取目标需求参数对应的目标参数数据,并根据该目标参数数据生成参数索引,将生成的参数索引进行编码得到编码索引,进而通过第二接口地址传递编码索引给网页,实现了对网页的安全访问,提高了网页访问的安全性和效率,同时通过对参数索引编码,避免了因索引过长导致访问失败的情况发生,也进一步提高了网页访问的安全性。
附图说明
图1是本申请实施例提供的一种网页访问方法的流程示意图;
图2是本申请实施例提供的一种网页访问装置的示意性框图;
图3是本申请实施例提供的一种计算机设备的结构示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本申请实施例提供一种网页访问方法、装置、计算机设备及计算机可读存储介质。其中,该网页访问方法可应用于终端设备或服务器中,该终端设备可以手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备,该服务器可以为单台的服务器,也可以为由多台服务器组成的服务器集群。以下以该网页访问方法应用于服务器为例进行解释说明。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请实施例提供的一种网页访问方法的示意流程图。
如图1所示,所述网页访问方法具体包括步骤S11至S16,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S11,响应于用户访问目标网页的访问请求,从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址。
获取用户发送的访问目标网页的访问请求,所述访问请求可以是HTTP请求。所述访问请求中包括所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址,所述第一接口地址用于获取访问所述目标网页的目标参数数据,所述第二接口地址用于访问所述目标网页。
在一些实施方式中,所述从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址包括:
获取所述访问请求的请求报文;
从配置标签库中获取地址信息对应的报文分割标识符;
基于所述报文分割标识符对所述请求报文进行分割,得到地址片段;
基于语义解析,从所述地址片段中得到第一接口地址和第二接口地址。
示例性的,预先设置配置标签库,所述配置标签库中存储了多种信息对应的报文分割标识符,如地址信息对应的报文分割标识符。所述报文分割标识符用于标识报文进行切割的位置。基于所述报文分割标识符的位置,对所述访问请求对应的请求报文进行分割,得到所述第一接口地址对应的第一地址片段及所述第二接口地址对应的第二地址片段,通过对所述第一地址片段进行语义解析得到所述第一接口地址,通过对所述第二地址片段进行解析得到所述第二地址片段。
S12,根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数。
通过访问所述第二接口地址,获取所述目标网页的网页信息,根据所述网页信息确定访问所述目标网页的多个目标需求参数。
在一些实施方式中,所述根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数包括:
获取所述第二接口地址对应的页面描述性文本;
根据所述页面描述性文本中节点的流转顺序,生成所述页面描述性文本对应的页面树结构;
对所述页面树结构进行逐层遍历,计算所述页面树结构中每个节点对应的节点饱和度;
将节点饱和度小于预设饱和阈值的节点确定为目标节点;
确定所述目标节点对应的多个目标参数,并将所述多个目标参数作为访问所述目标网页的多个目标需求参数。
访问所述第二接口地址,获取所述第二接口对应的页面描述性文本,即所述目标网页对应的页面描述性文本。根据所述页面描述性文本中节点的流转顺序,确定每个节点对应的节点类型,如根节点、父节点、第一子节点、第二子节点等,根据每个节点对应的节点类型,生成所述页面描述性文本对应的页面树结构。
对所述页面树结构进行逐层遍历,确定所述节点中的数据存储情况,根据所述数据存储情况计算所述页面树结构中每个节点对应的节点饱和度。预先设置饱和阈值,将节点饱和度小于预设饱和阈值的节点确定为目标节点,获取所述目标节点的节点信息,根据所述节点信息确定所述目标节点对应的多个目标参数,并将所述多个目标参数作为访问所述目标网页的多个目标需求参数。
通过将页面描述性文本生成页面树结构,并对所述页面树结构进行逐层遍历,保证了页面描述性文本中的每个节点都被计算过节点饱和度,提高了确定目标需求参数准确率,从而提高了网页访问的效率。
S13,根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据。
第一接口存储了访问所述目标网页的参数数据,所述参数数据可以包括用户信息和验证信息,通过访问所述第一接口的第一接口地址可从所述第一接口中获取参数信息。
在一些实施方式中,所述根据所述多个目标需求参数从所述第一接口地址中拉取目标参数数据包括:
从所述第一接口地址中获取所述访问请求对应的用户身份;
获取所述用户身份对应的Token;
提取所述Token中的多个字段;
将所述多个字段中的每个字段与每个目标需求参数进行匹配;
将与所述目标需求参数匹配成功的字段确定为目标字段;
将所述Token中所述目标字段对应的字段值,作为所述目标需求参数对应的目标参数数据。
获取用户对应的用户身份后,可访问所述用户身份对应区块链存储地址,获取所述用户信息对应的Token。Token中存储了该用户的用户信息,提取Token中的字段可获取用户信息数据,所述用户信息数据中包括用于访问目标页面的数据。将目标需求参数与Token的字段进行匹配确定目标字段,并将所述目标字段对应的字段值,作为所述目标需求参数对应的目标参数数据。
在一些实施方式中,所述根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据包括:
配置目标请求队列;
确定所述多个目标参数请求对应的多个参数标签;
确定每个参数标签对应的重要度;
根据重要度从大到小的顺序,将所述多个目标需求参数添加至所述目标请求队列;
根据所述目标请求队列访问所述第一接口地址得到目标参数。
示例性的,预先设置参数标签对应的重要度,生成标签查询表。查询所述标签查询表确定每个参数标签对应的重要度。按照一定的顺序将目标需求参数添加至目标请求队列,可以提高参数添加的速率。
S14,根据所述多个目标参数数据生成参数索引。
根据所述多个目标参数数据的内容生成所述多个目标参数数据对应的参数索引。提高了目标参数数据的管理,同时方便了后续调取目标参数数据。
在一些实施方式中,所述根据所述多个目标参数数据生成参数索引包括:
提取所述多个目标参数数据中的目标字段;
根据预设的字段权重对照表确定每个目标字段的权重值;
将权重值大于权重阈值的目标字段对应的字段值作为第一索引词;
将权重值小于或等于所述权重阈值的目标字段对应的字段值作为第二索引词;
将目标参数数据中的非目标字段对应的字段值对进行字符转换生成字符串;
根据所述第一索引词、所述第二索引词和所述字符串生成参数索引。
示例性的,可查询预设的目标字段表,根据所述目标字段表提取所述多个目标参数数据中的目标字段。按照预设的字段权重对照表确定每个目标字段的权重值。当一目标字段的权重值大于权重阈值时,将该目标字段对应的字段值作为第一索引词;当一目标字段的权重值小于或等于权重阈值时,将该目标字段对应的字段值作为第二索引词。示例性的,可将所述目标参数数据中的非目标字段对应的字段值输入预先训练的字符转换模型,得到所述非目标字段对应的字段值的字符串。根据目标字段的权重值大小生成第一索引词和第二索引词,可有效提高参数索引的逻辑性,提高了参数索引的管理效率。
在一些实施方式中,所述根据预设的字段权重对照表确定每个目标字段的权重值之前,所述方法还包括:
预先设置节点类型对应的节点权重;
获取所述目标网页对应的页面描述性文本,并生成所述页面描述性文本对应的页面树结构;
对所述页面树结构进行逐层遍历,确定每个字段对应的节点类型;
根据每个字段对应的节点类型和所述节点权重,确定每个字段对应的权重;
根据字段对应的权重生成字段权重对照表。
示例性的,所述节点类型包括根节点、父节点、第一子节点、第二子节点等,不同的节点类型对应的节点权重不同,节点层级越高的节点对应的节点权重也越大。对所述页面树结构进行逐层遍历,确定所述页面树结构中每个字段所在的节点,并确定该节点的节点类型,从而得到每个字段对应的节点类型。根据字段和字段对应的权重之间的映射关系生成字段权重对照表。
S15,对所述参数索引进行编码得到编码索引。
按照预设的编码规则对所述参数索引进行编码得到编码索引。
在一个可选的实施例中,所述对所述参数索引进行编码得到编码索引包括:
确定所述目标网页的参数长度;
根据所述参数长度对所述参数索引进行分割,得到多个参数子索引;
计算每个参数子索引中的参数的哈希值;
根据所述哈希值编码对应的参数子索引,得到编码子索引;
对多个所述编码子索引进行拼接,得到编码索引。
获取所述目标网页的输入信息,根据所述输入信息确定所述目标网页的参数长度,所述参数长度可以是目标网页的最大输入参数长度,也可以是目标网页的最优输入参数长度。示例性的,可以将所述参数索引输入预先训练的切割模块进行分割。通过将参数索引进行分割得到多个参数子索引,保证了索引的长度,避免了因索引过长导致的访问失败,并利用哈希值对所述参数子索引进行编码得到编码子索引,可以提高参数索引的安全性,进一步提高网页访问的安全性。
S16,通过所述第二接口地址根据所述编码索引访问所述目标网页。
示例性的,通过所述第二接口地址将访问所述目标页面需要的编码索引发送至所述目标网页完成验证以及相关参数的填写,进而访问所述目标网页。
上述实施例提供的网页访问方法,响应于用户访问目标网页的访问请求,从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址;根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数,通过第二接口地址确定所述目标网页的多个目标需求参数,提高了目标需求参数的准确率;根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据;根据所述多个目标参数数据生成参数索引,通过对目标参数数据建立参数索引,提高了目标参数数据的传输速率,方便管理和调取所述目标参数数据;对所述参数索引进行编码得到编码索引,通过对参数索引进行编码,缩短了索引的长度,避免了因索引过长导致的访问失败,同时也进一步提高了网页访问的安全性;通过所述第二接口地址,根据所述编码索引访问所述目标网页。本申请通过第二接口地址确定访问网页需要的目标需求参数,然后从第一接口地址中拉取目标需求参数对应的目标参数数据,并根据该目标参数数据生成参数索引,将生成的参数索引进行编码得到编码索引,进而通过第二接口地址传递编码索引给网页,实现了对网页的安全访问,提高了网页访问的安全性和效率,同时通过对参数索引编码,避免了因索引过长导致访问失败的情况发生,也进一步提高了网页访问的安全性。
请参阅图2,图2是本申请的实施例提供的一种网页访问装置的示意性框图,该网页访问装置用于执行前述的网页访问方法。其中,该网页访问装置可以配置于服务器或终端中。
其中,服务器可以为独立的服务器,也可以为服务器集群。该终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。
如图2所示,网页访问装置20包括:地址提取模块201、参数确定模块202、数据获取模块203、索引生成模块204、编码处理模块205和网页访问模块206。
地址提取模块201,用于响应于用户访问目标网页的访问请求,从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址。
获取用户发送的访问目标网页的访问请求,所述访问请求可以是HTTP请求。所述访问请求中包括所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址,所述第一接口地址用于获取访问所述目标网页的目标参数数据,所述第二接口地址用于访问所述目标网页。
在一些实施方式中,地址提取模块201从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址包括:
获取所述访问请求的请求报文;
从配置标签库中获取地址信息对应的报文分割标识符;
基于所述报文分割标识符对所述请求报文进行分割,得到地址片段;
基于语义解析,从所述地址片段中得到第一接口地址和第二接口地址。
示例性的,预先设置配置标签库,所述配置标签库中存储了多种信息对应的报文分割标识符,如地址信息对应的报文分割标识符。所述报文分割标识符用于标识报文进行切割的位置。基于所述报文分割标识符的位置,对所述访问请求对应的请求报文进行分割,得到所述第一接口地址对应的第一地址片段及所述第二接口地址对应的第二地址片段,通过对所述第一地址片段进行语义解析得到所述第一接口地址,通过对所述第二地址片段进行解析得到所述第二地址片段。
参数确定模块202,用于根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数。
通过访问所述第二接口地址,获取所述目标网页的网页信息,根据所述网页信息确定访问所述目标网页的多个目标需求参数。
在一些实施方式中,参数确定模块202根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数包括:
获取所述第二接口地址对应的页面描述性文本;
根据所述页面描述性文本中节点的流转顺序,生成所述页面描述性文本对应的页面树结构;
对所述页面树结构进行逐层遍历,计算所述页面树结构中每个节点对应的节点饱和度;
将节点饱和度小于预设饱和阈值的节点确定为目标节点;
确定所述目标节点对应的多个目标参数,并将所述多个目标参数作为访问所述目标网页的多个目标需求参数。
访问所述第二接口地址,获取所述第二接口对应的页面描述性文本,即所述目标网页对应的页面描述性文本。根据所述页面描述性文本中节点的流转顺序,确定每个节点对应的节点类型,如根节点、父节点、第一子节点、第二子节点等,根据每个节点对应的节点类型,生成所述页面描述性文本对应的页面树结构。
对所述页面树结构进行逐层遍历,确定所述节点中的数据存储情况,根据所述数据存储情况计算所述页面树结构中每个节点对应的节点饱和度。预先设置饱和阈值,将节点饱和度小于预设饱和阈值的节点确定为目标节点,获取所述目标节点的节点信息,根据所述节点信息确定所述目标节点对应的多个目标参数,并将所述多个目标参数作为访问所述目标网页的多个目标需求参数。
通过将页面描述性文本生成页面树结构,并对所述页面树结构进行逐层遍历,保证了页面描述性文本中的每个节点都被计算过节点饱和度,提高了确定目标需求参数准确率,从而提高了网页访问的效率。
数据获取模块203,用于根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据。
第一接口存储了访问所述目标网页的参数数据,所述参数数据可以包括用户信息和验证信息,通过访问所述第一接口的第一接口地址可从所述第一接口中获取参数信息。
在一些实施方式中,数据获取模块203根据所述多个目标需求参数从所述第一接口地址中拉取目标参数数据包括:
从所述第一接口地址中获取所述访问请求对应的用户身份;
获取所述用户身份对应的Token;
提取所述Token中的多个字段;
将所述多个字段中的每个字段与每个目标需求参数进行匹配;
将与所述目标需求参数匹配成功的字段确定为目标字段;
将所述Token中所述目标字段对应的字段值,作为所述目标需求参数对应的目标参数数据。
获取用户对应的用户身份后,可访问所述用户身份对应区块链存储地址,获取所述用户信息对应的Token。Token中存储了该用户的用户信息,提取Token中的字段可获取用户信息数据,所述用户信息数据中包括用于访问目标页面的数据。将目标需求参数与Token的字段进行匹配确定目标字段,并将所述目标字段对应的字段值,作为所述目标需求参数对应的目标参数数据。
在一些实施方式中,数据获取模块203根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据包括:
配置目标请求队列;
确定所述多个目标参数请求对应的多个参数标签;
确定每个参数标签对应的重要度;
根据重要度从大到小的顺序,将所述多个目标需求参数添加至所述目标请求队列;
根据所述目标请求队列访问所述第一接口地址得到目标参数。
示例性的,预先设置参数标签对应的重要度,生成标签查询表。查询所述标签查询表确定每个参数标签对应的重要度。按照一定的顺序将目标需求参数添加至目标请求队列,可以提高参数添加的速率。
索引生成模块204,用于根据所述多个目标参数数据生成参数索引。
根据所述多个目标参数数据的内容生成所述多个目标参数数据对应的参数索引。提高了目标参数数据的管理,同时方便了后续调取目标参数数据。
在一些实施方式中,索引生成模块204根据所述多个目标参数数据生成参数索引包括:
提取所述多个目标参数数据中的目标字段;
根据预设的字段权重对照表确定每个目标字段的权重值;
将权重值大于权重阈值的目标字段对应的字段值作为第一索引词;
将权重值小于或等于所述权重阈值的目标字段对应的字段值作为第二索引词;
将目标参数数据中的非目标字段对应的字段值对进行字符转换生成字符串;
根据所述第一索引词、所述第二索引词和所述字符串生成参数索引。
示例性的,可查询预设的目标字段表,根据所述目标字段表提取所述多个目标参数数据中的目标字段。按照预设的字段权重对照表确定每个目标字段的权重值。当一目标字段的权重值大于权重阈值时,将该目标字段对应的字段值作为第一索引词;当一目标字段的权重值小于或等于权重阈值时,将该目标字段对应的字段值作为第二索引词。示例性的,可将所述目标参数数据中的非目标字段对应的字段值输入预先训练的字符转换模型,得到所述非目标字段对应的字段值的字符串。根据目标字段的权重值大小生成第一索引词和第二索引词,可有效提高参数索引的逻辑性,提高了参数索引的管理效率。
在一些实施方式中,索引生成模块204根据预设的字段权重对照表确定每个目标字段的权重值之前,所述方法还包括:
预先设置节点类型对应的节点权重;
获取所述目标网页对应的页面描述性文本,并生成所述页面描述性文本对应的页面树结构;
对所述页面树结构进行逐层遍历,确定每个字段对应的节点类型;
根据每个字段对应的节点类型和所述节点权重,确定每个字段对应的权重;
根据字段对应的权重生成字段权重对照表。
示例性的,所述节点类型包括根节点、父节点、第一子节点、第二子节点等,不同的节点类型对应的节点权重不同,节点层级越高的节点对应的节点权重也越大。对所述页面树结构进行逐层遍历,确定所述页面树结构中每个字段所在的节点,并确定该节点的节点类型,从而得到每个字段对应的节点类型。根据字段和字段对应的权重之间的映射关系生成字段权重对照表。
编码处理模块205,用于对所述参数索引进行编码得到编码索引。
按照预设的编码规则对所述参数索引进行编码得到编码索引。
在一个可选的实施例中,编码处理模块205对所述参数索引进行编码得到编码索引包括:
确定所述目标网页的参数长度;
根据所述参数长度对所述参数索引进行分割,得到多个参数子索引;
计算每个参数子索引中的参数的哈希值;
根据所述哈希值编码对应的参数子索引,得到编码子索引;
对多个所述编码子索引进行拼接,得到编码索引。
获取所述目标网页的输入信息,根据所述输入信息确定所述目标网页的参数长度,所述参数长度可以是目标网页的最大输入参数长度,也可以是目标网页的最优输入参数长度。示例性的,可以将所述参数索引输入预先训练的切割模块进行分割。通过将参数索引进行分割得到多个参数子索引,保证了索引的长度,避免了因索引过长导致的访问失败,并利用哈希值对所述参数子索引进行编码得到编码子索引,可以提高参数索引的安全性,进一步提高网页访问的安全性。
网页访问模块206,用于通过所述第二接口地址根据所述编码索引访问所述目标网页。
示例性的,通过所述第二接口地址将访问所述目标页面需要的编码索引发送至所述目标网页完成验证以及相关参数的填写,进而访问所述目标网页。
上述实施例提供的网页访问装置可以实现为一种计算机程序的形式,该计算机程序可以在如图3所示的计算机设备上运行。
请参阅图3,图3为本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以为服务器或终端设备。
如图3所示,该计算机设备30包括通过系统总线连接的处理器301和存储器302,其中,存储器302可以包括非易失性存储介质和易失性存储介质。
处理器301用于提供计算和控制能力,支撑整个计算机设备的运行。
存储器302可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器301执行所述的网页访问方法。
在一可行实施例中,所述计算机设备还包括网络接口,所述网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器301是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器执行存储在存储器中的计算机程序,以实现如下步骤:
响应于用户访问目标网页的访问请求,从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址;
根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数;
根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据;
根据所述多个目标参数数据生成参数索引;
对所述参数索引进行编码得到编码索引;
通过所述第二接口地址根据所述编码索引访问所述目标网页。
具体地,所述处理器对上述指令的具体实现方法可参考前述网页访问方法实施例中相关步骤的描述,在此不赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参照本申请网页访问方法的各个实施例。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据计算机设备的使用所创建的数据等。
前述实施例提供的网页访问方法、装置、计算机设备及计算机可读存储介质,响应于用户访问目标网页的访问请求,从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址;根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数,通过第二接口地址确定所述目标网页的多个目标需求参数,提高了目标需求参数的准确率;根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据;根据所述多个目标参数数据生成参数索引,通过对目标参数数据建立参数索引,提高了目标参数数据的传输速率,方便管理和调取所述目标参数数据;对所述参数索引进行编码得到编码索引,通过对参数索引进行编码,缩短了索引的长度,避免了因索引过长导致的访问失败,同时也进一步提高了网页访问的安全性;通过所述第二接口地址,根据所述编码索引访问所述目标网页。本申请通过第二接口地址确定访问网页需要的目标需求参数,然后从第一接口地址中拉取目标需求参数对应的目标参数数据,并根据该目标参数数据生成参数索引,将生成的参数索引进行编码得到编码索引,进而通过第二接口地址传递编码索引给网页,实现了对网页的安全访问,提高了网页访问的安全性和效率,同时通过对参数索引编码,避免了因索引过长导致访问失败的情况发生,也进一步提高了网页访问的安全性。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种网页访问方法,其特征在于,所述网页访问方法包括:
响应于用户访问目标网页的访问请求,从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址;
根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数;
根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据;
根据所述多个目标参数数据生成参数索引;
对所述参数索引进行编码得到编码索引;
通过所述第二接口地址根据所述编码索引访问所述目标网页。
2.根据权利要求1所述的网页访问方法,其特征在于,所述对所述参数索引进行编码得到编码索引包括:
确定所述目标网页的参数长度;
根据所述参数长度对所述参数索引进行分割,得到多个参数子索引;
计算每个参数子索引中的参数的哈希值;
根据所述哈希值编码对应的参数子索引,得到编码子索引;
对多个所述编码子索引进行拼接,得到编码索引。
3.根据权利要求1所述的网页访问方法,其特征在于,所述方法还包括:
预先设置节点类型对应的节点权重;
获取所述目标网页对应的页面描述性文本,并生成所述页面描述性文本对应的页面树结构;
对所述页面树结构进行逐层遍历,确定每个字段对应的节点类型;
根据每个字段对应的节点类型和所述节点类型对应的节点权重,确定每个字段对应的权重;
根据字段对应的权重生成字段权重对照表。
4.根据权利要求3所述的网页访问方法,其特征在于,所述根据所述多个目标参数数据生成参数索引包括:
提取所述多个目标参数数据中的目标字段;
根据所述字段权重对照表确定每个目标字段的权重值;
将权重值大于权重阈值的目标字段对应的字段值作为第一索引词;
将权重值小于或等于所述权重阈值的目标字段对应的字段值作为第二索引词;
将所述多个目标参数数据中的非目标字段对应的字段值进行字符转换生成字符串;
根据所述第一索引词、所述第二索引词和所述字符串生成参数索引。
5.根据权利要求3所述的网页访问方法,其特征在于,所述根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数包括:
计算所述页面树结构中每个节点对应的节点饱和度;
将节点饱和度小于预设饱和阈值的节点确定为目标节点;
确定所述目标节点对应的多个目标参数,并将所述多个目标参数作为访问所述目标网页的多个目标需求参数。
6.根据权利要求1-5任意一项所述的网页访问方法,其特征在于,所述从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址包括:
获取所述访问请求的请求报文;
从配置标签库中获取所述请求报文对应的报文分割标识符;
基于所述报文分割标识符对所述请求报文进行分割,得到地址片段;
基于语义解析,从所述地址片段中得到所述第一接口地址和所述第二接口地址。
7.根据权利要求1-5任意一项所述的网页访问方法,其特征在于,所述根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据包括:
从所述第一接口地址中获取所述访问请求对应的用户身份;
获取所述用户身份对应的Token;
提取所述Token中的多个字段;
将所述多个字段中的每个字段与每个目标需求参数进行匹配;
将与所述目标需求参数匹配成功的字段确定为目标字段;
将所述Token中所述目标字段对应的字段值,作为所述目标需求参数对应的目标参数数据。
8.一种网页访问装置,其特征在于,包括:
地址提取模块,用于响应于用户访问目标网页的访问请求,从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址;
参数确定模块,用于根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数;
数据获取模块,用于根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据;
索引生成模块,用于根据所述多个目标参数数据生成参数索引;
编码处理模块,用于对所述参数索引进行编码得到编码索引;
网页访问模块,用于通过所述第二接口地址根据所述编码索引访问所述目标网页。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序时实现如权利要求1至7中任意一项所述的网页访问方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的网页访问方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110121055.8A CN112818199A (zh) | 2021-01-28 | 2021-01-28 | 网页访问方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110121055.8A CN112818199A (zh) | 2021-01-28 | 2021-01-28 | 网页访问方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112818199A true CN112818199A (zh) | 2021-05-18 |
Family
ID=75859953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110121055.8A Pending CN112818199A (zh) | 2021-01-28 | 2021-01-28 | 网页访问方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112818199A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116360859A (zh) * | 2023-03-31 | 2023-06-30 | 摩尔线程智能科技(北京)有限责任公司 | 电源域的访问方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103077254A (zh) * | 2013-02-06 | 2013-05-01 | 人民搜索网络股份公司 | 网页获取方法和装置 |
CN104104649A (zh) * | 2013-04-02 | 2014-10-15 | 阿里巴巴集团控股有限公司 | 页面登录的方法、装置及系统 |
-
2021
- 2021-01-28 CN CN202110121055.8A patent/CN112818199A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103077254A (zh) * | 2013-02-06 | 2013-05-01 | 人民搜索网络股份公司 | 网页获取方法和装置 |
CN104104649A (zh) * | 2013-04-02 | 2014-10-15 | 阿里巴巴集团控股有限公司 | 页面登录的方法、装置及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116360859A (zh) * | 2023-03-31 | 2023-06-30 | 摩尔线程智能科技(北京)有限责任公司 | 电源域的访问方法、装置、设备及存储介质 |
CN116360859B (zh) * | 2023-03-31 | 2024-01-26 | 摩尔线程智能科技(北京)有限责任公司 | 电源域的访问方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112329419A (zh) | 文档编辑方法、装置、服务器、终端和存储介质 | |
CN111274045A (zh) | 一种多平台对接方法、装置、计算机设备及可读存储介质 | |
CN110427453B (zh) | 数据的相似度计算方法、装置、计算机设备及存储介质 | |
CN112507212A (zh) | 智能回访方法、装置、电子设备及可读存储介质 | |
CN114218315A (zh) | 接口生成方法、装置、计算机设备及存储介质 | |
CN111475700A (zh) | 一种数据提取方法及相关设备 | |
CN115544560A (zh) | 一种敏感信息的脱敏方法、装置、计算机设备及存储介质 | |
CN113535677B (zh) | 数据分析查询管理方法、装置、计算机设备及存储介质 | |
CN115099233A (zh) | 一种语义解析模型的构建方法、装置、电子设备及存储介质 | |
CN113010542B (zh) | 业务数据处理方法、装置、计算机设备及存储介质 | |
CN112818199A (zh) | 网页访问方法、装置、计算机设备及存储介质 | |
CN112000692B (zh) | 页面查询反馈方法、装置、计算机设备及可读存储介质 | |
CN113239256A (zh) | 生成网站签名的方法、识别网站的方法及装置 | |
CN112069808A (zh) | 融资风控方法、装置、计算机设备及存储介质 | |
CN116956326A (zh) | 权限数据的处理方法、装置、计算机设备及存储介质 | |
CN116860856A (zh) | 一种财务数据处理方法、装置、计算机设备及存储介质 | |
CN113706249B (zh) | 数据推荐方法、装置、电子设备及存储介质 | |
Khan et al. | On uniform convergence of undiscounted optimal programs in the Mitra–Wan forestry model: the strictly concave case | |
CN115238009A (zh) | 基于血缘分析的元数据管理方法、装置、设备及存储介质 | |
CN113656466A (zh) | 保单数据查询方法、装置、设备及存储介质 | |
CN108768742B (zh) | 网络构建方法及装置、电子设备、存储介质 | |
CN112528647A (zh) | 相似文本生成方法、装置、电子设备及可读存储介质 | |
CN112527830A (zh) | 数据查询方法、装置、设备及存储介质 | |
CN112231454A (zh) | 提问预测及回答反馈方法、装置、计算机设备及存储介质 | |
CN117093717B (zh) | 一种相似文本聚合方法、装置、设备及其存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |