CN109460783A

CN109460783A - 伪造浏览器的识别方法、系统、服务器及存储介质

Info

Publication number: CN109460783A
Application number: CN201811233084.8A
Authority: CN
Inventors: 张振宇; 汪智勇
Original assignee: Wuhan Summit Network Technology Co Ltd
Current assignee: Wuhan Summit Network Technology Co Ltd
Priority date: 2018-10-22
Filing date: 2018-10-22
Publication date: 2019-03-12
Anticipated expiration: 2038-10-22
Also published as: CN109460783B

Abstract

本发明公开了一种伪造浏览器的识别方法、系统、服务器及存储介质；本发明通过服务器响应于终端设备的当前浏览器发送的访问请求，从访问请求中提取待比较浏览器信息，并向当前浏览器发送响应指令；在接收到当前浏览器反馈的响应完成指令时，根据响应完成指令确定当前浏览器的当前响应特征；将当前响应特征代入目标深度神经网络模型中，获得当前浏览器的当前性能特征，并根据待比较浏览器信息查找对应的实际性能特征；计算当前性能特征与实际性能特征的相似度；当相似度不在预设阈值内时，判定当前浏览器为伪造浏览器，并对当前浏览器的后续请求进行拦截，实现了从更本质的维度去识别伪造浏览器，提高了识别准确率。

Description

伪造浏览器的识别方法、系统、服务器及存储介质

技术领域

本发明涉及信息安全领域，尤其涉及一种伪造浏览器的识别方法、系统、服务器及存储介质。

背景技术

近年来随着网站资源日益丰富，网站主们为了保护这些网站资源通常会对一些恶意访问实施反爬虫技术，想要获得这些网站信息，就需要伪造浏览器，模拟真实用户的行为。

目前对于伪造浏览器的识别方法是为每个浏览器构建一个浏览器指纹，通过判断浏览器指纹来确定浏览器是否被伪造，然而随着计算机技术的发展，浏览器指纹很容易被篡改，导致这种方法很难准确识别出浏览器是否为伪造。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种伪造浏览器的识别方法、系统、服务器及存储介质，旨在解决现有技术中无法从更本质的维度识别伪造浏览器的技术问题。

为实现上述目的，本发明提供一种伪造浏览器的识别方法，所述方法包括以下步骤：

响应于终端设备的当前浏览器发送的访问请求，从所述访问请求中提取待比较浏览器信息，并向所述当前浏览器发送响应指令；

在接收到所述当前浏览器反馈的响应完成指令时，根据所述响应完成指令确定所述当前浏览器的当前响应特征；

将所述当前响应特征代入目标深度神经网络模型中，获得所述当前浏览器的当前性能特征，并根据所述待比较浏览器信息查找对应的实际性能特征；

计算所述当前性能特征与实际性能特征的相似度；

当所述相似度不在预设阈值内时，判定所述当前浏览器为伪造浏览器，并对所述当前浏览器的后续请求进行拦截。

优选地，所述计算所述当前性能特征与实际性能特征的相似度，具体包括：

将所述当前性能特征进行维度拆解，获得当前性能向量；

将所述实际性能特征进行维度拆解，获得实际性能向量；

通过计算所述当前性能向量与所述实际性能向量的欧式距离获得所述当前性能特征与实际性能特征的相似度。

优选地，所述在接收到所述当前浏览器反馈的响应完成指令时，根据所述响应完成指令确定所述当前浏览器的当前响应特征，具体包括：

在接收到所述当前浏览器反馈的响应完成指令时，判断所述当前浏览器的页面内容是否完全展示；

在所述页面内容完全展示时，根据所述响应完成指令确定所述当前浏览器的当前响应特征。

优选地，所述在所述页面内容完全展示时，根据所述响应完成指令确定所述当前浏览器的当前响应特征，具体包括：

在所述页面内容完全展示时，记录向所述当前浏览器发送响应指令的第一时间以及接收到所述响应完成指令的第二时间；

根据所述第一时间及所述第二时间确定页面加载时间；

将所述页面加载时间作为所述当前浏览器的当前响应特征。

优选地，所述将所述当前响应特征代入目标深度神经网络模型中，获得所述当前浏览器的当前性能特征，并根据所述待比较浏览器信息查找对应的实际性能特征之前，所述方法还包括：

根据所述待比较浏览器信息查找对应的目标深度神经网络模型。

优选地，所述待比较浏览器信息为所述当前浏览器的版本号。

优选地，所述根据所述待比较浏览器信息查找对应的目标深度神经网络模型之前，所述方法还包括：

获得真实浏览器的真实性能特征，并将所述真实性能特征作为正样本数据；

获得伪造浏览器的伪造性能特征，并将所述伪造性能特征作为负样本数据；

以响应特征为维度根据所述正样本数据及负样本数据对初始深度神经网络模型，获得目标深度神经网络模型。

此外，为实现上述目的，本发明还提供一种伪造浏览器的识别系统，所述伪造浏览器的识别系统包括：

指令发送模块，用于响应于终端设备的当前浏览器发送的访问请求，从所述访问请求中提取待比较浏览器信息，并向所述当前浏览器发送响应指令；

特征确定模块，用于在接收到所述当前浏览器反馈的响应完成指令时，根据所述响应完成指令确定所述当前浏览器的当前响应特征；

性能获取模块，用于将所述当前响应特征代入目标深度神经网络模型中，获得所述当前浏览器的当前性能特征，并根据所述待比较浏览器信息查找对应的实际性能特征；

相似度计算模块，用于计算所述当前性能特征与实际性能特征的相似度；

浏览器判定模块，用于当所述相似度不在预设阈值内时，判定所述当前浏览器为伪造浏览器，并对所述当前浏览器的后续请求进行拦截。

此外，为实现上述目的，本发明还提供一种服务器，所述服务器包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的伪造浏览器的识别程序，所述伪造浏览器的识别程序配置为实现所述的伪造浏览器的识别方法的步骤。

此外，为实现上述目的，本发明还提供一种存储介质，其特征在于，所述存储介质上存储有伪造浏览器的识别程序，所述伪造浏览器的识别程序被处理器执行时实现所述的伪造浏览器的识别方法的步骤。

本发明通过服务器响应于终端设备的当前浏览器发送的访问请求，从访问请求中提取待比较浏览器信息，并向当前浏览器发送响应指令；在接收到当前浏览器反馈的响应完成指令时，根据响应完成指令确定当前浏览器的当前响应特征；将当前响应特征代入目标深度神经网络模型中，获得当前浏览器的当前性能特征，并根据待比较浏览器信息查找对应的实际性能特征；计算当前性能特征与实际性能特征的相似度；当相似度不在预设阈值内时，判定当前浏览器为伪造浏览器，并对当前浏览器的后续请求进行拦截，实现了从更本质的维度去识别伪造浏览器，提高了识别准确率。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的服务器结构示意图；

图2为本发明伪造浏览器的识别方法第一实施例的流程示意图；

图3为本发明第一实施例中步骤S50的可视化效果图；

图4为本发明伪造浏览器的识别方法第二实施例的流程示意图；

图5为本发明伪造浏览器的识别系统第一实施例的功能模块图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的服务器结构示意图。

如图1所示，该服务器可以包括：处理器1001，例如CPU，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的结构并不构成对服务器的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及伪造浏览器的识别程序。

在图1所示的服务器中，网络接口1004主要用于与外部网络进行数据通信；用户接口1003主要用于接收用户的输入指令；所述服务器通过处理器1001调用存储器1005中存储的伪造浏览器的识别程序，并执行以下操作：

计算所述当前性能特征与实际性能特征的相似度；

进一步地，处理器1001可以调用存储器1005中存储的伪造浏览器的识别程序，还执行以下操作：

将所述当前性能特征进行维度拆解，获得当前性能向量；

将所述实际性能特征进行维度拆解，获得实际性能向量；

根据所述第一时间及所述第二时间确定页面加载时间；

将所述页面加载时间作为所述当前浏览器的当前响应特征。

本实施例通过服务器响应于终端设备的当前浏览器发送的访问请求，从访问请求中提取待比较浏览器信息，并向当前浏览器发送响应指令；在接收到当前浏览器反馈的响应完成指令时，根据响应完成指令确定当前浏览器的当前响应特征；将当前响应特征代入目标深度神经网络模型中，获得当前浏览器的当前性能特征，并根据待比较浏览器信息查找对应的实际性能特征；计算当前性能特征与实际性能特征的相似度；当相似度不在预设阈值内时，判定当前浏览器为伪造浏览器，并对当前浏览器的后续请求进行拦截，实现了从更本质的维度去识别伪造浏览器，提高了识别准确率。

基于上述硬件结构，提出本发明伪造浏览器的识别方法实施例。

参照图2，图2为本发明伪造浏览器的识别方法第一实施例的流程示意图。

在第一实施例中，所述伪造浏览器的识别方法包括以下步骤：

S10：响应于终端设备的当前浏览器发送的访问请求，从所述访问请求中提取待比较浏览器信息，并向所述当前浏览器发送响应指令。

应理解的是，所述终端设备可以是智能手机、平板电脑或笔记本电脑等设备，本实施例对此不加以限制。

所述浏览器是指可以显示网页服务器或者文件系统的超文本标记语言(HyperText Mark-up Language，HTML)文件内容，并让用户与这些文件交互的一种软件，可以是QQ浏览器、Internet Explorer浏览器、百度浏览器、搜狗浏览器、猎豹浏览器、360浏览器、UC浏览器、傲游浏览器、世界之窗浏览器等，本实施例对此不加以限制。

需要说明的是，浏览器信息包括浏览器名称、浏览器版本号、渲染引擎、操作系统等，本实施例中所述待比较浏览器信息优选地为所述当前浏览器的版本号，当然也可以是所述当前浏览器的型号，或其他特征信息，本实施例对此不加以限制。

可以理解的是，不同的浏览器根据型号或版本不同，性能也是不一样的。浏览器向服务器发送访问请求时，访问请求里会有浏览器信息，通过浏览器信息可以判断用户使用的是哪个型号或版本的浏览器，从而再根据浏览器的性能确定是否为伪造。

S20：在接收到所述当前浏览器反馈的响应完成指令时，根据所述响应完成指令确定所述当前浏览器的当前响应特征。

可以理解的是，本实施例中当前响应特征为页面加载时间，当然也可以是浏览器的其他特征，本实施例对此不加以限制。

需要说明的是，服务器向当前浏览器发送响应指令，待当前浏览器响应完指令之后，会接收到当前浏览器反馈的响应完成指令。根据这两种指令可以计算出当前响应特征。

S30：将所述当前响应特征代入目标深度神经网络模型中，获得所述当前浏览器的当前性能特征，并根据所述待比较浏览器信息查找对应的实际性能特征。

需要说明的是，所述目标深度神经网络模型为所述待比较浏览器信息对应的模型，也就是说，在建立深度神经网络模型时，会根据浏览器的信息建立不同的模型。比如，当浏览器为火狐浏览器时，根据火狐浏览器的样本数据建立一个深度神经网络模型，当浏览器为360浏览器时，根据360浏览器的样本数据建立另一个深度神经网络模型。

在具体实现中，因为需要提前为不同的浏览器建立不同的深度神经网络模型。因此在选用目标深度神经网络模型前，需要根据所述待比较浏览器信息查找对应的目标深度神经网络模型。

具体地，获得真实浏览器的真实性能特征，并将所述真实性能特征作为正样本数据；获得伪造浏览器的伪造性能特征，并将所述伪造性能特征作为负样本数据；以响应特征为维度根据所述正样本数据及负样本数据对初始深度神经网络模型，获得目标深度神经网络模型。

可以理解的是，在使用目标深度神经网络模型之前，需要先获得目标深度神经网络模型。而建立目标深度神经网络模型需要大量的样本数据。本实施例中，所述真实浏览器是指所述待比较浏览器信息对应的浏览器。另外，可以通过模拟攻击者伪造浏览器的过程建立伪造浏览器，在伪造浏览器运行过程中获得其伪造性能特征。

应理解的是，所述实际性能特征，指真实浏览器在运行时表现出来的性能指标。伪造的浏览器与真实的浏览器相比性能指标是不同的，故通过当前性能特征与实际性能特征相比较，可以判断出当前浏览器是否为伪造浏览器。在将性能特征进行对比之前，需要将真实浏览器的实际性能特征建立性能数据库，根据所述待比较浏览器信息遍历性能数据库，从中查找到对应的实际性能特征。

S40：计算所述当前性能特征与实际性能特征的相似度。

具体地，服务器将所述当前性能特征进行维度拆解，获得当前性能向量；将所述实际性能特征进行维度拆解，获得实际性能向量；通过计算所述当前性能向量与所述实际性能向量的欧式距离获得所述当前性能特征与实际性能特征的相似度。

可以理解的是，所述欧式距离是一个距离定义，指在N维空间中两个点之间的真实距离，或者向量的自然长度(即该点到原点的距离)，可以很好地反应两点之间的相似度。通过计算各向量的欧式距离，可以得到向量之间的相似度，从而获得向量对应的特征之间的相似度。

S50：当所述相似度不在预设阈值内时，判定所述当前浏览器为伪造浏览器，并对所述当前浏览器的后续请求进行拦截。

可以理解的是，对伪造浏览器进行识别后，需要对浏览器进行安全策略更新，以减少伪造浏览器给网站带来的损失。参照图3，若服务器根据当前浏览器表现出来的性能特征发现当前性能特征与火狐浏览器的性能特征匹配度很高，而从当前浏览器信息中获得的待比较浏览器信息为Internet Explorer浏览器，当前性能特征与Internet Explorer浏览器的实际性能特征相似度很低，服务器会判定当前浏览器为伪造浏览器，并产生预警，从而对所述当前浏览器的后续请求进行拦截。

进一步地，如图4所示，基于第一实施例提出本发明伪造浏览器的识别方法第二实施例，在本实施例中，步骤S20具体包括包括：

S21：在接收到所述当前浏览器反馈的响应完成指令时，判断所述当前浏览器的页面内容是否完全展示。

需要说明的是，所述页面内容包括页面中的文字、图片、视频等信息，只有当所述页面内容完全展示时，才说明页面加载完成。

S22：在所述页面内容完全展示时，根据所述响应完成指令确定所述当前浏览器的当前响应特征。

在具体实现中，在所述页面内容完全展示时，需要记录向所述当前浏览器发送响应指令的第一时间以及接收到所述响应完成指令的第二时间；根据所述第一时间及所述第二时间确定页面加载时间；将所述页面加载时间作为所述当前浏览器的当前响应特征。

应理解的是，根据服务器发送响应指令与接收响应完成指令之间的时间差，可以确定浏览器加载完页面所用的页面加载时间，以页面加载时间为响应特征，能准确地反映出浏览器的性能。

本实施例通过在接收到所述当前浏览器反馈的响应完成指令时，判断所述当前浏览器的页面内容是否完全展示，在所述页面内容完全展示时，根据所述响应完成指令确定所述当前浏览器的当前响应特征，获得当前浏览器准确的响应时间，即页面加载时间，以此作为维度对浏览器性能进行比较，能更准确地识别出伪造浏览器。

本发明进一步提供一种伪造浏览器的识别系统。

参照图5，图5为本发明伪造浏览器的识别系统一实施例的功能模块图。

本实施例中，所述伪造浏览器的识别系统包括：

指令发送模块10，用于响应于终端设备的当前浏览器发送的访问请求，从所述访问请求中提取待比较浏览器信息，并向所述当前浏览器发送响应指令。

特征确定模块20，用于在接收到所述当前浏览器反馈的响应完成指令时，根据所述响应完成指令确定所述当前浏览器的当前响应特征。

性能获取模块30，用于将所述当前响应特征代入目标深度神经网络模型中，获得所述当前浏览器的当前性能特征，并根据所述待比较浏览器信息查找对应的实际性能特征。

相似度计算模块40，用于计算所述当前性能特征与实际性能特征的相似度。

浏览器判定模块50，用于当所述相似度不在预设阈值内时，判定所述当前浏览器为伪造浏览器，并对所述当前浏览器的后续请求进行拦截。

此外，本发明实施例还提出一种存储介质，所述存储介质上存储有伪造浏览器的识别程序，所述伪造浏览器的识别程序被处理器执行时实现如下操作：

计算所述当前性能特征与实际性能特征的相似度；

进一步地，所述伪造浏览器的识别程序被处理器执行时还实现如下操作：

将所述当前性能特征进行维度拆解，获得当前性能向量；

将所述实际性能特征进行维度拆解，获得实际性能向量；

根据所述第一时间及所述第二时间确定页面加载时间；

将所述页面加载时间作为所述当前浏览器的当前响应特征。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种伪造浏览器的识别方法，其特征在于，所述伪造浏览器的识别方法包括以下步骤：

服务器响应于终端设备的当前浏览器发送的访问请求，从所述访问请求中提取待比较浏览器信息，并向所述当前浏览器发送响应指令；

计算所述当前性能特征与实际性能特征的相似度；

2.如权利要求1所述的伪造浏览器的识别方法，其特征在于，所述计算所述当前性能特征与实际性能特征的相似度，具体包括：

将所述当前性能特征进行维度拆解，获得当前性能向量；

将所述实际性能特征进行维度拆解，获得实际性能向量；

3.如权利要求1所述的伪造浏览器的识别方法，其特征在于，所述在接收到所述当前浏览器反馈的响应完成指令时，根据所述响应完成指令确定所述当前浏览器的当前响应特征，具体包括：

4.如权利要求3所述的伪造浏览器的识别方法，其特征在于，所述在所述页面内容完全展示时，根据所述响应完成指令确定所述当前浏览器的当前响应特征，具体包括：

根据所述第一时间及所述第二时间确定页面加载时间；

将所述页面加载时间作为所述当前浏览器的当前响应特征。

5.如权利要求1所述的伪造浏览器的识别方法，其特征在于，所述将所述当前响应特征代入目标深度神经网络模型中，获得所述当前浏览器的当前性能特征，并根据所述待比较浏览器信息查找对应的实际性能特征之前，所述方法还包括：

6.如权利要求5所述的伪造浏览器的识别方法，其特征在于，所述待比较浏览器信息为所述当前浏览器的版本号。

7.如权利要求5～6中任一项所述的伪造浏览器的识别方法，其特征在于，所述根据所述待比较浏览器信息查找对应的目标深度神经网络模型之前，所述方法还包括：

8.一种伪造浏览器的识别系统，其特征在于，所述伪造浏览器的识别系统包括：

9.一种服务器，其特征在于，所述服务器包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的伪造浏览器的识别程序，所述伪造浏览器的识别程序配置为实现如权利要求1至7中任一项所述的伪造浏览器的识别方法的步骤。

10.一种存储介质，其特征在于，所述存储介质上存储有伪造浏览器的识别程序，所述伪造浏览器的识别程序被处理器执行时实现如权利要求1至7中任一项所述的伪造浏览器的识别方法的步骤。