CN109460783A - 伪造浏览器的识别方法、系统、服务器及存储介质 - Google Patents

伪造浏览器的识别方法、系统、服务器及存储介质 Download PDF

Info

Publication number
CN109460783A
CN109460783A CN201811233084.8A CN201811233084A CN109460783A CN 109460783 A CN109460783 A CN 109460783A CN 201811233084 A CN201811233084 A CN 201811233084A CN 109460783 A CN109460783 A CN 109460783A
Authority
CN
China
Prior art keywords
browser
current
response
instruction
performance feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811233084.8A
Other languages
English (en)
Other versions
CN109460783B (zh
Inventor
张振宇
汪智勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Summit Network Technology Co Ltd
Original Assignee
Wuhan Summit Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Summit Network Technology Co Ltd filed Critical Wuhan Summit Network Technology Co Ltd
Priority to CN201811233084.8A priority Critical patent/CN109460783B/zh
Publication of CN109460783A publication Critical patent/CN109460783A/zh
Application granted granted Critical
Publication of CN109460783B publication Critical patent/CN109460783B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Abstract

本发明公开了一种伪造浏览器的识别方法、系统、服务器及存储介质;本发明通过服务器响应于终端设备的当前浏览器发送的访问请求,从访问请求中提取待比较浏览器信息,并向当前浏览器发送响应指令;在接收到当前浏览器反馈的响应完成指令时,根据响应完成指令确定当前浏览器的当前响应特征;将当前响应特征代入目标深度神经网络模型中,获得当前浏览器的当前性能特征,并根据待比较浏览器信息查找对应的实际性能特征;计算当前性能特征与实际性能特征的相似度;当相似度不在预设阈值内时,判定当前浏览器为伪造浏览器,并对当前浏览器的后续请求进行拦截,实现了从更本质的维度去识别伪造浏览器,提高了识别准确率。

Description

伪造浏览器的识别方法、系统、服务器及存储介质
技术领域
本发明涉及信息安全领域,尤其涉及一种伪造浏览器的识别方法、系统、服务器及存储介质。
背景技术
近年来随着网站资源日益丰富,网站主们为了保护这些网站资源通常会对一些恶意访问实施反爬虫技术,想要获得这些网站信息,就需要伪造浏览器,模拟真实用户的行为。
目前对于伪造浏览器的识别方法是为每个浏览器构建一个浏览器指纹,通过判断浏览器指纹来确定浏览器是否被伪造,然而随着计算机技术的发展,浏览器指纹很容易被篡改,导致这种方法很难准确识别出浏览器是否为伪造。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种伪造浏览器的识别方法、系统、服务器及存储介质,旨在解决现有技术中无法从更本质的维度识别伪造浏览器的技术问题。
为实现上述目的,本发明提供一种伪造浏览器的识别方法,所述方法包括以下步骤:
响应于终端设备的当前浏览器发送的访问请求,从所述访问请求中提取待比较浏览器信息,并向所述当前浏览器发送响应指令;
在接收到所述当前浏览器反馈的响应完成指令时,根据所述响应完成指令确定所述当前浏览器的当前响应特征;
将所述当前响应特征代入目标深度神经网络模型中,获得所述当前浏览器的当前性能特征,并根据所述待比较浏览器信息查找对应的实际性能特征;
计算所述当前性能特征与实际性能特征的相似度;
当所述相似度不在预设阈值内时,判定所述当前浏览器为伪造浏览器,并对所述当前浏览器的后续请求进行拦截。
优选地,所述计算所述当前性能特征与实际性能特征的相似度,具体包括:
将所述当前性能特征进行维度拆解,获得当前性能向量;
将所述实际性能特征进行维度拆解,获得实际性能向量;
通过计算所述当前性能向量与所述实际性能向量的欧式距离获得所述当前性能特征与实际性能特征的相似度。
优选地,所述在接收到所述当前浏览器反馈的响应完成指令时,根据所述响应完成指令确定所述当前浏览器的当前响应特征,具体包括:
在接收到所述当前浏览器反馈的响应完成指令时,判断所述当前浏览器的页面内容是否完全展示;
在所述页面内容完全展示时,根据所述响应完成指令确定所述当前浏览器的当前响应特征。
优选地,所述在所述页面内容完全展示时,根据所述响应完成指令确定所述当前浏览器的当前响应特征,具体包括:
在所述页面内容完全展示时,记录向所述当前浏览器发送响应指令的第一时间以及接收到所述响应完成指令的第二时间;
根据所述第一时间及所述第二时间确定页面加载时间;
将所述页面加载时间作为所述当前浏览器的当前响应特征。
优选地,所述将所述当前响应特征代入目标深度神经网络模型中,获得所述当前浏览器的当前性能特征,并根据所述待比较浏览器信息查找对应的实际性能特征之前,所述方法还包括:
根据所述待比较浏览器信息查找对应的目标深度神经网络模型。
优选地,所述待比较浏览器信息为所述当前浏览器的版本号。
优选地,所述根据所述待比较浏览器信息查找对应的目标深度神经网络模型之前,所述方法还包括:
获得真实浏览器的真实性能特征,并将所述真实性能特征作为正样本数据;
获得伪造浏览器的伪造性能特征,并将所述伪造性能特征作为负样本数据;
以响应特征为维度根据所述正样本数据及负样本数据对初始深度神经网络模型,获得目标深度神经网络模型。
此外,为实现上述目的,本发明还提供一种伪造浏览器的识别系统,所述伪造浏览器的识别系统包括:
指令发送模块,用于响应于终端设备的当前浏览器发送的访问请求,从所述访问请求中提取待比较浏览器信息,并向所述当前浏览器发送响应指令;
特征确定模块,用于在接收到所述当前浏览器反馈的响应完成指令时,根据所述响应完成指令确定所述当前浏览器的当前响应特征;
性能获取模块,用于将所述当前响应特征代入目标深度神经网络模型中,获得所述当前浏览器的当前性能特征,并根据所述待比较浏览器信息查找对应的实际性能特征;
相似度计算模块,用于计算所述当前性能特征与实际性能特征的相似度;
浏览器判定模块,用于当所述相似度不在预设阈值内时,判定所述当前浏览器为伪造浏览器,并对所述当前浏览器的后续请求进行拦截。
此外,为实现上述目的,本发明还提供一种服务器,所述服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的伪造浏览器的识别程序,所述伪造浏览器的识别程序配置为实现所述的伪造浏览器的识别方法的步骤。
此外,为实现上述目的,本发明还提供一种存储介质,其特征在于,所述存储介质上存储有伪造浏览器的识别程序,所述伪造浏览器的识别程序被处理器执行时实现所述的伪造浏览器的识别方法的步骤。
本发明通过服务器响应于终端设备的当前浏览器发送的访问请求,从访问请求中提取待比较浏览器信息,并向当前浏览器发送响应指令;在接收到当前浏览器反馈的响应完成指令时,根据响应完成指令确定当前浏览器的当前响应特征;将当前响应特征代入目标深度神经网络模型中,获得当前浏览器的当前性能特征,并根据待比较浏览器信息查找对应的实际性能特征;计算当前性能特征与实际性能特征的相似度;当相似度不在预设阈值内时,判定当前浏览器为伪造浏览器,并对当前浏览器的后续请求进行拦截,实现了从更本质的维度去识别伪造浏览器,提高了识别准确率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的服务器结构示意图;
图2为本发明伪造浏览器的识别方法第一实施例的流程示意图;
图3为本发明第一实施例中步骤S50的可视化效果图;
图4为本发明伪造浏览器的识别方法第二实施例的流程示意图;
图5为本发明伪造浏览器的识别系统第一实施例的功能模块图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的服务器结构示意图。
如图1所示,该服务器可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及伪造浏览器的识别程序。
在图1所示的服务器中,网络接口1004主要用于与外部网络进行数据通信;用户接口1003主要用于接收用户的输入指令;所述服务器通过处理器1001调用存储器1005中存储的伪造浏览器的识别程序,并执行以下操作:
响应于终端设备的当前浏览器发送的访问请求,从所述访问请求中提取待比较浏览器信息,并向所述当前浏览器发送响应指令;
在接收到所述当前浏览器反馈的响应完成指令时,根据所述响应完成指令确定所述当前浏览器的当前响应特征;
将所述当前响应特征代入目标深度神经网络模型中,获得所述当前浏览器的当前性能特征,并根据所述待比较浏览器信息查找对应的实际性能特征;
计算所述当前性能特征与实际性能特征的相似度;
当所述相似度不在预设阈值内时,判定所述当前浏览器为伪造浏览器,并对所述当前浏览器的后续请求进行拦截。
进一步地,处理器1001可以调用存储器1005中存储的伪造浏览器的识别程序,还执行以下操作:
将所述当前性能特征进行维度拆解,获得当前性能向量;
将所述实际性能特征进行维度拆解,获得实际性能向量;
通过计算所述当前性能向量与所述实际性能向量的欧式距离获得所述当前性能特征与实际性能特征的相似度。
进一步地,处理器1001可以调用存储器1005中存储的伪造浏览器的识别程序,还执行以下操作:
在接收到所述当前浏览器反馈的响应完成指令时,判断所述当前浏览器的页面内容是否完全展示;
在所述页面内容完全展示时,根据所述响应完成指令确定所述当前浏览器的当前响应特征。
进一步地,处理器1001可以调用存储器1005中存储的伪造浏览器的识别程序,还执行以下操作:
在所述页面内容完全展示时,记录向所述当前浏览器发送响应指令的第一时间以及接收到所述响应完成指令的第二时间;
根据所述第一时间及所述第二时间确定页面加载时间;
将所述页面加载时间作为所述当前浏览器的当前响应特征。
进一步地,处理器1001可以调用存储器1005中存储的伪造浏览器的识别程序,还执行以下操作:
根据所述待比较浏览器信息查找对应的目标深度神经网络模型。
进一步地,处理器1001可以调用存储器1005中存储的伪造浏览器的识别程序,还执行以下操作:
获得真实浏览器的真实性能特征,并将所述真实性能特征作为正样本数据;
获得伪造浏览器的伪造性能特征,并将所述伪造性能特征作为负样本数据;
以响应特征为维度根据所述正样本数据及负样本数据对初始深度神经网络模型,获得目标深度神经网络模型。
本实施例通过服务器响应于终端设备的当前浏览器发送的访问请求,从访问请求中提取待比较浏览器信息,并向当前浏览器发送响应指令;在接收到当前浏览器反馈的响应完成指令时,根据响应完成指令确定当前浏览器的当前响应特征;将当前响应特征代入目标深度神经网络模型中,获得当前浏览器的当前性能特征,并根据待比较浏览器信息查找对应的实际性能特征;计算当前性能特征与实际性能特征的相似度;当相似度不在预设阈值内时,判定当前浏览器为伪造浏览器,并对当前浏览器的后续请求进行拦截,实现了从更本质的维度去识别伪造浏览器,提高了识别准确率。
基于上述硬件结构,提出本发明伪造浏览器的识别方法实施例。
参照图2,图2为本发明伪造浏览器的识别方法第一实施例的流程示意图。
在第一实施例中,所述伪造浏览器的识别方法包括以下步骤:
S10:响应于终端设备的当前浏览器发送的访问请求,从所述访问请求中提取待比较浏览器信息,并向所述当前浏览器发送响应指令。
应理解的是,所述终端设备可以是智能手机、平板电脑或笔记本电脑等设备,本实施例对此不加以限制。
所述浏览器是指可以显示网页服务器或者文件系统的超文本标记语言(HyperText Mark-up Language,HTML)文件内容,并让用户与这些文件交互的一种软件,可以是QQ浏览器、Internet Explorer浏览器、百度浏览器、搜狗浏览器、猎豹浏览器、360浏览器、UC浏览器、傲游浏览器、世界之窗浏览器等,本实施例对此不加以限制。
需要说明的是,浏览器信息包括浏览器名称、浏览器版本号、渲染引擎、操作系统等,本实施例中所述待比较浏览器信息优选地为所述当前浏览器的版本号,当然也可以是所述当前浏览器的型号,或其他特征信息,本实施例对此不加以限制。
可以理解的是,不同的浏览器根据型号或版本不同,性能也是不一样的。浏览器向服务器发送访问请求时,访问请求里会有浏览器信息,通过浏览器信息可以判断用户使用的是哪个型号或版本的浏览器,从而再根据浏览器的性能确定是否为伪造。
S20:在接收到所述当前浏览器反馈的响应完成指令时,根据所述响应完成指令确定所述当前浏览器的当前响应特征。
可以理解的是,本实施例中当前响应特征为页面加载时间,当然也可以是浏览器的其他特征,本实施例对此不加以限制。
需要说明的是,服务器向当前浏览器发送响应指令,待当前浏览器响应完指令之后,会接收到当前浏览器反馈的响应完成指令。根据这两种指令可以计算出当前响应特征。
S30:将所述当前响应特征代入目标深度神经网络模型中,获得所述当前浏览器的当前性能特征,并根据所述待比较浏览器信息查找对应的实际性能特征。
需要说明的是,所述目标深度神经网络模型为所述待比较浏览器信息对应的模型,也就是说,在建立深度神经网络模型时,会根据浏览器的信息建立不同的模型。比如,当浏览器为火狐浏览器时,根据火狐浏览器的样本数据建立一个深度神经网络模型,当浏览器为360浏览器时,根据360浏览器的样本数据建立另一个深度神经网络模型。
在具体实现中,因为需要提前为不同的浏览器建立不同的深度神经网络模型。因此在选用目标深度神经网络模型前,需要根据所述待比较浏览器信息查找对应的目标深度神经网络模型。
具体地,获得真实浏览器的真实性能特征,并将所述真实性能特征作为正样本数据;获得伪造浏览器的伪造性能特征,并将所述伪造性能特征作为负样本数据;以响应特征为维度根据所述正样本数据及负样本数据对初始深度神经网络模型,获得目标深度神经网络模型。
可以理解的是,在使用目标深度神经网络模型之前,需要先获得目标深度神经网络模型。而建立目标深度神经网络模型需要大量的样本数据。本实施例中,所述真实浏览器是指所述待比较浏览器信息对应的浏览器。另外,可以通过模拟攻击者伪造浏览器的过程建立伪造浏览器,在伪造浏览器运行过程中获得其伪造性能特征。
应理解的是,所述实际性能特征,指真实浏览器在运行时表现出来的性能指标。伪造的浏览器与真实的浏览器相比性能指标是不同的,故通过当前性能特征与实际性能特征相比较,可以判断出当前浏览器是否为伪造浏览器。在将性能特征进行对比之前,需要将真实浏览器的实际性能特征建立性能数据库,根据所述待比较浏览器信息遍历性能数据库,从中查找到对应的实际性能特征。
S40:计算所述当前性能特征与实际性能特征的相似度。
具体地,服务器将所述当前性能特征进行维度拆解,获得当前性能向量;将所述实际性能特征进行维度拆解,获得实际性能向量;通过计算所述当前性能向量与所述实际性能向量的欧式距离获得所述当前性能特征与实际性能特征的相似度。
可以理解的是,所述欧式距离是一个距离定义,指在N维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离),可以很好地反应两点之间的相似度。通过计算各向量的欧式距离,可以得到向量之间的相似度,从而获得向量对应的特征之间的相似度。
S50:当所述相似度不在预设阈值内时,判定所述当前浏览器为伪造浏览器,并对所述当前浏览器的后续请求进行拦截。
可以理解的是,对伪造浏览器进行识别后,需要对浏览器进行安全策略更新,以减少伪造浏览器给网站带来的损失。参照图3,若服务器根据当前浏览器表现出来的性能特征发现当前性能特征与火狐浏览器的性能特征匹配度很高,而从当前浏览器信息中获得的待比较浏览器信息为Internet Explorer浏览器,当前性能特征与Internet Explorer浏览器的实际性能特征相似度很低,服务器会判定当前浏览器为伪造浏览器,并产生预警,从而对所述当前浏览器的后续请求进行拦截。
本实施例通过服务器响应于终端设备的当前浏览器发送的访问请求,从访问请求中提取待比较浏览器信息,并向当前浏览器发送响应指令;在接收到当前浏览器反馈的响应完成指令时,根据响应完成指令确定当前浏览器的当前响应特征;将当前响应特征代入目标深度神经网络模型中,获得当前浏览器的当前性能特征,并根据待比较浏览器信息查找对应的实际性能特征;计算当前性能特征与实际性能特征的相似度;当相似度不在预设阈值内时,判定当前浏览器为伪造浏览器,并对当前浏览器的后续请求进行拦截,实现了从更本质的维度去识别伪造浏览器,提高了识别准确率。
进一步地,如图4所示,基于第一实施例提出本发明伪造浏览器的识别方法第二实施例,在本实施例中,步骤S20具体包括包括:
S21:在接收到所述当前浏览器反馈的响应完成指令时,判断所述当前浏览器的页面内容是否完全展示。
需要说明的是,所述页面内容包括页面中的文字、图片、视频等信息,只有当所述页面内容完全展示时,才说明页面加载完成。
S22:在所述页面内容完全展示时,根据所述响应完成指令确定所述当前浏览器的当前响应特征。
在具体实现中,在所述页面内容完全展示时,需要记录向所述当前浏览器发送响应指令的第一时间以及接收到所述响应完成指令的第二时间;根据所述第一时间及所述第二时间确定页面加载时间;将所述页面加载时间作为所述当前浏览器的当前响应特征。
应理解的是,根据服务器发送响应指令与接收响应完成指令之间的时间差,可以确定浏览器加载完页面所用的页面加载时间,以页面加载时间为响应特征,能准确地反映出浏览器的性能。
本实施例通过在接收到所述当前浏览器反馈的响应完成指令时,判断所述当前浏览器的页面内容是否完全展示,在所述页面内容完全展示时,根据所述响应完成指令确定所述当前浏览器的当前响应特征,获得当前浏览器准确的响应时间,即页面加载时间,以此作为维度对浏览器性能进行比较,能更准确地识别出伪造浏览器。
本发明进一步提供一种伪造浏览器的识别系统。
参照图5,图5为本发明伪造浏览器的识别系统一实施例的功能模块图。
本实施例中,所述伪造浏览器的识别系统包括:
指令发送模块10,用于响应于终端设备的当前浏览器发送的访问请求,从所述访问请求中提取待比较浏览器信息,并向所述当前浏览器发送响应指令。
应理解的是,所述终端设备可以是智能手机、平板电脑或笔记本电脑等设备,本实施例对此不加以限制。
所述浏览器是指可以显示网页服务器或者文件系统的超文本标记语言(HyperText Mark-up Language,HTML)文件内容,并让用户与这些文件交互的一种软件,可以是QQ浏览器、Internet Explorer浏览器、百度浏览器、搜狗浏览器、猎豹浏览器、360浏览器、UC浏览器、傲游浏览器、世界之窗浏览器等,本实施例对此不加以限制。
需要说明的是,浏览器信息包括浏览器名称、浏览器版本号、渲染引擎、操作系统等,本实施例中所述待比较浏览器信息优选地为所述当前浏览器的版本号,当然也可以是所述当前浏览器的型号,或其他特征信息,本实施例对此不加以限制。
可以理解的是,不同的浏览器根据型号或版本不同,性能也是不一样的。浏览器向服务器发送访问请求时,访问请求里会有浏览器信息,通过浏览器信息可以判断用户使用的是哪个型号或版本的浏览器,从而再根据浏览器的性能确定是否为伪造。
特征确定模块20,用于在接收到所述当前浏览器反馈的响应完成指令时,根据所述响应完成指令确定所述当前浏览器的当前响应特征。
可以理解的是,本实施例中当前响应特征为页面加载时间,当然也可以是浏览器的其他特征,本实施例对此不加以限制。
需要说明的是,服务器向当前浏览器发送响应指令,待当前浏览器响应完指令之后,会接收到当前浏览器反馈的响应完成指令。根据这两种指令可以计算出当前响应特征。
性能获取模块30,用于将所述当前响应特征代入目标深度神经网络模型中,获得所述当前浏览器的当前性能特征,并根据所述待比较浏览器信息查找对应的实际性能特征。
需要说明的是,所述目标深度神经网络模型为所述待比较浏览器信息对应的模型,也就是说,在建立深度神经网络模型时,会根据浏览器的信息建立不同的模型。比如,当浏览器为火狐浏览器时,根据火狐浏览器的样本数据建立一个深度神经网络模型,当浏览器为360浏览器时,根据360浏览器的样本数据建立另一个深度神经网络模型。
在具体实现中,因为需要提前为不同的浏览器建立不同的深度神经网络模型。因此在选用目标深度神经网络模型前,需要根据所述待比较浏览器信息查找对应的目标深度神经网络模型。
具体地,获得真实浏览器的真实性能特征,并将所述真实性能特征作为正样本数据;获得伪造浏览器的伪造性能特征,并将所述伪造性能特征作为负样本数据;以响应特征为维度根据所述正样本数据及负样本数据对初始深度神经网络模型,获得目标深度神经网络模型。
可以理解的是,在使用目标深度神经网络模型之前,需要先获得目标深度神经网络模型。而建立目标深度神经网络模型需要大量的样本数据。本实施例中,所述真实浏览器是指所述待比较浏览器信息对应的浏览器。另外,可以通过模拟攻击者伪造浏览器的过程建立伪造浏览器,在伪造浏览器运行过程中获得其伪造性能特征。
应理解的是,所述实际性能特征,指真实浏览器在运行时表现出来的性能指标。伪造的浏览器与真实的浏览器相比性能指标是不同的,故通过当前性能特征与实际性能特征相比较,可以判断出当前浏览器是否为伪造浏览器。在将性能特征进行对比之前,需要将真实浏览器的实际性能特征建立性能数据库,根据所述待比较浏览器信息遍历性能数据库,从中查找到对应的实际性能特征。
相似度计算模块40,用于计算所述当前性能特征与实际性能特征的相似度。
具体地,服务器将所述当前性能特征进行维度拆解,获得当前性能向量;将所述实际性能特征进行维度拆解,获得实际性能向量;通过计算所述当前性能向量与所述实际性能向量的欧式距离获得所述当前性能特征与实际性能特征的相似度。
可以理解的是,所述欧式距离是一个距离定义,指在N维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离),可以很好地反应两点之间的相似度。通过计算各向量的欧式距离,可以得到向量之间的相似度,从而获得向量对应的特征之间的相似度。
浏览器判定模块50,用于当所述相似度不在预设阈值内时,判定所述当前浏览器为伪造浏览器,并对所述当前浏览器的后续请求进行拦截。
可以理解的是,对伪造浏览器进行识别后,需要对浏览器进行安全策略更新,以减少伪造浏览器给网站带来的损失。参照图3,若服务器根据当前浏览器表现出来的性能特征发现当前性能特征与火狐浏览器的性能特征匹配度很高,而从当前浏览器信息中获得的待比较浏览器信息为Internet Explorer浏览器,当前性能特征与Internet Explorer浏览器的实际性能特征相似度很低,服务器会判定当前浏览器为伪造浏览器,并产生预警,从而对所述当前浏览器的后续请求进行拦截。
本实施例通过服务器响应于终端设备的当前浏览器发送的访问请求,从访问请求中提取待比较浏览器信息,并向当前浏览器发送响应指令;在接收到当前浏览器反馈的响应完成指令时,根据响应完成指令确定当前浏览器的当前响应特征;将当前响应特征代入目标深度神经网络模型中,获得当前浏览器的当前性能特征,并根据待比较浏览器信息查找对应的实际性能特征;计算当前性能特征与实际性能特征的相似度;当相似度不在预设阈值内时,判定当前浏览器为伪造浏览器,并对当前浏览器的后续请求进行拦截,实现了从更本质的维度去识别伪造浏览器,提高了识别准确率。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有伪造浏览器的识别程序,所述伪造浏览器的识别程序被处理器执行时实现如下操作:
响应于终端设备的当前浏览器发送的访问请求,从所述访问请求中提取待比较浏览器信息,并向所述当前浏览器发送响应指令;
在接收到所述当前浏览器反馈的响应完成指令时,根据所述响应完成指令确定所述当前浏览器的当前响应特征;
将所述当前响应特征代入目标深度神经网络模型中,获得所述当前浏览器的当前性能特征,并根据所述待比较浏览器信息查找对应的实际性能特征;
计算所述当前性能特征与实际性能特征的相似度;
当所述相似度不在预设阈值内时,判定所述当前浏览器为伪造浏览器,并对所述当前浏览器的后续请求进行拦截。
进一步地,所述伪造浏览器的识别程序被处理器执行时还实现如下操作:
将所述当前性能特征进行维度拆解,获得当前性能向量;
将所述实际性能特征进行维度拆解,获得实际性能向量;
通过计算所述当前性能向量与所述实际性能向量的欧式距离获得所述当前性能特征与实际性能特征的相似度。
进一步地,所述伪造浏览器的识别程序被处理器执行时还实现如下操作:
在接收到所述当前浏览器反馈的响应完成指令时,判断所述当前浏览器的页面内容是否完全展示;
在所述页面内容完全展示时,根据所述响应完成指令确定所述当前浏览器的当前响应特征。
进一步地,所述伪造浏览器的识别程序被处理器执行时还实现如下操作:
在所述页面内容完全展示时,记录向所述当前浏览器发送响应指令的第一时间以及接收到所述响应完成指令的第二时间;
根据所述第一时间及所述第二时间确定页面加载时间;
将所述页面加载时间作为所述当前浏览器的当前响应特征。
进一步地,所述伪造浏览器的识别程序被处理器执行时还实现如下操作:
根据所述待比较浏览器信息查找对应的目标深度神经网络模型。
进一步地,所述伪造浏览器的识别程序被处理器执行时还实现如下操作:
获得真实浏览器的真实性能特征,并将所述真实性能特征作为正样本数据;
获得伪造浏览器的伪造性能特征,并将所述伪造性能特征作为负样本数据;
以响应特征为维度根据所述正样本数据及负样本数据对初始深度神经网络模型,获得目标深度神经网络模型。
本实施例通过服务器响应于终端设备的当前浏览器发送的访问请求,从访问请求中提取待比较浏览器信息,并向当前浏览器发送响应指令;在接收到当前浏览器反馈的响应完成指令时,根据响应完成指令确定当前浏览器的当前响应特征;将当前响应特征代入目标深度神经网络模型中,获得当前浏览器的当前性能特征,并根据待比较浏览器信息查找对应的实际性能特征;计算当前性能特征与实际性能特征的相似度;当相似度不在预设阈值内时,判定当前浏览器为伪造浏览器,并对当前浏览器的后续请求进行拦截,实现了从更本质的维度去识别伪造浏览器,提高了识别准确率。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种伪造浏览器的识别方法,其特征在于,所述伪造浏览器的识别方法包括以下步骤:
服务器响应于终端设备的当前浏览器发送的访问请求,从所述访问请求中提取待比较浏览器信息,并向所述当前浏览器发送响应指令;
在接收到所述当前浏览器反馈的响应完成指令时,根据所述响应完成指令确定所述当前浏览器的当前响应特征;
将所述当前响应特征代入目标深度神经网络模型中,获得所述当前浏览器的当前性能特征,并根据所述待比较浏览器信息查找对应的实际性能特征;
计算所述当前性能特征与实际性能特征的相似度;
当所述相似度不在预设阈值内时,判定所述当前浏览器为伪造浏览器,并对所述当前浏览器的后续请求进行拦截。
2.如权利要求1所述的伪造浏览器的识别方法,其特征在于,所述计算所述当前性能特征与实际性能特征的相似度,具体包括:
将所述当前性能特征进行维度拆解,获得当前性能向量;
将所述实际性能特征进行维度拆解,获得实际性能向量;
通过计算所述当前性能向量与所述实际性能向量的欧式距离获得所述当前性能特征与实际性能特征的相似度。
3.如权利要求1所述的伪造浏览器的识别方法,其特征在于,所述在接收到所述当前浏览器反馈的响应完成指令时,根据所述响应完成指令确定所述当前浏览器的当前响应特征,具体包括:
在接收到所述当前浏览器反馈的响应完成指令时,判断所述当前浏览器的页面内容是否完全展示;
在所述页面内容完全展示时,根据所述响应完成指令确定所述当前浏览器的当前响应特征。
4.如权利要求3所述的伪造浏览器的识别方法,其特征在于,所述在所述页面内容完全展示时,根据所述响应完成指令确定所述当前浏览器的当前响应特征,具体包括:
在所述页面内容完全展示时,记录向所述当前浏览器发送响应指令的第一时间以及接收到所述响应完成指令的第二时间;
根据所述第一时间及所述第二时间确定页面加载时间;
将所述页面加载时间作为所述当前浏览器的当前响应特征。
5.如权利要求1所述的伪造浏览器的识别方法,其特征在于,所述将所述当前响应特征代入目标深度神经网络模型中,获得所述当前浏览器的当前性能特征,并根据所述待比较浏览器信息查找对应的实际性能特征之前,所述方法还包括:
根据所述待比较浏览器信息查找对应的目标深度神经网络模型。
6.如权利要求5所述的伪造浏览器的识别方法,其特征在于,所述待比较浏览器信息为所述当前浏览器的版本号。
7.如权利要求5~6中任一项所述的伪造浏览器的识别方法,其特征在于,所述根据所述待比较浏览器信息查找对应的目标深度神经网络模型之前,所述方法还包括:
获得真实浏览器的真实性能特征,并将所述真实性能特征作为正样本数据;
获得伪造浏览器的伪造性能特征,并将所述伪造性能特征作为负样本数据;
以响应特征为维度根据所述正样本数据及负样本数据对初始深度神经网络模型,获得目标深度神经网络模型。
8.一种伪造浏览器的识别系统,其特征在于,所述伪造浏览器的识别系统包括:
指令发送模块,用于响应于终端设备的当前浏览器发送的访问请求,从所述访问请求中提取待比较浏览器信息,并向所述当前浏览器发送响应指令;
特征确定模块,用于在接收到所述当前浏览器反馈的响应完成指令时,根据所述响应完成指令确定所述当前浏览器的当前响应特征;
性能获取模块,用于将所述当前响应特征代入目标深度神经网络模型中,获得所述当前浏览器的当前性能特征,并根据所述待比较浏览器信息查找对应的实际性能特征;
相似度计算模块,用于计算所述当前性能特征与实际性能特征的相似度;
浏览器判定模块,用于当所述相似度不在预设阈值内时,判定所述当前浏览器为伪造浏览器,并对所述当前浏览器的后续请求进行拦截。
9.一种服务器,其特征在于,所述服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的伪造浏览器的识别程序,所述伪造浏览器的识别程序配置为实现如权利要求1至7中任一项所述的伪造浏览器的识别方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有伪造浏览器的识别程序,所述伪造浏览器的识别程序被处理器执行时实现如权利要求1至7中任一项所述的伪造浏览器的识别方法的步骤。
CN201811233084.8A 2018-10-22 2018-10-22 伪造浏览器的识别方法、系统、服务器及存储介质 Active CN109460783B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811233084.8A CN109460783B (zh) 2018-10-22 2018-10-22 伪造浏览器的识别方法、系统、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811233084.8A CN109460783B (zh) 2018-10-22 2018-10-22 伪造浏览器的识别方法、系统、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN109460783A true CN109460783A (zh) 2019-03-12
CN109460783B CN109460783B (zh) 2021-02-12

Family

ID=65608117

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811233084.8A Active CN109460783B (zh) 2018-10-22 2018-10-22 伪造浏览器的识别方法、系统、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN109460783B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103685308A (zh) * 2013-12-25 2014-03-26 北京奇虎科技有限公司 一种钓鱼网页的检测方法及系统、客户端、服务器
CN104090919A (zh) * 2014-06-16 2014-10-08 华为技术有限公司 推荐广告的方法及广告推荐服务器
CN104166725A (zh) * 2014-08-26 2014-11-26 哈尔滨工业大学(威海) 一种钓鱼网站检测方法
US8943588B1 (en) * 2012-09-20 2015-01-27 Amazon Technologies, Inc. Detecting unauthorized websites
CN106681926A (zh) * 2017-01-05 2017-05-17 网易(杭州)网络有限公司 网页性能的测试方法及装置
CN108234441A (zh) * 2017-10-19 2018-06-29 珠海市魅族科技有限公司 确定伪造访问请求的方法、装置、电子设备和存储介质
CN108566399A (zh) * 2018-04-23 2018-09-21 中国互联网络信息中心 钓鱼网站识别方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8943588B1 (en) * 2012-09-20 2015-01-27 Amazon Technologies, Inc. Detecting unauthorized websites
CN103685308A (zh) * 2013-12-25 2014-03-26 北京奇虎科技有限公司 一种钓鱼网页的检测方法及系统、客户端、服务器
CN104090919A (zh) * 2014-06-16 2014-10-08 华为技术有限公司 推荐广告的方法及广告推荐服务器
CN104166725A (zh) * 2014-08-26 2014-11-26 哈尔滨工业大学(威海) 一种钓鱼网站检测方法
CN106681926A (zh) * 2017-01-05 2017-05-17 网易(杭州)网络有限公司 网页性能的测试方法及装置
CN108234441A (zh) * 2017-10-19 2018-06-29 珠海市魅族科技有限公司 确定伪造访问请求的方法、装置、电子设备和存储介质
CN108566399A (zh) * 2018-04-23 2018-09-21 中国互联网络信息中心 钓鱼网站识别方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
AMIT LEVY 等: "Stickler: Defending Against Malicious CDNs in an Unmodified Browser", 《COMPUTER SCIENCE》 *
郭敏哲: "基于浏览器的网络钓鱼检测机制的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
陈康 等: "基于深度学习的恶意URL识别", 《计算机系统应用》 *

Also Published As

Publication number Publication date
CN109460783B (zh) 2021-02-12

Similar Documents

Publication Publication Date Title
TWI729472B (zh) 特徵詞的確定方法、裝置和伺服器
CN109408821B (zh) 一种语料生成方法、装置、计算设备及存储介质
CN110019349A (zh) 语句预警方法、装置、设备及计算机可读存储介质
CN111310613B (zh) 一种图像检测方法、装置以及计算机可读存储介质
CN110674144A (zh) 用户画像生成方法、装置、计算机设备和存储介质
CN111523677A (zh) 实现对机器学习模型的预测结果进行解释的方法及装置
CN112148952A (zh) 一种任务执行方法、装置、设备及计算机可读存储介质
CN116304341A (zh) 基于用户网络大数据的欺诈判别方法及系统
WO2021208774A1 (zh) 辅助机器学习模型上线的方法及装置
CN106484913A (zh) 一种目标图片确定的方法以及服务器
CN109284590A (zh) 访问行为安全防护的方法、设备、存储介质及装置
CN113537207A (zh) 视频处理方法、模型的训练方法、装置以及电子设备
CN109460783A (zh) 伪造浏览器的识别方法、系统、服务器及存储介质
CN115905016A (zh) 一种BIOS Setup搜索功能测试方法、装置、电子设备及存储介质
CN115186240A (zh) 基于关联性信息的社交网络用户对齐方法、装置、介质
JP2024507029A (ja) ウェブページ識別方法、装置、電子機器、媒体およびコンピュータプログラム
CN110955369B (zh) 基于点击位置的焦点判断方法、装置、设备及存储介质
CN113409014A (zh) 基于人工智能的大数据业务处理方法及人工智能服务器
CN111859985A (zh) Ai客服模型测试方法、装置、电子设备及存储介质
Filipovikj et al. Specifying industrial system requirements using specification patterns: A case study of evaluation with practitioners
CN110019547A (zh) 获取客户间的关联关系的方法、装置、设备及介质
CN116248375B (zh) 一种网页登录实体识别方法、装置、设备和存储介质
CN116992294B (zh) 卫星测控训练评估方法、装置、设备及存储介质
KR102648613B1 (ko) 입력 이미지를 기반으로 인터넷 쇼핑몰에 전시되는 상품 이미지를 생성하는 방법, 장치 및 컴퓨터-판독 가능 기록 매체
CN113535594B (zh) 业务场景测试用例的生成方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant