CN114900356A - 恶意用户行为检测方法、装置及电子设备 - Google Patents

恶意用户行为检测方法、装置及电子设备 Download PDF

Info

Publication number
CN114900356A
CN114900356A CN202210489991.9A CN202210489991A CN114900356A CN 114900356 A CN114900356 A CN 114900356A CN 202210489991 A CN202210489991 A CN 202210489991A CN 114900356 A CN114900356 A CN 114900356A
Authority
CN
China
Prior art keywords
behavior
information
user
preset
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210489991.9A
Other languages
English (en)
Inventor
齐元利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lianyun Shandong Big Data Co Ltd
Original Assignee
Lianyun Shandong Big Data Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lianyun Shandong Big Data Co Ltd filed Critical Lianyun Shandong Big Data Co Ltd
Priority to CN202210489991.9A priority Critical patent/CN114900356A/zh
Publication of CN114900356A publication Critical patent/CN114900356A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network

Abstract

本公开提供一种恶意用户行为检测方法、装置及电子设备,所述方法包括基于在多个业务场景中预设的流量镜像工具,获取用户访问业务场景的访问流量信息;提取所述访问流量信息中的行为特征信息;根据所述行为特征信息,基于预设的第三方数据库和/或预设的行为检测模型,确定用户访问业务场景的行为是否异常。本公开的方法能够有效避免用户信息泄露、对用户行为进行长线监控、借助第三方数据库提升异常行为检测准确率和检测效率。

Description

恶意用户行为检测方法、装置及电子设备
技术领域
本公开涉及安全检测技术领域,尤其涉及一种恶意用户行为检测方法、装置及电子设备。
背景技术
随着互联网在各行各业的广泛应用,企业面向的互联网用户数量在不断增长,用户类型也日益多样,尤其是电商、金融等拥有海量用户的大规模应用互联网的企业,日活跃用户数量可达上千万,其中,以灰产、黑产为代表的恶意访问的占比居高不下。但目前以发现潜在问题或检测出恶意用户、恶意行为的用户行为异常检测方法比较片面。
传统的恶意用户行为检测方法通常是基于对象行为特征进行检测,例如,通过检测http请求的user-agent、每分钟登录请求是否超过预设阈值等手段,判断是否存在自动化脚本模拟真人行为。
现有的基于对象行为特征进行恶意用户行为检测的方法存在如下缺陷:
1、恶意用户可以绕过常规公开的特征检测规则,从而进行恶意访问;
2、恶意用户或者自动化脚本可以模拟真人行为进行随机访问,现有的恶意用户行为检测方法无法识别访问行为是否是机器行为;
3、基于对象行为特征只关注短暂时间段内用户的行为特征,缺少对用户历史行为的综合判断,难以建立长期行为检测机制;
4、基于对象行为特征的检测规则独立于其他系统,没有第三方数据能够参考,检测效率和准确率低下。
公开于本申请背景技术部分的信息仅仅旨在加深对本申请的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
发明内容
本公开实施例提供一种恶意用户行为检测方法、装置及电子设备,能够解决现有技术的上述问题。
本公开实施例的第一方面,提供一种恶意用户行为检测方法,包括:
基于在多个业务场景中预设的流量镜像工具,获取用户访问业务场景的访问流量信息;
提取所述访问流量信息中的行为特征信息;
根据所述行为特征信息,基于预设的第三方数据库和/或预设的行为检测模型,确定用户访问业务场景的行为是否异常。
在一种可选的实施方式中,
所述业务场景包括用户注册场景、用户登录场景和免注册登录场景中任意一种;
所述获取用户访问业务场景的访问流量信息之前,所述方法还包括:
确定用户访问的当前业务场景;
若当前业务场景为用户注册场景,则为所述用户适配注册所需的第一验证策略,并输出第一提示信息;
若当前业务场景为用户登录场景,则为所述用户适配登录所需的第二验证策略,并输出第二提示信息;
若当前业务场景为免注册登录场景,则为所述用户适配免注册登录所需的第三验证策略,并输出第三提示信息。
在一种可选的实施方式中,
所述流量镜像工具包括获取工具和镜像工具,所述流量工具预先安装于业务系统的前端负载侧,
所述基于在多个业务场景中预设的流量镜像工具,获取用户访问业务场景的访问流量信息的方法包括:
所述获取工具获取业务系统的第一接口中所有的原始访问流量信息;
所述镜像工具将所述原始访问流量信息通过分析系统的第二接口复制到所述分析系统中,用以获取并分析访问流量信息。
在一种可选的实施方式中,
所述行为特征信息包括用户身份信息以及行为信息,每个用户身份信息对应多个行为信息;
所述提取所述访问流量信息中的行为特征信息的方法包括:
提取所述行为特征信息中的用户身份信息,并提取所述用户身份信息对应的多个行为信息,其中,
所述行为信息包括当前行为信息与多个历史行为信息,所述历史行为信息与所述当前行为信息相距预设时间长度。
在一种可选的实施方式中,
所述根据所述行为特征信息,基于预设的第三方数据库,确定用户访问业务场景的行为是否异常的方法包括:
根据所述行为特征信息中的行为信息,基于所述第三方数据库,匹配所述第三方数据库中与所述行为信息相同类别的预设行为信息,
若相匹配,则确定用户访问业务场景的行为异常。
在一种可选的实施方式中,
所述根据所述行为特征信息,基于预设的行为检测模型,确定用户访问业务场景的行为是否异常的方法包括:
提取所述行为特征信息中用户身份信息对应的多个行为信息,将其输入所述行为检测模型,获取每个行为信息对应的行为检测值;
获取所述行为检测值与所述行为检测模型中预设的行为标准值的差值范围;
若所述差值范围超出预设行为基准范围,则确定用户访问业务场景的行为异常。
在一种可选的实施方式中,
在基于预设的行为检测模型,确定用户访问业务场景的行为是否异常之前,所述方法还包括:
基于预先构建的分布式计算框架训练所述行为检测模型,直至所述行为检测模型的检测结果满足预设阈值条件。
在一种可选的实施方式中,
在确定用户访问业务场景的行为异常之后,所述方法还包括:
对行为异常的用户进行二次认证,和/或
重置行为异常的用户的登录令牌,和/或
启动针对行为异常的用户的人脸识别,和/或
对行为异常的用户进行阻断响应。
本公开实施例的第二方面,提供一种恶意用户行为检测装置,包括:
第一单元,用于基于在多个业务场景中预设的流量镜像工具,获取用户访问业务场景的访问流量信息;
第二单元,用于提取所述访问流量信息中的行为特征信息;
第三单元,用于根据所述行为特征信息,基于预设的第三方数据库和/或预设的行为检测模型,确定用户访问业务场景的行为是否异常。
在一种可选的实施方式中,
所述业务场景包括用户注册场景、用户登录场景和免注册登录场景中任意一种;
所述装置还包括第四单元,所述第四单元用于:
确定用户访问的当前业务场景;
若当前业务场景为用户注册场景,则为所述用户适配注册所需的第一验证策略,并输出第一提示信息;
若当前业务场景为用户登录场景,则为所述用户适配登录所需的第二验证策略,并输出第二提示信息;
若当前业务场景为免注册登录场景,则为所述用户适配免注册登录所需的第三验证策略,并输出第三提示信息。
在一种可选的实施方式中,
所述流量镜像工具包括获取工具和镜像工具,所述流量工具预先安装于业务系统的前端负载侧,
所述第一单元还用于:
所述获取工具获取业务系统的第一接口中所有的原始访问流量信息;
所述镜像工具将所述原始访问流量信息通过分析系统的第二接口复制到所述分析系统中,用以获取并分析访问流量信息。
在一种可选的实施方式中,
所述行为特征信息包括用户身份信息以及行为信息,每个用户身份信息对应多个行为信息;
所述第二单元还用于:
提取所述行为特征信息中的用户身份信息,并提取所述用户身份信息对应的多个行为信息,其中,
所述行为信息包括当前行为信息与多个历史行为信息,所述历史行为信息与所述当前行为信息相距预设时间长度。
在一种可选的实施方式中,
所述第三单元还用于:
根据所述行为特征信息中的行为信息,基于所述第三方数据库,匹配所述第三方数据库中与所述行为信息相同类别的预设行为信息,
若相匹配,则确定用户访问业务场景的行为异常。
在一种可选的实施方式中,
所述第三单元还用于:
提取所述行为特征信息中用户身份信息对应的多个行为信息,将其输入所述行为检测模型,获取每个行为信息对应的行为检测值;
获取所述行为检测值与所述行为检测模型中预设的行为标准值的差值范围;
若所述差值范围超出预设行为基准范围,则确定用户访问业务场景的行为异常。
在一种可选的实施方式中,
所述装置还包括第五单元,所述第五单元用于:
基于预先构建的分布式计算框架训练所述行为检测模型,直至所述行为检测模型的检测结果满足预设阈值条件。
在一种可选的实施方式中,
所述装置还包括第六单元,所述第六单元用于:
对行为异常的用户进行二次认证,和/或
重置行为异常的用户的登录令牌,和/或
启动针对行为异常的用户的人脸识别,和/或
对行为异常的用户进行阻断响应。
本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述中任意一项所述的方法。
本公开提供一种恶意用户行为检测方法,包括:
基于在多个业务场景中预设的流量镜像工具,获取用户访问业务场景的访问流量信息;
通过流量镜像工具,不仅能够获取用户当前访问业务场景的访问流量信息,还能够获取同一用户身份的历史访问流量信息,引入用户的历史行为,并对用户建立长期行为监控;
提取所述访问流量信息中的行为特征信息;
本公开的行为特征信息包括用户身份信息以及行为信息,每个用户身份信息对应多个行为信息,根据行为特征信息检测用户访问业务场景的行为是否异常;
根据所述行为特征信息,基于预设的第三方数据库和/或预设的行为检测模型,确定用户访问业务场景的行为是否异常;
通过第三方数据库,将行为特征信息中的行为信息与第三方数据库中与行为信息相同类别的预设行为信息进行匹配,借助外部信息,提升检测准确性和检测效率;
通过行为检测模型,能够识别行为特征信息是否为机器行为,可以加强传统的基于规则的异常行为检测机制,在降低异常检测误报率的同时,提升异常判定的准确性。
附图说明
图1为本公开实施例的一种恶意用户行为检测方法的流程示意图;
图2为本公开实施例的一种恶意用户行为检测方法的逻辑示意图;
图3为本公开实施例的一种恶意用户行为检测装置的结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,在本公开的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本公开实施例的实施过程构成任何限定。
应当理解,在本公开中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本公开中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含A、B和C”、“包含A、B、C”是指A、B、C三者都包含,“包含A、B或C”是指包含A、B、C三者之一,“包含A、B和/或C”是指包含A、B、C三者中任1个或任2个或3个。
应当理解,在本公开中,“与A对应的B”、“与A相对应的B”、“A与B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。A与B的匹配,是A与B的相似度大于或等于预设的阈值。
取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。
下面以具体地实施例对本公开的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本公开实施例的一种恶意用户行为检测方法的流程示意图,图2为本公开实施例的一种恶意用户行为检测方法的逻辑示意图,如图1和图2所示,所述方法包括:
S101、基于在多个业务场景中预设的流量镜像工具,获取用户访问业务场景的访问流量信息;
随着互联网在各行各业的广泛应用,企业面向的互联网用户数量在不断增长,用户类型也日益多样,尤其是电商、金融等拥有海量用户的大规模应用互联网的企业,日活跃用户数量可达上千万,其中,以灰产、黑产为代表的恶意访问的占比居高不下。但目前以发现潜在问题或检测出恶意用户、恶意行为的用户行为异常检测方法比较片面,无法基于部分数据信息获取更加综合的用户行为评价。
本公开实施例可以在多个业务场景中预设流量镜像工具,根据流量镜像工具获取用户访问业务场景的访问流量信息。
示例性地,本公开实施例的访问流量信息可以包括用户信息、设备账号ID、IP地址、URL(Uniform Resource Locator,统一资源定位器)以及地理位置等能够表征用户访问业务系统的信息。
可选地,流量镜像工具可以包括获取工具和镜像工具,所述流量工具预先安装于业务系统的前端负载侧,其中,获取工具用于获取访问流量信息,镜像工具用于将获取工具所获取的访问流量信息复制到分析系统中。
在一种可选的实施方式中,
所述流量镜像工具包括获取工具和镜像工具,所述流量工具预先安装于业务系统的前端负载侧,
所述基于在多个业务场景中预设的流量镜像工具,获取用户访问业务场景的访问流量信息的方法包括:
所述获取工具获取业务系统的第一接口中所有的原始访问流量信息;
所述镜像工具将所述原始访问流量信息通过分析系统的第二接口复制到所述分析系统中,用以获取并分析访问流量信息。
示例性地,本公开实施例的流量工具可以预先安装在业务系统的前端负载侧,后台接口并发量大,一般后台接口会有多个,需要前端去判定到底去请求哪个负载均衡器,但是实际过程,往往没有这样的条件,通过将流量工具预先安装在业务系统的前端负载侧,便于业务监测和故障定位,网络管理员时常要获取设备上的业务报文进行分析。
以业务场景为登录场景和注册场景为例,可以将所有的登录场景和注册场景中访问流量信息和关键业务流量进行旁路采集。
本公开的获取工具可以通过第一接口获取业务系统的所有原始访问流量信息,并且通过第二接口复制到分析系统中,将流量进行转发,能够降低业务系统的处理压力,通过分析系统专门分析流量信息,不仅针对性强而且效率更高。
在一种可选的实施方式中,
所述业务场景包括用户注册场景、用户登录场景和免注册登录场景中任意一种;
所述获取用户访问业务场景的访问流量信息之前,所述方法还包括:
确定用户访问的当前业务场景;
若当前业务场景为用户注册场景,则为所述用户适配注册所需的第一验证策略,并输出第一提示信息;
若当前业务场景为用户登录场景,则为所述用户适配登录所需的第二验证策略,并输出第二提示信息;
若当前业务场景为免注册登录场景,则为所述用户适配免注册登录所需的第三验证策略,并输出第三提示信息。
需要说明的是,本公开实施例中业务场景包括用户注册场景、用户登录场景以及免注册登录场景只是示例性说明,本公开实施例对业务场景的具体类型并不进行限定。
以当前业务场景为用户注册场景为例,可以为用户适配注册所需的第一验证策略,并输出第一提示信息,其中,
第一验证策略可以包括用户注册后,根据注册信息开启多重安全验证,若多重安全验证通过后,则输出第一提示信息;
其中,用户已经注册,为了避免信息泄露,可以直接根据注册信息开启短信验证,若业务场景的安全性较低,例如为非金融领域的场景,则可以提示信息“您已注册”,若是金融领域,则继续进行安全验证;
若短信验证通过,则可以调用第三方接口,例如执法部门的接口进行人脸识别验证;
若多重验证均无问题,则可以输出第一提示信息。
可选地,第一提示信息可以为“您已注册,可直接登录”或者“同一用户,只能注册一个账号”;多重安全验证可以包括短信验证、人脸识别验证、邮箱验证中任意一种。
以当前业务场景为用户登录场景为例,可以为用户适配登录所需的第二验证策略,并输出第二提示信息,其中,
第二验证策略可以包括用户未注册进行登录,则开启短信验证;短信验证通过后,
如果安全性较低,则提示客户未注册,并且进行注册界面;
如果安全性较高,则进行人脸识别验证,后台系统可以记录每张人脸绑定唯一的账号,避免同一用户进行多账户注册。
可选地,第二提示信息包括为“您未注册,请先注册”或者“同一用户,只能登录一个账号”。
以当前业务场景为免注册登录场景为例,可以为用户适配免注册登录所需的第三验证策略,并输出第三提示信息,其中,
第三验证策略可以包括在用户免注册登录场景下,引入第三方验证,由第三方进行用户身份验证,当第三方验证通过后,输出第三提示信息,其中,
第三提示信息可以包括“您通过第三方验证”。
本公开实施例针对不同的业务场景,采用对应的验证策略,能够有效避免用户访问业务场景时用户信息泄露。
S102、提取所述访问流量信息中的行为特征信息;
示例性地,本公开实施例的行为特征信息可以包括用户身份信息以及行为信息,每个用户身份信息对应多个行为信息;
其中,用户身份信息可以包括用户ID、用户访问地理位置信息、用户访问设备信息,行为信息可以包括用户访问时间、用户访问动作、用户访问频率以及用户访问对象。
需要说明的是,本公开实施例对用户身份信息和行为信息的类别只是示例性地说明,本公开实施例对用户身份信息和行为信息并不进行具体限定。
在一种可选的实施方式中,
所述提取所述访问流量信息中的行为特征信息的方法包括:
提取所述行为特征信息中的用户身份信息,并提取所述用户身份信息对应的多个行为信息,其中,
所述行为信息包括当前行为信息与多个历史行为信息,所述历史行为信息与所述当前行为信息相距预设时间长度。
示例性地,可以获取用户当前行为信息,并且关联该用户与当前行为信息相距预设时间长度的多个历史信息,以预设时间长度为1个月为例,可以获取该用户前一个月的历史访问流量信息。
本公开的行为特征信息包括用户身份信息以及行为信息,每个用户身份信息对应多个行为信息,根据行为特征信息检测用户访问业务场景的行为是否异常。
S103、根据所述行为特征信息,基于预设的第三方数据库和/或预设的行为检测模型,确定用户访问业务场景的行为是否异常。
示例性地,本公开的第三方数据库可以包括黑灰产数据库,黑灰产数据库可以预先录入用户异常行为信息,和异常用户信息;
本公开的行为检测模型,能够根据所输入的行为特征信息,输入每个行为特征信息对应的行为检测值,根据行为检测值判断用户行为是否异常。
在一种可选的实施方式中,
所述根据所述行为特征信息,基于预设的第三方数据库,确定用户访问业务场景的行为是否异常的方法包括:
根据所述行为特征信息中的行为信息,基于所述第三方数据库,匹配所述第三方数据库中与所述行为信息相同类别的预设行为信息,
若相匹配,则确定用户访问业务场景的行为异常。
示例性地,第三方数据库可以预先存储有多种异常访问行为,可以获取行为特征信息中的行为信息,将其与第三方数据库中与行为信息相同类别的预设行为信息进行匹配,其中,
匹配方法可以包括计算行为特征信息中的行为信息与预设行为信息的关联度;若关联度大于预设关联度阈值,则可以认定该用户访问业务场景的行为异常。
需要说明的是,本公开实施例的预设关联度阈值可以根据数据库以及用户的实际需要进行设定,本公开实施例对预设关联度阈值的具体值并不进行限定。本公开实施例关联度的计算方法可以参考现有的关联度计算方法,本公开实施例对此不进行展开。
在一种可选的实施方式中,
所述根据所述行为特征信息,基于预设的行为检测模型,确定用户访问业务场景的行为是否异常的方法包括:
提取所述行为特征信息中用户身份信息对应的多个行为信息,将其输入所述行为检测模型,获取每个行为信息对应的行为检测值;
获取所述行为检测值与所述行为检测模型中预设的行为标准值的差值范围;
若所述差值范围超出预设行为基准范围,则确定用户访问业务场景的行为异常。
示例性地,本公开的行为检测模型用于指示输入模型的行为信息的行为检测值,本公开实施例以孤立森林模型为例,需要说明的是,孤立森林模型只是示例性的说明,本公开实施例对于行为检测模型的具体类型并不进行限定。为了说明的方便,本公开实施例后续以孤立森林模型指代行为检测模型进行说明。
孤立森林模型是一种适用于连续数据(Continuous numerical data)的无监督异常检测方法,即不需要有标记的样本来训练。在孤立森林模型中,递归地随机分割数据集,直到所有的样本点都是孤立的。在这种随机分割的策略下,异常点通常具有较短的路径。直观上来讲,那些密度很高的簇是需要被切很多次才能被孤立,但是那些密度很低的点很容易就可以被孤立。
假设T是孤立森林树的一个节点,它要么是没有子节点的叶子节点,要么是只有两个子节点(Tl,Tr)的内部节点。每一步分割,都包含特征q和分割值p,将q<p的数据分到Tl,将q≥p的数据分到Tr
给定n个样本数据X={x1,…xn},其中,本公开实施例的样本数据可以包括用户身份信息对应的多个行为信息,特征的维度为d。
为了构建一棵孤立树,需要随机选择一个特征q及其分割值p,递归地分割数据集X,直到满足以下任意一个条件:
(1)孤立树达到了限制的高度;
(2)节点上只有一个样本;
(3)节点上的样本所有特征都相同。
异常检测的任务是给出一个反应异常程度的排序,常用的排序方法是根据样本点的路径长度或异常得分来排序,异常点就是排在最前面的那些点。
其中,可以定义样本点x的路径长度h(x)为从iTree的根节点到叶子节点所经过的边的数量;
给定一个包含n个样本的数据集,树的平均路径长度为:
Figure BDA0003630799580000131
其中,H()为调和数,c(n)为给定样本数n时,路径长度的平均值,用来标准化样本点x的路径长度。
样本点x的行为检测值定义为:
Figure BDA0003630799580000132
其中,E(h(x))为样本x在一批孤立树中的路径长度的期望。
当E(h(x))→c(n)时,s→0.5,即样本点的路径平均长度与树的平均路径长度相似,不能区分为是否异常;
当E(h(x))→0时,s→1,即样本点的异常分数接近1时,则可以判定为异常;
当E(h(x))→n-1时,s→0,则可以判定为正常。
在一种可选的实施方式中,
在基于预设的行为检测模型,确定用户访问业务场景的行为是否异常之前,所述方法还包括:
基于预先构建的分布式计算框架训练所述行为检测模型,直至所述行为检测模型的检测结果满足预设阈值条件。
在训练阶段,孤立树的建立是通过对训练集的递归分隔来建立的,直到所有的样本被孤立,或者树达到了指定的高度。孤立树的高度限制l与子样本数量
Figure BDA0003630799580000141
的关系为:
Figure BDA0003630799580000142
它近似等于树的平均高度。树只生长到平均高度,而不继续生长的原因是,我们只关心路径长度较小的那些点,它们更有可能是异常点,而并不关系路径很长的正常点。
示例性地,本公开实施例的分布式计算框架可以包括flink开源流处理框架,用以加强模型构建速度和流量检测效率。
在一种可选的实施方式中,
在确定用户访问业务场景的行为异常之后,所述方法还包括:
对行为异常的用户进行二次认证,和/或
重置行为异常的用户的登录令牌,和/或
启动针对行为异常的用户的人脸识别,和/或
对行为异常的用户进行阻断响应。
在确定用户访问业务场景的行为异常后,可以进行如下操作:
对于高危对象,可以对用户进行阻断响应,例如锁定用户、封锁IP等;
对行为异常的用户可以进行至少两次短信验证,以防止短信拦截;
对行为异常的用户还可以重置其登录令牌,强制行为异常的用户重新登录;
对行为异常的用户启动人脸识别,在特定场景下,可以调用执法部门的人脸识别系统。
本公开提供一种恶意用户行为检测方法,包括:
基于在多个业务场景中预设的流量镜像工具,获取用户访问业务场景的访问流量信息;
通过流量镜像工具,不仅能够获取用户当前访问业务场景的访问流量信息,还能够获取同一用户身份的历史访问流量信息,引入用户的历史行为,并对用户建立长期行为监控;
提取所述访问流量信息中的行为特征信息;
本公开的行为特征信息包括用户身份信息以及行为信息,每个用户身份信息对应多个行为信息,根据行为特征信息检测用户访问业务场景的行为是否异常;
根据所述行为特征信息,基于预设的第三方数据库和/或预设的行为检测模型,确定用户访问业务场景的行为是否异常;
通过第三方数据库,将行为特征信息中的行为信息与第三方数据库中与行为信息相同类别的预设行为信息进行匹配,借助外部信息,提升检测准确性和检测效率;
通过行为检测模型,能够识别行为特征信息是否为机器行为,可以加强传统的基于规则的异常行为检测机制,在降低异常检测误报率的同时,提升异常判定的准确性。
图3为本公开实施例的一种恶意用户行为检测装置的结构示意图,如图3所示,所述装置包括:
第一单元31,用于基于在多个业务场景中预设的流量镜像工具,获取用户访问业务场景的访问流量信息;
第二单元32,用于提取所述访问流量信息中的行为特征信息;
第三单元33,用于根据所述行为特征信息,基于预设的第三方数据库和/或预设的行为检测模型,确定用户访问业务场景的行为是否异常。
在一种可选的实施方式中,
所述业务场景包括用户注册场景、用户登录场景和免注册登录场景中任意一种;
所述装置还包括第四单元34,所述第四单元34用于:
确定用户访问的当前业务场景;
若当前业务场景为用户注册场景,则为所述用户适配注册所需的第一验证策略,并输出第一提示信息;
若当前业务场景为用户登录场景,则为所述用户适配登录所需的第二验证策略,并输出第二提示信息;
若当前业务场景为免注册登录场景,则为所述用户适配免注册登录所需的第三验证策略,并输出第三提示信息。
在一种可选的实施方式中,
所述流量镜像工具包括获取工具和镜像工具,所述流量工具预先安装于业务系统的前端负载侧,
所述第一单元31还用于:
所述获取工具获取业务系统的第一接口中所有的原始访问流量信息;
所述镜像工具将所述原始访问流量信息通过分析系统的第二接口复制到所述分析系统中,用以获取并分析访问流量信息。
在一种可选的实施方式中,
所述行为特征信息包括用户身份信息以及行为信息,每个用户身份信息对应多个行为信息;
所述第二单元32还用于:
提取所述行为特征信息中的用户身份信息,并提取所述用户身份信息对应的多个行为信息,其中,
所述行为信息包括当前行为信息与多个历史行为信息,所述历史行为信息与所述当前行为信息相距预设时间长度。
在一种可选的实施方式中,
所述第三单元33还用于:
根据所述行为特征信息中的行为信息,基于所述第三方数据库,匹配所述第三方数据库中与所述行为信息相同类别的预设行为信息,
若相匹配,则确定用户访问业务场景的行为异常。
在一种可选的实施方式中,
所述第三单元33还用于:
提取所述行为特征信息中用户身份信息对应的多个行为信息,将其输入所述行为检测模型,获取每个行为信息对应的行为检测值;
获取所述行为检测值与所述行为检测模型中预设的行为标准值的差值范围;
若所述差值范围超出预设行为基准范围,则确定用户访问业务场景的行为异常。
在一种可选的实施方式中,
所述装置还包括第五单元35,所述第五单元35用于:
基于预先构建的分布式计算框架训练所述行为检测模型,直至所述行为检测模型的检测结果满足预设阈值条件。
在一种可选的实施方式中,
所述装置还包括第六单元36,所述第六单元36用于:
对行为异常的用户进行二次认证,和/或
重置行为异常的用户的登录令牌,和/或
启动针对行为异常的用户的人脸识别,和/或
对行为异常的用户进行阻断响应。
需要说明的是,本公开的装置实施例的有益效果可以参考前述方法实施例的有益效果,本公开实施例对此不再赘述。
本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述中任意一项所述的方法。
本公开还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。设备的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的方法。
其中,可读存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(ApplicationSpecific Integrated Circuits,简称:ASIC)中。另外,该ASIC可以位于用户设备中。当然,处理器和可读存储介质也可以作为分立组件存在于通信设备中。可读存储介质可以是只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在上述终端或者服务器的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本公开所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
最后应说明的是:以上各实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述各实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的范围。

Claims (10)

1.一种恶意用户行为检测方法,其特征在于,包括:
基于在多个业务场景中预设的流量镜像工具,获取用户访问业务场景的访问流量信息;
提取所述访问流量信息中的行为特征信息;
根据所述行为特征信息,基于预设的第三方数据库和/或预设的行为检测模型,确定用户访问业务场景的行为是否异常。
2.根据权利要求1所述的方法,其特征在于,所述业务场景包括用户注册场景、用户登录场景和免注册登录场景中任意一种;
所述获取用户访问业务场景的访问流量信息之前,所述方法还包括:
确定用户访问的当前业务场景;
若当前业务场景为用户注册场景,则为所述用户适配注册所需的第一验证策略,并输出第一提示信息;
若当前业务场景为用户登录场景,则为所述用户适配登录所需的第二验证策略,并输出第二提示信息;
若当前业务场景为免注册登录场景,则为所述用户适配免注册登录所需的第三验证策略,并输出第三提示信息。
3.根据权利要求1所述的方法,其特征在于,所述流量镜像工具包括获取工具和镜像工具,所述流量工具预先安装于业务系统的前端负载侧,
所述基于在多个业务场景中预设的流量镜像工具,获取用户访问业务场景的访问流量信息的方法包括:
所述获取工具获取业务系统的第一接口中所有的原始访问流量信息;
所述镜像工具将所述原始访问流量信息通过分析系统的第二接口复制到所述分析系统中,用以获取并分析访问流量信息。
4.根据权利要求1所述的方法,其特征在于,所述行为特征信息包括用户身份信息以及行为信息,每个用户身份信息对应多个行为信息;
所述提取所述访问流量信息中的行为特征信息的方法包括:
提取所述行为特征信息中的用户身份信息,并提取所述用户身份信息对应的多个行为信息,其中,
所述行为信息包括当前行为信息与多个历史行为信息,所述历史行为信息与所述当前行为信息相距预设时间长度。
5.根据权利要求1所述的方法,其特征在于,所述根据所述行为特征信息,基于预设的第三方数据库,确定用户访问业务场景的行为是否异常的方法包括:
根据所述行为特征信息中的行为信息,基于所述第三方数据库,匹配所述第三方数据库中与所述行为信息相同类别的预设行为信息,
若相匹配,则确定用户访问业务场景的行为异常。
6.根据权利要求1所述的方法,其特征在于,所述根据所述行为特征信息,基于预设的行为检测模型,确定用户访问业务场景的行为是否异常的方法包括:
提取所述行为特征信息中用户身份信息对应的多个行为信息,将其输入所述行为检测模型,获取每个行为信息对应的行为检测值;
获取所述行为检测值与所述行为检测模型中预设的行为标准值的差值范围;
若所述差值范围超出预设行为基准范围,则确定用户访问业务场景的行为异常。
7.根据权利要求6所述的方法,其特征在于,在基于预设的行为检测模型,确定用户访问业务场景的行为是否异常之前,所述方法还包括:
基于预先构建的分布式计算框架训练所述行为检测模型,直至所述行为检测模型的检测结果满足预设阈值条件。
8.根据权利要求1-7中任一项所述的方法,其特征在于,在确定用户访问业务场景的行为异常之后,所述方法还包括:
对行为异常的用户进行二次认证,和/或
重置行为异常的用户的登录令牌,和/或
启动针对行为异常的用户的人脸识别,和/或
对行为异常的用户进行阻断响应。
9.一种恶意用户行为检测装置,其特征在于,包括:
第一单元,用于基于在多个业务场景中预设的流量镜像工具,获取用户访问业务场景的访问流量信息;
第二单元,用于提取所述访问流量信息中的行为特征信息;
第三单元,用于根据所述行为特征信息,基于预设的第三方数据库和/或预设的行为检测模型,确定用户访问业务场景的行为是否异常。
10.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至8中任意一项所述的方法。
CN202210489991.9A 2022-05-06 2022-05-06 恶意用户行为检测方法、装置及电子设备 Pending CN114900356A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210489991.9A CN114900356A (zh) 2022-05-06 2022-05-06 恶意用户行为检测方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210489991.9A CN114900356A (zh) 2022-05-06 2022-05-06 恶意用户行为检测方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN114900356A true CN114900356A (zh) 2022-08-12

Family

ID=82719672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210489991.9A Pending CN114900356A (zh) 2022-05-06 2022-05-06 恶意用户行为检测方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN114900356A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117061254A (zh) * 2023-10-12 2023-11-14 之江实验室 异常流量检测方法、装置和计算机设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108306846A (zh) * 2017-01-13 2018-07-20 中国移动通信集团公司 一种网络访问异常检测方法及系统
CN109241711A (zh) * 2018-08-22 2019-01-18 平安科技(深圳)有限公司 基于预测模型的用户行为识别方法及装置
CN109447651A (zh) * 2018-10-22 2019-03-08 武汉极意网络科技有限公司 业务风控检测方法、系统、服务器及存储介质
KR20190066741A (ko) * 2017-12-06 2019-06-14 에스케이텔레콤 주식회사 트래픽 분류를 이용하여 이상 탐지를 수행하기 위한 시스템
CN112291225A (zh) * 2020-10-23 2021-01-29 翼集分电子商务(上海)有限公司 一种应用于积分系统的大数据异常流量检测方法和系统
CN112543176A (zh) * 2020-10-22 2021-03-23 新华三信息安全技术有限公司 一种异常网络访问检测方法、装置、存储介质及终端
CN113222736A (zh) * 2021-05-24 2021-08-06 北京城市网邻信息技术有限公司 一种异常用户的检测方法、装置、电子设备及存储介质
WO2022033396A1 (zh) * 2020-08-13 2022-02-17 百果园技术(新加坡)有限公司 信用阈值的训练方法及装置、ip地址的检测方法及装置
CN114238041A (zh) * 2021-12-16 2022-03-25 深圳腾银信息咨询有限责任公司 一种告警方法、装置、电子设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108306846A (zh) * 2017-01-13 2018-07-20 中国移动通信集团公司 一种网络访问异常检测方法及系统
KR20190066741A (ko) * 2017-12-06 2019-06-14 에스케이텔레콤 주식회사 트래픽 분류를 이용하여 이상 탐지를 수행하기 위한 시스템
CN109241711A (zh) * 2018-08-22 2019-01-18 平安科技(深圳)有限公司 基于预测模型的用户行为识别方法及装置
CN109447651A (zh) * 2018-10-22 2019-03-08 武汉极意网络科技有限公司 业务风控检测方法、系统、服务器及存储介质
WO2022033396A1 (zh) * 2020-08-13 2022-02-17 百果园技术(新加坡)有限公司 信用阈值的训练方法及装置、ip地址的检测方法及装置
CN112543176A (zh) * 2020-10-22 2021-03-23 新华三信息安全技术有限公司 一种异常网络访问检测方法、装置、存储介质及终端
CN112291225A (zh) * 2020-10-23 2021-01-29 翼集分电子商务(上海)有限公司 一种应用于积分系统的大数据异常流量检测方法和系统
CN113222736A (zh) * 2021-05-24 2021-08-06 北京城市网邻信息技术有限公司 一种异常用户的检测方法、装置、电子设备及存储介质
CN114238041A (zh) * 2021-12-16 2022-03-25 深圳腾银信息咨询有限责任公司 一种告警方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117061254A (zh) * 2023-10-12 2023-11-14 之江实验室 异常流量检测方法、装置和计算机设备
CN117061254B (zh) * 2023-10-12 2024-01-23 之江实验室 异常流量检测方法、装置和计算机设备

Similar Documents

Publication Publication Date Title
CN110399925B (zh) 账号的风险识别方法、装置及存储介质
CN108200054B (zh) 一种基于dns解析的恶意域名检测方法及装置
EP2691848B1 (en) Determining machine behavior
CN107579956B (zh) 一种用户行为的检测方法和装置
CN107391359B (zh) 一种业务测试方法及装置
CN110602029B (zh) 一种用于识别网络攻击的方法和系统
US11652841B2 (en) System and method for detecting bots based on iterative clustering and feedback-driven adaptive learning techniques
CN112543196A (zh) 一种基于区块链智能合约的网络威胁情报共享平台
CN114003903B (zh) 一种网络攻击追踪溯源方法及装置
CN113949527A (zh) 异常访问的检测方法、装置、电子设备及可读存储介质
CN112131507A (zh) 网站内容处理方法、装置、服务器和计算机可读存储介质
CN114650176A (zh) 钓鱼网站的检测方法、装置、计算机设备及存储介质
CN114329455B (zh) 基于异构图嵌入的用户异常行为检测方法及装置
CN112819611A (zh) 欺诈识别方法、装置、电子设备和计算机可读存储介质
CN114244564A (zh) 攻击防御方法、装置、设备及可读存储介质
CN111404937A (zh) 一种服务器漏洞的检测方法和装置
CN114900356A (zh) 恶意用户行为检测方法、装置及电子设备
CN110827036A (zh) 一种欺诈交易的检测方法、装置、设备及存储介质
US11539730B2 (en) Method, device, and computer program product for abnormality detection
CN112395511A (zh) 一种基于移动应用内消息传播路径的谣言检测与存证系统
CN115618415A (zh) 敏感数据识别方法、装置、电子设备和存储介质
CN114422168A (zh) 一种恶意机器流量识别方法及系统
CN112488562A (zh) 一种业务实现方法及装置
CN111639365A (zh) 一种数据泄漏告警方法及相关装置
CN113965421B (zh) 应用程序接口的获取方法、装置和分析方法、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination