CN108769026A - 用户账号检测系统和方法 - Google Patents
用户账号检测系统和方法 Download PDFInfo
- Publication number
- CN108769026A CN108769026A CN201810547649.3A CN201810547649A CN108769026A CN 108769026 A CN108769026 A CN 108769026A CN 201810547649 A CN201810547649 A CN 201810547649A CN 108769026 A CN108769026 A CN 108769026A
- Authority
- CN
- China
- Prior art keywords
- user account
- node server
- data
- server
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1408—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
- H04L63/1425—Traffic logging, e.g. anomaly detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1441—Countermeasures against malicious traffic
- H04L63/1466—Active attacks involving interception, injection, modification, spoofing of data unit addresses, e.g. hijacking, packet injection or TCP sequence number attacks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Computer And Data Communications (AREA)
Abstract
本申请涉及一种用户账号检测系统和方法。所述系统包括:客户端服务器,获取多个用户账号实时数据,用户账号实时数据包括用户账号标识;主节点服务器,获取多个用户账号数据,将多个用户账号数据按照预设分配规则分配到多个从节点服务器,用户账号数据包括从客户端服务器获取的用户账号实时数据和从白名单数据库中获取的用户账号标识对应的用户账号历史数据;从节点服务器,接收主节点服务器发送的用户账号数据,加载主节点服务器中的预设用户账号分类器,使用预设用户账号分类器对用户账号数据进行检测,得到检测结果。采用本系统能够用户账号的检测效率。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种用户账号检测系统和方法。
背景技术
在互联网平台中,每日用户注册或者用户活跃度高达十万用户,在高峰时间段,每小时注册或者用户活跃度过万用户,此时,大量用户使用用户账号访问平台,则平台对应的服务器会产生大量用户账号数据,形成大数据。若平台进行优惠促销活动,则虚假用户账号很容易进行批量操作或者利用漏洞领取平台福利,给平台造成大量损失。此时,根据形成的用户账号大数据去判断用户账号是否有欺诈行为,目前都是采用关系型数据库进行大数据处理,但是由于计算量太大,无法在短时间内计算得到结果,效率比较低下。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高用户账号检测效率的用户账号检测系统和方法。
一种用户账号检测系统,所述系统,包括:
客户端服务器,获取多个用户账号实时数据,用户账号实时数据包括用户账号标识;
主节点服务器,获取多个用户账号数据,将多个用户账号数据按照预设分配规则分配到多个从节点服务器,用户账号数据包括从客户端服务器获取的用户账号实时数据和从白名单数据库中获取的用户账号标识对应的用户账号历史数据;
从节点服务器,接收主节点服务器发送的用户账号数据,并加载主节点服务器中的预设用户账号分类器,使用预设用户账号分类器对用户账号数据进行检测,得到检测结果。
在其中一个实施例中,所述主节点服务器,接收从节点服务器返回的检测结果,并将检测结果为异常的用户账号数据发送到客户端服务器,将检测结果为正常的用户账号数据存储到白名单数据库中;
客户端服务器,接收异常用户账号数据,将异常用户账号数据存储到黑名单数据库中,当获取到用户账号实时数据时,根据用户账号标识在黑名单数据库中查找,当能够查找到用户账号标识时,客户端服务器拦截用户账号标识对应的用户账号操作请求。
在其中一个实施例中,主节点服务器,获取历史用户账号数据和对应的检测结果,根据历史用户账号数据确定用户特征属性,将用户特征属性作为朴素贝叶斯模型的输入,将历史用户账号数据对应的检测结果作为朴素贝叶斯模型的标签进行训练,得到预设用户账号分类器。
在其中一个实施例中,主节点服务器,获取待检测用户账号数和从节点服务器数,根据待检测用户账号数和从节点服务器数计算从节点服务器可分配用户账号数,向从节点服务器分配可分配用户账号数的用户账号数据。
在其中一个实施例中,主节点服务器,根据从节点服务器的负载能力得到从节点服务器权重,根据从节点服务器权重将多个用户账号数据分配到从节点服务器。
一种用户账号检测方法,所述方法包括:
客户端服务器获取多个用户账号实时数据,用户账号实时数据包括用户账号标识;
主节点服务器接收客户端服务器发送的多个用户账号实时数据,并根据用户账号标识获取白名单数据库中存储的多个用户账号历史数据,根据多个用户账号实时数据和多个用户帐号历史数据得到多个用户账号数据,将多个用户账号数据按照预设分配规则分配到从节点服务器;
从节点服务器获取到主节点服务器分配的用户账号数据,并加载主节点服务器中的预设用户账号分类器,使用预设用户账号分类器对用户账号数据进行检测,得到检测结果。
在其中一个实施例中,在从节点服务器使用预设用户账号分类器对用户账号数据进行检测,得到检测结果之后,包括:
主节点服务器接收从节点服务器返回的检测结果,并将检测结果为异常的用户账号数据发送到客户端服务器,将检测结果为正常的用户账号数据存储到白名单数据库中;
客户端服务器接收异常用户账号数据,将异常用户账号数据存储到黑名单数据库中,当获取到用户账号实时数据时,根据用户账号标识在黑名单数据库中查找,当能够查找到用户账号标识时,客户端服务器拦截用户账号标识对应的用户账号操作请求。
在其中一个实施例中,预设用户账号分类器的生成步骤,包括:
主节点服务器获取历史用户账号数据和对应的检测结果,根据历史用户账号数据确定用户特征属性;
将用户特征属性作为朴素贝叶斯模型的输入,将历史用户账号数据对应的检测结果作为朴素贝叶斯模型的标签进行训练,得到预设用户账号分类器。
在其中一个实施例中,主节点服务器将多个用户账号数据按照预设分配规则分配到从节点服务器,包括:
主节点服务器获取待检测用户账号数和从节点服务器数;
根据待检测用户账号数和从节点服务器数计算从节点服务器可分配用户账号数;
向从节点服务器分配可分配用户账号数的用户账号数据。
在其中一个实施例中,主节点服务器将多个用户账号数据按照预设分配规则分配到从节点服务器,包括:
主节点服务器根据从节点服务器的负载能力得到从节点服务器权重;
根据从节点服务器权重将多个用户账号数据分配到从节点服务器。
上述用户账号检测系统和方法,使用客户端服务器获取多个用户账号实时数据,用户账号实时数据包括用户账号标识;主节点服务器,获取多个用户账号数据,将多个用户账号数据按照预设分配规则分配到多个从节点服务器,用户账号数据包括从客户端服务器获取的用户账号实时数据和从白名单数据库中获取的用户账号标识对应的用户账号历史数据;从节点服务器,接收主节点服务器发送的用户账号数据,并加载所述主节点服务器中的预设用户账号分类器,使用预设用户账号分类器对用户账号数据进行检测,得到检测结果。通过将多个用户账号数据分配到从节点服务器进行用户账号数据的检测,从而能够并行检测用户账号数据,提高了大批量用户账号检测的效率。
附图说明
图1为一个实施例中用户账号检测系统的系统架构图;
图2为一个实施例中用户账号检测系统的结构框图;
图3为一个实施例中用户账号检测方法的流程示意图;
图4为一个实施例中得到黑名单数据库和白名单数据库的流程示意图;
图5为一个实施例中生成预设用户账号分类器的流程示意图;
图6为一个实施例中分配多个用户账号数据的流程示意图;
图7为另一个实施例中分配多个用户账号数据的流程示意图;
图8为一个具体的实施例中用户账号检测的时序图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的用户账号检测系统,可以应用于如图1所示的系统架构中。其中,多个终端与客户端服务器104通过网络进行通信,客户端服务器104与主节点服务器106通过网络进行通信。主节点服务器106与多个从节点服务器通过网络进行通信。客户端服务器104,从多个终端获取多个用户账号实时数据,用户账号实时数据包括用户账号标识;主节点服务器106,获取多个用户账号数据,将多个用户账号数据按照预设分配规则分配到多个从节点服务器,用户账号数据包括从客户端服务器获取的用户账号实时数据和从白名单数据库中获取的用户账号标识对应的用户账号历史数据;从节点服务器,接收主节点服务器发送的用户账号数据,并加载主节点服务器中的预设用户账号分类器,使用预设用户账号分类器对用户账号数据进行检测,得到检测结果。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,客户端服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种用户账号检测系统的结构框图200,以该系统应用于图1的系统架构图中为例进行说明,包括:客户端服务器202、主节点服务器204和从节点服务器206。
客户端服务器202,获取多个用户账号实时数据,用户账号实时数据包括用户账号标识。
其中,用户账号实时数据是指用户使用用户账号进行操作时在其操作发生的实际时间内产生的数据,比如,在该实际时间内产生的用户行为数据,产生的日志数据等等。例如,用户点击了一个按键,则获取到在点击时间内的相关数据。用户账号标识用于唯一标识该用户账号。
具体地,客户端服务器从不同的终端中获取到大量的用户账号实时数据,当有多个终端都使用不同的用户账号登录用户账号对应的平台时,会产生不同的实时数据,每个用户账号都有对应的实时数据,各个终端会将得到的实时数据都发送给客户端服务器,客户端服务器接收到各个终端发送的用户账号实时数据,每个用户账号实时数据都带有用户账号标识,该用户账号标识用于反映该用户账号实时数据是该用户账号标识对应的用户账号产生的。当客户端服务器接收到多个用户账号实时数据时,将得到多个用户账号实时数据都发送到主节点服务器中。
主节点服务器204,获取多个用户账号数据,将多个用户账号数据按照预设分配规则分配到多个从节点服务器,用户账号数据包括从客户端服务器获取的用户账号实时数据和从白名单数据库中获取的用户账号标识对应的用户账号历史数据。
其中,用户账号数据包括用户账号数据包括账号基础属性、设备信息、用户行为数据和业务数据。其中,账号基础属性用于反映用户的个人信息,可以包括账户名、手机号、银行卡号、姓名、年龄、性别、身份证、注册信息和地址等。设备信息用于描述用户使用的设备参数信息,可以包括手机、平板电脑、笔记本和PC等各类设备的参数,也可以是用户经常使用设备的设备指纹。用户行为数据是指用户在网页或者客户端上进行各种操作时产生的各类数据,可以包括用户页面停留时长、用户的访问顺序、操作频率和按键信息等。业务数据是指进行业务活动时产生的数据,比如,有秒杀商品的业务活动时,则业务数据就是该商品的维度属性。白名单数据库中存储有历史检测结果为正常用户账号的用户账号数据。
具体地,主节点服务器获取到客户端服务器发送的多个用户账号实时数据,此时,主节点服务器根据用户账号实时数据中的用户账号标识获取到白名单数据库中存储的用户账号历史数据,根据用户账号实时数据和用户账号历史数据得到了多个用户账号数据。将得到的多个用户账号数据按照预设分配规则分配到多个从节点服务器中。其中,预设分配规则可以是按照用户账号标识进行分配,也可以是按照从节点服务器的负载能力进行均衡分配,还可以进行随机分配等等。
从节点服务器206,接收主节点服务器发送的用户账号数据,并加载主节点服务器中的预设用户账号分类器,使用预设用户账号分类器对用户账号数据进行检测,得到检测结果。
其中,预设用户账号分类器是主节点服务器预先使用机器学习算法训练好的用于检测用户账号的模型,使用历史用户账号数据进行训练。机器学习算法可以是有监督机器学习算法包括朴素贝叶斯算法、逻辑回归算法和神经网络算法等,也可以是无监督机器学习算法包括聚类算法等
具体地,当各个从节点服务器接收到主节点服务器分配的用户帐号数据时,从节点服务器加载主节点服务器中的预设用户账号分类器,则根据所述用户账号数据得到用户特征属性,将用户特征属性输入到预设用户账号分类器中,得到输出特征,根据输出特征得到用户账号检测结果,其中,多个从节点服务器并行检测主节点服务器分配的用户帐号数据,每个从节点服务器都得到各自的用户账号数据的检测结果。
在一个实施例中,客户端服务器获取到用户账号实时数据,将用户账号实时数据保存。主节点服务器定时获取客户端服务器保存的用户账号实时数据,定时对用户账号进行检测,可以发现更加隐蔽的异常用户账号,可以有效防止遗漏异常用户账号,提高检测用户账号的准确度。
上述用户账号检测系统中,使用客户端服务器,获取多个用户账号实时数据,用户账号实时数据包括用户账号标识;主节点服务器,获取多个用户账号数据,将多个用户账号数据按照预设分配规则分配到多个从节点服务器,用户账号数据包括从客户端服务器获取的用户账号实时数据和从白名单数据库中获取的用户账号标识对应的用户账号历史数据;从节点服务器,接收主节点服务器发送的用户账号数据,并加载主节点服务器中的预设用户账号分类器,使用预设用户账号分类器对用户账号数据进行检测,得到检测结果。通过将多个用户账号数据分配到从节点服务器进行检测,从而能够并行检测多个用户账号数据,提高了大批量用户账号检测的效率。
在一个实施例中,主节点服务器,接收从节点服务器返回的检测结果,并将检测结果为异常的用户账号数据发送到客户端服务器,将检测结果为正常的用户账号数据存储到白名单数据库中。
其中,检测结果包括异常用户账号和正常用户账号,异常用户账号是指该用户账号存在着异常欺诈行为操作,异常欺诈行为包括批量领取行为、利用漏洞操作、恶意注册、盗号和滥发不良行为等。正常用户账号是指没有存在异常欺诈行为操作的用户账号。
具体地,当各个从节点服务器得到用户账号数据的检测结果时,将得到的检测结果返回给主节点服务器,主节点服务器接收到各个从节点服务器返回的检测结果,将得到的检测结果数据进行汇总统计,将检测结果为异常用户账号的用户账号数据发送到客户端服务器。将检测结果为正常用户账号的用户账号数据存储到白名单数据库中。其中,在主节点服务器预先设置好白名单数据库,用来存储检测结果为正常的用户账号数据。
客户端服务器,接收异常用户账号数据,将异常用户账号数据存储到黑名单数据库中,当获取到用户账号实时数据时,根据用户账号标识在黑名单数据库中查找,当能够查找到所述用户账号标识时,客户端服务器拦截用户账号标识对应的用户账号操作请求。
其中,黑名单数据库是预先在客户端服务建立的用户存储检测结果为异常的用户账号数据的数据库。还可以根据黑名单数据库实时监测黑名单数据库中的用户账号。
具体地,客户端服务器接收到主节点服务器发送的异常用户账号数据,将异常用户账号数据存储到黑名单数据库中。则当客户端服务器获取到用户账号实时数据时,首先根据用户账号标识在黑名单数据库中查找是否存储一致的用户账号标识,当能够查找到一致的用户账号标识时,说明该用户账号标识对应的用户账号为异常用户账号,此时客户端服务器拦截用户账号标识对应的用户账号操作请求,然后客户端服务器将该用户标识对应的用户账号实时数据存储到黑名单数据库中。,当没有查找到一致的用户账号标识时,将该用户账号标识对应的用户账号实时数据发送到主节点服务器进行检测。
在上述实施例中,主节点服务器,接收从节点服务器返回的检测结果,并将检测结果为异常的用户账号数据发送到客户端服务器,将检测结果为正常的用户账号数据存储到白名单数据库中,客户端服务器,接收异常用户账号数据,将异常用户账号数据存储到黑名单数据库中,当获取到用户账号实时数据时,根据用户账号标识在黑名单数据库中查找,当能够查找到所述用户账号标识时,客户端服务器拦截用户账号标识对应的用户账号操作请求,能够通过建立的黑名单数据进行初步的用户账号检测,使得进一步提高大批量用户账号的检测效率。
在一个实施例中,主节点服务器,获取历史用户账号数据和对应的检测结果,根据历史用户账号数据确定用户特征属性,将用户特征属性作为朴素贝叶斯模型的输入,将历史用户账号数据对应的检测结果作为朴素贝叶斯模型的标签进行训练,得到预设用户账号分类器。
其中,检测结果包括历史正常用户账号和历史异常用户账号。朴素贝叶斯模型是使用朴素贝叶斯算法建立的,朴素贝叶斯算法是基于贝叶斯定理与特征条件独立假设的分类方法。用户特征属性是指根据预先对历史用户账号数据经过特征提取得到用户特征,根据历史用户账号数据得到用户特征对应的值得到用户特征属性。比如得到的用户特征若一个历史用户账号数据中好友数量为100个好友,注册天数为400天,则该用户特征对应的用户特征属性为0.25。
具体地,主节点服务器获取到历史用户账号数据和对应的检测结果,该历史用户账号数据和对应的检测结果可以是通过人工审核或者根据专家规则检测历史用户账号数据得到的检测结果,然后将检测结果保存。此时,对历史用户账号数据进行特征提取得到用户特征,然后根据用户特征从历史用户账号数据中得到用户特征对应的用户特征属性,将该用户特征属性作为朴素贝叶斯模型输入。根据历史用户账号对应的检测结果得到输出特征,然后根据检查结果得到输出特征属性,将输出特征属性作为标签,进行训练,当训练完成时,得到预设用户账号分类器。
在一个实施例中,获取到历史用户账号数据和对应的检测结果,根据历史用户账号数据确定输入特征向量,根据所述对应的检测结果确定对应输出特征向量,将输入特征向量作为逻辑回归模型的输入,将检测结果对应的输出特征向量作为逻辑回归模型的标签,进行训练,当训练完成时,得到预设用户账号分类器。其中,输入特征包括账号基础属性特征、设备信息特征、用户行为特征和业务信息特征,账号基础属性特征用于描述该用户的基本信息,比如账号名特征、性别特征、年龄特征、地址特征、和手机号特征等。设备信息特征用于描述登录用户账号的设备参数信息,比如设备操作系统版本号特征、设备指纹特征、身边芯片特征、硬件特征和设备处于越狱或者破解模式特征等。用户行为特征用于描述用户使用户账号在网页或者客户端进行各种操作时产生的数据。比如,用户页面停留时长特征、用户的访问顺序特征、操作频率特征和按键信息特征等。业务信息特征用于描述平台咋进行业务活动时产生的信息特征。比如,在有优惠券活动时,则业务信息特征可以是优惠券信息特征,优惠规则特征等。输出特征包括异常用户账号特征和正常用户账号特征。异常用户特征用于描述检测结果为异常用户账号的特征,正常用户特征用户描述检测结果为正常用户的特征。逻辑回归模型使用Sigmoid函数作为激活函数,其中,Sigmoid函数为训练完成是指逻辑回归模型的代价函数达到预设阈值,待见函数使用交叉熵,交叉熵函数为其中C为差异值,y为期望的输出,a为实际输出。
在一个实施例中,获取到历史用户账号数据和对应的检测结果,根据历史用户账号数据确定输入特征向量,根据所述对应的检测结果确定对应输出特征向量,将输入特征向量作为前馈神经网络模型的输入,将检测结果对应的输出特征向量作为逻辑回归模型的标签,进行训练,当训练完成时,得到预设用户账号分类器。其中,前馈神经网络可以是BP神经网络,是一种按照误差逆向传播算法训练的多层前馈神经网络,使用S型函数作为激活函数其中,输入为x,输出为s。
在一个实施例中,获取到历史用户账号数据和对应的检测结果,使用聚类算法得到预设用户账号分类器,其中聚类算法使用K均值算法,该算法以欧式距离作为相似度测度。根据对应的检测结果得到聚类个数。
上述实施例中,通过不同的机器学习算法来预先训练得到预设用户账号分类器,可以在进行用户账号检测时直接使用预先建立的用户账号分类器,提高了用户账号检测的效率。
在一个实施例中,主节点服务器,获取测试样本数据,使用测试样本数据对预设用户账号分类器进行测试,得到测试结果,当测试结果达到预设准确率时,得到目标预设用户账号分类器。
具体地,当主节点服务器获取到历史用户账号数据和对应的检测结果,将得到的历史用户账号数据和对应的检测结果分为训练样本数据和测试样本数据,使用训练样本数据训练得到预设用户账号分类器,使用测试样本数据对训练得到的预设用户账号分类器进行测试,得到测试结果,根据测试结果计算用户账号检测的准确率,当测试结果达到预设准确率时,说明得到的预设用户账号分类器达到了要求,将得到的预设用户账号分类器作为最终的目标预设用户账号分类器。当测试结果未达到预设准确率时,重新训练预设用户账号分类器,直到测试结果达到预设准确率时,就将对应的预设用户账号分类器作为目标预设用户账号分类器。
上述实施例中,通过获取测试样本数据,使用测试样本数据对预设用户账号分类器进行测试,得到测试结果,当测试结果达到预设准确率时,得到目标预设用户账号分类器,使用目标预设用户账号分类器检测用户账号,可以提高用户账号分类器检测用户账号的准确率。
在一个实施例中,主节点服务器,获取待检测用户账号数和从节点服务器数,根据待检测用户账号数和从节点服务器数计算从节点服务器可分配用户账号数,向从节点服务器分配可分配用户账号数的用户账号数据。
具体地,主节点服务器获取多个用户账号数据中的用户账号标识,根据用户账号标识得到待检测用户账号数,并获取到从节点服务器数。对待检测用户账号数和从节点服务器数进行取余计算,若余数为0,则在每个从节点服务器中分配取余数的用户账号数据。若余数不为0,则先在每个从节点服务器中分配取余数的用户账号数据,在将余数的用户账号数据依次从第一个从节点服务器进行分配,直到分配完成。根据从节点服务器与主节点服务器的网络连接先后顺序,确定从节点服务器的顺序。
在一个实施例中,主节点服务器,根据从节点服务器的负载能力得到从节点服务器权重,根据从节点服务器权重将多个用户账号数据分配到从节点服务器。
其中,负载能力是指从节点服务器在固定时间间隔内能够检测的用户账号数量,能够检测的用户账号数量越多,则负载能力越高,对应的权重就高。
具体地,主节点服务器根据从节点服务器在历史固定时间间隔内检测的用户账号数量得到从节点服务器的负载能力,根据从节点服务器的负载能力得到从节点服务器权重,则主节点服务器在分配到用户账号检测任务时,根据从节点服务器权重进行均衡分配,即从节点服务器权重高,分配的用户账号检测任务就多,从节点服务器权重底,则分配的用户账号检测任务就相应的少。
在一个实施例中,主节点服务器,随机将多个用户账号数据分配到从节点服务器,因为将用户更账号数据分配到从节点服务器的概率相同,则进行随机分配后,从节点服务器得到的用户账号数据的检测任务是一致的。
在一个实施例中,主节点服务器,根据从节点的计算性能来进行分配。主节点服务器获取从节点服务器执行单个用户账号检测任务的平均花费时间,计算所有从节点服务器平均花费时间的时间比,将多个用户账号数据按照时间比进行分配。
在上述实施例中,主节点服务器通过按照预设规则将多个用户账号数据分配到从节点服务器,使得多个从节点服务器可以并行实现用户账号的检测,提高了用户账号检测的效率。
在一个实施例中,主节点服务器和从节点服务器形成分布式集群。
其中,分布式集群是指hadoop集群,Hadoop是一个分布式系统基础架构,用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力高速运算和存储。
具体地,主节点服务器和从节点服务器形成hadoop集群,该hadoop集群可以根据大量的用户帐号数据对用户账号进行检测,能够实现并行计算,提高用户账号的检测效率。
在一个实施例中,如图3所示,提供了一种用户账号检测方法,以该方法应用于图1中的系统为例进行说明,包括以下步骤:
S302,客户端服务器获取多个用户账号实时数据,用户账号实时数据包括用户账号标识;
S304,主节点服务器接收客户端服务器发送的多个用户账号实时数据,并根据用户账号标识获取白名单数据库中存储的多个用户账号历史数据,根据多个用户账号实时数据和多个用户帐号历史数据得到多个用户账号数据,将多个用户账号数据按照预设分配规则分配到从节点服务器;
S306,从节点服务器获取到主节点服务器分配的用户账号数据,并加载所述主节点服务器中的预设用户账号分类器,使用预设用户账号分类器对用户账号数据进行检测,得到检测结果。
在一个实施例中,如图4所示,在步骤S306之后,即在所述从节点服务器使用所述用户账号分类器对所述用户账号数据进行检测,得到检测结果之后,还包括步骤:
S402,主节点服务器接收从节点服务器返回的检测结果,并将检测结果为异常的用户账号数据发送到客户端服务器,将检测结果为正常的用户账号数据存储到白名单数据库中。
S404,客户端服务器接收异常用户账号数据,将异常用户账号数据存储到黑名单数据库中,当获取到用户账号实时数据时,根据用户账号标识在黑名单数据库中查找,当能够查找到用户账号标识时,客户端服务器拦截用户账号标识对应的用户账号操作请求。
在一个实施例中,如图5所示,预设用户账号分类器的生成步骤包括:
S502,主节点服务器获取历史用户账号数据和对应的检测结果,根据历史用户账号数据确定用户特征属性。
S504,将用户特征属性作为朴素贝叶斯模型的输入,将历史用户账号数据对应的检测结果作为朴素贝叶斯模型的标签进行训练,得到预设用户账号分类器。
在一个实施例中,在预设用户账号分类器生成之后,还包括步骤:
主节点服务器获取测试样本数据,使用测试样本数据对预设用户账号分类器进行测试,得到测试结果,当测试结果达到预设准确率时,得到目标预设用户账号分类器。
在一个实施例中,如图6所示,步骤S304,即将多个用户账号数据按照预设分配规则分配到从节点服务器,包括步骤:
S602,主节点服务器获取待检测用户账号数和从节点服务器数。
S604,根据待检测用户账号数和从节点服务器数计算从节点服务器可分配用户账号数。
S606,向从节点服务器分配可分配用户账号数的用户账号数据。
在一个实施例中,如图6所示,步骤S304,即将多个用户账号数据按照预设分配规则分配到从节点服务器,包括步骤:
S702,主节点服务器根据从节点服务器的负载能力得到从节点服务器权重。
S704,根据从节点服务器权重将多个用户账号数据分配到从节点服务器。
在一个实施例中,主节点服务器和从节点服务器形成分布式集群。
应该理解的是,虽然图3-7的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图3-7中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个具体的实施例中,如图8所示,包括,客户端服务器802、hadoop集群中的主节点服务器804和从节点服务器806。客户端服务器802定时从多个终端处采集多个用户账号实时数据,该实时数据带有用户账号标识。根据该用户表示在黑名单数据库中进行查找,若能查找到一致的用户账号标识,则说明该用户帐号为异常用户账号,此时将该用户账号标识对应的用户数据存储到黑名单数据库中。若没有查找到一致的用户账号标识,则客户端服务器802将没有查找到用户账号标识的用户账号实时数据发送到hadoop集群中的主节点服务器804,该主节点服务器804接收到用户账号实时数据时,根据用户账号标识在白名单数据库中查找对应用户账号历史数据,根据用户账号实时数据和用户账号历史数据得到用户账号数据。然后主节点服务器804获取到的预设分配规则为按照用户账号标识进行分配。主节点服务器804按照该分配规则将用户账号数据分配到hodoop集群的从节点服务器806,此时,从节点服务器806加载主节点服务器804中的预设用户账号分类器,并根据得到的用户账号数据使用加载的预设用户账号分类器对用户账号进行检测,得到检测结果。此时从节点服务器806将检测结果返回给主节点服务器804,主节点服务器804统计接收到的检测结果,将检测结果为正常的用户账号数据存储到白名单数据库中作为用户账号历史数据,将检测结果为异常的用户账号数据存储到黑名单数据库中,可以进行黑名单检测。在需要进行大量用户账号检测时,能够及时快速的得到检测结果,提高了用户账号的检测效率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种用户账号检测系统,所述系统,包括:
客户端服务器,获取多个用户账号实时数据,所述用户账号实时数据包括用户账号标识;
主节点服务器,获取多个用户账号数据,将所述多个用户账号数据按照预设分配规则分配到多个从节点服务器,所述用户账号数据包括从客户端服务器获取的用户账号实时数据和从白名单数据库中获取的用户账号标识对应的用户账号历史数据;
从节点服务器,接收所述主节点服务器发送的用户账号数据,并加载所述主节点服务器中的预设用户账号分类器,使用所述预设用户账号分类器对所述用户账号数据进行检测,得到检测结果。
2.根据权利要求1所述的系统,其特征在于,所述主节点服务器,接收所述从节点服务器返回的检测结果,并将所述检测结果为异常的用户账号数据发送到所述客户端服务器,将所述检测结果为正常的用户账号数据存储到白名单数据库中;
所述客户端服务器,接收异常用户账号数据,将所述异常用户账号数据存储到黑名单数据库中,当获取到用户账号实时数据时,根据所述用户账号标识在所述黑名单数据库中查找,当能够查找到所述用户账号标识时,所述客户端服务器拦截所述用户账号标识对应的用户账号操作请求。
3.根据权利要求1所述的系统,其特征在于,所述主节点服务器,获取历史用户账号数据和对应的检测结果,根据所述历史用户账号数据确定用户特征属性,将所述用户特征属性作为朴素贝叶斯模型的输入,将所述历史用户账号数据对应的检测结果作为所述朴素贝叶斯模型的标签进行训练,得到预设用户账号分类器。
4.根据权利要求1所述的系统,其特征在于,所述主节点服务器,获取待检测用户账号数和从节点服务器数,根据所述待检测用户账号数和从节点服务器数计算所述从节点服务器可分配用户账号数,向所述从节点服务器分配可分配用户账号数的用户账号数据。
5.根据权利要求1所述的系统,其特征在于,所述主节点服务器,根据所述从节点服务器的负载能力得到所述从节点服务器权重,根据所述从节点服务器权重将所述多个用户账号数据分配到所述从节点服务器。
6.一种用户账号检测方法,其特征在于,所述方法包括:
客户端服务器获取多个用户账号实时数据,所述用户账号实时数据包括用户账号标识;
主节点服务器接收所述客户端服务器发送的多个用户账号实时数据,并根据所述用户账号标识获取白名单数据库中存储的多个用户账号历史数据,根据多个用户账号实时数据和多个用户帐号历史数据得到多个用户账号数据,将所述多个用户账号数据按照预设分配规则分配到从节点服务器;
所述从节点服务器获取到所述主节点服务器分配的用户账号数据,并加载所述主节点服务器中的预设用户账号分类器,使用所述预设用户账号分类器对所述用户账号数据进行检测,得到检测结果。
7.根据权利要求6所述的方法,其特征在于,在所述从节点服务器使用所述预设用户账号分类器对所述用户账号数据进行检测,得到检测结果之后,包括:
所述主节点服务器接收所述从节点服务器返回的检测结果,并将所述检测结果为异常的用户账号数据发送到所述客户端服务器,将所述检测结果为正常的用户账号数据存储到白名单数据库中;
所述客户端服务器接收异常用户账号数据,将所述异常用户账号数据存储到黑名单数据库中,当获取到用户账号实时数据时,根据所述用户账号标识在所述黑名单数据库中查找,当能够查找到所述用户账号标识时,所述客户端服务器拦截所述用户账号标识对应的用户账号操作请求。
8.根据权利要求6所述的方法,其特征在于,所述预设用户账号分类器的生成步骤,包括:
所述主节点服务器获取历史用户账号数据和对应的检测结果,根据所述历史用户账号数据确定用户特征属性;
将所述用户特征属性作为朴素贝叶斯模型的输入,将所述历史用户账号数据对应的检测结果作为所述朴素贝叶斯模型的标签进行训练,得到预设用户账号分类器。
9.根据权利要求6所述的方法,其特征在于,所述主节点服务器将所述多个用户账号数据按照预设分配规则分配到从节点服务器,包括:
所述主节点服务器获取待检测用户账号数和从节点服务器数;
根据所述待检测用户账号数和从节点服务器数计算所述从节点服务器可分配用户账号数;
向所述从节点服务器分配所述可分配用户账号数的用户账号数据。
10.根据权利要求6所述的方法,其特征在于,所述主节点服务器将所述多个用户账号数据按照预设分配规则分配到从节点服务器,包括:
所述主节点服务器根据所述从节点服务器的负载能力得到所述从节点服务器权重;
根据所述从节点服务器权重将所述多个用户账号数据分配到所述从节点服务器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810547649.3A CN108769026B (zh) | 2018-05-31 | 2018-05-31 | 用户账号检测系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810547649.3A CN108769026B (zh) | 2018-05-31 | 2018-05-31 | 用户账号检测系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108769026A true CN108769026A (zh) | 2018-11-06 |
CN108769026B CN108769026B (zh) | 2022-02-15 |
Family
ID=64000957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810547649.3A Active CN108769026B (zh) | 2018-05-31 | 2018-05-31 | 用户账号检测系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108769026B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109407997A (zh) * | 2018-11-09 | 2019-03-01 | 长沙理工大学 | 一种数据处理方法、装置、设备及可读存储介质 |
CN110223109A (zh) * | 2019-05-24 | 2019-09-10 | 深圳市元征科技股份有限公司 | 一种线上购物方法和相关装置 |
CN110378781A (zh) * | 2019-06-17 | 2019-10-25 | 深圳壹账通智能科技有限公司 | 数据监控方法、装置、计算机设备和存储介质 |
CN110427971A (zh) * | 2019-07-05 | 2019-11-08 | 五八有限公司 | 用户及ip的识别方法、装置、服务器和存储介质 |
CN110727510A (zh) * | 2019-09-25 | 2020-01-24 | 浙江大搜车软件技术有限公司 | 用户数据处理方法、装置、计算机设备和存储介质 |
CN111079175A (zh) * | 2019-11-26 | 2020-04-28 | 微民保险代理有限公司 | 数据处理方法、装置、计算机可读存储介质和计算机设备 |
CN111224932A (zh) * | 2019-10-15 | 2020-06-02 | 平安科技(深圳)有限公司 | 服务器带外管理系统的用户管理方法及装置 |
CN113535518A (zh) * | 2021-07-23 | 2021-10-22 | 北京八分量信息科技有限公司 | 一种用户行为的分布式实时动态监控方法及系统 |
CN113783828A (zh) * | 2020-11-25 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 一种业务系统监控方法和装置 |
CN114629693A (zh) * | 2022-02-28 | 2022-06-14 | 天翼安全科技有限公司 | 一种可疑宽带账号的识别方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1649311A (zh) * | 2005-03-23 | 2005-08-03 | 北京首信科技有限公司 | 基于机器学习的用户行为异常检测系统和方法 |
CN101692267A (zh) * | 2009-09-15 | 2010-04-07 | 北京大学 | 一种大规模恶意网页检测方法及系统 |
CN102325062A (zh) * | 2011-09-20 | 2012-01-18 | 北京神州绿盟信息安全科技股份有限公司 | 异常登录检测方法及装置 |
US20120131567A1 (en) * | 2010-11-23 | 2012-05-24 | International Business Machines Corporation | Systematic migration of workload based on classification |
CN102685221A (zh) * | 2012-04-29 | 2012-09-19 | 华北电力大学(保定) | 一种状态监测数据的分布式存储与并行挖掘方法 |
CN107395678A (zh) * | 2017-06-22 | 2017-11-24 | 上海斐讯数据通信技术有限公司 | 一种信息管理方法及系统 |
CN107480483A (zh) * | 2016-06-07 | 2017-12-15 | 阿里巴巴集团控股有限公司 | 一种账号检测的方法及装置 |
-
2018
- 2018-05-31 CN CN201810547649.3A patent/CN108769026B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1649311A (zh) * | 2005-03-23 | 2005-08-03 | 北京首信科技有限公司 | 基于机器学习的用户行为异常检测系统和方法 |
CN101692267A (zh) * | 2009-09-15 | 2010-04-07 | 北京大学 | 一种大规模恶意网页检测方法及系统 |
US20120131567A1 (en) * | 2010-11-23 | 2012-05-24 | International Business Machines Corporation | Systematic migration of workload based on classification |
CN102325062A (zh) * | 2011-09-20 | 2012-01-18 | 北京神州绿盟信息安全科技股份有限公司 | 异常登录检测方法及装置 |
CN102685221A (zh) * | 2012-04-29 | 2012-09-19 | 华北电力大学(保定) | 一种状态监测数据的分布式存储与并行挖掘方法 |
CN107480483A (zh) * | 2016-06-07 | 2017-12-15 | 阿里巴巴集团控股有限公司 | 一种账号检测的方法及装置 |
CN107395678A (zh) * | 2017-06-22 | 2017-11-24 | 上海斐讯数据通信技术有限公司 | 一种信息管理方法及系统 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109407997A (zh) * | 2018-11-09 | 2019-03-01 | 长沙理工大学 | 一种数据处理方法、装置、设备及可读存储介质 |
CN110223109A (zh) * | 2019-05-24 | 2019-09-10 | 深圳市元征科技股份有限公司 | 一种线上购物方法和相关装置 |
CN110223109B (zh) * | 2019-05-24 | 2023-09-05 | 深圳市元征科技股份有限公司 | 一种线上购物方法和相关装置 |
CN110378781A (zh) * | 2019-06-17 | 2019-10-25 | 深圳壹账通智能科技有限公司 | 数据监控方法、装置、计算机设备和存储介质 |
CN110427971A (zh) * | 2019-07-05 | 2019-11-08 | 五八有限公司 | 用户及ip的识别方法、装置、服务器和存储介质 |
CN110727510A (zh) * | 2019-09-25 | 2020-01-24 | 浙江大搜车软件技术有限公司 | 用户数据处理方法、装置、计算机设备和存储介质 |
CN111224932A (zh) * | 2019-10-15 | 2020-06-02 | 平安科技(深圳)有限公司 | 服务器带外管理系统的用户管理方法及装置 |
CN111224932B (zh) * | 2019-10-15 | 2022-01-04 | 平安科技(深圳)有限公司 | 服务器带外管理系统的用户管理方法及装置 |
CN111079175A (zh) * | 2019-11-26 | 2020-04-28 | 微民保险代理有限公司 | 数据处理方法、装置、计算机可读存储介质和计算机设备 |
CN113783828A (zh) * | 2020-11-25 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 一种业务系统监控方法和装置 |
CN113535518A (zh) * | 2021-07-23 | 2021-10-22 | 北京八分量信息科技有限公司 | 一种用户行为的分布式实时动态监控方法及系统 |
CN113535518B (zh) * | 2021-07-23 | 2023-12-05 | 北京八分量信息科技有限公司 | 一种用户行为的分布式实时动态监控方法及系统 |
CN114629693A (zh) * | 2022-02-28 | 2022-06-14 | 天翼安全科技有限公司 | 一种可疑宽带账号的识别方法及装置 |
CN114629693B (zh) * | 2022-02-28 | 2023-10-31 | 天翼安全科技有限公司 | 一种可疑宽带账号的识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108769026B (zh) | 2022-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108769026A (zh) | 用户账号检测系统和方法 | |
CN110598845B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN108898418B (zh) | 用户账号检测方法、装置、计算机设备和存储介质 | |
CN109784654B (zh) | 任务生成方法、装置、计算机设备和存储介质 | |
CN110598037A (zh) | 一种图像搜索方法、装置和存储介质 | |
CN110888911A (zh) | 样本数据处理方法、装置、计算机设备及存储介质 | |
CN111008335B (zh) | 一种信息处理方法、装置、设备及存储介质 | |
CN111178949B (zh) | 服务资源匹配参考数据确定方法、装置、设备和存储介质 | |
CN111259952B (zh) | 异常用户识别方法、装置、计算机设备及存储介质 | |
CN108182633B (zh) | 贷款数据处理方法、装置、计算机设备和存储介质 | |
CN107741953A (zh) | 社交平台用户的现实关系匹配方法、装置及可读存储介质 | |
US20230360071A1 (en) | Actionable kpi-driven segmentation | |
CN114722281B (zh) | 基于用户画像及用户选课行为的培训课程配置方法、装置 | |
CN113869931A (zh) | 广告投放策略确定方法、装置、计算机设备和存储介质 | |
US11886597B2 (en) | Detection of common patterns in user generated content with applications in fraud detection | |
CN117151855A (zh) | 欺诈风险预测方法、装置、计算机设备和可读存储介质 | |
CN116798414A (zh) | 通话语音分类方法、装置、计算机设备和存储介质 | |
Jose et al. | Detection of credit card fraud using resampling and boosting technique | |
Xiao et al. | Explainable fraud detection for few labeled time series data | |
CN116029760A (zh) | 消息推送方法、装置、计算机设备和存储介质 | |
CN115907954A (zh) | 账户的识别方法、装置、计算机设备和存储介质 | |
CN111316259A (zh) | 用于反馈和裁定的语义属性的动态合成和瞬时聚簇的系统和方法 | |
CN115293783A (zh) | 风险用户识别方法、装置、计算机设备和存储介质 | |
CN113313505B (zh) | 异常定位方法、装置及计算设备 | |
CN112818235A (zh) | 基于关联特征的违规用户识别方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |