CN110689084A - 一种异常用户识别方法及装置 - Google Patents
一种异常用户识别方法及装置 Download PDFInfo
- Publication number
- CN110689084A CN110689084A CN201910943381.XA CN201910943381A CN110689084A CN 110689084 A CN110689084 A CN 110689084A CN 201910943381 A CN201910943381 A CN 201910943381A CN 110689084 A CN110689084 A CN 110689084A
- Authority
- CN
- China
- Prior art keywords
- user
- network
- information
- abnormal
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 165
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012549 training Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 2
- 206010000117 Abnormal behaviour Diseases 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006399 behavior Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种异常用户识别方法及装置,所述方法包括:获取目标用户及多个历史用户的业务信息;根据所述目标用户及多个历史用户提交的业务信息,确定所述目标用户所属的关联社区网络;基于所述关联社区网络,确定目标用户所属的关联社区网络的网络结构特征向量和异常信息特征向量;利用所述网络结构特征向量和异常信息特征向量,以及训练好的异常网络识别模型,确定所述关联社区网络为异常网络的概率值;若所述概率值大于或等于预设概率值,则确定所述目标用户为异常用户。与现有技术相比,本申请能够在关联用户产生异常行为之前识别异常用户,具有较高的预见性,进而能够提升异常用户识别的准确性。
Description
技术领域
本申请涉及计算机技术领域,尤其是涉及一种异常用户识别方法及装置。
背景技术
目前,在工作与生活中,存在大量需要进行申请的业务,业务的提供方会根据用户提供的业务信息,判断是否需要给申请业务的用户提供业务服务。在这个过程中,通常需要用户提供诸如联系人等信息,用户提供的信息与其他用户相关联,多个用户之间会形成一个关系网络。通常情况下,若申请人所属的关系网络中存在较多异常用户,则业务的申请人也大概率为异常用户。
现有的异常用户识别方法中,通常仅依靠关联用户的行为信息,确定关联用户是否为异常用户,进而判断申请人是否为异常用户,这种方式仅能够在关联用户产生异常行为后进行判断,不能够预先进行异常用户的识别,如何在关联用户发生异常行为之前进行异常用户识别,是一个亟待解决的难题。
发明内容
有鉴于此,本申请的目的在于提供一种异常用户识别方法及装置,通过同时根据目标用户所属的关联社区网络的网络结构特征向量和异常信息特征向量,判断目标用户所属的关联社区网络是否为异常网络,进而判断目标用户是否为异常用户,能够在关联用户产生异常行为之前识别异常用户,具有较高的预见性,进而能够提升异常用户识别的准确性。
本申请实施例提供了一种异常用户识别方法,所述方法包括:
获取目标用户及多个历史用户的业务信息;
根据所述目标用户及多个历史用户提交的业务信息,确定所述目标用户所属的关联社区网络,其中,所述关联社区网络中包括多个用户节点及多个业务节点,每个业务节点中包括一项业务信息,每个用户节点通过连接线和与该用户节点相关联的业务节点连接,所述连接线中储存有与其对应的用户节点和业务节点之间的关联信息;
基于所述关联社区网络,确定目标用户所属的关联社区网络的网络结构特征向量和异常信息特征向量;
利用所述网络结构特征向量和异常信息特征向量,以及训练好的异常网络识别模型,确定所述关联社区网络为异常网络的概率值;
若所述概率值大于或等于预设概率值,则确定所述目标用户为异常用户。
在一种可能的实施方式中,所述根据所述目标用户及多个历史用户提交的业务信息,确定所述目标用户所属的关联社区网络,包括:
基于所述目标用户和多个历史用户提交的业务信息,以及每个业务信息与目标用户及多个历史用户之间的关系,生成用户异构信息网络,所述用户异构信息网络包括多个用户节点与多个业务节点,每个用户节点通过连接线和与该用户节点相关联的业务节点连接,所述用户异构信息网络根据所述用户节点之间的连接关系划分为多个子信息网络;
根据所述用户异构信息网络中,每两个相邻用户节点之间的距离,以及每个子信息网络中的用户节点数量,将用户节点数量大于预设阈值的子信息网络切分成多个用户节点数量小于或等于预设阈值的子信息网络;
确定所述目标用户对应的用户节点所属的子信息网络为所述目标用户所属的关联社区网络。
在一种可能的实施方式中,所述基于所述关联社区网络,确定目标用户所属的关联社区网络的网络结构特征向量和异常信息特征向量,包括:
基于每个用户节点、每个业务节点中的所述业务信息及每条连接线中的所述关联信息,确定所述关联社区网络中的异常业务节点,并根据所述异常业务节点中的业务信息确定所述异常信息特征向量;
对所述关联社区网络进行嵌入处理,得到所述网络结构特征向量。
在一种可能的实施方式中,所述方法还包括训练所述异常网络识别模型的步骤:
基于多个历史用户的业务信息,生成多个关联社区网络样本,并确定每个关联社区网络样本的网络结构特征向量样本及异常信息特征向量样本;
针对每个关联社区网络样本,基于该关联社区网络样本中每个用户节点对应的用户的业务状态,确定该关联社区网络样本的状态标签;
利用每个关联社区网络的状态标签、网络结构特征向量样本及异常信息特征向量样本,训练所述异常网络识别模型。
在一种可能的实施方式中,所述基于该关联社区网络样本中每个用户节点对应的用户的业务状态,确定该关联社区网络样本的状态标签,包括:
基于每个业务状态对应的状态权重,确定该关联社区网络样本的平均状态权重;
基于所述平均状态权重,确定该关联社区网络样本的状态标签。
本申请实施例还提供了一种异常用户识别装置,所述装置包括:
获取模块,用于获取目标用户及多个历史用户的业务信息;
第一确定模块,用于根据所述目标用户及多个历史用户提交的业务信息,确定所述目标用户所属的关联社区网络,其中,所述关联社区网络中包括多个用户节点及多个业务节点,每个业务节点中包括一项业务信息,每个用户节点通过连接线和与该用户节点相关联的业务节点连接,所述连接线中储存有与其对应的用户节点和业务节点之间的关联信息;
第二确定模块,用于基于所述关联社区网络,确定目标用户所属的关联社区网络的网络结构特征向量和异常信息特征向量;
第三确定模块,用于利用所述网络结构特征向量和异常信息特征向量,以及训练好的异常网络识别模型,确定所述关联社区网络为异常网络的概率值;
第四确定模块,用于在所述概率值大于或等于预设概率值时,确定所述目标用户为异常用户。
在一种可能的实施方式中,所述第一确定模块包括:
生成单元,用于基于所述目标用户和多个历史用户提交的业务信息,以及每个业务信息与目标用户及多个历史用户之间的关系,生成用户异构信息网络,所述用户异构信息网络包括多个用户节点与多个业务节点,每个用户节点通过连接线和与该用户节点相关联的业务节点连接,所述用户异构信息网络根据所述用户节点之间的连接关系划分为多个子信息网络;
切分单元,用于根据所述用户异构信息网络中,每两个相邻用户节点之间的距离,以及每个子信息网络中的用户节点数量,将用户节点数量大于预设阈值的子信息网络切分成多个用户节点数量小于或等于预设阈值的子信息网络;
确定单元,用于确定所述目标用户对应的用户节点所属的子信息网络为所述目标用户所属的关联社区网络。
在一种可能的实施方式中,所述装置还包括模型训练模块,所述模型训练模块用于:
基于多个历史用户的业务信息,生成多个关联社区网络样本,并确定每个关联社区网络样本的网络结构特征向量样本及异常信息特征向量样本;
针对每个关联社区网络样本,基于该关联社区网络样本中每个用户节点对应的用户的业务状态,确定该关联社区网络样本的状态标签;
利用每个关联社区网络的状态标签、网络结构特征向量样本及异常信息特征向量样本,训练所述异常网络识别模型。
在一种可能的实施方式中,所述第二确定模块具体用于:
基于每个用户节点、每个业务节点中的所述业务信息及每条连接线中的所述关联信息,确定所述关联社区网络中的异常业务节点,并根据所述异常业务节点中的业务信息确定所述异常信息特征向量;
对所述关联社区网络进行嵌入处理,得到所述网络结构特征向量。
在一种可能的实施方式中,所述模型训练模块在基于该关联社区网络样本中每个用户节点对应的用户的业务状态,确定该关联社区网络样本的状态标签时,具体用于:
基于每个业务状态对应的状态权重,确定该关联社区网络样本的平均状态权重;
基于所述平均状态权重,确定该关联社区网络样本的状态标签。
本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的异常用户识别方法的步骤。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的异常用户识别方法的步骤。
本申请实施例提供的异常用户识别方法及装置,获取目标用户及多个历史用户的业务信息;根据所述目标用户及多个历史用户提交的业务信息,确定所述目标用户所属的关联社区网络;基于所述关联社区网络,确定目标用户所属的关联社区网络的网络结构特征向量和异常信息特征向量;利用所述网络结构特征向量和异常信息特征向量,以及训练好的异常网络识别模型,确定所述关联社区网络为异常网络的概率值;若所述概率值大于或等于预设概率值,则确定所述目标用户为异常用户。与现有技术相比,本申请能够在关联用户产生异常行为之前识别异常用户,具有较高的预见性,进而能够提升异常用户识别的准确性。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种异常用户识别方法的流程图;
图2示出了本申请实施例所提供的另一种异常用户识别方法的流程图;
图3示出了本申请实施例所提供的一种异常用户识别装置的结构示意图之一;
图4示出了本申请实施例所提供的一种异常用户识别装置的结构示意图之二;
图5示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
经研究发现,现有的异常用户识别方法中,通常仅依靠关联用户的行为信息,确定关联用户是否为异常用户,进而判断申请人是否为异常用户,这种方式仅能够在关联用户产生异常行为后进行判断,不能够预先进行异常用户的识别,如何在关联用户发生异常行为之前进行异常用户识别,是一个亟待解决的难题。
基于此,本申请实施例提供了一种异常用户识别方法,通过同时根据目标用户所属的关联社区网络的网络结构特征向量和异常信息特征向量,判断目标用户所属的关联社区网络是否为异常网络,进而判断目标用户是否为异常用户,能够在关联用户产生异常行为之前识别异常用户,具有较高的预见性,进而能够提升异常用户识别的准确性。
请参阅图1,图1为本申请实施例所提供的一种异常用户识别方法的流程图。如图1中所示,本申请实施例提供的异常用户识别方法,包括:
S101、获取目标用户及多个历史用户的业务信息。
该步骤中,用户在办理业务时需要提交业务信息,以使业务提供方能够根据业务信息判断用户是否为异常用户,业务信息可以包括用户的个人信用信息、联系人信息、人口统计信息、工作信息、设备信息及业务的状态信息等。
S102、根据所述目标用户及多个历史用户提交的业务信息,确定所述目标用户所属的关联社区网络。
其中,所述关联社区网络中包括多个用户节点及多个业务节点,每个业务节点中包括一项业务信息,每个用户节点通过连接线和与该用户节点相关联的业务节点连接,所述连接线中储存有与其对应的用户节点和业务节点之间的关联信息。
该步骤中,可以先根据目标用户及多个历史用户提交的业务信息,建立用户异构信息网络,用户异构信息网络中包括有多个用户节点及多个业务节点,每个用户节点代表一个用户,业务节点可以包括地址节点、电话节点、公司节点、设备节点等,每个业务节点中储存有用户在办理业务时提交的业务信息,或用户在办理业务期间产生的业务信息,用户节点和业务节点通过连接线连接,连接线中储存有用户与业务信息之间的相关属性,例如,用户A在办理业务时填写的联系人为B,联系人电话为a,则在用户异构信息网络中,代表用户A的用户节点与储存有a的业务节点通过连接线L相连,L中储存的关系类型为联系人,关联属性包括联系人姓名,储存有a的业务节点还可以通过连接线M与代表用户B的用户节点连接,M中储存的信息可以为用户电话。
这里,生成的用户异构信息网络中存在多个大型连通网络和小型连通网络,在连通网络中,用户节点通过业务节点及连接线连接,为了使各个连通网络内部的联系更真实、紧密,可以将大型的连通网络进行切分,使其变为多个小型的连通网络,包含目标用户对应的用户节点的连通网络,即为上述关联社区网络。
S103、基于所述关联社区网络,确定目标用户所属的关联社区网络的网络结构特征向量和异常信息特征向量。
该步骤中,可以确定出关联社区网络中储存的异常业务信息,如不同用户提交的联系人电话相同,联系人姓名却不同,公司电话相同,公司名称却不同的业务信息,并将这些异常的业务信息使用向量表示,得到异常信息特征向量,再将关联社区网络的结构特征通过向量表示,得到网络结构特征向量。
需要注意的是,异常用户所属的关联社区网络通常具有相似的结构特征,在既考虑目标用户所属的关联社区网络中用户的业务行为,又考虑关联社区网络的结构特征后,能够在用户发生异常业务行为之前,识别异常用户,具有较好的预见性。
S104、利用所述网络结构特征向量和异常信息特征向量,以及训练好的异常网络识别模型,确定所述关联社区网络为异常网络的概率值。
具体的,可以将网络结构特征向量和异常信息特征向量输入进异常网络识别模型中,异常网络识别模型经过计算后输出关联社区网络为异常网络的概率值。
S105、若所述概率值大于或等于预设概率值,则确定所述目标用户为异常用户。
请参阅图2,图2为本申请另一实施例提供的异常用户识别方法的流程图。如图2中所示,本申请实施例提供的异常用户识别方法,包括:
S201、获取目标用户及多个历史用户的业务信息。
S202、根据所述目标用户及多个历史用户提交的业务信息,确定所述目标用户所属的关联社区网络。
S203、基于每个用户节点、每个业务节点中的所述业务信息及每条连接线中的所述关联信息,确定所述关联社区网络中的异常业务节点,并根据所述异常业务节点中的业务信息确定所述异常信息特征向量。
该步骤中,可以将与其他业务信息存在逻辑错误的业务信息对应的业务节点作为异常业务节点,并将这些业务信息通过向量的方式表示,得到异常信息特征向量。
S204、对所述关联社区网络进行嵌入处理,得到所述网络结构特征向量。
具体的,可以使用Graph2vec算法对关联社区网络做嵌入处理,生成网络结构特征向量,其中可以包括关联社区网络中用户节点的属性特征、设备特征、时间特征及行为特征等。
S205、利用所述网络结构特征向量和异常信息特征向量,以及训练好的异常网络识别模型,确定所述关联社区网络为异常网络的概率值。
S206、若所述概率值大于或等于预设概率值,则确定所述目标用户为异常用户。
其中,S201、S202、S205及S206的描述可以参照S101、S102、S104及S105的描述,并且能达到相同的技术效果,对此不做赘述。
在一种可能的实施方式中,所述根据所述目标用户及多个历史用户提交的业务信息,确定所述目标用户所属的关联社区网络,包括:
基于所述目标用户和多个历史用户提交的业务信息,以及每个业务信息与目标用户及多个历史用户之间的关系,生成用户异构信息网络,所述用户异构信息网络包括多个用户节点与多个业务节点,每个用户节点通过连接线和与该用户节点相关联的业务节点连接,所述用户异构信息网络根据所述用户节点之间的连接关系划分为多个子信息网络;
根据所述用户异构信息网络中,每两个相邻用户节点之间的距离,以及每个子信息网络中的用户节点数量,将用户节点数量大于预设阈值的子信息网络切分成多个用户节点数量小于或等于预设阈值的子信息网络;
确定所述目标用户对应的用户节点所属的子信息网络为所述目标用户所属的关联社区网络。
具体的,可以使用社区发现算法,如K-Clique、Louvain等,将用户节点数量大于预设阈值的子信息网络切分成多个用户节点数量小于或等于预设阈值的子信息网络。
其中,子信息网络即为上述的连通网络。具体的,大型连通网络可以包括超过50个用户节点,小型连通网络可以包括2至50个用户节点。
在一种可能的实施方式中,所述方法还包括训练所述异常网络识别模型的步骤:
基于多个历史用户的业务信息,生成多个关联社区网络样本,并确定每个关联社区网络样本的网络结构特征向量样本及异常信息特征向量样本;
针对每个关联社区网络样本,基于该关联社区网络样本中每个用户节点对应的用户的业务状态,确定该关联社区网络样本的状态标签;
利用每个关联社区网络的状态标签、网络结构特征向量样本及异常信息特征向量样本,训练所述异常网络识别模型。
该步骤中,生成关联社区网络样本,并确定每个关联社区网络样本的网络结构特征向量样本及异常信息特征向量样本的步骤可以参考生成关联社区网络,并确定每个关联社区网络的网络结构特征向量及异常信息特征向量的步骤,在此不再赘述。
进一步的,关联社区网络样本的状态标签即为关联社区网络样本是否为异常关联社区网络的真值,具体的,可以根据每个用户的业务状态来确定。
在一种可能的实施方式中,所述基于该关联社区网络样本中每个用户节点对应的用户的业务状态,确定该关联社区网络样本的状态标签,包括:
基于每个业务状态对应的状态权重,确定该关联社区网络样本的平均状态权重;
基于所述平均状态权重,确定该关联社区网络样本的状态标签。
该步骤中,不同的业务状态对应不同的状态权重,越接近异常的业务状态可以对应越大的状态权重,具体的,可以计算关联社区网络样本中所有用户节点对应的状态权重的平均值,在该平均值大于或等于预设阈值时,即可确定该关联社区网络样本为异常网络,反之则确定其为正常网络,并为其添加对应的状态标签。
本申请实施例提供的异常用户识别方法,获取目标用户及多个历史用户的业务信息;根据所述目标用户及多个历史用户提交的业务信息,确定所述目标用户所属的关联社区网络;基于所述关联社区网络,确定目标用户所属的关联社区网络的网络结构特征向量和异常信息特征向量;利用所述网络结构特征向量和异常信息特征向量,以及训练好的异常网络识别模型,确定所述关联社区网络为异常网络的概率值;若所述概率值大于或等于预设概率值,则确定所述目标用户为异常用户。与现有技术相比,本申请能够在关联用户产生异常行为之前识别异常用户,具有较高的预见性,进而能够提升异常用户识别的准确性。
请参阅图3、图4,图3为本申请实施例所提供的一种异常用户识别装置的结构示意图之一,图4为本申请实施例所提供的一种异常用户识别装置的结构示意图之二。如图3中所示,所述异常用户识别装置300包括:
获取模块310,用于获取目标用户及多个历史用户的业务信息;
第一确定模块320,用于根据所述目标用户及多个历史用户提交的业务信息,确定所述目标用户所属的关联社区网络,其中,所述关联社区网络中包括多个用户节点及多个业务节点,每个业务节点中包括一项业务信息,每个用户节点通过连接线和与该用户节点相关联的业务节点连接,所述连接线中储存有与其对应的用户节点和业务节点之间的关联信息;
第二确定模块330,用于基于所述关联社区网络,确定目标用户所属的关联社区网络的网络结构特征向量和异常信息特征向量;
第三确定模块340,用于利用所述网络结构特征向量和异常信息特征向量,以及训练好的异常网络识别模型,确定所述关联社区网络为异常网络的概率值;
第四确定模块350,用于在所述概率值大于或等于预设概率值时,确定所述目标用户为异常用户。
进一步的,如图4所示,所述第一确定模块320包括:
生成单元321,用于基于所述目标用户和多个历史用户提交的业务信息,以及每个业务信息与目标用户及多个历史用户之间的关系,生成用户异构信息网络,所述用户异构信息网络包括多个用户节点与多个业务节点,每个用户节点通过连接线和与该用户节点相关联的业务节点连接,所述用户异构信息网络根据所述用户节点之间的连接关系划分为多个子信息网络;
切分单元322,用于根据所述用户异构信息网络中,每两个相邻用户节点之间的距离,以及每个子信息网络中的用户节点数量,将用户节点数量大于预设阈值的子信息网络切分成多个用户节点数量小于或等于预设阈值的子信息网络;
确定单元323,用于确定所述目标用户对应的用户节点所属的子信息网络为所述目标用户所属的关联社区网络。
在一种可能的实施方式中,所述异常用户识别装置300还包括模型训练模块360,所述模型训练模块360用于:
基于多个历史用户的业务信息,生成多个关联社区网络样本,并确定每个关联社区网络样本的网络结构特征向量样本及异常信息特征向量样本;
针对每个关联社区网络样本,基于该关联社区网络样本中每个用户节点对应的用户的业务状态,确定该关联社区网络样本的状态标签;
利用每个关联社区网络的状态标签、网络结构特征向量样本及异常信息特征向量样本,训练所述异常网络识别模型。
在一种可能的实施方式中,所述第二确定模块330具体用于:
基于每个用户节点、每个业务节点中的所述业务信息及每条连接线中的所述关联信息,确定所述关联社区网络中的异常业务节点,并根据所述异常业务节点中的业务信息确定所述异常信息特征向量;
对所述关联社区网络进行嵌入处理,得到所述网络结构特征向量。
在一种可能的实施方式中,所述模型训练模块360在基于该关联社区网络样本中每个用户节点对应的用户的业务状态,确定该关联社区网络样本的状态标签时,具体用于:
基于每个业务状态对应的状态权重,确定该关联社区网络样本的平均状态权重;
基于所述平均状态权重,确定该关联社区网络样本的状态标签。
本申请实施例提供的异常用户识别装置,获取目标用户及多个历史用户的业务信息;根据所述目标用户及多个历史用户提交的业务信息,确定所述目标用户所属的关联社区网络;基于所述关联社区网络,确定目标用户所属的关联社区网络的网络结构特征向量和异常信息特征向量;利用所述网络结构特征向量和异常信息特征向量,以及训练好的异常网络识别模型,确定所述关联社区网络为异常网络的概率值;若所述概率值大于或等于预设概率值,则确定所述目标用户为异常用户。与现有技术相比,本申请能够在关联用户产生异常行为之前识别异常用户,具有较高的预见性,进而能够提升异常用户识别的准确性。
请参阅图5,图5为本申请实施例所提供的一种电子设备的结构示意图。如图5中所示,所述电子设备500包括处理器510、存储器520和总线530。
所述存储器520存储有所述处理器510可执行的机器可读指令,当电子设备500运行时,所述处理器510与所述存储器520之间通过总线530通信,所述机器可读指令被所述处理器510执行时,可以执行如上述图1以及图2所示方法实施例中的异常用户识别方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1以及图2所示方法实施例中的异常用户识别方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种异常用户识别方法,其特征在于,所述方法包括:
获取目标用户及多个历史用户的业务信息;
根据所述目标用户及多个历史用户提交的业务信息,确定所述目标用户所属的关联社区网络,其中,所述关联社区网络中包括多个用户节点及多个业务节点,每个业务节点中包括一项业务信息,每个用户节点通过连接线和与该用户节点相关联的业务节点连接,所述连接线中储存有与其对应的用户节点和业务节点之间的关联信息;
基于所述关联社区网络,确定目标用户所属的关联社区网络的网络结构特征向量和异常信息特征向量;
利用所述网络结构特征向量和异常信息特征向量,以及训练好的异常网络识别模型,确定所述关联社区网络为异常网络的概率值;
若所述概率值大于或等于预设概率值,则确定所述目标用户为异常用户。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户及多个历史用户提交的业务信息,确定所述目标用户所属的关联社区网络,包括:
基于所述目标用户和多个历史用户提交的业务信息,以及每个业务信息与目标用户及多个历史用户之间的关系,生成用户异构信息网络,所述用户异构信息网络包括多个用户节点与多个业务节点,每个用户节点通过连接线和与该用户节点相关联的业务节点连接,所述用户异构信息网络根据所述用户节点之间的连接关系划分为多个子信息网络;
根据所述用户异构信息网络中,每两个相邻用户节点之间的距离,以及每个子信息网络中的用户节点数量,将用户节点数量大于预设阈值的子信息网络切分成多个用户节点数量小于或等于预设阈值的子信息网络;
确定所述目标用户对应的用户节点所属的子信息网络为所述目标用户所属的关联社区网络。
3.根据权利要求1所述的方法,其特征在于,所述基于所述关联社区网络,确定目标用户所属的关联社区网络的网络结构特征向量和异常信息特征向量,包括:
基于每个用户节点、每个业务节点中的所述业务信息及每条连接线中的所述关联信息,确定所述关联社区网络中的异常业务节点,并根据所述异常业务节点中的业务信息确定所述异常信息特征向量;
对所述关联社区网络进行嵌入处理,得到所述网络结构特征向量。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括训练所述异常网络识别模型的步骤:
基于多个历史用户的业务信息,生成多个关联社区网络样本,并确定每个关联社区网络样本的网络结构特征向量样本及异常信息特征向量样本;
针对每个关联社区网络样本,基于该关联社区网络样本中每个用户节点对应的用户的业务状态,确定该关联社区网络样本的状态标签;
利用每个关联社区网络的状态标签、网络结构特征向量样本及异常信息特征向量样本,训练所述异常网络识别模型。
5.根据权利要求4所述的方法,其特征在于,所述基于该关联社区网络样本中每个用户节点对应的用户的业务状态,确定该关联社区网络样本的状态标签,包括:
基于每个业务状态对应的状态权重,确定该关联社区网络样本的平均状态权重;
基于所述平均状态权重,确定该关联社区网络样本的状态标签。
6.一种异常用户识别装置,其特征在于,包括:
获取模块,用于获取目标用户及多个历史用户的业务信息;
第一确定模块,用于根据所述目标用户及多个历史用户提交的业务信息,确定所述目标用户所属的关联社区网络,其中,所述关联社区网络中包括多个用户节点及多个业务节点,每个业务节点中包括一项业务信息,每个用户节点通过连接线和与该用户节点相关联的业务节点连接,所述连接线中储存有与其对应的用户节点和业务节点之间的关联信息;
第二确定模块,用于基于所述关联社区网络,确定目标用户所属的关联社区网络的网络结构特征向量和异常信息特征向量;
第三确定模块,用于利用所述网络结构特征向量和异常信息特征向量,以及训练好的异常网络识别模型,确定所述关联社区网络为异常网络的概率值;
第四确定模块,用于在所述概率值大于或等于预设概率值时,确定所述目标用户为异常用户。
7.根据权利要求6所述的装置,其特征在于,所述第一确定模块包括:
生成单元,用于基于所述目标用户和多个历史用户提交的业务信息,以及每个业务信息与目标用户及多个历史用户之间的关系,生成用户异构信息网络,所述用户异构信息网络包括多个用户节点与多个业务节点,每个用户节点通过连接线和与该用户节点相关联的业务节点连接,所述用户异构信息网络根据所述用户节点之间的连接关系划分为多个子信息网络;
切分单元,用于根据所述用户异构信息网络中,每两个相邻用户节点之间的距离,以及每个子信息网络中的用户节点数量,将用户节点数量大于预设阈值的子信息网络切分成多个用户节点数量小于或等于预设阈值的子信息网络;
确定单元,用于确定所述目标用户对应的用户节点所属的子信息网络为所述目标用户所属的关联社区网络。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括模型训练模块,所述模型训练模块用于:
基于多个历史用户的业务信息,生成多个关联社区网络样本,并确定每个关联社区网络样本的网络结构特征向量样本及异常信息特征向量样本;
针对每个关联社区网络样本,基于该关联社区网络样本中每个用户节点对应的用户的业务状态,确定该关联社区网络样本的状态标签;
利用每个关联社区网络的状态标签、网络结构特征向量样本及异常信息特征向量样本,训练所述异常网络识别模型。
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至5任一所述的异常用户识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至5任一所述的异常用户识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910943381.XA CN110689084B (zh) | 2019-09-30 | 2019-09-30 | 一种异常用户识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910943381.XA CN110689084B (zh) | 2019-09-30 | 2019-09-30 | 一种异常用户识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110689084A true CN110689084A (zh) | 2020-01-14 |
CN110689084B CN110689084B (zh) | 2022-03-01 |
Family
ID=69111322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910943381.XA Active CN110689084B (zh) | 2019-09-30 | 2019-09-30 | 一种异常用户识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110689084B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111091393A (zh) * | 2019-11-26 | 2020-05-01 | 北京摩拜科技有限公司 | 异常账号识别方法、装置及电子设备 |
CN111339436A (zh) * | 2020-02-11 | 2020-06-26 | 腾讯科技(深圳)有限公司 | 一种数据识别方法、装置、设备以及可读存储介质 |
CN111401478A (zh) * | 2020-04-17 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 数据异常识别方法以及装置 |
CN113946758A (zh) * | 2020-06-30 | 2022-01-18 | 腾讯科技(深圳)有限公司 | 一种数据识别方法、装置、设备及可读存储介质 |
CN115102758A (zh) * | 2022-06-21 | 2022-09-23 | 新余学院 | 异常网络流量的检测方法、装置、设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1859224A (zh) * | 2005-12-31 | 2006-11-08 | 华为技术有限公司 | 一种业务行为异常处理方法及系统 |
CN104734868A (zh) * | 2013-12-19 | 2015-06-24 | 中兴通讯股份有限公司 | 业务节点间业务处理方法及装置 |
CN107093090A (zh) * | 2016-10-25 | 2017-08-25 | 北京小度信息科技有限公司 | 异常用户识别方法及装置 |
CN107590504A (zh) * | 2017-07-31 | 2018-01-16 | 阿里巴巴集团控股有限公司 | 异常主体识别方法和装置、服务器 |
CN109344326A (zh) * | 2018-09-11 | 2019-02-15 | 阿里巴巴集团控股有限公司 | 一种社交圈的挖掘方法和装置 |
CN109410036A (zh) * | 2018-10-09 | 2019-03-01 | 北京芯盾时代科技有限公司 | 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置 |
CN109450920A (zh) * | 2018-11-29 | 2019-03-08 | 北京奇艺世纪科技有限公司 | 一种异常账号检测方法及装置 |
CN109905411A (zh) * | 2019-04-25 | 2019-06-18 | 北京腾云天下科技有限公司 | 一种异常用户识别方法、装置和计算设备 |
-
2019
- 2019-09-30 CN CN201910943381.XA patent/CN110689084B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1859224A (zh) * | 2005-12-31 | 2006-11-08 | 华为技术有限公司 | 一种业务行为异常处理方法及系统 |
CN104734868A (zh) * | 2013-12-19 | 2015-06-24 | 中兴通讯股份有限公司 | 业务节点间业务处理方法及装置 |
WO2015090027A1 (zh) * | 2013-12-19 | 2015-06-25 | 中兴通讯股份有限公司 | 业务节点间业务处理方法及装置 |
CN107093090A (zh) * | 2016-10-25 | 2017-08-25 | 北京小度信息科技有限公司 | 异常用户识别方法及装置 |
CN107590504A (zh) * | 2017-07-31 | 2018-01-16 | 阿里巴巴集团控股有限公司 | 异常主体识别方法和装置、服务器 |
CN109344326A (zh) * | 2018-09-11 | 2019-02-15 | 阿里巴巴集团控股有限公司 | 一种社交圈的挖掘方法和装置 |
CN109410036A (zh) * | 2018-10-09 | 2019-03-01 | 北京芯盾时代科技有限公司 | 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置 |
CN109450920A (zh) * | 2018-11-29 | 2019-03-08 | 北京奇艺世纪科技有限公司 | 一种异常账号检测方法及装置 |
CN109905411A (zh) * | 2019-04-25 | 2019-06-18 | 北京腾云天下科技有限公司 | 一种异常用户识别方法、装置和计算设备 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111091393A (zh) * | 2019-11-26 | 2020-05-01 | 北京摩拜科技有限公司 | 异常账号识别方法、装置及电子设备 |
CN111091393B (zh) * | 2019-11-26 | 2023-09-05 | 汉海信息技术(上海)有限公司 | 异常账号识别方法、装置及电子设备 |
CN111339436A (zh) * | 2020-02-11 | 2020-06-26 | 腾讯科技(深圳)有限公司 | 一种数据识别方法、装置、设备以及可读存储介质 |
CN111339436B (zh) * | 2020-02-11 | 2021-05-28 | 腾讯科技(深圳)有限公司 | 一种数据识别方法、装置、设备以及可读存储介质 |
CN111401478A (zh) * | 2020-04-17 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 数据异常识别方法以及装置 |
CN113946758A (zh) * | 2020-06-30 | 2022-01-18 | 腾讯科技(深圳)有限公司 | 一种数据识别方法、装置、设备及可读存储介质 |
CN113946758B (zh) * | 2020-06-30 | 2023-09-19 | 腾讯科技(深圳)有限公司 | 一种数据识别方法、装置、设备及可读存储介质 |
CN115102758A (zh) * | 2022-06-21 | 2022-09-23 | 新余学院 | 异常网络流量的检测方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110689084B (zh) | 2022-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110689084B (zh) | 一种异常用户识别方法及装置 | |
KR102151862B1 (ko) | 서비스 처리 방법 및 장치 | |
CN109347827B (zh) | 网络攻击行为预测的方法、装置、设备及存储介质 | |
CN110287688B (zh) | 关联账号分析方法、装置和计算机可读存储介质 | |
CN111553488B (zh) | 一种针对用户行为的风险识别模型训练方法及系统 | |
CN113010896B (zh) | 确定异常对象的方法、装置、设备、介质和程序产品 | |
CN108734304B (zh) | 一种数据模型的训练方法、装置、及计算机设备 | |
CN111090807B (zh) | 一种基于知识图谱的用户识别方法及装置 | |
CN112435137B (zh) | 一种基于社团挖掘的欺诈信息检测方法及系统 | |
CN110224859B (zh) | 用于识别团伙的方法和系统 | |
CN111078742B (zh) | 用户分类模型训练方法、用户分类方法及装置 | |
CN111612085B (zh) | 一种对等组中异常点的检测方法及装置 | |
CN112328802A (zh) | 数据处理方法、装置和服务器 | |
CN115883187A (zh) | 网络流量数据中的异常信息识别方法、装置、设备和介质 | |
CN111078560B (zh) | 基于流量剪枝的测试方法、装置、电子设备及存储介质 | |
CN110781410A (zh) | 一种社群检测方法及装置 | |
CN115208938B (zh) | 用户行为管控方法及装置、计算机可读存储介质 | |
CN111210279B (zh) | 一种目标用户预测方法、装置和电子设备 | |
CN115358772A (zh) | 一种交易风险预测方法、装置、存储介质及计算机设备 | |
CN110830314B (zh) | 一种异常流量的确定方法及装置 | |
CN111985979A (zh) | 用于广告业务中的无效流量信息处理的方法和装置 | |
CN113194039B (zh) | 系统数据流量的切分方法和装置、电子设备和存储介质 | |
CN112785315B (zh) | 批量注册识别方法及装置 | |
CN110781439A (zh) | 一种确定多级转发关系的方法、装置、设备及存储介质 | |
CN113781156A (zh) | 恶意订单的识别方法、模型的训练方法、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |