CN110717805A - 一种识别风险用户的方法、服务器及可读存储介质 - Google Patents

一种识别风险用户的方法、服务器及可读存储介质 Download PDF

Info

Publication number
CN110717805A
CN110717805A CN201910812865.0A CN201910812865A CN110717805A CN 110717805 A CN110717805 A CN 110717805A CN 201910812865 A CN201910812865 A CN 201910812865A CN 110717805 A CN110717805 A CN 110717805A
Authority
CN
China
Prior art keywords
transaction
group
risk
user
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910812865.0A
Other languages
English (en)
Inventor
李�真
汤敏伟
王家辉
王志宏
过弋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China University of Science and Technology
Tianyi Electronic Commerce Co Ltd
Original Assignee
East China University of Science and Technology
Tianyi Electronic Commerce Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China University of Science and Technology, Tianyi Electronic Commerce Co Ltd filed Critical East China University of Science and Technology
Priority to CN201910812865.0A priority Critical patent/CN110717805A/zh
Publication of CN110717805A publication Critical patent/CN110717805A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0609Buyer or seller confidence or verification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Abstract

本发明实施例涉及互联网技术领域,公开了一种识别风险用户的方法、服务器及可读存储介质。本发明中,获取关联图,关联图用于指示在交易过程中各所述交易对象之间的可达距离;根据关联图中每两个交易对象之间的可达距离,将关联图中的交易对象划分为N个群组,N为大于1的整数;根据每个群组内交易对象的标注信息,确定每个群组各自对应的风险概率;根据每个群组各自对应的风险概率,识别关联图中属于风险用户的交易对象。本实施方式,使得可以准确识别出风险用户,优化整个网络交易的交易环境。

Description

一种识别风险用户的方法、服务器及可读存储介质
技术领域
本发明实施例涉及互联网技术领域,特别涉及一种识别风险用户的方法、服务器及可读存储介质。
背景技术
随着电商时代的来临,电商的用户量、交易额逐年提升,同时电子商务中的欺诈行为也随着合法用户数量的增加而增加。各大电商平台均不定期得推出各种代金券,立返,立减等优惠活动,以鼓励用户消费、提升用户黏性,然而不少不法分子利用各种不法手段来骗取支付平台所提供的各类优惠活动的资金,最终导致营销资金未发挥其应有的价值,欺诈方式有多种,例如,用户A在平台上领取了一张满50元减30元的优惠券,该用户A使用该优惠券在虚假商户的商店内购买50元的物品,用户A实际支付20元,平台支付30元,虚假商户实际收到50元,之后该虚假商户通过其他转账方式返还用户A20元,则在此次交易中,该虚假商户将获利30元,而平台则亏损30元。
因此,实施欺诈行为的用户的风险度高,称为风险用户;检测风险用户是十分必要的,可以减少在电商交易中的欺诈行为的发生,优化整个电商的交易环境。
发明人发现相关技术中至少存在如下问题:目前通常可以利用监督学习的训练方式,获得检测模型,该训练方法十分依赖于训练数据,训练数据为带有标签的用户数据,标签用于指示该用户是否为风险用户,而标签通常是人工基于电商提供的黑名单用户进行标注的,标注原则为:黑名单中的用户标注为风险用户,除黑名单中之外的用户可以标注为普通用户或者未知用户,但是,标注的数据并不一定准确,这将导致训练得到的模型的检测不准确;还有一种方式是无监督学习的训练方式,该方式并不需要使用训练数据中的标签,但是,由于风险用户会极力伪装自己,该方式的识别效果并不理想。
发明内容
本发明实施方式的目的在于提供一种识别风险用户的方法、服务器及可读存储介质,使得可以准确识别出风险用户,优化整个网络交易的交易环境。
为解决上述技术问题,本发明的实施方式提供了一种识别风险用户的方法,包括:获取关联图,关联图用于指示在交易过程中各交易对象之间的可达距离;根据关联图中每两个交易对象之间的可达距离,将关联图中的交易对象划分为N个群组,N为大于1的整数;根据每个群组内交易对象的标注信息,确定每个群组各自对应的风险概率;根据每个群组各自对应的风险概率,识别关联图中属于风险用户的交易对象。
发明的实施方式还提供了一种服务器,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的识别风险用户的方法。
发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述的识别风险用户的方法。
本发明实施方式相对于现有技术而言,由于在网络交易中通常是以团伙作案的方式进行欺诈,若仅利用单个交易对象的交易数据识别风险用户,导致识别风险用户的准确率低;本实施方式中通过该关联图中每两个交易对象之间的可达距离,可以快速将该关联图中的交易对象划分为N个群组,由于关联图指示了在交易过程中各交易对象之间的可达距离,且由于两个交易对象之间的距离大小可以反应两个交易对象在交易中的紧密程度,因而通过两个交易对象之间的可达距离可以合理的进行群组的划分;由于考虑了团伙作案的风险概率,将关联紧密度相近的交易对象之间划分在一个群组,从而根据群组的风险概率,可以准确地识别出风险用户,优化整个网络交易的交易环境。
另外,根据关联图中每两个交易对象之间的可达距离,将关联图中的交易对象划分为N个群组,具体包括:获取关联图中所有的交易对象,并汇集所有的交易对象构成第一交易对象集合;在一次群组划分中进行如下处理:从所述第一交易对象集合中选取一个所述交易对象作为起始交易对象;将关联图中满足群组划分条件的交易对象划分为同一个群组,群组划分条件为与起始交易对象的可达距离小于或等于预设可达距离的交易对象;从第一交易对象集合中删除属于群组的交易对象;判断第一交易对象集合是否为空,若不为空,则进行下一次群组划分,若为空,停止群组划分的过程。在进行群组划分的时,根据与该起始交易对象之间的可达距离可以快速划分出群组,另外在第一交易对象集合为空时结束群组的划分,也可以避免漏出现交易对象被漏划分的问题,减小划分群组的复杂度。
另外,从第一交易对象集合中选取一个交易对象作为起始交易对象,具体包括:从第一交易对象集合中选取度中心性最小的交易对象,作为起始交易对象。由于交易对象的度中心性越小,表明该交易对象与其它交易对象之间的关联越小,则该交易对象为正常用户的概率越高,优先划分出度中心性最小的交易对象作为起始交易对象,可以加快群组的划分,缩短群组划分的速度。
另外,在汇集所有的交易对象构成第一交易对象集合之后,且在进行一次群组划分之前,识别风险用户的方法还包括:根据关联图,获取第一交易对象集合中每个交易对象的度中心性;根据每个交易对象的度中心性,对第一交易对象集合中的交易对象进行排序;从第一交易对象集合中选取一个交易对象作为起始交易对象,具体包括:选取排序后的第一交易对象集合中第一个交易对象或最后一个交易对象作为起始交易对象。在划分群组之前预先进行度中心性的排序,使得可以在每次划分群组时都可以快速的选出最小度中心性的交易对象,进一步缩短群组划分的速度。
另外,交易对象至少包括:属于用户的交易对象,交易对象的标注信息包括:用于指示交易对象类型的类型信息以及风险指示信息,风险指示信息用于指示属于用户的交易对象是否为风险用户的信息;根据每个群组内交易对象的标注信息,确定每个群组各自对应的风险概率,具体包括:针对每个群组进行如下处理:根据群组内每个交易对象的类型信息,确定群组的第一数据,第一数据为属于用户的交易对象的数目;根据群组内每个属于用户的交易对象的风险指示信息,确定群组的第二数据,第二数据为群组内标注为风险用户的交易对象的数目;将第二数据与第一数据的比值作为群组的风险概率。通常风险指示信息是基于黑名单确定的,因而若交易对象被标注为风险用户,该交易对象必然属于黑名单的,基于此原理,可以快速确定出群组的风险概率。
另外,根据每个群组各自对应的风险概率,识别关联图中属于风险用户的交易对象,具体包括:针对每个属于用户的交易对象进行如下处理:根据属于用户的交易对象所在群组各自对应的风险概率,确定属于用户的交易对象的风险概率;判断属于用户的交易对象的风险概率是否大于预设概率值,若是,则确定属于用户的交易对象为风险用户。
另外,根据每个群组各自对应的风险概率,确定属于用户的交易对象的风险概率,具体包括:判断属于用户的交易对象所在群组的数目是否大于1,若是,则将属于用户的交易对象所在的各群组的风险概率的平均值作为属于用户的交易对象的风险概率,否则,将属于用户的交易对象所在群组的风险概率作为属于用户的交易对象的风险概率。
另外,在将关联图中满足群组划分条件的交易对象划分为同一个群组之后,识别风险用户的方法还包括:检测群组内是否存在被标注为商户的交易对象;若确定存在被标注为商户的交易对象,则根据群组内每个交易对象的标注信息,确定第三数据,第三数据为群组内除去被属于商户的交易对象后的交易对象的数目;判断第三数据是否超过预设数目,若是,删除群组。通过第三数据与预设数目进行比较,可以排除特大商户,从而提高识别的准确率。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是根据发明第一实施方式提供的一种识别风险用户的方法的具体流程图;
图2是根据发明第一实施方式提供的一种识别风险用户的方法中关联图的示意图。
图3是根据发明第一实施方式提供的一种识别风险用户的方法中划分群组具体实现示意图;
图4是根据发明第一实施方式提供的一种识别风险用户的方法中群组划分具体实现示意图;
图5是根据发明第一实施方式提供的一种对每个属于用户的交易对象识别的具体实现示意图;
图6是根据发明第二实施方式提供的一种识别风险用户的方法中群组划分具体实现示意图;
图7是根据发明第二实施方式提供的一种识别风险用户的方法中群组划分具体实现示意图;
图8是根据发明第三实施方式提供的一种服务器的具体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
发明人发现相关识别风险用户的方法,是利用深度学习的方式训练出识别模型,进而利用识别模型,对交易数据中的交易对象进行识别,确定出风险用户;例如,利用循环神经网络(Recurrent Neural Network,简称“RNN”)模型训练得到的欺诈检测系统,该系统是通过大量的带有标注信息的交易数据训练获得,标注信息用于区分正常用户和风险用户,通常可以根据网络交易平台提供的黑名单的列表对交易数据中的用户进行标注,通常黑名单中的用户标注为风险用户,而处于白名单列表中的用户标注为正常用户。但是这种方式中训练数据的标注信息可能并不准确,例如,白名单中的用户可能也为风险用户,导致训练得到的识别模型的识别准确度低。
还有基于同构图的识别方式,同构图的识别方式是构建用户之间的连接关系,通过现有标签推断同构图网络中未标记的节点的可能标签,从而识别出风险用户,但是这种方式仅考虑了相同属性的交易对象之间的连接关系,这与实际交易应用多种类别的交易对象明显不想符合,导致在实际应用中识别风险用户的准确率低。
本发明的第一实施方式涉及一种识别风险用户的方法。该识别风险用户的方法可以应用于互联网设备,如:服务器等,通过识别出风险用户,可以针对风险用户进行处理,优化整个网络交易的交易环境,该识别风险用户的方法,具体的流程如图1所示。
步骤101:获取关联图,关联图用于指示在交易过程中各交易对象之间的可达距离。
具体的说,关联图包含各交易对象,以及各交易对象之间的连接关系,通过关联图,可以确定出各交易对象之间的可达距离。获取预设时间段内的历史交易数据,根据历史交易数据可以构建关联图,预设时间段可以为最近3个月的历史交易数据,历史交易数据中包括交易记录向以及交易过程中的各交易对象。在实际网络交易中,有4个类型的交易对象,分别为:用户、商户、银行卡和设备,用户可以为个人消费者,也可以是企业消费者,商户为销售产品的交易对象,设备可以是终端,如手机、电脑等;银行卡可以用于从银行提现或充值货币。图2为简易的包含4类交易对象的关联图,如图2所示,f1表示用户与用户之间的连接方式为:红包或转账;f2表示用户向商户连接的方式为消费;f3表示商户向用户连接的方式为返利/营销活动;f4表示商户向银行卡连接的方式为提现;f5表示用户向银行卡连接的方式为提现,f6表示银行卡向用户连接的方式为充值;f表示用户向设备连接的方式为操作(例如登录);其中,图2所示的关联图中各交易对象之间的连接方式仅为举例,并不限于以上提到的连接方式。
步骤102:根据关联图中每两个交易对象之间的可达距离,将关联图中的交易对象划分为N个群组,N为大于1的整数。
具体的说,在网络交易中,若用户连接的其他交易对象的数目很少,那么该用户为正常用户概率很高,因此可以根据两个交易对象之间的可达距离,对交易对象进行群组划分。为了避免划分群组过程中发生漏掉交易对象的情况,获取关联图中所有的交易对象,并汇集所有的交易对象构成第一交易对象集合,从该第一交易对象集合中选取一个起始交易对象,以该起始交易对象为起点,查找满足群组划分条件的交易对象。其中,可达距离为两个交易对象之间直接连接或间接连接的可到达的距离。
一个具体实现中,划分群组的具体的处理过程如图3所示;
子步骤1021:从第一交易对象集合中选取一个交易对象作为起始交易对象。
具体的说,可以从该第一交易对象集合中任意选取一个交易对象作为起始交易对象。还可以获取每个交易对象的度中心性,从第一交易对象集合中选取度中心性最小的交易对象,作为起始交易对象。
子步骤1022:将关联图中满足群组划分条件的交易对象划分为同一个群组,群组划分条件为与起始交易对象的可达距离小于或等于预设可达距离的交易对象。
具体的说,预设可达距离可以根据实际应用进行确定,本实施方式中以预设可达距离为2为例进行说明,根据该关联图,确定出该起始交易对象的1阶可达距离的交易对象,以及该起始交易对象的2阶可达距离的交易对象,并将满足群组划分条件的交易对象划分为一个群组。图4为一个关联图的示意图,满足标号为2的交易对像的2阶可达距离的交易对象为:标号为4的交易对象以及标号为5的交易对象。
子步骤1023:从第一交易对象集合中删除属于群组的交易对象。
子步骤1024:判断第一交易对象集合是否为空,若不为空,则返回步骤1021,进行下一次群组划分;若为空,则停止群组划分的过程。
下面结合图4,详细介绍群组的划分过程:
图中有6个交易对象,分别表示为x1,x2,x3,x4,x5,x6;该第一交易对象集合D表示为:D=[x1,x2,x3,x4,x5,x6];预设可达距离为2,可以从第一交易对象D中任选一个交易对象作为起始交易对象,该例子中,选取x1作为起始交易对象,由于x1与其它的交易对象没有连接,即x1与其它的交易对象之间的可达距离为无穷大,而关联图中的交易对象x1与交易对象x1之间的可达距离为0,满足群组划分条件,故第一个群组1表示为:group1=[x1];从第一交易对象集合D中删除属于group1中的交易对象,即从第一交易对象集合D中删除x1,第一交易对象集合D更新为:D=[x2,x3,x4,x5,x6];判断第一交易对象集合D不为空,从该第一交易对象集合D中选出x3作为起始交易对象,与交易对象x3连接的交易对象为x5,与x5连接的交易对象为x6,则满足群组划分条件的交易对象为:x5,x6;群组2表示为:group2=[x3,x5,x6];从第一交易对象集合D中删除x3,x5,x6,第一交易对象集合D更新为:D=[x2,x4],第一交易对象集合D不为空,继续进行群组划分,选取x2为起始交易对象,则群组3表示为:group3=[x2,x6,x4,x5];从第一交易对象集合D中删除x2,x4,判断该第一交易对象集合为空,结束群组的划分过程。
子步骤103:根据每个群组内交易对象的标注信息,确定每个群组各自对应的风险概率。
一个具体的实现中,交易对象至少包括:属于用户的交易对象,交易对象的标注信息包括:用于指示交易对象类型的类型信息以及风险指示信息,风险指示信息用于指示属于用户的交易对象是否为风险用户的信息。
针对每个群组进行如下处理:根据群组内每个交易对象的类型信息,确定群组的第一数据,第一数据为属于用户的交易对象的数目;根据群组内每个属于用户的交易对象的风险指示信息,确定群组的第二数据,第二数据为群组内标注为风险用户的交易对象的数目;将第二数据与第一数据的比值作为群组的风险概率。
例如,如图4所示,交易对象x1和x3被标注为普通用户;x2,x4和x6被标记为风险用户;x5被标注为未知用户,计算该图4中3个群组的风险概率,群组3中一共有4个交易对象,其中,被标注为风险用户的交易对象的数目为3,则P(Group3)=3/4=0.75,同理可得P(Group2)=1/3=0.33。
若一个群组中被标注为风险用户的交易对象的数据越多,表明该群组为欺诈团伙的可能性高,则属于该群组的交易对象为风险用户的概率越高。
步骤104:根据每个群组各自对应的风险概率,识别关联图中属于风险用户的交易对象。
一个具体的实现中,针对每个属于用户的交易对象进行如图5所示的子步骤:
子步骤1041:根据属于用户的交易对象所在群组各自对应的风险概率,确定属于用户的交易对象的风险概率。
具体的说,判断属于用户的交易对象所在群组的数目是否大于1,若是,则将属于用户的交易对象所在的各群组的风险概率的平均值作为属于用户的交易对象的风险概率,否则,将属于用户的交易对象所在群组的风险概率作为属于用户的交易对象的风险概率。例如:如图4中的群组,P(x1)=P(Group1)=0/1=0;交易对象x3所在群组的数目为1,故交易对象x3的风险概率为:P(x3)=P(Group2)=1/3=0.33,交易对象5所在群组的数目为2,故交易对象x5的风险概率为Group2的风险概率和Group3风险概率的平均值,即P(x5)=(P(Group3)+P(Group2))/2=(0.75+0.33)/2=0.54。
子步骤1042:判断属于用户的交易对象的风险概率是否大于预设概率值,若是,则确定属于用户的交易对象为风险用户。
具体的说,预设概率值可以根据实际应用确定,例如,预设概率值可以为0.2;属于用户的交易对象的风险概率是否大于预设概率值,若是,则执行步骤1043;否则,执行步骤1044。
子步骤1043:确定属于用户的交易对象为风险用户。
子步骤1044:确定属于用户的交易对象为非风险用户。
需要说明的是,在执行完将关联图中满足群组划分条件的交易对象划分为同一个群组的步骤之后,还可以检测该群组内是否存在被标注为商户的交易对象;若确定该群组内存在被标注为商户的交易对象,则根据群组内每个交易对象的标注信息,确定第三数据,第三数据为群组内除去被标注为商户的交易对象后的交易对象数目;判断第三数据是否超过预设数目,若是,删除该群组。预设数目可以根据实现需要设置,例如,预设数目为10万。通过与预设数目的比较,可以删除为特大商户的群组,从而确保对风险用户识别的准确率。
本发明实施方式相对于现有技术而言,由于在网络交易中通常是以团伙作案的方式进行欺诈,若仅利用单个交易对象的交易数据识别风险用户,导致识别风险用户的准确率低;本实施方式中通过该关联图中每两个交易对象之间的可达距离,可以快速将该关联图中的交易对象划分为N个群组,由于关联图指示了在交易过程中各交易对象之间的可达距离,且由于两个交易对象之间的距离大小可以反应两个交易对象在交易中的紧密程度,因而通过两个交易对象之间的可达距离可以合理的进行群组的划分;由于考虑了团伙作案的风险概率,将关联紧密度相近的交易对象之间划分在一个群组,从而根据群组的风险概率,可以准确地识别出风险用户,优化整个网络交易的交易环境。
本发明的第二实施方式涉及一种识别风险用户的方法。该识别风险用户的方法包括:获取关联图;根据关联图中每两个所述交易对象之间的可达距离,将关联图中的交易对象划分为N个群组,N为大于1的整数;根据每个群组内交易对象的标注信息,确定每个群组各自对应的风险概率;根据每个群组各自对应的风险概率,识别关联图中属于风险用户的交易对象。
第二实施方式是第一实施方式中步骤102的另一种具体实现,本实施方式中划分群组的具体过程如图6所示。
步骤201:获取关联图中所有的交易对象,并汇集所有的交易对象构成第一交易对象集合。
该步骤与第一实施方式中步骤102中构成第一交易对象集合的方式大致相同,此处不再赘述。
步骤202:根据关联图,获取第一交易对象集合中每个交易对象的度中心性。
具体的说,根据该关联图,计算第一交易对象集合中每个交易对象的度中心性,每个交易对象的度中心性等于与该交易对象可达距离为1的交易对象的数目。例如,关联图如图7所示,交易对象x1的度中心性为deg(x1)=0;交易对象x1的度中心性为deg(x2)=1;交易对象x3的度中心性为deg(x3)=1;交易对象x4的度中心性为deg(x4)=1;交易对象x5的度中心性为deg(x5)=2;交易对象x6的度中心性为deg(x6)=3。
步骤203:根据每个交易对象的度中心性,对第一交易对象集合中的交易对象进行排序。
具体的说,按照每个交易对象的度中心性的降序或者升序对第一交易对象集合中的交易对象进行排序。例如,按照度中心性的升序排列,该第一交易对象集合D=[x1,x2,x3,x4,x5,x6]。
步骤204:选取排序后的第一交易对象集合中第一个交易对象或最后一个交易对象作为起始交易对象。
具体的说,若第一交易对象集合中的交易对象按照度中心性的降序排列,则选取该第一交易对象集合中最后一个交易对象作为起始交易对象;若第一交易对象集合中的交易对象按照度中心性的升序排列,则选取该第一交易对象集合中第一个交易对象作为起始交易对象。
步骤205:将关联图中满足群组划分条件的交易对象划分为同一个群组,群组划分条件为与起始交易对象的可达距离小于或等于预设可达距离的交易对象。
步骤206:从第一交易对象集合中删除属于群组的交易对象。
步骤207:判断第一交易对象集合是否为空,若不为空,则返回步骤1021,进行下一次群组划分;若为空,则停止群组划分的过程。
下面结合图7详解介绍该群组划分的过程:
图7中有6个交易对象,分别表示为x1,x2,x3,x4,x5,x6;该第一交易对象集合D表示为:D=[x1,x2,x3,x4,x5,x6];预设可达距离为2,根据图7,计算出每个交易对象的度中心性,度中心性以“deg”表示;则6个交易对象的度中心性分别为:deg(x1)=0,deg(x2)=deg(x3)=deg(x4)=1,deg(x5)=2,deg(x6)=3;按照度中心性的升序,对第一交易对象集合D中的交易对象进行排序,得到排序后的第一交易对象集合D=[x1,x2,x3,x4,x5,x6];从第一交易对象集合D中选取第一个交易对象x1作为起始交易对象;由于x1与其它的交易对象没有连接,即x1与其它的交易对象之间的可达距离为无穷大,x1与x1之间的可达距离为0,满足群组划分条件,故第一个群组1表示为:group1=[x1];从第一交易对象集合D中删除属于group1中的交易对象,即从第一交易对象集合D中删除交易对象x1,第一交易对象集合D更新为:D=[x2,x3,x4,x5,x6];判断第一交易对象集合D不为空,继续进行群组的划分,同理,选取交易对象x2作为起始交易对象,交易对象x6与交易对象x2的可达距离为1,交易对象x5与交易对象x2的可达距离为2,交易对象x4与交易对象x2的可达距离为2;则该群组2表示为:group2=[x2,x6,x4,x5];从第一交易对象集合D中删除x2,x6,x4,x5;第一交易对象集合D更新为:D=[x3],判断第一交易对象集合不为空,继续进行群组的划分,从该第一交易对象D中选出交易对象x3作为起始交易对象,关联图中交易对象为x5与交易对象x3的可达距离为1,交易对象为x6与交易对象x3的可达距离为1,则满足群组划分条件的交易对象为:x5,x6;群组3表示为:group3=[x3,x5,x6];从第一交易对象集合D中删除x3,判断该第一交易对象集合为空,结束群组的划分过程。
步骤205至步骤207与第一实施方式中的子步骤1022至子步骤1024大致相同,此处不再赘述。
本实施方式提供的识别风险用户的方法,由于交易对象的度中心性越小,表明该交易对象与其它交易对象之间的关联越小,则该交易对象为正常用户的概率越高,优先划分出度中心性最小的交易对象作为起始交易对象,可以加快群组的划分,缩短群组划分的速度。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第三实施方式涉及一种服务器,该服务器30的结构如图8所示,包括:至少一个处理器301;以及,与至少一个处理器301通信连接的存储器302;其中,存储器302存储有可被至少一个处理器执行的指令,指令被至少一个处理器301执行,以使至少一个处理器301能够执行时实现第一实施方式或第二实施方式中的识别风险用户的方法。
其中,存储器和处理器采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路链接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。
处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
本发明第四实施方式涉及一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现第一实施方式或第二实施方式中的识别风险用户的方法。
本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (10)

1.一种识别风险用户的方法,其特征在于,包括:
获取关联图,所述关联图用于指示在交易过程中各所述交易对象之间的可达距离;
根据所述关联图中每两个所述交易对象之间的可达距离,将所述关联图中的所述交易对象划分为N个群组,N为大于1的整数;
根据每个群组内所述交易对象的标注信息,确定每个所述群组各自对应的风险概率;
根据每个所述群组各自对应的风险概率,识别所述关联图中属于风险用户的交易对象。
2.根据权利要求1所述的识别风险用户的方法,其特征在于,所述根据所述关联图中每两个所述交易对象之间的可达距离,将所述关联图中的所述交易对象划分为N个群组,具体包括:
获取所述关联图中所有的所述交易对象,并汇集所有的所述交易对象构成第一交易对象集合;
在一次群组划分中进行如下处理:从所述第一交易对象集合中选取一个所述交易对象作为起始交易对象;将所述关联图中满足群组划分条件的所述交易对象划分为同一个群组,所述群组划分条件为与所述起始交易对象的可达距离小于或等于预设可达距离的所述交易对象;从所述第一交易对象集合中删除属于所述群组的所述交易对象;判断所述第一交易对象集合是否为空,若不为空,则进行下一次群组划分,若为空,停止所述群组划分的过程。
3.根据权利要求2所述的识别风险用户的方法,其特征在于,所述从所述第一交易对象集合中选取一个所述交易对象作为起始交易对象,具体包括:
从所述第一交易对象集合中选取度中心性最小的所述交易对象,作为所述起始交易对象。
4.根据权利要求2所述的识别风险用户的方法,其特征在于,在所述汇集所有的交易对象构成第一交易对象集合之后,且在进行一次群组划分之前,所述识别风险用户的方法还包括:
根据所述关联图,获取所述第一交易对象集合中每个所述交易对象的度中心性;
根据每个所述交易对象的度中心性,对所述第一交易对象集合中的所述交易对象进行排序;
所述从所述第一交易对象集合中选取一个所述交易对象作为起始交易对象,具体包括:
选取排序后的所述第一交易对象集合中第一个所述交易对象或最后一个所述交易对象作为所述起始交易对象。
5.根据权利要求1至4中任一项所述的识别风险用户的方法,其特征在于,所述交易对象至少包括:属于用户的交易对象,所述交易对象的标注信息包括:用于指示所述交易对象类型的类型信息以及风险指示信息,所述风险指示信息用于指示属于用户的所述交易对象是否为风险用户的信息;
所述根据每个群组内所述交易对象的标注信息,确定每个所述群组各自对应的风险概率,具体包括:
针对每个群组进行如下处理:
根据所述群组内每个所述交易对象的类型信息,确定所述群组的第一数据,所述第一数据为属于用户的所述交易对象的数目;
根据所述群组内每个属于用户的所述交易对象的风险指示信息,确定所述群组的第二数据,所述第二数据为所述群组内标注为风险用户的所述交易对象的数目;
将所述第二数据与所述第一数据的比值作为所述群组的风险概率。
6.根据权利要求1所述的识别风险用户的方法,其特征在于,所述根据每个群组各自对应的风险概率,识别所述关联图中属于风险用户的交易对象,具体包括:
针对每个属于用户的交易对象进行如下处理:
根据所述属于用户的交易对象所在群组各自对应的风险概率,确定所述属于用户的交易对象的风险概率;
判断所述属于用户的交易对象的风险概率是否大于预设概率值,若是,则确定所述属于用户的交易对象为风险用户。
7.根据权利要求6所述的识别风险用户的方法,其特征在于,所述根据每个所述群组各自对应的风险概率,确定属于用户的所述交易对象的风险概率,具体包括:
判断所述属于用户的交易对象所在群组的数目是否大于1,若是,则将所述属于用户的交易对象所在的各群组的风险概率的平均值作为所述属于用户的交易对象的风险概率,否则,将所述属于用户的交易对象所在群组的风险概率作为所述属于用户的交易对象的风险概率。
8.根据权利要求2所述的识别风险用户的方法,其特征在于,在所述将所述关联图中满足群组划分条件的所述交易对象划分为同一个群组之后,所述识别风险用户的方法还包括:
检测所述群组内是否存在被标注为商户的交易对象;
若确定存在被标注为商户的交易对象,则根据所述群组内每个所述交易对象的标注信息,确定第三数据,所述第三数据为所述群组内除去属于商户的交易对象后的所述交易对象的数目;判断所述第三数据是否超过预设数目,若是,删除所述群组。
9.一种服务器,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至8任一所述的识别风险用户的方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的识别风险用户的方法。
CN201910812865.0A 2019-08-30 2019-08-30 一种识别风险用户的方法、服务器及可读存储介质 Pending CN110717805A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910812865.0A CN110717805A (zh) 2019-08-30 2019-08-30 一种识别风险用户的方法、服务器及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910812865.0A CN110717805A (zh) 2019-08-30 2019-08-30 一种识别风险用户的方法、服务器及可读存储介质

Publications (1)

Publication Number Publication Date
CN110717805A true CN110717805A (zh) 2020-01-21

Family

ID=69209557

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910812865.0A Pending CN110717805A (zh) 2019-08-30 2019-08-30 一种识别风险用户的方法、服务器及可读存储介质

Country Status (1)

Country Link
CN (1) CN110717805A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530503A (zh) * 2013-09-27 2014-01-22 北京航空航天大学 保持社区结构的复杂网络采样方法
US20150213598A1 (en) * 2014-01-30 2015-07-30 Case Western Reserve University Spatially Aware Cell Cluster (SPACCL) Graphs
CN110135853A (zh) * 2019-04-25 2019-08-16 阿里巴巴集团控股有限公司 团伙用户识别方法、装置和设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530503A (zh) * 2013-09-27 2014-01-22 北京航空航天大学 保持社区结构的复杂网络采样方法
US20150213598A1 (en) * 2014-01-30 2015-07-30 Case Western Reserve University Spatially Aware Cell Cluster (SPACCL) Graphs
CN110135853A (zh) * 2019-04-25 2019-08-16 阿里巴巴集团控股有限公司 团伙用户识别方法、装置和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张引著: "《社会标注系统中标签推荐方法研究》", 31 July 2016, 东北大学出版社 *

Similar Documents

Publication Publication Date Title
US6990460B2 (en) Dynamic demand management
CN107590688A (zh) 目标客户的识别方法及终端设备
CN109003131B (zh) 基于用户场景属性信息的精准营销方法及装置
CN104866484A (zh) 一种数据处理方法和装置
CN110428244B (zh) 套餐推荐方法和装置
CN107133289A (zh) 一种确定商圈的方法和装置
CN110210900B (zh) 基于交易关联性的参考产品确定方法、装置和设备
CN109165947B (zh) 账户信息确定方法、装置及服务器
CN109583826B (zh) 申报文件生成方法、装置、服务器及可读存储介质
CN114219003A (zh) 样本生成模型的训练方法、装置及电子设备
CN112330373A (zh) 用户行为分析方法、装置及计算机可读存储介质
CN108510302A (zh) 一种营销决策方法及交易服务器
CN108960501B (zh) 一种商品防窜货方法
CN115345663A (zh) 营销策略评估方法、装置、电子设备及存储介质
CN110717805A (zh) 一种识别风险用户的方法、服务器及可读存储介质
CN110751501A (zh) 新零售模式下的商品导购方法、装置、设备及存储介质
CN113095939B (zh) 一种区块链智能合约推荐方法及装置
CN110570301B (zh) 风险识别方法、装置、设备及介质
CN111340622A (zh) 一种异常交易集群的检测方法及装置
CN110111131A (zh) 虚假客资信息的确定方法及装置
JP2020154543A (ja) 不正取引検知装置、不正取引検知方法および不正取引検知プログラム
CN111368543B (zh) 一种确定商户类别的方法及装置
CN113822692B (zh) 商品信息的处理方法、装置、电子设备和存储介质
CN113362176B (zh) 数据处理方法和数据处理装置
CN113032442A (zh) 确定目标用户的方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200121