CN109615461A - 目标用户识别方法、违规商户识别方法和装置 - Google Patents

目标用户识别方法、违规商户识别方法和装置 Download PDF

Info

Publication number
CN109615461A
CN109615461A CN201811330098.1A CN201811330098A CN109615461A CN 109615461 A CN109615461 A CN 109615461A CN 201811330098 A CN201811330098 A CN 201811330098A CN 109615461 A CN109615461 A CN 109615461A
Authority
CN
China
Prior art keywords
user
label information
node
calibration
violation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811330098.1A
Other languages
English (en)
Other versions
CN109615461B (zh
Inventor
陆逊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811330098.1A priority Critical patent/CN109615461B/zh
Publication of CN109615461A publication Critical patent/CN109615461A/zh
Application granted granted Critical
Publication of CN109615461B publication Critical patent/CN109615461B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0609Buyer or seller confidence or verification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud

Landscapes

  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种目标用户识别方法,包括:确定存在关联关系的第一用户与第二用户,第一用户中包括第一标定用户和第一非标定用户;根据第一标定用户的第一标签信息,确定第二用户中的第二标定用户,第二标定用户中至少一个与第一标定用户之间存在关联关系;基于第一标定用户的第一标签信息和第二标定用户的第二标签信息,从第一非标定用户中识别出目标用户,目标用户与第二标定用户之间存在关联关系。采用上述方法,可以根据关联关系,通过与已标定的第一标定用户存在关联关系的第二标定用户识别出目标用户,因此,可以主动识别出可能存在违规违禁行为的用户(即目标用户),实现对平台交易的风险控制。

Description

目标用户识别方法、违规商户识别方法和装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种目标用户识别方法和装置。
背景技术
随着互联网技术的发展和普及,各类线上业务平台应运而生,越来越多的用户(包括商家用户和消费用户等)选择利用线上业务平台进行交易。
与此同时,部分非法用户也可能利用线上业务平台进行违反规定或者违反限制要求的交易,例如,赌博等。这些非法交易往往具有隐蔽性,对平台的合法、健康运维构成威胁。
因此,亟需一种目标用户识别方法,以便主动识别出可能存在违规违禁行为的用户,实现对平台交易的风险控制。
发明内容
本申请实施例提供一种目标用户识别方法和装置,以便主动识别出可能存在违规违禁行为的用户,实现对平台交易的风险控制。
本申请实施例还提供一种违规商户识别方法和装置,以便主动识别出可能存在违规违禁行为的商户,实现对平台交易的风险控制。
本申请实施例采用下述技术方案:
第一方面,本申请实施例提供一种目标用户识别方法,包括:
确定存在关联关系的第一用户与第二用户,所述第一用户中包括第一标定用户和第一非标定用户;
根据所述第一标定用户的第一标签信息,确定所述第二用户中的第二标定用户,所述第二标定用户中至少一个与所述第一标定用户之间存在关联关系;
基于所述第一标定用户的第一标签信息和所述第二标定用户的第二标签信息,从所述第一非标定用户中识别出目标用户,所述目标用户与所述第二标定用户之间存在关联关系。
优选的,本申请实施例第一方面提供的方法中,在根据所述第一标定用户的第一标签信息,确定所述第二用户中的第二标定用户之前,所述方法还包括:
基于所述第一用户和所述第二用户及其关联关系,创建关联网络图,其中,所述关联网络图中的节点对应所述第一用户或者所述第二用户,所述关联网络图中的边用于连接存在关联关系的第一用户和第二用户所对应的节点;
则根据所述第一标定用户的第一标签信息,确定所述第二用户中的第二标定用户,具体为:
根据所述第一标定用户的第一标签信息,在所述关联网络图中进行标签传播,确定所述第二用户中的第二标定用户。
优选的,本申请实施例第一方面提供的方法中,根据所述第一标定用户的第一标签信息,在所述关联网络图中进行标签传播,确定所述第二用户中的第二标定用户,包括:
根据所述第一标定用户的第一标签信息,对所述关联网络图中各节点的标签信息进行初始化;
基于所述第一标签信息,在所述关联网络图中进行标签传播,确定所述关联网络图中第一待标定节点的标签信息,所述第一待标定节点为所述关联网络图中、除所述第一标定用户所对应节点以外的其他节点;
基于所述第二用户的标签信息,确定所述第二用户中的第二标定用户。
优选的,本申请实施例第一方面提供的方法中,基于所述第二用户的标签信息,确定所述第二用户中的第二标定用户,包括:
将标签信息满足第一预设条件的第二用户,确定为所述第二标定用户。
优选的,本申请实施例第一方面提供的方法中,基于所述第一标签信息,在所述关联网络图中进行标签传播,确定所述关联网络图中第一待标定节点的标签信息,包括:
确定对所述关联网络图中第一待标定节点的标签信息的更新顺序;
按照所述更新顺序,对所述第一待标定节点的标签信息进行更新;
重新确定所述更新顺序,并迭代执行所述对所述第一待标定节点的标签信息进行更新的步骤,直至所述第一待标定节点的标签信息更新完毕或者迭代次数达到预设阈值;
将更新完毕时的标签信息,确定为所述第一待标定节点的标签信息。
优选的,本申请实施例第一方面提供的方法中,确定对所述关联网络图中第一待标定节点的标签信息的更新顺序,具体为:
随机确定对所述关联网络图中第一待标定节点的标签信息的更新顺序。
优选的,本申请实施例第一方面提供的方法中,按照所述更新顺序,对所述第一待标定节点的标签信息进行更新,包括:
基于所述更新顺序,确定待更新的当前节点;
根据所述当前节点的邻居节点的标签信息,更新所述当前节点的标签信息;
将所述当前节点的下一个节点作为新的当前节点,并迭代执行所述更新所述当前节点的标签信息的步骤,直至按照所述更新顺序遍历所述第一待标定节点。
优选的,本申请实施例第一方面提供的方法中,根据所述当前节点的邻居节点的标签信息,更新所述当前节点的标签信息,包括:
统计所述邻居节点的标签信息中、各种标签信息的出现次数;
将出现次数最多的标签信息确定为所述当前节点的标签信息。
优选的,本申请实施例第一方面提供的方法中,基于所述第一标定用户的第一标签信息和所述第二标定用户的第二标签信息,从所述第一非标定用户中识别出目标用户,包括:
基于所述第一标签信息和所述第二标签信息,在所述关联网络图中进行标签传播,确定所述关联网络图中第二待标定节点的标签信息,所述第二待标定节点为所述关联网络图中、除所述第一标定用户所对应节点和所述第二标定用户所对应节点以外的其他节点;
基于所述第一非标定用户的标签信息,确定所述第一非标定用户中的目标用户。
优选的,本申请实施例第一方面提供的方法中,基于所述第一非标定用户的标签信息,确定所述第一非标定用户中的目标用户,包括:
将标签信息满足第二预设条件的第一非标定用户,确定为所述目标用户。
优选的,本申请实施例第一方面提供的方法中,基于所述第一标签信息和所述第二标签信息,在所述关联网络图中进行标签传播,确定所述关联网络图中第二待标定节点的标签信息,包括:
确定对所述关联网络图中第二待标定节点的标签信息的更新顺序;
按照所述更新顺序,对所述第二待标定节点的标签信息进行更新;
重新确定所述更新顺序,并迭代执行所述对所述第二待标定节点的标签信息进行更新的步骤,直至所述第二待标定节点的标签信息更新完毕或者迭代次数达到预设阈值;
将更新完毕时的标签信息,确定为所述第二待标定节点的标签信息。
优选的,本申请实施例第一方面提供的方法中,确定对所述关联网络图中第二待标定节点的标签信息的更新顺序,具体为:
随机确定对所述关联网络图中第二待标定节点的标签信息的更新顺序。
优选的,本申请实施例第一方面提供的方法中,按照所述更新顺序,对所述第二待标定节点的标签信息进行更新,包括:
基于所述更新顺序,确定待更新的当前节点;
根据所述当前节点的邻居节点的标签信息,更新所述当前节点的标签信息;
将所述当前节点的下一个节点作为新的当前节点,并迭代执行所述更新所述当前节点的标签信息的步骤,直至按照所述更新顺序遍历所述第二待标定节点。
优选的,本申请实施例第一方面提供的方法中,根据所述当前节点的邻居节点的标签信息,更新所述当前节点的标签信息,包括:
统计所述邻居节点的标签信息中、各种标签信息的出现次数;
将出现次数最多的标签信息确定为所述当前节点的标签信息。
优选的,本申请实施例第一方面提供的方法中,所述第一用户具体为商家用户,所述第二用户具体为消费用户,所述第一标定用户为已知违规商户,所述第一非标定用户为待定商户,所述第一标签信息为违规标签信息,所述第二标定用户为预测违规用户,所述第二标签信息为预测违规信息,所述目标用户为预测违规商户。
第二方面,本申请实施例提供一种违规商户识别方法,包括:
确定存在关联关系的商家用户与消费用户,所述商家用户中包括已知违规商户和待定商户;
根据所述已知违规商户的违规标签信息,确定所述消费用户中的预测违规用户,所述预测违规用户中至少一个与所述已知违规商户之间存在关联关系;
基于所述已知违规商户的违规标签信息和所述预测违规用户的预测违规信息,从所述待定商户中识别出预测违规商户,所述预测违规商户与所述预测违规用户之间存在关联关系。
第三方面,本申请实施例提供一种目标用户识别装置,包括:
用户确定模块,用于确定存在关联关系的第一用户与第二用户,所述第一用户中包括第一标定用户和第一非标定用户;
第二标定用户确定模块,用于根据所述第一标定用户的第一标签信息,确定所述第二用户中的第二标定用户,所述第二标定用户中至少一个与所述第一标定用户之间存在关联关系;
目标用户识别模块,用于基于所述第一标定用户的第一标签信息和所述第二标定用户的第二标签信息,从所述第一非标定用户中识别出目标用户,所述目标用户与所述第二标定用户之间存在关联关系。
第四方面,本申请实施例提供一种违规商户识别装置,包括:
用户确定模块,用于确定存在关联关系的商家用户与消费用户,所述商家用户中包括已知违规商户和待定商户;
预测违规用户确定模块,用于根据所述已知违规商户的违规标签信息,确定所述消费用户中的预测违规用户,所述预测违规用户中至少一个与所述已知违规商户之间存在关联关系;
预测违规商户识别模块,用于基于所述已知违规商户的违规标签信息和所述预测违规用户的预测违规信息,从所述待定商户中识别出预测违规商户,所述预测违规商户与所述预测违规用户之间存在关联关系。
第五方面,本申请实施例提供一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
确定存在关联关系的第一用户与第二用户,所述第一用户中包括第一标定用户和第一非标定用户;
根据所述第一标定用户的第一标签信息,确定所述第二用户中的第二标定用户,所述第二标定用户中至少一个与所述第一标定用户之间存在关联关系;
基于所述第一标定用户的第一标签信息和所述第二标定用户的第二标签信息,从所述第一非标定用户中识别出目标用户,所述目标用户与所述第二标定用户之间存在关联关系。
第六方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
确定存在关联关系的第一用户与第二用户,所述第一用户中包括第一标定用户和第一非标定用户;
根据所述第一标定用户的第一标签信息,确定所述第二用户中的第二标定用户,所述第二标定用户中至少一个与所述第一标定用户之间存在关联关系;
基于所述第一标定用户的第一标签信息和所述第二标定用户的第二标签信息,从所述第一非标定用户中识别出目标用户,所述目标用户与所述第二标定用户之间存在关联关系。
第七方面,本申请实施例提供一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
确定存在关联关系的商家用户与消费用户,所述商家用户中包括已知违规商户和待定商户;
根据所述已知违规商户的违规标签信息,确定所述消费用户中的预测违规用户,所述预测违规用户中至少一个与所述已知违规商户之间存在关联关系;
基于所述已知违规商户的违规标签信息和所述预测违规用户的预测违规信息,从所述待定商户中识别出预测违规商户,所述预测违规商户与所述预测违规用户之间存在关联关系。
第八方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
确定存在关联关系的商家用户与消费用户,所述商家用户中包括已知违规商户和待定商户;
根据所述已知违规商户的违规标签信息,确定所述消费用户中的预测违规用户,所述预测违规用户中至少一个与所述已知违规商户之间存在关联关系;
基于所述已知违规商户的违规标签信息和所述预测违规用户的预测违规信息,从所述待定商户中识别出预测违规商户,所述预测违规商户与所述预测违规用户之间存在关联关系。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
在本申请实施例提供的目标用户识别方法中,根据关联关系确定第一用户和第二用户,并且,第一用户中包括已经标定有第一标签信息的第一标定用户。在此基础上,可以进一步确定出第二用户中、与第一标定用户之间存在关联关系的第二标定用户,进而可以基于第一标定用户的第一标签信息和第二标定用户的第二标签信息,从第一非标定用户中识别出与第二标定用户之间存在关联关系的目标用户。因此,采用上述方法,可以根据关联关系,通过与已标定的第一标定用户存在关联关系的第二标定用户识别出目标用户,因此,可以主动识别出可能存在违规违禁行为的用户(即目标用户),实现对平台交易的风险控制。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的目标用户识别方法的流程示意图;
图2为本申请实施例中构建的关联网络图的示意图;
图3为本申请实施例提供的违规商户识别方法的流程示意图;
图4为本申请实施例提供的目标用户识别装置的结构示意图;
图5为本申请实施例提供的违规商户识别装置的结构示意图;
图6为本申请实施例提供的一种电子设备的结构示意图;
图7为本申请实施例提供的又一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
参见图1所示,本申请实施例提供了一种目标用户识别方法,可具体包括:
S101:确定存在关联关系的第一用户与第二用户,第一用户中包括第一标定用户和第一非标定用户。
可以理解到,本申请实施例提供的目标用户识别方法中,服务器或者其他执行主体通过执行步骤S101,可以根据历史关联关系,将两类用户(即第一用户和第二用户)关联起来,以便能够根据第一用户中已标定有标签信息的第一标定用户,从第一非标定用户中识别出目标用户。
需要说明的是,本申请实施例中所说的关联关系,可以是第一用户和第二用户之间的交易关系、通信关系、设备连接关系中至少一种。可以理解到,若第一用户和第二用户之间存在买卖交易,则可认为二者之间存在交易关系。若第一用户和第二用户之间存在通话记录,或者其他形式的通信印记,则可认为二者之间存在通信关系。若第一用户和第二用户所持的终端设备之间存在连接记录,则可认为二者之间存在设备连接关系。可以理解到,无论是哪种形式的关联关系,都反映了第一用户和第二用户之间存在某方面的紧密关系,本申请实施例对关联关系的具体形式不做限定。
以下将以第一用户和第二用户之间存在交易关系为主,举例说明本申请实施例的实施过程。
在实施步骤S101时,可以获取一定时间段内的交易数据,例如,可以获取最近15天或者30天的订单数据等,将交易数据所对应的买卖双方确定为第一用户和第二用户,具体的,将卖方(可以理解为商家用户)确定为第一用户,将买方(可以理解为消费用户)确定为第二用户。
在第一用户中,已知部分第一用户的标签信息,这部分第一用户可称为第一标定用户。在不同的具体应用场景下,第一标定用户及其标签信息的内涵也有所不同。
例如,利用本申请实施例提供的目标用户识别方法进行赌博商家的识别时,第一标定用户可以理解为已经通过人工审理确定的赌博商家,第一标定用户的标签信息也就表示确定该用户属于赌博商家。
又例如,利用本申请实施例提供的目标用户识别方法进行洗钱主体(可以理解为配合进行洗钱的企业)的识别时,第一标定用户可以理解为已经通过人工审理确定的洗钱主体,第一标定用户的标签信息也就表示确定该用户属于洗钱主体。
可选的,在执行步骤S101确定存在关联关系的第一用户与第二用户的基础上,可以进一步基于第一用户和第二用户及其关联关系,创建关联网络图,参见图2所示。其中,关联网络图中的节点对应第一用户或者第二用户,关联网络图中的边用于连接存在关联关系的第一用户和第二用户所对应的节点。
可以理解到,在不同的应用场景下,关联网络图中的节点和边的具体内涵也有所不同。
在一种应用场景下,利用本申请实施例提供的目标用户识别方法进行赌博商家的识别时,关联网络图中的节点代表买卖双方。关联网络图中的边代表买卖双方之间的关联关系,每条边都将连接存在关联关系(可具体为交易关系)的第一用户和第二用户所对应的节点。
以图2所示关联网络图为例,节点A1~A4代表第一用户,即卖方用户、商家用户,依次为用户A1、用户A2、用户A3和用户A4;节点B1~B8代表第二用户,即买方用户、消费用户,依次为用户B1、用户B2、用户B3、用户B4、用户B5、用户B6、用户B7和用户B8。连接两个节点的边,代表节点所对应用户之间存在关联关系。例如,用户A1与用户B1、用户B2、用户B3和用户B4分别存在关联关系,用户A2与用户B7和用户B8分别存在关联关系,用户A3与用户B2、用户B3、用户B5和用户B6分别存在关联关系,用户A4与用户B1、用户B3、用户B4和用户B5分别存在关联关系。
能够理解,利用第一用户和第二用户之间的关联关系构建关联网络图,能够通过图形的方式清晰、直观的描述节点之间(本质上为用户之间)的特定关系,从而便于基于第一标定用户的标签信息识别出第一非标定用户中的目标用户。
S103:根据第一标定用户的第一标签信息,确定第二用户中的第二标定用户,其中,第二标定用户中至少一个与第一标定用户之间存在关联关系。
可以理解到,在执行步骤S101确定存在关联关系的第一用户与第二用户之后,可以进一步确定第二用户中、与标定有第一标签信息的第一标定用户存在关联关系的那部分,这部分第二用户即为第二标定用户。
可选的,在基于第一用户与第二用户间的关联关系构建有关联网络图的情况下,可以利用标签传播算法,根据第一标定用户的第一标签信息,在关联网络图中进行标签传播,从而确定第二用户中的第二标定用户。
可选的,在利用标签传播算法确定第二标定用户的过程中,可以先根据第一标定用户的第一标签信息,对关联网络图中各节点的标签信息进行初始化。可以理解到,这一初始化过程,本质上是对关联网络图中各节点(包括第一用户对应的节点和第二用户对应的节点)进行分类的过程。
在具体实施时,可以对第一标定用户标定第一标签信息(例如,取值为1),对其他未标定的用户标定另一标签信息(例如,记为第三标签信息,取值为0),从而将第一标定用户和其他用户(包括第二用户,以及第一用户中的第一非标定用户)分为两类。
在以上基础上,可以进一步基于第一标签信息,在关联网络图中进行标签传播,进而确定关联网络图中第一待标定节点的标签信息。其中,第一待标定节点为关联网络图中、除第一标定用户所对应节点以外的其他节点。
在此基础上,就可以进一步基于第一待标定节点中第二用户的标签信息,确定第二用户中的第二标定用户。具体的,可以将标签信息满足第一预设条件的第二用户,确定为第二标定用户。需要说明的是,第一预设条件的设定,使得满足第一预设条件的第二用户与第一标定用户之间存在关联关系,从而能够从第二用户中筛选出与第一标定用户存在关联关系的那部分用户。
S105:基于第一标定用户的第一标签信息和第二标定用户的第二标签信息,从第一非标定用户中识别出目标用户,其中,目标用户与第二标定用户之间存在关联关系。
可以理解到,在执行步骤S103,确定了与第一标定用户之间存在关联关系的第二标定用户之后,可进一步从第一非标定用户中确定出与第二标定用户存在关联关系的那部分用户,作为目标用户。
可选的,在基于第一用户与第二用户间的关联关系构建有关联网络图的情况下,可以利用标签传播算法,根据第一标定用户的第一标签信息以及第二标定用户的第二标签信息,在关联网络图中进行标签传播,确定关联网络图中第二待标定节点的标签信息。其中,第二待标定节点为关联网络图中、除第一标定用户所对应节点和第二标定用户所对应节点以外的其他节点。
在以上基础上,可以基于第一非标定用户的标签信息,进一步确定第一非标定用户中的目标用户。具体的,可以将标签信息满足第二预设条件的第一非标定用户,确定为目标用户。需要说明的是,第二预设条件的设定,使得满足第二预设条件的第一非标定用户与第二标定用户之间存在关联关系,从而能够从第一非标定用户中筛选出与第二标定用户存在关联关系的那部分用户,作为目标用户。
可以理解到,在关联网络图中进行的标签传播,其实质为:任一待标定节点,都可以根据相邻节点的标签信息,按照一定的规则,更新(或者说预测)自己的标签信息。通过多次的迭代更新后,关联网络图中各节点的标签将趋于稳定,甚至不再发生变化,此时,可以认为完成了标签传播,得到了关联网络图中待标定节点的标签信息。
在本申请实施例中,在基于第一标定用户,确定与第一标定用户存在关联关系的第二标定用户时,可以采用标签传播算法,此处记为第一次标签传播。在基于第一标定用户和第二标定用户,确定第一非标定用户中、与第二标定用户存在关联关系的目标用户时,也可以采用标签传播算法,此处记为第二次标签传播。
需要说明的是,这两次标签传播所采用的具体规则可以相同,也可以不同。基于第一次标签传播的结果确定第二标定用户时的第一预设条件,与基于第二次标签传播的结果确定目标用户时的第二预设条件,可以相同,也可以不同。
在本申请实施例中,可以采用多种社区发现算法(全称Community Detection)法进行标签的传播,例如,标签传播算法LPA(全称Label Propagation Algorithm)、SLPA算法(全称Speaker-listener based information propagation algorithm)、衰减因子与节点特征算法HANP(全称Hop Attenuation&Node Preference)、快速社区发现算法FU(全称FastUnfolding)、DCLP算法(全称Distance-Control Label Propagation)等。
可以理解到,采用不同的标签传播算法,更新节点的标签信息的规则将有所不同,基于第一标定用户的第一标签信息进行标签传播后得到的各待标定节点的标签信息也将不同,据此确定出的目标节点也可能不同。
下面以采用LPA算法进行标签传播为例,说明进行第一次标签传播确定第二标定用户的过程,以及进行第二次标签传播确定目标用户的过程。
在利用LPA算法进行第一次标签传播时,可以先为关联网络图中的每个节点设置唯一的初始标签信息。在本申请实施例中,对第一标定用户所对应的节点,将其初始标签信息设定为第一标签信息,表示该节点所对应用户属于已确定的用户类型(例如,属于违规用户,属于赌博商户,属于洗钱主体,等)。而对于第一标定用户以外的其他用户所对应的节点,即第一待标定节点,将其初始标签信息设定为第三标签信息,表示该节点所对应用户属于尚未确定的用户类型。
在对关联网络图中各节点的标签信息进行初始化之后,即可按照预设规则更新各第一待标定节点的标签信息。具体的,对任意一个第一待标定节点,通过统计该节点的邻居节点的标签信息,采用数量最多的标签信息更新该节点的标签信息;如果数量最多的标签信息不止一种,则从中随机选择一个标签信息更新该节点的标签信息。迭代执行以上过程直至收敛,即,直至第一待标定节点的标签信息更新完毕或者迭代次数达到预设阈值。需要说明的是,当第一待标定节点的标签信息维持稳定、不再变化时,可以认为第一待标定节点的标签信息已更新完毕。
需要说明的是,在上述迭代更新节点标签的过程中,第一标定用户所对应节点的第一标签信息是维持不变的。
需要说明的是,在上述迭代更新节点标签的过程中,可以有两种标签更新策略。一种是同步更新策略,即,在执行第t次迭代更新时,仅依赖各节点在第t-1次更新后的标签信息。另一种是异步更新策略,即,在执行第t次迭代更新时,同时依赖第t次迭代时已经更新的节点的标签信息,以及在第t-1次迭代中已更新、但在第t次迭代中尚未更新的节点的标签信息。
可以理解到,若采用异步更新策略,每次迭代更新时各待标定节点的更新顺序将影响到节点的标签信息。因此,每次迭代更新中各待标定节点的更新顺序十分重要。优选的,可以在每次迭代更新开始前,随机确定本次迭代中各待标定节点的更新顺序,并以此更新顺序进行本次迭代。
具体的,可以在基于第一标签信息,在关联网络图中进行标签传播,确定关联网络图中第一待标定节点的标签信息时,先确定对关联网络图中第一待标定节点的标签信息的更新顺序,然后按照更新顺序对第一待标定节点的标签信息进行更新。
需要说明的是,在完成一次迭代更新后,可重新确定更新顺序,并迭代执行对第一待标定节点的标签信息进行更新的步骤,直至第一待标定节点的标签信息更新完毕或者迭代次数达到预设阈值。将更新完毕时的标签信息,确定为第一待标定节点的标签信息。
实施上述确定对关联网络图中第一待标定节点的标签信息的更新顺序时,优选随机确定对关联网络图中第一待标定节点的标签信息的更新顺序。
在确定更新顺序的基础上,按照更新顺序,对第一待标定节点的标签信息进行更新时,可以基于更新顺序,确定待更新的当前节点,进而根据当前节点的邻居节点的标签信息,更新当前节点的标签信息。然后,将当前节点的下一个节点作为新的当前节点,并迭代执行更新当前节点的标签信息的步骤,直至按照更新顺序遍历第一待标定节点。
进一步的,在根据当前节点的邻居节点的标签信息,更新当前节点的标签信息时,可以统计邻居节点的标签信息中、各种标签信息的出现次数,并将出现次数最多的标签信息确定为当前节点的标签信息。
以图2中所示关联网络图为例,假设用户A1为已标定用户,其他用户均为未标定用户。则对节点的标签信息进行初始化时,可以将节点A1的标签信息置为[1](表示节点所对应的用户为已标定用户,即第一标定用户),将其他节点(可称为第一待标定节点)的标签信息均置为[0](表示节点所对应的用户均为未标定用户)。
在进行第一次迭代时,假设随机确定出的迭代顺序为节点B3、节点A4、节点A2、节点B7、节点A3、节点B8、节点B4、节点B6、节点B5、节点B2、节点B1,则将按此顺序进行节点标签信息的迭代更新。
具体的,在本次迭代中:
对于节点B3,由于其相邻节点A1、节点A3和节点A4中,只有节点A1的标签信息为[1],另两个节点的标签信息均为[0],因此,节点B3的标签信息仍为[0];
对于节点A4,由于其相邻节点B1、节点B4、节点B3和节点B5的标签信息均为[0],因此,节点A4的标签信息仍为[0];
对于节点A2,由于其相邻节点B7和节点B8的标签信息均为[0],因此,节点A2的标签信息仍为[0];
对于节点B7,由于其相邻节点A2的标签信息为[0],因此,节点B7的标签信息仍为[0];
对于节点A3,由于其相邻节点B2、节点B3、节点B5和节点B6的标签信息均为[0],因此,节点A3的标签信息仍为[0];
对于节点B8,由于其相邻节点A2的标签信息为[0],因此,节点B8的标签信息仍为[0];
对于节点B4,由于其相邻节点A1的标签信息为[1],其相邻节点A4的标签信息为[0],因此,节点B4的标签信息可以在[1]和[0]中随机确定。假设,本次确定节点B4的标签信息更新为[1];
对于节点B6,由于其相邻节点A3的标签信息为[0],因此,节点B6的标签信息仍为[0];
对于节点B5,由于其相邻节点A3和节点A4的标签信息均为[0],因此,节点B5的标签信息仍为[0];
对于节点B2,由于其相邻节点A1的标签信息为[1],其相邻节点A3的标签信息为[0],因此,节点B2的标签信息可以在[1]和[0]中随机确定。假设,本次确定节点B2的标签信息更新为[1];
对于节点B1,由于其相邻节点A1的标签信息为[1],其相邻节点A4的标签信息为[0],因此,节点B1的标签信息可以在[1]和[0]中随机确定。假设,本次确定节点B1的标签信息更新为[1]。
在进行第二次迭代时,假设随机确定出的迭代顺序为节点A4、节点B3、节点B2、节点A3、节点B7、节点B4、节点B6、节点B8、节点B5、节点A2、节点B1,则将按此顺序进行节点标签信息的迭代更新。
具体的,在本次迭代中:
对于节点A4,由于其相邻节点B1和相邻节点B4的标签信息为[1](在上一次迭代中更新为[1]),相邻节点B3和相邻节点B5的标签信息为[0],因此,节点A4的标签信息可以在[1]和[0]中随机确定。假设,本次确定节点A4的标签信息更新为[1];
对于节点B3,由于其相邻节点A1的标签信息为[1],相邻节点A4的标签信息也为[1](在本次迭代中更新为[1]),相邻节点A3的标签信息为[0],因此,节点B3的标签信息更新为[1];
对于节点B2,由于其相邻节点A1的标签信息为[1],其相邻节点A3的标签信息为[0],因此,节点B2的标签信息可以在[1]和[0]中随机确定。假设,本次确定节点B2的标签信息更新为[1];
对于节点A3,由于其相邻节点B2和相邻节点B3的标签信息为[1],相邻节点B5和节点B6的标签信息为[0],因此,节点A3的标签信息可以在[1]和[0]中随机确定。假设,本次确定节点A3的标签信息仍为[0];
对于节点B7,由于其相邻节点A2的标签信息为[0],因此,节点B7的标签信息仍为[0];
对于节点B4,由于其相邻节点A1和节点A4的标签信息均为[1],因此,节点B4的标签信息更新为[1];
对于节点B6,由于其相邻节点A3的标签信息为[0],因此,节点B6的标签信息仍为[0];
对于节点B8,由于其相邻节点A2的标签信息为[0],因此,节点B8的标签信息仍为[0];
对于节点B5,由于其相邻节点A3的标签信息为[0],其相邻节点A4的标签信息为[1],因此,节点B5的标签信息可以在[1]和[0]中随机确定。假设,本次确定节点B5的标签信息更新为[1];
对于节点A2,由于其相邻节点B7和节点B8的标签信息均为[0],因此,节点A2的标签信息仍为[0];
对于节点B1,由于其相邻节点A1和节点A4的标签信息均为[1],因此,节点B1的标签信息仍为[1]。
以此类推,直至关联网络图中各待标定节点(包括节点A1以外的所有节点)的标签信息保持稳定,不再改变。在此基础上,即可基于第二用户的标签信息,确定第二用户中的第二标定用户。具体的,可将第二用户(包括节点B1、节点B2、节点B3、节点B4、节点B5、节点B6、节点B7和节点B8所对应的用户)中,标签信息为[1]的用户,确定为第二标定用户。
以图2所示关联网络图为例,假设经过第一次标签传播,确定出的第二标定用户所对应节点为节点B1、节点B2、节点B3、节点B4、节点B5和节点B6。
在此基础上,可以进一步进行第二次标签传播,即基于第一标定用户的第一标签信息和第二标定用户的第二标签信息,在关联网络图中进行标签传播,确定关联网络图中第二待标定节点的标签信息的过程。其中,第二待标定节点为关联网络图中、除第一标定用户所对应节点和第二标定用户所对应节点以外的其他节点。
延续以上示例,第二次标签传播,也就是基于节点A1的标签信息、以及节点B1、节点B2、节点B3、节点B4、节点B5和节点B6的标签信息,在图2所示的关联网络图中进行标签传播的过程。需要说明的是,在第二次标签传播过程中,节点A1、节点B1、节点B2、节点B3、节点B4、节点B5和节点B6的标签信息均不再改变,而只可能对节点A2、节点A3、节点A4、节点B7和节点B8的标签信息进行更新。
可以理解到,在进行第二次标签传播时,同样可以采用异步更新策略。具体的,可以在基于第一标签信息和第二标签信息进行标签传播时,先确定对关联网络图中第二待标定节点的标签信息的更新顺序,然后按照更新顺序对第二待标定节点的标签信息进行更新。
需要说明的是,在完成一次迭代更新后,重新确定更新顺序,并迭代执行对第二待标定节点的标签信息进行更新的步骤,直至第二待标定节点的标签信息更新完毕或者迭代次数达到预设阈值。将更新完毕时的标签信息,确定为第二待标定节点的标签信息。
实施上述确定对关联网络图中第二待标定节点的标签信息的更新顺序时,优选随机确定对关联网络图中第二待标定节点的标签信息的更新顺序。
在确定更新顺序的基础上,按照更新顺序,对第二待标定节点的标签信息进行更新时,可以基于更新顺序,确定待更新的当前节点,进而根据当前节点的邻居节点的标签信息,更新当前节点的标签信息。然后,将当前节点的下一个节点作为新的当前节点,并迭代执行更新当前节点的标签信息的步骤,直至按照更新顺序遍历第二待标定节点。
进一步的,在根据当前节点的邻居节点的标签信息,更新当前节点的标签信息时,可以统计邻居节点的标签信息中、各种标签信息的出现次数,并将出现次数最多的标签信息确定为当前节点的标签信息。
可以理解到,第二次标签传播的过程,与第一次标签传播的过程类似,此处不再赘述。以图2所示关联网络图为例,经过第二次标签传播后,由于节点A3和节点A4所对应的用户,均与第二标定用户之间存在关联关系,因此,节点A3和节点A4将被确定为目标节点。
需要特别说明的是,在反映节点之间关联关系的关联网络图中,可以根据关联关系的不同情况,对不同的边设定不同的权重。以反映第一用户与第二用户之间的交易关系的关联网络图为例,可以根据买卖双方交易的金额、交易的次数等设定边的权重。可选的,边的权重可以取得与交易金额和交易次数中至少一项正相关,即交易金额越高,交易次数越多,边的权重可以设定得越高。
进一步的,在进行第一次标签传播和/或第二次标签传播时,某一节点的边的权重,可以理解为边所对应的相邻节点的标签信息对该节点的标签信息的影响程度。可选的,相邻接点对该节点的影响程度,可以取得与对应的边的权重正相关,即边的权重越高,该边所连接到的相邻接点对该节点的影响程度越大。
以图2所示关联网络图为例,假设节点A1为第一标定用户所对应节点,其第一标签信息为[1],节点A1与节点B2之间存在3笔交易,与节点B3之间存在10笔交易,与节点B4之间存在1笔交易,与节点B1之间存在1笔交易,则可以将连接节点A1和节点B2的边的权重设定为3,将连接节点A1和节点B3的边的权重设定为10,将连接节点A1和节点B4的边的权重设定为1,将连接节点A1和节点B1的边的权重设定为1。
进一步的,进行标签传播时,在统计当前节点的邻居节点的标签信息中、各种标签信息的出现次数时,就可以将连接当前节点和各邻居节点的边的权重也纳入考虑。例如,可以将同类标签信息所对应边的权重之和,作为该标签信息的出现次数。
以确定节点B2的标签信息为例,节点B2存在两个相邻节点(节点A1和节点A3)。假设节点A3的标签信息为[0],连接节点A3和节点B2的边的权重为1;与此同时,节点A1的标签信息为[1],连接节点A1和节点B2的边的权重为3。则,在统计节点B2的邻居节点的标签信息中、各种标签信息的出现次数时,可以认为,标签信息[1]的出现次数为3(权重为3),标签信息[0]的出现次数为1。
以上举例说明了基于用户之间的关联关系,通过两次标签传播确定出目标用户的主要过程。在本申请实施例提供的目标用户识别方法中,可以根据关联关系确定第一用户和第二用户,并且,第一用户中包括已经标定有第一标签信息的第一标定用户。在此基础上,可以进一步确定出第二用户中、与第一标定用户之间存在关联关系的第二标定用户,进而可以基于第一标定用户的第一标签信息和第二标定用户的第二标签信息,从第一非标定用户中识别出与第二标定用户之间存在关联关系的目标用户。
采用上述方法,可以根据关联关系,通过与已标定的第一标定用户存在关联关系的第二标定用户识别出目标用户,因此,可以主动识别出可能存在违规违禁行为的用户(即目标用户),实现对平台交易的风险控制。
并且,由于本申请实施例基于已经客观存在的历史关联关系和已标定有标签信息的第一标定用户进行目标用户的识别,能够避免人为因素对识别结果的影响。因此,即使存在违规违禁行为的目标用户企图通过隐瞒、篡改特征信息等方式规避业务平台的风险防控,仍然能够及时、有效的从第一非标定用户中识别出目标用户,实现了对平台交易的风险控制。
在将本申请实施例的目标用户识别方法应用于违规商户识别这一场景时,第一用户具体为商家用户,第二用户具体为消费用户,第一标定用户为已知违规商户,第一非标定用户为待定商户,第一标签信息为违规标签信息,第二标定用户为预测违规用户,第二标签信息为预测违规信息,目标用户为预测违规商户。
相应的,本申请实施例提供一种违规商户识别方法,参见图3所示,该方法包括:
S201:确定存在关联关系的商家用户与消费用户,商家用户中包括已知违规商户和待定商户;
S203:根据已知违规商户的违规标签信息,确定消费用户中的预测违规用户,预测违规用户中至少一个与已知违规商户之间存在关联关系;
S205:基于已知违规商户的违规标签信息和预测违规用户的预测违规信息,从待定商户中识别出预测违规商户,预测违规商户与预测违规用户之间存在关联关系。
可以理解到,上述违规商户识别方法,是目标用户识别方法在具体场景下的应用,前述实施例中关于目标用户识别方法的相关阐述均适用于违规商户识别方法,此处不再赘述。
需要说明的是,在部分违规商户识别场景中,由于交易双方均为受益者,因此,交易双方都不会像盗用、欺诈等违规行为出现时那样主动报案,因此,需要业务平台主动、及时的进行违规商户的识别,以便进行风险控制。例如,对赌博商户的识别,对洗钱主体的识别,均需要进行主动风险识别与防控。
这类违规商户的识别主要存在以下困难:
一是这类识别属于主动风险识别,没有用户明确的反馈标签,难以使用有监督方法进行识别;
二是违规商家对风险防控有感知,会尝试规避防控,对抗性强,风险特征易变,因此,识别模型容易退化。
为进行赌博交易识别,可以采用有监督模型,以人工审理定性的赌博交易为黑样本,其他交易为白样本,使用随机森林、GBDT等机器学习方法建模。这类方法一般能够在样本上有比较好的学习效果,但是其缺点是严重依赖定性的黑样本。而且,在机器学习中,样本标记的成本很高,因此,难以获得足够多的样本进行学习,这就导致这种方法虽然准确度高,但是覆盖率低。除此之外,在赌博识别等违规行为的识别中,因为对抗性强,赌博风险特征等违规特征容易发生变化,因此,采用这种方法训练得到的模型不够稳定,需要频繁重建模型,造成建模成本过高。因此,这种方法难以有效的应用于这种主动风险识别场景。
而在本申请实施例中,考虑到赌徒(即交易中的买方,违规用户)相对稳定,因此,通过赌徒与赌博商户之间的交易关系、通信关系等关联关系,以已知的赌博商户作为黑种子,利用已知的赌博商户,通过标签传播算法发现赌徒,再利用赌徒的聚集性,再次通过标签传播算法发现新的赌博商户。因此,即使赌博商户改头换面,企图规避风险防控,业务平台仍然可以有效、及时、准确的定位到新开的赌博商户,提高了赌博商户识别的准确性与稳定性。
参见图4所示,与前述实施例中提供的目标用户识别方法相对应的,本申请实施例提供一种目标用户识别装置,包括:
用户确定模块101,用于确定存在关联关系的第一用户与第二用户,第一用户中包括第一标定用户和第一非标定用户;
第二标定用户确定模块103,用于根据第一标定用户的第一标签信息,确定第二用户中的第二标定用户,第二标定用户中至少一个与第一标定用户之间存在关联关系;
目标用户识别模块105,用于基于第一标定用户的第一标签信息和第二标定用户的第二标签信息,从第一非标定用户中识别出目标用户,目标用户与第二标定用户之间存在关联关系。
能够理解,上述目标用户识别装置,能够实现前述实施例中提供的目标用户识别方法的各个步骤,关于目标用户识别方法的相关阐释均适用于目标用户识别装置,此处不再赘述。
参见图5所示,与前述实施例中提供的违规商户识别方法相对应的,本申请实施例提供一种违规商户识别装置,包括:
用户确定模块201,用于确定存在关联关系的商家用户与消费用户,商家用户中包括已知违规商户和待定商户;
预测违规用户确定模块203,用于根据已知违规商户的违规标签信息,确定消费用户中的预测违规用户,预测违规用户中至少一个与已知违规商户之间存在关联关系;
预测违规商户识别模块205,用于基于已知违规商户的违规标签信息和预测违规用户的预测违规信息,从待定商户中识别出预测违规商户,预测违规商户与预测违规用户之间存在关联关系。
能够理解,上述违规商户识别装置,能够实现前述实施例中提供的违规商户识别方法的各个步骤,关于违规商户识别方法的相关阐释均适用于违规商户识别装置,此处不再赘述。
图6是本申请的一个实施例电子设备的结构示意图。请参考图6,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成目标用户识别装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
确定存在关联关系的第一用户与第二用户,第一用户中包括第一标定用户和第一非标定用户;
根据第一标定用户的第一标签信息,确定第二用户中的第二标定用户,第二标定用户中至少一个与第一标定用户之间存在关联关系;
基于第一标定用户的第一标签信息和第二标定用户的第二标签信息,从第一非标定用户中识别出目标用户,目标用户与第二标定用户之间存在关联关系。
上述如本申请图1所示实施例揭示的目标用户识别装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1中目标用户识别装置执行的方法,并实现目标用户识别装置在图1所示实施例的功能,本申请实施例在此不再赘述。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行图1所示实施例中目标用户识别装置执行的方法,并具体用于执行:
确定存在关联关系的第一用户与第二用户,第一用户中包括第一标定用户和第一非标定用户;
根据第一标定用户的第一标签信息,确定第二用户中的第二标定用户,第二标定用户中至少一个与第一标定用户之间存在关联关系;
基于第一标定用户的第一标签信息和第二标定用户的第二标签信息,从第一非标定用户中识别出目标用户,目标用户与第二标定用户之间存在关联关系。
图7是本申请的一个实施例电子设备的结构示意图。请参考图7,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成违规商户识别装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
确定存在关联关系的商家用户与消费用户,商家用户中包括已知违规商户和待定商户;
根据已知违规商户的违规标签信息,确定消费用户中的预测违规用户,预测违规用户中至少一个与已知违规商户之间存在关联关系;
基于已知违规商户的违规标签信息和预测违规用户的预测违规信息,从待定商户中识别出预测违规商户,预测违规商户与预测违规用户之间存在关联关系。
上述如本申请图3所示实施例揭示的违规商户识别装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图3中违规商户识别装置执行的方法,并实现违规商户识别装置在图3所示实施例的功能,本申请实施例在此不再赘述。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行图3所示实施例中违规商户识别装置执行的方法,并具体用于执行:
确定存在关联关系的商家用户与消费用户,商家用户中包括已知违规商户和待定商户;
根据已知违规商户的违规标签信息,确定消费用户中的预测违规用户,预测违规用户中至少一个与已知违规商户之间存在关联关系;
基于已知违规商户的违规标签信息和预测违规用户的预测违规信息,从待定商户中识别出预测违规商户,预测违规商户与预测违规用户之间存在关联关系。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (24)

1.一种目标用户识别方法,包括:
确定存在关联关系的第一用户与第二用户,所述第一用户中包括第一标定用户和第一非标定用户;
根据所述第一标定用户的第一标签信息,确定所述第二用户中的第二标定用户,所述第二标定用户中至少一个与所述第一标定用户之间存在关联关系;
基于所述第一标定用户的第一标签信息和所述第二标定用户的第二标签信息,从所述第一非标定用户中识别出目标用户,所述目标用户与所述第二标定用户之间存在关联关系。
2.根据权利要求1所述方法,在根据所述第一标定用户的第一标签信息,确定所述第二用户中的第二标定用户之前,所述方法还包括:
基于所述第一用户和所述第二用户及其关联关系,创建关联网络图,其中,所述关联网络图中的节点对应所述第一用户或者所述第二用户,所述关联网络图中的边用于连接存在关联关系的第一用户和第二用户所对应的节点;
则根据所述第一标定用户的第一标签信息,确定所述第二用户中的第二标定用户,具体为:
根据所述第一标定用户的第一标签信息,在所述关联网络图中进行标签传播,确定所述第二用户中的第二标定用户。
3.根据权利要求2所述方法,根据所述第一标定用户的第一标签信息,在所述关联网络图中进行标签传播,确定所述第二用户中的第二标定用户,包括:
根据所述第一标定用户的第一标签信息,对所述关联网络图中各节点的标签信息进行初始化;
基于所述第一标签信息,在所述关联网络图中进行标签传播,确定所述关联网络图中第一待标定节点的标签信息,所述第一待标定节点为所述关联网络图中、除所述第一标定用户所对应节点以外的其他节点;
基于所述第二用户的标签信息,确定所述第二用户中的第二标定用户。
4.根据权利要求3所述方法,基于所述第二用户的标签信息,确定所述第二用户中的第二标定用户,包括:
将标签信息满足第一预设条件的第二用户,确定为所述第二标定用户。
5.根据权利要求3所述方法,基于所述第一标签信息,在所述关联网络图中进行标签传播,确定所述关联网络图中第一待标定节点的标签信息,包括:
确定对所述关联网络图中第一待标定节点的标签信息的更新顺序;
按照所述更新顺序,对所述第一待标定节点的标签信息进行更新;
重新确定所述更新顺序,并迭代执行所述对所述第一待标定节点的标签信息进行更新的步骤,直至所述第一待标定节点的标签信息更新完毕或者迭代次数达到预设阈值;
将更新完毕时的标签信息,确定为所述第一待标定节点的标签信息。
6.根据权利要求5所述方法,确定对所述关联网络图中第一待标定节点的标签信息的更新顺序,具体为:
随机确定对所述关联网络图中第一待标定节点的标签信息的更新顺序。
7.根据权利要求5所述方法,按照所述更新顺序,对所述第一待标定节点的标签信息进行更新,包括:
基于所述更新顺序,确定待更新的当前节点;
根据所述当前节点的邻居节点的标签信息,更新所述当前节点的标签信息;
将所述当前节点的下一个节点作为新的当前节点,并迭代执行所述更新所述当前节点的标签信息的步骤,直至按照所述更新顺序遍历所述第一待标定节点。
8.根据权利要求7所述方法,根据所述当前节点的邻居节点的标签信息,更新所述当前节点的标签信息,包括:
统计所述邻居节点的标签信息中、各种标签信息的出现次数;
将出现次数最多的标签信息确定为所述当前节点的标签信息。
9.根据权利要求2所述方法,基于所述第一标定用户的第一标签信息和所述第二标定用户的第二标签信息,从所述第一非标定用户中识别出目标用户,包括:
基于所述第一标签信息和所述第二标签信息,在所述关联网络图中进行标签传播,确定所述关联网络图中第二待标定节点的标签信息,所述第二待标定节点为所述关联网络图中、除所述第一标定用户所对应节点和所述第二标定用户所对应节点以外的其他节点;
基于所述第一非标定用户的标签信息,确定所述第一非标定用户中的目标用户。
10.根据权利要求9所述方法,基于所述第一非标定用户的标签信息,确定所述第一非标定用户中的目标用户,包括:
将标签信息满足第二预设条件的第一非标定用户,确定为所述目标用户。
11.根据权利要求9所述方法,基于所述第一标签信息和所述第二标签信息,在所述关联网络图中进行标签传播,确定所述关联网络图中第二待标定节点的标签信息,包括:
确定对所述关联网络图中第二待标定节点的标签信息的更新顺序;
按照所述更新顺序,对所述第二待标定节点的标签信息进行更新;
重新确定所述更新顺序,并迭代执行所述对所述第二待标定节点的标签信息进行更新的步骤,直至所述第二待标定节点的标签信息更新完毕或者迭代次数达到预设阈值;
将更新完毕时的标签信息,确定为所述第二待标定节点的标签信息。
12.根据权利要求11所述方法,确定对所述关联网络图中第二待标定节点的标签信息的更新顺序,具体为:
随机确定对所述关联网络图中第二待标定节点的标签信息的更新顺序。
13.根据权利要求11所述方法,按照所述更新顺序,对所述第二待标定节点的标签信息进行更新,包括:
基于所述更新顺序,确定待更新的当前节点;
根据所述当前节点的邻居节点的标签信息,更新所述当前节点的标签信息;
将所述当前节点的下一个节点作为新的当前节点,并迭代执行所述更新所述当前节点的标签信息的步骤,直至按照所述更新顺序遍历所述第二待标定节点。
14.根据权利要求13所述方法,根据所述当前节点的邻居节点的标签信息,更新所述当前节点的标签信息,包括:
统计所述邻居节点的标签信息中、各种标签信息的出现次数;
将出现次数最多的标签信息确定为所述当前节点的标签信息。
15.根据权利要求1~14之任一所述方法,所述第一用户具体为商家用户,所述第二用户具体为消费用户,所述第一标定用户为已知违规商户,所述第一非标定用户为待定商户,所述第一标签信息为违规标签信息,所述第二标定用户为预测违规用户,所述第二标签信息为预测违规信息,所述目标用户为预测违规商户。
16.根据权利要求1~14之任一所述方法,所述关联关系为交易关系、通信关系、设备连接关系中至少一种。
17.一种违规商户识别方法,包括:
确定存在关联关系的商家用户与消费用户,所述商家用户中包括已知违规商户和待定商户;
根据所述已知违规商户的违规标签信息,确定所述消费用户中的预测违规用户,所述预测违规用户中至少一个与所述已知违规商户之间存在关联关系;
基于所述已知违规商户的违规标签信息和所述预测违规用户的预测违规信息,从所述待定商户中识别出预测违规商户,所述预测违规商户与所述预测违规用户之间存在关联关系。
18.根据权利要求17所述方法,所述关联关系为交易关系、通信关系、设备连接关系中至少一种。
19.一种目标用户识别装置,包括:
用户确定模块,用于确定存在关联关系的第一用户与第二用户,所述第一用户中包括第一标定用户和第一非标定用户;
第二标定用户确定模块,用于根据所述第一标定用户的第一标签信息,确定所述第二用户中的第二标定用户,所述第二标定用户中至少一个与所述第一标定用户之间存在关联关系;
目标用户识别模块,用于基于所述第一标定用户的第一标签信息和所述第二标定用户的第二标签信息,从所述第一非标定用户中识别出目标用户,所述目标用户与所述第二标定用户之间存在关联关系。
20.一种违规商户识别装置,包括:
用户确定模块,用于确定存在关联关系的商家用户与消费用户,所述商家用户中包括已知违规商户和待定商户;
预测违规用户确定模块,用于根据所述已知违规商户的违规标签信息,确定所述消费用户中的预测违规用户,所述预测违规用户中至少一个与所述已知违规商户之间存在关联关系;
预测违规商户识别模块,用于基于所述已知违规商户的违规标签信息和所述预测违规用户的预测违规信息,从所述待定商户中识别出预测违规商户,所述预测违规商户与所述预测违规用户之间存在关联关系。
21.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
确定存在关联关系的第一用户与第二用户,所述第一用户中包括第一标定用户和第一非标定用户;
根据所述第一标定用户的第一标签信息,确定所述第二用户中的第二标定用户,所述第二标定用户中至少一个与所述第一标定用户之间存在关联关系;
基于所述第一标定用户的第一标签信息和所述第二标定用户的第二标签信息,从所述第一非标定用户中识别出目标用户,所述目标用户与所述第二标定用户之间存在关联关系。
22.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
确定存在关联关系的第一用户与第二用户,所述第一用户中包括第一标定用户和第一非标定用户;
根据所述第一标定用户的第一标签信息,确定所述第二用户中的第二标定用户,所述第二标定用户中至少一个与所述第一标定用户之间存在关联关系;
基于所述第一标定用户的第一标签信息和所述第二标定用户的第二标签信息,从所述第一非标定用户中识别出目标用户,所述目标用户与所述第二标定用户之间存在关联关系。
23.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
确定存在关联关系的商家用户与消费用户,所述商家用户中包括已知违规商户和待定商户;
根据所述已知违规商户的违规标签信息,确定所述消费用户中的预测违规用户,所述预测违规用户中至少一个与所述已知违规商户之间存在关联关系;
基于所述已知违规商户的违规标签信息和所述预测违规用户的预测违规信息,从所述待定商户中识别出预测违规商户,所述预测违规商户与所述预测违规用户之间存在关联关系。
24.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
确定存在关联关系的商家用户与消费用户,所述商家用户中包括已知违规商户和待定商户;
根据所述已知违规商户的违规标签信息,确定所述消费用户中的预测违规用户,所述预测违规用户中至少一个与所述已知违规商户之间存在关联关系;
基于所述已知违规商户的违规标签信息和所述预测违规用户的预测违规信息,从所述待定商户中识别出预测违规商户,所述预测违规商户与所述预测违规用户之间存在关联关系。
CN201811330098.1A 2018-11-09 2018-11-09 目标用户识别方法、违规商户识别方法和装置 Active CN109615461B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811330098.1A CN109615461B (zh) 2018-11-09 2018-11-09 目标用户识别方法、违规商户识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811330098.1A CN109615461B (zh) 2018-11-09 2018-11-09 目标用户识别方法、违规商户识别方法和装置

Publications (2)

Publication Number Publication Date
CN109615461A true CN109615461A (zh) 2019-04-12
CN109615461B CN109615461B (zh) 2022-04-29

Family

ID=66003976

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811330098.1A Active CN109615461B (zh) 2018-11-09 2018-11-09 目标用户识别方法、违规商户识别方法和装置

Country Status (1)

Country Link
CN (1) CN109615461B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110264037A (zh) * 2019-05-14 2019-09-20 阿里巴巴集团控股有限公司 一种用户数据的处理方法和装置
CN110348516A (zh) * 2019-07-11 2019-10-18 同盾控股有限公司 数据处理方法、装置、存储介质及电子设备
CN110555172A (zh) * 2019-08-30 2019-12-10 京东数字科技控股有限公司 用户关系挖掘方法及装置、电子设备和存储介质
CN111062770A (zh) * 2019-10-31 2020-04-24 支付宝(杭州)信息技术有限公司 商户识别方法、设备及计算机可读介质
CN112669053A (zh) * 2020-12-03 2021-04-16 杭州未名信科科技有限公司 基于销售数据的欺诈群体识别方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015044690A1 (en) * 2013-09-30 2015-04-02 Visa Europe Limited Account association systems and methods
CN106779811A (zh) * 2016-11-25 2017-05-31 中国银联股份有限公司 一种消费商户预测方法和装置
CN107730262A (zh) * 2017-10-23 2018-02-23 阿里巴巴集团控股有限公司 一种欺诈识别方法和装置
CN108174296A (zh) * 2018-01-02 2018-06-15 武汉斗鱼网络科技有限公司 恶意用户识别方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015044690A1 (en) * 2013-09-30 2015-04-02 Visa Europe Limited Account association systems and methods
CN106779811A (zh) * 2016-11-25 2017-05-31 中国银联股份有限公司 一种消费商户预测方法和装置
CN107730262A (zh) * 2017-10-23 2018-02-23 阿里巴巴集团控股有限公司 一种欺诈识别方法和装置
CN108174296A (zh) * 2018-01-02 2018-06-15 武汉斗鱼网络科技有限公司 恶意用户识别方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110264037A (zh) * 2019-05-14 2019-09-20 阿里巴巴集团控股有限公司 一种用户数据的处理方法和装置
CN110264037B (zh) * 2019-05-14 2023-10-27 创新先进技术有限公司 一种用户数据的处理方法和装置
CN110348516A (zh) * 2019-07-11 2019-10-18 同盾控股有限公司 数据处理方法、装置、存储介质及电子设备
CN110348516B (zh) * 2019-07-11 2021-05-11 同盾控股有限公司 数据处理方法、装置、存储介质及电子设备
CN110555172A (zh) * 2019-08-30 2019-12-10 京东数字科技控股有限公司 用户关系挖掘方法及装置、电子设备和存储介质
CN110555172B (zh) * 2019-08-30 2023-04-07 京东科技控股股份有限公司 用户关系挖掘方法及装置、电子设备和存储介质
CN111062770A (zh) * 2019-10-31 2020-04-24 支付宝(杭州)信息技术有限公司 商户识别方法、设备及计算机可读介质
CN112669053A (zh) * 2020-12-03 2021-04-16 杭州未名信科科技有限公司 基于销售数据的欺诈群体识别方法、装置、设备及介质

Also Published As

Publication number Publication date
CN109615461B (zh) 2022-04-29

Similar Documents

Publication Publication Date Title
CN109615461A (zh) 目标用户识别方法、违规商户识别方法和装置
Chatterjee et al. Quantitative analysis of smart contracts
WO2021259140A1 (zh) 基于区块链的原创作品交易方法及装置和电子设备
CN109816323A (zh) 用于区块链网络的交易审核方法、计算设备、存储介质
CN102541899B (zh) 一种信息识别方法及设备
US20210312444A1 (en) Data processing method, node, blockchain network, and virtual data carrier
CN112465627B (zh) 基于区块链和机器学习的金融借贷审核方法及系统
CN107256465A (zh) 风险账户的识别方法及装置
CN109064171A (zh) 一种区块链并行交易的方法、装置及电子系统
CN109508879A (zh) 一种风险的识别方法、装置及设备
CN110009365A (zh) 非正常转移电子资产的用户群体检测方法、装置和设备
CN112990941B (zh) 一种针对智能合约中庞氏骗局的漏洞检测方法及系统
CN110428139A (zh) 基于标签传播的信息预测方法及装置
CN108734469A (zh) 确定待定用户风险标签的方法和装置
CN110060053A (zh) 一种识别方法、设备及计算机可读介质
US11354671B2 (en) Fraud mitigation using one or more enhanced spatial features
Pal et al. On a way to improve cyber-insurer profits when a security vendor becomes the cyber-insurer
CN110046784A (zh) 一种用户准入的风险确定方法及装置
CN110020865A (zh) 交易识别方法及装置
CN109636181A (zh) 一种用户信用分计算方法及系统
CN110517145A (zh) 基于多区块链间的数据交易方法及相关设备
CN113609345A (zh) 目标对象关联方法和装置、计算设备以及存储介质
CN108635851A (zh) 一种游戏画面的处理方法和装置
CN113297594B (zh) 跨链交易方法、装置、电子设备及存储介质
CN109614263A (zh) 一种容灾数据处理方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant