CN115204888A - 一种目标账户识别方法、装置、存储介质和电子设备 - Google Patents

一种目标账户识别方法、装置、存储介质和电子设备 Download PDF

Info

Publication number
CN115204888A
CN115204888A CN202110399907.XA CN202110399907A CN115204888A CN 115204888 A CN115204888 A CN 115204888A CN 202110399907 A CN202110399907 A CN 202110399907A CN 115204888 A CN115204888 A CN 115204888A
Authority
CN
China
Prior art keywords
nodes
class
node
interactive
account
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110399907.XA
Other languages
English (en)
Inventor
张密
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110399907.XA priority Critical patent/CN115204888A/zh
Publication of CN115204888A publication Critical patent/CN115204888A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4014Identity check for transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种目标账户识别方法、装置、存储介质和电子设备,涉及互联网技术领域。其中,目标账户识别方法包括:根据各个第一类账户与各个第二类账户之间的资源交互信息,生成多个交互二分图;分别对得到的交互二分图中各节点之间的连接密度进行检测,获得其各自对应的检测结果;针对各个候选节点:基于包含有该候选节点的检测结果的总数目,确定该候选节点对应的账户是否为目标账户。本申请根据各个第一类账户与各个第二类账户之间的资源交互信息,生成多个属于异构网络的交互二分图,通过对属于异构网络的交互二分图进行检测,确定第一类账户和第二类账户中的目标账户。通过该方法,可以快速识别出目标账户,提高目标账户的识别效率。

Description

一种目标账户识别方法、装置、存储介质和电子设备
技术领域
本申请涉及互联网技术领域,更具体地说,涉及一种目标账户识别方法、装置、存储介质和电子设备。
背景技术
随着移动支付的日益发展,人们的购物模式日益多样化,随之出现了采用支付应用扫码或刷脸等移动支付方式。通过移动交易平台,消费者可以向商户进行支付,商户也可以向消费者进行支付。
商户和消费者均作为移动交易平台的用户。用户的质量均参差不齐,正常用户数量一般占绝大多数,但其中也会隐藏一些不良用户。不良用户的违规行为,如商户的网络欺诈行为,消费者为商户刷单的行为等,会扰乱移动支付的健康发展,因此,对不良用户应予以打击。
目前,通常需要人工对平台中的账户进行识别定性,确定账户为不良用户的账户时,对其予以打击。然而,移动交易平台存在大量账户,人工对账户进行识别每次对账户的处理数量有限,且花费时间较长,因此,确定不良账户的效率较低。
发明内容
为解决相关技术中存在的技术问题,本申请实施例提供一种目标账户识别方法、装置、存储介质和电子设备,能够提高目标账户的识别效率。
为达到上述目的,本申请实施例的技术方案是这样实现的:
第一方面,本申请实施例提供一种目标账户识别方法,所述方法包括:
根据各个第一类账户与各个第二类账户之间的资源交互信息,生成多个交互二分图;其中,每个交互二分图中包含多个节点,所述多个节点包括:存在资源交互行为的第一类账户和第二类账户分别对应的第一类节点和第二类节点;
分别对得到的交互二分图中各节点之间的连接密度进行检测,获得所述多个交互二分图各自对应的检测结果;其中,每个检测结果中各候选节点之间的连接密度满足设定条件;
分别针对获得的各个候选节点执行以下操作:确定包含有所述候选节点的检测结果的总数目,基于所述总数目,确定所述候选节点对应的账户是否为目标账户。
第二方面,本申请实施例提供一种目标账户识别装置,所述装置包括:
采样单元,用于根据各个第一类账户与各个第二类账户之间的资源交互信息,生成多个交互二分图;其中,每个交互二分图中包含多个节点,所述多个节点至少包括:存在资源交互行为的第一类账户和第二类账户分别对应的第一类节点和第二类节点;
检测单元,用于分别对得到的交互二分图中各节点之间的连接密度进行检测,获得所述多个交互二分图各自对应的检测结果;其中,每个检测结果中各候选节点之间的连接密度满足设定条件;
识别单元,用于分别针对获得的各个候选节点执行以下操作:确定包含有所述候选节点的检测结果的总数目,基于所述总数目,确定所述候选节点对应的账户是否为目标账户。
在一种可选的实施例中,所述采样单元,具体用于:
获取设定时间段内用于记录各个第一类账户与各个第二类账户之间的资源交换行为的资源交互信息;
将所述资源交互信息中的第一类账户作为第一类节点,将所述资源交互信息中的第二类账户作为第二类节点,根据第一类账户与第二类账户之间的资源交换行为,生成连接相应第一类节点与相应第二类节点的边,得到资源交互总图;
从所述资源交互总图中选取部分第一类节点和部分第二类节点,并根据选取的部分第一类节点和部分第二类节点,以及所述部分第一类节点和所述部分第二类节点之间的边,生成交互二分图;
重复执行从所述资源交互总图中选取部分第一类节点和部分第二类节点的操作,得到多个交互二分图。
在一种可选的实施例中,所述采样单元,具体用于:
将所述资源交互总图转化为总邻接矩阵;其中,所述总邻接矩阵中的行对应所述资源交互总图中的第二类节点,所述总邻接矩阵中的列对应所述资源交互总图中的第一类节点;所述总邻接矩阵中的矩阵元素表示所属行对应的第二类节点与所属列对应的第一类节点之间是否存在边;
按照设定的采样率,对所述总邻接矩阵进行采样,得到子邻接矩阵;
根据所述子邻接矩阵中的行对应的第二类节点,所述子邻接矩阵中的列对应的第一类节点,以及所述子邻接矩阵中的矩阵元素,将所述子邻接矩阵转化为交互二分图。
在一种可选的实施例中,所述采样单元,具体用于:
按照各个第一类节点对应的第一类账户的交互属性信息,将所述资源交互总图中的各个第一类节点划分至相应的第一类层级;所述交互属性信息包括资源交互总额、资源交互频率或资源交互次数中的至少一种;
按照各个第二类节点对应的第二类账户的交互属性信息,将所述资源交互总图中的各个第二类节点划分至相应的第二类层级;
按照设定的采样率,分别从各个第二类层级包含的第二类节点中选取部分第二类节点,以及按照所述采样率,分别从各个第一类层级包含的第一类节点中选取部分第一类节点。
在一种可选的实施例中,所述检测单元,具体用于:
针对各个交互二分图,分别执行如下操作:
获取所述交互二分图对应的所有交互子图;所述交互子图包含的节点数量不大于所述交互二分图包含的节点数量;
根据各个交互子图中包含的第二类节点的数量、第一类节点的数量、以及各第二类节点的度数,分别确定各个交互子图的紧密度;所述紧密度用于表征对应的交互子图中各节点之间的连接密度;所述节点的度数为与所述节点连接的边的数量;
根据紧密度最大的交互子图,确定所述交互二分图对应的检测结果。
在一种可选的实施例中,所述检测单元,具体用于:
针对各个交互二分图,分别执行如下操作:
将所述交互二分图作为待处理二分图,采用循环迭代方式执行以下操作,直至满足循环结束条件为止,得到所述交互二分图对应的多个候选检测图;其中,一次循环迭代过程包括:
根据待处理二分图中各个节点的度数,逐个减少节点的数量,得到多个待检测子图;所述节点的度数为与所述节点连接的边的数量;
根据各个待检测子图中包含的第二类节点的数量、第一类节点的数量、以及各第二类节点的度数,分别确定各个待检测子图的紧密度;所述紧密度用于表征对应的待检测子图中各节点之间的连接密度;
将紧密度符合第一预设条件的待检测子图中的节点添加至候选检测图,并确定所述候选检测图的紧密度;
将紧密度符合第一预设条件的待检测子图中的节点从所述待处理二分图中移除,得到更新的交互二分图,并将更新的交互二分图作为待处理二分图;
根据得到的各个候选检测图的紧密度,从所述多个候选检测图中确定目标检测图,并根据所述目标检测图,确定所述交互二分图对应的检测结果。
在一种可选的实施例中,所述检测单元,具体用于:
根据各个候选检测图的紧密度,分别确定各个所述候选检测图的紧密度的二阶导数;
将紧密度的二阶导数符合第二预设条件的候选检测图作为所述目标检测图。
在一种可选的实施例中,所述识别单元,具体用于:
若所述总数目不小于设定阈值,则将所述候选节点对应的账户作为目标账户;或者,
将包含所述候选节点的检测结果作为目标检测结果;
将各个目标检测结果中包含的节点数量的倒数之和,作为所述候选节点对应的检测值;
若所述候选节点对应的检测值不小于设定检测阈值,则将所述候选节点对应的账户作为目标账户。
第三方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现第一方面的目标账户识别方法。
第四方面,本申请实施例还提供了一种电子设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器实现第一方面的目标账户识别方法。
本申请实施例提供的目标账户识别方法、装置、存储介质和电子设备,根据各个第一类账户与各个第二类账户之间的资源交互信息,生成多个属于异构网络的交互二分图,通过对属于异构网络的交互二分图进行检测,确定第一类账户和第二类账户中的目标账户。通过该方法,可以快速识别出目标账户,提高目标账户的识别效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种目标账户识别方法的应用场景示意图;
图2为本申请实施例提供的一种目标账户识别方法的流程示意图;
图3为本申请实施例提供的一种资源交互总图的示意图;
图4为本申请实施例提供的一种目标账户识别结果的示意图;
图5为本申请实施例提供的另一种目标账户识别结果的示意图;
图6为本申请实施例提供的另一种目标账户识别方法的流程示意图;
图7为本申请实施例提供的一种将资源交互总图转化为邻接矩阵的示意图;
图8为本申请实施例提供的一种基于邻接矩阵进行采样得到交互二分图的示意图;
图9为图6中步骤S604的流程示意图;
图10为本申请实施例提供的一种目标账户识别装置的结构框图;
图11为本申请实施例提供的一种电子设备的结构框图;
图12为本申请实施例提供的另一种电子设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
需要说明的是,本申请的文件中涉及的术语“包括”和“具有”以及它们的变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
以下对本申请实施例中的部分用语进行解释说明,以便于本领域技术人员理解。
(1)同构网络:网络的概念与图的概念一致,是由若干给定的节点和连接任意两个节点的边构成的图形。同构网络指网络中的节点都是同一类型,比如用户-用户交易形成的网络,网络中的节点类型都是用户,该网络为同构网络。
(2)异构网络:网络中的节点至少属于两种不同的类型,比如学者-论文-会议网络,网络中的节点类型有三种,分别是学者、论文和会议。在本申请实施例中,交互二分图中包括两种不同类型的节点,第一类账户对应的第一类节点和第二类账户对应的第二类节点,因此,交互二分图属于异构网络。
(3)交互二分图:图中的节点属于两种不同的类型,并且同一种类型的节点之间没有边连接。比如商户账户-消费者账户交易形成的网络,网络中的节点类型为商户账户或者消费者账户,并且商户账户和商户账户之间没有关联,消费者账户和消费者账户之间也没有关联。
下文中所用的词语“示例性”的意思为“用作例子、实施例或说明性”。作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
文中的术语“第一”、“第二”仅用于描述目的,而不能理解为明示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征,在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
为更好地理解本申请实施例提供的技术方案,下面对本申请实施例提供的技术方案适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施时,可以根据实际需要灵活地应用本申请实施例提供的技术方案。
本申请实施例涉及区块链(Blockchain)技术,区块链为分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的区块。每一个区块中记录了一批次用户行为的测试数据,用于验证其测试数据的有效性(防伪)和生成下一个区块。区块链的每个区块中包括本区块存储的测试数据的哈希值(本区块的哈希值)、以及前一区块的哈希值,各区块通过哈希值连接形成区块链。另外,区块链的每个区块中还可以包括本区块生成时的时间戳等信息。
本申请实施例中,商户账户与消费者账户的交易信息可以实时保存到区块链上,服务器从区块链上获取各商户账户与各消费者账户的交易信息,根据交易信息生成交互二分图。
本申请实施例还涉及人工智能(Artificial Intelligence,AI)和机器学习(Machine Learning,ML)技术,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术主要包括计算机视觉技术、语音处理技术、以及机器学习/深度学习等几大方向。
随着人工智能技术研究和进步,人工智能在多个领域展开研究和应用,例如常见的智能家居、图像检索、视频监控、视频检测、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗等,相信随着技术的发展,人工智能将在更多的领域得到应用,并发挥越来越重要的价值。
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。本申请实施例使用基于机器学习的网络模型,根据获取的资源交互信息生成资源交互总图。
本申请实施例提供的目标账户识别方法,可以用于对交易平台中的不良账户进行识别,也可以用于在包括两种不同类型的账户的其他平台中识别符合设定条件的目标账户。下文实施例中以在交易平台中使用本申请实施例提供的目标账户识别方法为例进行说明。
示例性地,本申请实施例所提供的目标账户识别方法可以应用于图1示出的一种应用场景中。参见图1所示,服务器100通过网络200与终端设备300进行通信连接,其中,网络200可以是但不限于局域网、城域网或广域网等,与服务器100连接的终端设备300的数量可以是多个。终端设备300可以通过网络200和服务器100相互传输通信数据和消息。
终端设备300可以是便携设备(例如:手机、平板电脑、笔记本电脑等),也可以是计算机、智能屏或个人电脑(PC,Personal Computer)等。终端设备300可以安装有各类客户端,包括资源交互客户端、移动交易客户端等,并且是能够将已安装的客户端中提供的各个操作界面及操作界面中的各个对象进行显示的电子设备。
客户端是一种安装在终端设备300上的软件,例如,安装在手机等移动终端上的APP,属于终端设备300中的软件资源。例如,终端设备300可以通过网络下载客户端的安装包,利用安装包安装该客户端,完成安装后,客户端即可在终端设备300上运行。
服务器100可以是交易平台对应的服务器。服务器100可以是一台服务器或由若干台服务器组成的服务器集群或分布式系统,或者是一个虚拟化平台,或者是,也可以是个人计算机、大中型计算机或计算机集群,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。根据实现需要,本申请实施例中的应用场景中可以具有任意数目的终端设备和服务器。本申请实施例对此不做特殊限定。
示例性地,终端设备300上安装有移动交易客户端。用户可以通过移动交易客户端在交易平台上注册账户,例如注册消费者账户。用户可以使用注册的消费者账户登录交易平台,与交易平台中注册的商户账户进行交易,例如,向商户账户进行支付,以从商户账户购买相应的商品或服务。
在每次商户账户与消费者账户进行交易的过程中,交易平台或者服务器100可以记录交易信息。在一种可能的应用场景中,各个商户账户与各个消费者账户的交易信息可以采用云存储技术进行存储。云存储(cloudstorage)是在云计算概念上延伸和发展出来的一个新的概念,分布式云存储系统(以下简称存储系统)是指通过集群应用、网格技术以及分布存储文件系统等功能,将网络中大量各种不同类型的存储设备(存储设备也称之为存储节点)通过应用软件或应用接口集合起来协同工作,共同对外提供数据存储和业务访问功能的一个存储系统。
在一种可能的应用场景中,为了便于降低通信时延,可以在各个地区部署服务器100,或为了负载均衡,可以由不同的服务器100分别去服务各个终端设备300对应的地区。多个服务器100以通过区块链实现数据的共享,多个服务器100相当于多个服务器100组成的数据共享系统。例如终端设备300位于地点a,与服务器100之间进行通信连接,终端设备300位于地点b,与其他服务器100之间通信连接。
对于数据共享系统中的每个服务器100,均具有与该服务器100对应的节点标识,数据共享系统中的每个服务器100均可以存储有数据共享系统中其他服务器100的节点标识,以便后续根据其他服务器100的节点标识,将生成的区块广播至数据共享系统中的其他服务器100。每个服务器100中可维护一个如下表所示的节点标识列表,将服务器100名称和节点标识对应存储至该节点标识列表中。其中,节点标识可为IP(Internet Protocol,网络之间互联的协议)地址以及其他任一种能够用于标识该节点的信息,表1中仅以IP地址为例进行说明。
表1
服务器名称 节点标识
节点1 119.115.151.174
节点2 118.116.189.145
节点N 119.124.789.258
由于移动交易平台的用户中会隐藏一些不良用户。不良用户的违规行为,如商户的网络欺诈行为,消费者为商户刷单的行为等,会扰乱移动支付的健康发展。目前,通过人工对平台中的账户进行识别定性,确定账户为不良用户的账户时,对其予以打击的方式,确定不良账户的效率较低。
基于此,本申请实施例提供一种目标账户识别方法、装置、存储介质和电子设备。本申请实施例中的服务器100根据各个第一类账户与各个第二类账户之间的资源交互信息,生成多个交互二分图。其中,每个交互二分图中包含多个节点,多个节点中至少包括:存在资源交互行为的第一类账户和第二类账户分别对应的第一类节点和第二类节点。服务器100分别对得到的交互二分图中各节点之间的连接密度进行检测,获得多个交互二分图各自对应的检测结果;其中,每个检测结果中各候选节点之间的连接密度满足设定条件。服务器100分别针对获得的各个候选节点执行以下操作:确定包含有各个候选节点中的一个候选节点的检测结果的总数目,基于总数目,确定一个候选节点对应的账户是否为目标账户。
本申请实施例根据各个第一类账户与各个第二类账户之间的资源交互信息,生成多个属于异构网络的交互二分图,通过对属于异构网络的交互二分图进行检测,确定第一类账户和第二类账户中的目标账户。通过该方法,可以快速识别出目标账户,提高目标账户的识别效率。
为进一步说明本申请实施例提供的技术方案,下面结合附图以及具体实施方式对此进行详细的说明。虽然本申请实施例提供了如下述实施例或附图所示的方法操作步骤,但基于常规或者无需创造性的劳动在该方法中可以包括更多或者更少的操作步骤。在逻辑上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。该方法在实际的处理过程中或者装置执行时,可按照实施例或者附图所示的方法顺序执行或者并行执行。
在一种实施例中,本申请实施例提供的目标账户识别方法可以由服务器执行,也可以由具有一定计算能力,用于进行不良账户识别的其他电子设备执行。下文实施例以服务器执行该目标账户识别方法为例进行说明。
图2示出了一种目标账户识别方法的流程图,如图2所示,该方法可以包括如下步骤:
步骤S201,根据各个第一类账户与各个第二类账户之间的资源交互信息,生成多个交互二分图。
其中,每个交互二分图中包含多个节点,多个节点中包括:存在资源交互行为的第一类账户和第二类账户分别对应的第一类节点和第二类节点。示例性地,第一类账户可以为商户账户,第二类账户可以为消费者账户。
在一些实施例中,服务器可以获取设定时间段内用于记录各个第一类账户与各个第二类账户之间的资源交换行为的资源交互信息,将资源交互信息中的第一类账户作为第一类节点,将资源交互信息中的第二类账户作为第二类节点,根据第一类账户与第二类账户之间的资源交换行为,生成连接相应第一类节点与相应第二类节点的边,得到资源交互总图,如图3所示。从资源交互总图中选取部分第一类节点和部分第二类节点,并根据选取的部分第一类节点和部分第二类节点,以及部分第一类节点和部分第二类节点之间的边,生成交互二分图;重复执行从资源交互总图中选取部分第一类节点和部分第二类节点的操作,得到多个交互二分图。
例如,交易平台的服务器可以获取1个月内用于记录各个商户账户与各个消费者账户之间的交易行为的交易信息,将交易信息中的商户账户作为第一类节点,将交易信息中的消费者账户作为第二类节点,根据商户账户与消费者账户之间的交易行为,生成连接相应第一类节点与相应第二类节点的边,得到资源交互总图。
资源交互总图中的任意一个第一类节点可能与一个或多个第二类节点之间存在边,同理,资源交互总图中的任意一个第二类节点可能与一个或多个第一类节点之间存在边。如果资源交互总图中第一类节点A与第二类节点B之间存在边,说明在1个月内第一类节点A对应的商户账户A与第二类节点B对应的消费者账户B之间存在交易行为。
从资源交互总图中选取部分第一类节点和部分第二类节点,并根据选取的部分第一类节点和部分第二类节点,以及选取的部分第一类节点和部分第二类节点之间的边,生成交互二分图。
具体地,在一种实施例中,可以将资源交互总图转化为总邻接矩阵。其中,总邻接矩阵中的行对应资源交互总图中的第二类节点,总邻接矩阵中的列对应资源交互总图中的第一类节点。总邻接矩阵中的矩阵元素表示所属行对应的第二类节点与所属列对应的第一类节点之间是否存在边。
按照设定的采样率,对总邻接矩阵进行采样,得到子邻接矩阵,根据子邻接矩阵中的行对应的第二类节点,子邻接矩阵中的列对应的第一类节点,以及子邻接矩阵中的矩阵元素,将子邻接矩阵转化为交互二分图。
例如,可以按照设定的采样率,对总邻接矩阵进行随机采样,如按照采样率30%对m×n的总邻接矩阵W进行随机采样,得到0.3m×0.3n的子邻接矩阵。
为了使采样结果更符合商户账户和消费者账户的分布情况,可以采用层次采样的方法进行采样。具体地说,可以按照各个第一类节点对应的商户账户的交互属性信息,将各个第一类节点划分至相应的第一类层级,按照各个第二类节点对应的第二类账户的交互属性信息,将各个第二类节点划分至相应的第二类层级。其中,交互属性信息可以包括资源交互总额、资源交互频率或资源交互次数中的至少一种。
以交互属性信息是资源交互次数为例进行说明,可以统计设定时间内每个商户账户的资源交互次数,或称为交易次数。根据资源交互次数,将商户账户对应的第一类节点划分为3个层级,分别为层级a、层级b和层级c,这3个层级称为第一类层级。如果商户账户A的资源交互次数小于设定的第一门限值,则将商户账户A对应的第一类节点划分至层级c;如果商户账户A的资源交互次数大于设定的第一门限值,且小于设定的第二门限值,则将商户账户A对应的第一类节点划分至层级b;如果商户账户A的资源交互次数大于设定的第二门限值,则将商户账户A对应的第一类节点划分至层级a。其中,第二门限值大于第一门限值。
同理,根据资源交互次数,将消费者账户对应的第二类节点划分为3个层级,分别为层级m、层级n和层级l,这3个层级称为第二类层级。如果消费者账户B的资源交互次数小于设定的第三门限值,则将消费者账户B对应的第二类节点划分至层级l;如果消费者账户B的资源交互次数大于设定的第三门限值,且小于设定的第四门限值,则将消费者账户B对应的第二类节点划分至层级n;如果消费者账户B的资源交互次数大于设定的第四门限值,则将消费者账户B对应的第二类节点划分至层级m。其中,第四门限值大于第三门限值。
完成第一类节点和第二类节点的层级划分后,可以按照设定的采样率,分别从各个第二类层级包含的第二类节点中选取部分第二类节点,以及按照该采样率,分别从各个第一类层级包含的第一类节点中选取部分第一类节点。例如,按照采样率30%,分别从层级a包含的第一类节点中选取30%的第一类节点,从层级b包含的第一类节点中选取30%的第一类节点,从层级c包含的第一类节点中选取30%的第一类节点;并按照采样率30%,分别从层级m包含的第二类节点中选取30%的第二类节点,从层级n包含的第二类节点中选取30%的第二类节点,从层级l包含的第二类节点中选取30%的第二类节点。分别确定从三个第一类层级中选取的第一类节点在总邻接矩阵中对应的目标列和从三个第二类层级中选取的第二类节点在总邻接矩阵中对应的目标行,从总邻接矩阵中提取每个目标列和目标行的交叉位置的矩阵元素,得到子邻接矩阵,根据子邻接矩阵中的行对应的第二类节点,子邻接矩阵中的列对应的第一类节点,以及子邻接矩阵中的矩阵元素,将子邻接矩阵转化为交互二分图。
在另一种实施例中,可以按照设定的采样率,对资源交互总图中第一类节点和第二类节点进行随机采样,基于采样选取的第一类节点和第二类节点,以及各个第一类节点和第二类节点之间的边,得到交互二分图。
同样,为了使采样结果更符合商户账户和消费者账户的分布情况,可以采用层次采样的方法进行采样。具体地说,可以按照各个第一类节点对应的第一类账户的交互属性信息,将资源交互总图中的各个第一类节点划分至相应的第一类层级;按照各个第二类节点对应的第二类账户的交互属性信息,将资源交互总图中的各个第二类节点划分至相应的第二类层级。其中,交互属性信息包括资源交互总额、资源交互频率或资源交互次数中的至少一种。然后,按照设定的采样率,分别从各个第二类层级包含的第二类节点中选取部分第二类节点,以及按照采样率,分别从各个第一类层级包含的第一类节点中选取部分第一类节点。根据选取的第一类节点和第二类节点,以及各个第一类节点和第二类节点之间的边,生成交互二分图。
重复执行上述任意一种采样方法,可以得到多个交互二分图。例如,重复N次上述采样方法,可以得到N个交互二分图。
步骤S202,分别对得到的交互二分图中各节点之间的连接密度进行检测,获得多个交互二分图各自对应的检测结果。
其中,每个检测结果中各候选节点之间的连接密度满足设定条件,设定条件可以是检测结果中为对应的交互二分图包含的所有交互子图中紧密度最大的交互子图,即在对应的交互二分图包含的所有交互子图中,作为检索结果的交互子图中各候选节点之间的连接密度最紧密。
在一种实施例中,可以通过如下方式获取各个交互二分图对应的检测结果:对于一个交互二分图,获取该交互二分图对应的所有交互子图,每个交互子图均包含第一类节点和第二类节点,且交互子图包含的节点数量不大于该交互二分图包含的节点数量。例如,假设一个交互二分图包括6个节点,3个第一类节点和3个第二类节点。其中,3个第一类节点分别是u1、u2、u3,3个第二类节点分别是v1、v2、v3,则该交互二分图共对应有42个交互子图,可以分别表示为{v1、u1},{v1、u2},{v1、u3},{v2、u1},{v2、u2},{v2、u3},{v3、u1},{v3、u2},{v3、u3},{v1、v2、u1},{v1、v2、u2},{v1、v2、u3},{v1、v3、u1},{v1、v3、u2},{v1、v3、u3},{v2、v3、u1},{v2、v3、u2},{v2、v3、u3},{v1、u1、u2},{v2、u1、u2},{v3、u1、u2},{v1、u1、u3},{v2、u1、u3},{v3、u1、u3},{v1、u2、u3},{v2、u2、u3},{v3、u2、u3},{v1、v2、u1、u2},{v1、v3、u1、u2},{v2、v3、u1、u2},{v1、v2、u1、u3},{v1、v3、u1、u3},{v2、v3、u1、u3},{v1、v2、u2、u3},{v1、v3、u2、u3},{v2、v3、u2、u3},{v1、v2、v3、u1、u2},{v1、v2、v3、u1、u3},{v1、v2、v3、u2、u3},{v1、v2、u1、u2、u3},{v1、v3、u1、u2、u3},{v2、v3、u1、u2、u3}。
获取该交互二分图对应的所有交互子图之后,可以根据各个交互子图中包含的第二类节点的数量、第一类节点的数量、以及各第二类节点的度数,分别确定各个交互子图的紧密度。其中,节点的度数为与该节点连接的边的数量;紧密度用于表征对应的交互子图中各节点之间的连接密度。
具体地,对于任意一个交互子图G,可以通过如下紧密度计算公式确定该交互子图G的紧密度:
Figure BDA0003019765980000161
其中,|u|表示交互子图G中第一类节点的数量,|v|表示交互子图G中第二类节点的数量,dj表示交互子图G中第j个第一类节点的度数,c是一个预设常量,c的值可以很小,主要是为了避免分母为0。其中,第一类节点为商户账户对应的节点。
通过上述方法确定各个交互子图的紧密度之后,从中选出紧密度最大的交互子图,根据紧密度最大的交互子图,确定该交互二分图对应的检测结果。具体地,可以将紧密度最大的交互子图中包含的节点组成节点集合,将该节点集合作为该交互二分图对应的检测结果。
针对每个交互二分图执行上述操作,得到各个交互二分图对应的检测结果。
上述包含6个节点的交互二分图仅是举例,实际应用中得到的交互二分图中的节点的数量可能远大于6个。例如,每个交互二分图中可以包括100个节点或200个节点,因此,每个交互二分图对应的交互子图的数量会相当多,确定所有交互子图的紧密度的计算量非常大。
为了减小计算量,节约计算资源,在另一种实施例中,可以通过如下方式获取各个交互二分图对应的检测结果,其效果与上述方法相同。具体地,对于一个交互二分图,可以将该交互二分图作为待处理二分图,采用循环迭代方式执行以下操作,直至满足循环结束条件为止,得到该交互二分图对应的多个候选检测图,循环结束条件为待处理二分图中剩余的节点数量不大于设定数量,例如,当待处理二分图中剩余的节点数量不大于2个节点时,结束循环迭代过程。
其中,一次循环迭代过程可以包括:根据待处理二分图中各个节点的度数,逐个减少节点的数量,得到多个待检测子图,节点的度数为与该节点连接的边的数量。例如,假设待处理二分图中共包含6个节点,将该待处理二分图记作H6,确定H6中每个节点的度数,并从H6中找到度数最小的节点。其中,一个节点的度数为与该节点连接的边的数量。将度数最小的节点从H6中删除,得到待检测子图H5,找到待检测子图H5中度数最小的节点,并将其从待检测子图H5中删除,得到待检测子图H4。依此类推,逐个减少图中节点的数量,直至得到的待检测子图中仅包括2个节点为止,即得到最后一个待检测子图H2。将待处理二分图也作为一个待检测子图,共得到5个待检测子图。
根据各个待检测子图中包含的第二类节点的数量、第一类节点的数量、以及各第二类节点的度数,分别确定各个待检测子图的紧密度,紧密度用于表征对应的待检测子图中各节点之间的连接密度。如可以采用上述的紧密度计算公式确定各个待检测子图的紧密度。将紧密度符合第一预设条件的待检测子图中的节点添加至候选检测图,并确定候选检测图的紧密度。其中第一预设条件可以是紧密度大于设定阈值,或者,在各个待检测子图中紧密度最大。
将上述紧密度符合第一预设条件的待检测子图中的节点从待处理二分图中移除,得到更新的交互二分图,并将更新的交互二分图作为待处理二分图,此时,待处理二分图中的节点数量小于最初的待处理二分图中的节点数量。
在上述循环迭代过程中,每循环迭代一次,可以得到一个候选检测图,因此通过上述循环迭代过程,可以得到多个候选检测图。根据得到的各个候选检测图的紧密度,从多个候选检测图中确定目标检测图,并根据目标检测图,确定交互二分图对应的检测结果。
具体地,可以根据各个候选检测图的紧密度,分别确定各个候选检测图的紧密度的二阶导数,将紧密度的二阶导数符合第二预设条件的候选检测图作为目标检测图。其中,第二预设条件可以是紧密度的二阶导数小于设定阈值,或者,在各个候选检测图中二阶导数最小。确定目标检测图后,可以将目标检测图中包含的节点组成节点集合,将该节点集合作为该交互二分图对应的检测结果。检测结果中的节点可以称为候选节点。
针对每个交互二分图执行上述操作,得到各个交互二分图对应的检测结果,每个检测结果中包括多个候选节点。
步骤S203,分别针对获得的各个候选节点执行以下操作:确定包含有该候选节点的检测结果的总数目,基于该总数目,确定该候选节点对应的账户是否为目标账户。
在一种实施例中,对于各个候选节点,如果包含有该候选节点的检测结果的总数目不小于设定阈值,则将该候选节点对应的账户作为目标账户。
例如,假设设定阈值为3,如图4所示,对于商户账户对应的第一类节点u2和u3,两个节点均为候选节点,其中,包括候选节点u2的检测结果的总数目为2个,小于设定阈值3,因此,候选节点u2对应的商户账户不是目标账户。包括候选节点u3的检测结果共有3个,不小于设定阈值3,因此,候选节点u3对应的商户账户是目标账户。如果某商户账户被确定为目标账户,说明该商户账户为不良商户,如存在欺诈或洗钱行为的商户账户。
如图5所示,对于消费者账户对应的第二类节点v1和v5,两个节点均为候选节点,其中,包括候选节点v1的检测结果的总数目为4个,大于设定阈值3,因此,候选节点v1对应的消费者账户是目标账户。包括候选节点v5的检测结果共有3个,等于设定阈值3,因此,候选节点v5对应的消费者账户也是目标账户。如果某消费者账户被确定为目标账户,说明该消费者账户为不良消费者,如存在洗钱或刷单行为的消费者账户。
该方法的原理如下:每个交互二分图各自对应的检测结果用于从各个节点中检测出异常节点。检测结果中各候选节点之间的连接密度最大,说明各候选节点与检测结果对应的局部范围内的节点存在紧密的联系,其紧密程度一般远大于各候选节点与交易平台对应的全局范围内的其他节点之间的连接紧密度,说明这部分候选节点疑似存在异常,属于异常节点。如果一个节点被多个检测结果确定为异常节点,说明其为异常节点的机率非常大,则可以认为该节点对应的账户为不良账户。
在另一种实施例中,在确定目标账户时,为了让大图对应的检测结果和小图对应的检测结果的贡献更均衡,其中,大图指包含的节点数量较多的目标检测图,小图指包含的节点数量较少的目标检测图。对于各个候选节点,将包含该候选节点的检测结果作为目标检测结果,将各个目标检测结果中包含的节点数量的倒数之和,作为该候选节点对应的检测值,如果该候选节点对应的检测值不小于设定检测阈值,则将该候选节点对应的账户作为目标账户。
例如,假设对于候选节点v1,包含候选节点v1的检测结果共有4个,其中,第一个检测结果中包含的节点数量为D个,则,第二个检测结果中包含的节点数量为M个,第三个检测结果中包含的节点数量为C个,第四个检测结果中包含的节点数量为L个,则4个检测结果中包含的节点数量的倒数分别是:
Figure BDA0003019765980000201
Figure BDA0003019765980000202
则候选节点v1对应的检测值为各倒数之和:
Figure BDA0003019765980000203
如果该检测值大于或等于设定检测阈值,则将该候选节点v1对应的账户作为目标账户。
本申请实施例提供的目标账户识别方法,根据各个第一类账户与各个第二类账户之间的资源交互信息,生成多个属于异构网络的交互二分图,通过对属于异构网络的交互二分图进行检测,确定第一类账户和第二类账户中的不良账户。与相关技术中基于谱方法对同构网络进行分析,识别不良账户相比,算法相对简单,耗时较少,可以在线上环境中实时对不良账户进行识别,且识别准确性较高,对识别出的不良用户进行打击,打击效果较好。
为了更方便理解本申请实施例的目标账户识别方法,图6示出了本申请实施例的一个具体实施过程。如图6所示,该过程包括如下步骤:
步骤S601,获取设定时间段内通过指定交易平台进行交易的交易信息,并根据获取的交易信息生成资源交互总图。
其中,指定交易平台可以是互联网交易平台中的任意一个,消费者账户和商户账户可以通过指定交易平台进行交易。例如,指定交易平台可以是购物平台,商户入驻购物平台后,可以通过购物平台销售其商品,消费者可以通过该购物平台购买商户销售的商品,并通过购物平台将货款支付给对应的商户。在上述商户与消费者的交易过程中,购物平台可以记录此次交易过程的交易信息,交易信息中包括消费者账户的账户信息、商户账户的账户信息和交易金额等相关信息。
本申请实施例可以获取设定时间段内指定交易平台记录的多个交易过程的交易信息,这些交易信息中包括多个商户账户和多个消费者账户,以及不同商户账户与不同消费者账户之间的支付记录。支付记录可以包括商业支付和企业支付两种类型的支付记录。商业支付与企业支付形成反向支付,商业支付指消费者账户向商户账户进行付款;企业支付指商户账户向消费者账户进行付款。
根据上述多个交易过程的交易信息,可以生成用于表征消费者账户与商户账户之间的交易关系的资源交互总图,该资源交互总图为二分图,图中的节点代表消费者账户和商户账户。示例性地,图3示出了一种资源交互总图的示意图,该资源交互总图也可以称为商户-消费者交易网络。如图3所示,节点v1至节点v5代表商户账户,可以称为商户节点,节点u1至节点u5为消费者账户,可以称为消费者节点,商户节点与消费者节点之间的连线可以称为边,表示对应的商户账户与对应的消费者账户之间存在交易关系。例如,商户节点v1与消费者节点u1之间的连线表示商户账户v1与消费者账户u1之间在设定时间段内曾经交易过,二者之间存在交易关系;商户节点v4与消费者节点u3之间不存在连线,表示商户账户v4与消费者账户u3之间在设定时间段内没有交易过,二者之间不存在交易关系。
图3所示的商户节点和消费者节点的数量相等,在其他实施例中,商户节点和消费者节点的数量也可以不相等。例如,资源交互总图中包括100个商户节点和150个消费者节点。
步骤S602,将资源交互总图转化为邻接矩阵。
邻接矩阵可以是二维数组,邻接矩阵中的行表示商户账户,列表示消费者账户。邻接矩阵中的矩阵元素为0或1,“0”可以表示该行对应的商户账户与该列对于的消费者账户之间不存在交易关系,“1”可以表示该行对应的商户账户与该列对于的消费者账户之间存在交易关系。
示例性地,假设根据资源交互总图得到的邻接矩阵W为m×n的矩阵,其中,行数m表示存在m个商户账户,分别对应商户账户v1~商户账户vm,列数n表示存在n个消费者账户,分别对应商户账户u1~商户账户un。如果邻接矩阵W中第一行第一列的矩阵元素为1,则表示商户账户v1与消费者账户u1之间存在交易关系,在资源交互总图中商户节点v1与消费者节点u1之间存在连线。例如,图3所示的资源交互总图可以转化为图7所示的邻接矩阵。
步骤S603,按照设定的采样率,多次对邻接矩阵进行随机采样,得到多个子邻接矩阵,并确定各个子邻接矩阵对应的交互二分图。
在一种实施例中,假设设定的采样率为30%,则按照采样率30%对邻接矩阵W进行随机采样,得到0.3m×0.3n的子邻接矩阵。具体地,从邻接矩阵W的m行中随机选择0.3m行,或者说,从邻接矩阵W对应的m个商户账户中随机选择0.3m个商户账户;从邻接矩阵W的n列中随机选择0.3n列,或者说,从邻接矩阵W对应的n个消费者账户中随机选择0.3n个消费者账户。例如,假设邻接矩阵W为200×100的矩阵,则从邻接矩阵W的200行中随机选择60行,从邻接矩阵W的100列中随机选择30列,将被选择的60行和被选择的30列的交叉位置的矩阵元素从邻接矩阵W提取出来,组成子邻接矩阵。
重复执行N次按照采样率30%对邻接矩阵W进行随机采样的操作,得到N个子邻接矩阵,分别为
Figure BDA0003019765980000221
分别根据N个子邻接矩阵,确定各个子邻接矩阵对应的交互二分图。每个交互二分图包括0.3m个商户账户对应的商户节点和0.3n个消费者账户对应的消费者节点。商户节点与消费者节点之间是否存在连线,可以根据对应的子邻接矩阵中该商户账户对应的行与该消费者账户对应的列的交叉位置的矩阵元素确定。
在另一种实施例中,假设设定的采样率为60%。如图8所示,按照采样率60%对5×5的邻接矩阵进行随机采样,得到3×3的子邻接矩阵,该子邻接矩阵中包含商户节点v1、v2和v3对应的行和消费者节点u1、u2和u4对应的列。根据该子邻接矩阵,确定的交互二分图如图8所示,在该交互二分图中,消费者节点u4的度数为0。
步骤S604,根据每个交互二分图中各节点之间的连接关系,分别确定各个交互二分图对应的检测结果。
具体地,假设步骤S603中得到N个交互二分图。对于每个交互二分图,分别按照图9所示的方法,执行如下步骤:
步骤S6041,将交互二分图作为初始待处理二分图,分别设置数据集Sd、数据集vd和数据集ud,其中,Sd=(ud∪vd),令数据集vd和数据集ud为空集。
步骤S6042,根据待处理二分图中各个节点的度数,逐个减少待处理二分图中节点的数量,得到多个待检测子图。
该步骤中的待处理二分图可以是步骤S6041中的初始待处理二分图,也可以是下文中步骤S6043中的更新的待处理二分图。如果待处理二分图中的节点数量为n,该节点数量为待处理二分图中商户节点和消费者节点的总个数,即待处理二分图中共包括n个节点。将该待处理二分图记作Hn,确定Hn中每个节点的度数,并从Hn中找到度数最小的节点。其中,一个节点的度数为与该节点连接的边的数量。将度数最小的节点从Hn中删除,得到待检测子图Hn-1,找到待检测子图Hn-1中度数最小的节点,并将其从待检测子图Hn-1中删除,得到待检测子图Hn-2。依此类推,逐个减少图中节点的数量,直至得到的待检测子图中仅包括2个节点为止,即得到最后一个待检测子图H2。假设待检测子图Hi中度数最小的节点为m,则删除该节点后得到的待检测子图Hi-1可以表示为Hi-1=Hi-{m}。
将待处理二分图Hn也作为一个待检测子图,上述过程共可以得到n-1个待检测子图Hi,i=n,…2。
步骤S6043,确定每个待检测子图的紧密度,将紧密度最大的待检测子图作为目标检测子图,将目标检测子图中包含的商户节点添加至数据集vd,将目标检测子图中包含的消费者节点添加至数据集ud,并将目标检测子图中包含的节点和边从待处理二分图中移除,得到更新的待处理二分图。
对于任意一个二分图G,可以通过如下公式确定该二分图G的紧密度:
Figure BDA0003019765980000231
其中,|u|表示二分图G中消费者节点的数量,|v|表示二分图G中商户节点的数量,dj表示二分图G中第j个商户节点的度数,c是一个预设常量,c的值可以很小,主要是为了避免分母为0。
根据上述公式,可以确定每个待检测子图的紧密度,分别记为φ(H2),φ(H3),…,φ(Hn)。确定φ(H2)~φ(Hn)中的最大值,将紧密度最大的待检测子图作为目标检测子图,记作G(Hi)=(ui∪vi,εi),其中,εi表示目标检测子图G(Hi)中的边,即待处理二分图中与目标检测子图G(Hi)包含的各个节点连接的边。令ud=ud∪ui,vd=vd∪vi,得到更新的数据集Sd。从待处理二分图中移除目标检测子图G(Hi)中包含的节点和边,得到更新的待处理二分图。
步骤S6044,根据目标检测子图确定更新的数据集Sd对应的二分图G(Sd),并将该二分图G(Sd)作为候选检测图,计算候选检测图的紧密度φ(G(Sd))的二阶导数,记作△2φ(G(Sd))。
步骤S6045,判断更新的待处理二分图中包含的节点数量是否小于设定数量;如果是,执行步骤S6046;如果否,返回执行步骤S6042。
步骤S6046,将紧密度的二阶导数最小的数据集Sd作为交互二分图的检测结果。
针对更新的待处理二分图,重复执行上述步骤S6042~步骤S6044,直至更新的待处理二分图中包含的节点的数量小于2个。在重复执行上述步骤的过程中,数据集Sd不断地增长,每增长一次,均确定更新的数据集Sd对应的候选检测图的紧密度的二阶导数,将紧密度的二阶导数最小的数据集Sd作为该交互二分图的检测结果,该检测结果也可以称为交互二分图对应的检测结果,检测结果中的节点称为候选节点。与二次方程对应的曲线的顶点处的斜率最小类似,紧密度的二阶导数最小,表示对应的数据集Sd的紧密度达到峰值,说明该数据集Sd中各个节点之间的连接紧密度最大化,即检测结果中各个节点之间存在最紧密的连接关系。
上述确定一个交互二分图对应的检测结果的过程,也可以理解为:将该交互二分图切分为若干个目标检测子图,每个目标检测子图没有交集。即每执行一次步骤S6042~步骤S6044,就可以得到一个目标检测子图,每次得到的目标检测子图与其他目标检测子图之间没有交集。当得到的所有目标检测子图的紧密度之和最大化时,将得到的各个目标检测子图包含的节点共同组成数据集Sd,数据集Sd即为该交互二分图对应的检测结果。
采用图9所示的方法,可以分别确定N个交互二分图中的每个交互二分图对应的检测结果,得到N个检测结果,可以记为{G1,G2,…,Gn}。
步骤S605,从检测结果包含的候选节点中,确定风险值达到设定阈值的异常节点。
将每个检测结果中包含的节点均作为候选节点,对于每个候选节点,分别执行如下操作:确定包含该候选节点的检测结果的个数,包含该候选节点的检测结果的个数可以称为命中该候选节点的检测结果的个数,将命中该候选节点的检测结果的个数作为该候选节点的风险值。如果该候选节点的风险值达到设定阈值,则将该节点作为异常节点。异常节点中可能只包括商户节点,也可以只包括消费者节点;异常节点中还可能包括商户节点和消费者节点。
具体地说,假设设定阈值为T,对于检测结果中的任意一个消费者节点,如果命中该消费者节点的检测结果的个数大于或等于设定阈值T,说明该消费者节点存在异常的概率较大,则将该消费者节点作为异常节点添加至异常消费者集合ufinal中。对于检测结果中的任意一个商户节点,如果命中该商户节点的检测结果的个数大于或等于设定阈值T,说明该商户节点存在异常的概率较大,则将该商户节点作为异常节点添加至异常商户集合vfinal中。
步骤S606,输出确定的异常节点的账户信息。
其中,异常节点对应的账户即为目标账户。如果步骤S605中确定的异常消费者集合ufinal和异常商户集合vfinal均不是空集,可以将异常消费者集合ufinal和异常商户集合vfinal中异常节点的账户信息均输出至显示装置,通过显示装置将异常消费者和异常商户的账户信息显示给用户。
与图2所示的目标账户识别方法基于同一发明构思,本申请实施例中还提供了一种目标账户识别装置,该目标账户识别装置可以布设在服务器或其他电子设备中。由于该装置是本申请目标账户识别方法对应的装置,并且该装置解决问题的原理与该方法相似,因此该装置的实施可以参见上述方法的实施,重复之处不再赘述。
图10示出了本申请实施例提供的一种目标账户识别装置的结构示意图,如图10所示,该目标账户识别装置包括采样单元1001、检测单元1002和识别单元1003。
采样单元1001,用于根据各个第一类账户与各个第二类账户之间的资源交互信息,生成多个交互二分图;其中,每个交互二分图中包含多个节点,多个节点至少包括:存在资源交互行为的第一类账户和第二类账户分别对应的第一类节点和第二类节点;
检测单元1002,用于分别对得到的交互二分图中各节点之间的连接密度进行检测,获得多个交互二分图各自对应的检测结果;其中,每个检测结果中各候选节点之间的连接密度满足设定条件;
识别单元1003,用于分别针对获得的各个候选节点执行以下操作:确定包含有各个候选节点中的一个候选节点的检测结果的总数目,基于总数目,确定一个候选节点对应的账户是否为目标账户。
在一种可选的实施例中,采样单元1001,具体用于:
获取设定时间段内用于记录各个第一类账户与各个第二类账户之间的资源交换行为的资源交互信息;
将资源交互信息中的第一类账户作为第一类节点,将资源交互信息中的第二类账户作为第二类节点,根据第一类账户与第二类账户之间的资源交换行为,生成连接相应第一类节点与相应第二类节点的边,得到资源交互总图;
从资源交互总图中选取部分第一类节点和部分第二类节点,并根据选取的部分第一类节点和部分第二类节点,以及部分第一类节点和部分第二类节点之间的边,生成交互二分图;
重复执行从资源交互总图中选取部分第一类节点和部分第二类节点的操作,得到多个交互二分图。
在一种可选的实施例中,采样单元1001,具体用于:
将资源交互总图转化为总邻接矩阵;其中,总邻接矩阵中的行对应资源交互总图中的第二类节点,总邻接矩阵中的列对应资源交互总图中的第一类节点;总邻接矩阵中的矩阵元素表示所属行对应的第二类节点与所属列对应的第一类节点之间是否存在边;
按照设定的采样率,对总邻接矩阵进行采样,得到子邻接矩阵;
根据子邻接矩阵中的行对应的第二类节点,子邻接矩阵中的列对应的第一类节点,以及子邻接矩阵中的矩阵元素,将子邻接矩阵转化为交互二分图。
在一种可选的实施例中,采样单元1001,具体用于:
按照各个第一类节点对应的第一类账户的交互属性信息,将资源交互总图中的各个第一类节点划分至相应的第一类层级;交互属性信息包括资源交互总额、资源交互频率或资源交互次数中的至少一种;
按照各个第二类节点对应的第二类账户的交互属性信息,将资源交互总图中的各个第二类节点划分至相应的第二类层级;
按照设定的采样率,分别从各个第二类层级包含的第二类节点中选取部分第二类节点,以及按照采样率,分别从各个第一类层级包含的第一类节点中选取部分第一类节点。
在一种可选的实施例中,检测单元1002,具体用于:
针对各个交互二分图,分别执行如下操作:
获取各个交互二分图中的一个交互二分图对应的所有交互子图;交互子图包含的节点数量不大于一个交互二分图包含的节点数量;
根据各个交互子图中包含的第二类节点的数量、第一类节点的数量、以及各第二类节点的度数,分别确定各个交互子图的紧密度;紧密度用于表征对应的交互子图中各节点之间的连接密度;节点的度数为与节点连接的边的数量;
根据紧密度最大的交互子图,确定交互二分图对应的检测结果。
在一种可选的实施例中,检测单元1002,具体用于:
针对各个交互二分图,分别执行如下操作:
将交互二分图作为待处理二分图,采用循环迭代方式执行以下操作,直至满足循环结束条件为止,得到交互二分图对应的多个候选检测图;其中,一次循环迭代过程包括:
根据待处理二分图中各个节点的度数,逐个减少节点的数量,得到多个待检测子图;节点的度数为与节点连接的边的数量;
根据各个待检测子图中包含的第二类节点的数量、第一类节点的数量、以及各第二类节点的度数,分别确定各个待检测子图的紧密度;紧密度用于表征对应的待检测子图中各节点之间的连接密度;
将紧密度符合第一预设条件的待检测子图中的节点添加至候选检测图,并确定候选检测图的紧密度;
将紧密度符合第一预设条件的待检测子图中的节点从待处理二分图中移除,得到更新的交互二分图,并将更新的交互二分图作为待处理二分图;
根据得到的各个候选检测图的紧密度,从多个候选检测图中确定目标检测图,并根据目标检测图,确定交互二分图对应的检测结果。
在一种可选的实施例中,检测单元1002,具体用于:
根据各个候选检测图的紧密度,分别确定各个候选检测图的紧密度的二阶导数;
将紧密度的二阶导数符合第二预设条件的候选检测图作为目标检测图。
在一种可选的实施例中,识别单元1003,具体用于:
若总数目不小于设定阈值,则将一个候选节点对应的账户作为目标账户;或者,
将包含一个候选节点的检测结果作为目标检测结果;
将各个目标检测结果中包含的节点数量的倒数之和,作为一个候选节点对应的检测值;
若一个候选节点对应的检测值不小于设定检测阈值,则将一个候选节点对应的账户作为目标账户。
与上述方法实施例和装置实施例基于同一发明构思,本申请实施例中还提供了一种电子设备。该电子设备可以是服务器,如图1所示的服务器100,也可以是计算机等其他电子设备。在一种实施例中,电子设备的结构可以如图11所示,包括存储器101,通讯模块103以及一个或多个处理器102。
存储器101,用于存储处理器102执行的计算机程序。存储器101可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。
存储器101可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器101也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)、或者存储器101是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器101可以是上述存储器的组合。
处理器102,可以包括一个或多个中央处理单元(central processing unit,CPU)或者为数字处理单元等等。处理器102,用于调用存储器101中存储的计算机程序时实现上述目标账户识别方法。
通讯模块103用于与终端设备和其他电子设备进行通信。如果电子设备为服务器,则服务器可以通过通讯模块103收集各账户的资源交互信息。
本申请实施例中不限定上述存储器101、通讯模块103和处理器102之间的具体连接介质。本申请实施例在图11中以存储器101和处理器102之间通过总线104连接,总线104在图11中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线104可以分为地址总线、数据总线、控制总线等。为便于表示,图11中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
在一些实施例中,电子设备还可以包括显示器,用于显示将识别出的目标账户的账户信息。
在另一种实施例中,电子设备的结构可以如图12所示,其中,存储器101可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)1011和/或高速缓存存储器1012,还可以进一步包括只读存储器(ROM)1013。
存储器101还可以包括具有一组(至少一个)程序模块1014的程序/实用工具1015,程序模块1014包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,示例中的每一个或某种组合中可能包括网络环境的实现。
电子设备也可以与一个或多个外部设备110(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与电子设备交互的设备通信,和/或与使得该电子设备能与一个或多个其它计算装置进行通信的任何设备(例如路由器、调制解调器等)通信。这种通信可以通过输入/输出(I/O)接口105进行。并且,通讯模块103可以是网络适配器,电子设备还可以通过网络适配器与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,通讯模块103通过总线104与用于电子设备的其它模块通信。应当理解,尽管图中未示出,可以结合电子设备使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些可能的实施方式中,本申请提供的目标账户识别方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的目标账户识别方法的步骤,例如,计算机设备可以执行如图2所示的步骤S201~S203中目标账户识别方法的流程。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请的实施方式的用于目标账户识别方法的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算设备上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (15)

1.一种目标账户识别方法,其特征在于,所述方法包括:
根据各个第一类账户与各个第二类账户之间的资源交互信息,生成多个交互二分图;其中,每个交互二分图中包含多个节点,所述多个节点包括:存在资源交互行为的第一类账户和第二类账户分别对应的第一类节点和第二类节点;
分别对得到的交互二分图中各节点之间的连接密度进行检测,获得所述多个交互二分图各自对应的检测结果;其中,每个检测结果中各候选节点之间的连接密度满足设定条件;
分别针对获得的各个候选节点执行以下操作:确定包含有所述候选节点的检测结果的总数目,基于所述总数目,确定所述候选节点对应的账户是否为目标账户。
2.根据权利要求1所述的方法,其特征在于,所述根据各个第一类账户与各个第二类账户之间的资源交互信息,生成多个交互二分图,包括:
获取设定时间段内用于记录各个第一类账户与各个第二类账户之间的资源交换行为的资源交互信息;
将所述资源交互信息中的第一类账户作为第一类节点,将所述资源交互信息中的第二类账户作为第二类节点,根据第一类账户与第二类账户之间的资源交换行为,生成连接相应第一类节点与相应第二类节点的边,得到资源交互总图;
从所述资源交互总图中选取部分第一类节点和部分第二类节点,并根据选取的部分第一类节点和部分第二类节点,以及所述部分第一类节点和所述部分第二类节点之间的边,生成交互二分图;
重复执行从所述资源交互总图中选取部分第一类节点和部分第二类节点的操作,得到多个交互二分图。
3.根据权利要求2所述的方法,其特征在于,所述从所述资源交互总图中选取部分第一类节点和部分第二类节点,并根据选取的部分第一类节点和部分第二类节点,以及所述部分第一类节点和所述部分第二类节点之间的边,生成交互二分图,包括:
将所述资源交互总图转化为总邻接矩阵;其中,所述总邻接矩阵中的行对应所述资源交互总图中的第二类节点,所述总邻接矩阵中的列对应所述资源交互总图中的第一类节点;所述总邻接矩阵中的矩阵元素表示所属行对应的第二类节点与所属列对应的第一类节点之间是否存在边;
按照设定的采样率,对所述总邻接矩阵进行采样,得到子邻接矩阵;
根据所述子邻接矩阵中的行对应的第二类节点,所述子邻接矩阵中的列对应的第一类节点,以及所述子邻接矩阵中的矩阵元素,将所述子邻接矩阵转化为交互二分图。
4.根据权利要求2所述的方法,其特征在于,所述从所述资源交互总图中选取部分第一类节点和部分第二类节点,包括:
按照各个第一类节点对应的第一类账户的交互属性信息,将所述资源交互总图中的各个第一类节点划分至相应的第一类层级;所述交互属性信息包括资源交互总额、资源交互频率或资源交互次数中的至少一种;
按照各个第二类节点对应的第二类账户的交互属性信息,将所述资源交互总图中的各个第二类节点划分至相应的第二类层级;
按照设定的采样率,分别从各个第二类层级包含的第二类节点中选取部分第二类节点,以及按照所述采样率,分别从各个第一类层级包含的第一类节点中选取部分第一类节点。
5.根据权利要求1所述的方法,其特征在于,所述分别对得到的交互二分图中各节点之间的连接密度进行检测,获得所述多个交互二分图各自对应的检测结果,包括:
针对各个交互二分图,分别执行如下操作:
获取所述交互二分图对应的所有交互子图;所述交互子图包含的节点数量不大于所述交互二分图包含的节点数量;
根据各个交互子图中包含的第二类节点的数量、第一类节点的数量、以及各第二类节点的度数,分别确定各个交互子图的紧密度;所述紧密度用于表征对应的交互子图中各节点之间的连接密度;所述节点的度数为与所述节点连接的边的数量;
根据紧密度最大的交互子图,确定所述交互二分图对应的检测结果。
6.根据权利要求1所述的方法,其特征在于,所述分别对得到的交互二分图中各节点之间的连接密度进行检测,获得所述多个交互二分图各自对应的检测结果,包括:
针对各个交互二分图,分别执行如下操作:
将所述交互二分图作为待处理二分图,采用循环迭代方式执行以下操作,直至满足循环结束条件为止,得到所述交互二分图对应的多个候选检测图;其中,一次循环迭代过程包括:
根据待处理二分图中各个节点的度数,逐个减少节点的数量,得到多个待检测子图;所述节点的度数为与所述节点连接的边的数量;
根据各个待检测子图中包含的第二类节点的数量、第一类节点的数量、以及各第二类节点的度数,分别确定各个待检测子图的紧密度;所述紧密度用于表征对应的待检测子图中各节点之间的连接密度;
将紧密度符合第一预设条件的待检测子图中的节点添加至候选检测图,并确定所述候选检测图的紧密度;
将紧密度符合第一预设条件的待检测子图中的节点从所述待处理二分图中移除,得到更新的交互二分图,并将更新的交互二分图作为待处理二分图;
根据得到的各个候选检测图的紧密度,从所述多个候选检测图中确定目标检测图,并根据所述目标检测图,确定所述交互二分图对应的检测结果。
7.根据权利要求6所述的方法,其特征在于,所述根据各个候选检测图的紧密度,从所述候选检测图中确定目标检测图,包括:
根据各个候选检测图的紧密度,分别确定各个所述候选检测图的紧密度的二阶导数;
将紧密度的二阶导数符合第二预设条件的候选检测图作为所述目标检测图。
8.根据权利要求1~7中任一项所述的方法,其特征在于,基于所述总数目,确定所述候选节点对应的账户是否为目标账户,包括:
若所述总数目不小于设定阈值,则将所述候选节点对应的账户作为目标账户;或者,
将包含所述候选节点的检测结果作为目标检测结果;
将各个目标检测结果中包含的节点数量的倒数之和,作为所述候选节点对应的检测值;
若所述候选节点对应的检测值不小于设定检测阈值,则将所述候选节点对应的账户作为目标账户。
9.一种目标账户识别装置,其特征在于,所述装置包括:
采样单元,用于根据各个第一类账户与各个第二类账户之间的资源交互信息,生成多个交互二分图;其中,每个交互二分图中包含多个节点,所述多个节点至少包括:存在资源交互行为的第一类账户和第二类账户分别对应的第一类节点和第二类节点;
检测单元,用于分别对得到的交互二分图中各节点之间的连接密度进行检测,获得所述多个交互二分图各自对应的检测结果;其中,每个检测结果中各候选节点之间的连接密度满足设定条件;
识别单元,用于分别针对获得的各个候选节点执行以下操作:确定包含有所述候选节点的检测结果的总数目,基于所述总数目,确定所述候选节点对应的账户是否为目标账户。
10.根据权利要求9所述的装置,其特征在于,所述采样单元,具体用于:
获取设定时间段内用于记录各个第一类账户与各个第二类账户之间的资源交换行为的资源交互信息;
将所述资源交互信息中的第一类账户作为第一类节点,将所述资源交互信息中的第二类账户作为第二类节点,根据第一类账户与第二类账户之间的资源交换行为,生成连接相应第一类节点与相应第二类节点的边,得到资源交互总图;
从所述资源交互总图中选取部分第一类节点和部分第二类节点,并根据选取的部分第一类节点和部分第二类节点,以及所述部分第一类节点和所述部分第二类节点之间的边,生成交互二分图;
重复执行从所述资源交互总图中选取部分第一类节点和部分第二类节点的操作,得到多个交互二分图。
11.根据权利要求9所述的装置,其特征在于,所述检测单元,具体用于:
针对各个交互二分图,分别执行如下操作:
获取所述交互二分图对应的所有交互子图;所述交互子图包含的节点数量不大于所述交互二分图包含的节点数量;
根据各个交互子图中包含的第二类节点的数量、第一类节点的数量、以及各第二类节点的度数,分别确定各个交互子图的紧密度;所述紧密度用于表征对应的交互子图中各节点之间的连接密度;所述节点的度数为与所述节点连接的边的数量;
根据紧密度最大的交互子图,确定所述交互二分图对应的检测结果。
12.根据权利要求9所述的装置,其特征在于,所述检测单元,具体用于:
针对各个交互二分图,分别执行如下操作:
将所述交互二分图作为待处理二分图,采用循环迭代方式执行以下操作,直至满足循环结束条件为止,得到所述交互二分图对应的多个候选检测图;其中,一次循环迭代过程包括:
根据待处理二分图中各个节点的度数,逐个减少节点的数量,得到多个待检测子图;所述节点的度数为与所述节点连接的边的数量;
根据各个待检测子图中包含的第二类节点的数量、第一类节点的数量、以及各第二类节点的度数,分别确定各个待检测子图的紧密度;所述紧密度用于表征对应的待检测子图中各节点之间的连接密度;
将紧密度符合第一预设条件的待检测子图中的节点添加至候选检测图,并确定所述候选检测图的紧密度;
将紧密度符合第一预设条件的待检测子图中的节点从所述待处理二分图中移除,得到更新的交互二分图,并将更新的交互二分图作为待处理二分图;
根据得到的各个候选检测图的紧密度,从所述多个候选检测图中确定目标检测图,并根据所述目标检测图,确定所述交互二分图对应的检测结果。
13.根据权利要求9~12中任一项所述的装置,其特征在于,所述识别单元,具体用于:
若所述总数目不小于设定阈值,则将所述候选节点对应的账户作为目标账户;或者,
将包含所述候选节点的检测结果作为目标检测结果;
将各个目标检测结果中包含的节点数量的倒数之和,作为所述候选节点对应的检测值;
若所述候选节点对应的检测值不小于设定检测阈值,则将所述候选节点对应的账户作为目标账户。
14.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,其特征在于:所述计算机程序被处理器执行时,实现权利要求1~8中任一项所述的方法。
15.一种电子设备,其特征在于,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,当所述计算机程序被所述处理器执行时,实现权利要求1~8中任一项所述的方法。
CN202110399907.XA 2021-04-14 2021-04-14 一种目标账户识别方法、装置、存储介质和电子设备 Pending CN115204888A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110399907.XA CN115204888A (zh) 2021-04-14 2021-04-14 一种目标账户识别方法、装置、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110399907.XA CN115204888A (zh) 2021-04-14 2021-04-14 一种目标账户识别方法、装置、存储介质和电子设备

Publications (1)

Publication Number Publication Date
CN115204888A true CN115204888A (zh) 2022-10-18

Family

ID=83574315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110399907.XA Pending CN115204888A (zh) 2021-04-14 2021-04-14 一种目标账户识别方法、装置、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN115204888A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115664847A (zh) * 2022-12-08 2023-01-31 南京金科院大学科技园管理有限公司 一种互联网教育平台的用户信息安全存储方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115664847A (zh) * 2022-12-08 2023-01-31 南京金科院大学科技园管理有限公司 一种互联网教育平台的用户信息安全存储方法

Similar Documents

Publication Publication Date Title
US10872166B2 (en) Systems and methods for secure prediction using an encrypted query executed based on encrypted data
CN104796270B (zh) 在云应用的问题诊断中推荐可疑组件的方法及装置
CN105224606A (zh) 一种用户标识的处理方法及装置
WO2013067461A2 (en) Identifying associations in data
US11094015B2 (en) Data access and processing system
AU2021202807A1 (en) Method to determine account similarity in an online accounting system
US20220027339A1 (en) Identifying source datasets that fit a transfer learning process for a target domain
CN111768258A (zh) 识别异常订单的方法、装置、电子设备和介质
CN112348659A (zh) 用户风险识别策略的分配方法、装置及电子设备
CN115062163A (zh) 异常组织的识别方法、装置、电子设备和介质
CN109711849B (zh) 以太坊地址画像生成方法、装置、电子设备及存储介质
US20210398225A1 (en) Network risk assessment for live issuance and management of cyber insurance policies
CN112347457A (zh) 异常账户检测方法、装置、计算机设备和存储介质
CN115204888A (zh) 一种目标账户识别方法、装置、存储介质和电子设备
US20220084034A1 (en) Encoding multi-dimensional information for deep vision learning
CN110070383B (zh) 基于大数据分析的异常用户识别方法及装置
US11308562B1 (en) System and method for dimensionality reduction of vendor co-occurrence observations for improved transaction categorization
JP2021197089A (ja) 出力装置、出力方法及び出力プログラム
US11164245B1 (en) Method and system for identifying characteristics of transaction strings with an attention based recurrent neural network
CN110197316B (zh) 运营数据的处理方法、装置、计算机可读介质及电子设备
WO2023060150A1 (en) Data compression techniques for machine learning models
US11741099B2 (en) Supporting database queries using unsupervised vector embedding approaches over unseen data
CN114492647A (zh) 基于分布式图嵌入的联邦图聚类方法、装置及可读存储介质
US11561963B1 (en) Method and system for using time-location transaction signatures to enrich user profiles
Liu et al. A network embedding based approach for telecommunications fraud detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40077375

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination