CN113157767B - 一种风险数据监控方法、装置以及设备 - Google Patents

一种风险数据监控方法、装置以及设备 Download PDF

Info

Publication number
CN113157767B
CN113157767B CN202110316073.1A CN202110316073A CN113157767B CN 113157767 B CN113157767 B CN 113157767B CN 202110316073 A CN202110316073 A CN 202110316073A CN 113157767 B CN113157767 B CN 113157767B
Authority
CN
China
Prior art keywords
user
index
determining
node
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110316073.1A
Other languages
English (en)
Other versions
CN113157767A (zh
Inventor
庞博
凌芳觉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202110316073.1A priority Critical patent/CN113157767B/zh
Publication of CN113157767A publication Critical patent/CN113157767A/zh
Application granted granted Critical
Publication of CN113157767B publication Critical patent/CN113157767B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/389Keeping log of transactions for guaranteeing non-repudiation of a transaction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1416Event detection, e.g. attack signature detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Computer Security & Cryptography (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例公开了一种风险数据监控方法、装置以及设备。方案包括:基于用户节点的时序行为数据,确定由多个用户节点和用户节点间的关联边构成的随时序变化的图结构;根据图结构中用户节点的连通性,划分得到若干第一用户组;根据第一用户组中关联边的权重,确定第一用户组对应的凝聚指标;根据第一用户组对应的凝聚指标,删除第一用户组中的若干关联边,对第一用户组进行再划分,得到若干第二用户组;根据第二用户组中关联边的权重,确定用户节点的重要性指标;根据用户节点的重要性指标在随时序变化的图结构中的变化,确定用户节点的异动指标,以及对用户节点的异动指标进行监控,确定时序异动风险节点。

Description

一种风险数据监控方法、装置以及设备
技术领域
本说明书涉及计算机软件技术领域,尤其涉及一种风险数据监控方法、装置以及设备。
背景技术
随着计算机技术的迅速发展,互联网的应用范围越来越广泛。大量用户通过互联网进行业务的交互,包括一些不法分子,也以互联网为媒介,实施不法行为。
目前,直接对用户业务数据持续进行监控,以发现是否存在异动风险。
基于此,还需要能够更加便利、有效的风险数据监控方案。
发明内容
本说明书一个或多个实施例提供一种风险数据监控方法、装置、设备以及存储介质,用以解决如下技术问题:需要能够更加便利、有效的风险数据监控方案。
为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
本说明书一个或多个实施例提供的一种风险数据监控方法,包括:
基于用户节点的时序行为数据,确定由多个所述用户节点和所述用户节点间的关联边构成的随时序变化的图结构;
根据所述图结构中用户节点的连通性,划分得到若干第一用户组;
根据所述第一用户组中关联边的权重,确定所述第一用户组对应的凝聚指标;
根据所述第一用户组对应的凝聚指标,删除所述第一用户组中的若干关联边,对所述第一用户组进行再划分,得到若干第二用户组;
根据所述第二用户组中关联边的权重,确定所述用户节点的重要性指标;
根据所述用户节点的重要性指标在所述随时序变化的图结构中的变化,确定所述用户节点的异动指标,以及对所述用户节点的异动指标进行监控,确定时序异动风险节点。
本说明书一个或多个实施例提供的一种风险数据监控装置,包括:
图结构模块,基于用户节点的时序行为数据,确定由多个所述用户节点和所述用户节点间的关联边构成的随时序变化的图结构;
第一划分模块,根据所述图结构中用户节点的连通性,划分得到若干第一用户组;
凝聚指标确定模块,根据所述第一用户组中关联边的权重,确定所述第一用户组对应的凝聚指标;
第二划分模块,根据所述第一用户组对应的凝聚指标,删除所述第一用户组中的若干关联边,对所述第一用户组进行再划分,得到若干第二用户组;
重要性指标确定模块,根据所述第二用户组中关联边的权重,确定所述用户节点的重要性指标;
异动指标及时序异动风险节点确定模块,根据所述用户节点的重要性指标在所述随时序变化的图结构中的变化,确定所述用户节点的异动指标,以及对所述用户节点的异动指标进行监控,确定时序异动风险节点。
本说明书一个或多个实施例提供的一种风险数据监控设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
基于用户节点的时序行为数据,确定由多个所述用户节点和所述用户节点间的关联边构成的随时序变化的图结构;
根据所述图结构中用户节点的连通性,划分得到若干第一用户组;
根据所述第一用户组中关联边的权重,确定所述第一用户组对应的凝聚指标;
根据所述第一用户组对应的凝聚指标,删除所述第一用户组中的若干关联边,对所述第一用户组进行再划分,得到若干第二用户组;
根据所述第二用户组中关联边的权重,确定所述用户节点的重要性指标;
根据所述用户节点的重要性指标在所述随时序变化的图结构中的变化,确定所述用户节点的异动指标,以及对所述用户节点的异动指标进行监控,确定时序异动风险节点。
本说明书一个或多个实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
基于用户节点的时序行为数据,确定由多个所述用户节点和所述用户节点间的关联边构成的随时序变化的图结构;
根据所述图结构中用户节点的连通性,划分得到若干第一用户组;
根据所述第一用户组中关联边的权重,确定所述第一用户组对应的凝聚指标;
根据所述第一用户组对应的凝聚指标,删除所述第一用户组中的若干关联边,对所述第一用户组进行再划分,得到若干第二用户组;
根据所述第二用户组中关联边的权重,确定所述用户节点的重要性指标;
根据所述用户节点的重要性指标在所述随时序变化的图结构中的变化,确定所述用户节点的异动指标,以及对所述用户节点的异动指标进行监控,确定时序异动风险节点。
本说明书一个或多个实施例采用的上述至少一个技术方案能够达到以下有益效果:能够以无监督的网络时序异动模型实现,通过与图结构中的图特征的融合,更加简便明了地表示用户节点之间的关联关系,有利于关注网络异动。并且,图结构的形式简便灵活,能够即时地根据用户的时序行为数据进行动态更新,有利于提高模型的运行效率,减少运行时间,及时发现风险数据,还可同时对若干用户节点进行监控,并行运作。另外,本方案可在一阶线性时间复杂度内完成,所需的计算量小,复杂度较低,有利于提高计算效率,增强监控性能。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例提供的一种风险数据监控方法的流程示意图;
图2为本说明书一个或多个实施例提供的一种图结构的变化示意图;
图3为本说明书一个或多个实施例提供的一种应用场景下,图1中方法的一种详细流程示意图;
图4为本说明书一个或多个实施例提供的一种风险数据监控装置的结构示意图;
图5为本说明书一个或多个实施例提供的一种风险数据监控设备的结构示意图。
具体实施方式
本说明书实施例提供一种风险数据监控方法、装置、设备以及存储介质。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
在本说明书一个或多个实施例中,通过构建图结构,表示用户之间的行为数据的关联,能够更加直接的凸显用户之间的关联关系。通过设置凝聚度指标与重要性指标,将关联关系密切的若干用户划分在一起,加强团伙行为之间的关联特征,并进一步明确用户组(比如违法团伙)中用户的重要性,以对重要程度较高的用户进行重点监控与关注。随时序的变化,通过图结构的方式对用户的行为数据变化、重要性指标变化进行监控,确定用户是否存在行为异动,并通过异动指标判断用户对应的风险高低,以实现对风险数据的及时监控与定位,有利于增强网络安全。下面基于这样的思路,具体进行说明。
图1为本说明书一个或多个实施例提供的一种风险数据监控方法的流程示意图。该方法可以应用于不同的业务领域,比如,互联网金融业务领域、电商业务领域、即时通讯业务领域、游戏业务领域、公务业务领域等。该流程可以由相应领域的计算设备(比如,支付业务对应的风控服务器或者智能移动终端等)执行,流程中的某些输入参数或者中间结果允许人工干预调节,以帮助提高准确性。
图1中的流程可以包括以下步骤:
S102:基于用户节点的时序行为数据,确定由多个所述用户节点和所述用户节点间的关联边构成的随时序变化的图结构。
在本说明书一个或多个实施例中,用户节点可通过账号、序号等表示。账号包括手机号、搭载于终端上的某个应用的账号,比如,第三方支付应用的账号、银行应用的账号、即时通讯应用的账号等。
不同的用户节点间可能具有一种或者多种类型的关系,比如,交易关系、通讯录关系、同地址关系、应用好友关系等。用户节点之间的关系可通过关联边表示,则通过关联边将用户节点关联起来,可生成相应的图结构。
进一步地,用户节点之间的关系可能会发生变化,比如增加了交易关系、失去了通讯录关系等。基于用户节点之间的关系变化,表示用户节点之间的关联的关联边随之增加、删除,则其对应的生成的图结构也发生相应的改变。因此,针对不同时刻的用户的行为数据,可分别生成与相应时刻的用户的行为数据对应的图结构,图结构是随时序动态更新的。
直观地,图2为本说明书一个或多个实施例提供的一种图结构的变化示意图,在图2的图结构中,示出了A~H共8个用户节点,以及7条关联边。其中,图2上半部分表示初始的图结构,下半部分表示经过变化后的图结构。
在图2上半部分中,以A为例,A与C之间具有一条关联边,该关联边表示的是A与C之间的交易关系。需要说明的是,根据实际需要,也可以采用更复杂的策略决定是否在用户节点间构建关联边,比如,预设一个交易次数阈值等于3次,A与C之间虽然曾经发生过交易,但若交易次数未超过3次,可以认为交易次数过少,关系特征不够明显,则可以不在A与C之间构建表示交易关系关联的边,而若交易次数超过3次,才在A与C之间构建表示交易关系的关联边。
A与B之间具有一条表示同IP地址关系的关联边,该同IP地址关系比如表示A与B近期可能用同一个局域网中的电脑上过网;A与D之间具有一条表示通讯录关系的关联边,该通讯录关系比如表示A或者D在对方的手机通讯录中。
再以E为例,E与F、H之间分别具有一条表示交易关系的关联边;E与 G之间具有一条表示同收发货地址的边,该同收发货地址比如表示E与G在网上购物时使用相同的收货地址,或者在网上卖货时使用相同的发货地址,则E 与G可能是家人或者同事。
在图2下半部分中,用户节点A与D之间不再有通讯录关系,其对应的关联边消失;节点C与节点G之间新增了一条表示交易关系的关联边,比如,用户节点C与G之间从未有过交易,在某一时刻,C与G之间产生了交易,即对应图2下半部分的情况。除此之外,其他用户节点之间的关联关系基本保持不变。
在实际实施本说明书的方案时,采用的图结构中包含的用户节点和关联边远多于图2中所示。后面的处理基于图结构进行。
在本说明书一个或多个实施例中,图结构的变化可按照预设时间间隔进行定时更新,比如一天、一周等,或者,图结构可仅在用户节点的时序行为数据产生变化的时候,进行更新。
此外,图结构可以常规地以图的形式表示,也可以以列表、文本字符串其他形式间接表示。
S104:根据所述图结构中用户节点的连通性,划分得到若干第一用户组。
根据用户节点之间的关联关系,可确定用户节点之间的连通性。连通性包括两个用户节点之间直接、间接存在的各种关系,比如,在图2中,节点F与 E存在直接关系,同时,节点F与H还通过E的连接存在间接关系。
通过用户节点之间的连通性,对用户节点进行划分,得到若干第一用户组。可知,属于同一第一用户组的用户节点之间均存在一定的关联关系。则在实际业务中,针对不法分子来说,第一用户组可能表示具有关联关系的一个违法团伙。
比如,在图2上半部分中,用户节点A、B、C、D可构成一个第一用户组,用户节点E、F、G、H可构成另一个第一用户组。
S106:根据所述第一用户组中关联边的权重,确定所述第一用户组对应的凝聚指标。
在本说明书一个或多个实施例中,根据第一用户组中用户节点之间的关联关系,以及用户节点之间关联关系的紧密程度,可确定相应图结构中关联边的权重。比如,交易关系越频繁,对应的表示交易关系的关联边的权重越大;在通讯录中的联系次数越频繁,对应的表示通讯录关系的关联边的权重越大;等。
进一步地,根据第一用户组中关联边的权重,可确定第一用户组对应的凝聚指标。凝聚指标用于表示第一用户组整体的关联关系的紧密程度。凝聚指标越高,表示对应的组中的用户节点之间的关联越密切,该第一用户组的划分越合理。
S108:根据所述第一用户组对应的凝聚指标,删除所述第一用户组中的若干关联边,对所述第一用户组进行再划分,得到若干第二用户组。
在本说明书一个或多个实施例中,步骤S106中划分出的第一用户组的关联紧密程度可能不够高,其中掺杂了部分无关紧要的用户节点或者关联关系,比如两个用户节点之间仅存在数量很少的一两次交易,或者,两个用户节点之间为通讯录好友、但从未联系过,等。
因此,通过一定的策略,对划分出的第一用户组进行提纯,去掉无用的用户节点与关联边,使用户组的凝聚指标更高,可得到用户节点之间的关联关系更紧密的用户组,这样也使得通过划分用户组来确认团伙行为的方案能更加准确。
在本说明书的一个或者多个实施例中,通过删除图结构中的关联边,可确定删除关联边对第一用户组的凝聚指标的影响。根据第一用户组的凝聚指标,确定删除组中的部分关联边,以对第一用户组进行再划分,得到若干第二用户组。
S110:根据所述第二用户组中关联边的权重,确定所述用户节点的重要性指标。
在一个用户组中,基于用户节点之间的关联关系,可确定用户节点对应的不同的重要程度。重要程度高的用户节点,通常与其他用户节点之间的关系较为密切,属于用户组的中心,比如不法分子团伙中的领导人物;重要程度较低的用户节点,通常仅与部分其他用户节点存在关联,属于用户组的边缘。
具体地,针对步骤S108确定出的第二用户组中的用户节点,可根据图结构中的关联边的权重,确定该用户节点对应的重要性指标。重要性指标用于表示用户节点在第二用户组中的重要程度,也表示用户节点与其他用户节点之间的关联关系的紧密程度。
S112:根据所述用户节点的重要性指标在所述随时序变化的图结构中的变化,确定所述用户节点的异动指标,以及对所述用户节点的异动指标进行监控,确定时序异动风险节点。
由于用户节点的重要性指标是通过用户时序行为数据所构建的图结构得到的,因此,在用户时序行为数据正常稳定的情况下,用户节点的重要性指标通常也较为稳定。
若用户节点的重要性指标发生较大变化,表示用户节点的行为数据可能存在异常。因此,可根据用户节点的重要性指标的变化,确定用户节点对应的异动指标。异动指标用于表示用户节点的稳定程度,表示用户行为数据在一定时间内的变化剧烈程度,异动指标的大小与用户节点的稳定程度成负相关关系。
进一步地,通过用户节点的异动指标,可确定用户节点对应的异动风险,从而确定异动风险较大的用户节点为时序异动风险节点。用户节点的异动指标越大,表示用户越不稳定,其对应的风险也越大。
通过图1的方法,根据用户的时序行为数据,构建随时序变化的图结构,通过图结构的变化,捕捉用户节点的异常风险行为,确定时序异动风险节点,实现对风险数据的有效监控。本方案能够以无监督的网络时序异动模型实现,通过与图结构中的图特征的融合,更加简便明了地表示用户节点之间的关联关系,有利于关注网络异动。并且,图结构的形式简便灵活,能够即时地根据用户的时序行为数据进行更新,有利于提高模型的运行效率,减少运行时间,及时发现风险数据,还可同时对若干用户节点进行监控,并行运作。
基于图1的方法,本说明书还提供了该方法的一些具体实施方案和扩展方案,下面继续进行说明。
在本说明书一个或多个实施例中,在划分第一用户组的过程中,可确定用户组中道路连通的用户节点,并将道路连通的用户节点划分至同一第一用户组中,以此得到若干第一用户组。即同一用户组内的用户节点之间是道路连通的,不同用户组之间的用户节点之间道路不连通。
具体地,在划分第一用户组时,首先,可初始化用户节点的分组标识。在初始情况下,所有用户节点均属于未更新分组标识的用户节点集合。从未更新分组标识的用户节点集合中,选择待更新的用户节点。针对该待更新的用户节点,确定与其道路连通的其他用户节点。之后,对该待更新的用户节点与确定出的其他用户节点的分组标识进行相同的更新,并将该待更新的用户节点与确定出的其他用户节点划分至同一个第一用户组中。之后,继续重复上述步骤,从未更新分组标识的用户节点集合中选择待更新的用户节点,直到未更新分组标识的用户节点集合为空后,可确定所有用户节点均划分完毕,可得到划分后的若干第一用户组。
更直观地,本说明书实施例还示例性地提供了一种应用场景下,第一用户组划分的具体方案。通过以下步骤说明:
第一,初始化每个用户节点的分组标识为G0(xi)=xi,i=1,……,n。
第二,初始化已更新分组标识的用户节点集合为
Figure BDA0002991240460000101
未更新分组标识的用户节点集合为Q={x1,x2,……,xn},准备更新用户节点的分组标识。
第三,从Q中随机选择一个用户节点xi,初始化集合Z={xi}。
第四,在Q中寻找与Z中的用户节点存在关联边的用户节点,将找到的用户节点从Q中删除,并分别添加到
Figure BDA0002991240460000102
中和Z中。反复执行第四步,直到Z中的任一用户节点与Q中的任一用户节点均不存在关联边。
第五,更新Z中的用户节点的分组标识为G1(xj)=xi
Figure BDA0002991240460000103
第六,判断Q是否为空集,若否,则重复执行第三步到第五步,若是,则确定第一用户组划分结束,输出全部的G1(xi)。
在本说明书一个或多个实施例中,针对第一用户组中的用户节点,可根据该用户节点对应的关联边的权重、该用户节点的邻接节点,确定该用户节点对应的局部凝聚指标。之后,可根据第一用户组中用户节点对应的局部凝聚指标,以及第一用户组对应的关联边的权重之和,确定第一用户组对应的总的凝聚指标。其中,局部凝聚指标、总的凝聚指标与上述步骤S106中的凝聚指标的含义相似,在此不再赘述。
更直观地,本说明书实施例还示例性地提供了一种应用场景下,总的凝聚指标的计算方案,主要通过下面的公式一说明。
Figure BDA0002991240460000111
其中,N表示用户组的总的凝聚指标,M表示用户组对应的图结构中所有关联边的权重之和,ei表示与用户节点i相连的用户节点数,可用于表示用户节点的重要性,wij表示关联边的权重,δ(·)表示示性函数,示性函数所使用的判定条件为真则取值为1,为假则取值为0。
mi表示第i个用户节点xi所连接的所有关联边的权重之和:
Figure BDA0002991240460000112
M表示用户组对应的图结构中所有关联边的权重之和:
Figure BDA0002991240460000113
其中,E表示全部关联边的集合,eij表示xi与xj之间的关联边。公式一中已经解释的部分符号会在后面沿用,后面不再重复解释。
当然,在实际应用中,凝聚度指标的计算公式并不限于公式一,基于公式一的思路还可以得到其他的公式。以下公式同理。
在本说明书一个或多个实施例中,可根据第一用户组的凝聚指标,以及删除关联边对凝聚指标的影响,判断是否删除相应的关联边。
具体地,针对第一用户组中的关联边,可确定删除该关联边后,对应的第一用户组的修改的凝聚指标。若删除该关联边后,修改的凝聚指标大于第一用户组的原始的凝聚指标,表示该关联边对第一用户组的关联性的紧密程度不起积极作用,通常表示无关紧要的关联关系,则可确定删除该关联边,以增加第一用户组的凝聚指标;若删除该关联边后,修改的凝聚指标小于第一用户组的原始的凝聚指标,表示该关联边对第一用户组的关联性的紧密程度可能起到较为重要的积极作用,则不应删除该关联边,以免影响第一用户组的凝聚指标。
遍历第一用户组中的关联边,依次判断是否删除相应的关联边,可对第一用户组进行再划分,得到划分后的若干第二用户组。
进一步地,可能存在删除关联边后,第一用户组即分裂为两个用户组的情况。在这种情况下,可将分裂得到的两个用户组的修改的凝聚指标求和,与第一用户组原始的凝聚指标进行比较,以判断是否删除关联边。
或者,可确定分裂后的两个用户组中,至少存在一个用户组的修改的凝聚指标大于第一用户组原始的凝聚指标时,即认为符合条件,并删除关联边。
或者,可根据分裂后的两个用户组中分别包含的用户节点的数量,以包含的用户节点的数量多的用户组为准,将包含的用户节点的数量多的用户组的修改的凝聚指标与原始的凝聚指标进行比较,以判断是否需要删除相应的关联边。
此外,在对第一用户组进行再划分时,可确定仅对用户节点数大于第一预设阈值的第一用户组进行再划分。这样有利于集中对用户节点数量较多的用户组进行提纯,同时减少工作量。
在本说明书一个或多个实施例中,用户节点的重要性指标的确定过程主要包括以下步骤:
第一,根据用户组中用户节点对应的关联边的权重,初始化用户节点的重要性指标。
第二,根据用户节点的邻接节点的重要性指标,以及用户节点对应的关联边的权重,更新用户节点的重要性指标。
第三,对用户节点的重要性指标进行归一化。
第四,重复本步骤中第二步与第三步,直至用户节点的重要性指标达到收敛目标,可得到用户节点的重要性指标。
更直观地,本说明书实施例还示例性地提供了一种应用场景下,重要性指标的计算方案。
通过
Figure BDA0002991240460000131
i=1,2,……,n初始化用户节点的重要性指标。
其中,pi表示用户节点i对应的重要性指标。
通过
Figure BDA0002991240460000132
i=1,2,……,n更新用户节点的重要性指标。
通过
Figure BDA0002991240460000133
对用户节点的重要性指标进行归一化。
本计算方案中涉及的部分符号会在后面沿用,后面不再重复解释。
在本说明书一个或多个实施例中,为了减少工作量,提高风险监控效率,同时更加集中的、具有针对性的对主要的、最可能存在风险的用户节点进行风险数据监控,可仅对重要性指标大于第二预设阈值的用户节点进行监控。
具体地,确定对用户节点进行监控的时段对应的第一时间点、第二时间点,通过用户的时序行为数据的变化,可确定用户节点对应的重要性指标在第一时间点与第二时间点之间的差值。之后,可根据预设的时间衰减系数,对一定时间段内对应的多个差值进行时间平均,以确定用户节点的异动指标。其中,第一时间点、第二时间点可用于表示多个时段的两端。
更直观地,本说明书实施例还示例性地提供了一种应用场景下,异动指标的计算方案。主要通过以下公式二说明。
Figure BDA0002991240460000134
其中,
Figure BDA0002991240460000135
表示对用户节点进行监控的时段的第一时间点,
Figure BDA0002991240460000136
对用户节点进行监控的时段的第二时间点,第一时间点早于第二时间点,
Figure BDA0002991240460000137
表示用户节点在第二时间点对应的异动指标,αj、βj表示预设的时间衰减系数。
在公式二中,用户节点的重要性指标随时间变大时,
Figure BDA0002991240460000138
中括号中第一项对应的示性函数的取值为1,第二项对应的示性函数的取值为0,通过时间衰减系数αj对重要性指标的变化进行时间平均;用户节点的重要性指标随时间变小时,
Figure BDA0002991240460000139
中括号中第一项对应的示性函数的取值为0,第二项对应的示性函数的取值为1,通过时间衰减系数βj对重要性指标的变化进行时间平均。
上述公式二为一阶线性时间复杂度,所需的计算量小,复杂度较低,有利于提高计算效率,增强风险监控性能。
公式二中涉及的部分符号会在后面沿用,后面不再重复解释。
在本说明书一个或多个实施例中,用户节点的异动指标在第一时间点与第二时间点之间的变化,表示了用户节点异动变大或者变小的趋势,也可用于表示用户节点存在的风险变大或者变小的趋势。因此,根据用户节点的异动指标在第一时间点与第二时间点之间的变化,可对用户节点的异动指标进行适当的调整,以在考虑用户节点的异动变化趋势的基础上,对用户节点存在的风险进行评判,得到用户节点的风险指标。之后,根据用户节点的风险指标,可确定相应的时序异动风险节点。比如,确定风险指标大于第三预设阈值的用户节点为时序异动风险节点。
进一步地,针对用户节点的异动指标的变化趋势不同,可分情况讨论对用户节点的风险指标进行调整的方案。
若异动指标随时序变大,表示用户节点的风险存在增大的趋势,且用户节点先前(比如在第一时间点)的行为风险较小,则可不考虑用户节点先前的行为,而仅考虑用户节点当前(比如在第二时间点)的行为。则可根据第二时间点的异动指标,即增大的异动指标,确定用户节点对应的调整后的异动指标,得到所述用户节点的风险指标。
若异动指标随时序变小,表示用户节点的风险存在减小的趋势,但用户节点先前(比如在第一时间点)的行为已经属于较高风险的行为,则在对用户节点的异动指标进行调整时,可对用户节点先前的行为与当前的行为进行综合考虑与评判,也就是同时根据第一时间点以及第二时间点的异动指标,确定用户节点对应的调整后的异动指标,得到用户节点的风险指标。
这样分情况对用户节点的行为的风险性进行评判,有利于针对用户节点的不同行为变化趋势,有针对性的确定用户节点可能具有的风险,以实现对用户节点的风险性的更准确的判断。
更直观地,本说明书实施例还示例性地提供了一种应用场景下,风险指标的计算方案。主要通过以下公式三进行说明。
Figure BDA0002991240460000151
其中,
Figure BDA0002991240460000152
表示风险指标,
Figure BDA0002991240460000153
表示第一时间点的异动指标,
Figure BDA0002991240460000154
表示第二时间的异动指标,γ表示预设的平滑因子。
在公式二中,异动指标随时序变大时,以第二时间点的异动指标,即增大的异动指标,作为用户节点的风险指标。异动指标随时序变小时,根据第一时间点的异动指标与第二时间点的异动指标之间的加权和,确定用户节点的风险指标,平滑因子用于确定加权的权重大小。
进一步地,在综合评判用户节点的风险时,可将第二时间点(比如当前时间点)的异动指标作为基础,将第一时间点的异动指标作为辅助,确定用户节点的风险指标。因此,可将平滑因子设置为大于0.5的数值,比如0.8。
结合前面的说明,本说明书一个或多个实施例提供了的一种应用场景下,图1中方法的一种详细流程示意图,该流程中使用了前面一些可选的方案,该流程如图3所示。
在图3的流程中,获取用户行为序列数据,用于构建图结构。
将用户节点划分为具有聚集性的第一用户组,同一用户组内部的用户道路连通,不同用户组之间的用户道路不连通。并且,确定第一用户组的凝聚指标。
根据第一用户组的凝聚指标,将用户节点数量超过第一预设阈值的第一用户组再划分为若干更具有聚集性的第二用户组。
确定第二用户组中用户节点的重要性指标,并挖掘其中重要程度高的用户节点。
基于图结构随用户时序行为数据的动态更新,对重要程度高的用户节点进行时序异动监控,确定时序异动风险节点并输出,对时序异动风险节点进行重点关注。
进一步地,也可直接根据划分的第一用户组,进行后续的确定用户节点的重要性指标、确定时序异动风险节点的操作。这样节省了再划分第二用户组的操作,有利于提高效率。
基于同样的思路,本说明书一个或多个实施例还提供了上述方法对应的装置和设备,如图4、图5所示。
图4为本说明书一个或多个实施例提供的一种风险数据监控装置的结构示意图,图中的虚线方框表示可选的模块,所述装置包括:
图结构模块402,基于用户节点的时序行为数据,确定由多个所述用户节点和所述用户节点间的关联边构成的随时序变化的图结构;
第一划分模块404,根据所述图结构中用户节点的连通性,划分得到若干第一用户组;
凝聚指标确定模块406,根据所述第一用户组中关联边的权重,确定所述第一用户组对应的凝聚指标;
第二划分模块408,根据所述第一用户组对应的凝聚指标,删除所述第一用户组中的若干关联边,对所述第一用户组进行再划分,得到若干第二用户组;
重要性指标确定模块410,根据所述第二用户组中关联边的权重,确定所述用户节点的重要性指标;
异动指标及时序异动风险节点确定模块412,根据所述用户节点的重要性指标在所述随时序变化的图结构中的变化,确定所述用户节点的异动指标,以及对所述用户节点的异动指标进行监控,确定时序异动风险节点。
可选地,所述第一划分模块404,根据所述图结构中用户节点的连通性,确定道路连通的用户节点;将所述道路连通的用户节点划分至同一第一用户组中,得到若干第一用户组。
可选地,所述第一划分模块404,初始化所述用户节点的分组标识;从未更新分组标识的用户节点集合中,选择待更新的用户节点;确定与所述待更新的用户节点道路连通的其他用户节点,对所述待更新的用户节点与确定出的所述其他用户节点的分组标识进行相同的更新,并将所述待更新的用户节点与确定出的所述其他用户节点划分至同一第一用户组中;确定所述未更新分组标识的用户节点集合为空后,得到若干第一用户组。
可选地,所述凝聚指标确定模块406,针对所述第一用户组中用户节点,根据该用户节点对应的关联边的权重、该用户节点的邻接节点,确定该用户节点对应的局部凝聚指标;根据所述第一用户组中用户节点对应的局部凝聚指标,以及所述第一用户组对应的关联边的权重之和,确定所述第一用户组对应的总的凝聚指标。
可选地,所述第二划分模块408,针对所述第一用户组中的关联边,确定删除该关联边后,对应的所述第一用户组的修改的凝聚指标;若删除该关联边后,所述修改的凝聚指标大于所述第一用户组的原始的凝聚指标,则确定删除该关联边;遍历所述第一用户组中的关联边,判断是否删除相应的关联边,以对所述第一用户组进行再划分,得到若干第二用户组。
可选地,所述装置还包括:划分确定模块414,确定所述第一用户组中的用户节点数大于第一预设阈值。
可选地,所述重要性指标确定模块410,根据所述用户节点对应的关联边的权重,初始化所述用户节点的重要性指标;根据所述用户节点的邻接节点的重要性指标,以及所述用户节点对应的关联边的权重,更新所述用户节点的重要性指标,并对所述用户节点的重要性指标进行归一化;重复所述更新以及归一化的过程,直至所述用户节点的重要性指标达到收敛目标,得到所述用户节点的重要性指标。
可选地,所述装置还包括:重要性筛选模块416,确定所述用户节点的重要性指标大于第二预设阈值;所述异动指标及时序异动风险节点确定模块412 具体包括异动指标确定模块4122、时序异动风险节点确定模块4124;所述异动指标确定模块4122,确定对所述用户节点进行监控的时段对应的第一时间点、第二时间点;所述第一时间点早于所述第二时间点;确定所述用户节点在所述第一时间点的重要性指标与在所述第二时间点的重要性指标之间的差值;根据预设的时间衰减系数,对所述差值进行时间平均,确定所述用户节点的异动指标。
可选地,所述时序异动风险节点确定模块4124,根据所述用户节点的异动指标在所述第一时间点与所述第二时间点对应的变化,对所述用户节点的异动指标进行调整,得到所述用户节点的风险指标;根据所述用户节点的风险指标,确定时序异动风险节点。
可选地,所述时序异动风险节点确定模块4124,确定所述用户节点的异动指标随时序的大小变化趋势;若所述异动指标随时序变大,则根据所述第二时间点的异动指标,对所述用户节点的异动指标进行调整,得到所述用户节点的风险指标;若所述异动指标随时序变小,则根据所述第一时间点以及第二时间点的异动指标,对所述用户节点的异动指标进行调整,得到所述用户节点的风险指标。
图5为本说明书一个或多个实施例提供的一种风险数据监控设备的结构示意图,所述设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
基于用户节点的时序行为数据,确定由多个所述用户节点和所述用户节点间的关联边构成的随时序变化的图结构;
根据所述图结构中用户节点的连通性,划分得到若干第一用户组;
根据所述第一用户组中关联边的权重,确定所述第一用户组对应的凝聚指标;
根据所述第一用户组对应的凝聚指标,删除所述第一用户组中的若干关联边,对所述第一用户组进行再划分,得到若干第二用户组;
根据所述第二用户组中关联边的权重,确定所述用户节点的重要性指标;
根据所述用户节点的重要性指标在所述随时序变化的图结构中的变化,确定所述用户节点的异动指标,以及对所述用户节点的异动指标进行监控,确定时序异动风险节点。
处理器与存储器之间可以通过总线通信,设备还可以包括与其他设备通信的输入/输出接口。
基于同样的思路,本说明书一个或多个实施例还提供了对应于上述方法的一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
基于用户节点的时序行为数据,确定由多个所述用户节点和所述用户节点间的关联边构成的随时序变化的图结构;
根据所述图结构中用户节点的连通性,划分得到若干第一用户组;
根据所述第一用户组中关联边的权重,确定所述第一用户组对应的凝聚指标;
根据所述第一用户组对应的凝聚指标,删除所述第一用户组中的若干关联边,对所述第一用户组进行再划分,得到若干第二用户组;
根据所述第二用户组中关联边的权重,确定所述用户节点的重要性指标;
根据所述用户节点的重要性指标在所述随时序变化的图结构中的变化,确定所述用户节点的异动指标,以及对所述用户节点的异动指标进行监控,确定时序异动风险节点。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray, FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、 Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL (Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL (RubyHardware Description Language)等,目前最普遍使用的是VHDL (Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书实施例可提供为方法、系统、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (21)

1.一种风险数据监控方法,包括:
基于用户节点的时序行为数据,确定由多个所述用户节点和所述用户节点间的关联边构成的随时序变化的图结构;
根据所述图结构中用户节点的连通性,划分得到若干第一用户组;
根据所述第一用户组中关联边的权重,确定所述第一用户组对应的凝聚指标;
根据所述第一用户组对应的凝聚指标,删除所述第一用户组中的若干关联边,对所述第一用户组进行再划分,得到若干第二用户组;
根据所述第二用户组中关联边的权重,确定所述用户节点的重要性指标;
根据所述用户节点的重要性指标在所述随时序变化的图结构中的变化,确定所述用户节点的异动指标,以及对所述用户节点的异动指标进行监控,确定时序异动风险节点。
2.如权利要求1所述的方法,所述根据所述图结构中用户节点的连通性,划分得到若干第一用户组,具体包括:
根据所述图结构中用户节点的连通性,确定道路连通的用户节点;
将所述道路连通的用户节点划分至同一第一用户组中,得到若干第一用户组。
3.如权利要求2所述的方法,所述根据所述图结构中用户节点的连通性,划分得到若干第一用户组,具体包括:
初始化所述用户节点的分组标识;
从未更新分组标识的用户节点集合中,选择待更新的用户节点;
确定与所述待更新的用户节点道路连通的其他用户节点,对所述待更新的用户节点与确定出的所述其他用户节点的分组标识进行相同的更新,并将所述待更新的用户节点与确定出的所述其他用户节点划分至同一第一用户组中;
确定所述未更新分组标识的用户节点集合为空后,得到若干第一用户组。
4.如权利要求1所述的方法,所述根据所述第一用户组中关联边的权重,确定所述第一用户组对应的凝聚指标,具体包括:
针对所述第一用户组中用户节点,根据该用户节点对应的关联边的权重、该用户节点的邻接节点,确定该用户节点对应的局部凝聚指标;
根据所述第一用户组中用户节点对应的局部凝聚指标,以及所述第一用户组对应的关联边的权重之和,确定所述第一用户组对应的总的凝聚指标。
5.如权利要求1所述的方法,所述根据所述第一用户组对应的凝聚指标,删除所述第一用户组中的若干关联边,对所述第一用户组进行再划分,得到若干第二用户组,具体包括:
针对所述第一用户组中的关联边,确定删除该关联边后,对应的所述第一用户组的修改的凝聚指标;
若删除该关联边后,所述修改的凝聚指标大于所述第一用户组的原始的凝聚指标,则确定删除该关联边;
遍历所述第一用户组中的关联边,判断是否删除相应的关联边,以对所述第一用户组进行再划分,得到若干第二用户组。
6.如权利要求4所述的方法,所述对所述第一用户组进行再划分之前,所述方法还包括:
确定所述第一用户组中的用户节点数大于第一预设阈值。
7.如权利要求1所述的方法,所述根据所述第二用户组中关联边的权重,确定所述用户节点的重要性指标,具体包括:
根据所述用户节点对应的关联边的权重,初始化所述用户节点的重要性指标;
根据所述用户节点的邻接节点的重要性指标,以及所述用户节点对应的关联边的权重,更新所述用户节点的重要性指标,并对所述用户节点的重要性指标进行归一化;
重复所述更新以及归一化的过程,直至所述用户节点的重要性指标达到收敛目标,得到所述用户节点的重要性指标。
8.如权利要求1所述的方法,所述根据所述用户节点的重要性指标在所述随时序变化的图结构中的变化,确定所述用户节点的异动指标之前,所述方法还包括:
确定所述用户节点的重要性指标大于第二预设阈值;
所述根据所述用户节点的重要性指标在所述随时序变化的图结构中的变化,确定所述用户节点的异动指标,具体包括:
确定对所述用户节点进行监控的时段对应的第一时间点、第二时间点;所述第一时间点早于所述第二时间点;
确定所述用户节点在所述第一时间点的重要性指标与在所述第二时间点的重要性指标之间的差值;
根据预设的时间衰减系数,对多个所述差值进行时间平均,确定所述用户节点的异动指标。
9.如权利要求8所述的方法,所述对所述用户节点的异动指标进行监控,确定时序异动风险节点,具体包括:
根据所述用户节点的异动指标在所述第一时间点与所述第二时间点对应的变化,对所述用户节点的异动指标进行调整,得到所述用户节点的风险指标;
根据所述用户节点的风险指标,确定时序异动风险节点。
10.如权利要求9所述的方法,所述根据所述用户节点的异动指标在所述第一时间点与所述第二时间点对应的变化,对所述用户节点的异动指标进行调整,得到所述用户节点的风险指标,具体包括:
确定所述用户节点的异动指标随时序的大小变化趋势;
若所述异动指标随时序变大,则根据所述第二时间点的异动指标,对所述用户节点的异动指标进行调整,得到所述用户节点的风险指标;
若所述异动指标随时序变小,则根据所述第一时间点以及第二时间点的异动指标,对所述用户节点的异动指标进行调整,得到所述用户节点的风险指标。
11.一种风险数据监控装置,包括:
图结构模块,基于用户节点的时序行为数据,确定由多个所述用户节点和所述用户节点间的关联边构成的随时序变化的图结构;
第一划分模块,根据所述图结构中用户节点的连通性,划分得到若干第一用户组;
凝聚指标确定模块,根据所述第一用户组中关联边的权重,确定所述第一用户组对应的凝聚指标;
第二划分模块,根据所述第一用户组对应的凝聚指标,删除所述第一用户组中的若干关联边,对所述第一用户组进行再划分,得到若干第二用户组;
重要性指标确定模块,根据所述第二用户组中关联边的权重,确定所述用户节点的重要性指标;
异动指标及时序异动风险节点确定模块,根据所述用户节点的重要性指标在所述随时序变化的图结构中的变化,确定所述用户节点的异动指标,以及对所述用户节点的异动指标进行监控,确定时序异动风险节点。
12.如权利要求11所述的装置,所述第一划分模块,根据所述图结构中用户节点的连通性,确定道路连通的用户节点;
将所述道路连通的用户节点划分至同一第一用户组中,得到若干第一用户组。
13.如权利要求12所述的装置,所述第一划分模块,初始化所述用户节点的分组标识;
从未更新分组标识的用户节点集合中,选择待更新的用户节点;
确定与所述待更新的用户节点道路连通的其他用户节点,对所述待更新的用户节点与确定出的所述其他用户节点的分组标识进行相同的更新,并将所述待更新的用户节点与确定出的所述其他用户节点划分至同一第一用户组中;
确定所述未更新分组标识的用户节点集合为空后,得到若干第一用户组。
14.如权利要求11所述的装置,所述凝聚指标确定模块,针对所述第一用户组中用户节点,根据该用户节点对应的关联边的权重、该用户节点的邻接节点,确定该用户节点对应的局部凝聚指标;
根据所述第一用户组中用户节点对应的局部凝聚指标,以及所述第一用户组对应的关联边的权重之和,确定所述第一用户组对应的总的凝聚指标。
15.如权利要求11所述的装置,所述第二划分模块,针对所述第一用户组中的关联边,确定删除该关联边后,对应的所述第一用户组的修改的凝聚指标;
若删除该关联边后,所述修改的凝聚指标大于所述第一用户组的原始的凝聚指标,则确定删除该关联边;
遍历所述第一用户组中的关联边,判断是否删除相应的关联边,以对所述第一用户组进行再划分,得到若干第二用户组。
16.如权利要求14所述的装置,所述装置还包括:
划分确定模块,确定所述第一用户组中的用户节点数大于第一预设阈值。
17.如权利要求11所述的装置,所述重要性指标确定模块,根据所述用户节点对应的关联边的权重,初始化所述用户节点的重要性指标;
根据所述用户节点的邻接节点的重要性指标,以及所述用户节点对应的关联边的权重,更新所述用户节点的重要性指标,并对所述用户节点的重要性指标进行归一化;
重复所述更新以及归一化的过程,直至所述用户节点的重要性指标达到收敛目标,得到所述用户节点的重要性指标。
18.如权利要求11所述的装置,所述装置还包括:
重要性筛选模块,确定所述用户节点的重要性指标大于第二预设阈值;
所述异动指标及时序异动风险节点确定模块具体包括异动指标确定模块、时序异动风险节点确定模块;
所述异动指标确定模块,确定对所述用户节点进行监控的时段对应的第一时间点、第二时间点;所述第一时间点早于所述第二时间点;
确定所述用户节点在所述第一时间点的重要性指标与在所述第二时间点的重要性指标之间的差值;
根据预设的时间衰减系数,对多个所述差值进行时间平均,确定所述用户节点的异动指标。
19.如权利要求18所述的装置,所述时序异动风险节点确定模块,根据所述用户节点的异动指标在所述第一时间点与所述第二时间点对应的变化,对所述用户节点的异动指标进行调整,得到所述用户节点的风险指标;
根据所述用户节点的风险指标,确定时序异动风险节点。
20.如权利要求19所述的装置,所述时序异动风险节点确定模块,确定所述用户节点的异动指标随时序的大小变化趋势;
若所述异动指标随时序变大,则根据所述第二时间点的异动指标,对所述用户节点的异动指标进行调整,得到所述用户节点的风险指标;
若所述异动指标随时序变小,则根据所述第一时间点以及第二时间点的异动指标,对所述用户节点的异动指标进行调整,得到所述用户节点的风险指标。
21.一种风险数据监控设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
基于用户节点的时序行为数据,确定由多个所述用户节点和所述用户节点间的关联边构成的随时序变化的图结构;
根据所述图结构中用户节点的连通性,划分得到若干第一用户组;
根据所述第一用户组中关联边的权重,确定所述第一用户组对应的凝聚指标;
根据所述第一用户组对应的凝聚指标,删除所述第一用户组中的若干关联边,对所述第一用户组进行再划分,得到若干第二用户组;
根据所述第二用户组中关联边的权重,确定所述用户节点的重要性指标;
根据所述用户节点的重要性指标在所述随时序变化的图结构中的变化,确定所述用户节点的异动指标,以及对所述用户节点的异动指标进行监控,确定时序异动风险节点。
CN202110316073.1A 2021-03-24 2021-03-24 一种风险数据监控方法、装置以及设备 Active CN113157767B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110316073.1A CN113157767B (zh) 2021-03-24 2021-03-24 一种风险数据监控方法、装置以及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110316073.1A CN113157767B (zh) 2021-03-24 2021-03-24 一种风险数据监控方法、装置以及设备

Publications (2)

Publication Number Publication Date
CN113157767A CN113157767A (zh) 2021-07-23
CN113157767B true CN113157767B (zh) 2022-06-07

Family

ID=76884855

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110316073.1A Active CN113157767B (zh) 2021-03-24 2021-03-24 一种风险数据监控方法、装置以及设备

Country Status (1)

Country Link
CN (1) CN113157767B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837252B (zh) * 2021-09-14 2024-03-26 支付宝(杭州)信息技术有限公司 聚类处理方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106708844A (zh) * 2015-11-12 2017-05-24 阿里巴巴集团控股有限公司 一种用户群体的划分方法和装置
CN109598563A (zh) * 2019-01-24 2019-04-09 北京三快在线科技有限公司 刷单检测方法、装置、存储介质和电子设备
CN109978538A (zh) * 2017-12-28 2019-07-05 阿里巴巴集团控股有限公司 确定欺诈用户、训练模型、识别欺诈风险的方法及装置
US10515366B1 (en) * 2013-12-24 2019-12-24 EMC IP Holding Company LLC Network neighborhood topology as a predictor for fraud and anomaly detection
CN111612041A (zh) * 2020-04-24 2020-09-01 平安直通咨询有限公司上海分公司 异常用户识别方法及装置、存储介质、电子设备
CN112308565A (zh) * 2020-08-14 2021-02-02 中国工商银行股份有限公司 基于知识图谱的多对多跨境资金风控方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8566213B2 (en) * 2005-05-20 2013-10-22 Bgc Partners, Inc. System and method for automatically distributing a trading order over a range of prices
US8869245B2 (en) * 2011-03-09 2014-10-21 Ebay Inc. Device reputation
US20200084019A1 (en) * 2018-09-07 2020-03-12 Nebulas IO Limited Blockchain Ranking Engine
US20200242615A1 (en) * 2019-01-28 2020-07-30 Fair Isaac Corporation First party fraud detection

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10515366B1 (en) * 2013-12-24 2019-12-24 EMC IP Holding Company LLC Network neighborhood topology as a predictor for fraud and anomaly detection
CN106708844A (zh) * 2015-11-12 2017-05-24 阿里巴巴集团控股有限公司 一种用户群体的划分方法和装置
CN109978538A (zh) * 2017-12-28 2019-07-05 阿里巴巴集团控股有限公司 确定欺诈用户、训练模型、识别欺诈风险的方法及装置
CN109598563A (zh) * 2019-01-24 2019-04-09 北京三快在线科技有限公司 刷单检测方法、装置、存储介质和电子设备
CN111612041A (zh) * 2020-04-24 2020-09-01 平安直通咨询有限公司上海分公司 异常用户识别方法及装置、存储介质、电子设备
CN112308565A (zh) * 2020-08-14 2021-02-02 中国工商银行股份有限公司 基于知识图谱的多对多跨境资金风控方法及系统

Also Published As

Publication number Publication date
CN113157767A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
CN110264326B (zh) 识别异常账户集合和风险账户集合的方法、装置及设备
EP3754571A1 (en) Risk control rule generation method and apparatus
CN110322349B (zh) 一种数据的处理方法、装置及设备
TW201933232A (zh) 店鋪資訊推薦方法、裝置及用戶端
CN113361658B (zh) 一种基于隐私保护的图模型训练方法、装置及设备
CN111080304B (zh) 一种可信关系识别方法、装置及设备
CN110428137B (zh) 一种风险防控策略的更新方法及装置
CN111639687B (zh) 一种模型训练以及异常账号识别方法及装置
CN107578338B (zh) 一种业务发布方法、装置及设备
CN111047220A (zh) 一种风控阈值条件确定方法、装置、设备和可读介质
CN113157767B (zh) 一种风险数据监控方法、装置以及设备
CN107391564B (zh) 数据转换方法、装置以及电子设备
CN114372566A (zh) 图数据的增广、图神经网络训练方法、装置以及设备
CN116308738B (zh) 一种模型训练的方法、业务风控的方法及装置
CN109614415B (zh) 一种数据挖掘、处理方法、装置、设备及介质
CN112001649B (zh) 一种风险数据挖掘方法、装置以及设备
CN115618748A (zh) 一种模型优化的方法、装置、设备及存储介质
CN107368281B (zh) 一种数据处理方法及装置
CN114968422A (zh) 基于变量状态自动执行合约的方法和装置
CN111212073B (zh) 基于公有云的黑名单账户共享方法及装置
CN109753351B (zh) 一种限时任务处理方法、装置、设备及介质
CN109325127B (zh) 一种风险识别方法和装置
CN111522866A (zh) 一种可信子图的挖掘方法、装置以及设备
CN114723269A (zh) 一种事件的风险防控方法、装置及设备
WO2024113932A1 (zh) 一种模型优化的方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant