CN110851541A - 用于基于关系图生成风险特征的方法及装置 - Google Patents

用于基于关系图生成风险特征的方法及装置 Download PDF

Info

Publication number
CN110851541A
CN110851541A CN201911046463.0A CN201911046463A CN110851541A CN 110851541 A CN110851541 A CN 110851541A CN 201911046463 A CN201911046463 A CN 201911046463A CN 110851541 A CN110851541 A CN 110851541A
Authority
CN
China
Prior art keywords
graph
risk
feature
specified
relational graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911046463.0A
Other languages
English (en)
Other versions
CN110851541B (zh
Inventor
张天翼
叶捷明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN201911046463.0A priority Critical patent/CN110851541B/zh
Publication of CN110851541A publication Critical patent/CN110851541A/zh
Application granted granted Critical
Publication of CN110851541B publication Critical patent/CN110851541B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Development Economics (AREA)
  • Mathematical Physics (AREA)
  • Educational Administration (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例提供了一种用于基于关系图生成风险特征的方法及装置。在该方法中,在获取事件级数据后,执行以下循环过程,直至满足指定循环结束条件:按照构图模板和当前边参数来将事件级数据构建成关系图,对关系图进行特征生成处理以生成当前风险特征,输出满足指定特征效能条件的风险特征。其中,在不满足指定循环结束条件时对当前边参数进行参数调整处理,调整后的边参数被确定为下一循环中的当前边参数。

Description

用于基于关系图生成风险特征的方法及装置
技术领域
本说明书实施例涉及机器学习技术领域,具体地,涉及用于基于关系图生成风险特征的方法及装置。
背景技术
风控体系由规则和模型两部分组成,利用风控规则和风控模型可以对潜在风险进行评估进而发现风险,并对发现的风险采取措施以避免造成损失。
风控模型和风控规则都是基于风险形势、作案手法以及行为序列等风险特征得到的,并且风控模型和风控规则都强依赖于风险特征的准确性、覆盖性以及鲁棒性等。
目前有一类风险特征主要依赖于关系图生成的,这类风险特征在风控体系中有着很重要的作用。对于这一类风险特征,需要先依赖于人工经验构建关系图,再基于关系图以生成相应的风险特征。
发明内容
鉴于上述,本说明书实施例提供了一种用于基于关系图生成风险特征的方法及装置。在该方法中,在获取事件级数据后,执行以下循环过程,直至满足指定循环结束条件:按照构图模板和当前边参数来将事件级数据构建成关系图,对关系图进行特征生成处理以生成当前风险特征,输出满足指定特征效能条件的风险特征。其中,在不满足指定循环结束条件时对当前边参数进行参数调整处理,调整后的边参数被确定为下一循环中的当前边参数。上述方法的执行过程不依赖于人工经验便能得到满足指定特征效能条件的风险特征,避免了人为干预以及提高了风险特征的生成效率。
根据本说明书实施例的一个方面,提供了一种用于基于关系图生成风险特征的方法,包括:获取事件级数据;对所述事件级数据执行下述循环过程,直到满足指定循环结束条件:按照构图模板和当前边参数来将所述事件级数据构建成关系图;对所述关系图进行特征生成处理,以生成当前风险特征;输出所生成的当前风险特征中的满足指定特征效能条件的风险特征,其中,在不满足所述指定循环结束条件时,对所述当前边参数进行参数调整处理,所述调整后的边参数被确定为下一循环中的当前边参数。
可选地,在上述方面的一个示例中,还包括:当所构建的关系图不小于指定尺寸时,基于预定关系图拆分策略对该关系图进行拆分,以得到小于所述指定尺寸的子关系图;以及对所述关系图进行特征生成处理,以生成当前风险特征包括:分别对各个子关系图进行特征生成处理,以生成当前风险特征。
可选地,在上述方面的一个示例中,所述预定关系图拆分策略使得所述关系图被拆分导致的图信息损失量小于损失阈值。
可选地,在上述方面的一个示例中,对所述关系图进行特征生成处理以生成当前风险特征包括:采用下述算法中的至少一种来对所述关系图进行特征生成处理以生成当前风险特征:社群发现算法;图结构匹配算法;和深度学习算法。
可选地,在上述方面的一个示例中,所述指定特征效能条件包括:风险特征对应的特征信息量大于指定阈值。
可选地,在上述方面的一个示例中,所述指定特征效能条件包括:风险特征对应的风控模型的模型性能增益大于增益阈值。
可选地,在上述方面的一个示例中,参数调整处理的方式包括遗传算法。
可选地,在上述方面的一个示例中,所输出的风险特征用于训练风控模型。
根据本说明书实施例的另一方面,还提供一种用于基于关系图生成风险特征的装置,包括:数据获取单元,获取事件级数据;关系图构建单元,按照构图模板和当前边参数来将所述事件级数据构建成关系图;特征生成单元,对所述关系图进行特征生成处理,以生成当前风险特征;特征输出单元,输出所生成的当前风险特征中的满足指定特征效能条件的风险特征;以及参数调整单元,在满足指定循环结束条件时,对所述当前边参数进行参数调整处理,所述调整后的边参数被确定为下一循环中的当前边参数,并触发所述关系图构建单元。
可选地,在上述方面的一个示例中,还包括:关系图拆分单元,当所构建的关系图不小于指定尺寸时,基于预定关系图拆分策略对该关系图进行拆分,以得到小于所述指定尺寸的子关系图;以及所述特征生成单元:分别对各个子关系图进行特征生成处理,以生成当前风险特征。
可选地,在上述方面的一个示例中,所述特征生成单元:采用下述算法中的至少一种来对所述关系图进行特征生成处理以生成当前风险特征:社群发现算法;图结构匹配算法;和深度学习算法。
可选地,在上述方面的一个示例中,所述指定特征效能条件包括:风险特征对应的特征信息量大于指定阈值。
可选地,在上述方面的一个示例中,所述指定特征效能条件包括:风险特征对应的风控模型的模型性能增益大于增益阈值。
根据本说明书实施例的另一方面,还提供一种电子设备,包括:至少一个处理器;以及存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的用于基于关系图生成风险特征的方法。
根据本说明书实施例的另一方面,还提供一种机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如上所述的用于基于关系图生成风险特征的方法。
附图说明
通过参照下面的附图,可以实现对于本说明书内容的本质和优点的进一步理解。在附图中,类似组件或特征可以具有相同的附图标记。附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本说明书的实施例,但并不构成对本说明书的实施例的限制。在附图中:
图1示出了本说明书的实施例的用于基于关系图生成风险特征的方法的流程图;
图2示出了本说明书的实施例的完全子图的一个示例的示意图;
图3示出了本说明书的实施例的图元的一个示例的示意图;
图4示出了本说明书的另一实施例的用于基于关系图生成风险特征的方法的流程图;
图5示出了本说明书的实施例的用于基于关系图生成风险特征的装置的方框图;
图6示出了本说明书的另一实施例的用于基于关系图生成风险特征的装置的方框图;
图7示出了本说明书的实施例的用于基于关系图生成风险特征的方法的电子设备的方框图。
具体实施方式
以下将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本说明书内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。
如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。
风控体系包括风控规则和风控模型,使用风控规则和风控模型可以对潜在风险进行评估进而发现风险,后续再对发现的风险采取相应措施以避免造成经济损失。
风控模型和风控规则都是基于风险形势、作案手法以及行为序列等风险特征得到的,并且风控模型和风控规则都强依赖于风险特征的准确性、覆盖性以及鲁棒性等。
目前有一类风险特征主要根据关系图生成的,这类风险特征在风控体系中有着很重要的作用。对于这一类风险特征,需要先依赖于人工经验构建关系图,再基于关系图以生成相应的风险特征。
然而,依赖于人工经验不仅导致人力资源的浪费,而且人工经验无法进行量化评估会存在人工经验判断失误、作弊等情况,进而导致生成的风险特征准确性、覆盖性以及鲁棒性均达不到要求。
为了解决上述问题,本说明书实施例提供了一种用于基于关系图生成风险特征的方法及装置。在该方法中,在获取事件级数据后,执行以下循环过程,直至满足指定循环结束条件:按照构图模板和当前边参数来将事件级数据构建成关系图,对关系图进行特征生成处理以生成当前风险特征,输出满足指定特征效能条件的风险特征。其中,在不满足指定循环结束条件时对当前边参数进行参数调整处理,调整后的边参数被确定为下一循环中的当前边参数。上述方法的执行过程不依赖于人工经验便能得到满足指定特征效能条件的风险特征,避免了人为干预以及提高了风险特征的生成效率。并且指定特征效能条件保证了输出的风险特征能够反映出事件级数据的特征。
下面将结合附图来详细描述根据本说明书实施例的用于基于关系图生成风险特征的方法及装置。
图1示出了本说明书的实施例的用于基于关系图生成风险特征的方法的流程图。
如图1所示,在块110,获取事件级数据。
在本说明书实施例中,事件级数据(detailed event level data)是事件的详细数据记录,事件级数据所针对的事件可以是交易事件、操作事件、浏览事件以及登陆事件等。每条事件级数据可以包括事件时间、事件的主动方和被动方、事件涉及的金额、环境、设备等数据信息。其中,环境可以是事件发生的IP、地点等。
例如,一笔交易的事件级数据可以包括:该交易发生时间为2019年9月8日10点,交易的地点为北京,交易金额为10万,交易的主动方为A,被动方包括B、C和D,以及交易设备为手机。
在一个示例中,可以按照指定方式来获取事件级数据。比如,指定方式可以包括指定时间区间、指定区域或地点等。
在块120,按照构图模板和当前边参数来将事件级数据构建成关系图。
在本说明书实施例中,关系图可以表征出事件级数据所对应的事件之间的关系。构图模板用于定义关系图中的节点和边,一种构图模板可以确定事件级数据对应的一种关系图。针对相同的事件级数据,不同的构图模板可以构建出不同的关系图。构图模板可以是指定的。
每种构图模板可以包括多个边构建维度,每个边构建维度可以用来确定关系图中的一条边。例如,事件时间、事件的主动方和被动方、环境和设备等均可以作为边构建维度,以用来构建关系图的边。
在一个示例中,一种构图模板可以是以交易事件为节点,以交易设备、交易的主动方和被动方以及交易环境等边构建维度来构建边。另一种构图模板可以是以账户为节点,以两账户之间发生的交易、两账户共用的设备等边构建维度来构建边。
在本说明书实施例中,边参数可以用来从构图模板的边构建维度中确定用于构建关系图的边的边构建维度。边参数所确定出的边构建参数可以是构图模板中的所有或者部分边构建维度。比如,构图模板中的边构建维度包括:交易关系、交易设备以及交易的主动方和被动方,边参数所确定出的边构建参数为交易关系,则两账户之间存在交易关系时可以构建一条边。
在一个示例中,可以将构图模板中的边构建维度作为一个向量集,边参数为向量,该向量的维度数与构图模板中边构建维度的数量相同,向量的维度与构图模板中的边构建维度是一一对应的。边参数以向量的方式来从向量集中确定出用于构建边的边构建维度。一个示例中,向量中用0和1的方式来确定边构建维度,1对应的边构建维度表示被选取,0对应的边构建维度表示未被选取。
例如,一种构图模板以账户为节点,边构建维度包括交易关系,同设备关系和同城市关系。当边参数为(1,1,0)时,表示交易关系和同设备关系均被确定为用于构建边的边构建维度,当两账户之间存在交易关系和/或同设备关系时,将两账户表示的节点连接以作为边。同城市关系未被确定为用于构建边的边构建维度,因此,两账户之间是否同城市关系与两账户之间构建边无关。
在块130,对关系图进行特征生成处理,以生成当前风险特征。
在本说明书实施例中,所生成的当前风险特征与当前边参数是对应的,在采用不同的边参数时对应生成的风险特征可以是不同的。
在本说明书实施例的一个示例中,可以采用下述算法中的至少一种来对关系图进行特征生成处理以生成当前风险特征:社群发现算法、图结构匹配算法和深度学习算法。当然,除了上述三种算法以外,还可以采用其他算法来对关系图进行特征生成处理以生成当前风险特征。
针对社群发现算法
社群发现算法用于从关系图的关系网络中发现社群,社群是关系网络中的密集群体,每个社群内部的节点之间的连接会相对较紧密,而社群之间的连接会相对比较稀疏。
在一个示例中,首先,可以确定出关系图所包括的指定数量节点的完全子图。完全子图内部的任意两个节点都相连接。例如,图2示出了本说明书的实施例的完全子图的一个示例的示意图,如图2所示,G1为三个节点的完全子图,G2为4个节点的完全子图,G3为五个节点的完全子图。
在从关系图中确定出完全子图后,判断所确定出的各个完全子图之间是否存在共同节点,若存在共同节点则表示完全子图之间存在重合。当两个完全子图之间的共同节点数量大于指定阈值时,则可以确定该两个完全子图属于同一个社群。属于同一个社群的完全子图即可以构成一个社群。
在另一个示例中,将初始的关系图作为目标关系图,计算目标关系图中每条边的边介数,并删除边介数最大的边,可以得到删除边后的另一关系图,将该另一关系图作为下一循环中的目标关系图,并执行计算目标关系图中每条边的边介数的步骤,直至存在一个节点作为一个社群为止。在循环结束后可以得到关系网络中的社群。其中,边介数是指任意两节点之间通过该边的最短路径的数量。
使用社群发现算法从关系图中发现并得到各个社群后,针对每个社群,可以计算出该社群中的节点数、边数、密度、直径以及模块度等特征,各个社群的特征可以作为关系图的风险特征。
其中,直径(graph diameter)是社群的结构网络中一个节点到另一个节点的最远距离。模块度可以用来表征关系图被划分为社群的划分质量,其中,模块度的值越接近于1表示社群的结构强度越强,划分质量越好。密度(graph density forumla)可以根据下式计算得到:
Figure BDA0002254260800000081
其中,E表示边数,V表示节点数,D表示密度。
社群发现算法的参数可以包括共同节点数、是否存在社群重合等。社群发现算法所配置的参数不同,所发现的社群会存在差别,进而使得风险特征会不同。在一个示例中,社群发现算法的参数可以是指定的。在另一个示例中,社群发现算法的参数可以是根据所生成的风险特征的特征效能进行筛选,筛选出的参数可以是对应生成的风险特征的特征效能最佳,或者是特征效能大于指定效能阈值。用筛选出的参数来配置社群发现算法,并使用配置的社群发现算法生成当前风险特征。
针对图结构匹配算法
图结构匹配算法是在关系图中匹配是否存在特定的网络结构,或者特定的网络结构的数量。这种特定的网络结构可以构成风险特征,这种特定的网络结构的数量、频率分布等都可以构成风险特征。
在一个示例中,特定的网络结构可以包括菱形网络,菱形网络可以用来表征资金存在风险的风险特征。例如,在涉及资金流向的关系网络中,账户A给多个账户转账,而该多个账户又给账户B转账,这样账户A、该多个账户以及账户B之间的转账关系就构成了菱形网络。账户A、该多个账户以及账户B之间被认为存在洗钱、刷单等违规风险。
当关系网中存在菱形网络时,可以表示该关系网存在风险,当关系网中菱形网络越多,则表示风险越大。
在另一个示例中,特定的网络结构可以包括资金闭环网络,资金闭环网络可以是表征资金安全的风险特征。当关系网中存在资金闭环网络时,表示该关系网的资金安全性较高。
在一个示例中,特定的网络结构可以包括图元(graphlet),图元是指定数量的节点和边构成的可以穷举的较小的图结构。比如,指定数量是2个时,所构成的是2个节点的图元。在该示例中,节点的数量可以作为图结构匹配算法的参数。
图3示出了本说明书的实施例的图元的一个示例的示意图,如图3所示的四种图元分别是:2个节点的图元,3个节点的图元、4个节点的图元以及5个节点的图元。其中,2个节点的图元只有一种图结构(图2中的G0),3个节点的图元包括有两种图结构(图2中的G1和G2),4个节点的图元包括有六种图结构(图2中的G3-G8),5个节点的图元包括有21种图结构(图3中的G9-G29)。
关系图中图元的数量以及图元在关系图中的频率分布等都可以构成关系图的风险特征。
以图元的频率分布为例,对于待进行特征生成处理的关系图,首先确定图元的大小(即图元的节点数),并在关系图中对所确定的图元进行采样,采样的方式可以是随机节点采样(Random vertex sampling)和随机游走采样(Random walk sampling)。
当所确定的图元的大小为k个节点时,随机节点采样是在关系图中随机选取k个节点,并用关系图中的边连接,当该k个节点可以连通时则可以作为k个节点的图元。随机游走采样是在关系图中按照游走策略确定k个节点的图元。
在采样图元后,统计每种图元的数量,并按照下式来计算每种图元的在关系图中的出现频率:
Figure BDA0002254260800000091
其中,i表示第i种图元,n表示所样的图元的种类,wi表示第i种图元在关系图中的数量,pi表示第i种图元的出现频率。
各种图元的出现频率构成了关系图的图元频率分布。图元频率分布可以作为关系图的风险特征,可以通过图元频率分布来比较关系图之间的相似度。例如,已知关系图A的关系网络存在资金风险,若确定关系图B的图元频率分布与关系图A相似,则可以确定该关系图B的关系网络也存在资金风险。
针对深度学习算法
深度学习算法可以包括Node2vec,Struc2vec,LINE(large-scale informationnetwork embedding)以及SDNE(Structural Deep Network Embedding)等。
以Node2vec为例,首先,在关系图的网络结构中通过游走方式来获得节点序列。关系图中每条边对应有权重和权重调整参数,权重调整参数可以影响游走方向。Node2vec中可以采用BFS(Breadth First Search,宽度优先搜索)和DFS(Depth-First-Search,深度优先搜索)两种游走策略,两种游走策略均基于权重调整参数。
按照上述游走策略在关系图中进行游走,可以得到由节点组成的节点序列,所得到的节点序列可以反映出关系图的网络结构特点。然后,将节点序列作为训练样本,可以训练带有隐藏层的神经网络,该隐藏层可以认为是一个权重矩阵,基于训练出的隐藏层可以输出各个节点的特征向量,由各个节点的特征向量可以构成用于表征关系图的向量矩阵。
基于深度学习算法所得到的向量矩阵可以表征关系图并反映出关系图的结构特征,可以将向量矩阵作为关系图的风险特征。
深度学习算法的参数可以包括学习率和深度学习层数等,深度学习算法的参数可以影响生成的向量矩阵,进一步地影响关系图的风险特征。在一个示例中,深度学习算法的参数可以是指定的。在另一个示例中,深度学习算法的参数可以是根据所生成的风险特征的特征效能进行筛选,筛选出的参数可以是对应生成的风险特征的特征效能最佳,或者是特征效能大于指定效能阈值。用筛选出的参数来配置深度学习算法,并使用配置的深度学习算法来生成当前风险特征。
在块140,输出所生成的当前风险特征中的满足指定特征效能条件的风险特征。
在本说明书实施例中,所输出的风险特征可以作为训练样本以用来训练风控模型,或者用于风控规则。输出的风险特征需满足指定特征效能条件,使得输出的风险特征更能反映出关系图的特征,提高了输出的风险特征的对于关系图的准确性和覆盖性。
在一个示例中,指定特征效能条件可以包括:风险特征对应的特征信息量大于指定阈值。
在该示例中,特征信息量(以下称为IV(Information Value)值)可以用来衡量风险特征作为自变量的预测能力。IV值越大,则表示该风险特征作为自变量的预测能力越强。可以将IV值大的风险特征确定为训练样本以用来训练风控模型,或者用于风控规则,进而可以提高风控模型或者风控规则的风险预测能力。
风险特征的IV值的计算过程如下:首先,可以将风险特征进行分组处理,得到多个组别,该多个组别即构成了该风险特征。例如,风险特征是是否是违约客户,则将该风险特征进行分组处理后的两个组别包括:是违约客户和不是违约客户。
然后,针对每个组别,按照以下公式可以得到该组别的WOE(Weight ofEvidence):
Figure BDA0002254260800000111
其中,WOEi表示第i组别的WOE,pyi表示第i组别中响应客户占样本中所有响应客户的比例,yi表示第i组别中响应客户的数量,yT表示样本中所有响应客户的数量,pni表示第i组别中未响应客户占样本中所有未响应客户的比例,ni表示第i组别中未响应客户的数量,nT表示样本中所有未响应客户的数量。其中,响应客户可以理解为预测模型中预测变量取值为“是”或者1的个体。
在计算出各个组别的WOE后,按照以下公式可以得到各个组别的IV值:
IVi=(pyi-pni)×WOEi
其中,IVi表示第i组别的IV值。
最后将各个组别的IV值相加所得到的和即为风险特征的IV值。
在一个示例中,指定特征效能条件包括:风险特征对应的风控模型的模型性能增益大于增益阈值。
在该示例中,风控模型的性能可以用AUC(area under the curve)、召回率、准确率以及F1度量等来度量。模型性能增益是指模型性能的增加程度,比如,模型的性能用AUC来度量时,模型性能增益是AUC的增加值。
风险特征对应的风控模型是使用包含有该风险特征的训练样本(以下称为第一训练样本)来训练得到的风控模型。
风控模型的模型性能增益的比较对象是风险特征对应的风控模型与不使用该风险特征训练得到的风控模型,其中,对于不使用该风险特征训练得到的风控模型,所使用的训练样本(以下称为第二训练样本)中不包含风险特征,第一训练样本和第二训练样本的区别仅在于是否包含有风险特征。
当风险特征对应的风控模型比不使用该风险特征训练得到的风控模型的性能强,且模型性能增益大于增益阈值时,则表示该风险特征满足指定特征效能条件。
在另一个示例中,指定特征效能条件可以包括:风险特征对应的特征信息量大于指定阈值,以及风险特征对应的风控模型的模型评估增益大于评估阈值。
在块150,判断是否满足指定循环结束条件。如果是,则循环结束。如果否,则流程进行到块160。
在循环结束后,可以将输出的所有风险特征确定为训练样本,以用来训练风控模型。在一个示例中,还可以将输出的所有风险特征形成风控规则。
在一个示例中,指定循环结束条件可以包括达到指定循环次数,当达到该指定循环次数时,循环结束,否则流程进行到块160。
在一个示例中,指定循环结束条件可以包括输出的风险特征的总数量达到指定数量阈值。其中,输出的风险特征的总数量为每次循环输出的风险特征的和。例如,在执行第三次循环过程时,输出300个风险特征,第一次循环过程输出250个风险特征,第二次循环过程输出280个风险特征,则当前第三次循环过程对应的输出风险特征的总数量为850。
在该示例中,指定数量阈值的风险特征足够用来作为训练样本来训练风控模型。
在块160,对当前边参数进行参数调整处理,调整后的边参数被确定为下一循环中的当前边参数。
在块160后,流程返回至块120,直至满足指定循环结束条件。
在本说明书实施例中,针对当前边参数进行参数调整处理时,调整后的边参数与当前边参数不相同。在一个示例中,参数调整处理的方式可以包括:对边参数中的指定数量的维度进行调整。例如,指定数量是1,则每次仅对边参数中的一个维度进行调整。
在一个示例中,参数调整处理的方式可以包括遗传算法。进一步地,在一个示例中,参数调整处理的方式可以包括遗传算法中的变异算法。可以使用变异算法将边参数中的一个或多个维度进行变异处理,其中,进行变异处理的维度可以是随机确定的。
例如,构图模板的边构建维度包括交易关系,同设备关系和同城市关系,当前边参数为(1,1,0),使用变异算法将第三个维度进行变异处理,即将第三个维度的0变异成1,变异处理后的边参数为(1,1,1),则该变异处理后的边参数表示交易关系、同设备关系以及同城市关系均被选取作为构建边的边构建维度。
在另一个示例中,参数调整处理的方式可以包括遗传算法中的交叉算法。具体地,可以使用交叉算法将边参数中的两个维度进行交叉处理,为了使得调整后的边参数与当前边参数不相同,进行交叉处理的两个维度对应的值不相同。
例如,构图模板的边构建维度包括交易关系,同设备关系和同城市关系,当前边参数为(1,1,0),使用交叉算法将第二个维度和第三个维度进行交叉处理,交叉处理后的边参数为(1,0,1),则该交叉处理后的边参数表示交易关系和同城市关系均被选取作为构建边的边构建维度。
在本说明书实施例的一个示例中,参数调整处理的对象可以包括当前边参数以及特征生成处理的算法的当前参数,特征生成处理的算法的当前参数可以包括社群发现算法的参数、图结构匹配算法的参数以及深度学习算法的参数。
在该示例中,在不满足指定循环结束条件时,可以对当前边参数和算法的当前参数进行参数调整处理,并将调整后的边参数和算法的参数确定为下一循环中的当前边参数和算法的当前参数。在该示例中,调整的对象可以是当前边参数以及算法的当前参数中的至少一个。
图4示出了本说明书的另一实施例的用于基于关系图生成风险特征的方法的流程图。图4中所示的实施例是上述图1示出的实施例的修改实施例。
在图4中示出的实施例中,块210、块220、块260、块270、块280以及块290的操作分别与图1中的块110、块120、块130、块140、块150以及块160相同,在此不再描述。下面仅仅对不同之处进行详细描述。
在块230,判断所构建的关系图是否小于指定尺寸。如果是,则流程进行到块260;如果否,则流程进行到块240。
在一个示例中,关系图的尺寸可以用节点数量来衡量。比如,包括10个节点的关系图的尺寸大于包括6个节点的关系图的尺寸。
在块240,基于预定关系图拆分策略对关系图进行拆分,以得到小于指定尺寸的子关系图。
在本说明书的实施例中,预定关系图拆分策略可以使得进行拆分时尽可能少的破坏关系图的图信息。预定关系图拆分策略可以是拆分维度,拆分维度包括地理位置、空间、时间以及渠道等。例如,预定关系图拆分策略是省份作为拆分维度,则将关系图按照省份进行拆分,拆分得到子关系图包括针对浙江省的子关系图、针对江苏省的子关系图以及针对广东省的子关系图等。
对于同一关系图,按照不同的拆分维度进行拆分,所得到的子关系图会有所不同,该关系图的图信息的破坏程度会不同。例如,关系图是关于线下商户的,当针对商户的营销作弊问题时,基于线下商户较少出现跨省的情况,因此将省份作为拆分维度,可以较少的破坏关系图的图信息。
在本说明书实施例的一个示例中,预定关系图拆分策略使得关系图被拆分导致的图信息损失量小于损失阈值。图信息损失量可以用风险特征对应的风控模型的AUC来衡量。通过该示例,使用预定关系图拆分策略减少图信息的损失,进而使得基于关系图生成的风险特征准确性更高。
在一个示例中,可以计算出由关系图直接生成的风险特征对应的风控模型的AUC,然后,在关系图被拆分成多个子关系图后计算该多个子关系图生成的风险特征所对应的风控模型的AUC,将两个AUC的差值确定为图信息损失量。
在一个示例中,预定关系图拆分策略的拆分维度可以是指定的。在另一个示例中,基于预定关系图拆分策略的拆分维度对关系图进行拆分,可以计算出该预定关系图拆分策略对应的图信息损失量。在经过多种预定关系图拆分策略分别对关系图进行拆分后,每种预定关系图拆分策略对应有一个图信息损失量。可以将图信息损失量最小的预定关系图拆分策略确定为最终的拆分策略。并使用最终的拆分策略对关系图进行拆分,以得到小于指定尺寸的子关系图。
在块250,分别对各个子关系图进行特征生成处理,以生成当前风险特征。
每个子关系图可以对应生成一种或多种风险特征,当前风险特征包括各个子关系图对应生成的风险特征。
通过上述实施例,将尺寸较大的关系图拆分成尺寸较小的子关系图,后续对小尺寸的子关系图进行处理时可以提高处理速度。尤其是在实时计算过程中,可以对各个子关系图进行并行处理,进一步地提高特征生成效率。
在本说明书实施例的一个示例中,参数调整处理的对象可以包括当前边参数、特征生成处理的算法的当前参数以及当前拆分参数。当前拆分参数包括当前的预定关系图拆分策略。
在该示例中,在不满足指定循环结束条件时,可以对当前边参数、算法的当前参数以及当前拆分参数进行参数调整处理,并将调整后的边参数、算法的参数以及拆分参数确定为下一循环中的当前边参数、算法的当前参数以及当前拆分参数。在该示例中,调整的对象可以仅是当前边参数、算法的当前参数以及当前拆分参数中的至少一个。
图5示出了本说明书的实施例的用于基于关系图生成风险特征的装置(以下称为风险特征生成装置500)的方框图。如图5所示,风险特征生成装置500包括数据获取单元510,关系图构建单元520,特征生成单元530,特征输出单元540以及参数调整单元550。
数据获取单元510获取事件级数据。
关系图构建单元520按照构图模板和当前边参数来将事件级数据构建成关系图。
特征生成单元530对关系图进行特征生成处理,以生成当前风险特征。在一个示例中,特征生成单元:采用下述算法中的至少一种来对关系图进行特征生成处理以生成当前风险特征:社群发现算法;图结构匹配算法;和深度学习算法。
特征输出单元540输出所生成的当前风险特征中的满足指定特征效能条件的风险特征。在一个示例中,指定特征效能条件包括:风险特征对应的特征信息量大于指定阈值。在另一个示例中,指定特征效能条件包括:风险特征对应的风控模型的模型性能增益大于增益阈值。
参数调整单元550在满足指定循环结束条件时,对当前边参数进行参数调整处理,调整后的边参数被确定为下一循环中的当前边参数,并触发关系图构建单元。在一个示例中,参数调整单元550可以包括判断模块,该判断模块用于判断是否满足指定循环结束条件。
图6示出了本说明书的另一实施例的用于基于关系图生成风险特征的装置的方框图。图6中所示的实施例是上述图5示出的实施例的修改实施例。
如图6所示,风险特征生成装置500还可以包括关系图拆分单元560。关系图拆分单元560当所构建的关系图不小于指定尺寸时,基于预定关系图拆分策略对该关系图进行拆分,以得到小于指定尺寸的子关系图。在一个示例中,关系图拆分单元560可以包括判断模块,该判断模块用于判断所构建的关系图是否小于指定尺寸。
以上参照图1到图6,对根据本说明书实施例的用于基于关系图生成风险特征的方法及装置的实施例进行了描述。
本说明书实施例的用于基于关系图生成风险特征的装置可以采用硬件实现,也可以采用软件或者硬件和软件的组合来实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在设备的处理器将存储器中对应的计算机程序指令读取到内存中运行形成的。在本说明书实施例中,用于基于关系图生成风险特征的装置例如可以利用电子设备实现。
图7示出了本说明书的实施例的用于基于关系图生成风险特征的方法的电子设备700的方框图。
如图7所示,电子设备700可以包括至少一个处理器710、存储器(例如,非易失性存储器)720、内存730和通信接口740,并且至少一个处理器710、存储器720、内存730和通信接口740经由总线750连接在一起。至少一个处理器710执行在存储器中存储或编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。
在一个实施例中,在存储器中存储计算机可执行指令,其当执行时使得至少一个处理器710:获取事件级数据,对事件级数据执行下述循环过程,直到满足指定循环结束条件:按照构图模板和当前边参数来将事件级数据构建成关系图,对关系图进行特征生成处理,以生成当前风险特征,输出所生成的当前风险特征中的满足指定特征效能条件的风险特征,其中,在不满足指定循环结束条件时,对当前边参数进行参数调整处理,调整后的边参数被确定为下一循环中的当前边参数。
应该理解,在存储器中存储的计算机可执行指令当执行时使得至少一个处理器710进行本说明书的各个实施例中以上结合图1-6描述的各种操作和功能。
根据一个实施例,提供了一种例如机器可读介质的程序产品。机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本说明书的各个实施例中以上结合图1-6描述的各种操作和功能。
具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
在这种情况下,从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此机器可读代码和存储机器可读代码的可读存储介质构成了本发明的一部分。
可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上或云上下载程序代码。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
上述各流程和各系统结构图中不是所有的步骤和单元都是必须的,可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的,可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构,也可以是逻辑结构,即,有些单元可能由同一物理实体实现,或者,有些单元可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。
以上结合附图详细描述了本说明书的实施例的可选实施方式,但是,本说明书的实施例并不限于上述实施方式中的具体细节,在本说明书的实施例的技术构思范围内,可以对本说明书的实施例的技术方案进行多种简单变型,这些简单变型均属于本说明书的实施例的保护范围。
本说明书内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本说明书内容。对于本领域普通技术人员来说,对本说明书内容进行的各种修改是显而易见的,并且,也可以在不脱离本说明书内容的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。因此,本说明书内容并不限于本文所描述的示例和设计,而是与符合本文公开的原理和新颖性特征的最广范围相一致。

Claims (15)

1.一种用于基于关系图生成风险特征的方法,包括:
获取事件级数据;
对所述事件级数据执行下述循环过程,直到满足指定循环结束条件:
按照构图模板和当前边参数来将所述事件级数据构建成关系图;
对所述关系图进行特征生成处理,以生成当前风险特征;
输出所生成的当前风险特征中的满足指定特征效能条件的风险特征,
其中,在不满足所述指定循环结束条件时,对所述当前边参数进行参数调整处理,所述调整后的边参数被确定为下一循环中的当前边参数。
2.如权利要求1所述的方法,还包括:
当所构建的关系图不小于指定尺寸时,基于预定关系图拆分策略对该关系图进行拆分,以得到小于所述指定尺寸的子关系图;以及
对所述关系图进行特征生成处理,以生成当前风险特征包括:
分别对各个子关系图进行特征生成处理,以生成当前风险特征。
3.如权利要求2所述的方法,其中,所述预定关系图拆分策略使得所述关系图被拆分导致的图信息损失量小于损失阈值。
4.如权利要求1所述的方法,其中,对所述关系图进行特征生成处理以生成当前风险特征包括:
采用下述算法中的至少一种来对所述关系图进行特征生成处理以生成当前风险特征:
社群发现算法;
图结构匹配算法;和
深度学习算法。
5.如权利要求1所述的方法,其中,所述指定特征效能条件包括:风险特征对应的特征信息量大于指定阈值。
6.如权利要求1所述的方法,其中,所述指定特征效能条件包括:风险特征对应的风控模型的模型性能增益大于增益阈值。
7.如权利要求1所述的方法,其中,参数调整处理的方式包括遗传算法。
8.如权利要求1所述的方法,其中,所输出的风险特征用于训练风控模型。
9.一种用于基于关系图生成风险特征的装置,包括:
数据获取单元,获取事件级数据;
关系图构建单元,按照构图模板和当前边参数来将所述事件级数据构建成关系图;
特征生成单元,对所述关系图进行特征生成处理,以生成当前风险特征;
特征输出单元,输出所生成的当前风险特征中的满足指定特征效能条件的风险特征;以及
参数调整单元,在满足指定循环结束条件时,对所述当前边参数进行参数调整处理,所述调整后的边参数被确定为下一循环中的当前边参数,并触发所述关系图构建单元。
10.如权利要求9所述的装置,还包括:
关系图拆分单元,当所构建的关系图不小于指定尺寸时,基于预定关系图拆分策略对该关系图进行拆分,以得到小于所述指定尺寸的子关系图;以及
所述特征生成单元:
分别对各个子关系图进行特征生成处理,以生成当前风险特征。
11.如权利要求9所述的装置,其中,所述特征生成单元:
采用下述算法中的至少一种来对所述关系图进行特征生成处理以生成当前风险特征:
社群发现算法;
图结构匹配算法;和
深度学习算法。
12.如权利要求9所述的装置,其中,所述指定特征效能条件包括:风险特征对应的特征信息量大于指定阈值。
13.如权利要求9所述的装置,其中,所述指定特征效能条件包括:风险特征对应的风控模型的模型性能增益大于增益阈值。
14.一种电子设备,包括:
至少一个处理器,以及
与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如权利要求1到8中任一所述的方法。
15.一种机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如权利要求1到8中任一所述的方法。
CN201911046463.0A 2019-10-30 2019-10-30 用于基于关系图生成风险特征的方法及装置 Active CN110851541B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911046463.0A CN110851541B (zh) 2019-10-30 2019-10-30 用于基于关系图生成风险特征的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911046463.0A CN110851541B (zh) 2019-10-30 2019-10-30 用于基于关系图生成风险特征的方法及装置

Publications (2)

Publication Number Publication Date
CN110851541A true CN110851541A (zh) 2020-02-28
CN110851541B CN110851541B (zh) 2022-09-27

Family

ID=69599402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911046463.0A Active CN110851541B (zh) 2019-10-30 2019-10-30 用于基于关系图生成风险特征的方法及装置

Country Status (1)

Country Link
CN (1) CN110851541B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115018280A (zh) * 2022-05-24 2022-09-06 支付宝(杭州)信息技术有限公司 风险图模式的挖掘方法、风险识别方法及对应装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679985A (zh) * 2017-09-12 2018-02-09 阿里巴巴集团控股有限公司 风险特征筛选、描述报文生成方法、装置以及电子设备
CN108511078A (zh) * 2018-03-30 2018-09-07 大连理工大学 基于社区发现的医疗团队组成方法
CN109003089A (zh) * 2018-06-28 2018-12-14 中国工商银行股份有限公司 风险识别方法及装置
CN109063966A (zh) * 2018-07-03 2018-12-21 阿里巴巴集团控股有限公司 风险账户的识别方法和装置
CN109102393A (zh) * 2018-08-15 2018-12-28 阿里巴巴集团控股有限公司 训练和使用关系网络嵌入模型的方法及装置
CN109615167A (zh) * 2018-11-06 2019-04-12 阿里巴巴集团控股有限公司 确定疑似批量风险交易事件的方法、装置和电子设备
CN109635953A (zh) * 2018-11-06 2019-04-16 阿里巴巴集团控股有限公司 一种特征衍生方法、装置及电子设备
CN109685355A (zh) * 2018-12-19 2019-04-26 重庆百行智能数据科技研究院有限公司 企业风险识别方法、装置和计算机可读存储介质
CN109829375A (zh) * 2018-12-27 2019-05-31 深圳云天励飞技术有限公司 一种机器学习方法、装置、设备及系统
CN109919316A (zh) * 2019-03-04 2019-06-21 腾讯科技(深圳)有限公司 获取网络表示学习向量的方法、装置和设备及存储介质
CN109949046A (zh) * 2018-11-02 2019-06-28 阿里巴巴集团控股有限公司 风险团伙的识别方法和装置
US10438001B1 (en) * 2018-12-31 2019-10-08 Arceo Labs Inc. Identification, prediction, and assessment of cyber security risk

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679985A (zh) * 2017-09-12 2018-02-09 阿里巴巴集团控股有限公司 风险特征筛选、描述报文生成方法、装置以及电子设备
CN108511078A (zh) * 2018-03-30 2018-09-07 大连理工大学 基于社区发现的医疗团队组成方法
CN109003089A (zh) * 2018-06-28 2018-12-14 中国工商银行股份有限公司 风险识别方法及装置
CN109063966A (zh) * 2018-07-03 2018-12-21 阿里巴巴集团控股有限公司 风险账户的识别方法和装置
CN109102393A (zh) * 2018-08-15 2018-12-28 阿里巴巴集团控股有限公司 训练和使用关系网络嵌入模型的方法及装置
CN109949046A (zh) * 2018-11-02 2019-06-28 阿里巴巴集团控股有限公司 风险团伙的识别方法和装置
CN109615167A (zh) * 2018-11-06 2019-04-12 阿里巴巴集团控股有限公司 确定疑似批量风险交易事件的方法、装置和电子设备
CN109635953A (zh) * 2018-11-06 2019-04-16 阿里巴巴集团控股有限公司 一种特征衍生方法、装置及电子设备
CN109685355A (zh) * 2018-12-19 2019-04-26 重庆百行智能数据科技研究院有限公司 企业风险识别方法、装置和计算机可读存储介质
CN109829375A (zh) * 2018-12-27 2019-05-31 深圳云天励飞技术有限公司 一种机器学习方法、装置、设备及系统
US10438001B1 (en) * 2018-12-31 2019-10-08 Arceo Labs Inc. Identification, prediction, and assessment of cyber security risk
CN109919316A (zh) * 2019-03-04 2019-06-21 腾讯科技(深圳)有限公司 获取网络表示学习向量的方法、装置和设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NAEIMEH LALEH: "Graph Based Local Risk Estimation in Large Scale Online Social Networks", 《2015 IEEE INTERNATIONAL CONFERENCE ON SMART CITY/SOCIALCOM/SUSTAINCOM (SMARTCITY)》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115018280A (zh) * 2022-05-24 2022-09-06 支付宝(杭州)信息技术有限公司 风险图模式的挖掘方法、风险识别方法及对应装置

Also Published As

Publication number Publication date
CN110851541B (zh) 2022-09-27

Similar Documents

Publication Publication Date Title
Chamberlain et al. Grand: Graph neural diffusion
Huang et al. Resilient routing mechanism for wireless sensor networks with deep learning link reliability prediction
Zhao et al. A machine learning based trust evaluation framework for online social networks
CN113255895B (zh) 基于图神经网络表示学习的结构图对齐方法和多图联合数据挖掘方法
CN111325619A (zh) 一种基于联合学习的信用卡欺诈检测模型更新方法及装置
Alghayadh et al. A hybrid intrusion detection system for smart home security
Hu et al. Deterministic ripple-spreading model for complex networks
CN103400299A (zh) 基于重叠点识别的网络重叠社团检测方法
Shojafar et al. Automatic clustering of attacks in intrusion detection systems
CN111222583B (zh) 一种基于对抗训练与关键路径提取的图像隐写分析方法
Puri et al. Application of ensemble Machine Learning models for phishing detection on web networks
CN110851541B (zh) 用于基于关系图生成风险特征的方法及装置
CN114205816A (zh) 一种电力移动物联网信息安全架构及其使用方法
Chen et al. Deep belief network-based fake task mitigation for mobile crowdsensing under data scarcity
CN110889493A (zh) 针对关系网络添加扰动的方法及装置
Malmir et al. Optimization of data mining with evolutionary algorithms for cloud computing application
CN116881916A (zh) 基于异质图神经网络的恶意用户检测方法及装置
Pu et al. Detection mechanism of FDI attack feature based on deep learning
CN114662705A (zh) 联邦学习方法、装置、电子设备和计算机可读存储介质
CN116451050A (zh) 异常行为识别模型训练、异常行为识别方法和装置
CN114519605A (zh) 广告点击欺诈检测方法、系统、服务器和存储介质
JP7230324B2 (ja) ニューラルネットワークの学習方法、コンピュータプログラム及びコンピュータ装置
Bhat et al. A density-based approach for mining overlapping communities from social network interactions
CN112597699A (zh) 一种融入客观赋权法的社交网络谣言源识别方法
Gopal et al. Modeling Traffic Congestion using Graph Convolutional Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant