CN117350461A - 企业异常行为预警方法、系统、计算机设备及存储介质 - Google Patents
企业异常行为预警方法、系统、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN117350461A CN117350461A CN202311653532.0A CN202311653532A CN117350461A CN 117350461 A CN117350461 A CN 117350461A CN 202311653532 A CN202311653532 A CN 202311653532A CN 117350461 A CN117350461 A CN 117350461A
- Authority
- CN
- China
- Prior art keywords
- path
- nodes
- heterogeneous
- neighborhood
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010000117 Abnormal behaviour Diseases 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 title claims abstract description 57
- 239000013598 vector Substances 0.000 claims abstract description 161
- 230000002776 aggregation Effects 0.000 claims abstract description 71
- 238000004220 aggregation Methods 0.000 claims abstract description 71
- 238000005070 sampling Methods 0.000 claims abstract description 25
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000004364 calculation method Methods 0.000 claims abstract description 12
- 230000004931 aggregating effect Effects 0.000 claims abstract description 9
- 238000013528 artificial neural network Methods 0.000 claims description 32
- 238000005295 random walk Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 238000010845 search algorithm Methods 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 abstract description 10
- 230000006399 behavior Effects 0.000 description 7
- 210000002569 neuron Anatomy 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Accounting & Taxation (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Technology Law (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请属于数据处理技术领域,涉及企业异常行为预警方法、系统、计算机设备及存储介质,所述方法包括:获取包括若干参与对象的多维数据的数据集,根据所述多维数据生成参与对象关系表构建有向图;在所述有向图中形成多个k‑hop路径,将其分为同质子图和异质子图并分别进行邻域分布采样,得到同质邻域路径和异质邻域路径并对其中的节点的有序属性进行聚合,生成路径嵌入向量后经过多次迭代聚合后得到各节点的聚合特征向量,根据聚合特征向量进行相似度计算,当相似度满足预设条件时进行预警。本申请方案用于异常行为评估预警的聚合特征向量包含了同质信息和异质信息,能够更为准确地反应节点与邻域节点以及边的关系,评估预警准确度更高。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及企业异常行为预警方法、系统、计算机设备及存储介质。
背景技术
非法集资对于企业而言属于异常经营行为,在识别非法集资过程中,通常需要综合考虑不同类型的人或组织之间的交互关系,例如投资者、筹资者、项目、资金流动等,由于涉及人员多,涉及资金面广,在进行非法集资行为评估识别时面临数据分析量大、数据类型多的问题,导致分析效率低下,拉长非法集资行为打击周期,同时由于数据具有不同的属性特征,现有采用评估指标进行评估识别的方式容易忽略其中一些特征,以致难以有效进行评估识别,准确性低。
发明内容
本申请实施例的目的在于提出一种企业异常行为预警方法、系统、计算机设备及存储介质,以解决现有技术中由于数据量大、数据类型多、评估指标能力有限导致无法有效识别企业异常行为的问题。
为了解决上述技术问题,本申请实施例提供一种企业异常行为预警方法,所述方法包括:
从不同数据源获取若干数据集,所述数据集包括若干参与对象的多维数据,所述多维数据包括参与对象本身基础数据以及参与对象之间的关联数据;
根据所述多维数据生成参与对象关系表,并对所述参与对象关系表中的条目进行筛选后构建有向图,所述有向图具有多个节点,每个节点对应一个所述参与对象,且每个节点和节点之间的有向边具有初始属性;
在所述有向图中采用随机游走方式任意选择起始点形成多个k-hop路径,所述k-hop路径保留各节点的初始属性以及节点之间的原始结构连接,判断所述k-hop路径中的节点的初始属性是否相同、以及有向边的初始属性是否相同,若均相同则所述k-hop路径构成同质子图,若至少一个不同则所述k-hop路径构成异质子图;
对所述同质子图和所述异质子图采用不同的方式分别进行邻域分布采样,得到同质邻域路径和异质邻域路径,通过预设的图神经网络的路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的有序属性进行聚合,生成路径嵌入向量,即为节点的状态向量,将各节点的状态向量经过多次迭代聚合后得到各节点的聚合特征向量;
当所述有向图中任意节点对应的参与对象具有异常行为时,将其余参与对象的聚合特征向量与具有异常行为的参与对象的聚合特征向量进行相似度计算,当相似度满足预设条件时进行预警。
进一步地,在将各节点的状态向量经过多次迭代的过程中,所述方法还包括:
定义参考路径嵌入向量,将生成的所述路径嵌入向量作为迭代聚合输入,计算所述参考路径嵌入向量和所述路径嵌入向量的能量分数,所述能量分数表示所述参考路径嵌入向量和所述路径嵌入向量的关联性大小;
对所述能量分数进行归一化处理得到注意力权重,使用所述注意力权重对迭代聚合输入进行加权求和得到聚合关联性的新的路径嵌入向量,基于新的路径嵌入向量反复迭代直到得到各节点的聚合特征向量。
进一步地,所述通过预设的图神经网络的路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的有序属性进行聚合,生成路径嵌入向量的步骤包括:
提供第一图神经网络路径聚合器和第二图神经网络路径聚合器;
通过所述第一图神经网络路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的前向顺序的其它节点进行聚合,得到前向聚合结果;
通过所述第二图神经网络路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的后向顺序的其它节点进行聚合,得到后向聚合结果;
合并所述前向聚合结果和所述后向聚合结果,得到所述路径嵌入向量。
进一步地,所述对所述同质子图和所述异质子图采用不同的方式分别进行邻域分布采样包括:
通过广度优先搜索算法遍历所述同质子图,基于给到的起始节点按照广度优先的方式依次访问与当前节点相邻的节点,得到同质邻域分布,同时通过随机游走生成器对同质邻域分布进行采样,得到所述同质子图中节点的样本数据,该样本数据即为所述同质邻域路径;
通过深度优先搜索算法遍历所述异质子图,基于给定的起始节点单向访问路径节点,并在无法继续访问时回溯至上一节点以访问其它路径,得到异质邻域分布,通过生成器对异质邻域分布进行采样,得到所述异质子图中节点的样本数据,该样本数据即为所述异质邻域路径。
进一步地,在所述得到各节点的聚合特征向量的步骤后,所述方法还包括:
获取更新数据集,判断所述更新数据集中是否包含存在异常行为的参与对象,若是则判断所述有向图中是否包含所述存在异常行为的参与对象,若包含则基于所述更新数据集中其余参与对象的数据更新所述同质子图和所述异质子图,以更新原始的所述有向图中各节点的聚合特征向量,并生成所述更新数据集中其余参与对象的聚合特征向量;
当所述更新数据中未包含存在异常行为的参与对象,或者所述更新数据集中包含存在异常行为的参与对象但其未包含在所述有向图中时,基于所述更新数据集中的全部参与对象更新所述同质子图和所述异质子图,以更新原始的所述有向图中各节点的聚合特征向量,并生成所述更新数据集中全部参与对象的聚合特征向量。
进一步地,在所述在所述有向图中采用随机游走方式任意选择起始点形成多个k-hop路径的步骤之后,所述方法还包括:
判断所述同质子图和所述异质子图的数量的比例是否满足预设条件,若不满足则对所述k-hop路径的k值进行调整,直到所述同质子图和所述异质子图的数量的比例满足预设条件。
进一步地,所述将其余参与对象的聚合特征向量与具有异常行为的参与对象的聚合特征向量进行相似度计算时,具体采用余弦相似度进行计算。
为了解决上述技术问题,本申请实施例还提供一种企业异常行为预警系统,包括:
数据获取模块,用于从不同数据源获取若干数据集,所述数据集包括若干参与对象的多维数据,所述多维数据包括参与对象本身基础数据以及参与对象之间的关联数据;
有向图构建模块,用于根据所述多维数据生成参与对象关系表,并对所述参与对象关系表中的条目进行筛选后构建有向图,所述有向图具有多个节点,每个节点对应一个所述参与对象,且每个节点和节点之间的有向边具有初始属性;
子图生成模块,用于在所述有向图中采用随机游走方式任意选择起始点形成多个k-hop路径,所述k-hop路径保留各节点的初始属性以及节点之间的原始结构连接,判断所述k-hop路径中的节点的初始属性是否相同、以及有向边的初始属性是否相同,若均相同则所述k-hop路径构成同质子图,若至少一个不同则所述k-hop路径构成异质子图;
向量生成模块,用于对所述同质子图和所述异质子图采用不同的方式分别进行邻域分布采样,得到同质邻域路径和异质邻域路径,通过预设的图神经网络的路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的有序属性进行聚合,生成路径嵌入向量,即为节点的状态向量,将各节点的状态向量经过多次迭代聚合后得到各节点的聚合特征向量;
预警模块,用于当所述有向图中任意节点对应的参与对象具有异常行为时,将其余参与对象的聚合特征向量与具有异常行为的参与对象的聚合特征向量进行相似度计算,当相似度满足预设条件时进行预警。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如上所述的企业异常行为预警方法。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的企业异常行为预警方法。
与现有技术相比,本申请主要有以下有益效果:
本申请通过构建有向图来获取同质子图和异质子图,并采用不同的方式分别进行邻域分布采样,得到同质邻域路径和异质邻域路径,通过预设的图神经网络的路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的有序属性进行聚合,生成路径嵌入向量,经过多次迭代聚合后得到各节点的聚合特征向量,通过各节点之间聚合特征向量的相似度来进行预警,其中的聚合特征向量包含了同质信息和异质信息,能够更为准确地反应节点与邻域节点以及边的关系,有效利用节点和边的不同属性特征,通过聚合特征向量进行异常行为评估预警时,准确度更高。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的企业异常行为预警方法的一个实施例的流程图;
图3是根据本申请实施例生成的有向图的一种示例;
图4是根据本申请实施例生成的异质子图的一种示例;
图5是根据本申请实施例生成的同质子图的一种示例;
图6是根据本申请的企业异常行为预警系统的一个实施例的结构示意图;
图7是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如下文中的提供服务端视图数据的服务器。
需要说明的是,本申请实施例所提供的企业异常行为预警方法一般由服务器105执行,相应地,企业异常行为预警系统一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的企业异常行为预警方法的一个实施例的流程图。所述的企业异常行为预警方法包括以下步骤S201至S205:
步骤S201,从不同数据源获取若干数据集,所述数据集包括若干参与对象的多维数据,所述多维数据包括参与对象本身基础数据以及参与对象之间的关联数据。
在本实施例中,可以通过指定区域来获取特定范围内的数据集,所述指定区域是指参与对象所在的行政区域或者地理区域,出于对小范围内的非法集资行为的灵活监控,可以通过获取不同设定区域的参与对象的数据集进行采集。其中,参与对象可以是企业、个体户或者自然人,也即金融活动中的主体,其中,对于参与对象的关联数据包括,这些关系可体现出不同参与对象之间的从属关系,而交易数据包括银行资金交易流水,可直观反应不同参与对象之间的资金流向。
具体地对于数据集的数据来源,可以来自金融数据、互联网数据、公共记录数据、调查数据、第三方数据等,这些数据来源的数据涉及多个维度,能够多角度反映参与对象本身的属性(基础数据)和与其他参与对象的关系(关联数据),其中金融数据包括银行、证券、保险等金融机构的交易数据,可以反映投资者的资金流向和交易行为,用于监测异常交易和可疑资金流动;互联网数据包括社交媒体、论坛、博客等网络平台上的信息,可以反映公众对参与对象的非法集资的关注度和舆论情况;公共记录数据包括权威单位记录的数据,可以反映参与对象的信用状况,参与对象之间的投资关系、股权关系、雇佣关系等;调查数据包括监管部门等对非法集资案件的调查数据,可以反映涉及非法集资等异常行为的参与对象,将其作为对其它参与对象的异常行为评估的标准;第三方数据包括信用评级机构、商业智能公司等提供的数据,可以反映投资者的信用状况和商业行为,用于评估投资者的风险水平和可疑行为。
在获取到上述数据来源的数据后,需对其中的数据进行清洗和验证,将反映参与对象自身属性和反映参与对象与其他参与对象的关系的数据进行甄别,确保数据的准确性,形成最终用于异常行为预警的数据集。
步骤S202,根据所述多维数据生成参与对象关系表,并对所述参与对象关系表中的条目进行筛选后构建有向图,所述有向图具有多个节点,每个节点对应一个所述参与对象,且每个节点和节点之间的有向边具有初始属性;
步骤S202,根据所述从属关系和所述资金流向构建参与对象关系表,根据预设白名单对所述参与对象关系表进行筛选,得到目标参与对象关系表,基于所述目标参与对象关系表构建有向图,所述有向图具有多个节点,每个节点对应一个所述参与对象。
在本实施例中,构建参与对象关系表时,根据关联数据和交易数据可分别构建具有指向性的两张关系表,这种指向性表示参与对象的从属关系或资金流向,如下表1和表2所示,表1为表示参与对象从属关系的关系表,比如股权关系、雇佣关系、投资关系等;表2为表示参与对象资金流向的关系表,其中A-G表示同一类参与对象,比如企业,U1-U5表示同一类参与对象,比如个人:
;
通过上述参与对象关系表可将所有参与对象进行串联,生成至少一个有向图,例如通过表1和表2生成的有向图如图3所示。
在一些实施例中,如果生成有多个有向图或存在孤立节点时,意味着各有向图之间相互独立,没有关联关系,在后续步骤S203中进行同质子图和异质子图获取时,对于节点数量过小有向图或者孤立节点进行剔除,减少后续步骤的数据处理量,提高处理效率。
步骤S203,在所述有向图中采用随机游走方式任意选择起始点形成多个k-hop路径,所述k-hop路径保留各节点的初始属性以及节点之间的原始结构连接,判断所述k-hop路径中的节点的初始属性是否相同、以及有向边的初始属性是否相同,若均相同则所述k-hop路径构成同质子图,若至少一个不同则所述k-hop路径构成异质子图。
本实施例中,本步骤随机游走基于k的值进行,以形成多个k-hop路径,比如取k的值为2,取图3中A和H为起始点分别得到图4和图5两个k-hop路径,其中图4中存在多种类型的节点和边,则其构成异质子图,图5的节点为同一种类型,且边也为同一种类型,则其构成同质子图。
步骤S204,对所述同质子图和所述异质子图采用不同的方式分别进行邻域分布采样,得到同质邻域路径和异质邻域路径,通过预设的图神经网络的路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的有序属性进行聚合,生成路径嵌入向量,即为节点的状态向量,将各节点的状态向量经过多次迭代聚合后得到各节点的聚合特征向量。
由于同质子图和异质子图反映的参与对象之间的交互关系不同,异质子图能够描述参与对象之间更复杂的交互关系,在对所述同质子图和所述异质子图采用不同的方式分别进行邻域分布采样时可以分别通过广度广度优先搜索算法和深度优先搜索算法为基础进行。
对于同质子图而言,通过广度优先搜索算法遍历所述同质子图,基于给到的起始节点按照广度优先的方式依次访问与当前节点相邻的节点,得到同质邻域分布,同时通过随机游走生成器对同质邻域分布进行采样,得到所述同质子图中节点的样本数据,该样本数据即为所述同质邻域路径。
对于异质子图而言,通过深度优先搜索算法遍历所述异质子图,基于给定的起始节点单向访问路径节点,并在无法继续访问时回溯至上一节点以访问其它路径,得到异质邻域分布,通过生成器对异质邻域分布进行采样,得到所述异质子图中节点的样本数据,该样本数据即为所述异质邻域路径。
本步骤中进行采样的目的是为了降低数据处理量,通过样本数据来反映同质子图和异质子图的整体特征,可以提高处理效率,为平衡数据处理量和处理准确度,可以根据实际数据量来设定合适的采样比例来满足高效准确的异常行为评估。
在一些实施例中,所述通过预设的图神经网络的路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的有序属性进行聚合,生成路径嵌入向量的步骤包括:提供第一图神经网络路径聚合器和第二图神经网络路径聚合器;通过所述第一图神经网络路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的前向顺序的其它节点进行聚合,得到前向聚合结果;通过所述第二图神经网络路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的后向顺序的其它节点进行聚合,得到后向聚合结果;合并所述前向聚合结果和所述后向聚合结果,得到所述路径嵌入向量。
其中,所述同质邻域路径和所述异质邻域路径中的节点是指同质子图或异质子图中表示路径的一系列参与对象对应的节点,所述有序属性是指这些节点上具有顺序或时间性质的特征。所述第一图神经网络路径聚合器和第二图神经网络路径聚合器,在路径建模过程中,对路径节点进行聚合操作,将多个节点的信息汇总到一个节点上,在本实例中,由于因为路径节点对应的参与对象具有顺序属性,所以使用两个聚合器分别对路径的前向顺序和后向顺序进行聚合。在对所述前向聚合结果和所述后向聚合结果进行合并时,可通过连接、求和等方式来实现,由此得到的路径嵌入向量包含同质信息和异质信息,能够更加准确地表征有向图中的参与对象(节点)的特征。
步骤S205,当所述有向图中任意节点对应的参与对象具有异常行为时,将其余参与对象的聚合特征向量与具有异常行为的参与对象的聚合特征向量进行相似度计算,当相似度满足预设条件时进行预警。
在本实施例中,所述将其余参与对象的聚合特征向量与具有异常行为的参与对象的聚合特征向量进行相似度计算时,具体采用余弦相似度进行计算。具体地在获取到相似度满足预设条件的参与对象后,可初步判定这些参与对象类似于基准对象存在异常行为比如非法集资行为,由此可进行预警。在一些实施例中,所述方法还包括分析相似度满足预设条件的参与对象的交易数据以提取共有特征,根据所述共有特征对相似度满足预设条件的参与对象或指定的参与对象进行非法集资行为预警。具体地通过对这些参与对象的交易数据进行分析,包括交易金额、交易时间、交易范围等各类特征进行分析,得到这些参与对象的交易数据中与非法集资行为相关的共有特征,基于这些共有特征可对有向图中的任意参与对象或者有向图之外指定的参与对象进行非法集资行为的预警,识别效率高。
在一些实施例中,为进一步提高异常行为评估的准确性,在获得路径嵌入向量的过程中可以引入注意力机制,相应地,在将各节点的状态向量经过多次迭代的过程中,所述方法还包括:
定义参考路径嵌入向量,将生成的所述路径嵌入向量作为迭代聚合输入,计算所述参考路径嵌入向量和所述路径嵌入向量的能量分数,所述能量分数表示所述参考路径嵌入向量和所述路径嵌入向量的关联性大小;对所述能量分数进行归一化处理得到注意力权重,使用所述注意力权重对迭代聚合输入进行加权求和得到聚合关联性的新的路径嵌入向量,基于新的路径嵌入向量反复迭代直到得到各节点的聚合特征向量。
在本实施例中,通过注意力机制能够学习所述同质邻域路径和所述异质邻域路径的重要性,从而赋予不同的权重来优化路径嵌入向量。在计算所述参考路径嵌入向量和所述路径嵌入向量的能量分数时,具体通过多层感知机等计算相似度关联性的函数,多层感知机(Multilayer Perceptron,简称MLP)是一种基于前馈神经网络(Feedforward NeuralNetwork)的深度学习模型,多层感知机由多个神经元层组成,其中每个神经元层与前一层全连接,多层感知机的每个神经元层由许多神经元组成,其中输入层接收输入特征,即所述参考路径嵌入向量和所述路径嵌入向量,输出层给出最终的预测结果即为所述参考路径嵌入向量和所述路径嵌入向量的关联性大小,中间的隐藏层用于提取特征和进行非线性变换,每个神经元接收前一层的输出,进行加权和和激活函数运算,得到当前层的输出,通过不断迭代训练,多层感知机可以自动学习到所述参考路径嵌入向量和所述路径嵌入向量之间的关联性关系。对所述能量分数进行归一化处理时,本实施例具体采用softmax 函数将能量分数转化为注意力权重,Softmax 函数会使得注意力权重的总和为 1,表示在计算加权和时的权重分配,具体计算公式为:注意力权重 = Softmax(能量分数) ,最后将注意力权重与对应的值向量进行加权求和,得到最终的注意力输出。基于新的路径嵌入向量反复迭代,可设置迭代次数为目标来实现聚合特征向量的输出,也可通过使聚合特征向量达到稳定状态为目标来实现聚合特征向量的输出。
在一些实施例中,在所述得到各节点的聚合特征向量的步骤后,所述方法还包括:获取更新数据集,判断所述更新数据集中是否包含存在异常行为的参与对象,若是则判断所述有向图中是否包含所述存在异常行为的参与对象,若包含则基于所述更新数据集中其余参与对象的数据更新所述同质子图和所述异质子图,以更新原始的所述有向图中各节点的聚合特征向量,并生成所述更新数据集中其余参与对象的聚合特征向量;当所述更新数据中未包含存在异常行为的参与对象,或者所述更新数据集中包含存在异常行为的参与对象但其未包含在所述有向图中时,基于所述更新数据集中的全部参与对象更新所述同质子图和所述异质子图,以更新原始的所述有向图中各节点的聚合特征向量,并生成所述更新数据集中全部参与对象的聚合特征向量。在本步骤中,由于异常行为的参与对象是进行异常行为评估的基准,因此在更新数据时将特别关注存在异常行为的参与对象,可通过为新增的存在异常行为的参与对象的初始特征向量赋予更高的权重来进行迭代,得到最终的聚合特征向量,以提高评估的准确性。
在一些实施例中,在所述在所述有向图中采用随机游走方式任意选择起始点形成多个k-hop路径的步骤之后,所述方法还包括:判断所述同质子图和所述异质子图的数量的比例是否满足预设条件,若不满足则对所述k-hop路径的k值进行调整,直到所述同质子图和所述异质子图的数量的比例满足预设条件。本步骤调整k值的目的在于平衡所述同质子图和所述异质子图对最终的聚合特征向量的影响,尽可能还原有向图中同质信息和异质信息对参与对象的影响,保证最终聚合特征向量的准确性,从而有利于提高异常行为预警的准确率,在具体实施例中,k值可根据所述同质子图和所述异质子图的数量进行适应性设定,在此不作限定。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请通过构建有向图来获取同质子图和异质子图,并采用不同的方式分别进行邻域分布采样,得到同质邻域路径和异质邻域路径,通过预设的图神经网络的路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的有序属性进行聚合,生成路径嵌入向量,经过多次迭代聚合后得到各节点的聚合特征向量,通过各节点之间聚合特征向量的相似度来进行预警,其中的聚合特征向量包含了同质信息和异质信息,能够更为准确地反应节点与邻域节点以及边的关系,有效利用节点和边的不同属性特征,通过聚合特征向量进行异常行为评估预警时,准确度更高。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)等非易失性存储介质,或随机存储记忆体(RandomAccessMemory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
进一步参考图6,作为对上述图2所示方法的实现,本申请提供了一种企业异常行为预警系统的一个实施例,该系统实施例与图2所示的方法实施例相对应,该系统具体可以应用于各种服务器中。
如图6所示,本实施例所述的企业异常行为预警系统包括:数据获取模块601、有向图构建模块602、子图生成模块603、向量生成模块604以及预警模块605。其中:
所述数据获取模块601用于从不同数据源获取若干数据集,所述数据集包括若干参与对象的多维数据,所述多维数据包括参与对象本身基础数据以及参与对象之间的关联数据;所述有向图构建模块602用于根据所述多维数据生成参与对象关系表,并对所述参与对象关系表中的条目进行筛选后构建有向图,所述有向图具有多个节点,每个节点对应一个所述参与对象,且每个节点和节点之间的有向边具有初始属性;所述子图生成模块603用于在所述有向图中采用随机游走方式任意选择起始点形成多个k-hop路径,所述k-hop路径保留各节点的初始属性以及节点之间的原始结构连接,判断所述k-hop路径中的节点的初始属性是否相同、以及有向边的初始属性是否相同,若均相同则所述k-hop路径构成同质子图,若至少一个不同则所述k-hop路径构成异质子图;所述向量生成模块604用于对所述同质子图和所述异质子图采用不同的方式分别进行邻域分布采样,得到同质邻域路径和异质邻域路径,通过预设的图神经网络的路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的有序属性进行聚合,生成路径嵌入向量,即为节点的状态向量,将各节点的状态向量经过多次迭代聚合后得到各节点的聚合特征向量;所述预警模块605用于当所述有向图中任意节点对应的参与对象具有异常行为时,将其余参与对象的聚合特征向量与具有异常行为的参与对象的聚合特征向量进行相似度计算,当相似度满足预设条件时进行预警。
在一些实施例中,所述向量生成模块604在将各节点的状态向量经过多次迭代的过程中,还用于:定义参考路径嵌入向量,将生成的所述路径嵌入向量作为迭代聚合输入,计算所述参考路径嵌入向量和所述路径嵌入向量的能量分数,所述能量分数表示所述参考路径嵌入向量和所述路径嵌入向量的关联性大小;对所述能量分数进行归一化处理得到注意力权重,使用所述注意力权重对迭代聚合输入进行加权求和得到聚合关联性的新的路径嵌入向量,基于新的路径嵌入向量反复迭代直到得到各节点的聚合特征向量。
在一些实施例中,所述向量生成模块604通过预设的图神经网络的路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的有序属性进行聚合,生成路径嵌入向量时,具体用于:提供第一图神经网络路径聚合器和第二图神经网络路径聚合器;通过所述第一图神经网络路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的前向顺序的其它节点进行聚合,得到前向聚合结果;通过所述第二图神经网络路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的后向顺序的其它节点进行聚合,得到后向聚合结果;合并所述前向聚合结果和所述后向聚合结果,得到所述路径嵌入向量。
在一些实施例中,所述向量生成模块604对所述同质子图和所述异质子图采用不同的方式分别进行邻域分布采样时,具体用于:通过广度优先搜索算法遍历所述同质子图,基于给到的起始节点按照广度优先的方式依次访问与当前节点相邻的节点,得到同质邻域分布,同时通过随机游走生成器对同质邻域分布进行采样,得到所述同质子图中节点的样本数据,该样本数据即为所述同质邻域路径;通过深度优先搜索算法遍历所述异质子图,基于给定的起始节点单向访问路径节点,并在无法继续访问时回溯至上一节点以访问其它路径,得到异质邻域分布,通过生成器对异质邻域分布进行采样,得到所述异质子图中节点的样本数据,该样本数据即为所述异质邻域路径。
在一些实施例中,所述向量生成模块604在得到各节点的聚合特征向量后,还用于:通过所述数据获取模块601获取更新数据集,判断所述更新数据集中是否包含存在异常行为的参与对象,若是则判断所述有向图中是否包含所述存在异常行为的参与对象,若包含则通过所述有向图构建模块602基于所述更新数据集中其余参与对象的数据更新所述同质子图和所述异质子图,以更新原始的所述有向图中各节点的聚合特征向量,并生成所述更新数据集中其余参与对象的聚合特征向量;当所述更新数据中未包含存在异常行为的参与对象,或者所述更新数据集中包含存在异常行为的参与对象但其未包含在所述有向图中时,通过所述有向图构建模块602基于所述更新数据集中的全部参与对象更新所述同质子图和所述异质子图,以更新原始的所述有向图中各节点的聚合特征向量,并生成所述更新数据集中全部参与对象的聚合特征向量。数据获取模块601、有向图构建模块602、子图生成模块603、向量生成模块604以及预警模块605。
在一些实施例中,子图生成模块603还用于在所述有向图中采用随机游走方式任意选择起始点形成多个k-hop路径后,判断所述同质子图和所述异质子图的数量的比例是否满足预设条件,若不满足则对所述k-hop路径的k值进行调整,直到所述同质子图和所述异质子图的数量的比例满足预设条件。
在一些实施例中,所述预警模块605将其余参与对象的聚合特征向量与具有异常行为的参与对象的聚合特征向量进行相似度计算时,具体采用余弦相似度进行计算。
上述各模块在执行相关操作时,各操作具体涉及的技术内容可参考上述方法实施例中的相关内容,在此不作展开。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请通过构建有向图来获取同质子图和异质子图,并采用不同的方式分别进行邻域分布采样,得到同质邻域路径和异质邻域路径,通过预设的图神经网络的路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的有序属性进行聚合,生成路径嵌入向量,经过多次迭代聚合后得到各节点的聚合特征向量,通过各节点之间聚合特征向量的相似度来进行预警,其中的聚合特征向量包含了同质信息和异质信息,能够更为准确地反应节点与邻域节点以及边的关系,有效利用节点和边的不同属性特征,通过聚合特征向量进行异常行为评估预警时,准确度更高。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如上所述的企业异常行为预警方法的步骤,并具有相应的技术效果。
具体请参阅图7,图7为本实施例计算机设备基本结构框图。所述计算机设备7包括通过系统总线相互通信连接存储器71、处理器72、网络接口73。需要指出的是,图中仅示出了具有组件71-73的计算机设备7,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(DigitalSignal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器71至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器71可以是所述计算机设备7的内部存储单元,例如该计算机设备7的硬盘或内存。在另一些实施例中,所述存储器71也可以是所述计算机设备7的外部存储设备,例如该计算机设备7上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。当然,所述存储器71还可以既包括所述计算机设备7的内部存储单元也包括其外部存储设备。本实施例中,所述存储器71通常用于存储安装于所述计算机设备7的操作系统和各类应用软件,例如企业异常行为预警方法的程序代码等。此外,所述存储器71还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器72在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器72通常用于控制所述计算机设备7的总体操作。本实施例中,所述处理器72用于运行所述存储器71中存储的程序代码或者处理数据,例如运行所述企业异常行为预警方法的程序代码。
所述网络接口73可包括无线网络接口或有线网络接口,该网络接口73通常用于在所述计算机设备7与其他电子设备之间建立通信连接。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的企业异常行为预警方法的步骤,并具有相应的技术效果。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种企业异常行为预警方法,其特征在于,所述方法包括:
从不同数据源获取若干数据集,所述数据集包括若干参与对象的多维数据,所述多维数据包括参与对象本身基础数据以及参与对象之间的关联数据;
根据所述多维数据生成参与对象关系表,并对所述参与对象关系表中的条目进行筛选后构建有向图,所述有向图具有多个节点,每个节点对应一个所述参与对象,且每个节点和节点之间的有向边具有初始属性;
在所述有向图中采用随机游走方式任意选择起始点形成多个k-hop路径,所述k-hop路径保留各节点的初始属性以及节点之间的原始结构连接,判断所述k-hop路径中的节点的初始属性是否相同、以及有向边的初始属性是否相同,若均相同则所述k-hop路径构成同质子图,若至少一个不同则所述k-hop路径构成异质子图;
对所述同质子图和所述异质子图采用不同的方式分别进行邻域分布采样,得到同质邻域路径和异质邻域路径,通过预设的图神经网络的路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的有序属性进行聚合,生成路径嵌入向量,即为节点的状态向量,将各节点的状态向量经过多次迭代聚合后得到各节点的聚合特征向量;
当所述有向图中任意节点对应的参与对象具有异常行为时,将其余参与对象的聚合特征向量与具有异常行为的参与对象的聚合特征向量进行相似度计算,当相似度满足预设条件时进行预警。
2.根据权利要求1所述的企业异常行为预警方法,其特征在于,在将各节点的状态向量经过多次迭代的过程中,所述方法还包括:
定义参考路径嵌入向量,将生成的所述路径嵌入向量作为迭代聚合输入,计算所述参考路径嵌入向量和所述路径嵌入向量的能量分数,所述能量分数表示所述参考路径嵌入向量和所述路径嵌入向量的关联性大小;
对所述能量分数进行归一化处理得到注意力权重,使用所述注意力权重对迭代聚合输入进行加权求和得到聚合关联性的新的路径嵌入向量,基于新的路径嵌入向量反复迭代直到得到各节点的聚合特征向量。
3.根据权利要求1或2所述的企业异常行为预警方法,其特征在于,所述通过预设的图神经网络的路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的有序属性进行聚合,生成路径嵌入向量的步骤包括:
提供第一图神经网络路径聚合器和第二图神经网络路径聚合器;
通过所述第一图神经网络路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的前向顺序的其它节点进行聚合,得到前向聚合结果;
通过所述第二图神经网络路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的后向顺序的其它节点进行聚合,得到后向聚合结果;
合并所述前向聚合结果和所述后向聚合结果,得到所述路径嵌入向量。
4.根据权利要求3所述的企业异常行为预警方法,其特征在于,所述对所述同质子图和所述异质子图采用不同的方式分别进行邻域分布采样包括:
通过广度优先搜索算法遍历所述同质子图,基于给到的起始节点按照广度优先的方式依次访问与当前节点相邻的节点,得到同质邻域分布,同时通过随机游走生成器对同质邻域分布进行采样,得到所述同质子图中节点的样本数据,该样本数据即为所述同质邻域路径;
通过深度优先搜索算法遍历所述异质子图,基于给定的起始节点单向访问路径节点,并在无法继续访问时回溯至上一节点以访问其它路径,得到异质邻域分布,通过生成器对异质邻域分布进行采样,得到所述异质子图中节点的样本数据,该样本数据即为所述异质邻域路径。
5.根据权利要求3所述的企业异常行为预警方法,其特征在于,在所述得到各节点的聚合特征向量的步骤后,所述方法还包括:
获取更新数据集,判断所述更新数据集中是否包含存在异常行为的参与对象,若是则判断所述有向图中是否包含所述存在异常行为的参与对象,若包含则基于所述更新数据集中其余参与对象的数据更新所述同质子图和所述异质子图,以更新原始的所述有向图中各节点的聚合特征向量,并生成所述更新数据集中其余参与对象的聚合特征向量;
当所述更新数据中未包含存在异常行为的参与对象,或者所述更新数据集中包含存在异常行为的参与对象但其未包含在所述有向图中时,基于所述更新数据集中的全部参与对象更新所述同质子图和所述异质子图,以更新原始的所述有向图中各节点的聚合特征向量,并生成所述更新数据集中全部参与对象的聚合特征向量。
6.根据权利要求3所述的企业异常行为预警方法,其特征在于,在所述在所述有向图中采用随机游走方式任意选择起始点形成多个k-hop路径的步骤之后,所述方法还包括:
判断所述同质子图和所述异质子图的数量的比例是否满足预设条件,若不满足则对所述k-hop路径的k值进行调整,直到所述同质子图和所述异质子图的数量的比例满足预设条件。
7.根据权利要求3所述的企业异常行为预警方法,其特征在于,
所述将其余参与对象的聚合特征向量与具有异常行为的参与对象的聚合特征向量进行相似度计算时,具体采用余弦相似度进行计算。
8.一种企业异常行为预警系统,其特征在于,包括:
数据获取模块,用于从不同数据源获取若干数据集,所述数据集包括若干参与对象的多维数据,所述多维数据包括参与对象本身基础数据以及参与对象之间的关联数据;
有向图构建模块,用于根据所述多维数据生成参与对象关系表,并对所述参与对象关系表中的条目进行筛选后构建有向图,所述有向图具有多个节点,每个节点对应一个所述参与对象,且每个节点和节点之间的有向边具有初始属性;
子图生成模块,用于在所述有向图中采用随机游走方式任意选择起始点形成多个k-hop路径,所述k-hop路径保留各节点的初始属性以及节点之间的原始结构连接,判断所述k-hop路径中的节点的初始属性是否相同、以及有向边的初始属性是否相同,若均相同则所述k-hop路径构成同质子图,若至少一个不同则所述k-hop路径构成异质子图;
向量生成模块,用于对所述同质子图和所述异质子图采用不同的方式分别进行邻域分布采样,得到同质邻域路径和异质邻域路径,通过预设的图神经网络的路径聚合器对所述同质邻域路径和所述异质邻域路径中的节点的有序属性进行聚合,生成路径嵌入向量,即为节点的状态向量,将各节点的状态向量经过多次迭代聚合后得到各节点的聚合特征向量;
预警模块,用于当所述有向图中任意节点对应的参与对象具有异常行为时,将其余参与对象的聚合特征向量与具有异常行为的参与对象的聚合特征向量进行相似度计算,当相似度满足预设条件时进行预警。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的企业异常行为预警方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的企业异常行为预警方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311653532.0A CN117350461B (zh) | 2023-12-05 | 2023-12-05 | 企业异常行为预警方法、系统、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311653532.0A CN117350461B (zh) | 2023-12-05 | 2023-12-05 | 企业异常行为预警方法、系统、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117350461A true CN117350461A (zh) | 2024-01-05 |
CN117350461B CN117350461B (zh) | 2024-03-19 |
Family
ID=89356125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311653532.0A Active CN117350461B (zh) | 2023-12-05 | 2023-12-05 | 企业异常行为预警方法、系统、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117350461B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020147594A1 (zh) * | 2019-01-16 | 2020-07-23 | 阿里巴巴集团控股有限公司 | 获取实体间关系表达的方法、系统和设备、广告召回系统 |
CN113569906A (zh) * | 2021-06-10 | 2021-10-29 | 重庆大学 | 基于元路径子图的异质图信息提取方法和装置 |
CN113988718A (zh) * | 2021-12-23 | 2022-01-28 | 支付宝(杭州)信息技术有限公司 | 一种风险识别方法、装置及设备 |
GB2605218A (en) * | 2021-03-23 | 2022-09-28 | Adobe Inc | Graph Neural Networks for datasets with heterophily |
US20230289828A1 (en) * | 2021-06-03 | 2023-09-14 | Tencent Cloud Computing (Beijing) Co., Ltd. | Data processing method, computer device, and readable storage medium |
-
2023
- 2023-12-05 CN CN202311653532.0A patent/CN117350461B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020147594A1 (zh) * | 2019-01-16 | 2020-07-23 | 阿里巴巴集团控股有限公司 | 获取实体间关系表达的方法、系统和设备、广告召回系统 |
GB2605218A (en) * | 2021-03-23 | 2022-09-28 | Adobe Inc | Graph Neural Networks for datasets with heterophily |
US20230289828A1 (en) * | 2021-06-03 | 2023-09-14 | Tencent Cloud Computing (Beijing) Co., Ltd. | Data processing method, computer device, and readable storage medium |
CN113569906A (zh) * | 2021-06-10 | 2021-10-29 | 重庆大学 | 基于元路径子图的异质图信息提取方法和装置 |
CN113988718A (zh) * | 2021-12-23 | 2022-01-28 | 支付宝(杭州)信息技术有限公司 | 一种风险识别方法、装置及设备 |
Non-Patent Citations (3)
Title |
---|
TAO LIANG等: "Meta-Path_Generation_Online_for_Heterogeneous_Network_Embedding", 《IEEE》 * |
孙权;汤韬;郑建宾;潘婧;赵金涛;: "金融交易数据驱动的图谱网络智能化欺诈侦测", 应用科学学报, no. 05 * |
高晨晖;姜晓睿;叶政君;梁荣华;: "基于异质学术超网的文献评价", 情报学报, no. 08 * |
Also Published As
Publication number | Publication date |
---|---|
CN117350461B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110009174B (zh) | 风险识别模型训练方法、装置及服务器 | |
US20210241120A1 (en) | Systems and methods for identifying synthetic identities | |
Benchaji et al. | Enhanced credit card fraud detection based on attention mechanism and LSTM deep model | |
Wang et al. | Ponzi scheme detection via oversampling-based long short-term memory for smart contracts | |
US20180260891A1 (en) | Systems and methods for generating and using optimized ensemble models | |
Hu | A multivariate grey prediction model with grey relational analysis for bankruptcy prediction problems | |
US11538044B2 (en) | System and method for generation of case-based data for training machine learning classifiers | |
CN110135978B (zh) | 用户金融风险评估方法、装置、电子设备和可读介质 | |
Ntwiga | Social network analysis for credit risk modeling | |
Tao et al. | An efficient method for network security situation assessment | |
CN115204886A (zh) | 账户识别的方法、装置、电子设备和存储介质 | |
Tundis et al. | Experiencing the detection of radicalized criminals on facebook social network and data-related issues. | |
CN116402625B (zh) | 客户评估方法、装置、计算机设备及存储介质 | |
Boz et al. | Reassessment and monitoring of loan applications with machine learning | |
CN115982654B (zh) | 一种基于自监督图神经网络的节点分类方法及装置 | |
CN117350461B (zh) | 企业异常行为预警方法、系统、计算机设备及存储介质 | |
Kadam et al. | Loan Approval Prediction System using Logistic Regression and CIBIL Score | |
Xu et al. | Multi-view Heterogeneous Temporal Graph Neural Network for “Click Farming” Detection | |
Kaur | Development of Business Intelligence Outlier and financial crime analytics system for predicting and managing fraud in financial payment services | |
CN114048330A (zh) | 风险传导概率知识图谱生成方法、装置、设备及存储介质 | |
CN116150429A (zh) | 异常对象识别方法、装置、计算设备以及存储介质 | |
Hassan et al. | Web Phishing Classification Model using Artificial Neural Network and Deep Learning Neural Network | |
CN114443409A (zh) | 支付业务系统监控方法、装置和设备及计算机存储介质 | |
Tong et al. | User financial credit analysis for blockchain regulation | |
Hamedinia et al. | Analysis of Stock Market Manipulation using Generative Adversarial Nets and Denoising Auto-Encode Models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |