CN109948000B - 异质网络的异常目标检测方法、装置、设备及存储介质 - Google Patents

异质网络的异常目标检测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109948000B
CN109948000B CN201910020777.7A CN201910020777A CN109948000B CN 109948000 B CN109948000 B CN 109948000B CN 201910020777 A CN201910020777 A CN 201910020777A CN 109948000 B CN109948000 B CN 109948000B
Authority
CN
China
Prior art keywords
node
nodes
network
abnormal
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910020777.7A
Other languages
English (en)
Other versions
CN109948000A (zh
Inventor
史玉回
曲良
黄骏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest University of Science and Technology
Original Assignee
Southwest University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest University of Science and Technology filed Critical Southwest University of Science and Technology
Priority to CN201910020777.7A priority Critical patent/CN109948000B/zh
Publication of CN109948000A publication Critical patent/CN109948000A/zh
Application granted granted Critical
Publication of CN109948000B publication Critical patent/CN109948000B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种异质网络的异常目标检测方法、装置、设备及存储介质,该异常目标检测方法包括:获取异质网络的输入信息数据;根据该输入信息数据建立图神经网络模型;基于该输入信息数据和该图神经网络模型输出异常目标。本发明通过将异质网络的输入信息数据建立图神经网络模型,基于该输入信息数据和该图神经网络模型输出异常目标,该方法采用图神经网络模型,该模型与实际逼近程度高,从而使得检测结果准确。本发明可广泛应用于大数据的异质网络数据处理和分析检测。

Description

异质网络的异常目标检测方法、装置、设备及存储介质
技术领域
本发明涉及大数据领域,尤其是涉及一种异质网络的异常目标检测方法、装置、设备及存储介质。
背景技术
现有技术中,对这种动态异质网络的学习方式一般是基于随机行走和Skip-Gram,以及矩阵分解的方式,随机行走和Skip-Gram是受自然语言处理领域的一种启发,将网络中相连的若干节点看作自然语言处理中的一句话,从而利用自然语言处理技术对网络节点进行表征。矩阵分解是通过将图的高维拉普拉斯矩阵分解成两个维度更小的矩阵乘积的形式,但是计算代价高且很难自然地处理动态网络问题。另一方面,传统方法往往利用凸优化技术对此非凸问题进行优化,容易陷到局部最优解,使其学习准确率受到极大限制。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的是提供一种异质网络的异常目标检测方法、装置、设备及存储介质。
本发明所采用的技术方案是:
第一方面,本发明提供一种异质网络的异常目标检测方法,该异常目标检测方法包括:获取异质网络的输入信息数据;根据该输入信息数据建立图神经网络模型;基于该输入信息数据和该图神经网络模型输出异常目标,该异常目标为该异质网络的节点、社团或链接。
其中,该基于该输入信息数据和该图神经网络模型输出异常目标的步骤具体包括:基于该输入信息数据和该图神经网络模型得到该异质网络的节点的低维表征向量矩阵;从该表征向量矩阵中抽取出社团、节点及链接;对该社团、该节点及该链接,采用机器学习算法输出异常目标。
其中,该对该社团采用机器学习算法输出异常目标的步骤具体包括:将该异质网络划分为k个社团,那么可以定义一个k×k的对称矩阵e,该对称矩阵的元素eij用来表示社团i和社团j之间连边的数目与整个网络所有连边数目的比值,ei为连接到社团i中所有节点的边数占整个网络所有连边数目的比值;分别计算该k个社团的异常值,每个社团的异常值根据分数维模块性计算公式计算:
Figure GDA0003988231980000011
Qi为该社团的异常值,取值为复数,n为异常类型,n=3,4,5,6,7;将异常值的绝对值偏离平均值幅度大于标准差的预定百分比的社团作为异常社团,该异常社团为该异常目标。
其中,该对该节点或该链接采用机器学习算法输出异常目标的步骤具体包括:将该节点或该链接输入到机器学习算法中,得出该节点或该链接是否为异常;如果该节点或该链接为异常,则该节点或该链接为该异常目标。
其中,该根据该输入信息数据建立图神经网络模型的步骤具体包括:从该输入信息数据的节点中确定目标节点,将该目标节点作为该图神经网络模型的第一层;选择目标节点的邻居节点,将该目标节点的邻居节点作为该图神经网络模型的第二层;再选择该邻居节点的邻居节点,将该邻居节点的邻居节点作为该图神经网络模型的第三层;以此类推,直至完成该图神经网络模型的最底层的邻居节点的选择;从该最后一层向上传播训练该图神经网络模型。
其中,该图神经网络模型的邻居节点信息聚集公式为:
Figure GDA0003988231980000021
其中,hv代表节点v的表征,σ是非线性激活函数,W是网络中学习的权重参数,u代表节点v的邻居节点,hu代表节点u的表征,N代表节点的所有邻居节点集合,B是对于不同邻居节点分配的权重参数,t代表当前时刻,t+1代表下一时刻。
其中,采用头脑风暴算法对该图神经网络模型的权重参数进行优化。
第二方面,本发明提供一种异质网络的异常目标检测装置,该异常目标检测装置包括:数据获取模块,用于获取异质网络的输入信息数据;模型建立模块,用于根据该输入信息数据建立图神经网络模型;以及目标输出模块,用于基于该输入信息数据和该图神经网络模型输出异常目标。
第三方面,本发明提供一种异质网络的异常目标检测设备,包括:至少一个处理器;以及与该至少一个处理器通信连接的存储器;其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行如上述的方法。
第四方面,本方面提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使计算机执行如上述的方法。
本发明的有益效果是:
本发明将异质网络的输入信息数据建立图神经网络模型,基于该输入信息数据和该图神经网络模型输出异常目标。该方法采用图神经网络模型,该模型与实际数据逼近程度高,从而使得检测结果准确。
进一步地,本发明基于该图神经网络模型获得该异常网络的低维表征向量矩阵,从该低维表征向量矩阵中抽取出节点、社团或链接,采用机器学习算法得出该节点、该社团或该链接是否为异常目标。该计算方法相较于现有技术的随机行走、Skip-Gram以及矩阵分解的计算法,计算代价小,计算效率高。
进一步地,本发明的图神经网络模型通过利用邻居节点的特征信息来更新目标节点的表征,不仅充分地利用了图中的拓扑结构信息,还利用了神经网络模型数据分布的强大近似能力,对于处理图数据结构具有很好的表征效果。
进一步地,在本发明的图神经网络模型中,对于不同类型的邻居节点采用不同的权重进行聚合信息,且分配的权重同样是可以进行自适应训练的,这样可以区分同一个网络中不同类型的节点对于目标节点的影响程度。
并且,由于该图神经网络模型仅仅利用网络的局部信息(邻居节点)而不需要整个网络的全局信息,且同层之间的网络权重是共享的,即同一层中所有神经元的权重是相同的,所以图神经网络模型可以自然的对新加进来的节点直接进行前馈输出,并由反向传播进行训练权重,而不需要重新训练网络结构,这对于处理关系网络的动态特征也十分适用。
此外,对于权重参数的学习过程,不采用基于梯度的方法,而采用基于群体智能思想的头脑风暴优化算法对图神经网络的权重进行优化,可以避免优化结果陷入局部最优解而降低准确度。
本发明可广泛应用于大数据的异质网络数据处理和分析检测。
附图说明
图1是本发明异质网络的异常目标检测方法的一实施例的流程示意图;
图2是图1的一应用实施例的步骤S11的流程示意图;
图3是图1的一应用实施例的步骤S12的流程示意图;
图4是图1的步骤S13的流程示意图;
图5是本发明异质网络的异常目标检测装置的一实施例的结构示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例一:
请参阅图1,图1是本发明异质网络的异常目标检测方法的一实施例的流程示意图。如图1所示,该异常目标检测方法包括如下步骤:
S11:获取异质网络的输入信息数据;
其中,异质网络可以是贿赂犯罪社会关系网络等各种社交关系网络。
以贿赂犯罪社会关系网络举例,将贿赂犯罪社会关系网络划分为节点和边,其中,节点具有:人或公司两种类型,边具有:有向边(如行贿、受贿)和无向边(如朋友关系)两种类型。
此外,本步骤还具有数据存储功能,可以将异质网络的输入信息数据通过分布式存储方式进行大规模存储和调用,使其可以建立一个完备的智能数据库,方便相关人员进行调用。
具体地,如图2所示,检察人员根据被举报人现有的社会关系网络和举报人提供的线索,将被举报人的社交状况数据更新到数据库中,生成被举报人最新的贿赂犯罪社会关系的数据信息。比如,与被举报人联系最紧密的人和公司有哪些,联系最紧密的人的又与哪些公司和人联系紧密,如此类推,得到被举报人贿赂犯罪社会关系网络的最新输入数据。
S12:根据该输入信息数据建立图神经网络模型;
在步骤S12中,以贿赂犯罪社会关系网络举例。具体地,如图3所示,该输入信息数据主要为节点-人员和节点-公司构成的网络信息,实心三角形表示网络中的人员,实心圆形表示网络中的公司,空心三角形表示网络中的新加人员,空心圆形表示网络中的新加公司。该输入数据包括节点C1、C2、C3、P1、P2、P3、P4及P5。其中,所述节点C1、所述节点C3为网络中的公司,所述节点C2为网络中的新加公司,所述节点P1、所述节点P2、所述节点P3为网络中的人员,所述节点P4、所述节点P5为网络中的新加人员,所述节点C1与所述节点P1、所述节点P2、所述节点P3相连接,所述节点C2与所述节点P2、所述节点P3、所述节点P4、所述节点P5相连接,所述节点C3与所述节点P1、所述节点P2、所述节点P3相连接。
对上述输入数据建立图神经网络,首先,确定目标节点,如C2节点作为第一层;其次,选择目标节点的邻居节点,如P2、P3作为图神经网络的第二层;最后,再选择P2、P3节点的邻居C1、C3,将C1、C3作为图神经网络的第三层。以此类推,可以根据需要不断利用节点的邻居增加图神经网络的层数,再从最后一层向上传播进行训练图神经网络。
其中,该图神经网络模型的邻居节点信息聚集公式为:
Figure GDA0003988231980000041
其中,hv代表节点v的表征,σ是非线性激活函数,W是网络中学习的权重参数,u代表节点v的邻居节点,hu代表节点u的表征,N代表节点的所有邻居节点集合,B是对于不同邻居节点分配的权重参数,t代表当前时刻,t+1代表下一时刻。
其中,该图神经网络模型的权重参数矩阵W和B中元素的取值范围均为(0,1)之间的实数。
其中,采用头脑风暴算法对该图神经网络模型的权重参数W和B进行优化。具体地,可采用如下步骤进行:
(1)对该图神经网络中的权重参数W和B进行随机初始化,得到权重参数矩阵;
(2)采用聚类算法对该权重参数矩阵进行聚类,得到多类权重矩阵,每类的中心为对应的权重矩阵的第一行;
(3)生成第一随机数与预先设置的第一超参数进行比较,如果该第一随机数大于等于该第一超参数,则随机选择一类权重矩阵的中心,并在该一类权重矩阵中随机选择一个元素以一个随机数代替该元素,生成一类新向量;反之,
(4)生成第二随机数与预先设置的第二超参数进行比较,如果该第二随机数大于等于该第二超参数,则随机选择一类权重矩阵的中心,并在该一类权重矩阵中随机选择一个元素以一个随机数代替所述元素,生成一类新向量;反之,
(5)随机选择两类权重矩阵的中心,并利用交叉重组操作得到两个新向量;
(6)判断是否达到终止条件,如果达到终止条件,则输出优化权重参数矩阵;反之,则返回到步骤(2),进行下一轮优化。
S13:基于该输入信息数据和图神经网络模型输出异常目标。
其中,该异常目标可以是异质网络的节点、社团或链接,社团为多个节点组成的组合,链接为节点和节点之间的关系。对应到实际贿赂犯罪社会关系网络中,异常目标为嫌疑人或嫌疑公司、或两个及两个以上的嫌疑人和嫌疑公司组成的基团或由两个节点链接构成的嫌疑边。
如图4所示,步骤S13具体包括如下步骤:
S131:基于该输入信息数据和该图神经网络模型得到异质网络的节点的低维表征向量矩阵;
在步骤S131中,基于该输入信息数据和该图神经网络模型得到网络中节点的低维表征向量矩阵H:
Figure GDA0003988231980000051
其中,H是一个由n行m列构成的矩阵,n行代表着网络中一共有n个节点,m列代表每个节点表征之后的维度。
S132:从该表征向量矩阵中抽取出社团、节点及链接;
在步骤S132中,从节点低维表征矩阵H中抽取出社团、节点、链接的表达形式如下:
Figure GDA0003988231980000061
Figure GDA0003988231980000062
Figure GDA0003988231980000063
其中C代表着网络中的社团矩阵,C中的元素由H中的若干行组成;
其中N代表着网络中的节点向量,N中的元素由H中的每行组成;
其中E代表着网络中的链接向量,E中的元素由对两个节点向量的某种操作组成,如两个节点相减。
S133:对该社团、该节点及该链接,采用机器学习算法输出异常目标。
在步骤133中,对节点或链接的异常检测是一个二分类问题,如果该节点或该链接为异常,则该节点或该链接为异常目标。采用分数维模块性评价社团的结构异常,该异常社团为异常目标。
可以利用各种机器学习算法对异常目标进行检测,例如可采用向量机、决策树、逻辑回归等常用的机器学习算法。以逻辑回归算法进行举例说明:
Figure GDA0003988231980000064
其中P(Y=0|x)代表着逻辑回归输出为正常的概率,P(Y=1|x)代表着逻辑回归输出为异常的概率,x可以是C、N、E,分别代表了对社团、节点及链接的异常检测。
采用分数维模块性评价社团的异常。将该异质网络划分为k个社团,那么可以定义一个k×k的对称矩阵e,该对称矩阵的元素eij用来表示社团i和社团j之间连边的数目与整个网络所有连边数目的比值,ei为连接到社团i中所有节点的边数占整个网络所有连边数目的比值。
分别计算该k个社团的异常值,每个社团的异常值根据分数维模块性计算公式计算:
Figure GDA0003988231980000065
n=3,4,5,6,7,Qi为该社团的异常值,取值为复数,n为异常类型。
将异常值的绝对值偏离平均值幅度大于标准差的预定百分比的社团作为异常社团,该异常社团为该异常目标。
以下具体分析本实施例相较于现有技术的改进点:
首先,在本实施例中,本发明将异质网络的输入信息数据建立图神经网络模型,基于该输入信息数据和该图神经网络模型输出异常目标。该方法采用图神经网络模型,模型与实际逼近程度高,从而使得检测结果准确。
进一步地,本实施例基于该图神经网络模型获得该异常网络的低维表征向量矩阵,从该低维表征向量矩阵中抽取出节点、社团或链接,采用机器学习算法得出该节点、该社团或该链接是否为异常目标。该计算方法相较于现有技术的随机行走、Skip-Gram以及矩阵分解的计算法,计算代价小,计算效率高。
进一步地,本发明的图神经网络模型通过利用邻居节点的特征信息来更新目标节点的表征,不仅充分地利用了图中的拓扑结构信息,还利用了神经网络模型数据分布的强大近似能力,对于处理图数据结构具有很好的表征效果。
进一步地,在本发明的图神经网络模型中,对于不同类型的邻居节点采用不同的权重进行聚合信息,且分配的权重同样是可以进行自适应训练的,这样可以区分同一个网络中不同类型的节点对于目标节点的影响程度。
并且,由于该图神经网络模型仅仅利用网络的局部信息(邻居节点)而不需要整个网络的全局信息,且同层之间的网络权重是共享的,即同一层中所有神经元的权重是相同的,所以图神经网络模型可以自然的对新加进来的节点直接进行前馈输出,并由反向传播进行训练权重,而不需要重新训练网络结构,这对于处理关系网络的动态特征也十分适用。
此外,对于权重参数的学习过程,不采用基于梯度的方法,而采用基于群体智能思想的头脑风暴优化算法对图神经网络的权重进行优化,可以避免优化结果陷入局部最优解而降低准确度。
本实施例的实施方法可采用Hadoop框架实现。Hadoop是一个分布式文件存储和运算系统框架,具有高可靠性、高扩展性以及高效性,此外,基于它的开源特性还带来了低成本的优势。
实施例二:
请参阅图5,图5是本发明异质网络的异常目标检测装置的一实施例的结构示意图。如图5所示,该异常目标检测装置包括数据获取模块51、模型建立模块52及目标输出模块53,目标输出模块53包括节点结果输出单元531、节点信息分析单元532及异常目标生产单元533。
其中,数据获取模块51用于获取异质网络的输入信息数据;模型建立模块52用于根据该输入信息数据建立图神经网络模型;目标输出模块53用于基于该输入信息数据和该图神经网络模型输出异常目标。
其中,节点结果输出单元531用于基于该输入信息数据和该图神经网络模型得到该异质网络的节点的低维表征向量矩阵;节点信息分析单元532用于从表征向量矩阵中抽取出社团、节点及链接;异常目标生成单元533用于对该社团、该节点及该链接,采用机器学习算法输出异常目标。
其中,该图神经网络模型的邻居节点信息聚集公式为:
Figure GDA0003988231980000081
其中,hv代表节点v的表征,σ是非线性激活函数,W是网络中学习的权重参数,u代表节点v的邻居节点,hu代表节点u的表征,N代表节点的所有邻居节点集合,B是对于不同邻居节点分配的权重参数,t代表当前时刻,t+1代表下一时刻。
其中,模型建立模块52采用头脑风暴算法对该图神经网络模型的权重参数进行优化。
此外,数据获取模块51还具有数据存储功能,可以将异质网络的输入信息数据通过分布式存储方式进行大规模存储和调用,使其可以建立一个完备的智能数据库,方便相关人员进行调用。
在本实施例中,数据获取模块51、模型建立模块52及目标输出模块53的具体工作流程和步骤同实施例一的方法的工作流程和步骤,在此不作赘述。
实施例三:
本发明提供一种异质网络的异常目标检测设备,包括:至少一个处理器;以及与该至少一个处理器通信连接的存储器;其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行如实施例一的方法。
实施例四:
本发明提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使计算机执行如实施例一的方法。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (7)

1.一种异质网络的异常目标检测方法,其特征在于,包括:
获取异质网络的输入信息数据;其中,该输入信息数据主要为节点-人员和节点-公司构成的网络信息,实心三角形表示网络中的人员,实心圆形表示网络中的公司,空心三角形表示网络中的新加人员,空心圆形表示网络中的新加公司,所述该输入信息数据包括节点C1、C2、C3、P1、P2、P3、P4及P5,其中,所述节点C1、所述节点C3为网络中的公司,所述节点C2为网络中的新加公司,所述节点P1、所述节点P2、所述节点P3为网络中的人员,所述节点P4、所述节点P5为网络中的新加人员,所述节点C1与所述节点P1、所述节点P2、所述节点P3相连接,所述节点C2与所述节点P2、所述节点P3、所述节点P4、所述节点P5相连接,所述节点C3与所述节点P1、所述节点P2、所述节点P3相连接;
异质网络包括贿赂犯罪社会关系网络,将贿赂犯罪社会关系网络划分为节点和边,其中,节点具有:人或公司两种类型,边具有:有向边和无向边两种类型,有向边包括行贿、受贿,无向边包括朋友关系;
输入信息数据,包括:检察人员根据被举报人现有的社会关系网络和举报人提供的线索,将被举报人的社交状况数据更新到数据库中,生成被举报人最新的贿赂犯罪社会关系的数据信息;
根据所述输入信息数据建立图神经网络模型,包括:
所述图神经网络模型的邻居节点信息聚集公式为:
Figure FDA0004034454600000011
其中,hv代表节点v的表征,σ是非线性激活函数,W是网络中学习的权重参数,u代表节点v的邻居节点,hu代表节点u的表征,N代表节点的所有邻居节点集合,B是对于不同邻居节点分配的权重参数,t代表当前时刻,t+1代表下一时刻;
采用头脑风暴算法对所述图神经网络模型的权重参数进行优化,包括:
(1)对该图神经网络中的权重参数W和B进行随机初始化,得到权重参数矩阵;
(2)采用聚类算法对该权重参数矩阵进行聚类,得到多类权重矩阵,每类的中心为对应的权重矩阵的第一行;
(3)生成第一随机数与预先设置的第一超参数进行比较,如果该第一随机数大于等于该第一超参数,则随机选择一类权重矩阵的中心,并在该一类权重矩阵中随机选择一个元素以一个随机数代替该元素,生成一类新向量;如果所述第一随机数小于所述第一超参数,则生成第二随机数与预先设置的第二超参数进行比较,如果该第二随机数大于等于该第二超参数,则随机选择一类权重矩阵的中心,并在该一类权重矩阵中随机选择一个元素以一个随机数代替所述元素,生成一类新向量;如果所述第二随机数小于所述第二超参数,则随机选择两类权重矩阵的中心,并利用交叉重组操作得到两个新向量;
(4)判断是否达到终止条件,如果达到终止条件,则输出优化权重参数矩阵;反之,则返回到步骤(2),进行下一轮优化;
基于所述输入信息数据和所述图神经网络模型输出异常目标,所述异常目标为所述异质网络的节点、社团或链接,所述基于所述输入信息数据和所述图神经网络模型输出异常目标包括:
基于该输入信息数据和该图神经网络模型得到异质网络的节点的低维表征向量矩阵;
从该表征向量矩阵中抽取出社团、节点及链接;
对该社团、该节点及该链接,采用机器学习算法输出异常目标;其中,该异常目标包括:异质网络的节点、社团或链接,社团为多个节点组成的组合,链接为节点和节点之间的关系,对应到实际贿赂犯罪社会关系网络中,异常目标为嫌疑人或嫌疑公司、或两个及两个以上的嫌疑人和嫌疑公司组成的基团或由两个节点链接构成的嫌疑边。
2.根据权利要求1所述的异常目标检测方法,其特征在于,对所述社团采用机器学习算法输出异常目标的步骤具体包括:
将所述异质网络划分为k个社团,定义一个k×k的对称矩阵e,所述对称矩阵的元素eij用来表示社团i和社团j之间连边的数目与整个网络所有连边数目的比值,ei为连接到社团i中所有节点的边数占整个网络所有连边数目的比值;
分别计算所述k个社团的异常值,每个社团的异常值根据分数维模块性计算公式计算:
Figure FDA0004034454600000021
Qi为所述社团的异常值,取值为复数,n为异常类型,n=3,4,5,6,7;
将异常值的绝对值偏离平均值幅度大于标准差的预定百分比的社团作为异常社团,所述异常社团为所述异常目标。
3.根据权利要求1所述的异常目标检测方法,其特征在于,对所述节点或所述链接采用机器学习算法输出异常目标的步骤具体包括:
将所述节点或所述链接输入到机器学习算法中,得出所述节点或所述链接是否为异常;
如果所述节点或所述链接为异常,则所述节点或所述链接为所述异常目标。
4.根据权利要求1所述的异常目标检测方法,其特征在于,所述根据所述输入信息数据建立图神经网络模型的步骤具体包括:
从所述输入信息数据的节点中确定目标节点,将所述目标节点作为所述图神经网络模型的第一层;
选择目标节点的邻居节点,将所述目标节点的邻居节点作为所述图神经网络模型的第二层;
再选择所述邻居节点的邻居节点,将所述邻居节点的邻居节点作为所述图神经网络模型的第三层;
以此类推,直至完成所述图神经网络模型的最后一层的邻居节点的选择;
从所述最后一层向上传播训练所述图神经网络模型。
5.一种异质网络的异常目标检测装置,其特征在于,包括:
数据获取模块,用于获取异质网络的输入信息数据;其中,该输入信息数据主要为节点-人员和节点-公司构成的网络信息,实心三角形表示网络中的人员,实心圆形表示网络中的公司,空心三角形表示网络中的新加人员,空心圆形表示网络中的新加公司; 所述该输入信息数据包括节点C1、C2、C3、P1、P2、P3、P4及P5,其中,所述节点C1、所述节点C3为网络中的公司,所述节点C2为网络中的新加公司,所述节点P1、所述节点P2、所述节点P3为网络中的人员,所述节点P4、所述节点P5为网络中的新加人员,所述节点C1与所述节点P1、所述节点P2、所述节点P3相连接,所述节点C2与所述节点P2、所述节点P3、所述节点P4、所述节点P5相连接,所述节点C3与所述节点P1、所述节点P2、所述节点P3相连接;
异质网络包括贿赂犯罪社会关系网络,将贿赂犯罪社会关系网络划分为节点和边,其中,节点具有:人或公司两种类型,边具有:有向边和无向边两种类型,有向边包括行贿、受贿,无向边包括朋友关系;
输入信息数据,包括:检察人员根据被举报人现有的社会关系网络和举报人提供的线索,将被举报人的社交状况数据更新到数据库中,生成被举报人最新的贿赂犯罪社会关系的数据信息;
模型建立模块,用于根据所述输入信息数据建立图神经网络模型,包括:
所述图神经网络模型的邻居节点信息聚集公式为:
Figure FDA0004034454600000031
其中,hv代表节点v的表征,σ是非线性激活函数,W是网络中学习的权重参数,u代表节点v的邻居节点,hu代表节点u的表征,N代表节点的所有邻居节点集合,B是对于不同邻居节点分配的权重参数,t代表当前时刻,t+1代表下一时刻;
采用头脑风暴算法对所述图神经网络模型的权重参数进行优化,包括:
(1)对该图神经网络中的权重参数W和B进行随机初始化,得到权重参数矩阵;
(2)采用聚类算法对该权重参数矩阵进行聚类,得到多类权重矩阵,每类的中心为对应的权重矩阵的第一行;
(3)生成第一随机数与预先设置的第一超参数进行比较,如果该第一随机数大于等于该第一超参数,则随机选择一类权重矩阵的中心,并在该一类权重矩阵中随机选择一个元素以一个随机数代替该元素,生成一类新向量;如果所述第一随机数小于所述第一超参数,则生成第二随机数与预先设置的第二超参数进行比较,如果该第二随机数大于等于该第二超参数,则随机选择一类权重矩阵的中心,并在该一类权重矩阵中随机选择一个元素以一个随机数代替所述元素,生成一类新向量;如果所述第二随机数小于所述第二超参数,则随机选择两类权重矩阵的中心,并利用交叉重组操作得到两个新向量;
(4)判断是否达到终止条件,如果达到终止条件,则输出优化权重参数矩阵;反之,则返回到步骤(2),进行下一轮优化;以及
目标输出模块,用于基于所述输入信息数据和所述图神经网络模型输出异常目标,包括:
基于该输入信息数据和该图神经网络模型得到异质网络的节点的低维表征向量矩阵;
从该表征向量矩阵中抽取出社团、节点及链接;
对该社团、该节点及该链接,采用机器学习算法输出异常目标;其中,该异常目标包括:异质网络的节点、社团或链接,社团为多个节点组成的组合,链接为节点和节点之间的关系,对应到实际贿赂犯罪社会关系网络中,异常目标为嫌疑人或嫌疑公司、或两个及两个以上的嫌疑人和嫌疑公司组成的基团或由两个节点链接构成的嫌疑边。
6.一种异质网络的异常目标检测设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1 至 4 任一项所述的方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至4任一项所述的方法。
CN201910020777.7A 2019-01-09 2019-01-09 异质网络的异常目标检测方法、装置、设备及存储介质 Active CN109948000B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910020777.7A CN109948000B (zh) 2019-01-09 2019-01-09 异质网络的异常目标检测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910020777.7A CN109948000B (zh) 2019-01-09 2019-01-09 异质网络的异常目标检测方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109948000A CN109948000A (zh) 2019-06-28
CN109948000B true CN109948000B (zh) 2023-04-07

Family

ID=67006477

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910020777.7A Active CN109948000B (zh) 2019-01-09 2019-01-09 异质网络的异常目标检测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109948000B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110515793B (zh) * 2019-07-23 2022-02-18 平安科技(深圳)有限公司 系统性能监控方法、装置、设备及存储介质
CN112346831A (zh) * 2019-08-09 2021-02-09 华为技术有限公司 管理异常应用的方法和装置
CN110705709B (zh) * 2019-10-14 2021-03-23 支付宝(杭州)信息技术有限公司 训练图神经网络模型的方法和装置
CN111159395B (zh) * 2019-11-22 2023-02-17 国家计算机网络与信息安全管理中心 基于图神经网络的谣言立场检测方法、装置和电子设备
CN111625688B (zh) * 2019-11-28 2024-04-05 京东科技控股股份有限公司 一种基于异构网络的特征聚合方法、装置、设备和存储介质
CN111325340B (zh) * 2020-02-17 2023-06-02 南方科技大学 信息网络关系预测方法及系统
CN111681204B (zh) * 2020-04-30 2023-09-26 北京深睿博联科技有限责任公司 基于图神经网络的ct肋骨骨折病灶关系建模方法及装置
CN111597396B (zh) * 2020-05-13 2021-05-28 深圳计算科学研究院 异构网络社群检测方法、装置、计算机设备及存储介质
CN111639687B (zh) * 2020-05-19 2024-03-01 北京三快在线科技有限公司 一种模型训练以及异常账号识别方法及装置
CN112437022B (zh) * 2020-11-11 2023-05-19 中国科学技术大学先进技术研究院 网络流量识别方法、设备及计算机存储介质
CN116541794B (zh) * 2023-07-06 2023-10-20 中国科学技术大学 一种基于自适应图注意网络的传感器数据异常检测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944629A (zh) * 2017-11-30 2018-04-20 北京邮电大学 一种基于异质信息网络表示的推荐方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224872B (zh) * 2015-09-30 2018-04-13 河南科技大学 一种基于神经网络聚类的用户异常行为检测方法
CN106709037B (zh) * 2016-12-29 2019-11-08 武汉大学 一种基于异构信息网络的电影推荐方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944629A (zh) * 2017-11-30 2018-04-20 北京邮电大学 一种基于异质信息网络表示的推荐方法及装置

Also Published As

Publication number Publication date
CN109948000A (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
CN109948000B (zh) 异质网络的异常目标检测方法、装置、设备及存储介质
CN111832922B (zh) 基于知识图谱推理的食品安全事件风险研判方法及装置
CN108776683A (zh) 一种基于孤立森林算法和神经网络的电力运维数据清洗方法
CN112217674B (zh) 基于因果网络挖掘和图注意力网络的告警根因识别方法
Suzan et al. Students' Adaptability Level Prediction in Online Education using Machine Learning Approaches
CN112381179A (zh) 一种基于双层注意力机制的异质图分类方法
CN114580934A (zh) 基于无监督异常检测的食品检测数据风险的早预警方法
CN107918837A (zh) 一种果蔬类食品安全风险预测方法
CN111695611A (zh) 一种蜂群优化核极限学习和稀疏表示机械故障识别方法
Ramachandra Deep learning for causal inference
CN111079348B (zh) 一种缓变信号检测方法和装置
CN105228185A (zh) 一种用于识别通信网络中模糊冗余节点身份的方法
Yu et al. Pattern clustering of forest fires based on meteorological variables and its classification using hybrid data mining methods
CN110136017A (zh) 一种基于数据增强和非负矩阵稀疏分解的群组发现方法
CN112579708A (zh) 一种基于改进局部路径的链路预测相似性指标方法
Davila-Frias et al. Deep neural networks for all-terminal network reliability estimation
Islam et al. An approach to evaluate classifiers for automatic disease detection and classification of plant leaf
Naik et al. Rainfall prediction based on deep neural network: a review
Dasgaonkar et al. Analysis of multi-layered perceptron, radial basis function and convolutional neural networks in recognizing handwritten digits
Moradi Kordmahalleh et al. Time-series forecasting with evolvable partially connected artificial neural network
Shi Integration of unascertained method with neural networks and its application
Wang et al. Image Recognition Technology in Pest Control Based on Convolution Neural Network and An Improved VGG-16 Algorithm: A Case Stduy of Asian Gaint Hornet
Nowak et al. Learning in rough-neuro-fuzzy system for data with missing values
Shu et al. Link prediction based on 3D convolutional neural network
Goztepe et al. Estimating fuzzy analytic network process (FANP) comparison matrix weights using artificial neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant