CN111817898A - 一种识别动态网络结构异常的方法及装置 - Google Patents

一种识别动态网络结构异常的方法及装置 Download PDF

Info

Publication number
CN111817898A
CN111817898A CN202010704354.XA CN202010704354A CN111817898A CN 111817898 A CN111817898 A CN 111817898A CN 202010704354 A CN202010704354 A CN 202010704354A CN 111817898 A CN111817898 A CN 111817898A
Authority
CN
China
Prior art keywords
network
result
time
moments
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010704354.XA
Other languages
English (en)
Other versions
CN111817898B (zh
Inventor
艾青
谭树国
张扬
王征
梁华欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yixin Zhicheng Credit Management Co ltd
Zhicheng Afu Technology Development Beijing Co ltd
Original Assignee
Beijing Yixin Zhicheng Credit Management Co ltd
Zhicheng Afu Technology Development Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yixin Zhicheng Credit Management Co ltd, Zhicheng Afu Technology Development Beijing Co ltd filed Critical Beijing Yixin Zhicheng Credit Management Co ltd
Priority to CN202010704354.XA priority Critical patent/CN111817898B/zh
Publication of CN111817898A publication Critical patent/CN111817898A/zh
Application granted granted Critical
Publication of CN111817898B publication Critical patent/CN111817898B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种识别动态网络结构异常的方法及装置。根据预设时间切分间隔将动态关系网络切分为多个时间网络;多个时间网络分别对应不同的切分时刻;对任一时间网络,获得该时间网络的度分布数据;根据该时间网络的度分布数据拟合线性函数;根据线性函数得到该时间网络的图特征结果;利用多个时间网络中每个时间网络的图特征结果,识别动态关系网络的结构是否异常。在本申请中,由于依据时间网络的度分布数据进行了线性拟合,并依据线性拟合得到的函数得到图特征结果,实现了对该拟合出的线性函数的量化。以量化表示的图特征结果来识别动态关系网络,能够更加准确、高效地识别出网络结构的异常。有利于及时基于网络中的异常加以警示,防范风险。

Description

一种识别动态网络结构异常的方法及装置
技术领域
本申请涉及大数据技术领域,特别是涉及一种识别动态网络结构异常的方法及装置。
背景技术
关系网络中通常包括多个节点,具有关系的节点中间通过边连接。目前已有针对静态的关系网络具有多种异常分析方法,例如通过度、中心性进行异常网络结构的识别。但是针对网络结构随时间发生变化的动态关系网络,尚不具备高效、准确异常识别方案。例如,相同间隔时间内,同等的节点增量和边的增量既可能使网络结构无明显变化,也可能使网络内部结构发生较大变化。单纯从数量统计节点和边的变化很难识别动态网络结构的异常变化。
发明内容
基于上述问题,本申请提供了一种识别动态网络结构异常的方法及装置,以高效、准确地识别动态网络结构的异常。
本申请实施例公开了如下技术方案:
第一方面,本申请提供一种识别动态网络结构异常的方法,包括:
根据预设时间切分间隔将动态关系网络切分为多个时间网络;所述多个时间网络分别对应不同的切分时刻;
对于任一时间网络,获得该时间网络的度分布数据;
根据该时间网络的度分布数据拟合线性函数;
根据所述线性函数得到该时间网络的图特征结果;
利用所述多个时间网络中每个时间网络的图特征结果,识别所述动态关系网络的结构是否异常。
可选地,所述根据该时间网络的度分布数据拟合线性函数,具体包括:
对该时间网络的度分布数据进行对数转换,得到转换后的数据;
利用线性回归算法模型和所述转换后的数据进行拟合,得到所述线性函数。
可选地,根据所述线性函数得到该时间网络的图特征结果,具体包括:
基于所述线性函数进行残差平方和计算,得到该时间网络的图特征结果。
可选地,利用所述多个时间网络中每个时间网络的图特征结果,识别所述动态关系网络的结构是否异常,具体包括:
利用所述多个时间网络中每个时间网络的图特征结果,获得所有相邻两个切分时刻之间图特征结果的变化结果;
根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值识别所述动态关系网络的结构是否异常。
可选地,根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值识别所述动态关系网络的结构是否异常,具体包括:
当某相邻两个切分时刻之间图特征结果的变化结果超出所述第一预设参考值时,判断该相邻两个切分时刻之间所述动态关系网络的结构发生异常。
可选地,以上识别动态网络结构异常的方法还包括:
对于任一时间网络,获得该时间网络的全局聚类系数;
利用所述多个时间网络中每个时间网络的全局聚类系数,获得所有相邻两个切分时刻之间全局聚类系数的变化结果;
所述根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值识别所述动态关系网络的结构是否异常,具体包括:
根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值,以及每相邻两个切分时刻之间全局聚类系数的变化结果和第二预设参考值,识别所述动态关系网络的结构是否异常。
可选地,根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值,以及每相邻两个切分时刻之间全局聚类系数的变化结果和第二预设参考值,识别所述动态关系网络的结构是否异常,具体包括:
当某相邻两个切分时刻之间图特征结果的变化结果超出所述第一预设参考值时,将该相邻两个切分时刻和该相邻两个切分时刻分别对应的时间网络共同作为一个元素列入第一异常结果集;
当某相邻两个切分时刻之间全局聚类系数的变化结果超出所述第二预设参考值时,将该相邻两个切分时刻和该相邻两个切分时刻分别对应的时间网络共同作为一个元素列入第二异常结果集;
对所述第一异常结果集和所述第二异常结果集取并集,根据所述并集识别所述动态关系网络的结构是否异常。
可选地,以上识别动态网络结构异常的方法还包括:对所述动态关系网络的结构异常情况进行展示。
第二方面,本申请提供一种识别动态网络结构异常的装置,包括:
切分模块,用于根据预设时间切分间隔将动态关系网络切分为多个时间网络;所述多个时间网络分别对应不同的切分时刻;
度分布计算模块,用于对于任一时间网络,获得该时间网络的度分布数据;
函数拟合模块,用于根据该时间网络的度分布数据拟合线性函数;
图特征获取模块,用于根据所述线性函数得到该时间网络的图特征结果;
网络异常识别模块,用于利用所述多个时间网络中每个时间网络的图特征结果,识别所述动态关系网络的结构是否异常。
可选地,所述函数拟合模块包括:
数据转换单元,用于对该时间网络的度分布数据进行对数转换,得到转换后的数据;
第一拟合单元,用于利用线性回归算法模型和所述转换后的数据进行拟合,得到所述线性函数。
可选地,所述图特征获取模块,具体包括:
第一计算单元,用于基于所述线性函数进行残差平方和计算,得到该时间网络的图特征结果。
可选地,所述网络异常识别模块,具体包括:
变化结果获取单元,用于利用所述多个时间网络中每个时间网络的图特征结果,获得所有相邻两个切分时刻之间图特征结果的变化结果;
第一识别单元,用于根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值识别所述动态关系网络的结构是否异常。
可选地,所述第一识别单元,具体用于当某相邻两个切分时刻之间图特征结果的变化结果超出所述第一预设参考值时,判断该相邻两个切分时刻之间所述动态关系网络的结构发生异常。
可选地,以上识别动态网络结构异常的装置还包括:
聚类系数计算模块,用于对于任一时间网络,获得该时间网络的全局聚类系数;
变化结果计算模块,用于利用所述多个时间网络中每个时间网络的全局聚类系数,获得所有相邻两个切分时刻之间全局聚类系数的变化结果;
所述第一识别单元,具体用于根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值,以及每相邻两个切分时刻之间全局聚类系数的变化结果和第二预设参考值,识别所述动态关系网络的结构是否异常。
可选地,所述第一识别单元,具体包括:
第一异常结果集获取子单元,用于当某相邻两个切分时刻之间图特征结果的变化结果超出所述第一预设参考值时,将该相邻两个切分时刻和该相邻两个切分时刻分别对应的时间网络共同作为一个元素列入第一异常结果集;
第二异常结果集获取子单元,用于当某相邻两个切分时刻之间全局聚类系数的变化结果超出所述第二预设参考值时,将该相邻两个切分时刻和该相邻两个切分时刻分别对应的时间网络共同作为一个元素列入第二异常结果集;
异常识别子单元,用于对所述第一异常结果集和所述第二异常结果集取并集,根据所述并集识别所述动态关系网络的结构是否异常。
可选地,以上识别动态网络结构异常的装置还包括:
展示模块,用于对所述动态关系网络的结构异常情况进行展示。
相较于现有技术,本申请具有以下有益效果:
本申请提供的技术方案中,根据预设时间切分间隔将动态关系网络切分为多个时间网络;多个时间网络分别对应不同的切分时刻;对于任一时间网络,获得该时间网络的度分布数据;根据该时间网络的度分布数据拟合线性函数;根据线性函数得到该时间网络的图特征结果;利用多个时间网络中每个时间网络的图特征结果,识别动态关系网络的结构是否异常。在本申请中,由于依据时间网络的度分布数据进行了线性拟合,并依据线性拟合得到的函数得到图特征结果,实现了对该拟合出的线性函数的量化。以量化表示的图特征结果来识别动态关系网络,相比于单纯依赖动态关系网络中节点和边的变化情况,能够更加准确、高效地识别出网络结构的异常。从而有利于及时基于网络中的异常加以警示,防范风险。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种识别动态网络结构异常的方法流程图;
图2为本申请实施例提供的一种相邻两个切分时刻中较先的切分时刻对应的时间网络示意图;
图3为本申请实施例提供的一种相邻两个切分时刻中较后的切分时刻对应的时间网络示意图;
图4为本申请实施例提供的另一种识别动态网络结构异常的方法流程图;
图5为本申请实施例提供的一种时刻网络示意图;
图6为步骤408的一种实现方式流程图;
图7为本申请实施例提供的一种识别动态网络结构异常的装置的结构示意图;
图8为本申请实施例提供的另一种识别动态网络结构异常的装置的结构示意图。
具体实施方式
正如前文描述,目前难以对动态关系网络中的结构异常进行准确、高效的识别。基于此,发明人经过研究,于本申请中提供一种识别动态网络结构异常的方法及装置。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
方法实施例
参见图1,该图为本申请实施例提供的一种识别动态关系网络结构异常的方法流程图。
如图1所示,该识别动态关系网络结构异常的方法包括:
步骤101:根据预设时间切分间隔将动态关系网络切分为多个时间网络;多个时间网络分别对应不同的切分时刻。
在本申请实施例中,动态关系网络是指结构可随时间发生变化的关系网络。此处,变化可以是指增添或解除。多数情况下,关系网络的异常体现为网络中节点或边的异常增加。
对于执行本实施例方法的当前时刻,动态关系网络已经发展了有一段时间。例如,动态关系网络的建立时刻定义为t0,当前时刻为T。预设的时间切分间隔为Δt,可以在[t0,T]的时间区间内以Δt进行切分。因此得到多个不同的切分时刻t1,t2,t3,…,tn等,其中t1=t0+Δt,t2=t1+Δt,t3=t2+Δt,…,tn=tn-1+Δt。其中tn小于或等于T。实际应用中,时间切分间隔Δt可以随实际需求设置,此处对时间切分间隔Δt的具体单位和具体数值不加以限定。
因为动态关系网络是可随时间发生变化的,因此不同的切分时刻对应不同的时间网络。例如,在切分时刻t1的时间网络为G1(v1,e1,t1),在切分时刻t2的时间网络为G2(v2,e2,t2)。其中v1和v2分别表示节点集合,e1和e2分别表示边集合。以此类推,可以切分得到每个切分时刻对应的时间网络。
为便于理解动态关系网络在不同切分时刻的区别,以图2和图3为示例进行说明。图2和图3分别示意了相邻两个切分时刻分别对应的时间网络。显然,图3示意的时间网络相比于图2示意的时间网络,节点数量增多,且连接到个别节点的边的数量增多。需要说明的是,图2和图3仅为时间网络的示意图,并不作为对步骤101切分得到的时间网络的形态限制。
步骤102:对于任一时间网络,获得该时间网络的度分布数据。
对于每个时间网络,均可以获得其度分布数据。获得一个静态关系网络的度分布数据属于本领域较为成熟的技术,切分出的每个时间网络相当于静态的关系网络,故此处对获得时间网络的度分布数据的实现方式不做限制也不做赘述。
在本申请实施例中,时间网络遵循幂律分布的规律。幂律分布用于表征自然界与社会生活中数据的分布规律。长尾分布和正态分布等均属于幂律分布。任一时间网络的度分布数据均可以拟合得到幂律分布函数,不同的时间网络的度分布数据不同,因此,拟合得到的幂律分布函数也是不同的。
步骤103:根据该时间网络的度分布数据拟合线性函数。
在一种示例实现方式中,步骤103执行时,首先对该时间网络的度分布数据进行对数转换,得到转换后的数据;再利用线性回归算法模型和转换后的数据进行拟合,得到线性函数。
本步骤中,通过线性回归拟合得到线性函数,从时间网络中原本离散的度分布数据挖掘出数据的线性关系。
步骤104:根据线性函数得到该时间网络的图特征结果。
在一种示例实现方式中,步骤104执行时,可以基于线性函数进行残差平方和计算,得到该时间网络的图特征结果。
残差平方和(Residual Sum of Squares,RSS)是在线性模型中衡量模型拟合程度的一个量,用连续曲线近似地刻画或比拟平面上离散点组,以表示坐标之间函数关系的一种数据处理方法。通过基于步骤103得到的线性函数进行RSS计算,将原本的数据降维,以拟合程度的量化表达上述线性函数。
由于线性函数的量化表达反映了该时间网络的图特征,因此可以将RSS计算的结果直接作为该时间网络的图特征结果。作为示例,时间网络G1(v1,e1,t1)的图特征结果表示为feature(G1),时间网络G2(v2,e2,t2)的图特征结果表示为feature(G2)。
步骤105:利用多个时间网络中每个时间网络的图特征结果,识别动态关系网络的结构是否异常。
依据上述步骤102-104,可以获得步骤101切分的每个时间网络的图特征结果。本步骤中正是依据每个时间网络的图特征结果来识别动态关系网络的结构是否异常。
在一种可能的实现方式中,可以利用多个时间网络中每个时间网络的图特征结果,获得所有相邻两个切分时刻之间图特征结果的变化结果。例如t1和t2为相邻两个切分时刻,t2和t3为相邻两个切分时刻,t3和t4为相邻两个切分时刻。图特征结果的变化结果可以通过以下公式表达:
Figure BDA0002594141050000081
公式(1)中,result(Gi_j)表示相邻两个切分时刻ti和tj之间图特征结果的变化结果,即tj对应的时间网络的图特征结果与ti对应的时间网络的图特征结果的变化结果,feature(Gi)表示ti对应的时间网络的图特征结果,feature(Gj)表示tj对应的时间网络的图特征结果。其中,tj=ti+Δt。本实施例中,i和j为1~n之间任一整数,j=i+1,n为大于或等于3的整数。
需要说明的是,若以t1为第一个切分时刻,则令t1对应的时间网络的图特征结果为0。
依据公式(1)可以得到每相邻两个切分时刻之间图特征结果的变化结果。接着,可以根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值识别动态关系网络的结构是否异常。
本申请实施例中,第一预设参考值可以为经验值或者依据历史数据分析得到的适于判断异常结构且与图特征相关的参考值。第一预设参考值也可以根据实际需求来设定。本实施例不对第一预设参考值的具体数值做限定。
当某相邻两个切分时刻之间图特征结果的变化结果超出第一预设参考值时,可以判断该相邻两个切分时刻之间动态关系网络的结构发生异常。具体异常的结构可以通过比对该相邻两个切分时刻的时刻网络的区别做出判定。例如,result(G1_2)大于第一预设参考值,则表示在t1和t2之间,动态关系网络的结构发生异常,可以重点分析t2对应的时间网络相比于t1对应的时间网络新增加的节点和边。
以上即为本申请实施例提供的识别动态网络结构异常的方法。在本申请中,由于依据时间网络的度分布数据进行了线性拟合,并依据线性拟合得到的函数得到图特征结果,实现了对该拟合出的线性函数的量化。以量化表示的图特征结果来识别动态关系网络,相比于单纯依赖动态关系网络中节点和边的变化情况,能够更加准确、高效地识别出网络结构的异常。从而有利于及时基于网络中的异常加以警示,防范风险。
在本申请中,为了进一步提升对动态关系网络结构异常识别的准确性,提供了另一种识别动态关系网络结构异常的方法。以下结合实施例和附图对该实施例方法进行说明。
参见图4,该图为本申请实施例提供的另一种识别动态关系网络结构异常的方法流程图。
如图4所示,该识别动态关系网络结构异常的方法包括:
步骤401:根据预设时间切分间隔将动态关系网络切分为多个时间网络;所述多个时间网络分别对应不同的切分时刻。
步骤402:对于任一时间网络,获得该时间网络的度分布数据。
步骤403:根据该时间网络的度分布数据拟合线性函数。
步骤404:根据所述线性函数得到该时间网络的图特征结果。
步骤405:利用所述多个时间网络中每个时间网络的图特征结果,获得所有相邻两个切分时刻之间图特征结果的变化结果。
在图4所示的识别动态关系网络结构异常的方法中,步骤401-405的实现方式均已在前述实施例详细介绍,故此处对步骤401-405的实现方式不再赘述。
全局聚类系数也成集群系数、群聚系数或集群系数。全局聚类系数是图论中用来描述一个图中的顶点之间集结成团的程度的系数。对于一个时间网络,其全局聚类系数也可以反映出节点的紧密度。本申请在执行步骤402-405的求取到所有相邻两个切分时刻之间图特征结果的变化结果之外,还通过执行步骤406-407,获得识别动态网络结构异常的另一判据,以此提升识别的准确性。
步骤406:对于任一时间网络,获得该时间网络的全局聚类系数。
全局聚类系数的计算公式如下:
Figure BDA0002594141050000101
公式(2)中,CE表示该时间网络的全局聚类系数,S1表示该时间网络中完整闭合三角形的数量,S2表示该时间网络中完整闭合三角形与开放三角形的数量之和。
以图5所示的时刻网络为示例,包含完整闭合三角形3个和开放三角形5个,因此计算得到的全局聚类系数为3/8。
求取某静态关系网络的全局聚类系数属于本领域比较成熟的技术。故此处对于步骤406的实现方式不再赘述。通过执行步骤406能够得到步骤401切分出的每个时间网络的全局聚类系数。
步骤407:利用所述多个时间网络中每个时间网络的全局聚类系数,获得所有相邻两个切分时刻之间全局聚类系数的变化结果。
全局聚类系数的变化结果可以通过以下公式表达:
Figure BDA0002594141050000102
公式(3)中,CE(Gi_j)表示相邻两个切分时刻ti和tj之间全局聚类系数的变化结果,即tj对应的时间网络的全局聚类系数与ti对应的时间网络的全局聚类系数的变化结果,CE(Gi)表示ti对应的时间网络的全局聚类系数,CE(Gj)表示tj对应的时间网络的全局聚类系数。其中,tj=ti+Δt。本实施例中,i和j为1~n之间任一整数,j=i+1,n为大于或等于3的整数。
通过执行步骤407,可以得到每相邻两个切分时刻之间图特征结果的变化结果。
需要说明的是,本实施例对于步骤402-405与步骤406-407的相对执行顺序不进行限定。例如,可以先执行步骤402-405再执行步骤406-407,也可以先执行步骤406-407再执行步骤402-405。另外,还可以同时执行步骤402-405以及步骤406-407。
步骤408:根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值,以及每相邻两个切分时刻之间全局聚类系数的变化结果和第二预设参考值,识别所述动态关系网络的结构是否异常。
参见图6,该图为本步骤的一种可能的实现方式。如图6所示,步骤408可以包括以下子步骤:
S4081:当某相邻两个切分时刻之间图特征结果的变化结果超出所述第一预设参考值时,将该相邻两个切分时刻和该相邻两个切分时刻分别对应的时间网络共同作为一个元素列入第一异常结果集。
例如,result(G5_6)超过第一预设参考值,则将t5、t6、G5(v5,e5,t5)和G6(v6,e6,t6)作为第一异常结果集U1的一个元素。同理,类似地,如果有其他符合上述条件的,也将其列入U1中。
S4082:当某相邻两个切分时刻之间全局聚类系数的变化结果超出所述第二预设参考值时,将该相邻两个切分时刻和该相邻两个切分时刻分别对应的时间网络共同作为一个元素列入第二异常结果集。
本申请实施例中,第二预设参考值可以为经验值或者依据历史数据分析得到的适于判断异常结构且与全局聚类系数相关的参考值。第二预设参考值也可以根据实际需求来设定。本实施例不对第二预设参考值的具体数值做限定。
例如,CE(G9_10)超过第二预设参考值,则将t9、t10、G9(v9,e9,t9)和G10(v10,e10,t10)作为第二异常结果集U2的一个元素。同理,类似地,如果有其他符合上述条件的,也将其列入U2中。
在具体实现时,第一异常结果集合U1与第二异常结果集合U2可能有一个或多个元素重合,这表明重合的元素由两种判据共同判断为异常。为了尽可能保证识别异常的准确性,避免疏漏,通过S4083得到最终的识别结果。
S4083:对所述第一异常结果集和所述第二异常结果集取并集,根据所述并集识别所述动态关系网络的结构是否异常。
在S4083,通过对第一异常结果集合U1与第二异常结果集合U2取并集,保证任一判据判断为异常的均提供出来。
步骤409:对所述动态关系网络的结构异常情况进行展示。
在具体实现时,可以通过多种方式将动态关系网络的结构异常情况进行展示。例如,在时间轴上通过增量曲线方式展示各个相邻两个切分时刻的时间网络节点数量、边数量、聚集程度等方面的变化。另外,还可以将判断异常的节点或边强调展示出来。
本申请将网络点边结构和时间结合,能够更好地进行同一网络不同时间下网络结构的变化比对,通过数值更加直观的展示出不同时间下网络变化的差异程度,辅助相关从业人员(用户)有效的进行网络数据分析及处理工作。此外,本申请实施例将图特征和聚类系数相结合,互相结合比对参照,配合分析能够更好地发现网络随着时间推移产生的变化。
基于前述实施例提供的识别动态网络结构异常的方法,相应地,本申请也提供一种识别动态网络结构异常的装置。以下结合实施例和附图对该装置的实现方式进行说明。
装置实施例
参见图7,该图为识别动态网络结构异常的装置的结构示意图。如图7所示,该识别动态网络结构异常的装置700包括:
切分模块701,用于根据预设时间切分间隔将动态关系网络切分为多个时间网络;所述多个时间网络分别对应不同的切分时刻;
度分布计算模块702,用于对于任一时间网络,获得该时间网络的度分布数据;
函数拟合模块703,用于根据该时间网络的度分布数据拟合线性函数;
图特征获取模块704,用于根据所述线性函数得到该时间网络的图特征结果;
网络异常识别模块705,用于利用所述多个时间网络中每个时间网络的图特征结果,识别所述动态关系网络的结构是否异常。
本申请提供的技术方案中,由于依据时间网络的度分布数据进行了线性拟合,并依据线性拟合得到的函数得到图特征结果,实现了对该拟合出的线性函数的量化。以量化表示的图特征结果来识别动态关系网络,相比于单纯依赖动态关系网络中节点和边的变化情况,能够更加准确、高效地识别出网络结构的异常。从而有利于及时基于网络中的异常加以警示,防范风险。
可选地,函数拟合模块703包括:
数据转换单元,用于对该时间网络的度分布数据进行对数转换,得到转换后的数据;
第一拟合单元,用于利用线性回归算法模型和所述转换后的数据进行拟合,得到所述线性函数。
可选地,图特征获取模块704,具体包括:
第一计算单元,用于基于所述线性函数进行残差平方和计算,得到该时间网络的图特征结果。
可选地,网络异常识别模块705,具体包括:
变化结果获取单元,用于利用所述多个时间网络中每个时间网络的图特征结果,获得所有相邻两个切分时刻之间图特征结果的变化结果;
第一识别单元,用于根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值识别所述动态关系网络的结构是否异常。
可选地,所述第一识别单元,具体用于当某相邻两个切分时刻之间图特征结果的变化结果超出所述第一预设参考值时,判断该相邻两个切分时刻之间所述动态关系网络的结构发生异常。
可选地,在一种可能的实现方式中,参见图8所示的另一种识别动态网络结构异常的装置800还可以在装置700的结构基础上进一步包括:
聚类系数计算模块706,用于对于任一时间网络,获得该时间网络的全局聚类系数;
变化结果计算模块707,用于利用所述多个时间网络中每个时间网络的全局聚类系数,获得所有相邻两个切分时刻之间全局聚类系数的变化结果;
所述第一识别单元,具体用于根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值,以及每相邻两个切分时刻之间全局聚类系数的变化结果和第二预设参考值,识别所述动态关系网络的结构是否异常。
可选地,识别动态网络结构异常的装置800中网络异常识别模块705的第一识别单元,具体包括:
第一异常结果集获取子单元,用于当某相邻两个切分时刻之间图特征结果的变化结果超出所述第一预设参考值时,将该相邻两个切分时刻和该相邻两个切分时刻分别对应的时间网络共同作为一个元素列入第一异常结果集;
第二异常结果集获取子单元,用于当某相邻两个切分时刻之间全局聚类系数的变化结果超出所述第二预设参考值时,将该相邻两个切分时刻和该相邻两个切分时刻分别对应的时间网络共同作为一个元素列入第二异常结果集;
异常识别子单元,用于对所述第一异常结果集和所述第二异常结果集取并集,根据所述并集识别所述动态关系网络的结构是否异常。
可选地,识别动态网络结构异常的装置700或800还可以包括:展示模块,用于对所述动态关系网络的结构异常情况进行展示。
本申请将网络点边结构和时间结合,能够更好地进行同一网络不同时间下网络结构的变化比对,通过数值更加直观的展示出不同时间下网络变化的差异程度,辅助相关从业人员(用户)有效的进行网络数据分析及处理工作。此外,本申请实施例将图特征和聚类系数相结合,互相结合比对参照,配合分析能够更好地发现网络随着时间推移产生的变化。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元提示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (16)

1.一种识别动态网络结构异常的方法,其特征在于,包括:
根据预设时间切分间隔将动态关系网络切分为多个时间网络;所述多个时间网络分别对应不同的切分时刻;
对于任一时间网络,获得该时间网络的度分布数据;
根据该时间网络的度分布数据拟合线性函数;
根据所述线性函数得到该时间网络的图特征结果;
利用所述多个时间网络中每个时间网络的图特征结果,识别所述动态关系网络的结构是否异常。
2.根据权利要求1所述的方法,其特征在于,所述根据该时间网络的度分布数据拟合线性函数,具体包括:
对该时间网络的度分布数据进行对数转换,得到转换后的数据;
利用线性回归算法模型和所述转换后的数据进行拟合,得到所述线性函数。
3.根据权利要求1所述的方法,其特征在于,所述根据所述线性函数得到该时间网络的图特征结果,具体包括:
基于所述线性函数进行残差平方和计算,得到该时间网络的图特征结果。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述利用所述多个时间网络中每个时间网络的图特征结果,识别所述动态关系网络的结构是否异常,具体包括:
利用所述多个时间网络中每个时间网络的图特征结果,获得所有相邻两个切分时刻之间图特征结果的变化结果;
根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值识别所述动态关系网络的结构是否异常。
5.根据权利要求4所述的方法,其特征在于,所述根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值识别所述动态关系网络的结构是否异常,具体包括:
当某相邻两个切分时刻之间图特征结果的变化结果超出所述第一预设参考值时,判断该相邻两个切分时刻之间所述动态关系网络的结构发生异常。
6.根据权利要求4所述的方法,其特征在于,还包括:
对于任一时间网络,获得该时间网络的全局聚类系数;
利用所述多个时间网络中每个时间网络的全局聚类系数,获得所有相邻两个切分时刻之间全局聚类系数的变化结果;
所述根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值识别所述动态关系网络的结构是否异常,具体包括:
根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值,以及每相邻两个切分时刻之间全局聚类系数的变化结果和第二预设参考值,识别所述动态关系网络的结构是否异常。
7.根据权利要求6所述的方法,其特征在于,所述根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值,以及每相邻两个切分时刻之间全局聚类系数的变化结果和第二预设参考值,识别所述动态关系网络的结构是否异常,具体包括:
当某相邻两个切分时刻之间图特征结果的变化结果超出所述第一预设参考值时,将该相邻两个切分时刻和该相邻两个切分时刻分别对应的时间网络共同作为一个元素列入第一异常结果集;
当某相邻两个切分时刻之间全局聚类系数的变化结果超出所述第二预设参考值时,将该相邻两个切分时刻和该相邻两个切分时刻分别对应的时间网络共同作为一个元素列入第二异常结果集;
对所述第一异常结果集和所述第二异常结果集取并集,根据所述并集识别所述动态关系网络的结构是否异常。
8.根据权利要求1-3和5-7中任一项所述的方法,其特征在于,还包括:对所述动态关系网络的结构异常情况进行展示。
9.一种识别动态网络结构异常的装置,其特征在于,包括:
切分模块,用于根据预设时间切分间隔将动态关系网络切分为多个时间网络;所述多个时间网络分别对应不同的切分时刻;
度分布计算模块,用于对于任一时间网络,获得该时间网络的度分布数据;
函数拟合模块,用于根据该时间网络的度分布数据拟合线性函数;
图特征获取模块,用于根据所述线性函数得到该时间网络的图特征结果;
网络异常识别模块,用于利用所述多个时间网络中每个时间网络的图特征结果,识别所述动态关系网络的结构是否异常。
10.根据权利要求9所述的装置,其特征在于,所述函数拟合模块包括:
数据转换单元,用于对该时间网络的度分布数据进行对数转换,得到转换后的数据;
第一拟合单元,用于利用线性回归算法模型和所述转换后的数据进行拟合,得到所述线性函数。
11.根据权利要求9所述的装置,其特征在于,所述图特征获取模块,具体包括:
第一计算单元,用于基于所述线性函数进行残差平方和计算,得到该时间网络的图特征结果。
12.根据权利要求9-11任一项所述的装置,其特征在于,所述网络异常识别模块,具体包括:
变化结果获取单元,用于利用所述多个时间网络中每个时间网络的图特征结果,获得所有相邻两个切分时刻之间图特征结果的变化结果;
第一识别单元,用于根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值识别所述动态关系网络的结构是否异常。
13.根据权利要求12所述的装置,其特征在于,所述第一识别单元,具体用于当某相邻两个切分时刻之间图特征结果的变化结果超出所述第一预设参考值时,判断该相邻两个切分时刻之间所述动态关系网络的结构发生异常。
14.根据权利要求12所述的装置,其特征在于,还包括:
聚类系数计算模块,用于对于任一时间网络,获得该时间网络的全局聚类系数;
变化结果计算模块,用于利用所述多个时间网络中每个时间网络的全局聚类系数,获得所有相邻两个切分时刻之间全局聚类系数的变化结果;
所述第一识别单元,具体用于根据每相邻两个切分时刻之间图特征结果的变化结果和第一预设参考值,以及每相邻两个切分时刻之间全局聚类系数的变化结果和第二预设参考值,识别所述动态关系网络的结构是否异常。
15.根据权利要求14所述的装置,其特征在于,所述第一识别单元,具体包括:
第一异常结果集获取子单元,用于当某相邻两个切分时刻之间图特征结果的变化结果超出所述第一预设参考值时,将该相邻两个切分时刻和该相邻两个切分时刻分别对应的时间网络共同作为一个元素列入第一异常结果集;
第二异常结果集获取子单元,用于当某相邻两个切分时刻之间全局聚类系数的变化结果超出所述第二预设参考值时,将该相邻两个切分时刻和该相邻两个切分时刻分别对应的时间网络共同作为一个元素列入第二异常结果集;
异常识别子单元,用于对所述第一异常结果集和所述第二异常结果集取并集,根据所述并集识别所述动态关系网络的结构是否异常。
16.根据权利要求9-11和13-15中任一项所述的装置,其特征在于,还包括:展示模块,用于对所述动态关系网络的结构异常情况进行展示。
CN202010704354.XA 2020-07-21 2020-07-21 一种识别动态网络结构异常的方法及装置 Active CN111817898B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010704354.XA CN111817898B (zh) 2020-07-21 2020-07-21 一种识别动态网络结构异常的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010704354.XA CN111817898B (zh) 2020-07-21 2020-07-21 一种识别动态网络结构异常的方法及装置

Publications (2)

Publication Number Publication Date
CN111817898A true CN111817898A (zh) 2020-10-23
CN111817898B CN111817898B (zh) 2023-04-28

Family

ID=72861462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010704354.XA Active CN111817898B (zh) 2020-07-21 2020-07-21 一种识别动态网络结构异常的方法及装置

Country Status (1)

Country Link
CN (1) CN111817898B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686494A (zh) * 2020-11-25 2021-04-20 国网江苏省电力有限公司营销服务中心 基于线损异常台区的数据拟合方法、装置及智能设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004356915A (ja) * 2003-05-28 2004-12-16 Chiba Inst Of Technology 情報処理システム、情報処理装置、プログラム、及び通信ネットワークにおける通信の異常を検知する方法
US20060047807A1 (en) * 2004-08-25 2006-03-02 Fujitsu Limited Method and system for detecting a network anomaly in a network
CN102810113A (zh) * 2012-06-06 2012-12-05 北京航空航天大学 一种针对复杂网络的混合型聚类方法
US20130163471A1 (en) * 2011-12-27 2013-06-27 Infosys Limited Methods for discovering and analyzing network topologies and devices thereof
US20140325649A1 (en) * 2013-04-29 2014-10-30 Telefonaktiebolaget L M Ericsson (Publ) Method and system to dynamically detect traffic anomalies in a network
US9749406B1 (en) * 2013-03-13 2017-08-29 Hrl Laboratories, Llc System and methods for automated community discovery in networks with multiple relational types
CN110852584A (zh) * 2019-10-30 2020-02-28 北京航空航天大学 一种基于复杂网络分析的风险识别方法
WO2020079681A1 (en) * 2018-10-15 2020-04-23 Netz Forecasts Ltd. Systems and methods for network stabilization prediction
US20200136923A1 (en) * 2018-10-28 2020-04-30 Netz Forecasts Ltd. Systems and methods for prediction of anomalies

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004356915A (ja) * 2003-05-28 2004-12-16 Chiba Inst Of Technology 情報処理システム、情報処理装置、プログラム、及び通信ネットワークにおける通信の異常を検知する方法
US20060047807A1 (en) * 2004-08-25 2006-03-02 Fujitsu Limited Method and system for detecting a network anomaly in a network
US20130163471A1 (en) * 2011-12-27 2013-06-27 Infosys Limited Methods for discovering and analyzing network topologies and devices thereof
CN102810113A (zh) * 2012-06-06 2012-12-05 北京航空航天大学 一种针对复杂网络的混合型聚类方法
US9749406B1 (en) * 2013-03-13 2017-08-29 Hrl Laboratories, Llc System and methods for automated community discovery in networks with multiple relational types
US20140325649A1 (en) * 2013-04-29 2014-10-30 Telefonaktiebolaget L M Ericsson (Publ) Method and system to dynamically detect traffic anomalies in a network
WO2020079681A1 (en) * 2018-10-15 2020-04-23 Netz Forecasts Ltd. Systems and methods for network stabilization prediction
US20200136923A1 (en) * 2018-10-28 2020-04-30 Netz Forecasts Ltd. Systems and methods for prediction of anomalies
CN110852584A (zh) * 2019-10-30 2020-02-28 北京航空航天大学 一种基于复杂网络分析的风险识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
吴斌等: "基于Spark的并行增量动态社团发现算法", 《清华大学学报(自然科学版)》 *
孟啸: "动态复杂网络中的异常检测问题的研究", 《中国优秀硕士论文电子期刊》 *
杨国正;陆余良;朱峰;: "Internet网络拓扑建模方法综述" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686494A (zh) * 2020-11-25 2021-04-20 国网江苏省电力有限公司营销服务中心 基于线损异常台区的数据拟合方法、装置及智能设备
CN112686494B (zh) * 2020-11-25 2024-03-22 国网江苏省电力有限公司营销服务中心 基于线损异常台区的数据拟合方法、装置及智能设备

Also Published As

Publication number Publication date
CN111817898B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
US8630962B2 (en) Error detection method and its system for early detection of errors in a planar or facilities
EP4009590A1 (en) Traffic abnormality detection method, and model training method and apparatus
CN110830450A (zh) 基于统计的异常流量监测方法、装置、设备及存储介质
CN105378714A (zh) 时间序列的快速分组
CN110532119B (zh) 动力系统运行异常点检测方法
CN109459399B (zh) 一种光谱水质cod、浊度检测方法
CN110083507B (zh) 关键性能指标分类方法及装置
CN115796708B (zh) 一种工程建设用的大数据智能质检方法、系统和介质
CN114861788A (zh) 一种基于dbscan聚类的负荷异常检测方法及系统
CN113723861A (zh) 异常用电行为检测方法、装置、计算机设备和存储介质
CN116132263B (zh) 告警解决方案推荐方法、装置、电子设备及存储介质
CN113139880A (zh) 风电机组实际功率曲线拟合方法、装置、设备及存储介质
CN115033463A (zh) 一种系统异常类型确定方法、装置、设备和存储介质
CN111817898A (zh) 一种识别动态网络结构异常的方法及装置
CN103914386B (zh) 基于输入参数特征谱的软件缺陷定位方法
CN113987027A (zh) 一种基于故障预测的设备状态确定方法、装置及介质
Ha et al. Social filtering using social relationship for movie recommendation
CN114138601A (zh) 一种业务告警方法、装置、设备及存储介质
CN113839799B (zh) 一种告警关联规则挖掘方法及装置
CN117193088B (zh) 一种工业设备监控方法、装置以及服务器
Fang et al. A data-driven smooth test of symmetry
CN113708949A (zh) 一种告警根因定位方法及装置
Lee et al. Variable sampling interval cumulative count of conforming chart with runs rules
CN110955811A (zh) 基于朴素贝叶斯算法的电力数据分类方法及系统
CN115018366B (zh) 储能系统工作状态监测方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant