CN110852584B - 一种基于复杂网络分析的风险识别方法 - Google Patents
一种基于复杂网络分析的风险识别方法 Download PDFInfo
- Publication number
- CN110852584B CN110852584B CN201911043034.8A CN201911043034A CN110852584B CN 110852584 B CN110852584 B CN 110852584B CN 201911043034 A CN201911043034 A CN 201911043034A CN 110852584 B CN110852584 B CN 110852584B
- Authority
- CN
- China
- Prior art keywords
- risk
- nodes
- node
- time series
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 102
- 238000003012 network analysis Methods 0.000 title claims abstract description 22
- 238000010801 machine learning Methods 0.000 claims abstract description 14
- 239000013598 vector Substances 0.000 claims description 40
- 230000008569 process Effects 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 13
- 208000027744 congestion Diseases 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 12
- 238000013145 classification model Methods 0.000 claims description 10
- 230000014509 gene expression Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 238000005192 partition Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 206010039203 Road traffic accident Diseases 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000008520 organization Effects 0.000 claims description 3
- 238000012502 risk assessment Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 8
- 230000007547 defect Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于复杂网络分析的风险识别方法,其步骤包括:步骤A:找出所有需要判定风险情况的节点,并对每一个节点建立时间序列特征;步骤B:计算所有节点中每两个点的相关性,并根据相关性的结果建立风险骨干网络,计算网络拓扑特性等指标;步骤C:采用机器学习相关方法,基于上一步骤所得的风险骨干网络特征,对风险事件进行分类预测;通过以上的三个步骤完成基于复杂网络分析的风险识别;该方法的通用性强,客观度高,易于操作,解决了生活中风险难以客观衡量评估的问题。
Description
技术领域
本发明提出了一种基于复杂网络分析的风险识别方法,它涉及风险识别、网络科学等技术领域。
背景技术
风险是指在某一特定环境下,在某一特定时间段内或时间点上,某种损失或不期望结果发生的可能性或不确定性。风险是一种客观存在,并且可以通过采用防范措施防止或降低风险发生导致的损失,却不能消除风险。
风险在生活中各个领域都普遍存在。比如,航海界中渔民出海打渔时有可能遭遇由于天气不佳等原因导致的空猎风险、覆船风险等;而在金融界,投资者购买股票等产品时也存在无法收回本金的风险;即使是普通群众,生活中也可能遭遇灾害带来的风险如地震、洪水、火灾等对人身安全与财产安全造成的损失与侵害。
此外,除上述对单一个体造成的风险外,风险也存在于诸多大型、复杂的系统中,这样的风险相对而言更加难以定位与识别风险因素,例如电力系统、通信网络、交通运输系统、供水系统、金融服务、公共安全等。系统整体与内部构成复杂,关键节点众多,部级连接关系多样,发生在单一节点上的风险能够通过与其他节点的连接与耦合从而进行传播与扩散,形成级联效应,从而为整个系统引入巨大的风险。
由于风险存在的普遍性及其产生的损失给人们的生活甚至社会运行都带来了巨大的影响,因此采用科学的、合理的方法对风险进行准确的评估与判断是十分必要的,尤其是针对上述系统性风险的评估。在风险识别过程中,可以采用多种操作方法,包括基于知识(Knowledge-based)的分析方法、基于模型(Model-based)的分析方法、定性分析和定量分析等。对于非单一节点的系统,充分理解和深入研究系统中各节点之间的连接关系、根据针对关键节点的风险进行度量是实现系统风险识别的重中之重。根据系统的风险划分需求,首先需确定出需要进行分析的各个节点,而如何刻画各节点之间在系统中的连接关系,成为了本发明的重点。
以往无论是基于流行性疾病的风险扩散分析、基于网络拓扑结构的风险传播阈分析还是基于级联失效的风险传播过程分析,都较少将系统在各个时段或时点上的特征进行关联与对比分析,因此上述方法虽然能够针对系统风险进行定量或定性的评估,却是缺少时间动态性特征的。而已有研究表明,系统的风险传播过程在时间上存在相关性,某些节点的风险属性在时间领域中的传播影响亦不容小觑。
本发明首先根据某系统的风险情况判定需求,确定需要判定风险的种类并命名,随后根据该风险的需求确定系统中所有需要判断风险情况的节点,并提取节点的时间序列特征以及确定各个节点的风险变化周期,得到一个最小的公共周期,随即提取基于该公共周期的节点时间序列特征。接着,本发明根据已提取出的时间序列特征,对各节点之间的相似性进行计算,并根据系统的实际情况与该风险的相应情况进行相似性阈值确定,之后将相似性大于阈值的两节点进行连边,建立针对某风险的风险骨干网络,计算网络拓扑特性等指标,最后应用机器学习方法,基于风险网络特征,对某风险进行风险事件分类预测,对该系统中此风险网络所描述的风险及其风险事件进行识别与评价。
本专利通过引入时间序列特征进行节点的相关性计算与分析,考虑到风险传播的时延性,能够评估各个系统节点的时序风险大小,具有较好的通用性及创新性。基于以上的方法基础及现实的意义提出了一种基于复杂网络分析的风险识别方法。
发明内容
(一)发明的目的
本发明主要用于解决在复杂系统与网络结构背景下的风险识别问题,现有的方法大多是使用基于流行性疾病的风险扩散分析、基于网络拓扑结构的风险传播阈分析以及基于级联失效的风险传播过程分析,而这些方法都未将系统在各个时段或时点上的特征进行关联与对比分析,缺少时间动态性特征。因此针对于现有方法的不足,本专利提出了一种基于复杂网络分析的风险识别方法。
通过使用该方法实现在非单一部件、非单一节点系统中的风险网络构建与风险识别,将系统单元/节点的时间序列特征通过合理移动与统一从而加入风险识别方法中,进而能够实现针对节点的时序风险网络分析,发现风险网络关键节点,从而为后续的风险传播抑制与阻断手段提供信息支持。
(二)技术方案
为了实现上述目的,本发明的方法所采用的技术方案是:一种基于复杂网络分析的风险识别方法。
本发明所述的一种基于复杂网络分析的风险识别方法是一种应用复杂网络建模的思想,将风险根据其互相间的相关性的强弱建立网络,并随后应用网络的思想及理论对风险指标进行度量评估。
本发明所述的“一种基于复杂网络分析的风险识别方法”,其步骤如下:
步骤A:找出所有需要判定风险情况的节点,并对每一个节点建立时间序列特征;
步骤B:计算所有节点中每两个点的相关性,并根据相关性的结果建立风险骨干网络,计算网络拓扑特性等指标;
步骤C:采用机器学习相关方法,基于上一步骤所得的风险骨干网络特征,对风险事件进行分类预测;
通过以上步骤,可以实现基于复杂网络分析的风险识别的目的,该方法的通用性强,客观度高,易于操作,解决了生活中风险难以客观衡量评估的问题。
其中,步骤A中所述的“找出所有需要判定风险情况的节点,并对每一个节点建立时间序列特征”,其做法如下:首先确定需要判定风险的种类,并将该风险命名需判定风险(即risk风险);根据risk风险分析的需求确定出所有需要判断风险情况的节点个数m,并对这些节点分别命名为n1,n2,...,nm,提取所有节点的risk风险随时间变动的信息,并依据这些信息确定出每一个节点的risk风险的时间序列特征(即time_seriei),分别命名为time_serie1,time_serie2,...,time_seriem,
以上所述过程的具体步骤如下:
步骤A1:根据risk风险的需求,确定出于该风险有关系或者需要进行该风险判定的所有节点的个数,并将这些节点分别命名为n1,n2,...,nm,其中ni表示的是第i个节点的名称(time_seriei表示的是第i个节点的时间序列特征),后续的表达也将延续该表达方式;
步骤A2:根据所有节点的risk风险随时间变化的情况确定出每一个节点的risk风险变化周期(即Ti),分别为T1,T2,...,Tm,根据每一个节点周期的不同,求出最小的公共周期(即Tcommon);
(对于一般的风险相关的节点极有可能出现T1=T2=...=Tm=Tcommon的情况);
步骤A3:针对于节点ni,针对于周期Ti及该节点的risk风险随时间变动的信息,得到周期Ti内的时间序列特征;
步骤A4:计算公共周期Tcommon与节点ni的周期Ti的关系,将节点ni的在周期Ti内的时间序列特征重复放置到公共周期Tcommon内,得到节点ni周期Tcommon内的时间序列特征t-characteri;
步骤A5:针对于所有节点重复步骤A3、A4,直到完成所有节点的时间序列特征的提取。
其中,步骤B中所述的“计算在该风险识别情景下所有节点中每两个点的相关性,根据相关性的结果建立风险骨干网络,计算网络拓扑特性等指标”,其做法如下:首先对于所有的节点中遍历抽取两个节点,并将其对应的时间序列特征进行相似性计算,随后根据所有节点之间的相似性值的情况确定阈值,将两点之间的相似性系数大于阈值的建立两个节点之间的连边,通过遍历完成了risk风险骨干网络的建立,随后计算风险骨干网络的属性;以上所述过程的具体步骤如下:
步骤B2:针对于每一个节点的时间序列特征t-characteri,根据公共周期Tcommon分段的情况,分别计算risk风险在每一个分段中风险的平均值,并将该平均值作为该分段的特征值,于是可以得到数组(averagei1,averagei2,...,averageiw)作为节点ni的时间序列分段特征向量,并命名为characteri,遍历所有节点可以得到所有节点的时间序列分段特征向量;
步骤B3:从所有的节点中提取出两个节点nx与ny以及与之对应的时间序列分段特征向量characterx与charactery;
步骤B4:利用皮尔逊系数的计算方法计算节点nx与ny的时间序列分段特征向量characterx与charactery,并将结果记录为sim_0x,y(由于皮尔逊系数的计算方法是常用计算相似性的方法,因此不针对该方法的计算过程进行详细说明);
步骤B5:由于针对不同节点之间的风险传递可能会存在时延,因此针对于该问题,对于节点nx与ny的时间序列分段特征向量characterx与charactery计算相似度的过程中也需要考虑这样的问题;保持节点nx的时间序列分段特征向量characterx不变,将ny的时间序列分段特征向量charactery逐次循环后移I个元素,随后得到ny移动后的时间序列分段特征向量character_Iy(该过程是将向量charactery的第I个元素之后的所有元素向前移动I,将前I个元素向后移动w-I得到新的向量为character_Iy)。从1到w逐个遍历得到节点ny移动后的时间序列分段特征向量character_Iy;
步骤B6:将节点nx的时间序列分段特征向量characterx与ny移动I单位时间序列分段特征向量character_Iy进行皮尔逊系数的求解,并将结果表示为sim_Ix,y;依据以上过程从1到w逐个遍历,得到不同的移动情况下的两节点的相似系数,比较所得的节点nx与ny的所有相似性指数(包括sim_0x,y和sim_Ix,y)的大小,选出最大的值max_sim_Ix,y及其对应的移动值;
步骤B7:遍历所有节点中的两两节点的组合(区分顺序),重复步骤B3-B6,得到所有两两节点的最大相关系数max_sim_Ii,j;
步骤B8:设定相关性阈值thresholdcor,将所有的节点间相似性的最大值max_sim_Ii,j中大于阈值thresholdcor的建立节点ni与节点nj的有向连边,遍历所有节点组合的相关性情况,完成risk风险的骨干网络建立;
步骤B9:对risk风险的骨干网络计算其平均路径长度(即average_path_length)、聚类系数(即clustering_coefficient)、度分布(即degree_distribution)等风险网络特征;
其中,步骤C中所述的“采用机器学习相关方法,基于上一步骤所得的风险骨干网络特征,对风险事件进行分类预测”,其具体做法如下:首先根据上一步骤计算所得风险骨干网络结构特征情况划分风险阈值,随后依据这些指标将不同的但不仅限于:交通网络中可能造成拥堵风险的交通事故进行风险的分类预测,以上所述过程的具体步骤如下:
步骤C1:分别设定平均路径长度指标的风险事件划分阈值(即thresholdaverage_path_length)、聚类系数指标的风险事件划分阈值(即thresholdclustering_coefficient)、度分布指标的风险事件划分阈值(即thresholddegree_distribution)等,判定该risk风险的骨干网络的平均路径长度average_path_length、聚类系数clustering_coefficient及度分布degree_distribution是否符合风险事件划分阈值标准,其中该risk风险例如但不仅限于交通复杂网络中的拥堵风险;
步骤C2:基于上述结构特征指标,构建risk风险骨干网络风险事件分类指标(即risk_category)
risk_category=F(a1,a2,a3,…,average_path_length,clustering_coefficient,degree_distribution) (1)
其中a1,a2,a3,……为参数,针对不同的复杂网络,参数的取值与定义可作相应调整,(例如但不仅限于:交通网络中a1,a2,a3,……可分别取“交通信号灯数量”,“路段数量”,“路段流量平均速度”,……)根据实际risk风险可能出现的情况,将风险事件分类指标risk_category划定为不同的类别,(例如但不仅限于交通网络拥堵风险事件可被划分为轻度、中度、重度三类拥堵情况)通过该指标可判定此risk风险整体属于何种组织结构,并对该risk风险进行相应的类别划分。
步骤C3:将风险骨干网络的特征划分测试集与训练集,输入采用的具体机器学习分类模型(包括但不仅限于聚类方法),根据risk_category的数量设定分类类目数量(例如但不仅限于交通网络拥堵风险事件可被划分为轻度、中度、重度三类拥堵情况),随后对该机器学习分类模型进行模型训练集的拟合、分类模型的参数调整与模型效果验证评估,最后输出对上述特征描述的risk风险(例如但不仅限于交通网络拥堵风险)进行分类预测结果。
(三)优点创新
本发明具有如下的创新点:
1、通用性强:本专利并不是针对于某一个特定的系统进行的基于复杂网络分析的风险识别方法,而是一种对于各类系统通用的基于复杂网络分析的风险识别方法,因此具有较好的通用性。
2、可移植性好:本专利并没有指定系统节点的时间序列特征内容以及各个时间序列特征与公共时间周期的关系计算方式,因此在具体的不同系统中可以根据实际情况的需要进行特征的删减与计算方法的调整,因此具有很好的可移植性。
3、客观性强:本专利通过引入时间序列的风险特征,提升了该方法的适用性,能够更加客观的进行风险识别。
4、系统性强:本专利是站在整体系统的角度上进行的基于网络方法的风险识别,因此能够把握全局信息的变化,同时发现对于系统全局风险情况具有重要影响的节点,具有良好的系统性。
综上,这种基于复杂网络分析的风险识别方法能够结合时间相关的风险因素与变化,更好地发现系统中的高风险节点,能够弥补现有方法的不足。
附图说明
图1是本发明所述方法框架流程图。
具体实施方式
为使本发明要解决的技术问题、技术方案更加清楚,下面将结合附图及具体实施案例进行详细描述。应当理解,此处所描述的实施实例仅用于说明和解释本发明,并不用于限定本发明。
本发明的目的在于解决在复杂系统与网络结构背景下的风险识别问题,现有的方法很少从去全局系统的角度考虑风险识别的问题,评估的方法在局部的评估效果较好,但是对于全局风险的评估对于经验的要求比较高,当全局分割解耦方法较好时得到的风险识别结果也相对较好,一旦出现解耦效率较低的情况时传统方法对于风险识别的方法短板就成为了致命的缺陷。因此基于现有方法的不足,本专利从全局系统的角度出发,实现基于复杂网络分析的风险识别。该方法拥有通用性强、可移植性好、客观性强、系统性强等特点。下面结合附图说明及具体实施方式对本发明进一步说明。
本发明实施例以某风险识别情景为例,阐述本发明方法。
为了实现上述目的,本发明的方法所采用的技术方案是:一种基于复杂网络分析的风险识别方法。
本发明所述的“一种基于复杂网络分析的风险识别方法”,该方法框架流程图如图1所示,其具体步骤如下:
步骤A:找出在该风险识别情景下所有需要判定风险情况的节点,并对每一个节点建立时间序列特征;
步骤B:计算在该风险识别情景下所有节点中每两个点的相关性,并根据相关性的结果建立风险骨干网络,计算该风险骨干网络的拓扑特性等指标;
步骤C:采用机器学习相关方法,基于风险骨干网络特征,对风险事件进行分类预测;
通过以上步骤,可以实现基于复杂网络分析的风险识别的目的,该方法的通用性强,客观度高,易于操作,解决了生活中风险难以客观衡量评估的问题。
其中,步骤A中所述的“找出在该风险识别情景下所有需要判定风险情况的节点,并对每一个节点建立时间序列特征”,其做法如下:首先确定需要判定风险的种类,并将该风险命名为risk风险。根据risk风险分析的需求确定出所有需要判断风险情况的节点个数m,并对这些节点分别命名为n1,n2,...,nm,提取所有节点的risk风险随时间变动的信息,并依据这些信息确定出每一个节点的risk风险的时间序列特征,分别命名为time_serie1,time_serie2,...,time_seriem,以上所述过程的具体步骤如下:
步骤A1:根据risk风险的需求,确定出于该风险有关系或者需要进行该风险判定的所有节点的个数,并将这些节点分别命名为n1,n2,...,nm,其中ni表示的是第i个节点的名称(time_seriei表示的是第i个节点的时间序列特征),后续的表达也将延续该表达方式;
步骤A2:根据所有节点的risk风险随时间变化的情况确定出每一个节点的risk风险变化周期,分别为T1,T2,...,Tm,根据每一个节点周期的不同,求出最小的公共周期Tcommon(对于一般的风险相关的节点极有可能出现T1=T2=...=Tm=Tcommon的情况);
步骤A3:针对于节点ni,针对于周期Ti及该节点的risk风险随时间变动的信息,得到周期Ti内的时间序列特征;
步骤A4:计算公共周期Tcommon与节点ni的周期Ti的关系,将节点ni的在周期Ti内的时间序列特征重复放置到公共周期Tcommon内,得到节点ni周期Tcommon内的时间序列特征t-characteri;
步骤A5:针对于所有节点重复步骤A3、A4,直到完成所有节点的时间序列特征的提取。
其中,步骤B中所述的“计算在该风险识别情景下所有节点中每两个点的相关性,根据相关性的结果建立风险骨干网络,计算网络拓扑特性等指标”,其做法如下:首先对于所有的节点中遍历抽取两个节点,并将其对应的时间序列特征进行相似性计算,随后根据所有节点之间的相似性值的情况确定阈值,将两点之间的相似性系数大于阈值的建立两个节点之间的连边,通过遍历完成了risk风险骨干网络的建立,随后计算风险骨干网络的属性;以上所述过程的具体步骤如下:
步骤B2:针对于每一个节点的时间序列特征t-characteri,根据公共周期Tcommon分段的情况,分别计算risk风险在每一个分段中风险的平均值,并将该平均值作为该分段的特征值,于是可以得到数组(averagei1,averagei2,...,averageiw)作为节点ni的时间序列分段特征向量,并命名为characteri,遍历所有节点可以得到所有节点的时间序列分段特征向量;
步骤B3:从所有的节点中提取出两个节点nx与ny以及与之对应的时间序列分段特征向量characterx与charactery;
步骤B4:利用皮尔逊系数的计算方法计算节点nx与ny的时间序列分段特征向量characterx与charactery,并将结果记录为sim_0x,y(由于皮尔逊系数的计算方法是常用计算相似性的方法,因此不针对该方法的计算过程进行详细说明);
步骤B5:由于针对不同节点之间的风险传递可能会存在时延,因此针对于该问题,对于节点nx与ny的时间序列分段特征向量characterx与charactery计算相似度的过程中也需要考虑这样的问题;保持节点nx的时间序列分段特征向量characterx不变,将ny的时间序列分段特征向量charactery逐次循环后移I个元素,随后得到ny移动后的时间序列分段特征向量character_Iy(该过程是将向量charactery的第I个元素之后的所有元素向前移动I,将前I个元素向后移动w-I得到新的向量为character_Iy)。从1到w逐个遍历得到节点ny移动后的时间序列分段特征向量character_Iy;
步骤B6:将节点nx的时间序列分段特征向量characterx与ny移动I单位时间序列分段特征向量character_Iy进行皮尔逊系数的求解,并将结果表示为sim_Ix,y。依据以上过程从1到w逐个遍历,得到不同的移动情况下的两节点的相似系数,比较所得的节点nx与ny的所有相似性指数(包括sim_0x,y和sim_Ix,y)的大小,选出最大的值max_sim_Ix,y及其对应的移动值;
步骤B7:遍历所有节点中的两两节点的组合(区分顺序),重复步骤B3-B6,得到所有两两节点的最大相关系数max_sim_Ii,j;
步骤B8:设定相关性阈值thresholdcor,将所有的节点间相似性的最大值max_sim_Ii,j中大于阈值thresholdcor的建立节点ni与节点nj的有向连边,遍历所有节点组合的相关性情况,完成risk风险的骨干网络建立;
步骤B9:对risk风险的骨干网络计算其平均路径长度(即average_path_length)、聚类系数(即clustering_coefficient)、度分布(即degree_distribution)等风险网络特征;
其中,步骤C中所述的“采用机器学习相关方法,基于风险骨干网络特征,对风险事件进行分类预测”,其具体做法如下:首先根据上一步骤计算所得风险骨干网络结构特征情况划分风险阈值,随后依据这些指标将不同的但不仅限于:交通网络中可能造成拥堵风险的交通事故进行风险的分类预测,以上所述过程的具体步骤如下:
步骤C1:分别设定平均路径长度指标的风险事件划分阈值(即thresholdaverage_path_length)、聚类系数指标的风险事件划分阈值(即thresholdclustering_coefficient)、度分布指标的风险事件划分阈值(即thresholddegree_distribution)等,判定该risk风险的骨干网络的平均路径长度average_path_length、聚类系数clustering_coefficient及度分布degree_distribution是否符合风险事件划分阈值标准,其中该risk风险例如但不仅限于交通复杂网络中的拥堵风险;
步骤C2:基于上述结构特征指标,构建risk风险骨干网络风险事件分类指标(即risk_category)
risk_category=F(a1,a2,a3,…,average_path_length,clustering_coefficient,degree_distribution) (1)
其中a1,a2,a3,……为参数,针对不同的复杂网络,参数的取值与定义可作相应调整,(例如但不仅限于:交通网络中a1,a2,a3,……可分别取“交通信号灯数量”,“路段数量”,“路段流量平均速度”,……)根据实际risk风险可能出现的情况,将风险事件分类指标risk_category划定为不同的类别,(例如但不仅限于交通网络拥堵风险事件可被划分为轻度、中度、重度三类拥堵情况)通过该指标可判定此risk风险整体属于何种组织结构,并对该risk风险进行相应的类别划分。
步骤C3:将风险骨干网络的特征划分测试集与训练集,输入采用的具体机器学习分类模型(包括但不仅限于聚类方法),根据risk_category的数量设定分类类目数量(例如但不仅限于交通网络拥堵风险事件可被划分为轻度、中度、重度三类拥堵情况),随后对该机器学习分类模型进行模型训练集的拟合、分类模型的参数调整与模型效果验证评估,最后输出对上述特征描述的risk风险(例如但不仅限于交通网络拥堵风险)进行分类预测结果。
Claims (3)
1.一种基于复杂网络分析的风险识别方法,其特征在于:其步骤如下:
步骤A:找出所有需要判定风险情况的节点,并对每一个节点建立时间序列特征;确定需要判定风险的种类,并将该风险命名需判定风险即risk风险;
步骤B:计算所有节点中每两个点的相关性,并根据相关性的结果建立风险骨干网络,计算网络拓扑特性等指标;
步骤C:采用机器学习相关方法,基于上一步骤所得的风险骨干网络特征,对风险事件进行分类预测;
其中,在步骤C中所述的“采用机器学习相关方法,基于上一步骤所得的风险骨干网络特征,对风险事件进行分类预测”,首先根据上一步骤计算所得风险骨干网络结构特征情况划分风险阈值,随后依据这些指标将不同的交通网络中可能造成拥堵风险的交通事故进行风险的分类预测,以上所述过程的具体步骤如下:
步骤C1:分别设定平均路径长度指标的风险事件划分阈值即thresholdaverage_path_length、聚类系数指标的风险事件划分阈值即thresholdclustering_coefficient、度分布指标的风险事件划分阈值即thresholddegree_distribution,判定该risk风险的骨干网络的平均路径长度average_path_length、聚类系数clustering_coefficient及度分布degree_distribution是否符合风险事件划分阈值标准;
步骤C2:基于上述结构特征指标,构建risk风险骨干网络风险事件分类指标即risk_category;
risk_category=F(a1,a2,a3,…,average_path_length,clustering_coefficient,degree_distribution)
(1)
其中a1,a2,a3,……为参数,针对不同的复杂网络,参数的取值与定义作相应调整,交通网络中a1,a2,a3,……分别取“交通信号灯数量”,“路段数量”,“路段流量平均速度”;根据实际risk风险出现的情况,将风险事件分类指标risk_category划定为不同的类别,交通网络拥堵风险事件可被划分为轻度、中度、重度三类拥堵情况,通过该指标能判定此risk风险整体属于何种组织结构,并对该risk风险进行相应的类别划分;
步骤C3:将风险骨干网络的特征划分测试集与训练集,输入采用的具体机器学习分类模型,根据risk_category的数量设定分类类目数量,交通网络拥堵风险事件被划分为轻度、中度、重度三类拥堵情况,随后对该机器学习分类模型进行模型训练集的拟合、分类模型的参数调整与模型效果验证评估,最后输出对上述特征描述的risk风险,进行分类预测结果。
2.根据权利要求1所述的一种基于复杂网络分析的风险识别方法,其特征在于:在步骤A中所述的“找出所有需要判定风险情况的节点,并对每一个节点建立时间序列特征”,其做法如下:根据risk风险分析的需求确定出所有需要判断风险情况的节点个数m,并对这些节点分别命名为n1,n2,...,nm,提取所有节点的risk风险随时间变动的信息,并依据这些信息确定出每一个节点的risk风险的时间序列特征即time_seriei,分别命名为time_serie1,time_serie2,...,time_seriem,以上所述过程的具体步骤如下:
步骤A1:根据risk风险的需求,确定出于该风险有关系及需要进行该风险判定的所有节点的个数,并将这些节点分别命名为n1,n2,...,nm,其中ni表示的是第i个节点的名称,后续的表达也将延续该表达方式;
步骤A2:根据所有节点的risk风险随时间变化的情况确定出每一个节点的risk风险变化周期即Ti,分别为T1,T2,...,Tm,根据每一个节点周期的不同,求出最小的公共周期即Tcommon;
步骤A3:针对于节点ni,针对于周期Ti及该节点的risk风险随时间变动的信息,得到周期Ti内的时间序列特征;
步骤A4:计算公共周期Tcommon与节点ni的周期Ti的关系,将节点ni的在周期Ti内的时间序列特征重复放置到公共周期Tcommon内,得到节点ni周期Tcommon内的时间序列特征t-characteri;
步骤A5:针对于所有节点重复步骤A3、A4,直到完成所有节点的时间序列特征的提取。
3.根据权利要求1所述的一种基于复杂网络分析的风险识别方法,其特征在于:在步骤B中所述的“计算所有节点中每两个点的相关性,并根据相关性的结果建立风险骨干网络,计算网络拓扑特性等指标”,其做法如下:首先对于所有的节点中遍历抽取两个节点,并将其对应的时间序列特征进行相似性计算,随后根据所有节点之间的相似性值的情况确定阈值,将两点之间的相似性系数大于阈值的建立两个节点之间的连边,最后通过遍历完成了risk风险骨干网络的建立,随后计算风险骨干网络的属性;以上所述过程的具体步骤如下:
步骤B2:针对于每一个节点的时间序列特征即t-characteri,根据公共周期Tcommon分段的情况,分别计算risk风险在每一个分段中风险的平均值,并将该平均值作为该分段的特征值,于是能得到数组即(averagei1,averagei2,...,averageiw)作为节点ni的时间序列分段特征向量即characteri,遍历所有节点能得到所有节点的时间序列分段特征向量;
步骤B3:从所有的节点中提取出两个节点nx与ny以及与之对应的时间序列分段特征向量characterx与charactery;
步骤B4:利用皮尔逊系数的计算方法计算节点nx与ny的时间序列分段特征向量characterx与charactery,并将结果记录为节点nx与ny的时间序列分段特征向量characterx与charactery的相似性即sim_0x,y;
步骤B5:由于针对不同节点之间的风险传递有可能会存在时延,因此针对于该问题,对于节点nx与ny的时间序列分段特征向量characterx与charactery计算相似度的过程中也需要考虑这样的问题;保持节点nx的时间序列分段特征向量characterx不变,将ny的时间序列分段特征向量charactery逐次循环后移I个元素,随后得到ny移动后的时间序列分段特征向量character_Iy,该过程是将向量charactery的第I个元素之后的所有元素向前移动I,将前I个元素向后移动w-I得到新的向量为character_Iy;从1到w逐个遍历得到节点ny移动后的时间序列分段特征向量character_Iy;
步骤B6:将节点nx的时间序列分段特征向量characterx与ny移动I单位时间序列分段特征向量即character_Iy进行皮尔逊系数的求解,并将结果表示为sim_Ix,y;依据以上过程从1到w逐个遍历,得到不同的移动情况下的两节点的相似系数,比较所得的节点nx与ny的所有相似性指数sim_0x,y和sim_Ix,y的大小,选出最大的值max_sim_Ix,y及其对应的移动值;
步骤B7:遍历所有节点中的两两节点的组合,重复步骤B3-B6,得到所有两两节点的最大相关系数max_sim_Ii,j;
步骤B8:设定相关性阈值thresholdcor,将所有的节点间相似性的最大值max_sim_Ii,j中大于阈值thresholdcor的建立节点ni与节点nj的有向连边,遍历所有节点组合的相关性情况,完成risk风险的骨干网络建立;
步骤B9:对risk风险的骨干网络计算其平均路径长度,即average_path_length、聚类系数即clustering_coefficient和度分布即degree_distribution风险网络特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911043034.8A CN110852584B (zh) | 2019-10-30 | 2019-10-30 | 一种基于复杂网络分析的风险识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911043034.8A CN110852584B (zh) | 2019-10-30 | 2019-10-30 | 一种基于复杂网络分析的风险识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110852584A CN110852584A (zh) | 2020-02-28 |
CN110852584B true CN110852584B (zh) | 2022-06-10 |
Family
ID=69598394
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911043034.8A Active CN110852584B (zh) | 2019-10-30 | 2019-10-30 | 一种基于复杂网络分析的风险识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110852584B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401775A (zh) * | 2020-03-27 | 2020-07-10 | 深圳壹账通智能科技有限公司 | 复杂关系网络的信息分析方法、装置、设备及存储介质 |
CN111598408B (zh) * | 2020-04-23 | 2023-04-18 | 成都数之联科技股份有限公司 | 一种贸易信息风险预警模型的构建方法及应用 |
CN111724250A (zh) * | 2020-06-29 | 2020-09-29 | 深圳壹账通智能科技有限公司 | 风险传播的确定方法、装置、计算机系统及可读存储介质 |
CN111817898B (zh) * | 2020-07-21 | 2023-04-28 | 致诚阿福技术发展(北京)有限公司 | 一种识别动态网络结构异常的方法及装置 |
CN112989374B (zh) * | 2021-03-09 | 2021-11-26 | 闪捷信息科技有限公司 | 基于复杂网络分析的数据安全风险识别方法及装置 |
CN112801798A (zh) * | 2021-04-08 | 2021-05-14 | 成都数联铭品科技有限公司 | 关联网络的影响传播分析和模式识别方法、系统、设备 |
CN113780827A (zh) * | 2021-09-14 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 一种物品筛选方法、装置、电子设备及计算机可读介质 |
CN113947248B (zh) * | 2021-10-21 | 2024-05-31 | 广东电网有限责任公司广州供电局 | 一种电缆受潮老化跳闸的风险预测方法和相关装置 |
CN114187783B (zh) * | 2021-12-06 | 2023-10-31 | 中国民航大学 | 一种用于机场飞行区潜在冲突分析预测的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105608896A (zh) * | 2016-03-14 | 2016-05-25 | 西安电子科技大学 | 城市交通网络中的交通瓶颈识别方法 |
CN108320506A (zh) * | 2018-02-05 | 2018-07-24 | 青岛大学 | 一种基于复合网络的拥堵时段的发现方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2950294B1 (en) * | 2014-05-30 | 2019-05-08 | Honda Research Institute Europe GmbH | Method and vehicle with an advanced driver assistance system for risk-based traffic scene analysis |
-
2019
- 2019-10-30 CN CN201911043034.8A patent/CN110852584B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105608896A (zh) * | 2016-03-14 | 2016-05-25 | 西安电子科技大学 | 城市交通网络中的交通瓶颈识别方法 |
CN108320506A (zh) * | 2018-02-05 | 2018-07-24 | 青岛大学 | 一种基于复合网络的拥堵时段的发现方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110852584A (zh) | 2020-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110852584B (zh) | 一种基于复杂网络分析的风险识别方法 | |
CN111124840B (zh) | 业务运维中告警的预测方法、装置与电子设备 | |
CN108520357B (zh) | 一种线损异常原因的判别方法、装置及服务器 | |
CN111309824A (zh) | 实体关系图谱显示方法及系统 | |
CN113032238B (zh) | 基于应用知识图谱的实时根因分析方法 | |
CN114495507B (zh) | 融合时空注意力神经网络和交通模型的交通流预测方法 | |
CN105721228A (zh) | 基于快速密度聚类的电力通信网节点重要性评估方法 | |
CN108647691A (zh) | 一种基于点击特征预测的图像分类方法 | |
CN113283581B (zh) | 多融合图网络协同多通道注意力模型及其应用和应用方法 | |
CN104052612A (zh) | 一种电信业务的故障识别与定位的方法及系统 | |
US20220092433A1 (en) | Training method and device for generative adversarial network model, equipment, program and storage medium | |
CN113486337B (zh) | 一种基于粒子群算法的网络安全态势要素识别系统和方法 | |
CN111294812A (zh) | 一种资源扩容规划的方法及系统 | |
CN113037783A (zh) | 一种异常行为检测方法及系统 | |
CN112562312A (zh) | 一种基于融合特征的GraphSAGE交通路网数据预测的方法 | |
CN114142923A (zh) | 光缆故障定位方法、装置、设备及可读介质 | |
Zhang et al. | An improved composite hypothesis test for Markov models with applications in network anomaly detection | |
CN111475566A (zh) | 一种区块链资金可疑交易模式的识别方法及装置 | |
CN114245329B (zh) | 通行方式识别方法、装置、设备及存储介质 | |
CN115643153A (zh) | 基于图神经网络的报警关联分析方法 | |
CN115720212A (zh) | 一种基于多源数据融合的网络流量预测及自动优化均衡方法 | |
CN109614742A (zh) | 一种海面高度持续性预测算法 | |
CN111343664A (zh) | 用户定位方法、装置、设备及介质 | |
CN115310682A (zh) | 复杂水域船舶交通划分方法、装置、设备和介质 | |
CN115222196A (zh) | 一种山区道路网脆弱性评估与驱动力探测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |