CN112989526B - 一种基于核极限学习机的航空网络关键节点识别方法 - Google Patents

一种基于核极限学习机的航空网络关键节点识别方法 Download PDF

Info

Publication number
CN112989526B
CN112989526B CN202110064777.4A CN202110064777A CN112989526B CN 112989526 B CN112989526 B CN 112989526B CN 202110064777 A CN202110064777 A CN 202110064777A CN 112989526 B CN112989526 B CN 112989526B
Authority
CN
China
Prior art keywords
node
nodes
network
value
kernel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110064777.4A
Other languages
English (en)
Other versions
CN112989526A (zh
Inventor
甘旭升
杨任农
孙静娟
李双峰
屈虹
孟祥伟
杨丽薇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Air Force Engineering University of PLA
Original Assignee
Air Force Engineering University of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Air Force Engineering University of PLA filed Critical Air Force Engineering University of PLA
Priority to CN202110064777.4A priority Critical patent/CN112989526B/zh
Publication of CN112989526A publication Critical patent/CN112989526A/zh
Application granted granted Critical
Publication of CN112989526B publication Critical patent/CN112989526B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/18Network design, e.g. design based on topological or interconnect aspects of utility systems, piping, heating ventilation air conditioning [HVAC] or cabling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/02CAD in a network environment, e.g. collaborative CAD or distributed simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)

Abstract

本发明公开了一种基于核极限学习机的航空网络关键节点识别方法,构造训练样本:从航空网络中随机生成部分节点,计算节点度值、点强和K‑shell值共三个简单节点指标值;同时,确定节点的接近中心性、介数中心性、网络连接密度和网络效率共四个复杂指标;确定综合重要度:通过层次分析法计算得出四个复杂指标的权重,然后通过四个复杂指标的权重计算以上随机生成部分节点的综合重要度值;训练核极限学习机KELM评估模型:以节点度值、点强和K‑shell值为输入,以由复杂指标计算出的综合重要度值为输出,训练核极限学习机KELM学习简单节点指标与综合重要度值的映射关系,从而获得核极限学习机KELM评估模型。本发明提高了节点排序的准确性,降低计算复杂度。

Description

一种基于核极限学习机的航空网络关键节点识别方法
技术领域
本发明涉及航空网络关键节点识别领域,特别是一种基于核极限学习机的航空网络关键节点识别方法。
背景技术
随着国际国内机场、航路航线数量的指数式爆炸增长,以城市机场为节点、航线为连边的航空网络逐渐形成。航空网络的发展水平反映了国家的社会和经济状况,是国家实力的一种象征。在平时,航空网络为社会各产业提供了交流和输出平台,促进了经济发展。在战时,航空网络担负着战斗物资转移与战斗支援任务,直接影响战争进程。
当前,辨识航空网络关键节点的理论研究已成为热点。以往的关键节点辨识方法存在不足主要体现在两个方面:其一,重视网络拓扑性质及其节点相互关系,而没有考量网络边权。例如,Corley等通过研究删除节点后的最短路径来评估删除节点的重要性;Daniel等比较了接近中心性、介数中心性和度数中心性指标,并引入博弈论评估了网络节点的重要性;He等根据节点度、效率研究了复杂网络节点的重要排序问题;谭跃进等在定义凝聚度基础上提出了一种评估节点重要度的节点收缩方法,将收缩后网络凝聚度最大的节点视为最重要节点。这些研究主要适用于不带权网络,但基本没有考虑航空网络中航线流量的影响。其二,方法过于单一,一般仅考虑节点的某一性质。例如,谢凤宏等根据复杂网络的关键节点辨识算法的缺点,提出了一种基于加权聚类系数的复杂网络节点重要度排序方法;Chen等根据每种中心性度量自身缺点,将几种不同的中心性度量多属性,并采用层次分析法对多属性进行聚合,得到各节点的影响评估值。王建伟等依据网络中节点的局域特征,提出了一种基于近邻节点度节点重要性的度量方法。这些研究简便高效,不足之处是,机场节点的重要性影响因素过于复杂,仅考虑个别性质往往难以获得准确结论。为了解决这两个问题,本文提出了用接近中心度(CC)、介数(BC)、网络连接密度(LD)以及网络效率(NE)来综合衡量节点的重要性,其中,网络连接密度涉及边权即航线流量。但是,航空网络的节点和连边数一般较多,在计算这些指标时,往往涉及到最短路径等一些时间复杂度高的运算,非常耗时。
发明内容
本发明的目的是要解决现有技术中存在的不足,提供一种基于核极限学习机的航空网络关键节点识别方法,提高了节点排序的准确性,降低计算复杂度。
为达到上述目的,本发明是按照以下技术方案实施的:
一种基于核极限学习机的航空网络关键节点识别方法,包括以下步骤:
S1、构造训练样本:从航空网络中随机生成部分节点,计算节点度值、点强和K-shell值共三个简单节点指标值;同时,确定节点的接近中心性、介数中心性、网络连接密度和网络效率共四个复杂指标;
S2、确定综合重要度:通过层次分析法计算得出四个复杂指标的权重,然后通过四个复杂指标的权重计算以上随机生成部分节点的综合重要度值;
S3、训练核极限学习机KELM评估模型:以节点度值、点强和K-shell值为输入,以由复杂指标计算出的综合重要度值为输出,训练核极限学习机KELM 学习简单节点指标与综合重要度值的映射关系,从而获得核极限学习机KELM 评估模型;
S4、对于航空网络中的新节点,计算出新节点的简单指标后输入核极限学习机KELM评估模型,输出新节点的综合重要度值,进而简单节点指标与综合重要度值的映射关系完成关键节点的辨识。
进一步地,所述步骤S1中,
节点度值的计算公式为:Di=∑aij,式中:aij为两节点间的连边状况,若节点vi和vj不存在直接连边,则aij=0;否则,aij=1;
点强的计算公式为:
Figure RE-GDA0003026877620000031
式中,Si表示点强,wij表示与节点vi直接连边的权值,Ni表示节点vi的相邻节点集合;
K-shell值的计算步骤为:搜索航空网络中度为1的节点,删除此类节点及其连边;删掉这些节点后,网络结构出现变化,将此时度是1的节点及其连边删除,依此过程,继续删除节点,直至网络中不包含度为1的节点,将删掉的节点组成的壳作为1-壳,继续去除节点度为2的节点,作为2-壳,以此类推,直至删完所有节点;从而获得节点vi的K-shell值为Ksi,其值越大,节点越重要;
将节点度值Di、点强Si和K-shell值Ksi进行归一化处理,n个节点可以组成一个的简单指标值矩阵
Figure RE-GDA0003026877620000032
上式中,X表示n个节点的度值、点强和K-shell值矩阵。
进一步地,所述步骤S1中,
所述节点的接近中心性CC表示为:
Figure RE-GDA0003026877620000033
式中,CC(i)越大,vi越接近网络中心,位置越重要,重要性也越大;d表示节点vi到网络中剩余节点的最短距离平均值,
Figure RE-GDA0003026877620000034
节点的介数中心性BC表示为:
Figure RE-GDA0003026877620000041
式中,σij(k)是vi与vj间经由vk的最短路径数目,σij为vi与vj间最短路径的数目;
节点的网络连接密度LD表示为:
Figure RE-GDA0003026877620000042
式中,n为当前网络节点总数,若vi与vj直接相连,aij=1;否则,aij=0,wij为节点连边的权值;LD越大,整体的异质性越高,网络流量越大,网络综合性能越好;
节点的网络效率NE表示为:
Figure RE-GDA0003026877620000043
式中,N为网络中节点总数,NE反映了网络信息传输的难易程度,NE越大,信息传递越顺畅,抗毁性越强。
进一步地,所述核极限学习机KELM的算法步骤具体为:
1)随机初始化输入层与隐层的权值向量ai和隐层节点偏置值bi
2)构建隐层输出矩阵H=[g(x1)T,…,g(xN)T];
3)通过式
Figure RE-GDA0003026877620000044
估算隐层与输出层的连接权值向量
Figure RE-GDA0003026877620000045
其中,x1=[x1,x2,…,xN]为N个样本,g(x)表示ELM网络隐层节点的输出函数,根据核函数理论,通过非线性函数将输入空间的样本点映射入特征空间,并由核函数代替特征空间的内积运算,假设隐层特征映射函数g(x)形式未知,则用核函数代替其内积形式;ELM通过核矩阵形式来描述:
ΩELM=HHTELMi,j
=g(xi)·g(xj)=K(xi,xj);
此时,基于核函数的核极限学习机KELM输出函数为:
Figure RE-GDA0003026877620000051
式中:HHT为隐层输出矩阵H的对角矩阵,1/c为引入的一个参数。
与现有技术相比,本发明选取少量节点为训练样本,将由复杂指标计算出的综合重要度值作为输出,节点度值、点强和K-shell值等简单指标作为输入,训练核极限学习机KELM评估模型,学习简单指标与综合重要度值的映射关系;这样,对于剩余节点来说,仅需通过其简单指标,便可求得其综合重要度和排序结果,从而提高了节点排序的准确性,降低计算复杂度。
附图说明
图1为本发明的流程图。
图2为K-shell方法示意。
图3为节点度和接近度方法效果对比图。
图4为核函数的映射过程。
图5为交叉验证法参数寻优过程图。
图6为指标Xt并输入KELM重要度评估模型,得到测试结果Yt,与其原来复杂指标值评估得到的重要度Y进行比较的效果图。
图7为美国航空网络的拓扑图。
图8为仿真实验中采用交叉验证法对美国航空网络的拓扑图的参数寻优过程图。
图9为仿真实验中随机选择20、40、60、80个节点作为训练样本,然后比较测试结果与原来的重要度值比较的效果图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步的详细说明。此处所描述的具体实施例仅用于解释本发明,并不用于限定发明。
如图1所示,本实施例提供了一种基于核极限学习机的航空网络关键节点识别方法,包括以下步骤:
S1、构造训练样本:从航空网络中随机生成部分节点,计算节点度值、点强和K-shell值共三个简单节点指标值;同时,确定节点的接近中心性、介数中心性、网络连接密度和网络效率共四个复杂指标;
S2、确定综合重要度:通过层次分析法计算得出四个复杂指标的权重,然后通过四个复杂指标的权重计算以上随机生成部分节点的综合重要度值;
S3、训练核极限学习机KELM评估模型:以节点度值、点强和K-shell值为输入,以由复杂指标计算出的综合重要度值为输出,训练核极限学习机KELM 学习简单节点指标与综合重要度值的映射关系,从而获得核极限学习机KELM 评估模型;
S4、对于航空网络中的新节点,计算出新节点的简单指标后输入核极限学习机KELM评估模型,输出新节点的综合重要度值,进而简单节点指标与综合重要度值的映射关系完成关键节点的辨识。
以下对上述步骤进行详细阐述。
航空网络对关键机场的研究主要是指标分析,指标较少时评估准确度不够理想,指标较全面时计算的时间复杂度又很高。
简单指标值为训练知识数据库,本文选取节点度值、点强、K-shell值作为简单指标。
节点度值:反映网络中单个节点与相邻节点间连接次数的指标,定义为节点的直接连边数
Figure RE-GDA0003026877620000071
式中,aij为两节点间的连边状况,若节点vi和vj不存在直接连边,则aij=0;否则,aij=1。
点强:主要指航空网络中的边权,即航线流量,点强Si表达式为
Figure RE-GDA0003026877620000072
式中,wij表示与节点vi直接连边的权值,Ni表示节点vi的相邻节点集合。周围机场与该机场节点联系越紧密,连边权值就越大。
K-shell:如图2所示,K-shell法是几种节点排序的代表性算法,根据节点度或其它指标,将处在网络外壳的节点一层一层剥离,剥离越晚的节点就越重要[8]。其具体步骤:搜索网络中度为1的节点,删除此类节点及其连边;删掉这些节点后,网络结构出现变化,将此时度是1的节点及其连边删除,依此过程,继续删除节点,直至网络中不包含度为1的节点。将删掉的节点组成的壳作为 1-壳(即Ks=1)。同理,继续去除节点度为2的节点,作为2-壳,以此类推,直至删完所有节点。这种方法对节点进行的是粗粒化排序,虽然精度不高,但反映了节点的全局性质。
对于节点vi,其K-shell值为Ksi,其值越大,节点越重要。表1给出了简单指标的优缺点对比。
表1
Figure RE-GDA0003026877620000073
Figure RE-GDA0003026877620000081
表1中三个指标比较有代表性,且都具有较低时间复杂度. 对简单指标也进行归一化:
Figure RE-GDA0003026877620000082
对于节点vi的点强Si和K-shell值Ksi,做同样的处理。综上所述,n个节点可以组成一个的简单指标值矩阵
Figure RE-GDA0003026877620000083
上式中,X表示n个节点的度值、点强和K-shell值矩阵。
在复杂网络领域,辨识关键节点的方法主要包括社会网络分析方法和系统科学分析方法。
对于社会网络分析方法,可选取接近中心性与介数中心性作为评估指标。
接近中心性(CC):计算网络中节点vi与剩余节点的距离平均值,解决特殊值问题。若vi与其他节点的距离比节点vj小,则认为vi的CC比vj大。通常,最靠近中心的节点具有信息流的最佳视野。设网络包含n个节点,则vi到网络中剩余节点的最短距离平均值
Figure RE-GDA0003026877620000084
若di较小,则说明vi比较接近网络的剩余节点,则di的倒数可定义为节点vi的 CC:
Figure RE-GDA0003026877620000085
在上式中,CC(i)越大,vi越接近网络中心,位置越重要,重要性也越大。图3为节点度和接近度方法效果对比图,可以看出,接近度比节点度更能精确区分节点重要性。
介数中心性(BC):在整体网络中反映节点的中心程度,节点vk的介数BC(k) 是指经过节点vk的网络中全部节点对间的最短路径数占总最短路径数的比重:
Figure RE-GDA0003026877620000091
式中,σij(k)是vi与vj间经由vk的最短路径数目,σij为vi与vj间最短路径的数目。
对于系统科学分析方法,可采用节点删除法。节点删除法的思想是,删除某个节点后,计算网络性能,并与原网络比较,网络性能变化越大,节点就越重要。对于网络性能,采用网络连接密度与网络效率来衡量。
网络连接密度(LD):在无权网络中,连接密度指网络中现有连边与可能存在的连边的比值。对于航空网络,可定义加权连接密度:
Figure RE-GDA0003026877620000092
式中,n为当前网络节点总数。若vi与vj直接相连,aij=1;否则,aij=0,wij为节点连边的权值。LD越大,整体的异质性越高,网络流量越大,网络综合性能越好。
网络效率(NE)为所有节点之间的距离倒数和的平均值
Figure RE-GDA0003026877620000093
式中,N为网络中节点总数。NE反映了网络信息传输的难易程度,NE越大,信息传递越顺畅,抗毁性越强。
为更加直观,表2给出了四个复杂指标的优缺点与时间复杂度对比。
表2
Figure RE-GDA0003026877620000101
从表2中可以看出,除了连接密度外,其余三个指标的计算时间复杂度均为O(N3)。虽然综合这四个指标能够较为全面地反映节点的重要性,但这样耗费时间较长,不适合复杂的大型网络。
考虑到航空网络节点训练样本集的复杂指标计算复杂度较高,本文提出采用基于核函数的ELM(Kernel ELM,KELM)来学习简单指标与综合重要度之间的映射关系,以期耗费较少的计算和时间资源,实现航空网络节点重要度的准确评估,进而辨识出关键节点。
对于模式识别问题,当样本在低维空间线性不可分时,可通过某非线性函数映射到高维特征空间,能够实现线性可分。核函数基本原理:通过某非线性函数,将输入空间样本映射到高维特征空间,在高维特征空间进行数据的处理。其关键在于,引入核函数后,能够将高维特征空间的内积运算转化为输入空间内的运算。
设xi与xj为输入空间中的样本点,原始输入空间到高维特征空间的映射函数为Φ,则核函数方法可描述为实现内积变换
(xi·xj)→K(xi,xj)=<Φ(xi),Φ(xj)> (8)
式中,K(xi,xj)为核函数,<Φ(xi),Φ(xj)>为内积。在式(8)中,输入空间的核函数与高维特征空间的内积是等价的,非线性变换函数Φ的内积运算较为复杂,而核函数K(xi,xj)运算则相对较为简单,因此,为降低运算复杂性,可用输入空间的核函数运算替代高维特征空间的内积运算。此外,在使用核函数时,无需明确Φ的具体形式和参数,极大地方便了运算。图4为核函数的映射过程。
在ELM工程实践中,由于各种原因,所采集数据样本相互可能存在复共线性问题,那么,对于隐层输出矩阵H,在求解Moore-Penrose广义逆 H+=HT(HHT)-1时,会导致非奇异,对估算结果也会产生负面影响。为解决这个问题,Huang等引入一个参数1/c,将之加到对角矩阵HHT的主对角线上,使HHT特征根偏离零值,再据此估算隐层与输出层的连接权值向量
Figure RE-GDA0003026877620000111
以改善ELM的稳定性和泛化性。
为提高ELM的稳定性,
Figure RE-GDA0003026877620000112
可估算为:
Figure RE-GDA0003026877620000113
则ELM的输出函数为:
Figure RE-GDA0003026877620000114
对于训练样本(xi,ti),且xi=[xi1,xi2,…,xin]T∈Rn与ti=[ti1,ti2,…,tim]T∈Rm,g(x)为激励函数,L为隐层节点个数(L≤N)。则ELM算法计算步骤:
1.随机初始化输入层与隐层的权值向量ai和隐层节点偏置值bi
2.构建隐层输出矩阵H=[g(x1)T,…,g(xN)T];
3.通过式(10)估算隐层与输出层的连接权值向量
Figure RE-GDA0003026877620000115
其中,x1=[x1,x2,…,xN]为N个样本,g(x)表示ELM网络隐层节点的输出函数,根据核函数理论,通过非线性函数将输入空间的样本点映射入特征空间,并由核函数代替特征空间的内积运算。假设隐层特征映射函数g(x)形式未知,则可用核函数代替其内积形式。ELM可通过核矩阵形式来描述:
ΩELM=HHTELMi,j
=g(xi)·g(xj)=K(xi,xj) (12)
此时,基于核函数的ELM(KELM)输出函数为
Figure RE-GDA0003026877620000121
不难理解,在KELM算法中,无需了解g(x)的具体形式,仅需明确具体核函数K(x,xi),就可计算输出函数的值。另外,需要说明的是,核函数为内积形式,在计算式(11)时,不需要确定网络隐层节点的个数。
进一步地,为了验证上述实施例的基于核极限学习机的航空网络关键节点识别方法的可行性,首先对随机网络进行测试,然后对美国航空网络进行测试,并对测试结果进行相应分析。
考虑一随机网络G={V,E,W},该网络含有600个节点,6000条连边,实验目的是检验KELM关键节点辨识方法的有效性,也就是判断KELM能够能准确学习简单指标与综合重要度之间的关系。
按照关键节点识别算法步骤,先随机选择60个节点作为KELM训练样本,通过AHP得出复杂指标CC、BC、LD和NE的权重分别为0.1592,0.5789,0.0565, 0.2055,计算复杂指标加权和为综合重要度值Y,然后计算对应简单指标值X。 KELM训练前,利用交叉验证法在log2c∈[-10,10]与log2σ∈[-10,10]内自动搜索最佳的参数c和参数σ,参数寻优过程如图5所示。
图中,复杂指标重要度的实际值和预测值的均方根误差RMSE:
Figure RE-GDA0003026877620000122
可以看出,网格图底部较平缓,说明在很大取值范围内的两个参数都可以使RMSE最小,因此,能够较容易地找出最佳参数c和σ。
进行训练后,随机选择除训练样本之外的60个节点作为测试节点,计算得到其简单指标Xt并输入KELM重要度评估模型,得到测试结果Yt,与其原来复杂指标值评估得到的重要度Y进行比较,效果如图6所示。
从图6中可以看到,KELM输出的结果与原来的重要度值非常接近,说明本文方法是准确、可行的。由表2可知,使用复杂指标对节点重要度评估所需时间复杂度为o(N3),而KELM评估仅需o(N'2),其中,N'为训练样本数。因此,采用这种方法,可以通过简单、耗时少的指标快速得到节点的综合重要度。
对于美国航空网络,做同样测试,实验数据集包含332个机场节点、2126 条连边(直飞航线)以及连边的权重,美国航空网络的拓扑图如图7所示。数据来源:http://vlado.fmf.uni-lj.si/pub/networks/data
根据提出的方法,通过交叉验证法确定参数,如图8所示。在节点重要度评估过程中,耗时最长的是知识数据库的建立(用复杂指标评估节点重要度),如果选择网络中大部分节点作为训练样本,评估方法就失去了时间复杂度低的优势,变得没有意义。因此,在这里测试KELM是否仅需要很少一部分节点就能准确评估节点重要度,分别随机选择20、40、60、80个节点作为训练样本,然后比较测试结果与原来的重要度值,如图9所示。
由图9中可看出,选择20个训练样本时,测试结果与原值的拟合效果较差,当选择40个训练样本时,拟合效果明显改善,选择60、80个节点时,拟合效果无明显提升。因此,在美国航空网络中,仅需计算40个节点的复杂指标值,如此将大大降低了原来的运算量,提高辨识关键节点的效率。
选择40个节点作为训练样本,对所有节点进行测试,得到测试结果后对节点进行排序,并与原复杂指标评估重要度排序、ACI排序进行比较,如表3所示。其中,ACI指国际机场委员会对美国各机场的综合排名。
表3
Figure RE-GDA0003026877620000141
由排序对比不难发现,测试结果(简单指标评估结果)排名前16的机场节点与ACI仅有3个不同,说明所提出方法比较符合现实情况,具有一定的准确性。再将测试结果与复杂指标评估结果作比较,发现两种方法的结果几乎一致,在前几名中,只有San Francisco与G.Bush对调了顺序,后几名略有差异,说明了KELM的学习效果较好,具有准确预测数据的能力。
通过上述仿真分析,以航空网络中部分节点作为训练样本,其中,将反映机场位置、航线流量的复杂指标计算出综合重要度值作为输出,将计算复杂度较小的简单指标作为输入,采用KELM学习综合重要度值与简单指标的映射关系。对剩余大部分节点只要求出其简单指标,便可以求得其综合重要度和节点排序。解决了传统指标单一、未考虑边权的问题,提高了节点排序的准确性,同时降低了计算复杂度,节省了大量时间。通过实证分析,发现美国航空网络的关键节点包括芝加哥奥黑尔国际机场(Chicago O'hare Intl)、达拉斯沃斯堡国际机场(Dallas/Fort Worth Intl)和亚特兰大哈慈菲尔德(The William BHartsfield Atlan)国际机场等,并与其它方法对比,验证了所提出方法的有效性和可行性。
本发明的技术方案不限于上述具体实施例的限制,凡是根据本发明的技术方案做出的技术变形,均落入本发明的保护范围之内。

Claims (4)

1.一种基于核极限学习机的航空网络关键节点识别方法,其特征在于,包括以下步骤:
S1、构造训练样本:从航空网络中随机生成部分节点,计算节点度值、点强和K-shell值共三个简单节点指标值;同时,确定节点的接近中心性、介数中心性、网络连接密度和网络效率共四个复杂指标;
S2、确定综合重要度:通过层次分析法计算得出四个复杂指标的权重,然后通过四个复杂指标的权重计算以上随机生成部分节点的综合重要度值;
S3、训练核极限学习机KELM评估模型:以节点度值、点强和K-shell值为输入,以由复杂指标计算出的综合重要度值为输出,训练核极限学习机KELM学习简单节点指标与综合重要度值的映射关系,从而获得核极限学习机KELM评估模型;
S4、对于航空网络中的新节点,计算出新节点的简单指标后输入核极限学习机KELM评估模型,输出新节点的综合重要度值,进而简单节点指标与综合重要度值的映射关系完成关键节点的辨识。
2.根据权利要求1所述的基于核极限学习机的航空网络关键节点识别方法,其特征在于,所述步骤S1中,
节点度值的计算公式为:Di=∑aij,式中:aij为两节点间的连边状况,若节点vi和vj不存在直接连边,则aij=0;否则,aij=1;
点强的计算公式为:
Figure FDA0002903727390000011
式中,Si表示点强,wij表示与节点vi直接连边的权值,Ni表示节点vi的相邻节点集合;
K-shell值的计算步骤为:搜索航空网络中度为1的节点,删除此类节点及其连边;删掉这些节点后,网络结构出现变化,将此时度是1的节点及其连边删除,依此过程,继续删除节点,直至网络中不包含度为1的节点,将删掉的节点组成的壳作为1-壳,继续去除节点度为2的节点,作为2-壳,以此类推,直至删完所有节点;从而获得节点vi的K-shell值为Ksi,其值越大,节点越重要;
将节点度值Di、点强Si和K-shell值Ksi进行归一化处理,n个节点可以组成一个的简单指标值矩阵
Figure FDA0002903727390000021
上式中,X表示n个节点的度值、点强和K-shell值矩阵。
3.根据权利要求1所述的基于核极限学习机的航空网络关键节点识别方法,其特征在于:所述步骤S1中,
所述节点的接近中心性CC表示为:
Figure FDA0002903727390000022
式中,CC(i)越大,vi越接近网络中心,位置越重要,重要性也越大;d表示节点vi到网络中剩余节点的最短距离平均值,
Figure FDA0002903727390000023
节点的介数中心性BC表示为:
Figure FDA0002903727390000024
式中,σij(k)是vi与vj间经由vk的最短路径数目,σij为vi与vj间最短路径的数目;
节点的网络连接密度LD表示为:
Figure FDA0002903727390000025
式中,n为当前网络节点总数,若vi与vj直接相连,aij=1;否则,aij=0,wij为节点连边的权值;LD越大,整体的异质性越高,网络流量越大,网络综合性能越好;
节点的网络效率NE表示为:
Figure FDA0002903727390000031
式中,N为网络中节点总数,NE反映了网络信息传输的难易程度,NE越大,信息传递越顺畅,抗毁性越强。
4.根据权利要求1所述的基于核极限学习机的航空网络关键节点识别方法,其特征在于:所述核极限学习机KELM的算法步骤具体为:
1)随机初始化输入层与隐层的权值向量ai和隐层节点偏置值bi
2)构建隐层输出矩阵H=[g(x1)T,…,g(xN)T];
3)通过式
Figure FDA0002903727390000032
估算隐层与输出层的连接权值向量
Figure FDA0002903727390000033
其中,x1=[x1,x2,…,xN]为N个样本,g(x)表示ELM网络隐层节点的输出函数,根据核函数理论,通过非线性函数将输入空间的样本点映射入特征空间,并由核函数代替特征空间的内积运算,假设隐层特征映射函数g(x)形式未知,则用核函数代替其内积形式;ELM通过核矩阵形式来描述:
ΩELM=HHTELM i,j
=g(xi)·g(xj)=K(xi,xj);
此时,基于核函数的核极限学习机KELM输出函数为:
Figure FDA0002903727390000034
式中:HHT为隐层输出矩阵H的对角矩阵,1/c为引入的一个参数。
CN202110064777.4A 2021-01-18 2021-01-18 一种基于核极限学习机的航空网络关键节点识别方法 Active CN112989526B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110064777.4A CN112989526B (zh) 2021-01-18 2021-01-18 一种基于核极限学习机的航空网络关键节点识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110064777.4A CN112989526B (zh) 2021-01-18 2021-01-18 一种基于核极限学习机的航空网络关键节点识别方法

Publications (2)

Publication Number Publication Date
CN112989526A CN112989526A (zh) 2021-06-18
CN112989526B true CN112989526B (zh) 2022-09-30

Family

ID=76344411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110064777.4A Active CN112989526B (zh) 2021-01-18 2021-01-18 一种基于核极限学习机的航空网络关键节点识别方法

Country Status (1)

Country Link
CN (1) CN112989526B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113726564B (zh) * 2021-08-20 2024-06-07 国家电网有限公司 服务器节点重要度分析方法
CN113780436B (zh) * 2021-09-15 2024-03-05 中国民航大学 一种基于综合度的复杂网络关键节点识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299776A (zh) * 2018-09-14 2019-02-01 湖南工程学院 一种核增量型超限学习机、差分多种群灰狼混合优化方法
CN109886350A (zh) * 2019-02-25 2019-06-14 东北农业大学 一种基于核极限学习机奶牛日粮消化能预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299776A (zh) * 2018-09-14 2019-02-01 湖南工程学院 一种核增量型超限学习机、差分多种群灰狼混合优化方法
CN109886350A (zh) * 2019-02-25 2019-06-14 东北农业大学 一种基于核极限学习机奶牛日粮消化能预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于粒子群算法优化核极限学习机的磨煤机故障诊断;张文涛等;《电力科学与工程》;20180928(第09期);全文 *

Also Published As

Publication number Publication date
CN112989526A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN104102745B (zh) 基于局部最小边的复杂网络社团挖掘方法
CN104850727B (zh) 基于云重心理论的分布式大数据系统风险评估方法
CN112989526B (zh) 一种基于核极限学习机的航空网络关键节点识别方法
Bai et al. Link prediction based on a semi-local similarity index
CN105574541A (zh) 一种基于紧密度排序的网络社区发现方法
Ren et al. A measure of identifying influential waypoints in air route networks
Wang et al. A hybrid fuzzy method for performance evaluation of fusion algorithms for integrated navigation system
Liu et al. A novel method for identifying influential nodes in complex networks based on multiple attributes
Wang et al. Abnormal trajectory detection based on geospatial consistent modeling
CN112989272A (zh) 一种基于局部路径的社团发现算法
Fushimi et al. Estimating node connectedness in spatial network under stochastic link disconnection based on efficient sampling
Li et al. Evaluating node importance in complex networks based on TOPSIS and gray correlation
CN115438453B (zh) 一种利用观测数据构建路网设施拓扑结构的方法
Sihag et al. Detecting community structure based on traffic at node in networks
CN110941767A (zh) 一种基于多相似度集成的网络社团检测对抗增强方法
CN111008730A (zh) 基于城市空间结构的人群聚集度预测模型构建方法及装置
Wang et al. Road network link prediction model based on subgraph pattern
Zhang et al. Variable stage self-correcting grey clustering model
Du et al. Similarity measurements on multi‐scale qualitative locations
CN114529096A (zh) 基于三元闭包图嵌入的社交网络链路预测方法及系统
Yu et al. Link prediction algorithm based on the Choquet fuzzy integral
Rezaeipanah et al. Providing a new method for link prediction in social networks based on the meta-heuristic algorithm
CN108418715B (zh) 无线网络虚拟化环境中资源发现方法
CN109765355A (zh) 一种机场水泥混凝土道面裂开模式预测方法
CN114169192B (zh) 基于粗糙集理论的热力耦合系统不确定性分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant