CN115374855B - 一种基于聚类的对铁路突发事件进行分级的方法 - Google Patents
一种基于聚类的对铁路突发事件进行分级的方法 Download PDFInfo
- Publication number
- CN115374855B CN115374855B CN202211010989.5A CN202211010989A CN115374855B CN 115374855 B CN115374855 B CN 115374855B CN 202211010989 A CN202211010989 A CN 202211010989A CN 115374855 B CN115374855 B CN 115374855B
- Authority
- CN
- China
- Prior art keywords
- railway
- emergency
- grading
- accident
- cluster center
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 36
- 238000005457 optimization Methods 0.000 claims abstract description 13
- 230000008859 change Effects 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000001739 density measurement Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 230000007423 decrease Effects 0.000 claims description 4
- 238000004445 quantitative analysis Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 7
- 238000011161 development Methods 0.000 description 6
- 238000007635 classification algorithm Methods 0.000 description 4
- 238000011835 investigation Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Train Traffic Observation, Control, And Security (AREA)
Abstract
本发明提供了一种基于聚类的对铁路突发事件进行分级的方法。该方法包括:获取铁路突发事件分级指标,从铁路突发事件分级指标中提取铁路突发事件情景要素;构建基于k近邻与拐点优化的密度峰值聚类铁路事故分级算法IDPC‑KNN‑TP,将所述铁路突发事件情景要素输入到IDPC‑KNN‑TP算法中,得到铁路突发事件的分级结果信息。本发明方法通过提取铁路突发事件的情景要素信息作为分级指标,采用基于k近邻与拐点优化的密度峰值聚类分级算法求得事故的严重等级,能有效地划分铁路日常事故的严重等级。
Description
技术领域
本发明涉及铁路突发事件管理技术领域,尤其涉及一种基于聚类的对铁路突发事件进行分级的方法。
背景技术
近年来,随着铁路路网规模增大与铁路系统复杂性增加,铁路突发事件频发。铁路突发事件影响铁路的正常运营。铁路突发事件的发生、发展至结束是一个动态的过程。随着事故的发展和救援行动的展开,铁路突发事件的级别是动态变化的。如果决策者无法快速有效地识别事故的严重等级,在应急处置方案的选择和制定上,将缺乏针对性和科学性,甚至延误救援时机。因此,正确的事故分类决定了铁路突发事件应急响应的高效性。
现阶段,针对铁路突发事件的严重程度分级研究,在理论上已经有了一定的积累。但当前分级研究多是铁路突发事件的事后评估与静态评估,无法指导事故发展过程中的应急响应工作,应急救援工作无法随着事故等级发展而调整。此外,当前铁路突发事件的分级标准仅仅适用于铁路重大事故,对铁路日常突发事件的无标签事故指导意义不大。
因此,亟需一种适用于铁路日常事故的严重性分级方法。
发明内容
本发明的实施例提供了一种基于聚类的对铁路突发事件进行分级的方法,以有效地划分铁路日常事故的严重等级。
为了实现上述目的,本发明采取了如下技术方案。
一种基于聚类的对铁路突发事件进行分级的方法,包括:
获取铁路突发事件分级指标,从所述铁路突发事件分级指标中提取铁路突发事件情景要素;
构建基于k近邻与拐点优化的密度峰值聚类铁路事故分级算法IDPC-KNN-TP,将所述铁路突发事件情景要素输入到IDPC-KNN-TP算法中,得到铁路突发事件的分级结果信息。
优选地,所述的获取铁路突发事件分级指标,从所述铁路突发事件分级指标中提取铁路突发事件情景要素,包括:
将情景的理论融入到铁路突发事件分级指标选取中,从铁路突发事件分级指标中的事故的基本信息、事故的状态信息与应急响应信息三个维度提取铁路日常突发事件集的情景要素信息,事故基本信息是铁路突发事故的显性信息,事故状态信息是铁路突发事件演变时隐形信息,应急响应信息是人为干预情况;
设铁路突发事件情景要素为Si,j,其中i∈(1,n)为应急关键情景要素变量的个数,j∈(0,∞)为事故序列,表示的是第j个事故所对应的第i个关键情景要素信息;
将所述铁路突发事件情景要素的不同状态程度用不同的模拟值表达,规范化处理,作为最终选取的铁路突发事件情景要素及其取值。
优选地,参数化后的铁路突发事件情景要素及其取值包括:
优选地,所述的将所述铁路突发事件情景要素输入到IDPC-KNN-TP算法中,得到铁路突发事件的分级结果信息,包括:
步骤S3-1:将铁路日常突发事件集的情景要素信息S1,j,S2,j,S3,j…Sn,j输入到IDPC-KNN-TP算法中,通过基于k近邻优化的局部密度度量方法计算局部密度ρi与距离δi:
ρi=∑j∈KNN(j)exp(-dij) (1)
其中,dij为数据点i和j之间的欧氏距离,KNN(i)为样本i的k近邻样本集合,数据点i表示分级样本中一个样本点,其由某铁路突发事件的情景要素序列集构成,定义如下:
KNN(i)={j|d(i,j)≤d(i,ki)} (2)
定义距离δi为:
δi是点i与局部密度大于它的点j的最小距离,对于局部密度ρi最高的样本i,其距离δi为:
步骤S3-2:引入簇类中心权值的概念,簇中心权值γi的计算方法如下:
γi=ρi×δi (5)
定义拐点为簇中心权值偏离原点的趋势变化最快的临界点,将簇中心权值γi按照降序排列,计算过程如下;
计算簇中心权值变化趋势,用两点线段的斜率表征簇中心权值下降的趋势,即:
其中表示在区间[i,i+m]中簇中心权值平均变化率,表征了在某一区间内γ的总体变化趋势;
计算簇中心权值的拐点,即簇中心权值下降趋势由急变缓的临界点;
由式(6)可知,为[1,i]区间的平均变化率,/>为[i,i+1]区间的平均变化率,由式(7)可知,拐点为簇中心权值下降趋势变化最快的临界点,其最大值点为拐点,在一定范围内,取拐点及拐点之前的样本点i作为聚类中心点;
步骤S3-3:分配类簇的非中心点,构造局部密度主干区域,从一个聚类中心点开始,依次遍历其k近邻样本,采用k近邻思想对剩余点进行样本分配,遍历所有未分配的样本,计算其k近邻属于不同类簇的数量,将k近邻的最大值所在聚类作为该样本所属聚类,遍历直到所有点被分配为止,得到铁路突发事件分级结果,通过铁路突发事件分级结果得到输入的事故情景要素集划分的级别数量、每个级别包含的事故样本和某一铁路突发事故对应的事故级别。
由上述本发明的实施例提供的技术方案可以看出,本发明实施例提供的铁路日常突发事件的严重程度分级方法,通过提取铁路突发事件的情景要素信息作为分级指标,采用基于k近邻与拐点优化的密度峰值聚类分级算法求得事故的严重等级,能有效地划分铁路日常事故的严重等级。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于聚类的对铁路突发事件进行分级的方法的处理流程图;
图2为本发明实施例提供的一种决策图;
图3为本发明实施例提供的一种簇类中心权值降序排列示意图;
图4为本发明实施例提供的一种拐点判别图;
图5为本发明实施例提供的一种类簇对应的情景要素分布时候示意图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
实施例一
本发明实施例提供了一种基于聚类的铁路突发事件分级的方法,该方法基于k近邻与拐点优化密度峰值聚类分级算法(IDPC-KNN-TP)对铁路日常突发事件分级。所述方法能适用于无标签的铁路日常事故分级的场景。
本发明实施例提供的一种基于聚类的铁路突发事件分级的方法的实现原理图如图1所示,包括如下的处理步骤:
步骤S1,确定铁路突发事件分级指标。
铁路突发事件分级指标选取应满足:首先,描述事故状态,包括事故致灾因子、承灾体、孕灾环境与应急响应的描述;其次,反映事故的动态性,即事故随时间推移的动态演变性与因素状态变化的特点;最后,避免主观随意性。
本发明中,将情景的理论融入到铁路突发事件分级指标选取中,规范选取过程。情景是铁路突发事件发生与发展中的态势,是对铁路突发事件当前的状态与未来发展趋势的描述与表达。
优先地,步骤S1进一步包括:
步骤S1-1:提取事故的情景要素信息。设铁路突发事件情景要素为Si,j,其中i∈(1,n)为应急关键情景要素变量的个数,j∈(0,∞)为事故序列,表示的是第j个事故所对应的第i个关键情景要素信息。
从事故的基本信息、事故的状态信息与应急响应信息三个维度提取铁路日常突发事件集的情景要素信息。事故基本信息是铁路突发事故的显性信息,如事件发生的时间、地点与车厢损坏程度等信息;事故状态信息是铁路突发事件演变时隐形信息,如事故人员伤亡、事故波及范围与事故原因等;应急响应信息是人为干预情况,包括物资调度、人员疏散措施等。
步骤S1-2:情景要素参数化处理。将所述铁路突发事件情景要素的不同状态程度用不同的模拟值表达,规范化处理,作为最终选取的铁路突发事件情景要素及其取值。以输入到铁路事故分级算法中。
步骤S2,构建基于k近邻与拐点优化的密度峰值聚类铁路事故分级算法IDPC-KNN-TP。
铁路日常突发事故没有统一的分级标准,属于无标签数据,采用聚类方法探究数据本身的特点实现分级。构建一种基于k近邻与拐点优化的密度峰值聚类分级算法IDPC-KNN-TP,能够自动确定聚类中心,实现任意形状的数据聚类。
密度峰值聚类算法是综合了样本点的密度与距离所提出的一种新的聚类算法,基于两个假设实现:(1)类簇中心点的密度大于周围邻居点的密度;(2)类簇中心点与更高密度点之间的距离相对较大。该算法能快速发现任意形状的簇,确定数据集的类簇中心,高效进行样本点分配和离群点剔除,但存在以下缺陷:(1)DPC算法的局部密度计算方式是通过截断距离计算的,这个值往往是通过经验设置,无法适应不同密度的数据集;(2)在聚类中心点选择上,需要人工选取决策图上较大值点来确定类簇中心,具有主观随意性;
(3)在样本分配策略中,采用分配样本到距其最近且密度比它大的样本所在类簇,该样本分配方法会形成“多米诺骨牌效应”,一旦某一个样本分配错误,会带来一连串的样本分配错误,造成错误的聚类结果。
基于以上不足,本发明构建了一种采用基于K近邻与拐点优化的密度峰值聚类算法IDPC-KNN-TP。首先,对局部密度度量方法进行优化,将k近邻的概念融入到局部密度度量中,无需人工输入截断距离,适用于多尺度、不同密度或维数的数据集。其次,对簇类中心选取过程进行优化,通过计算簇类中心权值的拐点求得最佳簇类数与聚类中心,以定量的方法而不是定性分析确定聚类中心。最后,对样本分配策略进行优化,提出一种两阶段分配算法,提高了非中心点正确分配的概率,避免了样本分配错误一连串的问题。
步骤S3,将铁路日常突发事件集的情景要素信息S1,j,S2,j…Sn,j输入到IDPC-KNN-TP算法中,得到铁路日常事故的严重等级。
优先地,步骤S3进一步包括:
步骤S3-1:计算局部密度ρi与距离δi。在本发明中,提出一种基于k近邻优化的局部密度度量方法,局部密度ρi的计算方法如下:
ρi=∑j∈KNN(j)exp(-dij) (1)
其中,dij为数据点i和j之间的欧氏距离,数据点i表示分级样本中一个样本点,其由某铁路突发事件的情景要素序列集构成,KNN(i)为样本i的k近邻样本集合,定义如下:
KNN(i)={j|d(i,j)≤d(i,ki)} (2)
定义距离δi为:
由上式可知,δi是点i与局部密度大于它的点j的最小距离。此外,对于局部密度ρi最高的样本i,其距离δi为:
步骤S3-2:确定聚类中心。在本发明中提出了一种聚类中心自动选择策略。首先引入簇类中心权值的概念,计算如下:
γi=ρi×δi (5)
定义拐点为簇中心权值偏离原点的趋势变化最快的临界点。将簇中心权值γi按照降序排列,计算过程如下;
第一步,计算簇中心权值变化趋势。用两点线段的斜率表征簇中心权值下降的趋势,即:
其中表示在区间[i,i+m]中簇中心权值平均变化率,表征了在某一区间内γ的总体变化趋势;
第二步,计算簇中心权值的拐点,即簇中心权值下降趋势由急变缓的临界点;
由式(6)可知,为[1,i]区间的平均变化率,/>为[i,i+1]区间的平均变化率。由式(7)可知,拐点为簇中心权值下降趋势变化最快的临界点,其最大值点为拐点。在一定范围内,取拐点及拐点之前的样本点i作为聚类中心点。
步骤S3-3:分配类簇的非中心点。在本发明中提出了一种基于两阶段的分配方法。首先,构造局部密度主干区域,从一个聚类中心点开始,依次遍历其k近邻样本;其次,采用k近邻思想对剩余点进行样本分配,遍历所有未分配的样本,计算其k近邻属于不同类簇的数量,将k近邻的最大值所在聚类作为该样本所属聚类。遍历直到所有点被分配为止,得到铁路突发事件分级结果。通过铁路突发事件分级结果可得到输入的事故情景要素集划分的级别数量,以及每个级别包含的事故样本,具体到某一铁路突发事故对应的事故级别。将分级结果与实际相联系,分析每一级别的情景要素集,可得出铁路日常突发事件的特点、严重等级与具体信息,从而完成对铁路日常突发事件的严重等级分析。
步骤S4,结果评估。
对分级算法的分级结果进行评估,分别从两方面展开。首先,对算法进行聚类有效性评估,选用四个内部评估方法对聚类结果进行评估,分别是Silhouette,Xie_Beni,S_Dbw与Calinski-HarabaszIndex。其次,将分级结果的情景含义与实际相联系,探究分级结果的实际意义。
实施例二
本发明提供了一种对铁路日常事故的分级算法,具体为一种基于k近邻与拐点优化的密度峰值聚类分级算法,通过情景构建选取铁路突发事件的分级指标,对铁路日常事故的严重程度分级。
本发明以2010—2021年英国铁路运营事故为例,对铁路日常事故的严重程度进行了划分。
步骤1,铁路突发事件的分级指标确定;
选取2010—2021年英国铁路运营事故数据作为研究数据。数据来源于英国铁路事故调查部门发布的事故调查报告中获得。收集从2010-2021年期间R022010-R022021铁路运营事故数据,事故可分为两列车相撞、列车与物体相撞、列车脱轨、列车冒进、工人/乘客被列车击中与列车失控等。
具体地,步骤1-1:情景要素信息提取;
对2010-2021年英国铁路运营事故进行分析,提取其公有的且对铁路事故分级影响较大的七个情景要素作为分级指标。事故基本信息即事故发生的时间、气候状况、救援环境恶劣程度、车厢损坏程度与基础设施损坏程度,事故状态信息包括事故类型与人员伤亡数量。调查报告主要是事故原因与管理建议的介绍,鲜少提及人为响应信息,故这部分信息未考虑在内。
具体地,步骤1-2:情景要素参数化处理;
基于事故调查报告中对提取情景要素的描述,对情景要素进行参数化处理。铁路运营事故数据提取的关键情景要素及取值如下所示。
步骤2:铁路突发事件分级;
具体地,步骤2-1:计算局部密度ρi与距离δi,得到图2所示的决策图;
步骤2-2:确定聚类中心,计算拐点。簇类中心权值降序排列如图3所示,拐点判别图如图4所示,在图4中,最大值点即为拐点。在n=4时,变化幅度最大,选择前四个点作为聚类中心点。
具体地,步骤2-3:对非中心点进行分配。分配过程主要为两阶段分配策略,首先构造局部密度主干区域,对非离群点进行分配;其次,基于K近邻的思想完成对剩余点的分配过程。
步骤3:结果评估;
首先,聚类有效性评估。通过四个内部评估的指标,将本发明的分级结果与传统DPC、k-means算法、DBSCAN算法与AP算法进行对比,如下表所示;
由上表所示,IDPC-KNN-TP的聚类结果在四个聚类评定指标中三个指标表现最优。IDPC-KNN-TP的Xie_Beni指标最小,其聚类结果的类间距离更大,类内紧致性更高,远小于传统DPC的Xie_Beni指标值。IDPC-KNN的S_Dbw指标最小,在其余聚类算法中表现最好。IDPC-KNN的CH指标值最大,其衡量了类间离散与类内离散的比率,远大于传统DPC的结果,且在其他聚类算法中表现最优。IDPC-KNN的轮廓系数在其余聚类算法中不是最优,但值仍不低,且结果优于传统DPC算法。综上所述,证明了IDPC-KNN算法分类结果的有效性。
其次,分级结果实际意义分析。本发明构建铁路突发事件分级模型的分级指标为七个情景要素,分别为S1,j时间,S2,j气候状况,S3,j救援环境恶劣程度,S4,j车厢损坏程度,S5,j线路及周围及设施损坏程度,S6,j事故类型,S7,j伤亡人数。
本发明实施例提供的一种类簇对应的情景要素分布如图5所示。如图5所示,在聚类1中,大部分铁路突发事件发生在白天,事故基本由人为因素造成,天气良好,救援环境适宜实施救援措施。整体车厢受损程度较低,线路及基础设施受损程度较轻,伤亡人数较低。设施的伤亡和损坏较小。总体来看,类簇1的铁路突发事件严重程度等级较轻。簇2夜间铁路突发事件数量增加。簇2的事故类型与集群1的事故类型相同,但类簇2的车厢破坏程度明显增大,类簇2的伤亡严重程度大于类簇1。其他情景要素的严重程度等级与簇1相似。类簇2的事故严重程度进一步增加。簇3的铁路突发事件大多是设备故障。与簇1和簇2相比,簇3中线路和基础设施的破坏程度增加,救援环境的严重性增加,车厢损坏程度比集群1严重。因此,簇3中铁路突发事件的严重程度等级确定为Ⅲ级。集群4中铁路突发事件大多发生在夜间。车厢损坏程度和基础设施损坏程度的情景向更消极的方向发展,其严重程度大多较高。与其他簇相比,簇4的事故严重程度级别最高;
分级结果符合事故实际表现,由此本分级算法具有良好的实际意义。
综上所述,本发明实施例提供了一种铁路日常突发事件的严重程度分级方法,通过提取铁路突发事件的情景要素信息作为分级指标,采用基于k近邻与拐点优化的密度峰值聚类分级算法求得事故的严重等级。所述方法具有以下优点:
(1)能划分铁路日常事故的严重等级;
(2)分级指标更符合铁路突发事件动态发展的规律,选取过程更加规范;
(3)能自动确定聚类中心,输入参数简单,样本点分配正确率高;
(4)算法简单,易于理解与计算,应用性较强;
(5)计算速度快。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (2)
1.一种基于聚类的对铁路突发事件进行分级的方法,其特征在于,包括:
获取铁路突发事件分级指标,从所述铁路突发事件分级指标中提取铁路突发事件情景要素;
构建基于k近邻与拐点优化的密度峰值聚类铁路事故分级算法IDPC-KNN-TP,所述密度峰值聚类算法IDPC-KNN-TP对局部密度度量方法进行优化,将k近邻的概念融入到局部密度度量中,无需人工输入截断距离,适用于多尺度、不同密度或维数的数据集,对簇类中心选取过程进行优化,通过计算簇类中心权值的拐点求得最佳簇类数与聚类中心,以定量的方法确定聚类中心,对样本分配策略进行优化,提出两阶段分配算法;
将所述铁路突发事件情景要素输入到IDPC-KNN-TP算法中,得到铁路突发事件的分级结果信息;
所述的获取铁路突发事件分级指标,从所述铁路突发事件分级指标中提取铁路突发事件情景要素,包括:
将情景的理论融入到铁路突发事件分级指标选取中,从铁路突发事件分级指标中的事故的基本信息、事故的状态信息与应急响应信息三个维度提取铁路日常突发事件集的情景要素信息,事故基本信息是铁路突发事故的显性信息,事故状态信息是铁路突发事件演变时隐形信息,应急响应信息是人为干预情况;
设铁路突发事件情景要素为Si,j,其中i∈(1,n)为应急关键情景要素变量的个数,j∈(0,∞)为事故序列,表示的是第j个事故所对应的第i个关键情景要素信息;
将所述铁路突发事件情景要素的不同状态程度用不同的模拟值表达,规范化处理,作为最终选取的铁路突发事件情景要素及其取值;
所述的将所述铁路突发事件情景要素输入到IDPC-KNN-TP算法中,得到铁路突发事件的分级结果信息,包括:
步骤S3-1:将铁路日常突发事件集的情景要素信息S1,j,S2,j,S3,j…Sn,j输入到IDPC-KNN-TP算法中,通过基于k近邻优化的局部密度度量方法计算局部密度ρi与距离δi:
ρi=∑j∈KNN(j)exp(-dij) (1)
其中,dij为数据点i和j之间的欧氏距离,KNN(i)为样本i的k近邻样本集合,数据点i表示分级样本中一个样本点,其由某铁路突发事件的情景要素序列集构成,定义如下:
KNN(i)={j|d(i,j)≤d(i,ki)} (2)
定义距离δi为:
δi是点i与局部密度大于它的点j的最小距离,对于局部密度ρi最高的样本i,其距离δi为:
步骤S3-2:引入簇类中心权值的概念,簇中心权值γi的计算方法如下:
γi=ρi×δi (5)
定义拐点为簇中心权值偏离原点的趋势变化最快的临界点,将簇中心权值γi按照降序排列,计算过程如下;
计算簇中心权值变化趋势,用两点线段的斜率表征簇中心权值下降的趋势,即:
其中表示在区间[i,i+m]中簇中心权值平均变化率,表征了在某一区间内γ的总体变化趋势;
计算簇中心权值的拐点,即簇中心权值下降趋势由急变缓的临界点;
由式(6)可知,为[1,i]区间的平均变化率,/>为[i,i+1]区间的平均变化率,由式(7)可知,拐点为簇中心权值下降趋势变化最快的临界点,其最大值点为拐点,在一定范围内,取拐点及拐点之前的样本点i作为聚类中心点;
步骤S3-3:分配类簇的非中心点,构造局部密度主干区域,从一个聚类中心点开始,依次遍历其k近邻样本,采用k近邻思想对剩余点进行样本分配,遍历所有未分配的样本,计算其k近邻属于不同类簇的数量,将k近邻的最大值所在聚类作为该样本所属聚类,遍历直到所有点被分配为止,得到铁路突发事件分级结果,通过铁路突发事件分级结果得到输入的事故情景要素集划分的级别数量、每个级别包含的事故样本和某一铁路突发事故对应的事故级别。
2.根据权利要求1所述的方法,其特征在于,参数化后的铁路突发事件情景要素及其取值包括:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211010989.5A CN115374855B (zh) | 2022-08-23 | 2022-08-23 | 一种基于聚类的对铁路突发事件进行分级的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211010989.5A CN115374855B (zh) | 2022-08-23 | 2022-08-23 | 一种基于聚类的对铁路突发事件进行分级的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115374855A CN115374855A (zh) | 2022-11-22 |
CN115374855B true CN115374855B (zh) | 2024-05-14 |
Family
ID=84067061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211010989.5A Active CN115374855B (zh) | 2022-08-23 | 2022-08-23 | 一种基于聚类的对铁路突发事件进行分级的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115374855B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109242209A (zh) * | 2018-10-12 | 2019-01-18 | 北京交通大学 | 基于K-means聚类的铁路突发事件分级预警方法 |
CN109582003A (zh) * | 2018-12-03 | 2019-04-05 | 东北林业大学 | 基于伪标签半监督核局部费舍尔判别分析轴承故障诊断 |
KR101982753B1 (ko) * | 2017-12-12 | 2019-05-27 | (주)위세아이텍 | 열차사고 위험도 예측 장치 및 방법 |
CN110232414A (zh) * | 2019-06-11 | 2019-09-13 | 西北工业大学 | 基于k近邻与共享近邻的密度峰值聚类算法 |
CN110532298A (zh) * | 2019-08-07 | 2019-12-03 | 北京交通大学 | 多属性铁路事故致因权重分析方法 |
CN111079860A (zh) * | 2019-12-31 | 2020-04-28 | 河海大学常州校区 | 基于情景相似度的突发事件多粒度响应模型构建方法 |
CN113378968A (zh) * | 2021-06-28 | 2021-09-10 | 北京辰安科技股份有限公司 | 基于K-means聚类的建筑火灾分级分类方法和装置 |
CN113436433A (zh) * | 2021-06-24 | 2021-09-24 | 福建师范大学 | 一种高效的城市交通离群值检测方法 |
CN113793241A (zh) * | 2021-08-20 | 2021-12-14 | 北京交通大学 | 一种基于深度学习的铁路突发事件应急情景推演方法 |
CN113971426A (zh) * | 2020-07-22 | 2022-01-25 | 中移(苏州)软件技术有限公司 | 一种信息获取方法、装置、设备及存储介质 |
CN114862095A (zh) * | 2022-03-21 | 2022-08-05 | 武汉理工大学 | 识别复杂水域船舶交通冲突热点的区域交通划分方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10839256B2 (en) * | 2017-04-25 | 2020-11-17 | The Johns Hopkins University | Method and apparatus for clustering, analysis and classification of high dimensional data sets |
-
2022
- 2022-08-23 CN CN202211010989.5A patent/CN115374855B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101982753B1 (ko) * | 2017-12-12 | 2019-05-27 | (주)위세아이텍 | 열차사고 위험도 예측 장치 및 방법 |
CN109242209A (zh) * | 2018-10-12 | 2019-01-18 | 北京交通大学 | 基于K-means聚类的铁路突发事件分级预警方法 |
CN109582003A (zh) * | 2018-12-03 | 2019-04-05 | 东北林业大学 | 基于伪标签半监督核局部费舍尔判别分析轴承故障诊断 |
CN110232414A (zh) * | 2019-06-11 | 2019-09-13 | 西北工业大学 | 基于k近邻与共享近邻的密度峰值聚类算法 |
CN110532298A (zh) * | 2019-08-07 | 2019-12-03 | 北京交通大学 | 多属性铁路事故致因权重分析方法 |
CN111079860A (zh) * | 2019-12-31 | 2020-04-28 | 河海大学常州校区 | 基于情景相似度的突发事件多粒度响应模型构建方法 |
CN113971426A (zh) * | 2020-07-22 | 2022-01-25 | 中移(苏州)软件技术有限公司 | 一种信息获取方法、装置、设备及存储介质 |
CN113436433A (zh) * | 2021-06-24 | 2021-09-24 | 福建师范大学 | 一种高效的城市交通离群值检测方法 |
CN113378968A (zh) * | 2021-06-28 | 2021-09-10 | 北京辰安科技股份有限公司 | 基于K-means聚类的建筑火灾分级分类方法和装置 |
CN113793241A (zh) * | 2021-08-20 | 2021-12-14 | 北京交通大学 | 一种基于深度学习的铁路突发事件应急情景推演方法 |
CN114862095A (zh) * | 2022-03-21 | 2022-08-05 | 武汉理工大学 | 识别复杂水域船舶交通冲突热点的区域交通划分方法 |
Non-Patent Citations (7)
Title |
---|
An Improved Density Peak Clustering Algorithm Based on K Nearest Neighbors and Tissue-like P System;Fuhua Ge et al;2022 5th International Conference on Advanced Electronic Materials, Computers and Software Engineering (AEMCSE);20220424;全文 * |
K近邻优化的密度峰值快速搜索聚类算法;谢娟英;高红超;谢维信;;中国科学:信息科学;20160220(第02期);全文 * |
基于KL散度的密度峰值聚类算法;丁志成;葛洪伟;周竞;;重庆邮电大学学报(自然科学版);20190615(第03期);全文 * |
基于K近邻和优化分配策略的密度峰值聚类算法;孙林等;软件学报;20211026;全文 * |
基于情景划分的突发事件应急响应策略库构建方法;陈祖琴;苏新宁;;图书情报工作;20141005(第19期);全文 * |
基于改进快速密度峰值聚类算法的电力大数据异常值检测;刘凤魁;邓春宇;王晓蓉;王新迎;;电力信息与通信技术;20170615(第06期);全文 * |
基于聚类分析的高速铁路突发事故等级划分;艾倩楠;;内江科技;20191225(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115374855A (zh) | 2022-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110378869B (zh) | 一种样本自动标注的钢轨扣件异常检测方法 | |
CN112819207B (zh) | 基于相似性度量的地质灾害空间预测方法、系统及存储介质 | |
CN110796859A (zh) | 基于交通流的实时交通状态辨识及事故风险预警方法 | |
CN107610469A (zh) | 一种考虑多因素影响的日维度区域交通指数预测方法 | |
CN109242209B (zh) | 基于K-means聚类的铁路突发事件分级预警方法 | |
CN103745229A (zh) | 一种基于svm的轨道交通故障诊断方法及系统 | |
CN111179592B (zh) | 基于时空数据流融合分析的城市交通预测方法和系统 | |
CN104050361A (zh) | 一种监狱服刑人员危险性倾向的智能分析预警方法 | |
CN109598931B (zh) | 基于交通安全风险的群体划分与差异性分析方法及系统 | |
CN117611015B (zh) | 一种建筑工程质量实时监测系统 | |
CN113569462A (zh) | 一种计及天气因素的配电网故障等级预测方法及系统 | |
CN108154256A (zh) | 预测风险值的确定方法及装置、存储介质 | |
CN112800115A (zh) | 数据处理方法及数据处理装置 | |
CN112101779A (zh) | 基于主客观结合的结构熵权法机场场面运行综合评价系统 | |
CN115311858A (zh) | 基于交通流韧性的城市路段分级管制方法 | |
CN115374855B (zh) | 一种基于聚类的对铁路突发事件进行分级的方法 | |
CN116957361B (zh) | 一种基于虚实结合的船舶任务系统健康状态检测方法 | |
CN113824580B (zh) | 一种网络指标预警方法及系统 | |
CN118134700A (zh) | 一种桥梁结构综合智能养护决策方法及系统 | |
CN111341096B (zh) | 一种基于gps数据的公交运行状态评估方法 | |
CN115830873B (zh) | 城市道路交通事件分类方法、装置、设备及可读存储介质 | |
CN106709522B (zh) | 一种基于改进模糊三角数的高压电缆施工缺陷分级方法 | |
CN110196797B (zh) | 适于信用评分卡系统的自动优化方法和系统 | |
CN109344729B (zh) | 一种识别道路中人员运动的方法 | |
CN116484266A (zh) | 一种精细城市用地类型识别模型训练方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |