CN113780682B - 基于故障标志物的轨道交通系统业务故障预测方法 - Google Patents
基于故障标志物的轨道交通系统业务故障预测方法 Download PDFInfo
- Publication number
- CN113780682B CN113780682B CN202111154631.5A CN202111154631A CN113780682B CN 113780682 B CN113780682 B CN 113780682B CN 202111154631 A CN202111154631 A CN 202111154631A CN 113780682 B CN113780682 B CN 113780682B
- Authority
- CN
- China
- Prior art keywords
- fault
- time
- parameters
- parameter
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 239000003550 marker Substances 0.000 claims abstract description 98
- 238000004458 analytical method Methods 0.000 claims abstract description 67
- 230000008878 coupling Effects 0.000 claims abstract description 21
- 238000010168 coupling process Methods 0.000 claims abstract description 21
- 238000005859 coupling reaction Methods 0.000 claims abstract description 21
- 238000012549 training Methods 0.000 claims description 70
- 238000012360 testing method Methods 0.000 claims description 32
- 238000012216 screening Methods 0.000 claims description 30
- 238000012546 transfer Methods 0.000 claims description 26
- 238000012353 t test Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 16
- 230000008859 change Effects 0.000 claims description 13
- 230000000694 effects Effects 0.000 claims description 11
- 238000012544 monitoring process Methods 0.000 claims description 11
- 238000000692 Student's t-test Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000010219 correlation analysis Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000011084 recovery Methods 0.000 claims description 4
- 238000007621 cluster analysis Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000013139 quantization Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 abstract description 7
- 239000000523 sample Substances 0.000 description 44
- 238000010586 diagram Methods 0.000 description 10
- 238000004088 simulation Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000010205 computational analysis Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010832 independent-sample T-test Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于故障标志物的轨道交通系统业务故障预测方法,其包括以下步骤,步骤一:基于轨道交通系统业务参数进行目标参数分析与预处理;步骤二:进行业务故障标志物识别;步骤三:基于滑动时间窗进行业务故障标志物的故障预测。本发明通过对轨道交通系统业务参数进行分析、处理并识别业务故障标志物,通过滑动时间窗进行业务故障标志物的故障预测,能够帮助轨道交通运营公司和研究人员深入理解轨道交通系统业务故障的耦合机理,并从故障机理角度对轨道交通系统业务故障标志物进行识别与筛选,从而支持对轨道交通系统业务故障进行分析与准确预测。
Description
技术领域
本申请涉及可靠性及安全系统工程领域,具体地涉及一种基于故障标志物的轨道交通系统业务故障预测方法。
背景技术
随着科技的发展,轨道交通系统运输业务从单一线路发展为耦合多线路来满足乘客的复杂出行需求,保证运输业务的高可靠运营是轨道交通运营公司运维管理的目标。业务可靠性研究的核心是业务故障,对于轨道交通系统而言,乘客及轨道交通运营公司最关注的是由于拥塞引发的轨道交通运输业务故障,即拥塞导致运输业务无法满足乘客群体准时到达目的站点的出行需求。轨道交通业务故障的发生受多线路业务的复杂动态耦合影响,导致支持故障预测的众多监控指标间具有复杂的动态耦合关系,在这种情况下,如何准确有效预测轨道交通业务故障是轨道交通运营管理过程中需要解决的关键问题,其可以预防轨道交通业务故障的发生以及对业务故障的早期处理和恢复。
当前的故障预测方法,无论是基于故障机理还是基于数据驱动的方法,对轨道交通系统业务故障的特征和机理分析不足,包括对业务故障的特征分析不充分、对业务耦合关系的分析不全面,缺乏这些故障分析的基础,便难以在众多可监测参数中识别与业务故障相关的关键性参数及其耦合关系,进一步无法支持准确有效地预测轨道交通系统业务故障。因此,需要提供一种基于故障标志物的业务拥塞故障预测方法,能够识别一组表征业务拥塞故障的关键性参数及其耦合,并基于此对业务拥塞故障进行预测。
发明内容
为了克服现有技术的不足,解决已有故障预测方法由于缺乏对耦合多业务运行下业务故障机理的分析,难以在众多可监测参数中识别并筛选出与业务故障相关的关键参数及其耦合关系,导致其不适用于轨道交通业务故障的预测这一问题,本发明提出一种基于故障标志物的轨道交通系统业务故障预测方法,该方法从业务故障机理角度出发,在识别故障标志物过程中充分考虑了业务间耦合关系,能够针对不同线路运输业务给出对应的故障标志物,并根据该标志物的变化规律能准确有效地预测该业务故障的发生,其可以指导轨道交通运营公司提前采取有效的业务故障预防措施和方案,综合提高轨道交通系统运输业务的管理水平。
为实现上述目的,本发明所采用的解决方案为:
一种基于故障标志物的轨道交通系统业务故障预测方法,其包括以下步骤:
步骤1:采集待分析轨道交通系统底层监测数据,基于所述底层监测数据进行业务故障标志物备选参数的分析与预处理,具体包括业务故障标志物备选参数分析、业务故障标志物备选参数预处理和业务故障判据分析;
步骤2:业务故障标志物识别,具体包括以下步骤:
步骤21:对所述步骤1获得的业务故障标志物备选参数进行显著性分析,获得显著性表达参数,所述显著性分析包括t检验筛选、伪发现率FDR筛选和差异表达Fold-change筛选;
步骤22:对所述步骤21获得的显著性表达参数进行相关性分析,获得关键性参数组,所述相关性分析包括计算相关性系数、计算参数相关距离和基于参数相关距离的聚类分析;
步骤23:计算所述步骤22获得的关键性参数组的综合指标CI、关键性参数组中所有参数的标准差的均值SD和BZ;
步骤24:根据所述步骤23获得的关键性参数组的综合指标CI,识别业务故障标志物,具体为绘制所述关键性参数组的综合指标CI、关键性参数组中所有参数的标准差的均值SD和BZ随时间变化的曲线,指标l∈{SD,BZ,CI},获取所述指标l随时间变化的曲线中的最高峰位置、次高峰的影响和最高峰的峰度Kl:
式中:μl为指标l全过程中的均值;σl为指标l全过程中的标准差;vi l为指标l的第i个时序数据;N为全过程时间点总数;
对于所述指标l,所述最高峰位置为所述指标l随时间变化的曲线最高峰值所处的时间点,如果所述时间点位于正常状态时间段内,则所述指标l的得分scorel为0,所述正常状态时间段包括故障输入之前和故障完全恢复之后;所述次高峰为所述随时间变化的曲线中第二高的波峰所处的时间点,如果所述次高峰在所述最高峰之前,并且所述次高峰的高度超过了所述最高峰的高度的80%,则认为所述次高峰对所述最高峰产生影响,则所述指标l的得分scorel为0,利用所述最高峰的峰度Kl计算关键性参数组的综合得分,具体为:对所述峰度Kl进行归一化获得关键性参数组的综合指标CI、关键性参数组中所有参数的标准差的均值SD和BZ的得分分别为scoreCI、scoreSD和scoreBZ,分别对所述scoreCI、scoreSD和scoreBZ赋予权值β1、β2、β3,加和计算得到关键性参数组的综合得分:
score=β1scoreCI+β2scoreSD+β3scoreBZ
选取所述综合得分最高的关键性参数组作为业务故障标志物的参数,所述关键性参数组的综合指标CI的计算公式为所述关键性参数组的耦合关系,所述业务故障标志物包括所述业务故障标志物的参数和所述关键性参数组的耦合关系;
步骤3:基于滑动时间窗进行所述步骤2获得的业务故障标志物的故障预测。
可优选的是,所述步骤3中划分滑动时间窗具体为划分3个时间窗,所述时间窗的大小为4个时间步。
可优选的是,所述步骤1业务故障标志物备选参数分析具体包括以下步骤:
步骤11:采集待分析轨道交通系统底层监测数据,所述底层监测数据包括直接可测的实时参数和动态可调参数,所述直接可测的实时参数包括实时断面客流量、实时进站口人数、实时出站口人数、实时大厅人数、实时站台人数和实时换乘区人数,所述动态可调参数包括实时列车运行速度、实时进站口容量、实时出站口容量、实时大厅容量、实时站台容量、实时换乘区容量和实时车厢容量;
步骤12:将所述步骤11采集的底层监测数据中早于业务状态参数变化的参数作为预先变化参数,获得训练集样本和测试集样本,所述训练集样本包括训练集故障样本和训练集正常样本;
步骤13:对所述步骤12获得的训练集故障样本,基于相关系数过滤法获得业务故障标志物备选参数。
可优选的是,所述步骤13基于相关系数过滤法获得业务故障标志物备选参数具体为:在全时间周期内取n个时间点,选取所述训练集故障样本中某一类参数{x1,x2,x3,...,xM}与同时期的业务的平均留乘时长y之间的皮尔逊相关系数PCCn(xr,y)中最大的一类参数作为业务故障标志物备选参数:
式中:xr为{x1,x2,x3,...,xM}中的第r个参数;M为{x1,x2,x3,...,xM}中参数的数量;和yb分别为在第b个时间点的参数xr和y的表达值;和分别为xr和y参数的平均表达值。
可优选的是,所述步骤1业务故障标志物备选参数预处理具体为对所述业务故障标志物备选参数进行标准化处理:
式中:Dnormal为训练集正常样本数据;Dfailure表示训练集故障样本数据;N、F分别为训练集正常样本数据和训练集故障样本数据标准化后的数据;和SD(Dnormal)分别为多个训练集正常样本数据的均值和标准差。
可优选的是,所述步骤1业务故障判据分析具体为选取业务的平均留乘时长y作为业务故障判据参数,设置业务故障判据参数的阈值。
可优选的是,获得所述步骤21中t检验筛选具体为设置显著性水平,通过双总体独立样本t检验,挑选出训练集正常样本和训练集故障样本间差异表达显著的参数,计算所述差异表达显著的参数的统计量为:
式中:和分别为训练集正常样本和训练集故障样本的均值,和分别为训练集正常样本和训练集故障样本的方差;n1和n2分别为训练集正常样本和训练集故障样本的容量;
进行方差方程的Levene检验分析,根据检验分析结果判断方差是否相等,如果方差相等选取相应的t值,根据t检验的p值与所述显著性水平进行比较来选取拒绝原假设的站点参数,获取t检验筛选后的显著表达的参数;
所述步骤21中伪发现率FDR筛选具体为将所述t检验筛选后的显著表达的参数的p值按照从小到大排列得到p(1),p(2),…,p(j),在p(1),p(2),…,p(j)中挑选w个项满足FDR≤q,具体为:
式中:j为经过t检验筛选后的显著表达的参数的个数;w为满足FDR≤q的最大的正整数;q为量化概率;
将p(1),p(2),…,p(w)的参数作为FDR筛选后的显著表达的参数;
所述步骤21中差异表达Fold-change筛选具体为设置差异倍数,利用标准差对所述FDR筛选后的显著表达的参数进一步筛选,获得显著性表达的参数m,具体为:
Fold(m)≥3
式中:SD(Dfailure)为训练集故障样本的标准差;SD(Dnormal)为训练集正常样本的标准差;最终得到显著性表达的参数组{m1,m2,m3,...,mh};h为显著性表达参数组的参数个数。
进一步,所述步骤22中计算相关性系数具体为:对于所述显著性表达的参数组{m1,m2,m3,...,mh},计算参数间的皮尔逊相关系数;
所述步骤22中计算参数相关距离为通过皮尔逊相关系数计算参数间的相关距离dist(mc,md),具体为:
dist(mc,md)=1-|PCCn(mc,md)|
式中:mc、md为参数组{m1,m2,m3,...,mh}中第c和d个参数;|PCCn(mc,md)|为在全时间周期内的n个时间点参数mc和md间的皮尔逊相关系数;
所述步骤22中基于参数相关距离的聚类分析具体为采用层次聚类中的AGNES算法,根据所述参数相关距离dist(mc,md)对显著性表达的参数组{m1,m2,m3,...,mh}中的参数进行聚类,对聚类得到的每一个时间点对应的确定类数的多个参数组设置参数个数下限,去除掉所述多个参数组中参数个数低于所述个数下限的组,得到关键性参数组{m1,m2,m3,...,mh'},h’为关键性参数组中参数个数。
更进一步的是,所述步骤23中的CI、SD和BZ具体为:
BZ=PCCin/PCCout
式中:PCCin为关键性参数组中参数间皮尔逊相关系数的绝对值的均值;PCCout为关键性参数组中参数与其他参数间皮尔逊相关系数的绝对值的均值;ε为充分小的数;记被所述步骤21筛选掉的参数组为{y1,y2,y3,...,yg},共g个参数;ya为参数组{y1,y2,y3,...,yg}中的第a个参数;mc’、md’为关键性参数组{m1,m2,m3,...,mh'}中第c’和d’个参数;为mc’、md’间的皮尔逊相关系数。
可优选的是,所述步骤3包括划分滑动时间窗、预测时刻分析和结果预测,所述预测时刻分析包括实际故障发生的时刻分析和故障标志物预测的时刻分析;
所述实际故障发生的时刻分析具体为:基于划分滑动时间窗,根据所述步骤1确定的业务故障判据对具体的业务进行分析,结合设置的业务故障判据参数的阈值,确定第一次超过所述阈值的时刻作为所述具体的业务实际故障发生的时刻;
所述故障标志物预测的时刻分析具体为:设置预测业务故障的,将业务故障标志物的综合指标CI值超过所述预测业务故障的阈值的时刻作为故障标志物预测的时刻;
所述步骤3中结果预测具体为对测试集样本根据步骤1中的业务故障标志物备选参数分析与预处理,获取业务故障标志物备选参数,并基于步骤2中的业务故障标志物识别方法,获取业务故障标志物,再结合步骤3中的基于滑动时间窗的故障预测方法进行业务故障预测,获得预测结果,所述预测结果包括预警成功、虚警和预测准确;
指定预警提前时间上限,当所述实际故障发生的时刻与故障标志物预测的时刻的差值大于0且小于所述预警提前时间上限时,所述预测结果为预警成功;
对测试集样本预测时,如果正常样本被检出,所述预测结果为虚警;
指定限定时间区间,对测试集样本预测时,当实际故障发生的时刻与故障标志物预测的时刻的差值落入所述限定时间区间时,所述预测结果为预测准确。
与现有技术相比,本发明的有益效果在于:
(1)本发明能够支持对具有多业务耦合的轨道交通系统业务的描述与建模,识别轨道交通业务故障标志物,实现轨道交通系统业务故障的准确有效的预测。
(2)本发明可以帮助轨道交通运营公司和研究人员深入理解轨道交通系统业务故障的耦合机理,改进和完善对轨道交通系统业务的分析和建模。
附图说明
图1为本发明实施例的基于故障标志物的轨道交通系统业务故障预测方法的控制框图;
图2为本发明实施例的指标值随时间变化曲线分析流程图;
图3为本发明实施例中滑动时间窗划分示意图;
图4为发明本实施例中换乘人数数据示意图;
图5为本发明实施例中5月1日成都地铁2号线客流数据变化;
图6为本发明实施例中成都地铁1业务的实时换乘人数与平均留乘时长对比图;
图7为本发明实施例中24组关键性参数组得分;
图8(a)、(b)、(c)分别为本发明实施例中1业务故障标志物的SD、BZ、CI值随时间变化的趋势图;
图9为本发明实施例中1业务故障标志物的参数组的具体位置图;
图10(a)、(b)、(c)分别为本发明实施例中车厢人数参数组的SD、BZ、CI值随时间变化的趋势图;
图11(a)、(b)、(c)分别为本发明实施例中等待人数参数组的SD、BZ、CI值随时间变化的趋势图;
图12为本发明实施例中本文滑动时间窗划分后的换乘人数数据;
图13(a)、(b)、(c)分别为本发明实施例中训练集正常样本2、4、6的CI-t图;
图14(a)、(b)、(c)分别为本发明实施例中训练集故障样本1、5、10的CI-t图;
图15(a)、(b)分别为本发明实施例中同一测试样本实际的和预测的业务故障时间;
图16为本发明实施例中预警结果统计图。
具体实施方式
以下,参照附图对本发明的实施方式进行说明。
如图1-9所示,本发明实施例提供了一种基于故障标志物的轨道交通系统业务故障预测方法,可以支持对具有多业务耦合的轨道交通系统业务故障进行分析和预测,为了证明本发明的适用性,将其应用于成都地铁系统的实例,具体包含如下步骤:
S1:基于地铁系统业务参数分析的目标参数分析与预处理,包括业务故障标志物关键性参数的备选参数分析、备选参数预处理、业务故障判据分析;
S1.1业务故障标志物关键性参数的备选参数分析
S1.1.1:获取底层可监测参数
获取地铁业务的底层可监测参数,共13类,如表1所示:
表1
对于成都地铁系统而言,其包含12个业务、160个地铁站,此时一个换乘站算两或三个站,因此对应不同业务的不同站点,按照一个站点所属两个方向线路级业务分别收集参数,13类底层可监测参数中单一类型的参数有320个,若研究k类参数即收集k*320个参数,如图4是业务1换乘人数的部分示意。
每一个参数都有所属业务、站点名称、参数序号的信息。而且为了提高识别效率,不再对仿真的200个时间步一一进行关键性参数组的识别,由于本文是预测业务故障的发生,那么业务故障逐渐恢复的最后面的50个时间步可以不再研究,只用前150个时间步,且每隔3个时间步选取一个时间点,实际只利用50个时间点的数据进行标志物的识别。
S1.1.2:基于理论分析获取可能预先变化的参数,获取训练集样本和测试集样本,训练集样本包括训练集故障样本和训练集正常样本。
本案例中,对13类底层可监测参数进行预先表达分析,根据成都地铁的实际情况,如图5所示,发现2号线上的出站口人数明显滞后于其他参数,不适合用于预测地铁系统业务故障。
动态可调参数,包括列车运行速度、站点多个区域的容量等参数都是地铁运营公司主动调整的,涉及到优化策略,不考虑这些参数。因此,可能适合的参数有实时车厢人数、实时进站口人数、实时大厅人数、实时站台人数、实时换乘区人数共5类,即换乘人数共5类。
S1.1.3:基于相关系数过滤法获取故障标志物的备选参数
在全时间周期内取n个时间点,所有训练集故障样本的某一类参数{x1,x2,x3,...,xM},如与同时期的业务的平均留乘时长y之间的皮尔逊相关系数PCCn(xr,y)中最大的一类参数作为业务故障标志物备选参数:
其中:xr为{x1,x2,x3,...,xM}中的第r个参数,M为{x1,x2,x3,...,xM}中参数的数量,和yb分别为在第b个时间点的参数xr和y的表达值;和分别为xr和y参数的平均表达值。
皮尔逊相关系数的取值区间为[-1,1],+1表示完全的正相关,-1表示完全的负相关,0表示没有线性相关。本步骤选取皮尔逊相关系数最大的几类参数做标志物研究,即故障标志物的备选参数。
本案例中,根据公式(1),1业务的实时换乘人数与平均留乘时长的皮尔逊相关系数的值达到0.98982,可以认为非常相关。
S1.2备选参数预处理
对原始数据进行标准化,其中正常样本的标准化得到均值为0,标准差为1的服从正态分布的参数表达数据,而故障样本的标准化基于正常样本的数据进行,具体公式如下:
其中,Dnormal表示训练集正常样本数据,Dfailure表示训练集故障样本数据,N,F分别表示训练集正常样本数据和训练集故障样本数据标准化后的数据,和SD(Dnormal)分别表示多个训练集正常样本数据的均值和标准差。
通过对80个可用的训练集故障样本进行标准化、取平均值处理后,得到的成都地铁1业务的实时换乘人数与平均留乘时长随时间变化的趋势,如图6所示。
由图6可以看出两类参数紧密相关,因此实时换乘人数适合作为故障标志物的备选参数。
S1.3业务故障判据分析
选取业务的平均留乘时长作为业务故障判据参数,再根据理论和实际情况分析设计合适的阈值。根据成都地铁系统1业务的日常运行情况来看,例如在上下班高峰期拥塞发生时,一般来说,一位乘客搭乘地铁平均需要等待1.5辆列车是可以接受的,因此可以认为delayAPP1=1.5是业务故障的阈值,此时一位乘客需要等待1辆或者2辆列车的概率相等。
S2:业务故障标志物识别方法,包括业务故障标志物备选参数显著性分析、相关性分析、关键性参数组综合指标值计算、基于三大指标值的业务故障标志物选取;
S2.1业务故障标志物备选参数显著性分析
S2.1.1:t检验筛选
在每个时间点,结合训练集正常样本数据和故障样本数据分析该参数差异表达是否显著。具体是设置显著性水平为p<0.05,据此挑选出在正常样本和故障样本间差异表达显著的参数。该步骤通过双总体独立样本t检验来实现,其统计量为:
其中,和分别为训练集正常样本和训练集故障样本的均值,和分别为训练集正常样本和训练集故障样本的方差;n1和n2分别为训练集正常样本和训练集故障样本的容量。
判断过程中先进行方差方程的Levene检验分析,根据结果判断方差是否相等以选取相应的t值,然后根据t检验的p值与0.05进行比较来选取拒绝原假设的站点参数。
S2.1.2:伪发现率FDR筛选
利用伪发现率(false discoveryrate,FDR)挑选出差异变量,其意义是拒绝真的原假设的个数占所有被拒绝的原假设个数的比例的期望值。
设经过t检验筛选得到的显著表达的参数有j个,每个参数对应的p值从小到大排列分别是p(1),p(2),…,p(j),若想控制FDR不超过q,q为量化概率,则只需找到最大的正整数w,使得
即
然后,挑选对应p(1),p(2),…,p(j)的参数做为差异表达参数,这样就能从统计学上保证FDR不超过q。
S2.1.3:差异表达Fold-change筛选
根据不同的参数类型的筛选经验,设置合适的差异倍数,例如3倍,利用标准差进一步筛选差异表达显著的参数。如下式:
若Fold(m)≥3,则认为m是显著性表达的参数,SD(Dfailure)为训练集故障样本的标准差;SD(Dnormal)为训练集正常样本的标准差,最终得到显著性表达的参数组{m1,m2,m3,...,mh},h为显著性表达参数组的参数个数。
在进行本案例备选参数显著性分析过程中,结合仿真实际的情况,本案例中换乘人数的标志物识别采用的是t检验的α=0.05,α表示t检验的显著性水平,差异倍数选择3倍。
S2.2显著性表达参数相关性分析
S2.2.1:相关性系数的计算
对于显著性表达的参数,计算参数间的皮尔逊相关系数。
S2.2.2:参数相关距离的计算
通过皮尔逊相关系数计算参数间的相关距离dist(mc,md),如下:
dist(mc,md)=1-|PCCn(mc,md)| (8)
其中,mc、md为参数组{m1,m2,m3,...,mf}中第c和d个参数;|PCCn(mc,md)|为在全时间周期内的n个时间点参数mc和md间的皮尔逊相关系数。
S2.2.3:基于参数相关距离的聚类分析
利用上一步得到的参数相关距离对大量的显著性表达参数进行聚类,这样每个类中参数间的相关性高。具体选用层次聚类中的AGNES算法,具体算法如下:
聚类结果是每一个时间点都可以得到确定类数的多个参数组,然后设置合适的参数个数下限去除掉参数个数太少的组。
在进行本案例显著性表达参数相关性分析过程中,为迅速筛选出合适的关键性参数组,根据仿真的实际情况,本案例中将层次聚类输出结果设置为3类,并筛去参数个数少于6个的参数组,降低偶然性,最终得到关键性参数组{m1,m2,m3,...,mh}。
S2.3关键性参数组及标志物的挖掘
设某一次标志物识别用到共l个参数,经过前面几个步骤的筛选得到的关键性参数组为{m1,m2,m3,...,mh},包含h个参数,其他的被筛选掉的参数为{e1,e2,e3,...,eg},共g个参数,l=g+h。
设计关键性参数组的综合指标值为CI,计算公式如下:
其中,SD是关键性参数组的标准差的均值,计算公式如下:
PCCin是关键性参数组中参数间皮尔逊相关系数的绝对值的均值,计算公式如下:
PCCout是关键性参数组中参数与其他参数间皮尔逊相关系数的绝对值的均值,计算公式如下:
其中,ε是个充分小的数,以保证整个分式有意义。BZ是PCCin和PCCout比值,计算公式如下:
BZ=PCCin/PCCout (13)
根据步骤13,本次标志物识别用到的参数组{x1,x2,x3,...,xM},经过前面几个步骤的筛选得到关键性参数组{m1,m2,m3,...,mh'}。因此,由筛选掉的参数组成了其他参数组{y1,y2,y3,...,yg}。式中:mc’、md’为关键性参数组{m1,m2,m3,...,mh'}中第c’和d’个参数;h’为关键性参数组的参数个数;其他参数组ya为其他参数组{y1,y2,y3,...,yg}中的第a个参数;g为其他参数组的参数个数;为mc’、md’间的皮尔逊相关系数;PCCin为关键性参数组{m1,m2,m3,...,mh'}中参数间皮尔逊相关系数的绝对值的均值;PCCout为关键性参数组中参数与其他参数组中参数间皮尔逊相关系数的绝对值的均值;ε为充分小的数;
由式(10)可知,SD值体现了关键性参数组的标准差的波动;由式(13)可知,BZ值体现了关键性参数组的参数间相关性,即参数耦合强度;由式(9)可知,CI值是关键性参数组的综合状态值。根据这三大指标随时间变化的曲线特征,从关键性参数组中选出属于业务故障标志物的关键性参数组。
S2.4基于三大指标值的业务故障标志物选取
根据各个关键性参数组的SD、BZ、CI三个指标的变化趋势来决定最满足标志物3大条件即显著、相关、预测的关键性参数组,分别是:
①根据SD-t曲线检验参数组的显著表达性;
②根据BZ-t曲线检验参数组的强相关性;
③根据CI-t曲线检验参数组的预先变化性。
具体来说,每一个条件的曲线特征分析流程都是一样的,都是依次考察指标值随时间变化曲线的最高峰位置、次高峰的影响、最高峰的峰度三个方面。分析流程图如图2所示。
对于上述三类SD、BZ、CI指标,指标l∈{SD,BZ,CI},对于指标l,根据其随时间变化的曲线,最高峰位置是指曲线最高峰所处的时间点,若该时间点位于正常状态时间段内,则得分scorel=0,正常状态时间段包括故障输入之前和故障完全恢复之后。次高峰是指曲线中第二高的波峰,若其处于最高峰之前,且其高度超过了最高峰高度的80%,则认为其可能对最高峰产生影响,则得分scorel=0。
如果最高峰、次高峰都符合要求,则根据最高峰的峰度Kl来计算指标l的得分。
其中Kl是峰度,用于评价曲线波峰的明显程度,μl是指标l全过程中的均值,σl为指标l全过程中的标准差,vi l为指标l的第i个时序数据,N为全过程时间点总数。最后以峰度Kl归一化后来表示该项得分,关键性参数组的综合指标CI、关键性参数组中所有参数的标准差的均值SD和BZ的得分分别为scoreCI、scoreSD和scoreBZ。
综上,将三大条件的得分各自赋予一定的权值β1、β2、β3,加和计算得到该参数组的综合得分:
score=β1scoreCI+β2scoreSD+β3scoreBZ (15)
选取综合得分最高的关键性参数组作为业务故障标志物的实体,以这组关键性参数的名称列表或代号列表的形式输出,公式(9)是这些参数的耦合计算方法。通过业务故障标志物的综合指标值CI值的实时取值实现对业务故障标志物的状态监测,CI值变化的临界点确定故障前状态,最终达到提前预测业务故障发生的目的。这一组关键性参数及其耦合作为预测的依据,即是业务故障标志物。
分别对实时换乘人数、实时车厢人数、实时等待人数三类案例仿真中得到的参数运用关键性参数组综合指标值计算方法、基于三大指标值的标志物选取方法进行分析,最终完成标志物的识别,并分析识别结果。
1)实时换乘人数
本案例从第21~35个时间点中共筛选出了24组关键性参数组,分别根据公式(10)、(13)、(9)对各参数组的SD、BZ、CI值进行计算,得到的3个指标的变化趋势如图7所示。然后依据公式(15),其中设置权值分别为β1=0.3、β2=0.3、β3=0.4,对每一个关键性参数组分别打分,得分见每个子图顶部。
由上述分析,根据最高的得分0.91,最终分析出的1业务故障标志物包含的参数为第11个参数组,这一参数组的SD、BZ、CI值随时间变化的趋势如图8(a)、(b)、(c)所示:
对识别结果进行分析,发现训练集中所有故障样本平均故障峰值的时间点为27.475,由图8可知,此参数组计算综合指标值CI预测的故障峰值的时间点为25,早于27.475,因此可以认为包含此参数组的标志物预先变化,能提前预测1业务故障的发生。利用实时换乘人数的数据识别出的成都地铁1业务故障标志物,其包含的关键性参数如表2所示。
表2案例识别出的业务故障标志物包含的关键性参数
参数序号 | 参数名称 |
79 | 3业务的衣冠庙的实时换乘人数 |
104 | 4业务的太升南路的实时换乘人数 |
106 | 4业务的宽窄巷子的实时换乘人数 |
233 | 9业务的磨子桥的实时换乘人数 |
271 | 10业务的宽窄巷子的实时换乘人数 |
273 | 10业务的太升南路的实时换乘人数 |
可以看出,识别出的业务故障标志物既有参数信息,即参数种类,又有位置信息和业务信息,即所属业务,还有参数类型信息,为了更清晰的展示,将各参数落在网络拓扑的具体位置上,如图8(a)、(b)、(c)所示。
该标志物是利用实时换乘人数识别出来的,包含的参数分布在3业务、4业务、9业务和10业务这4个与1业务耦合紧密的业务上,验证了建模过程中初步理论分析的正确性,也区别于传统的预测方法只针对本业务,即1业务参数研究的思路,证明了考虑业务耦合关系的重要性。
这6个参数是1业务的故障标志物的实体,通过计算他们的CI值进行组合,观察CI值的变化趋势进一步用于1业务故障的预测。
2)实时车厢人数
这类型参数识别出的标志物质量不高,说明这类参数本身的预测效果不行,与前文备选参数的理论分析结果一致,仿真数据中此类参数与平均留乘时长相关性不高。图10展示一个相对最好的参数组的计算分析结果,因为预测效果很差,不能称之为故障标志物。
由图10(a)可知,SD值变化趋势相对于换乘人数的SD值变化趋势比较不稳定,并没有呈现明显的先上升后下降的变化趋势,且经过后期的试验证明,预测效果确实很差,因此后面不再考虑。
3)实时等待人数
与车厢人数同理,这类型参数识别出的标志物质量不高,说明这类参数本身的预测效果不行。图11展示一个相对最好的参数组的计算分析结果,同理不能称之为故障标志物。由图11可知,与实时车厢人数识别出的标志物有类似的问题,不再赘述。
S3:基于滑动时间窗下业务故障标志物的故障预测方法,包括滑动时间窗的划分、预测时刻分析、预测结果分析;
S3.1滑动时间窗的划分
本文的时间窗划分方法,如图3所示。图3中划分了3个时间窗,时间窗大小为4个时间步,计算时会用到5个时刻的数据,每个时间窗以正中间的时刻作为重要时间点。
本文案例的预测时刻分析中,利用的是80个可用的训练集故障样本。此外,用50个正常样本作为案例的预测时刻分析的辅助。而在预测结果的分析过程中,用到的是测试集的样本,本文从60个测试样本中,同样经过业务状态变化曲线delay-t的筛选,去掉一些变化过于异常的样本,得到50个可用的测试样本,进行预测。
一般来说,时间窗的大小以4、6、8为宜,而在本案例中,业务演化条件前后两次变化的时间分别为第60和第90个时间步,即实际业务故障发生的前后过程不超过30个时间步,若时间窗大小为4,即每隔3个时间步取1个时间点,可获取10个最关键的时间点;若时间窗大小为6,即每隔4个时间步取1个时间点,可获取7个最关键的时间点;若时间窗大小为8,可获取6个最关键的时间点。因此,可以看出在本案例中由于业务故障发生较快,不超过30个时间步,时间窗不宜过大,本案例时间窗大小设置为4比较合适,每个时间窗中包含5个数据,数据存储在Excel表格中,如图12所示。
表格从横向来看是各个站点,从纵向来看是每5行为一个时间点,案例中共50个时间点,即图中是各个站点的每个时间点的换乘人数数据。
S3.2预测时刻分析
Step1:实际故障发生时刻:
根据前面的分析,对具体的业务通过对其业务故障判据的分析,结合实际经验来设定判据的阈值,第一次超过该阈值的时刻即为该业务故障发生的时刻。本案例中,设定第一次业务的平均留乘时长delay≥1.5的时刻即为业务故障发生的时刻。
Step2:故障标志物预测的时刻:
CI值在某一时刻陡增,超过一定的阈值即预测故障发生,“陡增”的意思是指曲线在这一时刻附近有明显的、较快的上升趋势,“阈值”是根据经验分析得出的,超过这一阈值的那个时刻即确定为预测时刻。
根据预测结果的经验分析,设定第一次换乘人数标志物的CI≥10的时刻即为标志物预测的时刻。
一方面,训练集中的正常样本的CI值的表现,发现正常样本的CI值全仿真周期内都不会超过10,而且还有一定的差距,设置10为故障的预先判定比较合适。图13展示3个训练集正常样本的CI-t图。
从图13中可以看出,正常样本的CI值波动的最高值均介于7~8之间,距离上限10还有一定的距离,CI=10的阈值设计顺应业务故障并不是正常状态下的波动的现实。
另一方面,训练集中的故障样本CI值的表现,由于CI值相比于业务故障状态优先变化,在业务演化条件变化之前一段时间以及业务故障恢复到正常状态之后,故障样本的CI值都在10以下,设置10为故障的预先判定能比较好地区分正常状态和故障状态的时段。图14展示3个训练集故障样本的CI-t图。
图15(b)中,第21个时刻的刻度线表示CI超过10,可以看出,这些样本在业务演化条件变化,即第20个时间点之前的CI值均不会超过10,即约第17个时间点之前的时段,且第30个时间点在业务演化条件再次变化故障逐渐恢复后,约第45个时间点以后的时段,CI值也会回落到10以下,也佐证了正常状态下CI值不会波动超过设定的10的上限。
S3.3预测结果分析
对测试集样本的预测结果通过以下三个方面来分析:
(1)预警Early Warning是指能提前预报故障的发生,只需满足提前预报的要求即算预警成功。
在测试集样本中,对于会发生故障的样本,利用实际故障发生的时间点减去业务故障标志物的CI值预测的时间点,差值大于0,且小于一定的上限,该上限根据实际情况进行规定,因为预警提前的时间太早不可信,即为预警成功。
对应指标是预警成功率/故障检出率:测试样本中的业务故障提前一段合适的时间被检测出来的比例。
(2)虚警FalseAlarm是指在预测中正常状态被检测出故障。
在测试集样本中,对于不会发生故障的样本,方法却预测出会发生故障,此即为一次虚警。
对应指标是虚警率:测试样本中正常状态被检测出故障的比例。
(3)预测Prediction是指在一定的提前时间的区间内,成功预报故障发生,对提前时间的区间的大小有要求。
在测试集样本中,对于会发生故障的样本,限定一定长度的时间区间,若实际故障发生的时间点减去业务故障标志物预测的时间点的差值落在这一时间区间内,即认为这次预测准确。
对应指标是预测准确率:限定一定长度的时间区间,在这一时间区间内测试样本中预测故障发生的样本占所有测试样本的比例。
基于上述的三个方面的指标对本文的预测方法进行评价,证明基于故障标志物的地铁系统业务故障预测方法的有效性。
利用50个测试样本检测标志物的预警效果。如图15分别展示了同一个测试样本,即测试样本17的实际的delay-t曲线和业务故障标志物CI-t曲线。
图15(a)中故障的实际发生在第28个时间点,而图15(b)中业务故障标志物预测的故障发生在第21个时间点,因此提前了7个时间点预测业务故障的发生。
然后将测试集各个样本实际发生故障的时间点减去标志物预测的时间点,得到的差值进行统计,得到的结果如表3所示。若差值≤0即认为没有预警效果,若差值>10,即提前30分钟则认为时间差太大,预测结果不实用也不可信,因此具体统计提前1~10个时间点,即提前3~30分钟的预测结果。图16将预警结果进行统计。
表3预警结果统计表
提前时间点 | ≤0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | >10 |
个数 | 0 | 0 | 0 | 2 | 4 | 3 | 10 | 12 | 12 | 5 | 2 | 0 |
由表3和图16可知,预警都提前3~10个时间点,即提前9~30分钟预测故障的发生,在合理的区间内,即提前9~30分钟内预警率达到100%,可以说明,本方法筛选得到的标志物预警效果很好。
而且预警时间分布还呈现一定的集中趋势,在提前6~8个时间点内,允许一定的波动,即18~24分钟的区间内的预警占比达到68%,在提前6~9个时间点内,即18~27分钟的共10分钟的区间内的预警占比达到78%,可以说明,本方法筛选得到的标志物有较好的预测效果。
因此,针对提出的三个指标,案例预测的结果为:
1)预警成功率/故障检出率
由上述案例结果可知,故障检出率达到100%。
2)虚警率
本文对50个未发生业务故障的样本做了测试,发现只有2个样本被误检出故障,因此虚警率为4%。
3)预测准确率
由上述案例结果分析可知,在提早18~24分钟的区间内,预测准确率达到68%;在提早18~27分钟的区间内,预测准确率达到78%。
综上,本案例的预测结果证明了识别出的故障标志物对成都地铁系统1业务故障具有很好的预警和预测效果。
(1)本发明能够支持对具有多业务耦合的轨道交通系统业务的描述与建模,识别轨道交通业务故障标志物,实现轨道交通系统业务故障的准确有效的预测。
(2)本发明可以帮助轨道交通运营公司和研究人员深入理解轨道交通系统业务故障的耦合机理,改进和完善对轨道交通系统业务的分析和建模。
以上所述的实施例仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (10)
1.一种基于故障标志物的轨道交通系统业务故障预测方法,其特征在于,其包括以下步骤:
步骤1:采集待分析轨道交通系统底层监测数据,基于所述底层监测数据进行业务故障标志物备选参数的分析与预处理,具体包括业务故障标志物备选参数分析、业务故障标志物备选参数预处理和业务故障判据分析;
步骤2:业务故障标志物识别,具体包括以下步骤:
步骤21:对所述步骤1获得的业务故障标志物备选参数进行显著性分析,获得显著性表达参数,所述显著性分析包括t检验筛选、伪发现率FDR筛选和差异表达Fold-change筛选;
步骤22:对所述步骤21获得的显著性表达参数进行相关性分析,获得关键性参数组,所述相关性分析包括计算相关性系数、计算参数相关距离和基于参数相关距离的聚类分析;
步骤23:计算所述步骤22获得的关键性参数组的综合指标CI、关键性参数组中所有参数的标准差的均值SD和BZ;
步骤24:根据所述步骤23获得的关键性参数组的综合指标CI,识别业务故障标志物,具体为绘制所述关键性参数组的综合指标CI、关键性参数组中所有参数的标准差的均值SD和BZ随时间变化的曲线,指标l∈{SD,BZ,CI},获取所述指标l随时间变化的曲线中的最高峰位置、次高峰的影响和最高峰的峰度Kl:
式中:μl为指标l全过程中的均值;σl为指标l全过程中的标准差;vi l为指标l的第i个时序数据;N为全过程时间点总数;
对于所述指标l,所述最高峰位置为所述指标l随时间变化的曲线最高峰值所处的时间点,如果所述时间点位于正常状态时间段内,则所述指标l的得分scorel为0,所述正常状态时间段包括故障输入之前和故障完全恢复之后;所述次高峰为所述随时间变化的曲线中第二高的波峰所处的时间点,如果所述次高峰在所述最高峰之前,并且所述次高峰的高度超过了所述最高峰的高度的80%,则认为所述次高峰对所述最高峰产生影响,则所述指标l的得分scorel为0,利用所述最高峰的峰度Kl计算关键性参数组的综合得分,具体为:对所述峰度Kl进行归一化获得关键性参数组的综合指标CI、关键性参数组中所有参数的标准差的均值SD和BZ的得分分别为scoreCI、scoreSD和scoreBZ,分别对所述scoreCI、scoreSD和scoreBZ赋予权值β1、β2、β3,加和计算得到关键性参数组的综合得分:
score=β1scoreCI+β2scoreSD+β3scoreBZ
选取所述综合得分最高的关键性参数组作为业务故障标志物的参数,所述关键性参数组的综合指标CI的计算公式为所述关键性参数组的耦合关系,所述业务故障标志物包括所述业务故障标志物的参数和所述关键性参数组的耦合关系;
步骤3:基于滑动时间窗进行所述步骤2获得的业务故障标志物的故障预测。
2.根据权利要求1所述的基于故障标志物的轨道交通系统业务故障预测方法,其特征在于,所述步骤3中划分滑动时间窗具体为划分3个时间窗,所述时间窗的大小为4个时间步。
3.根据权利要求1或2所述的基于故障标志物的轨道交通系统业务故障预测方法,其特征在于,所述步骤1业务故障标志物备选参数分析具体包括以下步骤:
步骤11:采集待分析轨道交通系统底层监测数据,所述底层监测数据包括直接可测的实时参数和动态可调参数,所述直接可测的实时参数包括实时断面客流量、实时进站口人数、实时出站口人数、实时大厅人数、实时站台人数和实时换乘区人数,所述动态可调参数包括实时列车运行速度、实时进站口容量、实时出站口容量、实时大厅容量、实时站台容量、实时换乘区容量和实时车厢容量;
步骤12:将所述步骤11采集的底层监测数据中早于业务状态参数变化的参数作为预先变化参数,获得训练集样本和测试集样本,所述训练集样本包括训练集故障样本和训练集正常样本;
步骤13:对所述步骤12获得的训练集故障样本,基于相关系数过滤法获得业务故障标志物备选参数。
4.根据权利要求3所述的基于故障标志物的轨道交通系统业务故障预测方法,其特征在于,所述步骤13基于相关系数过滤法获得业务故障标志物备选参数具体为:在全时间周期内取n个时间点,选取所述训练集故障样本中某一类参数{x1,x2,x3,...,xM}与同时期的业务的平均留乘时长y之间的皮尔逊相关系数PCCn(xr,y)中最大的一类参数作为业务故障标志物备选参数:
式中:xr为{x1,x2,x3,...,xM}中的第r个参数;M为{x1,x2,x3,...,xM}中参数的数量;和yb分别为在第b个时间点的参数xr和y的表达值;和分别为xr和y参数的平均表达值。
5.根据权利要求1或2所述的基于故障标志物的轨道交通系统业务故障预测方法,其特征在于,所述步骤1业务故障标志物备选参数预处理具体为对所述业务故障标志物备选参数进行标准化处理:
式中:Dnormal为训练集正常样本数据;Dfailure表示训练集故障样本数据;N、F分别为训练集正常样本数据和训练集故障样本数据标准化后的数据;和SD(Dnormal)分别为多个训练集正常样本数据的均值和标准差。
6.根据权利要求1或2所述的基于故障标志物的轨道交通系统业务故障预测方法,其特征在于,所述步骤1业务故障判据分析具体为选取业务的平均留乘时长y作为业务故障判据参数,设置业务故障判据参数的阈值。
7.根据权利要求1或2所述的基于故障标志物的轨道交通系统业务故障预测方法,其特征在于,获得所述步骤21中t检验筛选具体为设置显著性水平,通过双总体独立样本t检验,挑选出训练集正常样本和训练集故障样本间差异表达显著的参数,计算所述差异表达显著的参数的统计量为:
式中:和分别为训练集正常样本和训练集故障样本的均值,和分别为训练集正常样本和训练集故障样本的方差;n1和n2分别为训练集正常样本和训练集故障样本的容量;
进行方差方程的Levene检验分析,根据检验分析结果判断方差是否相等,如果方差相等选取相应的t值,根据t检验的p值与所述显著性水平进行比较来选取拒绝原假设的站点参数,获取t检验筛选后的显著表达的参数;
所述步骤21中伪发现率FDR筛选具体为将所述t检验筛选后的显著表达的参数的p值按照从小到大排列得到p(1),p(2),…,p(j),在p(1),p(2),…,p(j)中挑选w个项满足FDR≤q,具体为:
式中:j为经过t检验筛选后的显著表达的参数的个数;w为满足FDR≤q的最大的正整数;q为量化概率;
将p(1),p(2),…,p(w)的参数作为FDR筛选后的显著表达的参数;
所述步骤21中差异表达Fold-change筛选具体为设置差异倍数,利用标准差对所述FDR筛选后的显著表达的参数进一步筛选,获得显著性表达的参数m,具体为:
Fold(m)≥3
式中:SD(Dfailure)为训练集故障样本的标准差;SD(Dnormal)为训练集正常样本的标准差;最终得到显著性表达的参数组{m1,m2,m3,...,mh};h为显著性表达参数组的参数个数。
8.根据权利要求7所述的基于故障标志物的轨道交通系统业务故障预测方法,其特征在于,所述步骤22中计算相关性系数具体为:对于所述显著性表达的参数组{m1,m2,m3,...,mh},计算参数间的皮尔逊相关系数;
所述步骤22中计算参数相关距离为通过皮尔逊相关系数计算参数间的相关距离dist(mc,md),具体为:
dist(mc,md)=1-|PCCn(mc,md)|
式中:mc、md为参数组{m1,m2,m3,...,mh}中第c和d个参数;|PCCn(mc,md)|为在全时间周期内的n个时间点参数mc和md间的皮尔逊相关系数;
所述步骤22中基于参数相关距离的聚类分析具体为采用层次聚类中的AGNES算法,根据所述参数相关距离dist(mc,md)对显著性表达的参数组{m1,m2,m3,...,mh}中的参数进行聚类,对聚类得到的每一个时间点对应的确定类数的多个参数组设置参数个数下限,去除掉所述多个参数组中参数个数低于所述个数下限的组,得到关键性参数组{m1,m2,m3,...,mh'},h’为关键性参数组中参数个数。
9.根据权利要求8所述的基于故障标志物的轨道交通系统业务故障预测方法,其特征在于,所述步骤23中的CI、SD和BZ具体为:
BZ=PCCin/PCCout
式中:PCCin为关键性参数组中参数间皮尔逊相关系数的绝对值的均值;PCCout为关键性参数组中参数与其他参数间皮尔逊相关系数的绝对值的均值;ε为充分小的数;记被所述步骤21筛选掉的参数组为{y1,y2,y3,...,yg},共g个参数;ya为参数组{y1,y2,y3,...,yg}中的第a个参数;mc’、md’为关键性参数组{m1,m2,m3,...,mh'}中第c’和d’个参数;为mc’、md’间的皮尔逊相关系数。
10.根据权利要求1所述的基于故障标志物的轨道交通系统业务故障预测方法,其特征在于,所述步骤3包括划分滑动时间窗、预测时刻分析和结果预测,所述预测时刻分析包括实际故障发生的时刻分析和故障标志物预测的时刻分析;
所述实际故障发生的时刻分析具体为:基于划分滑动时间窗,根据所述步骤1确定的业务故障判据对具体的业务进行分析,结合设置的业务故障判据参数的阈值,确定第一次超过所述阈值的时刻作为所述具体的业务实际故障发生的时刻;
所述故障标志物预测的时刻分析具体为:设置预测业务故障的,将业务故障标志物的综合指标CI值超过所述预测业务故障的阈值的时刻作为故障标志物预测的时刻;
所述步骤3中结果预测具体为对测试集样本根据步骤1中的业务故障标志物备选参数分析与预处理,获取业务故障标志物备选参数,并基于步骤2中的业务故障标志物识别方法,获取业务故障标志物,再结合步骤3中的基于滑动时间窗的故障预测方法进行业务故障预测,获得预测结果,所述预测结果包括预警成功、虚警和预测准确;
指定预警提前时间上限,当所述实际故障发生的时刻与故障标志物预测的时刻的差值大于0且小于所述预警提前时间上限时,所述预测结果为预警成功;
对测试集样本预测时,如果正常样本被检出,所述预测结果为虚警;
指定限定时间区间,对测试集样本预测时,当实际故障发生的时刻与故障标志物预测的时刻的差值落入所述限定时间区间时,所述预测结果为预测准确。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111154631.5A CN113780682B (zh) | 2021-09-29 | 2021-09-29 | 基于故障标志物的轨道交通系统业务故障预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111154631.5A CN113780682B (zh) | 2021-09-29 | 2021-09-29 | 基于故障标志物的轨道交通系统业务故障预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113780682A CN113780682A (zh) | 2021-12-10 |
CN113780682B true CN113780682B (zh) | 2023-07-18 |
Family
ID=78854495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111154631.5A Active CN113780682B (zh) | 2021-09-29 | 2021-09-29 | 基于故障标志物的轨道交通系统业务故障预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113780682B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114785672B (zh) * | 2022-03-31 | 2023-09-26 | 北京航空航天大学 | 基于故障标志物的云化网络业务故障预测方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110647446A (zh) * | 2018-06-26 | 2020-01-03 | 中兴通讯股份有限公司 | 一种日志故障关联与预测方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6977650B2 (ja) * | 2018-03-30 | 2021-12-08 | 富士通株式会社 | 異常検出方法、異常検出プログラム、及び異常検出装置 |
-
2021
- 2021-09-29 CN CN202111154631.5A patent/CN113780682B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110647446A (zh) * | 2018-06-26 | 2020-01-03 | 中兴通讯股份有限公司 | 一种日志故障关联与预测方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
基于油中溶解气体动态网络标志物模型的变压器缺陷预警与辨识;张燕,方瑞明;电工技术学报;第35卷(第09期);2032-2041 * |
Also Published As
Publication number | Publication date |
---|---|
CN113780682A (zh) | 2021-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111144727B (zh) | 一种城市轨道交通进站客流韧性评估系统及方法 | |
CN103984994B (zh) | 一种城市轨道交通客流高峰持续时间预测方法 | |
CN115240431B (zh) | 高速公路收费站交通流量实时在线仿真系统及仿真方法 | |
CN108285071A (zh) | 一种基于贝叶斯网络的电梯健康诊断方法 | |
Li et al. | Dwell time estimation models for bus rapid transit stations | |
CN108364464B (zh) | 一种基于概率模型的公交车辆旅行时间建模方法 | |
CN109903555B (zh) | 一种基于大数据的公交乘客下车数据预测方法及系统 | |
CN113033840B (zh) | 一种公路养护的判断方法和装置 | |
CN111179592B (zh) | 基于时空数据流融合分析的城市交通预测方法和系统 | |
CN113780682B (zh) | 基于故障标志物的轨道交通系统业务故障预测方法 | |
CN116168356B (zh) | 一种基于计算机视觉的车辆损伤判别方法 | |
CN110766940A (zh) | 道路信号交叉口运行状况评估方法 | |
CN100481153C (zh) | 基于偏最小二乘原理的高速公路交通事件自动检测方法 | |
CN115311858A (zh) | 基于交通流韧性的城市路段分级管制方法 | |
CN107730882B (zh) | 基于人工智能的道路拥堵预测系统及方法 | |
CN117864216A (zh) | 基于ai的轨道交通动态安全预警系统 | |
CN117975712A (zh) | 基于拥堵时长预测的高速公路服务区协同控制方法及系统 | |
CN115545996B (zh) | 一种基于相似度矩阵的地铁异常历史客流识别方法及装置 | |
CN116187762A (zh) | 一种基于Anylogic的轨道交通枢纽站瓶颈风险识别方法 | |
CN115374579A (zh) | 基于瓶颈识别的轨道交通差异化安检通道布局方法 | |
CN115293948A (zh) | 基于工业互联网的轨道交通应急管控一体方法与系统 | |
CN112488568A (zh) | 一种地铁车站大客流运营风险评价方法及其应用 | |
CN113516335A (zh) | 一种区域交通健康状态评估方法、系统及存储介质 | |
CN118378901B (zh) | 一种高速公路交通事故影响程度动态评价方法及设备 | |
CN114446045B (zh) | 一种疫情期间高速公路车辆违法运输行为的研判方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |