CN110428109B - 地铁屏蔽门故障间隔时间预测模型建立及预测方法 - Google Patents

地铁屏蔽门故障间隔时间预测模型建立及预测方法 Download PDF

Info

Publication number
CN110428109B
CN110428109B CN201910728058.0A CN201910728058A CN110428109B CN 110428109 B CN110428109 B CN 110428109B CN 201910728058 A CN201910728058 A CN 201910728058A CN 110428109 B CN110428109 B CN 110428109B
Authority
CN
China
Prior art keywords
fault
time
data
door
subway
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910728058.0A
Other languages
English (en)
Other versions
CN110428109A (zh
Inventor
李逸帆
丁保剑
秦伟
曾明
翁宗鹏
杨东泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Huazhiyuan Information Engineering Co ltd
Guangzhou Xinke Jiadu Technology Co Ltd
PCI Technology Group Co Ltd
Original Assignee
Guangdong Huazhiyuan Information Engineering Co ltd
Guangzhou Xinke Jiadu Technology Co Ltd
PCI Suntek Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Huazhiyuan Information Engineering Co ltd, Guangzhou Xinke Jiadu Technology Co Ltd, PCI Suntek Technology Co Ltd filed Critical Guangdong Huazhiyuan Information Engineering Co ltd
Priority to CN201910728058.0A priority Critical patent/CN110428109B/zh
Publication of CN110428109A publication Critical patent/CN110428109A/zh
Application granted granted Critical
Publication of CN110428109B publication Critical patent/CN110428109B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/109Time management, e.g. calendars, reminders, meetings or time accounting

Abstract

本发明涉及一种地铁屏蔽门故障间隔时间预测模型建立及预测方法,地铁屏蔽门故障间隔时间预测模型建立,包括以下步骤:步骤1:获取地铁屏蔽门的历史运行数据,对历史运行数据进行预处理;步骤2:对预处理后的历史运行数据建立特征工程,得到特征工程数据;步骤3:对特征工程数据进行WOE和IV计算,得到每一条特征工程数据的IV值;步骤4:筛选出当前站点的当前屏蔽门的若干个IV值作为训练模型的训练数据,将训练数据输入GBDT模型进行训练,得到当前站点的当前屏蔽门的训练模型,得到的训练模型作为预测模型。本发明基于数据驱动对地铁屏蔽门故障进行预测,能够针对性的为每个屏蔽门建立对应的预测模型,预测准确性高,通用性好。

Description

地铁屏蔽门故障间隔时间预测模型建立及预测方法
技术领域
本发明涉及地铁屏蔽门故障预测技术领域,具体涉及一种地铁屏蔽门故障间隔时间预测模型建立及预测方法。
背景技术
城市轨道交通是一种经济环保的重要交通方式,不仅为人们的日常出行带来了巨大便利,也大大缓解城市交通拥堵的问题。地铁屏蔽门是乘客进出地铁的重要通道,目前地铁采取的是确认所有屏蔽门安全关闭后才会驶出。但是由于屏蔽门系统与信号系统、主控系统接口较多,因此发生故障的几率也很大,而屏蔽门一旦发生故障,会对地铁列车的运行和整个列车系统调度产生非常大的影响,对地铁运营造成很大的损失。目前对地铁屏蔽门采取的是在固定的时间进行检修,由于地铁屏蔽门的设备多,定期对屏蔽门系统设备进行地毯式检修,不仅效率低下,而且还产生大量运维成本和安全隐患,并不是一种好的检修方式。
综上,如何对地铁屏蔽门系统设备的故障时间进行精准智能预测,是实现地铁智能化运维的关键。
目前,关于地铁屏蔽门设备故障预测重要有三种方式:
(1)基于设备原理的预测
基于设备原理的预测主要是基于屏蔽门系统设备的物理属性及电气运行原理,对屏蔽门设备系统状态及故障时间进行预测的一种方法。该类技术主要依赖于工程人员的技术经验,工程人员在定期对屏蔽门设备检查中,通过观察发现设备物理属性或者与该设备配合设备物理属性存在异常,推测设备是否即将发生故障。该类技术存在问题是比较依赖于工程师的经验,此外,有些设备故障不易被肉眼察觉和发现。预测的准确性和预测覆盖的范围均有限。
(2)基于阈值判断的预测
基于阈值判断的预测是屏蔽门系统设备故障预测比较常规使用的技术。该技术的原理是事先为每个设备设置一个报警阈值区间,将实时采集数据与该报警阈值区间做比较,如果采集到数据在该报警区间内,则提醒屏蔽门设备故障报警。该技术不足地方主要有:首先,该技术属于实时故障报警预测技术,未能利用历史数据计算出下一次报警时间,当发出提醒告警时,往往屏蔽门设备已经发生恶化,甚至影响轨道交通正常运营和发生安全事故。其次,该技术是基于简单规则进行的,未能完全挖掘设备运行深层次关联信息。
(3)基于数据驱动的预测
基于数据驱动的预测主要是基于屏蔽门系统的历史运行故障数据,通过数据建模和算法模型对屏蔽门故障时间进行预测。查找现有的文献和专利,发现目前基于数据驱动预测屏蔽门设备故障时间的预测技术研究比较匮乏。通常只是简单将屏蔽门故障时间预测从时间序列分析角度考虑,未能够将设备环境因素,地铁运维特点及其他时间因素融入到模型中,导致可靠性不高。
发明内容
针对现有技术的不足,本发明的目的之一提供一种地铁屏蔽门故障间隔时间预测模型建立方法,其能够解决地铁屏蔽门故障预测不精准的问题;
本发明的目的之二提供一种地铁屏蔽门故障间隔时间预测方法,其能够解决地铁屏蔽门故障预测不精准的问题;
实现本发明的目的之一的技术方案为:一种地铁屏蔽门故障间隔时间预测模型建立方法,包括以下步骤:
步骤1:获取地铁屏蔽门的历史运行数据,对历史运行数据进行预处理;
步骤2:对预处理后的历史运行数据建立特征工程,得到每一个站点的每一个屏蔽门设备的特征工程数据,
所述特征工程数据包括时间特征、故障频次特征、设备特征和站点特征,所述故障频次特征是指同一个设备在当前故障发生距离满足条件一的最近故障的时间间隔内的所有故障次数:
条件一:本次故障发生时间距离上次故障的时间间隔高于限定时间;
步骤3:对特征工程数据进行WOE计算,得到WOE值,通过WOE值进行IV计算,得到每一条特征工程数据的IV值;
步骤4:筛选出当前站点的当前屏蔽门的若干个IV值作为训练模型的训练数据,将训练数据输入GBDT模型进行训练,得到当前站点的当前屏蔽门的训练模型,得到的训练模型作为所述地铁屏蔽门故障间隔时间预测模型。
进一步地,所述步骤4之后,还包括对每一个站点的每一个屏蔽门执行所述步骤1-步骤4,得到所有屏蔽门对应的地铁屏蔽门故障间隔时间预测模型。
进一步地,所述预处理后的历史运行数据表征每一个屏蔽门设备的告警时间、站点名称、设备类型、故障发生时间、故障是否发生在支线上、距离上一次故障的时间间隔和告警类型。
进一步地,所述告警类型包括状态提醒类型、状态告警类型和故障告警类型。
进一步地,所述限定时间为3小时、6小时和12小时。
进一步地,所述特征工程数据如下表所示:
Figure BDA0002159050200000041
Figure BDA0002159050200000051
进一步地,所述WOE计算按公式①进行:
Figure BDA0002159050200000052
其中,WOEi表示某一条特征工程数据的第i个WOE值,
Figure BDA0002159050200000053
Figure BDA0002159050200000054
Bi表示一条特征工程数据中的第i个取值的故障中为长时偶发故障的次数,BT表示一条特征工程数据中的所有取值的故障中为长时偶发故障的总次数,Gi表示一条特征工程数据中的第i个取值的故障中为短时频发故障的次数,GT表示一条特征工程数据中的所有取值的故障中为短时频发故障的总次数,
短时频发故障是指屏蔽门相隔预设时间以内连续发生故障的次数超过预设次数,长时偶发故障是指屏蔽门相隔预设时间以上才发生一次故障。
进一步地,所述IV计算按公式②进行:
Figure BDA0002159050200000061
其中,IVi表示某一条特征工程数据的第i个IV值。
进一步地,所述步骤4中,还包括,筛选出当前站点的当前屏蔽门的若干个IV值作为训练模型的训练数据,剩余的IV值作为测试数据,采用训练模型对测试数据进行预测,得到训练结果,并采用均方误差评价训练结果。
实现本发明的目的之二的技术方案为:一种地铁屏蔽门故障间隔时间预测方法,包括如下步骤:
采用所述地铁屏蔽门故障间隔时间预测模型建立方法获得地铁屏蔽门故障间隔时间预测模型,将待预测的历史运行数据进行预处理和建立特征工程,将获得的特征工程数据输入预测模型,获得预测结果,预测结果作为所述故障间隔时间。
本发明的有益效果为:本发明采用基于数据驱动对地铁屏蔽门故障进行预测,通过历史运行数据建立特征工程数据,能够针对性的为每个屏蔽门建立对应的预测模型,预测准确性高,通用性好。
附图说明
图1为实施例一的流程示意图;
图2为实施例二的流程示意图;
图3为预测第t+1次故障时间的特征工程的示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
如图1和图3所示,一种地铁屏蔽门故障间隔时间预测模型建立方法,包括以下步骤:
步骤1:获取地铁屏蔽门的历史运行数据,对历史运行数据进行预处理。
本发明中的屏蔽门是泛指概念,不仅包括屏蔽门本身,还包括与屏蔽门连接的DCU、行程开关、蓄电池、电机和电源等设备,统称为屏蔽门设备。
本步骤中,对每个地铁站点的每一个屏蔽门设备均提取对应的历史运行数据。通常,历史运行数据是结构化数据,包括运行的时间、状态和位置信息,其中状态信息包括了屏蔽门设备的故障信息,位置信息表征屏蔽门设备在地铁站台的位置,如表一所示:
时间 故障描述 设备位置
2017-10-29-07.52.20.758000 下行站台头端门门打开状态 XXX站/下行站台头端门
2017-10-28-23.33.04.992000 下行站台头端门门未锁紧超时报警 XXX站/下行站台头端门
2017-10-28-00.12.23.315000 上行整侧站台PEDC故障报警 XXX站/上行整侧站台
2017-10-28-16.21.07.537000 上行整侧站台总线故障 XXX站/上行整侧站台
2017-10-28-00.12.23.315000 下行整侧站台PEDC故障报警 XXX站/下行整侧站台
2017-10-28-16.21.08.117000 下行整侧站台总线故障 XXX站/下行整侧站台
2017-10-29-08.02.12.170000 上行站台尾端门门打开状态 XXX站/上行站台尾端门
表一地铁屏蔽门的历史运行数据
如表一的第三行数据,在XXX站台的上行整侧站台的PEDC(屏蔽门控制器)发生故障,发生故障的时间为2017-10-28-00.12.23.315000,包括了故障的发生时间、故障状态和发生位置的信息。可通过分布式文件系统hdfs(Hadoop Distributed File System)导出结构化数据来获得历史运行数据。
所述预处理包括:
从历史运行数据中提取屏蔽门的告警时间,告警时间包括年份、月份、日期、小时、分钟、是否工作日,实际情况可以在上述时间指标上进行增减,不作具体限定。如表格一的第三行数据,该故障的告警时间的年份为2017年,月份为10月,日期为28日,小时为00(凌晨),分钟为12,通过查找2017-10-28确定28号当天是否为工作日,工作日用1表示,非工作日用0表示。
从历史运行数据中提取屏蔽门的告警类型,将告警类型分成3类,分别是状态提醒类型、状态告警类型和故障告警类型,告警类型均可从表一中的故障描述中获得。其中,状态提醒类型包括'门打开状态'、'站台ASD/EED全部关闭状态'和'站台ASD全部开启状态'共3种情形。其中,ASD是指滑动门,EED是指应急门,即ASD是指屏蔽门为滑动门,EED是指屏蔽门为应急门。状态告警类型包括'门未锁紧超时报警'、'PEDC故障报警'、'手动解锁'、'关门障碍物遇阻'、'开门障碍物遇阻'、'手动/隔离报警'、'PSL操作允许状态'、'IBP操作允许状态'、'站台ASD首末门开启状态'、'IBP首末开门/关门状态'、'IBP全开门/关门状态'、'ASD/EED互锁解除状态'、'PSL开关门命令'、'应急门打开报警'、'应急门隔离报警'、'右开门障碍物遇阻'、'左开门障碍物遇阻'、'右关门障碍物遇阻'和'左关门障碍物遇阻'共19种情形。其中,PSL是指就地控制盘,IBP是指综合后备盘。故障告警类型包括'总线故障'、'DCU总线1故障'、'DCU总线2故障'、'PSC与电源通信故障'、'DCU故障'、'开门故障'、'驱动电源故障'、'UPS故障'、'控制电源故障'、'控制蓄电池故障'、'驱动蓄电池故障'、'主电源故障'、'闸锁解锁故障'、'电机故障'、'关门故障'、'右电机故障'、'左闸锁解锁故障'、'右闸锁解锁故障'、'左电机故障'和'ISCS与PSD通信故障'共20种情形。其中,DCU是指门控单元,PSC是指屏蔽门控制系统,UPS是指不间断电源,ISCS是指综合监控系统,PSD是指屏蔽门系统。
从历史运行数据中提取故障是否发生在地铁支线上,故障发生在地铁支线上用1表示,发生在非地铁支线上用0表示。可根据故障屏蔽门设备所在地铁站点确定是否发生在地铁支线上,地铁支线通常是由政府官方以行政的方式定义出当前地铁线路是否属于地铁支线,因此可以明确得到。
从历史运行数据中提取发生故障设备的设备类型,设备类型是指设备的类别,包括屏蔽门、电源、行程开关、电机等屏蔽门设备。
根据历史运行数据计算出每个站点的每种告警类型的前后故障发生时间间隔,通过公式(1)计算出:
Figure BDA0002159050200000101
其中,Ti,j,n表示第i个站点第j种类型屏蔽门系统设备的第n次发生故障的时间,Ti,j,n-1表示第i个站点第j种类型屏蔽门系统设备的第n-1次发生故障的时间,
Figure BDA0002159050200000102
表示第i个站点第j种类型屏蔽门系统设备的第n次发生故障与第n-1次发生故障的间隔时间,即前后故障发生时间间隔。
经过预处理后的历史运行数据如表二所示:
Figure BDA0002159050200000103
Figure BDA0002159050200000111
表二预处理后的历史运行数据
步骤2:对预处理后的历史运行数据建立特征工程,得到特征工程数据。
本步骤中,从时间特征、故障频次特征、设备特征和站点特征建立特征工程,主要是基于以下原因而采用上述的四个特征来建立特征工程。
屏蔽门故障的发生跟设备、站点和时间是息息相关的。首先,设备故障的发生受设备构造特点和设备使用寿命决定,如屏蔽门电源故障发生频次和频率要高于屏蔽门站台门的故障。其次,不同站点由于客流量大小、设备维修周期差异、设备重视程度存在差异,因此,同一个屏蔽门设备在不同站点的故障发生频次也会存在差异。最后,时间因素是影响屏蔽门故障发生的一个十分重要因素,屏蔽门在工作日发生故障几率要高于非工作日,节假日发生故障几率要高于非节假日,早晚高峰发生故障几率要高于普通时间段。因此,如果单纯从时间序列角度去分析屏蔽门设备故障的发生就会损失很多建模信息,造成模型的预测精度下降。
建立时间特征,时间特征包括基本时间特征和衍生时间特征。其中,基本时间特征有:月份(1月份到12月份),星期(周一到周日),日期(1号到31号),是否周末(周六和周日归属“是”,周一到周五归属“否”)。衍生时间特征有:故障时间是否发生在0到7时,刻画凌晨时间特征;故障时间是否发生在7到9时,刻画上班高峰期时间特征;故障时间是否发生在9到12时,刻画上午时间特征;故障时间是否发生在12到14时,刻画中午时间特征;故障时间是否发生在14到17时,刻画下午时间特征;故障时间是否发生在17到20时,刻画下班高峰期时间特征;故障时间是否发生在20到24时,刻画夜间时间特征。当然,衍生时间特征也可以划分出不同的时间段刻画不同时间特征。
建立设备故障频次特征,设备故障频次特征用于刻画设备短期内发生故障的特征,捕捉屏蔽门故障发生特性。设备故障频次特征是指同一个设备在当前故障发生距离满足条件一的最近故障的时间间隔内的所有故障次数:
条件一:本次故障发生时间距离上次故障的时间间隔高于限定时间。
如表三所示,统计某个时间段内的总线故障的次数及时间:
Figure BDA0002159050200000121
表三总线故障统计
本实施例中,限定时间包括3个小时、6个小时和12个小时,共设置三个值,实际可进行调整,例如设置为4个小时、8个小时或其他值,不作具体限定。对应的,设备故障频次特征包括限定时间是3个小时的设备故障频次、限定时间是6个小时的设备故障频次和限定时间是12个小时的设备故障频次。
假设要计算1月1号9时的总线故障限定时间是3个小时的故障发生频次特征,则需要统计出1月1号9时的总线故障距离满足条件一的最近故障的时间间隔内的所有故障次数:
条件一:本次故障发生时间距离上次故障的时间间隔高于限定时间,即高于3小时。
表三中1月1号5时的总线故障(也即本次故障)距离上次故障的时间间隔为5小时,高于3小时,因此,最接近1月1号9时且满足条件一的最近故障是发生在1月1号5时的故障,从1月1号9时至1月1号5时的时间间隔内的所有故障次数为3次。因此1月1号9时的总线故障的故障频次特征为3次。
建立站点特征,以表征站点位置的站点名称作为站点特征。通常,从站点名称即可获取站点所在的位置、是否为地铁支线等信息。
建立设备特征,以屏蔽门设备的专业类型划分建立设备特征。例如屏蔽门、电源、行程开关等等都是设备特征。
基于以上建立的特征工程,为了预测第t+1次(可以理解为下一次)屏蔽门故障发生的时间,需要选取最近屏蔽门故障发生的故障特征,即第t次故障特征和往前数的最近两次故障特征,分别为第t-1次故障特征和第t-2次故障特征,以及选取站点特征和设备特征。如图3所示,预测第t+1次故障时间的特征工程。
最终得到的特征工程数据(变量)如表四所示:
Figure BDA0002159050200000141
Figure BDA0002159050200000151
表四特征工程的变量
需要注意的是,表四是相对于当前第t次屏蔽门故障发生的时间而统计的包括最近三个时间(t-1、t-2、t-3)对应的特征工程数据。表四中,STATION_NAME变量表示站点名称,DEVICE_TYPE表示设备类型,因此每一个站点的每一个屏蔽门设备均包括如表四中从序号3至序号51的特征工程数据,也即序号3至序号51的每一个变量代表一个特征工程数据。
步骤3:对特征工程数据进行WOE(Weight of Evidence,证据权重)和IV(Information Value,信息价值)计算,得到计算结果数据。对应的,每一条特征工程数据分别进行WOE和IV计算,得到对应的计算结果数据。
本步骤中,将地铁屏蔽门故障分成两类,分别为长时偶发故障和短时频发故障,并从特征工程数据中统计出长时偶发故障和短时频发故障。长时偶发故障是指屏蔽门相隔预设时间以上(包含预设时间)才发生一次故障,通常预设时间为几百小时。例如,预设时间设置为100小时,相隔100小时以上才发生一次故障,也即当前屏蔽门故障距离上一次故障的间隔时间超过100小时,才将本次故障认为是长时偶发故障。短时频发故障是指屏蔽门相隔预设时间以内连续发生故障的次数超过预设次数,通常要求屏蔽门连续几个小时发生几次甚至几十次故障。例如,预设时间仍设置为100小时,预设次数设置为300次,相当于连续100个小时发生300次故障,则这300次故障均认为是短时频发故障。
优选地,为了能够量化长时偶发故障和短时频发故障,将高于屏蔽门故障时间四分之三位数数值作为分隔点,分隔点可以由维修人员根据实际经验来获得,大于等于分隔点的故障时间为长时偶发故障时间点,小于分隔点的故障时间为短时频发故障时间点。
在发明人研究和实际发现的过程中,发现屏蔽门故障时间发生间隔主要包括两种模式,一种是短时频发,另一种是长时偶发。对应的,屏蔽门故障包括两类:长时偶发故障和短时频发故障,以上将地铁屏蔽门故障分成长时偶发故障和短时频发故障是符合实际情况的。
基于以上,选择WOE和IV进行计算,主要有两个方面的考虑:第一,IV分析和计算依赖于WOE分析和计算;第二,特征工程数据中,有很多分类变量,例如星期、日期等,这些变量的数值大小跟屏蔽门设备故障时间没有必然联系,因此,需要将这些数据映射成跟设备故障时间有关的数值,而WOE方法正好具备这个能力。
WOE按公式(2)计算得到,IV按公式(3)计算得到:
Figure BDA0002159050200000171
其中,
Figure BDA0002159050200000172
Figure BDA0002159050200000173
式中,WOEi表示某一条特征工程数据的第i个WOE值,IVi表示某一条特征工程数据的第i个IV值,Bi表示一条特征工程数据中的第i个取值的故障中为长时偶发故障的次数,BT表示一条特征工程数据中的所有取值的故障中为长时偶发故障的总次数,Gi表示一条特征工程数据中的第i个取值的故障中为短时频发故障的次数,GT表示一条特征工程数据中的所有取值的故障中为短时频发故障的总次数。例如,表四中的ALARM_WEEKDAY_BEFORE_SEP_1变量代表一条特征工程数据,其取值为1-7,即i=1,2,3,…,7,B1表示ALARM_WEEKDAY_BEFORE_SEP_1中星期一(1代表日期为星期一)发生的所有故障中为长时偶发故障的次数,其他以此类推。
为了能够进一步理解WOE和IV的计算过程,以下示例性地给出一个具体的实例:
假设ALARM_WEEKDAY_BEFORE_SEP_1变量代表的特征工程数据统计到的长时偶发故障和短时频发故障的次数如表五所示:
Figure BDA0002159050200000174
Figure BDA0002159050200000181
表五长时偶发故障和短时频发故障的次数
则根据表五,
Figure BDA0002159050200000182
Figure BDA0002159050200000183
对应的,有
Figure BDA0002159050200000184
各个WOE的值如表六所示:
alarm_weekday_before_sep_1的i值 WOE
1 0.053042
2 0.477781
3 0.064572
4 0.230969
5 -0.121997
6 -0.076702
7 -0.501040
表六各个WOE值
相应地,根据WOE值计算出每一条特征工程数据的IV值,也即计算出每一个站点的每一个屏蔽门设备包括的所有的特征工程数据的IV值,得到的各个IV值如表七所示,具体过程就不赘述了。
Figure BDA0002159050200000185
Figure BDA0002159050200000191
Figure BDA0002159050200000201
表七各个IV值
表七中,aE-m表示a*10-m,例如,5.03E-01表示5.03*10-1=0.503。
步骤4:筛选若干个IV值作为训练模型的训练数据,剩下的IV值作为测试数据。将训练数据输入GBDT(Gradient Boosting Decision Tree,梯度提升决策树)模型中,设置GBDT模型的参数,例如设置学习速率为0.05,设置迭代次数为100,设置最大深度为5,得到训练模型,训练模型即作为地铁屏蔽门故障间隔时间预测模型,从而建立了作为地铁屏蔽门故障间隔时间预测模型。
采用训练模型对测试数据进行预测,得到训练结果。采用均方误差评价训练结果。
优选地,根据得到的IV值按从大到小进行排序,筛选前十个IV值作为训练数据。按各IV值对应的故障发生时间从小到大排序,也即离当前最近发生的故障对应的IV值排在最前面,离当前间隔时间最久发生的故障对应的IV值排在最后面,并将最后3个IV值作为测试数据。
本发明采用基于数据驱动对地铁屏蔽门故障进行预测,相比于现有屏蔽门故障预测,本发明不是单纯从时间序列角度进行建模预测,而是从特征工程角度去分析屏蔽门故障时间的机理,通过时间特征、故障频次特征、设备特征和站点特征,较完备地刻画影响屏蔽门设备故障发生的因素。
基于屏蔽门故障的特点,通过构造短时频发故障和长时偶发故障的方式将回归问题转换成二分类问题,有机结合WOE分析和IV分析,将特征工程数值化刻度,并选中GBDT模型,能够解决屏蔽门因不同因素而产生故障的故障时间预测的问题。
从特征工程构造上,考虑到屏蔽门设备故障发生在时间线上具有前后关联,通过设置屏蔽门故障频次特征,刻画了屏蔽门的近期故障状态。
本方案针对特定屏蔽门进行建模分析,可通过训练不同屏蔽门设备的历史运行数据而获得每个屏蔽门对应的预测模型,具有更高的准确性和较好的通用性。
实施例二
如图2所示,实施例二在实施例一的基础上提供一种地铁屏蔽门故障间隔时间预测方法,也即采用实施例一的方法对地铁屏蔽门故障间隔时间进行预测,也即预测下一次故障发生的时间,所述间隔时间表征当前故障与下一次故障的时间间隔。与实施例一不同之处在于,还包括以下步骤:
步骤5:当需要预测下一次故障的发生时间,也即下一次故障与当前最近的故障的时间间隔,将获得的待预测的历史运行数据按实施例一所述方法进行预处理和建立特征工程,将获得的特征工程数据输入预测模型,获得预测结果,预测结果作为故障间隔时间。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (9)

1.一种地铁屏蔽门故障间隔时间预测模型建立方法,其特征在于,包括以下步骤:
步骤1:获取地铁屏蔽门的历史运行数据,对历史运行数据进行预处理;
步骤2:对预处理后的历史运行数据建立特征工程,得到每一个站点的每一个屏蔽门设备的特征工程数据,
所述特征工程数据包括时间特征、故障频次特征、设备特征和站点特征,所述故障频次特征是指同一个设备在当前故障发生距离满足条件一的最近故障的时间间隔内的所有故障次数:
条件一:本次故障发生时间距离上次故障的时间间隔高于限定时间;
步骤3:对特征工程数据进行WOE计算,得到WOE值,通过WOE值进行IV计算,得到每一条特征工程数据的IV值,其中,
所述WOE计算按公式①进行:
Figure FDA0002605741570000011
其中,WOEi表示某一条特征工程数据的第i个WOE值,
Figure FDA0002605741570000012
Figure FDA0002605741570000013
Bi表示一条特征工程数据中的第i个取值的故障中为长时偶发故障的次数,BT表示一条特征工程数据中的所有取值的故障中为长时偶发故障的总次数,Gi表示一条特征工程数据中的第i个取值的故障中为短时频发故障的次数,GT表示一条特征工程数据中的所有取值的故障中为短时频发故障的总次数,
短时频发故障是指屏蔽门相隔预设时间以内连续发生故障的次数超过预设次数,长时偶发故障是指屏蔽门相隔预设时间以上才发生一次故障;
步骤4:筛选出当前站点的当前屏蔽门的若干个IV值作为训练模型的训练数据,将训练数据输入GBDT模型进行训练,得到当前站点的当前屏蔽门的训练模型,得到的训练模型作为所述地铁屏蔽门故障间隔时间预测模型。
2.根据权利要求1所述的地铁屏蔽门故障间隔时间预测模型建立方法,其特征在于,所述步骤4之后,还包括对每一个站点的每一个屏蔽门执行所述步骤1-步骤4,得到所有屏蔽门对应的地铁屏蔽门故障间隔时间预测模型。
3.根据权利要求1所述的地铁屏蔽门故障间隔时间预测模型建立方法,其特征在于,所述预处理后的历史运行数据表征每一个屏蔽门设备的告警时间、站点名称、设备类型、故障发生时间、故障是否发生在支线上、距离上一次故障的时间间隔和告警类型。
4.根据权利要求3所述的地铁屏蔽门故障间隔时间预测模型建立方法,其特征在于,所述告警类型包括状态提醒类型、状态告警类型和故障告警类型。
5.根据权利要求1所述的地铁屏蔽门故障间隔时间预测模型建立方法,其特征在于,所述限定时间为3小时、6小时和12小时。
6.根据权利要求5所述的地铁屏蔽门故障间隔时间预测模型建立方法,其特征在于,所述特征工程数据如下表所示:
Figure FDA0002605741570000021
Figure FDA0002605741570000031
Figure FDA0002605741570000041
7.根据权利要求1所述的地铁屏蔽门故障间隔时间预测模型建立方法,其特征在于,所述IV计算按公式②进行:
Figure FDA0002605741570000042
其中,IVi表示某一条特征工程数据的第i个IV值。
8.根据权利要求1所述的地铁屏蔽门故障间隔时间预测模型建立方法,其特征在于,所述步骤4中,还包括,筛选出当前站点的当前屏蔽门的若干个IV值作为训练模型的训练数据,剩余的IV值作为测试数据,采用训练模型对测试数据进行预测,得到训练结果,并采用均方误差评价训练结果。
9.一种地铁屏蔽门故障间隔时间预测方法,其特征在于,包括如下步骤:
采用如权利要求1-8任一项所述地铁屏蔽门故障间隔时间预测模型建立方法获得地铁屏蔽门故障间隔时间预测模型,将待预测的历史运行数据进行预处理和建立特征工程,将获得的特征工程数据输入预测模型,获得预测结果,预测结果作为所述故障间隔时间。
CN201910728058.0A 2019-08-07 2019-08-07 地铁屏蔽门故障间隔时间预测模型建立及预测方法 Active CN110428109B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910728058.0A CN110428109B (zh) 2019-08-07 2019-08-07 地铁屏蔽门故障间隔时间预测模型建立及预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910728058.0A CN110428109B (zh) 2019-08-07 2019-08-07 地铁屏蔽门故障间隔时间预测模型建立及预测方法

Publications (2)

Publication Number Publication Date
CN110428109A CN110428109A (zh) 2019-11-08
CN110428109B true CN110428109B (zh) 2020-11-03

Family

ID=68414901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910728058.0A Active CN110428109B (zh) 2019-08-07 2019-08-07 地铁屏蔽门故障间隔时间预测模型建立及预测方法

Country Status (1)

Country Link
CN (1) CN110428109B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111144639A (zh) * 2019-12-24 2020-05-12 国电南京自动化股份有限公司 一种基于alln算法的地铁设备故障预测方法及系统
CN111612260B (zh) * 2020-05-27 2022-03-25 华东师范大学 基于集成学习模型的轨道交通车载数据预测方法
CN111768113A (zh) * 2020-07-03 2020-10-13 许艳杰 一种基于公有云的水利工程管理系统和方法
CN115140102B (zh) * 2022-05-18 2024-03-29 卡斯柯信号有限公司 一种城市轨道交通站台门联动控制故障检测方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005015326A1 (en) * 2003-08-05 2005-02-17 Oxford Biosignals Limited System for monitoring the working condition of an installation
CN103745229A (zh) * 2013-12-31 2014-04-23 北京泰乐德信息技术有限公司 一种基于svm的轨道交通故障诊断方法及系统
CN108304941A (zh) * 2017-12-18 2018-07-20 中国软件与技术服务股份有限公司 一种基于机器学习的故障预测方法
CN109204389A (zh) * 2018-09-12 2019-01-15 济南轨道交通集团有限公司 一种地铁设备故障诊断和自愈方法、系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8849730B2 (en) * 2011-12-15 2014-09-30 Microsoft Corporation Prediction of user response actions to received data
SG11201811283PA (en) * 2017-04-18 2019-01-30 Beijing Didi Infinity Technology & Development Co Ltd System and method for determining safety score of driver
KR102602216B1 (ko) * 2017-12-22 2023-11-15 삼성전자주식회사 고장 예측에 기반한 가전기기의 제어 방법 및 장치
CN108591104B (zh) * 2018-04-18 2019-11-05 广东寰球智能科技有限公司 一种基于云平台的风机故障预测与健康管理系统、方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005015326A1 (en) * 2003-08-05 2005-02-17 Oxford Biosignals Limited System for monitoring the working condition of an installation
CN103745229A (zh) * 2013-12-31 2014-04-23 北京泰乐德信息技术有限公司 一种基于svm的轨道交通故障诊断方法及系统
CN108304941A (zh) * 2017-12-18 2018-07-20 中国软件与技术服务股份有限公司 一种基于机器学习的故障预测方法
CN109204389A (zh) * 2018-09-12 2019-01-15 济南轨道交通集团有限公司 一种地铁设备故障诊断和自愈方法、系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"数据挖掘模型中的IV和WOE详解";kevin7561;《CSDN博客 https://blog.csdn.net/kevin7658/article/details/50780391/》;20160302;第1-7页 *

Also Published As

Publication number Publication date
CN110428109A (zh) 2019-11-08

Similar Documents

Publication Publication Date Title
CN110428109B (zh) 地铁屏蔽门故障间隔时间预测模型建立及预测方法
CN107219837B (zh) 一种用于地铁屏蔽门故障监控与预警智能系统
CN110929898B (zh) 水电站启闭设备运维及故障监测在线评估系统及方法
CN102623910B (zh) 一种基于可靠性的开关设备维修决策方法
CN106447107B (zh) 一种基于飞机结构健康监控的维修方法
CN105678467A (zh) 特高压交直流联网下调控一体数据分析与辅助决策系统及方法
CN104376716A (zh) 一种基于贝叶斯网络模型的公交时刻表动态生成方法
CN104732286A (zh) 一种城市轨道交通车站安全态势感知方法
CN110209999A (zh) 一种车载设备故障趋势预测方法
CN103903429A (zh) 一种快速公交停靠站的延误时间组合预测方法
Kariniotakis et al. Evaluation of advanced wind power and load forecasting methods for the optimal management of isolated power systems
CN113807678B (zh) 站台安全门能效管理方法、装置、计算机设备和存储介质
CN111046940A (zh) 一种基于决策树与神经网络的车门故障诊断方法
CN113723659A (zh) 一种城市轨道交通全场景客流预测方法及系统
CN110210169A (zh) 一种基于lstm的盾构机故障预测方法
Tympakianaki et al. Anatomy of tunnel congestion: Causes and implications for tunnel traffic management
CN115938124A (zh) 一种城市轨道交通突发事件影响预测方法、系统及产品
El Hamshary et al. Integrated maintenance planning approach to optimize budget allocation for subway operating systems
Wang et al. An ensemble learning model for short-term passenger flow prediction
CN109409563B (zh) 一种公交运营车辆实时人数的分析方法、系统和存储介质
CN112446157A (zh) 一种交通设备剩余寿命预测方法及装置
CN112418662A (zh) 一种利用人工神经网络的配电网运行可靠性分析方法
Verevkina Assessment of contribution of human factor and factors of material-technical supply to safety risks due to poor repair and technology
CN110851961A (zh) 一种基于系统可用度的船闸维修计划制定方法
CN111209979A (zh) 监控车辆电压的方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: Room 306, area 2, building 1, Fanshan Venture Center, Panyu energy saving science and Technology Park, 832 Yingbin Road, Donghuan street, Panyu District, Guangzhou, Guangdong 510000

Patentee after: Jiadu Technology Group Co.,Ltd.

Patentee after: GUANGZHOU XINKE JIADU TECHNOLOGY Co.,Ltd.

Patentee after: Guangdong Huazhiyuan Information Engineering Co.,Ltd.

Address before: Room 306, zone 2, building 1, Fanshan entrepreneurship center, Panyu energy saving technology park, No. 832 Yingbin Road, Donghuan street, Panyu District, Guangzhou City, Guangdong Province

Patentee before: PCI-SUNTEKTECH Co.,Ltd.

Patentee before: GUANGZHOU XINKE JIADU TECHNOLOGY Co.,Ltd.

Patentee before: Guangdong Huazhiyuan Information Engineering Co.,Ltd.

CP03 Change of name, title or address