CN113610188B - 弓网接触力非区段异常识别方法及装置 - Google Patents

弓网接触力非区段异常识别方法及装置 Download PDF

Info

Publication number
CN113610188B
CN113610188B CN202110964594.8A CN202110964594A CN113610188B CN 113610188 B CN113610188 B CN 113610188B CN 202110964594 A CN202110964594 A CN 202110964594A CN 113610188 B CN113610188 B CN 113610188B
Authority
CN
China
Prior art keywords
detection data
contact force
data
time sequence
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110964594.8A
Other languages
English (en)
Other versions
CN113610188A (zh
Inventor
杨劲松
邵奇
刘金朝
陶凯
郭剑峰
杨志鹏
彭楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Railway Sciences Corp Ltd CARS
Infrastructure Inspection Institute of CARS
Beijing IMAP Technology Co Ltd
Original Assignee
China Academy of Railway Sciences Corp Ltd CARS
Infrastructure Inspection Institute of CARS
Beijing IMAP Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Railway Sciences Corp Ltd CARS, Infrastructure Inspection Institute of CARS, Beijing IMAP Technology Co Ltd filed Critical China Academy of Railway Sciences Corp Ltd CARS
Priority to CN202110964594.8A priority Critical patent/CN113610188B/zh
Publication of CN113610188A publication Critical patent/CN113610188A/zh
Application granted granted Critical
Publication of CN113610188B publication Critical patent/CN113610188B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明提供了一种弓网接触力非区段异常识别方法及装置,该方法包括:从待分析的弓网接触力检测数据中,筛选出离群值点,确定所述离群值点为单值异常数据;将待分析的弓网接触力检测数据采用移动滑窗的方式处理为时间序列预测集;对时间序列预测集中每个检测数据,将时间序列预测集中该检测数据前预设长度个检测数据输入至训练好的接触力拉直线识别模型中,获得预测值,在所述预测值与该检测数据的差值超过误差阈值后,确定该检测数据为拉直线异常数据,其中该检测数据在时间序列预测集中的序号在预设标记值之后。本发明可以自动识别弓网接触力非区段异常,准确度高,效率高。

Description

弓网接触力非区段异常识别方法及装置
技术领域
本发明属于铁路弓网的基础设施检测技术领域,涉及一种弓网接触力非区段异常识别方法和装置。
背景技术
电气化铁路接触网状态对于铁路运行车辆安全状态起着至关重要的作用,当电气化铁路接触网状态出现异常时,铁路运行车辆处于危险状态,给人们生命安全带来危险。因此及时有效的对接触网状态进行检测对保障车辆运行安全具有重要意义。特别是在高速线路接触网状态检测中,传统的上道测量、步行巡视已逐步被检测装置的定期检测取代。弓网检测系统通过测量接触网几何参数、弓网接触力、硬点、燃弧等参数,以评价弓网受流性能和接触网状态,指导接触网维修作业。目前,对于高速铁路弓网检测主要依靠高速铁路供电安全检测监测系统(6C系统)的检测数据对接触网进行状态评估。这能够在一定程度上帮助铁路部门及时地掌握接触网的状态,了解接触网状态变化规律,从而合理地制定维修计划,对于保障接触网系统的正常运行以及列车行车安全具有十分重要的意义。
2016年9月,以6C系统中的高速弓网综合检测装置(1C)的检测数据为依据获得接触网运行质量指数(CQI)在全路范围内使用,该指数作为接触网设备质量的评价依据,服务于供电系统设备管理。CQI充分利用1C装置检测数据,实现了对接触网区段质量的量化描述。
在CQI计算过程,弓网接触力是一项重要指标,弓网接触力是受电弓与接触线之间相互接触而产生的作用力,是综合反映弓网受流性能的指标,可反映接触网和受电弓机械振荡系统的质量、弹性系数、衰减系数和自然频率。然而,由于检测设备自身以及外部复杂的电磁环境等原因,会导致接触力检测数据出现异常。这对后续的CQI计算将产生严重影响,导致对接触网质量的量化评价出现偏差。
接触力的异常数据产生原因较为复杂,表现形式多样,目前主要根据专家经验采用人工筛查的方法来剔除异常值。这严重影响了弓网检测数据的分析效率,并且由于对专家经验的依赖性,处理结果存在较大的主观性。因此,找到一种弓网接触力检测数据中异常自动识别、剔除方法,对于接触网检测数据分析和接触网区段质量评价具有重要意义。
随着各种检测、监测手段和数据分析方法的不断进步,基于检测、监测数据的故障识别和安全预警已经成为保障各类基础设施和装备正常运行的重要方法。然而,由于外部环境变化和检测设备等原因,会出现检测数据不能反应设备真实状态的情况,通常称这类数据为异常数据。在进行后续的数据分析时如果没能及时的剔除异常数据,将会严重影响分析结果的可信度。因此,异常数据识别算法也成为数据分析领域的一个重要研究内容。
相关异常数据自动识别的研究已有一定的进展,其中信号处理技术是异常数据识别的重要方法。现有技术提出了一种应用于风电机组监测数据中异常识别的方法,针对风电机组监测数据中常出现数据缺失、堆积、越限等异常监测数据,采用了一种基于差分自回归滑动平均、小波分解和隐马尔科夫组合算法对异常风速数据进行识别的方法。现有技术还指出电机组数据采集与监控系统中采集的风速和功率数据中通常因弃风限电、传感器故障等原因存在异常数据,这些异常数据对风电机组运行状况、功率预测、优化调度等会造成较大的影响,因此提出了一种提出基于Copula理论的风电机组异常数据识别方法,利用Copula函数建立风速和功率间相关关系的概率功率曲线,结合三类异常数据特征得到了相应异常数据识别模型。现有技术还提出了一种热工过程中异常监测数据的识别算法,首先利用经验小波变换方法提取热工过程时间序列的运行趋势,去除序列运行趋势后采用局部离群因子方法对各数据点求取其局部异常值,最后使用箱型图的方法确定序列异常点。为提高现有风电场数据采集系统的准确性和可利用性,现有技术还提出了深层玻尔兹曼机(DBM)、经验模态分解(EMD)和隐马尔科夫(HMM)组合算法处理运行数据含有少量异常风速值的自适应检测方法。现有技术还针对铁路轨道几何检测数据中存在冲击噪声的问题,利用小波分析方法将将检测数据中含有冲击噪声的高频、低频成分分离出来,并使用有序中值法自动识别冲击噪声的位置并滤除。在异常值处理中滤波是一种常用方法,现有技术还提出了一种自适应阈值中值(ASWM)滤波器,用于去除图像中的脉冲噪声。ASWM不需要像传统阈值中值滤波器那样设定先验阈值,而是采用在滑动窗口中根据图像像素的强度值局部计算阈值。现有技术还提出了一种基于模糊逻辑的轨道几何测量数据中脉冲尖峰噪声实时检测与去除算法。通过在模糊系统中加入特定的判断规则能够实现对由外部环境或传输过程中产生的脉冲噪声的去除,避免了错误报警。
近年来,基于机器学习和深度学习的方法在异常数据识别领域的应用越来越广泛。现有技术还基于深度方法提出一种适用于大型工程结构健康监测数据的中异常数据识别算法,将监测数据转化为可视化图片,然后通过卷积神经网络来进行分类,实现异常识别。
现有技术还提出一种基于深度学习的心电信号数据预处理方法,首先通过专家知识把数据标记为包含正常心电和异常心电的心电信号作为训练样本,之后利用小波变换去除基线漂移,最后将训练集输入深度学习模型进行训练,利用测试集优化模型参数。该发明可以扩增样本数,同时做到样本均衡,使模型更容易训练。
现有技术还建立了一个具有三个隐含层的深度模型SAE_BP,并与传统的BP模型、SVM模型进行了实验对比分析,结果表明该方法预测精度更高。
现有技术还在处理风功率预测数据时首先利用拉依达准则去除风速和功率奇异点,再使用优化的一次指数平滑法及最大皮尔逊相关系数对风速进行平滑处理,最后将预处理过后的风速数据作为BP神经网络预测模型的输入,使得风功率的预测精度显著提高。
根据现有技术,在数据预测处理过程中进行异常数据识别主要可以分为基于信号处理算法和基于机器学习、深度学习算法两个方向。目前对于接触网动态检测中的接触力检测数据的异常识别,尤其是非区段异常识别暂无相关研究。
发明内容
本发明实施例提出一种弓网接触力非区段异常识别方法,用以自动识别弓网接触力非区段异常,准确度高,效率高,该方法包括:
从待分析的弓网接触力检测数据中,筛选出离群值点,确定所述离群值点为单值异常数据;
将待分析的弓网接触力检测数据采用移动滑窗的方式处理为时间序列预测集;
对时间序列预测集中每个检测数据,将时间序列预测集中该检测数据前预设长度个检测数据输入至训练好的接触力拉直线识别模型中,获得预测值,在所述预测值与该检测数据的差值超过误差阈值后,确定该检测数据为拉直线异常数据,其中该检测数据在时间序列预测集中的序号在预设标记值之后。
本发明实施例提出一种弓网接触力非区段异常识别装置,用以自动识别弓网接触力非区段异常,准确度高,效率高,该装置包括:
单值异常数据确定模块,用于从待分析的弓网接触力检测数据中,筛选出离群值点,确定所述离群值点为单值异常数据;
数据处理模块,用于将待分析的弓网接触力检测数据采用移动滑窗的方式处理为时间序列预测集;
拉直线异常数据确定模块,用于对时间序列预测集中每个检测数据,将时间序列预测集中该检测数据前预设长度个检测数据输入至训练好的接触力拉直线识别模型中,获得预测值,在所述预测值与该检测数据的差值超过误差阈值后,确定该检测数据为拉直线异常数据,其中该检测数据在时间序列预测集中的序号在预设标记值之后。
本发明实施例还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述弓网接触力非区段异常识别方法。
本发明实施例还提出了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述弓网接触力非区段异常识别方法的计算机程序。
在本发明实施例中,从待分析的弓网接触力检测数据中,筛选出离群值点,确定所述离群值点为单值异常数据;将待分析的弓网接触力检测数据采用移动滑窗的方式处理为时间序列预测集;对时间序列预测集中每个检测数据,将时间序列预测集中该检测数据前预设长度个检测数据输入至训练好的接触力拉直线识别模型中,获得预测值,在所述预测值与该检测数据的差值超过误差阈值后,确定该检测数据为拉直线异常数据,其中该检测数据在时间序列预测集中的序号在预设标记值之后。在上述实施例中,从弓网动态检测数据中识别出了两种非区段异常数据,包括单值异常数据和拉直线异常数据,具体有益效果包括:通过自动识别的离群值点和训练好的接触力拉直线识别模型,显著提高了弓网接触力检测数据的识别效率和准确度。摆脱了人工识别时对工作人员经验的依赖性,提高了接触网状态评价的准确度和权威性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中弓网接触力非区段异常识别方法的流程图;
图2本发明实施例中密度聚类方法的具体流程图;
图3为本发明实施例中密度聚类方法识别出的单值异常数据;
图4为本发明实施例中LSTM神经网络的结构示意图;
图5为本发明实施例中LSTM神经网络中3层LSTM网络结构的输入示意图;
图6为本发明实施例中接触力拉直线识别模型进行训练和预测的流程图;
图7为本发明实施例中采用移动滑窗的方式处理为时间序列训练集的示意图;
图8为本发明实施例中采用图6的步骤进行训练和预测的结果示意图;
图9为本发明实施例中某高铁下行接触力检测数据的示意图;
图10为本发明实施例中某高铁下行接触力检测数据的预测值的示意图;
图11为本发明实施例中弓网接触力非区段异常识别装置的示意图;
图12为本发明实施例中弓网接触力非区段异常识别装置的另一示意图;
图13为本发明实施例中计算机设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本发明的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
图1为本发明实施例中弓网接触力非区段异常识别方法的流程图,如图1所示,该方法包括:
步骤101,从待分析的弓网接触力检测数据中,筛选出离群值点,确定所述离群值点为单值异常数据;
步骤102,将待分析的弓网接触力检测数据采用移动滑窗的方式处理为时间序列预测集;
步骤103,对时间序列预测集中每个检测数据,将时间序列预测集中该检测数据前预设长度个检测数据输入至训练好的接触力拉直线识别模型中,获得预测值,在所述预测值与该检测数据的差值超过误差阈值后,确定该检测数据为拉直线异常数据,其中该检测数据在时间序列预测集中的序号在预设标记值之后。
具体实施时,接触网检测装置通常安装于车顶,在检测过程中受车体振动的影响,同时,由于检测原理和技术手段的不同,还受到阳光、雨雾或高压电磁干扰等外界因素的影响,数据不可避免会存在偏差,因而有效识别与剔除测量数据中的异常值是提高检测数据质量需要解决的关键问题。
根据统计理论和长期的经验积累可知,即使是设计良好的数据采样系统,由于受现场多种不可控偶发因素的影响,通常也会包含1%—5%的随机误差,极端严重的情况下误差可达到10%-20%。这种严重偏离目标真值的结果被称为异常值或野值,这种异常值为单值异常数据,由于目标真值的分布是十分紧密的,而单值异常数据距离目标真值较远,这时候就可以筛选出单值异常数据。
在本发明实施例中,采用密度聚类方法先筛选出离群值点,然后确定所述离群值点为单值异常数据,密度聚类是以数据集在空间分布上的稠密程度为依据进行聚类的,即只要一个区域中的样本密度大于某个阈值,就把它划入与之相近的簇中。密度聚类是从样本密度的角度出发,考察样本之间的连接性,并由可连接样本不断扩展直到获得最终的聚类结果。这类方法可以克服其他聚类方法只适用于凸样本集的情况。可以聚类出样本数据的任意形状。
图2本发明实施例中密度聚类方法的具体流程图。在密度聚类方法中,假设样本集是D=(x1,x2,...,xm),则密度聚类具体的密度描述定义如下:
(1)ε-邻域:对于xj∈D,其ε-邻域包含样本集D中与xj的距离不大于ε的子样本集,即Nε(xj)={xj∈D|distance(xi,xj)≤ε},这个子样本集的个数记为|Nε(xj)|。
(2)核心点:对于任一样本xj∈D,如果其ε-邻域对应的Nε(xj)至少包含MinPts个,则称xj是核心点(也称为核心对象),MinPts为密度阈值。
(3)密度直达:如果xi位于xj的ε-邻域中,且xj是核心点,则称xi由xj密度直达,注意反之不一定成立。
(4)密度可达:对于xi位于xj,如果存在样本序列P1,P2,...,PT,满足p1=xi,pT=xj,且pt+1由pt密度直达,则称xj由xi密度可达。
(5)密度相连:对于xi与xj,如果存在核心对象xk,使xi和xj均由xk密度可达,则xi与xj密度相连。
密度聚类的定义很简单,由密度可达关系导出的最大密度相连的样本集合,即为聚类的一个类别。密度聚类的每一类别中可以有一个或者多个核心点。如果只有一个核心点,则簇里其他的非核心点样本都在这个核心点的ε-邻域里;如果有多个核心点,则类别里的任意一个核心点的ε-邻域中一定有一个其他的核心点,否则这两个核心点无法密度可达。这些核心点的邻域里所有的样本的集合组成的一个密度聚类的类别。
在本发明实施例中,在一实施例中,从待分析的弓网接触力检测数据中,筛选出离群值点,包括:
以待分析的弓网接触力检测数据中每一个检测数据为圆心,根据预设的搜索半径对所述圆心和搜索半径构成的圆圈内的检测数据进行统计,在统计的检测数据的数量超过密度阈值时,将该圆心记为核心点;
若待分析的弓网接触力检测数据中一个检测数据的搜索半径邻域内的检测数据的数量小于所述密度阈值,但落入核心点的邻域内,将该检测数据记为边界点;
将待分析的弓网接触力检测数据中既不是核心点也不是边界点的检测数据,记为离群值点。
拿某一组接触力检测数据进行试验,图3为本发明实施例中密度聚类方法识别出的单值异常数据,其中离群值点为图3中虚线框中的点,虚线框外的点为核心点和边界点组成的簇,这里显示了两个簇,分别在左侧虚线框的左侧和右侧。由于各个簇是由大量的同分布紧密关联的数据组成,可以认为不同的簇都是正常检测数据。由于离群值点的存在,将正常值割裂成不同的簇,从上文密度聚类的定义可以看出,离群值点即噪声点和周围簇(由边界点和核心点组成)的稀疏密度分布情况及关联性存在交大的差异,因此可将其定义为单值异常数据。密度聚类方法对离群值点的识别率达到了99%,也近一步验证了密度聚类方法在单值异常数据的识别中的可靠性。
具体实施时,在接触力检测过程中,由于接触力检测用的传感器故障会出现检测数据长时间为保存某一固定值的情况,称这种异常模式为拉直线。接触网是通过接触线定位装置来调整接触网和受电弓炭滑板的接触点位置,使接触点往复移动保证炭滑板磨耗均匀。接触力数据的大小与接触网和受电弓炭滑板的接触点位置有关,正常情况下接触点位置是左右连续滑动的,因此某时刻接触力的大小与其之前的接触力测量值存在一定的相关性。正常的检测数据是在一定范围内波动变化的,而拉直线区段数据不存在这样的变化规律。
在本发明实施例中,采用接触力拉直线识别模型来进行拉直线异常数据的识别,在一实施例中,所述接触力拉直线识别模型采用3层LSTM网络结构的LSTM神经网络模型。
LSTM神经网络模型能够有效的学习到时间序列数据中前后依赖关系和变化规律,由于出现拉直线异常的区段数据不满足这种规律,会导致模型对拉直线异常区段的预测误差较大。因此可以基于LSTM网络的预测偏差来辨识数据是否出现异常。
LSTM是循环神经网络(RNN)的一种特殊形式,图4为本发明实施例中LSTM神经网络的结构示意图。LSTM神经网络隐藏层增加了单元状态C使得单元的状态能够长期保持。其前向传播算法如公式(1)~(6)所示。其中[a,b]表示两个向量a连接到向量b尾部,σ为sigmod函数,Ct表示t时刻的状态,表示临时状态,W表示全连接神经网络的权重系数,b表示偏置,h表示单元的输出。
LSTM神经网络的特点在于设计了遗忘门ft,输入门it以及输出门Ot三个门结构,每个门结构相当于一个独立的全连接神经网络,其中遗忘门如公式(1),用于舍弃和保留时间序列中的部分信息。如公式(2),(3),(4)输入门的作用在于根据遗忘门得到的状态信息将时间序列上一时刻的信息与当前输入信息相结合,并产生新的状态信息。如公式(5),(6),输出门的作用在于得到当前时刻的输出值。
ft=σ(Wf·[ht-1,xt]+bf) (1)
it=σ(Wi·[ht-1,xt]+bi) (2)
Ot=σ(Wo·[ht-1,xt]+bO) (5)
ht=Ot*tanh(Ct) (6)
为了提高模型的预测效果,经过试验对比在本发明实施例中采取3层LSTM网络结构,不同层级采取不同的隐藏层节点数具体的,具体参数见表1。
表1.LSTM模型参数
LSTM层级 隐藏层节点 输入维度 输出维度
LSTM1 100 (200,1) (200,100)
LSTM2 20 (200,100) (200,20)
LSTM3 1 (200,20) 1
不管是进行接触力拉直线识别模型训练还是进行预测,都需要先采用移动滑窗的方式处理,在一实施例中,所述训练好的接触力拉直线识别模型采用如下步骤进行训练:
将历史弓网接触力正常检测数据采用移动滑窗的方式处理为时间序列训练集,所述时间序列训练集包括m+1个正常检测数据,其中m为所述预设标记值;
以时间序列训练集中前m个正常检测数据为输入,以时间序列训练集中第m+1个正常检测数据为输出,对接触力拉直线识别模型进行训练,获得训练好的接触力拉直线识别模型。
目前,大多数两接触线固定装置之间的距离为50米,接触力检测数据的采集频率为每米4个点,因此在本发明实施例中,预设标记值m可以为200,即选择200个点为时间序列长度进行预测,LSTM神经网络的输入序列长度为200,图5为本发明实施例中LSTM神经网络中3层LSTM网络结构的输入示意图。
图6为本发明实施例中接触力拉直线识别模型进行训练和预测的流程图,包括训练阶段和预测阶段,这里的接触力拉直线识别模型采用LSTM神经网络模型,在训练阶段,将历史弓网接触力正常检测数据采用移动滑窗的方式处理为时间序列训练集,图7为本发明实施例中采用移动滑窗的方式处理为时间序列训练集的示意图;以时间序列训练集中前200个正常检测数据为输入,以时间序列训练集中第201个正常检测数据为输出,第201个正常检测数据为预测标签,对LSTM神经网络模型进行训练,使LSTM神经网络模型能够学习到检测数据的变化规律,使得在预测时将待分析的弓网接触力检测数据输入网络,由于异常数据不满足正常数据的变化规律,将导致较大的预测误差,因此可以判断检测数据是否正常。
在预测阶段,将待分析的弓网接触力检测数据采用移动滑窗的方式处理为时间序列预测集;对时间序列预测集中第Tm(m>=200)个检测数据,将时间序列预测集中该检测数据前200个检测数据Tm-200至Tm-1输入至训练好的LSTM神经网络模型中,获得预测值Tpm,在所述预测值Tpm与该检测数据Tm的差值|Tpm-Tm|超过误差阈值w后,确定该检测数据为拉直线异常数据。其原理是由于通过之前的预训练,LSTM神经网络已经学习到了接触力正常检测数据沿时间维度的变化规律,因此,如果第Tm个数据点为正常检测数据,其与LSTM神经网络的预测值应当十分接近,但如果出现了拉直线异常,LSTM神经网络将出现较大的预测误。
在一实施例中,所述方法还包括:
在确定该检测数据为拉直线异常数据之后,将所述时间序列预测集中该检测数据替换为所述预测值。这是为了后续预测不受拉直线异常数据的影响。图8为本发明实施例中采用图6的步骤进行训练和预测的结果示意图,通过训练使LSTM神经网络模型能够学习到接触力检测数据的变化规律,图8中,圆点划线部分为LSTM神经网络模型对时间序列训练集的预测效果,三角形划线部分为时间序列预测集的预测效果,可以看出LSTM神经网络模型能够很好地预测接触力检测数据的变化规律,从而识别拉直线异常数据。
下面给出具体实施例,以某高铁下行接触网进行接触力检测时的一段接触力检测数据为例,图9为本发明实施例中某高铁下行接触力检测数据的示意图,可以看出第17000至21000个检测点之间接触力出现了拉直线异常。将检测数据采用移动滑窗的方式处理为时间序列预测集,输入到训练好的LSTM神经网络模型中,得到的预测结果如图10所示,图10为本发明实施例中某高铁下行接触力检测数据的预测值的示意图,可以看出17000至21000个检测点之间预测值与图9中的真实值存在较大偏差,通过图9中的检测数据的真实值与预测值进行比较可以判定为拉直线异常数据。
综上所述,在本发明实施例提出的方法中,从待分析的弓网接触力检测数据中,筛选出离群值点,确定所述离群值点为单值异常数据;将待分析的弓网接触力检测数据采用移动滑窗的方式处理为时间序列预测集;对时间序列预测集中每个检测数据,将时间序列预测集中该检测数据前预设长度个检测数据输入至训练好的接触力拉直线识别模型中,获得预测值,在所述预测值与该检测数据的差值超过误差阈值后,确定该检测数据为拉直线异常数据,其中该检测数据在时间序列预测集中的序号在预设标记值之后。在上述实施例中,从弓网动态检测数据中识别出了两种非区段异常数据,包括单值异常数据和拉直线异常数据,具体有益效果包括:通过自动识别的离群值点和训练好的接触力拉直线识别模型,显著提高了弓网接触力检测数据的识别效率和准确度。摆脱了人工识别时对工作人员经验的依赖性,提高了接触网状态评价的准确度和权威性。
本发明实施例还提出一种弓网接触力非区段异常识别装置,其原理与弓网接触力非区段异常识别方法类似,这里不再赘述。
图11为本发明实施例中弓网接触力非区段异常识别装置的示意图,如图11所示,该装置包括:
单值异常数据确定模块1101,用于从待分析的弓网接触力检测数据中,筛选出离群值点,确定所述离群值点为单值异常数据;
数据处理模块1102,用于将待分析的弓网接触力检测数据采用移动滑窗的方式处理为时间序列预测集;
拉直线异常数据确定模块1103,用于对时间序列预测集中每个检测数据,将时间序列预测集中该检测数据前预设长度个检测数据输入至训练好的接触力拉直线识别模型中,获得预测值,在所述预测值与该检测数据的差值超过误差阈值后,确定该检测数据为拉直线异常数据,其中该检测数据在时间序列预测集中的序号在预设标记值之后。
在一实施例中,单值异常数据确定模块具体用于:
以待分析的弓网接触力检测数据中每一个检测数据为圆心,根据预设的搜索半径对所述圆心和搜索半径构成的圆圈内的检测数据进行统计,在统计的检测数据的数量超过密度阈值时,将该圆心记为核心点;
若待分析的弓网接触力检测数据中一个检测数据的搜索半径邻域内的检测数据的数量小于所述密度阈值,但落入核心点的邻域内,将该检测数据记为边界点;
将待分析的弓网接触力检测数据中既不是核心点也不是边界点的检测数据,记为离群值点。
图12为本发明实施例中弓网接触力非区段异常识别装置的另一示意图,在一实施例中,所述装置还包括模型训练模块1104,用于:
采用如下步骤进行训练接触力拉直线识别模型:
将历史弓网接触力正常检测数据采用移动滑窗的方式处理为时间序列训练集,所述时间序列训练集包括m+1个正常检测数据,其中m为所述预设标记值;
以时间序列训练集中前m个正常检测数据为输入,以时间序列训练集中第m+1个正常检测数据为输出,对接触力拉直线识别模型进行训练,获得训练好的接触力拉直线识别模型。
在一实施例中,所述接触力拉直线识别模型采用3层LSTM网络结构的LSTM神经网络模型。
在一实施例中,模型训练模块还用于:
在确定该检测数据为拉直线异常数据之后,将所述时间序列预测集中该检测数据替换为所述预测值。
综上所述,在本发明实施例提出的装置中,从待分析的弓网接触力检测数据中,筛选出离群值点,确定所述离群值点为单值异常数据;将待分析的弓网接触力检测数据采用移动滑窗的方式处理为时间序列预测集;对时间序列预测集中每个检测数据,将时间序列预测集中该检测数据前预设长度个检测数据输入至训练好的接触力拉直线识别模型中,获得预测值,在所述预测值与该检测数据的差值超过误差阈值后,确定该检测数据为拉直线异常数据,其中该检测数据在时间序列预测集中的序号在预设标记值之后。在上述实施例中,从弓网动态检测数据中识别出了两种非区段异常数据,包括单值异常数据和拉直线异常数据,具体有益效果包括:通过自动识别的离群值点和训练好的接触力拉直线识别模型,显著提高了弓网接触力检测数据的识别效率和准确度。摆脱了人工识别时对工作人员经验的依赖性,提高了接触网状态评价的准确度和权威性。
本发明的实施例还提供一种计算机设备,图13为本发明实施例中计算机设备的示意图,该计算机设备能够实现上述实施例中的弓网接触力非区段异常识别方法中全部步骤,所述计算机设备具体包括如下内容:
处理器(processor)1301、存储器(memory)1302、通信接口(CommunicationsInterface)1303和通信总线1304;
其中,所述处理器1301、存储器1302、通信接口1303通过所述通信总线1304完成相互间的通信;所述通信接口1303用于实现服务器端设备、检测设备以及用户端设备等相关设备之间的信息传输;
所述处理器1301用于调用所述存储器1302中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的弓网接触力非区段异常识别方法中的全部步骤。
本发明的实施例还提供一种计算机可读存储介质,能够实现上述实施例中的弓网接触力非区段异常识别方法中全部步骤,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的弓网接触力非区段异常识别方法的全部步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种弓网接触力非区段异常识别方法,其特征在于,包括:
从待分析的弓网接触力检测数据中,筛选出离群值点,确定所述离群值点为单值异常数据;
将待分析的弓网接触力检测数据采用移动滑窗的方式处理为时间序列预测集;
对时间序列预测集中每个检测数据,将时间序列预测集中该检测数据前预设长度个检测数据输入至训练好的接触力拉直线识别模型中,获得预测值,在所述预测值与该检测数据的差值超过误差阈值后,确定该检测数据为拉直线异常数据,其中该检测数据在时间序列预测集中的序号在预设标记值之后;
所述训练好的接触力拉直线识别模型采用如下步骤进行训练:
将历史弓网接触力正常检测数据采用移动滑窗的方式处理为时间序列训练集,所述时间序列训练集包括m+1个正常检测数据,其中m为所述预设标记值;
以时间序列训练集中前m个正常检测数据为输入,以时间序列训练集中第m+1个正常检测数据为输出,对接触力拉直线识别模型进行训练,获得训练好的接触力拉直线识别模型;
所述接触力拉直线识别模型采用3层LSTM网络结构的LSTM神经网络模型。
2.如权利要求1所述的弓网接触力非区段异常识别方法,其特征在于,从待分析的弓网接触力检测数据中,筛选出离群值点,包括:
以待分析的弓网接触力检测数据中每一个检测数据为圆心,根据预设的搜索半径对所述圆心和搜索半径构成的圆圈内的检测数据进行统计,在统计的检测数据的数量超过密度阈值时,将该圆心记为核心点;
若待分析的弓网接触力检测数据中一个检测数据的搜索半径邻域内的检测数据的数量小于所述密度阈值,但落入核心点的邻域内,将该检测数据记为边界点;
将待分析的弓网接触力检测数据中既不是核心点也不是边界点的检测数据,记为离群值点。
3.如权利要求1所述的弓网接触力非区段异常识别方法,其特征在于,还包括:
在确定该检测数据为拉直线异常数据之后,将所述时间序列预测集中该检测数据替换为所述预测值。
4.一种弓网接触力非区段异常识别装置,其特征在于,包括:
单值异常数据确定模块,用于从待分析的弓网接触力检测数据中,筛选出离群值点,确定所述离群值点为单值异常数据;
数据处理模块,用于将待分析的弓网接触力检测数据采用移动滑窗的方式处理为时间序列预测集;
拉直线异常数据确定模块,用于对时间序列预测集中每个检测数据,将时间序列预测集中该检测数据前预设长度个检测数据输入至训练好的接触力拉直线识别模型中,获得预测值,在所述预测值与该检测数据的差值超过误差阈值后,确定该检测数据为拉直线异常数据,其中该检测数据在时间序列预测集中的序号在预设标记值之后;
还包括模型训练模块,用于:
采用如下步骤进行训练接触力拉直线识别模型:
将历史弓网接触力正常检测数据采用移动滑窗的方式处理为时间序列训练集,所述时间序列训练集包括m+1个正常检测数据,其中m为所述预设标记值;
以时间序列训练集中前m个正常检测数据为输入,以时间序列训练集中第m+1个正常检测数据为输出,对接触力拉直线识别模型进行训练,获得训练好的接触力拉直线识别模型;
所述接触力拉直线识别模型采用3层LSTM网络结构的LSTM神经网络模型。
5.如权利要求4所述的弓网接触力非区段异常识别装置,其特征在于,单值异常数据确定模块具体用于:
以待分析的弓网接触力检测数据中每一个检测数据为圆心,根据预设的搜索半径对所述圆心和搜索半径构成的圆圈内的检测数据进行统计,在统计的检测数据的数量超过密度阈值时,将该圆心记为核心点;
若待分析的弓网接触力检测数据中一个检测数据的搜索半径邻域内的检测数据的数量小于所述密度阈值,但落入核心点的邻域内,将该检测数据记为边界点;
将待分析的弓网接触力检测数据中既不是核心点也不是边界点的检测数据,记为离群值点。
6.如权利要求4所述的弓网接触力非区段异常识别装置,其特征在于,模型训练模块还用于:
在确定该检测数据为拉直线异常数据之后,将所述时间序列预测集中该检测数据替换为所述预测值。
7.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至3任一项所述方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至3任一项所述方法的计算机程序。
CN202110964594.8A 2021-08-20 2021-08-20 弓网接触力非区段异常识别方法及装置 Active CN113610188B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110964594.8A CN113610188B (zh) 2021-08-20 2021-08-20 弓网接触力非区段异常识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110964594.8A CN113610188B (zh) 2021-08-20 2021-08-20 弓网接触力非区段异常识别方法及装置

Publications (2)

Publication Number Publication Date
CN113610188A CN113610188A (zh) 2021-11-05
CN113610188B true CN113610188B (zh) 2024-04-30

Family

ID=78309121

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110964594.8A Active CN113610188B (zh) 2021-08-20 2021-08-20 弓网接触力非区段异常识别方法及装置

Country Status (1)

Country Link
CN (1) CN113610188B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114964389B (zh) * 2022-08-03 2022-10-21 成都凯磁科技有限公司 一种受电弓滑板运行状态评估系统及方法
CN115795999B (zh) * 2022-10-26 2023-08-01 国网新源控股有限公司 一种长期服役抽水蓄能机组性能异常预警方法
CN117932232B (zh) * 2024-03-21 2024-05-28 南京信息工程大学 基于状态识别rime-delm多变量时间序列预测的风速预测系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113267286A (zh) * 2021-07-02 2021-08-17 中国国家铁路集团有限公司 铁路弓网接触力识别方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200097810A1 (en) * 2018-09-25 2020-03-26 Oracle International Corporation Automated window based feature generation for time-series forecasting and anomaly detection

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113267286A (zh) * 2021-07-02 2021-08-17 中国国家铁路集团有限公司 铁路弓网接触力识别方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于深层玻尔兹曼机的风电场异常风速值自适应检测预处理方法;林洁;吴布托;陈伟;;电工技术学报(第S1期);全文 *
接触线高度检测数据异常值识别技术;汪海瑛;周威;孙刚;付浩月;;中国铁路(第06期);全文 *

Also Published As

Publication number Publication date
CN113610188A (zh) 2021-11-05

Similar Documents

Publication Publication Date Title
CN113610188B (zh) 弓网接触力非区段异常识别方法及装置
CN107941537B (zh) 一种机械设备健康状态评估方法
CN110502991B (zh) 基于随机卷积神经网络结构的内燃机健康监测方法及系统
CN104091070B (zh) 一种基于时间序列分析的轨道交通故障诊断方法和系统
CN110533229B (zh) 轨道维修时刻预测方法及装置
CN113848417A (zh) 轨道交通供电设备故障预测方法及装置
Zhang et al. A study on the method for cleaning and repairing the probe vehicle data
Zhou et al. Fault diagnosis of high-speed railway turnout based on support vector machine
CN105205113A (zh) 一种时序数据异常变化过程的挖掘系统及方法
Atamuradov et al. Feature selection and fault‐severity classification–based machine health assessment methodology for point machine sliding‐chair degradation
CN111353640B (zh) 一种组合法风速预测模型构建方法
CN111461183A (zh) 改进人工鱼群算法优化bp神经网络的平轮故障检测方法
Shubinsky et al. Application of machine learning methods for predicting hazardous failures of railway track assets
CN116595319A (zh) 应用于轨道交通电机健康状态评估的预测方法及系统
Rahman et al. Deep learning model for railroad structural health monitoring via distributed acoustic sensing
Chen et al. A mixed samples-driven methodology based on denoising diffusion probabilistic model for identifying damage in carbon fiber composite structures
Cai et al. Estimation of turnout irregularities using vehicle responses with improved BiLSTM and Gaussian process regression
CN113780432A (zh) 基于增强学习的网络信息系统运维异常智能检测方法
Ghiasi et al. An unsupervised anomaly detection framework for onboard monitoring of railway track geometrical defects using one-class support vector machine
CN115222160B (zh) 一种基于实测大数据的轨道交通牵引负荷预测方法
Zeng et al. Rail break prediction and cause analysis using imbalanced in-service train data
CN115310499B (zh) 一种基于数据融合的工业设备故障诊断系统及方法
CN116070140A (zh) 一种配电变电站安全运行状态监测系统及方法
Xu et al. Research of surface defect detection method of hot rolled strip steel based on generative adversarial network
CN114547796B (zh) 一种基于优化bn网络的球磨机特征融合故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant