CN114818353A - 一种基于故障特征关系图谱的列控车载设备故障预测方法 - Google Patents

一种基于故障特征关系图谱的列控车载设备故障预测方法 Download PDF

Info

Publication number
CN114818353A
CN114818353A CN202210499368.1A CN202210499368A CN114818353A CN 114818353 A CN114818353 A CN 114818353A CN 202210499368 A CN202210499368 A CN 202210499368A CN 114818353 A CN114818353 A CN 114818353A
Authority
CN
China
Prior art keywords
data
fault
file
training
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210499368.1A
Other languages
English (en)
Inventor
刘江
蔡伯根
王剑
陆德彪
李正交
郭忠斌
许康智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Original Assignee
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University filed Critical Beijing Jiaotong University
Priority to CN202210499368.1A priority Critical patent/CN114818353A/zh
Publication of CN114818353A publication Critical patent/CN114818353A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Train Traffic Observation, Control, And Security (AREA)

Abstract

本发明提供了一种基于故障特征关系图谱的列控车载设备故障预测方法。该方法包括:构建多层级自动贯通的系统服务架构;设备运行记录数据的全自动处理方法,用于实现现场设备原始数据的自动接入和预处理转换;基于大数据的故障特征关系图谱构建方法,用于实现列控车载设备各类故障的特征关系图谱融合与动态更新;故障特征关系图谱驱动的故障预测方法,用于调用故障特征关系图谱相应的大数据故障预测模型实现故障概率计算与输出。本发明能够运用列控车载设备大数据深度挖掘故障演化规律,构建显性化故障特征关系图谱,提供数据驱动的故障模型预测功能接口,实现列控车载设备在役状态实时评估,为轨道交通列控车载设备智能维护决策提供专用服务。

Description

一种基于故障特征关系图谱的列控车载设备故障预测方法
技术领域
本发明涉及轨道交通系运行维护技术领域,尤其涉及一种基于故障特征关系图谱的列控车载设备故障预测方法。
背景技术
轨道交通系统因其与其他运输系统相比存在的特殊性,多年来已形成了较完整的运营维护体制,然而,随着轨道交通运营发展的不断持续,从系统生命周期的视角来看,将所关注的目标从系统安全分析、系统设计和开发逐步向系统的运行维护与管理进行延伸,引入系统全生命周期协同优化的思路,将是进一步提升轨道交通系统环境友好性、低成本化及综合能效优化的必然选择。列控车载设备作为轨道交通系统运行中对列车实施直接安全控制的核心对象,其维修技术及标准的制定需要大量的实际调研、深入了解系统工作机制、广泛研究国内外相关技术领域的普遍性原理、实施不断的试验和完善,并且需要不断伴随着列车控制系统模式发展与革新进行及时、合理的响应与适配。然而,在当前的列控车载设备维修维护中仍然面临着诸多实际问题,包括维修维护计划相对固定、资源利用率和集中度低、设备生命周期覆盖度不足等。
近年来,以可靠性为中心开展列控系统故障诊断、故障趋势预测这一思路已开始得到关注,且目前主要的列控设备厂商均已实现了列车运行日志的在线存储和报警信息记录,大量日志信息为故障定位与维护分析创造了重要条件。然而,随着城市轨道交通系统的快速建设发展,列控系统车载设备日益累积的监测信息与日志信息过于庞大,对检修人员进行准确分析并综合运用其中的关键间接信息带来了巨大挑战。为此,如何建立有效的平台系统对日益增加的现场数据进行存储与管理,并在此基础上深入探索智能化的数据分析、规律挖掘、模型辨识方法用于对特定列控车载设备实施故障趋势预测,是实施动态的健康管理并及时发现潜在风险点的必要途径。
目前,现有技术中的一些列控车载设备的故障预测方法采用较为分散、局域化的诊断、评估及预测方法,难以对大量的信息进行充分运用,所采用的方案预测能力有限,或受限于模型本身与实际现场情况的偏差,或受限于建模所运用的数据条件不够充分,未有效发挥大数据的能力,所采用的方案针对的设备直接面向列控车载设备的比较少见,实际现场数据难以获取或者条件不具备,是导致这一问题的主因之一。
基于上述分析,目前现有技术中还没有一种适用于列控车载设备未来新型智能维护模式、有效充分运用设备现场运行大数据的故障预测方法。
发明内容
本发明的实施例提供了一种基于故障特征关系图谱的列控车载设备故障预测方法,以实现为构建列控车载设备专用的维修维护支持系统提供基础。
为了实现上述目的,本发明采取了如下技术方案。
一种基于故障特征关系图谱的列控车载设备故障预测方法,包括:构建多层级自动贯通的系统服务架构,基于所述多层级自动贯通的系统服务架构实现设备运行记录数据的全自动处理方法、基于大数据的故障特征关系图谱构建方法和故障特征关系图谱驱动的故障预测方法;
所述的多层级自动贯通的系统服务架构,用于实现从设备数据采集到故障预测输出过程的自动化全覆盖,支撑列控车载设备故障预测系统的自动化服务,实现数据预处理层、数据存储层和数据应用层多层级的全链条自动贯通;
所述的设备运行记录数据的全自动处理方法,用于利用所述多层级自动贯通的系统服务架构中的数据预处理层实现现场设备原始数据的自动接入和预处理转换,完成数据规格化处理,为故障特征关系图谱构建及故障模型训练提供合规接口,实现对现场设备实际数据的有效集成;
所述的基于大数据的故障特征关系图谱构建方法,用于利用所述多层级自动贯通的系统服务架构中的数据应用层实现列控设备大数据与故障特征的融合,通过大数据建模建立设备运行中记录的各个监测量字段与各个故障特征之间的关联融合描述,实现列控设备数据增量叠加条件下各类故障特征关系图谱的动态更新;
所述的故障特征关系图谱驱动的故障预测方法,用于利用所述多层级自动贯通的系统服务架构中的数据应用层对列控车载设备故障演化趋势进行量化描述,通过对故障特征关系图谱对应的大数据故障预测模型进行实时测试,在测试性能达到要求的情况下,调用相应大数据故障预测模型实现故障概率计算与输出。
优选地,所述的多层级自动贯通的系统服务架构包括数据预处理层、数据存储层和数据应用层;
所述的数据预处理层,用于采用在线实时数据接入与离线数据采集的方式,从列控车载设备的现场运营管理单位获取各型号列控车载设备现场原始数据,在将原始数据接入数据存储层之前,首先对原始数据进行预处理,包括数据分类、格式转化、编码转化和文件去重;
所述的数据存储层,用于利用1主N从共N+1台服务器搭建分布式大数据平台,多台服务器通过时间校准、防火墙设置和SSH配置操作实现分布式架构,并实现远程客户端登录访问、互相切换和文件传输功能,基于该平台将经过预处理之后的数据以文本格式存到分布式文件系统HDFS指定格式目录下;
所述的数据应用层,用于在平台内构建数据应用功能模块,完成对存储的现场设备原始数据进行数据管理、数据查询和建模预测,具体包括:数据检索统计模块、故障预测模块和上位操作人机界面模块。
优选地,所述的设备运行记录数据的全自动处理方法的具体处理过程包括以下步骤:
步骤S3.1、对现场设备运行记录数据的文件进行规范命名,利用规范命名后的现场设备数据构建原始训练样本集;
步骤S3.2、文件去重,针对现场设备原始数据的两种情况:一种是文件名完全一样,另一种是文件内容完全一样,具体的文件去重步骤包括:
(1)分别对经过命名规范化的全量文件的文件名和文件内容的信息摘要算法MD5建立索引,记录其出现的次数;
(2)遍历每一个文件,在文件名索引中查看其文件名是否已经存在:
如果存在,则将该文件移入到异常数据集合中;
如果不存在,则继续以该文件内容的MD5值在MD5索引中查看其是否已经存在:
如果存在,则将该文件移入到异常数据集合中;
如果不存在,则将该数据放入到正常数据集合中;
步骤S3.3、格式转化,针对现场设备原始数据文件的二进制编码,利用读取软件将PCF格式原始数据文件批量转化格式并进行编码转化,由GBK编码转换为UTF-8编码;
步骤S3.4、数据清洗,将上述处理后的数据批量存入HDFS指定目录下,通过数据清洗来发现并纠正数据文件中存在的可识别错误。
优选地,所述的步骤S3.4、数据清洗的处理过程包括对以下5种情况开展的操作:
(1)数据值缺失:根据本字段数值分布状态的众数来填充;
(2)异常数据:根据每个变量的合理取值范围和相互关系,检查数据是否合乎要求,发现超出正常范围、逻辑上不合理或者相互矛盾的数据,对于取值不在范围内的情况,则使用默认值进行填充;
(3)重复数据:根据每条数据记录的时间字段来进行判断,如果两条数据记录的时间字段相同,则比较整条记录的所有字段:若整条记录的所有字段完全一样,则认为该条记录重复出现,删除该重复项;
(4)构造新字段:编组号只出现在文件名称中,为将其纳入建模训练的监测量集,将其加入到文件内容中作为每条记录的一部分,时间使用时间戳来表示;
(5)数据记录合并:由于数据清洗之前同一个列控车载设备所属列车车号的原始数据在每天会有不同时间段的多个数据记录文件,对同一个列车车号、同一种信息类别每天的多个数据记录文件进行合并,以时间顺序将它们合并为一个文件。
优选地,所述的基于大数据的故障特征关系图谱构建方法的具体处理过程包括:
步骤S4.1、样本集构建,从HDFS存储的经过数据预处理所得数据文件中提取针对各个故障类型的相关数据,构建用于实施特征关系图谱训练生成的样本集;
步骤S4.2、图谱训练生成,对原始训练样本集进行特征提取、模型训练两个过程,实现在给定训练样本条件下的图谱生成,具体过程包括:
(1)对特定原始训练样本集进行特征转换和特征提取,特征提取过程中选取其中一个包含故障类型的特征字段作为训练标签,所有其余相关字段作为监测量字段,实现对这一故障类型相应故障特征关系图谱生成的数据准备;
(2)利用特征提取后明确监测量字段、训练标签的样本数据为输入,调用故障预测模块所含学习训练程序进行故障特征关系模型构建;
实施决策树学习训练的目标函数obj(t)可列写为:
Figure BDA0003634740180000041
当前迭代次数的正则项Ω(ft)可按如下方式计算:
Figure BDA0003634740180000042
在迭代训练中,使目标函数值最小时的目标函数最优值obj*
Figure BDA0003634740180000043
在迭代训练学习中,目标函数最优值obj*的值越小,代表所构建决策树的结构越优,通过不断迭代生成新的分类回归树加入到原有模型中,不断提高所训练模型的精度水平,直到迭代次数达到最大为止;
(3)遍历所有特征字段对应的故障类型,完成相应的(1)、(2)训练步骤,在全部故障类型迭代学习训练后,获得各个故障特征关系图谱结果;
步骤S4.3、图谱动态更新,当特定故障特征关系图谱所示故障类型有后续新样本接入HDFS后,按时域步进尺度ΔTinc设置的时间周期,当积累样本达到时域条件后,重复步骤4.1、步骤4.2的处理过程,利用增量样本集对既有故障特征关系图谱进行替换,从而实现列控设备数据增量叠加条件下各类故障特征关系图谱的动态更新,并在上位操作人机界面模块上进行显示。
优选地,所述的故障特征关系图谱驱动的故障预测方法的具体处理过程包括:
步骤S5.1、在大数据故障预测模型的测试过程中,调取增量更新的故障特征关系图谱对应的大数据故障预测模型,从HDFS中随机抽取特定故障类型对应数据样本构成测试样本集,提取测试样本中的监测量字段数据,直接加载已训练好的故障特征关系图谱对应的大数据故障预测模型,预测出相应类型故障发生的概率大小,并将预测结果与测试样本故障标签所示真实故障状态进行比较,计算图谱模型预测准确率
Figure BDA0003634740180000051
设置预测准确率门限Qu,在图谱模型预测准确率高于该门限Qu时,即满足式(5)所示条件时,才判定q(τ)对应的模型能够用于实施故障预测计算;
Figure BDA0003634740180000052
步骤S5.2、故障概率预测,从HDFS中提取数据样本所含监测量字段信息,调用已通过测试的大数据故障预测模型,计算输出相应类型故障的发生概率值,利用该发生概率值输出用于对列控车载设备故障演化趋势进行量化描述,并在上位操作人机界面模块中显示故障概率计算的量化结果。
由上述本发明的实施例提供的技术方案可以看出,本发明实施例方法能够依据列控车载设备大数据深度挖掘故障演化规律,构建显性化的故障特征关系图谱,提供数据驱动的故障模型预测功能接口,实现列控车载设备在役状态的实时评估,为轨道交通列控车载设备智能维护决策提供专用服务,为构建列控车载设备专用的维修维护支持系统提供基础。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于故障特征关系图谱的列控车载设备故障预测方法的实现原理示意图;
图2为本发明实施例提供的多层级自动贯通的系统服务架构图;
图3为本发明实施例提供的设备原始数据自动预处理转换流程图;
图4为本发明实施例提供的设备原始数据文件去重流程图;
图5为本发明实施例提供的设备运行监测量重要性分数排序结果;
图6为本发明实施例提供的基于大数据的故障特征关系图谱实例;
图7为本发明实施例提供的故障特征关系图谱对应的单个分类树实例;
图8为本发明实施例提供的故障概率计算结果显示实例。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
本发明实施例以大数据驱动的知识建模与预测维护为目标,提供了一种基于故障特征关系图谱的列控车载设备故障预测方法,为构建列控车载设备专用的维修维护支持系统提供基础。该方法可以实现对大量列控车载设备运行数据的汇集与处理,生成并更新特定基于大数据的故障特征关系图谱,通过对故障趋势的预测为实施适配的故障处理及维修维护操作提供决策依据。该方法包括多层级自动贯通的系统服务架构、设备运行记录数据的全自动处理方法、基于大数据的故障特征关系图谱构建方法、故障特征关系图谱驱动的故障预测方法。列控车载设备的现场运用维护单位,将按期将设备运行中记录的原始数据送入列控车载设备原始数据存储平台,运用本发明提供的方法,首先对原始运行数据进行自动化预处理,其次根据不同的故障类型分别建立并更新相应的故障特征关系图谱构建,最后调用大数据预测模型形成故障趋势的预测分析,确保现场运营维护过程准确掌握列控车载设备的运行可靠性状态,结合对设备故障趋势的把握为维修维护计划的制定与实施提供决策依据。
为本发明实施例提供的一种基于故障特征关系图谱的列控车载设备故障预测方法的实现原理示意图如图1所示,该方法首先构建图2所示的多层级自动贯通的系统服务架构,该系统服务架构可以实现从设备数据采集到故障预测输出过程的自动化全覆盖,支撑列控车载设备故障预测系统的自动化服务,实现数据预处理层、数据存储层、数据应用层等多层级的全链条自动贯通。
基于上述图2所示的多层级自动贯通的系统服务架构,本发明实施例的基于故障特征关系图谱的列控车载设备故障预测方法包括如下的处理过程:
设备运行记录数据的全自动处理方法,用于实现现场设备原始数据的自动接入和预处理转换,实现对数据的规格化处理,为故障特征关系图谱构建及故障模型训练提供合规接口,实现对现场设备实际数据的有效集成。图3为本发明实施例提供的设备原始数据自动预处理转换流程图;
基于大数据的故障特征关系图谱构建方法,用于实现列控设备大数据与故障特征的融合,通过大数据建模建立设备运行中记录的各个监测量字段与各个故障特征之间的关联融合描述,实现列控设备数据增量叠加条件下各类故障特征关系图谱的动态更新。
故障特征关系图谱驱动的故障预测方法,用于对列控车载设备故障演化趋势进行量化描述,通过对故障特征关系图谱对应的大数据故障预测模型进行实时测试,在测试性能达到要求的情况下,调用相应大数据故障预测模型实现故障概率计算与输出。
本发明实施例所建立的基于故障特征关系图谱的列控车载设备故障预测系统,采用了一种多层级自动贯通的系统服务架构,系统一共分为三个层级:
(1)数据预处理层
通过在线实时数据接入接口、离线数据采集接入接口,采用在线实时数据接入与离线数据采集的方式,从列控车载设备的现场运营管理单位获取各型号列控车载设备现场原始数据,在将原始数据接入数据存储层之前,首先对原始数据进行预处理,包括数据分类、格式转化、编码转化、文件去重等。
(2)数据存储层
利用1主N从共(N+1)台服务器搭建分布式大数据平台(比如,Hadoop平台)平台,多台服务器通过时间校准、防火墙设置、SSH(Secure Shell,安全外壳协议)配置等操作实现分布式架构,并实现远程客户端登录访问、互相切换、文件传输等功能。基于该平台将经过预处理之后的数据以文本格式存到HDFS(Hadoop Distribute File System,分布式文件系统)指定格式目录下。HDFS架构由一组特定节点构建,包括NameNode(1个,对应1台主服务器),在HDFS内部提供元数据服务;DataNode(N个,对应N台从服务器),为HDFS提供存储块,作为数据存储使用。
(3)数据应用层
在平台内构建数据应用功能模块,完成对已存储进HDFS的现场设备原始数据进行数据管理、数据查询和建模预测等功能,具体包括:基于Hive组件搭建的数据检索统计模块、基于Spark并行计算框架搭建的故障预测模块、基于HUE(Hadoop User Experience,Hadoop用户界面)的上位操作人机界面模块。
基于Hive组件搭建的数据检索统计模块为系统提供查询引擎,直接读取访问HDFS上存储的数据,将已经过数据预处理后规律存储的设备数据直接进行建表,实现各项数据统计查询功能。以高速列车300T型列控车载设备数据为例,按照子设备类型在Hive建表包括300t_atpcu1、300T_c2cu1、300T_sdp1、300T_tsg1等,以高速列车200H型列控车载设备数据为例,按照子设备类型建表包括baliseinfo、controlinfo、revisioninfo、versioninfo等。
基于Spark并行计算框架搭建的故障预测模块,基于Spark平台作为数据应用层的主要支撑,运行于HDFS上读取数据存储层的数据文件,进行模型选取、机器学习算法测试,完成故障特征关系图谱及对应的大数据故障预测模型的计算与结果输出。
基于HUE架构的上位操作人机界面模块,对系统数据及相应数据应用结果进行可视化展示和查询,如:对各个型号车载设备现场数据的时间、类型分布统计结果进行图形化显示;对所有源文件及清洗后的文件进行筛选,快速定位到某一个文件并在线查看;按照条件进行检索,例如查询某个列控车载设备在某个时间段范围内的故障统计及详细日志;显示构建故障特征关系图谱的设置条件及图谱更新结果;显示大数据故障预测模型的调用选项,并显示故障概率计算与输出结果。
基于上述三个层级的设计,基于故障特征关系图谱的列控车载设备故障预测系统中的各台服务器通过路由器连接,通过内网、外网配置及协议配置,实现以Hadoop平台的互操作性为基础、以自动化数据批处理程序为依托、以上位操作人机界面模块的上位集成接口为交互边界的多层级全链条自动贯通的系统服务架构。基于上述本发明实施例提供的多层级自动贯通的系统服务架构图,本实施例的基于故障特征关系图谱的列控车载设备故障预测系统,能够实现从设备原始数据采集到故障预测输出过程的自动化全覆盖,支撑列控车载设备故障预测系统的自动化服务。
所述的设备运行记录数据的全自动处理方法,用于实现现场设备原始数据的自动接入和预处理转换,实现对数据的规格化处理,其主要原因在于从现场获取的列控车载设备原始数据存在文件命名不规范、文件格式错误、文件内容重复和文件字段缺失、非法等问题,在将原始数据存入HDFS之前,必须先对数据进行预处理,才能确保对数据的处理能够使用固定适配的脚本程序实现存储处理的自动化。具体的数据预处理过程包括4个主要步骤,即:规范命名、文件去重、格式转化、数据清洗。
图3给出了本发明实施例提供的设备原始数据自动预处理转换流程图,包括如下的处理步骤:
步骤S3.1、规范命名,主要针对列控车载设备现场原始数据产生过程中,文件名称可能被人为修改或其它因素导致命名不规范,为批量实施原始文件文件名自动规范化处理带来了困难。因此,需要对文件名提高辨识度和统一性。以200H型列控车载设备为例,其命名规范化过程以“车编组号-车首/车尾-数据生成日期-数据生成时间(精确到秒)”的格式,如表1所示,其中车首以00,车尾以01进行编码,按以上规范修改每个文件的命名后,再删除掉文件名首尾的空格。
表1列控车载设备原始数据命名规范(200H型示例)
Figure BDA0003634740180000101
步骤S3.2、文件去重,主要考虑现场设备原始数据的两种情况:一种是文件名完全一样,另一种是文件内容完全一样,具体的文件去重步骤包括:
(1)分别对经过命名规范化的全量文件的文件名和文件内容的MD5(Message-Digest Algorithm,信息摘要算法)建立索引,记录其出现的次数。
(2)遍历每一个文件,在文件名索引中查看其文件名是否已经存在:
·如果存在,则将该文件移入到异常数据集合中;
·如果不存在,则继续以该文件内容的MD5值在MD5索引中查看其是否已经存在:
·如果存在,则将该文件移入到异常数据集合中;
·如果不存在,则将该数据放入到正常数据集合中。
本发明实施例提供的设备原始数据文件去重流程图如图4所示。
步骤S3.3、格式转化,针对现场设备原始数据文件是二进制编码,利用读取软件将PCF格式原始数据文件批量转化为Excel格式的文件,并在分布式存储平台所部署的Linux环境下对EXCEL文件进行编码转化,由GBK编码转换为UTF-8编码。经过格式转换后的现场设备原始数据文件具备格式化的文件类型。以200H型列控车载设备数据为例,格式转化后的数据文件根据存储信息类型可分为多类,代表性的如控制信息、版本信息、应答器信息,所包含的具体设备运行监测量分别如表2、表3、表4所示。
表2经格式转化的控制信息类数据文件监测量(200H型示例)
Figure BDA0003634740180000111
表3经格式转化的版本信息类数据文件监测量(200H型示例)
Figure BDA0003634740180000112
表4经格式转化的应答器信息类数据文件监测量(200H型示例)
Figure BDA0003634740180000113
Figure BDA0003634740180000121
步骤S3.4、数据清洗,将上述处理后的数据批量存入HDFS指定目录下,通过数据清洗来发现并纠正数据文件中存在的可识别错误。对数据进行重新审查和校验,包括检查数据一致性、处理无效值和缺失值等,删除重复信息,完成数据纠错,并提供数据一致性,供后续数据分析和模型训练使用。具体的数据清洗包括对以下5种情况开展的操作:
(1)数据值缺失:根据本字段数值分布状态的众数来填充。
(2)异常数据:根据每个变量的合理取值范围和相互关系,检查数据是否合乎要求,发现超出正常范围、逻辑上不合理或者相互矛盾的数据,对于取值不在范围内的情况,则使用默认值进行填充。
(3)重复数据:根据每条数据记录的时间字段(精确到毫秒)来进行判断,如果两条数据记录的时间字段相同,则比较整条记录的所有字段:若整条记录的所有字段完全一样,则认为该条记录重复出现,删除该重复项。
(4)构造新字段:编组号只出现在文件名称中,为将其纳入建模训练的监测量集,将其加入到文件内容中作为每条记录的一部分,时间使用Unix时间戳来表示,方便后续进行大小比较与统计查询。
(5)数据记录合并:由于数据清洗之前同一个列控车载设备所属列车车号的原始数据在每天会有不同时间段的多个数据记录文件,对同一个列车车号、同一种信息类别每天的多个数据记录文件进行合并,以时间顺序将它们合并为一个文件。
按照上述流程进行数据清洗处理,在数据规格化基础上,数据量规模、数据文件数量会存在一定变化。以一组300T型列控车载设备数据为例,清洗前原始数据量为631.9MB,文件个数为19569个,清洗后数据量为612.8MB,文件个数为19178个;以一组200H型列控车载设备数据为例,清洗前原始数据量为108.0GB,文件个数为8018个,清洗后数据量为109.1GB,清洗后用于查询的文件个数为6062个,实施数据记录合并后按列车车号与日期存储的文件个数为1799个。
在本发明提供的多层级自动贯通的系统服务架构下,上述数据预处理操作均自动加载完成,最终保留于存储进HDFS的文件目录按照“日期-数据类型-具体类别文件”的格式进行规格化存储,实现对现场设备实际数据的有效集成,在此基础上,能够在基于Hive组件搭建的数据检索统计模块中建立外部关联表,记录清洗数据后存储在HDFS上的路径,进行数据量统计、故障统计、故障查询统计等操作,并为故障特征关系图谱构建及故障模型训练提供合规接口。
所述的基于大数据的故障特征关系图谱构建方法,用于在获得长时间大规模现场运行数据的情况下,在现场运行记录数据文件中蕴含的设备故障状态特征信息与各个相关列控车载设备监测量字段信息之间建立数据驱动的关联描述,通过数据驱动的模型训练构建各个特定设备故障的特征关系图谱,对各个监测量字段对特定故障的“作用程度”进行量化表达,并在大数据条件下使所得故障特征关系图谱能够准确反映、跟踪故障发生的致因作用度演化趋势。基于HDFS存储的经过数据预处理所得数据文件,调用基于Spark并行计算框架搭建的故障预测模块所含特定模型训练程序进行故障特征关系图谱生成,具体的故障关系图谱构建过程包括3个主要步骤,即:样本集构建、图谱训练生成、图谱动态更新。
步骤S4.1、样本集构建,从HDFS存储的经过数据预处理所得数据文件中提取针对各个故障类型的相关数据,构建用于实施特征关系图谱训练生成的样本集。由于原始数据集中无故障数据比例很高,为了平衡训练样本数据的正负样本比例,需要选择部分原始数据构建合理的训练的样本,构建方法如下:
将HDFS中特定故障类型所有原始数据中出现该故障的数据样本全部搜索出来,对发生各类型故障的数据样本按时间段划分成多组“时域前延式”故障样本集。以200H型列控车载设备的“故障信息(faultinfo_1)”这一故障类型为例,针对HDFS中存储的2016至2018年全部原始数据,利用Hive进行条件检索,得到对应该故障类型的全部数据样本,以年度为“时域步进尺度”(ΔTinc=1year),可分别构建2016年故障样本集、2016-2017年故障样本集、2016-2018年故障样本集,然后在每个故障样本集对应时间段内随机选取无故障数据样本,与带故障数据样本组合成原始训练样本集,使原始训练样本的正负样本比例达到1:1,按此方式依次构建出3组原始训练样本集用于故障特征关系图谱构建。
步骤S4.2、图谱训练生成,对步骤S3.1所得原始训练样本集进行特征提取、模型训练两个过程,实现在给定训练样本条件下的图谱生成,具体过程包括:
(1)对特定原始训练样本集进行特征转换和特征提取,特征提取过程中选取其中一个包含故障类型的特征字段作为训练标签,所有其余相关字段作为监测量字段,实现对这一故障类型相应故障特征关系图谱生成的数据准备。以200H型列控车载设备的“故障信息(faultinfo_1)”这一故障类型为例,每一条原始样本包含57个特征字段,将包含“故障信息(faultinfo_1)”的字段作为标签,将离散的字符型数据转化为数值型数据,其余56个字段作为监测量字段,用来训练模型并确定模型的相关参数。
(2)利用特征提取后明确监测量字段、训练标签的样本数据为输入,调用基于Spark并行计算框架搭建的故障预测模块所含学习训练程序进行故障特征关系模型构建。以实施例中构建的200H型列控车载设备2016-2017年故障样本集为例,采用决策树方法进行学习训练,主要参数设置包括:
·最大树深度:max_depth=5;
·树个数:n_estimators=500;
·学习率:learning_rate=0.05;
·分类方法:objective=‘multi:softmax’(多分类);
·多分类类别数:num_class=5。
实施决策树学习训练的目标函数obj(t)可列写为:
Figure BDA0003634740180000141
式中:
Figure BDA0003634740180000142
为第t次预测值下的误差函数,共涉及包含n个样本和m个特征的样本数据集D=(xi,yi)(D|=n,xi∈Rm,yi∈R);
Figure BDA0003634740180000143
为t-1次计算的预测值;ft(xi)为当前的误差预测值;Ω(ft)为当前迭代的正则项;C为常数,表示前t-1次迭代的正则项。
当前迭代次数的正则项Ω(ft)可按如下方式计算:
Figure BDA0003634740180000144
式中:γ和λ是自定义参数,T为决策树的叶子节点数,ω为决策树第j个叶子节点的输出值。
在迭代训练中,使目标函数值最小时的目标函数最优值obj*
Figure BDA0003634740180000151
式中:
Figure BDA0003634740180000152
gi、hi分别为式(1)按照二阶泰勒公式展开的一阶导数、二阶导数;Ij={i|q(xi)=j}表示第j棵分类回归树叶子节点的数据点集合。
在迭代训练学习中,目标函数最优值obj*的值越小,代表所构建决策树的结构越优,通过不断迭代生成新的分类回归树加入到原有模型中,不断提高所训练模型的精度水平,直到迭代次数达到最大为止。
(3)遍历所有特征字段对应的故障类型,完成相应的(1)、(2)训练步骤,在全部故障类型迭代学习训练后,获得各个故障特征关系图谱结果。根据实施例中学习训练参数设置,训练得到故障特征关系图谱对应的模型包含500棵决策树,在学习训练结束后,能够得到全部监测量字段对应相应故障图谱的重要性分数,量化反映大数据条件下各个监测量字段对相应故障标签所示故障类别发生的影响程度,所有监测量字段的重要性分数之和为1,数值越高说明该监测量字段对所得故障特征关系图谱的影响越大。图5给出了本发明实施例提供的设备运行监测量重要性分数排序结果,其中,由于仅有部分监测量字段具有较大的重要性分数,而多数监测量的重要性分数值很小,因此,图中仅显示了重要性排在前10位的监测量字段重要性分数结果。图6给出了本发明实施例提供的基于大数据的故障特征关系图谱实例,其中,围绕在训练标签对应故障类型周围的各个圆形图例代表了各个与该故障具备一定相关度(重要性分数高于一定水平)的监测量字段,圆形图例的大小对应了其重要性分数数值的高低。图6所示故障特征关系图谱的生成有赖于训练所得500棵决策树结果,图7展示了本发明实施例提供的故障特征关系图谱对应的单个分类树实例,其中:圆角矩形框表示某个特征的数值与划分标准的比较,根据比较结果进行分类;直角矩形框表示叶子节点,即按照本棵树的规则划分后得到的预测值,500棵决策树所有的预测值共同决定最终的分类计算结果。
步骤S4.3、图谱动态更新,当特定故障特征关系图谱所示故障类型有后续新样本接入HDFS后,按“时域步进尺度”ΔTinc设置的时间周期,当积累样本达到时域条件后,重复4.1、4.2所示步骤,利用增量样本集对既有故障特征关系图谱进行替换,从而实现列控设备数据增量叠加条件下各类故障特征关系图谱的动态更新,并在基于HUE架构的上位操作人机界面模块上进行显示。
5、所述的故障特征关系图谱驱动的故障预测方法,利用所生成并得到不断更新的故障特征关系图谱及其对应的模型,在得到新数据接入的情况下,代入相应监测量字段量,实施对特定类型故障发生概率的预测计算。具体的故障预测过程包括2个主要步骤,即:图谱模型测试、故障概率预测。
步骤S5.1、在已建立列控车载设备各个类型故障特征关系图谱后,随着HDFS新接入数据样本到来,为了能够调用与之相应的故障特征关系图谱对特定故障的发生概率进行预测,首先需调取增量更新的故障特征关系图谱对应的大数据故障预测模型,通过图谱模型测试,对该模型性能是否足以用于实施故障预测进行判断。在图谱模型测试过程中,从HDFS中随机抽取特定故障类型对应数据样本构成测试样本集,提取测试样本中的监测量字段数据,直接加载已训练好的故障特征关系图谱对应的大数据故障预测模型,预测出相应类型故障发生的概率大小,并将预测结果与测试样本故障标签所示真实故障状态进行比较,计算图谱模型预测准确率。
Figure BDA0003634740180000161
式中:
Figure BDA0003634740180000162
表示对应第q个故障特征关系图谱的模型预测准确率,τ表示训练该模型的训练样本集时间范围;Ntrue(p)、Nsamp(p)分别表示采用第p个测试样本集测试时所有样本中正确预测的数量与样本总数。
设置预测准确率门限Qu,在图谱模型预测准确率高于该门限时,即满足式(5)所示条件时,才判定q(τ)对应的模型可用于实施故障预测计算。
Figure BDA0003634740180000163
以本实施例采用的200H型列控车载设备“故障信息(faultinfo_1)”这一故障类型为例,针对2016年故障样本集、2016-2017年故障样本集、2016-2018年故障样本集分别训练生成的故障特征关系图谱对应的大数据故障预测模型(以下分别简称为2016模型、2016-2017模型、2016-2018模型),设置预测准确率门限为Qu=90%,分别采用2019年1月至2月间5天的测试样本进行图谱模型测试,相应的测试结果如表5所示。
从图谱模型测试结果可以看出,采用不同时域范围的训练样本集生成的图谱模型,在测试过程中表现出的预测准确率水平有明显差别,随着图谱生成阶段所用训练样本集所覆盖时间间隔加长、且临近测试样本日期,模型预测准确性呈现出增高趋势;采用2016-2018模型,在给定的测试样本条件下,其预测准确率能够保证均高于所设定门限,能够被用于进行故障预测操作。
表5图谱模型测试结果示例
Figure BDA0003634740180000171
步骤S5.2、故障概率预测,从HDFS中提取数据样本所含监测量字段信息,调用已通过测试的大数据故障预测模型,计算输出相应类型故障的发生概率值(0到100%之间),利用该概率输出用于对列控车载设备故障演化趋势进行量化描述,并在基于HUE架构的上位操作人机界面模块中显示故障概率计算的量化结果。图8为本发明实施例提供的故障概率计算结果显示实例,其中,纵轴表示时刻值,横轴表示故障类型代码从00000000H到80000000H的17种故障类型的概率水平(每类故障由0到1分别表示概率水平为0到100%)。
综上所述,本发明能够依据列控车载设备大数据深度挖掘故障演化规律,构建显性化的故障特征关系图谱,提供数据驱动的故障模型预测功能接口,实现列控车载设备在役状态的实时评估,为轨道交通列控车载设备智能维护决策提供专用服务,为构建列控车载设备专用的维修维护支持系统提供基础。
本发明实施例通过引入故障特征关系图谱这一方式,既直观化显示故障与各个相关特征量的直接关联,又在背后将大数据建模过程融入其中,使所得故障模型的能力建立在全面、深入的数据与方法之上。本发明实施例方法直接面向列控车载设备,与研究对象具有直接契合度。
本发明实施例方法可以解决当前应用中缺乏有效、专用的列控车载设备故障预测系统的问题,改变现有条件下无法充分运用设备运行大数据等资源的情况,支撑新型主动式设备维修维护模式、设备全生命周期成本优化的实现。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (6)

1.一种基于故障特征关系图谱的列控车载设备故障预测方法,其特征在于,包括:构建多层级自动贯通的系统服务架构,基于所述多层级自动贯通的系统服务架构实现设备运行记录数据的全自动处理方法、基于大数据的故障特征关系图谱构建方法和故障特征关系图谱驱动的故障预测方法;
所述的多层级自动贯通的系统服务架构,用于实现从设备数据采集到故障预测输出过程的自动化全覆盖,支撑列控车载设备故障预测系统的自动化服务,实现数据预处理层、数据存储层和数据应用层多层级的全链条自动贯通;
所述的设备运行记录数据的全自动处理方法,用于利用所述多层级自动贯通的系统服务架构中的数据预处理层实现现场设备原始数据的自动接入和预处理转换,完成数据规格化处理,为故障特征关系图谱构建及故障模型训练提供合规接口,实现对现场设备实际数据的有效集成;
所述的基于大数据的故障特征关系图谱构建方法,用于利用所述多层级自动贯通的系统服务架构中的数据应用层实现列控设备大数据与故障特征的融合,通过大数据建模建立设备运行中记录的各个监测量字段与各个故障特征之间的关联融合描述,实现列控设备数据增量叠加条件下各类故障特征关系图谱的动态更新;
所述的故障特征关系图谱驱动的故障预测方法,用于利用所述多层级自动贯通的系统服务架构中的数据应用层对列控车载设备故障演化趋势进行量化描述,通过对故障特征关系图谱对应的大数据故障预测模型进行实时测试,在测试性能达到要求的情况下,调用相应大数据故障预测模型实现故障概率计算与输出。
2.根据权利要求1所述的方法,其特征在于,所述的多层级自动贯通的系统服务架构包括数据预处理层、数据存储层和数据应用层;
所述的数据预处理层,用于采用在线实时数据接入与离线数据采集的方式,从列控车载设备的现场运营管理单位获取各型号列控车载设备现场原始数据,在将原始数据接入数据存储层之前,首先对原始数据进行预处理,包括数据分类、格式转化、编码转化和文件去重;
所述的数据存储层,用于利用1主N从共N+1台服务器搭建分布式大数据平台,多台服务器通过时间校准、防火墙设置和SSH配置操作实现分布式架构,并实现远程客户端登录访问、互相切换和文件传输功能,基于该平台将经过预处理之后的数据以文本格式存到分布式文件系统HDFS指定格式目录下;
所述的数据应用层,用于在平台内构建数据应用功能模块,完成对存储的现场设备原始数据进行数据管理、数据查询和建模预测,具体包括:数据检索统计模块、故障预测模块和上位操作人机界面模块。
3.根据权利要求1或者2所述的方法,其特征在于,所述的设备运行记录数据的全自动处理方法的具体处理过程包括以下步骤:
步骤S3.1、对现场设备运行记录数据的文件进行规范命名,利用规范命名后的现场设备数据构建原始训练样本集;
步骤S3.2、文件去重,针对现场设备原始数据的两种情况:一种是文件名完全一样,另一种是文件内容完全一样,具体的文件去重步骤包括:
(1)分别对经过命名规范化的全量文件的文件名和文件内容的信息摘要算法MD5建立索引,记录其出现的次数;
(2)遍历每一个文件,在文件名索引中查看其文件名是否已经存在:
如果存在,则将该文件移入到异常数据集合中;
如果不存在,则继续以该文件内容的MD5值在MD5索引中查看其是否已经存在:
如果存在,则将该文件移入到异常数据集合中;
如果不存在,则将该数据放入到正常数据集合中;
步骤S3.3、格式转化,针对现场设备原始数据文件的二进制编码,利用读取软件将PCF格式原始数据文件批量转化格式并进行编码转化,由GBK编码转换为UTF-8编码;
步骤S3.4、数据清洗,将上述处理后的数据批量存入HDFS指定目录下,通过数据清洗来发现并纠正数据文件中存在的可识别错误。
4.根据权利要求3所述的方法,其特征在于,所述的步骤S3.4、数据清洗的处理过程包括对以下5种情况开展的操作:
(1)数据值缺失:根据本字段数值分布状态的众数来填充;
(2)异常数据:根据每个变量的合理取值范围和相互关系,检查数据是否合乎要求,发现超出正常范围、逻辑上不合理或者相互矛盾的数据,对于取值不在范围内的情况,则使用默认值进行填充;
(3)重复数据:根据每条数据记录的时间字段来进行判断,如果两条数据记录的时间字段相同,则比较整条记录的所有字段:若整条记录的所有字段完全一样,则认为该条记录重复出现,删除该重复项;
(4)构造新字段:编组号只出现在文件名称中,为将其纳入建模训练的监测量集,将其加入到文件内容中作为每条记录的一部分,时间使用时间戳来表示;
(5)数据记录合并:由于数据清洗之前同一个列控车载设备所属列车车号的原始数据在每天会有不同时间段的多个数据记录文件,对同一个列车车号、同一种信息类别每天的多个数据记录文件进行合并,以时间顺序将它们合并为一个文件。
5.根据权利要求1所述的方法,其特征在于,所述的基于大数据的故障特征关系图谱构建方法的具体处理过程包括:
步骤S4.1、样本集构建,从HDFS存储的经过数据预处理所得数据文件中提取针对各个故障类型的相关数据,构建用于实施特征关系图谱训练生成的样本集;
步骤S4.2、图谱训练生成,对原始训练样本集进行特征提取、模型训练两个过程,实现在给定训练样本条件下的图谱生成,具体过程包括:
(1)对特定原始训练样本集进行特征转换和特征提取,特征提取过程中选取其中一个包含故障类型的特征字段作为训练标签,所有其余相关字段作为监测量字段,实现对这一故障类型相应故障特征关系图谱生成的数据准备;
(2)利用特征提取后明确监测量字段、训练标签的样本数据为输入,调用故障预测模块所含学习训练程序进行故障特征关系模型构建;
实施决策树学习训练的目标函数obj(t)可列写为:
Figure FDA0003634740170000031
当前迭代次数的正则项Ω(ft)可按如下方式计算:
Figure FDA0003634740170000032
在迭代训练中,使目标函数值最小时的目标函数最优值obj*为:
Figure FDA0003634740170000033
在迭代训练学习中,目标函数最优值obj*的值越小,代表所构建决策树的结构越优,通过不断迭代生成新的分类回归树加入到原有模型中,不断提高所训练模型的精度水平,直到迭代次数达到最大为止;
(3)遍历所有特征字段对应的故障类型,完成相应的(1)、(2)训练步骤,在全部故障类型迭代学习训练后,获得各个故障特征关系图谱结果;
步骤S4.3、图谱动态更新,当特定故障特征关系图谱所示故障类型有后续新样本接入HDFS后,按时域步进尺度ΔTinc设置的时间周期,当积累样本达到时域条件后,重复步骤4.1、步骤4.2的处理过程,利用增量样本集对既有故障特征关系图谱进行替换,从而实现列控设备数据增量叠加条件下各类故障特征关系图谱的动态更新,并在上位操作人机界面模块上进行显示。
6.根据权利要求5所述的方法,其特征在于,所述的故障特征关系图谱驱动的故障预测方法的具体处理过程包括:
步骤S5.1、在大数据故障预测模型的测试过程中,调取增量更新的故障特征关系图谱对应的大数据故障预测模型,从HDFS中随机抽取特定故障类型对应数据样本构成测试样本集,提取测试样本中的监测量字段数据,直接加载已训练好的故障特征关系图谱对应的大数据故障预测模型,预测出相应类型故障发生的概率大小,并将预测结果与测试样本故障标签所示真实故障状态进行比较,计算图谱模型预测准确率
Figure FDA0003634740170000041
设置预测准确率门限Qu,在图谱模型预测准确率高于该门限Qu时,即满足式(5)所示条件时,才判定q(τ)对应的模型能够用于实施故障预测计算;
Figure FDA0003634740170000042
步骤S5.2、故障概率预测,从HDFS中提取数据样本所含监测量字段信息,调用已通过测试的大数据故障预测模型,计算输出相应类型故障的发生概率值,利用该发生概率值输出用于对列控车载设备故障演化趋势进行量化描述,并在上位操作人机界面模块中显示故障概率计算的量化结果。
CN202210499368.1A 2022-05-09 2022-05-09 一种基于故障特征关系图谱的列控车载设备故障预测方法 Pending CN114818353A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210499368.1A CN114818353A (zh) 2022-05-09 2022-05-09 一种基于故障特征关系图谱的列控车载设备故障预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210499368.1A CN114818353A (zh) 2022-05-09 2022-05-09 一种基于故障特征关系图谱的列控车载设备故障预测方法

Publications (1)

Publication Number Publication Date
CN114818353A true CN114818353A (zh) 2022-07-29

Family

ID=82512781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210499368.1A Pending CN114818353A (zh) 2022-05-09 2022-05-09 一种基于故障特征关系图谱的列控车载设备故障预测方法

Country Status (1)

Country Link
CN (1) CN114818353A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116304663A (zh) * 2022-12-05 2023-06-23 北京交通大学 基于非平衡样本增强的列控车载设备健康状态管理装置
CN117807377A (zh) * 2024-03-01 2024-04-02 深圳市快金数据技术服务有限公司 多维度物流数据挖掘与预测方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116304663A (zh) * 2022-12-05 2023-06-23 北京交通大学 基于非平衡样本增强的列控车载设备健康状态管理装置
CN116304663B (zh) * 2022-12-05 2023-10-24 北京交通大学 基于非平衡样本增强的列控车载设备健康状态管理装置
CN117807377A (zh) * 2024-03-01 2024-04-02 深圳市快金数据技术服务有限公司 多维度物流数据挖掘与预测方法及系统
CN117807377B (zh) * 2024-03-01 2024-05-14 深圳市快金数据技术服务有限公司 多维度物流数据挖掘与预测方法及系统

Similar Documents

Publication Publication Date Title
CN112990284B (zh) 一种基于XGBoost算法的个体出行行为预测方法、系统及终端
CN110659173A (zh) 一种运维系统及方法
CN114818353A (zh) 一种基于故障特征关系图谱的列控车载设备故障预测方法
CN114970926A (zh) 一种模型训练方法、企业经营风险预测方法和装置
CA3195853A1 (en) Artificial intelligence driven document analysis, including searching, indexing, comparing or associating datasets based on learned representations
CN111461231A (zh) 一种短信息的发送控制方法、装置及存储介质
Vychuzhanin et al. Analysis and structuring diagnostic large volume data of technical condition of complex equipment in transport
CN112527572A (zh) 磁盘故障预测方法、装置、计算机可读存储介质及服务器
CN114662793A (zh) 基于可解释分层模型的业务流程剩余时间预测方法与系统
CN114548494A (zh) 一种可视化造价数据预测智能分析系统
CN113177644A (zh) 一种基于词嵌入和深度时序模型的自动建模系统
CN111723021B (zh) 一种基于知识库和表示学习的缺陷报告自动分派方法
CN113891342B (zh) 基站巡检方法、装置、电子设备及存储介质
CN113127955A (zh) 一种建筑抗震性能评估方法、系统、装置及存储介质
CN115238583B (zh) 一种支持增量日志的业务流程剩余时间预测方法与系统
CN116149895A (zh) 大数据集群性能预测方法、装置和计算机设备
CN113656692B (zh) 基于知识迁移算法的产品推荐方法、装置、设备及介质
CN115345163A (zh) 一种基于故障数据的外场质量分析方法及系统
CN114140004A (zh) 数据处理方法、装置、电子设备及存储介质
CN113554524A (zh) 基于工业互联网的生产智能监控方法、系统及存储介质
CN116701912B (zh) 基于一维卷积神经网络的轴承故障诊断方法及系统
CN117081666B (zh) 故障预测方法、装置、电子设备、存储介质及程序产品
CN117725488B (zh) 基于机器学习的建筑工程项目安全性能预测方法及系统
CN111008658B (zh) 一种基于监督式学习的警务人员学习分析系统
WO2024113641A1 (zh) 视频推荐方法、装置、电子设备、计算机可读存储介质及计算机程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination