CN112732787A - 面向动车组重要部件的设备画像与个性化运维服务方法 - Google Patents

面向动车组重要部件的设备画像与个性化运维服务方法 Download PDF

Info

Publication number
CN112732787A
CN112732787A CN202110000266.6A CN202110000266A CN112732787A CN 112732787 A CN112732787 A CN 112732787A CN 202110000266 A CN202110000266 A CN 202110000266A CN 112732787 A CN112732787 A CN 112732787A
Authority
CN
China
Prior art keywords
fault
case
motor train
attr
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110000266.6A
Other languages
English (en)
Other versions
CN112732787B (zh
Inventor
张映锋
史丽春
任杉
林琦
王刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202110000266.6A priority Critical patent/CN112732787B/zh
Publication of CN112732787A publication Critical patent/CN112732787A/zh
Application granted granted Critical
Publication of CN112732787B publication Critical patent/CN112732787B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • G06Q50/40

Abstract

本发明提出一种面向动车组重要部件的设备画像与个性化运维服务方法,首先针对动车组的各个重要部件进行FMEA分析,获取每一个子系统可能发生的故障类别,对故障案例样本抽取故障现象关键词及其权重后,形成特征案例库;其次,构建动车组运维故障的标签库,针对每一个动车组个体建立设备画像模型并进行周期性更新,精确刻画动车组故障规律;最后,基于最近邻搜索算法实现最佳相似案例推荐,最终实现动车组个性化和差异化运维,以降低运维成本,提高运维效率。

Description

面向动车组重要部件的设备画像与个性化运维服务方法
技术领域
本发明涉及重要部件监控与运维方法技术领域,具体为一种面向动车组重要部件的设备画像与个性化运维服务方法。
背景技术
动车组是高速铁路运输的主要技术装备,承担着运输旅客和货物的重大任务,其高效运维直接影响高速铁路运输的安全与效益。动车组零部件众多、结构复杂、集成度高、运维数据庞大,包含有牵引、制动、控制、网络等多个子系统,涵盖了牵引电机、车轮、转向架等多个重要部件。
现有的维修策略主要以计划预防修为主,体现为5级检修制度,包括一级例行检修、二级重点检查、三级重要部件分解检修、四级系统全面分解检修、五级整车全面分解检修,为不同车型设置对应固定的维修周期结构,存在缺乏维修或者过度维修导致的大量人力财力投入问题。随着检修诊断设备、物联网、信息物理系统等新一代信息与通信技术的迅猛发展,动车组检修制度融入了更灵活可变的状态修,充分考虑列车各部件的工作方式与故障模式,对一些已掌握寿命规律的重要零部件进行严格的寿命管理,但维修周期结构不应单一取决于运行里程或车型,还应考虑每一列车在运维过程中的差异化故障现象,进行个性化运维方案的制定。
中国专利《一种物联网设备行为画像方法》(201710500863.9)公开了一种物联网设备行为画像方法,该方法是将用户画像系统与物联网平台相结合,通过对采集得到的智能终端设备的行为数据进行分析、特征提取、放置标签的处理,最终生成多维度的设备行为画像,并生成模型回馈给物联网平台。文献“CTCS--1级列控系统区域列控数据中心故障诊断方法研究,北京:北京交通大学,2019”基于列车区域列控数据中心(Regional DataCenter,RDC)失效模式和影响分析,提出了基于案例推理和词袋模型的RDC浅层诊断模型和基于粗糙集理论和贝叶斯网络的RDC深层故障诊断模型,进而实现快速准确的故障分类,并提供对应的维修措施。
设备画像是根据自动化设备在运行过程中留下的数据,主动或被动采集基本信息,再针对设备本身提取有效的信息当成标签,按照标签信息构造设备的抽象模型。而上述发明和研究在设备画像和动车组某一部件的故障诊断方面取得一定成果,然而在实际的动车组运维过程中,故障现象相互重叠、关联,复杂的部件组成与海量的运维数据使得难以把握每一列车的故障规律特点,因而动车组的运维方案同质化严重、维修周期结构单一,缺乏针对性的、差异性的运维服务,也难以对以往的故障维修案例进行有效利用。因此,针对动车组运维过程的设备画像与个性化运维方案制定有待进一步研究
发明内容
为了解决动车组在运维过程中故障规律精确刻画和差异化运维方案制定问题,本发明提出了一种面向动车组重要部件的设备画像与个性化运维服务方法,以动车组为代表,研究对复杂产品的重要部件在运维过程中的差异化故障现象建立设备画像模型,基于特征案例库和最近邻搜索算法实现最佳相似案例推荐,实现动车组个性化运维方案的形成。
本发明的技术方案是:
首先针对动车组的各个重要部件进行FMEA分析,获取每一个子系统可能发生的故障类别,对故障案例样本抽取故障现象关键词及其权重后,形成特征案例库;其次,构建动车组运维故障的标签库,针对每一个动车组个体建立设备画像模型并进行周期性更新,精确刻画动车组故障规律;最后,基于最近邻搜索算法实现最佳相似案例推荐,最终实现动车组个性化和差异化运维,以降低运维成本,提高运维效率。
具体包括以下步骤:
步骤1:通过整合动车组关键部件的设计、制造和运维场景信息,建立动车组关键部件的标签库,包括动车组关键部件的评价标签、属性标签和行为标签;
具体而言,标签是一个同时包含设备特定属性和值的二元组,其形式化描述为:Tag=<Name:W>,其中Name表示属性名称,W表示权值,其类型和取值范围由属性决定,具体包括数值型、区间数据型、文本型等。
步骤2:从动车组运维管理相关的系统中收集动车组历史故障信息,并基于面向对象技术与数据库技术相结合的案例表示方法,构建特征案例库。具体包括以下步骤:
步骤2.1:从动车组列控系统、调度系统、联锁系统及外部系统收集动车组历史故障信息,并对动车组进行FMEA分析,确定每一个子系统可能发生的故障类别,并对每一故障类别的故障现象、故障发生的原因、故障影响以及故障发生频率进行分析,总结出典型的故障模式,并筛选出具有代表性的故障案例。
步骤2.2:对收集到的故障案例文本进行文本处理,包括分词、去掉停用词等,抽取故障现象关键词(即评价标签),并将动车组故障案例用一个四元组来定义:
C=(D,(S,E),R)
其中,D={d1,d2,…,dn}表示对动车组故障案例的描述,包括车次、故障编号、故障发生地点、故障类别等;(S,E)表示故障案例的特征集,S是故障案例的故障现象特征集,表现形式为S={(attr11),(attr22),…,(attrnn)},包括故障案例特的故障现象关键词attri与对应权重ηi,E是故障案例的属性标签与行为标签信息,包括故障位置、运行环境、运行参数等,表现形式是
E={(name1:W1),(name2:W2),…,(namem:Wm)};
R是动车组故障结论信息,包括维修方案、结果评价。
步骤3:构建每一动车组个体的设备画像模型,具体包括以下步骤:
步骤3.1:构建每一动车组个体的设备画像模型Mu为如下形式:
Mu={(F1,E1):ω1,(F2,E2):ω2,…,(Fn,En):ωn}
在设备画像模型Mu中,(Fi,Ei)表示某一动车组的某一重要部件的一个故障类别特征向量,每一个故障类别特征向量都关联一个权重ωi,该权重ωi是指该部件发生第i个故障类别的次数占设定的固定历史时间窗口中发生所有故障类别数量的比重,只有权重大于设定阈值ωthresηold的故障类别特征向量才能出现在设备画像模型Mu中。
通过建立设备画像模型Mu,可以对像动车组这样的复杂设备发生频率较高的故障类别及其所属部件进行重点关注。在故障类别特征向量(Fi,Ei)中,Fi为故障现象兴趣模型,表现形式是Fi={(attr11),(attr22),…,(attrpp)},其中,attrj表示一个故障现象关键词,ηj是相应的权重,表示该故障特征的重要程度。Ei是设备部件的属性与行为特征模型,表现形式是Ei={(name1:W1),(name2:W2),…,(nameq:Wq)},namek是属性标签或行为标签,包括该故障类别所属的部件编号、运行路段、服役时长、负荷强度、环境湿度、环境温度、生产厂家等基本信息,Wk是标签内容。
步骤3.2:周期性更新设备画像模型Mu
设备画像模型的更新是一个周期性的更新过程,可根据设备具体的运维情况设置更新周期,统计分析一个周期内的故障反馈信息来更新设备画像模型Mu中的故障类别特征向量(Fi,Ei),i=1,…,n。根据最新的设备属性和行为信息更新设备画像模型Mu中的设备部件的属性与行为特征模型Ei,i=1,…,n。应用Rocchio反馈算法更新故障现象兴趣模型Fi,i=1,…,n。下面详细说明故障现象兴趣模型Fi,i=1,…,n的更新过程。本发明只考虑Rocchio反馈算法的正反馈情形,所以Rocchio反馈算法计算公式如下:
Figure BDA0002881274140000041
Fold是更新前的故障现象兴趣模型,Fnew是更新后的故障现象兴趣模型,α,β是调整系数,分别表示更新前故障现象兴趣模型的重要性和正反馈故障特征集DR的重要性,并且α+β=1。具体的更新过程包括以下步骤:
步骤3.2.1:统计一个更新周期内动车组每一个子系统发生的故障现象,构成正反馈故障特征集
Figure BDA0002881274140000042
其中的
Figure BDA0002881274140000043
是指某一子系统在更新周期内发生的故障特征向量,包括故障现象关键词attrj和相应权重ηj,权重ηj等于故障现象关键词attrj出现次数nj占比,计算公式为
Figure BDA0002881274140000044
步骤3.2.2:对于正反馈故障特征集
Figure BDA0002881274140000045
中的每一个故障特征向量
Figure BDA0002881274140000046
计算
Figure BDA0002881274140000047
Figure BDA0002881274140000048
的相似度。将与
Figure BDA0002881274140000049
相似度最高的
Figure BDA00028812741400000410
记为
Figure BDA00028812741400000411
Figure BDA00028812741400000412
Figure BDA00028812741400000413
sthreshold是相似度阈值,则更新此
Figure BDA00028812741400000414
Figure BDA00028812741400000415
否则将
Figure BDA00028812741400000416
作为新的故障类别特征向量加入到Mu,遍历完正反馈故障特征集
Figure BDA00028812741400000417
并更新相应相似度最高的故障类别特征向量。
步骤3.2.3:更新设备画像模型Mu中故障类别特征向量(Fi,Ei)的权重ωi,i=1,…,n。计算每一动车组个体所有故障类别发生次数占比,将发生次数占比低于阈值ωthreshold的故障类别从Mu中删除。
步骤4:为设备画像模型Mu中的每一个故障类别特征向量推荐最佳相似案例,以形成该设备每一故障类别的个性化运维方案。具体包括以下步骤:
步骤4.1:遍历设备画像模型Mu中每一个故障类别(Fi,Ei),i=1,…,n,找出特征案例库中第i个故障类别下的故障案例集合,计算故障类别特征向量(Fi,Ei),i=1,…,n与该故障案例集合中的历史故障案例的相似度,并将相似度最高的历史故障案例及其解决方案进行推送。
步骤4.2:判断设备画像模型Mu中每个故障类别(Fi,Ei),i=1,…,n被推送的历史故障案例及其解决方案是否适用,若适用,则直接应用其解决方法解决当前问题;若不完全适用,则对最佳相似案例的维修方案进行修正并保存到特征案例库之后,形成该设备故障类别特征向量的个性化维修方案。
有益效果
与现有技术相比,本发明的优点是:整合动车组关键部件的设计、制造和运维场景信息,建立动车组关键部件的标签库;整理故障案例样本,形成特征案例库,为案例推理奠定基础;借鉴用户兴趣建模相关理论,建立设备画像模型,并建立周期性模型更新机制,便于运维人员通过设备画像模型重点关注每一辆动车组的频发故障类型;基于最近邻搜索算法实现最佳相似案例推荐,最终实现案例复用与动车组个性化运维方案的制定,实现动车组的差异化运维管理。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明的技术路线图。
图2是本发明方法的故障案例组织结构图。
图3是故障案例推荐与个性化运维方案形成流程。
具体实施方式
下面详细描述本发明的实施例,所述实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
参照图1,本发明针对动车组在运维阶段故障现象之间相互重叠、关联,难以把握每一列车的故障规律与特点而制定个性运维方案的问题,设计了一种面向动车组重要部件的设备画像与个性化运维服务方法,目的是对每一辆动车组个体建立设备画像模型,最终基于特征案例库和最近邻搜索算法实现最佳相似案例推荐,实现案例复用,并形成个性化运维方案。具体实施步骤如下:
步骤1:通过整合动车组关键部件的设计、制造和运维场景信息,建立动车组关键部件的标签库,包括动车组关键部件的评价标签、属性标签和行为标签。标签是一个同时包含设备特定属性和值的二元组,其形式化描述为:Tag=<Name:W>,其中Name表示属性名称,W表示权值,其类型和取值范围由属性决定,具体包括数值型、区间数据型、文本型等。标签的构建方法主要包括以下3种方法:
(1)从数据库直接获取:这类标签可从数据库中直接获取,多应用于属性标签,主要描述资产的基本信息,如一个部件标签是<部件名称,转向架>。
(2)逻辑运算:通过简单的逻辑计算即可得到这类标签,多应用于行为标签,描述部件的运行信息,如运行时长、故障次数等。
(3)文本挖掘:对于设备部件整个生命周期的文本信息,采用文本特征化技术,提取故障现象关键词信息,多应用于评价标签,本发明也称评价标签为故障现象关键词,主要描述设备部件的故障特征信息,如运行负荷高等。故障现象关键词的提取方法具体见步骤2.2。
步骤2:参照图2,从动车组运维管理相关的系统中收集动车组历史故障信息,并基于面向对象技术与数据库技术相结合的案例表示方法,构建特征案例库。具体包括以下步骤:
步骤2.1:从动车组的列控系统、调度系统、联锁系统及外部系统收集动车组历史故障信息,并对动车组进行FMEA分析,确定每一个子系统可能发生的故障类别,并对每一故障类别的故障现象、故障发生的原因、故障影响以及故障发生频率进行分析,总结出典型的故障模式,并筛选出具有代表性的故障案例。
步骤2.2:对收集到的故障文本进行分词、去掉停用词等文本处理,抽取故障现象关键词,并用动车组故障案例用一个四元组C=(D,(S,E),R)来定义。具体包括以下步骤:
步骤2.2.1:Jieba是目前常用的Python中文分词组件,通过在Jieba中加入动车组运维故障常见的专业术语描述,构建动车组专业词汇词典,对故障文本进行分词处理。
步骤2.2.2:构建停用词词典,去掉停用词。
步骤2.2.3:采用卡方检验判断词语与故障之间的相关性,筛选与动车组故障相关性高的词语作为故障现象关键词。具体包括以下步骤:
(1)在故障现象关键词选择阶段,以某个词与某故障类别C不相关作为原假设,计算的卡方值结果越大,说明对原假设的误差越大,说明二者越相关。假设共有N个故障样本,以是否包含特征词T和是否属于故障类别Cj为区分条件,得到A、B、C、D四个数值量,具体如表1所示。
表1
Figure BDA0002881274140000071
(2)根据原假设Cj类别中包含T的故障样本比例应该与所有故障样本中包含特征词T的占比相同,则A的理论值为:
Figure BDA0002881274140000072
N=A+B+C+D
差值为:
Figure BDA0002881274140000073
其他情况类似,故障类别Cj与特征词T之间的卡方值为:
χ(T,Cj)2=D11+D12+D21+D22
特征词T的卡方值为:
Figure BDA0002881274140000081
(3)查询卡方值表,求出临界值,若χ(T)2>临界值,则特征词T为故障现象关键词。抽取完所有故障现象关键词之后,可以得到故障现象关键词词库。
步骤2.2.4:应用TF-IDF计算每一个故障案例中各故障现象关键词的权重。TF部分则是指某个故障现象关键词在所属故障案例样本中出现的频率,设某故障现象关键词T出现了ni次,所属故障案例样本中总的故障现象关键词出现次数为n,则故障现象关键词T的TF为:
Figure BDA0002881274140000082
另一方面,假设该故障类别下所有故障案例样本数量为N,含有某个故障现象关键词的故障案例样本数量为Ni,则故障现象关键词T的IDF为:
Figure BDA0002881274140000083
因此,在该故障案例样本中,故障现象关键词T的权重为TFi*IDFi,对于某个故障案例样本S,其故障特征可以对应到若干个故障现象关键词,则组成这个故障案例样本的向量空间模型为S={(attr1:TF1*IDF1),(attr2:TF2*IDF2),…,(attrn:TFn*IDFn)},对权重进行归一化之后的故障案例样本的向量空间模型为S={(attr11),(attr22),…,(attrnn)},其中
Figure BDA0002881274140000084
步骤2.2.5:用一个四元组C=(D,(S,E),R)来定义每一个动车组故障案例。其中,D={d1,d2,…,dn}表示对动车组故障案例的描述,包括车次、故障编号、故障发生地点、故障类别等;(S,E)表示故障案例的特征集,S是故障案例的故障现象特征集,表现形式为S={(attr11),(attr22),…,(attrnn)},包括故障案例特的故障现象关键词attri与对应权重ηi,E是故障案例的属性标签与行为标签信息,包括故障位置、运行环境、运行参数等,表现形式是E={(name1:W1),(name2:W2),…,(namem:Wm)};R是动车组故障结论信息,包括维修方案、结果评价。
步骤3:构建每一动车组个体的设备画像模型,具体包括以下步骤:
步骤3.1:构建每一动车组个体的设备画像模型Mu为如下形式:
Mu={(F1,E1):ω1,(F2,E2):ω2,…,(Fn,En):ωn}
在设备画像模型Mu中,(Fi,Ei)表示某一动车组的某一重要部件的一个故障类别特征向量,每一个故障类别特征向量都关联一个权重ωi,该权重ωi是指该部件发生故障类别Fi次数占设定的固定历史时间窗口中发生所有故障类别的比重,只有权重大于设定阈值ωthreshold的故障类别特征向量才能出现在设备画像模型Mu中。通过建立设备画像模型Mu,可以对像动车组这样的复杂设备发生频率较高的故障类别及其所属部件进行重点关注。在故障类别特征向量(Fi,Ei)中,Fi为故障现象兴趣模型,表现形式是Fi={(attr11),(attr22),…,(attrpp)},其中,attrj表示一个故障现象关键词,ηj是相应的权重,表示该故障特征的重要程度。具体的计算方法如步骤2.2.4所示。Ei是设备部件的属性与行为特征模型,表现形式是Ei={(name1:W1),(name2:W2),…,(nameq:Wq)},namek是属性标签或行为标签,包括该故障类别所属的部件编号、运行路段、服役时长、负荷强度、环境湿度、环境温度、生产厂家等基本信息,Wk是标签内容。
步骤3.2:周期性更新设备画像模型Mu。设备画像模型的更新是一个周期性的更新过程,可根据设备具体的运维情况设置更新周期,统计分析一个周期内的故障反馈信息来更新设备画像模型Mu中的故障类别特征向量(Fi,Ei),i=1,…,n。根据最新的设备属性和行为信息更新设备画像模型Mu中的设备部件的属性与行为特征模型Ei,i=1,…,n。应用Rocchio反馈算法思想更新故障现象兴趣模型Fi,i=1,…,n。下面详细介绍故障现象兴趣模型Fi,i=1,…,n的更新过程。本发明只考虑Rocchio反馈算法的正反馈情形,所以Rocchio反馈算法计算公式如下:
Figure BDA0002881274140000091
Fold是更新前的故障现象兴趣模型,Fnew是更新后的故障现象兴趣模型,α,β是调整系数,分别表示更新前故障现象兴趣模型、正反馈故障特征集DR的重要性,并且α+β=1。具体的更新过程包括以下步骤:
步骤3.2.1:统计一个更新周期内动车组每一个子系统发生的故障现象,构成正反馈故障特征集
Figure BDA0002881274140000101
其中的
Figure BDA0002881274140000102
是指某一子系统在更新周期内发生的故障特征向量,包括故障现象关键词attrj和相应权重ηj,权重ηj等于故障现象关键词attrj出现次数nj占比,计算公式为
Figure BDA0002881274140000103
步骤3.2.2:对于正反馈故障特征集
Figure BDA0002881274140000104
中的每一个故障特征向量
Figure BDA0002881274140000105
计算
Figure BDA0002881274140000106
Figure BDA0002881274140000107
的相似度。相似度计算方法参考步骤4.1。将与
Figure BDA0002881274140000108
相似度最高的
Figure BDA0002881274140000109
记为
Figure BDA00028812741400001010
Figure BDA00028812741400001011
sthreshold是相似度阈值,则更新此
Figure BDA00028812741400001012
Figure BDA00028812741400001013
否则将
Figure BDA00028812741400001014
作为新的故障类别特征向量加入到Mu,遍历完正反馈故障特征集
Figure BDA00028812741400001015
并更新相应相似度最高的故障类别特征向量。
步骤3.2.3:更新设备画像模型Mu中故障类别特征向量(Fi,Ei)的权重ωi,i=1,…,n。计算每一动车组个体所有故障类别发生次数占比,将发生次数占比低于阈值ωthreshold的故障类别从Mu中删除。
步骤4:参照图3,为设备画像模型Mu中的每一个故障类别特征向量推荐最佳相似案例,以形成该设备每一故障类别的个性化运维方案。具体包括以下步骤:
步骤4.1:遍历设备画像模型Mu中每一个故障类别(Fi,Ei),i=1,…,n,找出特征案例库中故障类别i下的故障案例集合i,计算故障类别特征向量(Fi,Ei),i=1,…,n与故障案例集合中故障案例的相似度,并将相似度最高的历史案例及其解决方案进行推送。故障类别特征向量(Fi,Ei)与故障案例
Figure BDA00028812741400001016
的相似度计算公式如下:
Figure BDA00028812741400001017
Figure BDA00028812741400001018
是故障类别特征向量(Fi,Ei)与故障案例
Figure BDA00028812741400001019
的总体相似度,
Figure BDA00028812741400001020
是故障类别特征向量(Fi,Ei)与故障案例
Figure BDA00028812741400001021
的结构相似度,
Figure BDA0002881274140000111
是故障类别特征向量(Fi,Ei)与故障案例
Figure BDA0002881274140000112
的共有属性的属性相似度。num是共有属性的个数,且num=numF+numE,numF是共有的故障现象兴趣属性的个数,numE是共有的基本属性与行为属性的个数。
结构相似度
Figure BDA0002881274140000113
的计算公式为:
Figure BDA0002881274140000114
其中,
Figure BDA0002881274140000115
是故障类别特征向量(Fi,Ei)与故障案例
Figure BDA0002881274140000116
交集属性的个数,
Figure BDA0002881274140000117
是故障类别特征向量(Fi,Ei)与故障案例
Figure BDA0002881274140000118
并集属性的个数。
属性相似度
Figure BDA0002881274140000119
的计算公式为:
Figure BDA00028812741400001110
其中,设故障现象兴趣模型Fi={(attr11),(attr22),…,(attrpp)}与故障案例
Figure BDA00028812741400001111
中的S={(attr11),(attr22),…,(attrnn)},只考虑两者共有属性,则有
Figure BDA00028812741400001112
Figure BDA00028812741400001113
Figure BDA00028812741400001114
的计算公式为:
Figure BDA00028812741400001115
假设设备部件的属性与行为特征模型
Ei={(name1:W1),(name2:W2),…,(nameq:Wq)}
与故障案例
Figure BDA00028812741400001116
中的属性标签与行为标签信息
E={(name1:W1),(name2:W2),…,(namem:Wm)}
只考虑两者共有属性,则有
Figure BDA00028812741400001117
Figure BDA00028812741400001118
并通过专家知识为这numE个共有属性根据不同重要重要度赋予权值
Figure BDA00028812741400001119
Figure BDA00028812741400001120
的计算公式为:
Figure BDA0002881274140000121
基于属性标签与行为标签所对应的权值的取值类型有数值型、数据区间型、确定符号型等多种类型,针对不同取值类型,
Figure BDA0002881274140000122
的计算方法如下:
(1)数值型属性
常用的数值型属性相似度计算方法如下,max(Wk)、min(Wk)是所有案例中属性k的最大值和最小值。
Figure BDA0002881274140000123
(2)数据区间型属性
数据区间型属性的相似度与区间的上下边界有关,设Wk∈[Lk,Hk],则相似度计算公式为:
Figure BDA0002881274140000124
(3)确定符号型属性
确定符号属性通常是采用明确的符号表示每个值,是一种确定性的符号描述,其相似度计算公式如下:
Figure BDA0002881274140000125
步骤4.2:判断设备画像模型Mu中第i个故障类别(Fi,Ei),i=1,…,n被推送的历史案例及其解决方案是否适用,若适用,则直接应用其解决方法解决当前问题;若不完全适用,则对最佳相似案例的维修方案进行修正并保存到特征案例库之后,形成该设备各个故障类别特征向量的个性化维修方案。
本发明以动车组为代表,研究对复杂产品的重要部件在运维过程中的差异化故障现象建立设备画像模型,基于特征案例库和最近邻搜索算法实现最佳相似案例推荐,实现动车组个性化运维方案的形成。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
本发明所属项目得到国家重点研发项目课题(No:2018YFB1703402)和西北工业大学研究生创意创新种子基金(No:CX2020102)资助,以及中车唐山机车车辆有限公司大力支持。

Claims (7)

1.一种面向动车组重要部件的设备画像与个性化运维服务方法,其特征在于:包括以下步骤:
步骤1:通过整合动车组关键部件的设计、制造和运维场景信息,建立动车组关键部件的标签库,包括动车组关键部件的评价标签、属性标签和行为标签;
步骤2:从动车组运维管理相关的系统中收集动车组历史故障信息,并基于面向对象技术与数据库技术相结合的案例表示方法,构建特征案例库:
步骤2.1:从动车组列控系统、调度系统、联锁系统及外部系统收集动车组历史故障信息,并对动车组进行FMEA分析,确定每一个子系统可能发生的故障类别,并对每一故障类别的故障现象、故障发生的原因、故障影响以及故障发生频率进行分析,总结出典型的故障模式,并筛选出具有代表性的故障案例;
步骤2.2:对收集到的故障案例文本进行文本处理,抽取故障现象关键词,并将动车组故障案例用一个四元组来定义:
C=(D,(S,E),R)
其中,D={d1,d2,…,dn}表示对动车组故障案例的描述,包括车次、故障编号、故障发生地点、故障类别;(S,E)表示故障案例的特征集,S是故障案例的故障现象特征集,表现形式为S={(attr11),(attr22),…,(attrnn)},包括故障案例特的故障现象关键词attri与对应权重ηi,E是故障案例的属性标签与行为标签信息,包括故障位置、运行环境、运行参数,表现形式是
E={(name1:W1),(name2:W2),…,(namem:Wm)};
R是动车组故障结论信息,包括维修方案、结果评价;
步骤3:构建每一动车组个体的设备画像模型,具体包括以下步骤:
步骤3.1:构建每一动车组个体的设备画像模型Mu为如下形式:
Mu={(F1,E1):ω1,(F2,E2):ω2,…,(Fn,En):ωn}
在设备画像模型Mu中,(Fi,Ei)表示某一动车组的某一重要部件的一个故障类别特征向量,每一个故障类别特征向量都关联一个权重ωi,该权重ωi是指该部件发生第i个故障类别的次数占设定的固定历史时间窗口中发生所有故障类别数量的比重,只有权重大于设定阈值ωthreshold的故障类别特征向量才能出现在设备画像模型Mu中;
在故障类别特征向量(Fi,Ei)中,Fi为故障现象兴趣模型,表现形式是Fi={(attr11),(attr22),…,(attrpp)},其中,attrj表示一个故障现象关键词,ηj是相应的权重,表示该故障特征的重要程度;Ei是设备部件的属性与行为特征模型,表现形式是Ei={(name1:W1),(name2:W2),…,(nameq:Wq)},namek是属性标签或行为标签,Wk是标签内容;
步骤3.2:周期性更新设备画像模型Mu
设备画像模型的更新是一个周期性的更新过程,根据设备具体的运维情况设置更新周期,统计分析一个周期内的故障反馈信息来更新设备画像模型Mu中的故障类别特征向量(Fi,Ei),i=1,…,n,包括根据最新的设备属性和行为信息更新设备画像模型Mu中的设备部件的属性与行为特征模型Ei,i=1,…,n,以及应用Rocchio反馈算法更新故障现象兴趣模型Fi,i=1,…,n;
步骤4:为设备画像模型Mu中的每一个故障类别特征向量推荐最佳相似案例,以形成该设备每一故障类别的个性化运维方案;具体包括以下步骤:
步骤4.1:遍历设备画像模型Mu中每一个故障类别(Fi,Ei),i=1,…,n,找出特征案例库中第i个故障类别下的故障案例集合,计算故障类别特征向量(Fi,Ei),i=1,…,n与该故障案例集合中的历史故障案例的相似度,并将相似度最高的历史故障案例及其解决方案进行推送;
步骤4.2:判断设备画像模型Mu中每个故障类别(Fi,Ei),i=1,…,n被推送的历史故障案例及其解决方案是否适用,若适用,则直接应用其解决方法解决当前问题;若不完全适用,则对最佳相似案例的维修方案进行修正并保存到特征案例库之后,形成该设备故障类别特征向量的个性化维修方案。
2.根据权利要求1所述一种面向动车组重要部件的设备画像与个性化运维服务方法,其特征在于:步骤1中所述标签是一个同时包含设备特定属性和值的二元组,其形式化描述为:Tag=<Name:W>,其中Name表示属性名称,W表示权值,权值类型和取值范围由属性决定,包括数值型、区间数据型、文本型。
3.根据权利要求2所述一种面向动车组重要部件的设备画像与个性化运维服务方法,其特征在于:步骤1中所述标签的构建方法包括:从数据库直接获取,用于描述资产的基本信息;通过逻辑计算获得,用于描述部件的运行信息;通过文本挖掘获得:对于设备部件整个生命周期的文本信息,采用文本特征化方法,提取故障现象关键词信息。
4.根据权利要求1所述一种面向动车组重要部件的设备画像与个性化运维服务方法,其特征在于:步骤2.2中,对收集到的故障案例文本进行文本处理,抽取故障现象关键词的具体过程为:
步骤2.2.1:构建动车组专业词汇词典,对故障文本进行分词处理;
步骤2.2.2:构建停用词词典,去掉停用词;
步骤2.2.3:采用卡方检验判断词语与故障之间的相关性,筛选与动车组故障相关性高的词语作为故障现象关键词;具体包括以下步骤:
(1)假设共有N个故障样本,以是否包含特征词T和是否属于故障类别Cj为区分条件,得到A、B、C、D四个数值量:
Figure FDA0002881274130000031
(2)A的理论值为:
Figure FDA0002881274130000032
N=A+B+C+D
差值为:
Figure FDA0002881274130000033
相应能够计算出D12,D21,D22,则故障类别Cj与特征词T之间的卡方值为:
χ(T,Cj)2=D11+D12+D21+D22
特征词T的卡方值为:
Figure FDA0002881274130000041
(3)查询卡方值表,求出临界值,若χ(T)2>临界值,则特征词T为故障现象关键词;抽取完所有故障现象关键词之后,得到故障现象关键词词库;
步骤2.2.4:应用TF-IDF计算每一个故障案例中各故障现象关键词的权重;
其中TF部分则指某个故障现象关键词在所属故障案例样本中出现的频率,设某故障现象关键词T出现了ni次,所属故障案例样本中总的故障现象关键词出现次数为n,则故障现象关键词T的TF为:
Figure FDA0002881274130000042
另一方面,假设该故障类别下所有故障案例样本数量为N,含有某个故障现象关键词的故障案例样本数量为Ni,则故障现象关键词T的IDF为:
Figure FDA0002881274130000043
则在该故障案例样本中,故障现象关键词T的权重为TFi*IDFi
对于某个故障案例样本S,其故障特征对应到若干个故障现象关键词,则组成这个故障案例样本的向量空间模型为
S={(attr1:TF1*IDF1),(attr2:TF2*IDF2),…,(attrn:TFn*IDFn)}
对权重进行归一化之后的故障案例样本的向量空间模型为
S={(attr11),(attr22),…,(attrnn)}
其中
Figure FDA0002881274130000044
5.根据权利要求1所述一种面向动车组重要部件的设备画像与个性化运维服务方法,其特征在于:步骤3.2中,更新故障现象兴趣模型Fi,i=1,…,n的过程为:
步骤3.2.1:统计一个更新周期内动车组每一个子系统发生的故障现象,构成正反馈故障特征集
Figure FDA0002881274130000045
其中的
Figure FDA0002881274130000046
是指某一子系统在更新周期内发生的故障特征向量,包括故障现象关键词attrj和相应权重ηj,权重ηj等于故障现象关键词attrj出现次数nj占比,计算公式为
Figure FDA0002881274130000051
步骤3.2.2:对于正反馈故障特征集
Figure FDA0002881274130000052
中的每一个故障特征向量
Figure FDA0002881274130000053
计算
Figure FDA0002881274130000054
Figure FDA0002881274130000055
的相似度;将与
Figure FDA0002881274130000056
相似度最高的
Figure FDA0002881274130000057
记为
Figure FDA0002881274130000058
Figure FDA0002881274130000059
Figure FDA00028812741300000510
sthreshold是相似度阈值,则更新此
Figure FDA00028812741300000511
Figure FDA00028812741300000512
否则将
Figure FDA00028812741300000513
作为新的故障类别特征向量加入到Mu,遍历完正反馈故障特征集
Figure FDA00028812741300000514
并更新相应相似度最高的故障类别特征向量;其中α,β是调整系数,分别表示更新前故障现象兴趣模型的重要性和正反馈故障特征集DR的重要性,并且α+β=1;
步骤3.2.3:更新设备画像模型Mu中故障类别特征向量(Fi,Ei)的权重ωi,i=1,…,n;计算每一动车组个体所有故障类别发生次数占比,将发生次数占比低于阈值ωthreshold的故障类别从Mu中删除。
6.根据权利要求1所述一种面向动车组重要部件的设备画像与个性化运维服务方法,其特征在于:步骤4.1中,故障类别特征向量(Fi,Ei)与故障案例
Figure FDA00028812741300000515
的相似度计算公式为
Figure FDA00028812741300000516
Figure FDA00028812741300000517
是故障类别特征向量(Fi,Ei)与故障案例
Figure FDA00028812741300000518
的总体相似度,
Figure FDA00028812741300000519
是故障类别特征向量(Fi,Ei)与故障案例
Figure FDA00028812741300000520
的结构相似度,
Figure FDA00028812741300000521
是故障类别特征向量(Fi,Ei)与故障案例
Figure FDA00028812741300000522
的共有属性的属性相似度;num是共有属性的个数,且num=numF+numE,numF是共有的故障现象兴趣属性的个数,numE是共有的基本属性与行为属性的个数;
结构相似度
Figure FDA00028812741300000523
的计算公式为:
Figure FDA00028812741300000524
其中,
Figure FDA00028812741300000525
是故障类别特征向量(Fi,Ei)与故障案例
Figure FDA00028812741300000526
交集属性的个数,
Figure FDA0002881274130000061
是故障类别特征向量(Fi,Ei)与故障案例
Figure FDA0002881274130000062
并集属性的个数;
属性相似度
Figure FDA0002881274130000063
的计算公式为:
Figure FDA0002881274130000064
其中,设故障现象兴趣模型Fi={(attr11),(attr22),…,(attrpp)}与故障案例
Figure FDA0002881274130000065
中的S={(attr11),(attr22),…,(attrnn)},只考虑两者共有属性,则有
Figure FDA0002881274130000066
Figure FDA0002881274130000067
Figure FDA0002881274130000068
的计算公式为:
Figure FDA0002881274130000069
假设设备部件的属性与行为特征模型
Ei={(name1:W1),(name2:W2),…,(nameq:Wq)}
与故障案例
Figure FDA00028812741300000610
中的属性标签与行为标签信息
E={(name1:W1),(name2:W2),…,(namem:Wm)}
只考虑两者共有属性,则有
Figure FDA00028812741300000611
Figure FDA00028812741300000612
并通过专家知识为这numE个共有属性根据不同重要重要度赋予权值
Figure FDA00028812741300000613
Figure FDA00028812741300000614
的计算公式为:
Figure FDA00028812741300000615
7.根据权利要求6所述一种面向动车组重要部件的设备画像与个性化运维服务方法,其特征在于:基于属性标签与行为标签所对应的权值的取值类型有数值型、数据区间型、确定符号型,针对不同取值类型,步骤4.1中的
Figure FDA00028812741300000616
的计算方法如下:
(1)数值型属性
数值型属性相似度计算方法如下,max(Wk)、min(Wk)是所有案例中属性k的最大值和最小值。
Figure FDA0002881274130000071
(2)数据区间型属性
数据区间型属性的相似度与区间的上下边界有关,设Wk∈[Lk,Hk],则相似度计算公式为:
Figure FDA0002881274130000072
(3)确定符号型属性
确定符号属性采用明确的符号表示每个值,其相似度计算公式如下:
Figure FDA0002881274130000073
CN202110000266.6A 2021-01-02 2021-01-02 面向动车组重要部件的设备画像与个性化运维服务方法 Active CN112732787B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110000266.6A CN112732787B (zh) 2021-01-02 2021-01-02 面向动车组重要部件的设备画像与个性化运维服务方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110000266.6A CN112732787B (zh) 2021-01-02 2021-01-02 面向动车组重要部件的设备画像与个性化运维服务方法

Publications (2)

Publication Number Publication Date
CN112732787A true CN112732787A (zh) 2021-04-30
CN112732787B CN112732787B (zh) 2024-04-16

Family

ID=75609460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110000266.6A Active CN112732787B (zh) 2021-01-02 2021-01-02 面向动车组重要部件的设备画像与个性化运维服务方法

Country Status (1)

Country Link
CN (1) CN112732787B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115946132A (zh) * 2023-03-15 2023-04-11 江西丹巴赫机器人股份有限公司 一种智能密集库与物流机器人系统及其故障监测方法
CN116523546A (zh) * 2023-06-29 2023-08-01 深圳市华图测控系统有限公司 智能读者行为分析预测系统数据采集分析的方法和装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5351247A (en) * 1988-12-30 1994-09-27 Digital Equipment Corporation Adaptive fault identification system
US20170108856A1 (en) * 2015-10-14 2017-04-20 Honeywell International Inc. Devices, methods, and systems for a distributed rule based automated fault detection
CN107168285A (zh) * 2017-05-26 2017-09-15 大连理工大学 一种结合主客观信息和云模型的汽车智能故障诊断与维修辅助方法及系统
CN107315810A (zh) * 2017-06-27 2017-11-03 济南浪潮高新科技投资发展有限公司 一种物联网设备行为画像方法
CN109857831A (zh) * 2019-02-20 2019-06-07 云南电网有限责任公司信息中心 一种基于大数据技术的电力设备画像标签体系建设方法
CN109902153A (zh) * 2019-04-02 2019-06-18 杭州安脉盛智能技术有限公司 基于自然语言处理和案例推理的设备故障诊断方法及系统
CN110070257A (zh) * 2019-01-04 2019-07-30 国网浙江省电力有限公司 一种基于标签的电力采集运维对象画像方法
WO2020215907A1 (zh) * 2019-04-23 2020-10-29 北京海益同展信息科技有限公司 机房巡检系统
CN111966758A (zh) * 2020-06-30 2020-11-20 国网浙江省电力有限公司湖州供电公司 一种基于画像数据分析技术的电力隐患排查方法
CN112100506A (zh) * 2020-11-10 2020-12-18 中国电力科学研究院有限公司 信息推送方法、系统、设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5351247A (en) * 1988-12-30 1994-09-27 Digital Equipment Corporation Adaptive fault identification system
US20170108856A1 (en) * 2015-10-14 2017-04-20 Honeywell International Inc. Devices, methods, and systems for a distributed rule based automated fault detection
CN107168285A (zh) * 2017-05-26 2017-09-15 大连理工大学 一种结合主客观信息和云模型的汽车智能故障诊断与维修辅助方法及系统
CN107315810A (zh) * 2017-06-27 2017-11-03 济南浪潮高新科技投资发展有限公司 一种物联网设备行为画像方法
CN110070257A (zh) * 2019-01-04 2019-07-30 国网浙江省电力有限公司 一种基于标签的电力采集运维对象画像方法
CN109857831A (zh) * 2019-02-20 2019-06-07 云南电网有限责任公司信息中心 一种基于大数据技术的电力设备画像标签体系建设方法
CN109902153A (zh) * 2019-04-02 2019-06-18 杭州安脉盛智能技术有限公司 基于自然语言处理和案例推理的设备故障诊断方法及系统
WO2020215907A1 (zh) * 2019-04-23 2020-10-29 北京海益同展信息科技有限公司 机房巡检系统
CN111966758A (zh) * 2020-06-30 2020-11-20 国网浙江省电力有限公司湖州供电公司 一种基于画像数据分析技术的电力隐患排查方法
CN112100506A (zh) * 2020-11-10 2020-12-18 中国电力科学研究院有限公司 信息推送方法、系统、设备及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MARK A ETAL.: "Product portfolio architectural complexity and operational performance :incorporating the roles of learning and fixed assets", JOURNAL OF OPERATIONS MANAGEMENT, vol. 29, no. 8 *
刘冬梅;: "基于数据分析的车辆故障系统研发", 电子测量技术, no. 15 *
寇兴怡;帅斌;黄文成;: "基于贝叶斯网络的高速动车组运营故障分析", 中国安全生产科学技术, no. 04, 30 April 2020 (2020-04-30) *
赵永柱等: "基于电力资产全寿命周期的标签画像技术研究", 电网与清洁能源, vol. 34, no. 1 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115946132A (zh) * 2023-03-15 2023-04-11 江西丹巴赫机器人股份有限公司 一种智能密集库与物流机器人系统及其故障监测方法
CN115946132B (zh) * 2023-03-15 2023-05-30 江西丹巴赫机器人股份有限公司 一种智能密集库与物流机器人系统及其故障监测方法
CN116523546A (zh) * 2023-06-29 2023-08-01 深圳市华图测控系统有限公司 智能读者行为分析预测系统数据采集分析的方法和装置
CN116523546B (zh) * 2023-06-29 2023-12-19 深圳市华图测控系统有限公司 智能读者行为分析预测系统数据采集分析的方法和装置

Also Published As

Publication number Publication date
CN112732787B (zh) 2024-04-16

Similar Documents

Publication Publication Date Title
Wu et al. Literature review and prospect of the development and application of FMEA in manufacturing industry
Kim et al. Futuristic data-driven scenario building: Incorporating text mining and fuzzy association rule mining into fuzzy cognitive map
CN111882446B (zh) 一种基于图卷积网络的异常账户检测方法
CN113723632A (zh) 一种基于知识图谱的工业设备故障诊断方法
Xu et al. A data-driven approach for constructing the component-failure mode matrix for FMEA
Ke et al. An intelligent design for remanufacturing method based on vector space model and case-based reasoning
CN101470731B (zh) 一种可个性化定制的网页过滤方法
CN109345117B (zh) 一种多维数据驱动的交通运输主体综合画像方法
CN105512195B (zh) 一种产品fmeca报告分析决策辅助方法
CN109947898B (zh) 基于智能化的装备故障测试方法
CN112732787A (zh) 面向动车组重要部件的设备画像与个性化运维服务方法
He et al. A novel risk assessment model based on failure mode and effect analysis and probabilistic linguistic ELECTRE II method
CN112884179A (zh) 基于机器故障和文本主题分析的城轨折返故障诊断方法
CN113379313A (zh) 一种具有智能化的预防性试验作业管控系统
Shubinsky et al. Application of machine learning methods for predicting hazardous failures of railway track assets
Xu et al. Typical short-term remedy knowledge mining for product quality problem-solving based on bipartite graph clustering
CN113379214A (zh) 基于事理图谱的电网事故信息自动填报及辅助决策的方法
CN116861924A (zh) 基于人工智能的项目风险预警方法及系统
Gürbüz et al. Classification rule discovery for the aviation incidents resulted in fatality
Alzyoud Improved model for traffic accident management system using KDD and big data: case study Jordan
Li et al. Research on construction of crude set model of critical fault information for bus based on can-bus data
CN115438190A (zh) 一种配电网故障辅助决策知识抽取方法及系统
CN113887994A (zh) 基于互联网评论挖掘的失效模式风险评估方法及系统
Yuan et al. A gray prediction method for economic loss of road traffic accidents based on Logistic model.
CN113886592A (zh) 一种电力信息通信系统运维数据的质量检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant