CN112732787A

CN112732787A - 面向动车组重要部件的设备画像与个性化运维服务方法

Info

Publication number: CN112732787A
Application number: CN202110000266.6A
Authority: CN
Inventors: 张映锋; 史丽春; 任杉; 林琦; 王刚
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2021-01-02
Filing date: 2021-01-02
Publication date: 2021-04-30
Anticipated expiration: 2041-01-02
Also published as: CN112732787B

Abstract

本发明提出一种面向动车组重要部件的设备画像与个性化运维服务方法，首先针对动车组的各个重要部件进行FMEA分析，获取每一个子系统可能发生的故障类别，对故障案例样本抽取故障现象关键词及其权重后，形成特征案例库；其次，构建动车组运维故障的标签库，针对每一个动车组个体建立设备画像模型并进行周期性更新，精确刻画动车组故障规律；最后，基于最近邻搜索算法实现最佳相似案例推荐，最终实现动车组个性化和差异化运维，以降低运维成本，提高运维效率。

Description

面向动车组重要部件的设备画像与个性化运维服务方法

技术领域

本发明涉及重要部件监控与运维方法技术领域，具体为一种面向动车组重要部件的设备画像与个性化运维服务方法。

背景技术

动车组是高速铁路运输的主要技术装备，承担着运输旅客和货物的重大任务，其高效运维直接影响高速铁路运输的安全与效益。动车组零部件众多、结构复杂、集成度高、运维数据庞大，包含有牵引、制动、控制、网络等多个子系统，涵盖了牵引电机、车轮、转向架等多个重要部件。

现有的维修策略主要以计划预防修为主，体现为5级检修制度，包括一级例行检修、二级重点检查、三级重要部件分解检修、四级系统全面分解检修、五级整车全面分解检修，为不同车型设置对应固定的维修周期结构，存在缺乏维修或者过度维修导致的大量人力财力投入问题。随着检修诊断设备、物联网、信息物理系统等新一代信息与通信技术的迅猛发展，动车组检修制度融入了更灵活可变的状态修，充分考虑列车各部件的工作方式与故障模式，对一些已掌握寿命规律的重要零部件进行严格的寿命管理，但维修周期结构不应单一取决于运行里程或车型，还应考虑每一列车在运维过程中的差异化故障现象，进行个性化运维方案的制定。

中国专利《一种物联网设备行为画像方法》(201710500863.9)公开了一种物联网设备行为画像方法，该方法是将用户画像系统与物联网平台相结合，通过对采集得到的智能终端设备的行为数据进行分析、特征提取、放置标签的处理，最终生成多维度的设备行为画像，并生成模型回馈给物联网平台。文献“CTCS--1级列控系统区域列控数据中心故障诊断方法研究，北京：北京交通大学，2019”基于列车区域列控数据中心(Regional DataCenter,RDC)失效模式和影响分析，提出了基于案例推理和词袋模型的RDC浅层诊断模型和基于粗糙集理论和贝叶斯网络的RDC深层故障诊断模型，进而实现快速准确的故障分类，并提供对应的维修措施。

设备画像是根据自动化设备在运行过程中留下的数据，主动或被动采集基本信息，再针对设备本身提取有效的信息当成标签，按照标签信息构造设备的抽象模型。而上述发明和研究在设备画像和动车组某一部件的故障诊断方面取得一定成果，然而在实际的动车组运维过程中，故障现象相互重叠、关联，复杂的部件组成与海量的运维数据使得难以把握每一列车的故障规律特点，因而动车组的运维方案同质化严重、维修周期结构单一，缺乏针对性的、差异性的运维服务，也难以对以往的故障维修案例进行有效利用。因此，针对动车组运维过程的设备画像与个性化运维方案制定有待进一步研究

发明内容

为了解决动车组在运维过程中故障规律精确刻画和差异化运维方案制定问题，本发明提出了一种面向动车组重要部件的设备画像与个性化运维服务方法，以动车组为代表，研究对复杂产品的重要部件在运维过程中的差异化故障现象建立设备画像模型，基于特征案例库和最近邻搜索算法实现最佳相似案例推荐，实现动车组个性化运维方案的形成。

本发明的技术方案是：

首先针对动车组的各个重要部件进行FMEA分析，获取每一个子系统可能发生的故障类别，对故障案例样本抽取故障现象关键词及其权重后，形成特征案例库；其次，构建动车组运维故障的标签库，针对每一个动车组个体建立设备画像模型并进行周期性更新，精确刻画动车组故障规律；最后，基于最近邻搜索算法实现最佳相似案例推荐，最终实现动车组个性化和差异化运维，以降低运维成本，提高运维效率。

具体包括以下步骤：

步骤1：通过整合动车组关键部件的设计、制造和运维场景信息，建立动车组关键部件的标签库，包括动车组关键部件的评价标签、属性标签和行为标签；

具体而言，标签是一个同时包含设备特定属性和值的二元组，其形式化描述为：Tag＝<Name:W>，其中Name表示属性名称，W表示权值，其类型和取值范围由属性决定，具体包括数值型、区间数据型、文本型等。

步骤2：从动车组运维管理相关的系统中收集动车组历史故障信息，并基于面向对象技术与数据库技术相结合的案例表示方法，构建特征案例库。具体包括以下步骤：

步骤2.1：从动车组列控系统、调度系统、联锁系统及外部系统收集动车组历史故障信息，并对动车组进行FMEA分析，确定每一个子系统可能发生的故障类别，并对每一故障类别的故障现象、故障发生的原因、故障影响以及故障发生频率进行分析，总结出典型的故障模式，并筛选出具有代表性的故障案例。

步骤2.2：对收集到的故障案例文本进行文本处理，包括分词、去掉停用词等，抽取故障现象关键词(即评价标签)，并将动车组故障案例用一个四元组来定义：

C＝(D,(S,E),R)

其中，D＝{d₁,d₂,…,d_n}表示对动车组故障案例的描述，包括车次、故障编号、故障发生地点、故障类别等；(S,E)表示故障案例的特征集，S是故障案例的故障现象特征集，表现形式为S＝{(attr₁:η₁),(attr₂:η₂),…,(attr_n:η_n)}，包括故障案例特的故障现象关键词attr_i与对应权重η_i，E是故障案例的属性标签与行为标签信息，包括故障位置、运行环境、运行参数等，表现形式是

E＝{(name₁:W₁),(name₂:W₂),…,(name_m:W_m)}；

R是动车组故障结论信息，包括维修方案、结果评价。

步骤3：构建每一动车组个体的设备画像模型，具体包括以下步骤：

步骤3.1：构建每一动车组个体的设备画像模型M_u为如下形式：

M_u＝{(F₁,E₁):ω₁,(F₂,E₂):ω₂,…,(F_n,E_n):ω_n}

在设备画像模型M_u中，(F_i,E_i)表示某一动车组的某一重要部件的一个故障类别特征向量，每一个故障类别特征向量都关联一个权重ω_i，该权重ω_i是指该部件发生第i个故障类别的次数占设定的固定历史时间窗口中发生所有故障类别数量的比重，只有权重大于设定阈值ω_thresηold的故障类别特征向量才能出现在设备画像模型M_u中。

通过建立设备画像模型M_u，可以对像动车组这样的复杂设备发生频率较高的故障类别及其所属部件进行重点关注。在故障类别特征向量(F_i,E_i)中，F_i为故障现象兴趣模型，表现形式是F_i＝{(attr₁:η₁),(attr₂:η₂),…,(attr_p:η_p)}，其中，attr_j表示一个故障现象关键词，η_j是相应的权重，表示该故障特征的重要程度。E_i是设备部件的属性与行为特征模型，表现形式是E_i＝{(name₁:W₁),(name₂:W₂),…,(name_q:W_q)}，name_k是属性标签或行为标签，包括该故障类别所属的部件编号、运行路段、服役时长、负荷强度、环境湿度、环境温度、生产厂家等基本信息，W_k是标签内容。

步骤3.2：周期性更新设备画像模型M_u。

设备画像模型的更新是一个周期性的更新过程，可根据设备具体的运维情况设置更新周期，统计分析一个周期内的故障反馈信息来更新设备画像模型M_u中的故障类别特征向量(F_i,E_i),i＝1,…,n。根据最新的设备属性和行为信息更新设备画像模型M_u中的设备部件的属性与行为特征模型E_i,i＝1,…,n。应用Rocchio反馈算法更新故障现象兴趣模型F_i,i＝1,…,n。下面详细说明故障现象兴趣模型F_i,i＝1,…,n的更新过程。本发明只考虑Rocchio反馈算法的正反馈情形，所以Rocchio反馈算法计算公式如下：

F_old是更新前的故障现象兴趣模型，F_new是更新后的故障现象兴趣模型，α,β是调整系数，分别表示更新前故障现象兴趣模型的重要性和正反馈故障特征集D_R的重要性，并且α+β＝1。具体的更新过程包括以下步骤：

步骤3.2.1：统计一个更新周期内动车组每一个子系统发生的故障现象，构成正反馈故障特征集

其中的

是指某一子系统在更新周期内发生的故障特征向量，包括故障现象关键词attr_j和相应权重η_j，权重η_j等于故障现象关键词attr_j出现次数n_j占比，计算公式为

步骤3.2.2：对于正反馈故障特征集

中的每一个故障特征向量

计算

与

的相似度。将与

相似度最高的

记为

若

s_threshold是相似度阈值，则更新此

为

否则将

作为新的故障类别特征向量加入到M_u，遍历完正反馈故障特征集

并更新相应相似度最高的故障类别特征向量。

步骤3.2.3：更新设备画像模型M_u中故障类别特征向量(F_i,E_i)的权重ω_i,i＝1,…,n。计算每一动车组个体所有故障类别发生次数占比，将发生次数占比低于阈值ω_threshold的故障类别从M_u中删除。

步骤4：为设备画像模型M_u中的每一个故障类别特征向量推荐最佳相似案例，以形成该设备每一故障类别的个性化运维方案。具体包括以下步骤：

步骤4.1：遍历设备画像模型M_u中每一个故障类别(F_i,E_i),i＝1,…,n，找出特征案例库中第i个故障类别下的故障案例集合，计算故障类别特征向量(F_i,E_i),i＝1,…,n与该故障案例集合中的历史故障案例的相似度，并将相似度最高的历史故障案例及其解决方案进行推送。

步骤4.2：判断设备画像模型M_u中每个故障类别(F_i,E_i),i＝1,…,n被推送的历史故障案例及其解决方案是否适用，若适用，则直接应用其解决方法解决当前问题；若不完全适用，则对最佳相似案例的维修方案进行修正并保存到特征案例库之后，形成该设备故障类别特征向量的个性化维修方案。

有益效果

与现有技术相比，本发明的优点是：整合动车组关键部件的设计、制造和运维场景信息，建立动车组关键部件的标签库；整理故障案例样本，形成特征案例库，为案例推理奠定基础；借鉴用户兴趣建模相关理论，建立设备画像模型，并建立周期性模型更新机制，便于运维人员通过设备画像模型重点关注每一辆动车组的频发故障类型；基于最近邻搜索算法实现最佳相似案例推荐，最终实现案例复用与动车组个性化运维方案的制定，实现动车组的差异化运维管理。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明的技术路线图。

图2是本发明方法的故障案例组织结构图。

图3是故障案例推荐与个性化运维方案形成流程。

具体实施方式

下面详细描述本发明的实施例，所述实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

参照图1，本发明针对动车组在运维阶段故障现象之间相互重叠、关联，难以把握每一列车的故障规律与特点而制定个性运维方案的问题，设计了一种面向动车组重要部件的设备画像与个性化运维服务方法，目的是对每一辆动车组个体建立设备画像模型，最终基于特征案例库和最近邻搜索算法实现最佳相似案例推荐，实现案例复用，并形成个性化运维方案。具体实施步骤如下：

步骤1：通过整合动车组关键部件的设计、制造和运维场景信息，建立动车组关键部件的标签库，包括动车组关键部件的评价标签、属性标签和行为标签。标签是一个同时包含设备特定属性和值的二元组，其形式化描述为：Tag＝<Name:W>，其中Name表示属性名称，W表示权值，其类型和取值范围由属性决定，具体包括数值型、区间数据型、文本型等。标签的构建方法主要包括以下3种方法：

(1)从数据库直接获取：这类标签可从数据库中直接获取，多应用于属性标签，主要描述资产的基本信息，如一个部件标签是<部件名称，转向架>。

(2)逻辑运算：通过简单的逻辑计算即可得到这类标签，多应用于行为标签，描述部件的运行信息，如运行时长、故障次数等。

(3)文本挖掘：对于设备部件整个生命周期的文本信息，采用文本特征化技术，提取故障现象关键词信息，多应用于评价标签，本发明也称评价标签为故障现象关键词，主要描述设备部件的故障特征信息，如运行负荷高等。故障现象关键词的提取方法具体见步骤2.2。

步骤2：参照图2，从动车组运维管理相关的系统中收集动车组历史故障信息，并基于面向对象技术与数据库技术相结合的案例表示方法，构建特征案例库。具体包括以下步骤：

步骤2.1：从动车组的列控系统、调度系统、联锁系统及外部系统收集动车组历史故障信息，并对动车组进行FMEA分析，确定每一个子系统可能发生的故障类别，并对每一故障类别的故障现象、故障发生的原因、故障影响以及故障发生频率进行分析，总结出典型的故障模式，并筛选出具有代表性的故障案例。

步骤2.2：对收集到的故障文本进行分词、去掉停用词等文本处理，抽取故障现象关键词，并用动车组故障案例用一个四元组C＝(D,(S,E),R)来定义。具体包括以下步骤：

步骤2.2.1：Jieba是目前常用的Python中文分词组件，通过在Jieba中加入动车组运维故障常见的专业术语描述，构建动车组专业词汇词典，对故障文本进行分词处理。

步骤2.2.2：构建停用词词典，去掉停用词。

步骤2.2.3：采用卡方检验判断词语与故障之间的相关性，筛选与动车组故障相关性高的词语作为故障现象关键词。具体包括以下步骤：

(1)在故障现象关键词选择阶段，以某个词与某故障类别C不相关作为原假设，计算的卡方值结果越大，说明对原假设的误差越大，说明二者越相关。假设共有N个故障样本，以是否包含特征词T和是否属于故障类别C_j为区分条件，得到A、B、C、D四个数值量，具体如表1所示。

表1

(2)根据原假设C_j类别中包含T的故障样本比例应该与所有故障样本中包含特征词T的占比相同，则A的理论值为：

N＝A+B+C+D

差值为：

其他情况类似，故障类别C_j与特征词T之间的卡方值为：

χ(T,C_j)²＝D₁₁+D₁₂+D₂₁+D₂₂

特征词T的卡方值为：

(3)查询卡方值表，求出临界值，若χ(T)²>临界值，则特征词T为故障现象关键词。抽取完所有故障现象关键词之后，可以得到故障现象关键词词库。

步骤2.2.4：应用TF-IDF计算每一个故障案例中各故障现象关键词的权重。TF部分则是指某个故障现象关键词在所属故障案例样本中出现的频率，设某故障现象关键词T出现了n_i次，所属故障案例样本中总的故障现象关键词出现次数为n，则故障现象关键词T的TF为：

另一方面，假设该故障类别下所有故障案例样本数量为N，含有某个故障现象关键词的故障案例样本数量为N_i，则故障现象关键词T的IDF为：

因此，在该故障案例样本中，故障现象关键词T的权重为TF_i*IDF_i，对于某个故障案例样本S，其故障特征可以对应到若干个故障现象关键词，则组成这个故障案例样本的向量空间模型为S＝{(attr₁:TF₁*IDF₁),(attr₂:TF₂*IDF₂),…,(attr_n:TF_n*IDF_n)}，对权重进行归一化之后的故障案例样本的向量空间模型为S＝{(attr₁:η₁),(attr₂:η₂),…,(attr_n:η_n)}，其中

步骤2.2.5：用一个四元组C＝(D,(S,E),R)来定义每一个动车组故障案例。其中，D＝{d₁,d₂,…,d_n}表示对动车组故障案例的描述，包括车次、故障编号、故障发生地点、故障类别等；(S,E)表示故障案例的特征集，S是故障案例的故障现象特征集，表现形式为S＝{(attr₁:η₁),(attr₂:η₂),…,(attr_n:η_n)}，包括故障案例特的故障现象关键词attr_i与对应权重η_i，E是故障案例的属性标签与行为标签信息，包括故障位置、运行环境、运行参数等，表现形式是E＝{(name₁:W₁),(name₂:W₂),…,(name_m:W_m)}；R是动车组故障结论信息，包括维修方案、结果评价。

M_u＝{(F₁,E₁):ω₁,(F₂,E₂):ω₂,…,(F_n,E_n):ω_n}

在设备画像模型M_u中，(F_i,E_i)表示某一动车组的某一重要部件的一个故障类别特征向量，每一个故障类别特征向量都关联一个权重ω_i，该权重ω_i是指该部件发生故障类别F_i次数占设定的固定历史时间窗口中发生所有故障类别的比重，只有权重大于设定阈值ω_threshold的故障类别特征向量才能出现在设备画像模型M_u中。通过建立设备画像模型M_u，可以对像动车组这样的复杂设备发生频率较高的故障类别及其所属部件进行重点关注。在故障类别特征向量(F_i,E_i)中，F_i为故障现象兴趣模型，表现形式是F_i＝{(attr₁:η₁),(attr₂:η₂),…,(attr_p:η_p)}，其中，attr_j表示一个故障现象关键词，η_j是相应的权重，表示该故障特征的重要程度。具体的计算方法如步骤2.2.4所示。E_i是设备部件的属性与行为特征模型，表现形式是E_i＝{(name₁:W₁),(name₂:W₂),…,(name_q:W_q)}，name_k是属性标签或行为标签，包括该故障类别所属的部件编号、运行路段、服役时长、负荷强度、环境湿度、环境温度、生产厂家等基本信息，W_k是标签内容。

步骤3.2：周期性更新设备画像模型M_u。设备画像模型的更新是一个周期性的更新过程，可根据设备具体的运维情况设置更新周期，统计分析一个周期内的故障反馈信息来更新设备画像模型M_u中的故障类别特征向量(F_i,E_i),i＝1,…,n。根据最新的设备属性和行为信息更新设备画像模型M_u中的设备部件的属性与行为特征模型E_i,i＝1,…,n。应用Rocchio反馈算法思想更新故障现象兴趣模型F_i,i＝1,…,n。下面详细介绍故障现象兴趣模型F_i,i＝1,…,n的更新过程。本发明只考虑Rocchio反馈算法的正反馈情形，所以Rocchio反馈算法计算公式如下：

F_old是更新前的故障现象兴趣模型，F_new是更新后的故障现象兴趣模型，α,β是调整系数，分别表示更新前故障现象兴趣模型、正反馈故障特征集D_R的重要性，并且α+β＝1。具体的更新过程包括以下步骤：

其中的

步骤3.2.2：对于正反馈故障特征集

中的每一个故障特征向量

计算

与

的相似度。相似度计算方法参考步骤4.1。将与

相似度最高的

记为

若

s_threshold是相似度阈值，则更新此

为

否则将

并更新相应相似度最高的故障类别特征向量。

步骤4：参照图3，为设备画像模型M_u中的每一个故障类别特征向量推荐最佳相似案例，以形成该设备每一故障类别的个性化运维方案。具体包括以下步骤：

步骤4.1：遍历设备画像模型M_u中每一个故障类别(F_i,E_i),i＝1,…,n，找出特征案例库中故障类别i下的故障案例集合i，计算故障类别特征向量(F_i,E_i),i＝1,…,n与故障案例集合中故障案例的相似度，并将相似度最高的历史案例及其解决方案进行推送。故障类别特征向量(F_i,E_i)与故障案例

的相似度计算公式如下：

是故障类别特征向量(F_i,E_i)与故障案例

的总体相似度，

是故障类别特征向量(F_i,E_i)与故障案例

的结构相似度，

是故障类别特征向量(F_i,E_i)与故障案例

的共有属性的属性相似度。num是共有属性的个数，且num＝num_F+num_E，num_F是共有的故障现象兴趣属性的个数，num_E是共有的基本属性与行为属性的个数。

结构相似度

的计算公式为：

其中，

是故障类别特征向量(F_i,E_i)与故障案例

交集属性的个数，

是故障类别特征向量(F_i,E_i)与故障案例

并集属性的个数。

属性相似度

的计算公式为：

其中，设故障现象兴趣模型F_i＝{(attr₁:η₁),(attr₂:η₂),…,(attr_p:η_p)}与故障案例

中的S＝{(attr₁:η₁),(attr₂:η₂),…,(attr_n:η_n)}，只考虑两者共有属性，则有

和

则

的计算公式为：

假设设备部件的属性与行为特征模型

E_i＝{(name₁:W₁),(name₂:W₂),…,(name_q:W_q)}

与故障案例

中的属性标签与行为标签信息

E＝{(name₁:W₁),(name₂:W₂),…,(name_m:W_m)}

只考虑两者共有属性，则有

和

并通过专家知识为这num_E个共有属性根据不同重要重要度赋予权值

则

的计算公式为：

基于属性标签与行为标签所对应的权值的取值类型有数值型、数据区间型、确定符号型等多种类型，针对不同取值类型，

的计算方法如下：

(1)数值型属性

常用的数值型属性相似度计算方法如下，max(W_k)、min(W_k)是所有案例中属性k的最大值和最小值。

(2)数据区间型属性

数据区间型属性的相似度与区间的上下边界有关，设W_k∈[L_k,H_k]，则相似度计算公式为：

(3)确定符号型属性

确定符号属性通常是采用明确的符号表示每个值，是一种确定性的符号描述，其相似度计算公式如下：

步骤4.2：判断设备画像模型M_u中第i个故障类别(F_i,E_i),i＝1,…,n被推送的历史案例及其解决方案是否适用，若适用，则直接应用其解决方法解决当前问题；若不完全适用，则对最佳相似案例的维修方案进行修正并保存到特征案例库之后，形成该设备各个故障类别特征向量的个性化维修方案。

本发明以动车组为代表，研究对复杂产品的重要部件在运维过程中的差异化故障现象建立设备画像模型，基于特征案例库和最近邻搜索算法实现最佳相似案例推荐，实现动车组个性化运维方案的形成。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

本发明所属项目得到国家重点研发项目课题(No：2018YFB1703402)和西北工业大学研究生创意创新种子基金(No：CX2020102)资助，以及中车唐山机车车辆有限公司大力支持。

Claims

1.一种面向动车组重要部件的设备画像与个性化运维服务方法，其特征在于：包括以下步骤：

步骤2：从动车组运维管理相关的系统中收集动车组历史故障信息，并基于面向对象技术与数据库技术相结合的案例表示方法，构建特征案例库：

步骤2.1：从动车组列控系统、调度系统、联锁系统及外部系统收集动车组历史故障信息，并对动车组进行FMEA分析，确定每一个子系统可能发生的故障类别，并对每一故障类别的故障现象、故障发生的原因、故障影响以及故障发生频率进行分析，总结出典型的故障模式，并筛选出具有代表性的故障案例；

步骤2.2：对收集到的故障案例文本进行文本处理，抽取故障现象关键词，并将动车组故障案例用一个四元组来定义：

C＝(D,(S,E),R)

其中，D＝{d₁,d₂,…,d_n}表示对动车组故障案例的描述，包括车次、故障编号、故障发生地点、故障类别；(S,E)表示故障案例的特征集，S是故障案例的故障现象特征集，表现形式为S＝{(attr₁:η₁),(attr₂:η₂),…,(attr_n:η_n)}，包括故障案例特的故障现象关键词attr_i与对应权重η_i，E是故障案例的属性标签与行为标签信息，包括故障位置、运行环境、运行参数，表现形式是

E＝{(name₁:W₁),(name₂:W₂),…,(name_m:W_m)}；

R是动车组故障结论信息，包括维修方案、结果评价；

M_u＝{(F₁,E₁):ω₁,(F₂,E₂):ω₂,…,(F_n,E_n):ω_n}

在设备画像模型M_u中，(F_i,E_i)表示某一动车组的某一重要部件的一个故障类别特征向量，每一个故障类别特征向量都关联一个权重ω_i，该权重ω_i是指该部件发生第i个故障类别的次数占设定的固定历史时间窗口中发生所有故障类别数量的比重，只有权重大于设定阈值ω_threshold的故障类别特征向量才能出现在设备画像模型M_u中；

在故障类别特征向量(F_i,E_i)中，F_i为故障现象兴趣模型，表现形式是F_i＝{(attr₁:η₁),(attr₂:η₂),…,(attr_p:η_p)}，其中，attr_j表示一个故障现象关键词，η_j是相应的权重，表示该故障特征的重要程度；E_i是设备部件的属性与行为特征模型，表现形式是E_i＝{(name₁:W₁),(name₂:W₂),…,(name_q:W_q)}，name_k是属性标签或行为标签，W_k是标签内容；

步骤3.2：周期性更新设备画像模型M_u：

设备画像模型的更新是一个周期性的更新过程，根据设备具体的运维情况设置更新周期，统计分析一个周期内的故障反馈信息来更新设备画像模型M_u中的故障类别特征向量(F_i,E_i),i＝1,…,n，包括根据最新的设备属性和行为信息更新设备画像模型M_u中的设备部件的属性与行为特征模型E_i,i＝1,…,n，以及应用Rocchio反馈算法更新故障现象兴趣模型F_i,i＝1,…,n；

步骤4：为设备画像模型M_u中的每一个故障类别特征向量推荐最佳相似案例，以形成该设备每一故障类别的个性化运维方案；具体包括以下步骤：

步骤4.1：遍历设备画像模型M_u中每一个故障类别(F_i,E_i),i＝1,…,n，找出特征案例库中第i个故障类别下的故障案例集合，计算故障类别特征向量(F_i,E_i),i＝1,…,n与该故障案例集合中的历史故障案例的相似度，并将相似度最高的历史故障案例及其解决方案进行推送；

2.根据权利要求1所述一种面向动车组重要部件的设备画像与个性化运维服务方法，其特征在于：步骤1中所述标签是一个同时包含设备特定属性和值的二元组，其形式化描述为：Tag＝<Name:W>，其中Name表示属性名称，W表示权值，权值类型和取值范围由属性决定，包括数值型、区间数据型、文本型。

3.根据权利要求2所述一种面向动车组重要部件的设备画像与个性化运维服务方法，其特征在于：步骤1中所述标签的构建方法包括：从数据库直接获取，用于描述资产的基本信息；通过逻辑计算获得，用于描述部件的运行信息；通过文本挖掘获得：对于设备部件整个生命周期的文本信息，采用文本特征化方法，提取故障现象关键词信息。

4.根据权利要求1所述一种面向动车组重要部件的设备画像与个性化运维服务方法，其特征在于：步骤2.2中，对收集到的故障案例文本进行文本处理，抽取故障现象关键词的具体过程为：

步骤2.2.1：构建动车组专业词汇词典，对故障文本进行分词处理；

步骤2.2.2：构建停用词词典，去掉停用词；

步骤2.2.3：采用卡方检验判断词语与故障之间的相关性，筛选与动车组故障相关性高的词语作为故障现象关键词；具体包括以下步骤：

(1)假设共有N个故障样本，以是否包含特征词T和是否属于故障类别C_j为区分条件，得到A、B、C、D四个数值量：