CN112990467A - 一种基于生成式贝叶斯因果网络的汽车故障分析方法 - Google Patents

一种基于生成式贝叶斯因果网络的汽车故障分析方法 Download PDF

Info

Publication number
CN112990467A
CN112990467A CN202011545177.1A CN202011545177A CN112990467A CN 112990467 A CN112990467 A CN 112990467A CN 202011545177 A CN202011545177 A CN 202011545177A CN 112990467 A CN112990467 A CN 112990467A
Authority
CN
China
Prior art keywords
causal
automobile
generative
automobile fault
causal network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011545177.1A
Other languages
English (en)
Inventor
廖军
叶婷
刘礼
邓正巧
李小虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202011545177.1A priority Critical patent/CN112990467A/zh
Publication of CN112990467A publication Critical patent/CN112990467A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开一种基于生成式贝叶斯因果网络的汽车故障分析方法,步骤为:1)获取汽车故障数据。2)建立汽车故障代表性样本子集;3)建立特征选择模型HSIC Lasso;4)构建生成式贝叶斯函数因果网络模型;5)将特征向量集v输入到生成式贝叶斯因果网络模型中,输出因果有向图;6)计算因果有向图的模型评估指标,若模型评估指标满足要求,则输出当前因果有向图,否则,更新生成式贝叶斯因果网络模型的权重和偏移,并返回步骤5);本发明提出一种直观、有效的汽车故障分析方法,建立更加快速、准确、方便的汽车故障因果分析方法。

Description

一种基于生成式贝叶斯因果网络的汽车故障分析方法
技术领域
本发明涉及神经网络领域,具体是一种基于生成式贝叶斯因果网络的汽车故障分析方法。
背景技术
随着电子信息技术的发展,在这样的背景之下,汽车故障诊断的自动化智能化也应运而生,方向也变得更加多元。如何充分利用现代化技术,更好的对汽车进行故障诊断成为新的发展方向。
贝叶斯因果网络是因果发现中最常用的因果表示,它根据马尔可夫毛毯属性,通过节点和边来表示各变量之间的因果关系及其联合概率分布。贝叶斯网络模型在表示和学习观察数据的因果关系方面有许多优点。该模型很灵活,可以自然地吸收先前的知识。它还具有从观测数据推导模型的能力,并且可以结合专业知识和观测数据来提高模型性能。最重要的是,它的结构和参数有明确的含义,允许它明确地表示因果关系。
发明内容
本发明的目的是提供一种基于生成式贝叶斯因果网络的汽车故障分析方法,包括以下步骤:
1)获取汽车故障数据,并对汽车故障数据集进行预处理。
所述汽车故障数据包括故障属性数据和运行数据。
所述故障属性包括传感器本身故障、线路故障、变速箱散热系统故障和电动机转速传感器故障。
所述运行数据包括变速箱输入转速、变速箱输出转速、变速箱油温度、标准负荷值、冷却液温度、发动机转速、车速和油门踏板位置。
对汽车故障数据进行预处理的步骤如下:
1.1)对汽车故障数据的特征类别进行编码。所述特征类别为故障属性和运行数据。
1.2)对汽车故障数据进行归一化处理,得到归一化后的数据集
Figure BDA0002855787800000011
即:
Figure BDA0002855787800000012
式中,xmax表示数据的最大值。xmin表示数据的最小值。x表示汽车故障数据。
2)利用Top-k方法对预处理后的汽车故障数据集X进行抽样,建立汽车故障代表性样本子集。
建立汽车故障代表性样本子集的步骤如下:
2.1)计算从汽车故障数据集X中找到代表性样本子集XS,即:
Figure BDA0002855787800000021
式中,R1(X,xi)为决策参数,用于衡量从汽车故障数据集X中找到k个相似样本的概率、样本间相似性的强度。
决策参数R1(X,xi)如下所示:
Figure BDA0002855787800000022
式中,TopKdist(xj,X,k)表示汽车故障数据集X中与xj最相似的k个样本。k为常数。R2(xi,xj)表示样本xj与样本xi之间的欧式距离。
欧式距离R2(xi,xj)如下所示:
Figure BDA0002855787800000023
式中,dist(xi,xj)表示样本xi与样本xj之间的相似性。
2.2)基于步骤2.1),以相似样本建立汽车故障代表性样本子集
Figure BDA0002855787800000024
M表示汽车属性数量。
3)利用非线性特征选择算法建立特征选择模型HSIC Lasso,并将汽车故障代表性样本子集特征映射到高维空间中,得到汽车故障代表性样本子集的特征向量集
Figure BDA0002855787800000025
其中
Figure BDA0002855787800000026
表示汽车故障代表性样本子集的第k个特征向量。
特征选择模型HSIC Lasso的目标函数和约束条件分别如下所示:
Figure BDA0002855787800000027
式中,α=[α1,...,αM]T是回归系数向量。αk为第k个特征的回归系数。其中||·||Frob表示Frobenius范数。Gram矩阵
Figure BDA0002855787800000028
和Gram矩阵
Figure BDA0002855787800000031
和Li,j=L(yi,yj)为Gram矩阵;K(x,x′)和L(y,y′)是内核函数;
Figure BDA0002855787800000032
为中心矩阵。In为n维单位矩阵。1n为全为1的n维向量。
4)构建生成式贝叶斯函数因果网络模型。
生成式贝叶斯函数因果网络模型如下所示:
Figure BDA0002855787800000033
式中,
Figure BDA0002855787800000034
表示因果有向无环图。f为连续函数。噪声随机向量ε=U[0,1]。
生成式贝叶斯因果网络模型定义特征向量集中任意向量满足下式:
Figure BDA0002855787800000035
式中,
Figure BDA0002855787800000036
表示因果有向无环图
Figure BDA0002855787800000037
中节点
Figure BDA0002855787800000038
的父子节点集合。
Figure BDA0002855787800000039
为连续函数。
5)将特征向量集
Figure BDA00028557878000000310
输入到生成式贝叶斯因果网络模型中,输出因果有向图。
输出因果有向图的步骤如下:
5.1)建立特征向量集
Figure BDA00028557878000000311
的连续函数集f=(f1,...,fM),令函数因果模型
Figure BDA00028557878000000312
相关的联合分布
Figure BDA00028557878000000313
满足下式:
Figure BDA00028557878000000314
5.2)构建生成式贝叶斯因果网络模型
Figure BDA00028557878000000315
将噪声随机向量ε=[ε1,...,εM]输入到生成式贝叶斯因果网络模型中,生成概率分布为
Figure BDA00028557878000000316
的特征向量集。噪声εi之间都是相互独立。
其中,更新的特征向量
Figure BDA00028557878000000317
如下所示:
Figure BDA00028557878000000318
式中,因果机制
Figure BDA00028557878000000319
因果机制
Figure BDA00028557878000000320
为一个一层隐藏层的回归神经网络,其具有nh个隐藏神经元。
Figure BDA00028557878000000321
为神经网络的参数,σ为激活函数。
5.3)估计特征向量
Figure BDA00028557878000000322
的联合分布
Figure BDA00028557878000000323
5.4)基于联合分布P与联合分布
Figure BDA00028557878000000324
输出因果有向图。
5.5)计算函数因果模型
Figure BDA0002855787800000041
相关的联合分布P与生成式贝叶斯因果网络模型
Figure BDA0002855787800000042
生成样本的联合分布
Figure BDA0002855787800000043
之间的距离S,即:
Figure BDA0002855787800000044
式中,
Figure BDA0002855787800000045
表示有向无环图
Figure BDA0002855787800000046
中的边数。λ是惩罚权值。高斯内核
Figure BDA0002855787800000047
5.6)判断距离S≤阈值Smin是否成立,若是,则输出当前因果有向图,否则,返回步骤5.1)。
生成式因果网络模型的激活函数设置为Relu激活函数。
生成式因果网络模型权重和偏移更新方法为Adam梯度下降算法。
生成式因果网络模型数据处理方法为批标准化。
6)因果有向图用于表征汽车故障分析结果,评估汽车故障因果关系的AUPR值、SHD值和SID值。
SID表示两个图之间等价的二元干预的数量。
AUPR值表示召回率Recall和精确率Precision组成的PR曲线与坐标轴围成的面积。
精确率Precision如下所示:
Figure BDA0002855787800000048
式中,TP表示将正类样本预测为正类。FN表示将正类样本预测为负类。FP表示将负类样本预测为正类。TN表示将负类样本预测为正类。
召回率Recall如下所示:
Figure BDA0002855787800000049
SHD值表示将一个图转换为另一个图而发生变化的边数,即:
SHD=AA+MA+WDA (13)
其中,AA表示添加的有向边。MA表示删除的有向边。WDA表示调整方向的有向边或无向边。
本发明的技术效果是毋庸置疑的,本发明提出一种直观、有效的汽车故障分析方法,建立更加快速、准确、方便的汽车故障因果分析方法。本发明是一种基于生成式贝叶斯因果网络的汽车故障分析方法,运用于汽车数据的因果发现;通过本方法建立因果模型,在可以有效发现汽车各方面数据的因果关系。由此可见,本发明设计原理可靠,与现有技术相比,具有突出的实质性特点和显著地进步,具有较高的实用性。
附图说明
图1为本发明一种基于生成式贝叶斯因果网络的汽车故障分析方法的整体流程结构图;
图2为变量集为
Figure BDA0002855787800000051
的生成式因果网络模型图。
具体实施方式
下面结合实施例对本发明作进一步说明,但不应该理解为本发明上述主题范围仅限于下述实施例。在不脱离本发明上述技术思想的情况下,根据本领域普通技术知识和惯用手段,做出各种替换和变更,均应包括在本发明的保护范围内。
实施例1:
参见图1至图2,一种基于生成式贝叶斯因果网络的汽车故障分析方法,包括以下步骤:
1)获取汽车故障数据,并对汽车故障数据集进行预处理。
所述汽车故障数据包括故障属性数据和运行数据。
所述故障属性包括传感器本身故障、线路故障、变速箱散热系统故障和电动机转速传感器故障。
所述运行数据包括变速箱输入转速、变速箱输出转速、变速箱油温度、标准负荷值、冷却液温度、发动机转速、车速和油门踏板位置。
对汽车故障数据进行预处理的步骤如下:
1.1)对汽车故障数据的特征类别进行编码。所述特征类别为故障属性和运行数据。
1.2)对汽车故障数据进行归一化处理,得到归一化后的数据集
Figure BDA0002855787800000052
即:
Figure BDA0002855787800000053
式中,xmax表示数据的最大值。xmin表示数据的最小值。x表示汽车故障数据。
2)利用Top-k方法对预处理后的汽车故障数据集X进行抽样,建立汽车故障代表性样本子集。Top-k方法是指在一堆数据里面找到前K大(或者前K小)的数作为样本。
建立汽车故障代表性样本子集的步骤如下:
2.1)计算从汽车故障数据集X中找到代表性样本子集XS,即:
Figure BDA0002855787800000061
式中,R1(X,xi)为决策参数,用于衡量从汽车故障数据集X中找到k个相似样本的概率、样本间相似性的强度。
决策参数R1(X,xi)如下所示:
Figure BDA0002855787800000062
式中,TopKdist(xj,X,k)表示汽车故障数据集X中与xj最相似的k个样本。k为常数。
R2(xi,xj)表示样本xj与样本xi之间的欧式距离。样本xj为汽车故障数据集X中的样本。
欧式距离R2(xi,xj)如下所示:
Figure BDA0002855787800000063
式中,dist(xi,xj)表示样本xi与样本xj之间的相似性。
2.2)基于步骤2.1),以相似样本建立汽车故障代表性样本子集
Figure BDA0002855787800000064
M表示汽车特征类别。
3)利用非线性特征选择算法建立特征选择模型HSIC Lasso,并将汽车故障代表性样本子集特征映射到高维空间中,得到汽车故障代表性样本子集的特征向量集
Figure BDA0002855787800000065
其中
Figure BDA0002855787800000066
表示汽车故障代表性样本子集的第k个特征向量。k=1,2,…M。
特征选择模型HSIC Lasso的目标函数和约束条件分别如下所示:
Figure BDA0002855787800000067
式中,α=[α1,...,αM]T是回归系数向量。αk为第k个特征的回归系数。其中||·||Frob表示Frobenius范数。
Figure BDA0002855787800000071
Figure BDA0002855787800000072
为Gram矩阵。
Figure BDA0002855787800000073
和Li,j=L(yi,yj)为Gram矩阵。K(x,x′)和L(y,y′)是内核函数。
Figure BDA0002855787800000074
为中心矩阵。In为n维单位矩阵。1n为全为1的n维向量。
4)构建生成式贝叶斯函数因果网络模型。
生成式贝叶斯函数因果网络模型如下所示:
Figure BDA0002855787800000075
式中,
Figure BDA0002855787800000076
表示因果有向无环图。f为连续函数。噪声随机向量ε=U[0,1]。
生成式贝叶斯因果网络模型定义特征向量集中任意向量满足下式:
Figure BDA0002855787800000077
式中,
Figure BDA0002855787800000078
表示因果有向无环图
Figure BDA0002855787800000079
中节点
Figure BDA00028557878000000710
的父子节点集合。
Figure BDA00028557878000000711
为连续函数。
5)将特征向量集
Figure BDA00028557878000000712
输入到生成式贝叶斯因果网络模型中,输出因果有向图。
输出因果有向图的步骤如下:
5.1)建立特征向量集
Figure BDA00028557878000000713
的连续函数集f=(f1,...,fM),令函数因果模型
Figure BDA00028557878000000714
相关的联合分布
Figure BDA00028557878000000715
满足下式:
Figure BDA00028557878000000716
5.2)构建生成式贝叶斯因果网络模型
Figure BDA00028557878000000717
将噪声随机向量ε=[ε1,...,εM]输入到生成式贝叶斯因果网络模型中,生成概率分布为
Figure BDA00028557878000000718
的特征向量集。噪声εi之间都是相互独立。上标^表示更新后的值。
其中,更新的特征向量
Figure BDA00028557878000000719
如下所示:
Figure BDA00028557878000000720
式中,因果机制
Figure BDA00028557878000000721
因果机制
Figure BDA00028557878000000722
为一个一层隐藏层的回归神经网络,其具有nh个隐藏神经元。
Figure BDA00028557878000000723
为神经网络的参数,σ为激活函数。
5.3)估计特征向量
Figure BDA0002855787800000081
的联合分布
Figure BDA0002855787800000082
5.4)基于联合分布P与联合分布
Figure BDA0002855787800000083
输出因果有向图。
5.5)计算函数因果模型
Figure BDA0002855787800000084
相关的联合分布P与生成式贝叶斯因果网络模型
Figure BDA0002855787800000085
生成样本的联合分布
Figure BDA0002855787800000086
之间的距离S,即:
Figure BDA0002855787800000087
式中,
Figure BDA0002855787800000088
表示有向无环图
Figure BDA0002855787800000089
中的边数。λ是惩罚权值。高斯内核
Figure BDA00028557878000000810
γ为系数。
5.6)判断距离S≤阈值Smin是否成立,若是,则输出当前因果有向图,否则,返回步骤5.1)。
生成式因果网络模型的激活函数设置为Relu激活函数。
生成式因果网络模型权重和偏移更新方法为Adam梯度下降算法。
生成式因果网络模型数据处理方法为批标准化。
6)计算因果有向图的评估指标,所述因果有向图用于表征汽车故障分析结果。
评估汽车故障因果关系的AUPR值、SHD值和SID值。
SID表示两个图之间等价的二元干预的数量。
AUPR值表示召回率Recall和精确率Precision组成的PR曲线与坐标轴围成的面积。
精确率Precision如下所示:
Figure BDA00028557878000000811
式中,TP表示将正类样本预测为正类。FN表示将正类样本预测为负类。FP表示将负类样本预测为正类。TN表示将负类样本预测为正类。
召回率Recall如下所示:
Figure BDA00028557878000000812
SHD值表示将一个图转换为另一个图而发生变化的边数,即:
SHD=AA+MA+WDA (13)
其中,AA表示添加的有向边。MA表示删除的有向边。WDA表示调整方向的有向边或无向边。
实施例2:
一种基于生成式贝叶斯因果网络,主要包括以下步骤:
1)获取汽车观测数据集
Figure BDA0002855787800000091
其中,每个样本Xi具有M个属性变量,进一步,对数据集进行预处理的主要步骤如下:
1.1)对汽车观测数据的类别特征进行整型编码。
1.2)对汽车观测数据进行归一化处理,得到归一化后的数据x',即:
Figure BDA0002855787800000092
式中,xmax表示数据的最大值。xmin表示数据的最小值。x表示汽车观测数据。
2)在主动学习中,通过选择最具代表性的样本来代表整个训练集来减少样本的数量。不确定性抽样是主动学习的一种方法,但它容易受到离群值的影响。我们采用一种基于KNN的采样方法来解决异常值的问题。主要步骤如下:
2.1)一个的汽车数据集X,我们可以使用
Figure BDA0002855787800000093
来对X进行代表性抽样。
Figure BDA0002855787800000094
TopKdist(xj,X,k)表示X中与xj最相似的k个样本,其中k为常数。R1(X,xi)可以衡量从集合X中找到k个最相似样本的概率和相似性的强度。
2.2)R2(xi,xj)由下面的公式计算
Figure BDA0002855787800000095
其中dist(xi,xj)表示样本xi与xj之间的相似性。
2.3)通过Top-k计算得到汽车样本子集
Figure BDA0002855787800000096
后面我们使用
Figure BDA0002855787800000101
代表汽车变量集合,具有M个汽车属性。
3)初始化汽车因果图,用因果图表示汽车调控网络,其中,一个汽车属性变量对应一个节点,将汽车因果网络初始化为空图。
4)采用HSICLasso特征选择模型,生成因果骨架,原理如下:
HSIC Lasso关键思想是以特征的方式应用非线性转换,而不是以样本的方式。更具体地说,我们用特征方式
Figure BDA0002855787800000102
来表示样本矩阵,其中
Figure BDA0002855787800000103
是所有样本子集的第k个特征向量。
HSIC Lasso优化问题为
Figure BDA0002855787800000104
α=[α1,...,αM]T是回归系数向量,αk为第k个特征的回归系数。其中||·||Frob表示Frobenius范数,简称F-范数。
Figure BDA0002855787800000105
Figure BDA0002855787800000106
都是Gram矩阵,
Figure BDA0002855787800000107
和Li,j=L(yi,yj)同样也是Gram矩阵。K(x,x′)和L(y,y′)是内核函数。
Figure BDA0002855787800000108
为中心矩阵,In为n维单位矩阵,1n为全为1的n维向量。我们对α使用了非负性约束的方式来选择有意义的特征。此外,在HSIC Lasso中由于我们使用输出的Gram矩阵L来选择的特征,我们可以自然地通过内核合并结构化输出。而且,即使训练数据集由输入x和输入之间的链接结构等关联信息L组成,我们也可以进行特征选择。式中的第一项表示我们用一种特征输入核矩阵
Figure BDA0002855787800000109
的线性组合回归输出核矩阵
Figure BDA00028557878000001010
最后,选出的变量作为候选节点加入到网络骨架中。
5)函数因果模型的定义如下所示:
函数因果模型
Figure BDA00028557878000001011
对变量集
Figure BDA00028557878000001012
定义了一组方程,如下所示:
Figure BDA00028557878000001013
其中,
Figure BDA00028557878000001014
表示
Figure BDA00028557878000001015
中节点
Figure BDA00028557878000001016
的父子节点集合,而且fi是一个连续函数
Figure BDA00028557878000001017
因此,函数因果模型由一个基于有向无环图
Figure BDA0002855787800000111
的潜在(因果)结构,函数fi(·)(i=1,...,M)以及ε=U[0,1]指定的。U(0,1)为均匀分布。
6)一组连续的汽车变量
Figure BDA0002855787800000112
存在f=(f1,...,fM)使
Figure BDA0002855787800000113
等于由
Figure BDA0002855787800000114
定义的生成模型,其中fi为连续函数。
Figure BDA0002855787800000115
6.1)构建生成式因果网络模型
Figure BDA0002855787800000116
将噪声随机向量ε=[ε1,...,εM]输入到网络中,生成概率分布为
Figure BDA0002855787800000117
的样本,噪声εi之间都是相互独立。
Figure BDA0002855787800000118
Figure BDA0002855787800000119
其中因果机制
Figure BDA00028557878000001110
为一个一层隐藏层的回归神经网络,其具有nh个隐藏神经元。
Figure BDA00028557878000001111
为神经网络的参数,而σ为激活函数。
6.2)汽车变量集
Figure BDA00028557878000001112
的联合分布
Figure BDA00028557878000001113
由因果网络模型
Figure BDA00028557878000001114
估计,模型优化是通过最小化函数因果模型
Figure BDA00028557878000001115
相关的联合分布P与
Figure BDA00028557878000001116
生成样本的联合分布
Figure BDA00028557878000001117
之间的距离S:
Figure BDA00028557878000001118
其中,
Figure BDA00028557878000001119
表示有向无环图
Figure BDA00028557878000001120
中的边数,而λ是惩罚权值。其中内核k通常取为高斯内核
Figure BDA00028557878000001121
生成式因果网络模型的激活函数设置为Relu激活函数;采用Adam梯度下降算法更新模型中的权重和偏移;利用批标准化进行数据处理。最终生成汽车故障的因果图,用于分析汽车故障数据的因果关系。
7)使用AUPR值、SHD值和SID值对汽车故障因果图进行评估:
AUPR(Area Under the Precision/Recall Curve)是PR曲线下的面积,PR即召回率和精确率组成的曲线图。
精确率Precision如下所示:
Figure BDA0002855787800000121
式中,TP为将正类样本预测为正类;FN为将正类样本预测为负类;FP为将负类样本预测为正类;TN为将负类样本预测为正类;
召回率Recall如下所示:
Figure BDA0002855787800000122
SHD(Structural Hamming Distance)是考虑两个部分有向无环图,计算有多少边不重合,即为将一个图转换为另一个图而发生变化的边数。
SHD=AA+MA+WDA (11)
其中,AA表示添加的有向边,MA表示删除的有向边,WDA表示调整方向的有向边或无向边。根据SHD的定义可以看出,其值越小表示与目标越接近。
SID(Structural Intervention Distance)估计了两个图之间等价的二元干预的数量。SID仅基于图形标准,并根据它们相应的因果推断语句,量化两个有向无环图之间的紧密程度。因此,它非常适合评估用于计算干预措施的图。
实施例3:
一种基于生成式贝叶斯因果网络的汽车故障分析方法,主要包括以下步骤:
1)获取汽车故障数据集,数据属性包括传感器本身故障,线路故障,变速箱散热系统故障和电动机转速传感器故障,同时采集变速箱输入转速,变速箱输出转速,变速箱油温度,标准负荷值,冷却液温度,发动机转速,车速,油门踏板位置等数据。对汽车数据集进行预处理与归一化;
2)采用Top-k方法抽取具有代表性的样本子集数据;
3)采用非线性特征选择算法建立特征选择模型HSIC Lasso,将特征映射到高维空间中,捕捉特征间的非线性依赖关系。输入汽车数据样本子集,通过模型训练,输出初始因果骨架。
4)构建生成式贝叶斯函数因果网络模型,如图2所示,将汽车故障数据输入模型进行训练。每个神经网络的隐藏神经元设置为20;激活函数设置为Relu激活函数;学习速率选择为0.01;采用Adam梯度下降算法更新模型中的权重和偏移;批处理大小设置为32。输出汽车属性的因果有向图,此时的有向图可能包含环。
5)不断优化模型,使得生成模型达到最好,最终输出汽车故障的因果有向无环图,用于分析汽车故障的原因。

Claims (9)

1.一种基于生成式贝叶斯因果网络的汽车故障分析方法,其特征在于,包括以下步骤:
1)获取所述汽车故障数据,并对汽车故障数据集进行预处理。
2)利用Top-k方法对预处理后的汽车故障数据集X进行抽样,建立汽车故障代表性样本子集;
3)利用非线性特征选择算法建立特征选择模型HSIC Lasso,并将汽车故障代表性样本子集特征映射到高维空间中,得到汽车故障代表性样本子集的特征向量集
Figure FDA0002855787790000011
其中
Figure FDA0002855787790000012
表示汽车故障代表性样本子集的第k个特征向量;
4)构建生成式贝叶斯函数因果网络模型;
5)将特征向量集
Figure FDA0002855787790000013
输入到生成式贝叶斯因果网络模型中,输出因果有向图;
6)计算函数因果模型与生成因果模型的样本距离S,若小于阈值Smin,则输出当前因果有向图,否则,更新生成式贝叶斯因果网络模型的权重和偏移,并返回步骤5);所述因果有向图用于表征汽车故障分析结果。
2.根据权利要求1所述的一种基于生成式贝叶斯因果网络的汽车故障分析方法,其特征在于:所述汽车故障数据包括故障属性数据和运行数据;
所述故障属性包括传感器本身故障、线路故障、变速箱散热系统故障和电动机转速传感器故障;
所述运行数据包括变速箱输入转速、变速箱输出转速、变速箱油温度、标准负荷值、冷却液温度、发动机转速、车速和油门踏板位置。
3.根据权利要求1所述的一种基于生成式贝叶斯因果网络的汽车故障分析方法,其特征在于,对汽车故障数据进行预处理的步骤如下:
1)对汽车故障数据的特征类别进行编码;所述特征类别为故障属性和运行数据;
2)对汽车故障数据进行归一化处理,得到归一化后的数据集
Figure FDA0002855787790000014
即:
Figure FDA0002855787790000015
式中,xmax表示数据的最大值;xmin表示数据的最小值;x表示汽车故障数据。
4.根据权利要求1所述的一种基于生成式贝叶斯因果网络的汽车故障分析方法,其特征在于,建立汽车故障代表性样本子集的步骤如下:
1)从汽车故障数据集X中找到代表性样本子集XS,即:
Figure FDA0002855787790000021
式中,R1(X,xi)为决策参数,用于衡量从汽车故障数据集X中找到k个相似样本的概率、样本间相似性的强度;
决策参数R1(X,xi)如下所示:
Figure FDA0002855787790000022
式中,TopKdist(xj,X,k)表示汽车故障数据集X中与xj最相似的k个样本;k为常数;R2(xi,xj)表示样本xj与样本xi之间的欧式距离;
欧式距离R2(xi,xj)如下所示:
Figure FDA0002855787790000023
式中,dist(xi,xj)表示样本xi与样本xj之间的相似性;
2)基于步骤1),以相似样本建立汽车故障代表性样本子集
Figure FDA0002855787790000024
M表示汽车所有特征数量。
5.根据权利要求1所述的一种基于生成式贝叶斯因果网络的汽车故障分析方法,其特征在于,特征选择模型HSIC Lasso的目标函数和约束条件分别如下所示:
Figure FDA0002855787790000025
式中,α=[α1,...,αM]T是回归系数向量;αk为第k个特征的回归系数。其中||·||Frob表示Frobenius范数;Gram矩阵
Figure FDA0002855787790000026
和Gram矩阵
Figure FDA0002855787790000027
和Li,j=L(yi,yj)为Gram矩阵;K(x,x′)和L(y,y′)是内核函数;
Figure FDA0002855787790000028
为中心矩阵;In为n维单位矩阵;1n为全为1的n维向量。
6.根据权利要求1所述的一种基于生成式贝叶斯因果网络的汽车故障分析方法,其特征在于,生成式贝叶斯函数因果网络模型
Figure FDA0002855787790000031
如下所示:
Figure FDA0002855787790000032
式中,
Figure FDA0002855787790000033
表示因果有向无环图;f为连续函数;噪声随机向量ε=U[0,1];
生成式贝叶斯因果网络模型定义特征向量集中任意向量满足下式:
Figure FDA0002855787790000034
式中,
Figure FDA0002855787790000035
表示因果有向无环图
Figure FDA0002855787790000036
中节点
Figure FDA0002855787790000037
的父子节点集合;
Figure FDA0002855787790000038
为连续函数。
7.根据权利要求1所述的一种基于生成式贝叶斯因果网络的汽车故障分析方法,其特征在于,输出因果有向图的步骤如下:
1)建立特征向量集
Figure FDA00028557877900000325
的连续函数集f=(f1,...,fM),令函数因果模型
Figure FDA0002855787790000039
相关的联合分布
Figure FDA00028557877900000310
满足下式:
Figure FDA00028557877900000311
2)构建生成式贝叶斯因果网络模型
Figure FDA00028557877900000312
将噪声随机向量ε=[ε1,...,εM]输入到生成式贝叶斯因果网络模型中,生成概率分布为
Figure FDA00028557877900000313
的特征向量集;噪声εi之间都是相互独立;
其中,更新的特征向量
Figure FDA00028557877900000314
如下所示:
Figure FDA00028557877900000315
式中,因果机制
Figure FDA00028557877900000316
因果机制
Figure FDA00028557877900000317
为一个一层隐藏层的回归神经网络,其具有nh个隐藏神经元;
Figure FDA00028557877900000318
为神经网络的参数,σ为激活函数;
3)估计特征向量
Figure FDA00028557877900000319
的联合分布
Figure FDA00028557877900000320
4)基于联合分布P与联合分布
Figure FDA00028557877900000321
输出因果有向图;
5)计算函数因果模型
Figure FDA00028557877900000322
相关的联合分布P与生成式贝叶斯因果网络模型
Figure FDA00028557877900000323
生成样本的联合分布
Figure FDA00028557877900000324
之间的距离S,即:
Figure FDA0002855787790000041
式中,
Figure FDA0002855787790000042
表示有向无环图
Figure FDA0002855787790000043
中的边数;λ是惩罚权值;高斯内核
Figure FDA0002855787790000044
6)判断距离S≤阈值Smin是否成立,若是,则输出当前因果有向图,否则,返回步骤1)。
8.根据权利要求7所述的一种基于生成式贝叶斯因果网络的汽车故障分析方法,其特征在于,生成式因果网络模型的激活函数设置为Relu激活函数;
生成式因果网络模型权重和偏移更新方法为Adam梯度下降算法;
生成式因果网络模型数据处理方法为批标准化。
9.根据权利要求1所述的一种基于生成式贝叶斯因果网络的汽车故障分析方法,其特征在于,评估汽车故障因果关系的AUPR值、SHD值和SID值;
SID表示两个图之间等价的二元干预的数量;
AUPR值表示召回率Recall和精确率Precision组成的PR曲线与坐标轴围成的面积;
精确率Precision如下所示:
Figure FDA0002855787790000045
式中,TP表示将正类样本预测为正类;FP表示将负类样本预测为正类;
召回率Recall如下所示:
Figure FDA0002855787790000046
式中,TN表示将负类样本预测为正类;
SHD值表示将一个图转换为另一个图而发生变化的边数,即:
SHD=AA+MA+WDA (13)
其中,AA表示添加的有向边;MA表示删除的有向边;WDA表示调整方向的有向边或无向边。
CN202011545177.1A 2020-12-24 2020-12-24 一种基于生成式贝叶斯因果网络的汽车故障分析方法 Pending CN112990467A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011545177.1A CN112990467A (zh) 2020-12-24 2020-12-24 一种基于生成式贝叶斯因果网络的汽车故障分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011545177.1A CN112990467A (zh) 2020-12-24 2020-12-24 一种基于生成式贝叶斯因果网络的汽车故障分析方法

Publications (1)

Publication Number Publication Date
CN112990467A true CN112990467A (zh) 2021-06-18

Family

ID=76345058

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011545177.1A Pending CN112990467A (zh) 2020-12-24 2020-12-24 一种基于生成式贝叶斯因果网络的汽车故障分析方法

Country Status (1)

Country Link
CN (1) CN112990467A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116226478A (zh) * 2022-12-27 2023-06-06 北京百度网讯科技有限公司 信息处理方法、模型训练方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116226478A (zh) * 2022-12-27 2023-06-06 北京百度网讯科技有限公司 信息处理方法、模型训练方法、装置、设备及存储介质
CN116226478B (zh) * 2022-12-27 2024-03-19 北京百度网讯科技有限公司 信息处理方法、模型训练方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN109947086B (zh) 基于对抗学习的机械故障迁移诊断方法及系统
Yang et al. Bearing remaining useful life prediction based on regression shapalet and graph neural network
US11803744B2 (en) Neural network learning apparatus for deep learning and method thereof
Mena et al. A survey on uncertainty estimation in deep learning classification systems from a bayesian perspective
Cheng et al. Deep transfer learning based on dynamic domain adaptation for remaining useful life prediction under different working conditions
Li et al. Multi-label spacecraft electrical signal classification method based on DBN and random forest
Ren et al. Correntropy-based robust extreme learning machine for classification
Caraka et al. Using hierarchical likelihood towards support vector machine: theory and its application
CN115096590A (zh) 一种基于iwoa-elm的滚动轴承故障诊断方法
CN112733692B (zh) 基于集成混合模型的故障预测方法、装置及相关设备
Amirkhani et al. A novel fuzzy inference approach: neuro-fuzzy cognitive map
Zhao et al. Quantifying classification uncertainty using regularized evidential neural networks
Zhang et al. A novel voting convergent difference neural network for diagnosing breast cancer
Abdulmajeed et al. Predict the required cost to develop Software Engineering projects by Using Machine Learning
Mohsin Investigating the use of an adaptive neuro-fuzzy inference system in software development effort estimation
Kronberger et al. Using robust generalized fuzzy modeling and enhanced symbolic regression to model tribological systems
Saufi et al. Machinery fault diagnosis based on a modified hybrid deep sparse autoencoder using a raw vibration time-series signal
CN112990467A (zh) 一种基于生成式贝叶斯因果网络的汽车故障分析方法
Wriggers et al. Intelligent support of engineering analysis using ontology and case-based reasoning
Kaushik et al. Radial basis function network using intuitionistic fuzzy C means for software cost estimation
CN116714437B (zh) 基于大数据的氢燃料电池汽车安全监控系统及监控方法
Kang et al. Randomized learning-based classification of sound quality using spectrogram image and time-series data: A practical perspective
Wu Fault diagnosis model based on Gaussian support vector classifier machine
Li et al. Improving fuzzy rule interpolation performance with information gain-guided antecedent weighting
CN112949524B (zh) 一种基于经验模态分解与多核学习的发动机故障检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination