CN115659178A - 基于深度强化学习和专家知识库的无人车故障诊断方法 - Google Patents

基于深度强化学习和专家知识库的无人车故障诊断方法 Download PDF

Info

Publication number
CN115659178A
CN115659178A CN202211340353.7A CN202211340353A CN115659178A CN 115659178 A CN115659178 A CN 115659178A CN 202211340353 A CN202211340353 A CN 202211340353A CN 115659178 A CN115659178 A CN 115659178A
Authority
CN
China
Prior art keywords
fault
reinforcement learning
data
deep reinforcement
unmanned vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211340353.7A
Other languages
English (en)
Inventor
冯炫
许荣鸽
兰巍
马文博
郭强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Zhiyin Technology Co ltd
Original Assignee
Shaanxi Zhiyin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi Zhiyin Technology Co ltd filed Critical Shaanxi Zhiyin Technology Co ltd
Priority to CN202211340353.7A priority Critical patent/CN115659178A/zh
Publication of CN115659178A publication Critical patent/CN115659178A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明属于无人驾驶应用技术领域,尤其涉及一种基于深度强化学习和专家知识库的无人车故障诊断方法。本发明通过深度强化学习和专家知识的深度融合,使二者在无人车故障诊断领域更好地发挥其优势。本发明技术方案中,基于专家知识库和完整的训练样本,通过深度强化学习算法进行模型训练,得到深度强化学习知识系统;根据深度强化学习知识系统和专家知识库,建立故障名称和诊断数据之间的解释库;基于深度强化学习知识系统实现对预处理后的无人车数据的诊断,并通过解释库输出故障名称,若该故障无解则更新知识系统和解释库,从而有效提升了故障的检测范围,减少了无人车因故障引起的安全事故的发生。

Description

基于深度强化学习和专家知识库的无人车故障诊断方法
技术领域
本发明属于无人驾驶应用技术领域,尤其涉及一种基于深度强化学习和专家知识库的无人车故障诊断方法。
背景技术
无人车是无人驾驶无人车、自动驾驶无人车或电脑驾驶无人车的简称,能够对道路和障碍物进行探测和识别,是一种通过电脑系统控制,替代人做出各种决策,以实现无人驾驶功能的智能化无人车。
随着智慧化矿山的建设,电机车无人驾驶正在被越来越多的矿山企业所认可。无人驾驶系统的实施,可以减少运输水平作业人员,包括井下电机车司机和溜井放矿工,在井上控制室一个人可以监管多台车的运行,改善劳动环境,增加设备运行时间,提高生产能力,达到本质安全水平,真正实现机械化换人、自动化减人的目标。
然而,无人车依赖于核心中控电脑实现对各种子系统的控制,并保证车辆的正常行驶,一旦某个子系统或设备发生故障,但未能及时的诊断和检测,就会产生极大的安全隐患。所以无人车的故障诊断与检测是极为重要的,及时定位故障类型并发出提醒,能有效避免严重事故的发生,提升无人车的行驶安全性。
发明内容
本发明针对上述的无人车所存在的技术问题,提出一种方法简单、操作方便且能够将深度强化学习和专家知识应用于无人车故障诊断领域,能根据专家经验和自主学习有效检测故障类型,降低了无人车因故障检测不及时而带来的安全隐患的基于深度强化学习和专家知识库的无人车故障诊断方法。
为了达到上述目的,本发明采用的技术方案为,本发明提供一种基于深度强化学习和专家知识库的无人车故障诊断方法,其特征在于,包括以下步骤:
S1:获取专家知识库和完整的训练样本,作为模型训练数据;
S2:对所述模型训练数据,通过深度强化学习算法进行训练学习,得到深度强化学习知识系统;
S3:根据所述深度强化学习知识系统和专家知识库,建立深度强化学习知识系统输出结果和故障类型之间的解释库;
S4:获取无人车的图像、传感器状态以及设备配置等数据,作为待处理数据;
S5:对所述待处理数据进行数据预处理后,作为待检测数据;
S6:将无人车的待检测数据输入深度强化学习知识系统,输出故障标志位和待解释的诊断结果;
S7:若故障标志位为0,表示无故障发生;
若故障标志位为1,表示有故障发生,则执行步骤S8;
S8:将待解释的诊断结果输入到解释库,若解释库中有解,则输出故障的具体信息,并保存故障信息到数据库,若无解,则执行步骤S9;
S9:根据深度强化学习知识系统的诊断,更新专家知识和解释库;其中,所述S2步骤中,深度强化学习算法进行模型训练的过程如下:
a、将训练样本随机分为70%的训练集和30%的测试集;
b、设置初始配置:输入训练集故障数据作为状态空间S,输入训练集故障类型作为动作空间A,折扣率γ,学习率η和贪心率ε,初始化经验池D,容量为N,初始化Q网络的参数θ,初始化目标Q网络的参数θ-,初始化状态s并设置训练轮数epi;
c、状态s下,采用贪心策略得到动作ai,Agent执行动作a,数据环境根据输出故障类型与真实故障对比得到奖励值r,并给出下一个数据状态s′,状态s′下,采用贪心策略得到动作ai′;
d、将et=(s,a,r,s′)存放在初始化经验池D中;
e、从D中随机选取k个经验样本(sj,aj,rj,sj′),j=1,2,...,k,k<N;
f、
Figure BDA0003914600990000031
对损失函数L(θ)执行梯度下降算法,更新神经网络参数θ,每C次更新目标网络参数θ-=θ;
g、循环除初始参数配置以外的上述步骤,直到Q(s,a·i)收敛或者达到最大的训练轮数epi,并使用测试集进行模型测试,得到深度强化学习知识系统。
作为优选,所述步骤S1中,专家知识库数据指:根据专家经验,在无人车行驶过程中,由何种设备或系统故障导致的何种驾驶故障的发生,并以此形成故障数据的输入、输出关系表,构建专家知识库;所述完整的训练样本是指无人车行驶过程中的正常和故障数据。
作为优选,步骤S3中,解释库的建立过程如下:首先,基于深度强化学习知识系统,以专家知识库中的各故障现象作为输入,输出结果值;然后,根据结果值和专家知识库中的故障类型,建立输出结果和故障类型之间的映射关系表,存储到数据库后完成解释库的建立。
作为优选,步骤S5中,数据的预处理过程如下:根据不同类型的输入数据,采用不同方法进行数据清洗工作,以随时间线性增长的数据为例,设传感器1输入为D={d1,d2,d3,...,dn};对D进行缺失值的识别和处理:在R语言里使用函数is.na判别,函数complete.cases识别样本数据是否完整,并采用替换法对缺失值进行替换;对D进行异常值的识别和处理:识别D中远离正常值范围的点,并采用平均值修正的方法处理并替换该异常值;数据清洗结束后将该组数据标记为无人车的待检测数据。
作为优选,步骤S6中,深度强化学习知识系统故障诊断的流程如下:输入故障数据s到深度强化学习知识系统模型;输出正常或故障的诊断结果r,并将故障标志位flag对应置0或1;当故障标志位flag为0时无故障,为1时输入到解释库,在映射表中查表匹配到故障类型并输出最终的诊断结果,将该结果保存到数据库后推送至用户处理。
作为优选,步骤S9中,更新专家知识库和解释库的流程如下:保存深度强化学习知识系统模型的输入参数组为Su,保存模型的诊断结果为Ru;更新专家知识库中的故障表项信息,添加故障征兆Su和对应的故障类型Ru,并将待更新位置1,等待用户确认并更新该条故障记录;更新解释库中的故障映射表信息,添加故障类型Ru和故障名称Nw,并将待更新位置1,等待用户确认并更新该条记录的故障名称Nw。用户完成专家知识库和解释库的更新确认,并进行故障名称设置后,下次该故障数据将会被诊断为对应的故障类型。
与现有技术相比,本发明的优点和积极效果在于,
本发明提出基于深度强化学习和专家知识库的无人车故障诊断方法,通过深度强化学习和专家知识的深度融合,使二者在无人车故障诊断领域更好地发挥其优势。本发明技术方案中,基于专家知识库和完整的训练样本,通过深度强化学习算法进行模型训练,得到深度强化学习知识系统;根据深度强化学习知识系统和专家知识库,建立故障名称和诊断数据之间的解释库;基于深度强化学习知识系统实现对预处理后的无人车数据的诊断,并通过解释库输出故障名称,若该故障无解则更新知识系统和解释库,从而有效提升了故障的检测范围,减少了无人车因故障引起的安全事故的发生。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的基于深度强化学习和专家知识库的无人车故障诊断方法的故障诊断方法流程图;
图2为本发明的基于深度强化学习和专家知识库的无人车故障诊断方法的深度强化学习模型训练流程图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和实施例对本发明做进一步说明。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用不同于在此描述的其他方式来实施,因此,本发明并不限于下面公开说明书的具体实施例的限制。
实施例1,如图1、图2所示,本实施例提供一种基于深度强化学习和专家知识库的无人车故障诊断方法
要想对故障进行判断,就要先知道有哪些故障,为此,在本实施例中,首先,获取专家知识库和完整的训练样本,作为模型训练数据。其中,根据专家经验,在无人车行驶过程中,由何种设备或系统故障导致的何种驾驶故障的发生,并以此形成故障数据的输入、输出关系表,作为深度强化学习进行模型训练的学习反馈目标;完整的训练样本主要指的是汽车行驶过程中的正常和故障数据,并对数据进行了简单标注。这样,就得到了模型训练的数据。
然后,即可对得到的模型训练数据通过深度强化学习算法进行训练学习,进而得到深度强化学习知识系统。具体的训练方法如下:
将训练样本随机分为70%的训练集和30%的测试集;
设置初始配置:输入训练集故障数据作为状态空间S,输入训练集故障类型作为动作空间A,折扣率γ,学习率η和贪心率ε,初始化经验池D,容量为N,初始化Q网络的参数θ,初始化目标Q网络的参数θ-,初始化状态s并设置训练轮数epi;
状态s下,采用贪心策略得到动作ai,Agent执行动作a,数据环境根据输出故障类型与真实故障对比得到奖励值r,并给出下一个数据状态s′,状态s′下,采用贪心策略得到动作ai′;
将et=(s,a,r,s′)存放在初始化经验池D中;
从D中随机选取k个经验样本(sj,aj,rj,sj′),j=1,2,...,k,k<N;
Figure BDA0003914600990000061
对损失函数L(θ)执行梯度下降算法,更新神经网络参数θ,每C次更新目标网络参数θ-=θ;
循环除初始参数配置以外的上述步骤,直到Q(s,a·i)收敛或者达到最大的训练轮数epi,并使用测试集进行模型测试,得到深度强化学习知识系统。
然后,根据所述深度强化学习知识系统和专家知识库,建立深度强化学习知识系统输出结果和故障类型之间的解释库。解释库的建立过程如下:
基于深度强化学习知识系统,以专家知识库中的各故障现象作为输入,输出结果值;根据结果值和专家知识库中的故障类型,建立输出结果和故障类型之间的映射关系表,存储到数据库后完成解释库的建立。
接着,获取无人车的图像、传感器状态以及设备配置等数据,作为待处理数据。然后,对所述待处理数据进行数据预处理后,作为待检测数据。
数据预处理的方法为:根据不同类型的输入数据,采用不同方法进行数据清洗工作,以随时间线性增长的数据为例,设传感器1输入为D={d1,d2,d3,...,dn};
对D进行缺失值的识别和处理:在R语言里使用函数is.na判别,函数complete.cases识别样本数据是否完整,并采用替换法对缺失值进行替换;
对D进行异常值的识别和处理:识别D中远离正常值范围的点,并采用平均值修正的方法处理并替换该异常值;
数据清洗结束后将该组数据标记为无人车的待检测数据。
将无人车的待检测数据输入深度强化学习知识系统,输出故障标志位和待解释的诊断结果,具体的说,深度强化学习知识系统故障诊断的流程如下:
输入故障数据s到深度强化学习知识系统模型;
输出正常或故障的诊断结果r,并将故障标志位flag对应置0或1;
当故障标志位flag为0时无故障,为1时输入到解释库,在映射表中查表匹配到故障类型并输出最终的诊断结果,将该结果保存到数据库后推送至用户处理。
故障标志位为0,表示无故障发生;
若故障标志位为1,表示有故障发生,则将待解释的诊断结果输入到解释库,若解释库中有解,则输出故障的具体信息,并保存故障信息到数据库,若无解,则根据深度强化学习知识系统的诊断,更新专家知识和解释库;更新专家知识库和解释库的流程如下:
保存深度强化学习知识系统模型的输入参数组为Su,保存模型的诊断结果为Ru
更新专家知识库中的故障表项信息,添加故障征兆Su和对应的故障类型Ru,并将待更新位置1,等待用户确认并更新该条故障记录;
更新解释库中的故障映射表信息,添加故障类型Ru和故障名称Nw,并将待更新位置1,等待用户确认并更新该条记录的故障名称Nw
用户完成专家知识库和解释库的更新确认,并进行故障名称设置后,下次该故障数据将会被诊断为对应的故障类型。
通过上述的设置,有效实现了故障模型的训练,进而对无人车的故障诊断提供安全、可靠的保障。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例应用于其它领域,但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。

Claims (6)

1.一种基于深度强化学习和专家知识库的无人车故障诊断方法,其特征在于,包括以下步骤:
S1:获取专家知识库和完整的训练样本,作为模型训练数据;
S2:对所述模型训练数据,通过深度强化学习算法进行训练学习,得到深度强化学习知识系统;
S3:根据所述深度强化学习知识系统和专家知识库,建立深度强化学习知识系统输出结果和故障类型之间的解释库;
S4:获取无人车的图像、传感器状态以及设备配置等数据,作为待处理数据;
S5:对所述待处理数据进行数据预处理后,作为待检测数据;
S6:将无人车的待检测数据输入深度强化学习知识系统,输出故障标志位和待解释的诊断结果;
S7:若故障标志位为0,表示无故障发生;
若故障标志位为1,表示有故障发生,则执行步骤S8;
S8:将待解释的诊断结果输入到解释库,若解释库中有解,则输出故障的具体信息,并保存故障信息到数据库,若无解,则执行步骤S9;
S9:根据深度强化学习知识系统的诊断,更新专家知识和解释库;其中,
所述S2步骤中,深度强化学习算法进行模型训练的过程如下:
a、将训练样本随机分为70%的训练集和30%的测试集;
b、设置初始配置:输入训练集故障数据作为状态空间S,输入训练集故障类型作为动作空间A,折扣率γ,学习率η和贪心率ε,初始化经验池D,
容量为N,初始化Q网络的参数θ,初始化目标Q网络的参数θ-,初始化状态s并设置训练轮数epi;
c、状态s下,采用贪心策略得到动作ai,Agent执行动作a,数据环境根据输出故障类型与真实故障对比得到奖励值r,并给出下一个数据状态s′,状
态s′下,采用贪心策略得到动作a′i
d、将et=(s,a,r,s′)存放在初始化经验池D中;
e、从D中随机选取k个经验样本(sj,aj,rj,sj′),j=1,2,...,k,k<N;
f、
Figure FDA0003914600980000021
对损失函数L(θ)执行梯度下降算法,更新神经网络参数θ,每C次更新目标网络参数θ-=θ;
g、循环除初始参数配置以外的上述步骤,直到Q(s,a·i)收敛或者达到最大的训练轮数epi,并使用测试集进行模型测试,得到深度强化学习知识系统。
2.根据权利要求1所述的基于深度强化学习和专家知识库的无人车故障诊断方法,其特征在于,所述步骤S1中,专家知识库数据指:根据专家经验,在无人车行驶过程中,由何种设备或系统故障导致的何种驾驶故障的发生,并以此形成故障数据的输入、输出关系表,构建专家知识库;所述完整的训练样本是指无人车行驶过程中的正常和故障数据。
3.根据权利要求2所述的基于深度强化学习和专家知识库的无人车故障诊断方法,其特征在于,步骤S3中,解释库的建立过程如下:首先,基于深度强化学习知识系统,以专家知识库中的各故障现象作为输入,输出结果值;然后,根据结果值和专家知识库中的故障类型,建立输出结果和故障类型之间的映射关系表,存储到数据库后完成解释库的建立。
4.根据权利要求3所述的基于深度强化学习和专家知识库的无人车故障诊断方法,其特征在于,步骤S5中,数据的预处理过程如下:根据不同类型的输入数据,采用不同方法进行数据清洗工作,以随时间线性增长的数据为例,设传感器1输入为D={d1,d2,d3,...,dn};对D进行缺失值的识别和处理:在R语言里使用函数is.na判别,函数complete.cases识别样本数据是否完整,并采用替换法对缺失值进行替换;对D进行异常值的识别和处理:识别D中远离正常值范围的点,并采用平均值修正的方法处理并替换该异常值;数据清洗结束后将该组数据标记为无人车的待检测数据。
5.根据权利要求4所述的基于深度强化学习和专家知识库的无人车故障诊断方法,其特征在于,步骤S6中,深度强化学习知识系统故障诊断的流程如下:输入故障数据s到深度强化学习知识系统模型;输出正常或故障的诊断结果r,并将故障标志位flag对应置0或1;当故障标志位flag为0时无故障,为1时输入到解释库,在映射表中查表匹配到故障类型并输出最终的诊断结果,将该结果保存到数据库后推送至用户处理。
6.根据权利要求5所述的基于深度强化学习和专家知识库的无人车故障诊断方法,其特征在于,步骤S9中,更新专家知识库和解释库的流程如下:保存深度强化学习知识系统模型的输入参数组为Su,保存模型的诊断结果为Ru;更新专家知识库中的故障表项信息,添加故障征兆Su和对应的故障类型Ru,并将待更新位置1,等待用户确认并更新该条故障记录;更新解释库中的故障映射表信息,添加故障类型Ru和故障名称Nw,并将待更新位置1,等待用户确认并更新该条记录的故障名称Nw。用户完成专家知识库和解释库的更新确认,并进行故障名称设置后,下次该故障数据将会被诊断为对应的故障类型。
CN202211340353.7A 2022-10-28 2022-10-28 基于深度强化学习和专家知识库的无人车故障诊断方法 Pending CN115659178A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211340353.7A CN115659178A (zh) 2022-10-28 2022-10-28 基于深度强化学习和专家知识库的无人车故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211340353.7A CN115659178A (zh) 2022-10-28 2022-10-28 基于深度强化学习和专家知识库的无人车故障诊断方法

Publications (1)

Publication Number Publication Date
CN115659178A true CN115659178A (zh) 2023-01-31

Family

ID=84993163

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211340353.7A Pending CN115659178A (zh) 2022-10-28 2022-10-28 基于深度强化学习和专家知识库的无人车故障诊断方法

Country Status (1)

Country Link
CN (1) CN115659178A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117389372A (zh) * 2023-12-12 2024-01-12 南通至正电子有限公司 一种稳压控制方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117389372A (zh) * 2023-12-12 2024-01-12 南通至正电子有限公司 一种稳压控制方法及系统
CN117389372B (zh) * 2023-12-12 2024-03-01 南通至正电子有限公司 一种稳压控制方法及系统

Similar Documents

Publication Publication Date Title
CN108773373B (zh) 用于操作自动驾驶车辆的方法和装置
US7865278B2 (en) Diagnostic test sequence optimization method and apparatus
US8996235B2 (en) Repair assist system for vehicle servicing
CN101986124B (zh) 对先占症状的支持
US7643916B2 (en) Vehicle state tracking method and apparatus for diagnostic testing
JP6890527B2 (ja) 動作に関する予測推論のモデルを求めるシステム及び方法、およびこれらのための非一時的コンピューター可読記憶媒体
WO2021023097A1 (zh) 一种汽车维修方法、装置及其系统
DE102015214739A1 (de) Bestimmung einer Fehlerursache bei einem Fahrzeug
CN115659178A (zh) 基于深度强化学习和专家知识库的无人车故障诊断方法
JP2009265104A (ja) 診断データマイニング
CN116610092A (zh) 用于车辆分析的方法和系统
CN106331177A (zh) 一种远程智能终端自动烧写vin码的方法及系统
CN111284426A (zh) 车辆故障根本原因诊断
US20200005084A1 (en) Training method of, and inspection system based on, iterative deep learning system
CN109345512A (zh) 汽车图像的处理方法、装置及可读存储介质
US11714403B2 (en) Method for learning and detecting abnormal part of device through artificial intelligence
DE102018209773A1 (de) Verfahren zur rechnergestützten Bestimmung einer Fehlerdiagnose eines Fahrzeugs
US20140188433A1 (en) Method and diagnostic system for supporting the controlled fault detection in technical systems
US11551488B2 (en) Adaptive fault diagnostic system for motor vehicles
EP4191489A1 (en) Maintenance control system and method
CN111415326A (zh) 一种用于铁路接触网螺栓异常状态的检测方法及系统
DE102015214987B4 (de) Bestimmung eines defekten Bauteils eines Fahrzeugs
KR102437701B1 (ko) 엘리베이터 상태의 진단 방법
DE102020128497A1 (de) Computerimplementiertes Verfahren und System zur dialogunterstützten Ferndiagnose eines Defekts an einem technischen Bauteil und/oder System eines Fahrzeugs und Trainingsverfahren
DE102008051017A1 (de) Verfahren zur Steigerung der Effizienz von Fahrzeugen bzw. Fahrzeugsystemen mit und ohne Waffensysteme

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination