CN116028868B - 设备故障分类方法、装置、电子设备及可读存储介质 - Google Patents

设备故障分类方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN116028868B
CN116028868B CN202310114787.3A CN202310114787A CN116028868B CN 116028868 B CN116028868 B CN 116028868B CN 202310114787 A CN202310114787 A CN 202310114787A CN 116028868 B CN116028868 B CN 116028868B
Authority
CN
China
Prior art keywords
text
equipment
target
fault
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310114787.3A
Other languages
English (en)
Other versions
CN116028868A (zh
Inventor
冯建设
丁艺
朱枫
谢旻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xinrun Fulian Digital Technology Co Ltd
Original Assignee
Shenzhen Xinrun Fulian Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xinrun Fulian Digital Technology Co Ltd filed Critical Shenzhen Xinrun Fulian Digital Technology Co Ltd
Priority to CN202310114787.3A priority Critical patent/CN116028868B/zh
Publication of CN116028868A publication Critical patent/CN116028868A/zh
Application granted granted Critical
Publication of CN116028868B publication Critical patent/CN116028868B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了设备故障分类方法、装置、电子设备及可读存储介质,应用于大数据技术领域,所述设备故障分类方法包括:获取目标设备对应的维修日志文本数据,提取所述维修日志文本数据的文本关键词;依据所述文本关键词,确定所述维修日志文本数据对应的文本信息语义特征;依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类,得到故障分类结果。本申请解决了无法兼顾设备故障分类的分类准确性和分类效率的技术问题。

Description

设备故障分类方法、装置、电子设备及可读存储介质
技术领域
本申请涉及大数据技术领域,尤其涉及一种设备故障分类方法、装置、电子设备及可读存储介质。
背景技术
随着科技的高速发展,目前,通过深度学习模型提取设备的维修日志的语义信息以进行分类,需要人工对维修日志进行标注得到监督信息,将监督信息与语义信息结合进行模型的训练,从而导致设备故障分类的分类效率低,而直接通过深度学习模型提取维修日志的特征向量,对特征向量进行聚类分类时,容易出现由于维修日志中特征之间的相关性较高,出现设备故障分类的分类准确性低的情况,从而导致无法兼顾设备故障分类的分类准确性和分类效率。
发明内容
本申请的主要目的在于提供一种设备故障分类方法、装置、电子设备及可读存储介质,旨在解决现有技术中无法兼顾设备故障分类的分类准确性和分类效率的技术问题。
为实现上述目的,本申请提供一种设备故障分类方法,应用于设备故障分类设备,所述设备故障分类方法包括:
获取目标设备对应的维修日志文本数据,提取所述维修日志文本数据的文本关键词;
依据所述文本关键词,确定所述维修日志文本数据对应的文本信息语义特征;
依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类,得到故障分类结果。
为实现上述目的,本申请还提供一种设备故障分类装置,所述设备故障分类装置应用于设备故障分类设备,所述设备故障分类装置包括:
获取模块,用于获取目标设备对应的维修日志文本数据,提取所述维修日志文本数据的文本关键词;
确定模块,用于依据所述文本关键词,确定所述维修日志文本数据对应的文本信息语义特征;
分类模块,用于依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类,得到故障分类结果。
本申请还提供一种电子设备,所述电子设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述设备故障分类方法的程序,所述设备故障分类方法的程序被处理器执行时可实现如上述的设备故障分类方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有实现设备故障分类方法的程序,所述设备故障分类方法的程序被处理器执行时实现如上述的设备故障分类方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的设备故障分类方法的步骤。
本申请提供了一种设备故障分类方法、装置、电子设备及可读存储介质,相比于通过深度学习模型提取设备的维修日志的语义信息以进行分类,本申请通过获取目标设备对应的维修日志文本数据,提取所述维修日志文本数据的文本关键词;依据所述文本关键词,确定所述维修日志文本数据对应的文本信息语义特征;依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类,得到故障分类结果,实现了提取维修日志文本数据的语义信息特征,通过确定维修日志文本数据的语义信息特征和关键词的语义信息特征之间的相似度,对目标设备的故障类型进行分类,避免了当采用深度学习模型提取设备的维修日志的语义信息以进行分类时,需要人工对维修日志进行标注得到监督信息,将监督信息与语义信息结合进行模型的训练,从而导致设备故障分类的分类效率低的情况,或者,直接通过深度学习模型提取维修日志的特征向量,对特征向量进行聚类分类时,容易出现由于维修日志中特征之间的相关性较高,出现设备故障分类的分类准确性低的情况的技术缺陷,从而兼顾了设备故障分类的分类准确性和分类效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请设备故障分类方法第一实施例的流程示意图;
图2为本申请设备故障分类方法第二实施例的流程示意图;
图3为本申请实施例中设备故障分类方法涉及的硬件运行环境的设备结构示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本申请保护的范围。
实施例一
本申请实施例提供一种设备故障分类方法,在本申请设备故障分类方法的第一实施例中,参照图1,所述设备故障分类方法包括:
步骤S10,获取目标设备对应的维修日志文本数据,提取所述维修日志文本数据的文本关键词;
步骤S20,依据所述文本关键词,确定所述维修日志文本数据对应的文本信息语义特征;
在本实施例中,需要说明的是,所述维修日志文本数据包括所述目标设备的设备故障类别和设备维修记录。所述文本信息语义特征由维修日志文本数据中各词汇对应的词向量的位置所表征。所述文本关键词为所述维修日志文本数据中的词汇。
步骤S30,依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类,得到故障分类结果。
在本实施例中,需要说明的是,所述预设设备故障类别为预设的目标设备对应的设备故障类型。
其中,在步骤S10中,所述依据所述文本关键词,确定所述维修日志文本数据对应的文本信息语义特征的步骤包括:
步骤S11,依据预设前缀词库和所述维修日志文本数据,确定文本切分方式;
步骤S12,依据所述文本切分方式对应的切分路径,构建所述维修日志文本数据的有向无环图;
步骤S13,在所述有向无环图中选取目标切分路径,依据所述目标切分路径,确定所述维修日志文本数据的文本关键词。
在本实施例中,需要说明的是,所述预设前缀词库为预设的对于维修日志文本数据的各前缀词的集合,所述预设前缀词库依据统计词库中的词汇以及所述词汇对应的词频,以及所述词汇对应的词性构建得到。
示例性地,步骤S11至步骤S13包括:依据预设前缀词库和所述维修日志文本数据,确定文本切分方式;依据各所述切分方式,对所述维修日志文本数据进行切分,得到所述维修日志文本数据的切分路径;依据各所述切分路径,构建所述维修日志文本数据的有向无环图;在所述有向无环图的各所述切分路径中选取最大概率路径,得到目标切分路径,依据目标切分路径,确定所述维修日志文本数据的文本关键词,过滤所述文本关键词中的不常用词和/或停用词,得到所述维修日志文本数据的文本关键词。
所述有向无环图的各所述切分路径中最大概率路径的确定可以为:
Figure SMS_1
其中,
Figure SMS_2
为切分路径/>
Figure SMS_3
的切分方案/>
Figure SMS_4
对应的概率,/>
Figure SMS_5
为所述最大概率路径。
通过对维修日志文本数据进行文本关键词的提取,依据概率最大的切分路径确定维修日志文本数据的关键词,降低了文本信息语义特征确定的处理量,从而提高了设备故障分类的分类效率。
其中,在步骤S20中,所述依据所述文本关键词,确定所述维修日志文本数据对应的文本信息语义特征的步骤包括:
步骤S21,获取各所述文本关键词之间的相关系数,判断所述相关系数中是否存在目标相关系数是否大于或等于预设相关系数;
步骤S22,若是,则通过奇异值分解提取所述文本关键词的特征,得到所述文本信息语义特征;
步骤S23,若否,则通过特征提取层提取所述文本关键词对应的文本信息语义特征。
在本实施例中,需要说明的是,所述预设相关系数为预先设置的判定维修日志文本数据的相关性较强的文本关键词之间的相关系数临界值。
示例性地,步骤S21至步骤S23包括:通过皮尔逊积相关系数公式,确定各所述文本关键词之间的相关系数,判断所述相关系数中是否存在目标相关系数是否大于或等于预设相关系数;若所述相关系数中存在所述目标相关系数大于或等于所述预设相关系数,则通过奇异值分解提取所述文本关键词的特征,得到所述文本信息语义特征;若所述相关系数中不存在所述目标相关系数大于或等于所述预设相关系数,则通过特征提取层提取所述文本关键词对应的文本信息语义特征。
通过文本关键词之间的相关系数,对维修日志的相关性进行判断,在相关性较强时,通过奇异值分解法对所述文本关键词进行特征提取,由于奇异值分解法的计算量级较低,且主要分析特征间的线性关系,从而提高了语义信息提取的特征度,进而提高了设备故障分类的分类效率,而在相关性较弱时,通过特征提取层提取文本信息语义特征,不仅可以分析特征间的非线性关系,还可以保证处理数据量较大的文本关键词时不出现较多的特征丢失的情况,在文本关键词中挖掘更深层次的特征信息,从而提高了语义信息提取的特征度,进而提高了设备故障分类的分类准确度,综上兼顾了设备故障分类的分类效率和分类准确度。
所述通过奇异值分解提取所述文本关键词的特征,得到所述文本信息语义特征具体可以为:获取所述文本关键词以及各所述文本关键词出现的频率,依据所述文本关键词和所述文本关键词对应的频率,构建所述维修日志文本数据对应的维修日志文本数据矩阵;对所述维修日志文本数据矩阵进行奇异值分解,得到左奇异值矩阵、右奇异值矩阵和对角矩阵,通过将各所述文本关键词映射至所述左奇异值矩阵与所述对角矩阵点乘的第一空间,得到所述文本关键词对应的文本信息语义特征;将所述文本关键词映射至所述右奇异值矩阵与所述对角矩阵点乘的第二空间,得到所述维修日志文本数据对应的日志信息语义特征。
所述对所述维修日志文本数据矩阵进行奇异值分解具体可以为:
Figure SMS_6
其中,
Figure SMS_9
为所述维修日志文本数据矩阵,/>
Figure SMS_10
为所述左奇异矩阵,由/>
Figure SMS_13
个左奇异向量/>
Figure SMS_8
组成,/>
Figure SMS_11
为所述右奇异矩阵,由/>
Figure SMS_12
个右奇异向量/>
Figure SMS_14
组成,/>
Figure SMS_7
为所述对角矩阵。
在所述通过奇异值分解提取所述文本关键词的特征,得到所述文本信息语义特征的步骤之后,还包括:
当检测到更新文本关键词时,将所述更新文本关键词映射至所述第一空间,得到所述更新文本关键词对应的更新文本信息语义特征。
所述将所述更新文本关键词映射至所述第一空间和所述第二空间具体可以为:
Figure SMS_15
其中,
Figure SMS_16
为所述更新文本关键词,/>
Figure SMS_17
为所述左奇异矩阵,/>
Figure SMS_18
为所述对角矩阵,/>
Figure SMS_19
为所述更新文本信息语义特征。
当检测到更新数据时,直接将更新数据映射至已计算的第一空间中,从而提高了语义信息特征提取的速度。
其中,在步骤S23中,所述通过特征提取层提取所述文本关键词对应的文本信息语义特征的步骤包括:
步骤A10,通过热编码将所述文本关键词转化为文本词向量;
步骤A20,将所述文本词向量输入所述特征提取层,得到所述文本关键词对应的文本信息语义特征。
其中,在步骤A20之前,在所述将所述文本词向量输入所述特征提取层,得到所述文本关键词对应的文本信息语义特征的步骤之前,还包括:
步骤B10,获取待训练特征提取层、训练样本词向量以及各所述训练样本词向量对应的真实文本位置信息;
步骤B20,通过归一化指数函数预测各所述训练样本词向量在各预设位置出现的预测概率;
步骤B30,依据所述预测概率与所述真实文本位置信息,对所述待训练特征提取层进行迭代训练优化,得到所述特征提取层。
示例性地,步骤B10至步骤B30包括:获取待训练特征提取层、训练样本词向量以及各所述训练样本词向量对应的真实文本位置信息,依据所述待训练特征提取层以及所述训练样本词向量,通过归一化指数函数预测各所述训练样本词向量在各预设位置出现的预测概率;依据各所述训练样本词向量在所述真实文本位置信息的预测概率,构建所述特征提取层的损失函数;判断模型损失是否收敛,若所述模型损失收敛,则将所述待训练特征提取层作为所述特征提取层,若所述函数损失未收敛,则基于所述函数损失计算的梯度,通过预设更新方法更新所述待训练特征提取层,其中,所述预设更新方法包括梯度下降法和梯度上升法等。
所述预测各所述训练样本词向量在各预设位置出现的概率的过程具体可以为:
Figure SMS_20
其中,
Figure SMS_22
为位置/>
Figure SMS_24
预测出现/>
Figure SMS_29
词汇,/>
Figure SMS_23
为位置/>
Figure SMS_25
实际出现的词汇,
Figure SMS_27
为输入词,/>
Figure SMS_30
为预测位置/>
Figure SMS_21
的单词时U向量中的第/>
Figure SMS_26
个值,/>
Figure SMS_28
为所述总词汇量。
所述构建所述待训练特征提取层的损失函数具体可以为:
Figure SMS_31
其中,
Figure SMS_32
为所述损失函数,/>
Figure SMS_33
为预测位置/>
Figure SMS_34
的单词时U向量中的第/>
Figure SMS_35
个值,
Figure SMS_36
为语义窗口的大小,/>
Figure SMS_37
为所述纵词汇量。
本申请实施例提供了一种设备故障分类方法,相比于通过深度学习模型提取设备的维修日志的语义信息以进行分类,本申请实施例通过获取目标设备对应的维修日志文本数据,提取所述维修日志文本数据的文本关键词;依据所述文本关键词,确定所述维修日志文本数据对应的文本信息语义特征;依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类,得到故障分类结果,实现了提取维修日志文本数据的语义信息特征,通过确定维修日志文本数据的语义信息特征和关键词的语义信息特征之间的相似度,对目标设备的故障类型进行分类,避免了当采用深度学习模型提取设备的维修日志的语义信息以进行分类时,需要人工对维修日志进行标注得到监督信息,将监督信息与语义信息结合进行模型的训练,从而导致设备故障分类的分类效率低的情况,或者,直接通过深度学习模型提取维修日志的特征向量,对特征向量进行聚类分类时,容易出现由于维修日志中特征之间的相关性较高,出现设备故障分类的分类准确性低的情况的技术缺陷,从而兼顾了设备故障分类的分类准确性和分类效率。
实施例二
进一步地,参照图2,基于本申请第一实施例,在本申请另一实施例中,与上述实施例一相同或相似的内容,可以参考上文介绍,后续不再赘述。在此基础上,其中,在步骤S30中,在所述依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类的步骤之前,还包括:
步骤C10,获取所述维修日志文本数据中各所述预设设备故障类别对应的分类关键词数据;
示例性地,步骤C10包括:在云服务器中查询所述维修日志文本数据中各所述预设设备故障类别对应的分类关键词数据。
步骤C20,获取所述维修日志文本数据对应的历史文本数据,在所述历史文本数据中提取各所述预设设备故障类别对应的历史关键词数据;
在本实施例中,需要说明的是,所述历史文本数据为与所述维修日志文本数据中已分类的文本数据。
步骤C30,依据各所述预设设备故障类别,将所述分类关键词数据与所述历史关键词数据整合得到所述类别信息语义特征。
示例性地,步骤C30包括:依据各所述预设设备故障类别,将所述分类关键词数据与所述历史关键词数据拼接得到所述类别信息语义特征。
其中,在步骤S30中,所述依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类,得到故障分类结果的步骤包括:
步骤S31,获取所述文本信息语义特征与各所述类别信息语义特征之间的相似度;
步骤S32,在各所述相似度中选取目标相似度,将所述目标相似度对应的目标设备故障类别作为所述目标设备的故障类别,得到故障分类结果。
其中,所述获取所述文本信息语义特征与各所述类别信息语义特征之间的相似度的方法包括余弦相似度确定法和最大均值差异确定法,所述获取所述文本信息语义特征与各所述类别信息语义特征之间的相似度的步骤包括:当所述相关系数中存在所述目标相关系数大于或等于所述预设相关系数时,通过所述余弦相似度确定法,确定所述文本信息语义特征与各所述类别信息语义特征之间的相似度;当所述相关系数中不存在所述目标相关系数大于或等于所述预设相关系数时,通过所述最大均值差异确定法,确定所述文本信息语义特征与各所述类别信息语义特征之间的相似度。
通过各文本关键词之间的相关系数,对特征之间的相关性进行判断,在相关性较强时,通过所述余弦相似度确定法,确定所述文本信息语义特征与各所述类别信息语义特征之间的相似度,主要对于线性相关的数据之间的相似度的确定准确率较高,而对于非线性相关的数据如仍采用余弦相似度确定法,容易出现相似度的确定准确率低的情况,因此,对于相关性较弱的维修日志文本数据,通过所述最大均值差异确定法,确定所述文本信息语义特征与各所述类别信息语义特征之间的相似度,从而提高了文本信息语义特征与各所述类别信息语义特征之间的相似度的确定准确率,进而提高了设备故障分类的分类准确度。
所述通过所述余弦相似度确定法,确定所述文本信息语义特征与各所述类别信息语义特征之间的相似度具体可以为:
Figure SMS_38
其中,
Figure SMS_39
为所述相似度,/>
Figure SMS_40
为所述文本信息语义特征,/>
Figure SMS_41
为所述类别信息语义特征。
所述通过所述最大均值差异确定法,确定所述文本信息语义特征与各所述类别信息语义特征之间的相似度具体可以为:
Figure SMS_42
其中,
Figure SMS_43
为所述相似度,/>
Figure SMS_44
为所述文本信息语义特征的径向高斯核函数,/>
Figure SMS_45
为所述类别信息语义特征的径向高斯核函数,/>
Figure SMS_46
为所述文本信息语义特征以及所述类别信息语义特征的空间维度。
判断各所述相似度中是否存在目标相似度大于或等于预设相似度阈值,若各所述相似度中存在目标相似度大于或等于预设相似度阈值,则将所述目标相似度对应的设备故障类别作为所述目标设备的故障类别;若各所述相似度中不存在目标相似度大于或等于预设相似度阈值,则获取所述文本信息语义特征中的词向量对应的词汇数据,并将所述词汇数据添加至所述类别信息语义特征,其中,所述预设相似度阈值为预设的判定文本信息语义特征与类别信息语义特征相似的相似度临界值。
本申请实施例提供了一种设备故障分类方法,相比于通过深度学习模型提取设备的维修日志的语义信息以进行分类,本申请实施例通过获取目标设备对应的维修日志文本数据,提取所述维修日志文本数据的文本关键词;依据所述文本关键词,确定所述维修日志文本数据对应的文本信息语义特征;依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类,得到故障分类结果,实现了提取维修日志文本数据的语义信息特征,通过确定维修日志文本数据的语义信息特征和关键词的语义信息特征之间的相似度,对目标设备的故障类型进行分类,避免了当采用深度学习模型提取设备的维修日志的语义信息以进行分类时,需要人工对维修日志进行标注得到监督信息,将监督信息与语义信息结合进行模型的训练,从而导致设备故障分类的分类效率低的情况,或者,直接通过深度学习模型提取维修日志的特征向量,对特征向量进行聚类分类时,容易出现由于维修日志中特征之间的相关性较高,出现设备故障分类的分类准确性低的情况的技术缺陷,从而兼顾了设备故障分类的分类准确性和分类效率。
实施例三
本申请实施例还提供一种设备故障分类装置,所述设备故障分类装置应用于设备故障分类设备,所述设备故障分类装置包括:
获取模块,用于获取目标设备对应的维修日志文本数据,提取所述维修日志文本数据的文本关键词;
确定模块,用于依据所述文本关键词,确定所述维修日志文本数据对应的文本信息语义特征;
分类模块,用于依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类,得到故障分类结果。
可选地,所述获取模块还用于:
依据预设前缀词库和所述维修日志文本数据,确定文本切分方式;
依据所述文本切分方式对应的切分路径,构建所述维修日志文本数据的有向无环图;
在所述有向无环图中选取目标切分路径,依据所述目标切分路径,确定所述维修日志文本数据的文本关键词。
可选地,所述确定模块还用于:
获取各所述文本关键词之间的相关系数,判断所述相关系数中是否存在目标相关系数是否大于或等于预设相关系数;
若是,则通过奇异值分解提取所述文本关键词的特征,得到所述文本信息语义特征;
若否,则通过特征提取层提取所述文本关键词对应的文本信息语义特征。
可选地,所述确定模块还用于:
通过热编码将所述文本关键词转化为文本词向量;
将所述文本词向量输入所述特征提取层,得到所述文本关键词对应的文本信息语义特征。
可选地,所述确定模块还用于:
获取待训练特征提取层、训练样本词向量以及各所述训练样本词向量对应的真实文本位置信息;
通过归一化指数函数预测各所述训练样本词向量在各预设位置出现的预测概率;
依据所述预测概率与所述真实文本位置信息,对所述待训练特征提取层进行迭代训练优化,得到所述特征提取层。
可选地,所述设备故障分类装置还用于:
获取所述维修日志文本数据中各所述预设设备故障类别对应的分类关键词数据;
获取所述维修日志文本数据对应的历史文本数据,在所述历史文本数据中提取各所述预设设备故障类别对应的历史关键词数据;
依据各所述预设设备故障类别,将所述分类关键词数据与所述历史关键词数据整合得到所述类别信息语义特征。
可选地,所述分类模块还用于:
获取所述文本信息语义特征与各所述类别信息语义特征之间的相似度;
在各所述相似度中选取目标相似度,将所述目标相似度对应的目标设备故障类别作为所述目标设备的故障类别,得到故障分类结果。
本申请提供的设备故障分类装置,采用上述实施例中的设备故障分类方法,解决了无法兼顾设备故障分类的分类准确性和分类效率的技术问题。与现有技术相比,本申请实施例提供的设备故障分类装置的有益效果与上述实施例提供的设备故障分类方法的有益效果相同,且该设备故障分类装置中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
实施例四
本申请实施例提供一种电子设备,所述电子设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例中的设备故障分类方法。
下面参考图3,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图3示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图3所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(ROM)中的程序或者从存储装置加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有电子设备操作所需的各种程序和数据。处理装置、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。
通常,以下系统可以连接至I/O接口:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置;包括例如磁带、硬盘等的存储装置;以及通信装置。通信装置可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种系统的电子设备,但是应理解的是,并不要求实施或具备所有示出的系统。可以替代地实施或具备更多或更少的系统。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置被安装,或者从ROM被安装。在该计算机程序被处理装置执行时,执行本公开实施例的方法中限定的上述功能。
本申请提供的电子设备,采用上述实施例中的设备故障分类方法,解决了无法兼顾设备故障分类的分类准确性和分类效率的技术问题。与现有技术相比,本申请实施例提供的电子设备的有益效果与上述实施例提供的设备故障分类方法的有益效果相同,且该电子设备中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式的描述中,具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
实施例五
本实施例提供一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行上述实施例中的设备故障分类方法的方法。
本申请实施例提供的计算机可读存储介质例如可以是U盘,但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读存储介质可以是电子设备中所包含的;也可以是单独存在,而未装配入电子设备中。
上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被电子设备执行时,使得电子设备:获取目标设备对应的维修日志文本数据,提取所述维修日志文本数据的文本关键词;依据所述文本关键词,确定所述维修日志文本数据对应的文本信息语义特征;依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类,得到故障分类结果。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该单元本身的限定。
本申请提供的计算机可读存储介质,存储有用于执行上述设备故障分类方法的计算机可读程序指令,解决了无法兼顾设备故障分类的分类准确性和分类效率的技术问题。与现有技术相比,本申请实施例提供的计算机可读存储介质的有益效果与上述实施提供的设备故障分类方法的有益效果相同,在此不做赘述。
实施例六
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的设备故障分类方法的步骤。
本申请提供的计算机程序产品解决了无法兼顾设备故障分类的分类准确性和分类效率的技术问题。与现有技术相比,本申请实施例提供的计算机程序产品的有益效果与上述实施例提供的设备故障分类方法的有益效果相同,在此不做赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

Claims (9)

1.一种设备故障分类方法,其特征在于,所述设备故障分类方法包括:
获取目标设备对应的维修日志文本数据,提取所述维修日志文本数据的文本关键词;
依据所述文本关键词,确定所述维修日志文本数据对应的文本信息语义特征;
依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类,得到故障分类结果;
所述依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类,得到故障分类结果的步骤包括:
获取所述文本信息语义特征与各所述类别信息语义特征之间的相似度;
在各所述相似度中选取目标相似度,将所述目标相似度对应的目标设备故障类别作为所述目标设备的故障类别,得到故障分类结果;
所述获取所述文本信息语义特征与各所述类别信息语义特征之间的相似度的步骤包括:
当所述文本信息语义特征与各所述类别信息语义特征之间的各个相关系数中存在目标相关系数大于或等于预设相关系数时,通过余弦相似度确定法,确定所述文本信息语义特征与各所述类别信息语义特征之间的相似度;
当所述文本信息语义特征与各所述类别信息语义特征之间的各个相关系数中不存在目标相关系数大于或等于所述预设相关系数时,通过最大均值差异确定法,确定所述文本信息语义特征与各所述类别信息语义特征之间的相似度。
2.如权利要求1所述设备故障分类方法,其特征在于,所述提取所述维修日志文本数据的文本关键词的步骤包括:
依据预设前缀词库和所述维修日志文本数据,确定文本切分方式;
依据所述文本切分方式对应的切分路径,构建所述维修日志文本数据的有向无环图;在所述有向无环图中选取目标切分路径,依据所述目标切分路径,确定所述维修日志文本数据的文本关键词。
3.如权利要求1所述设备故障分类方法,其特征在于,所述依据所述文本关键词,确定所述维修日志文本数据对应的文本信息语义特征的步骤包括:
获取各所述文本关键词之间的相关系数,判断所述相关系数中是否存在目标相关系数是否大于或等于预设相关系数;
若是,则通过奇异值分解提取所述文本关键词的特征,得到所述文本信息语义特征;
若否,则通过特征提取层提取所述文本关键词对应的文本信息语义特征。
4.如权利要求3所述设备故障分类方法,其特征在于,所述通过特征提取层提取所述文本关键词对应的文本信息语义特征的步骤包括:
通过热编码将所述文本关键词转化为文本词向量;
将所述文本词向量输入所述特征提取层,得到所述文本关键词对应的文本信息语义特征。
5.如权利要求4所述设备故障分类方法,其特征在于,在所述将所述文本词向量输入所述特征提取层,得到所述文本关键词对应的文本信息语义特征的步骤之前,还包括:
获取待训练特征提取层、训练样本词向量以及各所述训练样本词向量对应的真实文本位置信息;
通过归一化指数函数预测各所述训练样本词向量在各预设位置出现的预测概率;
依据所述预测概率与所述真实文本位置信息,对所述待训练特征提取层进行迭代训练优化,得到所述特征提取层。
6.如权利要求1所述设备故障分类方法,其特征在于,在所述依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类的步骤之前,还包括:
获取所述维修日志文本数据中各所述预设设备故障类别对应的分类关键词数据;
获取所述维修日志文本数据对应的历史文本数据,在所述历史文本数据中提取各所述预设设备故障类别对应的历史关键词数据;
依据各所述预设设备故障类别,将所述分类关键词数据与所述历史关键词数据整合得到所述类别信息语义特征。
7.一种设备故障分类装置,其特征在于,所述设备故障分类装置包括:
获取模块,用于获取目标设备对应的维修日志文本数据,提取所述维修日志文本数据的文本关键词;
确定模块,用于依据所述文本关键词,确定所述维修日志文本数据对应的文本信息语义特征;
分类模块,用于依据所述文本信息语义特征与各预设设备故障类别对应的类别信息语义特征之间的相似度,对所述目标设备进行故障分类,得到故障分类结果;
其中,所述分类模块还用于:
获取所述文本信息语义特征与各所述类别信息语义特征之间的相似度;
在各所述相似度中选取目标相似度,将所述目标相似度对应的目标设备故障类别作为所述目标设备的故障类别,得到故障分类结果;
所述分类模块还用于:
当所述文本信息语义特征与各所述类别信息语义特征之间的各个相关系数中存在目标相关系数大于或等于预设相关系数时,通过余弦相似度确定法,确定所述文本信息语义特征与各所述类别信息语义特征之间的相似度;
当所述文本信息语义特征与各所述类别信息语义特征之间的各个相关系数中不存在目标相关系数大于或等于所述预设相关系数时,通过最大均值差异确定法,确定所述文本信息语义特征与各所述类别信息语义特征之间的相似度。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至6中任一项所述的设备故障分类方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有实现设备故障分类方法的程序,所述实现设备故障分类方法的程序被处理器执行以实现如权利要求1至6中任一项所述设备故障分类方法的步骤。
CN202310114787.3A 2023-02-15 2023-02-15 设备故障分类方法、装置、电子设备及可读存储介质 Active CN116028868B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310114787.3A CN116028868B (zh) 2023-02-15 2023-02-15 设备故障分类方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310114787.3A CN116028868B (zh) 2023-02-15 2023-02-15 设备故障分类方法、装置、电子设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN116028868A CN116028868A (zh) 2023-04-28
CN116028868B true CN116028868B (zh) 2023-06-27

Family

ID=86073875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310114787.3A Active CN116028868B (zh) 2023-02-15 2023-02-15 设备故障分类方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN116028868B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117556829B (zh) * 2024-01-11 2024-04-09 中汽信息科技(天津)有限公司 一种车辆故障码的比对方法、装置、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115659146A (zh) * 2022-11-10 2023-01-31 北京航空航天大学 一种基于改进tri-training的AMC场景迁移方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11132248B2 (en) * 2018-11-29 2021-09-28 Nec Corporation Automated information technology system failure recommendation and mitigation
CN113448935B (zh) * 2020-03-24 2024-04-26 伊姆西Ip控股有限责任公司 用于提供日志信息的方法、电子设备和计算机程序产品
CN112445912B (zh) * 2020-11-06 2022-06-07 苏州浪潮智能科技有限公司 一种故障日志分类方法、系统、设备以及介质
CN115062111A (zh) * 2022-06-16 2022-09-16 平安银行股份有限公司 故障复盘报告生成方法、装置及电子设备
CN115509797A (zh) * 2022-11-22 2022-12-23 北京优特捷信息技术有限公司 一种故障类别的确定方法、装置、设备及介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115659146A (zh) * 2022-11-10 2023-01-31 北京航空航天大学 一种基于改进tri-training的AMC场景迁移方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于维修日志的飞机设备故障原因判别方法;王锐光等;《软件学报》;第30卷(第5期);第1375−1385页 *

Also Published As

Publication number Publication date
CN116028868A (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
JP7164729B2 (ja) クロスモーダル情報検索方法及びその装置、並びに記憶媒体
CN109002510B (zh) 一种对话处理方法、装置、设备和介质
CN110321958B (zh) 神经网络模型的训练方法、视频相似度确定方法
US9923860B2 (en) Annotating content with contextually relevant comments
CN109743311B (zh) 一种WebShell检测方法、装置及存储介质
CN110334209B (zh) 文本分类方法、装置、介质及电子设备
KR20210091076A (ko) 비디오를 처리하기 위한 방법, 장치, 전자기기, 매체 및 컴퓨터 프로그램
CN112712795B (zh) 标注数据确定方法、装置、介质及电子设备
CN113033682B (zh) 视频分类方法、装置、可读介质、电子设备
KR20210098397A (ko) 차량용 기기의 응답 속도 테스트 방법, 장치, 기기 및 저장매체
CN116028868B (zh) 设备故障分类方法、装置、电子设备及可读存储介质
CN112287144A (zh) 图片检索方法、设备及存储介质
CN113033707B (zh) 视频分类方法、装置、可读介质及电子设备
WO2022148239A1 (zh) 信息输出方法、装置和电子设备
CN116151961A (zh) 信用风险预测方法、电子设备及可读存储介质
CN114140723B (zh) 多媒体数据的识别方法、装置、可读介质及电子设备
CN113986958B (zh) 文本信息的转换方法、装置、可读介质和电子设备
CN114218219A (zh) 数据处理方法、装置、设备及存储介质
CN111460214B (zh) 分类模型训练方法、音频分类方法、装置、介质及设备
CN110276001B (zh) 盘点页识别方法、装置、计算设备和介质
CN111694951B (zh) 兴趣主题生成方法、装置、设备及存储介质
CN116910669B (zh) 数据分类方法、装置、电子设备及可读存储介质
CN113434695A (zh) 金融事件抽取方法、装置、电子设备及存储介质
CN116302043B (zh) 代码维护问题检测方法、装置、电子设备及可读存储介质
CN116306632A (zh) 网络威胁信息标注方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant