CN111860667A - 设备故障的确定方法及装置、存储介质、电子装置 - Google Patents
设备故障的确定方法及装置、存储介质、电子装置 Download PDFInfo
- Publication number
- CN111860667A CN111860667A CN202010733179.7A CN202010733179A CN111860667A CN 111860667 A CN111860667 A CN 111860667A CN 202010733179 A CN202010733179 A CN 202010733179A CN 111860667 A CN111860667 A CN 111860667A
- Authority
- CN
- China
- Prior art keywords
- data
- fault
- equipment
- data set
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012549 training Methods 0.000 claims abstract description 122
- 238000012360 testing method Methods 0.000 claims abstract description 101
- 238000012545 processing Methods 0.000 claims abstract description 41
- 238000012423 maintenance Methods 0.000 claims abstract description 35
- 238000010801 machine learning Methods 0.000 claims abstract description 19
- 230000008439 repair process Effects 0.000 claims abstract description 12
- 238000004590 computer program Methods 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims description 15
- 230000000694 effects Effects 0.000 abstract description 4
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000013139 quantization Methods 0.000 description 6
- 230000001360 synchronised effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Medical Informatics (AREA)
- Economics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种设备故障的确定方法及装置、存储介质、电子装置,其中,所述方法包括:获取目标设备的运行数据,其中,所述运行数据包括:设备故障数据、设备状态数据;通过对所述运行数据中的所述设备故障数据和所述设备状态数据进行处理,得到测试数据集;通过对预先获取的所述目标设备的维修信息进行处理,得到训练数据集,其中,所述训练数据集包括:所述维修信息中的设备故障和所述设备故障的标签;将所述训练数据集和所述测试数据集输入机器学习模型进行故障分类,确定所述目标设备的故障类型。通过本发明,解决了故障反馈准确率低的问题,进而达到了提高故障判断准确率和完整度的效果。
Description
技术领域
本发明涉及家电故障分析领域,具体而言,涉及一种设备故障的确定方法及装置、存储介质、电子装置。
背景技术
物联网家电是指将物联网技术应用在冰箱、洗衣进、空调、彩电等产品中。基于物联网家电故障自反馈系统是根据家电上报的故障或者状态数据,根据人工制订规则,将符合规则的故障数据推送到售后系统,售后系统根据录入的售后信息进行售后服务。
基于物联网家电故障自反馈系统具有如下的缺陷:制订的故障规则不够准确且不够完整,导致售后反映故障率匹配率低且会消耗大量的工作量。
针对相关技术中,故障反馈准确率低的问题,目前尚未存在有效的解决方案。
发明内容
本发明实施例提供了一种设备故障的确定方法及装置、存储介质、电子装置,以至少解决相关技术中故障反馈准确率低的问题。
根据本发明的一个实施例,提供了一种设备故障的确定方法,包括:获取目标设备的运行数据,其中,所述运行数据包括:设备故障数据、设备状态数据;通过对所述运行数据中的所述设备故障数据和所述设备状态数据进行处理,得到测试数据集;通过对预先获取的所述目标设备的维修信息进行处理,得到训练数据集,其中,所述训练数据集包括:所述维修信息中的设备故障和所述设备故障的标签;将所述训练数据集和所述测试数据集输入机器学习模型进行故障分类,确定所述目标设备的故障类型。
根据本发明的另一个实施例,提供了一种设备故障的确定装置,包括:获取模块,用于获取目标设备的运行数据,其中,所述运行数据包括:设备故障数据、设备状态数据;测试集模块,用于通过对所述运行数据中的所述设备故障数据和所述设备状态数据进行处理,得到测试数据集;训练集模块,用于通过对预先获取的所述目标设备的维修信息进行处理,得到训练数据集,其中,所述训练数据集包括:所述维修信息中的设备故障和所述设备故障的标签;故障分类模块,用于将所述训练数据集和所述测试数据集输入机器学习模型进行故障分类,确定所述目标设备的故障类型。
根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,由于获取测试数据集合训练数据集后,将所述训练数据集和所述测试数据集输入机器学习模型进行故障分类,从而能够确定所述目标设备的故障类型。因此,可以解决故障反馈准确率低的问题,达到提高故障判断准确率和完整度的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的系统架构示意图;
图2是根据本发明实施例的设备故障的确定方法的流程图;
图3是根据本发明实施例的设备故障的确定装置的结构框图;
图4是本发明实施例中的设备故障的确定方法处理逻辑示意图;
图5是本发明优选实施例中的系统架构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
实施例1
本申请实施例一所提供的方法实施例中在如图1所示的系统架构中执行,其中,图1中包括:故障自主反馈系统10、消息分发系统20、工单信息同步系统30、训练集系统40。在上述系统中,通过售后系统中回传的工单信息,金额过训练集系统40得到训练集,并通过故障自主反馈系统10机器学习模型,得到故障规则。故障自主反馈系统10实时接收网器的故障和状态数据,并对数据进行规则匹配,然后将筛选出的故障机器信息推送到售后系统,由售后系统进行确认并进行服务,然后再反馈到工单信息同步系统30。
在所述故障自主反馈系统10中,采用spark ml,订阅物联网中家用电器的故障数据和状态数据,进行过滤、量化处理后进入训练模型,经过计算后将故障信息推送到kafka消息平台。
在所述消息分发系统20中消息分发采用java程序,线程循环读取故障自反馈主程序发送过来的故障信息,然后根据配置信息,将故障信息通过rest接口发送至售后系统。
在所述工单信息同步系统30中,工单信息同步系统采用java程序,服务端接收售后回传的工单信息,然后发送至大数据平台。
在所述训练集系统40中将同步过来的工单信息进行落地,然后去数据仓库里进行条件关联,将关联出来的数据进行过滤,量化处理,然后以约定的格式存储在redis。
在本实施例中提供了一种运行于上述系统架构的设备故障的确定方法,图2是根据本发明实施例的设备故障的确定的流程图,如图2所示,该流程包括如下步骤:
步骤S202,获取目标设备的运行数据,其中,所述运行数据包括:设备故障数据、设备状态数据;
步骤S204,通过对所述运行数据中的所述设备故障数据和所述设备状态数据进行处理,得到测试数据集;
步骤S206,通过对预先获取的所述目标设备的维修信息进行处理,得到训练数据集,其中,所述训练数据集包括:所述维修信息中的设备故障和所述设备故障的标签;
步骤S208,将所述训练数据集和所述测试数据集输入机器学习模型进行故障分类,确定所述目标设备的故障类型。
通过上述步骤,由于获取测试数据集合训练数据集后,将所述训练数据集和所述测试数据集输入机器学习模型进行故障分类,从而能够确定所述目标设备的故障类型。因此,可以解决故障反馈准确率低的问题,达到提高故障判断准确率和完整度的效果。
在上述步骤S202中,通过订阅的方式获取物联网中家电的运行数据,在所述运行数据中包括了设备故障数据和设备状态数据。
在上述步骤S204中,通过对所述运行数据中的设备故障数据和设备状态数据进行处理得到测试数据集。在所述测试数据集中经过处理包括了设备故障数据和设备状态数据。
在上述步骤S206中,通过对预先获取的目标设备的维修信息进行处理后得到训练数据集,在所述训练数据集中包括了维修信息中的设备故障和设备故障的标签,即在训练数据集中包括的是真实维修信息中记录的设备故障以及设备故障对应的标签。比如,设备故障为冰箱压缩机,设备故障的标签为制冷不足的问题。
在上述步骤S208中,通过在机器学习模型通过所述训练数据集和所述测试数据集进行故障分类。
作为本实施例中的优选,所述确定所述目标设备的故障类型之后,所述方法还包括:将所述故障类型推送至消息队列;将所述消息队列中的故障类型通过预设接口发送至售后系统;接收所述售后系统返回的对所述目标设备进行维修的工单信息;将所述工单信息与数据库中设备信息的进行关联,并将关联结果保存至所述训练数据集。
具体实施时,通过将所述故障类型推送至卡夫卡消息队列,然后将所述卡夫卡消息队列中的故障类型通过预设数据接口发送至售后系统,最后接收所述售后系统返回的对所述目标设备进行修为的工单信息,所述工单信息中包括对目标设备发生的设备故障进行维修的信息,比如,维修时间、维修故障状态、维修故障状态数据等。将所述工单信息与数据仓的数据库中设备信息进行关联,将关联后的结果保存至所述训练数据集。
比如,可以采用spark streaming获取同步过来的工单信息,然后去数据仓库里进行条件关联,将关联出来的数据进行过滤、量化等处理,然后按照预设的格式存储在redis中。其中,所述工单信息与数据仓的数据库中设备信息进行关联的方法可以包括如下的实现方式:将售后回传的工单落地到hive表,工单信息和数据仓库的历史表中的数据进行有条件关联,关联出来的数据进行筛选,剔除掉无效数据。将筛选后的数据根据温度、故障属性等重要字段进行量化,将量化后的数据写入redis,并更改apollo的定义key,通知实时程序刷新训练集库。
可选地,所述通过对所述运行数据中的所述设备故障数据和所述设备状态数据进行处理,得到测试数据集包括:在所述设备故障数据中包括正在维修的所述设备故障数据的情况下,将所述正在维修的所述设备故障数据进行过滤;在所述运行数据中的所述设备状态数据中包括正在维修的所述设备状态数据的情况下,将所述正在维修的所述设备状态数据进行过滤;根据过滤结果对所述设备故障数据和所述设备状态数据进行量化,得到所述测试数据集。具体地,在进行过滤时,采用macid过滤掉不需要监控的状态数据、不需要计算的故障数据。其中,确定不需要监控的状态数据或者不需要计算的故障数据的方式可以是对于不需要深度计算或者有工单正在维护的数据,则属于不需要监控的状态数据。
可选地,所述通过对所述目标设备的维修信息进行处理,得到训练数据集包括:将所述工单信息与所述数据库中的历史设备信息进行关联,得到第一关联数据;根据设备故障特征对所述第一关联数据进行量化,得到所述维修信息中的设备故障和所述设备故障的标签,其中,所述设备故障的标签包括:不同设备故障特征的分类结果;根据所述维修信息中的设备故障和所述设备故障的标签建立得到训练数据集。
可选地,所述通过对所述运行数据中的所述设备故障数据和所述设备状态数据进行处理,得到测试数据集包括:通过对所述运行数据中的所述设备故障数据进行量化处理,得到第一测试数据集,其中,所述第一测试数据集包括:设备故障数据的故障分类特征;通过对所述运行数据中的所述设备状态数据进行量化处理,得到第二测试数据集,其中,所述第二测试数据集包括:设备状态数据的状态分类特征,其中,所述测试数据集包括:所述第一测试数据集,所述第二测试数据集。分别对所述故障数据和状态数据进行量化处理,得到测试数据集。比如,将故障数据、状态数据中的预设字段等进行量化,作为测试数据。
可选地,所述将所述训练数据集和所述测试数据集输入机器学习模型进行故障分类,确定所述目标设备的故障类型包括:将所述测试数据集中的所述设备故障数据的第一故障特征以及所述设备状态数据中的第一状态特征与所述训练数据集中的所述维修信息中对应的特征进行比较;根据比较结果在所述训练数据集中确定K个相似的设备故障的标签;在所述K个相似的设备故障的标签中,确定所述目标设备的故障类型,其中,K为整数。将所述测试数据集合训练数据集输入机器学习模型后,对所述设备故障数据的第一故障特征以及所述设备状态数据中的第一状态特征与所述训练数据集中的所述维修信息中对应的特征进行比较。并且根据确定K个相似的设备故障的标签,确定所述目标设备的故障类型。
可选地,所述在所述K个相似的设备故障的标签中,确定所述目标设备的故障类型包括:遍历所述训练数据集,计算所述训练数据集中的训练元组到所述测试数据集中的测试元组的距离L;在所述距离L小于门限阈值的情况下,将所述训练数据集中的训练元组存入优先级队列,其中,所述优先级队列包括:训练元组的标号、所述训练数据集中的K个初始训练元组到所述测试数据集中的测试元组的初始距离;通过遍历所述优先级队列得到所述优先级队列中K个相似的元组标签;根据所述K个相似的元组标签确定所述目标设备的故障类型。
具体实施时,设定参数,如k。
首先,维护一个大小为k的按距离由大到小的优先级队列,用于存储最近邻训练元组。随机从训练元组中选取k个元组作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,将训练元组标号和距离存入优先级队列
然后,遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离L与优先级队列中的最大距离Lmax。进行比较。若L>=Lmax,则舍弃该元组,遍历下一个元组。若L<Lmax,删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列。
最后,遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别。在测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取误差率最小的k值。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
在本实施例中还提供了一种设备故障的确定装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图3是根据本发明实施例的设备故障的确定装置的结构框图,如图3所示,该装置包括
获取模块30,用于获取目标设备的运行数据,其中,所述运行数据包括:设备故障数据、设备状态数据;
测试集模块32,用于通过对所述运行数据中的所述设备故障数据和所述设备状态数据进行处理,得到测试数据集;
训练集模块34,用于通过对预先获取的所述目标设备的维修信息进行处理,得到训练数据集,其中,所述训练数据集包括:所述维修信息中的设备故障和所述设备故障的标签;
故障分类模块36,用于将所述训练数据集和所述测试数据集输入机器学习模型进行故障分类,确定所述目标设备的故障类型。
通过上述模块,由于获取测试数据集合训练数据集后,将所述训练数据集和所述测试数据集输入机器学习模型进行故障分类,从而能够确定所述目标设备的故障类型。因此,可以解决故障反馈准确率低的问题,达到提高故障判断准确率和完整度的效果。
在所述获取模块30中通过订阅的方式获取物联网中家电的运行数据,在所述运行数据中包括了设备故障数据和设备状态数据。
在所述测试集模块32中通过对所述运行数据中的设备故障数据和设备状态数据进行处理得到测试数据集。在所述测试数据集中经过处理包括了设备故障数据和设备状态数据。
在所述训练集模块34中通过对预先获取的目标设备的维修信息进行处理后得到训练数据集,在所述训练数据集中包括了维修信息中的设备故障和设备故障的标签,即在训练数据集中包括的是真实维修信息中记录的设备故障以及设备故障对应的标签。比如,设备故障为冰箱压缩机,设备故障的标签为制冷不足的问题。
在所述故障分类模块36中通过在机器学习模型通过所述训练数据集和所述测试数据集进行故障分类。
作为本实施例中的优选,还包括:消息处理模块,用于将所述故障类型推送至消息队列;将所述消息队列中的故障类型通过预设接口发送至售后系统;接收所述售后系统返回的对所述目标设备进行维修的工单信息;将所述工单信息与数据库中设备信息的进行关联,并将关联结果保存至所述训练数据集。
具体实施时,通过将所述故障类型推送至卡夫卡消息队列,然后将所述卡夫卡消息队列中的故障类型通过预设数据接口发送至售后系统,最后接收所述售后系统返回的对所述目标设备进行修为的工单信息,所述工单信息中包括对目标设备发生的设备故障进行维修的信息,比如,维修时间、维修故障状态、维修故障状态数据等。将所述工单信息与数据仓的数据库中设备信息进行关联,将关联后的结果保存至所述训练数据集。
比如,可以采用spark streaming获取同步过来的工单信息,然后去数据仓库里进行条件关联,将关联出来的数据进行过滤、量化等处理,然后按照预设的格式存储在redis中。其中,所述工单信息与数据仓的数据库中设备信息进行关联的方法可以包括如下的实现方式:将售后回传的工单落地到hive表,工单信息和数据仓库的历史表中的数据进行有条件关联,关联出来的数据进行筛选,剔除掉无效数据。将筛选后的数据根据温度、故障属性等重要字段进行量化,将量化后的数据写入redis,并更改apollo的定义key,通知实时程序刷新训练集库。
可选地,所述测试集模块32,用于在所述设备故障数据中包括正在维修的所述设备故障数据的情况下,将所述正在维修的所述设备故障数据进行过滤;在所述运行数据中的所述设备状态数据中包括正在维修的所述设备状态数据的情况下,将所述正在维修的所述设备状态数据进行过滤;根据过滤结果对所述设备故障数据和所述设备状态数据进行量化,得到所述测试数据集。具体地,在进行过滤时,采用macid过滤掉不需要监控的状态数据、不需要计算的故障数据。其中,确定不需要监控的状态数据或者不需要计算的故障数据的方式可以是对于不需要深度计算或者有工单正在维护的数据,则属于不需要监控的状态数据。
可选地,所述训练集模块,用于将所述工单信息与所述数据库中的历史设备信息进行关联,得到第一关联数据;根据设备故障特征对所述第一关联数据进行量化,得到所述维修信息中的设备故障和所述设备故障的标签,其中,所述设备故障的标签包括:不同设备故障特征的分类结果;根据所述维修信息中的设备故障和所述设备故障的标签建立得到训练数据集。
可选地,所述测试集模块,用于通过对所述运行数据中的所述设备故障数据进行量化处理,得到第一测试数据集,其中,所述第一测试数据集包括:设备故障数据的故障分类特征;通过对所述运行数据中的所述设备状态数据进行量化处理,得到第二测试数据集,其中,所述第二测试数据集包括:设备状态数据的状态分类特征,其中,所述测试数据集包括:所述第一测试数据集,所述第二测试数据集。分别对所述故障数据和状态数据进行量化处理,得到测试数据集。比如,将故障数据、状态数据中的预设字段等进行量化,作为测试数据。
可选地,所述故障分类模块,用于将所述测试数据集中的所述设备故障数据的第一故障特征以及所述设备状态数据中的第一状态特征与所述训练数据集中的所述维修信息中对应的特征进行比较;根据比较结果在所述训练数据集中确定K个相似的设备故障的标签;在所述K个相似的设备故障的标签中,确定所述目标设备的故障类型,其中,K为整数。将所述测试数据集合训练数据集输入机器学习模型后,对所述设备故障数据的第一故障特征以及所述设备状态数据中的第一状态特征与所述训练数据集中的所述维修信息中对应的特征进行比较。并且根据确定K个相似的设备故障的标签,确定所述目标设备的故障类型。
可选地,所述故障分类模块,还用于遍历所述训练数据集,计算所述训练数据集中的训练元组到所述测试数据集中的测试元组的距离L;在所述距离L小于门限阈值的情况下,将所述训练数据集中的训练元组存入优先级队列,其中,所述优先级队列包括:训练元组的标号、所述训练数据集中的K个初始训练元组到所述测试数据集中的测试元组的初始距离;通过遍历所述优先级队列得到所述优先级队列中K个相似的元组标签;根据所述K个相似的元组标签确定所述目标设备的故障类型。
具体实施时,设定参数,如k。
首先,维护一个大小为k的按距离由大到小的优先级队列,用于存储最近邻训练元组。随机从训练元组中选取k个元组作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,将训练元组标号和距离存入优先级队列
然后,遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离L与优先级队列中的最大距离Lmax。进行比较。若L>=Lmax,则舍弃该元组,遍历下一个元组。若L<Lmax,删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列。
最后,遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别。在测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取误差率最小的k值。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
为了更好的理解上述设备故障的确定方法流程,以下结合优选实施例对上述技术方案进行解释说明,但不用于限定本发明实施例的技术方案。
本发明优选实施例使用了更靠谱的KNN模型替代人工经验得出来的规则,解决了由开发人员凭经验录入规则的不准确、不完整的问题,同时减少了数据开发人员的工作量。
如图4所示,是本发明实施例中的设备故障的确定方法处理逻辑示意图,主体基于spark实现,其原理是实时数据流按照先后顺序按条进行处理,在图4中所示为其中一条故障/状态数据的处理逻辑,具体步骤如下:
步骤一,对数据进行预处理。将售后返回的工单信息与数据仓库的故障状态数据进行关联,提取关联数据进行量化,然后作为训练集中数据和标签。
预处理过程主要包括数据过滤,通过macid过滤掉不需要监控的状态数据、不需要计算的故障数据。通过数据库redis中获取训练集,并订阅实时更新目标设备的运行数据作为测试集,缓存于本地。
步骤二,将故障数据、状态数据里的重点关注字段等进行量化,作为测试数据,将测试数据的特征与训练集中对应的特征进行相互比较,找到训练集中与之最为相似的前k个数据。
通过实时数据获取,量化。初始化部分获取规则,根据多重校验规则对数据进行过滤,根据数据生成fault处理器、status处理器。对故障数据应用fault处理器,对状态数据应用status处理,生成相应状态并触发推送消息,将反馈信息发送出去。
如图5所示,是本发明优选实施例中的系统架构示意图。所述系统架构中包括,故障自主反馈系统10、消息分发系统20、工单信息同步系统30、训练集系统40。在所述故障自主反馈系统10中执行订阅网器数据的步骤,将数据进行量化处理的步骤以及K-邻近模型计算的步骤后进行故障推送。在所述消息分发系统20中实现kafka数据分发将kafka消息平台的数据分发至售后系统。再由工单信息同步系统30通过接收销售系统返回的数据执行工单信息同步的步骤。在所述训练集系统10中执行从数据仓库中获取设备状态数据和设备故障数据的步骤,并经过量化处理的步骤后得到训练集。
其中,所述消息分发系统20采用采用java程序,线程循环从Kafka中读取故障自反馈主程序发送过来的故障信息,然后根据配置信息,将故障信息通过rest接口发送至售后系统。
其中,所述工单信息同步系统30工单信息同步系统采用java程序,服务端接收售后回传的工单信息,然后发送至大数据平台的Kafka。
其中,所述训练集系统40采用spark streaming将同步过来的工单信息进行落地,然后去数据仓库里进行条件关联,将关联出来的数据进行过滤,量化处理,然后以约定的格式存储在redis。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取目标设备的运行数据,其中,所述运行数据包括:设备故障数据、设备状态数据;
S2,通过对所述运行数据中的所述设备故障数据和所述设备状态数据进行处理,得到测试数据集;
S3,通过对预先获取的所述目标设备的维修信息进行处理,得到训练数据集,其中,所述训练数据集包括:所述维修信息中的设备故障和所述设备故障的标签;
S4,将所述训练数据集和所述测试数据集输入机器学习模型进行故障分类,确定所述目标设备的故障类型。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:
S1,将所述故障类型推送至消息队列;
S2,将所述消息队列中的故障类型通过预设接口发送至售后系统;
S3,接收所述售后系统返回的对所述目标设备进行维修的工单信息;
S4,将所述工单信息与数据库中设备信息的进行关联,并将关联结果保存至所述训练数据集.
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取目标设备的运行数据,其中,所述运行数据包括:设备故障数据、设备状态数据;
S2,通过对所述运行数据中的所述设备故障数据和所述设备状态数据进行处理,得到测试数据集;
S3,通过对预先获取的所述目标设备的维修信息进行处理,得到训练数据集,其中,所述训练数据集包括:所述维修信息中的设备故障和所述设备故障的标签;
S4,将所述训练数据集和所述测试数据集输入机器学习模型进行故障分类,确定所述目标设备的故障类型。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种设备故障的确定方法,其特征在于,包括:
获取目标设备的运行数据,其中,所述运行数据包括:设备故障数据、设备状态数据;
通过对所述运行数据中的所述设备故障数据和所述设备状态数据进行处理,得到测试数据集;
通过对预先获取的所述目标设备的维修信息进行处理,得到训练数据集,其中,所述训练数据集包括:所述维修信息中的设备故障和所述设备故障的标签;
将所述训练数据集和所述测试数据集输入机器学习模型进行故障分类,确定所述目标设备的故障类型。
2.根据权利要求1所述的方法,其特征在于,所述确定所述目标设备的故障类型之后,所述方法还包括:
将所述故障类型推送至消息队列;
将所述消息队列中的故障类型通过预设接口发送至售后系统;
接收所述售后系统返回的对所述目标设备进行维修的工单信息;
将所述工单信息与数据库中设备信息的进行关联,并将关联结果保存至所述训练数据集。
3.根据权利要求2所述的方法,其特征在于,所述通过对所述运行数据中的所述设备故障数据和所述设备状态数据进行处理,得到测试数据集包括:
在所述设备故障数据中包括正在维修的所述设备故障数据的情况下,将所述正在维修的所述设备故障数据进行过滤;
在所述运行数据中的所述设备状态数据中包括正在维修的所述设备状态数据的情况下,将所述正在维修的所述设备状态数据进行过滤;
根据过滤结果对所述设备故障数据和所述设备状态数据进行量化,得到所述测试数据集。
4.根据权利要求2所述的方法,其特征在于,所述通过对所述目标设备的维修信息进行处理,得到训练数据集包括:
将所述工单信息与所述数据库中的历史设备信息进行关联,得到第一关联数据;
根据设备故障特征对所述第一关联数据进行量化,得到所述维修信息中的设备故障和所述设备故障的标签,其中,所述设备故障的标签包括:不同设备故障特征的分类结果;
根据所述维修信息中的设备故障和所述设备故障的标签建立得到训练数据集。
5.根据权利要求1所述的方法,其特征在于,所述通过对所述运行数据中的所述设备故障数据和所述设备状态数据进行处理,得到测试数据集包括:
通过对所述运行数据中的所述设备故障数据进行量化处理,得到第一测试数据集,其中,所述第一测试数据集包括:设备故障数据的故障分类特征;
通过对所述运行数据中的所述设备状态数据进行量化处理,得到第二测试数据集,其中,所述第二测试数据集包括:设备状态数据的状态分类特征,其中,所述测试数据集包括:所述第一测试数据集,所述第二测试数据集。
6.根据权利要求1所述的方法,其特征在于,所述将所述训练数据集和所述测试数据集输入机器学习模型进行故障分类,确定所述目标设备的故障类型包括:
将所述测试数据集中的所述设备故障数据的第一故障特征以及所述设备状态数据中的第一状态特征与所述训练数据集中的所述维修信息中对应的特征进行比较;
根据比较结果在所述训练数据集中确定K个相似的设备故障的标签;
在所述K个相似的设备故障的标签中,确定所述目标设备的故障类型,其中,K为整数。
7.根据权利要求6所述的方法,其特征在于,所述在所述K个相似的设备故障的标签中,确定所述目标设备的故障类型包括:
遍历所述训练数据集,计算所述训练数据集中的训练元组到所述测试数据集中的测试元组的距离L;
在所述距离L小于门限阈值的情况下,将所述训练数据集中的训练元组存入优先级队列,其中,所述优先级队列包括:训练元组的标号、所述训练数据集中的K个初始训练元组到所述测试数据集中的测试元组的初始距离;
通过遍历所述优先级队列得到所述优先级队列中K个相似的元组标签;
根据所述K个相似的元组标签确定所述目标设备的故障类型。
8.一种设备故障的确定装置,其特征在于,包括:
获取模块,用于获取目标设备的运行数据,其中,所述运行数据包括:设备故障数据、设备状态数据;
测试集模块,用于通过对所述运行数据中的所述设备故障数据和所述设备状态数据进行处理,得到测试数据集;
训练集模块,用于通过对预先获取的所述目标设备的维修信息进行处理,得到训练数据集,其中,所述训练数据集包括:所述维修信息中的设备故障和所述设备故障的标签;
故障分类模块,用于将所述训练数据集和所述测试数据集输入机器学习模型进行故障分类,确定所述目标设备的故障类型。
9.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至7任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至7任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010733179.7A CN111860667A (zh) | 2020-07-27 | 2020-07-27 | 设备故障的确定方法及装置、存储介质、电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010733179.7A CN111860667A (zh) | 2020-07-27 | 2020-07-27 | 设备故障的确定方法及装置、存储介质、电子装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111860667A true CN111860667A (zh) | 2020-10-30 |
Family
ID=72948893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010733179.7A Pending CN111860667A (zh) | 2020-07-27 | 2020-07-27 | 设备故障的确定方法及装置、存储介质、电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111860667A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112330060A (zh) * | 2020-11-25 | 2021-02-05 | 新智数字科技有限公司 | 设备故障预测方法、装置、可读存储介质及电子设备 |
CN112560997A (zh) * | 2020-12-29 | 2021-03-26 | 珠海拓芯科技有限公司 | 故障识别模型训练方法、故障识别方法及相关装置 |
CN112579471A (zh) * | 2020-12-30 | 2021-03-30 | 锐捷网络股份有限公司 | 软件测试信息的处理方法及装置 |
CN112860525A (zh) * | 2021-03-31 | 2021-05-28 | 中国工商银行股份有限公司 | 分布式系统中的节点故障预测方法及装置 |
CN113516340A (zh) * | 2021-04-01 | 2021-10-19 | 广东电网有限责任公司广州供电局 | 一种智能工单的推送方法和装置 |
CN114139733A (zh) * | 2021-10-27 | 2022-03-04 | 深圳市移动力量科技有限公司 | 智能公寓的设备管理方法、终端设备以及存储介质 |
CN114461735A (zh) * | 2022-04-13 | 2022-05-10 | 天津中新智冠信息技术有限公司 | 工矿数据分级分类方法、装置和计算机设备 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120185728A1 (en) * | 2010-12-24 | 2012-07-19 | Commonwealth Scientific And Industrial Research Organisation | System and method for detecting and/or diagnosing faults in multi-variable systems |
CN103246265A (zh) * | 2013-04-26 | 2013-08-14 | 河海大学常州校区 | 机电设备检测维护系统及检测维护方法 |
CN104714538A (zh) * | 2015-01-21 | 2015-06-17 | 中国铁路总公司 | 一种铁路信号系统智能故障诊断装置及诊断方法 |
CN106408192A (zh) * | 2016-09-23 | 2017-02-15 | 东北大学 | 一种选矿设备运行状态监控系统及方法 |
CN106555788A (zh) * | 2016-11-11 | 2017-04-05 | 河北工业大学 | 基于模糊处理的深度学习在液压装备故障诊断中的应用 |
CN107728602A (zh) * | 2017-09-28 | 2018-02-23 | 合肥工业大学 | 一种液压成形装备故障的个性化服务方法 |
CN108710555A (zh) * | 2018-05-23 | 2018-10-26 | 郑州云海信息技术有限公司 | 一种基于监督学习的服务器错误诊断方法 |
CN109492790A (zh) * | 2018-09-18 | 2019-03-19 | 北京光耀电力科技股份有限公司 | 基于神经网络与数据挖掘的风电机组健康管理方法 |
US20190228322A1 (en) * | 2018-01-25 | 2019-07-25 | Noregon Systems, Inc. | Vehicle repair guidance system |
US20190278529A1 (en) * | 2018-03-06 | 2019-09-12 | Kabushiki Kaisha Toshiba | System and method for machine learning optimization of human resource scheduling for device repair visits |
CN110322026A (zh) * | 2019-06-26 | 2019-10-11 | 杭州培慕科技有限公司 | 基于设备故障数据的动态可靠性设备管理方法 |
CN110766059A (zh) * | 2019-10-14 | 2020-02-07 | 四川西部能源股份有限公司郫县水电厂 | 一种变压器故障的预测方法、装置和设备 |
US20200150622A1 (en) * | 2018-11-13 | 2020-05-14 | Guangdong University Of Technology | Method for detecting abnormity in unsupervised industrial system based on deep transfer learning |
CN111368890A (zh) * | 2020-02-26 | 2020-07-03 | 珠海格力电器股份有限公司 | 故障检测方法及装置、信息物理融合系统 |
-
2020
- 2020-07-27 CN CN202010733179.7A patent/CN111860667A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120185728A1 (en) * | 2010-12-24 | 2012-07-19 | Commonwealth Scientific And Industrial Research Organisation | System and method for detecting and/or diagnosing faults in multi-variable systems |
CN103246265A (zh) * | 2013-04-26 | 2013-08-14 | 河海大学常州校区 | 机电设备检测维护系统及检测维护方法 |
CN104714538A (zh) * | 2015-01-21 | 2015-06-17 | 中国铁路总公司 | 一种铁路信号系统智能故障诊断装置及诊断方法 |
CN106408192A (zh) * | 2016-09-23 | 2017-02-15 | 东北大学 | 一种选矿设备运行状态监控系统及方法 |
CN106555788A (zh) * | 2016-11-11 | 2017-04-05 | 河北工业大学 | 基于模糊处理的深度学习在液压装备故障诊断中的应用 |
CN107728602A (zh) * | 2017-09-28 | 2018-02-23 | 合肥工业大学 | 一种液压成形装备故障的个性化服务方法 |
US20190228322A1 (en) * | 2018-01-25 | 2019-07-25 | Noregon Systems, Inc. | Vehicle repair guidance system |
US20190278529A1 (en) * | 2018-03-06 | 2019-09-12 | Kabushiki Kaisha Toshiba | System and method for machine learning optimization of human resource scheduling for device repair visits |
CN108710555A (zh) * | 2018-05-23 | 2018-10-26 | 郑州云海信息技术有限公司 | 一种基于监督学习的服务器错误诊断方法 |
CN109492790A (zh) * | 2018-09-18 | 2019-03-19 | 北京光耀电力科技股份有限公司 | 基于神经网络与数据挖掘的风电机组健康管理方法 |
US20200150622A1 (en) * | 2018-11-13 | 2020-05-14 | Guangdong University Of Technology | Method for detecting abnormity in unsupervised industrial system based on deep transfer learning |
CN110322026A (zh) * | 2019-06-26 | 2019-10-11 | 杭州培慕科技有限公司 | 基于设备故障数据的动态可靠性设备管理方法 |
CN110766059A (zh) * | 2019-10-14 | 2020-02-07 | 四川西部能源股份有限公司郫县水电厂 | 一种变压器故障的预测方法、装置和设备 |
CN111368890A (zh) * | 2020-02-26 | 2020-07-03 | 珠海格力电器股份有限公司 | 故障检测方法及装置、信息物理融合系统 |
Non-Patent Citations (2)
Title |
---|
邹琼俊: "《H5+跨平台移动应用实战开发》", vol. 978, 30 April 2019, 北京航空航天大学出版社, pages: 187 - 188 * |
陶皖主编: "《云计算与大数据》", vol. 978, 31 January 2017, 西安电子科技大学出版社, pages: 185 - 188 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112330060A (zh) * | 2020-11-25 | 2021-02-05 | 新智数字科技有限公司 | 设备故障预测方法、装置、可读存储介质及电子设备 |
CN112330060B (zh) * | 2020-11-25 | 2024-01-12 | 新奥新智科技有限公司 | 设备故障预测方法、装置、可读存储介质及电子设备 |
CN112560997A (zh) * | 2020-12-29 | 2021-03-26 | 珠海拓芯科技有限公司 | 故障识别模型训练方法、故障识别方法及相关装置 |
CN112579471A (zh) * | 2020-12-30 | 2021-03-30 | 锐捷网络股份有限公司 | 软件测试信息的处理方法及装置 |
CN112860525A (zh) * | 2021-03-31 | 2021-05-28 | 中国工商银行股份有限公司 | 分布式系统中的节点故障预测方法及装置 |
CN113516340A (zh) * | 2021-04-01 | 2021-10-19 | 广东电网有限责任公司广州供电局 | 一种智能工单的推送方法和装置 |
CN114139733A (zh) * | 2021-10-27 | 2022-03-04 | 深圳市移动力量科技有限公司 | 智能公寓的设备管理方法、终端设备以及存储介质 |
CN114461735A (zh) * | 2022-04-13 | 2022-05-10 | 天津中新智冠信息技术有限公司 | 工矿数据分级分类方法、装置和计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860667A (zh) | 设备故障的确定方法及装置、存储介质、电子装置 | |
CN111158977B (zh) | 一种异常事件根因定位方法及装置 | |
CN103513983B (zh) | 用于预测性警报阈值确定工具的方法和系统 | |
CN109120461B (zh) | 一种业务性能端到端监控方法、系统及装置 | |
CN110704231A (zh) | 一种故障处理方法及装置 | |
US20160253402A1 (en) | Adaptive data repartitioning and adaptive data replication | |
CN106126403B (zh) | Oracle数据库故障分析方法和装置 | |
CN109409780B (zh) | 变更处理方法、装置、计算机设备和存储介质 | |
CN109492826B (zh) | 一种基于机器学习的信息系统运行状态风险预测方法 | |
US20150095719A1 (en) | Data preprocessing device and method thereof | |
CN111209310B (zh) | 基于流计算的业务数据处理方法、装置和计算机设备 | |
CN110333995A (zh) | 对工业设备运行状态进行监测的方法及装置 | |
CN110489142B (zh) | 设备软件升级的评估方法及装置、存储介质、终端 | |
CN115712843B (zh) | 基于人工智能的数据匹配检测处理方法及系统 | |
CN113190426B (zh) | 一种大数据评分系统稳定性监控方法 | |
CN112148779A (zh) | 确定业务指标的方法、装置及存储介质 | |
CN117290719B (zh) | 基于数据分析的巡检管理方法、装置及存储介质 | |
CN109902196B (zh) | 一种商标类别推荐方法、装置、计算机设备及存储介质 | |
CN111400370A (zh) | 数据流通中的数据监控方法及装置、存储介质、服务器 | |
CN114185938B (zh) | 基于数字金融及大数据溯源的项目溯源分析方法及系统 | |
CN113448747B (zh) | 数据传输方法、装置、计算机设备和存储介质 | |
CN109740941A (zh) | 军品数据处理系统 | |
CN115062676A (zh) | 数据处理方法、装置及计算机可读存储介质 | |
CN115168509A (zh) | 风控数据的处理方法及装置、存储介质、计算机设备 | |
Xie et al. | Optimizing cost of continuous overlapping queries over data streams by filter adaption |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |