CN114722715A - 基于机器学习的设备故障处理方法及装置 - Google Patents

基于机器学习的设备故障处理方法及装置 Download PDF

Info

Publication number
CN114722715A
CN114722715A CN202210401951.4A CN202210401951A CN114722715A CN 114722715 A CN114722715 A CN 114722715A CN 202210401951 A CN202210401951 A CN 202210401951A CN 114722715 A CN114722715 A CN 114722715A
Authority
CN
China
Prior art keywords
fault
equipment
data
model
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210401951.4A
Other languages
English (en)
Inventor
李腾飞
吴嘉
丁二帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202210401951.4A priority Critical patent/CN114722715A/zh
Publication of CN114722715A publication Critical patent/CN114722715A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Geometry (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种基于机器学习的设备故障处理方法及装置,涉及人工智能技术领域,其中该方法包括:接收实时设备数据;将实时设备数据分别输入预先构建的故障预防模型、故障极早期处理模型和故障智能处理模型中,进行异常场景识别,所述故障预防模型、故障极早期处理模型和故障智能处理模型基于机器学习模型构建,对应识别设备由轻微到严重的不同异常场景;当故障预防模型、故障极早期处理模型或故障智能处理模型识别得到异常场景时,利用与异常场景对应的预设处理措施对相应设备进行故障处理。本发明可以及时对设备的异常状态进行干预,减少设备故障率,解放生产力降本增效,提升设备使用者的用户体验。

Description

基于机器学习的设备故障处理方法及装置
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于机器学习的设备故障处理方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
设备是企业运行的基础,企业的正常运转离不开各种设备的日常维护。设备的日常维护包含大量的设备故障处理工作,诸如设备软件运行、设备系统故障、设备硬件故障、设备供电故障等,主要依赖用户报送故障、技术人员巡检、监控报警平台等方式触发处理流程,各类技术人员现场处理。当设备数量大、设备种类差异大、人员配备不足时,设备故障保障能力明显下降,用户体验差。
发明内容
本发明实施例提供一种基于机器学习的设备故障处理方法,用以及时对设备的异常状态进行干预,减少设备故障率,解放生产力降本增效,提升设备使用者的用户体验,该方法包括:
接收实时设备数据,其中,设备数据包括设备记录数据、通过采集装置采集的设备数据、用户行为数据和设备人为报修数据;
将实时设备数据分别输入预先构建的故障预防模型、故障极早期处理模型和故障智能处理模型中,进行异常场景识别,所述故障预防模型、故障极早期处理模型和故障智能处理模型基于机器学习模型构建,对应识别设备由轻微到严重的不同异常场景;
当故障预防模型、故障极早期处理模型或故障智能处理模型识别得到异常场景时,利用与异常场景对应的预设处理措施对相应设备进行故障处理。
本发明实施例还提供一种基于机器学习的设备故障处理装置,用以及时对设备的异常状态进行干预,减少设备故障率,解放生产力降本增效,提升设备使用者的用户体验,该装置包括:
通信模块,用于接收实时设备数据,其中,设备数据包括设备记录数据、通过采集装置采集的设备数据、用户行为数据和设备人为报修数据;
识别模块,用于将实时设备数据分别输入预先构建的故障预防模型、故障极早期处理模型和故障智能处理模型中,进行异常场景识别,所述故障预防模型、故障极早期处理模型和故障智能处理模型基于机器学习模型构建,对应识别设备由轻微到严重的不同异常场景;
故障处理模块,用于当故障预防模型、故障极早期处理模型或故障智能处理模型识别得到异常场景时,利用与异常场景对应的预设处理措施对相应设备进行故障处理。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于机器学习的设备故障处理方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于机器学习的设备故障处理方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述基于机器学习的设备故障处理方法。
本发明实施例中,针对故障发展由轻微到严重的不同异常场景,基于机器学习模型,分别构建了故障预防模型、故障极早期处理模型和故障智能处理模型,当获取到实时设备数据之后,将实时设备数据分别输入故障预防模型、故障极早期处理模型和故障智能处理模型中,如果上述三个模型之一得到异常场景识别结果,则表明已经出现或轻微或严重的异常,对于识别的异常,采用与异常场景对应的预设处理措施对相应设备进行故障处理。这样一来,可以通过日常设备数据采集分析模拟人类进行故障预防、故障分析和故障解决,可以大大降低数据处理工作,显著降低设备故障发生率以及设备故障处理的工作量,减轻了设备管理人员的压力,提升了用户体验;将计算机程序应用于日常保障方面,解放生产力降本增效,同时也带来了不断自动提高计算机程序取代人类进行日常保障可信度的可能性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中一种基于机器学习的设备故障处理方法的流程图;
图2为本发明实施例中一种设备数据流向示意图;
图3为本发明实施例中一种基于机器学习的设备故障处理方法的另一种流程图;
图4为本发明实施例中一种基于机器学习的设备故障处理装置的结构示意图;
图5为本发明实施例中一种计算机设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
本发明实施例中提供了一种基于机器学习的设备故障处理方法,如图1所示,该方法包括:
步骤101、接收实时设备数据。
其中,设备数据包括设备记录数据、通过采集装置采集的设备数据、用户行为数据和设备人为报修数据。
设备记录数据包括设备型号、日志信息、设备硬件运行信息、设备软件运行信息和操作系统运行信息,设备硬件运行信息包括内存运行信息、硬盘运行信息和CPU运行信息;通过采集装置采集的设备数据包括设备的温度、风扇运行速度(也即风扇转速)、声音信息、电压和网线是否松动;用户行为数据包括用户的个人信息、抱怨声音(也可以通过采集装置进行采集)、工作骤停状态(比如说5分钟内电脑屏幕未发生任何操作)信息、反复尝试运行状态信息(比如说反复打开同一系统或网页等)、拍打鼠标行为以及拍打键盘行为。
其中,设备运行声音大小往往是设备是否故障最直接最直观的表现,设备风扇转速快慢往往是设备部件工作强度最直观的指示,设备运行温度高低会直接影响设备寿命,硬件资源占用率直接体现了设备工作状态。因此,通过综合设备记录信息、通过采集装置采集的设备数据能够对设备进行异常场景的识别。
设备记录数据通过在操作系统安装探针获取;采集装置可以为传感器,可以通过安装在设备中的传感器采集如设备的温度等数据。设备人为保修数据,包括故障事件的起因、经过、现象、对象、影响范围等,该些数据为构建机器学习模型的数据挖掘和机器学习提供数据基础。
步骤102、将实时设备数据分别输入预先构建的故障预防模型、故障极早期处理模型和故障智能处理模型中,进行异常场景识别。
其中,故障预防模型、故障极早期处理模型和故障智能处理模型基于机器学习模型构建,对应识别设备由轻微到严重的不同异常场景。
本发明实施例中,在将实时设备数据分别输入预先构建的故障预防模型、故障极早期处理模型和故障智能处理模型中,进行异常场景识别之前,还获取历史设备数据,接收开发人员对于历史设备数据的分类,以及设置的每一类历史设备数据中各项数据对应的历史异常场景;利用相应类的历史设备数据集对应的历史异常场景训练机器学习模型,得到故障预防模型、故障极早期处理模型和故障智能处理模型。
其中,各类历史设备数据分别对应故障预防阶段的历史设备数据、故障极早期处理阶段的历史设备数据以及故障智能处理阶段的历史设备数据。
在异常出现的不同阶段,与异常表现相关的各项设备数据多有不同。具体的,参见图2所示,故障预防阶段的历史设备数据包括设备记录数据、通过采集装置采集的设备数据和用户行为数据;故障极早期处理阶段的历史设备数据包括设备记录数据、通过采集装置采集的设备数据和用户行为数据;故障智能处理阶段的历史设备数据包括设备数据包括设备记录数据、通过采集装置采集的设备数据、用户行为数据和设备人为报修数据。
需要说明的是,虽然在故障预防节段、故障极早期处理节段和故障智能处理阶段所使用的设备数据类型存在部门相同,但其在进行不同模型训练时的数据具体值往往不同,比如说,对于风扇温度而言,在故障预防阶段,风扇温度为35~40度;在故障极早期处理阶段,风扇温度为40度~45度;在设备智能处理节段,风扇温度为45度以上。
具体的,故障预防模型主要识别故障未发生前的异常状况,智能化干预,防止故障发生。主要基于数据挖掘和机器学习技术,从大量的设备正常运行场景、异常运行场景以及设备故障事件对应的历史设备数据中提取异常场景,将异常场景对应的历史设备数据及异常场景所属的场景分类输入机器学习模型中进行训练,构建故障预防模型。此外,还构建按异常场景和异常干预手段(也即预设处理措施)为参照指标的知识库,当故障预防模型自动匹配到异常场景后,自动触发异常干预手段,预防设备故障发生,防患于未然。
故障极早期处理模型主要通过识别设备故障信息、用户异常行为,早于用户主动报修,优先处理设备故障,降低设备故障对用户的影响程度、降低设备故障影响范围。主要基于数据挖掘和机器学习技术,从大量的设备故障运行场景、设备故障事件、人员行为异常对应的历史设备数据中提取异常场景,将异常场景对应的历史设备数据及异常场景所属的场景分类输入机器学习模型中进行训练,构建故障极早期处理模型。在实际应用中,故障极早期处理模型可以识别用户未感知到的早期异常,识别异常场景,并通过预先构建的异常场景和预设处理措施为参照指标的知识库,自动触发解决方案,在第一时间处理设备故障,优化用户体验,缩小故障影响范围。
故障智能化处理模型,主要通过识别用户报修信息,智能化处理设备故障,为用户提供解决方案。在构建故障智能化处理模型时,基于数据挖掘和机器学习技术,从大量的设备故障事件中提取故障场景(也即故障时的异常场景),利用故障场景及提取到故障场景的历史设备参数对机器学习模型进行训练,得到故障智能处理模型。之后,可以构建故障场景和解决方案(即预设处理措施)为参照指标的知识库,当通过故障智能处理模型自动匹配到故障场景时,为用户提供解决方案。
步骤103、当故障预防模型、故障极早期处理模型或故障智能处理模型识别得到异常场景时,利用与异常场景对应的预设处理措施对相应设备进行故障处理。
需要说明的是,本步骤中将在故障预防阶段的异常场景的处理也称为了故障处理,但此阶段中仍属于轻微异常,还未发展为故障。
本发明实施例中,在故障预防模型、故障极早期处理模型或故障智能处理模型识别得到异常场景之后,如图3所示,还可以执行如下步骤301和步骤302:
步骤301、每间隔预设时间段,将在间隔的时间段中故障预防模型、故障极早期处理模型及故障智能处理模型识别的异常场景,以及异常场景对应的设备数据输入预先构建的设备预警分析模型,得到设备预警分析结果;
步骤302、展示设备预警分析结果。
其中,利用故障预防阶段、故障极早期处理阶段和故障智能处理阶段确定的历史异常场景及对应的历史设备数据对机器学习模型进行训练,得到设备预警分析模型。
考虑到通过自动匹配预设处理设施对异常场景进行处理往往存在灵活性不足,且往往不会综合考虑导致多项设备异常的深入原因,比如说,当故障预防模型识别出的异常场景为风扇转速过高时,按照预设处理措施降低风扇转速进行处理,当出现多次风扇转速过高时,每一次均采用降低风扇转速的处理,而不会深入挖掘导致风扇经常性转速过高的原因。为了解决上述问题,本发明实施例中,利用了设备预警分析模型对深入原因进行分析。设备预警分析模型是通过对故障预防模型、故障极早期处理模型、故障智能处理模型中识别的异常场景及设备数据进行识别,得到与该预设时间段中出现的异常场景进行综合分析,得到预警分析结果,确定异常设备,为管理人员提供预警,以便于管理人员尽早对可能存在的异常进行排查处理,降低设备异常场景的发生率。
本发明实施例中,在故障预防模型、故障极早期处理模型、故障智能处理模型和设备预警分析模型运行一段时间后,可以人工对各个模型的运行情况进行评估,并对认为不符合预期识别结果的模型进行参数调整,以实现模型的优化。
本发明实施例中,针对故障发展由轻微到严重的不同异常场景,基于机器学习模型,分别构建了故障预防模型、故障极早期处理模型和故障智能处理模型,当获取到实时设备数据之后,将实时设备数据分别输入故障预防模型、故障极早期处理模型和故障智能处理模型中,如果上述三个模型之一得到异常场景识别结果,则表明已经出现或轻微或严重的异常,对于识别的异常,采用与异常场景对应的预设处理措施对相应设备进行故障处理。这样一来,可以通过日常设备数据采集分析模拟人类进行故障预防、故障分析和故障解决,可以大大降低数据处理工作,显著降低设备故障发生率以及设备故障处理的工作量,减轻了设备管理人员的压力,提升了用户体验;将计算机程序应用于日常保障方面,解放生产力降本增效,同时也带来了不断自动提高计算机程序取代人类进行日常保障可信度的可能性。
本发明实施例中还提供了一种基于机器学习的设备故障处理装置,如下面的实施例所述。由于该装置解决问题的原理与基于机器学习的设备故障处理方法相似,因此该装置的实施可以参见基于机器学习的设备故障处理方法的实施,重复之处不再赘述。
如图4所示,该装置400包括:
通信模块401,用于接收实时设备数据,其中,设备数据包括设备记录数据、通过采集装置采集的设备数据、用户行为数据和设备人为报修数据;
识别模块402,用于将实时设备数据分别输入预先构建的故障预防模型、故障极早期处理模型和故障智能处理模型中,进行异常场景识别,故障预防模型、故障极早期处理模型和故障智能处理模型基于机器学习模型构建,对应识别设备由轻微到严重的不同异常场景;
故障处理模块403,用于当故障预防模型、故障极早期处理模型或故障智能处理模型识别得到异常场景时,利用与异常场景对应的预设处理措施对相应设备进行故障处理。
在本发明实施例的一种实现方式中,设备记录数据包括设备型号、日志信息、设备硬件运行信息、设备软件运行信息和操作系统运行信息,设备硬件运行信息包括内存运行信息、硬盘运行信息和CPU运行信息;通过采集装置采集的设备数据包括设备的温度、风扇运行速度、声音信息、电压和网线是否松动;用户行为数据包括用户的个人信息、抱怨声音、工作骤停状态信息、反复尝试运行状态信息、拍打鼠标行为以及拍打键盘行为。
在本发明实施例的一种实现方式中,装置还包括:
获取模块,用于获取历史设备数据,接收开发人员对于历史设备数据的分类,以及设置的每一类历史设备数据中各项数据对应的历史异常场景,其中,各类历史设备数据分别对应故障预防阶段的历史设备数据、故障极早期处理阶段的历史设备数据以及故障智能处理阶段的历史设备数据;
模型训练模块,用于利用相应类的历史设备数据集对应的历史异常场景训练机器学习模型,得到故障预防模型、故障极早期处理模型和故障智能处理模型。
在本发明实施例的一种实现方式中,故障预防阶段的历史设备数据包括设备记录数据、通过采集装置采集的设备数据和用户行为数据;故障极早期处理阶段的历史设备数据包括设备记录数据、通过采集装置采集的设备数据和用户行为数据;故障智能处理阶段的历史设备数据包括设备数据包括设备记录数据、通过采集装置采集的设备数据、用户行为数据和设备人为报修数据。
在本发明实施例的一种实现方式中,装置还包括:
预警分析模块,用于每间隔预设时间段,将在间隔的时间段中故障预防模型、故障极早期处理模型及故障智能处理模型识别的异常场景,以及异常场景对应的设备数据输入预先构建的设备预警分析模型,得到设备预警分析结果;
展示模块,用于展示设备预警分析结果;
其中,利用故障预防阶段、故障极早期处理阶段和故障智能处理阶段确定的历史异常场景及对应的历史设备数据对机器学习模型进行训练,得到设备预警分析模型。
本发明实施例中,针对故障发展由轻微到严重的不同异常场景,基于机器学习模型,分别构建了故障预防模型、故障极早期处理模型和故障智能处理模型,当获取到实时设备数据之后,将实时设备数据分别输入故障预防模型、故障极早期处理模型和故障智能处理模型中,如果上述三个模型之一得到异常场景识别结果,则表明已经出现或轻微或严重的异常,对于识别的异常,采用与异常场景对应的预设处理措施对相应设备进行故障处理。这样一来,可以通过日常设备数据采集分析模拟人类进行故障预防、故障分析和故障解决,可以大大降低数据处理工作,显著降低设备故障发生率以及设备故障处理的工作量,减轻了设备管理人员的压力,提升了用户体验;将计算机程序应用于日常保障方面,解放生产力降本增效,同时也带来了不断自动提高计算机程序取代人类进行日常保障可信度的可能性。
本发明实施例还提供一种计算机设备,图5为本发明实施例中计算机设备的示意图,该计算机设备能够实现上述实施例中的基于机器学习的设备故障处理方法中全部步骤,该计算机设备具体包括如下内容:
处理器(processor)501、存储器(memory)502、通信接口(CommunicationsInterface)503和通信总线504;
其中,所述处理器501、存储器502、通信接口503通过所述通信总线504完成相互间的通信;所述通信接口503用于实现相关设备之间的信息传输;
所述处理器501用于调用所述存储器502中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的基于机器学习的设备故障处理方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于机器学习的设备故障处理方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述基于机器学习的设备故障处理方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种基于机器学习的设备故障处理方法,其特征在于,所述方法包括:
接收实时设备数据,其中,设备数据包括设备记录数据、通过采集装置采集的设备数据、用户行为数据和设备人为报修数据;
将实时设备数据分别输入预先构建的故障预防模型、故障极早期处理模型和故障智能处理模型中,进行异常场景识别,所述故障预防模型、故障极早期处理模型和故障智能处理模型基于机器学习模型构建,对应识别设备由轻微到严重的不同异常场景;
当故障预防模型、故障极早期处理模型或故障智能处理模型识别得到异常场景时,利用与异常场景对应的预设处理措施对相应设备进行故障处理。
2.根据权利要求1所述的方法,其特征在于,设备记录数据包括设备型号、日志信息、设备硬件运行信息、设备软件运行信息和操作系统运行信息,所述设备硬件运行信息包括内存运行信息、硬盘运行信息和CPU运行信息;通过采集装置采集的设备数据包括设备的温度、风扇运行速度、声音信息、电压和网线是否松动;用户行为数据包括用户的个人信息、抱怨声音、工作骤停状态信息、反复尝试运行状态信息、拍打鼠标行为以及拍打键盘行为。
3.根据权利要求1或2所述的方法,其特征在于,在将实时设备数据分别输入预先构建的故障预防模型、故障极早期处理模型和故障智能处理模型中,进行异常场景识别之前,所述方法还包括:
获取历史设备数据,接收开发人员对于历史设备数据的分类,以及设置的每一类历史设备数据中各项数据对应的历史异常场景,其中,各类历史设备数据分别对应故障预防阶段的历史设备数据、故障极早期处理阶段的历史设备数据以及故障智能处理阶段的历史设备数据;
利用相应类的历史设备数据集对应的历史异常场景训练机器学习模型,得到故障预防模型、故障极早期处理模型和故障智能处理模型。
4.根据权利要求3所述的方法,其特征在于,所述故障预防阶段的历史设备数据包括设备记录数据、通过采集装置采集的设备数据和用户行为数据;所述故障极早期处理阶段的历史设备数据包括设备记录数据、通过采集装置采集的设备数据和用户行为数据;所述故障智能处理阶段的历史设备数据包括设备数据包括设备记录数据、通过采集装置采集的设备数据、用户行为数据和设备人为报修数据。
5.根据权利要求1所述的方法,其特征在于,在故障预防模型、故障极早期处理模型或故障智能处理模型识别得到异常场景之后,所述方法还包括:
每间隔预设时间段,将在间隔的时间段中故障预防模型、故障极早期处理模型及故障智能处理模型识别的异常场景,以及异常场景对应的设备数据输入预先构建的设备预警分析模型,得到设备预警分析结果;
展示所述设备预警分析结果;
其中,利用故障预防阶段、故障极早期处理阶段和故障智能处理阶段确定的历史异常场景及对应的历史设备数据对机器学习模型进行训练,得到所述设备预警分析模型。
6.一种基于机器学习的设备故障处理装置,其特征在于,所述装置包括:
通信模块,用于接收实时设备数据,其中,设备数据包括设备记录数据、通过采集装置采集的设备数据、用户行为数据和设备人为报修数据;
识别模块,用于将实时设备数据分别输入预先构建的故障预防模型、故障极早期处理模型和故障智能处理模型中,进行异常场景识别,所述故障预防模型、故障极早期处理模型和故障智能处理模型基于机器学习模型构建,对应识别设备由轻微到严重的不同异常场景;
故障处理模块,用于当故障预防模型、故障极早期处理模型或故障智能处理模型识别得到异常场景时,利用与异常场景对应的预设处理措施对相应设备进行故障处理。
7.根据权利要求6所述的装置,其特征在于,设备记录数据包括设备型号、日志信息、设备硬件运行信息、设备软件运行信息和操作系统运行信息,所述设备硬件运行信息包括内存运行信息、硬盘运行信息和CPU运行信息;通过采集装置采集的设备数据包括设备的温度、风扇运行速度、声音信息、电压和网线是否松动;用户行为数据包括用户的个人信息、抱怨声音、工作骤停状态信息、反复尝试运行状态信息、拍打鼠标行为以及拍打键盘行为。
8.根据权利要求6或7所述的装置,其特征在于,所述装置还包括:
获取模块,用于获取历史设备数据,接收开发人员对于历史设备数据的分类,以及设置的每一类历史设备数据中各项数据对应的历史异常场景,其中,各类历史设备数据分别对应故障预防阶段的历史设备数据、故障极早期处理阶段的历史设备数据以及故障智能处理阶段的历史设备数据;
模型训练模块,用于利用相应类的历史设备数据集对应的历史异常场景训练机器学习模型,得到故障预防模型、故障极早期处理模型和故障智能处理模型。
9.根据权利要求8所述的装置,其特征在于,所述故障预防阶段的历史设备数据包括设备记录数据、通过采集装置采集的设备数据和用户行为数据;所述故障极早期处理阶段的历史设备数据包括设备记录数据、通过采集装置采集的设备数据和用户行为数据;所述故障智能处理阶段的历史设备数据包括设备数据包括设备记录数据、通过采集装置采集的设备数据、用户行为数据和设备人为报修数据。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
预警分析模块,用于每间隔预设时间段,将在间隔的时间段中故障预防模型、故障极早期处理模型及故障智能处理模型识别的异常场景,以及异常场景对应的设备数据输入预先构建的设备预警分析模型,得到设备预警分析结果;
展示模块,用于展示所述设备预警分析结果;
其中,利用故障预防阶段、故障极早期处理阶段和故障智能处理阶段确定的历史异常场景及对应的历史设备数据对机器学习模型进行训练,得到所述设备预警分析模型。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一所述方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至5任一所述方法。
13.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至5任一所述方法。
CN202210401951.4A 2022-04-18 2022-04-18 基于机器学习的设备故障处理方法及装置 Pending CN114722715A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210401951.4A CN114722715A (zh) 2022-04-18 2022-04-18 基于机器学习的设备故障处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210401951.4A CN114722715A (zh) 2022-04-18 2022-04-18 基于机器学习的设备故障处理方法及装置

Publications (1)

Publication Number Publication Date
CN114722715A true CN114722715A (zh) 2022-07-08

Family

ID=82243390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210401951.4A Pending CN114722715A (zh) 2022-04-18 2022-04-18 基于机器学习的设备故障处理方法及装置

Country Status (1)

Country Link
CN (1) CN114722715A (zh)

Similar Documents

Publication Publication Date Title
EP3798846B1 (en) Operation and maintenance system and method
CN111209131B (zh) 一种基于机器学习确定异构系统的故障的方法和系统
US20190228296A1 (en) Significant events identifier for outlier root cause investigation
CN107301119B (zh) 利用时序相关性进行it故障根因分析的方法及装置
CN112152830A (zh) 一种智能的故障根因分析方法及系统
CN111625428A (zh) 监控Java应用程序运行状态的方法、系统、设备和存储介质
CN108665237B (zh) 一种基于业务系统建立自动巡检模型和定位异常的方法
CN113516244A (zh) 一种智能运维方法、装置、电子设备及存储介质
CN113887749A (zh) 基于云边协同的电力物联网多维度监控处置方法、设备及平台
CN110704313B (zh) Java虚拟机内存泄漏检测方法及装置
CN112988843B (zh) 一种基于SQL Server数据库的SMT贴片机故障管理及诊断系统
CN113468022B (zh) 一种对产品集中监控的自动化运维方法
CN117220917A (zh) 一种基于云计算的网络实时监控方法
CN117391675A (zh) 一种数据中心基础设施运维管理方法
CN114722715A (zh) 基于机器学习的设备故障处理方法及装置
WO2023181241A1 (ja) 監視サーバ装置、システム、方法、及びプログラム
CN116468423A (zh) 一种运维应急协同方法、系统和终端设备
CN115827318A (zh) 数据中心的异常处理方法、装置、电子设备及介质
CN113285824B (zh) 一种监控网络配置命令安全性的方法及装置
CN113805564A (zh) 一种基于cep的设备故障预警以及诊断系统
CN113037550B (zh) 一种服务故障监控方法、系统及计算机可读存储介质
CN118193959B (zh) 一种电涌能量的监测方法及系统
CN117930819A (zh) 基于人工智能的工控机行为分析与异常检测系统
CN117724882A (zh) 热泵机器的工单生成方法、装置、设备及存储介质
CN118262284A (zh) 一种基于深度学习的施工现场违章智能识别系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination