CN114579380B - 一种计算机系统故障的人工智能检测系统及方法 - Google Patents

一种计算机系统故障的人工智能检测系统及方法 Download PDF

Info

Publication number
CN114579380B
CN114579380B CN202210198471.2A CN202210198471A CN114579380B CN 114579380 B CN114579380 B CN 114579380B CN 202210198471 A CN202210198471 A CN 202210198471A CN 114579380 B CN114579380 B CN 114579380B
Authority
CN
China
Prior art keywords
fault
probability
module
computer
hardware
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210198471.2A
Other languages
English (en)
Other versions
CN114579380A (zh
Inventor
刘影
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang China Commodity City Group Co ltd
Original Assignee
Zhejiang China Commodity City Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang China Commodity City Group Co ltd filed Critical Zhejiang China Commodity City Group Co ltd
Priority to CN202210198471.2A priority Critical patent/CN114579380B/zh
Publication of CN114579380A publication Critical patent/CN114579380A/zh
Application granted granted Critical
Publication of CN114579380B publication Critical patent/CN114579380B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明公开了一种计算机系统故障的人工智能检测系统及方法,属于人工智能检测技术领域。该系统包括计算机数据采集模块、故障分析模块、概率测算模块、维修模块;所述计算机数据采集模块的输出端与所述故障分析模块的输入端相连接;所述故障分析模块的输出端与所述概率测算模块的输入端相连接;所述概率测算模块的输出端与所述维修模块的输入端相连接;同时本发明还提供一种计算机系统故障的人工智能检测方法,能够提供计算机系统故障的精确分析,在维修人员进行诊断时,以人工智能的方式,不过多依赖人工经验或者多项实验,能够提高故障诊断效率。

Description

一种计算机系统故障的人工智能检测系统及方法
技术领域
本发明涉及人工智能检测技术领域,具体为一种计算机系统故障的人工智能检测系统及方法。
背景技术
计算机系统故障是指系统在运行过程中,由于某种原因,以致事务在执行过程中以非正常的方式终止。按故障的部件可将故障分为硬件故障和软件故障。硬件故障是指故障因硬件系统失效。软件故障是指程序运行一些非法指令,如特权指令等等。
随着科学技术的发展,计算机系统的规模和复杂程度都在日益提高,一旦规模较大或较为复杂的系统发生故障,就可能带来重大的财产损失和人员伤亡。因此对于计算机系统故障的处理与检测,如何提高系统在运行中的安全性与可靠性,是目前亟待解决的问题之一。在目前的技术手段中,往往采用多种方法逐一排查,对计算机系统故障进行诊断分析,最终判断故障发生的时间、位置、大小和种类等情况,即完成故障检测、分离和估计。
然而,在计算机系统故障的判断过程中,多依赖人工经验或者多项实验,在确定故障的过程中耗费时间较长,缺乏能够提高故障诊断效率的手段。
发明内容
本发明的目的在于提供一种计算机系统故障的人工智能检测系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:
一种计算机系统故障的人工智能检测方法,该方法包括以下步骤:
S1、获取计算机最后一次运行的软件程序数据,获取计算机工作环境数据;
S2、构建系统故障预测模型,确定计算机系统故障类别,所述计算机系统故障类别包括硬件故障与软件故障;
S3、对计算机系统故障的各硬件故障概率与各软件故障概率计算分析;
S4、获取概率数据,按照从大到小的顺序进行排序,发送至维修端口,维修人员可根据概率数据顺序进行测试维修。
计算机硬件故障一般指内存、硬盘、CPU等硬件因为某种原因出现使用不正常,功能失效从而使计算机不能正常使用的现象。这种现象一般由硬件自身质量问题或使用不当等原因造成。软件故障是指安装在计算机中的操作系统或者软件发生错误而引起的故障。
构建硬件故障类型集合A=k1、k2、…、km;其中k1、k2、…、km分别代表硬件故障中的一种;
获取计算机使用环境因素;
在使用环境因素中进行选择,选择与硬件故障相关系数高的环境因素作为硬件故障预测模型训练特征;
所述硬件故障预测模型训练特征包括:环境温度、环境湿度、环境静电程度、环境洁净度、计算机使用按键个性化按压力度;
计算机的硬件故障一般是由于计算机电源损坏或者主板、硬盘等设备的供电线路损坏使之不能加电,导致计算机无法正常启动;芯片的针脚损坏、接触不良、或者因温度过热而使计算机无法正常工作等等,一般与计算机的使用环境与使用方式相关,例如在高静电或高温度的条件下,计算机供电电路容易出现短路、高温断路等现象;计算机使用按键个性化按压力度一般指对于计算机的按键进行按压的力度,例如电源按键,每个人的使用方式不同,其电源按键的使用寿命与日常的使用时密切相关的,长期的大力按压也容易造成内部芯片的损坏。
设置硬件故障k0;k0代表任一硬件故障;
以故障预测时间为因变量,所述故障预测时间为硬件故障k0的预测时间;以环境温度、环境湿度、环境静电程度、环境洁净度、计算机使用按键个性化按压力度为自变量,构建第一预测模型:
其中,u0、u1、u2、u3、u4、u5为第一预测模型的回归系数,为误差因子,用于表达计算机异常使用操作对于故障预测时间的影响情况;c1、c2、c3、c4、c5代表环境温度、环境湿度、环境静电程度、环境洁净度、计算机使用按键个性化按压力度;t0代表故障预测时间;
本申请中,故障预测时间一般设置为一个区间,即以公式中得出的故障预测时间为起点,自定义设置一个时间区间,例如故障预测时间为120,设置时间区间为p,则故障预测时间为[120,120+p];
利用集成学习思想对第一预测模型进行处理:
获取故障预测时间作为预测值,获取实际故障时间作为实际值,获取β个数据样本,β为可设置常数,对预测值符合实际值的数据样本定义为高样本,对预测值不符合实际值的数据样本定义为低样本;
本技术方案,即是通过不断迭代,使得获取的数据样本中的低样本数量逐渐减少,从而达到提高数据精度。
所述数据样本中包括计算机使用数据,所述计算机使用数据包括计算机使用环境因素数据与计算机系统故障数据;
构建硬件故障预测模型:
构建损失函数L(y,f(x)),以均方差函数作为损失函数,设置最大迭代次数T和回归树的最大深度;f(x)为第一预测模型;
初始化一个使损失函数最小的弱学习器f0
迭代训练弱学习器;
对每一个数据样本i,分别计算其负梯度rti
利用负梯度rti拟合一棵回归树,得到第t棵回归树,其对应的叶子结点区域为Rtj;xi为数据样本取值,yi为xi对应的损失函数;f(x)=ft-1(x)表示在本轮计算中的f(x)使用的是上一轮强学习器ft-1(x)下的第一预测模型;t表示迭代次数;指微分;
计算最佳拟合值ctj
其中,i、j为标号,取值都是1~β;c为损失函数后面加的常数;
所述最佳拟合值指在每一个叶子结点区域里的样本中使损失函数最小的输出值,即拟合叶子结点区域最好的输出值;
将弱学习器加入到已经训练完成的模型中,得到新的强学习器:
其中,I用于与ctj组合,表示本轮的决策树拟合函数;J表示叶子区域;
ft(x)代表第t轮迭代得出的强学习器;
循环完成后,得到最终的强学习器作为新的预测模型,即硬件故障预测模型,其输出硬件故障k0的预测时间。
利用集成学习的方式能够不断提高预测精度,在每个节点(不一定是叶子节点)都会得到一个预测值,但衡量最好的标准不是最大熵,而是最小化均方差,即误差平方和除以N。预测的错误率越高,均方差越大,通过最小化均方差能够找到最靠谱的分支依据。分支直到每个叶子节点上都唯一或者达到预设的终止条件(即设置的迭代次数)即可结束,得到的最终预测模型,即为通过集成学习不断加深精度后的模型。
根据上述技术方案,根据计算机使用数据与硬件故障预测模型,获取计算机的各个硬件故障的预测时间,在计算机系统故障时,获取计算机工作时间,构建硬件故障概率公式:
P0=|v0-l0|*e0
其中,P0为对应l0的硬件故障的概率,v0为计算机工作时间,l0为任一硬件故障预测时间,e0为影响因子,正值;
设置概率阈值为Pmax,若存在任一项P0超出概率阈值,即表明计算机系统存在硬件故障。
根据上述技术方案,获取计算机系统故障中软件故障时计算机的最后一次使用操作记录,分别记为a1、a2、…、an;其中a1、a2、…、an代表在计算机的最后一次使用操作记录中的运行事务;
本文所述事务在计算机术语中是指访问并可能更新数据库中各种数据项的一个程序执行单元,由高级数据库操纵语言或编程语言(如SQL,C++或Java)书写的用户程序的执行所引起,并用形如begin transaction和end transaction语句(或函数调用)来界定。事务由事务开始(begin transaction)和事务结束(end transaction)之间执行的全体操作组成。
获取每一项软件故障下计算机的最后一次使用操作记录中的各运行事务出现的频率,将出现频率为100%的运行事务记为必要运行事务;
在软件故障的必要运行事务中,例如计算机病毒引起的软件故障,一般其存在的必要运行事务为“下载”,通常计算机感染病毒,均是由于机主登录异常网页、接收下载异常文件所导致的;又例如误操作引起的软件故障,例如执行命令误操作是指执行了不该使用的命令,例如,系统运行时必须用到的文件(如后缀为ini或dll的文件),如果删除了这些文件,将会导致系统不能正常运行;那么这些事务必然是在上一次运行过程中造成了误删除,因此这一类事务一般为必要运行事务。
构建软件故障m0概率公式,其中m0为任一软件故障:
其中,P1为软件故障m0的概率;e1为必要运行事务影响因子,正值;e2为其他运行事务影响因子,负值;s1指计算机的最后一次使用操作记录中的存在的软件故障m0的必要运行事务的数量;d1指软件故障m0的必要运行事务的数量;s2指计算机的最后一次使用操作记录中除去s1的其他运行事务的数量。
在上述软件故障的计算过程中,必要运行事务的影响权重是较大的,一般情况下,均为1,因为一旦发生软件故障,大多数情况其所存在的必要运行事务均是在上一次运行过程中操作过的,而由于计算机每一次运行的事务较多,而必要运行事务又存在覆盖的情况,例如一软件故障的必要运行事务为a1、a2、a3;另一软件故障的必要运行事务为a1、a2;则在计算过程中,存在较少的必要运行事务的软件故障概率是较低的,因为限制条件越少,其所代表的概率越低;另外在两次计算机运行过程中,若第一次的运行事务远大于第二次的运行事务数量,即便两次中均存在同一软件故障的必要运行事务,但其他事务的数量不同,即s2是不同的,第一次的s2远大于第二次的,那么在运行事务更多的情况下,就有可能出现新的未发现的软件故障问题,因此整体的软件故障概率是偏低的,因此设置有e2,以减函数的方式平衡概率。
根据上述技术方案,硬件故障的优先级高于软件故障,即在判断过程中,若满足硬件故障条件优先判断为硬件故障,并按照概率从大到小的顺序输出至维修人员端口;
输出硬件故障概率后,再获取软件故障概率,并按照概率从大到小的顺序输出至维修人员端口。
一种计算机系统故障的人工智能检测系统,该系统包括计算机数据采集模块、故障分析模块、概率测算模块、维修模块;
所述计算机数据采集模块用于采集获取计算机最后一次运行的软件程序数据,采集计算机工作环境数据;所述故障分析模块用于构建系统故障预测模型,确定计算机系统故障类别,所述计算机系统故障类别包括硬件故障与软件故障;所述概率测算模块用于对计算机系统故障的各硬件故障概率与各软件故障概率计算分析;所述维修模块用于获取概率数据,按照从大到小的顺序进行排序,发送至维修端口,维修人员可根据概率数据顺序进行测试维修;
所述计算机数据采集模块的输出端与所述故障分析模块的输入端相连接;所述故障分析模块的输出端与所述概率测算模块的输入端相连接;所述概率测算模块的输出端与所述维修模块的输入端相连接。
根据上述技术方案,所述计算机数据采集模块包括软件程序监测子模块、环境数据采集子模块;
所述软件程序监测子模块用于获取计算机最后一次运行的软件程序数据;所述环境数据采集子模块用于采集计算机工作环境数据;
所述软件程序监测子模块的输出端与所述环境数据采集子模块的输入端相连接;所述环境数据采集子模块的输出端与所述故障分析模块的输入端相连接。
根据上述技术方案,所述故障分析模块包括硬件故障分析子模块、软件故障分析子模块;
所述硬件故障分析子模块用于对计算机系统故障的类别进行判断是否为硬件故障;所述软件故障分析子模块用于对计算机系统故障的类别进行判断是否为软件故障;
所述硬件故障分析子模块与软件故障分析子模块的输出端均连接至概率测算模块的输入端。
根据上述技术方案,所述概率测算模块包括硬件故障概率测算子模块、软件故障概率测算子模块;
所述硬件故障概率测算子模块用于在计算机系统故障为硬件故障时,对各个硬件故障的概率进行分析;所述软件故障概率测算子模块用于在计算机系统故障为软件故障时,对各个软件故障的概率进行分析;
所述硬件故障概率测算子模块与软件故障概率测算子模块的输出端均连接至维修模块的输入端。
根据上述技术方案,所述维修模块包括概率排序子模块、维修模块;
所述概率排序子模块用于对计算机系统故障的概率进行排序,并输出至维修模块;所述维修模块用于维修人员进行系统故障的测试维修。
与现有技术相比,本发明所达到的有益效果是:
本发明设置了计算机数据采集模块用于采集获取计算机最后一次运行的软件程序数据,采集计算机工作环境数据;利用故障分析模块构建系统故障预测模型,确定计算机系统故障类别;利用概率测算模块对计算机系统故障的各硬件故障概率与各软件故障概率计算分析;利用维修模块获取概率数据,按照从大到小的顺序进行排序,发送至维修端口,维修人员可根据概率数据顺序进行测试维修;以人工智能的手段进行系统故障的分析,并通过梯度提升的方式,以集成学习的思想提高系统精度,同时能够输出预测系统故障的概率,在维修人员进行维修时,提供高效的测试顺序,有效降低人工经验的依赖性,提高检测效率。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种计算机系统故障的人工智能检测系统及方法的流程示意图;
图2是本发明一种计算机系统故障的人工智能检测方法的步骤示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-图2,本发明提供技术方案:
一种计算机系统故障的人工智能检测方法,该方法包括以下步骤:
S1、获取计算机最后一次运行的软件程序数据,获取计算机工作环境数据;
S2、构建系统故障预测模型,确定计算机系统故障类别,所述计算机系统故障类别包括硬件故障与软件故障;
S3、对计算机系统故障的各硬件故障概率与各软件故障概率计算分析;
S4、获取概率数据,按照从大到小的顺序进行排序,发送至维修端口,维修人员可根据概率数据顺序进行测试维修。
构建硬件故障类型集合A=k1、k2、…、km;其中k1、k2、…、km分别代表硬件故障中的一种;
获取计算机使用环境因素;
在使用环境因素中进行选择,选择与硬件故障相关系数高的环境因素作为硬件故障预测模型训练特征;
所述硬件故障预测模型训练特征包括:环境温度、环境湿度、环境静电程度、环境洁净度、计算机使用按键个性化按压力度;
设置硬件故障k0;k0代表任一硬件故障;
以故障预测时间为因变量,所述故障预测时间为硬件故障k0的预测时间;以环境温度、环境湿度、环境静电程度、环境洁净度、计算机使用按键个性化按压力度为自变量,构建第一预测模型:
其中,u0、u1、u2、u3、u4、u5为第一预测模型的回归系数,为误差因子,用于表达计算机异常使用操作对于故障预测时间的影响情况;c1、c2、c3、c4、c5代表环境温度、环境湿度、环境静电程度、环境洁净度、计算机使用按键个性化按压力度;t0代表故障预测时间;
利用集成学习思想对第一预测模型进行处理:
获取故障预测时间作为预测值,获取实际故障时间作为实际值,获取β个数据样本,β为可设置常数,对预测值符合实际值的数据样本定义为高样本,对预测值不符合实际值的数据样本定义为低样本;
所述数据样本中包括计算机使用数据,所述计算机使用数据包括计算机使用环境因素数据与计算机系统故障数据;
构建硬件故障预测模型:
构建损失函数L(y,f(x)),以均方差函数作为损失函数,设置最大迭代次数T和回归树的最大深度;f(x)为第一预测模型;
初始化一个使损失函数最小的弱学习器f0
迭代训练弱学习器;
对每一个数据样本i,分别计算其负梯度rti
利用负梯度rti拟合一棵回归树,得到第t棵回归树,其对应的叶子结点区域为Rtj;xi为数据样本取值,yi为xi对应的损失函数;f(x)=ft-1(x)表示在本轮计算中的f(x)使用的是上一轮强学习器ft-1(x)下的第一预测模型;t表示迭代次数;指微分;
计算最佳拟合值ctj
其中,i、j为标号,取值都是1~β;c为损失函数后面加的常数;
所述最佳拟合值指在每一个叶子结点区域里的样本中使损失函数最小的输出值,即拟合叶子结点区域最好的输出值;
将弱学习器加入到已经训练完成的模型中,得到新的强学习器:
其中,I用于与ctj组合,表示本轮的决策树拟合函数;J表示叶子区域;
ft(x)代表第t轮迭代得出的强学习器;
循环完成后,得到最终的强学习器作为新的预测模型,即硬件故障预测模型,其输出硬件故障k0的预测时间。
根据计算机使用数据与硬件故障预测模型,获取计算机的各个硬件故障的预测时间,在计算机系统故障时,获取计算机工作时间,构建硬件故障概率公式:
P0=|v0-l0|*e0
其中,P0为对应l0的硬件故障的概率,v0为计算机工作时间,l0为任一硬件故障预测时间,e0为影响因子,正值;
设置概率阈值为Pmax,若存在任一项P0超出概率阈值,即表明计算机系统存在硬件故障。
获取计算机系统故障中软件故障时计算机的最后一次使用操作记录,分别记为a1、a2、…、an;其中a1、a2、…、an代表在计算机的最后一次使用操作记录中的运行事务;
获取每一项软件故障下计算机的最后一次使用操作记录中的各运行事务出现的频率,将出现频率为100%的运行事务记为必要运行事务;
构建软件故障m0概率公式,其中m0为任一软件故障:
其中,P1为软件故障m0的概率;e1为必要运行事务影响因子,正值;e2为其他运行事务影响因子,负值;s1指计算机的最后一次使用操作记录中的存在的软件故障m0的必要运行事务的数量;d1指软件故障m0的必要运行事务的数量;s2指计算机的最后一次使用操作记录中除去s1的其他运行事务的数量。
硬件故障的优先级高于软件故障,即在判断过程中,若满足硬件故障条件优先判断为硬件故障,并按照概率从大到小的顺序输出至维修人员端口;
输出硬件故障概率后,再获取软件故障概率,并按照概率从大到小的顺序输出至维修人员端口。
一种计算机系统故障的人工智能检测系统,该系统包括计算机数据采集模块、故障分析模块、概率测算模块、维修模块;
所述计算机数据采集模块用于采集获取计算机最后一次运行的软件程序数据,采集计算机工作环境数据;所述故障分析模块用于构建系统故障预测模型,确定计算机系统故障类别,所述计算机系统故障类别包括硬件故障与软件故障;所述概率测算模块用于对计算机系统故障的各硬件故障概率与各软件故障概率计算分析;所述维修模块用于获取概率数据,按照从大到小的顺序进行排序,发送至维修端口,维修人员可根据概率数据顺序进行测试维修;
所述计算机数据采集模块的输出端与所述故障分析模块的输入端相连接;所述故障分析模块的输出端与所述概率测算模块的输入端相连接;所述概率测算模块的输出端与所述维修模块的输入端相连接。
所述计算机数据采集模块包括软件程序监测子模块、环境数据采集子模块;
所述软件程序监测子模块用于获取计算机最后一次运行的软件程序数据;所述环境数据采集子模块用于采集计算机工作环境数据;
所述软件程序监测子模块的输出端与所述环境数据采集子模块的输入端相连接;所述环境数据采集子模块的输出端与所述故障分析模块的输入端相连接。
所述故障分析模块包括硬件故障分析子模块、软件故障分析子模块;
所述硬件故障分析子模块用于对计算机系统故障的类别进行判断是否为硬件故障;所述软件故障分析子模块用于对计算机系统故障的类别进行判断是否为软件故障;
所述硬件故障分析子模块与软件故障分析子模块的输出端均连接至概率测算模块的输入端。
所述概率测算模块包括硬件故障概率测算子模块、软件故障概率测算子模块;
所述硬件故障概率测算子模块用于在计算机系统故障为硬件故障时,对各个硬件故障的概率进行分析;所述软件故障概率测算子模块用于在计算机系统故障为软件故障时,对各个软件故障的概率进行分析;
所述硬件故障概率测算子模块与软件故障概率测算子模块的输出端均连接至维修模块的输入端。
所述维修模块包括概率排序子模块、维修模块;
所述概率排序子模块用于对计算机系统故障的概率进行排序,并输出至维修模块;所述维修模块用于维修人员进行系统故障的测试维修。
在本实施例中:
构建硬件故障类型集合A=k1、k2、…、km;其中k1、k2、…、km分别代表硬件故障中的一种;
以故障预测时间为因变量,所述故障预测时间为硬件故障k0的预测时间;以环境温度、环境湿度、环境静电程度、环境洁净度、计算机使用按键个性化按压力度为自变量,构建第一预测模型:
其中,u0、u1、u2、u3、u4、u5为第一预测模型的回归系数,为误差因子,用于表达计算机异常使用操作对于故障预测时间的影响情况;c1、c2、c3、c4、c5代表环境温度、环境湿度、环境静电程度、环境洁净度、计算机使用按键个性化按压力度;t0代表故障预测时间;
利用集成学习思想对第一预测模型进行处理:
获取故障预测时间作为预测值,获取实际故障时间作为实际值,获取β个数据样本,β为可设置常数,对预测值符合实际值的数据样本定义为高样本,对预测值不符合实际值的数据样本定义为低样本;
所述数据样本中包括计算机使用数据,所述计算机使用数据包括计算机使用环境因素数据与计算机系统故障数据;
构建硬件故障预测模型:
构建损失函数L(y,f(x)),以均方差函数作为损失函数,设置最大迭代次数T和回归树的最大深度;f(x)为第一预测模型;
初始化一个使损失函数最小的弱学习器f0
迭代训练弱学习器;
对每一个数据样本i,分别计算其负梯度rti
利用负梯度rti拟合一棵回归树,得到第t棵回归树,其对应的叶子结点区域为Rtj;xi为数据样本取值,yi为xi对应的损失函数;f(x)=ft-1(x)表示在本轮计算中的f(x)使用的是上一轮强学习器ft-1(x)下的第一预测模型;t表示迭代次数;指微分;
计算最佳拟合值ctj
其中,i、j为标号,取值都是1~β;c为损失函数后面加的常数;
所述最佳拟合值指在每一个叶子结点区域里的样本中使损失函数最小的输出值,即拟合叶子结点区域最好的输出值;
将弱学习器加入到已经训练完成的模型中,得到新的强学习器:
其中,I用于与ctj组合,表示本轮的决策树拟合函数;J表示叶子区域;
ft(x)代表第t轮迭代得出的强学习器;
循环完成后,得到最终的强学习器作为新的预测模型,即硬件故障预测模型,其输出硬件故障k0的预测时间。
根据计算机使用数据与硬件故障预测模型,获取计算机的各个硬件故障的预测时间,在计算机系统故障时,获取计算机工作时间,构建硬件故障概率公式:
P0=|v0-l0|*e0
其中,P0为对应l0的硬件故障的概率,v0为计算机工作时间,l0为任一硬件故障预测时间,e0为影响因子,正值;
设置概率阈值为Pmax,发现存在两项硬件故障概率超出概率阈值,即表明计算机系统存在硬件故障,并将硬件故障概率按照顺序输出至维修端口。
获取计算机系统故障中软件故障时计算机的最后一次使用操作记录,分别记为a1、a2、…、an;其中a1、a2、…、an代表在计算机的最后一次使用操作记录中的运行事务;
获取每一项软件故障下计算机的最后一次使用操作记录中的各运行事务出现的频率,将出现频率为100%的运行事务记为必要运行事务;
构建软件故障m0概率公式,其中m0为任一软件故障:
其中,P1为软件故障m0的概率;e1为必要运行事务影响因子,正值;e2为其他运行事务影响因子,负值;s1指计算机的最后一次使用操作记录中的存在的软件故障m0的必要运行事务的数量;d1指软件故障m0的必要运行事务的数量;s2指计算机的最后一次使用操作记录中除去s1的其他运行事务的数量。
将获得的软件故障的概率按照顺序输出,排在硬件故障后面。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种计算机系统故障的人工智能检测方法,其特征在于:该方法包括以下步骤:
S1、获取计算机最后一次运行的软件程序数据,获取计算机工作环境数据;
S2、构建系统故障预测模型,确定计算机系统故障类别,所述计算机系统故障类别包括硬件故障与软件故障;
S3、对计算机系统故障的各硬件故障概率与各软件故障概率计算分析;
S4、获取概率数据,按照从大到小的顺序进行排序,发送至维修端口,维修人员可根据概率数据顺序进行测试维修;
构建硬件故障类型集合A=k1、k2、…、km;其中k1、k2、…、km分别代表硬件故障中的一种;
获取计算机使用环境因素;
在使用环境因素中进行选择,选择与硬件故障相关系数高的环境因素作为硬件故障预测模型训练特征;
所述硬件故障预测模型训练特征包括:环境温度、环境湿度、环境静电程度、环境洁净度、计算机使用按键个性化按压力度;
设置硬件故障k0;k0代表任一硬件故障;
以故障预测时间为因变量,所述故障预测时间为硬件故障k0的预测时间;以环境温度、环境湿度、环境静电程度、环境洁净度、计算机使用按键个性化按压力度为自变量,构建第一预测模型:
其中,u0、u1、u2、u3、u4、u5为第一预测模型的回归系数,为误差因子,用于表达计算机异常使用操作对于故障预测时间的影响情况;c1、c2、c3、c4、c5代表环境温度、环境湿度、环境静电程度、环境洁净度、计算机使用按键个性化按压力度;t0代表故障预测时间;
利用集成学习思想对第一预测模型进行处理:
获取故障预测时间作为预测值,获取实际故障时间作为实际值,获取β个数据样本,β为可设置常数,对预测值符合实际值的数据样本定义为高样本,对预测值不符合实际值的数据样本定义为低样本;
所述数据样本中包括计算机使用数据,所述计算机使用数据包括计算机使用环境因素数据与计算机系统故障数据;
构建硬件故障预测模型:
构建损失函数L(y,f(x)),以均方差函数作为损失函数,设置最大迭代次数T和回归树的最大深度;f(x)为第一预测模型;
初始化一个使损失函数最小的弱学习器f0
迭代训练弱学习器;
对每一个数据样本i,分别计算其负梯度rti
利用负梯度rti拟合一棵回归树,得到第t棵回归树,其对应的叶子结点区域为Rtj;xi为数据样本取值,yi为xi对应的损失函数;f(x)=ft-1(x)表示在本轮计算中的f(x)使用的是上一轮强学习器ft-1(x)下的第一预测模型;t表示迭代次数;指微分;
计算最佳拟合值ctj
其中,i、j为标号,取值都是1~β;c为损失函数后面加的常数;
所述最佳拟合值指在每一个叶子结点区域里的样本中使损失函数最小的输出值,即拟合叶子结点区域最好的输出值;
将弱学习器加入到已经训练完成的模型中,得到新的强学习器:
其中,I用于与ctj组合,表示本轮的决策树拟合函数;J表示叶子区域;
ft(x)代表第t轮迭代得出的强学习器;
循环完成后,得到最终的强学习器作为新的预测模型,即硬件故障预测模型,其输出硬件故障k0的预测时间。
2.根据权利要求1所述的一种计算机系统故障的人工智能检测方法,其特征在于:根据计算机使用数据与硬件故障预测模型,获取计算机的各个硬件故障的预测时间,在计算机系统故障时,获取计算机工作时间,构建硬件故障概率公式:
P0=|v0-l0|*e0
其中,P0为对应l0的硬件故障的概率,v0为计算机工作时间,l0为任一硬件故障预测时间,e0为影响因子,正值;
设置概率阈值为Pmax,若存在任一项P0超出概率阈值,即表明计算机系统存在硬件故障。
3.根据权利要求2所述的一种计算机系统故障的人工智能检测方法,其特征在于:获取计算机系统故障中软件故障时计算机的最后一次使用操作记录,分别记为a1、a2、…、an;其中a1、a2、…、an代表在计算机的最后一次使用操作记录中的运行事务;
获取每一项软件故障下计算机的最后一次使用操作记录中的各运行事务出现的频率,将出现频率为100%的运行事务记为必要运行事务;
构建软件故障m0概率公式,其中m0为任一软件故障:
其中,P1为软件故障m0的概率;e1为必要运行事务影响因子,正值;e2为其他运行事务影响因子,负值;s1指计算机的最后一次使用操作记录中的存在的软件故障m0的必要运行事务的数量;d1指软件故障m0的必要运行事务的数量;s2指计算机的最后一次使用操作记录中除去s1的其他运行事务的数量。
4.根据权利要求3所述的一种计算机系统故障的人工智能检测方法,其特征在于:硬件故障的优先级高于软件故障,即在判断过程中,若满足硬件故障条件优先判断为硬件故障,并按照概率从大到小的顺序输出至维修人员端口;
输出硬件故障概率后,再获取软件故障概率,并按照概率从大到小的顺序输出至维修人员端口。
5.应用权利要求1所述的一种计算机系统故障的人工智能检测方法的一种计算机系统故障的人工智能检测系统,其特征在于:该系统包括计算机数据采集模块、故障分析模块、概率测算模块、维修模块;
所述计算机数据采集模块用于采集获取计算机最后一次运行的软件程序数据,采集计算机工作环境数据;所述故障分析模块用于构建系统故障预测模型,确定计算机系统故障类别,所述计算机系统故障类别包括硬件故障与软件故障;所述概率测算模块用于对计算机系统故障的各硬件故障概率与各软件故障概率计算分析;所述维修模块用于获取概率数据,按照从大到小的顺序进行排序,发送至维修端口,维修人员可根据概率数据顺序进行测试维修;
所述计算机数据采集模块的输出端与所述故障分析模块的输入端相连接;所述故障分析模块的输出端与所述概率测算模块的输入端相连接;所述概率测算模块的输出端与所述维修模块的输入端相连接。
6.根据权利要求5所述的一种计算机系统故障的人工智能检测系统,其特征在于:所述计算机数据采集模块包括软件程序监测子模块、环境数据采集子模块;
所述软件程序监测子模块用于获取计算机最后一次运行的软件程序数据;所述环境数据采集子模块用于采集计算机工作环境数据;
所述软件程序监测子模块的输出端与所述环境数据采集子模块的输入端相连接;所述环境数据采集子模块的输出端与所述故障分析模块的输入端相连接。
7.根据权利要求5所述的一种计算机系统故障的人工智能检测系统,其特征在于:所述故障分析模块包括硬件故障分析子模块、软件故障分析子模块;
所述硬件故障分析子模块用于对计算机系统故障的类别进行判断是否为硬件故障;所述软件故障分析子模块用于对计算机系统故障的类别进行判断是否为软件故障;
所述硬件故障分析子模块与软件故障分析子模块的输出端均连接至概率测算模块的输入端。
8.根据权利要求5所述的一种计算机系统故障的人工智能检测系统,其特征在于:所述概率测算模块包括硬件故障概率测算子模块、软件故障概率测算子模块;
所述硬件故障概率测算子模块用于在计算机系统故障为硬件故障时,对各个硬件故障的概率进行分析;所述软件故障概率测算子模块用于在计算机系统故障为软件故障时,对各个软件故障的概率进行分析;
所述硬件故障概率测算子模块与软件故障概率测算子模块的输出端均连接至维修模块的输入端。
9.根据权利要求5所述的一种计算机系统故障的人工智能检测系统,其特征在于:所述维修模块包括概率排序子模块、维修模块;
所述概率排序子模块用于对计算机系统故障的概率进行排序,并输出至维修模块;所述维修模块用于维修人员进行系统故障的测试维修。
CN202210198471.2A 2022-03-02 2022-03-02 一种计算机系统故障的人工智能检测系统及方法 Active CN114579380B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210198471.2A CN114579380B (zh) 2022-03-02 2022-03-02 一种计算机系统故障的人工智能检测系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210198471.2A CN114579380B (zh) 2022-03-02 2022-03-02 一种计算机系统故障的人工智能检测系统及方法

Publications (2)

Publication Number Publication Date
CN114579380A CN114579380A (zh) 2022-06-03
CN114579380B true CN114579380B (zh) 2023-10-17

Family

ID=81775706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210198471.2A Active CN114579380B (zh) 2022-03-02 2022-03-02 一种计算机系统故障的人工智能检测系统及方法

Country Status (1)

Country Link
CN (1) CN114579380B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115730815B (zh) * 2022-10-10 2024-06-14 江苏安胜达安全科技有限公司 基于物联感知的工业生产安全风险预警系统及方法
CN115860718B (zh) * 2022-12-02 2023-07-25 深圳市黑金工业制造有限公司 一种基于大数据的触摸一体机综合维护管理系统及方法
CN115830757B (zh) * 2022-12-02 2023-11-17 江苏锦花电子股份有限公司 一种基于大数据的显示设备性能监测系统及方法
CN116069590B (zh) * 2023-01-09 2023-10-24 甘肃昊润科技信息有限公司 一种基于人工智能的计算机数据安全监测系统及方法
CN116155627B (zh) * 2023-04-20 2023-11-03 深圳市黑金工业制造有限公司 一种基于互联网的显示屏访问数据管理系统及方法
CN116434685B (zh) * 2023-04-27 2023-12-08 江苏锦花电子股份有限公司 一种基于大数据的液晶屏异常显示监管系统及方法
CN116628561B (zh) * 2023-07-25 2023-09-29 江苏嘉杨机电配件有限公司 一种电子水泵智能测试系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2327319A1 (en) * 2000-11-30 2002-05-30 Breakpoint Systems Inc. Method and apparatus for monitoring computer hardware
CN107392258A (zh) * 2017-08-04 2017-11-24 合肥工业大学 一种设备故障元件排查方法及系统
CN110795260A (zh) * 2019-09-10 2020-02-14 武汉攀升鼎承科技有限公司 一种智能客户关怀系统
CN111523718A (zh) * 2020-04-16 2020-08-11 广东电网有限责任公司 基于人工智能的线路故障预测方法、系统及其存储介质
CN111796956A (zh) * 2020-06-22 2020-10-20 深圳壹账通智能科技有限公司 分布式系统故障诊断方法、装置、设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8694836B2 (en) * 2010-01-27 2014-04-08 Telcordia Technologies, Inc. Fault diagnosis employing probabilistic models and statistical learning

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2327319A1 (en) * 2000-11-30 2002-05-30 Breakpoint Systems Inc. Method and apparatus for monitoring computer hardware
CN107392258A (zh) * 2017-08-04 2017-11-24 合肥工业大学 一种设备故障元件排查方法及系统
CN110795260A (zh) * 2019-09-10 2020-02-14 武汉攀升鼎承科技有限公司 一种智能客户关怀系统
CN111523718A (zh) * 2020-04-16 2020-08-11 广东电网有限责任公司 基于人工智能的线路故障预测方法、系统及其存储介质
CN111796956A (zh) * 2020-06-22 2020-10-20 深圳壹账通智能科技有限公司 分布式系统故障诊断方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN114579380A (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
CN114579380B (zh) 一种计算机系统故障的人工智能检测系统及方法
CN111459700B (zh) 设备故障的诊断方法、诊断装置、诊断设备及存储介质
US8650137B2 (en) Method and apparatus for creating state estimation models in machine condition monitoring
CN113852603B (zh) 网络流量的异常检测方法、装置、电子设备和可读介质
CN114707234B (zh) 一种基于贝叶斯深度学习的航空发动机剩余寿命预测方法
WO2021174812A1 (zh) 用于画像的数据的清洗方法、装置、介质及电子设备
CN109784528A (zh) 基于时间序列和支持向量回归的水质预测方法及装置
CN110570544A (zh) 飞机燃油系统故障识别方法、装置、设备和存储介质
CN117094184B (zh) 基于内网平台的风险预测模型的建模方法、系统及介质
CN117992743A (zh) 一种基于知识图谱的电网故障智能分析与处置方法及系统
CN116910559A (zh) 一种面向电网超算中心智能运维应用的指标异常检测方法
CN117972596B (zh) 一种基于操作日志的风险预测方法
CN109726736A (zh) 训练电梯抱闸故障诊断模型、抱闸故障诊断的方法及系统
CN113158448A (zh) 一种船舶系统设备阈值的自适应计算方法
CN116384223A (zh) 基于退化状态智能辨识的核设备可靠性评估方法及系统
US12066910B2 (en) Reinforcement learning based group testing
Zeileis et al. party with the mob: Model-Based Recursive Partitioning in R
CN117973285B (zh) 一种后硅电路异常的深度测试方法、装置及计算设备
CN115116594B (zh) 医疗装置有效性的检测方法及装置
CN116149899A (zh) 获取平台故障成因的方法及平台故障自动检查处置方法
CN118655488A (zh) 一种电源故障检测系统及方法
CN117667697A (zh) 一种基于深度学习的软件质量评估方法
CN118094352A (zh) 设备的故障类型的确定方法、装置、存储介质及电子设备
CN117632747A (zh) 基于度惩罚的知识图谱补全模型缺陷检测方法和装置
CN116559710A (zh) 电池状态检测方法、装置、系统、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230918

Address after: Ocean Business Building, No. 105 Futian Road, Yiwu City, Jinhua City, Zhejiang Province, 322000

Applicant after: Zhejiang China Commodity City Group Co.,Ltd.

Address before: 235000 building 11, central Huacheng North District, Xiangnan street, Xiangshan District, Huaibei City, Anhui Province

Applicant before: Huaibei Shiou Network Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant