CN109491844B - 一种识别异常信息的计算机系统 - Google Patents

一种识别异常信息的计算机系统 Download PDF

Info

Publication number
CN109491844B
CN109491844B CN201811105166.4A CN201811105166A CN109491844B CN 109491844 B CN109491844 B CN 109491844B CN 201811105166 A CN201811105166 A CN 201811105166A CN 109491844 B CN109491844 B CN 109491844B
Authority
CN
China
Prior art keywords
abnormal
abnormal information
occupancy rate
identifying
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811105166.4A
Other languages
English (en)
Other versions
CN109491844A (zh
Inventor
王雪筠
张晓蓉
陈国栋
王安民
陈伟杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid of China Technology College
Original Assignee
State Grid Corp of China SGCC
State Grid of China Technology College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid of China Technology College filed Critical State Grid Corp of China SGCC
Priority to CN201811105166.4A priority Critical patent/CN109491844B/zh
Publication of CN109491844A publication Critical patent/CN109491844A/zh
Application granted granted Critical
Publication of CN109491844B publication Critical patent/CN109491844B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/2236Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test CPU or processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种识别异常信息的计算机系统,包括连接到中心服务器的一个或多个显示客户端,异常信息抓取服务器和数据存储系统;所述显示客户端用于异常识别结果显示;所述异常信息抓取服务器通信连接到多个异常信息上传客户端,用于实时接收上传客户端传输硬件设备异常时采集的异常信息;所述数据存储系统用于已知的异常信息;所述中心服务器用于根据已知的异常信息,识别异常信息服务器实时接收的异常信息;其中,所述异常信息包括硬件设备出现异常时的CPU占用率、当前内存占用率和当前硬盘读取速度。

Description

一种识别异常信息的计算机系统
技术领域
本发明涉及信息技术领域,特别涉及一种识别异常信息的计算机系统。
背景技术
在信息技术领域,很多PC设备和嵌入式设备被广泛应用到控制系统中,这些设备均会包括不同类型或型号的处理器、内部存储器和外部存储器,外部存储器一般实现为磁介质或者FLASH介质的硬盘。然而,一旦硬件设备,特别是设备驱动出现异常,则只能通过串口查看一些简单的信息。对从事系统定制和应用开发的工程技术人员解决所遇到的调试问题很不方便,根本无法快速分析问题和定位问题,导致解决问题效率不高。因此有必要提供硬件设备异常信息监控、分析和诊断的系统,记录设备运行过程中的异常信息,提高异常信息的识别效率。
发明内容
本发明为解决上述问题,本发明提供了一种识别异常信息的计算机系统,包括连接到中心服务器的一个或多个显示客户端,异常信息抓取服务器和数据存储系统;所述显示客户端用于异常识别结果显示;所述异常信息抓取服务器通信连接到多个异常信息上传客户端,用于实时接收上传客户端传输硬件设备异常时采集的异常信息;所述数据存储系统用于已知的异常信息;所述中心服务器用于根据已知的异常信息,识别异常信息服务器实时接收的异常信息;其中,所述异常信息包括硬件设备出现异常时的CPU占用率、当前内存占用率和当前硬盘读取速度。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明,提供了一种识别异常信息的计算机系统,包括连接到中心服务器的一个或多个显示客户端,异常信息抓取服务器和数据存储系统。
根据本发明,异常信息,为硬件设备(包括PC设备和嵌入式设备)在出现异常时,被监测到的硬件设备的一个或多个运行参数信息。本领域技术人员知晓,不同种类的硬件设备具有不同的异常信息,但是一般的,异常信息都会包括硬件设备出现异常时的CPU占用率、当前内存占用率和当前硬盘读取速度。
根据本发明,异常信息抓取服务器通信连接到多个异常信息上传客户端,用于实时接收上传客户端传输硬件设备异常时采集的异常信息。上传客户端可以实现为监测异常信息的硬件传感器,也可以实现为硬件设备上安装并运行的监控软件,上传客户端还可以在上传异常信息时同步上传硬件设备的驱动版本号。异常信息抓取服务器可以物理实现为单台服务器,也可以实现为多台服务器构成的分布式服务器,本领域技术人员知晓,服务器的类型和型号不会影响本申请的保护范围。
根据本发明,数据存储系统用于已知的异常信息,即存储已经识别出的造成硬件设备出现异常的历史上的异常信息。数据存储系统可以物理实现为现有技术中已知的各种数据库系统,包括关系型数据库和/或非关系型数据库。
根据本发明,中心服务器用于根据已知的异常信息,识别异常信息服务器实时接收的异常信息,并将异常识别结果显示在显示客户端上。显示客户端可以实现为PC、PAD或者智能手机,进一步的,显示客户端能够用于文字显示、图片显示、表格显示和/或视频显示。
根据本发明,进一步的,中心服务器还包括处理器、存储有计算机程序的存储介质,处理器执行计算机程序以使得中心服务器实现以下步骤,包括:
步骤200,接收异常信息抓取服务器实时获得的硬件设备出现异常时的异常信息和硬件设备的驱动版本号。
步骤300,判断驱动版本是否升级到最新版;如果没有升级到最新版,那么转入步骤400;如果已经升级到最新版,那么转入步骤500。
步骤400,为异常发生的硬件设备升级驱动程序,检查异常是否消失,如果消失,识别为驱动程序异常,终止;如果未消失,转入步骤500。
步骤200-400中,中心服务器能够将历史统计中硬件设备出现异常的概率最大的原因(驱动未升级)优先进行识别,从而一方面提升了识别并解决异常信息的效率,另一方面也为后续的识别减轻了干扰因素。
步骤500,根据异常发生的硬件设备的CPU占用率、当前内存占用率和当前硬盘读取速度,获取异常信息与F个已知异常信息的关联度r1、r2…rF。本领域技术人员知晓,在硬件设备发生异常时,异常信息可以包括除了CPU占用率、当前内存占用率和当前硬盘读取速度之外的任意能够监听到的硬件设备运行信息,这些其他信息也可以用于与F个已知异常信息进行比较和计算,从而获得关联度。但是本发明优选的使用CPU占用率、当前内存占用率和当前硬盘读取速度作为关联度的计算参数,一方面降低了参数的数量,从而使得计算机系统的运算速度和实时性得到保证,另一方面根据历史经验和小规模的实验测试,也能够保证异常信息识别的准确度。进一步的,根据本发明的一个方面,
Figure BDA0001807665390000031
z的取值范围为1到F,rz为异常信息和F个已知异常信息中第z个的关联度,rC、rM、rS分别为当前CPU占用率、内存占用率、硬盘读取速度与第z个已知异常的内存占用率的关联度;根据本发明的另一个方面,由于CPU占用率和内存占用率具有较高的正相关性,即CPU占用率高时,内存的占用率很大概率上也会比较高,反之亦然,因此采用CPU占用率和内存占用率的均值平滑两个参数,进而调整rz的计算方式为
Figure BDA0001807665390000032
具体的,关联度的计算方式可以采用现有技术中求取相关度的常规算法。但是优选的,本发明中的步骤500包括以下步骤:
步骤510,获取第z个已知异常信息的CPU占用率集合{EC}={EC(t1),EC(t2),...,EC(tm)}和当前CPU占用率集合{ER}={ER(t1),ER(t2),...,ER(tm)};其中,{t1,t2…tm}为固定时间间隔Δt的m个时间点序列,ti为第i个时间点,i∈[1,m]。
步骤520,计算
Figure BDA0001807665390000033
其中,
Figure BDA0001807665390000034
为当前CPU占用率数据与第z个已知异常的CPU占用率数据在第i个时间点的关联度,ΔoCi=|EC(ti)-ER(ti)|,ΔminC为ΔoCi中的最小值,ΔmaxC为ΔoCi的最大值,ρC为CPU占用率加权系数,ρC∈[0,1],ρC具体的数值可以采用经验参数确定,也可以根据现有技术中的机器学习方法动态确定。
步骤530,根据和步骤510-520的方法,计算rM和rS。由于当前内存占用率和当前硬盘读取速度和已知异常信息的关联度rM和rS的计算方式与CPU占用率的计算方式一致,因此不再赘述。
步骤600,将关联度r1、r2…rF从高到低进行排序,获得关联度最高的已知异常rf,其中1≤f≤F。显然,相关度最高的已知异常rf对应的硬件设备故障或异常,会有较大概率就是当前异常信息对应的硬件设备故障或异常。根据本发明的一个方面,将rf作为识别的异常直接发送到显示客户端,以供用户直观的获取并参考。根据本发明的另一个方面,还继续执行步骤700,以获取更为准确的识别信息。
步骤700,如果rf≥K1,那么识别当前异常为第f种已知异常;如果rf<K2,那么识别当前异常为未知异常,将当前异常信息为未知异常发送到显示客户端进行显示;其中K1和K2为预设的经验常数。K1的取值范围为0.7到0.95,优选0.8,K2的取值范围为0.25-0.4,优选0.3。通过步骤700,不仅考虑了关联度排序中最大的关联度,而且还要求关联度超过一定的阈值,才将已知异常信息作为匹配到的当前异常信息,识别的准确性得到提升。
根据本发明,进一步的还对K1和K2之间的情况进行处理,从而更为精准的识别出较为模糊的[K1,K2]范围内的情况。具体的,所述步骤700还包括:如果K1≤rf<K2,遍历排序后的F个关联度,获取
Figure BDA0001807665390000041
取最大值的s,其中,re为从高到低排序之后的第e个关联度,e∈[1,F]。如果s=1,那么识别当前异常信息为第f种已知异常。如果s>1,那么将排序后的F个关联度中的前s个发送到显示客户端。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种识别异常信息的计算机系统,其特征在于,包括连接到中心服务器的一个或多个显示客户端,异常信息抓取服务器和数据存储系统;所述显示客户端用于异常识别结果显示;所述异常信息抓取服务器通信连接到多个异常信息上传客户端,用于实时接收上传客户端传输硬件设备异常时采集的异常信息;所述数据存储系统用于已知的异常信息;所述中心服务器用于根据已知的异常信息,识别异常信息服务器实时接收的异常信息;
其中,所述异常信息包括硬件设备出现异常时的CPU占用率、当前内存占用率和当前硬盘读取速度;
其中,所述中心服务器包括处理器、存储有计算机程序的存储介质,所述处理器执行计算机程序以使得所述中心服务器实现以下步骤,包括:
步骤200,接收所述异常信息抓取服务器实时获得的硬件设备出现异常时的异常信息和硬件设备的驱动版本号;
步骤300,判断驱动版本是否升级到最新版;如果没有升级到最新版,那么转入步骤400;
步骤400,为所述异常发生的硬件设备升级驱动程序,检查异常是否消失,如果消失,识别为驱动程序异常,终止;
其中,所述步骤300还包括如果驱动版本已经升级到最新版,那么转入步骤500;所述步骤400还包括,如果异常未消失,转入步骤500;
步骤500,根据所述异常发生的硬件设备的CPU占用率、当前内存占用率和当前硬盘读取速度,获取所述异常与F个已知异常的关联度r1、r2…rF
其中,r1为所述异常与第1个已知异常的关联度,r2为所述异常与第2个已知异常的关联度…rF为所述异常与第F个已知异常的关联度;
步骤600,将关联度r1、r2…rF从高到低进行排序,获得关联度最高的已知异常rf,其中1≤f≤F;
步骤700,如果rf≥K1,那么识别当前异常为第f种已知异常;如果rf<K2,那么识别当前异常为未知异常,将当前异常信息为未知异常发送到显示客户端进行显示;其中K1和K2为预设的经验常数。
2.根据权利要求1所述的识别异常信息的计算机系统,其特征在于,所述显示客户端用于文字显示、图片显示、表格显示和/或视频显示。
3.根据权利要求1所述的识别异常信息的计算机系统,其特征在于,K1的取值范围为0.7到0.95,K2的取值范围为0.25-0.4。
4.根据权利要求1所述的识别异常信息的计算机系统,其特征在于,所述步骤700还包括:如果K1≤rf<K2,遍历排序后的F个关联度,获取
Figure FDA0003485128140000021
取最大值的s,其中,re为从高到低排序之后的第e个关联度,e∈[1,F];
如果s=1,那么识别当前异常信息为第f种已知异常。
5.根据权利要求4所述的识别异常信息的计算机系统,其特征在于,如果s>1,那么将排序后的F个关联度中的前s个发送到显示客户端。
6.根据权利要求1-5之任一所述的识别异常信息的计算机系统,其中,
Figure FDA0003485128140000022
z的取值范围为1到F,rC、rM、rS分别为当前CPU占用率、内存占用率、硬盘读取速度与第z个已知异常的内存占用率的关联度。
7.根据权利要求1所述的识别异常信息的计算机系统,其特征在于,所述步骤500进一步包括:
步骤510,获取第z个已知异常的CPU占用率集合{EC}={EC(t1),EC(t2),...,EC(tm)}和当前CPU占用率集合{ER}={ER(t1),ER(t2),...,ER(tm)};其中,{t1,t2…tm}为固定时间间隔Δt的m个时间点序列,t1为第1个时间点,t2为第2个时间点…tm为第m个时间点,ti为第i个时间点,i∈[1,m];
步骤520,计算
Figure FDA0003485128140000023
其中,
Figure FDA0003485128140000024
为当前CPU占用率数据与第z个已知异常的CPU占用率数据在第i个时间点的关联度,ΔoCi=|EC(ti)-ER(ti)|,ΔminC为ΔoCi中的最小值,ΔmaxC为ΔoCi的最大值,ρC为CPU占用率加权系数,ρC∈[0,1];
步骤530,根据步骤510-520的方法,计算rM和rS
CN201811105166.4A 2018-09-21 2018-09-21 一种识别异常信息的计算机系统 Active CN109491844B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811105166.4A CN109491844B (zh) 2018-09-21 2018-09-21 一种识别异常信息的计算机系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811105166.4A CN109491844B (zh) 2018-09-21 2018-09-21 一种识别异常信息的计算机系统

Publications (2)

Publication Number Publication Date
CN109491844A CN109491844A (zh) 2019-03-19
CN109491844B true CN109491844B (zh) 2022-03-04

Family

ID=65690741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811105166.4A Active CN109491844B (zh) 2018-09-21 2018-09-21 一种识别异常信息的计算机系统

Country Status (1)

Country Link
CN (1) CN109491844B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112800110B (zh) * 2021-01-22 2022-09-16 国家电网有限公司技术学院分公司 电力物联网传感器弱敏感数据异常检测系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105204970A (zh) * 2014-06-30 2015-12-30 北京金山安全软件有限公司 检测app的cpu占用率异常的方法、装置及移动终端
CN105320585A (zh) * 2014-07-08 2016-02-10 北京启明星辰信息安全技术有限公司 一种实现应用故障诊断的方法及装置
CN107145547A (zh) * 2017-04-26 2017-09-08 努比亚技术有限公司 一种异常数据的获取方法、设备及计算机可读存储介质
CN108009040A (zh) * 2017-12-12 2018-05-08 杭州时趣信息技术有限公司 一种确定故障根因的方法、系统和计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375768A (zh) * 2010-08-23 2012-03-14 鸿富锦精密工业(深圳)有限公司 电脑启动测试装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105204970A (zh) * 2014-06-30 2015-12-30 北京金山安全软件有限公司 检测app的cpu占用率异常的方法、装置及移动终端
CN105320585A (zh) * 2014-07-08 2016-02-10 北京启明星辰信息安全技术有限公司 一种实现应用故障诊断的方法及装置
CN107145547A (zh) * 2017-04-26 2017-09-08 努比亚技术有限公司 一种异常数据的获取方法、设备及计算机可读存储介质
CN108009040A (zh) * 2017-12-12 2018-05-08 杭州时趣信息技术有限公司 一种确定故障根因的方法、系统和计算机可读存储介质

Also Published As

Publication number Publication date
CN109491844A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
US10805151B2 (en) Method, apparatus, and storage medium for diagnosing failure based on a service monitoring indicator of a server by clustering servers with similar degrees of abnormal fluctuation
US20170083830A1 (en) System and Methods for Automated Plant Asset Failure Detection
CN110647894B (zh) 电器设备的故障诊断方法、系统、云端服务器及存储介质
US10866852B2 (en) Image based fault state determination
CN108460397B (zh) 设备故障类型的分析方法、装置、储存介质和电子设备
CN103746829A (zh) 一种基于集群的故障感知系统及其方法
WO2022166481A1 (zh) 一种针对硬盘的故障预测方法、装置及设备
WO2023169274A1 (zh) 数据处理方法、装置、存储介质以及处理器
WO2022001125A1 (zh) 一种存储系统的存储故障预测方法、系统及装置
WO2022134828A1 (zh) 基于图片识别的智能仓储方法、系统、设备及存储介质
CN109491844B (zh) 一种识别异常信息的计算机系统
CN111898035B (zh) 基于物联网的数据处理策略配置方法、装置和计算机设备
CN115904883B (zh) 一种rpa流程执行可视化异常监控方法、装置及介质
US20230280861A1 (en) System and Method for Detecting Imperfections in a Screen
CN115793990B (zh) 存储器健康状态确定方法、装置、电子设备及存储介质
CN114398228A (zh) 一种设备资源使用情况的预测方法、装置及电子设备
US20190138931A1 (en) Apparatus and method of introducing probability and uncertainty via order statistics to unsupervised data classification via clustering
JP7483095B2 (ja) 産業システムのための多目的異常検出システム
US20230059298A1 (en) Cavitation detection system and method
US10498592B2 (en) Method and baseboard management control system for automatically providing error status data
CN117457059A (zh) 一种ssd的故障检测方法、装置及电子设备
CN116451144A (zh) 一种风险预测方法及装置、计算机可读存储介质
CN114756399A (zh) 一种故障检测方法及相关装置
CN116662863A (zh) 基于移动设备app的rpa任务处理方法及相关装置
CN116824508A (zh) 一种人员异常行为监控方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant