CN111309537A - 一种检测服务器诊断系统报错的方法和设备 - Google Patents

一种检测服务器诊断系统报错的方法和设备 Download PDF

Info

Publication number
CN111309537A
CN111309537A CN202010110187.6A CN202010110187A CN111309537A CN 111309537 A CN111309537 A CN 111309537A CN 202010110187 A CN202010110187 A CN 202010110187A CN 111309537 A CN111309537 A CN 111309537A
Authority
CN
China
Prior art keywords
error
threshold
information
order
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010110187.6A
Other languages
English (en)
Inventor
孙昌龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010110187.6A priority Critical patent/CN111309537A/zh
Publication of CN111309537A publication Critical patent/CN111309537A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种检测服务器诊断系统报错的方法和设备,该方法包括以下步骤:部署监控服务器并将监控服务器连接到服务器诊断系统对外发布信息的网站;使监控服务器每经过阈值时间获取网站中的订单信息;分析订单信息以基于订单信息计算报错信息,并判断监控服务器中第一报错阈值和第二报错阈值的逻辑关系;响应于逻辑关系为与并且报错信息满足第一报错阈值和第二报错阈值,向管理员发出警告信息;响应于逻辑关系为或并且报错信息满足第一报错阈值或第二报错阈值中的一个,向管理员发出警告信息。通过使用本发明的方案,能够及时准确的发出警告信息,解决了依靠人工的非实时性以及巡查需要投入巨大人力的问题。

Description

一种检测服务器诊断系统报错的方法和设备
技术领域
本领域涉及计算机领域,并且更具体地涉及一种检测服务器诊断系统报错的方法和设备。
背景技术
服务器生产的过程中,需要进行系统诊断工序,系统诊断过程中会出现同一订单批量报错的问题。目前发现批量报错订单的方法主要靠生产线人员发现或者系统诊断工程师不断的查询服务器诊断系统对外发布信息的网站。这两种方法都需要人员不间断的关注产线信息,耗时耗力,而且具有无法及时发现问题的风险。
发明内容
有鉴于此,本发明实施例的目的在于提出一种检测服务器诊断系统报错的方法和设备,通过使用本发明的方法,能够及时准确的发出警告信息,降低了生产过程中的风险,并解决了依靠人工的非实时性以及巡查需要投入巨大人力的问题。
基于上述目的,本发明的实施例的一个方面提供了一种检测服务器诊断系统报错的方法,包括以下步骤:
部署监控服务器并将监控服务器连接到服务器诊断系统对外发布信息的网站;
使监控服务器每经过阈值时间获取网站中的订单信息;
分析订单信息以基于订单信息计算报错信息,并判断监控服务器中第一报错阈值和第二报错阈值的逻辑关系;
响应于逻辑关系为与并且报错信息满足第一报错阈值和第二报错阈值,向管理员发出警告信息;
响应于逻辑关系为或并且报错信息满足第一报错阈值或第二报错阈值中的一个,向管理员发出警告信息。
根据本发明的一个实施例,使监控服务器每经过阈值时间获取网站中的订单信息包括:
利用Python脚本借助Selenium工具和chrome浏览器访问网站并获得网站的内容;
按照H5规范解析网站内容,读取描述服务器当前状态的信息;
统计服务器当前状态信息,将状态为失败的服务器的台数统计为订单故障台数。
根据本发明的一个实施例,报错信息包括订单故障台数除以订单机器总数。
根据本发明的一个实施例,第一报错阈值为订单故障台数占订单机器总数的百分比,第二报错阈值为订单故障台数。
根据本发明的一个实施例,向管理员发出警告信息包括:
在监控服务器中弹出报错警告和将报错警告发送到管理人的邮箱中。
本发明的实施例的另一个方面,还提供了一种检测服务器诊断系统报错的设备,设备包括:
连接模块,连接模块配置为部署监控服务器并将监控服务器连接到服务器诊断系统对外发布信息的网站;
获取模块,获取模块配置为使监控服务器每经过阈值时间获取网站中的订单信息;
计算模块,计算模块配置为分析订单信息以基于订单信息计算报错信息,并判断监控服务器中第一报错阈值和第二报错阈值的逻辑关系;
第一警告模块,第一警告模块配置为响应于逻辑关系为逻辑与关系并且报错信息满足第一报错阈值和第二报错阈值,向管理员发出警告信息;
第二警告模块,第二警告模块配置为响应于逻辑关系为逻辑或关系并且报错信息满足第一报错阈值或第二报错阈值中的一个,向管理员发出警告信息。
根据本发明的一个实施例,获取模块还配置为:
利用Python脚本借助Selenium工具和chrome浏览器访问网站并获得网站的内容;
按照H5规范解析网站内容,读取描述服务器当前状态的信息;
统计服务器当前状态信息,将状态为失败的服务器的台数统计为订单故障台数。
根据本发明的一个实施例,报错信息包括订单故障台数除以订单机器总数。
根据本发明的一个实施例,第一报错阈值为订单故障台数占订单机器总数的百分比,第二报错阈值为订单故障台数。
根据本发明的一个实施例,第一警告模块和第二警告模块还配置为在监控服务器中弹出报错警告和将报错警告发送到管理人的邮箱中。
本发明具有以下有益技术效果:本发明实施例提供的检测服务器诊断系统报错的方法,通过部署监控服务器并将监控服务器连接到服务器诊断系统对外发布信息的网站;使监控服务器每经过阈值时间获取网站中的订单信息;分析订单信息以基于订单信息计算报错信息,并判断监控服务器中第一报错阈值和第二报错阈值的逻辑关系;响应于逻辑关系为逻辑与关系并且报错信息满足第一报错阈值和第二报错阈值,向管理员发出警告信息;响应于逻辑关系为逻辑或关系并且报错信息满足第一报错阈值或第二报错阈值中的一个,向管理员发出警告信息的技术方案,能够及时准确的发出警告信息,降低了生产过程中的风险,并解决了依靠人工的非实时性以及巡查需要投入巨大人力的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为根据本发明一个实施例的检测服务器诊断系统报错的方法的示意性流程图;
图2为根据本发明一个实施例的检测服务器诊断系统报错的设备的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
基于上述目的,本发明的实施例的第一个方面,提出了一种检测服务器诊断系统报错的方法的一个实施例。图1示出的是该方法的示意性流程图。
如图1中所示,该方法可以包括以下步骤:
S1部署监控服务器并将监控服务器连接到服务器诊断系统对外发布信息的网站,监控服务器可以通过网线与服务器诊断系统对外发布信息的网站可连通,在金控服务器上安装chrome浏览器、Python3工具、Selenium工具、webdriver,该chrome浏览器可以访问到服务器诊断系统对外发布信息的网站即可;
S2使监控服务器每经过阈值时间获取网站中的订单信息,可以根据实际生产情况设定一个获取信息的阈值时间,并利用Python脚本借助Selenium工具和chrome浏览器,根据batcherrconf.ini配置文件中设定的巡查启动间隔定时访问服务器诊断系统对外发布信息的网站,从该网站上解析网页源码,将该网站中的源码进行解析会得到很多行,按照“订单号、序列号、机型、位置、电源、处理时间、网络IP、BMCIP、当前测试项、操作员、用时、状态、重测”顺序排列的信息,将这些信息进行统计,统计按照“订单、报错台数、当前测试节点”进行统计排序,这样就能得到一个订单的相关情况;
S3分析订单信息以基于订单信息计算报错信息,并判断监控服务器中第一报错阈值和第二报错阈值的逻辑关系,根据订单信息可以计算报错信息,这里的报错信息可以是订单故障台数占订单机器总数的百分比,还可以将订单故障台数作为另一个报错信息,根据具体的阈值设置可以判断当前订单中是否出现需要报警的情况;
S4响应于逻辑关系为逻辑与关系并且报错信息满足第一报错阈值和第二报错阈值,向管理员发出警告信息,该报错信息需要同时超过第一报错阈值和第二报错阈值,才会向管理员发出警告信息;
S5响应于逻辑关系为逻辑或关系并且报错信息满足第一报错阈值或第二报错阈值中的一个,向管理员发出警告信息,该报错信息只要大于第一报错阈值和第二报错阈值中的一个就向管理员发出警告信息。
通过本发明的技术方案,能够及时准确的发出警告信息,降低了生产过程中的风险,并解决了依靠人工的非实时性以及巡查需要投入巨大人力的问题。
在本发明的一个优选实施例中,使监控服务器每经过阈值时间获取网站中的订单信息包括:
利用Python脚本借助Selenium工具和chrome浏览器访问网站并获得网站的内容;
按照H5规范解析网站内容,读取描述服务器当前状态的信息;
统计服务器当前状态信息,将状态为失败的服务器的台数统计为订单故障台数。
上述实施例为利用爬虫技术获取订单中的内容,利用Python脚本借助Selenium工具和chrome浏览器浏览器,根据batcherrconf.ini配置文件中设定的巡查启动间隔定时访问服务器诊断系统对外发布信息的网站,比如浪潮服务器诊断系统对外发布信息的网站(http://10.68.12.48/monitor/search/index),从该网站上解析网页源码,然后找寻服务器状态所在信息进行解析分类,获得服务器状态为失败内容,统计状态为失败的服务器,统计出该类服务器的订单与错误台数,统计完毕后,与批量报错条件进行比较,将符合批量报错条件的信息写入sendwarning文件中,完成自动巡查功能。利用爬虫技术可以将网站中的源文件进行解析会得到很多行,按照“订单号、序列号、机型、位置、电源、处理时间、网络IP、BMCIP、当前测试项、操作员、用时、状态、重测”顺序排列的信息。将这些信息进行统计,统计按照“订单、报错台数、当前测试节点”进行统计排序,这样就能得到一个订单的相关情况。
在本发明的一个优选实施例中,报错信息包括订单故障台数除以订单机器总数。根据获取到的订单情况,可以计算出发生故障台数的百分比,可以将该百分比作为警告的参数之一,可以根据日常生产的实际情况设定一个百分比阈值,如果发生故障台数的实际百分比超过了该阈值则向管理员发出警告。
在本发明的一个优选实施例中,第一报错阈值为订单故障台数占订单机器总数的百分比,第二报错阈值为订单故障台数。当报错阈值的逻辑关系为与时,需要报错信息中的百分比大于第一报错阈值,同时报错信息中的订单故障台数要大于第二报错阈值才会向管理员发出警告;当报错阈值的逻辑关系为或时,只要报错信息中的百分比大于第一报错阈值,或者报错信息中的订单故障台数要大于第二报错阈值,或者两者同时满足就会向管理员发出警告。
在本发明的一个优选实施例中,向管理员发出警告信息包括:
在监控服务器中弹出报错警告和将报错警告发送到管理人的邮箱中。目前的信息提醒是定时读取sendwarning文件,将其中需要提醒的订单以弹框提示来展示,后续会考虑使用邮件或微信等方式进行提醒。目前只是做到,将文件中的内容读出,进行弹框提醒。
通过本发明的技术方案,能够及时准确的发出警告信息,降低了生产过程中的风险,并解决了依靠人工的非实时性以及巡查需要投入巨大人力的问题。
需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,上述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中存储介质可为磁碟、光盘、只读存储器(Read-Only Memory,ROM)或随机存取存储器(Random AccessMemory,RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
此外,根据本发明实施例公开的方法还可以被实现为由CPU执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被CPU执行时,执行本发明实施例公开的方法中限定的上述功能。
基于上述目的,本发明的实施例的第二个方面,提出了一种检测服务器诊断系统报错的设备,如图2所示,设备200包括:
连接模块201,连接模块201配置为部署监控服务器并将监控服务器连接到服务器诊断系统对外发布信息的网站;
获取模块202,获取模块202配置为使监控服务器每经过阈值时间获取网站中的订单信息;
计算模块203,计算模块203配置为分析订单信息以基于订单信息计算报错信息,并判断监控服务器中第一报错阈值和第二报错阈值的逻辑关系;
第一警告模块204,第一警告模块204配置为响应于逻辑关系为逻辑与关系并且报错信息满足第一报错阈值和第二报错阈值,向管理员发出警告信息;
第二警告模块205,第二警告模块205配置为响应于逻辑关系为逻辑或关系并且报错信息满足第一报错阈值或第二报错阈值中的一个,向管理员发出警告信息。
在本发明的一个优选实施例中,获取模块202还配置为:
利用Python脚本借助Selenium工具和chrome浏览器访问网站并获得网站的内容;
按照H5规范解析网站内容,读取描述服务器当前状态的信息;
统计服务器当前状态信息,将状态为失败的服务器的台数统计为订单故障台数。
在本发明的一个优选实施例中,报错信息包括订单故障台数除以订单机器总数。
在本发明的一个优选实施例中,第一报错阈值为订单故障台数占订单机器总数的百分比,第二报错阈值为订单故障台数。
在本发明的一个优选实施例中,第一警告模块204和第二警告模块205还配置为在监控服务器中弹出报错警告和将报错警告发送到管理人的邮箱中。
需要特别指出的是,上述系统的实施例采用了上述方法的实施例来具体说明各模块的工作过程,本领域技术人员能够很容易想到,将这些模块应用到上述方法的其他实施例中。
此外,上述方法步骤以及系统单元或模块也可以利用控制器以及用于存储使得控制器实现上述步骤或单元或模块功能的计算机程序的计算机可读存储介质实现。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
上述实施例,特别是任何“优选”实施例是实现的可能示例,并且仅为了清楚地理解本发明的原理而提出。可以在不脱离本文所描述的技术的精神和原理的情况下对上述实施例进行许多变化和修改。所有修改旨在被包括在本公开的范围内并且由所附权利要求保护。

Claims (10)

1.一种检测服务器诊断系统报错的方法,其特征在于,包括以下步骤:
部署监控服务器并将所述监控服务器连接到所述服务器诊断系统对外发布信息的网站;
使所述监控服务器每经过阈值时间获取所述网站中的订单信息;
分析所述订单信息以基于所述订单信息计算报错信息,并判断所述监控服务器中第一报错阈值和第二报错阈值的逻辑关系;
响应于所述逻辑关系为与并且所述报错信息满足所述第一报错阈值和所述第二报错阈值,向管理员发出警告信息;
响应于所述逻辑关系为或并且所述报错信息满足所述第一报错阈值或所述第二报错阈值中的一个,向管理员发出警告信息。
2.根据权利要求1所述的方法,其特征在于,使所述监控服务器每经过阈值时间获取所述网站中的订单信息包括:
利用Python脚本借助Selenium工具和chrome浏览器访问所述网站并获得所述网站的内容;
按照H5规范解析所述网站内容,读取描述服务器当前状态的信息;
统计所述服务器当前状态信息,将状态为失败的服务器的台数统计为订单故障台数。
3.根据权利要求1所述的方法,其特征在于,所述报错信息包括订单故障台数除以订单机器总数。
4.根据权利要求1所述的方法,其特征在于,所述第一报错阈值为订单故障台数占订单机器总数的百分比,所述第二报错阈值为订单故障台数。
5.根据权利要求1所述的方法,其特征在于,向管理员发出警告信息包括:
在所述监控服务器中弹出报错警告和将报错警告发送到管理人的邮箱中。
6.一种检测服务器诊断系统报错的设备,其特征在于,所述设备包括:
连接模块,所述连接模块配置为部署监控服务器并将所述监控服务器连接到所述服务器诊断系统对外发布信息的网站;
获取模块,所述获取模块配置为使所述监控服务器每经过阈值时间获取所述网站中的订单信息;
计算模块,所述计算模块配置为分析所述订单信息以基于所述订单信息计算报错信息,并判断所述监控服务器中第一报错阈值和第二报错阈值的逻辑关系;
第一警告模块,所述第一警告模块配置为响应于所述逻辑关系为逻辑与关系并且所述报错信息满足所述第一报错阈值和所述第二报错阈值,向管理员发出警告信息;
第二警告模块,所述第二警告模块配置为响应于所述逻辑关系为逻辑或关系并且所述报错信息满足所述第一报错阈值或所述第二报错阈值中的一个,向管理员发出警告信息。
7.根据权利要求6所述的设备,其特征在于,所述获取模块还配置为:
利用Python脚本借助Selenium工具和chrome浏览器访问所述网站并获得所述网站的内容;
按照H5规范解析所述网站内容,读取描述服务器当前状态的信息;
统计所述服务器当前状态信息,将状态为失败的服务器的台数统计为订单故障台数。
8.根据权利要求6所述的设备,其特征在于,所述报错信息包括订单故障台数除以订单机器总数。
9.根据权利要求6所述的设备,其特征在于,所述第一报错阈值为订单故障台数占订单机器总数的百分比,所述第二报错阈值为订单故障台数。
10.根据权利要求6所述的设备,其特征在于,所述第一警告模块和所述第二警告模块还配置为在所述监控服务器中弹出报错警告和将报错警告发送到管理人的邮箱中。
CN202010110187.6A 2020-02-23 2020-02-23 一种检测服务器诊断系统报错的方法和设备 Withdrawn CN111309537A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010110187.6A CN111309537A (zh) 2020-02-23 2020-02-23 一种检测服务器诊断系统报错的方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010110187.6A CN111309537A (zh) 2020-02-23 2020-02-23 一种检测服务器诊断系统报错的方法和设备

Publications (1)

Publication Number Publication Date
CN111309537A true CN111309537A (zh) 2020-06-19

Family

ID=71152949

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010110187.6A Withdrawn CN111309537A (zh) 2020-02-23 2020-02-23 一种检测服务器诊断系统报错的方法和设备

Country Status (1)

Country Link
CN (1) CN111309537A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113485906A (zh) * 2021-05-10 2021-10-08 广州城建职业学院 财务云平台中统计数据的测试方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113485906A (zh) * 2021-05-10 2021-10-08 广州城建职业学院 财务云平台中统计数据的测试方法
CN113485906B (zh) * 2021-05-10 2024-01-26 广州城建职业学院 财务云平台中统计数据的测试方法

Similar Documents

Publication Publication Date Title
CN114065613B (zh) 基于深度迁移学习的多工况流程工业故障检测诊断方法
US7493236B1 (en) Method for reporting the status of a control application in an automated manufacturing environment
US7805639B2 (en) Tool to report the status and drill-down of an application in an automated manufacturing environment
US7793162B2 (en) Method for reporting the status and drill-down of a control application in an automated manufacturing environment
CN104731664A (zh) 用于故障处理的方法和装置
WO2019209146A1 (ru) Способ и система идентификации и прогнозирования развития дефектов объектов
CN117041029A (zh) 网络设备故障处理方法、装置、电子设备及存储介质
CN113091817A (zh) 一种三甘醇脱水装置状态监测及故障诊断系统
CN114550336B (zh) 设备巡检方法、装置、计算机设备和存储介质
CN113468022B (zh) 一种对产品集中监控的自动化运维方法
CN115952081A (zh) 一种软件测试方法、装置、存储介质及设备
US20200401596A1 (en) Test data integration system and method thereof
CN111124817A (zh) 一种基于缓存机制的多类型告警判断算法
CN111309537A (zh) 一种检测服务器诊断系统报错的方法和设备
CN111314110B (zh) 一种用于分布式系统的故障预警方法
CN116611953A (zh) 基于物联网的电能表生产制造实时数据管理方法和系统
CN115187210A (zh) 异常信息处置方法、装置、系统、电子设备及存储介质
CN113300918A (zh) 智慧灯杆的故障检测方法、终端设备及存储介质
CN112035315A (zh) 网页数据监控方法、装置、计算机设备及存储介质
CN110703730A (zh) 一种基于mes中数据采集测试方法和装置
KR102672799B1 (ko) 반도체 장비의 실시간 공정 데이터를 매칭 및 분석하는 시스템 및 그 방법
US20240104911A1 (en) Information processing device
CN113837703B (zh) 一种物流运单承运信息量化防重实时自动核验法
CN114757648A (zh) 一种故障统计记录方法、系统及装置
CN114095337A (zh) Kpi异常检测方法、装置、计算设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200619