CN109710501B - 一种服务器数据传输稳定性的检测方法和系统 - Google Patents

一种服务器数据传输稳定性的检测方法和系统 Download PDF

Info

Publication number
CN109710501B
CN109710501B CN201811553655.6A CN201811553655A CN109710501B CN 109710501 B CN109710501 B CN 109710501B CN 201811553655 A CN201811553655 A CN 201811553655A CN 109710501 B CN109710501 B CN 109710501B
Authority
CN
China
Prior art keywords
server
data transmission
data
black box
transmission stability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811553655.6A
Other languages
English (en)
Other versions
CN109710501A (zh
Inventor
岳远斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811553655.6A priority Critical patent/CN109710501B/zh
Publication of CN109710501A publication Critical patent/CN109710501A/zh
Application granted granted Critical
Publication of CN109710501B publication Critical patent/CN109710501B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种服务器数据传输稳定性的检测方法和系统,该方法包括:对服务器数据链路进行加压测试;测试完成后,收集与加压测试相关的黑盒日志;根据黑盒日志获取CE报错数量;判断CE报错数量是否≤设定的阈值;如果是,判定服务器数据传输稳定性合格,否则判定不合格。该服务器数据传输稳定性的检测系统包括:测试模块、日志收集模块、CE报错数量获取模块和判断模块。通过本申请,事先及时准确地拦截数据传输不稳定的服务器,提高检测效率和数据传输稳定性。

Description

一种服务器数据传输稳定性的检测方法和系统
技术领域
本申请涉及服务器检测技术领域,特别是涉及一种服务器数据传输稳定性的检测方法和系统。
背景技术
随着大数据、云计算和人工智能技术时代的到来,数据成为当前很多关键技术的基础。而在服务系统中,随着用于存储和计算的数据量的增加,服务器的运载压力越来越大,这就对整个存储链路的稳定性提出更高的要求。
在数据传输过程中,对于存储链路上的数据传输错误而言,个别的传输错误通过校验机制可以纠正过来,不会对整个服务器的运行造成大的影响。但是,如果存储链路稳定性比较差,随着传输的错误数据不断增多和积,就会造成整条存储链路的瘫痪,轻微的会造成服务器的计算性能及存储性能降低,严重的会造成硬盘掉盘和系统宕机,进而导致客户端的业务中断、数据丢失,造成的损失不可预估。因此,检测服务器数据传输的稳定性,是个重要问题。
目前检测服务器数据传输稳定性的方法,通常是通过检测服务器是否发生硬盘掉盘,一定时间段内硬盘掉盘的次数,或者服务器发生宕机的概率,来衡量存储链路的稳定性。
然而,目前检测服务器数据传输稳定性的方法中,硬盘掉盘、服务器系统宕机等情况都是服务器数据存储中的严重故障,一旦发生这种故障,服务器便无法继续使用,不利于服务器的稳定运行,检测效率太低。而且目前的检查方法属于事后检测,检测不够及时,无法及时保护服务器存储系统。
发明内容
本申请提供了一种服务器数据传输稳定性的检测方法和系统,以解决现有技术中对服务器数据传输稳定性的检测不够及时、检测效率太低的问题。
为了解决上述技术问题,本申请实施例公开了如下技术方案:
一种服务器数据传输稳定性的检测方法,所述检测方法包括:
对服务器数据链路进行加压测试;
测试完成后,收集与所述加压测试相关的黑盒日志;
根据所述黑盒日志,获取CE(Correctable Error,可更正错误)报错数量;
判断所述CE报错数量是否≤设定的阈值;
如果是,判定服务器数据传输稳定性合格;
如果否,判定服务器数据传输稳定性不合格。
可选地,所述对服务器数据链路进行加压测试,具体为:
对服务器数据链路增加数据读写量。
可选地,所述对服务器数据链路增加数据读写量,包括:
顺序读写服务器数据链路中的数据,每次读写的数据量包括:1KB、2KB或者4KB;和/或,
随机读写服务器数据链路中的数据,每次读写的数据量包括:1KB、2KB或者4KB。
可选地,所述根据所述黑盒日志,获取CE报错数量,包括:
对所述黑盒日志进行解析,获取可统计格式的黑盒日志;
根据所获取的命令,从可统计格式的黑盒日志中抓取关键字,所述关键字包括:Correctable Error;
统计所述关键字的数量。
可选地,判定服务器数据传输稳定性不合格之后,所述方法还包括:
对数据传输稳定性不合格的服务器进行定位显示。
一种服务器数据传输稳定性的检测系统,所述检测系统包括:
测试模块,用于对服务器数据链路进行加压测试;
日志收集模块,用于测试完成后,收集与所述加压测试相关的黑盒日志;
CE报错数量获取模块,用于根据所述黑盒日志,获取CE报错数量;
判断模块,用于判断所述CE报错数量是否≤设定的阈值,如果是,判定服务器数据传输稳定性合格,如果否,判定服务器数据传输稳定性不合格。
可选地,所述测试模块,包括:顺序读写单元和/或随机读写单元;
所述顺序读写单元,用于顺序读写服务器数据链路中的数据,每次读写的数据量包括:1KB、2KB或者4KB;
所述随机读写单元,用于随机读写服务器数据链路中的数据,每次读写的数据量包括:1KB、2KB或者4KB。
可选地,所述CE报错数量获取模块,包括:
解析单元,用于对所述黑盒日志进行解析,获取可统计格式的黑盒日志;
抓取单元,用于根据所获取的命令,从可统计格式的黑盒日志中抓取关键字,所述关键字包括:Correctable Error;
统计单元,用于统计所述关键字的数量。
可选地,所述检测系统中还包括:定位显示单元,用于对数据传输稳定性不合格的服务器进行定位显示。
本申请的实施例提供的技术方案可以包括以下有益效果:
本申请提供一种服务器数据传输稳定性的检测方法,该方法首先对服务器数据链路进行加压测试,测试完成后,收集与加压测试相关的黑盒日志,然后根据黑盒日志获取CE报错数量,并判断CE报错数量是否超过设定的阈值,如果是判定服务器数据传输稳定性合格,否则判定服务器数据传输稳定性不合格。可以采用本申请中的方法编写自动化检测程序。本申请通过在生产过程中实时自动监控每一台服务器的CE报错数量,当CE报错数量达到设定阈值时自动产生报警,从而能够对CE报错数量大于阈值的服务器进行拦截,实现事前闭环解决机器故障,有利于提高数据中心服务器数据传输的准确性和稳定性,而且本申请中获取CE报错数量比较方便,不需要服务器发生硬盘掉盘或者宕机等严重故障时获取,检测效率较高,检测成本低,有利于推广使用。另外,由于本申请中的方法能够通过筛选拦截数据链路不稳定的服务器,在提高数据传输稳定性的基础上,还能够避免数据传输过程中因不断的纠错而占用系统资源,因此,能够提高服务器硬盘的读写性能,以及服务器的存储和计算性能,从而提高整个服务器产品的可靠性。
本申请还提供一种服务器数据传输稳定性的检测系统,该系统主要包括测试模块、日志收集模块、CE报错数量获取模块和判断模块。通过测试模块对服务器链路进行加压测试,测试结束后通过日志收集模块收集与加压测试相关的黑盒日志,然后利用CE报错数量获取模块,根据黑盒日志获取CE报错数量,最后通过判断模块判断CE报错数量是否小于等于设定的阈值,如果是,判定服务器数据传输稳定性合格,否则判定服务器数据传输稳定性不合格。本申请通过CE报错数量获取模块和判断模块,从CE报错数量的角度,来判断服务器数据传输稳定性,既能够及时准确地拦截数据传输不稳定的服务器,又能够有效提高检测效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例所提供的一种服务器数据传输稳定性的检测方法的流程示意图;
图2为本申请实施例所提供的一种服务器数据传输稳定性的检测系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
为了更好地理解本申请,下面结合附图来详细解释本申请的实施方式。
实施例一
参见图1,图1为本申请实施例所提供的一种服务器数据传输稳定性的检测方法的流程示意图。由图1可知,本实施例中服务器数据传输稳定性的检测方法,主要包括如下过程:
S1:对服务器数据链路进行加压测试。
本实施例中对服务器数据链路进行加压测试的方法,具体为:对服务器数据链路增加数据读写量。具体包括如下过程:
S11:顺序读写服务器数据链路中的数据,每次读写的数据量包括:1KB、2KB或者4KB。
S12:随机读写服务器数据链路中的数据,每次读写的数据量包括:1KB、2KB或者4KB。
当然,对服务器数据链路增加数据读写量的方法,也可以仅选择步骤S11或步骤S12中的一个步骤。
本实施例通过对服务器数据链路进行加压测试,以增加数据读写量的方式给数据传输链路施加压力,从而增加数据传输出错的概率,判断条件更严格,使得这种情况下所获取测试结果更加可靠,同时还可以模拟客户实际使用的情形,更贴合实际情况,有利于提高测试准确性和可靠性。
S2:测试完成后,收集与加压测试相关的黑盒日志。
黑盒日志是BMC(Baseboard Management Controller,基板管理控制器)中用于记录故障信息的一种加密日志,当服务器内部发生电源、内存或者链路错误等故障时,相应的故障信息会存储于黑盒日志中。黑盒日志中所记录的报错日志,通常包括:电源报错、内存报错、CPU报错以及CE报错等。本实施例中对数据链路进行加压测试后,仅需收集与加压测试相关的黑盒日志,如CE报错日志即可。
S3:根据黑盒日志,获取CE报错数量。
具体地,步骤S3包括如下过程:
S31:对黑盒日志进行解析,获取可统计格式的黑盒日志。
由于黑盒日志为加密日志,首先对所获取的黑盒日志进行解析,获取到可统计格式的黑盒日志,也就是对黑盒日志进行解密,以便于后续统计CE报错数量。
S32:根据所获取的命令,从可统计格式的黑盒日志中抓取关键字,关键字包括:Correctable Error。
本实施例中的的关键字,为黑盒日志中用于描述CE报错信息的关键字。通常黑盒日志中用于描述CE报错信息的关键字为Correctable Error。对黑盒日志进行解析后,解析后的黑盒日志中直接以关键字Correctable Error进行信息抓取即可。
S33:统计关键字的数量。
根据所统计的关键字Correctable Error的数量,确定CE报错数量。
影响服务器数据链路稳定性的参数除了CE,还有UCE(UncorrectableCorrectable Error,不可更正错误)等,但是UCE报错是CE报错之后的更严重的服务器错误,一旦产生UCE报错,服务器数据链路会挂掉。本申请从统计服务器CE报错数量的角度,来判断服务器数据传输稳定性,既能够及时准确地拦截数据传输不稳定的服务器,又能够有效提高检测效率,而且检验服务器的CE报错数量比较方便,在服务器发生硬盘掉盘或者宕机等严重故障之前即可获取CE报错数量,有利于提高服务器稳定性,且检测效率较高,检测成本低,有利于推广使用。
继续参见图1可知,获取到CE报错数量之后,执行步骤S4:判断CE报错数量是否≤设定的阈值。
本实施例中关于CE报错数量所设定的阈值,根据生产过程中抓取到大量服务器CE报错数量的正态分布特性,以及,根据客户需求所定制的服务器产品设计方案来确定。
S5:如果是,判定服务器数据传输稳定性合格。
S6:如果否,判定服务器数据传输稳定性不合格。
进一步地,判定服务器数据传输稳定性不合格之后,本实施例中服务器数据传输稳定性的检测方法还包括步骤S7:对数据传输稳定性不合格的服务器进行定位显示。
具体地,可以通过点亮当前不合格服务器的定位指示灯的方式,对不合格的服务器进行定位显示。通过对数据传输稳定性不合格的服务器进行定位显示,能够直观地通知工作人员,有利于及时启动故障维护,从而实现闭环解决故障机器的目的。
实际应用中,可以采用本实施例中的方法进行编程,通过运行自动化检测程序,在生产过程中实时自动地监控每一个服务器的CE报错数量,当达到某一设定阈值后,自动产生报警。
实施例二
在图1所示实施例的基础之上参见图2,图2为本申请实施例所提供的一种服务器数据传输稳定性的检测系统的结构示意图。由图2可知,本实施例中服务器数据传输稳定性的检测系统主要包括:测试模块、日志收集模块、CE报错数量获取模块和判断模块四部分。
其中,测试模块用于对服务器数据链路进行加压测试。日志收集模块用于测试完成后,收集与加压测试相关的黑盒日志。CE报错数量获取模块用于根据所述黑盒日志,获取CE报错数量。判断模块用于判断CE报错数量是否≤设定的阈值,如果是,判定服务器数据传输稳定性合格,否则,判定服务器数据传输稳定性不合格。
进一步地,测试模块包括顺序读写单元和/或随机读写单元。也就是测试模块有三种情形,第一种是仅包括一顺序读写单元,第二种是仅包括一随机读写单元,第三种是包括顺序读写单元和随机读写单元。
其中,顺序读写单元用于顺序读写服务器数据链路中的数据,每次读写的数据量包括:1KB、2KB或者4KB。随机读写单元用于随机读写服务器数据链路中的数据,每次读写的数据量包括:1KB、2KB或者4KB。
进一步地,本实施例中CE报错数量获取模块又包括:解析单元、抓取单元和统计单元。其中,解析单元用于对黑盒日志进行解析,获取可统计格式的黑盒日志。抓取单元用于根据所获取的命令,从可统计格式的黑盒日志中抓取关键字,关键字包括:CorrectableError。统计单元用于统计关键字的数量。
另外,本实施例的服务器数据传输稳定性的检测系统中还包括定位显示单元,用于对数据传输稳定性不合格的服务器进行定位显示。定位显示单元可以采用服务器的定位指示灯,判断模块和服务器的定位指示灯连接,当判断模块判定服务器数据传输稳定性不合格时,触发服务器的定位指示灯点亮。
该实施例中服务器数据传输稳定性的检测系统的工作原理和工作方法,在图1所是的实施例中已经详细阐述,两个实施例之间可以互相参照,在此不再赘述。
以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种服务器数据传输稳定性的检测方法,其特征在于,所述检测方法包括:
对服务器数据链路进行加压测试;
测试完成后,收集与所述加压测试相关的黑盒日志;
根据所述黑盒日志,获取CE报错数量;
判断所述CE报错数量是否≤设定的阈值;
如果是,判定服务器数据传输稳定性合格;
如果否,判定服务器数据传输稳定性不合格;
其中,所述根据所述黑盒日志,获取CE报错数量,包括:
对所述黑盒日志进行解析,获取可统计格式的黑盒日志;
根据所获取的命令,从可统计格式的黑盒日志中抓取关键字,所述关键字包括:Correctable Error;
统计所述关键字的数量。
2.根据权利要求1所述的一种服务器数据传输稳定性的检测方法,其特征在于,所述对服务器数据链路进行加压测试,具体为:
对服务器数据链路增加数据读写量。
3.根据权利要求2所述的一种服务器数据传输稳定性的检测方法,其特征在于,所述对服务器数据链路增加数据读写量,包括:
顺序读写服务器数据链路中的数据,每次读写的数据量包括:1KB、2KB或者4KB;和/或,
随机读写服务器数据链路中的数据,每次读写的数据量包括:1KB、2KB或者4KB。
4.根据权利要求1-3中任一所述的一种服务器数据传输稳定性的检测方法,其特征在于,判定服务器数据传输稳定性不合格之后,所述方法还包括:
对数据传输稳定性不合格的服务器进行定位显示。
5.一种服务器数据传输稳定性的检测系统,其特征在于,所述检测系统包括:
测试模块,用于对服务器数据链路进行加压测试;
日志收集模块,用于测试完成后,收集与所述加压测试相关的黑盒日志;
CE报错数量获取模块,用于根据所述黑盒日志,获取CE报错数量;
判断模块,用于判断所述CE报错数量是否≤设定的阈值,如果是,判定服务器数据传输稳定性合格,如果否,判定服务器数据传输稳定性不合格;
其中,所述CE报错数量获取模块,包括:
解析单元,用于对所述黑盒日志进行解析,获取可统计格式的黑盒日志;
抓取单元,用于根据所获取的命令,从可统计格式的黑盒日志中抓取关键字,所述关键字包括:Correctable Error;
统计单元,用于统计所述关键字的数量。
6.根据权利要求5所述的一种服务器数据传输稳定性的检测系统,其特征在于,所述测试模块,包括:顺序读写单元和/或随机读写单元;
所述顺序读写单元,用于顺序读写服务器数据链路中的数据,每次读写的数据量包括:1KB、2KB或者4KB;
所述随机读写单元,用于随机读写服务器数据链路中的数据,每次读写的数据量包括:1KB、2KB或者4KB。
7.根据权利要求5或6所述的一种服务器数据传输稳定性的检测系统,其特征在于,所述检测系统中还包括:定位显示单元,用于对数据传输稳定性不合格的服务器进行定位显示。
CN201811553655.6A 2018-12-18 2018-12-18 一种服务器数据传输稳定性的检测方法和系统 Active CN109710501B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811553655.6A CN109710501B (zh) 2018-12-18 2018-12-18 一种服务器数据传输稳定性的检测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811553655.6A CN109710501B (zh) 2018-12-18 2018-12-18 一种服务器数据传输稳定性的检测方法和系统

Publications (2)

Publication Number Publication Date
CN109710501A CN109710501A (zh) 2019-05-03
CN109710501B true CN109710501B (zh) 2021-10-29

Family

ID=66256068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811553655.6A Active CN109710501B (zh) 2018-12-18 2018-12-18 一种服务器数据传输稳定性的检测方法和系统

Country Status (1)

Country Link
CN (1) CN109710501B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489298B (zh) * 2019-07-12 2022-07-08 苏州浪潮智能科技有限公司 一种提高服务器PCIe设备工作稳定性的方法
CN111211937B (zh) * 2019-12-28 2022-03-22 苏州浪潮智能科技有限公司 服务器链路信号稳定性的测试方法、测试装置及测试系统
CN111338874B (zh) * 2020-02-29 2022-05-31 苏州浪潮智能科技有限公司 一种测试gpu速率切换的方法及系统
CN111899731A (zh) * 2020-06-16 2020-11-06 北京百度网讯科技有限公司 语音功能的稳定性测试方法、装置、设备和计算机存储介质
CN113297090B (zh) * 2021-06-11 2024-01-23 南方电网数字平台科技(广东)有限公司 系统测试方法、装置、计算机设备和存储介质
CN113886154B (zh) * 2021-08-27 2023-07-14 苏州浪潮智能科技有限公司 一种自动测试存储链路控制器的方法、装置及介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6480882A (en) * 1987-09-24 1989-03-27 Hitachi Ltd Semiconductor integrated circuit device
CN102662808A (zh) * 2012-03-21 2012-09-12 北京星网锐捷网络技术有限公司 一种pcie硬件故障检测的实现方法与装置
JP2013061840A (ja) * 2011-09-14 2013-04-04 Ricoh Co Ltd 機器管理システム、障害管理装置、機器管理装置、障害管理プログラム、及び機器管理プログラム
CN106201753A (zh) * 2016-06-28 2016-12-07 浪潮(北京)电子信息产业有限公司 一种基于linux中PCIE错误的处理方法及系统
CN107832179A (zh) * 2017-11-27 2018-03-23 郑州云海信息技术有限公司 一种PCIe Error Enabling测试方法
CN107908490A (zh) * 2017-11-09 2018-04-13 郑州云海信息技术有限公司 一种服务器dc测试中gpu寄存器可靠性验证方法与系统
CN108735242A (zh) * 2018-05-22 2018-11-02 郑州云海信息技术有限公司 基于sata硬盘的crc错误信息自动检测方法及系统
CN108763005A (zh) * 2018-05-30 2018-11-06 郑州云海信息技术有限公司 一种内存ecc故障报错方法及系统
CN108920297A (zh) * 2018-07-13 2018-11-30 郑州云海信息技术有限公司 一种诊断黑盒日志中pcie报错信息的方法和系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6480882A (en) * 1987-09-24 1989-03-27 Hitachi Ltd Semiconductor integrated circuit device
JP2013061840A (ja) * 2011-09-14 2013-04-04 Ricoh Co Ltd 機器管理システム、障害管理装置、機器管理装置、障害管理プログラム、及び機器管理プログラム
CN102662808A (zh) * 2012-03-21 2012-09-12 北京星网锐捷网络技术有限公司 一种pcie硬件故障检测的实现方法与装置
CN106201753A (zh) * 2016-06-28 2016-12-07 浪潮(北京)电子信息产业有限公司 一种基于linux中PCIE错误的处理方法及系统
CN107908490A (zh) * 2017-11-09 2018-04-13 郑州云海信息技术有限公司 一种服务器dc测试中gpu寄存器可靠性验证方法与系统
CN107832179A (zh) * 2017-11-27 2018-03-23 郑州云海信息技术有限公司 一种PCIe Error Enabling测试方法
CN108735242A (zh) * 2018-05-22 2018-11-02 郑州云海信息技术有限公司 基于sata硬盘的crc错误信息自动检测方法及系统
CN108763005A (zh) * 2018-05-30 2018-11-06 郑州云海信息技术有限公司 一种内存ecc故障报错方法及系统
CN108920297A (zh) * 2018-07-13 2018-11-30 郑州云海信息技术有限公司 一种诊断黑盒日志中pcie报错信息的方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于CPCI的GSM基站测试硬件平台的设计与实现;荆世勇;《中国优秀硕士学位论文全文数据库信息科技辑》;20140115;全文 *

Also Published As

Publication number Publication date
CN109710501A (zh) 2019-05-03

Similar Documents

Publication Publication Date Title
CN109710501B (zh) 一种服务器数据传输稳定性的检测方法和系统
CN111209131B (zh) 一种基于机器学习确定异构系统的故障的方法和系统
JP7185808B1 (ja) 故障を検出するための方法および装置、モデルをトレーニングするための方法および装置、並びにそれらのデバイスおよび記憶媒体
WO2019169743A1 (zh) 一种服务器故障的检测方法及系统
WO2020052147A1 (zh) 监测设备故障检测方法及装置
CN105117301B (zh) 一种内存预警的方法及装置
CN104809030A (zh) 一种基于Android的异常处理系统及处理方法
WO2018233170A1 (zh) 日志记录方法、装置、计算机设备及存储介质
CN114255784A (zh) 一种基于声纹识别的变电站设备故障诊断方法及相关装置
CN112763960A (zh) 一种就地模块的自运维方法
CN109389697A (zh) 井下巡检数据录入时间的记录方法、设备及可读存储介质
CN110687851A (zh) 一种终端运行监控系统及方法
CN106201753B (zh) 一种基于linux中PCIE错误的处理方法及系统
US8949669B1 (en) Error detection, correction and triage of a storage array errors
CN109635001A (zh) 基于设备失效数据分析的产品可靠性提升方法和系统
CN111526109A (zh) 自动检测web威胁识别防御系统的运行状态的方法及装置
CN113221096A (zh) 一种在混沌工程中随机事件相关性分析方法及系统
CN113010341A (zh) 一种故障内存定位的方法和设备
CN112444697A (zh) 一种电力线路信息监测系统及方法
CN110990223A (zh) 一种基于系统日志的监控告警方法及装置
CN105786668A (zh) 一种基于Redhat系统下内存错误检测方法
US10776240B2 (en) Non-intrusive performance monitor and service engine
TW201409968A (zh) 資通信服務品質評估與即時告警系統與方法
CN112213980A (zh) 一种单片机故障诊断板卡及方法
CN113037550B (zh) 一种服务故障监控方法、系统及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant