CN106911520A - 一种面向hpc集群的故障统计方法和装置 - Google Patents

一种面向hpc集群的故障统计方法和装置 Download PDF

Info

Publication number
CN106911520A
CN106911520A CN201710237075.5A CN201710237075A CN106911520A CN 106911520 A CN106911520 A CN 106911520A CN 201710237075 A CN201710237075 A CN 201710237075A CN 106911520 A CN106911520 A CN 106911520A
Authority
CN
China
Prior art keywords
fault
fault data
input
failure
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710237075.5A
Other languages
English (en)
Inventor
肖义军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dawning Information Industry Beijing Co Ltd
Original Assignee
Dawning Information Industry Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Beijing Co Ltd filed Critical Dawning Information Industry Beijing Co Ltd
Priority to CN201710237075.5A priority Critical patent/CN106911520A/zh
Publication of CN106911520A publication Critical patent/CN106911520A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提出了一种面向HPC集群的故障统计方法和装置,该故障统计方法包括:故障写入流程和故障展示流程,其中,故障写入流程包括:输入多个服务器的故障数据,其中,通过表单录入的方式输入多个服务器的故障数据;获取多个服务器的故障数据,并通过PHP脚本,将多个服务器的故障数据保存至MySQL数据库;以及故障展示流程包括:获取故障查询信息;根据故障查询信息,将MySQL数据库存储的故障数据展示,其中,通过HTML表格将MySQL数据库存储的故障数据展示。本发明基于MySQL数据库,利用PHP和HTML表单将数据写入数据库,通过HTML表格展示给使用者,进而能够减少人工操作的时间和误差,且易于查询统计。

Description

一种面向HPC集群的故障统计方法和装置
技术领域
本发明涉及计算机领域,具体来说,涉及一种面向HPC集群的故障统计方法和装置。
背景技术
在HPC(High Performance Computing,高性能计算)订单联调环节,即服务器完成老化测试后,将用户定制的各型号服务器,统一安装应用环境,进行测试,同时,在测试中难免发现一些故障,需要统计下来,但是,现有技术是将故障数据人工统计到excel表中数据,但是,上述方式存在着易产生误差,统计不及时等缺陷,同时,其是由人工去完成一系列操作,这样耗费人力,效率不高,且容易出错。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的问题,本发明提出一种面向HPC集群的故障统计方法和装置,能够减少人工操作的时间和误差,且易于查询统计。
本发明的技术方案是这样实现的:
根据本发明的一个方面,提供了一种面向HPC集群的故障统计方法。
该故障统计方法包括:故障写入流程和故障展示流程,其中,故障写入流程包括:输入多个服务器的故障数据,其中,通过表单录入的方式输入多个服务器的故障数据;获取多个服务器的故障数据,并通过PHP脚本,将多个服务器的故障数据保存至MySQL数据库;
以及故障展示流程包括:获取故障查询信息;根据故障查询信息,将MySQL数据库存储的故障数据展示,其中,通过HTML表格将MySQL数据库存储的故障数据展示。
根据本发明的一个实施例,通过表单录入的方式输入多个服务器的故障数据包括:加载网页表单,其中,网页表单包括多个栏位;将第一故障数据输入至对应的栏位,待所有的栏位填完后,进行第二故障数据的输入。
根据本发明的一个实施例,多个栏位至少包括:开始时间、结束时间、服务器序列号、生产订单、销售订单、服务器机型、故障数量、发现时间。
根据本发明的一个实施例,进一步包括:判断第一故障数据的输入是否错误;在第一故障数据输入错误的情况下,输出提示信息。
根据本发明的一个实施例,还包括:在MySQL数据库存储的故障数据展示的情况下,对展示的故障数据进行补充。
根据本发明的另一方面,提供了一种面向HPC集群的故障统计装置。
该故障统计装置包括:故障写入装置和故障展示装置,其中,故障写入装置包括:输入模块,用于输入多个服务器的故障数据,其中,通过表单录入的方式输入多个服务器的故障数据;第一获取模块,用于获取多个服务器的故障数据,并通过PHP脚本,将多个服务器的故障数据保存至MySQL数据库;
以及故障展示装置包括:第二获取模块,用于获取故障查询信息;展示模块,用于根据故障查询信息,将MySQL数据库存储的故障数据展示,其中,通过HTML表格将MySQL数据库存储的故障数据展示。
根据本发明的一个实施例,输入模块包括:
记载模块,用于加载网页表单,其中,网页表单包括多个栏位;
输入子模块,用于将第一故障数据输入至对应的栏位,待所有的栏位填完后,进行第二故障数据的输入。
根据本发明的一个实施例,多个栏位至少包括:开始时间、结束时间、服务器序列号、生产订单、销售订单、服务器机型、故障数量、发现时间。
根据本发明的一个实施例,进一步包括:判断模块,用于判断第一故障数据的输入是否错误;输出模块,用于在第一故障数据输入错误的情况下,输出提示信息。
根据本发明的一个实施例,还包括:补充模块,用于在MySQL数据库存储的故障数据展示的情况下,对展示的故障数据进行补充。
本发明通过表单录入的方式输入多个服务器的故障数据,随后通过PHP脚本,将多个服务器的故障数据保存至MySQL数据库,最后通过HTML表格将MySQL数据库存储的故障数据展示,从而基于MySQL数据库,利用PHP和HTML表单将数据写入数据库,通过HTML表格展示给使用者,进而能够减少人工操作的时间和误差,且易于查询统计。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的面向HPC集群的故障统计方法的流程图;
图2是根据本发明具体实施例的表单录入的示意图;
图3是根据本发明具体实施例的故障记录展示的示意图;
图4是根据本发明实施例的面向HPC集群的故障统计装置的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明的实施例,提供了一种面向HPC集群的故障统计方法。
如图1所示,根据本发明实施例的面向HPC集群的故障统计方法包括:故障写入流程和故障展示流程,其中,故障写入流程包括:
步骤S101,输入多个服务器的故障数据,其中,通过表单录入的方式输入多个服务器的故障数据;
步骤S103,获取多个服务器的故障数据,并通过PHP脚本,将多个服务器的故障数据保存至MySQL数据库;
以及故障展示流程包括:
步骤S105,获取故障查询信息;
步骤S107,根据故障查询信息,将MySQL数据库存储的故障数据展示,其中,通过HTML表格将MySQL数据库存储的故障数据展示。
在该实施例中,该方法总体分为2大部分:故障写入部分(或故障写入流程)和故障记录展示部分(或故障展示流程),继续参见图2,服务器完成老化测试后,将用户定制的各型号服务器,统一安装应用环境,进行测试,同时,在测试中难免发现一些故障,用户将该故障的相关信息按照表单中的多个栏位进行对应信息的填写,如开始日期、结束日期等,随后通过PHP(Hypertext Preprocessor,超文本预处理器)脚本将上述故障数据保存至MySQL(关系型数据库管理系统)数据库,从而多个使用者按照上述流程写入故障数据,进而能够测试过程中发现故障,通过表单录入的方式,将故障发生解决的过程记录到MySQL数据库中,继续参见图3,随后当用户需查看故障数据时,通过HTML表格的展示的方式,将所有故障信息展示给使用者。
通过本发明的上述方案,通过表单录入的方式输入多个服务器的故障数据,随后通过PHP脚本,将多个服务器的故障数据保存至MySQL数据库,最后通过HTML表格将MySQL数据库存储的故障数据展示,从而基于MySQL数据库,利用PHP和HTML表单将数据写入数据库,通过HTML表格展示给使用者,进而能够减少人工操作的时间和误差,且易于查询统计。
根据本发明的一个实施例,通过表单录入的方式输入多个服务器的故障数据包括:加载网页表单,其中,网页表单包括多个栏位;将第一故障数据输入至对应的栏位,待所有的栏位填完后,进行第二故障数据的输入。
在该实施例中,继续参见图2,该表单可通过网页的形式呈现,其中,网页表单包括多个栏位,该多个栏位包括:故障开始时间、故障结束时间、服务器序列号、生产订单、销售订单、服务器机型、故障数量、故障发现时间,其中,生产订单是指服务器完成老化测试后,用户定制的各型号服务器的订单,销售订单是由多个生产订单构成,其可包括多个不同型号的服务器,如,生产订单A是用户定制的10个A型号的服务器,生产订单B是用户定制的10个C型号的服务器,该销售订单是用户定制的10个A型号的服务器和10个C型号的服务器,此外,该第一故障数据对应于图3中的一行的故障数据,例如,根据本发明的一个实施例,将ID号为1的故障数据输入,待ID号为1的故障数据输入完成后,输入ID号为2的故障数据,同时,第二故障数据与第一故障数据类似,在此不做阐述。
根据本发明的一个实施例,多个栏位至少包括:开始时间、结束时间、服务器序列号、生产订单、销售订单、服务器机型、故障数量、发现时间,当然可以理解,可根据实际需求对栏位信息进行设置,例如,根据本发明的一个实施例,多个栏位进一步包括故障解决手段,本发明对此不做限定。此外,图2仅示出了故障数据的一部分,剩余的相关栏位信息可参见图3。
根据本发明的一个实施例,进一步包括:判断第一故障数据的输入是否错误;在第一故障数据输入错误的情况下,输出提示信息。
在该实施例中,继续参见图2,当用户在填写故障数据的过程中,通过对应栏位的填写对应的故障数据,从而避免了现有技术中通过excel表等填写故障数据造成的错行、串行等情况,另外,当用户在填写故障数据的过程中,还可判断故障数据的填写是否正确,如,用户填写的故障数据格式不正确(如多位、少位等)的情况下,可输出提示信息,以告知用户故障数据填写错误,如,在填写的故障数据错误的情况下,可通过将字体变颜色、栏位变色等方式告知用户。
根据本发明的一个实施例,还包括:在MySQL数据库存储的故障数据展示的情况下,对展示的故障数据进行补充。
在该实施例中,服务器以曙光的服务器进行示例,当然该方法同样适用于其他类型的服务器,继续参见图3,通过HTML表格的展示的方式,将所有故障信息展示给使用者,输出的故障数据包括:故障序号(ID)、故障开始时间(start time)、故障结束时间(endtime)、服务器序列号(serial number)、生产订单号(order_product)、销售订单号(order_sale)、曙光服务器机型号(sugon_type)、故障数量(number)、故障发现时间(found_time)、修理故障完成时间(finish_time)、故障发现人员(find_man)、故障修理人员(finish_man)、故障(phenomenon)、解决故障手段(solution_method)、结果(result)、故障类型(fault)、出现故障的部门(department)。另外,在MySQL数据库存储的故障数据展示的情况下,对展示的故障数据进行补充(add),如选择部分故障数据或全选故障数据,对选中的故障数据进行修改或添加,此外,为了便于记录,还可采用简写的字母或数字的形式表示对应的栏位信息。
根据本发明的实施例,还提供了一种面向HPC集群的故障统计装置。
如图4所示,根据本发明实施例的故障统计装置包括:故障写入装置和故障展示装置,其中,故障写入装置包括:
输入模块41,用于输入多个服务器的故障数据,其中,通过表单录入的方式输入多个服务器的故障数据;
第一获取模块42,用于获取多个服务器的故障数据,并通过PHP脚本,将多个服务器的故障数据保存至MySQL数据库;
以及故障展示装置包括:
第二获取模块43,用于获取故障查询信息;
展示模块44,用于根据故障查询信息,将MySQL数据库存储的故障数据展示,其中,通过HTML表格将MySQL数据库存储的故障数据展示。
根据本发明的一个实施例,输入模块41包括:
记载模块(未示出),用于加载网页表单,其中,网页表单包括多个栏位;
输入子模块(未示出),用于将第一故障数据输入至对应的栏位,待所有的栏位填完后,进行第二故障数据的输入。
根据本发明的一个实施例,多个栏位至少包括:开始时间、结束时间、服务器序列号、生产订单、销售订单、服务器机型、故障数量、发现时间。
根据本发明的一个实施例,进一步包括:判断模块(未示出),用于判断第一故障数据的输入是否错误;输出模块(未示出),用于在第一故障数据输入错误的情况下,输出提示信息。
根据本发明的一个实施例,还包括:补充模块(未示出),用于在MySQL数据库存储的故障数据展示的情况下,对展示的故障数据进行补充。
综上所述,借助于本发明的上述技术方案,通过表单录入的方式输入多个服务器的故障数据,随后通过PHP脚本,将多个服务器的故障数据保存至MySQL数据库,最后通过HTML表格将MySQL数据库存储的故障数据展示,从而基于MySQL数据库,利用PHP和HTML表单将数据写入数据库,通过HTML表格展示给使用者,进而能够减少人工操作的时间和误差,且易于查询统计。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种面向HPC集群的故障统计方法,其特征在于,包括:故障写入流程和故障展示流程,
所述故障写入流程包括:
输入多个服务器的故障数据,其中,通过表单录入的方式输入所述多个服务器的故障数据;
获取所述多个服务器的故障数据,并通过PHP脚本,将所述多个服务器的故障数据保存至MySQL数据库;以及
所述故障展示流程包括:
获取故障查询信息;
根据所述故障查询信息,将所述MySQL数据库存储的故障数据展示,其中,通过HTML表格将所述MySQL数据库存储的故障数据展示。
2.根据权利要求1所述的故障统计方法,其特征在于,通过表单录入的方式输入所述多个服务器的故障数据包括:
加载网页表单,其中,所述网页表单包括多个栏位;
将第一故障数据输入至对应的栏位,待所有的栏位填完后,进行第二故障数据的输入。
3.根据权利要求2所述的故障统计方法,其特征在于,所述多个栏位至少包括:
开始时间、结束时间、服务器序列号、生产订单、销售订单、服务器机型、故障数量、发现时间。
4.根据权利要求2所述的故障统计方法,其特征在于,进一步包括:
判断所述第一故障数据的输入是否错误;
在所述第一故障数据输入错误的情况下,输出提示信息。
5.根据权利要求1所述的故障统计方法,其特征在于,还包括:
在所述MySQL数据库存储的故障数据展示的情况下,对展示的故障数据进行补充。
6.一种面向HPC集群的故障统计装置,其特征在于,包括:故障写入装置和故障展示装置,
所述故障写入装置包括:
输入模块,用于输入多个服务器的故障数据,其中,通过表单录入的方式输入所述多个服务器的故障数据;
第一获取模块,用于获取所述多个服务器的故障数据,并通过PHP脚本,将所述多个服务器的故障数据保存至MySQL数据库;以及
所述故障展示装置包括:
第二获取模块,用于获取故障查询信息;
展示模块,用于根据所述故障查询信息,将所述MySQL数据库存储的故障数据展示,其中,通过HTML表格将所述MySQL数据库存储的故障数据展示。
7.根据权利要求6所述的故障统计装置,其特征在于,所述输入模块包括:
记载模块,用于加载网页表单,其中,所述网页表单包括多个栏位;
输入子模块,用于将第一故障数据输入至对应的栏位,待所有的栏位填完后,进行第二故障数据的输入。
8.根据权利要求7所述的故障统计装置,其特征在于,所述多个栏位至少包括:
开始时间、结束时间、服务器序列号、生产订单、销售订单、服务器机型、故障数量、发现时间。
9.根据权利要求2所述的故障统计装置,其特征在于,进一步包括:
判断模块,用于判断所述第一故障数据的输入是否错误;
输出模块,用于在所述第一故障数据输入错误的情况下,输出提示信息。
10.根据权利要求6所述的故障统计装置,其特征在于,还包括:
补充模块,用于在所述MySQL数据库存储的故障数据展示的情况下,对展示的故障数据进行补充。
CN201710237075.5A 2017-04-12 2017-04-12 一种面向hpc集群的故障统计方法和装置 Pending CN106911520A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710237075.5A CN106911520A (zh) 2017-04-12 2017-04-12 一种面向hpc集群的故障统计方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710237075.5A CN106911520A (zh) 2017-04-12 2017-04-12 一种面向hpc集群的故障统计方法和装置

Publications (1)

Publication Number Publication Date
CN106911520A true CN106911520A (zh) 2017-06-30

Family

ID=59196087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710237075.5A Pending CN106911520A (zh) 2017-04-12 2017-04-12 一种面向hpc集群的故障统计方法和装置

Country Status (1)

Country Link
CN (1) CN106911520A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060021021A1 (en) * 2004-06-08 2006-01-26 Rajesh Patel Security event data normalization
CN104599059A (zh) * 2015-01-12 2015-05-06 内蒙古自治区农牧业科学院 一种奶牛移动数据管理系统及其方法
CN105224420A (zh) * 2015-10-08 2016-01-06 惠州Tcl移动通信有限公司 一种自动解析终端异常的分析方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060021021A1 (en) * 2004-06-08 2006-01-26 Rajesh Patel Security event data normalization
CN104599059A (zh) * 2015-01-12 2015-05-06 内蒙古自治区农牧业科学院 一种奶牛移动数据管理系统及其方法
CN105224420A (zh) * 2015-10-08 2016-01-06 惠州Tcl移动通信有限公司 一种自动解析终端异常的分析方法及系统

Similar Documents

Publication Publication Date Title
CN108647049A (zh) 基于规则引擎的可配置化系统、方法、设备和存储介质
US9037549B2 (en) System and method for testing data at a data warehouse
KR20210100600A (ko) 소프트웨어 테스팅
CN106796585A (zh) 条件验证规则
CN107220178B (zh) 一种服务器诊断测试结果准实时展现的方法
US20140331203A1 (en) Analysis of source code changes
CN108459957A (zh) 基金系统测试用例的测试方法、装置、设备及存储介质
US10360238B1 (en) Database systems and user interfaces for interactive data association, analysis, and presentation
CN109614324A (zh) 一种测试用例生成方法和装置
Sarhan et al. A survey of challenges in spectrum-based software fault localization
CN110716870A (zh) 服务的自动化测试方法及装置
CN105302115B (zh) 列车网络应用层控制软件自动化测试方法
CN108875061A (zh) 一种分布式文件系统的一致性测试方法及相关装置
CN112433944A (zh) 业务测试方法、装置、计算机设备和存储介质
CN109710528A (zh) 一种测试脚本生成方法、装置、设备和介质
CN103678116A (zh) 用于促进自动化程序测试的方法和系统
CN112579621A (zh) 数据展示方法、装置、电子设备及计算机存储介质
CN113158634A (zh) 批量数据申报方法、装置、设备及计算机可读存储介质
CN116955097A (zh) 测试流程的展示方法、装置和测试流程展示系统
CN106598763A (zh) Bi报表测试方法
CN103019931A (zh) Asn.1接口的检测处理方法和装置
CN117472988A (zh) 一种流程实例的日志查看方法、装置、设备及可读介质
CN106911520A (zh) 一种面向hpc集群的故障统计方法和装置
Blanco et al. Test adequacy evaluation for the user-database interaction: A specification-based approach
CN115794639A (zh) 基于流程的可视化测试及可视化仿真模拟测试系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170630