CN110990226A - 数据中心设备巡检方法及服务器、计算机可读存储介质 - Google Patents

数据中心设备巡检方法及服务器、计算机可读存储介质 Download PDF

Info

Publication number
CN110990226A
CN110990226A CN201911203258.0A CN201911203258A CN110990226A CN 110990226 A CN110990226 A CN 110990226A CN 201911203258 A CN201911203258 A CN 201911203258A CN 110990226 A CN110990226 A CN 110990226A
Authority
CN
China
Prior art keywords
data center
center equipment
information
state information
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911203258.0A
Other languages
English (en)
Inventor
居静
王剑
宋婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanxi Xintong Operation And Maintenance Service Co ltd
Original Assignee
Wright Star Ming Data Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wright Star Ming Data Co Ltd filed Critical Wright Star Ming Data Co Ltd
Priority to CN201911203258.0A priority Critical patent/CN110990226A/zh
Publication of CN110990226A publication Critical patent/CN110990226A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种数据中心设备巡检方法及服务器,所述方法应用于数据中心设备服务器中,所述方法包括:在运维任务检测功能开启时,从数据中心设备数据库中提取数据中心设备信息;根据所述数据中心设备信息获取数据中心设备的运行状态信息;根据所述运行状态信息,更新所述数据中心设备数据库中的数据。采用本发明,解决了运维管理人员在维护数据中心设备时无法智能反馈巡检信息的问题,实现数据中心设备的巡检信息及时反馈,提高数据中心设备的运维管理能力,节省人力。

Description

数据中心设备巡检方法及服务器、计算机可读存储介质
技术领域
本发明涉及网络信息技术领域,特别涉及一种数据中心设备巡检方法及服务器、计算机可读存储介质。
背景技术
数据中心设备的正常运转离不开运维,状态运维就是其中一种运维管理方式。
目前,IT运维管理人员需要人工反馈数据中心设备的运行状态,再通过人工对运行状态进行统计,并人工录入数据库中。整个操作过程效率较低,而且还会影响数据中心设备的正常使用。
发明内容
本申请的目的在于解决运维管理人员在维护数据中心设备时无法智能反馈巡检信息的问题。
为实现上述目的,本发明实施例提供了一种数据中心设备巡检方法及服务器。所述技术方案如下:
第一方面,一种数据中心设备巡检方法,所述方法应用于数据中心设备服务器中,所述方法包括:
在运维任务检测功能开启时,从数据中心设备数据库中提取数据中心设备信息;
根据所述数据中心设备信息获取数据中心设备的运行状态信息;
根据所述运行状态信息,更新所述数据中心设备数据库中的数据。
进一步的,在运维任务检测功能开启时,从数据中心设备数据库中提取数据中心设备信息的具体步骤包括:
接收运维任务检测功能的开启请求,并根据所述请求对所述数据中心设备数据库进行访问;
成功访问所述数据中心设备数据库后,从所述数据中心设备数据库中提取所述数据中心设备信息。
进一步的,根据所述设备信息获取数据中心设备的运行状态信息的具体步骤包括:
提取所述数据中心设备信息中的数据中心设备ID;
获取与所述数据中心设备ID相对应的数据中心设备的运行状态信息。
进一步的,根据所述运行状态信息,更新所述数据中心设备数据库中的数据的具体步骤包括:
分析所述运行状态信息,确定正常状态信息和告警状态信息;
根据所述正常状态信息和所述告警状态信息,更新所述数据中心设备数据库中的数据。
进一步的,所述方法还包括:
根据所述数据中心设备数据库中的数据,判断所述运维任务中的数据中心设备是否存在故障。
第二方面,一种数据中心设备巡检服务器,所述服务器包括:
设备信息提取单元,用于在运维任务检测功能开启时,从数据中心设备数据库中提取数据中心设备信息;
运行信息获取单元,用于根据所述数据中心设备信息获取数据中心设备的运行状态信息;
数据更新单元,用于根据所述运行状态信息,更新所述数据中心设备数据库中的数据;
故障判断单元,用于根据所述数据中心设备数据库中的数据,判断所述运维任务中的数据中心设备是否存在故障。
进一步的,所述设备信息提取单元还用于:
接收运维任务检测功能的开启请求,并根据所述请求对所述数据中心设备数据库进行访问;
成功访问所述数据中心设备数据库后,从所述数据中心设备数据库中提取所述数据中心设备信息。
进一步的,所述运行信息获取单元还用于:
提取所述数据中心设备信息中的数据中心设备ID;
获取与所述数据中心设备ID相对应的数据中心设备的运行状态信息。
进一步的,所述数据更新单元还用于:
分析所述运行状态信息,确定正常状态信息和告警状态信息;
根据所述正常状态信息和所述告警状态信息,更新所述数据中心设备数据库中的数据。
第三方面,一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如第一方面所述的数据中心设备巡检方法。
本发明实施例提供的技术方案带来的有益效果是:通过一种数据中心巡检方法及服务器,解决了运维管理人员在维护数据中心设备时无法智能反馈巡检信息的问题,实现数据中心设备的巡检信息及时反馈,提高数据中心设备的运维管理能力,节省人力。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明中一种数据中心设备巡检方法流程图;
图2是本发明中一种数据中心设备巡检服务器示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种数据中心设备巡检方法,所述方法应用于数据中心服务器中,所述方法包括以下步骤:
101:在运维任务检测功能开启时,从数据中心设备数据库中提取数据中心设备信息。
在实施中,服务器接收运维任务检测功能的开启请求,接收到请求之后,服务器开始对数据中心设备开始巡检,首先,服务器与数据中心设备数据库建立连接,数据中心设备数据库为关系型数据库,如Oracle、DB2、MySQL、MicroSoft SQL Server、MicroSoft Access等,数据中心设备数据库包括信息表、实时告警表以及历史告警表,三个数据表相关联,其中,信息表中包括多个字段,如数据中心设备的ID、型号、序列号、位置信息、用途、使用部门、维护日期等,具体可根据实际情况设定。本实施方式中,信息表中的数据中心设备ID与数据中心设备一一对应,服务器与数据中心设备数据库成功连接后并进行访问,提取信息表中的数据中心设备ID和位置信息。
102:根据所述数据中心设备信息获取数据中心设备的运行状态信息。
在实施中,服务器根据步骤101中所提取的数据中心设备ID,获取数据中心设备的运行状态信息,运行状态信息包括正常状态信息和告警状态信息,其中告警状态信息包括内存标志报警信息、主板故障信息、关机状态信息、数据中心设备关机操作记录信息、电源模块故障信息、硬盘告警信息、高温告警信息。具体的,结合内存灯和故障状态灯说明运行状态信息:
内存标志报警或者主板故障,数据中心设备的内存灯显示黄色,原因有两个方面,一方面是ECC内存校验错误,另一方面是CPU在某个时间内未读取到内存数据。运维人员可以对数据中心设备进行关机,关机后清除报错日志,数据中心设备重启后,换位置重新插内存,如果黄色灯的位置跟随内存移动说明内存故障,反之则是主板故障。
关机状态或者电源模块故障,表现为内存灯灭或者故障状态灯灭。
数据中心设备关机操作记录,维修人员或者运维人员或者其他人员对数据中心设备的关机操作会被记录下来。
硬盘告警,外接设备通过进入阵列卡的BIOS程序查看硬盘状态。当故障状态灯灭时,表示硬盘未供电;当故障状态灯显示琥珀色闪烁时,表示硬盘出现错误;当故障状态灯显示蓝色长亮时,表示硬盘正常工作。
高温告警,出现此状态的原因有四个方面,一方面是网络服务器机柜发热密度过高、散热不良,造成局部过热,另一方面是机房空调制冷量不足,再一方面是数据中心设备的制冷设备异常停机,最后一方面是制冷设备因为异常断电重新恢复供电后不能自动启动,而数据中心设备的其他设备仍然由不间断电源供电,并正常运行发热。
103:根据所述运行状态信息,更新所述数据中心设备数据库中的数据。
在实施中,服务器根据运行状态信息中的正常状态信息,更新数据中心设备数据库中的信息表。服务器根据运行状态信息中的告警状态信息,更新数据中心设备数据库中的实时告警表和历史告警表。在本实施方式中,若数据中心设备的运行状态信息中存在告警状态信息,表明与告警状态信息对应的数据中心设备存在故障,此时,服务器根据数据中心设备数据库中的数据,确定发生故障的数据中心设备的位置信息,并将位置信息发送给运维人员,运维人员根据位置信息对发生故障的数据中心设备进行故障处理,运维人员查看数据中心设备数据库中的实时告警表和历史告警表就可了解数据中心设备的整体状况,具体的,一方面运维人员根据实时告警表即可了解数据中心设备的实时状况,并根据实时状况对数据中心设备进行维护。另一方面运维人员根据历史告警表即可了解数据中心设备的历史运行状态,有利于日后出现新的故障时运维人员可更好的查找出发生故障的原因,并及时解决。
如图2所示,本发明实施例提供了一种数据中心设备巡检服务器,所述服务器包括:
设备信息提取单元201,用于在运维任务检测功能开启时,从数据中心设备数据库中提取数据中心设备信息;
运行信息获取单元202,用于根据所述数据中心设备信息获取数据中心设备的运行状态信息;
数据更新单元203,用于根据所述运行状态信息,更新所述数据中心设备数据库中的数据。
故障判断单元204,用于根据所述数据中心设备数据库中的数据,判定所述运维任务中的数据中心设备是否存在故障。
进一步的,所述设备信息提取单元201还用于:
接收运维任务检测功能的开启请求,并根据所述请求对所述数据中心设备数据库进行访问;
成功访问所述数据中心设备数据库后,从所述数据中心设备数据库中提取所述数据中心设备信息。
进一步的,所述运行信息获取单元202还用于:
提取所述数据中心设备信息中的数据中心设备ID;
获取与所述数据中心设备ID相对应的数据中心设备的运行状态信息。
进一步的,所述数据更新单元203还用于:
分析所述运行状态信息,确定正常状态信息和告警状态信息;
根据所述正常状态信息和所述告警状态信息,更新所述数据中心设备数据库中的数据。
由上可见,通过一种数据中心巡检方法及服务器,解决了运维管理人员在维护数据中心设备时无法智能反馈巡检信息的问题,实现数据中心设备的巡检信息及时反馈,提高数据中心设备的运维管理能力,节省人力。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种数据中心设备巡检方法,其特征在于,所述方法应用于数据中心设备服务器中,所述方法包括:
在运维任务检测功能开启时,从数据中心设备数据库中提取数据中心设备信息;
根据所述数据中心设备信息获取数据中心设备的运行状态信息;
根据所述运行状态信息,更新所述数据中心设备数据库中的数据。
2.根据权利要求1所述的方法,其特征在于,在运维任务检测功能开启时,从数据中心设备数据库中提取数据中心设备信息的具体步骤包括:
接收运维任务检测功能的开启请求,并根据所述请求对所述数据中心设备数据库进行访问;
成功访问所述数据中心设备数据库后,从所述数据中心设备数据库中提取所述数据中心设备信息。
3.根据权利要求1所述的方法,其特征在于,根据所述设备信息获取数据中心设备的运行状态信息的具体步骤包括:
提取所述数据中心设备信息中的数据中心设备ID;
获取与所述数据中心设备ID相对应的数据中心设备的运行状态信息。
4.根据权利要求1所述的方法,其特征在于,根据所述运行状态信息,更新所述数据中心设备数据库中的数据的具体步骤包括:
分析所述运行状态信息,确定正常状态信息和告警状态信息;
根据所述正常状态信息和所述告警状态信息,更新所述数据中心设备数据库中的数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述数据中心设备数据库中的数据,判断所述运维任务中的数据中心设备是否存在故障。
6.一种数据中心设备巡检服务器,其特征在于,所述服务器包括:
设备信息提取单元,用于在运维任务检测功能开启时,从数据中心设备数据库中提取数据中心设备信息;
运行信息获取单元,用于根据所述数据中心设备信息获取数据中心设备的运行状态信息;
数据更新单元,用于根据所述运行状态信息,更新所述数据中心设备数据库中的数据;
故障判断单元,用于根据所述数据中心设备数据库中的数据,判断所述运维任务中的数据中心设备是否存在故障。
7.根据权利要求6所述的服务器,其特征在于,所述设备信息提取单元还用于:
接收运维任务检测功能的开启请求,并根据所述请求对所述数据中心设备数据库进行访问;
成功访问所述数据中心设备数据库后,从所述数据中心设备数据库中提取所述数据中心设备信息。
8.根据权利要求6所述的服务器,其特征在于,所述运行信息获取单元还用于:
提取所述数据中心设备信息中的数据中心设备ID;
获取与所述数据中心设备ID相对应的数据中心设备的运行状态信息。
9.根据权利要求6所述的服务器,其特征在于,所述数据更新单元还用于:
分析所述运行状态信息,确定正常状态信息和告警状态信息;
根据所述正常状态信息和所述告警状态信息,更新所述数据中心设备数据库中的数据。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至5任一所述的数据中心设备巡检方法。
CN201911203258.0A 2019-11-29 2019-11-29 数据中心设备巡检方法及服务器、计算机可读存储介质 Pending CN110990226A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911203258.0A CN110990226A (zh) 2019-11-29 2019-11-29 数据中心设备巡检方法及服务器、计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911203258.0A CN110990226A (zh) 2019-11-29 2019-11-29 数据中心设备巡检方法及服务器、计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN110990226A true CN110990226A (zh) 2020-04-10

Family

ID=70088517

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911203258.0A Pending CN110990226A (zh) 2019-11-29 2019-11-29 数据中心设备巡检方法及服务器、计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110990226A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157533A (zh) * 2021-03-05 2021-07-23 南方电网深圳数字电网研究院有限公司 营业厅设备的安全监测方法、终端、服务器及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019030698A1 (en) * 2017-08-08 2019-02-14 Perry + Currier Inc. METHOD, SYSTEM AND APPARATUS FOR PROCESSING DATABASE UPDATES
CN110149218A (zh) * 2019-04-04 2019-08-20 视联动力信息技术股份有限公司 一种告警信息的处理方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019030698A1 (en) * 2017-08-08 2019-02-14 Perry + Currier Inc. METHOD, SYSTEM AND APPARATUS FOR PROCESSING DATABASE UPDATES
CN110149218A (zh) * 2019-04-04 2019-08-20 视联动力信息技术股份有限公司 一种告警信息的处理方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157533A (zh) * 2021-03-05 2021-07-23 南方电网深圳数字电网研究院有限公司 营业厅设备的安全监测方法、终端、服务器及系统

Similar Documents

Publication Publication Date Title
US6865685B2 (en) Power supply event notification system for sending an electronic notification to multiple destinations
US11249835B2 (en) Automatic repair of computing devices in a data center
CN111897671A (zh) 故障恢复方法、计算机设备及存储介质
CN111444031A (zh) 服务器故障预警方法、装置、计算机设备及存储介质
CN102937930A (zh) 应用程序监控系统及方法
CN109299064B (zh) 数据库监控方法及终端设备
CN106055438A (zh) 一种快速定位主板上内存条异常的方法及系统
WO2019000963A1 (zh) 业务系统预先稽查方法、服务器及计算机可读存储介质
CN111858176A (zh) 一种远程监控故障自愈系统和方法
CN103678087A (zh) 服务器风扇状态监控方法及系统
CN110990226A (zh) 数据中心设备巡检方法及服务器、计算机可读存储介质
CN115794588A (zh) 内存故障预测方法、装置、系统及监测服务器
CN109460311A (zh) 固件异常状态的管理方法和装置
CN117077594A (zh) 一种仿真加速器监控的方法、系统、计算机设备及介质
CN115190044B (zh) 设备连接状态检查方法、装置、设备和存储介质
CN113010375B (zh) 设备告警方法及相关设备
CN113468189A (zh) 设备信息管理方法、装置及系统
CN110750427A (zh) 一种数据中心设备巡检方法及系统
CN110943863A (zh) 一种数据中心
CN112561385A (zh) 风险监控方法及系统
CN112131090B (zh) 业务系统性能监控方法及装置、设备及介质
CN113656358A (zh) 一种数据库日志文件处理方法及系统
CN113448811B (zh) 服务器系统故障灯点亮的方法、装置、设备及可读介质
CN118331823B (zh) 航天工程业务运行日志管理与监控告警方法及系统
CN118132118B (zh) 固件升级方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230413

Address after: Room 401, Office Building, No.1 Rong Street, Equipment Manufacturing Industrial Park, Datong Economic and Technological Development Zone, Datong City, Shanxi Province, 037000

Applicant after: Shanxi Xintong Operation and Maintenance Service Co.,Ltd.

Address before: 075400 village committee yard of Huangying village, sangyuan Town, Huailai County, Zhangjiakou City, Hebei Province

Applicant before: Wright Star Ming Data Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200410