CN111352773A - 一种基于大数据的云计算服务器监测控制方法及系统 - Google Patents

一种基于大数据的云计算服务器监测控制方法及系统 Download PDF

Info

Publication number
CN111352773A
CN111352773A CN202010126740.5A CN202010126740A CN111352773A CN 111352773 A CN111352773 A CN 111352773A CN 202010126740 A CN202010126740 A CN 202010126740A CN 111352773 A CN111352773 A CN 111352773A
Authority
CN
China
Prior art keywords
fault
temperature
storage equipment
monitoring
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010126740.5A
Other languages
English (en)
Inventor
张彩霞
王向东
胡绍林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan University
Original Assignee
Foshan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan University filed Critical Foshan University
Priority to CN202010126740.5A priority Critical patent/CN111352773A/zh
Publication of CN111352773A publication Critical patent/CN111352773A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开一种基于大数据的云计算服务器监测控制方法及系统,包括:存储设备、备用存储设备、温度监测模块、信息比对模块、监控管理服务器;本发明通过实时监测存储设备的故障情况和温度情况,可以对出现故障的存储设备或者温度过高的存储设备及时进行替换,保证了设备的传输,提高设备的传输效率,减少文件丢失的风险,延长设备寿命;本发明可用于云存储设备。

Description

一种基于大数据的云计算服务器监测控制方法及系统
技术领域
本发明涉及云计算服务器技术领域,尤其涉及一种基于大数据的云计算服务器监测控制方法及系统。
背景技术
大数据,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语;在总数据量相同的情况下,与个别分析独立的小型数据集相比,将各个小型数据集合并后进行分析可得出许多额外的信息和数据关系性;目前的大数据云计算服务器多通常保存大量的同步数据,在对云计算服务器内的数据存储单元进行频繁写入时,会产生大量的热量,影响了存储设备的寿命和数据传输效率,同时,存储设备出现故障时,难以进行有效的处理,影响后续数据的传输,造成不可挽回的影响。
发明内容
本发明的目的在于提出一种基于大数据的云计算服务器监测控制方法及系统,以解决现有技术中所存在的一个或多个技术问题,至少提供一种有益的选择或创造条件。
本发明的目的采用如下技术方案实现:一种基于大数据的云计算服务器监测控制方法,包括:
S1、实时监测存储设备状态,当发现某个存储设备出现故障以后进入S4,出现故障的存储设备为故障存储设备;监测到没有出现故障的设备以后进入S2,没有出现故障的设备为无故障存储设备;
S2、实时监测无故障存储设备表面温度;
S3、将无故障存储设备表面温度与数据库内设定的温度表进行比较,得出温度对比结果;当发现某个无故障存储设备表面温度超过温度健康值以后进入S4,出现超过温度健康值的无故障存储设备存储设备为温度过高存储设备;
S4、唤醒备用存储设备并将被唤醒的备用存储设备的等级分别从备用等级提升至正常工作等级;
S5、将故障存储设备、温度过高存储设备的等级降低至故障等级,故障等级小于正常工作等级和备用等级;
S6、对被唤醒的备用存储设备的状态进行监测,如果正常则将后续应该存储到故障存储设备、温度过高存储设备的数据传输到被唤醒的备用存储设备中进行存储,如果不正常则将被唤醒的备用存储设备设定为新的故障存储设备,并重复S4至S6。
作为上述技术方案的进一步改进,S5中监控管理服务器将故障存储设备、温度过高存储设备的等级降低至故障等级,并对故障存储设备进行报警。
作为上述技术方案的进一步改进,还包括:S6还包括:根据各个无故障存储设备的实时温度数据控制数据存储。
作为上述技术方案的进一步改进,还包括:S6还包括:间隔半小时将温度过高存储设备进行故障监测和温度检测,监测结果无故障且温度正常则将等级提升至备用等级。
一种基于大数据的云计算服务器监测控制系统,包括:
存储设备,用于存储数据;
备用存储设备,用于备用存储数据;
温度监测模块,用于实时监测存储设备表面温度;
信息比对模块,用于将存储设备表面温度与数据库内设定的温度表进行比较;
监控管理服务器,用于实时监测存储设备状态,提升降低存储设备的等级,控制数据的存储。
作为上述技术方案的进一步改进,还包括报警服务器,所述报警服务器用于对存储设备进行故障报警。
本发明的有益效果是:本发明通过实时监测存储设备的故障情况和温度情况,可以对出现故障的存储设备或者温度过高的存储设备及时进行替换,保证了设备的传输,提高设备的传输效率,减少文件丢失的风险,延长设备寿命。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明提供的一种基于大数据的云计算服务器监测控制方法及系统的电路模块结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
一种基于大数据的云计算服务器监测控制方法,包括:
S1、实时监测存储设备状态,当发现某个存储设备出现故障以后进入步骤S4,出现故障的存储设备为故障存储设备;监测到没有出现故障的设备以后进入S2,没有出现故障的设备为无故障存储设备;
S2、实时监测无故障存储设备表面温度;
具体地,传感温度传感器检测存储设备的表面温度,并通过温度采集模块将温度数据发送到对比分析模块进行分析。
S3、将无故障存储设备表面温度与数据库内设定的温度表进行比较,得出温度对比结果;当发现某个无故障存储设备表面温度超过温度健康值以后进入S4,出现超过温度健康值的无故障存储设备存储设备为温度过高存储设备;
具体地,当系统检测到多个故障存储设备、温度过高存储设备的时候,首先系统会需替换的存储设备个数,然后系统会将唤醒相应数量的备用存储设备并为其加载存储节点程序,使其成为新的存储设备进入系统进行监测。
S4、唤醒备用存储设备并将被唤醒的备用存储设备的等级分别从备用等级提升至正常工作等级;
将存储设备和备用的存储设备设置为不同的等级,存储设备为正常工作等级,备用的存储设备的等级低于正常工作等级,对存储设备和备用的存储设备进行区分,使其各司其职。
S5、将故障存储设备、温度过高存储设备的等级降低至故障等级,故障等级小于正常工作等级和备用等级,并对故障存储设备进行报警;
故障等级小于备用的存储设备的等级,根据不同的等级系统可以对不同等级的存储设备进行工作运行安排,同时对故障等级设为报警等级。
具体地,通过无线网络进行报警,可以实现远距离报警,快速自动化。
S6、对被唤醒的备用存储设备的状态进行监测,如果正常则将后续应该存储到故障存储设备、温度过高存储设备的数据传输到被唤醒的备用存储设备中进行存储,如果不正常则将被唤醒的备用存储设备设定为新的故障存储设备,并重复S4至S6;根据各个无故障存储设备的实时温度数据控制数据存储;间隔半小时将温度过高存储设备进行故障监测和温度检测,监测结果无故障且温度正常则将等级提升至备用等级;
具体地,通过温度传感器监测到的各个无故障存储设备的温度并由对比分析模块得到的温度对比结果,系统控制较少的数据传输到其中温度较高的存储设备进行存储,系统控制较多的数据传输到其中温度较低的存储设备进行存储。
优选地,温度健康值为55度,最佳传输温度值为50度;传输到表面温度为50度的存储设备的数据量为总数据除以存储设备数,即平均数据值;存储设备表面温度在最佳传输温度值的基础上每降低5度,则传输到该存储设备的数据值为平均数据值+0.2乘以平均数据值;存储设备表面温度在最佳传输温度值的基础上每升高1度,则传输到该存储设备的数据值为平均数据值-0.2乘以平均数据值。
在温度过高存储设备进行半个小时的自然冷却之后,存储设备重新进行故障监测和温度检测,达到健康的标准,即无故障且温度未超过温度健康值,则将该存储设备的等级提升为备用等级。
请参照图1,一种基于大数据的云计算服务器监测控制系统,包括:存储设备、备用存储设备、温度监测模块、信息比对模块、监控管理服务器和报警服务器。
存储设备用于存储数据;备用存储设备用于备用存储数据;温度监测模块用于实时监测存储设备表面温度;信息比对模块用于将存储设备表面温度与数据库内设定的温度表进行比较;监控管理服务器用于实时监测存储设备状态,提升降低存储设备的等级,控制数据的存储;报警服务器用于对存储设备进行故障报警。
本发明通过实时监测存储设备的故障情况和温度情况,可以对出现故障的存储设备或者温度过高的存储设备及时进行替换,保证了设备的传输,提高设备的传输效率,减少文件丢失的风险,延长设备寿命。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所述技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (6)

1.一种基于大数据的云计算服务器监测控制方法,其特征在于:包括:
S1、实时监测存储设备状态,当发现某个存储设备出现故障以后进入S4,出现故障的存储设备为故障存储设备;监测到没有出现故障的设备以后进入S2,没有出现故障的设备为无故障存储设备;
S2、实时监测无故障存储设备表面温度;
S3、将无故障存储设备表面温度与数据库内设定的温度表进行比较,得出温度对比结果;当发现某个无故障存储设备表面温度超过温度健康值以后进入S4,出现超过温度健康值的无故障存储设备存储设备为温度过高存储设备;
S4、唤醒备用存储设备并将被唤醒的备用存储设备的等级分别从备用等级提升至正常工作等级;
S5、将故障存储设备、温度过高存储设备的等级降低至故障等级,故障等级小于正常工作等级和备用等级;
S6、对被唤醒的备用存储设备的状态进行监测,如果正常则将后续应该存储到故障存储设备、温度过高存储设备的数据传输到被唤醒的备用存储设备中进行存储,如果不正常则将被唤醒的备用存储设备设定为新的故障存储设备,并重复S4至S6。
2.根据权利要求1所述的一种基于大数据的云计算服务器监测控制方法,其特征在于:S5中监控管理服务器将故障存储设备、温度过高存储设备的等级降低至故障等级,并对故障存储设备进行报警。
3.根据权利要求1所述的一种基于大数据的云计算服务器监测控制方法,其特征在于:还包括:S6还包括:根据各个无故障存储设备的实时温度数据控制数据存储。
4.根据权利要求1所述的一种基于大数据的云计算服务器监测控制方法,其特征在于:还包括:S6还包括:间隔半小时将温度过高存储设备进行故障监测和温度检测,监测结果无故障且温度正常则将等级提升至备用等级。
5.一种基于大数据的云计算服务器监测控制系统,其特征在于:包括:
存储设备,用于存储数据;
备用存储设备,用于备用存储数据;
温度监测模块,用于实时监测存储设备表面温度;
信息比对模块,用于将存储设备表面温度与数据库内设定的温度表进行比较;
监控管理服务器,用于实时监测存储设备状态,提升降低存储设备的等级,控制数据的存储。
6.根据权利要求5所述的一种基于大数据的云计算服务器监测控制系统,其特征在于:还包括报警服务器,所述报警服务器用于对存储设备进行故障报警。
CN202010126740.5A 2020-02-28 2020-02-28 一种基于大数据的云计算服务器监测控制方法及系统 Pending CN111352773A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010126740.5A CN111352773A (zh) 2020-02-28 2020-02-28 一种基于大数据的云计算服务器监测控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010126740.5A CN111352773A (zh) 2020-02-28 2020-02-28 一种基于大数据的云计算服务器监测控制方法及系统

Publications (1)

Publication Number Publication Date
CN111352773A true CN111352773A (zh) 2020-06-30

Family

ID=71197153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010126740.5A Pending CN111352773A (zh) 2020-02-28 2020-02-28 一种基于大数据的云计算服务器监测控制方法及系统

Country Status (1)

Country Link
CN (1) CN111352773A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103354503A (zh) * 2013-05-23 2013-10-16 浙江闪龙科技有限公司 一种可自动检测及替换故障节点的云存储系统及其方法
CN207440717U (zh) * 2017-10-25 2018-06-01 常州轻工职业技术学院 基于大数据的云计算服务器平台
CN110690763A (zh) * 2019-11-13 2020-01-14 上海迈内能源科技有限公司 一种电力系统智能监控装置及其监控方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103354503A (zh) * 2013-05-23 2013-10-16 浙江闪龙科技有限公司 一种可自动检测及替换故障节点的云存储系统及其方法
CN207440717U (zh) * 2017-10-25 2018-06-01 常州轻工职业技术学院 基于大数据的云计算服务器平台
CN110690763A (zh) * 2019-11-13 2020-01-14 上海迈内能源科技有限公司 一种电力系统智能监控装置及其监控方法

Similar Documents

Publication Publication Date Title
CN103354503A (zh) 一种可自动检测及替换故障节点的云存储系统及其方法
CN113074833A (zh) 机房健康状态预警系统及方法
CN113708493A (zh) 基于云边协同的配电终端运维方法、装置和计算机设备
CN109040277A (zh) 一种服务器的远程监控方法及装置
CN102495786B (zh) 服务器系统
CN212895016U (zh) 一种基于LoRa无线测控技术的铝电解槽况诊断系统
CN116345699B (zh) 一种基于互联网的输电电路信息采集系统及采集方法
CN111982334A (zh) 温度修正方法及装置、计算机存储介质、处理器
CN111596643A (zh) 一种基于大数据的可视化动态能耗诊断、分析和预控系统
CN117119783B (zh) 一种模块待机功耗的控制方法
CN111341063A (zh) 用电设备安全预警监测智控系统、方法、装置及终端设备
CN112882901A (zh) 一种分布式处理系统健康状态智能监控器
CN113487182B (zh) 设备健康状态评估方法、装置、计算机设备和介质
CN106339294A (zh) 一种电压监控系统及方法
CN111352773A (zh) 一种基于大数据的云计算服务器监测控制方法及系统
CN113391611B (zh) 动力环境监控系统的预警方法、装置及系统
CN116455079B (zh) 基于大数据的用电信息一体化安全监管系统及方法
CN116345687A (zh) 电力监控系统用户行为安全预警系统
CN113741656A (zh) 一种基于vpx架构的机箱管理系统及方法
CN113469453B (zh) 基于信息物理系统的电梯评估方法以及电梯评估装置
CN215642677U (zh) 一种计算机故障报警系统
CN116991664A (zh) 一种面向信息机房的异常监督管理方法与系统
CN113746695B (zh) 一种故障监测的调整方法、装置及设备
CN211293180U (zh) 一种数据中心分布式电池监控系统
CN116389584B (zh) 电化学储能站云边数据传输方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200630

RJ01 Rejection of invention patent application after publication