CN109324834A - 一种分布式存储服务器自动重启的系统及方法 - Google Patents

一种分布式存储服务器自动重启的系统及方法 Download PDF

Info

Publication number
CN109324834A
CN109324834A CN201811093690.4A CN201811093690A CN109324834A CN 109324834 A CN109324834 A CN 109324834A CN 201811093690 A CN201811093690 A CN 201811093690A CN 109324834 A CN109324834 A CN 109324834A
Authority
CN
China
Prior art keywords
server
restart
script
restarted
distributed storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811093690.4A
Other languages
English (en)
Inventor
韩腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811093690.4A priority Critical patent/CN109324834A/zh
Publication of CN109324834A publication Critical patent/CN109324834A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4416Network booting; Remote initial program loading [RIPL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Retry When Errors Occur (AREA)

Abstract

本发明提出一种分布式存储服务器自动重启的系统及方法,其中系统包括:主服务器及与主服务器进行数据通信的从服务器;主服务器包括:重启脚本发送模块:用于当接收到从服务器发送的从服务器重启请求时,向从服务器发送重启脚本;重启状态信息接收模块:用于接收从服务器发送的从服务器重启状态信息;从服务器包括:状态获取模块:用于获取从服务器状态信息;重启脚本获取模块:用于依据从服务器状态信息确定从服务器需要重启时,向主服务器发送从服务器重启请求;重启脚本运行模块:用于接收主服务器发送的重启脚本,运行重启脚本,并向主服务器发送从服务器重启状态信息。本发明降低了服务器的维护成本,保证了分布式存储服务器的正常运行。

Description

一种分布式存储服务器自动重启的系统及方法
技术领域
本发明涉及计算机应用技术领域,具体涉及一种分布式存储服务器自动重启的系统及方法。
背景技术
为维持分布式存储服务器的正常运行,工作人员需对分布式存储服务器进行性能测试,而由于服务器反复的测试操作,导致服务器运行空间被占用、存储空间受限,从而引起服务器重启甚至宕机,进而影响分布式存储服务器的性能测试进程以及后续的正常应用。
为解决上述问题,本发明提出一种分布式存储服务器自动重启的系统及方法,能够依据服务器状态信息,使服务器执行重启操作,以释放服务器进程空间,保证服务器的正常运行。
发明内容
本发明的目的在于,提出一种分布式存储服务器自动重启的系统及方法,以解决上述技术问题。
第一方面,本发明提出一种分布式存储服务器自动重启的系统,包括:
主服务器及与主服务器进行数据通信的从服务器;
所述主服务器包括:
重启脚本发送模块:用于当接收到从服务器发送的从服务器重启请求时,向从服务器发送重启脚本;
重启状态信息接收模块:用于接收从服务器发送的从服务器重启状态信息;
所述从服务器包括:
状态获取模块:用于获取从服务器状态信息;
重启脚本获取模块:用于依据从服务器状态信息确定从服务器需要重启时,向主服务器发送从服务器重启请求;
重启脚本运行模块:用于接收主服务器发送的重启脚本,运行重启脚本,并向主服务器发送从服务器重启状态信息。
进一步的,所述状态获取模块包括:
发送子单元:用于依据预定时间间隔向从服务器发送状态响应请求;
接收子单元:用于接收从服务器依据上述状态响应请求反馈的从服务器状态信息。
进一步的,所述重启脚本运行模块还用于:备份系统日志,具体包括:
获取系统日志列表;
依据预置系统日志列表次序排列;
将系统日志列表写入预设的系统日志备份空间。
进一步的,所述重启脚本运行模块用于运行重启脚本具体包括:
设定重启次数;
执行监测项监测,若监测项正常,进行下一步,若监测项异常,停止执行从服务器重启;
清除系统日志;
执行从服务器重启。
进一步的,所述监测项包括:
CPU Core、内存、PCIE设备、硬盘。
第二方面,本发明提出一种分布式存储服务器自动重启的方法,包括:
获取从服务器状态信息;
从服务器依据从服务器状态信息确定从服务器需要重启时,向主服务器发送从服务器重启请求;
主服务器接收到从服务器发送的从服务器重启请求时,向从服务器发送重启脚本;
从服务器接收主服务器发送的重启脚本,运行重启脚本,并向主服务器发送从服务器重启状态信息;
主服务器接收从服务器发送的从服务器重启状态信息。
进一步的,所述获取从服务器状态信息包括:
依据预定时间间隔向从服务器发送状态响应请求;
接收从服务器依据上述状态响应请求反馈的从服务器状态信息。
进一步的,所述从服务器运行重启脚本之前还包括:备份系统日志,具体包括:
获取系统日志列表;
依据预置系统日志列表次序排列;
将系统日志列表写入预设的系统日志备份空间。
进一步的,所述从服务器运行重启脚本具体包括:
设定重启次数;
执行监测项监测,若监测项正常,进行下一步,若监测项异常,停止执行从服务器重启;
清除系统日志;
执行从服务器重启。
进一步的,所述监测项包括:
CPU Core、内存、PCIE设备、硬盘。
本发明提供一种分布式存储服务器自动重启的系统及方法,通过判定从服务器状态信息确定从服务器需要重启时,向主服务器发送从服务器重启请求,获取并运行重启脚本,以实现从服务器自动重启的目的。本发明解决了分布式存储器性能反复测试过程中造成的从服务器运行空间被占用的问题,通过从服务器自动重启释放了从服务器的进程空间,进而保证从服务器的正常运行。本发明提供分布式存储服务器自动重启的系统及方法引入了自动重启的机制,避免了现阶段当服务器宕机后需人工重启服务器的问题,在提高效率的同时还降低了服务器的维护成本,保证了分布式存储服务器的正常运行,具有良好的技术价值以及广阔的应用前景。
附图说明
为了更清楚的说明本发明实施例,下面将实施例中所需要使用的附图做简单的介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中分布式存储服务器自动重启的系统原理图。
图2为本发明实施例中分布式存储服务器自动重启的方法流程图。
具体实施方式
下面结合本发明实施例中的附图,对发明实施例中的技术方案进行清楚完整的描述,显然,所描述的实施例仅仅为本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
为了使本技术领域的人员更好的理解本发明方案,下面结合附图和具体实施方式对本发明做进一步的详细说明。
本发明实施例提供一种分布式存储服务器自动重启的系统,如图1所示的,包括:主服务器1及与主服务器1进行数据通信的从服务器2。
上述主服务器1包括:
重启脚本发送模块102:用于当接收到从服务器2发送的从服务器2重启请求时,向从服务器2发送重启脚本;
重启状态信息接收模块202:用于接收从服务器2发送的从服务器2重启状态信息;
上述从服务器2包括:
状态获取模块201:用于获取从服务器2状态信息;
重启脚本获取模块202:用于依据从服务器2状态信息确定从服务器2需要重启时,向主服务器1发送从服务器2重启请求;
重启脚本运行模块203:用于接收主服务器1发送的重启脚本,运行重启脚本,并向主服务器1发送从服务器2重启状态信息。
本实施例中,上述从服务器2重启状态信息,包括从服务器2重启时间、重启次数、监测项信息。
本实施例中,上述状态获取模块201包括:
发送子单元:用于依据预定时间间隔向从服务器2发送状态响应请求;
接收子单元:用于接收从服务器2依据上述状态响应请求反馈的从服务器2状态信息。
上述状态获取模块201的发送子单元及接收子单元,通过预定时间间隔的获取从服务器2状态的形式,使得获取的从服务器2状态信息更为实时准确,也更加方便。
本实施例中,上述重启脚本运行模块203还用于,备份系统日志,具体包括:
获取系统日志列表;
依据预置系统日志列表次序排列;
将系统日志列表写入预设的系统日志备份空间。
上述备份系统日志的步骤,能够确保从服务器2数据的完整性,避免重启过程中可能造成的故障进而导致系统日志丧失的情形。
本实施例中,上述重启脚本运行模式用于运行重启脚本具体包括:
设定重启次数;
执行监测项监测,上述监测项包括:CPU Core、内存、PCIE设备、硬盘;若监测项正常,进行下一步,若监测项异常,停止执行从服务器2重启;
清除系统日志;
执行从服务器2重启。
本发明实施例还提供一种分布式存储服务器自动重启的方法,如图2所示的,包括:
SS1、获取从服务器2状态信息;
SS2、从服务器2依据从服务器2状态信息确定从服务器2需要重启时,向主服务器1发送从服务器2重启请求;
SS3、主服务器1接收到从服务器2发送的从服务器2重启请求时,向从服务器2发送重启脚本;
SS4、从服务器2接收主服务器1发送的重启脚本,运行重启脚本,并向主服务器1发送从服务器2重启状态信息;
SS4、主服务器1接收从服务器2发送的从服务器2重启状态信息。
本实施例中,步骤SS1具体包括:
SS101、依据预定时间间隔向从服务器2发送状态响应请求;
SS102、接收从服务器2依据上述状态响应请求反馈的从服务器2状态信息。
上述获取从服务器2状态的方法,通过预定时间间隔的获取从服务器2 状态的形式,使得获取的从服务器2状态信息更为实时准确,也更加方便。
本实施例中,步骤SS4中运行重启脚本之前需备份系统日志,具体包括:
SS401、获取系统日志列表;
SS402、依据预置系统日志列表次序排列;
SS403、将系统日志列表写入预设的系统日志备份空间。
上述备份系统日志的步骤,能够确保从服务器2数据的完整性,避免重启过程中可能造成的故障进而导致系统日志丧失的情形。
本实施例中,步骤SS4中运行重启脚本具体包括:
设定重启次数;
执行监测项监测,上述监测项包括:CPU Core、内存、PCIE设备、硬盘;若监测项正常,进行下一步,若监测项异常,停止执行从服务器2重启;
清除系统日志;
执行从服务器2重启。
本实施例中,步骤SS4中所述从服务器2重启状态信息,包括从服务器2 重启时间、重启次数、监测项信息。
本发明提供一种分布式存储服务器自动重启的系统及方法,通过判定从服务器状态信息确定从服务器需要重启时,向主服务器发送从服务器重启请求,获取并运行重启脚本,以实现从服务器自动重启的目的。本发明解决了分布式存储器性能反复测试过程中造成的从服务器运行空间被占用的问题,通过从服务器自动重启释放了从服务器的进程空间,进而保证从服务器的正常运行。本发明提供分布式存储服务器自动重启的系统及方法引入了自动重启的机制,避免了现阶段当服务器宕机后需人工重启服务器的问题,在提高效率的同时还降低了服务器的维护成本,保证了分布式存储服务器的正常运行,具有良好的技术价值以及广阔的应用前景。
以上对本发明公开的一种分布式存储服务器自动重启的系统及方法进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,因此描述的较为简单,相关会出参见方法部分说明即可。以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种分布式存储服务器自动重启的系统,其特征在于,包括:主服务器及与主服务器进行数据通信的从服务器;
所述主服务器包括:
重启脚本发送模块:用于当接收到从服务器发送的从服务器重启请求时,向从服务器发送重启脚本;
重启状态信息接收模块:用于接收从服务器发送的从服务器重启状态信息;
所述从服务器包括:
状态获取模块:用于获取从服务器状态信息;
重启脚本获取模块:用于依据从服务器状态信息确定从服务器需要重启时,向主服务器发送从服务器重启请求;
重启脚本运行模块:用于接收主服务器发送的重启脚本,运行重启脚本,并向主服务器发送从服务器重启状态信息。
2.根据权利要求1所述的分布式存储服务器自动重启的系统,其特征在于,所述状态获取模块包括:
发送子单元:用于依据预定时间间隔向从服务器发送状态响应请求;
接收子单元:用于接收从服务器依据上述状态响应请求反馈的从服务器状态信息。
3.根据权利要求1所述的分布式存储服务器自动重启的系统,其特征在于,所述重启脚本运行模块还用于:备份系统日志,具体包括:
获取系统日志列表;
依据预置系统日志列表次序排列;
将系统日志列表写入预设的系统日志备份空间。
4.根据权利要求1所述的分布式存储服务器自动重启的系统,其特征在于,所述重启脚本运行模块用于运行重启脚本具体包括:
设定重启次数;
执行监测项监测,若监测项正常,进行下一步,若监测项异常,停止执行从服务器重启;
清除系统日志;
执行从服务器重启。
5.执行从服务器重启根据权利要求4所述的分布式存储服务器自动重启的系统,其特征在于,所述监测项包括:
CPU Core、内存、PCIE设备、硬盘。
6.一种分布式存储服务器自动重启的方法,其特征在于,包括:
获取从服务器状态信息;
从服务器依据从服务器状态信息确定从服务器需要重启时,向主服务器发送从服务器重启请求;
主服务器接收到从服务器发送的从服务器重启请求时,向从服务器发送重启脚本;
从服务器接收主服务器发送的重启脚本,运行重启脚本,并向主服务器发送从服务器重启状态信息;
主服务器接收从服务器发送的从服务器重启状态信息。
7.根据权利要求6所述的分布式存储服务器自动重启的方法,所述获取从服务器状态信息包括:
依据预定时间间隔向从服务器发送状态响应请求;
接收从服务器依据上述状态响应请求反馈的从服务器状态信息。
8.根据权利要求6所述的分布式存储服务器自动重启的方法,其特征在于,所述从服务器运行重启脚本之前还包括:备份系统日志,具体包括:
获取系统日志列表;
依据预置系统日志列表次序排列;
将系统日志列表写入预设的系统日志备份空间。
9.根据权利要求6所述的分布式存储服务器自动重启的方法,其特征在于,所述从服务器运行重启脚本具体包括:
设定重启次数;
执行监测项监测,若监测项正常,进行下一步,若监测项异常,停止执行从服务器重启;
清除系统日志;
执行从服务器重启。
10.根据权利要求9所述的分布式存储服务器自动重启的方法,其特征在于,所述监测项包括:
CPU Core、内存、PCIE设备、硬盘。
CN201811093690.4A 2018-09-19 2018-09-19 一种分布式存储服务器自动重启的系统及方法 Pending CN109324834A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811093690.4A CN109324834A (zh) 2018-09-19 2018-09-19 一种分布式存储服务器自动重启的系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811093690.4A CN109324834A (zh) 2018-09-19 2018-09-19 一种分布式存储服务器自动重启的系统及方法

Publications (1)

Publication Number Publication Date
CN109324834A true CN109324834A (zh) 2019-02-12

Family

ID=65264872

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811093690.4A Pending CN109324834A (zh) 2018-09-19 2018-09-19 一种分布式存储服务器自动重启的系统及方法

Country Status (1)

Country Link
CN (1) CN109324834A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377357A (zh) * 2019-06-26 2019-10-25 苏州浪潮智能科技有限公司 一种服务器中dimm的配置方法、系统及装置
CN110515820A (zh) * 2019-08-29 2019-11-29 北京浪潮数据技术有限公司 一种服务器故障维护方法、装置、服务器及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102360323A (zh) * 2011-10-28 2012-02-22 东莞市正欣科技有限公司 一种网络服务器宕机自修复的方法及系统
CN102394791A (zh) * 2011-10-26 2012-03-28 浪潮(北京)电子信息产业有限公司 宕机恢复方法和系统
CN104506392A (zh) * 2015-01-04 2015-04-08 华为技术有限公司 一种宕机检测方法及设备
CN104714863A (zh) * 2015-02-06 2015-06-17 浪潮电子信息产业股份有限公司 一种基于Linux操作系统的系统宕机后Raid卡日志完整保存的方法
CN104965727A (zh) * 2015-04-29 2015-10-07 无锡天脉聚源传媒科技有限公司 一种重启服务器的方法及装置
CN106201799A (zh) * 2016-07-14 2016-12-07 浪潮电子信息产业股份有限公司 一种基于ipmi服务对服务器进行DC重启的测试方法
CN106598796A (zh) * 2016-12-16 2017-04-26 郑州云海信息技术有限公司 一种测试reboot时硬件信息稳定性的方法
CN106789191A (zh) * 2016-12-06 2017-05-31 微梦创科网络科技(中国)有限公司 一种分布式部署服务进程自动重启方法及装置
CN103701661B (zh) * 2013-12-23 2017-08-25 浪潮(北京)电子信息产业有限公司 一种实现节点监控的方法及系统
CN107273258A (zh) * 2017-07-24 2017-10-20 郑州云海信息技术有限公司 一种刀片服务器内置交换机的自动化重启测试方法及系统
CN108196982A (zh) * 2017-12-29 2018-06-22 北京诺君安信息技术股份有限公司 一种linux系统自动重启服务的配置方法
CN108427577A (zh) * 2018-01-31 2018-08-21 深圳市元征科技股份有限公司 一种通信方法、装置及系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102394791A (zh) * 2011-10-26 2012-03-28 浪潮(北京)电子信息产业有限公司 宕机恢复方法和系统
CN102360323A (zh) * 2011-10-28 2012-02-22 东莞市正欣科技有限公司 一种网络服务器宕机自修复的方法及系统
CN103701661B (zh) * 2013-12-23 2017-08-25 浪潮(北京)电子信息产业有限公司 一种实现节点监控的方法及系统
CN104506392A (zh) * 2015-01-04 2015-04-08 华为技术有限公司 一种宕机检测方法及设备
CN104714863A (zh) * 2015-02-06 2015-06-17 浪潮电子信息产业股份有限公司 一种基于Linux操作系统的系统宕机后Raid卡日志完整保存的方法
CN104965727A (zh) * 2015-04-29 2015-10-07 无锡天脉聚源传媒科技有限公司 一种重启服务器的方法及装置
CN106201799A (zh) * 2016-07-14 2016-12-07 浪潮电子信息产业股份有限公司 一种基于ipmi服务对服务器进行DC重启的测试方法
CN106789191A (zh) * 2016-12-06 2017-05-31 微梦创科网络科技(中国)有限公司 一种分布式部署服务进程自动重启方法及装置
CN106598796A (zh) * 2016-12-16 2017-04-26 郑州云海信息技术有限公司 一种测试reboot时硬件信息稳定性的方法
CN107273258A (zh) * 2017-07-24 2017-10-20 郑州云海信息技术有限公司 一种刀片服务器内置交换机的自动化重启测试方法及系统
CN108196982A (zh) * 2017-12-29 2018-06-22 北京诺君安信息技术股份有限公司 一种linux系统自动重启服务的配置方法
CN108427577A (zh) * 2018-01-31 2018-08-21 深圳市元征科技股份有限公司 一种通信方法、装置及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377357A (zh) * 2019-06-26 2019-10-25 苏州浪潮智能科技有限公司 一种服务器中dimm的配置方法、系统及装置
CN110377357B (zh) * 2019-06-26 2022-05-24 苏州浪潮智能科技有限公司 一种服务器中dimm的配置方法、系统及装置
CN110515820A (zh) * 2019-08-29 2019-11-29 北京浪潮数据技术有限公司 一种服务器故障维护方法、装置、服务器及存储介质
CN110515820B (zh) * 2019-08-29 2022-07-08 北京浪潮数据技术有限公司 一种服务器故障维护方法、装置、服务器及存储介质

Similar Documents

Publication Publication Date Title
JP6291248B2 (ja) ファームウェアアップグレードエラー検出および自動ロールバック
US10282279B2 (en) System and method for diagnosing information technology systems in multiple virtual parallel universes
US8245077B2 (en) Failover method and computer system
WO2020248507A1 (zh) 基于容器云的系统资源监控方法及相关设备
CN101226515B (zh) 热插拔总线接口的资源分配方法及装置
CN111367743A (zh) 一种循环重启测试过程中服务器掉电的诊断方法及系统
CN109324834A (zh) 一种分布式存储服务器自动重启的系统及方法
CN111338698A (zh) 一种bios准确引导服务器启动的方法及系统
CN107729213B (zh) 一种后台任务监控方法及装置
CN103618634A (zh) 集群中自动发现节点的方法
CN116266150A (zh) 一种业务恢复方法、数据处理单元及相关设备
CN111090546A (zh) 一种操作系统重启方法、装置、设备及可读存储介质
CN102780578A (zh) 网络设备的操作系统的更新系统及更新方法
JP2003173272A (ja) 情報処理システム,情報処理装置及び保守センタ
CN111309388A (zh) 设备的系统软件版本的自动回滚系统及其方法
CN115562900B (zh) Amd服务器系统安装断电处理方法、装置、设备及介质
CN115314361B (zh) 一种服务器集群管理方法及其相关组件
CN104866380A (zh) 一种集群管理系统的状态转换的处理方法和装置
CN109144788B (zh) 一种重建osd的方法、装置及系统
TWI554876B (zh) 節點置換處理方法與使用其之伺服器系統
CN114189305B (zh) 一种时间同步方法、装置、设备及可读存储介质
KR101272802B1 (ko) 모바일 기기를 이용한 컴퓨터 장애 처리 시스템 및 방법
CN110134453B (zh) 服务器配置重载方法及服务器
CN117349062A (zh) 一种bios故障处理方法、系统、装置、设备及介质
US20230305900A1 (en) Workload execution on backend systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190212