CN112732465A - 一种基于配置调度实现自动化远程执行的方法 - Google Patents

一种基于配置调度实现自动化远程执行的方法 Download PDF

Info

Publication number
CN112732465A
CN112732465A CN202110073699.4A CN202110073699A CN112732465A CN 112732465 A CN112732465 A CN 112732465A CN 202110073699 A CN202110073699 A CN 202110073699A CN 112732465 A CN112732465 A CN 112732465A
Authority
CN
China
Prior art keywords
servers
cluster
machine room
fault
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110073699.4A
Other languages
English (en)
Inventor
范瑾
高岐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gaoma Technology Co ltd
Original Assignee
Beijing Gaoma Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gaoma Technology Co ltd filed Critical Beijing Gaoma Technology Co ltd
Priority to CN202110073699.4A priority Critical patent/CN112732465A/zh
Publication of CN112732465A publication Critical patent/CN112732465A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/547Remote procedure calls [RPC]; Web services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于配置调度实现自动化远程执行的方法,并公开了具体的运行方法步骤。本发明涉及计算机技术领域,具体提供了一种基于配置调度实现自动化远程执行的方法,通过远程服务器的整体控制作用,既可以对集群/机房内其他服务器进行实时监控,保证集群/机房内其他服务器运行稳定性,又可以对硬件、软件故障进行及时反馈,并根据预设规则执行自动化故障修复,也为管理员日常巡检操作提供了海量服务器的自动化命令下发、执行结果收集的方法。

Description

一种基于配置调度实现自动化远程执行的方法
技术领域
本发明涉及计算机技术领域,具体为一种基于配置调度实现自动化远程执行的方法。
背景技术
IT运维从诞生发展至今,自动化作为其重要属性之一已经不仅仅只是代替人工操作,更重要的是深层探知和全局分析,关注的是在当前条件下如何实现性能与服务最优化,同时保障投资收益最大化。
自动化对IT运维的影响,已经不仅仅是人与设备之间的关系,已经发展到了面向客户服务驱动IT运维决策的层面,IT运维团队的构成,也从各级技术人员占大多数发展到业务人员甚至用户占大多数的局面。随着用户机房设备数量、种类、品牌越来越多,运维人员工作强度也越来越大,针对海量服务器的日常检查、常见故障的修复都需要由自动取代传统人工。
发明内容
针对上述情况,为克服当前的技术缺陷,本发明提供了一种既可以对服务器进行实时监控保证服务器运行稳定性,又可以对硬件、软件故障进行及时反馈,并根据预设规则执行自动化故障修复,也为管理员日常巡检操作提供了海量服务器的自动化命令下发、执行结果收集的方法。
本发明采取的技术方案如下:本发明一种基于配置调度实现自动化远程执行的方法,具体包括下列步骤:
步骤一:远程服务器向集群/机房内其他服务器发送运行指令;
步骤二:集群/机房内其他服务器上部署的Agent根据运行指令做出反馈,若集群/机房内其他服务器可依据运行指令正常运行,则根据运行指令做出相应动作,若集群/机房内其他服务器不能准确判断远程服务器发送指令,则反馈至远程服务器;
步骤三:远程服务器根据反馈,将报警信息发送至无线连接的移动端,便于相关人员及时收到故障信息,并在故障库内自动查找是否存在同种故障,若故障库内存在类似故障的记录,故障库提供相应的解决方案供维修人员参考或者自动维护检修,若故障库内不存在同种故障,则由专业技术人员进行检修;
步骤四:专业技术人员将故障原因以及解决方案录入添加至故障库内,以补充故障库。
进一步地,所述运行指令包括工作状态监控指令和通断电指令。
进一步地,所述工作状态监控指令负责监控工作状态。
进一步地,所述通断电指令负责通断电控制模块,所述通断电控制模块控制集群/机房内其他服务器的通电或者断电,若监测到集群/机房内其他服务器的运行状态稳定,则控制集群/机房内其他服务器以当前状态稳定保持工作,若监测到集群/机房内其他服务器的运行状态不稳定或者发生故障,则及时反馈至远程服务器,远程服务器下达通断电指令控制集群/机房内其他服务器及时断电。
采用上述结构本发明取得的有益效果如下:本发明一种基于配置调度实现自动化远程执行的方法,通过远程服务器的整体控制作用,既可以对集群/机房内其他服务器进行实时监控,保证集群/机房内其他服务器运行稳定性,又可以对硬件、软件故障进行及时反馈,并根据预设规则执行自动化故障修复,也为管理员日常巡检操作提供了海量服务器的自动化命令下发、执行结果收集的方法。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明一种基于配置调度实现自动化远程执行的方法的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,下面描述中使用的词语“前”、“后”、“左”、“右”、“上”和“下”指的是附图中的方向,词语“内”和“外”分别指的是朝向或远离特定部件几何中心的方向。
如图1所示,本发明采取的技术方案如下:本发明一种基于配置调度实现自动化远程执行的方法,具体包括下列步骤:
步骤一:远程服务器向集群/机房内其他服务器发送运行指令;
步骤二:集群/机房内其他服务器上部署的Agent根据运行指令做出反馈,若集群/机房内其他服务器可依据运行指令正常运行,则根据运行指令做出相应动作,若集群/机房内其他服务器不能准确判断远程服务器发送指令,则反馈至远程服务器;
步骤三:远程服务器根据反馈,将报警信息发送至无线连接的移动端,便于相关人员及时收到故障信息,并在故障库内自动查找是否存在同种故障,若故障库内存在类似故障的记录,故障库提供相应的解决方案供维修人员参考或者自动维护检修,若故障库内不存在同种故障,则由专业技术人员进行检修;
步骤四:专业技术人员将故障原因以及解决方案录入添加至故障库内,以补充故障库。
其中,所述运行指令包括工作状态监控指令和通断电指令。所述工作状态监控指令负责监控工作状态。所述通断电指令负责通断电控制模块,所述通断电控制模块控制集群/机房内其他服务器的通电或者断电,若监测到集群/机房内其他服务器的运行状态稳定,则控制集群/机房内其他服务器以当前状态稳定保持工作,若监测到集群/机房内其他服务器的运行状态不稳定或者发生故障,则及时反馈至远程服务器,远程服务器下达通断电指令控制集群/机房内其他服务器及时断电。
要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物料或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物料或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (4)

1.一种基于配置调度实现自动化远程执行的方法,其特征在于,具体包括下列步骤:
步骤一:远程服务器向集群/机房内其他服务器发送运行指令;
步骤二:集群/机房内其他服务器上部署的Agent根据运行指令做出反馈,若集群/机房内其他服务器可依据运行指令正常运行,则根据运行指令做出相应动作,若集群/机房内其他服务器不能准确判断远程服务器发送指令,则反馈至远程服务器;
步骤三:远程服务器根据反馈,将报警信息发送至无线连接的移动端,并在故障库内自动查找是否存在同种故障,若故障库内存在类似故障的记录,故障库提供相应的解决方案供维修人员参考或者自动维护检修,若故障库内不存在同种故障,则由专业技术人员进行检修;
步骤四:专业技术人员将故障原因以及解决方案录入添加至故障库内,以补充故障库。
2.根据权利要求1所述的一种基于配置调度实现自动化远程执行的方法,其特征在于,所述运行指令包括工作状态监控指令和通断电指令。
3.根据权利要求1所述的一种基于配置调度实现自动化远程执行的方法,其特征在于,所述工作状态监控指令负责监控工作状态。
4.根据权利要求2所述的一种基于配置调度实现自动化远程执行的方法,其特征在于,所述通断电指令负责通断电控制模块,所述通断电控制模块控制集群/机房内其他服务器的通电或者断电,若监测到集群/机房内其他服务器的运行状态稳定,则控制集群/机房内其他服务器以当前状态稳定保持工作,若监测到集群/机房内其他服务器的运行状态不稳定或者发生故障,则及时反馈至远程服务器,远程服务器下达通断电指令控制集群/机房内其他服务器及时断电。
CN202110073699.4A 2021-01-20 2021-01-20 一种基于配置调度实现自动化远程执行的方法 Pending CN112732465A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110073699.4A CN112732465A (zh) 2021-01-20 2021-01-20 一种基于配置调度实现自动化远程执行的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110073699.4A CN112732465A (zh) 2021-01-20 2021-01-20 一种基于配置调度实现自动化远程执行的方法

Publications (1)

Publication Number Publication Date
CN112732465A true CN112732465A (zh) 2021-04-30

Family

ID=75592627

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110073699.4A Pending CN112732465A (zh) 2021-01-20 2021-01-20 一种基于配置调度实现自动化远程执行的方法

Country Status (1)

Country Link
CN (1) CN112732465A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101060391A (zh) * 2007-05-16 2007-10-24 华为技术有限公司 主备服务器切换方法及系统及主用服务器、备用服务器
CN102231681A (zh) * 2011-06-27 2011-11-02 中国建设银行股份有限公司 一种高可用集群计算机系统及其故障处理方法
CN104657150A (zh) * 2015-03-13 2015-05-27 浪潮集团有限公司 一种集群环境下的自动化运维方法
CN105337765A (zh) * 2015-10-10 2016-02-17 上海新炬网络信息技术有限公司 一种分布式hadoop集群故障自动诊断修复系统
CN106790538A (zh) * 2016-12-22 2017-05-31 逯帅 电力系统用运维故障库建立和故障解决方案推送方法
CN206807469U (zh) * 2017-06-20 2017-12-26 胡新炜 一种网络机房集成监控及故障远程处理系统
CN108009300A (zh) * 2017-12-28 2018-05-08 中译语通科技(青岛)有限公司 一种基于大数据技术的远程运维系统
CN109089109A (zh) * 2018-08-31 2018-12-25 北京融通智慧科技有限公司 一种变电站监控视频常见故障的处理方法
CN109117298A (zh) * 2018-09-03 2019-01-01 郑州云海信息技术有限公司 一种硬件故障修复方法、装置及设备
CN111556125A (zh) * 2020-04-24 2020-08-18 北京奇艺世纪科技有限公司 一种访问请求分配方法、负载均衡设备及电子设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101060391A (zh) * 2007-05-16 2007-10-24 华为技术有限公司 主备服务器切换方法及系统及主用服务器、备用服务器
CN102231681A (zh) * 2011-06-27 2011-11-02 中国建设银行股份有限公司 一种高可用集群计算机系统及其故障处理方法
CN104657150A (zh) * 2015-03-13 2015-05-27 浪潮集团有限公司 一种集群环境下的自动化运维方法
CN105337765A (zh) * 2015-10-10 2016-02-17 上海新炬网络信息技术有限公司 一种分布式hadoop集群故障自动诊断修复系统
CN106790538A (zh) * 2016-12-22 2017-05-31 逯帅 电力系统用运维故障库建立和故障解决方案推送方法
CN206807469U (zh) * 2017-06-20 2017-12-26 胡新炜 一种网络机房集成监控及故障远程处理系统
CN108009300A (zh) * 2017-12-28 2018-05-08 中译语通科技(青岛)有限公司 一种基于大数据技术的远程运维系统
CN109089109A (zh) * 2018-08-31 2018-12-25 北京融通智慧科技有限公司 一种变电站监控视频常见故障的处理方法
CN109117298A (zh) * 2018-09-03 2019-01-01 郑州云海信息技术有限公司 一种硬件故障修复方法、装置及设备
CN111556125A (zh) * 2020-04-24 2020-08-18 北京奇艺世纪科技有限公司 一种访问请求分配方法、负载均衡设备及电子设备

Similar Documents

Publication Publication Date Title
CN110782370B (zh) 一种电力调度数据网综合运维管理平台
US7917536B2 (en) Systems, methods and computer program products for managing a plurality of remotely located data storage systems
US20060004830A1 (en) Agent-less systems, methods and computer program products for managing a plurality of remotely located data storage systems
CN110278097B (zh) 一种基于Android系统的服务器运维系统及方法
US20050076052A1 (en) Maintenance service system, method and program
CN105871605A (zh) 一种基于电力营销大数据的运维监控平台
CN108667666A (zh) 一种基于可视化技术的智能运维方法及其系统
CN103606024A (zh) 一种基于调度数据网的集中运维系统及其方法
CN104516324A (zh) 智能型建筑管理系统及多建筑管理系统
CN113673858B (zh) 一种厂务设备的维保方法、装置、系统及存储介质
CN114138639A (zh) 机器人流程自动化的管理系统及方法
CN115222077A (zh) 一种工单运维统计分析系统
US20120143567A1 (en) Scheduling the Maintenance of Operational Equipment
US20060143037A1 (en) System for taking over and operating services and installations at a site
CN112732465A (zh) 一种基于配置调度实现自动化远程执行的方法
CN116991678A (zh) 一种数据中心智能运维系统
CN109039714A (zh) 云计算系统中资源的管理方法和装置
CN117270937A (zh) 数字运营运维管理系统
CN112581304A (zh) 一种制造车间信息化管理系统及其使用方法
KR101913343B1 (ko) Kpi 지표를 이용한 스마트 공장의 모바일 어플리케이션 관리 시스템
CN114816943A (zh) 企业智能云运维系统
Wu et al. Characteristics and development prospect of computer automatic patrol inspection technology
CN109523199B (zh) 基于交互式配网gis平台的可视化外力破坏管控系统
KR102536112B1 (ko) 학습 및 진화하는 아바타를 이용한 태양광 발전시스템의 운영유지보수 장치 및 그 방법
CN118175012A (zh) 供配电网中网络信息设备的自动运维管理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination