CN109005066A - 基于Docker分布式服务器运维管理方法及计算机可读存储介质 - Google Patents
基于Docker分布式服务器运维管理方法及计算机可读存储介质 Download PDFInfo
- Publication number
- CN109005066A CN109005066A CN201810985016.0A CN201810985016A CN109005066A CN 109005066 A CN109005066 A CN 109005066A CN 201810985016 A CN201810985016 A CN 201810985016A CN 109005066 A CN109005066 A CN 109005066A
- Authority
- CN
- China
- Prior art keywords
- server
- operation management
- docker
- distributed
- info
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0813—Configuration setting characterised by the conditions triggering a change of settings
- H04L41/082—Configuration setting characterised by the conditions triggering a change of settings the condition being updates or upgrades of network functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
- G06F8/61—Installation
- G06F8/63—Image based installation; Cloning; Build to order
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
- G06F8/65—Updates
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5041—Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the time relationship between creation and deployment of a service
- H04L41/5045—Making service definitions prior to deployment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/16—Implementing security features at a particular protocol layer
- H04L63/168—Implementing security features at a particular protocol layer above the transport layer
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Environmental & Geological Engineering (AREA)
- Computer Security & Cryptography (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供一种基于Docker分布式服务器运维管理方法,包括收集分布式系统中每个分布式服务器的服务器信息;将服务器信息以及Docker服务端口注册至运维管理服务器;运维管理服务器验证服务器信息,验证通过后,生成对应的服务器记录;运维管理服务器对分布式服务器进行Docker容器的部署或升级;运维管理服务器定时获取每个分布式服务器的服务器信息,对每个服务器进行运维管理;本发明还提供一种计算机可读存储介质,能够有效解决分布式系统在服务器部署升级、告警监控、自我修复上人力成本耗费多以及操作困难的问题。
Description
技术领域
本发明涉及一种基于Docker分布式服务器运维管理方法及计算机可读存储介质。
背景技术
由于分布式系统各个服务分布在不同的服务器上,随着服务的增多,系统的运维度也变得复杂。在服务的部署升级上,需要运维人员每台专门去维护,耗费人力成本巨大。分布式的服务器众多,对于其监控告警也存在很多不便,现缺乏一种统一的运维方式。现有的基于Docker的分布式系统虽然有着服务环境易于打包部署的优势,但缺乏对于物理机的实时监控。
发明内容
本发明要解决的技术问题,在于提供一种基于Docker分布式服务器运维管理方法及计算机可读存储介质,能够有效解决分布式系统在服务器部署升级、告警监控、自我修复上人力成本耗费多以及操作困难的问题。
本发明之一是这样实现的:一种基于Docker分布式服务器运维管理方法,包括:
步骤1、收集分布式系统中每个分布式服务器的服务器信息;
步骤2、将服务器信息以及Docker服务端口注册至运维管理服务器;
步骤3、运维管理服务器验证服务器信息,验证通过后,生成对应的服务器记录;
步骤4、运维管理服务器对分布式服务器进行Docker容器的部署或升级;
步骤5、运维管理服务器定时获取每个分布式服务器的服务器信息,对每个服务器进行运维管理。
进一步地,还包括步骤6、设置一堡垒机服务器,所述运维管理服务器通过所述堡垒机服务器进行SSH连接。
进一步地,所述服务器信息包括网卡信息、硬件信息、防火墙信息以及进程信息。
进一步地,所述步骤4进一步具体为:若运维管理服务器存在部署或者升级策略,运维管理服务器下发对应指令至服务器,服务器进行自我检查判断是否符合部署或者升级的条件,若是符合,则获取Docker镜像进行部署或者升级,最后返回结果至运维服务器。
本发明之二是这样实现的:一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
步骤1、收集分布式系统中每个分布式服务器的服务器信息;
步骤2、将服务器信息以及Docker服务端口注册至运维管理服务器;
步骤3、运维管理服务器验证服务器信息,验证通过后,生成对应的服务器记录;
步骤4、运维管理服务器对分布式服务器进行Docker容器的部署或升级;
步骤5、运维管理服务器定时获取每个分布式服务器的服务器信息,对每个服务器进行运维管理。
进一步地,还包括步骤6、设置一堡垒机服务器,所述运维管理服务器通过所述堡垒机服务器进行SSH连接。
进一步地,所述服务器信息包括网卡信息、硬件信息、防火墙信息以及进程信息。
进一步地,所述步骤4进一步具体为:若运维管理服务器存在部署或者升级策略,运维管理服务器下发对应指令至服务器,服务器进行自我检查判断是否符合部署或者升级的条件,若是符合,则获取Docker镜像进行部署或者升级,最后返回结果至运维服务器。
本发明具有如下优点:由于分布式系统特性不可避免服务器增多,会导致各个服务器监控起来难以操作,特别是告警信息无法及时获取。而使用本发明可以规避这种情况,因为本发明的是通过一个独立对服务器进行监控,同时搭建一个统一的运维平台告警内容进行分析处理。
分布式系统各个服务器众多,运维过程中缺乏统一的管理入口,而且运维人员的操作不易被记录,难以进行相应的审计定责。而本发明通过堡垒机为统一的入口,从而对服务器进行访问。在运维管理平台上记录操作人员的操作行为,以此来达到对分布式服务器操作管理的目的。同时运维平台也可以远程配置防火墙规则,以应对不同异常情况,采取不同的安全策略。
附图说明
下面参照附图结合实施例对本发明作进一步的说明。
图1为本发明方法执行流程图。
图2是本发明服务器运维程序初次运行流程图
图3是本发明服务器部署升级的流程图
图4是本发明服务器运维SSH连接流程图
具体实施方式
如图1所示,本发明基于Docker分布式服务器运维管理方法,包括:
步骤1、收集分布式系统中每个分布式服务器的服务器信息,所述服务器信息包括网卡信息、硬件信息、防火墙信息以及进程信息;
步骤2、将服务器信息以及Docker服务端口注册至运维管理服务器;
步骤3、运维管理服务器验证服务器信息,验证通过后,生成对应的服务器记录;
步骤4、若运维管理服务器存在部署或者升级策略,运维管理服务器下发对应指令至服务器,服务器进行自我检查判断是否符合部署或者升级的条件,若是符合,则获取Docker镜像进行部署或者升级,最后返回结果至运维服务器;
步骤5、运维管理服务器定时获取每个分布式服务器的服务器信息,对每个服务器进行运维管理。
步骤6、设置一堡垒机服务器,所述运维管理服务器通过所述堡垒机服务器进行SSH连接。
如图1所示,本发明计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
步骤1、收集分布式系统中每个分布式服务器的服务器信息,所述服务器信息包括网卡信息、硬件信息、防火墙信息以及进程信息;
步骤2、将服务器信息以及Docker服务端口注册至运维管理服务器;
步骤3、运维管理服务器验证服务器信息,验证通过后,生成对应的服务器记录;
步骤4、若运维管理服务器存在部署或者升级策略,运维管理服务器下发对应指令至服务器,服务器进行自我检查判断是否符合部署或者升级的条件,若是符合,则获取Docker镜像进行部署或者升级,最后返回结果至运维服务器;
步骤5、运维管理服务器定时获取每个分布式服务器的服务器信息,对每个服务器进行运维管理;
步骤6、设置一堡垒机服务器,所述运维管理服务器通过所述堡垒机服务器进行SSH连接。
本发明一种具体实施方式:
方法包括:对于基于Docker分布式系统上的服务器,安装一个运维程序。该程序独立于服务器上部署的正式服务。通过该程序可以自动收集各个物理机器上的信息,包括CPU、磁盘、内存、网卡信息、操作系统、内核版本、防火墙规则、进程等信息,同时自动配置、启动Docker服务并获取docker服务端口,自动注册到指定的运维管理系统。此时通过运维管理系统可以对物理机进行相关docker容器的部署、升级,以此来实现自动化服务部署的功能,也可以远程配置物理机防火墙。此外运维程序还会对docker容器的运行状态进行监控,及时上报管理平台。对于某些已知的故障,进行相关自我修复操作。
在运维管理平台与各个服务器之间,搭建堡垒机,以此作为统一访问的跳板、达到统一管理的目的。
主要步骤:
第一步:在分布式系统服务器上安装运维程序,运维程序收集信息如:网卡信息、硬件信息、防火墙信息、进程信息。同时运维程序自动配置、启动Docker服务,并携带服务器信息以及Docker服务端口往指定的运维管理系统上注册该服务器。
第二步:运维管理系统收到运维程序注册请求后,验证相关的服务器信息,生成相关服务器记录。运维程序注册成功后定时收集服务器信息,并主动上告异常情况。
第三步:运维管理系统上可以设置自动或者手动对服务器进行docker容器的部署升级,即分布式服务的部署。也可以对物理机器进行防火墙规则配置。
第四步:相应的服务器上的服务部署完成后,可以根据运维平台上的策略,各个服务器对自身的物理信息(即硬件信息)、服务运行状态(即进程信息)进行监控告警。
第五步:设置一个堡垒机服务器,以便统一通过运维管理平台对各个服务器进行SSH等功能。以此和运维小程序互补管控服务器,增加灵活性和安全性。
如图2所示的一种服务器运维程序初次运行的流程图,运维程序初次运行时,会收集服务器的信息并携带基本信息至运维平台进行注册认证,运维平台认证成功后,保存服务器相关信息,并检查是否有已有相应的部署升级策略。若存在,运维平台会下发相关部署指令。升级完成后,运维程序监控服务以及物理机运行状况,并及时上报异常信息。
如图3所示的服务器的部署升级的流程图,当分布式系统中各个服务器中的运维程序注册到运维管理平台后,运维人员可以选择相应的服务版本对服务器进行部署升级,当运维程序收到指令后,进行自我检查判断是否符合部署升级的条件,并到指定的仓库服务器拉取Docker镜像进行部署。最后返回结果至运维平台端。
如图4所示的分布式系统进行SSH连接流程图,当运维小程序无法满足运维人员的运维需求时,这时可以通过运维平台端的SSH连接功能,对服务器进行维护。在连接过程中,平台先登录堡垒机,然后堡垒机再去连接指定的服务器,以此达到统一管理的目的。
以上服务器之间使用http协议进行通信。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。
Claims (8)
1.一种基于Docker分布式服务器运维管理方法,其特征在于:包括:
步骤1、收集分布式系统中每个分布式服务器的服务器信息;
步骤2、将服务器信息以及Docker服务端口注册至运维管理服务器;
步骤3、运维管理服务器验证服务器信息,验证通过后,生成对应的服务器记录;
步骤4、运维管理服务器对分布式服务器进行Docker容器的部署或升级;
步骤5、运维管理服务器定时获取每个分布式服务器的服务器信息,对每个服务器进行运维管理。
2.根据权利要求1所述的一种基于Docker分布式服务器运维管理方法,其特征在于:还包括步骤6、设置一堡垒机服务器,所述运维管理服务器通过所述堡垒机服务器进行SSH连接。
3.根据权利要求1所述的一种基于Docker分布式服务器运维管理方法,其特征在于:所述服务器信息包括网卡信息、硬件信息、防火墙信息以及进程信息。
4.根据权利要求1所述的一种基于Docker分布式服务器运维管理方法,其特征在于:所述步骤4进一步具体为:若运维管理服务器存在部署或者升级策略,运维管理服务器下发对应指令至服务器,服务器进行自我检查判断是否符合部署或者升级的条件,若是符合,则获取Docker镜像进行部署或者升级,最后返回结果至运维服务器。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现以下步骤:
步骤1、收集分布式系统中每个分布式服务器的服务器信息;
步骤2、将服务器信息以及Docker服务端口注册至运维管理服务器;
步骤3、运维管理服务器验证服务器信息,验证通过后,生成对应的服务器记录;
步骤4、运维管理服务器对分布式服务器进行Docker容器的部署或升级;
步骤5、运维管理服务器定时获取每个分布式服务器的服务器信息,对每个服务器进行运维管理。
6.根据权利要求5所述的一种计算机可读存储介质,其特征在于:还包括步骤6、设置一堡垒机服务器,所述运维管理服务器通过所述堡垒机服务器进行SSH连接。
7.根据权利要求5所述的一种计算机可读存储介质,其特征在于:所述服务器信息包括网卡信息、硬件信息、防火墙信息以及进程信息。
8.根据权利要求5所述的一种计算机可读存储介质,其特征在于:所述步骤4进一步具体为:若运维管理服务器存在部署或者升级策略,运维管理服务器下发对应指令至服务器,服务器进行自我检查判断是否符合部署或者升级的条件,若是符合,则获取Docker镜像进行部署或者升级,最后返回结果至运维服务器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810985016.0A CN109005066A (zh) | 2018-08-28 | 2018-08-28 | 基于Docker分布式服务器运维管理方法及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810985016.0A CN109005066A (zh) | 2018-08-28 | 2018-08-28 | 基于Docker分布式服务器运维管理方法及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109005066A true CN109005066A (zh) | 2018-12-14 |
Family
ID=64594241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810985016.0A Pending CN109005066A (zh) | 2018-08-28 | 2018-08-28 | 基于Docker分布式服务器运维管理方法及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109005066A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113162806A (zh) * | 2021-04-23 | 2021-07-23 | 华上(天津)信息科技发展有限公司 | 一种远程运维方法 |
CN113595802A (zh) * | 2021-08-09 | 2021-11-02 | 山石网科通信技术股份有限公司 | 分布式防火墙的升级方法及其装置 |
CN114697985A (zh) * | 2020-12-28 | 2022-07-01 | 中国联合网络通信集团有限公司 | 无线运维系统注册方法、装置、电子设备及存储介质 |
CN116521325A (zh) * | 2023-07-05 | 2023-08-01 | 中国人寿保险股份有限公司上海数据中心 | 一种分布式容器的集中管理系统和方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103209086A (zh) * | 2012-01-16 | 2013-07-17 | 深圳市腾讯计算机系统有限公司 | 穿透中转机实现服务器维护的方法、系统及中转机 |
CN104657150A (zh) * | 2015-03-13 | 2015-05-27 | 浪潮集团有限公司 | 一种集群环境下的自动化运维方法 |
CN105187500A (zh) * | 2015-08-07 | 2015-12-23 | 浪潮(北京)电子信息产业有限公司 | 一种基于容器的分布式存储系统部署方法 |
CN107979493A (zh) * | 2017-11-21 | 2018-05-01 | 平安科技(深圳)有限公司 | 平台即服务paas容器平台的构建方法、服务器及存储介质 |
US20180146069A1 (en) * | 2016-11-18 | 2018-05-24 | Sap Se | Efficient application build/deployment for distributed container cloud platform |
CN108171473A (zh) * | 2017-12-26 | 2018-06-15 | 北京九章云极科技有限公司 | 一种数据分析处理系统及数据分析处理方法 |
-
2018
- 2018-08-28 CN CN201810985016.0A patent/CN109005066A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103209086A (zh) * | 2012-01-16 | 2013-07-17 | 深圳市腾讯计算机系统有限公司 | 穿透中转机实现服务器维护的方法、系统及中转机 |
CN104657150A (zh) * | 2015-03-13 | 2015-05-27 | 浪潮集团有限公司 | 一种集群环境下的自动化运维方法 |
CN105187500A (zh) * | 2015-08-07 | 2015-12-23 | 浪潮(北京)电子信息产业有限公司 | 一种基于容器的分布式存储系统部署方法 |
US20180146069A1 (en) * | 2016-11-18 | 2018-05-24 | Sap Se | Efficient application build/deployment for distributed container cloud platform |
CN107979493A (zh) * | 2017-11-21 | 2018-05-01 | 平安科技(深圳)有限公司 | 平台即服务paas容器平台的构建方法、服务器及存储介质 |
CN108171473A (zh) * | 2017-12-26 | 2018-06-15 | 北京九章云极科技有限公司 | 一种数据分析处理系统及数据分析处理方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114697985A (zh) * | 2020-12-28 | 2022-07-01 | 中国联合网络通信集团有限公司 | 无线运维系统注册方法、装置、电子设备及存储介质 |
CN113162806A (zh) * | 2021-04-23 | 2021-07-23 | 华上(天津)信息科技发展有限公司 | 一种远程运维方法 |
CN113595802A (zh) * | 2021-08-09 | 2021-11-02 | 山石网科通信技术股份有限公司 | 分布式防火墙的升级方法及其装置 |
CN116521325A (zh) * | 2023-07-05 | 2023-08-01 | 中国人寿保险股份有限公司上海数据中心 | 一种分布式容器的集中管理系统和方法 |
CN116521325B (zh) * | 2023-07-05 | 2023-09-29 | 中国人寿保险股份有限公司上海数据中心 | 一种分布式容器的集中管理系统和方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109005066A (zh) | 基于Docker分布式服务器运维管理方法及计算机可读存储介质 | |
CN104506393B (zh) | 一种基于云平台的系统监控方法 | |
CN105518629B (zh) | 云部署基础结构确认引擎 | |
US10200506B2 (en) | Method, system and device for monitoring data | |
US7490066B2 (en) | Method, apparatus, and article of manufacture for a network monitoring system | |
US8276023B2 (en) | Method and system for remote monitoring subscription service | |
CN102739802B (zh) | 面向业务应用的it集中运维分析系统 | |
CN102437938B (zh) | 面向大规模网络监测的虚拟化部署系统和方法 | |
US8578337B2 (en) | Method and system for quality assurance subscription service | |
CN109714192A (zh) | 一种监控云平台的监控方法及系统 | |
US20020123966A1 (en) | System and method for administration of network financial transaction terminals | |
US20040111425A1 (en) | Method and system for automatic detection of monitoring data sources | |
US20080082661A1 (en) | Method and Apparatus for Network Monitoring of Communications Networks | |
US8504610B2 (en) | System and method for obtaining and executing instructions from a private network | |
US7739554B2 (en) | Method and system for automatic resolution and dispatching subscription service | |
US8903923B2 (en) | Methods and apparatus for system monitoring | |
US20080208931A1 (en) | Method and system for continuous availability subscription service | |
Casola et al. | Security monitoring in the cloud: an SLA-based approach | |
CN102859505B (zh) | 管理系统以及计算机系统的管理方法 | |
CN106330599A (zh) | Android应用程序网络流量多线程采集系统及方法 | |
CN106790463A (zh) | Web配置文件重载过程的访问方法和系统 | |
CN105843725A (zh) | 一种IaaS平台的监控方法及装置 | |
CN114710798A (zh) | 一种故障定位方法及装置 | |
CN108039956A (zh) | 应用监控方法、系统和计算机可读存储介质 | |
US20040039804A1 (en) | Method and framework for service-based remote support delivery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181214 |