CN110460476B - 一种网络运维管理方法 - Google Patents
一种网络运维管理方法 Download PDFInfo
- Publication number
- CN110460476B CN110460476B CN201910783118.9A CN201910783118A CN110460476B CN 110460476 B CN110460476 B CN 110460476B CN 201910783118 A CN201910783118 A CN 201910783118A CN 110460476 B CN110460476 B CN 110460476B
- Authority
- CN
- China
- Prior art keywords
- host
- data
- information
- maintenance management
- management method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
Abstract
本发明提供一种网络运维管理方法,涉及网络管理技术领域,该方法包括以下步骤:S1:根据服务器的用途和所在位置按照主机名命名规范,添加主机至控制云端;S2:进行后台初始化,控制云端获取主机的元项目,并将主机进行分组;S3:每间隔预定时间,监控端对各主机进行监控,获取数据;S4:调用工具箱对各主机磁盘进行检测,将检测数据进行展现,并生成系统安全系数;S5:判断系统安全系数是否高于预定安全值,若是,则进行告警;反之继续执行步骤S4。本发明一种网络运维管理方法合理有效,管理方便,有效整理各类数据,并进行展现,在异常情况下自动告警,可以对接多种第三方系统,协助运维管理人员对系统进行管理维护。
Description
技术领域
本发明涉及网络管理技术领域,
尤其是,本发明涉及一种网络运维管理方法。
背景技术
计算机行业的大型公司基本上都存在各种各样的网管平台分管不同的项目、业务。但是由于第三方厂家各自为政,所以这些数据基本上都是不互通的,所以在数据同步化上存在极大的难题,无法进行统一的业务管理,需要建立对接端口和算法进行网络运维管理,既浪费了管理运维成本,又无法自动收集管理各系统数据,以至于不能及时进行数据通报,为网络运维管理人员的工作带来了极大的不便。
所以,如何设计一种可以对不同系统进行整合管理的网络运维管理方法,成为我们当前急需要解决的问题。
发明内容
本发明的目的在于提供一种合理有效,管理方便,有效整理各类数据,同步管理,并进行展现,并在异常情况下自动进行告警,方便操作人员远程执行,可以对接多种第三方系统,对不同系统的数据源进行整合分析,可以应用于各种以Linux为基础的各种项目以及平台,协助运维管理人员对系统进行管理维护的网络运维管理方法。
为达到上述目的,本发明采用如下技术方案得以实现的:
一种网络运维管理方法,该方法包括以下步骤:
S1:根据服务器的用途和所在位置按照主机名命名规范,添加主机至控制云端;
S2:进行后台初始化,控制云端获取主机的元项目,并将主机进行分组,各分组绑定不同的数据端口;
S3:每间隔预定时间,监控端对各主机进行监控,获取主机网络信息列表数据;
S4:调用工具箱对各主机磁盘进行检测,获取工具箱测量数据,将平台数据进行展现,并生成系统安全系数;
S5:判断系统安全系数是否高于预定安全值,若是,则调用告警输出端进行告警;反之则继续执行步骤S4。
作为本发明的优选,执行步骤S1至步骤S5时,将控制云端获取的数据进行同步,并定时进行主动采集保存入库。
作为本发明的优选,执行步骤S1时,主机名信息包括地市、机房、IP信息、厂家、应用以及编号。
作为本发明的优选,执行步骤S1时,添加主机之前,需要使用用户名和密码登录控制云端。
作为本发明的优选,步骤S2中,后台初始化具体包括以下步骤:
S21:收到用户访问菜单栏信息时,调用对应URI对应的接口,判断该用户是否有对应URI的访问权限;若有则执行步骤S22,反之继续执行步骤S21;
S22:进入主机列表,提示用户选择需要展示的平台
S23:获取平台选择信息,搜索框显示过滤筛选指定服务器;
S24:获取新服务器添加信息,解析主机名,对主机进行配置;
S25:确定主机配置完毕,进行后台初始化。
作为本发明的优选,执行步骤S25时,主机进行配置内容包括:添加普通用户、配置yum仓库、SNMP配置、初始化环境变量、配置远程管理地址、配置SSH主机互信、安装监控端、安装磁盘管理软件、主机信息采集、软件版本信息采集。
作为本发明的优选,执行步骤S3时,监控端为zabbix客户端。
作为本发明的优选,执行步骤S3时,将获取的主机网络信息列表数据进行存储,并设置调用链接方便进行调用,提供更新、查询以及删除接口对数据进行操作。
作为本发明的优选,执行步骤S4时,工具箱为自动化脚本,包括smarttool、ipmitool和python psutil模块;数据展现内容包括硬盘坏道数量最多的top10服务器、各业务组负载情况以及每台服务器的健康状态;数据展现方式包括文字展示、柱状图、饼图、点阵图以及表格展示方式。
作为本发明的优选,执行步骤S5时,告警输出端包括钉钉、微信、页面告警、蓝牙设备以及可穿戴设备。
本发明一种网络运维管理方法有益效果在于:合理有效,管理方便,有效整理各类数据,同步管理,并进行展现,并在异常情况下自动进行告警,方便操作人员远程执行,可以对接多种第三方系统,对不同系统的数据源进行整合分析,可以应用于各种以Linux为基础的各种项目以及平台,协助运维管理人员对系统进行管理维护。
附图说明
图1为本发明一种网络运维管理方法的流程示意图。
具体实施方式
以下是本发明的具体实施例,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的模块和步骤的相对布置和步骤不限制本发明的范围。
同时,应当明白,为了便于描述,附图中的流程并不仅仅是单独进行,而是多个步骤相互交叉进行。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法及系统可能不作详细讨论,但在适当情况下,技术、方法及系统应当被视为授权说明书的一部分。
计算机行业的大型公司基本上都存在各种各样的网管平台分管不同的项目、业务。但是由于第三方厂家各自为政,所以这些数据基本上都是不互通的,所以在数据同步化上存在极大的难题,无法进行统一的业务管理,需要建立对接端口和算法进行网络运维管理,既浪费了管理运维成本,又无法自动收集管理各系统数据,以至于不能及时进行数据通报,为网络运维管理人员的工作带来了极大的不便。
实施例一
如图1所示,仅为本发明的其中一个实施例,本发明提供一种网络运维管理方法,该方法包括以下步骤:
S1:根据服务器的用途和所在位置按照主机名命名规范,添加主机至控制云端;
对各个管理系统和平台进行信息采集,方便后面步骤进行管理,在这里,主机名信息包括地市、机房、IP信息、厂家、应用以及编号,且根据服务器的用途和所在位置按照主机名命名规范:<地市>-<机房>-<IP信息>-<厂家>-<应用>-<编号>进行命名,例如:FZ-HX203-015189-Enrich-VSS-009。
S2:进行后台初始化,控制云端获取主机的元项目,并将主机进行分组,各分组绑定不同的数据端口;
监控端为zabbix客户端,且zabbix客户端为初始化之后自动安装,在自动安装完zabbix客户端时设置metaItem,包括机房、应用、厂家、服务器型号等。zabbix自动发现规则根据metaItem将对应的主机归入不同的机房、应用分组,各分组绑定不同模版加载对应的监控项和触发器。
在此步骤中,将信息采集数据完成数据接入,且此步骤中支持SNMP协议、IPMI协议、XML主动上报以及被动上报等采集手段,负责采集能力系统的CPU、磁盘、网卡、服务器传感器、应用层信息等一系列参数。
S3:每间隔预定时间,监控端对各主机进行监控,获取主机网络信息列表数据;
通过聚合函数从机房、厂家、推流组等不同的维度进行了流量、并发的汇总、查询、对比。监控端在flask框架基础下用python编写的多个功能子模块。每个子模块对应一个主机进行监控,每隔预定时间进行数据反馈,为运维的自动化提供相关的接口以及web管理后台。
当然可以根据该组主机的服务器、机房、厂家等信息来设置不停的预定间隔时间,越是复杂,则间隔时间越短,越是相同性统一性高,则间隔时间可以适当拉长,并且所有主机服务器完成数据监控之后,会进行统一汇总,统一对比和存储。
S4:调用工具箱对各主机磁盘进行检测,获取工具箱测量数据,将平台数据进行展现,并生成系统安全系数;
在这里工具箱为全自动脚本,可以根据主机的不同,提前进行编写,然后在步骤S3中不同分组的主机绑定不同的全自动脚本作为工具箱,对主机进行数据测量然后反馈。
通过数据库查询、页面爬取等手段以点阵图的形式实现了在网服务器、下线服务器的总览图。结合信息汇总中各业务组负载情况便于项目组成员对服务器进行调度管理。
S5:判断系统安全系数是否高于预定安全值,若是,则调用告警输出端进行告警;反之则继续执行步骤S4。
实时的判断系统的安全性,保证对服务器和平台的自动监视,一旦异常变弹出告警,若是一切正常,则不进行告警,继续进行监测。
当然,服务器和平台数据是出于流动中的,文件状态也是变化中的,一旦服务器和平台数据以及各频道文件的状态异常,便可以有效识别判断,在发现异常时候弹出告警。
总之,步骤S1至S2为数据接入阶段;步骤S3为内部监控阶段;步骤S4为数据展现阶段;最后的步骤S5为告警输出阶段。程序采用前后端分离架构,后台通过flask python框架实现初始化完成数据接入,前端通过bootstrap结合flask实现。其中后台通过celery任务管理器实现程序的异步执行,并可以调用ansible api接口对全自动脚本进行组装和执行。
当然,在执行步骤S1至步骤S5时,将控制云端获取的数据进行同步,并定时进行主动采集保存入库。且通过IPMITool自动根据信令网IP配置远程管理卡地址,并统一修改默认登录密码。保证控制云端对所有服务器和平台是同步进行管理的。
本发明主要是为了方便运维人员的日常维护和管理,尽可能的将重复简单的操作进行自动化处理,监控平台的各项指标,在出现异常时能够及时的预警,同时为了对海量的服务器管理,采集了服务器的基础信息入库进行各种排序、筛选、查询等操作。为对接已有的系统,通过数据接入模块中定制化开发的API接口,对接各种不同协议的平台。
本发明一种网络运维管理方法不仅能够由运维人员通过自定义脚本的方式采集不同服务器的版本信息,并对服务器版本的变更记录和版本相关信息进行留档,而且能够定期收集故障磁盘的坏道信息在页面上进行显示输出,并对接ZABBIX能够清楚的显示当前每台服务器的健康状态,还能够定时的主动采集对端数据入库。
那么本发明一种网络运维管理方法合理有效,管理方便,有效整理各类数据,同步管理,并进行展现,并在异常情况下自动进行告警,方便操作人员远程执行,可以对接多种第三方系统,对不同的系统的数据源进行整合分析,可以应用于各种以Linux为基础的各种项目以及平台,协助运维管理人员对系统进行管理和维护。
实施例二
仍如图1所示,依然为本发明的其中一个实施例,为了使得本发明一种网络运维管理方法更加的运行稳定,监测管理的准确度更高,本发明中还具有以下几个设计:
首先,执行步骤S1时,添加主机之前,需要使用用户名和密码登录控制云端。启动后通过浏览器访问http://192.168.10.18:2001/
用户登录后访问login接口,后台程序验证密码后返回加密后的token串,写入浏览器cookie,记录登录状态。
然后在步骤S2中,后台初始化具体包括以下步骤:
S21:收到用户访问菜单栏信息时,调用对应URI对应的接口,判断该用户是否有对应URI的访问权限;若有则执行步骤S22,反之继续执行步骤S21;
用户访问菜单栏时,调用对应URI对应的接口,接口调用时,后台程序首先访问权限控制表确认该用户是否有对应URI的访问权限
S22:进入主机列表,提示用户选择需要展示的平台;
进入主机列表后,通过swal弹窗控件提示用户选择需要展示的平台,这里包括OTT、VOD等
S23:获取平台选择信息,搜索框显示过滤筛选指定服务器;
选择平台后,页面通过ajax向后台程序发起listapi接口请求服务器列表。页面通过datatable控件对放回的列表进行展现,返回的信息包括主机名、IP、型号、操作系统、序列号等。右上角搜索框支持过滤筛选指定服务器;
S24:获取新服务器添加信息,解析主机名,对主机进行配置;
添加新服务器时,点击右上角“添加服务器”,输入服务器登录方式后点击验证,后台程序向目标服务器发起模拟登录,并向celery任务管理器中添加一条任务,在服务端/etc/hosts文件中写入主机名-IP对应信息,为后续主机名解析做准备。
S25:确定主机配置完毕,进行后台初始化。
点击确认添加后,后台执预设的ansiblePlayBook(开源python程序)在后台对系统进行初始化。
而且需要注意的是,后台初始化过程中状态灯显示灰色,初始化完毕后状态灯被置为绿色,方便管理人员查看初始化进程。
当然,执行步骤S25时,主机进行配置内容包括:添加普通用户、配置yum仓库、SNMP配置、初始化环境变量、配置远程管理地址、配置SSH主机互信、安装监控端、安装磁盘管理软件、主机信息采集、软件版本信息采集。
还有,执行步骤S3时,将获取的主机网络信息列表数据进行存储,并设置调用链接方便进行调用,提供更新、查询以及删除接口对数据进行操作。进入版本管理菜单,后台接口返回初始化过程中采集的应用版本,zabbix对应用程序md5值进行监测,当md5值变化时触发版本上报脚本,上报最新版本信息,记录在数据库中。在变更信息中可以查到历史版本记录。
另外,在执行步骤S4时,工具箱为自动化脚本,包括smarttool、ipmitool和pythonpsutil模块;在添加服务器过中,自动化脚本通过ipmitool和python psutil模块对网络信息进行采集上报。用户通过浏览器访问系统时,通过接口获取各主机的网络信息列表。
以及数据展现内容包括硬盘坏道数量最多的top10服务器、各业务组负载情况以及每台服务器的健康状态。celery任务管理器通过定时任务调用脚本,最好在每天凌晨4点调用smarttool、megacli工具对磁盘进行检测、上报硬盘状态,页面通过接口获取脚本以柱状图的形式展现硬盘坏道数量最多的top10服务器。
还有数据展现方式包括文字展示、柱状图、饼图、点阵图以及表格展示方式,展现在屏幕或者数据显示端上,方便工作人员统一进行管理。
最后,执行步骤S5时,告警输出端包括钉钉、微信、页面告警、蓝牙设备以及可穿戴设备。通过调用钉钉、微信的API接口实现自动告警功能,通过以上方式将系统异常第一时间通知到项目组成员。
本发明一种网络运维管理方法合理有效,管理方便,有效整理各类数据,同步管理,并进行展现,并在异常情况下自动进行告警,方便操作人员远程执行,可以对接多种第三方系统,对不同的系统的数据源进行整合分析,可以应用于各种以Linux为基础的各种项目以及平台,协助运维管理人员对系统进行管理和维护。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围,本发明所属技术领域的技术人员可以对所描述的具体实施例来做出各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的方向或者超越所附权利要求书所定义的范围。本领域的技术人员应该理解,凡是依据本发明的技术实质对以上实施方式所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围。
Claims (6)
1.一种网络运维管理方法,其特征在于,包括以下步骤:
S1:根据服务器的用途和所在位置按照主机名命名规范<地市>-<机房>-<IP信息>-<厂家>-<应用>-<编号>,添加主机至控制云端;
S2:进行后台初始化,控制云端获取主机的元项目,自动发现规则根据元项目将对应的主机归入不同的机房、应用分组,各分组绑定不同模版加载对应的监控项和触发器;
S3:每间隔预定时间,监控端对各主机进行监控,获取主机网络信息列表数据;
S4:调用工具箱对各主机磁盘进行检测,获取工具箱测量数据,将平台数据进行展现,并生成系统安全系数;
S5:判断系统安全系数是否高于预定安全值,若是,则调用告警输出端进行告警;反之则继续执行步骤S4;
步骤S2中,后台初始化,具体包括以下步骤:
S21:收到用户访问菜单栏信息时,调用对应URI对应的接口,判断该用户是否有对应URI的访问权限;若有则执行步骤S22,反之继续执行步骤S21;
S22:进入主机列表,提示用户选择需要展示的平台;
S23:获取平台选择信息,搜索框显示过滤筛选指定服务器;
S24:获取新服务器添加信息,解析主机名,对主机进行配置;
S25:确定主机配置完毕,进行后台初始化;
执行步骤S25时,主机进行配置内容包括:添加普通用户、配置yum仓库、SNMP配置、初始化环境变量、配置远程管理地址、配置SSH主机互信、安装监控端、安装磁盘管理软件、主机信息采集、软件版本信息采集;
执行步骤S4时,工具箱为自动化脚本,包括smarttool、ipmitool和python psutil模块;数据展现内容包括硬盘坏道数量最多的top10服务器、各业务组负载情况以及每台服务器的健康状态;数据展现方式包括文字展示、柱状图、饼图、点阵图以及表格展示方式;
执行步骤S5时,告警输出端包括钉钉、微信、页面告警、蓝牙设备以及可穿戴设备;
步骤S1至S2为数据接入阶段;步骤S3为内部监控阶段;步骤S4为数据展现阶段;步骤S5为告警输出阶段;程序采用前后端分离架构,后台通过flask python框架实现初始化完成数据接入,前端通过bootstrap结合flask实现;其中后台通过celery任务管理器实现程序的异步执行,并可以调用ansible api接口对全自动脚本进行组装和执行。
2.根据权利要求1所述的一种网络运维管理方法,其特征在于:执行步骤S1至步骤S5时,将控制云端获取的数据进行同步,并定时进行主动采集保存入库。
3.根据权利要求1所述的一种网络运维管理方法,其特征在于:执行步骤S1时,主机名信息包括地市、机房、IP信息、厂家、应用以及编号。
4.根据权利要求1所述的一种网络运维管理方法,其特征在于:执行步骤S1时,添加主机之前,需要使用用户名和密码登录控制云端。
5.根据权利要求1所述的一种网络运维管理方法,其特征在于:执行步骤S3时,监控端为zabbix客户端。
6.根据权利要求1所述的一种网络运维管理方法,其特征在于:执行步骤S3时,将获取的主机网络信息列表数据进行存储,并设置调用链接方便进行调用,提供更新、查询以及删除接口对数据进行操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910783118.9A CN110460476B (zh) | 2019-08-23 | 2019-08-23 | 一种网络运维管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910783118.9A CN110460476B (zh) | 2019-08-23 | 2019-08-23 | 一种网络运维管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110460476A CN110460476A (zh) | 2019-11-15 |
CN110460476B true CN110460476B (zh) | 2022-08-02 |
Family
ID=68488767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910783118.9A Active CN110460476B (zh) | 2019-08-23 | 2019-08-23 | 一种网络运维管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110460476B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111124807B (zh) * | 2019-11-29 | 2022-10-14 | 苏州浪潮智能科技有限公司 | 一种服务器功率测量方法及系统 |
CN111209157A (zh) * | 2019-12-19 | 2020-05-29 | 深圳市光联世纪信息科技有限公司 | 一种自动化运维平台 |
CN112667275A (zh) * | 2020-12-03 | 2021-04-16 | 平安科技(深圳)有限公司 | Linux软件管理方法、装置、计算机设备及存储介质 |
CN113014445B (zh) * | 2021-02-08 | 2022-11-11 | 中国工商银行股份有限公司 | 用于服务器的运维方法、装置、平台及电子设备 |
CN115987782B (zh) * | 2023-03-20 | 2023-06-06 | 建信金融科技有限责任公司 | 云主机名的生成方法、装置、设备、存储介质和程序产品 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100437503C (zh) * | 2006-03-15 | 2008-11-26 | 联想(北京)有限公司 | 一种存储装置关键数据备份与恢复系统和方法 |
US20080002711A1 (en) * | 2006-06-30 | 2008-01-03 | Bugenhagen Michael K | System and method for access state based service options |
CN104253706B (zh) * | 2013-06-29 | 2017-10-10 | 北京新媒传信科技有限公司 | 一种数据库管理平台的监控方法和装置 |
CN104731580B (zh) * | 2015-01-12 | 2018-02-06 | 上海新炬网络信息技术股份有限公司 | 基于Karaf与ActiveMQ的自动化运维系统及其实现方法 |
CN109614292A (zh) * | 2018-12-12 | 2019-04-12 | 国网辽宁省电力有限公司信息通信分公司 | 基于shell的主机运行数据自动采集监控系统 |
-
2019
- 2019-08-23 CN CN201910783118.9A patent/CN110460476B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110460476A (zh) | 2019-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110460476B (zh) | 一种网络运维管理方法 | |
US11151083B2 (en) | Generating target application packages for groups of computing devices | |
US11366686B1 (en) | Managing user data in a multitenant deployment | |
US10394703B2 (en) | Managing converged IT infrastructure with generic object instances | |
US11249710B2 (en) | Technology add-on control console | |
CN103532780B (zh) | 用于it领域的运维监控一体化系统及一体化监控方法 | |
JP7079310B2 (ja) | 診断分析装置関連情報の集約方法および集約システム | |
US10984013B1 (en) | Tokenized event collector | |
US11829381B2 (en) | Data source metric visualizations | |
US11044144B2 (en) | Self-monitoring | |
US10423509B2 (en) | System and method for managing environment configuration using snapshots | |
US11276240B1 (en) | Precise plane detection and placement of virtual objects in an augmented reality environment | |
US20120317259A1 (en) | Operation managing device and operation management method | |
JP2018173703A (ja) | 障害解析装置、障害解析方法および障害解析プログラム | |
CN112506969A (zh) | 一种bmc地址查询方法、系统、设备及可读存储介质 | |
CN107451056B (zh) | 监听接口测试结果的方法及装置 | |
CN114268569B (zh) | 一种可配置的网络运维验收测试方法及装置 | |
JP4827024B2 (ja) | サーバ監視システム及びその方法 | |
US11354012B1 (en) | Automated placement and time selection for dashboard panels in an extended reality environment | |
CN115801588A (zh) | 网络连接的动态拓扑处理方法及系统 | |
Dimonte | Centralized Monitoring Infrastructure on Cloud: An Open Source Approach. | |
CN113918175A (zh) | 应用容器化离线安装部署系统、方法、终端和存储介质 | |
CN116185677A (zh) | 一种自动故障定位方法、系统及介质 | |
Mayo et al. | OVIS 2.0 user% 3CU% 2B2019% 3Es guide. | |
Mayo et al. | OVIS 3.2 user's guide. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |