CN109934361A - 一种基于容器和大数据的自动化运维平台模型 - Google Patents

一种基于容器和大数据的自动化运维平台模型 Download PDF

Info

Publication number
CN109934361A
CN109934361A CN201910138021.2A CN201910138021A CN109934361A CN 109934361 A CN109934361 A CN 109934361A CN 201910138021 A CN201910138021 A CN 201910138021A CN 109934361 A CN109934361 A CN 109934361A
Authority
CN
China
Prior art keywords
container
data
automation
operation system
building
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910138021.2A
Other languages
English (en)
Other versions
CN109934361B (zh
Inventor
王纪军
陈咏秋
承轶青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information and communication branch of Jiangsu Electric Power Co., Ltd.
State Grid Jiangsu Electric Power Co Ltd
Original Assignee
Jiangsu Electric Power Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Electric Power Information Technology Co Ltd filed Critical Jiangsu Electric Power Information Technology Co Ltd
Priority to CN201910138021.2A priority Critical patent/CN109934361B/zh
Publication of CN109934361A publication Critical patent/CN109934361A/zh
Application granted granted Critical
Publication of CN109934361B publication Critical patent/CN109934361B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种基于容器和大数据的自动化运维平台模型,包括业务系统持续构建部署和自动化运维;基于容器和大数据的原理方式,利用容器调度kubernete保证容器的调度分析,保证调度的容器在合理的节点上面,确保业务系统能够容灾备份,加强系统安全性,通过指标监控组件完成对业务系统、服务器的监控,并推送至大数据平台分析,通过自动配置弹性伸缩算法,分析业务系统监控数据,实现业务系统的弹性伸缩,通过负载策略分担访问流量,保证用户正常访问,平台系统根据业务应用场景智能决策,如重启、扩容、缩容等。

Description

一种基于容器和大数据的自动化运维平台模型
技术领域
本发明属于软件技术领域,涉及容器的云计算、大数据领域机制,具体是一种基于容器和大数据的自动化运维平台模型。
背景技术
对于基于容器和大数据平台的PaaS部署的应用而言,系统的稳定运行和自动化运维是很重要的一个组成部分。业务应用持续的版本发布、应用的负载考虑、监控数据的集中采集、清洗在传统的运维体系下,版本的发布需要人工打包、人工复制文件部署到中间件的服务器中,在访问用户剧增、或者访问某个时间段访问请求剧增、吞吐量达到瓶颈的时候,通过查看每台服务器的监控数据,如CPU、内存、网络IO、磁盘IO,结合一定的算法,人工判断是否需要增加节点。反之则减少服务器,释放资源,提高资源的利用率,保证资源合理的应用。
发明内容
本发明的目的是提供一种基于容器和大数据的自动化运维平台模型,使应用系统可以实现快速部署,版本快速迭代;并充分分析docker运行时的性能指标以及环境参数,对业务所需资源进行实时动态伸缩,以保证资源利用率的最大化;应用大数据技术分析实时监控数据,实现对运维数据的自动识别与分级,保障关键信息的快速获取、准确定位。
本发明的目的通过以下技术方案实现:
一种基于容器和大数据的自动化运维平台模型,模型内容包括:业务系统持续构建部署和自动化运维两个部分。
业务应用持续构建部署端,代表的是一个业务应用构建。该业务应用需要对系统进行构建改造,如mvn、ant改造和设计。构建部署分为两个步骤:持续构建和基于kubernete的容器应用发布。
1)持续构建:一般是业务系统改造项目结构,技术方案选择不限,比如:传统的ant编译,通过编写ant脚本实现业务系统的自动化打包。比如:通过主流的maven编译,构建打包,编写pom.xml文件对系统自动化打包。引入持续构建工具,如jenkins开源工具,配置触发条件,编写部分脚本,调用jenkinsAPI接口,完成构建。
2)基于kubernete的容器应用发布:基于上述业务系统的持续构建生成的war,通过对war包进行Docker镜像的制作,生成应用镜像。并基于kubernete的机制,内网创建pod、service、deployment、ingress等对象,实现对镜像的启动,并调度访问。基于kubernete的容器调度保证业务系统稳定运行,本身拥有健康检查机制。保持容器组副本节点数,拥有基于7层负载的ingress访问请求。容器的调度可以保证调度分布到不同的机房、机架,对应用灾备保护。
自动化运维:这是一个根据应用场景决策自动化运维系统。整个一系列自动化运维体系包括如下:
1)应用系统监控:通过分析国网典型容器化应用的监控指标,研究这些应用的规模、部署方式和基本技术框架,分析典型的中间件(Tomcat或者weblogic)的容器化方案,通过JMX等技术读取中间件的技术指标。整个监控系统包括对服务器的各项指标进行监控,如CPU、内存、磁盘、网络,通过的容器组的监控CPU、内存、磁盘、网络,通过对数据库连接池、JVM的线程池对业务系统全链路过程进行完整的监控,实现完整的监控体系。
2)数据采集清洗:业务系统生成的数据有两种,一种是日志数据、一种是监控数据。针对这两种不同的数据实体,进行不同的采集汇总,针对日志数据,通过ELK的成熟的一套分布式日志集中采集处理,实现对日志的集中查询分析,并对日志的格式数据进行整体的规则控制,保证格式统一,将日志分析结果推送至下面场景分析决策,并做出一定合理的智能决策。
3)场景分析智能决策:业务系统运行于容器集群中,通过对监控数据、日志集中分析、服务器系统指标数据汇总分析、弹性伸缩的控制分析,根据预测的告警结果,用户的访问模型观察,配置出合理的弹性伸缩数据模型,实现自动化运维的场景。如系统遇到日志量的错误、某项系统指标急剧上身,根据弹性伸缩算法,做出合理的反应如扩容、缩容。
本发明利用Docker容器技术将应用系统包、配置文件整合打包成image,通过docker容器技术以容器形式启动。通过kubernets编排部署,将应用容器通过yaml方式,编排调度至kubernets群集。
根据定制的监控指标数据,通过对日志数据、资源监控数据、系统运行情况根据一定的算法,分析系统负载情况,进行弹性伸缩和运维智能预警。
本发明通过docker技术轻量化与快速部署的特点,使应用系统可以实现快速部署,版本快速迭代,并改进基于docker容器灰度发布中分流策略,针对国家电网特殊的用户群体,做到更好的版本迭代。同时docker可以对资源更细粒度封装的特性,并充分分析docker运行时的性能指标以及环境参数,根据业务的特点,对业务所需资源进行实时动态伸缩,以保证资源利用率的最大化。应用大数据技术分析实时监控数据,并对历史日志数据和监控指标数据进行数据清洗与数据挖掘,实现对运维数据的自动识别与分级,保障关键信息的快速获取、准确定位;研究建立针对核心资源的典型缺陷库及判断算法,以实时运行数据为驱动,利用大数据技术开展关联分析,实现对核心资源运行风险的预判,实现以预防为主的主动运维。
本发明基于容器和大数据的原理方式,利用容器调度kubernete保证容器的调度分析,保证调度的容器在合理的节点上面,确保业务系统能够容灾备份,加强系统安全性,通过指标监控组件完成对业务系统、服务器的监控,并推送至大数据平台分析,通过自动配置弹性伸缩算法,分析业务系统监控数据,实现业务系统的弹性伸缩,通过负载策略分担访问流量,保证用户正常访问,平台系统根据业务应用场景智能决策,如重启、扩容、缩容等。
附图说明
图1业务应用基于jenkins持续构建,业务应用基于容器平台的部署图。
图2业务应用指标监控画面示意图。
图3业务应用弹性伸缩画面示意图。
具体实施方式
以下结合附图和具体实施例对本发明进行详细说明。
一种基于容器和大数据的自动化运维平台模型,包括业务系统持续构建部署和自动化运维两部分。
1.持续构建
图1展示了系统在jenkins配置页面中,依据项目中代码管理配置编译命令、以及触发编译的触发器,生产应用包供部署使用。分为两个步骤:持续构建和基于kubernete的容器应用发布。
持续构建:一般是业务系统改造项目结构,技术方案选择不限,比如:传统的ant编译,通过编写ant脚本实现业务系统的自动化打包。比如:通过主流的maven编译,构建打包,编写pom.xml文件对系统自动化打包。引入持续构建工具,如jenkins开源工具,配置触发条件,编写部分脚本,调用jenkinsAPI接口,完成构建。
基于kubernete的容器应用发布:基于上述业务系统的持续构建生成的war,通过对war包进行Docker镜像的制作,生成应用镜像。并基于kubernete的机制,内网创建pod、service、deployment、ingress等对象,实现对镜像的启动,并调度访问。基于kubernete的容器调度保证业务系统稳定运行,本身拥有健康检查机制。保持容器组副本节点数,拥有基于7层负载的ingress访问请求。容器的调度可以保证调度分布到不同的机房、机架,对应用灾备保护。
2.容器部署
图1展示了持续构建后的应用包,在容器平台中填写部署表单,选择基础镜像、群集名称、上下文、配置文件上传、数据库组件、负载信息等,容器平台通过制作镜像,并推送至仓库,集群拉取镜像,调度起容器应用。
自动化运维:这是一个根据应用场景决策自动化运维系统。
3.监控分析
通过分析国网典型容器化应用的监控指标,研究这些应用的规模、部署方式和基本技术框架,分析典型的中间件(Tomcat或者weblogic)的容器化方案,通过JMX等技术读取中间件的技术指标。整个监控系统包括对服务器的各项指标进行监控,如CPU、内存、磁盘、网络,通过的容器组的监控CPU、内存、磁盘、网络,通过对数据库连接池、JVM的线程池对业务系统全链路过程进行完整的监控,实现完整的监控体系。
图2展示了主机信息的监控画面,如CPU、内存、网络IO,同时监控容器的各项指标信息,采集数据供程序计算分析,供场景决策用。
4.场景决策分析
图3展示了弹性伸缩配置画面,通过配置节点阀值、指标阀值、采集数据间隔、计算时间间隔,供业务系统场景决策分析。

Claims (3)

1.一种基于容器和大数据的自动化运维平台模型,其特征在于:该模型包括:业务系统持续构建部署和自动化运维;其中:
业务系统持续构建部署,代表的是一个业务应用构建;分为两个步骤:持续构建和基于kubernete的容器应用发布;
1)持续构建:业务系统改造项目结构,引入持续构建工具,完成业务系统的持续构建;
2)基于kubernete的容器应用发布:基于上述业务系统的持续构建生成的war,通过对war包进行Docker镜像的制作,生成应用镜像;并基于kubernete的机制,内网创建pod、service、deployment、ingress对象,实现对镜像的启动,并调度访问;基于kubernete的容器调度保证业务系统稳定运行;保持容器组副本节点数,拥有基于7层负载的ingress访问请求;容器的调度保证调度分布到不同的机房、机架,对应用灾备保护;
自动化运维:根据应用场景决策自动化运维系统;具体如下:
1)应用系统监控:通过分析典型容器化应用的监控指标,研究这些应用的规模、部署方式和基本技术框架,分析典型的中间件的容器化方案,通过JMX技术读取中间件的技术指标;整个监控系统包括对服务器的各项指标进行监控,通过对数据库连接池、JVM的线程池对业务系统全链路过程进行完整的监控,实现完整的监控体系;
2)数据采集清洗:业务系统生成的数据有两种,一种是日志数据、一种是监控数据;针对这两种不同的数据实体,进行不同的采集汇总,针对日志数据,通过ELK的成熟的一套分布式日志集中采集处理,实现对日志的集中查询分析,并对日志的格式数据进行整体的规则控制,保证格式统一,将日志分析结果推送至下面场景分析决策,并做出一定合理的智能决策;
3)场景分析智能决策:业务系统运行于容器集群中,通过对监控数据、日志集中分析、服务器系统指标数据汇总分析、弹性伸缩的控制分析,根据预测的告警结果,用户的访问模型观察,配置出合理的弹性伸缩数据模型,实现自动化运维的场景。
2.根据权利要求1所述的基于容器和大数据的自动化运维平台模型,其特征在于:持续构建中,传统的ant编译,通过编写ant脚本实现业务系统的自动化打包;比如:通过主流的maven编译,构建打包,编写pom.xml文件对系统自动化打包;引入持续构建工具,如jenkins开源工具,配置触发条件,编写部分脚本,调用jenkinsAPI接口,完成构建。
3.根据权利要求1所述的基于容器和大数据的自动化运维平台模型,其特征在于:场景分析智能决策中,系统遇到日志量的错误、某项系统指标急剧上升,根据弹性伸缩算法,做出合理的反应,如扩容、缩容。
CN201910138021.2A 2019-02-25 2019-02-25 一种基于容器和大数据的自动化运维平台模型 Active CN109934361B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910138021.2A CN109934361B (zh) 2019-02-25 2019-02-25 一种基于容器和大数据的自动化运维平台模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910138021.2A CN109934361B (zh) 2019-02-25 2019-02-25 一种基于容器和大数据的自动化运维平台模型

Publications (2)

Publication Number Publication Date
CN109934361A true CN109934361A (zh) 2019-06-25
CN109934361B CN109934361B (zh) 2022-03-11

Family

ID=66985853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910138021.2A Active CN109934361B (zh) 2019-02-25 2019-02-25 一种基于容器和大数据的自动化运维平台模型

Country Status (1)

Country Link
CN (1) CN109934361B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321152A (zh) * 2019-07-04 2019-10-11 青岛华正信息技术股份有限公司 一种软件开发平台
CN110912972A (zh) * 2019-11-07 2020-03-24 北京浪潮数据技术有限公司 一种业务处理方法、系统、电子设备及可读存储介质
CN111026414A (zh) * 2019-12-12 2020-04-17 杭州安恒信息技术股份有限公司 一种基于kubernetes的HDP平台部署方法
CN111431748A (zh) * 2020-03-20 2020-07-17 支付宝(杭州)信息技术有限公司 一种对集群进行自动运维的方法、系统及装置
CN111708605A (zh) * 2020-05-29 2020-09-25 北京赛博云睿智能科技有限公司 一种智能运维支撑方法和支撑系统
CN112149975A (zh) * 2020-09-11 2020-12-29 杭州东方通信软件技术有限公司 一种基于人工智能的apm监控系统及监控方法
CN112394945A (zh) * 2020-10-28 2021-02-23 浙江大学 一种面向复杂边缘计算的系统校验方法
CN112764875A (zh) * 2020-12-31 2021-05-07 中国科学院软件研究所 一种面向智能计算的轻量级入口容器微服务系统及方法
CN113259377A (zh) * 2021-06-11 2021-08-13 中国电子信息产业集团有限公司第六研究所 一种互联网安全监控系统、方法及集成一体机
CN113419750A (zh) * 2021-08-24 2021-09-21 北京华品博睿网络技术有限公司 一种模型推理服务调用系统和方法
CN113472845A (zh) * 2021-05-27 2021-10-01 四川大学华西医院 一种基于容器技术的医学物联网智能系统
US20220129203A1 (en) * 2020-10-27 2022-04-28 Viettel Group Method of queue design for data storage and management
CN116643950A (zh) * 2023-07-19 2023-08-25 浩鲸云计算科技股份有限公司 一种基于FaaS的云原生应用自动化运维方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045656A (zh) * 2015-06-30 2015-11-11 深圳清华大学研究院 基于虚拟容器的大数据存储与管理方法
CN106325975A (zh) * 2016-09-09 2017-01-11 浪潮软件股份有限公司 一种利用Docker容器自动化部署与管理大数据集群的方法
CN106330576A (zh) * 2016-11-18 2017-01-11 北京红马传媒文化发展有限公司 容器化微服务自动伸缩及迁移调度的方法、系统和设备
CN106603284A (zh) * 2016-12-14 2017-04-26 国网天津市电力公司 基于Docker虚拟容器微应用平台系统及运行方法
CN107294772A (zh) * 2017-05-23 2017-10-24 甘肃万维信息技术有限责任公司 一种结合Docker实现动态管理监控服务系统
CN107395762A (zh) * 2017-08-30 2017-11-24 四川长虹电器股份有限公司 一种基于Docker容器的应用服务访问系统及方法
CN107733977A (zh) * 2017-08-31 2018-02-23 北京百度网讯科技有限公司 一种基于Docker的集群管理方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045656A (zh) * 2015-06-30 2015-11-11 深圳清华大学研究院 基于虚拟容器的大数据存储与管理方法
CN106325975A (zh) * 2016-09-09 2017-01-11 浪潮软件股份有限公司 一种利用Docker容器自动化部署与管理大数据集群的方法
CN106330576A (zh) * 2016-11-18 2017-01-11 北京红马传媒文化发展有限公司 容器化微服务自动伸缩及迁移调度的方法、系统和设备
CN106603284A (zh) * 2016-12-14 2017-04-26 国网天津市电力公司 基于Docker虚拟容器微应用平台系统及运行方法
CN107294772A (zh) * 2017-05-23 2017-10-24 甘肃万维信息技术有限责任公司 一种结合Docker实现动态管理监控服务系统
CN107395762A (zh) * 2017-08-30 2017-11-24 四川长虹电器股份有限公司 一种基于Docker容器的应用服务访问系统及方法
CN107733977A (zh) * 2017-08-31 2018-02-23 北京百度网讯科技有限公司 一种基于Docker的集群管理方法及装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321152A (zh) * 2019-07-04 2019-10-11 青岛华正信息技术股份有限公司 一种软件开发平台
CN110321152B (zh) * 2019-07-04 2023-08-29 青岛华正信息技术股份有限公司 一种软件开发平台
CN110912972A (zh) * 2019-11-07 2020-03-24 北京浪潮数据技术有限公司 一种业务处理方法、系统、电子设备及可读存储介质
CN111026414B (zh) * 2019-12-12 2023-09-08 杭州安恒信息技术股份有限公司 一种基于kubernetes的HDP平台部署方法
CN111026414A (zh) * 2019-12-12 2020-04-17 杭州安恒信息技术股份有限公司 一种基于kubernetes的HDP平台部署方法
CN111431748A (zh) * 2020-03-20 2020-07-17 支付宝(杭州)信息技术有限公司 一种对集群进行自动运维的方法、系统及装置
CN111431748B (zh) * 2020-03-20 2022-09-30 支付宝(杭州)信息技术有限公司 一种对集群进行自动运维的方法、系统及装置
CN111708605A (zh) * 2020-05-29 2020-09-25 北京赛博云睿智能科技有限公司 一种智能运维支撑方法和支撑系统
CN112149975A (zh) * 2020-09-11 2020-12-29 杭州东方通信软件技术有限公司 一种基于人工智能的apm监控系统及监控方法
US11687288B2 (en) * 2020-10-27 2023-06-27 Viettel Group Method of queue design for data storage and management
US20220129203A1 (en) * 2020-10-27 2022-04-28 Viettel Group Method of queue design for data storage and management
CN112394945A (zh) * 2020-10-28 2021-02-23 浙江大学 一种面向复杂边缘计算的系统校验方法
CN112764875A (zh) * 2020-12-31 2021-05-07 中国科学院软件研究所 一种面向智能计算的轻量级入口容器微服务系统及方法
CN113472845B (zh) * 2021-05-27 2023-05-09 四川大学华西医院 一种基于容器技术的医学物联网智能系统
CN113472845A (zh) * 2021-05-27 2021-10-01 四川大学华西医院 一种基于容器技术的医学物联网智能系统
CN113259377B (zh) * 2021-06-11 2021-09-21 中国电子信息产业集团有限公司第六研究所 一种互联网安全监控系统、方法及集成一体机
CN113259377A (zh) * 2021-06-11 2021-08-13 中国电子信息产业集团有限公司第六研究所 一种互联网安全监控系统、方法及集成一体机
CN113419750B (zh) * 2021-08-24 2021-11-02 北京华品博睿网络技术有限公司 一种模型推理服务调用系统和方法
CN113419750A (zh) * 2021-08-24 2021-09-21 北京华品博睿网络技术有限公司 一种模型推理服务调用系统和方法
CN116643950A (zh) * 2023-07-19 2023-08-25 浩鲸云计算科技股份有限公司 一种基于FaaS的云原生应用自动化运维方法
CN116643950B (zh) * 2023-07-19 2023-10-20 浩鲸云计算科技股份有限公司 一种基于FaaS的云原生应用自动化运维方法

Also Published As

Publication number Publication date
CN109934361B (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
CN109934361A (zh) 一种基于容器和大数据的自动化运维平台模型
US11386058B2 (en) Rule-based autonomous database cloud service framework
US10389592B2 (en) Method, system and program product for allocation and/or prioritization of electronic resources
Islam et al. Predicting application failure in cloud: A machine learning approach
Shahverdi et al. Big stream processing systems: an experimental evaluation
CN105144118A (zh) 应用测试和分析
CN103279471A (zh) 剖析图数据的逻辑分组
Couceiro et al. Chasing the optimum in replicated in-memory transactional platforms via protocol adaptation
CN113778500A (zh) 一种基于DevOps的软件开发生命周期管理平台
CN104077224A (zh) 软件功能分析系统与方法
CN110502366A (zh) 案例执行方法、装置、设备及计算机可读存储介质
Cunha et al. Context-aware execution migration tool for data science Jupyter Notebooks on hybrid clouds
Rauschmayr et al. Amazon sagemaker debugger: a system for real-time insights into machine learning model training
CN116643950B (zh) 一种基于FaaS的云原生应用自动化运维方法
Wesolowski et al. Datacenter-scale analysis and optimization of gpu machine learning workloads
Ilin et al. Performance analysis of software with a variant NoSQL data schemes
Eggum Smartphone assisted, complex event processing
CN112364071A (zh) 货值数据分析方法及系统
CN113094240A (zh) 应用程序的异常监控方法、移动终端和存储介质
Chowdhury Scaling a convolutional neural network based Flower counting application in a distributed GPU cluster
US11449413B2 (en) Accelerating development and deployment of enterprise applications in data driven enterprise IT systems
Chouliaras Adaptive resource provisioning in cloud computing environments
CN117057755B (zh) 面向工业控制设备的流程热更新方法、设备及介质
Friebe et al. Work-in-Progress: Validation of Probabilistic Timing Models of a Periodic Task with Interference-A Case Study
Kang An Analysis of Workload Patterns In Borg Cloud Cluster Traces

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20191125

Address after: 210024 civil defense building, No. 189, Guangzhou Road, Gulou District, Nanjing, Jiangsu

Applicant after: Jiangsu Electric Power Information Technology Co., Ltd.

Applicant after: State Grid Jiangsu Electric Power Co., Ltd.

Applicant after: Information and communication branch of Jiangsu Electric Power Co., Ltd.

Address before: 210024 civil defense building, No. 189, Guangzhou Road, Gulou District, Nanjing, Jiangsu

Applicant before: Jiangsu Electric Power Information Technology Co., Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant