CN115967619A - 适配多cpu架构多云平台的监控技术 - Google Patents

适配多cpu架构多云平台的监控技术 Download PDF

Info

Publication number
CN115967619A
CN115967619A CN202211417973.6A CN202211417973A CN115967619A CN 115967619 A CN115967619 A CN 115967619A CN 202211417973 A CN202211417973 A CN 202211417973A CN 115967619 A CN115967619 A CN 115967619A
Authority
CN
China
Prior art keywords
monitoring
cloud
cloud platform
management
architecture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211417973.6A
Other languages
English (en)
Other versions
CN115967619B (zh
Inventor
李森
王伟华
周飞
谈超洪
文静
彭新永
韦宇星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi Gradient Technology Co ltd
Guangxi Zhuang Autonomous Region Information Center Guangxi Zhuang Autonomous Region Big Data Research Institute
Original Assignee
Guangxi Gradient Technology Co ltd
Guangxi Zhuang Autonomous Region Information Center Guangxi Zhuang Autonomous Region Big Data Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi Gradient Technology Co ltd, Guangxi Zhuang Autonomous Region Information Center Guangxi Zhuang Autonomous Region Big Data Research Institute filed Critical Guangxi Gradient Technology Co ltd
Priority to CN202211417973.6A priority Critical patent/CN115967619B/zh
Publication of CN115967619A publication Critical patent/CN115967619A/zh
Application granted granted Critical
Publication of CN115967619B publication Critical patent/CN115967619B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明属于云计算技术领域,具体涉及一种适配多CPU架构多云平台的监控技术,包括:S1、开发自定义的export组件,部署到虚拟机或物理机上面;S2、编写镜像构建步骤文件Dockerfile,构建适配不同架构环境下的资源监控服务应用;S3、部署多云管理平台,用于供用户单位运维人员在多云管理平台上创建数据采集目标;S4、自定义新建配置监控实例,用于分类管理,图形化展示各资源的监控指标数据;S5、进入新建的监控实例中,创建监控指标;S6、在创建的监控指标的基础上,自定义配置告警规则;S7、在告警事件管理界面,查看告警事件记录。本发明可以解决由于不同云厂商的系统架构不一致导致无法全局统一的对多个云平台资源进行监控管理的问题,具有较好的市场应用前景。

Description

适配多CPU架构多云平台的监控技术
技术领域
本发明属于云计算技术领域,具体涉及一种适配多CPU架构多云平台的监控技术。
背景技术
在企业数字化发展的进程中,企业不可避免的会使用多个云厂商的资源和服务。伴随着多个云平台的使用,由于不同云厂商的系统架构不一致,监控告警体系实现不一致,监控数据管理展示统计不一致,自定义配置告警规则支持程度不一致等等,就出现了企业资源的难以统一管理监控等等问题。用户需要熟悉了解不同云平台的资源管理界面的交互方式,资源监控告警规则配置方式等等,无法全局统一的对多个云平台资源进行监控管理。
目前信创多云环境下,国内的云服务提供商(华为云、阿里云、腾讯云、天翼云、浪潮云等)各自采取了不同的国产操作系统(麒麟、深度Linux、安超OS),以及不同的CPU架构(X86、ARM)。
当前业内两大主流监控方案:Zabbix和Prometheus。Zabbix更适合监控物理机环境,由于使用关系型数据库进行监控数据存储,后期的数据查询,聚合都有很大的问题。使用不灵活,定制化难度高,可扩展性相对较差。Prometheus更适合云环境的监控,对OpenStack,Kubernetes有更好的集成。支持更大的规模集群,采用TSDB时序数据库,大大的节省了存储空间,并且提升了查询效率。使用灵活,定制化难度低,可扩展性强
对此,最终我们采用了Prometheus做资源监控。在Prometheus原有的基础上,我们对不同的国产操作系统(麒麟、深度Linux、安超OS),以及不同的CPU架构(X86、ARM)进行了适配兼容,实现了跨平台,跨架构统一管理。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本发明的目的是在于提供一种适配多CPU架构多云平台的监控技术,以解决由于不同云厂商的系统架构不一致导致无法全局统一的对多个云平台资源进行监控管理的问题。
为了实现上述目的,本发明提供了如下技术方案:
适配多CPU架构多云平台的监控技术,包括以下步骤:
S1、开发自定义的export组件,部署到虚拟机或物理机上面;
S2、编写镜像构建步骤文件Dockerfile,构建适配不同架构环境下的资源监控服务应用;
S3、部署多云管理平台,用于供用户单位运维人员在多云管理平台上创建数据采集目标;
S4、自定义新建配置监控实例,用于分类管理,图形化展示各资源的监控指标数据;
S5、进入新建的监控实例中,创建监控指标;
S6、在创建的监控指标的基础上,自定义配置告警规则;
S7、在告警事件管理界面,查看告警事件记录。
作为优选,所述export组件包括node-exporter、mysql-exporter、redis--exporter和rabbitmq-exporter。
作为优选,步骤S3中的数据采集目标会自动同步到Prometheus监控配置中,用于定时拉取目标的指标数据。
作为优选,步骤S6中自定义配置的告警规则达到触发条件时,自动发出告警事件。
与现有技术相比,本发明具有如下有益效果:
(1)本发明的适配多CPU架构多云平台的监控技术,做到了去平台化,兼容不同操作系统和CPU架构,可以集中式的对不同云平台的资源进行监管管理,大大节约了企业运维成本。
(2)本发明的适配多CPU架构多云平台的监控技术,可以提供更高灵活度的资源监控管理和监控组件的扩展,能够适应更复杂的监控运维场景。
(3)本发明的适配多CPU架构多云平台的监控技术,不仅可以有效的区分资源使用情况,提高资源的利用率,防止资源浪费,还可以及时发现负载过高的资源,防范在高并发的情况下服务崩溃,有效防止企业事故的发生。
附图说明
图1是本发明的适配多CPU架构多云平台的监控技术的流程示意图;
具体实施方式
下面对本发明专利的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域所属的技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,如出现术语“中心”、“上”、“下”“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对发明的限制。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,如出现术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接连接,也可以通过中间媒介间接相连,可以是两个元件内部的连接。对于本领域所属的技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
适配多CPU架构多云平台的监控技术,包括以下步骤:
S1、开发自定义的export组件,部署到虚拟机或物理机上面;
S2、编写镜像构建步骤文件Dockerfile,构建适配不同架构环境下的资源监控服务应用;
S3、部署多云管理平台,用于供用户单位运维人员在多云管理平台上创建数据采集目标;数据采集目标会自动同步到Prometheus监控配置中,用于定时拉取目标的指标数据;
S4、自定义新建配置监控实例,用于分类管理,图形化展示各资源的监控指标数据;
S5、进入新建的监控实例中,创建监控指标;
S6、在创建的监控指标的基础上,自定义配置告警规则;当达到触发条件时,自动发出告警事件;
S7、在告警事件管理界面,查看告警事件记录。
在本实施例中,所述export组件包括node-exporter、mysql-exporter、redis--exporter和rabbitmq-exporter,,用于监控不同的资源组件。
编写的Dockerfile通过持续集成,可以在多架构环境中构建适配国产操作系统下X86、ARM等不同架构环境下的资源监控服务应用,可以用来提供多云管理云平台监控功能服务。
经过步骤S1、S2和S3配置后,监控数据存储到监控中心,方便用户自定义新建配置监控实例。进入新建的监控实例中,创建监控指标,可以自定义配置PromQL表达式,用于图形化展示指标数据。在创建的监控指标的基础上,自定义配置告警规则,可以指定告警间隔、触发条件、通知方式、告警级别等等。其中,通知方式包括短信、钉钉、邮件、站内信等。在告警事件管理界面,查看告警事件记录,可以看到监控的资源对象,然后可以对资源进行运维管理。
本发明的适配多CPU架构多云平台的监控技术,通过在服务镜像层面适配不同的系统架构,提供了一个统一管理的入口,以Prometheus为底座,实现了自身特有的监控技术。在Prometheus原有的基础上,我们对不同的国产操作系统(麒麟、深度Linux、安超OS),以及不同的CPU架构(X86、ARM)进行了适配兼容,实现了跨平台、跨CPU架构,方便跨架构统一管理。
本发明的适配多CPU架构多云平台的监控技术,可以兼容多架构环境,支持服务的动态发现和静态配置,支持自定义告警规则。本发明的适配多CPU架构多云平台的监控技术,还可以自定义扩展监控组件和监控指标数据,大大提高了监控的灵活性。因为统一了监控管理,也大大节约了企业运维时间成本等。
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。

Claims (4)

1.适配多CPU架构多云平台的监控技术,其特征在于,包括以下步骤:
S1、开发自定义的export组件,部署到虚拟机或物理机上面;
S2、编写镜像构建步骤文件Dockerfile,构建适配不同架构环境下的资源监控服务应用;
S3、部署多云管理平台,用于供用户单位运维人员在多云管理平台上创建数据采集目标;
S4、自定义新建配置监控实例,用于分类管理,图形化展示各资源的监控指标数据;
S5、进入新建的监控实例中,创建监控指标;
S6、在创建的监控指标的基础上,自定义配置告警规则;
S7、在告警事件管理界面,查看告警事件记录。
2.根据权利要求1所述的适配多CPU架构多云平台的监控技术,其特征在于,所述export组件包括node-exporter、mysql-exporter、redis--exporter和rabbitmq-exporter。
3.根据权利要求1所述的适配多CPU架构多云平台的监控技术,其特征在于,步骤S3中的数据采集目标会自动同步到Prometheus监控配置中,用于定时拉取目标的指标数据。
4.根据权利要求1所述的适配多CPU架构多云平台的监控技术,其特征在于,步骤S6中自定义配置的告警规则达到触发条件时,自动发出告警事件。
CN202211417973.6A 2022-11-14 2022-11-14 适配多cpu架构多云平台的监控技术 Active CN115967619B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211417973.6A CN115967619B (zh) 2022-11-14 2022-11-14 适配多cpu架构多云平台的监控技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211417973.6A CN115967619B (zh) 2022-11-14 2022-11-14 适配多cpu架构多云平台的监控技术

Publications (2)

Publication Number Publication Date
CN115967619A true CN115967619A (zh) 2023-04-14
CN115967619B CN115967619B (zh) 2023-07-07

Family

ID=85900220

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211417973.6A Active CN115967619B (zh) 2022-11-14 2022-11-14 适配多cpu架构多云平台的监控技术

Country Status (1)

Country Link
CN (1) CN115967619B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084009A (zh) * 2020-09-17 2020-12-15 湖南长城科技信息有限公司 PK体系下基于容器化技术构建和监控Hadoop集群与告警的方法
CN112416524A (zh) * 2020-11-25 2021-02-26 电信科学技术第十研究所有限公司 基于docker和kubernetes离线的跨平台的CI/CD的实现方法及装置
CN114338687A (zh) * 2021-12-23 2022-04-12 中国农业银行股份有限公司 中间件管理方法和服务器
CN114356714A (zh) * 2022-01-07 2022-04-15 中国科学技术大学 基于Kubernetes智能板卡集群的资源集成监控与调度装置
CN115220839A (zh) * 2022-07-13 2022-10-21 北京凯锐远景科技有限公司 一种信息平台管理系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084009A (zh) * 2020-09-17 2020-12-15 湖南长城科技信息有限公司 PK体系下基于容器化技术构建和监控Hadoop集群与告警的方法
CN112416524A (zh) * 2020-11-25 2021-02-26 电信科学技术第十研究所有限公司 基于docker和kubernetes离线的跨平台的CI/CD的实现方法及装置
CN114338687A (zh) * 2021-12-23 2022-04-12 中国农业银行股份有限公司 中间件管理方法和服务器
CN114356714A (zh) * 2022-01-07 2022-04-15 中国科学技术大学 基于Kubernetes智能板卡集群的资源集成监控与调度装置
CN115220839A (zh) * 2022-07-13 2022-10-21 北京凯锐远景科技有限公司 一种信息平台管理系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
林灵等: "自主可控云原生生态与架构研究", 信息通信技术, pages 63 - 57 *
谢峰等: "基于云技术的边缘计算平台基础运行环境设计", 自动化博览, pages 55 - 61 *

Also Published As

Publication number Publication date
CN115967619B (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
US10469600B2 (en) Local Proxy for service discovery
CN111459763B (zh) 跨kubernetes集群监控系统及方法
WO2023142054A1 (zh) 一种面向容器微服务的性能监控告警方法及告警系统
CN111209011A (zh) 一种跨平台的容器云自动化部署系统
CN103761309A (zh) 一种运营数据处理方法及系统
CN104243236A (zh) 一种监控系统运维告警数据分析的方法、系统及服务器
CN108932184A (zh) 监控装置及方法
CN104881352A (zh) 基于移动端的系统资源监控装置
CN105429791A (zh) 一种分布式服务状态检测器及方法
CN108848132B (zh) 一种基于云的配电调度主站系统
CN113377626B (zh) 基于服务树的可视化统一报警方法、装置、设备和介质
CN108347347A (zh) 一种信息处理方法、装置和系统
WO2023245985A1 (zh) 一种基于物模型的智慧网关适配系统及其运行方法
CN114598586A (zh) 一种多云场景算力网格化方法及系统
CN116192961A (zh) 一种多中心异构多云环境高效适配方法
CN103051478B (zh) 一种大容量电信网管系统及其设置和应用方法
CN115967619A (zh) 适配多cpu架构多云平台的监控技术
CN109165022A (zh) 一种大数据集群部署方法、系统、介质及设备
CN104298745A (zh) 电力信息通信机房基础资源模型
CN111984723A (zh) 数据同步方法、装置及终端设备
CN116521664A (zh) 数据仓库的数据监控方法及装置、计算设备、存储介质
CN116069460A (zh) 基于监控体系的Kubernetes容器资源动态调度方法
CN113824801B (zh) 一种智能融合终端统一接入管理组件系统
CN112860657B (zh) Tias系统实时数据库地址空间的构建方法及系统
CN108712499A (zh) 基于对云计算服务进行管理的系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant