CN114090386A - 一种监控Kubernetes运行的方法及系统 - Google Patents

一种监控Kubernetes运行的方法及系统 Download PDF

Info

Publication number
CN114090386A
CN114090386A CN202111405348.5A CN202111405348A CN114090386A CN 114090386 A CN114090386 A CN 114090386A CN 202111405348 A CN202111405348 A CN 202111405348A CN 114090386 A CN114090386 A CN 114090386A
Authority
CN
China
Prior art keywords
service
command line
kubernets
monitoring
agent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111405348.5A
Other languages
English (en)
Inventor
吴阳
王刚
生铮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Cloud Information Technology Co Ltd
Original Assignee
Inspur Cloud Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Cloud Information Technology Co Ltd filed Critical Inspur Cloud Information Technology Co Ltd
Priority to CN202111405348.5A priority Critical patent/CN114090386A/zh
Publication of CN114090386A publication Critical patent/CN114090386A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/301Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种监控Kubernetes运行的方法及系统,属于云计算技术领域,通过监控Kubernetes集群中Pod命令行执行结果实现监控Kubernetes运行,在Kubernetes集群中的Pod中部署Agent服务执行命令行,并将执行结果反馈至统一的Service服务,来排查Pod运行过程中可能会遇到的问题。本发明监控Kubernetes运行,可以实现不改变原有Kubernetes集群的网络结构,而且在其质上进行拓展,和原有网络模型兼容;可以更加细致的观察指定pod中命令行的执行结果,对执行结果进行分析展示。

Description

一种监控Kubernetes运行的方法及系统
技术领域
本发明涉及云计算技术领域,具体地说是一种监控Kubernetes运行的方法及系统。
背景技术
目前云计算技术正在趋于成熟,使用部署在云上的应用、服务越来越多。管理和编排云上应用、程序最好的解决方案就是使用Kubernetes进行控制。Kubernetes提供了应用部署,规划,更新,维护的一种机制。而Kubernetes的部署方式一般是集群部署,通常的做法是找几台服务器组成集群来部署Kubernetes相关组件。Kubernetes为用户提供了很多核心的功能,包括自愈、弹性伸缩、服务的自发现和负载均衡、滚动升级和一键回滚等。在日常的云计算使用过程中需要运行非常多的容器,需要更加细致化的监控每个容器的运行情况,更有效的预警机制。
发明内容
本发明的技术任务是针对以上不足之处,提供一种监控Kubernetes运行的方法及系统,通过在Kubernetes集群对应管理侧部署监控应用Service服务,来分析Kubernetes集群中的Pod命令行执行结果,来排查Pod运行过程中可能会遇到的问题。
本发明解决其技术问题所采用的技术方案是:
一种监控Kubernetes运行的方法,通过监控Kubernetes集群中Pod命令行执行结果实现监控Kubernetes运行,在Kubernetes集群中的Pod中部署Agent服务执行命令行,并将执行结果反馈至统一的Service服务,来排查Pod运行过程中可能会遇到的问题;
该方法的实现包括两部分:
在Kuberntes集群中Pod运行Agent服务执行命令行,Agent服务执行Service服务中设置的该Pod需要执行的命令行,并将执行结果反馈至Service服务;
Service服务收集Agent服务命令行执行结果后,进行分析、展示和预警。
进一步的,在集群中的管理侧的一个节点上部署Pod监控应用Service服务,在所述Pod中部署Agent服务,使Service服务和Agent服务在一个集群内部署,并修改相关配置参数使Service服务和Agent服务可以互相访问;
Agent服务执行Service服务中设置该Pod需要执行的命令行,并将命令行的执行结果每隔一个时间节点反馈至Service服务,Service服务在收集pod中Agent服务命令行执行结果后,进行分析展示,并对特定的执行结果进行预警操作。
优选的,所述Service服务包括:
配置Agent服务:Service服务中配置Agent服务,需要新增Agent服务的相关参数;在新增完成后,向对应Agent服务发送命令行执行请求;
数据接收服务:Service服务启动特定Http服务,用于接收Agent服务发送的数据,在配置完Agent服务后,Agent服务会定期将命令行执行结果反馈给Service服务,Service将接收的数据按照指定的结构存储至本地的数据库;
数据分析服务:Service服务定时分析之前存储的服务,通过Html页面展示出来,按照Agent服务进行分类;
预警提示服务:配置Service服务数据分析服务,当命令行执行结果等于或者不等于提前设定的结果时,将发送预警提示。
优选的,所述新增Agent服务的相关参数包括:Agent服务Ip、命令行执行时间间隔、命令行执行次数、命令行的名称、命令行、命令行执行结果;
数据分析服务中Service服务定时分析之前存储的服务,分析数据包括Agent服务Ip、时间、命令行的名称、命令行、命令行执行结果。
优选的,所述预警提示服务,在Service服务指定Agent服务A执行命令行top,当执行结果中%CUP数据大于100,则进行资源预警提示,预警提示包括邮件预警和/或页面展示预警。
优选的,所述Agent服务功能包括:在指定时间间隔执行Service服务中配置的命令行;将执行命令行的结果定时发送至Service服务中。
进一步的,所述Agent服务包括:
执行命令行:Agent服务在接收到Service服务发送的命令行执行请求后,根据请求中的参数,定时的执行相关命令行,并将结果统一存储至本地数据库。
发送命令行执行结果至Service服务:Agent服务在特定的时间间隔统一将命令行执行的结果,通过Http请求的方式反馈至Service服务。请求中的数据包括:Agent服务Ip、命令行执行时间间隔、命令行执行次数、命令行的名称、命令行、命令行执行结果。
本方法不需要改变Kubernetes集群原有的部署方式。只需要在集群中的一个节点上部署Pod监控应用Service服务,在Pod中部署Agent服务,修改相关配置参数使Service服务和Agent服务可以互相访问。其中,Agent服务主要功能是执行Service服务中设置该Pod需要执行的命令行,并将命令行的执行结果每隔一个时间节点反馈至Service服务,Service服务在收集pod中Agent服务命令行执行结果后,进行分析展示,并对特定的执行结果进行预警操作,从而达到监控预警功能。
本发明还要求保护一种监控Kubernetes运行的系统,该系统通过监控Kubernetes集群中Pod命令行执行结果实现监控Kubernetes运行,
该系统实现上述的监控Kubernetes运行的方法。
本发明还要求保护一种监控Kubernetes运行的装置,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行上述的监控Kubernetes运行的方法。
本发明还要求保护计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行上述的监控Kubernetes运行的方法。
本发明的一种监控Kubernetes运行的方法及系统与现有技术相比,具有以下有益效果:
通过该方法监控Kubernetes运行,可以实现不改变原有Kubernetes集群的网络结构,而且在其质上进行拓展,和原有网络模型兼容;
该方法可以更加细致的观察指定pod中命令行的执行结果,对执行结果进行分析展示。
该方法提供监控预警机制,更加快速准确的反馈命令行的执行情况。帮助运维人员更好的使用Kubernetes集群服务。
附图说明
图1是本发明实施例提供的监控Kubernetes运行的方法的架构示图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
一种监控Kubernetes运行的方法,通过监控Kubernetes集群中Pod命令行执行结果实现监控Kubernetes运行,在Kubernetes集群中的Pod中部署Agent服务执行命令行,并将执行结果反馈至统一的Service服务,来排查Pod运行过程中可能会遇到的问题。
通过本方法,不需要改变Kubernetes集群原有的部署方式,只需要在集群中的一个节点上部署Pod监控应用Service服务,在Pod中部署Agent服务,修改相关配置参数使Service服务和Agent服务可以互相访问。其中,Agent服务主要功能是执行Service服务中设置该Pod需要执行的命令行,并将命令行的执行结果每隔一个时间节点反馈至Service服务,Service服务在收集pod中Agent服务命令行执行结果后,进行分析展示,并对特定的执行结果进行预警操作,从而达到监控预警功能。
本方法的实现包括两个部分:
一部分是在Kuberntes集群中Pod运行Agent服务执行命令行;
另一部分是Service服务收集Agent服务命令行执行结果后,进行分析、展示和预警。
需要在集群中的管理测的一个节点上部署Pod监控应用Service服务,在Pod中部署Agent服务,修改相关配置参数使Service服务和Agent服务可以互相访问。
Service服务:
在集群中的管理测的一个节点上部署Pod监控应用Service服务,服务主要作用是接收Agent服务定时发送的数据,进行数据分析、预警、展示。部署Service服务和Agent服务需要在一个集群内,且Service服务与Agent服务可以互相访问。
下面举例说明一下具体的Service服务:
1)、配置Agent服务:Service服务中配置Agent服务,需要新增Agent服务的相关参数,例如:Agent服务Ip、命令行执行时间间隔、命令行执行次数、命令行的名称、命令行、命令行执行结果。在新增完成后,向对应Agent服务发送命令行执行请求。
2)、数据接收服务:Service服务启动特定Http服务,用于接收Agent服务发送的数据,在配置完Agent服务后,Agent服务会定期将命令行执行结果反馈给Service服务,Service将接收的数据按照指定的结构存储至本地的数据库。
3)、数据分析服务:Service服务会定时分析之前存储的服务,分析数据包括Agent服务Ip、时间、命令行的名称、命令行、命令行执行结果,通过Html页面展示出来,按照Agent服务进行分类。
4)、预警提示服务:配置Service服务数据分析服务,当命令行执行结果等于或者不等于提前设定的结果时,将发送预警提示。例如在Service服务指定Agent服务A执行命令行top,当执行结果中%CUP数据大于100,则进行资源预警提示,预警提示包括,邮件预警,页面展示预警等。
Agent服务:
Agent服务需要运行在每一个需要被监控的Pod资源中,主要功能有两个部分,一个部分是在指定时间间隔执行Service服务中配置的命令行,令一部分是将执行命令行的结果定时发送至Service服务中。
下面举例说明一下具体的Agent服务:
1)、执行命令行:Agent服务在接收到Service服务发送的命令行执行请求后,根据请求中的参数,定时的执行相关命令行,并将结果统一存储至本地数据库。
2)、发送命令行执行结果至Service服务:Agent服务在特定的时间间隔统一将命令行执行的结果,通过Http请求的方式反馈至Service服务。请求中的数据包括:Agent服务Ip、命令行执行时间间隔、命令行执行次数、命令行的名称、命令行、命令行执行结果。
本发明实施例还提供了一种监控Kubernetes运行的系统,该系统通过监控Kubernetes集群中Pod命令行执行结果实现监控Kubernetes运行,
该系统实现本发明上述实施例中所述的监控Kubernetes运行的方法。
本发明实施例还提供了一种监控Kubernetes运行的装置,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行本发明上述实施例中所述的监控Kubernetes运行的方法。
本发明实施例还提供了一种计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行本发明上述实施例中所述的监控Kubernetes运行的方法。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
上文通过附图和优选实施例对本发明进行了详细展示和说明,然而本发明不限于这些已揭示的实施例,基与上述多个实施例本领域技术人员可以知晓,可以组合上述不同实施例中的代码审核手段得到本发明更多的实施例,这些实施例也在本发明的保护范围之内。

Claims (10)

1.一种监控Kubernetes运行的方法,其特征在于,通过监控Kubernetes集群中Pod命令行执行结果实现监控Kubernetes运行,在Kubernetes集群中的Pod中部署Agent服务执行命令行,并将执行结果反馈至统一的Service服务,来排查Pod运行过程中可能会遇到的问题;
该方法的实现包括两部分:
在Kuberntes集群中Pod运行Agent服务执行命令行,Agent服务执行Service服务中设置的该Pod需要执行的命令行,并将执行结果反馈至Service服务;
Service服务收集Agent服务命令行执行结果后,进行分析、展示和预警。
2.根据权利要求1所述的一种监控Kubernetes运行的方法,其特征在于,在集群中的管理侧的一个节点上部署Pod监控应用Service服务,在所述Pod中部署Agent服务,使Service服务和Agent服务在一个集群内部署,并修改相关配置参数使Service服务和Agent服务可以互相访问;
Agent服务执行Service服务中设置该Pod需要执行的命令行,并将命令行的执行结果每隔一个时间节点反馈至Service服务,Service服务在收集pod中Agent服务命令行执行结果后,进行分析展示,并对特定的执行结果进行预警操作。
3.根据权利要求1或2所述的一种监控Kubernetes运行的方法,其特征在于所述Service服务包括:
配置Agent服务:Service服务中配置Agent服务,需要新增Agent服务的相关参数;在新增完成后,向对应Agent服务发送命令行执行请求;
数据接收服务:Service服务启动特定Http服务,用于接收Agent服务发送的数据,在配置完Agent服务后,Agent服务会定期将命令行执行结果反馈给Service服务,Service将接收的数据按照指定的结构存储至本地的数据库;
数据分析服务:Service服务定时分析之前存储的服务,通过Html页面展示出来,按照Agent服务进行分类;
预警提示服务:配置Service服务数据分析服务,当命令行执行结果等于或者不等于提前设定的结果时,将发送预警提示。
4.根据权利要求3所述的一种监控Kubernetes运行的方法,其特征在于,所述新增Agent服务的相关参数包括:Agent服务Ip、命令行执行时间间隔、命令行执行次数、命令行的名称、命令行、命令行执行结果;
数据分析服务中Service服务定时分析之前存储的服务,分析数据包括Agent服务Ip、时间、命令行的名称、命令行、命令行执行结果。
5.根据权利要求3所述的一种监控Kubernetes运行的方法,其特征在于,所述预警提示服务,在Service服务指定Agent服务A执行命令行top,当执行结果中%CUP数据大于100,则进行资源预警提示,预警提示包括邮件预警和/或页面展示预警。
6.根据权利要求1或2所述的一种监控Kubernetes运行的方法,其特征在于,所述Agent服务功能包括:在指定时间间隔执行Service服务中配置的命令行;将执行命令行的结果定时发送至Service服务中。
7.根据权利要求6所述的一种监控Kubernetes运行的方法,其特征在于,所述Agent服务包括:
执行命令行:Agent服务在接收到Service服务发送的命令行执行请求后,根据请求中的参数,定时的执行相关命令行,并将结果统一存储至本地数据库。
发送命令行执行结果至Service服务:Agent服务在特定的时间间隔统一将命令行执行的结果,通过Http请求的方式反馈至Service服务。
8.一种监控Kubernetes运行的系统,其特征在于,该系统通过监控Kubernetes集群中Pod命令行执行结果实现监控Kubernetes运行,
该系统实现权利要求1-7所述的监控Kubernetes运行的方法。
9.一种监控Kubernetes运行的装置,其特征在于,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行权利要求1至7任一所述的监控Kubernetes运行的方法。
10.计算机可读介质,其特征在于,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行权利要求1至7任一所述的监控Kubernetes运行的方法。
CN202111405348.5A 2021-11-24 2021-11-24 一种监控Kubernetes运行的方法及系统 Pending CN114090386A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111405348.5A CN114090386A (zh) 2021-11-24 2021-11-24 一种监控Kubernetes运行的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111405348.5A CN114090386A (zh) 2021-11-24 2021-11-24 一种监控Kubernetes运行的方法及系统

Publications (1)

Publication Number Publication Date
CN114090386A true CN114090386A (zh) 2022-02-25

Family

ID=80304023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111405348.5A Pending CN114090386A (zh) 2021-11-24 2021-11-24 一种监控Kubernetes运行的方法及系统

Country Status (1)

Country Link
CN (1) CN114090386A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114328130A (zh) * 2022-03-03 2022-04-12 深圳市明源云科技有限公司 服务器监控方法、系统、设备及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114328130A (zh) * 2022-03-03 2022-04-12 深圳市明源云科技有限公司 服务器监控方法、系统、设备及计算机可读存储介质
CN114328130B (zh) * 2022-03-03 2022-08-12 深圳市明源云科技有限公司 服务器监控方法、系统、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN106844198B (zh) 一种分布式调度自动化测试平台及方法
CN104731580B (zh) 基于Karaf与ActiveMQ的自动化运维系统及其实现方法
CN105653425B (zh) 基于复杂事件处理引擎的监控系统
CN107508722B (zh) 一种业务监控方法和装置
US8020044B2 (en) Distributed batch runner
CN111338814A (zh) 消息处理方法和装置、存储介质和电子装置
CN112559133A (zh) 一种基于原生容器技术的云边协同系统及云边协同方法
EP3200071A1 (en) Runtime environment configuration method, device and system
CN107992392B (zh) 一种用于云渲染系统的自动监控修复系统和方法
CN107483567B (zh) 一种分布式日志搜索的方法及系统
CN103678133A (zh) 一种用于应用软件云测试的任务调度系统
CN108521339A (zh) 一种基于集群日志的反馈式节点故障处理方法及系统
CN106533803B (zh) 基于tr069协议的cpe配置方法及装置
US9195535B2 (en) Hotspot identification
CN114356499A (zh) Kubernetes集群告警根因分析方法及装置
CN110908674A (zh) 应用程序的自动化部署方法及装置
CN112529223A (zh) 一种设备故障报修方法、装置、服务器及储存介质
CN112350854A (zh) 一种流量故障定位方法、装置、设备及存储介质
CN114090386A (zh) 一种监控Kubernetes运行的方法及系统
CN110855481B (zh) 数据采集系统及方法
CN110750453B (zh) 基于html5的智能移动端测试方法、系统、服务器及存储介质
CN111654411A (zh) 一种巡检方法及相关装置
CN114553867A (zh) 一种云原生的跨云网络监控方法、装置及存储介质
CN107995026B (zh) 基于中间件的管控方法、管理节点、受管节点及系统
CN108241545B (zh) 系统故障的调试方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination