CN112152881B - 混合云环境下的网络状态监控方法 - Google Patents

混合云环境下的网络状态监控方法 Download PDF

Info

Publication number
CN112152881B
CN112152881B CN202011018386.0A CN202011018386A CN112152881B CN 112152881 B CN112152881 B CN 112152881B CN 202011018386 A CN202011018386 A CN 202011018386A CN 112152881 B CN112152881 B CN 112152881B
Authority
CN
China
Prior art keywords
monitoring
abnormal
count
hybrid cloud
alarm information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011018386.0A
Other languages
English (en)
Other versions
CN112152881A (zh
Inventor
吴晓峰
赵可欣
臧其事
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank of China Shanghai Branch
Original Assignee
Agricultural Bank of China Shanghai Branch
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank of China Shanghai Branch filed Critical Agricultural Bank of China Shanghai Branch
Priority to CN202011018386.0A priority Critical patent/CN112152881B/zh
Publication of CN112152881A publication Critical patent/CN112152881A/zh
Application granted granted Critical
Publication of CN112152881B publication Critical patent/CN112152881B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明揭示了混合云环境下的网络状态监控方法,包括:设置一组监控项目,监控项目与网络运行的全局参数相关。创建一组对象标识符,对象标识符为全局唯一并且与监控项目一一对应。创建管理信息库,保存对象标识符与监控项目的对应关系。创建服务进程,服务进程调用管理信息库,根据管理信息库将对象标识符与监控项目一一对应。部署服务进程,将服务进程部署至混合云上的各个虚拟机模板以及现存虚拟机上。监控平台根据监控规则编辑监控指令并发送给混合云上的服务器,监控指令中包含对象标识符。服务器调用服务进程,根据监控指令查询各个虚拟机的对应的监控项目的参数,并将执行结果同一反馈给监控平台。监控平台根据反馈的执行结果确定网络状态。

Description

混合云环境下的网络状态监控方法
技术领域
本发明涉及云计算领域,更具体地说,涉及分布式网络环境下的监控基数。
背景技术
随着分布式网络结构和云计算技术的发展和普及,大量的运行环境被放置到云端。云主要包括公有云和私有云,而目前由公有云和私有云共同组成的混合云环境是主流运行环境。混合云的运行环境下DevOps(Development和Operations的组合词,表示开发和运维的合作沟通)的要求也随之提高。在混合云环境下会部署大量的虚拟机并运用云计算管理平台进行管理。比如VMWare、Openstack等虚拟化技术都是当前广泛使用的虚拟机以及云计算管理平台。
混合云运行过程中同样会出现各种故障,在分布式环境下,故障的发现、报警和处理变得更加复杂。现有的混合运运维方案中,主要采用人工巡检结合设备告警的方式来进行故障的发现和排查。
人工巡检主要用于私有云,按照固定周期人工登陆私有云监控运行状态,如果发现异常及时排查。设备告警主要用于公有云,公有云会配置统一的监控进程,在发现设备异常时会主动告警通知用户。对于公有云,操作人员也需要定期登录公有云管理平台进行主动监控。
无论是公有云还是私有云,都会面临一个问题,异常以及故障的识别依赖于管理信息库(Management Information Base)MIB,MIB中记录了与设备、故障、异常状况等对应的标识符,在出现故障或者异常时,会以是标识符的形式反馈。操作人员根据标识符定位设备、故障或者异常。由于各个服务器厂商会自行定义各自的MIB文件,当组成混合云的服务器来自多个服务器厂商时,由于各家的MIB定义不同,就会使得设备、故障或者异常的定位过程变得复杂,需要根据不同服务器的MIB进行定位。
上述的问题共同导致了混合云环境下的运维困境:
1)过于依赖人工运维,运维人员负荷较大。无论是私有云还是公有云,都需要大量的人工维护工作。
2)响应迟缓。按照现有的运维模式,从问题发现到处理的时间通常在15分钟左右,滞后于系统可用性需求。
3)无法做到统一管理。由于底层服务器不同,按照现有的运维模式无法对公有云和私有云设备信息进行统一管理和监控,对相同或近似的操作需要重复多次,造成人力的浪费。
发明内容
本发明提出一种混合云环境下的网络状态监控方法,包括下述的步骤:
设置一组监控项目,监控项目与网络运行的全局参数相关;
创建一组对象标识符,对象标识符为全局唯一并且与监控项目一一对应;
创建管理信息库,管理信息库中保存对象标识符与监控项目的对应关系;
创建服务进程,该服务进程调用管理信息库,根据管理信息库将对象标识符与监控项目一一对应;
部署服务进程,将服务进程部署至混合云上的各个虚拟机模板以及现存虚拟机上;
监控平台根据监控规则编辑监控指令并发送给混合云上的服务器,监控指令中包含对象标识符;
服务器调用服务进程,根据监控指令查询各个虚拟机的对应的监控项目的参数,并将执行结果同一反馈给监控平台;
监控平台根据反馈的执行结果确定网络状态。
在一个实施例中,对象标识符是按照简单网络管理协议定义的对象标识符。
在一个实施例中,监控项目包括:正在运行的进程列表、已经安装的软件列表、CPU负载、存储器使用率、虚拟内存使用状态、索引节点使用率、收发数据量。
在一个实施例中,监控正在运行的进程列表包括:
每隔固定的时间间隔,遍历当前正在运行的进程列表,检查是否有黑名单进程正在运行;
如果发现黑名单进程正在运行,则关闭该黑名单进程并发出告警信息;
如果没有发现正在运行的黑名单进程,则发出正常信息;
告警信息或者正常信息为监控正在运行的进程列表的执行结果。
在一个实施例中,监控已经安装的软件列表包括:
每隔固定的时间间隔,遍历已经安装的软件列表,检查是否缺少必备软件清单中的软件;
如果缺少必备软件清单中的软件,则发出告警信息;
如果没有发现缺少必备软件清单中的软件,则发出正常信息;
告警信息或者正常信息为监控正在运行的进程列表的执行结果。
在一个实施例中,监控CPU负载包括:
每隔固定的时间间隔,遍历每一个CPU核的当前负载,如果所有的CPU核的当前负载都大于80%,记录为异常状态并且异常计数+1;
当异常计数累计到3时,发出告警信息,当异常计数>3时,异常计数每增加2就发送一次告警信息;
当任意一个CPU核的当前负载不大于80%时,将异常计数清零。
在一个实施例中,监控存储器使用率包括:
每隔固定的时间间隔,遍历每一个存储器的当前使用率,如果任意一个存储器的当前使用率大于80%,记录为异常状态并且异常计数+1;
当异常计数累计到3时,发出告警信息,当异常计数>3时,异常计数每增加2就发送一次告警信息;
当所有的存储器的使用率都不大于80%时,将异常计数清零。
在一个实施例中,监控虚拟内存使用状态包括:
每隔固定的时间间隔,获取总虚拟内存空间值Total_Swap_Size以及可用虚拟空间值Available_Swap_Space,计算虚拟空间可用比Available_Swap_Space/Total_Swap_Size,如果虚拟空间可用比<0.5,记录为异常状态并且异常计数+1;
当异常计数累计到3时,发出告警信息,当异常计数>3时,异常计数每增加2就发送一次告警信息;
当虚拟空间可用比≥0.5时,将异常计数清零。
在一个实施例中,监控索引节点使用率包括:
每隔固定的时间间隔,遍历每一个存储器的索引节点的当前使用率,如果任意一个存储器的索引节点的当前使用率大于80%,记录为异常状态并且异常计数+1;
当异常计数累计到3时,发出告警信息,当异常计数>3时,异常计数每增加2就发送一次告警信息;
当所有的存储器的索引节点使用率都不大于80%时,将异常计数清零。
在一个实施例中,监控收发数据量包括:
以固定的时间间隔执行:
在时刻t遍历所有接口,获得时刻t的所有接口接收字节数和所有接口发送字节数;
在相隔固定的时间间隔的下一个时刻t+1遍历所有接口,获得时刻t+1的所有接口接收字节数和所有接口发送字节数;
计算时刻t+1与时刻t之间接收字节数的差值deltaInOctet和发送字节数的差值deltaOutOctet;
在业务时段内,如果deltaInOctet<1k或者deltaOutOctet<1k,记录为异常状态并且异常计数+1;
当异常计数累计到5时,发出告警信息,当异常计数>5时,异常计数每增加5就发送一次告警信息;
当deltaInOctet≥1k并且deltaOutOctet≥1k,将异常计数清零。
本发明的混合云环境下的网络状态监控方法解决了混合云环境下的监控问题,提供统一的监控平台,对由全局唯一对象标识符的监控项目进行监控,监控项目反应全局参数。本发明的监控方法能提高系统兼容性和通用性,降低人工依赖度,便于统一管理。
附图说明
图1揭示了根据本发明的一实施例的混合云环境下的网络状态监控方法的流程图。
具体实施方式
本发明提出一种混合云环境下的网络状态监控方法。图1揭示了根据本发明的一实施例的混合云环境下的网络状态监控方法的流程图。参考图1所示,该混合云环境下的网络状态监控方法包括如下的步骤:
S101、设置一组监控项目,监控项目与网络运行的全局参数相关。在一个实施例中,监控项目可以包括:正在运行的进程列表、已经安装的软件列表、CPU负载、存储器使用率、虚拟内存使用状态、索引节点使用率、收发数据量。这些都是体现网络全局性能的参数。
S102、创建一组对象标识符(Object Identifier,OID),对象标识符为全局唯一并且与监控项目一一对应。在一个实施例中,本发明是按照简单网络管理协议SNMP执行,对象标识符OID是按照简单网络管理协议SNMP定义的对象标识符OID。
S103、创建管理信息库MIB,管理信息库MIB中保存对象标识符OID与监控项目的对应关系。
S104、创建服务进程,该服务进程调用管理信息库MIB,根据管理信息库MIB将对象标识符OID与监控项目一一对应。
S105、部署服务进程,将服务进程部署至混合云上的各个虚拟机模板以及现存虚拟机上。
S106、监控平台根据监控规则编辑监控指令并发送给混合云上的服务器,监控指令中包含对象标识符OID。
S107、服务器调用服务进程,根据监控指令查询各个虚拟机的对应的监控项目的参数,并将执行结果同一反馈给监控平台。
S108、监控平台根据反馈的执行结果确定网络状态。
下面详细介绍各个监控项目:正在运行的进程列表、已经安装的软件列表、CPU负载、存储器使用率、虚拟内存使用状态、索引节点使用率、收发数据量的具体执行过程。
监控正在运行的进程列表包括:
每隔固定的时间间隔,遍历当前正在运行的进程列表,检查是否有黑名单进程正在运行;
如果发现黑名单进程正在运行,则关闭该黑名单进程并发出告警信息;
如果没有发现正在运行的黑名单进程,则发出正常信息;
告警信息或者正常信息为监控正在运行的进程列表的执行结果。
监控正在运行的进程列表是为了判断是否有非法进程在运行,例如ccproxy。在一个具体实现中:
每隔300秒,使用walk指令遍历.1.3.6.1.2.1.25.4.2.1.2(系统运行的进程列表),检查是否存在有在黑名单中的进程运行。
如果存在,尝试kill-9指令终止该进程,并通过get.1.3.6.1.2.1.1.4.0获取系统联系人信息,向系统联系人及总控台发送告警。
监控已经安装的软件列表包括:
每隔固定的时间间隔,遍历已经安装的软件列表,检查是否缺少必备软件清单中的软件;
如果缺少必备软件清单中的软件,则发出告警信息;
如果没有发现缺少必备软件清单中的软件,则发出正常信息;
告警信息或者正常信息为监控正在运行的进程列表的执行结果。
监控已经安装的软件列表是为了判断是否满足了必备软件要求,例如g01的加固,或者windows服务器的杀毒软件。在一个具体实现中,
每隔300秒,使用walk指令遍历.1.3.6.1.2.1.25.6.3.1.2(系统安装的软件列表),检查是否存在有在必备软件清单未安装。
如果存在,通过get.1.3.6.1.2.1.1.4.0获取系统联系人,向系统联系人及总控台发送告警。
监控CPU负载包括:
每隔固定的时间间隔,遍历每一个CPU核的当前负载,如果所有的CPU核的当前负载都大于80%,记录为异常状态并且异常计数+1;
当异常计数累计到3时,发出告警信息,当异常计数>3时,异常计数每增加2就发送一次告警信息;
当任意一个CPU核的当前负载不大于80%时,将异常计数清零。
监控CPU负载是因为系统允许短期高负载的出现,但持续90秒未结束的任务可能出现了死循环,需要告警。在一个具体实现中,
每隔30秒,使用walk指令遍历.1.3.6.1.2.1.25.3.3.1.2(CPU核的当前负载,hrProcessorLoad),获取每个CPU核当前的负载,如果所有CPU核的负载都大于80%,标记状态为异常,记录次数为1。
次数为3时,通过get.1.3.6.1.2.1.1.4.0获取系统联系人,向系统联系人及总控台发送告警。
从次数为3开始,次数每加2,发送一次告警。
当不满足所有CPU核的负载大于80%的条件时,即当任意一个CPU核的当前负载不大于80%时,将次数清零。
监控存储器使用率包括:
每隔固定的时间间隔,遍历每一个存储器的当前使用率,如果任意一个存储器的当前使用率大于80%,记录为异常状态并且异常计数+1;
当异常计数累计到3时,发出告警信息,当异常计数>3时,异常计数每增加2就发送一次告警信息;
当所有的存储器的使用率都不大于80%时,将异常计数清零。
检查存储器使用率的报警阈值设定为80%,当使用率超过80%时,如果有大文件被解压会十分危险。在一个具体实现中,
每隔30秒,使用walk指令遍历.1.3.6.1.4.1.2021.9.1.9(存储器使用空间百分比Percentage of space used on disk),获取每个disk当前的使用情况,如果有任意disk的使用率高于80%,标记状态为异常,记录次数为1。
次数为3时,通过get.1.3.6.1.2.1.1.4.0获取系统联系人,向系统联系人及总控台发送告警。
从次数为3开始,次数每加2,发送一次告警。
当不满足任意disk的使用率高于80%的条件时,即所有的disk的使用率都不高于80%时,次数清零。
监控虚拟内存使用状态包括:
每隔固定的时间间隔,获取总虚拟内存空间值Total_Swap_Size以及可用虚拟空间值Available_Swap_Space,计算虚拟空间可用比Available_Swap_Space/Total_Swap_Size,如果虚拟空间可用比<0.5,记录为异常状态并且异常计数+1;
当异常计数累计到3时,发出告警信息,当异常计数>3时,异常计数每增加2就发送一次告警信息;
当虚拟空间可用比≥0.5时,将异常计数清零。
检查虚拟内存SWAP状态是因为当使用SWAP时,表示内存已耗尽而使用了SWAP,需要调整服务器设置或者检查程序是否有内存泄漏导致内存耗尽。在一个具体实现中,
每隔30秒,使用get指令获取.1.3.6.1.4.1.2021.4.3.0(总虚拟内存空间值TotalSwap Size)与.1.3.6.1.4.1.2021.4.4.0(可用虚拟空间值Available Swap Space),记为Total_Swap_Size及Available_Swap_Space。计算虚拟空间可用比Available_Swap_Space/Total_Swap_Size,如结果<0.5,标记状态为异常,记录次数为1。
次数为3时,通过get.1.3.6.1.2.1.1.4.0获取系统联系人,向系统联系人及总控台发送告警。
从次数为3开始,次数每加2,发送一次告警。
当不满足Available_Swap_Space/Total_Swap_Size<0.5的条件时,次数清零。
监控索引节点使用率包括:
每隔固定的时间间隔,遍历每一个存储器的索引节点的当前使用率,如果任意一个存储器的索引节点的当前使用率大于80%,记录为异常状态并且异常计数+1;
当异常计数累计到3时,发出告警信息,当异常计数>3时,异常计数每增加2就发送一次告警信息;
当所有的存储器的索引节点使用率都不大于80%时,将异常计数清零。
检查索引节点inode使用率,报警阈值为80%。如果inode耗尽,即使存储器尚存空间,也会由于索引节点inode不足而无法进行创建文件等操作。
在一个具体实现中,
每隔30秒,使用walk指令遍历.1.3.6.1.4.1.2021.9.1.10(存储器索引节点使用百分比Percentage of inodes used on disk),获取每个disk当前的inode的使用情况,如果有任意disk的inode高于80%,标记状态为异常,记录次数为1。
次数为3时,通过get.1.3.6.1.2.1.1.4.0获取系统联系人,向系统联系人及总控台发送告警。
从次数为3开始,次数每加2,发送一次告警。
当不满足任意disk的inode高于80%的条件时,即所有disk的inode使用率都不高于80%时,次数清零。
监控收发数据量包括:
以固定的时间间隔执行:
在时刻t遍历所有接口,获得时刻t的所有接口接收字节数和所有接口发送字节数;
在相隔固定的时间间隔的下一个时刻t+1遍历所有接口,获得时刻t+1的所有接口接收字节数和所有接口发送字节数;
计算时刻t+1与时刻t之间接收字节数的差值deltaInOctet和发送字节数的差值deltaOutOctet;
在业务时段内,如果deltaInOctet<1k或者deltaOutOctet<1k,记录为异常状态并且异常计数+1;
当异常计数累计到5时,发出告警信息,当异常计数>5时,异常计数每增加5就发送一次告警信息;
当deltaInOctet≥1k并且deltaOutOctet≥1k,将异常计数清零。
监控收发数据量是为了判断网络和业务是否中断,在正常工作时段,几乎不存在5分钟内连续无网络包的情况发生,连续5分钟接受和发送小于1k,可以认为系统失去响应(所以没有返回包),或者网络异常中断。在一个具体实现中,
每隔60秒,
使用walk指令遍历.1.3.6.1.2.1.2.2.1.10(接口收到的字节数),将所有接口的字节数加总后得到此刻t的InOctet。
使用walk指令遍历.1.3.6.1.2.1.2.2.1.16(接口发送的字节数),将所有接口的字节数加总后得到此刻t的OutOctet。
在下一轮遍历时,得到t+1时刻的InOctet和OutOctet。
使用t+1时刻的InOctet-t时刻的InOctet,得到deltaInOctet。
使用t+1时刻的OutOctet-t时刻的OutOctet,得到deltaOutOctet。
在业务时段(8:30-17:00),deltaInOctet<1k或者deltaOutOctet<1k,标记状态为异常,记录次数为1。
次数为5时,通过get.1.3.6.1.2.1.1.4.0获取系统联系人,向系统联系人及总控台发送告警。
从次数为5开始,次数每加5,发送一次告警。
当不满足任意deltaInOctet<1k或者deltaOutOctet<1k的条件时,次数清零。
本发明的混合云环境下的网络状态监控方法解决了混合云环境下的监控问题,提供统一的监控平台,对由全局唯一对象标识符的监控项目进行监控,监控项目反应全局参数。本发明的监控方法能提高系统兼容性和通用性,降低人工依赖度,便于统一管理。
还需要注意的是,以上所列举的实施例仅为本发明的具体实施例。显然本发明不局限于以上实施例,随之做出的类似变化或变形是本领域技术人员能从本发明公开的内容直接得出或者很容易便联想到的,均应属于本发明的保护范围。上述实施例是提供给熟悉本领域内的人员来实现或使用本发明的,熟悉本领域的人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的最大范围。

Claims (10)

1.一种混合云环境下的网络状态监控方法,其特征在于,包括:
设置一组监控项目,监控项目与网络运行的全局参数相关;
创建一组对象标识符,对象标识符为全局唯一并且与监控项目一一对应;
创建管理信息库,管理信息库中保存对象标识符与监控项目的对应关系;
创建服务进程,该服务进程调用管理信息库,根据管理信息库将对象标识符与监控项目一一对应;
部署服务进程,将所述服务进程部署至混合云上的各个虚拟机模板以及现存虚拟机上;
监控平台根据监控规则编辑监控指令并发送给混合云上的服务器,所述监控指令中包含对象标识符;
服务器调用所述服务进程,根据监控指令查询各个虚拟机的对应的监控项目的参数,并将执行结果统一反馈给监控平台;
监控平台根据反馈的执行结果确定网络状态。
2.如权利要求1所述的混合云环境下的网络状态监控方法,其特征在于,所述对象标识符是按照简单网络管理协议定义的对象标识符。
3.如权利要求2所述的混合云环境下的网络状态监控方法,其特征在于,所述监控项目包括:
正在运行的进程列表、已经安装的软件列表、CPU负载、存储器使用率、虚拟内存使用状态、索引节点使用率、收发数据量。
4.如权利要求3所述的混合云环境下的网络状态监控方法,其特征在于,监控正在运行的进程列表包括:
每隔固定的时间间隔,遍历当前正在运行的进程列表,检查是否有黑名单进程正在运行;
如果发现黑名单进程正在运行,则关闭该黑名单进程并发出告警信息;
如果没有发现正在运行的黑名单进程,则发出正常信息;
所述告警信息或者正常信息为监控正在运行的进程列表的执行结果。
5.如权利要求3所述的混合云环境下的网络状态监控方法,其特征在于,监控已经安装的软件列表包括:
每隔固定的时间间隔,遍历已经安装的软件列表,检查是否缺少必备软件清单中的软件;
如果缺少必备软件清单中的软件,则发出告警信息;
如果没有发现缺少必备软件清单中的软件,则发出正常信息;
所述告警信息或者正常信息为监控正在运行的进程列表的执行结果。
6.如权利要求3所述的混合云环境下的网络状态监控方法,其特征在于,监控CPU负载包括:
每隔固定的时间间隔,遍历每一个CPU核的当前负载,如果所有的CPU核的当前负载都大于80%,记录为异常状态并且异常计数+1;
当异常计数累计到3时,发出告警信息,当异常计数>3时,异常计数每增加2就发送一次告警信息;
当任意一个CPU核的当前负载不大于80%时,将异常计数清零。
7.如权利要求3所述的混合云环境下的网络状态监控方法,其特征在于,监控存储器使用率包括:
每隔固定的时间间隔,遍历每一个存储器的当前使用率,如果任意一个存储器的当前使用率大于80%,记录为异常状态并且异常计数+1;
当异常计数累计到3时,发出告警信息,当异常计数>3时,异常计数每增加2就发送一次告警信息;
当所有的存储器的使用率都不大于80%时,将异常计数清零。
8.如权利要求3所述的混合云环境下的网络状态监控方法,其特征在于,监控虚拟内存使用状态包括:
每隔固定的时间间隔,获取总虚拟内存空间值Total_Swap_Size以及可用虚拟空间值Available_Swap_Space,计算虚拟空间可用比Available_Swap_Space/Total_Swap_Size,如果虚拟空间可用比<0.5,记录为异常状态并且异常计数+1;
当异常计数累计到3时,发出告警信息,当异常计数>3时,异常计数每增加2就发送一次告警信息;
当虚拟空间可用比≥0.5时,将异常计数清零。
9.如权利要求3所述的混合云环境下的网络状态监控方法,其特征在于,监控索引节点使用率包括:
每隔固定的时间间隔,遍历每一个存储器的索引节点的当前使用率,如果任意一个存储器的索引节点的当前使用率大于80%,记录为异常状态并且异常计数+1;
当异常计数累计到3时,发出告警信息,当异常计数>3时,异常计数每增加2就发送一次告警信息;
当所有的存储器的索引节点使用率都不大于80%时,将异常计数清零。
10.如权利要求3所述的混合云环境下的网络状态监控方法,其特征在于,监控收发数据量包括:
以固定的时间间隔执行:
在时刻t遍历所有接口,获得时刻t的所有接口接收字节数和所有接口发送字节数;
在相隔固定的时间间隔的下一个时刻t+1遍历所有接口,获得时刻t+1的所有接口接收字节数和所有接口发送字节数;
计算时刻t+1与时刻t之间接收字节数的差值deltaInOctet和发送字节数的差值deltaOutOctet;
在业务时段内,如果deltaInOctet<1k或者deltaOutOctet<1k,记录为异常状态并且异常计数+1;
当异常计数累计到5时,发出告警信息,当异常计数>5时,异常计数每增加5就发送一次告警信息;
当deltaInOctet≥1k并且deltaOutOctet≥1k,将异常计数清零。
CN202011018386.0A 2020-09-24 2020-09-24 混合云环境下的网络状态监控方法 Active CN112152881B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011018386.0A CN112152881B (zh) 2020-09-24 2020-09-24 混合云环境下的网络状态监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011018386.0A CN112152881B (zh) 2020-09-24 2020-09-24 混合云环境下的网络状态监控方法

Publications (2)

Publication Number Publication Date
CN112152881A CN112152881A (zh) 2020-12-29
CN112152881B true CN112152881B (zh) 2022-05-17

Family

ID=73896845

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011018386.0A Active CN112152881B (zh) 2020-09-24 2020-09-24 混合云环境下的网络状态监控方法

Country Status (1)

Country Link
CN (1) CN112152881B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116016257B (zh) * 2023-01-28 2023-06-20 鹏城实验室 状态监测方法、装置、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108199920A (zh) * 2017-12-29 2018-06-22 北京星河星云信息技术有限公司 监控云平台中的服务器的性能的方法和服务器

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140366155A1 (en) * 2013-06-11 2014-12-11 Cisco Technology, Inc. Method and system of providing storage services in multiple public clouds
CN104506393B (zh) * 2015-01-06 2017-12-08 北京海量数据技术股份有限公司 一种基于云平台的系统监控方法
CN107592237B (zh) * 2016-07-08 2020-09-08 腾讯科技(深圳)有限公司 一种混合云的资源监控方法及系统
WO2018095416A1 (zh) * 2016-11-24 2018-05-31 腾讯科技(深圳)有限公司 信息处理方法、装置及系统
US10708136B2 (en) * 2017-06-20 2020-07-07 Microsoft Technology Licensing, Llc Standardization of network management across cloud computing environments and data control policies
CN107222356A (zh) * 2017-07-28 2017-09-29 郑州云海信息技术有限公司 一种云监控系统告警方法和系统
CN108880867B (zh) * 2018-05-31 2020-09-04 腾讯科技(深圳)有限公司 一种网络设备数据采集方法及系统
CN109450693B (zh) * 2018-11-23 2021-12-10 金色熊猫有限公司 混合云监控系统及使用其的监控方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108199920A (zh) * 2017-12-29 2018-06-22 北京星河星云信息技术有限公司 监控云平台中的服务器的性能的方法和服务器

Also Published As

Publication number Publication date
CN112152881A (zh) 2020-12-29

Similar Documents

Publication Publication Date Title
US11140037B2 (en) Communication method, network device, and system
KR100978726B1 (ko) 장치 관리에서 소정 동작을 구현하기 위한 장치 및 방법
US9319284B2 (en) Operation delay monitoring method, operation management apparatus, and operation management program
US20040193711A1 (en) Local assurance management device for an equipment element in a communication network
US20120005538A1 (en) Dynamic Discovery Algorithm
EP3044690A1 (en) Intelligent auto-scaling
CN103607297A (zh) 一种计算机集群系统的故障处理方法
US20090070425A1 (en) Data processing system, method of updating a configuration file and computer program product
JP2008092598A (ja) 通信ネットワークを管理する方法および通信システム
CN110677480B (zh) 一种节点健康管理方法、装置和计算机可读存储介质
CN108111499B (zh) 业务处理性能优化方法、装置、电子设备及存储介质
CN107888455A (zh) 一种数据检测方法、装置和系统
CN112152881B (zh) 混合云环境下的网络状态监控方法
CN110611597A (zh) 一种基于单向网闸环境的跨域运维系统
CN115202958A (zh) 一种电力异常监控方法、装置、电子设备及存储介质
CN107453888B (zh) 高可用性的虚拟机集群的管理方法及装置
CN105849699B (zh) 控制数据中心架构设备的方法
CN112054925B (zh) 一种部署后台服务的方法及装置
CN110224872B (zh) 一种通信方法、装置及存储介质
Lee et al. A fault management system for nfv
US20100153543A1 (en) Method and System for Intelligent Management of Performance Measurements In Communication Networks
JP2016146519A (ja) ネットワーク監視システム、監視装置および監視方法
Cisco Network Management Basics
JP5761422B2 (ja) 管理装置、ネットワークシステム、統合管理システム、管理方法、及び管理プログラム
CN110995500A (zh) 节点日志管控方法、系统及相关组件

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant