CN113505051A - 数据上报方法以及装置、网络设备、计算机可读存储介质 - Google Patents

数据上报方法以及装置、网络设备、计算机可读存储介质 Download PDF

Info

Publication number
CN113505051A
CN113505051A CN202110724154.5A CN202110724154A CN113505051A CN 113505051 A CN113505051 A CN 113505051A CN 202110724154 A CN202110724154 A CN 202110724154A CN 113505051 A CN113505051 A CN 113505051A
Authority
CN
China
Prior art keywords
characteristic data
cpu
reporting
event
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110724154.5A
Other languages
English (en)
Other versions
CN113505051B (zh
Inventor
霍晓宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Big Data Technologies Co Ltd
Original Assignee
New H3C Big Data Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Big Data Technologies Co Ltd filed Critical New H3C Big Data Technologies Co Ltd
Priority to CN202110724154.5A priority Critical patent/CN113505051B/zh
Publication of CN113505051A publication Critical patent/CN113505051A/zh
Application granted granted Critical
Publication of CN113505051B publication Critical patent/CN113505051B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3433Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment for load management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本说明书提供一种数据上报方法及装置、网络设备、计算机可读存储介质,所述方法包括:应用于监控模块,所述监控模块用于监控至少一个特性数据的状态,其中,若接收到针对任一特性数据的CPU的相对阈值事件,则延长该特性数据的默认上报周期,其中,所述CPU的相对阈值事件是在所述特性数据的CPU使用率大于或等于第一相对阈值时触发的;按照延长后的第一上报周期上报该特性数据。

Description

数据上报方法以及装置、网络设备、计算机可读存储介质
技术领域
本说明书涉及通信技术领域,尤其涉及一种数据上报方法、装置及网络设备、计算机可读存储介质。
背景技术
现今网络规模越来越大,部署的复杂度逐步提升,用户对业务的质量要求也不断提高,智能运维重要性日渐突出,而智能运维必须通过海量数据采集,才能从大数据中分析出网络指标的过去、现在和未来,实现运维的精细化和智能化。但海量数据的采集量往往与网络设备的资源使用成正比,尤其是CPU和内存,即数据采集越多对网络设备就会造成越大的运行压力。
Telemetry(遥测技术)是一项监控设备性能和故障的远程数据采集技术。在网络中,由网络设备对指定数据采集整理后,通过GRPC(Remote Procedure Call,远程过程调用)、INT(In-band Network Telemetry,带内遥测技术)、ERSPAN(Encapsulated RemoteSwitch Port Analyzer,远程网络流量监控技术)等不同封装方式,主动将数据上报给采集器,这样就实现了一次订阅持续上报,不仅减轻了设备处理查询请求的压力,还能使采集数据的精度更高,数据上报更及时。
虽然Telemetry这种方式已经大大降低了采集器主动采集对设备的消耗,但是网络设备侧的CPU仍然面对极大的压力,因为目前的数据采集,尤其是性能相关的采集数据,全量数据的量级跟设备的接口数量、网络规模等都成正比关系,同时为了获取更精准的分析结果,极限情况下可能需要以秒级上报,在网络规模大、业务流量复杂的情况下,全量采集得到的数据量非常庞大,在订阅的上报时间点,设备的CPU需要全力处理数据上报,而内存也会被缓存的海量数据占据,导致设备性能受到较大影响。所以需要从数据上报方式进行优化,避免影响网络设备的正常业务运行。
发明内容
为克服相关技术中存在的问题,本说明书提供了一种数据上报方法及装置、网络设备、计算机可读存储介质。
根据本说明书实施例的第一方面,提供一种数据上报方法,应用于监控模块,所述监控模块用于监控至少一个特性数据的状态,所述方法包括:
若接收到针对任一特性数据的CPU的相对阈值事件,则延长该特性数据的默认上报周期,其中,所述CPU的相对阈值事件是在所述特性数据的CPU使用率大于或等于第一相对阈值时触发的;
按照延长后的第一上报周期上报该特性数据。
可选的,若接收到针对任一特性数据的CPU的相对阈值事件之后,所述方法还包括:
若监测到所述特性数据的CPU使用率持续上升,但未接收到CPU的绝对阈值事件,则进一步延长所述第一上报周期至第二上报周期;其中,所述CPU的绝对阈值事件是在特性数据的CPU使用率大于或等于第一绝对阈值时触发的,所述第一绝对阈值大于第一相对阈值;
若检测到所述特性数据的CPU使用率持续下降,但未接收到CPU恢复相对阈值事件,则保持第一上报周期上报该特性数据;其中,所述CPU恢复相对阈值事件是在所述特性数据的CPU使用率由位于第一相对阈值与第一绝对阈值之间的区间降低至小于第一相对阈值时触发的;
若检测到所述特性数据的CPU使用率持续下降,并接收到针对所述特性数据的CPU恢复相对阈值事件,则按照所述第一上报周期上报该特性数据第一预设个数个周期后,恢复默认上报周期。
可选的,所述方法还包括:
若接收到针对所述特性数据的CPU的绝对阈值事件,则当下一上报周期到来时,抑制该特性数据上报,并保存该下一上报周期被抑制上报的特性数据;
当下下一个上报周期到来时,将所述下一上报周期抑制上报的特性数据与所述下下一个上报周期待上报的特性数据去除重复的数据后,进行合并上报;
其中,所述下下一个上报周期是所述下一上报周期的下一个上报周期。
可选的,若接收到针对所述特性数据的CPU的绝对阈值事件之后,所述方法还包括:
若检测到该特性数据的CPU使用率持续下降,但未收到CPU恢复绝对阈值事件,则持续抑制所述特性数据的上报,直至接收到新的事件;
若检测到该特性数据的CPU使用率持续下降,并接收到针对所述特性数据的CPU恢复绝对阈值事件,则采用所述抑制该特性数据上报之前采用的第三上报周期上报所述特性数据;
其中,所述CPU恢复绝对阈值事件是所述特性数据的CPU使用率由大于或等于第一绝对阈值降低至小于第一绝对阈值时触发的。
可选的,若接收到针对所述特性数据的CPU恢复绝对阈值事件之后,所述方法还包括:
若接收到针对所述特性数据的CPU恢复相对阈值事件,则按照所述第三上报周期上报该特性数据第二预设个数个周期后,恢复默认上报周期。
可选的,在接收到针对所述特性数据的CPU的绝对阈值事件之后,所述方法还包括:
若针对所述特性数据的CPU使用率持续增加,则在所述下下一个上报周期的下一个上报周期到来时,则保存待上报的特性数据,并抑制所述特性数据的上报。
可选的,所述方法还包括:
若接收到达到CPU可使用总量的阈值的事件,在当前存在上报的特性数据中选取重要性最低的特性数据停止上报;
其中,所述达到CPU可使用总量阈值的事件是订阅的所有特性数据的CPU使用率的总和达到CPU可使用总量的最大值触发的。
可选的,所述方法还包括:
若接收到达到CPU可使用总量的阈值的事件之后,检测到订阅的所有的特性数据的总的CPU使用率持续增加,则在当前存在上报的特性数据中选取重要性最低的特性数据据停止上报,直至所有订阅的特性数据均停止上报。
可选的,在当前存在上报的特性数据中选取重要性最低的特性数据停止上报,所述方法还包括:
若接收到达到CPU可使用总量的阈值的事件之后,检测到订阅的所有的特性数据的总的CPU使用率持续下降,但未收到恢复CPU可使用总量的阈值的事件,保持各个特性数据的上报方式保持不变;
若接收到达到CPU可使用总量的阈值的事件之后,检测到订阅的所有的特性数据的总的CPU使用率持续下降,并收到恢复CPU可使用总量的阈值的事件,则保持各个特性数据的上报方式第三预设时长之后,在已经停止上报的特性数据中选择重要性最高的特性数据恢复上报;
其中,所述恢复CPU可使用总量的阈值的事件是订阅的所有特性数据的总的CPU使用率小于CPU可使用总量的最大值时触发的。
可选的,所述方法还包括:
若接收到针对任一特性数据的内存的相对阈值事件,且该特性数据的CPU使用率未达到第一绝对阈值,则立刻进行该特性数据的上报;其中,所述内存的相对阈值事件是在该特性数据占用的内存大于或等于第二相对阈值时触发的;
若接收到针对任一特性数据的内存的相对阈值事件,且接收到CPU的绝对阈值事件,则清空该特性数据对应的内存,并停止该特性数据上报,直至接收到CPU恢复相对阈值事件,恢复特性数据上报。
可选的,还包括:
若接收到达到内存可使用总量的阈值的事件,对于CPU使用率未达到第一绝对阈值的特性数据立刻进行上报;其中,所述内存可使用总量的阈值的事件是订阅的所有特性数据占用内存的总和达到可使用内存的最大值触发的;
若接收到达到内存可使用总量的阈值的事件,且接收到CPU的绝对阈值事件,则清空该特性数据对应的内存,并停止数据上报,直至接收到CPU恢复相对阈值事件,恢复特性数据上报。
可选的,所述第一上报周期、所述第二上报周期为预先设置的周期;
或者,所述第一上报周期为在所述默认上报周期的基础上延长预设的周期步长后得到的、所述第二上报周期为在所述第一上报周期的基础上延长至少一个预设的周期步长后得到的。
根据本说明书实施例的第二方面,提供一种数据上报装置,包括监控模块,所述监控模块用于监控至少一个特性数据的状态,所述装置还包括:接收模块、延长模块、上报模块;
延长模块,用于在接收模块接收到针对任一特性数据的CPU的相对阈值事件时,延迟模块303延长该特性数据的默认上报周期,其中,所述CPU的相对阈值事件是在所述特性数据的CPU使用率大于或等于第一相对阈值时触发的;
所述上报模块用于按照延长后的第一上报周期上报该特性数据。
可选的,所述接收模块接收到针对任一特性数据的CPU的相对阈值事件之后,若监控模块监测到所述特性数据的CPU使用率持续上升,但接收模块未接收到CPU的绝对阈值事件,则延长模块进一步延长所述第一上报周期至第二上报周期;其中,所述CPU的绝对阈值事件是在特性数据的CPU使用率大于或等于第一绝对阈值时触发的,所述第一绝对阈值大于第一相对阈值;
若监控模块检测到所述特性数据的CPU使用率持续下降,但接收模块未接收到CPU恢复相对阈值事件,则上报模块保持第一上报周期上报该特性数据;其中,所述CPU恢复相对阈值事件是在所述特性数据的CPU使用率由位于第一相对阈值与第一绝对阈值之间的区间降低至小于第一相对阈值时触发的;
若监控模块检测到所述特性数据的CPU使用率持续下降,并且接收模块接收到针对所述特性数据的CPU恢复相对阈值事件,则上报模块按照所述第一上报周期上报该特性数据第一预设个数个周期后,恢复默认上报周期。
可选的,若接收模块接收到针对所述特性数据的CPU的绝对阈值事件,则当下一上报周期到来时,上报模块抑制该特性数据上报,并保存该下一上报周期被抑制上报的特性数据;
当下下一个上报周期到来时,所述上报模块将所述下一上报周期抑制上报的特性数据与所述下下一个上报周期待上报的特性数据去除重复的数据后,进行合并上报;
其中,所述下下一个上报周期是所述下一上报周期的下一个上报周期。
可选的,若所述接收模块接收到针对所述特性数据的CPU的绝对阈值事件之后,若监控模块检测到该特性数据的CPU使用率持续下降,但接收模块未收到CPU恢复绝对阈值事件,则所述上报模块持续抑制所述特性数据的上报,直至接收到新的事件;
若监控模块检测到该特性数据的CPU使用率持续下降,并且接收模块接收到针对所述特性数据的CPU恢复绝对阈值事件,则上报模块采用所述抑制该特性数据上报之前采用的第三上报周期上报所述特性数据;
其中,所述CPU恢复绝对阈值事件是所述特性数据的CPU使用率由大于或等于第一绝对阈值降低至小于第一绝对阈值时触发的。
可选的,若接收模块接收到针对所述特性数据的CPU恢复绝对阈值事件之后,若接收模块接收到针对所述特性数据的CPU恢复相对阈值事件,则所述上报模块按照所述第三上报周期上报该特性数据第二预设个数个周期后,恢复默认上报周期。
可选的,在接收模块接收到针对所述特性数据的CPU的绝对阈值事件之后,若监控模块监控到针对所述特性数据的CPU使用率持续增加,则上报模块在所述下下一个上报周期的下一个上报周期到来时,则保存待上报的特性数据,并抑制所述特性数据的上报。
可选的,若接收模块接收到达到CPU可使用总量的阈值的事件,则上报模块在当前存在上报的特性数据中选取重要性最低的特性数据停止上报;
其中,所述达到CPU可使用总量阈值的事件是订阅的所有特性数据的CPU使用率的总和达到CPU可使用总量的最大值触发的。
可选的,若接收模块接收到达到CPU可使用总量的阈值的事件之后,监控模块检测到订阅的所有的特性数据的总的CPU使用率持续增加,则上报模块在当前存在上报的特性数据中选取重要性最低的特性数据据停止上报,直至所有订阅的特性数据均停止上报。
可选的,针对上报模块在当前存在上报的特性数据中选取重要性最低的特性数据停止上报,所述上报模块具体用于:
若接收模块接收到达到CPU可使用总量的阈值的事件之后,监控模块检测到订阅的所有的特性数据的总的CPU使用率持续下降,但接收模块未收到恢复CPU可使用总量的阈值的事件,则上报模块保持各个特性数据的上报方式保持不变;
若接收模块接收到达到CPU可使用总量的阈值的事件之后,监控模块检测到订阅的所有的特性数据的总的CPU使用率持续下降,并且接收模块收到恢复CPU可使用总量的阈值的事件,则上报模块保持各个特性数据的上报方式第三预设时长之后,在已经停止上报的特性数据中选择重要性最高的特性数据恢复上报;
其中,所述恢复CPU可使用总量的阈值的事件是订阅的所有特性数据的总的CPU使用率小于CPU可使用总量的最大值时触发的。
可选的,若接收模块接收到针对任一特性数据的内存的相对阈值事件,且监控模块检测到该特性数据的CPU使用率未达到第一绝对阈值,则上报模块进行该特性数据的上报;其中,所述内存的相对阈值事件是在该特性数据占用的内存大于或等于第二相对阈值时触发的;
若接收模块接收到针对任一特性数据的内存的相对阈值事件,且接收模块接收到CPU的绝对阈值事件,则上报模块清空该特性数据对应的内存,并停止该特性数据上报,直至接收到CPU恢复相对阈值事件,恢复特性数据上报。
可选的,若接收模块接收到达到内存可使用总量的阈值的事件,则上报模块对于CPU使用率未达到第一绝对阈值的特性数据进行上报;其中,所述内存可使用总量的阈值的事件是订阅的所有特性数据占用内存的总和达到可使用内存的最大值触发的;
若接收模块接收到达到内存可使用总量的阈值的事件,且接收模块接收到CPU的绝对阈值事件,则上报模块清空该特性数据对应的内存,并停止数据上报,直至接收到CPU恢复相对阈值事件,恢复特性数据上报。根据本说明书实施例的第三方面,提供一种网络设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现上述第一方面提供的任一项所述的方法。
根据本说明书实施例的第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序在被计算机调用时,使所述计算机执行上述第一方面提供的任一项所述的方法。
本说明书的实施例提供的技术方案可以包括以下有益效果:本实施例提供的方法中,可以动态的延长上报周期,由此可以为特性数据的上报留出资源恢复的时机,同时可以避免特性数据的上报影响正常的业务。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。
图1是本说明书一实施例提供的数据上报方法的流程示意图;
图2是本说明书另一实施例提供的数据上报方法的流程示意图;
图3是本说明书再一实施例提供的数据上报方法的流程示意图;
图4是本说明书一实施例提供的数据上报方法的流程示意图;
图5是本说明书另一实施例提供的数据上报方法的流程示意图;
图6是本说明书再一实施例提供的数据上报方法的流程示意图;
图7是本说明书又一实施例提供的数据上报方法的流程示意图;
图8是本说明书一实施例提供的数据上报方法的流程示意图;
图9是本说明书另一实施例提供的数据上报方法的流程示意图;
图10是本说明书再一实施例提供的数据上报方法的流程示意图;
图11是本说明书一实施例提供的数据上报装置的结构示意图;
图12是本说明书提供的网络设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
针对现有技术中的问题,可以采用对增量数据进行上报的方式,在首次上报时上报全量数据,后续仅在数据有变化时上报有变化的数据,不上报无变化的数据,降低了每次全量上报带来的压力。采用增量上报方式时,可以使用定时或定量方式上报增量数据。针对同一模块,在变化的数据达到一定数量或者时间达到一定周期时才进行上报,两种方式可以分别使用或一起使用。在一起使用时,满足任何一个条件就上报。这样不同模块可根据自身对数据精度的需求,定制不同的上报方式。
当网络出现问题的时候,比如路由震荡、广播风暴等,增量数据会变得很庞大,数据的反复变化使得很多增量数据实际上是无意义的,增量上报方式反而会加剧设备此时的性能压力,并且对采集器性能也将造成较大压力。
在设备正常业务已经占用了大量CPU和内存资源时,如果还继续采用已经设置好的上报方式,包括上报周期和增量阈值,会使设备的压力进一步增加,甚至可能影响正常业务的运行。
实施例一
本说明书实施例提供一种数据上报方法,该数据上报方法可以应用于监控模块,该监控模块可以是以软件的形态存在,例如,可以是运行于硬件设备上的监控进程或线程等。该监控模块用于监控一个或者多个特性数据的状态,具体的状态包括CPU的使用率和/或内存的使用率等。
在介绍本说明书提供的数据上报方法之前,对于本说明书中多个实施例中涉及到的一些概念做基本的介绍。
由于网络设备进行数据上报也会占用CPU的处理性能,可以由管理模块按照一定的统计周期进行统计:
(1)每一个特性数据占用的CPU的使用率。其中,特性数据为网络管理设备订阅的关于网络设备的数据,网络设备需要按照一定周期将网络管理设备订阅的特性数据上报至网络管理设备。特性数据的具体内容可以根据实际需求进行订阅。本实施例中所提及的所有特性数据可以均为用户订阅的特性数据。
管理模块还可以统计:
(2)网络管理设备订阅的所有特性数据占用的CPU使用率的总和;
其中,订阅的所有的特性数据的CPU的总量一般要小于等于CPU可使用总量的最大值。其中,CPU可使用总量的最大值可以根据CPU的处理能力预先配置好,或者,另一种实现方式中,CPU的可使用总量的最大值可以根据被其他常规业务占用的CPU的情况进行确定。
例如,常规业务为报文转发业务,那么所有特性数据占用的CPU的总量可以为:
(M-常规业务的CPU的使用率)×B%;
其中,M为CPU总的使用率的最大值,一般可以进行设置,例如,可以设置CPU总的使用率不超过70%。常规业务占用50%,B为特性数据可以占用的比例,B的最大取值可以为100。常规业务的CPU的使用率可以实时进行获取。因此CPU的可使用总量的最大值可以是实时变化的。
(3)每一个特性数据占用的内存;其中,特性数据占用的内存在特性数据被上报至网络管理设备之后会被释放。每一个特性数据占用不同的内存块进行缓存,管理模块可以统计每个特性数据占用的内存。
(4)订阅的所有特性数据占用的内存的总和:即所有特性数据上报使用内存的和。
一般来说,所有特性数据占用的内存的总和要小于或者等于可使用内存的最大值。
可使用内存的最大值可以预先设置好,或者与上述所有特性数据占用的CPU的总量类似的,可以进行实时计算。本实施例中不再详细赘述。
下面对本说明书中涉及到的几个事件加以介绍:
CPU的相对阈值事件:CPU的相对阈值事件是在任一特性数据的CPU使用率大于或等于第一相对阈值时触发的。其中,每一个特性数据可以设置相对应的第一相对阈值。
CPU的绝对阈值事件:针对每一个特性数据,可以设计两级阈值,即相对阈值和绝对阈值,本说明书中,每一个特性数据对应的绝对阈值大于相对阈值。CPU的绝对阈值事件是特性数据的CPU使用率大于或等于第一绝对阈值时触发的。
CPU恢复相对阈值事件:CPU恢复相对阈值事件是在任一特性数据的CPU使用率由位于第一相对阈值与第一绝对阈值之间的区间降低至小于第一相对阈值时触发的。即,该特性数据的CPU使用率的取值区间由:
[第一相对阈值,第一绝对阈值]变化为[0,第一相对阈值)会触发CPU恢复相对阈值事件。
CPU恢复绝对阈值事件:任一特性数据的CPU使用率由大于或等于第一绝对阈值降低至小于第一绝对阈值时触发的。
达到CPU可使用总量的阈值的事件:该事件是网络管理设备订阅的所有特性数据的CPU使用率的总和达到CPU可使用总量的最大值触发的。
恢复CPU可使用总量的阈值的事件:恢复CPU可使用总量的阈值的事件是订阅的所有特性数据的总的CPU使用率小于CPU可使用总量的最大值时触发的。
内存的相对阈值事件:内存的相对阈值事件是在任一特性数据占用的内存大于或等于第二相对阈值时触发的。其中,这里的“第二”是用于与CPU的相对阈值事件中的相对阈值加以区分。
内存可使用总量的阈值的事件:该事件内存可使用总量的阈值的事件是订阅的所有的特性数据占用内存的总和达到可使用内存的最大值触发的。
图1示出了本公开提供的数据上报方法的流程示意图,如图1所示,该方法包括:
步骤101,若接收到针对任一特性数据的CPU的相对阈值事件,则延长该特性数据的默认上报周期,其中,CPU的相对阈值事件是在该特性数据的CPU使用率大于或等于第一相对阈值时触发的。
步骤103,按照延长后的第一上报周期上报该特性数据。
在该实施例提供的数据上报方式中,如果监控模块接收到任一特性数据的CPU的使用率大于或等于第一相对阈值时,则延长该特性数据的上报周期。
这里的上报,若该监控模块在网络设备中,网络设备可以包括路由器、交换机、摄像头、服务器、各种移动终端,本说明书对于网络设备的类型并不加以限定,则监控模块可以上报至网络设备的CPU,或者,直接上报至用于监控管理网络设备的网络管理设备。
在一种可选的实施方式中,上报的特性数据指的是增量数据,即与上一个采集周期相比增加的特性数据。当然,上报的特性数据也可以为全量数据,即本周期采集的全部的特性数据。
本实施例提供的方法,可以动态的延长上报周期,由此可以为特性数据的上报留出资源恢复的时机,同时可以避免特性数据的上报影响正常的业务。
实施例二
在上述实施例一的基础上,本实施例还提供一数据上报方法,图2为本实施例提供的数据上报方法的流程示意图,如图2所示,该方法包括:
步骤101,若接收到针对任一特性数据的CPU的相对阈值事件,则延长该特性数据的默认上报周期,其中,所述CPU的相对阈值事件是在所述特性数据的CPU使用率大于或等于第一相对阈值时触发的;
步骤103,按照延长后的第一上报周期上报该特性数据。
例如,若默认上报周期为T,则可以每一次延长t,t为延长的周期步长,例如,第一上报周期可以为T+t。
其中步骤101与步骤103与上述实施例一相同,在此不再赘述。
步骤105,若监测到特性数据的CPU使用率持续上升,但未接收到CPU的绝对阈值事件,则进一步延长所述第一上报周期至第二上报周期。
其中,CPU的绝对阈值事件是在特性数据的CPU使用率大于或等于第一绝对阈值时触发的,第一绝对阈值大于第一相对阈值。
如果该特性数据的CPU使用率持续上升,但是该特性数据的CPU使用率还没大于或等于第一绝对阈值,则可以进一步延长第一上报周期。具体的,可以通过预先设置的周期步长,对上报周期进行延长。即上述第一上报周期为在所述默认上报周期的基础上延长预设的周期步长后得到的、所述第二上报周期为在所述第一上报周期的基础上延长至少一个预设的周期步长后得到的。可选的,周期步长可以与配置的默认上报周期相同。例如,默认的上报周期为1分钟,那么周期步长可以也为1分钟。
对第一上报周期进行延长时,每一次延长一个周期步长。
进一步的,如果CPU使用率与上一个采集周期相比,CPU使用率继续上升,那么,可以继续延长1个周期步长,依次类推,直至接收到CPU的绝对阈值事件。
第二上报周期可以为T+n×t,其中,n为延长的次数,t为周期步长。
在另一种可选的实施方式中,上述第一上报周期、第二上报周期均为预先设置的周期,即周期对应的时长为预先配置好的。
当然,步骤105的另一种可以替换的实施方式中,若监测到特性数据的CPU使用率持续上升,但未接收到CPU的绝对阈值事件,也可以保持第一上报周期不变。或者,采用配置的上报周期,该配置的上报周期大于默认上报周期即可。
此外,对于本说明书中的持续上升或者持续下降指的是连续预设数量个针对CPU或内存的占用情况的采集,采集的数据的上升或下降的情况。例如,第一次采集CPU使用率为2%,第二次采集CPU使用率为3%,第三次采集CPU使用率为5%,那么可以根据3次采集的数据判断CPU的使用率在上升;第一次采集CPU使用率为2%,第二次采集CPU使用率为1%,第三次采集CPU使用率为5%,第四次采集的CPU使用率为7%,即整体的趋势是在上升,也可以认为是持续上升。
实施例三
在上述实施例一或实施例二的基础上,本实施例还提供一种数据上报方法,图3给出了一种数据上报方法的流程示意图,如图3所示,该方法包括:
步骤101,若接收到针对任一特性数据的CPU的相对阈值事件,则延长该特性数据的默认上报周期,其中,所述CPU的相对阈值事件是在所述特性数据的CPU使用率大于或等于第一相对阈值时触发的;
步骤103,按照延长后的第一上报周期上报该特性数据;
步骤107,若检测到该特性数据的CPU使用率下降,但未接收到CPU恢复相对阈值事件,则保持第一上报周期上报该特性数据。
如果该特征数据的CPU使用率在超过第一相对阈值之后的一段时间内,CPU的使用率一直在下降或者基本维持不变,但是,仍然没有下降到第一相对阈值之下,那么依然可以保持第一上报周期上报该特性数据。
实施例四
在上述实施例一至实施例三的基础上,本实施例还提供一种数据上报方法,图4给出了一种数据上报方法的流程示意图,如图4所示,该方法包括:
步骤101,若接收到针对任一特性数据的CPU的相对阈值事件,则延长该特性数据的默认上报周期,其中,所述CPU的相对阈值事件是在所述特性数据的CPU使用率大于或等于第一相对阈值时触发的;
步骤103,按照延长后的第一上报周期上报该特性数据;
步骤109,若检测到所述特性数据的CPU使用率持续下降,并接收到针对所述特性数据的CPU恢复相对阈值事件,则按照所述第一上报周期上报该特性数据第一预设个数个周期后,恢复默认上报周期。
如果某一特性数据的CPU使用率在超过第一相对阈值之后,CPU的使用率又恢复到第一相对阈值之下,那么可以按照第一上报周期上报该特性数据,例如按照第一上报周期上报3次之后,恢复至默认上报周期进行该特性数据的上报。
需要说明的是,本实施例中的步骤109一般来说,可能会经过实施例二中的步骤107,也就是可能存在某一特性数据的CPU使用率在超过第一相对阈值,但是该CPU的使用率是突然激增,然后又慢慢一点一点的恢复至第一相对阈值之下,该种情况可能会经过步骤107,然后再经过步骤109。或者,CPU的使用率突然激增,又突然下降,对于该种情况,则无需经过步骤107。
本说明书中各个实施例所提供的方法,各个步骤之间在不冲突的情况下可以相互结合。
实施例五
在上述实施例一至实施例四任一实施例的基础上,本实施例还提供一种数据上报方法,图5给出了一种数据上报方法的流程示意图,如图5所示,该方法包括:
步骤101,若接收到针对任一特性数据的CPU的相对阈值事件,则延长该特性数据的默认上报周期,其中,所述CPU的相对阈值事件是在所述特性数据的CPU使用率大于或等于第一相对阈值时触发的;
步骤103,按照延长后的第一上报周期上报该特性数据;
步骤111,若接收到针对所述特性数据的CPU的绝对阈值事件,则当下一上报周期到来时,抑制该特性数据上报,并保存该下一上报周期被抑制上报的特性数据。
步骤113,当下下一个上报周期到来时,将所述下一上报周期抑制上报的特性数据与所述下下一个上报周期待上报的特性数据去除重复的数据后,进行合并上报;其中,所述下下一个上报周期是所述下一上报周期的下一个上报周期。
如果在特性数据的CPU使用率大于或等于第一相对阈值之后,该特性数据对应的CPU使用率继续升高,达到第一绝对阈值,触发了CPU的绝对阈值事件,此时可以抑制该特性数据的上报,同时保留该被抑制上报的特性数据。
当该特性数据的的下下一个上报周期到来时,将上一周期被抑制上报的特性数据以及原本下下一个周报周期需要上报的特性数据去重之后,进行合并上报。
本实施例提供的方法中,在某一特性数据的CPU使用率大于第一相对阈值时,这种情况有可能是因为网络震荡引起的,本实施例提供的方法通过将两个周期重复的特性数据进行去重之后进行特性数据的上报,从而可以在一定程度上避免重复数据上报带来的设备的压力。
针对上述步骤111和步骤113的一种可以替换的实现方式中,若接收到针对所述特性数据的CPU的绝对阈值事件,对多个上报周期应该上报的特性数据进行抑制,进行去重之后,进行上报。
实施例六
在上述实施例一至实施例五任一实施例的基础上,本实施例还提供一种数据上报方法,图6给出了一种数据上报方法的流程示意图,如图6所示,该方法包括:
步骤101,若接收到针对任一特性数据的CPU的相对阈值事件,则延长该特性数据的默认上报周期,其中,所述CPU的相对阈值事件是在所述特性数据的CPU使用率大于或等于第一相对阈值时触发的。
步骤103,按照延长后的第一上报周期上报该特性数据。
步骤111,若接收到针对所述特性数据的CPU的绝对阈值事件,则当下一上报周期到来时,抑制该特性数据上报,并保存该下一上报周期被抑制上报的特性数据。
步骤113,当下下一个上报周期到来时,将所述下一上报周期抑制上报的特性数据与所述下下一个上报周期待上报的特性数据去除重复的数据后,进行合并上报;
步骤115,若检测到该特性数据的CPU使用率持续下降,但未收到CPU恢复绝对阈值事件,持续抑制所述特性数据的上报,直至接收到新的事件。
当该特性数据的CPU的使用率超过第一绝对阈值之后,该特性数据的CPU使用率持续下降,但是还未下降至第一绝对阈值之下,那么持续抑制特性数据的上报。在一个示例中,在接收到相对阈值事件之后,上报周期被延长为T+2t,如果此时接收到CPU的绝对阈值事件,那么开始进行特性数据的上报,此时抑制上报的周期为T+2t,如果特性数据的CPU使用率持续下降,但未收到CPU恢复绝对阈值事件,那么可以按照T+2t进行特性数据的抑制,直至接收到的新的事件。
新的事件会触发对应的流程,这里新的事件可能为CPU恢复绝对阈值事件、或者可能为CPU恢复相对阈值事件等等,对于新的事件类型本实施例不再一一赘述。
实施例七
在上述实施例一至实施例六任一实施例的基础上,本实施例还提供一种数据上报方法,图7给出了一种数据上报方法的流程示意图,如图7所示,该方法包括:
步骤101,若接收到针对任一特性数据的CPU的相对阈值事件,则延长该特性数据的默认上报周期,其中,所述CPU的相对阈值事件是在所述特性数据的CPU使用率大于或等于第一相对阈值时触发的。
步骤103,按照延长后的第一上报周期上报该特性数据;
步骤117,接收到针对所述特性数据的CPU的绝对阈值事件之后,若检测到该特性数据的CPU使用率持续下降,直至接收到针对所述特性数据的CPU恢复绝对阈值事件,则采用抑制该特性数据上报之前采用的第三上报周期上报特性数据。
在这里,由于在接收到针对所述特性数据的CPU的绝对阈值事件时,要对特性数据进行抑制上报,如果此时接收到CPU恢复绝对阈值事件,那么可以采用抑制上报之前采用的上报周期进行上报,在本实施例中,抑制上报之前采用的上报周期被称为第三上报周期。具体的,在一个示例中,如果监控模块先接收到相对阈值事件,若监测到所述特性数据的CPU使用率持续上升,但未接收到CPU的绝对阈值事件,若此时上报周期被延长为第二上报周期T+5t,如果接收到CPU的绝对阈值事件,此时对特性数据进行抑制,此时特性数据本应该按照T+5t的上报周期进行上报,但因为进行了抑制,因此将待上报的特性数据存储至本地,如果此时接收到CPU恢复绝对阈值事件,那么可以采用对特性数据进行抑制上报之前采用的T+5t进行数据上报。
在另一个示例中,如果在CPU使用率激增的情况下,监控模块可能未接收相对阈值事件,直接接收到绝对阈值事件,那么此时的上报周期为T,如果此时接收到CPU恢复绝对阈值事件,那么可以采用对特性数据进行抑制上报之前采用的T进行数据上报。
实施例八
在上述实施例一至实施例七任一实施例的基础上,本实施例还提供一种数据上报方法,图8给出了一种数据上报方法的流程示意图,如图8所示,该方法包括:
步骤101,若接收到针对任一特性数据的CPU的相对阈值事件,则延长该特性数据的默认上报周期,其中,所述CPU的相对阈值事件是在所述特性数据的CPU使用率大于或等于第一相对阈值时触发的。
步骤103,按照延长后的第一上报周期上报该特性数据;
步骤119,在接收到针对所述特性数据的CPU的绝对阈值事件之后,若针对所述特性数据的CPU使用率持续增加,则在所述下下一个上报周期的下一个上报周期到来时,保存待上报的特性数据,并抑制所述特性数据的上报。
如果特性数据占用的CPU利用率在超过第一绝对阈值之后仍然持续增加,那么可以在下下一个上报周期的下一个上报周期到来时,持续抑制该特性数据的上报。在一种可选的实施方式中,正常情况下在该特性数据抑制上报之后,特性数据占用的CPU的利用率一般会下降,因此一般来说,可能抑制上报特性数据的几个周期后,就会使得CPU的利用率恢复至相对比较低的水平。
实施例九
在上述实施例一至实施例八任一实施例的基础上,本实施例还提供一种数据上报方法,图9给出了一种数据上报方法的流程示意图,如图9所示,该方法包括:
步骤101,若接收到针对任一特性数据的CPU的相对阈值事件,则延长该特性数据的默认上报周期,其中,所述CPU的相对阈值事件是在所述特性数据的CPU使用率大于或等于第一相对阈值时触发的。
步骤103,按照延长后的第一上报周期上报该特性数据。
步骤121,若接收到达到CPU可使用总量的阈值的事件,在当前存在上报的特性数据中选取重要性最低的特性数据停止上报。
在这里需要解释的是,对于订阅的特性数据,此时不一定有数据进行上报,因此,可以在当前存在上报的特性数据中选取重要性最低的特性数据停止上报,从而降低CPU利用率。
在一种可选的实施方式中,可以为每个特性数据根据重要程度设置权重,权重值越大,重要性程度越高。
在一种可选的实施方式中,对于订阅的所有特性数据,可以不同的特性数据对应的CPU的相对阈值是相同的,或者,也可以根据重要性程度,配置的CPU的相对阈值是不同的,重要性越高,其对应的CPU的相对阈值越大。
例如,表1示出了三个不同的特性数据,对于每一个特性数据可以设置不同的权重、CPU的相对阈值、CPU的绝对阈值。
表1
特性数据标识 权重 CPU的相对阈值 CPU的绝对阈值
A 0.1 10% 20%
B 0.06 6% 12%
C 0.04 4% 8%
在一个示例中,如果网络管理设备订阅的所有的特性数据的可使用的CPU总量的最大值为25%。如果此时接收到了CPU可使用总量的阈值的事件,说明订阅的所有的特性数据使用的CPU总量超过了25%,那么可以先停止重要性最低的特性数据C的上报。
此时,可能会出现以下几种情况之一:
一种情况是:接收到达到CPU可使用总量的阈值的事件之后,检测到订阅的所有的特性数据的总的CPU使用率持续增加,则在当前存在上报的特性数据中选取重要性最低的特性数据据停止上报,直至所有订阅的特性数据均停止上报。
接续上述示例,在将特性数据C停止上报之后,当前重要性最低的特性数据为特性数据B,此时可以将特性数据B停止上报,如果订阅的所有特性数据的总的CPU使用率还在持续上升,则将特性数据A也停止上报。如果在此期间收到针对某一个特性数据的CPU的相对阈值事件或CPU的绝对阈值的事件,根据本示例提供的处理方式处理。
另外一种情况是:若接收到达到CPU可使用总量的阈值的事件之后,检测到订阅的所有的特性数据的总的CPU使用率持续下降,但未收到恢复CPU可使用总量的阈值的事件,保持各个特性数据的上报方式保持不变。
接续上面的示例,如果订阅的所有特性数据总的CPU使用率在下降,但是未恢复到25%以下,那么保持当前各个特性数据的上报方式不变。
如果收到了任一特性数据的CPU的相对阈值事件或者,任一特性数据的CPU的绝对阈值事件,该任一特性数据按照CPU的相对阈值事件或者CPU的绝对阈值事件处理流程进行处理。
还有一种可能的情况是:若接收到达到CPU可使用总量的阈值的事件之后,检测到订阅的所有的特性数据的总的CPU使用率持续下降,并收到恢复CPU可使用总量的阈值的事件,则保持各个特性数据的上报方式第三预设时长之后,在已经停止上报的特性数据中选择重要性最高的特性数据恢复上报。
由于订阅的所有的特性的总的CPU使用率超过CPU的可使用总量的最大值之后,可能会出现多个特性数据被抑制上报的情况,因此,在接收到恢复CPU可使用总量的阈值的事件时,可以保持各个特性数据当前的上报方式预设时长X,避免出现特性数据一会被抑制上报一会又被解除抑制上报的情况出现,然后恢复当前重要性最高的特性数据的上报。
在恢复当前重要性最高的特性数据的上报之后,如果还存在N个特性数据被抑制上报,只要订阅的所有的特性数据的总的CPU使用率在持续下降,则保持N个特性数据停止上报预设时长X。在预设时长X到期后,在已经停止上报的特性数据中选择重要性最高的特性数据恢复上报,变为保持N-1个特性停止上报的预设时长X,如此循环直到所有特性数据恢复上报。
还有一种可能的情况是:如果没有收到恢复CPU可使用总量的阈值的事件,而是收到某个特性数据CPU恢复相对阈值事件或CPU恢复相对阈值事件,则不响应特性数据CPU恢复相对阈值事件或CPU恢复相对阈值事件处理流程,仅记录特性数据CPU恢复相对阈值事件或CPU恢复相对阈值事件,保持现有上报方式不变,直到收到恢复CPU可使用总量的阈值的事件,才逐个响应记录的事件。
实施例十
在上述实施例一至实施例九任一实施例的基础上,本实施例还提供一种数据上报方法,图10给出了一种数据上报方法的流程示意图,如图10所示,该方法包括:
步骤101,若接收到针对任一特性数据的CPU的相对阈值事件,则延长该特性数据的默认上报周期,其中,所述CPU的相对阈值事件是在所述特性数据的CPU使用率大于或等于第一相对阈值时触发的。
步骤103,按照延长后的第一上报周期上报该特性数据。
步骤121,若接收到针对任一特性数据的内存的相对阈值事件,且该特性数据的CPU使用率未达到第一绝对阈值,则立刻进行该特性数据的上报;其中,所述内存的相对阈值事件是在该特性数据占用的内存大于或等于第二相对阈值时触发的。
步骤123,若接收到针对任一特性数据的内存的相对阈值事件,且接收到CPU的绝对阈值事件,则清空该特性数据对应的内存,并停止数据上报,直至接收到CPU恢复相对阈值事件,恢复特性数据上报。
可选的,在上述实施例的基础上,该数据上报方法还可以包括:
若接收到达到内存可使用总量的阈值的事件,对于CPU使用率未达到第一绝对阈值的特性数据立刻进行上报;
若接收到达到内存可使用总量的阈值的事件,且接收到CPU的绝对阈值事件,则清空该特性数据对应的内存,并停止数据上报,直至接收到CPU恢复相对阈值事件,恢复特性数据上报。
实施例十一
为了更好的说明本实施例提供的上述方法,本实施例以具体示例的方式对上述十个实施例可能涉及到的几种情况进行说明。
如果网络管理设备订阅了3个特性数据A、B、C,该三个特性数据可使用CPU总量的最大值为20%,周期步长定义为10s,接收到恢复CPU可使用总量的阈值的事件之后,第三预设时长为5分钟,即保持5分钟当前的上报方式。
表2
Figure BDA0003137244900000221
Figure BDA0003137244900000231
若本例子中出现如下现象:
(1)特性数据A上报使用的CPU增加到10%,所有订阅的特性数据使用CPU总量未超20%,特性数据A使用的内存未超10M。
此时特性A触发达到相对阈值事件,上报周期延长10s。
(2)特性数据B上报使用的CPU增加到6%,所有订阅的特性数据使用CPU总量未超20%。
此时特性B触发达到相对阈值事件,上报周期延长10s。
(3)特性数据A上报使用内存使用达到10M。
此时特性数据A的CPU未达到绝对阈值,立刻进行一次数据上报,释放内存,内存恢复。
(4)特性数据A上报使用的CPU增加到15%,特性数据B上报使用的CPU降低到3%,所有特性使用CPU总量未超20%,特性A内存使用暂未达到阈值。
此时由于特性数据A使用的CPU持续上升,上报周期已经比默认上报周期一共延长了20s。特性数据A触发CPU的绝对阈值事件,下一个周期停止上报,恢复上报时,一起上报两个周期的数据,之后采用比默认上报周期延长20s的上报周期进行上报。
(5)特性数据B收到CPU恢复相对阈值事件,持续当前上报周期三个周期后,恢复配置默认上报周期。
(6)特性数据A上报使用的CPU降低并持续在14%,特性数据C上报使用的CPU增加到4%。
此时特性数据A触发CPU恢复绝对阈值事件,特性A保持周期上报,上报周期不变,即保持采用比默认上报周期延长20s的上报周期进行上报。特性C触发达到CPU的相对阈值事件,上报周期延长10s。
(7)特性数据C上报使用的CPU增加到5%,所有特性使用CPU总量达到20%。
此时由于特性数据C使用CPU持续上升,上报周期已经比默认上报周期延长了10s。由于收到达到CPU可使用总量的阈值的事件,特性C的权重值最低,特性数据C停止上报,并清空特性C所占内存。
(8)特性数据C上报使用的CPU降低到0,所有订阅的特性数据使用的CPU总量下降到15%。
此时收到恢复CPU可使用总量的阈值的事件,保持现有的上报方式5分钟,5分钟后恢复特性数据C的上报,上报周期采用特性数据C配置的默认上报周期,可选的,首次上报需要上报全量数据。
(9)特性数据A上报使用的CPU降低到9%,特性数据B上报使用CPU保持在2%,特性数据C上报使用CPU保持在1%。
此时特性数据A收到CPU恢复相对阈值事件,持续当前上报周期三个周期后,恢复配置的默认上报周期。
实施例十二
在上述实施例的基础上,本实施例还提供一种数据上报装置,该装置用于执行上述实施例一至实施例十一中所提供的任一数据上报方法,图11为该数据上报装置的结构示意图,如图11所示,该装置包括:
监控模块301,所述监控模块用于监控至少一个特性数据的状态,所述装置还包括:接收模块302、延长模块303、上报模块304;
延长模块303,用于在接收模块302接收到针对任一特性数据的CPU的相对阈值事件时,延长模块303延长该特性数据的默认上报周期,其中,所述CPU的相对阈值事件是在所述特性数据的CPU使用率大于或等于第一相对阈值时触发的;
所述上报模块304用于按照延长后的第一上报周期上报该特性数据。
可选的,所述接收模块302接收到针对任一特性数据的CPU的相对阈值事件之后,若监控模块301监测到所述特性数据的CPU使用率持续上升,但接收模块302未接收到CPU的绝对阈值事件,则延长模块303进一步延长所述第一上报周期至第二上报周期;其中,所述CPU的绝对阈值事件是在特性数据的CPU使用率大于或等于第一绝对阈值时触发的,所述第一绝对阈值大于第一相对阈值;
若监控模块301检测到所述特性数据的CPU使用率持续下降,但接收模块302未接收到CPU恢复相对阈值事件,则上报模块304保持第一上报周期上报该特性数据;其中,所述CPU恢复相对阈值事件是在所述特性数据的CPU使用率由位于第一相对阈值与第一绝对阈值之间的区间降低至小于第一相对阈值时触发的;
若监控模块301检测到所述特性数据的CPU使用率持续下降,并且接收模块302接收到针对所述特性数据的CPU恢复相对阈值事件,则上报模块304按照所述第一上报周期上报该特性数据第一预设个数个周期后,恢复默认上报周期。
可选的,若接收模块302接收到针对所述特性数据的CPU的绝对阈值事件,则当下一上报周期到来时,上报模块304抑制该特性数据上报,并保存该下一上报周期被抑制上报的特性数据;当下下一个上报周期到来时,所述上报模块304将所述下一上报周期抑制上报的特性数据与所述下下一个上报周期待上报的特性数据去除重复的数据后,进行合并上报;
其中,所述下下一个上报周期是所述下一上报周期的下一个上报周期。
可选的,若所述接收模块302接收到针对所述特性数据的CPU的绝对阈值事件之后,
若监控模块301检测到该特性数据的CPU使用率持续下降,但接收模块302未收到CPU恢复绝对阈值事件,则所述上报模块304持续抑制所述特性数据的上报,直至接收到新的事件;
若监控模块301检测到该特性数据的CPU使用率持续下降,并且接收模块302接收到针对所述特性数据的CPU恢复绝对阈值事件,则上报模块304采用所述抑制该特性数据上报之前采用的第三上报周期上报所述特性数据;
其中,所述CPU恢复绝对阈值事件是所述特性数据的CPU使用率由大于或等于第一绝对阈值降低至小于第一绝对阈值时触发的。
可选的,若接收模块302接收到针对所述特性数据的CPU恢复绝对阈值事件之后,若接收模块302接收到针对所述特性数据的CPU恢复相对阈值事件,则所述上报模块304按照所述第三上报周期上报该特性数据第二预设个数个周期后,恢复默认上报周期。
可选的,在接收模块302接收到针对所述特性数据的CPU的绝对阈值事件之后,若监控模块301监控到针对所述特性数据的CPU使用率持续增加,则上报模块304在所述下下一个上报周期的下一个上报周期到来时,则保存待上报的特性数据,并抑制所述特性数据的上报。
可选的,若接收模块302接收到达到CPU可使用总量的阈值的事件,则上报模块304在当前存在上报的特性数据中选取重要性最低的特性数据停止上报;
其中,所述达到CPU可使用总量阈值的事件是订阅的所有特性数据的CPU使用率的总和达到CPU可使用总量的最大值触发的。
可选的,若接收模块302接收到达到CPU可使用总量的阈值的事件之后,监控模块301检测到订阅的所有的特性数据的总的CPU使用率持续增加,则上报模块304在当前存在上报的特性数据中选取重要性最低的特性数据据停止上报,直至所有订阅的特性数据均停止上报。
可选的,针对上报模块304在当前存在上报的特性数据中选取重要性最低的特性数据停止上报,所述上报模块具体用于:
若接收模块302接收到达到CPU可使用总量的阈值的事件之后,监控模块301检测到订阅的所有的特性数据的总的CPU使用率持续下降,但接收模块302未收到恢复CPU可使用总量的阈值的事件,则上报模块304保持各个特性数据的上报方式保持不变;
若接收模块302接收到达到CPU可使用总量的阈值的事件之后,监控模块301检测到订阅的所有的特性数据的总的CPU使用率持续下降,并且接收模块302收到恢复CPU可使用总量的阈值的事件,则上报模块304保持各个特性数据的上报方式第三预设时长之后,在已经停止上报的特性数据中选择重要性最高的特性数据恢复上报;
其中,所述恢复CPU可使用总量的阈值的事件是订阅的所有特性数据的总的CPU使用率小于CPU可使用总量的最大值时触发的。
可选的,若接收模块302接收到针对任一特性数据的内存的相对阈值事件,且监控模块301检测到该特性数据的CPU使用率未达到第一绝对阈值,则上报模块304进行该特性数据的上报;其中,所述内存的相对阈值事件是在该特性数据占用的内存大于或等于第二相对阈值时触发的;
若接收模块302接收到针对任一特性数据的内存的相对阈值事件,且接收模块302接收到CPU的绝对阈值事件,则上报模块304清空该特性数据对应的内存,并停止该特性数据上报,直至接收到CPU恢复相对阈值事件,恢复特性数据上报。
可选的,若接收模块302接收到达到内存可使用总量的阈值的事件,则上报模块304对于CPU使用率未达到第一绝对阈值的特性数据进行上报;其中,所述内存可使用总量的阈值的事件是订阅的所有特性数据占用内存的总和达到可使用内存的最大值触发的;
若接收模块302接收到达到内存可使用总量的阈值的事件,且接收模块302接收到CPU的绝对阈值事件,则上报模块304清空该特性数据对应的内存,并停止数据上报,直至接收到CPU恢复相对阈值事件,恢复特性数据上报。
本实施例提供的数据上报装置具体的执行步骤以及实现的技术效果可以参照数据上报方法实施例的描述,本实施例中不再详细赘述。
本公开还提供一种网络设备50,图5为本公开另一实施例提供的网络设备的结构示意图,如图5所示,该网络设备50包括处理器501和存储器502,
所述存储器502用于存储程序指令,所述处理器501用于调用所述存储器中的存储的程序指令,当所述处理器501执行所述存储器502存储的程序指令时,用于执行上述实施例一或实施例二的方法。另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
在本公开所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本公开的实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本公开各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个可读存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (14)

1.一种数据上报方法,其特征在于,应用于监控模块,所述监控模块用于监控至少一个特性数据的状态,所述方法包括:
若接收到针对任一特性数据的CPU的相对阈值事件,则延长该特性数据的默认上报周期,其中,所述CPU的相对阈值事件是在所述特性数据的CPU使用率大于或等于第一相对阈值时触发的;
按照延长后的第一上报周期上报该特性数据。
2.根据权利要求1所述的方法,其特征在于,若接收到针对任一特性数据的CPU的相对阈值事件之后,所述方法还包括:
若监测到所述特性数据的CPU使用率持续上升,但未接收到CPU的绝对阈值事件,则进一步延长所述第一上报周期至第二上报周期;其中,所述CPU的绝对阈值事件是在特性数据的CPU使用率大于或等于第一绝对阈值时触发的,所述第一绝对阈值大于第一相对阈值;
若检测到所述特性数据的CPU使用率持续下降,但未接收到CPU恢复相对阈值事件,则保持第一上报周期上报该特性数据;其中,所述CPU恢复相对阈值事件是在所述特性数据的CPU使用率由位于第一相对阈值与第一绝对阈值之间的区间降低至小于第一相对阈值时触发的;
若检测到所述特性数据的CPU使用率持续下降,并接收到针对所述特性数据的CPU恢复相对阈值事件,则按照所述第一上报周期上报该特性数据第一预设个数个周期后,恢复默认上报周期。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若接收到针对所述特性数据的CPU的绝对阈值事件,则当下一上报周期到来时,抑制该特性数据上报,并保存该下一上报周期被抑制上报的特性数据;
当下下一个上报周期到来时,将所述下一上报周期抑制上报的特性数据与所述下下一个上报周期待上报的特性数据去除重复的数据后,进行合并上报;
其中,所述下下一个上报周期是所述下一上报周期的下一个上报周期。
4.根据权利要求3所述的方法,其特征在于,若接收到针对所述特性数据的CPU的绝对阈值事件之后,所述方法还包括:
若检测到该特性数据的CPU使用率持续下降,但未收到CPU恢复绝对阈值事件,则持续抑制所述特性数据的上报,直至接收到新的事件;
若检测到该特性数据的CPU使用率持续下降,并接收到针对所述特性数据的CPU恢复绝对阈值事件,则采用所述抑制该特性数据上报之前采用的第三上报周期上报所述特性数据;
其中,所述CPU恢复绝对阈值事件是所述特性数据的CPU使用率由大于或等于第一绝对阈值降低至小于第一绝对阈值时触发的。
5.根据权利要求4所述的方法,其特征在于,若接收到针对所述特性数据的CPU恢复绝对阈值事件之后,所述方法还包括:
若接收到针对所述特性数据的CPU恢复相对阈值事件,则按照所述第三上报周期上报该特性数据第二预设个数个周期后,恢复默认上报周期。
6.根据权利要求3所述的方法,其特征在于,在接收到针对所述特性数据的CPU的绝对阈值事件之后,所述方法还包括:
若针对所述特性数据的CPU使用率持续增加,则在所述下下一个上报周期的下一个上报周期到来时,则保存待上报的特性数据,并抑制所述特性数据的上报。
7.根据权利要求1~6任一项所述的方法,其特征在于,所述方法还包括:
若接收到达到CPU可使用总量的阈值的事件,在当前存在上报的特性数据中选取重要性最低的特性数据停止上报;
其中,所述达到CPU可使用总量阈值的事件是订阅的所有特性数据的CPU使用率的总和达到CPU可使用总量的最大值触发的。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
若接收到达到CPU可使用总量的阈值的事件之后,检测到订阅的所有的特性数据的总的CPU使用率持续增加,则在当前存在上报的特性数据中选取重要性最低的特性数据据停止上报,直至所有订阅的特性数据均停止上报。
9.根据权利要求7所述的方法,其特征在于,在当前存在上报的特性数据中选取重要性最低的特性数据停止上报,所述方法还包括:
若接收到达到CPU可使用总量的阈值的事件之后,检测到订阅的所有的特性数据的总的CPU使用率持续下降,但未收到恢复CPU可使用总量的阈值的事件,保持各个特性数据的上报方式保持不变;
若接收到达到CPU可使用总量的阈值的事件之后,检测到订阅的所有的特性数据的总的CPU使用率持续下降,并收到恢复CPU可使用总量的阈值的事件,则保持各个特性数据的上报方式第三预设时长之后,在已经停止上报的特性数据中选择重要性最高的特性数据恢复上报;
其中,所述恢复CPU可使用总量的阈值的事件是订阅的所有特性数据的总的CPU使用率小于CPU可使用总量的最大值时触发的。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若接收到针对任一特性数据的内存的相对阈值事件,且该特性数据的CPU使用率未达到第一绝对阈值,则进行该特性数据的上报;其中,所述内存的相对阈值事件是在该特性数据占用的内存大于或等于第二相对阈值时触发的;
若接收到针对任一特性数据的内存的相对阈值事件,且接收到CPU的绝对阈值事件,则清空该特性数据对应的内存,并停止该特性数据上报,直至接收到CPU恢复相对阈值事件,恢复特性数据上报。
11.根据权利要求1~6或8-10任一项所述的方法,其特征在于,还包括:
若接收到达到内存可使用总量的阈值的事件,对于CPU使用率未达到第一绝对阈值的特性数据进行上报;其中,所述内存可使用总量的阈值的事件是订阅的所有特性数据占用内存的总和达到可使用内存的最大值触发的;
若接收到达到内存可使用总量的阈值的事件,且接收到CPU的绝对阈值事件,则清空该特性数据对应的内存,并停止数据上报,直至接收到CPU恢复相对阈值事件,恢复特性数据上报。
12.根据权利要求2所述的方法,其特征在于,所述第一上报周期、所述第二上报周期为预先设置的周期;
或者,所述第一上报周期为在所述默认上报周期的基础上延长预设的周期步长后得到的、所述第二上报周期为在所述第一上报周期的基础上延长至少一个预设的周期步长后得到的。
13.一种网络设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现权利要求1~12任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序在被计算机调用时,使所述计算机执行如权利要求1-12任一项所述的方法。
CN202110724154.5A 2021-06-29 2021-06-29 数据上报方法以及装置、网络设备、计算机可读存储介质 Active CN113505051B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110724154.5A CN113505051B (zh) 2021-06-29 2021-06-29 数据上报方法以及装置、网络设备、计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110724154.5A CN113505051B (zh) 2021-06-29 2021-06-29 数据上报方法以及装置、网络设备、计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113505051A true CN113505051A (zh) 2021-10-15
CN113505051B CN113505051B (zh) 2024-08-06

Family

ID=78011342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110724154.5A Active CN113505051B (zh) 2021-06-29 2021-06-29 数据上报方法以及装置、网络设备、计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113505051B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115065621A (zh) * 2022-06-10 2022-09-16 中国电信股份有限公司 一种数据订阅方法、装置、电子设备及可读存储介质
CN117493113A (zh) * 2023-11-08 2024-02-02 上海一谈网络科技有限公司 数据上报方法、装置、计算机设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101527654A (zh) * 2009-04-20 2009-09-09 中兴通讯股份有限公司 一种网管系统中的数据传输方法及系统
JP2011019098A (ja) * 2009-07-09 2011-01-27 Funai Electric Co Ltd 通信システム
CN107040415A (zh) * 2017-04-06 2017-08-11 青岛海信宽带多媒体技术有限公司 一种终端及数据上报方法、服务器及数据接收方法
CN111786851A (zh) * 2020-06-30 2020-10-16 新华三大数据技术有限公司 一种信息上报方法及装置
CN112231107A (zh) * 2020-10-28 2021-01-15 新华三信息安全技术有限公司 防火墙的报文限速系统、方法、设备及介质
CN112653569A (zh) * 2019-10-12 2021-04-13 华为技术有限公司 一种设备管理的方法、装置及系统
CN112799856A (zh) * 2019-11-14 2021-05-14 华为技术有限公司 一种用于获取数据的方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101527654A (zh) * 2009-04-20 2009-09-09 中兴通讯股份有限公司 一种网管系统中的数据传输方法及系统
JP2011019098A (ja) * 2009-07-09 2011-01-27 Funai Electric Co Ltd 通信システム
CN107040415A (zh) * 2017-04-06 2017-08-11 青岛海信宽带多媒体技术有限公司 一种终端及数据上报方法、服务器及数据接收方法
CN112653569A (zh) * 2019-10-12 2021-04-13 华为技术有限公司 一种设备管理的方法、装置及系统
CN112799856A (zh) * 2019-11-14 2021-05-14 华为技术有限公司 一种用于获取数据的方法及装置
CN111786851A (zh) * 2020-06-30 2020-10-16 新华三大数据技术有限公司 一种信息上报方法及装置
CN112231107A (zh) * 2020-10-28 2021-01-15 新华三信息安全技术有限公司 防火墙的报文限速系统、方法、设备及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GERBER, KM ET AL.: "A suite of standard post-tagging evaluation metrics can help assess tag retention for field-based fish telemetry research", REVIEWS IN FISH BIOLOGY AND FISHERIES, 21 August 2017 (2017-08-21) *
王春娟;: "一种改进动态反馈调度算法的分析与实现", 经营管理者, no. 16, 20 August 2009 (2009-08-20) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115065621A (zh) * 2022-06-10 2022-09-16 中国电信股份有限公司 一种数据订阅方法、装置、电子设备及可读存储介质
CN117493113A (zh) * 2023-11-08 2024-02-02 上海一谈网络科技有限公司 数据上报方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN113505051B (zh) 2024-08-06

Similar Documents

Publication Publication Date Title
CN113505051A (zh) 数据上报方法以及装置、网络设备、计算机可读存储介质
CN107040415B (zh) 一种终端及数据上报方法、服务器及数据接收方法
CN108770017B (zh) 一种无线资源动态均衡方法及系统
CN101360075B (zh) 一种分组网关及节省功耗的方法
CN110677480B (zh) 一种节点健康管理方法、装置和计算机可读存储介质
CN101662386B (zh) 告警风暴的处理方法和装置
CN111538572A (zh) 任务处理方法、装置、调度服务器及介质
CN1984119B (zh) 一种利用时分技术实现流量控制的方法
CN111385359A (zh) 对象网关的负载处理方法及装置
CN112100029B (zh) 客户端状态监测方法及相关组件
CN112579396A (zh) 软件系统动态限流方法、装置及设备
CN112988546A (zh) 一种支付系统防止服务雪崩的熔断方案及系统
CN114827033B (zh) 数据流控方法、装置、设备与计算机可读存储介质
CN114143263B (zh) 一种对用户请求进行限流的方法、设备及介质
CN111427667B (zh) Jvm负载量化及优化方法
CN103684875A (zh) 过载保护方法以及设备过载保护装置
CN112188499B (zh) 网络自适应配置方法、装置、服务器及计算机存储介质
CN103746968A (zh) 一种cdn服务器摘除方法、cdn控制中心及系统
CN103391580A (zh) 基于业务量的用户状态转换方法及系统
CN111193760A (zh) 一种信息发送方法、装置及存储介质
CN109815048A (zh) 数据读取方法、装置及设备
CN111817909A (zh) 一种基于行为集合模板监测的设备健康管理方法
CN115474165B (zh) 短信服务自监控动态调整方法和系统
CN111049807B (zh) 旁路报文限速方法和系统
CN112953605B (zh) 单双流调度方法、装置、通信基站及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant