CN115114133B - 基于java的系统自适应限流方法、装置及存储介质 - Google Patents

基于java的系统自适应限流方法、装置及存储介质 Download PDF

Info

Publication number
CN115114133B
CN115114133B CN202210939923.8A CN202210939923A CN115114133B CN 115114133 B CN115114133 B CN 115114133B CN 202210939923 A CN202210939923 A CN 202210939923A CN 115114133 B CN115114133 B CN 115114133B
Authority
CN
China
Prior art keywords
health degree
health
calculating
storage
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210939923.8A
Other languages
English (en)
Other versions
CN115114133A (zh
Inventor
刘佳
陈学森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Chehaiyang Environmental Protection Technology Co ltd
Original Assignee
Guangdong Chehaiyang Environmental Protection Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Chehaiyang Environmental Protection Technology Co ltd filed Critical Guangdong Chehaiyang Environmental Protection Technology Co ltd
Priority to CN202210939923.8A priority Critical patent/CN115114133B/zh
Publication of CN115114133A publication Critical patent/CN115114133A/zh
Application granted granted Critical
Publication of CN115114133B publication Critical patent/CN115114133B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3433Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment for load management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/20Software design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/31Programming languages or programming paradigms
    • G06F8/315Object-oriented languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5022Workload threshold
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/504Resource capping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/508Monitor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/54Indexing scheme relating to G06F9/54
    • G06F2209/548Queue
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于JAVA的系统自适应限流方法、装置及存储介质,该方法包括:创建系统健康度模型;设定系统健康度的采集方式及采集点;计算得到系统健康度良好状态的基准量化值;在系统健康度采集点按相应采集方式分别进行数据采集;对分别采集到的数据根据系统健康度模型进行系统健康度评估,分别得到系统健康度级别;分别判断系统健康度级别,当某一系统健康度级别为告警时,对系统接到的对应请求进行服务降级处理。本发明基于指标数值计算得到系统合理限流阈值,使系统充分利用服务器资源,降低运维成本,在最大可控的负载下保持健壮,提供最大的服务能力。

Description

基于JAVA的系统自适应限流方法、装置及存储介质
技术领域
本发明属于系统限流领域,尤其涉及一种基于JAVA的系统自适应限流方法、装置及存储介质。
背景技术
限流是流量限速(Rate Limit)的简称,是指只允许指定的事件进入系统,超过的部分将被拒绝服务、排队或等待、降级等处理。对于server服务而言,限流为了保证一部分的请求流量可以得到正常的响应,总好过全部的请求都不能得到响应,甚至导致系统雪崩。
限流的常用处理手段有:计数器、漏桶、令牌桶。计数器:一种比较简单的限流算法,用途比较广泛。在一段时间内,进行计数,与阈值进行比较。漏桶:请求先进入到漏桶里,漏桶以一定的速度出水,当水流入速度过大会直接溢出,可以看出漏桶算法能强行限制数据的传输速率。令牌桶:在令牌桶算法中有一个程序以某种恒定的速度生成令牌,并存入令牌桶中,而每个请求需要先获取令牌才能执行。
现有的限流手段都有一个共同的缺点:都需要系统发布前手动设置一个固定的限流阈值。首先这个阈值是需要预测评估的,往往准确的阈值评估是比较难的,不准确的阈值可能会使系统宕机或无法充分的利用服务器资源;其次每次系统更新或迁移至新的服务器上又需要重新评估,是比较繁琐与复杂的。
因此,设计一种基于系统自身指标数值自动计算得到一个合理的限流阈值,并对系统服务器资源进行针对性自适应限流的方法成为研究的方向。
发明内容
为了解决现有技术存在的不足,本发明提供了一种基于JAVA的系统自适应限流方法、装置及存储介质,该方法通过基于系统自身指标数值的计算得到合理的限流阈值,使系统充分利用服务器资源,降低运维成本,在最大可控的负载下保持健壮,提供最大的服务能力。
为了实现上述目的,本发明的一个实施方式的一种基于JAVA的系统自适应限流方法,包括以下步骤:
S1、创建系统健康度模型;
S2、设定系统健康度的采集方式及采集点;
S3、计算得到系统健康度的基准量化值;
S4、在系统健康度采集点按相应采集方式分别进行数据采集;
S5、对分别采集到的数据根据系统健康度模型进行系统健康度评估,分别得到系统健康度级别;
S6、分别判断系统健康度级别,当某一系统健康度级别为告警时,对系统接到的对应请求进行服务降级处理。
进一步地,所述步骤S1中系统健康度模型包括计算健康度模型及存储健康度模型;
所述计算健康度模型为:
C= max ( Jm ,Wn) (1)
其中,C为计算健康度,Jm为JVM计算健康度,Wn为物理机计算健康度;
所述存储健康度模型为:
Figure 266339DEST_PATH_IMAGE001
其中,Dt为存储健康度,t为应用程序读取访问数据库链路的往返时间,T0为系统启动后应用程序平稳查询读取访问数据库链路的往返时间。
进一步地,所述JVM计算健康度模型为:
Figure 6675DEST_PATH_IMAGE002
其中,m为JVM堆内存已使用量占比,Jm为JVM计算健康度;
所述物理机计算健康度模型为:
Figure 501242DEST_PATH_IMAGE003
其中,n为物理机CPU或内存已使用量占比,wn为物理机计算健康度。
进一步地,所述步骤S2中系统健康度包括计算健康度及存储健康度;
计算健康度的采集点为JVM堆内存及物理机CPU或内存,采集方式为按照第一标定时限间隔及第一标定次数,分别进行JVM堆内存已使用量及物理机CPU或内存已使用量的采集并记录;
存储健康度的采集点在应用程序与数据库交互的链路上,采集方式为按照第二标定时限间隔及第二标定次数,使用AOP进行切面记录数据往返时间的采集并记录。
进一步地,所述步骤S3中计算得到系统健康度的基准量化值,具体步骤为:
S31、采集计算JVM堆内存总量,得到JVM计算健康度基准量化值;
S32、采集计算物理机CPU或内存总量,得到物理机计算健康度基准量化值;
S33、使用AOP进行切面记录数据往返时间,计算得到存储健康度基准量化值,具体为:
S331、在需要监测的方法路径上使用AOP进行切面记录数据往返时间;
S332、每间隔第二标定时限采集一次,共采集第二标定次数,得到第二标定次数个往返时间记录;
S333、对得到的往返时间记录进行平均值计算,得到往返时间平均值;
S334、将得到的往返时间平均值保存到redis中,并判断当前redis中是否有历史记录,如果没有,则令当前值为存储健康度基准量化值即系统启动后应用程序平稳查询读取访问数据库链路的往返时间T0
进一步地,所述步骤S5中对采集到的数据根据系统健康度模型进行系统健康度评估,分别得到系统健康度级别,具体步骤包括:
S51、采集评估得到计算健康度级别,具体为:
S511、将采集到的JVM堆内存已使用量的平均值与JVM堆内存总量相比,得到JVM堆内存已使用量占比m,根据JVM计算健康度模型,得到JVM计算健康度Jm;
S512、将采集到的物理机CPU或内存已使用量的平均值与物理机CPU或内存总量相比,得到物理机CPU或内存已使用量占比n,根据物理机计算健康度模型,得到物理机计算健康度wn;
S513、将JVM计算健康度Jm及物理机计算健康度wn代入计算健康度模型,求出max( Jm ,Wn),即取Jm与wn中的最大值为计算健康度C;
S514、令C=1时,计算健康度级别为良好;令C=2时,计算健康度级别为忙碌;令C=3时,计算健康度级别为告警;
S52、采集评估得到存储健康度级别,具体为:
S521、将按照采集方式采集得到的多个往返时间记录进行平均值计算,得到应用程序读取访问数据库链路的往返时间t;
S522、将得到的往返时间t与redis中存储健康度基准量化值T0代入存储健康度模型,得到存储健康度Dt;
S523、令Dt=1时,存储健康度级别为良好;令Dt=2时,存储健康度级别为忙碌;令Dt=3时,存储健康度级别为告警;
进一步地,所述步骤S6中分别判断系统健康度级别,当某一系统健康度级别为告警时,对系统接到的对应请求进行服务降级处理,具体步骤为:
S61、判断计算健康度级别,当计算健康度级别为告警时,对系统接到的访问层请求进行按几率拒绝部分请求的服务降级处理;
S62、判断存储健康度级别,当存储健康度级别为告警时,对系统接到的数据库请求进行只是将一部分数据放入rabbitMQ队列中的服务降级处理。
根据本发明实施例的另一方面,还提供了一种基于JAVA语言的系统自适应限流装置,包括:
创建单元:用于创建系统健康度模型及系统健康度的采集方式及采集点;所述系统健康度模型包括计算健康度模型及存储健康度模型;
还包括设置系统服务降级处理的基础信息,包括影响到计算健康度的请求访问层的方法路径用于服务降级后拒绝部分请求及设置影响存储健康度的一些表操作方法路径;
获取单元,用于获取存储健康度良好级别时的系统基准量化值,及按照设定的系统健康度的采集方式及采集点对系统健康度的当前值进行获取采集;
检查单元,用于根据系统健康度模型及获取的系统基准量化值及系统当前值,通过计算,检查系统健康度,获取当前系统的计算健康度及存储健康度情况;
限流单元,用于根据当前系统的健康度情况,通过回调的方式告知应用系统,应用系统根据得到的信息做相应的服务降级处理。
根据本发明实施例的另一方面,还提供了一种计算机可读的存储介质,所述存储介质包括存储的程序,其中,所述程序运行时执行所述的方法。
本发明的有益效果为:
1、本发明创建了基于JAVA语言的系统的系统健康度模型,定义了健康度,并把健康度级别分为了良好、忙碌及告警三种,在流量非高峰期时健康度在良好和忙碌两种级别中跳动,流量高峰期达到告警级别时,则针对性降级限流,让系统稳定在忙碌级别,达到满足健壮性的同时又提供最大的服务能力;
2、本发明根据JAVA语言系统的系统健康度模型,针对性设定系统健康度的采集方式及采集点,计算健康度通过定时器定时采集,存储健康度通过面向切面编程AOP切面配置采集点,并通过算法计算采集的平均值对应得到系统健康度的级别;
3、本发明是通过计算得到当前系统健康度的基准量化值,不需要提前手动设置系统的限流阈值,即不需要事先预测评估,且每次系统更新或迁移至新的服务器上也不需要重新评估,适应系统范围广、效率高;
4、本发明根据判断得到的系统健康度告警级别,自动对系统接到的对应请求进行服务降级处理,当计算健康度级别为告警时,对系统接到的访问层请求进行按几率拒绝部分请求的服务降级处理;当存储健康度级别为告警时,对系统接到的数据库请求进行只是将一部分数据放入rabbitMQ队列中的服务降级处理,有针对性地保证了系统处理请求效率,使系统保持健壮。
附图说明
图1是本发明一种基于JAVA的系统自适应限流方法的流程图;
图2是本发明一种基于JAVA的系统自适应限流方法的一个实施例应用状态的部署拓扑图;
图3是本发明的一个实施例的应用系统与限流模块的启动调用流程示意图;
图4是本发明的一个实施例计算健康度的的监测、采集及系统服务降级过程示意图;
图5是本发明的一个实施例存储健康度的的监测、采集及系统服务降级过程示意图;
图6是本发明的一个实施例计算健康度告警时系统服务降级过程示意图;
图7是本发明的一个实施例存储健康度告警时系统服务降级过程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更为清楚,下面结合附图和实施例作进一步说明。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
一、本发明专业术语介绍及英文缩写对应的完整英文:
限流:流量限速(Rate Limit);健康度:当前系统的是否健康的一种状态值;应用服务器:物理机或云服务器,应用程序的载体;应用程序:为实现某些应用服务而编写的程序代码;JVM:JAVA代码运行的容器;数据库:按照数据结构来组织、存储和管理数据的仓库;AOP:全称是 Aspect Oriented Programming 即:面向切面编程。是OOP的延续,也是Spring框架中的一个重要内容,是函数式编程的一种衍生泛型。
二、本发明提出解决方案的基本思路是基于一些指标数值计算得到一个合理的阈值,使系统充分利用服务器资源,降低运维成本,在最大可控的负载下保持健壮,提供最大的服务能力。
本发明的一个实施方式的一种基于JAVA的系统自适应限流方法,包括以下步骤:
S1、创建系统健康度模型;
系统健康度模型包括计算健康度模型及存储健康度模型,其中:
计算健康度模型为:
C= max ( Jm ,Wn) (1)
其中,C为计算健康度,Jm为JVM计算健康度,Wn为物理机计算健康度;
存储健康度模型为:
Figure 565013DEST_PATH_IMAGE001
其中,Dt为存储健康度,t为应用程序读取访问数据库链路的往返时间,T0为系统启动后应用程序平稳查询读取访问数据库链路的往返时间。
进一步地,JVM计算健康度模型为:
Figure 436017DEST_PATH_IMAGE002
其中,m为JVM堆内存已使用量占比,Jm为JVM计算健康度;
物理机计算健康度模型为:
Figure 776999DEST_PATH_IMAGE003
其中,n为物理机CPU或内存已使用量占比,wn为物理机计算健康度。
S2、设定系统健康度的采集方式及采集点;
系统健康度包括计算健康度及存储健康度;
计算健康度的采集点为JVM堆内存及物理机CPU或内存,采集方式为按照第一标定时限10秒间隔及采集第一标定次数7次,分别进行JVM堆内存已使用量及物理机CPU或内存已使用量的采集并记录;
存储健康度的采集点在应用程序与数据库交互的链路上,采集方式为按照第二标定时限10秒间隔及采集第二标定次数7次,为使用AOP进行切面记录数据往返时间的采集并记录。
S3、计算得到系统健康度的基准量化值,具体步骤为:
S31、采集计算JVM堆内存总量,得到JVM计算健康度基准量化值;
S32、采集计算物理机CPU或内存总量,得到物理机计算健康度基准量化值;
S33、使用AOP进行切面记录数据往返时间,计算得到存储健康度基准量化值,具体为:
S331、在需要监测的方法路径上使用AOP进行切面记录数据往返时间;
S332、每间隔第二标定时限10秒采集一次,共采集第二标定次数7次,得到7个往返时间记录;
S333、对得到的往返时间记录进行平均值计算,得到往返时间平均值;
S334、将得到的往返时间平均值保存到redis中,并判断当前redis中是否有历史记录,如果没有,则令当前值为存储健康度基准量化值即系统启动后应用程序平稳查询读取访问数据库链路的往返时间T0
S4、在系统健康度采集点按相应采集方式分别进行数据采集;
S5、对分别采集到的数据根据系统健康度模型进行系统健康度评估,分别得到系统健康度级别,具体步骤包括:
S51、采集评估得到计算健康度级别,具体为:
S511、将采集到的JVM堆内存已使用量计算平均值,并将平均值与JVM堆内存总量相比,得到JVM堆内存已使用量占比m,根据JVM计算健康度模型,得到JVM计算健康度Jm;
S512、将采集到的物理机CPU或内存已使用量计算平均值,并将平均值与物理机CPU或内存总量相比,得到物理机CPU或内存已使用量占比n,根据物理机计算健康度模型,得到物理机计算健康度wn;
S513、将JVM计算健康度Jm及物理机计算健康度wn代入计算健康度模型,求出max( Jm ,Wn),即取Jm与wn中的最大值为计算健康度C;
S514、令C=1时,计算健康度级别为良好;令C=2时,计算健康度级别为忙碌;令C=3时,计算健康度级别为告警;
S52、采集评估得到存储健康度级别,具体为:
S521、将按照采集方式采集得到的多个往返时间记录进行平均值计算,得到应用程序读取访问数据库链路的往返时间t;
S522、将得到的往返时间t与redis中存储健康度基准量化值T0代入存储健康度模型,得到存储健康度Dt;
S523、令Dt=1时,存储健康度级别为良好;令Dt=2时,存储健康度级别为忙碌;令Dt=3时,存储健康度级别为告警;
S6、分别判断系统健康度级别,当某一系统健康度级别为告警时,对系统接到的对应请求进行服务降级处理;
进一步地,步骤S6中分别判断系统健康度级别,当某一系统健康度级别为告警时,对系统接到的对应请求进行服务降级处理,具体步骤为:
S61、判断计算健康度级别:当计算健康度级别为告警时,对系统接到的访问层请求进行按几率拒绝部分请求的服务降级处理;
按几率拒绝部分请求的服务降级处理举例来说,当前请求数为100,假定:按1/10的比例不允许通过,可通过数为90,则大于90的请求数量就拒绝,下一次当前请求数为90,如果还是告警状态,同样的假定则允许通过数为81,则大于81的请求数量就拒绝。
S62、判断存储健康度级别:当存储健康度级别为告警时,对系统接到的数据库请求进行只是将一部分数据放入rabbitMQ队列中的服务降级处理。
数据库请求的服务降级处理举例来说,当前请求数:100,假定:10/1不允许通过可通过数为90,则大于90的交互数据就放到rabbitMQ中,下一次当前请求数为:90,如果还是告警状态,同样的假定则允许通过数为81,则大于81的数据交互数量就放入rabbitMQ中。
作为本发明的另一个实施例,限流可以做为一个单独的模块被应用程序所引用,应用程序采用JAVA开发运行在JVM环境中,JVM又运行在真实的服务器(物理机)之上,应用程序会和数据进行交互完成数据交换。那么健康度监测点其一在JVM和物理机的运行指标;其二在应用程序与数据库交互的链路上。具体的部署拓扑如图2所示:
首先定义健康度类别、指标矩阵模型,见下两表:
Figure 708046DEST_PATH_IMAGE004
Figure 134479DEST_PATH_IMAGE005
如模型所示,定义了两类健康度:计算健康度和存储健康度,并分别为其定义了级别和量化值。在配置文件中按此模型给定义出来,这样限流模块即可获得定义的基础信息,进行后续的计算与监测。
如附图3所示,由于限流模块是单独存在的一个模块程序,应用程序是需要引用装载的,那模块与限流模块交互采用接口的方式,主要定义的接口如下表所示:
Figure 668229DEST_PATH_IMAGE006
Figure 598139DEST_PATH_IMAGE007
接着在应用系统根据需求实现了限流模块获得健康度信息的接口后进行启动,启动完成后调用限流模块的init方法,限流模块就开始装载配置,进行监测采集。
如附图4所示,计算健康度的的监测方法主要采用定时器,默认为10秒(可配置)采集一次,主要采集JVM和物理机的CPU情况并把信息保存到存储系统redis中,采集7次为一个生命周期,当第7次完成采集后分项求平均值得到量化值,用量化值再对应回计算健康度的级别中确定当前级别并把级别也保存到redis中,如果确定为告警级别则回调通知应用服务器。
如附图5所示,存储健康度的监测方法主要使用了spring的面向切面编程AOP,(Spring是一个开放源代码的设计层面框架)当应用程序在配置文件中配置好需要监测的方法路径后,限流模块读取配置使用AOP进行切面记录数据往返时间,间隔10秒(可配置)记录一次,共记录7个点后分项求平均值,如果配置了多个采集点则分别计算出平均值后再累加除以采集点数量,判断当前redis中是否有历史记录,如果没有则认为当前值为良好级别的量化值作为基础值,作为后续忙碌或告警健康度判定依据,如果后续判定为告警级别了则回调通知应用程序做一些后续处理。
如图6、图7所示,然后限流模块会根据配置的应用访问层路径对请求进行统计监控当前系统的访问流量,另外限流模块在请求访问层和数据库插入时做了两种不同降级处理方案,其中请求访问层按几率拒绝部分请求,假如两个请求则拒绝一个2/1,或者十个请求拒绝一个10/1根据系统健康度级别动态调整即可;数据库插入时算法去请求访问层一致只是将一部分数据放入rabbitMQ队列中。
最后当系统健康度为忙碌时则保持当前的拒绝或暂存方案,当健康度为正常时则恢复应用程序的服务能力。
在上述实施例中:
1、配置文件:可配置项打包配置在配置文件中;
2、定义健康度及分类:服务器server的服务程序是否可支撑当前流量的访问,影响健康度因素主要包含两大块:其一为应用程序服务器本身的负载情况如内存、CPU、JVM等指标,其指标如果占用率太高或满负荷持续较长的时间会引起服务程序的宕机,定义为“计算健康度”;其二为访问数据库时的响应时间,假设响应时间呈上涨趋势那么意味着数据库的处理能力无法满足当前流量的存储与访问服务,继续访问数据库只会使情况更加恶劣甚至引起雪崩效应,定义为“存储健康度”;
3、健康度级别:把健康度分为良好、忙碌、告警三种。流量非高峰期时健康度在良好和忙碌两种级别中跳动,流量高峰期会达到告警级别这时就需要降级限流让其稳定在忙碌级别达到满足健壮性的同时提供最大的服务能力;
4、健康度定量与指标:每个级别都需要具体的指标量化,当达到什么样的数值区间则为什么样的级别;
5、指标数值采集:计算健康度通过定时器定时采集,存储健康度通过面向切面编程AOP切面配置采集点,7次采集为一个采集周期计算其平均值;
6、通过算法计算采集的平均值对应到健康度的级别;
7、发生告警级别时进入降级处理流程。
本发明是基于JAVA语言的编写并作为示例,本发明方法在其它语言也适用,只需摘除JVM的指标采集,换成物理机的内存采集即可。
根据本发明实施例的另一方面,还提供了一种基于JAVA语言的系统自适应限流装置,包括:
创建单元:用于创建系统健康度模型及系统健康度的采集方式及采集点;系统健康度模型包括计算健康度模型及存储健康度模型;
还包括设置系统服务降级处理的基础信息,包括影响到计算健康度的请求访问层的方法路径、用于服务降级后拒绝部分请求及设置影响存储健康度的一些表操作方法、路径,暂存于rabbitMQ;
获取单元,用于获取存储健康度良好级别时的系统基准量化值,及按照设定的系统健康度的采集方式及采集点对系统健康度的当前值进行获取采集;
检查单元,用于根据系统健康度模型及获取的系统基准量化值及系统当前值,通过计算,检查系统健康度,获取当前系统的计算健康度及存储健康度情况;
限流单元,用于根据当前系统的健康度情况,通过回调的方式告知应用系统,应用系统根据得到的信息做相应的服务降级处理。
根据本发明实施例的另一方面,还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1、创建系统健康度模型;
S2、设定系统健康度的采集方式及采集点;
S3、计算得到系统健康度的基准量化值;
S4、在系统健康度采集点按相应采集方式分别进行数据采集;
S5、对分别采集到的数据根据系统健康度模型进行系统健康度评估,分别得到系统健康度级别;
S6、分别判断系统健康度级别,当某一系统健康度级别为告警时,对系统接到的对应请求进行服务降级处理。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。
作为本发明的一个实施例,本发明的基于JAVA的系统自适应限流方法应用于智能洗车服务系统,该智能洗车服务系统的服务分布于全国238个城市,设有10000+智能洗车站点,会员超过2000万。作为智能洗车服务系统的数据处理中心,需要实时处理10000+智能洗车站点的2000万会员的洗车消费处理请求,并实时出具各数据统计图表及报告,系统请求受理量庞大,在未使用本发明方法前,经常出现请求流量不能得到正常响应,不定时系统宕机的情况,应用本发明限流方法后,智能洗车服务系统根据创建的系统健康度模型及计算得到的系统健康度级别,只允许指定的事件进入系统,超过的部分将被降级处理,从而限流保证了系统允许的最大部分的请求流量可以得到正常的响应,使系统充分利用服务器资源,降低运维成本,在最大可控的负载下保持健壮,提供最大的服务能力,避免了系统雪崩的可能性。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或单元的间接耦合或通信连接,可以是电性或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
以上对本发明及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。

Claims (5)

1.一种基于JAVA的系统自适应限流方法,其特征在于,其包括以下步骤:
S1、创建系统健康度模型;
系统健康度模型包括计算健康度模型及存储健康度模型;
所述计算健康度模型为:
C=max(Jm,Wn)(1)
其中,C为计算健康度,Jm为JVM计算健康度,具体为:
Figure FDA0004041929380000011
其中,m为JVM堆内存已使用量占比,Jm为JVM计算健康度;
Wn为物理机计算健康度,具体为:
Figure FDA0004041929380000012
其中,n为物理机CPU或内存已使用量占比,Wn为物理机计算健康度;
所述存储健康度模型为:
Figure FDA0004041929380000013
其中,Dt为存储健康度,t为应用程序读取访问数据库链路的往返时间,T0为系统启动后应用程序平稳查询读取访问数据库链路的往返时间;
S2、设定系统健康度的采集方式及采集点;
所述系统健康度包括计算健康度及存储健康度;计算健康度的采集点为JVM堆内存及物理机CPU或内存,采集方式为按照第一标定时限间隔及第一标定次数,分别进行JVM堆内存已使用量及物理机CPU或内存已使用量的采集并记录;存储健康度的采集点在应用程序与数据库交互的链路上,采集方式为按照第二标定时限间隔及第二标定次数,使用AOP进行切面记录数据往返
时间的采集并记录;
S3、计算得到系统健康度的基准量化值,具体步骤为:
S31、采集计算JVM堆内存总量,得到JVM计算健康度基准量化值;
S32、采集计算物理机CPU或内存总量,得到物理机计算健康度基准量化值;
S33、使用AOP进行切面记录数据往返时间,计算得到存储健康度基准量化值,具体为:
S331、在需要监测的方法路径上使用AOP进行切面记录数据往返时间;
S332、每间隔第二标定时限采集一次,共采集第二标定次数,得到第二标定次数个往返时间记录;
S333、对得到的往返时间记录进行平均值计算,得到往返时间平均值;
S334、将得到的往返时间平均值保存到redis中,并判断当前redis中是否有历史记录,如果没有,则令当前值为存储健康度基准量化值即系统启动后应用程序平稳查询读取访问数据库链路的往返时间T0
S4、在系统健康度采集点按相应采集方式分别进行数据采集;
S5、对分别采集到的数据根据系统健康度模型进行系统健康度评估,分别得到系统健康度级别,具体步骤包括:
S51、采集评估得到计算健康度级别,具体为:
S511、将采集到的JVM堆内存已使用量计算平均值,并将平均值与JVM堆内存总量相比,得到JVM堆内存已使用量占比m,根据JVM计算健康度模型,得到JVM计算健康度Jm
S512、将采集到的物理机CPU或内存已使用量计算平均值,并将平均值与物理机CPU或内存总量相比,得到物理机CPU或内存已使用量占比n,根据物理机计算健康度模型,得到物理机计算健康度Wn
S513、将JVM计算健康度Jm及物理机计算健康度Wn代入计算健康度模型,求出max(Jm,Wn),即取Jm与Wn中的最大值为计算健康度C;
S514、令C=1时,计算健康度级别为良好;令C=2时,计算健康度级别为忙碌;令C=3时,计算健康度级别为告警;
S52、采集评估得到存储健康度级别,具体为:
S521、将按照采集方式采集得到的多个往返时间记录进行平均值计算,得到应用程序读取访问数据库链路的往返时间t;
S522、将得到的往返时间t与redis中存储健康度基准量化值T0代入存储健康度模型,得到存储健康度Dt;
S523、令Dt=1时,存储健康度级别为良好;令Dt=2时,存储健康度级别为忙碌;令Dt=3时,存储健康度级别为告警;
S6、分别判断系统健康度级别,当某一系统健康度级别为告警时,对系统接到的对应请求进行服务降级处理。
2.根据权利要求1所述的基于JAVA的系统自适应限流方法,其特征在于,所述步骤S6中分别判断系统健康度级别,当某一系统健康度级别为告警时,对系统接到的对应请求进行服务降级处理,具体步骤为:
S61、判断计算健康度级别:当计算健康度级别为告警时,对系统接到的访问层请求进行按几率拒绝部分请求的服务降级处理;
S62、判断存储健康度级别:当存储健康度级别为告警时,对系统接到的数据库请求进行只是将一部分数据放入rabbitMQ队列中的服务降级处理。
3.根据权利要求1所述的基于JAVA的系统自适应限流方法,其特征在于,所述第一标定时限间隔为10秒,所述第一标定次数为7次;所述第二标定时限间隔为10秒,所述第二标定次数为7次。
4.一种基于JAVA的系统自适应限流装置,其特征在于,包括:
创建单元:用于创建系统健康度模型及系统健康度的采集方式及采集点;所述系统健康度模型包括计算健康度模型及存储健康度模型;
还包括设置系统服务降级处理的基础信息,包括影响到计算健康度的请求访问层的方法路径用于服务降级后拒绝部分请求及设置影响存储健康度的一些表操作方法路径;
获取单元,用于获取存储健康度良好级别时的系统基准量化值,及按照设定的系统健康度的采集方式及采集点对系统健康度的当前值进行获取采集;
检查单元,用于根据系统健康度模型及获取的系统基准量化值及系统当前值,通过计算,检查系统健康度,获取当前系统的计算健康度及存储健康度情况;
限流单元,用于根据当前系统的健康度情况,通过回调的方式告知应用系统,应用系统根据得到的信息做相应的服务降级处理。
5.一种计算机可读的存储介质,所述存储介质包括存储的程序,其特征在于,所述程序运行时执行所述权利要求1至3任一项中所述的方法。
CN202210939923.8A 2022-08-05 2022-08-05 基于java的系统自适应限流方法、装置及存储介质 Active CN115114133B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210939923.8A CN115114133B (zh) 2022-08-05 2022-08-05 基于java的系统自适应限流方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210939923.8A CN115114133B (zh) 2022-08-05 2022-08-05 基于java的系统自适应限流方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN115114133A CN115114133A (zh) 2022-09-27
CN115114133B true CN115114133B (zh) 2023-03-14

Family

ID=83333660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210939923.8A Active CN115114133B (zh) 2022-08-05 2022-08-05 基于java的系统自适应限流方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN115114133B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104753805A (zh) * 2013-12-31 2015-07-01 腾讯科技(深圳)有限公司 分布式流量控制方法、服务器和系统
CN110086888A (zh) * 2019-05-15 2019-08-02 上海淇毓信息科技有限公司 基于RabbitMQ的多集群动态负载方法、装置、电子设备
CN110297698A (zh) * 2018-03-22 2019-10-01 财付通支付科技有限公司 一种多优先级动态限流方法、装置、服务器及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104753805A (zh) * 2013-12-31 2015-07-01 腾讯科技(深圳)有限公司 分布式流量控制方法、服务器和系统
CN110297698A (zh) * 2018-03-22 2019-10-01 财付通支付科技有限公司 一种多优先级动态限流方法、装置、服务器及存储介质
CN110086888A (zh) * 2019-05-15 2019-08-02 上海淇毓信息科技有限公司 基于RabbitMQ的多集群动态负载方法、装置、电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IT健康度模型的设计与实践;梁奂等;《移动通信》;20141230(第24期);第62-65页 *

Also Published As

Publication number Publication date
CN115114133A (zh) 2022-09-27

Similar Documents

Publication Publication Date Title
CN105281981B (zh) 网络服务的数据流量监控方法和装置
CN102081622B (zh) 评估系统健康度的方法及系统健康度评估装置
CN112749056A (zh) 应用服务指标监控方法、装置、计算机设备和存储介质
CN106487601B (zh) 资源监控方法、装置及系统
WO2023138058A1 (zh) 一种告警事件的处理方法、装置及计算机可读存储介质
JP3285547B2 (ja) 通信システムにおけるメッセージの過負荷処理方法
CN111241059A (zh) 一种基于数据库的数据库优化方法及装置
CN112272201A (zh) 一种设备纳管方法、系统及纳管集群
CN115114133B (zh) 基于java的系统自适应限流方法、装置及存储介质
CN110196868A (zh) 基于分布式的工单流程监控方法
CN116886517B (zh) 一种基于流量数据的告警系统及方法
CN111913937B (zh) 数据库运维方法和装置
CN111522870B (zh) 数据库访问方法、中间件和可读存储介质
CN111327492B (zh) 一种全链路监控处理方法
CN103530173B (zh) 动态权重事件处理系统和方法
CN110932935A (zh) 资源控制方法、装置、设备及计算机存储介质
CN114490091B (zh) 工业数据采集管理系统中监控规则引擎性能的方法及装置
CN115617553A (zh) 一种数据库的熔断降级保护方法、装置及电子设备
US7490080B2 (en) Method for delivering information with caching based on interest and significance
CN110932926B (zh) 一种容器集群的监控方法、系统及装置
CN115374088A (zh) 数据库健康度分析方法、装置、设备及可读存储介质
CN114185681A (zh) 一种自动化限流处理方法及装置
CN114328078A (zh) 一种阈值动态计算方法、装置及计算机可读存储介质
CN116450485B (zh) 一种应用性能干扰的检测方法和系统
CN116069595B (zh) 一种基于日志的运维监控方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant