CN117155821A - 一种云环境下基于标靶拨测的应用可用性监测方法 - Google Patents
一种云环境下基于标靶拨测的应用可用性监测方法 Download PDFInfo
- Publication number
- CN117155821A CN117155821A CN202311254650.4A CN202311254650A CN117155821A CN 117155821 A CN117155821 A CN 117155821A CN 202311254650 A CN202311254650 A CN 202311254650A CN 117155821 A CN117155821 A CN 117155821A
- Authority
- CN
- China
- Prior art keywords
- dial testing
- application
- dial
- target
- testing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 217
- 238000012544 monitoring process Methods 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000004088 simulation Methods 0.000 claims abstract description 24
- 230000005856 abnormality Effects 0.000 claims abstract description 8
- 230000004044 response Effects 0.000 claims description 21
- 230000002159 abnormal effect Effects 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000009877 rendering Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0811—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/50—Testing arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明特别涉及一种云环境下基于标靶拨测的应用可用性监测方法。该云环境下基于标靶拨测的应用可用性监测方法,在云环境下,采用多个节点周期性地对所监测应用对象进行仿真拨测的同时,通过部署与所监测应用对象环境完全一致的标靶节点,并同时对标靶节点上的应用也进行仿真拨测,最后综合应用拨测结果和标靶的拨测结果,基于内置规则对应用运行质量进行分析和根因定位。该云环境下基于标靶拨测的应用可用性监测方法,即避免了应用拨测间隔时间内无法及时发现网络问题的情况,又能明确拨测异常的原因,提高了应用监测的准确率,同时通过判断标靶节点上数据库的连通性,也能在一定程度上反应出云平台存储的问题。
Description
技术领域
本发明涉及云服务技术领域,特别涉及一种云环境下基于标靶拨测的应用可用性监测方法。
背景技术
随着云计算技术的成熟和发展,为了降低IT的硬件和运维成本、获得更高的扩展性和灵活性,越来越多的企事业单位选择把应用部署到云端,从而在云原生下应用的可观测性就显得愈发重要。租户需要掌握应用的运行质量,最基本的就是实时掌握应用是否可以访问,一般的做法是通过部署在全国的监测节点,模拟用户的访问行为,对应用进行周期性的监测,对应用的性能指标进行采集与分析,从而协助用户实现应用可用性性能质量的判断以便提升用户使用体验。但是这种监测方法有一定局限性,具体表现在:由于是周期性的拨测,如果发生了网络抖动的情况,会出现在拨测的那一刻应用的访问是正常的,而在没有拨测的间隔时间内应用实际是无法访问的情况,结果造成无法及时上报应用的网络问题,相反的,也会出现在拨测的那一刻网络恰好无法访问,但是当用户真正访问的时候网络却是正常的情况,会造成一定程度的误报。另一方面,当出现拨测异常的情况下,也很难区分是网络原因引起的拨测异常还是应用本身原因(比如应用未正常启动)造成的拨测异常,无法进一步定位问题。
基于此,本发明提出了一种云环境下基于标靶拨测的应用可用性监测方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的云环境下基于标靶拨测的应用可用性监测方法。
本发明是通过如下技术方案实现的:
一种云环境下基于标靶拨测的应用可用性监测方法,其特征在于:在云环境下,采用多个节点周期性地对所监测应用对象进行仿真拨测的同时,通过部署与所监测应用对象环境完全一致的标靶节点,并同时对标靶节点上的应用也进行仿真拨测,最后综合应用拨测结果和标靶的拨测结果,基于内置规则对应用运行质量进行分析和根因定位;
具体包括以下步骤:
步骤S1、部署阶段
在云环境下,采用中心center与本地local相结合模式部署拨测节点;同时,部署一个或多个与所监测应用对象环境完全一致的标靶节点;
步骤S2、采集阶段
通过curl命令请求应用外网地址,获取应用的响应状态码和其他的页面加载性能指标数据,包括应用的仿真拨测与标靶的仿真拨测;
步骤S3、分析阶段
对获取到的性能指标数据进行展示分析,通过图表/列表展示汇聚后各个标靶节点的拨测结果,并基于内置规则,综合分析相同环境下标靶节点的拨测结果和最近一次应用的拨测结果,对应用运行质量进行分析和根因定位。
所述步骤S1中,部署阶段包括以下步骤:
步骤S1.1、部署拨测节点
为保证对应用仿真拨测数据的准确性,拨测节点采用中心center与本地local相结合模式,即创建一个公有云节点作为中心center节点部署拨测服务端,然后在不同地域创建多个公有云节点作为本地local节点部署拨测客户端;
所述中心center节点和本地local节点均具备弹性公网IP,并设置安全组开启必要的端口,以便通过外网地址互联;所述本地local节点还能够通过外网访问被监测。
步骤S1.2、部署标靶节点
在被监测应用所在的云平台上创建标靶节点,所述标靶节点选择与被监测应用网络和存储环境一致的云服务器,部署有且安全可靠的简易应用,简易应用在访问时连接数据库。
所述步骤S2中,采集阶段包括以下步骤:
步骤S2.1、应用的仿真拨测
由部署在中心center节点的拨测服务端执行定时任务,周期性地调用各个本地local节点拨测客户端的RESTful接口下达拨测任务;各个拨测客户端在接到任务后,通过curl命令请求所监测应用的外网地址,获取应用的响应状态码和页面加载性能指标数据后,再通过RESTful接口上报性能数据给拨测服务端;
步骤S2.1、标靶的仿真拨测
当位于local节点上的拨测客户端在拨测应用时,也对相同环境下的标靶节点上的简易应用进行拨测,以获取对应的性能指标数据作为分析时的参考;且所述标靶应用的监测频率远高于所检测应用的监测频率。
所述步骤S2.1中,应用的仿真拨测实现流程如下:
步骤S2.1.1、用户首先在页面配置监测任务,配置信息包括但不限于监测应用的名称、监测应用的外网统一资源定位符URL(Uniform Resource Locator)、请求方式(get或post)、拨测客户端地址列表、监测的频率。
步骤S2.1.2、拨测服务端根据任务生成采集指令,然后以键值对(Key-Value)的形式缓存到Redis内存数据库;所述键Key为拨测客户端地址,值Value为采集任务指令;拨测服务端根据监测频率定时生成每个拨测客户端的采集任务指令;
步骤S2.1.3、在各个拨测客户端配置拨测服务端的回调地址,并定时请求拨测服务端的心跳接口;拨测服务端收到心跳请求后,查询Redis内存数据库,检查对应的拨测客户端是否有符合该心跳请求时间点的拨测任务,若有,则随着心跳响应下达拨测任务;
所述拨测客户端的心跳周期小于监测频率;
步骤S2.1.4、拨测客户端收到心跳响应后,若发现其中有拨测任务下达,则执行相关的拨测任务,通过curl命令请求所监测的应用,获取响应状态码和页面性能指标数据后,再次调用拨测服务端的回调接口回传性能数据;
步骤S2.1.5、拨测服务端收到回传的性能数据后,将性能数据存入influxdb时序数据库,然后通过定时任务汇聚多个拨测节点对同一个应用的拨测结果,并将拨测的汇聚结果存入influxdb时序数据库;
汇聚拨测结果时,只要有一个节点的拨测结果正常则认为应用能够正常访问,如果所有拨测节点都返回异常则认为应用无法访问。
所述页面加载性能指标数据包括网络性能指标和网页性能指标,所述网络性能指标包括但不限于响应时延与HTTP状态码,所述网页性能指标包括但不限于首屏时间和首次渲染时间。
所述步骤S3中,通过图表展示汇聚后应用的监测性能数据,展示图表包括但不限于网络指标和http状态码的历史趋势图;所述网络指标包括但不限于页面加载时间、网络层时间、页面下载速度、页面下载大小、DNS解析时延、TCP连接时延、SSL握手时延、服务器处理时延、内如传输时延;
同时通过列表展示无法访问的应用Top5(前五名)、访问速度慢的应用Top5、监测请求耗时Top10(前十名)与应用下载速率Bottom10(倒数前十名)数据。
所述步骤S3中,当拨测服务端每次汇聚各个标靶节点的拨测结果后,对应用运行质量进行分析和根因定位时,内置规则如下:
(1)如果应用拨测异常,同时标靶拨测也异常,则说明网络环境异常,立即产生告警;
(2)如果应用拨测异常,但是标靶拨测正常,并且这种情况连续发生达10次,则说明网络环境是正常状态,是应用本身无法访问,立即产生告警;
(3)如果应用拨测正常,但是标靶拨测异常,则说明网络环境与应用本身均为正常状态,无需处理。
一种云环境下基于标靶拨测的应用可用性监测设备,其特征在于:包括存储器和处理器;所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现如上所述的方法步骤。
一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法步骤。
本发明的有益效果是:该云环境下基于标靶拨测的应用可用性监测方法,即避免了应用拨测间隔时间内无法及时发现网络问题的情况,又能明确拨测异常的原因,提高了应用监测的准确率,同时通过判断标靶节点上数据库的连通性,也能在一定程度上反应出云平台存储的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1为本发明云环境下基于标靶拨测的应用可用性监测方法示意图。
附图2为本发明云环境下基于标靶拨测的应用可用性监测流程示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明中的技术方案,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚,完整的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
该云环境下基于标靶拨测的应用可用性监测方法,在云环境下,采用多个节点周期性地对所监测应用对象进行仿真拨测的同时,通过部署与所监测应用对象环境完全一致的标靶节点,并同时对标靶节点上的应用也进行仿真拨测,最后综合应用拨测结果和标靶的拨测结果,基于内置规则对应用运行质量进行分析和根因定位;
具体包括以下步骤:
步骤S1、部署阶段
在云环境下,采用中心center与本地local相结合模式部署拨测节点;同时,部署一个或多个与所监测应用对象环境完全一致的标靶节点;
步骤S1.1、部署拨测节点
为保证对应用仿真拨测数据的准确性,拨测节点采用中心center与本地local相结合模式,即创建一个公有云节点作为中心center节点部署拨测服务端,然后在不同地域创建多个公有云节点作为本地local节点部署拨测客户端;
所述中心center节点和本地local节点均具备弹性公网IP,并设置安全组开启必要的端口,以便通过外网地址互联;所述本地local节点还能够通过外网访问被监测。
步骤S1.2、部署标靶节点
在被监测应用所在的云平台上创建标靶节点,所述标靶节点选择与被监测应用网络和存储环境一致的云服务器,部署有且安全可靠的简易应用,简易应用在访问时连接数据库;
标靶节点可以规格足够小,尽量少占资源,要求可被互联网访问。为了采样数据更加准确合适,可以创建多个标靶节点。在标靶节点上,部署一个简易的安全可靠的网站应用,应用可以在访问时连接数据库。标靶节点上的简易应用相当于所检测应用的“卫星”,当位于local节点上的拨测客户端在拨测应用时,也会对同环境下的标靶节点上的简易应用进行拨测,以获取对应的性能指标数据作为分析时的参考。
步骤S2、采集阶段
通过curl命令请求应用外网地址,获取应用的响应状态码和其他的页面加载性能指标数据,包括应用的仿真拨测与标靶的仿真拨测;
步骤S2.1、应用的仿真拨测
由部署在中心center节点的拨测服务端执行定时任务,周期性地调用各个本地local节点拨测客户端的RESTful接口下达拨测任务;各个拨测客户端在接到任务后,通过curl命令请求所监测应用的外网地址,获取应用的响应状态码和页面加载性能指标数据后,再通过RESTful接口上报性能数据给拨测服务端;
所述步骤S2.1中,应用的仿真拨测实现流程如下:
步骤S2.1.1、用户首先在页面配置监测任务,配置信息包括但不限于监测应用的名称、监测应用的外网统一资源定位符URL(Uniform Resource Locator)、请求方式(get或post)、拨测客户端地址列表、监测的频率。
步骤S2.1.2、拨测服务端根据任务生成采集指令,然后以键值对(Key-Value)的形式缓存到Redis内存数据库;所述键Key为拨测客户端地址,值Value为采集任务指令;拨测服务端根据监测频率定时生成每个拨测客户端的采集任务指令;
步骤S2.1.3、在各个拨测客户端配置拨测服务端的回调地址,并定时请求拨测服务端的心跳接口;拨测服务端收到心跳请求后,查询Redis内存数据库,检查对应的拨测客户端是否有符合该心跳请求时间点的拨测任务,若有,则随着心跳响应下达拨测任务;
所述拨测客户端的心跳周期小于监测频率。
步骤S2.1.4、拨测客户端收到心跳响应后,若发现其中有拨测任务下达,则执行相关的拨测任务,通过curl命令请求所监测的应用,获取响应状态码和页面性能指标数据后,再次调用拨测服务端的回调接口回传性能数据;
所述页面加载性能指标数据包括网络性能指标和网页性能指标,所述网络性能指标包括但不限于响应时延与HTTP状态码,所述网页性能指标包括但不限于首屏时间和首次渲染时间。
步骤S2.1.5、拨测服务端收到回传的性能数据后,将性能数据存入influxdb时序数据库,然后通过定时任务汇聚多个拨测节点对同一个应用的拨测结果,并将拨测的汇聚结果存入influxdb时序数据库;
汇聚拨测结果时,只要有一个节点的拨测结果正常则认为应用能够正常访问,如果所有拨测节点都返回异常则认为应用无法访问。
步骤S2.1、标靶的仿真拨测
当位于local节点上的拨测客户端在拨测应用时,也对相同环境下的标靶节点上的简易应用进行拨测,以获取对应的性能指标数据作为分析时的参考;且所述标靶应用的监测频率远高于所检测应用的监测频率;
对标靶节点上简易应用的拨测过程与所监测应用的拨测过程基本一致,也包括下达拨测任务、采集拨测数据、汇聚拨测结果等过程,此处不再赘述。
需要注意的是,标靶节点上简易应用在被拨测时可以有访问数据库的操作,以尽量贴近真实应用的使用场景,同时通过对标靶节点上数据库连通性的性能采样,也能一定程度上反应出云平台存储的性能。另外,标靶应用的监测频率要远高于所检测应用的监测频率,例如所监测应用的采样频率是5分钟一次,标靶应用可以是1分钟一次,对标靶上的简易应用加快采样频率能够尽早发现网络环境的问题,而且由于是简易的应用,也无需担心加快频率对应用造成的访问压力。
步骤S3、分析阶段
对获取到的性能指标数据进行展示分析,通过图表/列表展示汇聚后各个标靶节点的拨测结果,并基于内置规则,综合分析相同环境下标靶节点的拨测结果和最近一次应用的拨测结果,对应用运行质量进行分析和根因定位。
所述步骤S3中,包括应用状态分析与应用分析告警;
步骤S3.1、应用状态分析
通过图表展示汇聚后应用的监测性能数据,展示图表包括但不限于网络指标和http状态码的历史趋势图;所述网络指标包括但不限于页面加载时间、网络层时间、页面下载速度、页面下载大小、DNS解析时延、TCP连接时延、SSL握手时延、服务器处理时延、内如传输时延;
同时通过列表展示无法访问的应用Top5(前五名)、访问速度慢的应用Top5、监测请求耗时Top10(前十名)与应用下载速率Bottom10(倒数前十名)数据;
步骤S3.2、应用分析告警
当拨测服务端每次汇聚各个标靶节点的拨测结果后,对应用运行质量进行分析和根因定位时,内置规则如下:
(1)如果应用拨测异常,同时标靶拨测也异常,则说明网络环境异常,立即产生告警;
(2)如果应用拨测异常,但是标靶拨测正常,并且这种情况连续发生达10次(假定应用拨测5分钟一次,标靶拨测1分钟一次),则说明网络环境是正常状态,是应用本身无法访问,立即产生告警;
(3)如果应用拨测正常,但是标靶拨测异常,则说明网络环境与应用本身均为正常状态,无需处理。
通过这种方式,以同环境下更快频率的标靶拨测作为参考,即减少了应用拨测间隔时间内无法及时发现网络问题的情况,又明确了拨测异常的原因,一定程度上提高了应用监测的准确率。
该云环境下基于标靶拨测的应用可用性监测设备,包括存储器和处理器;所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现如上所述的方法步骤。
该可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法步骤。
以上所述的实施例,只是本发明具体实施方式的一种,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。
Claims (9)
1.一种云环境下基于标靶拨测的应用可用性监测方法,其特征在于:在云环境下,采用多个节点周期性地对所监测应用对象进行仿真拨测的同时,通过部署与所监测应用对象环境完全一致的标靶节点,并同时对标靶节点上的应用也进行仿真拨测,最后综合应用拨测结果和标靶的拨测结果,基于内置规则对应用运行质量进行分析和根因定位;
具体包括以下步骤:
步骤S1、部署阶段
在云环境下,采用中心center与本地local相结合模式部署拨测节点;同时,部署一个或多个与所监测应用对象环境完全一致的标靶节点;
步骤S2、采集阶段
通过curl命令请求应用外网地址,获取应用的响应状态码和其他的页面加载性能指标数据,包括应用的仿真拨测与标靶的仿真拨测;
步骤S3、分析阶段
对获取到的性能指标数据进行展示分析,通过图表/列表展示汇聚后各个标靶节点的拨测结果,并基于内置规则,综合分析相同环境下标靶节点的拨测结果和最近一次应用的拨测结果,对应用运行质量进行分析和根因定位。
2.根据权利要求1所述的云环境下基于标靶拨测的应用可用性监测方法,其特征在于:所述步骤S1中,部署阶段包括以下步骤:
步骤S1.1、部署拨测节点
为保证对应用仿真拨测数据的准确性,拨测节点采用中心center与本地local相结合模式,即创建一个公有云节点作为中心center节点部署拨测服务端,然后在不同地域创建多个公有云节点作为本地local节点部署拨测客户端;
所述中心center节点和本地local节点均具备弹性公网IP,并设置安全组开启必要的端口,以便通过外网地址互联;所述本地local节点还能够通过外网访问被监测;
步骤S1.2、部署标靶节点
在被监测应用所在的云平台上创建标靶节点,所述标靶节点选择与被监测应用网络和存储环境一致的云服务器,部署有且安全可靠的简易应用,简易应用在访问时连接数据库。
3.根据权利要求2所述的云环境下基于标靶拨测的应用可用性监测方法,其特征在于:所述步骤S2中,采集阶段包括以下步骤:
步骤S2.1、应用的仿真拨测
由部署在中心center节点的拨测服务端执行定时任务,周期性地调用各个本地local节点拨测客户端的RESTful接口下达拨测任务;各个拨测客户端在接到任务后,通过curl命令请求所监测应用的外网地址,获取应用的响应状态码和页面加载性能指标数据后,再通过RESTful接口上报性能数据给拨测服务端;
步骤S2.1、标靶的仿真拨测
当位于local节点上的拨测客户端在拨测应用时,也对相同环境下的标靶节点上的简易应用进行拨测,以获取对应的性能指标数据作为分析时的参考;且所述标靶应用的监测频率远高于所检测应用的监测频率。
4.根据权利要求3所述的云环境下基于标靶拨测的应用可用性监测方法,其特征在于:所述步骤S2.1中,应用的仿真拨测实现流程如下:
步骤S2.1.1、用户首先在页面配置监测任务,配置信息包括但不限于监测应用的名称、监测应用的外网统一资源定位符URL、请求方式、拨测客户端地址列表、监测的频率。
步骤S2.1.2、拨测服务端根据任务生成采集指令,然后以键值对Key-Value的形式缓存到Redis内存数据库;所述键Key为拨测客户端地址,值Value为采集任务指令;拨测服务端根据监测频率定时生成每个拨测客户端的采集任务指令;
步骤S2.1.3、在各个拨测客户端配置拨测服务端的回调地址,并定时请求拨测服务端的心跳接口;拨测服务端收到心跳请求后,查询Redis内存数据库,检查对应的拨测客户端是否有符合该心跳请求时间点的拨测任务,若有,则随着心跳响应下达拨测任务;
所述拨测客户端的心跳周期小于监测频率;
步骤S2.1.4、拨测客户端收到心跳响应后,若发现其中有拨测任务下达,则执行相关的拨测任务,通过curl命令请求所监测的应用,获取响应状态码和页面性能指标数据后,再次调用拨测服务端的回调接口回传性能数据;
步骤S2.1.5、拨测服务端收到回传的性能数据后,将性能数据存入influxdb时序数据库,然后通过定时任务汇聚多个拨测节点对同一个应用的拨测结果,并将拨测的汇聚结果存入influxdb时序数据库;
汇聚拨测结果时,只要有一个节点的拨测结果正常则认为应用能够正常访问,如果所有拨测节点都返回异常则认为应用无法访问。
5.根据权利要求4所述的云环境下基于标靶拨测的应用可用性监测方法,其特征在于:所述页面加载性能指标数据包括网络性能指标和网页性能指标,所述网络性能指标包括但不限于响应时延与HTTP状态码,所述网页性能指标包括但不限于首屏时间和首次渲染时间。
6.根据权利要求1所述的云环境下基于标靶拨测的应用可用性监测方法,其特征在于:所述步骤S3中,通过图表展示汇聚后应用的监测性能数据,展示图表包括但不限于网络指标和http状态码的历史趋势图;所述网络指标包括但不限于页面加载时间、网络层时间、页面下载速度、页面下载大小、DNS解析时延、TCP连接时延、SSL握手时延、服务器处理时延、内如传输时延;
同时通过列表展示无法访问的应用Top5、访问速度慢的应用Top5、监测请求耗时Top10与应用下载速率Bottom10数据。
7.根据权利要求1所述的云环境下基于标靶拨测的应用可用性监测方法,其特征在于:所述步骤S3中,当拨测服务端每次汇聚各个标靶节点的拨测结果后,对应用运行质量进行分析和根因定位时,内置规则如下:
(1)如果应用拨测异常,同时标靶拨测也异常,则说明网络环境异常,立即产生告警;
(2)如果应用拨测异常,但是标靶拨测正常,并且这种情况连续发生达10次,则说明网络环境是正常状态,是应用本身无法访问,立即产生告警;
(3)如果应用拨测正常,但是标靶拨测异常,则说明网络环境与应用本身均为正常状态,无需处理。
8.一种云环境下基于标靶拨测的应用可用性监测设备,其特征在于:包括存储器和处理器;所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现如权利要求1至7任意一项所述的方法步骤。
9.一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311254650.4A CN117155821A (zh) | 2023-09-27 | 2023-09-27 | 一种云环境下基于标靶拨测的应用可用性监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311254650.4A CN117155821A (zh) | 2023-09-27 | 2023-09-27 | 一种云环境下基于标靶拨测的应用可用性监测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117155821A true CN117155821A (zh) | 2023-12-01 |
Family
ID=88886927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311254650.4A Pending CN117155821A (zh) | 2023-09-27 | 2023-09-27 | 一种云环境下基于标靶拨测的应用可用性监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117155821A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117793764A (zh) * | 2023-12-27 | 2024-03-29 | 广东宜通衡睿科技有限公司 | 5g专网软探针拨测数据完整性校验和补全方法及系统 |
-
2023
- 2023-09-27 CN CN202311254650.4A patent/CN117155821A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117793764A (zh) * | 2023-12-27 | 2024-03-29 | 广东宜通衡睿科技有限公司 | 5g专网软探针拨测数据完整性校验和补全方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111522922B (zh) | 日志信息查询方法、装置、存储介质及计算机设备 | |
US10515000B2 (en) | Systems and methods for performance testing cloud applications from multiple different geographic locations | |
Jayathilaka et al. | Performance monitoring and root cause analysis for cloud-hosted web applications | |
US9584364B2 (en) | Reporting performance capabilities of a computer resource service | |
US9251032B2 (en) | Method, computer program, and information processing apparatus for analyzing performance of computer system | |
Wang et al. | Estimating the performance of hypothetical cloud service deployments: A measurement-based approach | |
WO2008079510A2 (en) | High-throughput extract-transform-load (etl) of program events for subsequent analysis | |
US20070265811A1 (en) | Using stochastic models to diagnose and predict complex system problems | |
CN103377077A (zh) | 通过诱发延时来评估分布式计算服务的弹性的方法和系统 | |
Zhu et al. | Research the performance testing and performance improvement strategy in web application | |
US9559915B2 (en) | System and method for dynamically testing networked target systems | |
US20150012647A1 (en) | Router-based end-user performance monitoring | |
WO2017062008A1 (en) | Comparing scripts | |
US20200210310A1 (en) | Analytics-based architecture compliance testing for distributed web applications | |
CN108334429A (zh) | 用于排查前端页面问题的方法、装置及系统 | |
US20090161559A1 (en) | Error identification in a computer-based network | |
CN117155821A (zh) | 一种云环境下基于标靶拨测的应用可用性监测方法 | |
Jehangiri et al. | Practical Aspects for Effective Monitoring of SLAs in Cloud Computing and Virtual Platforms. | |
US20230053592A1 (en) | Performance profiler of third party automations | |
Javadi et al. | Bandwidth modeling in large distributed systems for big data applications | |
Çapari et al. | Efficiency performance evaluation on multi-user web application platforms in cloud computing | |
CN111858276A (zh) | 一种获取服务器压测数据的方法及系统 | |
Filipe et al. | Online client-side bottleneck identification on HTTP server infrastructures | |
Taibi et al. | Data driven network performance inference from within the browser | |
RU2642411C2 (ru) | Способ определения тренда показателя степени вовлеченности пользователя |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |