CN110768859A - 一种基于时序数据的应用健康自动检测方法 - Google Patents
一种基于时序数据的应用健康自动检测方法 Download PDFInfo
- Publication number
- CN110768859A CN110768859A CN201910879665.7A CN201910879665A CN110768859A CN 110768859 A CN110768859 A CN 110768859A CN 201910879665 A CN201910879665 A CN 201910879665A CN 110768859 A CN110768859 A CN 110768859A
- Authority
- CN
- China
- Prior art keywords
- health
- detection
- application
- time sequence
- alarm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 75
- 238000012423 maintenance Methods 0.000 claims abstract description 25
- 230000002159 abnormal effect Effects 0.000 claims abstract description 10
- 230000000007 visual effect Effects 0.000 claims abstract description 8
- 238000012800 visualization Methods 0.000 claims abstract description 5
- 238000000034 method Methods 0.000 claims description 5
- 230000003862 health status Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
- H04L43/045—Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Environmental & Geological Engineering (AREA)
- Alarm Systems (AREA)
Abstract
本发明公开了一种基于时序数据的应用健康自动检测方法,通过分布式任务调度平台指定业务域构建一个自动检测的任务;检测程序模拟用户访问操作,通过全天不间断自动检测,将检测信息记录到时序数据中,得到健康检测指标数据作为时序数据存储;运维人员通过可视化工具配置仪表盘展示应用健康指标相关图表;同时基于健康指标与自动检测结果的时序数据,配置相应的告警规则,以实现应用健康状态异常实时告警,并通过可视化展示工具直观的向运维人员展示应用健康状况。
Description
技术领域
本发明涉及一种运维配置管理平台的健康检测方法,具体说是一种基于时序数据的应用健康自动检测方法。
背景技术
运维系统和服务异常庞大的情况下,如果经由运维人员不定时访问验证,花费时间及人力成本较高,还可能会出现漏检测等人为工作失误,并且访问时长等一些精确度较高的量化指标人为记录不够准确,无法保障检测工作的准确性。
发明内容
本发明的目的是提供一种基于时序数据的应用健康自动检测方法。利用运维配置管理平台收集应用服务地址,通过定时任务去自动检测应用健康状态,并及时将健康指标数据记录通过告警规则配置通知运维人员。
本发明的目的通过以下技术方案实现:
一种基于时序数据的应用健康自动检测方法,其特征在于:通过分布式任务调度平台指定业务域构建一个自动检测的任务;检测程序模拟用户访问操作,通过全天不间断自动检测,将检测信息记录到时序数据中,得到健康检测指标数据作为时序数据存储;运维人员通过可视化工具配置仪表盘展示应用健康指标相关图表;同时基于健康指标与自动检测结果的时序数据,配置相应的告警规则,以实现应用健康状态异常实时告警,并通过可视化展示工具直观的向运维人员展示应用健康状况。
具体包括如下步骤:
S1、运维配置管理系统配置应用检测信息:在运维配置管理系统中,配置应用健康检测相关的负载均衡入口健康检测信息与各应用实例节点入口健康检测信息;
S2、健康检测定时任务:创建定时检测任务,定时通过预先配置的应用检测信息自动检测健康状态;
S3、模拟访问健康检测:通过模拟访问应用负载均衡和应用实例节点地址,模拟应用登录、检测页面是否包含指定关键字,记录页面访问时长、登录时长、关键字检测结果并保存至时序数据库;
S4、健康检测结果展示:使用支持时序数据源的可视化展现工具,配置Dashboard展示历史和实时健康指标数据;
S5、检测告警规则配置:使用基于时序数据的告警服务,根据健康指标配置告警规则,实现应用健康状态异常告警;
S6、健康异常告警通知:根据告警规则产生告警后,回调统一通知服务,服务调用短信和邮件网关,发送告警内容给应用运维人员。
本发明利用运维配置管理平台收集应用服务地址,通过定时任务去自动检测应用健康状态,将检测信息记录到时序数据中,并及时将健康指标数据记录通过告警规则配置通知运维人员,花费时间及人力成本较低,精确度高,记录准确,保障检测工作的准确性。
附图说明
图1基于时序数据的应用健康自动检测流程图。
具体实施方式
以下结合附图和具体实例对本发明进行详细说明。
一种基于时序数据的应用健康自动检测方法,通过分布式任务调度平台指定业务域构建一个自动检测的任务;检测程序模拟用户访问操作,通过全天不间断自动检测,将检测信息记录到时序数据中,得到健康检测指标数据作为时序数据存储;运维人员通过可视化工具配置仪表盘展示应用健康指标相关图表;同时基于健康指标与自动检测结果的时序数据,配置相应的告警规则,以实现应用健康状态异常实时告警,并通过可视化展示工具直观的向运维人员展示应用健康状况。具体如下:
步骤一:运维配置管理系统配置应用检测信息
运维配置管理系统中配置应用域名检测地址及实例节点健康检测地址,健康检测时指定系统配置系统访问超时时间、登录方式、登录超时时间、检测关键字等健康检测指标。
步骤二:健康检测定时任务
利用分布式任务调度平台,创建健康检测定时任务,不同系统检测任务分配到不同任务平台节点,每个节点内部使用多线程并发执行检测,最大程度的保证了检测任务的时效性。
步骤三:模拟用户访问应用
使用页面模拟访问技术,模拟用户访问应用目标页面,重定向认证登录,检测页面是否存在指定关键字,记录访问、登录时间,将能否访问,访问耗时、能否登录、登录耗时、关键字检测结果等健康指标数据存储至时序数据库。
步骤四:应用健康指标可视化展示
使用支持时序数据源的可视化展现工具创建仪表盘,在仪表盘中配置应用访问历史折线图、应用登录历史折线图、应用访问时长历史折线图、应用登录时长历史折线图、页面关键字检测历史折线图及最后一次健康指标值,上述图表均支持实时数据动态更新展示。
步骤五:告警规则配置及告警服务应用
使用基于时序数据的告警服务,针对应用健康检测指标配置告警规则,在一定时间范围内满足N次访问不通或者超时即触发告警,实现应用健康异常告警,异常告警以RESTful接口方式通知监控系统。
步骤六:健康异常告警通知
监控系统接收到告警消息,调用短信网关和邮件服务通知相关运维人员,进一步排查应用问题。
本发明能够解决定期人工验证应用健康状态,通过全天不间断自动检测,将检测信息记录到时序数据中,并通过可视化展示工具直观的向运维人员展示应用健康状况。
Claims (2)
1.一种基于时序数据的应用健康自动检测方法,其特征在于:通过分布式任务调度平台指定业务域构建一个自动检测的任务;检测程序模拟用户访问操作,通过全天不间断自动检测,将检测信息记录到时序数据中,得到健康检测指标数据作为时序数据存储;运维人员通过可视化工具配置仪表盘展示应用健康指标相关图表;同时基于健康指标与自动检测结果的时序数据,配置相应的告警规则,以实现应用健康状态异常实时告警,并通过可视化展示工具直观的向运维人员展示应用健康状况。
2.根据权利要求1所述的基于时序数据的应用健康自动检测方法,其特征在于:具体包括如下步骤:
S1、运维配置管理系统配置应用检测信息:在运维配置管理系统中,配置应用健康检测相关的负载均衡入口健康检测信息与各应用实例节点入口健康检测信息;
S2、健康检测定时任务:创建定时检测任务,定时通过预先配置的应用检测信息自动检测健康状态;
S3、模拟访问健康检测:通过模拟访问应用负载均衡和应用实例节点地址,模拟应用登录、检测页面是否包含指定关键字,记录页面访问时长、登录时长、关键字检测结果并保存至时序数据库;
S4、健康检测结果展示:使用支持时序数据源的可视化展现工具,配置Dashboard展示历史和实时健康指标数据;
S5、检测告警规则配置:使用基于时序数据的告警服务,根据健康指标配置告警规则,实现应用健康状态异常告警;
S6、健康异常告警通知:根据告警规则产生告警后,回调统一通知服务,服务调用短信和邮件网关,发送告警内容给应用运维人员。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910879665.7A CN110768859A (zh) | 2019-09-18 | 2019-09-18 | 一种基于时序数据的应用健康自动检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910879665.7A CN110768859A (zh) | 2019-09-18 | 2019-09-18 | 一种基于时序数据的应用健康自动检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110768859A true CN110768859A (zh) | 2020-02-07 |
Family
ID=69330359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910879665.7A Pending CN110768859A (zh) | 2019-09-18 | 2019-09-18 | 一种基于时序数据的应用健康自动检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110768859A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112749071A (zh) * | 2020-12-30 | 2021-05-04 | 中国人寿保险股份有限公司上海数据中心 | 一种用于检测应用集群健康度的系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9210178B1 (en) * | 2012-06-15 | 2015-12-08 | Amazon Technologies, Inc. | Mixed-mode authorization metadata manager for cloud computing environments |
CN106534378A (zh) * | 2016-12-29 | 2017-03-22 | 宁波金网信息产业股份有限公司 | 一种Web应用的健康指数监控系统 |
CN106681930A (zh) * | 2017-01-23 | 2017-05-17 | 北京思特奇信息技术股份有限公司 | 分布式自动检测应用运行异常方法及系统 |
CN107094182A (zh) * | 2017-06-01 | 2017-08-25 | 云南电网有限责任公司信息中心 | 一种采用sso单点认证系统检测服务节点健康度的负载均衡方法 |
CN109240126A (zh) * | 2018-11-21 | 2019-01-18 | 国网湖北省电力有限公司电力科学研究院 | 一种具有模拟操作功能的分布式应用服务监测系统及方法 |
-
2019
- 2019-09-18 CN CN201910879665.7A patent/CN110768859A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9210178B1 (en) * | 2012-06-15 | 2015-12-08 | Amazon Technologies, Inc. | Mixed-mode authorization metadata manager for cloud computing environments |
CN106534378A (zh) * | 2016-12-29 | 2017-03-22 | 宁波金网信息产业股份有限公司 | 一种Web应用的健康指数监控系统 |
CN106681930A (zh) * | 2017-01-23 | 2017-05-17 | 北京思特奇信息技术股份有限公司 | 分布式自动检测应用运行异常方法及系统 |
CN107094182A (zh) * | 2017-06-01 | 2017-08-25 | 云南电网有限责任公司信息中心 | 一种采用sso单点认证系统检测服务节点健康度的负载均衡方法 |
CN109240126A (zh) * | 2018-11-21 | 2019-01-18 | 国网湖北省电力有限公司电力科学研究院 | 一种具有模拟操作功能的分布式应用服务监测系统及方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112749071A (zh) * | 2020-12-30 | 2021-05-04 | 中国人寿保险股份有限公司上海数据中心 | 一种用于检测应用集群健康度的系统及方法 |
CN112749071B (zh) * | 2020-12-30 | 2023-11-14 | 中国人寿保险股份有限公司上海数据中心 | 一种用于检测应用集群健康度的系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
de Mast et al. | Process improvement in healthcare: Overall resource efficiency | |
JP5283905B2 (ja) | 自動遠隔監視及び診断サービス方法とシステム | |
Deif | Dynamic analysis of a lean cell under uncertainty | |
Jørgensen et al. | CI implementation: an empirical test of the CI maturity model | |
CN107026894A (zh) | 通过工业资产递送自动通知 | |
US20110298608A1 (en) | Site and alarm prioritization system | |
KR20060051738A (ko) | 서비스발송 데이터 관리 시스템 및 방법 | |
JP2021036247A (ja) | 診断分析装置関連情報の集約方法および集約システム | |
CN110457371A (zh) | 数据管理方法、装置、存储介质及系统 | |
CN110460476A (zh) | 一种网络运维管理方法 | |
CN102609789A (zh) | 图书馆信息监控与异常预测系统 | |
WO2018005230A1 (en) | Systems and methods of adaptive management of caregivers | |
CN111897806A (zh) | 大数据离线数据质量检查方法及装置 | |
CN115860729A (zh) | 一种it运维综合管理系统 | |
Wu et al. | A review of alarm system design for advanced control rooms of nuclear power plants | |
CN115186977A (zh) | 一种汽车零部件研发项目任务异常监控方法及系统 | |
US20070282781A1 (en) | Method To Retrieve Data For An Equipment, Plant Or A Process | |
CN110768859A (zh) | 一种基于时序数据的应用健康自动检测方法 | |
US10981586B2 (en) | Railway diagnostic systems and methods | |
US20060010049A1 (en) | Regulatory auditing methods and systems | |
Cook et al. | Coordinating fault detection, alarm management, and energy efficiency in a large corporate campus | |
AU2010310482B2 (en) | Method and system for event pattern detection | |
JP5292182B2 (ja) | 水処理設備管理システム | |
US20060058902A1 (en) | System and method for scheduling mold manufacturing | |
CN108133359A (zh) | 一种考勤管理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200207 |
|
RJ01 | Rejection of invention patent application after publication |