CN110768859A - 一种基于时序数据的应用健康自动检测方法 - Google Patents

一种基于时序数据的应用健康自动检测方法 Download PDF

Info

Publication number
CN110768859A
CN110768859A CN201910879665.7A CN201910879665A CN110768859A CN 110768859 A CN110768859 A CN 110768859A CN 201910879665 A CN201910879665 A CN 201910879665A CN 110768859 A CN110768859 A CN 110768859A
Authority
CN
China
Prior art keywords
health
detection
application
time sequence
alarm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910879665.7A
Other languages
English (en)
Inventor
程伟华
夏飞
贺敬伟
宋浒
王纪军
刘小磊
戚林成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information And Communication Branch Of Jiangsu Electric Power Co Ltd
State Grid Jiangsu Electric Power Co Ltd
Jiangsu Electric Power Information Technology Co Ltd
Information and Telecommunication Branch of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
Information And Communication Branch Of Jiangsu Electric Power Co Ltd
State Grid Jiangsu Electric Power Co Ltd
Jiangsu Electric Power Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information And Communication Branch Of Jiangsu Electric Power Co Ltd, State Grid Jiangsu Electric Power Co Ltd, Jiangsu Electric Power Information Technology Co Ltd filed Critical Information And Communication Branch Of Jiangsu Electric Power Co Ltd
Priority to CN201910879665.7A priority Critical patent/CN110768859A/zh
Publication of CN110768859A publication Critical patent/CN110768859A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • H04L43/045Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Environmental & Geological Engineering (AREA)
  • Alarm Systems (AREA)

Abstract

本发明公开了一种基于时序数据的应用健康自动检测方法,通过分布式任务调度平台指定业务域构建一个自动检测的任务;检测程序模拟用户访问操作,通过全天不间断自动检测,将检测信息记录到时序数据中,得到健康检测指标数据作为时序数据存储;运维人员通过可视化工具配置仪表盘展示应用健康指标相关图表;同时基于健康指标与自动检测结果的时序数据,配置相应的告警规则,以实现应用健康状态异常实时告警,并通过可视化展示工具直观的向运维人员展示应用健康状况。

Description

一种基于时序数据的应用健康自动检测方法
技术领域
本发明涉及一种运维配置管理平台的健康检测方法,具体说是一种基于时序数据的应用健康自动检测方法。
背景技术
运维系统和服务异常庞大的情况下,如果经由运维人员不定时访问验证,花费时间及人力成本较高,还可能会出现漏检测等人为工作失误,并且访问时长等一些精确度较高的量化指标人为记录不够准确,无法保障检测工作的准确性。
发明内容
本发明的目的是提供一种基于时序数据的应用健康自动检测方法。利用运维配置管理平台收集应用服务地址,通过定时任务去自动检测应用健康状态,并及时将健康指标数据记录通过告警规则配置通知运维人员。
本发明的目的通过以下技术方案实现:
一种基于时序数据的应用健康自动检测方法,其特征在于:通过分布式任务调度平台指定业务域构建一个自动检测的任务;检测程序模拟用户访问操作,通过全天不间断自动检测,将检测信息记录到时序数据中,得到健康检测指标数据作为时序数据存储;运维人员通过可视化工具配置仪表盘展示应用健康指标相关图表;同时基于健康指标与自动检测结果的时序数据,配置相应的告警规则,以实现应用健康状态异常实时告警,并通过可视化展示工具直观的向运维人员展示应用健康状况。
具体包括如下步骤:
S1、运维配置管理系统配置应用检测信息:在运维配置管理系统中,配置应用健康检测相关的负载均衡入口健康检测信息与各应用实例节点入口健康检测信息;
S2、健康检测定时任务:创建定时检测任务,定时通过预先配置的应用检测信息自动检测健康状态;
S3、模拟访问健康检测:通过模拟访问应用负载均衡和应用实例节点地址,模拟应用登录、检测页面是否包含指定关键字,记录页面访问时长、登录时长、关键字检测结果并保存至时序数据库;
S4、健康检测结果展示:使用支持时序数据源的可视化展现工具,配置Dashboard展示历史和实时健康指标数据;
S5、检测告警规则配置:使用基于时序数据的告警服务,根据健康指标配置告警规则,实现应用健康状态异常告警;
S6、健康异常告警通知:根据告警规则产生告警后,回调统一通知服务,服务调用短信和邮件网关,发送告警内容给应用运维人员。
本发明利用运维配置管理平台收集应用服务地址,通过定时任务去自动检测应用健康状态,将检测信息记录到时序数据中,并及时将健康指标数据记录通过告警规则配置通知运维人员,花费时间及人力成本较低,精确度高,记录准确,保障检测工作的准确性。
附图说明
图1基于时序数据的应用健康自动检测流程图。
具体实施方式
以下结合附图和具体实例对本发明进行详细说明。
一种基于时序数据的应用健康自动检测方法,通过分布式任务调度平台指定业务域构建一个自动检测的任务;检测程序模拟用户访问操作,通过全天不间断自动检测,将检测信息记录到时序数据中,得到健康检测指标数据作为时序数据存储;运维人员通过可视化工具配置仪表盘展示应用健康指标相关图表;同时基于健康指标与自动检测结果的时序数据,配置相应的告警规则,以实现应用健康状态异常实时告警,并通过可视化展示工具直观的向运维人员展示应用健康状况。具体如下:
步骤一:运维配置管理系统配置应用检测信息
运维配置管理系统中配置应用域名检测地址及实例节点健康检测地址,健康检测时指定系统配置系统访问超时时间、登录方式、登录超时时间、检测关键字等健康检测指标。
步骤二:健康检测定时任务
利用分布式任务调度平台,创建健康检测定时任务,不同系统检测任务分配到不同任务平台节点,每个节点内部使用多线程并发执行检测,最大程度的保证了检测任务的时效性。
步骤三:模拟用户访问应用
使用页面模拟访问技术,模拟用户访问应用目标页面,重定向认证登录,检测页面是否存在指定关键字,记录访问、登录时间,将能否访问,访问耗时、能否登录、登录耗时、关键字检测结果等健康指标数据存储至时序数据库。
步骤四:应用健康指标可视化展示
使用支持时序数据源的可视化展现工具创建仪表盘,在仪表盘中配置应用访问历史折线图、应用登录历史折线图、应用访问时长历史折线图、应用登录时长历史折线图、页面关键字检测历史折线图及最后一次健康指标值,上述图表均支持实时数据动态更新展示。
步骤五:告警规则配置及告警服务应用
使用基于时序数据的告警服务,针对应用健康检测指标配置告警规则,在一定时间范围内满足N次访问不通或者超时即触发告警,实现应用健康异常告警,异常告警以RESTful接口方式通知监控系统。
步骤六:健康异常告警通知
监控系统接收到告警消息,调用短信网关和邮件服务通知相关运维人员,进一步排查应用问题。
本发明能够解决定期人工验证应用健康状态,通过全天不间断自动检测,将检测信息记录到时序数据中,并通过可视化展示工具直观的向运维人员展示应用健康状况。

Claims (2)

1.一种基于时序数据的应用健康自动检测方法,其特征在于:通过分布式任务调度平台指定业务域构建一个自动检测的任务;检测程序模拟用户访问操作,通过全天不间断自动检测,将检测信息记录到时序数据中,得到健康检测指标数据作为时序数据存储;运维人员通过可视化工具配置仪表盘展示应用健康指标相关图表;同时基于健康指标与自动检测结果的时序数据,配置相应的告警规则,以实现应用健康状态异常实时告警,并通过可视化展示工具直观的向运维人员展示应用健康状况。
2.根据权利要求1所述的基于时序数据的应用健康自动检测方法,其特征在于:具体包括如下步骤:
S1、运维配置管理系统配置应用检测信息:在运维配置管理系统中,配置应用健康检测相关的负载均衡入口健康检测信息与各应用实例节点入口健康检测信息;
S2、健康检测定时任务:创建定时检测任务,定时通过预先配置的应用检测信息自动检测健康状态;
S3、模拟访问健康检测:通过模拟访问应用负载均衡和应用实例节点地址,模拟应用登录、检测页面是否包含指定关键字,记录页面访问时长、登录时长、关键字检测结果并保存至时序数据库;
S4、健康检测结果展示:使用支持时序数据源的可视化展现工具,配置Dashboard展示历史和实时健康指标数据;
S5、检测告警规则配置:使用基于时序数据的告警服务,根据健康指标配置告警规则,实现应用健康状态异常告警;
S6、健康异常告警通知:根据告警规则产生告警后,回调统一通知服务,服务调用短信和邮件网关,发送告警内容给应用运维人员。
CN201910879665.7A 2019-09-18 2019-09-18 一种基于时序数据的应用健康自动检测方法 Pending CN110768859A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910879665.7A CN110768859A (zh) 2019-09-18 2019-09-18 一种基于时序数据的应用健康自动检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910879665.7A CN110768859A (zh) 2019-09-18 2019-09-18 一种基于时序数据的应用健康自动检测方法

Publications (1)

Publication Number Publication Date
CN110768859A true CN110768859A (zh) 2020-02-07

Family

ID=69330359

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910879665.7A Pending CN110768859A (zh) 2019-09-18 2019-09-18 一种基于时序数据的应用健康自动检测方法

Country Status (1)

Country Link
CN (1) CN110768859A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749071A (zh) * 2020-12-30 2021-05-04 中国人寿保险股份有限公司上海数据中心 一种用于检测应用集群健康度的系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9210178B1 (en) * 2012-06-15 2015-12-08 Amazon Technologies, Inc. Mixed-mode authorization metadata manager for cloud computing environments
CN106534378A (zh) * 2016-12-29 2017-03-22 宁波金网信息产业股份有限公司 一种Web应用的健康指数监控系统
CN106681930A (zh) * 2017-01-23 2017-05-17 北京思特奇信息技术股份有限公司 分布式自动检测应用运行异常方法及系统
CN107094182A (zh) * 2017-06-01 2017-08-25 云南电网有限责任公司信息中心 一种采用sso单点认证系统检测服务节点健康度的负载均衡方法
CN109240126A (zh) * 2018-11-21 2019-01-18 国网湖北省电力有限公司电力科学研究院 一种具有模拟操作功能的分布式应用服务监测系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9210178B1 (en) * 2012-06-15 2015-12-08 Amazon Technologies, Inc. Mixed-mode authorization metadata manager for cloud computing environments
CN106534378A (zh) * 2016-12-29 2017-03-22 宁波金网信息产业股份有限公司 一种Web应用的健康指数监控系统
CN106681930A (zh) * 2017-01-23 2017-05-17 北京思特奇信息技术股份有限公司 分布式自动检测应用运行异常方法及系统
CN107094182A (zh) * 2017-06-01 2017-08-25 云南电网有限责任公司信息中心 一种采用sso单点认证系统检测服务节点健康度的负载均衡方法
CN109240126A (zh) * 2018-11-21 2019-01-18 国网湖北省电力有限公司电力科学研究院 一种具有模拟操作功能的分布式应用服务监测系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749071A (zh) * 2020-12-30 2021-05-04 中国人寿保险股份有限公司上海数据中心 一种用于检测应用集群健康度的系统及方法
CN112749071B (zh) * 2020-12-30 2023-11-14 中国人寿保险股份有限公司上海数据中心 一种用于检测应用集群健康度的系统及方法

Similar Documents

Publication Publication Date Title
de Mast et al. Process improvement in healthcare: Overall resource efficiency
JP5283905B2 (ja) 自動遠隔監視及び診断サービス方法とシステム
Deif Dynamic analysis of a lean cell under uncertainty
Jørgensen et al. CI implementation: an empirical test of the CI maturity model
CN107026894A (zh) 通过工业资产递送自动通知
US20110298608A1 (en) Site and alarm prioritization system
KR20060051738A (ko) 서비스발송 데이터 관리 시스템 및 방법
JP2021036247A (ja) 診断分析装置関連情報の集約方法および集約システム
CN110457371A (zh) 数据管理方法、装置、存储介质及系统
CN110460476A (zh) 一种网络运维管理方法
CN102609789A (zh) 图书馆信息监控与异常预测系统
WO2018005230A1 (en) Systems and methods of adaptive management of caregivers
CN111897806A (zh) 大数据离线数据质量检查方法及装置
CN115860729A (zh) 一种it运维综合管理系统
Wu et al. A review of alarm system design for advanced control rooms of nuclear power plants
CN115186977A (zh) 一种汽车零部件研发项目任务异常监控方法及系统
US20070282781A1 (en) Method To Retrieve Data For An Equipment, Plant Or A Process
CN110768859A (zh) 一种基于时序数据的应用健康自动检测方法
US10981586B2 (en) Railway diagnostic systems and methods
US20060010049A1 (en) Regulatory auditing methods and systems
Cook et al. Coordinating fault detection, alarm management, and energy efficiency in a large corporate campus
AU2010310482B2 (en) Method and system for event pattern detection
JP5292182B2 (ja) 水処理設備管理システム
US20060058902A1 (en) System and method for scheduling mold manufacturing
CN108133359A (zh) 一种考勤管理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200207

RJ01 Rejection of invention patent application after publication