CN108665237B - 一种基于业务系统建立自动巡检模型和定位异常的方法 - Google Patents

一种基于业务系统建立自动巡检模型和定位异常的方法 Download PDF

Info

Publication number
CN108665237B
CN108665237B CN201810412107.5A CN201810412107A CN108665237B CN 108665237 B CN108665237 B CN 108665237B CN 201810412107 A CN201810412107 A CN 201810412107A CN 108665237 B CN108665237 B CN 108665237B
Authority
CN
China
Prior art keywords
information
abnormal
database
middleware
inspection model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810412107.5A
Other languages
English (en)
Other versions
CN108665237A (zh
Inventor
赵静
梅永坚
邓书芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Ke Teng Information Technology Co ltd
Guangzhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Guangzhou Ke Teng Information Technology Co ltd
Guangzhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Ke Teng Information Technology Co ltd, Guangzhou Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Guangzhou Ke Teng Information Technology Co ltd
Priority to CN201810412107.5A priority Critical patent/CN108665237B/zh
Publication of CN108665237A publication Critical patent/CN108665237A/zh
Application granted granted Critical
Publication of CN108665237B publication Critical patent/CN108665237B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于业务系统建立自动巡检模型和定位异常的方法,包括以下步骤:提前获取业务系统信息;启动监控系统监控相关信息;运行所有测试用例N次;提取用例运行过程中的信息;分析存储的信息,建立巡检模型;采用巡检模型进行自动化巡检,当检测到异常信息时,进行比对分析,得出可能的异常业务处理,并输出比对结果,通知相关人员处理。本发明通过建立自动巡检模型,实现了IT运维过程中快速、精确地定位异常点的需求,进一步通过分析异常点以及相应的资源使用情况来分析异常的业务处理,得出可能出现的业务异常并给出相应的概率,方便运维人员及时解决,大大提高了业务处理的可用性以及工作效率,降低了对运维人员的技术要求。

Description

一种基于业务系统建立自动巡检模型和定位异常的方法
技术领域
本发明涉及计算机软件开发技术领域,特别是一种实现系统自动巡检和异常定位的方法。
背景技术
随着信息时代的持续发展,IT运维已经成为IT服务内涵中重要的组成部分。面对越来越复杂的业务,越来越多样化的用户需求,不断扩展的IT应用需要越来越合理的模式来保障IT服务的灵活便捷、安全稳定运行。
目前,许多企业的IT运维已经实现从人工运维到计算机管理,大多数企业的IT运维管理还只是处在半自动化的运维状态,也即这种IT运维模式仍然是在等到IT故障出现后,再由运维人员采取相应的补救措施。这些传统式被动、孤立、半自动式的IT运维管理模式存在以下缺点。
(1)运维人员被动、效率低
在IT运维过程中,由于故障预警机制的不完善,往往只有当事件已经发生并已造成业务影响时,才能发现和着手处理,这种被动“救火”使IT运维人员终日忙碌,并且处理的大多是简单重复的问题,不但事倍功半而且常常会出现恶性连锁反应,降低了IT运维的本身质量,导致IT部门和业务部门对IT运维的服务满意度都不高。
(2)无法精准定位异常内部位置
目前,许多企业在IT运维管理过程中缺少自动化的运维管理模式,也没有明确的角色定义和责任划分,使到问题出现后很难快速、准确地找到根本原因,无法及时地找到相应的人员进行修复和处理,或者是在问题找到后缺乏流程化的故障处理机制,而在处理问题时不但欠缺规范化的解决方案,也缺乏全面的跟踪记录。
(3)对运维人员的技术经验要求较高
因运维工具无法精准定位异常点,所以需要运维人员凭借经验去排查事故异常,提高了对事故处理运维人员的业务技术要求。
发明内容
本发明需要解决的技术问题是提供一种基于业务系统建立自动巡检模型和定位异常的方法,以便于能够快速精准地定位业务系统异常问题,并给出概率,为运维人员解决问题提供帮助,进一步提高工作效率,降低对运维人员的技术要求。
为解决上述技术问题,本发明所采取的技术方案如下。
一种基于业务系统建立自动巡检模型和定位异常的方法,主要包括以下步骤:
S1.提前获取业务系统信息;
S2.启动监控系统监控相关信息;
S3.运行所有测试用例N次,N为系统复杂度,记录相应的监控信息,放入资料库存储;
S4.用例运行过程中提取每个用例运行的时间、相应的日志、从日志里计算相关分解步骤的时间、运行过程中系统资源信息的变化和所使用的数据库中间件的情况,并对这些信息进行存储;
S5.分析存储的信息,将对这些信息的检查加入模型中形成巡检模型;
S6.采用巡检模型进行业务系统的自动化巡检,当检测到异常信息时,将当时获取的各种异常信息和资源的信息放入资料库进行比对分析,得出可能的异常业务处理,并输出比对结果,通知相关人员处理。
上述一种基于业务系统建立自动巡检模型和定位异常的方法,步骤S1中所述业务系统信息包括业务系统的日志位置及格式、业务系统使用的中间件种类版本、业务系统使用的数据库种类版本、业务系统的全套黑盒用例。
上述一种基于业务系统建立自动巡检模型和定位异常的方法,步骤S2中监控系统监控的相关信息包括系统硬件信息、网络I/O以及业务系统中间件和数据库的日志。
上述一种基于业务系统建立自动巡检模型和定位异常的方法,步骤S3中所述系统复杂度的计算方法为:通过获取系统使用的中间件数据库数量及日志信息显示详细程度来计算。
上述一种基于业务系统建立自动巡检模型和定位异常的方法,步骤S6的分析比对方法为:
S61.获取业务系统异常日志;
S62.获取异常点前后五秒内数据库的运行情况,并判断数据库是否存在异常,如存在异常,则输出相应数据库错误信息,并通知相关人员处理;若不存在异常则进行步骤S63;
S63.获取异常点中间件前后五秒内的情况,并判断中间件服务是否异常,如存在则输出相应中间件错误信息,并通知相关人员处理;若不存在异常则进行步骤S64;
S64.获取异常点前后五秒内的资源使用情况;
S65.将步骤S62至S64获取的资料输送至资料库,与所有用例结果进行比对,输出相似度;
S66.输出比对结果,分析异常业务处理,并通知相关人员进行处理。
由于采用了以上技术方案,本发明所取得技术进步如下。
本发明通过建立自动巡检模型,实现了IT运维过程中快速、精确地定位异常点的需求,进一步通过分析异常点以及相应的资源使用情况来分析异常的业务处理,利用全面覆盖测试得到的数据,根据异常点的错误信息分析可能出现业务异常并给出相应的概率,方便运维人员及时解决,大大提高了业务处理的可用性以及工作效率,降低了对运维人员的技术要求。
附图说明
图1为本发明的流程图;
图2为本发明所述步骤S6的流程图。
具体实施方式
下面将结合附图和具体实施例对本发明进行进一步详细说明。
一种基于业务系统建立自动巡检模型和定位异常的方法,通过建立自动巡检模型,可在业务运行过程中准确找出异常,并分析异常点情况,给出概率。该方法的流程图如图1所示,主要包括以下步骤。
S1.提前获取业务系统信息;业务系统信息包括业务系统的日志位置及格式、业务系统使用的中间件种类版本、业务系统使用的数据库种类版本、业务系统的全套黑盒用例。
S2.启动监控系统监控相关信息;包括系统硬件信息、网络I/O以及业务系统中间件和数据库的日志,其中硬件信息主要包括CPU、内存、磁盘等硬件设备的信息。
S3.运行所有测试用例N次,N为系统复杂度,记录相应的监控信息,放入资料库存储。本步骤中所述系统复杂度的计算方法为:通过获取系统使用的中间件数据库数量及日志信息显示详细程度来计算。
S4.用例运行过程中提取每个用例运行的时间、相应的日志、从日志里计算相关分解步骤的时间、运行过程中系统资源信息的变化和所使用的数据库中间件的情况,并对这些信息进行存储;
S5.分析存储的信息,将对这些信息的检查加入模型中形成巡检模型;
S6.采用巡检模型进行业务系统的自动化巡检,当检测到异常信息时,将当时获取的各种异常信息和资源的信息放入资料库进行比对分析,得出可能的异常业务处理,并输出比对结果,通知相关人员处理。
本步骤所述比对分析的方法如图2所示,具体包括以下内容。
S61.获取业务系统异常日志。
S62.获取异常点前后五秒内数据库的运行情况,并判断数据库是否存在异常,如存在异常,则输出相应数据库错误信息,并通知相关人员处理;若不存在异常则进行步骤S63。
S63.获取异常点中间件前后五秒内的情况,并判断中间件服务是否异常,如存在则输出相应中间件错误信息,并通知相关人员处理;若不存在异常则进行步骤S64。
S64.获取异常点前后五秒内的资源使用情况。
S65.将步骤S62至S64获取的资料输送至资料库,与所有用例结果进行比对,输出相似度。
S66.输出比对结果,分析异常业务处理,并通知相关人员进行处理。

Claims (4)

1.一种基于业务系统建立自动巡检模型和定位异常的方法,其特征在于,主要包括以下步骤:
S1.提前获取业务系统信息;
S2.启动监控系统监控相关信息;
S3.运行所有测试用例N次,N为系统复杂度,记录相应的监控信息,放入资料库存储;
S4.用例运行过程中提取每个用例运行的时间、相应的日志、从日志里计算相关分解步骤的时间、运行过程中系统资源信息的变化和所使用的数据库中间件的情况,并对这些信息进行存储;
S5.分析存储的信息,将对这些信息的检查加入模型中形成巡检模型;
S6.采用巡检模型进行业务系统的自动化巡检,当检测到异常信息时,将当时获取的各种异常信息和资源的信息放入资料库进行比对分析,得出可能的异常业务处理,并输出比对结果,通知相关人员处理;
比对分析方法为:
S61.获取业务系统异常日志;
S62.获取异常点前后五秒内数据库的运行情况,并判断数据库是否存在异常,如存在异常,则输出相应数据库错误信息,并通知相关人员处理;若不存在异常则进行步骤S63;
S63.获取异常点中间件前后五秒内的情况,并判断中间件服务是否异常,如存在则输出相应中间件错误信息,并通知相关人员处理;若不存在异常则进行步骤S64;
S64.获取异常点前后五秒内的资源使用情况;
S65.将步骤S62至S64获取的资料输送至资料库,与所有用例结果进行比对,输出相似度;
S66.输出比对结果,分析异常业务处理,并通知相关人员进行处理。
2.根据权利要求1所述的一种基于业务系统建立自动巡检模型和定位异常的方法,其特征在于,步骤S1中所述业务系统信息包括业务系统的日志位置及格式、业务系统使用的中间件种类版本、业务系统使用的数据库种类版本、业务系统的全套黑盒用例。
3.根据权利要求1所述的一种基于业务系统建立自动巡检模型和定位异常的方法,其特征在于,步骤S2中监控系统监控的相关信息包括系统硬件信息、网络I/O以及业务系统中间件和数据库的日志。
4.根据权利要求1所述的一种基于业务系统建立自动巡检模型和定位异常的方法,其特征在于,步骤S3中所述系统复杂度的计算方法为:通过获取系统使用的中间件数据库数量及日志信息显示详细程度来计算。
CN201810412107.5A 2018-05-03 2018-05-03 一种基于业务系统建立自动巡检模型和定位异常的方法 Active CN108665237B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810412107.5A CN108665237B (zh) 2018-05-03 2018-05-03 一种基于业务系统建立自动巡检模型和定位异常的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810412107.5A CN108665237B (zh) 2018-05-03 2018-05-03 一种基于业务系统建立自动巡检模型和定位异常的方法

Publications (2)

Publication Number Publication Date
CN108665237A CN108665237A (zh) 2018-10-16
CN108665237B true CN108665237B (zh) 2022-05-13

Family

ID=63781693

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810412107.5A Active CN108665237B (zh) 2018-05-03 2018-05-03 一种基于业务系统建立自动巡检模型和定位异常的方法

Country Status (1)

Country Link
CN (1) CN108665237B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110069401B (zh) * 2019-03-18 2023-09-12 平安科技(深圳)有限公司 基于数据建模的系统测试异常定位方法及系统
CN110633189B (zh) * 2019-09-20 2023-04-07 深圳市广通软件有限公司 一种it系统的智能运维监控方法及其智能运维监控系统
CN112134865A (zh) * 2020-09-15 2020-12-25 深圳市欢太科技有限公司 一种日志信息上报方法、电子设备及可读存储介质
CN112615737B (zh) * 2020-12-09 2023-06-09 苏宁金融科技(南京)有限公司 业务系统自动监控的方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103188526A (zh) * 2011-12-29 2013-07-03 青岛海尔软件有限公司 模拟电视墙以实现非视频类频道可用性监控的系统与方法
CN105790441A (zh) * 2016-05-02 2016-07-20 国家电网公司 一种智能变电站继电保护巡检系统
CN106710001A (zh) * 2016-12-29 2017-05-24 山东鲁能智能技术有限公司 一种基于变电站巡检机器人集中监控仿真系统及其方法
JP2017211682A (ja) * 2016-05-23 2017-11-30 三菱電機株式会社 データ検索視点生成方法、設備管理装置およびそれを用いた設備管理システム
CN107870824A (zh) * 2016-09-28 2018-04-03 中兴通讯股份有限公司 一种对组件进行巡检的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103188526A (zh) * 2011-12-29 2013-07-03 青岛海尔软件有限公司 模拟电视墙以实现非视频类频道可用性监控的系统与方法
CN105790441A (zh) * 2016-05-02 2016-07-20 国家电网公司 一种智能变电站继电保护巡检系统
JP2017211682A (ja) * 2016-05-23 2017-11-30 三菱電機株式会社 データ検索視点生成方法、設備管理装置およびそれを用いた設備管理システム
CN107870824A (zh) * 2016-09-28 2018-04-03 中兴通讯股份有限公司 一种对组件进行巡检的方法及装置
CN106710001A (zh) * 2016-12-29 2017-05-24 山东鲁能智能技术有限公司 一种基于变电站巡检机器人集中监控仿真系统及其方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
配电自动化缺陷自动巡检系统的设计;颜慧 等;《电气设计》;20171231;第83-85页 *

Also Published As

Publication number Publication date
CN108665237A (zh) 2018-10-16

Similar Documents

Publication Publication Date Title
CN108665237B (zh) 一种基于业务系统建立自动巡检模型和定位异常的方法
US20190228296A1 (en) Significant events identifier for outlier root cause investigation
US10275301B2 (en) Detecting and analyzing performance anomalies of client-server based applications
US7409316B1 (en) Method for performance monitoring and modeling
US7082381B1 (en) Method for performance monitoring and modeling
US20190108112A1 (en) System and method for generating a log analysis report from a set of data sources
US10489711B1 (en) Method and apparatus for predictive behavioral analytics for IT operations
CN107124289B (zh) 网络日志时间对齐方法、装置及主机
US7197428B1 (en) Method for performance monitoring and modeling
EP3511834B1 (en) System and method for tool chain data capture through parser for empirical data analysis
CN109960635B (zh) 实时计算平台的监控和报警方法、系统、设备及存储介质
CN109669844A (zh) 设备故障处理方法、装置、设备和存储介质
US7369967B1 (en) System and method for monitoring and modeling system performance
CN113946499A (zh) 一种微服务链路跟踪及性能分析方法、系统、设备及应用
CN114844797A (zh) 调用链日志与监控日志关联方法及微服务异常检测方法
EP2113874A1 (en) Method and system for monitoring computer-implemented processes
US7617313B1 (en) Metric transport and database load
CN111143185A (zh) 一种基于日志的故障分析方法及装置
CN114924990A (zh) 一种异常场景测试方法及电子设备
CN112416896A (zh) 数据异常的报警方法和装置、存储介质、电子装置
JP5240709B2 (ja) シンプトンを評価するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム
CN111209130B (zh) 基于MySQL主从复制集群的故障处理方法、系统、设备和介质
Afshinpour et al. Telemetry-based Software Failure Prediction by Concept-space Model Creation
CN109933476A (zh) 一种OpenPOWER服务器性能的显示方法和装置
Jayapal et al. Automation of Trace Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210312

Address after: 510000 Tianhe No. two road, Guangzhou, Guangdong Province, No. 2

Applicant after: Guangzhou Power Supply Bureau of Guangdong Power Grid Co.,Ltd.

Applicant after: GUANGZHOU KE TENG INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 510000 Tianhe No. two road, Guangzhou, Guangdong Province, No. 2

Applicant before: GUANGZHOU POWER SUPPLY Co.,Ltd.

Applicant before: GUANGZHOU KE TENG INFORMATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant