CN112598291B - 一种基于Prophet的运维智能排班方法及装置 - Google Patents

一种基于Prophet的运维智能排班方法及装置 Download PDF

Info

Publication number
CN112598291B
CN112598291B CN202011560216.5A CN202011560216A CN112598291B CN 112598291 B CN112598291 B CN 112598291B CN 202011560216 A CN202011560216 A CN 202011560216A CN 112598291 B CN112598291 B CN 112598291B
Authority
CN
China
Prior art keywords
alarm data
predicted
data
preprocessed
system alarm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011560216.5A
Other languages
English (en)
Other versions
CN112598291A (zh
Inventor
王哲
彭新宇
王灿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank of China
Original Assignee
Agricultural Bank of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank of China filed Critical Agricultural Bank of China
Priority to CN202011560216.5A priority Critical patent/CN112598291B/zh
Publication of CN112598291A publication Critical patent/CN112598291A/zh
Application granted granted Critical
Publication of CN112598291B publication Critical patent/CN112598291B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063118Staff planning in a project environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • Computer Hardware Design (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Technology Law (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于Prophet的运维智能排班方法及装置,方法包括:采集预设历史时间段内发生的系统告警数据;对系统告警数据进行预处理,得到预处理后的系统告警数据;将预处理后的系统告警数据存储至数据库;基于预处理后的系统告警数据,拟合Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测;按照预测的告警数量对所有系统进行逆序排序;根据系统排名,对应相关系统运维负责人生成值班表。本发明能够减少通知链条上不必要的时间浪费,将应急处置时间缩到最短,提高系统响应效率,保证系统高效稳定运行。

Description

一种基于Prophet的运维智能排班方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于Prophet的运维智能排班方法及装置。
背景技术
目前,商业银行为了快速响应业务系统在运行过程中出现的问题,需要每天安排运维人员进行值班。由于系统众多,当天收到的系统告警不一定是值班人员所负责的系统模块,对于告警的严重程度以及处置方法无法确定,此时就需要临时通知相应的系统运维人员完成应急处置,以满足服务的连续性。在这个过程中有可能会因为通知不及时或者通知链条过长等状况,错过最佳解决问题时间,延误系统恢复。
因此,如何减少通知链条上不必要的时间浪费,将应急处置时间缩到最短,以提高系统响应效率,保证系统高效稳定运行,是一项亟待解决的问题。
发明内容
有鉴于此,本发明提供了一种基于Prophet的运维智能排班方法,能够根据历史告警的发生趋势,智能预测出某系统未来一段时间内的发生告警的概率,并生成值班表,据此,排班管理员就可以安排该系统的运维人员在当天进行值班,减少通知链条上不必要的时间浪费,将应急处置时间缩到最短,提高系统响应效率,保证系统高效稳定运行。
本发明提供了一种基于Prophet的运维智能排班方法,包括:
采集预设历史时间段内发生的系统告警数据;
对所述系统告警数据进行预处理,得到预处理后的系统告警数据;
将所述预处理后的系统告警数据存储至数据库;
基于所述预处理后的系统告警数据,拟合Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测;
按照预测的告警数量对所有系统进行逆序排序;
根据系统排名,对应相关系统运维负责人生成值班表。
优选地,所述对所述系统告警数据进行预处理,得到预处理后的系统告警数据,包括:
对所述系统告警数据中的异常数据或缺失的数据进行丢弃处理,得到预处理后的系统告警数据。
优选地,基于所述预处理后的系统告警数据,拟合Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测,包括:
基于待预测时间段超参数,对Prophet模型进行训练;
评估训练后的Prophet模型的预测结果与真实结果之间的误差;
基于所述误差加入影响预测结果的因素,并对训练后的Prophet模型的参数进行调整,得到调整后的Prophet模型;
基于所述预处理后的系统告警数据,采用调整后的Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测。
优选地,所述根据系统排名,对应相关系统运维负责人生成值班表,包括:
根据系统排名,判断推荐的运维负责人是否满足值班预设条件,若是,则:
根据系统排名以及满足值班预设条件的运维负责人生成值班表。
优选地,所述评估训练后的Prophet模型的预测结果与真实结果之间的误差,包括:
采用均方误差、均方根误差和平均绝对误差指标评估训练后的Prophet模型的预测结果与真实结果之间的误差。
一种基于Prophet的运维智能排班装置,包括:
数据采集模块,用于采集预设历史时间段内发生的系统告警数据;
数据预处理模块,用于对所述系统告警数据进行预处理,得到预处理后的系统告警数据;
数据入库模块,用于将所述预处理后的系统告警数据存储至数据库;
预测模块,用于基于所述预处理后的系统告警数据,拟合Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测;
排序模块,用于按照预测的告警数量对所有系统进行逆序排序;
生成模块,用于根据系统排名,对应相关系统运维负责人生成值班表。
优选地,所述数据预处理模块在执行对所述系统告警数据进行预处理,得到预处理后的系统告警数据时,具体用于:
对所述系统告警数据中的异常数据或缺失的数据进行丢弃处理,得到预处理后的系统告警数据。
优选地,所述预测模块在执行基于所述预处理后的系统告警数据,拟合Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测时,包括:
训练单元,用于基于待预测时间段超参数,对Prophet模型进行训练;
评估单元,用于评估训练后的Prophet模型的预测结果与真实结果之间的误差;
调整单元,用于基于所述误差加入影响预测结果的因素,并对训练后的Prophet模型的参数进行调整,得到调整后的Prophet模型;
预测单元,用于基于所述预处理后的系统告警数据,采用调整后的Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测。
优选地,所述生成模块在执行根据系统排名,对应相关系统运维负责人生成值班表时,包括:
判断单元,用于根据系统排名,判断推荐的运维负责人是否满足值班预设条件;
生成单元,用于当推荐的运维负责人满足值班预设条件时,根据系统排名以及满足值班预设条件的运维负责人生成值班表。
优选地,所述评估单元在执行评估训练后的Prophet模型的预测结果与真实结果之间的误差时,具体用于:
采用均方误差、均方根误差和平均绝对误差指标评估训练后的Prophet模型的预测结果与真实结果之间的误差。
综上所述,本发明公开了一种基于Prophet的运维智能排班方法,当需要实现智能排班时,首先采集预设历史时间段内发生的系统告警数据,对系统告警数据进行预处理,得到预处理后的系统告警数据;将预处理后的系统告警数据存储至数据库;然后基于预处理后的系统告警数据,拟合Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测;按照预测的告警数量对所有系统进行逆序排序;根据系统排名,对应相关系统运维负责人生成值班表。本发明能够根据历史告警的发生趋势,智能预测出某系统未来一段时间内的发生告警的概率,并生成值班表,据此,排班管理员就可以安排该系统的运维人员在当天进行值班,减少通知链条上不必要的时间浪费,将应急处置时间缩到最短,提高系统响应效率,保证系统高效稳定运行。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明公开的一种基于Prophet的运维智能排班方法实施例1的方法流程图;
图2为本发明公开的一种基于Prophet的运维智能排班方法实施例2的方法流程图;
图3为本发明公开的一种基于Prophet的运维智能排班装置实施例1的结构示意图;
图4为本发明公开的一种基于Prophet的运维智能排班装置实施例2的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明公开的一种基于Prophet的运维智能排班方法的实施例1的方法流程图,所述方法可以包括以下步骤:
S101、采集预设历史时间段内发生的系统告警数据;
当需要实现智能排班时,首先采集预设历史时间段内发送的系统告警数据,即采集历史时间段内每天发生的系统告警事件,并按照系统的时间维度统计告警数量。
S102、对系统告警数据进行预处理,得到预处理后的系统告警数据;
在采集到预设历史时间段内发生的系统告警数据后,进一步对采集到的系统告警数据进行分析及处理,得到预处理后的系统告警数据。
S103、将预处理后的系统告警数据存储至数据库;
然后,将预处理后的系统告警数据存入数据库。
S104、基于预处理后的系统告警数据,拟合Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测;
然后,根据预处理后的系统告警数据,拟合prophet模型,对未来日期的告警数量以及某系统在特定日期发生故障的概率进行预测。
S105、按照预测的告警数量对所有系统进行逆序排序;
然后,按照预测的告警数量对所有本部门负责运维的系统进行逆序排序,将排名最高的top-5进行输出。
S106、根据系统排名,对应相关系统运维负责人生成值班表。
根据系统排名,对应相关系统运维负责人生成值班表,展示推荐的值班人员。排班管理员可以根据智能生成的值班表,结合具体情况安排一线运维人员值班。
综上所述,在上述实施例中,当需要实现智能排班时,首先采集预设历史时间段内发生的系统告警数据,对系统告警数据进行预处理,得到预处理后的系统告警数据;将预处理后的系统告警数据存储至数据库;然后基于预处理后的系统告警数据,拟合Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测;按照预测的告警数量对所有系统进行逆序排序;根据系统排名,对应相关系统运维负责人生成值班表。能够根据历史告警的发生趋势,智能预测出某系统未来一段时间内的发生告警的概率,并生成值班表,据此,排班管理员就可以安排该系统的运维人员在当天进行值班,减少通知链条上不必要的时间浪费,将应急处置时间缩到最短,提高系统响应效率,保证系统高效稳定运行。
如图2所示,为本发明公开的一种基于Prophet的运维智能排班方法的实施例2的方法流程图,所述方法可以包括以下步骤:
S201、采集预设历史时间段内发生的系统告警数据;
当需要实现智能排班时,首先采集预设历史时间段内发送的系统告警数据,即采集历史时间段内每天发生的系统告警事件,并按照系统的时间维度统计告警数量。
S202、对系统告警数据中的异常数据或缺失的数据进行丢弃处理,得到预处理后的系统告警数据;
在采集到预设历史时间段内发生的系统告警数据后,进一步对采集到的系统告警数据进行分析及处理,得到预处理后的系统告警数据。
具体的,在对采集到的系统告警数据进行预处理时,可以对系统告警数据中的异常数据或缺失的数据进行丢弃处理,得到预处理后的系统告警数据。
S203、将预处理后的系统告警数据存储至数据库;
然后,将预处理后的系统告警数据存入数据库。
S204、基于待预测时间段超参数,对Prophet模型进行训练;
然后,根据预处理后的系统告警数据,拟合prophet模型,对未来日期的告警数量以及某系统在特定日期发生故障的概率进行预测。
具体的,首先通过手工构建待预测时间段超参数,进行模型的训练。
S205、评估训练后的Prophet模型的预测结果与真实结果之间的误差;
然后,评估训练后的Prophet模型的预测结果与真实结果之间的误差。
具体的,采用均方误差(MSE)、均方根误差(RMSE)和平均绝对误差(MAE)指标评估训练后的Prophet模型的预测结果与真实结果之间的误差。其中:
S206、基于误差加入影响预测结果的因素,并对训练后的Prophet模型的参数进行调整,得到调整后的Prophet模型;
将误差较大的潜在原因呈现给分析师做人工干预,加入可能影响预测结果的因素,比如说投产日、节假日、重要时间点等。并对训练后的Prophet模型的参数进行调整,得到调整后的Prophet模型。
S207、基于预处理后的系统告警数据,采用调整后的Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测;
然后,采用调整后的Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测。
S208、按照预测的告警数量对所有系统进行逆序排序;
然后,按照预测的告警数量对所有本部门负责运维的系统进行逆序排序,将排名最高的top-5进行输出。
S209、根据系统排名,判断推荐的运维负责人是否满足值班预设条件,若是,则进入S210:
根据系统排名,判断推荐的值班人员是否满足值班预设条件。例如,值班人员两次值班间隔不得小于5天,小于5天则不会分配该系统运维人员进行值班。
S210、根据系统排名以及满足值班预设条件的运维负责人生成值班表。
若推荐的值班人员满足值班预设条件,则对值班人员执行相应的排班操作。排班管理员可以根据智能生成的值班表,结合具体情况安排一线运维人员值班。
综上所述,本发明采用Prophet时间序列模型结合专家经验和手工特征的方法对系统告警数量、以及某系统在特定日期发生告警的概率进行预测。本发明中的装置按照预先设定好的排班条件来生成值班人员排班表,并由排班管理员来决策执行排班。通过本发明提出的运维智能排班策略及装置,既可以降低排班管理员人工排班的工作量,也能够选择最直接的系统运维人员参与值班,将处置时间降到最低,提升系统的应急处置效率。
如图3所示,为本发明公开的一种基于Prophet的运维智能排班装置的实施例1的结构示意图,所述装置可以包括:
数据采集模块301,用于采集预设历史时间段内发生的系统告警数据;
当需要实现智能排班时,首先采集预设历史时间段内发送的系统告警数据,即采集历史时间段内每天发生的系统告警事件,并按照系统的时间维度统计告警数量。
数据预处理模块302,用于对系统告警数据进行预处理,得到预处理后的系统告警数据;
在采集到预设历史时间段内发生的系统告警数据后,进一步对采集到的系统告警数据进行分析及处理,得到预处理后的系统告警数据。
数据入库模块303,用于将预处理后的系统告警数据存储至数据库;
然后,将预处理后的系统告警数据存入数据库。
预测模块304,用于基于预处理后的系统告警数据,拟合Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测;
然后,根据预处理后的系统告警数据,拟合prophet模型,对未来日期的告警数量以及某系统在特定日期发生故障的概率进行预测。
排序模块305,用于按照预测的告警数量对所有系统进行逆序排序;
然后,按照预测的告警数量对所有本部门负责运维的系统进行逆序排序,将排名最高的top-5进行输出。
生成模块306,用于根据系统排名,对应相关系统运维负责人生成值班表。
根据系统排名,对应相关系统运维负责人生成值班表,展示推荐的值班人员。排班管理员可以根据智能生成的值班表,结合具体情况安排一线运维人员值班。
综上所述,在上述实施例中,当需要实现智能排班时,首先采集预设历史时间段内发生的系统告警数据,对系统告警数据进行预处理,得到预处理后的系统告警数据;将预处理后的系统告警数据存储至数据库;然后基于预处理后的系统告警数据,拟合Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测;按照预测的告警数量对所有系统进行逆序排序;根据系统排名,对应相关系统运维负责人生成值班表。能够根据历史告警的发生趋势,智能预测出某系统未来一段时间内的发生告警的概率,并生成值班表,据此,排班管理员就可以安排该系统的运维人员在当天进行值班,减少通知链条上不必要的时间浪费,将应急处置时间缩到最短,提高系统响应效率,保证系统高效稳定运行。
如图4所示,为本发明公开的一种基于Prophet的运维智能排班装置的实施例2的结构示意图,所述装置可以包括:
数据采集模块401,用于采集预设历史时间段内发生的系统告警数据;
当需要实现智能排班时,首先采集预设历史时间段内发送的系统告警数据,即采集历史时间段内每天发生的系统告警事件,并按照系统的时间维度统计告警数量。
数据预处理模块402,用于对系统告警数据中的异常数据或缺失的数据进行丢弃处理,得到预处理后的系统告警数据;
在采集到预设历史时间段内发生的系统告警数据后,进一步对采集到的系统告警数据进行分析及处理,得到预处理后的系统告警数据。
具体的,在对采集到的系统告警数据进行预处理时,可以对系统告警数据中的异常数据或缺失的数据进行丢弃处理,得到预处理后的系统告警数据。
数据入库模块403,用于将预处理后的系统告警数据存储至数据库;
然后,将预处理后的系统告警数据存入数据库。
训练单元404,用于基于待预测时间段超参数,对Prophet模型进行训练;
然后,根据预处理后的系统告警数据,拟合prophet模型,对未来日期的告警数量以及某系统在特定日期发生故障的概率进行预测。
具体的,首先通过手工构建待预测时间段超参数,进行模型的训练。
评估单元405,用于评估训练后的Prophet模型的预测结果与真实结果之间的误差;
然后,评估训练后的Prophet模型的预测结果与真实结果之间的误差。
具体的,采用均方误差(MSE)、均方根误差(RMSE)和平均绝对误差(MAE)指标评估训练后的Prophet模型的预测结果与真实结果之间的误差。其中:
调整单元406,用于基于误差加入影响预测结果的因素,并对训练后的Prophet模型的参数进行调整,得到调整后的Prophet模型;
将误差较大的潜在原因呈现给分析师做人工干预,加入可能影响预测结果的因素,比如说投产日、节假日、重要时间点等。并对训练后的Prophet模型的参数进行调整,得到调整后的Prophet模型。
预测单元407,用于基于预处理后的系统告警数据,采用调整后的Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测;
然后,采用调整后的Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测。
排序模块408,用于按照预测的告警数量对所有系统进行逆序排序;
然后,按照预测的告警数量对所有本部门负责运维的系统进行逆序排序,将排名最高的top-5进行输出。
判断单元409,用于根据系统排名,判断推荐的运维负责人是否满足值班预设条件;
根据系统排名,判断推荐的值班人员是否满足值班预设条件。例如,值班人员两次值班间隔不得小于5天,小于5天则不会分配该系统运维人员进行值班。
生成单元410,用于当推荐的运维负责人满足值班预设条件时,根据系统排名以及满足值班预设条件的运维负责人生成值班表。
若推荐的值班人员满足值班预设条件,则对值班人员执行相应的排班操作。排班管理员可以根据智能生成的值班表,结合具体情况安排一线运维人员值班。
综上所述,本发明采用Prophet时间序列模型结合专家经验和手工特征的方法对系统告警数量、以及某系统在特定日期发生告警的概率进行预测。本发明中的装置按照预先设定好的排班条件来生成值班人员排班表,并由排班管理员来决策执行排班。通过本发明提出的运维智能排班策略及装置,既可以降低排班管理员人工排班的工作量,也能够选择最直接的系统运维人员参与值班,将处置时间降到最低,提升系统的应急处置效率。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种基于Prophet的运维智能排班方法,其特征在于,包括:
采集预设历史时间段内发生的系统告警数据;
对所述系统告警数据进行预处理,得到预处理后的系统告警数据;
将所述预处理后的系统告警数据存储至数据库;
基于待预测时间段超参数,对Prophet模型进行训练;
评估训练后的Prophet模型的预测结果与真实结果之间的误差;
基于所述误差加入影响预测结果的因素,并对训练后的Prophet模型的参数进行调整,得到调整后的Prophet模型;
基于所述预处理后的系统告警数据,采用调整后的Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测;
按照预测的告警数量对所有系统进行逆序排序;
根据系统排名,对应相关系统运维负责人生成值班表。
2.根据权利要求1所述的方法,其特征在于,所述对所述系统告警数据进行预处理,得到预处理后的系统告警数据,包括:
对所述系统告警数据中的异常数据或缺失的数据进行丢弃处理,得到预处理后的系统告警数据。
3.根据权利要求1所述的方法,其特征在于,所述根据系统排名,对应相关系统运维负责人生成值班表,包括:
根据系统排名,判断推荐的运维负责人是否满足值班预设条件,若是,则:
根据系统排名以及满足值班预设条件的运维负责人生成值班表。
4.根据权利要求3所述的方法,其特征在于,所述评估训练后的Prophet模型的预测结果与真实结果之间的误差,包括:
采用均方误差、均方根误差和平均绝对误差指标评估训练后的Prophet模型的预测结果与真实结果之间的误差。
5.一种基于Prophet的运维智能排班装置,其特征在于,包括:
数据采集模块,用于采集预设历史时间段内发生的系统告警数据;
数据预处理模块,用于对所述系统告警数据进行预处理,得到预处理后的系统告警数据;
数据入库模块,用于将所述预处理后的系统告警数据存储至数据库;
预测模块,用于基于所述预处理后的系统告警数据,拟合Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测;
排序模块,用于按照预测的告警数量对所有系统进行逆序排序;
生成模块,用于根据系统排名,对应相关系统运维负责人生成值班表;
其中,所述预测模块包括训练单元、评估单元、调整单元和预测单元;
所述训练单元,用于基于待预测时间段超参数,对Prophet模型进行训练;
所述评估单元,用于评估训练后的Prophet模型的预测结果与真实结果之间的误差;
所述调整单元,用于基于所述误差加入影响预测结果的因素,并对训练后的Prophet模型的参数进行调整,得到调整后的Prophet模型;
所述预测单元,用于基于所述预处理后的系统告警数据,采用调整后的Prophet模型,对待预测时间段的告警数量以及目标系统在特定日期发生故障的概率进行预测。
6.根据权利要求5所述的装置,其特征在于,所述数据预处理模块在执行对所述系统告警数据进行预处理,得到预处理后的系统告警数据时,具体用于:
对所述系统告警数据中的异常数据或缺失的数据进行丢弃处理,得到预处理后的系统告警数据。
7.根据权利要求5所述的装置,其特征在于,所述生成模块在执行根据系统排名,对应相关系统运维负责人生成值班表时,包括:
判断单元,用于根据系统排名,判断推荐的运维负责人是否满足值班预设条件;
生成单元,用于当推荐的运维负责人满足值班预设条件时,根据系统排名以及满足值班预设条件的运维负责人生成值班表。
8.根据权利要求7所述的装置,其特征在于,所述评估单元在执行评估训练后的Prophet模型的预测结果与真实结果之间的误差时,具体用于:
采用均方误差、均方根误差和平均绝对误差指标评估训练后的Prophet模型的预测结果与真实结果之间的误差。
CN202011560216.5A 2020-12-25 2020-12-25 一种基于Prophet的运维智能排班方法及装置 Active CN112598291B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011560216.5A CN112598291B (zh) 2020-12-25 2020-12-25 一种基于Prophet的运维智能排班方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011560216.5A CN112598291B (zh) 2020-12-25 2020-12-25 一种基于Prophet的运维智能排班方法及装置

Publications (2)

Publication Number Publication Date
CN112598291A CN112598291A (zh) 2021-04-02
CN112598291B true CN112598291B (zh) 2023-10-13

Family

ID=75202456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011560216.5A Active CN112598291B (zh) 2020-12-25 2020-12-25 一种基于Prophet的运维智能排班方法及装置

Country Status (1)

Country Link
CN (1) CN112598291B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113835387A (zh) * 2021-09-16 2021-12-24 国家计算机网络与信息安全管理中心 运维管理方法、系统及介质
CN114118824A (zh) * 2021-11-30 2022-03-01 中国建设银行股份有限公司 一种值班管理方法与系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800127A (zh) * 2019-01-03 2019-05-24 众安信息技术服务有限公司 一种基于机器学习的系统故障诊断智能化运维方法及系统
CN110990174A (zh) * 2019-10-25 2020-04-10 苏州浪潮智能科技有限公司 一种基于Prophet模型预测SSD可用时间的方法、设备及介质
CN111459761A (zh) * 2020-04-01 2020-07-28 广州虎牙科技有限公司 一种Redis配置的方法、装置、存储介质及设备
CN111753875A (zh) * 2020-05-15 2020-10-09 国家电网有限公司客户服务中心 一种电力信息系统运行趋势分析方法、装置及存储介质
CN111984514A (zh) * 2020-09-02 2020-11-24 大连大学 基于Prophet-bLSTM-DTW的日志异常检测方法
CN112116123A (zh) * 2019-08-05 2020-12-22 云智慧(北京)科技有限公司 一种基于动态基线的智能告警方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11754997B2 (en) * 2018-02-17 2023-09-12 Ei Electronics Llc Devices, systems and methods for predicting future consumption values of load(s) in power distribution systems

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800127A (zh) * 2019-01-03 2019-05-24 众安信息技术服务有限公司 一种基于机器学习的系统故障诊断智能化运维方法及系统
CN112116123A (zh) * 2019-08-05 2020-12-22 云智慧(北京)科技有限公司 一种基于动态基线的智能告警方法和系统
CN110990174A (zh) * 2019-10-25 2020-04-10 苏州浪潮智能科技有限公司 一种基于Prophet模型预测SSD可用时间的方法、设备及介质
CN111459761A (zh) * 2020-04-01 2020-07-28 广州虎牙科技有限公司 一种Redis配置的方法、装置、存储介质及设备
CN111753875A (zh) * 2020-05-15 2020-10-09 国家电网有限公司客户服务中心 一种电力信息系统运行趋势分析方法、装置及存储介质
CN111984514A (zh) * 2020-09-02 2020-11-24 大连大学 基于Prophet-bLSTM-DTW的日志异常检测方法

Also Published As

Publication number Publication date
CN112598291A (zh) 2021-04-02

Similar Documents

Publication Publication Date Title
US11876374B2 (en) System and method for optimal control of energy storage system
CN112598291B (zh) 一种基于Prophet的运维智能排班方法及装置
US20200125465A1 (en) Automatic prediction system for server failure and method of automatically predicting server failure
CN108073497B (zh) 一种基于数据中心数据采集平台的多指标异动分析方法
CN111679952B (zh) 告警阈值生成方法及装置
EP3852036A1 (en) Systems and methods for selecting grid actions to improve grid outcomes
CN113383282A (zh) 校正离子注入半导体制造工具中的部件故障
CN103856339A (zh) 一种对告警信息进行压缩的方法和设备
CN112651785B (zh) 交易量实时监测方法与系统
CN111062518B (zh) 基于人工智能的处理催收业务的方法、装置及存储介质
CN108509309A (zh) 一种基于访问日志进行性能监控的系统及方法
CN109492826A (zh) 一种基于机器学习的信息系统运行状态风险预测方法
CN102568147B (zh) 半导体设备软件故障报警方法
CN114267178A (zh) 一种车站的智能运营维护方法及装置
CN111832776A (zh) 一种机群维护的管理方法和系统
CN108306997B (zh) 域名解析监控方法及装置
CN113377559A (zh) 基于大数据的异常处理方法、装置、设备及存储介质
CN110673555A (zh) 一种基于mes系统的故障现象异常预警方法及系统
CN116258484A (zh) 设备的预测性运维方案生成方法、装置、终端设备和介质
CN113448808B (zh) 一种批处理任务中单任务时间的预测方法、系统及存储介质
CN112100024B (zh) 一种资源负载异常检测方法、装置及设备
CN109784524B (zh) 件量预测方法及装置、设备和存储介质
WO2020071949A1 (ru) Способ контроля работы газотурбинной установки
CN115342937A (zh) 温度异常检测方法及装置
CN111737086B (zh) 一种监控方式的调整方法、装置和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant