CN115484138B - 运维工具快速定制化开发方法与系统 - Google Patents

运维工具快速定制化开发方法与系统 Download PDF

Info

Publication number
CN115484138B
CN115484138B CN202211109726.XA CN202211109726A CN115484138B CN 115484138 B CN115484138 B CN 115484138B CN 202211109726 A CN202211109726 A CN 202211109726A CN 115484138 B CN115484138 B CN 115484138B
Authority
CN
China
Prior art keywords
data
maintenance
action
template
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211109726.XA
Other languages
English (en)
Other versions
CN115484138A (zh
Inventor
郭延西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202211109726.XA priority Critical patent/CN115484138B/zh
Publication of CN115484138A publication Critical patent/CN115484138A/zh
Application granted granted Critical
Publication of CN115484138B publication Critical patent/CN115484138B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/20Network management software packages

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种运维工具快速定制化开发方法,属于通信和计算机技术领域,本方法把网络运维工作抽象成运维动作和数据的组合,为了描述和调用方便,把运维动作进一步抽象成运维动作通用模板;当处理某类运维任务时,可以编排组合这些运维动作模板和数据,形成一个运维工作流程框架,然后对框架内的运维动作通用模板进行定制化配置或者低代码开发,把流程框架转换成完成该类任务的自动化运维工具。基于该方法可以设计具有基本数据管理、运维动作模板管理、编排、定制化开发等功能的系统,该系统可作为快速定制化开发运维工具的平台。

Description

运维工具快速定制化开发方法与系统
技术领域
本发明属于通信领域和计算机技术领域,涉及一种运维工具快速定制化开发方法与系统。
背景技术
在通信网络中,运维工作繁琐且有一定的技术复杂性,所以运维手段和工具非常重要。不同维护场景需要相应的不同的运维工具,比如处理故障告警的,处理用户投诉的,处理维护作业计划的,处理数据核查的等等,不一而同,导致在通信网络运维体系中,有大量的针对功能相对单一的网管系统。而随着网络和业务的复杂度增加,很多运维工作需要跨系统完成,效率较低,而针对某项运维工作的工具开发,不具有良好的可扩展性,且再开发涉及系统多,工作量大,不能及时响应需求。同时不同技术水平的人分析问题的思路和流程不同,高水平技术人员的运维经验也不能很好的沉淀到系统上。
发明内容
有鉴于此,本发明的目的在于提供一种快速定制化开发网络运维工具的方法,并依据该方法设计一套软件系统,让运维经验丰富的人可以快速在系统中定制化生成一个维护操作工具,来自动完成某一项维护工作任务,比如巡检路由器设备,处理用户投诉,处理设备严重告警等。让没有维护经验的人,可以调用已有的运维工具模板,实现专家经验的共享。
为达到上述目的,本发明提供如下技术方案:
一方面,本发明提供一种运维工具快速定制化开发方法,包括以下步骤:
S1:从现有各类运维工作流程抽象成两类基本对象:运维动作通用模板和运维动作操作的基本数据;
S2:两类基本对象可被复用、编排、组合,生成完成运维任务的基本工作流程框架;
S3:以定制化配置、低代码开发方式实例化运维动作通用模板,从而生成自动化完成任务的运维工具;
S4:保存所述自动化完成任务的运维工具为工具模板,以供将来直接调用。
进一步,步骤S1所述的运维动作通用模板和基本数据两类对象,可根据需要进行增加和删除,包括以下内容:
所述基本数据包括设备数据、指令数据、系统数据、指标数据、异常判断规则数据、决策规则数据;
所述运维动作包括采集设备数据动作、采集系统数据动作、数据计算动作、异常判断动作、数据汇总动作、智能决策动作、设备操作动作、生成报告动作;所述采集设备数据动作用于采集网络中需要维护的各类设备的数据;所述采集系统数据动作用于采集各类网管系统的数据;所述数据计算动作用于通过定制的计算公式对采集的数据进行计算,得到指标;所述异常判断动作用于将数据计算后的指标与指标异常判断规则进行对比,判断指标数据是否异常;所述数据汇总动作收集汇总各节点送来的数据,按一定模板输出;所述智能决策动作通过汇总数据和状态,根据决策规则,生成分析结论和操作建议;所述设备操作动作用于对设备进行相应的维护操作;所述生成报告动作根据预设模板生成包含数据、分析操作过程和结论的报告;将所述运维动作封装成标准的通用模板,通过配置或编辑其中的参数、命令、或脚本代码,实现模板的实例化,从而对具体设备、系统和数据进行对应操作。
进一步,步骤S2所述的运维任务的基本工作流程包括以下步骤:
S21:解析任务的关键信息;
S22:根据关键信息,设计分析模型或操作方案,确定该任务涉及的运维动作通用模板种类、数量,以及可能涉及的基本数据;
S23:对确定的所有运维动作通用模板命名,标识其需要完成的具体内容,并设置相应顺序,按顺序把命名后的运维动作通用模板排列组合在一起,形成完成该任务的工作流程框架。
进一步,步骤S3所述的以定制化配置、低代码开发方式实例化运维动作通用模板,从而生成自动化完成任务的运维工具,包括以下步骤:
S31:定制化配置每个运维动作通用模板;
S32:低代码开发解析脚本和解析规则,实例化解析子动作;
S33:定制化计算模型,根据采集数据动作采集到的数据,进行计算公式和计算结果的输出设计;
S34:定制化数据汇总,在已确定的运维动作通用模板中添加统一的数据接口和参数,把本动作涉及的数据发送至数据汇总动作模板;数据汇总动作模板中,根据上述已添加数据接口情况,设计汇总后的数据字段和输出格式;
S35:定制化决策分析,根据数据汇总输出的指标数据和逻辑状态,查找决策规则数据库中对应规则,输出分析/操作的结论和建议,如果查找不到,则添加汇总数据的标识并配置分析/操作结论和建议,并把汇总数据标识和对应结论构成的决策分析规则,存入决策规则数据库;决策分析模板中还包含智能决策算法,汇总数据和逻辑状态在进行决策判断的同时,输入到智能决策算法进行智能分析,并输出结论和建议,所述算法独立封装,可进行定制化算法替换。
进一步,步骤S3中,在实例化运维动作通用模板过程中,所涉及数据可以在对应数据库中查询选择,如果数据库中查询不到,则可直接在运维动作通用模板中配置,所配置数据可保存到对应数据库中,从而逐步完善数据库。
进一步,步骤S4中,已生成的运维工具可以保存为针对特定运维任务的工具模板,该模板可被调用,在调用过程中可重新定制化配置其中的任意数据和运维动作,以优化原有工具的性能。
另一方面,本发明提供一种运维工具快速定制化开发系统,所述运维工具快速定制化开发系统用于实现所述的运维工具快速定制化开发方法,包括数据库、运维动作模板库、系统数据采集模块、设备数据采集模块、数据计算模块、异常判断模块、数据汇总模块、智能决策模块、设备操作模块、报告生成模块和流程编排模块;
所述数据库内存储有设备数据、系统数据、指令数据、指标数据、异常判断规则数据、决策规则数据;
所述运维动作模板库,用于存储抽象出的各种运维动作通用模板;
所述系统数据采集模块用于采集各类网管系统的数据;
所述设备数据采集模块用于采集网络中需要维护的各类设备的数据;
所述数据计算模块用于通过定制的计算公式对采集的数据进行计算,得到指标;
所述异常判断模块用于将数据计算后的指标与指标异常判断规则进行对比,判断指标数据是否异常;
所述数据汇总模块用于收集汇总各节点送来的数据,按一定模板输出到智能决策模块;
所述智能决策模块用于通过汇总数据和状态,根据决策规则,生成分析结论和操作建议;
所述设备操作模块用于对设备进行相应的维护操作;
所述报告生成模块用于根据预设模板生成包含数据、分析过程和结论的报告;
所述流程编排模块用于对所述数据库、系统数据采集模块、设备数据采集模块、数据计算模块、异常判断模块、数据汇总模块、智能决策模块、设备操作模块、报告生成模块进行流程编排和内容修改,根据不同任务形成定制化的运维工具。
进一步,所述数据库包括设备数据库、系统数据库、指标及规则数据库、决策规则库,其中:
所述设备数据库包括网络中需要维护的各类设备,每个设备可看作一个对象,包含各个属性变量,还包括多个操作指令及指令结果的解析规则,包括设备名称、类型、厂家、管理IP、多个性能指标及与其相关的操作指令;性能指标包括CPU利用率、内存利用率、峰值会话数、峰值流量、注册用户数、签约速率;所述操作指令与性能指标是一对多关系,与解析规则是一对一关系;
所述系统数据库中包含有各类网管系统,用于获取任务信息、指标数据时访问,所述网管系统通过查询接口传递需要查询的数据指标,所述网管系统包括若干属性变量、可提供查询的指标、每个指标对应具体的查询接口;
所述指标及规则数据库内包括每一个指标在不同分析模型下的计算公式和异常判断规则,所述分析模型包括阈值比较、同期对比、同类型设备的横向对比、系统与设备间对比、与同设备下平均值比较;
所述决策规则库内包括决策分析的规则,每一条决策规则包含任务类型、任务关键信息、指标和状态列表、可忽略的指标、分析结论和操作建议;所述可忽略的指标用于在匹配规则时,不考虑该指标异常状态,用于筛除影响较小的指标。
进一步,所述智能决策模块包括常规决策和智能决策,所述常规决策为通过对比决策规则表的对应规则,输出分析结论和操作建议,如果决策规则表中无此规则,则进行规则增加;所述智能决策为把汇总后的数据送入智能决策算法,自动生成分析结论和操作建议,智能算法为独立封装,可根据需要替换。
进一步,所述流程编排模块根据任务定制化的修改流程中的参数、命令脚本或者判断规则,以满足使用者的需求和使用习惯,并将生成的运维工具存储为工具模板,当这个工具模板被调用的时候,也允许调用的人根据需要修改其中的内容,从而不断优化分析/操作过程,提升工具性能。
本发明的有益效果在于:本发明描述的运维工具定制化开发方法和系统,为维护人员提供了一种自主定制开发运维工具的环境,通过编辑指标、算法、规则,定制化数据和运维动作模板,把自己的工作思路,转换成自动化的流程,极大提高了处理问题的工作效率。同时不再每次开发新工具都要和开发人员沟通需求,也提升了工具开发的效率。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为运维工作流程框架图;
图2为基本运维流程框架模板;
图3为运维工具中数据与动作间的调用关系图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
请参阅图1,本发明提供一种运维工具快速定制化开发方法,实现运维工具灵活定制化开发的前提,是先抽象出运维工作的共性,这些共性就是运维工作的基础流程框架,再据此设计出定制化开发运维系统的功能框架即可。不管是设备巡检还是投诉处理,或是其他工作,梳理下来大致都是如下流程:
流程节点1:解析任务的关键信息,接收到任务后,需要分析任务的关键信息,比如收到一个投诉需要处理,需要去登录到投诉管理系统,根据工单编号把这个投诉的工单内容查询出来,然后根据解析规则进行解析,获得号码、时间、投诉现象、区域等关键字段,送入下一流程。这里涉及的动作有:
a)登录某个系统。
b)执行查询指令,获取详细内容,
c)查询到的内容送入解析模块,获取关键信息。
流程节点2:设计分析模型并选定分析指标。根据节点1传递过来的关键信息,确定分析哪些数据;这些数据在哪些设备或系统上可以查询到;每一个数据间是否有先后顺序,这里涉及到的动作有:
a)输入或在指标库里选择某个指标。
b)输入或选择分析该指标的分析模型,如与上周同期比较、与阈值比较、不同设备间一致性比较、与同设备下平均值比较等等。
c)为不同指标的分析顺序赋值,默认顺序相同。
流程节点3:根据节点2确定的指标、查询顺序和分析模型,登录顺序第一的指标对应的设备或系统,执行相应的查询命令,如果获取得到的是指标字段,把对应字段数据传入下一节点,如果得到的是命令响应描述文本,则送入解析模块,解析出对应的指标字段。涉及到的动作有:
a)按指标的顺序编号,相同的划分为一组,数字小的优先查询,从第1组开始。
b)登录某个设备或系统。
c)执行查询指令,获取详细内容。
d)查询到的内容送入解析模块,获取指标数据。
e)同序号的指标,可以同时查询,也就是并行执行几个b-d的动作。
f)把所有查询到指标数据,传送到下一节点。
流程节点4:根据节点3传递过来的指标数据和分析模型,与指标规则库比较,判断指标是否正常,如果正常,则重复节点3与4。如果异常,则把已获取的指标数据全部送到下一节点。涉及到的动作有:
a)分析收到的指标数据和分析模型,
b)根据分析模型计算对比数据
c)查询指标规则库,判断是否正常。
d)对于指标判断正常,则返回节点3,查询第2组指标。
流程节点5:根据节点4传递过来的指标数据和异常状态,可根据智能决策库相应规则得到本次任务的结论,当智能决策模块中无相应的规则时,可以提供输入结论,并保存到智能决策库中。涉及到的动作有:
a)把指标数据整理,以任务名+指标集+异常判断状态,输入智能决策模块中。
b)智能决策模块,根据相应规则,输出分析结论和操作建议。
c)对未找到规则的数据集,可人工输入分析结论和操作建议,并存入决策模块的规则库中。
d)智能决策模块设计智能算法,对每次输入进来的数据集进行智能分析,并输出结论和建议。
e)每一个任务+指标+状态的数据集和结论,均作为训练数据,送给智能决策算法,以辅助智能决策算法更加智能。
流程节点6:根据流程节点5的分析结论和操作建议,设计设备操作方案和步骤,以便解决前述问题。
综合上述的工作流程分析,快速开发运维工具的方法,就是在抽象出运维工作流程的逻辑流程基础上,进而抽象出两类基础对象,一是维护基本的配置数据,供用户选择使用;二是维护基本的运维动作通用模板,可编排生成新的工作流程。需要维护的基本配置数据库有:设备数据库、系统数据库、指标及规则数据库、决策规则库等等;需要维护的基本动作有:采集设备数据、采集系统数据、数据计算、异常判断、数据汇总、智能决策、设备操作、生成报告等,当然这些动作可继续分解成子动作,以支持每个基本动作的定制化。所述工具开发平台最主要的功能就是通过编排组合运维动作模板、配置数据和定制化配置开发,实现运维工作流程的自动化。
(1)主要维护的基础数据库有:设备数据库、系统数据库、指标及规则数据库、决策规则库等。
设备数据库:包括了网络中需要维护的各类设备,每个设备可看作一个对象,包括各个属性变量,还包括多个指令函数及指令结果的解析规则,如设备名称、类型、厂家、管理IP、若干性能指标(CPU利用率、内存利用率、峰值会话数、峰值流量等)、若干操作指令(每条操作指令与性能指标是一对多关系,与解析规则是一对一关系)。设备数据库支持增删修改等操作。
系统数据库:包括了获取任务信息、指标数据需要访问的各类网管系统,为了实现简单,所述工具开发平台并不登录系统去查询访问数据,而是与每个系统协商确定接口规范,通过查询接口传递需要查询的数据指标,系统完成查询后把指标数据反馈给工具平台。系统还有若干属性变量,如系统名称、系统功能描述、业务IP等,还罗列出可提供查询的指标,每个指标需对应具体的查询接口。系统、接口及所列指标均支持增删修改等操作。
指标及规则数据库:每一个指标,在不同分析模型下的计算公式和异常判断规则,这里的分析模型主要是:阈值对比、同期对比、同类型设备的横向对比、系统与设备间对比、与同设备下平均值比较等等。如防火墙设备的峰值会话连接数,与阈值比较达到90%,认为异常;用户上网速率在系统上与UDM中签约速率比较,幅度超过50%,认为异常;在同一局域网内的交换机的内存利用率指标,如果不同交换机设备间差异超过30%,认为异常。每一条指标和规则均支持增删修改等操作。
决策规则库:在所有的分析过程结束后,把分析过程中用到指标数据或设备状态,汇总到一起,进行决策分析,定位问题和给出操作建议。每一条决策规则包含任务类型、任务关键信息、指标和状态列表、可忽略的指标、分析结论和操作建议。可忽略的指标字段,主要用来在匹配规则时,不考虑该指标异常状态,用于筛除影响较小的指标,以减少总的决策规则。每条决策规则均支持增删修改等操作。
(2)主要维护的基本动作数据库有:采集系统数据、采集设备数据、数据计算、异常判断、智能决策、设备操作、生成报告等。
采集系统数据,作为运维工作的一个基本动作,实现工具到系统内采集数据的过程。包括两个子动作,一是调用系统接口,二是解析系统返回数据。调用系统接口时,可以手工完成接口参数的修改和增加,同步会完成解析规则的修改,从而实现定制化的系统数据采集。
采集设备数据,与采集系统数据相似的基本动作,实现工具到设备上采集数据的过程。包括三个子动作,一是登录设备,二是执行采集数据所需的指令,但是解析指令响应结果。每个子动作的对应参数均可进行修改,以实现定制化的设备数据采集
数据计算,是针对采集回来的数据,以一定的计算公式完成数据的计算,并输出计算结果,这里的计算公式,可进行修改,从而实现定制化的数据处理。
异常判断,是针对数据计算后的指标,通过与指标异常判断规则对比,判断指标数据是否异常。这个动作可以根据需要判断一个或同时判断若干个指标。这个动作执行过程中,如果在指标规则表中没有匹配的规则,则可跳转到相应的规则增删过程。
数据汇总,该动作主要是收集汇总各节点送来的数据,按一定模板输出到智能决策节点。该节点定义了统一的接口规范,每个分析过程都可通过接口把需要的数据送过来;
智能决策,通过汇总数据和状态,根据决策规则,生成分析结论和操作建议。这个基本动作包括两个子动作,一是常规决策,通过对比决策规则表的对应规则,输出分析结论和操作建议,如果决策规则表中无此规则,可跳转到规则增删过程;二是智能决策,把汇总后的数据送入智能决策算法,自动生成分析结论和操作建议,该操作建议可进行修改,以辅助进行算法训练。
设备操作,根据决策的解决问题的操作建议,对设备下达相应的指令,进行相应的维护操作。如设备主备倒换、关闭某个端口、清除设备缓存、配置路由数据等等,
生成报告,为了方便查看分析/操作过程,可以根据预设模板生成包含数据、分析/操作过程和结论的报告。
(3)流程编排
工具定制化开发平台的核心,就是在实现了上述基础数据和基本动作模板的配置准备后,通过对数据和动作的灵活编排,生成针对某项运维任务的工具,当然在编排的过程中,需要根据运维任务定制化配置修改流程中的参数、命令、解析脚本或者判断规则,生成自动处理任务的运维工具,以满足使用者的需求和使用习惯。同时生成的运维工具会以模板形式存储下来,当这个工具模板被调用的时候,也允许调用的人修改其中的内容,从而不断优化分析/操作过程和结论。这样的设计不仅可高效开发运维工具,还促进专家经验的沉淀和共享。
在本实施例中,以一个投诉处理过程,描述定制化生成运维工具的流程步骤,如图2-3所示。
步骤1:新增一个运维工具,定义类型和名称,标识一个特定的运维工具,如投诉_网速慢_手机。
步骤2:打开基本运维流程框架模板,根据网速慢投诉处理的过程,通过增减、命名、编排组合运维动作模板,形成投诉网速慢处理运维流程框架。包含采集该投诉工单的关键信息;采集数据中台用户当前速率,采集UDM设备签约速率,采集PCF用户策略及限制速率,数据处理,异常判断,采集同UPF设备其他用户速率,采集同小区其他用户速率,采集同小区同终端型号其他用户速率,数据处理,异常判断,智能决策,设备操作,生成报告等运维动作模板。
步骤3:定制化每个运维动作模板。
A1:解析任务的关键信息,包括一下两个步骤
A11:新增运维工具,定义类型和名称,标识一个特定的运维工具;
A12:在任务分析中,如果任务比较复杂,来自某个系统,则需要定制化“采集系统数据”运维动作,其包含“调用系统接口”和“解析数据”两个子动作;修改“调用系统接口”动作中的相应参数,去获取系统相应任务数据;取到的数据送入子动作“解析数据”,通过修改解析规则和输出参数得到任务的关键信息;
A2:执行步骤A1,在运行结果区,展示当前关键信息,设计分析模型,在基本的运维工作流程框架中,通过增减、命名、编排运维动作模板,生成针对该任务的运维工作流程模板。可以分为以下步骤:
A21:在基本的运维工作流程框架中,根据分析模型和顺序,在采集数据动作模板前后增加并行或串行的采集数据动作模板,或者在采集数据、数据处理、异常判断动作模板组合的前后添加组合动作,可并行也可串行。
A22:如果任务类型是设备操作类型的,则可以是若干设备操作动作模板和异常判断的组合,即执行设备命令和解析判断执行结果。
A23:任务类型也可以是分析类型的,只需要通过分析数据得到问题原因,不执行设备操作去解决问题。则不需要设备操作动作模板。
A22:设计后的运维工作流程模板,包括以下一个或若干个采集设备数据动作模板、采集系统数据动作模板、数据计算动作模板、异常判断动作模板、数据汇总动作模板、智能决策动作模板、设备操作动作模板、生成报告动作模板的组合
A3:实例化“采集系统数据动作模板”,修改名字为“采集-系统名-指标名”;将子动作“系统接口调用”修改名字为“系统名_指标名_接口”,修改其中的参数;将取到的数据送入子动作“解析模块”,修改名字为“系统名_指标名_解析规则”,修改解析规则和输出参数;将修改后的动作名称存入系统数据库;
A4:实例化“采集设备数据动作模板”,修改名字为“采集-设备名-指标名”;将子动作“登录设备”修改名字为“设备名_登录”,修改其中的参数;将子动作“查询指令”修改名字为“设备名_指标名_查询”;将取到的数据送入子动作“解析模块”,修改名字为“设备名_指标名_解析规则”,修改解析规则和输出参数;将修改后的动作名称存入设备数据库;
A5:实例化“数据处理动作模板”,根据设计的分析模型和前述A3/A4采集到的数据,修改成具体指标数据的计算公式,对采集的数据进行计算,并设计输出参数;
A6:实例化“异常判断动作模板”,把步骤A5的计算结果输入异常判断逻辑中,同时在指标判断规则表中读取该指标规则,进行逻辑判断,如果指标规则表中无此指标规则,则人工输入该数据并保存;如果输出结果为异常,则进行智能决策动作;如果输出结果为正常,则进行智能决策动作,或者进行新一轮数据采集、处理、判断过程;
A7:实例化“数据汇总动作模板”,把每个运维动作模板采集的数据或判断状态送到数据汇总动作模板,并按照一定的模板输出;
A71:设计统一的数据接口,在每个运维动作模板中,根据需要添加统一数据接口,以便把该动作采集的数据或判断状态送到数据汇总动作模板;
A72:在数据汇总动作模板,设计数据汇总涉及的字段和格式,并设计输出模板,按照设计的模板提供给决策分析动作模板;
A8:实例化“决策分析动作模板”,将数据汇总后的分析指标数据及异常判断结果输入决策分析动作,所述决策分析动作分为常规决策和智能决策两个模块分别处理,常规决策模块通过匹配决策规则库中的相应规则,输出分析结论和操作建议,通过人工修改、保存;对于未找到规则的数据集,通过人工输入分析结论和操作建议,并存入决策模块的规则库中;智能决策模块利用智能算法对每次输入进来的数据集进行智能分析,并输出结论和建议,结果可人工修改并反馈给智能决策算法进行训练学习和优化;
A9:在生成报告动作中,根据预设模板生成包含数据、分析过程和结论的报告。
在本实施例中,定制运维动作模板包括以下步骤:
1)定制化采集投诉工单的关键信息动作模板。该动作模板又包含“调用系统接口”和“解析”两个子动作。修改并调用投诉管理系统接口,配置投诉工单ID等参数,去获取投诉管理系统相应ID的工单数据;取到的数据送入子动作“解析数据”,编辑修改解析脚本规则和输出参数得到任务的关键信息:用户号码、投诉时间、投诉现象、投诉区域等。
2)定制化采集数据中台用户当前速率动作模板。修改子动作“系统接口调用”,修改名字为“数据中台_性能数据_接口调用”,修改其中的相应参数为:号码、上下行速率、小区、终端型号、UPF、UDM、PCF等;对取到的数据送入子动作“解析模块”,修改名字为“数据中台_用户性能设备_解析规则”,修改解析规则和输出参数。上述修改后的动作名称,存入系统数据库。
3)定制化采集UDM设备签约速率动作模板。修改子动作“登录设备”,修改名字为“UDM_登录”,修改其中的相应IP、账号密码等参数;修改子动作“查询指令”,修改名字为“UDM_签约速率_查询”,并修改指令参数;对取到的数据送入子动作“解析模块”,修改名字为“UDM_签约速率_解析规则”,修改解析规则和输出参数。上述修改后的动作名称,存入设备数据库。
4)定制化采集PCF用户策略及限制速率动作模板。修改子动作“登录设备”,修改名字为“PCF_登录”,修改其中的相应IP、账号密码等参数;修改子动作“查询指令”,修改名字为“PCF_限制速率_查询”,并修改指令参数;对取到的数据送入子动作“解析模块”,修改名字为“PCF_限制速率_解析规则”,修改解析规则和输出参数。上述修改后的动作名称,存入设备数据库。
5)定制化数据处理动作模板。根据上述采集到的数据,编辑计算模型中的公式和输出参数,该计算公式修改为“用户速率_签约_对比”,“用户速率_限速_对比”,可存入指标及规则数据库。
6)定制化异常判断动作模板。对上述计算后的数据,编辑设置异常判断逻辑,超过30%为异常,分别修改为“用户速率_签约_对比_异常规则”,“用户速率_限速_对比_异常规则”,可存入指标及规则数据库。
7)定制化采集同小区其他用户速率动作模板。修改子动作“系统接口调用”,修改名字为“数据中台_性能数据_接口调用”,修改其中的相应参数为:号码、上下行速率、小区、平均速率(不含给定号码)等;对取到的数据送入子动作“解析模块”,修改解析规则和输出参数。上述修改后的动作名称,存入系统数据库。采集同UPF设备其他用户速率,采集同小区同终端型号其他用户速率两个动作模板定制化相似,不再赘述。
8)定制化智能决策动作模板。以“用户速率_签约_对比_异常规则”数据和异常状态为例,决策规则为当用户速率和签约速率差异小于30%时,认为时签约速率存在问题,需要更改用户的签约速率数据,修改后需要用户重新注册生效,操作建议为辅助用户重新注册。
9)定制化数据汇总动作模板,在采集数据和异常判断动作模板中添加数据接口,配置接口参数,把相应的数据和状态,送到数据汇总模块;在数据汇总动作模板配置接收数据的接口,并设计汇总后的数据格式,输出给决策动作模板。
10)根据智能决策的操作建议,定制化设备操作动作模板。这里包含两个动作模板,一是修改子动作“登录设备”为“UDM_登录”,修改子动作“指令”名字为“UDM_签约速率_配置”,并修改指令参数;二是修改子动作“登录设备”为“AMF_登录”,修改相关登录参数,修改子动作“指令”名字为“辅助_用户重注册”,并修改指令参数;相应子动作可存入设备数据库。
步骤4:在定制化动作模板完成后,就完成了运维工具的定制化开发,可自动运行完成该投诉现象的处理,实现了重复运维工作的自动化替换。同时该工具模板可保存在运维工具模板库中,供后续调用和优化。
需要说明的是:
(1)上述采集数据、数据处理、异常判断等动作模板的增减操作,在采集数据模板前后,可增加采集数据模板,可并行也可串行。也可在异常判断节点后,增加采集数据、数据处理、异常判断等动作模板的组合动作,也就是完成一组数据的判断后,再进行下一组数据的判断过程。
(2)在上述运维动作模板定制化过程中,所需配置的数据和规则既可在已有数据库中选择使用,也可以手工配置添加后存入数据库中。
(3)在“决策分析”动作模板中,分为常规决策和智能决策两个模块分别处理,常规决策去匹配决策规则库中的相应规则,输出分析结论和操作建议,可人工修改、保存,对未找到规则的数据集,可人工输入分析结论和操作建议,并存入决策模块的规则库中。智能决策模块,利用智能算法对每次输入进来的数据集进行智能分析,并输出结论和建议,结果可人工修改并反馈给智能算法,不断优化算法。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (7)

1.一种运维工具快速定制化开发方法,其特征在于:包括以下步骤:
S1:从现有各类运维工作流程抽象成两类基本对象:运维动作通用模板和运维动作操作的基本数据;
S2:两类基本对象可被复用、编排、组合,生成完成运维任务的基本工作流程框架;
S3:以定制化配置、低代码开发方式实例化运维动作通用模板,从而生成自动化完成任务的运维工具;
S4:保存所述自动化完成任务的运维工具为工具模板,以供将来直接调用;
步骤S1所述的运维动作通用模板和基本数据两类对象,可根据需要进行增加和删除,包括以下内容:
所述基本数据包括设备数据、指令数据、系统数据、指标数据、异常判断规则数据、决策规则数据;
所述运维动作包括采集设备数据动作、采集系统数据动作、数据计算动作、异常判断动作、数据汇总动作、智能决策动作、设备操作动作、生成报告动作;所述采集设备数据动作用于采集网络中需要维护的各类设备的数据;所述采集系统数据动作用于采集各类网管系统的数据;所述数据计算动作用于通过定制的计算公式对采集的数据进行计算,得到指标;所述异常判断动作用于将数据计算后的指标与指标异常判断规则进行对比,判断指标数据是否异常;所述数据汇总动作收集汇总各节点送来的数据,按一定模板输出;所述智能决策动作通过汇总数据和状态,根据决策规则,生成分析结论和操作建议;所述设备操作动作用于对设备进行相应的维护操作;所述生成报告动作根据预设模板生成包含数据、分析操作过程和结论的报告;将所述运维动作封装成标准的通用模板,通过配置或编辑其中的参数、命令、或脚本代码,实现模板的实例化,从而对具体设备、系统和数据进行对应操作;
步骤S2所述的生成完成运维任务的基本工作流程框架包括以下步骤:
S21:解析任务的关键信息;
S22:根据关键信息,设计分析模型或操作方案,确定该任务涉及的运维动作通用模板种类、数量,以及可能涉及的基本数据;
S23:对确定的所有运维动作通用模板命名,标识其需要完成的具体内容,并设置相应顺序,按顺序把命名后的运维动作通用模板排列组合在一起,形成完成该任务的工作流程框架;
步骤S3所述的以定制化配置、低代码开发方式实例化运维动作通用模板,从而生成自动化完成任务的运维工具,包括以下步骤:
S31:定制化配置每个运维动作通用模板;
S32:低代码开发解析脚本和解析规则,实例化解析子动作;
S33:定制化计算模型,根据采集到的数据,进行计算公式和计算结果的输出设计;
S34:定制化数据汇总,在已确定的运维动作通用模板中添加统一的数据接口和参数,把本动作涉及的数据发送至数据汇总动作模板;数据汇总动作模板中,根据已添加数据接口情况,设计汇总后的数据字段和输出格式;
S35:定制化决策分析,根据数据汇总输出的指标数据和逻辑状态,查找决策规则数据库中对应规则,输出分析/操作的结论和建议,如果查找不到,则添加汇总数据的标识并配置分析/操作结论和建议,并把汇总数据标识和对应结论构成的决策分析规则,存入决策规则数据库;决策分析规则中还包含智能决策算法,汇总数据和逻辑状态在进行决策判断的同时,输入到智能决策算法进行智能分析,并输出结论和建议,所述算法独立封装,可进行定制化算法替换。
2.根据权利要求1所述的运维工具快速定制化开发方法,其特征在于:步骤S3中,在实例化运维动作通用模板过程中,所涉及数据可以在对应数据库中查询选择,如果数据库中查询不到,则可直接在运维动作通用模板中配置,所配置数据可保存到对应数据库中,从而逐步完善数据库。
3.根据权利要求1所述的运维工具快速定制化开发方法,其特征在于:步骤S4中,已生成的运维工具可以保存为针对特定运维任务的工具模板,该模板可被调用,在调用过程中可重新定制化配置其中的任意数据和运维动作,以优化原有工具的性能。
4.一种运维工具快速定制化开发系统,所述运维工具快速定制化开发系统用于实现权利要求1所述的运维工具快速定制化开发方法,其特征在于:包括数据库、运维动作模板库、系统数据采集模块、设备数据采集模块、数据计算模块、异常判断模块、数据汇总模块、智能决策模块、设备操作模块、报告生成模块和流程编排模块;
所述数据库内存储有设备数据、系统数据、指令数据、指标数据、异常判断规则数据、决策规则数据;
所述运维动作模板库,用于存储抽象出的各种运维动作通用模板;
所述系统数据采集模块用于采集各类网管系统的数据;
所述设备数据采集模块用于采集网络中需要维护的各类设备的数据;
所述数据计算模块用于通过定制的计算公式对采集的数据进行计算,得到指标;
所述异常判断模块用于将数据计算后的指标与指标异常判断规则进行对比,判断指标数据是否异常;
所述数据汇总模块用于收集汇总各节点送来的数据,按一定模板输出到智能决策模块;
所述智能决策模块用于通过汇总数据和状态,根据决策规则,生成分析结论和操作建议;
所述设备操作模块用于对设备进行相应的维护操作;
所述报告生成模块用于根据预设模板生成包含数据、分析过程和结论的报告;
所述流程编排模块用于对所述数据库、系统数据采集模块、设备数据采集模块、数据计算模块、异常判断模块、数据汇总模块、智能决策模块、设备操作模块、报告生成模块进行流程编排和内容修改,根据不同任务形成定制化的运维工具。
5.根据权利要求4所述的运维工具快速定制化开发系统,其特征在于:所述数据库包括设备数据库、系统数据库、指标及规则数据库、决策规则库,其中:
所述设备数据库包括网络中需要维护的各类设备,每个设备可看作一个对象,包含各个属性变量,还包括多个操作指令函数及指令结果的解析规则,包括设备名称、类型、厂家、管理IP、多个性能指标及与其相关的操作指令;性能指标包括CPU利用率、内存利用率、峰值会话数、峰值流量、注册用户数、签约速率;所述操作指令与性能指标是一对多关系,与解析规则是一对一关系;
所述系统数据库中包含有各类网管系统,用于获取任务信息、指标数据时访问,所述网管系统通过查询接口传递需要查询的数据指标,所述网管系统包括若干属性变量、可提供查询的指标、每个指标对应具体的查询接口;
所述指标及规则数据库内包括每一个指标在不同分析模型下的计算公式和异常判断规则,所述分析模型包括阈值比较、同期对比、同类型设备的横向对比、系统与设备间对比、与同设备下平均值比较;
所述决策规则库内包括决策分析的规则,每一条决策规则包含任务类型、任务关键信息、指标和状态列表、可忽略的指标、分析结论和操作建议;所述可忽略的指标用于在匹配规则时,不考虑该指标异常状态,用于筛除影响较小的指标。
6.根据权利要求4所述的运维工具快速定制化开发系统,其特征在于:所述智能决策模块包括常规决策和智能决策,所述常规决策为通过对比决策规则表的对应规则,输出分析结论和操作建议,如果决策规则表中无此规则,则进行规则增加;所述智能决策为把汇总后的数据送入智能决策算法,自动生成分析结论和操作建议,智能算法为独立封装,可根据需要替换。
7.根据权利要求4所述的运维工具快速定制化开发系统,其特征在于:所述流程编排模块根据任务定制化的修改流程中的参数、命令脚本或者判断规则,以满足使用者的需求和使用习惯,并将生成的运维工具存储为工具模板,当这个工具模板被调用的时候,也允许调用的人根据需要修改其中的内容,从而不断优化分析/操作过程,提升工具性能。
CN202211109726.XA 2022-09-13 2022-09-13 运维工具快速定制化开发方法与系统 Active CN115484138B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211109726.XA CN115484138B (zh) 2022-09-13 2022-09-13 运维工具快速定制化开发方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211109726.XA CN115484138B (zh) 2022-09-13 2022-09-13 运维工具快速定制化开发方法与系统

Publications (2)

Publication Number Publication Date
CN115484138A CN115484138A (zh) 2022-12-16
CN115484138B true CN115484138B (zh) 2023-03-21

Family

ID=84423567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211109726.XA Active CN115484138B (zh) 2022-09-13 2022-09-13 运维工具快速定制化开发方法与系统

Country Status (1)

Country Link
CN (1) CN115484138B (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110428127B (zh) * 2019-06-19 2022-04-15 深圳壹账通智能科技有限公司 自动化分析方法、用户设备、存储介质及装置
CN110430073B (zh) * 2019-07-30 2022-06-21 中国工程物理研究院计算机应用研究所 一种基于抽象业务原子操作的异构系统自动化运维方法
CN113849244B (zh) * 2021-09-13 2024-01-12 广州咨元信息科技有限公司 一种基于编排引擎实现自定义业务场景的配置方法
CN114662944A (zh) * 2022-03-28 2022-06-24 阿里巴巴(中国)有限公司 运维机器人管控系统、运维任务管理方法及相关装置

Also Published As

Publication number Publication date
CN115484138A (zh) 2022-12-16

Similar Documents

Publication Publication Date Title
CN110198237B (zh) 一种无线意图驱动网络的配置方法
US6411922B1 (en) Problem modeling in resource optimization
CN107864174B (zh) 一种基于规则的物联网设备联动方法
CN107957992B (zh) 一种用户反馈信息的自动处理方法及系统
WO2017041406A1 (zh) 一种故障定位方法及装置
EP2186025B1 (en) Configuring of intelligent electronic device
CN102724079B (zh) 一种以太网设备辅助配置的方法及系统
WO1998024222A2 (en) Software fault management system
CN109660377A (zh) 统一配置管理方法、业务服务器及操作维护管理平台
CN111782890A (zh) 一种装备状态分析与管理系统
CN108365969B (zh) 一种基于无线传感网的自适应服务组合方法
CN109190008A (zh) 自动化运维管理方法
CN107911251A (zh) 一种网络设备配置方法、装置和介质
CN110322143B (zh) 模型实体化管理方法、装置、设备及计算机存储介质
CN114026838A (zh) 用于工作负载路由的智能容量
CN112543170A (zh) 软件定义广域网管理方法、装置和系统、存储介质
CN115484138B (zh) 运维工具快速定制化开发方法与系统
Chen et al. Complex event processing using simple rule-based event correlation engines for business performance management
CN109033483A (zh) 一种在yang模型中定义数据关系的方法、装置及系统
CN111917592A (zh) 一种异构品牌网络设备的集中操作方法及装置
CN113627613B (zh) 一种实现边端协同的规则推理方法
CN115934097A (zh) 生成可执行语句的方法、装置、存储介质及电子装置
CN115695280A (zh) 基于边缘节点的路由方法及装置、电子设备、存储介质
CN110908642A (zh) 一种策略生成执行方法和装置
CN115599881A (zh) 工作流创建方法、系统、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant