CN115086148B - 光网络告警处理方法、系统、设备及存储介质 - Google Patents

光网络告警处理方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN115086148B
CN115086148B CN202210836895.7A CN202210836895A CN115086148B CN 115086148 B CN115086148 B CN 115086148B CN 202210836895 A CN202210836895 A CN 202210836895A CN 115086148 B CN115086148 B CN 115086148B
Authority
CN
China
Prior art keywords
alarm
data
network
optical network
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210836895.7A
Other languages
English (en)
Other versions
CN115086148A (zh
Inventor
刘言
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202210836895.7A priority Critical patent/CN115086148B/zh
Publication of CN115086148A publication Critical patent/CN115086148A/zh
Application granted granted Critical
Publication of CN115086148B publication Critical patent/CN115086148B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种光网络告警处理方法、系统、设备及存储介质,所述方法包括步骤:服务器从多个光网络设备中获取由多类数据组成的关联数据集;服务器基于所述关联数据集中的至少一类数据,进行第一次分析,得到第一分析结果;服务器基于所述第一分析结果和所述关联数据集中的至少一类数据,进行第二次分析,得到第二分析结果;所述第二分析结果用于确定告警根因;以及服务器获取备用网络资源,并基于所述告警根因和所述备用网络资源,生成处理数据并输出;所述处理数据用于处理所述告警信息;本发明不仅能准确定位根因告警,而且实现结合网络现有资源情况自动化维护操作或给出解决建议,利于快速解决告警,从而利于提高网络运维效率。

Description

光网络告警处理方法、系统、设备及存储介质
技术领域
本发明涉及通信设备运维技术领域,具体地说,涉及一种光网络告警处理方法、系统、设备及存储介质。
背景技术
随着5G网络的逐步商业化,服务变得越来越复杂和多样化,技术的复杂性呈指数级增长。这些挑战使得网络运行和维护变得愈加困难,维护人员必须面对各种光网络设备(比如SDH、OTN等光传输设备)产生的大量实时数据和历史数据。
现有的网络管理系统的技术手段缺乏告警根因分析应用流程,无法准确定位网络告警根源,难以为维护人员提供足够的支持,许多问题无法快速响应解决,导致故障扩散升级,最终影响到客户体验。并且,无法结合根因分析结果及网络现有资源情况,自动化地进行实时问题分析、现网维护策略等决策操作。
发明内容
针对现有技术中的问题,本发明的目的在于提供一种光网络告警处理方法、系统、设备及存储介质,解决现有技术无法准确定位告警根因,以及无法结合网络现有资源情况快速解决告警的问题。
为实现上述目的,本发明提供了一种光网络告警处理方法,所述方法包括以下步骤:
服务器从多个光网络设备中获取由多类数据组成的关联数据集;所述关联数据集包括告警信息;
服务器基于所述关联数据集中的至少一类数据,进行第一次分析,得到第一分析结果;
服务器基于所述第一分析结果和所述关联数据集中的至少一类数据,进行第二次分析,得到第二分析结果;所述第二分析结果用于确定告警根因;以及
服务器获取备用网络资源,并基于所述告警根因和所述备用网络资源,生成处理数据并输出;所述处理数据用于处理所述告警信息。
可选地,所述服务器获取备用网络资源,并基于所述告警根因和所述备用网络资源,生成处理数据并输出,包括:
当所述备用网络资源满足预设条件时,所述服务器生成自动化控制指令,并控制与所述告警根因对应的所述光网络设备执行所述自动化控制指令;
当所述备用网络资源不满足预设条件时,所述服务器生成运维提示信息并输出;所述运维提示信息用于提示人工介入处理。
可选地,所述服务器获取备用网络资源,并基于所述告警根因和所述备用网络资源,生成处理数据并输出,包括:
当所述备用网络资源满足预设条件时,基于所述自动化控制指令启用所述备用网络资源。
可选地,所述服务器获取备用网络资源,并基于所述告警根因和所述备用网络资源,生成处理数据并输出,包括:
所述服务器获取所述告警根因关联的光网络设备数量,作为第一数量;以及获取所述备用网络资源具有的光网络设备数量,作为第二数量;
当所述第二数量大于等于所述第一数量时,确定所述备用网络资源满足预设条件;
否则确定所述备用网络资源不满足预设条件。
可选地,所述方法包括:
服务器基于所述关联数据集中的网络拓扑信息、网元信息以及所述告警信息,进行第一次分析,得到第一分析结果;
服务器基于所述第一分析结果和所述关联数据集中的全部数据,进行第二次分析,得到第二分析结果;所述第二分析结果用于确定告警根因。
可选地,所述第一分析结果为各个告警信息之间的关联度。
可选地,所述服务器基于所述关联数据集中的至少一类数据,进行第一次分析,得到第一分析结果,包括:
服务器获取与所述光网络设备连接的对端设备的网元信息,作为对端网元信息;
服务器基于所述对端网元信息,计算所述告警信息之间的关联度。
可选地,所述服务器基于所述第一分析结果和所述关联数据集中的至少一类数据,进行第二次分析,得到第二分析结果,包括:
所述服务器将所述第一分析结果和所述关联数据集中的全部数据,作为预设计算模型的输入,获得各个告警信息对应的概率;
所述服务器将概率最大的告警信息,作为目标告警信息;
所述服务器基于所述目标告警信息,确定告警根因。
可选地,所述关联数据集还包括网络拓扑信息、网元信息、性能数据以及日志数据。
本发明还提供了一种光网络告警处理系统,用于实现上述光网络告警处理方法,所述系统包括:
数据采集模块,服务器从多个光网络设备中获取由多类数据组成的关联数据集;所述关联数据集包括告警信息;
告警关联分析模块,服务器基于所述关联数据集中的至少一类数据,进行第一次分析,得到第一分析结果;
根因分析模块,服务器基于所述第一分析结果和所述关联数据集中的至少一类数据,进行第二次分析,得到第二分析结果;所述第二分析结果用于确定告警根因;以及
决策模块,服务器获取备用网络资源,并基于所述告警根因和所述备用网络资源,生成处理数据并输出;所述处理数据用于处理所述告警信息。
本发明还提供了一种光网络告警处理设备,包括:
处理器;
存储器,其中存储有所述处理器的可执行程序;
其中,所述处理器配置为经由执行所述可执行程序来执行上述任意一项光网络告警处理方法的步骤。
本发明还提供了一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现上述任意一项光网络告警处理方法的步骤。
本发明与现有技术相比,具有以下优点及突出性效果:
本发明提供的光网络告警处理方法、系统、设备及存储介质通过第一次分析确定各个告警信息之间的关联度,然后利用关联度和所有采集数据第二次分析确定告警根因,并且实现结合网络现有资源情况生成处理数据,可以实现自动化维护操作或给出解决建议,利于快速解决告警,从而利于提高网络运维效率。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
图1为本发明一实施例公开的一种光网络告警处理方法的示意图;
图2为本发明一实施例公开的一种光网络告警处理方法的示意图;
图3为本发明另一实施例公开的一种光网络告警处理方法的示意图;
图4为本发明一实施例公开的一种光网络告警处理系统的结构示意图;
图5为本发明一实施例公开的一种光网络告警处理系统的结构示意图;
图6为本发明另一实施例公开的一种光网络告警处理系统的结构示意图;
图7为本发明一实施例公开的一种光网络告警处理设备的结构示意图。
具体实施方式
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本申请所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用系统,本申请中的各项细节也可以根据不同观点与应用系统,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
下面以附图为参考,针对本申请的实施例进行详细说明,以便本申请所属技术领域的技术人员能够容易地实施。本申请可以以多种不同形态体现,并不限定于此处说明的实施例。
在本申请的表示中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的表示意指结合该实施例或示例表示的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且,表示的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本申请中表示的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于表示目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的表示中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
为了明确说明本申请,省略与说明无关的器件,对于通篇说明书中相同或类似的构成要素,赋予了相同的参照符号。
在通篇说明书中,当说某器件与另一器件“连接”时,这不仅包括“直接连接”的情形,也包括在其中间把其它元件置于其间而“间接连接”的情形。另外,当说某种器件“包括”某种构成要素时,只要没有特别相反的记载,则并非将其它构成要素排除在外,而是意味着可以还包括其它构成要素。
当说某器件在另一器件“之上”时,这可以是直接在另一器件之上,但也可以在其之间伴随着其它器件。当对照地说某器件“直接”在另一器件“之上”时,其之间不伴随其它器件。
虽然在一些实例中术语第一、第二等在本文中用来表示各种元件,但是这些元件不应当被这些术语限制。这些术语仅用来将一个元件与另一个元件进行区分。例如,第一接口及第二接口等表示。再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在的特征、步骤、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能、步骤或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
此处使用的专业术语只用于言及特定实施例,并非意在限定本申请。此处使用的单数形态,只要语句未明确表示出与之相反的意义,那么还包括复数形态。在说明书中使用的“包括”的意义是把特定特性、区域、整数、步骤、作业、要素及/或成份具体化,并非排除其它特性、区域、整数、步骤、作业、要素及/或成份的存在或附加。
虽然未不同地定义,但包括此处使用的技术术语及科学术语,所有术语均具有与本申请所属技术领域的技术人员一般理解的意义相同的意义。普通使用的字典中定义的术语追加解释为具有与相关技术文献和当前提示的内容相符的意义,只要未进行定义,不得过度解释为理想的或非常公式性的意义。
如图1所示,本发明一实施例公开了一种光网络告警处理方法。该方法可以应用于一个光网络系统内。提出一种可适用于任何光传送网的故障根因定位和相关决策流程,易于结合现有网管/控制器系统实现,对数据的输入、输出提出明确定义,并将决策结果分为自动维护优化和人工干预两种类型,更符合网络运营的实际需求。该方法包括以下步骤:
S110,服务器从多个光网络设备中获取由多类数据组成的关联数据集。其中,上述光网络设备具有多个,该多个光网络设备可以同属于上述光网络系统内的。上述关联数据集包含有多种数据。关联数据集与光网络设备是一一对应的,也即每一个光网络设备对应一个关联数据集。本实施例中,上述关联数据集包括但不限于告警信息、网络拓扑信息、网元信息、性能数据以及日志数据。
上述告警信息为每一台光网络设备发出的告警信息,并且,每台设备可以发出多个告警信息。网络拓扑信息包含有该设备与其他设备之间的连接数据,比如具有哪些连接对象,与连接对象之间的距离信息等。上述网元信息可以为上述光网络系统中包含网元对应的网元名称、序列号和端口等信息。上述性能数据可以包含有网络性能数据和设备工作环境数据等。网络性能数据比如包含有光纤损耗率、信道质量数据,设备工作环境数据比如包含有光强度和温度数据等。日志数据可以包含有服务器对光网络设备的操作记录日志等。其中,服务器中可以设有网络管理控制系统。该步骤S110就可以由上述网络管理控制系统负责执行采集数据。上述日志数据也可以为网络管理控制系统对光网络设备的操作记录日志。
其中,表1示出了本实施例中采集的告警数据和性能数据中包含的数据字段名称和对应的数据描述:
表1
S120,服务器基于上述关联数据集中的至少一类数据,进行第一次分析,得到第一分析结果。也即,具体实施时该步骤可以利用关联数据集中的全部数据来计算得到第一分析结果,也可以仅利用关联数据集中的部分数据来计算。
本实施例中,该步骤仅利用关联数据集部分种类数据作为输入,计算得到各个告警信息之间的关联度。也即,第一分析结果为各个告警信息之间的关联度。这样可以在保证关联度计算准确性的前提下,利于提高计算效率。具体来说,服务器基于上述关联数据集中的网络拓扑信息、网元信息以及上述告警信息,进行第一次计算,得到第一分析结果。具体计算过程可利用现有技术中的计算模型来实现,本实施例不再赘述。比如可以利用随机森林、现有的统计学模型等等。
作为一可选的实施例,上述步骤S120包括:服务器获取与上述光网络设备连接的对端设备的网元信息,作为对端网元信息。服务器利用对端网元信息和上述关联数据集中的部分数据,综合计算上述告警信息之间的关联度。这样利于提高告警信息关联度的准确性,从而利于提高后续定位根因告警的准确性。
或者,上述网元信息包含有对端设备的信息(不限于对端网元信息,比如为对端设备的板卡、端口和/或时隙等信息),然后利用对端设备的信息和上述关联数据集中的部分其他数据,综合计算告警信息之间的关联度。这样也利于提高告警信息关联度的准确性,从而利于提高后续定位根因告警的准确性。
示例性地,表2示出了第一分析结果中包含的数据字段名称和对应的数据描述:
表2
S130,服务器基于上述第一分析结果和上述关联数据集中的至少一类数据,进行第二次分析,得到第二分析结果。上述第二分析结果用于确定告警根因。具体来说,该步骤中利于上一次分析计算之后得到的结果作为输入,再次进行分析计算。该次分析为根因分析,用于确定告警根因。该步骤可以利用关联数据集中的全部数据结合第一分析结果来计算得到第二分析结果,也可以仅利用关联数据集中的部分数据来计算。
如图2所示,本实施例中,步骤S130包括:
S131,上述服务器将上述第一分析结果和上述关联数据集中的全部数据,作为预设计算模型的输入,获得各个告警信息对应的概率。
S132,上述服务器将概率最大的告警信息,作为告警根因。
也即,本实施例中,与上述第一分析结果计算过程中仅利用关联数据集中部分数据来计算不同,第二分析结果是利用关联数据集中全部数据进行计算,这样可以兼顾告警根因计算分析过程的准确性和计算效率,保证了告警根因的定位准确性。
其中,该步骤利用预设计算模型计算的具体计算过程,可参考现有技术实现,本实施例不再赘述。示例性地,比如预设计算模型可以为随机森林分类模型或者决策器模型等等。
示例性地,表3示出了第二分析结果中包含的数据字段名称和对应的数据描述:
表3
以及S140,服务器获取备用网络资源,并基于上述告警根因和上述备用网络资源,生成处理数据并输出。上述处理数据用于处理上述告警信息。其中,上述处理数据可以为自动化维护操作或提供运维建议。具体而言,当告警根因可以通过自动化维护操作解决时,那么就优先通过自动化维护操作解决。当自动化维护操作无法解决时,就提示人工介入处理。同时依据告警根因提供运维建议,利于提高告警解决效率。上述运维建议可以根据告警根因从预设数据库中获得。预设数据库中存储有告警信息和运维建议的映射关系。每一条告警信息都存在对应的运维建议。
这样本申请实现结合备用网络资源对定位结果进行评估和反馈,整体形成闭环运维系统:备用网络资源可满足条件时,反馈至网管系统实现自动化运维操作;备用网络资源不满足时,可按照系统提出的根因定位信息和运维建议进行人工介入。
如图3所示,作为一可选的实施例,步骤S140包括:
S141,服务器获取备用网络资源,判断备用网络资源是否满足预设条件。示例性地,备用网络资源可以为备用的光网络设备的数量、备用端口的数量等。预设条件比如可以为备用网络资源中的设备数量达到一预设阈值。本申请不以此为限。
当上述备用网络资源满足预设条件时,执行步骤S142:服务器生成自动化控制指令,并控制与上述告警根因对应的光网络设备执行自动化控制指令。该步骤中,上述自动化控制指令可以为配置调整指令,通过该指令对上述光网络设备进行优化调整,实现解决告警的目的。
当上述备用网络资源不满足预设条件时,执行步骤S143:上述服务器生成运维提示信息并输出。上述运维提示信息用于提示人工介入处理,并提供运维建议。
在一些实施例中,在上述图3对应实施例的基础上,步骤S142包括:
基于上述自动化控制指令启用上述备用网络资源。该步骤中,将告警根因对应的光网络设备的任务切换为由备用网络资源来执行。也即,无法通过对告警根因对应的光网络设备通过配置调整,来解决告警问题时。比如上述光网络设备已经出故障,此时就切换由备用网络资源执行任务。
在一些实施例中,在上述图3对应实施例的基础上,步骤S140包括:
上述服务器获取上述告警根因关联的光网络设备数量,作为第一数量;以及获取上述备用网络资源具有的光网络设备数量,作为第二数量。第一数量即为待切换的(比如为出故障的)设备数量,或者需要关闭的设备数量。
当上述第二数量大于等于上述第一数量时,确定上述备用网络资源满足预设条件。否则确定上述备用网络资源不满足预设条件。此时预设条件即为备用网络资源具有的光网络设备数量大于等于告警根因关联的光网络设备数量。
其中,在其他实施例中,上述第一数量也可以为告警根因关联的光网络设备中的网元、板卡、端口和/或时隙等数量。类似地,第二数量也可以为备用网络资源具有的光网络设备中的网元、板卡、端口和/或时隙等数量。本申请对此不作限制。
需要说明的是,本申请中公开的上述所有实施例可以进行自由组合,组合后得到的技术方案也在本申请的保护范围之内。
如图4所示,本发明一实施例还公开了一种光网络告警处理系统,提出一种可适用于任何光传送网的故障根因定位和相关决策流程,易于结合现有网管/控制器系统实现,对数据的输入、输出提出明确定义,并将决策结果分为自动维护优化和人工干预两种类型,更符合网络运营的实际需求。该光网络告警处理系统可以应用于一个光网络系统内。
该光网络告警处理系统包括光网络设备31,还包括:
数据采集模块32,服务器从多个光网络设备中获取由多类数据组成的关联数据集。其中,上述数据采集模块位于网络管控系统平台36中。其中,上述光网络设备具有多个,该多个光网络设备可以同属于上述光网络系统内的。上述关联数据集包含有多种数据。关联数据集与光网络设备是一一对应的,也即每一个光网络设备对应一个关联数据集。本实施例中,上述关联数据集包括但不限于告警信息、网络拓扑信息、网元信息、性能数据以及日志数据。
上述告警信息为每一台光网络设备发出的告警信息,并且,每台设备可以发出多个告警信息。网络拓扑信息包含有该设备与其他设备之间的连接数据,比如具有哪些连接对象,与连接对象之间的距离信息等。上述网元信息可以为上述光网络系统中包含网元对应的网元名称、序列号和端口等信息。上述性能数据可以包含有网络性能数据和设备工作环境数据等。网络性能数据比如包含有信道质量数据,设备工作环境数据比如包含有光强度和温度数据等。日志数据可以包含有服务器对光网络设备的操作记录日志等。其中,服务器中可以设有网络管理控制系统。此时上述数据采集模块就设于网络管理控制系统内。
告警关联分析模块33,服务器基于上述关联数据集中的至少一类数据,进行第一次分析,得到第一分析结果。
根因分析模块34,服务器基于上述第一分析结果和上述关联数据集中的至少一类数据,进行第二次分析,得到第二分析结果。上述第二分析结果用于确定告警根因。
以及决策模块35,服务器获取备用网络资源,并基于上述告警根因和上述备用网络资源,生成处理数据并输出。上述处理数据用于处理上述告警信息。比如,决策模块将处理数据发送给网络管控系统平台36,网络管控系统平台36根据该处理数据对光网络设备进行优化调整。备用网络资源可以为备用的光网络设备的数量、备用端口的数量等。预设条件比如可以为备用网络资源中的设备数量达到一预设阈值。本申请不以此为限。
其中,上述处理数据可以为自动化维护操作或提供运维建议。具体而言,当告警根因可以通过自动化维护操作解决时,那么就优先通过自动化维护操作解决。当自动化维护操作无法解决时,就提示人工介入处理。同时依据告警根因提供运维建议,利于提高告警解决效率。上述运维建议可以根据告警根因从预设数据库中获得。预设数据库中存储有告警信息和运维建议的映射关系。每一条告警信息都存在对应的运维建议。
本实施例中,上述告警关联分析模块33仅利用关联数据集部分种类数据作为输入,计算得到各个告警信息之间的关联度。也即,第一分析结果为各个告警信息之间的关联度。这样可以在保证关联度计算准确性的前提下,利于提高计算效率。具体来说,服务器基于上述关联数据集中的网络拓扑信息、网元信息以及上述告警信息,进行第一次计算,得到第一分析结果。具体计算过程可利用现有技术中的计算模型来实现,本实施例不再赘述。比如可以利用随机森林、现有的统计学模型等等。
作为一可选的实施例,上述告警关联分析模块33还获取与上述光网络设备连接的对端设备的网元信息,作为对端网元信息。然后利用对端网元信息和上述关联数据集中的部分数据,综合计算上述告警信息之间的关联度。这样利于提高告警信息关联度的准确性,从而利于提高后续定位根因告警的准确性。
或者,上述网元信息包含有对端设备的信息(不限于对端网元信息),然后利用对端设备的信息和上述关联数据集中的部分其他数据,综合计算告警信息之间的关联度。这样也利于提高告警信息关联度的准确性,从而利于提高后续定位根因告警的准确性。
具体实施时,根因分析模块34利于告警关联分析模块33分析计算之后得到的结果作为输入,再次进行分析计算。该次分析为根因分析,用于确定告警根因。根因分析模块34可以利用关联数据集中的全部数据结合第一分析结果来计算得到第二分析结果,也可以仅利用关联数据集中的部分数据来计算。
本实施例中,与上述第一分析结果计算过程中仅利用关联数据集中部分数据来计算不同,第二分析结果是利用关联数据集中全部数据进行计算,这样可以兼顾告警根因计算分析过程的准确性和计算效率,保证了告警根因的定位准确性。
其中,根因分析模块34利用预设计算模型计算的具体计算过程,可参考现有技术实现,本实施例不再赘述。示例性地,比如预设计算模型可以为随机森林分类模型或者决策器模型等等。
本实施例引入上述决策模块35,结合现网资源对定位结果进行评估和反馈,整体形成闭环运维系统:网络资源可满足时,反馈至网管系统实现自动化运维操作;网络资源不满足时,可按照系统提出的根因定位信息和运维建议进行人工介入。
这样从对网络设备的数据采集,到管理系统平台、分析决策模块之间的接口信息交互,以及对根因分析结果的评估决策,提出了一套可具应用条件的闭环系统流程。
可以理解的是,本发明的光网络告警处理系统还包括其他支持光网络告警处理系统运行的现有功能模块。图4显示的光网络告警处理系统仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
本实施例中的光网络告警处理系统用于实现上述的光网络告警处理的方法,因此对于光网络告警处理系统的具体实施步骤可以参照上述对光网络告警处理的方法的描述,此处不再赘述。
在一些实施例中,如图5所示,在上述图4对应实施例的基础上,上述根因分析模块34包括概率计算单元341和告警根因确定单元342。上述概率计算单元341用于将上述第一分析结果和上述关联数据集中的全部数据,作为预设计算模型的输入,获得各个告警信息对应的概率。告警根因确定单元342用于将概率最大的告警信息,作为告警根因。
在一些实施例中,如图6所示,在上述图4对应实施例的基础上,决策模块35包括判断单元351、自动化运维单元352和运维提示单元353。其中,上述判断单元351用于获取备用网络资源,判断备用网络资源是否满足预设条件。当上述备用网络资源满足预设条件时,执行自动化运维单元。当上述备用网络资源不满足预设条件时,执行运维提示单元。自动化运维单元352用于生成自动化控制指令,并控制与上述告警根因对应的光网络设备执行上述自动化控制指令。运维提示单元353用于生成运维提示信息并输出。
作为一可选的实施例,决策模块35获取上述告警根因关联的光网络设备数量,作为第一数量;以及获取上述备用网络资源具有的光网络设备数量,作为第二数量。第一数量即为待切换的(比如为出故障的)设备数量,或者需要关闭的设备数量。
当上述第二数量大于等于上述第一数量时,确定上述备用网络资源满足预设条件。否则确定上述备用网络资源不满足预设条件。此时预设条件即为备用网络资源具有的光网络设备数量大于等于告警根因关联的光网络设备数量。
本发明一实施例还公开了一种光网络告警处理设备,包括处理器和存储器,其中存储器存储有所述处理器的可执行程序;处理器配置为经由执行可执行程序来执行上述光网络告警处理方法中的步骤。图7是本发明公开的光网络告警处理设备的结构示意图。下面参照图7来描述根据本发明的这种实施方式的电子设备600。图7显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述光网络告警处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明还公开了一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述光网络告警处理方法中的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述光网络告警处理方法中描述的根据本发明各种示例性实施方式的步骤。
如上所示,该实施例的计算机可读存储介质的程序在执行时,通过第一次分析确定各个告警信息之间的关联度,然后利用关联度和所有采集数据第二次分析确定告警根因,并且实现结合网络现有资源情况生成处理数据,可以实现自动化维护操作或给出解决建议,利于快速解决告警,从而利于提高网络运维效率。
根据本发明的实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本发明实施例提供的光网络告警处理方法、系统、设备及存储介质通过第一次分析确定各个告警信息之间的关联度,然后利用关联度和所有采集数据第二次分析确定告警根因,保证了告警根因定位的准确性;并且实现结合网络现有资源情况生成处理数据,可以实现自动化维护操作或给出解决建议,利于快速解决告警,从而利于提高网络运维效率。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (11)

1.一种光网络告警处理方法,其特征在于,包括以下步骤:
服务器从多个光网络设备中获取由多类数据组成的关联数据集;所述关联数据集包括网络拓扑信息、网元信息以及告警信息;
服务器基于所述关联数据集中的至少一类数据,进行第一次分析,得到第一分析结果,所述第一分析结果为各个告警信息之间的关联度;
服务器基于所述第一分析结果和所述关联数据集中的全部数据,进行第二次分析,得到第二分析结果;所述第二分析结果用于确定告警根因;以及
服务器获取备用网络资源,并基于所述告警根因和所述备用网络资源,生成处理数据并输出;所述处理数据用于处理所述告警信息。
2.如权利要求1所述的光网络告警处理方法,其特征在于,所述服务器获取备用网络资源,并基于所述告警根因和所述备用网络资源,生成处理数据并输出,包括:
当所述备用网络资源满足预设条件时,所述服务器生成自动化控制指令,并控制与所述告警根因对应的所述光网络设备执行所述自动化控制指令;
当所述备用网络资源不满足预设条件时,所述服务器生成运维提示信息并输出;所述运维提示信息用于提示人工介入处理。
3.如权利要求2所述的光网络告警处理方法,其特征在于,所述服务器获取备用网络资源,并基于所述告警根因和所述备用网络资源,生成处理数据并输出,包括:
当所述备用网络资源满足预设条件时,基于所述自动化控制指令启用所述备用网络资源。
4.如权利要求2所述的光网络告警处理方法,其特征在于,所述服务器获取备用网络资源,并基于所述告警根因和所述备用网络资源,生成处理数据并输出,包括:
所述服务器获取所述告警根因关联的光网络设备数量,作为第一数量;以及获取所述备用网络资源具有的光网络设备数量,作为第二数量;
当所述第二数量大于等于所述第一数量时,确定所述备用网络资源满足预设条件;
否则确定所述备用网络资源不满足预设条件。
5.如权利要求1所述的光网络告警处理方法,其特征在于,所述服务器基于所述关联数据集中的至少一类数据,进行第一次分析,得到第一分析结果包括:
服务器基于所述关联数据集中的网络拓扑信息、网元信息以及所述告警信息,进行第一次分析,得到第一分析结果。
6.如权利要求1所述的光网络告警处理方法,其特征在于,所述服务器基于所述关联数据集中的至少一类数据,进行第一次分析,得到第一分析结果,包括:
服务器获取与所述光网络设备连接的对端设备的网元信息,作为对端网元信息;
服务器基于所述对端网元信息,计算所述告警信息之间的关联度。
7.如权利要求1所述的光网络告警处理方法,其特征在于,所述服务器基于所述第一分析结果和所述关联数据集中的至少一类数据,进行第二次分析,得到第二分析结果,包括:
所述服务器将所述第一分析结果和所述关联数据集中的全部数据,作为预设计算模型的输入,获得各个告警信息对应的概率;
所述服务器将概率最大的告警信息,作为目标告警信息;
所述服务器基于所述目标告警信息,确定告警根因。
8.如权利要求1至7中任意一项所述的光网络告警处理方法,其特征在于,所述关联数据集还包括性能数据以及日志数据。
9.一种光网络告警处理系统,用于实现如权利要求1所述的光网络告警处理方法,其特征在于,所述系统包括:
数据采集模块,服务器从多个光网络设备中获取由多类数据组成的关联数据集;所述关联数据集包括网络拓扑信息、网元信息以及告警信息;
告警关联分析模块,服务器基于所述关联数据集中的至少一类数据,进行第一次分析,得到第一分析结果,所述第一分析结果为各个告警信息之间的关联度;
根因分析模块,服务器基于所述第一分析结果和所述关联数据集中的全部数据,进行第二次分析,得到第二分析结果;所述第二分析结果用于确定告警根因;以及
决策模块,服务器获取备用网络资源,并基于所述告警根因和所述备用网络资源,生成处理数据并输出;所述处理数据用于处理所述告警信息。
10.一种光网络告警处理设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行程序;
其中,所述处理器配置为经由执行所述可执行程序来执行权利要求1至8中任意一项所述光网络告警处理方法的步骤。
11.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现权利要求1至8中任意一项所述光网络告警处理方法的步骤。
CN202210836895.7A 2022-07-15 2022-07-15 光网络告警处理方法、系统、设备及存储介质 Active CN115086148B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210836895.7A CN115086148B (zh) 2022-07-15 2022-07-15 光网络告警处理方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210836895.7A CN115086148B (zh) 2022-07-15 2022-07-15 光网络告警处理方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN115086148A CN115086148A (zh) 2022-09-20
CN115086148B true CN115086148B (zh) 2024-01-30

Family

ID=83259978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210836895.7A Active CN115086148B (zh) 2022-07-15 2022-07-15 光网络告警处理方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115086148B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117792864A (zh) * 2022-09-27 2024-03-29 中兴通讯股份有限公司 一种告警处理方法、装置、存储介质及电子装置
CN115941446A (zh) * 2022-12-27 2023-04-07 中国联合网络通信集团有限公司 告警根因定位方法、装置、电子设备和计算机可读介质
CN115766401B (zh) * 2023-01-09 2023-04-21 北京安帝科技有限公司 工业告警信息解析方法、装置、电子设备与计算机介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684181A (zh) * 2018-11-20 2019-04-26 华为技术有限公司 告警根因分析方法、装置、设备及存储介质
CN109698763A (zh) * 2017-10-24 2019-04-30 中兴通讯股份有限公司 一种巡检的方法、装置及计算机可读存储介质
CN110995482A (zh) * 2019-11-27 2020-04-10 深圳市商汤科技有限公司 告警分析方法、装置、计算机设备及计算机可读存储介质
WO2022007108A1 (zh) * 2020-07-07 2022-01-13 南京邮电大学 一种基于深度学习的网络告警定位方法
WO2022127435A1 (zh) * 2020-12-14 2022-06-23 华为技术有限公司 告警处理方法、装置、设备及可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11329719B2 (en) * 2020-07-17 2022-05-10 At&T Intellectual Property I, L.P. Proactive isolation of layer 1 faults based on layer 2 alarm indicators
US11444824B2 (en) * 2020-12-02 2022-09-13 Ciena Corporation Knowledge base and mining for effective root-cause analysis

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109698763A (zh) * 2017-10-24 2019-04-30 中兴通讯股份有限公司 一种巡检的方法、装置及计算机可读存储介质
CN109684181A (zh) * 2018-11-20 2019-04-26 华为技术有限公司 告警根因分析方法、装置、设备及存储介质
CN110995482A (zh) * 2019-11-27 2020-04-10 深圳市商汤科技有限公司 告警分析方法、装置、计算机设备及计算机可读存储介质
WO2022007108A1 (zh) * 2020-07-07 2022-01-13 南京邮电大学 一种基于深度学习的网络告警定位方法
WO2022127435A1 (zh) * 2020-12-14 2022-06-23 华为技术有限公司 告警处理方法、装置、设备及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
网络运维系统告警管理子系统的设计与实现;黄岩;《中国优秀硕士学位论文全文数据库 信息科技辑 2022年第05期》;全文 *

Also Published As

Publication number Publication date
CN115086148A (zh) 2022-09-20

Similar Documents

Publication Publication Date Title
CN115086148B (zh) 光网络告警处理方法、系统、设备及存储介质
CN106201757B (zh) 一种异常处理方法和装置
CN111427748A (zh) 任务告警方法、系统、设备及存储介质
US11416321B2 (en) Component failure prediction
CN111431754A (zh) 配用电通信网故障分析方法和系统
CN110708285B (zh) 流量监控方法、装置、介质及电子设备
CN109542737A (zh) 平台告警处理方法、装置、电子装置及存储介质
CN111582649B (zh) 基于用户app独热编码的风险评估方法、装置和电子设备
CN115883392B (zh) 算力网络的数据感知方法、装置、电子设备及存储介质
CN112668314A (zh) 数据标准符合性检测方法、装置、系统及存储介质
CN116226786A (zh) 一种用于信息系统数据融合的数据处理方法及装置
US11838171B2 (en) Proactive network application problem log analyzer
CN113590484B (zh) 算法模型服务测试方法、系统、设备及存储介质
CN116126415A (zh) 一种基于场景的上云组件配置推荐方法及系统
CN114546780A (zh) 数据监控方法、装置、设备、系统及存储介质
CN114756301A (zh) 日志处理方法、装置和系统
CN113064812A (zh) 一种项目开发过程质量缺陷预测方法、装置及介质
CN112988441A (zh) 异常处理方法和装置
CN113537519A (zh) 一种识别异常设备的方法和装置
CN113434404B (zh) 校验灾备系统可靠性的自动化业务验证方法及装置
CN115062056B (zh) 一种用于民航数据的用户查找方法、电子设备及存储介质
CN111274088B (zh) 大数据平台实时监控方法、装置、介质及电子设备
CN117311777A (zh) 自动化运维平台及方法
Peter et al. Structured Data for Product Performance Improvement
KR20230159130A (ko) 데이터 포맷 변환 장치 및 그 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant