CN116471196B - 运维监控网络维护方法、系统及设备 - Google Patents
运维监控网络维护方法、系统及设备 Download PDFInfo
- Publication number
- CN116471196B CN116471196B CN202310722792.2A CN202310722792A CN116471196B CN 116471196 B CN116471196 B CN 116471196B CN 202310722792 A CN202310722792 A CN 202310722792A CN 116471196 B CN116471196 B CN 116471196B
- Authority
- CN
- China
- Prior art keywords
- maintenance monitoring
- network
- sequence data
- maintenance
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 255
- 238000012544 monitoring process Methods 0.000 title claims abstract description 217
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000005856 abnormality Effects 0.000 claims abstract description 74
- 230000002159 abnormal effect Effects 0.000 claims abstract description 39
- 238000000605 extraction Methods 0.000 claims description 50
- 230000015654 memory Effects 0.000 claims description 40
- 230000007246 mechanism Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 8
- 230000002195 synergetic effect Effects 0.000 abstract description 3
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000004927 fusion Effects 0.000 description 4
- 125000003275 alpha amino acid group Chemical group 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/149—Network analysis or design for prediction of maintenance
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及运维监控技术领域,提供运维监控网络维护方法、系统及设备,包括:基于运维监控网络的拓扑关系,得到网络流量序列数据和设备性能序列数据;根据网络流量序列数据,通过第一运维监控模型得到网络流量预测信息;根据设备性能序列数据,通过第二运维监控模型得到设备性能异常预测信息;根据网络流量预测信息和设备性能异常预测信息,通过第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信。本发明通过结合网络流量预测信息和设备性能异常预测信息,利用第三运维监控模型的协同作用,准确预测和诊断运维监控网络的异常问题,提供更全面的运维监控网络的待维护信息,改善网络的稳定性、性能和安全性。
Description
技术领域
本发明涉及运维监控技术领域,尤其涉及运维监控网络维护方法、系统及设备。
背景技术
随着互联网的普及和企业网络的扩张,网络规模和复杂性不断增加。现代网络涉及多个地理位置、数百甚至数千个设备的连接,包括服务器、路由器、交换机、防火墙等。监控这些设备和它们之间的交互关系,并对运维监控网络进行维护,成为保障网络稳定运行的关键。在现有网络运维监控技术中,往往需要人工分析和处理大量的网络数据,这存在着效率低下和易错的问题。再者,某些现有技术仅专注于监控和分析网络流量数据,这些现有技术使用流量监测工具或设备来收集和分析网络中的数据传输量,从而识别出网络中的拥塞情况、带宽利用率等问题。然而,单独监控流量无法实现对整个网络的全面维护。
发明内容
本发明提供一种运维监控网络维护方法、系统及设备,旨在解决现有技术无法对运维监控网络进行全面维护的缺陷。
第一方面,本发明提供一种运维监控网络维护方法,包括:
基于运维监控网络的拓扑关系,得到网络流量序列数据和设备性能序列数据;
根据所述网络流量序列数据,通过第一运维监控模型预测运维监控网络流量,得到网络流量预测信息;
根据所述设备性能序列数据,通过第二运维监控模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息;
根据所述网络流量预测信息和所述设备性能异常预测信息,通过第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息。
在一个实施例中,所述根据所述网络流量序列数据,通过第一运维监控模型预测运维监控网络流量,得到网络流量预测信息,包括:
根据所述网络流量序列数据,通过第一特征提取模型得到网络流量特征;
根据所述网络流量特征,通过第一预测模型预测运维监控网络流量,得到网络流量预测信息。
在一个实施例中,所述网络流量序列数据包括流量速率序列数据和流量数据包序列数据;
所述根据所述网络流量序列数据,通过第一特征提取模型得到网络流量特征,包括:
根据所述流量速率序列数据,通过第一特征提取子模型得到时间维度上的流量速率特征;
根据所述流量数据包序列数据,通过第二特征提取子模型得到时间维度上的流量数据包特征;
利用第一注意力机制融合所述流量速率特征和所述流量数据包特征,得到网络流量特征。
在一个实施例中,所述根据所述设备性能序列数据,通过第二运维监控模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息,包括:
根据所述设备性能序列数据,通过第二特征提取模型得到设备性能特征;
根据所述设备性能特征,通过第二预测模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息。
在一个实施例中,所述设备性能序列数据包括CPU序列数据、内存序列数据和温度序列数据;
所述根据所述设备性能序列数据,通过第二特征提取模型得到设备性能特征,包括:
根据所述CPU序列数据,通过第三特征提取子模型得到时间维度上的CPU使用率特征;
根据所述内存序列数据,通过第四特征提取子模型得到时间维度上的内存使用率特征;
根据所述温度序列数据,通过第五特征提取子模型得到时间维度上的温度特征;
利用第二注意力机制融合所述CPU使用率特征、所述内存使用率特征和所述温度特征,得到设备性能特征。
在一个实施例中,所述根据所述网络流量预测信息和所述设备性能异常预测信息,通过第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息,包括:
利用第三注意力机制融合所述网络流量预测信息和所述设备性能异常预测信息,得到运维监控特征;
根据所述运维监控特征,通过所述第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息。
在一个实施例中,在所述根据所述网络流量特征,通过第一预测模型预测运维监控网络流量,得到网络流量预测信息之后,包括:
根据所述网络流量预测信息,结合预设流量预警规则,发出网络流量预警。
在一个实施例中,在所述根据所述设备性能序列数据,通过第二运维监控模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息之后,包括:
根据所述设备性能异常预测信息,结合预设性能异常预警规则,发出设备性能异常预警。
第二方面,本发明提供一种运维监控网络维护系统,包括:
获取模块,用于:基于运维监控网络的拓扑关系,得到网络流量序列数据和设备性能序列数据;
第一预测模块,用于:根据所述网络流量序列数据,通过第一运维监控模型预测运维监控网络流量,得到网络流量预测信息;
第二预测模块,用于:根据所述设备性能序列数据,通过第二运维监控模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息;
第三预测模块,用于:根据所述网络流量预测信息和所述设备性能异常预测信息,通过第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息。
第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述任一项所述运维监控网络维护方法的步骤。
本发明提供的运维监控网络维护方法、系统及设备,先基于存储丰富信息的运维监控网络的拓扑关系,获取网络流量序列数据和设备性能序列数据,然后通过第一运维监控模型对运维监控网络流量进行预测,通过第二运维监控模型对运维监控网络的设备性能异常问题进行预测,再充分结合网络流量预测信息和设备性能异常预测信息,通过第三运维监控模型的协同作用,更准确地预测和诊断运维监控网络的异常问题,提供更准确和全面的运维监控网络的待维护信息,提高运维效率和质量,进一步改善网络的稳定性、性能和安全性。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的运维监控网络维护方法的流程示意图之一;
图2是本发明提供的运维监控网络维护方法的流程示意图之一
图3是本发明提供的运维监控网络维护方法的第三注意力机制的原理图;
图4是本发明提供的运维监控网络维护方法的图卷积神经网络(GCN)模型的原理图;
图5是本发明提供的运维监控网络维护系统的结构示意图;
图6是本发明提供的运维监控网络维护装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了运维监控网络维护方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些数据下,可以以不同于此处的顺序完成所示出或描述的步骤。
参照图1和图2,图1和图2是本发明提供的运维监控网络维护方法的流程示意图。本发明实施例提供的运维监控网络维护方法包括:
步骤101,基于运维监控网络的拓扑关系,得到网络流量序列数据和设备性能序列数据;
步骤102,根据所述网络流量序列数据,通过第一运维监控模型预测运维监控网络流量,得到网络流量预测信息;
步骤103,根据所述设备性能序列数据,通过第二运维监控模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息;
步骤104,根据所述网络流量预测信息和所述设备性能异常预测信息,通过第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息。
需要说明的是,本发明提供的运维监控网络维护方法,可以应用于企业网络、电信运营商、云服务提供商、物联网等任何适用的领域,其用于全方位预测和诊断网络中的异常问题,并提供相应的待维护信息,有助于提高运维效率和质量,以确保网络的稳定运行,满足不断增长的业务需求和用户期望。
本发明实施例的执行主体可以是任何符合实施要求的终端侧设备,例如运维监控系统等。
在步骤101中,终端侧设备会基于运维监控网络的拓扑关系,得到网络流量序列数据和设备性能序列数据。
需要说明的是,在网络运维监控中,拓扑关系是指网络中各个设备之间的连接方式和结构布局,包含各设备的名称、IP地址等信息。它可通过图形化方式描述网络中设备之间的物理或逻辑连接关系,包括设备之间的直接连接、上下级关系、传输路径等,为后续能够及时发现出现问题设备提供支撑。通过运维监控网络的拓扑关系,终端侧设备可以通过SNMP协议、接口、API、现有的流量监测工具和性能监控功能工具等,获取多元时间序列数据,例如网络流量序列数据和设备性能序列数据,网络流量序列数据是指网络中的数据传输量随时间的变化情况,设备性能序列数据是指网络设备的性能指标。在本实施例中,网络流量序列数据包括流量速率序列数据和流量数据包序列数据,设备性能序列数据包括CPU序列数据、内存序列数据和温度序列数据。
在步骤102中,终端侧设备会根据所述网络流量序列数据,通过第一运维监控模型预测运维监控网络流量,得到网络流量预测信息。
需要说明的是,可以基于历史网络流量序列数据对第一运维监控模型进行训练,学习网络流量的规律和趋势,使其实现对运维监控网络进行流量预测的功能。通过网络流量预测信息,运维团队可以提前做好网络资源的规划和调整,以应对未来可能出现的流量波动和拥塞情况。
在一种实施例中,步骤102可以包括:
步骤1021,根据所述网络流量序列数据,通过第一特征提取模型得到网络流量特征;
步骤1022,根据所述网络流量特征,通过第一预测模型预测运维监控网络流量,得到网络流量预测信息。
具体的,步骤1022可以通过以下步骤实现:
根据所述流量速率序列数据,通过第一特征提取子模型得到时间维度上的流量速率特征;
根据所述流量数据包序列数据,通过第二特征提取子模型得到时间维度上的流量数据包特征;
利用第一注意力机制融合所述流量速率特征和所述流量数据包特征,得到网络流量特征。
在本实施例中,流量速率特征包括流量、峰值流量、平均带宽占比、拥塞时段占比、平均帧流量、峰值帧流量、平均广播流量、峰值广播流量中的一个或多个;流量数据包特征包括平均丢包量、峰值丢包量、平均错包量、峰值错包量中的一个或多个。其中,第一特征提取子模型和第二特征提取子模型均采用图卷积神经网络(GCN)模型框架,实现相应特征的提取,第一预测模型采用长短期记忆(LSTM)模型框架,实现对运维监控网络流量的预测。进一步,本实施例中的第一注意力机制根据下式(1)利用滑动平均法(moving average)对流量速率特征进行滤波,再将流量速率特征和流量数据包特征进行融合,以消除流量数据包特征的噪声影响,得到精度更高的网络流量特征,有助于提高预测运维监控网络流量的准确性。
(1)
式(1)中,x表示平滑前的流量速率特征,k表示窗口长度,n表示流量速率特征的数量,y表示平滑后的流量速率特征。
进一步的,在得到网络流量预测信息后,终端侧设备可以结合预设流量预警规则,例如判定网络流量预测值大于预设阈值,即使通过文字或语音的方式发出网络流量预警,以提醒运维团队及时处理。
在步骤103中,终端侧设备会根据所述设备性能序列数据,通过第二运维监控模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息。
需要说明的是,可以基于历史设备性能序列数据对第二运维监控模型进行训练,学习设备性能的正常范围和异常模式。当设备性能序列数据超出了正常范围或出现异常模式时,第二运维监控模型可以及时发现并预测设备性能的异常情况,以警示运维团队快速做出预案。
在一种实施例中,步骤103可以包括:
步骤1031,根据所述设备性能序列数据,通过第二特征提取模型得到设备性能特征;
步骤1032,根据所述设备性能特征,通过第二预测模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息。
具体的,步骤1032可以通过以下步骤实现:
根据所述CPU序列数据,通过第三特征提取子模型得到时间维度上的CPU使用率特征;
根据所述内存序列数据,通过第四特征提取子模型得到时间维度上的内存使用率特征;
根据所述温度序列数据,通过第五特征提取子模型得到时间维度上的温度特征;
利用第二注意力机制融合所述CPU使用率特征、所述内存使用率特征和所述温度特征,得到设备性能特征。
在本实施例中,CPU使用率特征包括CPU利用率、CPU平均负载、CPU高负载时间比率、CPU忠负载时间比率、CPU低负载时间比率中的一个或多个,内存使用率特征包括内存利用率、内存高负载时间比率、内存中负载时间比率、内存低负载时间比率中的一个或多个,温度特征包括CPU温度、CPU核心温度、主板温度中的一个或多个。其中,第三特征提取子模型、第四特征提取子模型和第五特征提取子模型均采用图卷积神经网络(GCN)模型框架,实现相应特征的提取,第二预测模型采用长短期记忆(LSTM)模型框架,实现对运维监控网络的设备性能异常问题的预测。进一步,本实施例利用第二注意力机制,通过下式(2)融合CPU使用率特征、内存使用率特征和温度特征,得到表达能力更强的设备性能特征,以提高设备性能异常预测信息的准确性。
(2)
式(2)中,表示CPU使用率特征级数展开之后的常数项,/>表示CPU使用率特征级数展开之后的第一振幅特征值,/>表示CPU使用率特征级数展开之后的第二振幅特征值,中n表示组别序号,/>表示频率,t表示时间,/>表示内存使用率特征级数展开之后的常数项,/>表示内存使用率特征级数展开之后的第一振幅特征值,/>表示内存使用率特征级数展开之后的第二振幅特征值,/>表示温度特征级数展开之后的常数项,/>表示温度特征级数展开之后的第一振幅特征值,/>表示温度特征级数展开之后的第二振幅特征值,H表示融合得到的设备性能特征,cos表示余弦函数,/>表示正弦函数。
进一步的,在得到设备性能异常预测信息后,终端侧设备可以结合预设性能异常预警规则,例如判定预测的设备性能异常问题的严重程度为严重程度及以上时(设备性能异常问题的严重程度包括一般、较重、严重、非常严重,每个等级的严重程度递增),及时通过文字或语音的方式发出设备性能异常预警,以警示运维团队及时处理。
在步骤104中,终端侧设备会根据所述网络流量预测信息和所述设备性能异常预测信息,通过第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息。
需要说明的是,可以采用例如分类模型(如决策树、支持向量机、神经网络等)的框架构建第三运维监控模型,使第三运维监控模型学习网络流量和设备性能的模式,并预测网络的异常问题。通过第三运维监控模型实现预测运维监控网络的异常问题的功能,输出运维监控网络的待维护信息,例如识别出哪些网络出现了何种异常(可能是网络连接问题、安全攻击、网络拥塞等)、哪些设备需要进行维护和修复等。根据第三运维监控模型的输出结果,运维团队可以根据待维护信息对网络进行提前的维护和优化操作,例如调整网络配置、修复设备故障、增加带宽等,以确保网络的稳定性和可用性。
在一种实施例中,步骤104可以包括:
步骤1041,利用第三注意力机制融合所述网络流量预测信息和所述设备性能异常预测信息,得到运维监控特征;
步骤1042,根据所述运维监控特征,通过所述第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息。
在本实施例中,参照图3,第三注意力机制通过将网络流量预测信息(网络流量预测特征)Ai与第一向量权重Wi(Wi根据经验值预设)相乘得到网络流量预测向量Xi,将设备性能异常预测信息(设备性能异常预测特征)Aj与第二向量权重Wj(Wj根据经验值预设)相乘得到设备性能异常预测向量Xj,再通过计算网络流量预测向量Xi与网络流量预测向量Xi和设备性能异常预测向量Xj之和的比值()得到网络流量预测权重比特征Bi,以及计算网络流量预测向量Xj与网络流量预测向量Xi和设备性能异常预测向量Xj之和的比值(/>)得到设备性能异常预测权重比特征Bj,再将网络流量预测权重比特征Bi和设备性能异常预测权重比特征Bj进行特征融合。
进一步的,本实施例对运维监控网络中的设备按类别和区域进行分组,并从设备整体特征中抽取同类组设备的同类设备特征和区域组设备的区域设备特征,再将同类设备特征和区域设备特征输入分类器模型进行分类,确定同类组设备或区域组设备的异常问题,可以根据异常问题的数量和严重程度,对其进行分级(例如一般、较重、严重、特别严重等),得到对应的运维监控网络的待维护信息,实现自动化运维提前预警,有利于运维团队按需及时响应,提高运维效果。
另一方面,对于本实施例中提及的图卷积神经网络(GCN)模型,其大致原理可参考图4,其由3个矩阵计算迭代生成,邻接矩阵A表示节点间的连接关系,度矩阵D中每个节点的度指的是其连接的节点数,特征矩阵X表示节点的特征,Z表示GCN模型计算得出的各层网络特征集,GCN模型通过下式(3)进行特征更新。
(3)
式(3)中,表示每个节点增加自连接后更新的邻接矩阵,/>,/>表示自连接;/>表示度矩阵的逆矩阵;/>表示网络第k层的特征,其中/>;/>表示学习权重;表示激活函数,本实施例选取ReLu函数,为神经网络的基本单元。
再一方面,对于本实施例中提及的长短期记忆(LSTM)模型,采用现有的一般长短期记忆(LSTM)模型的模型框架即可。
本发明实施例提供的运维监控网络维护方法,先基于存储丰富信息的运维监控网络的拓扑关系,获取网络流量序列数据和设备性能序列数据,然后通过第一运维监控模型对运维监控网络流量进行预测,通过第二运维监控模型对运维监控网络的设备性能异常问题进行预测,再充分结合网络流量预测信息和设备性能异常预测信息,通过第三运维监控模型的协同作用,更准确地预测和诊断运维监控网络的异常问题,提供更准确和全面的运维监控网络的待维护信息,提高运维效率和质量,进一步改善网络的稳定性、性能和安全性。
进一步的,本发明提供的运维监控网络维护系统与本发明提供的运维监控网络维护方法互对应参照。
参照图5,该运维监控网络维护系统,包括:
获取模块501,用于:基于运维监控网络的拓扑关系,得到网络流量序列数据和设备性能序列数据;
第一预测模块502,用于:根据所述网络流量序列数据,通过第一运维监控模型预测运维监控网络流量,得到网络流量预测信息;
第二预测模块503,用于:根据所述设备性能序列数据,通过第二运维监控模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息;
第三预测模块504,用于:根据所述网络流量预测信息和所述设备性能异常预测信息,通过第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息。
需要说明的是,所述网络流量序列数据包括流量速率序列数据和流量数据包序列数据,所述设备性能序列数据包括CPU序列数据、内存序列数据和温度序列数据。
在一种实施例中,所述第一预测模块502可以包括:
第一提取子模块,用于:根据所述网络流量序列数据,通过第一特征提取模型得到网络流量特征;
流量预测子模块,用于:根据所述网络流量特征,通过第一预测模型预测运维监控网络流量,得到网络流量预测信息。
在一种实施例中,所述第一提取子模块可以包括:
流量速率特征提取子模块,用于:根据所述流量速率序列数据,通过第一特征提取子模型得到时间维度上的流量速率特征;
流量数据包特征提取子模块,用于:根据所述流量数据包序列数据,通过第二特征提取子模型得到时间维度上的流量数据包特征;
第一融合子模块,用于:利用第一注意力机制融合所述流量速率特征和所述流量数据包特征,得到网络流量特征。
在一种实施例中,所述第二预测模块503可以包括:
第二提取子模块,用于:根据所述设备性能序列数据,通过第二特征提取模型得到设备性能特征;
设备性能异常预测子模块,用于:根据所述设备性能特征,通过第二预测模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息。
在一种实施例中,所述第二提取子模块可以包括:
CPU使用率特征提取子模块,用于:根据所述CPU序列数据,通过第三特征提取子模型得到时间维度上的CPU使用率特征;
内存使用率特征提取子模块,用于:根据所述内存序列数据,通过第四特征提取子模型得到时间维度上的内存使用率特征;
温度特征提取子模块,用于:根据所述温度序列数据,通过第五特征提取子模型得到时间维度上的温度特征;
第二融合子模块,用于:利用第二注意力机制融合所述CPU使用率特征、所述内存使用率特征和所述温度特征,得到设备性能特征。
在一种实施例中,所述第三预测模块504可以包括:
第三融合子模块,用于:利用第三注意力机制融合所述网络流量预测信息和所述设备性能异常预测信息,得到运维监控特征;
异常问题预测子模块,用于:根据所述运维监控特征,通过所述第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息。
在一种实施例中,还包括第一预警模块,用于:根据所述网络流量预测信息,结合预设流量预警规则,发出网络流量预警。
在一种实施例中,还包括第二预警模块,用于:根据所述设备性能异常预测信息,结合预设性能异常预警规则,发出设备性能异常预警。
图6示例了一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行运维监控网络维护方法,该方法包括:
基于运维监控网络的拓扑关系,得到网络流量序列数据和设备性能序列数据;
根据所述网络流量序列数据,通过第一运维监控模型预测运维监控网络流量,得到网络流量预测信息;
根据所述设备性能序列数据,通过第二运维监控模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息;
根据所述网络流量预测信息和所述设备性能异常预测信息,通过第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的运维监控网络维护方法,该方法包括:
基于运维监控网络的拓扑关系,得到网络流量序列数据和设备性能序列数据;
根据所述网络流量序列数据,通过第一运维监控模型预测运维监控网络流量,得到网络流量预测信息;
根据所述设备性能序列数据,通过第二运维监控模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息;
根据所述网络流量预测信息和所述设备性能异常预测信息,通过第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的运维监控网络维护方法,该方法包括:
基于运维监控网络的拓扑关系,得到网络流量序列数据和设备性能序列数据;
根据所述网络流量序列数据,通过第一运维监控模型预测运维监控网络流量,得到网络流量预测信息;
根据所述设备性能序列数据,通过第二运维监控模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息;
根据所述网络流量预测信息和所述设备性能异常预测信息,通过第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种运维监控网络维护方法,其特征在于,包括:
基于运维监控网络的拓扑关系,得到网络流量序列数据和设备性能序列数据;
根据所述网络流量序列数据,通过第一运维监控模型预测运维监控网络流量,得到网络流量预测信息;
根据所述设备性能序列数据,通过第二运维监控模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息;
根据所述网络流量预测信息和所述设备性能异常预测信息,通过第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息;
所述第二运维监控模型包括了第二特征提取模型和第二预测模型,根据所述设备性能序列数据,通过第二运维监控模型的第二特征提取模型和第二预测模型来预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息,包括:
根据所述设备性能序列数据,通过第二特征提取模型得到设备性能特征;
根据所述设备性能特征,通过第二预测模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息;
所述设备性能序列数据包括CPU序列数据、内存序列数据和温度序列数据;
所述根据所述设备性能序列数据,通过第二特征提取模型得到设备性能特征,包括:
根据所述CPU序列数据,通过第三特征提取子模型得到时间维度上的CPU使用率特征;
根据所述内存序列数据,通过第四特征提取子模型得到时间维度上的内存使用率特征;
根据所述温度序列数据,通过第五特征提取子模型得到时间维度上的温度特征;
利用第二注意力机制融合所述CPU使用率特征、所述内存使用率特征和所述温度特征,得到设备性能特征;
利用第二注意力机制,通过下式融合CPU使用率特征、内存使用率特征和温度特征,得到表达能力更强的设备性能特征,以提高设备性能异常预测信息的准确性;
在上式中,表示CPU使用率特征级数展开之后的常数项,/>表示CPU使用率特征级数展开之后的第一振幅特征值,/>表示CPU使用率特征级数展开之后的第二振幅特征值,中n表示组别序号,/>表示频率,t表示时间,/>表示内存使用率特征级数展开之后的常数项,/>表示内存使用率特征级数展开之后的第一振幅特征值,/>表示内存使用率特征级数展开之后的第二振幅特征值,/>表示温度特征级数展开之后的常数项,/>表示温度特征级数展开之后的第一振幅特征值,/>表示温度特征级数展开之后的第二振幅特征值,H表示融合得到的设备性能特征,cos表示余弦函数,/>表示正弦函数。
2.根据权利要求1所述的运维监控网络维护方法,其特征在于,所述第一运维监控模型包括了第一特征提取模型和第一预测模型,根据所述网络流量序列数据,通过第一运维监控模型的第一特征提取模型和第一预测模型来预测运维监控网络流量,得到网络流量预测信息,包括:
根据所述网络流量序列数据,通过第一特征提取模型得到网络流量特征;
根据所述网络流量特征,通过第一预测模型预测运维监控网络流量,得到网络流量预测信息。
3.根据权利要求2所述的运维监控网络维护方法,其特征在于,所述网络流量序列数据包括流量速率序列数据和流量数据包序列数据;
所述根据所述网络流量序列数据,通过第一特征提取模型得到网络流量特征,包括:
根据所述流量速率序列数据,通过第一特征提取子模型得到时间维度上的流量速率特征;
根据所述流量数据包序列数据,通过第二特征提取子模型得到时间维度上的流量数据包特征;
利用第一注意力机制融合所述流量速率特征和所述流量数据包特征,得到网络流量特征。
4.根据权利要求1所述的运维监控网络维护方法,其特征在于,所述根据所述网络流量预测信息和所述设备性能异常预测信息,通过第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息,包括:
利用第三注意力机制融合所述网络流量预测信息和所述设备性能异常预测信息,得到运维监控特征;
根据所述运维监控特征,通过所述第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息。
5.根据权利要求2所述的运维监控网络维护方法,其特征在于,在所述根据所述网络流量特征,通过第一预测模型预测运维监控网络流量,得到网络流量预测信息之后,包括:
根据所述网络流量预测信息,结合预设流量预警规则,发出网络流量预警。
6.根据权利要求4所述的运维监控网络维护方法,其特征在于,在所述根据所述设备性能序列数据,通过第二运维监控模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息之后,包括:
根据所述设备性能异常预测信息,结合预设性能异常预警规则,发出设备性能异常预警。
7.一种运维监控网络维护系统,其特征在于,如权利要求1至6任一项所述运维监控网络维护方法的步骤,包括:
获取模块,用于:基于运维监控网络的拓扑关系,得到网络流量序列数据和设备性能序列数据;
第一预测模块,用于:根据所述网络流量序列数据,通过第一运维监控模型预测运维监控网络流量,得到网络流量预测信息;
第二预测模块,用于:根据所述设备性能序列数据,通过第二运维监控模型预测运维监控网络的设备性能异常问题,得到设备性能异常预测信息;
第三预测模块,用于:根据所述网络流量预测信息和所述设备性能异常预测信息,通过第三运维监控模型预测运维监控网络的异常问题,得到运维监控网络的待维护信息。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述运维监控网络维护方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310722792.2A CN116471196B (zh) | 2023-06-19 | 2023-06-19 | 运维监控网络维护方法、系统及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310722792.2A CN116471196B (zh) | 2023-06-19 | 2023-06-19 | 运维监控网络维护方法、系统及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116471196A CN116471196A (zh) | 2023-07-21 |
CN116471196B true CN116471196B (zh) | 2023-10-20 |
Family
ID=87175735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310722792.2A Active CN116471196B (zh) | 2023-06-19 | 2023-06-19 | 运维监控网络维护方法、系统及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116471196B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116828513A (zh) * | 2023-08-31 | 2023-09-29 | 长春市鑫鸿图科技有限公司 | 一种移动通信网络实时维护方法 |
CN117896163A (zh) * | 2024-01-29 | 2024-04-16 | 广州卓冠科技有限公司 | 一种网络流量监控系统 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105323111A (zh) * | 2015-11-17 | 2016-02-10 | 南京南瑞集团公司 | 一种运维自动化系统及方法 |
CN108900546A (zh) * | 2018-08-13 | 2018-11-27 | 杭州安恒信息技术股份有限公司 | 基于lstm的时间序列网络异常检测的方法与装置 |
CN110278102A (zh) * | 2018-03-15 | 2019-09-24 | 勤智数码科技股份有限公司 | 一种it自动化运维系统和方法 |
CN110942137A (zh) * | 2019-10-18 | 2020-03-31 | 云南电网有限责任公司信息中心 | 一种基于深度学习的电网信息运维监控方法 |
WO2022011977A1 (zh) * | 2020-07-15 | 2022-01-20 | 中国科学院深圳先进技术研究院 | 一种网络异常检测方法、系统、终端以及存储介质 |
CN113965397A (zh) * | 2021-10-28 | 2022-01-21 | 公诚管理咨询有限公司 | 信创网络安全管理方法、装置、计算机设备以及存储介质 |
CN113988183A (zh) * | 2021-10-29 | 2022-01-28 | 深圳市光网世纪科技有限公司 | 一种计算机网络数据流量监测系统及方法 |
WO2022048168A1 (zh) * | 2020-09-03 | 2022-03-10 | 上海上讯信息技术股份有限公司 | 一种用于故障预测神经网络模型的训练方法与设备 |
WO2022077951A1 (zh) * | 2020-10-16 | 2022-04-21 | 鹏城实验室 | 基于深度学习的sketch网络测量方法及电子设备 |
CN115146726A (zh) * | 2022-06-30 | 2022-10-04 | 北京比特易湃信息技术有限公司 | 一种基于机器学习的智能运维中kpi异常预警方法 |
CN115664939A (zh) * | 2022-12-28 | 2023-01-31 | 中国电子科技集团公司第十五研究所 | 一种基于自动化技术的综合运维方法、装置和存储介质 |
WO2023016159A1 (zh) * | 2021-08-12 | 2023-02-16 | 北京邮电大学 | 智慧城市网络流量预测方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11796993B2 (en) * | 2021-05-12 | 2023-10-24 | Yokogawa Electric Corporation | Systems, methods, and devices for equipment monitoring and fault prediction |
-
2023
- 2023-06-19 CN CN202310722792.2A patent/CN116471196B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105323111A (zh) * | 2015-11-17 | 2016-02-10 | 南京南瑞集团公司 | 一种运维自动化系统及方法 |
CN110278102A (zh) * | 2018-03-15 | 2019-09-24 | 勤智数码科技股份有限公司 | 一种it自动化运维系统和方法 |
CN108900546A (zh) * | 2018-08-13 | 2018-11-27 | 杭州安恒信息技术股份有限公司 | 基于lstm的时间序列网络异常检测的方法与装置 |
CN110942137A (zh) * | 2019-10-18 | 2020-03-31 | 云南电网有限责任公司信息中心 | 一种基于深度学习的电网信息运维监控方法 |
WO2022011977A1 (zh) * | 2020-07-15 | 2022-01-20 | 中国科学院深圳先进技术研究院 | 一种网络异常检测方法、系统、终端以及存储介质 |
WO2022048168A1 (zh) * | 2020-09-03 | 2022-03-10 | 上海上讯信息技术股份有限公司 | 一种用于故障预测神经网络模型的训练方法与设备 |
WO2022077951A1 (zh) * | 2020-10-16 | 2022-04-21 | 鹏城实验室 | 基于深度学习的sketch网络测量方法及电子设备 |
WO2023016159A1 (zh) * | 2021-08-12 | 2023-02-16 | 北京邮电大学 | 智慧城市网络流量预测方法及系统 |
CN113965397A (zh) * | 2021-10-28 | 2022-01-21 | 公诚管理咨询有限公司 | 信创网络安全管理方法、装置、计算机设备以及存储介质 |
CN113988183A (zh) * | 2021-10-29 | 2022-01-28 | 深圳市光网世纪科技有限公司 | 一种计算机网络数据流量监测系统及方法 |
CN115146726A (zh) * | 2022-06-30 | 2022-10-04 | 北京比特易湃信息技术有限公司 | 一种基于机器学习的智能运维中kpi异常预警方法 |
CN115664939A (zh) * | 2022-12-28 | 2023-01-31 | 中国电子科技集团公司第十五研究所 | 一种基于自动化技术的综合运维方法、装置和存储介质 |
Non-Patent Citations (1)
Title |
---|
基于模糊PID控制的网络异常流量监控设计;王俊士;;科技通报(05);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116471196A (zh) | 2023-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116471196B (zh) | 运维监控网络维护方法、系统及设备 | |
CN111885012B (zh) | 基于多种网络设备信息采集的网络态势感知方法及系统 | |
CN110351118B (zh) | 根因告警决策网络构建方法、装置和存储介质 | |
CN109831386B (zh) | 一种sdn下基于机器学习的最优路径选择算法 | |
US10958506B2 (en) | In-situ OAM (IOAM) network risk flow-based “topo-gram” for predictive flow positioning | |
CN114630352B (zh) | 一种接入设备的故障监测方法和装置 | |
US20200134421A1 (en) | Assurance of policy based alerting | |
CN107872457B (zh) | 一种基于网络流量预测进行网络操作的方法及系统 | |
CN110460454B (zh) | 基于深度学习的网络设备端口故障智能预测方法 | |
CN113542039A (zh) | 一种通过ai算法定位5g网络虚拟化跨层问题的方法 | |
CN111385106B (zh) | 一种用于故障根因的识别方法、装置和设备 | |
CN114513470A (zh) | 网络流量控制方法、装置、设备及计算机可读存储介质 | |
CN117093461A (zh) | 一种时延检测分析的方法、系统、设备和存储介质 | |
CN112508316B (zh) | 实时异常检测系统中的自适应异常判定方法和装置 | |
CN116723136B (zh) | 应用fcm聚类算法的网络检测数据的方法 | |
CN110647086B (zh) | 一种基于运行大数据分析的智能运维监控系统 | |
CN114640573A (zh) | 网络设备故障处理系统 | |
CN114205214B (zh) | 一种电力通信网络故障识别方法、装置、设备及存储介质 | |
Tang et al. | Intelligent awareness of delay-sensitive internet traffic in digital twin network | |
CN116016150A (zh) | 物理网络的预警方法、装置、电子设备、存储介质 | |
CN113595786B (zh) | 一种叶脊网络结构的性能监测方法及装置 | |
TWI718778B (zh) | 聯網裝置及其流量預估方法 | |
CN116522213A (zh) | 业务状态级别分类及分类模型训练方法、电子设备 | |
CN117376084A (zh) | 故障检测方法、电子设备及其介质 | |
CN112711510A (zh) | 一种业务连续性运行监测自动适配方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |