CN112039715A - 一种网络系统容量预测方法及系统 - Google Patents

一种网络系统容量预测方法及系统 Download PDF

Info

Publication number
CN112039715A
CN112039715A CN201910482376.3A CN201910482376A CN112039715A CN 112039715 A CN112039715 A CN 112039715A CN 201910482376 A CN201910482376 A CN 201910482376A CN 112039715 A CN112039715 A CN 112039715A
Authority
CN
China
Prior art keywords
models
prediction
model
network system
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910482376.3A
Other languages
English (en)
Inventor
巫忠正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201910482376.3A priority Critical patent/CN112039715A/zh
Publication of CN112039715A publication Critical patent/CN112039715A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种网络系统容量的预测方法及装置,其中该方法包括:对网络系统的历史数据进行筛选和转化;根据所述筛选和转化后的网络系统的历史数据的特点,选择一个或多个模型并进行模型训练;使用所述一个或多个模型对所述网络系统的容量进行预测。本发明实施例提供的技术方案提高了网络系统容量预测的准确性。

Description

一种网络系统容量预测方法及系统
技术领域
本发明属于一种预测方法,尤其涉及一种网络系统容量预测系统。
背景技术
近年来,随着企业网络技术的发展和互联网应用的普及,有越来越多的设备连接到网络,网络异常的出现将变得不可避免。如何提高系统可靠性一直以来都是研究的重点,根据系统出现异常时的处理模式,这些研究的方向主要可以分为系统恢复和异常监测,异常监测是基于对系统的历史和当前状态的分析,以便确定系统是否异常,进而有助于系统避免异常或尽快采取措施恢复。
异常监测基于一个前提,即异常行为与正常用户行为存在差异,且这种差异可以进行定性或定量的描述。目前的异常监测方法在处理数据量、准确性、可靠性方面存在不足。
发明内容
本发明提供了一种系统日志的分析方法和系统,以解决传统异常检测中处理数据量小、准确性、可靠性不足的问题。
根据本发明的一个实施例,提供了一种网络系统容量的预测方法,包括:一种网络系统容量的预测方法,包括:对网络系统的历史数据进行筛选和转化;根据所述筛选和转化后的网络系统的历史数据的特点,选择一个或多个模型并进行模型训练;使用所述一个或多个模型对所述网络系统的容量进行预测。
可选地,使用所述一个或多个模型对所述网络系统容量进行预测后,还包括:当模型为多个时,通过集成学习的方法降低预测结果的方差。
可选地,通过集成学习的方法降低预测结果的方差,包括:所述集成学习使用所述多个模型,通过加权线性组合策略集成所述多个模型的预测结果,其中预测权重根据所述多个模型的历史预测记录决定。
可选地,通过加权线性组合策略集成所述多个模型的预测结果,还包括:所述加权线性组合策略公式为:
Figure BDA0002084264620000021
Figure BDA0002084264620000022
模型p为所述多个模型中的一个,
Figure BDA0002084264620000023
是所述模型p在时间点t的预测结果;
Figure BDA0002084264620000024
是所述模型p在时间点t时,在所述多个模型预测结果中的权重;
Figure BDA0002084264620000025
是所述多个模型在时间点t时,各个模型预测结果与各自权重之积的和。
可选地,其中预测权重根据所述多个模型的历史预测记录决定,包括:计算出所述多个模型之一的模型在某一时间点的相对误差;再对所述相对误差进行归一化,求出所述多个模型之一的模型的预测权重。
可选地,计算出所述多个模型之一的模型在某一时间点的相对误差;再对所述相对误差进行归一化,求出所述多个模型之一的模型的预测权重,包括:求所述相对误差的公式为:
Figure BDA0002084264620000026
其中,
Figure BDA0002084264620000027
表示所述多个模型中的一个模型i在时间点t的预测结果,
Figure BDA0002084264620000028
表示所述多个模型中的一个模型p在时间点t的预测结果,ei (t)表示所述模型i在时间点t的相对误差;对所述相对误差进行归一化的公式为:
Figure BDA0002084264620000029
其中Wi (t)表示所述多个模型中的一个模型i在时间t的预测权重。
可选地,根据所述筛选和转化后的网络系统的历史数据的特点,选择一个或多个模型并进行模型训练,所述一个或多个模型为以下模型中的一个或多个:滑动平均、自回归预测、神经网络、支持向量机、基因表达式。
根据本发明的一个实施例,提供了一种网络系统容量的预测系统,包括数据收集模块、模型训练模块、预测模块:所述数据收集模块用于对网络系统的历史数据进行筛选和转化;所述模型训练模块用于根据所述筛选和转化后的历史数据的特点,选择一个或多个模型并进行模型训练;所述预测模块用于使用所述一个或多个模型对所述网络系统容量进行预测。
可选的,预测系统还包括:集成学习模块,当模型为多个时,用于通过集成学习的方法降低预测结果的方差。
可选地,所述一个或多个模型为以下模型中的一个或多个:滑动平均、自回归预测、神经网络、支持向量机、基因表达式。
在本发明的上述实施例中,在收集到网络日志的正常样本后通过选择模型并进行模型训练,对网络系统容量进行预测,并通过加权线性组合策略集成多个预测模型的预测结果,进一步提高了预测结果的准确性和稳定性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的网络系统容量的预测方法的流程图;
图2是根据本发明实施例的网络系统容量预测系统的结构框图;
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本发明实施例中提供了一种网络系统容量的预测方法,图1是根据本发明实施例的流程图,如图1所示,该流程包括如下步骤:
步骤S101,对网络系统的历史数据进行筛选和转化;
步骤S102,根据所述筛选和转化后的网络系统的历史数据的特点,选择模型并进行模型训练;
步骤S103,使用所述模型对所述网络系统容量进行预测。
在步骤S101中,对网络系统的历史数据进行分析、转化以及预处理,筛选掉无关数据及属性,并把有用的原始数据转化为预测模型可用的格式。
在步骤S102中,根据筛选和转化后的网络系统的历史数据的特点进行模型选择及训练,由于网络系统的动态特性,模型选择及训练会使用最新的数据定期重复执行。当模型训练完后,保存所有模型的相关参数并更新已有模型。
其中预测模型共有5种,分别是滑动平均、自回归预测、神经网络、支持向量机、基因表达式,五种模型的相关描述见表1:
Figure BDA0002084264620000041
表1
在步骤103中,根据训练好的模型对网络系统容量进行预测,通过每种训练后的模型算出对应的预测结果。
在步骤103之后,通过集成学习的方法来降低上述预测模型预测结果的方差。集成学习的方法为,根据每种模型的预测结果,基于每种模型的权重,将各个模型的预测结果求和。假设预测模型p(p相当于五种预测模型中的一种,p∈P相当于五种模型的集合)在时间点t的预测结果为
Figure BDA0002084264620000051
且它在时间点t对应的权重为
Figure BDA0002084264620000052
(可以在各算法权重之和等于1的情况下自由分配,但是可能影响预测结果)则在时间点t针对某个日志的预测值为:
Figure BDA0002084264620000053
Figure BDA0002084264620000054
先计算出模型i在时间点t的相对误差ei (t),再对相对误差进行归一化,求出模型p的预测权重Wi (t)
Figure BDA0002084264620000055
是模型i算出的预测结果,公式为:
Figure BDA0002084264620000056
其中预测结果
Figure BDA0002084264620000057
还可以由本方法提出的非对称错误代价函数(AsymmetricError Cost,AEC)计算得出。
其中所述非对称错误代价函数(AEC),方法如下:
AEC是一种非对称的异质错误代价函数,由过高预测和过低预测是两种不同的代价构成,相应的,使用和
Figure BDA0002084264620000058
来表示它们,其中v(s)表示在未来时间点s时的异常数量,而
Figure BDA0002084264620000059
表示在未来时间点s时的异常预测数量。
假设准确预测的代价为Cnormal,过低预测的代价为Cunder,过高预测的代价为Cover,通常情况下,Cunder是不确定的,但是可以确定的是Cunder Cnormal,则ACE代价函数中的P函数可以描述为:
Figure BDA00020842646200000510
而ACE代价函数中的R函数可以表示为:
Figure BDA00020842646200000511
因此总的代价函数可以表示为:
Figure BDA0002084264620000061
其中β是用于调整两种代价权重的参数。借着这个参数,可以通过β值的变化来人为调整过高预测和过低预测的代价构成权重。
在本发明实施例中提供了一种网络系统容量的预测装置,图2是根据本发明实施例的装置图,如图2所示,该装置包括:
数据收集模块,用于对网络系统的历史数据进行筛选和转化;
所述模型训练模块,用于根据所述筛选和转化后的历史数据的特点,选择一个或多个模型并进行模型训练;
所述预测模块,用于使用所述一个或多个模型对所述网络系统容量进行预测;
集成学习模块,当模型为多个时,用于通过集成学习的方法降低预测结果的方差。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

Claims (10)

1.一种网络系统容量的预测方法,包括:
对网络系统的历史数据进行筛选和转化;
根据所述筛选和转化后的网络系统的历史数据的特点,选择一个或多个模型并进行模型训练;
使用所述一个或多个模型对所述网络系统的容量进行预测。
2.如权利要求1所述的方法,使用所述一个或多个模型对所述网络系统容量进行预测后,还包括:
当模型为多个时,通过集成学习的方法降低预测结果的方差。
3.如权利要求2所述的方法,通过集成学习的方法降低预测结果的方差,包括:
所述集成学习使用所述多个模型,通过加权线性组合策略集成所述多个模型的预测结果,其中预测权重根据所述多个模型的历史预测记录决定。
4.如权利要求3所述的方法,通过加权线性组合策略集成所述多个模型的预测结果,包括:
所述加权线性组合策略公式为:
Figure FDA0002084264610000011
Figure FDA0002084264610000012
模型p为所述多个模型中的一个,
Figure FDA0002084264610000013
是所述模型p在时间点t的预测结果;
Figure FDA0002084264610000014
是所述模型p在时间点t时,在所述多个模型预测结果中的权重;
Figure FDA0002084264610000021
是所述多个模型在时间点t时,各个模型预测结果与各自权重之积的和。
5.如权利要求3所述的方法,其中预测权重根据所述多个模型的历史预测记录决定,包括:
计算出所述多个模型之一的模型在某一时间点的相对误差;再对所述相对误差进行归一化,求出所述多个模型之一的模型的预测权重。
6.如权利要求5所述的方法,计算出所述多个模型之一的模型在某一时间点的相对误差;再对所述相对误差进行归一化,求出所述多个模型之一的模型的预测权重,包括:
求所述相对误差的公式为:
Figure FDA0002084264610000022
其中,
Figure FDA0002084264610000023
表示所述多个模型中的一个模型i在时间点t的预测结果,
Figure FDA0002084264610000024
表示所述多个模型中的一个模型p在时间点t的预测结果,ei (t)表示所述模型i在时间点t的相对误差;
对所述相对误差进行归一化的公式为:
Figure FDA0002084264610000025
其中Wi (t)表示所述多个模型中的一个模型i在时间t的预测权重。
7.如权利要求1至6任一项所述的方法,根据所述筛选和转化后的网络系统的历史数据的特点,选择一个或多个模型并进行模型训练,所述一个或多个模型为以下模型中的一个或多个:
滑动平均、自回归预测、神经网络、支持向量机、基因表达式。
8.一种网络系统容量的预测系统,包括数据收集模块、模型训练模块、预测模块:
所述数据收集模块用于对网络系统的历史数据进行筛选和转化;
所述模型训练模块用于根据所述筛选和转化后的历史数据的特点,选择一个或多个模型并进行模型训练;
所述预测模块用于使用所述一个或多个模型对所述网络系统容量进行预测。
9.如权利要求8所述的系统,还包括:
集成学习模块,当模型为多个时,用于通过集成学习的方法降低预测结果的方差。
10.如权利要求8所述的系统,所述一个或多个模型为以下模型中的一个或多个:滑动平均、自回归预测、神经网络、支持向量机、基因表达式。
CN201910482376.3A 2019-06-04 2019-06-04 一种网络系统容量预测方法及系统 Withdrawn CN112039715A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910482376.3A CN112039715A (zh) 2019-06-04 2019-06-04 一种网络系统容量预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910482376.3A CN112039715A (zh) 2019-06-04 2019-06-04 一种网络系统容量预测方法及系统

Publications (1)

Publication Number Publication Date
CN112039715A true CN112039715A (zh) 2020-12-04

Family

ID=73576372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910482376.3A Withdrawn CN112039715A (zh) 2019-06-04 2019-06-04 一种网络系统容量预测方法及系统

Country Status (1)

Country Link
CN (1) CN112039715A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114697108A (zh) * 2022-03-29 2022-07-01 山东省计算中心(国家超级计算济南中心) 基于集成学习的系统日志异常检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
倪震等: "面向电力大数据日志分析平台的异常监测集成预测算法", 《南京理工大学学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114697108A (zh) * 2022-03-29 2022-07-01 山东省计算中心(国家超级计算济南中心) 基于集成学习的系统日志异常检测方法

Similar Documents

Publication Publication Date Title
US20220277225A1 (en) Method and device for detecting anomalies, corresponding computer program and non-transitory computer-readable medium
US10248528B2 (en) System monitoring method and apparatus
US9129228B1 (en) Robust and fast model fitting by adaptive sampling
CN110705598B (zh) 智能模型管理方法、装置、计算机设备及存储介质
WO2020134442A1 (zh) 磁盘故障的预测方法、设备及存储介质
CN110209560B (zh) 数据异常检测方法及检测装置
EP3382938A1 (en) A computer implemented method, a system and computer programs to forecast the performance of a network
CN114202256B (zh) 架构升级预警方法、装置、智能终端及可读存储介质
CN112039715A (zh) 一种网络系统容量预测方法及系统
CN110543869A (zh) 滚珠丝杠寿命预测方法、装置、计算机设备及存储介质
CN113836241A (zh) 时序数据分类预测方法、装置、终端设备及存储介质
CN116010228B (zh) 面向网络安全扫描的时间预估方法及装置
AU2021269196B2 (en) Performance event troubleshooting system
CN115904916A (zh) 一种硬盘故障预测的方法、装置、电子设备以及存储介质
CN112152968B (zh) 网络威胁检测方法和装置
CN114610590A (zh) 作业运行时长确定方法、装置、设备及存储介质
CN111353626A (zh) 数据的审核方法、装置及设备
CN110858355A (zh) 项目预算结余预测方法及装置
CN113703974A (zh) 一种预测服务器容量的方法及装置
CN112785000A (zh) 面向大规模机器学习系统的机器学习模型训练方法及系统
CN116610484B (zh) 一种模型训练方法、故障预测方法、系统、设备以及介质
CN111177465A (zh) 一种确定类别的方法及装置
JP2020135739A (ja) 障害予兆検知システム
CN117275644B (zh) 基于深度学习的检测结果互认方法、系统及存储介质
CN112882822B (zh) 生成负载预测模型的方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20201204

WW01 Invention patent application withdrawn after publication