CN116032359A - 特征网络数据的预测方法、系统及电子设备 - Google Patents
特征网络数据的预测方法、系统及电子设备 Download PDFInfo
- Publication number
- CN116032359A CN116032359A CN202211689650.2A CN202211689650A CN116032359A CN 116032359 A CN116032359 A CN 116032359A CN 202211689650 A CN202211689650 A CN 202211689650A CN 116032359 A CN116032359 A CN 116032359A
- Authority
- CN
- China
- Prior art keywords
- network
- parameters
- data
- network data
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000013528 artificial neural network Methods 0.000 claims abstract description 40
- 230000003287 optical effect Effects 0.000 claims abstract description 21
- 230000008859 change Effects 0.000 claims abstract description 5
- 230000015654 memory Effects 0.000 claims description 26
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000003062 neural network model Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 4
- 230000010354 integration Effects 0.000 claims description 4
- 230000014759 maintenance of location Effects 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000013475 authorization Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000000306 component Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 206010027175 memory impairment Diseases 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本公开提供一种特征网络数据的预测方法、系统及电子设备,以解决PON口速率预测不准确的技术问题,所述方法包括:获取第一现网数据,第一现网数据包括O域系统、B域系统和M域系统中与所述特征网络相关的数据;整合第一现网数据的所有参数字段,获取特征网络的待测参数的特征参数,得到第二现网数据,第二现网数据包括特征参数和待测参数的值,待测参数包括速率、流量或者容量;根据各个地区的特征网络的待测参数变化趋势将所有地区分为多个不同的标签组;分别为每一个标签组的第二现网数据构建神经网络,并分别通过对应的神经网络为各个标签组进行特征网络的待测参数的预测。本公开可以更精确的对PON口速率进行预测,助力精准扩容。
Description
技术领域
本公开涉及通信技术领域,具体涉及一种特征网络数据的预测方法,一种特征网络数据的预测系统,以及一种电子设备。
背景技术
在网络通信中,随着宽带应用的日益普及,特别是虚拟现实(Virtual Reality,VR)、增强现实(Augmented Reality,AR)等新型业务的开展,一方面,用户对于运营商网络质量的要求日益增高;另一方面,各运营商之间在网络领域的竞争也愈发激烈。基于以上两点,对运营商在通信网络的规划建设、运营维护方面提出了更高的要求。
在上述众多要求中,一个迫切的需求是清晰的挖掘出影响无源光纤网络(PassiveOptical Network,PON)口速率的关键因素并构建速率模型进而预测PON口速率指导扩容。而在现有PON系统中,通常是依据一线人员的经验来指定影响PON口速率的因素,并没有实际的数值依据,扩容也多是依据用户投诉被动扩容,另外PON口参数不是简单线性关系,是全参量多方位的,难以依据简单的线性模型做分析,所以依据经验预测得到的PON口速率通常存在较大误差,无法为PON口扩容提供有效的规划。
发明内容
为了至少解决现有技术中存在的PON口速率预测不准确的技术问题,本公开提供一种特征网络数据的预测方法、特征网络数据的预测系统、以及电子设备,可以学习不同类型地区的PON口速率趋势,预测未来一段时间内有相似规律地区的PON口速率,为上层网络预计容量压力,为接入网规划、建设、业务升级提供速率预测模型,助力精准扩容。
第一方面,本公开提供一种特征网络数据的预测方法,所述方法包括:
获取第一现网数据,所述第一现网数据包括O域(operation support system,简称OSS,又称运营域)系统、B域(business support system,简称BSS,又称业务域)系统和M域(management support system,简称MSS,又称管理域)系统中与所述特征网络相关的数据;
整合第一现网数据的所有参数字段,获取所述特征网络的待测参数的特征参数,得到第二现网数据,所述第二现网数据包括特征参数和待测参数的值,所述待测参数包括速率、流量或者容量;
根据各个地区的特征网络的待测参数变化趋势将所有地区分为多个不同的标签组;
分别为每一个标签组的第二现网数据构建神经网络,并分别通过对应的神经网络为各个标签组进行特征网络的待测参数的预测。
进一步的,所述特征网络包括无源光纤网络PON口,所述特征网络的待测参数包括PON口速率。
进一步的,所述整合第一现网数据的所有参数字段包括:
依据PON口IP和端口号将第一现网数据中各个数据的参数字段进行整合,其中,每一条数据为一个PON口预设周期内的数据。
进一步的,所述获取所述特征网络的待测参数的特征参数包括:
对整合后的第一现网数据的各个参数字段的出现概率和关联性进行计算,得到K个特征参数字段,K为正整数;
其中,所述特征参数字段对应的支持度大于或等于第一阈值,且所述特征参数字段对应的置信度大于或等于第二阈值,所述支持度用于指示参数字段出现的频率,所述置信度用于指示所述参数字段之间的关联规则。
进一步的,所述根据各个地区的特征网络的待测参数变化趋势将所有地区分为多个不同的标签组,包括:
分别构建各个地区的特征网络的待测参数的时间-待测参数曲线,并通过曲线拟合配对方法聚类出时间-待测参数曲线具有相似趋势的地区特征网络;
将特征网络的待测参数的时间-待测参数曲线具有相似趋势的地区设定为同一标签组。
进一步的,所述曲线拟合配对方法包括:
令A地区-B地区的最佳路径表示为x()
计算x(1,1)=y(1,1) 公式1
计算第一列x(1,j)=x(1,j-1)+y(1,j) 公式2
计算第一行x(i,1)=x(i-1,1)+y(i,1) 公式3
x(i,2)= min(x(i,1),x(i-1,1),x(i-1,2))+y(i,2) 公式4
从左到右计算:
x(i,j)= min(x(i-1,j)+x(i,j-1)+x(i-1,j-1)) +y(i,j) 公式5
其中,i≥2,j≥2,A地区的时间-待测参数曲线为A(A1、A2、A3…),B地区的时间-待测参数曲线为B(B1、B2、B3…),y(i,j)=|Aj-Bi|;
回溯x(n,m)->x(1,1)的最佳路径;
通过以下公式(6)计算最佳路径的计算值为:
将曲线两两比较,并将最佳路径的计算值小于等于第三阈值的曲线判定为相似曲线,并将相似的曲线打上相同的标签算为一个标签组。
进一步的,所述方法还包括:
将不同标签组中具有同一个地区的多个标签组合并为一个标签组。
进一步的,所述分别为每一个标签组的第二现网数据构建神经网络包括:
对每一个标签组,将第二现网数据的特征参数和待测参数的值作为神经网络输入训练样本的x值和和y值;
将输入的特征参数进行归一化处理;
通过神经网络细胞单元状态控制并传递记忆信息,捕获输入数据的时序特征,神经网络每个细胞单元具体的计算公式如下:
ft=σ(Wf.[ht-1,xt]+bf)
it=σ(Wi.[ht-1,xt]+bi)
ot=σ(Wo.[ht-1,xt]+bo)
ht=ot×tanh(Ct),
其中Wf表示遗忘门对应的权值向量,bf表示偏置量,б表示sigmoid函数,输出0至1之间的数字,0表示完全遗忘,1表示全部保留;Wi、bi表示输入门权值向量和偏置量,Wc、bc表示候选状态、候选门权值和偏置量,Ct表示更新后的当前时刻细胞状态;Ot表示输出门得到的细胞输出;Wo、bo表示输出门权值和偏置量,ht表示细胞单元的输出量;
通过既定的迭代次数之后分布式构建各个标签组用于预测的神经网络模型。
第二方面,本公开提供一种特征网络数据的预测系统,所述预测系统包括:
获取模块,其设置为获取第一现网数据,所述第一现网数据包括运营域O域系统、业务域B域系统和管理域M域系统中与所述特征网络相关的数据;
整合模块,其设置为整合第一现网数据的所有参数字段,获取所述特征网络的待测参数的特征参数,得到第二现网数据,所述第二现网数据包括特征参数和待测参数的值,所述待测参数包括速率、流量或者容量;
分组模块,其设置为根据各个地区的特征网络的待测参数变化趋势将所有地区分为多个不同的标签组;
预测模块,其设置为分别为每一个标签组的第二现网数据构建神经网络,并分别通过对应的神经网络为各个标签组进行特征网络的待测参数的预测。
第三方面,本公开提供一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器执行如第一方面中任一所述的特征网络数据的预测方法。
第四方面,本公开提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一所述的特征网络数据的预测方法。
有益效果:
本公开提供的特征网络数据的预测方法、预测系统及电子设备,可以先确定影响特征网络待测参数的关键影响因子,剔除冗余因子提高后续预测模型运行效率,考虑到各个地区特征网络数量众多,单独为每个特征网络待测参数构建一个预测模型复杂度较高,而不同地区趋势特征网络待测参数不可能完全统一,如果统一学习会影响模型准确率,而本申请技术方案通过学习不同类型地区的特征网络待测参数变化趋势,预测未来一段时间内有相似规律地区的特征网络待测参数。辅助运营商一线员工构建各专业网速率或者流量的预测模型,为上层网络预计容量压力,为网络规划、建设、业务升级提供更合适的预测模型,助力精准扩容。
附图说明
图1为本公开提供的一种PON的结构示意;
图2为本公开实施例一提供的一种特征网络数据的预测方法的流程示意图;
图3为本公开实施例一提供的一种曲线拟合配对过程计算得到的x(i,j)的示意图;
图4为本公开实施例一提供的一种曲线拟合配对过程计算最佳路径的计算值的示意图;
图5为本公开实施例一提供的某两个地区的PON口上行和下行速率的时间-速率曲线图;
图6为本公开实施例一提供的一种神经网络模型结构示意图;
图7为本公开实施例一提供的一种神经网络每个细胞单元图;
图8为本公开实施例二提供的一种特征网络数据的预测系统的架构图;
图9为本公开实施例三提供的一种电子设备的架构图。
具体实施方式
为使本领域技术人员更好地理解本公开的技术方案,下面结合附图和实施例对本公开作进一步详细描述。应当理解的是,此处描述的具体实施例和附图仅仅用于解释本发明,而非对本发明的限定。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序;并且,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互任意组合。
其中,在本公开实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本公开的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
下面以具体地实施例对本公开的技术方案以及本公开的技术方案如何解决现有技术中存在的上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
本申请实施例的技术方案可用于各种通信系统,例如无源光纤网络(PassiveOptical Network,PON)。
参见图1,为本申请提供的一种PON的结构示意图。该PON包括光线路终端(opticalline terminal,OLT)、光分配网(optical distribution network,ODN)和光网络终端(optical network terminal,ONT)。
其中,OLT是PON网络的核心部件,用于提供面向用户的PON网络的光纤接口,相当于传统通信网中的交换机和路由器,一般放置在局端。ONT是PON中的用户端设备,用于为用户提供语音、数据和多媒体等业务,例如可以为光猫。OND用于在OLT和ONT之间提供光传输通道。
其中,PON中的无源指ODN中不含有任何电子器件及电子电源,全部由分光器等无源器件组成,避免了外部设备的电磁干扰和雷电影响,减少了线路和外部设备的故障率,提高了网络可靠性,同时节省了维护成本。
其中,OLT的下行端口称为PON口。PON口一般与ODN中的分光器相连。一个PON口对应一个分光器,一个分光器对应多个ONT。
下面将结合附图,对本申请实施例提供的方法进行展开说明。可以理解的,本申请实施例中,执行主体可以执行本申请实施例中的部分或全部步骤,这些步骤或操作仅是示例,本申请实施例还可以执行其它操作或者各种操作的变形。此外,各个步骤可以按照本申请实施例呈现的不同的顺序来执行,并且有可能并非要执行本申请实施例中的全部操作。
图2为本公开实施例一提供的一种特征网络数据的预测方法的流程示意图,如图2所示,所述方法包括:
步骤S101:获取第一现网数据,所述第一现网数据包括O域系统、B域系统和M域中与所述特征网络相关的数据;
在本公开实施例中,特征网络可以是接入网侧(包括无线和有线)、传输网侧、承载网侧、核心网侧的各种特定网络,通过获取在各个域与所述特征网络相关的数据,收集所有与特征网络数据相关数据,从而为后续找出影响特征网络待测参数的特征因子打下良好基础,以PON口速率预测为例,第一现网数据包括PON口上的数据、经分系统中PON口对应的数据、AAA(authentication authorization accounting,认证授权计费)系统中PON口对应的数据、以及号线系统中PON口对应的数据。也就是说,第一现网数据包括PON口上的数据以及其他系统中与PON口对应的数据。
其中,经分系统,即经营分析系统,用于基于运营商的经营数据对经营状况进行分析。AAA系统,用于验证用户的身份和可以使用的网络服务,依据验证结果向用户开放网络服务,记录用户对各种网络服务的用量,并提供给计费系统。号线系统,用于对通信网的局站、机房、交换机、接入网、数据网、分光器、交接设备、固网号码资源、本地网地址信息等信息进行管理。
步骤S102:整合第一现网数据的所有参数字段,获取所述特征网络的待测参数的特征参数,得到第二现网数据,所述第二现网数据包括特征参数和待测参数的值,所述待测参数包括速率、流量或者容量;
在第一现网数据存在多种参数字段,数据较为杂乱,为了将数据进行统一,需要对数据进行整合,并找出其中影响待测参数较大的因子,即特征参数,根据因此场景不同,待测参数也不同,如速率、流量或者容量等。比如说核心网容量预测,每一条数据是某一天的一个核心网网元设备信息,特征参数是该网元对应的特征参数,包括如时间、4G/5G开户用户数、活动用户数、市场发展目标、终端网上用户、注册态用户数、业务网上用户等特征参数,预测该网元容量。
再以PON口速率为例,将数据和PON口对应后,依据PON口IP和端口号将第一现网数据中各个数据的参数字段进行整合,其中,每一条数据是一个PON口预设周期内的数据。预设周期的时间粒度可用精确到天,当然,预设周期星期也可以根据需要预测的情况自主设置,如固定天数,或者星期、月等。
将数据整合后,由于参数字段中的数据并不一定都与PON口速率密切相关,通过获取PON口速率的特征参数,确定影响PON口速率的关键影响因子,剔除冗余因子提高后续预测模型运行效率。
具体的,对整合后的第一现网数据的各个参数字段的出现概率和关联性进行计算,得到K个特征参数字段,K为正整数;
其中,所述特征参数字段对应的支持度大于或等于第一阈值,且所述特征参数字段对应的置信度大于或等于第二阈值,所述支持度用于指示参数字段出现的频率,所述置信度用于指示所述参数字段之间的关联规则。
优选的,在关联挖掘影响PON口速率的因素时,对整合后的所有参数字段,通过参数字段的出现频率计算出参数字段的支持度:
支持度=包括该参数字段的数据条数/总数据条数;
选择支持度满足第一阈值条件下的参数字段,计算参数字段的置信度,如第一参数字段与第二参数字段(一般为PON口速率)之间的关联规则;
第一参数字段的置信度=包括第一参数字段和第二参数字段的数据条数/包括第一特征字段的条数。
挖掘出的置信度满足第二阈值所对应的参数字段可被考虑成为影响PON口速率的特征参数。
优选的,对于参数字段,通过项目集合表示,通过计算高频项目集合:
高频项目集合=(关联事物的数量)/整理出来数据的总条数;
找出高频项目集合中的强关联:
挖掘出的强关联=关联事物的数量/挖掘出的关联事物之一出现的数量;
选择满足最小高频项目集合阈值的条件下,满足最小挖掘出的关联关系阈值所对应的特征参数可被考虑成为影响PON口速率的特征参数。最主要的是找出和PON口速率强关联的特征参数。
示例性的,涉及的特征字段可以包括大公商类型、非对称数字用户线路(asymmetric digital subscriber line,ADSL)速率、用户套餐等,本申请对具体的特征字段不做限定。
步骤S103:根据各个地区的特征网络的待测参数变化趋势将所有地区分为多个不同的标签组;
具体的,分别构建各个地区的特征网络的待测参数的时间-待测参数曲线,并通过曲线拟合配对方法聚类出时间-待测参数曲线具有相似趋势的地区特征网络;
将特征网络的待测参数的时间-待测参数曲线具有相似趋势的地区设定为同一标签组。
对于PON口,考虑到PON口数量众多,单独为每个PON口构建一个速率预测模型复杂度较高,而不同地区PON口速率趋势不可能完全统一,如果统一学习会影响模型准确率,因此,本实施例通过学习不同类型地区的PON口速率趋势,预测未来一段时间内有相似规律地区的PON口速率;如不同城市,人口流动在某些时间点,如春节前后可能具有相同的趋势,其对应的PON口速率趋势可能也具有相似的趋势;可根据这些地区历史数据中的PON速率变化趋势将某些地区分为同一个标签组。
进一步的,所述曲线拟合配对方法包括:
令A地区-B地区的最佳路径表示为x()
计算x(1,1)=y(1,1) 公式1
计算第一列x(1,j)=x(1,j-1)+y(1,j) 公式2
计算第一行x(i,1)=x(i-1,1)+y(i,1) 公式3
x(i,2)= min(x(i,1),x(i-1,1),x(i-1,2))+y(i,2) 公式4
从左到右计算:
x(i,j)= min(x(i-1,j)+x(i,j-1)+x(i-1,j-1)) +y(i,j) 公式5
其中,i≥2,j≥2,A地区的时间-待测参数曲线为A(A1、A2、A3…),B地区的时间-待测参数曲线为B(B1、B2、B3…),y(i,j)=|Aj-Bi|;
回溯x(n,m)->x(1,1)的最佳路径;
通过以下公式(6)计算最佳路径的计算值为:
将曲线两两比较,并将最佳路径的计算值小于等于第三阈值的曲线判定为相似曲线,并将相似的曲线打上相同的标签算为一个标签组。
如图3和图4所示,以A地区(1、3、5、8、2)和B地区(1、4、3、2、6)为例,计算得到的x(i,j)如图3所示,回溯x(n,m)->x(1,1)的最佳路径为其中加粗字样,图4为路径涉及到的两个序列点与点之间的距离,通过计算得到最佳路径的计算值为21/7=3。判断得到的计算值是否小于等于第三阈值,若是则判定为相似曲线,若不是,则判断为非相似曲线,第三阈值可以根据实际情况设定。如图5为某两个地区的PON口上行和下行速率的时间-速率曲线,通过曲线拟合配对后可判定为相似曲线。
进一步的,所述方法还包括:
将不同标签组中具有同一个地区的多个标签组合并为一个标签组。
比较每一组和每一组之间是否存在共同的曲线,如果存在,则合并(比如A-B,B-C,都存在B,那就A-B-C合在一起算为一个新组),去掉原有组标签,重新打一个新标签设为一个大组。进一步减少所需模型数量。
步骤S104:分别为每一个标签组的第二现网数据构建神经网络,并分别通过对应的神经网络为各个标签组进行特征网络的待测参数的预测。
分别为每一个标签组的第二现网数据构建神经网络,神经网络的输入为对应标签组内的第二现网数据,即训练样本的x值(特征参数)和y值(特征网络的待测参数值,如PON口速率),设定需要学习的数据,如历史多少天内的数据,需要预测的数据,未来多少天的PON口速率,特征参数个数,未来的第一天和历史最后一天之间的间隔天数,迭代次数。神经网络的输出为未来多少天的速率值。在神经网络训练完成后,根据训练好的神经网络模型,为各个标签组进行PON口速率的预测,不再依据一线人员的经验预测PON口速率,降低了人为主观因素对预测速率的影响,减小了PON口的预测速率与实际速率之间的误差,从而使得PON口的扩容有数据依据,能够更准确科学的指导PON口的扩容。
进一步的,所述分别为每一个标签组的第二现网数据构建神经网络包括:
对每一个标签组,将第二现网数据的特征参数和待测参数的值作为神经网络输入训练样本的x值和和y值;
将输入的特征参数进行归一化处理;
通过神经网络细胞单元状态控制并传递记忆信息,捕获输入数据的时序特征,神经网络每个细胞单元具体的计算公式如下:
ft=σ(Wf.[ht-1,xt]+bf)
it=σ(Wi.[ht-1,xt]+bi)
ot=σ(Wo.[ht-1,xt]+bo)
ht=ot×tanh(Ct),
其中Wf表示遗忘门对应的权值向量,bf表示偏置量,б表示sigmoid函数,输出0至1之间的数字,0表示完全遗忘,1表示全部保留;Wi、bi表示输入门权值向量和偏置量,Wc、bc表示候选状态、候选门权值和偏置量,Ct表示更新后的当前时刻细胞状态;Ot表示输出门得到的细胞输出;Wo、bo表示输出门权值和偏置量,ht表示细胞单元的输出量;
通过既定的迭代次数之后分布式构建各个标签组用于预测的神经网络模型。
神经网络模型结构如图6所示,其中xt表示t时刻的输入,即训练样本的x值;yt表示t时刻的输出,即训练样本的y值;ht表示神经网络细胞单元t时刻的输出;Ct表示神经网络细胞单元状态,用于控制并传递记忆信息,捕获输入数据的时序特征。
神经网络每个细胞单元如图7所示,通过神经网络每个细胞单元计算公式状态控制并传递记忆信息,获得下一细胞单元的输入参数,通过既定的迭代次数之后构建对应标签组用于预测的神经网络模型。
进一步的,将第二现网数据分为训练集和验证集,训练集和验证集的比例为2:1,对训练后的神经网络,分析预测结果与实际结果之间的差异,为每一组构建的神经网络确定最佳模型参数迭代值。
在得到最终模型后,对于各个地区,通过其测试集数据和所在标签组的神经网络模型,进行预测未来一段时间内的特征网络的待测参数(如PON口速率);优先的,还可以将同一个标签组进行测试数据合并,为组内所有地区进行整体预测。
本公开实施例应用到PON口速率预测时,先确定影响PON口速率的关键影响因子,剔除冗余因子提高后续预测模型运行效率,并通过学习不同类型地区的PON口速率趋势,预测未来一段时间内有相似规律地区的PON口速率。辅助运营商一线员工构建接入网速率模型,为上层网络预计容量压力,为接入网规划、建设、业务升级提供速率预测模型,助力精准扩容。
图8为本公开实施例二提供的一种特征网络数据的预测系统的结构示意图,如图8所示,所述预测系统包括:
获取模块11,其设置为获取第一现网数据,所述第一现网数据包括运营域O域系统、业务域B域系统和管理域M域系统中与所述特征网络相关的数据;
整合模块12,其设置为整合第一现网数据的所有参数字段,获取所述特征网络的待测参数的特征参数,得到第二现网数据,所述第二现网数据包括特征参数和待测参数的值,所述待测参数包括速率、流量或者容量;
分组模块13,其设置为根据各个地区的特征网络的待测参数变化趋势将所有地区分为多个不同的标签组;
预测模块14,其设置为分别为每一个标签组的第二现网数据构建神经网络,并分别通过对应的神经网络为各个标签组进行特征网络的待测参数的预测。
进一步的,所述特征网络包括PON口,所述特征网络的待测参数包括PON口速率。
进一步的,所述整合模块12具体设置为依据PON口IP和端口号将第一现网数据中各个数据的参数字段进行整合,其中,每一条数据是一个PON口预设周期内的数据。
进一步的,所述整合模块12具体还设置为:
对整合后的第一现网数据的各个参数字段的出现概率和关联性进行计算,得到K个特征参数字段,K为正整数;
其中,所述特征参数字段对应的支持度大于或等于第一阈值,且所述特征参数字段对应的置信度大于或等于第二阈值,所述支持度用于指示参数字段出现的频率,所述置信度用于指示所述参数字段之间的关联规则。
进一步的,所述分组模块13具体设置为:
分别构建各个地区的特征网络的待测参数的时间-待测参数曲线,并通过曲线拟合配对方法聚类出时间-待测参数曲线具有相似趋势的地区特征网络;以及,
将特征网络的待测参数的时间-待测参数曲线具有相似趋势的地区设定为同一标签组。
进一步的,所述曲线拟合配对方法包括:
令A地区-B地区的最佳路径表示为x()
计算x(1,1)=y(1,1) 公式1
计算第一列x(1,j)=x(1,j-1)+y(1,j) 公式2
计算第一行x(i,1)=x(i-1,1)+y(i,1) 公式3
x(i,2)=min(x(i,1),x(i-1,1),x(i-1,2))+y(i,2) 公式4
从左到右计算:
x(i,j)=min(x(i-1,j)+x(i,j-1)+x(i-1,j-1))+y(i,j) 公式5
其中,i≥2,j≥2,A地区的时间-待测参数曲线为A(A1、A2、A3…),B地区的时间-待测参数曲线为B(B1、B2、B3…),y(i,j)=|Aj-Bi|;
回溯x(n,m)->x(1,1)的最佳路径;
通过以下公式(6)计算最佳路径的计算值为:
将曲线两两比较,并将最佳路径的计算值小于等于第三阈值的曲线判定为相似曲线,并将相似的曲线打上相同的标签算为一个标签组。
进一步的,所述分组模块13还设置为将不同标签组中具有同一个地区的多个标签组合并为一个标签组。
进一步的,所述预测模块14具体设置为:
对每一个标签组,将第二现网数据的特征参数和待测参数的值作为神经网络输入训练样本的x值和y值;
将输入的特征参数进行归一化处理;
通过神经网络细胞单元状态控制并传递记忆信息,捕获输入数据的时序特征,神经网络每个细胞单元具体的计算公式如下:
ft=σ(Wf.[ht-1,xt]+bf)
it=σ(Wi.[ht-1,xt]+bi)
ot=σ(Wo.[ht-1,xt]+bo)
ht=ot×tanh(Ct),
其中Wf表示遗忘门对应的权值向量,bf表示偏置量,б表示sigmoid函数,输出0至1之间的数字,0表示完全遗忘,1表示全部保留;Wi、bi表示输入门权值向量和偏置量,Wc、bc表示候选状态、候选门权值和偏置量,Ct表示更新后的当前时刻细胞状态;Ot表示输出门得到的细胞输出;Wo、bo表示输出门权值和偏置量,ht表示细胞单元的输出量;
通过既定的迭代次数之后分布式构建各个标签组用于预测的神经网络模型。
本公开实施例可以先确定影响PON口速率的关键影响因子,剔除冗余因子提高后续预测模型运行效率,考虑到PON口数量众多,单独为每个PON口构建一个速率预测模型复杂度较高,不同地区PON口速率趋势不可能完全统一,如果统一学习会影响模型准确率,而本申请技术方案通过学习不同类型地区的PON口速率趋势,预测未来一段时间内有相似规律地区的PON口速率。辅助运营商一线员工构建接入网速率模型,为上层网络预计容量压力,为接入网规划、建设、业务升级提供速率预测模型,助力精准扩容。
本公开实施例的特征网络数据的预测系统用于实施方法实施例一中的特征网络数据的预测方法,所以描述的较为简单,具体可以参见前面方法实施例一中的相关描述,此处不再赘述。
此外,如图9所示,本公开实施例三还提供一种电子设备,包括存储器100和处理器200,所述存储器100中存储有计算机程序,当所述处理器200运行所述存储器100存储的计算机程序时,所述处理器200执行上述各种可能的方法。
其中,存储器100与处理器200连接,存储器100可采用闪存或只读存储器或其他存储器,处理器200可采用中央处理器或单片机。
此外,本公开实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行上述各种可能的方法。
该计算机可读存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、计算机程序模块或其他数据)的任何方法或技术中实施的易失性或非易失性、可移除或不可移除的介质。计算机可读存储介质包括但不限于RAM(Random Access Memory,随机存取存储器),ROM(Read-Only Memory,只读存储器),EEPROM(Electrically ErasableProgrammable read only memory,带电可擦可编程只读存储器)、闪存或其他存储器技术、CD-ROM(Compact Disc Read-Only Memory,光盘只读存储器),数字多功能盘(DVD,DigitalVideo Disc)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。
可以理解的是,以上实施方式仅仅是为了说明本公开的原理而采用的示例性实施方式,然而本公开并不局限于此。对于本领域内的普通技术人员而言,在不脱离本公开的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本公开的保护范围。
Claims (10)
1.一种特征网络数据的预测方法,其特征在于,所述方法包括:
获取第一现网数据,所述第一现网数据包括运营域O域系统、业务域B域系统和管理域M域系统中与所述特征网络相关的数据;
整合第一现网数据的所有参数字段,获取所述特征网络的待测参数的特征参数,得到第二现网数据,所述第二现网数据包括特征参数和待测参数的值,所述待测参数包括速率、流量或者容量;
根据各个地区的特征网络的待测参数变化趋势将所有地区分为多个不同的标签组;
分别为每一个标签组的第二现网数据构建神经网络,并分别通过对应的神经网络为各个标签组进行特征网络的待测参数的预测。
2.根据权利要求1所述的预测方法,其特征在于,所述特征网络包括无源光纤网络PON口,所述特征网络的待测参数包括PON口速率。
3.根据权利要求2所述的方法,其特征在于,所述整合第一现网数据的所有参数字段包括:
依据PON口IP和端口号将第一现网数据中各个数据的参数字段进行整合,其中,每一条数据为一个PON口预设周期内的数据。
4.根据权利要求3所述的预测方法,其特征在于,所述获取所述特征网络的待测参数的特征参数包括:
对整合后的第一现网数据的各个参数字段的出现概率和关联性进行计算,得到K个特征参数字段,K为正整数;
其中,所述特征参数字段对应的支持度大于或等于第一阈值,且所述特征参数字段对应的置信度大于或等于第二阈值,所述支持度用于指示参数字段出现的频率,所述置信度用于指示所述参数字段之间的关联规则。
5.根据权利要求1所述的预测方法,其特征在于,所述根据各个地区的特征网络的待测参数变化趋势将所有地区分为多个不同的标签组,包括:
分别构建各个地区的特征网络的待测参数的时间-待测参数曲线,并通过曲线拟合配对方法聚类出时间-待测参数曲线具有相似趋势的地区特征网络;
将特征网络的待测参数的时间-待测参数曲线具有相似趋势的地区设定为同一标签组。
6.根据权利要求5所述的预测方法,其特征在于,所述曲线拟合配对方法包括:
令A地区-B地区的最佳路径表示为x()
计算x(1,1)=y(1,1)公式1
计算第一列x(1,j)=x(1,j-1)+y(1,j)公式2
计算第一行x(i,1)=x(i-1,1)+y(i,1)公式3
x(i,2)= min(x(i,1),x(i-1,1),x(i-1,2))+y(i,2) 公式4
从左到右计算:
x(i,j)= min(x(i-1,j)+x(i,j-1)+x(i-1,j-1)) +y(i,j) 公式5
其中,i≥2,j≥2,A地区的时间-待测参数曲线为A(A1、A2、A3…),B地区的时间-待测参数曲线为B(B1、B2、B3…),y(i,j)=|Aj-Bi|;
回溯x(n,m)->x(1,1)的最佳路径;
通过以下公式(6)计算最佳路径的计算值为:
将曲线两两比较,并将最佳路径的计算值小于等于第三阈值的曲线判定为相似曲线,并将相似的曲线打上相同的标签算为一个标签组。
7.根据权利要求6所述的预测方法,其特征在于,所述方法还包括:
将不同标签组中具有同一个地区的多个标签组合并为一个标签组。
8.根据权利要求1或7所述的预测方法,其特征在于,所述分别为每一个标签组的第二现网数据构建神经网络包括:
对每一个标签组,将第二现网数据的特征参数和待测参数的值作为神经网络输入训练样本的x值和y值;
将输入的特征参数进行归一化处理;
通过神经网络细胞单元状态控制并传递记忆信息,捕获输入数据的时序特征,神经网络每个细胞单元具体的计算公式如下:
ft=σ(Wf.[ht-1,xt]+bf)
it=σ(Wi.[ht-1,xt]+bi)
ot=σ(Wo.[ht-1,xt]+bo)
ht=ot×tanh(Ct),
其中Wf表示遗忘门对应的权值向量,bf表示偏置量,б表示sigmoid函数,输出0至1之间的数字,0表示完全遗忘,1表示全部保留;Wi、bi表示输入门权值向量和偏置量,Wc、bc表示候选状态、候选门权值和偏置量,Ct表示更新后的当前时刻细胞状态;Ot表示输出门得到的细胞输出;Wo、bo表示输出门权值和偏置量,ht表示细胞单元的输出量;
通过既定的迭代次数之后分布式构建各个标签组用于预测的神经网络模型。
9.一种特征网络数据的预测系统,其特征在于,所述预测系统包括:
获取模块,其设置为获取第一现网数据,所述第一现网数据包括运营域O域系统、业务域B域系统和管理域M域系统中与所述特征网络相关的数据;
整合模块,其设置为整合第一现网数据的所有参数字段,获取所述特征网络的待测参数的特征参数,得到第二现网数据,所述第二现网数据包括特征参数和待测参数的值,所述待测参数包括速率、流量或者容量;
分组模块,其设置为根据各个地区的特征网络的待测参数变化趋势将所有地区分为多个不同的标签组;
预测模块,其设置为分别为每一个标签组的第二现网数据构建神经网络,并分别通过对应的神经网络为各个标签组进行特征网络的待测参数的预测。
10.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器执行如权利要求1-8中任一项所述的特征网络数据的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211689650.2A CN116032359B (zh) | 2022-12-27 | 特征网络数据的预测方法、系统及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211689650.2A CN116032359B (zh) | 2022-12-27 | 特征网络数据的预测方法、系统及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116032359A true CN116032359A (zh) | 2023-04-28 |
CN116032359B CN116032359B (zh) | 2024-09-24 |
Family
ID=
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107067028A (zh) * | 2017-03-16 | 2017-08-18 | 华南理工大学 | 基于分布式聚类的网络流量时间序列预测方法 |
CN109587008A (zh) * | 2018-12-28 | 2019-04-05 | 华为技术服务有限公司 | 检测异常流量数据的方法、装置及存储介质 |
CN109698836A (zh) * | 2019-02-01 | 2019-04-30 | 重庆邮电大学 | 一种基于深度学习的无线局域网入侵检测方法和系统 |
CN110659779A (zh) * | 2019-09-26 | 2020-01-07 | 国网湖南省电力有限公司 | 一种基于长短期记忆网络的配电系统网损预测方法 |
CN111654489A (zh) * | 2020-05-27 | 2020-09-11 | 杭州迪普科技股份有限公司 | 一种网络安全态势感知方法、装置、设备及存储介质 |
CN112101431A (zh) * | 2020-08-30 | 2020-12-18 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 电子设备故障诊断系统 |
CN112418939A (zh) * | 2020-11-24 | 2021-02-26 | 中国科学技术大学先进技术研究院 | 基于神经网络挖掘房价时空关联性以预测房价的方法 |
CN112581262A (zh) * | 2020-12-23 | 2021-03-30 | 百维金科(上海)信息科技有限公司 | 一种基于鲸鱼算法优化lvq神经网络的欺诈行为检测方法 |
CN113453096A (zh) * | 2021-06-04 | 2021-09-28 | 中国联合网络通信集团有限公司 | 一种无源光网络pon口流量的预测方法及装置 |
CN114048889A (zh) * | 2021-10-08 | 2022-02-15 | 天津大学 | 基于长短期记忆网络的飞行器轨迹预测的方法 |
CN114219024A (zh) * | 2021-12-14 | 2022-03-22 | 中国科学院计算机网络信息中心 | 一种网络边缘的应用级流量预测与模型迁移方法 |
EP4024212A1 (en) * | 2020-12-29 | 2022-07-06 | Telefonica Digital España, S.L.U. | Method for scheduling interference workloads on edge network resources |
CN115201608A (zh) * | 2022-07-26 | 2022-10-18 | 广东粤电靖海发电有限公司 | 一种基于神经网络的电厂设备运行参数监测方法 |
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107067028A (zh) * | 2017-03-16 | 2017-08-18 | 华南理工大学 | 基于分布式聚类的网络流量时间序列预测方法 |
CN109587008A (zh) * | 2018-12-28 | 2019-04-05 | 华为技术服务有限公司 | 检测异常流量数据的方法、装置及存储介质 |
CN109698836A (zh) * | 2019-02-01 | 2019-04-30 | 重庆邮电大学 | 一种基于深度学习的无线局域网入侵检测方法和系统 |
CN110659779A (zh) * | 2019-09-26 | 2020-01-07 | 国网湖南省电力有限公司 | 一种基于长短期记忆网络的配电系统网损预测方法 |
CN111654489A (zh) * | 2020-05-27 | 2020-09-11 | 杭州迪普科技股份有限公司 | 一种网络安全态势感知方法、装置、设备及存储介质 |
CN112101431A (zh) * | 2020-08-30 | 2020-12-18 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 电子设备故障诊断系统 |
CN112418939A (zh) * | 2020-11-24 | 2021-02-26 | 中国科学技术大学先进技术研究院 | 基于神经网络挖掘房价时空关联性以预测房价的方法 |
CN112581262A (zh) * | 2020-12-23 | 2021-03-30 | 百维金科(上海)信息科技有限公司 | 一种基于鲸鱼算法优化lvq神经网络的欺诈行为检测方法 |
EP4024212A1 (en) * | 2020-12-29 | 2022-07-06 | Telefonica Digital España, S.L.U. | Method for scheduling interference workloads on edge network resources |
CN113453096A (zh) * | 2021-06-04 | 2021-09-28 | 中国联合网络通信集团有限公司 | 一种无源光网络pon口流量的预测方法及装置 |
CN114048889A (zh) * | 2021-10-08 | 2022-02-15 | 天津大学 | 基于长短期记忆网络的飞行器轨迹预测的方法 |
CN114219024A (zh) * | 2021-12-14 | 2022-03-22 | 中国科学院计算机网络信息中心 | 一种网络边缘的应用级流量预测与模型迁移方法 |
CN115201608A (zh) * | 2022-07-26 | 2022-10-18 | 广东粤电靖海发电有限公司 | 一种基于神经网络的电厂设备运行参数监测方法 |
Non-Patent Citations (1)
Title |
---|
黄国伦;诸葛丽强;杨乐;磨唯;: "基于LSTM的电力通信流量预测", 中国科技信息, no. 1, 15 February 2020 (2020-02-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113627566B (zh) | 一种网络诈骗的预警方法、装置和计算机设备 | |
CN111191897A (zh) | 基于双向gru神经网络的业务流程在线合规性预测方法及系统 | |
CN105471647B (zh) | 一种电力通信网故障定位方法 | |
CN113189451A (zh) | 配电网故障定位研判方法、系统、计算机设备和存储介质 | |
CN103250376B (zh) | 用于执行与通信网络的节点有关的预测分析的方法和系统 | |
CN112565422B (zh) | 一种对电力物联网故障数据的识别方法、系统和存储介质 | |
CN112396135A (zh) | 一种融合通信网络流量异常检测方法及系统 | |
CN111884832A (zh) | 一种获取无源网络拓扑信息的方法及相关设备 | |
CN115858606A (zh) | 时序数据的异常检测方法、装置、设备及存储介质 | |
CN113688542A (zh) | 智能优化水资源配置方法、装置、计算机设备及存储介质 | |
CN116032359B (zh) | 特征网络数据的预测方法、系统及电子设备 | |
CN117519951A (zh) | 基于消息中台的实时数据处理方法及系统 | |
CN109241154A (zh) | 一种分布式数据库监控分析方法及系统 | |
CN117195045A (zh) | 网络障碍模型训练方法、装置、非易失性存储介质及电子设备 | |
CN116032359A (zh) | 特征网络数据的预测方法、系统及电子设备 | |
Christian et al. | Network Traffic Prediction Of Mobile Backhaul Capacity Using Time Series Forecasting | |
JP4780668B2 (ja) | トラヒック分析モデルの構築方法、装置および構築プログラムならびにその記憶媒体 | |
CN111343664A (zh) | 用户定位方法、装置、设备及介质 | |
Emerson et al. | Broadband network fault prediction using complex event processing and predictive analytics techniques | |
CN115720212A (zh) | 一种基于多源数据融合的网络流量预测及自动优化均衡方法 | |
CN114449569B (zh) | 用户流量使用量处理方法、网络设备及业务处理系统 | |
CN114943374A (zh) | 地铁od量预测方法、设备、存储介质 | |
CN116318386A (zh) | 光模块的失效预测方法及其系统、存储介质 | |
Gorshenin et al. | Mobile network traffic analysis based on probability-informed machine learning approach | |
CN113569938A (zh) | 基于时空域特征的业务大数据采集方法及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |