CN112884020B - 一种基于多尺度圆形卷积神经网络的业务质量预测方法 - Google Patents
一种基于多尺度圆形卷积神经网络的业务质量预测方法 Download PDFInfo
- Publication number
- CN112884020B CN112884020B CN202110126309.5A CN202110126309A CN112884020B CN 112884020 B CN112884020 B CN 112884020B CN 202110126309 A CN202110126309 A CN 202110126309A CN 112884020 B CN112884020 B CN 112884020B
- Authority
- CN
- China
- Prior art keywords
- layer
- output
- sample
- calculating
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 28
- 239000011159 matrix material Substances 0.000 claims abstract description 22
- 230000008447 perception Effects 0.000 claims abstract description 13
- 210000002569 neuron Anatomy 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 20
- 230000004913 activation Effects 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 210000004027 cell Anatomy 0.000 claims description 4
- 238000007477 logistic regression Methods 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 210000004205 output neuron Anatomy 0.000 description 5
- 238000005457 optimization Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/60—Business processes related to postal services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于多尺度圆形卷积神经网络的业务质量预测方法,包括生成业务感知样本训练集D0,还包括以下步骤:初始化数据参数;构造输入层的输入样本D;计算卷积层输出H1;计算全连接层输出H2;计算输出层输出;计算输出层损失、窗参W3和b3的梯度;计算L2全连接层损失窗参数W2和b2的梯度;计算L1卷积层损失窗参数W1和b1的梯度;更新窗参数;构造未知样本输入矩阵D';进行业务质量标记结果的预测。本发明提出的基于多尺度圆形卷积神经网络的业务质量预测方法,根据海量的用户业务感知历史数据,对用户在特定场景下的业务体验好坏做出预测和预警。
Description
技术领域
本发明涉及移动互联网业务质量预测的技术领域,特别是一种基于多尺度圆形卷积神经网络的业务质量预测方法。
背景技术
移动网络用户在使用OTT业务(如网页浏览,视频播放等)过程中,其业务体验的好坏一般可用一套KQI(关键质量指标)指标进行评价,比如网页打开时延、下载速率等。这种体验的好坏受多种因素的影响,包括终端质量、使用业务时所处位置的移动网络质量、APP质量、SP网站服务器集群的带宽和负荷等。
电信运营商作为各类业务的传输通道提供方和业务体验保障的关键环节,需要尽可能保障用户的业务体验,否则可能导致用户投诉甚至离网。
目前一般是电信运营商的网络运维和优化部门通过日常的网络优化作业来保障网络质量,但网络质量与用户的业务体验之间仍然存在较大的差异,好的网络质量并不一定能保障良好的业务体验(由于业务体验是受前述的众多因素的综合作用)。客服部门只有在接到用户投诉时才发现业务体验的问题,再去协调网络运维和优化部门去排查问题和解决,往往很被动。
如果能在日常的网络运营中持续监测用户的业务体验,并根据海量的用户业务感知历史数据(不同场景下的业务感知指标的好坏),对用户在特定场景下的业务体验好坏做出预测和预警,则有助于及早发现业务体验问题并及时采取相关措施进行改善,并有效降低投诉率和离网率。
公开号为CN110049129A的发明专利申请公开了一种基于特征选择的移动互联网业务质量预测方法,该方法的实现过程如下:步骤S1:构造训练样本集;步骤S2:计算特征权值;步骤S3:构造训练样本的k近邻样本集;步骤S4:计算先验概率和归一化频数矩阵;步骤S5:构造未知样本的k近邻样本集;步骤S6:计算未知样本的同标记统计;步骤S7:计算未知样本的似然概率;步骤S8:估计未知样本的标记值。该方法的缺点是当未知样本的近邻样本正负例标记平衡时的预测准确率较低。
发明内容
为了解决上述的技术问题,本发明提出的基于多尺度圆形卷积神经网络的业务质量预测方法,根据海量的用户业务感知历史数据,对用户在特定场景下的业务体验好坏做出预测和预警。
本发明的目的是提供一种基于多尺度圆形卷积神经网络的业务质量预测方法,包括生成业务感知样本训练集D0,还包括以下步骤:
步骤01:初始化数据参数;
步骤02:构造输入层的输入样本D;
步骤03:计算卷积层输出H1;
步骤04:计算全连接层输出H2;
步骤05:计算输出层输出;
步骤06:计算输出层损失、窗参W3和b3的梯度;
步骤07:计算L2全连接层损失窗参数W2和b2的梯度;
步骤08:计算L1卷积层损失窗参数W1和b1的梯度;
步骤09:更新窗参数;
步骤10:构造未知样本输入矩阵D';
步骤11:进行业务质量标记结果的预测。
优选的是,所述业务感知样本训练集D0包括N个样本,共F+L个维度,其中F为特征维度个数,L为标记维度个数(即KQI指标个数),D0为N×(F+L)矩阵。
在上述任一方案中优选的是,所述步骤01包括以下子步骤:
步骤011:初始化卷积窗参数W1,W2,W3,b1,b2,b3;
步骤012:基于D0构造邻接矩阵A0=[N×K],依次选择D0中每个样本作为中心样本,根据其F个特征值构造的特征向量在D0的所有N个样本构成的特征空间中基于欧氏距离准则寻找其前K个最近邻样本,按距离从小到大原则将这K个样本的样本编号排序,并按中心样本的序号存储在A0中的对应行,最终构造出N×K维矩阵。
在上述任一方案中优选的是,所述步骤012包括对A0中的各行样本计算该中心样本的前K2个近邻样本的标记进行混淆因子计算,即K2个近邻中正例标记近邻的占比。
在上述任一方案中优选的是,所述步骤012还包括当混淆因子为40%~60%时保留该样本,否则从A0中剔除。
在上述任一方案中优选的是,所述步骤02包括从D0中取1个训练样本,其标记矢量作为真实输出结果,从D0和A0中取该样本对应的K个近邻的标记值构成输入数据D=[K×L]=H0。
在上述任一方案中优选的是,所述步骤03包括从卷积窗W1取[K×L]…[25×L][16×L][9×L][4×L]各一种,共M=sqrt(K)-1种卷积窗,每种窗用Q个,卷积结果经ReLU判决后输出得到H1,即:
H1=ReLU(Z1)
其中,激活前输入值Z1=W1*H0+b1,W1和b1为该层的卷积窗参数和偏置项,*为卷积运算,H1为该层的输出。
在上述任一方案中优选的是,所述步骤04包括用Q个[M×L]的卷积窗W2对输入处理得到H2:
H2=W2*H1+b2
其中,W2和b2为该层的卷积窗参数和偏置项,j=1~L,H2为全连接层的输出。
在上述任一方案中优选的是,所述步骤05包括输出层神经元个数等于标记项个数L,用Logistic回归函数对神经元的输入进行处理得到输出Y={yj},j=1~L
其中,为该输出神经元的logistic激活前的值,/>和/>为输出层的卷积窗参数和偏置项。
在上述任一方案中优选的是,所述步骤06包括先根据预测结果和真实标记基于交叉熵损失函数计算得到各输出神经元的预测误差Lossj,再根据交叉熵损失函数计算输出层残差
j=1~L
该神经网络的总预测误差为:
神经元j的残差即为预测误差对该神经元输入值(激活前)的导数,即:
进一步,计算输出层参数的梯度:
其中,为输入样本的真实标记,y={yj}为输出的预测标记值(即该输入样本的各KQI指标的正例概率)。
在上述任一方案中优选的是,所述步骤07包括以下子步骤:
步骤071:计算本层卷积前的残差δ2,
步骤072:计算该层的卷积窗参数和/>的梯度,
在上述任一方案中优选的是,所述步骤08包括以下子步骤:
步骤081:将损失函数对L1层ReLU函数求偏导,即得L1层神经元的(卷积后,激活前)残差δ1,
其中,ReLU′(Z1)为ReLU对Z1各元素分别求导,⊙为哈达玛积;
步骤082:计算该层的卷积窗参数W1和b1的梯度,
在上述任一方案中优选的是,所述步骤09包括以下子步骤:
步骤91:根据设定的学习率,按梯度下降原则更新所述窗参数W1,W2,W3,b1,b2,b3;
步骤92:待N个训练样本全部迭代完毕或输出层损失收敛后得到最终的H-CNN模型。
在上述任一方案中优选的是,所述步骤10包括输入未知样本,计算其在训练样本空间D0中的K个近邻样本及其标记,得到矩阵D’。
在上述任一方案中优选的是,所述步骤11包括根据所述H-CNN模型,逐步前向计算后得到L个标记项的输出正例概率,硬判决后作为预测的标记结果,即该未知样本的L个业务质量KQI指标的预测值。
在上述任一方案中优选的是,所述步骤11还包括先根据D'对输入未知样本进行混淆因子计算,当混淆因子落在40%~60%范围之外时,采用基于kNN方法直接进行KQI指标的预测。
在上述任一方案中优选的是,如果混淆因子为40%~60%,再将D'输入H-CNN模型进行KQI指标的预测。
本发明提出了一种基于多尺度圆形卷积神经网络的业务质量预测方法,有助于及早发现业务体验问题并及时采取相关措施进行改善,并有效降低投诉率和离网率。
附图说明
图1为按照本发明的基于多尺度圆形卷积神经网络的业务质量预测方法的一优选实施例的流程图。
图2为按照本发明的基于多尺度圆形卷积神经网络的业务质量预测方法的另一优选实施例的流程图。
图3为按照本发明的基于多尺度圆形卷积神经网络的业务质量预测方法的H-CNN神经网络模型的一实施例的结构示意图。
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的阐述。
实施例一
如图1所述,执行步骤1000,生成业务感知样本训练集D0,业务感知样本训练集D0包括N个样本,共F+L个维度,其中F为特征维度个数,L为标记维度个数(即KQI指标个数),D0为N×(F+L)矩阵。
执行步骤1010,初始化数据参数。在本步骤中,步骤1011:初始化卷积窗参数W1,W2,W3,b1,b2,b3。
步骤1012:基于D0构造邻接矩阵A0=[N×K],依次选择D0中每个样本作为中心样本,根据其F个特征值构造的特征向量在D0的所有N个样本构成的特征空间中基于欧氏距离准则寻找其前K个最近邻样本。按距离从小到大原则将这K个样本的样本编号排序,并按中心样本的序号存储在A0中的对应行,最终构造出N×K维矩阵。对A0中的各行样本计算该中心样本的前K2个近邻样本(K2一般取15~20)的标记进行混淆因子计算,即K2个近邻中正例标记近邻的占比。当混淆因子为40%~60%时保留该样本,否则从A0中剔除。这样,所构建的A0矩阵中仅包含那些通过kNN方法无法有效处理的高度混淆样本,并在后续步骤中对这些样本进行训练、并用于其他高度混淆的未知样本的标记预测。
执行步骤1020,构造输入层的输入样本D,从D0中取1个训练样本,其标记矢量作为真实输出结果。从D0和A0中取该样本对应的K个近邻的标记值构成输入数据D=[K×L]=H0,在本事实例中,K=225。
执行步骤1030,计算卷积层输出H1,从卷积窗W1取[K×L]…[25×L][16×L][9×L][4×L]各一种,共M=sqrt(K)-1种卷积窗,每种窗用Q个(在本实施例中。Q取4或者8)。卷积结果经ReLU判决后输出得到H1,即:
H1=ReLU(Z1)
其中,激活前输入值Z1=W1*H0+b1,W1和b1为该层的卷积窗参数和偏置项,*为卷积运算,H1为该层的输出。
执行步骤1040,计算全连接层输出H2。用Q个[M×L]的卷积窗W2对输入处理得到H2:
H2=W2*H1+b2
其中,W2和b2为该层的卷积窗参数和偏置项,j=1~L,H2为全连接层的输出。
执行步骤1050,计算输出层输出。输出层神经元个数等于标记项个数L,用Logistic回归函数对神经元的输入进行处理得到输出Y={yj},j=1~L
其中,为该输出神经元的logistic激活前的值,/>和/>为输出层的卷积窗参数和偏置项。
执行步骤1060,计算输出层损失、窗参W3和b3的梯度;。先根据预测结果和真实标记基于交叉熵损失函数计算得到各输出神经元的预测误差Lossj,再根据交叉熵损失函数计算输出层残差
j=1~L
该神经网络的总预测误差为:
神经元j的残差即为预测误差对该神经元输入值(激活前)的导数,即:
进一步,计算输出层参数的梯度:
其中,为输入样本的真实标记,y={yj}为输出的预测标记值(即该输入样本的各KQI指标的正例概率)。
执行步骤1070,计算L2全连接层损失窗参数W2和b2的梯度。在本步骤中,步骤071:计算本层卷积前的残差δ2,/>
步骤072:计算该层的卷积窗参数和/>的梯度,
执行步骤1080,计算L1卷积层损失窗参数W1和b1的梯度。在本步骤中,步骤081:将损失函数对L1层ReLU函数求偏导,即得L1层神经元的(卷积后,激活前)残差δ1,
其中,ReLU′(Z1)为ReLU对Z1各元素分别求导,⊙为哈达玛积;
步骤082:计算该层的卷积窗参数W1和b1的梯度,
执行步骤1090,更新窗参数。在本步骤中,步骤91:根据设定的学习率,按梯度下降原则更新所述窗参数W1,W2,W3,b1,b2,b3;
步骤92:待N个训练样本全部迭代完毕或输出层损失收敛后得到最终的H-CNN模型。
执行步骤1100,构造未知样本输入矩阵D。输入未知样本,计算其在训练样本空间D0中的K个近邻样本及其标记,得到矩阵D'。
执行步骤1110,进行业务质量标记结果的预测。根据所述H-CNN模型,逐步前向计算后得到L个标记项的输出正例概率,硬判决后作为预测的标记结果,即该未知样本的L个业务质量KQI指标的预测值。先根据D'对输入未知样本进行混淆因子计算,当混淆因子落在40%~60%范围之外时,采用基于kNN方法直接进行KQI指标的预测即可。如果混淆因子为40%~60%,再将D'输入H-CNN模型进行KQI指标的预测。
实施例二
本发明提出了一种基于多尺度圆形卷积神经网络(H-CNN)的业务质量KQI预测方法。其中,H-CNN神经网络模型如图2所示。L0为输入层,L1卷积层,L2全连接层,L3输出层。
具体算法步骤的详细描述如下:
输入:
业务感知样本训练集D0:包括N个样本(顺序编号),共F+L个维度,其中F为特征维度个数,L为标记维度个数(即KQI指标个数),D0为N×(F+L)矩阵。
步骤S1:初始化
(1)初始化卷积窗参数W1,W2,W3,b1,b2,b3。
(2)构造邻接矩阵A0=[N×K]:基于D0构造得到,存储每个训练样本对应的K个近邻的样本编号,为N×K维矩阵。即取D0中每个样本,将其在N个样本的特征空间中根据欧氏距离搜索前K个近邻样本,将这些近邻样本按其与当前样本的欧氏距离从小到大排列,并记录近邻样本在D0中的编号存入A0中该样本对应行。
步骤S2:构造输入层的输入样本D
从D0中按顺序取1个训练样本,其标记矢量作为真实输出结果。从D0和A0中取该样本对应的225个近邻的标记值构成输入数据D=[K×L]=H0;
步骤S3:计算卷积层输出H1
卷积窗W1取[K×L]…[25×L][16×L][9×L][4×L]各一,共M=sqrt(K)-1种卷积窗,每种窗用4个。卷积结果经ReLU判决后输出得到H1,即:
H1=ReLU(Z1) (1)
其中,激活前输入值Z1=W1*H0+b1,W1和b1为该层的卷积窗参数和偏置项,*为卷积运算。
步骤S4:计算全连接层输出H2
用Q个[M×L]的卷积窗W2对输入处理得到H2:
H2=W2*H1+b2 (1)其中,W2和b2为该层的卷积窗参数和偏置项,j=1~L。
步骤S5:计算输出层输出
输出层神经元个数等于标记项个数L。用Logistic回归函数对神经元的输入进行处理得到输出Y={yj},j=1~L:
为该输出神经元的logistic激活前的值。
步骤S6:计算输出层损失和窗参梯度
先根据预测结果和真实标记基于交叉熵损失函数计算得到各输出神经
元的预测误差Lossj,再根据交叉熵损失函数计算输出层残差
该神经网络的总预测误差为:
Loss=∑jLossj (5)
神经元j的残差即为预测误差对该神经元输入值(激活前)的导数,即:
进一步,计算输出层参数的梯度:
步骤S7:计算L2全连接层损失窗参数W2梯度
首先计算本层卷积前的残差δ2:
进一步,计算该层的卷积窗参数和/>的梯度:
步骤S8:计算L1卷积层损失窗参数W1梯度将损失函数对L1层ReLU函数求偏导,即得L1层神经元的(卷积后,激活前)残差δ1:
其中,ReLU′(Z1)为ReLU对Z1各元素分别求导,⊙为哈达玛积。
进一步,计算该层的卷积窗参数W1和b1的梯度:
步骤S9:更新窗参
根据设定的学习率,按梯度下降原则更新窗参W1,W2,W3b1,b2,,b3。重复上述步骤S2~S9,待N个训练样本全部迭代完毕或输出层损失收敛后得到最终的H-CNN模型。
步骤S10:构造未知样本输入矩阵D'
输入未知样本,计算其在训练样本空间D0中的K个近邻样本及其标记,得到矩阵D';
步骤S11:业务质量标记结果的预测
根据该模型,逐步前向计算后得到L个标记项的输出正例概率,硬判决后作为预测的标记结果,即该未知样本的L个业务质量KQI指标的预测值。
实施例三
以网页浏览业务的KQI指标预测为例。
取近邻数K=225,业务特征数量F=13,业务标记(KQI指标)数量L=4,尺度数M=sqrt(K)-1=14(包括4,9,16,25,…,225)。
已知某城市的本地移动网络下(如北京移动的LTE网络),当用户在智能终端上使用网页浏览类业务App(如UCweb、QQ浏览器等)浏览预定义的目标网页集合(如新浪主页,搜狐主页等)中的某个网页时,通过部署在用户终端上的数据采集App等方式,获取此时的“网页浏览业务感知样本”;在一定时间范围内、从海量用户终端上采集的全部样本构成了“浏览业务感知样本集”。
网页浏览业务感知样本其所包含的信息(即样本字段)包括:日期,时间,网络制式,小区标识,终端当前经纬度,场强,信号质量,用户标识,终端标识,终端型号,浏览器App名称,浏览网站名称,浏览网站URL,浏览网站IP,DNS IP,首包时延,页面打开时延,DNS解析时延,TCP连接时延,GET请求时延,接收响应时延。
从上述样本的所有字段中选择其子集,即{日期,时间,经度,纬度,大区编号,小区编号,场强,信号质量,网站名称,网站IP,DNS IP,用户标识,终端型号},作为训练样本的属性集x={x1,x2,…,xd},d为属性集的维度,这里d=13;其中,属性字段{日期,时间,经度,纬度,场强,信号质量}为数值型数据,属性字段{大区编号,小区编号,网站名称,网站IP,DNSIP,用户标识,终端型号}为名目型数据;
从上述样本的所有字段中选择其子集,即{DNS解析时延,TCP连接时延,GET请求时延,接收响应时延},作为训练样本的标记即L=4,均为布尔型数据。
按上述步骤S1~S11即可对未知样本,即13个特征字段值已知、4个标记字段值未知的样本的标记字段值{DNS解析时延,TCP连接时延,GET请求时延,接收响应时延}做出预测。
为了更好地理解本发明,以上结合本发明的具体实施例做了详细描述,但并非是对本发明的限制。凡是依据本发明的技术实质对以上实施例所做的任何简单修改,均仍属于本发明技术方案的范围。本说明书中每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
Claims (6)
1.一种基于多尺度圆形卷积神经网络的业务质量预测方法,包括生成业务感知样本训练集D0,其特征在于,还包括以下步骤:
所述业务感知样本训练集D0包括N个样本,共F+L个维度,其中,F为特征维度个数,L为标记维度个数,即KQI指标个数,D0为N×(F+L)矩阵;
步骤01:初始化数据参数,包括以下子步骤:
步骤011:初始化卷积窗参数W1,W2,W3,b1,b2,b3;
步骤012:基于D0构造邻接矩阵A0=[N×K],依次选择D0中每个样本作为中心样本,根据其F个特征值构造的特征向量在D0的所有N个样本构成的特征空间中基于欧氏距离准则寻找其前K个最近邻样本,按距离从小到大原则将这K个样本的样本编号排序,并按中心样本的序号存储在A0中的对应行,最终构造出N×K维矩阵;
步骤02:构造输入层的输入样本D,从D0中取1个训练样本,其标记矢量作为真实输出结果,从D0和A0中取该样本对应的K个近邻的标记值构成输入数据D=[K×L]=H0;
步骤03:计算卷积层输出H1,从卷积窗W1取[K×L]…[25×L][16×L][9×L][4×L]各一种,共种卷积窗,每种窗用Q个,卷积结果经ReLU判决后输出得到H1,即:
H1=ReLU(Z1)
其中,K表示最近邻样本个数,L表示标记维度个数,激活前输入值Z1=W1*H0+b1,W1和b1为该层的卷积窗参数和偏置项,*为卷积运算,H1为该层的输出;
步骤04:计算全连接层输出H2;
步骤05:计算输出层输出;
步骤06:计算输出层损失、窗参W3和b3的梯度;
步骤07:计算L2全连接层损失窗参数W2和b2的梯度;
步骤08:计算L1卷积层损失窗参数W1和b1的梯度;
步骤09:更新窗参数;
步骤10:构造未知样本输入矩阵D';
步骤11:进行业务质量标记结果的预测;
所述业务为网页浏览业务,所述业务感知样本包含的信息包括:日期,时间,网络制式,小区标识,终端当前经纬度,场强,信号质量,用户标识,终端标识,终端型号,浏览器App名称,浏览网站名称,浏览网站URL,浏览网站IP,DNS IP,首包时延,页面打开时延,DNS解析时延,TCP连接时延,GET请求时延,接收响应时延。
2.如权利要求1所述的基于多尺度圆形卷积神经网络的业务质量预测方法,其特征在于,所述步骤04包括用L个[M×Q]的卷积窗W2对输入处理得到H2:
H2=W2*H1+b2
其中,W2和b2为该层的卷积窗参数和偏置项,j=1~L,H2为全连接层的输出。
3.如权利要求2所述的基于多尺度圆形卷积神经网络的业务质量预测方法,其特征在于,所述步骤05包括输出层神经元个数等于标记项个数L,用Logistic回归函数对神经元的输入进行处理得到输出Y={yj},j=1~L,
其中,为该输出层神经元的logistic激活前的值,/>和/>为输出层的卷积窗参数和偏置项。
4.如权利要求3所述的基于多尺度圆形卷积神经网络的业务质量预测方法,其特征在于,所述步骤06包括先根据预测结果和真实标记基于交叉熵损失函数计算得到各输出层神经元的预测误差Lossj,再根据交叉熵损失函数计算输出层残差
该神经网络的总预测误差为:
神经元j的残差即为预测误差对该神经元激活前输入值的导数,即:
进一步,计算输出层参数的梯度:
其中,为输入样本的真实标记,y={yj}为输出的预测标记值,即该输入样本的各KQI指标的正例概率。
5.如权利要求4所述的基于多尺度圆形卷积神经网络的业务质量预测方法,其特征在于,所述步骤07包括以下子步骤:
步骤071:计算本层卷积前的残差δ2,
步骤072:计算该层的卷积窗参数和/>的梯度,
6.如权利要求5所述的基于多尺度圆形卷积神经网络的业务质量预测方法,其特征在于,所述步骤08包括以下子步骤:
步骤081:将损失函数对L1层ReLU函数求偏导,即得L1层神经元卷积后激活前的残差δ1,
其中,ReLU′(Z1)为ReLU对Z1各元素分别求导,⊙为哈达玛积;
步骤082:计算该层的卷积窗参数W1和b1的梯度,
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110126309.5A CN112884020B (zh) | 2021-01-29 | 2021-01-29 | 一种基于多尺度圆形卷积神经网络的业务质量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110126309.5A CN112884020B (zh) | 2021-01-29 | 2021-01-29 | 一种基于多尺度圆形卷积神经网络的业务质量预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112884020A CN112884020A (zh) | 2021-06-01 |
CN112884020B true CN112884020B (zh) | 2024-06-04 |
Family
ID=76053650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110126309.5A Active CN112884020B (zh) | 2021-01-29 | 2021-01-29 | 一种基于多尺度圆形卷积神经网络的业务质量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112884020B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102946613A (zh) * | 2012-10-10 | 2013-02-27 | 北京邮电大学 | 一种用于测量用户业务体验质量的方法 |
WO2013044997A1 (en) * | 2011-09-28 | 2013-04-04 | Telefonica, S.A. | A method to measure quality of experience of a video service |
CN107087161A (zh) * | 2017-04-28 | 2017-08-22 | 南京邮电大学 | 视频业务中基于多层神经网络的用户体验质量的预测方法 |
CN110049129A (zh) * | 2019-04-20 | 2019-07-23 | 北京联合大学 | 一种基于特征选择的移动互联网业务质量预测方法 |
CN110322222A (zh) * | 2019-06-28 | 2019-10-11 | 广东石油化工学院 | 一种基于深度学习的异质软件工作量估计方法 |
CN110995520A (zh) * | 2020-02-28 | 2020-04-10 | 清华大学 | 网络流量预测方法、装置、计算机设备及可读存储介质 |
CN111405585A (zh) * | 2020-03-19 | 2020-07-10 | 北京联合大学 | 一种基于卷积神经网络的邻区关系预测方法 |
CN111813764A (zh) * | 2019-04-11 | 2020-10-23 | 中国移动通信集团四川有限公司 | 一种投诉预测模型的训练方法、装置及电子设备 |
-
2021
- 2021-01-29 CN CN202110126309.5A patent/CN112884020B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013044997A1 (en) * | 2011-09-28 | 2013-04-04 | Telefonica, S.A. | A method to measure quality of experience of a video service |
CN102946613A (zh) * | 2012-10-10 | 2013-02-27 | 北京邮电大学 | 一种用于测量用户业务体验质量的方法 |
CN107087161A (zh) * | 2017-04-28 | 2017-08-22 | 南京邮电大学 | 视频业务中基于多层神经网络的用户体验质量的预测方法 |
CN111813764A (zh) * | 2019-04-11 | 2020-10-23 | 中国移动通信集团四川有限公司 | 一种投诉预测模型的训练方法、装置及电子设备 |
CN110049129A (zh) * | 2019-04-20 | 2019-07-23 | 北京联合大学 | 一种基于特征选择的移动互联网业务质量预测方法 |
CN110322222A (zh) * | 2019-06-28 | 2019-10-11 | 广东石油化工学院 | 一种基于深度学习的异质软件工作量估计方法 |
CN110995520A (zh) * | 2020-02-28 | 2020-04-10 | 清华大学 | 网络流量预测方法、装置、计算机设备及可读存储介质 |
CN111405585A (zh) * | 2020-03-19 | 2020-07-10 | 北京联合大学 | 一种基于卷积神经网络的邻区关系预测方法 |
Non-Patent Citations (3)
Title |
---|
Estimation of the Quality of Experience During Video Streaming From Facial Expression and Gaze Direction;Simone Porcu等;《IEEE Transactions on Network and Service Management》;20200920;第17卷(第4期);2702-2716 * |
基于k近邻的多尺度超球卷积神经网络学习;刘子巍等;《计算机工程》;20221130;第48卷(第11期);111-119 * |
网络视频业务中用户QoE评估研究;宋佳润;《中国博士学位论文全文数据库 (信息科技辑)》;20170215(第2017年02期);I136-110 * |
Also Published As
Publication number | Publication date |
---|---|
CN112884020A (zh) | 2021-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sevgican et al. | Intelligent network data analytics function in 5G cellular networks using machine learning | |
Liu et al. | Opprentice: Towards practical and automatic anomaly detection through machine learning | |
CN110134675B (zh) | 一种面向海洋数据流的数据清洗方法和系统 | |
CN109905696A (zh) | 一种基于加密流量数据的视频服务体验质量的识别方法 | |
CN114221790A (zh) | 一种基于图注意力网络的bgp异常检测方法及系统 | |
CN111405585B (zh) | 一种基于卷积神经网络的邻区关系预测方法 | |
CN112911626B (zh) | 基于多图卷积的无线网络流量预测方法 | |
CN109902172A (zh) | 案情文本分类方法、装置以及存储介质 | |
CN110062410B (zh) | 一种基于自适应谐振理论的小区中断检测定位方法 | |
CN111490897A (zh) | 一种针对复杂网络的网络故障分析方法和系统 | |
CN112699945A (zh) | 数据标注方法及装置、存储介质及电子装置 | |
Jiang et al. | Crowd flow prediction for social internet-of-things systems based on the mobile network big data | |
Mardini et al. | Genetic algorithm for friendship selection in social IoT | |
CN107358269B (zh) | 一种面向精准营销的电信用户消费画像的构建方法 | |
CN111178543B (zh) | 一种基于元学习的概率域泛化学习方法 | |
US20180260396A1 (en) | Method and system for mapping attributes of entities | |
CN109376964B (zh) | 一种基于记忆神经网络的刑事案件罪名预测方法 | |
CN112884020B (zh) | 一种基于多尺度圆形卷积神经网络的业务质量预测方法 | |
CN108133387B (zh) | 基于软信息的多标记k近邻算法 | |
CN107292519B (zh) | 一种基于多标记学习的浏览类业务感知指标预测方法 | |
CN113824707A (zh) | 一种基于知识图谱的网站性能拨测度量方法和装置 | |
CN114757391B (zh) | 一种面向服务质量预测的网络数据空间设计与应用方法 | |
US20180004807A1 (en) | Search dimensionality expansion | |
CN116528149A (zh) | 融合定位方法、系统、电子设备及存储介质 | |
CN110120918A (zh) | 一种标识解析方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |