CN112884020B

CN112884020B - 一种基于多尺度圆形卷积神经网络的业务质量预测方法

Info

Publication number: CN112884020B
Application number: CN202110126309.5A
Authority: CN
Inventors: 李克; 苏利敏; 肖明明; 刘子巍
Original assignee: Beijing Union University
Current assignee: Beijing Union University
Priority date: 2021-01-29
Filing date: 2021-01-29
Publication date: 2024-06-04
Anticipated expiration: 2041-01-29
Also published as: CN112884020A

Abstract

本发明提供一种基于多尺度圆形卷积神经网络的业务质量预测方法，包括生成业务感知样本训练集D⁰，还包括以下步骤：初始化数据参数；构造输入层的输入样本D；计算卷积层输出H¹；计算全连接层输出H²；计算输出层输出；计算输出层损失、窗参W³和b³的梯度；计算L2全连接层损失窗参数W²和b²的梯度；计算L1卷积层损失窗参数W¹和b¹的梯度；更新窗参数；构造未知样本输入矩阵D'；进行业务质量标记结果的预测。本发明提出的基于多尺度圆形卷积神经网络的业务质量预测方法，根据海量的用户业务感知历史数据，对用户在特定场景下的业务体验好坏做出预测和预警。

Description

一种基于多尺度圆形卷积神经网络的业务质量预测方法

技术领域

本发明涉及移动互联网业务质量预测的技术领域，特别是一种基于多尺度圆形卷积神经网络的业务质量预测方法。

背景技术

移动网络用户在使用OTT业务(如网页浏览，视频播放等)过程中，其业务体验的好坏一般可用一套KQI(关键质量指标)指标进行评价，比如网页打开时延、下载速率等。这种体验的好坏受多种因素的影响，包括终端质量、使用业务时所处位置的移动网络质量、APP质量、SP网站服务器集群的带宽和负荷等。

电信运营商作为各类业务的传输通道提供方和业务体验保障的关键环节，需要尽可能保障用户的业务体验，否则可能导致用户投诉甚至离网。

目前一般是电信运营商的网络运维和优化部门通过日常的网络优化作业来保障网络质量，但网络质量与用户的业务体验之间仍然存在较大的差异，好的网络质量并不一定能保障良好的业务体验(由于业务体验是受前述的众多因素的综合作用)。客服部门只有在接到用户投诉时才发现业务体验的问题，再去协调网络运维和优化部门去排查问题和解决，往往很被动。

如果能在日常的网络运营中持续监测用户的业务体验，并根据海量的用户业务感知历史数据(不同场景下的业务感知指标的好坏)，对用户在特定场景下的业务体验好坏做出预测和预警，则有助于及早发现业务体验问题并及时采取相关措施进行改善，并有效降低投诉率和离网率。

公开号为CN110049129A的发明专利申请公开了一种基于特征选择的移动互联网业务质量预测方法，该方法的实现过程如下：步骤S1：构造训练样本集；步骤S2：计算特征权值；步骤S3：构造训练样本的k近邻样本集；步骤S4：计算先验概率和归一化频数矩阵；步骤S5：构造未知样本的k近邻样本集；步骤S6：计算未知样本的同标记统计；步骤S7：计算未知样本的似然概率；步骤S8：估计未知样本的标记值。该方法的缺点是当未知样本的近邻样本正负例标记平衡时的预测准确率较低。

发明内容

为了解决上述的技术问题，本发明提出的基于多尺度圆形卷积神经网络的业务质量预测方法，根据海量的用户业务感知历史数据，对用户在特定场景下的业务体验好坏做出预测和预警。

本发明的目的是提供一种基于多尺度圆形卷积神经网络的业务质量预测方法，包括生成业务感知样本训练集D⁰，还包括以下步骤：

步骤01：初始化数据参数；

步骤02：构造输入层的输入样本D；

步骤03：计算卷积层输出H¹；

步骤04：计算全连接层输出H²；

步骤05：计算输出层输出；

步骤06：计算输出层损失、窗参W³和b³的梯度；

步骤07：计算L2全连接层损失窗参数W²和b²的梯度；

步骤08：计算L1卷积层损失窗参数W¹和b¹的梯度；

步骤09：更新窗参数；

步骤10：构造未知样本输入矩阵D'；

步骤11：进行业务质量标记结果的预测。

优选的是，所述业务感知样本训练集D⁰包括N个样本，共F+L个维度，其中F为特征维度个数，L为标记维度个数(即KQI指标个数)，D⁰为N×(F+L)矩阵。

在上述任一方案中优选的是，所述步骤01包括以下子步骤：

步骤011：初始化卷积窗参数W¹，W²，W³，b¹，b²，b³；

步骤012：基于D⁰构造邻接矩阵A⁰＝[N×K]，依次选择D⁰中每个样本作为中心样本，根据其F个特征值构造的特征向量在D⁰的所有N个样本构成的特征空间中基于欧氏距离准则寻找其前K个最近邻样本，按距离从小到大原则将这K个样本的样本编号排序，并按中心样本的序号存储在A⁰中的对应行，最终构造出N×K维矩阵。

在上述任一方案中优选的是，所述步骤012包括对A⁰中的各行样本计算该中心样本的前K₂个近邻样本的标记进行混淆因子计算，即K₂个近邻中正例标记近邻的占比。

在上述任一方案中优选的是，所述步骤012还包括当混淆因子为40％～60％时保留该样本，否则从A⁰中剔除。

在上述任一方案中优选的是，所述步骤02包括从D⁰中取1个训练样本，其标记矢量作为真实输出结果，从D⁰和A⁰中取该样本对应的K个近邻的标记值构成输入数据D＝[K×L]＝H⁰。

在上述任一方案中优选的是，所述步骤03包括从卷积窗W¹取[K×L]…[25×L][16×L][9×L][4×L]各一种，共M＝sqrt(K)-1种卷积窗，每种窗用Q个，卷积结果经ReLU判决后输出得到H¹，即：

H¹＝ReLU(Z¹)

其中，激活前输入值Z¹＝W¹*H⁰+b¹，W¹和b¹为该层的卷积窗参数和偏置项,*为卷积运算，H¹为该层的输出。

在上述任一方案中优选的是，所述步骤04包括用Q个[M×L]的卷积窗W²对输入处理得到H²：

H²＝W²*H¹+b²

其中，W²和b²为该层的卷积窗参数和偏置项，j＝1～L，H²为全连接层的输出。

在上述任一方案中优选的是，所述步骤05包括输出层神经元个数等于标记项个数L，用Logistic回归函数对神经元的输入进行处理得到输出Y＝{y_j},j＝1～L

其中，为该输出神经元的logistic激活前的值，/>和/>为输出层的卷积窗参数和偏置项。

在上述任一方案中优选的是，所述步骤06包括先根据预测结果和真实标记基于交叉熵损失函数计算得到各输出神经元的预测误差Loss_j，再根据交叉熵损失函数计算输出层残差

j＝1～L

该神经网络的总预测误差为：

神经元j的残差即为预测误差对该神经元输入值(激活前)的导数，即：

进一步，计算输出层参数的梯度：

其中，为输入样本的真实标记，y＝{y_j}为输出的预测标记值(即该输入样本的各KQI指标的正例概率)。

在上述任一方案中优选的是，所述步骤07包括以下子步骤：

步骤071：计算本层卷积前的残差δ²，

步骤072：计算该层的卷积窗参数和/>的梯度，

在上述任一方案中优选的是，所述步骤08包括以下子步骤：

步骤081：将损失函数对L1层ReLU函数求偏导，即得L1层神经元的(卷积后，激活前)残差δ¹，

其中，ReLU′(Z¹)为ReLU对Z¹各元素分别求导,⊙为哈达玛积；

步骤082：计算该层的卷积窗参数W¹和b¹的梯度，

在上述任一方案中优选的是，所述步骤09包括以下子步骤：

步骤91：根据设定的学习率，按梯度下降原则更新所述窗参数W¹,W²,W³,b¹,b²,b³；

步骤92：待N个训练样本全部迭代完毕或输出层损失收敛后得到最终的H-CNN模型。

在上述任一方案中优选的是，所述步骤10包括输入未知样本，计算其在训练样本空间D⁰中的K个近邻样本及其标记，得到矩阵D’。

在上述任一方案中优选的是，所述步骤11包括根据所述H-CNN模型，逐步前向计算后得到L个标记项的输出正例概率，硬判决后作为预测的标记结果,即该未知样本的L个业务质量KQI指标的预测值。

在上述任一方案中优选的是，所述步骤11还包括先根据D'对输入未知样本进行混淆因子计算，当混淆因子落在40％～60％范围之外时，采用基于kNN方法直接进行KQI指标的预测。

在上述任一方案中优选的是，如果混淆因子为40％～60％，再将D'输入H-CNN模型进行KQI指标的预测。

本发明提出了一种基于多尺度圆形卷积神经网络的业务质量预测方法，有助于及早发现业务体验问题并及时采取相关措施进行改善，并有效降低投诉率和离网率。

附图说明

图1为按照本发明的基于多尺度圆形卷积神经网络的业务质量预测方法的一优选实施例的流程图。

图2为按照本发明的基于多尺度圆形卷积神经网络的业务质量预测方法的另一优选实施例的流程图。

图3为按照本发明的基于多尺度圆形卷积神经网络的业务质量预测方法的H-CNN神经网络模型的一实施例的结构示意图。

具体实施方式

下面结合附图和具体的实施例对本发明做进一步的阐述。

实施例一

如图1所述，执行步骤1000，生成业务感知样本训练集D⁰，业务感知样本训练集D⁰包括N个样本，共F+L个维度，其中F为特征维度个数，L为标记维度个数(即KQI指标个数)，D⁰为N×(F+L)矩阵。

执行步骤1010，初始化数据参数。在本步骤中，步骤1011：初始化卷积窗参数W¹，W²，W³，b¹，b²，b³。

步骤1012：基于D⁰构造邻接矩阵A⁰＝[N×K]，依次选择D⁰中每个样本作为中心样本，根据其F个特征值构造的特征向量在D⁰的所有N个样本构成的特征空间中基于欧氏距离准则寻找其前K个最近邻样本。按距离从小到大原则将这K个样本的样本编号排序，并按中心样本的序号存储在A⁰中的对应行，最终构造出N×K维矩阵。对A⁰中的各行样本计算该中心样本的前K₂个近邻样本(K₂一般取15～20)的标记进行混淆因子计算，即K₂个近邻中正例标记近邻的占比。当混淆因子为40％～60％时保留该样本，否则从A⁰中剔除。这样，所构建的A⁰矩阵中仅包含那些通过kNN方法无法有效处理的高度混淆样本，并在后续步骤中对这些样本进行训练、并用于其他高度混淆的未知样本的标记预测。

执行步骤1020，构造输入层的输入样本D，从D⁰中取1个训练样本，其标记矢量作为真实输出结果。从D⁰和A⁰中取该样本对应的K个近邻的标记值构成输入数据D＝[K×L]＝H⁰，在本事实例中，K＝225。

执行步骤1030，计算卷积层输出H¹，从卷积窗W¹取[K×L]…[25×L][16×L][9×L][4×L]各一种，共M＝sqrt(K)-1种卷积窗，每种窗用Q个(在本实施例中。Q取4或者8)。卷积结果经ReLU判决后输出得到H¹，即：

H¹＝ReLU(Z¹)

执行步骤1040，计算全连接层输出H²。用Q个[M×L]的卷积窗W²对输入处理得到H²：

H²＝W²*H¹+b²

执行步骤1050，计算输出层输出。输出层神经元个数等于标记项个数L，用Logistic回归函数对神经元的输入进行处理得到输出Y＝{y_j},j＝1～L

执行步骤1060，计算输出层损失、窗参W³和b³的梯度；。先根据预测结果和真实标记基于交叉熵损失函数计算得到各输出神经元的预测误差Loss_j，再根据交叉熵损失函数计算输出层残差

j＝1～L

该神经网络的总预测误差为：

进一步，计算输出层参数的梯度：

执行步骤1070，计算L2全连接层损失窗参数W²和b²的梯度。在本步骤中，步骤071：计算本层卷积前的残差δ²，/>

步骤072：计算该层的卷积窗参数和/>的梯度，

执行步骤1080，计算L1卷积层损失窗参数W¹和b¹的梯度。在本步骤中，步骤081：将损失函数对L1层ReLU函数求偏导，即得L1层神经元的(卷积后，激活前)残差δ¹，

其中，ReLU′(Z¹)为ReLU对Z¹各元素分别求导,⊙为哈达玛积；

步骤082：计算该层的卷积窗参数W¹和b¹的梯度，

执行步骤1090，更新窗参数。在本步骤中，步骤91：根据设定的学习率，按梯度下降原则更新所述窗参数W¹,W²,W³,b¹,b²,b³；

执行步骤1100，构造未知样本输入矩阵D。输入未知样本，计算其在训练样本空间D⁰中的K个近邻样本及其标记，得到矩阵D'。

执行步骤1110，进行业务质量标记结果的预测。根据所述H-CNN模型，逐步前向计算后得到L个标记项的输出正例概率，硬判决后作为预测的标记结果,即该未知样本的L个业务质量KQI指标的预测值。先根据D'对输入未知样本进行混淆因子计算，当混淆因子落在40％～60％范围之外时，采用基于kNN方法直接进行KQI指标的预测即可。如果混淆因子为40％～60％，再将D'输入H-CNN模型进行KQI指标的预测。

实施例二

本发明提出了一种基于多尺度圆形卷积神经网络(H-CNN)的业务质量KQI预测方法。其中，H-CNN神经网络模型如图2所示。L0为输入层，L1卷积层，L2全连接层，L3输出层。

具体算法步骤的详细描述如下：

输入：

业务感知样本训练集D⁰：包括N个样本(顺序编号)，共F+L个维度，其中F为特征维度个数，L为标记维度个数(即KQI指标个数)，D⁰为N×(F+L)矩阵。

步骤S1：初始化

(1)初始化卷积窗参数W¹，W²，W³，b¹，b²，b³。

(2)构造邻接矩阵A⁰＝[N×K]：基于D⁰构造得到，存储每个训练样本对应的K个近邻的样本编号，为N×K维矩阵。即取D⁰中每个样本，将其在N个样本的特征空间中根据欧氏距离搜索前K个近邻样本，将这些近邻样本按其与当前样本的欧氏距离从小到大排列，并记录近邻样本在D⁰中的编号存入A⁰中该样本对应行。

步骤S2：构造输入层的输入样本D

从D⁰中按顺序取1个训练样本，其标记矢量作为真实输出结果。从D⁰和A⁰中取该样本对应的225个近邻的标记值构成输入数据D＝[K×L]＝H⁰；

步骤S3：计算卷积层输出H¹

卷积窗W¹取[K×L]…[25×L][16×L][9×L][4×L]各一，共M＝sqrt(K)-1种卷积窗，每种窗用4个。卷积结果经ReLU判决后输出得到H¹，即：

H¹＝ReLU(Z¹) (1)

其中，激活前输入值Z¹＝W¹*H⁰+b¹，W¹和b¹为该层的卷积窗参数和偏置项,*为卷积运算。

步骤S4：计算全连接层输出H²

用Q个[M×L]的卷积窗W²对输入处理得到H²：

H²＝W²*H¹+b² (1)其中，W²和b²为该层的卷积窗参数和偏置项，j＝1～L。

步骤S5：计算输出层输出

输出层神经元个数等于标记项个数L。用Logistic回归函数对神经元的输入进行处理得到输出Y＝{y_j},j＝1～L：

为该输出神经元的logistic激活前的值。

步骤S6：计算输出层损失和窗参梯度

先根据预测结果和真实标记基于交叉熵损失函数计算得到各输出神经

元的预测误差Loss_j，再根据交叉熵损失函数计算输出层残差

该神经网络的总预测误差为：

Loss＝∑_jLoss_j (5)

进一步，计算输出层参数的梯度：

步骤S7：计算L2全连接层损失窗参数W²梯度

首先计算本层卷积前的残差δ²：

进一步，计算该层的卷积窗参数和/>的梯度：

步骤S8：计算L1卷积层损失窗参数W¹梯度将损失函数对L1层ReLU函数求偏导，即得L1层神经元的(卷积后，激活前)残差δ¹：

其中，ReLU′(Z¹)为ReLU对Z¹各元素分别求导,⊙为哈达玛积。

进一步，计算该层的卷积窗参数W¹和b¹的梯度：

步骤S9：更新窗参

根据设定的学习率，按梯度下降原则更新窗参W¹,W²,W³b¹,b²,,b³。重复上述步骤S2～S9，待N个训练样本全部迭代完毕或输出层损失收敛后得到最终的H-CNN模型。

步骤S10：构造未知样本输入矩阵D'

输入未知样本，计算其在训练样本空间D⁰中的K个近邻样本及其标记，得到矩阵D'；

步骤S11：业务质量标记结果的预测

根据该模型，逐步前向计算后得到L个标记项的输出正例概率，硬判决后作为预测的标记结果,即该未知样本的L个业务质量KQI指标的预测值。

实施例三

以网页浏览业务的KQI指标预测为例。

取近邻数K＝225，业务特征数量F＝13，业务标记(KQI指标)数量L＝4，尺度数M＝sqrt(K)-1＝14(包括4，9，16，25，…，225)。

已知某城市的本地移动网络下(如北京移动的LTE网络)，当用户在智能终端上使用网页浏览类业务App(如UCweb、QQ浏览器等)浏览预定义的目标网页集合(如新浪主页，搜狐主页等)中的某个网页时，通过部署在用户终端上的数据采集App等方式，获取此时的“网页浏览业务感知样本”；在一定时间范围内、从海量用户终端上采集的全部样本构成了“浏览业务感知样本集”。

网页浏览业务感知样本其所包含的信息(即样本字段)包括：日期，时间，网络制式，小区标识，终端当前经纬度，场强，信号质量，用户标识，终端标识，终端型号，浏览器App名称，浏览网站名称，浏览网站URL，浏览网站IP，DNS IP，首包时延，页面打开时延，DNS解析时延，TCP连接时延，GET请求时延，接收响应时延。

从上述样本的所有字段中选择其子集，即{日期，时间，经度，纬度，大区编号，小区编号，场强，信号质量，网站名称，网站IP，DNS IP，用户标识，终端型号}，作为训练样本的属性集x＝{x₁,x₂,…,x_d}，d为属性集的维度，这里d＝13；其中，属性字段{日期，时间，经度，纬度，场强，信号质量}为数值型数据，属性字段{大区编号，小区编号，网站名称，网站IP，DNSIP，用户标识，终端型号}为名目型数据；

从上述样本的所有字段中选择其子集，即{DNS解析时延，TCP连接时延，GET请求时延，接收响应时延}，作为训练样本的标记即L＝4，均为布尔型数据。

按上述步骤S1～S11即可对未知样本，即13个特征字段值已知、4个标记字段值未知的样本的标记字段值{DNS解析时延，TCP连接时延，GET请求时延，接收响应时延}做出预测。

为了更好地理解本发明，以上结合本发明的具体实施例做了详细描述，但并非是对本发明的限制。凡是依据本发明的技术实质对以上实施例所做的任何简单修改，均仍属于本发明技术方案的范围。本说明书中每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言，由于其与方法实施例基本对应，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

Claims

1.一种基于多尺度圆形卷积神经网络的业务质量预测方法，包括生成业务感知样本训练集D⁰，其特征在于，还包括以下步骤：

所述业务感知样本训练集D⁰包括N个样本，共F+L个维度，其中，F为特征维度个数，L为标记维度个数，即KQI指标个数，D⁰为N×(F+L)矩阵；

步骤01：初始化数据参数，包括以下子步骤：

步骤011：初始化卷积窗参数W¹，W²，W³，b¹，b²，b³；

步骤012：基于D⁰构造邻接矩阵A⁰＝[N×K]，依次选择D⁰中每个样本作为中心样本，根据其F个特征值构造的特征向量在D⁰的所有N个样本构成的特征空间中基于欧氏距离准则寻找其前K个最近邻样本，按距离从小到大原则将这K个样本的样本编号排序，并按中心样本的序号存储在A⁰中的对应行，最终构造出N×K维矩阵；

步骤02：构造输入层的输入样本D，从D⁰中取1个训练样本，其标记矢量作为真实输出结果，从D⁰和A⁰中取该样本对应的K个近邻的标记值构成输入数据D＝[K×L]＝H⁰；

步骤03：计算卷积层输出H¹，从卷积窗W¹取[K×L]…[25×L][16×L][9×L][4×L]各一种，共种卷积窗，每种窗用Q个，卷积结果经ReLU判决后输出得到H¹，即：

H¹＝ReLU(Z¹)

其中，K表示最近邻样本个数，L表示标记维度个数，激活前输入值Z¹＝W¹*H⁰+b¹，W¹和b¹为该层的卷积窗参数和偏置项,*为卷积运算，H¹为该层的输出；

步骤04：计算全连接层输出H²；

步骤05：计算输出层输出；

步骤06：计算输出层损失、窗参W³和b³的梯度；

步骤07：计算L2全连接层损失窗参数W²和b²的梯度；

步骤08：计算L1卷积层损失窗参数W¹和b¹的梯度；

步骤09：更新窗参数；

步骤10：构造未知样本输入矩阵D'；

步骤11：进行业务质量标记结果的预测；

所述业务为网页浏览业务，所述业务感知样本包含的信息包括：日期，时间，网络制式，小区标识，终端当前经纬度，场强，信号质量，用户标识，终端标识，终端型号，浏览器App名称，浏览网站名称，浏览网站URL，浏览网站IP，DNS IP，首包时延，页面打开时延，DNS解析时延，TCP连接时延，GET请求时延，接收响应时延。

2.如权利要求1所述的基于多尺度圆形卷积神经网络的业务质量预测方法，其特征在于，所述步骤04包括用L个[M×Q]的卷积窗W²对输入处理得到H²：

H²＝W²*H¹+b²

3.如权利要求2所述的基于多尺度圆形卷积神经网络的业务质量预测方法，其特征在于，所述步骤05包括输出层神经元个数等于标记项个数L，用Logistic回归函数对神经元的输入进行处理得到输出Y＝{y_j},j＝1～L，

其中，为该输出层神经元的logistic激活前的值，/>和/>为输出层的卷积窗参数和偏置项。

4.如权利要求3所述的基于多尺度圆形卷积神经网络的业务质量预测方法，其特征在于，所述步骤06包括先根据预测结果和真实标记基于交叉熵损失函数计算得到各输出层神经元的预测误差Loss_j，再根据交叉熵损失函数计算输出层残差

该神经网络的总预测误差为：

神经元j的残差即为预测误差对该神经元激活前输入值的导数，即：

进一步，计算输出层参数的梯度：

其中，为输入样本的真实标记，y＝{y_j}为输出的预测标记值，即该输入样本的各KQI指标的正例概率。

5.如权利要求4所述的基于多尺度圆形卷积神经网络的业务质量预测方法，其特征在于，所述步骤07包括以下子步骤：

步骤071：计算本层卷积前的残差δ²，

步骤072：计算该层的卷积窗参数和/>的梯度，

6.如权利要求5所述的基于多尺度圆形卷积神经网络的业务质量预测方法，其特征在于，所述步骤08包括以下子步骤：

步骤081：将损失函数对L1层ReLU函数求偏导，即得L1层神经元卷积后激活前的残差δ¹，

其中，ReLU′(Z¹)为ReLU对Z¹各元素分别求导,⊙为哈达玛积；

步骤082：计算该层的卷积窗参数W¹和b¹的梯度，