CN114816321A

CN114816321A - 一种无监督的用户感知指标重要度确定方法

Info

Publication number: CN114816321A
Application number: CN202210429602.3A
Authority: CN
Inventors: 梅芳; 温建博; 孙庚�; 郭新荣; 刘雨晴
Original assignee: Jilin University
Current assignee: Jilin University
Priority date: 2022-04-22
Filing date: 2022-04-22
Publication date: 2022-07-29

Abstract

本发明公开了一种无监督的用户感知指标重要度确定方法，属于无线通信领域，包括以下步骤：S1.计算相关性系数矩阵；S2.软阈值法构建邻接矩阵；S3.计算拓扑重叠矩阵；S4.计算候选指标重要度。能够客观计算出各维度指标之间的连接度，并以此来表征感知指标重要度的方法；无须定义目标值，仅需基于候选指标数据内部规律，通过无监督学习算法，计算并得出指标重要度信息。

Description

一种无监督的用户感知指标重要度确定方法

技术领域

本发明涉及无线无线通信技术领域，尤其涉及一种无监督的用户感知指标重要度确定方法。

背景技术

现有的指标重要度排序方法，大多数都是利用有监督的机器学习算法，寻找多维度指标对于特定目标的影响程度，来确定指标重要度。例如，根据各个指标与目标的相关性因数，将各个指标按照从大到小进行排序，得到指标排序表；或者采用序关系分析法对指标排序；再比如，将相关特征输入到机器学习模型，机器学习模型根据相关特征以某项指标的增益为目标，并根据增益值的大小进行相关特征的重要度排序。

现有技术中提到的指标重要度排序方法，均需设定目标值，从而根据各维度指标对目标的影响大小，来确定指标的重要性。但在很多场景下，是无法获得目标值的，这就需要一种通过关键指标数据的内部规律，计算并定位指标重要度的方法。

以用户综合上网感知指标为例，如果采用传统做法，则需要获取一个可以真实客观评价用户综合上网感知情况的目标值，现实中与此值最相近的就是用户满意度调查评分，但此值主观性过强，且样本量过少的话，作为指标重要度排序的目标值，则很难得出有价值的结果。

本发明提出了一种无监督的用户感知指标重要度排序方法，仅通过指标内部数据规律即可确定指标重要度，无需提供目标值。

发明内容

本发明的目的是为了解决现有技术中存在的缺陷，而提出的无监督的用户感知指标重要度确定方法。

为了实现上述目的，本发明采用了如下技术方案：

一种无监督的用户感知指标重要度确定方法，包括以下步骤：

S1.计算相关性系数矩阵；

S2.软阈值法构建邻接矩阵；

S3.计算拓扑重叠矩阵；

S4.计算候选指标重要度。

进一步地，在步骤S1中，相关系数矩阵的计算方式为：所述利用皮尔逊相关系数公式，计算得出相关性系数矩阵Corr。

进一步地，在步骤S2中，具体步骤为，通过软阈值法基于步骤S1中获得的相关性系数矩阵Corr进行加权，计算得到邻接矩阵。

进一步地，在步骤S3中，具体步骤为，利将步骤S2获得的结果中引入拓扑重叠矩阵；

利用python，计算得出拓扑重叠矩阵。

进一步地，在步骤S4中，具体步骤为，基于步骤S3得出的拓扑重叠矩阵，根据连接度计算公式，对拓扑重叠矩阵的每行进行求和，计算得出各个指标的连接度；

将得到的连接度，做为每个候选指标的重要度结果；

基于每个指标的重要度排序结果，得到了用户视频维度的关键感知指标，完成既定目标。

进一步地，在步骤S1中，相关系数矩阵具体为：基于数据预处理后的候选指标样本集合X获得的矩阵，具体公式如下：

其中，[X1,X2…Xn]每列为一个指标，则共n个指标、样本数据大小为m，即矩阵为m行、所以矩阵X大小为m×n。

进一步地，在步骤S2中，通过软阈值法对相关性系数矩阵Corr进行加权计算得到邻接矩阵的具体步骤为：给步骤S1中得到的相关性系数矩阵中每一个相关性系数加上一个指数β，则邻接矩阵中每个元素如下所示：

A_ij＝(|cor(X_i,X_j)|)^β

生成矩阵大小为n×n，即i,j∈[1,n]，完成对邻接矩阵的构建。

进一步地，在步骤S3中，拓扑重叠矩阵的计算公式，具体如下：

其中，

以1为遍历因子，遍历指标列表里除i，j以外的所有指标，并将1与i，j之间的相关系数以上式运算，运用其它指标做为桥梁，将指标i，j在网络中表现的重叠程度数据化；

若i，j在网络中的连接情况越相似，则Tom_ij越大。

完成拓扑重叠矩阵的计算。

进一步地，在步骤S4中，所述候选指标连接度为该指标在整个指标体系中的重要度，其中，每个指标的连接度，是与其相连的指标的边属性之和。

进一步地，在步骤S4中，所述候选指标连接度的值基于步骤S3中的TOM矩阵计算，所述候选指标连接度的计算公式为

公式中Connect_i即为第i(i∈[1,n])个指标的连接度。

相比于现有技术，本发明的有益效果在于：能够客观计算出各维度指标之间的连接度，并以此来表征感知指标重要度的方法；

无须定义目标值，仅需基于候选指标数据内部规律，通过无监督学习算法，计算并得出指标重要度信息。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。

图1为本发明提出的无监督的用户感知指标重要度确定方法的步骤流程图；

图2为本发明实施例中的可视化相关系统矩阵图；

图3为本发明实施例中的处理后的可视化相关系统矩阵图；

图4为本发明实施例中的相关性矩阵数据样例图；

图5为本发明实施例中的邻接矩阵数据样例图；

图6为本发明实施例中的拓扑重叠矩阵的详细代码图；

图7为本发明实施例中的拓扑重叠矩阵的代码运行结果图；

图8为本发明实施例中的Python实验代码及计算结果图；

图9为本发明提出的无监督的用户感知指标重要度确定方法的实施流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。

实施例一

参照图1-8，无监督的用户感知指标重要度确定方法，包括以下步骤：

S1.计算相关性系数矩阵；

具体的，在步骤S1中，相关系数矩阵的计算方式为：所述利用皮尔逊相关系数公式，计算得出相关性系数矩阵Corr。

S2.软阈值法构建邻接矩阵；

具体的，在步骤S2中，具体步骤为，通过软阈值法基于步骤S1中获得的相关性系数矩阵Corr进行加权，计算得到邻接矩阵。

S3.计算拓扑重叠矩阵；

具体的，在步骤S3中，具体步骤为，利将步骤S2获得的结果中引入拓扑重叠矩阵；

利用python，计算得出拓扑重叠矩阵。

S4.计算候选指标重要度。

具体的，在步骤S4中，具体步骤为，基于步骤S3得出的拓扑重叠矩阵，根据连接度计算公式，对拓扑重叠矩阵的每行进行求和，计算得出各个指标的连接度；

将得到的连接度，做为每个候选指标的重要度结果；

实施例二

参照图1-9，在实施例一的基础上，在步骤S1中：

相关系数矩阵具体为：基于数据预处理后的候选指标样本集合X获得的矩阵，具体公式如下：

具体的，由于有n个指标，则相关性系数矩阵大小为n×n，矩阵中任意一个元素cor(Xi,Xj)，i,j∈[1,n]为第i,j个指标之间的皮尔逊相关性系数，则：

其中，

公式中cov(X₁,X₂)为X₁和X₂的协方差，

为X₁的方差，

为X₁的平均值。

在步骤S2中：

通过软阈值法对相关性系数矩阵Corr进行加权计算得到邻接矩阵的具体步骤为：给步骤S1中得到的相关性系数矩阵中每一个相关性系数加上一个指数β，则邻接矩阵中每个元素如下所示：

A_ij＝(|cor(X_i,X_j)|)^β

生成矩阵大小为n×n，即i,j∈[1,n]，完成对邻接矩阵的构建。

具体的，对相关性系数矩阵Corr进行加权，可以得到邻接矩阵，这样做的直接结果是可以把感知指标之间的相关性强弱差异放大，使强弱关系更加分明；

需要说明的是，软阈值法就是给相关性系数矩阵中每一个相关性系数加上一个指数β，当β>1时，不同相关系数之间的差距会被放大，这种处理方式强化了强相关或正相关，弱化了弱相关或负相关，使得相关性数值更符合无尺度网络特征；

β的值根据无尺度网络适应系数进行自适应选择，例如要构建无尺度网络，即适应系数大于0.9的网络，就需计算各个β值加权后网络的无尺度网络适应系数，超过0.9的最小β，就是最优选择。

在步骤S3中：

拓扑重叠矩阵的计算公式，具体如下：

其中，

若i，j在网络中的连接情况越相似，则Tom_ij越大。

完成拓扑重叠矩阵的计算。

需要说明的是，如果直接利用步骤S2得到的两两指标间的加权相关系数来进行模块识别划分，准确性较差，且未充分利用到数据中所提供的全部信息，为此引入了拓扑重叠矩阵的概念。

拓扑重叠矩阵的原理就是进一步考虑间接关联度。即如果指标i和指标j可以通过若干个中间关联的指标1，而形成间接联系，那么这种联系关系的强弱也会进一步被考虑进来，当作划分模块的依据。

在步骤S4中：

所述候选指标连接度为该指标在整个指标体系中的重要度，其中，每个指标的连接度，是与其相连的指标的边属性之和；

所述候选指标连接度的值基于步骤S3中的TOM矩阵计算，所述候选指标连接度的计算公式为

公式中Connect_i即为第i(i∈[1,n])个指标的连接度。

需要说明的是，候选指标连接度的定义，为该指标在整个指标体系中的重要度，连接度，类似图算法中“度”的概念。

为了更好的理解本实施例的技术方案，以下以视频维度用户感知指标数据为例，应用本文方法，进一步用实际实验过程，说明本文方法上述四个步骤的应用效果：

根据实际业务意义，筛选出以下跟用户视频感知比较相关的12个指标。

采用上述方法步骤，计算得出这些指标的重要度，并从下述指标中筛选出重要度结果最高的三个指标，做为用户视频维度的关键指标，具体见表1，表1为用户视频感知的12个相关指标。

表1

提取长春市区视频维度的用户级、天粒度指标，做为实验数据。

具体实施步骤如下：

S1：计算相关性系数矩阵；

首先计算得出相关性系数矩阵，并进行可视化后，结果见图2；

通过直观观察，先直接将相关性系数超过0.8的一对指标，只保留一个，这样处理之后，留下8个指标，结果见图3。

S2.软阈值法构建邻接矩阵；

针对上述留下的8个指标，通过软阈值法，基于相关性矩阵，计算得出邻接矩阵，矩阵变换过程如数据样例所示，具体见图5-6。

S3.计算拓扑重叠矩阵；

根据公式，利用python，计算得出拓扑重叠矩阵，代码及计算结果，具体见图7-8。

S4.计算候选指标重要度

根据连接度计算公式，基于步骤S3得出的拓扑重叠矩阵，计算得出各个指标的连接度，即对拓扑重叠矩阵的每行进行求和；

最后将得到的连接度，作为每个候选指标的重要度结果，Python实验代码及计算结果，具体见图9；

最终完成了既定目标，即基于每个指标的重要度排序结果，得到了用户视频维度的关键感知指标。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种无监督的用户感知指标重要度确定方法，其特征在于，包括以下步骤：

S1.计算相关性系数矩阵；

S2.软阈值法构建邻接矩阵；

S3.计算拓扑重叠矩阵；

S4.计算候选指标重要度。

2.根据权利要求1所述的无监督的用户感知指标重要度确定方法，其特征在于，在步骤S1中，相关系数矩阵的计算方式为：所述利用皮尔逊相关系数公式，计算得出相关性系数矩阵Corr。

3.根据权利要求2所述的无监督的用户感知指标重要度确定方法，其特征在于，在步骤S2中，具体步骤为，通过软阈值法基于步骤S1中获得的相关性系数矩阵Corr进行加权，计算得到邻接矩阵。

4.根据权利要求3所述的无监督的用户感知指标重要度确定方法，其特征在于，在步骤S3中，具体步骤为，利将步骤S2获得的结果中引入拓扑重叠矩阵；

利用python，计算得出拓扑重叠矩阵。

5.根据权利要求4所述的无监督的用户感知指标重要度确定方法，其特征在于，在步骤S4中，具体步骤为，基于步骤S3得出的拓扑重叠矩阵，根据连接度计算公式，对拓扑重叠矩阵的每行进行求和，计算得出各个指标的连接度；

将得到的连接度，做为每个候选指标的重要度结果；

6.根据权利要求5所述的无监督的用户感知指标重要度确定方法，其特征在于，在步骤S1中，相关系数矩阵具体为：基于数据预处理后的候选指标样本集合X获得的矩阵，具体公式如下：

7.根据权利要求6所述的无监督的用户感知指标重要度确定方法，其特征在于，在步骤S2中，通过软阈值法对相关性系数矩阵Corr进行加权计算得到邻接矩阵的具体步骤为：给步骤S1中得到的相关性系数矩阵中每一个相关性系数加上一个指数β，则邻接矩阵中每个元素如下所示：

A_ij＝(|cor(X_i,X_j)|)^β

生成矩阵大小为n×n，即i,j∈[1,n]，完成对邻接矩阵的构建。

8.根据权利要求7所述的无监督的用户感知指标重要度确定方法，其特征在于，在步骤S3中，拓扑重叠矩阵的计算公式，具体如下：

其中，

若i，j在网络中的连接情况越相似，则Tom_ij越大；

完成拓扑重叠矩阵的计算。

9.根据权利要求8所述的无监督的用户感知指标重要度确定方法，其特征在于，在步骤S4中，所述候选指标连接度为该指标在整个指标体系中的重要度，其中，每个指标的连接度，是与其相连的指标的边属性之和。

10.根据权利要求9所述的无监督的用户感知指标重要度确定方法，其特征在于，在步骤S4中，所述候选指标连接度的值基于步骤S3中的TOM矩阵计算，所述候选指标连接度的计算公式为

其中，公式中Connect_i即为第i(i∈[1,n])个指标的连接度。