CN114816321A - 一种无监督的用户感知指标重要度确定方法 - Google Patents

一种无监督的用户感知指标重要度确定方法 Download PDF

Info

Publication number
CN114816321A
CN114816321A CN202210429602.3A CN202210429602A CN114816321A CN 114816321 A CN114816321 A CN 114816321A CN 202210429602 A CN202210429602 A CN 202210429602A CN 114816321 A CN114816321 A CN 114816321A
Authority
CN
China
Prior art keywords
matrix
index
importance
indexes
correlation coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210429602.3A
Other languages
English (en)
Inventor
梅芳
温建博
孙庚�
郭新荣
刘雨晴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202210429602.3A priority Critical patent/CN114816321A/zh
Publication of CN114816321A publication Critical patent/CN114816321A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/06Arrangements for sorting, selecting, merging, or comparing data on individual record carriers
    • G06F7/08Sorting, i.e. grouping record carriers in numerical or other ordered sequence according to the classification of at least some of the information they carry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种无监督的用户感知指标重要度确定方法,属于无线通信领域,包括以下步骤:S1.计算相关性系数矩阵;S2.软阈值法构建邻接矩阵;S3.计算拓扑重叠矩阵;S4.计算候选指标重要度。能够客观计算出各维度指标之间的连接度,并以此来表征感知指标重要度的方法;无须定义目标值,仅需基于候选指标数据内部规律,通过无监督学习算法,计算并得出指标重要度信息。

Description

一种无监督的用户感知指标重要度确定方法
技术领域
本发明涉及无线无线通信技术领域,尤其涉及一种无监督的用户感知指标重要度确定方法。
背景技术
现有的指标重要度排序方法,大多数都是利用有监督的机器学习算法,寻找多维度指标对于特定目标的影响程度,来确定指标重要度。例如,根据各个指标与目标的相关性因数,将各个指标按照从大到小进行排序,得到指标排序表;或者采用序关系分析法对指标排序;再比如,将相关特征输入到机器学习模型,机器学习模型根据相关特征以某项指标的增益为目标,并根据增益值的大小进行相关特征的重要度排序。
现有技术中提到的指标重要度排序方法,均需设定目标值,从而根据各维度指标对目标的影响大小,来确定指标的重要性。但在很多场景下,是无法获得目标值的,这就需要一种通过关键指标数据的内部规律,计算并定位指标重要度的方法。
以用户综合上网感知指标为例,如果采用传统做法,则需要获取一个可以真实客观评价用户综合上网感知情况的目标值,现实中与此值最相近的就是用户满意度调查评分,但此值主观性过强,且样本量过少的话,作为指标重要度排序的目标值,则很难得出有价值的结果。
本发明提出了一种无监督的用户感知指标重要度排序方法,仅通过指标内部数据规律即可确定指标重要度,无需提供目标值。
发明内容
本发明的目的是为了解决现有技术中存在的缺陷,而提出的无监督的用户感知指标重要度确定方法。
为了实现上述目的,本发明采用了如下技术方案:
一种无监督的用户感知指标重要度确定方法,包括以下步骤:
S1.计算相关性系数矩阵;
S2.软阈值法构建邻接矩阵;
S3.计算拓扑重叠矩阵;
S4.计算候选指标重要度。
进一步地,在步骤S1中,相关系数矩阵的计算方式为:所述利用皮尔逊相关系数公式,计算得出相关性系数矩阵Corr。
进一步地,在步骤S2中,具体步骤为,通过软阈值法基于步骤S1中获得的相关性系数矩阵Corr进行加权,计算得到邻接矩阵。
进一步地,在步骤S3中,具体步骤为,利将步骤S2获得的结果中引入拓扑重叠矩阵;
利用python,计算得出拓扑重叠矩阵。
进一步地,在步骤S4中,具体步骤为,基于步骤S3得出的拓扑重叠矩阵,根据连接度计算公式,对拓扑重叠矩阵的每行进行求和,计算得出各个指标的连接度;
将得到的连接度,做为每个候选指标的重要度结果;
基于每个指标的重要度排序结果,得到了用户视频维度的关键感知指标,完成既定目标。
进一步地,在步骤S1中,相关系数矩阵具体为:基于数据预处理后的候选指标样本集合X获得的矩阵,具体公式如下:
Figure BDA0003609569040000031
其中,[X1,X2…Xn]每列为一个指标,则共n个指标、样本数据大小为m,即矩阵为m行、所以矩阵X大小为m×n。
进一步地,在步骤S2中,通过软阈值法对相关性系数矩阵Corr进行加权计算得到邻接矩阵的具体步骤为:给步骤S1中得到的相关性系数矩阵中每一个相关性系数加上一个指数β,则邻接矩阵中每个元素如下所示:
Aij=(|cor(Xi,Xj)|)β
生成矩阵大小为n×n,即i,j∈[1,n],完成对邻接矩阵的构建。
进一步地,在步骤S3中,拓扑重叠矩阵的计算公式,具体如下:
Figure BDA0003609569040000032
其中,
Figure BDA0003609569040000033
以1为遍历因子,遍历指标列表里除i,j以外的所有指标,并将1与i,j之间的相关系数以上式运算,运用其它指标做为桥梁,将指标i,j在网络中表现的重叠程度数据化;
若i,j在网络中的连接情况越相似,则Tomij越大。
完成拓扑重叠矩阵的计算。
进一步地,在步骤S4中,所述候选指标连接度为该指标在整个指标体系中的重要度,其中,每个指标的连接度,是与其相连的指标的边属性之和。
进一步地,在步骤S4中,所述候选指标连接度的值基于步骤S3中的TOM矩阵计算,所述候选指标连接度的计算公式为
Figure BDA0003609569040000041
公式中Connecti即为第i(i∈[1,n])个指标的连接度。
相比于现有技术,本发明的有益效果在于:能够客观计算出各维度指标之间的连接度,并以此来表征感知指标重要度的方法;
无须定义目标值,仅需基于候选指标数据内部规律,通过无监督学习算法,计算并得出指标重要度信息。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1为本发明提出的无监督的用户感知指标重要度确定方法的步骤流程图;
图2为本发明实施例中的可视化相关系统矩阵图;
图3为本发明实施例中的处理后的可视化相关系统矩阵图;
图4为本发明实施例中的相关性矩阵数据样例图;
图5为本发明实施例中的邻接矩阵数据样例图;
图6为本发明实施例中的拓扑重叠矩阵的详细代码图;
图7为本发明实施例中的拓扑重叠矩阵的代码运行结果图;
图8为本发明实施例中的Python实验代码及计算结果图;
图9为本发明提出的无监督的用户感知指标重要度确定方法的实施流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
实施例一
参照图1-8,无监督的用户感知指标重要度确定方法,包括以下步骤:
S1.计算相关性系数矩阵;
具体的,在步骤S1中,相关系数矩阵的计算方式为:所述利用皮尔逊相关系数公式,计算得出相关性系数矩阵Corr。
S2.软阈值法构建邻接矩阵;
具体的,在步骤S2中,具体步骤为,通过软阈值法基于步骤S1中获得的相关性系数矩阵Corr进行加权,计算得到邻接矩阵。
S3.计算拓扑重叠矩阵;
具体的,在步骤S3中,具体步骤为,利将步骤S2获得的结果中引入拓扑重叠矩阵;
利用python,计算得出拓扑重叠矩阵。
S4.计算候选指标重要度。
具体的,在步骤S4中,具体步骤为,基于步骤S3得出的拓扑重叠矩阵,根据连接度计算公式,对拓扑重叠矩阵的每行进行求和,计算得出各个指标的连接度;
将得到的连接度,做为每个候选指标的重要度结果;
基于每个指标的重要度排序结果,得到了用户视频维度的关键感知指标,完成既定目标。
实施例二
参照图1-9,在实施例一的基础上,在步骤S1中:
相关系数矩阵具体为:基于数据预处理后的候选指标样本集合X获得的矩阵,具体公式如下:
Figure BDA0003609569040000061
其中,[X1,X2…Xn]每列为一个指标,则共n个指标、样本数据大小为m,即矩阵为m行、所以矩阵X大小为m×n。
具体的,由于有n个指标,则相关性系数矩阵大小为n×n,矩阵中任意一个元素cor(Xi,Xj),i,j∈[1,n]为第i,j个指标之间的皮尔逊相关性系数,则:
Figure BDA0003609569040000062
其中,
Figure BDA0003609569040000071
公式中cov(X1,X2)为X1和X2的协方差,
Figure BDA0003609569040000072
为X1的方差,
Figure BDA0003609569040000073
为X1的平均值。
在步骤S2中:
通过软阈值法对相关性系数矩阵Corr进行加权计算得到邻接矩阵的具体步骤为:给步骤S1中得到的相关性系数矩阵中每一个相关性系数加上一个指数β,则邻接矩阵中每个元素如下所示:
Aij=(|cor(Xi,Xj)|)β
生成矩阵大小为n×n,即i,j∈[1,n],完成对邻接矩阵的构建。
具体的,对相关性系数矩阵Corr进行加权,可以得到邻接矩阵,这样做的直接结果是可以把感知指标之间的相关性强弱差异放大,使强弱关系更加分明;
需要说明的是,软阈值法就是给相关性系数矩阵中每一个相关性系数加上一个指数β,当β>1时,不同相关系数之间的差距会被放大,这种处理方式强化了强相关或正相关,弱化了弱相关或负相关,使得相关性数值更符合无尺度网络特征;
β的值根据无尺度网络适应系数进行自适应选择,例如要构建无尺度网络,即适应系数大于0.9的网络,就需计算各个β值加权后网络的无尺度网络适应系数,超过0.9的最小β,就是最优选择。
在步骤S3中:
拓扑重叠矩阵的计算公式,具体如下:
Figure BDA0003609569040000081
其中,
Figure BDA0003609569040000082
以1为遍历因子,遍历指标列表里除i,j以外的所有指标,并将1与i,j之间的相关系数以上式运算,运用其它指标做为桥梁,将指标i,j在网络中表现的重叠程度数据化;
若i,j在网络中的连接情况越相似,则Tomij越大。
完成拓扑重叠矩阵的计算。
需要说明的是,如果直接利用步骤S2得到的两两指标间的加权相关系数来进行模块识别划分,准确性较差,且未充分利用到数据中所提供的全部信息,为此引入了拓扑重叠矩阵的概念。
拓扑重叠矩阵的原理就是进一步考虑间接关联度。即如果指标i和指标j可以通过若干个中间关联的指标1,而形成间接联系,那么这种联系关系的强弱也会进一步被考虑进来,当作划分模块的依据。
在步骤S4中:
所述候选指标连接度为该指标在整个指标体系中的重要度,其中,每个指标的连接度,是与其相连的指标的边属性之和;
所述候选指标连接度的值基于步骤S3中的TOM矩阵计算,所述候选指标连接度的计算公式为
Figure BDA0003609569040000091
公式中Connecti即为第i(i∈[1,n])个指标的连接度。
需要说明的是,候选指标连接度的定义,为该指标在整个指标体系中的重要度,连接度,类似图算法中“度”的概念。
为了更好的理解本实施例的技术方案,以下以视频维度用户感知指标数据为例,应用本文方法,进一步用实际实验过程,说明本文方法上述四个步骤的应用效果:
根据实际业务意义,筛选出以下跟用户视频感知比较相关的12个指标。
采用上述方法步骤,计算得出这些指标的重要度,并从下述指标中筛选出重要度结果最高的三个指标,做为用户视频维度的关键指标,具体见表1,表1为用户视频感知的12个相关指标。
Figure BDA0003609569040000092
表1
提取长春市区视频维度的用户级、天粒度指标,做为实验数据。
具体实施步骤如下:
S1:计算相关性系数矩阵;
首先计算得出相关性系数矩阵,并进行可视化后,结果见图2;
通过直观观察,先直接将相关性系数超过0.8的一对指标,只保留一个,这样处理之后,留下8个指标,结果见图3。
S2.软阈值法构建邻接矩阵;
针对上述留下的8个指标,通过软阈值法,基于相关性矩阵,计算得出邻接矩阵,矩阵变换过程如数据样例所示,具体见图5-6。
S3.计算拓扑重叠矩阵;
根据公式,利用python,计算得出拓扑重叠矩阵,代码及计算结果,具体见图7-8。
S4.计算候选指标重要度
根据连接度计算公式,基于步骤S3得出的拓扑重叠矩阵,计算得出各个指标的连接度,即对拓扑重叠矩阵的每行进行求和;
最后将得到的连接度,作为每个候选指标的重要度结果,Python实验代码及计算结果,具体见图9;
最终完成了既定目标,即基于每个指标的重要度排序结果,得到了用户视频维度的关键感知指标。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种无监督的用户感知指标重要度确定方法,其特征在于,包括以下步骤:
S1.计算相关性系数矩阵;
S2.软阈值法构建邻接矩阵;
S3.计算拓扑重叠矩阵;
S4.计算候选指标重要度。
2.根据权利要求1所述的无监督的用户感知指标重要度确定方法,其特征在于,在步骤S1中,相关系数矩阵的计算方式为:所述利用皮尔逊相关系数公式,计算得出相关性系数矩阵Corr。
3.根据权利要求2所述的无监督的用户感知指标重要度确定方法,其特征在于,在步骤S2中,具体步骤为,通过软阈值法基于步骤S1中获得的相关性系数矩阵Corr进行加权,计算得到邻接矩阵。
4.根据权利要求3所述的无监督的用户感知指标重要度确定方法,其特征在于,在步骤S3中,具体步骤为,利将步骤S2获得的结果中引入拓扑重叠矩阵;
利用python,计算得出拓扑重叠矩阵。
5.根据权利要求4所述的无监督的用户感知指标重要度确定方法,其特征在于,在步骤S4中,具体步骤为,基于步骤S3得出的拓扑重叠矩阵,根据连接度计算公式,对拓扑重叠矩阵的每行进行求和,计算得出各个指标的连接度;
将得到的连接度,做为每个候选指标的重要度结果;
基于每个指标的重要度排序结果,得到了用户视频维度的关键感知指标,完成既定目标。
6.根据权利要求5所述的无监督的用户感知指标重要度确定方法,其特征在于,在步骤S1中,相关系数矩阵具体为:基于数据预处理后的候选指标样本集合X获得的矩阵,具体公式如下:
Figure FDA0003609569030000021
其中,[X1,X2…Xn]每列为一个指标,则共n个指标、样本数据大小为m,即矩阵为m行、所以矩阵X大小为m×n。
7.根据权利要求6所述的无监督的用户感知指标重要度确定方法,其特征在于,在步骤S2中,通过软阈值法对相关性系数矩阵Corr进行加权计算得到邻接矩阵的具体步骤为:给步骤S1中得到的相关性系数矩阵中每一个相关性系数加上一个指数β,则邻接矩阵中每个元素如下所示:
Aij=(|cor(Xi,Xj)|)β
生成矩阵大小为n×n,即i,j∈[1,n],完成对邻接矩阵的构建。
8.根据权利要求7所述的无监督的用户感知指标重要度确定方法,其特征在于,在步骤S3中,拓扑重叠矩阵的计算公式,具体如下:
Figure FDA0003609569030000022
其中,
Figure FDA0003609569030000031
以1为遍历因子,遍历指标列表里除i,j以外的所有指标,并将1与i,j之间的相关系数以上式运算,运用其它指标做为桥梁,将指标i,j在网络中表现的重叠程度数据化;
若i,j在网络中的连接情况越相似,则Tomij越大;
完成拓扑重叠矩阵的计算。
9.根据权利要求8所述的无监督的用户感知指标重要度确定方法,其特征在于,在步骤S4中,所述候选指标连接度为该指标在整个指标体系中的重要度,其中,每个指标的连接度,是与其相连的指标的边属性之和。
10.根据权利要求9所述的无监督的用户感知指标重要度确定方法,其特征在于,在步骤S4中,所述候选指标连接度的值基于步骤S3中的TOM矩阵计算,所述候选指标连接度的计算公式为
Figure FDA0003609569030000032
其中,公式中Connecti即为第i(i∈[1,n])个指标的连接度。
CN202210429602.3A 2022-04-22 2022-04-22 一种无监督的用户感知指标重要度确定方法 Pending CN114816321A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210429602.3A CN114816321A (zh) 2022-04-22 2022-04-22 一种无监督的用户感知指标重要度确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210429602.3A CN114816321A (zh) 2022-04-22 2022-04-22 一种无监督的用户感知指标重要度确定方法

Publications (1)

Publication Number Publication Date
CN114816321A true CN114816321A (zh) 2022-07-29

Family

ID=82505898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210429602.3A Pending CN114816321A (zh) 2022-04-22 2022-04-22 一种无监督的用户感知指标重要度确定方法

Country Status (1)

Country Link
CN (1) CN114816321A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115147417A (zh) * 2022-09-02 2022-10-04 之江实验室 一种基于过滤法特征选择的功能连接矩阵处理系统及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115147417A (zh) * 2022-09-02 2022-10-04 之江实验室 一种基于过滤法特征选择的功能连接矩阵处理系统及装置
CN115147417B (zh) * 2022-09-02 2022-11-15 之江实验室 一种基于过滤法特征选择的功能连接矩阵处理系统及装置
US11989883B2 (en) 2022-09-02 2024-05-21 Zhejiang Lab Functional connectivity matrix processing system and device based on feature selection using filtering method

Similar Documents

Publication Publication Date Title
CN112308115B (zh) 一种多标签图像深度学习分类方法及设备
CN111523055A (zh) 一种基于农产品特征属性评论倾向的协同推荐方法及系统
CN110634060A (zh) 一种用户信用风险的评估方法、系统、装置及存储介质
CN114254093A (zh) 多空间知识增强的知识图谱问答方法及系统
CN114816321A (zh) 一种无监督的用户感知指标重要度确定方法
CN115374106A (zh) 一种基于知识图谱技术的数据智能分级方法
CN107688647A (zh) 一种基于协同过滤的学习复习题库推荐方法
CN113592197A (zh) 一种家政服务推荐系统及方法
CN108509588B (zh) 一种基于大数据的律师评估方法及推荐方法
CN108428234B (zh) 基于图像分割结果评价的交互式分割性能优化方法
CN113591947A (zh) 基于用电行为的电力数据聚类方法、装置和存储介质
CN111584010B (zh) 一种基于胶囊神经网络和集成学习的关键蛋白质识别方法
CN107644285A (zh) 售电市场盈利能力评估指标的筛选与权重确定方法及系统
CN116823782A (zh) 一种基于图卷积和多尺度特征的无参考图像质量评价方法
CN113837913B (zh) 一种村镇耕地资源承载力关键阈值确定方法及装置
CN115442240A (zh) 一种社交网络公平结构挖掘方法
CN115345710A (zh) 一种电商商务大数据决策分析与数据处理方法
CN114331226A (zh) 一种企业需求智能诊断方法、系统以及存储介质
CN114387005A (zh) 一种基于图分类的套利团伙识别方法
CN114282875A (zh) 流程审批确定性规则和语义自学习结合判定方法及装置
CN111581297A (zh) 一种基于图卷积网络的符号网络符号的预测方法
CN112463643A (zh) 一种软件质量预测方法
CN116070120B (zh) 一种多标签时序电生理信号的自动识别方法及系统
CN112000897B (zh) 用于提升节点中心性的链路推荐方法及其用户推荐方法
CN116485232A (zh) 不均衡样本下的水质评估方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination