CN112667876A - 一种基于PSOTVCF-Kmeans算法的意见领袖群识别方法 - Google Patents
一种基于PSOTVCF-Kmeans算法的意见领袖群识别方法 Download PDFInfo
- Publication number
- CN112667876A CN112667876A CN202011548691.0A CN202011548691A CN112667876A CN 112667876 A CN112667876 A CN 112667876A CN 202011548691 A CN202011548691 A CN 202011548691A CN 112667876 A CN112667876 A CN 112667876A
- Authority
- CN
- China
- Prior art keywords
- cluster
- psotvcf
- amount
- opinion leader
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 239000002245 particle Substances 0.000 claims abstract description 52
- 230000006835 compression Effects 0.000 claims abstract description 21
- 238000007906 compression Methods 0.000 claims abstract description 21
- 238000004364 calculation method Methods 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 10
- 230000001133 acceleration Effects 0.000 claims description 9
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 8
- 230000009977 dual effect Effects 0.000 abstract description 6
- 238000005457 optimization Methods 0.000 abstract description 5
- 238000004458 analytical method Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000003094 perturbing effect Effects 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 244000097202 Rathbunia alamosensis Species 0.000 description 1
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013278 delphi method Methods 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开了一种基于PSOTVCF‑Kmeans算法的意见领袖群识别方法,包括:步骤1,利用网络爬虫工具,从互联网中采集实际的社交网络数据;步骤2,基于“用户影响力”和“话题影响力”计算意见领袖值;所述用户影响力包括粉丝量、原创微博量和是否认证,话题影响力包括博文评论量、转发量和点赞量;步骤3,依意见领袖值高低排序得到预判的意见领袖群簇P和普通用户群簇Q,作为粒子群的初始扰动场,基于PSOTVCF‑Kmeans算法对意见领袖群簇P和普通用户群簇Q进行聚类。本文利用时变双重压缩因子粒子群优化算法,建立PSOTVCF‑KMeans聚类模型,通过PSOTVCF寻找全局最优解的优势,确定最佳聚类初始簇心,提高了K‑means算法的聚类效果和效率。
Description
技术领域
本发明涉及一种识别方法,特别是涉及一种基于PSOTVCF-Kmeans算法的意见领袖群 识别方法。
背景技术
微博不仅是舆论流传的一个独立源头,也参与舆论的形成、发展与引导的进程中。微博 平台中存在各种意见领袖,他们能影响其他人的观点与行为,令话题不断升温。因此,如何 精确识别意见领袖群,对于政府高效疏导群众突发事件舆论走向,具有重大意义。
目前社会网络分析法、PageRank法及指标分析法等技术得到广泛应用。依据“粉丝量”、“转 发量”、“点赞量”以及“是否认证”等指标加权,对用户影响力进行排序,是现今大多数意见领 袖识别模型的基础,虽然实现了对用户影响力的衡量,但在确定意见领袖范围时一般采用自 定义排名阈值方式,偶然性强。李熠辉等[7]将改进的PageRank算法与K-means算法结合构建 MUK-means聚类模型,按影响力排名将用户分成两簇,自动识别出意见领袖的范围,提高了 意见领袖识别在阈值选取的客观性。但将初始簇心设为用户影响力排名最高和最低用户,虽 然初始簇心距离保持最大,但忽略了初始簇内平均距离对聚类的影响,导致聚类效果不佳, 聚类效率低下。
发明内容
针对现有技术的不足,本发明提出了一种基于PSOTVCF-Kmeans算法的意见领袖群识 别方法,具体包括如下步骤:
步骤1,利用网络爬虫工具,从互联网中采集实际的社交网络数据;
步骤2,基于“用户影响力”和“话题影响力”计算意见领袖值;所述用户影响力包括粉丝量、 原创微博量和是否认证,话题影响力包括博文评论量、转发量和点赞量;
步骤3,依意见领袖值高低排序得到预判的意见领袖群簇P和普通用户群簇Q,作为粒子 群的初始扰动场,基于PSOTVCF-Kmeans算法对意见领袖群簇P和普通用户群簇Q进行聚 类,具体实现方式如下,
(1)粒子种群初始扰动:首先随机在簇P和簇Q中选取一个初始聚类簇心,然后依据最大距离原则选取剩余的聚类簇心,重复操作n次,产生n个粒子,计算每个初始簇心与所在簇其他节点的距离;
(2)计算n个粒子的适应度值fit,并寻找每个粒子的个体极值pbest和群体极值gbest;
(3)更新粒子的速度与位置;
(4)以更新后的粒子为聚类中心重新聚类,并计算每个粒子的适应度值;
(5)判断当前种群适应度方差Var是否低于某个阈值Thre或者达到最大迭代次数,如 果是,则转向(6);否则转向(3);
(6)以PSOTVCF算法得到的簇P和簇Q的最佳位置[pbest,qbest]作为初始中心,令 K-means当前迭代次数为t=0;
(7)对每个数据,分别计算其与当前迭代的簇P和簇Q的簇心Cj1,Cj2的距离,将其加入到最近的聚类中心,计算同一簇群中所有数据的平均值,以此为新的聚类中心;
(8)记录每一次的簇心Cj1,Cj2,若簇心不再变化,或者t≥tmax,或者簇心的fit值小于等于Var,说明算法已收敛,停止当前迭代,记录当前的fit值;反之回到(7),t+1,重 新进行迭代计算。
进一步的,步骤2中意见领袖值的计算公式如下,
I=w1*F1+w2F2+w3F3 (3.1)
T=w4*F4+w5F5+w6F6 (3.2)
L=I+T (3.3)
其中,公式(3.1)为用户影响力计算公式,其中,w1-w3代表不同指标的权重,F1-F3为用 户的粉丝量、原创微博量和是否认证;若已认证,则F3=1;公式(3.2)为话题影响力计算公式, w4-w6代表不同指标的权重,F4-F6代表评论量、转发量和点赞量;公式(3.3)为用户最终的意 见领袖值。
进一步的,w1-W6根据重要性的等级构造判断矩阵,重要等级分为:同等重要、略为重 要、比较重要、非常重要、绝对重要,对应标度为1,3,5,7,9,处于相邻重要性判断的中间值用2,4,6,8表示,运用改进的AHP对判断矩阵进行计算得到的各指标权重。
进一步的,(5)中适应度方差Var的计算公式如下;
其中,fi是指第i代的fit值;favg是fit值的平均值。
进一步的,(3)中更新粒子的速度与位置的计算公式如下,
得到系统矩阵:
时变压缩因子计算公式为:
其中,压缩因子χ是一个正实数,ITER为当前进化代数,MAXITER为最大迭代数,C1N,C1M,C2N,C2M分别为第一、二个加速因子的初始最大和最小值。
与现有技术相比,本发明的优点和有益效果:本文利用时变双重压缩因子粒子群优化算 法(Particle Swarm Optimizer with Time Varying Constrict Factor,PSOTVCF),建立 PSOTVCF-KMeans聚类模型,通过PSOTVCF寻找全局最优解的优势,确定最佳聚类初始簇 心,提高K-means算法的聚类效果和效率,并通过实验验证了PSOTVCF-KMeans算法意见 领袖群识别的有效性。
附图说明
图1为本发明实施例流程图。
图2为K-means算法200次实验结果。
图3为PSO-Kmeans算法200次实验结果。
图4为PSOTVCF-Kmeans算法200次实验结果。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步说明。
1、时变双重压缩因子粒子群算法
粒子群算法(PSO)是由R.C.Eberhart以及J.Kennedy等设计的一种进化算法[1]。由于 在解决实际问题中展示了其易实现、精度高、收敛快的特点,很快引起了研发人员的重视。 由于PSO容易堕入局部最优,通过改善惯性权重(w)、种群规模(n)和最大速度(vbest)等参数克服这一缺陷,本发明提出了结合时变加速因子的粒子群算法PSOTVCF。该算法运用双重压缩因子:第一个压缩因子C1用来调节全局和局部搜索,第二压缩因子C2利用时变加速因子进一步平衡全局和局部最优值对粒子种群升级的影响。
PSOTVCF时变压缩因子计算公式为:
其中,ITER为当前进化代数,MAXITER为最大迭代数,C1N,C1M,C2N,C2M分别为 第一、二个加速因子的初始最大和最小值。
PSOTVCF的速度更新公式可变形为:
得到系统矩阵:
压缩因子χ是一个正实数,PSOCF升级粒子和速度的公式如下:
k为迭代次数,Rand表示随机数,Pi,j表示速度的局部最优值,G表示速度的全局最优值, xi,j(k)表示粒子i中的第j维在第t次迭代的位置,χ1和χ2分别表示第一、二个压缩因子。 χ根据下述公式计算到得:
加速因子取初始值为2.05,所以公式2.10中的压缩因子为常数;公式2.11连续使用第二 个加速因子χ2,与第一个压缩因子得到的速度Vel(k+1)相乘得到V(k+2);χ2根据式2.4计算 得到的时变加速因子,根据式2.10和2.11计算得出,因为时变的加速因子会根据朝代化数发 生变化,所以第二个压缩因子也是时变的。
设循环次数为M,简化的粒子速度为:
2、微博KOL群识别指标分析模型构建
为了比较聚类效果与效率,本文结合指标分析法,提出了基于“用户影响力”和“话题影响 力”的KOL指标分析模型。
(1)用户影响力
用户影响力烘托用户的社会影响力和对其他用户在情感和观点上产生影响的可能性。微 博平台KOL的用户影响力可用粉丝量(F1)、原创微博量(F2)和是否认证(F3)权衡。F1越大, 用户被关注度高,微博被关注的可能性也越大。F2既可反应博主活跃度和账号的经营程度, 也体现博主在不同话题的沉淀以及自我情感的倾向性和感染力。F2越多,发言越多,影响力 的积累越大。F3包括“微博个人认证”和“微博官方认证”,影响力辐射至微博各范畴,吸引和 影响更多粉丝群体。
(2)话题影响力
话题影响力刻画了用户自身在特定话题上的张力,不同话题有不同意见领袖,针对突发 事件,意见领袖大多都有独特或影响力的看法,可带动用户的观点和情感走势。微博意见领 袖的话题影响力可通过博文评论量(F4)、转发量(F5)和点赞量(F6)来评估。F4是某 一特定话题博文评论的总和,F4越大,说明用户的观点引起了更多人讨论;F5说明用户观点 被其他人认同且乐意于做二次分享,表明该舆论以级联方式传播,可产生骨牌效应;F6能最 直观地表达民众对于博主观点的赞同。
本文引用德尔菲法构造判别矩阵,构建基于“用户影响力”和“话题影响力”的意见领袖群 识别指标分析体系,确定F1~F6这6个指标的权重。根据重要性的等级,因素i的重要性可分 为:同等重要、略为重要、比较重要、非常重要、绝对重要,对应标度为1,3,5,7,9,处于 相邻重要性判断的中间值用2,4,6,8表示。运用改进的AHP对判断矩阵进行计算得到的各指 标权重如表3.1所示。
表3.1微博意见领袖指标权重
I=w1*F1+w2F2+w3F3 (3.1)
T=w4*F4+w5F5+w6F6 (3.2)
L=I+T (3.3)
公式(3.1)为用户影响力计算公式。其中,w1-w3代表不同指标的权重,F1-F3为用户的粉 丝量、原创微博量和是否认证。若已认证,则F3=1;公式(3.2)为话题影响力计算公式。w4-w6代表不同指标的权重,F4-F6代表评论量、转发量和点赞量。公式(3.3)为用户最终的意见领袖 值。
3、PSOTVCF-Kmeans算法模型
针对K-means算法因初始簇心选取不确定,易陷入局部最优,且耗费时间长等缺点,本 文将时变双重压缩因子粒子群算法运用到聚类前最佳初始簇心的选取中,建立了PSOTVCF-Kmeans算法模型:通过PSOTVCF算法提前找到最优聚类初始簇心,从而防止 K-means算法陷入局部最优的可能性,以提高微博平台KOL群识别的识别效率。算法伪代码 如下:
(1)初始化种群,随机选取一个粒子为聚类簇心,依据最大距离原则选取剩余的聚类簇 心;重复操作n次,产生n个粒子(每个粒子为一个k×col维向量,k是聚类簇群数,col为 数据集中属性的个数)。
(2)依据粒子选取的中心,通过每个粒子的fit值,寻找粒子的个体极值pbesti和全局最 值gbest,以及对应粒子的位置xbesti和xgbest;fit函数采用聚类指标DBI(Davies-Bouldin) 指数计算公式:
距离公式如下:
C表示聚类中心集合,xj表示数据集中第j个数据,|C|表示当前聚类数。Ci表示簇i的 平均距离,||||2表示欧氏距离,k为簇群数。
(3)根据公式(2.3)、(2.4)动态调整因子,按照公式(2.5)、(2.6)更新粒子单体 所对应的速度与位置。
(4)选取更新后的粒子为聚类中心,对数据集重新聚类,计算每个粒子的fit值。
(5)判断当前种群适应度方差(Var)是否低于阈值(Thre)或是否达到最大迭代次数, 如果是,则跳至(6);否则跳至(3)。
其中,fi是指第i代的fit值;favg是fit值的平均值。
(6)选用PSOTVCF的最佳位置作为初始中心,建立类别矩阵Un×k,令K-means当前迭代次数t=0。
(7)按”最近距离原则”重新聚类划分,并按下式更新Un×k。
(8)如果Un×k未发生变化,说明聚类中心已经收敛,则结束迭代,否则转向(9)。
(9)根据划分结果计算每个聚类的平均值作为新的聚类中心点,如果存在某个簇类为 空,则删除该簇类,同时簇群数量k的值-1。
(10)令当前迭代次数t+1,若t≥tmax,则算法终止,输出聚类划分的结果,并按公式(3.8)计算聚类指标DBI指数;否则跳回至步骤(8)。
4、基于PSOTVCF-Kmeans算法的意见领袖群识别模型
本文搭建了一种新的微博用户影响力的指标体系,用来完成微博用户的影响力评估。识 别意见领袖时,用户被划分为意见领袖和非意见领袖,K-means中的K值为2。根据公式(3.1) 通过指标加权计算出用户节点的影响力I和话题影响力T,I和T值越大,影响力越大,排名 越高。将用户群按照排名(即微博KOL群识别指标L)提前平均分为两簇,排名高的一簇被 提前预判为意见领袖群簇P,排名低的为普通用户群簇Q。用PSOTVCF在簇P、Q中随机扰 动,通过粒子群的速度与位移更新,不断迭代,寻找目标函数的最优解,即为K-means算法 的最佳初始簇心。
基于PSOTVCF-KMeans的KOL群识别模型伪代码如下:
(1)粒子种群初始扰动:分别在簇P和簇Q中选取聚类簇心p,q,然后依据最大距离原 则选取剩余的聚类簇心,重复操作n次,产生n个粒子,其中每个粒子为2×1维向量,即[pj,qj], 计算每个簇心与所在簇其他节点xi的距离dis(xi,pj),dis(xi,qj)。
(2)根据公式(3.9)计算n个粒子的适应度值,寻找每个粒子的个体极值pbest和群体 极值gbest,适应度函数采用聚类指标DBI指数;
(3)根据公式(2.3)、(2.4)动态调整因子,按照公式(2.5)、(2.6)更新粒子的速 度与位置。
(4)以更新后的粒子为聚类中心重新聚类,计算每个粒子的适应度值。
(5)判断当前种群适应度方差Var是否低于某个阈值Thre或者达到最大迭代次数,如 果是,则转向(6);否则转向(3)。
(6)以PSOTVCF算法得到的簇P和簇Q的最佳位置[pbest,qbest]作为初始中心,令当前迭代次 数为t=0;
(7)对数据集的每个数据,计算其与当前迭代的簇P和簇Q的簇心Cj1,Cj2的距离,将其加入到最近的聚类中心,计算同一簇群中所有数据的平均值,以此为新的聚类中心。
(8)记录每一次的簇心Cj1,Cj2,若簇心不再变化,或者判断是否t≥tmax,或者判断簇心的fit值是否小于等于Var,说明算法已收敛,停止当前迭代,记录当前的DBI值,反之回到(7),t+1,重新进行迭代计算。
本文基于新浪微博开放API,以“某话题”作为话题关键词,通过Python Scrapy爬取2020 年5月17日—5月19日的话题相关博文数据,共收集微博12249条。用正则表达式处理后 的量化数据包括博文的转发数、评论数和点赞数,以及用户基础信息:粉丝数、认证信息和 原创微博数。首先用excel对量化后的“用户影响力”与“话题影响力”的数据根据公式3.1-3.3计 算意见领袖值,依意见领袖值高低排序得到预判的意见领袖群簇P和普通用户群簇Q,作为粒 子群的初始扰动场,用Python Jupiter Lab对数据进行扰动,再根据模型展开数值实验。
实验中,PSOTVCF的参数为:第一个压缩因子为常量,C1=2.6,C2=1.2;第二个压缩因子呈时变状态,C1N=2.88,C1M=2.68,C2N=1.45,C2M=1.25。测试环境:硬件Intel Corei5,软件Jupiter Lab开发工具(Python 3.7)。
3.2实验结果与分析
本文对KOL群识别的对比方法,通过DBI指标和聚类时间对比PSOTVCF-KMeans、PSO-Kmeans和标准K-means的聚类效果,以验证PSOTVCF-KMeans算法的有效性。由于PSO 是随机算法,本实验对每种算法共进行200次数值试验,统计最优值、最差值和平均值作为最终的对比数据。实验结果如图2~4及表4.1、4.2所示。图中横坐标表示试验次数,纵坐标表示 每次试验所测得聚类结果的DBI值。
表4.1三种算法的DBI数据
表4.2三种算法的聚类时间
由图2~4和表4.1所示,对于DBI,Kmeans算法最大,PSOTVCF-KMeans最小,说明PSOTVCF-KMeans的聚类效果最佳,其原因在于:PSOTVCF的双重压缩因子使粒子初期和后期的搜索范围更大,找到的全局最优解质量更高,获得更优质的初始聚类簇心。表4.2说明,在聚类时间上,PSOTVCF所消耗的时间比PSOK-means和K-means更短,这是因为良好的初始簇心使聚类过程中达到阈值的速度更快。
综上,PSOTVCF-Kmeans算法由于其自身双重压缩因子对粒子速度的调节,提高了初始 聚类簇心的优越性,增强了KOL群识别的聚类效果,缩短了KOL群识别的聚类时间,从而KOL 群识别聚类模型的效率。
本文中所描述的具体实施例仅仅是对本发明作举例说明。本发明所属技术领域的技术人 员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏 离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (5)
1.一种基于PSOTVCF-Kmeans算法的意见领袖群识别方法,其特征在于,包括如下步骤:
步骤1,利用网络爬虫工具,从互联网中采集实际的社交网络数据;
步骤2,基于“用户影响力”和“话题影响力”计算意见领袖值;所述用户影响力包括粉丝量、原创微博量和是否认证,话题影响力包括博文评论量、转发量和点赞量;
步骤3,依意见领袖值高低排序得到预判的意见领袖群簇P和普通用户群簇Q,作为粒子群的初始扰动场,基于PSOTVCF-Kmeans算法对意见领袖群簇P和普通用户群簇Q进行聚类,具体实现方式如下,
(1)粒子种群初始扰动:首先随机在簇P和簇Q中选取一个初始聚类簇心,然后依据最大距离原则选取剩余的聚类簇心,重复操作n次,产生n个粒子,计算每个初始簇心与所在簇其他节点的距离;
(2)计算n个粒子的适应度值fit,并寻找每个粒子的个体极值pbest和群体极值gbest;
(3)更新粒子的速度与位置;
(4)以更新后的粒子为聚类中心重新聚类,并计算每个粒子的适应度值;
(5)判断当前种群适应度方差Var是否低于某个阈值Thre或者达到最大迭代次数,如果是,则转向(6);否则转向(3);
(6)以PSOTVCF算法得到的簇P和簇Q的最佳位置[pbest,qbest]作为初始中心,令K-means当前迭代次数为t=0;
(7)对每个数据,分别计算其与当前迭代的簇P和簇Q的簇心Cj1,Cj2的距离,将其加入到最近的聚类中心,计算同一簇群中所有数据的平均值,以此为新的聚类中心;
(8)记录每一次的簇心Cj1,Cj2,若簇心不再变化,或者t≥tmax,或者簇心的fit值小于等于Var,说明算法已收敛,停止当前迭代,记录当前的fit值;反之回到(7),t+1,重新进行迭代计算。
2.如权利要求1所述的一种基于PSOTVCF-Kmeans算法的意见领袖群识别方法,其特征在于:步骤2中意见领袖值的计算公式如下,
I=w1*F1+w2F2+w3F3 (3.1)
T=w4*F4+w5F5+w6F6 (3.2)
L=I+T (3.3)
其中,公式(3.1)为用户影响力计算公式,其中,w1-w3代表不同指标的权重,F1-F3为用户的粉丝量、原创微博量和是否认证;若已认证,则F3=1;公式(3.2)为话题影响力计算公式,w4-w6代表不同指标的权重,F4-F6代表评论量、转发量和点赞量;公式(3.3)为用户最终的意见领袖值。
3.如权利要求2所述的一种基于PSOTVCF-Kmeans算法的意见领袖群识别方法,其特征在于:w1-W6根据重要性的等级构造判断矩阵,重要等级分为:同等重要、略为重要、比较重要、非常重要、绝对重要,对应标度为1,3,5,7,9,处于相邻重要性判断的中间值用2,4,6,8表示,运用改进的AHP对判断矩阵进行计算得到的各指标权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011548691.0A CN112667876B (zh) | 2020-12-24 | 2020-12-24 | 一种基于PSOTVCF-Kmeans算法的意见领袖群识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011548691.0A CN112667876B (zh) | 2020-12-24 | 2020-12-24 | 一种基于PSOTVCF-Kmeans算法的意见领袖群识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112667876A true CN112667876A (zh) | 2021-04-16 |
CN112667876B CN112667876B (zh) | 2024-04-09 |
Family
ID=75408266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011548691.0A Active CN112667876B (zh) | 2020-12-24 | 2020-12-24 | 一种基于PSOTVCF-Kmeans算法的意见领袖群识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112667876B (zh) |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6012058A (en) * | 1998-03-17 | 2000-01-04 | Microsoft Corporation | Scalable system for K-means clustering of large databases |
WO2002095534A2 (en) * | 2001-05-18 | 2002-11-28 | Biowulf Technologies, Llc | Methods for feature selection in a learning machine |
US20050196047A1 (en) * | 2004-02-03 | 2005-09-08 | Yuri Owechko | Object recognition system incorporating swarming domain classifiers |
CN103116611A (zh) * | 2013-01-25 | 2013-05-22 | 西安市烟草专卖局 | 社交网络意见领袖识别方法 |
CN103136331A (zh) * | 2013-01-18 | 2013-06-05 | 西北工业大学 | 微博网络意见领袖识别方法 |
CN103150333A (zh) * | 2013-01-26 | 2013-06-12 | 安徽博约信息科技有限责任公司 | 微博媒体中的意见领袖识别方法 |
CN103617235A (zh) * | 2013-11-26 | 2014-03-05 | 中国科学院信息工程研究所 | 一种基于粒子群算法的网络水军账号识别方法及系统 |
CN104123352A (zh) * | 2014-07-10 | 2014-10-29 | 西安理工大学 | 面向微博的话题层次用户影响力度量方法 |
CN104216954A (zh) * | 2014-08-20 | 2014-12-17 | 北京邮电大学 | 突发事件话题状态的预测装置及预测方法 |
CN105956113A (zh) * | 2016-05-05 | 2016-09-21 | 南京邮电大学 | 基于粒子群优化的视频数据挖掘高维聚类方法 |
CN107153837A (zh) * | 2017-04-14 | 2017-09-12 | 中国科学技术大学苏州研究院 | 深度结合K‑means和PSO的聚类方法 |
CN107506480A (zh) * | 2017-09-13 | 2017-12-22 | 浙江工业大学 | 一种基于评论挖掘与密度聚类的双层图结构推荐方法 |
CN107633260A (zh) * | 2017-08-23 | 2018-01-26 | 上海师范大学 | 一种基于聚类的社交网络意见领袖挖掘方法 |
WO2018072351A1 (zh) * | 2016-10-20 | 2018-04-26 | 北京工业大学 | 一种基于粒子群优化算法对支持向量机的优化方法 |
CN108399267A (zh) * | 2018-03-27 | 2018-08-14 | 东北大学 | 一种基于簇语义特征分析的反馈式聚类方法 |
CN109492022A (zh) * | 2018-09-18 | 2019-03-19 | 南京邮电大学 | 基于语义的改进的k-means算法的搜索方法 |
KR20190128963A (ko) * | 2018-05-09 | 2019-11-19 | 서강대학교산학협력단 | K-평균 클러스터링 기반의 데이터 마이닝 시스템 및 이를 이용한 k-평균 클러스터링 방법 |
CN111159402A (zh) * | 2019-12-13 | 2020-05-15 | 深圳大学 | 一种基于主题意见分析和意见领袖的网络用户影响关系的挖掘方法 |
CN111368077A (zh) * | 2020-02-28 | 2020-07-03 | 大连大学 | 一种基于粒子群位置更新思想灰狼优化算法的K-Means文本分类方法 |
-
2020
- 2020-12-24 CN CN202011548691.0A patent/CN112667876B/zh active Active
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6012058A (en) * | 1998-03-17 | 2000-01-04 | Microsoft Corporation | Scalable system for K-means clustering of large databases |
WO2002095534A2 (en) * | 2001-05-18 | 2002-11-28 | Biowulf Technologies, Llc | Methods for feature selection in a learning machine |
US20050196047A1 (en) * | 2004-02-03 | 2005-09-08 | Yuri Owechko | Object recognition system incorporating swarming domain classifiers |
CN103136331A (zh) * | 2013-01-18 | 2013-06-05 | 西北工业大学 | 微博网络意见领袖识别方法 |
CN103116611A (zh) * | 2013-01-25 | 2013-05-22 | 西安市烟草专卖局 | 社交网络意见领袖识别方法 |
CN103150333A (zh) * | 2013-01-26 | 2013-06-12 | 安徽博约信息科技有限责任公司 | 微博媒体中的意见领袖识别方法 |
CN103617235A (zh) * | 2013-11-26 | 2014-03-05 | 中国科学院信息工程研究所 | 一种基于粒子群算法的网络水军账号识别方法及系统 |
CN104123352A (zh) * | 2014-07-10 | 2014-10-29 | 西安理工大学 | 面向微博的话题层次用户影响力度量方法 |
CN104216954A (zh) * | 2014-08-20 | 2014-12-17 | 北京邮电大学 | 突发事件话题状态的预测装置及预测方法 |
CN105956113A (zh) * | 2016-05-05 | 2016-09-21 | 南京邮电大学 | 基于粒子群优化的视频数据挖掘高维聚类方法 |
WO2018072351A1 (zh) * | 2016-10-20 | 2018-04-26 | 北京工业大学 | 一种基于粒子群优化算法对支持向量机的优化方法 |
CN107153837A (zh) * | 2017-04-14 | 2017-09-12 | 中国科学技术大学苏州研究院 | 深度结合K‑means和PSO的聚类方法 |
CN107633260A (zh) * | 2017-08-23 | 2018-01-26 | 上海师范大学 | 一种基于聚类的社交网络意见领袖挖掘方法 |
CN107506480A (zh) * | 2017-09-13 | 2017-12-22 | 浙江工业大学 | 一种基于评论挖掘与密度聚类的双层图结构推荐方法 |
CN108399267A (zh) * | 2018-03-27 | 2018-08-14 | 东北大学 | 一种基于簇语义特征分析的反馈式聚类方法 |
KR20190128963A (ko) * | 2018-05-09 | 2019-11-19 | 서강대학교산학협력단 | K-평균 클러스터링 기반의 데이터 마이닝 시스템 및 이를 이용한 k-평균 클러스터링 방법 |
CN109492022A (zh) * | 2018-09-18 | 2019-03-19 | 南京邮电大学 | 基于语义的改进的k-means算法的搜索方法 |
CN111159402A (zh) * | 2019-12-13 | 2020-05-15 | 深圳大学 | 一种基于主题意见分析和意见领袖的网络用户影响关系的挖掘方法 |
CN111368077A (zh) * | 2020-02-28 | 2020-07-03 | 大连大学 | 一种基于粒子群位置更新思想灰狼优化算法的K-Means文本分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112667876B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Entity embedding-based anomaly detection for heterogeneous categorical events | |
Xue et al. | A multi-objective evolutionary algorithm with interval based initialization and self-adaptive crossover operator for large-scale feature selection in classification | |
Yang et al. | Extracting actionable knowledge from decision trees | |
US9489627B2 (en) | Hybrid clustering for data analytics | |
Yu et al. | An automatic method to determine the number of clusters using decision-theoretic rough set | |
US7921069B2 (en) | Granular data for behavioral targeting using predictive models | |
Guo et al. | Group recommendation with latent voting mechanism | |
CN110866030A (zh) | 一种基于无监督学习的数据库异常访问检测方法 | |
CN115688024B (zh) | 基于用户内容特征和行为特征的网络异常用户预测方法 | |
Prakash et al. | Gravitational search algorithm and K-means for simultaneous feature selection and data clustering: a multi-objective approach | |
CN109657147A (zh) | 基于萤火虫和加权极限学习机的微博异常用户检测方法 | |
CN112258223A (zh) | 一种基于决策树的营销广告点击的预测方法 | |
Alhajj et al. | Multi-objective genetic algorithms based automated clustering for fuzzy association rules mining | |
Kuo et al. | Integration of artificial immune network and K-means for cluster analysis | |
Al-Otaibi et al. | Hybrid immunizing solution for job recommender system | |
Hussain et al. | Clustering uncertain graphs using ant colony optimization (ACO) | |
He | Evolutionary K-Means with pair-wise constraints | |
CN110543601B (zh) | 一种基于中智集的上下文感知兴趣点推荐方法及系统 | |
Çomak | A particle swarm optimizer with modified velocity update and adaptive diversity regulation | |
CN112667876A (zh) | 一种基于PSOTVCF-Kmeans算法的意见领袖群识别方法 | |
Mu et al. | AD-link: An adaptive approach for user identity linkage | |
Deng et al. | Label propagation on k-partite graphs with heterophily | |
CN115829683A (zh) | 一种基于逆奖赏学习优化的电力积分商品推荐方法及系统 | |
Salehi et al. | Attribute-based collaborative filtering using genetic algorithm and weighted c-means algorithm | |
Aghabozorgi et al. | Using incremental fuzzy clustering to web usage mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |