CN117421490A - 社交网络群体的组织能力评估方法及系统 - Google Patents
社交网络群体的组织能力评估方法及系统 Download PDFInfo
- Publication number
- CN117421490A CN117421490A CN202311482667.5A CN202311482667A CN117421490A CN 117421490 A CN117421490 A CN 117421490A CN 202311482667 A CN202311482667 A CN 202311482667A CN 117421490 A CN117421490 A CN 117421490A
- Authority
- CN
- China
- Prior art keywords
- group
- social network
- information
- influence
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008520 organization Effects 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 title claims abstract description 45
- 239000011159 matrix material Substances 0.000 claims abstract description 44
- 238000011156 evaluation Methods 0.000 claims abstract description 33
- 230000003993 interaction Effects 0.000 claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 17
- 230000009471 action Effects 0.000 claims description 18
- 238000010276 construction Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 2
- 230000006399 behavior Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000009825 accumulation Methods 0.000 description 4
- 238000011158 quantitative evaluation Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供社交网络群体的组织能力评估方法及系统,方法包括:获取群体内部行动能力信息;获取群体的对外影响力信息,使用社交网络中关注、点赞、回复、转发、引用以及交互次数信息等构建构建无向边,由交互程度构建边的权值,从而构建图的带权邻接矩阵A;定义带权邻接矩阵A的Rayleigh熵,将最小化矩阵A的最大特征值等价最小化;一条边的影响力定义为删除该边后矩阵最大特征值减小的程度;进行群体的信息传播重要性量化,评价社交网络中群体组织能力。本发明解决了群体组织能力的内涵难以明确,在面向群体组织能力评估的应用场景下多源异构网络数据采集与处理困难,以及无法对群体组织能力进行全面定量评估的技术问题。
Description
技术领域
本发明涉及社交网络数据处理领域,具体涉及社交网络群体的组织能力评估方法及系统。
背景技术
(1)基于社交网络的影响力评估技术
现有的许多技术主要利用社交网络分析,基于节点的拓扑特征(如中心性、介数等)来评估一个节点的影响力和传播能力。代表性的技术包括:PageRank算法:利用网络中节点的链接关系计算节点的重要性;LeaderRank算法:在PageRank基础上加入节点与TOPIC的关联度评估节点影响力。例如公布号为CN112380465A的现有发明专利申请文献《基于注意力流网络模型的互联网站点影响力的定量评估方法》包括对海量群体用户的在线点击流数据进行数据清洗,得到群体用户的注意力转换序列;构建群体注意力流网络;计算注意力流矩阵M、概率转移矩阵P、注意力耗散矩阵Q和基本矩阵U;计算互联网站点影响力Ci。前述现有技术的应用场景限于对社交网络中的节点影响力及传播能力的评估,无法量化反映群体的组织调动能力。
(2)基于拓扑特征(如节点度、介数等)的影响力评估技术。例如公布号为CN107818514A的现有发明专利申请文献《一种控制在线社交网络信息传播的方法、装置及终端》,该现有方法包括:构建信息传播网络,信息传播网络包括节点、信息流通方向和信息传播概率;信息传播网络是基于在线社交网络的用户关系链和用户历史信息传播行为构建的;信息传播概率的计算公式为:其中,wi代表每篇文章的权重,cnt表示每篇文章的转发量;B→A表示用户A从用户B处转发了文章,n为用户A从用户B处转发文章的数量;用户A从用户B处转发了文章,则构建一条从用户B指向用户A的有向边,边上的数据为有向边上的权重,有向边上的权重定义为历史上用户A从用户B处转发的文章数量和质量的加权组合,用于表示信息传播概率;基于信息传播网络,计算节点的离线特征,从离线特征中抽取训练样本,通过机器学习训练预先构建的节点传播影响力预测模型;基于信息传播网络,计算节点的在线特征;在线特征为信息传播中的动态变化的特征,用于反映信息传播的实时情况,在线特征包括信息的热度和信息传播的拓扑特征;当信息传播的实时情况指示节点的邻居节点没有被非法不实信息感染时,向节点传播影响力预测模型提供作为输入的离线特征和在线特征,节点传播影响力预测模型进行预测并输出节点传播影响力预测值;结合当前节点的节点传播影响力预测值和指定时间窗口大小内的其他节点的信息,对节点传播影响力预测值大于预设值的节点进行信息控制;其中节点传播影响力预测值大于预设值的节点的邻居节点没有被非法不实信息感染。从前述现有方案的具体实施内容可知,前述现有技术侧重群体影响力和信息传播能力评估,没有考虑群体的组织能力评估。
(3)基于文本挖掘的社交网络影响力评估技术
这类技术通过分析用户生成内容和互动文本,采用文本特征来评估网络中节点的影响力。典型的技术包括:基于内容特征(关键词、情感倾向等)的影响力评估;基于传播树的影响力评估技术;基于话题模型的影响力评估技术。这些技术也存在上述问题。
(4)现有的社交网络群体发现和分析技术
现有技术可以发现网络中的社区结构和群体,但主要侧重识别和划分群体,而未涉及群体组织组织能力的评估。目前对于社交网络中的个体或者群体的能力评估多针对影响力方面的评估,影响力是一个比较广泛的概念,本方案针对社交网络中群体组织能力,提出了一个全方位、多角度的评估方案。
原有的社交网络个体或群体评估技术存在以下几点缺点:
评估维度较单一,主要集中在影响力方面,很少考虑群体的组织能力维度;
对群体组织能力的评估缺乏系统性,无法全方位反映群体的组织调动能力;
现有方法缺乏客观的定量指标,评估结果主观性较强;
评估指标和计算方法简单化,未充分利用多源异构网络数据支持评估;
针对以上缺点,本技术方案要解决的技术问题是:
明确定义群体组织能力的内涵,提出反映群体组织能力的评估指标体系。
设计面向群体组织能力评估的多源异构网络数据采集与处理技术。
提出基于多源数据的群体组织能力量化指标计算方法。
现有技术存在群体组织能力的内涵难以明确,在面向群体组织能力评估的应用场景下多源异构网络数据采集与处理困难,以及无法对群体组织能力进行全面定量评估的技术问题。
发明内容
本发明所要解决的技术问题在于如何解决现有技术中群体组织能力的内涵难以明确,在面向群体组织能力评估的应用场景下多源异构网络数据采集与处理困难,以及无法对群体组织能力进行全面定量评估的技术问题。
本发明是采用以下技术方案解决上述技术问题的:社交网络群体的组织能力评估方法包括:
S1、对待评估社交网络,获取群体协同性信息、群体行动及时性信息以及群体行为活跃度信息,以得到群体内部行动能力信息;
S2、获取并使用构建信息,根据待评估网络的节点,构建无向边,,据以构造邻接矩阵,以对待评估社会网络,获取邻接矩阵的最大特征值,以处理得到待评估社交网络的传播能力,据以根据节点信息获取群体的对外影响力;
S3、根据群体内部行动能力以及群体对外影响力,评价待评估社交网络的群体组织能力。
本方案发明针对社交网络中群体组织能力,提出了一个全方位、多角度的评估方案,明确定义群体组织能力的内涵,提出反映群体组织能力的评估指标体系,设计面向群体组织能力评估的多源异构网络数据采集与处理技术,能够基于多源数据计算群体组织能力。
在更具体的技术方案中,步骤S2中,节点信息包括:互动数量、介数、聚类系数、平均度以及中心度。
在更具体的技术方案中,步骤S2包括:
S21、获取待评估社交网络中的节点间操作信息,以作为构建信息,据以构建无向边,利用节点的交互程度,构建无向边的权重,据以构建图带权邻接矩阵A,获取最小化矩阵的最大特征值近似参数;
S22、利用下述逻辑,定义图带权邻接矩阵A的Rayleigh熵:
利用下述逻辑,将将图带权邻接矩阵A的最大特征值,等价于下述最小化形式,得到最小化矩阵:
式中,x为任意向量,α为向量X沿矩阵A最大特征向量的分量。
根据最小化形式,选去特殊值向量:
x=[d1,d2,...,dn]
式中,di为节点i的度,n为社交网络中节点数量;
利用下述逻辑,在k为特定值时,最小化矩阵的最大特征值近似参数xTA2x:
S23、利用下述逻辑,将去掉当前的无向边时,最小化矩阵的最大特征值近似参数下降的数量,定义节点i与j之间的无向边eij的影响力:
式中,dk为节点k的度,Nj表示节点j的邻居节点集合。在本实施例中,使用该边影响力定义对社交网络边进行评估,得到每条无向边的边影响力指标;
S24、求取待评估社交网络的节点,与外部节点之间直接交互边的影响力之和,以作为对外影响力,据以进行群体的信息传播重要性量化。
本发明通过节点互动数量、介数、聚类系数、平均度中心度确定群体的对外影响力,同时针对多节点的综合影响力并不是单个节点的影响力线性累加,本发明设计基于社交网络互动关系的群体在组织行动中的对外影响力量化方案,充分考虑了节点间的影响力重叠效应,能够在面向群体组织能力评估的应用场景下,进行多源异构网络数据采集与量化处理。
在更具体的技术方案中,步骤S21中,对节点间操作信息,利用下述逻辑表示为五元组:
Tij=[a,b,c,d,e]
式中,a取值为0、1或2,b、c、d和e取值为非负整数。
在更具体的技术方案中,步骤S21中,利用下述逻辑,求取邻接矩阵的元素,以得到无向边的权重:
式中,wt为该互动关系的权重。
在更具体的技术方案中,步骤S21中,利用信息熵求取无向边的权重的步骤还包括:
S211、确定待分配权重指标以及无向边的权重范围;
S212、计算待分配权重指标的相对频率;
S213、根据相对频率,计算信息熵;
S214、根据信息熵,计算无向边的权重。
在更具体的技术方案中,步骤S212中,将每个待分配权重指标的取值范围划分为离散区间,计算每个离散区间的相对频率。
在更具体的技术方案中,步骤S213中,利用下述逻辑,根据待分配权重指标对应是相对频率,计算待分配权重指标的信息熵:
式中,p(xi)为第i个区间的相对频率。
在更具体的技术方案中,步骤S24还包括:
S241、基于已有的群体划分方式,得到各个待评估涉及网络对应的群体对应的节点列表;
S242、遍历群体group对应的节点列表,将节点列表中节点与外部节点直接交互的无向边,加入至各个群体对应的无向边列表;
S243、遍历无向边列表,利用下述逻辑,累加处理边影响力指标,,据以得到群体的重要性指标:
其中,为S23中提到的节点i与j之间的无向边eij的影响力指标。
本发明量化根据群体中个体指标数据,计算群体中多节点的综合影响力,强调的某个具体的社区的对外影响力的评估,其叠加效应考虑的是群体内部个体之间的叠加,多个高影响力节点组合起来的综合影响力并不一定大于同样数目的低影响力节点的组合。本发明对群体综合影响力的指标进行量化处理,实现了对群体组织能力进行全面定量评估。
在更具体的技术方案中,社交网络群体的组织能力评估系统包括:
群体内部行动能力获取模块,用以对待评估社交网络,获取群体协同性信息、群体行动及时性信息以及群体行为活跃度信息,以得到群体内部行动能力信息;
群体对外影响力获取模块,用以获取并使用构建信息,根据待评估网络的节点,构建无向边,据以构造邻接矩阵,以对待评估社会网络,获取邻接矩阵的最大特征值,以处理得到待评估社交网络的传播能力,据以根据节点信息获取群体的对外影响力;
群体组织能力评价模块,用以根据群体内部行动能力以及群体对外影响力,评价待评估社交网络的群体组织能力,群体组织能力评价模块与群体对外影响力获取模块及群体内部行动能力获取模块连接。
本发明相比现有技术具有以下优点:
本方案发明针对社交网络中群体组织能力,提出了一个全方位、多角度的评估方案,明确定义群体组织能力的内涵,提出反映群体组织能力的评估指标体系,设计面向群体组织能力评估的多源异构网络数据采集与处理技术,能够基于多源数据计算群体组织能力。
本发明通过节点互动数量、介数、聚类系数、平均度中心度确定群体的对外影响力,同时针对多节点的综合影响力并不是单个节点的影响力线性累加,本发明设计基于社交网络互动关系的群体在组织行动中的对外影响力量化方案,充分考虑了节点间的影响力重叠效应,能够在面向群体组织能力评估的应用场景下,进行多源异构网络数据采集与量化处理。
本发明量化根据群体中个体指标数据,计算群体中多节点的综合影响力,强调的某个具体的社区的对外影响力的评估,其叠加效应考虑的是群体内部个体之间的叠加,多个高影响力节点组合起来的综合影响力并不一定大于同样数目的低影响力节点的组合。本发明对群体综合影响力的指标进行量化处理,实现了对群体组织能力进行全面定量评估。
本发明解决了现有技术中存在的群体组织能力的内涵难以明确,在面向群体组织能力评估的应用场景下多源异构网络数据采集与处理困难,以及无法对群体组织能力进行全面定量评估的技术问题。
附图说明
图1为本发明实施例1的社交网络群体的组织能力评估方法基本步骤示意图;
图2为本发明实施例1的社交网络群体的组织能力评估方法数据处理架构示意图;
图3为本发明实施例1的获取群体内部行动能力的具体步骤示意图;
图4为本发明实施例1的计算群体协同性的具体步骤示意图;
图5为本发明实施例1的求取群体对外影响力的具体步骤示意图;
图6为本发明实施例1的使用信息熵方法求解权重的具体步骤示意图;
图7为本发明实施例1的群体的信息传播重要性量化的具体步骤示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1及图2所示,本发明提供的社交网络群体的组织能力评估方法,包括以下基本步骤:
S1、获取群体协同性信息、群体行动及时性信息以及群体行为活跃度信息,以得到群体内部行动能力信息;
如图3所示,在本实施例中,获取群体内部行动能力的步骤S1,还包括以下具体步骤:
S11、获取群体协同性信息;
在本实施例中,群体协同性是社交网络中群体行为的重要特征,用于衡量群体成员在实现共同目标和协调行动方面的能力。在本实施例中,群体协同性指标较高的群体可为了共同的目标形成有组织的、协调一致的行动的能力,是衡量群体组织能力的重要指标。
如图4所示,在本实施例中,计算群体协同性的步骤S11,还包括以下具体步骤:
S111、分别计算当前群体的提及话题一致性、关注对象一致性和活跃时间一致性等三个指标,选取信息熵的方式确定权重并三个指标加权求和得到群体协同性指标;
S112、通过采集群体内部个体的提及话题,对所有个体的话题一致性进行评估;
S113、通过采集群体内部个体的关注对象,对所有个体的关注对象一致性进行评估;
S114、采集个体在一个较长时间段内进行发帖、点赞、关注、回复、提及等行为的时间,对所有个体的活跃时间一致性进行评估;
S115、通过对上述指标进行归一化和加权求和,得到最终的群体协同性指标。
在本实施例中,进行数据收集,通过社交网络平台提供的开放API(ApplicationProgramming Interface)或者其他合法途径进行,通过API向社交网络平台发送请求来获取用户的行为信息。
在本实施例中,话题数据集包括但不限于:采集群体内部所有个体的提及话题的数据;关注对象数据集包括但不限于:采集群体内部所有个体的关注的人的数据,主要包括每个个体关注的其他用户;活跃时间数据集包括但不限于:采集个体在一时间段内进行发帖、点赞、关注、回复、提及等行为的时间。
S12、获取群体行动及时性信息;
在本实施例中,评估群体行动的及时性是了解群体在社交网络中的行为反应速度和即时性的重要方面。在本实施例中,群体行为的及时性可以根据不同的行为类型来衡量。本方案采集群体在一个时间段内参与特定事件的相关帖文和互动行为,得到每个个体参与特定时间事件活动的最早时间,基于个体参与活动的平均时间差类衡量群体行动的及时性。在本实施例中,行为类型包括但不限于:发帖、点赞、评论、转发以及提及信息;
S13、获取群体行为活跃度信息;
在本实施例中,采集社交网络中群体内部所有个体在一个较长时间段内进行发帖、点赞、关注、回复、提及等行为的时间,对该群体的行为活跃度进行评估。
S2、根据社会网络的节点信息,获取群体的对外影响力信息;
在本实施例中,节点信息包括但不限于:互动数量、介数、聚类系数、平均度以及中心度。在本实施例中,多节点的综合影响力并不是单个节点的影响力线性累加,需要考虑节点间的影响力重叠效应,因此在本实施例中,设计基于社交网络互动关系的群体在组织行动中的对外影响力量化方案。
在本实施例的经典的疾病传播模型中,社交网络的邻接矩阵的最大特征值决定了信息是否会在网络中扩散或消亡,因此使用邻接矩阵的最大特征值衡量整个社交网络的传播能力。在本实施例中,组织能力除了信息传输之外,更多还指的是激发、组织和影响其他节点参与某种活动、事件或行动的能力,因此除了关注之外,在本实施例中,还使用构建信息构建无向边,从而构造能衡量节点组织能力的邻接矩阵。在本实施例中,构建信息包括但不限于:关注、点赞、回复、转发、引用以及交互次数信息。
在本实施例中,将节点之间边的影响力定义为去掉该条边之后形成的新的社交网络组织能力的下降程度,将群体对外影响力等同于该群体与外部节点之间直接交互的边影响力之和。
如图5所示,在本实施例中,求取群体对外影响力的步骤S2,还包括以下具体步骤:
S21、使用社交网络中关注、点赞、回复、转发、引用以及交互次数信息等构建构建无向边,由交互程度构建边的权值,从而构建图的带权邻接矩阵A;
在本实施例中,若节点i与j之间存在关注、点赞、回复、引用或者转发等关系,则五种互动关系构成的五元组为:
Tij=[a,b,c,d,e]
其中,a取值为0、1或2,b、c、d和e取值为非负整数;
在本实施例中,边的权值即邻接矩阵元素计算方式为:
其中,wt为该互动关系的权重。
在本实施例中,确定关系的权重取值过程中,互动关系权重wt的取值方式包括但不限于:关注关系的对应权重wa设置为固定值1作为基准;点赞、回复、引用和转发的权重根据现有实证研究中统计的Tweeter数据的分布情况确定,基本原则包括但不限于:如果采集到的数据中其他交互数量约为关注关系的K倍,因此点赞、回复、引用、转发权重之和为K;出现频率高的互动行为权重较低。
在本实施例中,参见下表1,根据表1中Tweet数据集中的互动关系分布,点赞、转发、回复和引用的数量比为6183928:1581922:379874:108216,大约为75:19:5:1。结合基本原则和本实验中的实践经验,我们将点赞、转发、回复和引用这四种互动关系的权重分别设置为0.1K、0.2K、0.35K、0.35K。
表1:社交网络中的互动关系分布
在本实施例中,利用信息熵的方式求解权重。使用信息熵(Entropy)的方式来求解权重是一种常见的方法,尤其在决策问题中,当需要根据一组指标的重要性来分配权重时,信息熵可以帮助评估不同指标的信息量,从而确定权重。这种方法的基本思想是,信息熵越大,表示对应的指标信息越丰富,其权重应该相对较高。
如图6所示,在本实施例中,使用信息熵方法求解权重的操作,包括以下具体步骤:
S211、确定指标和权重范围;
在本实施例中,确定要分配权重的指标。这些指标可以是影响决策的因素,比如评估不同方案的多个指标。确保这些指标在同一范围内,例如从0到1,或者从0%到100%。
S212、计算指标相对频率;
在本实施例中,对于每个指标,将其取值范围分成一些离散的区间,然后计算每个区间的相对频率,即该区间内指标值的出现次数除以总样本数。这里的样本在前述步骤S11中的群体协同性方案中,可选取社交网络中的随机群体或者指定群体。
S213、计算信息熵;
在本实施例中,对于每个指标,根据其相对频率计算信息熵,使用信息熵的公式:
其中,p(xi)为第i个区间的相对频率。
S214、计算权重;
在本实施例中,将每个指标的信息熵除以所有指标的信息熵之和,,得到每个指标的权重。这样可以保证权重之和为1,适用于多个指标的情况。
S22、带权邻接矩阵A的Rayleigh熵定义为:
在本实施例中,将最小化矩阵A的最大特征值等价于最小化下式:
其中,x为任意向量,α为向量X沿矩阵A最大特征向量的分量。
在本实施例中,选定一组特殊值构成的向量:
x=[d1,d2,...,dn]
其中,di为节点i的度,n为社交网络中节点数量。在k=2时,最小化矩阵A的最大特征值近似于最小化下式:
S23、将一条边的影响力定义为删除该边后矩阵最大特征值减小的程度,即上式xTA2x下降的数量,因此节点i与j之间的连边eij的影响力为:
其中,dk为节点k的度,Nj表示节点j的邻居节点集合。在本实施例中,使用该边影响力定义对社交网络边进行评估,得到每条边的影响力指标。
S24、进行群体的信息传播重要性量化;
如图7所示,在本实施例中,由于本方案将群体对外影响力等同于该群体与外部节点之间直接交互的边影响力之和,因此群体的信息传播重要性量化的步骤S24,还包括以下具体步骤:
S241、基于已有的群体划分方式,得到各个群体包含的节点列表;
S242、遍历群体group对应的节点列表,将列表中节点与外部节点直接交互的无向边加入到各个群体对应的无向边列表中;
S243、遍历群体group对应的无向边列表,使用步骤S23中的边重要性指标,将边重要性指标累加,最终得到群体的重要性指标,即:
S3、根据群体内部行动能力以及群体对外影响力,评价社交网络中群体组织能力。
综上,本方案发明针对社交网络中群体组织能力,提出了一个全方位、多角度的评估方案,明确定义群体组织能力的内涵,提出反映群体组织能力的评估指标体系,设计面向群体组织能力评估的多源异构网络数据采集与处理技术,能够基于多源数据计算群体组织能力。
本发明通过节点互动数量、介数、聚类系数、平均度中心度确定群体的对外影响力,同时针对多节点的综合影响力并不是单个节点的影响力线性累加,本发明设计基于社交网络互动关系的群体在组织行动中的对外影响力量化方案,充分考虑了节点间的影响力重叠效应,能够在面向群体组织能力评估的应用场景下,进行多源异构网络数据采集与量化处理。
本发明量化根据群体中个体指标数据,计算群体中多节点的综合影响力,强调的某个具体的社区的对外影响力的评估,其叠加效应考虑的是群体内部个体之间的叠加,多个高影响力节点组合起来的综合影响力并不一定大于同样数目的低影响力节点的组合。本发明对群体综合影响力的指标进行量化处理,实现了对群体组织能力进行全面定量评估。
本发明解决了现有技术中存在的群体组织能力的内涵难以明确,在面向群体组织能力评估的应用场景下多源异构网络数据采集与处理困难,以及无法对群体组织能力进行全面定量评估的技术问题。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.社交网络群体的组织能力评估方法,其特征在于,所述方法包括:
S1、对待评估社交网络,获取群体协同性信息、群体行动及时性信息以及群体行为活跃度信息,以得到群体内部行动能力信息;
S2、获取并使用构建信息,根据所述待评估网络的节点,构建无向边,据以构造邻接矩阵,以对所述待评估社会网络,获取所述邻接矩阵的最大特征值,以处理得到所述待评估社交网络的传播能力,据以根据节点信息获取群体的对外影响力;
S3、根据所述群体内部行动能力以及所述群体对外影响力,评价所述待评估社交网络的群体组织能力。
2.根据权利要求1所述的社交网络群体的组织能力评估方法,其特征在于,所述步骤S2中,所述节点信息包括:互动数量、介数、聚类系数、平均度以及中心度。
3.根据权利要求1所述的社交网络群体的组织能力评估方法,其特征在于,所述步骤S2包括:
S21、获取所述待评估社交网络中的节点间操作信息,以作为所述构建信息,据以构建所述无向边,利用所述节点的交互程度,构建所述无向边的权重,,据以构建图带权邻接矩阵A,获取最小化矩阵的最大特征值近似参数;
S22、利用下述逻辑,定义所述图带权邻接矩阵A的Rayleigh熵:
利用下述逻辑,将将图带权邻接矩阵A的所述最大特征值,等价于下述最小化形式,得到最小化矩阵:
式中,x为任意向量,α为向量X沿矩阵A最大特征向量的分量。
根据所述最小化形式,选去特殊值向量:
X[d1,d2,...,dn]
式中,di为节点i的度,n为社交网络中节点数量;
利用下述逻辑,在k为特定值时,所述最小化矩阵的最大特征值近似参数xTA2x:
S23、利用下述逻辑,将去掉当前的所述无向边时,所述最小化矩阵的最大特征值近似参数下降的数量,定义所述节点i与j之间的所述无向边eij的影响力:
式中,dk为节点k的度,Nj表示节点j的邻居节点集合。在本实施例中,使用该边影响力定义对社交网络边进行评估,得到每条所述无向边的边影响力指标;
S24、求取所述待评估社交网络的节点,与外部节点之间直接交互边的影响力之和,以作为所述对外影响力,据以进行群体的信息传播重要性量化。
4.根据权利要求3所述的社交网络群体的组织能力评估方法,其特征在于,所述步骤S21中,对所述节点间操作信息,利用下述逻辑表示为五元组:
Tij=[a,b,c,d,e]
式中,a取值为0、1或2,b、c、d和e取值为非负整数。
5.根据权利要求3所述的社交网络群体的组织能力评估方法,其特征在于,所述步骤S21中,利用下述逻辑,求取所述邻接矩阵的元素,以得到所述无向边的权重:
式中,wt为该互动关系的权重。
6.根据权利要求3所述的社交网络群体的组织能力评估方法,其特征在于,所述步骤S21中,利用信息熵求取所述无向边的权重的步骤还包括:
S211、确定待分配权重指标以及所述无向边的权重范围;
S212、计算所述待分配权重指标的相对频率;
S213、根据所述相对频率,计算所述信息熵;
S214、根据所述信息熵,计算所述无向边的权重。
7.根据权利要求6所述的社交网络群体的组织能力评估方法,其特征在于,所述步骤S212中,将每个所述待分配权重指标的取值范围划分为离散区间,计算每个所述离散区间的相对频率。
8.根据权利要求6所述的社交网络群体的组织能力评估方法,其特征在于,所述步骤S213中,利用下述逻辑,根据所述待分配权重指标对应是所述相对频率,计算所述待分配权重指标的所述信息熵:
式中,p(xi)为第i个区间的相对频率。
9.根据权利要求1所述的社交网络群体的组织能力评估方法,其特征在于,所述步骤S24还包括:
S241、基于预置群体划分方式,得到各个所述待评估涉及网络对应的群体对应的节点列表;
S242、遍历所述节点列表,将所述节点列表中节点与外部节点直接交互的所述无向边,加入至各个所述群体对应的无向边列表;
S243、遍历所述无向边列表,利用下述逻辑,累加处理所述边影响力指标,据以得到群体的重要性指标:
式中,为S23中提到的节点i与j之间的无向边eij的影响力指标。
10.社交网络群体的组织能力评估系统,其特征在于,所述系统包括:
群体内部行动能力获取模块,用以对待评估社交网络,获取群体协同性信息、群体行动及时性信息以及群体行为活跃度信息,以得到群体内部行动能力信息;
群体对外影响力获取模块,用以获取并使用构建信息,根据所述待评估网络的节点,构建无向边,据以构造邻接矩阵,以对所述待评估社会网络,获取所述邻接矩阵的最大特征值,以处理得到所述待评估社交网络的传播能力,据以根据节点信息获取群体的对外影响力;
群体组织能力评价模块,用以根据所述群体内部行动能力以及所述群体对外影响力,评价所述待评估社交网络的群体组织能力,所述群体组织能力评价模块与所述群体对外影响力获取模块及所述群体内部行动能力获取模块连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311482667.5A CN117421490A (zh) | 2023-11-06 | 2023-11-06 | 社交网络群体的组织能力评估方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311482667.5A CN117421490A (zh) | 2023-11-06 | 2023-11-06 | 社交网络群体的组织能力评估方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117421490A true CN117421490A (zh) | 2024-01-19 |
Family
ID=89532436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311482667.5A Pending CN117421490A (zh) | 2023-11-06 | 2023-11-06 | 社交网络群体的组织能力评估方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117421490A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118035526A (zh) * | 2024-04-08 | 2024-05-14 | 北京网智天元大数据科技有限公司 | 一种社交媒体精英节点识别方法及系统 |
-
2023
- 2023-11-06 CN CN202311482667.5A patent/CN117421490A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118035526A (zh) * | 2024-04-08 | 2024-05-14 | 北京网智天元大数据科技有限公司 | 一种社交媒体精英节点识别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | A new approach to intrusion detection using Artificial Neural Networks and fuzzy clustering | |
Zhang et al. | Social influence locality for modeling retweeting behaviors | |
Liu et al. | Data mining feature selection for credit scoring models | |
CN106651030B (zh) | 一种改进的rbf神经网络热点话题用户参与行为预测方法 | |
US7600017B2 (en) | System and method for scoring electronic messages | |
Jianqiang et al. | A new method of identifying influential users in the micro-blog networks | |
Stults | Determinants of Chicago neighborhood homicide trajectories: 1965-1995 | |
Samanta et al. | Coopetition bunch graphs: competition and cooperation on COVID19 research | |
CN117421490A (zh) | 社交网络群体的组织能力评估方法及系统 | |
Özçelik et al. | An extension of EDAS method equipped with trapezoidal bipolar fuzzy information: An application from healthcare system | |
CN110990777B (zh) | 数据关联性分析方法及系统、可读存储介质 | |
CN111143704B (zh) | 一种融合用户影响关系的在线社区好友推荐方法及系统 | |
Wang et al. | Predicting the security threats on the spreading of rumor, false information of Facebook content based on the principle of sociology | |
CN111914152B (zh) | 一种网络事件预警方法及系统 | |
Wu et al. | Making recommendations in a microblog to improve the impact of a focal user | |
Uddin et al. | Topological analysis of longitudinal networks | |
Mark et al. | Microscopic simulations of complex metropolitan dynamics | |
Chae et al. | Structural determinants of Human Resource Development research collaboration networks: A Social‐Network Analysis of publications Between 1990 to 2014 | |
CN107145508B (zh) | 网站数据处理方法、装置及系统 | |
Boumaiza et al. | Innovation diffusion for renewable energy technologies | |
Burchard et al. | Resource efficient algorithms for message sampling in online social networks | |
Lee et al. | Uncovering the social dynamics of online elections | |
Brandão et al. | Tie strength in co-authorship social networks: analyses, metrics and a new computational model | |
Abdidizaji et al. | Analyzing X's Web of Influence: Dissecting News Sharing Dynamics through Credibility and Popularity with Transfer Entropy and Multiplex Network Measures | |
CN118035526B (zh) | 一种社交媒体精英节点识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |