CN118035526B - 一种社交媒体精英节点识别方法及系统 - Google Patents

一种社交媒体精英节点识别方法及系统 Download PDF

Info

Publication number
CN118035526B
CN118035526B CN202410410822.0A CN202410410822A CN118035526B CN 118035526 B CN118035526 B CN 118035526B CN 202410410822 A CN202410410822 A CN 202410410822A CN 118035526 B CN118035526 B CN 118035526B
Authority
CN
China
Prior art keywords
elite
node
data
nodes
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410410822.0A
Other languages
English (en)
Other versions
CN118035526A (zh
Inventor
赵志远
莫倩
蔡锦森
孔晨光
张凯
李温龙
张驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wiseweb Technology Group Co ltd
Beijing Wiseweb Big Data Technology Co ltd
Original Assignee
Wiseweb Technology Group Co ltd
Beijing Wiseweb Big Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wiseweb Technology Group Co ltd, Beijing Wiseweb Big Data Technology Co ltd filed Critical Wiseweb Technology Group Co ltd
Priority to CN202410410822.0A priority Critical patent/CN118035526B/zh
Publication of CN118035526A publication Critical patent/CN118035526A/zh
Application granted granted Critical
Publication of CN118035526B publication Critical patent/CN118035526B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种社交媒体精英节点识别方法及系统,其中方法包括:收集精英活动数据;基于所述精英活动数据构建精英受众关系图;计算所述精英受众关系图中各节点的中心性指标,基于所述中心线指标识别所述精英受众关系图中的关键节点;分析各所述关键节点的动员性能指标,基于所述动员性能指标筛选所述关键节点中的精英节点。通过本发明,基于大数据分析和机器学习,能够有效地从海量信息中,快速、准确地识别出舆论中具有影响力和代表性的精英群体,对于理解网络舆论的形成、传播和演变具有重要意义。

Description

一种社交媒体精英节点识别方法及系统
技术领域
本发明涉及舆论分析技术领域,具体涉及一种社交媒体精英节点识别方法及系统。
背景技术
随着互联网技术的飞速发展和移动网络的普及,加之微博、微信等新型社交媒体的兴起和繁荣,互联网呈现出多元化结构,出现大量数据信息、重要人物和热点事件,对于社会的发展和人们的生活产生了重要的影响。节点作为舆论传播的起点和终点,是信息流动的枢纽。节点的重要性在于其能够接收、处理、存储和转发信息,从而将信息传递给其他节点。在社交网络中,精英节点通常位于社区的中心位置,与其他节点有更多的连接和互动,具有较高的影响力,承担了大部分的信息传播工作,且能够影响大量其他节点的信息接收和传播。精英节点作为社区结构的核心,对于维护和加强社区内部的联系和互动起着重要作用。
现有的舆论中精英节点识别方法主要依赖于人工筛选和关键词提取,存在着人工筛选效率低,无法实时更新精英节点,关键词提取的准确性受限于词汇表的选择、以及语义理解和情感分析的局限性的影响,导致精英节点是被存在漏报或误报以及以下多方面的不足:1、基于度或介数中心性的识别方法可能会忽略掉一些在传播过程中影响力较小的节点。例如,当一个度较大的节点位于网络的分支末端或外围时,该节点对于整个网络信息传播的影响力可能并不大。2、一些噪音数据,一些议题或者话题传播的过程中,节点的关联关系并不是连通的,那么就会出现一些无法计算的情况。3、在一些场景中,如社交网络图,已知部分节点是欺诈用户,但无法通过相关性和特征判断出剩余的其他节点是欺诈用户还是正常用户。4、在遍历网络中的所有节点以找到当前节点的所有邻居节点的过程中,如果网络规模较大或者网络结构复杂,这个过程可能会消耗大量的时间和计算资源。5、节点特征的提取由于数据量的问题,导致提取的准确度欠佳,特别是在处理动态网络或复杂网络结构时,某些特征更是难以直接测量导致整个关联网络的可用性较低。6、网络信息传播中的节点是动态变化的,新的节点可能随时加入,而现有节点可能离开或改变其行为。
发明内容
为此,本发明提供一种社交媒体精英节点识别方法及系统,旨在解决现有技术中无法准确识别舆论事件中精英节点的技术问题。
为实现以上目的,本发明采用如下技术方案:
依据本发明第一方面,提供了一种社交媒体精英节点识别方法,所述方法包括:
收集精英活动数据;
基于所述精英活动数据构建精英受众关系图;
计算所述精英受众关系图中各节点的中心性指标,基于所述中心线指标识别所述精英受众关系图中的关键节点;
分析各所述关键节点的动员性能指标,基于所述动员性能指标筛选所述关键节点中的精英节点。
可选地,所述精英活动数据包括精英支持数据、事件参与数据以及职业关联数据中至少之一;
所述精英支持数据为已知精英针对目标舆论事件的公开支持信息;
所述事件参与数据为与所述目标舆论事件相关的活动参与信息;
所述职业关联数据为与所述已知精英具有职业关联的人员信息。
可选地,所述基于所述精英活动数据构建精英受众关系图,包括:
基于所述精英活动数据确定图谱节点;所述图谱节点包括所述精英支持数据中的已知精英和被支持者、所述事件参与数据中的活动发起者和活动参与者、所述职业关联数据中的已知精英和职业关联者中至少之一;
基于所述精英活动数据确定所述图谱节点之间的有向边;所述有向边包括所述精英支持数据中的已知精英指向被支持者、所述事件参与数据中的活动参与者指向活动发起者、所述职业关联数据中的已知精英与职业关联者的定向关系;
根据所述图谱节点和所述有向边构建网络拓扑图,得到所述精英受众关系图。
可选地,所述根据所述图谱节点和所述有向边构建网络拓扑图,得到所述精英受众关系图,包括:
利用熵值法对所述有向边进行客观赋值,得到附有加权值的加权有向边;
基于所述加权值对各所述图谱节点进行加权综合,得到加权节点;
基于各所述加权节点和各所述加权有向边构建网络拓扑图,得到所述精英受众关系图。
可选地,所述中心性指标包括度中心性指标、介数中心性指标以及PageRank指标中至少之一;
所述计算所述精英受众关系图中各节点的中心性指标,包括:
利用如下公式计算所述精英受众关系图中各节点的度中心性指标:
其中,为目标节点i的度中心性指标;/>为目标节点i的度数;/>为所述精英受众关系图中的节点总数;
和/或,
利用如下公式计算所述精英受众关系图中各节点的介数中心性指标:
其中,为目标节点i的介数中心性指标;/>为任意节点s到任意节点t的最短路径条数;/>为任意节点s到任意节点t的最短路径中经过目标节点i的条数;
和/或,
利用如下公式所述精英受众关系图中各节点的PageRank指标:
其中,为目标节点iPR值;/>为其他各节点能够指向目标节点iPR值;/>为其他各节点能够指向目标节点i的出链数;a为当前时刻或迭代次数。
可选地,所述基于所述中心线指标识别所述精英受众关系图中的关键节点,包括:
将所述度中心性指标大于第一预设指标阈值的节点作为关键节点;和/或,
将所述介数中心性指标大于第二预设指标阈值的节点作为关键节点;和/或,
将所述PageRank指标大于第三预设指标阈值的节点作为关键节点。
可选地,所述分析各所述关键节点的动员性能指标,包括:
获取所述关键节点对应用户在预设时间周期内的发帖数据,确定所述发帖数据的发帖传播特征和所属议题的声量
利用如下公式计算各所述发帖数据的发帖传播性能指标:
其中,为发帖数据的发帖传播性能指标;/>为传播过程节点n的路径长度;
利用如下公式计算各所述关键节点的动员性能指标:
其中,为关键节点的动员性能指标。
可选地,所述基于所述动员性能指标筛选所述关键节点中的精英节点,包括:
根据所述动员性能指标取值范围确定第四预设指标阈值;
将所述动员性能指标大于所述第四预设指标阈值的关键节点作为精英节点。
可选地,所述方法还包括:
基于所述精英节点和所述精英节点之间的关系网络构建精英网络分析图谱;和/或,
根据时间变化展示所述精英网络分析图谱的动态图谱。
依据本发明第二方面,提供了一种社交媒体精英节点识别系统,所述系统包括:
活动数据收集模块,用于收集精英活动数据;
关系图谱构建模块,用于基于所述精英活动数据构建精英受众关系图;
关键节点识别模块,用于计算所述精英受众关系图中各节点的中心性指标,基于所述中心线指标识别所述精英受众关系图中的关键节点;
精英节点筛选模块,用于分析各所述关键节点的动员性能指标,基于所述动员性能指标筛选所述关键节点中的精英节点。
本发明采用以上技术方案,至少具备以下有益效果:
通过本发明方案,收集精英活动数据;基于所述精英活动数据构建精英受众关系图;计算所述精英受众关系图中各节点的中心性指标,基于所述中心线指标识别所述精英受众关系图中的关键节点;分析各所述关键节点的动员性能指标,基于所述动员性能指标筛选所述关键节点中的精英节点。由此,基于大数据分析和机器学习,能够有效地从海量信息中,快速、准确地识别出舆论中具有影响力和代表性的精英群体,对于理解网络舆论的形成、传播和演变具有重要意义。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明一实施例提供的社交媒体精英节点识别方法的流程示意图;
图2示出了本发明一实施例提供的精英受众关系图的简要示意图;
图3示出了本发明一实施例提供的社交媒体精英节点识别系统的结构示意图;
图4示出了本发明另一实施例提供的社交媒体精英节点识别系统的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明实施例提供了一种社交媒体精英节点识别方法,如图1所示,至少可以包括以下步骤S101~S104:
步骤S101,收集精英活动数据。
本发明实施例基于积累的历史精英活动数据,将精英舆论场进行历时性的、可解释的网络建模,从而以社交媒体精英节点为标志,来推理整体舆论网络发展的情况。为此,收集三类重大行为活动作为精英活动数据,共同建构一个典型的社会网络。其中,精英行为体构成了网络中的点(Node),将精英节点需要付出高昂的行动代价和机会成本的活动内容作为网络构建的数据基础。通过以下三类活动形成了联系:精英支持数据、事件参与数据以及职业关联数据。
其中,精英支持数据为已知精英针对目标舆论事件的公开支持信息,也即有声望的、著名的精英人物在社交媒体或主流媒体上公开表态的内容,例如精英人物A为舆论主体B公开背书支持。事件参与数据为与目标舆论事件相关的活动参与信息,也即与当前舆论场议题相关的事件中,有发表过类似的活动内容,例如发布会、记者会等。职业关联数据为与已知精英具有职业关联的人员信息,也即在工作单位中,工作类别、工作性质与已知精英存在重叠的或有相关联的任职部门的,这种关系可能意味着这些部门或职业的受众对精英的表态或行为有更高的关注度,或者更容易受到精英的影响。因此,这种关系可以被视为一种潜在的传播渠道,可以帮助信息在特定群体内快速传播,例如精英受众B和精英人物A均在2015年在同一家企业共事。
步骤S102,基于精英活动数据构建精英受众关系图。
具体地,本发明实施例基于精英活动数据确定图谱节点。精英活动数据包括精英支持数据、事件参与数据以及职业关联数据。因此,图谱节点可以包括精英支持数据中的已知精英和被支持者、事件参与数据中的活动发起者和活动参与者以及职业关联数据中的已知精英和职业关联者。
在确定好图谱节点后,本发明实施例可以基于精英活动数据确定图谱节点之间的有向边。可以理解的是,有向边包括精英支持数据中的已知精英指向被支持者、事件参与数据中的活动参与者指向活动发起者以及职业关联数据中的已知精英与职业关联者的定向关系。
由此,即可根据图谱节点和有向边构建网络拓扑图,得到精英受众关系图。
进一步地,本发明实施例还可以使用社会网络分析方法(Social NetworkAnalysis,SNA)处理不同精英活动的协作价值。具体地,可以利用熵值法对有向边进行客观赋值,得到附有加权值的加权有向边;基于加权值对各图谱节点进行加权综合,得到加权节点;基于各加权节点和各加权有向边构建网络拓扑图,得到精英受众关系图。
如图2所示,为一以立法机构情况为例的精英受众关系图示意。图中,议员A参与了另一议员B发起的议案,则有一条有向边从议员A指向议员B。也就是说,参与人与发起人的关系构成节点的有向边,参与次数构成边的权重。节点的入度为指向节点的所有有向边的权重和,节点的出度为节点指向其他节点的边的权重和。采用熵值法对有向边权重进行客观赋值,例如,议案参与的权重赋值为0.1,权重和则为各参与次数权重的总和,如参与了3次则权重和为0.3。
步骤S103,计算精英受众关系图中各节点的中心性指标,基于中心线指标识别精英受众关系图中的关键节点。
本发明实施例通过计算精英受众关系图中的各节点在网络中的中心性指标来评估各节点在网络中的影响力、地位或连接程度。可以理解的是,该步骤选取的关键节点是指在网络中具有较高中心性指标的节点,即具有较高的影响力、地位或连接程度的节点。
其中,中心性指标包括度中心性指标、介数中心性指标以及PageRank指标。
度中心性指标是一种在网络分析中使用节点度数来衡量节点在网络中的重要性的评估指标。节点的度数是指与该节点相连的边的数量。如果一个节点连接的数量越大,那么它在网络中的重要性就越高。
具体地,利用如下公式计算精英受众关系图中各节点的度中心性指标:
其中,为目标节点i的度中心性指标;/>为目标节点i的度数;/>为精英受众关系图中的节点总数。
介数中心性指标是一种衡量节点在网络中作为桥梁或中介的程度的评估指标。具有较高介数中心性的节点位于网络中的关键路径上,并且在节点之间的信息传递中起到重要的传递作用,也就是说,通过网络中所有最短路径中经过某节点的次数越多,说明该节点在网络中越重要。
具体地,利用如下公式计算精英受众关系图中各节点的介数中心性指标:
其中,为目标节点i的介数中心性指标;/>为任意节点s到任意节点t的最短路径条数;/>为任意节点s到任意节点t的最短路径中经过目标节点i的条数。
PageRank指标是一种用于计算网络中节点重要性的算法,根据网络中节点之间的链接关系来评估节点的重要性,认为一个节点的重要性取决于其被其他重要节点所指向的程度。
具体地,利用如下公式精英受众关系图中各节点的PageRank指标:
其中,为目标节点iPR值;/>为其他各节点能够指向目标节点iPR值;/>为其他各节点能够指向目标节点i的出链数;a为当前时刻或迭代次数。
基于上述方法计算得到精英受众关系图中各节点的中心线指标后,基于中心线指标识别精英受众关系图中的关键节点。为了确保关键节点不被漏选,本发明实施例对每项中心线指标都设定了达标阈值,当精英受众关系图中各节点的中心线指标达到相应的达标阈值,即可作为关键节点。
具体地,本发明实施例中基于中心线指标识别精英受众关系图中的关键节点,可以包括:将度中心性指标大于第一预设指标阈值的节点作为关键节点;和/或,将介数中心性指标大于第二预设指标阈值的节点作为关键节点;和/或,将PageRank指标大于第三预设指标阈值的节点作为关键节点。
需要说明的是,本发明实施例中的第一预设指标阈值、第二预设指标阈值以及第三预设指标阈值可以根据实际需求或多样本测试结果进行设定,本发明对此不做限定。
步骤S104,分析各关键节点的动员性能指标,基于动员性能指标筛选关键节点中的精英节点。
为了进一步加强精英节点的识别准确率,在利用上述步骤确定精英受众关系图中的关键节点后,本发明实施例还于多个关键节点中进一步筛选精英节点。筛选指标为关键节点的动员能力,动员能力是指个体或组织在特定情境下组织和激发他人的能力,基于个体或组织所发出议题的传播影响考虑,其主要的评价来源是传播议题、传播范围以及传播路径长度。
具体地,分析各关键节点的动员性能指标,可以包括步骤S1~S3:
步骤S1:获取关键节点对应用户在预设时间周期内的发帖数据,确定发帖数据的发帖传播特征和所属议题的声量
步骤S2:利用如下公式计算各发帖数据的发帖传播性能指标:
其中,为发帖数据的发帖传播性能指标;/>为传播过程节点n的路径长度;
步骤S3:利用如下公式计算各关键节点的动员性能指标:
其中,为关键节点的动员性能指标。
需要说明的是,如果无法得到发帖数据的传播结构,即无法获取传播路径,则可以采用发帖数据对应关键节点的直接网络距离作为路径距离。
进一步地,可以根据动员性能指标取值范围确定第四预设指标阈值;将动员性能指标大于第四预设指标阈值的关键节点作为精英节点。
例如,动员性能指标的整体取值范围为0-100,根据多样本测试结果定义第四预设指标阈值为20,则若关键节点的动员性能指标超过20,则表示该关键节点的动员能力较强,将其筛选为精英节点。需要说明的是,本发明实施例中的第四预设指标阈值可以根据实际的应用需求进行设定,本发明对此不做限定。
综上,本发明实施例可以应用于在大数据环境下的某个网络话题被网民关注后,信息由一个传播平台向多个平台扩散,在这个过程中信息量不断变化,事件议题热度不断升温的应用场景中。本发明通过持续采集、处理和分析舆论信息,不但将无关数据过滤,同时也能保持数据的动态更新,持续的获得与议题事件相关的用户节点,这些对象可能来自不同的领域、行业或地区,通常在特定领域或行业中具有重要地位和影响力,在利用观点倾向性分析和通过多种渠道收集与这些对象相关的数据,收集精英行为体背景、教育经历、职业经历、社交网络、媒体报道、公开演讲、社交媒体活动等活动相结合,评估每个对象的特征和优势,以组合的形式来确定这些对象是否符合精英节点的要求。
在通过上述方法筛选得到精英节点后,本发明实施例还可以基于精英节点和精英节点之间的关系网络构建精英网络分析图谱,并根据时间变化展示精英网络分析图谱的动态图谱,以更为直观地进行网络态势发展分析。
本发明采用如上技术方案,并具有有益效果:
(1)更准确地识别出精英节点,避免忽略掉在传播过程中影响力较小或位置较偏的节点。
(2)能够处理噪音数据,解决节点关联关系不连通的问题。
(3)能够区分欺诈用户和正常用户,提高识别准确性。
(4)减少遍历网络节点的时间和计算资源消耗。
(5)提高节点特征提取的准确度,特别是应用于动态网络或复杂网络结构时。
(6)能够实时监测网络数据并更新分析模型,适应节点动态变化的情况。
进一步地,作为图1的具体实现,本发明实施例提供了一种社交媒体精英节点识别系统,如图3所示,该系统可以包括:活动数据收集模块310、关系图谱构建模块320、关键节点识别模块330以及精英节点筛选模块340。
活动数据收集模块310,可以用于收集精英活动数据;
关系图谱构建模块320,可以用于基于精英活动数据构建精英受众关系图;
关键节点识别模块330,可以用于计算精英受众关系图中各节点的中心性指标,基于中心线指标识别精英受众关系图中的关键节点;
精英节点筛选模块340,可以用于分析各关键节点的动员性能指标,基于动员性能指标筛选关键节点中的精英节点。
可选地,如图4所示,本发明另一实施例提供的一种社交媒体精英节点识别系统,还包括:精英图谱展示模块350。
精英图谱展示模块350,可以用于基于精英节点和精英节点之间的关系网络构建精英网络分析图谱;和/或,根据时间变化展示精英网络分析图谱的动态图谱。
可选地,关系图谱构建模块320,还可以用于基于精英活动数据确定图谱节点;图谱节点包括精英支持数据中的已知精英和被支持者、事件参与数据中的活动发起者和活动参与者、职业关联数据中的已知精英和职业关联者中至少之一;基于精英活动数据确定图谱节点之间的有向边;有向边包括精英支持数据中的已知精英指向被支持者、事件参与数据中的活动参与者指向活动发起者、职业关联数据中的已知精英与职业关联者的定向关系;根据图谱节点和有向边构建网络拓扑图,得到精英受众关系图。
可选地,关系图谱构建模块320,还可以用于利用熵值法对有向边进行客观赋值,得到附有加权值的加权有向边;基于加权值对各图谱节点进行加权综合,得到加权节点;基于各加权节点和各加权有向边构建网络拓扑图,得到精英受众关系图。
可选地,关键节点识别模块330,还可以用于利用如下公式计算精英受众关系图中各节点的度中心性指标:
其中,为目标节点i的度中心性指标;/>为目标节点i的度数;/>为精英受众关系图中的节点总数;
和/或,利用如下公式计算精英受众关系图中各节点的介数中心性指标:
其中,为目标节点i的介数中心性指标;/>为任意节点s到任意节点t的最短路径条数;/>为任意节点s到任意节点t的最短路径中经过目标节点i的条数;
和/或,利用如下公式精英受众关系图中各节点的PageRank指标:
其中,为目标节点iPR值;/>为其他各节点能够指向目标节点iPR值;/>为其他各节点能够指向目标节点i的出链数;a为当前时刻或迭代次数。
可选地,关键节点识别模块330,还可以用于将度中心性指标大于第一预设指标阈值的节点作为关键节点;和/或,将介数中心性指标大于第二预设指标阈值的节点作为关键节点;和/或,将PageRank指标大于第三预设指标阈值的节点作为关键节点。
可选地,精英节点筛选模块340,还可以用于获取关键节点对应用户在预设时间周期内的发帖数据,确定发帖数据的发帖传播特征和所属议题的声量;利用如下公式计算各发帖数据的发帖传播性能指标:
其中,为发帖数据的发帖传播性能指标;/>为传播过程节点n的路径长度;利用如下公式计算各关键节点的动员性能指标:
其中,为关键节点的动员性能指标。
可选地,精英节点筛选模块340,还可以用于根据动员性能指标取值范围确定第四预设指标阈值;将动员性能指标大于第四预设指标阈值的关键节点作为精英节点。
需要说明的是,本发明实施例提供的一种社交媒体精英节点识别系统所涉及各功能模块的其他相应描述,可以参考图1所示方法的对应描述,在此不再赘述。
所属领域的技术人员可以清楚地了解到,上述描述的系统、装置、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,为简洁起见,在此不另赘述。
另外,在本发明各个实施例中的各功能单元可以物理上相互独立,也可以两个或两个以上功能单元集成在一起,还可以全部功能单元都集成在一个处理单元中。上述集成的功能单元既可以采用硬件的形式实现,也可以采用软件或者固件的形式实现。
本领域普通技术人员可以理解:所述集成的功能单元如果以软件的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,其包括若干指令,用以使得一台计算设备(例如个人计算机,服务器,或者网络设备等)在运行所述指令时执行本发明各实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM)、随机存取存储器(RAM),磁碟或者光盘等各种可以存储程序代码的介质。
或者,实现前述方法实施例的全部或部分步骤可以通过程序指令相关的硬件(诸如个人计算机,服务器,或者网络设备等的计算设备)来完成,所述程序指令可以存储于一计算机可读取存储介质中,当所述程序指令被计算设备的处理器执行时,所述计算设备执行本发明各实施例所述方法的全部或部分步骤。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:在本发明的精神和原则之内,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案脱离本发明的保护范围。

Claims (7)

1.一种社交媒体精英节点识别方法,其特征在于,所述方法包括:
收集精英活动数据;
基于所述精英活动数据构建精英受众关系图;
计算所述精英受众关系图中各节点的中心性指标,基于所述中心性指标识别所述精英受众关系图中的关键节点;
分析各所述关键节点的动员性能指标,基于所述动员性能指标筛选所述关键节点中的精英节点;
所述精英活动数据包括精英支持数据、事件参与数据以及职业关联数据中至少之一;
所述精英支持数据为已知精英针对目标舆论事件的公开支持信息;
所述事件参与数据为与所述目标舆论事件相关的活动参与信息;
所述职业关联数据为与所述已知精英具有职业关联的人员信息;
所述基于所述精英活动数据构建精英受众关系图,包括:
基于所述精英活动数据确定图谱节点;所述图谱节点包括所述精英支持数据中的已知精英和被支持者、所述事件参与数据中的活动发起者和活动参与者、所述职业关联数据中的已知精英和职业关联者中至少之一;
基于所述精英活动数据确定所述图谱节点之间的有向边;所述有向边包括所述精英支持数据中的已知精英指向被支持者、所述事件参与数据中的活动参与者指向活动发起者、所述职业关联数据中的已知精英与职业关联者的定向关系;
根据所述图谱节点和所述有向边构建网络拓扑图,得到所述精英受众关系图;
所述中心性指标包括度中心性指标、介数中心性指标以及PageRank指标中至少之一;
所述分析各所述关键节点的动员性能指标,包括:
获取所述关键节点对应用户在预设时间周期内的发帖数据,确定所述发帖数据的发帖传播特征和所属议题的声量
利用如下公式计算各所述发帖数据的发帖传播性能指标:
其中,为发帖数据的发帖传播性能指标;/>为传播过程节点n的路径长度;
利用如下公式计算各所述关键节点的动员性能指标:
其中,为关键节点的动员性能指标。
2.根据权利要求1所述的方法,其特征在于,所述根据所述图谱节点和所述有向边构建网络拓扑图,得到所述精英受众关系图,包括:
利用熵值法对所述有向边进行客观赋值,得到附有加权值的加权有向边;
基于所述加权值对各所述图谱节点进行加权综合,得到加权节点;
基于各所述加权节点和各所述加权有向边构建网络拓扑图,得到所述精英受众关系图。
3.根据权利要求1所述的方法,其特征在于,所述计算所述精英受众关系图中各节点的中心性指标,包括:
利用如下公式计算所述精英受众关系图中各节点的度中心性指标:
其中,为目标节点i的度中心性指标;/>为目标节点i的度数;/>为所述精英受众关系图中的节点总数;
和/或,
利用如下公式计算所述精英受众关系图中各节点的介数中心性指标:
其中,为目标节点i的介数中心性指标;/>为任意节点s到任意节点t的最短路径条数;/>为任意节点s到任意节点t的最短路径中经过目标节点i的条数;
和/或,
利用如下公式所述精英受众关系图中各节点的PageRank指标:
其中,为目标节点iPR值;/>为其他各节点能够指向目标节点iPR值;为其他各节点能够指向目标节点i的出链数;a为当前时刻或迭代次数。
4.根据权利要求3所述的方法,其特征在于,所述基于所述中心性指标识别所述精英受众关系图中的关键节点,包括:
将所述度中心性指标大于第一预设指标阈值的节点作为关键节点;和/或,
将所述介数中心性指标大于第二预设指标阈值的节点作为关键节点;和/或,
将所述PageRank指标大于第三预设指标阈值的节点作为关键节点。
5.根据权利要求1所述的方法,其特征在于,所述基于所述动员性能指标筛选所述关键节点中的精英节点,包括:
根据所述动员性能指标取值范围确定第四预设指标阈值;
将所述动员性能指标大于所述第四预设指标阈值的关键节点作为精英节点。
6.根据权利要求1~5任一项所述的方法,其特征在于,所述方法还包括:
基于所述精英节点和所述精英节点之间的关系网络构建精英网络分析图谱;和/或,
根据时间变化展示所述精英网络分析图谱的动态图谱。
7.一种社交媒体精英节点识别系统,其特征在于,所述系统包括:
活动数据收集模块,用于收集精英活动数据;
关系图谱构建模块,用于基于所述精英活动数据构建精英受众关系图;
关键节点识别模块,用于计算所述精英受众关系图中各节点的中心性指标,基于所述中心性指标识别所述精英受众关系图中的关键节点;
精英节点筛选模块,用于分析各所述关键节点的动员性能指标,基于所述动员性能指标筛选所述关键节点中的精英节点;
其中,所述精英活动数据包括精英支持数据、事件参与数据以及职业关联数据中至少之一;
所述精英支持数据为已知精英针对目标舆论事件的公开支持信息;
所述事件参与数据为与所述目标舆论事件相关的活动参与信息;
所述职业关联数据为与所述已知精英具有职业关联的人员信息;
所述关系图谱构建模块,还用于基于所述精英活动数据确定图谱节点;所述图谱节点包括所述精英支持数据中的已知精英和被支持者、所述事件参与数据中的活动发起者和活动参与者、所述职业关联数据中的已知精英和职业关联者中至少之一;
基于所述精英活动数据确定所述图谱节点之间的有向边;所述有向边包括所述精英支持数据中的已知精英指向被支持者、所述事件参与数据中的活动参与者指向活动发起者、所述职业关联数据中的已知精英与职业关联者的定向关系;
根据所述图谱节点和所述有向边构建网络拓扑图,得到所述精英受众关系图;
其中,所述中心性指标包括度中心性指标、介数中心性指标以及PageRank指标中至少之一;
所述精英节点筛选模块,还用于获取所述关键节点对应用户在预设时间周期内的发帖数据,确定所述发帖数据的发帖传播特征和所属议题的声量
利用如下公式计算各所述发帖数据的发帖传播性能指标:
其中,为发帖数据的发帖传播性能指标;/>为传播过程节点n的路径长度;
利用如下公式计算各所述关键节点的动员性能指标:
其中,为关键节点的动员性能指标。
CN202410410822.0A 2024-04-08 2024-04-08 一种社交媒体精英节点识别方法及系统 Active CN118035526B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410410822.0A CN118035526B (zh) 2024-04-08 2024-04-08 一种社交媒体精英节点识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410410822.0A CN118035526B (zh) 2024-04-08 2024-04-08 一种社交媒体精英节点识别方法及系统

Publications (2)

Publication Number Publication Date
CN118035526A CN118035526A (zh) 2024-05-14
CN118035526B true CN118035526B (zh) 2024-06-25

Family

ID=90984337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410410822.0A Active CN118035526B (zh) 2024-04-08 2024-04-08 一种社交媒体精英节点识别方法及系统

Country Status (1)

Country Link
CN (1) CN118035526B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111177526A (zh) * 2018-11-12 2020-05-19 百度在线网络技术(北京)有限公司 网络意见领袖识别方法及装置
CN117332161A (zh) * 2023-10-11 2024-01-02 深圳市网联安瑞网络科技有限公司 一种社交网络话题讨论影响力检测方法、系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9311620B2 (en) * 2010-10-21 2016-04-12 Trustees Of Davidson College System and process for ranking content on social networks such as twitter
US9576326B2 (en) * 2013-10-03 2017-02-21 Linkedin Corporation Identification of a propagator-type leader in a social network
CN117421490A (zh) * 2023-11-06 2024-01-19 数据空间研究院 社交网络群体的组织能力评估方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111177526A (zh) * 2018-11-12 2020-05-19 百度在线网络技术(北京)有限公司 网络意见领袖识别方法及装置
CN117332161A (zh) * 2023-10-11 2024-01-02 深圳市网联安瑞网络科技有限公司 一种社交网络话题讨论影响力检测方法、系统

Also Published As

Publication number Publication date
CN118035526A (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
Hu et al. Whoo. ly: Facilitating information seeking for hyperlocal communities using social media
Tang et al. Ranking user influence in healthcare social media
Gloor et al. Web science 2.0: Identifying trends through semantic social network analysis
CN111125453B (zh) 基于子图同构的社交网络中意见领袖角色识别方法及存储介质
Del Vicario et al. News consumption during the Italian referendum: A cross-platform analysis on facebook and twitter
Chin et al. Identifying communities in blogs: roles for social network analysis and survey instruments
US7844634B2 (en) Focused community discovery in network
Lee et al. Identifying the structure of knowledge networks in the US mobile ecosystems: patent citation analysis
KR101869815B1 (ko) 집단지성을 이용한 뉴스 판단 방법 및 장치
Del Vicario et al. Public discourse and news consumption on online social media: A quantitative, cross-platform analysis of the Italian Referendum
CN108921734A (zh) 一个基于多源异构数据的房地产信息可视化系统
Dou et al. Social awareness of crisis events: A new perspective from social-physical network
Srour et al. Joint theme and event based rating model for identifying relevant influencers on Twitter: COVID-19 case study
Zhu et al. Path prediction of information diffusion based on a topic-oriented relationship strength network
Bródka A method for group extraction and analysis in multilayer social networks
CN108520337B (zh) 一种基于网络风险熵差的谣言风险评估方法
CN107767280A (zh) 一种基于时间要素的优质节点探测方法
Pan et al. Analysis of fusing online and co-presence social networks
CN118035526B (zh) 一种社交媒体精英节点识别方法及系统
Shin et al. Learning through online participation: A longitudinal analysis of participatory budgeting using Big Data indicators
CN102750288B (zh) 一种互联网内容推荐方法及装置
Cao et al. Opinion leaders discovery in social networking site based on the theory of propagation probability
Bok et al. Recommending similar users using moving patterns in mobile social networks
Jiang et al. A bibliometric and scientometric review of research on crowdsourcing in smart cities
Laflin et al. Dynamic targeting in an online social medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant