CN111859164A - 基于局部结构的微博网络重要节点发现方法、装置及介质 - Google Patents
基于局部结构的微博网络重要节点发现方法、装置及介质 Download PDFInfo
- Publication number
- CN111859164A CN111859164A CN202010548943.3A CN202010548943A CN111859164A CN 111859164 A CN111859164 A CN 111859164A CN 202010548943 A CN202010548943 A CN 202010548943A CN 111859164 A CN111859164 A CN 111859164A
- Authority
- CN
- China
- Prior art keywords
- node
- nodes
- importance
- network
- neighbor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000012163 sequencing technique Methods 0.000 claims abstract description 18
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 7
- 238000001514 detection method Methods 0.000 claims abstract description 5
- 238000012795 verification Methods 0.000 claims abstract description 5
- 230000005540 biological transmission Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 238000005065 mining Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 description 5
- 238000011387 Li's method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005295 random walk Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000009412 basement excavation Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005474 detonation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及一种基于局部结构的微博网络重要节点发现方法、装置及介质,本发明的技术方案通过获取微博网络数据并建立网络拓扑模型;计算邻居节点对节点重要性的贡献;根据网络拓扑模型中任意节点的出入度和节点对邻居节点的贡献计算节点的局部重要性;计算邻居节点的局部重要性,通过节点的局部重要性及邻居节点的局部重要性对节点进行排序;通过SIR模型计算每个节点在设定时间内的传播能力;通过检测算法进行准确性校验,输出精确预测的节点传播能力的排序。本发明的有益效果为:充分挖掘节点的影响力,通过计算节点自身重要性和邻居节点重要性,针对大规模稀疏微博网络数据具有较好的应用价值,且具有时间复杂度低,降低了系统资源的消耗。
Description
技术领域
本发明涉及社交网络及数据分析领域,具体涉及了一种基于局部结构的微博 网络重要节点发现方法、装置及介质。
背景技术
微博网络是重要的社交网络,在信息传播的背景下,对微博网络的关键节点 进行识别,能够挖掘出引爆网络的关键节点,还能分析出网络信息传播路径,及 时对舆情进行监控和引领。对于商家而言,通过关键节点挖掘,在微博上对广告 进行定点投放,得到最大收益。因此,对微博网络关键节点识别具有较大研究意 义。
重要节点挖掘方法较多,大体可分为基于局部结构、基于全局结构和基于随 机游走的方法。基于局部结构的挖掘方法主要利用节点的度信息和邻居节点信 息,由于具有复杂度低、计算速度快等特点,常用于大规模网络中。基于全局结 构的方法考虑了节点在全局网络中的属性,其准确性较高。随机游走的方法采用 迭代的方法来计算节点重要性,能够深层的揭示网络的结构,典型的方法包括 pagerank、leadrank方法。基于全局的方法和随机游走的方法虽然预测精度高, 但不适用于大型网络中。而微博网络数据具有数据量大且稀疏的特点,现有的技 术方案计算效率低,在基于局部结构的方法中,最简单的方法是以节点的出入度 挖掘节点在网络中的重要性,但不足以挖掘节点的相对重要性,也有研究在此基 础上考虑了二阶邻居节点的重要性,以及节点的簇系数。节点在局部结构中重要性不仅与节点自身重要性有关还与邻居节点的重要性有关,当前虽然基于局部挖 掘的方法较多,但缺乏对节点自身和邻居节点的重要性的有效量化,在考虑节点 自身重要性时还需考虑节点对邻居节点贡献。
发明内容
本发明的目的在于至少解决现有技术中存在的技术问题之一,提供了一种基 于局部结构的微博网络重要节点发现方法、装置及介质,充分挖掘节点自身局部 重要性和邻居节点重要性,并应用于微博网络中重要节点识别,具有较好的效果。
本发明的技术方案包括一种基于局部结构的微博网络重要节点发现方法, 其特征在于,该方法包括:S100,获取微博网络数据并建立网络拓扑模型;S200, 根据所述网络拓扑模型中任意节点及其邻居节点的联系性,计算邻居节点对节点 重要性的贡献;S300,根据所述网络拓扑模型中任意所述节点的出入度和所述节 点对所述邻居节点的贡献计算所述节点的局部重要性;S400,结合所述节点的局 部重要性和所述邻居节点,计算所述邻居节点的局部重要性,通过所述节点的局 部重要性及所述邻居节点的局部重要性对节点进行排序;S500,通过SIR模型计 算每个节点在设定时间内的传播能力,并进行排序,得到节点传播能力的排序并 进行展示。
根据所述的基于局部结构的微博网络重要节点发现方法,其中该方法还包 括:S600,对所述S100~S500通过检测算法进行准确性校验,输出精确预测的 节点传播能力的排序。
根据所述的基于局部结构的微博网络重要节点发现方法,其中S100包括: 获取网络数据并建立网络拓扑模型G(V,E),网络以邻接矩阵A表示,A中元素值 axy∈{0,1},axy=1表示网络存在x→y的连边,为0表示不存在连边。
根据所述的基于局部结构的微博网络重要节点发现方法,其中S200包括: 定义所述网络拓扑模型中任意节点的度中心性、贡献概率及节点聚类度,通过所 述度中心性、所述贡献概率及所述节点聚类度计算所述邻居节点对所述节点的重 要性。
根据所述的基于局部结构的微博网络重要节点发现方法,其中S200还包 括:将所述度中心性DC(vi)配置为
所述度中心性用于描述了节点在全局网络中的相对重要性;
将所述共享概率P(vi)配置为
将所述共享概率用于表示节点vi对邻居节点的贡献概率;
将所述节点聚类度C(vi)配置为
所述度节点聚类度用于表示所述节点与所述邻居节点之间的紧密程度;通 过所述度中心性、所述贡献概率及所述节点聚类度计算节点vi的邻居节点的贡献 neiCon(vi),具体为
其中,dall(vi)表示节点vi的出入度之和,dout(vi)表示节点的出度,Γall(vi)和kall(vi)分别表示节点vi的全部邻居节点和节点所有的出入度之和。
根据所述的基于局部结构的微博网络重要节点发现方法,其中S300包括: 计算节点vi自身重要性,具体地,计算节点在网络拓扑模型中的相对重要性,计 算节点vi自身重要性方式为
根据所述的基于局部结构的微博网络重要节点发现方法,其中S400包括: 结合节点vi的邻居节点的贡献neiCon(vi)以及节点vi自身重要性ownCon(vi),通 过挖掘方法LI计算节点局部重要性LI(vi),具体为
LI(vi)=neiCon(vi)·ownCon(vi)。
根据所述的基于局部结构的微博网络重要节点发现方法,其中S500包括: 通过SIR模型对每个节点在设定时间步所传染网络中节点数目进行记录和排序, 根据所传染的网络中节点的数量对节点传播能力的进行量化处理。
本发明的技术方案还包括一种基于局部结构的微博网络重要节点发现装 置,该装置包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运 行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述任一 的方法步骤。
本发明的技术方案还包括一种计算机可读存储介质,所述计算机可读存储 介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述 任一的方法步骤。
本发明的有益效果为:充分挖掘节点的影响力,通过计算节点自身重要性 和邻居节点重要性,针对大规模稀疏微博网络数据具有较好的应用价值,且具有 时间复杂度低、计算成本低的优点,降低了系统资源的消耗。
附图说明
下面结合附图和实施例对本发明进一步地说明;
图1是根据本发明实施方式的总体流程图。
图2是根据本发明实施方式的微博网络重要节点发现的实施例一。
图3是根据本发明实施方式的装置示意图。
具体实施方式
本部分将详细描述本发明的具体实施例,本发明之较佳实施例在附图中示 出,附图的作用在于用图形补充说明书文字部分的描述,使人能够直观地、形象 地理解本发明的每个技术特征和整体技术方案,但其不能理解为对本发明保护范 围的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上, 大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。
术语解释:
precision,模型评估指标。
图1是根据本发明实施方式的总体流程图。该流程包括以下步骤:S100, 获取微博网络数据并建立网络拓扑模型;S200,根据网络拓扑模型中任意节点及 其邻居节点的联系性,计算邻居节点对节点重要性的贡献;S300,根据网络拓扑 模型中任意节点的出入度和节点对邻居节点的贡献计算节点的局部重要性; S400,结合节点的局部重要性和邻居节点,计算邻居节点的局部重要性,通过节 点的局部重要性及邻居节点的局部重要性对节点进行排序;S500,通过SIR模型 计算每个节点在设定时间内的传播能力,并进行排序,得到节点传播能力的排序 并进行展示。S600,对S100~S500通过检测算法进行准确性校验,输出精确预 测的节点传播能力的排序,具体地,使用precision指标评价算法的准确性。取排在前L条的LI方法结果与真实节点的排序结果做比较,计算有多少条预测准 确。
图2是根据本发明实施方式的微博网络重要节点发现的实施例一。
如附图2,其包括以下步骤:
步骤一:获取网络数据并建立网络拓扑模型G(V,E),网络以邻接矩阵A表 示,A中元素值axy∈{0,1},axy=1表示网络存在x→y的连边,为0表示不存在 连边;
步骤二:计算邻居节点的贡献。对网络中任意节点vi,在计算邻居节点贡献neiCon(vi)之前,需进行相关定义。下列公式中dall(vi)表示节点vi的出入度之和, dout(vi)表示节点的出度,Γall(vi)和kall(vi)分别表示vi的全部邻居节点和节点所有 的出入度之和,具体定义如下:
定义1度中心性:描述了节点在全局网络中的相对重要性,微博网络中节 点在全局网络中的重要性需要考虑节点的出入度,具体表示为:
定义2贡献概率:节点通过出度与其他节点产生联系,节点vi对邻居节点的 贡献概率表示为:
定义3节点聚类度:反应了节点与邻居节点之间的紧密程度,节点vi的聚类 度计算公式为:
基于上述定义,则节点vi的邻居节点的重要性可计算为:
步骤三:计算节点自身重要性。节点在网络中的相对重要性需考虑节点自身 重要性和对邻居节点的贡献,节点vi自身重要性的表达式为:
步骤四:结合邻居节点和自身重要性,节点局部重要性的挖掘方法LI(LocalInfluence)计算公式为:
LI(vi)=neiCon(vi)·ownCon(vi)
步骤五:通过SIR模型计算每个节点真实的传播能力,并排序。通过适用 SIR模型计算每个节点一定时间步所传染的网络节点数目的多少来评价节点的 传播能力,其中时间步数设置为40。
步骤六:使用precision指标评价算法的准确性。取排在前L条的LI方法结 果与真实节点的排序结果做比较,计算有多少条预测准确。
图3是根据本发明实施方式的装置示意图。图3所示为根据本发明实施方 式的装置示意图。装置包括存储器100及处理器200,其中处理器200存储有计 算机程序,计算机程序用于执行:获取微博网络数据并建立网络拓扑模型;根据 网络拓扑模型中任意节点及其邻居节点的联系性,计算邻居节点对节点重要性的 贡献;根据网络拓扑模型中任意节点的出入度和节点对邻居节点的贡献计算节点 的局部重要性;结合节点的局部重要性和邻居节点,计算邻居节点的局部重要性, 通过节点的局部重要性及邻居节点的局部重要性对节点进行排序;通过SIR模型 计算每个节点在设定时间内的传播能力,并进行排序,得到节点传播能力的排序 并进行展示;通过检测算法进行准确性校验,输出精确预测的节点传播能力的排 序。其中,存储器100用于存储数据。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施 例,在技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨 的前提下做出各种变化。
Claims (10)
1.一种基于局部结构的微博网络重要节点发现方法,其特征在于,该方法包括:
S100,获取微博网络数据并建立网络拓扑模型;
S200,根据所述网络拓扑模型中任意节点及其邻居节点的联系性,计算邻居节点对节点重要性的贡献;
S300,根据所述网络拓扑模型中任意所述节点的出入度和所述节点对所述邻居节点的贡献计算所述节点的局部重要性;
S400,结合所述节点的局部重要性和所述邻居节点,计算所述邻居节点的局部重要性,通过所述节点的局部重要性及所述邻居节点的局部重要性对节点进行排序;
S500,通过SIR模型计算每个节点在设定时间内的传播能力,并进行排序,得到节点传播能力的排序并进行展示。
2.根据权利要求1所述的基于局部结构的微博网络重要节点发现方法,其特征在于,该方法还包括:
S600,对所述S100~S500通过检测算法进行准确性校验,输出精确预测的节点传播能力的排序。
3.根据权利要求1所述的基于局部结构的微博网络重要节点发现方法,其特征在于,所述S100包括:
获取网络数据并建立网络拓扑模型G(V,E),网络以邻接矩阵A表示,A中元素值axy∈{0,1},axy=1表示网络存在x→y的连边,为0表示不存在连边。
4.根据权利要求1所述的基于局部结构的微博网络重要节点发现方法,其特征在于,所述S200包括:
定义所述网络拓扑模型中任意节点的度中心性、贡献概率及节点聚类度,通过所述度中心性、所述贡献概率及所述节点聚类度计算所述邻居节点对所述节点的重要性。
5.根据权利要求3或4所述的基于局部结构的微博网络重要节点发现方法,其特征在于,所述S200还包括:
将所述度中心性DC(vi)配置为
所述度中心性用于描述了节点在全局网络中的相对重要性;
将所述共享概率P(vi)配置为
将所述共享概率用于表示节点vi对邻居节点的贡献概率;
将所述节点聚类度C(vi)配置为
所述度节点聚类度用于表示所述节点与所述邻居节点之间的紧密程度;
通过所述度中心性、所述贡献概率及所述节点聚类度计算节点vi的邻居节点的贡献neiCon(vi),具体为
其中,dall(vi)表示节点vi的出入度之和,dout(vi)表示节点的出度,Γall(vi)和kall(vi)分别表示节点vi的全部邻居节点和节点所有的出入度之和。
7.根据权利要求6所述的基于局部结构的微博网络重要节点发现方法,其特征在于,所述S400包括:
结合节点vi的邻居节点的贡献neiCon(vi)以及节点vi自身重要性ownCon(vi),通过挖掘方法LI计算节点局部重要性LI(vi),具体为
LI(vi)=neiCon(vi)·ownCon(vi)。
8.一种根据权利要求7所述的基于局部结构的微博网络重要节点发现方法,其特征在于,所述S500包括:
通过SIR模型对每个节点在设定时间步所传染网络中节点数目进行记录和排序,根据所传染的网络中节点的数量对节点传播能力的进行量化处理。
9.一种基于局部结构的微博网络重要节点发现装置,该装置包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8任一所述的方法步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010548943.3A CN111859164A (zh) | 2020-06-16 | 2020-06-16 | 基于局部结构的微博网络重要节点发现方法、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010548943.3A CN111859164A (zh) | 2020-06-16 | 2020-06-16 | 基于局部结构的微博网络重要节点发现方法、装置及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111859164A true CN111859164A (zh) | 2020-10-30 |
Family
ID=72987261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010548943.3A Pending CN111859164A (zh) | 2020-06-16 | 2020-06-16 | 基于局部结构的微博网络重要节点发现方法、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111859164A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113094558A (zh) * | 2021-04-08 | 2021-07-09 | 电子科技大学 | 一种基于局部结构的网络节点影响力排序方法 |
-
2020
- 2020-06-16 CN CN202010548943.3A patent/CN111859164A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113094558A (zh) * | 2021-04-08 | 2021-07-09 | 电子科技大学 | 一种基于局部结构的网络节点影响力排序方法 |
CN113094558B (zh) * | 2021-04-08 | 2023-10-20 | 电子科技大学 | 一种基于局部结构的网络节点影响力排序方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kashima et al. | A parameterized probabilistic model of network evolution for supervised link prediction | |
Hübler et al. | Metropolis algorithms for representative subgraph sampling | |
Jiang et al. | Community detection in complex networks with an ambiguous structure using central node based link prediction | |
Qi et al. | Deep face clustering using residual graph convolutional network | |
CN109902203B (zh) | 基于边的随机游走的网络表示学习方法和装置 | |
Selim et al. | Towards shortest path identification on large networks | |
CN112910710B (zh) | 网络流量时空预测方法、装置、计算机设备和存储介质 | |
CN111008447A (zh) | 一种基于图嵌入法的链路预测方法 | |
CN103838803A (zh) | 一种基于节点Jaccard相似度的社交网络社团发现方法 | |
Ribeiro et al. | Efficient parallel subgraph counting using g-tries | |
Salter-Townshend et al. | Role analysis in networks using mixtures of exponential random graph models | |
Al Hasan | Methods and applications of network sampling | |
Attea et al. | Improving the performance of evolutionary-based complex detection models in protein–protein interaction networks | |
Maack et al. | On finding separators in temporal split and permutation graphs | |
CN111859164A (zh) | 基于局部结构的微博网络重要节点发现方法、装置及介质 | |
Zhou et al. | Clustering analysis in large graphs with rich attributes | |
Meng et al. | POI recommendation for occasional groups Based on hybrid graph neural networks | |
Zhao et al. | Detecting overlapping protein complexes in weighted PPI network based on overlay network chain in quotient space | |
Wang et al. | [Retracted] Overlapping Community Detection Based on Node Importance and Adjacency Information | |
Liu et al. | An effective simulated annealing for influence maximization problem of online social networks | |
CN106815653B (zh) | 一种基于距离博弈的社交网络关系预测方法及系统 | |
CN115329195A (zh) | 基于人工智能的意图挖掘方法、装置、设备及存储介质 | |
Ju et al. | Locating influence sources in social network by senders and receivers spaces mapping | |
García-Pérez et al. | Predictability of missing links in complex networks | |
Chen et al. | Towards contiguous sequences in uncertain data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201030 |
|
RJ01 | Rejection of invention patent application after publication |