CN106327012A - 一种基于二阶局部社团和节点度信息的预测网络未知连边的方法 - Google Patents
一种基于二阶局部社团和节点度信息的预测网络未知连边的方法 Download PDFInfo
- Publication number
- CN106327012A CN106327012A CN201610714819.3A CN201610714819A CN106327012A CN 106327012 A CN106327012 A CN 106327012A CN 201610714819 A CN201610714819 A CN 201610714819A CN 106327012 A CN106327012 A CN 106327012A
- Authority
- CN
- China
- Prior art keywords
- node
- network
- order
- order local
- corporations
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 9
- 239000000284 extract Substances 0.000 claims description 3
- 238000011160 research Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000005295 random walk Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于二阶局部社团和节点度信息的预测网络未知连边的方法,构建网络模型,获取一对未连接节点的一阶共同邻居节点和二阶共同邻居节点,这些节点及其之间的连边构成二阶局部社团;记录该社团的节点和连边总数,同时记录每个节点在整体网络中的度和在该社团中的度;计算该社团的度系数、边聚类系数、简谐平均距离和二阶局部社团系数;计算节点对之间的相似性分数指标;遍历整个网络,对任意两个未连接节点,计算相应的节点对之间的相似性分数指标,将所有的未连接节点对之间的相似性分数按降序排列,取前m个指标对应的节点对为预测连边。本发明考虑了二阶局部社团和节点度信息,充分利用了网络局部结构信息,预测效果好,准确率高。
Description
技术领域
本发明涉及网络与链路预测领域,特别是指一种基于二阶局部社团和节点度信息的预测网络未知连边的方法。
背景技术
随着科学飞速发展,人类进入了网络时代。各类以互联网为载体的技术与产业也应运而生,极大地改善了人们的学习与生活。我们生活在形形色色的网络中。与人交往就会出现关系网,出行则会有交通网络。自然科学的快速发展,使得我们对世界的认识越来越多。人类研究的网络越来越庞大且复杂,在如今大数据的背景下,随着需要处理的单个数据规模和数据总规模的增大,数据的平均质量却是在下降,而数据的不完整性造成的影响变得更加突出。这时就可使用链路预测来预测或重构接近真实且较完整的数据。链路预测技术可应用于任何可以将实体及其间接关系抽象成网络形式的系统中,如在线社交网络、电子商务网站等,从而产生可观的商业价值。因此,链路预测的研究显得十分有必要。
网络的链路预测包括对未知连边的预测,还包括对未来的连边预测。出于某种原因网络的信息会存在少量丢失的情况,利用网络中已知的信息去分析,最终还原缺失信息,这种就属于前者。考虑到网络的变化,节点及节点间的联系均存在变化,根据现有信息对网络中未来信息(现在不存在,但未来可能会存在)的预测则是后者。链路预测简单的说就是通过已知的节点信息去预测其他还未直接相连或未知状态的节点间产生连接的概率。近些年来,对于链路预测的研究主要是基于节点相似性,分别基于节点与路径对真实网络数据进行测试,如:AA指标,CN指标。周涛等在此基础上提出两种新指标:资源分配指标和局部路径指标。刘伟平和吕琳媛提出了两种局部随机游走指标。有限步的随机游走有时会比全局收敛后的预测精度要高,而最优的游走步数受到网络平均距离的强烈影响。传统上人们在解决问题时,往往考虑一阶共同邻居节点并对二阶共同邻居节点对整个网络的链路预测的重要作用考虑的不够多,本发明提出了一种基于二阶局部社团和节点度信息的预测网络未知连边的方法,考虑了种子节点的共同邻居节点之间的联系,同时还考虑到了边聚类系数、平均最短路径和局部社团内部节点度信息的影响。充分利用网络中的局部信息是提高链路预测算法准确性的一种新的有效手段。本发明针对相似性算法进行了扩展,种子节点的社团信息由原来的一阶邻居节点扩展到二阶邻居节点。
发明内容
为了克服已有链路预测算法准确率低,信息利用率低的不足,本发明提出一种准确率高、预测效果良好的基于二阶局部社团和节点度信息的链路预测方法。
本发明解决其技术问题所采用的技术具体步骤是:
一种基于二阶局部社团和节点度信息的预测网络未知连边的方法,包括如下步骤:
步骤一:在保证整个网络保持连通的条件下建立网络模型G(V,E),其中V为网络中的节点,E为网络中的边;
步骤二:选取网络中一对没有连边的节点i和j作为两个种子节点,提取所有i和j的一阶共同邻居节点和二阶共同邻居节点以及这些节点之间的连边,构成二阶局部社团,其中i和j之间长度为2的路径的中间的一个节点为一阶共同邻居,长度为3的路径的中间2个节点为二阶共同邻居;
步骤三:遍历整个二阶局部社团,节点总数记为CNij,总连边数量记为LCLij,每个节点在整体网络中的度记为kg,每个节点在二阶局部社团中的度记为γg,其中g表示二阶局部社团中的一个节点;
步骤四:计算二阶局部社团的度系数:
步骤五:计算二阶局部社团的边聚类系数:
步骤六:计算二阶局部社团的简谐平均距离:
其中
上式中,g和h表示二阶局部社团中任意两个节点,dgh为g和h两个节点之间的路径长度;
步骤七:计算二阶局部社团系数:
步骤八:计算节点i,j之间的相似性分数指标:
LCRAij=λij*TLCCij;
步骤九:遍历整个网络,对任意两个未连接节点,重复步骤二至步骤八,计算相应的LCRA指标作为节点对之间的相似性分数指标,相似性分数越高,相应的节点对之间出现连边的可能性越大,将所有的未连接节点对之间的相似性分数按降序排列,取前m个指标对应的节点对为预测连边,m≦M,M为整个网络中所有未连接节点对的总数。
本发明的技术构思为:网络的二阶邻居节点对整个网络的链路预测有着不可忽视的影响,本发明在考虑二阶局部社团的简谐平均距离和边聚类系数时,同时考虑了局部社团节点度在整体网络度中所占的比例,充分利用网络中的局部信息,在具有局部特性结构的网络中有很好的预测效果,可以提高链路预测算法准确性。
本发明的有益效果为:本发明将局部社团从一阶邻居扩展到二阶邻居,同时考虑了局部社团节点度在整体网络度中所占的比例,充分利用了已知的网络节点以及网络局部结构信息,算法的精确度高。
附图说明
图1为二阶局部社团描述图,黑色圆点为种子节点,白色圆点为共同邻居节点,虚线为邻居节点之间存在的连边,实线为种子节点与共同邻居之间的连边,白色圆点和虚线构成了二阶局部社团。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1,一种基于二阶局部社团和节点度信息的预测网络未知连边的方法,包括以下步骤:
步骤一:在保证整个网络保持连通的条件下建立网络模型G(V,E),其中V为网络中的节点,E为网络中的边;
步骤二:选取网络中一对没有连边的节点i和j作为两个种子节点,即图1中黑色圆点,提取所有i和j的一阶共同邻居节点和二阶共同邻居节点以及这些节点之间的连边,如图1中的白色圆点及其连边,构成二阶局部社团,其中i和j之间长度为2的路径的中间的一个节点为一阶共同邻居,长度为3的路径的中间2个节点为二阶共同邻居;
步骤三:遍历整个二阶局部社团,节点总数记为CNij,总连边数量记为LCLij,每个节点在整体网络中的度记为kg,每个节点在二阶局部社团中的度记为γg,其中g表示二阶局部社团中的一个节点;
步骤四:计算二阶局部社团的度系数:
步骤五:计算二阶局部社团的边聚类系数:
步骤六:计算二阶局部社团的简谐平均距离:
其中
上式中,g和h表示二阶局部社团中任意两个节点,dgh为g和h两个节点之间的路径长度;
步骤七:计算二阶局部社团系数:
步骤八:计算节点i,j之间的相似性分数指标:
LCRAij=λij*TLCCij;
步骤九:遍历整个网络,对任意两个未连接节点,重复步骤二至步骤八,计算相应的LCRA指标作为节点对之间的相似性分数指标,相似性分数越高,相应的节点对之间出现连边的可能性越大,将所有的未连接节点对之间的相似性分数按降序排列,取前m个指标对应的节点对为预测连边,m≦M,M为整个网络中所有未连接节点对的总数。
如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。
Claims (1)
1.一种基于二阶局部社团和节点度信息的预测网络未知连边的方法,其特征在于:包括以下步骤:
步骤一:在保证整个网络保持连通的条件下建立网络模型G(V,E),其中V为网络中的节点,E为网络中的边;
步骤二:选取网络中一对没有连边的节点i和j作为两个种子节点,提取所有i和j的一阶共同邻居节点和二阶共同邻居节点以及这些节点之间的连边,构成二阶局部社团,其中i和j之间长度为2的路径的中间的一个节点为一阶共同邻居,长度为3的路径的中间2个节点为二阶共同邻居;
步骤三:遍历整个二阶局部社团,节点总数记为CNij,总连边数量记为LCLij,每个节点在整体网络中的度记为kg,每个节点在二阶局部社团中的度记为γg,其中g表示二阶局部社团中的一个节点;
步骤四:计算二阶局部社团的度系数:
步骤五:计算二阶局部社团的边聚类系数:
步骤六:计算二阶局部社团的简谐平均距离:
其中
上式中,g和h表示二阶局部社团中任意两个节点,dgh为g和h两个节点之间的路径长度;
步骤七:计算二阶局部社团系数:
步骤八:计算节点i,j之间的相似性分数指标:LCRAij=λij*TLCCij;
步骤九:遍历整个网络,对任意两个未连接节点,重复步骤二至步骤八,计算相应的LCRA指标作为节点对之间的相似性分数指标,相似性分数越高,相应的节点对之间出现连边的可能性越大,将所有的未连接节点对之间的相似性分数按降序排列,取前m个指标对应的节点对为预测连边,m≦M,M为整个网络中所有未连接节点对的总数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610714819.3A CN106327012A (zh) | 2016-08-23 | 2016-08-23 | 一种基于二阶局部社团和节点度信息的预测网络未知连边的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610714819.3A CN106327012A (zh) | 2016-08-23 | 2016-08-23 | 一种基于二阶局部社团和节点度信息的预测网络未知连边的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106327012A true CN106327012A (zh) | 2017-01-11 |
Family
ID=57790203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610714819.3A Pending CN106327012A (zh) | 2016-08-23 | 2016-08-23 | 一种基于二阶局部社团和节点度信息的预测网络未知连边的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106327012A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106603313A (zh) * | 2017-01-23 | 2017-04-26 | 浙江工业大学 | 一种基于二阶局部群落和大度节点有利的预测网络连边的方法 |
CN107086933A (zh) * | 2017-05-23 | 2017-08-22 | 杨武略 | 一种基于贝叶斯估计和种子节点度的链路预测方法 |
-
2016
- 2016-08-23 CN CN201610714819.3A patent/CN106327012A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106603313A (zh) * | 2017-01-23 | 2017-04-26 | 浙江工业大学 | 一种基于二阶局部群落和大度节点有利的预测网络连边的方法 |
CN107086933A (zh) * | 2017-05-23 | 2017-08-22 | 杨武略 | 一种基于贝叶斯估计和种子节点度的链路预测方法 |
CN107086933B (zh) * | 2017-05-23 | 2018-07-13 | 杨武略 | 一种基于贝叶斯估计和种子节点度的链路预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106330541A (zh) | 一种基于二阶局部社团和偏好连接的预测网络未知连边的方法 | |
CN106295907A (zh) | 一种基于二阶局部社团信息的预测网络未知连边的方法 | |
CN103092911B (zh) | 一种融合社会标签相似度基于k近邻的协同过滤推荐系统 | |
CN103033856B (zh) | 基于水文气象一致性地区分析的雨量频率估计方法 | |
CN106372743A (zh) | 一种基于二阶局部社团和共同邻居比例信息的预测网络未知连边的方法 | |
CN106341258A (zh) | 一种基于二阶局部社团和种子节点结构信息的预测网络未知连边的方法 | |
CN107317704A (zh) | 一种基于紧密度和结构洞的复杂网络重要节点排序方法 | |
CN104268271A (zh) | 一种兴趣和网络结构双内聚的社交网络社区发现方法 | |
CN107274669B (zh) | 一种基于最短路径的城市道路交通网络熵计算方法及系统 | |
CN105162654A (zh) | 一种基于局部社团信息的链路预测方法 | |
CN103326899A (zh) | 一种基于网络异质性的加权网络节点重要度评估方法 | |
CN108090677B (zh) | 一种关键基础设施的可靠性测评方法 | |
CN107092984A (zh) | 一种基于级联失效的网络功能端节点传播预测方法 | |
CN109447261A (zh) | 一种基于多阶邻近相似度的网络表示学习的方法 | |
CN111815468A (zh) | 一种基于用户身份关联的多源社交网络构建方法 | |
CN106327012A (zh) | 一种基于二阶局部社团和节点度信息的预测网络未知连边的方法 | |
CN104731887B (zh) | 一种协同过滤中的用户相似度度量方法 | |
CN107357858A (zh) | 一种基于地理位置的网络重构方法 | |
CN109194509A (zh) | 一种基于路径强弱关系和社区信息的预测网络连边的方法 | |
CN104537418A (zh) | 一种自底向上的高维数据因果网络学习方法 | |
CN112257950A (zh) | 应用于电力市场的交易路径配置方法及计算机可读存储介质 | |
CN108133426A (zh) | 一种社交网络链路推荐方法及网络演化模型实施设计 | |
CN107220777A (zh) | 基于信息熵模型的网络品牌社区用户的社会资本度量方法 | |
CN114329867B (zh) | 一种基于模体的无标度网络鲁棒性度量方法 | |
CN106959953A (zh) | 一种基于统计特征的社交网络用户关系的计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170111 |