CN111581532A - 一种基于随机块的社交网络交友推荐方法和系统 - Google Patents
一种基于随机块的社交网络交友推荐方法和系统 Download PDFInfo
- Publication number
- CN111581532A CN111581532A CN202010383905.7A CN202010383905A CN111581532A CN 111581532 A CN111581532 A CN 111581532A CN 202010383905 A CN202010383905 A CN 202010383905A CN 111581532 A CN111581532 A CN 111581532A
- Authority
- CN
- China
- Prior art keywords
- friend
- users
- community
- social
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000004364 calculation method Methods 0.000 claims abstract description 13
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000004458 analytical method Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 230000006855 networking Effects 0.000 claims 1
- 238000007621 cluster analysis Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于随机块的社交网络交友推荐方法和系统,涉及计算机数据处理领域。本发明中的系统功能主要由以下四部分组成:数据处理模块、社区分类模块、好友推荐模块以及结果生成模块。基于随机块的社交网络交友推荐方法,包括以下步骤:步骤一,从数据库中获取用户好友列表,对获得的数据进行处理;步骤二,基于层次聚类算法BIRCH对数据进行聚类,划分多个社区;步骤三,根据社区分类结果,计算社区相关性指标;步骤四,基于社区相关性指标的计算结果,进行好友推荐,展示好友推荐结果。该系统通过随机块以及社区发现分析社交网络的方法,来识别并推荐用户潜在好友,提高用户体验。
Description
技术领域
本发明涉及计算机数据处理技术领域,具体涉及一种基于随机块的社交网络交友推荐方法和系统。
背景技术
随着计算机技术的飞速发展,社交网络不断壮大,涵盖了大量的用户信息,构成了复杂的网络结构,同时也吸引了越来越多关于社交网络好友推荐的研究。目前大量社交软件如QQ、微博等,其好友推荐方法主要基于社交网络中的用户相似性,该方法的特点为:用户之间的共同好友数越多,越有可能被推荐。
但是,在实际应用场合,基于共同好友的推荐方法效果欠佳,主要原因是这一类方法只是考虑了网络中的局部信息,忽视了整个社交网络的整体拓扑结构。比如,甲和乙两人都是科幻电影迷,看过众多类似的科幻片,那么他们两人就很可能有共同话题,能够成为好友。但由于两人互不相识,社交软件上没有共同好友,那么这种基于共同好友的推荐方法就无法在甲和乙之间建立朋友关系。显然,单纯聚焦于网络局部信息而忽视社交网络全局信息的推荐算法显然无法在推荐准确性上满足实际应用的需求。
发明内容
本发明针对上述现有技术存在的缺陷,提供了一种基于随机块的社交网络交友推荐方法和系统。
本发明是通过以下技术方案来实现的:
本发明公开了一种基于随机块的社交网络交友推荐方法和系统,包括以下步骤:
步骤一,从数据库中获取用户好友列表,对用户数据进行预处理;
步骤二,应用基于层次聚类算法BIRCH对数据进行聚类,划分具有稠密性的多个社交子网络;
步骤三,根据社交子网络结果,计算社区隶属度指标;
步骤四,基于社区隶属度指标的计算结果,进行好友推荐,展示好友推荐结果。
步骤一所述从数据库中获取用户好友列表,对获得的数据进行预处理,具体操作为:
1)收集社交平台中用户数据,获取各用户的好友列表;
2)处理收集的原始数据,得到由0和1构成的二维矩阵以表示用户间已知的社交网络。在该网络中,点表示用户,二两点之间的边则表示用户间的链接,若两用户是好友则边为1;反之,则为0。
步骤二对社交网络进行聚类分析,具体操作如下:
1)基于层次聚类算法BIRCH对社交网络进行聚类分析;
2)根据聚类的结果划分K个社交子网络,每个社交子网络中包括了多个用户之间的好友关系,并且这些用户在该子网络中的连接较为稠密。
步骤三所述的根据社交网络聚类分析的结果,计算社区隶属度指标,具体操作为:
1)为每个用户分配混合隶属度向量πi,服从狄利克雷分布,πi~Dirichelet(α),具体公式如下所示:
2)为社交子网络中每个社区分配权重βk,服从贝塔分布,βk~Beta(η),具体公式如下所示:
3)使用随机变分推理对上述参数进行更新;
4)最终得到两个重要的社区相关性指标:混合隶属度向量π和社区权重向量βk。
步骤四所述基于社区隶属度指标的计算结果,进行好友推荐,展示好友推荐结果,具体操作为:
1)根据两个用户的混合隶属度和所在社区的权重计算两个用户成为好友的概率。
具体的概率计算方法如下:
a)基于每对用户的混合隶属度向量πi和πj,为他们分配社区隶属度指标zi→j和zj→i,并服从多项式分布:zi→j~Multinomial(πi),zj→i~Multinomial(πj),具体公式如下所示:
b)经过抽样确定zi→j和zj→i的值。若两个用户所属的社区相同,那么他们成为好友的概率便是他们所在社区的权重;反之,概率为0。
3)展示好友推荐结果,向用户推荐所有潜在好友;
把可能成为好友的用户们,按照成为好友的概率大小由高到低排序。当两个用户成为好友的概率大于0.5时,向相关用户推荐。反之,暂时不予推荐。
本发明还公开了一种基于随机块的社交网络交友推荐系统,该系统包括:
数据处理模块,用于从数据库中获取用户好友列表,对获得的数据进行处理;
社区子网络聚类模块,用于对数据进行聚类,划分具有稠密性的社区子网络;
好友推荐模块,用于计算社区隶属度指标;
结果生成模块,根据社区隶属度指标的计算结果,展示好友推荐结果。
与现有技术相比,本发明具有以下有益的技术效果:
本发明公开的基于随机块的社交网络交友推荐方法和系统,首先从数据库中获取用户好友列表,对获得的数据进行预处理,构成社交网络;其次,基于层次聚类算法BIRCH对该社交网络进行聚类分析,以获得多个具有稠密性的社交子网络;然后,根据社区分类结果,为每个用户计算社区隶属度指标;最后,基于社区隶属度指标的计算结果,进行好友推荐,展示好友推荐结果,提高用户体验。本方法可以避免给用户推荐不符合的好友关系,同时可以利用社区发现方法对整体社交网络进行分析,针对用户感兴趣的领域进行精准好友推荐。与现有的基于共同好友的推荐算法相比,推荐的准确度有了明显的改善。
本发明还公开了能够实现上述交友推荐方法的系统,系统功能主要由以下四部分组成:数据处理模块、聚类分析模块、好友推荐模块以及结果生成模块。首先,从数据库中获取用户好友列表,对获得的数据进行处理。然后,对处理后的数据进行聚类,划分社交子网络。接着,计算社区相关性指标。最后,结果生成模块根据社区隶属度指标的计算结果,展示好友推荐结果。
附图说明
图1为本发明基于随机块的社交网络交友推荐方法和系统的逻辑结构图;
图2为本发明所涉及的数据处理说明图。
具体实施方式
下面结合具体的实例对本发明作进一步的详细说明,所述是对本发明的解释而不是限定。
本发明公开了一种基于随机块的社交网络交友推荐方法和系统,其功能结构如图1所示。其中,101为数据处理模块;102为聚类分析模块;103为好友推荐模块;104为结果生成模块。
系统功能主要由以下四部分组成:数据处理模块、聚类分析模块、好友推荐模块以及结果生成模块。
基于随机块的社交网络交友推荐方法,包括以下步骤:
步骤一,从数据库中获取用户好友列表,对获得的数据进行预处理,获得社交网络;
步骤二,基于层次聚类算法BIRCH对社交网络进行聚类,划分多个具有稠密性的社交子网络;
步骤三,根据聚类分析的结果,计算每个用户的社区隶属度指标;
步骤四,基于社区隶属度指标的计算结果,进行好友推荐,展示好友推荐结果。
下面对各模块工作进行具体举例说明:
1、数据处理模块
第一步,收集社交平台中众多用户数据,获取各用户的好友列表,如图2中上图的A、B、C、D。
第二步,处理收集的原始数据,用0和1代表用户之间的好友关系。如果两个用户是好友,那么他们之间的边设为1,反之,设为0。如图2中下图所示,然后以此构建邻接矩阵。
2、聚类分析模块
步骤二对社交网络进行聚类分析,具体操作如下:
第一步,基于层次聚类算法BIRCH对社交网络进行聚类。
第二步,聚类后形成K个具有稠密性的社交子网络,每个子网络中包括多个用户的好友关系。
3、好友推荐模块
根据聚类分析的结果,计算社区隶属度指标为推荐好友作准备。
社区隶属度指标具体计算方法是:
1)为每个用户分配混合隶属度向量πi,服从狄利克雷分布,πi~Dirichelet(α),具体公式如下所示:
2)为社交子网络中每个社区分配权重βk,服从贝塔分布,βk~Beta(η),具体公式如下所示:
3)使用随机变分推理对上述参数进行更新;
4)最终得到两个重要的社区相关性指标:混合隶属度向量π和社区权重向量βk。
4、结果生成模块
结果生成模块基于社区隶属度指标进行一系列计算,计算一对用户成为好友的概率,进行潜在好友推荐,并展示好友推荐的结果。具体操作为:
1)当两个用户处于不同社交子网络时,不触发任何操作;
2)当两个用户处于同一个社交子网络时,根据两个用户的混合隶属度和所在社区的权重计算两个用户成为好友的概率;
具体的概率计算方法如下:
a)基于每对用户的混合隶属度向量πi和πj,为他们分配社区隶属度指标zi→j和zj→i,并服从多项式分布:zi→j~Multinomial(πi),zj→i~Multinomial(πj),具体公式如下所示:
b)经过抽样确定zi→j和zj→i的值。若两个用户所属的社区相同,那么他们成为好友的概率便是他们所在社区的权重;反之,概率为0。
3)展示好友推荐结果,向用户推荐所有潜在好友;
把可能和本用户成为好友的用户们,按照成为好友的概率大小由高到低排序。当两个用户成为好友的概率大于0.5时,向用户互相推荐。反之,暂时不予推荐。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于随机块的社交网络交友推荐方法,其特征在于,包括以下步骤:
步骤一,从数据库中获取用户好友列表,对用户数据进行预处理;
步骤二,应用基于层次聚类算法BIRCH对数据进行聚类,划分具有稠密性的多个社交子网络;
步骤三,根据社交子网络结果,计算社区隶属度指标;
步骤四,基于社区隶属度指标的计算结果,进行好友推荐,展示好友推荐结果。
2.根据权利要求1所述的基于随机块的社交网络交友推荐方法,其特征在于,步骤一所述从数据库中获取用户好友列表,对获得的数据进行处理,具体操作为:
1)收集社交平台中用户数据,获取各用户的好友列表;
2)处理收集的原始数据,得到由0和1构成的二维矩阵以表示用户间已知的社交网络。在该网络中,点表示用户,二两点之间的边则表示用户间的链接,若两用户是好友则边为1;反之,则为0。
3.根据权利要求2所述的基于随机块的社交网络交友推荐方法,其特征在于,步骤二所述应用基于层次聚类算法BIRCH对数据进行聚类,划分具有稠密性的多个社交子网络,具体操作为:
1)基于层次聚类算法BIRCH对社交网络进行聚类分析;
2)根据聚类的结果划分K个社交子网络,每个社交子网络中包括了多个用户之间的好友关系,并且这些用户在该子网络中的连接较为稠密。
5.根据权利要求4所述的基于随机块的社交网络交友推荐方法,其特征在于,步骤四所述的基于社区隶属度指标的计算结果,进行好友推荐,展示好友推荐结果,具体操作为:
1)根据两个用户的混合隶属度和所在社区的权重计算两个用户成为好友的概率。
2)展示好友推荐结果,向用户推荐所有潜在好友。
7.根据权利要求5所述进行好友推荐,展示好友推荐结果,其特征在于,展示好友推荐结果,具体操作为:
1)把可能成为好友的用户们,按照成为好友的概率大小由高到低排序;
2)当两个用户成为好友的概率大于0.5时,向用户互相推荐。反之,暂时不予推荐。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010383905.7A CN111581532A (zh) | 2020-05-08 | 2020-05-08 | 一种基于随机块的社交网络交友推荐方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010383905.7A CN111581532A (zh) | 2020-05-08 | 2020-05-08 | 一种基于随机块的社交网络交友推荐方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111581532A true CN111581532A (zh) | 2020-08-25 |
Family
ID=72124791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010383905.7A Pending CN111581532A (zh) | 2020-05-08 | 2020-05-08 | 一种基于随机块的社交网络交友推荐方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111581532A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112507245A (zh) * | 2020-12-03 | 2021-03-16 | 中国人民大学 | 基于图神经网络的社交网络好友推荐方法 |
CN113343114A (zh) * | 2021-07-05 | 2021-09-03 | 云南大学 | 一种多特征融合的社交网络好友推荐方法及装置 |
CN113470739A (zh) * | 2021-07-03 | 2021-10-01 | 中国科学院新疆理化技术研究所 | 一种基于混合隶属度随机块模型的蛋白质相互作用预测方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106960390A (zh) * | 2017-01-03 | 2017-07-18 | 上海大学 | 基于节点聚合度的重叠社区划分方法 |
CN107545451A (zh) * | 2016-06-27 | 2018-01-05 | 腾讯科技(深圳)有限公司 | 一种广告推送方法及装置 |
CN107563898A (zh) * | 2017-09-26 | 2018-01-09 | 浪潮软件集团有限公司 | 一种社交圈推荐方法及装置 |
CN110263260A (zh) * | 2019-05-23 | 2019-09-20 | 山西大学 | 一种面向社交网络的社区检测方法 |
-
2020
- 2020-05-08 CN CN202010383905.7A patent/CN111581532A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107545451A (zh) * | 2016-06-27 | 2018-01-05 | 腾讯科技(深圳)有限公司 | 一种广告推送方法及装置 |
CN106960390A (zh) * | 2017-01-03 | 2017-07-18 | 上海大学 | 基于节点聚合度的重叠社区划分方法 |
CN107563898A (zh) * | 2017-09-26 | 2018-01-09 | 浪潮软件集团有限公司 | 一种社交圈推荐方法及装置 |
CN110263260A (zh) * | 2019-05-23 | 2019-09-20 | 山西大学 | 一种面向社交网络的社区检测方法 |
Non-Patent Citations (1)
Title |
---|
辛佰惠: "基于MMSB的加权社交网络社团发现算法研究" * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112507245A (zh) * | 2020-12-03 | 2021-03-16 | 中国人民大学 | 基于图神经网络的社交网络好友推荐方法 |
CN112507245B (zh) * | 2020-12-03 | 2023-07-18 | 中国人民大学 | 基于图神经网络的社交网络好友推荐方法 |
CN113470739A (zh) * | 2021-07-03 | 2021-10-01 | 中国科学院新疆理化技术研究所 | 一种基于混合隶属度随机块模型的蛋白质相互作用预测方法和系统 |
CN113343114A (zh) * | 2021-07-05 | 2021-09-03 | 云南大学 | 一种多特征融合的社交网络好友推荐方法及装置 |
CN113343114B (zh) * | 2021-07-05 | 2022-10-28 | 云南大学 | 一种多特征融合的社交网络好友推荐方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111581532A (zh) | 一种基于随机块的社交网络交友推荐方法和系统 | |
CN111966904B (zh) | 基于多用户画像模型的信息推荐方法和相关装置 | |
CN106817251B (zh) | 一种基于节点相似度的链路预测方法及装置 | |
US20130297714A1 (en) | Method and apparatus for targeting messages to users in a social network | |
CN105740342A (zh) | 一种基于社会关系主题模型的社交网络朋友推荐方法 | |
CN111143704B (zh) | 一种融合用户影响关系的在线社区好友推荐方法及系统 | |
CN106709037A (zh) | 一种基于异构信息网络的电影推荐方法 | |
Zanghi et al. | Strategies for online inference of model-based clustering in large and growing networks | |
CN104778237A (zh) | 一种基于关键用户的个性化推荐方法和系统 | |
CN107809370B (zh) | 用户推荐方法及装置 | |
JP2013196070A (ja) | 投稿者のプロフィール情報を分析する投稿者分析装置、プログラム及び方法 | |
Koren et al. | Measuring and extracting proximity graphs in networks | |
Yigit et al. | Extended topology based recommendation system for unidirectional social networks | |
Huang et al. | Information fusion oriented heterogeneous social network for friend recommendation via community detection | |
Cheung et al. | Characterizing user connections in social media through user-shared images | |
CN107346333B (zh) | 一种基于链路预测的在线社交网络好友推荐方法与系统 | |
Aylani et al. | Community detection in social network based on useras social activities | |
CN114461879A (zh) | 基于文本特征整合的语义社交网络多视角社区发现方法 | |
Zheng et al. | Towards improving community detection in complex networks using influential nodes | |
Gao et al. | Accelerating graph mining algorithms via uniform random edge sampling | |
CN110457387B (zh) | 一种应用于网络中用户标签确定的方法及相关装置 | |
CN117370565A (zh) | 一种信息检索方法及系统 | |
Abdollahpouri et al. | A multi-objective model for identifying valuable nodes in complex networks with minimum cost | |
Muruganantham et al. | Discovering and ranking influential users in social media networks using Multi-Criteria Decision Making (MCDM) Methods | |
Keerthi Chandra et al. | Collective embedding with feature importance: A unified approach for spatiotemporal network embedding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200825 |