CN105117422A - 智能社交网络推荐系统 - Google Patents

智能社交网络推荐系统 Download PDF

Info

Publication number
CN105117422A
CN105117422A CN201510461144.1A CN201510461144A CN105117422A CN 105117422 A CN105117422 A CN 105117422A CN 201510461144 A CN201510461144 A CN 201510461144A CN 105117422 A CN105117422 A CN 105117422A
Authority
CN
China
Prior art keywords
user
network
node
value
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510461144.1A
Other languages
English (en)
Other versions
CN105117422B (zh
Inventor
刘杉
柴剑平
范馨怡
毛博欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Communication University of China
Original Assignee
Communication University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communication University of China filed Critical Communication University of China
Priority to CN201510461144.1A priority Critical patent/CN105117422B/zh
Publication of CN105117422A publication Critical patent/CN105117422A/zh
Application granted granted Critical
Publication of CN105117422B publication Critical patent/CN105117422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种智能社交网络推荐系统,包括数据获取模块:对页面数据进行爬取将数据分别存入数据库中;数据处理模块:对网站数据进行爬取构建用户为节点的社交网络,以用户之间的互动关系作为节点之间的边关系进行网络构建,网络中的用户有一次互动发生则产生一条用户关系连边,反之则没有连边,拥有连边的用户呈相邻关系,完成社交网络传播网络的构建;通过社团划分算法对社交网络进行社团划分,根据不同社交网络中的侧重点选取影响指标对单个社团中具有相似特性的用户进行影响力排名分析,结合用户的兴趣标签分析将用户价值进行分类,最后对划分出的较大的社团进行用户的影响力价值分析。以实现提高社交网络中重要用户识别准确度的优点。

Description

智能社交网络推荐系统
技术领域
本发明涉及通信领域,具体地,涉及一种智能社交网络推荐系统。
背景技术
目前,社交网络作为人们传播信息、交流沟通的重要平台,充分利用了互联网开放、平等和快速的特征给人们带来了独特的交互及信息分享体验,极大地扩展了人类信息传播、交流的范围。社交网络的迅猛发展,用户数的持续增长,不仅带来的是信息传播技术的根本性变革,而且是人们生活习惯、交流方式、思维理念的改变。社交网络的信息传播方式具有双向互动型、开放性,这也导致了信息传播的范围广、速度快、不易控等特点。
现阶段在社交网络分析的应用上,网络监管部门在社交网络分析上对论坛重要用户分析和重点监控不足、缺少控制舆情传播的具体措施;广告合作商缺少对用户的精准定位实现广告投放、没有充分利用社交网络口碑效应和传播力。因此对社交网络的结构进行分析和研究势在必行。
目前的社交网络分析大量集中在对微博等社交媒体的研究上。主要研究用户关系特性、用户行为特征、信息传播模型、话题和群体性事件的定性研究分析等。基于复杂网络理论的社交网络研究主要从网络结构分析特性入手,利用复杂网络的小世界、无标度、高聚类、社团化等性质分析网络结构,将真实网络转换为理论上的图论模型进行研究。社交网络研究的难点在于大型数据集的长期挖掘和获取,不同的数据信息集对应不同的信息模型,需要采用不同的研究方法进行分析。
发明内容
本发明的目的在于,针对上述问题,提出一种智能社交网络推荐系统,以实现提高社交网络中重要用户识别准确度的优点。
为实现上述目的,本发明采用的技术方案是:
一种智能社交网络推荐系统,包括
数据获取模块::对页面数据进行爬取并将数据分别存入数据库中;
数据处理模块::对网站的数据进行爬取构建用户为节点的社交网络,以用户之间的互动关系作为节点之间的边关系进行网络构建,网络中的用户有一次互动发生则产生一条用户关系连边,反之则没有连边,拥有连边的用户呈相邻关系,从而完成社交网络传播网络的构建;
通过社团划分算法对社交网络进行社团划分,根据不同社交网络中的侧重点选取影响指标对单个社团中具有相似特性的用户进行影响力排名分析,结合用户的兴趣标签分析将用户价值进行分类,最后对划分出的较大的社团进行用户的影响力价值分析。
优选的,所述用户的影响力价值分析具体如下:
社交网络传播网络的构建具体为:
用G(V,E)表示网站的用户关系网络,其中V表示用户节点的集合,E表示连接用户节点之间连边的集合E={ξij},ξij是连接vi和vj的边,vi,vj是网络中用户节点,如果这个边存在,则ξij的值为1,否则为0,i={1,2,...,Nc},j={1,2,...,Nc}其中Nc为网络中用户节点的总数。
优选的,用户的影响力价值分析具体包括:
重要性排序;主题热度分析;以及用户价值分类分析。
优选的,所述重要性排序具体为:对于节点vi其在网络中的重要影响力定义为:
H(i)=αD(i)+βB(i)+λCO(i)
其中,α,β,λ是式中的可调参数,D(i)表示节点vi的度中心性值,B(i)表示节点vi的介数中心性值,cO(i)表示节点vi的邻居节点间接贡献度。设定α>λ>β,且α+β+λ=1
为了能够方便的进行不同规模网络之间的比较,需要将参数指标进行归一化处理,消除因为网络规模大小带来的结果差异性影响,归一化公式如下:
H , ( i ) = H ( i ) Σ i ∈ n H ( i )
其中将所有节点计算的重要性结果指标统一在[0,1]之间。
优选的,所述主题热度分析具体为:
定义节点vi的兴趣度为:
I ( i ) = 1 k Σ j = 1 k g ( i ) j
其中g(i)j表示节点vi对应的第j个关注主题的热度值,k表示节点vi一共有k个对应的关注主题。
本发明的技术方案具有以下有益效果:
本发明的技术方案,社交网络中的论坛网站进行分析,从用户网络和主题网络两个方面构建网络分析网络中的相互联系;提出了综合用户直接影响力、控制力和间接用户贡献度三个方面因素的用户重要性量化计算方法,实现提高社交网络中重要用户识别准确度的优点。以便于结合用户对论坛主题的关注热度和关注主题数对用户进行分类,对高影响力用户采取集中营销和重点保护的措施,对低影响力的用户采取推荐朋友和论坛主题的措施增加其网络粘性。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明实施例所述的兴趣爱好网用户关系网络拓扑图;
图2为本发明实施例所述的智能社交网络推荐系统原理框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
一种智能社交网络推荐系统,包括
数据获取模块::对页面数据进行爬取并将数据分别存入数据库中;
数据处理模块::对网站的数据进行爬取构建用户为节点的社交网络,以用户之间的互动关系作为节点之间的边关系进行网络构建,网络中的用户有一次互动发生则产生一条用户关系连边,反之则没有连边,拥有连边的用户呈相邻关系,从而完成社交网络传播网络的构建;
通过社团划分算法对社交网络进行社团划分,根据不同社交网络中的侧重点选取影响指标对单个社团中具有相似特性的用户进行影响力排名分析,结合用户的兴趣标签分析将用户价值进行分类,最后对划分出的较大的社团进行用户的影响力价值分析。智能社交网络推荐系统如图2所示。
通过页面数据的爬取将数据对应用户ID、用户名、用户发帖时间、回复数、查看数、所属主题类别等字段分别存入数据库中,爬取数据包括若干用户,大类主题包含下的子类论坛主题,建立以同一主题下帖子互动情况为连边,通过用户节点ID编码建立关系边。
通过对网站的数据爬取构建用户为节点的社交网络,以用户之间的互动关系作为节点之间的边关系进行网络构建,网络中的用户有一次互动发生则产生一条用户关系连边,反之则没有连边,拥有连边的用户呈相邻关系,以兴趣爱好网为例,网络中包括508个节点和7732条边,如图1所示即为兴趣爱好网的用户网络结构图。
图1空心圆圈的节点代表度值为1的边缘节点,其在网络中影响力最低,通常作为无价值的用户节点。图中黑色节点即为网络中较为重要的节点,对整个网络的结构和网络信息的传播具有重要意义。图1中边的粗细程度代表用户之间的互动频繁程度,节点间边越粗表示用户之间的互动越紧密。整个网络以辐射状呈现出用户之间的复杂关系。
为了进一步研究社交网络的结构特性,需要对整个网络进行统计仿真分析,发现社交网络用户之间的紧密程度和相似关系,用G(V,E)表示网站的用户关系网络,其中V表示用户节点的集合,E表示连接用户节点之间;连边的集合。E={ξij},ξij=(vi,vj),ξij是连接vi和vj的边,vi,vj是网络中用户节点,如果这个边存在,则ξij的值为1,否则为0,i={1,2,...,Nc},j={1,2,...,Nc}其中Nc为网络中用户节点的总数。
社交网络基本元素描述:
社交网络中的主要组成部分包括节点、关系边、用户群、社团等基本概念。下面对构建的社交网络中的各基本元素逐一进行简单介绍。
节点:节点,指网络中的研究个体,社交网络中节点通常指的是实际的参与者,可以是网络中具有相互联系的个人、事物、集体等。根据节点多样性的原则,本课题中分别以用户和用户关注的兴趣为节点构建了两个网络,方便更全面的研究网络中用户的相互联系和兴趣爱好。
关系边:关系边,一般指节点和节点之间的连接关系,个体之间通过一定的联系连接组成网络。这种连接关系是多样性的,人与人之间的好友关系、共同的属性关系、互动关系等都是成为连接两个节点之间的关系边。社交网络中用户节点之间的关系紧密程度也是不同的,有些人之间的关系紧密,有些人之间的关系较为稀疏,所以应该给不同的关系引入不同的权重值进行区分。但为了简单计算,通常采用二元关系进行分析,即两个用户之间要么有关系,要么没有关系。用户之间的关系同等对待。
本课题构建的两个无向网络分别以用户和用户关注的兴趣作为节点。用户为节点的网络中用户在论坛中的互动关系即为网络中的节点之间的连接边,兴趣为节点的网络中以兴趣之间的共同用户作为连接边,兴趣之间的共同用户越多两个兴趣之间的紧密性越大,其关系边的权重值越大。
用户群:群体的概念是指网络中的一部分节点因为某种共同的关系或目的组成的团体。群里的成员可能来自同一个城市、同一个单位,或者关注相同的兴趣,有共同的爱好和谈论话题。
通过用户群能方便用户们找到更多有相同或相近关注领域的朋友,扩大朋友圈,利于彼此的互动交流。本课题中的用户群以用户互动交流的内容兴趣标签作为分群依据,在相同兴趣圈中有互动交流的用户作为一个群体,真实网络中用户的所关注的主题类别往往不止一个,一个用户常常分属不同的兴趣群。
社团:社团是网络中一部分节点的集合。社团结构和群不同的是其并不是通过某种共同目的或者共同的属性而组建起来的一些节点,社团是网络中的自然存在,反映的是网络的固有状态和属性。社交网络中同一社团中的用户可以有不同的属性、不同的目的,但是社团中的用户之间关系较为紧密,社团内部结构中边的密度比较大,社团之间联系较稀疏。课题中采用划分效果较为精细的层次聚类的方法将用户进行社团划分,找出网络结构中关系较为紧密的用户集合。
具体实施步骤如下:
1、社交网络数据的获取与处理:
(1)获取社交网络数据,通过页面数据的爬取将数据对应用户ID、用户名、用户发帖时间、回复数、查看数、所属主题类别等字段分别存入数据库中,建立以同一主题下帖子互动情况为连边,通过用户节点ID编码建立关系边。
(2)对爬取数据进行存储和管理。因匹配爬取的数据信息量较大,需要按照规定字段要求分别存储到本地对应的专设数据库中。因网页站点之间存在大量重复信息数据,为了便于后期的数据分析,在设计数据库时需要对网页进行排重处理。
2、构建社交网络的传播网络:
(1)选取社交网络、
通过研究目标网络的节点度分布、网络平均路径长度、聚类系数等,验证网络具有小世界、无标度、聚族性等特征,然后可利用复杂网络理论研究社交网络的结构特性。
(2)社交网络的社团划分
社交网络中的社团代表的是相似或相近兴趣的真实社交团体,通过社团的划分提取可以发现复杂网络中的埋藏的不易发觉的规律,找到网络中联系紧密的群簇,以便更好地预测网络的趋势导向。常用的社团划分算法有KL算法、谱二分法、GN算法等。
3、用户影响力价值分析、
用户根据其不同的网络影响力、关注主题兴趣等内容可以分为不同的几个价值分区。本发明综合用户的影响力指标、用户关注的主题数目、用户关注的主题兴趣度三个指标对用户进行价值的分类。用户影响力指标考察的是用户在论坛中的个人影响能力,即活跃程度;用户关注兴趣数考察的是该用户在论坛中的关注广度;用户的兴趣度指标考察的用户关注主题的热度。三个指标相互独立,且从三个方面综合考虑用户的价值特性。
(1)重要性排序
综合考虑了节点的度值、介数值、邻居节点的贡献度值。
对于节点vi其在网络中的重要影响力定义为:
H(i)=αD(i)+βB(i)+λCO(i)(1)
其中α,β,λ是式中的可调参数,D(i)表示节点vi的度中心性值,B(i)表示节点vi的介数中心性值,cO(i)表示节点vi的邻居节点间接贡献度。一般情况下为了平衡各个指标的大小关系,通常设定α>λ>β,且α+β+λ=1。在社交网络中侧重对用户直接影响力,因此可以适当调大α值,提出的网络节点重要性计算方法可以根据实际网络调整参数大小进行计算。例如在交通网络中需要侧重于找出网络中承载信息量较大的节点,可以将β值增大,减小α和λ值。在传染病网络中需要侧重于发现网络中易被传染的用户,控制疫情,这时候主要考虑邻居节点的间接影响力,因此需要将λ增大,减小α和β的值。
为了能够方便的进行不同规模网络之间的比较,需要将参数指标进行归一化处理,消除因为网络规模大小带来的结果差异性影响,归一化公式如下:
H , ( i ) = H ( i ) Σ i ∈ n H ( i ) - - - ( 2 )
其中将所有节点计算的重要性结果指标统一在[0,1]之间,方便不同网络的对比研究。
(2)主题热度分析
每个论坛中都有发帖的主题,并且根据地域、年龄、职业等不同因素用户关注的帖子主题类别有不同的差异,网络运营商通过充分了解论坛网络中用户的关注主题倾向,一是可以更好的寻找对应领域的广告合作商对热点领域相关产品进行推荐,二是通过热度统计分析了解用户的关注交流需求倾向,及时对论坛的功能和附加内容信息做调整,向用户推荐热门主题,便于增强用户的互动,增加用户在网络中的粘性。
主题热度的分析分为两个部分,一部分通过采集的数据中用户的互动情况为依据对论坛网络的主题热度做分析,第二部分是针对用户进行的主题热度分析。每个论坛中的用户都可能对一个或多个主题感兴趣并在感兴趣的主题下进行互动。可以通过对用户个人的关注主题分析了解论坛用户的舆论互动领域,了解用户对热门话题的关注程度。
不仅需要分析整个网络情况下的主题热度了解用户的兴趣倾向,同时也应该对用户个体的关注主题热度进行分析。关注热门主题的用户在网络中充当重要的角色,他们是网络的核心用户或者是具有挖掘潜能成为核心的可推荐型用户。本发明中定义兴趣度为用户对热门兴趣的关注程度。兴趣度表示的是该用户个体关注的主题热度的均值,论坛中用户的关注主题往往不止一个,有热门也有冷门,因此通过采集数据中整理每个用户对应的关注主题类别,结合分析的各主题热度值对用户的兴趣度进行计算。以求均值的方式避免了因为用户关注兴趣数目的不同造成的兴趣度差异影响。定义节点vi的兴趣度为:
I ( i ) = 1 k Σ j = 1 k g ( i ) j - - - ( 3 )
式3中g(i)j表示节点vi对应的第j个关注主题的热度值,k表示节点vi一共有k个对应的关注主题。
(3)用户价值分类分析
用户关注主题的热度分析不能全面的将用户进行分类,因此可以结合用户影响力和用户关注主题数对论坛网络中的用户进行更为全面和细致的价值划分。分别对论坛网络中的用户进行三个指标值的计算,以均值作为划分的依据。可将用户分为7个类别,在实际的社交网络分析中可能会缺少其中的几类用户。如下表1所示用户的划分设置。
表1、用户的划分设置表:
用户类别 用户影响力 兴趣数 兴趣度 用户级别
1 重要VIP保护用户
2 爱好广泛型重要用户
3 集中偏好型重要用户
4 桥梁型重要用户
5 桥梁型一般用户
6 推荐型一般用户
7 推荐型一般用户型
8 无价值用户
如表1所示的划分设置,重要VIP保护用户是整个论坛网络中最具价值的用户,对于论坛运营商、网络监管人员和合作广告商都是非常重要的保护对象。论坛运营商可以通过VIP保护用户凝聚论坛网络的人气活跃性,广告商在成本投入有限、推广时间有限的情况下选择VIP用户进行集中推荐可以达到高效的推广效果,网络监管人员可以通过重要VIP用户控制网络中不良信息言论的传播,通过监控重要VIP用户的互动情况和互动方向来监控整个网络中舆论的导向。
爱好广泛型重要用户和集中偏好型重要用户在网络中具有较高的影响力,是必须重点关注的用户群体,针对爱好广泛型重要用户,其关注范围广,但关注的冷门主题较多,论坛运营商可以通过这一群体的用户达到凝聚整个网络的作用,将论坛中一些不相关的冷门主题下的用户进行关联,增加整个论坛网络的互动紧密性。同时监管部门也可以通过这部分用户控制信息传播,达到监管网络舆论的目的。针对集中偏好型用户,其关注范围较窄,关注领域较为集中,关注热门主题并且论坛中较为互动较为活跃。广告运营商们可以通过此类用户进行特定领域的产品信息推广,通过集中偏好型用户的“口碑效应”达到迅速推广的效果。
桥梁型用户,作为连接热门主题或者重要用户的桥梁而受到网络监管部门的重视,这部分用户数量非常少,但是在网络中具有不可或缺的作用。桥梁型重要用户,其影响力较大但是关注的主题兴趣较少和冷门,表示其与冷门主题中的重要用户互动联系较为紧密,因此,网络监管部门可以通过这部分用户迅速切断重要用户之间的传播联系,控制不良信息的传播速度和范围。桥梁型一般用户其网络影响力较低,但其关注的主题数较多且都很热门,这样的用户是连接热门主题之间互动联系的纽带,通过他们可以分析出热门主题之间的发展趋势,在一定程度上对预测网络中的未来舆论主题导向有一定的作用。
推荐型一般用户,在网络中的影响力都较低,属于具有潜能的可挖掘用户型用户。他们具有广泛的爱好关注或者关注领域的热度较高,可以通过推荐提升他们的网络影响力。论坛运营商主要针对这类用户进行论坛内兴趣主题的推荐或互动用户的推荐,以提高整个论坛网络的影响力,为吸引更多的论坛用户和合作广告商奠定基础。对于网络中关注范围广的低影响力用户,其关注的领域较为广泛,论坛运营商应当向其推荐论坛中的热门主题,通过在热门主题下互动交流提高其在网络中的影响力。对于网络中关注主题热度较高的低影响力用户,其关注的领域较为集中,可以向其推荐论坛中具有相似兴趣爱好主题的用户,增加其与用户的交流互动来增加其在网络中的个人影响力。
无价值用户,其网络影响力较低,关注主题较少且较为冷门。在广告商和运营商需要快速、高效推广信息和监控网络时其属于无价值的用户,不需要做过多的推荐和保护工作。
论坛运营监管商和合作广告商可以通过对用户价值分析的分类结果,选择重要用户进行推荐和保护监管,高效地进行信息推介;同时进行进一步挖掘出低影响力用户中有可推荐性潜能的一般用户,针对划分结果推荐对应的用户或论坛主题,提高论坛中用户的影响力,增加用户活跃度和粘性,逐步扩大整个论坛的影响力。
其中,(1)度中心性(degreecentrality),主要是从节点与周边节点关联性的角度,考察节点的直接连接数从而判断节点在网络的个体影响力。度中心性(degreecentrality)认为一个节点所连接的节点数量越多,则该节点在网络中的影响力最大,社会网络中可以理解为拥有众多社交朋友的人其影响力较大。网络中节点Vi的度值记为ki,其表示网络中直接与该节点相连的节点的数目。度的中心性表现的是节点在网络中的直接影响力。但是相同度值的节点在不同的网络中其影响力不一定相同,为了利用度值指标衡量比较不同网络大小规模中的节点的影响力,将节点的度值进行归一化表示,即为度中心性指标,可记为如下计算公式:
D C ( i ) = k i n - 1 , 其中 k i = Σ i a i j - - - ( 4 )
式中aij代表整个网络邻接矩阵中第i行的第j列的元素,表示将第i行所包含的所有i列函数相加,即表示节点Vi的所连边数目。N为网络的节点数,分母的n-1表示节点Vi可能存在的最大度值。
通过度中心性指标的计算可以简单直观地进行节点的重要性排序。
2.介数中心性(betweennesscentrality),属于基于路径排序法中较为常用的排序指标。介数是由Freeman提出的社会网络中衡量个体地位的参数。介数表示网络中所有节点对经过的最短路径中经过一个节点的路径概率。概率值越高则该节点在整个网络结构中越重要。介数主要从信息流的角度分析节点在网络中的控制力,节点vi的介数值有如下公式计算:
B C ( i ) = Σ i ≠ j , i ≠ k , j ≠ k g j k i g j k - - - ( 5 )
其中gjk表示整个网络中所有节点对的最短路径数目,表示的是网络中所有节点对的最短路径中经过节点vi的最短路径数目。当处于星状网络的外缘节点时,节点的介数中心性值为零。在含有n个节点的网络中,节点的介数最大可能值即为处于星状网络的中心位置节点的介数值,即较多的节点对之间的最短路径都会经过该中心节点,因此可以将介数归一化消除网络大小对指标值的影响,归一化后的介数计算公式如下:
BC w ( i ) = 2 ( n - 1 ) ( n - 2 ) Σ i ≠ j , i ≠ k , j ≠ k g j k i g j k - - - ( 6 )
介数中心性更多的从网络全局的角度考虑对节点的重要性进行量化计算排序。节点的介数中心性指标值越高,这个节点在网络中的影响力就越大,在社交网络中则表现为某个用户在关系网络中的信息承载量和对网络信息传播的掌控能力。用介数中心性指标能准确的找到某些承载信息量很大的重要节点。
3.紧密中心性(closenesscentrality),也称为接近中心性,也是基于路径排序法中较为常见的节点重要性考察指标,通过计算节点与网络中其他节点的的最短路径长度之和来判定节点的中心性,表现了信息流从该节点向整个网络传播的速度,因此紧密中心性也可以理解为利用信息流在网络中的传播时长老判断节点重要性大小。
为了消除网络节点距离中出现的奇异值,一般采用节点到网络中其他节点距离的均值作为该节点的紧密度中心性。节点的vi到网络中其他节点的平均路径长度如公式(7)所示:
d i = Σ j ≠ i d i j n - 1 - - - ( 7 )
其中dij表示节点vi到节点vj的最短路径长度,di的值越小代表节点在网络中越重要,在连通网络中取di的倒数定义为节点vi的紧密度中心性,如公式(8):
C C ( i ) = 1 d i = n - 1 Σ j ≠ i d i j - - - ( 8 ) .
4.在计算邻居节点贡献度时采用紧密度值作为又一影响因子。节点vi的邻居节点贡献度取其所有邻居节点对其的贡献度的加权和来表示。对于有n个节点的网络中,节点vi其邻居节点vj对其的间接影响贡献度表示为:
C h ( i ) = Σ j = 1 n B ( j ) C ( j ) , i ≠ j - - - ( 9 )
其中B(j)表示节点vj的介数,C(j)表示的是节点vj的紧密度指标,取节点vj的紧密度1/C(j)贡献给其相邻的节点。相邻节点距均为1,介数一定的情况下,网络紧密度越高的点对其邻居节点的贡献度越小。在此不考虑非相邻节点对该节点的贡献度,认为其值均为零。当节点vi的邻居节点处于网络边缘时,即介数中心性为零,则其对vi的影响力贡献度为零。
为了比较不同规模网络大小的节点间接影响力,需要对公式进行标准化,消除网络大小对指标计算结果的影响,在节点数为n个的网络中,一个节点的邻居节点最大可能数为n-1,因此对于节点vi其得到的邻居节点的间接影响力表示为:
C o ( i ) = 1 n - 1 Σ j = 1 n B ( j ) C ( j ) , i ≠ j - - - ( 10 ) .
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种智能社交网络推荐系统,其特征在于,
包括
数据获取模块:对页面数据进行爬取并将数据分别存入数据库中;
数据处理模块:对网站的数据进行爬取构建用户为节点的社交网络,以用户之间的互动关系作为节点之间的边关系进行网络构建,网络中的用户有一次互动发生则产生一条用户关系连边,反之则没有连边,拥有连边的用户呈相邻关系,从而完成社交网络传播网络的构建;
通过社团划分算法对社交网络进行社团划分,根据不同社交网络中的侧重点选取影响指标对单个社团中具有相似特性的用户进行影响力排名分析,结合用户的兴趣标签分析将用户价值进行分类,最后对划分出的较大的社团进行用户的影响力价值分析。
2.根据权利要求1所述的智能社交网络推荐系统,其特征在于,所述用户的影响力价值分析具体如下:
社交网络传播网络的构建具体为:
用G(V,E)表示网站的用户关系网络,其中V表示用户节点的集合,E表示连接用户节点之间连边的集合E={ξij},ξij是连接vi和vj的边,vi,vj是网络中用户节点,如果这个边存在,则ξij的值为1,否则为0,i={1,2,...,Nc},j={1,2,...,NC}其中Nc为网络中用户节点的总数。
3.根据权利要求2所述的智能社交网络推荐系统,其特征在于,
用户的影响力价值分析具体包括:
重要性排序;主题热度分析;以及用户价值分类分析。
4.根据权利要求3所述的智能社交网络推荐系统,其特征在于,所述重要性排序具体为:对于节点vi其在网络中的重要影响力定义为:
H(i)=αD(i)+βB(i)+λCO(i)
其中,α,β,λ是式中的可调参数,D(i)表示节点vi的度中心性值,B(i)表示节点vi的介数中心性值,cO(i)表示节点vi的邻居节点间接贡献度。设定α>λ>β,且α+β+λ=1
为了能够方便的进行不同规模网络之间的比较,需要将参数指标进行归一化处理,消除因为网络规模大小带来的结果差异性影响,归一化公式如下:
其中将所有节点计算的重要性结果指标统一在[0,1]之间。
5.根据权利要求3所述的智能社交网络推荐系统,其特征在于,所述主题热度分析具体为:
定义节点vi的兴趣度为:
其中g(i)j表示节点vi对应的第j个关注主题的热度值,k表示节点vi一共有k个对应的关注主题。
CN201510461144.1A 2015-07-30 2015-07-30 智能社交网络推荐系统 Active CN105117422B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510461144.1A CN105117422B (zh) 2015-07-30 2015-07-30 智能社交网络推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510461144.1A CN105117422B (zh) 2015-07-30 2015-07-30 智能社交网络推荐系统

Publications (2)

Publication Number Publication Date
CN105117422A true CN105117422A (zh) 2015-12-02
CN105117422B CN105117422B (zh) 2018-08-24

Family

ID=54665412

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510461144.1A Active CN105117422B (zh) 2015-07-30 2015-07-30 智能社交网络推荐系统

Country Status (1)

Country Link
CN (1) CN105117422B (zh)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868447A (zh) * 2016-03-24 2016-08-17 南京邮电大学 基于双层网络的用户通讯行为分析及模型仿真系统
CN106230973A (zh) * 2016-08-30 2016-12-14 南京邮电大学 一种基于社交网络的文件共享方法
CN106384292A (zh) * 2016-09-14 2017-02-08 哈尔滨工业大学(威海) 社交网络用户关系采集系统及方法
CN106789338A (zh) * 2017-01-18 2017-05-31 北京航空航天大学 一种在动态大规模社交网络中发现关键人物的方法
CN106874509A (zh) * 2017-03-01 2017-06-20 广州大学 基于中粒度用户分组的资源推荐方法及装置
CN107045536A (zh) * 2017-02-04 2017-08-15 武汉快舟科技有限公司 一种社交网络排名方法
WO2018010559A1 (zh) * 2016-07-11 2018-01-18 阿里巴巴集团控股有限公司 一种对象选择方法和装置
CN107705212A (zh) * 2017-07-07 2018-02-16 江苏开放大学 一种基于粒子群随机游走的角色识别方法
CN107809363A (zh) * 2016-08-30 2018-03-16 腾讯科技(深圳)有限公司 一种网络信息传播控制方法和装置
WO2018077301A1 (zh) * 2016-10-31 2018-05-03 中国科学技术大学先进技术研究院 账号筛选方法和装置
CN108205589A (zh) * 2017-12-29 2018-06-26 成都优易数据有限公司 一种热度迭代计算方法
CN108268566A (zh) * 2017-01-04 2018-07-10 腾讯科技(深圳)有限公司 一种数据关系确定方法及装置
CN108462610A (zh) * 2018-03-27 2018-08-28 西京学院 一种具有跨邻居传播能力的信息辐射模型构建方法
CN109543108A (zh) * 2018-11-26 2019-03-29 中国人民解放军陆军工程大学 面向网络多域信息的用户角色挖掘系统
CN109688167A (zh) * 2017-10-13 2019-04-26 中国移动通信集团安徽有限公司 数据处理方法、装置、设备及计算机存储介质
CN109828998A (zh) * 2019-01-14 2019-05-31 中国传媒大学 基于核心群体挖掘和意见领袖识别结果的分群方法及系统
CN110020146A (zh) * 2017-11-27 2019-07-16 香港城市大学深圳研究院 信息投放方法和装置
CN110020334A (zh) * 2017-07-27 2019-07-16 腾讯科技(深圳)有限公司 一种用户人群扩散方法及装置
CN110213164A (zh) * 2019-05-21 2019-09-06 南瑞集团有限公司 一种基于拓扑信息融合的识别网络关键传播者的方法及装置
CN110851664A (zh) * 2019-11-06 2020-02-28 中国人民解放军国防科技大学 一种面向主题的社交网络节点重要度评估方法
CN111178678A (zh) * 2019-12-06 2020-05-19 中国人民解放军战略支援部队信息工程大学 基于社团影响力的网络节点重要性评估方法
CN111291904A (zh) * 2020-02-06 2020-06-16 腾讯科技(深圳)有限公司 偏好预测方法、装置及计算机设备
CN111723298A (zh) * 2020-05-11 2020-09-29 珠海高凌信息科技股份有限公司 基于改进标签传播的社交网络社团发现方法、装置及介质
CN111988129A (zh) * 2019-05-21 2020-11-24 中移(苏州)软件技术有限公司 影响力最大化数据集处理方法、装置和系统
CN112184051A (zh) * 2020-10-13 2021-01-05 中国工程物理研究院计算机应用研究所 一种基于社交网络分析技术的员工工作考察方法
CN112307353A (zh) * 2020-12-28 2021-02-02 北京达佳互联信息技术有限公司 数据的处理方法、装置、电子设备、存储介质
CN112612942A (zh) * 2020-12-29 2021-04-06 河海大学 一种基于社交大数据的基金推荐系统及方法
CN112650862A (zh) * 2020-12-10 2021-04-13 北京爱笔科技有限公司 兴趣网络的构建方法、装置、电子设备及计算机存储介质
CN112800300A (zh) * 2021-03-19 2021-05-14 湖南人文科技学院 一种基于社交网络的数据采集与分析系统
CN113032636A (zh) * 2019-12-25 2021-06-25 中移动信息技术有限公司 完全子图数据的搜索方法、装置、设备及介质
CN114143571A (zh) * 2019-03-19 2022-03-04 广州虎牙信息科技有限公司 一种用户处理方法、装置、设备和存储介质
CN115797871A (zh) * 2022-12-22 2023-03-14 廊坊师范学院 一种幼儿同伴社会网络的分析方法及系统
TWI807243B (zh) * 2021-01-12 2023-07-01 統一超商股份有限公司 結合集資活動的線上社群系統與處理方法
WO2024114517A1 (zh) * 2022-11-29 2024-06-06 中电信数智科技有限公司 一种基于Louvain算法的内容推荐方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024017A (zh) * 2012-12-04 2013-04-03 武汉大学 一种社交网络重要目标及社区群体识别方法
CN103793489A (zh) * 2014-01-16 2014-05-14 西北工业大学 一种在线社交网络中社群话题的发现方法
CN104268271A (zh) * 2014-10-13 2015-01-07 北京建筑大学 一种兴趣和网络结构双内聚的社交网络社区发现方法
CN104731962A (zh) * 2015-04-03 2015-06-24 重庆邮电大学 一种社交网络中基于相似社团的好友推荐方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024017A (zh) * 2012-12-04 2013-04-03 武汉大学 一种社交网络重要目标及社区群体识别方法
CN103793489A (zh) * 2014-01-16 2014-05-14 西北工业大学 一种在线社交网络中社群话题的发现方法
CN104268271A (zh) * 2014-10-13 2015-01-07 北京建筑大学 一种兴趣和网络结构双内聚的社交网络社区发现方法
CN104731962A (zh) * 2015-04-03 2015-06-24 重庆邮电大学 一种社交网络中基于相似社团的好友推荐方法及系统

Cited By (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868447B (zh) * 2016-03-24 2019-05-24 南京邮电大学 基于双层网络的用户通讯行为分析及模型仿真系统
CN105868447A (zh) * 2016-03-24 2016-08-17 南京邮电大学 基于双层网络的用户通讯行为分析及模型仿真系统
WO2018010559A1 (zh) * 2016-07-11 2018-01-18 阿里巴巴集团控股有限公司 一种对象选择方法和装置
CN107809363A (zh) * 2016-08-30 2018-03-16 腾讯科技(深圳)有限公司 一种网络信息传播控制方法和装置
CN106230973A (zh) * 2016-08-30 2016-12-14 南京邮电大学 一种基于社交网络的文件共享方法
CN106230973B (zh) * 2016-08-30 2019-05-21 南京邮电大学 一种基于社交网络的文件共享方法
CN106384292A (zh) * 2016-09-14 2017-02-08 哈尔滨工业大学(威海) 社交网络用户关系采集系统及方法
WO2018077301A1 (zh) * 2016-10-31 2018-05-03 中国科学技术大学先进技术研究院 账号筛选方法和装置
US11468521B2 (en) 2016-10-31 2022-10-11 Tencent Technology (Shenzhen) Company Limited Social media account filtering method and apparatus
CN108268566A (zh) * 2017-01-04 2018-07-10 腾讯科技(深圳)有限公司 一种数据关系确定方法及装置
CN106789338B (zh) * 2017-01-18 2020-10-30 北京航空航天大学 一种在动态大规模社交网络中发现关键人物的方法
CN106789338A (zh) * 2017-01-18 2017-05-31 北京航空航天大学 一种在动态大规模社交网络中发现关键人物的方法
CN107045536A (zh) * 2017-02-04 2017-08-15 武汉快舟科技有限公司 一种社交网络排名方法
CN106874509A (zh) * 2017-03-01 2017-06-20 广州大学 基于中粒度用户分组的资源推荐方法及装置
CN106874509B (zh) * 2017-03-01 2020-02-07 广州大学 基于中粒度用户分组的资源推荐方法及装置
CN107705212A (zh) * 2017-07-07 2018-02-16 江苏开放大学 一种基于粒子群随机游走的角色识别方法
CN107705212B (zh) * 2017-07-07 2021-06-15 江苏开放大学 一种基于粒子群随机游走的角色识别方法
CN110020334A (zh) * 2017-07-27 2019-07-16 腾讯科技(深圳)有限公司 一种用户人群扩散方法及装置
CN110020334B (zh) * 2017-07-27 2022-12-09 腾讯科技(深圳)有限公司 一种用户人群扩散方法及装置
CN109688167A (zh) * 2017-10-13 2019-04-26 中国移动通信集团安徽有限公司 数据处理方法、装置、设备及计算机存储介质
CN109688167B (zh) * 2017-10-13 2022-07-01 中国移动通信集团安徽有限公司 数据处理方法、装置、设备及计算机存储介质
CN110020146A (zh) * 2017-11-27 2019-07-16 香港城市大学深圳研究院 信息投放方法和装置
CN110020146B (zh) * 2017-11-27 2021-03-02 香港城市大学深圳研究院 信息投放方法和装置
CN108205589A (zh) * 2017-12-29 2018-06-26 成都优易数据有限公司 一种热度迭代计算方法
CN108462610A (zh) * 2018-03-27 2018-08-28 西京学院 一种具有跨邻居传播能力的信息辐射模型构建方法
CN109543108A (zh) * 2018-11-26 2019-03-29 中国人民解放军陆军工程大学 面向网络多域信息的用户角色挖掘系统
CN109828998A (zh) * 2019-01-14 2019-05-31 中国传媒大学 基于核心群体挖掘和意见领袖识别结果的分群方法及系统
CN109828998B (zh) * 2019-01-14 2021-05-25 中国传媒大学 基于核心群体挖掘和意见领袖识别结果的分群方法及系统
CN114143571A (zh) * 2019-03-19 2022-03-04 广州虎牙信息科技有限公司 一种用户处理方法、装置、设备和存储介质
CN114143571B (zh) * 2019-03-19 2024-01-19 广州虎牙信息科技有限公司 一种用户处理方法、装置、设备和存储介质
CN110213164A (zh) * 2019-05-21 2019-09-06 南瑞集团有限公司 一种基于拓扑信息融合的识别网络关键传播者的方法及装置
CN111988129A (zh) * 2019-05-21 2020-11-24 中移(苏州)软件技术有限公司 影响力最大化数据集处理方法、装置和系统
CN110213164B (zh) * 2019-05-21 2021-06-08 南瑞集团有限公司 一种基于拓扑信息融合的识别网络关键传播者的方法及装置
CN111988129B (zh) * 2019-05-21 2022-07-01 中移(苏州)软件技术有限公司 影响力最大化数据集处理方法、装置和系统
CN110851664A (zh) * 2019-11-06 2020-02-28 中国人民解放军国防科技大学 一种面向主题的社交网络节点重要度评估方法
CN110851664B (zh) * 2019-11-06 2023-08-15 中国人民解放军国防科技大学 一种面向主题的社交网络节点重要度评估方法
CN111178678A (zh) * 2019-12-06 2020-05-19 中国人民解放军战略支援部队信息工程大学 基于社团影响力的网络节点重要性评估方法
CN111178678B (zh) * 2019-12-06 2022-11-08 中国人民解放军战略支援部队信息工程大学 基于社团影响力的网络节点重要性评估方法
CN113032636A (zh) * 2019-12-25 2021-06-25 中移动信息技术有限公司 完全子图数据的搜索方法、装置、设备及介质
CN111291904A (zh) * 2020-02-06 2020-06-16 腾讯科技(深圳)有限公司 偏好预测方法、装置及计算机设备
CN111291904B (zh) * 2020-02-06 2023-04-18 腾讯科技(深圳)有限公司 偏好预测方法、装置及计算机设备
CN111723298A (zh) * 2020-05-11 2020-09-29 珠海高凌信息科技股份有限公司 基于改进标签传播的社交网络社团发现方法、装置及介质
CN111723298B (zh) * 2020-05-11 2023-09-29 珠海高凌信息科技股份有限公司 基于改进标签传播的社交网络社团发现方法、装置及介质
CN112184051A (zh) * 2020-10-13 2021-01-05 中国工程物理研究院计算机应用研究所 一种基于社交网络分析技术的员工工作考察方法
CN112650862A (zh) * 2020-12-10 2021-04-13 北京爱笔科技有限公司 兴趣网络的构建方法、装置、电子设备及计算机存储介质
CN112650862B (zh) * 2020-12-10 2024-02-02 北京爱笔科技有限公司 兴趣网络的构建方法、装置、电子设备及计算机存储介质
CN112307353A (zh) * 2020-12-28 2021-02-02 北京达佳互联信息技术有限公司 数据的处理方法、装置、电子设备、存储介质
CN112612942B (zh) * 2020-12-29 2022-09-23 河海大学 一种基于社交大数据的基金推荐系统及方法
CN112612942A (zh) * 2020-12-29 2021-04-06 河海大学 一种基于社交大数据的基金推荐系统及方法
TWI807243B (zh) * 2021-01-12 2023-07-01 統一超商股份有限公司 結合集資活動的線上社群系統與處理方法
CN112800300B (zh) * 2021-03-19 2023-09-12 湖南人文科技学院 一种基于社交网络的数据采集与分析系统
CN112800300A (zh) * 2021-03-19 2021-05-14 湖南人文科技学院 一种基于社交网络的数据采集与分析系统
WO2024114517A1 (zh) * 2022-11-29 2024-06-06 中电信数智科技有限公司 一种基于Louvain算法的内容推荐方法
CN115797871A (zh) * 2022-12-22 2023-03-14 廊坊师范学院 一种幼儿同伴社会网络的分析方法及系统

Also Published As

Publication number Publication date
CN105117422B (zh) 2018-08-24

Similar Documents

Publication Publication Date Title
CN105117422B (zh) 智能社交网络推荐系统
Dong et al. New energy-driven construction industry: Digital green innovation investment project selection of photovoltaic building materials enterprises using an integrated fuzzy decision approach
Jain et al. Discover opinion leader in online social network using firefly algorithm
CN111125453B (zh) 基于子图同构的社交网络中意见领袖角色识别方法及存储介质
CN107808278A (zh) 一种基于稀疏自编码器的Github开源项目推荐方法
Xu et al. Identifying valuable customers on social networking sites for profit maximization
German et al. Predicting factors affecting the intention to use a 3PL during the COVID-19 pandemic: A machine learning ensemble approach
Cui et al. Text mining to explore the influencing factors of sharing economy driven digital platforms to promote social and economic development
CN108053050A (zh) 点击率预估方法、装置、计算设备及存储介质
Li SWOT analysis of e‐commerce development of rural tourism farmers' professional cooperatives in the era of big data
Leng et al. Interpretable recommender system with heterogeneous information: A geometric deep learning perspective
Yigit et al. Extended topology based recommendation system for unidirectional social networks
Zhang et al. Hybrid TODIM method for law enforcement possibility evaluation of judgment debtor
Sun et al. Leveraging friend and group information to improve social recommender system
Zou et al. Collaborative community-specific microblog sentiment analysis via multi-task learning
Zhang et al. Analyzing the coevolution of mobile application diffusion and social network: a multi-agent model
Fateminia et al. An adaptive hybrid model for determining subjective causal relationships in fuzzy system dynamics models for analyzing construction risks
Hassan et al. Performance analysis of neural networks-based multi-criteria recommender systems
Cai et al. An extension of social network group decision-making based on trustrank and personas
Wei et al. Using network flows to identify users sharing extremist content on social media
Zhang et al. Using social network analysis to identify the critical factors influencing residents’ green consumption behavior
Zhang et al. Detecting incentivized review groups with co-review graph
Zheng et al. Identifying labor market competitors with machine learning based on maimai platform
Li et al. Evaluation of nursing homes using a novel PROMETHEE method for probabilistic linguistic term sets
Zhao et al. Detecting fake reviews via dynamic multimode network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant