CN112487304A - 基于观点向量化的影响力传播模型的建立方法 - Google Patents
基于观点向量化的影响力传播模型的建立方法 Download PDFInfo
- Publication number
- CN112487304A CN112487304A CN202011350826.2A CN202011350826A CN112487304A CN 112487304 A CN112487304 A CN 112487304A CN 202011350826 A CN202011350826 A CN 202011350826A CN 112487304 A CN112487304 A CN 112487304A
- Authority
- CN
- China
- Prior art keywords
- user
- viewpoint
- influence
- tendency
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000009193 crawling Effects 0.000 claims abstract description 8
- 238000005295 random walk Methods 0.000 claims abstract description 6
- 230000000694 effects Effects 0.000 claims abstract description 4
- 230000002996 emotional effect Effects 0.000 claims description 30
- 239000013598 vector Substances 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000009792 diffusion process Methods 0.000 claims description 8
- 230000008451 emotion Effects 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000000644 propagated effect Effects 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 241000700605 Viruses Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000011273 social behavior Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于观点向量化的影响力传播模型的建立方法。现有方法存在着局限性,模型无法有效的计算用户之间的影响力,通常只能在单一的社交网络或者群体环境中有着一定的效果。本发明方法首先爬取社交网络中用户原创内容的相关信息,并建立基于观点影响力的传播网络;利用随机游走,搜寻影响力传播网络中的与用户观点一致的局部影响用户集合;然后根据观点相似性,搜寻影响力传播网络中与用户观点相似的全局影响用户集合;搜寻影响力传播网络中与用户观点相反的用户集合;最后建立基于观点的影响力传播模型。本发明方法考虑了与用户观点相反的影响用户集合,能够建立更为准确反映基于观点下的影响力传播模型。
Description
技术领域
本发明属于互联网技术领域,尤其是社交网络分析技术领域,具体涉及一种基于观点向量化的影响力传播模型的建立方法。
背景技术
社交网络影响力是个人在互联网平台中,通过发表或转发观点内容,从而影响到其他用户行为的一种体现,具体表现在点赞、转发等。近年来,随着计算机技术的快速发展和普及,越来越多的用户通过在推特(Twitter)、微博等社交网络平台上发表观点、传播内容,并影响到其他用户。围绕着用户之间的社交影响力这一方面,研究人员展开了大量的工作,并实现了多种应用,包括市场营销、广告投放和舆情控制等诸多领域。
信息、观点或情感的接受、融合及扩散是社交网络中的基本过程,可以通过社交行为,如转发等,进行广泛的传播,从而影响到更大规模的用户。在许多应用,诸如病毒式营销中,为了使影响力达到最大化,往往需要发现用户之间的影响力强度,建立相应的影响力传播模型。社交网络中的影响力传播取决于多种因素,包括用户之间的属性差异,用户之间的兴趣相似以及时间因素等。以往的研究方法中,为了建立影响力传播模型,研究人员通常将模型定义为预测用户之间的边的权重,该权重即表示用户之间的影响力。然而,这种方法存在许多局限性。首先,边的定义存在着局限性,只有当用户之间存在关注关系,或者说用户之间有着相应的交互,才能确定一条边的存在,因此,这种方法无法预测全体用户之间的影响力;其次,虽然在社交网络存在大量的边,但相较于全体用户数量来说,边的数据依旧是稀疏的,模型无法有效的计算用户之间的影响力;最后,许多通过边来计算影响力的方法,是通过挖掘社交网络中的强特征来实现的,这种方法没有普适性,通常只能在单一的社交网络或者群体环境中有着一定的效果。
发明内容
本发明的目的是针对现有方法中存在的问题,提供一种基于观点向量化的影响力传播模型的建立方法,利用随机游走,搜寻用户影响到的局部近邻用户集合,并考虑社交网络的全局性,搜寻与用户观点相似的全局性用户集合。另外,考虑到观点有着正反的相对性,本发明搜寻与用户观点相对的用户集合。最终,在词向量和节点向量化的思想下,利用搜寻到的用户集合作为观点影响力的上下文,并建立观点影响力传播计算模型。
本发明方法包括如下步骤:
步骤A.爬取社交网络中用户原创内容的相关信息,并建立基于观点影响力的传播网络;
步骤B.利用随机游走,搜寻影响力传播网络中的与用户观点一致的局部影响用户集合;
步骤C.根据观点相似性,搜寻影响力传播网络中与用户观点相似的全局影响用户集合;
步骤D.搜寻影响力传播网络中与用户观点相反的用户集合;
步骤E.建立基于观点的影响力传播模型。
进一步,步骤A首先利用scrapy模块创建爬虫,对社交网络进行数据爬取,包括用户的原创、转发、关注关系以及相应的操作时间;然后根据用户的转发关系,建立观点影响力传播网络;定义一个观点的影响力传播网络,该传播网络的所有用户对同一内容均进行了转发,并发表了自己的观点,这些观点有些是相同的,有些是相反的。根据关注关系网络、观点信息和转发时间,建立观点影响力的传播网络;具体如下:
A1.根据用户关系,建立用户之间的网络结构图G=(V,E),其中V属于全体用户集合,为节点集,E表示用户之间的关系,为有向边集;
A2.对原创内容d,利用主题提取工具提取主题内容,并用情感分析工具分析情感倾向,将主题和情感倾向结合,得到原创的观点;
A3.对所有转发该原创内容且带有评论内容的转发,利用情感分析工具分析评论内容的情感倾向,并结合原创内容的主题,得到评论内容的观点;
A4.在网络结构G中,选择转发d且观点一致的用户集合Vd,Vd∈V,并按照转发时间,选择影响关系集合Ed,Ed∈E;具体来说,假设用户v关注了用户u,以有向边(u,v)∈E表示,u和v都转发了d且观点一致,u的转发时间比v更早,那么将关系(u,v)放入影响关系集合Ed中,(u,v)∈Ed,否则最终得到原创内容d的观点影响力传播网络Gd=(Vd,Ed)。
进一步,步骤B是在观点影响力传播网络Gd=(Vd,Ed)中,利用随机游走来查找与用户观点一致的局部近邻用户集合;定义搜索的参数:扩散概率p和回退概率q;假设当前用户位置处于节点u,扩散概率p是指下一步传播到节点u的邻接点的概率,回退概率q是指在传播到邻接点后回退到节点u的概率,综合深度遍历和广度遍历的优点;具体如下:
B1.定义需要搜集到的用户u的影响近邻集合为NLd(u),初始化为空,并设置集合数量最大值为nl,令当前位置处于节点u,设置回退概率q,取q=0.3~0.6;
B2.设置扩散概率p为当前位置节点的邻接点数量之和的倒数,按照p随机选择一个当前位置节点的近邻节点v,且v没有被标记访问,将v添加到集合NLd(u)中,标记v已被访问,并将当前位置移动到v上;
B3.根据回退概率q,如果达到了回退条件,则将当前位置回退,否则,进入步骤B4;
B4.如果集合NLd(u)达到nl,则返回NLd(u)并结束步骤B,否则,进入步骤B2。
进一步,步骤C是根据观点相似性,在观点影响力传播网络Gd=(Vd,Ed)中搜寻全局性的影响用户集。定义用户u的影响全局集合为NGd(u),初始化为空,并设置集合数量最大值为ng;具体如下:
C1.从Vd中随机选择一个节点v,且v不在集合NLd(u)和NGd(u)中;
C2.将节点v添加到集合NGd(u)中;
C3.如果集合NGd(u)元素数量达到ng,则返回NGd(u)并结束步骤C,否则,进入步骤C1。
进一步,步骤D是考虑观点具有正反性的特点,即用户即使转发了原创内容d,但如果是评论中带有相反的观点意见,那么该转发观点对用户的影响力趋近于无穷小。定义与用户u在原创内容d上观点相反的用户集合为NRd(u),初始化为空,并设置集合元素最大数量为nr;具体如下:
D1.提取原创内容d中的主题和情感倾向,组合成d的观点倾向;
D2.如果用户u是原创内容d的原创作者,则用户u的观点以d的观点倾向表示,并转到步骤D5,否则,进入步骤D3;
D3.如果用户u转发了原创内容d,且没有发表评论内容,则用户u的观点以d的观点倾向表示,并转到D5,否则,进入步骤D4;
D4.用户u转发了原创内容d,且发表评论内容,利用情感分析工具分析评论内容的情感倾向,并与提取的d中的主题组合,表示用户u的观点倾向;
D5.定义所有转发d的用户集合Ud;
D6.遍历集合Ud,对所遍历的用户u′提取情感倾向,并与d的主题内容结合,得到用户u′的观点倾向;
D7.如果u′的观点倾向和u的观点倾向不一致,则将u′添加至集合NRd(u)中,否则进入步骤D8;
D8.如果集合NRd(u)的数量达到nr,则结束遍历,否则,返回D6。
进一步,步骤E是根据步骤B、步骤C、步骤D所得到的三个用户集合,并根据节点向量化的思想所建立的。定义从所有原创内容中提取的观点集合为O={o1,o2,o3,…,oN},on表示第n个观点,n=1,2,…,N,N为观点数量;每个观点o都有一定数量的列表集合D(o),而每个用户都有正向或负向的观点。对于原创内容d,根据步骤B、C、D可以从社交网络中搜寻到用户u的三个影响用户集合NLd(u)、NGd(u)和NRd(u),其中用户u对集合NLd(u)和NGd(u)的影响是正相关,对NRd(u)用户集合的影响是负相关。定义概率Pr(NLd(u)|u,o),该概率越大,表示用户u在观点o下越容易影响到用户集合NLd(u),这是因为NLd(u)中的用户和用户u的观点是一致的,用户u在该观点上更容易影响到NLd(u)集合中的用户。其计算方法为:
其中,Pr(v|u,o)表示用户u在观点o下对用户v的影响力,概率越大,影响力越大,NGd(u)同理。与NLd(u)不同的是,NGd(u)反映的是网络全局性的特征,而NLd(u)只反映了局部性特点。
其次,NRd(u)表示与用户u相反观点的用户集合,用户u在该观点上对这些用户的影响力应该微乎其微,因此,Pr(NRd(u)|u,o)是趋近于0。
定义用户u在每个观点o下包含两个向量:So u和To u,分别表示影响他人能力的表征和受到他人影响的表征。因此,用户u在观点o下对用户v的影响力Pr(v|u,o)用两个向量的点积表示,具体定义为:Pr(v|u,o)=exp(So uTo v)。
综上所述,该模型的目标是使概率Pr(NLd(u)∪NGd(u)|u,o)最大化,同时使Pr(NRd(u)|u,o)最小化,趋近于0。因此,定义目标函数为:
模型的训练目标即是使Obj最大化,并拟合得到每个用户u在每个观点o下包含两个向量:So u和To u。以此可以得到任意两个用户之间在不同观点下的相互影响力,并据此得到观点影响力在社交网络结构图中的传播模型。
模型训练方式是以随机梯度下降方法进行拟合,本发明对此不做叙述。
本发明基于观点向量化的影响力传播模型,采用了节点向量化的思想,运用以上的技术方案,与现有技术相比,具有以下优势:
在基于观点的影响力传播模型中,融入了情感倾向,对现实的社交网络特征进行了更深层次的模拟,采用节点向量化的思想,能够使模型不局限于特定的社交网络中,能够将模型运用于不同的环境中。另外,在模型中,综合考虑了局部和全局性的特征,使得模型更加的全面,此外,根据观点具有正反性的特点,本发明考虑了与用户观点相反的影响用户集合,能够建立更为准确反映基于观点下的影响力传播模型。
附图说明
图1为本发明方法的流程图;
图2为本发明方法中步骤B的流程图;
图3为本发明方法中步骤D的流程图。
具体实施方式
以下结合附图和实施实例对本发明加以详细说明。
如图1所示,基于观点向量化的影响力传播模型的建立方法,该方法包括如下步骤:
步骤A:爬取社交网络中用户博文的相关信息,并建立基于观点影响力的传播网络;
如针对微博社交网络平台,利用scrapy模块创建爬虫,对微博进行数据爬取,包括用户的原创博文、转发博文、关注关系以及相应的操作时间。之后,根据用户的转发关系,建立相应的观点影响力传播网络。具体来说包括以下步骤:
A1:根据用户关系,建立用户之间的网络结构图G=(V,E),其中V属于全体用户集合,为节点集,E表示用户之间的关系,为有向边集;
A2:对原创博文d,利用主题提取工具LDA提取主题内容t,并用情感分析工具SnowNLP分析情感倾向s,将主题和情感倾向结合,得到原创博文的观点o=(s,t);
A3:对所有转发该原创博文且带有评论内容的转发博文,利用情感分析工具分析评论内容的情感倾向,并结合原创博文的主题,得到评论内容的观点;
A4:在网络结构G中,选择转发过该篇博文d,且观点一致的用户集合Vd,Vd∈V,并按照转发时间,选择影响关系集合Ed,Ed∈E,具体来说,假设用户v关注了用户u,以有向边(u,v)∈E表示,如果u和v都转发了博文d并观点一致,且u的转发时间比v更早,那么将关系(u,v)放入影响关系集合Ed中,(u,v)∈Ed,否则最终,得到该博文d的观点影响力传播网络Gd=(Vd,Ed)。
步骤B:利用随机游走,搜寻影响力传播网络中的与用户观点一致的局部影响用户集合;
步骤B中是在步骤A中所得到的观点影响力传播网络Gd=(Vd,Ed),利用随机游走来查找。定义搜索的相关参数:扩散概率p和回退概率q。假设当前位置处于(用户)节点u,扩散概率是指下一步以概率p传播到节点u的邻接点,回退概率是指在传播到邻接点后,以概率q回退到节点u,综合深度遍历和广度遍历的优点。图2是步骤B的实现流程。如图2所示,步骤B包括以下步骤:
B1:定义回退概率q设置为0.5,定义需要搜集到的用户u的影响局部集合为NLd(u),初始化为空,并设置集合数量最大值为nl,令当前位置处于节点u;
B2:将概率p设置为当前位置节点的邻接点数量之和的倒数,按照概率p随机选择一个当前位置节点的近邻节点v,且v没有被标记访问,将v添加到集合NLd(u)中,标记v已被访问,并将当前位置移动到v上;
B3:根据回退概率q,如果达到了回退条件,则将当前位置回退,否则,进入步骤B4;
B4:如果集合NLd(u)大小已经等于nl,则返回NLd(u)并结束步骤B,否则,进入步骤B2。
步骤C:根据观点相似性,搜寻影响力传播网络中与用户观点相似的全局影响用户集合;
定义用户u的影响全局集合为NGd(u),初始化为空,并设置集合数量最大值为ng。其包括以下步骤:
C1:从Vd中随机选择一个节点v,且v不在集合NLd(u)和NGd(u)中;
C2:将节点v添加到集合NGd(u)中;
C3:如果集合NGd(u)元素数量已经等于ng,则返回NGd(u)并结束步骤C,否则,进入步骤C1。
步骤D:搜寻影响力传播网络中与用户观点相反的用户集合;
定义与用户u在博文d上观点相反的用户集合为NRd(u),初始化为空,并设置集合元素最大数量为nr。图3是步骤D的实现流程。如图3所示,步骤D包括以下步骤:
D1:提取博文d中的主题t和情感倾向s,组合成博文d的观点倾向o=(t,s);
D2:如果用户u是博文d的原创作者,则用户u的观点以博文d的观点倾向表示,并转到步骤D5,否则,进入步骤D3;
D3:如果用户u转发了博文d,且没有发表评论内容,则用户u的观点以博文d的观点倾向表示,并转到D5,否则,进入步骤D4;
D4:用户u转发了博文d,且发表评论内容,利用情感分析工具分析评论内容的情感倾向,并和博文d提取的主题组合,表示用户u的观点倾向;
D5:找出所有转发了博文d的用户集合,定义为Ud;
D6:遍历集合Ud,对所遍历的用户u′,提取该用户的情感倾向,并和博文d的主题内容结合,得到用户u′的观点倾向;
D7:如果u′的观点倾向和u的观点倾向不一致,则将u′添加至集合NRd(u)中,否则进入步骤D8;
D8:如果集合NRd(u)的数量等于nr,则结束遍历,否则,返回D6。
步骤E:建立基于观点的影响力传播模型。
建立基于观点的影响力传播模型,是根据步骤B、步骤C、步骤D所得到的三个用户集合,并根据节点向量化的思想所建立的。定义从所有博文中提取的观点集合为O={o1,o2,o3,…,oN},N为观点数量,on表示第n个观点,n=1,2,…,N;每个观点o都有一定数量的博文列表集合D(o),而每个用户在这些博文上都有着正向或负向的观点。对于博文d∈D(o),根据步骤B、C、D可以从社交网络中搜寻到用户u的三个影响用户集合NLd(u)、NGd(u)和NRd(u),其中用户u对集合NLd(u)和NGd(u)的影响应该是正相关的,对NRd(u)用户集合的影响是负相关的。定义概率Pr(NLd(u)|u,o),该概率越大,表示,用户u在观点o下越容易影响到用户集合NLd(u),这是因为NLd(u)中的用户和用户u的观点是一致的,用户u在该观点上更容易影响到NLd(u)集合中的用户。其计算方法定义为:
其中,Pr(v|u,o)表示用户u在观点o下对用户v的影响力,概率越大,影响力越大,NGd(u)同理。与NLd(u)不同的是,NGd(u)反映的是网络全局性的特征,而NLd(u)只反映了局部性特点。
其次,NRd(u)表示与用户u相反观点的用户集合,用户u在该观点上对这些用户的影响力应该微乎其微,因此,Pr(NRd(u)|u,o)应该是趋近于0的。
定义用户u在每个观点o下包含两个向量:So u和To u,分别表示影响他人能力的表征和受到他人影响的表征。因此,用户u在观点o下对用户v的影响力Pr(v|u,o)用两个向量的点积表示,具体定义为:
Pr(v|u,o)=exp(So uTo v)
综上所述,该模型的目标是使概率Pr(NLd(u)∪NGd(u)|u,o)最大化,同时使Pr(NRd(u)|u,o)最小化,趋近于0。因此,定义目标函数为:
模型的训练目标即是使Obj最大化,并拟合得到每个用户u在每个观点o下包含两个向量:So u和To u。以此可以得到任意两个用户之间在不同观点下的相互影响力,并据此得到观点影响力在社交网络结构图中的传播模型。
模型训练方式是以随机梯度下降方法进行拟合,对此不做叙述。
该方法在基于节点向量化的思想上,提出一种新的社交网络中的影响力传播模型建立方法。社交网络中用户有着不同的兴趣主题,他们在这些主题上对其他用户也有着不同的影响力,如“政治”类博主在“娱乐”相关主题上的影响力显然低于“政治”相关的。作为主题和情感倾向的结合,用户在观点上也应有着不同的影响力。与主题不同的是,观点影响力传播模型有着更为复杂的场景。在基于主题的影响力传播模型中,用户B转发了用户A一条相关博文,便认为A对B在该主题上有着一定的影响力。然而,在基于观点的影响力传播模型中,即使用户B转发了用户A的一条博文,但是用户B不赞成A的观点,只是为了反驳A,那么用户A在该观点上的影响力对B来说,应该是趋近于无。由此可见,观点影响力的传播模型比一般的影响力传播模型,更为复杂。
该方法基于观点向量化的影响力传播模型,采用了节点向量化的思想,对社交网络中的观点影响力的传播模型问题,提出了一个更有效的方法。不同于传统的影响力传播模型,本发明针对的是用户在观点上的影响力,问题模型更为的复杂,结合主题信息和情感倾向,能够挖掘出社交网络中更为详细的影响力相关细节。模型采用了节点向量化的思想,没有考虑工程性的特征,比如点赞等,能够让模型不局限与特定的社交网络中,使其能够运用在不同的社交网络平台上。其次,该方法综合考虑了局部和全局性的特征,使得模型更加的全面,此外,根据观点具有正反性的特点,该方法考虑了与用户观点相反的影响用户集合,更能准确地反映基于观点下的影响力传播模型。
上面结合附图对本发明的实施方式做了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
Claims (6)
1.基于观点向量化的影响力传播模型的建立方法,其特征在于,该方法包括以下步骤:
步骤A.爬取社交网络中用户原创内容的相关信息,并建立基于观点影响力的传播网络;
步骤B.利用随机游走,搜寻影响力传播网络中的与用户观点一致的局部影响用户集合;
步骤C.根据观点相似性,搜寻影响力传播网络中与用户观点相似的全局影响用户集合;
步骤D.搜寻影响力传播网络中与用户观点相反的用户集合;
步骤E.建立基于观点的影响力传播模型。
2.如权利要求1所述的基于观点向量化的影响力传播模型的建立方法,其特征在于,步骤A具体如下:
A1.根据用户关系,建立用户之间的网络结构图G=(V,E),其中V属于全体用户集合,为节点集,E表示用户之间的关系,为有向边集;
A2.对原创内容d,利用主题提取工具提取主题内容,并用情感分析工具分析情感倾向,将主题和情感倾向结合,得到原创的观点;
A3.对所有转发该原创内容且带有评论内容的转发,利用情感分析工具分析评论内容的情感倾向,并结合原创内容的主题,得到评论内容的观点;
3.如权利要求2所述的基于观点向量化的影响力传播模型的建立方法,其特征在于,步骤B具体如下:
B1.定义需要搜集到的用户u的影响近邻集合为NLd(u),初始化为空,并设置集合数量最大值为nl,令当前位置处于节点u,设置回退概率q,取q=0.3~0.6;所述的回退概率q是指在传播到邻接点后回退到节点u的概率;
B2.设置扩散概率p为当前位置节点的邻接点数量之和的倒数,按照p随机选择一个当前位置节点的近邻节点v,且v没有被标记访问,将v添加到集合NLd(u)中,标记v已被访问,并将当前位置移动到v上;所述的扩散概率p是指下一步传播到节点u的邻接点的概率;
B3.根据回退概率q,如果达到了回退条件,则将当前位置回退,否则,进入步骤B4;
B4.如果集合NLd(u)达到nl,则返回NLd(u)并结束步骤B,否则,进入步骤B2。
4.如权利要求3所述的基于观点向量化的影响力传播模型的建立方法,其特征在于,步骤C首先定义用户u的影响全局集合为NGd(u),初始化为空,并设置集合数量最大值为ng,然后进行如下处理:
C1.从Vd中随机选择一个节点v,且v不在集合NLd(u)和NGd(u)中;
C2.将节点v添加到集合NGd(u)中;
C3.如果集合NGd(u)元素数量达到ng,则返回NGd(u)并结束步骤C,否则,进入步骤C1。
5.如权利要求4所述的基于观点向量化的影响力传播模型的建立方法,其特征在于,步骤D首先定义与用户u在原创内容d上观点相反的用户集合为NRd(u),初始化为空,并设置集合元素最大数量为nr,然后进行如下处理:
D1.提取原创内容d中的主题和情感倾向,组合成d的观点倾向;
D2.如果用户u是原创内容d的原创作者,则用户u的观点以d的观点倾向表示,并转到步骤D5,否则,进入步骤D3;
D3.如果用户u转发了原创内容d,且没有发表评论内容,则用户u的观点以d的观点倾向表示,并转到D5,否则,进入步骤D4;
D4.用户u转发了原创内容d,且发表评论内容,利用情感分析工具分析评论内容的情感倾向,并与提取的d中的主题组合,表示用户u的观点倾向;
D5.定义所有转发d的用户集合Ud;
D6.遍历集合Ud,对所遍历的用户u′提取情感倾向,并与d的主题内容结合,得到用户u′的观点倾向;
D7.如果u′的观点倾向和u的观点倾向不一致,则将u′添加至集合NRd(u)中,否则进入步骤D8;
D8.如果集合NRd(u)的数量达到nr,则结束遍历,否则,返回D6。
6.如权利要求5所述的基于观点向量化的影响力传播模型的建立方法,其特征在于,步骤E首先定义从所有原创内容中提取的观点集合为O={o1,o2,o3,…,oN},on表示第n个观点,n=1,2,…,N,N为观点数量;每个观点o都有一定数量的列表集合D(o),而每个用户都有正向或负向的观点;对于原创内容d,从社交网络中搜寻到用户u的三个影响用户集合NLd(u)、NGd(u)和NRd(u),其中用户u对集合NLd(u)和NGd(u)的影响是正相关,对NRd(u)用户集合的影响是负相关;定义概率Pr(NLd(u)|u,o),该概率越大,表示用户u在观点o下越容易影响到用户集合NLd(u):其中,Pr(v|u,o)表示用户u在观点o下对用户v的影响力;
定义用户u在每个观点o下包含两个向量:So u和To u,分别表示影响他人能力的表征和受到他人影响的表征;用户u在观点o下对用户v的影响力Pr(v|u,o)用两个向量的点积表示,定义为:Pr(v|u,o)=exp(So uTo v);定义目标函数为:
模型的训练目标即是使Obj最大化,并拟合得到每个用户u在每个观点o下包含两个向量:So u和To u,得到任意两个用户之间在不同观点下的相互影响力,据此获得观点影响力在社交网络结构图中的传播模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011350826.2A CN112487304B (zh) | 2020-11-26 | 2020-11-26 | 基于观点向量化的影响力传播模型的建立方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011350826.2A CN112487304B (zh) | 2020-11-26 | 2020-11-26 | 基于观点向量化的影响力传播模型的建立方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112487304A true CN112487304A (zh) | 2021-03-12 |
CN112487304B CN112487304B (zh) | 2022-05-03 |
Family
ID=74935316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011350826.2A Active CN112487304B (zh) | 2020-11-26 | 2020-11-26 | 基于观点向量化的影响力传播模型的建立方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112487304B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113408089A (zh) * | 2021-05-31 | 2021-09-17 | 上海师范大学 | 一种基于引力场思想的集群间影响力建模方法及存储介质 |
CN116484113A (zh) * | 2023-04-12 | 2023-07-25 | 烟台大学 | 一种基于动态信任感知的群体观点预测方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150019474A1 (en) * | 2013-07-10 | 2015-01-15 | Yahoo! Inc. | Influence maximization with viral product design |
CN106780073A (zh) * | 2017-01-11 | 2017-05-31 | 中南大学 | 一种考虑用户行为和情感的社会网络影响力最大化初始节点选取方法 |
CN108549632A (zh) * | 2018-04-03 | 2018-09-18 | 重庆邮电大学 | 一种基于情感分析的社交网络影响力传播模型构建方法 |
CN108564479A (zh) * | 2017-12-20 | 2018-09-21 | 重庆邮电大学 | 一种基于隐链接分析热点话题传播趋势的系统及方法 |
CN110084714A (zh) * | 2019-04-25 | 2019-08-02 | 太原理工大学 | 基于有向树的社交网络影响力最大化方法、装置及设备 |
-
2020
- 2020-11-26 CN CN202011350826.2A patent/CN112487304B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150019474A1 (en) * | 2013-07-10 | 2015-01-15 | Yahoo! Inc. | Influence maximization with viral product design |
CN106780073A (zh) * | 2017-01-11 | 2017-05-31 | 中南大学 | 一种考虑用户行为和情感的社会网络影响力最大化初始节点选取方法 |
CN108564479A (zh) * | 2017-12-20 | 2018-09-21 | 重庆邮电大学 | 一种基于隐链接分析热点话题传播趋势的系统及方法 |
CN108549632A (zh) * | 2018-04-03 | 2018-09-18 | 重庆邮电大学 | 一种基于情感分析的社交网络影响力传播模型构建方法 |
CN110084714A (zh) * | 2019-04-25 | 2019-08-02 | 太原理工大学 | 基于有向树的社交网络影响力最大化方法、装置及设备 |
Non-Patent Citations (3)
Title |
---|
LINGFEI LI等: "Targeted influence maximization under a multifactor-based information propagation model", 《INFORMATION SCIENCES》 * |
张潇: "多重影响力作用下的双层网络舆论演化模型研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
陈好: "协同理论视角下网络舆情传播机理研究", 《中国优秀硕士学位论文全文数据库社会科学Ⅱ辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113408089A (zh) * | 2021-05-31 | 2021-09-17 | 上海师范大学 | 一种基于引力场思想的集群间影响力建模方法及存储介质 |
CN113408089B (zh) * | 2021-05-31 | 2023-09-26 | 上海师范大学 | 一种基于引力场思想的集群间影响力建模方法及存储介质 |
CN116484113A (zh) * | 2023-04-12 | 2023-07-25 | 烟台大学 | 一种基于动态信任感知的群体观点预测方法及系统 |
CN116484113B (zh) * | 2023-04-12 | 2023-09-19 | 烟台大学 | 一种基于动态信任感知的群体观点预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112487304B (zh) | 2022-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chakraborty et al. | A survey of sentiment analysis from social media data | |
Sharma et al. | Sentimental analysis of twitter data with respect to general elections in India | |
US9767182B1 (en) | Classification of search queries | |
Jamali et al. | Different aspects of social network analysis | |
CN107918644B (zh) | 声誉管理框架内的新闻议题分析方法和实施系统 | |
CN106296312A (zh) | 基于社交媒体的在线教育资源推荐系统 | |
CN110704743A (zh) | 一种基于知识图谱的语义搜索方法及装置 | |
CN107239512B (zh) | 一种结合评论关系网络图的微博垃圾评论识别方法 | |
CN114238573A (zh) | 基于文本对抗样例的信息推送方法及装置 | |
CN109992784B (zh) | 一种融合多模态信息的异构网络构建和距离度量方法 | |
CN112487304B (zh) | 基于观点向量化的影响力传播模型的建立方法 | |
CN112966091A (zh) | 一种融合实体信息与热度的知识图谱推荐系统 | |
CN107368509B (zh) | 通信方法、通信系统及计算机可读非暂时性存储介质 | |
CN105308591A (zh) | 来自社交交互的关系强度的动态性 | |
CN103365876B (zh) | 基于关系图谱生成网络操作辅助信息的方法与设备 | |
CN114329227A (zh) | 基于话题知识图谱的社交关系网络构建与拓展方法 | |
Qureshi et al. | Social media and microblogs credibility: Identification, theory driven framework, and recommendation | |
Sajeev et al. | Effective web personalization system based on time and semantic relatedness | |
Zhou et al. | Rank2vec: learning node embeddings with local structure and global ranking | |
US20170235835A1 (en) | Information identification and extraction | |
Kim et al. | User interest-based recommender system for image-sharing social media | |
Bhat et al. | Browser simulation-based crawler for online social network profile extraction | |
Servia-Rodríguez et al. | Inferring contexts from Facebook interactions: A social publicity scenario | |
Shaik et al. | Recurrent neural network with emperor penguin-based Salp swarm (RNN-EPS2) algorithm for emoji based sentiment analysis | |
Myneni et al. | Content-specific network analysis of peer-to-peer communication in an online community for smoking cessation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |