CN103177382B - 微博平台上的关键传播路径和中心节点的探测方法 - Google Patents
微博平台上的关键传播路径和中心节点的探测方法 Download PDFInfo
- Publication number
- CN103177382B CN103177382B CN201310087938.7A CN201310087938A CN103177382B CN 103177382 B CN103177382 B CN 103177382B CN 201310087938 A CN201310087938 A CN 201310087938A CN 103177382 B CN103177382 B CN 103177382B
- Authority
- CN
- China
- Prior art keywords
- mrow
- node
- mtd
- msub
- mtr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001514 detection method Methods 0.000 title abstract description 14
- 230000000694 effects Effects 0.000 claims description 64
- 238000000034 method Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 5
- 244000097202 Rathbunia alamosensis Species 0.000 abstract description 9
- 235000009776 Rathbunia alamosensis Nutrition 0.000 abstract description 9
- 238000011160 research Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004883 computer application Methods 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- TZCXTZWJZNENPQ-UHFFFAOYSA-L barium sulfate Chemical compound [Ba+2].[O-]S([O-])(=O)=O TZCXTZWJZNENPQ-UHFFFAOYSA-L 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于复杂网络研究体系中社交网络上信息传播影响力的研究范畴,涉及一种微博平台上的关键传播路径和中心节点的探测方法,解决微博平台上的微博广告传播流上的中心节点的探测问题,把中心节点的探测这一抽象的问题,与复杂网络中的最短传播路径问题紧密的结合起来,通过建立新浪微博上的广告传播流的最短传播路径的探测模型,从而解决了探测微博广告传播路径上的中心节点,即广告台风眼的探测问题。
Description
技术领域
本发明属于复杂网络研究体系中社交网络上信息传播影响力的研究范畴,涉及的研究领域主要包括微博平台上的关键传播路径和中心节点的探测模型及其探测方法。
背景技术
最近几年中,由于新浪微博的日趋热门,基于新浪微博平台的广告投放产业也日益兴起,利用微博平台的服务向广大社交网络中的用户推销产品,并利用数据信息挖掘的知识,做好基于群体特征信息的个性化广告投放却又是报纸和电视等广告投放媒介无法做到的。但是,由于现阶段的微博广告投放存在投放精度不高,实时更新难的问题,使得微博广告的投放效果不尽人意,为了解决这些问题,国内外不少研究学者在基于目前全球最热门的两大微博平台Twitter和新浪微博做了相关的技术研究和难点突破,先将国内外关于微博平台上的广告投放方面的研究成果进行了集中概括。
国内尚未深入的利用数据挖掘的相关知识对新浪微博上的广告投放的相关应用和问题进行研究,因此相关研究的论文为数并不多。其中,
刘刚、刘万军等人在其论文中研究基于星形用户社区模型的Twitter广告投放问题,该文章采用网页爬虫获取Twitter用户社交信息,利用高斯模型的多因素权系数算法处理用户社交信息,筛选出对产品感兴趣和有影响力的用户,并建立星形结构模型,确定出度核心节点并识别出目标星形子图社区,将此种社区的出度核心节点作为广告投放载体的个性化广告投放方式具有较高的社区用户满意度[2]。
俞淑平等在其论文中针对行为定向广告问题,提出了一种全新的行为定向广告投放算法,该算法首先根据用户行为特征模型对用户最近访问的网页按主题进行聚类,然后利用用户行为特征分析算法对每一类网页进行行为特征分析并计算该类网页的权重,利用该权重以及该类网页的质心与广告相似度来计算最后得分,并按照这个得分对广告进行排序从而选出适合该类网页的广告[3]。
BerthierRibeiro-Neto等人在其论文中研究了互联网网页在线广告的问题,提出了一种考虑问题语义的匹配策略,和基于矢量的微型策略相比,这种策略能够增加60%的精准度,此外,一种被称之为扩展网页文本的更加成熟的的阻抗耦合策略,能够降低和广告相关的词汇阻抗,额外的获得平均为50%的精确度[4]。
DeepayanChakrabarti等人在其论文中提出了一类新模型,这些模型能够把用户相关的点击反馈行为联系成一个内容关联的广告系统。模型是基于逻辑回归思想并能够允许大量的颗粒特征。建模方法的关键特征是在某种程度上建立存在的页面和广告区之间的词汇交互模型的能力,并且这种方法必须适合在倒排索引之上进行有效的评估。事实上,文中采用了一种乘法分解的方法,以一种简洁的方式为几个区域建立交互作用模型,此模型在运行过程中能够促进广告的快速浏览。
由于新浪微博属于社会网络的一种应用,社会网络属于较大规模网络的一种,因而它往往在结构上表现出复杂网络的特征,同时复杂网络拓扑特征体现了现实网络中最短路径的一些内在规律。复杂网络的大部分节点都只在小范围内相互连接,呈现出一定的高聚集系数特性,且任意两个节点间的距离都较短[6]。
但目前尚未出现实用的解决方案。
参考文献:
[1]新浪微博广告形式全攻略.[EB/OL].[2012-08-28].http://www.adquan.com/.
[2]刘刚,刘万军,张伟.基于星形用户社区模型的Twitter广告投放.计算机应用与软件[J],2012(4),44-48.
[3]俞淑平,陈刚.一种高效的行为定向广告投放算法.计算机应用与软件[J],2011(1),4-7.
[4]Berthier&R,Macro&C.ImpedanceCouplinginContent-targetedAdve--rtising.SIGIR,August,15-19,2005.
[5]Deepayan&C,Deepak&A,Vanja&J.ContextualAdvertisingbyCombiningRelevancewithClickFeedback.WWW2008,April21-25,2008.
[6]唐晋韬,王挺,王戟.适合复杂网络分析的最短路径近似算法.软件学报[J],2009(10),2279-2290.
发明内容
本发明的目的是解决微博平台上的微博广告传播流上的中心节点的探测问题。
本发明的技术方案为一种微博平台上的关键传播路径和中心节点的探测方法,包括以下步骤:
步骤1,根据预设的区域N,将微博平台上的广告传播网络划分为N个区域A1,A2,A3…AN;
步骤2,对N个区域A1,A2,A3…AN中任一,以区域内每个节点为关键节点求广告传播效应Y,然后比较得出区域内广告传播效应的极大值;N个区域A1,A2,A3…AN的极大值分别记为Y1,Y2,Y3…YN;
步骤3,根据预设的迭代次数m,对极大值Y1,Y2,Y3…YN进行比较,包括以下子步骤,
步骤3.1,设当前待比较的极大值数目S为N,设迭代次数为1;
步骤3.2,对当前待比较的S个极大值进行两两比较,去除次比较后所得较小者,剩余个极大值;
步骤3.3,判断迭代次数是否达到预设的迭代次数m,是则进入步骤3.4,否则迭代次数加1,设返回步骤3.2将剩余的极大值作为当前待比较的S个极大值进行比较;
步骤3.4,将剩余的极大值所对应节点作为中心节点;
步骤4,把步骤3所得中心节点串联起来,就构成了一条虚拟的关键传播路径。
而且,步骤2中,以区域内每个节点为关键节点求广告传播效应Y实现方式如下,
设某区域有I个节点,将任一节点作为关键节点并标记为节点I,其他I-1个节点标记为节点1、2…I-1,与节点I分别有路径相连;按以下公式进行计算,
ηI=0
其中,d表示以关键节点I为源节点时的节点维度,F(d+1)(i)表示节点i的第d+1度粉丝的粉丝数,F(d)(i)表示节点i的第d度粉丝的粉丝数,Bi(d+1)(i)表示节点i的第d+1度粉丝的互粉数,Bi(d)(i)表示节点i的第d度粉丝的互粉数;η(d)(I)则表示节点I的第d度粉丝的广告效应,F(d)(I)表示节点I的第d度粉丝的粉丝数。
本发明把中心节点的探测这一抽象的问题,与复杂网络中的最短传播路径问题紧密的结合起来,通过建立新浪微博上的广告传播流的最短传播路径的探测模型,从而解决了探测微博广告传播路径上的中心节点,即广告台风眼的探测问题。
附图说明
图1为本发明实施例的比较极大值示意图。
图2为本发明实施例的微博广告“台风眼”示意图。
图3为本发明实施例的微博广告传播流向示意图。
图4为本发明实施例的加权传播效应指数的模型示意图。
图5为本发明实施例的闭合回路上的加权传播效应指数示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
新浪微博自2009年12月由新浪公司成立以来,作为一种最近两年才兴起的网络微博服务和虚拟社交网络,它的主要功能是一类具有和Twitter很类似的网络服务,时下在中国的每一个网络用户之间都很受到欢迎,但用户只有将对方加为关注之后才能看到对方的转发信息。而媒体广告在中国也是屡见不鲜,花样层出不穷。自从新浪微博出现之后,广告行业和新浪微博的完美结合,进而萌发出了一个新兴的产业,那就是微博广告业。新浪日前发布的最新数据表明,新浪微博的注册用户数超过5亿,而通过微博广告业获得的广告收入却占了新浪公司全年总收入的八成。
新浪微博的广告形式也多种多样。根据发布终端的不同,其广告形式主要分为两大类[1]:它们是基于PC端的广告形式和基于移动终端的广告形式。
其中,基于PC端的广告形式主要包括:
1、微博登陆页面广告:它位于登陆页面左侧;
2、微博顶部广告:它位于微博新鲜事的下方,微博内容栏的上方;
3、快讯置顶栏目条:锁定固定账号,对微博内容进行置顶推送;
4、底部广告:位于微博最底端;
5、右侧活动广告:位于微博右上方;
6、右侧话题广告:位于活动广告下方;
7、微博名称后面的icon广告:位于微博名称的后面;
8、模板广告:以商业性模板的形式出现在微博的背景页面上。
9、APP游戏植入广告:位于新浪微博APP应用的加载页面或者加载后的页面中,由APP的开发者代码植入;
基于移动终端的广告形式包括:
1、客户端开屏广告:启动新浪微博应用时出现;
2、顶部条框广告:位于微博页面的顶部;
3、关键词广告:转发微博并且微博内容中含有“奥运”或含有品牌名称的关键词,便会出现相关品牌的漂浮广告;
虽然广告形式层次不穷,但是如果广告没有投放在关键点上,也不一定就能够使得广告效应最大化,这也就是本文着重需要研究的难点问题:微博广告需要通过哪些关键用户传播出去,才能使微博广告传播的范围最广,传播时间最短,传播效应最大。
在提出基本概念之前,首先来分析一下广告传播效应的影响因素,即广告传播效应究竟和哪些因素有关。
经过互联网知识和阅读参考文献,把广告传播效应的影响因素概括如下:
1、广告传播效应与广告在微博上的发布位置有关系;
2、广告传播效应与广告投放对象有关系;
3、广告传播效应与广告的投放形式有关系;
本专利中,要研究的内容界定于广告的投放对象和广告的投放形式,即本专利研究的核心在于让新浪微博上广告投放的广告传播流在经过了若干次节点转发之后,以最短的传播路径(即最少的传播时间),使得广告的传播范围最大(即广告传播流覆盖的传播节点数最多),以达到最大的广告影响力(广告传播效应),从而实现广告价值的最大化。
而本专利研究的目的就是为了找出广告应该投放在哪些用户上,才能以最少的转发次数达到最大的传播效应,而这些被找出来的用户就是本文中要提到的广告台风眼。而它们也正好是卷起广告风暴的中心和关键。
值得特别注意的是,本文的论述和实验都是基于每个节点与节点之间的传播时间均相同的假设基础之上的。在此假设的基础之上,以最少的节点转发次数来表征广告传播流最短的传播时间,以最少转发次数下的最大节点个数来表征最短传播时间内的广告最大传播效应的特征提取方法是合理的。
接下来,将介绍一下,微博广告传播流和微博广告台风眼的概念:
定义1微博广告传播流:就像江河里面的水一样,必然会存在一个源头和一定的流向。所谓微博广告传播流,就是广告传播的源头,本发明把广告传播源头称之为广告传播源,显然广告的传播源来自于广告的发布者;而把广告传播的路径称之为广告传播流。江河在流动的过程中并不会只有一条路径,必然会形成一些支流,而广告的传播流形成的“支流”就构成了路径,而支流的分叉点正好可以形象的比喻为本文中提到的“台风眼”,即广告传播过程中的关键节点,本发明首先假设只要抓住了这些关键节点,就能使广告传播流在最短的时间或者路径之下传遍新浪微博上的每个用户。而微博广告这场台风要想声势浩大,就必然离不开这些关键的节点。
定义2微博广告台风眼:在上述提到的关键节点构成的路径中,如果存在一条关键路径,它能够让广告传播流用最短的时间达到最大的传播范围,那么这条关键路径上的关键节点就被称之为微博广告台风眼。广告传播流的示意图如图2所示,图中的每个关键节点1、2、3、4、5、6、7、8都是新浪微博上的注册用户,而图中的边则表示每个用户之间的关系,如果用户节点之间存在边,则表示他们之间存在广告传播流,边的箭头的指向表明广告传播流的传播方向,例如图中的1——>2——>5,表示广告传播流从1流向2,然后再流向5。
定义3步长:所谓步长就是从广告传播源节点开始的广告传播流上,各个节点之间的距离,从源节点开始每向前传播一个节点,步长加1,本文中的步长统一用s表示,那么广告传播流中任意两个节点i与j之间的步长就可表示为s(i,j)。如图3所示,1——>2——>5是一条广告传播流,节点1和节点2之间的步长为s(1,2)=1,节点2与节点5之间的步长为s(2,5)=1,而节点1与节点5之间的步长则为s(1,5)=2。
在图3的基础之上,还可以进一步定义第d度节点i的微博广告传播效应指数η如下:
上述公式1中的Lout(d)(i)表示第d度节点i的出度数,其中d表示节点i的节点维度,所谓出度数,指的是以i为起始节点,由i指向除i以外其它节点的有向路径的条数。其中,F(d+1)(i)表示关键节点i的某个下一级节点(第d+1度)的粉丝数,而微博广告传播效应指数η则用来衡量微博广告在新浪微博上的传播影响力度。结合图4所示带权重的微博广告传播效应指数模型示意图来说明η的计算方法。图4中带圈的数字1-8表示广告传播路径的关键节点,箭头代表广告传播路径的传播方向,带箭头的连接线上的数字代表权重,该权重为箭头所指节点的粉丝数目。例如,节点1的出度数为3,节点1指向的节点2有3、5、6、7、8这五个粉丝,因此节点1指向节点2的权重为5。
在定义了广告传播效应指数之后,接下来将结合图4的例子来给出微博广告传播效应指数的计算模型,本发明就可以根据公式1计算出各条传播路径的传播效应指数如下:
1、1->2的广告传播效应指数为:5/3;
2、1->3的广告传播效应指数为:2/3;
3、1->4的广告传播效应指数为:9/3;
4、1->2->5的广告传播效应指数为:5/3+5/3×1/5=2;
5、1->2->6的广告传播效应指数为:5/3+5/3×5/5=10/3;
6、1->2->7的广告传播效应指数为:5/3+5/3×9/5=14/3;
7、1->2->8的广告传播效应指数为:5/3+5/3×2/5=7/3;
8、1->2->3的广告传播效应指数为:5/3+5/3×2/5=7/3;
如果把图中的节点2和节点3的箭头方向调换的话就会形成传播路径1->3->2,那么1->3->2的广告传播效应指数为:2/3+2/3×5/2=7/3;
由此可知,路径1->2->3和路径1->2->3的广告传播效应相同,这和人们对一般广告的传播效应的认知正好吻合,即闭合回路内的广告传播效应与广告传播流的传播方向无关。
由此可以得出如下定理:
定理1:闭合回路内的广告传播效应与广告传播流的传播方向无关,且广告传播效应均为除广告传播源节点以外的所有节点的粉丝之和与广告传播源节点的出度之商。
定理证明如下:
证明:设节点i,i+1和i+2构成了一个广告传播的闭合回路,如图5所示(其中节点i为广告传播源),并且形成了两条广告传播路径,分别是:i—>i+1—>i+2和i—>i+2—>i+1,并同时假设节点i+1和节点i+2的下一级节点的粉丝数分别为q和k,显然图中闭合回路中的广告传播源的出度为2,
那么计算两条广告传播路径的广告传播效应分别为:
i—>i+1—>i+2的广告传播效应为:
i—>i+2—>i+1的广告传播效应为:
由上述计算结果可得得证。
另外,还可以把广告传播流的传播效应指数的概念推广到为全局传播效应指数和局部传播效应指数。由此,可以分别给出两个概念的定义如下:
全局传播效应指数为,以新浪微博平台为参照标准,微博用户关注该广告的人数除以微博注册用户总人数(二度粉丝数/传播链路数(一度粉丝数))的结果,也就是本级出度链路数/上一级节点的出度链路数。
局部传播效应指数为,以新浪微博上某个影响区域,如微吧等为参照标准,微博用户关注该广告的人数除以微博注册用户总人数。
由于,新浪微博上的广告传播流网络符合复杂网络的特征,因此本文提出了在广告传播流网络中关于最短路径规律的一个假设:
假设1.在具有复杂网络特征的新浪微博广告传播网络中,大部分节点都是经过中心节点连接在一起的,任意节点之间的最短路径有较大的可能会经过中心节点。此处的中心节点指的是,粉丝数高度汇聚的新浪微博用户。
借鉴复杂网络中以中心节点为核心,把整个复杂网络划分为若干区域的思想,把该思想运用到新浪微博上的广告传播网络中,同样也可以把广告传播网络划分为若干个局部区域。
由若干中心节点为核心可以把新浪微博上的广告传播网络划分为若干个局部区域。只要通过查找区域中心点的方法和策略可以找出每个局部划分区域的区域中心节点,这些点如果成为每个区域的“台风眼”,然后把这些区域的台风眼一一串联起来的话,就有可能得到一条近似的虚拟关键路径,即最短路径,从而最大限度的扩大广告传播效应。而在复杂网络中,如果某个节点在一定区域内是中心节点的话,那么该区域内的大多数节点(修改后)之间相连接的路径都会经过该中心节点。相类似地,体现在广告传播网络中,大多数节点之间相连接的广告传播路径都经过中心节点,那么就说明中心节点必定关联着大多数节点,直接体现就是中心节点的出度数很大。
鉴于上述论述,本发明将公式1提到的广告传播传播效应指数,设某区域有I个节点,以其中每一节点为关键节点求广告传播效应Y,最后比较I个节点的广告传播效应Y的极大值。特殊情况下,如果有多个极大值相等时,可以考虑随机取其中一个对应的节点。
以任一节点为关键节点求广告传播效应Y的具体方式为,将关键节点标记为节点I,其他I-1个节点标记为节点1、2…I-1,与节点I分别有路径相连。结合区域中心节点的分治的思想,建立探测新浪微博上的广告台风眼的模型如下公式2所示:
其中,i的取值为1,2…I-1,特别地,源节点I处的广告效应指数ηI为0。Y表示关键节点I在区域内的广告传播效应。
上述公式2中,η表示的就是新浪微博上的广告传播网络中的广告传播效应指数,d表示节点维度,因此当d=0表示以关键节点I为源节点时,d=1就表示源节点的一度子节点,即源节点的一度粉丝节点;d=2,就表示源节点的二度子节点,即源节点的二度粉丝节点。ηi表示节点i的广告效应指数。η(d)(I)则表示节点I的第d度粉丝的广告效应,F(d)(I)表示节点I的第d度粉丝的粉丝数。此处的“度”就是指“级”。
F(d+1)(i)表示节点i的第d+1度粉丝的粉丝数,F(d)(i)表示节点i的第d度粉丝的粉丝数,Bi(d+1)(i)表示节点i的第d+1度粉丝的互粉数,Bi(d)(i)表示节点i的第d度粉丝的互粉数。
本发明把新浪微博上的广告传播网络,根据复杂网络的无标度特性划分为N个区域A1,A2,A3…AN,具体划分方式可由本领域技术人员实施时指定,例如,用户认为广告投放的重点在武汉地区,那么就把武汉地区的微博广告传播网络作为重点进行划分,其它城市划分一次即可,把武汉地区则根据行政区域加以细分啊,分为武昌区,汉阳区,汉口区等等啊。具体实施时可以预先进行划分。当本发明实施例求得各区域内的每个节点的广告传播效应Y以后,比较得出每个区域里的广告效应的极大值并相应记为Y1,Y2,Y3…YN,然后借助分治的思想,两两比较这些极大值。
比较的过程描述如下,以N=4个节点为例,节点编号假设为1,2,3,4。两两比较包括,1和2比较求谁更大,3和4比较求谁更大,比较次数为2,迭代次数为1,所谓迭代次数就是从头到尾把这4个数用循环程序扫描一遍的次数。因为把节点1和节点2,节点3和节点4分别比较为2个,即4个极大值变2个极大值的过程只需要用程序循环扫描一次,因此扫描一次的比较次数为N为初始待比较的极大值个数。推广到图1中,则比较过程可描述为:
1、分别求N个划分区域的极大值,得到N个极大值Y1,Y2,…YN;
2、根据需要进行迭代扫描。设当前待比较的极大值(即待比较节点)有S个,则当前比较次数为
(即S/2向下取整),得到的下一次待比较的极大值个数为(即S/2向上取整),值得注意的是,第一次的待比较节点个数S=N,比较这N个极大值,扫描1次。根据每次扫描比较后所得个极大值对应的节点可以重新划分网络得到相应局部区域。设达到预设迭代次数m后,得到X个极大值,分别对应X个节点,记为中心节点1、2、中心节点X-1、中心节点X。
假设仅需扫描5次(即迭代次数m为5),那么扫描5次之后,剩下来的极大值对应的节点编号就可以形成一条最优化路径,由于比较后的极大值比比较前每个区域的极大值还要大,所以该路径上的节点必然是中心节点。
然后把这些极大值所对应的中心节点串联起来,就构成了一条虚拟的最短路径,而这条路径必然非常的接近于实际的最短路径,而此刻本发明得到的这条路径上的节点1到节点n正好就是本发明要求的广告台风眼。
其中迭代次数m和划分区域N可根据微博广告的投放广告费确定。如果广告费用充足,划分区域N可适当多一些,由于微博用户达5亿之多,这样划分出来的N个区域中每个区域中包含的节点数目会少一些,在同样的比较迭代次数m下,得到的投放节点会相应的多一些,得到的计算结果会更接近于最大传播效应一些。相反,划分区域粗略,比较迭代次数m会相应的减少,得到的投放节点数少的话,广告的传播效应自然会差一些。
事实上,在已经得到了广告信息的传播流节点上再次投放广告的操作是无意义的。因为对于该节点而言,已经获取了广告信息而再次获取到一条同样的广告信息,那么广告的信息量对于该节点而言就会为零,这样就会失去广告传播的价值。
因此,在建立探测模型的时候,就要尽量避免加权有向图(图4)上出现闭合回路和节点上出现闭合环的情况。把这种思想迁移到新浪微博上就是要避免用户的广告传播流上出现互粉关系。虽然,新浪微博整个社交网络本身就是一个闭合的回路,但由于广告的数量数不胜数,所以本发明假设某条广告传播流几乎不可能遍及整个微博,而使每个用户都知晓这条广告的。
本发明实施例设计了相应流程,可采用计算机软件技术实现自动执行流程:
步骤1,根据预设的区域N,将微博平台上的广告传播网络划分为N个区域A1,A2,A3…AN;
步骤2,对N个区域A1,A2,A3…AN中任一,根据上述广告台风眼的模型以区域内每个节点为关键节点求广告传播效应Y,然后比较得出区域内广告传播效应的极大值;N个区域A1,A2,A3…AN的极大值分别记为Y1,Y2,Y3…YN;
步骤3,根据预设的迭代次数m,对极大值Y1,Y2,Y3…YN进行比较,包括以下子步骤,
步骤3.1,设当前待比较的极大值数目S为N,设迭代次数为1;
步骤3.2,对当前待比较的S个极大值进行两两比较,去除次比较后所得较小者,剩余个极大值;
步骤3.3,判断迭代次数是否达到预设的迭代次数m,是则进入步骤3.4,否则迭代次数加1,设返回步骤3.2将剩余的极大值作为当前待比较的S个极大值进行比较;
步骤3.4,将剩余的极大值所对应节点作为中心节点;
步骤4,把步骤3所得中心节点串联起来,就构成了一条虚拟的关键传播路径。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (2)
1.一种微博平台上的关键传播路径和中心节点的探测方法,其特征在于,包括以下步骤:
步骤1,根据预设的区域N,将微博平台上的广告传播网络划分为N个区域A1,A2,A3…AN;
步骤2,对N个区域A1,A2,A3…AN中任一,以区域内每个节点为关键节点求广告传播效应Y,然后比较得出区域内广告传播效应的极大值;N个区域A1,A2,A3…AN的极大值分别记为Y1,Y2,Y3…YN;
步骤3,根据预设的迭代次数m,对极大值Y1,Y2,Y3…YN进行比较,包括以下子步骤,
步骤3.1,设当前待比较的极大值数目S为N,设迭代次数为1;
步骤3.2,对当前待比较的S个极大值进行两两比较,去除次比较后所得较小者,剩余个极大值;
步骤3.3,判断迭代次数是否达到预设的迭代次数m,是则进入步骤3.4,否则迭代次数加1,设返回步骤3.2将剩余的极大值作为当前待比较的S个极大值进行比较;
步骤3.4,将剩余的极大值所对应节点作为中心节点;
步骤4,把步骤3所得中心节点串联起来,就构成了一条虚拟的关键传播路径。
2.根据权利要求1所述的微博平台上的关键传播路径和中心节点的探测方法,其特征在于:步骤2中,以区域内每个节点为关键节点求广告传播效应Y实现方式如下,
设某区域有I个节点,将任一节点作为关键节点并标记为节点I,其他I-1个节点标记为节点1、2…I-1,与节点I分别有路径相连;按以下公式进行计算,
ηI=0
其中,d表示以关键节点I为源节点时的节点维度,ηi表示节点i的广告效应指数,ηI为源节点I处的广告效应指数,F(d+1)(i)表示节点i的第d+1度粉丝的粉丝数,F(d)(i)表示节点i的第d度粉丝的粉丝数,Bi(d+1)(i)表示节点i的第d+1度粉丝的互粉数,Bi(d)(i)表示节点i的第d度粉丝的互粉数;η(d)(I)表示节点I的第d度粉丝的广告效应,F(d)(I)表示节点I的第d度粉丝的粉丝数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310087938.7A CN103177382B (zh) | 2013-03-19 | 2013-03-19 | 微博平台上的关键传播路径和中心节点的探测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310087938.7A CN103177382B (zh) | 2013-03-19 | 2013-03-19 | 微博平台上的关键传播路径和中心节点的探测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103177382A CN103177382A (zh) | 2013-06-26 |
CN103177382B true CN103177382B (zh) | 2015-11-11 |
Family
ID=48637215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310087938.7A Expired - Fee Related CN103177382B (zh) | 2013-03-19 | 2013-03-19 | 微博平台上的关键传播路径和中心节点的探测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103177382B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104518965B (zh) * | 2013-09-30 | 2018-04-20 | 华为技术有限公司 | 一种最短路径查询方法及装置 |
CN105991397B (zh) * | 2015-02-04 | 2020-03-03 | 阿里巴巴集团控股有限公司 | 信息传播方法和装置 |
CN106874289B (zh) * | 2015-12-11 | 2020-04-24 | 阿里巴巴集团控股有限公司 | 一种关联节点确定方法及设备 |
US10423683B2 (en) * | 2016-05-02 | 2019-09-24 | Microsoft Technology Licensing, Llc | Personalized content suggestions in computer networks |
CN106358256B (zh) * | 2016-10-26 | 2019-09-17 | 上海电机学院 | 一种多机器人控制协调者产生方法 |
CN106603387B (zh) * | 2016-12-20 | 2020-08-18 | 西南石油大学 | 基于微博转发关系进行微博转发路径预测的方法和系统 |
CN108614849B (zh) * | 2017-01-13 | 2022-11-18 | 南京邮电大学盐城大数据研究院有限公司 | 一种基于动态插桩和静态多脚本页特征提取的网页广告检测方法 |
CN108170842B (zh) * | 2018-01-16 | 2021-12-14 | 重庆邮电大学 | 基于三部图模型的微博热点话题溯源方法 |
CN109460490B (zh) * | 2018-09-28 | 2021-05-04 | 上海达家迎信息科技有限公司 | 社交网络中中心顶点的确定方法、装置、设备及存储介质 |
CN110110974B (zh) * | 2019-04-17 | 2022-03-29 | 福建天泉教育科技有限公司 | 关键意见领袖的识别方法及计算机可读存储介质 |
CN110796543B (zh) * | 2019-09-26 | 2024-02-27 | 北京淇瑀信息科技有限公司 | 基于关系网络的定制信息获取方法、装置及电子设备 |
-
2013
- 2013-03-19 CN CN201310087938.7A patent/CN103177382B/zh not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
《基于社区的关键节点挖掘算法》;陆晓野等;《计算机系统应用》;20120430;第21卷(第4期);正文第250-253、197页 * |
《微博中节点影响力度量与传播路径模式研究》;于洪等;《通信学报》;20120930;第33卷(第Z1期);正文第96-102页 * |
Also Published As
Publication number | Publication date |
---|---|
CN103177382A (zh) | 2013-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103177382B (zh) | 微博平台上的关键传播路径和中心节点的探测方法 | |
Liu et al. | Personalized travel package recommendation | |
CN103678613B (zh) | 一种计算影响力数据的方法与装置 | |
CN102394798B (zh) | 一种基于多元特征的微博信息传播行为预测方法及系统 | |
CN106484764A (zh) | 基于人群画像技术的用户相似度计算方法 | |
CN103064917A (zh) | 一种面向微博的特定倾向的高影响力用户群发现方法 | |
CN103116611A (zh) | 社交网络意见领袖识别方法 | |
CN107239512B (zh) | 一种结合评论关系网络图的微博垃圾评论识别方法 | |
CN103235823A (zh) | 根据相关网页和当前行为确定用户当前兴趣的方法和系统 | |
CN103729359A (zh) | 一种推荐搜索词的方法及系统 | |
CN103778260A (zh) | 一种个性化微博信息推荐系统和方法 | |
CN105025091A (zh) | 一种基于移动用户位置的商铺推荐方法 | |
CN102779182A (zh) | 融合偏好和信任关系的协同过滤推荐方法 | |
CN103617289A (zh) | 基于用户特征及网络关系的微博推荐方法 | |
CN106168953A (zh) | 面向弱关系社交网络的博文推荐方法 | |
CN103279512A (zh) | 利用社会网络上最有影响力节点实现高效病毒营销的方法 | |
CN103544188A (zh) | 移动互联网内容的用户偏好推送方法与装置 | |
CN108415913A (zh) | 基于不确定邻居的人群定向方法 | |
CN104123279A (zh) | 关键词的聚类方法和装置 | |
CN103150678B (zh) | 微博中用户间潜在关注关系的发现方法及装置 | |
CN103838819A (zh) | 一种信息发布方法及系统 | |
CN103425763A (zh) | 基于sns的用户推荐方法及装置 | |
CN105868267A (zh) | 一种移动社交网络用户兴趣的建模方法 | |
CN105373633A (zh) | 位置感知订阅/发布系统的top-k订阅查询匹配方法 | |
CN104699693A (zh) | 一种信息处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20151111 |