CN106651016B - 一种热点话题下动态预测用户行为的系统及方法 - Google Patents

一种热点话题下动态预测用户行为的系统及方法 Download PDF

Info

Publication number
CN106651016B
CN106651016B CN201611144446.7A CN201611144446A CN106651016B CN 106651016 B CN106651016 B CN 106651016B CN 201611144446 A CN201611144446 A CN 201611144446A CN 106651016 B CN106651016 B CN 106651016B
Authority
CN
China
Prior art keywords
user
tensor
topic
matrix
alternative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611144446.7A
Other languages
English (en)
Other versions
CN106651016A (zh
Inventor
肖云鹏
李晓娟
刘宴兵
李茜曦
柳靓云
刘晏驰
张克毅
赵金哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201611144446.7A priority Critical patent/CN106651016B/zh
Publication of CN106651016A publication Critical patent/CN106651016A/zh
Application granted granted Critical
Publication of CN106651016B publication Critical patent/CN106651016B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明请求保护一种热点话题下动态预测用户行为的系统及方法,属于社交网络分析领域。基于社交网络中用户间的关系网及用户的过往行为,根据用户参与话题的时间将用户分为热点用户和备选用户,通过时间离散化和时间切片的方法,将话题的时效性特征融入到其中,并且,针对热点话题在生命周期各阶段的数据不均匀和数据稀疏问题,构建了基于张量分解的预测模型。同时,为了体现话题发展的动态形式,在对话题进行时间切片后引入了增量张量分解模型对用户行为进行预测,使其动态的对用户行为进行预测,并且可以根据预测的用户行为把握话题的发展趋势。

Description

一种热点话题下动态预测用户行为的系统及方法
技术领域
本发明涉及社交网络分析领域,尤其涉及热点话题下基于张量分解的用户行为动态预测。
背景技术
随着互联网的发展,在社交网络大数据时代的条件下,微博成为一个基于用户关系的信息分享、传播和获取平台。通过挖掘微博用户间的交互行为数据,可以掌握社交网络中用户的行为、信息传播的规律。掌握用户行为特征,不仅可以帮助企业根据用户的行为特征为用户提供更好的产品和服务,还可以为不同的用户制定个性化的服务,从而提升自身企业的竞争力。而且,通过把握信息传播规律可以为有关部门对网络舆论进行合理的监控和干预提供理论依据。微博的出现极大地加快了信息传播的速度,微博提供的转发功能允许用户把其他微博用户的内容方便的呈现在自己的微博上进行分享,一条微博经过不同用户的转发,其受众面会呈几何形式递增,从而导致信息的病毒式传播和扩散,并且,微博的评论也可以体现出不同话题的热度以及波及的范围,因此,对用户行为的预测可以准确地推测出一条微博的传播范围和发展趋势等。同时,可以根据用户行为的预测,从而对社交网络中信息传播进行有效干预,控制信息传播的范围,这可以对舆论监控、网络水军的发现提供有力证据。
社会网络中的用户行为进行建模和预测是当前研究的重要问题,不仅需要各种技术手段分析用户行为的特点,还需要先进的技术对用户行为进行准确的建模和预测。目前关于互联网用户行为建模与预测方面的研究主要包含用户个体和群体行为两个方面。用户个体行为建模的研究主要基于数据驱动的建模方法,包括基于概率序列、条件随机场和主题模型等方法。如:根据用户的历史行为可能会对用户下一时刻采取的行为产生影响,Manavoglu和Pavlov提出采用概率序列模型来对用户行为进行建模,以时间顺序排列的用户行为序列为输入,以下一时刻将采取的行为的概率为输出;为更好地结合互联网用户个体的行为特征,除了用户自身的历史行为外,还需要考虑到用户所在的网络结构。根据网络结构特性,Peng等采用条件随机场对微博用户的转发行为进行建模。用户群体行为的研究,主要采用了随机模型(stochastic models)和时间序列模型等方法。如:Lerman和Hogg利用随机模型研究Digg网站上链接分享的得票总数。但是,以上基于用户个体和群体的用户行为预测都是静态的,基于热点话题的用户行为的动态预测的研究还比较少。并且,由于话题的时效性特征,在话题的不同阶段还存在数据不均匀和数据稀疏问题,这为动态进行用户行为预测带来了极大挑战。
为了动态预测用户的行为,本发明提出了基于热点话题的用户行为预测方法。为了说明本发明的实用性,需要具体的数据来验证,故本发明通过数据获取模块来获得本发明所需要的数据。由于本发明主要研究参与话题用户的粉丝是否会参与话题,故提出了属性提取模块来区分研究的对象。针对话题不同阶段的数据不均匀和数据稀疏问题,利用张量分解在数据空间转换和数据投影的特性,构建基于张量分解的预测模型。为了验证模型的实际效果,提出了模型预测分析模块验证模型的可用性及实用性。由于话题的爆发阶段会有很多用户一下子参与到该话题,从而导致话题下一阶段需要研究的粉丝量就会特别大,如何合理的确定需要研究的粉丝对象是本发明的一个难点。本发明未将合理过滤粉丝做为一个研究点,在后续研究中将会考虑此问题,为进一步提高模型的实用性而努力。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种热点话题下动态预测用户行为的系统及方法。本发明的技术方案如下:
一种热点话题下动态预测用户行为的系统,其包括数据获取模块,属性提取模块,模型构建模块和模型预测分析模块;其中数据获取模块,用于获取用户行为数据和用户关系数据;属性提取模块,用于提取社交网络中的用户参与话题的时间延迟属性并分为热点用户和备选用户;模型构建模块,根据备选用户的信息采用张量分解方法,构建用户参与热点话题预测模型;模型预测分析模块,利用张量进行分解得到模式展开矩阵的特征矩阵和核心张量,根据得到的特征矩阵和核心张量计算近似张量,并根据得到的近似张量预测备选用户的行为,在话题发展的不同阶段,根据新加入的备选用户行为数据构成的新张量和当前得到的特征矩阵和核心张量动态更新得到新的特征矩阵和核心张量,然后再根据新的特征矩阵和核心张量预测下一阶段的用户行为,同时,根据每一阶段预测的用户行为,可以把握话题发展的趋势。
进一步的,所述备选用户自身属性包括:备选用户是否是活跃用户,当备选用户过去一个月的动态达到某个阈值时就变为了活跃用户。并根据备选用户的属性构建话题当前阶段的张量,并得到张量模式展开成矩阵A(n),n=1,2,3,然后对张量模式展开成矩阵进行分解得到特征矩阵和核心张量S。
进一步的,所述张量模式展开成矩阵的分解采用的是Kernel SVD分解,KernelSVD分解是将张量的模式展开矩阵A(n)利用映射函数将A(n)的内容映射到高维空间,即
Figure BDA0001178557860000031
对于每一个A(n)可以找到一个对应的映射矩阵Gn,把A(n)中的每个元素axy映射成为Gn中的gxy,即gxy=Φ(axy),SVD分解计算A(n)(n=1,2,3)的左奇异矩阵U(n)是通过计算Gn
Figure BDA0001178557860000033
的特征向量所得,而Kernel SVD利用核函数代替了Gn
Figure BDA0001178557860000034
的内积计算,得到A(n)(n=1,2,3)的特征矩阵,并且根据特征矩阵的值计算核心张量。
进一步的,所述模型预测分析模块根据新加入的备选用户行为数据构成的新张量和当前得到的特征矩阵和核心张量动态更新得到新的特征矩阵和核心张量,包括:原始张量记为A,新增加的用户或新增加的话题构成的张量记为F,根据公式
Figure BDA0001178557860000032
Vt表示t阶段得到的右奇异矩阵,通过对张量F进行第一模式展开得到的展开矩阵F(1)可以(F(1)没有具体的计算公式,按图2的规则展开)计算得到矩阵B,对矩阵B进行Kernel SVD分解计算,得到矩阵B的三个特征矩阵UB,VB和ΣB,并根据公式:
Figure BDA0001178557860000041
Figure BDA0001178557860000042
得到新的特征矩阵
Figure BDA0001178557860000043
Figure BDA0001178557860000044
式中If的大小为I′1×I′1的单位阵,I′1表示新增加的用户。
进一步的,所述模型预测分析模块当对在某个话题下对用户行为进行预测的时候,根据更新后的特征因子
Figure BDA0001178557860000045
Figure BDA0001178557860000046
以及核心张量S,得到A*的近似张量
Figure BDA0001178557860000047
假设构建张量时第一模式表示用户u,第二模式表示话题s,第三模式表示用户行为a,因此对用户u在话题s下行为a的预测满足
Figure BDA0001178557860000048
Pusa表示用户u在话题s下进行动作a的预测值,当
Figure BDA0001178557860000049
大于某个阈值θ时,Pusa=1,则认为用户转发或评论了此话题的微博;反之,Pusa=0,则认为用户没有参与此话题,同时,可以根据预测的用户行为把握话题的发展趋势。
一种热点话题下动态预测用户行为的方法,其包括以下步骤:
获取社交网络中热点话题的互动数据以及用户的过往行为;根据用户的属性将用户定义为热点用户及其粉丝——备选用户;构建参与热点话题的用户行为预测模型即张量分解模型对用户行为进行预测;根据t阶段的已参与的用户预测t+1阶段备选用户的行为,结合话题的时效性特征,采用增量张量分解模型预测用户行为,根据预测的结果获取下一时刻备选用户归属的社交网络及数据流信息,调整网络结构。
进一步的,所述社交网络中热点话题的互动数据以及用户的过往行为的获取是利用网络爬虫或通过各社交网站开放API平台获取数据,数据内容是社交网络中热点话题的互动数据,包括用户行为数据和用户关系数据。
进一步的,根据用户的属性将用户定义为备选用户包括:
对数据进行切片以找出话题不同阶段的热点用户的粉丝——备选用户;
根据备选用户的信息构建张量A,张量A的数学表达式为
Figure BDA00011785578600000410
表示三阶张量,其中,张量的第一阶表示用户,即包括I1个用户;张量的第二阶表示话题,即包括I2个话题;张量的第三阶表示用户行为,即包括I3种行为。
Figure BDA0001178557860000051
体现了用户交互的信息,包括用户信息,话题信息和用户的行为。
本发明的优点及有益效果如下:
本发明是基于时间离散化及时间切片方法,加入话题信息的时效性影响,将话题生命周期分为几个不同的阶段并且针对热点话题不同阶段的数据不均匀和稀疏性问题,提出了一种高准确率,动态预测用户行为的张量分解模型,该模型不仅可以对用户行为进行预测还可以挖掘话题发展的趋势。
针对话题的周期性特点,采取了对话题进行时间切片,由于话题存在明显的时效性特征,那么对话题生命周期切片后,各阶段数据普遍存在不均匀性和稀疏性问题。由于张量可以良好的解决数据稀疏性问题,因此利用用户数据构建张量,并进行张量分解得到模式展开矩阵的特征矩阵和核心张量;由于话题在发展的过程中,不断会有新的用户,新的话题增加,故利用新增加的数据构成新的张量,利用增量张量分解动态更新各个特征矩阵和核心张量。最后,利用更新的特征矩阵和核心张量,得到近似张量,并根据设置合理的阈值对用户行为进行预测。同时,根据预测的用户行为把握话题的发展趋势。本发明采用的动态增量更新的方法解决了传统方法中静态数据的不足,提高了预测系统的实时性;而且,动态增量更新是根据历史结果和新增加的用户(话题)进行动态更新,不需要每次对所有数据构建张量进行分解,避免了每次都对历史行为进行重新计算。由于本发明可以根据用户行为的预测把握话题发展趋势,所以可以对舆情管控、网络水军的发现提供有力证据。
附图说明
图1是本发明提供优选实施例系统模型框架;
图2三阶张量的模式展开矩阵及具体实例;
图3张量动态更新的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
本发明解决上述技术问题的技术方案是:
由于参与热点话题的用户表现形式有:热点用户和备选用户,热点用户指在话题当前阶段参与的用户;备选用户指话题当前阶段热点用户的粉丝。本发明的目的是对话题下一阶段的备选用户进行行为预测,直至话题的生命周期结束。由于话题的时效性特征,基于时间离散化与时间切片方法,针对热点话题存在生命周期各阶段数据不均匀和数据稀疏问题,构建增量张量预测模型,使其动态预测备选用户的行为,并根据预测的用户行为把握话题的发展趋势。
本发明的实现过程具体表述为:给定热点话题下某个阶段t的社交网络
Figure BDA0001178557860000061
其中,Ut是热点用户,
Figure BDA0001178557860000065
表示好友关系边,
Figure BDA0001178557860000066
表示一系列话题下用户的历史交互信息。根据热点用户网络
Figure BDA0001178557860000062
找出备选用户网络
Figure BDA0001178557860000063
其中,Vt是备选用户。热点用户网络和备选用户网络构成了全网用户交互关系网
Figure BDA0001178557860000064
本发明根据t时间段的某话题下的话题参与情况来预测t+1阶段备选用户是否会参与此话题。本发明的模型框架图如图1所示,包括数据获取模块,属性提取模块,模型构建模块和模型预测分析模块。其中数据获取模块,用于获取用户行为数据和用户关系数据;属性提取模块,用于提取社交网络中的用户参与话题的时间延迟属性并分为热点用户和备选用户;模型构建模块,根据备选用户的信息采用张量分解方法,构建用户参与热点话题预测模型;模型预测分析模块,利用张量进行分解得到模式展开矩阵的特征矩阵和核心张量,根据得到的特征矩阵和核心张量计算近似张量,并根据得到的近似张量预测备选用户的行为,在话题发展的不同阶段,根据新加入的备选用户行为数据构成的新张量和当前得到的特征矩阵和核心张量动态更新得到新的特征矩阵和核心张量,然后再根据新的特征矩阵和核心张量预测下一阶段的用户行为,同时,根据每一阶段预测的用户行为,可以把握话题发展的趋势。
详细实施过程如下:
S1:获取数据源。数据获取可以利用网络爬虫或通过各社交网站开放API平台获取数据。数据内容是社交网络中热点话题的互动数据,包括用户行为数据和用户关系数据。
S2:提取属性模块。将社交网络中的用户根据参与话题的时间延迟分为热点用户和备选用户。
S3:建立模型,根据张量分解的基础思想和方法,构建用户参与热点话题预测模型。利用话题初始阶段(t0)的备选用户的行为数据构建张量A。
S31:话题从产生、发展到消亡要经历一个时间段称之为生命周期,为了更好的体现话题各生命阶段的特征,将话题数据进行了时间切片。对数据进行切片是为了找出话题不同阶段的热点用户的粉丝——备选用户。
S32:根据备选用户的信息构建张量A,张量A的数学表达式为
Figure BDA0001178557860000071
表示三阶张量,其中,张量的第一阶表示用户,即包括I1个用户;张量的第二阶表示话题,即包括I2个话题;张量的第三阶表示用户行为,即包括I3种行为。
Figure BDA0001178557860000072
体现了用户交互的信息,包括用户信息,话题信息和用户的行为。
S4:预测和分析过程。对S3中的张量A进行分解得到模式展开矩阵的特征矩阵和核心张量,根据得到的特征矩阵和核心张量计算近似张量
Figure BDA0001178557860000073
并根据得到的近似张量预测备选用户的行为。在话题发展的不同阶段,根据新加入的备选用户行为数据构成的新张量和当前得到的特征矩阵和核心张量动态更新得到新的特征矩阵和核心张量,然后再根据新的特征矩阵和核心张量预测下一阶段的用户行为。同时,根据每一阶段预测的用户行为,可以把握话题发展的趋势,张量动态更新的流程图如图3所示。
S41:将S3中构建的张量A进行分解运算,首先将张量A按模式展开成矩阵A(1),A(2)和A(3),具体展开过程如图2所示;然后分别对每一个模式展开矩阵进行Kernel SVD分解,得到话题当前阶段t(t0)相应的特征矩阵
Figure BDA0001178557860000081
Figure BDA0001178557860000082
并利用得到的特征矩阵计算核心张量。
S411:由于张量的模式展开矩阵A(n)(n=1,2,3)同样存在数据稀疏问题,为了解决此问题,本发明没有采用传统的SVD分解,而是选择了Kernel SVD分解。Kernel SVD分解是将张量的模式展开矩阵A(n)利用映射函数将A(n)的内容映射到高维空间,即
Figure BDA0001178557860000083
因此,对于每一个A(n)可以找到一个对应的映射矩阵Gn,把A(n)中的每个元素axy映射成为Gn中的gxy,即gxy=Φ(axy)。对于每个Gn矩阵应用SVD分解,即Gn=U(n)Σ(n)(V(n))T。为了避免显示计算Gn矩阵,可以采用一种内积的形式,定义一个矩阵Dn且满足
Figure BDA0001178557860000084
对于Dn的计算是通过计算Gn的内积得到的,可以利用核函数替代此内积的计算。Dn是对称的方阵,对其进行特征值分解Dn=QΣQ-1,Q即是左奇异矩阵U(n),当
Figure BDA0001178557860000085
可以得出右奇异矩阵V(n)和特征矩阵Σ(n),这样就可以得到所需的特征矩阵。
S412:根据S411中计算的U(n)和公式S=A×1(U(1))T×2(U(2))T×3(U(3))T得到核心张量S。
S42:在话题的t+1阶段,会有新的备选用户作为潜在用户存在,这些新的备选用户数据构成张量F,表示为
Figure BDA0001178557860000086
t时刻的张量为
Figure BDA0001178557860000087
两者在第一模式上合并后的张量为
Figure BDA0001178557860000088
其中
Figure BDA0001178557860000089
S421:将张量A*按照模式展开成矩阵
Figure BDA00011785578600000810
Figure BDA00011785578600000811
其中
Figure BDA00011785578600000812
Figure BDA00011785578600000813
Figure BDA00011785578600000820
经过列变换得到,
Figure BDA00011785578600000814
也是
Figure BDA00011785578600000821
经过列变换得到。
S422:由于Ut,Vt是正交矩阵,所以有
Figure BDA00011785578600000815
Figure BDA00011785578600000816
做如下计算:
Figure BDA00011785578600000817
其中
Figure BDA00011785578600000818
Figure BDA00011785578600000819
可以通过计算张量F的第一模式的展开矩阵F(1)得到。
S423:根据Kernel SVD分解有
Figure BDA0001178557860000091
再根据公式
Figure BDA0001178557860000092
Figure BDA0001178557860000093
Figure BDA0001178557860000094
可以得到
Figure BDA0001178557860000095
的特征矩阵,其中
Figure BDA0001178557860000096
是单位阵。
S424:对
Figure BDA0001178557860000097
做如下计算:
Figure BDA0001178557860000098
Figure BDA0001178557860000099
矩阵H可以通过计算张量F的第二模式的展开矩阵F(2)得到。
S425:根据Kernel SVD分解有
Figure BDA00011785578600000910
再根据公式
Figure BDA00011785578600000911
Figure BDA00011785578600000912
由于
Figure BDA00011785578600000913
Figure BDA00011785578600000921
经过列变换得到,所以
Figure BDA00011785578600000914
应该做相应的逆变换。同理,按照S424和S425得到
Figure BDA00011785578600000915
Figure BDA00011785578600000916
S426:根据核心张量
Figure BDA00011785578600000917
Figure BDA00011785578600000918
假设构建张量时第一模式表示用户u,第二模式表示话题s,第三模式表示用户行为a,因此对用户u在话题s下行为a的预测满足
Figure BDA00011785578600000919
用户u在话题s下进行动作a的预测值用Pusa表示,当
Figure BDA00011785578600000920
大于某个阈值θ时,将其置为1,即Pusa=1,则认为用户转发或评论了此话题的微博;反之,Pusa=0,则认为用户没有参与此话题。
S5:重复S4的过程,直至话题的生命周期结束。同时,通过预测话题的不同阶段备选用户的行为,可以判断出话题的每一阶段有多少人参与,从而可以把握话题的发展趋势。
本发明利用社交网络中热点话题的互动数据根据用户属性将用户分为热点用户和备选用户,利用张量分解及增量张量分解模型动态预测话题不同阶段备选用户的行为,即在话题生命周期的下一阶段备选用户是否会转发或评论该话题下的微博,并且通过预测的备选用户行为也可以把握话题发展的未来趋势。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims (6)

1.一种热点话题下动态预测用户行为的系统,其特征在于,包括数据获取模块,属性提取模块,模型构建模块和模型预测分析模块;其中数据获取模块,用于获取用户行为数据和用户关系数据;属性提取模块,用于提取社交网络中的用户参与话题的时间延迟属性并分为热点用户和备选用户;模型构建模块,根据备选用户的信息采用张量分解方法,构建用户参与热点话题预测模型;模型预测分析模块,利用张量进行分解得到模式展开矩阵的特征矩阵和核心张量,根据得到的特征矩阵和核心张量计算近似张量,并根据得到的近似张量预测备选用户的行为,在话题发展的不同阶段,根据新加入的备选用户行为数据构成的新张量和当前得到的特征矩阵和核心张量动态更新得到新的特征矩阵和核心张量,然后再根据新的特征矩阵和核心张量预测下一阶段的用户行为,同时,根据每一阶段预测的用户行为,可以把握话题发展的趋势;
所述备选用户自身属性为:备选用户是否是活跃用户,当备选用户过去一个月的动态达到某个阈值时就变为了活跃用户,并根据备选用户的属性构建话题当前阶段的张量,并得到张量模式展开成矩阵A(n),n=1,2,3,然后对张量模式展开成矩阵进行分解得到特征矩阵和核心张量S;所述张量模式展开成矩阵的分解采用的是Kernel SVD分解,Kernel SVD分解是将张量的模式展开矩阵A(n)利用映射函数将A(n)的内容映射到高维空间,即
Figure FDA0002425331150000011
对于每一个A(n)可以找到一个对应的映射矩阵Gn,把A(n)中的每个元素axy映射成为Gn中的gxy,即gxy=Φ(axy),SVD分解计算A(n)(n=1,2,3)的左奇异矩阵U(n)是通过计算
Figure FDA0002425331150000012
的特征向量所得,而Kernel SVD利用核函数代替了
Figure FDA0002425331150000013
的内积计算,得到A(n)(n=1,2,3)的特征矩阵,并且根据特征矩阵的值计算核心张量。
2.根据权利要求1所述的热点话题下动态预测用户行为的系统,其特征在于,所述模型预测分析模块根据新加入的备选用户行为数据构成的新张量和当前得到的特征矩阵和核心张量动态更新得到新的特征矩阵和核心张量,包括:原始张量记为A,新增加的用户或新增加的话题构成的张量记为F,根据公式
Figure FDA0002425331150000021
Vt表示t阶段得到的右奇异矩阵,通过对张量F进行第一模式展开得到的展开矩阵F(1)可以计算得到矩阵B,对矩阵B进行Kernel SVD分解计算,得到矩阵B的三个特征矩阵UB,VB和∑B,并根据公式:
Figure FDA0002425331150000022
Figure FDA0002425331150000023
得到新的特征矩阵
Figure FDA0002425331150000024
Figure FDA0002425331150000025
式中If的大小为I′1×I′1的单位阵,I′1表示新增加的用户。
3.根据权利要求2所述的热点话题下动态预测用户行为的系统,其特征在于,所述模型预测分析模块当对在某个话题下对用户行为进行预测的时候,根据更新后的特征因子
Figure FDA0002425331150000026
Figure FDA0002425331150000027
以及核心张量S,得到A*的近似张量
Figure FDA0002425331150000028
假设构建张量时第一模式表示用户u,第二模式表示话题s,第三模式表示用户行为a,因此对用户u在话题s下行为a的预测满足
Figure FDA0002425331150000029
Pusa表示用户u在话题s下进行动作a的预测值,当
Figure FDA00024253311500000210
大于某个阈值θ时,Pusa=1,则认为用户转发或评论了此话题的微博;反之,Pusa=0,则认为用户没有参与此话题,同时,可以根据预测的用户行为把握话题的发展趋势。
4.一种热点话题下动态预测用户行为的方法,其特征在于,包括以下步骤:获取社交网络中热点话题的互动数据以及用户的过往行为;根据用户的属性将用户定义为热点用户及其粉丝——备选用户;构建参与热点话题的用户行为预测模型即张量分解模型对用户行为进行预测;根据t阶段的已参与的用户预测t+1阶段备选用户的行为,结合话题的时效性特征,采用增量张量分解模型预测用户行为,根据预测的结果获取下一时刻备选用户归属的社交网络及数据流信息,调整网络结构;
所述备选用户自身属性为:备选用户是否是活跃用户,当备选用户过去一个月的动态达到某个阈值时就变为了活跃用户,并根据备选用户的属性构建话题当前阶段的张量,并得到张量模式展开成矩阵A(n),n=1,2,3,然后对张量模式展开成矩阵进行分解得到特征矩阵和核心张量S;所述张量模式展开成矩阵的分解采用的是Kernel SVD分解,Kernel SVD分解是将张量的模式展开矩阵A(n)利用映射函数将A(n)的内容映射到高维空间,即
Figure FDA0002425331150000031
对于每一个A(n)可以找到一个对应的映射矩阵Gn,把A(n)中的每个元素axy映射成为Gn中的gxy,即gxy=Φ(axy),SVD分解计算A(n)(n=1,2,3)的左奇异矩阵U(n)是通过计算
Figure FDA0002425331150000032
的特征向量所得,而Kernel SVD利用核函数代替了
Figure FDA0002425331150000033
的内积计算,得到A(n)(n=1,2,3)的特征矩阵,并且根据特征矩阵的值计算核心张量。
5.根据权利要求4所述热点话题下动态预测用户行为的方法,其特征在于,
所述社交网络中热点话题的互动数据以及用户的过往行为的获取是利用网络爬虫或通过各社交网站开放API平台获取数据,数据内容是社交网络中热点话题的互动数据,包括用户行为数据和用户关系数据。
6.根据权利要求5所述热点话题下动态预测用户行为的方法,其特征在于,
根据用户的属性将用户定义为备选用户包括:
对数据进行切片以找出话题不同阶段的热点用户的粉丝——备选用户;
根据备选用户的信息构建张量A,张量A的数学表达式为
Figure FDA0002425331150000034
表示三阶张量,其中,张量的第一阶表示用户,即包括I1个用户;张量的第二阶表示话题,即包括I2个话题;张量的第三阶表示用户行为,即包括I3种行为,
Figure FDA0002425331150000035
体现了用户交互的信息,包括用户信息,话题信息和用户的行为。
CN201611144446.7A 2016-12-13 2016-12-13 一种热点话题下动态预测用户行为的系统及方法 Active CN106651016B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611144446.7A CN106651016B (zh) 2016-12-13 2016-12-13 一种热点话题下动态预测用户行为的系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611144446.7A CN106651016B (zh) 2016-12-13 2016-12-13 一种热点话题下动态预测用户行为的系统及方法

Publications (2)

Publication Number Publication Date
CN106651016A CN106651016A (zh) 2017-05-10
CN106651016B true CN106651016B (zh) 2020-08-04

Family

ID=58824950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611144446.7A Active CN106651016B (zh) 2016-12-13 2016-12-13 一种热点话题下动态预测用户行为的系统及方法

Country Status (1)

Country Link
CN (1) CN106651016B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108228779B (zh) * 2017-12-28 2021-03-23 华中师范大学 一种基于学习社区对话流的成绩预测方法
CN108776844B (zh) * 2018-04-13 2021-09-14 中国科学院信息工程研究所 基于上下文感知张量分解的社交网络用户行为预测方法
CN111913921A (zh) * 2019-05-08 2020-11-10 中国移动通信集团福建有限公司 用户行为分析方法及装置、设备及存储介质
CN110287377B (zh) * 2019-05-13 2021-11-23 湖南大学 在线社交网络的增量式组水平的话题流行度预测方法
CN110825948B (zh) * 2019-11-05 2022-10-18 重庆邮电大学 基于促谣-辟谣消息和表示学习的谣言传播控制方法
CN112749335B (zh) * 2020-09-08 2023-11-07 腾讯科技(深圳)有限公司 生命周期状态预测方法、装置、计算机设备和存储介质
CN112270568B (zh) * 2020-11-02 2022-07-12 重庆邮电大学 面向隐藏信息的社交电商平台营销活动下单率预测方法
CN117539963B (zh) * 2024-01-10 2024-04-05 山东大学 一种社交网络数据动态分析方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013044564A1 (zh) * 2011-09-29 2013-04-04 北京亿赞普网络技术有限公司 一种用户网络行为分析方法、装置和系统
CN104123377A (zh) * 2014-07-30 2014-10-29 福州大学 一种微博话题热度预测系统及方法
CN104331404A (zh) * 2013-07-22 2015-02-04 中国科学院深圳先进技术研究院 一种基于用户手机上网数据的用户行为预测方法和装置
CN104408108A (zh) * 2014-11-18 2015-03-11 重庆邮电大学 基于灰色系统理论的热点话题群体影响力分析系统及方法
CN105809554A (zh) * 2016-02-07 2016-07-27 重庆邮电大学 一种社交网络中用户参与热点话题的预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013044564A1 (zh) * 2011-09-29 2013-04-04 北京亿赞普网络技术有限公司 一种用户网络行为分析方法、装置和系统
CN104331404A (zh) * 2013-07-22 2015-02-04 中国科学院深圳先进技术研究院 一种基于用户手机上网数据的用户行为预测方法和装置
CN104123377A (zh) * 2014-07-30 2014-10-29 福州大学 一种微博话题热度预测系统及方法
CN104408108A (zh) * 2014-11-18 2015-03-11 重庆邮电大学 基于灰色系统理论的热点话题群体影响力分析系统及方法
CN105809554A (zh) * 2016-02-07 2016-07-27 重庆邮电大学 一种社交网络中用户参与热点话题的预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于用户行为和会话的Web应用测试方法;武晋南 等;《计算机工程》;20100430;第36卷(第8期);全文 *

Also Published As

Publication number Publication date
CN106651016A (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
CN106651016B (zh) 一种热点话题下动态预测用户行为的系统及方法
Zhu et al. Complex dynamic behavior of a rumor propagation model with spatial-temporal diffusion terms
Lahrouz et al. Necessary and sufficient condition for extinction and persistence of SIRS system with random perturbation
Guo et al. System reliability assessment with multilevel information using the Bayesian melding method
Holko et al. Epidemiological modeling with a population density map-based cellular automata simulation system
Ronqui et al. Analyzing complex networks through correlations in centrality measurements
Fogués et al. BFF: A tool for eliciting tie strength and user communities in social networking services
Eustace et al. Overlapping community detection using neighborhood ratio matrix
Schimit et al. Disease spreading in complex networks: A numerical study with Principal Component Analysis
Kundu et al. Deprecation based greedy strategy for target set selection in large scale social networks
Dong et al. Spectral based hypothesis testing for community detection in complex networks
Acebron A Monte Carlo method for computing the action of a matrix exponential on a vector
Mukherjee et al. Understanding how both the partitions of a bipartite network affect its one-mode projection
Sun et al. Dynamic community detection based on the Matthew effect
Ling et al. Nestpp: Modeling thread dynamics in online discussion forums
Wang et al. Link prediction based on weighted synthetical influence of degree and H-index on complex networks
Hussain et al. Toward a formal, visual framework of emergent cognitive development of scholars
Xiao et al. On necessary conditions for scale-freedom in complex networks, with applications to computer communication systems
Ding et al. Control backbone: An index for quantifying a node׳ s importance for the network controllability
Chen et al. Graph embedding based ant colony optimization for negative influence propagation suppression under cost constraints
Severiukhina et al. Parallel data-driven modeling of information spread in social networks
Pu et al. Dynamic adaptive spatio–temporal graph network for COVID‐19 forecasting
CN115017275A (zh) 一种基于图神经网络和知识图谱的会话推荐方法及系统
Zhang et al. Space-invariant projection in streaming network embedding
Almodfer et al. Chaotic honey badger algorithm for single and double photovoltaic cell/module

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant