CN106372437A - 一种信息扩散预测的方法和装置 - Google Patents

一种信息扩散预测的方法和装置 Download PDF

Info

Publication number
CN106372437A
CN106372437A CN201610808101.0A CN201610808101A CN106372437A CN 106372437 A CN106372437 A CN 106372437A CN 201610808101 A CN201610808101 A CN 201610808101A CN 106372437 A CN106372437 A CN 106372437A
Authority
CN
China
Prior art keywords
user
node
kernel function
function formula
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610808101.0A
Other languages
English (en)
Other versions
CN106372437B (zh
Inventor
高升
庞华璨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201610808101.0A priority Critical patent/CN106372437B/zh
Publication of CN106372437A publication Critical patent/CN106372437A/zh
Application granted granted Critical
Publication of CN106372437B publication Critical patent/CN106372437B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种信息扩散预测的方法和装置,其中,信息扩散预测的方法,包括:获取传播预设信息的当前用户和用户特征、前一个用户和用户特征;映射前一个用户及其用户特征到潜在向量空间中,得到第一用户结点和第一用户特征向量,映射当前用户及其用户特征到潜在向量空间中,得到第二用户结点和第二用户特征向量;根据第一用户结点和第一用户特征向量、第二用户结点和第二用户特征向量,建立潜在向量空间模型;对潜在向量空间模型进行学习,得到与第一用户结点和第一特征向量、及第二用户结点和第二特征向量相关的核函数公式;根据核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势。

Description

一种信息扩散预测的方法和装置
技术领域
本发明涉及信息传播领域,特别是涉及一种信息扩散预测的方法和装置。
背景技术
近几年社会网络分析领域的相关研究已经愈发受到人们的重视,而其中信息传播已成为研究焦点之一。目前随着研究的深入,信息传播领域的研究已经逐步分成了四类:社区发现、社会影响预测、信息源检测以及链接预测。在链接预测中还有一个细分的研究领域,即传播预测,其目标是预测在社交网络中信息最终会影响到哪些人群。
目前传播预测的模型分为两类,相似度模型和概率模型。相似度模型预测时以大量的历史数据为依据,通过找到网络结构内在的规律,以及网络中每个用户的特定社交行为规律和偏好发现相似性,通过分类或聚类算法将相似度高的结点用户放在一起,并且假设越相近的用户越容易彼此影响;概率模型预测时,以大量的用户信息作为输入信息,通过参数模型特征,通过最大化(或最小化,视模型而定)目标函数求得最优参数解,从而能最好的拟合已有数据(训练集),通过用户间的概率预测训练集中的数据,需要大量的历史数据才能通过概率进行预测。
然而,以上两种模型的核心是用户在网络中的行为关系,包括彼此的好友关系网络,用户相似性等;需要大量的用户信息才能对信息的传播进行预测。
发明内容
本发明实施例的目的在于提供一种信息扩散预测的方法和装置,以解决目前信息传播中需要大量的用户信息才能进行预测的问题。
达到上述目的,本发明实施例公开了一种信息扩散预测的方法,包括:
获取在社交网络中传播预设信息的当前用户和用户特征、以及前一个用户和用户特征,其中,当前用户和前一个用户是按照传播所述预设信息的先后顺序进行排序的,且前一个用户传播预设信息在当前用户传播预设信息之前;
映射前一个用户和与前一个用户对应的用户特征到潜在向量空间中,得到第一用户结点和第一用户特征向量,以及映射当前用户和与当前用户对应的用户特征到潜在向量空间中,得到第二用户结点和第二用户特征向量;
根据第一用户结点和第一用户特征向量、第二用户结点和第二用户特征向量,建立潜在向量空间模型;其中,潜在向量空间模型至少包括:处于潜在向量空间坐标系的原点处的第一用户结点、到与处于潜在向量空间坐标系内的其他相邻结点的向量,该其他相邻结点为除第一用户结点以外的其他结点;
对潜在向量空间模型进行学习,得到与第一用户结点和第一特征向量、及第二用户结点和第二特征向量相关的核函数公式;
根据该核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势。
较优地,映射前一个用户和与前一个用户对应的用户特征到潜在向量空间中,得到第一用户结点和第一用户特征向量,以及映射当前用户和与当前用户对应的用户特征到潜在向量空间中,得到第二用户结点和第二用户特征向量,包括:
对前一个用户对应的用户特征、和当前用户对应的用户特征,分别对应分配预设向量,得到前一个用户的第一特征向量和当前用户的第二特征向量;
将位于潜在向量空间中坐标原点处的前一个用户,确定为前一个用户的第一用户结点,将位于潜在向量空间坐标系中的第一坐标点处的当前用户,确定为当前用户的第二用户结点。
较优地,该核函数公式为:
k ( x , y ) = e - | | x + r - y | | d 2 t 2
其中,k(x,y)为核函数,x为第一用户结点,r为第一特征向量,y为第二用户结点,||·||d为欧氏距离,为时间,x,r,y分别为R维向量R为所述潜在向量空间模型的维数。
较优地,根据该核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,包括:
根据该核函数公式,确定该核函数公式的单调性及该核函数公式中的欧氏距离的单调性;
根据该核函数公式中的欧氏距离的单调性,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,其中,该核函数公式中的欧氏距离的单调性与该核函数公式的单调性相反。
较优地,根据该核函数公式中的欧氏距离的单调性,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势之后,本发明实施例的信息扩散预测的方法还包括:
根据该核函数公式中的欧氏距离:
f(v)=min{||y+r-v||d}
确定其他相邻结点中传播预设信息的用户结点;
其中,y为第二用户结点,r为第二特征向量,v为社交网络中没有传播预设信息的其他用户结点,||·||d为欧氏距离,x,r,v分别为R维向量,R为潜在空间向量的维数,f(v)为社交网络中没有传播预设信息的其他用户结点v与第二用户结点y的最小欧氏距离,第二特征向量与第一特征向量相同。
较优地,根据该核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势之后,本发明实施例的信息扩散预测的方法还包括:
通过随机梯度下降算法,确定锁链损失函数公式的最小值;
获取锁链损失函数公式的最小值,对预测的传播趋势进行误差估计。
为了达到上述目的,本发明实施例公开了一种信息扩散预测的装置,包括:
获取模块,用于获取在社交网络中传播预设信息的当前用户和用户特征、以及前一个用户和用户特征,其中,当前用户和前一个用户是按照传播预设信息的先后顺序进行排序的,且前一个用户传播预设信息在当前用户传播预设信息之前;
映射模块,用于映射前一个用户和与前一个用户对应的用户特征到潜在向量空间中,得到第一用户结点和第一用户特征向量,以及映射当前用户和与当前用户对应的用户特征到潜在向量空间中,得到第二用户结点和第二用户特征向量;
建模模块,用于根据第一用户结点和第一用户特征向量、第二用户结点和第二用户特征向量,建立潜在向量空间模型;其中,潜在向量空间模型至少包括:处于潜在向量空间坐标系的原点处的第一用户结点、到与处于潜在向量空间坐标系内的其他相邻结点的向量,其他相邻结点为除第一用户结点以外的其他结点;
学习模块,用于对潜在向量空间模型进行学习,得到与第一用户结点和第一特征向量、及第二用户结点和第二特征向量相关的核函数公式;
预测模块,用于根据核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势。
较优地,映射模块还包括:
分配子模块,用于对前一个用户对应的用户特征、和当前用户对应的用户特征,分别对应分配预设向量,得到前一个用户的第一特征向量和当前用户的第二特征向量;
结点确定子模块,用于将位于潜在向量空间中坐标原点处的前一个用户,确定为前一个用户的第一用户结点,将位于潜在向量空间坐标系中的第一坐标点处的当前用户,确定为当前用户的第二用户结点。
较优地,核函数公式为:
k ( x , y ) = e - | | x + r - y | | d 2 t 2
其中,k(x,y)为核函数,x为第一用户结点,r为第一特征向量,y为第二用户结点,||·||d为欧氏距离,为时间,x,r,y分别为R维向量,R为潜在向量空间模型的维数。
较优地,预测模块还包括:
计算子模块,用于根据核函数公式,确定核函数公式的单调性及核函数公式中的欧氏距离的单调性;
预测子模块,用于根据核函数公式中的欧氏距离的单调性,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,其中,核函数公式中的欧氏距离的单调性与核函数公式的单调性相反。
由上述的技术方案可见,本发明实施例提供了一种信息扩散预测的方法和装置,通过使用核函数公式对第一用户结点、第二用户结点及第一特征向量进行学习,进而使用核函数公式对预设信息的传播趋势进行预测,不需要大量用户信息作为样本就可以进行预测,减小了样本量,提高了预测速度,解决了目前信息传播中需要大量的用户信息才能进行预测的问题。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的信息扩散预测的方法的流程图;
图2为本发明实施例的信息扩散预测的装置的结构框图;
图3为本发明实施例的信息扩散预测的装置的预测模块的结构框图;
图4为本发明实施例的信息扩散预测的装置的潜在向量空间模型与热力学传播模型、独立级联模型及热量扩散模型在追踪社区上的准确率对比图;
图5为本发明实施例的信息扩散预测的装置的潜在向量空间模型与热力学传播模型、独立级联模型及热量扩散模型在谷歌社区上的准确率对比图;
图6为本发明实施例的信息扩散预测的装置的潜在向量空间模型与热力学传播模型、独立级联模型及热量扩散模型在掘客上的准确率对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1为本发明实施例的信息扩散预测的方法的流程图,本发明实施例的信息扩散预测的方法包括:
S100:获取在社交网络中传播预设信息的当前用户和用户特征、以及前一个用户和用户特征,其中,当前用户和前一个用户是按照传播所述预设信息的先后顺序进行排序的,且前一个用户传播预设信息在当前用户传播预设信息之前;
具体地,预设信息为在社交网络中传播任一个信息的信息,用户特征为用户传播该信息时与该信息相关的特征。
比如,前一个用户和当前用户在社交网络中传播了一条关于打篮球的信息,那么,前一个用户的用户特征和当前用户的用户特征都是篮球。
S110:映射前一个用户和与前一个用户对应的用户特征到潜在向量空间中,得到第一用户结点和第一用户特征向量,以及映射当前用户和与当前用户对应的用户特征到潜在向量空间中,得到第二用户结点和第二用户特征向量;
在本步骤中,通过映射,得到第一用户结点和第一用户特征向量、以及第二用户结点和第二用户特征向量,能够在潜在向量空间模型中进行表示。
S120:根据第一用户结点和第一用户特征向量、第二用户结点和第二用户特征向量,建立潜在向量空间模型;其中,潜在向量空间模型至少包括:处于潜在向量空间坐标系的原点处的第一用户结点、到与处于潜在向量空间坐标系内的其他相邻结点的向量,该其他相邻结点为除第一用户结点以外的其他结点;
S130:对潜在向量空间模型进行学习,得到与第一用户结点和第一特征向量、及第二用户结点和第二特征向量相关的核函数公式;
具体地,该核函数公式为:
k ( x , y ) = e - | | x + r - y | | d 2 t 2
其中,k(x,y)为核函数,x为第一用户结点,r为第一特征向量,y为第二用户结点,||·||d为欧氏距离,为时间,x,r,y分别为R维向量R为所述潜在向量空间模型的维数。
S140:根据该核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势。
具体地,在本步骤中,上述的传播趋势可以是第二用户结点能够传播该预设信息给其他相邻结点中的几个相邻结点;还可以是
第二用户结点传播该预设信息给其他相邻结点中的相邻接点的先后顺序,其中,先后顺序是按照核函数的大小进行排序的,核函数值大,先传播给该相邻结点,核函数值小,后传播给该相邻结点。
可见,本发明实施例的信息扩散预测的方法,通过使用核函数公式对第一用户结点、第二用户结点及第一特征向量进行学习,进而使用核函数公式对预设信息的传播趋势进行预测,不需要大量用户信息作为样本就可以进行预测,减小了样本量,提高了预测速度,解决了目前信息传播中需要大量的用户信息才能进行预测的问题。
优选地,本发明实施例的信息扩散预测的方法中,映射前一个用户和与前一个用户对应的用户特征到潜在向量空间中,得到第一用户结点和第一用户特征向量,以及映射当前用户和与当前用户对应的用户特征到潜在向量空间中,得到第二用户结点和第二用户特征向量,包括:
第一步,对前一个用户对应的用户特征、和当前用户对应的用户特征,分别对应分配预设向量,得到前一个用户的第一特征向量和当前用户的第二特征向量;
第二步,将位于潜在向量空间中坐标原点处的前一个用户,确定为前一个用户的第一用户结点,将位于潜在向量空间坐标系中的第一坐标点处的当前用户,确定为当前用户的第二用户结点。
具体地,本步骤中的第一坐标点,按照实际需求,为当前用户在潜在向量空间坐标系中的位置,可以是潜在向量空间坐标系中的除原点以外的其他坐标点。
优选地,本发明实施例的信息扩散预测的方法中,根据核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,包括:
第一步,根据该核函数公式,确定该核函数公式的单调性及该核函数公式中的欧氏距离的单调性;
第二步,根据该核函数公式中的欧氏距离的单调性,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,其中,该核函数公式中的欧氏距离的单调性与该核函数公式的单调性相反。
在本步骤中,通过确定该核函数公式中的欧氏距离的单调性与该核函数公式的单调性相反,将通过核函数公式进行信息扩散预测转换为通过欧氏距离进行信息扩散预测,消除了时间对传播趋势的影响,同时,简化了计算过程,提高了预测速度。
优选地,根据该核函数公式中的欧氏距离的单调性,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势之后,本发明实施例的信息扩散预测的方法还包括:
根据该核函数公式中的欧氏距离:
f(v)=min{||y+r-v||d}
确定其他相邻结点中传播预设信息的用户结点;
其中,y为第二用户结点,r为第二特征向量,v为社交网络中没有传播预设信息的其他用户结点,||·||d为欧氏距离,x,r,v分别为R维向量,R为潜在空间向量的维数,f(v)为社交网络中没有传播预设信息的其他用户结点v与第二用户结点y的最小欧氏距离,第二特征向量与第一特征向量相同。
具体地,在根据该核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势之后,本发明实施例的信息扩散预测的方法还包括:
通过随机梯度下降算法,确定锁链损失函数公式的最小值;
获取锁链损失函数公式的最小值,对预测的传播趋势进行误差估计。
具体地,根据公式:
f(z)=min(0,|1-z|)
通过随机梯度下降算法,确定锁链损失函数公式的最小值,对预测的传播趋势进行误差估计,其中,f(z)为锁链损失函数公式的最小值,z为输入的变量,可以是核函数的值,还可以是欧氏距离的值。
具体地,本步骤中的误差估计具体为:上述锁链损失函数公式的最小值越小,则说明预测的越准确,反之,锁链损失函数公式的最小值越大,则说明预测的越不准确。
为了更清楚的说明本发明实施例的一种信息传播的预测方法,下面以对第l条信息的传播进行预测为例对本发明实施例进行说明:
假设C为社交网络中所有数据集中的信息序列(即一条消息沿着时间轴依次影响的用户结点)集合,Cl为第l条信息序列,ui、uj分别为潜在空间向量模型中没有传播第l条信息的两个用户结点,为潜在空间向量中传播第l条信息的当前用户结点,分别为没有传播第l条信息的两个用户结点ui、uj传播第l条信息的时间,为当前用户的特征向量。
分别将uiuj分别代入核函数公式得到:
k ( u s l , t lu i , u i ) = | | u s l + r s l - u i | | d 2 t lu i 2
k ( u s l , t lu j , u j ) = | | u s l + r s l - u j | | d 2 t lu j 2
时,可知用户结点ui比用户结点uj更容易传播第l条信息;
时,可知用户结点uj比用户结点ui更容易传播第l条信息。
具体地,假设
由核函数公式的单调性知,若则:
| | u s l + r s l - u i | | d 2 t lu i 2 < | | u s l + r s l - u j | | d 2 t lu j 2
经过变换得到:
| | u s l + r s l - u i | | d < t lu i 2 t lu j 2 | | u s l + r s l - u j | | d < | | u s l + r s l - u j | | d
因此,若用户结点ui的核函数值越大,则在潜在空间向量模型中,ui距离越近,就越容易传播第l条信息。
进一步地,根据本发明实施例的信息扩散预测的方法,可以通过公式:
f ( u n ) = min { | | u s l + r s l - u n | | d }
确定多个用户结点中传播第l条信息的用户结点对应的用户。
其中,un为社交网络中没有传播第l条信息的其他用户结点,为当前用户结点,为当前用户结点的特征向量,||·||d为欧氏距离,f(un)为社交网络中社交网络中没有传播第l条信息的其他用户结点与当前用户节点的最小欧氏距离。
具体地,在进行信息扩散预测时,选择与欧氏距离最近的用户,即为最有可能传播第l条信息的用户。
进一步地,为了使信息扩散预测更加准确,通过随机梯度下降算法,确定锁链损失函数公式的最小值,对预测的传播趋势进行误差估计。其中,随机梯度下降算法为现有技术,在此不再赘述。
参见图2,图2为本发明实施例的信息扩散预测的装置的结构框图,本发明实施例的信息扩散预测的装置包括:
获取模块200,用于获取在社交网络中传播预设信息的当前用户和用户特征、以及前一个用户和用户特征,其中,当前用户和前一个用户是按照传播预设信息的先后顺序进行排序的,且前一个用户传播预设信息在当前用户传播预设信息之前。
映射模块210,用于映射前一个用户和与前一个用户对应的用户特征到潜在向量空间中,得到第一用户结点和第一用户特征向量,以及映射当前用户和与当前用户对应的用户特征到潜在向量空间中,得到第二用户结点和第二用户特征向量。
建模模块220,用于根据第一用户结点和第一用户特征向量、第二用户结点和第二用户特征向量,建立潜在向量空间模型;其中,潜在向量空间模型至少包括:处于潜在向量空间坐标系的原点处的第一用户结点、到与处于潜在向量空间坐标系内的其他相邻结点的向量,其他相邻结点为除第一用户结点以外的其他结点;
学习模块230,用于对潜在向量空间模型进行学习,得到与第一用户结点和第一特征向量、及第二用户结点和第二特征向量相关的核函数公式;
具体地,核函数公式为:
k ( x , y ) = e - | | x + r - y | | d 2 t 2
其中,k(x,y)为核函数,x为第一用户结点,r为第一特征向量,y为第二用户结点,||·||d为欧氏距离,为时间,x,r,y分别为R维向量,R为潜在向量空间模型的维数。
预测模块240,用于根据核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势。
需要说明的是,本发明实施例的装置是应用上述信息扩散预测的方法的装置,则上述信息扩散预测的方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
优选地,参见图3,图3为本发明实施例的信息扩散预测的装置的预测模块的结构框图,该预测模块240包括:
计算子模块241,用于根据核函数公式,确定核函数公式的单调性及核函数公式中的欧氏距离的单调性;
预测子模块242,用于根据核函数公式中的欧氏距离的单调性,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,其中,核函数公式中的欧氏距离的单调性与核函数公式的单调性相反。
优选地,本发明实施例的信息扩散预测的装置中映射模块210包括:
分配子模块211,用于对前一个用户对应的用户特征、和当前用户对应的用户特征,分别对应分配预设向量,得到前一个用户的第一特征向量和当前用户的第二特征向量。
结点确定子模块212,用于将位于潜在向量空间中坐标原点处的前一个用户,确定为前一个用户的第一用户结点,将位于潜在向量空间坐标系中的第一坐标点处的当前用户,确定为当前用户的第二用户结点。
参见图4、图5、图6,图4为本发明实施例的信息扩散预测的装置的潜在向量空间模型与热力学传播模型、独立级联模型及热量扩散模型在追踪社区上的准确率对比图,图5为本发明实施例的信息扩散预测的装置的潜在向量空间模型与热力学传播模型、独立级联模型及热量扩散模型在谷歌社区上的准确率对比图,图6为本发明实施例的信息扩散预测的装置的潜在向量空间模型与热力学传播模型、独立级联模型及热量扩散模型在掘客上的准确率对比图。可以得到,本发明实施例的信息扩散预测的装置使用潜在向量空间模型的预测平均准确率均高于其他三种模型。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种信息扩散预测的方法,其特征在于,包括:
获取在社交网络中传播预设信息的当前用户和用户特征、以及前一个用户和用户特征,其中,所述当前用户和所述前一个用户是按照传播所述预设信息的先后顺序进行排序的,且所述前一个用户传播所述预设信息在所述当前用户传播所述预设信息之前;
映射所述前一个用户和与所述前一个用户对应的用户特征到潜在向量空间中,得到第一用户结点和第一用户特征向量,以及映射所述当前用户和与所述当前用户对应的用户特征到潜在向量空间中,得到第二用户结点和第二用户特征向量;
根据所述第一用户结点和所述第一用户特征向量、所述第二用户结点和所述第二用户特征向量,建立潜在向量空间模型;其中,所述潜在向量空间模型至少包括:处于潜在向量空间坐标系的原点处的第一用户结点、到与处于所述潜在向量空间坐标系内的其他相邻结点的向量,所述其他相邻结点为除所述第一用户结点以外的其他结点;
对所述潜在向量空间模型进行学习,得到与所述第一用户结点和所述第一特征向量、及所述第二用户结点和所述第二特征向量相关的核函数公式;
根据所述核函数公式,预测所述第二用户结点传播所述预设信息至所述其他相邻结点中的至少一个相邻结点的传播趋势。
2.根据权利要求1所述的信息扩散预测的方法,其特征在于,映射所述前一个用户和与所述前一个用户对应的用户特征到潜在向量空间中,得到第一用户结点和第一用户特征向量,以及映射所述当前用户和与所述当前用户对应的用户特征到潜在向量空间中,得到第二用户结点和第二用户特征向量,包括:
对所述前一个用户对应的用户特征、和所述当前用户对应的用户特征,分别对应分配预设向量,得到所述前一个用户的第一特征向量和所述当前用户的第二特征向量;
将位于潜在向量空间中坐标原点处的所述前一个用户,确定为所述前一个用户的第一用户结点,将位于潜在向量空间坐标系中的第一坐标点处的所述当前用户,确定为所述当前用户的第二用户结点。
3.根据权利要求1所述的信息扩散预测的方法,其特征在于,所述核函数公式为:
k ( x , y ) = e - | | x + r - y | | d 2 t 2
其中,所述k(x,y)为核函数,所述x为所述第一用户结点,所述r为所述第一特征向量,所述y为所述第二用户结点,||·||d为欧氏距离,所述t为时间,所述x,所述r,所述y分别为R维向量,所述R为所述潜在向量空间模型的维数。
4.根据权利要求1或3所述的信息扩散预测的方法,其特征在于,所述根据所述核函数公式,预测所述第二用户结点传播所述预设信息至所述其他相邻结点中的至少一个相邻结点的传播趋势,包括:
根据所述核函数公式,确定所述核函数公式的单调性及所述核函数公式中的欧氏距离的单调性;
根据所述核函数公式中的欧氏距离的单调性,预测所述第二用户结点传播所述预设信息至所述其他相邻结点中的至少一个相邻结点的传播趋势,其中,所述核函数公式中的欧氏距离的单调性与所述核函数公式的单调性相反。
5.根据权利要求4所述的信息扩散预测的方法,其特征在于,所述根据所述核函数公式中的欧氏距离的单调性,预测所述第二用户结点传播所述预设信息至所述其他相邻结点中的至少一个相邻结点的传播趋势之后,所述的信息扩散预测的方法还包括:
根据所述核函数公式中的欧氏距离:
f(v)=min{||y+r-v||d}
确定所述其他相邻结点中传播所述预设信息的用户结点;
其中,所述y为所述第二用户结点,所述r为所述第二特征向量,所述v为社交网络中没有传播预设信息的其他用户结点,||·||d为欧氏距离,所述x,所述r,所述v分别为R维向量,所述R为所述潜在空间向量的维数,f(v)为所述社交网络中没有传播预设信息的其他用户结点与所述第二用户结点的最小欧氏距离,所述第二特征向量与所述第一特征向量相同。
6.根据权利要求1所述的信息扩散预测的方法,其特征在于,所述根据所述核函数公式,预测所述第二用户结点传播所述预设信息至所述其他相邻结点中的至少一个相邻结点的传播趋势之后,所述的信息扩散预测的方法还包括:
通过随机梯度下降算法,确定锁链损失函数公式的最小值;
获取所述锁链损失函数公式的最小值,对预测的传播趋势进行误差估计。
7.一种信息扩散预测的装置,其特征在于,包括:
获取模块,用于获取在社交网络中传播预设信息的当前用户和用户特征、以及前一个用户和用户特征,其中,所述当前用户和所述前一个用户是按照传播所述预设信息的先后顺序进行排序的,且所述前一个用户传播所述预设信息在所述当前用户传播所述预设信息之前;
映射模块,用于映射所述前一个用户和与所述前一个用户对应的用户特征到潜在向量空间中,得到第一用户结点和第一用户特征向量,以及映射所述当前用户和与所述当前用户对应的用户特征到潜在向量空间中,得到第二用户结点和第二用户特征向量;
建模模块,用于根据所述第一用户结点和所述第一用户特征向量、所述第二用户结点和所述第二用户特征向量,建立潜在向量空间模型;其中,所述潜在向量空间模型至少包括:处于潜在向量空间坐标系的原点处的第一用户结点、到与处于所述潜在向量空间坐标系内的其他相邻结点的向量,所述其他相邻结点为除所述第一用户结点以外的其他结点;
学习模块,用于对所述潜在向量空间模型进行学习,得到与所述第一用户结点和所述第一特征向量、及所述第二用户结点和所述第二特征向量相关的核函数公式;
预测模块,用于根据所述核函数公式,预测所述第二用户结点传播所述预设信息至所述其他相邻结点中的至少一个相邻结点的传播趋势。
8.根据权利要求7所述的信息扩散预测的装置,其特征在于,所述映射模块还包括:
分配子模块,用于对所述前一个用户对应的用户特征、和所述当前用户对应的用户特征,分别对应分配预设向量,得到所述前一个用户的第一特征向量和所述当前用户的第二特征向量;
结点确定子模块,用于将位于潜在向量空间中坐标原点处的所述前一个用户,确定为所述前一个用户的第一用户结点,将位于潜在向量空间坐标系中的第一坐标点处的所述当前用户,确定为所述当前用户的第二用户结点。
9.根据权利要求7所述的信息扩散预测的装置,其特征在于,所述核函数公式为:
k ( x , y ) = e - | | x + r - y | | d 2 t 2
其中,所述k(x,y)为核函数,所述x为所述第一用户结点,所述r为所述第一特征向量,所述y为所述第二用户结点,||·||d为欧氏距离,所述t为时间,所述x,所述r,所述y分别为R维向量,所述R为所述潜在向量空间模型的维数。
10.根据权利要求7或9所述的信息扩散预测的装置,其特征在于,所述预测模块还包括:
计算子模块,用于根据所述核函数公式,确定所述核函数公式的单调性及所述核函数公式中的欧氏距离的单调性;
预测子模块,用于根据所述核函数公式中的欧氏距离的单调性,预测所述第二用户结点传播所述预设信息至所述其他相邻结点中的至少一个相邻结点的传播趋势,其中,所述核函数公式中的欧氏距离的单调性与所述核函数公式的单调性相反。
CN201610808101.0A 2016-09-07 2016-09-07 一种信息扩散预测的方法和装置 Active CN106372437B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610808101.0A CN106372437B (zh) 2016-09-07 2016-09-07 一种信息扩散预测的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610808101.0A CN106372437B (zh) 2016-09-07 2016-09-07 一种信息扩散预测的方法和装置

Publications (2)

Publication Number Publication Date
CN106372437A true CN106372437A (zh) 2017-02-01
CN106372437B CN106372437B (zh) 2019-03-29

Family

ID=57900307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610808101.0A Active CN106372437B (zh) 2016-09-07 2016-09-07 一种信息扩散预测的方法和装置

Country Status (1)

Country Link
CN (1) CN106372437B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163404A (zh) * 2018-06-12 2019-08-23 腾讯科技(深圳)有限公司 一种信息扩散预测方法、装置及服务器、存储介质
CN111008740A (zh) * 2019-12-04 2020-04-14 武汉轻工大学 数据传播趋势的预测方法、设备、存储介质及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103093049A (zh) * 2013-01-11 2013-05-08 中国科学院信息工程研究所 一种面向社交网络的恶意代码传播预测方法及系统
CN103699650A (zh) * 2013-12-26 2014-04-02 清华大学 消息传播预测方法及装置
CN104008150A (zh) * 2014-05-20 2014-08-27 中国科学院信息工程研究所 一种对社交网络信息传播趋势预测的方法及系统
CN104091206A (zh) * 2014-06-18 2014-10-08 北京邮电大学 基于演化博弈论的社交网络信息传播预测方法
US20140330548A1 (en) * 2013-05-05 2014-11-06 International Business Machines Corporation Method and system for simulation of online social network
CN104580385A (zh) * 2014-12-16 2015-04-29 腾讯科技(深圳)有限公司 一种拓展用户关系链的方法及装置
US20150149469A1 (en) * 2012-06-14 2015-05-28 Nokia Corporation Methods and apparatus for associating interest tags with media items based on social diffusions among users

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150149469A1 (en) * 2012-06-14 2015-05-28 Nokia Corporation Methods and apparatus for associating interest tags with media items based on social diffusions among users
CN103093049A (zh) * 2013-01-11 2013-05-08 中国科学院信息工程研究所 一种面向社交网络的恶意代码传播预测方法及系统
US20140330548A1 (en) * 2013-05-05 2014-11-06 International Business Machines Corporation Method and system for simulation of online social network
CN103699650A (zh) * 2013-12-26 2014-04-02 清华大学 消息传播预测方法及装置
CN104008150A (zh) * 2014-05-20 2014-08-27 中国科学院信息工程研究所 一种对社交网络信息传播趋势预测的方法及系统
CN104091206A (zh) * 2014-06-18 2014-10-08 北京邮电大学 基于演化博弈论的社交网络信息传播预测方法
CN104580385A (zh) * 2014-12-16 2015-04-29 腾讯科技(深圳)有限公司 一种拓展用户关系链的方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
AIWU XU, XIAOLIN ZHENG: "Dynamic Social Network Analysis using Latent Space Model and an Integrated Clustering Algorithm", 《2009 EIGHTH IEEE INTERNATIONAL CONFERENCE ON DEPENDABLE, AUTONOMIC AND SECURE COMPUTING》 *
ALIREZA HAJIBAGHERI, HAMIDREZA ALVARI, ALI HAMZEH, SATTAR HASHEM: "Community Detection in Social Networks Using Information Diffusion", 《2012 IEEE/ACM INTERNATIONAL CONFERENCE ON ADVANCES IN SOCIAL NETWORKS ANALYSIS AND MINING》 *
李洋, 陈毅恒, 刘挺: "微博信息传播预测研究综述", 《软件学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163404A (zh) * 2018-06-12 2019-08-23 腾讯科技(深圳)有限公司 一种信息扩散预测方法、装置及服务器、存储介质
CN111008740A (zh) * 2019-12-04 2020-04-14 武汉轻工大学 数据传播趋势的预测方法、设备、存储介质及装置
CN111008740B (zh) * 2019-12-04 2022-05-24 武汉轻工大学 数据传播趋势的预测方法、设备、存储介质及装置

Also Published As

Publication number Publication date
CN106372437B (zh) 2019-03-29

Similar Documents

Publication Publication Date Title
Xu et al. Incentive mechanism for multiple cooperative tasks with compatible users in mobile crowd sensing via online communities
Jelokhani-Niaraki et al. A group multicriteria spatial decision support system for parking site selection problem: A case study
Naeem et al. Pythagorean m-polar fuzzy sets and TOPSIS method for the selection of advertisement mode
Miao et al. Balancing quality and budget considerations in mobile crowdsourcing
Zhang et al. Grey relational analysis method based on cumulative prospect theory for intuitionistic fuzzy multi-attribute group decision making
Pham et al. A general model for out-of-town region recommendation
CN109416761A (zh) 使用图社区的机器学习和预测
Hu et al. A graph embedding based model for fine-grained POI recommendation
CN109508428A (zh) 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法
CN109492076A (zh) 一种基于网络的社区问答网站答案可信评估方法
CN109635206A (zh) 融合隐式反馈和用户社会地位的个性化推荐方法及系统
CN106021456A (zh) 将文本和地理信息融合在局部协同排列的兴趣点推荐方法
CN109493592A (zh) 路径推荐方法及装置
Yao et al. A game-theoretic perspective on rough set analysis
Dong et al. Preference evolution with deceptive interactions and heterogeneous trust in bounded confidence model: A simulation analysis
Singh et al. Generalized correlation coefficients of the hesitant fuzzy sets and the hesitant fuzzy soft sets with application in group decision-making
CN106372437A (zh) 一种信息扩散预测的方法和装置
Luan et al. Collaborative tensor factorization and its application in POI recommendation
CN115034379A (zh) 一种因果关系确定方法及相关设备
CN107909498B (zh) 基于最大化接受者操作特征曲线下方面积的推荐方法
Voss et al. Densities of shortest path lengths in spatial stochastic networks
Zhao et al. Service objective evaluation via exploring social users' rating behaviors
CN106779181A (zh) 一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法
CN114154085A (zh) 一种信息推荐方法、装置、设备及存储介质
CN107067036A (zh) 一种接地网腐蚀速率预测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant