CN107566249A - 一种训练用于预测社交网络用户转发消息的模型的方法 - Google Patents
一种训练用于预测社交网络用户转发消息的模型的方法 Download PDFInfo
- Publication number
- CN107566249A CN107566249A CN201710727462.7A CN201710727462A CN107566249A CN 107566249 A CN107566249 A CN 107566249A CN 201710727462 A CN201710727462 A CN 201710727462A CN 107566249 A CN107566249 A CN 107566249A
- Authority
- CN
- China
- Prior art keywords
- user
- message
- susceptibility
- users
- influence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012549 training Methods 0.000 title claims abstract description 15
- 230000006870 function Effects 0.000 claims description 52
- 230000014509 gene expression Effects 0.000 claims description 36
- 238000009792 diffusion process Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 4
- 238000000926 separation method Methods 0.000 claims description 4
- 230000000926 neurological effect Effects 0.000 abstract 4
- 230000008569 process Effects 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 244000097202 Rathbunia alamosensis Species 0.000 description 3
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 241000700605 Viruses Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种训练用于预测社交网络用户转发消息的模型的方法,包括:1)获得所述社交网络中的历史数据,所述历史数据包括不同用户对同一条消息进行发布、转发的次序;2)根据所述历史数据,求解使得损失函数取值最小时各名用户的影响力和易感性;其中,所述影响力用于描述该名用户发布的消息被转发的概率,所述易感性用于描述该名用户受到发布消息的源发用户的影响而对所述消息进行转发的概率,所述损失函数是发布消息的源发用户的影响力、除所述源发用户之外的其他用户的易感性的函数;以及其中,所述用户的影响力和易感性作为所述用于预测社交网络用户转发消息的模型的参数。
Description
技术领域
本发明涉及对社交网络用户所期望转发的消息的预测。
背景技术
近年来,在线社交网络以其在信息传播与共享、人际交流与沟通方面 的重要作用而发展迅猛,典型代表包括Facebook、Twitter、微博、微信等。 这些在线社交网络已经成为人们获取信息、人际交流的主要平台,很大程 度上改变了人们的生活方式和社交方式并成为主要的信息传播平台。以微 博为例,其基于用户关系进行信息获取、传播,用户可以通过WEB、WAP 以及各种客户端组建个人社区,以140字以内的文字,图片和视频发布信 息,并实现即时分享。诸如微博的在线社交网络可以满足用户对兴趣信息 的需求,是帮助用户获取和分享新闻热点、兴趣内容、专业知识、舆论导 向的重要平台。
社交网络的上述特点可以被应用到许多领域,例如病毒营销、媒体广 告和热点提取等,由此出现了许多关于预测用户所感兴趣的社交网络消息 的研究。最普遍的传播预测模型有两种,第一种是基于显式或隐式的社交 网络结构构建概率预测模型,然而在实际社交网络的场景中,社交网络结 构很可能是随时间动态变化的,这使得此种方式需要不断地依据社交网络 结构而更新所构建的概率预测模型才能保证预测的准确率;第二种是基于抽取用户、内容、时间序列等特征的机器学习模型,然而特征抽取的处理 复杂度相对较高,并且不能保证特征的完全性和有效性。因此,如何设计 一个既不需要社交网络结构信息,又不需要繁琐特征工程的预测模型是一 个亟待解决的问题。
针对上述问题,Bourigault等人在最近的研究中提出了用于社交网络 中消息传播预测的用户表达学习模型(CDK Model),该模型将先后参与消 息传播的社交网络用户映射到表达空间中,然后利用先转发用户比后转发 用户在欧式空间中距离消息源发用户更近、和转发用户比未转发用户在欧 式空间中距离消息源发用户更近这两个约束条件,构建损失函数的表达 式,通过最小化损失函数,确定用户空间表达的具体参数。在该模型中,只根据转发序列时间戳先后信息自动学习用户空间表达,既不需要社交网 络结构关系,也不需要代价高的特征工程。
然而,上述CDK模型所基于的假设是理想状态下的,致使其仍存在 需要改进的地方。例如,在CDK模型中假设社交网络中消息传播是对称 的,即社交网络中的任意用户a向用户b传播信息的能力等同于用户b向 用户a传播信息的能力。然而,在进行预测时,还应考虑不同的用户对其 他用户的影响力和易感力是不同的,这是由于用户往往更倾向于转发微博 明星、网络达人等影响力高的用户所发布的微博。基于上述理想状态下的 假设,将会对预测的准确性造成影响,可见上述CDK模型的预测准确度 仍有待改善。
发明内容
因此,本发明的目的在于克服上述现有技术的缺陷,提供一种训练用 于预测社交网络用户转发消息的模型的方法,包括:
1)获得所述社交网络中的历史数据,所述历史数据包括不同用户对 同一条消息进行发布、转发的次序;
2)根据所述历史数据,求解使得损失函数取值最小时各名用户的影 响力和易感性;
其中,所述影响力用于描述该名用户发布的消息被转发的概率,所述 易感性用于描述该名用户受到发布消息的源发用户的影响而对所述消息 进行转发的概率,所述损失函数是发布消息的源发用户的影响力、除所述 源发用户之外的其他用户的易感性的函数;以及
其中,所述用户的影响力和易感性作为所述用于预测社交网络用户转 发消息的模型的参数。
优选地,根据所述方法,所述损失函数是用户之间的临界惩罚间隔的 函数,其中,用户之间的所述临界惩罚间隔为其中一名用户的易感性表达 到发布消息的所述源发用户的影响力表达的欧式空间距离与另一名用户 的易感性表达到所述源发用户的影响力表达的欧式空间距离之差。
优选地,根据所述方法,所述用户之间的临界惩罚间隔C(i,j)为:
μ是消息扩散树的平均出度,i和j分别表示用户ui和uj在发布、转发 的次序中的顺序编号。
优选地,根据所述方法,其中所述损失函数L(Z)采用分类损失函数 -hinge loss,表示为:
其中,C(i,j)为用户i和用户j之间的临界惩罚间隔,m是话题Cl中的 任意一条消息,用户转发序列用户ui和uj为Φm×Φm转发序 列中的任意两个非原发用户,tm(ui)<tm(uj)表示用户ui的转发时刻早于用户 用户ui转发了消息m而用户uj未进行转发。用户表达集 合Z=(z(u1),…,z(uN)),z(ui)=(z(ui)I,z(ui)S),N代表所有用户的个数。
优选地,根据所述方法,其中步骤2)包括:
2-1)针对用户集合中的各名用户uk设置初始的影响力z(uk)I和易感性 z(uk)S;
2-2)根据用户的当前的影响力和易感性,计算除所述源发用户之外的 其他用户ui和uj之间的间隔距离δ以及临界惩罚间隔C(i,j);
2-3)若δ<C(i,j),则计算所述损失函数L(Z)相较于所述源发用户的影 响力的梯度所述损失函数L(Z)相较于所述用户ui的易感性 z(ui)S的梯度和所述损失函数L(Z)相较于所述用户uj的易感性z(uj)S的梯度利用所获得的梯度更新用户的影响力和易感性;
2-4)重复上述步骤2-2)、2-3),直到所获得的梯度中的至少一个小于 设定的阈值或达到最大迭代次数。
优选地,根据所述方法,在步骤2-3)中,利用下式更新用户的影响 力和易感性:
其中,是更新后的源发用户的影响力,是更新前的 源发用户的影响力,α是梯度下降算法中学习率,是所述损失函 数L(Z)相较于所述源发用户的影响力的梯度,z(ui)S(n+1)是更新后的用 户ui的易感性,z(ui)S(n)是更新前的用户ui的易感性,所述损失函数 L(Z)相较于所述用户ui的易感性z(ui)S的梯度,z(uj)S(n+1)是更新后的用户uj的 易感性,z(uj)S(n)是更新前的用户uj的易感性,是所述损失函数L(Z)相 较于所述用户uj的易感性z(uj)S的梯度。
一种预测社交网络用户转发消息的方法,包括:
1)基于前述任意一项方法确定发布消息m的源发用户的影响力 以及除所述源发用户之外的其他用户ui的易感性z(ui)S;
2)计算所述用户ui到所述源发用户的欧式空间距离:
3)根据所述欧式空间距离,判断所述用户ui对所述源发用户所发表 的消息进行转发的可能性。
一种计算机可读存储介质,其中存储有计算机程序,所述计算机程序 在被执行时用于实现前述任意一项所述的方法。
一种用于预测社交网络用户转发消息的系统,包括:
处理器、和存储装置,
其中,所述存储装置用于存储计算机程序,所述计算机程序在被所述 处理器执行时用于实现前述任意一项所述的方法。
与现有技术相比,本发明的优点在于:
根据信息传播过程的不对称性来建立模型,综合地考虑了用户对其他 用户的影响力以及用户受到其他用户影响进而对消息进行转发的易感性, 从而提高模型的预测性能。并且,本发明区分了在预测用户列表不同位置 的用户的重要性差别,如果出现前面的用户对相对位置判断错误,则其惩 罚高于排在后面的用户对判断错误,不同位置的用户对根据其在结果列表 中的位置具有不同的临界惩罚间隔,从而进一步提高模型的预测性能。
附图说明
以下参照附图对本发明实施例作进一步说明,其中:
图1示出了根据本发明的IS-VM模型的临界惩罚间隔示意图,其中用 户0是发出信息的消息源,用户1~5为先后转发该条信息的其他用户;
图2示出了根据本发明的平均出度μ=2的消息扩散树的示意图;
图3是根据本发明的一个实施例训练用于预测社交网络用户转发消息 的模型的方法的流程图;
图4是对采集的各条微博的训练数据进行存储的示意图;
图5示意性地示出了采用梯度法来训练IS-VM模型的流程;
图6示出了IS-VM模型与CDK模型在话题1的数据集A1、A2、A3 上的预测成功率;
图7示出了IS-VM模型与CDK模型在话题2的数据集B1、B2、B3 上的预测成功率;
图8示出了在分别建立IS-VM模型与CDK模型时为确定模型参数而 进行迭代的收敛速度。
具体实施方式
下面结合附图和具体实施方式对本发明作详细说明。
如前文所述,现有技术所提出的CDK模型被用于预测用户对社交网 络中所发布消息的偏好,其核心思想在于:将消息传播的动态过程映射为 在连续欧式空间中的热力学扩散过程,使得欧式空间中在用户坐标之间的 距离表示他们在传播时间上的远近关系,将传播时间更早的用户判断为更 有可能对发布的消息进行转发的用户,从而进行预测。
传统的CDK模型的核心思想如下:
定义一个消息扩散核函数K(t,y,x)如下式所示:
其中K(t,y,x)函数值计算的是在时刻t、消息源发用户在欧式空间位置y 的情况下,空间位置x处的热度,其中,||y-x||2代表位置y与位置x的欧 式空间距离。K(0,y,x)代表消息传播时刻t=0时的初始条件,其中δ代表狄 拉克函数。
,对于任意源发消息m而言,其传播至用户ui的核函数为:
其中,t为时刻,是发出消息m的源发用户,ui是在参与预测的用 户集合U=(u1,…uN)中除源发用户之外的任意其他用户,n是消息m的转 发序列中用户的个数,Z=(z(u1,...,z(uN))),z(uN)∈Rn,和z(ui)分别是用户 与ui在欧式空间中的表达,是和z(ui)之间的距离。其 中,源发用户是用户集合U中的一名用户,例如uk,这里为了方便并且使 其区分于其他用户,将发出消息m的源发用户uk标识为所述核函数需 满足以下两个约束条件:
<约束1>.对于两名用户ui和uj,如果ui早于uj先参与了对消息m的转 发,即tm(ui)<tm(uj),则在任意时刻都有其中,tm(uk) 是uk转发消息m的时间戳;
<约束2>.对于两名用户ui和uj,如果ui参与了对消息m的转发,而uj并未参与对消息m的转发,即ui∈Φm并且则在任意时刻都有 其中,Φm是参与转发消息m的用户的集合。
这两个约束的目的是约束传播核函数满足先转发用户比后 转发用户在欧式空间中距离消息源发用户更近和转发用户比未转发用户 在欧式空间中距离消息源发用户更近两个条件,然后在这两个条件下,确 定用户空间表达的具体参数。
结合传播核函数的具体形式和上述两个约束,可以推导出不 包含时间参数的不等式约束,如下所示:
对于这两个不等式约束,CDK模型利用经典的分类损失函数-hinge loss来进行刻画,其公式为:
l(y)=max(0,1-t·y)
其中t=±1,其表示可能输出的增或减的类别,y为分类器预测值。
在上述CDK模型中,通过上述核函数将消息传播的动态 过程转化为针对消息m寻找用户表达空间Z=(z(u1),…z(uN))的最优值的问 题,通过最优化求解使得损失函数最小化的参数,来预测用户对社交网络 中所发布消息的偏好。
利用上面提到的传播核函数,用户表达学习模型的损失函数在形式上 可以表示为下式的形式:
其中,是误差项,代表对于任意消息m∈Cl,已知其源 发用户利用传播核函数KZ进行预测的结果与消息m实际传播过程的 差异,其具体形式为:
其中,代表用户uj到源发用户的欧式空 间距离与用户ui到源发用户的欧式空间距离的差值η,当η≥1时, 当η<1时,
从而,通过最小化损失函数L(Z)可以学习最优的Z*,如下式所示:
Z*=arg minzL(Z)
如背景技术中所描述地,发明人发现现有的CDK模型是建立在消息 传播是对称的假设上,而这种假设在真实的社交网络中往往是不成立的, 例如在微博大V与其粉丝之间的消息传播是显然不对等的,所述粉丝对所 述微博大V所发布微博进行转发的概率要远大于所述微博大V对所述粉 丝所发布微博进行转发的概率。
对此,本发明提出将每名用户的“易感性”和“影响力”考虑在内。
在本发明中,发明人将用户的“易感性”定义为:该名用户对社交网 络所发布的消息进行转发的可能性。这里的易感性反映的是转发消息的用 户是否容易受到源发用户或较早转发该消息的用户的影响继而对该消息 进行转发。
并且,发明人还将用户的“影响力”定义为:该名用户所发布的消息 被转发的可能性。这里的影响力反映的是发出消息的源发用户对其他用户 的影响。
基于用户的易感性和影响力,可以将原有CDK模型中的用户表达Z= (z(u1),…z(uN))扩展为易感性表达zS=(z(u1)S,…z(uN)S)和影响力表达zI= (z(u1)I,…z(uN)I),以在连续的欧式空间中对各个用户个体ui分别学习其易 感性表达z(ui)S和影响力表达z(ui)I。具体的数学表达式将在下文中结合图1 进行详细介绍。
除上述易感性和影响力之外,发明人提出还可以进一步地针对不同用 户设置不同的表达空间临界惩罚间隔。在现有的CDK模型中,将用户列 表中对预测结果的影响大的用户在判断错误时的惩罚、以及对预测结果影 响相对较小的用户在判断错误时的惩罚均设置为1。而发明人认为如果针 对用户列表中的对预测结果影响大的用户设置更高的惩罚间隔,应当能提 高预测的准确度。这是由于,在实际应用中,转发序列里排序靠前的用户的重要性更高,根据用户对结果的影响而分别设置不同的惩罚间隔,可以 保证排序靠前的用户具有更高的准确率。
参考图1所示出的欧式空间,其中,用户0为发出消息m的源发用户, 用户1~5分别为先后转发消息m的用户。转发用户与源发用户间的距离为 欧式空间距离,例如图中的d(0,3)表示理想建模用户表达情况下用户3的 易感性到用户0的影响力的欧式空间距离,d(0,4)表示理想建模用户表达 情况下用户4的易感性到用户0的影响力的欧式空间距离,以此类推。本 发明中的临界惩罚间隔通过不同转发用户在欧式空间距离上的差异而体 现,例如临界惩罚间隔C(3,4)的大小表示用户3较用户4更先转发消息m 的程度,C(3,4)=d(0,4)-d(0,3)。
理想状态下,可以将源发用户的影响力非源发用户(例如转 发消息m的用户)的易感性z(ui)S和z(uj)S、临界惩罚间隔C(i,j)、欧式空间 距离d(0,i)和d(0,j)之间的关系表示为:
其中,是发出消息m的源发用户,ui和uj是转发消息m的转发用户。 可以看出,若(j>i),则C(i,j)>0。
通过推导,可以得出以下不等式关系:
由上述不等式可以看出,临界惩罚间隔C(i,j)具有累积性,例如从图1 中可以看出,C(1,5)=d(0,5)-d(0,1)>C(1,2)。由此证明了发明人的观点,如传 统CDK模型中将临界惩罚间隔设置为固定的常数(例如1)并不能很好地 表达各个用户的临界惩罚间隔关系。
为此,发明人认为可以根据需要,针对先后转发消息m的用户设置不 同的惩罚间隔,例如对较早转发的用户设置较大的惩罚间隔,对较晚转发 的用户设置较小的惩罚间隔。
针对惩罚间隔的设置,本发明提出了一种优选的方式,即利用消息扩 散树的方式对d(0,i)进行深度建模以确定更准确的临界惩罚间隔C(i,j)。具 体地,将d(0,i)表示为从消息扩散树的树根到用户ui的树的深度,即
d(0,i)=logμ(1+i), (3)
其中,其中μ代表消息扩散树的平均出度。为了方便,在图2的实施 例中采用μ=2。图2示出了平均出度为2的消息扩散树的示意图。
基于通过上述消息扩散树而确定的d(0,i),可以将临界惩罚间隔C(i,j) 表示为:
其中,i和j分别表示用户ui和uj在发布、转发的次序中的顺序编号, 例如表示用户ui和uj为第i名和第j名转发消息m的用户。
上述C(i,j)的表达式(4)相较于将C(i,j)设置为常数的方式而言,具有以 下两个优点:
(i)当i的值不变时,随着j-i值的增加,C(i,j)的大小也会增加,因而 能够满足前文中所述C(i,j)应当具有累积性的要求;
以图2为例,假设需要学习用户0、1和5在连续欧式空间中的表达, 可以利用上述C(i,j)的表达式为用户2~4在连续欧式空间中预留足够的空 间位置;
(ii)当j-i的值不变时,随着i值减小,C(i,j)的大小也会增加,因而满 足对判断错误时的惩罚的要求,即在靠前用户的相对位置被判断错误时所 提供的惩罚会高于靠后用户的相对位置被判断错误时的惩罚,以提高预测 的准确性。
根据上述临界惩罚间隔C(i,j)和欧式空间距离d(0,i)和d(0,j)的表达式, 本发明的IS-VM模型的损失函数L(Z)为:
其中,用户表达集合Z=(z(u1),…,z(uN)),z(ui)=(z(ui)I,z(ui)S),N 代表所有用户的个数,ui影响力表达为z(ui)I,ui易感性表达为z(ui)S,m 代表训练集Cl中任意源发消息,用户转发序列tm表示消 息m被转发的时刻,代表用户uj易感性表达 到源发用户影响力表达的距离与用户ui易感性表达到源发用户影响 力表达的欧式空间距离的差值η,当η≥C(i,j)时,不产生惩罚,当η<C(i,j) 时,产生惩罚。这里可以优选地采用如前文中所述消息扩散树的方式来确 定C(i,j)的取值。
可以看出上述式(5)与传统CDK模型的损失函数的区别在于,将用户 的易感性和影响力考虑在内,并且考虑到了惩罚间隔C(i,j)的取值,例如 综合源发用户的影响力以及转发用户的易感性z(ui)S和z(uj)S通过计 算获得(如式(1)所示),又或者例如利用消息扩散树的方式计算获得(如 式(4)所示)。
这里可以看到,上述式(5)采用了与传统CDK模型中相同的分类损失 函数-hingeloss,然而应当理解,本发明最重要的改进之处在于引入了用 户的易感性和影响力表达以及优化的临界惩罚间隔。因此,在本发明的其 他实施例中还可以采用其他形式的损失函数,只要该损失函数可以正确反 应出由于用户的易感性和影响力以及临界惩罚间隔形式即可。这里不再对 其他形式的损失函数进行一一列举。
可以根据上述损失函数L(Z),采用例如梯度下降等最优化算法来估计 参数对即希望确定使得损失函数取值最小 的参数对。
在上述内容中详细介绍了根据本发明的IS-VM模型的数学表达方式, 下面将通过具体的实施例介绍如何采用社交网络中的历史数据作为样本 训练IS-VM模型、以及如何采用训练好的模型来预测哪些用户更有可能对 社交网络中发布的消息进行转发。
根据本发明的一个实施例,采用新浪微博的多个话题的历史数据训练 根据本发明的IS-VM模型,参考图3,所述方法包括:
S1.采集新浪微博的一个或多个话题的历史数据作为训练样本。例如, 采集以下历史数据:
在当前话题下每条微博的唯一标识,例如m1、m2、m3等;
发表该条微博(例如发表m1)的源用户的唯一标识,例如uid1;
参与转发该条微博(例如转发m1)的用户的唯一标识,例如id1_1、 id1_2、id1_3等;
该条微博(例如m1)被发表及转发的时间信息,例如t1_0、t1_1、t1_2、t1_3等。
为了方便存储及调取所采集的历史数据,可以将属于同一话题下的微 博存储在同一个文件中,并且按照用户进行转发的先后顺序进行存储。例 如针对m1,在一行存储单元中按照uid1、id1_1、id1_2、id1_3的顺序进 行存储,对应的顺序存储t1_0、t1_1、t1_2、t1_3;类似地,针对m2,按 照uid2、id2_1、id2_2、id2_3的顺序进行存储,以此类推。
图4示意性地示出了对所采集的历史数据进行存储的一个示例,其中 针对每一条微博,存储源发用户的标识uid及先后转发该条微博的用户的 标识id。
在此步骤中,还可以针对未参与针对该条微博(例如m1)进行转发 的用户uj,为其设置一个经验值作为其排列顺序,例如将j设置为转发m1 的用户数量l_m与用户总数量之和L_U的二分之一,即j=(l_m+L_U)/2。
换句话说,所述历史数据可以包括:发布所述消息的用户的唯一标识、 参与转发所述消息的用户所各自对应的唯一标识、参与转发所述消息的各 名用户分别对所述消息进行转发的时间信息,以便确定不同用户对同一条 消息进行发布、转发的次序。
在步骤S1中所确定的不同用户对同一条消息进行发布、转发的次序 决定了随后步骤中所使用的符号和计算式中各名用户的脚标大小,例如ui为第i名对消息m进行转发的用户。
S2.根据所获得的所述历史数据(即,训练数据),利用如计算式(5) 所示出的损失函数L(Z),求解使得该损失函数L(Z)取值最小时的源发用户 的影响力转发用户的易感性z(ui)S和z(uj)S。
可以利用优化求解的方式确定所述参数例如梯度 下降的算法,图5示出了采用梯度下降算法训练参数的一个示例。通过前 文中的式(5)可以看出,损失函数L(Z)对源发用户的影响力非源发 用户ui的易感性z(ui)S和uj的易感性z(uj)S分别求微,则存在以下关系式:
因此,可以优选采用梯度下降的算法,初始地为需要计算的参数 z(ui)=(z(ui)I,z(ui)S)设置起始值,利用上述计算式(6)求解使得梯度小于设定 的阈值(例如一个极小的阈值)或达到最大迭代次数时的参数
根据本发明的一个实施例,通过梯度下降的方式求解参数包括:
S2-1:针对用户集合U中的每个用户(所述用户既包括前文中的所述 消息m的源发用户也包括除该名源发用户之外的其他用户),这里采 用符号uk来表示所述用户,设置初始的随机值作为该名用户uk的影响力 z(uk)I和易感性z(uk)S,即z(uk)=(z(uk)I,z(uk)S),并将初始迭代次数设置为n=0;
S2-2:根据用户当前的影响力和易感性,计算两名非源发用户ui和uj之 间的间隔距离δ以及临界惩罚间隔C(i,j)。可以采用以下计算式进行计算。
δ=d(0,j)-d(0,i) (7)
其中,为源发用户的影响力,z(ui)S为非源发用户ui的易感性, z(uj)S为非源发用户uj的易感性,δ为非源发用户ui和uj之间的间隔距离。
其中,μ为设置的消息扩散树的平均出度,例如μ=2;C(i,j)为非源 发用户i和j之间的临界惩罚间隔。
S2-3:比较所获得的δ与C(i,j)之间的大小,对于δ≥C(i,j)的情况,更 新迭代次n数使其等于其原先的值加1执行下一轮迭代,对于δ<C(i,j)的 情况,基于前文中由损失函数L(Z)对源发用户的影响力非源发用户 ui的易感性z(ui)S和uj的易感性z(uj)S分别求微所获得的关系,即计算式(6), 来计算z(ui)S、和z(uj)S分别的梯度和利 用所获得的梯度更新用户的影响力和易感性,例如更新参数z(ui)S、 和z(uj)S,并更新迭代次数n使其等于其原先的值加1。
更新后的参数可以通过下式表示。
其中,α是设置的学习率,为梯度下降法中的一个参数。
S2-4:判断所获得的梯度是否小于设定的阈值以及是否达到了最大迭 代次数,若不满足退出条件,则利用更新后的参数z(ui)S、和z(uj)S重复步骤S2-2,若满足退出条件,则输出当前的参数z(ui)S、和z(uj)S。
至此,通过上述步骤可以确定根据本发明的IS-VM模型的参数。应当 理解,在本发明中,还可以采用其他优化算法利用采集到的历史数据对如 计算式(6)所示出的损失函数L(Z)进行训练。在本发明中,可以采用任 意可用于确定使得所述损失函数L(Z)取值最小时参数z(ui)S、和z(uj)S的取值的算法。
根据本发明的上述方法训练得出的IS-VM模型可以被用于预测社交 用户对消息的转发。在进行预测时,对于测试集中每个消息,计算消息m 的源发用户的影响力表达与用户集合U中每个其他用户的易感性表达的 欧式距离,然后根据距离远近降序排列得到预测的用户列表,排在列表前 边的用户比排在列表后边的用户更可能转发。
根据本发明的一个实施例,还提供了一种采用通过上述方法训练获得 的IS-VM模型来预测社交网络中的用户是否会对消息进行转发的方法,包 括:利用所获得的参数和z(ui)S,计算用户ui与源发用户之间在用 户表达空间上的距离所述距离越大,则说明该名用 户ui对该名源发用户所发表的微博进行转发的可能性越小。
优选地,针对除所述源发用户之外的全部用户(即全部非源发用户) 计算所述在用户表达空间上的距离,并对所获得的距离进行排序。
这里进行消息预测的过程与信息检索的过程类似,可以看作是一种信 息检索过程,将消息源发用户看作是“查询”,将待预测的转发用户列表 看作是“文档”。针对某一条消息已知发出该消息的源发用户,对可能转 发该条消息的用户进行排序,将各个非源发用户与源发用户在用户表达空 间上的距离按照从小到大(或从大到小)的顺序添加到预测转发用户列表 中,从而确定哪名或哪些用户更有可能转发该条消息。
下面将根据实验数据来具体说明根据本发明的IS-VM模型、以及现有 技术CDK模型在使用时的比较结果。
为了进行模拟测试,发明人采集了新浪微博的部分数据进行了计算。 为了保证根据本发明的技术方案在训练及测试效果方面的可靠性,使每个 用户在转发关系中的特性均可用影响力和易感性两项来表达。进行模拟测 试所采用的数据集首先对未发表过原创微博的用户进行了过滤,仅考虑有 发表原创微博行为的用户。测试采集了两个热门话题的数据,记为话题1 和话题2,并针对每个话题分别构建了3个子数据集。各个子数据集包含着不同数据量的活跃用户,第一个数据集中包括前4000个活跃用户,第 二个数据集中包括前8000个活跃用户,第三个数据集中包括前18000个 活跃用户,每个数据集中70%的数据用于训练,30%的数据用于测试。
在两个不同话题的实际新浪微博数据集上测试发现,如图6所示出的 比较结果,本发明的IS-VM模型比CDK模型在话题1中3个数据集的在 准确率上所提高的百分比分别是10.8%,18.3%,35.1%,平均提高21.4%。 并且,如图7所示,IS-VM模型比CDK模型在话题2中3个数据集上的 提高比例分别是18.7%,27.2%,56.4%,平均提高34.1%。可以看出在实 验中,每个话题的三个数据集的数据量是递增的,上述结果表明数据规模 越大,IS-VM模型优越性越明显。此外,与CDK模型相比,相同计算环 境下IS-VM模型的收敛速度也有显著提高,如图8所示,IS-VM模型的 预测性能大概在500次达到稳定,CDK模型的预测性能大概在8000次达 到稳定,IS-VM模型的收敛速度显著快于CDK模型,提高了约16倍。
可以看出,采用根据本发明的IS-VM模型进行用户转发消息的预测准 确性要优于采用传统的CDK模型。并且在建立IS-VM模型时为获得参数 对而进行迭代的次数也要低于传统的CDK模型,因此根据本发明的技术 方案而建立IS-VM模型具有复杂度低的优点。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限 制。尽管上文参照实施例对本发明进行了详细说明,本领域的普通技术人 员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发 明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (9)
1.一种训练用于预测社交网络用户转发消息的模型的方法,包括:
1)获得所述社交网络中的历史数据,所述历史数据包括不同用户对同一条消息进行发布、转发的次序;
2)根据所述历史数据,求解使得损失函数取值最小时各名用户的影响力和易感性;
其中,所述影响力用于描述该名用户发布的消息被转发的概率,所述易感性用于描述该名用户受到发布消息的源发用户的影响而对所述消息进行转发的概率,所述损失函数是发布消息的源发用户的影响力、除所述源发用户之外的其他用户的易感性的函数;以及
其中,所述用户的影响力和易感性作为所述用于预测社交网络用户转发消息的模型的参数。
2.根据权利要求1所述的方法,所述损失函数是用户之间的临界惩罚间隔的函数,其中,用户之间的所述临界惩罚间隔为其中一名用户的易感性表达到发布消息的所述源发用户的影响力表达的欧式空间距离与另一名用户的易感性表达到所述源发用户的影响力表达的欧式空间距离之差。
3.根据权利要求2所述的方法,所述用户之间的临界惩罚间隔C(i,j)为:
<mrow>
<mi>C</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mi>log</mi>
<mi>&mu;</mi>
</msub>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>+</mo>
<mfrac>
<mrow>
<mi>j</mi>
<mo>-</mo>
<mi>i</mi>
</mrow>
<mrow>
<mn>1</mn>
<mo>+</mo>
<mi>i</mi>
</mrow>
</mfrac>
<mo>)</mo>
</mrow>
</mrow>
μ是消息扩散树的平均出度,i和j分别表示用户ui和uj在发布、转发的次序中的顺序编号。
4.根据权利要求2-3中任意一项所述的方法,其中所述损失函数L(Z)采用分类损失函数-hinge loss,表示为:
<mfenced open = "" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>L</mi>
<mrow>
<mo>(</mo>
<mi>Z</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>m</mi>
<msub>
<mo>&Element;</mo>
<msub>
<mi>C</mi>
<mi>l</mi>
</msub>
</msub>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<munder>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>u</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
<mo>&Element;</mo>
<msup>
<mi>&Phi;</mi>
<mi>m</mi>
</msup>
<mo>&times;</mo>
<msup>
<mi>&Phi;</mi>
<mi>m</mi>
</msup>
<mo>,</mo>
</mrow>
</munder>
<mrow>
<msup>
<mi>t</mi>
<mi>m</mi>
</msup>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo><</mo>
<msup>
<mi>t</mi>
<mi>m</mi>
</msup>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</munder>
<mi>max</mi>
<mo>(</mo>
<mn>0</mn>
<mo>,</mo>
<mi>C</mi>
<mo>(</mo>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
</mrow>
<mo>)</mo>
<mo>-</mo>
<mo>(</mo>
<mo>|</mo>
<mo>|</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>a</mi>
<mn>0</mn>
<mi>m</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mi>I</mi>
</msup>
<mo>-</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>S</mi>
</msup>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
<mo>-</mo>
<mo>|</mo>
<mo>|</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>a</mi>
<mn>0</mn>
<mi>m</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mi>I</mi>
</msup>
<mo>-</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>S</mi>
</msup>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
<mo>)</mo>
</mrow>
<mo>)</mo>
<mo>+</mo>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<msub>
<mi>u</mi>
<mi>i</mi>
</msub>
<mo>&Element;</mo>
<msup>
<mi>&Phi;</mi>
<mi>m</mi>
</msup>
<mo>,</mo>
<msub>
<mi>u</mi>
<mi>j</mi>
</msub>
<mo>&NotElement;</mo>
<msup>
<mi>&Phi;</mi>
<mi>m</mi>
</msup>
</mrow>
</munder>
<mi>max</mi>
<mrow>
<mo>(</mo>
<mn>0</mn>
<mo>,</mo>
<mi>C</mi>
<mo>(</mo>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
</mrow>
<mo>)</mo>
<mo>-</mo>
<mo>(</mo>
<mrow>
<mo>|</mo>
<mo>|</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>a</mi>
<mn>0</mn>
<mi>m</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mi>I</mi>
</msup>
<mo>-</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>S</mi>
</msup>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
<mo>-</mo>
<mo>|</mo>
<mo>|</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>a</mi>
<mn>0</mn>
<mi>m</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mi>I</mi>
</msup>
<mo>-</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>S</mi>
</msup>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>)</mo>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
其中,C(i,j)为用户i和用户j之间的临界惩罚间隔,m是话题Cl中的任意一条消息,用户转发序列用户ui和uj为Φm×Φm转发序列中的任意两个非原发用户,表示用户ui的转发时刻早于用户uj,ui∈Φ,用户ui转发了消息m而用户uj未进行转发。用户表达集合Z=(z(u1),…,z(uN)),z(ui)=(z(ui)I,z(ui)S),N代表所有用户的个数。
5.根据权利要求4所述的方法,其中步骤2)包括:
2-1)针对用户集合中的各名用户uk设置初始的影响力z(uk)I和易感性z(uk)S;
2-2)根据用户的当前的影响力和易感性,计算除所述源发用户之外的其他用户ui和uj之间的间隔距离δ以及临界惩罚间隔C(i,j);
2-3)若δ<C(i,j),则计算所述损失函数L(Z)相较于所述源发用户的影响力的梯度所述损失函数L(Z)相较于所述用户ui的易感性z(ui)S的梯度和所述损失函数L(Z)相较于所述用户uj的易感性z(uj)S的梯度利用所获得的梯度更新用户的影响力和易感性;
2-4)重复上述步骤2-2)、2-3),直到所获得的梯度中的至少一个小于设定的阈值或达到最大迭代次数。
6.根据权利要求5所述的方法,在步骤2-3)中,利用下式更新用户的影响力和易感性:
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>a</mi>
<mn>0</mn>
<mi>m</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mrow>
<mi>I</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>+</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
</msup>
<mo>=</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>a</mi>
<mn>0</mn>
<mi>m</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mrow>
<mi>I</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
</mrow>
</msup>
<mo>-</mo>
<mi>&alpha;</mi>
<mfrac>
<mrow>
<mo>&part;</mo>
<mi>L</mi>
</mrow>
<mrow>
<mo>&part;</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>a</mi>
<mn>0</mn>
<mi>m</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mi>I</mi>
</msup>
</mrow>
</mfrac>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mrow>
<mi>S</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>+</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
</msup>
<mo>=</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mrow>
<mi>S</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
</mrow>
</msup>
<mo>-</mo>
<mi>&alpha;</mi>
<mfrac>
<mrow>
<mo>&part;</mo>
<mi>L</mi>
</mrow>
<mrow>
<mo>&part;</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>S</mi>
</msup>
</mrow>
</mfrac>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<mi>u</mi>
<mo>)</mo>
</mrow>
<mrow>
<mi>S</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>+</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
</msup>
<mo>=</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mrow>
<mi>S</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
</mrow>
</msup>
<mo>-</mo>
<mi>&alpha;</mi>
<mfrac>
<mrow>
<mo>&part;</mo>
<mi>L</mi>
</mrow>
<mrow>
<mo>&part;</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>S</mi>
</msup>
</mrow>
</mfrac>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
其中,是更新后的源发用户的影响力,是更新前的源发用户的影响力,α是梯度下降算法中学习率,是所述损失函数L(Z)相较于所述源发用户的影响力的梯度,是更新后的用户ui的易感性,z(ui)S(n)是更新前的用户ui的易感性,所述损失函数L(Z)相较于所述用户ui的易感性z(ui)S的梯度,z(uj)S(n+1)是更新后的用户uj的易感性,z(uj)S(n)是更新前的用户uj的易感性,是所述损失函数L(Z)相较于所述用户uj的易感性z(uj)S的梯度。
7.一种预测社交网络用户转发消息的方法,包括:
1)基于权利要求1-6中任意一项方法确定发布消息m的源发用户的影响力以及除所述源发用户之外的其他用户ui的易感性z(ui)S;
2)计算所述用户ui到所述源发用户的欧式空间距离:
<mrow>
<mi>d</mi>
<mrow>
<mo>(</mo>
<mn>0</mn>
<mo>,</mo>
<mi>i</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>|</mo>
<mo>|</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>a</mi>
<mn>0</mn>
<mi>m</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mi>I</mi>
</msup>
<mo>-</mo>
<mi>z</mi>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>S</mi>
</msup>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
<mo>;</mo>
</mrow>
3)根据所述欧式空间距离,判断所述用户ui对所述源发用户所发表的消息进行转发的可能性。
8.一种计算机可读存储介质,其中存储有计算机程序,所述计算机程序在被执行时用于实现如权利要求1-7中任意一项所述的方法。
9.一种用于预测社交网络用户转发消息的系统,包括:
处理器、和存储装置,
其中,所述存储装置用于存储计算机程序,所述计算机程序在被所述处理器执行时用于实现如权利要求1-7中任意一项所述的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610958907.8A CN106503858A (zh) | 2016-10-28 | 2016-10-28 | 一种训练用于预测社交网络用户转发消息的模型的方法 |
CN2016109589078 | 2016-10-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107566249A true CN107566249A (zh) | 2018-01-09 |
CN107566249B CN107566249B (zh) | 2020-12-29 |
Family
ID=58321473
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610958907.8A Pending CN106503858A (zh) | 2016-10-28 | 2016-10-28 | 一种训练用于预测社交网络用户转发消息的模型的方法 |
CN201710727462.7A Active CN107566249B (zh) | 2016-10-28 | 2017-08-23 | 一种训练用于预测社交网络用户转发消息的模型的方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610958907.8A Pending CN106503858A (zh) | 2016-10-28 | 2016-10-28 | 一种训练用于预测社交网络用户转发消息的模型的方法 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN106503858A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108471380A (zh) * | 2018-03-09 | 2018-08-31 | 苏州大学 | 一种移动社交网络中基于智能优化的消息转发方法 |
CN109558540A (zh) * | 2018-11-30 | 2019-04-02 | 咪咕文化科技有限公司 | 一种确定用户影响力的方法及装置、设备、存储介质 |
CN110139288A (zh) * | 2019-04-08 | 2019-08-16 | 深圳众赢维融科技有限公司 | 一种网络通话方法、装置、系统和记录介质 |
CN111241421A (zh) * | 2020-01-14 | 2020-06-05 | 西安电子科技大学 | 基于社交上下文信息的用户转发行为预测方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991160B (zh) * | 2017-03-30 | 2020-07-24 | 武汉大学 | 一种基于用户影响力以及内容的微博传播预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103745105A (zh) * | 2014-01-06 | 2014-04-23 | 中国科学院计算技术研究所 | 一种社交网络中用户属性的预测方法及系统 |
US20140164398A1 (en) * | 2010-05-19 | 2014-06-12 | Adobe Systems Incorporated | Social media contributor weight |
CN104915392A (zh) * | 2015-05-26 | 2015-09-16 | 国家计算机网络与信息安全管理中心 | 一种微博转发行为预测方法及装置 |
CN105095988A (zh) * | 2015-07-01 | 2015-11-25 | 中国科学院计算技术研究所 | 社交网络信息爆发检测方法与系统 |
CN105893637A (zh) * | 2016-06-24 | 2016-08-24 | 四川大学 | 大规模微博异构信息网络中的链接预测方法 |
-
2016
- 2016-10-28 CN CN201610958907.8A patent/CN106503858A/zh active Pending
-
2017
- 2017-08-23 CN CN201710727462.7A patent/CN107566249B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140164398A1 (en) * | 2010-05-19 | 2014-06-12 | Adobe Systems Incorporated | Social media contributor weight |
CN103745105A (zh) * | 2014-01-06 | 2014-04-23 | 中国科学院计算技术研究所 | 一种社交网络中用户属性的预测方法及系统 |
CN104915392A (zh) * | 2015-05-26 | 2015-09-16 | 国家计算机网络与信息安全管理中心 | 一种微博转发行为预测方法及装置 |
CN105095988A (zh) * | 2015-07-01 | 2015-11-25 | 中国科学院计算技术研究所 | 社交网络信息爆发检测方法与系统 |
CN105893637A (zh) * | 2016-06-24 | 2016-08-24 | 四川大学 | 大规模微博异构信息网络中的链接预测方法 |
Non-Patent Citations (1)
Title |
---|
WEI LIU: "Learning Cost-Effective Social Embedding", 《HTTPS://LINK.SPRINGER.COM/CHAPTER/10.1007/978-981-10-2993-6_1》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108471380A (zh) * | 2018-03-09 | 2018-08-31 | 苏州大学 | 一种移动社交网络中基于智能优化的消息转发方法 |
CN109558540A (zh) * | 2018-11-30 | 2019-04-02 | 咪咕文化科技有限公司 | 一种确定用户影响力的方法及装置、设备、存储介质 |
CN109558540B (zh) * | 2018-11-30 | 2021-10-29 | 咪咕文化科技有限公司 | 一种确定用户影响力的方法及装置、设备、存储介质 |
CN110139288A (zh) * | 2019-04-08 | 2019-08-16 | 深圳众赢维融科技有限公司 | 一种网络通话方法、装置、系统和记录介质 |
CN110139288B (zh) * | 2019-04-08 | 2022-07-01 | 简链科技(广东)有限公司 | 一种网络通话方法、装置、系统和记录介质 |
CN111241421A (zh) * | 2020-01-14 | 2020-06-05 | 西安电子科技大学 | 基于社交上下文信息的用户转发行为预测方法 |
CN111241421B (zh) * | 2020-01-14 | 2022-07-01 | 西安电子科技大学 | 基于社交上下文信息的用户转发行为预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106503858A (zh) | 2017-03-15 |
CN107566249B (zh) | 2020-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107566249B (zh) | 一种训练用于预测社交网络用户转发消息的模型的方法 | |
CN101540739B (zh) | 用户推荐方法及用户推荐系统 | |
CN107330798B (zh) | 一种基于种子节点传播的社交网络间用户身份识别方法 | |
CN103064917B (zh) | 一种面向微博的特定倾向的高影响力用户群发现方法 | |
Yu et al. | A survey of multi-agent trust management systems | |
CN106682770B (zh) | 一种基于好友圈子的动态微博转发行为预测系统及方法 | |
US9483580B2 (en) | Estimation of closeness of topics based on graph analytics | |
CN105809554B (zh) | 一种社交网络中用户参与热点话题的预测方法 | |
CN110213164B (zh) | 一种基于拓扑信息融合的识别网络关键传播者的方法及装置 | |
CN113807616B (zh) | 基于时空注意力和异构图卷积网络的信息扩散预测系统 | |
US20150235137A1 (en) | Predicting influence in social networks | |
Pan et al. | Diffusion-aware personalized social update recommendation | |
CN105893637A (zh) | 大规模微博异构信息网络中的链接预测方法 | |
Zhang et al. | Mechanism design for finding experts using locally constructed social referral web | |
CN107403007B (zh) | 一种基于网络的微博消息可信度判别模型的方法 | |
CN110233833B (zh) | 支持社交网络用户隐私保护的消息发送方法及系统 | |
CN113850446B (zh) | 融合时空注意力和异构图卷积网络的信息扩散预测方法 | |
Yang et al. | Recommender system-based diffusion inferring for open social networks | |
CN110134883B (zh) | 一种异构社交网络位置实体锚链接识别方法 | |
US11336596B2 (en) | Personalized low latency communication | |
CN107784327A (zh) | 一种基于gn的个性化社区发现方法 | |
CN105913159A (zh) | 基于社交网络事件的用户影响力预测方法 | |
CN114928548A (zh) | 一种社交网络信息传播规模预测方法及装置 | |
CN115422441A (zh) | 一种基于社交时空信息与用户偏好的连续兴趣点推荐方法 | |
CN104572915B (zh) | 一种基于内容环境增强的用户事件相关度计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |