CN115829159B - 社交媒体粉丝新增预测方法、装置、设备及存储介质 - Google Patents
社交媒体粉丝新增预测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115829159B CN115829159B CN202211710495.8A CN202211710495A CN115829159B CN 115829159 B CN115829159 B CN 115829159B CN 202211710495 A CN202211710495 A CN 202211710495A CN 115829159 B CN115829159 B CN 115829159B
- Authority
- CN
- China
- Prior art keywords
- microblog
- fan
- potential
- user
- history
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000003993 interaction Effects 0.000 claims abstract description 107
- 230000006399 behavior Effects 0.000 claims description 200
- 239000013598 vector Substances 0.000 claims description 46
- 230000002452 interceptive effect Effects 0.000 claims description 18
- 238000004891 communication Methods 0.000 claims description 17
- 230000007246 mechanism Effects 0.000 claims description 14
- 238000013507 mapping Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 8
- 230000004931 aggregating effect Effects 0.000 claims description 4
- 230000008451 emotion Effects 0.000 claims description 4
- 230000001537 neural effect Effects 0.000 claims description 4
- 230000007935 neutral effect Effects 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000007792 addition Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 1
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请公开了一种社交媒体粉丝新增预测方法、装置、设备及存储介质。其中,所述方法包括:根据潜在粉丝用户在社交媒体上的历史交互行为确定所述潜在粉丝用户对应的粉丝历史微博文本序列,并根据微博博主在社交媒体上的历史交互行为确定所述微博博主对应的博主历史微博文本序列;根据所述粉丝历史微博文本序列确定所述潜在粉丝用户的粉丝历史行为序列表示,并基于所述博主历史微博文本序列确定所述微博博主的博主历史行为序列表示;根据所述粉丝历史行为序列表示和所述博主历史行为序列表示预测所述潜在粉丝用户与所述微博博主是否会发生关注关系。本方案基于新浪微博社交媒体场景,提出一种新颖的思路和方法实现粉丝新增预测。
Description
技术领域
本申请涉及社交媒体技术领域,具体涉及一种社交媒体粉丝新增预测方法、装置、设备及存储介质。
背景技术
预测社交媒体新增粉丝在各种场景中都有重要的作用,例如在商业场景中,对潜在商业价值用户进行定向吸粉;在新闻传播领域,对新闻内容潜在感兴趣用户进行预测;在娱乐角度,对明星新增粉丝进行预测等等。而新浪微博是国内社交媒体的典型代表,在新浪微博社交媒体场景下,目前还没有一种对粉丝新增的预测方法。
发明内容
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的社交媒体粉丝新增预测方法、装置、设备及存储介质。
根据本申请的一个方面,提供了一种社交媒体粉丝新增预测方法,包括:
根据潜在粉丝用户在社交媒体上的历史交互行为确定所述潜在粉丝用户对应的粉丝历史微博文本序列,并根据微博博主在社交媒体上的历史交互行为确定所述微博博主对应的博主历史微博文本序列;
根据所述粉丝历史微博文本序列确定所述潜在粉丝用户的粉丝历史行为序列表示,并基于所述博主历史微博文本序列确定所述微博博主的博主历史行为序列表示;
根据所述粉丝历史行为序列表示和所述博主历史行为序列表示预测所述潜在粉丝用户与所述微博博主是否会发生关注关系。
根据本申请的另一个方面,提供了一种社交媒体粉丝新增预测装置,包括:
微博文本序列确定模块,用于根据潜在粉丝用户在社交媒体上的历史交互行为确定所述潜在粉丝用户对应的粉丝历史微博文本序列,并根据微博博主在社交媒体上的历史交互行为确定所述微博博主对应的博主历史微博文本序列;
行为序列表示确定模块,用于根据所述粉丝历史微博文本序列确定所述潜在粉丝用户的粉丝历史行为序列表示,并基于所述博主历史微博文本序列确定所述微博博主的博主历史行为序列表示;
粉丝预测模块,用于根据所述粉丝历史行为序列表示和所述博主历史行为序列表示预测所述潜在粉丝用户与所述微博博主是否会发生关注关系。
根据本申请的另一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行本申请所述的社交媒体粉丝新增预测方法对应的操作。
根据本申请的另一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行本申请所述的社交媒体粉丝新增预测方法对应的操作。
根据本申请公开的社交媒体粉丝新增预测方法、设备及存储介质,通过根据潜在粉丝用户在社交媒体上的历史交互行为确定所述潜在粉丝用户对应的粉丝历史微博文本序列,并根据微博博主在社交媒体上的历史交互行为确定所述微博博主对应的博主历史微博文本序列;根据所述粉丝历史微博文本序列确定所述潜在粉丝用户的粉丝历史行为序列表示,并基于所述博主历史微博文本序列确定所述微博博主的博主历史行为序列表示;根据所述粉丝历史行为序列表示和所述博主历史行为序列表示预测所述潜在粉丝用户与所述微博博主是否会发生关注关系。这样基于新浪微博社交媒体场景,提出一种新颖的思路和方法实现粉丝新增预测。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本申请实施例一提供的一种社交媒体粉丝新增预测方法的流程示意图;
图2示出了根据本申请实施例二提供的一种社交媒体粉丝新增预测方法中NARRE双塔模型建模过程示意图;
图3示出了根据本申请实施三提供的一种社交媒体粉丝新增预测装置的结构示意图;
图4示出了根据本申请实施例五提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
实施例一
图1示出了根据本申请实施例一提供的一种社交媒体粉丝新增预测方法的流程示意图。如图1所示,该方法包括:
步骤S11,根据潜在粉丝用户在社交媒体上的历史交互行为确定潜在粉丝用户对应的粉丝历史微博文本序列,并根据微博博主在社交媒体上的历史交互行为确定微博博主对应的博主历史微博文本序列。
其中,潜在粉丝用户的历史交互行为包括主动发帖、转发、评论和点赞四种类型的行为。具体来说,当潜在粉丝用户在社交媒体上的历史交互行为为主动发帖时,潜在粉丝用户对应的粉丝历史微博文本序列由潜在粉丝用户主动发帖的微博文本组成。当潜在粉丝用户在社交媒体上的历史交互行为为转发时,潜在粉丝用户对应的粉丝历史微博文本序列由被潜在粉丝用户对应转发的原微博文本组成。当潜在粉丝用户在社交媒体上的历史交互行为为评论时,潜在粉丝用户对应的粉丝历史微博文本序列由被潜在粉丝用户对应评论的原微博文本组成。当潜在粉丝用户在社交媒体上的历史交互行为为点赞时,潜在粉丝用户对应的粉丝历史微博文本序列由被潜在粉丝用户对应点赞的原微博文本组成。
同理,对于微博博主的历史交互行为也包括主动发帖、转发、评论和点赞四种类型的行为。具体来说,当微博博主在社交媒体上的历史交互行为为主动发帖时,微博博主对应的博主历史微博文本序列由微博博主主动发帖的微博文本组成。当微博博主在社交媒体上的历史交互行为为转发时,微博博主对应的博主历史微博文本序列由被微博博主对应转发的原微博文本组成。当微博博主在社交媒体上的历史交互行为为评论时,微博博主对应的博主历史微博文本序列由被微博博主对应评论的原微博文本组成。当微博博主在社交媒体上的历史交互行为为点赞时,微博博主对应的博主历史微博文本序列由被微博博主对应点赞的原微博文本组成。
步骤S12,根据粉丝历史微博文本序列确定潜在粉丝用户的粉丝历史行为序列表示,并基于博主历史微博文本序列确定微博博主的博主历史行为序列表示。
具体的,可以将粉丝历史微博文本序列中每个交互行为对应的微博文本进行向量化,根据向量化后得到的特征向量确定潜在粉丝用户的粉丝历史行为序列表示。同理,将博主历史微博文本序列中每个交互行为对应的微博文本进行向量化,根据向量化后得到的特征向量确定微博博主的博主历史行为序列表示。
步骤S13,根据粉丝历史行为序列表示和博主历史行为序列表示预测潜在粉丝用户与微博博主是否会发生关注关系。
其中,粉丝历史行为序列表示和博主历史行为序列表示均为可以转化为特征向量,根据两个特征向量的相关性确定潜在粉丝用户与微博博主是否会发生关注关系。例如,计算两个特征向量的点积,当点积处于某个预设范围时,确定潜在粉丝用户会关注该微博博主。
由此可见,本实施例通过根据潜在粉丝用户在社交媒体上的历史交互行为确定潜在粉丝用户对应的粉丝历史微博文本序列,并根据微博博主在社交媒体上的历史交互行为确定微博博主对应的博主历史微博文本序列;根据粉丝历史微博文本序列确定潜在粉丝用户的粉丝历史行为序列表示,并基于博主历史微博文本序列确定微博博主的博主历史行为序列表示;根据粉丝历史行为序列表示和博主历史行为序列表示预测潜在粉丝用户与微博博主是否会发生关注关系。这样基于新浪微博社交媒体场景,提出一种新颖的思路和方法实现粉丝新增预测。
在一个可选实施例中,步骤S12包括:
步骤S121,对粉丝历史微博文本序列中的每个交互行为对应的微博文本进行语义处理,得到潜在粉丝用户的粉丝微博文本特征向量。
具体的,对每个交互行为对应的微博文本计算语义特征得到潜在粉丝用户的粉丝微博文本特征向量。例如,对每一个交互行为的微博文本进行建模,经过卷积神经网络(Convolutional Neural Network,CNN)、或循环神经网络(Recurrent Neural Network,RNN)以及最大池化Maxpooling处理得到每条微博文本语义的嵌入表示,可以记为Ou1,Ou2,…,Ouj,将该嵌入表示作为潜在粉丝用户的粉丝微博文本特征向量。
步骤S122,根据粉丝微博文本特征向量和潜在粉丝用户历史行为序列的数值类型特征确定潜在粉丝用户的粉丝历史行为序列表示。
其中,潜在粉丝用户历史行为序列的数值类型特征包括潜在粉丝用户交互行为类型、潜在粉丝用户发生交互行为的时间戳、潜在粉丝用户发生交互行为的上下文、基于与潜在粉丝用户发生交互行为的其他用户本身账号映射得到的特征向量、潜在粉丝用户的兴趣标签。
其中,潜在粉丝用户交互行为类型包括主动发帖、转发、评论、点赞,例如分别用数值1、2、3、4表示。
其中,潜在粉丝用户发生交互行为的时间戳可以用小时表示。
其中,潜在粉丝用户发生交互行为的上下文是指潜在粉丝用户u发生交互行为的上下文,此处可使用该潜在粉丝用户发布的文本中所表达的情绪代替,例如,1代表积极,0代表中立,-1代表消极(潜在粉丝用户u发布的文本在交互行为类型为主动发帖时,即为其发布帖子的正文文本内容;交互行为类型为评论时,即为其评论时发布的文本内容;交互行为类型为转发时,即为其转发时发布的评论文本内容;交互行为类型为点赞时,即为其点赞的原文内容)。
其中,基于与潜在粉丝用户发生交互行为的其他用户本身账号映射得到的特征向量可能是微博博主的,也可能不是。
其中,潜在粉丝用户的兴趣标签代表潜在粉丝用户u的兴趣标签(画像标签)编码,比如1代表社会时事、2代表财经、3代表娱乐明星、4代表体育、5代表读书作家。
具体的,可以将潜在粉丝用户的粉丝微博文本特征向量与对应的数值类型特征进行拼接,然后基于历史交互行为发生的时间戳从前到后排序得到其历史行为序列表示。
在一个可选实施例中,步骤S12具体包括:
基于粉丝微博文本特征向量和潜在粉丝用户历史行为序列的数值类型特征,采用注意力机制评估潜在粉丝用户历史行为序列中每个交互行为的贡献度,得到潜在粉丝用户的粉丝历史行为序列表示。
具体的,在计算历史行为序列中每个交互行为的时候,可以根据注意力机制确定该交互行为在整个历史交互行为序列中的重要性即贡献度(也即注意力机制输出的权重系数)。
在一个可选实施例中,步骤S13具体包括:
步骤S131,根据粉丝历史行为序列表示和基于潜在粉丝用户本身账号映射得到的特征向量确定潜在粉丝用户的粉丝特征向量。
具体的,可以将潜在粉丝用户本身账号进行映射特征向量,然后将粉丝历史行为序列表示和特征向量进行拼接,得到潜在粉丝用户的粉丝特征向量。
步骤S132,根据博主历史行为序列表示和基于微博博主本身账号映射得到的特征向量确定微博博主的博主特征向量。
同理,将微博博主本身账号进行映射特征向量,然后将博主历史行为序列表示和对应的特征向量进行拼接,得到微博博主的博主特征向量。
步骤S133,根据粉丝特征向量和博主特征向量预测潜在粉丝用户与微博博主是否会发生关注关系。
具体的,可以对粉丝特征向量和博主特征向量进行点积运算;根据点积结果预测潜在粉丝用户与微博博主是否会发生关注关系。例如,当点积处于某个范围区间时,预测潜在粉丝用户与微博博主会发生关注关系。
实施例二
本申请实施例二提供的一种社交媒体粉丝新增预测方法,本实施例基于评论级别的解释的神经注意力评分回归(Neural Attention Regression with Review-levelExplanation,NARRE)的双塔模型对粉丝新增进行预测。具体的,基于NARRE的双塔模型针对用户(包括潜在粉丝用户和微博博主)在社交媒体上的交互行为进行建模,包括主动发帖、转发、评论、点赞四种类型的行为,并对每个交互行为包含文本内容计算语义特征,然后利用注意力机制,挖掘用户重要兴趣,对用户所有交互行为进行聚合,得到用户的历史行为序列表示后,基于用户的历史行为序列表示进行预测。
由于需要基于用户历史交互行为序列挖掘用户兴趣进行建模,考虑采用NARRE等基于注意力的兴趣模型,该模型善于处理序列数据。其中,NARRE的双塔模型框架图如图2所示,其中NARRE相对比其它模型,可以同时对推荐系统中的user行为序列和item序列进行建模(此处,推荐系统中的user可对应本实施例中的潜在粉丝用户,推荐系统中的item可对应本实施例中的微博博主)。在本实施例中,不仅需要通过潜在粉丝用户历史交互行为序列挖掘其兴趣偏好,还需要通过微博博主的历史交互行为序列,挖掘博主自身的兴趣偏好。所以在微博社交媒体场景下,NARRE双塔模型具有天然的优势,能同时对潜在粉丝用户、微博博主历史交互行为序列进行建模。
具体参见图2所示的NARRE双塔模型,其建模过程如下:
(1)潜在粉丝用户的粉丝历史行为序列建模
假设在某个时刻t,微博博主i的主页或者微博相关内容曝光给了某个潜在粉丝用户u,Vu1,Vu2,…,Vuj是指潜在粉丝用户u在时刻t之前的历史微博文本序列,当交互行为类型为主动发帖时,选用潜在粉丝用户u主动发帖的微博文本,当交互行为类型为转发、评论、点赞行为时,选用被潜在粉丝用户u转发、或评论、或点赞的原微博文本。对每一个交互行为的微博文本进行建模,经过CNN\RNN+Maxpooling得到每条微博文本语义的嵌入表示即粉丝历史微博文本序列,记为Ou1,Ou2,…,Ouj。
iu1,iu2,…,iuj是对应刻画潜在粉丝用户u历史交互行为序列的数值类型特征,详细定义如下:
{i=(actionid,timestamp,context,userid_embedding,interest)}
其中,actionid是指潜在粉丝用户u交互行为类型编号(1代表主动发帖行为,2代表转发行为,3代表评论行为,4代表点赞行为);timestamp是指潜在粉丝用户u发生交互行为的时间戳,此处可以考虑细化到小时;context是指潜在粉丝用户u发生交互行为的上下文,此处可使用该用户发布的文本中所表达的情绪代替:1代表积极,0代表中立,-1代表消极(潜在粉丝用户u发布的文本的交互行为类型为主动发帖时,即为其发布帖子的正文文本内容;交互行为类型为评论时,即为其评论时发布的文本内容;行为类型为“转发”时,即为其转发时发布的评论文本内容;行为类型为“点赞”时,即为其点赞的原文内容);userid_embedding代表基于与潜在粉丝用户发生交互行为的其他用户本身账号映射得到的特征向量(可能是微博博主i,也可能不是);interest代表潜在粉丝用户u的兴趣标签(画像标签)编码,比如1代表社会时事、2代表财经、3代表娱乐明星、4代表体育、5代表读书作家。
将潜在粉丝用户u的历史交互行为根据时间戳从前到后排序得到其历史交互行为序列的表示:
Su={(iu1,Ou1),(iu2,Ou2),…,(iuj,Ouj)}
(2)微博博主的博主历史行为序列建模
微博博主i在时刻t之前的历史交互行为序列建模方式可类比(1)中对潜在粉丝用户的粉丝历史交互行为序列建模方式,得到:
Si={(ii1,Oi1),(ii2,Oi2),…,(iik,Oik)}
(3)注意力机制
引入注意力机制,聚合潜在粉丝用户u的粉丝历史交互行为序列,得到其表示Xu;聚合微博博主i的博主历史交互行为序列,得到其表示Yi。利用注意力机制,可以评估历史交互行为序列中每个交互行为的贡献度。
(4)预测
将用户本身的ID Embedding用到最终的评测结果中:
h=(qu+Xu)·(pi+Yi)
其中,qu为潜在粉丝用户u的userid embedding,pi为微博博主i的useridembedding。
经过上述过程可以完成NARRE双塔模型的建模过程,然后构建训练样本数据,对该模型进行训练,使其具备社交媒体粉丝新增预测功能。在训练样本选取时,可以选取正样本和负样本两种类型。具体的,在t~t+Δt时间段内,潜在粉丝用户u关注了微博博主i,label为1(正样本),否则,label为0(负样本),其中Δt是自定义的一段时间,代表微博博主i的微博或主页曝光给潜在粉丝用户u了Δt时间。
另外,存在一种特殊情况,潜在粉丝用户u关注了微博博主i后,一段时间(可以自定义设置)后,潜在粉丝用户u取消了关注。此时,可以将其作为负样本。
本实施例将基于用户交互行为序列挖掘用户兴趣的NARRE双塔模型,用于以新浪微博为代表的社交媒体的粉丝新增预测中,能够根据微博博主和潜在粉丝用户的历史交互行为序列,挖掘的两者的潜在兴趣并准确预测是否会发生关注关系。
实施例三
图3示出了根据本申请实施三提供的一种社交媒体粉丝新增预测装置的结构示意图。如图3所示,该装置包括:微博文本序列确定模块21、行为序列表示确定模块22和粉丝预测模块23;其中,
微博文本序列确定模块21用于根据潜在粉丝用户在社交媒体上的历史交互行为确定所述潜在粉丝用户对应的粉丝历史微博文本序列,并根据微博博主在社交媒体上的历史交互行为确定所述微博博主对应的博主历史微博文本序列;
行为序列表示确定模块22用于根据所述粉丝历史微博文本序列确定所述潜在粉丝用户的粉丝历史行为序列表示,并基于所述博主历史微博文本序列确定所述微博博主的博主历史行为序列表示;
粉丝预测模块23用于根据所述粉丝历史行为序列表示和所述博主历史行为序列表示预测所述潜在粉丝用户与所述微博博主是否会发生关注关系。
进一步的,所述行为序列表示确定模块22具体用于:当所述潜在粉丝用户在社交媒体上的历史交互行为为主动发帖时,根据所述潜在粉丝用户主动发帖的微博文本确定所述潜在粉丝用户对应的粉丝历史微博文本序列;或当所述潜在粉丝用户在社交媒体上的历史交互行为为转发、评论和点赞中的任一种行为时,根据被所述潜在粉丝用户对应转发、或对应评论、或对应点赞的原微博文本确定所述潜在粉丝用户对应的粉丝历史微博文本序列。
进一步的,所述行为序列表示确定模块22包括:语义处理单元221和行为序列表示确定单元222;其中,
所述语义处理单元221用于对所述粉丝历史微博文本序列中的每个交互行为对应的微博文本进行语义处理,得到所述潜在粉丝用户的粉丝微博文本特征向量;
所述行为序列表示确定单元222用于根据所述粉丝微博文本特征向量和所述潜在粉丝用户历史行为序列的数值类型特征确定所述潜在粉丝用户的粉丝历史行为序列表示。
进一步的,所述行为序列表示确定单元222具体用于:基于所述粉丝微博文本特征向量和所述潜在粉丝用户历史行为序列的数值类型特征,采用注意力机制评估所述潜在粉丝用户历史行为序列中每个交互行为的贡献度,得到所述潜在粉丝用户的粉丝历史行为序列表示。
进一步的,所述粉丝预测模块23包括:粉丝特征向量确定单元231、博主特征向量确定单元232和粉丝预测单元233;其中,
粉丝特征向量确定单元231用于根据所述粉丝历史行为序列表示和基于所述潜在粉丝用户本身账号映射得到的特征向量确定所述潜在粉丝用户的粉丝特征向量;
所述博主特征向量确定单元232用于根据所述博主历史行为序列表示和基于所述微博博主本身账号映射得到的特征向量确定所述微博博主的博主特征向量;
粉丝预测单元233用于根据所述粉丝特征向量和所述博主特征向量预测所述潜在粉丝用户与所述微博博主是否会发生关注关系。
进一步的,所述粉丝预测单元233具体用于:对所述粉丝特征向量和所述博主特征向量进行点积运算;根据点积结果预测所述潜在粉丝用户与所述微博博主是否会发生关注关系。
进一步的,所述潜在粉丝用户历史行为序列的数值类型特征包括所述潜在粉丝用户交互行为类型、所述潜在粉丝用户发生交互行为的时间戳、所述潜在粉丝用户发生交互行为的上下文、基于与所述潜在粉丝用户发生交互行为的其他用户本身账号映射得到的特征向量、所述潜在粉丝用户的兴趣标签。
本实施例所述的社交媒体粉丝新增预测装置用于执行上述实施例一至实施例二所述的社交媒体粉丝新增预测方法,其工作原理与技术效果类似,这里不再赘述。
实施例四
本申请实施例四提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的社交媒体粉丝新增预测方法。
实施例五
图4示出了根据本申请实施例五提供的一种电子设备的结构示意图。本申请具体实施例并不对电子设备的具体实现做限定。
如图4所示,该电子设备可以包括:处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。
其中:处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。处理器302,用于执行程序310,具体可以执行上述方法实施例中的相关步骤。
具体地,程序310可以包括程序代码,该程序代码包括计算机操作指令。
处理器302可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器306,用于存放程序310。存储器306可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序310具体可以用于使得处理器302执行上述任意方法实施例中的社交媒体粉丝新增预测方法。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本申请实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本申请并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本申请实施例的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
Claims (4)
1.一种社交媒体粉丝新增预测方法,其特征在于,包括:
根据潜在粉丝用户在社交媒体上的历史交互行为确定所述潜在粉丝用户对应的粉丝历史微博文本序列,并根据微博博主在社交媒体上的历史交互行为确定所述微博博主对应的博主历史微博文本序列;
根据所述粉丝历史微博文本序列确定所述潜在粉丝用户的粉丝历史交互行为序列表示,并基于所述博主历史微博文本序列确定所述微博博主的博主历史交互行为序列表示;其中,用户的历史交互行为序列表示通过基于神经注意力评分回归NARRE的双塔模型针对用户在社交媒体上的交互行为进行建模得到,所述用户包括潜在粉丝用户和微博博主;
根据所述粉丝历史交互行为序列表示和所述博主历史交互行为序列表示预测所述潜在粉丝用户与所述微博博主是否会发生关注关系;
其中,所述NARRE的双塔模型的建模过程如下:
(1)潜在粉丝用户的粉丝历史交互行为序列建模
假设在某个时刻t,微博博主的主页或者微博相关内容曝光给了某个潜在粉丝用户/>,,/>是指潜在粉丝用户/>在时刻t之前的历史微博文本序列,当交互行为类型为主动发帖时,选用潜在粉丝用户/>主动发帖的微博文本,当交互行为类型为转发、评论、点赞行为时,选用被潜在粉丝用户/>转发、或评论、或点赞的原微博文本;对每一个交互行为的微博文本进行建模,经过CNNRNN+Maxpooling得到每条微博文本语义的嵌入表示即粉丝历史微博文本序列,记为/>,/>;
,/>是对应刻画潜在粉丝用户/>历史交互行为序列的数值类型特征,定义如下:
i=(actionid, timestamp, context,userid_embedding,interest)}
其中,actionid是指潜在粉丝用户交互行为类型编号,所述类型编号代表主动发帖行为、转发行为、评论行为和点赞行为中的任意一种交互行为;timestamp是指潜在粉丝用户/>发生交互行为的时间戳;context是指潜在粉丝用户/>发生交互行为的上下文,所述上下文代表用户发布的文本中所表达的情绪积极、中立、消极中的任一种情绪;userid_embedding代表基于与潜在粉丝用户发生交互行为的其他用户本身账号映射得到的特征向量;interest代表潜在粉丝用户/>的兴趣标签编码,所述兴趣标签编码代表社会时事、财经、娱乐明星、体育、读书作家中的任意一种;
将潜在粉丝用户的历史交互行为根据时间戳从前到后排序得到潜在粉丝用户u的历史交互行为序列的表示:
(2)微博博主的博主历史交互行为序列建模
微博博主在时刻t之前的历史交互行为序列建模方式可类比(1)中对潜在粉丝用户的粉丝历史交互行为序列建模方式,得到:
(3)注意力机制
引入注意力机制,聚合潜在粉丝用户的粉丝历史交互行为序列,得到潜在粉丝用户u的表示/>;聚合微博博主/>的博主历史交互行为序列,得到微博博主i的表示/>;利用注意力机制评估历史交互行为序列中每个交互行为的贡献度;
(4)预测
将用户本身的ID Embedding用到最终的评测结果中:
其中,为潜在粉丝用户/>的userid embedding,/>为微博博主/>的userid embedding。
2.一种社交媒体粉丝新增预测装置,其特征在于,包括:
微博文本序列确定模块,用于根据潜在粉丝用户在社交媒体上的历史交互行为确定所述潜在粉丝用户对应的粉丝历史微博文本序列,并根据微博博主在社交媒体上的历史交互行为确定所述微博博主对应的博主历史微博文本序列;
行为序列表示确定模块,用于根据所述粉丝历史微博文本序列确定所述潜在粉丝用户的粉丝历史交互行为序列表示,并基于所述博主历史微博文本序列确定所述微博博主的博主历史交互行为序列表示;其中,用户的历史交互行为序列表示通过基于神经注意力评分回归NARRE的双塔模型针对用户在社交媒体上的交互行为进行建模得到,所述用户包括潜在粉丝用户和微博博主;
粉丝预测模块,用于根据所述粉丝历史交互行为序列表示和所述博主历史交互行为序列表示预测所述潜在粉丝用户与所述微博博主是否会发生关注关系;
其中,所述NARRE的双塔模型的建模过程如下:
(1)潜在粉丝用户的粉丝历史交互行为序列建模
假设在某个时刻t,微博博主的主页或者微博相关内容曝光给了某个潜在粉丝用户/>,,/>是指潜在粉丝用户/>在时刻t之前的历史微博文本序列,当交互行为类型为主动发帖时,选用潜在粉丝用户/>主动发帖的微博文本,当交互行为类型为转发、评论、点赞行为时,选用被潜在粉丝用户/>转发、或评论、或点赞的原微博文本;对每一个交互行为的微博文本进行建模,经过CNNRNN+Maxpooling得到每条微博文本语义的嵌入表示即粉丝历史微博文本序列,记为/>,/>;
,/>是对应刻画潜在粉丝用户/>历史交互行为序列的数值类型特征,定义如下:
i=(actionid, timestamp, context,userid_embedding,interest)}
其中,actionid是指潜在粉丝用户交互行为类型编号,所述类型编号代表主动发帖行为、转发行为、评论行为和点赞行为中的任意一种交互行为;timestamp是指潜在粉丝用户/>发生交互行为的时间戳;context是指潜在粉丝用户/>发生交互行为的上下文,所述上下文代表用户发布的文本中所表达的情绪积极、中立、消极中的任一种情绪;userid_embedding代表基于与潜在粉丝用户发生交互行为的其他用户本身账号映射得到的特征向量;interest代表潜在粉丝用户/>的兴趣标签编码,所述兴趣标签编码代表社会时事、财经、娱乐明星、体育、读书作家中的任意一种;
将潜在粉丝用户的历史交互行为根据时间戳从前到后排序得到潜在粉丝用户u的历史交互行为序列的表示:
(2)微博博主的博主历史交互行为序列建模
微博博主在时刻t之前的历史交互行为序列建模方式可类比(1)中对潜在粉丝用户的粉丝历史交互行为序列建模方式,得到:
(3)注意力机制
引入注意力机制,聚合潜在粉丝用户的粉丝历史交互行为序列,得到潜在粉丝用户u的表示/>;聚合微博博主/>的博主历史交互行为序列,得到微博博主i的表示/>;利用注意力机制评估历史交互行为序列中每个交互行为的贡献度;
(4)预测
将用户本身的ID Embedding用到最终的评测结果中:
其中,为潜在粉丝用户/>的userid embedding,/>为微博博主/>的userid embedding。
3.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1所述的社交媒体粉丝新增预测方法对应的操作。
4.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1所述的社交媒体粉丝新增预测方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211710495.8A CN115829159B (zh) | 2022-12-29 | 2022-12-29 | 社交媒体粉丝新增预测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211710495.8A CN115829159B (zh) | 2022-12-29 | 2022-12-29 | 社交媒体粉丝新增预测方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115829159A CN115829159A (zh) | 2023-03-21 |
CN115829159B true CN115829159B (zh) | 2023-11-10 |
Family
ID=85519347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211710495.8A Active CN115829159B (zh) | 2022-12-29 | 2022-12-29 | 社交媒体粉丝新增预测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115829159B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116596143A (zh) * | 2023-05-19 | 2023-08-15 | 人民网股份有限公司 | 社交媒体行为预测方法、装置、计算设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106649659A (zh) * | 2016-12-13 | 2017-05-10 | 重庆邮电大学 | 一种面向社交网络的链接预测系统及方法 |
CN107729569A (zh) * | 2017-11-17 | 2018-02-23 | 杭州师范大学 | 一种融合网络结构和文本信息的社交关系预测方法 |
CN107767279A (zh) * | 2017-10-12 | 2018-03-06 | 燕山大学 | 一种基于lda的加权平均的个性化好友推荐方法 |
CN107908700A (zh) * | 2017-11-06 | 2018-04-13 | 余帝乾 | 一种微博用户行为分析预测的方法 |
CN110633422A (zh) * | 2019-09-16 | 2019-12-31 | 安徽大学 | 一种基于异构信息网络的微博好友推荐方法 |
CN110837602A (zh) * | 2019-11-05 | 2020-02-25 | 重庆邮电大学 | 基于表示学习和多模态卷积神经网络的用户推荐方法 |
CN114723522A (zh) * | 2022-03-31 | 2022-07-08 | 合肥工业大学 | 一种面向评论文本的图神经网络推荐方法 |
CN115293437A (zh) * | 2022-08-15 | 2022-11-04 | 重庆邮电大学 | 一种基于社交网络平台动态交互的关系预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110302103A1 (en) * | 2010-06-08 | 2011-12-08 | International Business Machines Corporation | Popularity prediction of user-generated content |
-
2022
- 2022-12-29 CN CN202211710495.8A patent/CN115829159B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106649659A (zh) * | 2016-12-13 | 2017-05-10 | 重庆邮电大学 | 一种面向社交网络的链接预测系统及方法 |
CN107767279A (zh) * | 2017-10-12 | 2018-03-06 | 燕山大学 | 一种基于lda的加权平均的个性化好友推荐方法 |
CN107908700A (zh) * | 2017-11-06 | 2018-04-13 | 余帝乾 | 一种微博用户行为分析预测的方法 |
CN107729569A (zh) * | 2017-11-17 | 2018-02-23 | 杭州师范大学 | 一种融合网络结构和文本信息的社交关系预测方法 |
CN110633422A (zh) * | 2019-09-16 | 2019-12-31 | 安徽大学 | 一种基于异构信息网络的微博好友推荐方法 |
CN110837602A (zh) * | 2019-11-05 | 2020-02-25 | 重庆邮电大学 | 基于表示学习和多模态卷积神经网络的用户推荐方法 |
CN114723522A (zh) * | 2022-03-31 | 2022-07-08 | 合肥工业大学 | 一种面向评论文本的图神经网络推荐方法 |
CN115293437A (zh) * | 2022-08-15 | 2022-11-04 | 重庆邮电大学 | 一种基于社交网络平台动态交互的关系预测方法 |
Non-Patent Citations (2)
Title |
---|
"基于方面类别的情感分析和推荐系统方法研究";宁天昊;《中国优秀硕士学位论文全文数据库 信息科技辑》(第07期);正文第45-61页 * |
"微博网络中用户关注行为预测";曹云忠,等;《系统工程》;146-152 * |
Also Published As
Publication number | Publication date |
---|---|
CN115829159A (zh) | 2023-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu | Python machine learning by example | |
JP7000341B2 (ja) | 機械学習に基づくウェブインタフェース生成及びテストシステム | |
CN108491529B (zh) | 信息推荐方法及装置 | |
CN108121795B (zh) | 用户行为预测方法及装置 | |
US20180096219A1 (en) | Neural network combined image and text evaluator and classifier | |
US20170032280A1 (en) | Engagement estimator | |
CN113688304A (zh) | 搜索推荐模型的训练方法、搜索结果排序的方法及装置 | |
US20180253649A1 (en) | Method and system for finding a solution to a provided problem by selecting a winner in evolutionary optimization of a genetic algorithm | |
CN107862053A (zh) | 基于用户关系的用户画像构造方法、装置及计算设备 | |
CN111401700A (zh) | 一种数据分析方法、装置、计算机系统及可读存储介质 | |
CN108984555B (zh) | 用户状态挖掘和信息推荐方法、装置以及设备 | |
CN107590690B (zh) | 数据处理方法、装置及服务器 | |
KR102203253B1 (ko) | 생성적 적대 신경망에 기반한 평점 증강 및 아이템 추천 방법 및 시스템 | |
CN113590948B (zh) | 信息推荐方法、装置、设备以及计算机存储介质 | |
CN109213859A (zh) | 一种文本检测方法、装置及系统 | |
CN110362663A (zh) | 自适应多感知相似度检测和解析 | |
US20230177089A1 (en) | Identifying similar content in a multi-item embedding space | |
CN115829159B (zh) | 社交媒体粉丝新增预测方法、装置、设备及存储介质 | |
CN113424207B (zh) | 高效地训练可理解模型的系统和方法 | |
CN112765482A (zh) | 产品投放方法、装置、设备及计算机可读介质 | |
Aralikatte et al. | Fault in your stars: an analysis of android app reviews | |
CN115130711A (zh) | 一种数据处理方法、装置、计算机及可读存储介质 | |
Rai | Advanced deep learning with R: Become an expert at designing, building, and improving advanced neural network models using R | |
CN111680213A (zh) | 信息推荐方法、数据处理方法及装置 | |
CN111444447A (zh) | 内容推荐页面的展现方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |