CN111984872A - 基于迭代优化策略的多模态信息社交媒体流行度预测方法 - Google Patents

基于迭代优化策略的多模态信息社交媒体流行度预测方法 Download PDF

Info

Publication number
CN111984872A
CN111984872A CN202010942007.0A CN202010942007A CN111984872A CN 111984872 A CN111984872 A CN 111984872A CN 202010942007 A CN202010942007 A CN 202010942007A CN 111984872 A CN111984872 A CN 111984872A
Authority
CN
China
Prior art keywords
features
popularity
iterative optimization
social media
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010942007.0A
Other languages
English (en)
Other versions
CN111984872B (zh
Inventor
毛震东
张勇东
黄梦琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Research Institute
University of Science and Technology of China USTC
Original Assignee
Beijing Zhongke Research Institute
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongke Research Institute, University of Science and Technology of China USTC filed Critical Beijing Zhongke Research Institute
Priority to CN202010942007.0A priority Critical patent/CN111984872B/zh
Publication of CN111984872A publication Critical patent/CN111984872A/zh
Application granted granted Critical
Publication of CN111984872B publication Critical patent/CN111984872B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,为了解决多模态数据利用不充分的缺陷,从帖子中提取了多模态特征;为了增强特征的时效稳定性,使用滑动窗口中对帖子特征进行平均,再进行多模态特征的融合,融合的特征利用LightGBM模型进行回归预测。为了解决流行度极值预测的难点,提出了一种迭代优化的策略,有效补偿了预测流行度分数的残差,特别是极值补偿。通过在SMPD2020数据集上进行的大量实验,取得了较好的效果,证明了本方法的有效性。

Description

基于迭代优化策略的多模态信息社交媒体流行度预测方法
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于迭代优化策略的多模态信息社交媒体流行度预测方法。
背景技术
随着互联网技术的发展以及智能终端设备的兴起,社交媒体已成为人们生活的重要组成部分。与传统媒体不同,Flickr、Facebook、Twitter等现代社交媒体平台更多地依靠用户关系网络进行信息交流和传播。然而,由于网络中的信息过载、用户注意力有限,社交媒体上的信息存在关注不均衡的情况。因此,利用用户信息、帖子等进行社交媒体流行度预测,具有很高的研究价值和商业价值,也可以帮助内容创作者制作出更受欢迎的作品。
现有的社交媒体流行度预测工作,主要分为以下几个步骤:提取可能与流行度相关的因素特征,利用融合后的特征训练回归模型,最后使用模型预测出未发布的帖子流行度的值。在社交媒体特征提取部分,目前大多数方法都是基于单模态的文本类型数据,忽视了图像和用户的特征数据以及同一用户不同帖子之间流行度的相关性,这种对社交媒体数据的不充分利用往往造成预测结果的片面性和不理想。在模型回归预测方面,当前大多数基于机器学习的流行度预测方法会采用平滑正则化项来避免过拟合,但是这种回归方法会导致预测结果的平滑化,即导致流行度的极值难以准确预测,然而在现实生活中,拥有较大流行度的帖子往往具有更大的价值,正确地预测这些极值是非常重要的。
发明内容
本发明的目的是提供一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,能够准确实现社交媒体流行度预测。
本发明的目的是通过以下技术方案实现的:
一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,包括:
对于包含多媒体特征的帖子,从中提取多模态特征,包括:图像特征、文本特征、类别概念特征、时序和空间特征、以及用户ID特征;
使用滑动窗口平均化策略来处理文本特征和图像特征,将平均后的文本特征和图像特征与其他特征融合;
将融合特征输入LightGBM模型,并通过分类器与回归器进行多次迭代优化,获得帖子的流行度预测结果。
由上述本发明提供的技术方案可以看出,为了解决多模态数据利用不充分的缺陷,从帖子中提取了多模态特征;为了增强特征的时效稳定性,使用滑动窗口中对帖子特征进行平均,再将通过滑动窗口平均后的融合特征矩阵利用LightGBM模型进行回归预测。为了解决流行度极值预测的难点,提出了一种迭代优化的策略,有效补偿了预测流行度分数的残差,特别是极值补偿。通过在SMPD2020数据集上进行的大量实验,取得了较好的效果,证明了本方法的有效性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法的流程图;
图2为本发明实施例提供的不同时间段的流行度分布示意图;
图3为本发明实施例提供的多模态特征提取与融合框架图;
图4为本发明实施例提供的基于LightGBM回归预测与迭代优化的框架。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例提供一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,如图1所示,其主要包括:
1、对于包含多媒体特征的帖子,从中提取多模态特征。
本发明实施例中,多模态特征主要包括:图像特征、文本特征、类别概念特征、时序和空间特征、以及用户ID特征。
1)图像特征。
本发明实施例中,将图像风格视为影响帖子流行度的要素,而图像风格可以从图像语义信息中发掘,通过在COCO数据集上预训练的SAT(Show,Attention,and Tell)模型生成图像的文本描述,再将文本描述编码与解码,得到图像特征(即图像语义特征)。
由于COCO数据集上的一部分图片在实验数据集SMPD2020上不存在,即在某些样本中,高水平的图像语义特征无效。为了解决该问题,取编码器的最后一层的输出作为中水平的图像语义特征,并利用PCA做降维处理。
2)文本特征。
本发明实施例中,通过对文字数据进行清洗与去噪处理,再利用预训练的深度学习模型Bert提取出文本特征;同时,还统计每条帖子中文本的单词数与字符数。
3)类别概念特征。
本发明实施例中,通过预训练的Glove来提取帖子概念的单词表示,作为类别概念特征。
类别概念特征主要用来区分不同的帖子;示例性的,在某一应用中,数据集包含11个类别,77个子类别和668个概念来区分帖子。
4)时序和空间特征。
本发明实施例中,将帖子的时间转换为北京时间,再按照划分的时间尺度(年、月、日、小时、分钟、秒等),从转换的北京时间中提取时间特征的统计信息,再结合帖子的发布位置,构成时序和空间特征。
前人的研究发现,流行性具有与时间尺度相关的显著特征。社交帖子的流行度总是根据季节周期性的波动,人们更喜欢在周末的闲暇时间浏览网站。为了度量流行度的时间特征,可以从四个尺度(月、周、日和小时)中提取时间特征的统计信息,如图2所示,我们将一天内帖子的发布时间分为6类(每类4小时),工作日分为周一至周五和周末2类,因此,有12个子集。12个子集分别为工作日0:00-4:00、……、工作日20:00-24:00、周末0:00-4:00、……、周末20:00-24:00。
5)用户ID特征。
本发明实施例中,将用户ID表示为一个独热向量,并利用tsvd算法进行降维处理,再结合用户的粉丝数和用户的发帖数,构成用户ID特征。
2、使用滑动窗口平均化策略来稳定统一用户的文本和图像特征,再进行多模态特征的融合。
在社交媒体平台上,同一用户可能更倾向于在短时间内发布相同主题的帖子。为了增强同一个用户某一时间段内文本和图像特征的稳定性,本发明实施例中,首先对同一用户的帖子按时间顺序进行排序,然后在固定长度的滑动窗口中对帖子中的文本和图像特征进行平均,并在实际应用中使用平均的特征。特别地,在图像特征中滑动窗口大小取5,文本特征的窗口大小取3,其中,3和5为经验值,具体数值可以根据情况调整。
图3示出了包含上述步骤1~步骤2的多模态特征提取与融合框架。示例性的,多模态特征的融合可以通过将各类型特征进行拼接来实现。
3、将融合特征输入LightGBM模型,并通过分类器与回归器进行多次迭代优化,获得帖子的流行度预测结果。
本发明实施例中,采用LightGBM方法完成社交媒体流行度预测中的回归任务。LightGBM是一种基于直方图的GBDT方法,可以有效避免过拟合,缓解数据稀疏的问题。近年来,LightGBM被广泛应用于各种回归任务中。
如图4所示,将平均后的融合特征输入至LightGBM模型,能够初步的得到流行度预测结果;在训练阶段,基于流行度预测结果与真实值的残差进行补偿,本发明实施例提供一种迭代优化方法来提高预测性能,特别是极值补偿。
将初步的得到流行度预测结果(即受欢迎程度分数)记为Ps,我们将它与真实值的残差记为R;通过训练一个二值分类器来区分具有不同流行度的训练样本(即区分具有极高或极低受欢迎程度分数的训练样本),二值分类器表示为:
g(Xs)=C(Xs,|θs)
其中,Xs为训练集,C(.)为使用的分类器模型,θs为分类器模型的参数,g(Xs)为-1代表非极值,g(Xs)为1代表极值,这里的极值代表具有极高或者极低的流行度;
有多种方法来学习带有参数的分类器,如支持向量机(SVM),随机森林分类器(RFC),和AdaBoosting分类器。在本发明实施例中,采用AdaBoost作为分类器。
一般来说,损失函数应该是:
Figure BDA0002673950960000051
上式中,l是由学习方法定义的损失函数,L是总损失函数,N为训练样本的总数。由于R不是一个二值类,直接求解上述方程相对比较困难。
为了解决上述问题,首先预先定义了一个阈值ty,根据流行度预测值和真实值的残差R是否大于该阈值ty将该流行度的残差R分为两类:一类大于阈值,一类小于阈值,由此将原先的非二值类R转换为二值类Rt,则二值分类器训练中的损失函数为:
Figure BDA0002673950960000052
上式中,N代表训练样本总数。在直观上,R中较大的值表明预测情况很糟糕,这也意味着极值可能出现在该样本中。
设gj表示第j次迭代时的二值分类器,则gj(Xs)=1则意味着需要进行补偿。为了达到对流行度极值预测补偿的目的,我们设计了多级回归来补偿每次预测的残差,设hj表示第j个回归器,则需要学习k个回归器和分类器,第j阶段的回归器和分类器的训练是基于第j次迭代的二值类
Figure BDA0002673950960000053
和第j次迭代根据阈值ty挑选出来的训练样本
Figure BDA0002673950960000054
实现。第j次迭代的补偿函数定义如下:
Figure BDA0002673950960000055
上式中,Rj为第j次迭代的残差,用来确定二值类残差
Figure BDA0002673950960000056
Figure BDA0002673950960000057
为第j-1次迭代的补偿值,θj、θj-1分别为第j次、第j-1次迭代回归器的参数,hj-1为第j-1次迭代的回归器。
在训练样本
Figure BDA0002673950960000058
满足:
Figure BDA0002673950960000059
(即表示第j次补偿的样本为第j迭代被判断为极值类的样本);通过控制阈值ty从而确定训练样本的数量来补偿预测结果;设ty=0后,则对所有预测结果进行残差补偿。
图4示出了回归预测与迭代优化的原理,我们首先通过LightGBM Regressor得到未经过补偿优化的流行度预测值,在之后的每一次迭代中,根据真实值得到残差,通过分类器(i-th extreme case classifiers)得到该阶段需要补偿的样本,再通过该阶段的回归器计算本次迭代的补偿值(回归器未示出,其参与的是每一次迭代的预测补偿,也即图4中的i-th residual compensation阶段),进而更新本次迭代的预测结果。通过不断迭代训练,得到最终的预测模型。
在测试阶段,将测试样本输入到学习好的LightGBM模型中,并通过训练后的分类器与回归器进行k次迭代细化,能够得到非常准确的预测值。测试阶段的迭代过程与训练阶段相同,由于测试阶段各分类器与回归器的参数已经训练完毕,即θj、θj-1是已知的,因此,可以直接通过前文介绍的补偿函数计算出每一次迭代的补偿值。
与现有方法相比,本发明实施例建立了一个完整的多模态社交媒体特征提取网络。为了增强特征的稳定性,对同一用户的帖子按时间顺序进行排序,在滑动窗口中对特征进行平均,并且使用LightGBM模型来预测图像的流行度,最后,再通过提出的迭代优化策略进一步优化预测结果,达到了现有最优水平。在社交媒体预测数据集上进行的大量实验表明,该方法高效且稳定。
为了说明本发明实施例上述方案的效果,下面通过对比实验进行说明。
本次实验中,使用的数据集(SMPD2020)是一个用于社会学理解和预测的大规模基准数据集,包括了16个月中,70k位Flickr用户的发布的486k条帖子以及各种信息。数据集中训练集大小为305613,测试集大小为180581。采用Spearman排序相关性(SRC)和平均绝对误差(MAE)作为评价指标。目前现有的大多数方法大都采用单一回归器进行流行度回归预测,包括Bayers回归、支持向量机回归(SVR)、随机森林、LightGBM等。支持向量机回归(SVR)是SVM(支持向量机)的拓展,区别在于SVR寻求使所有的样本点离着总偏差最小的超平面。随机森林由多棵决策树构成,且森林中的每一棵决策树之间没有关联,模型的最终输出由森林中的每一棵决策树共同决定。LightGBM是boosting集合模型,采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。我们通过与现有的流行度预测回归方法的实验对比,证明了本发明所提出的方法的有效性,SRC为0.640,MAE为1.398。实验结果如表1所示。
Figure BDA0002673950960000061
表1不同回归模型对比实验结果
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (7)

1.一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,包括:
对于包含多媒体特征的帖子,从中提取多模态特征,包括:图像特征、文本特征、类别概念特征、时序和空间特征、以及用户ID特征;
使用滑动窗口平均化策略来处理文本特征和图像特征,将平均后的文本特征和图像特征与其他特征融合;
将融合特征输入LightGBM模型,并通过分类器与回归器进行多次迭代优化,获得帖子的流行度预测结果。
2.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,通过预训练的SAT模型生成图像的文本描述,再将文本描述编码与解码,得到图像特征。
3.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,通过对文字数据进行清洗与去噪处理,再利用预训练的深度学习模型Bert提取出文本特征;同时,还统计每条帖子中文本的单词数与字符数。
4.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,通过预训练的Glove来提取帖子概念的单词表示,作为类别概念特征。
5.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,将帖子的时间转换为北京时间,再按照划分的时间尺度,从转换的北京时间中提取时间特征的统计信息,再结合帖子的发布位置,构成时序和空间特征。
6.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,将用户ID表示为一个独热向量,并利用tsvd算法进行降维处理,再结合用户的粉丝数和用户的发帖数,构成用户ID特征。
7.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,将融合特征输入LightGBM模型,并通过分类器与回归器进行多次迭代优化的过程包括:
将平均后的融合特征输入至LightGBM模型,能够初步的得到流行度预测结果;在训练阶段,基于流行度预测结果与真实值的残差进行补偿;
将初步的得到流行度预测结果记为Ps,将Ps与真实值的残差记为R;通过训练一个二值分类器来区分具有不同流行度的训练样本,二值分类器表示为:
g(Xs)=C(Xs,|θs)
其中,Xs为训练集,C(.)为使用的分类器模型,θs为分类器模型的参数,g(Xs)为-1代表非极值,g(Xs)为1代表极值;
二值分类器训练中的损失函数为:
Figure FDA0002673950950000021
其中,N代表训练样本总数,l是由学习方法定义的损失函数,L是总损失函数;Rt为二值类的残差,定义方式为:预先定义一个一个阈值ty,根据流行度预测结果和真实值的残差R是否大于该阈值ty将该流行度的残差R分为两类:一类大于阈值,一类小于阈值,由此将原先的非二值类的R转换为二值类Rt
设gj表示第j次迭代时的二值分类器,则gj(Xs)=1时需要进行补偿;设计多级回归来补偿每次预测的残差;设hj表示第j个回归器,需要学习k个回归器和二值分类器;第j次迭代时回归器和二值分类器的训练,基于第j次迭代的二值类残差
Figure FDA0002673950950000022
和第j次迭代根据阈值ty挑选出来的训练样本
Figure FDA0002673950950000023
实现;第i次迭代的补偿函数定义如下:
Figure FDA0002673950950000024
上式中,Rj为第j次迭代的残差,用来确定二值类残差
Figure FDA0002673950950000025
Figure FDA0002673950950000026
为第j-1次迭代的补偿值,θj、θj-1分别为第j次、第j-1次迭代回归器的参数,hj-1为第j-1次迭代的回归器;
训练样本
Figure FDA0002673950950000027
满足:
Figure FDA0002673950950000028
通过控制阈值ty从而确定训练样本的数量来补偿预测结果;设ty=0,则对所有预测结果进行残差补偿。
CN202010942007.0A 2020-09-09 2020-09-09 基于迭代优化策略的多模态信息社交媒体流行度预测方法 Active CN111984872B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010942007.0A CN111984872B (zh) 2020-09-09 2020-09-09 基于迭代优化策略的多模态信息社交媒体流行度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010942007.0A CN111984872B (zh) 2020-09-09 2020-09-09 基于迭代优化策略的多模态信息社交媒体流行度预测方法

Publications (2)

Publication Number Publication Date
CN111984872A true CN111984872A (zh) 2020-11-24
CN111984872B CN111984872B (zh) 2021-03-16

Family

ID=73450398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010942007.0A Active CN111984872B (zh) 2020-09-09 2020-09-09 基于迭代优化策略的多模态信息社交媒体流行度预测方法

Country Status (1)

Country Link
CN (1) CN111984872B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657116A (zh) * 2021-08-05 2021-11-16 天津大学 基于视觉语义关系的社交媒体流行度预测方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229702A (zh) * 2017-05-24 2017-10-03 天津大学 基于低秩约束和多视角特征融合的微视频流行度预测方法
CN109256207A (zh) * 2018-08-29 2019-01-22 王雁 一种基于XGBoost+SVM混合机器学习诊断圆锥角膜病例的方法
CN110263256A (zh) * 2019-06-21 2019-09-20 西安电子科技大学 基于多模态异质信息的个性化推荐方法
CN110413494A (zh) * 2019-06-19 2019-11-05 浙江工业大学 一种改进贝叶斯优化的LightGBM故障诊断方法
CN110503162A (zh) * 2019-08-29 2019-11-26 广东工业大学 一种媒体信息流行度预测方法、装置和设备
CN110738349A (zh) * 2019-09-05 2020-01-31 国网浙江省电力有限公司杭州供电公司 基于多模型融合的电网故障抢修时长预测方法
CN110782658A (zh) * 2019-08-16 2020-02-11 华南理工大学 一种基于LightGBM算法的交通量预测方法
CN110991464A (zh) * 2019-11-08 2020-04-10 华南理工大学 一种基于深度多模态数据融合的商品点击率预测方法
CN111125486A (zh) * 2019-12-23 2020-05-08 重庆邮电大学 一种基于多特征的微博用户属性分析方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229702A (zh) * 2017-05-24 2017-10-03 天津大学 基于低秩约束和多视角特征融合的微视频流行度预测方法
CN109256207A (zh) * 2018-08-29 2019-01-22 王雁 一种基于XGBoost+SVM混合机器学习诊断圆锥角膜病例的方法
CN110413494A (zh) * 2019-06-19 2019-11-05 浙江工业大学 一种改进贝叶斯优化的LightGBM故障诊断方法
CN110263256A (zh) * 2019-06-21 2019-09-20 西安电子科技大学 基于多模态异质信息的个性化推荐方法
CN110782658A (zh) * 2019-08-16 2020-02-11 华南理工大学 一种基于LightGBM算法的交通量预测方法
CN110503162A (zh) * 2019-08-29 2019-11-26 广东工业大学 一种媒体信息流行度预测方法、装置和设备
CN110738349A (zh) * 2019-09-05 2020-01-31 国网浙江省电力有限公司杭州供电公司 基于多模型融合的电网故障抢修时长预测方法
CN110991464A (zh) * 2019-11-08 2020-04-10 华南理工大学 一种基于深度多模态数据融合的商品点击率预测方法
CN111125486A (zh) * 2019-12-23 2020-05-08 重庆邮电大学 一种基于多特征的微博用户属性分析方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JINNA LV 等: "Multi-feature Fusion for Predicting Social Media Popularity", 《SESSION: GRAND CHALLENGE》 *
JUNHONG CHEN 等: "Social Media Popularity Prediction Based on Visual-Textual Features with XGBoost", 《GRAND CHALLENGE: SOCIAL MEDIA PREDICTION》 *
李六武: "基于CNN的多模态深度融合特征的社交媒体流行度预测", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
艾擎 等: "在线社交网络信息流行度预测综述", 《计算机应用研究》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657116A (zh) * 2021-08-05 2021-11-16 天津大学 基于视觉语义关系的社交媒体流行度预测方法及装置
CN113657116B (zh) * 2021-08-05 2023-08-08 天津大学 基于视觉语义关系的社交媒体流行度预测方法及装置

Also Published As

Publication number Publication date
CN111984872B (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
CN108763493B (zh) 一种基于深度学习的推荐方法
Chang et al. Bi-level semantic representation analysis for multimedia event detection
CN107273438B (zh) 一种推荐方法、装置、设备及存储介质
CN109376242B (zh) 基于循环神经网络变体和卷积神经网络的文本分类方法
CN113139134B (zh) 一种社交网络中用户生成内容的流行度预测方法、装置
WO2022095376A1 (zh) 方面级别情感分类方法、装置、设备及可读存储介质
CN110415071B (zh) 一种基于观点挖掘分析的汽车竞品对比方法
Liu et al. Exploiting web images for fine-grained visual recognition by eliminating open-set noise and utilizing hard examples
CN110909125B (zh) 推文级社会媒体谣言检测方法
CN111159485A (zh) 尾实体链接方法、装置、服务器及存储介质
CN112668336B (zh) 一种基于任务模型的词语处理方法
CN108804577B (zh) 一种资讯标签兴趣度的预估方法
CN112163099A (zh) 基于知识图谱的文本识别方法、装置、存储介质和服务器
CN114998602A (zh) 基于低置信度样本对比损失的域适应学习方法及系统
CN111538846A (zh) 基于混合协同过滤的第三方库推荐方法
Yu et al. Deep metric learning with dynamic margin hard sampling loss for face verification
CN116541523A (zh) 一种基于大数据的法律判决舆情分类方法
Zeng et al. Pyramid hybrid pooling quantization for efficient fine-grained image retrieval
Mao et al. Context-aware robust fine-tuning
CN116595975A (zh) 一种基于句信息进行词信息增强的方面级情感分析方法
CN113869034B (zh) 基于强化依赖图的方面情感分类方法
CN111984872B (zh) 基于迭代优化策略的多模态信息社交媒体流行度预测方法
Wang et al. Application of an emotional classification model in e-commerce text based on an improved transformer model
CN112396091B (zh) 社交媒体图像流行度预测方法、系统、存储介质及应用
CN107070702B (zh) 基于合作博弈支持向量机的用户账号关联方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant