CN110503162A

CN110503162A - 一种媒体信息流行度预测方法、装置和设备

Info

Publication number: CN110503162A
Application number: CN201910809050.7A
Authority: CN
Inventors: 刘文印; 陈俊洪; 张启翔; 朱展模; 梁达勇
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2019-08-29
Filing date: 2019-08-29
Publication date: 2019-11-26

Abstract

本申请公开了一种媒体信息流行度预测方法、装置和设备，对媒体信息数据进行预处理，融合用户信息、视觉信息和文本信息，通过XGBoost分类模型对媒体信息流行度进行预测，避免了通过单一的文本媒体信息或视觉媒体信息预测媒体信息流行度带来的预测片面性，以用户信息、视觉信息和文本信息融合并通过XGBoost分类模型预测流行度的方式，确保了媒体信息流行度预测的全面性，预测准确度得到提高，解决了现有的媒体流行度的预测方法预测准确度不佳的技术问题的技术问题。

Description

一种媒体信息流行度预测方法、装置和设备

技术领域

本申请涉及多媒体信息处理技术领域，特别涉及一种媒体信息流行度预测方法、装置和设备。

背景技术

随着互联网多媒体技术的快速发展，人们对社交媒体的依赖性越来越强，从生活琐事刀时政新闻，社交信息被上传到网上进行分享，而新闻媒体如何从大量的多媒体资源中获取有价值的信息数据，是目前的重要研究方向。

目前的媒体流行度的预测方法是通过媒体信息或用户信息进行预测，只能对一些普遍的大事件及网红博客取得很好的效果，但对于其他方面(如摄影、美食)预测的效果一般，例如，有些出自普通人之手拍出的惊艳照片并不能受到很好的流行度预测，有些出自网红之手，但拍得很差劲的图片也不能得到很好的合理的流行度预测。因此，研究出能够准确预测出媒体信息流行度的方法，是本领域技术人员亟待解决的技术问题。

发明内容

本申请的目的是提供一种媒体信息流行度预测方法、装置和设备，用于解决现有的媒体流行度的预测方法预测准确度不佳的技术问题。

本申请第一方面提供了一种媒体信息流行度预测方法，包括：

对获取到的媒体信息数据进行预处理，所述媒体信息包括用户信息、视觉信息和文本信息；

对所述媒体信息数据进行特征提取，将得到的每个所述媒体信息数据对应的用户信息特征、视觉信息特征和文本信息特征进行特征融合；

将所述特征融合得到的特征数据输入到用于预测媒体流行度的预置XGBoost分类模型中，得到所述预置XGBoost分类模型输出的预测流行度。

可选的，还包括：

基于所述预测流行度对所述预置XGBoost分类模型进行性能评估。

可选的，所述基于所述预测流行度对所述预置XGBoost分类模型进行性能评估，包括：

基于所述预测流行度计算所述预测流行度的斯皮尔曼等级相关性和平均绝对误差；

基于所述斯皮尔曼等级相关性和平均绝对误差评估所述预置XGBoost分类模型的预测性能。

可选的，所述预处理包括：

将所述媒体信息数据进行分割，得到所述用户信息、所述视觉信息和所述文本信息；

生成所述用户信息、所述视觉信息和所述文本信息分别对应的标签；

对所述用户信息、所述视觉信息和所述文本信息进行内容类别分类，并抽象化概念。

可选的，所述将所述特征融合得到的特征数据输入到用于预测媒体流行度的预置XGBoost分类模型中，得到所述预置XGBoost分类模型输出的预测流行度，之前还包括：

对所述预置XGBoost分类模型进行训练。

可选的，所述对所述预置XGBoost分类模型进行训练，包括：

初始化所述预置XGBoost分类模型的参数，将学习率预置为0.007，生成树深度预置为130，迭代值预置为500，对所述预置XGBoost分类模型进行训练。

本申请第二方面提供了一种媒体信息流行度预测装置，包括：

预处理模块，用于对获取到的媒体信息数据进行预处理，所述媒体信息包括用户信息、视觉信息和文本信息；

特征提取融合模块，用于对所述媒体信息数据进行特征提取，将得到的每个所述媒体信息数据对应的用户信息特征、视觉信息特征和文本信息特征进行特征融合；

预测模块，用于将所述特征融合得到的特征数据输入到用于预测媒体流行度的预置XGBoost分类模型中，得到所述预置XGBoost分类模型输出的预测流行度。

可选地，还包括：

性能评估模块，用于基于所述预测流行度对所述预置XGBoost分类模型进行性能评估。

可选的，还包括：

训练模块，用于对所述预置XGBoost分类模型进行训练。

本申请第三方面提供了一种媒体信息流行度预测设备，所述设备包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行第一方面所述的媒体信息流行度预测方法。

从以上技术方案可以看出，本申请提供的媒体信息流行度预测方法具有以下优点：

本申请提供的媒体信息流行度预测方法，包括：对获取到的媒体信息数据进行预处理，媒体信息包括用户信息、视觉信息和文本信息；对媒体信息数据进行特征提取，将得到的每个媒体信息数据对应的用户信息特征、视觉信息特征和文本信息特征进行特征融合；将特征融合得到的特征数据输入到用于预测媒体流行度的预置XGBoost分类模型中，得到预置XGBoost分类模型输出的预测流行度。本申请提供的媒体信息流行度预测方法，对媒体信息数据进行预处理，融合用户信息、视觉信息和文本信息，通过XGBoost分类模型对媒体信息流行度进行预测，避免了通过单一的文本媒体信息或视觉媒体信息预测媒体信息流行度带来的预测片面性，以用户信息、视觉信息和文本信息融合并通过XGBoost分类模型预测流行度的方式，确保了媒体信息流行度预测的全面性，预测准确度得到提高，解决了现有的媒体流行度的预测方法预测准确度不佳的技术问题的技术问题。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请中提供的一种媒体信息流行度预测方法的一个实施例的流程示意图；

图2为本申请中提供的一种媒体信息流行度预测方法的另一个实施例的流程示意图；

图3为本申请中提供的一种媒体信息流行度预测方法的媒体信息数据处理过程示意图；

图4为本申请中提供的一种媒体信息流行度预测装置的一个实施例的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参考图1和图3，本申请中提供的一种媒体信息流行度预测方法的实施例，包括：

步骤101、对获取到的媒体信息数据进行预处理，媒体信息包括用户信息、视觉信息和文本信息。

需要说明的是，本申请实施例中，从社交平台，如微博、Facebook、Flickr、Twitter等，和一些竞赛平台，如ACMMM上爬取媒体信息数据，并对这些媒体信息数据进行预处理，得到每一媒体信息数据对应的用户信息、视觉信息和文本信息，如一媒体信息数据为一张照片，由A作者上传到社交平台上，文本内容为风景，可得到该照片对应的用户信息(A作者的信息)、图片信息(风景图片)和文本信息(“风景”文本)。

步骤102、对媒体信息数据进行特征提取，将得到的每个媒体信息数据对应的用户信息特征、视觉信息特征和文本信息特征进行特征融合。

需要说明的是，如图3所示，本申请实施例中，对每一预处理后的媒体信息数据进行特征提取，分别得到用户信息、视觉信息和文本信息对应的用户信息特征、视觉信息特征和文本信息特征，然后将用户信息特征、视觉信息特征和文本信息特征进行特征融合，得到表征用户信息、视觉信息和文本信息的特征数据。

步骤103、将特征融合得到的特征数据输入到用于预测媒体流行度的预置XGBoost分类模型中，得到预置XGBoost分类模型输出的预测流行度。

需要说明的是，XGBoost分类器可用于多信息回归分类识别，其分类预测准确度高，且识别速度快。本申请实施例中采用XGBoost分类器回归预测媒体信息流行度，将特征融合得到的特征数据输入到预置XGBoost分类模型中，获取预置XGBoost分类模型输出的预测结果即得到预测流行度。

本申请实施例中提供的媒体信息流行度预测方法，对媒体信息数据进行预处理，融合用户信息、视觉信息和文本信息，通过XGBoost分类模型对媒体信息流行度进行预测，避免了通过单一的文本媒体信息或视觉媒体信息预测媒体信息流行度带来的预测片面性，以用户信息、视觉信息和文本信息融合并通过XGBoost分类模型预测流行度的方式，确保了媒体信息流行度预测的全面性，预测准确度得到提高，解决了现有的媒体流行度的预测方法预测准确度不佳的技术问题的技术问题。

为了便于理解，请参阅图2和图3，本申请中提供了一种媒体信息流行度预测方法的另一个实施例，包括：

步骤201、对获取到的媒体信息数据进行预处理，媒体信息包括用户信息、视觉信息和文本信息；

预处理包括：

将媒体信息数据进行分割，得到用户信息、视觉信息和文本信息；

生成用户信息、视觉信息和文本信息分别对应的标签；

对用户信息、视觉信息和文本信息进行内容类别分类，并抽象化概念。

需要说明的是，本申请实施例中，首先在社交平台(如微博，Flickr，Twitter，Facebook等)和一些竞赛平台(如ACMMM)上爬取媒体信息数据，媒体信息分为文本信息和视觉信息，文本信息包括内容类别(如娱乐，风景)，内容子类别(如关于猫，狗，书)，标签(内容的标签，例如黑色的帽子，黄色的伞)，信息抽象概念(如拥抱，想象力，饥饿)，发表状态，信息类别(如照片还是视频)，用户关注者和用户粉丝数；视觉信息主要为用户分享的照片。在获取到这些信息后，可以按照用户名称对信息进行整理，形成一个表格以便下一步骤进行处理。对于视频数据，可以采用竞赛平台ACMMM提供的SMPD2019数据集进行测试。

在得到媒体信息数据之后，对媒体信息数据进行预处理，处理方式如下：

标签：使用自然语言处理里的Word2vec(词向量)模型进行预处理，该模型包含了300维的词向量，该词向量是由新闻语料库里训练提取出来，用来计算某个词的前后词概率，例如给“苹果”一词，它可以预测“切”和“剁”的概率，并将该概率作为向量保存。使用该模型，可以得到映射后的标签。

内容类别：统计出总的内容类别数量，对于每个内容类别使用相应的编码进行替代(如娱乐对应1，风景对应2)，然后再将这些数字编码转换为独热编码(One-hotencoding)进行替代，此时可以得到一个多维的矩阵特征，矩阵的横坐标为独热编码特征，纵坐标为用户数。

内容子类别：提供更具体的内容类别，例如内容类别为娱乐，则子类别可以为音乐，游戏；内容类别为天气，子类别可以为晴天，雨天等，具体的子类别对流行度会造成影响，例如晴天的照片流行度会更高，阴雨天则比较低。对内容子类别的处理也跟内容类别的处理一致。

信息抽象化概念：与内容子概念最相近的描述概念。例如雨天对应的是雨伞；潮流对应的可能是T恤，裤子等。相当于是众多标签里最直接的描述概念。对信息抽象概念的处理也跟内容类别的处理一致。

此外，预处理还可以包括：

发表状态：使用0和1表示未发表和已发表。

信息类别：使用1表示照片，0表示视频。

用户关注者和用户粉丝数：直接使用原数据。

步骤202、对媒体信息数据进行特征提取，将得到的每个媒体信息数据对应的用户信息特征、视觉信息特征和文本信息特征进行特征融合。

需要说明的是，可以使用Hu Moments(Hu矩)对图片进行特征抽取，Hu矩主要通过利用二阶和三阶正则中心距(normalized central moments)导出7个不变矩，这7个不变矩在图像平移、旋转和比例变化时保持不变，将这7个不变矩作为图像的特征，即视觉信息特征。

步骤203、将特征融合得到的特征数据输入到用于预测媒体流行度的预置XGBoost分类模型中，得到预置XGBoost分类模型输出的预测流行度。

需要说明的是，以上处理后，所有的文本数据跟图像数据都变成了数值型数据，将这些数据拼接起来，变成一个矩阵作为原数据输入到预置XGBoost分类模型，预置XGBoost分类模型的输出结果即为预测流行度。

在使用预置XGBoost分类模型进行预测前，还需要对预置XGBoost分类模型进行训练，对预置XGBoost分类模型的参数进行初始化，将学习率预置为0.007，生成树深度预置为130，迭代值预置为500，然后将表征用户文本图像的特征矩阵输入到预置XGBoost分类模型中进行训练，在训练完成后，输入待预测的媒体信息数据即可预测媒体信息流行度。

步骤204、基于预测流行度对预置XGBoost分类模型进行性能评估。

需要说明的是，对于流行度性能的评估，我们采用斯皮尔曼等级相关性(Spearmanranking correlation)和平均绝对误差(Mean Absolute Deviation)进行评判，其中斯皮尔曼等级相关性定义如下：

其中n为输入的媒体信息数量；p_k，为对应预测和真实流行度；为对应预测和真实流行度的平均值，σ_p,为对应预测和真实流行度的方差。平均绝对误差的定义如下：

斯皮尔曼等级相关性值在[-1,1]之间，越接近1表明使用的数据跟流行度相关性越高，越接近0表明越无关，越接近-1表明相关性成负相关。平均绝对误差值越低越好，表明数据的预测结果误差很小。使用以上两个评价指标即有效评估该模型的预测性能的好坏。

为了便于理解，请参阅图4，本申请中提供了一种媒体信息流行度预测装置的实施例，包括：

预处理模块301，用于对获取到的媒体信息数据进行预处理，媒体信息包括用户信息、视觉信息和文本信息。

特征提取融合模块302，用于对媒体信息数据进行特征提取，将得到的每个所述媒体信息数据对应的用户信息特征、视觉信息特征和文本信息特征进行特征融合。

预测模块303，用于将特征融合得到的特征数据输入到用于预测媒体流行度的预置XGBoost分类模型中，得到预置XGBoost分类模型输出的预测流行度。

作为进一步的改进，本申请实施例中提供的媒体信息流行度装置还可以包括：

性能评估模块304，用于基于预测流行度对预置XGBoost分类模型进行性能评估。

训练模块305，用于对预置XGBoost分类模型进行训练。

本申请中还提供了一种媒体信息流行度预测设备，设备包括处理器以及存储器：

存储器用于存储程序代码，并将程序代码传输给处理器；

处理器用于根据程序代码中的指令执行前述的媒体信息流行度预测方法实施例中的任一种媒体信息流行度预测方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以通过一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(英文全称：Read-OnlyMemory，英文缩写：ROM)、随机存取存储器(英文全称：Random Access Memory，英文缩写：RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种媒体信息流行度预测方法，其特征在于，包括：

2.根据权利要求1所述的媒体信息流行度预测方法，其特征在于，还包括：

3.根据权利要求2所述的媒体信息流行度预测方法，其特征在于，所述基于所述预测流行度对所述预置XGBoost分类模型进行性能评估，包括：

4.根据权利要求1所述的媒体信息流行度预测方法，其特征在于，所述预处理包括：

5.根据权利要求1所述的媒体信息流行度预测方法，其特征在于，所述将所述特征融合得到的特征数据输入到用于预测媒体流行度的预置XGBoost分类模型中，得到所述预置XGBoost分类模型输出的预测流行度，之前还包括：

对所述预置XGBoost分类模型进行训练。

6.根据权利要求5所述的媒体信息流行度预测方法，其特征在于，所述对所述预置XGBoost分类模型进行训练，包括：

7.一种媒体信息流行度预测装置，其特征在于，包括：

8.根据权利要求7所述的媒体信息流行度预测装置，其特征在于，还包括：

9.根据权利要求7所述的媒体信息流行度预测装置，其特征在于，还包括：

训练模块，用于对所述预置XGBoost分类模型进行训练。

10.一种媒体信息流行度预测设备，其特征在于，所述设备包括处理器以及存储器：

所述处理器用于根据所述程序代码中的指令执行权利要求1-6所述的任一种媒体信息流行度预测方法。