CN115730030A

CN115730030A - 一种评论信息的处理方法以及相关装置

Info

Publication number: CN115730030A
Application number: CN202110989051.1A
Authority: CN
Inventors: 彭加欣; 陈小帅
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-08-26
Filing date: 2021-08-26
Publication date: 2023-03-03

Abstract

本申请公开了一种评论信息的处理方法以及相关装置，涉及多媒体数据处理技术。该方法包括：通过获取待发布的第一媒体内容；然后基于第一媒体内容对应的特征向量确定对应的第二媒体内容，其中第一媒体内容基于第二媒体内容进行编辑所得；提取第二媒体内容对应的评论数据；进而将评论数据与第一媒体内容进行关联发布。由此，实现媒体内容之间的评论迁移过程，由于媒体内容之间存在关联关系，评论数据可以与第一媒体内容相匹配，从而使得待发布的第一媒体内容可以关联合适的评论进行联合发布，提升了评论信息生成的准确性，提升媒体内容与其关联发布的评论之间的关联度。

Description

一种评论信息的处理方法以及相关装置

方式领域

本申请涉及计算机技术领域，尤其涉及一种评论信息的处理方法以及相关装置。

背景方式

随着互联网方式的迅速发展，人们对娱乐形式的要求越来越高，短视频即为其中的一种；而短视频评论冷启动问题，即当新视频发布后，需要及时为视频补充评论以达到吸引用户观看和评论的目的。

一般，可以通过构建视频库，然后查找与待评论视频相似的视频集，获取相似视频集的评论数据，通过这些评论数据来生成待评论视频的评论。

但是，构建视频库的数据规模较大，待发布的短视频无法即时的获取到强关联的评论信息，评论往往与视频内容情节贴合度较差，质量难以达到要求，影响评论信息的准确性。

发明内容

有鉴于此，本申请提供一种评论信息的处理方法，可以有效提高媒体内容评论信息的准确性。

本申请第一方面提供一种评论信息的处理方法，可以应用于终端设备中包含评论信息的处理功能的系统或程序中，具体包括：

获取待发布的第一媒体内容；

基于所述第一媒体内容对应的特征向量确定对应的第二媒体内容，所述第一媒体内容基于所述第二媒体内容进行编辑所得；

获取所述第二媒体内容对应的评论数据；

将所述评论数据与所述第一媒体内容进行关联发布。

可选的，在本申请一些可能的实现方式中，所述将所述评论数据与所述第一媒体内容进行关联发布，包括：

确定所述评论数据与所述第一媒体内容对应目标内容的相关度参数；

将基于所述相关度参数对所述评论数据进行筛选，从所述评论数据中确定目标评论信息；

将所述目标评论信息与所述第一媒体内容进行关联发布。

可选的，在本申请一些可能的实现方式中，所述确定所述评论数据与所述第一媒体内容对应目标内容的相关度参数，包括：

基于预设数据规模对所述第一媒体内容进行内容抽取，以得到内容片段；

获取所述内容片段中的文本标签与视觉标签；

根据所述文本标签与所述视觉标签确定所述评论数据与所述第一媒体内容的相关度，以确定为所述相关度参数。

可选的，在本申请一些可能的实现方式中，所述基于所述相关度参数对所述评论数据进行筛选，从所述评论数据中确定目标评论信息，包括：

基于预设项目对所述评论数据进行识别，以得到参考参数，所述预设项目包括情感倾向、内容丰富度中的至少一项；

对所述相关度参数和所述参考参数进行加权处理，得到所述第一媒体内容对应目标内容的评论质量参数；

基于所述评论质量参数对所述评论数据进行筛选，从所述评论数据中确定目标评论信息。

可选的，在本申请一些可能的实现方式中，当所述预设项目包括情感倾向时，所述基于预设项目对所述评论数据进行识别，以得到参考参数，包括：

基于所述预设项目调用情感分类模型，通过所述情感分类模型，确定所述评论数据符合预设情感维度的概率参数，所述预设情感维度至少包含情感类型相反的两个维度；

根据各个所述预设情感维度的概率参数，以得到所述评论数据对应的所述参考参数。

可选的，在本申请一些可能的实现方式中，所述方法还包括：

获取情感训练数据；

对所述情感训练数据中的训练词汇对应的嵌入矩阵进行因式分解，以得到第一分解矩阵和第二分解矩阵，所述第一分解矩阵的维度和所述第二分解矩阵的维度小于所述嵌入矩阵的维度；

将所述第一分解矩阵输入所述情感分类模型的嵌入层，并将所述第二分解矩阵输入所述情感分类模型的隐藏层，以对所述情感分类模型进行训练，所述隐藏层之间的训练参数相互共享。

可选的，在本申请一些可能的实现方式中，所述基于预设项目对所述评论数据进行识别，以得到参考参数，包括：

基于所述预设项目对所述评论数据对应的文本信息进行解析，以确定所述文本信息对应的语法树结构；

识别所述语法树结构的复杂度信息；

基于所述复杂度信息确定所述参考参数。

本申请第二方面提供一种评论信息的处理装置，包括：

获取单元，用于获取待发布的第一媒体内容；

确定单元，用于基于所述第一媒体内容对应的特征向量确定对应的第二媒体内容，所述第一媒体内容基于所述第二媒体内容进行编辑所得；

所述获取单元，还用于获取所述第二媒体内容对应的评论数据；

处理单元，用于将所述评论数据与所述第一媒体内容进行关联发布。

可选的，在本申请一些可能的实现方式中，所述处理单元，具体用于确定所述评论数据与所述第一媒体内容对应目标内容的相关度参数；

所述处理单元，具体用于将基于所述相关度参数对所述评论数据进行筛选，从所述评论数据中确定目标评论信息；

所述处理单元，具体用于将所述目标评论信息与所述第一媒体内容进行关联发布。

可选的，在本申请一些可能的实现方式中，所述处理单元，具体用于所述处理单元，具体用于基于预设数据规模对所述第一媒体内容进行内容抽取，以得到内容片段；

所述处理单元，具体用于获取所述内容片段中的文本标签与视觉标签；

所述处理单元，具体用于根据所述文本标签与所述视觉标签确定所述评论数据与所述第一媒体内容的相关度，以确定为所述相关度参数。

可选的，在本申请一些可能的实现方式中，所述处理单元，具体用于基于预设项目对所述评论数据进行识别，以得到参考参数，所述预设项目包括情感倾向、内容丰富度中的至少一项；

所述处理单元，具体用于对所述相关度参数和所述参考参数进行加权处理，得到所述第一媒体内容对应目标内容的评论质量参数；

所述处理单元，具体用于基于所述评论质量参数对所述评论数据进行筛选，从所述评论数据中确定目标评论信息。

可选的，在本申请一些可能的实现方式中，当所述预设项目包括情感倾向时，基于所述预设项目调用情感分类模型，通过所述情感分类模型，确定所述评论数据符合预设情感维度的概率参数，所述预设情感维度至少包含情感类型相反的两个维度；

所述处理单元，具体用于根据各个所述预设情感维度的概率参数，以得到所述评论数据对应的所述参考参数。

可选的，在本申请一些可能的实现方式中，所述处理单元，具体用于获取情感训练数据；

所述处理单元，具体用于对所述情感训练数据中的训练词汇对应的嵌入矩阵进行因式分解，以得到第一分解矩阵和第二分解矩阵，所述第一分解矩阵的维度和所述第二分解矩阵的维度小于所述嵌入矩阵的维度；

所述处理单元，具体用于将所述第一分解矩阵输入所述情感分类模型的嵌入层，并将所述第二分解矩阵输入所述情感分类模型的隐藏层，以对所述情感分类模型进行训练，所述隐藏层之间的训练参数相互共享。

可选的，在本申请一些可能的实现方式中，所述处理单元，具体用于基于所述预设项目对所述评论数据对应的文本信息进行解析，以确定所述文本信息对应的语法树结构；

所述处理单元，具体用于识别所述语法树结构的复杂度信息；

所述处理单元，具体用于基于所述复杂度信息确定所述参考参数。

本申请第三方面提供一种计算机设备，包括：存储器、处理器以及总线系统；所述存储器用于存储程序代码；所述处理器用于根据所述程序代码中的指令执行上述第一方面或第一方面任一项所述的评论信息的处理方法。

本申请第四方面提供一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面或第一方面任一项所述的评论信息的处理方法。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述第一方面或者第一方面的各种可选实现方式中提供的评论信息的处理方法。

从以上方式方案可以看出，本申请实施例具有以下优点：

通过获取待发布的第一媒体内容；然后基于第一媒体内容对应的特征向量确定对应的第二媒体内容，其中第一媒体内容基于第二媒体内容进行编辑所得；进一步的提取第二媒体内容对应的评论数据；进而对评论数据进行筛选得到目标评论信息，以将目标评论信息与第一媒体内容进行关联发布。从而实现媒体内容之间的评论迁移过程，由于第一媒体内容与第二媒体内容之间存在关联关系，评论数据可以与第一媒体内容相匹配，从而使得待发布的第一媒体内容可以关联合适的评论发布，提升了评论信息生成的准确性。

附图说明

为了更清楚地说明本申请实施例或现有方式中的方式方案，下面将对实施例或现有方式描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通方式人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为评论信息的处理系统运行的网络架构图；

图2为本申请实施例提供的一种评论信息的处理的流程架构图；

图3为本申请实施例提供的一种评论信息的处理方法的流程图；

图4为本申请实施例提供的一种评论信息的处理方法的场景示意图；

图5为本申请实施例提供的另一种评论信息的处理方法的场景示意图；

图6为本申请实施例提供的另一种评论信息的处理方法的场景示意图；

图7为本申请实施例提供的另一种评论信息的处理方法的流程图；

图8为本申请实施例提供的另一种评论信息的处理方法的场景示意图；

图9为本申请实施例提供的一种评论信息的处理装置的结构示意图；

图10为本申请实施例提供的一种终端设备的结构示意图；

图11为本申请实施例提供的一种服务器的结构示意图。

具体实施方式

本申请实施例提供了一种评论信息的处理方法以及相关装置，可以应用于终端设备中包含评论信息的处理功能的系统或程序中，通过获取待发布的第一媒体内容；然后基于第一媒体内容对应的特征向量确定对应的第二媒体内容，其中第一媒体内容基于第二媒体内容进行编辑所得；进一步的提取第二媒体内容对应的评论数据；进而对评论数据进行筛选得到目标评论信息，以将目标评论信息与第一媒体内容进行关联发布。从而实现媒体内容之间的评论迁移过程，由于第一媒体内容与第二媒体内容之间存在关联关系，评论数据可以与第一媒体内容相匹配，从而使得待发布的第一媒体内容可以关联合适的评论发布，提升了评论信息生成的准确性。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“对应于”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先，对本申请实施例中可能出现的一些名词进行解释。

图像指纹：是将图像按照一定的算法，经过运算后得到一个或者一组能够代表图像特征的值。

评论：用户对于媒体内容所提供的具有针对性的文本信息。

应理解，本申请提供的评论信息的处理方法可以应用于终端设备中包含评论信息的处理功能的系统或程序中，例如短视频应用，具体的，评论信息的处理系统可以运行于如图1所示的网络架构中，如图1所示，是评论信息的处理系统运行的网络架构图，如图可知，评论信息的处理系统可以提供与多个信息源的评论信息的处理过程，即通过终端侧的发布操作对服务器确定对应的第二媒体内容，从而将第二媒体内容的评论迁移到第一媒体内容进行关联发布；可以理解的是，图1中示出了多种终端设备，终端设备可以为计算机设备，在实际场景中可以有更多或更少种类的终端设备参与到评论信息的处理的过程中，具体数量和种类因实际场景而定，此处不做限定，另外，图1中示出了一个服务器，但在实际场景中，也可以有多个服务器的参与，具体服务器数量因实际场景而定。

本实施例中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，终端以及服务器可以连接组成区块链网络，本申请在此不做限制。

可以理解的是，上述评论信息的处理系统可以运行于个人移动终端，例如：作为短视频应用这样的应用，也可以运行于服务器，还可以作为运行于第三方设备以提供评论信息的处理，以得到信息源的评论信息的处理结果；具体的评论信息的处理系统可以是以一种程序的形式在上述设备中运行，也可以作为上述设备中的系统部件进行运行，还可以作为云端服务程序的一种，具体运作模式因实际场景而定，此处不做限定。

但是，构建视频库的数据规模较大，待发布的短视频无法即时的获取到强关联的评论信息，评论往往与视频内容情节贴合度较差，质量难以达到要求，影响评论信息的准确性。另外，基于相似视频查找的评论生成方式，需要有一个规模较大的视频库做支撑，既要尽量保证能查找到十分相似的视频以及视频有较多的评论可用，因此前提条件要求较高；基于端到端深度学习模型的评论生成方式，需要有海量的优质训练数据，并且生成的评论往往与视频内容情节贴合度较差，质量难以达到要求。

为了解决上述问题，本申请提出了一种评论信息的处理方法，该方法应用于图2所示的评论信息的处理的流程框架中，如图2所示，为本申请实施例提供的一种评论信息的处理的流程架构图，用于短视频的冷启动，即第一媒体内容刚发布后，确定关联的第二媒体内容，进而对长视频的评论数据进行筛选，即通过本实施例方法生成视频的评论，然后发布评论。

可以理解的是，第一媒体内容可以是视频、音频、图像等媒体形式，例如当第一媒体内容为视频1时，则第二媒体内容则为包含视频1的视频2，即视频1是由视频2编辑所得；或第二媒体内容为歌曲1，则第一媒体内容为歌曲1的高潮部分剪辑；或第二媒体内容为图像集1，则第一媒体内容为图像集1中的封面图像。

具体的，针对短视频评论冷启动问题，当新视频发布后，需要及时为视频补充评论以达到吸引用户观看和评论的目的。发现许多短视频中包含对应的长视频内容，例如短视频《小明和小红解说》(第一媒体内容)对应的长视频为电影《小明和小红》(第二媒体内容)，基于此可以通过图像指纹找到短视频对应的长视频，然后将长视频的评论迁移到短视频，从而解决视频评论冷启动问题。

本实施例通过利用媒体内容之间的短-长关系，例如利用长视频的大量优质评论尤其是视频平台有大量的精品长视频，如电视剧、电影、动漫、综艺等，进行短视频的评论冷启动，保证了短视频中评论的准确性。

可以理解的是，本申请所提供的方法可以为一种程序的写入，以作为硬件系统中的一种处理逻辑，也可以作为一种评论信息的处理装置，采用集成或外接的方式实现上述处理逻辑。作为一种实现方式，该评论信息的处理装置通过获取待发布的第一媒体内容；然后基于第一媒体内容对应的特征向量确定对应的第二媒体内容，其中第一媒体内容基于第二媒体内容进行编辑所得；进一步的提取第二媒体内容对应的评论数据；进而对评论数据进行筛选得到目标评论信息，以将目标评论信息与第一媒体内容进行关联发布。从而实现媒体内容之间的评论迁移过程，由于第一媒体内容与第二媒体内容之间存在关联关系，评论数据可以与第一媒体内容相匹配，从而使得待发布的第一媒体内容可以关联合适的评论发布，提升了评论信息生成的准确性。

本申请实施例提供的方案涉及人工智能的自然语言识别方式，具体通过如下实施例进行说明：

结合上述流程架构，下面将对本申请中评论信息的处理方法进行介绍，请参阅图3，图3为本申请实施例提供的一种评论信息的处理方法的流程图，该管理方法可以是由参与者执行的，本申请实施例至少包括以下步骤：

301、获取待发布的第一媒体内容。

本实施例中，第一媒体内容可以是视频内容，例如短视频；也可以是音频内容，例如背景音乐片段；具体的媒体内容形式因实际场景而定，此处不作限定。

302、基于第一媒体内容对应的特征向量确定对应的第二媒体内容。

本实施例中，第一媒体内容基于第二媒体内容进行编辑所得；例如当第一媒体内容为短视频时，第二媒体内容即为包含该短视频的长视频，此时数据范围即为视频的长短，而第一媒体内容对应的特征向量即为图像指纹；或当第一媒体内容为音乐片段时，第二媒体内容即为包含该音乐片段的音频内容，此时数据范围即为音频的长短，具体的形式因实际场景而定，而第一媒体内容对应的特征向量即为音频指纹。

下面，以短视频(第一媒体内容)关联长视频(第二媒体内容)为例进行说明，即首先对长视频抽帧，抽出的帧过输入预训练深度学习模型后得到一组图像特征表示，该特征表示即为图像指纹。本实施例采用的预训练深度学习模型为ResNet，ResNet由buildingblock或bottleneck组成，building block的结构如4所示，图4为本申请实施例提供的一种评论信息的处理方法的场景示意图；该ResNet中的building block结构包含一个残差支路和short-cut支路，比传统的卷积结构多了一个short-cut支路，用于传递低层的信息，使得网络能够训练地很深。

可以理解的是，通过Resnet模型视频的图像帧转化为一组向量化表示的特征信息，将这一组向量平均化即得到最后视频的指纹表示。

应当注意的是，本实施例除了采用ResNet模型得到图像指纹，其他CNN类型的网络结构均可实现，此处不作限定。

在一种可能的场景中，用户上传短视频后，与对待长视频一样，也对短视频抽帧然后过Resnet模型得到短视频的向量化表示，然后计算短视频表征与长视频表征的余弦相似度，具体的，余弦相似度计算公式如下：

其中，x₁-x_n表示长视频的视频帧对应的图像向量特征；y₁-y_n表示长视频的视频帧对应的图像向量特征。

通过上述公式的计算，余弦相似度最高的视频即为短视频所对应的长视频，然后从长视频关联的评论数据(评论库)里检索到该长视频下的评论数据集。

303、获取第二媒体内容对应的评论数据。

本实施例中，第二媒体内容对应的评论数据即从长视频关联的评论数据(评论库)里检索到该长视频下的评论数据集；具体的该评论数据集可以是本地缓存的，也可以是云端存储的，具体方式因实际场景而定。

可以理解的是，评论数据包含但不限于专栏评论、弹幕评论、发帖评论等形式，具体的应用展现因实际场景而定。

304、将评论数据与第一媒体内容进行关联发布。

本实施例中，由于第一媒体内容为第二媒体内容的一部分，且评论信息具有针对性，故需要对评论数据进行筛选，以确定与第一媒体内容对应片段相匹配的评论。

由于在媒体内容发布的过程中，相关的评论数据为空白，即存在冷启动问题的问题，例如当新视频发布后，需要及时为视频补充评论以达到吸引用户观看和评论的目的，即需要进行评论的关联发布；或当图片1发布时，需要及时为图片补充评论以便于用户了解其含义，例如补充包含图片1的图像集的评论。

具体的，对于评论数据的筛选打分的过程可以是基于评论数据与第一媒体内容的相关度进行的，对于相关度参数的确定，可以包含文本与视觉两个维度进行考量。即首先基于预设数据规模对第一媒体内容进行内容抽取，以得到内容片段；然后获取内容片段中的文本标签与视觉标签；进而根据文本标签与视觉标签确定评论数据与第一媒体内容的相关度，以确定为相关度参数。

在一种可能的场景中，可以首先基于预设数据规模对第一媒体内容进行内容抽取，以得到内容片段；具体的，评论与短视频的相关性采用深度学习模型VideoBERT得出，该模型基于效果优异的BERT模型，可将video中提取出的特征向量通过聚类的方法离散化，继而在文本标签(token)的基础上增加视觉标签(token)，达到一起学习视觉和文本信息的目的；然后将输入深度学习模型，以对确定内容片段对应的视觉特征向量；并对视觉特征向量进行聚类，以得到类中心；进而确定类中心与第一媒体内容的相关度，并结合评论数据与第一媒体内容的相关度确定相关度参数。

具体的，针对第一媒体内容的处理，首先从输入视频中每秒中抽取20帧画面(20fps)，然后每30帧组成一个片段。进而对每个片段(clip)用pretrained的ConvNet提取特征向量。但是由于特征向量属于整个R^1024空间，是不可数的。为了和文本token相对应，延续原始BERT中的MLM任务，对所有提取出的特征向量使用hierarchical k-means做聚类，一共得到20736个类中心，把类中心作为visual token，每一个视觉特征向量都由它属于的类中心来表征。文本方面，采用候选评论数据作为输入。经过前面的处理，video中的语言和视觉信息都变成了离散的token，VideoBERT的输入格式延续了原始BERT的设计，只是增加了[>]这个特殊的token用来区分text token和visual token，从而提升了文本标签和视觉标签的融合效率以及融合后的准确性。

在一种可能的场景中，VideoBERT的结构如图5所示，图5为本申请实施例提供的另一种评论信息的处理方法的场景示意图；图中示出了VideoBERT模型的训练任务有两个，一是通过模型预测被mask的text token，二是分类任务，预测多个文本标签组成的文本序列(text sequence)和多个视觉标签组成的视觉序列(visual sequence)是否一致，而通过任务二即可得到视频和评论的相关度。

在本申请提供的另一种实施例中，对于评论数据的筛选打分的过程还可以是基于参考参数进行的，即筛选打分包含多个维度的考量，例如首先基于预设项目对评论数据进行识别，以得到参考参数；其中，预设项目包括情感倾向或内容丰富度中的至少一项；然后对相关度参数和参考参数进行加权处理，从而对评论质量进行更新，以保证评论筛选的准确性。

应当注意的是，参考参数可以包含情感倾向和丰富度中的至少一种，例如对于评论数据的筛选打分的过程包含相关度与情感倾向的考量；或首先确定评论数据与第一媒体内容对应目标内容的相关度参数；然后识别评论数据对应的情感倾向参数；进一步的对评论数据对应的文本信息进行解析，以确定丰富度参数；然后基于相关度参数、情感倾向参数和丰富度参数进行加权，以得到评论质量参数(评论质量分)；并根据评论质量参数对评论数据进行筛选，以确定目标评论信息；进而将目标评论信息与第一媒体内容进行关联发布。

在一种可能的实施例中，评论质量可以基于三个维度进行评价，分别是：评论与短视频标题的相关程度、评论的情感倾向和评论的丰富度，评论质量分为这三个维度得分的加权和，权重可以根据需要自行设定，其计算公式如下：

评论质量分＝w1*相关度+w2*情感倾向+w3*评论丰富度

进一步的，通过评论质量分的高低，确定相应的目标评论信息，例如选取评论质量分前20位的评论，具体的提取方式因实际场景而定。

另外，对于情感倾向参数的确定过程，可以首先确定评论数据在积极维度的第一情感参数；然后确定评论数据在消极维度的第二情感参数，这是由于情感分为积极和消极两类；然后根据第一情感参数和第二情感参数进行计算，以得到评论数据对应的情感倾向参数。具体的，评论的情感倾向根据情感分类深度模型给出，情感分为积极和消极两类，评论越积极则得分越高。本实施例采用ALBERT模型作为情感分类模型，ALBERT模型是对BERT模型的改造，在不明显降低模型精度的情况下大幅度削减模型参数，参数量远远少于传统的BERT架构，使得模型更轻巧效率更高。

应当注意的是，其他分类模型也可应用在本实施例中，例如Fasttext模型、TextCNN模型、DPCNN模型、TextGCN模型等，具体模型因实际场景而定。

在情感分类模型的训练过程中，训练词汇的词向量只是记忆了相对少量的词语的信息，更多的语义和句法等信息是由隐藏层记忆的。因此，词嵌入的维度可以不必与隐藏层的维度一致，可以通过降低词嵌入的维度的方式来减少参数量。

具体的，可以对情感训练数据中的训练词汇对应的嵌入矩阵进行因式分解，以得到第一分解矩阵和第二分解矩阵，其中第一分解矩阵的维度和第二分解矩阵的维度小于嵌入矩阵的维度；然后将第一分解矩阵输入情感分类模型的嵌入层，并将第二分解矩阵输入情感分类模型的隐藏层，以对情感分类模型进行训练，隐藏层之间的训练参数相互共享。

在一种可能的场景中，假设词表(情感训练数据)的大小为V，词嵌入的维度为E，隐藏层的维度为H。在BERT中E＝H；而对于ALBERT，可以将E降低，在词嵌入层和隐藏层之间加入一个调解层(project)，然后连接两个层。对于BERT模型，训练范围(ParameterNumBERT)＝E*V＝H*V，由于通常情况下V很大，BERT中文模型V约为30000，BERT_base中H＝1024，则对应的ParameterNumBERT＝30000*1024。

而对于ALBERT模型，训练范围(ParameterNumAL)＝(V+H)*E，在ALBERT中，E＝128(第一分解矩阵)；H＝1024(和第二分解矩阵)，对应的ParameterNumAL＝30000*128+128*1024，小于BERT的训练范围，故通过嵌入层的参数因式分解，成功将嵌入层的参数进行了缩小。

可以理解的是，ALBERT通过两个参数削减方式克服了扩展预训练模型面临的主要障碍。第一个方式是对嵌入参数化进行因式分解。将大的词汇嵌入矩阵分解为两个小的矩阵，从而将隐藏层的大小与词汇嵌入的大小分离开来。这种分离使得隐藏层的增加更加容易，同时不显著增加词汇嵌入的参数量。第二种方式是跨层参数共享。该方式可以避免参数量随着网络深度的增加而增加。两种方式都显著降低了BERT的参数量，同时不对其性能造成明显影响，从而提升了参数效率。ALBERT的配置类似于BERT-large，但参数量仅为后者的1/18，训练速度却是后者的1.7倍。

具体的，BERT模型采用Transformer结构作为隐藏层来对信息做特征提取和交互式学习表示，Transformer结构如图6所示，图6为本申请实施例提供的另一种评论信息的处理方法的场景示意图；即在编码器(Encoder)中，输入(Input)经过向量表示(embedding)后，要进行位置编码(positional encodings)，然后是多头注意力机制关联(Multi-headattention)，再经过位置前传导(position-wise Feed Forward)，其中每个子层之间有残差连接。而在解码器(Decoder)中，也有positional encodings，Multi-head attention和FFN，子层之间也要做残差连接，但比encoder多了一个Masked Multi-head attention，最后要经过Linear和softmax输出概率，从而得到归属于消极或积极情感的概率。

应当注意的是，对于评论质量打分的方法，计算评论与视频的相关性计算还可以采用其他类BERT结构的多模态表征训练模型。

另外，对于丰富度参数的确定，可以首先对评论数据对应的文本信息进行解析，以确定文本信息对应的语法树结构；然后识别语法树结构的复杂度信息；进而基于复杂度信息确定丰富度参数。即评论丰富度根据评论语法树复杂度来评估，语法树复杂度越高则表示评论丰富程度越高。

在另一种可能的场景中，可以基于第二媒体内容建立数据库，以便于评论的快速提取，即首先确定第二媒体内容关联的内容数据库；然后内容数据库对应的内容目标分别遍历内容评论信息；进而基于预设规则对内容评论信息进行筛选，以结合对应的内容数据得到评论数据库，其中，则基于文本的类型以及长短设定，该论数据库用于为第一媒体内容提供数据更新支持，以便于短视频评论的快速关联，例如第一媒体内容为热播的电视剧A的片段，其评论数据随着时间的推移不断变化，此时通过对数据库的维护，即时抓取电视剧A(第二媒体内容)的评论数据，在电视剧A的片段发布在短视频平台时即可关联最新的评论进行发布。

在一种可能的场景中，基于视频平台(内容数据库)有大量的精品长视频，如电视剧、电影、动漫、综艺等，将这些长视频的图像指纹、标题文本、一级评论文本构建成评论数据库，构建的过程中，剔除字数特别少或只有标点和表情符号的评论，因而低质量评论将不会被用到。

结合上述实施例可知，通过获取待发布的第一媒体内容；然后基于第一媒体内容对应的特征向量确定对应的第二媒体内容，其中第一媒体内容基于第二媒体内容进行编辑所得；进一步的提取第二媒体内容对应的评论数据；进而对评论数据进行筛选得到目标评论信息，以将目标评论信息与第一媒体内容进行关联发布。从而实现媒体内容之间的评论迁移过程，由于第一媒体内容与第二媒体内容之间存在关联关系，评论数据可以与第一媒体内容相匹配，从而使得待发布的第一媒体内容可以关联合适的评论发布，提升了评论信息生成的准确性。

下面结合短视频的发布过程进行说明。请参阅图7，图7为本申请实施例提供的另一种评论信息的处理方法的流程图，本申请实施例至少包括以下步骤：

701、响应于目标用户的上传操作确定短视频。

本实施例中，上传操作可以是用户点击上传按钮，也可以是用户在截取短视频过程中自动识别的，还可以是用户编辑短视频过程中应用后台的自动关联进程。

702、基于图像指纹识别短视频对应的长视频。

本实施例中，在给定的输入的图像中，使用一个散列函数，并基于图像视觉上的外观计算它的“图像散列”值，对于相似的头像，它的散列值应该也是相似的。即使用图像哈希算法可以大大简化重复图像检测的程序。具体的，可以使用“difference hash”，或者仅仅使用dHash算法来计算图像指纹。

703、获取长视频下所有评论数据。

本实施例中，长视频下所有评论数据可以包括弹幕数据、第三方论坛的帖子数据以及视频评论区的评论数据。

704、对评论数据进行质量打分和排序，并筛选出目标评论。

本实施例中，筛选出目标评论的过程参见图3所示实施例步骤304的描述，此处不作赘述。

705、设定评论阈值，以筛选出质量分在预设范围内的评论发布。

本实施例中，可以设定一个阈值，当评论质量分大于该阈值则保留评论，否则不保留，最终得到的评论即为迁移到短视频的评论，然后发布评论。

在一种可能的场景中，如图8所示，图8为本申请实施例提供的另一种评论信息的处理方法的场景示意图；用户通过点击上传按钮，在服务器侧进行长视频的关联，并调用对应的评论数据，进行确定用于短视频发布时播放的弹幕评论A1，从而实现了弹幕的快速生成过程。

可以理解的是，通过评论阈值的设定可以动态的更新短视频的关联评论(弹幕)，即质量分在预设范围内的评论是动态变化的，从而提高了评论的准确性。

为了更好的实施本申请实施例的上述方案，下面还提供用于实施上述方案的相关装置。请参阅图9，图9为本申请实施例提供的一种评论信息的处理装置的结构示意图，评论信息的处理装置900包括：

获取单元901，用于获取待发布的第一媒体内容；

确定单元902，用于基于所述第一媒体内容对应的特征向量确定对应的第二媒体内容，所述第一媒体内容基于所述第二媒体内容进行编辑所得；

所述获取单元901，还用于获取所述第二媒体内容对应的评论数据；

处理单元903，用于将所述评论数据与所述第一媒体内容进行关联发布。

可选的，在本申请一些可能的实现方式中，所述处理单元903，具体用于确定所述评论数据与所述第一媒体内容对应目标内容的相关度参数；

所述处理单元903，具体用于将基于所述相关度参数对所述评论数据进行筛选，从所述评论数据中确定目标评论信息；

所述处理单元903，具体用于将所述目标评论信息与所述第一媒体内容进行关联发布。

可选的，在本申请一些可能的实现方式中，所述处理单元903，具体用于所述处理单元903，具体用于基于预设数据规模对所述第一媒体内容进行内容抽取，以得到内容片段；

所述处理单元903，具体用于获取所述内容片段中的文本标签与视觉标签；

所述处理单元903，具体用于根据所述文本标签与所述视觉标签确定所述评论数据与所述第一媒体内容的相关度，以确定为所述相关度参数。

可选的，在本申请一些可能的实现方式中，所述处理单元903，具体用于基于预设项目对所述评论数据进行识别，以得到参考参数，所述预设项目包括情感倾向、内容丰富度中的至少一项；

所述处理单元903，具体用于对所述相关度参数和所述参考参数进行加权处理，得到所述第一媒体内容对应目标内容的评论质量参数；

所述处理单元903，具体用于基于所述评论质量参数对所述评论数据进行筛选，从所述评论数据中确定目标评论信息。

所述处理单元903，具体用于根据各个所述预设情感维度的概率参数，以得到所述评论数据对应的所述参考参数。

可选的，在本申请一些可能的实现方式中，所述处理单元903，具体用于获取情感训练数据；

所述处理单元903，具体用于对所述情感训练数据中的训练词汇对应的嵌入矩阵进行因式分解，以得到第一分解矩阵和第二分解矩阵，所述第一分解矩阵的维度和所述第二分解矩阵的维度小于所述嵌入矩阵的维度；

所述处理单元903，具体用于将所述第一分解矩阵输入所述情感分类模型的嵌入层，并将所述第二分解矩阵输入所述情感分类模型的隐藏层，以对所述情感分类模型进行训练，所述隐藏层之间的训练参数相互共享。

可选的，在本申请一些可能的实现方式中，所述处理单元903，具体用于基于所述预设项目对所述评论数据对应的文本信息进行解析，以确定所述文本信息对应的语法树结构；

所述处理单元903，具体用于识别所述语法树结构的复杂度信息；

所述处理单元903，具体用于基于所述复杂度信息确定所述参考参数。可选的，在本申请一些可能的实现方式中，所述处理单元903，具体用于确定所述第二媒体内容关联的内容数据库；

所述处理单元903，具体用于基于所述内容数据库对应的内容目标分别遍历内容评论信息；

所述处理单元903，具体用于根据预设规则对所述内容评论信息进行筛选，以结合对应的内容数据得到评论数据库，所述预设规则基于文本的类型以及长短设定，所述评论数据库用于为所述第一媒体内容提供数据更新支持。

本申请实施例还提供了一种终端设备，如图10所示，是本申请实施例提供的另一种终端设备的结构示意图，为了便于说明，仅示出了与本申请实施例相关的部分，具体方式细节未揭示的，请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(personal digital assistant，PDA)、销售终端(point of sales，POS)、车载电脑等任意终端设备，以终端为手机为例：

图10示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图10，手机包括：射频(radio frequency，RF)电路1010、存储器1020、输入单元1030、显示单元1040、传感器1050、音频电路1060、无线保真(wireless fidelity，WiFi)模块1070、处理器1080、以及电源1090等部件。本领域方式人员可以理解，图10中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图10对手机的各个构成部件进行具体的介绍：

RF电路1010可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器1080处理；另外，将设计上行的数据发送给基站。通常，RF电路1010包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noiseamplifier，LNA)、双工器等。此外，RF电路1010还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(globalsystem of mobile communication，GSM)、通用分组无线服务(general packet radioservice，GPRS)、码分多址(code division multiple access，CDMA)、宽带码分多址(wideband code division multiple access,WCDMA)、长期演进(long term evolution，LTE)、电子邮件、短消息服务(short messaging service，SMS)等。

存储器1020可用于存储软件程序以及模块，处理器1080通过运行存储在存储器1020的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器1020可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器1020可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元1030可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元1030可包括触控面板1031以及其他输入设备1032。触控面板1031，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1031上或在触控面板1031附近的操作，以及在触控面板1031上一定范围内的隔空触控操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板1031可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器1080，并能接收处理器1080发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1031。除了触控面板1031，输入单元1030还可以包括其他输入设备1032。具体地，其他输入设备1032可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元1040可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1040可包括显示面板1041，可选的，可以采用液晶显示器(liquidcrystal display，LCD)、有机发光二极管(organic light-emitting diode，OLED)等形式来配置显示面板1041。进一步的，触控面板1031可覆盖显示面板1041，当触控面板1031检测到在其上或附近的触摸操作后，传送给处理器1080以确定触摸事件的类型，随后处理器1080根据触摸事件的类型在显示面板1041上提供相应的视觉输出。虽然在图10中，触控面板1031与显示面板1041是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板1031与显示面板1041集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器1050，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板1041的亮度，接近传感器可在手机移动到耳边时，关闭显示面板1041和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路1060、扬声器1061，传声器1062可提供用户与手机之间的音频接口。音频电路1060可将接收到的音频数据转换后的电信号，传输到扬声器1061，由扬声器1061转换为声音信号输出；另一方面，传声器1062将收集的声音信号转换为电信号，由音频电路1060接收后转换为音频数据，再将音频数据输出处理器1080处理后，经RF电路1010以发送给比如另一手机，或者将音频数据输出至存储器1020以便进一步处理。

WiFi属于短距离无线传输方式，手机通过WiFi模块1070可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图10示出了WiFi模块1070，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器1080是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器1020内的软件程序和/或模块，以及调用存储在存储器1020内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器1080可包括一个或多个处理单元；可选的，处理器1080可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1080中。

手机还包括给各个部件供电的电源1090(比如电池)，可选的，电源可以通过电源管理系统与处理器1080逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在本申请实施例中，该终端所包括的处理器1080还具有执行如上述页面处理方法的各个步骤的功能。

本申请实施例还提供了一种服务器，请参阅图11，图11是本申请实施例提供的一种服务器的结构示意图，该服务器1100可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，CPU)1122(例如，一个或一个以上处理器)和存储器1132，一个或一个以上存储应用程序1142或数据1144的存储介质1130(例如一个或一个以上海量存储设备)。其中，存储器1132和存储介质1130可以是短暂存储或持久存储。存储在存储介质1130的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1122可以设置为与存储介质1130通信，在服务器1100上执行存储介质1130中的一系列指令操作。

服务器1100还可以包括一个或一个以上电源1126，一个或一个以上有线或无线网络接口1150，一个或一个以上输入输出接口1158，和/或，一个或一个以上操作系统1141，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

上述实施例中由管理装置所执行的步骤可以基于该图11所示的服务器结构。

本申请实施例中还提供一种计算机可读存储介质，该计算机可读存储介质中存储有评论信息的处理指令，当其在计算机上运行时，使得计算机执行如前述图3至图8所示实施例描述的方法中评论信息的处理装置所执行的步骤。

本申请实施例中还提供一种包括评论信息的处理指令的计算机程序产品，当其在计算机上运行时，使得计算机执行如前述图3至图8所示实施例描述的方法中评论信息的处理装置所执行的步骤。

本申请实施例还提供了一种评论信息的处理系统，所述评论信息的处理系统可以包含图9所描述实施例中的评论信息的处理装置，或图10所描述实施例中的终端设备，或者图11所描述的服务器。

所属领域的方式人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的方式方案本质上或者说对现有方式做出贡献的部分或者该方式方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，评论信息的处理装置，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的方式方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通方式人员应当理解：其依然可以对前述各实施例所记载的方式方案进行修改，或者对其中部分方式特征进行等同替换；而这些修改或者替换，并不使相应方式方案的本质脱离本申请各实施例方式方案的精神和范围。

Claims

1.一种评论信息的处理方法，其特征在于，包括：

获取待发布的第一媒体内容；

获取所述第二媒体内容对应的评论数据；

将所述评论数据与所述第一媒体内容进行关联发布。

2.根据权利要求1所述的方法，其特征在于，所述将所述评论数据与所述第一媒体内容进行关联发布，包括：

将所述目标评论信息与所述第一媒体内容进行关联发布。

3.根据权利要求2所述的方法，其特征在于，所述确定所述评论数据与所述第一媒体内容对应目标内容的相关度参数，包括：

基于预设数据规模对所述第一媒体内容对应的目标内容进行内容抽取，以得到内容片段；

获取所述内容片段中的文本标签与视觉标签；

4.根据权利要求2所述的方法，其特征在于，所述基于所述相关度参数对所述评论数据进行筛选，从所述评论数据中确定目标评论信息，包括：

5.根据权利要求4所述的方法，其特征在于，当所述预设项目包括情感倾向时，所述基于预设项目对所述评论数据进行识别，以得到参考参数，包括：

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

获取情感训练数据；

7.根据权利要求4所述的方法，其特征在于，所述基于预设项目对所述评论数据进行识别，以得到参考参数，包括：

识别所述语法树结构的复杂度信息；

基于所述复杂度信息确定所述参考参数。

8.一种评论信息的处理装置，其特征在于，包括：

获取单元，用于获取待发布的第一媒体内容；

9.一种计算机设备，其特征在于，所述计算机设备包括处理器以及存储器：

所述存储器用于存储程序代码；所述处理器用于根据所述程序代码中的指令执行权利要求1至7任一项所述的评论信息的处理方法。

10.一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述权利要求1至7任一项所述的评论信息的处理方法。