CN112559740A

CN112559740A - 一种基于多模型融合的广告标签分类方法、系统及设备

Info

Publication number: CN112559740A
Application number: CN202011393757.3A
Authority: CN
Inventors: 冯希宁
Original assignee: Star Media Ltd
Current assignee: Star Media Ltd
Priority date: 2020-12-03
Filing date: 2020-12-03
Publication date: 2021-03-26

Abstract

本发明提出的一种基于多模型融合的广告标签分类方法、系统及设备，一方面使用深度学习模型针对视频广告进行情感分析，得到视频广告的情感分类，另一方面使用深度学习模型对视频广告进行关键字的提取，关键字可以提取多个，将情感分类也加入到关键字中，将所有关键字进行权重处理，最后通过阈值控制进行精准的广告视频推荐，提升用户体验，提升广告的播放价值。

Description

一种基于多模型融合的广告标签分类方法、系统及设备

技术领域

本发明涉及图像分类识别技术领域，更具体的说是涉及一种基于多模型融合的广告标签分类方法、系统及设备。

背景技术

视频广告是指在移动设备内进行的插播视频的模式。视频广告分为传统视频广告和移动视频广告两类。传统视频广告是在视频内的广告进行设置和投放，而移动视频广告分为传统贴片广告和In-App视频广告。

随着网络技术和多媒体技术的快速发展，视频广告也随之快速发展，为了提高广告的播放价值，广告运营商需要收集大量的用户信息，比如用户的个人喜好、频繁搜索的关键字等信息，作为依据来判断用户关注的广告类别，进而实现广告的精准推送。

而实现广告的精准推送，关键在于对广告的情感分类和关键字的提取分类。目前，市面上的广告标签分类方法一般采用人工审核标注来实现广告的分类。采用人工进行广告的标签化处理，存在效率和准确率不高且过于主观的缺陷。

发明内容

针对以上问题，本发明的目的在于提供一种基于多模型融合的广告标签分类方法、系统及设备，能够自动进行广告的文本情感分类和关键词提取分类，为广告运营系统提供了精准的广告投放依据。

本发明为实现上述目的，通过以下技术方案实现：一种基于多模型融合的广告标签分类方法，包括如下步骤：

S1：使用目标检测模型对预设广告内容进行检测，得出对应的文本，人工对所述文本进行情感分类并标注，生成广告视频和情感分类的间接映射作为数据集；S2：使用第一学习模型训练数据集，生成情感分类模型；

S3：使用情感分类模型对待分类的广告进行情感分类预测，得到广告的内容情感分类结果，生成情感分类标签A和对应的概率a；

S4：使用第二学习模型对待分类的广告的文本进行关键词提取得到短语和自动摘要，根据短语生成关键字标签B和对应的概率b。

进一步，所述目标检测模型具体为：在COCO数据集中加入预设广告数据集作为基础数据集，使用Yolo神经网络训练基础数据集生成的深度学习模型。

进一步，所述第一学习模型采用基于BERT变种的神经网络。

进一步，所述第二学习模型采用TextRank为基础的文本分析模型。

进一步，所述步骤S4之后还包括：

S5：根据广告的情感分类标签A和对应的概率a、关键字标签B和对应的概率b组建广告标签系统。

进一步，所述步骤S5具体为：

提取所有广告的情感分类标签A和对应的概率a，以概率a的降序排列生成情感分类标签概率列表；

提取所有广告的关键字标签B和对应的概率b，以概率b的降序排列生成关键字标签概率列表。

相应的，本发明还公开了一种基于多模型融合的广告标签分类系统，包括：数据集准备单元，用于使用目标检测模型对预设广告内容进行检测，得出对应的文本，人工对所述文本进行情感分类并标注，生成广告视频和情感分类的间接映射作为数据集；

模型生成单元，用于使用第一学习模型训练数据集，生成情感分类模型；

第一分类单元，用于使用情感分类模型对待分类的广告进行情感分类预测，得到广告的内容情感分类结果，生成情感分类标签A和对应的概率a；

第二分类单元，用于使用第二学习模型对待分类的广告的文本进行关键词提取得到短语和自动摘要，根据短语生成关键字标签B和对应的概率b。

相应的，本发明还公开了一种基于多模型融合的广告标签分类设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上文任一所述的基于多模型融合的广告标签分类方法步骤。

对比现有技术，本发明有益效果在于：本发明提供了一种基于多模型融合的广告标签分类方法、系统及设备，一方面使用深度学习模型针对视频广告进行情感分析，得到视频广告的情感分类，另一方面使用深度学习模型对视频广告进行关键字的提取，关键字可以提取多个，将情感分类也加入到关键字中，将所有关键字进行权重处理，最后通过阈值控制进行精准的广告视频推荐，提升用户体验，提升广告的播放价值。

本发明基于多模型融合，实现了文本情感分析分类与视频内容关键词提取的广告标签分类。具体来说：1、根据实际应用情况，对广告视频进行情感类文本标注，生成广告视频情感分类的数据集；2、文本分析得到多关键字，对关键字生成多标签与概率。3、多模型共同对视频进行标签化处理，得到标签权重与等级，用户可以根据实际需求进行标签的筛选，进而实现了广告的精准推送。

由此可见，本发明与现有技术相比，具有突出的实质性特点和显著的进步，其实施的有益效果也是显而易见的。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

附图1是本发明的方法流程图。

附图2是本发明的系统结构图。

具体实施方式

下面结合附图对本发明的具体实施方式做出说明。

如图1所示的一种基于多模型融合的广告标签分类方法，包括如下步骤：

S1：使用目标检测模型对预设广告内容进行检测，得出对应的文本，人工对所述文本进行情感分类并标注，生成广告视频和情感分类的间接映射作为数据集。

其中，目标检测模型为已经存在的COCO数据集和按照需求增加自己的数据集下使用Yolo(具体为Yolo v5)神经网络训练的深度学习模型。使用目标检测模型，能够检测出很多文本，人工对该文本进行情感标注，相当于我们使用目标检测模型制作我们自己需要的数据集。

S2：使用第一学习模型训练数据集，生成情感分类模型。

使用客观存在的基于BERT变种的神经网络训练步骤S1的数据集得到情感分类模型。

S3：使用情感分类模型对待分类的广告进行情感分类预测，得到广告的内容情感分类结果，生成情感分类标签A和对应的概率a。

其中，第二学习模型为以TextRank为基础的文本分析模型，使用第二学习模型推理得到短语和自动摘要，我们使用其中的短语作为关键字标签B和对应的概率b。

具体来说，首先，提取所有广告的情感分类标签A和对应的概率a，以概率a的降序排列生成情感分类标签概率列表。然后，提取所有广告的关键字标签B和对应的概率b，以概率b的降序排列生成关键字标签概率列表。

可见，情感分类标签概率列表和关键字标签概率列表都是k个概率由大到小的标签。例如一个视频的上述两个列表采用以下方式呈现：

A类概率和标签：

％90众志成城。

B类概率和标签：

％99抗疫；

％90医生。

一直往下排，取K个停止。

使用时，我们可以根据需要在上述列表中筛选出需要推送的视频，例如，在疫情阶段，播出A类95％以上正能量标签和B类概率80％以上关于抗疫标签视频；在中秋节期间，播出A类概率50％以上快乐标签和B类70％月饼的视频。

相应的，如图2所示，本发明还公开了一种基于多模型融合的广告标签分类系统，包括：

数据集准备单元，用于使用目标检测模型对预设广告内容进行检测，得出对应的文本，人工对所述文本进行情感分类并标注，生成广告视频和情感分类的间接映射作为数据集。

模型生成单元，用于使用第一学习模型训练数据集，生成情感分类模型。

第一分类单元，用于使用情感分类模型对待分类的广告进行情感分类预测，得到广告的内容情感分类结果，生成情感分类标签A和对应的概率a。

相应的，本发明还公开了一种基于多模型融合的广告标签分类设备，包括：存储器，用于存储计算机程序；

本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质，包括若干指令用以使得一台计算机终端(可以是个人计算机，服务器，或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。本说明书中各个实施例之间相同相似的部分互相参见即可。尤其，对于终端实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例中的说明即可。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统、系统和方法，可以通过其它的方式实现。例如，以上所描述的系统实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，系统或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个单元中。

同理，在本发明各个实施例中的各处理单元可以集成在一个功能模块中，也可以是各个处理单元物理存在，也可以两个或两个以上处理单元集成在一个功能模块中。

结合附图和具体实施例，对本发明作进一步说明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所限定的范围。

Claims

1.一种基于多模型融合的广告标签分类方法，其特征在于，包括如下步骤：

S1：使用目标检测模型对预设广告内容进行检测，得出对应的文本，人工对所述文本进行情感分类并标注，生成广告视频和情感分类的间接映射作为数据集；

S2：使用第一学习模型训练数据集，生成情感分类模型；

2.根据权利要求1所述的基于多模型融合的广告标签分类方法，其特征在于，所述目标检测模型具体为：在COCO数据集中加入预设广告数据集作为基础数据集，使用Yolo神经网络训练基础数据集生成的深度学习模型。

3.根据权利要求1所述的基于多模型融合的广告标签分类方法，其特征在于，所述第一学习模型采用基于BERT变种的神经网络。

4.根据权利要求1所述的基于多模型融合的广告标签分类方法，其特征在于，所述第二学习模型采用TextRank为基础的文本分析模型。

5.根据权利要求1所述的基于多模型融合的广告标签分类方法，其特征在于，所述步骤S4之后还包括：

6.根据权利要求1所述的基于多模型融合的广告标签分类方法，其特征在于，所述步骤S5具体为：

7.一种基于多模型融合的广告标签分类系统，其特征在于，包括：

数据集准备单元，用于使用目标检测模型对预设广告内容进行检测，得出对应的文本，人工对所述文本进行情感分类并标注，生成广告视频和情感分类的间接映射作为数据集；

8.一种基于多模型融合的广告标签分类设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至6任一项所述基于多模型融合的广告标签分类方法步骤。