CN112559740A - 一种基于多模型融合的广告标签分类方法、系统及设备 - Google Patents

一种基于多模型融合的广告标签分类方法、系统及设备 Download PDF

Info

Publication number
CN112559740A
CN112559740A CN202011393757.3A CN202011393757A CN112559740A CN 112559740 A CN112559740 A CN 112559740A CN 202011393757 A CN202011393757 A CN 202011393757A CN 112559740 A CN112559740 A CN 112559740A
Authority
CN
China
Prior art keywords
advertisement
model
emotion classification
classification
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011393757.3A
Other languages
English (en)
Inventor
冯希宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Star Media Ltd
Original Assignee
Star Media Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Star Media Ltd filed Critical Star Media Ltd
Priority to CN202011393757.3A priority Critical patent/CN112559740A/zh
Publication of CN112559740A publication Critical patent/CN112559740A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出的一种基于多模型融合的广告标签分类方法、系统及设备,一方面使用深度学习模型针对视频广告进行情感分析,得到视频广告的情感分类,另一方面使用深度学习模型对视频广告进行关键字的提取,关键字可以提取多个,将情感分类也加入到关键字中,将所有关键字进行权重处理,最后通过阈值控制进行精准的广告视频推荐,提升用户体验,提升广告的播放价值。

Description

一种基于多模型融合的广告标签分类方法、系统及设备
技术领域
本发明涉及图像分类识别技术领域,更具体的说是涉及一种基于多模型融合的广告标签分类方法、系统及设备。
背景技术
视频广告是指在移动设备内进行的插播视频的模式。视频广告分为传统视频广告和移动视频广告两类。传统视频广告是在视频内的广告进行设置和投放,而移动视频广告分为传统贴片广告和In-App视频广告。
随着网络技术和多媒体技术的快速发展,视频广告也随之快速发展,为了提高广告的播放价值,广告运营商需要收集大量的用户信息,比如用户的个人喜好、频繁搜索的关键字等信息,作为依据来判断用户关注的广告类别,进而实现广告的精准推送。
而实现广告的精准推送,关键在于对广告的情感分类和关键字的提取分类。目前,市面上的广告标签分类方法一般采用人工审核标注来实现广告的分类。采用人工进行广告的标签化处理,存在效率和准确率不高且过于主观的缺陷。
发明内容
针对以上问题,本发明的目的在于提供一种基于多模型融合的广告标签分类方法、系统及设备,能够自动进行广告的文本情感分类和关键词提取分类,为广告运营系统提供了精准的广告投放依据。
本发明为实现上述目的,通过以下技术方案实现:一种基于多模型融合的广告标签分类方法,包括如下步骤:
S1:使用目标检测模型对预设广告内容进行检测,得出对应的文本,人工对所述文本进行情感分类并标注,生成广告视频和情感分类的间接映射作为数据集;S2:使用第一学习模型训练数据集,生成情感分类模型;
S3:使用情感分类模型对待分类的广告进行情感分类预测,得到广告的内容情感分类结果,生成情感分类标签A和对应的概率a;
S4:使用第二学习模型对待分类的广告的文本进行关键词提取得到短语和自动摘要,根据短语生成关键字标签B和对应的概率b。
进一步,所述目标检测模型具体为:在COCO数据集中加入预设广告数据集作为基础数据集,使用Yolo神经网络训练基础数据集生成的深度学习模型。
进一步,所述第一学习模型采用基于BERT变种的神经网络。
进一步,所述第二学习模型采用TextRank为基础的文本分析模型。
进一步,所述步骤S4之后还包括:
S5:根据广告的情感分类标签A和对应的概率a、关键字标签B和对应的概率b组建广告标签系统。
进一步,所述步骤S5具体为:
提取所有广告的情感分类标签A和对应的概率a,以概率a的降序排列生成情感分类标签概率列表;
提取所有广告的关键字标签B和对应的概率b,以概率b的降序排列生成关键字标签概率列表。
相应的,本发明还公开了一种基于多模型融合的广告标签分类系统,包括:数据集准备单元,用于使用目标检测模型对预设广告内容进行检测,得出对应的文本,人工对所述文本进行情感分类并标注,生成广告视频和情感分类的间接映射作为数据集;
模型生成单元,用于使用第一学习模型训练数据集,生成情感分类模型;
第一分类单元,用于使用情感分类模型对待分类的广告进行情感分类预测,得到广告的内容情感分类结果,生成情感分类标签A和对应的概率a;
第二分类单元,用于使用第二学习模型对待分类的广告的文本进行关键词提取得到短语和自动摘要,根据短语生成关键字标签B和对应的概率b。
相应的,本发明还公开了一种基于多模型融合的广告标签分类设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文任一所述的基于多模型融合的广告标签分类方法步骤。
对比现有技术,本发明有益效果在于:本发明提供了一种基于多模型融合的广告标签分类方法、系统及设备,一方面使用深度学习模型针对视频广告进行情感分析,得到视频广告的情感分类,另一方面使用深度学习模型对视频广告进行关键字的提取,关键字可以提取多个,将情感分类也加入到关键字中,将所有关键字进行权重处理,最后通过阈值控制进行精准的广告视频推荐,提升用户体验,提升广告的播放价值。
本发明基于多模型融合,实现了文本情感分析分类与视频内容关键词提取的广告标签分类。具体来说:1、根据实际应用情况,对广告视频进行情感类文本标注,生成广告视频情感分类的数据集;2、文本分析得到多关键字,对关键字生成多标签与概率。3、多模型共同对视频进行标签化处理,得到标签权重与等级,用户可以根据实际需求进行标签的筛选,进而实现了广告的精准推送。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
附图1是本发明的方法流程图。
附图2是本发明的系统结构图。
具体实施方式
下面结合附图对本发明的具体实施方式做出说明。
如图1所示的一种基于多模型融合的广告标签分类方法,包括如下步骤:
S1:使用目标检测模型对预设广告内容进行检测,得出对应的文本,人工对所述文本进行情感分类并标注,生成广告视频和情感分类的间接映射作为数据集。
其中,目标检测模型为已经存在的COCO数据集和按照需求增加自己的数据集下使用Yolo(具体为Yolo v5)神经网络训练的深度学习模型。使用目标检测模型,能够检测出很多文本,人工对该文本进行情感标注,相当于我们使用目标检测模型制作我们自己需要的数据集。
S2:使用第一学习模型训练数据集,生成情感分类模型。
使用客观存在的基于BERT变种的神经网络训练步骤S1的数据集得到情感分类模型。
S3:使用情感分类模型对待分类的广告进行情感分类预测,得到广告的内容情感分类结果,生成情感分类标签A和对应的概率a。
S4:使用第二学习模型对待分类的广告的文本进行关键词提取得到短语和自动摘要,根据短语生成关键字标签B和对应的概率b。
其中,第二学习模型为以TextRank为基础的文本分析模型,使用第二学习模型推理得到短语和自动摘要,我们使用其中的短语作为关键字标签B和对应的概率b。
S5:根据广告的情感分类标签A和对应的概率a、关键字标签B和对应的概率b组建广告标签系统。
具体来说,首先,提取所有广告的情感分类标签A和对应的概率a,以概率a的降序排列生成情感分类标签概率列表。然后,提取所有广告的关键字标签B和对应的概率b,以概率b的降序排列生成关键字标签概率列表。
可见,情感分类标签概率列表和关键字标签概率列表都是k个概率由大到小的标签。例如一个视频的上述两个列表采用以下方式呈现:
A类概率和标签:
%90众志成城。
B类概率和标签:
%99抗疫;
%90医生。
一直往下排,取K个停止。
使用时,我们可以根据需要在上述列表中筛选出需要推送的视频,例如,在疫情阶段,播出A类95%以上正能量标签和B类概率80%以上关于抗疫标签视频;在中秋节期间,播出A类概率50%以上快乐标签和B类70%月饼的视频。
相应的,如图2所示,本发明还公开了一种基于多模型融合的广告标签分类系统,包括:
数据集准备单元,用于使用目标检测模型对预设广告内容进行检测,得出对应的文本,人工对所述文本进行情感分类并标注,生成广告视频和情感分类的间接映射作为数据集。
模型生成单元,用于使用第一学习模型训练数据集,生成情感分类模型。
第一分类单元,用于使用情感分类模型对待分类的广告进行情感分类预测,得到广告的内容情感分类结果,生成情感分类标签A和对应的概率a。
第二分类单元,用于使用第二学习模型对待分类的广告的文本进行关键词提取得到短语和自动摘要,根据短语生成关键字标签B和对应的概率b。
相应的,本发明还公开了一种基于多模型融合的广告标签分类设备,包括:存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文任一所述的基于多模型融合的广告标签分类方法步骤。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。
同理,在本发明各个实施例中的各处理单元可以集成在一个功能模块中,也可以是各个处理单元物理存在,也可以两个或两个以上处理单元集成在一个功能模块中。
结合附图和具体实施例,对本发明作进一步说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所限定的范围。

Claims (8)

1.一种基于多模型融合的广告标签分类方法,其特征在于,包括如下步骤:
S1:使用目标检测模型对预设广告内容进行检测,得出对应的文本,人工对所述文本进行情感分类并标注,生成广告视频和情感分类的间接映射作为数据集;
S2:使用第一学习模型训练数据集,生成情感分类模型;
S3:使用情感分类模型对待分类的广告进行情感分类预测,得到广告的内容情感分类结果,生成情感分类标签A和对应的概率a;
S4:使用第二学习模型对待分类的广告的文本进行关键词提取得到短语和自动摘要,根据短语生成关键字标签B和对应的概率b。
2.根据权利要求1所述的基于多模型融合的广告标签分类方法,其特征在于,所述目标检测模型具体为:在COCO数据集中加入预设广告数据集作为基础数据集,使用Yolo神经网络训练基础数据集生成的深度学习模型。
3.根据权利要求1所述的基于多模型融合的广告标签分类方法,其特征在于,所述第一学习模型采用基于BERT变种的神经网络。
4.根据权利要求1所述的基于多模型融合的广告标签分类方法,其特征在于,所述第二学习模型采用TextRank为基础的文本分析模型。
5.根据权利要求1所述的基于多模型融合的广告标签分类方法,其特征在于,所述步骤S4之后还包括:
S5:根据广告的情感分类标签A和对应的概率a、关键字标签B和对应的概率b组建广告标签系统。
6.根据权利要求1所述的基于多模型融合的广告标签分类方法,其特征在于,所述步骤S5具体为:
提取所有广告的情感分类标签A和对应的概率a,以概率a的降序排列生成情感分类标签概率列表;
提取所有广告的关键字标签B和对应的概率b,以概率b的降序排列生成关键字标签概率列表。
7.一种基于多模型融合的广告标签分类系统,其特征在于,包括:
数据集准备单元,用于使用目标检测模型对预设广告内容进行检测,得出对应的文本,人工对所述文本进行情感分类并标注,生成广告视频和情感分类的间接映射作为数据集;
模型生成单元,用于使用第一学习模型训练数据集,生成情感分类模型;
第一分类单元,用于使用情感分类模型对待分类的广告进行情感分类预测,得到广告的内容情感分类结果,生成情感分类标签A和对应的概率a;
第二分类单元,用于使用第二学习模型对待分类的广告的文本进行关键词提取得到短语和自动摘要,根据短语生成关键字标签B和对应的概率b。
8.一种基于多模型融合的广告标签分类设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述基于多模型融合的广告标签分类方法步骤。
CN202011393757.3A 2020-12-03 2020-12-03 一种基于多模型融合的广告标签分类方法、系统及设备 Pending CN112559740A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011393757.3A CN112559740A (zh) 2020-12-03 2020-12-03 一种基于多模型融合的广告标签分类方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011393757.3A CN112559740A (zh) 2020-12-03 2020-12-03 一种基于多模型融合的广告标签分类方法、系统及设备

Publications (1)

Publication Number Publication Date
CN112559740A true CN112559740A (zh) 2021-03-26

Family

ID=75047386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011393757.3A Pending CN112559740A (zh) 2020-12-03 2020-12-03 一种基于多模型融合的广告标签分类方法、系统及设备

Country Status (1)

Country Link
CN (1) CN112559740A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313344A (zh) * 2021-04-13 2021-08-27 武汉烽火众智数字技术有限责任公司 一种融合多模式的标签体系构建方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140250032A1 (en) * 2013-03-01 2014-09-04 Xerox Corporation Methods, systems and processor-readable media for simultaneous sentiment analysis and topic classification with multiple labels
CN110427480A (zh) * 2019-06-28 2019-11-08 平安科技(深圳)有限公司 个性化文本智能推荐方法、装置及计算机可读存储介质
WO2020125445A1 (zh) * 2018-12-18 2020-06-25 腾讯科技(深圳)有限公司 分类模型训练方法、分类方法、设备及介质
CN111538828A (zh) * 2020-04-21 2020-08-14 招商局金融科技有限公司 文本情感分析方法、装置、计算机装置及可读存储介质
CN111814453A (zh) * 2020-07-09 2020-10-23 重庆大学 基于BiLSTM-TextCNN的细粒度情感分析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140250032A1 (en) * 2013-03-01 2014-09-04 Xerox Corporation Methods, systems and processor-readable media for simultaneous sentiment analysis and topic classification with multiple labels
WO2020125445A1 (zh) * 2018-12-18 2020-06-25 腾讯科技(深圳)有限公司 分类模型训练方法、分类方法、设备及介质
CN110427480A (zh) * 2019-06-28 2019-11-08 平安科技(深圳)有限公司 个性化文本智能推荐方法、装置及计算机可读存储介质
CN111538828A (zh) * 2020-04-21 2020-08-14 招商局金融科技有限公司 文本情感分析方法、装置、计算机装置及可读存储介质
CN111814453A (zh) * 2020-07-09 2020-10-23 重庆大学 基于BiLSTM-TextCNN的细粒度情感分析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
史绍亮等: "中文微博情感分类的简单多标签排序算法", 《计算机应用》 *
陆枫等: "基于细粒度标签的在线视频广告投放机制研究", 《计算机研究与发展》 *
陶永才等: "面向短文本情感分析的多特征融合方法研究", 《小型微型计算机系统》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313344A (zh) * 2021-04-13 2021-08-27 武汉烽火众智数字技术有限责任公司 一种融合多模式的标签体系构建方法和系统

Similar Documents

Publication Publication Date Title
CN110020437B (zh) 一种视频和弹幕相结合的情感分析及可视化方法
Mazloom et al. Multimodal popularity prediction of brand-related social media posts
CN112533051B (zh) 弹幕信息显示方法、装置、计算机设备和存储介质
CN106649603B (zh) 一种基于网页文本数据情感分类的指定信息推送方法
CN107305557A (zh) 内容推荐方法及装置
US20130024457A1 (en) Automatic Frequently Asked Question Compilation From Community-Based Question Answering Archive
CN112257452B (zh) 情感识别模型的训练方法、装置、设备和存储介质
EP3872652A2 (en) Method and apparatus for processing video, electronic device, medium and product
CN112395420A (zh) 视频内容检索方法、装置、计算机设备及存储介质
CN109145301B (zh) 信息分类方法及装置、计算机可读存储介质
CN112699645B (zh) 语料标注方法、装置及设备
CN111930792A (zh) 数据资源的标注方法、装置、存储介质及电子设备
CN111324713A (zh) 对话自动回复方法、装置、存储介质和计算机设备
CN110569502A (zh) 一种违禁广告语的识别方法、装置、计算机设备及存储介质
CN112995690B (zh) 直播内容品类识别方法、装置、电子设备和可读存储介质
CN116415017B (zh) 基于人工智能的广告敏感内容审核方法及系统
CN111782793A (zh) 智能客服处理方法和系统及设备
CN113742592A (zh) 舆情信息推送方法、装置、设备及存储介质
CN112559740A (zh) 一种基于多模型融合的广告标签分类方法、系统及设备
CN111159377B (zh) 属性召回模型训练方法、装置、电子设备以及存储介质
CN110110202A (zh) 一种信息流推送方法及装置
CN113569741A (zh) 图像试题的答案生成方法、装置、电子设备及可读介质
CN113869043A (zh) 内容标注方法、装置、设备及存储介质
CN114067343A (zh) 一种数据集的构建方法、模型训练方法和对应装置
CN112949299A (zh) 新闻稿件的生成方法及装置、存储介质、电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210326