CN106447366B - 多媒体广告的审核方法、广告审核模型的训练方法及装置 - Google Patents

多媒体广告的审核方法、广告审核模型的训练方法及装置 Download PDF

Info

Publication number
CN106447366B
CN106447366B CN201510484670.XA CN201510484670A CN106447366B CN 106447366 B CN106447366 B CN 106447366B CN 201510484670 A CN201510484670 A CN 201510484670A CN 106447366 B CN106447366 B CN 106447366B
Authority
CN
China
Prior art keywords
data
advertisement
multimedia
multimedia advertisement
auditing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510484670.XA
Other languages
English (en)
Other versions
CN106447366A (zh
Inventor
邓玥琳
刘辉
罗祥凤
黄浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510484670.XA priority Critical patent/CN106447366B/zh
Publication of CN106447366A publication Critical patent/CN106447366A/zh
Application granted granted Critical
Publication of CN106447366B publication Critical patent/CN106447366B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明实施例提供一种多媒体广告的审核方法、广告审核模型的训练方法及装置。所述多媒体广告的审核方法包括:获取待审核的多媒体广告数据;获取发布所述多媒体广告数据的商户的属性信息,并且根据预先训练的广告数据分类模型获取所述多媒体广告数据的特征数据;将所述属性信息和所述特征数据输入预设的广告审核模型,得到所述多媒体广告数据是否通过审核的审核结果。本发明提供的多媒体广告的审核方法、广告审核模型的训练方法及装置,实现了多媒体广告的自动审核,提高了多媒体广告的审核质量和审核效率。

Description

多媒体广告的审核方法、广告审核模型的训练方法及装置
技术领域
本发明涉及图像处理技术领域,尤其涉及一种多媒体广告的审核方法、广告审核模型的训练方法及装置。
背景技术
随着计算机技术和互联网技术的快速发展,互联网上的各种多媒体广告层出不穷。
现有技术中多媒体广告的审核工作还是依赖于人工完成的,但由于互联网上多媒体广告数量的极速增加,这给多媒体广告的审核工作带来了巨大的压力。例如,由于人工审核多媒体广告的效率较低,这造成很多商户的多媒体广告不能得到及时审核,延误多媒体广告的投放;又如,由于多媒体广告数量巨大,人工审核的时候为追求效率,对多媒体广告的审核就会放松,影响多媒体广告的审核质量。
发明内容
本发明的目的在于提供一种多媒体广告的审核方法、广告审核模型的训练方法及装置,以实现多媒体广告的自动审核,提高多媒体广告的审核质量和审核效率。
根据本发明的一方面,本发明提供一种多媒体广告的审核方法,所述方法包括:获取待审核的多媒体广告数据;获取发布所述多媒体广告数据的商户的属性信息,并且根据预先训练的广告数据分类模型获取所述多媒体广告数据的特征数据;将所述属性信息和所述特征数据输入预设的广告审核模型,得到所述多媒体广告数据是否通过审核的审核结果。
可选地,所述预先训练的广告数据分类模型包括预先训练的图像广告数据分类模型,所述根据预先训练的广告数据分类模型获取所述多媒体广告数据的特征数据的处理包括:将所述多媒体广告数据输入所述图像广告数据分类模型,获取所述多媒体广告数据记录的图像实体的数据;所述将所述属性信息和所述特征数据输入预设的广告审核模型,得到所述多媒体广告数据是否通过审核的审核结果的处理包括:将所述属性信息和所述图像实体的数据输入预设的广告审核模型,得到所述多媒体广告数据是否通过审核的审核结果。
可选地,所述预先训练的广告数据分类模型包括预先训练的图像广告数据分类模型还包括预先训练的文字广告数据分类模型,所述根据预先训练的广告数据分类模型获取所述多媒体广告数据的特征数据的处理还包括:将所述多媒体广告数据输入所述文字广告数据分类模型,获取所述多媒体广告数据记录的文字特征数据;所述将所述属性信息和所述特征数据输入预设的广告审核模型,得到所述多媒体广告数据是否通过审核的审核结果的处理包括:将所述属性信息、所述图像实体的数据和所述文字特征数据输入预设的广告审核模型,得到所述多媒体广告数据是否通过审核的审核结果。
可选地,在所述多媒体广告为动态图像时,所述获取待审核的多媒体广告数据的处理包括:将所述多媒体广告数据解析为多张图片的数据;从所述多张图片的数据中选取一张图片的数据作为所述待审核的多媒体广告数据。
可选地,所述属性信息包括所述商户的行业特征、资质特征和登录页特征当中的至少一个。
根据本发明的另一方面,本发明还提供一种广告审核模型的训练方法,所述方法包括:获取标注有审核结果的多个多媒体广告训练样本数据,所述审核结果为通过或拒绝;分别获取发布所述多个多媒体广告训练样本数据的商户的属性信息,并且根据预先训练的广告数据分类模型获取所述多个多媒体广告训练样本数据的特征数据;对已获取所述商户的属性信息和所述特征数据的多个多媒体广告训练样本数据进行训练,得到所述广告审核模型。
可选地,所述预先训练的广告数据分类模型包括预先训练的图像广告数据分类模型,所述根据预先训练的广告数据分类模型获取所述多个多媒体广告训练样本数据的特征数据的处理包括:分别将任一多媒体广告训练样本数据输入所述图像广告数据分类模型,获取该多媒体广告训练样本数据记录的图像实体的数据;所述对已获取所述商户的属性信息和所述特征数据的多个多媒体广告训练样本数据进行训练,得到所述广告审核模型的处理包括:对已获取所述商户的属性信息和所述图像实体的数据的多个多媒体广告训练样本数据进行训练,得到所述广告审核模型。
可选地,所述预先训练的广告数据分类模型包括预先训练的图像广告数据分类模型还包括预先训练的文字广告数据分类模型,所述根据预先训练的广告数据分类模型获取所述多个多媒体广告训练样本数据的特征数据的处理还包括:分别将任一多媒体广告训练样本数据输入所述文字广告数据分类模型,获取该多媒体广告训练样本数据记录的文字特征数据;所述对已获取所述商户的属性信息和所述特征数据的多个多媒体广告训练样本数据进行训练,得到所述广告审核模型的处理包括:对已获取所述商户的属性信息、所述图像实体的数据和所述文字特征数据的多个多媒体广告训练样本数据进行训练,得到所述广告审核模型。
可选地,所述方法还包括:获取被标注为审核结果不确定的多个多媒体广告数据;所述对已获取所述商户的属性信息和所述特征数据的多个多媒体广告训练样本数据进行训练,得到所述广告审核模型的处理包括:对由已获取所述商户的属性信息和所述特征数据的多个多媒体广告训练样本数据、以及所述多个多媒体广告数据构成的训练样本集进行训练,得到所述广告审核模型。
根据本发明的另一方面,本发明还提供一种多媒体广告的审核装置,所述装置包括:多媒体广告数据获取单元,用于获取待审核的多媒体广告数据;属性信息和特征数据获取单元,用于获取发布所述多媒体广告数据的商户的属性信息,并且根据预先训练的广告数据分类模型获取所述多媒体广告数据的特征数据;多媒体广告数据审核单元,用于将所述属性信息和所述特征数据输入预设的广告审核模型,得到所述多媒体广告数据是否通过审核的审核结果。
可选地,所述预先训练的广告数据分类模型包括预先训练的图像广告数据分类模型,所述属性信息和特征数据获取单元用于将所述多媒体广告数据输入所述图像广告数据分类模型,获取所述多媒体广告数据记录的图像实体的数据;所述多媒体广告数据审核单元用于将所述属性信息和所述图像实体的数据输入预设的广告审核模型,得到所述多媒体广告数据是否通过审核的审核结果。
可选地,所述预先训练的广告数据分类模型包括预先训练的图像广告数据分类模型还包括预先训练的文字广告数据分类模型,所述属性信息和特征数据获取单元还用于将所述多媒体广告数据输入所述文字广告数据分类模型,获取所述多媒体广告数据记录的文字特征数据;所述多媒体广告数据审核单元用于将所述属性信息、所述图像实体的数据和所述文字特征数据输入预设的广告审核模型,得到所述多媒体广告数据是否通过审核的审核结果。
可选地,在所述多媒体广告为动态图像时,所述多媒体广告数据获取单元包括:多媒体广告数据解析子单元,用于将所述多媒体广告数据解析为多张图片的数据;多媒体广告数据获取子单元,用于从所述多张图片的数据中选取一张图片的数据作为所述待审核的多媒体广告数据。
可选地,所述属性信息包括所述商户的行业特征、资质特征和登录页特征当中的至少一个。
根据本发明的另一方面,本发明还提供一种广告审核模型的训练装置,所述装置包括:训练样本数据获取单元,用于获取标注有审核结果的多个多媒体广告训练样本数据,所述审核结果为通过或拒绝;属性信息和特征数据获取单元,用于分别获取发布所述多个多媒体广告训练样本数据的商户的属性信息,并且根据预先训练的广告数据分类模型获取所述多个多媒体广告训练样本数据的特征数据;广告审核模型获得单元,用于对已获取所述商户的属性信息和所述特征数据的多个多媒体广告训练样本数据进行训练,得到所述广告审核模型。
可选地,所述预先训练的广告数据分类模型包括预先训练的图像广告数据分类模型,所述属性信息和特征数据获取单元用于分别将任一多媒体广告训练样本数据输入所述图像广告数据分类模型,获取该多媒体广告训练样本数据记录的图像实体的数据;所述广告审核模型获得单元用于对已获取所述商户的属性信息和所述图像实体的数据的多个多媒体广告训练样本数据进行训练,得到所述广告审核模型。
可选地,所述预先训练的广告数据分类模型包括预先训练的图像广告数据分类模型还包括预先训练的文字广告数据分类模型,所述属性信息和特征数据获取单元还用于分别将任一多媒体广告训练样本数据输入所述文字广告数据分类模型,获取该多媒体广告训练样本数据记录的文字特征数据;所述广告审核模型获得单元用于对已获取所述商户的属性信息、所述图像实体的数据和所述文字特征数据的多个多媒体广告训练样本数据进行训练,得到所述广告审核模型。
可选地,所述装置还包括:多媒体广告数据获取单元,用于获取被标注为审核结果不确定的多个多媒体广告数据;所述广告审核模型获得单元用于对由已获取所述商户的属性信息和所述特征数据的多个多媒体广告训练样本数据、以及所述多个多媒体广告数据构成的训练样本集进行训练,得到所述广告审核模型。
本发明实施例所提供的多媒体广告的审核方法、广告审核模型的训练方法及装置,根据预先训练的广告数据分类模型获取待审核的多媒体广告数据的特征数据,并将所述特征数据和发布所述多媒体广告数据的商户的属性信息输入预设的广告审核模型,得到所述多媒体广告数据是否通过审核的审核结果。本发明的技术方案实现了多媒体广告的自动审核,提高了多媒体广告的审核质量和审核效率。
附图说明
图1是示出本发明示例性实施例的广告审核模型的训练方法的流程示意图;
图2是示出训练广告审核模型的示意图;
图3是示出本发明示例性实施例的多媒体广告的审核方法的流程示意图;
图4是示出待审核的多媒体广告图片的示意图;
图5是示出本发明示例性实施例的广告审核模型的训练装置的结构示意图;
图6是示出本发明示例性实施例的多媒体广告的审核装置的结构示意图。
具体实施方式
为解决目前人工审核多媒体广告效率低下和审核质量难以保证的问题,本发明提供一种多媒体广告的审核方法、广告审核模型的训练方法以及实现上述方法的装置,用于根据预先训练的广告数据分类模型获取待审核的多媒体广告数据的特征数据,并将特征数据和发布多媒体广告数据的商户的属性信息输入预设的广告审核模型,得到多媒体广告数据是否通过审核的审核结果,从而实现多媒体广告的自动审核,同时提高多媒体广告的审核质量和审核效率。
下面结合附图对本发明示例性实施例的多媒体广告的审核方法、广告审核模型的训练方法及装置进行详细描述。
实施例一
图1是示出本发明示例性实施例广告审核模型的训练方法的流程图。
参照图1,在步骤S110,获取标注有审核结果的多个多媒体广告训练样本数据,审核结果为通过或拒绝。
由于目前人工已经审核一部分多媒体广告,所以可以从这部分多媒体广告中筛选出部分多媒体广告作为标注有审核结果的多个多媒体广告训练样本数据。
为了从已进行过审核的多媒体广告中批量筛选出训练样本,步骤S110的处理可包括:首先分别对人工审核结果为通过和拒绝的多个多媒体广告数据进行分类;然后根据人工审核结果和分类结果统计各类多媒体广告数据的通过占比分布和拒绝占比分布;最后将通过占比超过第一比例和拒绝占比超过第二比例的类别的多媒体广告数据作为多个多媒体广告训练样本数据。其中,第一比例和第二比例可以相同也可以不同,第一比例和第二比例的大小可根据实际需要确定,例如,可根据广告审核模型最终审核多媒体广告的质量确定,也可根据筛选出的多个多媒体广告训练样本数据占人工审核的多媒体广告的比例确定。
为方便理解上述筛选标注有审核结果的多个多媒体广告训练样本数据的过程,下面我们举一个具体实例进行说明。
具体地,人工审核结果为通过的各类多媒体广告数据的通过占比分布如表1所示。
表1 多媒体广告数据的通过占比分布
多媒体广告数据类型 通过占比
风景 99.21%
机械 99.21%
建筑 97.48%
植物 96.56%
……
人工审核结果为拒绝的各类多媒体广告数据的拒绝占比分布如表2所示。
表2 多媒体广告数据的拒绝占比分布
多媒体广告数据类型 拒绝占比
医生护士 83.51%
器官病理图 46.05%
成人用品 41.89%
低俗 40.01%
……
然后,我们可以将通过占比超过96.56%和拒绝占比超过40.01%的多媒体广告数据作为多个多媒体广告训练样本数据。
在步骤S120,分别获取发布多个多媒体广告训练样本数据的商户的属性信息,并且根据预先训练的广告数据分类模型获取多个多媒体广告训练样本数据的特征数据。
具体地,该步骤中的商户的属性信息可包括商户的行业特征、资质特征和登录页特征当中的至少一个。其中,行业特征可包括所属行业、行业对应的风险等级等信息;资质特征可包括资质图片的真实性特征、官方数据合法性特征等信息;登录页特征可包括登录页内容的特征等信息。此外,商户的属性信息还可包括客户信誉特征、消费特征和/或风险行为特征等等。
多个多媒体广告训练样本数据的特征数据可包括利用预先训练的广告数据分类模型从多个多媒体广告训练样本数据中的获取的图像实体的数据。此外,当相应的多媒体广告中包含文字时,特征数据还可包括利用预先训练的广告数据分类模型从多个多媒体广告训练样本数据中的获取的文字特征数据。其中,在获取图像实体的数据和文字特征数据时可分别训练相应的广告数据分类模型,后续将会对具体的模型训练过程做详细的说明,这里不再赘述。
需要说明的是,在获取多个多媒体广告训练样本数据的特征数据时,也可以不经过预先训练的广告数据分类模型通过多个多媒体广告训练样本数据的人工标注历史直接获得。
在步骤S130,对已获取商户的属性信息和特征数据的多个多媒体广告训练样本数据进行训练,得到广告审核模型。
可选地,在本发明具体实施中,可利用卷积神经网络或深度神经网络对已获取商户的属性信息和特征数据的多个多媒体广告训练样本数据进行训练,得到广告审核模型。
本发明实施例所提供的广告审核模型的训练方法,根据预先训练的广告数据分类模型获取多个多媒体广告训练样本数据的特征数据,并对特征数据和发布多个多媒体广告训练样本数据的商户的属性信息已知的多个多媒体广告训练样本数据进行训练,得到广告审核模型。利用该广告审核模型审核属性信息和特征数据已知的多媒体广告数据时,审核结果较为准确,审核结果的质量较高。
如前,在获取图像实体的数据和文字特征数据时可分别训练相应的广告数据分类模型,具体地,预先训练的广告数据分类模型可包括预先训练的图像广告数据分类模型和/或预先训练的文字广告数据分类模型。
其中,预先训练的图像广告数据分类模型的训练处理可包括:获取由已标注图像实体的数据的多个多媒体广告数据构成的训练样本集;利用卷积神经网络或深度神经网络对训练样本集进行训练,得到图像广告数据分类模型。其中,已标注的图像实体的数据即为多媒体广告数据的类别,具体可以是风景、机械、医生或低俗等等。预先训练的文字广告数据分类模型的训练处理可包括:获取由已标注文字特征数据的多个多媒体广告数据构成的训练样本集;利用卷积神经网络或深度神经网络对训练样本集进行训练,得到文字广告数据分类模型。
优选地,当预先训练的广告数据分类模型包括预先训练的图像广告数据分类模型时,根据预先训练的广告数据分类模型获取多个多媒体广告训练样本数据的特征数据的处理可包括:分别将任一多媒体广告训练样本数据输入图像广告数据分类模型,获取该多媒体广告训练样本数据记录的图像实体的数据。进一步地,步骤S130的处理可包括:对已获取商户的属性信息和图像实体的数据的多个多媒体广告训练样本数据进行训练,得到广告审核模型。为方便后续描述,将该广告审核模型定义为第一广告审核模型。进一步地,当预先训练的广告数据分类模型除包括预先训练的图像广告数据分类模型之外还包括预先训练的文字广告数据分类模型时,根据预先训练的广告数据分类模型获取多个多媒体广告训练样本数据的特征数据的处理还可包括:分别将任一多媒体广告训练样本数据输入文字广告数据分类模型,获取该多媒体广告训练样本数据记录的文字特征数据。进一步地,步骤S130的处理可包括:对已获取商户的属性信息、图像实体的数据和文字特征数据的多个多媒体广告训练样本数据进行训练,得到广告审核模型。为方便后续描述,将该广告审核模型定义为第二广告审核模型。
可选地,广告审核模型的训练方法还可包括:获取被标注为审核结果不确定的多个多媒体广告数据。进一步地,步骤S130的处理可包括:对由已获取商户的属性信息和特征数据的多个多媒体广告训练样本数据、以及多个多媒体广告数据构成的训练样本集进行训练,得到广告审核模型。为方便后续描述,将该广告审核模型定义为第三广告审核模型。
为方便理解,下面我们举一个的广告审核模型的训练实例对广告审核模型的训练过程加以说明。
如图2所示,图2是示出训练广告审核模型的示意图。具体地,首先将标注有审核结果的多个多媒体广告训练样本数据输入前述利用深度神经网络预先训练的广告数据分类模型,获取多个多媒体广告训练样本数据的多媒体特征(即特征数据),进一步地,利用相应模块获取多个多媒体广告训练样本数据的资质特征、行业特征和登录页特征等商户的属性信息,将多媒体特征和属性信息已知的多媒体广告训练样本数据利用卷积神经网络进行训练,得到广告审核模型。
实施例二
图3是示出本发明示例性实施例多媒体广告的审核方法的流程示意图。
参照图3,在步骤S310,获取待审核的多媒体广告数据。
具体地,待审核的多媒体广告数据来自于预发布多媒体广告的商户。多媒体广告的展现形式为图片、动态图像(例如Flash动画)等形式,同时图片和动态图像中可以有必要的文字说明。
在多媒体广告为动态图像时,获取待审核的多媒体广告数据的处理可包括:将多媒体广告数据解析为多张图片的数据;从多张图片的数据中选取一张图片的数据作为待审核的多媒体广告数据。此外,对Flash动画,还可从其提取文字内容的信息。
为方便理解,下面以一个具体的实例对本发明的技术方案予以说明。
具体地,在本步骤中,通过读取图4所示的图片获取的图片相关数据作为待审核的多媒体广告数据。其中,通过读取图片获取图片相关数据的方法属于现有技术,这里不再赘述。
在步骤S320,获取发布多媒体广告数据的商户的属性信息,并且根据预先训练的广告数据分类模型获取多媒体广告数据的特征数据。
可选地,商户的属性信息与训练实施例一中的广告审核模型时获取的商户的属性信息一致,可包括商户的行业特征、资质特征和登录页特征当中的至少一个。具体地,行业特征可包括所属行业、行业对应的风险等级等信息;资质特征可包括资质图片的真实性特征、官方数据合法性特征等信息;登录页特征可包括登录页内容的特征等信息。此外,商户的属性信息还可包括客户信誉特征、消费特征和/或风险行为特征等等。
在本步骤中,获取的属性信息包括图4所对应商户的资质特征、行业特征、登录页特征、客户信誉特征和风险行为特征。其中,资质特征为:携程旅游信息技术(上海)有限公司,资质图片真实,具备官方数据备案,风险较低;行业特征为:旅游,风险不高;登录页特征为:登录页内容合法,未违反国家法规,风险较低;客户信誉特征为:客户信誉良好;风险行为特征为:违规记录较少。获取的特征数据为图4的图像实体的数据,具体为风景。
在步骤S330,将属性信息和特征数据输入预设的广告审核模型,得到多媒体广告数据是否通过审核的审核结果。
其中,这里的广告审核模型即为实施例一中训练得到的广告审核模型。实施例一中不同的广告审核模型的审核结果不同。例如,第一广告审核模型和第二广告审核模型的审核结果为通过或拒绝;第三广告审核模型的审核结果为通过、拒绝或不确定。
在本步骤中,将步骤S320中获取的属性信息和特征数据输入预设的广告审核模型后,发现图4所对应商户的登录页特征、客户信誉特征和风险行为特征均符合审核通过的要求,且图4所对应商户的资质特征、行业特征与获取的特征数据有较高的相关度,所以图4所示的多媒体广告图片的审核结果为通过。
本发明实施例所提供的多媒体广告的审核方法,根据预先训练的广告数据分类模型获取待审核的多媒体广告数据的特征数据,并将特征数据和发布多媒体广告数据的商户的属性信息输入预设的广告审核模型,得到多媒体广告数据是否通过审核的审核结果。本发明的技术方案实现了多媒体广告的自动审核,提高了多媒体广告的审核质量和审核效率。
可选地,预先训练的广告数据分类模型可包括预先训练的图像广告数据分类模型,根据预先训练的广告数据分类模型获取多媒体广告数据的特征数据的处理可包括:将多媒体广告数据输入图像广告数据分类模型,获取多媒体广告数据记录的图像实体的数据。进一步地,步骤S330的处理可包括:将属性信息和图像实体的数据输入预设的广告审核模型,得到多媒体广告数据是否通过审核的审核结果。
其中,预先训练的图像广告数据分类模型与实施例一中的图像广告数据分类模型相同,这里不再赘述其训练方式。
可选地,预先训练的广告数据分类模型包括预先训练的图像广告数据分类模型还可包括预先训练的文字广告数据分类模型,根据预先训练的广告数据分类模型获取多媒体广告数据的特征数据的处理还可包括:将多媒体广告数据输入文字广告数据分类模型,获取多媒体广告数据记录的文字特征数据。进一步地,步骤S330的处理可包括:将属性信息、图像实体的数据和文字特征数据输入预设的广告审核模型,得到多媒体广告数据是否通过审核的审核结果。
其中,预先训练的文字广告数据分类模型与实施例一中的文字广告数据分类模型相同,这里不再赘述其训练方式。
实施例三
图5是示出本发明示例性实施例广告审核模型的训练装置的结构示意图。
参照图5,本发明实施例的广告审核模型的训练装置可执行实施例一的广告审核模型的训练方法。本发明实施例的广告审核模型的训练装置可包括:训练样本数据获取单元510、属性信息和特征数据获取单元520和广告审核模型获得单元530。
训练样本数据获取单元510用于获取标注有审核结果的多个多媒体广告训练样本数据,审核结果为通过或拒绝;
属性信息和特征数据获取单元520用于分别获取发布多个多媒体广告训练样本数据的商户的属性信息,并且根据预先训练的广告数据分类模型获取多个多媒体广告训练样本数据的特征数据;
广告审核模型获得单元530用于对已获取商户的属性信息和特征数据的多个多媒体广告训练样本数据进行训练,得到广告审核模型。
本发明实施例所提供的广告审核模型的训练装置,根据预先训练的广告数据分类模型获取多个多媒体广告训练样本数据的特征数据,并对特征数据和发布多个多媒体广告训练样本数据的商户的属性信息已知的多个多媒体广告训练样本数据进行训练,得到广告审核模型。利用该广告审核模型审核属性信息和特征数据已知的多媒体广告数据时,审核结果较为准确,审核结果的质量较高。
可选地,预先训练的广告数据分类模型包括预先训练的图像广告数据分类模型,属性信息和特征数据获取单元520用于分别将任一多媒体广告训练样本数据输入图像广告数据分类模型,获取该多媒体广告训练样本数据记录的图像实体的数据;广告审核模型获得单元530用于对已获取商户的属性信息和图像实体的数据的多个多媒体广告训练样本数据进行训练,得到广告审核模型。
可选地,预先训练的广告数据分类模型包括预先训练的图像广告数据分类模型还包括预先训练的文字广告数据分类模型,属性信息和特征数据获取单元520还用于分别将任一多媒体广告训练样本数据输入文字广告数据分类模型,获取该多媒体广告训练样本数据记录的文字特征数据;广告审核模型获得单元530用于对已获取商户的属性信息、图像实体的数据和文字特征数据的多个多媒体广告训练样本数据进行训练,得到广告审核模型。
可选地,广告审核模型的训练装置还可包括:多媒体广告数据获取单元,用于获取被标注为审核结果不确定的多个多媒体广告数据;广告审核模型获得单元530用于对由已获取商户的属性信息和特征数据的多个多媒体广告训练样本数据、以及多个多媒体广告数据构成的训练样本集进行训练,得到广告审核模型。
实施例四
图6是示出本发明示例性实施例多媒体广告的审核装置的结构示意图。
参照图6,本发明实施例的多媒体广告的审核装置可执行实施例二的多媒体广告的审核方法。本发明实施例的多媒体广告的审核装置可包括:多媒体广告数据获取单元610、属性信息和特征数据获取单元620和多媒体广告数据审核单元630。
多媒体广告数据获取单元610用于获取待审核的多媒体广告数据。
属性信息和特征数据获取单元620用于获取发布多媒体广告数据的商户的属性信息,并且根据预先训练的广告数据分类模型获取多媒体广告数据的特征数据。
多媒体广告数据审核单元630用于将属性信息和特征数据输入预设的广告审核模型,得到多媒体广告数据是否通过审核的审核结果。
本发明实施例所提供的多媒体广告的审核装置,根据预先训练的广告数据分类模型获取待审核的多媒体广告数据的特征数据,并将特征数据和发布多媒体广告数据的商户的属性信息输入预设的广告审核模型,得到多媒体广告数据是否通过审核的审核结果。本发明的技术方案实现了多媒体广告的自动审核,提高了多媒体广告的审核质量和审核效率。
可选地,预先训练的广告数据分类模型可包括预先训练的图像广告数据分类模型,属性信息和特征数据获取单元620用于将多媒体广告数据输入图像广告数据分类模型,获取多媒体广告数据记录的图像实体的数据;多媒体广告数据审核单元630用于将属性信息和图像实体的数据输入预设的广告审核模型,得到多媒体广告数据是否通过审核的审核结果。
可选地,预先训练的广告数据分类模型包括预先训练的图像广告数据分类模型还可包括预先训练的文字广告数据分类模型,属性信息和特征数据获取单元620还用于将多媒体广告数据输入文字广告数据分类模型,获取多媒体广告数据记录的文字特征数据;多媒体广告数据审核单元630用于将属性信息、图像实体的数据和文字特征数据输入预设的广告审核模型,得到多媒体广告数据是否通过审核的审核结果。
可选地,在多媒体广告为动态图像时,多媒体广告数据获取单元610可包括:多媒体广告数据解析子单元,用于将多媒体广告数据解析为多张图片的数据;多媒体广告数据获取子单元,用于从多张图片的数据中选取一张图片的数据作为待审核的多媒体广告数据。
可选地,属性信息可包括商户的行业特征、资质特征和登录页特征当中的至少一个。
需要指出,根据实施的需要,可将本申请中描述的各个步骤拆分为更多步骤,也可将两个或多个步骤或者步骤的部分操作组合成新的步骤,以实现本发明的目的。
上述根据本发明的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (6)

1.一种多媒体广告的审核方法,其特征在于,所述方法包括:
获取待审核的多媒体广告数据,所述多媒体广告数据包括:图像广告数据和文字广告数据;
获取发布所述多媒体广告数据的商户的属性信息,并将所述多媒体广告数据输入预先训练的图像广告数据分类模型,获取所述多媒体广告数据记录的图像实体的数据,以及将所述多媒体广告数据输入预先训练的文字广告数据分类模型,获取所述多媒体广告数据记录的文字特征数据,其中所述图像实体的数据为多媒体广告数据的类别,所述属性信息包括所述商户的行业特征、资质特征、登录页特征、客户信誉特征、消费特征和/或风险行为特征当中的至少一个;
将所述属性信息、所述图像实体的数据和所述文字特征数据输入预设的广告审核模型,得到所述多媒体广告数据是否通过审核的审核结果,所述审核结果为通过、拒绝或不确定。
2.根据权利要求1所述的方法,其特征在于,在所述多媒体广告为动态图像时,所述获取待审核的多媒体广告数据的处理包括:
将所述多媒体广告数据解析为多张图片的数据;
从所述多张图片的数据中选取一张图片的数据作为所述待审核的多媒体广告数据。
3.一种广告审核模型的训练方法,其特征在于,所述方法包括:
获取标注有审核结果的多个多媒体广告训练样本数据,所述审核结果为通过或拒绝;获取被标注为审核结果不确定的多个多媒体广告数据;所述多媒体广告训练样本数据和所述多个多媒体广告包括:图像广告训练样本数据和文字广告训练样本数据;
分别获取发布所述多个多媒体广告训练样本数据的商户的属性信息,并将任一多媒体广告训练样本数据输入图像广告数据分类模型,获取该多媒体广告训练样本数据记录的图像实体的数据,以及将任一多媒体广告训练样本数据输入文字广告数据分类模型,获取该多媒体广告训练样本数据记录的文字特征数据,其中所述图像广告数据分类模型是对获取的已标注图像实体的数据的多个多媒体广告数据进行训练得到的;所述文字广告数据分类模型是对获取的已标注文字特征数据的多个多媒体广告数据进行训练得到的,其中所述图像实体的数据为多媒体广告数据的类别,所述属性信息包括所述商户的行业特征、资质特征、登录页特征、客户信誉特征、消费特征和/或风险行为特征当中的至少一个;
对由已获取所述商户的属性信息、所述图像实体的数据和所述文字特征数据的多个多媒体广告训练样本数据、以及所述多个多媒体广告数据构成的训练样本集进行训练,得到所述广告审核模型。
4.一种多媒体广告的审核装置,其特征在于,所述装置包括:
多媒体广告数据获取单元,用于获取待审核的多媒体广告数据,所述多媒体广告数据包括:图像广告数据和文字广告数据;
属性信息和特征数据获取单元,用于获取发布所述多媒体广告数据的商户的属性信息,并将所述多媒体广告数据输入预先训练的图像广告数据分类模型,获取所述多媒体广告数据记录的图像实体的数据,以及将所述多媒体广告数据输入预先训练的文字广告数据分类模型,获取所述多媒体广告数据记录的文字特征数据,其中所述图像实体的数据为多媒体广告数据的类别,所述属性信息包括所述商户的行业特征、资质特征、登录页特征、客户信誉特征、消费特征和/或风险行为特征当中的至少一个;
多媒体广告数据审核单元,用于将所述属性信息、所述图像实体的数据和所述文字特征数据输入预设的广告审核模型,得到所述多媒体广告数据是否通过审核的审核结果。
5.根据权利要求4所述的装置,其特征在于,在所述多媒体广告为动态图像时,所述多媒体广告数据获取单元包括:
多媒体广告数据解析子单元,用于将所述多媒体广告数据解析为多张图片的数据;
多媒体广告数据获取子单元,用于从所述多张图片的数据中选取一张图片的数据作为所述待审核的多媒体广告数据。
6.一种广告审核模型的训练装置,其特征在于,所述装置包括:
训练样本数据获取单元,用于获取标注有审核结果的多个多媒体广告训练样本数据,所述审核结果为通过或拒绝;多媒体广告数据获取单元,用于获取被标注为审核结果不确定的多个多媒体广告数据;所述多媒体广告训练样本数据和所述多个多媒体广告包括:图像广告训练样本数据和文字广告训练样本数据;
属性信息和特征数据获取单元,用于分别获取发布所述多个多媒体广告训练样本数据的商户的属性信息,并将任一多媒体广告训练样本数据输入图像广告数据分类模型,获取该多媒体广告训练样本数据记录的图像实体的数据,以及将任一多媒体广告训练样本数据输入文字广告数据分类模型,获取该多媒体广告训练样本数据记录的文字特征数据,其中所述图像广告数据分类模型是对获取的已标注图像实体的数据的多个多媒体广告数据进行训练得到的;所述文字广告数据分类模型是对获取的已标注文字特征数据的多个多媒体广告数据进行训练得到的,其中所述图像实体的数据为多媒体广告数据的类别,所述属性信息包括所述商户的行业特征、资质特征、登录页特征、客户信誉特征、消费特征和/或风险行为特征当中的至少一个;
广告审核模型获得单元,用于对由已获取所述商户的属性信息、所述图像实体的数据和所述文字特征数据的多个多媒体广告训练样本数据、以及所述多个多媒体广告数据构成的训练样本集进行训练,得到所述广告审核模型。
CN201510484670.XA 2015-08-07 2015-08-07 多媒体广告的审核方法、广告审核模型的训练方法及装置 Active CN106447366B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510484670.XA CN106447366B (zh) 2015-08-07 2015-08-07 多媒体广告的审核方法、广告审核模型的训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510484670.XA CN106447366B (zh) 2015-08-07 2015-08-07 多媒体广告的审核方法、广告审核模型的训练方法及装置

Publications (2)

Publication Number Publication Date
CN106447366A CN106447366A (zh) 2017-02-22
CN106447366B true CN106447366B (zh) 2020-10-16

Family

ID=58092151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510484670.XA Active CN106447366B (zh) 2015-08-07 2015-08-07 多媒体广告的审核方法、广告审核模型的训练方法及装置

Country Status (1)

Country Link
CN (1) CN106447366B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679103B (zh) * 2017-09-08 2020-08-04 口碑(上海)信息技术有限公司 用于实体的属性分析方法及系统
CN107609906A (zh) * 2017-09-11 2018-01-19 四川创控智能科技股份有限公司 一种户外广告自动发布系统
CN107832765A (zh) * 2017-09-13 2018-03-23 百度在线网络技术(北京)有限公司 对包括文字内容和图像内容的图片识别
CN108230308B (zh) * 2017-12-29 2021-02-09 武汉璞华大数据技术有限公司 一种广告单校对方法、装置和设备
CN108280681A (zh) * 2018-01-16 2018-07-13 温州美渠传媒有限公司 一种基于互联网的广告投放系统
CN110580308B (zh) * 2018-05-22 2022-06-07 北京京东振世信息技术有限公司 信息审核方法及装置、电子设备、存储介质
CN111353626B (zh) * 2018-12-21 2023-05-26 阿里巴巴集团控股有限公司 数据的审核方法、装置及设备
CN111651981B (zh) * 2019-02-19 2023-04-21 阿里巴巴集团控股有限公司 数据的审核方法、装置及设备
CN112435035A (zh) * 2019-08-09 2021-03-02 阿里巴巴集团控股有限公司 数据的审核方法、装置及设备
CN110929055B (zh) * 2019-11-15 2023-05-02 北京达佳互联信息技术有限公司 多媒体质量检测方法、装置、电子设备及存储介质
CN111600922B (zh) * 2020-03-25 2023-08-15 平安银行股份有限公司 基于调节比例的请求发送方法、装置和计算机设备
CN114821378B (zh) * 2021-01-22 2024-02-23 百度在线网络技术(北京)有限公司 图像审核方法、装置、电子设备以及存储介质
CN116524394A (zh) * 2023-03-30 2023-08-01 北京百度网讯科技有限公司 视频检测方法、装置、设备以及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1797461A (zh) * 2004-12-23 2006-07-05 华为技术有限公司 一种广告业务信息发布系统及其发布方法
CN100541524C (zh) * 2008-04-17 2009-09-16 上海交通大学 基于内容的互联网动画媒体垃圾信息过滤方法
CN101887523B (zh) * 2010-06-21 2013-04-10 南京邮电大学 利用图片文字与局部不变特征检测图像垃圾邮件的方法
US8311973B1 (en) * 2011-09-24 2012-11-13 Zadeh Lotfi A Methods and systems for applications for Z-numbers
CN103310357A (zh) * 2012-03-13 2013-09-18 腾讯科技(深圳)有限公司 一种广告审核方法及系统

Also Published As

Publication number Publication date
CN106447366A (zh) 2017-02-22

Similar Documents

Publication Publication Date Title
CN106447366B (zh) 多媒体广告的审核方法、广告审核模型的训练方法及装置
CN107240047B (zh) 一种教学视频的学分评估方法和装置
Byun et al. Online crowdsourcing for efficient rating of speech: A validation study
CN108734184B (zh) 一种对敏感图像进行分析的方法及装置
US20170053213A1 (en) Method and system for filtering goods evaluation information
JP2016524259A (ja) 動的リサーチパネル
CN112102073A (zh) 信贷风险控制方法及系统、电子设备及可读存储介质
CN110532855A (zh) 基于深度学习的自然场景证件图像文字识别方法
CN106874443A (zh) 基于视频文本信息提取的信息查询方法以及装置
WO2015124024A1 (zh) 一种提升信息的曝光率的方法和装置、确定搜索词的价值的方法和装置
CN108509458A (zh) 一种业务对象识别方法及装置
CN114638777A (zh) 图像瑕疵检测方法、装置、电子设备及介质
CN106384316A (zh) 一种考试院实名制验证系统
CN104504104B (zh) 用于搜索引擎的图片物料处理方法、装置和搜索引擎
CN114639152A (zh) 基于人脸识别的多模态语音交互方法、装置、设备及介质
CN109660871A (zh) 一种弹幕角色信息确定方法、装置及设备
CN111967970B (zh) 基于spark平台的银行产品推荐方法及装置
CN112329814B (zh) 一种发票数据处理方法及设备
CN115292613A (zh) 线上帖评的内容滤差方法、系统和装置
CN114490929A (zh) 一种招投标信息采集方法、装置、存储介质及终端设备
CN112766824B (zh) 数据处理方法、装置、电子设备及存储介质
CN107463926B (zh) 一种艺术考试表演过程视频获取及处理方法
CN105868271A (zh) 一种姓名统计方法及装置
CN110619547A (zh) 确定网红商户的方法、装置、电子设备及存储介质
CN110992076A (zh) 商家质量评价方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant