CN108269116A

CN108269116A - 一种广告安全监测方法和装置

Info

Publication number: CN108269116A
Application number: CN201611271143.1A
Authority: CN
Inventors: 李新国
Original assignee: Beijing Gridsum Technology Co Ltd
Current assignee: Beijing Gridsum Technology Co Ltd
Priority date: 2016-12-30
Filing date: 2016-12-30
Publication date: 2018-07-10

Abstract

本发明实施例公开了一种广告安全监测方法和装置，可以自动监测投放网络广告网页是否存在敏感信息，提高监测效率。本发明实施例方法包括：获取投放目标广告的网页；判断所述网页是否存在预置的敏感信息，所述敏感信息为对所述目标广告有负面影响的信息；若所述网页存在所述预置的敏感信息，则确定在所述网页上投放所述目标广告存在安全风险。

Description

一种广告安全监测方法和装置

技术领域

本发明涉及广告监测领域，尤其涉及一种广告安全监测方法和装置。

背景技术

网络广告就是在网络平台上投放的广告。网络广告利用网站上的广告横幅、文本信息链接、多媒体的方法，在互联网刊登或发布广告，通过网络传递到互联网用户的一种高科技广告运作方式。随着互联网的发展，通过网络投放广告已经成为一种常见的广告运作方式，同时也是一种重要的网络营销方式。

为了不给品牌造成负面的影响，投放网络广告的网页，不能出现给品牌带来负面影响的敏感信息，例如伊利牛奶的网络广告不能投放在有“毒奶粉”之类的词汇的网页上，现有技术中，通过人工监测来避免上述问题。

然而，网络广告投放的网页数量非常大，人工监测的方式效率很低。

发明内容

本发明实施例提供了一种广告安全监测方法和装置，可以自动监测网络广告投放的网页是否存在敏感信息，提高监测效率。

一方面，本发明实施例提供了一种广告安全监测方法，该方法包括：

获取投放目标广告的网页；

所述判断所述网页是否存在预置的敏感信息，所述敏感信息为对所述目标广告有负面影响的信息；

若所述网页存在所述预置的敏感信息，则确定在所述网页上投放所述目标广告存在安全风险。

在一些可能的实现方式中，所述获取投放目标广告的网页包括：

向广告投放平台发送所述目标广告的监测代码，所述监测代码用于获取投放所述目标广告的URL；

接收所述广告投放平台发送的投放所述目标广告的URL；

通过爬虫爬取并保存所述URL对应的网页。

在一些可能的实现方式中，所述方法还包括：

若所述网页存在所述预置的敏感信息，则对所述存在所述预置的敏感信息的数量进行计数；

若所述数量超过预设的数值，则触发报警功能。

在一些可能的实现方式中，所述网页上存在文本信息和/或包含文本信息的图片，所述敏感信息为敏感词汇，所述判断所述网页是否存在预置的敏感信息包括：

若所述网页的文本信息中存在所述预置的敏感词汇，则确定所述网页存在所述预置的敏感词汇；

和/或，通过OCR技术识别所述网页的图片中的文本信息；

若所述网页的图片中的文本信息存在所述预置的敏感词汇，则确定所述网页存在所述预置的敏感词汇。

在一些可能的实现方式中，所述方法还包括：

若所述网页存在所述预置的敏感词汇，则对所述网页进行截图保存。

在一些可能的实现方式中，所述敏感信息包括敏感词汇、敏感图片和敏感动画中的至少一种。

另一方面，本发明实施例还提供了一种广告监测装置，该广告监测装置包括：

获取单元，用于获取投放目标广告的网页；

判断单元，用于判断所述网页是否存在预置的敏感信息，所述敏感信息为对所述目标广告有负面影响的信息；

确定单元，用于若所述网页存在所述预置的敏感信息，则确定在所述网页上投放所述目标广告存在安全风险。

在一些可能的实现方式中，所述获取单元包括：

获取模块，用于向广告投放平台发送所述目标广告的监测代码，所述监测代码用于获取投放所述目标广告的URL；

接收模块，用于接收所述广告投放平台发送的投放所述目标广告的URL；

爬取模块，用于通过爬虫爬取并保存所述URL对应的网页。

在一些可能的实现方式中，所述广告监测装置还包括：

计数单元，用于若所述网页存在所述预置的敏感信息，则对所述存在所述预置的敏感信息的数量进行计数；

报警单元，用于若所述数量超过预设的数值，则触发报警功能。

在一些可能的实现方式中，所述网页上存在文本信息和/或包含文本信息的图片，所述敏感信息为敏感词汇，所述判断单元包括：

第一确定模块，用于若所述网页的文本信息中存在所述预置的敏感词汇，则确定所述网页存在所述预置的敏感词汇；

和/或，识别模块，用于通过OCR技术识别所述网页的图片中的文本信息；

第二确定模块，用于若所述网页的图片中的文本信息存在所述预置的敏感词汇，则确定所述网页存在所述预置的敏感词汇。

在一些可能的实现方式中，所述广告监测装置还包括：

截图单元，用于若所述网页存在所述预置的敏感信息，则对所述网页进行截图保存。

再一方面，本发明实施例还提供了一种广告监测装置，该广告监测装置包括：输入装置、输出装置、处理器和存储器；

通过调用所述存储器存储的操作指令，所述处理器用于执行如下步骤：

获取投放目标广告的网页；

判断所述网页是否存在预置的敏感信息，所述敏感信息为对所述目标广告有负面影响的信息；

从以上技术方案可以看出，本发明实施例具有以下优点：

获取投放目标广告的网页；判断所述网页是否存在预置的敏感信息，所述敏感信息为对所述目标广告有负面影响的信息；若所述网页存在所述预置的敏感信息，则确定在所述网页上投放所述目标广告存在安全风险。本发明实施例中，可以自动监测网络广告投放的网页是否存在敏感信息，提高监测效率。

附图说明

图1为本发明实施例广告安全监测方法的一个实施例流程图；

图2为本发明实施例广告安全监测方法的另一个实施例流程图；

图3是本发明实施例广告监测装置的一个实施例的结构示意图；

图4是本发明实施例广告监测装置的另一个实施例的结构示意图；

图5是本发明实施例广告监测装置的另一个实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

网络广告已成为一种重要的营销方式，为了不给品牌造成负面的影响，投放网络广告的网页，不能出现给品牌带来负面影响的敏感信息，例如伊利牛奶的网络广告不能投放在有“毒奶粉”之类的词汇的网页上，本发明实施例提供一种广告安全监测方法和装置，可以自动监测网络广告投放的网页是否存在敏感信息，提高监测效率。

请参阅图1，本发明实施例中广告安全监测方法的一个实施例包括：

101、获取投放目标广告的网页。

目标广告为需要监测的广告，为了宣传效果，目标广告将投发在各式各样的网页上，用户点击后可以链接到目标广告的页面。

本实施例中，执行主体可以是客户端设备，电脑，终端或服务器，或者是上述设备的组合等，此处不做太多限定。执行主体可以设置在广告投放商，也可以设置在厂家，或者设置在第三方的监测机构，此处不做太多限定。以下以执行主体为广告监测装置为例进行说明。

102、判断网页是否存在预置的敏感信息。

敏感信息为对目标广告有负面影响的信息，负面影响包括使用户对目标广告有不好的印象，进而影响到目标广告的效果等，敏感信息包括敏感词汇、敏感图片和敏感动画中的至少一种，例如“毒奶粉”属于伊利奶粉广告的敏感词汇。

另外，敏感信息可以是预置的目标广告的敏感信息，也可以是通用的敏感信息，例如涉及黄赌毒的文字、图片或动画属于通用的敏感信息，此处不做太多限定，此外，也可以根据目标广告的类型，从其他平台或设备获取敏感信息。下文中提到的敏感信息均使用相同的描述，不再赘述。

若网页存在预置的敏感信息，则执行步骤103，若网页不存在预置的敏感信息，则执行步骤104。

103、确定在网页上投放目标广告存在安全风险。

若网页存在预置的敏感信息，确定在所述网页上投放所述目标广告存在安全风险，即投放目标广告的网页将对目标广告造成负面影响。

104、执行其他操作。

若网页不存在预置的敏感信息，则执行其他操作，例如可以记录该网页不存在预置的敏感信息的结果，也可以不执行任何操作，此处不做太多限定。

本实施例中，获取投放目标广告的网页，判断网页是否存在预置的敏感信息，敏感信息为对目标广告有负面影响的信息，若网页存在预置的敏感信息，则确定在所述网页上投放所述目标广告存在安全风险。本实施例可以自动监测网络广告投放的网页是否存在敏感信息，提高监测效率。

请参阅图2，本发明实施例中广告安全监测方法的另一个实施例包括：

201、向广告投放平台发送目标广告的监测代码。

相应地，广告投放平台接收目标广告的监测代码。广告投放平台包括搜索引擎，各种广告联盟等，此处不做太多限定。

监测代码可以由广告监测装置自动生成，或由其他设备生成后发送给广告监测装置，此处不做太多限定。监测代码可以用于获取投放目标广告的URL。监测代码可以符合移动营销协会(MMA，mobile marketing association)的标准。

202、接收广告投放平台发送的投放目标广告的URL。

相应地，广告投放平台向广告监测装置发送投放目标广告的URL。广告投放平台接收目标广告的监测代码后，对广告进行曝光的同时触发监测代码，监测代码可以使广告投放平台将投放目标广告的URL发送给广告监测装置。

在一些可能的实现方式中，广告投放平台发送的内容除了目标广告的URL外，还可以包括目标广告的信息等。则需要从广告平台发送的内容中提取目标广告的URL，可以实时从广告平台发送的内容中提取目标广告的URL，也可以按照预置的时间间隔提取目标广告的URL，此处不做太多限定。

203、通过爬虫爬取并保存URL对应的网页。

网络爬虫是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本，也被称作蚂蚁、自动索引、模拟程序或者蠕虫。广告监测装置可以通过爬虫爬取并保存URL对应的网页。

需要说明的是，在爬取URL之前，还可以对URL进行去重处理，避免重复爬取。

204、判断网页是否存在预置的敏感信息。

以敏感信息为敏感词汇为例，可以通过网页的文本信息和/或图片判断网页是否存在预置的敏感信息。

若网页的文本信息中存在预置的敏感词汇，则确定网页存在预置的敏感词汇。

和/或，通过光学字符识别(OCR，Optical Character Recognition)技术识别网页的图片中的文本信息，若网页的图片中的文本信息存在预置的敏感词汇，则确定网页存在预置的敏感词汇。

另外，根据不同的广告类型，可以预置不同的敏感信息，在判断网页是否存在预置的敏感信息之前，可以先确定目标广告的类型，再根据广告的类型获取敏感信息，也可以根据目标广告的标识，获取预置的目标广告的敏感信息，此处不做太多限定。

若网页存在预置的敏感信息，则执行步骤205～208，若网页不存在预置的敏感信息，则执行步骤209。

205、确定在网页上投放所述目标广告存在安全风险。

步骤205与图1的步骤103类似，不再赘述。

206、对网页进行截图保存。

若网页存在预置的敏感信息，则对网页进行截图保存，可以是对整个网页进行截图保存，也可以只对含有敏感信息的特定区域进行截图，此处不做太多限定。

在一些可能的实现方式，也可以没有步骤206，若网页存在预置的敏感信息，直接执行步骤207。

207、对存在预置的敏感信息的数量进行计数。

若网页存在预置的敏感信息，则对存在预置的敏感信息的数量进行计数。

208、若存在预置的敏感信息的数量的数值超过预设的数值，则触发报警功能。

若网页的数值超过预设的数值，则触发报警功能，也可以设置为只要发现存在预置的敏感信息的网页则实时触发报警功能，此处不做太多限定。

此外，还可以通知广告投放平台在存在预置的敏感信息的网页下架目标广告。

还需要说明的是，步骤205～207不存在执行的先后顺序，也可以先执行步骤206，再执行步骤205和步骤207，此处不做限定。

209、执行其他操作。

步骤209与图1的步骤104类似，不再赘述。

本实施例中，可以自动监测网络广告投放的网页是否存在敏感信息，提高监测效率。其次，本实施例对于如何获取投放目标广告的网页和判断目标广告网页中是否存在敏感信息进行了细化，提供了多种实现方式，丰富了本发明实施例的实现方式。本实施例还可以在网页存在敏感信息的情况下，进行截图保存，以便保存证据，防止后续URL对应的网页内容有所改变。

为便于理解，下面结合具体的应用场景对本实施例进行描述：

A公司接受B公司的委托，为B公司在网络上投放一则关于婴儿奶粉的广告，以下称为目标广告，为了品牌安全，B公司要求目标广告不能投放在含有婴儿奶粉的负面报道的网页，并自定义了敏感词汇，包括“毒奶粉”、“假奶粉”、“大头奶粉”和“三聚氰胺”。A公司的广告监测装置获取目标广告的排期，目标广告以及敏感词汇，其中，敏感词汇除了上述B公司定义的四个敏感词汇外，广告监测装置通过判断目标广告的类型为食品，还额外加入了食品类型广告的通用敏感词汇，包括“中毒”、“邪教”、“不合格”等。广告监测装置生成监测代码，监测代码符合MMA标准。广告监测装置向广告联盟C公司的广告投放平台发送目标广告的排期、目标广告以及监测代码，监测代码可以使C公司的广告投放平台按照目标广告的排期投放目标广告时，实时向广告监测装置返回投放目标广告的URL和目标广告的信息。广告监测装置收到目标广告信息和投放目标广告的URL后，通过爬虫爬取投放目标广告的URL并保存URL对应的网页。然后，广告监测装置判断网页的文本信息是否存在敏感词汇，包括B公司预置的敏感词汇和通用敏感词汇，除此以外，广告监测装置使用OCR技术识别网页的图片的文本信息，并判断图片的文本信息是否存在敏感词汇，无论是网页文本信息还是网页图片的文本信息，只要其中之一存在敏感词汇，就判定该网页存在敏感词汇。广告监测装置对存在敏感词汇的网页进行截图保存和计数，当存在敏感词汇的网页数量达到预置的数值5时，广告监测装置将触发报警，在广告监测装置的屏幕上提示工作人员“目标广告投放的网页存在安全风险”，工作人员可以查看截图，并通知C公司进行整改。由此，达到了自动监测目标广告是否存在敏感信息的目的。

以上是对本发明实施例方法的实施例和本发明实施例应用场景的介绍，下面将从装置的角度对本发明实施例进行详细的说明。

请参阅图3，本发明实施例广告监测装置的一个实施例包括：

获取单元301，用于若网页存在所述预置的敏感信息，则确定在网页上投放所述目标广告存在安全风险，具体地，获取单元301可用于执行图1的步骤101，不再赘述。

判断单元302，用于判断网页是否存在预置的敏感信息，敏感信息为对目标广告有负面影响的信息，具体地，获取单元302可用于执行图1的步骤102，不再赘述。

确定单元303，用于若网页存在预置的敏感信息，则确定在网页上投放所述目标广告存在安全风险，具体地，确定单元303可用于执行图1的步骤103，不再赘述。

请参阅图4，本发明实施例广告监测装置的另一个实施例包括：

获取单元401，用于获取投放目标广告的网页，具体地，获取单元401包括：

发送模块4011，用于向广告投放平台发送目标广告的监测代码，监测代码用于获取投放目标广告的URL，具体地，发送模块4011可用于执行图2的步骤201，不再赘述；

接收模块4012，用于接收广告投放平台发送的投放目标广告的URL，具体地，接收模块4012可用于执行图2的步骤202，不再赘述。

爬取模块4013，用于通过爬虫爬取并保存URL对应的网页，具体地，接收模块4013可用于执行图2的步骤203，不再赘述。

判断单元402，用于判断网页是否存在预置的敏感信息，敏感信息为对目标广告有负面影响的信息，判断单元402可用于执行图2的步骤204，具体地，以敏感信息为敏感词汇为例，判断单元402可以包括：

第一确定模块，用于若网页的文本信息中存在预置的敏感词汇，则确定网页存在预置的敏感词汇；

和/或，识别模块，用于通过OCR技术识别网页的图片中的文本信息；

第二确定模块，用于若网页的图片中的文本信息存在预置的敏感词汇，则确定网页存在预置的敏感词汇。

确定单元403，用于若网页存在所述预置的敏感信息，则确定在网页上投放目标广告存在安全风险，具体地，确定单元403可用于执行图2的步骤205，不再赘述。

截图单元404，用于若网页存在预置的敏感信息，则对网页进行截图保存，具体地，截图单元404可用于执行图2的步骤206，不再赘述。

还需要说明的是，截图单元404为可选的单元。

计数单元405，用于若网页存在预置的敏感信息，则对存在预置的敏感信息的数量进行计数，具体，计数单元405可用于执行图2的步骤207，不再赘述。

报警单元406，用于若网页存在预置的敏感信息，则触发报警功能，具体地，报警单元406可用于执行图2的步骤208，不再赘述。

本实施例中，广告监测装置可以自动监测网络广告投放的网页是否存在敏感信息，提高监测效率。其次，本实施例对于广告监测装置如何获取投放目标广告的网页和判断目标广告网页中是否存在敏感信息进行了细化，提供了多种实现方式，丰富了本发明实施例的实现方式。本实施例还可以在网页存在敏感信息的情况下，进行截图保存，以便保存证据，防止后续URL对应的网页内容有所改变。

上面从模块化功能实体的角度对本发明实施例中的广告监测装置进行描述，下面从硬件处理的角度对本申请实施例中的广告监测装置进行描述。

请参阅图5，本发明实施例中广告监测装置的另一实施例包括：

输入装置501、输出装置502、处理器503和存储器504(其中广告监测装置的处理器501的数量可以一个或多个，图5中以一个处理器501为例)。在本发明的一些实施例中，输入装置501、输出装置502、处理器503和存储器504可通过总线或其它方式连接，其中，图5中以通过总线连接为例。

其中，通过调用存储器504存储的操作指令，处理器503，用于执行如下步骤：

获取投放目标广告的网页；

判断网页是否存在预置的敏感信息，敏感信息为对目标广告有负面影响的信息；

若网页存在预置的敏感信息，则确定在网页上投放目标广告存在安全风险。

具体地，广告监测装置可用于执行图1、图2中的动作，不再赘述。

本实施例中，广告监测装置获取投放目标广告的网页，广告监测装置判断网页是否存在预置的敏感信息，敏感信息为对目标广告有负面影响的信息，若网页存在预置的敏感信息，则广告监测装置确定在网页上投放目标广告存在安全风险。本实施例可以自动监测网络广告投放的网页是否存在敏感信息，提高监测效率。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种广告安全监测方法，其特征在于，包括：

获取投放目标广告的网页；

2.根据权利要求1所述的广告安全监测方法，其特征在于，所述获取投放目标广告的网页包括：

接收所述广告投放平台发送的投放所述目标广告的URL；

通过爬虫爬取并保存所述URL对应的网页。

3.根据权利要求1所述的广告安全监测方法，其特征在于，所述方法还包括：

若所述数量超过预设的数值，则触发报警功能。

4.根据权利要求1所述的广告安全监测方法，其特征在于，所述网页上存在文本信息和/或包含文本信息的图片，所述敏感信息为敏感词汇，所述判断所述网页是否存在预置的敏感信息包括：

和/或，通过OCR技术识别所述网页的图片中的文本信息；

5.根据权利要求1-4任一项所述的广告安全监测方法，其特征在于，所述方法还包括：

若所述网页存在所述预置的敏感信息，则对所述网页进行截图保存。

6.一种广告监测装置，其特征在于，包括：

获取单元，用于获取投放目标广告的网页；

7.根据权利要求6所述的广告监测装置，其特征在于，所述获取单元包括：

爬取模块，用于通过爬虫爬取并保存所述URL对应的网页。

8.根据权利要求6所述的广告监测装置，其特征在于，所述装置还包括：

计数单元，用于若所述网页存在所述预置的敏感信息，则对存在所述预置的敏感信息的数量进行计数；

9.根据权利要求6所述的广告监测装置，其特征在于，所述网页上存在文本信息和/或包含文本信息的图片，所述敏感信息为敏感词汇，所述判断单元包括：

10.根据权利要求6-9任一项所述的广告监测装置，其特征在于，所述装置还包括：