CN104424436B

CN104424436B - 一种恶意广告识别方法及装置

Info

Publication number: CN104424436B
Application number: CN201310381536.8A
Authority: CN
Inventors: 沈飞; 周斌; 稂衡峰; 赵立; 谢波; 刘婷婷; 杨正朋
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd; Tencent Cloud Computing Beijing Co Ltd
Priority date: 2013-08-28
Filing date: 2013-08-28
Publication date: 2019-02-15
Anticipated expiration: 2033-08-28
Also published as: CN104424436A

Abstract

本发明实施例公开了一种恶意广告识别方法，包括：获取信息源；第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第二端滑动；扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素，并确定所述多个相似的信息元素为恶意广告；其中，所述N为大于或者等于2的整数，所述多个相似的信息元素是指相似度大于第一阈值的多个信息元素。相应地，本发明实施例提供一种恶意广告识别装置。本发明实施例可以快速有效地识别出恶意广告。

Description

一种恶意广告识别方法及装置

技术领域

本发明涉及互联网技术领域，尤其涉及一种恶意广告识别方法及装置

背景技术

目前互联网中传输的信息源中会存在一些恶意广告信息，而目前识别恶意广告的方法主要是将信息源切割为多个信息单元，再通过聚集分别对各个信息单元进行恶意广告识别。

上述技术中聚集是通过恶意广告的聚集度为识别的，而在实际应用中，每个信息单元包括的恶意广告的数量是不同，即每个信息单元的恶意广告聚集度是不同的，例如：信息单元1包括3个恶意广告，信息单元2包括4个恶意广告，信息单元3包括2个恶意广告，信息单元4包括0个恶意广告。当上述技术识别恶意广告的聚集度为3时，就只能识别出信息单元1和信息单元2中的恶意广告，当然上述技术中可以将聚集度为2，这样就可以识别出所有恶意广告，但随着聚集度的降低，识别恶意广告的过程就会越滞后。例如：信息单元长度为30秒，那么聚集度为2的识别过程就为比聚集度为3的识别过程滞后30秒。可见，目前恶意广告识别的技术容易漏识别一部分聚集度相对低的恶意广告，且识别的滞后时间比较长。即目前恶意广告识别的技术无法快速有效地识别出恶意广告。

发明内容

本发明实施例提供了一种恶意广告识别方法及装置，可以快速有效地识别出恶意广告。

第一方面，本发明实施例提供一种恶意广告识别方法，包括：

获取信息源；

将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第二端滑动；

扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素，并确定所述多个相似的信息元素为恶意广告；其中，所述N为大于或者等于2的整数，所述多个相似的信息元素是指相似度大于第一阈值的多个信息元素。

第二方面，本发明实施例提供恶意广告识别装置，包括：获取单元、滑动单元和扫描单元，其中：

所述获取单元，用于获取信息源；

所述滑动单元，用于将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第二端滑动；

所述扫描单元，用于扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素，并确定所述多个相似的信息元素为恶意广告；其中，所述N为大于或者等于2的整数，所述多个相似的信息元素是指相似度大于第一阈值的多个信息元素。

上述技术方案中，获取信息源；将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第二端滑动；扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素，并确定所述多个相似的信息元素为恶意广告。相比现有技术，本发明实施例可以对将信息源划分为更多的信息单元，且是以滑动的方式进行扫描，从而可以快速有效地识别出恶意广告。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种恶意广告识别方法的流程示意图；

图2是本发明实施例提供的另一种恶意广告识别方法的流程示意图；

图3是本发明实施例提供的可选的滑动示意图；

图4是本发明实施例提供的一种恶意广告识别装置的结构示意图；

图5是本发明实施例提供的另一种恶意广告识别装置的结构示意图；

图6是本发明实施例提供的另一种恶意广告识别装置的结构示意图；

图7是本发明实施例提供的另一种恶意广告识别装置的结构示意图；

图8是本发明实施例提供的另一种恶意广告识别装置的结构示意图；

图9是本发明实施例提供的另一种恶意广告识别装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例中的信息源具体可以是网络上传输的信息源，且该信息源可以是在时间上为连续信息源，例如：一段语音、一段视频等。

另外，本发明实施例中，滑动窗口滑动的速度可以是理解为每个滑动的时长，例如：滑动窗口以1秒/次的滑动速度进行滑动，即滑动窗口每次滑动的时长为1秒。且本发明实施例中，滑动窗口每次滑动的间隔时间可以是根据用户操作或者根据识别出的恶意广告的数量进行调整的，例如：滑动窗口每隔3秒或者1秒滑动一次，即滑动窗口每隔3秒或者1秒滑动一次，即滑动窗口每次停顿的时长为3秒或者1秒。

图1是本发明实施例提供的一种恶意广告识别方法的流程示意图，如图1所示，包括以下步骤：

S101、获取信息源。

具体可以是接收网络服务器发送的信息源，或者接收通信终端发送的信息源。

S102、将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第二端滑动。

可选的，上述第一时长可以是用户设置的，也可以预设指定的。例如：30秒时长的滑动窗口。上述信息源的第一端和第二端具体可以是信息源的两端点，例如，起始端和终端。

S103、扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素，并确定所述多个相似的信息元素为恶意广告；其中，所述N为大于或者等于2的整数，所述多个相似的信息元素是指相似度大于第一阈值的多个信息元素。

需要说明的是，步骤S102和步骤S103可以是同时执行的。

可选的，上述N可以是用户设置的，也可以预设指定的。由于上述滑动窗口是一个时长的滑动窗口，而信息源为一个时间连续的信息源，即滑动窗口每次滑动到一个位置都会覆盖信息源中的一部分，该覆盖的部分就为一个信息单元。滑动窗口需要经常W次从信息源的第一端滑动到第二端，那么就可以获取到W个信息单元，当然这W个信息单元可以是存在重复的部分，例如：滑动窗口滑动的速度小于上述第一时长时（即滑动窗口每次滑动的时长小于上述第一时长），那么这W个信息单元就存在重复的信息元素。例如：滑动窗口滑动的速度大于或者等于上述第一时长时（即滑动窗口每次滑动的时长大于或者等于上述第一时长），那么这W个信息单元就不存在重复的信息元素。

可选的，上述多个相似的信息元素是指相似度大于第一阈值的多个信息元素可以理解为，上述多个相似的信息元素彼此之间的相似度大于第一阈值，例如：上述多个相似的信息元素为多个相同的信息元素，或者多个相似度大于90%的信息元素。在实际应用中恶意广告都是以重复或者相似的信息元素出现，从而步骤S103可以将上述多个相似的信息元素确定为恶意广告。

可选的，上述技术中由于将信息源划分为多个信息单元，再对每信息单元进行恶意广告识别，从而更加容易将恶意广告组合在信息单元内，以便识别出来。

可选的，上述方法可以应用于任何具体通信功能的终端，即该终端可以实现上述方法，例如：平板电脑、手机、电子阅读器、遥控器、个人计算机（Personal Computer，PC）、笔记本电脑、车载设备、网络电视、可穿戴设备等具有网络功能的智能设备。

图2是本发明实施例提供的另一种恶意广告识别方法的流程示意图，如图2所示，包括以下步骤：

S201、获取信息源。

S202、将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第二端滑动。

S203、扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素，并确定所述多个相似的信息元素为恶意广告；其中，所述N为大于或者等于2的整数，所述多个相似的信息元素是指相似度大于第一阈值的多个信息元素。

作为一种可选的实施方式，所述方法还可以包括：

S204、根据识别出的恶意广告的数量及时调整识别参数；其中识别参考包括如下至少一项：

上述滑动窗口的时长、上述滑动窗口的滑动速度和上述用于识别出恶意广告的聚集度（例如：N）。

步骤S202以及步骤S203再可以通过调整后的参考继续滑动和识别恶意广告。具体的过程请参考下面的实施方式。

需要说明的是，步骤S202和步骤S203可以是一直在执行的，直到滑动窗口滑动到上述第二端，且步骤S203扫描完滑动窗口滑动到第二端时覆盖的信息单元。而步骤S204可以是在步骤S202和步骤S203开始执行到结束执行中的任意至少一个时间点执行的。即可以多次调整上述识别参数。

作为一种可选的实施方式，步骤S202可以包括：

将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第三端滑动，所述信息源的第三端与所述第一端之间识别出的恶意广告数量小于第二阈值。

将所述第二时间长的所述滑动窗口以第一滑动速度从所述信息源的第三端向所述信息源的第二端滑动，所述第二时长比所述第一时长要长。

例如：上述第一时长为30秒，那么上述第二时长就可以大于30秒，例如：60秒。由于滑动窗口的时长越长，那么所覆盖的信息单元的时长就越长，这样信息单元内包括的恶意广告的数量可能就越多，从而更加容易识别出恶意广告。具体可以如图3所示，30秒时长的滑动窗口301从信息源302的第一端向第二端滑动，当滑动窗口301滑动到第一位置时，步骤S203以为3的聚集度（即上述N为3）可以识别出恶意广告303和304，如果滑动窗口301以该时长一直滑动下去，这样恶意广告305是不可以被识别出的，因为当滑动窗口301滑动到第二位置时，步骤S203只能扫描到2个相似的信息元素，由于小于3所以不能识别出恶意广告305。但如果将滑动窗口301调整60秒时长的滑动窗口306，这样当滑动窗口306滑动到第三位置时，滑动窗口306所覆盖的信息单元就包括4个恶意广告（恶意广告304和恶意广告305），从而步骤S203可以识别出恶意广告304和恶意广告305。

其中，上述第三端可以是预先设置好的，也可以是用户根据实际情况设置的。上述第二阈值可以是预先设置好的，也可以是用户根据实际情况设置的。上述第一端为起始端，第三端为时间点为100秒的端，即第一端到第三端为0-100秒的时长，例如：上述第二阈值为10。即信息源的0-100秒的时长时识别出的恶意广告数量小于10个时，执行将所述第二时间长的所述滑动窗口以第一滑动速度从所述信息源的第三端向所述信息源的第二端滑动的步骤。

该实施方式中，可以根据识别出的恶意广告数量及时调整滑动窗口的时长，当然上述仅列出将滑动窗口的时长调长的实现方式，本实施例中还可以调短滑动窗口的时长，例如，识别出的恶意广告过多时，就可以调短滑动窗口的时长，以更加细致地识别恶意广告。

作为一种可选的实施方式，步骤S203可以包括：

在所述滑动窗口从所述信息源的第一端滑动至所述信息源的第四端时，扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素；其中，所述信息源的第四端与所述第一端之间识别出的恶意广告数量小于第三阈值；

在所述滑动窗口从所述信息源的第四端滑动至所述信息源的第二端时，扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于H的多个相似的信息元素；其中，所述H小于所述N，且所述H为大于或者等于2的整数。

其中，上述第三阈值可以是预先设置的，也可以是用户根据实际情况而设置的。

该实施方式中，可以实现当识别出的恶意广告的数量过少时，将聚集度调低，从而可以识别出更多的恶意广告，例如：第四端与所述第一端之间采用的聚集度为N（例如：N为4），那么第四端与所述第一端之间采用的聚集度就可以为H（例如：N为3）。

作为一种可选的实施方式，步骤S203可以包括：

在所述滑动窗口从所述信息源的第一端滑动至所述信息源的第五端时，扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素；其中，所述信息源的第五端与所述第一端之间识别出的恶意广告数量大于第四阈值；

在所述滑动窗口从所述信息源的第五端滑动至所述信息源的第二端时，扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于M的多个相似的信息元素；其中，所述M大于所述N，且所述M为大于或者等于2的整数。

其中，上述第四阈值可以是预先设置的，也可以是用户根据实际情况而设置的。

该实施方式中，可以实现当识别出的恶意广告的数量过多时，将聚集度调高，从而可以更加快速地识别出恶意广告，因为恶意广告过多时，聚集度高调同样可以识别出恶意广告，且识别速度要快。例如：第五端与所述第一端之间采用的聚集度为N（例如：N为4），那么第五端与所述第一端之间采用的聚集度就可以为W（例如：N为5）。

作为一种可选的实施方式，步骤S202可以包括：

将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第六端滑动，所述信息源的第三端与所述第一端之间识别出的恶意广告数量小于第五阈值；

将所述滑动窗口以所述第二滑动速度从所述信息源的第六端向所述信息源的第二端滑动，所述第二滑动速度快于所述第一滑动速度。

其中，上述第五阈值可以是预先设置的，也可以是用户根据实际情况而设置的。

该实施方式中，可以实现当识别出的恶意广告的数量过少时，就可以将滑动窗口的滑动速度调快，即将滑动窗口每次滑动的时长调长，例如：原来每次滑动1秒，现在调成每次滑动3秒等。这样可以更加快速地扫描信息源中的恶意广告，因为已经识别出的恶意广告比较少，这样信息源所有的恶意广告也比较少，即使滑动窗口每次滑动的时长比较长，也可以扫描出全部的恶意广告。

作为一种可选的实施方式，步骤S202可以包括：

将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第五端滑动，所述信息源的第三端与所述第一端之间识别出的恶意广告数量大于第六阈值；

将所述滑动窗口以所述第三滑动速度从所述信息源的第七端向所述信息源的第二端滑动，所述第三滑动速度慢于所述第一滑动速度。

其中，上述第六阈值可以是预先设置的，也可以是用户根据实际情况而设置的。

该实施方式中，可以实现当识别出的恶意广告的数量过大时，就可以将滑动窗口的滑动速度调慢，即将滑动窗口每次滑动的时长调短，例如：原来每次滑动2秒，现在调成每次滑动1秒等。这样可以将信息源划分出更多的信息单元，从而可以更有可能将多个恶意广告集中在信息单元内，以更加有效识别出恶意广告。

上述技术方案中，在上面实施例的基本上增加了多种可选的实施方式，且都可以实现快速有效地识别出恶意广告。

下面为本发明装置实施例，本发明装置实施例用于执行本发明方法实施例一至二实现的方法，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例一和实施例二。

图4是本发明实施例提供的一种恶意广告识别装置的结构示意图，如图4所示，包括：获取单元41、滑动单元42和扫描单元43，其中：

获取单元41，用于获取信息源。

滑动单元42，用于将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第二端滑动。

扫描单元43，用于扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素，并确定所述多个相似的信息元素为恶意广告；其中，所述N为大于或者等于2的整数，所述多个相似的信息元素是指相似度大于第一阈值的多个信息元素。

可选的，上述多个相似的信息元素是指相似度大于第一阈值的多个信息元素可以理解为，上述多个相似的信息元素彼此之间的相似度大于第一阈值，例如：上述多个相似的信息元素为多个相同的信息元素，或者多个相似度大于90%的信息元素。在实际应用中恶意广告都是以重复或者相似的信息元素出现，从而扫描单元43可以将上述多个相似的信息元素确定为恶意广告。

可选的，上述装置可以应用于任何具体通信功能的终端，即该终端可以包括上述装置，例如：平板电脑、手机、电子阅读器、遥控器、个人计算机（Personal Computer，PC）、笔记本电脑、车载设备、网络电视、可穿戴设备等具有网络功能的智能设备。

图5是本发明实施例提供的另一种恶意广告识别装置的结构示意图，如图5所示，包括：获取单元51、滑动单元52、扫描单元53，其中：

获取单元51，用于获取信息源。

滑动单元52，用于将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第二端滑动。

扫描单元53，用于扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素，并确定所述多个相似的信息元素为恶意广告；其中，所述N为大于或者等于2的整数，所述多个相似的信息元素是指相似度大于第一阈值的多个信息元素。

作为一种可选的实施方式，所述装置还可以包括：

调整单元54，用于根据识别出的恶意广告的数量及时调整识别参数；其中识别参考包括如下至少一项：

滑动单元52以及扫描单元53再可以通过调整后的参考继续滑动和识别恶意广告。具体的过程请参考下面的实施方式。

作为一种可选的实施方式，滑动单元52可以包括：

第一滑动子单元521，用于将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第三端滑动，所述信息源的第三端与所述第一端之间识别出的恶意广告数量小于第二阈值；

第二滑动单元522，用于将所述第二时间长的所述滑动窗口以第一滑动速度从所述信息源的第三端向所述信息源的第二端滑动，所述第二时长比所述第一时长要长。

作为一种可选的实施方式，如图6所示，扫描单元53可以包括：

第一扫描子单元531，用于在所述滑动窗口从所述信息源的第一端滑动至所述信息源的第四端时，扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素；其中，所述信息源的第四端与所述第一端之间识别出的恶意广告数量小于第三阈值；

第二扫描子单元532，用于在所述滑动窗口从所述信息源的第四端滑动至所述信息源的第二端时，扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于H的多个相似的信息元素；其中，所述H小于所述N，且所述H为大于或者等于2的整数。

作为一种可选的实施方式，如图7所示，扫描单元53包括：

第三扫描子单元533，用于在所述滑动窗口从所述信息源的第一端滑动至所述信息源的第五端时，扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素；其中，所述信息源的第五端与所述第一端之间识别出的恶意广告数量大于第四阈值；

第四扫描子单元534，用于在所述滑动窗口从所述信息源的第五端滑动至所述信息源的第二端时，扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于M的多个相似的信息元素；其中，所述M大于所述N，且所述M为大于或者等于2的整数。

作为一种可选的实施方式，如图8所示，滑动单元52可以包括：

第三滑动子单元523，用于将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第六端滑动，所述信息源的第三端与所述第一端之间识别出的恶意广告数量小于第五阈值；

第四滑动子单元524，用于将所述滑动窗口以所述第二滑动速度从所述信息源的第六端向所述信息源的第二端滑动，所述第二滑动速度快于所述第一滑动速度。

作为一种可选的实施方式，如图9所示，滑动单元52可以包括：

第五滑动子单元525，用于将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第五端滑动，所述信息源的第三端与所述第一端之间识别出的恶意广告数量大于第六阈值；

第六滑动子单元526，用于将所述滑动窗口以所述第三滑动速度从所述信息源的第七端向所述信息源的第二端滑动，所述第三滑动速度慢于所述第一滑动速度。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体（Read-Only Memory，ROM）或随机存取存储器（Random AccessMemory，简称RAM）等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种恶意广告识别方法，其特征在于，包括：

获取信息源；

将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第三端滑动，所述信息源的第三端与所述第一端之间识别出的恶意广告数量小于第二阈值；

调整所述滑动窗口的时长调整为第二时长；

将所述第二时长的所述滑动窗口以第一滑动速度从所述信息源的第三端向所述信息源的第二端滑动，所述第二时长比所述第一时长要长；

2.如权利要求1所述的方法，其特征在于，所述扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素，包括：

3.如权利要求1所述的方法，其特征在于，所述扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素，包括：

4.如权利要求1、2或3所述的方法，其特征在于，所述方法还包括：

将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第六端滑动，所述信息源的第六端与所述第一端之间识别出的恶意广告数量小于第五阈值；

将所述滑动窗口以第二滑动速度从所述信息源的第六端向所述信息源的第二端滑动，所述第二滑动速度快于所述第一滑动速度。

5.如权利要求1、2或3所述的方法，其特征在于，所述方法还包括：

将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第七端滑动，所述信息源的第七端与所述第一端之间识别出的恶意广告数量大于第六阈值；

将所述滑动窗口以第三滑动速度从所述信息源的第七端向所述信息源的第二端滑动，所述第三滑动速度慢于所述第一滑动速度。

6.一种恶意广告识别装置，其特征在于，包括：获取单元、滑动单元和扫描单元，其中：

所述获取单元，用于获取信息源；

所述滑动单元，用于将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第三端滑动，所述信息源的第三端与所述第一端之间识别出的恶意广告数量小于第二阈值；调整所述滑动窗口的时长调整为第二时长；将所述第二时长的所述滑动窗口以第一滑动速度从所述信息源的第三端向所述信息源的第二端滑动，所述第二时长比所述第一时长要长；

7.如权利要求6所述的装置，其特征在于，所述扫描单元包括：

第一扫描子单元，用于在所述滑动窗口从所述信息源的第一端滑动至所述信息源的第四端时，扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素；其中，所述信息源的第四端与所述第一端之间识别出的恶意广告数量小于第三阈值；

第二扫描子单元，用于在所述滑动窗口从所述信息源的第四端滑动至所述信息源的第二端时，扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于H的多个相似的信息元素；其中，所述H小于所述N，且所述H为大于或者等于2的整数。

8.如权利要求6所述的装置，其特征在于，所述扫描单元包括：

第三扫描子单元，用于在所述滑动窗口从所述信息源的第一端滑动至所述信息源的第五端时，扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于N的多个相似的信息元素；其中，所述信息源的第五端与所述第一端之间识别出的恶意广告数量大于第四阈值；

第四扫描子单元，用于在所述滑动窗口从所述信息源的第五端滑动至所述信息源的第二端时，扫描所述滑动窗口每个停顿时所覆盖的所述信息源的信息单元中数量大于或者等于M的多个相似的信息元素；其中，所述M大于所述N，且所述M为大于或者等于2的整数。

9.如权利要求6、7或8所述的装置，其特征在于，所述滑动单元包括：

第三滑动子单元，用于将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第六端滑动，所述信息源的第六端与所述第一端之间识别出的恶意广告数量小于第五阈值；

第四滑动子单元，用于将所述滑动窗口以第二滑动速度从所述信息源的第六端向所述信息源的第二端滑动，所述第二滑动速度快于所述第一滑动速度。

10.如权利要求6、7或8所述的装置，其特征在于，所述滑动单元包括：

第五滑动子单元，用于将第一时长的滑动窗口以第一滑动速度从所述信息源的第一端向所述信息源的第七端滑动，所述信息源的第七端与所述第一端之间识别出的恶意广告数量大于第六阈值；

第六滑动子单元，用于将所述滑动窗口以第三滑动速度从所述信息源的第七端向所述信息源的第二端滑动，所述第三滑动速度慢于所述第一滑动速度。