CN113269587A - 一种用于监测违规广告的方法、装置、存储介质和服务器 - Google Patents
一种用于监测违规广告的方法、装置、存储介质和服务器 Download PDFInfo
- Publication number
- CN113269587A CN113269587A CN202110569674.3A CN202110569674A CN113269587A CN 113269587 A CN113269587 A CN 113269587A CN 202110569674 A CN202110569674 A CN 202110569674A CN 113269587 A CN113269587 A CN 113269587A
- Authority
- CN
- China
- Prior art keywords
- source code
- advertisement
- character
- segment set
- webpage source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012545 processing Methods 0.000 claims description 26
- 230000011218 segmentation Effects 0.000 claims description 12
- 239000000463 material Substances 0.000 description 19
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 6
- 238000012550 audit Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 230000000750 progressive effect Effects 0.000 description 3
- 230000009193 crawling Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0248—Avoiding fraud
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请提供了一种用于监测违规广告的方法、装置、存储介质和服务器,包括:针对广告投放平台中的任一在投广告,获取第一网页源代码并进行切分形成多个第一字符段,将多个第一字符段组成第一字符段集合;获取第二网页源代码并进行切分形成多个第二字符段,将多个第二字符段组成第二字符段集合;根据第一字符段集合和第二字符段集合,分别确定第三字符段集合和第四字符段集合;根据第三字符段集合和第四字符段集合,确定第一网页源代码与第二网页源代码之间的相似度,并在相似度低于预设阈值时确定广告违规。可以看出,只要相似度低于预设阈值时,即可确定广告违规,而无需再采用人工的方式监测广告是否违规,从而提高了监测违规广告的效率。
Description
技术领域
本申请实施例涉及广告投放技术领域,尤其涉及一种用于监测违规广告的方法、装置、存储介质和服务器。
背景技术
随着互联网技术的发展,越来越多的广告主或者广告主的代理商通过广告投放平台投放广告。但是,一部分广告主或者广告主的代理商,有时也会通过多种方式发布各种违规广告。
现有的广告投放平台监测违规广告的方法是通过人工随机访问广告的方式对海量的广告进行监测,但是由于采用人工监测违规广告的方式,一方面需要配置大量的人力和物力,另一方面人工在监测过程中,存在疲劳、惯性等主观性因素,监测效率也比较低。因此,需要一种能够高监测违规广告效率的方法,以解决该问题。
发明内容
为了解决现有技术中存在的由于采用人工监测违规广告的方式而导致的监测违规广告效率较低的问题,本申请实施例提供一种用于监测违规广告的方法、装置、存储介质和服务器,从而提高监测违规广告的效率。
为达到上述目的,本申请实施例的技术方案是这样实现的:
一方面,本申请实施例提供一种用于监测违规广告的方法,应用于广告投放平台中,包括:
针对所述广告投放平台中的任一在投广告,获取第一网页源代码并对所述第一网页源代码进行切分形成多个第一字符段,然后将多个所述第一字符段组成第一字符段集合,所述第一网页源代码为通过使用第一IP地址访问所述在投广告的落地页地址对所述在投广告进行审核通过时的代码;
获取第二网页源代码并对所述第二网页源代码进行切分形成多个第二字符段,然后将多个所述第二字符段组成第二字符段集合,所述第二网页源代码为通过使用第二IP地址访问所述在投广告的所述落地页地址进行抓取的代码;
根据所述第一字符段集合和所述第二字符段集合,分别确定第三字符段集合和第四字符段集合,所述第三字符段集合是指同时存在于所述第一字符段集合和所述第二字符段集合中的所有字符段的集合,所述第四字符段集合是指存在于所述第一字符段集合中或者存在于所述第二字符段集合中的所有字符段的集合;
根据所述第三字符段集合和所述第四字符段集合,确定所述第一网页源代码与所述第二网页源代码之间的相似度,若所述相似度低于预设阈值,则确定所述在投广告违规。
在一种可选的实施例中,所述对所述第一网页源代码进行切分,包括:
以预设字符个数按照预设顺序对所述第一网页源代码进行切分;
所述对所述第二网页源代码进行切分,包括:
以所述预设字符个数按照所述预设顺序对所述第二网页源代码进行切分。
在一种可选的实施例中,在获取所述第一网页源代码之前,还包括:
在通过使用所述第一IP地址访问所述在投广告的落地页地址对所述在投广告进行审核通过之后,根据所述落地页地址分别确定存储所述第一网页源代码和存储所述第二网页源代码的第一存储地址和第二存储地址;
根据所述第一存储地址和所述第二存储地址,分别将所述第一网页源代码和所述第二网页源代码进行存储。
在一种可选的实施例中,所述落地页地址对应有多个广告,则在确定所述在投广告违规之后,还包括:
将与所述落地页地址对应的多个广告从所述广告投放平台中删除。
在一种可选的实施例中,所述在投广告为所述广告平台中状态设置为有效的广告。
在一种可选的实施例中,所述在投广告的形式至少包括:文字、视频或图片。
另一方面,本申请实施例提供一种用于监测违规广告的装置,应用于广告投放平台中,包括:获取模块、切分模块、处理模块;
所述获取模块,用于针对所述广告投放平台中的任一在投广告,获取第一网页源代码并指示所述切分模块对所述第一网页源代码进行切分形成多个第一字符段,然后将多个所述第一字符段组成第一字符段集合,所述第一网页源代码为通过使用第一IP地址访问所述在投广告的落地页地址对所述在投广告进行审核通过时的代码;
所述获取模块,还用于获取第二网页源代码并指示所述切分模块对所述第二网页源代码进行切分形成多个第二字符段,然后将多个所述第二字符段组成第二字符段集合,所述第二网页源代码为通过使用第二IP地址访问所述在投广告的所述落地页地址进行抓取的代码;
所述处理模块,用于根据所述第一字符段集合和所述第二字符段集合,分别确定第三字符段集合和第四字符段集合,所述第三字符段集合是指同时存在于所述第一字符段集合和所述第二字符段集合中的所有字符段的集合,所述第四字符段集合是指存在于所述第一字符段集合中或者存在于所述第二字符段集合中的所有字符段的集合;
所述处理模块,还用于根据所述第三字符段集合和所述第四字符段集合,确定所述第一网页源代码与所述第二网页源代码之间的相似度,若所述相似度低于预设阈值,则确定所述在投广告违规。
在一种可选的实施例中,所述切分模块具体用于:
以预设字符个数按照预设顺序对所述第一网页源代码进行切分;以及
以所述预设字符个数按照所述预设顺序对所述第二网页源代码进行切分。
在一种可选的实施例中,还包括:存储模块;
所述处理模块,还用于在获取所述第一网页源代码之前,并在通过使用所述第一IP地址访问所述在投广告的落地页地址对所述在投广告进行审核通过之后,根据所述落地页地址分别确定存储所述第一网页源代码和存储所述第二网页源代码的第一存储地址和第二存储地址;
所述存储模块,用于根据所述第一存储地址和所述第二存储地址,分别将所述第一网页源代码和所述第二网页源代码进行存储。
在一种可选的实施例中,所述落地页地址对应有多个广告,则所述处理模块,还用于在确定所述在投广告违规之后,将与所述落地页地址对应的多个广告从所述广告投放平台中删除。
在一种可选的实施例中,所述在投广告为所述广告平台中状态设置为有效的广告。
在一种可选的实施例中,所述在投广告的形式至少包括:文字、视频或图片。
又一方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现上述用于监测违规广告的方法。
再一方面,本申请实施例还提供一种服务器,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,当所述计算机程序被所述处理器执行时,实现上述用于监测违规广告的方法。
可以看出,采用本申请实施例提供的应用于广告投放平台中的,用于监测违规广告的方法、装置,针对所述广告投放平台中的任一在投广告,在获取第一网页源代码、第二网页源代码之后,通过对第一网页源代码、第二网页源代码进行切分形成多个第一字符段、多个第二字符段,之后由多个第一字符段、多个第二字符段分别组成第一字符段集合、第二字符段集合,之后再根据第一字符段集合和第二字符段集合确定第一网页源代码与第二网页源代码之间的相似度,并在相似度低于预设阈值时,即可确定在投广告违规。由于本申请提供的监测违规广告的方法,是在广告投放平台中自动化执行的,只需要在确定出第一网页源代码与第二网页源代码之间的相似度低于预设阈值时,即可确定在投广告违规,而无需再采用人工监测违规广告的方式,从而提高了监测违规广告的效率。此外,也不再需要配置大量的人力物力,还节省了人力成本。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的应用场景的结构示意图;
图2为本申请实施例提供的用于监测违规广告的方法的流程示意图;
图3a-图3d为本申请实施例提供的广告投放平台的具体结构示意图;
图4为本申请实施例提供的用于监测违规广告的装置的结构示意图;
图5为本申请实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
需要说明的是,本申请的文件中涉及的术语“包括”和“具有”以及它们的变形,意图在于覆盖不排他的包含,例如,包含一系列步骤或单元的过程、方法、系统、产品或设备不限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
尽管术语“第一”、“第二”等可以在本申请中用于描述各种网页源代码,但是这些网页源代码不应当受这些术语限制。这些术语可以仅用于将一份网页源代码与另一份网页源代码区分。诸如“第一”、“第二”的术语和其他数字术语在本申请中使用时不暗示顺序或次序,除非上下文有明确指示。因此,下文讨论的第一网页源代码可以被称为第二网页源代码,而不脱离示例性实施方式的教导。
本申请实施例中涉及的名词适用于如下的解释:
广告主:具有广告投放需求并通过广告投放平台进行投放的一方,广告主通过广告投放平台投放广告达到其商业营销的目的,这种目的类似于商品销售、应用推广等。
广告投放平台:进行广告投放的服务器,广告主或者广告主的代理商可以通过广告投放平台进行广告投放。
终端设备:是指诸如手机、电脑或平板电脑等终端或移动终端。
用户:在本申请实施例中,如果没有特别说明,用户通常指的是终端设备的使用者。
图1示出了本申请实施例中的技术方案能够适用的一种应用场景,在该场景中,可以包括广告主10、终端设备20以及广告投放平台30。
广告主10为具有广告投放需求并通过广告投放平台进行投放的一方,广告主10也可以为代表广告主利益的代理商。
终端设备20可以是诸如手机、电脑或平板电脑等终端或移动终端。
广告投放平台30为进行广告投放的后台服务器,广告主10可以通过广告投放平台30将各种商品(包括应用程序)的广告投放给用户,广告主10可以通过广告投放平台30进行广告投放。
当然,本申请实施例提供的方法并不限于图1所示的应用场景中,还可以用于其他可能的应用场景,对此本申请实施例并不进行限制。对于图1所示的应用场景中的各个设备所能实现的功能将在后续的方法实施例中一并进行描述,在此先不过多赘述。
需要说明的是,本发明实施例中的经由网络或者通过网络,指的是通过网络连接,其中,网络连接可以形成局域计算机网络(Local-Area computer Network,LAN)和广域计算机网络(Wide-Area computer Network,WAN)。这种网络用在公司计算机网络和公司内部网络中,并且这些网络通常有权访问互联网。当使用网络时,终端设备20可以使用调制解调器或本领域普通技术人员熟知的、实现与广域计算机网络(诸如因特网)的通信的其它模块。本领域普通技术人员将理解,网络连接是使用通信模块建立客户端与服务器的连接的许多熟知方式的非限制性示例。
图2为本申请实施例提供的、应用于广告投放平台中,用于监测违规广告的方法的具体流程示意图,如图2所示,可包括如下步骤:
S201、针对广告投放平台中的任一在投广告,获取第一网页源代码并对所述第一网页源代码进行切分形成多个第一字符段,然后将多个所述第一字符段组成第一字符段集合,所述第一网页源代码为通过使用第一IP地址访问所述在投广告的落地页地址对所述在投广告进行审核时的代码。
其中,在投广告的形式至少包括:文字、视频或图片。当然,在具体实施时,在投广告还可以包括其它形式的广告。
S202、获取第二网页源代码并对所述第二网页源代码进行切分形成多个第二字符段,然后将多个所述第二字符段组成第二字符段集合,所述第二网页源代码为通过使用第二IP地址访问所述在投广告的所述落地页地址进行抓取的代码。
具体的,第二IP地址通常选取容易发生广告素材篡改从而导致广告违规的一些地区的IP地址,比如一些三、四线城市由于对广告素材监管不严从而导致这些地区很容易发生广告素材篡改,所以在选取第二IP地址时,可以选取这些三、四线城市的IP地址。此外,在使用第二IP访问落地页地址时,可以采用多个第二IP地址按照预设的时间段间隔随机的访问在投广告的落地页地址从而抓取多个第二网页源代码;也可以采用多个第二IP地址按照预设的时间段间隔轮流的访问在投广告的落地页地址从而抓取多个第二网页源代码。
S203、根据所述第一字符段集合和所述第二字符段集合,分别确定第三字符段集合和第四字符段集合,所述第三字符段集合是指同时存在于所述第一字符段集合和所述第二字符段集合中的所有字符段的集合,所述第四字符段集合是指存在于所述第一字符段集合中或者存在于所述第二字符段集合中的所有字符段的集合。
具体来说,第三字符段集合其实就是第一字符段集合与第二字符段集合中的字符段的交集,第四字符段集合其实就是第一字符段集合与第二字符段集合中的字符段的合集。
需要说明的是,上述步骤S201和上述步骤S202中的在投广告的落地页地址有时也称为落地页链接,有时也称为落地页的URL(Uniform Resource Locator,统一资源定位器)。
S204、根据所述第三字符段集合与所述第四字符段集合,确定所述第一网页源代码与所述第二网页源代码之间的相似度。
S205、判断所述相似度是否低于预设阈值,若是,则转至步骤S206,否则转至步骤S207。
S206、确定所述在投广告违规。
S207、确定所述在投广告不违规。
在具体实施时,预设阈值通常设置为0.5,也就是说,如果第一字符段集合与第二字符段集合中的字符段的交集中的字符段个数与第一字符段集合与第二字符段集合中的字符段的合集中的字符段个数之比小于0.5,则说明第一字符段集合与第二字符段集合的相似度越低,从而说明在使用第一IP地址访问在投广告的落地页地址所产生的第一网页源代码与在使用第二IP地址访问在投广告的落地页地址所产生的第二网页源代码的相似度越低,进而可以确定在投广告违规。当然也可以根据具体情况而将预设阈值设置为其它数值。
需要注意的是,在第二IP地址为多个IP地址的情况下,在通过使用第二IP地址访问在投广告的落地页地址进行抓取第二网页源代码时,每通过使用一个第二IP地址抓取一次第二网页源代码,就可以采用本申请所提供的方法,确定第一网页源代码与第二网页源代码之间的相似度,从而判断该在投广告是否违规。此外,还需要注意的是,使用第二IP地址抓取第二网页源代码一定是发生在使用第一IP地址抓取第一网页源代码之后。
在说明步骤S201中的获取第一网页源代码和步骤S202中的获取第二网页源代码之前,下面先来说明第一网页源代码和第二网页源代码的存储过程。
基于图1所示的应用场景的基础上,广告投放平台30可以包括广告投放单元31、广告库32、存储单元33以及在投广告列表34,参见图3a。
广告主10经由网络将广告投放请求发送至广告投放单元31,广告投放单元31在接收到该广告投放请求以后,将该广告投放请求中携带的信息(诸如广告素材、落地页地址)存储到广告库32,然后广告投放单元31在对该广告进行审核以后为该广告分配广告标识,之后,广告投放单元31基于广告投放请求中携带的落地页地址分别确定存储第一网页源代码和第二网页源代码的第一存储地址和第二存储地址。
下面对广告投放单元31在接收到广告主10的广告投放请求以后,将该广告投放请求中携带的信息(诸如广告素材、落地页地址)存储到广告库32、广告投放单元31为该广告分配广告标识、以及广告投放单元31基于落地页地址分别确定存储第一网页源代码和第二网页源代码的第一存储地址和第二存储地址的具体过程进行解释说明。
首先,广告主10经由网络将广告投放请求发送至广告投放单元31,其中,广告投放请求中携带有广告素材和落地页地址,待广告投放单元31接收到广告投放请求以后,由审核人员通过使用第一IP地址访问所述广告投放请求中携带的落地页地址对所述广告素材进行审核,待审核人员对所述广告素材进行审核通过之后,广告投放单元31为该广告分配广告标识,并将该广告标识存放到在投广告列表34中,之后将该广告标识和所述落地页地址以对应的方式存储至广告库32中,同时广告投放单元31还基于广告投放请求中携带的落地页地址分别确定存储第一网页源代码和第二网页源代码的第一存储地址和第二存储地址,之后广告投放单元31基于第一存储地址将通过使用第一IP地址访问所述落地页地址时候所展示的包含所述广告素材的原截图以及访问所述落地页地址时的第一网页源代码对应地存储至存储单元33中;广告投放单元31基于第二存储地址将通过使用第二IP地址访问所述落地页地址时所展示的监测截图以及访问所述落地页地址时的第二网页源代码对应地存储至存储单元33中。
这样,后续广告投放单元31可以针对在投广告列表34中的任一广告,可以先从在投广告列表34中获取该广告的广告标识,然后根据该广告标识从广告库32中获取该广告所对应的落地页,之后再基于该落地页地址分别确定第一存储地址和第二存储地址,然后基于第一存储地址和第二存储地址,从存储单元33中分别获取第一网页源代码以及第二网页源代码。需要注意的是,在具体实施时,在基于第一存储地址和第二存储地址从存储单元33中分别获取第一网页源代码和第二网页源代码时,还可以同时获取原截图和监测截图,以供后续由审核人员进行对比使用,如果后续审核人员发现原截图与监测截图确实不同,并且在确定在投广告违规的情况下,可以将原截图和监测截图一起发送给该在投广告的广告主。
需要说明的是,在具体实施时,存储单元33可以设置在广告投放平台30中,存储单元33也可以设置在云中,参见图3b。此时,广告投放单元21与存储单元33之间的交互通过网络进行。
具体的,广告投放单元31在基于广告投放请求中携带的落地页地址分别确定存储第一网页源代码和第二网页源代码的第一存储地址和第二存储地址时,广告投放单元31可以采用MD5信息摘要算法对广告投放请求中携带的落地页地址进行加密处理后得到一哈希值,然后基于该哈希值分别确定存储第一网页源代码和第二网页源代码的第一存储地址和第二存储地址。例如,假设基于落地页地址www.110.com,采用MD5信息摘要算法进行哈希处理得到的哈希值为abcde,则在存储单元33设置在云中的情况下,例如可以将云中的存储路径http://ip.original.abcde作为存储第一网页源代码的第一存储地址,以及可以将云中的存储路径http://ip.check.abcde作为存储第二网页源代码的第二存储路径。
这样,后续广告投放单元31可以针对在投广告列表34中的任一广告,可以先从在投广告列表34中获取该广告的广告标识,然后根据该广告标识从广告库32中获取该广告所对应的落地页,之后再采用MD5信息摘要算法对落地页地址进行哈希处理之后得到一哈希值,之后再基于该哈希值,分别确定第一存储地址和第二存储地址,然后基于第一存储地址和第二存储地址,从存储单元33中分别获取第一网页源代码以及第二网页源代码。需要注意的是,在具体实施时,在基于第一存储地址和第二存储地址从存储单元33中分别获取第一网页源代码和第二网页源代码时,还可以同时获取原截图和监测截图,以供后续由审核人员进行对比使用,如果后续审核人员发现原截图与监测截图确实不同,并且在确定在投广告违规的情况下,可以将原截图和监测截图一起发送给该在投广告的广告主。
在具体实施时,还可以将上述第一存储地址和第二存储地址与相应的广告标识、落地页地址以对应的方式存储在广告库32中。在这种情况下,广告投放单元31可以针对在投广告列表34中的任一广告,可以先从在投广告列表34中获取该广告的广告标识,然后根据该广告标识从广告库32中直接获取第一存储地址和第二存储地址,而不用再基于落地页去即时计算第一存储地址和第二存储地址,从而提升了获取第一网页源代码和第二网页源代码的效率,进而提升了监测违规广告的效率。在根据广告标识从广告库32中直接获取第一存储地址和第二存储地址之后,再基于第一存储地址和第二存储地址从存储单元33中分别获取第一网页源代码和第二网页源代码。当然,在基于第一存储地址和第二存储地址从存储单元33中分别获取第一网页源代码和第二网页源代码时,还可以同时获取原截图和监测截图,以供后续由审核人员进行对比使用,如果后续审核人员发现原截图与监测截图确实不同,并且在确定在投广告违规的情况下,可以将原截图和监测截图一起发送给该在投广告的广告主。
下面通过一个简单的实施例对上述过程进行解释说明。
广告主10经由网络将广告投放请求1发送至广告投放单元31,其中,广告投放请求1中携带有广告素材1和落地页地址www.110.com,广告投放单元31在接收到广告投放请求1以后,由审核人员通过使用第一IP地址访问广告投放请求1中携带的落地页地址www.110.com对广告素材1进行合法合规审核,待审核人员对广告素材1进行合法合规审核通过以后,广告投放单元31为该广告分配广告标识11,并且将广告标识11存储到在投广告列表34中,参见下列表格1所示,之后再将广告标识11和落地页地址www.110.com存储到广告库32中,参见下列表格2所示。
表格1
表格2
这样,后续广告投放单元31针对广告1,可以先从上述表格1中获取该广告的广告标识11,然后根据广告标识11从上述表格2中获取该广告所对应的落地页地址www.110.com,之后再采用MD5信息摘要算法对落地页地址www.110.com进行哈希处理之后得到一哈希值,假设采用MD5信息摘要算法对落地页地址www.110.com进行哈希处理之后得到的哈希值为abcde,之后再基于该哈希值abcde,分别确定第一存储地址http://ip.original.abcde和第二存储地址http://ip.check.abcde,然后基于第一存储地址http://ip.original.abcde和第二存储地址http://ip.check.abcde,从存储单元33中分别获取第一网页源代码以及第二网页源代码。
当然,在具体实施时,在将广告标识11和落地页地址www.110.com存储到广告库32中时,还可以采用MD5信息摘要算法对落地页地址www.110.com进行哈希处理之后得到一哈希值,假设采用MD5信息摘要算法对落地页地址www.110.com进行哈希处理之后得到一哈希值为abcde,则在存储单元设置在云中的情况下,可以基于哈希值abcde分别确定第一存储地址http://ip.original.abcde和第二存储地址http://ip.check.abcde,同时将第一存储地址http://ip.original.abcde和第二存储地址http://ip.check.abcde与广告标识11、落地页地址www.110.com以对应的方式存储在广告库中,参见下列表格3所示。
表格3
这样,广告投放单元31针对广告1,可以先从上述表格1中获取该广告的广告标识11,然后根据该广告标识11从上述表格3中直接获取第一存储地址http://ip.original.abcde和第二存储地址http://ip.check.abcde,而不用再基于落地页地址www.110.com即时计算第一存储地址和第二存储地址,而是根据广告标识11从上述表格3中直接获取第一存储地址和第二存储地址,之后再基于第一存储地址和第二存储地址从存储单元33中分别获取第一网页源代码和第二网页源代码,从而能够提高获取第一网页源代码和第二网页源代码的效率,进而能够提高监测违规广告的效率。
此外,在具体实施时,在广告投放平台30中也可以不设置在投广告列表34,参见图3c,此时,广告主10经由网络将广告投放请求发送至广告投放单元31,其中,广告投放请求中携带有广告素材和落地页地址,待广告投放单元31接收到广告投放请求以后,由审核人员通过使用第一IP地址访问所述广告投放请求中携带的落地页地址对所述广告素材进行审核,待审核人员对所述广告素材进行审核通过之后,广告投放单元31为该广告分配广告标识,并将该广告标识和落地页地址以对应的方式存储到广告库32中。同时,还需要在广告库32中将该广告的状态设置为“开启”。当然,在广告投放平台中设置在投广告列表的情况下,也可以设置各个广告的状态(诸如开启/关闭)。在这种情况下,上述步骤S201中的“任一在投广告”既可以指在投广告列表中的任一广告,也可以指广告库中状态设置为“开启”的任一广告。
这样,后续广告投放单元31可以针对广告库32中广告状态设置为“开启”的任一广告,可以先从广告库32中获取该广告的广告标识,然后根据该广告标识从广告库32中获取该广告所对应的落地页地址,之后再基于该落地页地址分别确定第一存储地址和第二存储地址,然后基于第一存储地址和第二存储地址,从存储单元33中分别获取第一网页源代码以及第二网页源代码。
需要说明的是,在广告投放平台30中不设置在投广告列表的情况下,存储单元33可以设置在广告投放平台30中,存储单元33也可以设置在云中,参见图3d。此时,广告投放单元31与存储单元33之间的交互通过网络进行。
具体的,在广告投放平台30中不设置在投广告列表的情况下,广告投放单元31在基于广告投放请求中携带的落地页地址分别确定存储第一网页源代码和第二网页源代码的第一存储地址和第二存储地址时,广告投放单元31也可以采用MD5信息摘要算法对广告投放请求中携带的落地页地址进行加密处理后得到一哈希值,然后基于该哈希值分别确定存储第一网页源代码和第二网页源代码的第一存储地址和第二存储地址。这样,后续广告投放单元31可以针对广告库32中广告状态设置为“开启”的任一广告,可以先从广告库32中获取该广告的广告标识,然后根据该广告标识从广告库32中获取该广告所对应的落地页,之后再采用MD5信息摘要算法对落地页地址进行哈希处理之后得到一哈希值,之后再基于该哈希值,分别确定第一存储地址和第二存储地址,然后基于第一存储地址和第二存储地址,从存储单元33中分别获取第一网页源代码以及第二网页源代码。当然,在具体实施时,在将广告标识和落地页地址存储到广告库32中时,还可以采用MD5信息摘要算法对该落地页地址进行哈希处理之后得到一哈希值,假设采用MD5信息摘要算法对落地页地址进行哈希处理之后得到一哈希值abcde,则在存储单元设置在云中的情况下,可以基于哈希值abcde分别确定第一存储地址http://ip.original.abcde和第二存储地址http://ip.check.abcde,同时将第一存储地址http://ip.original.abcde和第二存储地址http://ip.check.abcde与广告标识11、落地页地址www.110.com以及广告的状态信息以对应的方式存储在广告库中,参见下列表格4所示。
表格4
这样,广告投放单元31针对广告1,可以先从广告库中获取该广告的广告标识11,然后根据该广告标识11从上述表格4中直接获取第一存储地址http://ip.original.abcde和第二存储地址http://ip.check.abcde,而不用再基于落地页地址www.110.com即时计算第一存储地址和第二存储地址,而是根据广告标识11从上述表格4中直接获取第一存储地址和第二存储地址,之后再基于第一存储地址和第二存储地址分别从存储单元中获取第一网页源代码和第二网页源代码,从而能够提高获取第一网页源代码和第二网页源代码的效率,进而能够提高监测违规广告的效率。
在广告投放单元31基于第一存储地址和第二存储地址从存储单元中分别获取第一网页源代码和第二网页源代码之后,分别以相同的预设字符个数按照预设顺序对第一网页源代码和第二网页源代码进行切分。
具体的,在以相同的预设字符个数按照预设顺序对第一网页源代码和第二网页源代码进行切分时,为了让字符段集合中的字符段具有一定的顺序性,从而提升判断第一网页源代码与第二网页源代码之间的相似度的概率,在具体实施时,可以基于相同的预设字符个数按照预设顺序将第一网页源代码和第二网页源代码分别切分成多个第一字符段和多个第二字符段,从而组成第一字符段集合和第二字符段集合。例如,假设从存储单元中获取的第一网页源代码包含如下字符:ABCDEFGHIJKLM,在假设预设字符个数为3且预设顺序为按照逐个字符进行递进切分的情况下,为了让字符段集合中的字符段具有一定的顺序性,从而提升判断第一网页源代码与第二网页源代码之间的相似度的概率,则可以基于3个字符进行切分,将上述字符切分为如下十一个字符段:ABC、BCD、CDE、DEF、EFG、FGH、GHI、HIJ、IJK、JKL、KLM。当然,在具体实施时,也可以基于预设的字符个数,采用其它的切分方式对第一网页源代码和第二网页源代码进行切分,例如,仍然以从存储单元中获取的第一网页源代码包含如下字符:ABCDEFGHIJKL为例,在假设预设字符个数为3且预设顺序为按照正序进行切分的情况下,可以将上述字符切分为如下四个字符段:ABC、DEF、GHI、JKL。
需要说明的是,在具体实施时,无论采用哪种切分方式,无论设置的预设字符个数是多少,在对第一网页源代码和第二网页源代码进行切分时,需要采用相同的预设字符个数和相同的切分方式,以便于后续能够将第一字符段集合与第二字符段集合进行比较,从而计算第一网页源代码与第二网页源代码之间的相似度。此外,需要注意的是,在将第一网页源代码和第二网页源代码切分成多个第一字符段和多个第二字符段时,第一字符段和第二字符段还可以包括一些特殊符号,例如,左括号、右括号、标点符号、等号等。在具体实施时,如果遇到在将第一网页源代码和第二网页源代码切分成多个第一字符段和多个第二字符段时,存在切分后的第一字符段和第二字符段的个数没有达到预设字符个数,则可以用预设字符进行补足,也可以不用预设字符进行补足。
下面通过一个具体的实施例来解释说明在从存储单元中分别获取第一网页源代码和第二网页源代码之后,是如何计算第一网页源代码与第二网页源代码之间的相似度的。
在该实施例中,将预设阈值设置为0.5,假设针对任一在投广告,并假设该在投广告为广告1,从存储单元中分别获取的第一网页源代码和第二网页源代码如下:
第一网页源代码:window.ViewResizer=function(document,window)
第二网页源代码:window.View=function(document,window)
进一步假设,在该实施例中预设字符个数为10个字符,并假设预设顺序为按照逐个字符进行递进切分,然后,以10个字符按照逐个字符进行递进切分将第一网页源代码进行切分后形成多个第一字符段,并由这多个第一字符段组成的第一字符段集合为:{window.Vie,indow.View,ndow.ViewR,dow.ViewRe,ow.ViewRes,w.ViewResi,.ViewResiz,ViewResize,iewResizer,ewResizer=,wResizer=f,Resizer=fu,esizer=fun,sizer=func,izer=funct,zer=functi,er=functio,r=function,=function(,function(d,unction(do,nction(doc,ction(docu,tion(docum,ion(docume,on(documen,n(document,(document,,document,w,ocument,wi,cument,win,ument,wind,ment,windo,ent,window}。
之后,继续以10个字符按照逐个字符进行递进切分将第二网页源代码进行切分后形成多个第二字符段,并由这多个第二字符段组成的第二字符段集合为:{window.Vie,indow.View,ndow.View=,dow.View=f,ow.View=fu,w.View=fun,.View=func,View=funct,iew=functi,ew=functio,w=function,=function(,function(d,unction(do,nction(doc,ction(docu,tion(docum,ion(docume,on(documen,n(document,(document,,document,w,ocument,wi,cument,win,ument,wind,ment,windo,ent,window,nt,window)}。
在确定出第一字符段集合和第二字符段集合之后,可以确定第三字符段集合和第四字符段集合,由于上述第一字符段集合中存在34个第一字符段,上述第二字符段集合中存在28个第二字符段,又由于上述第一字符段集合和上述第二字符段集合中均存在相同的字符段:window.Vie,indow.View,因此第三字符段集合中的字符段个数为2,第四字符段集合中的字符段个数为60。
在确定出第三字符段集合中的字符段个数为2,第四字符段集合中的字符段个数为60之后,可以确定出上述第一网页源代码与上述第二网页源代码之间的相似度为2/60≈0.03,由于0.03小于0.5,所以可以确定广告1违规。
在确定在投广告违规之后,可以直接将该在投广告从广告库和/或在投广告列表中进行删除,即在广告投放平台中下线该广告。此外,由于在广告投放平台中,存在同一落地页地址对应有多个广告的情况,参见下列表格5所示,可以看出,落地页地址www.130.com对应有两个广告,广告标识分别为11和22。因此,在确定在投广告违规之后,可以首先根据该在投广告在广告库中确定该在投广告的落地页地址,然后再根据该落地页地址,确定与落地页地址对应的所有广告,并将与该落地页地址对应的所有广告从在投广告列表和/或广告库中删除,即在广告投放平台中下线与该落地页地址对应的所有广告。
表格5
广告标识 | 落地页地址 | 状态 |
11 | www.130.com | 开启 |
22 | www.130.com | 开启 |
根据以上内容可以看出,本申请实施例提供的应用于广告投放平台中的,用于监测违规广告的方法,针对所述广告投放平台中的任一在投广告,在获取第一网页源代码、第二网页源代码之后,通过对第一网页源代码、第二网页源代码进行切分形成多个第一字符段、多个第二字符段,之后由多个第一字符段、多个第二字符段分别组成第一字符段集合、第二字符段集合,之后再根据第一字符段集合和第二字符段集合确定第一网页源代码与第二网页源代码之间的相似度,并在相似度低于预设阈值时,即可确定在投广告违规。由于本申请提供的监测违规广告的方法,是在广告投放平台中自动化执行的,只需要在确定出第一网页源代码与第二网页源代码之间的相似度低于预设阈值时,即可确定在投广告违规,而无需再采用人工监测违规广告的方式,从而提高了监测违规广告的效率。此外,也不再需要配置大量的人力物力,还节省了人力成本。
与图2所示的用于监测违规广告的方法基于同一发明构思,本申请实施例还提供了一种用于监测违规广告的装置,该装置可以布设在广告投放平台中。由于该装置是本申请实施例提供的用于监测违规广告的方法对应的装置,并且该装置解决问题的原理与该方法相似,因此该装置的实施例可以参见上述方法的实施,重复之处不再赘述。
图4示出了本申请实施例提供的一种用于监测违规广告的装置的结构示意图,如图4所示,该用于监测违规广告的装置40包括:获取模块401、切分模块402、处理模块403和存储模块404;其中:
获取模块401,用于针对所述广告投放平台中的任一在投广告,获取第一网页源代码并指示切分模块402对所述第一网页源代码进行切分形成多个第一字符段,然后将多个所述第一字符段组成第一字符段集合,所述第一网页源代码为通过使用第一IP地址访问所述在投广告的落地页地址对所述在投广告进行审核通过时的代码;
获取模块401,还用于获取第二网页源代码并指示切分模块402对所述第二网页源代码进行切分形成多个第二字符段,然后将多个所述第二字符段组成第二字符段集合,所述第二网页源代码为通过使用第二IP地址访问所述在投广告的所述落地页地址进行抓取的代码;
处理模块403,用于根据所述第一字符段集合和所述第二字符段集合,分别确定第三字符段集合和第四字符段集合,所述第三字符段集合是指同时存在于所述第一字符段集合和所述第二字符段集合中的所有字符段的集合,所述第四字符段集合是指存在于所述第一字符段集合中或者存在于所述第二字符段集合中的所有字符段的集合;
处理模块403,还用于根据所述第三字符段集合和所述第四字符段集合,确定所述第一网页源代码与所述第二网页源代码之间的相似度,若所述相似度低于预设阈值,则确定所述在投广告违规。
在一种可选的实施例中,所述切分模块402具体用于:以预设字符个数按照预设顺序对所述第一网页源代码进行切分;以及以所述预设字符个数按照所述预设顺序对所述第二网页源代码进行切分。
在一种可选的实施例中:所述处理模块403,还用于在获取所述第一网页源代码之前,并在通过使用所述第一IP地址访问所述在投广告的落地页地址对所述在投广告进行审核通过之后,根据所述落地页地址分别确定存储所述第一网页源代码和存储所述第二网页源代码的第一存储地址和第二存储地址;存储模块404,用于根据所述第一存储地址和所述第二存储地址,分别将所述第一网页源代码和所述第二网页源代码进行存储。
在一种可选的实施例中,所述落地页地址对应有多个广告,则处理模块403,还用于在确定所述在投广告违规之后,将与所述落地页地址对应的多个广告从所述广告投放平台中删除。
在一种可选的实施例中,所述在投广告为所述广告平台中状态设置为有效的广告。
在一种可选的实施例中,所述在投广告的形式至少包括:文字、视频或图片。
根据以上内容可以看出,本申请实施例提供的应用于广告投放平台中的,用于监测违规广告的装置,针对所述广告投放平台中的任一在投广告,在获取第一网页源代码、第二网页源代码之后,通过对第一网页源代码、第二网页源代码进行切分形成多个第一字符段、多个第二字符段,之后由多个第一字符段、多个第二字符段分别组成第一字符段集合、第二字符段集合,之后再根据第一字符段集合和第二字符段集合确定第一网页源代码与第二网页源代码之间的相似度,并在相似度低于预设阈值时,即可确定在投广告违规。由于本申请提供的监测违规广告的方法,是在广告投放平台中自动化执行的,只需要在确定出第一网页源代码与第二网页源代码之间的相似度低于预设阈值时,即可确定在投广告违规,而无需再采用人工监测违规广告的方式,从而提高了监测违规广告的效率。此外,也不再需要配置大量的人力物力,还节省了人力成本。
与上述方法实施例相对应地,本申请实施例还提供了一种服务器。该服务器可以是广告投放平台,该服务器至少包括用于存储数据的存储器和用于数据处理的处理器。其中,对于用于数据处理的处理器而言,在执行处理时,可以采用微处理器、CPU、GPU(Graphics Processing Unit,图形处理单元)、DSP或FPGA实现。对于存储器来说,存储器中存储有操作指令,该操作指令可以为计算机可执行程序,通过处理器执行该计算机可执行程序来实现上述本申请实施例的用于监测违规广告的方法流程中的各个步骤。
图5为本申请实施例提供的一种服务器的结构示意图;如图5所示,本申请实施例中该服务器110包括:处理器111、显示器112、存储器113、输入设备116、总线115和通讯模块114;该处理器111、存储器113、输入设备116、显示器112和通讯模块114均通过总线115连接,该总线115用于该处理器111、存储器113、显示器112、通讯模块114和输入设备116之间传输数据。
其中,存储器113可用于存储可在所述处理器上运行的计算机可执行程序以及模块,如本申请实施例中的用于监测违规广告的方法对应的程序指令/模块,处理器111通过运行存储在存储器113中的计算机可执行程序以及模块,从而执行服务器110的各种功能应用以及数据处理,如本申请实施例提供的用于监测违规广告的方法。存储器113可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个应用的应用程序等;存储数据区可存储根据服务器110的使用所创建的数据(比如第一网页源代码及原截图、第二网页源代码及监测截图)等。此外,存储器113可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其易失性固态存储器件。
处理器111是服务器110的控制中心,利用总线115以及各种接口和线路连接整个服务器110的各个部分,通过运行或执行存储在存储器113内的软件程序和/或模块,以及调用存储在存储器113内的数据,执行服务器110的各种功能和处理数据。可选的,处理器111可包括一个或多个处理单元,如CPU、GPU(Graphics Processing Unit,图形处理单元)、数字处理单元等。
该输入设备116主要用于获得用户的输入操作,当该服务器不同时,该输入设备116也可能不同。例如,当该服务器为计算机时,该输入设备116可以为鼠标、键盘等输入设备;当该服务器为智能手机、平板电脑等便携设备时,该输入设备116可以为触控屏。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机可执行程序,该计算机可执行程序用于实现本申请任一实施例所述的用于监测违规广告的方法。
在一些可能的实施例中,本申请提供的用于监测违规广告的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算机设备上运行时,所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本申请各种示例性实施例的用于监测违规广告的的方法的步骤。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是—但不限于—电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的实施例(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。
Claims (14)
1.一种用于监测违规广告的方法,其特征在于,应用于广告投放平台中,包括:
针对所述广告投放平台中的任一在投广告,获取第一网页源代码并对所述第一网页源代码进行切分形成多个第一字符段,然后将多个所述第一字符段组成第一字符段集合,所述第一网页源代码为通过使用第一IP地址访问所述在投广告的落地页地址对所述在投广告进行审核通过时的代码;
获取第二网页源代码并对所述第二网页源代码进行切分形成多个第二字符段,然后将多个所述第二字符段组成第二字符段集合,所述第二网页源代码为通过使用第二IP地址访问所述在投广告的所述落地页地址进行抓取的代码;
根据所述第一字符段集合和所述第二字符段集合,分别确定第三字符段集合和第四字符段集合,所述第三字符段集合是指同时存在于所述第一字符段集合和所述第二字符段集合中的所有字符段的集合,所述第四字符段集合是指存在于所述第一字符段集合中或者存在于所述第二字符段集合中的所有字符段的集合;
根据所述第三字符段集合和所述第四字符段集合,确定所述第一网页源代码与所述第二网页源代码之间的相似度,若所述相似度低于预设阈值,则确定所述在投广告违规。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一网页源代码进行切分,包括:
以预设字符个数按照预设顺序对所述第一网页源代码进行切分;
所述对所述第二网页源代码进行切分,包括:
以所述预设字符个数按照所述预设顺序对所述第二网页源代码进行切分。
3.根据权利要求1所述的方法,其特征在于,在获取所述第一网页源代码之前,还包括:
在通过使用所述第一IP地址访问所述在投广告的落地页地址对所述在投广告进行审核通过之后,根据所述落地页地址分别确定存储所述第一网页源代码和存储所述第二网页源代码的第一存储地址和第二存储地址;
根据所述第一存储地址和所述第二存储地址,分别将所述第一网页源代码和所述第二网页源代码进行存储。
4.根据权利要求1所述的方法,其特征在于,所述落地页地址对应有多个广告,则在确定所述在投广告违规之后,还包括:
将与所述落地页地址对应的多个广告从所述广告投放平台中删除。
5.根据权利要求1所述的方法,其特征在于,所述在投广告为所述广告平台中状态设置为有效的广告。
6.根据权利要求1所述的方法,其特征在于,所述在投广告的形式至少包括:文字、视频或图片。
7.一种用于监测违规广告的装置,其特征在于,应用于广告投放平台中,包括:获取模块、切分模块、处理模块;
所述获取模块,用于针对所述广告投放平台中的任一在投广告,获取第一网页源代码并指示所述切分模块对所述第一网页源代码进行切分形成多个第一字符段,然后将多个所述第一字符段组成第一字符段集合,所述第一网页源代码为通过使用第一IP地址访问所述在投广告的落地页地址对所述在投广告进行审核通过时的代码;
所述获取模块,还用于获取第二网页源代码并指示所述切分模块对所述第二网页源代码进行切分形成多个第二字符段,然后将多个所述第二字符段组成第二字符段集合,所述第二网页源代码为通过使用第二IP地址访问所述在投广告的所述落地页地址进行抓取的代码;
所述处理模块,用于根据所述第一字符段集合和所述第二字符段集合,分别确定第三字符段集合和第四字符段集合,所述第三字符段集合是指同时存在于所述第一字符段集合和所述第二字符段集合中的所有字符段的集合,所述第四字符段集合是指存在于所述第一字符段集合中或者存在于所述第二字符段集合中的所有字符段的集合;
所述处理模块,还用于根据所述第三字符段集合和所述第四字符段集合,确定所述第一网页源代码与所述第二网页源代码之间的相似度,若所述相似度低于预设阈值,则确定所述在投广告违规。
8.根据权利要求7所述的装置,其特征在于,所述切分模块具体用于:
以预设字符个数按照预设顺序对所述第一网页源代码进行切分;以及
以所述预设字符个数按照所述预设顺序对所述第二网页源代码进行切分。
9.根据权利要求7所述的装置,其特征在于,还包括:存储模块;
所述处理模块,还用于在获取所述第一网页源代码之前,并在通过使用所述第一IP地址访问所述在投广告的落地页地址对所述在投广告进行审核通过之后,根据所述落地页地址分别确定存储所述第一网页源代码和存储所述第二网页源代码的第一存储地址和第二存储地址;
所述存储模块,用于根据所述第一存储地址和所述第二存储地址,分别将所述第一网页源代码和所述第二网页源代码进行存储。
10.根据权利要求7所述的装置,其特征在于,所述落地页地址对应有多个广告,则所述处理模块,还用于在确定所述在投广告违规之后,将与所述落地页地址对应的多个广告从所述广告投放平台中删除。
11.根据权利要求7所述的装置,其特征在于,所述在投广告为所述广告平台中状态设置为有效的广告。
12.根据权利要求7所述的装置,其特征在于,所述在投广告的形式至少包括:文字、视频或图片。
13.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机可执行程序,其特征在于,所述计算机可执行程序被处理器执行时,实现权利要求1-6中任一项所述的方法。
14.一种服务器,其特征在于,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机可执行程序,当所述计算机可执行程序被所述处理器执行时,实现权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110569674.3A CN113269587A (zh) | 2021-05-24 | 2021-05-24 | 一种用于监测违规广告的方法、装置、存储介质和服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110569674.3A CN113269587A (zh) | 2021-05-24 | 2021-05-24 | 一种用于监测违规广告的方法、装置、存储介质和服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113269587A true CN113269587A (zh) | 2021-08-17 |
Family
ID=77232624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110569674.3A Pending CN113269587A (zh) | 2021-05-24 | 2021-05-24 | 一种用于监测违规广告的方法、装置、存储介质和服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113269587A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837772A (zh) * | 2021-09-24 | 2021-12-24 | 支付宝(杭州)信息技术有限公司 | 一种对营销信息进行审核的方法、装置及设备 |
CN114266597A (zh) * | 2021-12-22 | 2022-04-01 | 深圳市维卓数字营销有限公司 | 一种违规广告信息的处理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104731868A (zh) * | 2015-02-28 | 2015-06-24 | 小米科技有限责任公司 | 拦截广告的方法及装置 |
US9159067B1 (en) * | 2012-06-22 | 2015-10-13 | Google Inc. | Providing content |
CN108880921A (zh) * | 2017-05-11 | 2018-11-23 | 腾讯科技(北京)有限公司 | 网页监测方法 |
CN109740094A (zh) * | 2018-12-27 | 2019-05-10 | 上海掌门科技有限公司 | 页面监测方法、设备和计算机存储介质 |
CN112749351A (zh) * | 2019-10-29 | 2021-05-04 | 金色熊猫有限公司 | 链接地址确定方法、装置、计算机可读存储介质及设备 |
-
2021
- 2021-05-24 CN CN202110569674.3A patent/CN113269587A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9159067B1 (en) * | 2012-06-22 | 2015-10-13 | Google Inc. | Providing content |
CN104731868A (zh) * | 2015-02-28 | 2015-06-24 | 小米科技有限责任公司 | 拦截广告的方法及装置 |
CN108880921A (zh) * | 2017-05-11 | 2018-11-23 | 腾讯科技(北京)有限公司 | 网页监测方法 |
CN109740094A (zh) * | 2018-12-27 | 2019-05-10 | 上海掌门科技有限公司 | 页面监测方法、设备和计算机存储介质 |
CN112749351A (zh) * | 2019-10-29 | 2021-05-04 | 金色熊猫有限公司 | 链接地址确定方法、装置、计算机可读存储介质及设备 |
Non-Patent Citations (1)
Title |
---|
韩红旗, 科学技术文献出版社 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837772A (zh) * | 2021-09-24 | 2021-12-24 | 支付宝(杭州)信息技术有限公司 | 一种对营销信息进行审核的方法、装置及设备 |
CN114266597A (zh) * | 2021-12-22 | 2022-04-01 | 深圳市维卓数字营销有限公司 | 一种违规广告信息的处理方法 |
CN114266597B (zh) * | 2021-12-22 | 2023-12-26 | 深圳市维卓数字营销有限公司 | 一种违规广告信息的处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11546418B2 (en) | Method, client, server, and system for sharing content | |
US10075552B2 (en) | Systems and methods for caching augmented reality target data at user devices | |
CN110941778B (zh) | 广告中的广告主标识符的自动验证 | |
Anderson et al. | Spamscatter: Characterizing internet scam hosting infrastructure | |
US9846893B2 (en) | Systems and methods of serving parameter-dependent content to a resource | |
US20100125523A1 (en) | Method and a system for certifying a document for advertisement appropriateness | |
US10713693B2 (en) | Method and apparatus for advertising content management | |
EP3047370B1 (en) | Method and system for inferring risk of data leakage from third-party tags | |
CN109669795B (zh) | 崩溃信息处理方法及装置 | |
CN113269587A (zh) | 一种用于监测违规广告的方法、装置、存储介质和服务器 | |
US8719091B2 (en) | System, method and computer program for determining tags to insert in communications | |
US10037552B1 (en) | Systems and methods for discovery and tracking of obscured web-based advertisements | |
US20210390181A1 (en) | Generating Simulated Spear Phishing Messages and Customized Cybersecurity Training Modules Using Machine Learning | |
KR20060130029A (ko) | 컴퓨터 네트워크를 통한 광고 캠페인의 최적화 방법 | |
US11182826B1 (en) | Email compliance systems and methods | |
US20140012686A1 (en) | Systems and methods for providing message-enabled advertisements and content delivery | |
CN109087139B (zh) | 用于feed流的广告投放方法及装置 | |
CN102739776A (zh) | 一种展现信息的方法、装置及系统 | |
CN101369332A (zh) | 一种在手机网页中嵌入广告信息的方法和系统 | |
CN110943989B (zh) | 一种设备鉴别方法、装置、电子设备及可读存储介质 | |
CN109831417B (zh) | 防骚扰处理帐号的方法、装置、服务器及存储介质 | |
CN110334301B (zh) | 一种页面还原方法及装置 | |
AU2013221949A1 (en) | Online content collection | |
US10778711B2 (en) | Systems and methods for network traffic analysis | |
WO2020066084A1 (ja) | 検知装置、検知方法および検知プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210817 |
|
RJ01 | Rejection of invention patent application after publication |