CN108073631A - 一种防止广告页面修改的方法及装置 - Google Patents

一种防止广告页面修改的方法及装置 Download PDF

Info

Publication number
CN108073631A
CN108073631A CN201611010210.4A CN201611010210A CN108073631A CN 108073631 A CN108073631 A CN 108073631A CN 201611010210 A CN201611010210 A CN 201611010210A CN 108073631 A CN108073631 A CN 108073631A
Authority
CN
China
Prior art keywords
content
page
advertisement page
detected
advertisement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611010210.4A
Other languages
English (en)
Inventor
陈国斌
高超霖
杨友林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Founder International Beijing Co Ltd
Original Assignee
Founder International Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Founder International Beijing Co Ltd filed Critical Founder International Beijing Co Ltd
Priority to CN201611010210.4A priority Critical patent/CN108073631A/zh
Publication of CN108073631A publication Critical patent/CN108073631A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种防止广告页面修改的方法及装置,用以解决现有技术中存在的不能防止广告页面修改的问题,包括:确定检测要素;获取待检测广告页面的检测要素对应的第一页面内容;获取待检测广告页面对应的合规广告页面的检测要素对应的第二页面内容;确定第一页面内容与第二页面内容是否相同;若不相同,则屏蔽待检测广告页面。第二页面内容是合规广告页面中检测要素所对应的内容,如果第一页面内容和第二页面内容有差别,就说明待检测广告页面较合规页面内容发生了变化,通过对比检测要素,便能及时发现并屏蔽这些发生修改的广告页面,从而可以解决广告页面发生修改,但无法及时发现的问题。

Description

一种防止广告页面修改的方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种防止广告页面修改的方法及装置。
背景技术
近来年,广告乱象横生,不良影响的广告更是层出不穷,映入了人们的眼帘,进而影响到人们的生活,随着国家法律政策的健全,政府对不良影响广告的打击力度的加强,但是这类广告没有彻底消亡,而是由公众视野转战为隐蔽的方式进一步危害着人们的生活,其中一种便是更改广告登陆页内容,即在广告审核时登陆页内容是良性的、健康的,但是广告发布后,登陆页内容发生了更改,变为不良的、不健康的内容了,如何防止这样的事情发生,目前仍没有一种很好的方法。
发明内容
本发明提供一种防止广告页面修改的方法及装置,用以解决现有技术中存在的不能防止广告页面修改的问题。
本发明实施例提供一种防止广告页面修改的方法,包括:
确定检测要素;
获取待检测广告页面的检测要素对应的第一页面内容;
获取待检测广告页面对应的合规广告页面的检测要素对应的第二页面内容;
确定第一页面内容与第二页面内容是否相同;
若不相同,则屏蔽待检测广告页面。
可选地,还包括:
若第一页面内容与第二页面内容相同,则重新设定检测要素,并返回获取待检测广告页面的检测要素对应的第一页面内容的步骤,直至第一页面内容与第二页面内容不相同或待检测广告页面的各要素均比较完毕。
可选地,包括:
待检测广告页面的各要素包括文字内容、图片内容和视频内容;
检测要素按照文字内容、图片内容和视频内容依次设定。
可选地,检测要素按照文字内容、图片内容和视频内容依次设定,包括:
获取待检测广告页面的文字内容,将待检测广告页面的文字内容和合规广告页面的文字内容进行比较;
若文字内容相同,则获取待检测广告页面的图片内容,将待检测广告页面的图片内容和合规广告页面的图片内容进行比较;
若图片内容相同,则获取待检测广告页面的视频内容,将待检测广告页面的视频内容和合规广告页面的视频内容进行比较。
可选地,检测要素为视频内容,视频内容对应的页面内容为图像截图;
确定第一页面内容与第二页面内容是否相同,包括:
依据设定的视频截取规则,截取待检测广告页面的视频内容的各第一图像截图;
依据设定的视频截取规则,截取合规广告页面的视频内容的各第二图像截图;
依据设定的视频截取规则,比对各第一图像截图各第二图像截图。
本发明实施例提供一种防止广告页面修改的装置,包括:
确定模块,用于确定检测要素;
爬取模块,用于获取待检测广告页面的检测要素对应的第一页面内容;
获取模块,用于获取待检测广告页面对应的合规广告页面的检测要素对应的第二页面内容;
判断模块,用于确定第一页面内容与第二页面内容是否相同;
处理模块,用于当第一页面内容与第二页面内容不相同时,屏蔽待检测广告页面。
可选地,还包括:
循环模块,用于当第一页面内容与第二页面内容相同时,重新设定检测要素,并返回获取待检测广告页面的检测要素对应的第一页面内容的步骤,直至第一页面内容与第二页面内容不相同或待检测广告页面的各要素均比较完毕。
可选地,包括:
确定模块,用于按照文字内容、图片内容和视频内容依次设定检测要素。
可选地,包括:
爬取模块,用于获取待检测广告页面的文字内容;
获取模块,用于获取合规广告页面的文字内容;
判断模块,用于将待检测广告页面的文字内容和合规广告页面的文字内容进行比较;
循环模块,用于当文字内容相同时,控制爬取模块获取检测广告页面的图片内容,控制获取模块获取合规广告页面的图片内容,控制判断模块将待检测广告页面的图片内容和合规广告页面的图片内容进行比较;
循环模块,用于当图片内容相同时,控制爬取模块获取待检测广告页面的视频内容,控制获取模块获取合规广告页面的视频内容,控制判断模块将待检测广告页面的视频内容和合规广告页面的视频内容进行比较。
可选地,包括:
爬取模块,用于依据设定的视频截取规则,截取待检测广告页面的视频内容的各第一图像截图;
获取模块,用于依据设定的视频截取规则,截取合规广告页面的视频内容的各第二图像截图;
判断模块,用于依据设定的视频截取规则,比对各第一图像截图各第二图像截图。
综上所述,本发明实施例提供了一种防止广告页面修改的方法及装置,包括:确定检测要素;获取待检测广告页面的检测要素对应的第一页面内容;获取所述待检测广告页面对应的合规广告页面的检测要素对应的第二页面内容;确定所述第一页面内容与所述第二页面内容是否相同;若不相同,则屏蔽所述待检测广告页面。第二页面内容是合规广告页面中检测要素所对应的内容,如果第一页面内容和第二页面内容有差别,就说明待检测广告页面较合规页面内容发生了变化,通过对比检测要素,便能及时发现并屏蔽这些发生修改的广告页面,从而可以解决广告页面发生修改,但无法及时发现的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种防止广告页面修改的方法流程示意图;
图2为本发明实施例提供的一种广告页面检测流程图;
图3为本发明实施例提供的一种防止广告页面修改的装置结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种防止广告页面修改的方法流程示意图,如图1所示,包括以下步骤:
S101:确定检测要素;
S102:获取待检测广告页面的检测要素对应的第一页面内容;
S103:获取待检测广告页面对应的合规广告页面的检测要素对应的第二页面内容;
S104:确定第一页面内容与第二页面内容是否相同;
S105:若不相同,则屏蔽待检测广告页面。
具体实施过程中,本发明所指的广告网页指的是通过互联网直接访问的广告着陆页,即点开网页中的广告链接出现的网页即为本发明所指的广告网页,可选地,若与网页爬取技术相结合,本发明亦可解决广告着陆页下级网页防修改问题。
在步骤S101的具体实施过程中,确定检测要素主要指的是确定需要检测的内容,比如文字、图片、视频、音频等都属于检测要素,可选地,在确定检测要素时,先确定较为简单的要素作为检测要素,这是因为,只要有一个要素发生了变化就说明广告页面已被修改从而无需再检测其它要素,选择简单的要素作为检测要素可以提高检测效率
在步骤S102的具体实施过程中,获取待检测广告页面的检测要素对应的第一页面内容,此处第一页面内容指的是,访问广告页面时,广告页面在被访问时刻的内容,如文字、图片、视频等。一般,通过广告页面的超文本标记语言(HyperText Markup Language,HTML)文件来获取广告页面的页面内容。广告页面的HTML文件中包含了这个广告页面的图片、链接,甚至音乐、视频、程序等非文字要素,在获取各要素的第一页面内容时,可以根据接下来需要被用来比对以检测广告页面的要素类型,选择性地从广告页面的HTML文件中获取目标要素的第一页面内容。可选地,根据各要素的类型不同,获取方式也有所区别,例如,对于文字要素,可以直接从HTML文件中获取,对于图片或者视频内容,可以从HTML文件中的超链接中获取。可选地,对于各要素的第一页面内容的获取,也可以直接从HTML文件中将所有要素的第一页面内容全部提取,之后,再从中挑选出设定的检测要素相对应第一页面内容,可选地,除了文字要素可以直接从HTML文件中提取外,其它要素都通过HTML中的各标签查询,一般能够直接反应网页内容的标签为<img>、<object>、<video>、<audio>、<embed>、<script>和<applet>这七种标签,它们包含了网页的图片、视频、音频、网页(Flash)动画、程序等多种内容。可选地,检测要素为视频内容时,视频内容对应的页面内容为图像截图。在获取视频内容对应的第一页面内容时,依据设定的视频截取规则,截取待检测广告页面的视频内容的各第一图像截图。视频内容要素相对于其它要素来说,由于其具有连贯性,因此更难检测是否发生变化,依据设定的视频截取规则,截取所述待检测广告页面的视频内容的各第一图像截图,例如,截取规则为从视频开始,每隔1秒截一次图。对于视频类内容的获取便是获取其按截取规则截取的视频截图。
在步骤S103的具体实施过程中,待检测广告页面对应的合规广告页面具体指的是网站在发布一个广告链接时,会先对这个链接所对应的广告内容进行审核,只有当这个广告页面内容符合国家法律规定时才会被网站发布,此时的广告页面便是合规的广告页面,即,合规广告页面指的是待检测广告页面在发布前经发布网站审核并通过时的的页面内容,如果待检测广告页面的内容与合规广告页面的内容出现差别,便说明这个待检测广告页面已经被修改。在确定所述合规页面审核通过后,通过爬取程序对,待检测广告页面的各类要素对应的第二页面内容,这里的第二页面内容,指的便是合规广告页面中,各要素对应的内容。提取的第二页面内容相对应的要素类型应当为检测要素,这样才可以实现与第一页面的比对功能。可选地,在广告发布之前便从合规广告页面中获取所有要素对应的第二页面内容并存储,当对待检测广告页面进行检测时,根据检测要素类型从存储中提取出检测要素对应的第二页面内容。可选地,将各要素对应的第二页面内容采用哈希(Hash)处理,转换成Hash码的形式存储。可选地,从合规广告页面中提取的各要素中包括了视频内容,视频内容要素的第二页面内容的获取规则与视频类要素的第一页面内容一致,例如,第一规则可以只是截取视频的第一个截图,以减少处理数据,检测视频是否被替换,也可以是按照从视频开始,每隔1秒截取一次视频截图的,截取规则一致,第一页面内容和第二页面内容的对比才有意义,以防止视频中间被修改。
在步骤S104的具体实施过程中,需要对提取的检测要素的第一页面内容和第二页面内容进行对比。可选地,将第一页面内容采用Hash处理,转换成Hash码的形式之后,在于Hash码形式的第二页面内容处理。每一个源码经过Hash处理转换后,生成的Hash码是独一无二的,采用Hash码的形式进行存储,可以减少存储空间的消耗,采用Hash码的形式进行对比,可以简化对比过程,提高对比效率。可选地,当检测要素为视频要素时,对应视频内容要素的第一页面内容和第二页面内容,按照视频截图的截取顺序依次对比截图内容,若有一个发生了变化,则认为此视频内容已被修改。
在步骤S105的具体实施过程中,屏蔽待检测广告页面主要是通过屏蔽待检测广告页面的地址实现的,使得当用户点击广告登陆链接时,无法进入广告登陆页面。可选地,对于经过检测而被屏蔽的广告页面,保留其检测数据作为证据,例如,待检测广告页面的图片内容较合规广告页面的图片内容发生了变化,则保留此待检测广告页面的图片内容数据用作后续处理过程中的证据。
可选地,若所述第一页面内容与所述第二页面内容相同,则重新设定检测要素,并返回获取待检测广告页面的检测要素对应的第一页面内容的步骤,直至所述第一页面内容与所述第二页面内容不相同或所述待检测广告页面的各要素均比较完毕。一个网页包含了多个要素,仅对比一种要素获得的结果可信度较低,因此需设定多个待检测要素,依次设为检测要素进行检测,若其中有一个发生了变化,则认为广告页面被修改。可选地,所述待检测广告页面的待检测要素包括文字内容、图片内容和视频内容;所述检测要素按照文字内容、图片内容和视频内容依次设定。其具体比较过程为:获取待检测广告页面的文字内容,将待检测广告页面的文字内容和合规广告页面的文字内容进行比较;若文字内容相同,则获取待检测广告页面的图片内容,将待检测广告页面的图片内容和合规广告页面的图片内容进行比较;若图片内容相同,则获取待检测广告页面的视频内容,将待检测广告页面的视频内容和合规广告页面的视频内容进行比较。这是因为,相对应图片和视频内容,文字内容更容易对比,若文字内容发生了变化,便不再需要进行图片内容和视频内容的对比,相同道理,图片内容比视频内容更容易对比,若图片内容发生了变化,也不在需要进行视频内容的对比,即,先对比简单要素的第一页面内容和第二页面内容,在对比复杂要素的第一页面内容和第二页面内容。可选地,在检测完文字内容、图片内容和视频内容这三个要素后,继续检测脚本这个要素,这是由于,网页中的非法脚本可能会动态地改变其它要素。对于脚本要素,从待检测网页中提取脚本要素的第一页面内容,与合法广告页面的脚本要素的第二页面内容对比,若脚本要素对应的页面内容发生了变化,说明广告页面已被修改。
可选地,对于检测后未发送修改的广告页面仍保持周期性检测。可选地,周期性获取待检测广告页面的各类要素对应的第一页面内容,周期时长由实际应用情况决定。获取各类要素对应的第一页面内容之后,重复前述过程,以保证待检测广告页面即使在被检测合格之后也不能非法修改广告页面。可选地,对于可信度较高的广告页面提供商,可以适当延长检测周期时长,对于可信度较低的广告页面提供商,可以适当缩短检测周期时长。通过加入周期性设定,可以达到自动侦听、自动比对、自动屏蔽不良广告页面的目的。
图2为本发明实施例提供的一种广告页面检测流程图,如图2所示,包括以下步骤:
S201:访问待检测广告页面;
S202:获取待检测广告页面文字内容;
S203:获取合规广告页面的文字内容并与待检测广告页面的文字内容相对比,判断二者是否一致;若是,则执行步骤S204,若否,则执行步骤S211;
S204:获取待检测广告页面图片内容;
S205:获取合规广告页面的图片内容并与待检测广告页面的图片内容相对比,判断二者是否一致;若是,则执行步骤S206,若否,则执行步骤S211;
S206:获取待检测广告页面视频内容;
S207:获取合规广告页面的视频内容并与待检测广告页面的视频内容相对比,判断二者是否一致;若是,则执行步骤S208,若否,则执行步骤S211;
S208:获取待检测广告页面脚本内容;
S209:获取合规广告页面的脚本内容并与待检测广告页面的脚本内容相对比,判断二者是否一致;若是,则执行步骤S210,若否,则执行步骤S211
S210:得到页面未被修改的结果;
S211:屏蔽待检测广告页面。
文字、图片和视频可以大部分反应出待检测广告页面的页面内容,通过对比这三种既可以从整体上判断待检测广告页面是否被修改。
综上所述,本发明实施例提供了一种防止广告页面修改的方法,包括:确定检测要素;获取待检测广告页面的检测要素对应的第一页面内容;获取所述待检测广告页面对应的合规广告页面的检测要素对应的第二页面内容;确定所述第一页面内容与所述第二页面内容是否相同;若不相同,则屏蔽所述待检测广告页面。第二页面内容是合规广告页面中检测要素所对应的内容,如果第一页面内容和第二页面内容有差别,就说明待检测广告页面较合规页面内容发生了变化,通过对比检测要素,便能及时发现并屏蔽这些发生修改的广告页面,从而可以解决广告页面发生修改,但无法及时发现的问题。
基于相同的技术构思,本发明实施例还提供一种防止广告页面修改的装置,该装置可执行上述方法实施例。图3为本发明实施例提供的一种防止广告页面修改的装置结构示意图,如图3所示,装置300包括:确定模块301、爬取模块302、获取模块303、判断模块304和处理模块305,其中,
确定模块301,用于确定检测要素;
爬取模块302,用于获取待检测广告页面的检测要素对应的第一页面内容;
获取模块303,用于获取待检测广告页面对应的合规广告页面的检测要素对应的第二页面内容;
判断模块304,用于确定第一页面内容与第二页面内容是否相同;
处理模块305,用于当第一页面内容与第二页面内容不相同时,屏蔽待检测广告页面。
可选地,装置300还包括:
循环模块306,用于当第一页面内容与第二页面内容相同时,重新设定检测要素,并返回所述爬取模块获取待检测广告页面的检测要素对应的第一页面内容的步骤,直至所述第一页面内容与所述第二页面内容不相同或待检测广告页面的各要素均比较完毕。
可选地,确定模块301,用于按照文字内容、图片内容和视频内容依次设定检测要素。
可选地,爬取模块302,用于获取待检测广告页面的文字内容;
获取模块303,用于获取合规广告页面的文字内容;
判断模块304,用于将待检测广告页面的文字内容和合规广告页面的文字内容进行比较;
循环模块306,用于当文字内容相同时,控制爬取模块302获取待检测广告页面的图片内容,控制获取模块303获取合规广告页面的图片内容,控制判断模块304将待检测广告页面的图片内容和合规广告页面的图片内容进行比较;
循环模块306,用于当图片内容相同时,控制爬取模块302获取待检测广告页面的视频内容,控制获取模块303获取合规广告页面的视频内容,控制判断模块304将待检测广告页面的视频内容和合规广告页面的视频内容进行比较。
可选地,爬取模块302,用于依据设定的视频截取规则,截取待检测广告页面的视频内容的各第一图像截图;
获取模块303,用于依据设定的视频截取规则,截取合规广告页面的视频内容的各第二图像截图;
判断模块304,用于依据设定的视频截取规则,比对各第一图像截图各第二图像截图。
综上所述,本发明实施例提供了一种防止广告页面修改的方法及装置,包括:确定检测要素;获取待检测广告页面的检测要素对应的第一页面内容;获取所述待检测广告页面对应的合规广告页面的检测要素对应的第二页面内容;确定所述第一页面内容与所述第二页面内容是否相同;若不相同,则屏蔽所述待检测广告页面。第二页面内容是合规广告页面中检测要素所对应的内容,如果第一页面内容和第二页面内容有差别,就说明待检测广告页面较合规页面内容发生了变化,通过对比检测要素,便能及时发现并屏蔽这些发生修改的广告页面,从而可以解决广告页面发生修改,但无法及时发现的问题。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种防止广告页面修改的方法,其特征在于,包括:
确定检测要素;
获取待检测广告页面的检测要素对应的第一页面内容;
获取所述待检测广告页面对应的合规广告页面的检测要素对应的第二页面内容;
确定所述第一页面内容与所述第二页面内容是否相同;
若不相同,则屏蔽所述待检测广告页面。
2.如权利要求1所述的方法,其特征在于,还包括:
若所述第一页面内容与所述第二页面内容相同,则重新设定检测要素,并返回获取待检测广告页面的检测要素对应的第一页面内容的步骤,直至所述第一页面内容与所述第二页面内容不相同或所述待检测广告页面的各要素均比较完毕。
3.如权利要求2所述的方法,其特征在于,包括:
所述待检测广告页面的各要素包括文字内容、图片内容和视频内容;
所述检测要素按照文字内容、图片内容和视频内容依次设定。
4.如权利要求3所述的方法,其特征在于,所述检测要素按照文字内容、图片内容和视频内容依次设定,包括:
获取所述待检测广告页面的文字内容,将所述待检测广告页面的文字内容和所述合规广告页面的文字内容进行比较;
若文字内容相同,则获取所述待检测广告页面的图片内容,将所述待检测广告页面的图片内容和所述合规广告页面的图片内容进行比较;
若图片内容相同,则获取所述待检测广告页面的视频内容,将所述待检测广告页面的视频内容和所述合规广告页面的视频内容进行比较。
5.如权利要求1至4任一项所述的方法,其特征在于,所述检测要素为视频内容,所述视频内容对应的页面内容为图像截图;
确定所述第一页面内容与所述第二页面内容是否相同,包括:
依据设定的视频截取规则,截取所述待检测广告页面的视频内容的各第一图像截图;
依据所述设定的视频截取规则,截取所述合规广告页面的视频内容的各第二图像截图;
依据所述设定的视频截取规则,比对各第一图像截图各第二图像截图。
6.一种防止广告页面修改的装置,其特征在于,包括:
确定模块,用于确定检测要素;
爬取模块,用于获取待检测广告页面的检测要素对应的第一页面内容;
获取模块,用于获取所述待检测广告页面对应的合规广告页面的检测要素对应的第二页面内容;
判断模块,用于确定所述第一页面内容与所述第二页面内容是否相同;
处理模块,用于当第一页面内容与所述第二页面内容不相同时,屏蔽所述待检测广告页面。
7.如权利要求1所述的装置,其特征在于,还包括:
循环模块,用于当所述第一页面内容与所述第二页面内容相同时,重新设定检测要素,并返回获取待检测广告页面的检测要素对应的第一页面内容的步骤,直至所述第一页面内容与所述第二页面内容不相同或所述待检测广告页面的各要素均比较完毕。
8.如权利要求7所述的装置,其特征在于,包括:
所述确定模块,用于按照文字内容、图片内容和视频内容依次设定所述检测要素。
9.如权利要求8所述的装置,其特征在于,包括:
所述爬取模块,用于获取所述待检测广告页面的文字内容;
所述获取模块,用于获取所述合规广告页面的文字内容;
所述判断模块,用于将所述待检测广告页面的文字内容和所述合规广告页面的文字内容进行比较;
所述循环模块,用于当文字内容相同时,控制所述爬取模块获取所述检测广告页面的图片内容,控制所述获取模块获取所述合规广告页面的图片内容,控制所述判断模块将所述待检测广告页面的图片内容和所述合规广告页面的图片内容进行比较;
所述循环模块,用于当图片内容相同时,控制所述爬取模块获取所述待检测广告页面的视频内容,控制所述获取模块获取所述合规广告页面的视频内容,控制所述判断模块将所述待检测广告页面的视频内容和所述合规广告页面的视频内容进行比较。
10.如权利要求6至9任一项所述的装置,其特征在于,包括:
所述爬取模块,用于依据设定的视频截取规则,截取所述待检测广告页面的视频内容的各第一图像截图;
所述获取模块,用于依据所述设定的视频截取规则,截取所述合规广告页面的视频内容的各第二图像截图;
所述判断模块,用于依据所述设定的视频截取规则,比对各第一图像截图各第二图像截图。
CN201611010210.4A 2016-11-16 2016-11-16 一种防止广告页面修改的方法及装置 Pending CN108073631A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611010210.4A CN108073631A (zh) 2016-11-16 2016-11-16 一种防止广告页面修改的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611010210.4A CN108073631A (zh) 2016-11-16 2016-11-16 一种防止广告页面修改的方法及装置

Publications (1)

Publication Number Publication Date
CN108073631A true CN108073631A (zh) 2018-05-25

Family

ID=62163329

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611010210.4A Pending CN108073631A (zh) 2016-11-16 2016-11-16 一种防止广告页面修改的方法及装置

Country Status (1)

Country Link
CN (1) CN108073631A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740094A (zh) * 2018-12-27 2019-05-10 上海掌门科技有限公司 页面监测方法、设备和计算机存储介质
CN110912918A (zh) * 2019-12-02 2020-03-24 泰康保险集团股份有限公司 页面修复方法及装置
CN111488540A (zh) * 2019-01-29 2020-08-04 百度在线网络技术(北京)有限公司 信息屏蔽监测方法、装置、设备及计算机可读介质
WO2020199649A1 (zh) * 2019-03-29 2020-10-08 上海幻电信息科技有限公司 网页广告变更监测方法、装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102084388A (zh) * 2008-06-23 2011-06-01 双重验证有限公司 基于因特网的广告的自动监控和验证
US20140289058A1 (en) * 2013-03-22 2014-09-25 Yahoo Japan Corporation Advertisement generation apparatus and terminal device
CN104202622A (zh) * 2014-09-23 2014-12-10 山东泰信电子股份有限公司 一种广告安全播出方法及系统
CN104394463A (zh) * 2014-11-28 2015-03-04 北京国双科技有限公司 广告播放的监控方法和装置
CN105306467A (zh) * 2015-10-30 2016-02-03 北京奇虎科技有限公司 网页数据篡改的分析方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102084388A (zh) * 2008-06-23 2011-06-01 双重验证有限公司 基于因特网的广告的自动监控和验证
US20140289058A1 (en) * 2013-03-22 2014-09-25 Yahoo Japan Corporation Advertisement generation apparatus and terminal device
CN104202622A (zh) * 2014-09-23 2014-12-10 山东泰信电子股份有限公司 一种广告安全播出方法及系统
CN104394463A (zh) * 2014-11-28 2015-03-04 北京国双科技有限公司 广告播放的监控方法和装置
CN105306467A (zh) * 2015-10-30 2016-02-03 北京奇虎科技有限公司 网页数据篡改的分析方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740094A (zh) * 2018-12-27 2019-05-10 上海掌门科技有限公司 页面监测方法、设备和计算机存储介质
CN111488540A (zh) * 2019-01-29 2020-08-04 百度在线网络技术(北京)有限公司 信息屏蔽监测方法、装置、设备及计算机可读介质
CN111488540B (zh) * 2019-01-29 2024-04-02 百度在线网络技术(北京)有限公司 信息屏蔽监测方法、装置、设备及计算机可读介质
WO2020199649A1 (zh) * 2019-03-29 2020-10-08 上海幻电信息科技有限公司 网页广告变更监测方法、装置及存储介质
US20220198513A1 (en) * 2019-03-29 2022-06-23 Shanghai Hode Information Technology Co., Ltd. Web advertisement change monitoring method, device and storage medium
US11948168B2 (en) * 2019-03-29 2024-04-02 Shanghai Hode Information Technology Co., Ltd. Web advertisement change monitoring method, device and storage medium
CN110912918A (zh) * 2019-12-02 2020-03-24 泰康保险集团股份有限公司 页面修复方法及装置

Similar Documents

Publication Publication Date Title
US20240121266A1 (en) Malicious script detection
US10728274B2 (en) Method and system for injecting javascript into a web page
Bates et al. Regular expressions considered harmful in client-side XSS filters
Mughees et al. Detecting anti ad-blockers in the wild
CN108073631A (zh) 一种防止广告页面修改的方法及装置
US20160065613A1 (en) System and method for detecting malicious code based on web
CN104035984B (zh) 一种浏览器中进行弹窗拦截的方法和一种弹窗拦截的装置
CN102156832B (zh) 一种Firefox扩展的安全缺陷检测方法
CN104143008B (zh) 基于图片匹配检测钓鱼网页的方法及装置
CN102930211A (zh) 一种多核浏览器中拦截恶意网址的方法和多核浏览器
CN107688743A (zh) 一种恶意程序的检测分析方法及系统
CN103179125A (zh) 网站认证信息的显示方法及浏览器
US20170371888A1 (en) Method for advertisement interception in dual-kernel browser and browser apparatus
US20200336498A1 (en) Method and apparatus for detecting hidden link in website
CN102664872B (zh) 用于检测和防止对计算机网络中服务器攻击的方法
CN102999723A (zh) 主动防御xss攻击的数据防御组件生成方法及其装置
CN107786537A (zh) 一种基于互联网交叉搜索的孤页植入攻击检测方法
JP5499805B2 (ja) 情報処理装置、情報処理システム、情報処理方法並びに情報処理プログラム
CN106033450A (zh) 一种广告拦截的方法、装置和浏览器
EP3745292A1 (en) Hidden link detection method and apparatus for website
Shahriar et al. Proclick: a framework for testing clickjacking attacks in web applications
Mughees et al. A first look at ad-block detection: A new arms race on the web
CN104333558B (zh) 一种网址检测方法及网址检测装置
CN114157568B (zh) 一种浏览器安全访问方法、装置、设备及存储介质
CN103577188B (zh) 防御跨站脚本攻击的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180525