CN111611470A - 一种数据处理方法、装置和电子设备 - Google Patents

一种数据处理方法、装置和电子设备 Download PDF

Info

Publication number
CN111611470A
CN111611470A CN201910134019.8A CN201910134019A CN111611470A CN 111611470 A CN111611470 A CN 111611470A CN 201910134019 A CN201910134019 A CN 201910134019A CN 111611470 A CN111611470 A CN 111611470A
Authority
CN
China
Prior art keywords
search result
detected
page
result page
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910134019.8A
Other languages
English (en)
Inventor
南刚雷
张健
姜琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201910134019.8A priority Critical patent/CN111611470A/zh
Publication of CN111611470A publication Critical patent/CN111611470A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种数据处理方法、装置和电子设备,其中,所述方法包括:获取待检测搜索结果页的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识;依据所述网页地址确定所述待检测搜索结果页,从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,所述目标图像依据所述类别标识对应待检测搜索结果项的展示区域确定;将所述目标图像与对应预存的参考图像进行相似度比对,依据相似度比对结果推送提示信息;进而通过对单个搜索结果项的图像的比对,去除无需检测样式的搜索结果项的图像对比对结果的影响,从而提高检测准确性。

Description

一种数据处理方法、装置和电子设备
技术领域
本发明涉及数据处理技术领域,特别是涉及一种数据处理方法、装置和电子设备。
背景技术
随着互联网技术的不断发展,以及搜索引擎技术的发展,用户可以通过搜索平台进行信息查询。例如用户在搜索平台中输入搜索词,执行搜索操作后,搜索平台可以将搜索结果在搜索结果页中展示,用户可以在搜索结果页中选取任一搜索结果,进入对应的网页页面进行浏览。
其中,搜索平台展示的搜索结果页可能会出现页面样式错乱的问题,目前检测搜索结果页的页面样式是否错乱的方式是,对整个搜索结果页进行检测。由于部分查询词的结果实效性很强(如新闻类查询词、天气类查询词),使得这些查询词对应搜索结果页中的某一条或多条搜索结果,在不同时刻对应的页面样式可能不同;进而不同时刻对该搜索结果页面进行检测时,可能会检测到一个或多个样式错乱的区域,导致误报,检测准确性低。
发明内容
本发明实施例提供一种数据处理方法,以提高页面检测的准确性。
相应的,本发明实施例还提供了一种数据处理装置和一种电子设备,用以保证上述方法的实现及应用。
为了解决上述问题,本发明实施例公开了一种数据处理方法,具体包括:获取待检测搜索结果页的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识;依据所述网页地址确定所述待检测搜索结果页,从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,所述目标图像依据所述类别标识对应待检测搜索结果项的展示区域确定;将所述目标图像与对应预存的参考图像进行相似度比对,依据相似度比对结果推送提示信息。
可选地,所述配置信息还包括终端标识,所述依据所述网页地址确定所述待检测搜索结果页,包括:打开所述网页地址,按照所述终端标识对应的页面样式展示所述待检测搜索结果页。
可选地,所述将所述目标图像与对应预存的参考图像进行相似度比对,包括:将所述目标图像与预存的所述终端标识对应的参考图像进行相似度比对。
可选地,所述从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,包括:基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;依据所述目标区域信息,对所述待检测搜索结果页中所述目标区域信息对应的展示区域进行截图,得到目标图像。
可选地,所述从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,包括:获取所述待检测搜索结果页对应的页面图像;基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;依据所述目标区域信息,从所述页面图像中截取目标图像。
可选地,所述基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息,包括:基于所述类别标识查找映射关系,确定所述类别标识对应待检测搜索结果项在所述搜索结果页中最外层展示区域图层的区域信息;将所述最外层展示区域图层的区域信息,确定为所述搜索结果页中所述类别标识对应待检测搜索结果项对应的目标区域信息。
可选地,所述目标区域信息包括:所述最外层展示区域图层的左上角位置点对应的位置信息,和,最外层显示区域图层的尺寸。
可选地,所述参考图像包括:基准样式图像和容错样式图像;所述将所述目标图像与对应预存的参考图像进行相似度比对,包括:将所述目标图像与对应的基准样式图像进行相似度比对,确定第一相似度;若所述第一相似度低于相似度阈值,则将所述目标图像与对应的容错样式图像进行相似度比对,确定第二相似度。
本发明实施例还公开了一种数据处理装置,具体包括:信息获取模块,用于获取待检测搜索结果页的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识;图像提取模块,用于依据所述网页地址确定所述待检测搜索结果页,从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,所述目标图像依据所述类别标识对应待检测搜索结果项的展示区域确定;图像比对模块,用于将所述目标图像与对应预存的参考图像进行相似度比对,依据相似度比对结果推送提示信息。
可选地,所述配置信息还包括终端标识,所述图像提取模块包括:页面展示子模块,用于打开所述网页地址,按照所述终端标识对应的页面样式展示所述待检测搜索结果页。
可选地,所述图像比对模块包括:第一相似度对比子模块,用于将所述目标图像与预存的所述终端标识对应的参考图像进行相似度比对。
可选地,所述图像提取模块包括:信息查找子模块,用于基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;第一提取子模块,用于依据所述目标区域信息,对所述待检测搜索结果页中所述目标区域信息对应的展示区域进行截图,得到目标图像。
可选地,所述图像提取模块包括:图像获取子模块,用于获取所述待检测搜索结果页对应的页面图像;信息查找子模块,用于基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;第二提取子模块,用于依据所述目标区域信息,从所述页面图像中截取目标图像。
可选地,所述信息查找子模块,用于基于所述类别标识查找映射关系,确定所述类别标识对应待检测搜索结果项在所述搜索结果页中最外层展示区域图层的区域信息;将所述最外层展示区域图层的区域信息,确定为所述搜索结果页中所述类别标识对应待检测搜索结果项对应的目标区域信息。
可选地,所述目标区域信息包括:所述最外层展示区域图层的左上角位置点对应的位置信息,和,最外层显示区域图层的尺寸。
可选地,所述参考图像包括:基准样式图像和容错样式图像;所述图像比对模块包括:第二相似度对比子模块,用于将所述目标图像与对应的基准样式图像进行相似度比对,确定第一相似度;若所述第一相似度低于相似度阈值,则将所述目标图像与对应的容错样式图像进行相似度比对,确定第二相似度。
本发明实施例还公开了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如本发明实施例任一所述的数据处理方法。
本发明实施例还公开了一种电子设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取待检测搜索结果页的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识;依据所述网页地址确定所述待检测搜索结果页,从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,所述目标图像依据所述类别标识对应待检测搜索结果项的展示区域确定;将所述目标图像与对应预存的参考图像进行相似度比对,依据相似度比对结果推送提示信息。
可选地,所述配置信息还包括终端标识,所述依据所述网页地址确定所述待检测搜索结果页,包括:打开所述网页地址,按照所述终端标识对应的页面样式展示所述待检测搜索结果页。
可选地,所述将所述目标图像与对应预存的参考图像进行相似度比对,包括:将所述目标图像与预存的所述终端标识对应的参考图像进行相似度比对。
可选地,所述从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,包括:基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;依据所述目标区域信息,对所述待检测搜索结果页中所述目标区域信息对应的展示区域进行截图,得到目标图像。
可选地,所述从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,包括:获取所述待检测搜索结果页对应的页面图像;基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;依据所述目标区域信息,从所述页面图像中截取目标图像。
可选地,所述基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息,包括:基于所述类别标识查找映射关系,确定所述类别标识对应待检测搜索结果项在所述搜索结果页中最外层展示区域图层的区域信息;将所述最外层展示区域图层的区域信息,确定为所述搜索结果页中所述类别标识对应待检测搜索结果项对应的目标区域信息。
可选地,所述目标区域信息包括:所述最外层展示区域图层的左上角位置点对应的位置信息,和,最外层显示区域图层的尺寸。
可选地,所述参考图像包括:基准样式图像和容错样式图像;所述将所述目标图像与对应预存的参考图像进行相似度比对,包括:将所述目标图像与对应的基准样式图像进行相似度比对,确定第一相似度;若所述第一相似度低于相似度阈值,则将所述目标图像与对应的容错样式图像进行相似度比对,确定第二相似度。
本发明实施例包括以下优点:
本发明实施例中,可以通过获取包含网页地址和类别标识的配置信息,然后依据所述网页地址确定搜索结果页,提取所述搜索结果页中所述类别标识对应目标图像,实现提取单个搜索结果项对应的目标图像;然后将单个搜索结果项的目标图像与参考图像进行相似度比对,依据相似度比对结果推送提示信息;进而通过对单个搜索结果项的图像的比对,去除无需检测样式的搜索结果项的图像对比对结果的影响,从而提高检测准确性。
附图说明
图1是本发明的一种数据处理方法实施例的步骤流程图;
图2是本发明的一种数据处理方法可选实施例的步骤流程图;
图3是本发明的一种数据处理装置实施例的结构框图;
图4是本发明的一种数据处理装置可选实施例的结构框图;
图5根据一示例性实施例示出的一种用于数据处理的电子设备的结构框图;
图6是本发明根据另一示例性实施例示出的一种用于数据处理的电子设备的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例的核心构思之一是,可以根据搜索结果页中单条搜索结果项的对比结果,来对搜索结果页进行检测;进而能够去除无需检测页面样式的搜索结果项对比对结果的影响,从而可以提高页面检测的准确性。
参照图1,示出了本发明的一种数据处理方法实施例的步骤流程图,具体可以包括如下步骤:
步骤102、获取待检测搜索结果页的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识。
步骤104、依据所述网页地址确定待检测搜索结果页,从所述待检测搜索结果页提取所述类别标识对应待检测搜索结果项的目标图像,其中,所述目标图像依据所述类别标识对应待检测搜索结果项的展示区域确定。
步骤106、将所述目标图像与对应预存的参考图像进行相似度比对,依据相似度比对结果推送提示信息。
其中,所述对应预存的参考图像为预存的。
本发明实施例中,搜索结果页处于线上环境(可以是指用户可以访问到的环境)时,可以对该搜索结果页进行检测;其中,可以通过对该搜索结果页中搜索结果项的页面样式进行检测来实现。为了便于后续说明,可以将需要检测的搜索结果页称为待检测搜索结果页,以及将待检测搜索结果页中需要检测页面样式的搜索结果项称为待检测搜索结果项;其中,一个待检测搜索结果页中可以包括至少一条待检测搜索结果项,每个待检测搜索结果项存在对应的类别标识,所述类别标识用于唯一标识搜索结果页中的一个待检测搜索结果项,所述类别标识可以标识待检测搜索结果项在搜索结果页中的位置(即第几条搜索结果项)。
本发明实施例中,在待检测搜索结果页处于线上环境时,可以将其中的待检测搜索结果项的当前图像与该搜索结果项对应的参考图像进行比对,来对该待检测搜索结果页的页面样式进行检测;其中,所述参考图像可以预先获取并存储;所述待检测搜索结果项的图像可以是指所述待检测搜索结果项在该待检测搜索结果页中对应展示区域的图像。
本发明实施例中,一种获取待检测搜索结果项对应参考图像的方式可以是,确定该待检测搜索结果页对应的网页地址,和该待检测搜索结果项对应的类别标识;然后可以在测试工具中进行配置。待用户执行检测操作后,测试工具可以从该网页地址对应待检测搜索结果页中,获取所述类别标识对应待检测搜索结果项的图像;此时所述待检测搜索结果页可以是处于线上环境,也可以是处于测试环境(可以是指上线前验证的环境)。若依据该待检测搜索结果项的图像,确定该待检测搜索结果项的页面样式满足预设条件,可以将该图像确定为参考图像,然后为该参考图像添加该待检测搜索结果项的类别标识并存储。其中,所述预设条件可以按照实际需求设置,例如待检测搜索结果页的页面样式满足产品需求。
当然,当需要对一个待检测搜索结果页中的多个搜索结果项的页面样式进行检测时,所述待检测搜索结果项可以包括多个;进而通过测试工具,结合各待检测搜索结果项的类别标识,获取各待检测搜索结果项对应的参考图像,其中,各参考图像与对应待检测搜索结果项的类别标识对应。
在获取参考图像后,可以周期性对线上环境的该网页地址对应待检测搜索结果页中,该类别标识对应的待检测搜索结果项的页面样式进行检测:每当达到预设周期时,可以获取配置信息,所述配置信息可以包括:所述待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识。然后可以打开所述网页地址对应的待检测搜索结果页,并依据所述类别标识确定对应待检测搜索结果项在该待检测搜索结果页中的展示区域,然后提取该展示区域对应的图像,可称为目标图像。其中,所述预设周期可以按照需求设置,本发明实施例对此不作限制。然后可以将目标图像和参考图像进行比对(其中,目标图像和参考图像的尺寸可以是相同的),确定两者的相似度;例如可以计算目标图像与参考图像各像素值之间的差值,依据所述差值确定目标图像与参考图像的相似度。再依据所述相似度向后台维护人员推送提示消息。例如相似度低于相似度阈值(其中,所述相似度阈值可以按照实际需求设置如0.95)时,推送异常状态消息如报警消息例如“显示异常”;又例如相似度高于相似度阈值时,可以推送正常状态消息如“显示正常”,当然可以不推送消息,具体可按照需求设置。
本发明实施例中,若待检测搜索结果项包括多个,则配置信息中的类别标识可以包括多个,后续可以提取每个类别标识对应的目标图像;然后针对每一个类别标识,将该类别标识对应的目标图像与参考图像进行相似度比对,依据相似度比对结果推送提示信息。
综上,本发明实施例中,可以通过获取待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识,然后依据所述网页地址确定待检测搜索结果页,从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,进而提取出单个搜索结果项对应的目标图像;然后将所述目标图像与对应预存的参考图像进行相似度比对,依据相似度比对结果推送提示信息;进而通过对单个搜索结果项的比对,去除无需检测样式的搜索结果项对比对结果的影响,从而提高页面检测的准确性。
不同的终端对同一搜索结果页的展示样式可能不同,因此可以分别针对不同终端的待检测搜索结果页中,待检测搜索结果项对应的图像进行检测,以进一步提高页面检测的准确性。
参照图2,示出了本发明的一种数据处理方法可选实施例的步骤流程图,具体可以包括如下步骤:
步骤202、获取待检测搜索结果页的配置信息,所述配置信息包括待检测搜索结果页的网页地址、所述待检测搜索结果页中待检测搜索结果项的类别标识和终端标识。
其中,所述终端标识可以为显示所述待检测搜索结果页的终端对应的标识。本发明实施例中,由于不同终端对同一搜索结果展示的页面样式可能是不同的,因此在预先确定需要检测页面样式的待检测搜索结果页和该待检测搜索结果页中待检测搜索结果项的同时,还可以确定展示该待检测搜索结果页的终端对应的标识。然后再获取该待检测搜索结果页对应的网页地址,该待检测搜索结果项对应的类别标识,和该终端对应的终端标识;并在测试工具中采用该网页地址、类别标识和终端标识进行配置,以获取同一待检测搜索结果页中同一待检测搜索结果项,在不同终端中展示时对应的参考图像。其中,所述终端标识可以是终端操作系统信息如Android系统、IOS系统、Windows系统等等;也可以是终端型号信息等,本发明实施例对此不作限制。
本发明实施例中,所述测试工具可以包括以下功能:打开搜索结果页(如调用无头浏览器打开搜索结果页),从搜索结果页中提取搜索结果项的图像,自动将提取的目标图像和参考图像进行比对,依据比对结果推送提示消息等,本发明实施例对此不作限制;如浏览器自动化测试工具。本发明的一个示例中,一种测试工具可以包括多个配置项如Url(Uniform Resource Locator,统一资源定位符)、Selector(选择器)、User-Agent(用户代理)、Host(域名)、其他参数、图片地址、阈值和备注;其中,Url配置项用于配置网页地址,Selector配置项用于配置类别标识,User-Agent配置项用于配置终端标识,Host配置项用于配置参考图像的获取环境(可以是是测试环境还是线上环境,例如当不配置该项时,则在线上环境获取参考图像),其他参数配置项可以用于配置与网页地址相关的参数如cookie页面参数(其中,与网页地址相关的参数也可以在Url配置项中进行配置,本发明实施例对此不作限制),图片地址配置项用于配置参考图像的存储地址,阈值配置项用于配置相似度阈值,备注配置项用于配置注意事项如时间等。配置完成后,用户可以执行检测操作,所述检测操作可以包括两个操作:点击预览按钮的操作和点击保存按钮的操作;其中,用户点击预览按钮后,可以生成对应的图像并在该配置界面中展示该图像,若依据该图像确定待检测搜索结果项对应的页面样式满足预设条件,则可以点击保存按钮,将该图像确定为参考图像,然后为该参考图像添加对应的类别标识和终端标识,再将参考图像保存至上述配置的图片地址,然后周期性执行检测操作。其中,每个待检测搜索结果页中每个类别标识对应待检测搜索结果项的参考图像可以包括多个,每个参考图像不仅存在对应的类别标识,还存在对应的终端标识。
步骤204、打开所述网页地址,并按照所述终端标识对应的页面样式展示待检测搜索结果页。
步骤206、从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像。
测试工具在检测的过程中,可以打开所述网页地址,并按照所述终端标识对应的页面样式展示待检测搜索结果页;其中,一个可选地示例中,测试工具可以向无头浏览器发送调用指令,所述调用指令中可以包括网页地址和终端标识;所述无头浏览器接收到调用指令后,可以从所述调用指令中获取所述网页地址,然后打开所述网页地址对应的网页页面(即待检测搜索结果页),并按照所述终端标识对应的页面样式展示对应的待检测搜索结果页。进而测试工具可以依据所述类别标识和所述待检测搜索结果页,提取目标图像。
本发明的一个示例中,一种从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像的方式可以是,从待检测搜索结果页中直接获取目标图像;具体的:可以基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;依据所述目标区域信息,对所述待检测搜索结果页中的所述目标区域信息对应的展示区域进行截图,得到目标图像。其中,可以在打开网页地址对应的待检测搜索结果页后,确定所述搜索结果页中所述类别标识对应待检测搜索结果项对应的展示区域;然后从待检测搜索结果页中对该展示区域进行截图,得到目标图像。
其中,所述基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中对应的目标区域信息,可以通过如下子步骤62~64实现:
子步骤62:基于所述类别标识查找映射关系,确定所述类别标识对应待检测搜索结果项在所述搜索结果页中最外层展示区域图层的区域信息。
子步骤64:将所述最外层展示区域图层的区域信息,确定为所述搜索结果页中所述类别标识对应待检测搜索结果项对应的目标区域信息。
其中,所述目标区域信息可以包括待检测搜索结果项最外层展示区域图层的左上角位置点的位置信息,和待检测搜索结果项最外层显示区域图层的尺寸,如长和宽等。
本发明的一个示例中,另一种从所述待检测搜索结果页中所述类别标识对应待检测搜索结果项的目标图像的方式可以是,从待检测搜索结果页对应的页面图像中截取得到目标图像;具体的:可以获取所述待检测搜索结果页对应的页面图像;基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;依据所述目标区域信息,从所述页面图像中截取目标图像。其中,可以在打开所述网页地址对应的待检测搜索结果页后,执行截屏操作,获取该待检测搜索结果页对应的页面图像;然后确定页面图像中所述类别标识对应待检测搜索结果项对应的展示区域,从页面图像中截取该展示区域的图像,即为目标图像。本示例中,基于所述目标类别标识查找映射关系,确定所述搜索结果页中所述类别标识对应待检测搜索结果项对应的目标区域信息的步骤,与上述示例类似,在此不再赘述。
本发明一个可选实施例中,满足产品需求的页面样式可以包括多种,如基准样式和容错样式;其中,所述基准样式可以是指搜索结果项中所有网页元素的展示位置,均满足产品需求所要求的页面样式中各网页元素的展示位置,且各网页元素均成功加载,所述容错样式可以是指搜索结果项中所有的网页元素的展示位置,均满足产品需求所要求的页面样式中各网页元素的展示位置,但部分网页元素未成功加载。对应的,参考图像可以包括基准样式图像和容错图像,所述基准样式图像可以是指待检测搜索结果项以基准样式展示时对应展示区域的图像,所述容错样式图像可以是指待检测搜索结果项以容错样式展示时对应展示区域的图像;后续可以通过将目标图像与基准样式图像、容错样式图像对比后,依据对比结果推送提示信息。
其中,上述步骤106将所述目标图像与参考图像进行相似度比对,可包括如下步骤208-210。
步骤208、将所述目标图像与对应的基准样式图像进行相似度比对,确定第一相似度。
步骤210、若所述第一相似度低于相似度阈值,则将所述目标图像与对应的容错样式图像进行相似度比对,确定第二相似度。
本发明实施例中,可以查找与目标图像的类别标识相同,且终端标识相同的基准样式图像,然后将该基准样式图像与目标图像进行相似度比对,确定第一相似度;然后判断所述第一相似度是否低于相似度阈值。若所述第一相似度高于相似度阈值,可以确定目标图像与基准样式图像相似度高,则可以将所述第一相似度作为相似度对比结果,此时可以结束上述流程,也可以推送正常状态消息。若所述第一相似度低于相似度阈值,可以确定目标图像与基准样式图像相似度低,则可以查找与目标图像的类别标识相同,且终端标识相同的容错样式图像,然后将该容错样式图像与目标图像进行相似度比对,确定第二相似度;然后将所述第二相似度作为相似度比对结果。
上述步骤106依据相似度比对结果推送提示信息,可包括如下步骤212-214。
步骤212、判断所述第二相似度是否低于相似度阈值。
步骤214、推送报警消息。
本发明实施例中,可以将第二相似度与相似度阈值进行比对,判断所述第二相似度是否低于相似度阈值。若所述第二相似度高于相似度阈值,可以确定目标图像与容错样式图像相似度高,此时可以结束上述流程,也可以推送正常状态消息。若所述第二相似度低于相似度阈值,可以确定目标图像与容错样式图像相似度低,则此时可以推送报警消息。
当然,所述参考图像也可以只包括基准样式图像,进而将目标图像和对应的基准样式图像进行比对,得到第一相似度后,可以将第一相似度作为相似度对比结果;然后判断第一相似度是否低于相似度阈值,若所述第一相似度低于相似度阈值,则推送报警消息,若所述第一相似度高于相似度阈值,则结束上述流程,或者,推送正常状态消息。
本发明的一个可选实施例中,由于维护不同待检测搜索结果项的工作人员(如可以包括开发者、产品经理等)可能是不同的,因此在确定目标图像与参考图像相似度低时,为了便于对应维护的工作人员进行相应的处理,可以在推送报警消息过程中,确定所述类别标识对应的待检测搜索结果项的维护人员终端,将所述报警消息推送至所述维护人员终端如发送邮件;进而提高解决搜索结果项页面样式错误的效率。
本发明的一个可选实施例中,为了准确且快速的对待检测搜索结果项的页面样式进行调整,使得待检测搜索结果项的页面样式满足预设条件,推送的报警消息中可以包括多种信息,如配置信息、参考图像、目标图像、目标图像和参考图像的对比图像,以及相似度比对结果等等,其中,所述对比图像用于展示待检测搜索结果项样式错误的区域。
本发明一个可选实施例中,可以预先配置的相似度阈值可能无法很好的检测出待检测搜索结果项的页面样式是否满足预设条件,因此可以对所述相似度阈值进行优化;其中,可以统计所述第一相似度或第二相似度连续高于所述相似度阈值的次数;若所述次数大于次数阈值,则将所述相似度阈值增加设定步长。其中,所述次数阈值可以按照需求设置,所述设定步长也可以按照需求设置如0.1。
综上,本发明实施例中,可以通过获取待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识,然后依据所述网页地址确定待检测搜索结果页,从所述待检测搜索结果页中所述类别标识对应待检测搜索结果项的目标图像,进而提取出单个搜索结果项对应的目标图像;然后所述目标图像与对应预存的参考图像进行相似度比对,依据相似度比对结果推送提示信息;进而通过对单个搜索结果项的比对,去除无需检测样式的搜索结果项对比对结果的影响,从而提高页面检测的准确性。
其次,本发明实施例中,可以向无头浏览器发送调用指令,所述调用指令包括所述网页地址和终端标识,以调用所述无头浏览器打开所述网页地址,并按照所述终端标识对应的页面样式展示待检测搜索结果页;然后再提取所述待检测搜索结果页中所述类别标识对应目标图像;进而在用户无感知的情况下打开搜索结果页和提取目标图像,减少用户操作流程,提高检测效率。且每一个待检测搜索结果页中每个类别标识对应待检测搜索结果项可以包括多个参考图像,每个参考图像存在对应的终端标识;进而可以分别针对不同终端上展示的待检测搜索结果页进行检测,进一步提高了页面检测的准确率。
进一步,本发明实施例中所述参考图像包括:基准样式图像和容错样式图像;所述将所述目标图像与参考图像进行相似度比对,包括:将所述目标图像与基准样式图像进行相似度比对,确定第一相似度;若所述第一相似度低于相似度阈值,则将所述目标图像与容错样式图像进行相似度比对,确定第二相似度;将第二相似度作为相似度对比结果;进而解决搜索结果项中网页元素无法加载影响页面样式的检测结果,进一步提高检测准确性。
再次,本发明实施例中,可以统计所述第二相似度连续高于所述相似度阈值的次数;若所述次数大于次数阈值,则将所述相似度阈值增加设定步长,进而优化所述相似度阈值,提高检测的准确性。
此外,本发明实施例中,在推送报警消息时,可以确定所述类别标识对应待检测搜索结果项的维护人员终端,将所述报警消息推送至所述维护人员终端;进而提高解决搜索结果项页面样式展示错误的效率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图3,示出了本发明的一种数据处理装置实施例的结构框图,具体可以包括如下模块:
信息获取模块302,用于获取待检测搜索结果页的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识;
图像提取模块304,用于依据所述网页地址确定所述待检测搜索结果页,从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,所述目标图像依据所述类别标识对应待检测搜索结果项的展示区域确定;
图像比对模块306,用于将所述目标图像与对应预存的参考图像进行相似度比对,依据相似度比对结果推送提示信息。
参照图4,示出了本发明的一种数据处理装置可选实施例的结构框图。
本发明一个可选的实施例中,所述配置信息还包括终端标识,所述图像提取模块304包括:
页面展示子模块3042,用于打开所述网页地址,按照所述终端标识对应的页面样式展示所述待检测搜索结果页。
本发明一个可选的实施例中,所述图像比对模块306包括:
第一相似度对比子模块3062,用于将所述目标图像与预存的所述终端标识对应的参考图像进行相似度比对。
本发明一个可选的实施例中,所述图像提取模块304包括:
信息查找子模块3044,用于基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;
第一提取子模块3046,用于依据所述目标区域信息,对所述待检测搜索结果页中所述目标区域信息对应的展示区域进行截图,得到目标图像。
本发明一个可选的实施例中,所述图像提取模块304包括:
图像获取子模块3048,用于获取所述待检测搜索结果页对应的页面图像;
信息查找子模块3044,用于基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;
第二提取子模块30410,用于依据所述目标区域信息,从所述页面图像中截取目标图像。
本发明一个可选的实施例中,所述信息查找子模块3044,用于基于所述类别标识查找映射关系,确定所述类别标识对应待检测搜索结果项在所述搜索结果页中最外层展示区域图层的区域信息;将所述最外层展示区域图层的区域信息,确定为所述搜索结果页中所述类别标识对应待检测搜索结果项对应的目标区域信息。
本发明一个可选的实施例中,所述目标区域信息包括:所述最外层展示区域图层的左上角位置点对应的位置信息,和,最外层显示区域图层的尺寸。
本发明一个可选的实施例中,所述参考图像包括:基准图像和容错样式图像;所述图像比对模块306包括:
第二相似度对比子模块3064,用于将所述目标图像与基准图像进行相似度比对,确定第一相似度;若所述第一相似度低于相似度阈值,则将所述目标图像与容错样式图像进行相似度比对,确定第二相似度。
综上,本发明实施例中,可以通过获取包含网页地址和类别标识的配置信息,然后依据所述网页地址确定搜索结果页,提取所述搜索结果页中所述类别标识对应目标图像,实现提取单个搜索结果项对应的目标图像;然后将单个搜索结果项的目标图像与参考图像进行相似度比对,依据相似度比对结果推送提示信息;进而通过对单个搜索结果项的图像的比对,去除无需检测样式的搜索结果项的图像对比对结果的影响,从而提高检测准确性。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图5是根据一示例性实施例示出的一种用于数据处理的电子设备500的结构框图。例如,电子设备500可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,电子设备500可以包括以下一个或多个组件:处理组件502,存储器504,电力组件506,多媒体组件508,音频组件510,输入/输出(I/O)的接口512,传感器组件514,以及通信组件516。
处理组件502通常控制电子设备500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件502可以包括一个或多个处理器520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理部件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
存储器504被配置为存储各种类型的数据以支持在设备500的操作。这些数据的示例包括用于在电子设备500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件506为电子设备500的各种组件提供电力。电力组件506可以包括电源管理系统,一个或多个电源,及其他与为电子设备500生成、管理和分配电力相关联的组件。
多媒体组件508包括在所述电子设备500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当电子设备500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(MIC),当电子设备500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
I/O接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件514包括一个或多个传感器,用于为电子设备500提供各个方面的状态评估。例如,传感器组件514可以检测到设备500的打开/关闭状态,组件的相对定位,例如所述组件为电子设备500的显示器和小键盘,传感器组件514还可以检测电子设备500或电子设备500一个组件的位置改变,用户与电子设备500接触的存在或不存在,电子设备500方位或加速/减速和电子设备500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件516被配置为便于电子设备500和其他设备之间有线或无线方式的通信。电子设备500可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件514经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件514还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器504,上述指令可由电子设备500的处理器520执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种数据处理方法,所述方法包括:获取待检测搜索结果页的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识;依据所述网页地址确定所述待检测搜索结果页,从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,所述目标图像依据所述类别标识对应待检测搜索结果项的展示区域确定;将所述目标图像与对应预存的参考图像进行相似度比对,依据相似度比对结果推送提示信息。
可选地,所述配置信息还包括终端标识,所述依据所述网页地址确定所述待检测搜索结果页,包括:打开所述网页地址,按照所述终端标识对应的页面样式展示所述待检测搜索结果页。
可选地,所述将所述目标图像与对应预存的参考图像进行相似度比对,包括:将所述目标图像与预存的所述终端标识对应的参考图像进行相似度比对。
可选地,所述从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,包括:基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;依据所述目标区域信息,对所述待检测搜索结果页中所述目标区域信息对应的展示区域进行截图,得到目标图像。
可选地,所述从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,包括:获取所述待检测搜索结果页对应的页面图像;基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;依据所述目标区域信息,从所述页面图像中截取目标图像。
可选地,所述基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息,包括:基于所述类别标识查找映射关系,确定所述类别标识对应待检测搜索结果项在所述搜索结果页中最外层展示区域图层的区域信息;将所述最外层展示区域图层的区域信息,确定为所述搜索结果页中所述类别标识对应待检测搜索结果项对应的目标区域信息。
可选地,所述目标区域信息包括:所述最外层展示区域图层的左上角位置点对应的位置信息,和,最外层显示区域图层的尺寸。
可选地,所述参考图像包括:基准样式图像和容错样式图像;所述将所述目标图像与对应预存的参考图像进行相似度比对,包括:将所述目标图像与对应的基准样式图像进行相似度比对,确定第一相似度;若所述第一相似度低于相似度阈值,则将所述目标图像与对应的容错样式图像进行相似度比对,确定第二相似度。
图6是本发明根据另一示例性实施例示出的一种用于数据处理的电子设备600的结构示意图。该电子设备600可以是服务器,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)622(例如,一个或一个以上处理器)和存储器632,一个或一个以上存储应用程序642或数据644的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器632和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器622可以设置为与存储介质630通信,在服务器上执行存储介质630中的一系列指令操作。
服务器还可以包括一个或一个以上电源626,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口658,一个或一个以上键盘656,和/或,一个或一个以上操作系统641,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种电子设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取待检测搜索结果页的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识;依据所述网页地址确定所述待检测搜索结果页,从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,所述目标图像依据所述类别标识对应待检测搜索结果项的展示区域确定;将所述目标图像与对应预存的参考图像进行相似度比对,依据相似度比对结果推送提示信息。
可选地,所述配置信息还包括终端标识,所述依据所述网页地址确定所述待检测搜索结果页,包括:打开所述网页地址,按照所述终端标识对应的页面样式展示所述待检测搜索结果页。
可选地,所述将所述目标图像与对应预存的参考图像进行相似度比对,包括:将所述目标图像与预存的所述终端标识对应的参考图像进行相似度比对。
可选地,所述从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,包括:基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;依据所述目标区域信息,对所述待检测搜索结果页中所述目标区域信息对应的展示区域进行截图,得到目标图像。
可选地,所述从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,包括:获取所述待检测搜索结果页对应的页面图像;基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;依据所述目标区域信息,从所述页面图像中截取目标图像。
可选地,所述基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息,包括:基于所述类别标识查找映射关系,确定所述类别标识对应待检测搜索结果项在所述搜索结果页中最外层展示区域图层的区域信息;将所述最外层展示区域图层的区域信息,确定为所述搜索结果页中所述类别标识对应待检测搜索结果项对应的目标区域信息。
可选地,所述目标区域信息包括:所述最外层展示区域图层的左上角位置点对应的位置信息,和,最外层显示区域图层的尺寸。
可选地,所述参考图像包括:基准样式图像和容错样式图像;所述将所述目标图像与对应预存的参考图像进行相似度比对,包括:将所述目标图像与对应的基准样式图像进行相似度比对,确定第一相似度;若所述第一相似度低于相似度阈值,则将所述目标图像与对应的容错样式图像进行相似度比对,确定第二相似度。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种数据处理方法、一种数据处理装置和一种电子设备,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取待检测搜索结果页的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识;
依据所述网页地址确定所述待检测搜索结果页,从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,所述目标图像依据所述类别标识对应待检测搜索结果项的展示区域确定;
将所述目标图像与对应预存的参考图像进行相似度比对,依据相似度比对结果推送提示信息。
2.根据权利要求1所述的方法,其特征在于,所述配置信息还包括终端标识,所述依据所述网页地址确定所述待检测搜索结果页,包括:
打开所述网页地址,按照所述终端标识对应的页面样式展示所述待检测搜索结果页。
3.根据权利要求2所述的方法,其特征在于,所述将所述目标图像与对应预存的参考图像进行相似度比对,包括:
将所述目标图像与预存的所述终端标识对应的参考图像进行相似度比对。
4.根据权利要求1所述的方法,其特征在于,所述从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,包括:
基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;
依据所述目标区域信息,对所述待检测搜索结果页中所述目标区域信息对应的展示区域进行截图,得到目标图像。
5.根据权利要求1所述的方法,其特征在于,所述从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,包括:
获取所述待检测搜索结果页对应的页面图像;
基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;
依据所述目标区域信息,从所述页面图像中截取目标图像。
6.根据权利要求4或5所述的方法,其特征在于,所述基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息,包括:
基于所述类别标识查找映射关系,确定所述类别标识对应待检测搜索结果项在所述搜索结果页中最外层展示区域图层的区域信息;
将所述最外层展示区域图层的区域信息,确定为所述搜索结果页中所述类别标识对应待检测搜索结果项对应的目标区域信息。
7.根据权利要求6所述的方法,其特征在于,所述目标区域信息包括:所述最外层展示区域图层的左上角位置点对应的位置信息,和,最外层显示区域图层的尺寸。
8.一种数据处理装置,其特征在于,包括:
信息获取模块,用于获取待检测搜索结果页的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识;
图像提取模块,用于依据所述网页地址确定所述待检测搜索结果页,从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,所述目标图像依据所述类别标识对应待检测搜索结果项的展示区域确定;
图像比对模块,用于将所述目标图像与对应预存的参考图像进行相似度比对,依据相似度比对结果推送提示信息。
9.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-7任一所述的数据处理方法。
10.一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取待检测搜索结果页的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识;
依据所述网页地址确定所述待检测搜索结果页,从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,所述目标图像依据所述类别标识对应待检测搜索结果项的展示区域确定;
将所述目标图像与对应预存的参考图像进行相似度比对,依据相似度比对结果推送提示信息。
CN201910134019.8A 2019-02-22 2019-02-22 一种数据处理方法、装置和电子设备 Pending CN111611470A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910134019.8A CN111611470A (zh) 2019-02-22 2019-02-22 一种数据处理方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910134019.8A CN111611470A (zh) 2019-02-22 2019-02-22 一种数据处理方法、装置和电子设备

Publications (1)

Publication Number Publication Date
CN111611470A true CN111611470A (zh) 2020-09-01

Family

ID=72201710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910134019.8A Pending CN111611470A (zh) 2019-02-22 2019-02-22 一种数据处理方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN111611470A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113342684A (zh) * 2021-06-29 2021-09-03 北京搜狗科技发展有限公司 一种网页的测试方法、装置及设备
CN114398558A (zh) * 2022-01-19 2022-04-26 北京百度网讯科技有限公司 信息推荐方法、装置、电子设备和存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699669A (zh) * 2013-12-30 2014-04-02 北京奇虎科技有限公司 一种浏览器中进行消息推送的方法和一种浏览器终端
CN103761315A (zh) * 2014-01-27 2014-04-30 乐视网信息技术(北京)股份有限公司 一种显示网页内容的方法及系统
CN104484088A (zh) * 2014-12-02 2015-04-01 百度在线网络技术(北京)有限公司 搜索结果的展现方法及装置
CN104503962A (zh) * 2014-06-18 2015-04-08 北京邮电大学 一种网页暗链检测方法
CN106095884A (zh) * 2016-06-03 2016-11-09 深圳码隆科技有限公司 一种基于图片的相关物品信息处理方法及装置
CN107122402A (zh) * 2017-03-22 2017-09-01 广东神马搜索科技有限公司 网页图片的提取方法、装置、客户端装置和电子设备
CN107204960A (zh) * 2016-03-16 2017-09-26 阿里巴巴集团控股有限公司 网页识别方法及装置、服务器
CN107402756A (zh) * 2017-07-07 2017-11-28 北京小米移动软件有限公司 用于绘制页面的方法、装置及终端
CN107526744A (zh) * 2016-06-21 2017-12-29 北京搜狗科技发展有限公司 一种基于搜索的信息展示方法和装置
CN108510007A (zh) * 2018-04-08 2018-09-07 北京知道创宇信息技术有限公司 一种网页篡改检测方法、装置、电子设备及存储介质
CN108959928A (zh) * 2018-06-29 2018-12-07 北京奇虎科技有限公司 一种网页后门的检测方法、装置、设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699669A (zh) * 2013-12-30 2014-04-02 北京奇虎科技有限公司 一种浏览器中进行消息推送的方法和一种浏览器终端
CN103761315A (zh) * 2014-01-27 2014-04-30 乐视网信息技术(北京)股份有限公司 一种显示网页内容的方法及系统
CN104503962A (zh) * 2014-06-18 2015-04-08 北京邮电大学 一种网页暗链检测方法
CN104484088A (zh) * 2014-12-02 2015-04-01 百度在线网络技术(北京)有限公司 搜索结果的展现方法及装置
CN107204960A (zh) * 2016-03-16 2017-09-26 阿里巴巴集团控股有限公司 网页识别方法及装置、服务器
CN106095884A (zh) * 2016-06-03 2016-11-09 深圳码隆科技有限公司 一种基于图片的相关物品信息处理方法及装置
CN107526744A (zh) * 2016-06-21 2017-12-29 北京搜狗科技发展有限公司 一种基于搜索的信息展示方法和装置
CN107122402A (zh) * 2017-03-22 2017-09-01 广东神马搜索科技有限公司 网页图片的提取方法、装置、客户端装置和电子设备
CN107402756A (zh) * 2017-07-07 2017-11-28 北京小米移动软件有限公司 用于绘制页面的方法、装置及终端
CN108510007A (zh) * 2018-04-08 2018-09-07 北京知道创宇信息技术有限公司 一种网页篡改检测方法、装置、电子设备及存储介质
CN108959928A (zh) * 2018-06-29 2018-12-07 北京奇虎科技有限公司 一种网页后门的检测方法、装置、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113342684A (zh) * 2021-06-29 2021-09-03 北京搜狗科技发展有限公司 一种网页的测试方法、装置及设备
CN114398558A (zh) * 2022-01-19 2022-04-26 北京百度网讯科技有限公司 信息推荐方法、装置、电子设备和存储介质
CN114398558B (zh) * 2022-01-19 2023-05-23 北京百度网讯科技有限公司 信息推荐方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
US20170118298A1 (en) Method, device, and computer-readable medium for pushing information
US11281363B2 (en) Method and device for setting identity image
CN104572942A (zh) 推送消息显示方法及装置
CN109359056B (zh) 一种应用程序测试方法及装置
CN107870712B (zh) 一种截图处理方法及装置
CN106372204A (zh) 推送消息处理方法及装置
US20170075868A1 (en) Information collection method and apparatus
CN117390330A (zh) 网页访问方法及装置
CN105094904A (zh) 安装应用程序的方法及装置
CN104111979A (zh) 搜索推荐方法和装置
CN106331328B (zh) 信息提示的方法及装置
CN107402767B (zh) 显示推送消息的方法和装置
CN108011990B (zh) 联系人管理方法及装置
US10356160B2 (en) Methods and devices for acquiring user information
EP3057006A1 (en) Method and device of filtering address
CN107316207B (zh) 一种获取展示效果信息的方法和装置
CN104199915B (zh) 网页变化检测方法及装置
CN112131466A (zh) 群组展示方法、装置、系统和存储介质
CN111614990A (zh) 加载时长的获取方法、装置及电子设备
CN111611470A (zh) 一种数据处理方法、装置和电子设备
KR101744696B1 (ko) 정보 필터링 방법, 장치, 프로그램 및 저장매체
CN110213062B (zh) 处理消息的方法及装置
CN105976201B (zh) 用于电商系统的购买行为监控方法及装置
CN112784151A (zh) 一种确定推荐信息的方法及相关装置
CN116166359A (zh) 一种数据处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination