CN112883253A - 数据处理方法、装置、设备及可读存储介质 - Google Patents

数据处理方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN112883253A
CN112883253A CN202110488651.XA CN202110488651A CN112883253A CN 112883253 A CN112883253 A CN 112883253A CN 202110488651 A CN202110488651 A CN 202110488651A CN 112883253 A CN112883253 A CN 112883253A
Authority
CN
China
Prior art keywords
data
target
webpage
preset
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110488651.XA
Other languages
English (en)
Inventor
丁红霞
马永乐
马瑞礼
尹东伟
范红亮
盖建峰
张文强
李靖
李琪
廖宛玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingwei Jingwei Information Technology Beijing Co ltd
Original Assignee
Jingwei Jingwei Information Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingwei Jingwei Information Technology Beijing Co ltd filed Critical Jingwei Jingwei Information Technology Beijing Co ltd
Priority to CN202110488651.XA priority Critical patent/CN112883253A/zh
Publication of CN112883253A publication Critical patent/CN112883253A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请实施例提供了一种数据处理方法、装置、设备及可读存储介质,客户端响应于预设的刷新指令,刷新目标网页,目标网页为预设的目标网址指示的网页。获取目标数据,目标数据为位于目标网页中预设的目标位置处的数据。依据目标数据与历史目标数据,判断是否存在数据更新,历史目标数据为刷新目标网页之前,位于目标位置的数据。若存在数据更新,向服务端发送变化通知。响应于接收到变化通知,依据变化通知,执行第一预设流程,变化通知指示目标网页存在数据更新。由上可知,客户端依据目标数据,确定目标网页是否发生数据变化,由服务端对变化的网页数据进行处理,无需全量采集页面数据,提高监测效率,节省计算资源。

Description

数据处理方法、装置、设备及可读存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种数据处理方法、装置、设备及可读存储介质。
背景技术
伴随着数据信息行业的快速发展,网络爬虫已成为人们在浩瀚的网络世界中获取信息必不可少的工具。现有技术中,由于客户端无法胜任复杂计算,一般是由服务端利用网络爬虫,周期性对网页进行全量数据采集,并分析是否产生数据变化,但是,由于全量数据的采集和分析计算量大,耗时久,所以无法及时感知到网页的数据变化,因此,现有技术对于变化数据的处理不够及时且效率低。
发明内容
本申请提供了一种数据处理方法、装置、设备及可读存储介质,用于提高数据处理的效率,如下:
一种数据处理方法,应用于客户端,包括:
响应于预设的刷新指令,刷新目标网页,所述目标网页为预设的目标网址指示的网页;
获取目标数据,所述目标数据为位于所述目标网页中预设的目标位置处的数据;
依据所述目标数据与历史目标数据,判断是否存在数据更新,所述历史目标数据为刷新所述目标网页之前,位于所述目标位置的数据;
若存在数据更新,向服务端发送变化通知,以使所述服务端响应于所述变化通知,获取所述目标网页的网页数据,对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
可选地,在所述响应于预设的刷新指令,刷新目标网页之前,还包括:
依据预设参数,建立监测任务;所述预设参数包括预设刷新周期、所述目标网址和所述目标位置;
响应于所述预设刷新周期指示的刷新时间,发出所述刷新指令。
可选地,预设参数还包括:心跳周期和心跳信息;
在所述建立监测任务之后,还包括: 响应于达到所述心跳周期指示的发送时间,发送所述心跳信息至所述服务端。
一种数据处理方法,应用于服务端,包括:
响应于接收到变化通知,依据所述变化通知,获取目标网页的网页数据;所述变化通知由客户端依据目标数据与历史目标数据,确定存在数据更新后发送至所述服务端,所述目标数据为位于所述目标网页中预设的目标位置处的数据;
对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
可选地,还包括:
响应于接收到所述变化通知,至少依据所述变化通知,生成推送消息,所述推送消息至少指示所述目标网页存在数据更新;
将所述推送消息发送至预设账号。
可选地,还包括:
响应于接收到所述变化通知,获取所述变化通知的第一处理标识和第二处理标识,所述第一处理标识为有效标识或无效标识中一项,所述第二处理标识为已完成标识或未完成标识中一项;
所述对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果,包括:
若所述第一处理标识为所述有效标识,且所述第二处理标识为所述未完成标识,对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
可选地,还包括:
响应于接收到客户端发送的心跳信息,依据所述心跳信息,判断所述心跳信息是否与预设心跳信息相同;所述心跳信息为所述客户端响应于达到预设心跳周期指示的发送时间发送;
若所述心跳信息与所述预设心跳信息不相同,向所述预设账号发送预设的异常预警消息,所述异常预警消息指示所述客户端运行异常。
一种数据处理系统,包括服务端和与所述服务端通信相连的至少一个客户端,所述客户端预先以插件形式配置于预设浏览器中;
所述客户端用于实现如上所述的数据处理方法的各个步骤;
所述服务端用于实现如上所述的数据处理方法的各个步骤。
一种客户端,包括:
页面刷新单元,用于响应于预设的刷新指令,刷新目标网页,所述目标网页为预设的目标网址指示的网页;
目标数据获取单元,用于获取目标数据,所述目标数据为位于所述目标网页中预设的目标位置处的数据;
更新判断单元,用于依据所述目标数据与历史目标数据,判断是否存在数据更新,所述历史目标数据为刷新所述目标网页之前,位于所述目标位置的数据;
通知单元,用于若存在数据更新,向服务端发送变化通知,以使所述服务端响应于所述变化通知,获取所述目标网页的网页数据,对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
一种服务端,包括:
更新处理单元,用于响应于接收到变化通知,依据所述变化通知,获取目标网页的网页数据;所述变化通知由客户端依据目标数据与历史目标数据,确定存在数据更新后发送至所述服务端,所述目标数据为位于所述目标网页中预设的目标位置处的数据;
结果获取单元,用于对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
一种数据处理设备,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如上所述的数据处理方法的各个步骤。
一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的数据处理方法的各个步骤。
由上述技术方案可以看出,本申请实施例提供的数据处理方法、装置、设备及可读存储介质,客户端响应于预设的刷新指令,刷新目标网页,目标网页为预设的目标网址指示的网页。获取目标数据,目标数据为位于目标网页中预设的目标位置处的数据。依据目标数据与历史目标数据,判断是否存在数据更新,历史目标数据为刷新目标网页之前,位于目标位置的数据。若存在数据更新,向服务端发送变化通知。由于,变化通知指示目标网页存在数据更新,所以服务端响应于接收到变化通知,依据变化通知,依据所述变化通知,获取目标网页的网页数据,对比目标网页的网页数据和目标网页的历史数据,获取变化数据,作为数据处理结果。由上可知,由于目标数据为目标位置处的数据,也即,本方法通过客户端无需采集且分析全量的页面数据,即可确定目标网页是否发生数据变化,由此可以及时发现网页数据发生变化,提高监测效率,进一步,在客户端确定数据变化后发送变化通知至服务端,由服务端依据变化通知,经过对比目标网页的网页数据和目标网页的历史数据得到数据处理结果,避免客户端无法胜任复杂计算的缺陷。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种数据处理系统的结构示意图;
图2为本申请实施例提供的一种配置方法的流程示意图;
图3为本申请实施例提供的一种数据处理方法的具体实现方法的流程示意图;
图4为本申请实施例提供的又一种数据处理方法的具体实现方法的流程示意图;
图5为本申请实施例提供的一种客户端的结构示意图;
图6为本申请实施例提供的一种服务端的结构示意图;
图7为本申请实施例提供的一种数据处理方法的流程示意图;
图8为本申请实施例提供的一种数据处理相关装置的结构示意图;
图9为本申请实施例提供的一种数据处理设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供的数据处理方法可以应用于数据处理系统,数据处理系统包括客户端和服务端,其中,客户端预先以浏览器插件的形式配置于预设的浏览器中,服务端运行于服务器(包括单点服务器或集成服务器)或者云端,本方案通过客户端与服务端之间的通信,实现对浏览器中至少一个网页的实时监测。
如图1所示,数据处理系统包括服务端,和分别与该服务端通信相连的N个客户端,每一客户端预先配置于一个浏览器中,由服务端完成对客户端的任务配置后,通过服务端和客户端的数据交互实现本申请实施例提供的一种数据处理方法。图2示例了一种服务端配置目标客户端的示意图,其中,目标客户端为与服务端通信相连的客户端中的任意一个客户端。
如图2所示,本方法具体包括:
S201、服务端响应于配置完成指令,发送预设任务的预设参数至目标客户端。
本实施例中,预设参数包括:目标网址、心跳接口、心跳周期、数据接口、锚点位置(称为锚点xpath)、以及目标位置(称为目标xpath)。
需要说明的是,配置完成指令响应于用户点击预设的人机交互界面上的预设配置完成按钮发出,人机交互界面用于提供用户输入预设参数的可编辑界面,图2示例了一种可选的人机交互界面示意图。
如图2所示,任务描述输入框21用于输入预设任务的任务描述,例如,“监测第一网页的第一信息的更新情况”。
目标网址输入框22用于输入预设的目标网址,目标网址为目标网页的网址。
心跳接口输入框23用于输入预设的心跳接口,心跳接口为服务端心跳接口地址。
心跳周期输入框24用于输入预设的心跳周期,心跳周期为相邻两次心跳信息的发送时间的时间间隔。
数据接口输入框25用于输入预设的数据接口,数据接口为变化通知的提交地址。
锚点xpath输入框26用于输入预设的锚点xpath,锚点xpath为指示目标网页加载完毕的元素,在目标网页上的位置。
目标xpath输入框27用于输入预设的目标xpath,目标xpath为待监测元素在目标网页上的位置。
需要说明的是,锚点xpath和目标xpath满足:刷新目标网页时,锚点xpath和目标xpath的加载顺序为目标xpath先于锚点xpath加载完成。
保存按钮28为预设配置完成按钮,用于响应于点击操作,发出配置完成指令。
需要说明的是,图2所示的人机交互界面预先配置于服务端,服务端响应于用户在服务端的人机交互界面完成上述各项输入,并点击保存按钮,发送上述预设参数至目标客户端,实现对目标客户端的运行配置。
S202、目标客户端接收预设任务的预设参数,建立监测任务。
需要说明的是,S201~ S202为服务端配置目标客户端的过程,也即服务端在目标客户端建立监测任务的过程,本实施例中,数据处理系统可以包括多个客户端,服务端在每一客户端可以建立多个不同的任务,服务端在各个客户端建立各个任务的过程均参见上述S201~ S202,本实施例对此不做赘述。
需要说明的是,图2仅示例了一种可选的配置客户端以建立监测任务的过程,在实际应用中,建立监测任务的过程还包括:客户端响应于参数修改指令,更新监测任务,其中,参数修改指令为用户通过在客户端的预设交互界面输入。也即,客户端提供用户修改监测任务中各项参数的交互界面。
图3示例了一种本申请实施例提供的数据处理方法的具体实现方法,图3所示的流程中,仍以数据处理系统中的任意一个客户端(称为目标客户端)为例,对通过客户端与服务端的数据交互,实现本申请实施例提供的一种数据处理方法进行示例性说明。
S301、客户端响应于预设的刷新指令,刷新目标网页。
本实施例中,客户端依据目标网址监测并刷新目标网页,刷新指令预先配置为周期性生成,例如,每1小时生成一次刷新指令。
S302、客户端响应于监测到锚点xpath刷新完成,获取目标数据。
本实施例中,目标数据通过解析目标网页中目标xpath处的元素得到,需要说明的是,客户端依据目标网址监测目标网页,当锚点xpath加载完成时,判断锚点xpath刷新完成。
具体的监测方法以及目标元素的获取方法参见现有技术。
S303、客户端依据目标数据与历史目标数据,判断是否存在数据更新。
本实施例中,历史目标数据为客户端上一次刷新目标网页获取的目标数据,也即,上一次解析目标网页中目标xpath处的元素得到的数据。判断是否存在数据更新的具体方法可以参见现有技术。
S304、若客户端判断存在数据更新,向服务端发送变化通知。
本实施例中,变化通知指示目标网页存在数据更新。需要说明的是,变化通知具体可以包括唯一指示目标网页的标识,例如客户端的预设标识、目标网页的预设标识、和/或监测任务的预设标识,且客户端通过预设的数据接口发送变化通知,具体参见现有技术。
S305、服务端响应于接收到变化通知,获取变化通知的第一处理标识和第二处理标识。
本实施例中,变化通知的第一处理标识为变化通知的有效标识或无效标识中一项,其中,有效标识指示变化通知有效,无效标识指示变化通知无效。第二处理标识为已完成标识或未完成标识中一项,已完成标识指示变化通知已经被处理,未完成标识指示变化通知没有被处理。
判断变化通知是否有效的方法包括:
判断变化通知是否重复发送,若是则无效。
判断变化通知是否包括预设的更新信息,若否则无效。
S306、若变化通知的第一处理标识为有效标识,且第二处理标识为未完成标识,则服务端执行第一预设流程。
第一预设流程至少包括:获取目标网页的网页数据,对比目标网页的网页数据和目标网页的历史数据,获取变化数据,作为数据处理结果。
具体的,服务器调用爬虫平台对目标网页的网页数据进行采集,通过解析的页面数据并与预设数据库中存储的历史数据进行逐条验证,获取发生删除,更新或新增的数据,作为变化数据,将变化数据同步到预设数据库中,以更新预设数据库。
可选的,第一预设流程还包括:若第一预设流程的处理过程发生异常,服务端进行预设的容错处理流程。
可选的,第一预设流程还包括:生成推送消息,并发送至预设账号,用于通知预设的负责人目标网页存在数据更新,例如,以短信的方式将推送消息发送至预设的运维人员的手机号码绑定的设备。
S307、服务端发送完成状态。
需要说明的是,服务端将完成状态发送至预设账号,以通知运维人员服务端已完成对变化通知的响应。
由上述技术方案可以看出,本申请提供的一种数据处理方法应用于数据处理系统,数据处理系统包括客户端和服务端,由客户端依据获取的预设任务的预设参数,感知目标网页是否存在数据变化,并在目标网页存在数据变化时,发送变化通知至服务端,由服务端处理数据变化,由于,客户端通过目标数据和历史目标数据,判断待监测页面是否发生变化,若存在数据变化,发送变化通知至服务端,由服务端针对数据变化执行预定的处理流程(第一预设流程)。
本方案相对于现有技术具有如下有益效果:
1、本方法由客户端刷新目标网页并采集目标数据,通过目标数据和历史目标数据的对比,确定是否发生数据变化,相对于服务端周期性全量采集网页数据并进行数据对比以确定页面数据是否发生变化的方法,无需全量采集页面数据,提高监测效率,节省计算资源。
2、服务端只需获取变化通知指示的目标网页的网页数据,并对比目标网页的网页数据和目标网页的历史数据,获取变化数据,作为数据处理结果,一方面减少了服务端的计算任务量,另一方面,避免客户端无法胜任复杂计算的缺陷。
综上,本方法同时整合了服务端可以承担大规模计算的能力,以及客户端的高效监测数据变化的能力,提高数据处理的效率以及节省计算资源。
3、在判断变化通知的第一处理标识为有效标识,且第二处理标识为未完成标识后,服务端执行第一预设流程,并在执行第一预设流程后,更新第二处理标识,避免由于处理无效的变化通知,导致的计算资源和时间的浪费,也避免重复处理变化通知造成的处理错误。
需要说明的是,图3所示的方法仅为本申请提供的数据处理方法的可选的具体实现方法,图4示例了一种本申请提供的另一种数据处理方法的具体实现方法。与图3所示的流程相比,本方法新增下述S401~403。
S401、客户端响应于达到心跳周期指示的发送时间,发送预设的心跳信息至服务端。
本实施例中,心跳周期为相邻两次心跳信息的发送时间的时间间隔,可选的,客户端在预设的初始时间第一次发送心跳信息,并依据心跳周期,周期性发送心跳信息。
需要说明的是,心跳信息为预先配置的信息,且客户端通过预设的心跳接口发送心跳信息,心跳信息可以包括客户端标识或地址,具体可以参见现有技术本实施例不做限定。
S402、服务端响应于接收到心跳信息,依据心跳信息判断客户端运行状态。
本实施例中,依据心跳信息判断客户端运行状态的方法包括:
判断心跳信息是否与预设心跳信息一致,若是,则判断客户端运行状态正常,若否则判断客户端运行状态异常。
S403、响应于客户端运行状态异常,服务端执行第二预设流程。
需要说明的是,第二预设流程包括:
1、获取目标网页的网页数据,对比目标网页的网页数据和目标网页的历史网页数据,判断是否发生数据更新。
2、生成异常预警消息,并发送至预设的账号,用于通知预设的负责人客户端的运行状态异常,例如,以短信的方式将推送消息发送至预设的运维人员的手机号码绑定的设备。
需要说明的是,图4示例了一种依据心跳信息判断客户端运行是否正常的具体方法,本申请还包括其他的判断客户端运行是否正常的具体方法,例如,服务端响应于预设延迟时间内,没有接收到心跳信息,确定客户端的运行状态异常,其中,预设延迟时间依据心跳周期获取,可选的,预设延迟时间大于n(n大于1)倍的心跳周期。
由图4所示的流程可以看出,本申请实施例提供的一种数据处理方法,客户端周期性向服务端发送预设的心跳信息,服务端依据心跳信息判断客户端的运行状态,并在运行状态异常时,执行第二预设流程,避免因为客户端运行状态异常时,服务端没有及时收到客户端的变化通知,从而无法及时执行第一预设流程,或,避免由于客户端运行异常导致的无法及时感知目标网页的数据变化。因此,提高了数据处理方法的准确度。
综上,本申请实施提供的一种数据处理方法包括多种可选的具体实现方法,相对应的,图5为可选的一种用于实现数据处理方法的客户端的结构示意图,如图5所示,客户端包括:
心跳发送模块CP10,用于向服务端提交预设的心跳信息,以汇报客户端运行状态,以此实现服务端对服务端运行状态的监测。其中,心跳信息依据实际需求预设,例如包括位置信息,监控范围及其他信息,具体参见上述实施例。
自动化监控模块CP20,用于按照预设任务的预设参数对目标网页进行页面数据(包括但不限于目标数据)的获取和解析及判断是否发生数据变化。
具体的,CP20包括页面采集子模块CP201,用于刷新并采集目标数据。页面解析与判断子模块CP202,用于实时解析采集的目标数据,通过与历史目标数据对比判断页面数据是否发生变化,具体参见上述实施例。
事件推送模块CP30,用于在客户端感知到数据变化后将变化事件提交至服务端。
图6为可选的一种用于实现数据处理方法的服务端的结构示意图,如图6所示,服务端包括:心跳监控模块SP10,用于接收并处理心跳信息,以监控客户端的运行状态。
事件处理模块SP20,用于在接受到客户端提交的变化通知后,对变化通知进行响应,具体响应方法参见上述实施例。
消息推送模块SP30,用于发送推送消息,例如将客户端运行状态异常的消息推送至运维人员所属账号等。
根据上述各个实施例,将本申请实施例提供的一种数据处理方法总结概率为图7所示的流程,本方法具体可以包括:
S701、客户端响应于预设的刷新指令,刷新目标网页,
本实施例中,目标网页为预设的目标网址指示的网页。
S702、客户端获取目标数据。
本实施例中,目标数据为位于目标网页中预设的目标位置处的数据。
需要说明的是,目标网址和目标位置由服务端配置并发送至客户端,客户端依据目标网址监测目标网页,可选的一种配置过程参见图2所示流程。
S703、客户端依据目标数据与历史目标数据,判断是否存在数据更新。
本实施例中,历史目标数据为刷新目标网页之前,位于目标位置的数据。
需要说明的是,判断是否存在数据更新的方法包括多种,例如,对比目标数据和历史目标数据中关键字是否相同,若不相同,则判断存在数据更新。具体的判断是否存在数据更新的方法参见现有技术。
S704、客户端若存在数据更新,向服务端发送变化通知。
需要说明的是,向服务端发送变化通知的方法参见现有技术,例如,用过预设的数据接口发送变化通知。
S705、服务端端响应于接收到变化通知,依据所述变化通知,获取目标网页的网页数据。
S706、服务端对比目标网页的网页数据和目标网页的历史数据,获取变化数据,作为数据处理结果。
由上可知,由于目标数据为目标位置处的数据,也即,本方法无需采集且分析全量的页面数据,即可由客户端确定目标网页是否发生数据变化,由此可以及时发现网页数据发生变化,提高监测效率,进一步,在客户端确定数据变化后发送变化通知至服务端,由服务端对变化通知进行处理,避免客户端无法胜任复杂计算的缺陷。
本申请实施例还提供了一种客户端和服务端,图8示例了客户端81和服务端82的结构示意图。
如图8所示,客户端81包括:
页面刷新单元811,用于响应于预设的刷新指令,刷新目标网页,所述目标网页为预设的目标网址指示的网页;
目标数据获取单元812,用于获取目标数据,所述目标数据为位于所述目标网页中预设的目标位置处的数据;
更新判断单元813,用于依据所述目标数据与历史目标数据,判断是否存在数据更新,所述历史目标数据为刷新所述目标网页之前,位于所述目标位置的数据;
通知单元814,用于若存在数据更新,向服务端发送变化通知,以使所述服务端响应于所述变化通知,获取所述目标网页的网页数据,对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
可选地,客户端还包括:
任务建立单元,用于在响应于预设的刷新指令,刷新目标网页之前,依据预设参数,建立监测任务;所述预设参数包括预设刷新周期、所述目标网址和所述目标位置。
刷新指令发出单元,用于响应于所述预设刷新周期指示的刷新时间,发出所述刷新指令。
可选地,所述预设参数还包括:心跳周期和心跳信息;
客户端还包括:心跳发送单元,用于在所述建立监测任务之后,响应于达到所述心跳周期指示的发送时间,发送所述心跳信息至所述服务端。
如图8所示,服务端82包括:
更新处理单元821,用于响应于接收到变化通知,依据所述变化通知,获取所述目标网页的网页数据;所述变化通知由客户端依据目标数据与历史目标数据,确定存在数据更新后发送至所述服务端,所述目标数据为位于所述目标网页中预设的目标位置处的数据;
结果获取单元822,用于对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
可选地,服务端还包括:更新消息推送单元,用于:
响应于接收到所述变化通知,至少依据所述变化通知,生成推送消息,所述推送消息至少指示所述目标网页存在数据更新;将所述推送消息发送至预设账号。
可选地,服务端还包括:状态获取单元,用于:响应于接收到所述变化通知,获取所述变化通知的第一处理标识和第二处理标识,所述第一处理标识为有效标识或无效标识中一项,所述第二处理标识为已完成标识或未完成标识中一项;
结果获取单元用于对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果,包括:结果获取单元具体用于:
若所述第一处理标识为所述有效标识,且所述第二处理标识为所述未完成标识,对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
可选地,服务端还包括:心跳异常判断单元,用于:
响应于接收到客户端发送的心跳信息,依据所述心跳信息,判断所述心跳信息是否与预设心跳信息相同;所述心跳信息为所述客户端响应于达到预设心跳周期指示的发送时间发送;
若所述心跳信息与所述预设心跳信息不相同,向所述预设账号发送预设的异常预警消息,所述异常预警消息指示所述客户端运行异常。
需要说明的是,本申请实施例提供的数据处理系统中,包括服务端和与服务端通信相连的至少一个客户端,客户端预先以插件形式配置于预设浏览器中(如图1所示),其中,服务端与任一客户端的结构均可以参见图8。
图9示出了该数据处理设备的结构示意图,该设备可以包括:至少一个处理器901,至少一个通信接口902,至少一个存储器903和至少一个通信总线904;
在本申请实施例中,处理器901、通信接口902、存储器903、通信总线904的数量为至少一个,且处理器901、通信接口902、存储器903通过通信总线904完成相互间的通信;
处理器901可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
存储器903可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory)等,例如至少一个磁盘存储器;
其中,存储器存储有程序,处理器可执行存储器存储的程序,实现本申请实施例提供的一种数据处理方法的各个步骤,如下:
一种数据处理方法,应用于客户端,包括:
响应于预设的刷新指令,刷新目标网页,所述目标网页为预设的目标网址指示的网页;
获取目标数据,所述目标数据为位于所述目标网页中预设的目标位置处的数据;
依据所述目标数据与历史目标数据,判断是否存在数据更新,所述历史目标数据为刷新所述目标网页之前,位于所述目标位置的数据;
若存在数据更新,向服务端发送变化通知,以使所述服务端响应于所述变化通知,获取所述目标网页的网页数据,对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
可选地,在所述响应于预设的刷新指令,刷新目标网页之前,还包括:
依据预设参数,建立监测任务;所述预设参数包括预设刷新周期、所述目标网址和所述目标位置;
响应于所述预设刷新周期指示的刷新时间,发出所述刷新指令。
可选地,预设参数还包括:心跳周期和心跳信息;
在所述建立监测任务之后,还包括: 响应于达到所述心跳周期指示的发送时间,发送所述心跳信息至所述服务端。
一种数据处理方法,应用于服务端,包括:
响应于接收到变化通知,依据所述变化通知,获取目标网页的网页数据;所述变化通知由客户端依据目标数据与历史目标数据,确定存在数据更新后发送至所述服务端,所述目标数据为位于所述目标网页中预设的目标位置处的数据;
对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
可选地,还包括:
响应于接收到所述变化通知,至少依据所述变化通知,生成推送消息,所述推送消息至少指示所述目标网页存在数据更新;
将所述推送消息发送至预设账号。
可选地,还包括:
响应于接收到所述变化通知,获取所述变化通知的第一处理标识和第二处理标识,所述第一处理标识为有效标识或无效标识中一项,所述第二处理标识为已完成标识或未完成标识中一项;
所述对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果,包括:
若所述第一处理标识为所述有效标识,且所述第二处理标识为所述未完成标识,对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
可选地,还包括:
响应于接收到客户端发送的心跳信息,依据所述心跳信息,判断所述心跳信息是否与预设心跳信息相同;所述心跳信息为所述客户端响应于达到预设心跳周期指示的发送时间发送;
若所述心跳信息与所述预设心跳信息不相同,向所述预设账号发送预设的异常预警消息,所述异常预警消息指示所述客户端运行异常。
本申请实施例还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的计算机程序,计算机程序被处理器执行时,实现本申请实施例提供的一种数据处理方法的各个步骤,如下:
一种数据处理方法,应用于客户端,包括:
响应于预设的刷新指令,刷新目标网页,所述目标网页为预设的目标网址指示的网页;
获取目标数据,所述目标数据为位于所述目标网页中预设的目标位置处的数据;
依据所述目标数据与历史目标数据,判断是否存在数据更新,所述历史目标数据为刷新所述目标网页之前,位于所述目标位置的数据;
若存在数据更新,向服务端发送变化通知,以使所述服务端响应于所述变化通知,获取所述目标网页的网页数据,对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
可选地,在所述响应于预设的刷新指令,刷新目标网页之前,还包括:
依据预设参数,建立监测任务;所述预设参数包括预设刷新周期、所述目标网址和所述目标位置;
响应于所述预设刷新周期指示的刷新时间,发出所述刷新指令。
可选地,预设参数还包括:心跳周期和心跳信息;
在所述建立监测任务之后,还包括: 响应于达到所述心跳周期指示的发送时间,发送所述心跳信息至所述服务端。
一种数据处理方法,应用于服务端,包括:
响应于接收到变化通知,依据所述变化通知,获取目标网页的网页数据;所述变化通知由客户端依据目标数据与历史目标数据,确定存在数据更新后发送至所述服务端,所述目标数据为位于所述目标网页中预设的目标位置处的数据;
对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
可选地,还包括:
响应于接收到所述变化通知,至少依据所述变化通知,生成推送消息,所述推送消息至少指示所述目标网页存在数据更新;
将所述推送消息发送至预设账号。
可选地,还包括:
响应于接收到所述变化通知,获取所述变化通知的第一处理标识和第二处理标识,所述第一处理标识为有效标识或无效标识中一项,所述第二处理标识为已完成标识或未完成标识中一项;
所述对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果,包括:
若所述第一处理标识为所述有效标识,且所述第二处理标识为所述未完成标识,对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
可选地,还包括:
响应于接收到客户端发送的心跳信息,依据所述心跳信息,判断所述心跳信息是否与预设心跳信息相同;所述心跳信息为所述客户端响应于达到预设心跳周期指示的发送时间发送;
若所述心跳信息与所述预设心跳信息不相同,向所述预设账号发送预设的异常预警消息,所述异常预警消息指示所述客户端运行异常。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (12)

1.一种数据处理方法,其特征在于,应用于客户端,包括:
响应于预设的刷新指令,刷新目标网页,所述目标网页为预设的目标网址指示的网页;
获取目标数据,所述目标数据为位于所述目标网页中预设的目标位置处的数据;
依据所述目标数据与历史目标数据,判断是否存在数据更新,所述历史目标数据为刷新所述目标网页之前,位于所述目标位置的数据;
若存在数据更新,向服务端发送变化通知,以使所述服务端响应于所述变化通知,获取所述目标网页的网页数据,对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
2.根据权利要求1所述的方法,其特征在于,在所述响应于预设的刷新指令,刷新目标网页之前,还包括:
依据预设参数,建立监测任务;所述预设参数包括预设刷新周期、所述目标网址和所述目标位置;
响应于所述预设刷新周期指示的刷新时间,发出所述刷新指令。
3.根据权利要求2所述的方法,其特征在于,所述预设参数还包括:心跳周期和心跳信息;
在所述建立监测任务之后,还包括:响应于达到所述心跳周期指示的发送时间,发送所述心跳信息至所述服务端。
4.一种数据处理方法,其特征在于,应用于服务端,包括:
响应于接收到变化通知,依据所述变化通知,获取目标网页的网页数据;所述变化通知由客户端依据目标数据与历史目标数据,确定存在数据更新后发送至所述服务端,所述目标数据为位于所述目标网页中预设的目标位置处的数据;
对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
5.根据权利要求4所述的方法,其特征在于,还包括:
响应于接收到所述变化通知,至少依据所述变化通知,生成推送消息,所述推送消息至少指示所述目标网页存在数据更新;
将所述推送消息发送至预设账号。
6.根据权利要求5所述的方法,其特征在于, 还包括:
响应于接收到所述变化通知,获取所述变化通知的第一处理标识和第二处理标识,所述第一处理标识为有效标识或无效标识中一项,所述第二处理标识为已完成标识或未完成标识中一项;
所述对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果,包括:
若所述第一处理标识为所述有效标识,且所述第二处理标识为所述未完成标识,对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
7.根据权利要求5所述的方法,其特征在于,还包括:
响应于接收到客户端发送的心跳信息,依据所述心跳信息,判断所述心跳信息是否与预设心跳信息相同;所述心跳信息为所述客户端响应于达到预设心跳周期指示的发送时间发送;
若所述心跳信息与所述预设心跳信息不相同,向所述预设账号发送预设的异常预警消息,所述异常预警消息指示所述客户端运行异常。
8.一种数据处理系统,其特征在于,包括服务端和与所述服务端通信相连的至少一个客户端,所述客户端预先以插件形式配置于预设浏览器中;
所述客户端用于实现如权利要求1~3中任一项所述的数据处理方法的各个步骤;
所述服务端用于实现如权利要求4~7中任一项所述的数据处理方法的各个步骤。
9.一种客户端,其特征在于,包括:
页面刷新单元,用于响应于预设的刷新指令,刷新目标网页,所述目标网页为预设的目标网址指示的网页;
目标数据获取单元,用于获取目标数据,所述目标数据为位于所述目标网页中预设的目标位置处的数据;
更新判断单元,用于依据所述目标数据与历史目标数据,判断是否存在数据更新,所述历史目标数据为刷新所述目标网页之前,位于所述目标位置的数据;
通知单元,用于若存在数据更新,向服务端发送变化通知,以使所述服务端响应于所述变化通知,获取所述目标网页的网页数据,对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
10.一种服务端,其特征在于,包括:
更新处理单元,用于响应于接收到变化通知,依据所述变化通知,获取目标网页的网页数据;所述变化通知由客户端依据目标数据与历史目标数据,确定存在数据更新后发送至所述服务端,所述目标数据为位于所述目标网页中预设的目标位置处的数据;
结果获取单元,用于对比所述目标网页的网页数据和所述目标网页的历史数据,获取变化数据,作为数据处理结果。
11.一种数据处理设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1~3或4~7中任一项所述的数据处理方法的各个步骤。
12.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~3或4~7中任一项所述的数据处理方法的各个步骤。
CN202110488651.XA 2021-05-06 2021-05-06 数据处理方法、装置、设备及可读存储介质 Pending CN112883253A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110488651.XA CN112883253A (zh) 2021-05-06 2021-05-06 数据处理方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110488651.XA CN112883253A (zh) 2021-05-06 2021-05-06 数据处理方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN112883253A true CN112883253A (zh) 2021-06-01

Family

ID=76040284

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110488651.XA Pending CN112883253A (zh) 2021-05-06 2021-05-06 数据处理方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN112883253A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115776516A (zh) * 2023-02-13 2023-03-10 天翼云科技有限公司 页面刷新方法及其装置、电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104219250A (zh) * 2014-09-26 2014-12-17 北京国双科技有限公司 网页数据获取方法和装置及网页数据发送方法和装置
CN107239546A (zh) * 2017-06-05 2017-10-10 成都知道创宇信息技术有限公司 一种网页局部内容跟踪与提醒的方法
CN110401580A (zh) * 2019-06-20 2019-11-01 平安普惠企业管理有限公司 基于心跳机制的网页状态监听方法及相关设备
CN111581569A (zh) * 2020-04-01 2020-08-25 车智互联(北京)科技有限公司 一种网页资源更新方法及系统
US10831892B2 (en) * 2018-06-07 2020-11-10 Sap Se Web browser script monitoring
CN112597369A (zh) * 2020-12-22 2021-04-02 荆门汇易佳信息科技有限公司 基于改良云平台的网页蜘蛛主题式搜索系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104219250A (zh) * 2014-09-26 2014-12-17 北京国双科技有限公司 网页数据获取方法和装置及网页数据发送方法和装置
CN107239546A (zh) * 2017-06-05 2017-10-10 成都知道创宇信息技术有限公司 一种网页局部内容跟踪与提醒的方法
US10831892B2 (en) * 2018-06-07 2020-11-10 Sap Se Web browser script monitoring
CN110401580A (zh) * 2019-06-20 2019-11-01 平安普惠企业管理有限公司 基于心跳机制的网页状态监听方法及相关设备
CN111581569A (zh) * 2020-04-01 2020-08-25 车智互联(北京)科技有限公司 一种网页资源更新方法及系统
CN112597369A (zh) * 2020-12-22 2021-04-02 荆门汇易佳信息科技有限公司 基于改良云平台的网页蜘蛛主题式搜索系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115776516A (zh) * 2023-02-13 2023-03-10 天翼云科技有限公司 页面刷新方法及其装置、电子设备
CN115776516B (zh) * 2023-02-13 2023-04-14 天翼云科技有限公司 页面刷新方法及其装置、电子设备

Similar Documents

Publication Publication Date Title
CN105357038B (zh) 监控虚拟机集群的方法和系统
CN102449567B (zh) 作为用于装备健康状况监视服务的基础的云计算
CN101252462B (zh) 告警页面刷新方法以及服务器和客户端
CN112115031A (zh) 集群状态监控方法及装置
CN109901969B (zh) 一种集中监控管理平台的设计方法及装置
CN115034638A (zh) 数字孪生处理方法及数字孪生系统
CN116107589B (zh) 软件代码的自动编译方法、装置、设备及存储介质
CN111478815B (zh) 网络性能监控方法及装置
CN112506969A (zh) 一种bmc地址查询方法、系统、设备及可读存储介质
CN112883253A (zh) 数据处理方法、装置、设备及可读存储介质
CN103699533A (zh) 获取web更新信息的方法和系统
CN110796272A (zh) 垃圾满溢提醒方法及系统
CN112149975B (zh) 一种基于人工智能的apm监控系统及监控方法
CN112463561B (zh) 一种故障定位方法、装置、设备及存储介质
CN112256470A (zh) 故障服务器定位方法及装置、存储介质及电子设备
CN113835918A (zh) 一种服务器故障分析方法及装置
CN116560893B (zh) 一种计算机应用程序运行数据故障处理系统
CN117370053A (zh) 一种面向信息系统业务运行全景监测方法及系统
CN116205624A (zh) 基于数字孪生的设备运行管理方法及相关产品
CN113094088A (zh) 数据库配置信息采集方法、装置、计算机设备及存储介质
CN113407430A (zh) 基于应用性能监控的单指标参数采集方法及装置
CN115222181A (zh) 机器人运营状态监控系统及方法
CN113656239A (zh) 针对中间件的监控方法、装置及计算机程序产品
CN112765188A (zh) 配置信息处理方法、配置管理系统、电子设备及存储介质
CN113377616B (zh) 接口监控方法、装置以及计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination