CN105988907B - 业务监控方法和装置 - Google Patents

业务监控方法和装置 Download PDF

Info

Publication number
CN105988907B
CN105988907B CN201510047132.4A CN201510047132A CN105988907B CN 105988907 B CN105988907 B CN 105988907B CN 201510047132 A CN201510047132 A CN 201510047132A CN 105988907 B CN105988907 B CN 105988907B
Authority
CN
China
Prior art keywords
node
data
relationships
scheduling unit
calculation procedure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510047132.4A
Other languages
English (en)
Other versions
CN105988907A (zh
Inventor
周贤豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Computer Systems Co Ltd
Original Assignee
Shenzhen Tencent Computer Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tencent Computer Systems Co Ltd filed Critical Shenzhen Tencent Computer Systems Co Ltd
Priority to CN201510047132.4A priority Critical patent/CN105988907B/zh
Publication of CN105988907A publication Critical patent/CN105988907A/zh
Application granted granted Critical
Publication of CN105988907B publication Critical patent/CN105988907B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种业务监控方法和装置,属于计算机技术领域。该方法用于包括调度单元和至少一个计算单元的业务监控系统中,该方法包括:通过调度单元在节点关系图中处于数据未知状态的节点中,查找可运算节点;通过调度单元将各个可运算节点的节点信息分配至计算单元提供的至少两个计算进程;通过至少两个计算进程对各个可运算节点进行计算;在计算进程计算到可运算节点的数据后,通过调度单元在节点关系图中更新可运算节点的状态为数据已知状态,并在节点关系图中仍然存在处于数据未知的节点时,重新执行查找可运算节点的操作;解决了现有技术中业务监控系统计算需要监控的数据时所需要的计算时长较长,无法满足监控实时性的要求的问题。

Description

业务监控方法和装置
技术领域
本发明涉及计算机技术领域,特别涉及一种业务监控方法和装置。
背景技术
业务系统中通常包括很多个需要监控的节点,每个节点可以在每分钟产生一次数据。不同节点所产生的数据可能还互相依赖,对于这种互相依赖的节点,业务监控系统需要进行计算之后才能得到该节点对应的需要监控的数据。
为了保证监控的实时性,业务监控系统通常需要在一分钟内将各个节点在当前分钟内产生的数据计算完毕,得到需要监控的数据并存储至指定位置。但业务系统中需要监控的节点的数量级很大时,比如达到千万级时,业务监控系统在计算需要监控的数据时所需要的计算时长也会很长,无法满足监控实时性的要求。
发明内容
为了解决现有技术中对各个业务节点的监控实时性较差的问题,本发明实施例提供了一种业务监控方法和装置。所述技术方案如下:
第一方面,提供了一种业务监控方法,用于包括调度单元和至少一个计算单元的业务监控系统中,业务监控系统用于对节点关系图中各个节点在业务监控时所对应的数据进行计算,该方法包括:
通过调度单元在节点关系图中处于数据未知状态的节点中,查找可运算节点;节点关系图是有向无环图,节点关系图中第i+1层节点的数据的计算依赖于节点在第i层中的子节点的数据,可运算节点是自身所依赖的各个子节点均处于数据已知状态的节点,初始状态的节点关系图中位于底层的第1层节点均处于数据已知状态,i≥1;
通过调度单元将各个可运算节点的节点信息分配至计算单元提供的至少两个计算进程;通过至少两个计算进程对各个可运算节点进行计算;
在计算进程计算到可运算节点的数据后,通过调度单元在节点关系图中更新可运算节点的状态为数据已知状态,并在节点关系图中仍然存在处于数据未知的节点时,重新执行查找可运算节点的操作。
第二方面,提供了一种业务监控装置,装置用于包括调度单元和至少一个计算单元的业务监控系统中,业务监控系统用于对节点关系图中各个节点在业务监控时所对应的数据进行计算,该装置包括:
节点查找模块,用于通过调度单元在节点关系图中处于数据未知状态的节点中,查找可运算节点;节点关系图是有向无环图,节点关系图中第i+1层节点的数据的计算依赖于节点在第i层中的子节点的数据,可运算节点是自身所依赖的各个子节点均处于数据已知状态的节点,初始状态的节点关系图中位于底层的第1层节点均处于数据已知状态,i≥1;
信息分配模块,用于通过调度单元将各个可运算节点的节点信息分配至计算单元提供的至少两个计算进程;
节点计算模块,用于通过至少两个计算进程对各个可运算节点进行计算;
状态更新模块,用于在计算进程计算到可运算节点的数据后,通过调度单元在节点关系图中更新可运算节点的状态为数据已知状态;
节点查找模块,还用于在节点关系图中仍然存在处于数据未知的节点时,重新执行查找可运算节点的操作。
本发明实施例提供的技术方案的有益效果是:
通过将节点关系图中的各个可运算节点分配至至少两个计算进程,通过至少两个计算进程对各个可运算节点进行计算。其中,可运算节点是自身所依赖的各个子节点均处于数据已知状态的节点。解决了现有技术中业务监控系统计算需要监控的数据时所需要的计算时长较长,无法满足监控实时性的要求的问题;达到了可以缩短对需要监控的数据的计算时长,进而满足监控实时性的要求的效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的业务监控方法的方法流程图;
图2A是本发明另一实施例提供的业务监控方法的方法流程图;
图2B是本发明另一实施例提供的节点关系图的示意图;
图3是本发明一个实施例提供的业务监控装置的结构方框图;
图4是本发明另一实施例提供的业务监控装置的结构方框图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参考图1,其示出了本发明一个实施例提供的业务监控方法的方法流程图,该方法用于包括调度单元和至少一个计算单元的业务监控系统中,业务监控系统用于对节点关系图中各个节点在业务监控时所对应的数据进行计算,该方法包括:
步骤101,通过调度单元在节点关系图中处于数据未知状态的节点中,查找可运算节点。
节点关系图是有向无环图,节点关系图中第i+1层节点的数据的计算依赖于节点在第i层中的子节点的数据,可运算节点是自身所依赖的各个子节点均处于数据已知状态的节点,初始状态的节点关系图中位于底层的第1层节点均处于数据已知状态,i≥1。
步骤102,通过调度单元将各个可运算节点的节点信息分配至计算单元提供的至少两个计算进程;通过至少两个计算进程对各个可运算节点进行计算。
步骤103,在计算进程计算到可运算节点的数据后,通过调度单元在节点关系图中更新可运算节点的状态为数据已知状态,并在节点关系图中仍然存在处于数据未知的节点时,重新执行查找可运算节点的操作。
综上所述,本实施例提供的业务监控方法,通过将节点关系图中的各个可运算节点分配至至少两个计算进程,通过至少两个计算进程对各个可运算节点进行计算。其中,可运算节点是自身所依赖的各个子节点均处于数据已知状态的节点。解决了现有技术中业务监控系统计算需要监控的数据时所需要的计算时长较长,无法满足监控实时性的要求的问题;达到了可以缩短对需要监控的数据的计算时长,进而满足监控实时性的要求的效果。
请参考图2A,其示出了本发明另一实施例提供的业务监控方法的方法流程图,该方法用于包括调度单元和至少一个计算单元的业务监控系统中,业务监控系统用于对节点关系图中各个节点在业务监控时所对应的数据进行计算,如图2A所示,该方法包括:
步骤201,通过调度单元生成1个节点关系图,节点关系图包括需要计算的各个节点。
业务系统中通常包括多个需要监控的节点,业务监控系统可以通过调度单元来生成包含各个需要监控的节点的节点关系图。节点关系图是有向无环图,且节点关系图中第i+1层节点的数据的计算依赖于节点在第i层中的子节点的数据,初始状态的节点关系图中位于底层的第1层节点均处于数据已知状态,i≥1。其中,有向无环图是指不存在数据依赖于自身的节点的关系图,节点关系图中的各个节点为业务系统中的各个业务节点,每个节点的数据为该业务节点所对应的业务数据。
比如,业务监控系统可以生成图2B所示的节点关系图,该节点关系图中的节点1~节点9的数据为已知。
步骤202,通过调度单元在节点关系图中处于数据未知状态的节点中,查找可运算节点。
可运算节点是自身所依赖的各个子节点均处于数据已知状态的节点。
比如,在图2B的初始状态下,业务监控系统可以通过调度单元查找到节点10的数据为未知,且节点10所依赖的节点1和节点2的数据均为已知,所以业务监控系统可以通过调度单元将节点10作为可运算节点。类似的,在初始状态下,业务监控系统可以从图2B中查找到的可运算节点可以包括节点10、节点11、节点12、节点13和节点14。
步骤203,通过调度单元将各个可运算节点的节点信息保存至发送队列。
在业务监控系统查找到各个可运算节点之后,业务监控系统可以将各个可运算节点的节点信息保存至发送队列。其中,发送队列中的各个可运算节点均是可以并行计算的节点,且可运算节点的节点信息包括可运算节点所依赖的各个子节点的标识,或者,可运算节点所依赖的各个子节点的数据。
步骤204,通过调度单元接收计算单元发送的信息获取请求,信息获取请求用于为计算单元中的计算进程请求获取可运算节点的节点信息。
当业务监控系统需要通过计算单元对节点关系图中的可运算节点进行计算时,业务监控系统可以通过计算单元向调度单元发送信息获取请求,相应的,业务监控系统可以通过调度单元接收计算单元发送的信息获取请求。
其中,信息获取请求用于为计算单元中的计算进程获取可运算节点的节点信息;计算单元可以包括至少两个计算进程。
步骤205,通过调度单元向至少两个计算进程分别分配发送队列中的至少一个可运算节点的节点信息。
业务监控系统通过调度单元接收到信息获取请求之后,业务监控系统可以通过调度单元从发送队列中任意选择预定数量的可运算节点的节点信息,将选择的可运算节点的节点信息分别发送至至少两个计算进程。其中,每个计算进程对应于至少一个可运算节点的节点信息,预定数量为大于等于2的数量。
比如,以发送队列中的可运算节点包括节点10、节点11、节点12、节点13和节点14,且计算单元中的计算进程有2个为例,业务监控系统可以通过调度单元将节点10、节点11和节点12的节点信息发送至计算进程1,将节点13和节点14的节点信息发送至计算进程2。
需要说明的是,业务监控系统通过调度单元接收到信息获取请求之后,业务监控系统可以通过调度单元将发送队列中的所有可运算节点的节点信息均发送至至少两个计算进程,当然,业务监控系统还可以通过调度单元将发送队列中的部分可计算节点的节点信息发送至至少两个计算进程。
比如,仍然以发送队列中的可运算节点包括节点10、节点11、节点12、节点13和节点14,且计算单元中的计算进程有2个为例,业务监控系统可以通过调度单元将节点10和节点11的节点信息发送至计算进程1,将节点12的节点信息发送至计算进程2,而发送队列中的节点13和节点14的节点信息并不发送至任何计算进程。
步骤206,通过至少两个计算进程对各个可运算节点进行计算。
在业务监控系统通过调度单元向至少两个计算进程发送对应的节点信息之后,业务监控系统可以通过该至少两个计算进程分别接收对应的节点信息,并通过至少两个计算进程对各自接收到的节点信息所对应可运算节点进行计算。
可选地,当可运算节点的节点信息包括可运算节点所依赖的子节点的节点标识时,业务监控系统通过至少两个计算进程对各个可运算节点进行计算的步骤可以包括:
第一,对于每个计算进程,通过计算进程检测共享内存中是否包含目标可运算节点所依赖的子节点的数据。
其中,共享内存为至少两个计算进程所共享的内存,共享内存中包括至少两个计算进程历史使用过或者历史计算过的各个节点的数据,目标可运算节点为计算进程接收到的节点信息所对应的可运算节点。
比如,对于计算进程1,计算进程1可以检测共享内存中是否包含节点1、节点2、节点3或者节点4的数据。
第二,若共享内存中包含子节点的数据,则通过计算进程从共享内存中获取子节点的数据,根据子节点的数据对可运算节点进行计算。
如果共享内存中包含子节点的数据,则业务监控系统可以通过计算进程从共享内存中获取该子节点的数据,然后根据获取到的子节点的数据计算可运算节点的数据。比如,共享内存中包括节点1和节点2的数据,则计算进程从共享内存中取得对应的数据之后,计算进程可以计算节点10的数据。
而如果共享内存中不包含子节点的数据,则业务监控系统可以执行如下步骤:
(1)、通过计算单元发送数据获取请求至存储单元,该数据获取请求用于请求获取计算进程接收到的节点信息中的节点标识所对应的子节点的数据。
其中,存储单元用于存储节点关系图中数据已知的各个节点的数据。
(2)、通过计算单元接收存储单元返回的各个子节点的数据。
(3)、通过计算进程计算可运算节点的数据。
可选地,当节点信息包括各个子节点的数据时,业务监控系统可以通过计算进程直接计算可运算节点的数据。
需要说明的一点是,本实施例通过从共享内存中获取子节点的数据,减少了计算单元向存储单元请求数据时所需耗用的资源,减少了对存储单元的读取请求量。
需要说明的另一点是,从共享内存中获取子节点的数据的步骤为可选步骤,业务监控系统还可以通过计算单元直接从存储单元中获取子节点的数据,本实施例对此并不做限定。
需要说明的再一点是,在业务监控系统通过计算进程计算得到可运算节点的数据滞后,业务监控系统可以通过计算进程将计算得到的数据存储至共享内存中,以备后续使用。类似的,业务监控系统还可以通过计算进程将计算得到的可运算节点的数据存储至存储单元中,本实施例对此不做限定。
步骤207,在计算进程计算到可运算节点的数据后,通过调度单元在节点关系图中更新可运算节点的状态为数据已知状态,并在节点关系图中仍然存在处于数据未知的节点时,重新执行查找可运算节点的操作。
比如,业务监控系统通过计算进程计算得到节点10和节点11的数据后,业务监控系统可以通过调度单元将节点关系图中节点10和节点11的状态修改为数据已知状态。
此后,当节点关系图中仍然有数据未知的节点时,业务监控系统可以再次通过调度单元执行查找可运算节点的操作,也即继续执行步骤202。
在本实施例的一个应用场景中,调度单元生成图2B所示的节点关系图,在初始状态下,调度单元可以查找到该节点关系图中的可运算节点可以包括节点10、节点11、节点12、节点13和节点14,将查找到的各个节点的节点信息保存至发送队列中。当调度单元接收到计算单元发送的信息获取请求之后,调度单元将发送队列中的节点10和节点11的节点信息发送至计算进程1,将节点12的节点信息发送至计算进程2。当计算进程1和计算进程2计算得到节点10、节点11和节点12之后,调度单元可以将节点10、节点11和节点12修改为数据已知状态。并且,由于节点关系图中还存在数据未知的节点,所以业务监控系统可以通过调度单元再次执行查找可运算节点的步骤。具体的,由于节点15所依赖的节点10、节点11和节点12均为已知,所以业务监控系统可以将节点15的节点信息保存至发送队列中。当业务监控系统通过调度单元接收到信息获取请求时,业务监控系统可以通过调度单元将发送队列中的节点15的节点信息发送至计算进程1,将发送队列中的节点13和节点14的节点信息发送至计算进程2。当计算进程1和计算进程2计算得到节点15、节点13和节点14之后,调度单元可以将节点15、节点13和节点14修改为数据已知状态。并且,由于节点关系图中还存在数据未知的节点,所以业务监控系统可以通过调度单元再次执行查找可运算节点的步骤,直至业务监控系统最终计算得到最后一个节点也即节点22结束。
需要说明的第一点是,在步骤203中,如果查找到的可运算节点只有一个,则业务监控系统可以通过调度单元将该可运算节点的节点信息发送至至少两个计算进程中的一个计算进程,本实施例对此并不做限定。
需要说明的第二点是,本实施例只是以通过至少两个进程对各个可运算节点进行计算为例,可选地,计算单元还可以只有一个计算进程,只是该计算进程中可以包括至少两个计算线程,通过该至少两个计算线程对各个可运算节点进行计算,本实施例对此并不做限定。
需要说明的第三点是,本实施例只是以先执行步骤202后执行步骤204为例,可选地,还可以同时执行上述两个步骤,或者先执行步骤204后执行步骤202,本实施例对此并不做限定。
需要说明的第四点是,上述实施例中的计算单元、调度单元以及存储单元可以实现在同一个设备中,也可以实现在不同设备中,本实施例对此并不做限定。
综上所述,本实施例提供的业务监控方法,通过将节点关系图中的各个可运算节点分配至至少两个计算进程,通过至少两个计算进程对各个可运算节点进行计算。其中,可运算节点是自身所依赖的各个子节点均处于数据已知状态的节点。解决了现有技术中业务监控系统计算需要监控的数据时所需要的计算时长较长,无法满足监控实时性的要求的问题;达到了可以缩短对需要监控的数据的计算时长,进而满足监控实时性的要求的效果。
本实施例通过从共享内存中获取子节点的数据,减少了计算单元向存储单元请求数据时所需耗用的资源,减少了对存储单元的读取请求量。
可选地,步骤201可以包括:通过调度单元每隔预定时间间隔生成1个节点关系图,节点关系图包括当前需要计算的各个节点。
由于业务系统中需要监控的节点可能会随着时间的推移而发生变化,比如,一段时间之后业务系统中出现新增的需要监控的节点,或者一段时间之后之前需要监控的节点不再需要继续监控,所以业务监控系统可以通过调度单元每隔预定时间间隔生成一个节点关系图。每次生成的节点关系图包括当前需要监控的各个节点。
通过每隔预定时间间隔生成1个节点关系图,使得节点关系图中能够包含当前需要监控的各个节点,保证了监控的准确度。
相应的,在步骤207之前,业务监控系统还可以执行如下步骤:
第一,在计算进程计算到可运算节点的数据后,通过调度单元获取计算进程最近计算的各个可运算节点所属的节点关系图的时间标识,时间标识用于标识节点关系图的生成时间。
在业务监控系统通过计算进程计算得到可运算节点的数据之后,业务监控系统可以通过计算进程获取该可运算节点所属的时间标识,然后通过计算进程将该时间标识发送至调度单元。相应的,业务监控系统可以通过调度单元接收计算进程发送的时间标识。
其中,业务监控系统通过计算进程获取该可运算节点所属的时间标识的步骤可以包括:业务监控系统通过计算进程读取接收该可运算节点的节点信息的同时接收到的时间标识,将该时间标识确定为该可运算节点所属的节点关系图的时间标识。
在业务监控系统通过调度单元向至少两个计算进程分配各个可运算节点的节点信息时,业务监控系统可以同时发送每个可运算节点所属的时间标识至计算进程,所以计算进程可以读取到该可运算节点所属的节点关系图的时间标识。
第二,通过调度单元检测时间标识所指示的节点关系图是否是调度单元当前维护的节点关系图。
业务监控系统通过调度单元每次生成一个节点关系图时,业务监控系统可以通过调度单元记录生成的该节点关系图的时间标识,所以在业务监控系统通过调度单元获取到最近计算的各个可运算节点所属的节点关系图的时间标识之后,业务监控系统可以通过调度单元检测该时间标识与调度单元中当前维护的节点关系图的时间标识是否相同;如果相同,则确定之前计算的各个可运算节点所属的节点关系图是调度单元当前维护的节点关系图;反之,则不是。
第三,若是调度单元当前维护的节点关系图,则执行步骤207。
而如果不是调度单元当前维护的节点关系图,则流程结束。
请参考图3,其示出了本发明一个实施例提供的业务监控装置的结构方框图,该业务监控装置用于包括调度单元和至少一个计算单元的业务监控系统中,所述业务监控系统用于对节点关系图中各个节点在业务监控时所对应的数据进行计算,该业务监控装置包括:节点查找模块310、信息分配模块320、节点计算模块330和状态更新模块340。
节点查找模块310,用于通过所述调度单元在所述节点关系图中处于数据未知状态的节点中,查找可运算节点;所述节点关系图是有向无环图,所述节点关系图中第i+1层节点的数据的计算依赖于所述节点在第i层中的子节点的数据,所述可运算节点是自身所依赖的各个子节点均处于数据已知状态的节点,初始状态的所述节点关系图中位于底层的第1层节点均处于数据已知状态,i≥1;
信息分配模块320,用于通过所述调度单元将各个所述可运算节点的节点信息分配至所述计算单元提供的至少两个计算进程;
节点计算模块330,用于通过所述至少两个计算进程对各个所述可运算节点进行计算;
状态更新模块340,用于在所述计算进程计算到所述可运算节点的数据后,通过所述调度单元在所述节点关系图中更新所述可运算节点的状态为数据已知状态;
所述节点查找模块310,还用于在所述节点关系图中仍然存在处于数据未知的节点时,重新执行所述查找可运算节点的操作。
综上所述,本实施例提供的业务监控装置,通过将节点关系图中的各个可运算节点分配至至少两个计算进程,通过至少两个计算进程对各个可运算节点进行计算。其中,可运算节点是自身所依赖的各个子节点均处于数据已知状态的节点。解决了现有技术中业务监控系统计算需要监控的数据时所需要的计算时长较长,无法满足监控实时性的要求的问题;达到了可以缩短对需要监控的数据的计算时长,进而满足监控实时性的要求的效果。
请参考图4,其示出了本发明一个实施例提供的业务监控装置的结构方框图,该业务监控装置用于包括调度单元和至少一个计算单元的业务监控系统中,所述业务监控系统用于对节点关系图中各个节点在业务监控时所对应的数据进行计算,该业务监控装置包括:节点查找模块410、信息分配模块420、节点计算模块430和状态更新模块440。
节点查找模块410,用于通过调度单元在节点关系图中处于数据未知状态的节点中,查找可运算节点;节点关系图是有向无环图,节点关系图中第i+1层节点的数据的计算依赖于节点在第i层中的子节点的数据,可运算节点是自身所依赖的各个子节点均处于数据已知状态的节点,初始状态的节点关系图中位于底层的第1层节点均处于数据已知状态,i≥1;
信息分配模块420,用于通过调度单元将各个可运算节点的节点信息分配至计算单元提供的至少两个计算进程;
节点计算模块430,用于通过至少两个计算进程对各个可运算节点进行计算;
状态更新模块440,用于在计算进程计算到可运算节点的数据后,通过调度单元在节点关系图中更新可运算节点的状态为数据已知状态;
节点查找模块410,还用于在节点关系图中仍然存在处于数据未知的节点时,重新执行查找可运算节点的操作。
可选地,信息分配模块420,包括:
信息保存单元421,用于通过调度单元将各个可运算节点的节点信息保存至发送队列;
请求接收单元422,用于通过调度单元接收计算单元发送的信息获取请求,信息获取请求用于为计算单元中的计算进程请求获取可运算节点的节点信息;
信息分配单元423,用于通过调度单元向至少两个计算进程分别分配发送队列中的至少一个可运算节点的节点信息。
可选地,装置还包括:
生成模块450,用于通过调度单元每隔预定时间间隔生成1个节点关系图,节点关系图包括当前需要计算的各个节点。
可选地,装置还包括:
标识获取模块460,用于通过调度单元获取计算进程最近计算的各个可运算节点所属的节点关系图的时间标识,时间标识用于标识节点关系图的生成时间;
检测模块470,用于通过调度单元检测时间标识所指示的节点关系图是否是调度单元当前维护的节点关系图;
状态更新模块440,还用于在检测模块的检测结果为是调度单元当前维护的节点关系图时,执行通过调度单元在节点关系图中更新可运算节点的状态为数据已知状态的操作。
可选地,节点计算模块430,包括:
检测单元431,用于对于每个计算进程,通过计算进程检测共享内存中是否包含目标可运算节点所依赖的子节点的数据,共享内存为至少两个计算进程所共享的内存,目标可运算节点为计算进程接收到的节点信息所对应的可运算节点;
数据获取单元432,用于在检测单元431的检测结果为共享内存中包含子节点的数据时,通过计算进程从共享内存中获取子节点的数据;
节点计算单元433,用于根据子节点的数据对可运算节点进行计算。
综上所述,本实施例提供的业务监控装置,通过将节点关系图中的各个可运算节点分配至至少两个计算进程,通过至少两个计算进程对各个可运算节点进行计算。其中,可运算节点是自身所依赖的各个子节点均处于数据已知状态的节点。解决了现有技术中业务监控系统计算需要监控的数据时所需要的计算时长较长,无法满足监控实时性的要求的问题;达到了可以缩短对需要监控的数据的计算时长,进而满足监控实时性的要求的效果。
本实施例通过从共享内存中获取子节点的数据,减少了计算单元向存储单元请求数据时所需耗用的资源,减少了对存储单元的读取请求量。
需要说明的是:上述实施例提供的业务监控装置在计算数据时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的业务监控装置与业务监控方法的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种业务监控方法,其特征在于,用于包括调度单元和至少一个计算单元的业务监控系统中,所述业务监控系统用于对节点关系图中各个节点在业务监控时所对应的数据进行计算,所述方法包括:
通过所述调度单元在所述节点关系图中处于数据未知状态的节点中,查找可运算节点;所述节点关系图是有向无环图,所述节点关系图中第i+1层节点的数据的计算依赖于所述节点在第i层中的子节点的数据,所述可运算节点是自身所依赖的各个子节点均处于数据已知状态的节点,初始状态的所述节点关系图中位于底层的第1层节点均处于数据已知状态,i≥1;
通过所述调度单元将各个所述可运算节点的节点信息分配至所述计算单元提供的至少两个计算进程;通过所述至少两个计算进程对各个所述可运算节点进行计算;
在所述计算进程计算到所述可运算节点的数据后,通过所述调度单元在所述节点关系图中更新所述可运算节点的状态为数据已知状态,并在所述节点关系图中仍然存在处于数据未知的节点时,重新执行所述查找可运算节点的操作;
所述通过所述调度单元将各个所述可运算节点的节点信息分配至所述计算单元提供的至少两个计算进程,包括:
通过所述调度单元将各个所述可运算节点的节点信息保存至发送队列;
通过所述调度单元接收所述计算单元发送的信息获取请求,所述信息获取请求用于为所述计算单元中的计算进程请求获取所述可运算节点的节点信息;
通过所述调度单元从所述发送队列中任意选择预设数量的所述可运算节点的节点信息,将选择的可运算节点的节点信息分别发送至所述至少两个计算进程;
其中,所述预设数量为大于等于2的数量,所述至少两个计算进程中的每个计算进程对应于至少一个可运算节点的节点信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过所述调度单元每隔预定时间间隔生成1个所述节点关系图,所述节点关系图包括当前需要计算的各个节点。
3.根据权利要求2所述的方法,其特征在于,所述通过所述调度单元在所述节点关系图中更新所述可运算节点的状态为数据已知状态之前,还包括:
通过所述调度单元获取所述计算进程最近计算的各个所述可运算节点所属的节点关系图的时间标识,所述时间标识用于标识所述节点关系图的生成时间;
通过所述调度单元检测所述时间标识所指示的节点关系图是否是所述调度单元当前维护的节点关系图;
若是所述调度单元当前维护的节点关系图,则执行所述通过所述调度单元在所述节点关系图中更新所述可运算节点的状态为数据已知状态的操作。
4.根据权利要求1所述的方法,其特征在于,所述通过所述至少两个计算进程对各个所述可运算节点进行计算,包括:
对于每个计算进程,通过所述计算进程检测共享内存中是否包含目标可运算节点所依赖的子节点的数据,所述共享内存为所述至少两个计算进程所共享的内存,所述目标可运算节点为所述计算进程接收到的节点信息所对应的可运算节点;
若所述共享内存中包含所述子节点的数据,则通过所述计算进程从所述共享内存中获取所述子节点的数据,根据所述子节点的数据对所述可运算节点进行计算。
5.一种业务监控装置,其特征在于,用于包括调度单元和至少一个计算单元的业务监控系统中,所述业务监控系统用于对节点关系图中各个节点在业务监控时所对应的数据进行计算,所述装置包括:
节点查找模块,用于通过所述调度单元在所述节点关系图中处于数据未知状态的节点中,查找可运算节点;所述节点关系图是有向无环图,所述节点关系图中第i+1层节点的数据的计算依赖于所述节点在第i层中的子节点的数据,所述可运算节点是自身所依赖的各个子节点均处于数据已知状态的节点,初始状态的所述节点关系图中位于底层的第1层节点均处于数据已知状态,i≥1;
信息分配模块,用于通过所述调度单元将各个所述可运算节点的节点信息分配至所述计算单元提供的至少两个计算进程;
节点计算模块,用于通过所述至少两个计算进程对各个所述可运算节点进行计算;
状态更新模块,用于在所述计算进程计算到所述可运算节点的数据后,通过所述调度单元在所述节点关系图中更新所述可运算节点的状态为数据已知状态;
所述节点查找模块,还用于在所述节点关系图中仍然存在处于数据未知的节点时,重新执行所述查找可运算节点的操作;
所述信息分配模块,包括:
信息保存单元,用于通过所述调度单元将各个所述可运算节点的节点信息保存至发送队列;
请求接收单元,用于通过所述调度单元接收所述计算单元发送的信息获取请求,所述信息获取请求用于为所述计算单元中的计算进程请求获取所述可运算节点的节点信息;
信息分配单元,用于通过所述调度单元从所述发送队列中任意选择预设数量的所述可运算节点的节点信息,将选择的可运算节点的节点信息分别发送至所述至少两个计算进程;
其中,所述预设数量为大于等于2的数量,所述至少两个计算进程中的每个计算进程对应于至少一个可运算节点的节点信息。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
生成模块,用于通过所述调度单元每隔预定时间间隔生成1个所述节点关系图,所述节点关系图包括当前需要计算的各个节点。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
标识获取模块,用于通过所述调度单元获取所述计算进程最近计算的各个所述可运算节点所属的节点关系图的时间标识,所述时间标识用于标识所述节点关系图的生成时间;
检测模块,用于通过所述调度单元检测所述时间标识所指示的节点关系图是否是所述调度单元当前维护的节点关系图;
所述状态更新模块,还用于在所述检测模块的检测结果为是所述调度单元当前维护的节点关系图时,执行所述通过所述调度单元在所述节点关系图中更新所述可运算节点的状态为数据已知状态的操作。
8.根据权利要求5所述的装置,其特征在于,所述节点计算模块,包括:
检测单元,用于对于每个计算进程,通过所述计算进程检测共享内存中是否包含目标可运算节点所依赖的子节点的数据,所述共享内存为所述至少两个计算进程所共享的内存,所述目标可运算节点为所述计算进程接收到的节点信息所对应的可运算节点;
数据获取单元,用于在所述检测单元的检测结果为所述共享内存中包含所述子节点的数据时,通过所述计算进程从所述共享内存中获取所述子节点的数据;
节点计算单元,用于根据所述子节点的数据对所述可运算节点进行计算。
CN201510047132.4A 2015-01-29 2015-01-29 业务监控方法和装置 Active CN105988907B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510047132.4A CN105988907B (zh) 2015-01-29 2015-01-29 业务监控方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510047132.4A CN105988907B (zh) 2015-01-29 2015-01-29 业务监控方法和装置

Publications (2)

Publication Number Publication Date
CN105988907A CN105988907A (zh) 2016-10-05
CN105988907B true CN105988907B (zh) 2019-04-02

Family

ID=57035074

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510047132.4A Active CN105988907B (zh) 2015-01-29 2015-01-29 业务监控方法和装置

Country Status (1)

Country Link
CN (1) CN105988907B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109558292A (zh) * 2017-09-26 2019-04-02 阿里巴巴集团控股有限公司 一种监控方法及装置
CN112311899A (zh) * 2020-11-18 2021-02-02 中国联合网络通信集团有限公司 一种会话处理方法、装置及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685452A (zh) * 2008-09-26 2010-03-31 阿里巴巴集团控股有限公司 数据仓库调度方法及调度系统
CN102629906A (zh) * 2012-03-30 2012-08-08 浪潮电子信息产业股份有限公司 一种将集群管理节点做双机实现提高集群业务可用性的设计办法
CN103942034A (zh) * 2014-03-21 2014-07-23 深圳华大基因科技服务有限公司 任务调度方法及实现该方法的电子装置
CN104184819A (zh) * 2014-08-29 2014-12-03 城云科技(杭州)有限公司 多层级负载均衡云资源监控方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109614170B (zh) * 2013-04-23 2022-02-25 起元科技有限公司 控制由计算系统执行的任务

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685452A (zh) * 2008-09-26 2010-03-31 阿里巴巴集团控股有限公司 数据仓库调度方法及调度系统
CN102629906A (zh) * 2012-03-30 2012-08-08 浪潮电子信息产业股份有限公司 一种将集群管理节点做双机实现提高集群业务可用性的设计办法
CN103942034A (zh) * 2014-03-21 2014-07-23 深圳华大基因科技服务有限公司 任务调度方法及实现该方法的电子装置
CN104184819A (zh) * 2014-08-29 2014-12-03 城云科技(杭州)有限公司 多层级负载均衡云资源监控方法

Also Published As

Publication number Publication date
CN105988907A (zh) 2016-10-05

Similar Documents

Publication Publication Date Title
Bhattacharjee et al. Barista: Efficient and scalable serverless serving system for deep learning prediction services
Lv et al. Microservice deployment in edge computing based on deep Q learning
CN104011719B (zh) 消息跟踪和检查的方法和系统
CN109146381A (zh) 物流数据监控方法、装置、电子设备及计算机存储介质
WO2015139164A1 (zh) 一种任务调度的方法、装置及设备
CN110502431B (zh) 系统服务评测方法、装置及电子设备
CN102868573A (zh) Web服务负载云测试方法和装置
CN111130842B (zh) 一种反映网络多维资源的动态网络图谱数据库构建方法
CN109981419A (zh) 负载均衡特性的测试方法、装置、系统、设备及存储介质
Tuli et al. GOSH: Task scheduling using deep surrogate models in fog computing environments
CN113537584A (zh) 巡检任务冲突处理方法、装置、电子设备及存储介质
CN108958975A (zh) 一种控制数据恢复速度的方法、装置及设备
WO2023207689A1 (zh) 一种变更风险评估方法、设备及存储介质
CN107220121A (zh) 一种numa架构下沙箱环境测试方法及其系统
CN105988907B (zh) 业务监控方法和装置
CN109753593A (zh) 喷洒作业任务调度方法及无人机
CN109739684A (zh) 基于向量时钟的分布式键值数据库的副本修复方法与装置
CN109936471A (zh) 一种多集群的资源分配方法和装置
CN109032809A (zh) 基于遥感影像存储位置的异构并行调度系统
CN109992408A (zh) 一种资源分配方法、装置、电子设备和存储介质
Samir et al. A controller for anomaly detection, analysis and management for self-adaptive container clusters
Chai et al. Modeling distributed platforms from application traces for realistic file transfer simulation
CN110493044A (zh) 一种可量化的态势感知的方法和系统
CN108880930A (zh) 一种网络环路的检测方法及设备
US20140173630A1 (en) Non real-time metrology data management

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant