CN115934461A - 服务系统监测方法、装置、介质及设备 - Google Patents

服务系统监测方法、装置、介质及设备 Download PDF

Info

Publication number
CN115934461A
CN115934461A CN202211539128.6A CN202211539128A CN115934461A CN 115934461 A CN115934461 A CN 115934461A CN 202211539128 A CN202211539128 A CN 202211539128A CN 115934461 A CN115934461 A CN 115934461A
Authority
CN
China
Prior art keywords
interface
target
service
attribution
dependent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211539128.6A
Other languages
English (en)
Inventor
贾立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Youzhuju Network Technology Co Ltd
Original Assignee
Beijing Youzhuju Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Youzhuju Network Technology Co Ltd filed Critical Beijing Youzhuju Network Technology Co Ltd
Priority to CN202211539128.6A priority Critical patent/CN115934461A/zh
Publication of CN115934461A publication Critical patent/CN115934461A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本公开涉及一种服务系统监测方法、装置、介质及设备,所述方法包括:接收服务系统中的服务接口的状态信息;根据待监测的目标服务接口的状态信息,确定所述目标服务接口是否运行异常;若所述目标服务接口运行异常,则确定所述目标服务接口对应的依赖接口,所述依赖接口包含所述目标服务接口对应的直接依赖接口和间接依赖接口;根据所述目标服务接口和所述依赖接口中每一接口在目标时段内的目标状态信息,确定所述目标服务接口运行异常对应的目标归因接口。由此通过对目标服务接口及其依赖接口的目标状态信息进行分析,快速且准确地确定出服务系统中导致目标服务接口运行异常的接口,可以实现异常问题的快速定位,便于运行异常的接口的快速恢复。

Description

服务系统监测方法、装置、介质及设备
技术领域
本公开涉及计算机技术领域,具体地,涉及一种服务系统监测方法、装5置、介质及设备。
背景技术
在规模较为庞大的服务架构中,系统间常出现大量的耦合、甚至回环依赖。这些依赖虽然能够在一定程度上加速服务迭代,同时也提升故障情况下0的运维复杂度。现有技术中,当对应的链路发生故障时,排查过程较为漫长,
其中存在着大量的基于群的1:N广播式沟通,难以快速实现故障问题的定位。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的5具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开提供一种服务系统监测方法,所述方法包括:
接收服务系统中的服务接口的状态信息;
0根据待监测的目标服务接口的状态信息,确定所述目标服务接口是否运行异常;
若所述目标服务接口运行异常,则确定所述目标服务接口对应的依赖接口,所述依赖接口包含所述目标服务接口对应的直接依赖接口和间接依赖接口;
5根据所述目标服务接口和所述依赖接口中每一接口在目标时段内的目标状态信息,确定所述目标服务接口运行异常对应的目标归因接口。
第二方面,本公开提供一种服务系统监测装置,所述装置包括:
接收模块,用于接收服务系统中的服务接口的状态信息;
第一确定模块,用于根据待监测的目标服务接口的状态信息,确定所述目标服务接口是否运行异常;
第二确定模块,用于若所述目标服务接口运行异常,则确定所述目标服务接口对应的依赖接口,所述依赖接口包含所述目标服务接口对应的直接依赖接口和间接依赖接口;
第三确定模块,用于根据所述目标服务接口和所述依赖接口中每一接口在目标时段内的目标状态信息,确定所述目标服务接口运行异常对应的目标归因接口。
第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现第一方面所述方法的步骤。
第四方面,本公开提供一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现第一方面所述方法的步骤。
在上述技术方案中,通过对服务系统中的服务接口的状态信息进行监测,则可以实时确定目标服务接口是否运行异常,以便对目标服务接口的运行状态进行实时监测。进一步地,若所述目标服务接口运行异常,则确定所述目标服务接口对应的依赖接口,所述依赖接口包含所述目标服务接口对应的直接依赖接口和间接依赖接口,并根据所述目标服务接口和所述依赖接口中每一接口在目标时段内的目标状态信息,确定所述目标服务接口运行异常对应的目标归因接口。由此,通过上述技术方案,可以通过对目标服务接口及其依赖接口的目标状态信息进行分析,快速且准确地确定出服务系统中导致目标服务接口运行异常的接口,一方面可以实现异常问题的快速定位,以便于运行异常的接口的快速恢复。另一方面可以确定出服务系统中真正运行异常的接口,以便确定服务系统中真正需要进行运维操作的接口,避免对各个目标服务接口进行服务恢复所导致的资源浪费以及对服务系统的负载压力,保证服务系统的安全监测和运行,提升用户使用体验。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。在附图中:
图1是根据本公开的一种实施方式提供的服务系统监测方法的流程图;
图2是所述服务系统对应的服务依赖图的示意图;
图3根据本公开的一种实施方式提供的服务系统监测装置的框图;
图4示出了适于用来实现本公开实施例的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确地提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主地选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
作为一种可选的但非限定性的实现方式,响应于接收到用户的主动请求,向用户发送提示信息的方式例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。
可以理解的是,上述通知和获取用户授权过程仅是示意性的,不对本公开的实现方式构成限定,其它满足相关法律法规的方式也可应用于本公开的实现方式中。
同时,可以理解的是,本技术方案所涉及的数据(包括但不限于数据本身、数据的获取或使用)应当遵循相应法律法规及相关规定的要求。
图1所示,为根据本公开的一种实施方式提供的服务系统监测方法的流程图,如图1所示,所述方法可以包括:
在步骤11中,接收服务系统中的服务接口的状态信息。
其中,该服务系统中可以包含多个服务接口,服务接口在启动之后可以间隔预设时长上报其状态信息,状态信息可以用于表示该服务接口当前是否运行正常,以及若是运行异常的情况下对应的异常信息,该异常信息可以用于指示该服务接口的告警接口信息,例如可以是当前服务接口运行异常,也可以是调用某个接口异常等。
则在该实施例中,监测系统可以接收服务接口上报的状态信息,并对该状态信息进行存储,以便后续进行异常归因分析。
在步骤12中,根据待监测的目标服务接口的状态信息,确定目标服务接口是否运行异常。
作为示例,在监测系统中可以基于实际的使用需求针对某些接口配置对应的检测规则,以用于确定该服务接口是否出现异常。如针对服务接口A,可以预先配置在T1时段内告警N次则确定运行异常;针对服务接口B,可以预先配置在T1时段内流量小于M则确定运行异常。其可以根据各个服务接口的功能和业务要求进行设置,本公开对此不做限定。
其中,目标服务接口即表示配置有检测规则的服务接口,则在接收到目标服务接口的状态信息后,可以根据该状态信息与该目标服务接口配置的检测规则进行匹配,若与该检测规则匹配,则可以认为该目标服务接口运行异常。
作为另一示例,可以基于目标服务接口对应的检测平台对其进行异常检测,如可以基于该状态信息,调用目标服务接口的对应的检测平台中的算法进行检测,并接收该检测平台中返回的检测结果,以确定该目标服务接口是否运行异常。其中,该检测平台可以为本领域中通用的检测平台,本公开对此不作限定。
在步骤13中,若目标服务接口运行异常,则确定目标服务接口对应的依赖接口,所述依赖接口包含所述目标服务接口对应的直接依赖接口和间接依赖接口。
在步骤14中,根据目标服务接口和依赖接口中每一接口在目标时段内的目标状态信息,确定目标服务接口运行异常对应的目标归因接口,该目标归因接口用于表示导致该目标服务接口运行异常的接口。
其中,在服务系统中多个接口之间存在关联关系,如在服务接口A中需要依赖服务接口B中的某些算法运行,则在服务接口B运行异常时,服务接口A也会出现异常,而服务接口A运行异常可能仅是由于服务接口B运行异常所导致,而服务接口A本身可能不存在异常问题,若针对服务接口A和B分别进行异常分析,则会严重增加需要进行分析的数据量。
基于此,在该实施例中,在目标服务接口异常时,可以进一步获取其对应的依赖接口,从而对目标服务接口的异常进行归因分析,以明确该目标服务接口运行异常是由于其本身异常所导致的还是由于其依赖的接口运行异常所导致,确定出准确的目标归因接口。
其中,目标时段可以根据实际的应用场景进行设置,本公开对比不作限定,如可以设置最近的30分钟为目标时段,则可以获取目标服务接口和依赖接口中每一接口在最近的30分钟内的状态信息作为目标状态信息,以对目标服务接口运行异常进行归因分析。
在上述技术方案中,通过对服务系统中的服务接口的状态信息进行监测,则可以实时确定目标服务接口是否运行异常,以便对目标服务接口的运行状态进行实时监测。进一步地,若所述目标服务接口运行异常,则确定所述目标服务接口对应的依赖接口,所述依赖接口包含所述目标服务接口对应的直接依赖接口和间接依赖接口,并根据所述目标服务接口和所述依赖接口中每一接口在目标时段内的目标状态信息,确定所述目标服务接口运行异常对应的目标归因接口。由此,通过上述技术方案,可以通过对目标服务接口及其依赖接口的目标状态信息进行分析,快速且准确地确定出服务系统中导致目标服务接口运行异常的接口,一方面可以实现异常问题的快速定位,以便于运行异常的接口的快速恢复。另一方面可以确定出服务系统中真正运行异常的接口,以便确定服务系统中真正需要进行运维操作的接口,避免对各个目标服务接口进行服务恢复所导致的资源浪费以及对服务系统的负载压力,保证服务系统的安全监测和运行,提升用户使用体验。
在一种可能的实施例中,所述确定所述目标服务接口对应的依赖接口,包括:
针对所述目标服务接口,根据所述目标服务接口的接口标识,查询所述服务系统对应的服务依赖图,以获得所述依赖接口;
其中,所述服务依赖图通过以下方式确定:
针对每一所述服务接口,获取所述服务接口对应的配置信息;
根据所述配置信息和所述服务接口的代码文件,确定所述服务接口的接口标识和所述服务接口的依赖接口的接口标识;
生成由所述服务接口的接口标识指向所述服务接口的依赖接口的接口标识的边,以获得所述服务依赖图。
其中,如图2所示,为所述服务系统对应的服务依赖图的示意图,针对服务接口A,可以获取该服务接口A对应的配置信息,在该配置信息中可以定义该服务接口A的接口标识,以及服务接口A中的方法、集群等参数,并通过对该服务接口的代码文件进行解析,获得该服务接口的依赖接口的接口标识,其中,对代码文件进行解析获得依赖接口的方式可以采用本领域中通常的方式,在此不再赘述。例如,确定出的服务接口A的依赖接口的接口标识为B,则可以生成如图2中服务接口A指向服务接口B所示的边,其他接口的边的确定方式与上文类似。
由此,可以针对该服务系统中的各个服务接口,确定各个服务接口之间的依赖关系,以便于对各个服务接口进行关联管理。作为示例,服务系统中的运行异常的目标服务接口为服务接口B,则基于该服务依赖图可以确定出其依赖接口为C、D、E、G、F、H,其中,接口C和D为其直接依赖接口,E、G、F、H为其间接依赖接口。
通过上述技术方案,可以基于服务系统中的服务接口对应的服务依赖图确定目标服务接口对应的依赖接口,为后续对异常的接口进行归因提供数据参考,便于确定出真实出现异常的接口,以实现服务系统中接口运行的安全、准确监测。
在一种可能的实施例中,所述根据所述目标服务接口和所述依赖接口中每一接口在目标时段内的目标状态信息,确定所述目标服务接口运行异常对应的目标归因接口的示例性实现方式如下,该步骤可以包括:
对待分析接口的目标状态信息进行归因处理,获得所述待分析接口对应的基础归因接口,其中,所述待分析接口初始为所述目标服务接口;
示例地,待分析接口初始为目标服务接口B,则可以首先获取服务接口B的目标状态信息并进行归因处理,确定其对应的基础归因接口。其中,该基础归因接口为基于该待分析接口的目标状态信息所确定出的使得该待分析接口运行异常的直接依赖接口。
若所述基础归因接口不包括所述待分析接口的任一依赖接口,则将所述待分析接口添加至所述目标归因接口;
若所述基础归因接口包括所述待分析接口的依赖接口,则将所述基础归因接口中包含的依赖接口确定为异常依赖接口,并基于所述异常依赖接口的目标状态信息,确定所述目标归因接口。
其中,若所述基础归因接口不包括所述待分析接口的任一依赖接口,则表示待分析接口运行异常不是由其依赖接口导致的,此时可以直接将所述待分析接口添加至所述目标归因接口。
若所述基础归因接口包括所述待分析接口的依赖接口,则表示该待分析接口运行异常至少一部分是由该依赖接口所导致的,此时可以进一步对该依赖接口进行分析,确定该依赖接口异常的原因,直至确定所述目标归因接口。
由此,通过上述技术方案,通过目标服务接口和依赖接口之间的依赖关系,依次进行归因分析,从而对引起该目标服务接口运行异常的接口的准确归因,为后续进行服务恢复提供可靠的数据支持,实现对服务接口异常的快速和准确定位,便于及时确定应对措施,保证服务系统的安全运行。
在一种可能的实施例中,所述对待分析接口的目标状态信息进行归因处理,获得所述待分析接口对应的基础归因接口,可以包括:
对所述待分析接口的目标状态信息进行识别,获得所述待分析接口的目标状态信息对应的告警接口。
其中,目标状态信息可以用于表示待分析接口的运行状态是否异常,如针对待分析接口B,其对应的目标状态信息可以包含表示运行正常的状态信息和表示运行异常的状态信息,在运行异常的状态信息中会包含该运行异常对应的告警接口,如其可以是服务接口B运行异常,调用服务接口C异常,则可以从对应于运行异常的状态信息中确定出对应的告警接口。
针对每一所述告警接口,若所述告警接口的告警次数与所述目标状态信息对应的告警总次数的比值超过告警阈值,则将所述告警接口确定为所述待分析接口的基础归因接口。
获取的目标状态信息中对应于运行异常的数量为num,同时可以针对每一告警接口统计该告警接口对应的告警次数。以服务接口B为例,其在目标时段内对应的目标状态信息对应的告警总次数为N1,其中针对服务接口B运行异常对应的次数为N2,即告警接口B的告警次数为N2,针对调用服务接口C异常的次数为N3,即告警接口C的告警次数为N3,该实施例中,N1为N2和N3的总和。
进一步地,若N2与N1的比值未超过告警阈值,即多次告警中由于服务接口B本身异常所致的告警比例较低,此时可以认为服务接口B运行异常并非是由其自身所导致的,可以不认为该告警接口B为待分析接口B对应的基础归因接口,若N3与N1的比值超过告警阈值,即多次告警中由于调用服务接口C异常所致的告警比例较高,此时可以认为服务接口C运行异常是导致服务接口B异常的原因,确定该告警接口C为待分析接口B对应的基础归因接口。
由此,通过上述技术方案,可以对待分析接口的目标状态信息进行分析,从而可以确定待分析接口其运行异常是由其自身运行异常所致,或是由其依赖的服务接口运行异常所致,为进一步进行异常归因提供数据支持,同时可以在一定程度上避免针对每一目标服务接口进行后续异常排查维护所导致的数据量。
在一种可能的实施例中,所述若所述基础归因接口包括所述待分析接口的依赖接口,则将所述基础归因接口中包含的依赖接口确定为异常依赖接口,并基于所述异常依赖接口的目标状态信息,确定所述目标归因接口的示例性实现方式如下,该步骤可以包括:
若所述基础归因接口包括所述待分析接口,则将所述待分析接口添加至所述目标归因接口,即表示目标服务接口运行异常其中也包含由其自身异常所致的运行异常。
将所述异常依赖接口作为新的待分析接口,并返回所述对待分析接口的目标状态信息进行归因处理,获得所述待分析接口对应的基础归因接口的步骤,直至每一所述异常依赖接口均被遍历,以获得所述目标归因接口。
接上文所述示例,通过对待分析接口B的目标状态信息进行分析,确定其对应的基础归因接口为接口C,此时可以将接口C作为新的待分析接口,并确定待分析接口C对应的基础归因接口。其中,确定基础归因接口的方式已在上文详述,在此不再赘述。
示例地,确定出的待分析接口C对应的基础归因接口为接口C和E,此时可以将接口C添加至基础归因接口中,并将接口E作为新的待分析接口,并确定待分析接口E对应的基础归因接口,如确定出的服务接口E对应的基础归因接口为接口G,则接口G作为新的待分析接口,并确定待分析接口G对应的基础归因接口,如确定出的服务接口G对应的基础归因接口为接口G,即表示服务接口G的异常是由于其本身异常所导致的,并将接口G添加至目标归因接口中。由此,通过上述过程,确定出的目标服务接口B运行异常对应的目标归因接口中包含接口G和C。
由上述可知,虽然在服务系统中有服务接口B、C、E、G等4个接口异常,但其实质上是由服务接口C和G运行异常所导致的,服务接口B和E本身并未异常。此时可以只对服务接口C和G进行服务异常排查和恢复。
由此,通过上述技术方案,可以根据各个服务接口之间的依赖关系,确定目标服务接口运行异常的归因接口,以便实现服务系统异常情况下异常的快速且准确地定位,为实现服务系统的安全监测提供支持,同时可以提高服务系统监测的准确性,提升用户使用体验。
作为示例,在确定出目标归因接口后,可以停止调用该目标归因接口,并可以向目标用户发送提示信息,所述提示信息可以用于提示该目标用户所述目标归因接口出现服务异常,以便目标用户可以及时查看并处理该异常,在异常处理之后恢复对该目标归因接口的调用。如目标用户可以是预先指定的服务系统的关联用户,如运维人员等。
在一种可能的实施例中,所述方法还可以包括:
根据每一所述目标归因接口,确定所述目标归因接口对应的异常信息。
其中,在确定出各个目标归因接口之后,则可以直接对各个目标归因接口进行分析,以避免对每一目标服务接口均进行分析所噪声的资源浪费。作为示例,该异常信息可以从目标归因接口上报的状态信息中提取,如可以基于本领域中常用的日志分析方式确定该异常信息,在此不再赘述。如可以针对异常预先进行异常编码,则在出现异常时上报的状态信息中可以包含异常编码,则可以通过状态信息中携带的异常编码以确定异常信息。
根据所述目标归因接口和所述异常信息的标识,从预设的解决方案库中查询解决方案;
如该异常信息的标识可以是异常编码,以用于对该异常信息进行唯一表示。其中,预设的解决方案库中可以由技术人员针对多种异常预先设置其对应的解决方案。
作为示例,可以直接将查询到的解决方案进行输出,以便对运维人员进行提示,以便及时对服务异常进行修复。
作为另一示例,可以根据解决方案的类型进行后续操作,如若查询到的解决方案为执行类型,则执行所述解决方案,若查询到的解决方案为提示类型,则输出所述解决方案。其中,执行类型的方案可以是由服务系统自动执行的方案,其可以无需用户交互参与,以便快速对服务异常进行恢复,保证服务系统的安全运行。提示类型的方案可以是需要用户交互参与的方案,此时可以在确定接口异常的同时为用户提示相应的解决方案,在及时告知异常的同时给出相应的解决方案的提示,提升用户使用体验。
在一种可能的实施例中,所述方法还可以包括:
针对运行异常的所述目标服务接口,生成所述目标服务接口和所述目标服务接口对应的目标归因接口对应的日志记录;
存储每一所述目标服务接口对应的日志记录。
通过该日志记录可以记录目标服务接口和目标归因接口之间的对应关系,从而便于实现服务系统的异常安全溯源,同时可以基于该日志记录进一步确定目标服务接口的归因的准确性,便于对服务系统监测过程进行全面的记录,实现对服务系统的全方位监测,便于后续的日志统一管理和分析。
本公开还提供一种服务系统监测装置,如图3所示,所述装置10包括:
接收模块100,用于接收服务系统中的服务接口的状态信息;
第一确定模块200,用于根据待监测的目标服务接口的状态信息,确定所述目标服务接口是否运行异常;
第二确定模块300,用于若所述目标服务接口运行异常,则确定所述目标服务接口对应的依赖接口,所述依赖接口包含所述目标服务接口对应的直接依赖接口和间接依赖接口;
第三确定模块400,用于根据所述目标服务接口和所述依赖接口中每一接口在目标时段内的目标状态信息,确定所述目标服务接口运行异常对应的目标归因接口。
可选地,所述第三确定模块包括:
第一处理子模块,用于对待分析接口的目标状态信息进行归因处理,获得所述待分析接口对应的基础归因接口,其中,所述待分析接口初始为所述目标服务接口;
第一添加子模块,用于若所述基础归因接口不包括所述待分析接口的任一依赖接口,则将所述待分析接口添加至所述目标归因接口;
第二处理子模块,用于若所述基础归因接口包括所述待分析接口的依赖接口,则将所述基础归因接口中包含的依赖接口确定为异常依赖接口,并基于所述异常依赖接口的目标状态信息,确定所述目标归因接口。
可选地,所述第一处理子模块包括:
识别子模块,用于对所述待分析接口的目标状态信息进行识别,获得所述待分析接口的目标状态信息对应的告警接口;
确定子模块,用于针对每一所述告警接口,若所述告警接口的告警次数与所述目标状态信息对应的告警总次数的比值超过告警阈值,则将所述告警接口确定为所述待分析接口的基础归因接口。
可选地,所述第二处理子模块包括:
第二添加子模块,用于若所述基础归因接口包括所述待分析接口,则将所述待分析接口添加至所述目标归因接口;并将所述异常依赖接口作为新的待分析接口,并触发所述第一处理子模块对待分析接口的目标状态信息进行归因处理,获得所述待分析接口对应的基础归因接口,直至每一所述异常依赖接口均被遍历,以获得所述目标归因接口。
可选地,所述第二确定模块包括:
查询子模块,用于针对所述目标服务接口,根据所述目标服务接口的接口标识,查询所述服务系统对应的服务依赖图,以获得所述依赖接口;
其中,所述服务依赖图通过以下方式确定:
针对每一所述服务接口,获取所述服务接口对应的配置信息;
根据所述配置信息和所述服务接口的代码文件,确定所述服务接口的接口标识和所述服务接口的依赖接口的接口标识;
生成由所述服务接口的接口标识指向所述服务接口的依赖接口的接口标识的边,以获得所述服务依赖图。
可选地,所述装置还包括:
第四确定模块,用于根据每一所述目标归因接口,确定所述目标归因接口对应的异常信息;
查询模块,用于根据所述目标归因接口和所述异常信息的标识,从预设的解决方案库中查询解决方案;
处理模块,用于若查询到的解决方案为执行类型,则执行所述解决方案,若查询到的解决方案为提示类型,则输出所述解决方案。
可选地,所述装置还包括:
生成模块,用于针对运行异常的所述目标服务接口,生成所述目标服务接口和所述目标服务接口对应的目标归因接口对应的日志记录;
存储模块,用于存储每一所述目标服务接口对应的日志记录。
下面参考图4,其示出了适于用来实现本公开实施例的电子设备600的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收服务系统中的服务接口的状态信息;根据待监测的目标服务接口的状态信息,确定所述目标服务接口是否运行异常;若所述目标服务接口运行异常,则确定所述目标服务接口对应的依赖接口,所述依赖接口包含所述目标服务接口对应的直接依赖接口和间接依赖接口;根据所述目标服务接口和所述依赖接口中每一接口在目标时段内的目标状态信息,确定所述目标服务接口运行异常对应的目标归因接口。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模块本身的限定,例如,接收模块还可以被描述为“接收服务系统中的服务接口的状态信息的模块”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,示例1提供了一种服务系统监测方法,其中,所述方法包括:
接收服务系统中的服务接口的状态信息;
根据待监测的目标服务接口的状态信息,确定所述目标服务接口是否运行异常;
若所述目标服务接口运行异常,则确定所述目标服务接口对应的依赖接口,所述依赖接口包含所述目标服务接口对应的直接依赖接口和间接依赖接口;
根据所述目标服务接口和所述依赖接口中每一接口在目标时段内的目标状态信息,确定所述目标服务接口运行异常对应的目标归因接口。
根据本公开的一个或多个实施例,示例2提供了示例1的方法,其中,所述根据所述目标服务接口和所述依赖接口中每一接口在目标时段内的目标状态信息,确定所述目标服务接口运行异常对应的目标归因接口,包括:
对待分析接口的目标状态信息进行归因处理,获得所述待分析接口对应的基础归因接口,其中,所述待分析接口初始为所述目标服务接口;
若所述基础归因接口不包括所述待分析接口的任一依赖接口,则将所述待分析接口添加至所述目标归因接口;
若所述基础归因接口包括所述待分析接口的依赖接口,则将所述基础归因接口中包含的依赖接口确定为异常依赖接口,并基于所述异常依赖接口的目标状态信息,确定所述目标归因接口。
根据本公开的一个或多个实施例,示例3提供了示例2的方法,其中,所述对待分析接口的目标状态信息进行归因处理,获得所述待分析接口对应的基础归因接口,包括:
对所述待分析接口的目标状态信息进行识别,获得所述待分析接口的目标状态信息对应的告警接口;
针对每一所述告警接口,若所述告警接口的告警次数与所述目标状态信息对应的告警总次数的比值超过告警阈值,则将所述告警接口确定为所述待分析接口的基础归因接口。
根据本公开的一个或多个实施例,示例4提供了示例2的方法,其中,所述若所述基础归因接口包括所述待分析接口的依赖接口,则将所述基础归因接口中包含的依赖接口确定为异常依赖接口,并基于所述异常依赖接口的目标状态信息,确定所述目标归因接口,包括:
若所述基础归因接口包括所述待分析接口,则将所述待分析接口添加至所述目标归因接口;
将所述异常依赖接口作为新的待分析接口,并返回所述对待分析接口的目标状态信息进行归因处理,获得所述待分析接口对应的基础归因接口的步骤,直至每一所述异常依赖接口均被遍历,以获得所述目标归因接口。
根据本公开的一个或多个实施例,示例5提供了示例1的方法,其中,所述确定所述目标服务接口对应的依赖接口,包括:
针对所述目标服务接口,根据所述目标服务接口的接口标识,查询所述服务系统对应的服务依赖图,以获得所述依赖接口;
其中,所述服务依赖图通过以下方式确定:
针对每一所述服务接口,获取所述服务接口对应的配置信息;
根据所述配置信息和所述服务接口的代码文件,确定所述服务接口的接口标识和所述服务接口的依赖接口的接口标识;
生成由所述服务接口的接口标识指向所述服务接口的依赖接口的接口标识的边,以获得所述服务依赖图。
根据本公开的一个或多个实施例,示例6提供了示例1的方法,其中,所述方法还包括:
根据每一所述目标归因接口,确定所述目标归因接口对应的异常信息;
根据所述目标归因接口和所述异常信息的标识,从预设的解决方案库中查询解决方案;
若查询到的解决方案为执行类型,则执行所述解决方案,若查询到的解决方案为提示类型,则输出所述解决方案。
根据本公开的一个或多个实施例,示例7提供了示例1的方法,其中,所述方法还包括:
针对运行异常的所述目标服务接口,生成所述目标服务接口和所述目标服务接口对应的目标归因接口对应的日志记录;
存储每一所述目标服务接口对应的日志记录。
根据本公开的一个或多个实施例,示例8提供了一种服务系统监测装置,其中,所述装置包括:
接收模块,用于接收服务系统中的服务接口的状态信息;
第一确定模块,用于根据待监测的目标服务接口的状态信息,确定所述目标服务接口是否运行异常;
第二确定模块,用于若所述目标服务接口运行异常,则确定所述目标服务接口对应的依赖接口,所述依赖接口包含所述目标服务接口对应的直接依赖接口和间接依赖接口;
第三确定模块,用于根据所述目标服务接口和所述依赖接口中每一接口在目标时段内的目标状态信息,确定所述目标服务接口运行异常对应的目标归因接口。
根据本公开的一个或多个实施例,示例9提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现示例1-7中任一项所述方法的步骤。
根据本公开的一个或多个实施例,示例10提供了一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现示例1-7中任一项所述方法的步骤。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

Claims (10)

1.一种服务系统监测方法,其特征在于,所述方法包括:
接收服务系统中的服务接口的状态信息;
根据待监测的目标服务接口的状态信息,确定所述目标服务接口是否运行异常;
若所述目标服务接口运行异常,则确定所述目标服务接口对应的依赖接口,所述依赖接口包含所述目标服务接口对应的直接依赖接口和间接依赖接口;
根据所述目标服务接口和所述依赖接口中每一接口在目标时段内的目标状态信息,确定所述目标服务接口运行异常对应的目标归因接口。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标服务接口和所述依赖接口中每一接口在目标时段内的目标状态信息,确定所述目标服务接口运行异常对应的目标归因接口,包括:
对待分析接口的目标状态信息进行归因处理,获得所述待分析接口对应的基础归因接口,其中,所述待分析接口初始为所述目标服务接口;
若所述基础归因接口不包括所述待分析接口的任一依赖接口,则将所述待分析接口添加至所述目标归因接口;
若所述基础归因接口包括所述待分析接口的依赖接口,则将所述基础归因接口中包含的依赖接口确定为异常依赖接口,并基于所述异常依赖接口的目标状态信息,确定所述目标归因接口。
3.根据权利要求2所述的方法,其特征在于,所述对待分析接口的目标状态信息进行归因处理,获得所述待分析接口对应的基础归因接口,包括:
对所述待分析接口的目标状态信息进行识别,获得所述待分析接口的目标状态信息对应的告警接口;
针对每一所述告警接口,若所述告警接口的告警次数与所述目标状态信息对应的告警总次数的比值超过告警阈值,则将所述告警接口确定为所述待分析接口的基础归因接口。
4.根据权利要求2所述的方法,其特征在于,所述若所述基础归因接口包括所述待分析接口的依赖接口,则将所述基础归因接口中包含的依赖接口确定为异常依赖接口,并基于所述异常依赖接口的目标状态信息,确定所述目标归因接口,包括:
若所述基础归因接口包括所述待分析接口,则将所述待分析接口添加至所述目标归因接口;
将所述异常依赖接口作为新的待分析接口,并返回所述对待分析接口的目标状态信息进行归因处理,获得所述待分析接口对应的基础归因接口的步骤,直至每一所述异常依赖接口均被遍历,以获得所述目标归因接口。
5.根据权利要求1所述的方法,其特征在于,所述确定所述目标服务接口对应的依赖接口,包括:
针对所述目标服务接口,根据所述目标服务接口的接口标识,查询所述服务系统对应的服务依赖图,以获得所述依赖接口;
其中,所述服务依赖图通过以下方式确定:
针对每一所述服务接口,获取所述服务接口对应的配置信息;
根据所述配置信息和所述服务接口的代码文件,确定所述服务接口的接口标识和所述服务接口的依赖接口的接口标识;
生成由所述服务接口的接口标识指向所述服务接口的依赖接口的接口标识的边,以获得所述服务依赖图。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据每一所述目标归因接口,确定所述目标归因接口对应的异常信息;
根据所述目标归因接口和所述异常信息的标识,从预设的解决方案库中查询解决方案;
若查询到的解决方案为执行类型,则执行所述解决方案,若查询到的解决方案为提示类型,则输出所述解决方案。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
针对运行异常的所述目标服务接口,生成所述目标服务接口和所述目标服务接口对应的目标归因接口对应的日志记录;
存储每一所述目标服务接口对应的日志记录。
8.一种服务系统监测装置,其特征在于,所述装置包括:
接收模块,用于接收服务系统中的服务接口的状态信息;
第一确定模块,用于根据待监测的目标服务接口的状态信息,确定所述目标服务接口是否运行异常;
第二确定模块,用于若所述目标服务接口运行异常,则确定所述目标服务接口对应的依赖接口,所述依赖接口包含所述目标服务接口对应的直接依赖接口和间接依赖接口;
第三确定模块,用于根据所述目标服务接口和所述依赖接口中每一接口在目标时段内的目标状态信息,确定所述目标服务接口运行异常对应的目标归因接口。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1-7中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现权利要求1-7中任一项所述方法的步骤。
CN202211539128.6A 2022-12-01 2022-12-01 服务系统监测方法、装置、介质及设备 Pending CN115934461A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211539128.6A CN115934461A (zh) 2022-12-01 2022-12-01 服务系统监测方法、装置、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211539128.6A CN115934461A (zh) 2022-12-01 2022-12-01 服务系统监测方法、装置、介质及设备

Publications (1)

Publication Number Publication Date
CN115934461A true CN115934461A (zh) 2023-04-07

Family

ID=86550006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211539128.6A Pending CN115934461A (zh) 2022-12-01 2022-12-01 服务系统监测方法、装置、介质及设备

Country Status (1)

Country Link
CN (1) CN115934461A (zh)

Similar Documents

Publication Publication Date Title
CN110912738B (zh) 一种业务异常的处理方法、装置、平台及电子设备
US10127092B1 (en) Method and apparatus for monitoring a message transmission frequency in a robot operating system
CN110674009A (zh) 应用服务器性能监测方法、装置、存储介质及电子设备
CN113495820A (zh) 异常信息收集、处理方法和装置以及异常监控系统
CN112948224A (zh) 一种数据处理方法、装置、终端及存储介质
CN112860504A (zh) 监控方法及装置、计算机存储介质、电子设备
CN112882948A (zh) 一种应用的稳定性测试方法、装置、系统及存储介质
CN113760503A (zh) 任务迁移方法、装置、电子设备和计算机可读介质
US20200028733A1 (en) Method and apparatus for processing information
CN117271177A (zh) 基于链路数据的根因定位方法、装置、电子设备及存储介质
CN111198853B (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
CN115622963A (zh) 基于工业交换机的报文检测方法、装置、设备与介质
CN115934461A (zh) 服务系统监测方法、装置、介质及设备
CN117493150A (zh) 代码质量检测方法、装置、设备、存储介质及程序
CN114443480A (zh) 测试方法、系统、可读介质及电子设备
CN113254313A (zh) 一种监控指标异常检测方法、装置、电子设备及存储介质
CN113094268B (zh) 测试方法、装置、设备和介质
CN110633566A (zh) 一种侵入检测方法、装置、终端设备及介质
CN113778800B (zh) 一种报错信息处理方法、装置、系统、设备及存储介质
CN115242606B (zh) 数据处理方法、装置、服务器、存储介质及程序产品
CN118041804B (zh) 通信设备联网数据检测方法、装置、电子设备与可读介质
CN113760590A (zh) 故障处理方法、装置、电子设备和计算机可读介质
EP4369204A1 (en) Graph comparison-based behavior analysis
CN110262756B (zh) 用于缓存数据的方法和装置
CN117014351A (zh) 一种网络检测方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination