CN115499302A - 业务系统的监测方法、装置、可读存储介质及电子设备 - Google Patents

业务系统的监测方法、装置、可读存储介质及电子设备 Download PDF

Info

Publication number
CN115499302A
CN115499302A CN202210987803.5A CN202210987803A CN115499302A CN 115499302 A CN115499302 A CN 115499302A CN 202210987803 A CN202210987803 A CN 202210987803A CN 115499302 A CN115499302 A CN 115499302A
Authority
CN
China
Prior art keywords
determining
fault
time
parameter
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210987803.5A
Other languages
English (en)
Inventor
蒋亮
帅高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202210987803.5A priority Critical patent/CN115499302A/zh
Publication of CN115499302A publication Critical patent/CN115499302A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer And Data Communications (AREA)

Abstract

本公开提供了业务系统的监测方法、装置、可读存储介质及电子设备,该方法包括:获取业务系统中客户感知参数对应的实时运行数据;在所述实时运行数据与获取的标准运行数据间的关系符合预设异常条件的情况下,在所述客户感知参数中确定出异常感知参数;基于所述异常感知参数进行故障定位,确定所述业务系统的故障信息。本公开提供的技术方案可以实现对业务系统的自动化评估,在业务系统存在故障时,快速、准确地确定出业务系统的故障信息,有效提升故障处理效率。

Description

业务系统的监测方法、装置、可读存储介质及电子设备
技术领域
本公开涉及通信技术领域,且更具体地,涉及业务系统的监测方法、装置、可读存储介质及电子设备。
背景技术
通常情况下各运营商都具有自己的业务系统,通过业务系统满足用户办理业务的需求。目前,在业务系统出现问题时,相关人员通过人工电话咨询,口头、即时通讯软件或邮件等对故障信息进行上报,维修人员根据上报的故障信息进行故障维修,此种故障处理方式的处理效率较低。
发明内容
本公开提供了一种业务系统的监测方法、装置、可读存储介质及电子设备,以解决现有技术中故障处理效率较低的技术问题。
根据本公开的第一方面,提供了一种业务系统的监测方法,包括:
获取业务系统中客户感知参数对应的实时运行数据;
在所述实时运行数据与获取的标准运行数据间的关系符合预设异常条件的情况下,在所述客户感知参数中确定出异常感知参数;
基于所述异常感知参数进行故障定位,确定所述业务系统的故障信息。
可选地,所述基于所述异常感知参数进行故障定位,确定所述业务系统的故障信息,包括:
在所述异常感知参数包括预设目标参数的情况下,确定诊断逻辑信息;
基于所述诊断逻辑信息和所述异常感知参数进行故障定位,确定所述业务系统的所述故障信息。
可选地,所述客户感知参数包括加载时间参数、响应时间参数和传输时间参数,所述预设目标参数为所述加载时间参数。
可选地,所述基于所述诊断逻辑信息和所述异常感知参数进行故障定位,确定所述业务系统的所述故障信息,包括:
在所述异常感知参数为所述加载时间参数的情况下,基于所述诊断逻辑信息,确定终端故障;并确定发生所述终端故障的目标终端;基于所述目标终端,确定所述业务系统的所述故障信息;
在所述异常感知参数为所述加载时间参数和所述传输时间参数的情况下,基于所述诊断逻辑信息,确定网络故障;并确定发生所述网络故障的目标网络设备;基于所述目标网络设备,确定所述业务系统的所述故障信息;
在所述异常感知参数为所述加载时间参数和所述响应时间参数的情况下,基于所述诊断逻辑信息,确定服务器故障;并确定发生所述服务器故障的目标服务器;基于所述目标服务器,确定所述业务系统的所述故障信息。
可选地,所述在所述实时运行数据与获取的标准运行数据间的关系符合预设异常条件的情况下,在所述客户感知参数中确定出异常感知参数,包括:
基于所述实时运行数据,确定客户感知健康度的当前值;
基于获取的所述标准运行数据,确定所述客户感知健康度的正常标称值;
在所述当前值与所述正常标称值间的关系符合所述预设异常条件的情况下,在所述客户感知参数中确定出所述异常感知参数。
可选地,所述当前值包括加载当前值,响应当前值和传输当前值;所述基于所述实时运行数据,确定客户感知健康度的当前值,包括:
在所述实时运行数据中,确定出第一预设时长内的页面加载时间、服务器响应时间、网络传输时间和页面访问量;
基于所述页面加载时间和所述页面访问量,确定所述客户感知健康度中的所述加载当前值;
基于所述服务器响应时间和所述页面访问量,确定所述客户感知健康度中的所述响应当前值;
基于所述网络传输时间和所述页面访问量,确定所述客户感知健康度中的所述传输当前值。
可选地,所述正常标称值包括加载正常标称值,响应正常标称值和传输正常标称值;所述基于获取的所述标准运行数据,确定所述客户感知健康度的正常标称值,包括:
在获取的所述标准运行数据中,确定出第二预设时长对应的加载历史值、响应历史值、传输历史值和数据节点值;
基于所述加载历史值和所述数据节点值,确定所述客户感知健康度中的所述加载正常标称值;
基于所述响应历史值和所述数据节点值,确定所述客户感知健康度中的所述响应正常标称值;
基于所述传输历史值和所述数据节点值,确定所述客户感知健康度中的所述传输正常标称值。
根据本公开的第二方面,提供了一种业务系统的监测装置,包括:
数据获取模块,用于获取业务系统中客户感知参数对应的实时运行数据;
异常确定模块,用于在所述实时运行数据与获取的标准运行数据间的关系符合预设异常条件的情况下,在所述客户感知参数中确定出异常感知参数;
故障定位模块,用于基于所述异常感知参数进行故障定位,确定所述业务系统的故障信息。
根据本公开的第三方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述业务系统的监测方法。
根据本公开的第四方面,提供了一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述的业务系统的监测方法。
与现有技术相比,本公开提供的业务系统的监测方法、装置、计算机可读存储介质及电子设备,至少包括以下有益效果:
本公开的技术方案获取业务系统中客户感知参数对应的实时运行数据,将实时运行数据与获取的标准运行数据进行对比,以实现业务系统的自动评估;在实时运行数据与获取的标准运行数据间的关系符合预设异常条件的情况下,表明业务系统出现故障,在客户感知参数中确定出异常感知参数,并根据异常感知参数进行故障定位,以准确地确定出业务系统的故障信息,实现在业务系统出现故障时,及时确定存在故障,并对故障进行定位,准确地确定出相关故障信息,根据该故障信息维修人员可以及时、准确地进行维修,有效地提升业务系统的故障处理效率。
附图说明
为了更清楚地说明本的技术方案,下面将对本公开的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本公开一示例性实施例提供的业务系统的监测方法的应用环境图;
图2是本公开一示例性实施例提供的业务系统的监测方法的流程示意图;
图3是本公开一示例性实施例提供的业务系统的监测装置的结构示意图;
图4是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
下面将结合本中的附图,对本公开中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部实施例。基于本公开中的实施例,本领域普通技术人员在没有创造性劳动前提下所获得的所有其他实施例,都属于本实施例保护的范围。
通常情况下,各运营商都有自己的业务系统,通过业务系统满足用户办理业务的需求,而长期以来,运营商的业务系统缺乏有效的监测和管理方法,当业务系统的营业受理出现问题时,相关故障申报一直停留在人工电话咨询,口头、即时通讯软件如QQ或邮件等传统上报方式,此种上报方式使得故障信息收集依靠人工完成,故障信息受理周期长,信息收集不完整容易缺失。并且上报的故障信息可能会涉及到应用、中间件、数据库、主机、网络以及营业终端等诸多环节,致使直接处理相关故障信息的人员难以准确、快速的定位出相关故障,故障处理效率较低,降低客户体验感。
请参阅图1,其所示为根据一示例性实施例示出的一种业务系统的监测方法的应用环境示意图,该应用环境可以包括至少一个营业终端11、核心交换机12、CRM服务器13、旁路监听系统14和监测系统15。
营业终端11为直接办理客户受理业务的终端,是营业受理客户感知监测的发起点,该营业终端11可以为全省地市分公司营业终端。具体地,分公司营业员根据客户要求操作营业终端11,通过客户关系管理(Customer Relationship Management,CRM)系统的终端页面提交业务订购web(网络)请求,web请求数据通过省市连接的企业内部数据通信网络提交至省集中CRM系统(对应图1中核心交换机12)。CRM系统接收到分公司营业终端11提交的业务订购web请求后,通过应用服务器(CRM服务器13中的一种)查询并操作数据库服务器(CRM服务器13中的一种)完成业务交易订购。其中从分公司营业终端11、分公司到省公司数据通信网络、省集中CRM系统主机、应用服务器、数据库服务器以及存储等诸多节点均会出现故障,影响用户感知,因此对上述各个环节利用旁路监听系统14进行数据的实时监测,并将监测到的实时运行数据传输至监测系统15。
图2是本公开一示例性实施例提供的业务系统的监测方法的流程示意图,该方法的执行主体可以为图1中的监测系统15,至少包括如下步骤:
步骤21,获取业务系统中客户感知参数对应的实时运行数据。
其中,业务系统用于办理客户业务,主要用于客户受理业务,业务系统会涉及到营业终端、数据通信网络、系统主机、服务器等各个环节。客户感知参数为预先指定的用于反映营业受理客户感知情况的参数,用户可以根据实际场景进行客户感知参数的设定。实时运行数据为实时对客户感知参数进行监控获取到的数据,该数据具有实时性,随着时间的推移,不断获取到新的实时运行数据,在先的实时运行数据成为历史运行数据。
在一实施例中,所述客户感知参数包括加载时间参数、响应时间参数和传输时间参数。其中,加载时间参数用于反映终端页面的加载时间,具体为CRM前台页面平均加载时间(AvgPLT);响应时间参数用于反映服务器的响应时间,具体为CRM应用服务器平均响应时间(AvgPST);传输时间参数用于反映终端页面请求的网络传输时间,具体为CRM前台页面请求平均网络传输时间(AvgPET)。也就是说,获取业务系统中客户参数对应的实时运行数据,包括,获取业务系统中加载时间参数、响应时间参数和传输时间参数分别对应的实时运行数据。
步骤22,在所述实时运行数据与获取的标准运行数据间的关系符合预设异常条件的情况下,在所述客户感知参数中确定出异常感知参数。
其中,标准运行数据为用于提供正常参考值的数据。预设异常条件为预先设定的用于表示业务系统存在异常的条件,其中预设异常条件可以为实时运行数据与标准运行数据的标准差大于设定值,如5%;当然预设异常条件还可以为实时运行数据连续多次(如3次)与标准运行数据的标准差大于设定值,用户可以根据实际应用场景进行预设异常条件的设置,对此本实施例不作具体限定。
具体地,将实时运行数据与标准运行数据进行对比,确定实时运行数据与标准运行数据的标准差,若确定出标准差符合预设异常条件,证明业务系统存在异常,在客户感知参数中确定出异常感知参数。异常感知参数为运行数据中呈现数据异常的参数,利用该异常感知参数进行故障定位,以保证准确地确定出故障原因和故障位置,为有效提升故障处理效率提供条件。
在一种可能的实现方式中,客户感知参数包括加载时间参数、响应时间参数和传输时间参数,异常感知参数可以为加载时间参数、响应时间参数和传输时间参数中的任意一个或至少两个的组合,即异常感知参数的数量可以为一个、两个或三个。对各个客户感知参数对应的实时运行数据分别与标准运行数据进行判断,若符合预设异常条件,则该客户感知参数为异常感知参数,若不符合预设异常条件,则该客户感知参数为正常感知参数。如加载时间参数对应的实时运行数据与标准运行数据间的关系符合预设异常条件的情况下,则加载时间参数为异常感知参数。响应时间参数对应的实时运行数据与标准运行数据间的关系符合预设异常条件的情况下,则响应时间参数为异常感知参数。传输时间参数对应的实时运行数据与标准运行数据间的关系符合预设异常条件的情况下,则传输时间参数为异常感知参数。
在一实施例中,所述步骤22包括:
步骤221,基于所述实时运行数据,确定客户感知健康度的当前值。
其中,客户感知健康度用于反映客户感知的状态和用户体验感。因为实时运行数据为实时采集到最新数据,因此根据实时运行数据,确定出的客户感知健康度的当前值可以反映客户感知的最新状态。
在对业务系统的设备进行单独监控时,可以体现单台设备的设备状态,如该设备运行正常或该设备运行异常,但对于客户感知而言,单独监控的设备数据往往难以直接体现客户感知情况,如对营业终端进行监控,营业终端运行正常,但是可能会因为其他多方面的原因导致客户感知出现延迟,如服务器出现异常,因此结合多维度、多参数数据关联进行自动化诊断分析可有效提升营业受理感知异常定位效率和准确率。从而在一实施例中,所述当前值包括加载当前值,响应当前值和传输当前值;所述步骤221,包括:
步骤2211,在所述实时运行数据中,确定出第一预设时长内的页面加载时间、服务器响应时间、网络传输时间和页面访问量。
其中,第一预设时长为预先设定的时间长度,如5分钟。页面加载时间为业务系统前台页面在第一预设时长内的加载总时间;服务器响应时间为业务系统应用服务器的响应总时间;网络传输时间为业务系统前台页面请求网络传输总时间。
步骤2212,基于所述页面加载时间和所述页面访问量,确定所述客户感知健康度中的所述加载当前值。
具体地,将页面加载时间与页面访问量的第一计算结果,确定为客户感知健康度中的加载当前值。例如,将页面加载时间除以页面访问量确定为第一计算结果。
步骤2213,基于所述服务器响应时间和所述页面访问量,确定所述客户感知健康度中的所述响应当前值。
具体地,将服务器响应时间与页面访问量的第二计算结果,确定为客户感知健康度中的响应当前值。例如,将服务器响应时间除以页面访问量确定为第二计算结果。
步骤2214,基于所述网络传输时间和所述页面访问量,确定所述客户感知健康度中的所述传输当前值。
具体地,将网络传输时间与页面访问量的第三计算结果,确定为客户感知健康度中的传输当前值。具体地,将网络传输时间除以页面访问量确定为第三计算结果。
举例来说,第一预设时长为5分钟,加载当前值即CRM前台页面平均加载时间(AvgPLT)指标=5分钟内营业终端前台页面加载总时间÷5分钟内页面总访问量;其中:5分钟内营业终端前台页面加载总时间取对应每台营业终端5分钟内每次访问CRM前台页面加载时间的累加值;5分钟内页面总访问量取对应每台营业终端页面访问点击量的累加值。
响应当前值即CRM应用服务器平均响应时间(AvgPST)指标=5分钟内CRM应用服务器响应总时间÷5分钟内页面总访问量。其中:5分钟内CRM应用服务器响应总时间取对应每台营业终端5分钟内每次访问CRM系统应用服务器响应时间的累加值;5分钟内页面总访问量取对应每台营业终端页面访问点击量的累加值。
传输当前值即CRM前台页面请求平均网络传输时间(AvgPET)指标=5分钟内CRM前台页面请求网络传输总时间÷5分钟内页面总访问量。其中:5分钟内CRM前台页面请求网络传输总时间取对应每台营业终端5分钟内每次访问CRM前台页面请求网络传输时间的累加值;5分钟内页面总访问量取对应每台营业终端页面访问点击量的累加值。
在本实施例中,通过对业务系统的加载、响应、传输等多个维度和多参数进行综合考虑,为对业务系统进行准确地自动化评估提供了前提条件。
步骤222,基于获取的所述标准运行数据,确定所述客户感知健康度的正常标称值。
具体地,将历史运行数据作为标准运行数据,根据该历史运行数据确定客户感知健康度的正常标称值。业务系统中的业务复杂多变,业务更新快、数据量巨多,因此通过与当前时刻相邻的历史运行数据,可以准确地确定出客户感知健康度的正常标称值。
在一实施例中,所述正常标称值包括加载正常标称值,响应正常标称值和传输正常标称值;所述步骤222,包括:
步骤2221,在获取的所述标准运行数据中,确定出第二预设时长对应的加载历史值、响应历史值、传输历史值和数据节点值。
其中,第二预设时长为预先选取的时间长度,例如可以为30天,2个月或3个月,用户可以根据实际场景确定第二预设时长的时间长度。确定第二预设时长内每一个加载历史值、响应历史值和传输历史值。在进行实时数据采集时,最新时刻的数据为当前值,随着时间的不断推移,不断出现新的当前值,在先的当前值即成为了历史值。数据节点值为第二预设时长对应的历史值个数。
步骤2222,基于所述加载历史值和所述数据节点值,确定所述客户感知健康度中的所述加载正常标称值。
具体地,确定各个加载历史值之和,然后确定各个加载历史值之和与数据节点值的第四计算结果,将该第四计算结果,确定为客户感知健康度中的加载正常标称值。例如,将各个加载历史值之和除以数据节点值确定为第四计算结果。
步骤2223,基于所述响应历史值和所述数据节点值,确定所述客户感知健康度中的所述响应正常标称值。
具体地,确定各个响应历史值之和,然后确定各个响应历史值之和与数据节点值的第五计算结果,将该第五计算结果,确定为客户感知健康度中的响应正常标称值。例如,将各个响应历史值之和除以数据节点值确定为第四计算结果。
步骤2224,基于所述传输历史值和所述数据节点值,确定所述客户感知健康度中的所述传输正常标称值。
具体地,确定各个传输历史值之和,然后确定各个传输历史值之和与数据节点值的第六计算结果,将该第六计算结果,确定为客户感知健康度中的传输正常标称值。例如,将各个传输历史值之和除以数据节点值确定为第四计算结果。
举例来说,第二预设时长为过去30天,根据过去30天的历史参数数据剔除噪声后每天计算,得到每类参数的月度基准标称值(NV),作为衡量营业受理感知健康度的基准数据,具体计算方法如下:
加载正常标称值即CRM前台页面平均加载时间指标标称值(AvgPLT_NV)=月度CRM前台页面平均加载时间(AvgPLT)指标总和÷月度数据节点数。
响应正常标称值即CRM应用服务器平均响应时间标称值(AvgPST_NV)=月度CRM应用服务器平均响应时间(AvgPST)指标总和÷月度数据节点数。
传输正常标称值即CRM前台页面请求平均网络传输时间标称值(AvgPET_NV)=月度CRM前台页面请求平均网络传输时间(AvgPET)指标总和÷月度数据节点数。
在本实施例中,通过确定多个参数的正常标称值为对业务系统进行多个维度的自动化评估提供了前提条件,有利于故障处理准确性的提升。
步骤223,在所述当前值与所述正常标称值间的关系符合所述预设异常条件的情况下,在所述客户感知参数中确定出异常感知参数。
具体地,确定当前值与正常标称值间的标准差,此时预设异常条件可以为当前值与正常标称值间的标准差大于设定标准差阈值,或连续多次当前值与正常标称值间的标准差大于设定标准差阈值。例如,在当前值与正常标称值间的标准差(SDEV)大于5%以上时,表明该客户感知参数的标准差(SDEV)已偏离正常,当该标准差(SDEV)连续3次偏离正常时,则判定对应客户感知健康状态(ST)异常,将异常的客户感知参数确定为异常感知参数。
举例来说,加载当前值与加载正常标称值的标准差即CRM前台页面平均加载时间指标标准差(AvgPLT_SDEV)={CRM前台页面平均加载时间(AvgPLT)指标实时节点数据-CRM前台页面平均加载时间指标标称值(AvgPLT_NV)}÷CRM前台页面平均加载时间指标标称值(AvgPLT_NV)。当CRM前台页面平均加载时间指标的标准差(AvgPLT_SDEV)连续3次>5%以上时表示异常,AvgPLT_ST=0,此时加载时间参数为异常感知参数;否则正常,AvgPLT_ST=1,此时加载时间参数为正常感知参数。
响应当前值与响应正常标称值的标准差即CRM应用服务器平均响应时间指标标准差(AvgPST_SDEV)={CRM应用服务器平均响应时间(AvgPST)指标实时节点数据-CRM应用服务器平均响应时间指标标称值(AvgPST_NV)}÷CRM应用服务器平均响应时间指标标称值(AvgPST_NV)。当CRM应用服务器平均响应时间指标的标准差(AvgPST_SDEV)连续3次>5%以上时表示异常,AvgPST_ST=0,此时响应时间参数为异常感知参数;否则正常,AvgPST_ST=1,此时响应时间参数为正常感知参数。
传输当前值与传输正常标称值的标准差即CRM前台页面请求平均网络传输时间指标标准差(AvgPET_SDEV)={CRM前台页面请求平均网络传输时间(AvgPET)指标实时节点数据-CRM前台页面请求平均网络传输时间指标标称值(AvgPET_NV)}÷CRM前台页面请求平均网络传输时间指标标称值(AvgPET_NV)。当CRM前台页面请求平均网络传输时间指标的标准差(AvgPET_SDEV)连续3次>5%以上时表示异常,AvgPET_ST=0,此时传输时间参数为异常感知参数;否则正常,AvgPET_ST=1,此时传输时间参数为正常感知参数。
在本实施例中,根据实时运行数据,确定客户感知健康度的当前值,根据标准运行数据,确定正常标称值,通过将当前值和正常标称值进行对比,实现对业务系统的自动评估,此时无需人工参与,避免人为因素的介入,提高异常感知参数确定的准确性。
步骤23,基于所述异常感知参数进行故障定位,确定所述业务系统的故障信息。
具体地,故障信息包括故障原因信息、故障位置信息等。通过异常感知参数对业务系统的故障进行准确地定位,确定出准确的故障信息,后续维修人员根据该故障信息高效地进行故障处理,提高故障处理效率。
在一实施例中,所述步骤23,包括:
步骤231,在所述异常感知参数包括预设目标参数的情况下,确定诊断逻辑信息。
步骤232,基于所述诊断逻辑信息和所述异常感知参数进行故障定位,确定所述业务系统的故障信息。
其中,预设目标参数为在客户感知参数中指定出的参数,该参数对客户感知影响较大。在异常感知参数包括预设目标参数的情况下,触发诊断逻辑信息进行故障定位,诊断逻辑信息为预先设定的用于进行故障诊断的规则,以确定出业务系统的故障信息。在异常感知参数不包括预设目标参数的情况下,不触发诊断逻辑信息进行故障定位。从而准确地诊断出对客户感知影响较大的故障。
具体地,客户在营业前台进行业务办理时,对于CRM系统的业务办理速度最为敏感,选取CRM前台页面平均加载时间指标状态(AvgPLT_ST)作为营业受理感知健康度是否异常的诊断触发条件,也就是将加载时间参数确定为预设目标参数,即:当AvgPLT_ST=0时,CRM营业受理页面加载速度缓慢,客户感知差,需诊断异常原因。当AvgPLT_ST=1时,营业受理客户感知无故障,不触发诊断。
在一实施例中,所述步骤232,包括:
步骤2321,在所述异常感知参数为所述加载时间参数的情况下,基于所述诊断逻辑信息,确定终端故障;并确定发生所述终端故障的目标终端;基于所述目标终端,确定所述业务系统的所述故障信息。
具体地,在加载时间参数为异常感知参数,响应时间参数和传输时间参数为正常感知参数的情况下,根据诊断逻辑信息,可以确定为终端故障,为了便于维修人员进行快速维修,进一步确定发生终端故障的目标终端;并基于目标终端,确定所述业务系统的故障信息,其中故障信息可以包括故障类型:终端故障;故障位置:目标终端的位置信息。
例如,当AvgPLT_ST=0且AvgPST_ST=1且AvgPET_ST=1时,则判定营业受理终端自身性能存在问题,记录CRM营业受理终端异常CHL=0,否则CHL=1。当CHL=0时,结合营业员账号信息直接定位至具体营业终端,确定出目标终端。
步骤2322,在所述异常感知参数为所述加载时间参数和所述传输时间参数的情况下,基于所述诊断逻辑信息,确定网络故障;并确定发生所述网络故障的目标网络设备;基于所述目标网络设备,确定所述业务系统的所述故障信息。
具体地,在加载时间参数和传输时间参数为异常感知参数,响应时间参数为正常感知参数的情况下,根据诊断逻辑信息,可以确定出网络故障,为了便于维修人员进行快速维修,进一步确定发生网络故障的目标网络设备;并基于目标网络设备,确定所述业务系统的故障信息,其中故障信息可以包括故障类型:网络故障;故障位置:目标网络设备的位置信息。
例如,当AvgPLT_ST=0且AvgPST_ST=1且AvgPET_ST=0时,则判断营业受理访问CRM系统的网络存在问题,记录CRM所处网络异常CHE=0,否则CHE=1。当CHE=0时,结合网络设备性能、告警数据(对设备进行监控时获取到的数据)定位至具体故障网络设备。
步骤2323,在所述异常感知参数为所述加载时间参数和所述响应时间参数的情况下,基于所述诊断逻辑信息,确定服务器故障;并确定发生服务器故障的目标服务器;基于所述目标服务器,确定所述业务系统的故障信息。
具体地,在加载时间参数和响应时间参数为异常感知参数,传输时间参数为正常感知参数的情况下,根据诊断逻辑信息,可以确定出服务器故障,为了便于维修人员进行快速维修,进一步确定发生服务器故障的目标服务器;并基于目标服务器,确定所述业务系统的故障信息,其中故障信息可以包括故障类型:网络故障;服务器故障:目标服务器的位置信息。
例如,当AvgPLT_ST=0且AvgPST_ST=0且AvgPET_ST=1时,则判断CRM系统应用服务器存在问题,记录CRM应用系统异常CHS=0,否则CHS=1。当CHS=0时,结合省集中CRM系统设备性能、告警数据定位至具体主机、应用服务器、数据库服务器或存储节点。
在本实施例中,根据确定出的不同异常感知参数,根据诊断逻辑信息,进行不同的故障定位,保证故障定位的准确性,有利于维修人员的高效维修。
在上述实施例中,获取业务系统中客户感知参数对应的实时运行数据,将实时运行数据与获取的标准运行数据进行对比,以实现业务系统的自动评估;在实时运行数据与获取的标准运行数据间的关系符合预设异常条件的情况下,表明业务系统出现故障,在客户感知参数中确定出异常感知参数,并根据异常感知参数进行故障定位,以准确地确定出业务系统的故障信息,实现在业务系统出现故障时,通过进行自动化诊断分析,及时确定存在故障,并对故障进行定位,准确地确定出相关故障信息,根据该故障信息维修人员可以及时、准确地进行维修,有效地提升业务系统的故障处理效率。并且业务系统的监测过程中无人工干预:在技术上采用纯自动化参数数据提取以及故障判断,实现了“零”人工干预。同时本实施例提供的方法可以采用多线程流式计算:可根据参数项数、数据量和计算节点服务器资源大小自动创建计算线程数,最大化利用计算节点性能,实时流式计算分析,节省扫描用时,提高计算效率。
示例性装置
基于与本公开方法实施例相同的构思,本公开实施例还提供了一种业务系统的监测装置。
图3示出了本公开一示例性实施例提供的业务系统的监测装置的结构示意图,包括:
数据获取模块31,用于获取业务系统中客户感知参数对应的实时运行数据;
异常确定模块32,用于在所述实时运行数据与获取的标准运行数据间的关系符合预设异常条件的情况下,在所述客户感知参数中确定出异常感知参数;
故障定位模块33,用于基于所述异常感知参数进行故障定位,确定所述业务系统的故障信息。
在本公开一示例性实施例中,所述故障定位模块33,包括:
逻辑触发单元,用于在所述异常感知参数包括预设目标参数的情况下,确定诊断逻辑信息;
故障定位单元,用于基于所述诊断逻辑信息和所述异常感知参数进行故障定位,确定所述业务系统的所述故障信息。
在本公开一示例性实施例中,所述客户感知参数包括加载时间参数、响应时间参数和传输时间参数,所述预设目标参数为所述加载时间参数。
在本公开一示例性实施例中,所述故障定位单元,包括:
第一确定子单元,用于在所述异常感知参数为所述加载时间参数的情况下,基于所述诊断逻辑信息,确定终端故障;并确定发生所述终端故障的目标终端;基于所述目标终端,确定所述业务系统的所述故障信息;
第二确定子单元,用于在所述异常感知参数为所述加载时间参数和所述传输时间参数的情况下,基于所述诊断逻辑信息,确定网络故障;并确定发生所述网络故障的目标网络设备;基于所述目标网络设备,确定所述业务系统的所述故障信息;
第三确定子单元,用于在所述异常感知参数为所述加载时间参数和所述响应时间参数的情况下,基于所述诊断逻辑信息,确定服务器故障;并确定发生所述服务器故障的目标服务器;基于所述目标服务器,确定所述业务系统的所述故障信息。
在本公开一示例性实施例中,所述异常确定模块32,包括:
当前值确定单元,用于基于所述实时运行数据,确定客户感知健康度的当前值;
标称值确定单元,用于基于获取的所述标准运行数据,确定所述客户感知健康度的正常标称值;
异常确定单元,用于在所述当前值与所述正常标称值间的关系符合所述预设异常条件的情况下,在所述客户感知参数中确定出所述异常感知参数。
在本公开一示例性实施例中,所述当前值包括加载当前值,响应当前值和传输当前值;所述当前值确定单元,包括:
数据确定子单元,用于在所述实时运行数据中,确定出第一预设时长内的页面加载时间、服务器响应时间、网络传输时间和页面访问量;
第四确定子单元,用于基于所述页面加载时间和所述页面访问量,确定所述客户感知健康度中的所述加载当前值;
第五确定子单元,用于基于所述服务器响应时间和所述页面访问量,确定所述客户感知健康度中的所述响应当前值;
第六确定子单元,用于基于所述网络传输时间和所述页面访问量,确定所述客户感知健康度中的所述传输当前值。
在本公开一示例性实施例中,所述正常标称值包括加载正常标称值,响应正常标称值和传输正常标称值;所述标称值确定单元,包括:
第七确定子单元,用于在获取的所述标准运行数据中,确定出第二预设时长对应的加载历史值、响应历史值、传输历史值和数据节点值;
第八确定子单元,用于基于所述加载历史值和所述数据节点值,确定所述客户感知健康度中的所述加载正常标称值;
第九确定子单元,用于基于所述响应历史值和所述数据节点值,确定所述客户感知健康度中的所述响应正常标称值;
第十确定子单元,用于基于所述传输历史值和所述数据节点值,确定所述客户感知健康度中的所述传输正常标称值。
示例性电子设备
图4图示了根据本公开实施例的电子设备的框图。
如图4所示,电子设备40包括一个或多个处理器41和存储器42。
处理器41可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备40中的其他组件以执行期望的功能。
存储器42可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器41可以运行所述程序指令,以实现上文所述的本公开的各个实施例的业务系统的监测方法以及/或者其他期望的功能。
在一个示例中,电子设备40还可以包括:输入装置43和输出装置44,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
当然,为了简化,图4中仅示出了该电子设备40中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备40还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的业务系统的监测方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的业务系统的监测方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述发明的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所发明的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此发明的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此发明的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种业务系统的监测方法,其特征在于,包括:
获取业务系统中客户感知参数对应的实时运行数据;
在所述实时运行数据与获取的标准运行数据间的关系符合预设异常条件的情况下,在所述客户感知参数中确定出异常感知参数;
基于所述异常感知参数进行故障定位,确定所述业务系统的故障信息。
2.根据权利要求1所述的方法,其特征在于,所述基于所述异常感知参数进行故障定位,确定所述业务系统的故障信息,包括:
在所述异常感知参数包括预设目标参数的情况下,确定诊断逻辑信息;
基于所述诊断逻辑信息和所述异常感知参数进行故障定位,确定所述业务系统的所述故障信息。
3.根据权利要求2所述的方法,其特征在于,所述客户感知参数包括加载时间参数、响应时间参数和传输时间参数,所述预设目标参数为所述加载时间参数。
4.根据权利要求3所述的方法,其特征在于,所述基于所述诊断逻辑信息和所述异常感知参数进行故障定位,确定所述业务系统的所述故障信息,包括:
在所述异常感知参数为所述加载时间参数的情况下,基于所述诊断逻辑信息,确定终端故障;并确定发生所述终端故障的目标终端;基于所述目标终端,确定所述业务系统的所述故障信息;
在所述异常感知参数为所述加载时间参数和所述传输时间参数的情况下,基于所述诊断逻辑信息,确定网络故障;并确定发生所述网络故障的目标网络设备;基于所述目标网络设备,确定所述业务系统的所述故障信息;
在所述异常感知参数为所述加载时间参数和所述响应时间参数的情况下,基于所述诊断逻辑信息,确定服务器故障;并确定发生所述服务器故障的目标服务器;基于所述目标服务器,确定所述业务系统的所述故障信息。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述在所述实时运行数据与获取的标准运行数据间的关系符合预设异常条件的情况下,在所述客户感知参数中确定出异常感知参数,包括:
基于所述实时运行数据,确定客户感知健康度的当前值;
基于获取的所述标准运行数据,确定所述客户感知健康度的正常标称值;
在所述当前值与所述正常标称值间的关系符合所述预设异常条件的情况下,在所述客户感知参数中确定出所述异常感知参数。
6.根据权利要求5所述的方法,其特征在于,所述当前值包括加载当前值,响应当前值和传输当前值;所述基于所述实时运行数据,确定客户感知健康度的当前值,包括:
在所述实时运行数据中,确定出第一预设时长内的页面加载时间、服务器响应时间、网络传输时间和页面访问量;
基于所述页面加载时间和所述页面访问量,确定所述客户感知健康度中的所述加载当前值;
基于所述服务器响应时间和所述页面访问量,确定所述客户感知健康度中的所述响应当前值;
基于所述网络传输时间和所述页面访问量,确定所述客户感知健康度中的所述传输当前值。
7.根据权利要求6所述的方法,其特征在于,所述正常标称值包括加载正常标称值,响应正常标称值和传输正常标称值;所述基于获取的所述标准运行数据,确定所述客户感知健康度的正常标称值,包括:
在获取的所述标准运行数据中,确定出第二预设时长对应的加载历史值、响应历史值、传输历史值和数据节点值;
基于所述加载历史值和所述数据节点值,确定所述客户感知健康度中的所述加载正常标称值;
基于所述响应历史值和所述数据节点值,确定所述客户感知健康度中的所述响应正常标称值;
基于所述传输历史值和所述数据节点值,确定所述客户感知健康度中的所述传输正常标称值。
8.一种业务系统的监测装置,其特征在于,包括:
数据获取模块,用于获取业务系统中客户感知参数对应的实时运行数据;
异常确定模块,用于在所述实时运行数据与获取的标准运行数据间的关系符合预设异常条件的情况下,在所述客户感知参数中确定出异常感知参数;
故障定位模块,用于基于所述异常感知参数进行故障定位,确定所述业务系统的故障信息。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-7任一项所述的业务系统的监测方法。
10.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-7任一项所述的业务系统的监测方法。
CN202210987803.5A 2022-08-17 2022-08-17 业务系统的监测方法、装置、可读存储介质及电子设备 Pending CN115499302A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210987803.5A CN115499302A (zh) 2022-08-17 2022-08-17 业务系统的监测方法、装置、可读存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210987803.5A CN115499302A (zh) 2022-08-17 2022-08-17 业务系统的监测方法、装置、可读存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN115499302A true CN115499302A (zh) 2022-12-20

Family

ID=84466053

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210987803.5A Pending CN115499302A (zh) 2022-08-17 2022-08-17 业务系统的监测方法、装置、可读存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN115499302A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115878439A (zh) * 2023-01-06 2023-03-31 北京仁科互动网络技术有限公司 系统性能瓶颈定位方法、装置、电子设备及存储介质
CN117033044A (zh) * 2023-07-28 2023-11-10 深圳荣灿大数据技术有限公司 可视化访问系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109308252A (zh) * 2017-07-27 2019-02-05 中国移动通信集团浙江有限公司 一种故障定位处理方法及装置
CN109586975A (zh) * 2018-12-25 2019-04-05 中国联合网络通信集团有限公司 业务质量异常的感知方法及系统
WO2021017364A1 (zh) * 2019-07-26 2021-02-04 京信通信系统(中国)有限公司 一种网络故障诊断方法、装置、网络设备及存储介质
CN113918376A (zh) * 2021-12-14 2022-01-11 湖南天云软件技术有限公司 故障检测方法、装置、设备及计算机可读存储介质
CN114244691A (zh) * 2020-09-09 2022-03-25 中国移动通信有限公司研究院 视频业务的故障定位方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109308252A (zh) * 2017-07-27 2019-02-05 中国移动通信集团浙江有限公司 一种故障定位处理方法及装置
CN109586975A (zh) * 2018-12-25 2019-04-05 中国联合网络通信集团有限公司 业务质量异常的感知方法及系统
WO2021017364A1 (zh) * 2019-07-26 2021-02-04 京信通信系统(中国)有限公司 一种网络故障诊断方法、装置、网络设备及存储介质
CN114244691A (zh) * 2020-09-09 2022-03-25 中国移动通信有限公司研究院 视频业务的故障定位方法、装置及电子设备
CN113918376A (zh) * 2021-12-14 2022-01-11 湖南天云软件技术有限公司 故障检测方法、装置、设备及计算机可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115878439A (zh) * 2023-01-06 2023-03-31 北京仁科互动网络技术有限公司 系统性能瓶颈定位方法、装置、电子设备及存储介质
CN117033044A (zh) * 2023-07-28 2023-11-10 深圳荣灿大数据技术有限公司 可视化访问系统及方法
CN117033044B (zh) * 2023-07-28 2024-05-28 深圳荣灿大数据技术有限公司 可视化访问系统及方法

Similar Documents

Publication Publication Date Title
CN112162878B (zh) 数据库故障发现方法、装置、电子设备及存储介质
CN115499302A (zh) 业务系统的监测方法、装置、可读存储介质及电子设备
US9817742B2 (en) Detecting hardware and software problems in remote systems
CN109960635B (zh) 实时计算平台的监控和报警方法、系统、设备及存储介质
JP2010526352A (ja) 統計的な分析を利用した性能障害管理システム及びその方法
CN105404581A (zh) 一种数据库的评测方法和装置
CN110765189A (zh) 互联网产品的异常管理方法和系统
CN112699007A (zh) 监控机器性能的方法、系统、网络设备及存储介质
CN113992602B (zh) 一种电缆监测数据上传方法、装置、设备以及存储介质
CN109639755B (zh) 关联系统服务器解耦方法、装置、介质及电子设备
CN112256548B (zh) 异常数据的监听方法、装置、服务器及存储介质
CN110727563A (zh) 预设客户的云服务报警方法及装置
JP2015194797A (ja) 監視漏れ特定処理プログラム,監視漏れ特定処理方法及び監視漏れ特定処理装置
CN110011845B (zh) 日志采集方法及系统
CN113760634A (zh) 一种数据处理方法和装置
CN116414608A (zh) 异常检测方法、装置、设备及存储介质
CN114265324B (zh) 设备运行状态的监测方法、装置及终端设备
JP2020035297A (ja) 機器状態監視装置及びプログラム
CN115643200A (zh) 一种异常检测方法、装置、电子设备及介质
CN114371980A (zh) 调用链路性能监控方法、装置、计算机设备及存储介质
CN113934595A (zh) 数据分析方法及系统、存储介质及电子终端
CN111639249A (zh) 用户反馈报错的自动监测方法、装置和设备
CN115372752A (zh) 故障检测方法、装置、电子设备以及存储介质
CN101894119B (zh) 用于监控的海量数据的储存
CN114338688B (zh) 一种数据管理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination