CN106161135A - 业务交易故障分析方法及装置 - Google Patents
业务交易故障分析方法及装置 Download PDFInfo
- Publication number
- CN106161135A CN106161135A CN201510196856.5A CN201510196856A CN106161135A CN 106161135 A CN106161135 A CN 106161135A CN 201510196856 A CN201510196856 A CN 201510196856A CN 106161135 A CN106161135 A CN 106161135A
- Authority
- CN
- China
- Prior art keywords
- failure point
- alarm
- solution
- matching degree
- current failure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种业务交易故障分析方法,包括:采集历史交易日志进行多维度数据分析,形成元数据模型;获取历史故障点的解决方案,形成经验库;根据所述元数据模型,对当前交易日志进行业务交易故障定位,确定当前故障点;在所述经验库中选择与所述当前故障点对应的解决方案;根据匹配策略确定是否采用所述解决方案。本发明实施例还公开了一种业务交易故障分析装置。
Description
技术领域
本发明涉及电信运营商业务支撑系统管理领域,尤其涉及一种业务交易故障分析方法及装置。
背景技术
随着移动通信公司业务的不断发展,随着客户量的不断增加,业务交易支撑网已从一个概念逐步发展成一个真正的实体网络,呈现越来越明显的网络化特征。所谓网络化特征不仅仅是业务交易支撑网发展的趋势,也预示着业务交易系统会随之凸显复杂性。
传统的业务交易故障分析方法为:登陆业务交易关联的主机,核查相关交易日志;在业务交易支撑网运营管理系统中,查询相关联的主机告警信息,在业务交易支撑网运营管理系统中,查询相关业务应用告警信息;综合以上信息,根据维护人员的经验汇总问题给相关开发人员;开发人员根据维护人员反馈的问题对业务交易故障进行最后的定位分析,并根据分析的结果进行处理。
但是,从上述处理过程可以看出,通过传统的业务交易故障分析方法对业务交易故障处理的效率不高,降低了用户感知度。
发明内容
有鉴于此,本发明实施例期望提供一种业务交易故障分析方法及装置,能提高业务交易故障处理的效率,增强用户感知度。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供一种业务交易故障分析方法,所述方法包括:
采集历史交易日志进行多维度数据分析,形成元数据模型;获取历史故障点的解决方案,形成经验库;
根据所述元数据模型,对当前交易日志进行业务交易故障定位,确定当前故障点;
在所述经验库中选择与所述当前故障点对应的解决方案;
根据匹配策略确定是否采用所述解决方案。
上述方案中,所述根据所述匹配策略确定是否采用所述解决方案包括:
根据预先设置的匹配策略计算得到所述解决方案的匹配度,所述匹配度与预设匹配度阈值进行对比,若所述匹配度大于等于所述预设匹配度阈值,则采用所述解决方案;若所述匹配度小于所述预设匹配度阈值,则不采用所述解决方案。
上述方案中,所述故障点包括信息名、信息值及信息个数;所述信息名包括指标名和/或告警名;所述信息值包括指标值和/或告警值;所述信息个数包括指标个数和/或告警个数;
在所述经验库中选择与所述当前故障点对应的解决方案,包括:根据所述当前故障点中的信息名,在所述经验库中筛选出与所述当前故障点中的信息名相同、且满足预设选择阈值的解决方案。
上述方案中,所述解决方案的匹配度为:
G=P×50%+E×50%;
其中,G为解决方案的匹配度;P为所述信息个数的匹配度,E为所述信息值的平均接近度;
所述信息值的平均接近度为:
E=(J1+J2+J3+......+Jn)/n;
其中,J1,J2,J3,......,Jn为所述信息值的接近度;
信息个数的匹配度为:
P=(A/B)×100%;
其中,P为信息个数的匹配度;B为所述当前故障点的信息个数;A为在所述经验库中与所述当前故障点对应的历史故障点的信息个数。
在上述方案中,所述指标值的接近度为:
J=(1-|(C-D)/C|)×100%;
其中,D为所述当前故障点的一个指标值,C为在所述经验库中与所述当前故障点的一个指标值对应的历史故障点的一个指标值。
上述方案中,所述告警值的接近度为:第一告警值的接近度,或第二告警值的接近度,或第三告警值的接近度;
所述第一告警值的接近度为:所述当前故障点为一般告警,在所述经验库中与所述当前故障点对应的历史故障点为严重告警;或,所述当前故障点为严重告警,在所述经验库中与当前故障点对应的历史故障点为一般告警;
所述第二告警值的接近度为:所述当前故障点为一般告警,在所述经验库中与所述当前故障点对应的历史故障点为重要告警;或,所述当前故障点为重要告警,在所述经验库中与所述当前故障点对应的历史故障点为一般告警或者严重告警;或,所述当前故障点为严重告警,在所述经验库中与所述当前故障点对应的历史故障点为重要告警;
所述第三告警值的接近度为:所述当前故障点和在所述经验库中与所述当前故障点对应的历史故障点都为一般告警;或,所述当前故障点和在所述经验库中与所述当前故障点对应的历史故障点都为重要告警;或,所述当前故障点和在所述经验库中与所述当前故障点对应的历史故障点都为严重告警。
上述方案中,所述匹配策略为:
指标的匹配策略,或告警的匹配策略,或指标与告警组合的匹配策略;
所述指标的匹配策略包括:根据所述指标值与所述指标个数得到指标解决方案的匹配度;
所述告警的匹配策略包括:根据所述告警值与所述告警个数得到告警解决方案的匹配度;
所述指标与告警组合的匹配策略包括:根据所述指标解决方案的匹配度与所述告警解决方案的匹配度得到指标与告警组合解决方案的匹配度。
本发明还提供一种业务交易故障分析装置,所述装置包括:
采集单元,用于采集历史交易日志进行多维度数据分析,形成元数据模型;获取历史故障点的解决方案,形成经验库;
定位单元,用于根据所述元数据模型,对当前交易日志进行业务交易故障定位,确定当前故障点;
选择单元,用于在所述经验库中选择与所述当前故障点对应的解决方案;
确定单元,根据匹配策略确定是否采用所述解决方案。
上述方案中,所述确定单元,还用于根据预先设置的匹配策略计算得到所述解决方案的匹配度,所述匹配度与预设匹配度阈值进行对比,若所述匹配度大于等于所述预设匹配度阈值,则采用所述解决方案;若所述匹配度小于所述预设匹配度阈值,则不采用所述解决方案。
上述方案中,所述故障点包括信息名、信息值及信息个数;所述信息名包括指标名和/或告警名;所述信息值包括指标值和/或告警值;所述信息个数包括指标个数和/或告警个数;
所述选择单元,还用于根据所述当前故障点中的信息名,在所述经验库中筛选出与所述当前故障点中的信息名相同、且满足预设选择阈值的解决方案。
本发明实施例提供的业务交易故障分析方法及装置,先统一交易日志的格式;再根据统一格式后的历史交易日志的数据进行多维度的数据分析,形成元数据模型;获取历史故障点的解决方案,形成经验库;接着,将统一格式后的当前交易日志数据依托元数据模型进行数据溯源挖掘分析,便可以发现当前交易日志的故障源,实现当前故障点的定位。
进一步的,根据当前故障点中的信息名,在经验库中筛选出与当前故障点中的信息名相同、且满足预设选择阈值的解决方案;之后,根据匹配策略计算得到解决方案的匹配度,先将该匹配度与预设匹配度阈值进行对比,若该匹配度大于等于预设匹配度阈值,则采用该解决方案;若该匹配度小于预设匹配度阈值,则不采用该解决方案;再根据确定采用的解决方案的匹配度最终计算得到解决方案的采用度。如此,可实现统一交易日志的规范,根据标准化的元数据模型能够快速对当前业务交易故障进行故障点的定位;并且,根据匹配策略在经验库中智能分析出当前故障点的解决方案,无需现有技术中复杂、繁琐的故障处理过程,不仅提高了工作效率,节省了运营维护成本,而且还增强了用户感知度。
附图说明
图1为本发明业务交易故障分析方法实施例一的流程图;
图2为本发明业务交易故障分析方法实施例二的流程图;
图3为本发明业务交易故障分析方法实施例二的多维度数据分析结构图;
图4为本发明业务交易故障分析方法实施例二的元数据模型示例图;
图5为本发明业务交易故障分析装置实施例的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
图1为本发明业务交易故障分析方法实施例一的流程图,如图1所示,该方法包括:
步骤101、采集历史交易日志进行多维度数据分析,形成元数据模型;获取历史故障点的解决方案,形成经验库;
这里,业务交易故障分析装置采集历史交易日志进行多维度数据分析后形成统一、标准化的元数据模型;与此同时,业务交易故障分析装置通过元数据模型进行历史故障点的定位,并获取历史故障点对应的解决方案,进行解决方案沉淀,形成解决方案的经验库。
步骤102、根据所述元数据模型,对当前交易日志进行业务交易故障定位,确定当前故障点。
具体的,业务交易故障分析装置根据标准化的元数据模型,对当前的交易日志进行数据溯源挖掘分析,便可以发现当前交易日志中的故障源,实现故障点的定位。
步骤103、在所述经验库中选择与所述当前故障点对应的解决方案。
本实施例中,预先创建好的经验库中包括各种故障点及其对应的解决方案,本步骤中,业务交易故障分析装置在创建好的经验库中选择与当前故障点相同的故障点对应的解决方案。
步骤104、根据匹配策略确定是否采用所述解决方案。
业务交易故障分析装置根据预先设置好的匹配策略来决定采用哪些解决方案,哪些解决方案不采用。
本实施例的业务交易故障分析方法实现了根据标准化的元数据模型能够快速对当前业务交易故障进行故障点的定位;并且,根据匹配策略在经验库中智能分析出当前故障点的解决方案,无需现有技术中复杂、繁琐的故障处理过程,不仅提高了工作效率,节省了运营维护成本,而且还增强了用户感知度。
为了更加体现出本发明的目的,在上述实施例的基础上,进一步的举例说明。图2为本发明业务交易故障分析方法实施例二的流程图,如图2所示,该方法包括:
步骤201、统一交易日志的格式。
业务交易故障分析装置对业务运营支撑(Business Operation SupportSystem,简称:BOSS)、客户关系管理(Customer Relationship Management,
简称:CRM)系统的交易进行统一格式的交易日志采集,其交易日志格式说明如下:
1)、交易开始记录,每笔交易开始生成对应开始记录,具体如表1所示。
表1
2)、交易结束记录,每笔交易结束生成对应结束记录,具体如表2所示。
表2
3)、交易请求发送记录(请求端应用,向应答端应用进行请求发送,并将记录请求发送记录)、交易自服务发起记录(请求端和接收端都是同一个应用,并记录自服务发起记录),具体如表3所示。
表3
4)交易应答接收记录(请求端应用接收应答端应用处理返回的信息,并记录应答接收记录)、交易自服务完成记录(接收断和请求端都是同一个应用,并记录交易自服务完成记录),具体如表4所示。
表4
5)、交易请求接收记录:应答端应用接收请求端应用发送的信息,并记录交易请求接收记录,具体如表5所示。
表5
6)、交易应答发送记录:应答端应用对接收端应用进行应答发送,并记录应答发送记录,具体如表6所示。
表6
步骤202、采集历史交易日志进行多维度数据分析,形成元数据模型;获取历史故障点的解决方案,形成经验库。
业务交易故障分析装置依据统一格式后的历史交易日志的数据进行多维度数据分析。图3为本发明业务交易故障分析方法实施例二的多维度数据分析结构图,如图3所示,多维度数据分析包括了:健康度分析、均衡度分析、地市分析、受理渠道分析、业务功能分析、用户行为分析、应用分析、终端分析。
所述健康度分析为:对客户业务开通受理的情况进行健康度的分析,可形成周期性的质量报告。
所述均衡度分析为:从业务量、业务故障情况分析某一时段业务的分布情况。
所述地市分析为:以地市为中心,通过各种性能指标建立忙闲地市列表和前10排名,并关联业务。
所述受理渠道分析为:以受理渠道(交易发起源)为中心,通过各种性能指标建立受理渠道列表和前10业务排名。
所述业务功能分析为:通过业务功能(请求环节、请求代码)进行分析,通过各种性能指标建立以业务为中心的用户列表和前10排名。
所述用户行为分析为:以用户(手机号)为中心,分析单个用户某一时间段办理业务过程的行为分析。
所述应用分析为:重点从进程利用率、应用版本变更情况分析不同业务类型资源的分布占比。
所述终端分析为:分析主机和数据库的资源情况,可按终端类型业务量建立前10列表。
从交易情况分析:交易开始记录报文的功能标识,记录的是此交易对应的业务名称。每一笔交易都有交易开始记录和交易结束记录,从交易开始记录的时间减去交易结束记录的时间得出交易的时长,从交易结束记录中的处理结果可获得此交易的故障情况。从而选定一定的时间范围进行统计,可获得汇总数据的交易量、平均交易时长、故障率情况,并从交易的报文中提取均衡度、健康度、用户行为、地市、受理渠道、业务功能的维度数据分析。
从环节情况分析:每一笔交易是由多个处理环节组成。其中,环节报文分为以下两种情况:
A)、当请求端应用和应答端应用不是同一个应用程序时,环节报文便有交易请求发送记录、交易请求接收记录、交易应答发送记录、交易应答接收记录四个报文记录,从而环节处理时长等于交易应答接收记录时间减去交易请求发送记录时间,从交易应答接收记录中的处理结果可获得此环节的故障情况。
B)、当请求端应用和应答端应用是同一个应用程序时,环节报文便有交易自服务发起记录、交易自服务完成记录,从而环节处理时长等于交易自服务完成记录时间减去交易自服务发起记录时间,从交易自服务完成记录中的处理结果可获得此环节的故障情况。
依据以上两种情况从而选定一定的时间范围进行统计,可获得汇总数据的处理量、平均处理时长、环节故障率情况,并从对应报文中提取应用、终端的维度数据分析。
业务交易故障分析装置根据上述多维度数据分析后得到的数据建立元数据模型。图4为本发明业务交易故障分析方法实施例二的元数据模型示例图,如图4所示,其中,元数据模型包括了:应用性能、应用版本、主机、数据库、业务状况、健康度等相关信息。图4中仅以应用性能、应用版本、主机、数据库、业务状况、健康度的信息来举例说明。
与此同时,业务交易故障分析装置通过元数据模型进行历史故障点的定位,并获取历史故障点对应的解决方案,进行解决方案沉淀,形成解决方案的经验库。
步骤203、根据所述元数据模型,对当前交易日志进行业务交易故障定位,确定当前故障点;
业务交易故障分析装置将统一格式后的当前交易日志数据依托步骤204中所建立的元数据模型进行数据溯源挖掘分析,便可以发现当前交易日志的故障源,实现当前故障点的定位。其中,故障点包括了信息名、信息值及信息个数;所述信息名包括了指标名和/或告警名;所述信息值包括了指标值和/或告警值;所述信息个数包括了指标个数和/或告警个数;
步骤204、在所述经验库中选择与所述当前故障点对应的解决方案。
本实施例中,预先创建好的经验库中包括各种故障点及其对应的解决方案,本步骤中,业务交易故障分析装置根据所述当前故障点中的信息名,在所述经验库中筛选出与所述当前故障点中的信息名相同、且满足预设选择阈值的解决方案。例如,当前故障点中有10个信息名,预设选择阈值为4。在经验库中与当前故障点相同的解决方案有3个,即第一方案、第二方案、第三方案,其中第一方案中有5个信息名与当前故障点中的信息名相同,第二方案中有4个信息名与当前故障点中的信息名相同,第三方案中有3个信息名与当前故障点中的信息名相同。按照预设选择阈值4将第一方案与第二方案筛选出来,第三方案不采用。这里需要说明的是,在本发明中,预设选择阈值可以根据实际需要进行设置,在此不加以限定。
步骤205、根据匹配策略确定是否采用所述解决方案。
业务交易故障分析装置根据预先设置的匹配策略计算得到所述解决方案的匹配度,所述匹配度与预设匹配度阈值进行对比,若所述匹配度大于等于所述预设匹配度阈值,则采用所述解决方案;若所述匹配度小于所述预设匹配度阈值,则不采用所述解决方案。之后,再根据确定采用的所述解决方案的匹配度最终计算得到所述解决方案的采用度。这里需要说明的,在本发明中所述预设匹配度阈值可以根据实际需求进行设置,在此不加以限定。
其中,所述匹配策略为:指标的匹配策略,或,告警的匹配策略,或,指标与告警组合的匹配策略;
所述指标的匹配策略包括:根据所述指标值与所述指标个数得到指标解决方案的匹配度。之后,再根据所述指标解决方案的匹配度得到指标解决方案的采用度;
所述告警的匹配策略包括:根据所述告警值与所述告警个数得到告警解决方案的匹配度。之后,再根据所述告警解决方案的匹配度得到告警解决方案的采用度;
所述指标与告警组合的匹配策略包括:根据所述指标解决方案的匹配度与所述告警解决方案的匹配度得到指标与告警组合解决方案的匹配度。之后,再根据所述指标与告警组合解决方案的匹配度得到指标与告警组合解决方案的采用度。
所述解决方案的匹配度为:
G=P×50%+E×50%;
其中,G为解决方案的匹配度;P为所述信息个数的匹配度,E为所述信息值的平均接近度;
所述信息值的平均接近度为:
E=(J1+J2+J3+......+Jn)/n;
其中,J1,J2,J3,......,Jn为所述信息值的接近度;
信息个数的匹配度为:
P=(A/B)×100%;
其中,P为信息个数的匹配度;B为所述当前故障点的信息个数;A为在所述经验库中与所述当前故障点对应的历史故障点的信息个数。
因为信息值包括了指标值和/或告警值,所以这里具体对指标值的接近度和告警值的接近度进行说明。
所述指标值的接近度为:
J=(1-|(C-D)/C|)×100%;
其中,D为所述当前故障点的一个指标值,C为在所述经验库中与所述当前故障点的一个指标值对应的历史故障点的一个指标值。
所述告警值的接近度为:
第一告警值的接近度,或第二告警值的接近度,或第三告警值的接近度;这里将故障点的告警等级系统按照一般告警、重要告警、严重告警,这三大告警级别划分,具体的,
所述第一告警值为的接近度:所述当前故障点为一般告警,在所述经验库中与所述当前故障点对应的历史故障点为严重告警;或,所述当前故障点为严重告警,在所述经验库中与当前故障点对应的历史故障点为一般告警;
所述第二告警值为的接近度:所述当前故障点为一般告警,在所述经验库中与所述当前故障点对应的历史故障点为重要告警;或,所述当前故障点为重要告警,在所述经验库中与所述当前故障点对应的历史故障点为一般告警或者严重告警;或,所述当前故障点为严重告警,在所述经验库中与所述当前故障点对应的历史故障点为重要告警;
所述第三告警值为的接近度:所述当前故障点和在所述经验库中与所述当前故障点对应的历史故障点都为一般告警;或,所述当前故障点和在所述经验库中与所述当前故障点对应的历史故障点都为重要告警;或,所述当前故障点和在所述经验库中与所述当前故障点对应的历史故障点都为严重告警。
例如,第一告警值为25%,第二告警值为50%,第三告警值为100%。这里需要说明的是,在本发明中,第一告警值、第二告警值、第三告警值可以根据实际需求进行设置,再次不加以限制。
所述指标解决方案或告警解决方案的采用度为:
F=(G1/(G1+G2+G3+......+Gn))×100%;
其中,F为所述指标解决方案或所述告警解决方案的采用度;G1,G2,G3,......,Gn为所述指标解决方案或所述告警解决方案的匹配度;
因为指标与告警组合解决方案的采用度是由指标解决方案的匹配度与告警解决方案的匹配度得到的,所以这里对指标与告警组合解决方案的采用度进行具体的说明。
所述指标与告警组合解决方案的采用度为:
M=(H1/(H1+H2))×100%;
其中,M为所述指标与告警组合解决方案的采用度,H1,H2为所述指标与告警组合解决方案的匹配度;
H=K×α+L×β;
其中,H为所述指标与告警组合解决方案的匹配度;K为所述指标解决方案的匹配度;L为所述告警解决方案的匹配度;α为所述指标解决方案的匹配度的权值,β为所述告警解决方案的匹配度的权值,α+β=1。
根据上述的采用度,打开解决方案,依据解决方案的内容描述,进行故障处理,直至故障解决。如果经验库中的解决方案无法解决时,可自行新增解决方案,记录故障处理的过程步骤,并提交经验库审批,以实现在经验库中解决方案的沉淀。
以下,针对利用指标的匹配策略、利用告警的匹配策略及利用指标与告警组合的匹配策略来计算得到各自解决方案的采用度进行示例说明。
指标的匹配策略:
例如,当前故障点关联有10个指标,其中和经验库中的第一方案能对应到5个指标,和经验库中的第二方案能对应到4个指标。第一方案的指标个数的匹配度为(5/10)×100%=50%;第二方案的指标个数的匹配度为(4/10)×100%=40%;第一方案中5个指标根据指标值的接近度公式计算,得出的指标值的接近度分别为90%、80%、70%、30%、92%;第二方案中4个指标根据指标值的接近度公式计算,得出的指标值的接近度分别为20%、99%、70%、65%;根据解决方案的匹配度公式,可得第一方案对应的匹配度为50%×50%+((90%+80%+70%+30%+92%)/5)×50%=61.2%;可得第二方案对应的匹配度为40%×50%+((20%+99%+70%+65%)/4)×50%=51.75%;设置的预设匹配度阈值为50%。因为第一方案与第二方案这两个方案的匹配度都大于预设匹配度阀值,所以第一方案与第二方案都采用。最终,根据解决方案的采用度的计算公式可得第一方案的采用度为(61.2%/(61.2%+51.75%))×100%=54.2%;第二方案的采用度为(51.75%/(61.2%+51.75%))×100%=45.8%。
告警的匹配策略:
例如,当前故障点关联有10个告警,其中和经验库中的第一方案能对应到5个告警,和经验库中的第二方案能对应到4个告警。第一方案的告警个数的匹配度为(5/10)×100%=50%;第二方案的告警个数的匹配度为(4/10)×100%=40%;第一方案中5个告警值的接近度分别为100%、100%、50%、25%、100%;第二方案中4个告警值的接近度分别为25%、100%、100%、100%;根据解决方案的匹配度公式,可得第一方案对应的匹配度为50%×50%+((100%+100%+50%+25%+100%)/5)×50%=62.5%;可得第二方案对应的匹配度为40%×50%+((25%+100%+100%+100%)/4)×50%=60.6%;设置的预设匹配度阈值为50%。第一方案与第二方案这两个方案的匹配度都大于预设匹配度阀值,所以第一方案与第二方案都采用。最终,根据解决方案的采用度的计算公式可得第一方案的采用度为(62.5%/(62.5%+60.6%))×100%=51%;第二方案的采用度为(60.6%/(62.5%+60.6%))×100%=49%。
指标与告警组合的匹配策略:
以指标的匹配策略的示例和告警的匹配策略的示例中的数据内容为例。第一方案的指标解决方案的匹配度为61.2%、第二方案的指标解决方案的匹配度为51.75%,第一方案的告警解决方案的匹配度为62.5%、第二方案的告警解决方案的匹配度为60.6%。设置指标解决方案的匹配度的权值为50%,设置告警解决方案的匹配度的权值为50%。
按照指标与告警组合解决方案的匹配度公式,可计算得第一方案的指标与告警组合解决方案的匹配度为61.2%×50%+62.5%×50%=61.9%;第二方案的指标与告警组合解决方案的匹配度为51.75%×50%+60.6%×50%=56.2%。再根据指标与告警组合解决方案的采用度公式,计算可得第一方案的指标与告警组合解决方案的采用度为(61.9%/(61.9%+56.2%))×100%=52.4%;第二方案的指标与告警组合解决方案的采用度为(56.2%/(61.9%+56.2%))×100%=47.6%。
本实施例的业务交易故障分析方法实现了统一交易日志的规范,根据标准化的元数据模型能够快速对当前业务交易故障进行故障点的定位,并根据匹配策略在经验库中智能分析出当前故障点的解决方案,无需现有技术中复杂、繁琐的故障处理过程,不仅提高了工作效率,节省了运营维护成本,而且还增强了用户感知度。
图5为本发明业务交易故障分析装置实施例的结构图,如图5所示,该装置包括:采集单元501,用于采集历史交易日志进行多维度数据分析,形成元数据模型;获取历史故障点的解决方案,形成经验库;
定位单元502,用于根据所述元数据模型,对当前交易日志进行业务交易故障定位,确定当前故障点;
选择单元503,用于在所述经验库中选择与所述当前故障点对应的解决方案;
确定单元504,根据匹配策略确定是否采用所述解决方案。
进一步的,该装置还包括:统一单元505,用于统一交易日志的格式。
进一步的,所述确定单元504,还用于根据预先设置的匹配策略计算得到所述解决方案的匹配度,所述匹配度与预设匹配度阈值进行对比,若所述匹配度大于等于所述预设匹配度阈值,则采用所述解决方案;若所述匹配度小于所述预设匹配度阈值,则不采用所述解决方案。
进一步的,所述故障点包括信息名、信息值及信息个数;所述信息名包括指标名和/或告警名;所述信息值包括指标值和/或告警值;所述信息个数包括指标个数和/或告警个数;
所述选择单元503,还用于根据所述当前故障点中的信息名,在所述经验库中筛选出与所述当前故障点中的信息名相同、且满足预设选择阈值的解决方案。
进一步的,所述解决方案的匹配度为:
G=P×50%+E×50%;
其中,G为解决方案的匹配度;P为所述信息个数的匹配度,E为所述信息值的平均接近度;
所述信息值的平均接近度为:
E=(J1+J2+J3+......+Jn)/n;
其中,J1,J2,J3,......,Jn为所述信息值的接近度;
信息个数的匹配度为:
P=(A/B)×100%;
其中,P为信息个数的匹配度;B为所述当前故障点的信息个数;A为在所述经验库中与所述当前故障点对应的历史故障点的信息个数;
所述指标值的接近度为:
J=(1-|(C-D)/C|)×100%;
其中,D为所述当前故障点的一个指标值,C为在所述经验库中与所述当前故障点的一个指标值对应的历史故障点的一个指标值;
所述告警值的接近度为:第一告警值的接近度,或第二告警值的接近度,或第三告警值的接近度;
所述第一告警值的接近度为:所述当前故障点为一般告警,在所述经验库中与所述当前故障点对应的历史故障点为严重告警;或,所述当前故障点为严重告警,在所述经验库中与当前故障点对应的历史故障点为一般告警;
所述第二告警值的接近度为:所述当前故障点为一般告警,在所述经验库中与所述当前故障点对应的历史故障点为重要告警;或,所述当前故障点为重要告警,在所述经验库中与所述当前故障点对应的历史故障点为一般告警或者严重告警;或,所述当前故障点为严重告警,在所述经验库中与所述当前故障点对应的历史故障点为重要告警;
所述第三告警值的接近度为:所述当前故障点和在所述经验库中与所述当前故障点对应的历史故障点都为一般告警;或,所述当前故障点和在所述经验库中与所述当前故障点对应的历史故障点都为重要告警;或,所述当前故障点和在所述经验库中与所述当前故障点对应的历史故障点都为严重告警。
进一步的,所述匹配策略为:
指标的匹配策略,或告警的匹配策略,或指标与告警组合的匹配策略;
所述指标的匹配策略包括:根据所述指标值与所述指标个数得到指标解决方案的匹配度;
所述告警的匹配策略包括:根据所述告警值与所述告警个数得到告警解决方案的匹配度;
所述指标与告警组合的匹配策略包括:根据所述指标解决方案的匹配度与所述告警解决方案的匹配度得到指标与告警组合解决方案的匹配度。
本实施例提供的业务交易故障分析装置,实现了统一交易日志的规范,根据标准化的元数据模型能够快速对当前业务交易故障进行故障点的定位,并根据匹配策略在经验库中智能分析出当前故障点的解决方案,无需现有技术中复杂、繁琐的故障处理过程,不仅提高了工作效率,节省了运营维护成本,而且还增强了用户感知度。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (10)
1.一种业务交易故障分析方法,其特征在于,所述方法包括:
采集历史交易日志进行多维度数据分析,形成元数据模型;获取历史故障点的解决方案,形成经验库;
根据所述元数据模型,对当前交易日志进行业务交易故障定位,确定当前故障点;
在所述经验库中选择与所述当前故障点对应的解决方案;
根据匹配策略确定是否采用所述解决方案。
2.根据权利要求1所述的方法,其特征在于,所述根据所述匹配策略确定是否采用所述解决方案包括:
根据预先设置的匹配策略计算得到所述解决方案的匹配度,所述匹配度与预设匹配度阈值进行对比,若所述匹配度大于等于所述预设匹配度阈值,则采用所述解决方案;若所述匹配度小于所述预设匹配度阈值,则不采用所述解决方案。
3.根据权利要求2所述的方法,其特征在于,所述故障点包括信息名、信息值及信息个数;所述信息名包括指标名和/或告警名;所述信息值包括指标值和/或告警值;所述信息个数包括指标个数和/或告警个数;
在所述经验库中选择与所述当前故障点对应的解决方案,包括:根据所述当前故障点中的信息名,在所述经验库中筛选出与所述当前故障点中的信息名相同、且满足预设选择阈值的解决方案。
4.根据权利要求3所述的方法,其特征在于,所述解决方案的匹配度为:
G=P×50%+E×50%;
其中,G为解决方案的匹配度;P为所述信息个数的匹配度,E为所述信息值的平均接近度;
所述信息值的平均接近度为:
E=(J1+J2+J3+......+Jn)/n;
其中,J1,J2,J3,......,Jn为所述信息值的接近度;
信息个数的匹配度为:
P=(A/B)×100%;
其中,P为信息个数的匹配度;B为所述当前故障点的信息个数;A为在所述经验库中与所述当前故障点对应的历史故障点的信息个数。
5.根据权利要求4所述的方法,其特征在于,所述指标值的接近度为:
J=(1-|(C-D)/C|)×100%;
其中,D为所述当前故障点的一个指标值,C为在所述经验库中与所述当前故障点的一个指标值对应的历史故障点的一个指标值。
6.根据权利要求5所述的方法,其特征在于,所述告警值的接近度为:第一告警值的接近度,或第二告警值的接近度,或第三告警值的接近度;
所述第一告警值的接近度为:所述当前故障点为一般告警,在所述经验库中与所述当前故障点对应的历史故障点为严重告警;或,所述当前故障点为严重告警,在所述经验库中与当前故障点对应的历史故障点为一般告警;
所述第二告警值的接近度为:所述当前故障点为一般告警,在所述经验库中与所述当前故障点对应的历史故障点为重要告警;或,所述当前故障点为重要告警,在所述经验库中与所述当前故障点对应的历史故障点为一般告警或者严重告警;或,所述当前故障点为严重告警,在所述经验库中与所述当前故障点对应的历史故障点为重要告警;
所述第三告警值的接近度为:所述当前故障点和在所述经验库中与所述当前故障点对应的历史故障点都为一般告警;或,所述当前故障点和在所述经验库中与所述当前故障点对应的历史故障点都为重要告警;或,所述当前故障点和在所述经验库中与所述当前故障点对应的历史故障点都为严重告警。
7.根据权利要求6所述的方法,其特征在于,所述匹配策略为:
指标的匹配策略,或告警的匹配策略,或指标与告警组合的匹配策略;
所述指标的匹配策略包括:根据所述指标值与所述指标个数得到指标解决方案的匹配度;
所述告警的匹配策略包括:根据所述告警值与所述告警个数得到告警解决方案的匹配度;
所述指标与告警组合的匹配策略包括:根据所述指标解决方案的匹配度与所述告警解决方案的匹配度得到指标与告警组合解决方案的匹配度。
8.一种业务交易故障分析装置,其特征在于,所述装置包括:
采集单元,用于采集历史交易日志进行多维度数据分析,形成元数据模型;获取历史故障点的解决方案,形成经验库;
定位单元,用于根据所述元数据模型,对当前交易日志进行业务交易故障定位,确定当前故障点;
选择单元,用于在所述经验库中选择与所述当前故障点对应的解决方案;
确定单元,根据匹配策略确定是否采用所述解决方案。
9.根据权利要求8所述的装置,其特征在于,所述确定单元,还用于根据预先设置的匹配策略计算得到所述解决方案的匹配度,所述匹配度与预设匹配度阈值进行对比,若所述匹配度大于等于所述预设匹配度阈值,则采用所述解决方案;若所述匹配度小于所述预设匹配度阈值,则不采用所述解决方案。
10.根据权利要求9所述的装置,其特征在于,所述故障点包括信息名、信息值及信息个数;所述信息名包括指标名和/或告警名;所述信息值包括指标值和/或告警值;所述信息个数包括指标个数和/或告警个数;
所述选择单元,还用于根据所述当前故障点中的信息名,在所述经验库中筛选出与所述当前故障点中的信息名相同、且满足预设选择阈值的解决方案。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510196856.5A CN106161135B (zh) | 2015-04-23 | 2015-04-23 | 业务交易故障分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510196856.5A CN106161135B (zh) | 2015-04-23 | 2015-04-23 | 业务交易故障分析方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106161135A true CN106161135A (zh) | 2016-11-23 |
CN106161135B CN106161135B (zh) | 2019-10-18 |
Family
ID=57346543
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510196856.5A Active CN106161135B (zh) | 2015-04-23 | 2015-04-23 | 业务交易故障分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106161135B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107484189A (zh) * | 2017-07-27 | 2017-12-15 | 北京市天元网络技术股份有限公司 | Lte数据处理系统 |
CN107480703A (zh) * | 2017-07-21 | 2017-12-15 | 阿里巴巴集团控股有限公司 | 交易故障检测方法及装置 |
CN108712284A (zh) * | 2018-05-18 | 2018-10-26 | 阿里巴巴集团控股有限公司 | 一种故障业务的定位方法、装置、及业务服务器 |
CN110677480A (zh) * | 2019-09-29 | 2020-01-10 | 北京浪潮数据技术有限公司 | 一种节点健康管理方法、装置和计算机可读存储介质 |
CN111934910A (zh) * | 2020-07-14 | 2020-11-13 | 中国联合网络通信集团有限公司 | 故障处理方法、设备及存储介质 |
CN112596996A (zh) * | 2020-12-28 | 2021-04-02 | 中国农业银行股份有限公司 | 一种业务监控方法及装置 |
CN113904912A (zh) * | 2021-12-08 | 2022-01-07 | 广州鲁邦通智能科技有限公司 | 一种实现云管理平台实现业务高可用的方法及装置 |
CN116112351A (zh) * | 2023-01-06 | 2023-05-12 | 吉林大学 | 一种有缆、无缆结合的节点诊断方法、系统及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101201786A (zh) * | 2006-12-13 | 2008-06-18 | 中兴通讯股份有限公司 | 一种故障日志监控方法及装置 |
CN101854277A (zh) * | 2010-06-12 | 2010-10-06 | 河北全通通信有限公司 | 一种移动通信经营分析系统的监控方法 |
CN102196478A (zh) * | 2010-03-01 | 2011-09-21 | 中兴通讯股份有限公司 | 一种网管系统故障的诊断方法和系统 |
CN104125085A (zh) * | 2013-04-27 | 2014-10-29 | 中国移动通信集团黑龙江有限公司 | 一种基于esb的数据管控方法及装置 |
-
2015
- 2015-04-23 CN CN201510196856.5A patent/CN106161135B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101201786A (zh) * | 2006-12-13 | 2008-06-18 | 中兴通讯股份有限公司 | 一种故障日志监控方法及装置 |
CN102196478A (zh) * | 2010-03-01 | 2011-09-21 | 中兴通讯股份有限公司 | 一种网管系统故障的诊断方法和系统 |
CN101854277A (zh) * | 2010-06-12 | 2010-10-06 | 河北全通通信有限公司 | 一种移动通信经营分析系统的监控方法 |
CN104125085A (zh) * | 2013-04-27 | 2014-10-29 | 中国移动通信集团黑龙江有限公司 | 一种基于esb的数据管控方法及装置 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480703A (zh) * | 2017-07-21 | 2017-12-15 | 阿里巴巴集团控股有限公司 | 交易故障检测方法及装置 |
CN107484189A (zh) * | 2017-07-27 | 2017-12-15 | 北京市天元网络技术股份有限公司 | Lte数据处理系统 |
CN107484189B (zh) * | 2017-07-27 | 2020-10-16 | 北京市天元网络技术股份有限公司 | Lte数据处理系统 |
CN108712284B (zh) * | 2018-05-18 | 2020-11-24 | 创新先进技术有限公司 | 一种故障业务的定位方法、装置、及业务服务器 |
CN108712284A (zh) * | 2018-05-18 | 2018-10-26 | 阿里巴巴集团控股有限公司 | 一种故障业务的定位方法、装置、及业务服务器 |
CN110677480A (zh) * | 2019-09-29 | 2020-01-10 | 北京浪潮数据技术有限公司 | 一种节点健康管理方法、装置和计算机可读存储介质 |
CN110677480B (zh) * | 2019-09-29 | 2022-04-22 | 北京浪潮数据技术有限公司 | 一种节点健康管理方法、装置和计算机可读存储介质 |
CN111934910A (zh) * | 2020-07-14 | 2020-11-13 | 中国联合网络通信集团有限公司 | 故障处理方法、设备及存储介质 |
CN111934910B (zh) * | 2020-07-14 | 2023-03-24 | 中国联合网络通信集团有限公司 | 故障处理方法、设备及存储介质 |
CN112596996A (zh) * | 2020-12-28 | 2021-04-02 | 中国农业银行股份有限公司 | 一种业务监控方法及装置 |
CN113904912A (zh) * | 2021-12-08 | 2022-01-07 | 广州鲁邦通智能科技有限公司 | 一种实现云管理平台实现业务高可用的方法及装置 |
CN113904912B (zh) * | 2021-12-08 | 2022-04-08 | 广州鲁邦通智能科技有限公司 | 一种实现云管理平台实现业务高可用的方法及装置 |
CN116112351A (zh) * | 2023-01-06 | 2023-05-12 | 吉林大学 | 一种有缆、无缆结合的节点诊断方法、系统及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN106161135B (zh) | 2019-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106161135A (zh) | 业务交易故障分析方法及装置 | |
US8156172B2 (en) | Monitoring and reporting enterprise data using a message-based data exchange | |
CN105243252B (zh) | 一种账户风险评估的方法及装置 | |
CN110245035A (zh) | 一种链路跟踪方法及装置 | |
CN112116438A (zh) | 一种多渠道支付集成方法、平台、设备和介质 | |
CN103927314B (zh) | 一种数据批量处理的方法和装置 | |
CN104317806B (zh) | 财务数据查询方法及财务数据系统 | |
RU2017111215A (ru) | Системы и способы анализа сети и обеспечения отчетов | |
CN109711155A (zh) | 一种预警确定方法和装置 | |
CN107229730A (zh) | 数据查询方法及装置 | |
CN109254901B (zh) | 一种指标监测方法及系统 | |
CN106250303A (zh) | 业务日志收集及预警系统和业务日志收集及预警方法 | |
WO2019076001A1 (zh) | 信息更新方法和装置 | |
CN112258070A (zh) | 一种智能派单方法和系统 | |
CN108073707B (zh) | 金融业务数据更新方法、装置及计算机可读取存储介质 | |
EP3437060A1 (en) | Rule based hierarchical configuration | |
CN107577769A (zh) | 一种计量专业数据的挖掘方法及系统 | |
CN107506422A (zh) | 一种多数据源的分布式日志处理系统及方法 | |
US20130304547A1 (en) | Investment valuation projections in an on-demand system | |
US8725703B2 (en) | Management of an inventory of websites | |
WO2022036165A1 (en) | Universal blockchain data model | |
CN103281202B (zh) | 一种浏览器/服务器架构的系统及其前端呈现方法 | |
CN108921433B (zh) | 基于业务连续性的风险定量分析系统 | |
CN104216986B (zh) | 以数据更新周期进行预操作提高数据查询效率的装置及方法 | |
CN103455910B (zh) | 业务应用的工作语境 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |