CN101848477A - 一种故障诊断方法及系统 - Google Patents

一种故障诊断方法及系统 Download PDF

Info

Publication number
CN101848477A
CN101848477A CN200910080172A CN200910080172A CN101848477A CN 101848477 A CN101848477 A CN 101848477A CN 200910080172 A CN200910080172 A CN 200910080172A CN 200910080172 A CN200910080172 A CN 200910080172A CN 101848477 A CN101848477 A CN 101848477A
Authority
CN
China
Prior art keywords
fault
data
monitored system
case storehouse
unusual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910080172A
Other languages
English (en)
Inventor
李小平
杨乃印
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asiainfo Technologies China Inc
Original Assignee
Asiainfo Technologies China Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asiainfo Technologies China Inc filed Critical Asiainfo Technologies China Inc
Priority to CN200910080172A priority Critical patent/CN101848477A/zh
Publication of CN101848477A publication Critical patent/CN101848477A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供了一种故障诊断方法及系统,获取每个业务的故障数据;根据所述故障数据,生成故障case库;当被监控系统异常时,根据从故障case库中获得的与所述异常对应的故障case,对所述异常进行在线诊断;所述异常为出现故障或存在潜在故障。解决了现有技术中移动业务运营支撑系统的网管系统无力监控移动业务处理级别的问题,无需人为参与诊断故障,能够实现故障的准确定位,提高了故障诊断的速度和效率。

Description

一种故障诊断方法及系统
技术领域
本发明涉及通信领域,尤其涉及一种故障诊断方法及系统。
背景技术
随着移动业务发展的持续深入以及市场竞争的加剧,移动业务的种类越来越多、复杂性越来越高,对移动业务运营支撑系统的快捷性、稳定性和可维护性提出了更高的要求。
移动业务运营支撑系统的网管系统无力对移动业务处理级别进行监控,无法获取营业终端的网络情况,导致必须有诸多人为因素参与,比如当营业员报障后,缺乏有效的诊断手段,表现为:营业员报障时对故障描述不够清晰、营业员操作的业务数据无法再次获取并作为调试工具的输入参数,营业员报障后,维护人员对故障处理不及时,或者由于维护人员的诊断过程不够合理,有时需要直接操作数据库,带来一定的不安全因素,或者业务操作在维护人员操作的环境下无法重现等诸多问题;当业务运营支撑系统发生性能问题时,无法及时定位性能故障原因,无法将当时营业终端状态、主机状态、应用服务器状态、后台服务器状态、后台服务状态、业务处理量和业务处理耗时做一个鲜明的对比、无法获取营业终端的网络情况、无法获取web主机和后台应用服务器之间的网络情况等,由于缺乏有效的诊断手段,而需要繁琐的人工交互才能查找和定位故障原因,既耗时又费力,不利于提高业务运营支撑系统业务处理的效率,很难快速准确地定位现有移动业务运营支撑系统中出现的问题,从而导致故障定位难、响应速度慢。
在对现有技术的研究和实践过程中,本发明的发明人发现,现有的实现方式中,移动业务运营支撑系统的网管系统无力监控移动业务处理级别的问题,需要人为参与诊断故障,出现故障时,很难准确定位,响应速度慢。
发明内容
本发明提供一种故障诊断方法及系统,解决了现有技术中移动业务运营支撑系统的网管系统无力监控移动业务处理级别的问题,无需人为参与诊断故障,能够实现故障的准确定位,提高了故障诊断的速度和效率。
为解决上述技术问题,本发明实施例提供一种故障诊断方法,包括:
获取每个业务的故障数据;
根据所述故障数据,生成故障case库;
当被监控系统异常时,根据从故障case库中获得的与所述异常对应的故障case,对所述异常进行在线诊断;
所述异常为出现故障或存在潜在故障。
优选地,所述获取故障数据的步骤包括:
根据接收到的被监控系统生成的运营日志,获取每个业务的故障数据,并存储所述故障数据。
优选地,所述获取故障数据的步骤进一步包括:所述故障数据包括整个业务的函数调用关系;
所述当被监控系统异常时的步骤包括:
当被监控系统异常时,从故障case库中获得的与所述异常对应的故障case,根据所述故障case中整个业务的函数调用关系,准确定位被监控系统异常的位置,分析异常原因,对所述异常进行在线诊断。
优选地,所述生成故障case库的步骤进一步包括:
根据所述整个业务的函数调用关系,每个业务与故障case库中的至少一个故障case关联。
优选地,所述生成故障case库的步骤包括:
根据所述故障数据,针对每个故障,生成对每个故障的故障诊断程序,将所述故障诊断程序存储在指定数据库中,生成故障case库,每个故障诊断程序对应一个故障case。
优选地,所述生成故障case库的步骤进一步包括:
当有新故障出现时,定制新故障的故障诊断程序,将所述新故障的故障诊断程序存储在故障case库中,保持对故障case的实时更新。
优选地,所述对所述异常进行在线诊断的步骤包括:
当某个业务出现故障时,根据故障case库进行在线诊断时,根据所述业务与相应故障case的关系,按照应用系统层次顺序由下而上的执行故障case,定位故障原因。
优选地,所述对所述异常进行在线诊断的步骤进一步包括:
根据在线诊断确定的故障原因,快速修复故障或对出现故障的业务组件进行替换。
相应地,本发明实施例提供一种故障诊断系统,包括获取单元、生成单元和诊断单元:
所述获取单元,用于获取每个业务的故障数据,输出至所述生成单元;
所述生成单元,用于根据接收到的每个业务的故障数据,生成故障case库;
所述诊断单元,用于被监控系统异常时,从所述生成单元获取与所述故障对应的故障case,对所述异常进行在线诊断,所述异常为出现故障或存在潜在故障。
优选地,所述获取单元包括接收单元、分析单元和存储单元:
所述接收单元,用于接收被监控系统生成的运营日志,输出至所述分析单元;
所述分析单元,用于对接收到的运营日志中每个故障的相关数据进行分析,获得故障数据,输出所述存储单元;
所述存储单元,用于按照故障与业务的对应关系存储分析单元输出的故障数据。
优选地,所述生成单元进一步包括:
更新单元,用于对已生成的故障case库进行更新。
优选地,所述系统进一步包括:
定制单元,用于在新故障出现时,定制新故障的故障诊断程序。
根据上述技术方案可知,本发明实施例提供的技术方案解决了现有技术中移动业务运营支撑系统的网管系统无力监控业务处理级别,无法获取营业终端的网络情况,需要繁琐的人工交互才能查找和定位故障原因的问题,能够快速准确地定位现有移动业务运营支撑系统中出现的问题,提高业务运营支撑系统业务处理的效率,达到能够准确实现故障定位、大大提高响应速度,提高故障诊断的速度和效率的技术效果。
附图说明
图1为本发明实施例提供的所述方法的流程图;
图2为本发明实施例提供的最佳实施方案方法的流程图;
图3为本发明实施例提供的所述系统的结构示意图;
图4为本发明实施例提供的最佳实施方案系统的结构示意图。
具体实施方式
本发明实施例提供了一种故障诊断方法,所述方法的实施流程如图1所示,所述方法包括:
步骤101,获取每个业务的故障数据;
步骤102,根据所述故障数据,生成故障case库;
步骤103,当被监控系统出现异常时,根据从故障case库中获得的与所述异常对应的故障case,对所述异常进行在线诊断;
所述出现异常为出现故障或存在潜在故障。
步骤101具体包括:
根据接收到的被监控系统生成的运营日志,获取每个业务的故障数据,并存储所述故障数据。
步骤101之后进一步包括:所述故障数据包括整个业务的函数调用关系;
在此基础上,步骤103具体包括:
当被监控系统出现异常时,从故障case库中获得的与所述异常对应的故障case,根据所述故障case中整个业务的函数调用关系,准确定位被监控系统异常的位置,分析异常原因,对所述异常进行在线诊断。
步骤102具体包括:
根据所述故障数据,针对每个故障,生成对每个故障的故障诊断程序,将所述故障诊断程序存储在指定数据库中,生成故障case库,每个故障诊断程序对应一个故障case。
步骤102进一步包括:
根据所述整个业务的函数调用关系,每个业务与故障case库中的至少一个故障case关联。
步骤102进一步包括:
当有新故障出现时,定制新故障的故障诊断程序,将所述新故障的故障诊断程序存储在故障case库中,保持对故障case库的实时更新。
步骤103中,所述对所述异常进行在线诊断的步骤包括:
当某个业务出现故障时,根据故障case库进行在线诊断时,根据所述业务与相应故障case的关系,按照应用系统层次顺序由下而上的执行故障case,定位故障原因。
步骤103中,所述对所述异常进行在线诊断的步骤进一步包括:
根据在线诊断确定的故障原因,快速修复故障或对出现故障的业务组件进行替换。
当有新故障出现时,系统为该新故障提供定制服务,可以为这个新故障定制解决方案或故障诊断程序,一旦该新故障的解决方案或故障诊断程序确定,会将其作为一个新的故障case,存储在故障case库,因此,故障case库会得到实时更新;
下面我们将结合附图,对本发明实施例提供的最佳实施方案进行详细描述。
本发明实施例所提供的最佳实施方案的流程图如图2所示,具体实施流程为:
步骤201,生成文件日志和消息日志;
被监控系统生成运营日志,这里所提到的运营日志包括文件日志和消息日志,文件日志通过FTP的方式传送至系统的FILE AGENT(文件代理),消息(也可以称为“事件”)日志通过在线的方式即时传送至系统的EVENTAGENT(消息代理),被监控系统包括运营系统的每台主机,如应用服务器、Web服务器、营业终端等,运营日志包括被监控系统中每台主机的每天的业务运行异常情况,如每台主机的负载均衡情况、SQL执行异常情况、函数执行或者网络超时、每个业务调用函数的失败次数及失败原因;通过运营日志,可以及时得到每台主机每天的业务运行异常情况,包括负载均衡情况、SQL执行异常、函数执行或者网络超时以及函数失败次数及原因等。
步骤202,接收文件日志和消息日志;
接收单元接收被监控系统生成的运营日志,接收单元包括FILE AGENT和EVENT AGENT,FILE AGENT接收文件日志,EVENT AGENT接收消息日志,接收单元将接收到的运营日志发送至分析单元,至步骤203;关于消息日志内容的操作,至步骤207;
步骤203,分析文件日志,获得故障数据;
对接收的运营日志中的文件日志进行分析,取得每个业务调用的函数的详细信息,包括每个业务调用的模块名、接口名、函数名、调用开始时间、调用结束时间、调用函数的输入输出参数以及数据量、调用函数执行涉及到的SQL语句、调用函数执行结果(包括调用函数成功或失败及失败原因)等;
由于每次业务调用时在WEB界面上开始时会产生一个唯一的调用号,这个调用号在每次函数调用时输出,并且每个函数都有该函数在本次业务调用中的序号,被该函数调用的下级函数则包含一个父节点序号,根据这些调用号以及每个函数在每个业务调用中的序号,从而可以获得整个业务的函数调用关系,针对某个具体的业务时,能够针对某个具体业务,分析得到整个业务的函数调用关系,即从被监控系统的前台操作员开始点击按钮/图标开始,在WEB服务器上执行了什么函数、在应用服务器上又调用了什么函数、完成了什么数据库操作、耗时情况如何等信息都可以通过分析运营日志得到,而获取这一信息对于准确定位被监控系统出现故障的位置所在非常关键;进一步地,本发明实施例提供的系统还可以根据每天接收到的运营日志,了解每天被监控系统的业务函数的运行情况,并对这些业务函数的运行情况进行统计和分析,分析得出不同阶段内相同函数/相同业务的调用量、平均耗时,得出函数或者业务的执行效率趋势,如可以获得各类业务的执行效率,包括调用次数、平均执行时间、90%响应时间、输入参数数据量、输出参数数据量、平均执行SQL条数等,根据这些数据,可以具体分析被监控系统出现异常的可能或原因,能够对每天的被监控系统的业务函数的运行情况进行统计和分析,得出各类分析报告,并比较历史数据,对系统潜在的性能和故障隐患做出提前反应;
步骤204,存储分析结果;
对步骤203得到的故障数据,进行存储,在存储故障数据时,可以对函数调用信息以及输出函数的相关SQL语句进行关联存储,这样的话可以得到SQL语句与业务函数之间的引用关系和统计信息,为DBA接入的系统性能优化提供帮助,能够通过分析结果对被监控系统的运行和故障情况进行统计和分析,并对未来被监控系统运行情况进行评估,至步骤205;
步骤205,根据分析结果确定故障诊断程序或解决方法;
具体的操作人员可以根据步骤204存储的分析结果,对具体的故障开发故障诊断程序,每个故障诊断程序都对应着一个故障,作为一个故障case被保存,至步骤206,也可以不用编写测试程序,而是结合现有的工具dump出来输入输出参数,进行测试和调试,这是因为业务处理在进入某个函数时,系统会将输入输出数据写到文件中去,该文件的文件名中包含该函数名和唯一的函数调用号,通过运营日志中的对应信息可获取该dump文件,通过查看整个业务中各个环节的函数调用关系,分析各个环节的耗时情况,确定慢的环节,也就是说确定可能存在潜在故障的环节,这些解决方案也可以作为故障case,存储在故障case库中,即至步骤206;
通过根据分析结果确定故障诊断程序或解决方法,做到对被监控系统可能出现异常的情况有一个细致、精确地的了解,提高制定管控策略的功能,能够做到对满足特定条件的操作员、营业厅、IP地址、主机、业务函数等进行实时详细监控;
步骤206,将故障诊断程序或解决方法存储在case库中;
将步骤205确定的故障case存储在故障case库中,需要说明的是,利用测试工具,配合测试脚本和规划的测试数据,可以建立自动测试平台,直接对被监控系统出现的异常进行测试,不管是故障case还是自动测试平台,都是当被监控系统出现异常时,为故障诊断提供的及时处理的诊断方法;这里需要注意的是,如果在步骤202中发现新故障,系统可以为这个新故障定制解决方案或故障诊断程序,一旦该新故障的解决方案或故障诊断程序确定,会将其作为一个新的故障case,存储在故障case库,因此,故障case库会得到实时更新;
步骤207,是否有告警消息;
查看消息日志中是否有告警消息。根据被监控系统发出的实时消息,分析消息日志的内容,为被监控系统定制告警规则,而后根据告警规则,对消息日志内容进行过滤,对符合告警规则的消息日志生成告警记录,并在被监控系统前台进行告警;当发现有告警消息时,至步骤208,当没有告警消息时,至步骤202;
步骤208,进行在线诊断,确定故障原因;
这里需要说明的是,当发现被监控系统有告警信息时,可能是被监控系统已经出现故障,也可能是被监控系统存在有潜在的故障,如某个函数的执行时间过长、或select出数据过多的SQL语句进行告警等;当被监控系统出现异常时,这里的异常指的是已经出现的故障或潜在故障,可以通过即时向故障case库发出请求,请求获取解决当前异常的诊断程序或解决方案,故障case库在收到该请求后,向被监控系统返回故障case,运行该故障case,对被监控系统进行在线诊断分析,快速找出故障原因,至步骤209;
步骤209,解决故障、快速修复;
根据步骤208确定的故障原因,解决该故障,或者进行快速修复,或对出现故障的部件(业务组件)进行替换,使得被监控系统一旦出现异常就可以及时得到解决。
查询业务处理细节时,自动查询出对应的前期出现过的故障,从故障case库中查询相应的故障case,对这些case提供过滤功能。同时提供查询故障环节的输入输出数据文件的功能。
提供维护员执行过滤后的故障case的功能,在执行故障case时,提供从其他系统查询诊断所需要的相关信息的功能,以便维护员进行自动在线诊断分析,定位故障原因。执行故障case可以按照应用系统层次划分至下而上进行。
提供分析营业终端的界面交互情况的功能,作为故障诊断的参考
上述技术方案提供对APP域和MGR域的分析,APP是应用逻辑层,供web前台调用,每个APP函数包含完整的业务逻辑,MGR是原子逻辑,APP组合MGR的原子逻辑形成复杂的业务逻辑调用关系的功能,可用于检查程序代码是否符合开发规范。提供分析MGR的私有kernel层和数据库实体表之间的关系的功能,检测是否符合开发规范。
提供分析特殊MGR和APP之间的调用关系的功能,检测是否符合开发规范,同时可整理更多的特殊的MGR模块,提高系统运行效率
本发明实施例还提供了一种故障诊断系统,所述故障诊断系统的结构示意图如图3所示,包括获取单元301、生成单元302和诊断单元303,所述获取单元301,用于获取每个业务的故障数据,输出至所述生成单元302;所述生成单元302,用于根据接收到的每个业务的故障数据,生成故障case库;所述诊断单元303,用于被监控系统出现异常时,从所述生成单元302获取与所述故障对应的故障case,对所述异常进行在线诊断,所述出现异常为出现故障或存在潜在故障。
本发明实施例提供的最佳实施方案系统的结构示意图如图4所示,本发明实施例所述故障诊断系统包括获取单元401、生成单元402、诊断单元403和定制单元404,所述获取单元401,用于获取每个业务的故障数据,输出至所述生成单元402。
所述生成单元402,用于根据接收到的每个业务的故障数据,生成故障case库4021。使得被监控系统一旦出现故障,即可通过故障case库,经在线诊断找到解决故障的程序或方法,提高了解决故障的速度和效率。
所述诊断单元403,用于被监控系统出现异常时,从所述生成单元402获取与所述故障对应的故障case,对所述异常进行在线诊断,所述出现异常为出现故障或存在潜在故障。
定制单元404,用于在新故障出现时,定制新故障的故障诊断程序。
所述获取单元401包括接收单元4011、分析单元4012和存储单元4013。所述获取单元401用于获取被监控系统的运营日志,被监控系统包括运营系统的每台主机,如应用服务器、Web服务器、营业终端等,运营日志包括被监控系统中每台主机的每天的业务运行异常情况,如每台主机的负载均衡情况、SQL执行异常情况、函数执行或者网络超时、每个业务调用函数的失败次数及失败原因。
所述接收单元4011,用于接收被监控系统生成的运营日志,输出至所述分析单元4012。通过运营日志,可以及时得到每台主机每天的业务运行异常情况,包括负载均衡情况、SQL执行异常、函数执行或者网络超时以及函数失败次数及原因等。
所述分析单元4012,用于对接收到的运营日志中每个故障的相关数据进行分析,获得故障数据,输出所述存储单元4013。通过分析单元4012分析分析单元4012接收到的运营日志,可以及时获得执行每个业务时出现的故障数据,可以通过这些故障数据的进一步分析,找到被监控系统出现的原因,从而制定解决故障的程序或方法。
所述存储单元4013,用于按照故障与业务的对应关系存储分析单元4012输出的故障数据。
所述生成单元402进一步包括:
更新单元4022,用于对已生成的故障case库4021进行更新。通过对故障case库4021的更新,保证故障case库中的数据的实时性,为系统可以及时解决被监控系统出现的故障提供保障。
根据上述技术方案可知,本发明实施例提供的技术方案解决了现有技术中移动业务运营支撑系统的网管系统无力监控业务处理级别,无法获取营业终端的网络情况,需要繁琐的人工交互才能查找和定位故障原因的问题,能够快速准确地定位现有移动业务运营支撑系统中出现的问题,提高业务运营支撑系统业务处理的效率,达到能够准确实现故障定位、大大提高响应速度,提高故障诊断的速度和效率的技术效果。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (12)

1.一种故障诊断方法,其特征在于,包括:
获取每个业务的故障数据;
根据所述故障数据,生成故障case库;
当被监控系统出现异常时,根据从故障case库中获得的与所述异常对应的故障case,对所述异常进行在线诊断;
所述出现异常为出现故障或存在潜在故障。
2.根据权利要求1所述方法,其特征在于,所述获取故障数据的步骤包括:
根据接收到的被监控系统生成的运营日志,获取每个业务的故障数据,并存储所述故障数据。
3.根据权利要求1或2所述方法,其特征在于,所述获取故障数据的步骤进一步包括:所述故障数据包括整个业务的函数调用关系;
所述当被监控系统出现异常时的步骤包括:
当被监控系统出现异常时,从故障case库中获得的与所述异常对应的故障case,根据所述故障case中整个业务的函数调用关系,准确定位被监控系统异常的位置,分析异常原因,对所述异常进行在线诊断。
4.根据权利要求3所述方法,其特征在于,所述生成故障case库的步骤进一步包括:
根据所述整个业务的函数调用关系,每个业务与故障case库中的至少一个故障case关联。
5.根据权利要求1所述方法,其特征在于,所述生成故障case库的步骤包括:
根据所述故障数据,针对每个故障,生成对每个故障的故障诊断程序,将所述故障诊断程序存储在指定数据库中,生成故障case库,每个故障诊断程序对应一个故障case。
6.根据权利要求1或5所述方法,其特征在于,所述生成故障case库的步骤进一步包括:
当有新故障出现时,定制新故障的故障诊断程序,将所述新故障的故障诊断程序存储在故障case库中,保持对故障case库的实时更新。
7.根据权利要求1或2或5所述方法,其特征在于,所述对所述异常进行在线诊断的步骤包括:
当某个业务出现故障时,根据故障case库进行在线诊断时,根据所述业务与相应故障case的关系,按照应用系统层次顺序由下而上的执行故障case,定位故障原因。
8.根据权利要求1或2或5所述方法,其特征在于,所述对所述异常进行在线诊断的步骤进一步包括:
根据在线诊断确定的故障原因,快速修复故障或对出现故障的业务组件进行替换。
9.一种故障诊断系统,其特征在于,包括获取单元、生成单元和诊断单元:
所述获取单元,用于获取每个业务的故障数据,输出至所述生成单元;
所述生成单元,用于根据接收到的每个业务的故障数据,生成故障case库;
所述诊断单元,用于被监控系统出现异常时,从所述生成单元获取与所述故障对应的故障case,对所述异常进行在线诊断,所述出现异常为出现故障或存在潜在故障。
10.根据权利要求9所述系统,其特征在于,所述获取单元包括接收单元、分析单元和存储单元:
所述接收单元,用于接收被监控系统生成的运营日志,输出至所述分析单元;
所述分析单元,用于对接收到的运营日志中每个故障的相关数据进行分析,获得故障数据,输出所述存储单元;
所述存储单元,用于按照故障与业务的对应关系存储分析单元输出的故障数据。
11.根据权利要求9所述系统,其特征在于,所述生成单元进一步包括:
更新单元,用于对已生成的故障case库进行更新。
12.根据权利要求9所述系统,其特征在于,所述系统进一步包括:
定制单元,用于在新故障出现时,定制新故障的故障诊断程序。
CN200910080172A 2009-03-24 2009-03-24 一种故障诊断方法及系统 Pending CN101848477A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910080172A CN101848477A (zh) 2009-03-24 2009-03-24 一种故障诊断方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910080172A CN101848477A (zh) 2009-03-24 2009-03-24 一种故障诊断方法及系统

Publications (1)

Publication Number Publication Date
CN101848477A true CN101848477A (zh) 2010-09-29

Family

ID=42772903

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910080172A Pending CN101848477A (zh) 2009-03-24 2009-03-24 一种故障诊断方法及系统

Country Status (1)

Country Link
CN (1) CN101848477A (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102724053A (zh) * 2011-03-30 2012-10-10 新奥特(北京)视频技术有限公司 一种远程播控系统出错处理的方法和装置
CN102818945A (zh) * 2011-12-19 2012-12-12 中国航空工业集团公司洛阳电光设备研究所 一种产品故障快速定位方法
CN102915028A (zh) * 2012-02-16 2013-02-06 上海西门子工业自动化有限公司 Pcs7软件系统的诊断系统和诊断方法
CN104244301A (zh) * 2013-06-19 2014-12-24 中国移动通信集团公司 基于无线指标定位lte网络问题的方法和系统
CN104462606A (zh) * 2014-12-31 2015-03-25 中国科学院深圳先进技术研究院 一种基于日志数据确定诊断处理措施的方法
CN104614601A (zh) * 2014-12-26 2015-05-13 惠州Tcl移动通信有限公司 一种终端故障定位方法、装置及系统
CN104866632A (zh) * 2015-04-30 2015-08-26 广东美的制冷设备有限公司 家电设备的故障数据获取方法、装置及终端
CN104978529A (zh) * 2015-03-10 2015-10-14 腾讯科技(深圳)有限公司 网页前端的异常处理方法、异常处理系统及异常处理服务器
CN105183620A (zh) * 2015-08-07 2015-12-23 北京思特奇信息技术股份有限公司 一种对业务运行状态进行跟踪的方法及系统
CN105262616A (zh) * 2015-09-21 2016-01-20 浪潮集团有限公司 一种基于故障知识库的自动化故障处理系统及方法
CN105320585A (zh) * 2014-07-08 2016-02-10 北京启明星辰信息安全技术有限公司 一种实现应用故障诊断的方法及装置
CN105591821A (zh) * 2016-01-06 2016-05-18 北京京东尚科信息技术有限公司 监控系统和业务系统
CN106411970A (zh) * 2015-07-28 2017-02-15 阿里巴巴集团控股有限公司 一种基于服务调用的故障处理方法、装置和系统
WO2017080384A1 (zh) * 2015-11-10 2017-05-18 阿里巴巴集团控股有限公司 数据处理方法及装置
CN107171819A (zh) * 2016-03-07 2017-09-15 北京华为数字技术有限公司 一种网络故障诊断方法及装置
CN108509323A (zh) * 2018-01-30 2018-09-07 深圳壹账通智能科技有限公司 基于日志分析的业务处理方法、装置及计算机设备
CN109039682A (zh) * 2017-06-09 2018-12-18 中兴通讯股份有限公司 一种诊断处理的方法和装置
CN109598505A (zh) * 2018-10-31 2019-04-09 阿里巴巴集团控股有限公司 一种基于区块链的质量数据处理方法和装置
CN110188083A (zh) * 2019-05-29 2019-08-30 口碑(上海)信息技术有限公司 接口信息挖掘方法及装置
CN110895503A (zh) * 2018-09-12 2020-03-20 传线网络科技(上海)有限公司 一种应用的性能监控方法及客户端
CN111277643A (zh) * 2020-01-18 2020-06-12 深圳市麦谷科技有限公司 一种http链路跟踪记录方法及系统
CN112783718A (zh) * 2020-12-31 2021-05-11 航天信息股份有限公司 一种用于系统异常的管理系统及方法

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102724053A (zh) * 2011-03-30 2012-10-10 新奥特(北京)视频技术有限公司 一种远程播控系统出错处理的方法和装置
CN102818945B (zh) * 2011-12-19 2015-07-22 中国人民解放军驻六一三所军事代表室 一种产品故障快速定位方法
CN102818945A (zh) * 2011-12-19 2012-12-12 中国航空工业集团公司洛阳电光设备研究所 一种产品故障快速定位方法
CN102915028B (zh) * 2012-02-16 2015-11-25 西门子工厂自动化工程有限公司 Pcs7软件系统的诊断系统和诊断方法
CN102915028A (zh) * 2012-02-16 2013-02-06 上海西门子工业自动化有限公司 Pcs7软件系统的诊断系统和诊断方法
CN104244301A (zh) * 2013-06-19 2014-12-24 中国移动通信集团公司 基于无线指标定位lte网络问题的方法和系统
CN104244301B (zh) * 2013-06-19 2017-11-21 中国移动通信集团公司 基于无线指标定位lte网络问题的方法和系统
CN105320585B (zh) * 2014-07-08 2019-04-02 北京启明星辰信息安全技术有限公司 一种实现应用故障诊断的方法及装置
CN105320585A (zh) * 2014-07-08 2016-02-10 北京启明星辰信息安全技术有限公司 一种实现应用故障诊断的方法及装置
CN104614601A (zh) * 2014-12-26 2015-05-13 惠州Tcl移动通信有限公司 一种终端故障定位方法、装置及系统
CN104614601B (zh) * 2014-12-26 2019-02-15 惠州Tcl移动通信有限公司 一种终端故障定位方法、装置及系统
CN104462606A (zh) * 2014-12-31 2015-03-25 中国科学院深圳先进技术研究院 一种基于日志数据确定诊断处理措施的方法
CN104462606B (zh) * 2014-12-31 2018-06-22 中国科学院深圳先进技术研究院 一种基于日志数据确定诊断处理措施的方法
CN104978529A (zh) * 2015-03-10 2015-10-14 腾讯科技(深圳)有限公司 网页前端的异常处理方法、异常处理系统及异常处理服务器
CN104866632B (zh) * 2015-04-30 2018-03-06 广东美的制冷设备有限公司 家电设备的故障数据获取方法、装置及终端
CN104866632A (zh) * 2015-04-30 2015-08-26 广东美的制冷设备有限公司 家电设备的故障数据获取方法、装置及终端
CN106411970A (zh) * 2015-07-28 2017-02-15 阿里巴巴集团控股有限公司 一种基于服务调用的故障处理方法、装置和系统
CN106411970B (zh) * 2015-07-28 2019-10-11 阿里巴巴集团控股有限公司 一种基于服务调用的故障处理方法、装置和系统
CN105183620A (zh) * 2015-08-07 2015-12-23 北京思特奇信息技术股份有限公司 一种对业务运行状态进行跟踪的方法及系统
CN105262616A (zh) * 2015-09-21 2016-01-20 浪潮集团有限公司 一种基于故障知识库的自动化故障处理系统及方法
WO2017080384A1 (zh) * 2015-11-10 2017-05-18 阿里巴巴集团控股有限公司 数据处理方法及装置
US10678624B2 (en) 2015-11-10 2020-06-09 Alibaba Group Holding Limited Identifying potential solutions for abnormal events based on historical data
CN105591821A (zh) * 2016-01-06 2016-05-18 北京京东尚科信息技术有限公司 监控系统和业务系统
CN105591821B (zh) * 2016-01-06 2020-06-30 北京京东尚科信息技术有限公司 监控系统和业务系统
CN107171819B (zh) * 2016-03-07 2020-02-14 北京华为数字技术有限公司 一种网络故障诊断方法及装置
CN107171819A (zh) * 2016-03-07 2017-09-15 北京华为数字技术有限公司 一种网络故障诊断方法及装置
CN109039682A (zh) * 2017-06-09 2018-12-18 中兴通讯股份有限公司 一种诊断处理的方法和装置
CN108509323A (zh) * 2018-01-30 2018-09-07 深圳壹账通智能科技有限公司 基于日志分析的业务处理方法、装置及计算机设备
CN108509323B (zh) * 2018-01-30 2021-10-08 深圳壹账通智能科技有限公司 基于日志分析的业务处理方法、装置及计算机设备
CN110895503A (zh) * 2018-09-12 2020-03-20 传线网络科技(上海)有限公司 一种应用的性能监控方法及客户端
CN110895503B (zh) * 2018-09-12 2024-04-12 阿里巴巴(中国)有限公司 一种应用的性能监控方法及客户端
CN109598505B (zh) * 2018-10-31 2020-05-19 阿里巴巴集团控股有限公司 一种基于区块链的质量数据处理方法和装置
CN109598505A (zh) * 2018-10-31 2019-04-09 阿里巴巴集团控股有限公司 一种基于区块链的质量数据处理方法和装置
CN111899016A (zh) * 2018-10-31 2020-11-06 创新先进技术有限公司 一种基于区块链的质量数据处理方法和装置
CN110188083A (zh) * 2019-05-29 2019-08-30 口碑(上海)信息技术有限公司 接口信息挖掘方法及装置
CN111277643A (zh) * 2020-01-18 2020-06-12 深圳市麦谷科技有限公司 一种http链路跟踪记录方法及系统
CN111277643B (zh) * 2020-01-18 2023-07-28 深圳市麦谷科技有限公司 一种http链路跟踪记录方法及系统
CN112783718A (zh) * 2020-12-31 2021-05-11 航天信息股份有限公司 一种用于系统异常的管理系统及方法

Similar Documents

Publication Publication Date Title
CN101848477A (zh) 一种故障诊断方法及系统
CN111209131B (zh) 一种基于机器学习确定异构系统的故障的方法和系统
CN103150249B (zh) 一种自动化测试的方法和系统
CN111176879A (zh) 设备的故障修复方法及装置
CN111756582B (zh) 基于nfv日志告警的业务链监控方法
CN106209405B (zh) 故障诊断方法及装置
CN106649040A (zh) 一种Weblogic中间件性能自动监控方法及装置
CN102111797A (zh) 一种故障的诊断方法和设备
CN101197621A (zh) 一种对网管系统故障进行远程诊断定位的方法及其系统
CN113946499A (zh) 一种微服务链路跟踪及性能分析方法、系统、设备及应用
CN112804093B (zh) 一种基于故障能力中心的集中调度支撑方法和系统
CN104461820A (zh) 一种设备监控的方法及装置
CN108809729A (zh) 一种分布式系统中ctdb服务的故障处理方法及装置
US20020026433A1 (en) Knowledge system and methods of business alerting and business analysis
CN114500178B (zh) 一种自运维的智慧物联网关
CN112131090B (zh) 业务系统性能监控方法及装置、设备及介质
KR20030056301A (ko) 시스템 장애 통합관리방법
CN113626288A (zh) 故障处理方法、系统、装置、存储介质和电子设备
CN109933798B (zh) 一种审计日志分析方法及装置
CN113722135A (zh) 一种错误日志采集系统、方法、设备及介质
CN112817827A (zh) 运维方法、装置、服务器、设备、系统及介质
CN113037550B (zh) 一种服务故障监控方法、系统及计算机可读存储介质
CN110674197A (zh) 一种业务操作的可视化配置与抓取系统
CN114090382B (zh) 超融合集群健康巡检方法和装置
CN117992304A (zh) 一种一体化智能运维平台

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100929