CN116954975A - 软件产品的故障处理方法、系统、装置以及存储介质 - Google Patents

软件产品的故障处理方法、系统、装置以及存储介质 Download PDF

Info

Publication number
CN116954975A
CN116954975A CN202310955298.0A CN202310955298A CN116954975A CN 116954975 A CN116954975 A CN 116954975A CN 202310955298 A CN202310955298 A CN 202310955298A CN 116954975 A CN116954975 A CN 116954975A
Authority
CN
China
Prior art keywords
fault
software product
information
identification information
log
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310955298.0A
Other languages
English (en)
Inventor
刘悦
金剑峰
杨采
王毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202310955298.0A priority Critical patent/CN116954975A/zh
Publication of CN116954975A publication Critical patent/CN116954975A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种软件产品的故障处理方法、系统、装置以及存储介质。涉及大数据领域。该方法包括:接收管理端下发的故障识别信息,并将故障识别信息同步至代理组件中,其中,代理组件配置在软件产品中,故障识别信息用于指示识别软件产品是否发生故障,并指示获取发生故障时的故障信息;接收代理组件反馈的故障日志,并解析故障日志,得到软件产品的故障发生原因,其中,故障日志为代理组件根据软件产品发生故障时的故障信息生成的日志;根据故障发生原因确定修改操作,其中,修改操作是指对软件产品执行的修改操作。通过本申请,解决了相关技术中通过分别对每个软件产品的故障原因单独进行处理的准确率和效率低的问题。

Description

软件产品的故障处理方法、系统、装置以及存储介质
技术领域
本申请涉及大数据领域,具体而言,涉及一种软件产品的故障处理方法、系统、装置以及存储介质。
背景技术
在软件产品研发运行过程中,通常会产生故障或状态异常的现象。因此在软件产品设计阶段和运行阶段需要对软件产品进行有效的管理,从而在软件产品产生故障的时候可以协助研发人员快速排查、分析、定位和解决问题,进而对故障进行及时处理。
现有故障管理方法依靠各个软件产品独自维护,大多是通过软件产品研发人员修改源代码对发生故障的软件产品进行维护配置,依靠软件产品研发人员相互沟通对故障进行管理。同时各个应用分别设计故障信息,不同的软件产品可能重复定义故障信息,或不同的故障使用相同的故障编码,导致业务、运维等人员混淆软件产品在交互调用过程中产生的故障,无法快速准确定位故障位置及产生原因。
针对相关技术中通过分别对每个软件产品的故障原因单独进行处理的准确率和效率低的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供一种软件产品的故障处理方法、系统、装置以及存储介质,以解决相关技术中通过分别对每个软件产品的故障原因单独进行处理的准确率和效率低的问题。
根据本申请的一个方面,提供了一种软件产品的故障处理方法。该方法包括:接收管理端下发的故障识别信息,并将故障识别信息同步至代理组件中,其中,代理组件配置在软件产品中,故障识别信息用于指示识别软件产品是否发生故障,并指示获取发生故障时的故障信息;接收代理组件反馈的故障日志,并解析故障日志,得到软件产品的故障发生原因,其中,故障日志为代理组件根据软件产品发生故障时的故障信息生成的日志;根据故障发生原因确定修改操作,其中,修改操作是指对软件产品执行的修改操作。
可选地,接收代理组件反馈的故障日志包括:在存在M个代理组件的情况下,确定每个代理组件反馈的故障日志中的数据的数据量,得到M个数据量,并计算M个数据量的和,得到总数据量,其中,M为正整数;判断总数据量是否大于预设数据量;在总数据量大于预设数据量的情况下,确定每个代理组件的权值,并按照权值由大到小的顺序依次获取每个代理组件反馈的故障日志。
可选地,接收代理组件反馈的故障日志包括:在管理模组存在异常的情况下,向代理组件发送第一通知,其中,代理组件在接收到第一通知后将故障日志存储在代理组件的数据库中;在管理模组恢复正常的情况下,向代理组件发送第二通知,其中,代理组件在接收到第二通知后将故障日志发送至管理模组中。
可选地,解析故障日志,得到软件产品的故障发生原因包括:解析故障日志,得到故障对象、故障信息,其中,故障信息至少包括以下之一:故障的发生次数,故障类型,发生时间点,发生场所;将故障对象和故障信息输入管理模组中的故障分析模型中,得到故障发生原因,其中,故障分析模型为分类模型,故障分析模型以多个历史故障发生原因以及每个历史故障发生原因对应的故障对象和故障信息作为样本训练得到。
可选地,将故障识别信息同步至代理组件中包括:在故障识别信息为新增信息的情况下,确定故障识别信息对应的软件产品,得到P个软件产品,并将故障识别信息发送至每个软件产品的代理组件中,其中,P为正整数,P小于等于M;在故障识别信息为修改信息的情况下,确定具有与故障识别信息相关联的待更新信息的代理组件,得到N个代理组件,并将故障识别信息发送至N个代理组件中,其中,故障识别信息用于替换待更新信息,待更新信息为代理组件中的异常信息。
可选地,根据故障发生原因确定修改操作包括:在故障发生原因指示配置软件产品的设备存在设备异常的情况下,根据预设对照表确定故障发生原因对应的故障编码,并将故障编码发送至软件产品的厂商;在故障发生原因指示软件产品存在操作异常的情况下,向软件产品发送告警信息,并通过软件产品展示告警信息,其中,告警信息中包括故障发生原因以及提示信息,提示信息用于提示软件产品的使用方对软件产品的正确操作方法。
可选地,代理组件监控软件产品的运行数据,并在运行数据存在异常的情况下,从软件产品的数据库中获取预设时间间隔内的软件产品的运行信息,得到故障信息,并将故障信息进行标准化,得到故障日志。
根据本申请的另一方面,提供了一种软件产品的故障处理系统。该系统包括:管理端,用于向管理模组下发故障识别信息,其中,故障识别信息用于指示识别软件产品是否发生故障,并指示获取发生故障时的故障信息;管理模组,与管理端和代理组件连接,用于接收管理端下发的故障识别信息,并将故障识别信息同步至代理组件中,并接收代理组件反馈的故障日志,并解析故障日志,得到软件产品的故障发生原因,并根据故障发生原因确定修改操作;代理组件,与管理模组连接,设置在软件产品中,用于根据故障识别信息识别软件产品是否发生故障,并在软件产品发生故障的情况下根据故障信息生成故障日志,并将故障日志发送至管理模组。
根据本申请的另一方面,提供了一种软件产品的故障处理装置。该装置包括:接收单元,用于接收管理端下发的故障识别信息,并将故障识别信息同步至代理组件中,其中,代理组件配置在软件产品中,故障识别信息用于指示识别软件产品是否发生故障,并指示获取发生故障时的故障信息;解析单元,用于接收代理组件反馈的故障日志,并解析故障日志,得到软件产品的故障发生原因,其中,故障日志为代理组件根据软件产品发生故障时的故障信息生成的日志;确定单元,用于根据故障发生原因确定修改操作,其中,修改操作是指对软件产品执行的修改操作。
根据本发明的另一方面,还提供了一种计算机存储介质,计算机存储介质用于存储程序,其中,程序运行时控制计算机存储介质所在的设备执行一种软件产品的故障处理方法。
根据本发明的另一方面,还提供了一种电子设备,包含一个或多个处理器和存储器;存储器中存储有计算机可读指令,处理器用于运行计算机可读指令,其中,计算机可读指令运行时执行一种软件产品的故障处理方法。
通过本申请,采用以下步骤:接收管理端下发的故障识别信息,并将故障识别信息同步至代理组件中,其中,代理组件配置在软件产品中,故障识别信息用于指示识别软件产品是否发生故障,并指示获取发生故障时的故障信息;接收代理组件反馈的故障日志,并解析故障日志,得到软件产品的故障发生原因,其中,故障日志为代理组件根据软件产品发生故障时的故障信息生成的日志;根据故障发生原因确定修改操作,其中,修改操作是指对软件产品执行的修改操作。解决了相关技术中通过分别对每个软件产品的故障原因单独进行处理的准确率和效率低的问题。通过管理模组将管理端下发的故障识别信息发送至代理组件中,并接收代理组件发送的故障日志,从而可以在管理模组中对多个代理组件发送的多个故障信息进行统一管理和识别,并在识别后通过故障日志确定故障原因,并根据故障原因和发生故障的软件产品确定故障的发生原因和解决方法,从而将解决方法发送至代理组件中解决软件产品的故障,进而通过对多个软件产品的故障进行统一处理,达到了提高故障的处理准确率和效率的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的软件产品的故障处理系统的流程图;
图2是根据本申请实施例提供的软件产品的故障处理方法的流程图;
图3是根据本申请实施例提供的软件产品的故障处理装置的示意图;
图4为根据本申请实施例提供的一种电子设备的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本公开所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。例如,本系统和相关用户或机构间设置有接口,在获取相关信息之前,需要通过接口向前述的用户或机构发送获取请求,并在接收到前述的用户或机构反馈的同意信息后,获取相关信息。
需要说明的是,本公开所确定的软件产品的故障处理方法、系统、装置以及存储介质可用于大数据领域,也可用于除大数据领域之外的任意领域,本公开所确定的软件产品的故障处理方法、系统、装置以及存储介质的应用领域不做限定。
在本实施例中,图1是根据本申请实施例提供的软件产品的故障处理系统的流程图,如图1所示,以一种可选的软件产品的故障处理系统为执行主体执行前述的软件产品的故障处理方法,该软件产品的故障处理系统至少包括:管理端101、管理模组102、代理组件103、软件产品104。
其中,管理端101,用于向管理模组102下发故障识别信息,其中,故障识别信息用于指示识别软件产品104是否发生故障,并指示获取发生故障时的故障信息。
具体的,在确定软件产品104是否存在故障的时候,首先需要开发人员通过管理端101设设置故障识别信息,其中,故障识别信息中可以包括识别规则、识别策略等,从而可以在软件产品104中通过监控软件产品104的测试数据、运行数据等信息,并将上述信息与故障识别信息进行对比,进而确定软件产品104是否存在故障。
进一步的,在完成故障识别信息的设置后,可以将故障识别信息发送至管理模组102中,从而在管理模组102中对不同的软件产品104对应的故障识别信息进行集中管理下发。
管理模组102,与管理端101和代理组件103连接,用于接收管理端101下发的故障识别信息,并将故障识别信息同步至代理组件103中,并接收代理组件103反馈的故障日志,并解析故障日志,得到软件产品104的故障发生原因,并根据故障发生原因确定修改操作。
具体的,在管理模组102接收到管理端101下发的故障识别信息之后,需要将故障识别信息同步至故障识别信息对应的软件产品104中设置的代理组件103中,代理组件103可以根据故障识别信息确定软件产品104是否发生故障,并在发生故障的情况下,可以通过代理组件103将故障对应的故障日志发送至管理模组102,管理模组102进一步对故障日志进行分析从而确定故障发生原因,并根据故障识别信息确定修改操作,从而根据修改操作对软件产品104进行修改。
代理组件103,与管理模组102连接,设置在软件产品104中,用于根据故障识别信息识别软件产品104是否发生故障,并在软件产品104发生故障的情况下根据故障信息生成故障日志,并将故障日志发送至管理模组102。
具体的,代理组件103需要存储管理模组102发送的故障识别信息,并实时监控软件产品104中的运行信息等,并根据运行信息等软件产品104的信息以及故障识别信息确定软件产品104是否发生故障,并在发生故障的情况下,获取软件产品104中与故障相关的运行信息从而生成故障日志,并将故障日志发送至管理模组102,进而可以通过管理模组102进一步对故障日志进行分析从而确定故障发生原因,并接收管理模组102发送的修改操作,从而可以通过修改操作对软件产品104进行修改,达到了解决软件产品104中的故障问题的效果,同时还通过管理模组102对多个软件产品104进行了集中管理,避免由于对每个软件产品104进行单独管理造成管理准确率低的现象发生。
根据本申请的实施例,提供了一种软件产品的故障处理方法。
图2是根据本申请实施例提供的软件产品的故障处理方法的流程图。如图2所示,该方法包括以下步骤:
步骤S201,接收管理端下发的故障识别信息,并将故障识别信息同步至代理组件中,其中,代理组件配置在软件产品中,故障识别信息用于指示识别软件产品是否发生故障,并指示获取发生故障时的故障信息。
具体的,管理模组在接收到管理端下发的故障识别信息后,需要先确定该故障识别信息指示的软件产品,并将该故障识别信息同步至对应的软件产品中的代理组件中,其中,故障识别信息中可以为管理人员为软件产品的故障识别操作设计制定一套识别方案,如根据故障类型对每个软件产品中可能发生的故障情景进行分类,如将常出现的空指针异常、无法访问请求资源等归类为技术故障,将密码错误,余额不足,账号非法等故障归类为业务故障,并将上述故障对应的运行数据场景作为识别信息添加至故障识别信息中。
例如,故障识别信息中存在一个策略为识别某字段是否存在中文内容,在软件产品运行的时候,在检测到该字段中不存在中文内容,则表明软件产品存在故障,并可以将该字段中的内容作为故障信息,从而可以通过管理模组对故障信息进行分析得到故障原因。
步骤S202,接收代理组件反馈的故障日志,并解析故障日志,得到软件产品的故障发生原因,其中,故障日志为代理组件根据软件产品发生故障时的故障信息生成的日志。
具体的,在管理模组接收到代理组件反馈的故障日志后,可以解析故障日志,并对故障日志进行分析,从而得到故障发生原因,其中,在对故障日志进行分析的时候,可以使用模型对故障日志进行分析,从而得到该故障对应的故障发生原因。
需要说明的是,故障日志为代理组件根据故障识别信息识别到软件产品发生故障后,通过获取运行数据得到的故障日志,从而可以根据故障日志得到故障发生时间以及故障发生时的运行数据,从而可以根据上述信息完成对故障发生原因的确定。
步骤S203,根据故障发生原因确定修改操作,其中,修改操作是指对软件产品执行的修改操作。
具体的,在得到故障发生原因后,即可根据故障发生原因确定对软件产品的修改操作,从而可以解决软件产品中发生的故障,并在确定修改操作后,将修改操作发送至代理组件中,从而使得代理组件可以根据修改操作对软件产品进行修改,进而达到准确的确定软件产品的故障原因,并对故障进行修复的效果。
本申请实施例提供的软件产品的故障处理方法,通过接收管理端下发的故障识别信息,并将故障识别信息同步至代理组件中,其中,代理组件配置在软件产品中,故障识别信息用于指示识别软件产品是否发生故障,并指示获取发生故障时的故障信息;接收代理组件反馈的故障日志,并解析故障日志,得到软件产品的故障发生原因,其中,故障日志为代理组件根据软件产品发生故障时的故障信息生成的日志;根据故障发生原因确定修改操作,其中,修改操作是指对软件产品执行的修改操作。解决了相关技术中通过分别对每个软件产品的故障原因单独进行处理的准确率和效率低的问题。通过管理模组将管理端下发的故障识别信息发送至代理组件中,并接收代理组件发送的故障日志,从而可以在管理模组中对多个代理组件发送的多个故障信息进行统一管理和识别,并在识别后通过故障日志确定故障原因,并根据故障原因和发生故障的软件产品确定故障的发生原因和解决方法,从而将解决方法发送至代理组件中解决软件产品的故障,进而通过对多个软件产品的故障进行统一处理,达到了提高故障的处理准确率和效率的效果。
在管理模组与多个软件产品的代理组件连接的情况下,为了保证故障日志的正常传输,可选地,在本申请实施例提供的软件产品的故障处理方法中,接收代理组件反馈的故障日志包括:在存在M个代理组件的情况下,确定每个代理组件反馈的故障日志中的数据的数据量,得到M个数据量,并计算M个数据量的和,得到总数据量,其中,M为正整数;判断总数据量是否大于预设数据量;在总数据量大于预设数据量的情况下,确定每个代理组件的权值,并按照权值由大到小的顺序依次获取每个代理组件反馈的故障日志。
需要说明的是,由于管理模组与多个软件产品的代理组件相连接,因此在多个代理组件同时向管理模组发送故障日志的情况下,可能由于数据流量过大导致管理模组在接受故障日志的时候出现异常。因此,在接收到M个代理组件同时发送的故障日志的情况下,需要通过消息队列将故障日志进行传输,从而实现流量的削峰填谷,保证故障数据的正常接收。
具体的,在接收到M个代理组件同时发送的故障日志的情况下,首先需要获取每个故障日志中的数据的数据量,得到M个数据量,并将M个数据量相加得到总数据量,从而通过总数据量确定当前能否同时接收M个数据量之和的数据量。在总数据量大于预设数据量的情况下,表征当前管理模组无法同时接收总数据量的故障日志,因此需要将多个故障日志按照队列顺序进行发送,在确定队列顺序的时候,可以采用确定每个代理组件的权值,并按照权值大小确定队列顺序,先传输权值大的故障日志,后传输权值小的故障日志,从而保证了每个故障日志均可以正确的被接收。
需要说明的是,在确定权值的时候,可以根据每个故障日志所属的软件产品的重要程度进行权值确定,重要程度越高的软件产品的权值越大,传输的优先级就越高。
可选地,在本申请实施例提供的软件产品的故障处理方法中,接收代理组件反馈的故障日志包括:在管理模组存在异常的情况下,向代理组件发送第一通知,其中,代理组件在接收到第一通知后将故障日志存储在代理组件的数据库中;在管理模组恢复正常的情况下,向代理组件发送第二通知,其中,代理组件在接收到第二通知后将故障日志发送至管理模组中。
具体的,由于管理模组可能会出现异常,导致无法正常接收故障日志,此时,管理模组会向与管理模组相连接的全部代理组件发送第一通知,从而表征管理模组此刻存在异常,无法接收故障日志,此时,在代理组件中生成故障日志的情况下,需要将故障日志存储在代理组件的数据库中,并在接收到第二通知的情况下,确定管理模组恢复正常,从而可以将存储的故障日志发送至管理模组中,并将代理组件的数据库中存储的数据删除,从而保证故障日志可以准确的传输至管理模组中。
可选地,在本申请实施例提供的软件产品的故障处理方法中,解析故障日志,得到软件产品的故障发生原因包括:解析故障日志,得到故障对象、故障信息,其中,故障信息至少包括以下之一:故障的发生次数,故障类型,发生时间点,发生场所;将故障对象和故障信息输入管理模组中的故障分析模型中,得到故障发生原因,其中,故障分析模型为分类模型,故障分析模型以多个历史故障发生原因以及每个历史故障发生原因对应的故障对象和故障信息作为样本训练得到。
具体的,在得到故障日志后,需要将故障日志进行解析,从而获取到与软件产品中发生的故障相关的故障信息和故障对象,其中,故障对象可以为发生故障的软件产品,故障信息可以为发生故障的相关信息,例如该故障的故障类型,发生时间点,发生场所、发生次数等信息,并根据上述信息在分类模型中进行故障原因分析,从而得到故障发生原因,进而可以根据故障发生原因对故障进行处理。
例如,在发生故障后,通过代理组件结合日志组织技术收集故障数据、故障上下文等故障信息,对收集到的故障信息进行多角度统计,如统计不同故障的发生次数,故障类型,发生时间点,发生场所等,再通过故障收集流程根据故障信息生成故障日志,并将故障日志发送至管理模组,管理模组对收集到的软件产品故障日志进行处理,为不同软件产品在不同时间段发生的故障提供查看故障上下文信息的功能,还原故障现场,还可以根据预留的监控规则和软件产品的故障统计结果自动触发监控报警,提高软件产品运维能力。
可选地,在本申请实施例提供的软件产品的故障处理方法中,将故障识别信息同步至代理组件中包括:在故障识别信息为新增信息的情况下,确定故障识别信息对应的软件产品,得到P个软件产品,并将故障识别信息发送至每个软件产品的代理组件中,其中,P为正整数,P小于等于M;在故障识别信息为修改信息的情况下,确定具有与故障识别信息相关联的待更新信息的代理组件,得到N个代理组件,并将故障识别信息发送至N个代理组件中,其中,故障识别信息用于替换待更新信息,待更新信息为代理组件中的异常信息。
具体的,在接收到故障识别信息为新增信息的情况下,也即需要在管理模组中原有存储的故障识别信息的基础上新增故障识别信息。此时,在管理模组完成故障识别信息的新增后,需要识别该新增的故障识别信息对应的软件产品,并将该新增的故障识别信息同步发送至故障识别信息对应的软件产品中的代理组件中,从而使得代理组件可以根据新增的故障识别信息对软件产品中的故障进行监控和识别。
进一步的,在接收到故障识别信息为修改信息的情况下,需要识别每个代理组件中已经存储的故障识别信息中是否存在待更新信息,并在存在待更新信息的情况下,将该故障识别信息发送至存在待更新信息的代理组件中,并将代理组件中给的待更新信息替换为故障识别信息,从而完成故障识别信息的更新操作。
可选地,在本申请实施例提供的软件产品的故障处理方法中,根据故障发生原因确定修改操作包括:在故障发生原因指示配置软件产品的设备存在设备异常的情况下,根据预设对照表确定故障发生原因对应的故障编码,并将故障编码发送至软件产品的厂商;在故障发生原因指示软件产品存在操作异常的情况下,向软件产品发送告警信息,并通过软件产品展示告警信息,其中,告警信息中包括故障发生原因以及提示信息,提示信息用于提示软件产品的使用方对软件产品的正确操作方法。
具体的,在配置软件产品的设备发生故障的情况下,由于无法对设备进行处理,因此,需要获取故障发生原因对应的编码,并将编码发送至厂商进行处理,在检测到是软件产品操作异常产生的故障的情况下,确定需要向软件产品发送的告警信息,从而可以在软件产品中显示告警信息告知用户如何进行正确操作,避免故障再次发生。
可选地,在本申请实施例提供的软件产品的故障处理方法中,代理组件监控软件产品的运行数据,并在运行数据存在异常的情况下,从软件产品的数据库中获取预设时间间隔内的软件产品的运行信息,得到故障信息,并将故障信息进行标准化,得到故障日志。
具体的,代理组件在检测到软件产品的运行数据存在异常的情况下,需要确定异常发生时间,并以异常发生时间为中心时刻确定预设时间间隔,并获取预设时间间隔内的软件产品运行信息,从而将该运行信息确定为故障信息,并将故障信息进行标准化,例如数据去重,数据清洗,格式转换等标准化操作,从而得到可以向管理模组发送的故障日志。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种软件产品的故障处理装置,需要说明的是,本申请实施例的软件产品的故障处理装置可以用于执行本申请实施例所提供的用于软件产品的故障处理方法。以下对本申请实施例提供的软件产品的故障处理装置进行介绍。
图3是根据本申请实施例提供的软件产品的故障处理装置的示意图。如图3所示,该装置包括:接收单元31,解析单元32,确定单元33。
接收单元31,用于接收管理端下发的故障识别信息,并将故障识别信息同步至代理组件中,其中,代理组件配置在软件产品中,故障识别信息用于指示识别软件产品是否发生故障,并指示获取发生故障时的故障信息。
解析单元32,用于接收代理组件反馈的故障日志,并解析故障日志,得到软件产品的故障发生原因,其中,故障日志为代理组件根据软件产品发生故障时的故障信息生成的日志。
确定单元33,用于根据故障发生原因确定修改操作,其中,修改操作是指对软件产品执行的修改操作。
本申请实施例提供的软件产品的故障处理装置,通过接收单元31接收管理端下发的故障识别信息,并将故障识别信息同步至代理组件中,其中,代理组件配置在软件产品中,故障识别信息用于指示识别软件产品是否发生故障,并指示获取发生故障时的故障信息;解析单元32接收代理组件反馈的故障日志,并解析故障日志,得到软件产品的故障发生原因,其中,故障日志为代理组件根据软件产品发生故障时的故障信息生成的日志;确定单元33根据故障发生原因确定修改操作,其中,修改操作是指对软件产品执行的修改操作。解决了相关技术中通过分别对每个软件产品的故障原因单独进行处理的准确率和效率低的问题。通过管理模组将管理端下发的故障识别信息发送至代理组件中,并接收代理组件发送的故障日志,从而可以在管理模组中对多个代理组件发送的多个故障信息进行统一管理和识别,并在识别后通过故障日志确定故障原因,并根据故障原因和发生故障的软件产品确定故障的发生原因和解决方法,从而将解决方法发送至代理组件中解决软件产品的故障,进而通过对多个软件产品的故障进行统一处理,达到了提高故障的处理准确率和效率的效果。
可选地,在本申请实施例提供的软件产品的故障处理装置中,解析单元32包括:第一确定模块,用于在存在M个代理组件的情况下,确定每个代理组件反馈的故障日志中的数据的数据量,得到M个数据量,并计算M个数据量的和,得到总数据量,其中,M为正整数;判断模块,用于判断总数据量是否大于预设数据量;第二确定模块,用于在总数据量大于预设数据量的情况下,确定每个代理组件的权值,并按照权值由大到小的顺序依次获取每个代理组件反馈的故障日志。
可选地,在本申请实施例提供的软件产品的故障处理装置中,解析单元32包括:第一发送模块,用于在管理模组存在异常的情况下,向代理组件发送第一通知,其中,代理组件在接收到第一通知后将故障日志存储在代理组件的数据库中;第二发送模块,用于在管理模组恢复正常的情况下,向代理组件发送第二通知,其中,代理组件在接收到第二通知后将故障日志发送至管理模组中。
可选地,在本申请实施例提供的软件产品的故障处理装置中,解析单元32包括:解析模块,用于解析故障日志,得到故障对象、故障信息,其中,故障信息至少包括以下之一:故障的发生次数,故障类型,发生时间点,发生场所;输入模块,用于将故障对象和故障信息输入管理模组中的故障分析模型中,得到故障发生原因,其中,故障分析模型为分类模型,故障分析模型以多个历史故障发生原因以及每个历史故障发生原因对应的故障对象和故障信息作为样本训练得到。
可选地,在本申请实施例提供的软件产品的故障处理装置中,接收单元31包括:第三确定模块,用于在故障识别信息为新增信息的情况下,确定故障识别信息对应的软件产品,得到P个软件产品,并将故障识别信息发送至每个软件产品的代理组件中,其中,P为正整数,P小于等于M;第四确定模块,用于在故障识别信息为修改信息的情况下,确定具有与故障识别信息相关联的待更新信息的代理组件,得到N个代理组件,并将故障识别信息发送至N个代理组件中,其中,故障识别信息用于替换待更新信息,待更新信息为代理组件中的异常信息。
可选地,在本申请实施例提供的软件产品的故障处理装置中,确定单元33包括:第三发送模块,用于在故障发生原因指示配置软件产品的设备存在设备异常的情况下,根据预设对照表确定故障发生原因对应的故障编码,并将故障编码发送至软件产品的厂商;告警模块,用于在故障发生原因指示软件产品存在操作异常的情况下,向软件产品发送告警信息,并通过软件产品展示告警信息,其中,告警信息中包括故障发生原因以及提示信息,提示信息用于提示软件产品的使用方对软件产品的正确操作方法。
可选地,在本申请实施例提供的软件产品的故障处理装置中,代理组件监控软件产品的运行数据,并在运行数据存在异常的情况下,从软件产品的数据库中获取预设时间间隔内的软件产品的运行信息,得到故障信息,并将故障信息进行标准化,得到故障日志。
上述软件产品的故障处理装置包括处理器和存储器,上述接收单元31,解析单元32,确定单元33等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决了相关技术中通过分别对每个软件产品的故障原因单独进行处理的准确率和效率低的问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现所述软件产品的故障处理方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述软件产品的故障处理方法。
如图4所示,本发明实施例提供了一种电子设备,电子设备40包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:接收管理端下发的故障识别信息,并将故障识别信息同步至代理组件中,其中,代理组件配置在软件产品中,故障识别信息用于指示识别软件产品是否发生故障,并指示获取发生故障时的故障信息;接收代理组件反馈的故障日志,并解析故障日志,得到软件产品的故障发生原因,其中,故障日志为代理组件根据软件产品发生故障时的故障信息生成的日志;根据故障发生原因确定修改操作,其中,修改操作是指对软件产品执行的修改操作。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:接收管理端下发的故障识别信息,并将故障识别信息同步至代理组件中,其中,代理组件配置在软件产品中,故障识别信息用于指示识别软件产品是否发生故障,并指示获取发生故障时的故障信息;接收代理组件反馈的故障日志,并解析故障日志,得到软件产品的故障发生原因,其中,故障日志为代理组件根据软件产品发生故障时的故障信息生成的日志;根据故障发生原因确定修改操作,其中,修改操作是指对软件产品执行的修改操作。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (11)

1.一种软件产品的故障处理方法,其特征在于,应用于管理模组,包括:
接收管理端下发的故障识别信息,并将所述故障识别信息同步至代理组件中,其中,所述代理组件配置在软件产品中,所述故障识别信息用于指示识别所述软件产品是否发生故障,并指示获取发生故障时的故障信息;
接收所述代理组件反馈的故障日志,并解析所述故障日志,得到所述软件产品的故障发生原因,其中,所述故障日志为所述代理组件根据所述软件产品发生故障时的故障信息生成的日志;
根据所述故障发生原因确定修改操作,其中,所述修改操作是指对所述软件产品执行的修改操作。
2.根据权利要求1所述的方法,其特征在于,接收所述代理组件反馈的故障日志包括:
在存在M个代理组件的情况下,确定每个代理组件反馈的故障日志中的数据的数据量,得到M个数据量,并计算所述M个数据量的和,得到总数据量,其中,M为正整数;
判断所述总数据量是否大于预设数据量;
在所述总数据量大于所述预设数据量的情况下,确定每个代理组件的权值,并按照所述权值由大到小的顺序依次获取每个代理组件反馈的故障日志。
3.根据权利要求1所述的方法,其特征在于,接收所述代理组件反馈的故障日志包括:
在所述管理模组存在异常的情况下,向所述代理组件发送第一通知,其中,所述代理组件在接收到所述第一通知后将所述故障日志存储在所述代理组件的数据库中;
在所述管理模组恢复正常的情况下,向所述代理组件发送第二通知,其中,所述代理组件在接收到所述第二通知后将所述故障日志发送至所述管理模组中。
4.根据权利要求1所述的方法,其特征在于,解析所述故障日志,得到所述软件产品的故障发生原因包括:
解析所述故障日志,得到故障对象、故障信息,其中,所述故障信息至少包括以下之一:故障的发生次数,故障类型,发生时间点,发生场所;
将所述故障对象和所述故障信息输入所述管理模组中的故障分析模型中,得到所述故障发生原因,其中,所述故障分析模型为分类模型,所述故障分析模型以多个历史故障发生原因以及每个历史故障发生原因对应的故障对象和故障信息作为样本训练得到。
5.根据权利要求1所述的方法,其特征在于,将所述故障识别信息同步至代理组件中包括:
在所述故障识别信息为新增信息的情况下,确定所述故障识别信息对应的软件产品,得到P个软件产品,并将所述故障识别信息发送至每个软件产品的代理组件中,其中,P为正整数,P小于等于M;
在所述故障识别信息为修改信息的情况下,确定具有与所述故障识别信息相关联的待更新信息的代理组件,得到N个代理组件,并将所述故障识别信息发送至所述N个代理组件中,其中,所述故障识别信息用于替换所述待更新信息,所述待更新信息为所述代理组件中的异常信息。
6.根据权利要求1所述的方法,其特征在于,根据所述故障发生原因确定修改操作包括:
在所述故障发生原因指示配置所述软件产品的设备存在设备异常的情况下,根据预设对照表确定所述故障发生原因对应的故障编码,并将所述故障编码发送至所述软件产品的厂商;
在所述故障发生原因指示所述软件产品存在操作异常的情况下,向所述软件产品发送告警信息,并通过所述软件产品展示所述告警信息,其中,所述告警信息中包括所述故障发生原因以及提示信息,所述提示信息用于提示所述软件产品的使用方对所述软件产品的正确操作方法。
7.根据权利要求1所述的方法,其特征在于,所述代理组件监控所述软件产品的运行数据,并在所述运行数据存在异常的情况下,从所述软件产品的数据库中获取预设时间间隔内的所述软件产品的运行信息,得到故障信息,并将所述故障信息进行标准化,得到所述故障日志。
8.一种软件产品的故障处理系统,其特征在于,包括:
管理端,用于向管理模组下发故障识别信息,其中,所述故障识别信息用于指示识别所述软件产品是否发生故障,并指示获取发生故障时的故障信息;
所述管理模组,与管理端和代理组件连接,用于接收管理端下发的故障识别信息,并将所述故障识别信息同步至所述代理组件中,并接收所述代理组件反馈的故障日志,并解析所述故障日志,得到所述软件产品的故障发生原因,并根据所述故障发生原因确定修改操作;
所述代理组件,与所述管理模组连接,设置在软件产品中,用于根据所述故障识别信息识别所述软件产品是否发生故障,并在所述软件产品发生故障的情况下根据故障信息生成故障日志,并将所述故障日志发送至所述管理模组。
9.一种软件产品的故障处理装置,其特征在于,包括:
接收单元,用于接收管理端下发的故障识别信息,并将所述故障识别信息同步至代理组件中,其中,所述代理组件配置在软件产品中,所述故障识别信息用于指示识别所述软件产品是否发生故障,并指示获取发生故障时的故障信息;
解析单元,用于接收所述代理组件反馈的故障日志,并解析所述故障日志,得到所述软件产品的故障发生原因,其中,所述故障日志为所述代理组件根据所述软件产品发生故障时的故障信息生成的日志;
确定单元,用于根据所述故障发生原因确定修改操作,其中,所述修改操作是指对所述软件产品执行的修改操作。
10.一种计算机存储介质,其特征在于,所述计算机存储介质用于存储程序,其中,所述程序运行时控制所述计算机存储介质所在的设备执行权利要求1至7中任意一项所述的软件产品的故障处理方法。
11.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的软件产品的故障处理方法。
CN202310955298.0A 2023-07-31 2023-07-31 软件产品的故障处理方法、系统、装置以及存储介质 Pending CN116954975A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310955298.0A CN116954975A (zh) 2023-07-31 2023-07-31 软件产品的故障处理方法、系统、装置以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310955298.0A CN116954975A (zh) 2023-07-31 2023-07-31 软件产品的故障处理方法、系统、装置以及存储介质

Publications (1)

Publication Number Publication Date
CN116954975A true CN116954975A (zh) 2023-10-27

Family

ID=88448969

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310955298.0A Pending CN116954975A (zh) 2023-07-31 2023-07-31 软件产品的故障处理方法、系统、装置以及存储介质

Country Status (1)

Country Link
CN (1) CN116954975A (zh)

Similar Documents

Publication Publication Date Title
US9038030B2 (en) Methods for predicting one or more defects in a computer program and devices thereof
CN110088744B (zh) 一种数据库维护方法及其系统
CN110046073B (zh) 一种日志采集方法及装置、设备、存储介质
CN108628748B (zh) 自动化测试管理方法和自动化测试管理系统
US11449488B2 (en) System and method for processing logs
US20160274997A1 (en) End user monitoring to automate issue tracking
CN108038039B (zh) 记录日志的方法及微服务系统
CN110851471A (zh) 分布式日志数据处理方法、装置以及系统
US10372572B1 (en) Prediction model testing framework
CN107168844B (zh) 一种性能监控的方法及装置
WO2014204470A1 (en) Generating a fingerprint representing a response of an application to a simulation of a fault of an external service
CN116194894A (zh) 原生云应用程序的故障定位
CN109274533B (zh) 一种基于规则引擎的Web服务故障的定位装置和方法
CN115757138A (zh) 脚本异常原因的确定方法、装置、存储介质以及电子设备
CN116954975A (zh) 软件产品的故障处理方法、系统、装置以及存储介质
CN114500249A (zh) 一种根因定位方法和装置
CN113934595A (zh) 数据分析方法及系统、存储介质及电子终端
CN112631929A (zh) 测试用例生成方法、装置、存储介质及电子设备
CN110362464B (zh) 软件分析方法及设备
CN112286792A (zh) 一种接口测试方法、装置、设备和存储介质
CN110908918A (zh) 针对多个相互依赖的node.js模块的单元测试方法及装置
CN117130945B (zh) 一种测试方法和装置
CN111967961B (zh) 一种数据挖掘方法和装置
CN112363870B (zh) 应用程序开发处理方法、装置、计算机设备和存储介质
CN118152190A (zh) 灾备应用的管理方法、装置、存储介质以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination