CN117149501B - 问题修复系统及方法 - Google Patents

问题修复系统及方法 Download PDF

Info

Publication number
CN117149501B
CN117149501B CN202311426450.2A CN202311426450A CN117149501B CN 117149501 B CN117149501 B CN 117149501B CN 202311426450 A CN202311426450 A CN 202311426450A CN 117149501 B CN117149501 B CN 117149501B
Authority
CN
China
Prior art keywords
information
layer
root cause
service
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311426450.2A
Other languages
English (en)
Other versions
CN117149501A (zh
Inventor
喻春萍
庞军
于妮妮
黄威
吴飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Post Consumer Finance Co ltd
Original Assignee
China Post Consumer Finance Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Post Consumer Finance Co ltd filed Critical China Post Consumer Finance Co ltd
Priority to CN202311426450.2A priority Critical patent/CN117149501B/zh
Publication of CN117149501A publication Critical patent/CN117149501A/zh
Application granted granted Critical
Publication of CN117149501B publication Critical patent/CN117149501B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及软件测试技术领域,公开了一种问题修复系统及方法,该系统包括用户交互层、问题定位层和基础模型层;用户交互层接收用户的问题关键信息并发送至问题定位层;问题定位层根据问题关键信息抓取问题定位信息;基础模型层根据问题定位信息采集各业务平台的业务信息,对业务信息进行聚类分析,获得问题根因并发送至问题定位层;问题定位层根据问题根因对问题关键信息对应的问题节点进行修复。由于本发明通过问题定位层从对应的日志平台抓取问题定位信息,再通过基础模型层分析问题定位信息的问题根因,最后通过问题定位层对问题节点进行修复,减少了人工参与测试的环节,使整个问题处理流程自动化,提升了问题解决效率,有助于软件效能提升。

Description

问题修复系统及方法
技术领域
本发明涉及软件测试技术领域,尤其涉及一种问题修复系统及方法。
背景技术
随着科技的进步,出现了各种各样的软件产品,给人们的生活带来了很多便利。一个软件产品通常要经过软件测试后发布到线上运行,由于软件测试环境和线上环境并不完全相同,因此,软件产品发布到线上运行后,可能会出现各种问题,如开发的业务系统出现系统bug、功能不符合业务预期、面临新需求等。
在日常需求测试中,环境问题解决的效率对测试执行进度起着至关重要的作用,尤其在金融软件测试领域,需求迭代快,且业务流程长,执行一个测试案例通常都要跨很多个系统,一旦某个系统的环境出现问题,相应案例执行就受阻。在传统的解决方式中,对于各类系统的问题,普遍没有一种规范的管理方法,往往是人工通过各种途径反馈到研发团队,再线下找到对应的系统相应人员对系统环境进行测试处理,此过程费时费力,效率低下。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供了一种问题修复系统及方法,旨在解决传统的对于各类系统的问题,一般是人工通过各种途径反馈,再线下找到对应的人员进行测试处理,过程费时费力,效率低下的技术问题。
为实现上述目的,本发明提供了一种问题修复系统,所述问题修复系统包括:用户交互层、问题定位层和基础模型层;
所述用户交互层,用于接收用户的问题关键信息,并将所述问题关键信息发送至所述问题定位层;
所述问题定位层,用于根据所述问题关键信息从对应的日志平台抓取问题定位信息,并将所述问题定位信息发送至所述基础模型层;
所述基础模型层,用于根据所述问题定位信息采集各业务平台的业务信息,对所述业务信息进行聚类分析,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层;
所述问题定位层,还用于根据所述问题根因对所述问题关键信息对应的问题节点进行修复。
可选地,所述问题定位信息包括交易链路信息、业务配置信息和接口定义信息,所述问题定位层包括:问题根因分析模块;
所述问题根因分析模块,用于根据所述问题关键信息从对应的日志平台抓取对应的交易日志;
所述问题根因分析模块,还用于根据所述交易日志抓取所述问题关键信息对应的全局交易ID,并根据所述全局交易ID获取所述问题关键信息对应的交易链路信息;
所述问题根因分析模块,还用于根据所述交易链路信息抓取所述问题关键信息对应的接口定义信息;
所述问题根因分析模块,还用于根据所述交易链路信息获取各业务平台对应的业务配置信息;
所述问题根因分析模块,还用于将所述交易链路信息、所述业务配置信息和所述接口定义信息发送至所述基础模型层。
可选地,所述基础模型层包括:结果预测模块;
所述结果预测模块,用于根据所述交易链路信息、所述业务配置信息和所述接口定义信息对各业务平台进行数据采集,获得业务信息;
所述结果预测模块,还用于通过预设特征提取算法对所述业务信息进行特征分析,获得问题特征信息;
所述结果预测模块,还用于通过预设神经网络模型对所述问题特征信息进行预测,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层。
可选地,所述基础模型层还包括:数据采集处理模块和聚类分析模块;
所述数据采集处理模块,用于根据所述问题定位信息对各业务平台进行数据采集,获得应用日志信息;
所述数据采集处理模块,还用于根据预设特征提取算法对所述应用日志信息进行特征提取,获得所述应用日志信息对应的特征数据;
所述聚类分析模块,用于通过所述特征数据对初始神经网络模型进行训练,获得预设神经网络模型。
可选地,所述数据采集处理模块,还用于对所述应用日志信息进行分词处理,获得分词数据集合;
所述数据采集处理模块,还用于对所述分词数据集合进行数据清洗,获得清洗后的分词数据集合;
所述数据采集处理模块,还用于通过预设特征提取算法对所述清洗后的分词数据集合进行聚类分析,获得所述应用日志信息对应的特征数据。
可选地,所述问题定位层还包括:问题自动修复模块;
所述问题自动修复模块,用于对所述问题根因进行分类打标,获得所述问题根因对应的分类标识,所述分类标识包括自动修复标识和非自动修复标识;
所述问题自动修复模块,还用于在所述分类标识为所述自动修复标识时,根据所述分类标识确定所述问题根因对应的自动修复策略,并根据所述自动修复策略对所述问题关键信息对应的问题节点进行修复;
所述问题自动修复模块,还用于在所述分类标识为所述非自动修复标识时,根据所述问题根因和所述问题关键信息调用预设通讯接口进行修复告警。
可选地,所述用户交互层包括:交互式应答模块和交互式满意度调查模块;
所述交互式应答模块,用于接收用户的问题关键信息,并将所述问题关键信息发送至所述问题定位层;
所述交互式满意度调查模块,用于在所述问题节点修复结束时,获取所述用户的反馈信息;
所述交互式满意度调查模块,还用于根据所述反馈信息更新所述预设神经网络模型的模型参数,并根据所述模型参数对所述预设神经网络模型进行优化,获得优化后的预设神经网络模型。
此外,为实现上述目的,本发明还提出一种问题修复方法,所述问题修复方法应用于问题修复系统,所述系统包括用户交互层、问题定位层和基础模型层;所述方法包括:
所述用户交互层接收用户的问题关键信息,并将所述问题关键信息发送至所述问题定位层;
所述问题定位层根据所述问题关键信息从对应的日志平台抓取问题定位信息,并将所述问题定位信息发送至所述基础模型层;
所述基础模型层根据所述问题定位信息采集各业务平台的业务信息,对所述业务信息进行聚类分析,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层;
所述问题定位层根据所述问题根因对所述问题关键信息对应的问题节点进行修复。
可选地,所述问题定位信息包括交易链路信息、业务配置信息和接口定义信息,所述问题定位层包括问题根因分析模块;所述问题定位层根据所述问题关键信息从对应的日志平台抓取问题定位信息,并将所述问题定位信息发送至所述基础模型层,包括:
所述问题根因分析模块根据所述问题关键信息从对应的日志平台抓取对应的交易日志,并根据所述交易日志抓取所述问题关键信息对应的全局交易ID;
所述问题根因分析模块根据所述全局交易ID获取所述问题关键信息对应的交易链路信息,并根据所述交易链路信息抓取所述问题关键信息对应的接口定义信息;
所述问题根因分析模块根据所述交易链路信息获取各业务平台对应的业务配置信息,并将所述交易链路信息、所述业务配置信息和所述接口定义信息发送至所述基础模型层。
可选地,所述基础模型层包括结果预测模块;所述基础模型层根据所述问题定位信息采集各业务平台的业务信息,对所述业务信息进行聚类分析,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层,包括:
所述结果预测模块根据所述交易链路信息、所述业务配置信息和所述接口定义信息对各业务平台进行数据采集,获得业务信息;
所述结果预测模块通过预设特征提取算法对所述业务信息进行特征分析,获得问题特征信息;
所述结果预测模块通过预设神经网络模型对所述问题特征信息进行预测,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层。
本发明提出了一种问题修复系统,所述问题修复系统包括:用户交互层、问题定位层和基础模型层;所述用户交互层,用于接收用户的问题关键信息,并将所述问题关键信息发送至所述问题定位层;所述问题定位层,用于根据所述问题关键信息从对应的日志平台抓取问题定位信息,并将所述问题定位信息发送至所述基础模型层;所述基础模型层,用于根据所述问题定位信息采集各业务平台的业务信息,对所述业务信息进行聚类分析,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层;所述问题定位层,还用于根据所述问题根因对所述问题关键信息对应的问题节点进行修复。由于本发明通过问题定位层从对应的日志平台抓取问题定位信息,再通过基础模型层分析问题定位信息的问题根因,最后通过问题定位层对问题节点进行修复,减少了人工参与测试的环节,使整个问题处理流程自动化,大大提升了问题解决效率。
附图说明
图1为本发明问题修复系统第一实施例的结构框图;
图2为本发明问题修复系统第二实施例的结构框图;
图3为本发明问题修复系统第二实施例中问题定位层的处理逻辑图;
图4为本发明问题修复系统第二实施例中基础模型层的处理逻辑图;
图5为本发明问题修复方法第一实施例的流程示意图;
图6为本发明问题修复方法第二实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明实施例提供了一种问题修复系统,参照图1,图1为本发明问题修复系统第一实施例的结构框图。
需要说明的是,在日常需求测试中,环境问题解决的效率对测试执行进度起着至关重要的作用,一般执行一个测试案例通常都要跨很多个系统,一旦某个系统的环境出现问题,相应案例执行就受阻。在传统的解决方式中,是在测试人员执行过程中出现问题线下找到对应的系统相应人员进行处理,此种方式存在多种弊端:一是线下沟通效率低下,问题都通过人工表述传达,信息一层层传递可能造成衰减,导致信息差;二是最终问题还是要由对应系统人员人工处理,由于目前各系统都是采用分布式部署,应用间的调用关系错综复杂,要人为去分析问题根因,效率比较低下,且受处理人自身经验能力等约束,处理人虽投入了时间精力却未必能定位到问题根因;三是整个问题处理过程会存在过多等待的时间,问题处理人提出问题到问题处理人真正开始处理存在等待,问题处理人处理到最终定位根因存在等待,问题处理人根据根因进行修复存在等待,且每个等待的时间因都是无法预估的,问题处理人因为当前问题执行案例受阻,又无法快速知道问题根因,无法评估当前问题是否对接下来其他案例有影响,导致无法判断是否可以在等待问题处理过程中先执行其他的案例,从而无法确定如何调整下一步的测试计划,严重影响了测试效率。因此,本发明实施例提出了一种问题修复系统,将原本需线下人工处理的问题转移到线上以自动化方式处理,以提升问题处理效率。
本实施例中,所述问题修复系统包括:用户交互层10、问题定位层20和基础模型层30;
所述用户交互层10,用于接收用户的问题关键信息,并将所述问题关键信息发送至所述问题定位层。
需要说明的是,用户交互层是问题修复系统中负责与用户进行交互的模块,在软件环境出现问题时,用户通过用户交互层可将出现问题的位置和信息上传至问题修复系统中,并获得相应的反馈和结果,从而使用户能够方便、直观地与系统进行沟通和操作,而无需了解底层的技术细节。
可理解的是,问题关键信息是软件环境出现问题时,所需的重要或核心的描述问题的信息,系统可基于问题关键信息更准确地定位问题并找到相应的解决方法。
所述问题定位层20,用于根据所述问题关键信息从对应的日志平台抓取问题定位信息,并将所述问题定位信息发送至所述基础模型层。
可理解的是,问题定位层是在故障排除过程中,用于确定问题根本原因的模块,通过问题定位层可追踪引起软件系统故障、错误或异常行为的具体位置。
应理解的是,问题定位信息是问题定位层根据问题关键信息获得的位置信息,包括问题关键信息对应的应用日志、业务配置等信息。
在具体实现中,问题定位层在接收到来自用户交互层的问题关键信息后,可根据此信息获取相应的业务系统的应用日志、业务配置等信息,然后调用基础模型库中的模型以获取到问题根因。此时,可基于问题根因对当前问题进行自动修复,并响应最终处理结果给用户交互层,对于无法自动修复处理一般人工介入的问题,可通过通讯工具通知相应环境接口人进行处理。
所述基础模型层30,用于根据所述问题定位信息采集各业务平台的业务信息,对所述业务信息进行聚类分析,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层。
所述问题定位层20,还用于根据所述问题根因对所述问题关键信息对应的问题节点进行修复。
需要说明的是,基础模型层是设有进行问题分析的模型的模块,通过基础模型层根据问题定位信息去获取日志平台日志,数据库数据记录,配置中心配置以及接口平台定义等数据,将其输入至模型中,从而可获得当前问题的问题根本原因,以实现快速获取问题根因的目的。
需要说明的是,业务信息是基础模型层根据问题定位信息获取的信息,例如日志平台日志,数据库数据记录,配置中心配置以及接口平台定义等信息。
在实际实现中,基础模型层根据所述问题定位信息采集各业务平台的业务信息,包括日志平台日志,数据库数据记录,配置中心配置以及接口平台定义等信息。接着将所述业务信息输入至模型中进行聚类分析,获得所述问题关键信息对应的问题根因,以实现快速获取问题根因的目的。最后问题定位层根据所述问题根因对所述问题关键信息对应的问题节点进行修复,同时将最终处理结果反馈至用户交互层,最终展示给用户。
本实施例问题定位层在接收到来自用户交互层的问题关键信息后,可根据此信息获取相应的业务系统的应用日志、业务配置等信息,然后调用基础模型库中的模型以获取到问题根因,基础模型层根据所述问题定位信息采集各业务平台的业务信息,包括日志平台日志,数据库数据记录,配置中心配置以及接口平台定义等信息。接着将所述业务信息输入至模型中进行聚类分析,获得所述问题关键信息对应的问题根因,以实现快速获取问题根因的目的。最后问题定位层根据所述问题根因对所述问题关键信息对应的问题节点进行修复,同时将最终处理结果反馈至用户交互层,最终展示给用户。对于无法自动修复处理一般人工介入的问题,可通过通讯工具通知相应环境接口人进行处理。由于本实施例通过问题定位层从对应的日志平台抓取问题定位信息,再通过基础模型层分析问题定位信息的问题根因,最后通过问题定位层对问题节点进行修复,减少了人工参与测试的环节,使整个问题处理流程自动化,大大提升了问题解决效率。
参考图2,图2为本发明问题修复系统第二实施例的结构框图。
基于上述第一实施例,在本实施例中,考虑到问题定位的准确性,所述问题定位信息包括交易链路信息、业务配置信息和接口定义信息,如图2所示,所述问题定位层包括20:问题根因分析模块;
所述问题根因分析模块,用于根据所述问题关键信息从对应的日志平台抓取对应的交易日志。
所述问题根因分析模块,还用于根据所述交易日志抓取所述问题关键信息对应的全局交易ID,并根据所述全局交易ID获取所述问题关键信息对应的交易链路信息。
所述问题根因分析模块,还用于根据所述交易链路信息抓取所述问题关键信息对应的接口定义信息。
需要说明的是,全局交易ID(Global Transaction ID)是在当前问题所在软件系统中的用于唯一标识的全局事务的标识符。由于出现问题的软件系统每个服务或组件都可能生成自己的本地事务ID,因此一般会通过全局交易ID确保全局事务的一致性,将本地事务与该全局事务进行关联。因此可通过全局交易ID追踪和监控当前问题的事务的状态,为故障排查和日志分析提供了便利。
可理解的是,交易日志(Transaction log)是在计算机系统中记录所有事务操作的一种数据日志,通过交易日志可对当前问题进行追踪,以提供故障恢复的数据。
应理解的是,交易链路信息(Transaction Trace Information)是指在当前问题所在计算机系统中跟踪和记录完整事务的相关信息,通过收集和分析交易链路信息,可深入分析当前问题所在系统的复杂事务的执行情况,可快速定位和解决问题。
可理解的是,接口定义信息(Interface Definition Information)是描述当前问题所在软件系统中接口的规范、结构和行为的相关信息。通过接口定义信息问题修复系统可与当前问题所在系统进行正确地交互和通信,获取当前问题的具体数据。
所述问题根因分析模块,还用于根据所述交易链路信息获取各业务平台对应的业务配置信息。
所述问题根因分析模块,还用于将所述交易链路信息、所述业务配置信息和所述接口定义信息发送至所述基础模型层。
需要说明的是,业务配置信息(Business Configuration Information)是当前问题所在软件系统中用于配置和定义特定业务逻辑、规则和行为的相关数据和参数,通过业务配置信息可获取当前问题所在不同业务场景的信息,以提高问题分析的准确性。
在具体实现中,如图3所示,图3为本发明问题修复系统第二实施例中问题定位层的处理逻辑图。问题根因分析模块接收商城传过来的问题关键信息后,根据问题关键信息去日志平台抓取日志平台日志,如抓取到相应日志,则从日志抓取该笔交易的全局交易ID,再以全局交易ID作为关键信息去抓取该交易完整的交易链路以分析接口平台数据,通过交易链路进一步分析出整个链路的接口调用链路,根据链路中调用的接口去接口平台抓取接口定义,并根据交易链路中所涉及到的系统去配置中心获取各系统的业务配置,并对获取的以上数据进行预处理,调用所述基础模型层的模型获得问题的根因。从而可根据抓取的交易链路日志、业务配置和接口定义按照模型来分析数据库信息,提高问题分析以及修复的准确性。
进一步地,如图2所示,本实施例中所述基础模型层包括30:结果预测模块;所述结果预测模块,用于根据所述交易链路信息、所述业务配置信息和所述接口定义信息对各业务平台进行数据采集,获得业务信息;所述结果预测模块,还用于通过预设特征提取算法对所述业务信息进行特征分析,获得问题特征信息;所述结果预测模块,还用于通过预设神经网络模型对所述问题特征信息进行预测,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层。
需要说明的是,问题特征信息结果预测模块对业务信息进行特征提取获得的信息。由于业务信息中每个文本都包含一些表达主题的独立属性,这些独立属性可被称为特征项,通过对业务信息进行特征提取,以提高模型进行聚类分析的精度。
可理解的是,预设神经网络模型是预先设置的基于人工神经元和连接权重构成的数学模型,可实现对问题特征信息的分析,获得所述问题关键信息对应的问题根因。通过预设神经网络模型可快速定位当次提问问题的根因信息。
在具体实现中,结果预测模块根据用户输入的信息,去日志平台、接口平台等应用抓取到与用户“提问”信息相关的应用执行日志,在对业务信息进行特征提取处理后,通过预设神经网络模型快速定位当次提问问题的根因信息,并响应给用户。从而通过模型能够快速精准的获取的问题根因,并提供自动修复的能力,大大减少人工线下沟通的时间、人工线下分析定位的时间、人工线下处理时间,有效提升了问题处理效率,有助于软件测试效率提升。
进一步地,考虑到模型的训练精度,如图2和图4所示,图4为本发明问题修复系统第二实施例中基础模型层的处理逻辑图。本实施例中所述基础模型层30还包括:数据采集处理模块和聚类分析模块;所述数据采集处理模块,用于根据所述问题定位信息对各业务平台进行数据采集,获得应用日志信息;所述数据采集处理模块,还用于根据预设特征提取算法对所述应用日志信息进行特征提取,获得所述应用日志信息对应的特征数据;所述聚类分析模块,用于通过所述特征数据对初始神经网络模型进行训练,获得预设神经网络模型。
需要说明的是,预设特征提取算法是从原始数据中提取有意义、可区分并具有代表性的特征的算法。通过预设特征提取算法可改善应用日志信息的数据容量,减少冗余信息,并提高后续模型分析问题根因的效率。
可理解的是,所述数据采集处理模块,可通过实时异步采集各业务系统的业务日志,业务配置、接口定义等数据,并进行离线分析、数据分词、数据清洗等步骤对数据进行预处理,其中获取的应用日志为全交易链路的日志,交易日志中包含日志唯一标识traceId,该ID可以获取当前问题的请求调用了哪些系统的哪些应用,也能分析出最终交易是在哪个系统的哪个应用断掉的。获取到相关信息后,可对采集到的数据进行预处理,进行预处理后通过特征提取算法进行特征提取、特征选择等操作以作为聚类分析模块的输入。
应理解的是,所述聚类分析模块,以所述数据采集处理模块处理后的数据作为模型训练数据集,并以学习率、批次大小、训练时长等方式,根据用户使用反馈改变训练数据,并调整模型架构或模型参数或增加训练时间等方法改善模型性能,以达到快速获取问题根因的目的,提高模型根据用户反馈自适应学习的能力。
为便于理解,以具体的聚类分析过程为例进行说明,但不对本实施例进行限定。如图3所示,聚类分析模块以数据采集处理模块的数据作为训练数据集,以训练出一个基本模型,训练算法可选择有监督的反馈神经网络算法,其具体步骤为:1、从输入训练集中取一个样本(Mi,Ni),其中Mi是输入,Ni是期望输出。2、计算网络的实际输出。3、计算实际输出和期望输出的差异。4、根据差异调整模型参数。5、对各输入数据集重复上述过程,直到整个训练集的误差不超过固定范围,在训练过程可不断调整学习率、批次大小、训练时长等因素,并根据用户反馈人工标注后,调整模型相关参数不断优化模型输出。所述预测模块对当前问题所对应的信息进行数据清洗、特征提取、特征选择等操作后进行结果预测,测得用户所提问题的根因,并响应给用户交互层,最终展示给用户。
在具体实现中,数据采集处理模块通过实时异步采集各业务系统的业务日志、业务配置并进行预处理后进行特征提取;聚类分析模块以所述数据采集处理模块处理后的数据作为模型训练数据集,并以学习率、批次大小、训练时长等方式,并根据用户使用反馈改变训练数据、调整模型架构或增加训练时间等方法改善模型性能,以达到快速获取问题根因的目的。最后所述预测模块根据用户交互层中用户的“提问”信息预测用户所提问题的根因,并响应给用户交互层,最终展示给用户。从而通过对模型进行训练,调整模型架构或模型参数或增加训练时间等方法改善模型性能,以达到快速获取问题根因的目的,提高模型根据用户反馈自适应学习的能力。
进一步地,如图2和图4所示,本实施例中所述数据采集处理模块,还用于对所述应用日志信息进行分词处理,获得分词数据集合;所述数据采集处理模块,还用于对所述分词数据集合进行数据清洗,获得清洗后的分词数据集合;所述数据采集处理模块,还用于通过预设特征提取算法对所述清洗后的分词数据集合进行聚类分析,获得所述应用日志信息对应的特征数据。
需要说明的是,分词数据集合是将应用日志信息中连续的文本序列切分成一个个离散的词语或词组获得的集合。通过对应用日志信息进行分词处理,可减少数据的冗杂程度,从而提高聚类分析的精度。
为便于理解,以具体的数据处理过程为例进行说明,但不对本实施例进行限定。首先对应用日志信息可进行分词处理。由于词是表达完整语义的最小单位,分词后,需进行一轮数据清洗,将一些特别语义的信息,如IP地址,时间戳,日志登记,组件等信息识别出来,从分词集合中去掉,因为这类词可理解为日志参数,不去掉可能会降低同类日志的相似度。经过前面的预处理后,需要选择特征表示模型,这里可选择向量空间模型,向量空间模型最基本思想是:每个文本中都包含一些表达主题的独立属性,这些独立属性被称为特征项,而每个特征项都可以看成向量空间的一个维数,文本就是这些特征项的集合,因此文本可以表示成:d=((t1,w1),(t2,w2),(t3,w3),……,(tn,wn)),其中ti为特征项,wi为其对应的权重。选择特征表示模型后,可对特征进行降维,也就是特征选择,因为经过分词处理后的,特征词条高达几万甚至几十万,尤其在本系统处理的文本信息是采集的应用系统的日志信息,本身在没分词之前数据量就是海量的,因此需要从分词后的特征词中选择对分类贡献大的特征词作为特征子集,从而提高聚类分析的精度。其中,特征选择算法可使用CFS算法,CFS算法是一种经典的Filter类型特征选择算法,用启发式评价函数对特征子集进行评价,这种评价函数更倾向于选择特征与特征之间冗余性小的特征子集,冗余的特征也应该被剔除掉。CFS的执行过程为:首先将训练数据集进行离散化,然后开始计算每个特征与类别,以及特征与特征之间的相关性,然后利用搜索算法搜索特征子集空间,在搜索过程中寻找最大启发值,最后得到学习精度的训练数据集。
进一步地,如图2和图3所示,本实施例中所述问题定位层20还包括:问题自动修复模块;所述问题自动修复模块,用于对所述问题根因进行分类打标,获得所述问题根因对应的分类标识,所述分类标识包括自动修复标识和非自动修复标识;所述问题自动修复模块,还用于在所述分类标识为所述自动修复标识时,根据所述分类标识确定所述问题根因对应的自动修复策略,并根据所述自动修复策略对所述问题关键信息对应的问题节点进行修复;所述问题自动修复模块,还用于在所述分类标识为所述非自动修复标识时,根据所述问题根因和所述问题关键信息调用预设通讯接口进行修复告警。
需要说明的是,自动修复标识是可自动修复的根因分类标识,非自动修复标识是不可自动修复的根因分类标识。问题自动修复模块根据对问题根因分进行打标分类标识,对于可自动修复的根因分类,则进入自动修复流程进行修复处理;对于无法自动修复的根因分类,则调用通讯工具(例如飞书、邮件)提供的API接口,提醒相应负责人人工处理,同时对相应负责人推送问题根因以及问题上下文信息。
具体的,对于问题根因进行打标分类的可自动修复情况包括中间件问题、配置中心配置问题、参数问题、服务问题等,根据不同根因类型进行不同自动修复流程。对于中间件问题,可通过网络协议到相应中间件对应的主机,查看主机上中间件的运行日志,并监控一段时间,如监控时间内日志正常,则认为中间件已自我修复,如发现运行日志有异常,则重启相应中间件,重启后,再次进行监控运行日志是否正常,如正常,则认为中间件问题修复成功。
对于配置中心配置问题,可根据问题根因分析出的不正确或缺失的配置,调用配置中心API接口修正或增加相应配置,配置后重启相应服务使其生效。
对于参数问题,可根据问题根因分析出的不正确的或缺失的参数,直接调用参数更新脚本更新相应参数。
对于服务问题,可根据服务的部署方式处理方式也不同,如果是虚机部署,则直接登录到相应服务通过重启脚本重启相应服务,如果是容器部署,则调用容器API重启相应服务,重启后,同样观察一段时间应用日志是否正常,正常后,则认为问题修复成功。
对于不可自动修复的根因分类,例如接口问题、数据库问题、测试数据问题等,则进入飞书提醒流程提醒相应负责人去处理。
在具体实现中,问题自动修复模块接收来自问题根因分析模块定位的根因分类后,对根因分类进行打标标识,打标标识主要区分哪些分类可以自动修复处理的,哪些是不可以的自动修复的。对于分类为接口问题、数据库问题和测试数据问题由于与应用程序的逻辑和开发对数据库设计强相关,有可能是因为应用程序缺陷导致的,因此此类问题都标识为自动修复,此类问题会通过飞邮提醒对应负责人人工进行处理,并且在通知时会同时告知相应负责人问题的上下文信息以及对应的交易日志,方便相应人员根据推送的信息快速的进行处理,而不用再投入时间重复进行分析工作。对于能自动修复的分类则进入自动修复处理流程,不同的分类的自动修复流程不同,则进行自动修复处理,并将处理结果响应给用户。从而从传统的人找人模式转变成事找人,进一步减少了人与人之间沟通等待时间,提高了问题修复的效率。
进一步地,如图2所示,本实施例中所述用户交互层10包括:交互式应答模块和交互式满意度调查模块;所述交互式应答模块,用于接收用户的问题关键信息,并将所述问题关键信息发送至所述问题定位层;所述交互式满意度调查模块,用于在所述问题节点修复结束时,获取所述用户的反馈信息;所述交互式满意度调查模块,还用于根据所述反馈信息更新所述预设神经网络模型的模型参数,并根据所述模型参数对所述预设神经网络模型进行优化,获得优化后的预设神经网络模型。
可理解的是,通过交互式应答模块,可提供友好易用的可视化前端页面供用户使用,用户可以通过交互式问答形式获取自己期望解决的问题的根因,与用户的整个交互流程采用自助式问答方式,对于用户的每一次“提问”,系统能快速根据提问信息分析出根因,并及时响应给用户,并且系统能根据响应结果的不同,指引用户下一步的操作。
应理解的是,通过交互式满意度调查模块,对于用户的每一次使用体验,可通过满意度调查的方式获取用户的反馈信息,以辅助所述基础模型层对模型进行调优训练。在当次“提问”流程处理结束后,可主动收集用户对本次使用体验的整体满意度情况,此过程中收集到的反馈信息可为模型调优训练提供数据支撑。
在具体实现中,在测试过程如发现阻碍测试的环境问题,可通过交互式应答模块的自助问答的方式快速获得问题的根因,并响应给问题提出人,问题提出人可根据根因去分析受影响的案例,以调整下一步的测试计划。减少了人工线下沟通的沟通成本,同时减少了人工分析处理的时间,解决了因人员能力差异而无法有效分析定位问题根因的弊端,大大提高了问题解决的效率。
本实施例问题根因分析模块接收商城传过来的问题关键信息后,根据问题关键信息去日志平台抓取日志平台日志,如抓取到相应日志,则从日志抓取该笔交易的全局交易ID,再以全局交易ID作为关键信息去抓取该交易完整的交易链路以分析接口平台数据,通过交易链路进一步分析出整个链路的接口调用链路,根据链路中调用的接口去接口平台抓取接口定义,并根据交易链路中所涉及到的系统去配置中心获取各系统的业务配置,并对获取的以上数据进行预处理,调用所述基础模型层的模型获得问题的根因。从而可根据抓取的交易链路日志、业务配置和接口定义按照模型来分析数据库信息,提高问题分析以及修复的准确性。进一步地,结果预测模块根据用户输入的信息,去日志平台、接口平台等应用抓取到与用户“提问”信息相关的应用执行日志,在对业务信息进行特征提取处理后,通过预设神经网络模型快速定位当次提问问题的根因信息,并响应给用户。从而通过模型能够快速精准的获取的问题根因,并提供自动修复的能力,大大减少人工线下沟通的时间、人工线下分析定位的时间、人工线下处理时间,有效提升了问题处理效率,有助于软件测试效率提升。更进一步地,数据采集处理模块还可通过实时异步采集各业务系统的业务日志、业务配置并进行预处理后进行特征提取;聚类分析模块以所述数据采集处理模块处理后的数据作为模型训练数据集,并以学习率、批次大小、训练时长等方式,并根据用户使用反馈改变训练数据、调整模型架构或增加训练时间等方法改善模型性能,以达到快速获取问题根因的目的。最后所述预测模块根据用户交互层中用户的“提问”信息预测用户所提问题的根因,并响应给用户交互层,最终展示给用户。从而通过对模型进行训练,调整模型架构或模型参数或增加训练时间等方法改善模型性能,以达到快速获取问题根因的目的,提高模型根据用户反馈自适应学习的能力。
参照图5,本发明问题修复系统提供一种问题修复方法,图5为本发明问题修复方法第一实施例的流程示意图,其问题修复系统包括:用户交互层、问题定位层和基础模型层;所述方法包括:
步骤S10:所述用户交互层接收用户的问题关键信息,并将所述问题关键信息发送至所述问题定位层。
需要说明的是,用户交互层是问题修复系统中负责与用户进行交互的模块,在软件环境出现问题时,用户通过用户交互层可将出现问题的位置和信息上传至问题修复系统中,并获得相应的反馈和结果,从而使用户能够方便、直观地与系统进行沟通和操作,而无需了解底层的技术细节。
可理解的是,问题关键信息是软件环境出现问题时,所需的重要或核心的描述问题的信息,系统可基于问题关键信息更准确地定位问题并找到相应的解决方法。
步骤S20:所述问题定位层根据所述问题关键信息从对应的日志平台抓取问题定位信息,并将所述问题定位信息发送至所述基础模型层。
可理解的是,问题定位层是在故障排除过程中,用于确定问题根本原因的模块,通过问题定位层可追踪引起软件系统故障、错误或异常行为的具体位置。
应理解的是,问题定位信息是问题定位层根据问题关键信息获得的位置信息,包括问题关键信息对应的应用日志、业务配置等信息。
在具体实现中,问题定位层在接收到来自用户交互层的问题关键信息后,可根据此信息获取相应的业务系统的应用日志、业务配置等信息,然后调用基础模型库中的模型以获取到问题根因。此时,可基于问题根因对当前问题进行自动修复,并响应最终处理结果给用户交互层,对于无法自动修复处理一般人工介入的问题,可通过通讯工具通知相应环境接口人进行处理。
步骤S30:所述基础模型层根据所述问题定位信息采集各业务平台的业务信息,对所述业务信息进行聚类分析,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层。
步骤S40:所述问题定位层根据所述问题根因对所述问题关键信息对应的问题节点进行修复。
需要说明的是,基础模型层是设有进行问题分析的模型的模块,通过基础模型层根据问题定位信息去获取日志平台日志,数据库数据记录,配置中心配置以及接口平台定义等数据,将其输入至模型中,从而可获得当前问题的问题根本原因,以实现快速获取问题根因的目的。
需要说明的是,业务信息是基础模型层根据问题定位信息获取的信息,例如日志平台日志,数据库数据记录,配置中心配置以及接口平台定义等信息。
在实际实现中,基础模型层根据所述问题定位信息采集各业务平台的业务信息,包括日志平台日志,数据库数据记录,配置中心配置以及接口平台定义等信息。接着将所述业务信息输入至模型中进行聚类分析,获得所述问题关键信息对应的问题根因,以实现快速获取问题根因的目的。最后问题定位层根据所述问题根因对所述问题关键信息对应的问题节点进行修复,同时将最终处理结果反馈至用户交互层,最终展示给用户。
本实施例问题定位层在接收到来自用户交互层的问题关键信息后,可根据此信息获取相应的业务系统的应用日志、业务配置等信息,然后调用基础模型库中的模型以获取到问题根因,基础模型层根据所述问题定位信息采集各业务平台的业务信息,包括日志平台日志,数据库数据记录,配置中心配置以及接口平台定义等信息。接着将所述业务信息输入至模型中进行聚类分析,获得所述问题关键信息对应的问题根因,以实现快速获取问题根因的目的。最后问题定位层根据所述问题根因对所述问题关键信息对应的问题节点进行修复,同时将最终处理结果反馈至用户交互层,最终展示给用户。对于无法自动修复处理一般人工介入的问题,可通过通讯工具通知相应环境接口人进行处理。由于本实施例通过问题定位层从对应的日志平台抓取问题定位信息,再通过基础模型层分析问题定位信息的问题根因,最后通过问题定位层对问题节点进行修复,减少了人工参与测试的环节,使整个问题处理流程自动化,大大提升了问题解决效率。
参照图6,图6为本发明问题修复方法第二实施例的流程示意图,基于上述图5所示的实施例,提出本发明问题修复方法的第二实施例。
在本实施例中,所述问题定位信息包括交易链路信息、业务配置信息和接口定义信息,所述问题定位层包括问题根因分析模块;所述步骤S20包括:
步骤S21:所述问题根因分析模块根据所述问题关键信息从对应的日志平台抓取对应的交易日志,并根据所述交易日志抓取所述问题关键信息对应的全局交易ID。
步骤S22:所述问题根因分析模块根据所述全局交易ID获取所述问题关键信息对应的交易链路信息,并根据所述交易链路信息抓取所述问题关键信息对应的接口定义信息。
需要说明的是,全局交易ID(Global Transaction ID)是在当前问题所在软件系统中的用于唯一标识的全局事务的标识符。由于出现问题的软件系统每个服务或组件都可能生成自己的本地事务ID,因此一般会通过全局交易ID确保全局事务的一致性,将本地事务与该全局事务进行关联。因此可通过全局交易ID追踪和监控当前问题的事务的状态,为故障排查和日志分析提供了便利。
可理解的是,交易日志(Transaction log)是在计算机系统中记录所有事务操作的一种数据日志,通过交易日志可对当前问题进行追踪,以提供故障恢复的数据。
应理解的是,交易链路信息(Transaction Trace Information)是指在当前问题所在计算机系统中跟踪和记录完整事务的相关信息,通过收集和分析交易链路信息,可深入分析当前问题所在系统的复杂事务的执行情况,可快速定位和解决问题。
可理解的是,接口定义信息(Interface Definition Information)是描述当前问题所在软件系统中接口的规范、结构和行为的相关信息。通过接口定义信息问题修复系统可与当前问题所在系统进行正确地交互和通信,获取当前问题的具体数据。
步骤S23:所述问题根因分析模块根据所述交易链路信息获取各业务平台对应的业务配置信息,并将所述交易链路信息、所述业务配置信息和所述接口定义信息发送至所述基础模型层。
需要说明的是,业务配置信息(Business Configuration Information)是当前问题所在软件系统中用于配置和定义特定业务逻辑、规则和行为的相关数据和参数,通过业务配置信息可获取当前问题所在不同业务场景的信息,以提高问题分析的准确性。
在具体实现中,问题根因分析模块接收商城传过来的问题关键信息后,根据问题关键信息去日志平台抓取日志平台日志,如抓取到相应日志,则从日志抓取该笔交易的全局交易ID,再以全局交易ID作为关键信息去抓取该交易完整的交易链路以分析接口平台数据,通过交易链路进一步分析出整个链路的接口调用链路,根据链路中调用的接口去接口平台抓取接口定义,并根据交易链路中所涉及到的系统去配置中心获取各系统的业务配置,并对获取的以上数据进行预处理,调用所述基础模型层的模型获得问题的根因。从而可根据抓取的交易链路日志、业务配置和接口定义按照模型来分析数据库信息,提高问题分析以及修复的准确性。
进一步地,本实施例中所述基础模型层包括结果预测模块;所述步骤S30包括:所述结果预测模块根据所述交易链路信息、所述业务配置信息和所述接口定义信息对各业务平台进行数据采集,获得业务信息;所述结果预测模块通过预设特征提取算法对所述业务信息进行特征分析,获得问题特征信息;所述结果预测模块通过预设神经网络模型对所述问题特征信息进行预测,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层。
需要说明的是,问题特征信息结果预测模块对业务信息进行特征提取获得的信息。由于业务信息中每个文本都包含一些表达主题的独立属性,这些独立属性可被称为特征项,通过对业务信息进行特征提取,以提高模型进行聚类分析的精度。
可理解的是,预设神经网络模型是预先设置的基于人工神经元和连接权重构成的数学模型,可实现对问题特征信息的分析,获得所述问题关键信息对应的问题根因。通过预设神经网络模型可快速定位当次提问问题的根因信息。
在具体实现中,结果预测模块根据用户输入的信息,去日志平台、接口平台等应用抓取到与用户“提问”信息相关的应用执行日志,在对业务信息进行特征提取处理后,通过预设神经网络模型快速定位当次提问问题的根因信息,并响应给用户。从而通过模型能够快速精准的获取的问题根因,并提供自动修复的能力,大大减少人工线下沟通的时间、人工线下分析定位的时间、人工线下处理时间,有效提升了问题处理效率,有助于软件测试效率提升。
本实施例问题根因分析模块接收商城传过来的问题关键信息后,根据问题关键信息去日志平台抓取日志平台日志,如抓取到相应日志,则从日志抓取该笔交易的全局交易ID,再以全局交易ID作为关键信息去抓取该交易完整的交易链路以分析接口平台数据,通过交易链路进一步分析出整个链路的接口调用链路,根据链路中调用的接口去接口平台抓取接口定义,并根据交易链路中所涉及到的系统去配置中心获取各系统的业务配置,并对获取的以上数据进行预处理,调用所述基础模型层的模型获得问题的根因。从而可根据抓取的交易链路日志、业务配置和接口定义按照模型来分析数据库信息,提高问题分析以及修复的准确性。进一步地,结果预测模块根据用户输入的信息,去日志平台、接口平台等应用抓取到与用户“提问”信息相关的应用执行日志,在对业务信息进行特征提取处理后,通过预设神经网络模型快速定位当次提问问题的根因信息,并响应给用户。从而通过模型能够快速精准的获取的问题根因,并提供自动修复的能力,大大减少人工线下沟通的时间、人工线下分析定位的时间、人工线下处理时间,有效提升了问题处理效率,有助于软件测试效率提升。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种问题修复系统,其特征在于,所述问题修复系统包括:用户交互层、问题定位层和基础模型层;
所述用户交互层,用于接收用户的问题关键信息,并将所述问题关键信息发送至所述问题定位层;
所述问题定位层,用于根据所述问题关键信息从对应的日志平台抓取问题定位信息,并将所述问题定位信息发送至所述基础模型层;
所述基础模型层,用于根据所述问题定位信息采集各业务平台的业务信息,对所述业务信息进行聚类分析,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层;
所述问题定位层,还用于根据所述问题根因对所述问题关键信息对应的问题节点进行修复;
其中,所述问题定位信息包括交易链路信息、业务配置信息和接口定义信息,所述问题定位层包括:问题根因分析模块;
所述问题根因分析模块,用于根据所述问题关键信息从对应的日志平台抓取对应的交易日志;
所述问题根因分析模块,还用于根据所述交易日志抓取所述问题关键信息对应的全局交易ID,并根据所述全局交易ID获取所述问题关键信息对应的交易链路信息;
所述问题根因分析模块,还用于根据所述交易链路信息抓取所述问题关键信息对应的接口定义信息;
所述问题根因分析模块,还用于根据所述交易链路信息获取各业务平台对应的业务配置信息;
所述问题根因分析模块,还用于将所述交易链路信息、所述业务配置信息和所述接口定义信息发送至所述基础模型层。
2.如权利要求1所述的问题修复系统,其特征在于,所述基础模型层包括:结果预测模块;
所述结果预测模块,用于根据所述交易链路信息、所述业务配置信息和所述接口定义信息对各业务平台进行数据采集,获得业务信息;
所述结果预测模块,还用于通过预设特征提取算法对所述业务信息进行特征分析,获得问题特征信息;
所述结果预测模块,还用于通过预设神经网络模型对所述问题特征信息进行预测,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层。
3.如权利要求2所述的问题修复系统,其特征在于,所述基础模型层还包括:数据采集处理模块和聚类分析模块;
所述数据采集处理模块,用于根据所述问题定位信息对各业务平台进行数据采集,获得应用日志信息;
所述数据采集处理模块,还用于根据预设特征提取算法对所述应用日志信息进行特征提取,获得所述应用日志信息对应的特征数据;
所述聚类分析模块,用于通过所述特征数据对初始神经网络模型进行训练,获得预设神经网络模型。
4.如权利要求3所述的问题修复系统,其特征在于,所述数据采集处理模块,还用于对所述应用日志信息进行分词处理,获得分词数据集合;
所述数据采集处理模块,还用于对所述分词数据集合进行数据清洗,获得清洗后的分词数据集合;
所述数据采集处理模块,还用于通过预设特征提取算法对所述清洗后的分词数据集合进行聚类分析,获得所述应用日志信息对应的特征数据。
5.如权利要求4所述的问题修复系统,其特征在于,所述问题定位层还包括:问题自动修复模块;
所述问题自动修复模块,用于对所述问题根因进行分类打标,获得所述问题根因对应的分类标识,所述分类标识包括自动修复标识和非自动修复标识;
所述问题自动修复模块,还用于在所述分类标识为所述自动修复标识时,根据所述分类标识确定所述问题根因对应的自动修复策略,并根据所述自动修复策略对所述问题关键信息对应的问题节点进行修复;
所述问题自动修复模块,还用于在所述分类标识为所述非自动修复标识时,根据所述问题根因和所述问题关键信息调用预设通讯接口进行修复告警。
6.如权利要求5所述的问题修复系统,其特征在于,所述用户交互层包括:交互式应答模块和交互式满意度调查模块;
所述交互式应答模块,用于接收用户的问题关键信息,并将所述问题关键信息发送至所述问题定位层;
所述交互式满意度调查模块,用于在所述问题节点修复结束时,获取所述用户的反馈信息;
所述交互式满意度调查模块,还用于根据所述反馈信息更新所述预设神经网络模型的模型参数,并根据所述模型参数对所述预设神经网络模型进行优化,获得优化后的预设神经网络模型。
7.一种问题修复方法,其特征在于,所述问题修复方法应用于问题修复系统,所述系统包括用户交互层、问题定位层和基础模型层;所述方法包括:
所述用户交互层接收用户的问题关键信息,并将所述问题关键信息发送至所述问题定位层;
所述问题定位层根据所述问题关键信息从对应的日志平台抓取问题定位信息,并将所述问题定位信息发送至所述基础模型层;
所述基础模型层根据所述问题定位信息采集各业务平台的业务信息,对所述业务信息进行聚类分析,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层;
所述问题定位层根据所述问题根因对所述问题关键信息对应的问题节点进行修复;
其中,所述问题定位信息包括交易链路信息、业务配置信息和接口定义信息,所述问题定位层包括问题根因分析模块;所述问题定位层根据所述问题关键信息从对应的日志平台抓取问题定位信息,并将所述问题定位信息发送至所述基础模型层,包括:
所述问题根因分析模块根据所述问题关键信息从对应的日志平台抓取对应的交易日志,并根据所述交易日志抓取所述问题关键信息对应的全局交易ID;
所述问题根因分析模块根据所述全局交易ID获取所述问题关键信息对应的交易链路信息,并根据所述交易链路信息抓取所述问题关键信息对应的接口定义信息;
所述问题根因分析模块根据所述交易链路信息获取各业务平台对应的业务配置信息,并将所述交易链路信息、所述业务配置信息和所述接口定义信息发送至所述基础模型层。
8.如权利要求7所述的问题修复方法,其特征在于,所述基础模型层包括结果预测模块;所述基础模型层根据所述问题定位信息采集各业务平台的业务信息,对所述业务信息进行聚类分析,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层,包括:
所述结果预测模块根据所述交易链路信息、所述业务配置信息和所述接口定义信息对各业务平台进行数据采集,获得业务信息;
所述结果预测模块通过预设特征提取算法对所述业务信息进行特征分析,获得问题特征信息;
所述结果预测模块通过预设神经网络模型对所述问题特征信息进行预测,获得所述问题关键信息对应的问题根因,并将所述问题根因发送至所述问题定位层。
CN202311426450.2A 2023-10-31 2023-10-31 问题修复系统及方法 Active CN117149501B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311426450.2A CN117149501B (zh) 2023-10-31 2023-10-31 问题修复系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311426450.2A CN117149501B (zh) 2023-10-31 2023-10-31 问题修复系统及方法

Publications (2)

Publication Number Publication Date
CN117149501A CN117149501A (zh) 2023-12-01
CN117149501B true CN117149501B (zh) 2024-02-06

Family

ID=88903133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311426450.2A Active CN117149501B (zh) 2023-10-31 2023-10-31 问题修复系统及方法

Country Status (1)

Country Link
CN (1) CN117149501B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110139455A (ko) * 2010-06-23 2011-12-29 한국전자통신연구원 근원-장애 분석에 기반한 하의 상달식 다계층 망 복구 방법 및 장치
CN110955575A (zh) * 2019-11-14 2020-04-03 国网浙江省电力有限公司信息通信分公司 一种基于关联分析模型的业务系统故障定位方法
CN112711493A (zh) * 2020-12-25 2021-04-27 上海精鲲计算机科技有限公司 一种场景化根因分析应用
CN113313271A (zh) * 2021-06-03 2021-08-27 国家电网有限公司客户服务中心 一种基于远程客服的电力系统故障报修方法及装置
CN113328872A (zh) * 2020-02-29 2021-08-31 华为技术有限公司 故障修复方法、装置和存储介质
CN114691831A (zh) * 2022-03-31 2022-07-01 彩虹无线(北京)新技术有限公司 一种基于知识图谱的任务型汽车故障智能问答系统
CN116701031A (zh) * 2023-05-19 2023-09-05 浙江大学滨江研究院 一种微服务系统中的根因模型训练方法、分析方法及装置
CN116820972A (zh) * 2023-06-30 2023-09-29 中信银行股份有限公司 一种智能化软件测试问诊方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10708795B2 (en) * 2016-06-07 2020-07-07 TUPL, Inc. Artificial intelligence-based network advisor
US10373094B2 (en) * 2016-07-29 2019-08-06 Cisco Technology, Inc. Automated model based root cause analysis
US10949287B2 (en) * 2018-09-19 2021-03-16 International Business Machines Corporation Finding, troubleshooting and auto-remediating problems in active storage environments
US11635752B2 (en) * 2021-05-07 2023-04-25 Servicenow, Inc. Detection and correction of robotic process automation failures

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110139455A (ko) * 2010-06-23 2011-12-29 한국전자통신연구원 근원-장애 분석에 기반한 하의 상달식 다계층 망 복구 방법 및 장치
CN110955575A (zh) * 2019-11-14 2020-04-03 国网浙江省电力有限公司信息通信分公司 一种基于关联分析模型的业务系统故障定位方法
CN113328872A (zh) * 2020-02-29 2021-08-31 华为技术有限公司 故障修复方法、装置和存储介质
CN112711493A (zh) * 2020-12-25 2021-04-27 上海精鲲计算机科技有限公司 一种场景化根因分析应用
CN113313271A (zh) * 2021-06-03 2021-08-27 国家电网有限公司客户服务中心 一种基于远程客服的电力系统故障报修方法及装置
CN114691831A (zh) * 2022-03-31 2022-07-01 彩虹无线(北京)新技术有限公司 一种基于知识图谱的任务型汽车故障智能问答系统
CN116701031A (zh) * 2023-05-19 2023-09-05 浙江大学滨江研究院 一种微服务系统中的根因模型训练方法、分析方法及装置
CN116820972A (zh) * 2023-06-30 2023-09-29 中信银行股份有限公司 一种智能化软件测试问诊方法及系统

Also Published As

Publication number Publication date
CN117149501A (zh) 2023-12-01

Similar Documents

Publication Publication Date Title
CN111209131B (zh) 一种基于机器学习确定异构系统的故障的方法和系统
CN111736875B (zh) 版本更新监控方法、装置、设备及计算机存储介质
CN100559350C (zh) 基于历史对可疑组件排优先级
CN111290900B (zh) 一种基于微服务日志的软件故障检测方法
CN113282461B (zh) 传输网的告警识别方法和装置
US11263072B2 (en) Recovery of application from error
CN109376868B (zh) 信息管理系统
CN111865673A (zh) 一种自动化故障管理方法、装置及系统
US20090183022A1 (en) Failure response support apparatus and failure response support method
CN114880312B (zh) 一种可柔性设置的应用系统业务数据稽核方法
CN114118295A (zh) 一种异常检测模型训练方法、异常检测方法、装置及介质
US11822578B2 (en) Matching machine generated data entries to pattern clusters
CN116578499B (zh) 公共组件功能变更影响的智能化分析测试方法及其系统
CN117149501B (zh) 问题修复系统及方法
CN111835566A (zh) 一种系统故障管理方法、装置及系统
CN113674065A (zh) 基于服务触点的业务推荐方法、装置、电子设备及介质
CN115599621A (zh) 微服务异常诊断方法、装置、设备及存储介质
CN109889258B (zh) 一种光网络故障校验方法和设备
CN116468423A (zh) 一种运维应急协同方法、系统和终端设备
Chen et al. Assessing expertise awareness in resolution networks
CN116308679A (zh) 供应链异常订单处理方法、装置、设备及存储介质
CN114417150A (zh) 故障原因排查步骤的推荐方法、装置、设备及存储介质
CN113010339A (zh) 联机交易测试中故障自动处理方法及装置
CN116414587A (zh) 故障数据获取方法、故障处理方法、电子设备及存储介质
CN113704124B (zh) 一种自动化测试方法、系统、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant