CN117873909B - 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质 - Google Patents

故障诊断执行方法、故障诊断执行系统、电子设备及存储介质 Download PDF

Info

Publication number
CN117873909B
CN117873909B CN202410281699.7A CN202410281699A CN117873909B CN 117873909 B CN117873909 B CN 117873909B CN 202410281699 A CN202410281699 A CN 202410281699A CN 117873909 B CN117873909 B CN 117873909B
Authority
CN
China
Prior art keywords
fault
task
subtask
fault diagnosis
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410281699.7A
Other languages
English (en)
Other versions
CN117873909A (zh
Inventor
李剑楠
苏鹏
黄炎
陈书俊
梁广涛
李恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Aikesheng Information Technology Co ltd
Original Assignee
Shanghai Aikesheng Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Aikesheng Information Technology Co ltd filed Critical Shanghai Aikesheng Information Technology Co ltd
Priority to CN202410281699.7A priority Critical patent/CN117873909B/zh
Publication of CN117873909A publication Critical patent/CN117873909A/zh
Application granted granted Critical
Publication of CN117873909B publication Critical patent/CN117873909B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明提供一种故障诊断执行方法、故障诊断执行系统、电子设备及存储介质,包括以下步骤:根据故障诊断流程,设置多个子任务单元,所述故障诊断流程用于处理用户提出的故障问题;针对至少一个所述子任务单元,对应设置监督代理模型,所述监督代理模型包括监督指标;根据接收到所述用户提出的故障问题,所述子任务单元生成对应的任务内容;调用所述监督代理模型评估所述任务内容,若所述任务内容符合所述监督指标,则允许进入该子任务单元的下一个所述子任务单元或执行该子任务单元的任务内容。本发明通过多个所述子任务单元与所述监督代理模型的协同工作,确保系统在故障诊断过程中具备全面性、灵活性和自适应性。

Description

故障诊断执行方法、故障诊断执行系统、电子设备及存储介质
技术领域
本发明涉及信息技术领域,具体涉及一种故障诊断执行方法、故障诊断执行系统、电子设备及存储介质。
背景技术
数据库故障问题通常会导致系统性能下降、数据丢失等严重后果。目前的数据库故障诊断方法大多依赖于DBA手动分析和经验积累,这种方式效率低下且容易受限于DBA个体的经验水平。
目前,一些数据库管理系统(DBMS)利用简单的规则引擎或基于统计学的方法来进行故障检测,但这些方法往往缺乏足够的智能化和自适应性。
一些研究关注于利用机器学习技术对数据库故障进行自动识别。然而,这些方法往往依赖于大量标记好的训练数据,且对于复杂多变的故障场景适应性较差。
大模型技术出现之后,基于大语言模型的数据库自动故障诊断系统则具有更强的泛化能力,能够从大规模语言数据中学习丰富的语境和知识,为故障诊断提供更全面的背景信息。但当直接使用大语言模型时我们发现模型很难直接对一个复杂问题有一个全面的认知,经常在排查的初期阶段就下结论。
由此可见,各种现有技术中对数据库故障诊断执行方面均存在缺陷,需要一种新的故障诊断执行解决方案。
发明内容
本发明的目的在于提供一种故障诊断执行方法、故障诊断执行系统、电子设备及存储介质,通过多个所述子任务单元与所述监督代理模型的协同工作,确保系统在故障诊断过程中具备全面性、灵活性和自适应性。
为实现上述目的,本发明提供一种故障诊断执行方法,包括以下步骤:根据故障诊断流程,设置多个子任务单元,所述故障诊断流程用于处理用户提出的故障问题;针对至少一个所述子任务单元,对应设置监督代理模型,所述监督代理模型包括监督指标;根据接收到所述用户提出的故障问题,所述子任务单元生成对应的任务内容;调用所述监督代理模型评估所述任务内容,若所述任务内容符合所述监督指标,则允许进入下一个所述子任务单元或执行该子任务单元的任务内容。
可选的,所述根据接收到所述用户提出的故障问题,所述子任务单元生成对应的任务内容,具体包括:建立知识库,所述知识库包括能够解决所述用户提出的故障问题的经验知识;所述子任务单元具有任务标签,根据所述用户提出的故障问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容。
可选的,所述根据所述用户提出的故障问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容,具体包括:根据所述用户提出的故障问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的数据段;所述知识库包括多个文本,选取出与所述数据段相对应的所述文本,根据所述根据所述用户提出的故障问题和所述任务标签,在被选取出的所述文本中检索出与所述子任务单元适配的任务内容。
可选的,所述根据接收到所述用户提出的故障问题,所述子任务单元生成对应的任务内容,具体包括:建立知识库,所述知识库包括能够解决所述用户提出的故障问题的经验知识;建立提示系统,所述提示系统包括多个预先设置的标准格式问题;将所述用户提出的故障问题转化为第一向量,将所述标准格式问题转化为第二向量,根据所述第一向量和所述第二向量之间的距离,在多个所述标准格式问题中选取出与所述用户提出的故障问题相似的相似问题;所述子任务单元具有任务标签,根据所述相似问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容。
可选的,所述根据所述相似问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容,具体包括:将所述用户提出的故障问题和\或所述相似问题作为指令,输入给大语言模型,利用所述大语言模型生成智能转写问题;根据所述智能转写问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容。
可选的,所述子任务单元包括以下单元中的至少一种:原因子任务单元,用于根据所述用户提出的故障问题,生成故障原因作为所述任务内容;计划子任务单元,用于根据所述用户提出的故障问题和所述故障原因,生成故障排查计划作为所述任务内容;方法子任务单元,用于执行所述故障排查计划。
可选的,所述监督指标的获取方式为:利用多个合格的以往的所述任务内容,训练一深度学习模型作为所述监督代理模型,以使所述监督代理模型具有所述监督指标。
本发明还提供一种故障诊断执行系统,应用于上述任一所述的故障诊断执行方法,包括:第一设置模块,用于根据所述故障诊断流程,设置多个所述子任务单元;第二设置模块,用于针对至少一个所述子任务单元,对应设置监督代理模型;第一执行模块,用于根据接收到所述用户提出的故障问题,调用所述子任务单元生成对应的任务内容;第二执行模块,用于调用所述监督代理模型评估所述任务内容,若所述任务内容符合所述监督指标,则允许进入该子任务单元的下一个所述子任务单元或执行该子任务单元的任务内容。
本发明还提供一种电子设备,所述电子设备包括:存储器,存储有计算机程序;处理器,与所述存储器通信相连,调用所述计算机程序时执行上述任一项所述的故障诊断执行方法;显示器,与所述处理器和所述存储器通信相连,用于显示与所述故障诊断执行方法相关GUI交互界面。
本发明还提供一种存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述的故障诊断执行方法。
本发明提供的故障诊断执行方法、故障诊断执行系统、电子设备及存储介质具有如下有益效果:
本发明提供一种故障诊断执行方法,包括以下步骤:根据故障诊断流程,设置多个子任务单元,所述故障诊断流程用于处理用户提出的故障问题;针对至少一个所述子任务单元,对应设置监督代理模型,所述监督代理模型包括监督指标;根据接收到所述用户提出的故障问题,所述子任务单元生成对应的任务内容;调用所述监督代理模型评估所述任务内容,若所述任务内容符合所述监督指标,则允许进入下一个所述子任务单元或执行该子任务单元的任务内容。与现有技术的区别之处在于,本发明采用了多代理系统,通过多个所述子任务单元与所述监督代理模型的协同工作,确保系统在故障诊断过程中具备全面性、灵活性和自适应性。这种智能分析的方法能够更全面、更深入地理解和解决复杂的故障问题。本发明在数据库自动故障诊断领域具有明显的优势,为解决数据库故障问题提供了更智能、更全面的解决方案。
本发明还提供一种故障诊断执行系统,由于所述权限控制系统与所述故障诊断执行方法属于同一个发明构思,因此所述故障诊断执行系统能够通过多个所述子任务单元与所述监督代理模型的协同工作,确保系统在故障诊断过程中具备全面性、灵活性和自适应性,能够更全面、更深入地理解和解决复杂的故障问题。
本发明还提供一种电子设备,由于所述电子设备与所述故障诊断执行方法属于同一个发明构思,因此所述电子设备能够通过多个所述子任务单元与所述监督代理模型的协同工作,确保系统在故障诊断过程中具备全面性、灵活性和自适应性,能够更全面、更深入地理解和解决复杂的故障问题。
本发明还提供一种存储介质,由于所述存储介质与所述故障诊断执行方法属于同一个发明构思,因此所述存储介质能够通过多个所述子任务单元与所述监督代理模型的协同工作,确保系统在故障诊断过程中具备全面性、灵活性和自适应性,能够更全面、更深入地理解和解决复杂的故障问题。
附图说明
图1为本发明一实施例提供的故障诊断执行方法的流程示意图。
图2为本发明一实施例提供的故障诊断执行系统的逻辑关系示意图。
图3为本发明一实施例提供的电子设备的方框结构示意图。
其中附图标记为:
101-处理器;102-通信接口;103-存储器;104-通信总线;105-显示器。
具体实施方式
为使本发明的目的、优点和特征更加清楚,以下结合附图和具体实施例对本发明作进一步详细说明。需说明的是,附图均采用非常简化的形式且未按比例绘制,仅用以方便、明晰地辅助说明本发明实施例的目的。此外,附图所展示的结构往往是实际结构的一部分。特别的,各附图需要展示的侧重点不同,有时会采用不同的比例。
应当明白,当元件或层被称为"在…上"、"连接到"其它元件或层时,其可以直接地在其它元件或层上、连接其它元件或层,或者可以包括居间的元件或层。相反,当元件被称为"直接在…上"、"直接连接到"其它元件或层时,则不包括居间的元件或层。尽管可使用术语第一、第二、第三等描述各种元件、部件、区、层和/或部分,这些元件、部件、区、层和/或部分不应当被这些术语限制。这些术语仅仅用来区分一个元件、部件、区、层或部分与另一个元件、部件、区、层或部分。因此,在不脱离本发明教导之下,下面讨论的第一元件、部件、区、层或部分可表示为第二元件、部件、区、层或部分。空间关系术语例如“在……之下”、“在下面”、“下面的”、“在……之上”、“在上面”、“上面的”等,在这里可为了方便描述而被使用从而描述图中所示的一个元件或特征与其它元件或特征的关系。应当明白,除了图中所示的取向以外,空间关系术语意图还包括使用和操作中的器件的不同取向。例如,如果附图中的器件翻转,然后,描述为“在……之下”、“在下面”、“下面的”元件或特征将取向为在其它元件或特征“上”。器件可以另外地取向(旋转90度或其它取向)并且在此使用的空间描述语相应地被解释。在此使用的术语的目的仅在于描述具体实施例并且不作为本发明的限制。在此使用时,单数形式的"一"、"一个"和"所述/该"也意图包括复数形式,除非上下文清楚地指出另外的方式。还应明白术语“包括”用于确定可以特征、步骤、操作、元件和/或部件的包括,但不排除一个或更多其它的特征、步骤、操作、元件、部件和/或组的包括或添加。在此使用时,术语"和/或"包括相关所列项目的任何及所有组合。
本发明的目的在于提供一种故障诊断执行方法、故障诊断执行系统、电子设备及存储介质,通过多个所述子任务单元与所述监督代理模型的协同工作,确保系统在故障诊断过程中具备全面性、灵活性和自适应性。
请参考图1和图2,图1为本发明一实施例提供的故障诊断执行方法的流程示意图;图2为本发明一实施例提供的故障诊断执行系统的逻辑关系示意图;所述故障诊断执行方法应用于所述故障诊断系统。如图1和图2所示,为实现上述目的,本发明提供一种故障诊断执行方法,包括以下步骤:
根据故障诊断流程,设置多个子任务单元,所述故障诊断流程用于处理用户提出的故障问题;
针对至少一个所述子任务单元,对应设置监督代理模型,所述监督代理模型包括监督指标;
根据接收到所述用户提出的故障问题,所述子任务单元生成对应的任务内容;
调用所述监督代理模型评估所述任务内容,若所述任务内容符合所述监督指标,则允许进入下一个所述子任务单元或执行该子任务单元的任务内容。
与现有技术的区别之处在于,本发明采用了多代理系统,通过多个所述子任务单元与所述监督代理模型的协同工作,确保系统在故障诊断过程中具备全面性、灵活性和自适应性。这种智能分析的方法能够更全面、更深入地理解和解决复杂的故障问题。本发明在数据库自动故障诊断领域具有明显的优势,为解决数据库故障问题提供了更智能、更全面的解决方案。
需要说明的是,所述监督指标可以是预设的监督指标,也可以是基于深度学习模型训练形成所述监督代理模型,基于此本发明进一步提供以下技术方案:
所述监督指标的获取方式为:利用多个合格的以往的所述任务内容,训练一深度学习模型作为所述监督代理模型,以使所述监督代理模型具有所述监督指标。
具体的,所述根据接收到所述用户提出的故障问题,所述子任务单元生成对应的任务内容,具体包括:
建立知识库,所述知识库包括能够解决所述用户提出的故障问题的经验知识;
所述子任务单元具有任务标签,根据所述用户提出的故障问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容。
所述经验知识包括历史工单,所述知识库可以是由以往的历史工单组成的经验知识库,也可以是从互联网上获取的经验知识信息。
进一步的,所述根据所述用户提出的故障问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容,具体包括:
根据所述用户提出的故障问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的数据段;
所述知识库包括多个文本,选取出与所述数据段相对应的所述文本,根据所述根据所述用户提出的故障问题和所述任务标签,在被选取出的所述文本中检索出与所述子任务单元适配的任务内容。
如此设置的原因是,在一些场景中,虽然个别关键词或文字段很相似,但语义实际不相符,这种情况在基于向量距离检索的场景下尤为常见。因此应将数据段回归文本上下文进行进一步的检索,从而进一步提升检索精确度。
优选的,所述根据接收到所述用户提出的故障问题,所述子任务单元生成对应的任务内容,具体包括:
建立知识库,所述知识库包括能够解决所述用户提出的故障问题的经验知识;
建立提示系统,所述提示系统包括多个预先设置的标准格式问题;
将所述用户提出的故障问题转化为第一向量,将所述标准格式问题转化为第二向量,根据所述第一向量和所述第二向量之间的距离,在多个所述标准格式问题中选取出与所述用户提出的故障问题相似的相似问题;
所述子任务单元具有任务标签,根据所述相似问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容。
如此设置的原因是,用户在提问时,并不能完全精确地使用专业措辞,很可能使用的是近义词甚至白话措辞提问,基于此本发明预先设置标准格式问题,基于向量检索原理,使用户提出的问题转化为标准问题,进一步提高检索精确度。
进一步的,所述根据所述相似问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容,具体包括:
将所述用户提出的故障问题和\或所述相似问题作为指令,输入给大语言模型,利用所述大语言模型生成智能转写问题;
根据所述智能转写问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容。
如此设置,可以将所述用户提出的故障问题和\或所述相似问题一起输入给大语言模型,引导模型更好地理解用户输入,并生成更精准的转写问题,进一步提高检索精确度。
请继续参考图2,具体的,所述子任务单元包括以下单元中的至少一种:
原因子任务单元,用于根据所述用户提出的故障问题,生成故障原因作为所述任务内容;所述原因子任务单元的任务标签即为“原因”。
计划子任务单元,用于根据所述用户提出的故障问题和所述故障原因,生成故障排查计划作为所述任务内容;所述计划子任务单元的任务标签即为“计划”。
方法子任务单元,用于执行所述故障排查计划。
本发明还提供一种故障诊断执行系统,应用于上述任一所述的故障诊断执行方法,包括:
第一设置模块,用于根据所述故障诊断流程,设置多个所述子任务单元;
第二设置模块,用于针对至少一个所述子任务单元,对应设置监督代理模型;
第一执行模块,用于根据接收到所述用户提出的故障问题,调用所述子任务单元生成对应的任务内容;
第二执行模块,用于调用所述监督代理模型评估所述任务内容,若所述任务内容符合所述监督指标,则允许进入下一个所述子任务单元或执行该子任务单元的任务内容。
由于所述故障诊断执行系统与所述故障诊断执行方法属于同一个发明构思,因此所述故障诊断执行系统能够通过多个所述子任务单元与所述监督代理模型的协同工作,确保系统在故障诊断过程中具备全面性、灵活性和自适应性,能够更全面、更深入地理解和解决复杂的故障问题。
由于所述故障诊断执行系统与所述故障诊断执行方法属于同一个发明构思,因此所述故障诊断执行系统能够通过多个所述子任务单元与所述监督代理模型的协同工作,确保系统在故障诊断过程中具备全面性、灵活性和自适应性,能够更全面、更深入地理解和解决复杂的故障问题。
请参考图3,图3为本发明一实施例提供的电子设备的方框结构示意图。如图3所示,本发明还提供一种电子设备,所述电子设备包括:
存储器103,存储有计算机程序;
处理器101,与所述存储器通信相连,调用所述计算机程序时执行上述任一项所述的故障诊断执行方法;
显示器105,与所述处理器和所述存储器通信相连,用于显示与所述故障诊断执行方法相关GUI交互界面。
由于所述电子设备与所述故障诊断执行方法属于同一个发明构思,因此所述电子设备既能够通过多个所述子任务单元与所述监督代理模型的协同工作,确保系统在故障诊断过程中具备全面性、灵活性和自适应性,能够更全面、更深入地理解和解决复杂的故障问题。
由于所述电子设备与所述故障诊断执行方法属于同一个发明构思,因此所述电子设备能够通过多个所述子任务单元与所述监督代理模型的协同工作,确保系统在故障诊断过程中具备全面性、灵活性和自适应性,能够更全面、更深入地理解和解决复杂的故障问题。
如图3所示,所述电子设备还包括通信接口102和通信总线104,其中所述处理器101、所述通信接口102、所述存储器103通过通信总线104完成相互间的通信。所述通信总线104可以是外设部件互连标准(Peripheral Component Interconnect,PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture,EISA)总线等。该通信总线104可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。所述通信接口102用于上述电子设备与其他设备之间的通信。
本发明中所称处理器101可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器101是所述电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分。
所述存储器103可用于存储所述计算机程序,所述处理器101通过运行或执行存储在所述存储器103内的计算机程序,以及调用存储在存储器103内的数据,实现所述电子设备的各种功能。
所述存储器103可以包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本发明还提供一种存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述的故障诊断执行方法。
由于所述存储介质与所述故障诊断执行方法属于同一个发明构思,因此所述存储介质既能够通过多个所述子任务单元与所述监督代理模型的协同工作,确保系统在故障诊断过程中具备全面性、灵活性和自适应性,能够更全面、更深入地理解和解决复杂的故障问题。
由于本发明提供的存储介质与上文所述的故障诊断执行方法属于同一发明构思,因此本发明提供的存储介质具有上文所述的故障诊断执行方法的所有优点,故在此不再对本发明提供的存储介质所具有的有益效果进行一一赘述。
本发明实施方式的存储介质,可以采用一个或多个计算机可读的介质的任意组合。可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机硬盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其组合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
下面结合具体的实施例说明本发明的技术原理,应理解,本发明并不以具体的实施例为限。
实施例
数据处理部分:
首先,通过导入历史工单构建了一个庞大的知识库。这个知识库包含了问题的摘要、问题描述、问题原因以及问题解决方法,为系统提供了丰富的背景信息。可对所述工单进行批量的预处理,将数据分为四个部分,以便后续的检索和分析。这一步确保了系统对历史故障案例的充分了解,并为后续的智能分析提供了强大的基础。
检索部分:
检索部分采用了检索增强生成(RAG)技术,结合了两种检索方法:知识库检索和联网检索。知识库检索基于预处理过的历史工单,通过向量检索算法快速定位相关信息。而联网检索则允许系统动态地从互联网上获取最新的信息和解决方案。这种综合的检索方式确保了系统对各类问题都能够获得全面而及时的信息,提高了故障诊断的准确性和实时性。
查询转写部分:
为了进一步提高系统对用户查询的理解能力,本实施例引入了查询转写技术,利用存储的300条QA数据构建一个提示系统。
QA数据的向量化与存储:首先,对300条QA数据进行向量化表示,将问题和答案转化为向量形式。这可以利用词嵌入(Word Embeddings)等技术,将文本信息映射到高维空间中,使得相似问题在向量空间中更为接近。然后,将向量化的QA数据存储在系统数据库中。
用户查询的相似问题检索:当用户查询到来时,首先利用向量检索技术,将用户的查询与存储的QA数据进行相似度匹配。通过找到与用户查询相似的问题,系统能够提供相关问题作为提示词,从而帮助用户更准确地表达问题。
大语言模型的智能转写:基于相似问题的提示词,系统将用户的输入与大语言模型进行转写。通过向模型提供相似问题作为提示,可以引导模型更好地理解用户输入,并生成更精准的转写结果。这一步骤有效地利用了存储的QA数据,提高了系统对用户问题的理解能力。
实时更新与优化:随着系统的不断运行,用户查询和交互会不断产生新的数据。因此,我们建立了一个实时更新与优化机制,定期更新QA数据的向量表示,并根据用户反馈不断优化大语言模型,以保持系统在不同场景下的高效性和准确性。
子任务单元系统:
本实施例采用了多子任务单元策略,包括原因子任务单元、计划子任务单元、和方法子任务单元,各自承担不同的责任。原因子任务单元负责分析故障的原因;计划子任务单元根据不同的原因生成相应的排查计划,提供系统性的问题解决方案;方法子任务单元负责生成具体的排查指令,并分析用户运行排查指令后返回的结果,形成闭环反馈。这一多子任务单元系统保证了系统在故障诊断过程中的全面性、灵活性和自适应性。
针对每个子任务单元,有不同的提示词、检索策略、输入格式。例如:
原因子任务单元:
输入为问题输入(例如MySQL连接异常中断)。知识库为MySQL故障处理手册、工单系统中的问题原因。检索策略为多轮检索。每轮检索的结果独立总结原因。最后合并所有原因。
计划子任务单元:
输入为问题输入+某个原因(例如MySQL连接异常中断,排查的可能原因是网络原因)。知识库为工单系统中的问题解决方案,检索策略为单轮检索。生成完整的排查计划。
方法子任务单元:
输入为校准完成后的计划。知识库为工单系统中的问题解决方案,检索策略为单轮检索。根据计划的每个节点生成具体的排查指令。
监督代理模型:
计划校准监督代理模型:对应所述计划子任务模块,输入为所述计划子任务模块生成的计划。对该代理的要求是检查生成的计划逻辑是否正确、是否有重复冗余节点、是否有额外的排查方案可以补充。当所述计划校准监督代理模型观察到当前的计划中某个节点有逻辑错误时,会选择对所述计划子任务单元进行发言,调用所述计划子任务单元重新生成计划。
方法监督代理模型:对应所述方法子任务单元,当所述方法监督代理模型与用户对话过程中发现当前的排查计划需要扩充时,会选择停止对话并对所述方法子任务单元进行发言,要求其修改排查计划。
本实施例目前展示了计划校准监督代理模型针对生成的排查计划进行校准,但实际上对于任意一个所述子任务单元来说,都可以使用一个监督代理模型来进行监督生成准确的结果。而对于监督代理模型,可以使用指令微调的小参数量模型进行代替。例如,收集1000组排查计划以及对应的修改意见。使用lora微调方法对Llama2模型进行指令微调。这类方法可以在简单的任务上节省推理的资源消耗。
检索增强生成策略:现有的检索增强生成方案采用在知识库中进行向量检索,这种方法基于认为在高维度向量空间中向量之间的距离可以代表语义的相似度。但实际场景中,可以发现有很多相似度极高但实际语义不相符的例子。所以本实施例提出了适用于所有子任务单元的一种重排序策略,例如检索时使用用户的查询语句召回k个相似的数据段。将k个文本段对应的原文整合成一个小规模知识库,将用户的查询语句中的关键词在小规模知识库中进行新一轮的topk召回。并将结果交给代理进行评估,选择其中的相关文本段落作为上下文。
系统的可扩展性:在本方案中针对故障诊断场景进行子任务拆解。将每个子任务安排对应的代理,再应用上述的检索增强生成以及多子任务单元通信等策略进行推理。所以,当任务场景进一步丰富的时候,我们仍然可以扩充子任务单元和监督代理模型的个数来处理数据库领域的更多问题。
区别于现有技术的优势:
全面的数据处理:相对于传统的数据库故障诊断方法,我们的系统首先通过导入历史工单构建了庞大的知识库,并进行了细致的预处理。这一步骤确保系统对于各类问题都具备了深刻的了解,为后续的大语言模型分析提供了知识基础。
综合的检索方法:本发明采用了知识库检索和联网检索相结合的方式,确保了系统不仅能够基于历史案例提供准确的解决方案,还能够从互联网上获取最新的信息。这种综合的检索方式大大提高了系统对于各类问题的适应性和实时性。
多子任务单元和多监督代理模型系统的智能分析:与单一分析角度的方法不同,本发明采用了多代理系统,通过多个所述子任务单元与所述监督代理模型的协同工作,确保系统在故障诊断过程中具备全面性、灵活性和自适应性,能够更全面、更深入地理解和解决复杂的故障问题。
可扩展性:系统定期将优质的QA数据补充到QA库中,系统能够根据用户的实际查询习惯和反馈进行个性化的适应,使提示词和转写结果更符合用户的需求。
在这种综合的技术框架下,本发明的专利技术在数据库自动故障诊断领域具有明显的优势,为解决数据库故障问题提供了更智能、更全面的解决方案。
发明人基于本发明的技术原理进行了实验,实验数据如下:
实验环境:
操作系统:Ubuntu20.04.5LTS
CPU:Intel(R)Xeon(R)Platinum8362CPU@2.80GHz
GPU:NVIDIAA30*2
内存:1TB
还需要说明的是,虽然本发明已以较佳实施例披露如上,然而上述实施例并非用以限定本发明。对于任何熟悉本领域的技术人员而言,在不脱离本发明技术方案范围情况下,都可利用上述揭示的技术内容对本发明技术方案作出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围。
还应当理解的是,除非特别说明或者指出,否则说明书中的术语“第一”、“第二”、“第三”等描述仅仅用于区分说明书中的各个组件、元素、步骤等,而不是用于表示各个组件、元素、步骤之间的逻辑关系或者顺序关系等。
此外还应该认识到,此处描述的术语仅仅用来描述特定实施例,而不是用来限制本发明的范围。必须注意的是,此处的以及所附权利要求中使用的单数形式“一个”和“一种”包括复数基准,除非上下文明确表示相反意思。例如,对“一个步骤”或“一个装置”的引述意味着对一个或多个步骤或装置的引述,并且可能包括次级步骤以及次级装置。应该以最广义的含义来理解使用的所有连词。以及,词语“或”应该被理解为具有逻辑“或”的定义,而不是逻辑“异或”的定义,除非上下文明确表示相反意思。此外,本发明实施例的实现可包括手动、自动或组合地执行所选任务。

Claims (9)

1.一种故障诊断执行方法,其特征在于,包括以下步骤:
根据故障诊断流程,设置多个子任务单元,所述故障诊断流程用于处理用户提出的故障问题;
针对至少一个所述子任务单元,对应设置监督代理模型,所述监督代理模型包括监督指标;
根据接收到所述用户提出的故障问题,所述子任务单元生成对应的任务内容;
调用所述监督代理模型评估所述任务内容,若所述任务内容符合所述监督指标,则允许进入下一个所述子任务单元或执行该子任务单元的任务内容;
所述根据接收到所述用户提出的故障问题,所述子任务单元生成对应的任务内容,具体包括:
建立知识库,所述知识库包括能够解决所述用户提出的故障问题的经验知识;
建立提示系统,所述提示系统包括多个预先设置的标准格式问题;
将所述用户提出的故障问题转化为第一向量,将所述标准格式问题转化为第二向量,根据所述第一向量和所述第二向量之间的距离,在多个所述标准格式问题中选取出与所述用户提出的故障问题相似的相似问题;
所述子任务单元具有任务标签,根据所述相似问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容。
2.如权利要求1所述的故障诊断执行方法,其特征在于,所述根据接收到所述用户提出的故障问题,所述子任务单元生成对应的任务内容,具体包括:
建立知识库,所述知识库包括能够解决所述用户提出的故障问题的经验知识;
所述子任务单元具有任务标签,根据所述用户提出的故障问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容。
3.如权利要求2所述的故障诊断执行方法,其特征在于,所述根据所述用户提出的故障问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容,具体包括:
根据所述用户提出的故障问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的数据段;
所述知识库包括多个文本,选取出与所述数据段相对应的文本,根据所述用户提出的故障问题和所述任务标签,在被选取出的所述文本中检索出与所述子任务单元适配的任务内容。
4.如权利要求1所述的故障诊断执行方法,其特征在于,所述根据所述相似问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容,具体包括:
将所述用户提出的故障问题和\或所述相似问题作为指令,输入给大语言模型,利用所述大语言模型生成智能转写问题;
根据所述智能转写问题和所述任务标签,在所述知识库中检索出与所述子任务单元适配的任务内容。
5.如权利要求1所述的故障诊断执行方法,其特征在于,所述子任务单元包括以下单元中的至少一种:
原因子任务单元,用于根据所述用户提出的故障问题,生成故障原因作为所述任务内容;
计划子任务单元,用于根据所述用户提出的故障问题和所述故障原因,生成故障排查计划作为所述任务内容;
方法子任务单元,用于执行所述故障排查计划。
6.如权利要求1所述的故障诊断执行方法,其特征在于,所述监督指标的获取方式为:
利用多个合格的以往的所述任务内容,训练一深度学习模型作为所述监督代理模型,以使所述监督代理模型具有所述监督指标。
7.一种故障诊断执行系统,应用于如权利要求1至6中任一所述的故障诊断执行方法,其特征在于,包括:
第一设置模块,用于根据所述故障诊断流程,设置多个所述子任务单元;
第二设置模块,用于针对至少一个所述子任务单元,对应设置监督代理模型;
第一执行模块,用于根据接收到所述用户提出的故障问题,调用所述子任务单元生成对应的任务内容;
第二执行模块,用于调用所述监督代理模型评估所述任务内容,若所述任务内容符合所述监督指标,则允许进入下一个所述子任务单元或执行该子任务单元的任务内容。
8.一种电子设备,其特征在于,包括:
存储器,存储有计算机程序;
处理器,与所述存储器通信相连,调用所述计算机程序时执行如权利要求1-6中任一项所述的故障诊断执行方法;
显示器,与所述处理器和所述存储器通信相连,用于显示与所述故障诊断执行方法相关GUI交互界面。
9.一种存储介质,存储有计算机程序,其特征在于:该计算机程序被处理器执行时实现如权利要求1-6中任一项所述的故障诊断执行方法。
CN202410281699.7A 2024-03-13 2024-03-13 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质 Active CN117873909B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410281699.7A CN117873909B (zh) 2024-03-13 2024-03-13 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410281699.7A CN117873909B (zh) 2024-03-13 2024-03-13 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN117873909A CN117873909A (zh) 2024-04-12
CN117873909B true CN117873909B (zh) 2024-05-28

Family

ID=90581622

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410281699.7A Active CN117873909B (zh) 2024-03-13 2024-03-13 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117873909B (zh)

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003076549A (ja) * 2001-08-31 2003-03-14 Fujitsu Ltd 故障診断装置、故障診断システム、および故障診断プログラム
CN104036112A (zh) * 2014-04-24 2014-09-10 河海大学 一种基于支持向量机与专家系统的故障诊断方法
CN109902153A (zh) * 2019-04-02 2019-06-18 杭州安脉盛智能技术有限公司 基于自然语言处理和案例推理的设备故障诊断方法及系统
WO2020047779A1 (zh) * 2018-09-05 2020-03-12 西门子(中国)有限公司 故障分析方法、装置和计算机可读介质
CN111221919A (zh) * 2018-11-27 2020-06-02 波音公司 用于生成飞机故障预测分类器的系统和方法
EP3716157A1 (en) * 2019-03-28 2020-09-30 Canon Medical Systems Corporation Apparatus and method for training models
WO2021082982A1 (zh) * 2019-10-29 2021-05-06 平安科技(深圳)有限公司 基于图谱化知识库的问答方法、设备、存储介质及装置
CN114118222A (zh) * 2021-11-02 2022-03-01 国家能源集团华北电力有限公司廊坊热电厂 一种磨煤机状态预警系统及故障识别诊断方法
CN114358075A (zh) * 2021-12-31 2022-04-15 北京化工大学 一种数据驱动的转子系统典型故障自动识别方法
CN115203364A (zh) * 2022-06-23 2022-10-18 平安科技(深圳)有限公司 软件故障反馈处理方法、装置、设备及可读存储介质
CN116186946A (zh) * 2023-05-04 2023-05-30 无锡华瀚能源装备科技有限公司 一种基于诊断模型的液压系统故障诊断方法及系统
WO2023109251A1 (zh) * 2021-12-17 2023-06-22 浪潮电子信息产业股份有限公司 一种系统故障检测方法、装置、设备及介质
WO2023125059A1 (zh) * 2021-12-29 2023-07-06 中兴通讯股份有限公司 故障数据获取方法、故障处理方法、电子设备及存储介质
CN117251641A (zh) * 2023-11-20 2023-12-19 上海爱可生信息技术股份有限公司 向量数据库检索方法、系统、电子设备及存储介质
CN117331730A (zh) * 2023-09-14 2024-01-02 南京领行科技股份有限公司 故障诊断方法、装置、电子设备及存储介质
CN117474093A (zh) * 2023-11-01 2024-01-30 重庆长安汽车股份有限公司 一种汽车故障知识图谱构建方法及系统
CN117592563A (zh) * 2023-10-31 2024-02-23 国网安徽省电力有限公司信息通信分公司 一种领域知识增强的电力大模型训调方法
CN117666546A (zh) * 2024-01-31 2024-03-08 中核武汉核电运行技术股份有限公司 一种分布式控制系统故障诊断方法及装置

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003076549A (ja) * 2001-08-31 2003-03-14 Fujitsu Ltd 故障診断装置、故障診断システム、および故障診断プログラム
CN104036112A (zh) * 2014-04-24 2014-09-10 河海大学 一种基于支持向量机与专家系统的故障诊断方法
WO2020047779A1 (zh) * 2018-09-05 2020-03-12 西门子(中国)有限公司 故障分析方法、装置和计算机可读介质
CN111221919A (zh) * 2018-11-27 2020-06-02 波音公司 用于生成飞机故障预测分类器的系统和方法
EP3716157A1 (en) * 2019-03-28 2020-09-30 Canon Medical Systems Corporation Apparatus and method for training models
CN109902153A (zh) * 2019-04-02 2019-06-18 杭州安脉盛智能技术有限公司 基于自然语言处理和案例推理的设备故障诊断方法及系统
WO2021082982A1 (zh) * 2019-10-29 2021-05-06 平安科技(深圳)有限公司 基于图谱化知识库的问答方法、设备、存储介质及装置
CN114118222A (zh) * 2021-11-02 2022-03-01 国家能源集团华北电力有限公司廊坊热电厂 一种磨煤机状态预警系统及故障识别诊断方法
WO2023109251A1 (zh) * 2021-12-17 2023-06-22 浪潮电子信息产业股份有限公司 一种系统故障检测方法、装置、设备及介质
WO2023125059A1 (zh) * 2021-12-29 2023-07-06 中兴通讯股份有限公司 故障数据获取方法、故障处理方法、电子设备及存储介质
CN114358075A (zh) * 2021-12-31 2022-04-15 北京化工大学 一种数据驱动的转子系统典型故障自动识别方法
CN115203364A (zh) * 2022-06-23 2022-10-18 平安科技(深圳)有限公司 软件故障反馈处理方法、装置、设备及可读存储介质
CN116186946A (zh) * 2023-05-04 2023-05-30 无锡华瀚能源装备科技有限公司 一种基于诊断模型的液压系统故障诊断方法及系统
CN117331730A (zh) * 2023-09-14 2024-01-02 南京领行科技股份有限公司 故障诊断方法、装置、电子设备及存储介质
CN117592563A (zh) * 2023-10-31 2024-02-23 国网安徽省电力有限公司信息通信分公司 一种领域知识增强的电力大模型训调方法
CN117474093A (zh) * 2023-11-01 2024-01-30 重庆长安汽车股份有限公司 一种汽车故障知识图谱构建方法及系统
CN117251641A (zh) * 2023-11-20 2023-12-19 上海爱可生信息技术股份有限公司 向量数据库检索方法、系统、电子设备及存储介质
CN117666546A (zh) * 2024-01-31 2024-03-08 中核武汉核电运行技术股份有限公司 一种分布式控制系统故障诊断方法及装置

Also Published As

Publication number Publication date
CN117873909A (zh) 2024-04-12

Similar Documents

Publication Publication Date Title
CN111078837B (zh) 智能问答信息处理方法、电子设备及计算机可读存储介质
CN111597243B (zh) 基于数据仓库抽象数据加载的方法及系统
CN114238629A (zh) 一种基于自动提示推荐的语言处理方法、装置及终端
US11829388B2 (en) System and method for identifying questions of users of a data management system
CN111651994B (zh) 一种信息抽取方法、装置、电子设备和存储介质
CN113988071A (zh) 一种基于金融知识图谱的智能对话方法及装置、电子设备
CN109657803A (zh) 机器学习模型的构建
Bazaga et al. Translating synthetic natural language to database queries with a polyglot deep learning framework
CN113343677B (zh) 一种意图识别方法、装置、电子设备及存储介质
CN117873909B (zh) 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质
CN117520514A (zh) 一种问答任务处理方法、装置、设备及可读存储介质
CN111831624A (zh) 数据表创建方法、装置、计算机设备及存储介质
CN116560631A (zh) 一种机器学习模型代码的生成方法及装置
CN116842076A (zh) 一种数据分析方法、装置、分析设备及可读存储介质
CN116955393A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN112181951B (zh) 一种异构数据库数据迁移方法、装置及设备
CN110955755A (zh) 一种确定目标标准信息的方法和系统
CN117806980B (zh) 一种基于大语言模型的测试用例自动生成装置
CN117743315B (zh) 一种为多模态大模型系统提供高质量数据的方法
CN117744803A (zh) 基于大语言模型的路径与约束分解知识库问答方法及系统
CN118070925A (zh) 模型训练方法、装置、电子设备、存储介质及程序产品
CN117421415A (zh) 数据处理方法、装置、电子设备及存储介质
CN117708282A (zh) 一种基于大语言模型的知识问答方法及系统
CN117009505A (zh) 观点识别方法、装置、设备及存储介质
CN117709357A (zh) 一种基于大语言模型的ai智能机器人交互处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant