CN117666546A - 一种分布式控制系统故障诊断方法及装置 - Google Patents
一种分布式控制系统故障诊断方法及装置 Download PDFInfo
- Publication number
- CN117666546A CN117666546A CN202410130086.3A CN202410130086A CN117666546A CN 117666546 A CN117666546 A CN 117666546A CN 202410130086 A CN202410130086 A CN 202410130086A CN 117666546 A CN117666546 A CN 117666546A
- Authority
- CN
- China
- Prior art keywords
- fault
- data
- distributed control
- control system
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims abstract description 42
- 239000013598 vector Substances 0.000 claims abstract description 69
- 238000012545 processing Methods 0.000 claims abstract description 56
- 230000006698 induction Effects 0.000 claims abstract description 37
- 238000004364 calculation method Methods 0.000 claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 21
- 230000002776 aggregation Effects 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 238000000605 extraction Methods 0.000 claims description 14
- 238000011156 evaluation Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 7
- 230000009467 reduction Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000013500 data storage Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 206010058009 Subacute myelo-opticoneuropathy Diseases 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 101100481876 Danio rerio pbk gene Proteins 0.000 description 1
- 241000282842 Lama glama Species 0.000 description 1
- 101100481878 Mus musculus Pbk gene Proteins 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 238000010225 co-occurrence analysis Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0259—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
- G05B23/0262—Confirmation of fault detection, e.g. extra checks to confirm that a failure has indeed occurred
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/20—Pc systems
- G05B2219/24—Pc safety
- G05B2219/24065—Real time diagnostics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种分布式控制系统故障诊断方法及装置,其中,方法包括以下步骤:收集分布式控制系统的故障处理经验文档,建立数据汇聚中心;对数据汇聚中心中故障处理经验文档进行数据预处理,得到故障样本数据,建立样本数据集;利用样本数据集对大语言模型进行训练,得到故障文本归纳模型以及训练后的标准数据集;对标准数据集中数据进行向量计算,构建知识库体系;获取待解决的故障现象数据,并将故障现象数据输入故障文本归纳模型得到标准故障数据,对标准故障数据进行向量计算,并在知识库体系中进行向量匹配,得到相应的故障处理方式。本发明提供的分布式控制系统故障诊断方法具有故障诊断准确性、自适应性以及实时性好的效果。
Description
技术领域
本发明涉及分布式控制系统技术领域,尤其涉及一种分布式控制系统故障诊断方法及装置。
背景技术
随着核电技术的蓬勃发展,DCS系统(Distributed Control System,分布式控制系统或集散控制系统)逐渐从原来的配角角色转变居于决定各工业企业安全经济运行的主角地位。实践证明,DCS 系统的应用,在大大减轻了工作人员的工作强度的同时,提高了工作效率。然而,在实际运行中,DCS 系统可能出现故障,导致生产过程受到影响。因此,如何快速、准确地诊断 DCS 系统故障,为维修人员提供有效的决策支持,成为亟待解决的问题。
现有的主要DCS 系统故障诊断方法及其固有问题如下。
1、基于专家系统进行DCS系统故障诊断,是指通过收集和整理故障现象、原因和处理方法等经验知识构建知识库,当系统发生故障时,专家系统根据知识库和推理引擎进行故障诊断。这种方式过于依赖专家经验,自适应性和普适性较差,难以应对复杂故障场景。
2、基于数据挖掘进行DCS系统故障诊断,是指通过分析实时数据和历史故障数据,识别故障模式,从而实现故障诊断。这种方式对于新型故障和未知故障的诊断效果有限。
3、基于人工神经网络进行DCS系统故障诊断,指通过人工神经网络学习和识别故障特征,从而实现故障诊断。这种方式需要大量的训练数据和计算资源。
4、基于模糊逻辑进行DCS系统故障诊断,指利用处理故障诊断中的不确定性信息,提高故障诊断的准确性。这种方式需要构建合适的模糊规则库。
5、基于实时监控和报警系统进行DCS系统故障诊断,指通过实时监测DCS系统的运行状态,一旦发现异常,立即发出报警。这种方式对人力要求极大,对操作人员的专业要求极高,事故处理完全依赖工作人员的瞬时反应和经验。
6、基于维修经验进行DCS系统故障诊断,是利用维修人员在长期的维修实践中积累的故障诊断经验进行故障诊断。这种方式同样对人力要求极大,对操作人员的专业要求极高,事故处理完全依赖工作人员的瞬时反应和经验。
发明内容
有鉴于此,有必要提供一种分布式控制系统故障诊断方法,以有效解决DCS系统故障诊断准确性、自适应性以及实时性较差的技术问题。
本发明提供一种分布式控制系统故障诊断方法,包括以下步骤:
步骤S1、收集分布式控制系统的故障处理经验文档,建立数据汇聚中心;
步骤S2、对所述数据汇聚中心中故障处理经验文档进行数据预处理,得到故障样本数据,建立样本数据集;
步骤S3、利用所述样本数据集对大语言模型进行训练,得到故障文本归纳模型以及训练后的标准数据集;
步骤S4、对所述标准数据集中数据进行向量计算,构建知识库体系;
步骤S5、获取待解决的故障现象数据,并将所述故障现象数据输入所述故障文本归纳模型得到标准故障数据,对所述标准故障数据进行向量计算,并在所述知识库体系中进行向量匹配,得到相应的故障处理方式。
优选的,所述步骤S1中收集分布式控制系统的故障处理经验文档,建立数据汇聚中心,具体为:
使用数据扭转引擎对不同分布式控制系统的故障处理经验文档进行数据同步,使用数据存储引擎对所述故障处理经验文档进行存储,得到构建的数据汇聚中心。
优选的,所述步骤S2中对所述数据汇聚中心中故障处理经验文档进行数据预处理,得到故障样本数据,建立样本数据集,具体包括以下步骤:
步骤S21、对所述故障处理经验文档进行文字提取,得到历史故障数据,对所述历史故障数据进行分词处理;
步骤S22、识别所述历史故障数据中实体以及实体之间的相互关系,并建立语义网络;
步骤S23、计算所述语义网络中的各词汇的词频以及各词汇之间的关联度;
步骤S24、基于所述词频以及所述关联度提取关键信息,构建故障样本数据,得到样本数据集。
优选的,所述步骤S3中利用所述样本数据集对大语言模型进行训练,得到故障文本归纳模型以及训练后的标准数据集,具体为:
选择大语言模型中基座模型,在所述基座模型的输入层中引入虚拟token,使用带有虚拟token的故障样本数据对所述基座模型进行训练,得到故障文本归纳模型以及训练后的标准数据集。
优选的,所述步骤S3还包括:
利用测试集对所述故障文本归纳模型进行性能评估,判断性能评估参数是否满足设定要求,如果是,则输出当前故障文本归纳模型,否则重新调整所述故障文本归纳模型参数,并继续对所述故障文本归纳模型进行训练。
优选的,所述步骤S4中对所述标准数据集中数据进行向量计算,构建知识库体系,具体为:
对所述标准数据集中的每一文本块数据进行向量计算得到特征向量,对所述特征向量进行特征抽取得到降维后的特征向量,基于降维后的特征向量之间的欧氏距离建立索引,得到构建的知识库体系。
优选的,所述步骤S5中对所述标准故障数据进行向量计算,具体为:
采用与构建知识库体系一样的向量计算方式对所述标准故障数据进行向量计算。
优选的,所述步骤S5中在所述知识库体系中进行向量匹配,得到相应的故障处理方式,具体为:
基于所述知识库体系的索引,将所述标准数据的向量计算结果与所述知识库体系中每一特征向量进行匹配,返回匹配度最高的前设定条特征向量作为向量结果数据,将所述向量结果数据输入所述故障文本归纳模型,得到相应的文本数据作为所述故障处理方式。
优选的,所述步骤S5还包括:
在所述数据汇聚中心中查找与所述故障处理方式相对应的故障处理经验文档,并输出所述故障处理经验文档作为用户的参考学习文件。
本发明还提供一种分布式控制系统故障诊断装置,包括存储器和处理器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时实现所述分布式控制系统故障诊断方法。
与现有技术相比,本发明具有的有益效果为:本发明采用大语言模型构建针对DCS故障诊断的智能化辅助决策系统,具有以下效果:
1、提高决策效率:决策者可以应用本方法快速获取有关决策主题的全面信息,从而缩短决策周期,提高决策效率;
2、提高决策质量:本方法对大量历史故障数据进行挖掘分析,为决策者提供有力证据和依据,有助于提高决策的科学性、准确性和前瞻性;
3、实现数据驱动的决策:通过构建数据汇聚中心、知识库体系、故障文本归纳模型,帮助决策者充分利用现有数据,实现数据驱动的诊断决策;
4、易用性:使用大语言模型帮助准确理解用户提出的问题,快速掌握系统的操作和功能高效处理核应急领域的自然语言问题,使决策者能够轻松上手,进而快速找到合适的答案;
5、高性能:具备良好的扩展性,便于在未来随着需求增长进行升级和扩展。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明提供的一种分布式控制系统故障诊断方法一实施例的流程图;
图2是图1所示实施例中分布式控制系统故障诊断方法的故障诊断架构图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
实施例一,请参阅图1,本实施例中的一种分布式控制系统故障诊断方法,具体包括如下步骤:
步骤S1、收集分布式控制系统的故障处理经验文档,建立数据汇聚中心;
步骤S2、对所述数据汇聚中心中故障处理经验文档进行数据预处理,得到故障样本数据,建立样本数据集;
步骤S3、利用所述样本数据集对大语言模型进行训练,得到故障文本归纳模型以及训练后的标准数据集;
步骤S4、对所述标准数据集中数据进行向量计算,构建知识库体系;
步骤S5、获取待解决的故障现象数据,并将所述故障现象数据输入所述故障文本归纳模型得到标准故障数据,对所述标准故障数据进行向量计算,并在所述知识库体系中进行向量匹配,得到相应的故障处理方式。
大语言模型(Large Language Model,简称 LLM)作为一种先进的人工智能技术,近年来在诸多方面取得了重大突破,在国内和国际上引起了广泛的关注,可以为DCS系统的故障诊断提供辅助决策、安全管理、人才培养等智能支持。基于此,本实施例提出一种基于大语言模型的 DCS 故障诊断辅助决策系统构建方法,旨在提高故障诊断的准确性、自适应性和实时性。其利用计算机技术、人工智能、数据挖掘等方法,对大量数据进行分析和处理,为决策者提供决策支持和知识。
具体的,首先进行数据汇聚,收集DCS系统的历史故障数据,包括故障现象、故障原因、故障处理过程等结构化与非结构化数据。然后进行数据预处理,对故障处理经验文档进行文本数据提取。使用大语言模型作为语言组织组件,对预处理后的文本数据进行数据样本制作,捕捉文本数据中的语义信息和上下文关系。利用收集的故障样本数据训练大语言模型,得到故障文本归纳模型,通过多轮训练,使模型能够识别故障现象、故障原因和故障处理方法之间的关联。故障诊断辅助决策实现:将训练好的故障文本归纳模型部署到实际生产环境中,实现对实时故障诊断的辅助决策支持。优选的,在数据处理和传输过程中,应确保用户数据的安全性,防止泄露和篡改。针对敏感信息,应采取适当的加密和脱敏措施,保护用户隐私。
进一步的,本实施例中,所述步骤S1中收集分布式控制系统的故障处理经验文档,建立数据汇聚中心,具体为:
使用数据扭转引擎对不同分布式控制系统的故障处理经验文档进行数据同步,使用数据存储引擎对所述故障处理经验文档进行存储,得到构建的数据汇聚中心。
为提高故障诊断的适应性,前期需要进行较多的故障文档汇聚,故障文档可以是专家经验文档、DCS系统故障日志、事故记录文档等。需要从不同的系统中抽取文档内容,涉及的数据量大且涵盖的范围较广,因此需要建立一个数据汇聚中心,作为信息的接入平台。本实施例选用DataX作为数据扭转引擎,采用Elasticsearch作为数据存储引擎,实现数据汇聚中心的建立。
进一步的,本实施例中,所述步骤S2中对所述数据汇聚中心中故障处理经验文档进行数据预处理,得到故障样本数据,建立样本数据集,具体包括以下步骤:
步骤S21、对所述故障处理经验文档进行文字提取,得到历史故障数据,对所述历史故障数据进行分词处理;
步骤S22、识别所述历史故障数据中实体以及实体之间的相互关系,并建立语义网络;
步骤S23、计算所述语义网络中的各词汇的词频以及各词汇之间的关联度;
步骤S24、基于所述词频以及所述关联度提取关键信息,构建故障样本数据,得到样本数据集。
由于数据汇聚中心中的文档来源、数据格式各不相同,因此在利用其对大语言模型进行训练之前需要进行数据预处理。首先对故障处理经验文档进行文本提取识别,例如,故障处理经验文档有可能是Word、PDF、TXT、JSON等类型文件,可以采用OCR提取PDF和Word中的文字,Excel文档通过前置程序转为CSV格式的文件再进行文字提取。
文字提取完成后根据语言选择不同的分词工具进行分词,将文字文本转换为词汇的列表,去除停用词,例如“的”、“和”、“是”等,以减少噪音,去除标点符号和特殊字符。不同语言采用不同的分词工具,例如,中文可以采用jieba、THULAC,英文可以采用NLTK、spaCy等。
使用分词工具或者自然语言处理库如spaCy,或者专门的实体识别工具如Stanford NLP进行命名实体识别与关系抽取等流程,识别文本中的实体如人名、地点、组织等,同时识别实体之间的关系,例如主谓关系、动宾关系等。
将识别的实体作为网络的节点。将实体之间的关系作为边的权重,边的方向由关系的类型决定,例如从主语指向谓语。这些实体和关系将作为语义网络的节点和边,构成一个有向图。根据需要对构建的语义网络进行优化,例如调整权重、剪枝、消除冗余关系等,以提高网络的质量和可用性。
根据语义网络计算词汇分布,对语义网络中的词汇进行统计分析,计算每个词汇的出现频率、与其他词汇的关联度等。这可以通过各种统计方法来实现,如词频统计、共现分析、共引分析等。
最后,对计算得到的词汇分布进行分析,提取有用的信息,如关键词、主题模型等,构建故障样本数据。
具体的,例如数据汇聚中心收集了一篇名为“人工智能在医疗领域的应用”的文章作为故障处理经验文档。对文章进行分词得到词汇列表,去除停用词,保留关键词如“人工智能”、“医疗”、“应用”。实体识别与关系抽取:识别出实体如“人工智能”是一个技术领域,“医疗”是一个应用领域,“应用”是一个动作。构建语义网络:将“人工智能”、“医疗”、“应用”作为节点,创建边来表示它们之间的关系,例如,“人工智能”应用于“医疗”领域。计算词汇分布:统计每个词汇的出现频率,如“人工智能”和“医疗”出现的频率较高。通过这个过程,我们可以构建一个关于人工智能在医疗领域应用的语义网络,从而更好地理解和分析文章的主题和内容。这个语义网络可以用于进一步的文本分析和应用,如文本分类、推荐系统等。
进一步的,本实施例中,所述步骤S3中利用所述样本数据集对大语言模型进行训练,得到故障文本归纳模型以及训练后的标准数据集,具体为:
选择大语言模型中基座模型,在所述基座模型的输入层中引入虚拟token,使用带有虚拟token的故障样本数据对所述基座模型进行训练,得到故障文本归纳模型以及训练后的标准数据集。
样本数据集建立后,利用其对大语言模型进行微调,微调是在一个已经预训练好的大语言模型基础上,通过使用领域特定的数据集进行额外的训练来适应特定任务或领域,可以使模型更好地适应你的数据,提高性能。在选择大语言模型时,需要根据故障处理经验文档的语种进行选择切换,针对不同的语种配置不同的大语言模型基座,例如,如果故障处理经验文档是中/英双语语种,则可以选择ChatGLM3-6B-Base、Qwen-14B、Baichuan-13B等大语言模型基座,如果故障处理经验文档均为中文,则可以选择Chinese-LLaMA2-7B或其它类似大语言模型,如果故障处理经验文档均为英文,则可以选择LLaMA-2-13B、LLaMa等大语言基座模型。本实施例选择大语言模型基座模型LLaMa2进行微调得到微调后的模型,即故障文本归纳模型。具体的,通过样本数据集对基座模型进行训练,从而在基座模型中加入我们自己的对话模型,使得大语言模型适应本实施例的特定任务和特定领域。
具体的,通过在输入层引入可学习的虚拟token来适应特定的任务,这些虚拟token与任务特定的提示相关联。定义任务特定的提示:设计一个任务特定的提示,这个提示是由一系列固定的token组成的,它能够引导基座模型生成与任务相关的输出。虚拟token的位置和数量可以根据任务的需要进行调整。使用带有虚拟token的样本数据对基座模型进行训练,在训练过程中,基座模型的参数会更新,以便更好地适应任务。使用虚拟token的优点在于它不需要对整个基座模型进行微调,而只需要在输入层引入少量的虚拟token,从而减少了微调的复杂性和计算成本;此外,还能够提高微调后模型在特定任务上的性能。
进一步的,本实施例中,所述步骤S3还包括:
利用测试集对所述故障文本归纳模型进行性能评估,判断性能评估参数是否满足设定要求,如果是,则输出当前故障文本归纳模型,否则重新调整所述故障文本归纳模型参数,并继续对所述故障文本归纳模型进行训练。
样本数据集对模型训练完成后,在测试集上评估微调后模型的性能,以确定微调后模型的泛化能力;迭代优化。根据微调后模型在任务上的表现,可能需要进行多次迭代来调整虚拟token的位置、数量或模型的其它模型参数,以进一步提高性能。一旦微调后模型在任务上达到满意的性能,就可以将其部署到生产环境中,用于实际的预测或生成任务。
进一步的,本实施例中,所述步骤S4中对所述标准数据集中数据进行向量计算,构建知识库体系,具体为:
对所述标准数据集中的每一文本块数据进行向量计算得到特征向量,对所述特征向量进行特征抽取得到降维后的特征向量,基于降维后的特征向量之间的欧氏距离建立索引,得到构建的知识库体系。
本方法采用embedding模型对文本块数据进行计算、降维以及建立索引,从而构建知识库体系。embedding模型是实时更新模型,会根据不同语种选择不同模型,有双语和单语种的。例如,当切割完成的文本块是中/英双语语种,则可以选择bge-reranker-large、m3e-large等embedding模型,如果文本块为中文,则可以选择bge-large-zh-v1.5、ext2vec-bge-large-chinese等embedding模型,如果文本块为英文,则可以选择llm-embedder、bge-large-en-v1.5等embedding模型。文本切片的长度会影响embedding模型的检索精度,因此在使用embedding模型构建知识库体系前,要根据embedding模型的需求控制好切割长度。具体的,本实施例选择前置embedding模型m3e-large,对切割完成的文本块进行向量计算,对文本块List进行特征向量抽取,采用欧氏距离建立索引。
进一步的,本实施例中,所述步骤S5中对所述标准故障数据进行向量计算,具体为:
采用与构建知识库体系一样的向量计算方式对所述标准故障数据进行向量计算。
进一步的,本实施例中,所述步骤S5中在所述知识库体系中进行向量匹配,得到相应的故障处理方式,具体为:
基于所述知识库体系的索引,将所述标准数据的向量计算结果与所述知识库体系中每一特征向量进行匹配,返回匹配度最高的前设定条特征向量作为向量结果数据,将所述向量结果数据输入所述故障文本归纳模型,得到相应的文本数据作为所述故障处理方式。
故障文本归纳模型训练完成后即可投入使用。在用户需要进行故障诊断时,使用LLM模型对用户输入的问题进行关键字提取和语言归纳,得到故障现象数据,对故障现象数据中关键字与段落进行向量计算,同样选择前置embedding模型m3e-large进行计算,分别查询TopK索引,将匹配度最高的前三条向量结果返回给LLM模型进行推理得到文本数据,并将文本数据进行归纳整理返回最终的故障处理方式给客户。
进一步的,本实施例中,所述步骤S5还包括:
在所述数据汇聚中心中查找与所述故障处理方式相对应的故障处理经验文档,并输出所述故障处理经验文档作为用户的参考学习文件。
本实施例借助大语言模型帮助客户提供准确的诊断答案和解决方案,同时找出相应的故障处理经验文档返回给用户,可以作为培训材料,帮助相关人员掌握所需知识和技能。从多方面提高在实际操作中对DCS 故障诊断的工作效率和准确性,从而提高整体诊断响应能力。
为了帮助本领域技术人员更好的理解本发明,图2给出了本实施例的故障诊断架构图。如图2所示,本实施例进行知识库体系的建立,知识库体系与DCS系统之间通过API接口连接以实现向量相似性匹配。知识库体系的建立首先收集故障样本数据建立样本数据集,接着以大语言模型作为数据解析器进行文本解析,基于解析后的文本建立向量数据库,实现知识库体系的建立。DCS系统这边出现故障时,现将故障信号转换为模型信号输入前置处理器,即大语言模型,得到标准故障信号后再进行向量计算、特征向量提取,实现标准故障信号的向量低维度映射,最后通过API接口在知识库体系中进行向量匹配,得到向量匹配结果,向量匹配结果进行文本匹配后得到相应的文本匹配结果,文本匹配结果通过后置处理器,即大语言模型道德整理归纳,得到故障处理方式,故障处理方式返回至控制执行系统,控制执行系统实现对DCS系统的故障诊断执行。
为了帮助本领域技术人员更好的理解本发明,下面给出本实施例的三个应用示例。
当用户输入“若出现代码 -41 Error returned from IPC -Exceeded allowableOM Updates/second 说明了什么问题”,经过模型以及知识库体系匹配后输出回答“根据已知信息,该错误信息显示在IPC子系统中。错误码为-41,错误类型为EIPCRET,错误描述为Error returned from IPC -Exceeded allowable OM Updates/second。这个错误通常表示IPC子系统已达到其允许的最大更新速率,可能是由于系统负载过高导致的。因此,解决此问题的方法是降低系统负载,例如通过增加资源预算或减少并行处理任务的数量”。
当用户输入“若出现代码14 IRDA_WR_FLASH_FAIL是出现了什么问题”,经过模型以及知识库体系匹配后输出回答,回答为“根据已知信息,该错误信息显示在IRDA子系统中,错误类型为IRDA_WR_FLASH_FAIL,错误描述为IRDA:Write Flash Fail -device isnot responding。这个错误通常表示IRDA子系统无法与设备通信,可能是由于设备故障或连接问题导致的。因此,解决此问题的方法是确认设备是否正常运行,并检查设备连接是否正确”。
当用户输入“若出现代码-72 SM_MON_A_XMTR_FAILED是出现了什么问题”,经过模型以及知识库体系匹配后输出回答,回答为“根据已知信息,该错误信息显示在SMON子系统中,错误码为-72,错误类型为SM_MON_A_XMTR_FAILED,错误描述为SMON:Monitoringsubsystem failed-all devices are offline。这个错误通常表示SMON子系统无法与设备通信,可能是由于设备故障或连接问题导致的。因此解决此问题的方法是确认设备是否正常运行,并检查设备连接是否正确”。
上面所给出的三个应用示例仅用于说明本发明的应用方式,其示例的输入信息、输出结果用于帮助本领域技术人员更好的理解本发明,并不用于限定本发明。在实际运用过程中,用户输入的信息更加多样化,更贴近实际的故障诊断环境,其输出结果则自然可以帮助用户解决更多的实际问题,本发明在应对用户输入的不同信息,均能很好的理解并输出贴近用户需求的信息,辅助用户解决实际的DCS系统故障。
实施例二,本实施例提供一种分布式控制系统故障诊断装置,包括存储器和处理器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时实现实施例一所述的分布式控制系统故障诊断方法。
本实施例提供的分布式控制系统故障诊断装置,用于实现分布式控制系统故障诊断方法,因此,分布式控制系统故障诊断方法所具备的技术效果,分布式控制系统故障诊断装置同样具备,在此不再赘述。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明之内。
Claims (10)
1.一种分布式控制系统故障诊断方法,其特征在于,包括以下步骤:
步骤S1、收集分布式控制系统的故障处理经验文档,建立数据汇聚中心;
步骤S2、对所述数据汇聚中心中故障处理经验文档进行数据预处理,得到故障样本数据,建立样本数据集;
步骤S3、利用所述样本数据集对大语言模型进行训练,得到故障文本归纳模型以及训练后的标准数据集;
步骤S4、对所述标准数据集中数据进行向量计算,构建知识库体系;
步骤S5、获取待解决的故障现象数据,并将所述故障现象数据输入所述故障文本归纳模型得到标准故障数据,对所述标准故障数据进行向量计算,并在所述知识库体系中进行向量匹配,得到相应的故障处理方式。
2.根据权利要求1所述的分布式控制系统故障诊断方法,其特征在于,所述步骤S1中收集分布式控制系统的故障处理经验文档,建立数据汇聚中心,具体为:
使用数据扭转引擎对不同分布式控制系统的故障处理经验文档进行数据同步,使用数据存储引擎对所述故障处理经验文档进行存储,得到构建的数据汇聚中心。
3.根据权利要求1所述的分布式控制系统故障诊断方法,其特征在于,所述步骤S2中对所述数据汇聚中心中故障处理经验文档进行数据预处理,得到故障样本数据,建立样本数据集,具体包括以下步骤:
步骤S21、对所述故障处理经验文档进行文字提取,得到历史故障数据,对所述历史故障数据进行分词处理;
步骤S22、识别所述历史故障数据中实体以及实体之间的相互关系,并建立语义网络;
步骤S23、计算所述语义网络中的各词汇的词频以及各词汇之间的关联度;
步骤S24、基于所述词频以及所述关联度提取关键信息,构建故障样本数据,得到样本数据集。
4.根据权利要求1所述的分布式控制系统故障诊断方法,其特征在于, 所述步骤S3中利用所述样本数据集对大语言模型进行训练,得到故障文本归纳模型以及训练后的标准数据集,具体为:
选择大语言模型中基座模型,在所述基座模型的输入层中引入虚拟token,使用带有虚拟token的故障样本数据对所述基座模型进行训练,得到故障文本归纳模型以及训练后的标准数据集。
5.根据权利要求1所述的分布式控制系统故障诊断方法,其特征在于,所述步骤S3还包括:
利用测试集对所述故障文本归纳模型进行性能评估,判断性能评估参数是否满足设定要求,如果是,则输出当前故障文本归纳模型,否则重新调整所述故障文本归纳模型参数,并继续对所述故障文本归纳模型进行训练。
6.根据权利要求1所述的分布式控制系统故障诊断方法,其特征在于,所述步骤S4中对所述标准数据集中数据进行向量计算,构建知识库体系,具体为:
对所述标准数据集中的每一文本块数据进行向量计算得到特征向量,对所述特征向量进行特征抽取得到降维后的特征向量,基于降维后的特征向量之间的欧氏距离建立索引,得到构建的知识库体系。
7.根据权利要求1所述的分布式控制系统故障诊断方法,其特征在于,所述步骤S5中对所述标准故障数据进行向量计算,具体为:
采用与构建知识库体系一样的向量计算方式对所述标准故障数据进行向量计算。
8.根据权利要求1所述的分布式控制系统故障诊断方法,其特征在于,所述步骤S5中在所述知识库体系中进行向量匹配,得到相应的故障处理方式,具体为:
基于所述知识库体系的索引,将所述标准数据的向量计算结果与所述知识库体系中每一特征向量进行匹配,返回匹配度最高的前设定条特征向量作为向量结果数据,将所述向量结果数据输入所述故障文本归纳模型,得到相应的文本数据作为所述故障处理方式。
9.根据权利要求1所述的分布式控制系统故障诊断方法,其特征在于,所述步骤S5还包括:
在所述数据汇聚中心中查找与所述故障处理方式相对应的故障处理经验文档,并输出所述故障处理经验文档作为用户的参考学习文件。
10.一种分布式控制系统故障诊断装置,其特征在于,包括存储器和处理器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-9中任一所述的分布式控制系统故障诊断方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410130086.3A CN117666546B (zh) | 2024-01-31 | 2024-01-31 | 一种分布式控制系统故障诊断方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410130086.3A CN117666546B (zh) | 2024-01-31 | 2024-01-31 | 一种分布式控制系统故障诊断方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117666546A true CN117666546A (zh) | 2024-03-08 |
CN117666546B CN117666546B (zh) | 2024-05-03 |
Family
ID=90064426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410130086.3A Active CN117666546B (zh) | 2024-01-31 | 2024-01-31 | 一种分布式控制系统故障诊断方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117666546B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117873909A (zh) * | 2024-03-13 | 2024-04-12 | 上海爱可生信息技术股份有限公司 | 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质 |
Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040199573A1 (en) * | 2002-10-31 | 2004-10-07 | Predictive Systems Engineering, Ltd. | System and method for remote diagnosis of distributed objects |
US7383238B1 (en) * | 2004-02-24 | 2008-06-03 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Inductive monitoring system constructed from nominal system data and its use in real-time system monitoring |
CN101464964A (zh) * | 2007-12-18 | 2009-06-24 | 同济大学 | 一种设备故障诊断的支持向量机模式识别方法 |
JP2015194831A (ja) * | 2014-03-31 | 2015-11-05 | 株式会社日立システムズ | 障害現象情報分析装置及び障害現象情報分析方法 |
CN108509483A (zh) * | 2018-01-31 | 2018-09-07 | 北京化工大学 | 基于知识图谱的机械故障诊断知识库构建方法 |
US20180276278A1 (en) * | 2017-03-20 | 2018-09-27 | Carnegie Mellon University | Searching of data structures in pre-processing data for a machine learning classifier |
CN109034368A (zh) * | 2018-06-22 | 2018-12-18 | 北京航空航天大学 | 一种基于dnn的复杂设备多重故障诊断方法 |
CN109766277A (zh) * | 2019-01-02 | 2019-05-17 | 北京航空航天大学 | 一种基于迁移学习与dnn的软件故障诊断方法 |
KR102123522B1 (ko) * | 2019-12-16 | 2020-06-16 | 주식회사 한국가스기술공사 | 고장 데이터의 군집에 기반한 고장 진단 방법 |
CN111580506A (zh) * | 2020-06-03 | 2020-08-25 | 南京理工大学 | 基于信息融合的工业过程故障诊断方法 |
CN112307218A (zh) * | 2020-10-21 | 2021-02-02 | 浙江大学 | 基于知识图谱的智能电厂典型设备故障诊断知识库构建方法 |
CN113279994A (zh) * | 2021-04-14 | 2021-08-20 | 杭州电子科技大学 | 一种基于支持向量机和二型模糊的离心式氮压机故障诊断方法 |
CN113325819A (zh) * | 2021-04-22 | 2021-08-31 | 上海孟伯智能物联网科技有限公司 | 一种基于深度学习算法的连退机组故障诊断方法及系统 |
US11182525B1 (en) * | 2020-07-07 | 2021-11-23 | Infineon Technologies Ag | Fault aware analog model (FAAM) |
CN114856941A (zh) * | 2022-05-18 | 2022-08-05 | 江苏科技大学 | 海上风电场及机组故障诊断运维系统及其诊断运维方法 |
CN115718472A (zh) * | 2022-11-17 | 2023-02-28 | 中国长江电力股份有限公司 | 水电机组故障扫描诊断方法 |
US20230316105A1 (en) * | 2022-04-01 | 2023-10-05 | Aitomatic, Inc. | Artificial intelligence based fault detection for industrial systems |
CN117034143A (zh) * | 2023-10-10 | 2023-11-10 | 南京邮电大学 | 一种基于机器学习的分布式系统故障诊断方法及装置 |
CN117251581A (zh) * | 2023-09-28 | 2023-12-19 | 西安电子科技大学广州研究院 | 一种基于文本分析的设备故障信息诊断方法 |
CN117332858A (zh) * | 2023-10-11 | 2024-01-02 | 武汉理工大学 | 基于知识图谱的汽车故障智能诊断系统的构建方法 |
-
2024
- 2024-01-31 CN CN202410130086.3A patent/CN117666546B/zh active Active
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040199573A1 (en) * | 2002-10-31 | 2004-10-07 | Predictive Systems Engineering, Ltd. | System and method for remote diagnosis of distributed objects |
US7383238B1 (en) * | 2004-02-24 | 2008-06-03 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Inductive monitoring system constructed from nominal system data and its use in real-time system monitoring |
CN101464964A (zh) * | 2007-12-18 | 2009-06-24 | 同济大学 | 一种设备故障诊断的支持向量机模式识别方法 |
JP2015194831A (ja) * | 2014-03-31 | 2015-11-05 | 株式会社日立システムズ | 障害現象情報分析装置及び障害現象情報分析方法 |
US20180276278A1 (en) * | 2017-03-20 | 2018-09-27 | Carnegie Mellon University | Searching of data structures in pre-processing data for a machine learning classifier |
CN108509483A (zh) * | 2018-01-31 | 2018-09-07 | 北京化工大学 | 基于知识图谱的机械故障诊断知识库构建方法 |
CN109034368A (zh) * | 2018-06-22 | 2018-12-18 | 北京航空航天大学 | 一种基于dnn的复杂设备多重故障诊断方法 |
CN109766277A (zh) * | 2019-01-02 | 2019-05-17 | 北京航空航天大学 | 一种基于迁移学习与dnn的软件故障诊断方法 |
KR102123522B1 (ko) * | 2019-12-16 | 2020-06-16 | 주식회사 한국가스기술공사 | 고장 데이터의 군집에 기반한 고장 진단 방법 |
CN111580506A (zh) * | 2020-06-03 | 2020-08-25 | 南京理工大学 | 基于信息融合的工业过程故障诊断方法 |
US11182525B1 (en) * | 2020-07-07 | 2021-11-23 | Infineon Technologies Ag | Fault aware analog model (FAAM) |
CN112307218A (zh) * | 2020-10-21 | 2021-02-02 | 浙江大学 | 基于知识图谱的智能电厂典型设备故障诊断知识库构建方法 |
CN113279994A (zh) * | 2021-04-14 | 2021-08-20 | 杭州电子科技大学 | 一种基于支持向量机和二型模糊的离心式氮压机故障诊断方法 |
CN113325819A (zh) * | 2021-04-22 | 2021-08-31 | 上海孟伯智能物联网科技有限公司 | 一种基于深度学习算法的连退机组故障诊断方法及系统 |
US20230316105A1 (en) * | 2022-04-01 | 2023-10-05 | Aitomatic, Inc. | Artificial intelligence based fault detection for industrial systems |
CN114856941A (zh) * | 2022-05-18 | 2022-08-05 | 江苏科技大学 | 海上风电场及机组故障诊断运维系统及其诊断运维方法 |
CN115718472A (zh) * | 2022-11-17 | 2023-02-28 | 中国长江电力股份有限公司 | 水电机组故障扫描诊断方法 |
CN117251581A (zh) * | 2023-09-28 | 2023-12-19 | 西安电子科技大学广州研究院 | 一种基于文本分析的设备故障信息诊断方法 |
CN117034143A (zh) * | 2023-10-10 | 2023-11-10 | 南京邮电大学 | 一种基于机器学习的分布式系统故障诊断方法及装置 |
CN117332858A (zh) * | 2023-10-11 | 2024-01-02 | 武汉理工大学 | 基于知识图谱的汽车故障智能诊断系统的构建方法 |
Non-Patent Citations (2)
Title |
---|
刘军 等: ""基于多方法联合的故障诊断技术研究"", 《航空计算技术》, vol. 45, no. 1, 31 January 2015 (2015-01-31), pages 111 - 115 * |
郭丽 等: ""基于SVM 专家系统的航空装备故障诊断研究"", 《长沙航空职业技术学院学报》, vol. 22, no. 3, 30 September 2022 (2022-09-30), pages 1 - 5 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117873909A (zh) * | 2024-03-13 | 2024-04-12 | 上海爱可生信息技术股份有限公司 | 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质 |
CN117873909B (zh) * | 2024-03-13 | 2024-05-28 | 上海爱可生信息技术股份有限公司 | 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117666546B (zh) | 2024-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101984730B1 (ko) | 서버 장애 자동 예측 시스템 및 자동 예측 방법 | |
CN110688288B (zh) | 基于人工智能的自动化测试方法、装置、设备及存储介质 | |
US20210035022A1 (en) | Method for updating service system electronic device, and readable storage medium | |
CN117666546B (zh) | 一种分布式控制系统故障诊断方法及装置 | |
CN117271767B (zh) | 基于多智能体的运维知识库的建立方法 | |
CN107103363A (zh) | 一种基于lda的软件故障专家系统的构建方法 | |
CN115858226A (zh) | 基于人工智能的智能运维系统 | |
CN111199469A (zh) | 用户还款模型生成方法、装置及电子设备 | |
CN116361147A (zh) | 测试用例根因定位方法及其装置、设备、介质、产品 | |
CN115659244A (zh) | 故障预测方法、装置及存储介质 | |
US20220405623A1 (en) | Explainable artificial intelligence in computing environment | |
CN114625406A (zh) | 应用开发管控方法、计算机设备、存储介质 | |
CN117692203A (zh) | 一种事件处置策略智能推荐方法及系统 | |
CN116611813B (zh) | 一种基于知识图谱的智能运维管理方法及系统 | |
CN117407441A (zh) | 一种应用于领域数据治理的人工智能平台 | |
CN117194834A (zh) | 一种网页自动化切换状态识别方法 | |
CN115358369A (zh) | 基于卷积神经网络模型的监控告警事件识别方法 | |
CN113807462A (zh) | 一种基于ai的网络设备故障原因定位方法及其系统 | |
KR20220120968A (ko) | 데이터 분석 관리가 용이한 머신러닝 기반의 빅데이터 분석 및 성능 감시 방법 | |
Saraph et al. | Test set generation and reduction with artificial neural networks | |
CN117422063B (zh) | 应用智能辅助决策的大数据处理方法及智能辅助决策系统 | |
CN117688485B (zh) | 一种基于深度学习的火灾诱因分析方法及系统 | |
Li et al. | On Testing and Evaluation of Artificial Intelligence Models | |
Ewing et al. | Text mining for procedure-level primitives in human reliability analysis | |
CN116208361A (zh) | 云网融合的网络与内容安全方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |