CN115455194A

CN115455194A - 铁路故障的知识抽取分析方法及装置

Info

Publication number: CN115455194A
Application number: CN202211015189.2A
Authority: CN
Inventors: 李新琴; 代明睿; 杜文然; 李国华; 史维峰; 马小宁; 徐贵红
Original assignee: China Academy of Railway Sciences Corp Ltd CARS; Institute of Computing Technologies of CARS; Beijing Jingwei Information Technology Co Ltd
Current assignee: China Academy of Railway Sciences Corp Ltd CARS; Institute of Computing Technologies of CARS; Beijing Jingwei Information Technology Co Ltd
Priority date: 2022-08-23
Filing date: 2022-08-23
Publication date: 2022-12-09

Abstract

本发明提供一种铁路故障的知识抽取分析方法及装置，该方法包括：基于故障记录文本，获取铁路故障信息；将铁路故障信息输入到故障分析模型中，输出与铁路故障信息对应的故障分析图谱。本发明提供的铁路故障的知识抽取分析方法及装置，基于故障记录文本提取出有效的铁路故障信息，以铁路故障信息作为铁路故障分析模型的输入，输出的结果为故障分析图谱。实现通过神经网络从高速铁路信号设备故障信息中，以抽取故障致因和处理方法知识为目的，对故障原因分析文本数据识别、发现和推断事件之间的复杂关系，能够有效辅助现场分析故障致因，为故障处理给予强有力的理论支持。

Description

铁路故障的知识抽取分析方法及装置

技术领域

本发明涉及铁路安全技术领域，尤其涉及一种铁路故障的知识抽取分析方法及装置。

背景技术

随着我国铁路运输的高速发展，高速铁路、普速铁路、货运铁路、重载铁路、城市轨道交通等铁路运输的运营里程也在飞速增长中，各类铁路的使用与铁路设备维护维修息息相关。当前我国铁路各类设备、设施日常运维故障维修作业中，通常是由人工全面记载了电务信号故障发生的详细信息后，凭借经验以及纸质版的铁路维修作业指导书和铁路维修作业安全管理实施细则等各类规章制度为依据进行维修操作的，其对于故障发生的原因和处理措施过于依赖主观判断，容易引起故障判断和处理上的误判。

发明内容

本发明提供一种铁路故障的知识抽取分析方法及装置，用以解决现有技术中故障处理缺乏理论支持的缺陷。

本发明提供一种铁路故障的知识抽取分析方法，包括：

基于故障记录文本，获取铁路故障信息；

将所述铁路故障信息输入到故障分析模型中，输出与所述铁路故障信息对应的故障分析图谱；

其中，所述故障分析图谱用于展示所述故障记录文本中的故障原因及故障整改链路；所述故障分析模型是根据历史故障记录，以及从所述历史故障记录提取出的实体和实体关系训练得到的；所述实体和实体关系是根据铁路故障知识结构确定的。

根据本发明提供的一种铁路故障的知识抽取分析方法，所述故障分析模型包括知识标注层、知识抽取层和图谱匹配层；

将所述铁路故障信息输入至所述知识标注层进行统一标注，获取标注序列集合；

将所述标注序列集合输入至知识抽取层，获取知识三元组；

将所述知识三元组输入至图谱匹配层，构建所述故障分析图谱。

根据本发明提供的一种铁路故障的知识抽取分析方法，所述将所述标注序列集合输入至知识抽取层，获取知识数据，包括：

基于所述标注序列集合，获取第一特征向量和第二特征向量；

将第一特征向量输入至实体识别模型，获取各实体对应的实体内容；

基于所述实体内容、所述第二特征向量输入至关系抽取模型，获取所述知识三元组；

其中，所述实体识别模型是基于所述历史故障记录及其标注出的实体训练得到的，所述关系抽取模型是基于所述历史故障记录及其标注出的实体关系训练得到的。

根据本发明提供的一种铁路故障的知识抽取分析方法，所述标注序列集合包括原文序列、索引序列、命名实体序列、关系序列和关系索引序列；

所述基于所述文本特征向量，获取第一特征向量和第二特征向量，具体包括：

基于所述原文序列和所述命名实体序列，获取所述第一特征向量；

基于所述标注序列集合，获取所述第二特征向量。

根据本发明提供的一种铁路故障的知识抽取分析方法，所述将第一特征向量输入至实体识别模型，获取各实体对应的实体内容，包括：

将所述第一特征向量输入至所述实体识别模型中的嵌入层，输出第一词向量；

利用双向长短期记忆网络Bi-LSTM对所述第一词向量进行处理，获取第二词向量；

利用条件随机场CRF对第二词向量进行解码，获取所述实体内容。

根据本发明提供的一种铁路故障的知识抽取分析方法，所述基于所述实体内容、所述第二特征向量输入至关系抽取模型，获取所述知识三元组，包括：

将所述第二特征向量输入至所述关系抽取模型中的嵌入层，输出第三词向量；

利用多头注意力机制对所述第三词向量，输出实体依赖关系；

基于所述实体依赖关系和所述实体内容进行处理，获取所述知识三元组。

本发明还提供一种铁路故障的知识抽取分析装置，包括：

数据获取模块，用于基于故障记录文本，获取铁路故障信息；

故障分析模块，用于将所述铁路故障信息输入到故障分析模型中，输出与所述铁路故障信息对应的故障分析图谱；

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述铁路故障的知识抽取分析方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述铁路故障的知识抽取分析方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述铁路故障的知识抽取分析方法。

本发明提供的铁路故障的知识抽取分析方法及装置，基于故障记录文本提取出有效的铁路故障信息，以铁路故障信息作为铁路故障分析模型的输入，输出的结果为故障分析图谱。实现通过神经网络从高速铁路信号设备故障信息中，以抽取故障致因和处理方法知识为目的，对故障原因分析文本数据识别、发现和推断事件之间的复杂关系，能够有效辅助现场分析故障致因，为故障处理给予强有力的理论支持。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的铁路故障的知识抽取分析方法的流程示意图；

图2是本发明提供的铁路故障的知识结构示意图；

图3是本发明提供的铁路故障的知识抽取分析方法的模型示意图之一；

图4是本发明提供的铁路故障的知识抽取分析方法的模型示意图之二；

图5是本发明提供的铁路故障的知识抽取分析方法的模型示意图之三；

图6是本发明提供的铁路故障的知识抽取分析装置的结构示意图；

图7是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请的说明书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。

应当理解，在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

图1是本发明提供的铁路故障的知识抽取分析方法的流程示意图。如图1所示，本发明实施例提供的铁路故障的知识抽取分析方法，包括：步骤101、基于待检测的语音数据，获取目标语音块。

需要说明的是，本发明实施例提供的铁路故障的知识抽取分析方法的执行主体是铁路故障的知识抽取分析装置。

本发明实施例提供的铁路故障的知识抽取分析方法的应用场景为，从大量的电务信号故障发生的详细记录中，进行非结构化解析，获取发生故障设备型号、故障发生原因、整改措施等有效的故障知识，以供铁路运维人员对于故障进行准确溯源，并实施相应的维修措施。

本申请实施例提供的铁路故障的知识抽取分析方法适用于用户通过电子设备对任一故障记录文本进行铁路故障分析。

其中，故障记录文本，是指铁路电务相关系统以及人员整理的故障信息，并以EXCEL形式存储，数据较为全面记载了电务信号故障发生的详细信息。

上述电子设备可以以各种形式来实施。例如，本申请实施例中描述的电子设备可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置、智能手环、智能手表等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。下面，假设电子设备是移动终端。然而，本领域技术人员将理解的是，除了特别用于移动目的的元件之外，根据本申请实施例的构造也能够应用于固定类型的终端。

具体地，在步骤101中，铁路故障的知识抽取分析装置对结构化的故障记录文本进行去除设备型号、停顿词等预处理操作，获取铁路故障信息。

步骤102、将铁路故障信息输入到故障分析模型中，输出与铁路故障信息对应的故障分析图谱。

其中，故障分析图谱用于展示故障记录文本中的故障原因及故障整改链路。故障分析模型是根据历史故障记录，以及从历史故障记录提取出的实体和实体关系训练得到的。实体和实体关系是根据铁路故障知识结构确定的。

需要说明的是，故障分析模型是基于历史故障记录，以及预先对历史故障记录标注出的实体和各实体间的关系，进行训练后得到的。

其中，对历史故障记录标注实体和各实体间关系的规则，是在根据某一设备现象引起另一设备现象时，能将揭示规律、指导行为等知识的结构化的闭环结构确定的。

示例性地，图2是本发明提供的铁路故障的知识结构示意图。如图2所示，下面示例一种铁路故障知识结构，该知识结构能够有效抽取引起故障的致因链，其余知识结构能够有效表达故障的处理措施。根据铁路故障知识结构，可以定义5类实体与7类实体关系，实体名称及标注缩写如表1所示。

表1自定义实体和实体关系定义表表

需要说明的是，故障分析模型是一种神经网络模型，神经网络的结构和参数包括但不限于神经网络的输入层，隐含层和输出层的层数，以及每一层的权重参数等。本发明实施例对神经网络的种类和结构不作具体限定。

例如，故障分析模型可以是一种神经网络模型，由输入层、隐藏层和输出层组成，其中：

输入层在整个网络的最前端部分，直接接收铁路故障信息的特征数据组成的输入向量。

隐藏层可以有一层或多层，通过自身的神经元对输入向量以加权求和的方式来进行运算。

输出层是最后一层，用来对加权求和后得到的向量进行解码，从故障记录文本中抽取实体以及实体关系，以三元组的形式输出知识数据。

具体地，在步骤102中，铁路故障的知识抽取分析装置对构建好的铁路故障分析模型各层间的权值系数初始化，再将训练集中的一组历史故障记录输入到当前权值系数下的神经网络，依次计算输入层、隐藏层和输出层的各节点的输出。输出层最后的输出结果与其实际连接位置状态类型之间的累积误差，根据梯度下降法，修正输入层与隐藏层各节点间的权值系数。依照上述过程，直至遍历训练集中的所有历史故障记录，可以得到输入层与隐藏层的权值系数。

铁路故障的知识抽取分析装置根据神经网络输入层与隐藏层的权值系数，还原步骤102中的铁路故障分析模型，并将测试集中的一组铁路故障信息输入到训练好的铁路故障分析模型，可以得到该铁路故障信息对应的“实体-关系-实体”三元组，将三元组中的实体于实体间的关系以知识图谱的形式输出，得到故障分析图谱。

故障分析图谱，是将每一组三元组中的两个实体分别作为节点，将两个实体之间的实体关系作为边连接对应的两个节点所构建的。故障分析图谱用于以非结构化文本的形式描述了故障设备型号、发生故障的原因以及整改措施的故障整改链路，为相关人员提供决策支持。

本发明实施例基于故障记录文本提取出有效的铁路故障信息，以铁路故障信息作为铁路故障分析模型的输入，输出的结果为故障分析图谱。实现通过神经网络从高速铁路信号设备故障信息中，以抽取故障致因和处理方法知识为目的，对故障原因分析文本数据识别、发现和推断事件之间的复杂关系，能够有效辅助现场分析故障致因，为故障处理给予强有力的理论支持。

在上述任一实施例的基础上，故障分析模型包括知识标注层、知识抽取层和图谱匹配层。

将铁路故障信息输入至知识标注层进行统一标注，获取标注序列集合。

将标注序列集合输入至知识抽取层，获取知识三元组。

将知识三元组输入至图谱匹配层，构建故障分析图谱。

具体地，铁路故障的知识抽取分析装置由输入层、隐藏层和输出层组成。隐藏层的作用是对铁路故障信息进行知识抽取，获取对应信息的知识三元组。

本发明实施例对隐藏层的结构不作具体限定。

优选地，隐藏层至少包含三层，分别是知识标注层、知识抽取层和图谱匹配层。其中：

知识标注层的作用是，根据铁路故障知识结构所自定义的实体和实体关系，统一标注铁路故障信息的文本内容，获取标注序列集合。

知识抽取层的作用是，利用标注序列集合进行特征表示，将文本数据转换为向量，经过命名实体识别模型与关系抽取模型先后实现实体抽取与关系抽取，获取知识三元组。

图谱匹配层的作用是，采用知识图谱的方式对知识三元组进行存储与展示，构建故障分析图谱。

本发明实施例基于知识标注层对将铁路故障信息中的命名实体定位并分类为预先定义的类别，通过知识抽取层对知识标注层输出的标注序列集合进行实体和实体关系的抽取，通过图谱匹配层将知识抽取层输出的知识三元组构建故障分析图谱。实现在知识抽取过程中先后抽取出预先定义实体的实体内容，以及实体关系，能够在获取实体内容，结合上下文关系，获取实体关系，避免文本信息丢失，在一定程度上提高知识抽取的准确率。

在上述任一实施例的基础上，将标注序列集合输入至知识抽取层，获取知识数据，包括：基于标注序列集合，获取第一特征向量和第二特征向量。

具体地，铁路故障的知识抽取分析装置将经过标注的信号设备故障数据(即标注序列集合)转换为第一特征向量和第二特征向量，以保留数据本身特征。

第一特征向量，是指包含铁路故障信息中每一个字符特征的多维向量，以体现自定义实体特征。

第二特征向量，是指包含铁路故障信息中每一个分词特征的多维向量，以体现文本上下文内部相关信息。

将第一特征向量输入至实体识别模型，获取各实体对应的实体内容。

其中，实体识别模型是基于历史故障记录及其标注出的实体训练得到的。

需要说明的是，实体识别模型的训练样本是历史故障记录，以及对其标注出的实体。在其训练过程中，通过实体识别模型输出的实体内容，将其与预先标注好的实体之间的对比作为前向反馈，去训练该模型。

具体地，实体识别模型的整个架构可以分为三个部分，特征表示，特征编码，标签解码。其中：

(一)特征表示

在嵌入层对铁路故障信息中的文字进行分布式向量表示，获取第一特征向量。

其中，向量表示方法包括但不限于Word Embedding、Char Embedding、WordEmbedding and Char Embedding和Hybird Representation等。

Word Embedding就是对单词进行表示，中文中就是先分词然后对词组进行表示。Char Embedding就是对每个英文字母进行表示，中文中就是对每个字进行表示。

可以理解的是，上述两种方式也可以融合，通过对Word Embedding和CharEmbedding的输出向量进行拼接或者相加等操作来融合信息。Hybird Representation(混合表示)就是除了对输入文字进行表示之外还引入知识图谱或者词典等外部信息来增强表示信息。

(二)特征编码

特征编码主要是对输入的第一特征向量进行变换，提取句子的语义信息。常用的特征提取器有CNN，RNN，Transformer等模型。

(三)标签解码

标签解码的主要目标是对输入的每个单词的标记(token)输出一个实体标签类别，以及该实体对应的实体内容。

其中，解码方式包括但不限于多层感知机(MLP，Multi-Layer Perceptron+Softmax)、循环神经网络(RNN，Recurrent Neural Networks)和指针网络(PointerNetworks)等。

基于实体内容、第二特征向量输入至关系抽取模型，获取知识三元组。

其中，关系抽取模型是基于历史故障记录及其标注出的实体关系训练得到的。

需要说明的是，关系抽取模型的训练样本是历史故障记录，以及对其标注出的实体关系。在其训练过程中，通过关系抽取模型输出的实体关系，将其与预先标注好的实体关系之间的对比作为前向反馈，去训练该模型。

具体地，铁路故障的知识抽取分析装置将抽取的实体内容，与句子的第二特征向量对应，给定一个具有至少两个已知实体的句子，通过关系抽取模型将该句子分类为预先定义的实体关系。

其中，关系抽取模型可以由基于规则的关系抽取算法、基于机器学习的关系抽取算法、基于深度学习的关系抽取算法实现。

本发明实施例基于实体和实体关系分别建模，通过实体识别模型对第一特征向量，以及关系抽取模型对第二特征向量并行单步解码，将实体识别模型解码出的实体内容和关系抽取模型解码出的实体关系组装成一个三元组。能够最大程度上保留完整的文本信息，在一定程度上提高知识抽取的准确率。

在上述任一实施例的基础上，标注序列集合包括原文序列、索引序列、命名实体序列、关系序列和关系索引序列。

具体地，铁路故障的知识抽取分析装置将铁路故障信息的文本内容标注为原文序列、索引序列、命名实体序列、关系序列、关系索引序列，组成一个标注序列集合。

其中，标注方法包括但不限于四位序列标注法(BMES，B表示一个词的词首位值，M表示一个词的中间位置，E表示一个词的末尾位置，S表示一个单独的字词)、三位标注(BIO，B-begin，I-inside，O-outside)、BIOES等。

示例性地，图3是本发明提供的铁路故障的知识抽取分析方法的模型示意图之一。如图3所示，以铁路故障信息中第15-31个字符作为示例，下面给出一个标注序列集合{seq₀,seq₁,seq₂,seq₃,seq₄}的具体实施方式：

(1)seq₀为铁路故障信息的原文序列，其包含第15-31个字含哈的文本内容“开闭器反位接点压力不足，接触虚造成”。

(2)seq₁＝(S₁₄,S₁₅,…,S₃₀)为铁路故障信息的索引序列，其中，字符S为铁路故障信息中的每一个单独字符的特征，其下标为对应字在句子中的次序，并以0开始记位。

(3)seq₂＝(S_B-P,S_I-P,…,S_O)为铁路故障信息的命名实体序列，其中，命名实体序列标注采用BIOE表示，B(Begin)表示实体的起始位置，I(Internal)表示实体的中间部分，E(End)表示实体的末尾字符，O(Other)表示非实体字符，用“-”与表1定义的实体标注类型连接

(4)seq₃＝(S_N,S_N,…,S_N)为铁路故障信息的关系序列，其中，若该字符不存在自定义实体关系，则其下标N为与对应字符的索引值，反之，则其下标为表1中与关系名对应的标注标识。

(5)seq₄＝(S₁₄,S₁₅,…,S₃₀)为铁路故障信息的关系索引序列，该序列参照seq₃将存在自定义实体关系的字符特征记录在相应位置，不存在自定义实体关系的字符特征则保留其原始字符特征。

基于文本特征向量，获取第一特征向量和第二特征向量，具体包括：基于原文序列和命名实体序列，获取第一特征向量。

具体地，铁路故障的知识抽取分析装置从原文序列和命名实体序列中，按照字符特征，标注样本的命名实体特征、以及能够表达样本内容的三维分词特征进行特征提取，获取第一特征向量。

(1)字符特征：即表示所有标注样本的原文序列seq₀的汉字特征，将样本去重后的所有字符按顺序编码得到字符编码集合{D_c}：

(2)命名实体特征：命名实体特征表示即将样本的命名实体序列seq₂信息完整表示出来。获取seq₂所有的不重复的命名实体标记，并将所有标记按顺序编码，映射为命名实体字典集合{T_c}：

(3)分词特征：样本的seq₀通过加载专业语料的jieba分词工具进行分词。得到的样本分词集合不仅能够表达字符在词语中的位置，并且可以判断词语的字符数量，设一个文本的总长度为L，包含n个分词{w₁,w₂,w₃,...,w_n}，计算每个分词的表示子集合，其中f(w_i)表示第w_i个分词的特征值，l表示w_i的字符长度，

得到分词集合表示为{S_c}。

f(w_i)＝{l-(l-1),...,l-1,l}

以上编码完成后，设有n个样本数据集，输入一个样本i的seq₀及seq₂，得到相应的编码向量[D_ci],[S_ci],[T_ci]，并且具有相同的维度，长度为样本字符的长度，每个样本采用三维不同的特征向量组成向量V_NERi(i＝1,2,...n)，所有样本的第一特征向量为V_NER表示，并且在最后加一维向量[L_n]用于表示每个样本的长度。

基于标注序列集合，获取第二文本特征向量。

具体地，铁路故障的知识抽取分析装置利用标注序列集合中的全部序列{seq₀,seq₁,seq₂,seq₃,seq₄}，表达实体以及实体之间的关系，设seq₃中有m个实体关系，将标注数据分解为m个实体关系学习样本，每个样本的采用基于多维分词的实体关系特征方法表示。

实体关系主要包括分词特征、首部命名实体特征以及尾部命名实体特征，掩盖特征，首部和尾部命名实体基于实体位置特征表示方法表示。

(1)分词特征：实体关系分词将样本中的命名实体作为语料加载到jieba分词工具进行分词，这样能够将命名实体作为一个分词整体进行处理。输入seq₀，实现样本数据的分词。并将所有标注样本的分词集合去重后按顺序编码，形成分词集合{S_c}。

(2)首部和尾部命名实体特征表示：x表示输入的当前命名实体的位置索引，y表示命名实体的字符长度，z表示整个样本的索引长度，δ表示索引值大小的上限，通过如下公式得到首部和尾部命名实体的特征表示向量：

f(x,y,z)＝[[-x,0]+[0]*y+[1,z-y-x+1]]+δ

(3)掩盖特征表示：表示首部实体和尾部实体以及其他非实体的位置信息。x表示首部索引的起始位置，y表示尾部实体的索引位置，z表示整个样本的索引长度，通过如下公式计算掩盖特征表示的向量，并且f(x,y,z)与g(x,y,z)的输出集合大小相等：

g(x,y,z)＝[1]*(x+1)+[2]*(y-x-1)+[3]*(z-y)

根据以上三种实体关系特征表示计算方法，输入第i个样本数据集{seq₀,seq₁,seq₂,seq₃,seq₄}，通过{S_c}的分词编码映射，得到分词特征向量[S_ci]，通过f(x,y,z)分别得到样本的首部命名实体特征向量[H_i]和尾部特征向量[T_i]，通过g(x,y,z)得到样本的掩盖特征向量[M_i]，最终得出该样本的多维特征向量V_REi(i＝1,2,...n)，所有样本合成的第二特征向量为V_REi表示：

本发明实施例基于原文序列、索引序列、命名实体序列、关系序列和关系索引序列，获取标注序列集合，通过标注序列集合得到第一特征向量和第二特征向量。能够最大程度上保留完整的文本信息，在一定程度上提高知识抽取的准确率。

在上述任一实施例的基础上，将第一特征向量输入至实体识别模型，获取各实体对应的实体内容，包括：将第一特征向量输入至实体识别模型中的嵌入层，输出第一词向量。

具体地，实体识别模型的嵌入层接收到由输入层发送的第一特征向量，将第一特征向量进行分词转换，输出具有固定大小的第一词向量。

利用双向长短期记忆网络Bi-LSTM对第一词向量进行处理，获取第二词向量。

具体地，双向长短期记忆网络Bi-LSTM由前向LSTM和后向LSTM组合而成，将每一个第一词向量分别作为一个节点，可以获得序列中每一个词节点的对应的隐状态。并依据该节点的隐状态来预测该节点的下一节点输出的隐状态，将最后一个节点的隐状态作为该行为序列对应的隐状态，根据前向LSTM输出的隐状态

和后向LSTM输出的隐状态

拼接成第二词向量

示例性地，图4是本发明提供的铁路故障的知识抽取分析方法的模型示意图之二。如图4所示，LSTM是一种特殊的循环神经网络，其神经元有三个门结构，分别是遗忘门、输入门和输出门。

遗忘门f_t决定丢弃信息，输入门i_t有两层组成，首先通过sigmoid层作为输入层，决定要将要更新的值，然后通过tanh层产生一个新向量

到细胞状态中，C_t将新输入的信息代替需要忘记的信息。最后输出层o_t由sigmoid层确定细胞状态哪些需要输出去。

f_t＝σ(W_f.[h_t-1,x_t]+b_f)

i_t＝σ(W_i.[h_t-1,x_t]+b_i)

o_t＝σ(W_o.[h_t-1,x_t]+b_o)

h_t＝o_t*tanh(C_t)

利用条件随机场CRF对第二词向量进行解码，获取实体内容。

具体地，条件随机场CRF通过对Bi-LSTM输出的第二词向量进行学习，能够保证输出的序列的条件概率满足马尔科夫性。

示例性地，B-P后面的输出字符应该是I-P，而不是其他，这样可以增强输出序列的正确性，可以由以下公式计算：

P(Y|X)＝P(y_i|X,y₁,y₂,…,y_i-1,y_i+1,…,y_n)＝P(y_i|X,y_i-1,y_i+1)

当输入序列x时，输出序列取值为y的条件概率如公式所示：

其中，Z(x)为归一化因子，t_k为转移特征函数，λ_k为转移特征的权值系数，s_l为结构特征函数，μ_l为结构特征的权值。

本发明实施例利用BiLSTM与CRF结合后的实体识别模型，进行实体抽取，获取实体内容。能够有效学习自然语言的上下文关系的同时，还保证输出序列前后依赖关系，在一定程度上提高知识抽取的准确率。

在上述任一实施例的基础上，基于实体内容、第二特征向量输入至关系抽取模型，获取知识三元组，包括：将第二特征向量输入至关系抽取模型中的嵌入层，输出第三词向量。

具体地，关系抽取模型的嵌入层接收到由输入层发送的第二特征向量，将第二特征向量进行分词转换，输出具有固定大小的第三词向量，并将其输出至全局输入(Encoder)网络单元中。

利用多头注意力机制对第三词向量，输出实体依赖关系。

具体地，基于Transformer的关系抽取模型中，Encoder网络单元由多头注意力机制和基于位置的全连接前馈网络两个子层组成，每一层的输出都经过一个归一化计算。

其中，多头注意力机制由多个注意力机制单元组成。多头注意力机制将输入向量转换为个query(Q)和一组key-value(K，V)向量，并根据注意力机制单元个数h进行h次线性变换，将每个注意力机制单元的计算结果进行拼接，如下公式所示：

MultiHead(Q,K,V)＝Concat(head₁,...,head_h)W^O

其中，

以及

都是模型学习的映射参数。

每个注意力机制单元对输入的Q，K，V进行Attention函数计算，计算公式如下所示：

全连接前馈网络层主要包括两层全连接前馈神经网络以及中间的一次ReLu函数激活和Dropout防止过拟合计算。对于不同的注意力机制单元使用相同的参数。最后对多头注意力机制层与全连接前馈网络层的输出结果求和并进行归一化输出：

FFN(x)＝max(0,xW₁+b₁)W₂+b₂

其中，W₁和b₁表示网络连接的前一次权重和偏置。W₂和b₂表示网络连接的本次权重和偏置。若FFN(x)符合预设条件，则将W₂和b₂作为关系抽取模型的模型参数，反之，进行前向反馈继续迭代。

基于实体依赖关系和实体内容进行处理，获取知识三元组。

具体地，铁路故障的知识抽取分析装置将实体识别模型识别出的实体内容，和关系抽取模型输出的实体依赖关系进行融合，得到知识三元组。

示例性地，图5是本发明提供的铁路故障的知识抽取分析方法的模型示意图之三。如图5所示，以文本内容为“经检查测试发现5号道岔尖3转辙机自动开闭器反位45、46接点压力不足，接触虚，造成列车通过时道岔无表示，天窗时间对其更换接点后，反复扳动试验良好。”的故障记录文本作为示例，结合故障知识抽取总体框架进行解释说明：

(1)经预处理后，将铁路故障信息输入至故障分析模型。

(2)通过故障知识结构对实体和实体关系的定义，统一标注铁路故障信息后，进行特征表示，将文本数据分别转换第一特征向量(多维字符特征表示)和第二特征向量(多维分词特征表示)。

经过实体识别模型得到自定义实体对应的实体内容：

设备现象：①自动开闭器反位接点压力不足。

②接触虚。

③道岔无表示。

维修措施：更换接点。

维修条件：天窗时间。

实验测试：反复扳动。

维修结果：良好。

经关系抽取模型得到自定义实体关系对应的实体关系：<xx，导致，xx>、<xx，采取，xx>、<xx，允许，xx>、<xx，验证，xx>和<xx，

得到，xx>。

将抽取出的实体和实体关系进行融合，获取的知识三元组则包括：

<自动开闭器反位接点压力不足，导致，接触虚>

<接触虚，导致，道岔无表示>

<自动开闭器反位接点压力不足，采取，更换接点>

<更换接点，允许，天窗时间>

<反复扳动，验证，更换节点>

<反复扳动，得到，良好>

(3)采用知识图谱的方式对知识三元组进行存储与展示。

本发明实施例利用注意力机制(Attention)建立全局输入(Encoder)和输出(Decoder)的依赖关系神经网络的关系抽取模型，进行实体关系抽取，获取实体依赖关系。能够较强的并行性，提高知识抽取的准确率和效率。

图6是本发明提供的铁路故障的知识抽取分析装置的结构示意图。在上述任一实施例的基础上，如图6所示，该装置包括：数据获取模块610和故障分析模块620，其中：

数据获取模块610，用于基于故障记录文本，获取铁路故障信息。

故障分析模块620，用于将铁路故障信息输入到故障分析模型中，输出与铁路故障信息对应的故障分析图谱。

具体地，数据获取模块610和故障分析模块620顺次电连接。

数据获取模块610对结构化的故障记录文本进行去除设备型号、停顿词等预处理操作，获取铁路故障信息。

故障分析模块620对构建好的铁路故障分析模型各层间的权值系数初始化，再将训练集中的一组历史故障记录输入到当前权值系数下的神经网络，依次计算输入层、隐藏层和输出层的各节点的输出。输出层最后的输出结果与其实际连接位置状态类型之间的累积误差，根据梯度下降法，修正输入层与隐藏层各节点间的权值系数。依照上述过程，直至遍历训练集中的所有历史故障记录，可以得到输入层与隐藏层的权值系数。

铁路故障的知识抽取分析装置根据神经网络输入层与隐藏层的权值系数，还原铁路故障分析模型，并将测试集中的一组铁路故障信息输入到训练好的铁路故障分析模型，可以得到该铁路故障信息对应的“实体-关系-实体”三元组，将三元组中的实体于实体间的关系以知识图谱的形式输出，得到故障分析图谱。

可选地，故障分析模型包括知识标注层、知识抽取层和图谱匹配层。

故障分析模块620包括知识标注单元、知识抽取单元和图谱匹配单元，其中：

知识标注单元，用于将铁路故障信息输入至知识标注层进行统一标注，获取标注序列集合。

知识抽取单元，用于将标注序列集合输入至知识抽取层，获取知识三元组。

图谱匹配单元，用于将知识三元组输入至图谱匹配层，构建故障分析图谱。

可选地，知识抽取单元包括特征提取子单元、实体识别子单元和知识抽取子单元，其中：

特征提取子单元，用于基于标注序列集合，获取第一特征向量和第二特征向量。

实体识别子单元，用于将第一特征向量输入至实体识别模型，获取各实体对应的实体内容。

知识抽取子单元，用于基于实体内容、第二特征向量输入至关系抽取模型，获取知识三元组。

其中，实体识别模型是基于历史故障记录及其标注出的实体训练得到的，关系抽取模型是基于历史故障记录及其标注出的实体关系训练得到的。

可选地，标注序列集合包括原文序列、索引序列、命名实体序列、关系序列和关系索引序列。

特征提取子单元，具体用于基于原文序列和命名实体序列，获取第一特征向量。

特征提取子单元，具体用于基于标注序列集合，获取第二特征向量。

可选地，实体识别子单元包括第一嵌入微单元、特征编码微单元和第一解码微单元，其中：

第一嵌入微单元，用于将第一特征向量输入至实体识别模型中的嵌入层，输出第一词向量。

特征编码微单元，用于利用双向长短期记忆网络Bi-LSTM对第一词向量进行处理，获取第二词向量。

第一解码微单元，用于利用条件随机场CRF对第二词向量进行解码，获取实体内容。

可选地，知识抽取子单元包括第二嵌入微单元、第二微解码单元和融合微单元，其中：

第二嵌入微单元，用于将第二特征向量输入至关系抽取模型中的嵌入层，输出第三词向量。

第二微解码单元，用于利用多头注意力机制对第三词向量，输出实体依赖关系。

融合微单元，用于基于实体依赖关系和实体内容进行处理，获取知识三元组。

本发明实施例提供的铁路故障的知识抽取分析装置，用于执行本发明上述铁路故障的知识抽取分析方法，其实施方式与本发明提供的铁路故障的知识抽取分析方法的实施方式一致，且可以达到相同的有益效果，此处不再赘述。

图7示例了一种电子设备的实体结构示意图，如图7所示，该电子设备可以包括：处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740，其中，处理器710，通信接口720，存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令，以执行铁路故障的知识抽取分析方法，该方法包括：基于故障记录文本，获取铁路故障信息；将铁路故障信息输入到故障分析模型中，输出与铁路故障信息对应的故障分析图谱；其中，故障分析图谱用于展示故障记录文本中的故障原因及故障整改链路；故障分析模型是根据历史故障记录，以及从历史故障记录提取出的实体和实体关系训练得到的；实体和实体关系是根据铁路故障知识结构确定的。

此外，上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的铁路故障的知识抽取分析方法，该方法包括：基于故障记录文本，获取铁路故障信息；将铁路故障信息输入到故障分析模型中，输出与铁路故障信息对应的故障分析图谱；其中，故障分析图谱用于展示故障记录文本中的故障原因及故障整改链路；故障分析模型是根据历史故障记录，以及从历史故障记录提取出的实体和实体关系训练得到的；实体和实体关系是根据铁路故障知识结构确定的。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的铁路故障的知识抽取分析方法，该方法包括：基于故障记录文本，获取铁路故障信息；将铁路故障信息输入到故障分析模型中，输出与铁路故障信息对应的故障分析图谱；其中，故障分析图谱用于展示故障记录文本中的故障原因及故障整改链路；故障分析模型是根据历史故障记录，以及从历史故障记录提取出的实体和实体关系训练得到的；实体和实体关系是根据铁路故障知识结构确定的。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种铁路故障的知识抽取分析方法，其特征在于，包括：

基于故障记录文本，获取铁路故障信息；

2.根据权利要求1所述的铁路故障的知识抽取分析方法，其特征在于，所述故障分析模型包括知识标注层、知识抽取层和图谱匹配层；

将所述标注序列集合输入至知识抽取层，获取知识三元组；

3.根据权利要求2所述的铁路故障的知识抽取分析方法，其特征在于，所述将所述标注序列集合输入至知识抽取层，获取知识数据，包括：

4.根据权利要求3所述的铁路故障的知识抽取分析方法，其特征在于，所述标注序列集合包括原文序列、索引序列、命名实体序列、关系序列和关系索引序列；

基于所述标注序列集合，获取所述第二特征向量。

5.根据权利要求3所述的铁路故障的知识抽取分析方法，其特征在于，所述将第一特征向量输入至实体识别模型，获取各实体对应的实体内容，包括：

6.根据权利要求3所述的铁路故障的知识抽取分析方法，其特征在于，所述基于所述实体内容、所述第二特征向量输入至关系抽取模型，获取所述知识三元组，包括：

7.一种铁路故障的知识抽取分析装置，其特征在于，包括：

8.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6任一项所述铁路故障的知识抽取分析方法。

9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述铁路故障的知识抽取分析方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述铁路故障的知识抽取分析方法。