CN112183994A

CN112183994A - 一种设备状态的评估方法、装置、计算机设备和存储介质

Info

Publication number: CN112183994A
Application number: CN202011007601.7A
Authority: CN
Inventors: 黄文琦; 卢铭翔; 赵继光; 朱信德; 钟连宏; 喇元
Original assignee: Southern Power Grid Digital Grid Research Institute Co Ltd
Current assignee: Southern Power Grid Digital Grid Research Institute Co Ltd
Priority date: 2020-09-23
Filing date: 2020-09-23
Publication date: 2021-01-05
Anticipated expiration: 2040-09-23
Also published as: CN112183994B

Abstract

本申请涉及一种设备状态的评估方法、装置、计算机设备和存储介质，包括：获取用户针对设备提交的状态描述信息；确定所述状态描述信息对应的文本特征信息，并将所述文本特征信息输入至不同类型的多个初级分类模型，得到所述多个初级分类模型分别输出的状态分类概率值；所述多个初级分类模型分别用于根据文本特征信息预测所述设备的状态为预设故障类型的概率值；将多个状态分类概率值输入至次级分类模型，得到所述次级分类模型输出的设备状态评估结果，实现了在缺少充足缺陷导则数据时获取准确的故障状态评估结果，由于可以采用不同分类模型进行预测，能够多维度地基于状态描述信息进行预测，有效减少了补充缺陷导则数据而花费的人力标注成本。

Description

一种设备状态的评估方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，特别是涉及一种设备状态的评估方、装置、计算机设备和存储介质。

背景技术

随着电力系统的不断扩展、完善，系统中的电力设备数量也在不断增加。为了保证电力设备的正常运作，往往需要对电力设备的设备状态进行评估。

在现有技术中，可以将质检人员记录的设备缺陷数据与缺陷导则数据进行匹配，确定设备对应的故障状态。然而，在缺陷导则数据不充分的情况下，难以得到准确的故障状态评估结果。

发明内容

基于此，有必要针对上述技术问题，提供一种设备状态的评估方法、装置、计算机设备和存储介质。

一种设备状态的评估方法，所述方法包括：

获取用户针对设备提交的状态描述信息；

确定所述状态描述信息对应的文本特征信息，并将所述文本特征信息输入至不同类型的多个初级分类模型，得到所述多个初级分类模型分别输出的状态分类概率值；所述多个初级分类模型分别用于根据文本特征信息预测所述设备的状态为预设故障类型的概率值；

将多个状态分类概率值输入至次级分类模型，得到所述次级分类模型输出的设备状态评估结果；所述次级分类模型通过对所述多个初级分类模型进行模型融合后得到，所述次级分类模型用于根据所述多个初级分类模型输出的状态分类概率值确定设备状态评估结果。

可选地，所述确定所述状态描述信息对应的文本特征信息，并将所述文本特征信息输入至不同类型的多个初级分类模型，得到所述多个初级分类模型分别输出的状态分类概率值，包括：

获取所述状态描述信息对应的多个文本特征信息；

获取各个文本特征信息对应的初级分类模型；

将所述多个文本特征信息分别输入对应的初级分类模型中，得到对应的初级分类模型输出的状态分类概率值。

可选地，所述获取各个文本特征信息对应的初级分类模型，包括：

当所述文本特征信息包括词向量时，获取与所述词向量对应的第一初级分类模型；所述第一初级分类模型根据具有故障类型标签的多个词向量对卷积神经网络进行训练得到；

当所述文本特征信息包括词频逆文档频率时，获取与所述词频逆文档频率对应的第二初级分类模型；所述第二初级分类模型根据设备故障导则对分类模型进行训练得到；

当所述文本特征信息包括句向量信息时，获取与所述句向量信息对应的第三初级分类模型；所述第三初级分类模型用于将所述句向量信息与设备故障导则进行语义相似度匹配，并根据匹配结果确定状态分类概率值。

可选地，所述获取所述状态描述信息对应的多个文本特征信息，包括：

获取预先训练的词向量模型的模型参数；所述词向量模型根据多个电网文本信息对预训练语言模型进行微调得到；

根据所述模型参数，确定所述状态描述信息对应的词向量。

可选地，还包括：

获取电网垂直领域中的多个电网文本信息；

对多个电网文本信息的语序进行调整，得到符合自然语言规则的多个电网训练文本信息；

根据所述多个电网训练文本信息，对预设的预训练语言模型进行微调，得到词向量模型。

可选地，所述根据所述多个电网训练文本信息，对预设的预训练语言模型进行微调，得到词向量模型，包括：

将所述多个电网训练文本信息输入到预设的预训练语言模型，得到所述预训练语言模型输出的上下文预测结果；

根据所述多个电网训练文本信息和所述上下文预测结果，确定所述预训练语言模型当前的损失函数；

根据所述损失函数对所述预训练语言模型的模型参数进行调整，直到满足所述预训练语言模型的训练结束条件，得到所述词向量模型。

可选地，还包括：

获取预设的设备故障导则，以及所述设备故障导则对应的故障类型和词频逆文档频率；

采用所述故障类型和词频逆文档频率对分类模型进行训练，得到第二初级分类模型。

一种设备状态的评估装置，所述装置包括：

状态描述信息获取模块，用于获取用户针对设备提交的状态描述信息；

状态分类概率值获取模块，用于确定所述状态描述信息对应的文本特征信息，并将所述文本特征信息输入至不同类型的多个初级分类模型，得到所述多个初级分类模型分别输出的状态分类概率值；所述多个初级分类模型分别用于根据文本特征信息预测所述设备的状态为预设故障类型的概率值；

设备状态评估结果获取模块，用于将多个状态分类概率值输入至次级分类模型，得到所述次级分类模型输出的设备状态评估结果；所述次级分类模型通过对所述多个初级分类模型进行模型融合后得到，所述次级分类模型用于根据所述多个初级分类模型输出的状态分类概率值确定设备状态评估结果。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如上所述的设备状态的评估方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的设备状态的评估方法的步骤。

上述一种设备状态的评估方法、装置、计算机设备和存储介质，通过获取用户针对设备提交的状态描述信息，确定状态描述信息对应的文本特征信息，并将文本特征信息输入至不同类型的多个初级分类模型，得到多个初级分类模型分别输出的状态分类概率值，将多个状态分类概率值输入至次级分类模型，得到次级分类模型输出的设备状态评估结果，实现了在缺少充足缺陷导则数据时获取准确的故障状态评估结果，由于可以采用不同分类模型进行预测，能够多维度地基于状态描述信息进行预测，有效减少了补充缺陷导则数据而花费的人力标注成本。

附图说明

图1为一个实施例中一种设备状态的评估方法的流程示意图；

图2为一个实施例中获取状态分类概率值步骤的流程示意图；

图3为一个实施例中文本特征信息输入步骤的流程示意图；

图4为一个实施例中词向量模型训练步骤的流程示意图；

图5为一个实施例中设备故障评估方法的流程示意图；

图6为一个实施例中一种设备状态的评估装置的结构框图；

图7为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

为了便于对本申请实施例的理解，先对现有技术进行说明。在现有技术中，可以将质检人员记录的设备缺陷数据与缺陷导则数据进行匹配，确定设备对应的故障状态。然而，在缺陷导则数据不充分的情况下，难以得到准确的故障状态评估结果，为了解决这一问题，往往需要电网设备专家通过人工方式补充缺陷导则数据，以提高匹配的准确度，或者，在每个设备的缺陷导则数据中增加“无对应”导则分类，以应对无法准确分类的问题。然而，通过人工方式补充缺陷导则，既需要消耗大量人工成本，故障状态评估结果的准确性也难以得到保障。基于此，本申请中提供了一种设备状态的评估方法。

在一个实施例中，如图1所示，提供了一种设备状态的评估方法，本实施例以该方法应用于设备管理终端进行举例说明，可以理解的是，该方法也可以应用于服务器，还可以应用于包括设备管理终端和服务器的系统，并通过设备管理终端和服务器的交互实现。其中，设备管理终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在本实施例中，包括以下步骤：

步骤101，获取用户针对设备提交的状态描述信息；

作为一示例，状态描述信息用于描述设备状态，其中，设备状态可以是用户对运行状态下或静止状态下的设备进行观察后确定的状态，例如设备运行过程中的抖动程度、设备产生的声音、设备的污染物排放量、设备散热程度，或者是设备静止状态下的外观、设备是否存在零件的缺损。当然，设备状态也可以是通过检测仪器对设备进行检测后确定的状态，例如通过传感器对设备进行检测后获取的设备运行参数。

在实际应用中，用户可以对设备进行检查，并提交针对该设备的状态描述信息，设备管理终端可以从用户提交的信息中获取状态描述信息。具体的，用户可以在操作终端中通过手工输入的方式填写状态描述信息，例如，用户按照个人语言习惯填写的状态描述信息；或者，在操作终端中，可以设置有针对设备状态的多个预置选项，每个预置选项对应于不同的设备状态，当检测到用户针对一个或多个预置选项的选择操作时，操作终端可以根据被选取的预置选项生成状态描述信息。

步骤102，确定所述状态描述信息对应的文本特征信息，并将所述文本特征信息输入至不同类型的多个初级分类模型，得到所述多个初级分类模型分别输出的状态分类概率值；所述多个初级分类模型分别用于根据文本特征信息预测所述设备的状态为预设故障类型的概率值。

作为一示例，文本特征信息可以是用于识别不同文本信息的标志或征象，通过文本特征信息，计算机设备可以识别不同的语言、文字。

在实际应用中，可以预先设置不同类型的多个初级分类模型，初级分类模型也可以称为初级学习器。具体而言，不同类型的初级分类模型，是指采用不同训练方式进行对预设模型进行训练后得到的多个模型，其中，被训练的预设模型可以是相同种类的模型，也可以是不同种类的多个模型，即可以采用不同训练方式对同一预设模型进行训练，也可以采用不同训练方式对多个类型的预设模型进行训练。训练后得到的多个初级分类模型可以根据输入模型的文本特征信息，预测设备状态为预设故障类型的概率值，例如，若存在多种预设故障类型，针对每一预设故障类型可以分别预测其概率值。

在获取到状态描述信息后，设备管理终端可以提取状态描述信息对应的文本特征信息，并将文本特征信息输入到多个初级分类模型中，得到多个初级分类模型输出的状态分类概率值，多个状态分类概率值采用不同的方式进行预测。

步骤103，将多个状态分类概率值输入至次级分类模型，得到所述次级分类模型输出的设备状态评估结果；所述次级分类模型通过对所述多个初级分类模型进行模型融合后得到，所述次级分类模型用于根据所述多个初级分类模型输出的状态分类概率值确定设备状态评估结果。

作为一示例，次级分类模型可以通过对多个初级分类模型进行模型融合后得到，次级分类模型可用于根据多个初级分类模型输出的状态分类概率值，确定设备状态评估结果。其中，可以采用训练好的初级分类模型输出的结果，作为训练集对预设模型进行训练，得到次级分类模型。

在获得多个状态分类概率值后，可以将多个状态分类概率值输入到次级分类模型中，进而可以得到次级分类模型输出的设备状态评估结果。

在本实施例中，通过获取用户针对设备提交的状态描述信息，确定状态描述信息对应的文本特征信息，并将文本特征信息输入至不同类型的多个初级分类模型，得到多个初级分类模型分别输出的状态分类概率值，将多个状态分类概率值输入至次级分类模型，得到次级分类模型输出的设备状态评估结果，实现了在缺少充足缺陷导则数据时获取准确的故障状态评估结果，由于可以采用不同分类模型进行预测，能够多维度地基于状态描述信息进行预测，无需多次补充缺陷导则数据，有效减少了补充缺陷导则数据而花费的人力标注成本。

在一个实施例中，当本申请提供的设备状态的评估方法应用于服务器时，服务器可以与多个操作终端通信连接，用户通过点击操作终端中的预设按键，可以跳转至填写状态描述信息的前端页面，当用户填写并点击提交后，服务器可以调用操作终端的API(应用程序接口，Application Programming Interface)接口获取状态描述信息，在状态描述信息中，还可以包括设备对应的身份信息。

在得到次级分类模型输出的设备状态评估结果，服务器可以通过调用API接口将设备状态评估结果返回至前端页面中，以使前端页面将设备状态评估结果展示给用户。

在一个实施例中，如图2所示，所述确定所述状态描述信息对应的文本特征信息，并将所述文本特征信息输入至不同类型的多个初级分类模型，得到所述多个初级分类模型分别输出的状态分类概率值，包括如下步骤：

步骤201，获取所述状态描述信息对应的多个文本特征信息。

在实际应用中，状态描述信息可以具有不同类型的多个文本特征信息，文本特征信息可以包括如下任一种或多种：词频(term frequency，TF)、逆文档频率(inversedocument frequency，IDF)、词频逆文档频率(TFIDF)、BM25值、类目信息、词性信息。其中，词频可用以评估一个词对于一个文件或者一个语料库中的一个领域文件集的重复程度；逆文档频率是文档频率的倒数；BM25值是通过BM25算法评估得到的单词与文档之间的相关度；类目信息用于表征单词所属的类目；词性信息用于表征单词词性。

在得到状态描述信息后，可以提取状态描述信息的多个文本特征信息。

步骤202，获取各个文本特征信息对应的初级分类模型。

在实际应用中，不同的初级分类模型可以采用不同的文本特征信息进行训练，在得到多个文本特征信息后，可以获取各个文本特征信息对应的初级分类模型。

步骤203，将所述多个文本特征信息分别输入对应的初级分类模型中，得到对应的初级分类模型输出的状态分类概率值。

当确定各个文本特征信息对应的初级分类模型后，可以将多个文本特征信息分别输入到与该文本特征信息对应的初级分类模型中，得到该初级分类模型输出的状态分类概率值。其中，初级分类模型的输出结果可以采用概率分布的形式输出。

在本实施例中，将多个文本特征信息分别输入对应的初级分类模型中，得到对应的初级分类模型输出的状态分类概率值，能够通过不同的文本特征以及不同的分类方式，多维度地对设备状态进行评估，在基于用户输入的状态描述信息进行评估时，有效提高评估的全面性。

在一个实施例中，如图3所示，所述获取各个文本特征信息对应的初级分类模型，可以包括如下步骤：

步骤301，当所述文本特征信息包括词向量时，获取与所述词向量对应的第一初级分类模型；所述第一初级分类模型根据具有故障类型标签的多个词向量对卷积神经网络进行训练得到。

具体的，第一初级分类模型可以是通过具有故障类型标签的多个词向量对卷积神经网络进行训练得到的。当多个文本特征信息包括词向量时，可以确定与词向量对应的初级分类模型为第一初级分类模型。

在实际应用中，第一初级分类模型可以由BiLSTM(Bi-directional Long Short-Term Memory)模型和自注意力机制(self_Attention)模型；其中，BiLSTM模型由前向LSTM(长短期记忆人工神经网络，Long Short-Term Memory)与后向LSTM组合而成，可用于预测文档中的上下文信息。

当提取到词向量后，可以经过BiLSTM模型的嵌入(embedding)层、记忆门和遗忘门处理，得到BiLSTM模型的输出结果，该输出结果可以由自注意力机制模型进行权重更新后，推送到全连接层通过sofamax函数进行处理，输出最终分类概率值。例如，可以将(-1,128,312)维的词向量输入到BiLSTM模型，在经过嵌入层、记忆门和遗忘门处理后，经经计算输出门得到(2,128,312)维的向量，在全连接层和sofamax函数处理后，得到3056个设备故障类别对应的分类概率值。

步骤302，当所述文本特征信息包括词频逆文档频率时，获取与所述词频逆文档频率对应的第二初级分类模型；所述第二初级分类模型根据设备故障导则对分类模型进行训练得到。

作为一示例，设备故障导则可以是设备在出现预设类型的设备故障时，对应的文字描述方式，例如“设备出现异常抖动”、“设备发热异常”，当然，设备故障导则中还可以包括设备缺陷参数，设备缺陷参数用于表征设备在出现预设类型的设备故障时对应的设备参数。

在实际应用中，当文本特征信息包括词频逆文档频率时，可以获取与词频逆文档频率对应的第二初级分类模型，其中，第二初级分类模型根据设备故障导则对分类模型进行训练得到。

步骤303，当所述文本特征信息包括句向量信息时，获取与所述句向量信息对应的第三初级分类模型；所述第三初级分类模型用于将所述句向量信息与设备故障导则进行语义相似度匹配，并根据匹配结果确定状态分类概率值。

当文本特征信息包括句向量信息时，可以获取与词频逆文档频率对应的第三初级分类模型，第三初级分类模型可以是匹配模型。

在具体实现中，第三初级分类模型可以根据句向量信息，与设备故障导则进行语义相似度匹配，并根据该匹配结果确定状态分类概率值。具体的，针对设备故障导则，可以以句子为粒度，提取设备故障导则中各个句子对应的句向量信息，并采用余弦定理，计算设备故障导则对应的句向量与状态描述信息对应的句向量夹角的余弦值，将余弦值与标准归一化系数相乘后，可以相乘结果作为语义相似度匹配的匹配结果。通过与多个故障类型对应的设备故障导则进行匹配，可以得到多个匹配结果，针对语义相似度超过预设阈值的匹配结果，第三初级分类模型可以获取匹配结果对应的状态分类概率值。或者，针对多个匹配结果，第三初级分类模型还可以对多个语义相似度进行降序排列，并获取排序最前的预设数量的语义相似度所对应的状态分类概率值，将该状态分类概率值作为输出结果输出。

在本实施例中，将多个各个文本特征信息输入到对应的第一初级分类模型、第二初级分类模型和第三初级分类模型中，实现了基于词向量、词频逆文档频率和语义相似度预测设备状态，多维度地对设备状态进行评估，在基于用户输入的状态描述信息进行评估时，有效提高评估的全面性。

在一个实施例中，所述方法还包括如下步骤：

获取预设的设备故障导则，以及所述设备故障导则对应的故障类型和词频逆文档频率；采用所述故障类型和词频逆文档频率对分类模型进行训练，得到第二初级分类模型。

在具体实现中，可以获取预设的设备故障导则，针对不同的设备，可以具有不同的故障类型以及对应的设备故障导则，针对多种的故障类型，可以获取故障类型对应的设备故障导则的词频逆文档频率。具体而言，在得到设备故障导则后，可以对该导则进行分词处理，并获取各个分词在设备故障导则中的词频逆文档频率。

在得到词频逆文档频率后，可以将故障类型作为训练标签，将词频逆文档频率作为训练集数据，输入到预设的分类型模型中进行训练，对该分类模型进行训练，得到第二初级分类模型。其中，在训练第二初级分类模型时，可以采用朴素贝叶斯模型(NaiveBayesian Model，NBM)、随机森林模型或SVM(支持向量机，Support Vector Machine)模型作为预设的分类模型；其中，在训练集数据较少(训练集数据少于预设阈值)时，朴素贝叶斯模型具有优秀的分类效果。

在第二初级分类模型的训练过程中，虽然是基于设备故障导则进行训练，但针对设备故障导则和状态描述信息，都可以获取词频逆文档频率，因此，可以根据状态描述信息的词频逆文档频率获取状态分类概率值，例如，在状态描述信息中存在与设备故障导则相同或相似的单词时，提取相同或相近单词的词频逆文档频率进行预测。

在本实施例中，通过采用故障类型和词频逆文档频率对分类模型进行训练，得到第二初级分类模型，能够通过电网文本信息的词频逆文档频率对设备状态进行预测。

在一个实施例中，所述获取所述状态描述信息对应的多个文本特征信息，可以包括如下步骤：

获取预先训练的词向量模型的模型参数；所述词向量模型根据多个电网文本信息对预训练语言模型进行微调得到；根据所述模型参数，确定所述状态描述信息对应的词向量。

在具体实现中，可以获取预先训练的词向量模型参数，其中，词向量模型时根据电网垂直领域中的多个电网文本信息，对预训练语言模型进行微调得到。通过词向量模型的模型参数，进而可以根据词向量模型的模型参数，确定状态描述信息对应的词向量。在实际应用中，由于句子是由多个单词组成的，当状态描述信息中存在句子时，还可以通过词向量模型的模型参数，以及Doc2vec模型确定状态描述信息对应的句向量。

在一个实施例中，状态描述信息的词向量可以通过Word2vec模型确定，该模型是一系列用来产生词向量的相关模型，该模型为浅双层的神经网络，用来训练以重新建构语言学之词文本，网络以词表现，并且需猜测相邻位置的输入词，在word2vec中词袋模型假设下，词的顺序是不重要的。训练完成之后，word2vec模型可用来映射每个词到一个向量，可用来表示词对词之间的关系，该向量为神经网络的隐藏层模型参数。

在本实施例中，获取基于多个电网文本信息进行调整得到词向量模型的模型参数，并采用该模型参数确定状态描述信息的词向量，使得最终得到的状态描述信息的词向量能够与电网生产领域或使用场景相匹配，提高了状态描述信息词向量的准确度。

在一个实施例中，所述方法还包括如下步骤：

获取电网垂直领域中的多个电网文本信息；对多个电网文本信息的语序进行调整，得到符合自然语言规则的多个电网训练文本信息；根据所述多个电网训练文本信息，对预设的预训练语言模型进行微调，得到词向量模型。

在实际应用中，可以获取电网垂直领域中的多个电网文本信息，其中，电网文本信息可以包括结构化或非结构化的文本信息，例如，电网设备缺陷状态描述、台账数据、电力系统操作票信息等。

在获取多个电网文本信息后，可以对多个电网文本信息的语序进行调整，得到符合自然语言规则的多个电网训练文本信息，在具体实现中，在进行语序调整前，还可以对多个电网文本信息进行筛选，去除电网文本信息中的冗余信息，例如无意义或重复输入的文本信息。在得到多个电网训练文本信息后，可以采用多个电网文本信息对预设的预训练语言模型进行微调，得到词向量模型。

在本实施例中，通过根据多个电网训练文本信息，对预设的预训练语言模型进行微调，得到词向量模型，能够得到与电网应用场景关联的词向量模型，提高了针对电网设备提交的状态描述信息的识别准确率，为文本分类、语义相似度匹配等后续自然语言任务提供准确的数据基础，同时，由于可以对已经过大量语料训练的预训练语言模型进行微调，得到词向量模型，有效缩短损失函数的收敛时间，降低训练成本。

在一个实施例中，如图4所示，所述根据所述多个电网训练文本信息，对预设的预训练语言模型进行微调，得到词向量模型，包括：

步骤401，将所述多个电网训练文本信息输入到预设的预训练语言模型，得到所述预训练语言模型输出的上下文预测结果。

作为一示例，预训练语言模型可以是运用大量文本语料进行训练后得到的语言模型，例如Albert预训练模型、BERT预训练模型、XLNETT预训练模型。

在具体实现中，可以将多个电网训练文本信息输入到预设的预训练语言模型中，得到预训练语言模型输出的上下文预测结果。具体而言，预训练语言模型可以根据输入的文本信息，对其上下文进行预测，例如，输入多个电网训练文本信息T1、T2、T3和T4，针对电网训练文本信息T2，预训练语言模型可以输出上下文预测结果T2’和T3’。

步骤402，根据所述多个电网训练文本信息和所述上下文预测结果，确定所述预训练语言模型当前的损失函数。

在得到上下文预测结果后，可以在多个电网训练文本信息中确定被测试对象真实的上下文文本信息，并根据真实的上下文文本信息和上下文预测结果，确定预训练语言模型当前的损失函数。

步骤403，根据所述损失函数对所述预训练语言模型的模型参数进行调整，直到满足所述预训练语言模型的训练结束条件，得到所述词向量模型。

在确定损失函数后，可以判断损失函数是否已收敛，当损失函数未收敛时，可以对预训练语言模型的模型参数进行调整，并返回至步骤401，对电网训练文本信息的上下文进行预测，确定调整后的预训练语言模型对应的当前损失函数。当损失函数收敛时，确定满足预训练语言模型的训练结束条件，或者，也可以在对模型参数的迭代调整次数满足预设阈值时，确定满足训练结束条件。在满足训练结束条件时，可以将当前的预训练语言模型确定为词向量模型。基于该词向量模型，可以进行与自然语言处理相关的多种任务，例如文本分类、实体抽取或文本摘要生成等。

在本申请中，采用多个电网训练文本信息对预训练语言模型进行训练，得到词向量模型，由于预训练语言模型已经过大量语料进行训练，通过电网训练文本信息对其进行微调，能够使词向量模型更贴合电网设备使用场景的同时，减少用于训练模型的训练集数据和训练时间，有效降低模型训练成本，并快速提高模型对电力设备状态的评估性能。

在一个实施例中，所述方法还可以包括如下步骤：

步骤501，获取具有故障类型标签的多个状态分类概率值；所述多个状态分类概率值为训练好的第一初级分类模型、第二初级分类模型和第三初级分类模型输出的状态分类概率值。

在本申请中，可以通过模型融合的方式，从多个初级分类模型输出的状态分类概率值中，确定设备状态评估结果。

在实际应用中，可以通过多个初级分类模型的输出结果训练次级分类模型。具体的，可以获取具有电力设备故障类型标签的多个状态分类概率值，其中，故障类型标签包括设备不故障的标签，多个状态分类概率值是训练好的第一初级分类模型、第二初级分类模型和第三初级分类模型输出的状态分类概率值。

步骤502，将所述多个状态分类概率值输入至回归模型，得到所述回归模型输出的设备状态评估结果；所述设备状态评估结果采用各个初级分类模型对应的模型权重对状态分类概率值处理后得到，所述设备状态评估结果为排序在预设范围内的处理后的状态分类概率值对应的设备状态。

具体的，可以将多个状态分类概率值输入到回归模型中，例如，通过预设函数concat对多个状态分类概率值进行拼接后，作为输入向量输入到逻辑回归线性分析模型(Logit Regression)中。回归模型针对多个初级分类模型，可以设置不同的模型权重，并根据各个模型权重对多个状态分类概率值进行处理，例如采用模型权重乘以对应的初级分类模型输出的状态分类概率值。针对处理后的多个状态分类概率值，回归模型可以对其进行降序排列，并将预设范围内的状态分类概率值对应的设备状态，作为设备状态评估结果输出。

步骤503，根据所述设备状态评估结果和所述故障类型标签，对所述回归模型的模型权重进行调整。

在输出设备状态评估结果后，可以根据该评估结果和故障类型标签，对回归模型的模型权重进行调整。例如可以根据设备状态评估结果和故障类型标签，确定回归模型当前的损失函数，并根据损失函数调整模型权重。

步骤504，返回所述获取具有故障类型标签的多个状态分类概率值的步骤，直到满足训练结束条件，得到次级分类模型。

在调整权重，可以返回步骤501，重复步骤501-503，直到满足训练结束条件，例如回归模型的迭代次数达到预设阈值，或者回归模型当前的损失函数已收敛，可以确定为满足训练结束条件。当满足训练结束条件是，可以将当前的回归模型确定为次级分类模型。

在本实施例中，将多个状态分类概率值输入至回归模型，得到回归模型输出的设备状态评估结果，根据设备状态评估结果和故障类型标签，对回归模型的模型权重进行调整，得到次级分类模型，由于不同的初级分类模型具有差异性，即不同的初级分类模型对不同的设备或不同的故障类型具有不同的设备状态评估准确度，通过融合各个初级分类模型，能够从多个初级分离模型输出的状态分类概率中，确定出最佳的设备状态评估结果。

在一个实施例中，本申请中可以采用决策树模型替代回归模型进行训练，得到次级分类模型，或者，也可以基于投票机制或Bagging算法(引导聚集算法，Bootstrapaggregating)，根据多个初级分类模型输出的状态分类概率值确定设备状态评估结果，提高结果的输出效率。

为了使本领域技术人员能够更好地理解上述步骤，以下通过一个例子对本申请实施例加以示例性说明，但应当理解的是，本申请实施例并不限于此。

如图5所示，设备质检人员可以通过操作终端中的前端页面填写设备的状态情况描述，服务器通过调用操作终端的API接口获取故障描述和设备单元ID信息(即本申请中的状态描述信息)，并判断API接口获取的信息与标准导则(例如本申请中的设备故障导则)是否匹配。具体可以通过三种算法进行匹配：基于电网的字向量或词向量对故障导则进行分类得到的算法(即本申请中的第一初级分类模型，也可以称为第一分类器)、基于词频逆文档频率(TFIDF)和设备故障导则进行分类的分类算法(即本申请中的第二初级分类模型，也可以称为第二分类器)、无监督训练得到的语义相似度匹配算法(即本申请中的第三初级分类模型，也可以称为第三分类器)。

在进行匹配后，可以综合语义相似度和分类器结果进行stacking输出，stacking输出可以通过次级分类模型对多个初级分类模型的输出结果进行处理后得到，当然，用户也可以指定三种算法中的任意一种，将指定算法所输出的结果确定为最终的结果。

在实际应用中，由于每种算法可以根据用户提交的故障描述确定各种故障类型对应的概率值，在通过stacking输出或用户指定确定被选中的目标算法后，可以对该目标算法输出的多个故障类型的概率值进行降序排列，故障类型的概率值也可以称为信心值，针对信心值排序最前的前三名，可以将对应的故障类型输出，例如通过调用API接口返回至用户的前端页面。

应该理解的是，虽然图1-5的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-5中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图6所示，提供了一种设备状态的评估装置，包括：

状态描述信息获取模块601，用于获取用户针对设备提交的状态描述信息；

状态分类概率值获取模块602，用于确定所述状态描述信息对应的文本特征信息，并将所述文本特征信息输入至不同类型的多个初级分类模型，得到所述多个初级分类模型分别输出的状态分类概率值；所述多个初级分类模型分别用于根据文本特征信息预测所述设备的状态为预设故障类型的概率值；

设备状态评估结果获取模块603，用于将多个状态分类概率值输入至次级分类模型，得到所述次级分类模型输出的设备状态评估结果；所述次级分类模型通过对所述多个初级分类模型进行模型融合后得到，所述次级分类模型用于根据所述多个初级分类模型输出的状态分类概率值确定设备状态评估结果。

在一个实施例中，所述状态分类概率值获取模块602，包括：

文本特征信息提取子模块，用于获取所述状态描述信息对应的多个文本特征信息；

初级分类模型确定子模块，用于获取各个文本特征信息对应的初级分类模型；

文本特征信息输入子模块，用于将所述多个文本特征信息分别输入对应的初级分类模型中，得到对应的初级分类模型输出的状态分类概率值。

在一个实施例中，所述初级分类模型确定子模块，包括：

第一确定单元，用于当所述文本特征信息包括词向量时，获取与所述词向量对应的第一初级分类模型；所述第一初级分类模型根据具有故障类型标签的多个词向量对卷积神经网络进行训练得到；

第二确定单元，用于当所述文本特征信息包括词频逆文档频率时，获取与所述词频逆文档频率对应的第二初级分类模型；所述第二初级分类模型根据设备故障导则对分类模型进行训练得到；

第三确定单元，用于当所述文本特征信息包括句向量信息时，获取与所述句向量信息对应的第三初级分类模型；所述第三初级分类模型用于将所述句向量信息与设备故障导则进行语义相似度匹配，并根据匹配结果确定状态分类概率值。

在一个实施例中，所述状态描述信息获取模块601，包括：

模型参数获取子模块，用于获取预先训练的词向量模型的模型参数；所述词向量模型根据多个电网文本信息对预训练语言模型进行微调得到；

词向量确定子模块，用于根据所述模型参数，确定所述状态描述信息对应的词向量。

在一个实施例中，所述装置还包括：

电网文本信息获取模块，用于获取电网垂直领域中的多个电网文本信息；

电网训练文本信息获取模块，用于对多个电网文本信息的语序进行调整，得到符合自然语言规则的多个电网训练文本信息；

模型微调模块，用于根据所述多个电网训练文本信息，对预设的预训练语言模型进行微调，得到词向量模型。

在一个实施例中，所述模型微调模块，包括：

预测子模块，用于将所述多个电网训练文本信息输入到预设的预训练语言模型，得到所述预训练语言模型输出的上下文预测结果；

损失函数获取子模块，用于根据所述多个电网训练文本信息和所述上下文预测结果，确定所述预训练语言模型当前的损失函数；

训练子模块，用于根据所述损失函数对所述预训练语言模型的模型参数进行调整，直到满足所述预训练语言模型的训练结束条件，得到所述词向量模型。

在一个实施例中，所述装置还包括：

设备故障导则获取模块，用于获取预设的设备故障导则，以及所述设备故障导则对应的故障类型和词频逆文档频率；

第二初级分类模型训练模块，用于采用所述故障类型和词频逆文档频率对分类模型进行训练，得到第二初级分类模型。

在一个实施例中，所述装置还包括：

概率值获取模块，用于获取具有故障类型标签的多个状态分类概率值；所述多个状态分类概率值为训练好的第一初级分类模型、第二初级分类模型和第三初级分类模型输出的状态分类概率值；

回归模型处理模块，用于将所述多个状态分类概率值输入至回归模型，得到所述回归模型输出的设备状态评估结果；所述设备状态评估结果采用各个初级分类模型对应的模型权重对状态分类概率值处理后得到，所述设备状态评估结果为排序在预设范围内的处理后的状态分类概率值对应的设备状态；

回归模型调整模块，用于根据所述设备状态评估结果和所述故障类型标签，对所述回归模型的模型权重进行调整，并调用所述概率值获取模块，直到满足训练结束条件，得到次级分类模型。

关于一种设备状态的评估装置的具体限定可以参见上文中对于一种设备状态的评估方法的限定，在此不再赘述。上述一种设备状态的评估装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种设备状态的评估方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

获取用户针对设备提交的状态描述信息；

在一个实施例中，处理器执行计算机程序时还实现上述其他实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

获取用户针对设备提交的状态描述信息；

在一个实施例中，计算机程序被处理器执行时还实现上述其他实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种设备状态的评估方法，其特征在于，所述方法包括：

获取用户针对设备提交的状态描述信息；

2.根据权利要求1所述的方法，其特征在于，所述确定所述状态描述信息对应的文本特征信息，并将所述文本特征信息输入至不同类型的多个初级分类模型，得到所述多个初级分类模型分别输出的状态分类概率值，包括：

获取所述状态描述信息对应的多个文本特征信息；

获取各个文本特征信息对应的初级分类模型；

3.根据权利要求2所述的方法，其特征在于，所述获取各个文本特征信息对应的初级分类模型，包括：

4.根据权利要求2所述的方法，其特征在于，所述获取所述状态描述信息对应的多个文本特征信息，包括：

根据所述模型参数，确定所述状态描述信息对应的词向量。

5.根据权利要求4所述的方法，其特征在于，还包括：

获取电网垂直领域中的多个电网文本信息；

6.根据权利要求5所述的方法，其特征在于，所述根据所述多个电网训练文本信息，对预设的预训练语言模型进行微调，得到词向量模型，包括：

7.根据权利要求3所述的方法，其特征在于，还包括：

8.一种设备状态的评估装置，其特征在于，所述装置包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的设备状态的评估方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的设备状态的评估方法的步骤。