CN113591479A

CN113591479A - 电力计量的命名实体识别方法、装置和计算机设备

Info

Publication number: CN113591479A
Application number: CN202110837584.8A
Authority: CN
Inventors: 梁洪浩; 伍少成; 姜和芳; 陈晓伟
Original assignee: Shenzhen Power Supply Co ltd
Current assignee: Shenzhen Power Supply Co ltd
Priority date: 2021-07-23
Filing date: 2021-07-23
Publication date: 2021-11-02

Abstract

本申请涉及一种电力计量的命名实体识别方法、装置、计算机设备和存储介质，所述方法包括：获取用于描述电力计量信息的待识别语料中多个词语各自对应的词向量；将多个词向量输入到训练好的编码器，通过所述编码器获取每个词向量对应的高斯分布的分布特征；基于多个词向量对应的分布特征，生成词向量特征；将所述词向量特征输入到预设的条件随机场，根据所述条件随机场输出的标注结果，确定所述待识别语料中的命名实体。在本实施例中，通过获取词向量对应高斯分布的分布特征，可以准确识别出相似词向量之间的差别，由此判断出两个相似词向量是否为同一词向量，有效提高电力计量的命名实体识别准确率。

Description

电力计量的命名实体识别方法、装置和计算机设备

技术领域

本申请涉及命名实体识别技术领域，特别是涉及一种电力计量的命名实体识别方法、装置、计算机设备和存储介质。

背景技术

随着知识图谱的日益普及，人们对知识图谱的需求越来越大。针对电力计量知识图谱，构建前往往需要从电力计量文本中准确识别并提取电力计量的命名实体。在传统技术中，深度学习模型在电力计量中得到了广泛的应用，例如通过长短时记忆神经网络(LSTM)、卷积神经网络等识别电力计量的命名实体。

然而，在中文的电力计量报告中，大量电力计量命名实体的名称较为相似，而传统的命名实体识别方法无法对其进行准确识别，导致电力计量命名实体的识别准确率低。

发明内容

基于此，有必要针对上述技术问题，提供一种电力计量的命名实体识别方法、装置、计算机设备和存储介质。

一种电力计量的命名实体识别方法，所述方法包括：

获取用于描述电力计量信息的待识别语料中多个词语各自对应的词向量；

将多个词向量输入到训练好的编码器，通过所述编码器获取每个词向量对应的高斯分布的分布特征；

基于多个词向量对应的分布特征，生成词向量特征；

将所述词向量特征输入到预设的条件随机场，根据所述条件随机场输出的标注结果，确定所述待识别语料中的命名实体。

在其中一个实施例中，所述基于多个词向量对应的分布特征，生成词向量特征，包括：

对多个词向量对应的分布特征进行组合，生成第一参考特征集合和第二参考特征集合；所述第一参考特征集合中的每个元素为一词向量；所述第二参考特征集合中的每个元素为相邻的词向量对；

将所述第一参考特征集合和第二参考特征集合输入到训练好的双向长短时记忆网络，通过所述双向长短时记忆网络获取所述第一参考特征集合对应的独立特征和所述第二参考集合对应的关联性特征；

对所述独立特征和所述关联性特征进行特征融合，得到词向量特征。

在其中一个实施例中，所述对多个词向量对应的分布特征进行组合，生成第二参考特征集合，包括：

确定多个分布特征对应的排列顺序；所述排列顺序与待识别语料中各个词语的排列顺序对应；

根据所述排列顺序，获取多组相邻的分布特征，得到多组分布特征对；

采用多组分布特征对生成第二参考特征集合。

在其中一个实施例中，还包括：

获取预先构建的电力计量语料库；所述电力计量语料库包括多条用于描述电力计量信息的语料；

采用预设的分词模型对电力计量语料库中的语料进行分词，得到多个用于描述电力计量信息的词语；

基于得到的多个词语对初始化的词向量模型进行训练，得到训练好的词向量模型，所述训练好的词向量模型用于获取电力计量语料中词语对应的词向量。

在其中一个实施例中，还包括：

通过训练好的词向量模型，获取用于描述电力计量信息的多个词语各自对应的第一词向量；

将所述第一词向量输入到待训练的编码器，通过所述编码器获取所述第一词向量对应高斯分布的第一分布特征；

将所述第一分布特征输入到待训练的解码器，通过所述解码器基于所述第一分布特征获取预测词向量；

基于所述第一词向量、预测词向量和损失函数，调整所述编码器和解码器的参数，直到满足训练结束条件，得到训练好的编码器和解码器。

在其中一个实施例中，还包括：

获取样本语料及其对应的标签；所述标签包括所述样本语料中电力计量的命名实体和所述命名实体对应的实体类别；

采用训练好的分词模型对所述样本语料分词，获取分词后多个词语各自对应的第二词向量，并通过训练好的编码器获取所述第二词向量对应的第二分布特征；

对多个第二分布特征进行组合，生成第一样本特征集合和第二样本特征集合，并将所述第一样本特征集合和第二样本特征集合输入到待训练的双向长短时记忆网络，获取对应的词向量特征；

将所述词向量特征输入到预设的条件随机场，根据所述条件随机场输出的预测结果和所述标签，调整所述双向长短时记忆网络对应的网络参数，直到满足训练结束条件，得到训练好的双向长短时记忆网络。

在其中一个实施例中，所述根据所述条件随机场输出的预测结果和所述标签，调整所述双向长短时记忆网络对应的网络参数，包括：

通过所述条件随机场基于所述词向量特征确定每个词向量特征对应的预测结果和所述预测结果对应的预测得分；

根据多个词向量对应的预测得分和预设的势函数，确定当前的条件概率；

当所述条件概率小于预设概率阈值时，根据所述预测结果和所述标签调整所述双向长短时记忆网络对应的网络参数。

一种电力计量的命名实体识别装置，所述装置包括：

词向量获取模块，用于获取用于描述电力计量信息的待识别语料中多个词语各自对应的词向量；

分布特征获取模块，用于将多个词向量输入到训练好的编码器，通过所述编码器获取每个词向量对应的高斯分布的分布特征；

词向量特征获取模块，用于基于多个词向量对应的分布特征，生成词向量特征；

命名实体确定模块，用于将所述词向量特征输入到预设的条件随机场，根据所述条件随机场输出的标注结果，确定所述待识别语料中的命名实体。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如上任一项所述方法的步骤。

上述电力计量的命名实体识别方法、装置、计算机设备和存储介质，可以获取用于描述电力计量信息的待识别语料中多个词语各自对应的词向量，将多个词向量输入到训练好的编码器，通过编码器获取每个词向量对应的高斯分布的分布特征，基于多个词向量对应的分布特征，生成词向量特征，进而可以将词向量特征输入到预设的条件随机场，根据条件随机场输出的标注结果，确定待识别语料中的命名实体。在本实施例中，通过获取词向量对应高斯分布的分布特征，可以准确识别出相似词向量之间的差别，由此判断出两个相似词向量是否为同一词向量，有效提高电力计量的命名实体识别准确率。

附图说明

图1为一个实施例中一种电力计量的命名实体识别方法的流程示意图；

图2为另一个实施例中一种电力计量的命名实体识别方法的流程示意图；

图3为一个实施例中一种电力计量的命名实体识别装置的结构框图；

图4为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

随着智能电网和大数据的发展，当今企业和研究机构对电力大数据的分析和处理需求越来越急迫。电力系统中存在着大量离散的电力计量信息，为获得有效知识的方法，可以从离散的电力计量信息中抽取知识、构建电力计量知识图谱。知识图谱以结构化的形式描述了客观世界中的概念、实体及其关系。对于智能电网，知识图谱可以将电力计量知识以系统的方式表示出来，从而结合数据为智能电网的决策提供知识支持和数据支持。电力计量知识图谱是基于电力计量知识的，而获取电力计量知识的关键是从电力计量文本中识别和提取电力计量实体，根据实体抽象知识、构建知识图谱，因此，电力计量实体识别是构建电力计量知识图谱的先决条件。电力计量实体识别的目的是识别特定领域的电力计量实体及其类别，这对电力计量内容分析和建立电力计量知识图谱具有重要意义，对高效的电力计量实体识别方法的需求也越来越迫切。

在传统技术中，早期电力计量的实体识别方法可分为基于字典或规则的方法和基于统计机器学习模型的方法。近年来，深度学习模型在电力计量中得到了广泛的应用，例如通过长短时记忆神经网络(LSTM)、卷积神经网络等识别电力计量的命名实体。

然而，在电力计量报告中，大量电力计量命名实体的名称较为相似，而传统的命名实体识别方法无法对其进行准确识别，导致电力计量命名实体的识别准确率低。

在一个实施例中，如图1所示，提供了一种电力计量的命名实体识别方法，本实施例以该方法应用于服务器进行举例说明，可以理解的是，该方法也可以应用于终端，还可以应用于包括终端和服务器的系统，并通过终端和服务器的交互实现。本实施例中，该方法可以包括以下步骤：

步骤101，获取用于描述电力计量信息的待识别语料中多个词语各自对应的词向量。

其中，词向量可以是将词语映射到实数后得到的向量。

在实际应用中，服务器可以获取用于描述电力计量信息的待识别语料，在对待识别语料进行分词后，可以确定待识别语料中多个词语各自对应的词向量。

步骤102，将多个词向量输入到训练好的编码器，通过所述编码器获取每个词向量对应的高斯分布的分布特征。

其中，分布特征可以包括高斯分布的期望和协方差。

在得到多个词向量后，可以将多个词向量输入到预先训练好的编码器，通过编码器将输入的词向量编码为参数化的高斯分布形式的特征，从而可以获取每个词向量对应的高斯分布的分布特征。在得到各个词向量对应高斯分布的分布特征后，即可以通过该分布特征反映两个词向量之间的差异。

具体而言，在电力计量中，两个相似的命名实体可以具有相似度较高的词向量，即相似的命名实体可能得到的词向量是比较相似的。若使用传统的距离度量方式度量词向量距离，容易得到很小的距离差距(词向量维度也比较高)，导致难以区分不同的命名实体。基于此，在本实施例中，可以把词向量之间的距离度量通过特征表示的方式，转换为高斯分布下期望和协方差的差异度量，把词向量编码为服从高斯分布的分布特征，通过不同词向量对应的特征的期望和协方差的差异，确定两个词向量是否相同。

步骤103，基于多个词向量对应的分布特征，生成词向量特征。

在得到多个词向量对应的分布特征后，可以将分布特征输入到训练好的双向长短时记忆网络(Bi-LSTM)中，通过双向长短时记忆网络对输入的分布特征进行处理后，生成词向量特征。

步骤104，将所述词向量特征输入到预设的条件随机场，根据所述条件随机场输出的标注结果，确定所述待识别语料中的命名实体。

在得到词向量特征后，可以将词向量特征输入到预设的条件随机场中，由条件随机场基于输入的词向量特征预测各个词语对应的标注结果，进而可以根据标注结果确定出待识别语料中的命名实体。在确定命名实体后，可以基于识别出的命名实体对待识别语料进行标注、保存。

在本实施例中，可以获取用于描述电力计量信息的待识别语料中多个词语各自对应的词向量，将多个词向量输入到训练好的编码器，通过编码器获取每个词向量对应的高斯分布的分布特征，基于多个词向量对应的分布特征，生成词向量特征，进而可以将词向量特征输入到预设的条件随机场，根据条件随机场输出的标注结果，确定待识别语料中的命名实体。在本实施例中，通过获取词向量对应高斯分布的分布特征，可以准确识别出相似词向量之间的差别，由此判断出两个相似词向量是否为同一词向量，有效提高电力计量的命名实体识别准确率。

在一个实施例中，所述基于多个词向量对应的分布特征，生成词向量特征，可以包括如下步骤：

对多个词向量对应的分布特征进行组合，生成第一参考特征集合和第二参考特征集合；将所述第一参考特征集合和第二参考特征集合输入到训练好的双向长短时记忆网络，通过所述双向长短时记忆网络获取所述第一参考特征集合对应的独立特征和所述第二参考集合对应的关联性特征；对所述独立特征和所述关联性特征进行特征融合，得到词向量特征。

其中，第一参考特征集合中的每个元素为对应词向量的分布特征，第二参考特征集合中的每个元素对应相邻的两个分布特征。

在具体实现中，在得到多个词向量对应的分布特征后，可以对多个分布特征进行组合，生成第一参考特征集合和第二参考特征集合，并将第一参考特征集合和第二参考特征集合中输入到训练好的双向长短时记忆网络，通过双向长短时记忆网络获取第一参考特征集合对应的独立特征和第二参考集合对应的关联性特征。

具体而言，训练好的双向长短时记忆网络中可以包括两个处理模块，该双向长短时记忆网络也可以称为双阶的双向长短时记忆网络。针对输入的第一参考特征集合和第二参考特征集合，可以通过两个处理模块分别对应进行处理，由第一处理模块处理第一参考特征集合，而第二处理模块则对第二参考特征集合中的各个元素进行处理。

例如，针对“电流失流”，在进行分词时，可能被分为“电流失流”一个词，也可能分为“电流”和“失流”两个词，但正确的划分方式是将“电流失流”确定为一个命名实体，其对应的命名实体类别为现象实体。如果“电流失流”被划分为两个实体后，容易导致在识别时候把“电流”识别为对象实体，而“失流”却没有被识别为实体。为了避免上述的错误划分，在词向量的分布特征进行处理，由第一处理模块基于单个词向量对应的分布特征进行处理，例如“电流”词向量对应的分布特征是FL1，“失流”词向量对应的特征是FL2，第一处理模块对FL1和FL2分别进行特征提取FL1和FL2各自对应的独立特征，而第二处理模块则同时基于FL1和FL2进行特征提取，得到与两者对应的关联性特征，从而防止出现实体识别错误的情况。

在得到独立特征和关联性特征后，可以对独立特征和所述关联性特征进行特征融合，得到反应多个词向量特点的词向量特征。

在本实施例中，可以对多个词向量对应的分布特征进行组合，生成第一参考特征集合和第二参考特征集合，将第一参考特征集合和第二参考特征集合输入到训练好的双向长短时记忆网络，通过双向长短时记忆网络获取第一参考特征集合对应的独立特征和第二参考集合对应的关联性特征，对独立特征和关联性特征进行特征融合，得到词向量特征，能够对词向量的分布特征进行组合，防止分词错误而导致的实体识别错误的情况。

在一个实施例中，所述对多个词向量对应的分布特征进行组合，生成第二参考特征集合，可以包括如下步骤：

确定多个分布特征对应的排列顺序；根据所述排列顺序，获取多组相邻的分布特征，得到多组分布特征对；采用多组分布特征对生成第二参考特征集合。

其中，多个分布特征对应的排列顺序与待识别语料中各个词语的排列顺序对应。

具体实现中，在得到多个词向量对应的分布特征后，可以确定多个分布特征对应的排列顺序。具体地，可以将词向量的分布特征按照原来各个词语对应的排列顺序组合成一个语料的分布特征表达。

在得到多个分布特征对应的排列顺序后，可以根据排列顺序，获取多组相邻的分布特征，得到多组分布特征对，每组分布特征对中包含两个相邻的分布特征。在得到多组分布特征对后，可以将每组分布特征对确定为一个元素，生成包含多个元素的第二参考特征集合。

在本实施例中，通过确定多个分布特征对应的排列顺序，根据排列顺序，获取多组相邻的分布特征，得到多组分布特征对，采用多组分布特征对生成第二参考特征集合，可以组合相邻词向量对应的特征分布，为防止分词错误而导致实体识别错误提供数据处理基础。

在一个实施例中，所述方法还可以包括如下步骤：

获取预先构建的电力计量语料库；采用预设的分词模型对电力计量语料库中的语料进行分词，得到多个用于描述电力计量信息的词语；基于得到的多个词语对初始化的词向量模型进行训练，得到训练好的词向量模型。

其中，电力计量语料库包括多条用于描述电力计量信息的语料，训练好的词向量模型用于获取电力计量语料中词语对应的词向量。

在具体实现中，一般领域的实体类型一般为人、场所、组织等，命名格式相对规范，相应地，许多通用领域的命名实体数据集已开放并用于模型训练。然而，在电力计量领域，缺少一个可以直接用于机器学习模型训练的公共数据集。

基于此，可以预先构建电力计量语料库。具体地，电力系统中存在着大量的与电力计量相关的语料，例如，可以从已开发的电力计量信息处理系统中获取，也可以从从事电力工作的企业中获取业务报表、电力计量统计数据等主体信息获取，或者，针对英语语料，可以从英文知识库中获取与电力计量相关的语料。在获取与电力计量相关的大量语料后，可以进行数据清洗，剔除无关信息，得到包括英文语料和中文语料的电力计量语料库。

在获取电力计量语料库后，可以采用预设的分词模型对电力计量语料库中的语料进行分词，得到多个用于描述电力计量信息的词语，例如基于多种标点符号对语料库中的句子进行结构划分。在进行分词后，可以采用当前得到的词语训练初始化的词向量模型，得到训练好的词向量模型，例如训练Word2Vec模型，从而后续可以利用该模型将描述电能计量信息的词语映射为词向量。

在本实施例中，通过获取预先构建的电力计量语料库，采用预设的分词模型对所述电力计量语料库的语料进行分词，得到多个用于描述电力计量信息的词语，采用得到的多个词语训练初始化的词向量模型，得到训练好的词向量模型，能够构建电力计量语料库以及与电力计量相关的词向量，避免电力计量的命名实体边界模型，为后续准确识别出电力计量的命名实体提供基础。

在一个实施例中，所述方法还可以包括如下步骤：

通过训练好的词向量模型，获取用于描述电力计量信息的多个词语各自对应的第一词向量；将所述第一词向量输入到待训练的编码器，通过所述编码器获取所述第一词向量对应高斯分布的第一分布特征；将所述第一分布特征输入到待训练的解码器，通过所述解码器基于所述第一分布特征获取预测词向量；基于所述第一词向量、预测词向量和损失函数，调整所述编码器和解码器的参数，直到满足训练结束条件，得到训练好的编码器和解码器。

在实际应用中，在得到训练好的词向量模型后，可以通过训练好的词向量模型，获取用于描述电力计量信息的多个词语各自对应的第一词向量，例如，针对样本渔捞，可以通过预设的分词模型对其进行分词，并通过训练好的词向量模型确定各个词语对应的第一词向量。

具体实现中，可以预先设置待训练的高斯自编码器(Auto-encoder，AE)，该自编码器包括编码器和解码器两部分。在获取到第一词向量后，可以将第一词向量输入到待训练的编码器中，由该编码器确定第一词向量对应的高斯分布，并获取其对应的第一分布特征。在获取到第一分布特征后，可以将第一分布特征输入到待训练的解码器中，并通过解码器基于第一分布特征获取预测词向量。进而可以基于第一词向量、预测词向量和损失函数，调整编码器和解码器的参数，直到满足训练结束条件，得到训练好的编码器和解码器。

具体而言，编码器也可以称为高斯编码器，该编码器的编码过程如下所示：

h＝Encoder(x)＝Neural(W；x)＝Gaussian(μ(W₁,x),σ(W₂，x))

其中，h表示词向量对应的隐式表达，μ表示期望，σ表示协方差，Neural表示一个卷积神经网络。

解码器也可以是卷积神经网络，输入到编码器的词向量和解码器输出的词向量具有相同的相同维度。

损失函数可以如下所示：

其中，Decoder表示解码器。在训练过程中，训练目标是使输入到编码器的词向量和解码器输出的词向量尽可能一直，从而通过编码器提取出词向量有效的分布特征。

在本实施例中，通过训练好的词向量模型，获取用于描述电力计量信息的多个词语各自对应的第一词向量，将第一词向量输入到待训练的编码器，通过编码器获取第一词向量对应高斯分布的第一分布特征，将第一分布特征输入到待训练的解码器，通过解码器基于所述第一分布特征获取预测词向量；基于第一词向量、预测词向量和损失函数，调整所码器和解码器的参数，直到满足训练结束条件，得到训练好的编码器和解码器，为后续准确确定词向量对应的分布特征提供模型基础。

在一个实施例中，所述方法还可以包括如下步骤：

获取样本语料及其对应的标签；采用训练好的分词模型对所述样本语料分词，获取分词后多个词语各自对应的第二词向量，并通过训练好的编码器获取所述第二词向量对应的第二分布特征；对多个第二分布特征进行组合，生成第一参考特征集合和第二参考特征集合，并将所述第一参考特征集合和第二参考特征集合输入到待训练的双向长短时记忆网络，获取对应的词向量特征；将所述词向量特征输入到预设的条件随机场，根据所述条件随机场输出的预测结果和所述标签，调整所述双向长短时记忆网络对应的网络参数，直到满足训练结束条件，得到训练好的双向长短时记忆网络。

其中，标签包括本语料中电力计量的命名实体和命名实体对应的实体类别，该标签可以通过BIO标注体系进行标记。每个命名实体对应的实体类别可以是一下任意一种：电力计量指标、电力计量对象、电力计量现象和电力计量行为。具体而言，在电力计量中，不同命名实体之间的边界较为模糊，通过引入上述实体类别，可以在识别出命名实体的同时确定出对应的实体类别，提高识别效率。

例如，统计用电数据可以标注为“用电量”“抄表率”“电流”“电量”等划分为电力计量指标实体。将与电力计量有关的对象、人员、地区、机构标识为电力计量对象实体，如“电能表”“广州供电局”等。将电力计量过程中特定主体产生的现象标识为电力计量现象实体，如“电量差异异常”“电能表停止”“电流损耗”“电流不平衡”等。针对特定动作的电力计量操作，则可以被标记为电力计量行为实体，如“抄表”“异常维修”等。其中，电力计量实体的指标和对象多为名词，电力计量现象多为名词和动词的组合，电力计量行为多为动词。

在实际应用中，可以获取样本语料及其对应的标签，该样本语料为用于描述电力计量信息的语料。在得到样本语料后，可以采用分词模型对样本语料分词，通过训练好的词向量模型获取分词后多个词语各自对应的第二词向量，并通过训练好的编码器获取第二词向量对应的第二分布特征。

在获取多个第二分布特征后，可以对多个第二分布特征进行组合，生成第一参考特征集合和第二参考特征集合，并将第一样本特征集合和第二样本特征集合输入到待训练的双向长短时记忆网络，获取对应的词向量特征，其中，第一样本特征集合中的每个元素可以对应一个分布特征，第二样本特征和中的一个元素可以对应相邻的两个分布特征，第一样本特征集合、第二样本特征集合的获取方式与第一参考特征集合、第二参考特征集合的获取方式类似，本实施例不作赘述。

在得到对应的词向量后，可以将词向量特征输入到预设的条件随机场，根据条件随机场输出的预测结果和标签，调整双向长短时记忆网络对应的网络参数，直到满足训练结束条件，得到训练好的双向长短时记忆网络。

在本实施例中，通过获取样本语料及其对应的标签，采用分词模型对样本语料分词，获取分词后多个词语各自对应的第二词向量，并通过训练好的编码器获取第二词向量对应的第二分布特征，进而对多个第二分布特征进行组合，生成第一参考特征集合和第二参考特征集合，并将第一参考特征集合和第二参考特征集合输入到待训练的双向长短时记忆网络，获取对应的词向量特征，将词向量特征输入到预设的条件随机场，根据条件随机场输出的预测结果和标签，调整双向长短时记忆网络对应的网络参数，直到满足训练结束条件，得到训练好的双向长短时记忆网络，能够为快速准确地获取词向量特征提供模型基础。

在一个实施例中，所述根据所述条件随机场输出的预测结果和所述标签，调整所述双向长短时记忆网络对应的网络参数，可以包括：

通过所述条件随机场基于所述词向量特征确定每个词向量特征对应的预测结果和所述预测结果对应的预测得分；根据多个词向量对应的预测得分和预设的势函数，确定当前的条件概率；当所述条件概率小于预设概率阈值时，根据所述预测结果和所述标签调整所述双向长短时记忆网络对应的网络参数。

在实际应用中，实体识别问题可以看作是一个序列标注问题，考虑到相邻标签与命名实体之间的相关性，可以通过条件随机场(conditional random field，CRF)对标签序列进行联合建模、识别命名实体。

在本实施例中，在得到样本语料对应的词向量特征后，可以将词向量特征输入到条件随机场中，由条件随机场基于词向量特征确定每个词向量特征对应的预测结果和所述预测结果对应的预测得分，其中，预测结果可以是每个词向量对应的实体识别结果和实体类别。

在得到预测得分后，可以根据多个词向量对应的预测得分和预设的势函数，确定当前的条件概率，势函数可以如下所示：

其中，

是相邻词向量及其标签对应的预测得分，

是第i个词向量及其标签对应的预测得分，这两个值都可以通过神经网络确定。

条件概率可以通过如下所示公式确定：

当条件概率小于预设概率阈值时，则可以根据预测结果和标签调整双向长短时记忆网络对应的网络参数，以不断提高条件概率作为模型的训练目标。当条件概率达到预设的概率阈值时，可以确定当前双向长短时记忆网络的预测结果与标签一致，达到训练结束条件，得到训练好的双向长短时记忆网络。

在本实施例中，可通过条件随机场基于词向量特征确定每个词向量特征对应的预测结果和预测结果对应的预测得分，根据多个词向量对应的预测得分和预设的势函数，确定当前的条件概率；当条件概率小于预设概率阈值时，根据预测结果和标签调整双向长短时记忆网络对应的网络参数，有效提高双向长短时记忆网络的识别准确性。

为了使本领域技术人员能够更好地理解上述步骤，以下通过一个例子对本申请实施例加以示例性说明，但应当理解的是，本申请实施例并不限于此。

如图2所示，在获取待识别语料后，可以对其进行分词，并获取分词后各个词语对应的词向量(对应于图2中的“电力计量的命名实体词向量”)，进而可以通过高斯自编码器(AE)获取每个词向量高斯分布下的分布特征。针对高斯自编码器，可以预先对编码器和解码器进行训练，以提高分布特征的识别准确性。

在获取到多个词向量对应的分布特征后，可以生成第一参考特征集合和第二参考特征集合，其中，第一参考特征集合中的每个元素对应一个分布特征，第二参考特征集合中的每个元素对应两个相邻的分布特征。

在得到第一参考特征集合和第二参考特征集合后，可以输入到训练好的双向长短时记忆网络中。在双向长短时记忆网络中可以包括两个处理模块：第一处理模块和第二处理模块。在两个处理模块中都包括一个双向长短时记忆网络模块，其中，第一处理模块可以对第一参考特征集合进行处理，即分别对每个分布特征进行分析处理，得到对应的独立特征；第二处理模块可以对第二参考特征集合进行处理，即每次处理相邻的两个分布特征，得到对应的关联性特征。

在得到独立特征和关联性特征后，可以对其进行融合，生成词向量特征，并将其输入到条件随机场中，从而通过条件随机场识别出待识别语料中的多个命名实体。

应该理解的是，虽然图1的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图3所示，提供了一种电力计量的命名实体识别装置，所述装置包括：

词向量获取模块301，用于获取用于描述电力计量信息的待识别语料中多个词语各自对应的词向量；

分布特征获取模块302，用于将多个词向量输入到训练好的编码器，通过所述编码器获取每个词向量对应的高斯分布的分布特征；

词向量特征获取模块303，用于基于多个词向量对应的分布特征，生成词向量特征；

命名实体确定模块304，用于将所述词向量特征输入到预设的条件随机场，根据所述条件随机场输出的标注结果，确定所述待识别语料中的命名实体。

在一个实施例中，所述词向量特征获取模块303，包括：

参考特征集合获取子模块，用于对多个词向量对应的分布特征进行组合，生成第一参考特征集合和第二参考特征集合；所述第一参考特征集合中的每个元素为一词向量；所述第二参考特征集合中的每个元素为相邻的词向量对；

网络处理子模块，用于将所述第一参考特征集合和第二参考特征集合输入到训练好的双向长短时记忆网络，通过所述双向长短时记忆网络获取所述第一参考特征集合对应的独立特征和所述第二参考集合对应的关联性特征；

词向量特征确定子模块，用于对所述独立特征和所述关联性特征进行特征融合，得到词向量特征。

在一个实施例中，所述参考特征集合获取子模块，具体用于：

采用多组分布特征对生成第二参考特征集合。

在一个实施例中，所述装置还包括：

电力计量语料库获取模块，用于获取预先构建的电力计量语料库；所述电力计量语料库包括多条用于描述电力计量信息的语料；

语料分词模块，用于采用预设的分词模型对电力计量语料库中的语料进行分词，得到多个用于描述电力计量信息的词语；

词向量模型训练模块，用于基于得到的多个词语对初始化的词向量模型进行训练，得到训练好的词向量模型，所述训练好的词向量模型用于获取电力计量语料中词语对应的词向量。

在一个实施例中，所述装置还包括：

第一词向量获取模块，用于通过训练好的词向量模型，获取用于描述电力计量信息的多个词语各自对应的第一词向量；

第一分布特征获取模块，用于将所述第一词向量输入到待训练的编码器，通过所述编码器获取所述第一词向量对应高斯分布的第一分布特征；

解码模块，用于将所述第一分布特征输入到待训练的解码器，通过所述解码器基于所述第一分布特征获取预测词向量；

第一训练模块，用于基于所述第一词向量、预测词向量和损失函数，调整所述编码器和解码器的参数，直到满足训练结束条件，得到训练好的编码器和解码器。

在一个实施例中，所述装置还包括：

样本语料获取模块，用于获取样本语料及其对应的标签；所述标签包括所述样本语料中电力计量的命名实体和所述命名实体对应的实体类别；

第二词向量获取模块，用于采用训练好的分词模型对所述样本语料分词，获取分词后多个词语各自对应的第二词向量，并通过训练好的编码器获取所述第二词向量对应的第二分布特征；

样本特征集合获取模块，用于对多个第二分布特征进行组合，生成第一样本特征集合和第二样本特征集合，并将所述第一样本特征集合和第二样本特征集合输入到待训练的双向长短时记忆网络，获取对应的词向量特征；

第二训练模块，用于将所述词向量特征输入到预设的条件随机场，根据所述条件随机场输出的预测结果和所述标签，调整所述双向长短时记忆网络对应的网络参数，直到满足训练结束条件，得到训练好的双向长短时记忆网络。

在一个实施例中，所述第二训练模块，包括：

预测得分获取子模块，用于通过所述条件随机场基于所述词向量特征确定每个词向量特征对应的预测结果和所述预测结果对应的预测得分；

条件概率确定子模块，用于根据多个词向量对应的预测得分和预设的势函数，确定当前的条件概率；

参数调整子模块，用于当所述条件概率小于预设概率阈值时，根据所述预测结果和所述标签调整所述双向长短时记忆网络对应的网络参数。

关于一种电力计量的命名实体识别装置的具体限定可以参见上文中对于一种电力计量的命名实体识别方法的限定，在此不再赘述。上述一种电力计量的命名实体识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储词向量。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种电力计量的命名实体识别方法。

本领域技术人员可以理解，图4中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

基于多个词向量对应的分布特征，生成词向量特征；

在一个实施例中，处理器执行计算机程序时还实现上述其他实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

基于多个词向量对应的分布特征，生成词向量特征；

在一个实施例中，计算机程序被处理器执行时还实现上述其他实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种电力计量的命名实体识别方法，其特征在于，所述方法包括：

基于多个词向量对应的分布特征，生成词向量特征；

2.根据权利要求1所述的方法，其特征在于，所述基于多个词向量对应的分布特征，生成词向量特征，包括：

3.根据权利要求2所述的方法，其特征在于，所述对多个词向量对应的分布特征进行组合，生成第二参考特征集合，包括：

采用多组分布特征对生成第二参考特征集合。

4.根据权利要求1所述的方法，其特征在于，还包括：

5.根据权利要求4所述的方法，其特征在于，还包括：

6.根据权利要求2所述的方法，其特征在于，还包括：

7.根据权利要求6所述的方法，其特征在于，所述根据所述条件随机场输出的预测结果和所述标签，调整所述双向长短时记忆网络对应的网络参数，包括：

8.一种电力计量的命名实体识别装置，其特征在于，所述装置包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。