WO2020232861A1

WO2020232861A1 - 命名实体识别方法、电子装置及存储介质

Info

Publication number: WO2020232861A1
Application number: PCT/CN2019/102206
Authority: WO
Inventors: 韦峰; 徐国强; 邱寒
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-05-20
Filing date: 2019-08-23
Publication date: 2020-11-26
Also published as: CN110287479B; CN110287479A

Abstract

本申请涉及计算机信息技术领域，提供了一种命名实体识别方法、电子装置及计算机存储介质，该方法包括：将接收到的待识别文本输入word2vec模型得到第一词向量，对所述待识别文本进行分词处理后输入ELMO模型，得到第二词向量，将所述第一词向量和所述第二词向量进行加权求和，利用双向LSTM模型对所述加权求和得到的结果进行处理，转换成文本特征序列，将所述文本特征输入至CRF模型处理，即得到命名实体识别结果。本申请利用ELMO模型深度考虑待识别文本在上下语义语法的不同表达以及在不同语言环境的表达意思，通过多个模型以不同层次处理待识别文本的信息，从而提高命名实体识别的准确率。

Description

命名实体识别方法、电子装置及存储介质

本申请基于巴黎公约申明享有2019年5月20日递交的申请号为CN201910419895.5、名称为“命名实体识别方法、电子装置及存储介质”的中国专利申请的优先权，该中国专利申请的整体内容以参考的方式结合在本申请中。

技术领域

本申请涉及计算机信息技术领域，尤其涉及一种命名实体识别方法、电子装置及存储介质。

背景技术

在信息抽取、实体链接等自然语言处理任务的场景中，常常需要进行命名实体识别(NamedEntity Recognition，NER)。其中，NER是指在文档集合中识别出特定类型的事物名称或符号的过程。

相关技术在进行命名实体识别时，一般采用条件随机场算法(Conditional Random Field，CRF)或单向循环神经网络(Recurrent Neural Network，RNN)等模型对待识别文本进行识别。

然而，由于无论采用CRF还是采用单向RNN进行识别，得到的语义信息比较有限，因此，识别的准确率不高。

发明内容

鉴于以上内容，本申请提供一种命名实体识别方法、电子装置及存储介质。其目的在于利用ELMO模型充分考虑待识别文本上下语义表达及语境变化表达，从而提高命名实体识别的准确率。

为实现上述目的，本申请提供一种命名实体识别方法，应用于电子装置，该方法包括：

接收步骤：接收待识别文本；

第一处理步骤：将所述待识别文本输入word2vec模型得到所述待识别文本的第一词向量；

第二处理步骤：对所述待识别文本进行分词处理，得到待识别文本中每一句/段对应的第一分词集合，将所述第一分词集合输入预先训练的ELMO模型，以ELMO模型输出的词向量作为所述待识别文本的第二词向量；

加权步骤：将所述第一词向量和所述第二词向量进行加权求和，得到加权求和结果；

序列生成步骤：将所述加权求和结果输入双向LSTM模型处理，得到文本特征序列；

命名识别步骤：将所述文本特征序列输入条件随机场CRF模型处理，得到所述待识别文本的命名实体识别结果。

为实现上述目的，本申请还提供一种电子装置，该电子装置通信连接客户端及存储节点，该电子装置包括：存储器及处理器，所述存储器上存储命名实体识别程序，所述命名实体识别程序被所述处理器执行，可实现如下步骤：

接收步骤：接收待识别文本；

为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质中包括命名实体识别程序，所述命名实体识别程序被处理器执行时，可实现如上所述命名实体识别方法中的任意步骤。

本申请提出的命名实体识别方法、电子装置及存储介质，通过接收到的待识别文本输入word2vec模型得到第一词向量，对所述待识别文本进行分词处理后输入ELMO模型，得到第二词向量，将所述第一词向量和所述第二词向量进行加权求和，利用双向LSTM模型对所述加权求和得到的结果进行处理，转换成文本特征序列，将所述文本特征输入至CRF模型处理，即得到得到命名实体识别结果。本申请利用ELMO模型，使待识别文本被充分考虑上下语义及语言环境，得到更为贴近待识别文本的语义信息，通过双向LSTM模型及CRF模型处理，使得到的命名实体识别准确率提高。

附图说明

图1为本申请命名实体识别方法较佳实施例的运行环境图；

图2为图1中的命名实体识别程序运行时执行ELMO模型训练的示意图；

图3为本申请命名实体识别方法应用的各模型协同运作的示意图；

图4为本申请命名实体识别程序实施例的程序模块图；

图5为本申请命名实体识别方法较佳施例的流程图；

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请提供一种电子装置1。参照图1所示，为本申请电子装置1较佳实施例的示意图。

所述电子装置1包括但不限于存储器11、处理器12以及网络接口13。

其中，所述存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器11可以是所述电子装置1的内部存储单元，例如该电子装置1的硬盘或内存。在另一些实施例中，所述存储器11也可以是所述电子装置1的外部存储设备，例如该电子装置1配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器11还可以既包括所述电子装置1的内部存储单元也包括其外部存储设备。本实施例中，所述存储器11通常用于存储安装于所述电子装置1的操作系统和各类应用软件，例如命名实体识别程序10的程序代码等。此外，所述存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子装置1的总体操作，例如执行数据交互或者通信相关的控制和处理等。本实施例中，所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据，例如运行命名实体识别程序10的程序代码等。

网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该装置1与其他电子设备之间建立通信连接。

图1仅示出了具有组件11-13以及命名实体识别程序10的电子装置1，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

可选地，所述电子装置1还可以包括用户接口，用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode，OLED)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。

该电子装置1还可以包括射频(Radio Frequency，RF)电路、传感器和音频电路等等，在此不再赘述。

在本实施例中，所述电子装置1为分布式存储系统电子装置集群中的任意一台电子装置。分布式存储系统通常包括多台电子装置，与电子装置通信连接的客户端，以及一系列的存储节点。每个存储节点可能是一个存储设备，例如硬盘、磁盘或其他网络存储装置，也可能为提供存储空间的电子装置，例如个人电脑、电子装置等等。在分布式存储系统，数据以多副本的形式均匀地分布在各个存储节点。当某个存储节点的数据发生损毁时，通过其他存储节点的备份副本执行数据恢复。

在上述实施例中，处理器12执行存储器11中存储的命名实体识别程序10时可以实现如下步骤：

接收步骤：接收待识别文本。

当有命名实体识别需求时，用户可以开启命名实体识别的客户端应用程序，通过该客户端获取待识别文本。

例如，可以针对某小说文本进行命名实体识别，根据用户的选择操作，当用户选择小说文本中的一段内容后，获取命名实体识别指令，根据该命名实体识别指令触发将小说文本中被选择的一段内容作为获取到的待识别文本，当终端获取到待识别文本后，将其发送至服务器，服务器由此获取到待识别文本。

第一处理步骤：将所述待识别文本输入word2vec模型得到所述待识别文本的第一词向量。

由于深度学习模型接受数字的输入，而不是字符串，因而在获取到待识别文本后，需要将待识别文本转换成词向量的形式。常见的词向量训练表示方法有word2vec和glove，本实施例采用word2vec模型来实现。

word2vec是一个常见的分布式词向量表示方法，通过学习文本用词向量的方式表征词的语义信息，可将相似的词的距离拉的很近。

第二处理步骤：对所述待识别文本进行分词处理，得到待识别文本中每一句/段对应的第一分词集合，将所述第一分词集合输入预先训练的ELMO模型，以ELMO模型输出的词向量作为所述待识别文本的第二词向量。

由于第一词向量不能完全体现出某一个词在具体语境中所代表的意思，为了提高命名实体识别的准确性，需进一步提高单个词对应的词向量的准确性。

进一步地，所述ELMO模型的训练过程包括如下步骤：

A1，从预设语料库中获取预设数量的指定文本，对所述指定文本进行分句及分词处理，得到所述指定文本中每一句对应的第二分词集合；

A2，确定所述第二分词集合中各分词对应的词向量，将所述第二分词集合中各分词及所述分词对应的词向量作为样本数据；

A3，利用所述样本数据对双向LSTM模型进行训练，得到所述ELMO模型。

应当理解的是，本申请所述双向LSTM模型，即通常说的Bi-LSTM模型。参照图2所示，为图1中的命名实体识别程序运行时执行ELMO模型训练的示意图。在所述ELMO模型训练中，对于所述样本数据中某一个词语P，一个L层的双向LSTM模型能够有2L+1个词向量表示:

其中，

R _k表示第L层双向LSTM模型的词向量；

X ^LM表示待识别文本的初始词向量；

表示第L层前后词向量；

由此，一个词语在双向LSTM模型中有多层词向量的表示，将双向LSTM模型的多层组合表示为ELMO模型。

在本实施例中，ELMO模型作为一种新的词向量的表达方式，能够充分考虑待识别文本在上下语义表达及语境变化的不同表达，从而提高命名实体识别的准确率。

例如：针对某一词多义的词汇w＝“苹果”

文本序列1＝“我买了六斤苹果。”

文本序列2＝“我买了一个苹果7。”

上面两个文本序列中都出现了“苹果”这个词汇，但是在不同的句子中，它们的含义显示是不同的，第一个属于水果领域，第二个属于电子产品领域。

通过使用ELMO模型，能够准确的辨别词语在语境中的表达意思，提高命名实体的准确性。

加权步骤：将所述第一词向量和所述第二词向量进行加权求和，得到加权求和结果。

通过加权求和的方式，能够更好的利用词向量的动态权重信息，更准确的体现出对待识别文本所要命名实体识别的效果。

在一种实现方式中，可直接将第二词向量放在第一词向量后面，用以共同表征一个词的词义；或者

将第一词向量按照其对应的权重进行处理，得到处理后的第一词向量，将第二词向量按照其对应的权重进行处理，得到处理后的第二词向量，最后，将处理后的第一词向量与处理后的第二词向量进行求和，得到加权求和结果。

进一步地，所述加权步骤包括：

将所述第一词向量和所述第二词向量输入预先训练的Attention模型进行加权求和，得到加权求和结果。

所述Attention模型是深度学习模拟人脑的注意力模型。在一种实施方式中，采用Attention模型可动态地训练词向量的权重，对词向量进行数据加权变换。

例如，当观赏一幅画时，虽然看到整幅画的全貌，但是深入仔细地观察时，其实眼睛聚焦的就只有很小的一块，这个时候大脑主要关注在这一小块图案上，也就是说这个时候人脑对整幅图的关注并不是均衡的，是有一定的权重区分的。

序列生成步骤：将所述加权求和结果输入双向LSTM模型处理，得到文本特征序列。

由于，日常生活中所说的语句存在前后关联关系，排列在后面的词语可能影响前面词语的意思表达，所以，为更好的处理词向量，双向LSTM模型在处理词句时分别从前后两个不同的方向进行传播，避免了在处理序列数据时只收到前时刻数据的影响，确保待识别文本命名实体识别的准确性。

本申请实施例利用双向LSTM模型构建与上下文相关的动态词向量表示。

在传统的机器学习任务中，CRF是根据海量的特征工程提取足够的不同维度的特征，然后根据这些特征做序列标注。实际应用中，CRF模型是一种端到端的深度学习模型，它是在给定需要标记的观察序列(词、句子数值等)的条件下，计算整个标记序列的联合概率分布。

在一种实现方式中，根据双向LSTM得到的文本特征序列M(如M1、M2…Mn)，可以采用局部最优解，算出文本特征序列可能的序列K(如K1、K2…Kn)的概率分布，也就是最终的文本标签，即命名实体识别结果。

参照图3所示，为本申请命名实体识别方法应用的各模型协同运作的示意图。基于上述过程，本方案采用了多个模型组合的方式：利用word2vec训练出第一词向量，利用ELMO模型训练出结合上下文语义语境的第二词向量，并对第一词向量和第二词向量通过Attention机制进行加权求和，然后输入到双向LSTM模型中处理，利用双向LSTM模型对词向量进行双向传播，得到的特征文本序列输入CRF模型，通过CRF模型对特征文本序列进行概率分布优化，得到输出每个词的标签，即得到命名实体识别结果。

进一步地，所述序列生成步骤中的双向LSTM模型及命名识别步骤中的CRF模型的训练过程包括：

获取数据集，将数据集划分为训练集、验证集和测试集，其中，所述数据集包括文本资源、已标注命名实体及词向量；

根据所述训练集对初始双向LSTM模型及初始CRF模型进行训练，得到训练后的双向LSTM模型及CRF模型；

根据所述验证集对训练后的双向LSTM模型及CRF模型进行验证；

当验证通过后，采用测试集对验证通过的双向LSTM模型及CRF模型进行测试，测试通过得到目标双向LSTM模型及目标CRF模型。

进一步地，所述文本资源包括：

获取初始文本资源，对初始文本资源进行预处理，得到语句序列；

对语句序列进行分词处理，得到至少一个词序列；

按照词频对词序列中的词进行排序，确定每个词对应的标签信息，得到多个词与标签信息的组合，将词与标签信息的组合作为最终的文本资源。

例如，对于初始文本“我很高兴，明天我要去北京出差，顺便参观北京人民大会堂，北京故宫博物馆。”，进行分词处理得到“我”、“明天”、“北京”、“出差”，对每一个分词进行序列标注，如：“B1”、“B2”、“B3”、“B4”，按照词出现的频率对分词进行标记，如“1”、“2”、“3”、“4”，得到词与标签信息的组合，即得到最终的文本资源。如下表格所示：

进一步地，所述对初始文本资源进行预处理包括：

对获取到的所述初始文本资源进行文本识别，当识别得到的词及/或字符的使用频率低于预设值时，将低于预设值的词及/或字符进行过滤，得到语句序列。

本实施例中，对初始文本资源进行预处理，可以进一步减少干扰，提高识别的准确性。

在一个实施方式中，对初始文本资源进行预处理，所述预处理以对初始文本资源进行文本识别得到的词及/或字符的使用频率低于预设值时，将低于预设值的词及/或字符进行过滤，得到语句序列，其中，词过滤可以是过滤一些停用词、词频小于一定值的词等等，字符可以是停用字符、无意义字符等。

需要说明的是，本实施例中，对初始文本资源进行词过滤及特殊字符过滤包括但不限于过滤初始文本资源中的词及/或字符，还可以是特殊字符等。

参照图4所示，为本申请命名实体识别程序实施例的程序模块图。

在一个实施例中，命名实体识别程序10包括：接收模块101、处理模块102、序列模块103、命名模块104。所述模块101-104所实现的功能或操作步骤均与上文类似，此处不再详述，示例性地，例如其中：

接收模块101，用于接收待识别文本。

处理模块102，用于将所述待识别文本输入word2vec模型得到所述待识别文本的第一词向量；

对所述待识别文本进行分词处理，得到待识别文本中每一句/段对应的第一分词集合，将所述第一分词集合输入预先训练的ELMO模型，以ELMO模型输出的词向量作为所述待识别文本的第二词向量；及

将所述第一词向量和所述第二词向量进行加权求和，得到加权求和结果。

序列模块103，用于将所述加权求和结果输入双向LSTM模型处理，得到文本特征序列。

命名模块104，用于将所述文本特征序列输入条件随机场CRF模型处理，得到所述待识别文本的命名实体识别结果。

参照图5所示，为本申请命名实体识别方法较佳施例的流程图。本实施例为一种命名实体识别方法，该方法包括：

接收步骤：接收待识别文本。

进一步地，所述ELMO模型的训练过程包括如下步骤：

其中，

R _k表示第L层双向LSTM模型的词向量；

X ^LM表示待识别文本的初始词向量；

表示第L层前后词向量；

例如：针对某一词多义的词汇w＝“苹果”

文本序列1＝“我买了六斤苹果。”

文本序列2＝“我买了一个苹果7。”

进一步地，所述加权步骤包括：

根据所述验证集对训练后的双向LSTM模型及CRF模型进行验证；

进一步地，所述文本资源包括：

对语句序列进行分词处理，得到至少一个词序列；

进一步地，所述对初始文本资源进行预处理包括：

进一步地，所述命名识别步骤包括：

对所述文本特征序列中的每一个词语进行特征标注；

利用CRF模型从预先训练的语料标签库识别与所述词语的特征标注相对应的词标签，将识别到的词标签的信息作为所述命名实体识别结果。

可选地，得到命名实体识别结果后，可以单独显示识别结果，也可以在所述待识别文本的基础上显示识别结果。

例如，对于待识别文本“小明，你不是喜欢爬山吗？这周六天气不错，咱们一起去爬泰山吧，约上其他几个好朋友一起出发。”，应用本方案进行命名实体识别后，识别出的命名实体“小明”、“周六”、“泰山”被标注显示出来。

此外，本申请实施例还提出一种计算机可读存储介质，该计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器等等中的任意一种或者几种的任意组合。所述计算机可读存储介质中包括命名实体识别程序10，所述命名实体识别程序10被处理器执行时实现如下操作：

接收步骤：接收待识别文本；

本申请之计算机可读存储介质的具体实施方式与上述命名实体识别方法的具体实施方式大致相同，在此不再赘述。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

需要说明的是，上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，电子装置，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种命名实体识别方法，应用于电子装置，该方法包括：

接收步骤：接收待识别文本；

第一处理步骤：将所述待识别文本输入word2vec模型得到所述待识别文本的第一词向量；

第二处理步骤：对所述待识别文本进行分词处理，得到待识别文本中每一句/段对应的第一分词集合，将所述第一分词集合输入预先训练的ELMO模型，以ELMO模型输出的词向量作为所述待识别文本的第二词向量；

加权步骤：将所述第一词向量和所述第二词向量进行加权求和，得到加权求和结果；

序列生成步骤：将所述加权求和结果输入双向LSTM模型处理，得到文本特征序列；

命名识别步骤：将所述文本特征序列输入条件随机场CRF模型处理，得到所述待识别文本的命名实体识别结果。
如权利要求1所述的命名实体识别方法，其特征在于，所述ELMO模型的训练过程包括：

A1，从预设语料库中获取预设数量的指定文本，对所述指定文本进行分句及分词处理，得到所述指定文本中每一句对应的第二分词集合；

A2，确定所述第二分词集合中各分词对应的词向量，将所述第二分词集合中各分词及所述分词对应的词向量作为样本数据；

A3，利用所述样本数据对双向LSTM模型进行训练，得到所述ELMO模型。
如权利要求1所述的命名实体识别方法，其特征在于，所述加权步骤包括：

将所述第一词向量和所述第二词向量输入预先训练的Attention模型进行加权求和，得到加权求和结果。
如权利要求1所述的命名实体识别方法，其特征在于，所述序列生成步骤中的双向LSTM模型及命名识别步骤中的CRF模型的训练过程包括：

获取数据集，将数据集划分为训练集、验证集和测试集，其中，所述数据集包括文本资源、已标注命名实体及词向量；

根据所述训练集对初始双向LSTM模型及初始CRF模型进行训练，得到训练后的双向LSTM模型及CRF模型；

根据所述验证集对训练后的双向LSTM模型及CRF模型进行验证；

当验证通过后，采用测试集对验证通过的双向LSTM模型及CRF模型进行测试，测试通过得到目标双向LSTM模型及目标CRF模型。
如权利要求4所述的命名实体识别方法，其特征在于，所述文本资源包括：

获取初始文本资源，对初始文本资源进行预处理，得到语句序列；

对语句序列进行分词处理，得到至少一个词序列；

按照词频对词序列中的词进行排序，确定每个词对应的标签信息，得到多个词与标签信息的组合，将词与标签信息的组合作为最终的文本资源。
如权利要求5所述的命名实体识别方法，其特征在于，所述对初始文本资源进行预处理包括：

对获取到的所述初始文本资源进行文本识别，当识别得到的词及/或字符的使用频率低于预设值时，将低于预设值的词及/或字符进行过滤，得到语句序列。
如权利要求1-6任意一项所述的命名实体识别方法，其特征在于，所述命名识别步骤包括：

对所述文本特征序列中的每一个词语进行特征标注；

利用CRF模型从预先训练的语料标签库识别与所述词语的特征标注相对应的词标签，将识别到的词标签的信息作为所述命名实体识别结果。
一种电子装置，该电子装置通信连接客户端及存储节点，其特征在于，所述电子装置包括：存储器及处理器，所述存储器上存储命名实体识别程序，所述命名实体识别程序被所述处理器执行，可实现如下步骤：

接收步骤：接收待识别文本；

第一处理步骤：将所述待识别文本输入word2vec模型得到所述待识别文本的第一词向量；

第二处理步骤：对所述待识别文本进行分词处理，得到待识别文本中每一句/段对应的第一分词集合，将所述第一分词集合输入预先训练的ELMO模型，以ELMO模型输出的词向量作为所述待识别文本的第二词向量；

加权步骤：将所述第一词向量和所述第二词向量进行加权求和，得到加权求和结果；

序列生成步骤：将所述加权求和结果输入双向LSTM模型处理，得到文本特征序列；

命名识别步骤：将所述文本特征序列输入条件随机场CRF模型处理，得到所述待识别文本的命名实体识别结果。
如权利要求8所述的电子装置，其特征在于，所述ELMO模型的训练过程包括：

A1，从预设语料库中获取预设数量的指定文本，对所述指定文本进行分句及分词处理，得到所述指定文本中每一句对应的第二分词集合；

A2，确定所述第二分词集合中各分词对应的词向量，将所述第二分词集合中各分词及所述分词对应的词向量作为样本数据；

A3，利用所述样本数据对双向LSTM模型进行训练，得到所述ELMO模型。
如权利要求8所述的电子装置，其特征在于，所述加权步骤包括：

将所述第一词向量和所述第二词向量输入预先训练的Attention模型进行加权求和，得到加权求和结果。
如权利要求8所述的电子装置，其特征在于，所述序列生成步骤中的双向LSTM模型及命名识别步骤中的CRF模型的训练过程包括：

获取数据集，将数据集划分为训练集、验证集和测试集，其中，所述数据集包括文本资源、已标注命名实体及词向量；

根据所述训练集对初始双向LSTM模型及初始CRF模型进行训练，得到训练后的双向LSTM模型及CRF模型；

根据所述验证集对训练后的双向LSTM模型及CRF模型进行验证；

当验证通过后，采用测试集对验证通过的双向LSTM模型及CRF模型进行测试，测试通过得到目标双向LSTM模型及目标CRF模型。
如权利要求11所述的电子装置，其特征在于，所述文本资源包括：

获取初始文本资源，对初始文本资源进行预处理，得到语句序列；

对语句序列进行分词处理，得到至少一个词序列；

按照词频对词序列中的词进行排序，确定每个词对应的标签信息，得到多个词与标签信息的组合，将词与标签信息的组合作为最终的文本资源。
如权利要求12所述的电子装置，其特征在于，所述对初始文本资源进行预处理包括：

对获取到的所述初始文本资源进行文本识别，当识别得到的词及/或字符的使用频率低于预设值时，将低于预设值的词及/或字符进行过滤，得到语句序列。
如权利要求8-13任意一项所述的电子装置，其特征在于，所述命名识别步骤包括：

对所述文本特征序列中的每一个词语进行特征标注；

利用CRF模型从预先训练的语料标签库识别与所述词语的特征标注相对应的词标签，将识别到的词标签的信息作为所述命名实体识别结果。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中包括命名实体识别程序，所述命名实体识别程序被处理器执行时，可实现如下步骤：

接收步骤：接收待识别文本；

第一处理步骤：将所述待识别文本输入word2vec模型得到所述待识别文本的第一词向量；

第二处理步骤：对所述待识别文本进行分词处理，得到待识别文本中每一句/段对应的第一分词集合，将所述第一分词集合输入预先训练的ELMO模型，以ELMO模型输出的词向量作为所述待识别文本的第二词向量；

加权步骤：将所述第一词向量和所述第二词向量进行加权求和，得到加权求和结果；

序列生成步骤：将所述加权求和结果输入双向LSTM模型处理，得到文本特征序列；

命名识别步骤：将所述文本特征序列输入条件随机场CRF模型处理，得到所述待识别文本的命名实体识别结果。
如权利要求15所述的计算机可读存储介质，其特征在于，所述ELMO模型的训练过程包括：

A1，从预设语料库中获取预设数量的指定文本，对所述指定文本进行分句及分词处理，得到所述指定文本中每一句对应的第二分词集合；

A2，确定所述第二分词集合中各分词对应的词向量，将所述第二分词集合中各分词及所述分词对应的词向量作为样本数据；

A3，利用所述样本数据对双向LSTM模型进行训练，得到所述ELMO模型。
如权利要求15所述的计算机可读存储介质，其特征在于，所述加权步骤包括：

将所述第一词向量和所述第二词向量输入预先训练的Attention模型进行加权求和，得到加权求和结果。
如权利要求15所述的计算机可读存储介质，其特征在于，所述序列生成步骤中的双向LSTM模型及命名识别步骤中的CRF模型的训练过程包括：

获取数据集，将数据集划分为训练集、验证集和测试集，其中，所述数据集包括文本资源、已标注命名实体及词向量；

根据所述训练集对初始双向LSTM模型及初始CRF模型进行训练，得到训练后的双向LSTM模型及CRF模型；

根据所述验证集对训练后的双向LSTM模型及CRF模型进行验证；

当验证通过后，采用测试集对验证通过的双向LSTM模型及CRF模型进行测试，测试通过得到目标双向LSTM模型及目标CRF模型。
如权利要求18所述的计算机可读存储介质，其特征在于，所述文本资源包括：

获取初始文本资源，对初始文本资源进行预处理，得到语句序列；

对语句序列进行分词处理，得到至少一个词序列；

按照词频对词序列中的词进行排序，确定每个词对应的标签信息，得到多个词与标签信息的组合，将词与标签信息的组合作为最终的文本资源。
如权利要求15-19任意一项所述的计算机可读存储介质，其特征在于，所述命名识别步骤包括：

对所述文本特征序列中的每一个词语进行特征标注；

利用CRF模型从预先训练的语料标签库识别与所述词语的特征标注相对应的词标签，将识别到的词标签的信息作为所述命名实体识别结果。