CN112101023A

CN112101023A - 文本处理方法、装置以及电子设备

Info

Publication number: CN112101023A
Application number: CN202011182226.XA
Authority: CN
Inventors: 郭子亮
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd; Shenzhen Huantai Technology Co Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd; Shenzhen Huantai Technology Co Ltd
Priority date: 2020-10-29
Filing date: 2020-10-29
Publication date: 2020-12-18
Anticipated expiration: 2040-10-29
Also published as: CN112101023B

Abstract

本申请实施例公开了一种文本处理方法、装置以及电子设备。属于计算机技术领域。该方法包括：获取扩展文本，扩展文本包括初始文本以及拼接在初始文本的指定位置的指定字符；获取对扩展文本中的目标字符进行类型标注的标注结果，其中，指定字符对应的标注内容为初始文本的标签类型，初始文本对应的标注内容为初始文本中每个字符各自的实体类型；将扩展文本以及标注结果输入到第一网络模型中对第一网络模型的网络参数进行更新，得到第二网络模型；基于第二网络模型对待识别文本中的实体内容进行识别。从而使得第二网络模型能够更加准确的对待识别文本中的实体内容进行识别，提升了实体内容进行识别的准确性。

Description

文本处理方法、装置以及电子设备

技术领域

本申请涉及计算机技术领域，更具体地，涉及一种文本处理方法、装置以及电子设备。

背景技术

命名实体识别(Named Entity Recognition，NER)是自然语言处理中比较基础也比较通用的技术方向，在文本分析、数据挖掘、关键词提取、机器翻译、语义理解等领域都需要实体识别技术的支撑。但是，相关的命名实体识别方式还存在识别准确性有待提升的问题。

发明内容

鉴于上述问题，本申请提出了一种文本处理方法、装置以及电子设备，以改善上述问题。

第一方面，本申请提供了一种文本处理方法，应用于电子设备，所述方法包括：获取扩展文本，所述扩展文本包括初始文本以及拼接在所述初始文本的指定位置的指定字符；获取对所述扩展文本中的目标字符进行类型标注的标注结果，所述目标字符包括所述指定字符以及至少部分所述初始文本，其中，所述指定字符对应的标注内容为所述初始文本的标签类型，至少部分所述初始文本对应的标注内容为至少部分所述初始文本中每个字符各自的实体类型；将所述扩展文本以及所述标注结果输入到第一网络模型中对所述第一网络模型的网络参数进行更新，得到第二网络模型，其中，所述第一网络模型包括双向长期短期记忆层以及条件随机场层；基于所述第二网络模型对待识别文本中的实体内容进行识别。

第二方面，本申请提供了一种文本处理方法，应用于电子设备，所述方法包括：获取待识别文本；将所述待识别文本输入到基于前述的方法得到的第二网络模型中，得到所述第二网络模型输出的实体识别结果；执行与所述实体识别结果对应的操作。

第三方面，本申请提供了一种文本处理装置，运行于电子设备，所述装置包括：扩展文本获取单元，用于获取扩展文本，所述扩展文本包括初始文本以及拼接在所述初始文本的指定位置的指定字符；标注结果获取单元，用于获取对所述扩展文本中的目标字符进行类型标注的标注结果，所述目标字符包括所述指定字符以及至少部分所述初始文本，其中，所述指定字符对应的标注内容为所述初始文本的标签类型，至少部分所述初始文本对应的标注内容为至少部分所述初始文本中每个字符各自的实体类型；参数更新单元，用于将所述扩展文本以及所述标注结果输入到第一网络模型中对所述第一网络模型的网络参数进行更新，得到第二网络模型，其中，所述第一网络模型包括双向长期短期记忆层以及条件随机场层；文本处理单元，用于基于所述第二网络模型对待识别文本中的实体内容进行识别。

第四方面，本申请提供了一种文本处理装置，运行于电子设备，所述装置包括：待识别文本获取单元，用于获取待识别文本；实体识别单元，用于将所述待识别文本输入到基于上述方法得到的第二网络模型中，得到所述第二网络模型输出的实体识别结果。

第五方面，本申请提供了一种电子设备，所述电子设备至少包括处理器、以及存储器；一个或多个程序被存储在所述存储器中并被配置为由所述处理器执行以实现上述方法。

第六方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有程序代码，其中，在所述程序代码被处理器运行时执行上述方法。

本申请提供的一种文本处理方法、装置以及电子设备，获取包括初始文本以及拼接在所述初始文本的指定位置的指定字符的扩展文本后，再获取对所述扩展文本中的目标字符进行类型标注的标注结果。并且，其中，所述指定字符对应的标注内容为所述初始文本的标签类型，至少部分所述初始文本对应的标注内容为至少部分所述初始文本中每个字符各自的实体类型。然后，在第一网络模型包括双向长期短期记忆层以及条件随机场层的情况下，再将所述扩展文本以及所述标注结果输入到第一网络模型中对所述第一网络模型的网络参数进行更新，进而得到用于对待识别文本中的实体内容进行识别的第二网络模型。

从而通过上述方式，获取用于对第一网络模型进行参数更新的文本时，在初始文本的指定位置拼接有指定字符的方式，使得在对第一网络模型中的双向长期短期记忆层的参数进行更新时提供了更多的信息，并且因为该拼接有该指定字符对应标注有初始文本的标签类型，从而使得条件随机场层中可以包括有更多的约束条件，进而使得进行参数更新得到的第二网络模型能够更加准确的对待识别文本中的实体内容进行识别，提升了实体内容进行识别的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本申请一实施例提出的一种文本处理方法的流程图；

图2示出了本申请实施例转移矩阵中的结构维度的示意图；

图3示出了本申请另一实施例提出的一种文本处理方法的流程图；

图4示出了本申请实施例中一种转移矩阵的示意图；

图5示出对图4所示的转移矩阵进行结构维度更新后的一种转移矩阵的示意图；

图6示出对图5所示的结构维度更新后的转移矩阵中新增元素的示意图；

图7示出了本申请再一实施例提出的一种文本处理方法的流程图；

图8示出了本申请再一实施例提出的一种文本处理方法的流程图；

图9示出了本申请实施例提出的一种文本处理装置的结构框图；

图10示出了本申请另一实施例提出的一种文本处理装置的结构框图；

图11示出了本申请再一实施例提出的一种文本处理装置的结构框图；

图12示出了本申请的用于执行根据本申请实施例的文本处理方法的另一种电子设备的结构框图；

图13是本申请实施例的用于保存或者携带实现根据本申请实施例的文本处理方法的程序代码的存储单元。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能可以理解为是计算机科学的一个综合技术。

其中，随着人工智能技术中的文本处理技术的发展，出现了许多的涉及基于文本处理技术以及自然语言处理技术进行文本识别的场景。例如，命名实体识别(下文也简称实体识别)场景，命名实体识别是自然语言处理中比较基础也比较通用的技术方向，在文本分析、数据挖掘、关键词提取、机器翻译、语义理解等领域都需要实体识别技术的支撑。

但是，发明人在对相关的命名实体识别进行研究后发现，相关的命名实体识别方式还存在识别准确性有待提升的问题。具体的，发明人发现相关的命名实体识别方式中会出现本身是合法但是确不正确的识别结果。例如，对于“播放刘德华的歌”这个文本中，实际要表达的含义是播放歌手刘德华的歌，即其中的刘德华的实体类型为歌手，但是在进行实体识别的过程中可能会将“播放刘德华的歌”中的刘德华识别为联系人，即将刘德华的实体类型识别为联系人，进而触发的可能就是电话拨打行为。但是，刘德华这个文本单独对应的实体类型为联系人本身是合法的，但是却不符合“播放刘德华的歌”这个文本的语义，进而造成对“刘德华”的实体类型识别错误。

因此，发明人在研究中发现上述问题后，提出了本申请中可以改善上述问题的文本处理方法、装置以及电子设备。在本申请的方法中，可以获取包括初始文本以及拼接在所述初始文本的指定位置的指定字符的扩展文本后，再获取对所述扩展文本中的目标字符进行类型标注的标注结果，该目标字符包括指定字符以及至少部分初始文本。并且，其中，所述指定字符对应的标注内容为所述初始文本的标签类型，至少部分所述初始文本对应的标注内容为至少部分所述初始文本中每个字符各自的实体类型。然后，在第一网络模型包括双向长期短期记忆层以及条件随机场层的情况下，再将所述扩展文本以及所述标注结果输入到第一网络模型中对所述第一网络模型的网络参数进行更新，进而得到用于对待识别文本中的实体内容进行识别的第二网络模型。

在对本申请实施例进行进一步详细说明之前，对本申请实施例中涉及一种应用环境进行介绍。

可选的，本申请实施例所提供的文本处理方法可以由服务器执行。其中，服务器可以是单个的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云计算、云存储、、CDN(Content DeliveryNetwork，内容分发网络)、以及人工智能平台等基础云计算服务的云服务器。其中，在本申请实施例提供的文本处理方法由多个物理服务器构成的服务器集群或者分布式系统执行的情况下，文本处理方法中的不同步骤可以分别由不同的物理服务器执行，或者可以由基于分布式系统构建的服务器基于分布式的方式执行。

下面将结合附图具体描述本申请的各实施例。

请参阅图1，本申请实施例提供的一种文本处理方法，所述方法包括：

S110：获取扩展文本，所述扩展文本包括初始文本以及拼接在所述初始文本的指定位置的指定字符。

其中，需要说明的是，在本申请实施例中扩展文本为用于对第一网络模型进行更新的文本。并且，在本实施例中，扩展文本可以是由初始文本和指定字符组成。可选的，所述指定位置为所述初始文本的第一字符之前，或者为所述初始文本的最后一个字符之后。示例性的，若初始文本为“播放刘德华的歌”，在指定字符为“label”的情况下，所获取得到的扩展文本可以为“label播放刘德华的歌”，也可以为“播放刘德华的歌label”。再例如，示例性的，若初始文本为“给刘德华打电话”，指定字符为“tag”，那么所获取得到的扩展文本可以为“tag给刘德华打电话”，或者获取到的扩展文本可以为“给刘德华打电话tag”。

作为一种方式，可以先获取到初始文本，然后在初始文本的指定位置拼接指定字符以得到扩展文本。作为另外一种方式，在初始文本的指定位置拼接指定字符得到扩展文本的操作可以由执行本实施的文本处理方法的设备以外的其他设备来执行，进而该其他设备可以在执行S110之前预先生成扩展文本，并将生成的扩展文本存储到指定存储区域，进而在执行S110时，执行本实施的文本处理方法的设备可以直接从该指定存储区域中读取得到扩展文本。

S120：获取对所述扩展文本中的目标字符进行类型标注的标注结果，其中，所述指定字符对应的标注内容为所述初始文本的标签类型，所述目标字符包括所述指定字符以及至少部分所述初始文本，至少部分所述初始文本对应的标注内容为至少部分所述初始文本中每个字符各自的实体类型。

在本申请实施例中对于扩展文本中的初始文本以及指定字符可以分别进行标注以便实现不同的标注效果。其中，所述目标字符包括所述指定字符以及至少部分所述初始文本，至少部分所述初始文本对应的标注内容为至少部分所述初始文本中每个字符各自的实体类型。可选的，那目标字符中可以包括有全部的初始文本，在目标字符包括全部的初始文本的情况下，目标字符进行类型标注的标注结果中可以包括初始文本中每个字符各自的实体类型。而对于指定字符而言，指定字符对应的标注内容为所述初始文本的标签类型。

可选的，可以基于BIO标注的方式来对初始文本中每个字符进行标注。其中，在基于BIO标注的方式中，以“B-NP”标注名词短语的开头，以“I-NP”标注名词短语的中间，以“O”标注不是名词的短语。例如，对于前述的初始文本“播放刘德华的歌”，在基于BIO标注的方式的情况下，初始文本对应的标注结果为“播(O)放(O)刘(B-歌手)德(I-歌手)华(I-歌手)的(O)歌(O)”，在该标注结果中，初始文本对应的标注内容为初始文本中每个字符各自的实体类型。例如，对于“刘”字的标注内容为“(B-歌手)”，而对于播和放因为不是实体类型，则对应的标注内容均为“(O)”。再者，在扩展文本中对于指定字符依然可以进行标注，并且对应的标注内容为初始文本的标签类型。其中，该标签类型可以为表征初始文本本身所应用的场景类别。例如，对于初始文本“播放刘德华的歌”所应用的场景类别为音乐场景，那么在标注结果中，对于扩展文本“label播放刘德华的歌”中的“label”对应的标注内容为音乐。

需要说明的是，初始文本的标签类型除了上述的音乐外，还可能会有其他的类型。例如，还可以会包括有电影、系统设置、闹钟、电话、外卖等类型。

S130：将所述扩展文本以及所述标注结果输入到第一网络模型中对所述第一网络模型的网络参数进行更新，得到第二网络模型，其中，所述第一网络模型包括双向长期短期记忆层以及条件随机场层。

如前述所示，第一网络模型为用于进行网络参数更新的网络模型。进而在得到扩展文本后，可以将扩展文本输入到第一网络模型中以对第一网络模型的网络参数进行更新。其中，在本申请实施例中第一网络模型可以为预先随机生成的网络模型，而对于随机生成的第一网络模型中的网络参数也对应为随机生成的。

其中，第一网络模型中包括有双向长期短期记忆层(Bi-LSTM)以及条件随机场层(CRF)。在本实施例中网络参数包括对应于双向长期短期记忆层的参数以及对应于条件随机场层的参数。

可选的，该对应于双向长期短期记忆层的参数包括权重参数以及结构参数。其中，结构参数表征的是神经网络(例如，该双向长期短期记忆层)中节点之间的操作的类型。其中，节点表征神经网络中产生有特征图的节点。其中，操作的类型可以为1x1卷积，3x3卷积、5x5卷积等不同操作。该权重参数表征神经网络中的操作的自带的可学习的参数。其中，操作可以为1x1卷积、3x3卷积、3x3可分离卷积等卷积操作，那么权重参数就可以理解为1x1卷积、3x3卷积、3x3可分离卷积等操作各自的可学习参数。

可选的，对于条件随机场层中包括有转移矩阵。那么对应于条件随机场层的网络参数可以为转移矩阵中的结构维度以及转移概率。其中，结构维度表征的是转移矩阵分别在横向以纵向中所包括的维度，而转移概率表征的是转移矩阵中某个元素所对应的横轴中的维度和对应的纵轴中的维度之间的转换概率。

示例性的，如图2所示，其中箭头10所示的方向为转移矩阵的横向，箭头11所示的方向为纵向。其中，图2所示的转移矩阵中在横向的结构维度和纵向的结构维度相同。例如，横向的结构维度和纵向的结构维度均包括“START”、“音乐”、“B-歌手”、“I-歌手”、“O”以及“END”这几个维度。可选的，在转移矩阵中结构维度为对扩展文本对应的标注内容生成。示例性的，其中的元素A对应的结构维度包括处于横向的B-歌手以及处于纵向的I-歌手，那么元素A的值则表征B-歌手和I-歌手之间的转移概率。再例如，元素B对应的结构维度包括处于横向的音乐以及处于纵向的B-歌手，那么元素B的值则表征音乐和B-歌手之间的转移概率。

S140：基于所述第二网络模型对待识别文本中的实体内容进行识别。

本申请提供的一种文本处理方法，获取包括初始文本以及拼接在所述初始文本的指定位置的指定字符的扩展文本后，再获取对所述扩展文本中的目标字符进行类型标注的标注结果。并且，其中，所述指定字符对应的标注内容为所述初始文本的标签类型，至少部分所述初始文本对应的标注内容为至少部分所述初始文本中每个字符各自的实体类型。然后，在第一网络模型包括双向长期短期记忆层以及条件随机场层的情况下，再将所述扩展文本以及所述标注结果输入到第一网络模型中对所述第一网络模型的网络参数进行更新，进而得到用于对待识别文本中的实体内容进行识别的第二网络模型。

请参阅图3，本申请实施例提供的一种文本处理方法，所述方法包括：

S210：获取扩展文本，所述扩展文本包括初始文本以及拼接在所述初始文本的指定位置的指定字符。

S220：获取对所述扩展文本中的目标字符进行类型标注的标注结果，所述目标字符包括所述指定字符以及至少部分所述初始文本，其中，所述指定字符对应的标注内容为所述初始文本的标签类型，至少部分所述初始文本对应的标注内容为至少部分所述初始文本中每个字符各自的实体类型。

S230：将所述扩展文本输入到第一网络模型中的所述双向长期短期记忆层中，并将所述双向长期短期记忆层的输出数据输入到非线性层，得到所述非线性层输出的发射概率。

可选的，可以先将扩展文本中的每个字符转换为对应的向量，然后将转换得到的向量输入到双向长期短期记忆层中。其中，在先将扩展文本中的每个字符转换为对应的向量的过程中，所转换得到的向量可以是随机初始化的向量，也可以是预训练语言模型预先训练好的向量。

S240：基于所述标注结果更新第一网络模型中的所述条件随机场层中转移矩阵的结构维度。

如图4所示，为执行S240之前的转移矩阵的示意图。如图4所示，在执行S240之前转移矩阵的结构维度包括“START”、“电话”、“B-联系人”、“I-联系人”、“O”以及“END”。若扩展文本的内容为“label播放刘德华的歌”，在执行S240的过程中标注结果为“label播放刘德华的歌”对应的标注结果，进而在基于“label播放刘德华的歌”对应的标注结果对条件随机场层中转移矩阵的结构维度进行更新后，会在图4所示的转移矩阵中增加“label播放刘德华的歌”对应的标注结果中标注内容，进而转移矩阵的结构维度由图4中所示的样式转换为图5中所示的样式。

S250：基于条件随机方式得到结构维度更新后的所述转移矩阵中的新增加元素的值，以得到更新后的转移矩阵，所述新增加元素的值表征所述新增加元素对应的结构维度之间的转移概率。

需要说明的是，如图5所示在对结构维度进行更新后，在原本的结构维度中会增加新的内容。例如，图4中的“音乐”、“B-歌手”、“I-歌手”均为相对于图3中的结构维度增加的新的内容。而在结构维度中的内容有新增的情况下，新增加的内容会在转移矩阵中有新的元素生成，而对于新增加元素会在初始基于条件随机方式生成对应的值。例如，在图6中，结构维度中的音乐为相对于图4中新增加的内容，那么音乐对应的元素D则转移矩阵中的新增加元素，而元素C为图4中原本就有的元素，进而元素D对应的值则表征横向中的音乐与纵向中的B-联系人之间的转移概率。

需要说明的是，在更新得到的转移矩阵中包括的标签类型有N种的情况下，实体类型有M种的情况下，更新得到的转移矩阵的尺寸可以为(M*2+3+N)*(M*2+3+N)。

S260：基于所述非线性层输出的发射概率以及所述更新后的转移矩阵，对所述双向长期短期记忆层的网络参数以及所述更新后的转移矩阵中的转移概率进行更新，得到第二网络模型。

作为一种方式，所述基于所述非线性层输出的发射概率以及所述更新后的转移矩阵，对所述双向长期短期记忆层的网络参数以及所述更新后的转移矩阵中的转移概率进行更新，得到第二网络模型，包括：基于所述非线性层输出的发射概率以及所述更新后的转移矩阵，得到所述初始文本中每个字符对应的实体识别结果；将所述实体识别结果与所述标注结果进行比对，根据比对结果对所述双向长期短期记忆层的网络参数以及所述更新后的转移矩阵中的转移概率进行更新，得到第二网络模型。

S270：基于所述第二网络模型对待识别文本中的实体内容进行识别。

需要说明的是，在本申请的实施例中，对于初始文本“播放刘德华的歌”因为在标注阶段引入了指定字符(例如前述的label)来标注“播放刘德华的歌”的标签类型为音乐，进而第二网络模型中的条件随机场层会对“播放刘德华的歌”中的刘德华被识别为歌手以外的其他实体类型进行纠正，进而提升了对于待识别文本中的实体进行准确识别的概率。

本申请提供的一种文本处理方法，通过获取用于对第一网络模型进行参数更新的文本时，在初始文本的指定位置拼接有指定字符的方式，使得在对第一网络模型中的双向长期短期记忆层的参数进行更新时提供了更多的信息，并且因为该拼接有该指定字符对应标注有初始文本的标签类型，从而使得条件随机场层中可以包括有更多的约束条件，进而使得进行参数更新得到的第二网络模型能够更加准确的对待识别文本中的实体内容进行识别，提升了实体内容进行识别的准确性。并且，在本实施例中，还会基于所述标注结果更新第一网络模型中的所述条件随机场层中转移矩阵的结构维度，并在结构进行更新后同时会基于条件随机方式得到结构维度更新后的所述转移矩阵中的新增加元素的值，以得到更新后的转移矩阵，以便使得最终得到的转移矩阵能够包括更为丰富的转移概率，进而将该转移概率作为约束条件，以便使得最终识别得到的实体识别结果更为准确。

请参阅图7，本申请实施例提供的一种文本处理方法，所述方法包括：

S310：获取初始文本。

S320：获取初始文本的指定位置以及指定字符。

S330：将所述指定字符拼接到所述初始文本的指定位置得到扩展文本，并将所述扩展文本存储到指定存储区域。

S340：从所述指定存储区域读取扩展文本，所述扩展文本包括初始文本以及拼接在所述初始文本的指定位置的指定字符。

S350：获取对所述扩展文本中的目标字符进行类型标注的标注结果，所述目标字符包括所述指定字符以及至少部分所述初始文本，其中，所述指定字符对应的标注内容为所述初始文本的标签类型，至少部分所述初始文本对应的标注内容为至少部分所述初始文本中每个字符各自的实体类型。

S360：将所述扩展文本以及所述标注结果输入到第一网络模型中对所述第一网络模型的网络参数进行更新，得到第二网络模型，其中，所述第一网络模型包括双向长期短期记忆层以及条件随机场层。

S370：基于所述第二网络模型对待识别文本中的实体内容进行识别。

本申请提供的一种文本处理方法，会先初始文本然后在初始文本的指定位置拼接指定字符，并将拼接有指定字符的初始文本作为扩展文本，然后将得到的扩展文本存储到指定存储区域。进而通过获取用于对第一网络模型进行参数更新的文本时，使得在对第一网络模型中的双向长期短期记忆层的参数进行更新时提供了更多的信息，并且因为该拼接有该指定字符对应标注有初始文本的标签类型，从而使得条件随机场层中可以包括有更多的约束条件，进而使得进行参数更新得到的第二网络模型能够更加准确的对待识别文本中的实体内容进行识别，提升了实体内容进行识别的准确性。

请参阅图8，本申请实施例提供的一种文本处理方法，所述方法包括：

S410：获取待识别文本。

需要说明的是，本申请实施例中待识别文本为用于进行实体识别的文本。在本申请实施例中，可以有多种的获取得到待识别文本的方式。

作为一种方式，在本申请实施例中可以有文本输入界面，进而用户可以在该文本输入界面中输入文本，那么在获取得到该文本输入界面中输入的文本后，可以将该文本输入界面中输入的文本作为待识别文本。

作为另一种方式，所述获取待识别文本，包括：获取采集到的语音内容；对所述语音内容进行语义识别得到对应的文本，将所述对应的文本作为待识别文本。

S420：将所述待识别文本输入到基于前述实施例提供的文本处理方法得到的第二网络模型中，得到所述第二网络模型输出的实体识别结果。

S430：执行与所述实体识别结果对应的操作。

需要说明的是，在不同的场景中与所述实体识别结果对应的操作可以不同。例如，以“播放刘德华的歌”为待识别文本为例，会识别处其中的刘德华的实体类型为歌手，进而歌手这个实体类型对应的操作可以为执行音频播放的操作。再例如，以“给播放刘德华的打电话”为待识别文本为例，会识别处其中的刘德华的实体类型为联系人，进而联系人这个实体类型对应的操作可以为执行电话拨打操作。

本申请提供的一种文本处理方法，在对待识别文本进行实体识别的过程中，采用了基于前述实施例提供的文本处理方法得到的第二网络模型，进而使得可以更为准确的对待识别文本中的实体进行识别，提升了实体识别的准确性。

请参阅图9，本申请实施例提供的一种文本处理装置500，运行于电子设备，所述装置500包括：

扩展文本获取单元510，用于获取扩展文本，所述扩展文本包括初始文本以及拼接在所述初始文本的指定位置的指定字符。

标注结果获取单元520，用于获取对所述扩展文本中的目标字符进行类型标注的标注结果，所述目标字符包括所述指定字符以及至少部分所述初始文本，其中，所述指定字符对应的标注内容为所述初始文本的标签类型，至少部分所述初始文本对应的标注内容为至少部分所述初始文本中每个字符各自的实体类型。

参数更新单元530，用于将所述扩展文本以及所述标注结果输入到第一网络模型中对所述第一网络模型的网络参数进行更新，得到第二网络模型，其中，所述第一网络模型包括双向长期短期记忆层以及条件随机场层。

文本处理单元540，用于基于所述第二网络模型对待识别文本中的实体内容进行识别。

作为一种方式，参数更新单元530，具体用于将所述扩展文本输入到所述双向长期短期记忆层中，并将所述双向长期短期记忆层的输出数据输入到非线性层，得到所述非线性层输出的发射概率；基于所述标注结果更新所述条件随机场层中转移矩阵的结构维度；基于条件随机方式得到结构维度更新后的所述转移矩阵中的新增加元素的值，以得到更新后的转移矩阵，所述新增加元素的值表征所述新增加元素对应的结构维度之间的转移概率；基于所述非线性层输出的发射概率以及所述更新后的转移矩阵，对所述双向长期短期记忆层的网络参数以及所述更新后的转移矩阵中的转移概率进行更新，得到第二网络模型。

作为一种方式，参数更新单元530，具体用于基于所述非线性层输出的发射概率以及所述更新后的转移矩阵，得到所述初始文本中每个字符对应的实体识别结果；将所述实体识别结果与所述标注结果进行比对，根据比对结果对所述双向长期短期记忆层的网络参数以及所述更新后的转移矩阵中的转移概率进行更新，得到第二网络模型。

如图10所示，所述装置500还包括：

初始文本拼接单元550，用于获取初始文本；获取初始文本的指定位置以及指定字符；将所述指定字符拼接到所述初始文本的指定位置得到扩展文本，并将所述扩展文本存储到指定存储区域。在这种方式中，扩展文本获取单元510，具体用于从所述指定存储区域读取扩展文本。

可选的，所述指定位置为所述初始文本的第一字符之前，或者为所述初始文本的最后一个字符之后。

请参阅图11，本申请实施例提供的一种文本处理装置600，运行于电子设备，所述装置600包括：

待识别文本获取单元610，用于获取待识别文本；

实体识别单元620，用于将所述待识别文本输入到基于前述实施例提供的文本处理方法得到的第二网络模型中，得到所述第二网络模型输出的实体识别结果；

结果执行单元630，用于执行与所述实体识别结果对应的操作。

本申请提供的一种文本处理方法装置，通过获取包括初始文本以及拼接在所述初始文本的指定位置的指定字符的扩展文本后，再获取对所述扩展文本中的目标字符进行类型标注的标注结果。并且，其中，所述指定字符对应的标注内容为所述初始文本的标签类型，至少部分所述初始文本对应的标注内容为至少部分所述初始文本中每个字符各自的实体类型。然后，在第一网络模型包括双向长期短期记忆层以及条件随机场层的情况下，再将所述扩展文本以及所述标注结果输入到第一网络模型中对所述第一网络模型的网络参数进行更新，进而得到用于对待识别文本中的实体内容进行识别的第二网络模型。

需要说明的是，本申请中装置实施例与前述方法实施例是相互对应的，装置实施例中具体的原理可以参见前述方法实施例中的内容，此处不再赘述。

下面将结合图12对本申请提供的一种电子设备进行说明。

请参阅图12，基于上述的图片处理方法、装置，本申请实施例还提供的另一种可以执行前述图片处理方法的服务器100。服务器100包括相互耦合的一个或多个(图中仅示出一个)处理器102、存储器104以及网络模块106。其中，该存储器104中存储有可以执行前述实施例中内容的程序，而处理器102可以执行该存储器104中存储的程序。

其中，处理器102可以包括一个或者多个处理核。处理器102利用各种接口和线路连接整个服务器100内的各个部分，通过运行或执行存储在存储器104内的指令、程序、代码集或指令集，以及调用存储在存储器104内的数据，执行服务器100的各种功能和处理数据。可选地，处理器102可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(ProgrammableLogic Array，PLA)中的至少一种硬件形式来实现。处理器102可集成中央处理器(CentralProcessing Unit，CPU)、图像处理器(Graphics Processing Unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器102中，单独通过一块通信芯片进行实现。

存储器104可以包括随机存储器(Random Access Memory，RAM)，也可以包括只读存储器(Read-Only Memory)。存储器104可用于存储指令、程序、代码、代码集或指令集。存储器104可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储终端100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。

所述网络模块106用于接收以及发送电磁波，实现电磁波与电信号的相互转换，从而与通讯网络或者其他设备进行通讯，例如和音频播放设备进行通讯。所述网络模块106可包括各种现有的用于执行这些功能的电路元件，例如，天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。所述网络模块106可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。例如，网络模块106可以与基站进行信息交互。

请参考图13，其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质800中存储有程序代码，所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。

计算机可读存储介质800可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地，计算机可读存储介质800包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质800具有执行上述方法中的任何方法步骤的程序代码810的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码810可以例如以适当形式进行压缩。

综上所述，本申请提供的一种文本处理方法、装置以及电子设备，获取包括初始文本以及拼接在所述初始文本的指定位置的指定字符的扩展文本后，再获取对所述扩展文本中的目标字符进行类型标注的标注结果。并且，其中，所述指定字符对应的标注内容为所述初始文本的标签类型，至少部分所述初始文本对应的标注内容为至少部分所述初始文本中每个字符各自的实体类型。然后，在第一网络模型包括双向长期短期记忆层以及条件随机场层的情况下，再将所述扩展文本以及所述标注结果输入到第一网络模型中对所述第一网络模型的网络参数进行更新，进而得到用于对待识别文本中的实体内容进行识别的第二网络模型。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种文本处理方法，其特征在于，应用于电子设备，所述方法包括：

获取扩展文本，所述扩展文本包括初始文本以及拼接在所述初始文本的指定位置的指定字符；

获取对所述扩展文本中的目标字符进行类型标注的标注结果，所述目标字符包括所述指定字符以及至少部分所述初始文本，其中，所述指定字符对应的标注内容为所述初始文本的标签类型，至少部分所述初始文本对应的标注内容为至少部分所述初始文本中每个字符各自的实体类型；

将所述扩展文本以及所述标注结果输入到第一网络模型中对所述第一网络模型的网络参数进行更新，得到第二网络模型，其中，所述第一网络模型包括双向长期短期记忆层以及条件随机场层；

基于所述第二网络模型对待识别文本中的实体内容进行识别。

2.根据权利要求1所述的方法，其特征在于，所述将所述扩展文本以及所述标注结果输入到第一网络模型中对所述第一网络模型的网络参数进行更新，得到第二网络模型，包括：

将所述扩展文本输入到所述双向长期短期记忆层中，并将所述双向长期短期记忆层的输出数据输入到非线性层，得到所述非线性层输出的发射概率；

基于所述标注结果更新所述条件随机场层中转移矩阵的结构维度；

基于条件随机方式得到结构维度更新后的所述转移矩阵中的新增加元素的值，以得到更新后的转移矩阵，所述新增加元素的值表征所述新增加元素对应的结构维度之间的转移概率；

基于所述非线性层输出的发射概率以及所述更新后的转移矩阵，对所述双向长期短期记忆层的网络参数以及所述更新后的转移矩阵中的转移概率进行更新，得到第二网络模型。

3.根据权利要求2所述的方法，其特征在于，所述基于所述非线性层输出的发射概率以及所述更新后的转移矩阵，对所述双向长期短期记忆层的网络参数以及所述更新后的转移矩阵中的转移概率进行更新，得到第二网络模型，包括：

基于所述非线性层输出的发射概率以及所述更新后的转移矩阵，得到所述初始文本中每个字符对应的实体识别结果；

将所述实体识别结果与所述标注结果进行比对，根据比对结果对所述双向长期短期记忆层的网络参数以及所述更新后的转移矩阵中的转移概率进行更新，得到第二网络模型。

4.根据权利要求1-3任一所述的方法，其特征在于，所述获取扩展文本之前还包括：

获取初始文本；

获取初始文本的指定位置以及指定字符；

将所述指定字符拼接到所述初始文本的指定位置得到扩展文本，并将所述扩展文本存储到指定存储区域；

所述获取扩展文本，包括：

从所述指定存储区域读取扩展文本。

5.根据权利要求4所述的方法，其特征在于，所述指定位置为所述初始文本的第一字符之前，或者为所述初始文本的最后一个字符之后。

6.一种文本处理方法，其特征在于，应用于电子设备，所述方法包括：

获取待识别文本；

将所述待识别文本输入到基于权利要求1-5任一所述的方法得到的第二网络模型中，得到所述第二网络模型输出的实体识别结果；

执行与所述实体识别结果对应的操作。

7.根据权利要求6所述的方法，其特征在于，所述获取待识别文本，包括：

获取采集到的语音内容；

对所述语音内容进行语义识别得到对应的文本，将所述对应的文本作为待识别文本。

8.一种文本处理装置，其特征在于，运行于电子设备，所述装置包括：

扩展文本获取单元，用于获取扩展文本，所述扩展文本包括初始文本以及拼接在所述初始文本的指定位置的指定字符；

标注结果获取单元，用于获取对所述扩展文本中的目标字符进行类型标注的标注结果，所述目标字符包括所述指定字符以及至少部分所述初始文本，其中，所述指定字符对应的标注内容为所述初始文本的标签类型，至少部分所述初始文本对应的标注内容为至少部分所述初始文本中每个字符各自的实体类型；

参数更新单元，用于将所述扩展文本以及所述标注结果输入到第一网络模型中对所述第一网络模型的网络参数进行更新，得到第二网络模型，其中，所述第一网络模型包括双向长期短期记忆层以及条件随机场层；

文本处理单元，用于基于所述第二网络模型对待识别文本中的实体内容进行识别。

9.一种文本处理装置，其特征在于，运行于电子设备，所述装置包括：

待识别文本获取单元，用于获取待识别文本；

实体识别单元，用于将所述待识别文本输入到基于权利要求1-5任一所述的方法得到的第二网络模型中，得到所述第二网络模型输出的实体识别结果；

结果执行单元，用于执行与所述实体识别结果对应的操作。

10.一种电子设备，其特征在于，包括处理器以及存储器；一个或多个程序被存储在所述存储器中并被配置为由所述处理器执行以实现权利要求1-5任一所述的方法或者权利要求6-7任一所述的方法。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有程序代码，其中，在所述程序代码被处理器运行时执行权利要求1-5任一所述的方法或者权利要求6-7任一所述的方法。