WO2021258914A1

WO2021258914A1 - 一种序列标注模型的训练方法及装置

Info

Publication number: WO2021258914A1
Application number: PCT/CN2021/094180
Authority: WO
Inventors: 周楠楠; 杨海军; 徐倩
Original assignee: 深圳前海微众银行股份有限公司
Priority date: 2020-06-24
Filing date: 2021-05-17
Publication date: 2021-12-30
Also published as: CN111737952A

Abstract

一种序列标注模型的训练方法及装置，涉及自然语言处理领域，用以在样本数据量不足的情况下对序列标注模型进行有效训练，该方法为：基于样本训练语句集合对序列标注模型进行训练，得到第一损失信息，在根据模型参数确定对抗扰动因子后，基于加入所述对抗扰动因子的样本训练语句集合，得到第二损失信息，基于第一损失信息和第二损失信息计算得到的目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练，确定满足收敛条件。所述方法通过增加对抗扰动因子，使得基于一个样本训练语句能够得到不同的损失信息，使得训练得到的所述序列标注模型的泛化能力更强，精度更高，而且避免了引入不必要的噪声干扰，节省资源消耗。

Description

一种序列标注模型的训练方法及装置

相关申请的交叉引用

本公开要求在2020年06月24日提交中国专利局、申请号为202010591966.2、申请名称为“一种序列标注模型的训练方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本公开中。

技术领域

本公开涉及自然语言处理领域，特别涉及一种序列标注模型的训练方法及装置。

背景技术

序列标注问题是自然语言处理领域中重要且应用广泛的一类问题，人们在基于训练样本完成对搭建的序列标注模型的训练后，能够借助于完成训练的序列标注模型，实现对输入的语句进行序列标注。但是，在进行序列标注模型训练时，很多场景下均存在样本量不足的情况。

现有技术下，为了获得足够的样本量，通常采用数据增强处理的方式由一个样本数据得到多个样本数据，然后通过得到的多个样本数据进行序列标注模型训练。然而，采用数据增强处理生成的样本数据进行训练时，会引入由于进行数据增强处理而带来的噪声，极大的影响序列标注模型精度，进而影响序列标注的精确度。

发明内容

本公开实施例提供一种序列标注模型的训练方法及装置，用以解决现有技术中存在的进行训练标注模型训练时由于样本数据量不足，导致无法得到有效的序列标注模型的问题。

本公开实施例提供的具体技术方案如下：

第一方面，提出一种序列标注模型的训练方法，包括：

获取待训练的序列标注模型和样本训练语句集合；

基于所述样本训练语句集合对所述序列标注模型进行训练，得到第一损失信息；

根据所述序列标注模型的模型参数，确定对抗扰动因子，并基于加入所述对抗扰动因子的样本训练语句集合对所述序列标注模型进行训练，得到第二损失信息；

基于所述第一损失信息和所述第二损失信息计算得到目标损失信息，并基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练，以及确定满足预设的收敛条件时，输出训练后的所述序列标注模型。

可选的，所述根据所述序列标注模型的模型参数，确定对抗扰动因子，包括：

获取所述序列标注模型当前的模型参数，并基于所述模型参数计算所述序列标注模型的梯度，并基于所述梯度以及预设的超参数计算对抗扰动因子，其中，所述超参数用于调整生成的对抗扰动的强弱。

可选的，所述基于所述梯度以及预设的超参数计算对抗扰动因子，包括：

获取预设的超参数，并将获得的所述超参数与所述梯度的乘积，与所述梯度的范数做商得到对抗扰动因子。

可选的，所述基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练之前，进一步包括：

获取为所述序列标注模型中的预训练模型设置的原始学习率，所述预训练模型用于基于输入的样本训练语句生成相应的字向量集合；

根据对应所述预训练模型中各个层级预设的层系数，结合所述原始学习率，分别确定各个层级对应的学习率，其中，所述学习率用于表征对各个层级对应的模型参数的调整幅度；

所述基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练，包括：

基于确定的所述序列标注模型中各个层级的学习率以及所述目标损失信息，采用误差反向传播的方式调整所述序列标注模型中各个层级的模型参数。

可选的，所述获取待训练的序列标注模型和样本训练语句集合之前，进一步包括：

获取多个样本训练语句，并确定各个样本训练语句的语句长度，基于所述各个样本训练语句的语句长度，对所述多个样本训练语句中的各个样本训练语句执行以下任意一项操作：

若所述语句长度未达到预设的固定语句长度，则采用预设的字符对所述一个样本训练语句进行填补，生成一个样本训练语句；或者，

若所述语句长度超过预设的固定语句长度时，则将所述一个样本训练语句中超过所述固定语句长度的部分进行截断，生成一个样本训练语句；或者，

若所述语句长度达到预设的固定语句长度时，则直接将所述一个样本训练语句作为一个样本训练语句。

可选的，基于所述样本训练语句集合对所述序列标注模型进行训练，得到第一损失信息，包括：

将所述样本训练语句集合中的各个样本训练语句输入序列标注模型，针对各个输入所述序列标注模型中的样本训练语句，分别执行以下操作：

确定一个样本训练语句中各个字符对应的字向量，生成相应的第一字向量集合；

基于所述第一字向量集合对所述一个样本训练语句进行实体标注，得到对应的第一预测标注信息；

基于所述第一预测标注信息与所述一个样本训练语句对应的真实标注信息之间的标注差异计算得到一个第一损失信息。

可选的，所述基于加入所述对抗扰动因子的样本训练语句集合对所述序列标注模型进行训练，得到第二损失信息，包括：

将所述对抗扰动因子加入所述第一字向量集合，得到第二字向量集合；

基于所述第二字向量集合对所述一个样本训练语句进行实体标注，得到对应的第二预测标注信息；

基于所述第二预测标注信息与所述一个样本训练语句对应的真实标注信息之间的标注差异计算得到一个第二损失信息。

可选的，所述确定满足预设的收敛条件，包括：

确定连续N次迭代过程中，每一次迭代过程中对于样本训练语句的预测准确率与前一次迭代过程中对样本训练语句的预测准确率之间的差值，满足预设的准确率差值范围时，确定达到预设的收敛条件；或者，

确定连续M次迭代过程中，每一次迭代过程中所述序列标注模型的目标损失与前一次迭代过程中所述序列标注模型的目标损失之间的差值，满足预设的损失差值范围时，确定满足预设的收敛条件；或者，

确定当前迭代的次数达到预设的最大迭代次数时，确定达到预设的收敛条件。

可选的，所述输出训练后的所述序列标注模型后，进一步包括：

获取待处理语句，调用所述序列标注模型对所述待处理语句进行序列标注处理，得到输出的预测标注信息。

第二方面，提出一种序列标注模型的训练装置，包括：

获取单元，获取待训练的序列标注模型和样本训练语句集合；

训练单元，基于所述样本训练语句集合对所述序列标注模型进行训练，得到第一损失信息；

确定单元，根据所述序列标注模型的模型参数，确定对抗扰动因子，并基于加入所述对抗扰动因子的样本训练语句集合对所述序列标注模型进行训练，得到第二损失信息；

调整单元，基于所述第一损失信息和所述第二损失信息计算得到目标损失信息，并基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练，以及确定满足预设的收敛条件时，输出训练后的所述序列标注模型。

可选的，所述根据所述序列标注模型的模型参数，确定对抗扰动因子时，所述确定单元用于：

可选的，所述基于所述梯度以及预设的超参数计算对抗扰动因子时，所述确定单元：

可选的，所述基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练之前，所述调整单元进一步用于：

可选的，所述获取待训练的序列标注模型和样本训练语句集合之前，所述获取单元进一步用于：

可选的，所述基于所述样本训练语句集合对所述序列标注模型进行训练，得到第一损失信息时，所述训练单元用于：

将所述样本训练语句集合中的各个样本训练语句输入序列标注模型，针对得到的一个样本训练语句中各个字符对应的字向量，生成相应的第一字向量集合；

可选的，所述基于加入所述对抗扰动因子的样本训练语句集合对所述序列标注模型进行训练，得到第二损失信息时，所述确定单元用于：

可选的，所述确定满足预设的收敛条件时，所述调整单元用于：

可选的，所述输出训练后的所述序列标注模型后，所述调整单元进一步用于：

第三方面，提出一种序列标注模型的训练装置，包括：

存储器，用于存储可执行指令；

处理器，用于读取并执行所述存储器中存储的可执行指令，以实现上述任一项所述的序列标注模型的训练方法。

第四方面，提出一种存储介质，当所述存储介质中的指令由处理器执行时，使得所述处理器能够执行上述任一项所述的序列标注模型的训练方法。

本公开有益效果如下：

本公开实施例中，获取待训练的序列标注模型和样本训练语句集合，然后，基于所述样本训练语句集合对所述序列标注模型进行训练，得到第一损失信息，再根据所述序列标注模型的模型参数，确定对抗扰动因子，并基于加入所述对抗扰动因子的样本训练语句集合对所述序列标注模型进行训练，得到第二损失信息，然后，基于所述第一损失信息和所述第二损失信息计算得到目标损失信息，并基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练，以及确定满足预设的收敛条件时，输出训练后的所述序列标注模型。

这样，通过在序列标注模型中增加对抗扰动因子，能够基于一个样本训练语句能够得到不同的损失信息，使得训练得到的所述序列标注模型的泛化能力更强，精度更高，而且避免了引入不必要的噪声干扰，节省资源消耗。此外，无需人工标注大量的训练样本，能够节省大量的人力成本和时间，从而能够提升序列标注模型的训练效率。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例中序列标注模型的训练流程图；

图2为本公开实施例中序列标注模型的训练装置逻辑结构示意图；

图3为本公开实施例中序列标注模型的训练装置实体结构示意图。

具体实施方式

为在样本数据不足的情况下，实现对序列标注模型进行有效训练，本公开实施例中，获取待训练的序列标注模型和样本训练语句集合，然后，基于所述样本训练语句集合对所述序列标注模型进行训练，得到第一损失信息，再根据所述序列标注模型的模型参数，确定对抗扰动因子，并基于加入所述对抗扰动因子的样本训练语句集合对所述序列标注模型进行训练，得到第二损失信息，然后，基于所述第一损失信息和所述第二损失信息计算得到目标损失信息，并基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练，以及确定满足预设的收敛条件时，输出训练后的所述序列标注模型。

下面结合附图对本公开优选的实施方式做出进一步详细说明。

参阅图1所示，本公开实施例中，对序列标注模型的训练流程如下：

S101：获取待训练的序列标注模型和样本训练语句集合。

具体的，首先，获取样本数据，并确定各个样本数据的语句长度。

例如，获取样本数据1{小明今天去银行还款两千元}，并确定样本数据1的语句长度为12个字符，读取样本数据2{小丽每天去学校学习}，并确定样本数据2的语句长度为9个字符。

进一步的，确定各个的样本数据的语句长度后，基于所述指定数目的样本数据中每一个样本数据的语句长度，对每一个样本数据进行处理得到一个样本训练语句，直至全部的样本数据处理完成，其中，对于每一个样本数据的处理方式，存在但不限于以下情况：

第一种情况：样本数据的语句长度未达到预设的固定语句长度。

若一个样本数据的语句长度未达到预设的固定语句长度，则采用预设的字符对所述一个样本数据进行填补，生成一个样本训练语句。

例如，假设，预设的固定语句长度为128个字符，预设的字符为“0”，样本训练语句1的语句长度为12个字符，此时，样本训练语句1的语句长度未达到128个字符，采用字符“0”对所述样本数据1进行填补，生成样本训练语句1。

第二种情况：样本数据的语句长度超过预设的固定语句长度。

若一个样本数据的语句长度超过预设的固定语句长度时，则将所述一个样本数据中超过所述固定语句长度的部分进行截断，生成一个样本训练语句。

例如，假设，预设的固定语句长度为128个字符，存在样本数据X的语句长度为130个字符，此时，样本数据的语句长度超过预设的固定语句长度128个字符，将样本数据X中超过128字符的部分进行截断，生成样本训练语句X。

第三种情况：样本数据的语句长度达到预设的固定语句长度。

若一个样本数据的语句长度达到预设的固定语句长度时，则直接将所述一个样本数据作为一个样本训练语句。

例如，假设，固定语句长度为128字符，样本数据N的语句长度为128字符，则直接将样本数据N作为一个样本训练语句N。

需要说明的是，本公开实施例中，在确定一个样本数据的语句长度之前，基于预设的句首标签[CLS]，预设的句末标签[SEP]，对样本数据进行处理，即，在一个样本数据的句首设置[CLS]，在一个样本数据的句末设置[SEP]。

进一步的，本公开实施例中，基于处理得到的训练样本语句得到训练样本语句集合。

需要说明的是，本公开实施例中，获得的序列标注模型是基于来自转换器的双向编码器表示(Bidirectional Encoder Representation from Transformers，BERT)+双向长短期记忆网络(Bidirectional Long Short-Term Memory，BiLSTM)+条件随机场(Conditional Random Fields，CRF)的模型架构搭建的，其中，所述BERT模型为所述序列标注模型中的预训练模型。

S102：基于样本训练语句集合对序列标注模型进行训练，得到第一损失信息。

本公开实施例中，获取样本训练语句集合后，基于所述样本序列语句集合对序列标注模型进行训练，得到第一损失信息。

需要说明的是，本公开实施例中，对序列标模型进行训练时，在进行迭代的过程中，采用批处理的方式，读取并处理样本训练语句。即，根据预设的批处理大小，确定每一次读取相应数目的样本训练语句进行模型训练。

例如，假设，预设的批处理大小为32，确定每一次读取32个样本训练语句进行模型训练。

又例如，假设，预设的批处理大小为64，确定每一次读取64个样本训练语句进行模型训练。

为了便于描述，下面仅以将一个样本训练语句输入所述序列标注模型为例，对训练过程进行说明。

具体的，将所述样本训练语句集合中的各个样本训练语句输入序列标注模型，针对各个输入所述序列标注模型中的样本训练语句，分别执行以下操作：

S1：确定一个样本训练语句中各个字符对应的字向量，生成相应的第一字向量集合。

具体的，将一个样本训练语句输入序列标注模型后，基于到所述序列标注模型中的预训练模型输出的，与所述一个样本训练语句中各个字符对应的字向量，生成相应的第一字向量集合。

例如，将样本训练语句{小明在读书}输入序列标注模型后，确定“小”对应字向量1，“明”对应字向量2，“在”对应字向量3，“读”对应字向量4，“书”对应字向量5，读一个样本训练语句得到得字向量集合包括字向量1-5，且，字向量1-5均为768维。

S2：基于字向量集合对一个样本训练语句进行实体标注，得到对应的第一预测标注信息。

例如，确定一个样本训练语句对应的字向量集合后，得到这对各个字向量的预测结果，如，对于样本训练语句{小明今天去银行还款两千元}，对应的第一预测标注信息为小(B-NAM)明(E-NAM)今(O)天(O)去(O)银(O)行(O)还(O)款(O)两(O)千(O)元(O)，表征样本训练语句中，“小”为人名的开始，“明”为人名的结束，“今”、“天”、“去”“银”、“行”、“还”“款”、“两”、“千”“元”归为其他标注。

S3：基于第一预测标注信息和一个样本训练语句对应的真实标注信息之间的标注差异计算得到一个第一损失信息，所述第一损失信息记为Le。

具体的，序列标注模型中的BiLSTM+CRF模型基于得到的第一预测标注信息，以及一个样本训练语句对应的真实标注信息，确定所述第一预测标注信息与真实标注信息之间的标注差异，并针对性的计算当前序列标注模型对应的第一损失。

例如，对于样本训练语句{小明今天去银行还款两千元}，对应的真实标注信息为：小(B-NAM)明(E-NAM)今(B-TIM)天(E-TIM)去(O)银(B-LOC)行(E-LOC)还(O)款(O)两(B-MON)千(I-MON)元(E-MON)，其中，“B-”表示标注的元素的开始，“I-”表示标注的元素的中间，“E-”表示标注的元素的结束。进而，基于真实标注信息与序列标注模型得到的第一标注信息的差异，计算当前所述序列标注模型对应的第一损失。

S103：根据所述序列标注模型的模型参数，确定对抗扰动因子。

本公开实施例中，获取所述序列标注模型当前的模型参数，并基于所述模型参数计算所述序列标注模型的梯度，并基于所述梯度以及预设的超参数计算对抗扰动因子，其中，所述超参数用于调整生成的对抗扰动的强弱。

具体的，基于所述序列标注模型当前的模型参数，计算所述序列标注模型的梯度g，进一步的，本公开实施例中，获取预设的超参数，并将获得的所述超参数与所述梯度的乘积，与所述梯度的范数做商得到对抗扰动因子。

计算对抗扰动因子r的公式如下：

r＝-εg/||g||2

其中，ε为超参数，所述超参数可以根据处理需要自行配置，用于调整对抗扰动因子的大小，对抗扰动因子越大，表示能够添加的对抗扰动越强。

S104：基于加入对抗扰动因子的样本训练语句集合对序列标注模型进行训练，得到第二损失信息。

具体的，继续S102中对样本训练集合中一个样本训练语句输入序列标注模型中，得到第二损失信息的过程进行说明。

将所述对抗扰动因子加入S102中得到的第一字向量集合，得到第二字向量集合，然后，序列标注模型中的BiLSTM+CRF模型基于所述第二字向量集合对所述一个样本训练语句进行实体标注，得到相应的第二预测标注信息。

例如，在样本训练语句{小明今天去银行还款两千元}对应的第一字向量集合中添加对抗扰动因子后，对第一字向量集合中各个字向量进行干扰，生成第二字向量集合。进而获得序列标注模型输出的诸如：小(B-NAM)明(E-NAM)今(O)天(O)去(O)银(B-NAM)行(E-NAM)还(O)款(O)两(O)千(O)元(O)的第二预测标注信息。

进一步的，基于所述第二预测标注信息和所述一个样本训练语句对应的真实标注信息之间的标注差异计算得到一个第二损失信息。

具体的，基于得到的第二预测标注信息，以及一个样本数据对应的真实标注信息，确定所述第二预测标注信息与真实标注信息之间的标注差异，并针对性的计算当前序列标注模型对应的第二损失，所述第二损失记为Lr。

例如，对于样本训练语句{小明今天去银行还款两千元}，对应的真实标注信息为：小(B-NAM)明(E-NAM)今(B-TIM)天(E-TIM)去(O)银(B-LOC)行(E-LOC)还(O)款(O)两(B-MON)千(I-MON)元(E-MON)，而对于样本训练语句得到的第二预测标注信息为：小(B-NAM)明(E-NAM)今(O)天(O)去(O)银(B-NAM)行(E-NAM)还(O)款(O)两(O)千(O)元(O)，进而，基于第二预测信息与真实标注信息之间的差异，获得当前序列标注模型对应的第二损失。

这样，基于一个样本训练语句，在添加对抗扰动因子的情况下，得到序列标注模型输出的不同预测标注信息，在样本有限的情况下，能够在不引入噪声的情况下，增加了样本训练语句的数量，而且基于添加有对抗扰动因子的样本训练语句进行训练时，能够使得序列标注模型的泛化能力更强，精度更高。

S105：基于所述第一损失信息和所述第二损失信息计算得到目标损失信息，并基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练。

具体的，获得针对第一预测标注信息与真实标注信息之间的差异确定的Le，以及针对第二预测标注信息与真实标注信息之间的差异确定的Lr之后，进一步的，将所述Le与所述Lr的和作为目标损失信息，所述目标损失信息记为L。

需要说明的是，本公开实施例中，在基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练之前，需要为序列标注模型中的预训练模型的每一层配置学习率，具体的，获取为所述序列标注模型中的预训练模型设置的原始学习率，所述预训练模型用于基于输入的样本训练语句生成相应的字向量集合，再根据对应所述预训练模型中各个层级预设的层系数，结合所述原始学习率，分别确定各个层级对应的学习率，其中，所述学习率用于表征对各个层级对应的模型参数的调整幅度。

需要说明的是，对于所述序列标注模型中的预训练模型，所述预训练模型中每一层级的学习率不同，通常所述预训练模型的上层包含更多的语义层次的信息，中层包含句法层次的信息，底层包含词组方面的信息，故在配置学习率时，对于所述预训练模型的上层，一般配置较高的学习率，以实现更多的改变上层参数，而对于所述预训练模型的底层，一般配置较低的学习率，以较少的改变底层参数。

具体的，采用如下两种方式，计算序列标注模型中预训练模型中各层的学习率：

方式一、

如下公式，计算所述序列标注模型中的预训练模型中每一层的学习率：

Li＝Lr/Ci

其中，Li表示第i层的学习率，Lr表示为预训练模型配置的原始学习率，Ci表示第i层的层系数。

需要说明的是，i越小表示层越高，以所述预训练模型具有三层为例，C1表示所述预训练模型上层的层系数，C2表示所述预训练模型中层的层系数，C3表示所述预训练模型底层的层系数，其中，可根据实际的处理需要调整Ci的取值。

方式二、

采用如下公式，计算所述序列标注模型中的预训练模型中每一层的学习率：

Li+1＝Li/C

其中，Li表示第i层的学习率，Li+1表示第i+1层的学习率，C为固定参数。

例如，假设，设置第1层的初始学习率L1为0.025，固定参数C取值为5，则第2层的学习率为0.005，第3层的学习率为0.001。

需要说明的是，i越小表示层越高，以所述预训练模型具有三层为例，L1表示所述预训练模型上层的学习率，L2表示所述预训练模型中层的学习率，L3表示所述预训练模型底层的学习率。

这样，考虑由于样本量不足，在调整预训练模型时，通过为所述预训练模型的不同层级配置不同的学习率，更多的改变所述预训练模型的上层参数，较少的去改变所述预训练模型的底层参数，能够使预训练模型的参数调整更加科学，进而得到精度更高的序列标注模型。

进一步的，基于确定的所述序列标注模型中各个层级的学习率以及所述目标损失信息，采用误差反向传播的方式调整所述序列标注模型中各个层级的模型参数。具体过程可以为：计算所述目标损失信息对所述各个层级的模型参数的偏导值，以及计算所述各个层级的学习率和计算的偏导值的乘积，利用计算所述各个层级所对应的乘积，调整所述各个层级的模型参数，具体地，各个层级调整后的模型参数为调整前模型参数与对应的乘积的差值。

例如，以对序列标注模型中某一层级的某一模型参数W1进行调整为例，首先，基于计算得到的目标损失信息，计算所述目标损失信息对W1的偏导，进而计算调整前模型参数W1取值与所述偏导值与学习率的乘积的差，然后讲计算的差作为更新后的W1，如假设原始W1为0.4，学习率为0.01，计算得到的偏导值为0.04728，则更新后的W1位0.4-0.01*0.04728＝0.3995727。

以上说明了将样本训练语句集合中一个样本训练语句输入序列标注模型中进行处理的过程，本公开实施例中，采用迭代训练的方式，基于所述样本训练语句集合中的各个样本训练语句进行训练，具体的，在对所述序列标注模型进行训练过程中，基于样本训练语句，得到一个目标损失信息，完成对所述序列标注模型的一次调整后，再从样本训练语句集合中获得新的样本训练语句输入经过的调整的序列标注模型中，进行再一次训练，如此循环迭代，直至确定满足收敛条件为止，在此不再赘述。

这样，相当于在序列标注模型的损失中添加了对抗扰动因子，而基于添加有对抗扰动因子的目标损失信息对所述序列标注模型进行调整时，能够使所述序列标注模型的泛化能力更强，精度更高。

S106：确定满足预设的收敛条件时，输出训练后的所述序列标注模型。

具体的，本公开实施例中，确定序列标注模型的目标损失信息后，可以采用但不限于以下方式判断满足预设的收敛条件：

第一种方式：确定连续N次迭代过程中，每一次迭代过程中对于样本训练语句的预测准确率与前一次迭代过程中对样本训练语句的预测准确率之间的差值，满足预设的准确率差值范围时，确定达到预设的收敛条件。

需要说明的是，所述预测准确率具体可以由预测标注信息与真实标注信息相比的正确率来衡量，即，预测标注信息中，正确标注的信息内容的占比。

例如，假设，序列标注模型对包括50个字符的样本训练语句进行序列标注后，确定其中40个字符序列标注正确，这样，所述序列标注模型的准确率为80％。

本公开实施例中，N的取值可以根据实际应用场景进行设定。

例如，假设，N的取值为2，预设的准确率差值范围为1％-5％，第10次迭代过程中样本训练语句的预测准确率1为80％，第9次迭代过程中样本训练语句的预测准确率2为75％，第8次迭代过程中样本训练语句的预测准确率3为70％，显然，第10次迭代过程中样本训练语句的预测准确率1与第9次迭代过程样本训练语句的预测准确率2之间的差值为5％，第9次迭代过程中样本训练语句的预测准确率2与第8次迭代过程样本训练语句的预测准确率3之间的差值为5％，此时，确定连续2次迭代过程中，每一次迭代过程中样本训练语句的预测准确率与前一次迭代过程中样本训练语句的预测准确率之间的差值，满足预设的1％-5％，那么，判定满足预设的收敛条件。

第三种方式：确定连续M次迭代过程中，每一次迭代过程中所述序列标注模型的目标损失信息与前一次迭代过程中所述序列标注模型的目标损失信息之间的差值，满足预设的准确率差值范围时，确定达到预设的收敛条件。

需要说明的是，本公开实施例中，M的取值可根据实际应用场景进行设定。

例如，假设，M的取值为5，预设的损失差值范围为1％-2.5％，第30次迭代过程中序列标注模型的目标损失信息为7.5％，第29次迭代过程中目标损失信息为8.4％，第28次迭代过程中目标损失信息为9.2％，第27次迭代过程中目标损失信息为10.3％，第26次迭代过程中目标损失信息为11.6％，第25次迭代过程中目标损失信息为13.0％，故确定从第25次迭代至第30次迭代，相邻两次迭代过程的目标损失信息差值为1.4％，1.3％，1.1％，0.8％，0.9％，连续5次满足目标损失信息的差值处于损失差值范围，那么，判定满足预设的收敛条件。

第三种方式：确定当前迭代次数达到预设的最大迭代次数时，确定满足预设的收敛条件。

例如，假设，预设的最大迭代次数为50，确定当前迭代次数达到50时，确定满足预设的收敛条件。

进一步的，确定满足以上任一收敛条件时，可确定所述序列标注模型收敛，可输出训练完成的所述序列标注模型。

进一步的，在实际的应用中，获取待处理语句后，通过调用所述序列标注模型对所述待处理语句进行序列标注处理，得到输出的预测标注信息。

基于同一发明构思，参阅图2所示，本公开实施例中，提供一种序列标注模型的训练装置，至少包括：获取单元201，训练单元202，确定单元203和调整单元204，其中，

获取单元201，获取待训练的序列标注模型和样本训练语句集合；

训练单元202，基于所述样本训练语句集合对所述序列标注模型进行训练，得到第一损失信息；

确定单元203，根据所述序列标注模型的模型参数，确定对抗扰动因子，并基于加入所述对抗扰动因子的样本训练语句集合对所述序列标注模型进行训练，得到第二损失信息；

调整单元204，基于所述第一损失信息和所述第二损失信息计算得到目标损失信息，并基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练，以及确定满足预设的收敛条件时，输出训练后的所述序列标注模型。

可选的，所述根据所述序列标注模型的模型参数，确定对抗扰动因子时，所述确定单元203用于：

可选的，所述基于所述梯度以及预设的超参数计算对抗扰动因子时，所述确定单元203：

可选的，所述基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练之前，所述调整单元204进一步用于：

可选的，所述获取待训练的序列标注模型和样本训练语句集合之前，所述获取单元201进一步用于：

可选的，所述基于所述样本训练语句集合对所述序列标注模型进行训练，得到第一损失信息时，所述训练单元202用于：

可选的，所述基于加入所述对抗扰动因子的样本训练语句集合对所述序列标注模型进行训练，得到第二损失信息时，所述确定单元203用于：

可选的，所述确定满足预设的收敛条件时，所述调整单元204用于：

可选的，所述输出训练后的所述序列标注模型后，所述调整单元204进一步用于：

基于同一发明构思，参阅图3所示，公开实施例提供一种序列标注模型的训练装置，至少包括：

存储器301，用于存储可执行指令；

处理器302，用于读取并执行存储器中存储的可执行指令，执行下列过程：

获取待训练的序列标注模型和样本训练语句集合；

可选的，所述根据所述序列标注模型的模型参数，确定对抗扰动因子时，所述处理器302用于：

可选的，所述基于所述梯度以及预设的超参数计算对抗扰动因子时，所述处理器302用于：

可选的，所述基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练之前，所述处理器302进一步用于：

根据对应所述预训练模型中各个层级预设的层系数，结合所述原始学习率，分别确定各个层级对应的学习率，其中，所述学习率用于表征对各个层级对应的模型参数的调整幅度。

可选的，所述获取待训练的序列标注模型和样本训练语句集合之前，所述处理器302进一步用于：

可选的，基于所述样本训练语句集合对所述序列标注模型进行训练，得到第一损失信息时，所述处理器302用于：

可选的，所述基于加入所述对抗扰动因子的样本训练语句集合对所述序列标注模型进行训练，得到第二损失信息时，所述处理器302用于：

可选的，所述确定满足预设的收敛条件时，所述处理器302用于：

可选的，所述输出训练后的所述序列标注模型后，所述处理器302进一步用于：

基于同一发明构思，本公开实施例提供一种存储介质，当所述存储介质中的指令由处理器执行时，使得所述处理器能够执行如上述实施例中任一项所述的序列标注模型的训练方法。

综上所述，本公开实施例中，本公开实施例中，获取待训练的序列标注模型和样本训练语句集合，然后，基于所述样本训练语句集合对所述序列标注模型进行训练，得到第一损失信息，再根据所述序列标注模型的模型参数，确定对抗扰动因子，并基于加入所述对抗扰动因子的样本训练语句集合对所述序列标注模型进行训练，得到第二损失信息，然后，基于所述第一损失信息和所述第二损失信息计算得到目标损失信息，并基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练，以及确定满足预设的收敛条件时，输出训练后的所述序列标注模型。这样，通过在序列标注模型中增加对抗扰动因子，能够基于一个样本训练语句能够得到不同的损失信息，使得训练得到的所述序列标注模型的泛化能力更强，精度更高，而且避免了引入不必要的噪声干扰，节省资源消耗。此外，无需人工标注大量的训练样本，能够节省大量的人力成本和时间，从而能够提升序列标注模型的训练效率。

本领域内的技术人员应明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本公开的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本公开范围的所有变更和修改。

显然，本领域的技术人员可以对本公开实施例进行各种改动和变型而不脱离本公开实施例的精神和范围。这样，倘若本公开实施例的这些修改和变型属于本公开权利要求及其等同技术的范围之内，则本公开也意图包含这些改动和变型在内。

Claims

一种序列标注模型的训练方法，其特征在于，包括：

获取待训练的序列标注模型和样本训练语句集合；

基于所述样本训练语句集合对所述序列标注模型进行训练，得到第一损失信息；

根据所述序列标注模型的模型参数，确定对抗扰动因子，并基于加入所述对抗扰动因子的样本训练语句集合对所述序列标注模型进行训练，得到第二损失信息；

基于所述第一损失信息和所述第二损失信息计算得到目标损失信息，并基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练，以及确定满足预设的收敛条件时，输出训练后的所述序列标注模型。
如权利要求1所述的方法，其特征在于，所述根据所述序列标注模型的模型参数，确定对抗扰动因子，包括：

获取所述序列标注模型当前的模型参数，并基于所述模型参数计算所述序列标注模型的梯度，并基于所述梯度以及预设的超参数计算对抗扰动因子，其中，所述超参数用于调整生成的对抗扰动的强弱。
如权利要求2所述的方法，其特征在于，所述基于所述梯度以及预设的超参数计算对抗扰动因子，包括：

获取所述超参数，并将获得的所述超参数与所述梯度的乘积，与所述梯度的范数做商得到对抗扰动因子。
如权利要求1所述的方法，其特征在于，所述基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练之前，进一步包括：

获取为所述序列标注模型中的预训练模型设置的原始学习率，所述预训练模型用于基于输入的样本训练语句生成相应的字向量集合；

根据对应所述预训练模型中各个层级预设的层系数，结合所述原始学习率，分别确定各个层级对应的学习率，其中，所述学习率用于表征对各个层级对应的模型参数的调整幅度；

所述基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练，包括：

基于确定的所述序列标注模型中各个层级的学习率以及所述目标损失信息，采用误差反向传播的方式调整所述序列标注模型中各个层级的模型参数。
如权利要求1所述的方法，其特征在于，所述获取待训练的序列标注模型和样本训练语句集合之前，进一步包括：

获取多个样本训练语句，并确定各个样本训练语句的语句长度，基于所述各个样本训练语句的语句长度，对所述多个样本训练语句中的各个样本训练语句执行以下任意一项操作：

若所述语句长度未达到预设的固定语句长度，则采用预设的字符对所述一个样本训练语句进行填补，生成一个样本训练语句；或者，

若所述语句长度超过预设的固定语句长度时，则将所述一个样本训练语句中超过所述固定语句长度的部分进行截断，生成一个样本训练语句；或者，

若所述语句长度达到预设的固定语句长度时，则直接将所述一个样本训练语句作为一个样本训练语句。
如权利要求1-5任一项所述的方法，其特征在于，基于所述样本训练语句集合对所述序列标注模型进行训练，得到第一损失信息，包括：

将所述样本训练语句集合中的各个样本训练语句输入序列标注模型，针对各个输入所述序列标注模型中的样本训练语句，分别执行以下操作：

确定一个样本训练语句中各个字符对应的字向量，生成相应的第一字向量集合；

基于所述第一字向量集合对所述一个样本训练语句进行实体标注，得到对应的第一预测标注信息；

基于所述第一预测标注信息与所述一个样本训练语句对应的真实标注信息之间的标注差异计算得到一个第一损失信息。
如权利要求6所述的方法，其特征在于，所述基于加入所述对抗扰动因子的样本训练语句集合对所述序列标注模型进行训练，得到第二损失信息，包括：

将所述对抗扰动因子加入所述第一字向量集合，得到第二字向量集合；

基于所述第二字向量集合对所述一个样本训练语句进行实体标注，得到对应的第二预测标注信息；

基于所述第二预测标注信息与所述一个样本训练语句对应的真实标注信息之间的标注差异计算得到一个第二损失信息。
如权利要求1-5任一项所述的方法，其特征在于，所述确定满足预设的收敛条件，包括：

确定连续N次迭代过程中，每一次迭代过程中对于样本训练语句的预测准确率与前一次迭代过程中对样本训练语句的预测准确率之间的差值，满足预设的准确率差值范围时，确定达到预设的收敛条件；或者，

确定连续M次迭代过程中，每一次迭代过程中所述序列标注模型的目标损失与前一次迭代过程中所述序列标注模型的目标损失之间的差值，满足预设的损失差值范围时，确定满足预设的收敛条件；或者，

确定当前迭代的次数达到预设的最大迭代次数时，确定达到预设的收敛条件。
如权利要求1-5任一项所述的方法，其特征在于，所述输出训练后的所述序列标注模型后，进一步包括：

获取待处理语句，调用所述序列标注模型对所述待处理语句进行序列标注处理，得到输出的预测标注信息。
一种序列标注模型的训练装置，其特征在于，包括：

获取单元，获取待训练的序列标注模型和样本训练语句集合；

训练单元，基于所述样本训练语句集合对所述序列标注模型进行训练，得到第一损失信息；

确定单元，根据所述序列标注模型的模型参数，确定对抗扰动因子，并基于加入所述对抗扰动因子的样本训练语句集合对所述序列标注模型进行训练，得到第二损失信息；

调整单元，基于所述第一损失信息和所述第二损失信息计算得到目标损失信息，并基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练，以及确定满足预设的收敛条件时，输出训练后的所述序列标注模型。
如权利要求10所述的装置，其特征在于，所述根据所述序列标注模型的模型参数，确定对抗扰动因子时，所述确定单元用于：

获取所述序列标注模型当前的模型参数，并基于所述模型参数计算所述序列标注模型的梯度，并基于所述梯度以及预设的超参数计算对抗扰动因子，其中，所述超参数用于调整生成的对抗扰动的强弱。
如权利要求11所述的装置，其特征在于，所述基于所述梯度以及预设的超参数计算对抗扰动因子时，所述确定单元用于：

获取所述超参数，并将获得的所述超参数与所述梯度的乘积，与所述梯度的范数做商得到对抗扰动因子。
如权利要求10所述的装置，其特征在于，所述基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练之前，所述调整单元进一步用于：

获取为所述序列标注模型中的预训练模型设置的原始学习率，所述预训练模型用于基于输入的样本训练语句生成相应的字向量集合；

根据对应所述预训练模型中各个层级预设的层系数，结合所述原始学习率，分别确定各个层级对应的学习率，其中，所述学习率用于表征对各个层级对应的模型参数的调整幅度；

所述基于所述目标损失信息对所述序列标注模型的模型参数进行调整并进行迭代训练时，所述调整单元用于：

基于确定的所述序列标注模型中各个层级的学习率以及所述目标损失信息，采用误差反向传播的方式调整所述序列标注模型中各个层级的模型参数。
如权利要求10所述的装置，其特征在于，所述获取待训练的序列标注模型和样本训练语句集合之前，所述获取单元进一步用于：

获取多个样本训练语句，并确定各个样本训练语句的语句长度，基于所述各个样本训练语句的语句长度，对所述多个样本训练语句中的各个样本训练语句执行以下任意一项操作：

若所述语句长度未达到预设的固定语句长度，则采用预设的字符对所述一个样本训练语句进行填补，生成一个样本训练语句；或者，

若所述语句长度超过预设的固定语句长度时，则将所述一个样本训练语句中超过所述固定语句长度的部分进行截断，生成一个样本训练语句；或者，

若所述语句长度达到预设的固定语句长度时，则直接将所述一个样本训练语句作为一个样本训练语句。
如权利要求10-14任一项所述的装置，其特征在于，基于所述样本训练语句集合对所述序列标注模型进行训练，得到第一损失信息时，所述训练单元用于：

将所述样本训练语句集合中的各个样本训练语句输入序列标注模型，针对各个输入所述序列标注模型中的样本训练语句，分别执行以下操作：

确定一个样本训练语句中各个字符对应的字向量，生成相应的第一字向量集合；

基于所述第一字向量集合对所述一个样本训练语句进行实体标注，得到对应的第一预测标注信息；

基于所述第一预测标注信息与所述一个样本训练语句对应的真实标注信息之间的标注差异计算得到一个第一损失信息。
如权利要求15所述的装置，其特征在于，所述基于加入所述对抗扰动因子的样本训练语句集合对所述序列标注模型进行训练，得到第二损失信息时，所述确定单元用于：

将所述对抗扰动因子加入所述第一字向量集合，得到第二字向量集合；

基于所述第二字向量集合对所述一个样本训练语句进行实体标注，得到对应的第二预测标注信息；

基于所述第二预测标注信息与所述一个样本训练语句对应的真实标注信息之间的标注差异计算得到一个第二损失信息。
如权利要求10-14任一项所述的装置，其特征在于，所述确定满足预设的收敛条件时，所述调整单元用于：

确定连续N次迭代过程中，每一次迭代过程中对于样本训练语句的预测准确率与前一次迭代过程中对样本训练语句的预测准确率之间的差值，满足预设的准确率差值范围时，确定达到预设的收敛条件；或者，

确定连续M次迭代过程中，每一次迭代过程中所述序列标注模型的目标损失与前一次迭代过程中所述序列标注模型的目标损失之间的差值，满足预设的损失差值范围时，确定满足预设的收敛条件；或者，

确定当前迭代的次数达到预设的最大迭代次数时，确定达到预设的收敛条件。
如权利要求10-14任一项所述的装置，其特征在于，所述输出训练后的所述序列标注模型后，所述调整单元进一步用于：

获取待处理语句，调用所述序列标注模型对所述待处理语句进行序列标注处理，得到输出的预测标注信息。
一种序列标注模型的训练装置，其特征在于，包括：

存储器，用于存储可执行指令；

处理器，用于读取并执行所述存储器中存储的可执行指令，以实现如权利要求1至9中任一项所述的序列标注模型的训练方法。
一种存储介质，其特征在于，当所述存储介质中的指令由处理器执行时，使得所述处理器能够执行如权利要求1至9中任一项所述的序列标注模型的训练方法。