CN114722834A

CN114722834A - 基于对比学习的语义识别模型训练方法、设备和介质

Info

Publication number: CN114722834A
Application number: CN202210439125.9A
Authority: CN
Inventors: 黄海龙
Original assignee: Ping An Life Insurance Company of China Ltd
Current assignee: Ping An Life Insurance Company of China Ltd
Priority date: 2022-04-25
Filing date: 2022-04-25
Publication date: 2022-07-08

Abstract

本申请涉及深度学习技术领域，提出了一种基于对比学习的语义识别模型训练方法、设备和介质，方法包括：在所述原始句子文本中对每一个所述第一目标词汇进行同义词替换，得到第一处理句子文本；以及，在所述原始句子文本中对每一个所述第二目标词汇进行反义词替换，得到第二处理句子文本；通过所述原始句子文本、所述第一处理句子文本和所述第二处理句子文本对初始的语义识别模型进行训练，以得到目标语义识别模型。本发明实施例目的是提供能够识别语义微小变化的对比学习方法，针对之前正负样本比较好区分的问题进行了改造，使得模型能够学习到更丰富的知识，提升模型训练效果。

Description

基于对比学习的语义识别模型训练方法、设备和介质

技术领域

本申请涉及人工智能技术领域，特别是涉及一种基于对比学习的语义识别模型训练方法、系统、电子设备和计算机可读存储介质。

背景技术

对比学习(Contrastive Learning)是一种常用的自监督学习方法，核心思想是缩小与正样本的距离,扩大与负样本的距离，通过训练模型哪些数据点相似或不同，来学习没有标签的数据集的一般特征。

然而，当将对比学习应用到语义识别模型，以训练语义识别模型来区分语义相似或者不同的文本句子时，遇到的困难较多，主要困难在于：一是文本对比学习的负样本对比较容易识别，不同文本表示的语义差别本身较大，仅通过文本长度即可区分出负样本对；其次是通过数据增强构造正样本对过程中可能出现假正例，因为往往改变文本的一个或多个词可能语义就发生了变化。基于以上，通过对比学习训练句子级的语义识别模型的效果并不好。

发明内容

本申请实施例的主要目的在于提出一种基于对比学习的语义识别模型训练方法、系统、电子设备和计算机可读存储介质，旨在提升通过对比学习训练句子级的语义识别模型的效果。

为实现上述目的，本申请实施例的第一方面提出了一种基于对比学习的语义识别模型训练方法，所述方法包括：

获取待处理的原始句子文本；

根据所述原始句子文本中各个词汇的词性，在所述原始句子文本中确定N个候选词汇；

从所述N个候选词汇中选取M个词汇作为第一目标词汇以及选取T个词汇作为第二目标词汇，其中，N、M和T满足以下数值关系式：1＜T＜M＜N；

在所述原始句子文本中，对每一个所述第一目标词汇进行同义词替换，得到第一处理句子文本；

在所述原始句子文本中，对每一个所述第二目标词汇进行反义词替换，得到第二处理句子文本；

通过所述原始句子文本、所述第一处理句子文本和所述第二处理句子文本对初始的语义识别模型进行训练，以得到目标语义识别模型。

根据本申请一些实施例提供的基于对比学习的语义识别模型训练方法，所述通过所述原始句子文本、所述第一处理句子文本和所述第二处理句子文本对初始的语义识别模型进行训练，以得到目标语义识别模型，包括：

将所述原始句子文本、所述第一处理句子文本和所述第二处理句子文本分别输入到初始的语义识别模型，得到对应于所述原始句子文本的原始语义向量、对应于所述第一处理句子文本的第一处理语义向量和对应于所述第二处理句子文本的第二处理语义向量；

基于所述原始语义向量和所述第一处理语义向量计算第一损失值；

基于所述原始语义向量和所述第二处理语义向量计算第二损失值；

基于所述第一损失值和所述第二损失值确定是否满足预设的训练结束条件；

在不满足训练结束条件时，调整所述语义识别模型的模型参数，并通过所述原始句子文本、所述第一处理句子文本和所述第二处理句子文本继续对调整后的语义识别模型进行训练；

在满足训练结束条件时，将当前的语义识别模型作为目标语义识别模型。

根据本申请一些实施例提供的基于对比学习的语义识别模型训练方法，所述语义识别模型包括BERT编码网络和语义预测网络；

所述将所述原始句子文本、所述第一处理句子文本和所述第二处理句子文本分别输入到初始的语义识别模型，得到对应于所述原始句子文本的原始语义向量、对应于所述第一处理句子文本的第一处理语义向量和对应于所述第二处理句子文本的第二处理语义向量，包括：

将所述原始句子文本、所述第一处理句子文本和所述第二处理句子文本分别输入到BERT编码网络，得到对应于所述原始句子文本的原始句编码向量、对应于所述第一处理句子文本的第一处理句编码向量和对应于所述第二处理句子文本的第二处理句编码向量；其中，所述原始句编码向量、所述第一处理句编码向量和所述第二处理句编码向量分别包括多个token；

将所述原始句编码向量、所述第一处理句编码向量和所述第二处理句编码向量输入所述语义预测网络，得到对应于所述原始句子文本的原始语义向量、对应于所述第一处理句子文本的第一处理语义向量和对应于所述第二处理句子文本的第二处理语义向量。

根据本申请一些实施例提供的基于对比学习的语义识别模型训练方法，所述语义识别模型还包括token判别网络；

所述方法还包括：

将所述第一处理句编码向量和所述第二处理句编码向量分别输入到token判别网络，得到对应于所述第一处理句编码向量的第一token标签序列和对应于所述第二处理句编码向量的第二token标签序列，其中，所述第一token标签序列用于指示所述第一处理句编码向量中与所述原始句编码向量存在区别的token位置，所述第二token标签序列用于指示所述第二处理句编码向量中与所述原始句编码向量存在区别的token的位置；

在将所述原始句编码向量、所述第一处理句编码向量和所述第二处理句编码向量输入所述语义预测网络时，还将所述第一token标签序列和所述第二token标签序列输入所述语义预测网络，以使所述语义预测网络基于所述第一token标签序列和所述第二token标签序列输出原始句编码向量、第一处理语义向量和第二处理语义向量。

根据本申请一些实施例提供的基于对比学习的语义识别模型训练方法，所述基于所述第一损失值和所述第二损失值确定是否满足预设的训练结束条件，包括：

将所述第一损失值与最小化收敛值进行比较，以及将所述第二损失值与最大化收敛值进行比较；

在所述第一损失值小于等于最小化收敛值、且所述第二损失值大于等于最大化收敛值时，确定满足预设的训练结束条件。

根据本申请一些实施例提供的基于对比学习的语义识别模型训练方法，所述根据所述原始句子文本中各个词汇的词性，在所述原始句子文本中确定N个候选词汇，包括：

通过预训练好的词性标注模型对所述原始句子文本中的各个词汇进行词性标注，得到所述原始句子文本中各个词汇的词性；

在所述原始句子文本中，将词性为预设词性的词汇确定为候选词汇；

所述预设词性包括形容词和动词中的至少一项。

根据本申请一些实施例提供的基于对比学习的语义识别模型训练方法，所述从所述N个候选词汇中选取M个词汇作为第一目标词汇以及选取T个词汇作为第二目标词汇，包括：

按照预设第一比例从N个候选词汇中随机选取M个词汇作为第一目标词汇；以及，

按照预设第二比例从N个候选词汇中随机选取T个词汇作为第二目标词汇；

其中，所述第二比例小于所述第一比例。

为实现上述目的，本申请实施例的第二方面提出了一种基于对比学习的语义识别模型训练系统，所述系统包括：

获取模块，用于获取待处理的原始句子文本；

确定模块，用于根据所述原始句子文本中各个词汇的词性，在所述原始句子文本中确定N个候选词汇；

选取模块，用于从所述N个候选词汇中选取M个词汇作为第一目标词汇以及选取T个词汇作为第二目标词汇，其中，N、M和T满足以下数值关系式：1＜T＜M＜N；

第一替换处理模块，用于在所述原始句子文本中，对每一个所述第一目标词汇进行同义词替换，得到第一处理句子文本；

第二替换处理模块，用于在所述原始句子文本中，对每一个所述第二目标词汇进行反义词替换，得到第二处理句子文本；

训练模块，用于通过所述原始句子文本、所述第一处理句子文本和所述第二处理句子文本对初始的语义识别模型进行训练，以得到目标语义识别模型。

为实现上述目的，本申请实施例的第三方面提出了一种电子设备，包括：至少一个处理器；

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有计算机程序，当所述计算机程序被所述至少一个处理器执行时，使得所述至少一个处理器执行如上第一方面任一项实施例所述的基于对比学习的语义识别模型训练方法。

为实现上述目的，本申请实施例的第四方面提出了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现如上第一方面任一项实施例所述的基于对比学习的语义识别模型训练方法。

本申请实施例提出了一种基于对比学习的语义识别模型训练方法、系统、电子设备和计算机可读存储介质，根据所述原始句子文本中各个词汇的词性，在所述原始句子文本中确定N个候选词汇，然后从所述N个候选词汇中选取M个词汇作为第一目标词汇以及选取T个词汇作为第二目标词汇；在所述原始句子文本中对每一个所述第一目标词汇进行同义词替换，得到第一处理句子文本；以及，在所述原始句子文本中对每一个所述第二目标词汇进行反义词替换，得到第二处理句子文本。这里，所述原始句子文本和所述第一处理句子文本可以组成正文本对，所述原始句子文本和所述第二处理句子文本可以组成负文本对。本发明实施例目的是提供能够识别语义微小变化的对比学习方法，针对之前正负样本比较好区分的问题进行了改造，本实施例中，同义词替换的词汇数量大于反义词替换的词汇数量，目的是使得负样本相比正样本变化更小、更难被识别，但句子语义却发生了相反的变化。通过上述正负样本对训练得到的语义识别模型，能够识别句子微小变化带来语义的影响，同时微小变化产生的正负样本对区分更困难，使得模型能够学习到更丰富的知识，改进后的对比方法比传统的对比学习方法，效果提升很大。

附图说明

图1是本申请实施例的提供的一种基于对比学习的语义识别模型训练方法的流程示意图；

图2是图1中的步骤S120的子步骤示意图；

图3是本申请的一个实施例提供的分类网络训练流程示意图；

图4是图1中的步骤S160的子步骤示意图；

图5A、图5B是图4中的步骤S161的子步骤示意图；

图6是本申请的一个具体示例的流程示意图；

图7是本申请实施例的提供的一种基于对比学习的语义识别模型训练系统的结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

需要说明的是，除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

首先，对本申请中涉及的若干名词进行解析：

人工智能(Artificial Intelligence，AI)：是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学；人工智能是计算机科学的一个分支，人工智能企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能还是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

BERT(全称为Bidirectional Encoder Representation from Transformers)：是一个预训练的语言表征模型。它强调了不再像以往一样采用传统的单向语言模型或者把两个单向语言模型进行浅层拼接的方法进行预训练，而是采用新的Masked Language Model(MLM)，以致能生成深度的双向语言表征。

对比学习(Contrastive Learning)：是一种常用的自监督学习方法，着重于学习同类实例之间的共同特征，区分非同类实例之间的不同之处。与生成式学习相比，对比式学习不需要关注实例上繁琐的细节，只需要在抽象语义级别的特征空间上学会对数据的区分即可，因此模型以及其优化变得更加简单，且泛化能力更强。对比学习的目标是学习一个编码器，此编码器对同类数据进行相似的编码，并使不同类的数据的编码结果尽可能的不同，也就是说，其核心思想是缩小与正样本间的距离，扩大与负样本间的距离，使正样本与锚点的距离远远小于负样本与锚点的距离，(或使正样本与锚点的相似度远远大于负样本与锚点的相似度)，从而达到它们间原有空间分布的真实距离。

嵌入(Embedding)：Embedding是一种向量表征，是指用一个低维的向量表示一个物体，该物体可以是一个词，或是一个商品，或是一个电影等等；这个Embedding向量的性质是能使距离相近的向量对应的物体有相近的含义，比如Embedding(复仇者联盟)和Embedding(钢铁侠)之间的距离就会很接近，但Embedding(复仇者联盟)和Embedding(乱世佳人)的距离就会远一些。Embedding实质是一种映射，从语义空间到向量空间的映射，同时尽可能在向量空间保持原样本在语义空间的关系，如语义接近的两个词汇在向量空间中的位置也比较接近。Embedding能够用低维向量对物体进行编码还能保留其含义，常应用于机器学习，在机器学习模型构建过程中，通过把物体编码为一个低维稠密向量再传给DNN，以提高效率。

相关技术中，将对比学习应用到语义识别模型中，以训练语义识别模型来区分语义相似或者不同的文本句子时，遇到的困难较多，主要困难在于：一是文本对比学习的负样本对比较容易识别，不同文本表示的语义差别本身较大，仅通过文本长度即可区分出负样本对；其次是通过数据增强构造正样本对过程中可能出现假正例，因为往往改变文本的一个或多个词可能语义就发生了变化。基于以上，通过对比学习训练句子级的语义识别模型的效果并不好。

本申请实施例的主要目的在于提出一种基于对比学习的语义识别模型训练方法、装置、电子设备和计算机可读存储介质，旨在提升通过对比学习训练句子级的语义识别模型的效果。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本申请实施例提供的基于对比学习的语义识别模型训练方法，涉及人工智能及深度学习技术领域。本申请实施例提供的语义识别模型训练方法可应用于终端中，也可应用于服务器端中，还可以是运行于终端或服务器端中的软件。在一些实施例中，终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等；服务器端可以配置成独立的物理服务器，也可以配置成多个物理服务器构成的服务器集群或者分布式系统，还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN以及大数据和人工智能平台等基础云计算服务的云服务器；软件可以是实现语义识别模型训练方法的应用等，但并不局限于以上形式。

本申请可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

请参见图1，图1示出了本申请实施例的提出的一种基于对比学习的语义识别模型训练方法的流程示意图。如图1所示，本申请实施例提供的方法包括但不限于如下步骤：

步骤S110,获取待处理的原始句子文本。

可以理解的是，本申请实施例的语义识别模型用于对句子级的文本进行语义识别，具体应用时，可将句子文本输入至所述语义识别模型，以使所述语义识别模型输出表征句子文本语义的特征向量。

具体实现时，原始句子文本可以来源于互联网的网页文本数据，或者是论坛、贴吧、购物网站、门户网站等。该网页文本数据，也不限于网站上发布的内容数据，还可包括用户对发布内容的评论数据，等等。当然，应理解，网页文本数据不限于上述提到的数据；本申请实施例的批量文本语料，也不限于来自互联网的网页文本数据，例如还可以来源于电子字词典、论文期刊数据库，等等。

步骤S120,根据所述原始句子文本中各个词汇的词性，在所述原始句子文本中确定N个候选词汇。

可以理解的是，本申请实施例从所述原始句子文本中选取一部分词汇，用作后面的步骤的同义词替换/反义词替换，目标是对这部分词汇进行替换后，使得句子语义基本不变/句子语义相反。本申请实施例根据词性从原始句子文本中选取可替换的候选词汇。

请参见图2，步骤S120具体可以通过如下步骤来实现：

步骤S121，通过预训练好的词性标注模型对所述原始句子文本中的各个词汇进行词性标注，得到所述原始句子文本中各个词汇的词性；

步骤S122，在所述原始句子文本中，将词性为预设词性的词汇确定为候选词汇，其中，所述预设词性包括形容词和动词中的至少一项。

示例性的，所述词性标注模型具体可以包括分词网络和分类网络，其中，所述分词网络用于对原始句子文本进行分词处理，以获得多个词汇；所述分类网络用于对各个词汇进行词性分类处理，以获得各个词汇对应的词性。

具体实现时，可以将原始句子文本输入到分词网络中，以使分词网络输出分词序列，所述分词序列包含有多个词汇，这些词汇具体可以是单词、词组或者短语，但不限于此。

分类网络可基于分词网络输出的分词序列，对分词序列中的各个词汇进行词性分类，输出词性标注序列，该词性标注序列包含有多个词性标注，这里的多个词性标注与分词序列中的多个词汇为逐一对应关系。

举例来说，原始句子文本为“Batman is an fictional super hero writtenby”，将该原始句子文本输入到分词网络，获得分词序列“Batman-is-an fictional-super-hero-written-by”；接着将该分词序列输入至词性标注序列中，获得词性标注序列“名词-动词-形容词-形容词-形容词-名词-动词-副词”，基于该词性标注序列即能获知原始句子文本各个词汇的词性。

示例性的，词性标注模型中的分词网络可以采用现有的或者未来能够实现分词功能的系统。请参见图3，分类网络则可以通过如下步骤训练得到：

步骤S201，获取语料样本集，语料样本集包含有多个句子语料样本；

步骤S202，采用分词系统对句子语料样本进行分词，将所得的多个分词按语序组成分词序列后输入到初始的分类网络中；

步骤S203，基于分类网络输出的结果调整分类网络的参数，直至分类网络收敛。

可以理解的是，由于有些词汇在不同的语句中具有不同的词性，例如：“book”在句子“I have a book”中的词性为名词，在“I want to book a room”中的词性为动词。因此本申请实施例是将整个句子转换为分词序列后，利用分词序列对分类网络进行训练，使得分类网络能够基于整句学习各个词汇的词性，从而使得训练得到的分类网络输出的词性标注结果更为准确。

可以理解的是，本申请实施例从所述原始句子文本中选取一部分词汇，用作后面的步骤的同义词替换/反义词替换，目标是对这部分词汇进行替换后，使得句子语义基本不变/句子语义相反。因此，可以根据词性选取会对句子语义影响较大的词汇作为可替换的候选词汇。具体的，会对句子语义影响较大的词汇一般可以是形容词或者动词，因此可以将原始句子文本中的形容词和/或动词作为候选词汇。

步骤S130,从所述N个候选词汇中选取M个词汇作为第一目标词汇以及选取T个词汇作为第二目标词汇，其中，N、M和T满足以下数值关系式：1＜T＜M＜N。

可以理解的是，本申请实施例中，第一目标词汇用于进行同义词替换，以获得正样本；第二目标词汇用于进行反义词替换，以获得负样本。本申请实施例中，对正样本的期望是，正样本相比原始句子文本有较大的改变，但二者的语义要尽量接近；对负样本的期望是，负样本相比原始句子文本只有微小差别，但二者的语义要尽量相反。

为达到以上目的，步骤S130具体可以通过如下步骤来实现：

按照预设第一比例从N个候选词汇中随机选取M个词汇作为第一目标词汇，以及，按照预设第二比例从N个候选词汇中随机选取T个词汇作为第二目标词汇，其中，所述第二比例小于所述第一比例。

这里，基于候选词汇的数量N，按照预设第一比例确定M的数值，以及按照预设第二比例确定T的数值，这里，所述第二比例要小于所述第一比例，所以T的数值也比M的数值小。

步骤S140,在所述原始句子文本中，对每一个所述第一目标词汇进行同义词替换，得到第一处理句子文本。

举例来说，原始句子文本“Batman is an fictional super hero written by”经过同义词替换处理后，可得到第一处理句子文本“Batman is an imaginary super herocreated by”。

步骤S150,在所述原始句子文本中，对每一个所述第二目标词汇进行反义词替换，得到第二处理句子文本。

举例来说，原始句子文本“Batman is an fictional super hero written by”经过反义词替换处理后，可得到第二处理句子文本“Batman is an real-life super herowritten by”。

步骤S160,通过所述原始句子文本、所述第一处理句子文本和所述第二处理句子文本对初始的语义识别模型进行训练，以得到目标语义识别模型。

可以理解的是，所述原始句子文本和所述第一处理句子文本可以组成正文本对，所述原始句子文本和所述第二处理句子文本可以组成负文本对。本发明实施例目的是提供能够识别语义微小变化的对比学习方法，针对之前正负样本比较好区分的问题进行了改造，本实施例中，同义词替换的词汇数量大于反义词替换的词汇数量，目的是使得负样本相比正样本变化更小、更难被识别，但句子语义却发生了相反的变化。通过上述正负样本对训练得到的语义识别模型，能够识别句子微小变化带来语义的影响，同时微小变化产生的正负样本对区分更困难，使得模型能够学习到更丰富的知识，改进后的对比方法比传统的对比学习方法，效果提升很大。

请参见图4，步骤S160具体可以通过如下步骤来实现：

步骤S161,将所述原始句子文本、所述第一处理句子文本和所述第二处理句子文本分别输入到初始的语义识别模型，得到对应于所述原始句子文本的原始语义向量、对应于所述第一处理句子文本的第一处理语义向量和对应于所述第二处理句子文本的第二处理语义向量。

步骤S162,基于所述原始语义向量和所述第一处理语义向量计算第一损失值；

步骤S163,基于所述原始语义向量和所述第二处理语义向量计算第二损失值；

步骤S164,基于所述第一损失值和所述第二损失值确定是否满足预设的训练结束条件；

步骤S165,在不满足训练结束条件时，调整所述语义识别模型的模型参数，并通过所述原始句子文本、所述第一处理句子文本和所述第二处理句子文本继续对调整后的语义识别模型进行训练；

步骤S166,在满足训练结束条件时，将当前的语义识别模型作为目标语义识别模型。

可以理解的是，本申请实施例的训练目标是使正样本对的向量距离尽量小，负样本对的向量距离进行大。基于此，步骤S164的具体实现过程如下：

作为示例，第一损失值的计算过程如下：根据欧式距离计算公式计算所述原始语义向量和所述第一处理语义向量间的欧式距离，将所述原始语义向量和所述第一处理语义向量间的欧式距离作为第一损失值。

作为示例，第二损失值的计算过程如下：根据欧式距离计算公式计算所述原始语义向量和所述第二处理语义向量间的欧式距离，将所述原始语义向量和所述第二处理语义向量间的欧式距离作为第二损失值。

本申请实施例的训练目标是使第一损失值最小化，满足最小化收敛值；使第二损失值最大化，满足最大化收敛值；在所述第一损失值小于等于最小化收敛值、且所述第二损失值大于等于最大化收敛值时，结束模型训练，得到目标语义识别模型。

作为示例，步骤S161中的所述语义识别模型可以包括BERT编码网络和语义预测网络。请参见图5A，步骤S161具体可以通过如下步骤实现：

步骤S1611，将所述原始句子文本、所述第一处理句子文本和所述第二处理句子文本分别输入到BERT编码网络，得到对应于所述原始句子文本的原始句编码向量、对应于所述第一处理句子文本的第一处理句编码向量和对应于所述第二处理句子文本的第二处理句编码向量；其中，所述原始句编码向量、所述第一处理句编码向量和所述第二处理句编码向量可理解为分别包括多个token的嵌入Embedding；

步骤S1612，将所述原始句编码向量、所述第一处理句编码向量和所述第二处理句编码向量输入所述语义预测网络，得到对应于所述原始句子文本的原始语义向量、对应于所述第一处理句子文本的第一处理语义向量和对应于所述第二处理句子文本的第二处理语义向量。

可以理解的是，本申请实施例通过BERT编码网络输出原始句编码向量、第一处理句编码向量和第二处理句编码向量，然后通过语义预测网络学习原始句编码向量、第一处理句编码向量和第二处理句编码向量之间的区别，输出对应的原始语义向量、第一处理语义向量和第二处理语义向量。

可选的，所述语义识别模型还包括token判别网络。请参见图5B，在所述语义识别模型还包括token判别网络时，在步骤S1611之后，还包括如下步骤：

步骤S1613，将所述第一处理句编码向量和所述第二处理句编码向量分别输入到token判别网络，得到对应于所述第一处理句编码向量的第一token标签序列和对应于所述第二处理句编码向量的第二token标签序列，其中，所述第一token标签序列用于指示所述第一处理句编码向量中与所述原始句编码向量存在区别的token位置，所述第二token标签序列用于指示所述第二处理句编码向量中与所述原始句编码向量存在区别的token的位置；

步骤S1614，在将所述原始句编码向量、所述第一处理句编码向量和所述第二处理句编码向量输入所述语义预测网络时，还将所述第一token标签序列和所述第二token标签序列输入所述语义预测网络，以使所述语义预测网络基于所述第一token标签序列和所述第二token标签序列输出原始句编码向量、第一处理语义向量和第二处理语义向量。

本申请实施例，将所述原始句编码向量和所述第一处理句编码向量作为正样本对，将所述原始句编码向量和所述第二处理句编码向量作为负样本对，将第一token标签序列作为正样本辅助知识，将所述第二token标签序列作为负样本辅助知识，所述语义预测网络在所述第一token标签序列和所述第二token标签序列的辅助下，输出原始句编码向量、第一处理语义向量和第二处理语义向量。

可以理解的是，本发明实施例为提高模型对比学习的效果，还将指示正/负样本对中两个样本的token区别的token标签序列作为辅助知识，输入到BERT编码网络中，使得BERT编码网络快速识别到样本对间的区别，提高训练效率。

请参见图6，下面通过具体示例对本发明提供的基于对比学习的语义识别模型训练方法进行说明。

步骤S301，获取待处理的原始句子文本“Batman is an fictional super herowritten by”；

步骤S302，通过预训练好的词性标注模型对所述原始句子文本中的各个词汇进行词性标注，得到所述原始句子文本中各个词汇的词性为“名词-动词-形容词-形容词-形容词-名词-动词-副词”；

步骤S303，在所述原始句子文本中，将词性为形容词或动词的词汇确定为候选词汇；

步骤S304，按照预设第一比例从获得的候选词汇中随机选取第一目标词汇，以及，按照预设第二比例从获得的候选词汇中随机选取第二目标词汇，其中，所述第二比例小于所述第一比例；

步骤S305，在所述原始句子文本中，对每一个所述第一目标词汇进行同义词替换，得到第一处理句子文本，本示例中，将原始句子文本“Batman is an fictional superhero written by”经过同义词替换处理后，得到第一处理句子文本“Batman is animaginary super hero created by”。

步骤S306，在所述原始句子文本中，对每一个所述第二目标词汇进行反义词替换，得到第二处理句子文本，本示例中，原始句子文本“Batman is an fictional super herowritten by”经过反义词替换处理后，得到第二处理句子文本“Batman is an real-lifesuper hero written by”。

步骤S307，将所述原始句子文本、所述第一处理句子文本和所述第二处理句子文本分别输入到BERT编码网络，得到对应于所述原始句子文本的原始句编码向量、对应于所述第一处理句子文本的第一处理句编码向量和对应于所述第二处理句子文本的第二处理句编码向量；其中，所述原始句编码向量、所述第一处理句编码向量和所述第二处理句编码向量分别包括多个token；

步骤S308，将所述第一处理句编码向量和所述第二处理句编码向量分别输入到token判别网络，得到对应于所述第一处理句编码向量的第一token标签序列和对应于所述第二处理句编码向量的第二token标签序列，其中，所述第一token标签序列用于指示所述第一处理句编码向量中与所述原始句编码向量存在区别的token位置，所述第二token标签序列用于指示所述第二处理句编码向量中与所述原始句编码向量存在区别的token的位置；

步骤S309，将上述所述原始句编码向量、所述第一处理句编码向量、所述第二处理句编码向量、正样本辅助知识和负样本辅助知识输入到语义预测网络，使得语义预测网络在正样本辅助知识和负样本辅助知识的辅助下，输出对应的原始语义向量、第一处理语义向量和第二处理语义向量。

步骤S310，基于原始语义向量和第一处理语义向量计算第一损失值，基于原始语义向量和第二处理语义向量计算第二损失值，以及基于所述第一损失值和所述第二损失值调整模型参数，直至满足预设模型训练结束条件，其中，模型训练结束条件为：所述第一损失值小于等于最小化收敛值、且所述第二损失值大于等于最大化收敛值，训练的目标是尽可能缩小原始语义向量和第一处理语义向量间的距离,尽可能扩大原始语义向量和第二处理语义向量间的距离。

请参见图7，本申请实施例提出了一种基于对比学习的语义识别模型训练系统，所述系统包括：

获取模块，用于获取待处理的原始句子文本；

本申请实施例还提出了一种电子设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有计算机程序，当所述计算机程序被所述至少一个处理器执行时，使得所述至少一个处理器执行如上任一项实施例所述的基于对比学习的语义识别模型训练方法。

本申请实施例还提出了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现如上任一项实施例所述的基于对比学习的语义识别模型训练方法。

上述各实施例可以结合使用，不同实施例之间名称相同的模块可相同可不同。

上述对本申请特定实施例进行了描述，其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，附图中描绘的过程不一定必须按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本申请中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统、设备、计算机可读存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本申请实施例提供的系统、设备、计算机可读存储介质与方法是对应的，因此，系统、设备、计算机可读存储介质也具有与对应方法类似的有益技术效果，由于上面已经对方法的有益技术效果进行了详细说明，因此，这里不再赘述对应系统、设备、计算机可读存储介质的有益技术效果。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本申请实施例可提供为方法、系统、或计算机程序产品。因此，本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本申请实施例中，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示单独存在A、同时存在A和B、单独存在B的情况。其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项”及其类似表达，是指的这些项中的任意组合，包括单项或复数项的任意组合。例如，a，b和c中的至少一项可以表示：a，b，c，a和b，a和c，b和c或a和b和c，其中a，b，c可以是单个，也可以是多个。

本申请实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本申请中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种基于对比学习的语义识别模型训练方法，其特征在于，所述方法包括：

获取待处理的原始句子文本；

2.根据权利要求1所述的方法，其特征在于，所述通过所述原始句子文本、所述第一处理句子文本和所述第二处理句子文本对初始的语义识别模型进行训练，以得到目标语义识别模型，包括：

3.根据权利要求2所述的方法，其特征在于，所述语义识别模型包括BERT编码网络和语义预测网络；

4.根据权利要求3所述的方法，其特征在于，所述语义识别模型还包括token判别网络；

所述方法还包括：

5.根据权利要求2所述的方法，其特征在于，所述基于所述第一损失值和所述第二损失值确定是否满足预设的训练结束条件，包括：

6.根据权利要求1所述的方法，其特征在于，所述根据所述原始句子文本中各个词汇的词性，在所述原始句子文本中确定N个候选词汇，包括：

所述预设词性包括形容词和动词中的至少一项。

7.根据权利要求1所述的方法，其特征在于，所述从所述N个候选词汇中选取M个词汇作为第一目标词汇以及选取T个词汇作为第二目标词汇，包括：

其中，所述第二比例小于所述第一比例。

8.一种基于对比学习的语义识别模型训练系统，其特征在于，所述系统包括：

获取模块，用于获取待处理的原始句子文本；

9.一种电子设备，其特征在于，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有计算机程序，当所述计算机程序被所述至少一个处理器执行时，使得所述至少一个处理器执行权利要求1至7中任一项所述的基于对比学习的语义识别模型训练方法。

10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的基于对比学习的语义识别模型训练方法。