CN112949687B

CN112949687B - 差异识别模型的训练方法及装置

Info

Publication number: CN112949687B
Application number: CN202110137593.6A
Authority: CN
Inventors: 张海超; 杨林; 胡懋地
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2021-02-01
Filing date: 2021-02-01
Publication date: 2022-05-31
Anticipated expiration: 2041-02-01
Also published as: CN112949687A

Abstract

本公开提供了一种差异识别模型的训练方法及装置。方法包括：获取训练样本；训练样本包括成对的第一菜品的第一菜品名称和第二菜品的第二菜品名称；基于预先构建的菜品知识图谱，获取第一菜品名称的第一菜品属性及第二菜品名称的第二菜品属性；将第一菜品名称、第二菜品名称、第一菜品属性和第二菜品属性输入至初始差异识别模型，获取由初始差异识别模型输出的第一菜品和第二菜品对应的预测名称差异和预测属性差异；根据初始名称差异、预测名称差异、初始属性差异和预测属性差异，计算得到初始差异识别模型对应的损失值；在损失值处于预设范围内的情况下，将训练后的初始差异识别模型作为目标差异识别模型。本公开可以提高菜品差异识别的准确度。

Description

差异识别模型的训练方法及装置

技术领域

本公开的实施例涉及模型训练技术领域，尤其涉及一种差异识别模型的训练方法及装置。

背景技术

目前，在外卖系统中的菜品数量较多，也出现了各式各样的菜品名称，不同的菜品名称有时最终烹饪的餐食却是一样的，相同的菜品名称往往也有不同做法和口味。用户在面对菜单里的菜品时，往往需要甄别菜品之间的差异。

在某些外卖应用程序上的菜品名称是由商家上传和填写的，另外一些外卖应用程序上的菜品名称由消费者或商家填写的，二者之间往往存在差异。这种差异会对菜品供给、消费者用户体验和商家运营等方面造成困扰，有必要对二者进行菜品匹配对齐，更进一步的判断出菜品之间的差异点。

现有方案在对菜品或食物的分类时，数据来源为菜品名称或者食物图像，模型多为经典的文本分类模型和图像分类模型或两者的融合。现有对菜品处理的技术方案主要集中在菜品分类识别上，将菜品划分到相关类目或者打上相关标签，此种方式菜品差异识别的准确度较低。

发明内容

本公开的实施例提供一种差异识别模型的训练方法及装置，用以提高菜品差异识别的准确度。

根据本公开的实施例的第一方面，提供了一种差异识别模型的训练方法，包括：

获取训练样本；所述训练样本包括成对的第一菜品的第一菜品名称和第二菜品的第二菜品名称；

基于预先构建的菜品知识图谱，获取所述第一菜品名称对应的第一菜品属性，及所述第二菜品名称对应的第二菜品属性；所述第一菜品和所述第二菜品对应于一个初始名称差异和一个初始属性差异；

将所述第一菜品名称、所述第二菜品名称、所述第一菜品属性和所述第二菜品属性输入至初始差异识别模型，并获取由所述初始差异识别模型输出的所述第一菜品和所述第二菜品对应的预测名称差异和预测属性差异；

根据所述初始名称差异、所述预测名称差异、所述初始属性差异和所述预测属性差异，计算得到所述初始差异识别模型对应的损失值；

在所述损失值处于预设范围内的情况下，将训练后的初始差异识别模型作为目标差异识别模型。

可选地，所述初始差异识别模型包括：输入层、编码层和匹配层，所述获取由所述初始差异识别模型输出的所述第一菜品和所述第二菜品对应的预测名称差异和预测属性差异，包括：

调用所述输入层获取所述第一菜品名称和所述第一菜品属性对应的第一菜品向量，及所述第二菜品名称和所述第二菜品属性对应的第二菜品向量；

调用所述编码层对所述第一菜品向量进行编码处理，得到所述第一菜品对应的第一编码向量，并对所述第二菜品向量进行编码处理，得到所述第二菜品对应的第二编码向量；

调用所述匹配层对所述第一编码向量和所述第二编码向量进行差异识别，以确定所述第一菜品和所述第二菜品对应的预测名称差异和预测属性差异。

可选地，所述调用所述输入层获取所述第一菜品名称和所述第一菜品属性对应的第一菜品向量，及所述第二菜品名称和所述第二菜品属性对应的第二菜品向量，包括：

调用所述输入层对所述第一菜品名称和所述第一菜品属性进行处理，得到所述第一菜品名称对应的第一名称向量，及所述第一菜品属性对应的第一属性向量；

调用所述输入层对所述第二菜品名称和所述第二菜品属性进行处理，得到所述第二菜品名称对应的第二名称向量，及所述第二菜品属性对应的第二属性向量；

调用所述输入层将所述第一名称向量和所述第一属性向量进行向量拼接处理，得到所述第一菜品向量；

调用所述输入层将所述第二名称向量和所述第二属性向量进行向量拼接处理，得到所述第二菜品向量。

可选地，所述根据所述初始名称差异、所述预测名称差异、所述初始属性差异和所述预测属性差异，计算得到所述初始差异识别模型对应的损失值，包括：

根据所述初始名称差异和所述预测名称差异，计算得到第一损失值；

根据所述初始属性差异和所述预测属性差异，计算得到第二损失值；

根据所述第一损失值、所述第二损失值和损失权重，计算得到所述初始差异识别模型对应的损失值。

可选地，在所述将训练后的初始差异识别模型作为目标差异识别模型之后，还包括：

获取第一待识别菜品的第三菜品名称和第二待识别菜品的第四菜品名称；

将所述第三菜品名称和所述第四菜品名称输入至所述目标差异识别模型，并由所述目标差异识别模型获取所述第三菜品名称对应的第三菜品属性，及所述第四菜品名称对应的第四菜品属性；

调用所述目标差异识别模型根据所述第三菜品名称、所述第四菜品名称、所述第三菜品属性和所述第四菜品属性，预测得到所述第一待识别菜品和所述第二待识别菜品对应的差异识别结果。

根据本公开的实施例的第二方面，提供了一种差异识别模型的训练装置，包括：

训练样本获取模块，用于获取训练样本；所述训练样本包括成对的第一菜品的第一菜品名称和第二菜品的第二菜品名称；

菜品属性获取模块，用于基于预先构建的菜品知识图谱，获取所述第一菜品名称对应的第一菜品属性，及所述第二菜品名称对应的第二菜品属性；所述第一菜品和所述第二菜品对应于一个初始名称差异和一个初始属性差异；

预测差异获取模块，用于将所述第一菜品名称、所述第二菜品名称、所述第一菜品属性和所述第二菜品属性输入至初始差异识别模型，并获取由所述初始差异识别模型输出的所述第一菜品和所述第二菜品对应的预测名称差异和预测属性差异；

损失值计算模块，用于根据所述初始名称差异、所述预测名称差异、所述初始属性差异和所述预测属性差异，计算得到所述初始差异识别模型对应的损失值；

目标模型获取模块，用于在所述损失值处于预设范围内的情况下，将训练后的初始差异识别模型作为目标差异识别模型。

可选地，所述初始差异识别模型包括：输入层、编码层和匹配层，所述预测差异获取模块包括：

菜品向量获取单元，用于调用所述输入层获取所述第一菜品名称和所述第一菜品属性对应的第一菜品向量，及所述第二菜品名称和所述第二菜品属性对应的第二菜品向量；

编码向量获取单元，用于调用所述编码层对所述第一菜品向量进行编码处理，得到所述第一菜品对应的第一编码向量，并对所述第二菜品向量进行编码处理，得到所述第二菜品对应的第二编码向量；

预测差异确定单元，用于调用所述匹配层对所述第一编码向量和所述第二编码向量进行差异识别，以确定所述第一菜品和所述第二菜品对应的预测名称差异和预测属性差异。

可选地，所述菜品向量获取单元包括：

第一属性向量获取子单元，用于调用所述输入层对所述第一菜品名称和所述第一菜品属性进行处理，得到所述第一菜品名称对应的第一名称向量，及所述第一菜品属性对应的第一属性向量；

第二属性向量获取子单元，用于调用所述输入层对所述第二菜品名称和所述第二菜品属性进行处理，得到所述第二菜品名称对应的第二名称向量，及所述第二菜品属性对应的第二属性向量；

第一菜品向量获取子单元，用于调用所述输入层将所述第一名称向量和所述第一属性向量进行向量拼接处理，得到所述第一菜品向量；

第二菜品向量获取子单元，用于调用所述输入层将所述第二名称向量和所述第二属性向量进行向量拼接处理，得到所述第二菜品向量。

可选地，所述损失值计算模块包括：

第一损失值计算单元，用于根据所述初始名称差异和所述预测名称差异，计算得到第一损失值；

第二损失值计算单元，用于根据所述初始属性差异和所述预测属性差异，计算得到第二损失值；

损失值计算单元，用于根据所述第一损失值、所述第二损失值和损失权重，计算得到所述初始差异识别模型对应的损失值。

可选地，还包括：

菜品名称获取模块，用于获取第一待识别菜品的第三菜品名称和第二待识别菜品的第四菜品名称；

目标菜品属性获取模块，用于将所述第三菜品名称和所述第四菜品名称输入至所述目标差异识别模型，并由所述目标差异识别模型获取所述第三菜品名称对应的第三菜品属性，及所述第四菜品名称对应的第四菜品属性；

差异识别结果获取模块，用于调用所述目标差异识别模型根据所述第三菜品名称、所述第四菜品名称、所述第三菜品属性和所述第四菜品属性，预测得到所述第一待识别菜品和所述第二待识别菜品对应的差异识别结果。

根据本公开的实施例的第三方面，提供了一种电子设备，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现上述任一项所述的差异识别模型的训练方法。

根据本公开的实施例的第四方面，提供了一种可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述任一项所述的差异识别模型的训练方法。

本公开的实施例提供了一种差异识别模型的训练方法及装置，通过获取训练样本，训练样本包括成对的第一菜品的第一菜品名称和第二菜品的第二菜品名称，基于预先构建的菜品知识图谱，获取第一菜品名称对应的第一菜品属性，及第二菜品名称对应的第二菜品属性，第一菜品和第二菜品对应于一个初始名称差异和一个初始属性差异，将第一菜品名称、第二菜品名称、第一菜品属性和第二菜品属性输入至初始差异识别模型，并获取由初始差异识别模型输出的第一菜品和第二菜品对应的预测名称差异和预测属性差异，根据初始名称差异、预测名称差异、初始属性差异和预测属性差异，计算得到初始差异识别模型对应的损失值，在损失值处于预设范围内的情况下，将训练后的初始差异识别模型作为目标差异识别模型。本公开的实施例通过在模型训练过程中结合菜品知识图谱获取菜品的属性信息，能够提高模型后续菜品识别中发掘出菜品在具体属性上的差异，提高了菜品差异识别的准确度。

附图说明

为了更清楚地说明本公开的实施例的技术方案，下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的实施例的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开的实施例提供的一种差异识别模型的训练方法的步骤流程图；

图2为本公开的实施例提供的另一种差异识别模型的训练方法的步骤流程图；

图2a为本公开的实施例提供的一种菜品属性标签的示意图；

图2b为本公开的实施例提供的一种差异识别模型架构的示意图；

图3为本公开的实施例提供的一种差异识别模型的训练装置的结构示意图；

图4为本公开的实施例提供的另一种差异识别模型的训练装置的结构示意图。

具体实施方式

下面将结合本公开的实施例中的附图，对本公开的实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开的实施例一部分实施例，而不是全部的实施例。基于本公开的实施例中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开的实施例保护的范围。

实施例一

参照图1，示出了本公开的实施例提供的一种差异识别模型的训练方法的步骤流程图，如图1所示，该方法具体可以包括如下步骤：

步骤101：获取训练样本；所述训练样本包括成对的第一菜品的第一菜品名称和第二菜品的第二菜品名称。

本公开的实施例可以应用于结合菜品知识图谱对菜品差异识别模型进行训练的场景中。

训练样本是指用于对差异识别模型进行训练的样本，在本实施中，训练样本可以包括成对的第一菜品的第一菜品名称和第二菜品的第二菜品名称。例如，“黄焖鸡米饭”和“鸡公煲”可以作为一个训练样本等。

在获取训练样本之后，执行步骤102。

步骤102：基于预先构建的菜品知识图谱，获取所述第一菜品名称对应的第一菜品属性，及所述第二菜品名称对应的第二菜品属性；所述第一菜品和所述第二菜品对应于一个初始名称差异和一个初始属性差异。

菜品知识图谱是指预先构建的与菜品关联的知识图谱，在菜品知识图谱中保存有每个菜品的菜品名称对应的菜品属性标签，菜品属性标签是指用于指示菜品的属性的标签，如图2a所示，菜品属性标签可以包括：菜系(如中餐、西餐、日料料理等)、口味(酸、甜、辣等)、食材(如蔬菜、水果、肉类等)、制作方法(炒、焖、炖等)等。

第一菜品属性是指第一菜品的菜品属性。

第二菜品属性是指第二菜品的菜品属性。

在获取训练样本之后，可以根据第一菜品名称从菜品知识图谱中查询第一菜品名称对应的菜品属性，以作为第一菜品属性，并根据第二菜品名称从菜品知识图谱中查询第二菜品名称对应的菜品属性，以作为第二菜品属性。

初始名称差异是指用于指示第一菜品名称和第二菜品名称之间的名称差异程度的值。

初始属性差异是指用于指示第一菜品属性和第二菜品之间的属性差异程度的值。

在获取第一菜品名称、第二菜品名称、第一菜品属性和第二菜品属性之后，可以由业务人员为第一菜品名称和第二菜品名称赋予一个名称差异值，即初始名称差异，并由业务人员为第一菜品属性和第二菜品属性赋予一个属性差异值，即初始属性差异。

在基于预先构建的菜品知识图谱，获取第一菜品名称对应的第一菜品属性，及第二菜品名称对应的第二菜品属性之后，执行步骤103。

步骤103：将所述第一菜品名称、所述第二菜品名称、所述第一菜品属性和所述第二菜品属性输入至初始差异识别模型，并获取由所述初始差异识别模型输出的所述第一菜品和所述第二菜品对应的预测名称差异和预测属性差异。

初始差异识别模型是指还未进行训练的用于对两菜品之间的差异进行识别的模型。

预测名称差异是指由初始差异识别模型预测得到的第一菜品名称和第二菜品名称之间的差异值，即该预测名称差异可以用于指示第一菜品名称和第二菜品名称之间的差异程度。

预测属性差异是指由初始差异识别模型预测得到的第一菜品属性和第二菜品属性之间的差异值，即该预测属性差异可以用于指示第一菜品属性和第二菜品属性之间的差异程度。

在获取第一菜品名称、第二菜品名称、第一菜品属性和第二菜品属性之后，可以将第一菜品名称、第二菜品名称、第一菜品属性和第二菜品属性输入至初始差异识别模型，并由初始差异识别模型根据第一菜品名称、第二菜品名称、第一菜品属性和第二菜品属性，预测得到第一菜品名称和第二菜品名称之间的差异值，即预测名称差异，并预测得到第一菜品属性和第二菜品属性之间的差异值，即预测属性差异。

在将第一菜品名称、第二菜品名称、第一菜品属性和第二菜品属性输入至初始差异识别模型，并获取由初始差异识别模型输出的第一菜品和第二菜品对应的预测名称差异和预测属性差异之后，执行步骤104。

步骤104：根据所述初始名称差异、所述预测名称差异、所述初始属性差异和所述预测属性差异，计算得到所述初始差异识别模型对应的损失值。

在获取到预测名称差异和预测属性差异之后，可以根据初始名称差异、预测名称差异、初始属性差异和预测属性差异，计算得到初始差异识别模型对应的损失值，具体地，可以根据初始名称差异和预测名称差异，计算得到名称差异对应的损失值，根据初始属性差异和预测属性差异，计算得到属性差异对应的损失值，进而，可以结合两个损失值计算出初始差异识别模型对应的损失值，具体地，将在下述实施例二中进行详细描述，本公开的实施例在此不再加以赘述。

在根据初始名称差异、预测名称差异、初始属性差异和预测属性差异计算得到初始差异识别模型对应的损失值之后，执行步骤105。

步骤105：在所述损失值处于预设范围内的情况下，将训练后的初始差异识别模型作为目标差异识别模型。

预设范围是指由业务人员预先设置的用于指示差异识别模型是否训练完成的范围。

在计算得到初始差异识别模型对应的损失值之后，可以判断损失值是否处于预设范围内。

若该损失值处于预设范围之外，表示初始差异识别模型训练还未完成，此时，可以获取更多的训练样本，执行上述训练过程。

若该损失值处于预设范围之内，表示初始差异识别模型已经训练完成，此时，可以将训练后的初始差异识别模型作为目标差异识别模型，该目标差异识别模型可以用于进行后续的菜品差异的识别。

本公开的实施例通过在模型训练过程中结合菜品知识图谱获取菜品的属性信息，能够提高模型后续菜品识别中发掘出菜品在具体属性上的差异，提高了菜品差异识别的准确度。

本公开的实施例提供的差异识别模型的训练方法，通过获取训练样本，训练样本包括成对的第一菜品的第一菜品名称和第二菜品的第二菜品名称，基于预先构建的菜品知识图谱，获取第一菜品名称对应的第一菜品属性，及第二菜品名称对应的第二菜品属性，第一菜品和第二菜品对应于一个初始名称差异和一个初始属性差异，将第一菜品名称、第二菜品名称、第一菜品属性和第二菜品属性输入至初始差异识别模型，并获取由初始差异识别模型输出的第一菜品和第二菜品对应的预测名称差异和预测属性差异，根据初始名称差异、预测名称差异、初始属性差异和预测属性差异，计算得到初始差异识别模型对应的损失值，在损失值处于预设范围内的情况下，将训练后的初始差异识别模型作为目标差异识别模型。本公开的实施例通过在模型训练过程中结合菜品知识图谱获取菜品的属性信息，能够提高模型后续菜品识别中发掘出菜品在具体属性上的差异，提高了菜品差异识别的准确度。

实施例二

参照图2，示出了本公开的实施例提供的另一种差异识别模型的训练方法的步骤流程图，如图2所示，该方法具体可以包括如下步骤：

步骤201：获取训练样本；所述训练样本包括成对的第一菜品的第一菜品名称和第二菜品的第二菜品名称。

在获取训练样本之后，执行步骤202。

步骤202：基于预先构建的菜品知识图谱，获取所述第一菜品名称对应的第一菜品属性，及所述第二菜品名称对应的第二菜品属性；所述第一菜品和所述第二菜品对应于一个初始名称差异和一个初始属性差异。

第一菜品属性是指第一菜品的菜品属性。

第二菜品属性是指第二菜品的菜品属性。

在基于预先构建的菜品知识图谱，获取第一菜品名称对应的第一菜品属性，及第二菜品名称对应的第二菜品属性之后，执行步骤203。

步骤203：调用所述输入层获取所述第一菜品名称和所述第一菜品属性对应的第一菜品向量，及所述第二菜品名称和所述第二菜品属性对应的第二菜品向量。

在本实施例中，初始差异识别模型可以包括输入层、编码层和匹配层，如图2b所示，Embedding Layer为输入层，Encoder Layer为编码层，Match Layer为匹配层。

第一菜品向量是指用于指示第一菜品名称和第一菜品属性的向量。

第二菜品向量是指用于指示第二菜品名称和第二菜品属性的向量。

在获取第一菜品名称对应的第一菜品属性，及第二菜品名称对应的第二菜品属性之后，可以将第一菜品名称、第二菜品名称、第一菜品属性和第二菜品属性输入至初始差异识别模型，此时，可以调用输入层获取第一菜品名称和第一菜品属性对应的第一菜品向量，并获取第二菜品名称和第二属性对应的第二菜品向量。

对于获取第一菜品向量和第二菜品向量的详细过程可以结合下述具体实现方式进行详细描述。

在本公开的实施例的一种具体实现方式中，上述步骤203可以包括：

子步骤A1：调用所述输入层对所述第一菜品名称和所述第一菜品属性进行处理，得到所述第一菜品名称对应的第一名称向量，及所述第一菜品属性对应的第一属性向量。

在本实施例中，第一名称向量是指第一菜品名称对应的向量。

第一属性向量是指第一菜品属性对应的向量。

在将第一菜品名称和第一菜品属性输入至初始差异识别模型之后，可以调用输入层将第一菜品名称和第一菜品属性映射至特定维度的向量，向量通过模型训练或预训练模型得到。

子步骤A2：调用所述输入层对所述第二菜品名称和所述第二菜品属性进行处理，得到所述第二菜品名称对应的第二名称向量，及所述第二菜品属性对应的第二属性向量。

第二名称向量是指第二菜品名称对应的向量。

第二属性向量是指第二菜品属性对应的向量。

在将第二菜品名称和第二菜品属性输入至初始差异识别模型之后，可以调用输入层将第二菜品名称和第二菜品属性映射至特定维度的向量，向量通过模型训练或预训练模型得到。

子步骤A3：调用所述输入层将所述第一名称向量和所述第一属性向量进行向量拼接处理，得到所述第一菜品向量。

在获取第一名称向量和第一属性向量之后，可以调用输入层将第一名称向量和第一属性向量进行向量拼接处理，从而可以得到第一菜品向量。

子步骤A4：调用所述输入层将所述第二名称向量和所述第二属性向量进行向量拼接处理，得到所述第二菜品向量。

在获取第二名称向量和第二属性向量之后，可以调用输入层将第二名称向量和第二属性向量进行向量拼接处理，从而可以得到第二菜品向量。

在调用输入层获取第一菜品名称和第一菜品属性对应的第一菜品向量，及第二菜品名称和第二菜品属性对应的第二菜品向量之后，执行步骤204。

步骤204：调用所述编码层对所述第一菜品向量进行编码处理，得到所述第一菜品对应的第一编码向量，并对所述第二菜品向量进行编码处理，得到所述第二菜品对应的第二编码向量。

第一编码向量是指对第一菜品向量进行编码得到的编码向量。

第二编码向量是指对第二菜品向量进行编码得到的编码向量。

在获取到第一菜品向量和第二菜品向量之后，可以调用编码层对第一菜品向量进行编码处理，得到第一菜品对应的第一编码向量，并调用编码层对第二菜品向量进行编码处理，得到第二菜品对应的第二编码向量。

在本实施例中，编码层会将输入层输出的向量(即第一菜品向量和第二菜品向量)为进行编码处理，编码层采用Transformer Encoder。Transformer Encoder结构包括Multi-head attention、全连接前馈网络和残差连接。

在调用编码层对第一菜品向量进行编码处理得到第一菜品对应的第一编码向量，并对第二菜品向量进行编码处理得到第二菜品对应的第二编码向量之后，执行步骤205。

步骤205：调用所述匹配层对所述第一编码向量和所述第二编码向量进行差异识别，以确定所述第一菜品和所述第二菜品对应的预测名称差异和预测属性差异。

在本示例中，匹配层(Match Layer)主要包括Multi-head attention层、MLP多层感知器和多任务匹配的目标函数，其中，Multi-head attention层的作用是通过对两菜品之间的交互，提高对菜品信息的捕获能力：

food_att_1＝Multihead(food_en_1，food_en_2，food_en_2)

food_att_2＝Multihead(food_en_2，food_en_1，food_en_1)

其中，food_en_1和food_en_2分别为第一编码向量和第二编码向量。

得到交互后的两菜品的表示后，进行元素级相加操作，并输入到MLP多层感知器，从可以由MLP多层感知器确定第一菜品和第二菜品对应的预测名称差异和预测属性差异。

在调用匹配层对第一编码向量和第二编码向量进行差异识别确定出第一菜品和第二菜品对应的预测名称差异和预测属性差异之后，执行步骤206和步骤207。

步骤206：根据所述初始名称差异和所述预测名称差异，计算得到第一损失值。

第一损失值是指初始名称差异和预测名称差异对应的名称差异损失值。

在获取到初始名称差异和预测名称差异之后，可以根据初始名称差异和预测名称差异，计算得到第一损失值，记为Loss-name_match。

步骤207：根据所述初始属性差异和所述预测属性差异，计算得到第二损失值。

第二损失值是指初始属性差异和预测属性差异对应的属性差异损失值。

在获取到初始属性差异和预测属性差异之后，可以根据初始属性差异和预测属性差异，计算得到第二损失值，记为Loss-category_match。

步骤208：根据所述第一损失值、所述第二损失值和损失权重，计算得到所述初始差异识别模型对应的损失值。

损失权重是指由业务人员预先设置的用于对菜品名称损失值和菜品属性损失值进行加权处理的权重，对于损失权重的具体数值可以根据业务需求而定，本实施例对此不加以限制。

在计算得到第一损失值和第二损失值之后，可以根据第一损失值、第二损失值和损失权重，共同计算得到初始差异识别模型对应的损失值，具体地，可以如下述公式(1)所示：

Loss＝aLoss-name_match+(1-a)Loss-category_match (1)

上述公式(1)中，a即为损失权重。

步骤209：在所述损失值处于预设范围内的情况下，将训练后的初始差异识别模型作为目标差异识别模型。

步骤210：获取第一待识别菜品的第三菜品名称和第二待识别菜品的第四菜品名称。

第一待识别菜品和第二待识别菜品是指需要进行菜品差异识别的两种菜品。

第三菜品名称是指第一待识别菜品的菜品名称。

第四菜品名称是指第二待识别菜品的菜品名称。

在获取到需要进行菜品差异识别的第一待识别菜品和第二待识别菜品之后，可以获取第一待识别菜品的第三菜品名称和第二待识别菜品的第四菜品名称。

在获取第一待识别菜品的第三菜品名称和第二待识别菜品的第四菜品名称之后，执行步骤211。

步骤211：将所述第三菜品名称和所述第四菜品名称输入至所述目标差异识别模型，并由所述目标差异识别模型获取所述第三菜品名称对应的第三菜品属性，及所述第四菜品名称对应的第四菜品属性。

在获取第一待识别菜品的第三菜品名称和第二待识别菜品的第四菜品名称之后，可以将第三菜品名称和第四菜品名称输入至目标差异识别模型，以由目标差异识别模型获取第三菜品名称对应的第三菜品属性，并获取第四菜品名称对应的第四菜品属性。

在获取第三菜品属性和第四菜品属性之后，执行步骤212。

步骤212：调用所述目标差异识别模型根据所述第三菜品名称、所述第四菜品名称、所述第三菜品属性和所述第四菜品属性，预测得到所述第一待识别菜品和所述第二待识别菜品对应的差异识别结果。

在获取到第三菜品属性和第四菜品属性之后，可以通过目标差异识别模型根据第三菜品名称、第四菜品名称、第三菜品属性和第四菜品属性，预测得到第一待识别菜品和第二待识别菜品对应的差异识别结果，该预测过程与上述模型训练过程类似，本实施例在此不再加以详细赘述。

实施例三

参照图3，示出了本公开的实施例提供的一种差异识别模型的训练装置的结构示意图，如图3所示，该差异识别模型的训练装置300具体可以包括如下模块：

训练样本获取模块310，用于获取训练样本；所述训练样本包括成对的第一菜品的第一菜品名称和第二菜品的第二菜品名称；

菜品属性获取模块320，用于基于预先构建的菜品知识图谱，获取所述第一菜品名称对应的第一菜品属性，及所述第二菜品名称对应的第二菜品属性；所述第一菜品和所述第二菜品对应于一个初始名称差异和一个初始属性差异；

预测差异获取模块330，用于将所述第一菜品名称、所述第二菜品名称、所述第一菜品属性和所述第二菜品属性输入至初始差异识别模型，并获取由所述初始差异识别模型输出的所述第一菜品和所述第二菜品对应的预测名称差异和预测属性差异；

损失值计算模块340，用于根据所述初始名称差异、所述预测名称差异、所述初始属性差异和所述预测属性差异，计算得到所述初始差异识别模型对应的损失值；

目标模型获取模块350，用于在所述损失值处于预设范围内的情况下，将训练后的初始差异识别模型作为目标差异识别模型。

本公开的实施例提供的差异识别模型的训练装置，通过获取训练样本，训练样本包括成对的第一菜品的第一菜品名称和第二菜品的第二菜品名称，基于预先构建的菜品知识图谱，获取第一菜品名称对应的第一菜品属性，及第二菜品名称对应的第二菜品属性，第一菜品和第二菜品对应于一个初始名称差异和一个初始属性差异，将第一菜品名称、第二菜品名称、第一菜品属性和第二菜品属性输入至初始差异识别模型，并获取由初始差异识别模型输出的第一菜品和第二菜品对应的预测名称差异和预测属性差异，根据初始名称差异、预测名称差异、初始属性差异和预测属性差异，计算得到初始差异识别模型对应的损失值，在损失值处于预设范围内的情况下，将训练后的初始差异识别模型作为目标差异识别模型。本公开的实施例通过在模型训练过程中结合菜品知识图谱获取菜品的属性信息，能够提高模型后续菜品识别中发掘出菜品在具体属性上的差异，提高了菜品差异识别的准确度。

实施例四

参照图4，示出了本公开的实施例提供的一种差异识别模型的训练装置的结构示意图，如图4所示，该差异识别模型的训练装置400具体可以包括如下模块：

训练样本获取模块410，用于获取训练样本；所述训练样本包括成对的第一菜品的第一菜品名称和第二菜品的第二菜品名称；

菜品属性获取模块420，用于基于预先构建的菜品知识图谱，获取所述第一菜品名称对应的第一菜品属性，及所述第二菜品名称对应的第二菜品属性；所述第一菜品和所述第二菜品对应于一个初始名称差异和一个初始属性差异；

预测差异获取模块430，用于将所述第一菜品名称、所述第二菜品名称、所述第一菜品属性和所述第二菜品属性输入至初始差异识别模型，并获取由所述初始差异识别模型输出的所述第一菜品和所述第二菜品对应的预测名称差异和预测属性差异；

损失值计算模块440，用于根据所述初始名称差异、所述预测名称差异、所述初始属性差异和所述预测属性差异，计算得到所述初始差异识别模型对应的损失值；

目标模型获取模块450，用于在所述损失值处于预设范围内的情况下，将训练后的初始差异识别模型作为目标差异识别模型；

菜品名称获取模块460，用于获取第一待识别菜品的第三菜品名称和第二待识别菜品的第四菜品名称；

目标菜品属性获取模块470，用于将所述第三菜品名称和所述第四菜品名称输入至所述目标差异识别模型，并由所述目标差异识别模型获取所述第三菜品名称对应的第三菜品属性，及所述第四菜品名称对应的第四菜品属性；

差异识别结果获取模块480，用于调用所述目标差异识别模型根据所述第三菜品名称、所述第四菜品名称、所述第三菜品属性和所述第四菜品属性，预测得到所述第一待识别菜品和所述第二待识别菜品对应的差异识别结果。

可选地，所述初始差异识别模型包括：输入层、编码层和匹配层，所述预测差异获取模块430包括：

菜品向量获取单元431，用于调用所述输入层获取所述第一菜品名称和所述第一菜品属性对应的第一菜品向量，及所述第二菜品名称和所述第二菜品属性对应的第二菜品向量；

编码向量获取单元432，用于调用所述编码层对所述第一菜品向量进行编码处理，得到所述第一菜品对应的第一编码向量，并对所述第二菜品向量进行编码处理，得到所述第二菜品对应的第二编码向量；

预测差异确定单元433，用于调用所述匹配层对所述第一编码向量和所述第二编码向量进行差异识别，以确定所述第一菜品和所述第二菜品对应的预测名称差异和预测属性差异。

可选地，所述菜品向量获取单元431包括：

可选地，所述损失值计算模块440包括：

第一损失值计算单元441，用于根据所述初始名称差异和所述预测名称差异，计算得到第一损失值；

第二损失值计算单元442，用于根据所述初始属性差异和所述预测属性差异，计算得到第二损失值；

损失值计算单元443，用于根据所述第一损失值、所述第二损失值和损失权重，计算得到所述初始差异识别模型对应的损失值。

本公开的实施例还提供了一种电子设备，包括：处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现前述实施例的差异识别模型的训练方法。

本公开的实施例还提供了一种可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行前述实施例的差异识别模型的训练方法。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本公开的实施例也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本公开的实施例的内容，并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本公开的示例性实施例的描述中，本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本公开的实施例的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。

本公开的实施例的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的实施例的动态图片的生成设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所述仅为本公开的实施例的较佳实施例而已，并不用以限制本公开的实施例，凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本公开的实施例的保护范围之内。

以上所述，仅为本公开的实施例的具体实施方式，但本公开的实施例的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的实施例的保护范围之内。因此，本公开的实施例的保护范围应以权利要求的保护范围为准。

Claims

1.一种差异识别模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述初始差异识别模型包括：输入层、编码层和匹配层，所述获取由所述初始差异识别模型输出的所述第一菜品和所述第二菜品对应的预测名称差异和预测属性差异，包括：

3.根据权利要求2所述的方法，其特征在于，所述调用所述输入层获取所述第一菜品名称和所述第一菜品属性对应的第一菜品向量，及所述第二菜品名称和所述第二菜品属性对应的第二菜品向量，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述初始名称差异、所述预测名称差异、所述初始属性差异和所述预测属性差异，计算得到所述初始差异识别模型对应的损失值，包括：

5.根据权利要求1所述的方法，其特征在于，在所述将训练后的初始差异识别模型作为目标差异识别模型之后，还包括：

6.一种差异识别模型的训练装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述初始差异识别模型包括：输入层、编码层和匹配层，所述预测差异获取模块包括：

8.根据权利要求7所述的装置，其特征在于，所述菜品向量获取单元包括：

9.根据权利要求6所述的装置，其特征在于，所述损失值计算模块包括：

10.根据权利要求6所述的装置，其特征在于，还包括：

11.一种电子设备，其特征在于，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1至5任一项所述的差异识别模型的训练方法。

12.一种可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行权利要求1至5任一项所述的差异识别模型的训练方法。