CN114067350A

CN114067350A - 模型更新方法、设备和计算机程序产品

Info

Publication number: CN114067350A
Application number: CN202010764694.1A
Authority: CN
Inventors: 倪嘉呈; 刘金鹏; 陈强; 王子嘉; 贾真
Original assignee: EMC IP Holding Co LLC
Current assignee: EMC Corp
Priority date: 2020-07-31
Filing date: 2020-07-31
Publication date: 2022-02-18
Also published as: US11562173B2; US20220036129A1

Abstract

本公开涉及模型更新方法、设备和计算机程序产品。本公开的实施例提供的方法包括获取第一图像集和第一标注信息，第一标注信息指示第一图像集中的相应图像是否包括目标对象；利用第一图像集和第一标注信息来更新对象验证模型的第一版本，以获得对象验证模型的第二版本，对象验证模型的第一版本已经被部署用于确定输入图像是否包括目标对象；确定对象验证模型的第二版本的准确度；以及如果确定准确度低于预定准确度阈值，利用第二图像集和第二标注信息来更新对象验证模型的第二版本，以获得对象验证模型的第三版本，第二图像集的图像数目大于第一图像集的图像数目，并且第二标注信息指示第二图像集中的相应图像是否包括期望的对象。

Description

模型更新方法、设备和计算机程序产品

技术领域

本公开总体上涉及人工智能(AI)领域，更特别地涉及模型更新的方法、装置、设备和计算机程序产品。

背景技术

当前个人安全已经成为各种应用中需要考虑的重要问题，用于对象验证的生物学信息识别系统(例如，基于人脸、声音、指纹、虹膜等)一直是技术关注重点。基于图像的对象验证，例如人脸验证，是最受欢迎的技术之一。图像的采集无需接触、没有侵略性和干扰，因而更不令人反感、用户友好度高。此外，由于图像采集设备(例如，相机)已经被广泛部署在各种终端设备，包括在物联网(IoT)设备中。相比于需要指纹传感器、虹膜传感器等额外设备的其他验证系统，基于图像信息的验证验证系统不需要额外的信息采集设备。近年来，随着人工智能技术的发展，还开发出基于机器学习模型的对象验证系统，能够提高对象验证的效率和准确度。

发明内容

根据本公开的一些实施例，提供了一种模型更新的方案。

在本公开的第一方面，提供了一种模型更新方法。该方法包括获取第一图像集和第一标注信息，第一标注信息指示第一图像集中的相应图像是否包括目标对象；利用第一图像集和第一标注信息来更新对象验证模型的第一版本，以获得对象验证模型的第二版本，对象验证模型的第一版本已经被部署用于确定输入图像是否包括目标对象；确定对象验证模型的第二版本的准确度；以及如果确定准确度低于预定准确度阈值，利用第二图像集和第二标注信息来更新对象验证模型的第二版本，以获得对象验证模型的第三版本，第二图像集的图像数目大于第一图像集的图像数目，并且第二标注信息指示第二图像集中的相应图像是否包括期望的对象。

在本公开的第二方面，提供了一种电子设备。该电子设备包括：至少一个处理器；以及存储有计算机程序指令的至少一个存储器，至少一个存储器和计算机程序指令被配置为与至少一个处理器一起使电子设备执行动作。动作包括：获取第一图像集和第一标注信息，第一标注信息指示第一图像集中的相应图像是否包括目标对象；利用第一图像集和第一标注信息来更新对象验证模型的第一版本，以获得对象验证模型的第二版本，对象验证模型的第一版本已经被部署用于确定输入图像是否包括目标对象；确定对象验证模型的第二版本的准确度；以及如果确定准确度低于预定准确度阈值，利用第二图像集和第二标注信息来更新对象验证模型的第二版本，以获得对象验证模型的第三版本，第二图像集的图像数目大于第一图像集的图像数目，并且第二标注信息指示第二图像集中的相应图像是否包括期望的对象。

在本公开的第三方面，提供了一种计算机程序产品，计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括计算机可执行指令，计算机可执行指令在被执行时使设备执行动作。动作包括：获取第一图像集和第一标注信息，第一标注信息指示第一图像集中的相应图像是否包括目标对象；利用第一图像集和第一标注信息来更新对象验证模型的第一版本，以获得对象验证模型的第二版本，对象验证模型的第一版本已经被部署用于确定输入图像是否包括目标对象；确定对象验证模型的第二版本的准确度；以及如果确定准确度低于预定准确度阈值，利用第二图像集和第二标注信息来更新对象验证模型的第二版本，以获得对象验证模型的第三版本，第二图像集的图像数目大于第一图像集的图像数目，并且第二标注信息指示第二图像集中的相应图像是否包括期望的对象。

根据本公开的各种实施例，通过使用无用户意图标签的用户数据来训练用户意图确定模型，使得模型能够更好地学习到用户向量化之间的交互和表示，由此提高用户意图确定模型的准确性。

附图说明

通过参考附图阅读下文的详细描述，本公开的实施例的上述以及其他目的、特征和优点将变得容易理解。在附图中，以示例性而非限制性的方式示出了本公开的若干实施例，其中：

图1示出了本公开的实施例能够在其中实现的用于对象验证的示例环境；

图2示出了根据本公开的一些实施例的用于模型更新的方法的流程图；

图3示出了根据本公开的一些实施例的对象验证的过程的流程图；

图4示出了根据本公开的一些实施例的训练样本的三元组在学习前后的距离的示意图；

图5示出了根据本公开的一些实施例的模型训练系统的示意框图；以及

图6示出了其中可以实施本公开的一个或多个实施例的计算设备的框图。

具体实施方式

下面将参照附图更详细地描述本公开的优选实现。虽然附图中显示了本公开的优选实现，然而应该理解，可以以各种形式实现本公开而不应被这里阐述的实现所限制。相反，提供这些实现是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

在本文中使用的术语“包括”及其变形表示开放性包括，即“包括但不限于”。除非特别申明，术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实现”和“一个实现”表示“至少一个示例实现”。术语“另一实现”表示“至少一个另外的实现”。术语“第一”、“第二”等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。

如本文中所使用的，术语“模型”可以从训练数据中学习到相应的输入与输出之间的关联，从而在训练完成后可以针对给定的输入，生成对应的输出。模型的生成可以基于机器学习技术。深度学习是一种机器学习算法，通过使用多层处理单元来处理输入和提供相应输出。神经网络模型是基于深度学习的模型的一个示例。在本文中，“模型”也可以被称为“机器学习模型”、“学习模型”、“机器学习网络”或“学习网络”，这些术语在本文中可互换地使用。

通常，机器学习可以包括三个阶段，即训练阶段、测试阶段和使用阶段(也称为推理阶段)。在训练阶段，给定的模型可以使用大量的训练数据进行训练，不断迭代，直到模型能够从训练数据中获取一致的、与人类智慧所能够做出的推理类似的推理。通过训练，模型可以被认为能够从训练数据中学习从输入到输出之间的关联(也称为输入到输出的映射)。模型可以被表示为一个函数，用于将输入映射到输出。经训练的模型的参数值被确定。在测试阶段，将测试输入应用到训练后的模型，测试模型是否能够提供正确的输出，从而确定模型的性能。在使用阶段，模型可以被用于基于训练得到的参数值，对实际的输入进行处理，确定对应的输出。

基于机器学习模型的对象验证技术能够实现自动且高效的对象验证。然而，对象验证模型的训练非常耗费计算资源，因此频繁重新训练模型通常不太可行。然而，在对象验证任务中，要验证的对象的新特征可能会出现，例如在人脸验证时会收集到新角度的人脸图像或者具有新表情的人脸图像。由于这些新特征在先前训练过程中没有被捕获，那么对象验证模型可能无法进行正确的对象验证。因此，期望所应用的对象验证模型具有较高鲁棒性，能够适应于对新特征的跟踪。

图1示出了示出了本公开的实施例能够在其中实现的用于对象验证的示例环境。如图1所示，示例环境100包括计算设备110，计算设备110包括模型训练系统112，用于训练和生成对象验证模型114。对象验证模型114可以被部署到另外的计算设备，例如计算设备120。

计算设备120可以利用对象验证模型114来验证输入图像102中是否包括目标对象，得到验证结果104。在一些实施例中，由计算设备110训练得到的对象验证模型114可以被部署到多个计算设备中，由每个计算设备用于执行对应的对象验证。

计算设备110和120可以是具有计算能力的任何设备。用于模型训练的计算设备110可以具有比较强大的计算能力，例如可以是集中式服务器、分布式服务器、大型机、边缘计算设备、或者云等。用于使用模型的计算设备120可以诸如可以是便携式或固定终端设备等，包括IoT设备、平板电脑、台式计算机、笔记本计算机、手机、通用计算设备等。然而，上面仅给出了一些计算设备的示例，模型的训练和计算可以由任何类型的计算设备来实现。

虽然被示出为单个设备，计算设备110或120可以由多个物理设备来实现。当然，在一些情况下，模型训练和模型使用也可以被实现在同一个设备或同一组设备上。这取决于实际的计算资源部署的需要。

对象验证模型114的具体功能例如可以由软件、硬件、固件或者前述的任意组合来支持。对象验证模型114可以被配置和训练为验证图像是否包括目标对象。对象验证模型114的模型结构可以被配置为能够支持图像处理和对象验证的任何模型结构。一个示例模型包括Facenet模型。然而，可以利用当前可用的或者将来开发的任何模型结构来配置对象验证模型114。在本公开的实施例中，对对象验证模型114的具体配置不做限制。

对象验证在很多应用中都有需要，特别是在需要保护个人信息或财产安全的领域，诸如IoT系统中的智能家居和家电设备、个人终端设备等。在一些示例中，要验证的目标对象可以包括目标人脸。通过对象验证模型114进行人脸验证，目标用户可以被授予相应权限，例如开启和控制智能家电和家居设备，诸如灯、门、窗、冰箱、多媒体设备、灌溉系统，等等。当然，这只是对象验证的一些示例应用。对象验证还可以在很多其他应用中被采用。

在一些实施例中，对象验证过程大致可以划分为三个阶段，包括对象检测和对齐(或规范化)、对象特征提取和对象验证。在对象检测和对齐阶段，从输入图像102检测对象区域(例如，人脸区域)，并且可以对检测到的对象区域的几何特性进行规范化。例如，对象区域的规范化可以包括将人脸的五官(眼睛、鼻子、嘴巴等)调整到与参考人脸类似的位置。对象特征提取阶段包括从图像，具体是图像的对象区域检测提取特征向量，所提取的特征向量能够表征对象的特性。

对象验证阶段要验证当前输入图像102中的对象是否是目标对象。为此，可以计算从包括目标对象的参考图像提取的参考特征向量与当前提取的特征向量之间的差异。该差异例如可以由各种向量距离计算公式来确定。如果所计算的差异较小(例如，小于阈值)，可以确定当前图像包括目标对象，因此本次验证通过。

在上述对象验证过程中，对象检测和对齐可以由另外的机器学习模型来完成或者可以除机器学习模型之外的其他手段来实现。在一些实施例中，对象验证模型114可以被配置为在对象检测结果的基础上执行特征向量的提取。对象验证模型114也可以包括验证模块，用于确定最终的验证结果，即当前输入图像是否包括目标对象。当然，在一些实施例中，对象验证模型114也可以将对象检测和对齐的功能包括在内。在对象验证过程中，特征向量的提取是重要的，因为其可能决定最终的验证结果。

在训练过程中，计算设备110可以从训练数据库105获得训练数据用于对象验证模型114的训练。训练数据可以包括各种训练图像，其中呈现相应对象。取决于所采用的训练方法，训练数据还可以包括训练图像的标注信息，指示训练图像是否包括某个目标对象。计算设备110可以利用各种模型训练技术，使对象验证模型114能够从图像中提取到特别有助于表征对象的特征向量，从而使验证结果准确。

如以上提及的，由于在模型使用过程中可能会出现对象的新特征，这样的特征在原训练数据中可能为被包括，因此对象验证模型对这样的特征不敏感，导致验证准确度降低。

在机器学习应用中，可以通过在线机器学习的方法更新机器学习模型。在线机器学习指的是在模型训练完成后，再获取新的训练数据来更新模型。然而，模型训练所要求的计算开销较大，特别是要在全训练数据集的基础上执行训练时。如果利用纯在线机器学习技术，即每当获得一个新训练样本就再次更新模型，这样每次更新的计算开销小，但可能会导致模型参数不稳定，并且频繁更新的总计算开销也会增加。此外，对于具有非线性操作的模型，训练样本过少将无法实现模型更新。

本公开的实施例提出了一种用于自适应的模型更新的方案。该方案通过分阶段以不同量级的训练数据来更新模型，达到模型更新速度和计算开销的平衡。具体地，在对象验证模型的使用过程中采集第一图像集和相关联的第一批注信息。利用第一图像集和第一批注信息来更新对象验证模型的第一版本，得到第二版本。第一图像集的图像数可以较小，从而使本次更新的计算开销有约束。然后，确定对象验证模型的第二版本的准确度。

如果准确度低于预定准确度阈值，利用第二图像集和相关联的第二批注信息来更新对象验证模型的第二版本。第二图像集的图像数大于第一图像集，这能够继续在较大训练样本基础上训练更准确的模型。

通过联合小训练数据集和大训练数据集来执行模型更新，可以解决计算开销，同时还可以确保模型准确度，避免严重的模型准确度衰退。

以下将继续参考附图描述本公开的一些示例实施例。

图2示出了根据本公开的一些实施例的模型更新的过程200的流程图。过程200可以由图1的计算设备110来实现，例如由计算设备110中的模型训练系统112来实现。为便于讨论，下文将参考图1来描述过程200。

在框210，模型训练系统112获取第一图像集和第一标注信息。第一标注信息指示第一图像集中的相应图像是否包括目标对象。如下文将描述的，第一图像集和第一标注信息用于更新对象验证模型114。第一图像集和第一标注信息可以被认为是对象验证模型114的新训练数据。

通常，在采集新训练数据时，新训练数据的标注比较耗费成本。在一些实施例中，第一图像集和第一标注信息可以是在对象验证模型114的当前版本(称为“第一版本”)的使用中被收集到。具体地，在一些实施例中，可以获取在对象验证模型114的第一版本的使用中收集到的至少一个输入图像和至少一个图像对应的验证结果，以用于确定第一图像集和第一标注信息。在使用中可以通过多种方式来自动获得第一图像集及其标注信息，而无需再进行后续人工标注，降低训练数据成本。

为便于理解第一图像集及其第一标注信息的获取，将结合图3来描述对象验证过程300。该对象验证过程300由部署有对象验证模型114的第一版本的计算设备，例如计算设备120实现。计算设备120执行对象验证过程300，以确定验证结果。验证结果用于判断用户的权限。该权限例如包括对特定设备、功能、服务等的访问权限、控制权限、修改权限等等。如果验证通过，计算设备120确定当前用户，例如提供输入图像102的用户具有权限。否则，计算设备120确定当前用户无法获得相应权限。

如图3所示，要验证的输入图像102首先由对象验证模型114进行验证，以确定验证结果104。对象验证模型114还借助参考图像302生成验证结果104。

例如，参考图像302可以是预先提供的被确定为包括目标对象的图像。参考图像302可以是由用户提供的包括目标对象的图像。在人脸验证的应用中，参考图像302可以在用户登记阶段由用户提供的人脸图像。如以上介绍的，对象验证模型114从输入图像102提取特征向量。所提取的特征向量与从参考图像302提取的特征向量之间的差异被用于判断输入图像102是否包括目标对象。如果对象验证模型114被部署到不同应用中，通过替换参考图像302，对象验证模型114可以执行针对不同目标对象的验证。

在框312，计算设备120基于来自对象验证模型114的验证结果104，确定基于对象验证模型114的验证是否通过。如果验证结果104指示输入图像102包括目标对象，则意味着验证通过。计算设备120可以确定当前用户，例如在输入图像102中呈现的对象，能够获得所要求的权限。此外，在框314，计算设备120将输入图像102存入训练数据库，例如训练数据库105。在这种情况下，输入图像102被标注为包括目标对象。

如果验证结果104指示输入图像102不包括目标对象，在一些应用中，计算设备120还可以基于另外的验证信息304来继续验证过程。另外的验证信息304例如可以包括密码、指纹、令牌等信息。在框316，计算设备120确定基于另外的验证信息304的验证是否通过。如果通过验证，计算设备120可以确定当前用户，即提供验证信息的用户具有权限。

如果用户在同一个验证过程中提供输入图像102和验证信息304，计算设备120可以确定用户未发生改变。因此，在一些实施例中，在框316的验证通过后，在框318，计算设备120还可以将输入图像102存入训练数据库105。此时，输入图像102也可以被标注为包括目标对象。这是因为虽然当前对象验证模型114未能成功验证，但另外的验证信息340辅助验证了目标对象的存在。因此输入图像102可能包含对象验证模型114当前未能捕获的特征，可以被提供作为新训练数据用于后续模型更新。

在一些实施例中，如果基于验证信息304的验证仍然未能通过，这意味着当前用户，例如输入图像中呈现的对象不具有权限。在框320，计算设备120还可以将输入图像102存入训练数据库105，并且输入图像102被标注为不包括目标对象。

在一些实施例中，第一图像集可以包括计算设备120在对象验证模型114的使用过程中采集到的多个输入图像，如以上参考图3讨论的输入图像。实时采集到的输入图像可以被提供到训练数据库105中进行存储。此外，输入图像已经被相应标注，因此第一标注信息也可以被相应地确认。

在一些实施例中，第一图像集还可以包括被提供用于对象验证模型的验证的参考图像302。由于参考图像302已知包括目标对象，第一信息可以指示参考图像302包括目标对象。

以上讨论了第一图像集和第一标注信息的获取方式的示例实施例。在其他实施例中，第一图像集和第一标注信息的部分或全部还可以通过其他方式来获得，本公开的实施例在此方面不受限制。在一些实施例中，如果采集到与多个目标对象有关的图像，第一标注信息还可以指示每个图像所包括的具体目标对象。

在框220，模型训练系统112利用第一图像集和第一标注信息来更新对象验证模型114的第一版本，以获得对象验证模型114的另一版本(称为“第二版本”)。对象验证模型114的第一版本可以是先前训练并且被部署到一个或多个计算设备(例如计算设备120)中使用的模型。

对象验证模型114的第一版本可以包括对象验证模型114的初始版本，或者之后更新的版本。在生成对象验证模型114的初始版本时，通常可以利用较大的训练数据集(例如，来自训练数据库105的训练数据集)，即包括更多图像和相关联的标注信息的训练数据集来支持模型训练。

为使对象验证模型114更准确，能够适应到对象的新特征，在本公开的实施例中，利用采集到的第一图像集和第一标注信息来更新对象验证模型114的第一版本，以获得第二版本。对象验证模型114的更新指的是模型的调整(fine-tuning)，涉及模型的训练过程。在一些实施例中，可以在收集到预定量的第一图像集后执行模型更新。在一些实施例中，可以周期性地利用收集到的第一图像集执行模型更新。

在一些实施例中，由于第一图像集的图像数目较小，即训练样本集小，可以利用基于小批(mini-batch)随机梯度下降的训练，来更新对象验证模型114的第一版本。在一些实施例中，模型训练系统112可以构造相应的目标函数(称为第一目标函数)来执行基于第一图像集和第一标注信息的模型训练。第一目标函数可以被构造为损失函数或成本函数。训练目标的实现包括使第一目标函数达到收敛条件(称为第一收敛条件)。

由于第一图像集的训练样本少，并且为了节约计算开销，在一些实施例中，模型训练系统112选择较容易满足收敛条件的目标函数来执行模型更新。在一些实施例中，模型训练系统112可以基于三元组损失(triplet loss)函数来确定第一目标函数，来引导模型更新过程。

在基于三元组损失函数的模型更新过程中，需要从第一图像集中构建多个三元组训练样本。每个三元组训练样本包括锚样本、正类样本和负类样本。锚样本和正类样本包括呈现相同对象的图像，例如包括目标对象的图像。负类样本包括呈现与锚样本和正类样本不同对象的图像。基于指示图像是否包括目标对象的第一标注信息，可以确定如何构建三元组训练样本。

在一些示例中，将对象验证模型114表示为函数f(x)∈R^d，其中x表示输入图像x，该对象验证模型114可以将输入图像x转换为d维的特征向量，并且具有约束条件||f(x)||＝1。在对象验证模型114这样的表示情况下，三元组损失函数可以被表示为：

其中

表示第i个三元组训练样本中的锚样本，

表示第i个三元组训练样本中的正类样本，

表示第i个三元组训练样本中的负类样本，

表示由对象验证模型114从两个样本提取的特征向量之间的差异(或相似度)。由于特征向量可以理解为多维向量，因此两个特征向量之间的相似度或差异可以利用任何适合用于衡量向量差异的方法来确定。在一个示例中，两个特征向量之间的差异可以基于欧式距离来确定，距离越大意味着两个特征向量之间的差异越大，相似度越小。

在公式(1)中，α表示锚文本和正类文本的特征向量之间的第一差异和锚文本与负类文本的特征向量之间的第二差异之间的最小间隔。α是模型的超参数，可以根据经验或者其他可能的方式被配置为预定值。

基于三元组损失函数，模型训练的目标在于使特定目标对象的锚样本

更靠近正类样本

(即它们的特征向量之间的距离更小)，小于锚样本

与负类样本

之间的距离(即它们的特征向量之间的距离)和间隔α。图4示出了在训练前后三元组训练样本之间的距离关系。在训练前，锚样本410与正类样本420之间的距离可能较远，而锚样本410与负类样本430之间的距离可能较近。在训练之后，期望锚样本420与正类样本420之间的距离被缩短，而锚样本410与负类样本430之间的距离被拉大。

因此，基于三元组损失函数，第一目标函数可以被构建为使以下损失函数达到收敛条件：

在公式(2)中，N表示从第一图像集构造的三元组训练样本的数目，[]₊表示：如果[]₊内的值大于零时，该值被确定三元组损失；如果[]₊内的值小于等于零，三元组损失为零。如果上述公式达到收敛条件，例如最小化，则训练完成。

在一些实施例中，在锚样本

给定的情况下，可以随机选择正类样本

和负类样本

在一些实施例中，为了提高模型训练效率，可以在锚样本

和正类样本

已经选定的情况下，选择一个负类样本

使该负类样本

满足以下条件：

这样构造的三元组训练样本更“难”。更“难”指的是，在三元组训练样本中，锚样本和负类样本之间的差异，与锚样本和正类样本之间的差异，两个差异的距离不大。因此，对象验证模型114需要更精确学习参数值，以便能够正确区分正类样本和负类样本。

以上讨论的基于三元组损失函数的模型更新。三元组损失函数的收敛条件通常比较容易达到，并且通过变换三元组训练样本，可以在较小量级的训练数据基础上满足收敛条件。因此，三元组损失函数特别适合用于基于小批次随机梯度下降的模型训练过程。在其他实施例中，还可以基于其他损失函数或成本函数来确定模型训练的目标函数，从而完成模型训练。只要所选择的目标函数能够在第一图像集的基础上达到模型收敛即可。

在一些实施例中，为了避免基于小量级训练数据的模型更新对准确度的较大影响，模型训练系统112还可以基于较小的预定学习率来训练对象验证模型114的第一版本。例如，该学习率小于预定阈值。在模型训练中，学习率的大小决定模型的参数移动到最优值的速度快慢。通过设置较小的预定学习率，可以避免对象验证模型114的参数值的快速变化，从而尽可能限制对准确度的影响。

继续参考图2，在基于第一图像集和第一批注信息的模型更新后，在框230，模型训练系统112确定所获得的对象验证模型114的第二版本的准确度。模型训练系统112可以通过模型验证过程来确定准确度。例如，模型训练系统112从训练数据库105选择一组用于模型验证的图像，利用对象验证模型114的第二版本来处理图像，确定验证结果是否与已知的验证结果相匹配。任何其他用于测试模型准确度的方法也是可行的。

在框240，模型训练系统112确定对象验证模型114的第二版本的准确度是否低于预定准确度阈值。预定准确度阈值可以被设置为可接受的准确度。

在一些情况下，如果对象验证模型114的第二版本的准确度低于预定准确度阈值，在框250，模型训练系统112利用第二图像集和第二标注信息来再次更新对象验证模型114的第二版本，以获得对象验证模型114的第三版本。第二图像集的图像数目大于第一图像集的图像数目，第二标注信息指示第二图像集中的相应图像是否包括期望的对象。由于第一图像集的使用导致了模型准确度衰退，在本公开的实施例中，模型训练系统112利用更大的训练数据集来重新训练对象验证模型114。

在一些实施例中，第二图像集可以包括训练数据库105中已存储的训练数据集，例如在初始结果用于模型训练的数据集。在一些实施例中，第二图像集可以包括第一图像集，第二标注信息也相应包括第一标注信息。也就是说，在当前阶段的更新中，除历史使用的训练数据外，还可以将新采集的训练数据一起用于再次训练对象验证模型114。

更大量级的训练数据可以很好地校正模型参数，提高模型的准确度。在一些实施例中，模型训练系统112可以构造相应的目标函数(称为第二目标函数)来执行基于第二图像集和第二标注信息的模型训练。第二目标函数可以被构造为损失函数或成本函数。训练目标的实现包括使第二目标函数达到收敛条件(称为第二收敛条件)。

由于训练数据集更充分，并且为了提高模型的准确度，第二目标函数可以被设计为更复杂，从而使满足第二收敛条件的复杂度大于满足第一收敛条件的复杂度。例如，模型训练系统112可以基于诸如softmax损失、感知机损失等损失函数来确定第二目标函数。模型训练系统112还可以利用基于批(batch)随机梯度下降的训练，来执行基于第二图像集和第二标注信息的模型训练。应当理解，还可以利用任何其他适当的损失函数或成本函数来支持模型训练。

通过先以小数据级的图像集执行模型更新，在准确度出现衰退时再利用大量级的图像集来执行模型更新，可以实现计算资源开销和模型准确度之间的平衡。

在一些实施例中，如果对象验证模型114的第二版本的准确度满足预定准确度阈值(例如，大于等于预定准确度阈值)，计算设备120可以将对象验证模型114的第二版本部署到计算设备120，用于替换计算设备120当前使用的版本。由于更新后的对象验证模型114的第二版本从新采集的第一图像中学习到了目标对象的新特征，对象验证模型114的第二版本将能够更准确地执行对象验证。

在一些实施例中，在对象验证模型114的第二版本被使用一段时间后，还可以基于在这段时间内采集到的新图像集以及相应的标注信息来再次更新当前版本的对象验证系统114。此处的更新与先前讨论的对对象验证模型114的“第一版本”的更新类似。也就是说，在准确度不下降的情况下，可以多次利用新采集的小量级的图像集来迭代对象验证模型114的版本。

在一些实施例中，在对象验证模型114的更新时，第一图像集和/或第二图像集可以被预处理，以得到适合作为对象验证模型114的输入的预处理结果。在一些实施例中，预处理可以包括对图像的对象检测和/或对齐，以确定第一图像集中每个图像中的对象区域和/或将对象区域进行规范化。对象检测和/或对齐可以由另外的模型来实现，或者可以通过其他手段来执行。当然，如果对象验证模型114本身被设计为具有对象检测和/或对齐功能，则无需进行这样的预处理。此外，其他适当的预处理也是可能的。

图5示出了根据本公开的一些实施例的模型训练系统212的示意框图。模型训练系统212包括第一模型更新模块510，其被配置为获取第一图像集501和相关联的标注信息511，对对象验证模型114的第一版本(V1)执行更新，得到对象验证模型114的第二版本(V2)。如果对象验证模型114的第二版本(V2)准确度大于预定准确度阈值，该版本可以被部署到计算设备110使用。

如果对象验证模型114的第二版本(V2)准确度低于预定准确度阈值，模型训练系统212还包括第二模型更新模块520，其被配置为获取第一图像集502和相关联的标注信息522，对对象验证模型114的第二版本(V2)执行更新，得到对象验证模型114的第三版本(V3)。该版本可以被部署到计算设备110使用。

图6示意性示出能够被用来实施本公开的实施例的设备600的框图。应当理解，图6所示出的设备600仅仅是示例性的，而不应当构成对本文所描述的实施例的功能和范围的任何限制。图6所示出的设备600可以用于实现图2的过程200。图6所示出的设备600可以被实现为或者被包括于图1的计算设备110或者其中的模型训练系统112。图6所示出的设备600可以被实现为或者被包括于图1的计算设备120。

如图6中所示出的，设备600包括中央处理单元(CPU)601，其可以根据存储在只读存储设备(ROM)602中的计算机程序指令或者从存储单元608加载到随机访问存储设备(RAM)603中的计算机程序指令，来执行各种适当的动作和处理。在RAM 603中，还可存储设备600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

设备600中的多个部件连接至I/O接口605，包括：输入单元606，例如键盘、鼠标等；输出单元607，例如各种类型的显示器、扬声器等；存储单元608，例如磁盘、光盘等；以及通信单元609，例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

上文所描述的各个过程和处理，例如过程200可由处理单元601来执行。例如，在一些实施例中，过程200可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元608。在一些实施例中，计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序被加载到RAM 603并由CPU 601执行时，可以执行上文描述的过程200的一个或多个步骤。

本公开的实施例还可以提供一种计算机可读存储介质，其上存储有计算机可执行指令，其中计算机可执行指令被处理器执行以实现上文描述的方法。根据本公开的示例性实现方式，还提供了一种计算机程序产品，计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括计算机可执行指令，计算机可执行指令被处理器执行以实现上文描述的方法。

这里参照根据本公开实现的方法、装置、设备、计算机可读介质和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理单元，从而生产出一种机器，使得这些指令在通过计算机或其他可编程数据处理装置的处理单元执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上，使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其他可编程数据处理装置、或其他设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实现的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

如本文所使用的，术语“确定”涵盖各种各样的动作。例如，“确定”可以包括运算、计算、处理、导出、调查、查找(例如，在表格、数据库或另一数据结构中查找)、查明等。此外，“确定”可以包括接收(例如，接收信息)、访问(例如，访问存储器中的数据)等。此外，“确定”可以包括解析、选择、选取、建立等。

以上已经描述了本公开的各实现，上述说明是示例性的，并非穷尽性的，并且也不限于所公开的各实现。在不偏离所说明的各实现的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实现的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其他普通技术人员能理解本文公开的各个实现方式。

Claims

1.一种模型更新方法，包括：

获取第一图像集和第一标注信息，所述第一标注信息指示所述第一图像集中的相应图像是否包括目标对象；

利用所述第一图像集和所述第一标注信息来更新对象验证模型的第一版本，以获得所述对象验证模型的第二版本，所述对象验证模型的所述第一版本已经被部署用于确定输入图像是否包括目标对象；

确定所述对象验证模型的所述第二版本的准确度；以及

如果确定所述准确度低于预定准确度阈值，利用第二图像集和第二标注信息来更新所述对象验证模型的所述第二版本，以获得所述对象验证模型的第三版本，所述第二图像集的图像数目大于所述第一图像集的图像数目，并且所述第二标注信息指示所述第二图像集中的相应图像是否包括期望的对象。

2.根据权利要求1所述的方法，其中获取所述第一图像集和所述第一标注信息包括：

获取在所述对象验证模型的所述第一版本的使用中收集到的至少一个输入图像和所述至少一个图像对应的验证结果，所述验证结果指示所述至少一个图像是否包括所述目标对象；

将所述至少一个输入图像包括到所述第一图像集；以及

基于所述验证结果来确定所述第一标注信息。

3.根据权利要求2所述的方法，其中获取所述至少一个输入图像包括获取以下至少一项：

由所述对象验证模型确定为包括所述目标对象的第一输入图像，所述第一标注信息被确定为指示所述第一输入图像包括所述目标对象，

由所述对象验证模型确定为不包括所述目标对象的第二输入图像，所述对象验证模型的验证结果被用于确定权限并且所述第二输入图像中的对象被确定为具有所述权限，所述第一标注信息被确定为指示所述第二输入图像包括所述目标对象，以及

由所述对象验证模型确定为不包括所述目标对象的第三输入图像，所述第三输入图像中的对象被确定为不具有所述权限，并且所述第一标注信息被确定为指示所述第二输入图像不包括所述目标对象，

被提供用于所述对象验证模型的验证的参考图像，所述第一标注信息被确定为指示所述参考图像包括所述目标对象。

4.根据权利要求1所述的方法，其中更新所述对象验证模型的所述第一版本包括：

利用所述第一图像集和所述第一标注信息来训练所述对象验证模型的所述第一版本，以满足第一目标函数的第一收敛条件；并且

其中更新所述对象验证模型的所述第二版本包括：

利用所述第二图像集和所述第二标注信息来训练所述对象验证模型的所述第二版本，以满足第二目标函数的第二收敛条件，满足所述第二收敛条件的复杂度大于满足所述第一收敛条件的复杂度。

5.根据权利要求1所述的方法，其中更新所述对象验证模型的所述第一版本包括：

利用基于小批随机梯度下降的训练，来更新所述对象验证模型的所述第一版本。

6.根据权利要求1所述的方法，其中更新所述对象验证模型的所述第一版本包括：

利用所述第一图像集和所述第一标注信息，基于预定学习率来训练所述对象验证模型的所述第一版本，所述预定学习率小于预定阈值。

7.根据权利要求1所述的方法，其中所述目标对象包括目标人脸。

8.一种电子设备，包括：

至少一个处理器；以及

存储有计算机程序指令的至少一个存储器，所述至少一个存储器和所述计算机程序指令被配置为与所述至少一个处理器一起使所述电子设备执行动作，所述动作包括：

确定所述对象验证模型的所述第二版本的准确度；以及

9.根据权利要求8所述的设备，其中获取所述第一图像集和所述第一标注信息包括：

将所述至少一个输入图像包括到所述第一图像集；以及

基于所述验证结果来确定所述第一标注信息。

10.根据权利要求9所述的设备，其中获取所述至少一个输入图像包括获取以下至少一项：

11.根据权利要求8所述的设备，其中更新所述对象验证模型的所述第一版本包括：

其中更新所述对象验证模型的所述第二版本包括：

12.根据权利要求8所述的设备，其中更新所述对象验证模型的所述第一版本包括：

13.根据权利要求8所述的设备，其中更新所述对象验证模型的所述第一版本包括：

14.根据权利要求8所述的设备，其中所述目标对象包括目标人脸。

15.一种计算机程序产品，所述计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括计算机可执行指令，所述计算机可执行指令在被执行时使设备执行动作，所述动作包括：

确定所述对象验证模型的所述第二版本的准确度；以及

16.根据权利要求15所述的计算机程序产品，其中获取所述第一图像集和所述第一标注信息包括：

将所述至少一个输入图像包括到所述第一图像集；以及

基于所述验证结果来确定所述第一标注信息。

17.根据权利要求16所述的计算机程序产品，其中获取所述至少一个输入图像包括获取以下至少一项：

18.根据权利要求15所述的计算机程序产品，其中更新所述对象验证模型的所述第一版本包括：

其中更新所述对象验证模型的所述第二版本包括：

19.根据权利要求15所述的计算机程序产品，其中更新所述对象验证模型的所述第一版本包括：

20.根据权利要求15所述的计算机程序产品，其中更新所述对象验证模型的所述第一版本包括：

21.根据权利要求15所述的计算机程序产品，其中所述目标对象包括目标人脸。