CN114004328A

CN114004328A - Ai模型更新的方法、装置、计算设备和存储介质

Info

Publication number: CN114004328A
Application number: CN202010732241.0A
Authority: CN
Inventors: 邬书哲; 金鑫; 李心成; 涂丹丹
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Cloud Computing Technologies Co Ltd
Priority date: 2020-07-27
Filing date: 2020-07-27
Publication date: 2022-02-01
Also published as: EP4177792A1; WO2022022233A1; US20230153622A1; EP4177792A4; JP2023535227A

Abstract

本申请提供了一种AI模型更新的方法、装置、计算设备和存储介质，属于人工智能技术领域。该方法包括：获取推理数据集，其中，推理数据集中的推理数据用于输入至已有AI模型执行推理；确定推理数据集的数据分布与训练数据集的数据分布存在差异，训练数据集为训练已有AI模型所使用的数据集；利用推理数据集，对已有AI模型进行更新，获得更新后的AI模型。采用本申请，在感知推理数据集的数据分布与训练数据集的数据分布存在差异时，可以及时对已有的AI模型进行更新，而不需要等到用户发现AI模型的推理精度下降时才对已有AI模型进行更新，所以可以及时的更新AI模型。

Description

AI模型更新的方法、装置、计算设备和存储介质

技术领域

本申请涉及人工智能(Artificial Intelligence，AI)技术领域，特别涉及一种AI模型更新的方法、装置、计算设备和存储介质。

背景技术

随着人工智能技术的发展，AI模型应用越来越广泛。目前AI模型主要是采用机器学习等算法基于大量数据来学习AI模型的参数，由于AI模型是通过学习大量数据获得，所以所构建的AI模型尽管具有一定的泛化能力，但是当其所使用的场景下的数据分布和其训练数据分布存在较大差异时，AI模型的表现会受到影响，精度降低，且分布差异越大，精度降低越显著。然而AI模型的实际应用环境是动态变化的，因此在实际应用场景中，数据分布有可能不断变化，有可能导致AI模型在变化的应用场景下无法保持稳定的精度。为了使AI模型的精度可以适应场景的变化，需要对AI模型进行自适应的更新。

相关技术中，是开发了一个AI平台，用户通过AI平台自行完成对模型的更新。具体的，AI平台提供了从训练AI模型至部署AI模型所需的功能，这些功能通常包括数据标注、数据管理、模型训练和模型推理等。用户可以通过AI平台训练AI模型，后续用户在确定当前的AI模型不适应于当前的场景时，用户可以提供当前的场景的数据集，对AI模型进行更新，以使更新后的AI模型适应当前的场景，再将更新后的AI模型应用于当前的场景。

由于相关技术的AI模型更新的方法只能在AI模型的精度降低后，用户感知到AI模型在当前场景下精度下降了，才会去进行AI模型的更新，所以会导致AI模型更新不及时。

发明内容

本申请提供了一种AI模型更新的方法、装置、计算设备和存储介质，用以及时的对AI模型进行更新。

第一方面，本申请提供了一种AI模型更新的方法，该方法包括：获取推理数据集，其中，推理数据集中的推理数据用于输入至已有AI模型执行推理；确定推理数据集的数据分布与训练数据集的数据分布存在差异，其中，训练数据集为训练已有AI模型所使用的数据集；利用推理数据集，对已有AI模型进行更新，获得更新后的AI模型。

本申请所示的方案，AI模型更新的方法可以由AI平台执行，由于上述方法在推理数据集的数据分布与训练数据集的数据分布存在差异时，会对已有AI模型进行更新，而不是等到用户感知到AI模型的精度降低，才对已有AI模型进行更新，所以可以更及时地对AI模型进行更新。

在一种可能的实现方式中，已有AI模型部署在推理平台，该方法还包括：比较更新后的AI模型和已有AI模型的推理精度，确定更新后的AI模型的推理精度优于已有AI模型的推理精度；将更新后的AI模型部署至推理平台，代替已有AI模型执行推理。

本申请所示的方案，已有AI模型可以部署在推理平台，推理平台可以是AI平台的一部分，也可以是独立于AI平台。AI平台可以获得更新后的AI模型和已有AI模型的推理精度，然后比较更新后的AI模型和已有AI模型的推理精度，在更新后的AI模型的推理精度优于已有AI模型的推理精度时，将更新后的AI模型部署至推理平台，推理平台中使用更新后的AI模型，代替已有AI模型执行推理。这样，在更新后的AI模型的推理精度优于已有AI模型时，才对已有AI模型进行更新，所以使用更新后的AI模型进行推理，使得推理精度较高。

在一种可能的实现方式中，将更新后的AI模型部署至推理平台之前，还包括：通过显示界面显示已有AI模型的推理精度和更新后的AI模型的推理精度；接收用户对已有AI模型的更新指令。

本申请所示的方案，AI平台在将更新后的AI模型部署至推理平台之前，可以通过显示界面显示已有AI模型的推理精度和更新后的AI模型的推理精度，用户可以选择是否更新已有AI模型。在AI平台接收到用户对已有AI模型的更新指令时，可以将更新后的AI模型部署至推理平台。这样，用户可以决定是否部署更新后的AI模型，所以可以使得用户体验更好。

在一种可能的实现方式中，利用推理数据集，对已有AI模型进行更新，包括：若差异达到离线更新条件，则利用推理数据集对已有AI模型进行离线更新；若差异未达到离线更新条件，则利用推理数据集对已有AI模型进行在线更新。

本申请所示的方案，AI平台可以判断推理数据集的数据分布与训练数据集的数据分布的差异是否满足离线更新条件。在该差异满足离线更新条件的情况下，AI平台可以利用推理数据集对已有AI模型进行离线更新。在该差异不满足离线更新条件的情况下，AI平台可以利用推理数据集对已有AI模型进行在线更新。这样，由于基于差异的不同，可以选择不同的更新方式，所以可以节约更新时长。

在一种可能的实现方式中，利用推理数据集对已有AI模型进行在线更新，包括：利用推理数据集的数据分布与训练数据集的数据分布的差异，确定已有AI模型的目标部分的参数变化量；基于已有AI模型中目标部分当前的参数和参数变化量，确定更新后的AI模型中目标部分的参数。这样，在进行在线更新时，可以仅更新AI模型中某些部分的参数，即可达到对已有AI模型进行在线更新。

在一种可能的实现方式中，利用推理数据集，对已有AI模型进行更新，包括：根据推理数据集构造目标数据集；利用目标数据集对已有AI模型进行更新。

在一种可能的实现方式中，根据推理数据集构造目标数据集，包括：在推理数据集中，获取满足样例条件的目标数据，通过显示界面显示目标数据；获取用户对目标数据的标注结果；根据目标数据以及目标数据的标注结果，构建目标数据集。

本申请所示的方案，AI平台可以在推理数据集中，选取出满足样例条件的目标数据，展示给用户，使得用户对目标数据进行标注。AI平台可以基于用户对目标数据的标注结果和目标数据，构建出目标数据集。这样，由于在对已有AI模型进行更新时，构建出的目标数据集中包括用户标注的满足样例条件的目标数据，所以可以使更新后的AI模型更适用于对推理数据集的推理。

在一种可能的实现方式中，在推理数据集中，获取满足样例条件的目标数据，包括：根据推理数据集的数据分布与训练数据集的数据分布的差异，在推理数据集中，获取满足样例条件的目标数据，其中，目标数据适用于更新已有AI模型。这样，基于推理数据集的数据分布与训练数据集的数据分布的差异，可以使得目标数据更适用于更新已有AI模型。

在一种可能的实现方式中，目标数据集还包括在当前的标注数据中采样和/或生成适合推理数据集的数据分布的标注数据，当前的标注数据包括训练数据集中的数据。这样，还可以在已有的标注数据中，获取到适合推理数据集的数据分布的标注数据，所以可以使得目标数据集中的标注数据比较多，进而可以使得更新后的AI模型的推理精度更高。

在一种可能的实现方式中，目标数据集包括适合推理数据集的数据分布的未标注数据和标注数据；利用目标数据集对已有AI模型进行更新，包括：利用目标数据集中的未标注数据，使用无监督方式对已有AI模型中的特征提取部分进行优化；根据优化后的特征提取部分和目标数据集中的标注数据，对已有AI模型进行更新。这样，可以先优化AI模型中的特征提取部分，然后再对已有AI模型进行更新。

在一种可能的实现方式中，目标数据集包括适合推理数据集的数据分布的未标注数据和标注数据；利用目标数据集对已有AI模型进行更新，包括：利用已有AI模型，对目标数据集中的未标注数据进行标注，获得未标注数据的标注结果；根据未标注数据的标注结果和目标数据集中的标注数据，对已有AI模型进行更新。这样，由于可以对目标数据集中的未标注数据进行标注，所以可以使目标数据集中的标注数据比较多，所以可以使得更新后的AI模型的推理精度更高。

在一种可能的实现方式中，利用目标数据集对已有AI模型进行更新，包括：根据目标数据集中数据的数据特性，获取更新已有AI模型的策略；根据策略，对已有AI模型进行更新。这样，由于可以使用目标数据集中数据的数据特性，选择出更新已有AI模型的策略，对已有AI模型进行更新，所以不仅可以提升更新已有AI模型的效率，而且可以使得更新后的AI模型的推理精度更高。

在一种可能的实现方式中，该方法还包括：获取用户输入的AI模型的更新周期；确定推理数据集的数据分布与训练数据集的数据分布存在差异，包括：根据AI模型的更新周期，确定推理数据集的数据分布与训练数据集的数据分布存在差异。这样，用户可以决定AI模型的更新周期，在达到该更新周期时，执行AI模型更新的流程。

第二方面，本申请提供了一种人工智能AI模型更新的装置，该装置包括：获取模块，用于获取推理数据集，其中，所述推理数据集中的推理数据用于输入至已有AI模型执行推理；确定模块，用于确定所述推理数据集的数据分布与训练数据集的数据分布存在差异，其中，所述训练数据集为训练所述已有AI模型所使用的数据集；更新模块，用于利用所述推理数据集，对所述已有AI模型进行更新，获得更新后的AI模型。这样，由于在推理数据集的数据分布与训练数据集的数据分布存在差异时，会对已有AI模型进行更新，而不是等到用户感知到AI模型的精度降低，才对已有AI模型进行更新，所以可以及时的对AI模型进行更新。

在一种可能的实现方式中，该已有AI模型部署在推理平台，该确定模块，还用于比较所述更新后的AI模型和所述已有AI模型的推理精度，确定所述更新后的AI模型的推理精度优于所述已有AI模型的推理精度；该更新模块，还用于将所述更新后的AI模型部署至所述推理平台，以使所述更新后的AI模型代替所述已有AI模型执行推理。这样，在更新后的AI模型的推理精度优于已有AI模型时，才对已有AI模型进行更新，使得推理精度较高。

在一种可能的实现方式中，所述装置还包括：显示模块，用于将所述更新后的AI模型部署至所述推理平台之前，通过显示界面显示所述已有AI模型的推理精度和所述更新后的AI模型的推理精度；所述装置还包括：接收模块，用于接收用户对所述已有AI模型的更新指令。这样，用户可以决定是否部署更新后的AI模型，所以可以使得用户体验更好。

在一种可能的实现方式中，该更新模块，用于：若所述差异达到离线更新条件，则利用所述推理数据集对所述已有AI模型进行离线更新；若所述差异未达到所述离线更新条件，则利用所述推理数据集对所述已有AI模型进行在线更新。这样，由于基于差异的不同，可以选择不同的更新方式，所以可以节约更新时长。

在一种可能的实现方式中，该更新模块，用于：利用所述推理数据集的数据分布与所述训练数据集的数据分布的差异，确定所述已有AI模型的目标部分的参数变化量；基于所述已有AI模型中所述目标部分当前的参数和所述参数变化量，确定更新后的AI模型中所述目标部分的参数。这样，在进行在线更新时，可以仅更新AI模型中某些部分的参数，即可达到对已有AI模型进行在线更新。

在一种可能的实现方式中，该更新模块，用于根据所述推理数据集构造目标数据集；利用所述目标数据集对所述已有AI模型进行更新。

在一种可能的实现方式中，该更新模块，用于：在所述推理数据集中，获取满足样例条件的目标数据，通过显示界面显示所述目标数据；获取用户对所述目标数据的标注结果；根据所述目标数据以及所述目标数据的标注结果，构建目标数据集。这样，由于在对已有AI模型进行更新时，构建出的目标数据集中包括用户标注的满足样例条件的目标数据，所以可以使更新后的AI模型更适用于对推理数据集的推理。

在一种可能的实现方式中，该更新模块，用于：根据所述推理数据集的数据分布与训练数据集的数据分布的差异，在所述推理数据集中，获取满足样例条件的目标数据，其中，所述目标数据适用于更新所述已有AI模型。这样，可以更准确的筛选出满足样例条件的目标数据。

在一种可能的实现方式中，所述目标数据集还包括在所述当前的标注数据中采样和/或生成适合所述推理数据集的数据分布的标注数据，所述当前的标注数据包括所述训练数据集中的数据。

在一种可能的实现方式中，所述目标数据集包括适合所述推理数据集的数据分布的未标注数据和标注数据；该更新模块，用于：利用所述目标数据集中的未标注数据，使用无监督方式对所述已有AI模型中的特征提取部分进行优化；根据优化后的特征提取部分和所述目标数据集中的标注数据，对所述已有AI模型进行更新。这样，可以先优化AI模型中的特征提取部分，然后再对已有AI模型进行更新。

在一种可能的实现方式中，所述目标数据集包括适合所述推理数据集的数据分布的未标注数据和标注数据；该更新模块，用于：利用所述已有AI模型，对所述目标数据集中的未标注数据进行标注，获得所述未标注数据的标注结果；根据所述未标注数据的标注结果和所述目标数据集中的标注数据，对所述已有AI模型进行更新。这样，由于可以对目标数据集中的未标注数据进行标注，所以可以使目标数据集中的标注数据比较多，所以可以使得更新后的AI模型的推理精度更高。

在一种可能的实现方式中，该更新模块，用于：根据所述目标数据集中数据的数据特性，获取更新所述已有AI模型的策略；根据所述策略，对所述已有AI模型进行更新。这样，由于可以使用目标数据集中数据的数据特性，选择出更新已有AI模型的策略，对已有AI模型进行更新，所以不仅可以提升更新已有AI模型的效率，而且可以使得更新后的AI模型的推理精度更高。

在一种可能的实现方式中，该获取模块，还用于获取用户输入的AI模型的更新周期；

该确定模块，用于根据所述AI模型的更新周期，确定所述推理数据集的数据分布与训练数据集的数据分布存在差异。

第三方面，提供了一种AI模型更新的计算设备，计算设备包括处理器和存储器，其中：存储器中存储有计算机指令，处理器执行计算机指令，以实现第一方面及其可能的实现方式的方法。

第四方面，提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机指令，当计算机可读存储介质中的计算机指令被计算设备执行时，使得计算设备执行第一方面及其可能的实现方式的方法，或者使得计算设备实现上述第二方面及其可能的实现方式的装置的功能。

第五方面，提供了一种包含指令的计算机程序产品，当其在计算设备上运行时，使得计算设备执行上述第一方面及其可能的实现方式的方法，或者使得计算设备实现上述第二方面及其可能的实现方式的装置的功能。

附图说明

图1为本申请实施例提供的一种AI平台100的结构示意图；

图2为本申请实施例提供的一种AI平台100的应用场景示意图；

图3为本申请实施例提供的一种AI平台100的部署示意图；

图4为本申请实施例提供的一种部署AI平台100的计算设备400的结构示意图；

图5为本申请实施例提供的一种提供的运作模式示意图；

图6为本申请实施例提供的一种AI模型更新逻辑图；

图7为本申请实施例提供的一种AI模型更新的方法的流程示意图；

图8为本申请实施例提供的一种无用户参与的AI模型更新示意图；

图9为本申请实施例提供的一种有用户参与的AI模型更新示意图；

图10为本申请实施例提供的一种AI模型更新的方法的流程示意图；

图11为本申请实施例提供的一种AI模型更新的场景示意图；

图12为本申请实施例提供的另一种确定数据分布差异的示意图；

图13为本申请实施例提供的一种更新AI模型的局部参数示意图；

图14为本申请实施例提供的一种确定目标数据的示意图；

图15为本申请实施例提供的一种AI模型更新的装置的结构示意图；

图16为本申请实施例提供的一种AI模型更新的装置的结构示意图；

图17为本申请实施例提供的一种计算设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

目前，人工智能热潮不断，机器学习是一种实现AI的核心手段，机器学习渗透至医学、交通、教育、金融等各个行业。不仅仅是专业技术人员，就连各行业的非AI技术专业也期盼用AI、机器学习完成特定任务。

为了便于理解本申请提供的技术方案和实施例，下面对AI模型、AI模型的训练、AI平台等概念进行详细说明：

AI模型，是一类用机器学习思想解决实际问题的数学算法模型，AI模型中包括大量的参数和计算公式(或计算规则)，AI模型中的参数是可以通过训练数据集对AI模型进行训练获得的数值。例如，AI模型的参数是AI模型中的计算公式或计算因子的权重。AI模型还包含一些超参数(hyper-parameter)，超参数可用于指导AI模型的构建或者AI模型的训练，超参数有多种。例如，AI模型训练的迭代(iteration)次数、学习率(leaning rate)、批尺寸(batch size)、AI模型的层数、每层神经元的个数。超参数可以是通过训练数据集对AI模型进行训练获得的参数，也可以是预先设定的参数，预先设定的参数指不会通过训练数据集对AI模型训练而更新。

AI模型多种多样，使用较为广泛的一类AI模型为神经网络模型，神经网络模型是一类模仿生物神经网络(动物的中枢神经系统)的结构和功能的数学算法模型。一个神经网络模型可以包括多种不同功能的神经网络层，每层包括参数和计算公式。根据计算公式的不同或功能的不同，神经网络模型中不同的层有不同的名称。例如，进行卷积计算的层称为卷积层，卷积层常用于对输入信号(如图像)进行特征提取。一个神经网络模型也可以由多个已有的神经网络模型组合构成。不同结构的神经网络模型可用于不同的场景(如分类、识别等)或在用于同一场景时提供不同的效果。神经网络模型结构不同具体包括以下一项或多项：神经网络模型中网络层的层数不同、各个网络层的顺序不同、每个网络层中的权重、参数或计算公式不同。业界已存在多种不同的用于识别或分类等应用场景的具有较高准确率的神经网络模型，其中，一些神经网络模型可以被特定的训练数据集进行训练后单独用于完成一项任务或与其他神经网络模型(或其他功能模块)组合完成一项任务。每个AI模型在被用于完成一项任务前通常都需要被训练。

训练AI模型，是指利用已有的样本(即训练数据集)通过一定方法使AI模型拟合已有的样本中的规律，确定AI模型中的参数。例如，训练一个用于图像分类或检测识别的AI模型需要准备一个训练图像集，根据训练图像集中的训练图像是否有标注(即：图像是否有特定的类型或名称)，可以将AI模型的训练分为监督训练(supervised training)和无监督训练(unsupervised training)。对AI模型进行监督训练时，用于训练的训练图像集中的训练图像带有标注(label)。训练AI模型时，将训练图像集中的训练图像作为AI模型的输入，将训练图像对应的标注作为AI模型的输出值的参考，利用损失函数(loss function)计算AI模型输出值与训练图像对应的标注的损失(loss)值，根据损失值调整AI模型中的参数。用训练图像集中的每个训练图像迭代地对AI模型进行训练，AI模型的参数不断调整，直到AI模型可以根据输入的训练图像准确度较高地输出与训练图像对应的标注相同的输出值。对AI模型进行无监督训练，则用于训练的图像集中的训练图像没有标注，训练图像集中的训练图像依次输入至AI模型，由AI模型逐步识别训练图像集中的训练图像之间的关联和潜在规则，直到AI模型可以用于判断或识别输入的图像的类型或特征。例如，聚类，用于聚类的AI模型接收到大量的训练图像后，可学习到各个训练图像的特征以及训练图像之间的关联和区别，将训练图像自动地分为多个类型。不同的任务类型可采用不同的AI模型，一些AI模型仅可以用监督学习的方式训练，一些AI模型仅可以用无监督学习的方式训练，还有一些AI模型既可以用监督学习的方式训练又可以用无监督学习的方式训练。经过训练完成的AI模型可以用于完成一项特定的任务。通常而言，机器学习中的AI模型都需要采用有监督学习的方式进行训练，有监督学习的方式对AI模型进行训练可使AI模型在带有标注的训练图像集中更有针对性地学习到训练图像集中训练图像与对应标注的关联，使训练完成的AI模型用于预测其他输入推理图像时准确率较高。

下面举一个用监督学习的方式训练一个用于数据分类任务的神经网络模型的例子：为了训练一个用于完成数据分类任务的神经网络模型，首先根据任务搜集数据，构建训练数据集，构成的训练数据集中包含3类数据，分别为：苹果、梨、香蕉，采集的训练数据分别按照类型存放在3个文件夹中，文件夹命名即为该文件夹内所有数据的标注。训练数据集构建好之后，选择一个可实现数据分类的神经网络模型(如卷积神经网络(convolutionalneural network，CNN))，将训练数据集中的训练数据输入至CNN中，CNN中各层的卷积核对数据进行特征提取、特征分类，最后输出数据属于每个类型的置信度(confidence)，根据置信度和数据对应的标注利用损失函数计算损失值，根据损失值和CNN结构更新CNN中每层的参数。前述训练过程持续进行，直到损失函数输出的损失值收敛或者训练数据集中所有的数据均被用于训练，则训练结束。

损失函数，是用于衡量AI模型被训练的程度(也就是用于计算AI模型预测的结果与真实目标之间的差异)的函数。在训练AI模型的过程中，因为希望AI模型的输出尽可能的接近真正想要预测的值，所以可以通过比较当前AI模型根据输入数据的预测值和真正想要的目标值(即输入数据的标注)，再根据两者之间的差异情况来更新AI模型中的参数(当然，在第一次更新之前通常会有初始化的过程，即为AI模型中的参数预先配置初始值)。每次训练都通过损失函数判断一下当前的AI模型预测的值与真实目标值之间的差异，更新AI模型的参数，直到AI模型能够预测出真正想要的目标值或与真正想要的目标值非常接近的值，则认为AI模型被训练完成。

在训练完成AI模型之后，训练完成的AI模型可以用于对数据进行推理，得到推理结果。例如，在图像分类的场景中，具体的推理过程是：将图像输入至AI模型中，AI模型中的各层的卷积核对图像进行特征提取，基于提取的特征输出图像所属的类别。在目标检测(也可以称为是物体检测)的场景中，将图像输入至AI模型中，AI模型中的各层的卷积核对图像进行特征提取，基于提取的特征输出图像包括的每个目标的边界框的位置和类别。在涵盖图像分类和目标检测的场景时，将图像输入至AI模型中，AI模型中的各层的卷积核对图像进行特征提取，基于提取的特征输出图像所属的类别，以及图像包括的每个目标的边界框的位置和类别。此处需要说明的是，对于AI模型，有些AI模型的推理能力较强，而有些AI模型的推理能力较弱。AI模型的推理能力较强指使用AI模型对图像进行推理时，推理结果的准确率大于或等于一定数值。而AI模型的推理能力较弱指使用AI模型对图像进行推理时，推理结果的准确率低于该一定数值。

数据标注，是对每个未标注数据添加在相应场景中的全部标签的过程。例如，未标注数据为未标注图像，在图像分类的场景中，为未标注图像添加所属类别，在目标检测的场景中，为未标注图像中的目标添加位置信息以及类别。当然数据标注也可以是对一个或多个未标注数据添加在相应场景中的部分标签的过程。例如，在目标检测的场景中，仅为未标注图像中的目标添加类别，而不添加目标在未标注图像中的位置信息。

AI平台，是一种为AI开发者和用户提供便捷的AI开发环境以及便利的开发工具的平台。AI平台中内置有各种解决不同问题的AI模型或者AI子模型，AI平台可以根据用户输入的需求建立适用的AI模型。即用户只需在AI平台中确定自己的需求，且按照提示准备好训练数据集上传至AI平台，AI平台就能为用户训练出一个可用于实现用户需要的AI模型。例如，用户需要一个图像分类模型，AI平台可以选择在存储的AI模型中选择一个分类模型，然后使用训练数据集，更新该分类模型，获得用户需要的AI模型。或者，用户按照提示准备好自己的算法和训练数据集，上传至AI平台，AI平台基于用户自己的算法和训练数据集，可以训练出一个可用于实现用户需要的AI模型。用户可利用训练完成的AI模型完成自己的特定任务。

需要说明的是，上文中提到的AI模型是一种泛指，AI模型包括深度学习模型、机器学习模型等。

图1为本申请实施例中的AI平台100的结构示意图，应理解，图1仅是示例性地展示了AI平台100的一种结构化示意图，本申请并不限定对AI平台100中的模块的划分。如图1所示，AI平台100包括用户输入输出(input/output，I/O)模块101、模型训练模块102、推理模块103。可选的，AI平台还可以包括AI模型存储模块104和数据存储模块105。

下面简要地描述AI平台100中的各个模块的功能：

用户I/O模块101：用于接收用户输入的推理数据集，或者用于用户建立AI平台与产生推理数据的设备的连接，从产生推理数据的设备获取推理数据集。例如，产生推理数据的设备为摄像机等。用户I/O模块101还用于接收用户输入或选择的任务目标、接收用户的训练数据集等。用户I/O模块101还用于接收用户对推理数据集中目标数据(目标数据为适应推理数据集的数据分布的样例)的标注结果、从用户获取带标注的一个或多个数据等，当然，用户I/O模块101还用于向其他用户提供AI模型等。作为用户I/O模块101的举例，可采用图形用户界面(graphical user interface，GUI)或命令行界面(CLI)实现。例如，GUI上显示AI平台100可向用户提供多种AI业务(如图像分类业务、目标检测业务等)。用户可在GUI上选择一个任务目标，例如，用户选择图像分类业务，用户可以继续在AI平台的GUI中上传未标注的多个图像等。GUI接收到任务目标和未标注的多个图像后，与模型训练模块102进行通信。模型训练模块102根据用户确定的任务目标为用户选择或者搜索可用于完成用户任务目标的初始AI模型。

可选的，用户I/O模块101还可用于接收用户输入的对完成任务目标的AI模型的效果期望。例如，输入或选择最终获得的AI模型用于人脸识别的准确率要高于99％。

可选的，用户I/O模块101还可用于接收用户输入的AI模型等。例如，用户可基于自己的任务目标，在GUI输入初始AI模型。用户I/O模块101还可用于提供各种预先内置的初始AI模型供用户选择。例如，用户可根据自己的任务目标在GUI上选择一个初始AI模型。

可选的，在AI模型应用于图像分类的场景、目标检测的场景时，用户I/O模块101还可用于接收用户输入的推理数据集中未标注图像的表层特征和深层特征。对于图像分类的场景中，表层特征包括图像的分辨率、图像的长宽比、图像的红绿蓝(RGB)的均值和方差、图像的亮度、图像的饱和度或图像的清晰度中的一种或多种，深层特征指使用特征提取模型(如CNN等)中的卷积核提取到的图像的抽象特征。对于目标检测的场景中，表层特征包括边界框的表层特征和图像的表层特征，边界框的表层特征可以包括单帧图像中每个边界框的长宽比、单帧图像中每个边界框的面积占图像面积的比例、单帧图像中每个边界框的边缘化程度、单帧图像中每个边界框的堆叠图、单帧图像中每个边界框的亮度或单帧图像中每个边界框的模糊度中的一种或多种，图像的表层特征可以包括图像的分辨率、图像的长宽比、图像的RGB的均值和方差、图像的亮度、图像的饱和度或图像的清晰度、单帧图像中框的数目或单帧图像中框的面积的方差中的一种或多种。深层特征指使用特征提取模型(如CNN等)中的卷积核提取到的图像的抽象特征。

可选的，用户I/O模块101还可用于提供GUI，用于用户对训练数据集中训练数据的标注，并且用于用户对推理数据集中的目标数据进行标注。

可选的，用户I/O模块101还可用于接收用户对初始AI模型、训练数据集中训练数据的各种配置信息等。

可选的，用户I/O模块101还可用于提供GUI，用于模型训练模块102提供更新前的AI模型的推理精度和更新后的AI模型的推理精度等，并且用于用户输入更新AI模型的指令。

可选的，用户I/O模块101还可用于提供GUI，用于用户输入AI模型的更新周期。

模型训练模块102：用于对AI模型进行训练，此处“训练”可以理解为对初始AI模型进行训练以及对完成训练的AI模型进行优化更新，初始AI模型包括未进行训练的AI模型。完成训练的AI模型指的是对初始AI模型进行训练，获得的AI模型，或者，对已有的完成训练的AI模型进行更新获得的AI模型。

模型训练模块102与用户I/O模块101、推理模块103、AI模型存储模块104均可以通信。具体的，模型训练模块102可以从用户I/O模块101获取用户标注的数据。模型训练模块102可以从AI模型存储模块104获取现有的AI模型，作为初始AI模型等。模型训练模块102可以从推理模块103获取推理数据集的推理结果以及推理数据集，基于该推理结果和推理数据集训练AI模型。

可选的，模型训练模块102还用于对用户I/O模块101接收到的训练数据集中的训练数据进行预处理操作。例如，对用户上传的训练图像集中训练图像进行预处理可使得训练图像集中训练图像在尺寸上具有一致性，还可以去除训练图像集中不恰当的训练图像。预处理后的训练数据集可适用于对初始AI模型进行训练，还可使训练的效果更优。预处理后的训练图像集还可以被存储至数据存储模块105。

可选的，模型训练模块102还可用于将用户在GUI上选择的AI模型确定为初始AI模型。或者将用户通过GUI上传的AI模型确定为初始AI模型。

可选的，模型训练模块102，还可以用于对训练的AI模型，进行评估，获得评估结果。当然对AI模型进行评估，也可以是一个单独的模块。

推理模块103使用AI模型对推理数据集进行推理，输出推理数据集的推理结果和目标数据。推理模块103与用户I/O模块101、AI模型存储模块104均可以进行通信。推理模块103从用户I/O模块101获取推理数据集，对推理数据集进行推理处理，得到推理数据集的推理结果。推理模块103将推理数据集的标注结果和目标数据反馈给用户I/O模块101。用户I/O模块101获取用户标注的目标数据、用户对推理结果的标注确认，将用户标注的目标数据和用户标注确认的推理数据反馈给模型训练模块102。模型训练模块102基于用户I/O模块101提供的目标数据和用户标注确认的推理数据，继续对优化AI模型进行训练，得到更加优化的AI模型。模型训练模块102将更加优化的AI模型传输至AI模型存储模块104进行存储，将更加优化的AI模型传输至推理模块103用于进行推理处理。

可选的，推理模块103在对推理数据集进行推理时，输出还可以包括推理数据集的数据分布与AI模型的训练数据集的数据分布的差异。此时，推理模块103将该差异提供给模型训练模块102，模型训练模块102可以基于该差异确定对AI模型的更新方式。当然推理数据集的数据分布与AI模型的训练数据集的数据分布的差异也可以不是由推理模块103确定，而是由AI平台上的独立模块确定。另外，推理数据集的数据分布与AI模型的训练数据集的数据分布的差异也可以是由模型训练模块102确定。

可选的，推理模块103还用于对用户I/O模块101接收到的推理数据集中的推理数据进行预处理操作。例如，对用户上传的推理图像集中推理图像进行预处理可使得推理图像集中推理图像在尺寸上具有一致性，还可以去除推理图像集中不恰当的推理图像。预处理后的推理数据集可适合用于对初始AI模型进行推理，还可使推理的效果更优。预处理后的推理图像集还可以被存储至数据存储模块105。

上述数据预处理操作，也可以是一个单独的模块，分别连接推理模块103和模型训练模块102，为推理模块103提供预处理后的推理数据集，并为模型训练模块102提供预处理后的训练图像集。

可选的，在AI模型更新过程中，若没有用户参与，则推理模块103可以不向用户I/O模块101提供推理数据集的推理结果和目标数据。

可选的，初始AI模型还可以包括使用训练数据集中的数据对AI模型存储模块104中的AI模型训练后的AI模型。

AI模型存储模块104：用于存储初始AI模型、更新后的AI模型、AI子模型结构和预置模型等。预置模型为AI平台上已经训练好可以直接使用的AI模型，或者为AI平台上已经进行训练但需要继续训练更新的AI模型。AI模型存储模块104与用户I/O模块101、模型训练模块102均可以进行通信。AI模型存储模块104接收并存储模型训练模块102传输的训练完成的初始AI模型和更新后的AI模型。AI模型存储模块104为模型训练模块102提供AI子模型或者初始AI模型。AI模型存储模块104对用户I/O模块101接收到的用户上传的初始AI模型，进行存储。应理解，在另一个实施例中，AI模型存储模块104也可作为模型训练模块102中的一部分。

数据存储模块105(如可以是云服务提供商提供的对象存储服务(Object StorageService，OBS)对应的数据存储资源)：用于存储用户上传的训练数据集和推理数据集，也用于存储数据预处理模块105处理后的数据，还用于存储采样或生成的适用于推理数据集的数据分布的数据。

可选的，上述是用户I/O模块获取推理数据集，当然数据存储模块105也可以直接连接数据源，获得推理数据集。例如，数据存储模块105连接有摄像机，摄像机拍摄的视频图像构成推理数据集。

可选的，数据存储模块105中还可以存储有知识库，知识库中包括有助于更快更新AI模型的知识。

需要说明的是，本申请中的AI平台可以是一个可以与用户交互的系统，这个系统可以是软件系统也可以是硬件系统，也可以是软硬结合的系统，本申请中不进行限定。

还需要说明的是，上述模型训练模块102既用于实现AI模型的初始训练，还用于实现AI模型的更新，当然在本申请实施例中，也可以分别部署用于初始训练的模块和用于AI模型更新的模块。

由于上述各模块的功能，本申请实施例提供的AI平台可以确定出推理数据集的数据分布与训练数据集的数据分布存在差异，且在存在差异的情况下，对AI模型进行更新处理，所以可以及时的对AI模型进行更新。

需要说明的是，在上述AI平台中，也可以不包括推理模块103，AI平台仅用于提供对AI模型进行更新的处理。具体的，用户将推理数据集、AI模型以及训练该AI模型的训练数据集(也可以是训练该AI模型的训练数据集的数据分布)提供给AI平台，AI平台对AI模型进行更新。AI平台向用户提供更新后的AI模型。或者，AI平台连接有第三方平台(即对推理数据进行推理的推理方平台)，AI平台从第三方平台获取推理数据集、AI模型以及训练该AI模型的训练数据集(也可以是训练该AI模型的训练数据集的数据分布)，AI平台对AI模型进行更新。AI平台向第三方平台提供更新后的AI模型。

图2为本申请实施例提供的一种AI平台100的应用场景示意图，如图2所示，在一种实施例中，AI平台100可全部部署在云环境中。云环境是云计算模式下利用基础资源向用户提供云服务的实体。云环境包括云数据中心和云服务平台，云数据中心包括云服务提供商拥有的大量基础资源(包括计算资源、存储资源和网络资源)，云数据中心包括的计算资源可以是大量的计算设备(例如服务器)。AI平台100可以独立地部署在云数据中心中的服务器或虚拟机上，AI平台100也可以分布式地部署在云数据中心中的多台服务器上、或者分布式地部署在云数据中心中的多台虚拟机上、再或者分布式地部署在云数据中心中的服务器和虚拟机上。如图2所示，AI平台100由云服务提供商在云服务平台抽象成一种AI云服务提供给用户，用户在云服务平台购买该云服务后(可预充值再根据最终资源的使用情况进行结算)，云环境利用部署在云数据中心的AI平台100向用户提供AI平台云服务。在使用AI平台云服务时，用户可以通过应用程序接口(application program interface，API)或者GUI确定要AI模型完成的任务、上传训练图像集和推理数据集至云环境，云环境中的AI平台100接收用户的任务信息、训练数据集和推理数据集，执行数据预处理、AI模型训练、使用训练完成的AI模型对推理数据集进行推理等操作。AI平台通过API或者GUI向用户返回对推理数据集的推理结果、在推理数据集中确定出的目标数据、更新前的AI模型的推理精度和更新后的AI模型的推理精度等内容。用户进一步选择是否要部署更新后的AI模型。训练完成的AI模型可被用户下载或者在线使用，用于完成特定的任务。

在本申请的另一种实施例中，云环境下的AI平台100抽象成AI云服务向用户提供时，可分为两部分，即：基础AI云服务和基于数据分布更新AI模型的云服务，该基础AI云服务可以是训练AI模型的服务。用户在云服务平台可先仅购买基础AI云服务，在需要使用更新AI模型的云服务时再进行购买，购买后由云服务提供商提供更新AI模型的云服务API，最终按照调用该API的次数对更新AI模型的云服务进行额外计费。当然，也可以仅购买更新AI模型的云服务。

本申请提供的AI平台100的部署较为灵活，如图3所示，在另一种实施例中，本申请提供的AI平台100还可以分布式地部署在不同的环境中。本申请提供的AI平台100可以在逻辑上分成多个部分，每个部分具有不同的功能。例如，在一种实施例中AI平台100包括用户I/O模块101、模型训练模块102、AI模型存储模块104和数据存储模块105。AI平台100中的各部分可以分别部署在终端计算设备、边缘环境和云环境中的任意两个或三个环境中。终端计算设备包括：终端服务器、智能手机、笔记本电脑、平板电脑、个人台式电脑、智能摄相机等。边缘环境为包括距离终端计算设备较近的边缘计算设备集合的环境，边缘计算设备包括：边缘服务器、拥有计算能力的边缘小站等。部署在不同环境或设备的AI平台100的各个部分协同实现为用户提供构建的AI模型确定和训练等功能。例如，在一种场景中，终端计算设备中部署AI平台100中的用户I/O模块101、数据存储模块105，边缘环境的边缘计算设备中部署AI平台100中的模型训练模块102、推理模块103和AI模型存储模块104。用户将训练数据集和推理数据集发送至终端计算设备中的用户I/O模块101，终端计算设备将训练数据集和推理数据集存储至数据存储模块105。边缘计算设备中模型训练模块102基于推理数据集对AI模型进行更新。应理解，本申请不对AI平台100的哪些部分部署具体部署在什么环境进行限制性的划分，实际应用时可根据终端计算设备的计算能力、边缘环境和云环境的资源占有情况或具体应用需求进行适应性的部署。上述是以用户需要输入训练数据集为例说明，当然，用户也可以不输入训练数据集，用户可以直接输入训练数据集的分布，或者，模型训练模块102分析当前已有AI模型，确定出训练数据集的分布。

AI平台100也可以单独部署在任意环境中的一个计算设备上(如单独部署在边缘环境的一个边缘服务器上)。图4为部署有AI平台100的计算设备400的硬件结构示意图，图4所示的计算设备400包括存储器401、处理器402、通信接口403以及总线404。其中，存储器401、处理器402、通信接口403通过总线404实现彼此之间的通信连接。

存储器401可以是只读存储器(Read Only Memory，ROM)，随机存取存储器(RandomAccess Memory，RAM)，硬盘，快闪存储器或其任意组合。存储器401可以存储程序，当存储器401中存储的程序被处理器402执行时，处理器402和通信接口403用于执行AI平台100为用户训练AI模型、确定推理数据集的数据分布与训练数据集的数据分布存在差异、基于推理数据集更新AI模型的方法。存储器还可以存储数据集。例如，存储器401中的一部分存储资源被划分成一个数据存储模块105，用于存储AI平台100所需的数据，存储器401中的一部分存储资源被划分成一个AI模型存储模块104，用于存储AI模型库。

处理器402可以采用中央处理器(CPU)，应用专用集成电路(ASIC)，图形处理器(GPU)或其任意组合。处理器402可以包括一个或多个芯片。处理器402可以包括AI加速器，例如神经网络处理器(neural processing unit，NPU)。

通信接口403使用例如收发器一类的收发模块，来实现计算设备400与其他设备或通信网络之间的通信。例如，可以通过通信接口403获取数据。

总线404可包括在计算设备400各个部件(例如，存储器401、处理器402、通信接口403)之间传送信息的通路。

在本申请实施例中，AI模型更新的方法中，在对已有AI模型进行更新时，可以有多种运作模式，如可以包括在线单节点自更新、在线多节点协同更新和离线多节点协同更新。在线单节点自更新是指部署了AI模型的每个计算节点相互独立，只使用自身接入的数据在线进行AI模型更新；在线多节点协同更新是指在不同的计算节点之间增加数据通信，允许计算节点之间交换接入的数据，那么一个计算节点在线进行模型更新时，不仅可以使用自身接入的数据，还可以使用其它计算节点共享的数据；离线多节点协同更新是指AI模型更新可以同时以离线的方式进行，在这种模式下，各个计算节点接入的数据可以汇总到一起，统一供离线更新AI模型时使用，离线更新好AI模型之后，再向各计算节点进行推送更新后的AI模型。这三种运作方式，分别对应图5所示的图5中的(a)、图5中的(b)和图5中的(c)。

具体的，在对已有AI模型进行更新时，可以根据实际情况，选择合适的运作模式(详细过程后文中有描述)。例如，在推理数据集的数据分布与训练数据集的数据分布变化不大时，采用在线单节点自更新；在推理数据集的数据分布与训练数据集的数据分布变化比较大时，采用离线多节点协同更新等。

在本申请实施例中，还提供了如图6所示的AI模型更新逻辑图：

图6中包括数据源、离线更新、在线更新和知识库等，数据源包括AI模型更新方法所应用的场景的数据。知识库包括模型训练的先验知识和/或领域知识，先验知识和/或领域知识可以提供模型更新策略选择的依据，并且还可以提供AI模型更新过程指导模型更新的策略。例如，用户需要一个检测猫的AI模型，AI平台从领域知识中获得猫和老虎均属于猫科动物，且具有相似性，当前AI平台已经有检测老虎的AI模型，AI平台可以获取检测老虎的AI模型，然后使用猫的图像对检测老虎的AI模型进行更新，获得检测猫的AI模型。再例如，用户对AI模型的推理速度、占用内存、硬件设备中的一种或多种有要求，AI平台可以基于用户的要求和知识库，选取符合用户要求的AI模型架构，或者预置模型。

在线更新指的是在线自适应更新AI模型。离线更新指的是离线更新AI模型。在离线更新时，使用的数据可以包括真实数据(如推理数据集中的数据)、采样或生成的适应推理数据集的标注数据(在图6中简称为生成的数据)，当然使用的数据还可以包括数据特性，数据特性指的是各种类型数据的统计量、分布等信息。图6中左下角方框中的“离线更新”指代的是离线更新的过程，包括获取更新AI模型的数据，基于该数据对已有AI模型进行更新，此处需要说明的是，在离线更新时，可以是对已有AI模型的参数进行调整，也可以是重新训练一个新的AI模型作为更新后的AI模型，在重新训练一个新的AI模型时，离线更新的过程还包括从AI模型存储模块104中获取初始的模型的处理。在线更新时，使用的数据(可以简称为在线数据)可以包括从真实数据中获取的数据、采样或生成的适应推理数据集的标注数据等。

下面结合图7描述AI模型更新的方法的具体流程，以该方法由AI平台执行为例进行说明：

步骤701，AI平台获取推理数据集。

其中，推理数据集中的推理数据用于输入至已有AI模型执行推理，已有AI模型也可以称为是更新前的AI模型。

在本实施例中，用户可以向AI平台输入推理数据集，或者AI平台从连接的推理数据源，获得推理数据集等。例如，AI平台连接有摄像头，AI平台可以从摄像头持续获取数据，作为推理数据集中的数据，摄像头为推理数据源。该推理数据集中的数据为未标注数据。

步骤702，AI平台确定推理数据集的数据分布与训练数据集的数据分布存在差异。

其中，训练数据集为训练已有AI模型所使用的数据集。

在本实施例中，AI平台可以在每次获得推理数据集时，确定推理数据集的数据分布，并且获取训练数据集的数据分布。或者，AI平台可以在每次在达到AI模型的更新周期时，确定推理数据集的数据分布，并且获取训练数据集的数据分布，该AI模型的更新周期可以由用户设置。

AI平台判断推理数据集的数据分布与训练数据集的数据分布是否存在差异，若推理数据集的数据分布与训练数据集的数据分布存在差异，则执行步骤703，反之不进行后续处理，原因为：推理数据集的数据分布与训练数据集的数据分布存在差异，大概率说明已有AI模型有可能不适用于推理数据集，对已有AI模型进行更新处理，以适应推理数据集。在推理数据集的数据分布与训练数据集的数据分布不存在差异时，说明已有AI模型还适用于推理数据集，可以不对已有AI模型进行更新处理，以节约处理资源。

此处，获取训练数据集的数据分布的过程可以是：AI平台可以获取到训练数据集，基于训练数据集，确定训练数据集的数据分布，也可以是AI平台从用户获取到的训练数据集的数据分布，也可以是AI平台基于已有AI模型对推理数据集的推理结果，分析获得训练数据集的数据分布。

步骤703，AI平台利用推理数据集，对已有AI模型进行更新，获得更新后的AI模型。

在本实施例中，AI平台在确定推理数据集的数据分布与训练数据集的数据分布存在差异时，可以基于推理数据集，对已有AI模型进行更新，获得更新后的AI模型。

这样，由于数据分布的变化可以感知，所以可以根据数据分布的变化，及时的对已有AI模型进行更新。

在一种可能的实现方式中，已有AI模型部署在推理平台(推理平台可以为AI平台一部分，如推理平台包括前文中提到的推理模块等，也可以是独立于AI平台之外的平台)，在步骤703之后，AI平台可以比较更新后的AI模型和已有AI模型的推理精度，确定更新后的AI模型的推理精度优于已有AI模型的推理精度；将更新后的AI模型部署至推理平台，以使更新后的AI模型代替已有AI模型执行推理。

在本实施例中，AI平台可以使用适应训练数据集的数据分布的测试数据集和适应推理数据集的数据分布的测试数据集，分别对更新后的AI模型进行评估，获得第一评估结果和第二评估结果，使用适应推理数据集的数据分布的测试数据集和适应训练数据集的数据分布的测试数据集，分别对已有AI模型进行评估，获得第三评估结果和第四评估结果。若第一评估结果未显著低于第四评估结果，且第二评估结果优于第三评估结果，则确定更新后的AI模型的推理精度优于已有AI模型的推理精度。AI平台可以向推理平台提供更新后的AI模型(具体可以是提供更新后的AI模型的全部内容，也可以是提供更新后的AI模型与已有AI模型的区别内容)，推理平台可以使用更新后的AI模型代替已有AI模型执行推理处理。

需要说明的是，对已有AI模型和更新后的AI模型的评估时，可以采用准确率-召回率(Precision Recall，PR)曲线、平均精度(Average Precision，AP)指标、误报率、漏报率、中的一种或多种。当然对不同类型的AI模型进行评估时，可以使用不同的评估指标，如在目标检测场景中，除了使用PR曲线、AP指标等，还可以使用目标框的交并比分布、不同交并比下AP的平均值等。此处是以PR曲线为例，当然，也可以是盒图、混淆矩阵等各种图表，而不局限于PR曲线

上述是以推理精度评估AI模型，当然还可以使用推理速度，即AI平台将推理精度和推理速度的综合结果，作为评估AI模型的依据。

在一种可能的实现方式中，用户可以决定是否部署更新后的AI模型，AI平台在确定更新后的AI模型的推理精度优于已有AI模型的推理精度时，可以通过显示界面显示已有AI模型的推理精度和更新后的AI模型的推理精度。用户可以基于二者的推理精度判断是否要部署更新后的AI模型，在确定部署更新后的AI模型时，用户可以触发更新AI模型，AI平台则会接收用户对已有AI模型的更新指令。AI平台可以向推理平台提供更新后的AI模型。

此处在显示推理精度时，AI平台在显示界面中还可以显示其它有助于展现更新后的AI模型的模型特性的信息或者用户指定的信息，如梯度变化趋势、训练的损失函数下降趋势、验证集精度变化趋势、中间输出结果或中间特征可视化中的一种或多种。

在一种可能的实现方式中，在步骤703中，可以按照差异的不同，采用不相同的更新方式：

若差异达到离线更新条件，则AI平台利用推理数据集对已有AI模型进行离线更新；若差异未达到离线更新条件，则AI平台利用推理数据集对已有AI模型进行在线更新。

其中，离线更新条件是预先设定的。例如，本申请实施例中针对图像，离线更新条件为图像的重构误差与训练图像集的重构误差大于第一数值、图像的特征对应的预测图像与原图像的预测误差大于第二数值等。还例如，本申请实施例针对交换机进行异常检测，推理数据集中的数据为丢包率，离线更新条件为推理数据集中的最大丢包率与训练数据集中最大丢包率的差值大于第三数值等。

在本实施例中，AI平台可以判断推理数据集的数据分布与训练数据集的数据分布的差异是否达到离线差异条件。若该差异达到离线差异条件，说明推理数据集的数据分布与训练数据集的数据分布的差异比较大，已有AI模型不再适用于推理数据集的推理，在线更新会比较慢，不适用于在线更新，AI平台利用推理数据集对已有AI模型进行离线更新。

若该差异未达到离线差异条件，说明推理数据集的数据分布与训练数据集的数据分布的差异不是很大，已有AI模型虽然不再适用于推理数据集的推理，但是在线更新即可，AI平台利用推理数据集对已有AI模型进行在线更新。

这样，可以基于推理数据集的数据分布与训练数据集的数据分布的差异，灵活的选择更新方式。

在一种可能的实现方式中，在进行在线更新时，可以基于推理数据集的数据分布与训练数据集的数据分布的差异，确定更新后的AI模型中的参数，具体为：

AI平台利用推理数据集的数据分布与训练数据集的数据分布的差异，确定已有AI模型的目标部分的参数变化量；基于已有AI模型中目标部分当前的参数和参数变化量，确定更新后的AI模型中目标部分的参数。

其中，目标部分为已有AI模型中的一个子模型，或者为已有AI模型的全部子模型。

在本实施例中，AI平台可以获取数据分布的变化与参数变化量的关系，该关系可以是AI平台预先建模获得，或者，从其他平台获得。AI平台可以获取数据分布的变化与参数变化量的关系，使用推理数据集的数据分布与训练数据集的数据分布的差异，数据分布的变化与参数变化量的关系，确定出目标部分的参数变化量。然后AI平台使用已有AI模型中目标部分当前的参数和参数变化量，确定更新后的AI模型中目标部分的参数，AI平台将目标部分的参数替换到已有AI模型，即获得更新后的AI模型。这样，可以在线更新AI模型的部分或全部参数。

在一种可能的实现方式中，在对已有AI模型进行更新时，可以基于一个数据集(后续可以称为是目标数据集)，对已有AI模型进行更新处理，处理如下：

AI平台根据推理数据集构造目标数据集；利用目标数据集对已有AI模型进行更新。

在本实施例中，已有AI模型可以使用推理数据集，构造出一个目标数据集，如在推理数据集中采样一些数据，作为目标数据集中的数据等。然后AI平台利用该目标数据集，对已有AI模型进行更新处理，获得更新后的AI模型。

在一种可能的实现方式中，在利用目标数据集对已有AI模型进行更新时，用户可以参与构建目标数据集，也可以不参与目标数据集。在用户参与构建目标数据集时，用户可以对推理数据的推理结果进行确认，或者对AI平台提供的目标数据进行标注，此时目标数据集中包括标注数据，AI平台可以使用监督学习技术等对已有AI模型进行更新。另外，AI平台也可以在必要时使用无监督学习技术更新已有AI模型，另外AI平台也可以通过迁移学习和领域适应技术对已有AI模型进行微调和适配。

在用户未参与构建目标数据集时，AI平台可以采用无监督学习技术更新已有AI模型，或者采用半监督学习技术更新已有AI模型。

具体处理为：1、可以基于用户的参与，构造目标数据集：AI平台在推理数据集中，获取满足样例条件的目标数据，通过显示界面显示目标数据；获取用户对目标数据的标注结果；根据目标数据以及目标数据的标注结果，构造目标数据集。

其中，样例条件用于指示推理数据集中典型的数据。

在本实施例中，AI平台可以在推理数据集中，确定满足样例条件的目标数据。然后AI平台通过显示界面显示目标数据，具体的，目标数据可以是推理数据集中未标注的数据，也可以是推理数据集经过推理后带有标注的数据。在目标数据为推理数据集中未标注的数据时，用户可以在显示界面，对目标数据进行标注，AI平台则会获取到用户对目标数据的标注结果。在目标数据为推理数据集经过推理后带有标注的数据，用户可以在显示界面，对目标数据已有的标注进行确认，AI平台也可以获得用户对目标数据的标注结果。AI平台可以将目标数据和目标数据的标注结果，作为目标数据集的部分标注数据。

2、在用户参与的情况下，AI平台可以通过显示界面显示推理数据集的推理结果，用户对推理结果，进行标注确认，AI平台可以获取标注确认的推理结果，作为目标数据集中的标注数据。另外，用户对推理结果进行标注确认的同时，如果发现新的类别，可以在标注确认结果中添加新的类别的标注，该新的类别的标注也作为目标数据集中的标注数据。

3、在用户未参与的情况下，目标数据集中还可以包括AI平台在当前的标注数据中，采样和/或生成适合推理数据集的数据分布的数据。当前的标注数据可以包括训练数据集中的数据，还可以包括已有的其它场景中的标注数据。此处“采样”指的是在当前的标注数据中，查找到适合推理数据集的数据分布的数据，此处“生成”指的是基于当前的标注数据和数据生成算法，生成适合推理数据集的数据分布的数据。这样，在现有的适应推理数据集的数据分布的数据比较少时，也可以提供出比较多的适应推理数据集的数据分布的数据，便于更新AI模型。

需要说明的是，在用户参与时，用户可以实时参与标注数据，AI平台可以实时使用用户标注的标注数据进行训练。

在一种可能的实现方式中，利用目标数据集对已有AI模型进行更新的处理可以为：

AI平台根据所述目标数据集中数据的数据特性，获取更新所述已有AI模型的策略；根据所述策略，对所述已有AI模型进行更新。

在本实施例中，AI平台可以使用目标数据集中数据的数据特性，使用知识库的中的先验知识和/或领域知识，选择更新已有AI模型的策略。然后AI平台使用该策略，对已有AI模型进行更新，获得更新后的AI模型。

例如，如果目标数据集中的标注数据比较少，基于知识库中的先验知识，获得在标注数据比较少时，使用迁移学习和/或小样本学习技术。AI平台可以使用迁移学习和/或小样本学习技术更新已有AI模型。

如果目标数据集中标注数据比较多，基于知识库中的先验知识，获得在标注数据比较多时，使用强监督技术。AI平台可以使用强监督技术，更新AI模型。需要说明的是，这里的强监督技术只是一种统称，仅作为示意，具体实现中，其可能为某一种具体的强监督训练方法，针对不同的任务和场景，对应的训练方法不同。

在一种可能的实现方式中，在AI模型更新过程中，没有用户的参与，目标数据集的标注数据是在当前的标注数据中，采样和/或生成适合推理数据集的数据分布的数据。目标数据集包括适合推理数据集的数据分布的未标注数据和标注数据，AI平台可以利用目标数据集中的未标注数据，使用无监督方式对已有AI模型中的特征提取部分进行优化；根据优化后的特征提取部分和目标数据集中的标注数据，对已有AI模型进行更新。

在本实施例中，在目标数据集中包括未标注数据和适合推理数据集的数据分布的标注数据时，AI平台可以利用目标数据集中的未标注数据，使用无监督方式，对已有AI模型中的特征提取部分进行优化，获得优化后的特征提取部分。此处的无监督方式可以是自监督方式等。然后AI平台可以使用优化后的特征提取部分和适应推理数据集的数据分布的标注数据，进一步对已有AI模型进行更新，获得更新后的AI模型。这样，在用户未参与的情况下，也能对已有AI模型进行更新。例如，如图8所示，在没有用户的参与的情况下，AI平台在对推理数据集进行推理时，获取推理结果和目标数据，仅会将推理结果提供给用户，而不会将目标数据提供给用户(图8中的(a)所示)。AI平台对已有AI模型进行更新，在对已有AI模型进行更新后，可以将更新后的AI模型提供给用户(图8中的(b)所示)。后续AI平台可以使用更新后的AI模型进行推理，获得推理结果和目标数据，将推理结果提供给用户(图8中的(c)所示)。当然，在图8中，也可以不输出目标数据。

需要说明的是，此处是基于优化后的特征提取部分和目标数据集中的标注数据，对已有AI模型进行更新，当然也可以是基于优化后的特征提取部分、目标数据集中的未标注数据和标注数据，对已有AI模型进行更新。

在一种可能的实现方式中，在AI模型更新过程中，没有用户的参与，目标数据集的标注数据是在当前的标注数据中，采样和/或生成适合推理数据集的数据分布的数据。目标数据集包括适合推理数据集的数据分布的未标注数据和标注数据，AI平台可以利用已有AI模型，对目标数据集中的未标注数据进行标注，获得目标数据集中的标注数据；利用所述已有AI模型，对所述目标数据集中的未标注数据进行标注，获得所述未标注数据的标注结果。根据所述未标注数据的标注结果和所述目标数据集中的标注数据，对所述已有AI模型进行更新。

在本实施例中，在目标数据集中的数据为未标注数据时，AI平台利用已有AI模型，对目标数据集中的未标注数据进行标注，获得未标注数据的标注结果(此处的标注结果有可能是不准确的标注，可以称为是“伪标注”)和对应的置信度。然后AI模型使用置信度比较高的标注结果(如置信度高于预设阈值的标注结果)和目标数据集中的标注数据，对已有AI模型进行更新，获得更新后的AI模型。

或者，AI模型使用置信度比较高的标注结果，对已有AI模型进行训练，获得训练后的AI模型。然后AI平台可以使用目标数据集中的标注数据(这部分标注数据是经过采样和/或生成适合所述推理数据集的数据分布的标注数据)，进一步对训练后的AI模型进行更新，获得更新后的AI模型。这样，在用户未参与的情况下，也能对已有AI模型进行更新。

在一种可能的实现方式中，在AI模型更新过程中，有用户的参与，AI平台可以基于目标数据集中的标注数据，使用强监督学习技术，更新已有AI模型。具体的，在任务没有发生变化的情况下，直接使用强监督学习技术，更新已有AI模型，获得更新后的AI模型。在任务发生变化的情况下(如出现了新的类别需要分类等)，若目标数据集中新的类别的标注数据的数目比较少，AI平台可以选择小样本学习技术更新已有AI模型。

例如，如图9所示，在有用户的参与的情况下，AI平台在对推理数据集进行推理时，获得推理结果和目标数据，会将推理结果和目标数据提供给用户(图9中的(a)所示)。用户可以向AI平台提供对推理结果的标注确认和/或多目标数据的标注结果(即标注数据)(图9中的(b)所示)。AI平台可以基于用户提供的标注数据，更新已有AI模型，获得更新后的AI模型，将更新后的AI模型提供给用户(图9中的(c)所示)。后续AI平台可以使用更新后的AI模型进行推理，获得推理结果和目标数据，提供给用户(图9中的(d)所示)。

另外，在任务没有发生变化的情况，若目标数据集中标注数据的数目比较少，则AI平台还可以在当前的标注数据中，采样和/或生成适合推理数据集的数据分布的数据，扩充目标数据集中的标注数据。

另外，在选择小样本学习技术更新已有AI模型时，还可以使用表示学习方式，调优已有AI模型的特征提取部分。

在一种可能的实现方式中，AI平台确定推理数据集的数据分布与训练数据集的数据分布的差异的过程为：

AI平台获取建模数据分布的概率模型，此处可以是AI平台自身建模获得该概率模型，也可以是从其它平台获得该概率模型。AI平台可以使用该概率模型提取训练数据集的特征，拟合一个混合高斯分布。AI平台可以在训练数据集的特征上拟合高斯分布，确定推理数据集的似然，该似然即表示训练数据集的数据分布与推理数据集的数据分布的差异，在似然越大时，表征该差异越小，反之该差异越大。

此处需要说明的是，进行概率建模时，使用的分布可以是混合高斯分布、参数化的分布拟合方法等，当然也可以是其它分布、非参数化的分布拟合算法、复杂的概率图模型等。

需要说明的是，上述仅描述了一次对已有AI模型进行更新的过程，在使用过程中可以持续循环对已有AI模型进行更新。如图10所示，提供了AI模型更新的循环示意图：步骤1001，AI平台获取推理数据集。步骤1002，AI平台判断推理数据集的数据分布与训练数据集的数据分布存在差异。步骤1003，AI平台利用推理数据集，对当前的已有AI模型进行更新，获得更新后的AI模型。步骤1004，部署更新后的AI模型，更新后的AI模型即为当前已有AI模型。步骤1005，AI平台返回执行步骤1002。

图10中仅描述了一个循环的过程，只要不停止对AI模型的更新，实际是一直在循环中。具体的，即AI平台接入推理数据源，会一直从推理数据源获取到推理数据集中的数据，确定出推理数据集的数据分布，继而判断与训练数据集的数据分布是否存在差异，在存在差异时，即更新已有AI模型，部署更新后的AI模型，然后返回步骤1002。步骤1001和步骤1002，与步骤1003和步骤1004是异步关系，这是由于：推理数据集中的数据是一直更新的，会一直判断推理数据集的数据分布与训练数据集的数据分布是否存在差异。而步骤1003和步骤1004是在推理数据集的数据分布与训练数据集的数据分布存在差异时，才会执行。

用户可以向AI平台输入停止指令，控制AI平台更新已有AI模型。或者AI平台确定推理数据集的数据分布与训练数据集的数据分布的差异比较小，且更新后的AI模型相比已有AI模型(即更新前的AI模型)的精度变化比较小，则AI平台可以主动停止更新AI模型。

在停止更新AI模型后，AI平台再次确定推理数据集的数据分布与训练数据集的数据分布的差异比较大，则可以向用户提供更新提示消息(如通过短消息将更新提示消息发送至用户的终端、通过显示界面显示更新提示消息等)，AI平台在接收到用户输入的确认更新指令时，可以重新启动更新AI模型的流程。当然AI在再次确定推理数据集的数据分布与训练数据集的数据分布的差异比较大时，可以主动启动更新AI模型的流程。

本申请实施例中，AI模型更新的方法可以应用于识别图像中动作的应用场景中。例如，应用于物流场景中不规范分拣动作的识别。在该应用场景中，AI平台可以基于已有AI模型进行推理和更新已有AI模型。

在该应用场景中，推理数据集为用户的监控视频数据，并且已有AI模型是可以进行不规范分拣动作识别的模型。在该应用场景中，训练数据集也是视频数据。该场景中的示意图为：如图11所示，AI平台包括：视频推理模块(即前文中的推理模块103)、存储服务模块(即前文中的数据存储模块105)、模型训练模块(即前文中的模型训练模块102)、用户I/O模块(即前文中的用户I/O模块101)等。视频推理模块用于推理从摄像头获取的推理数据集，存储服务模块用于存储推理数据集等，模型训练模块用于更新已有AI模型，用户I/O模块用于与用户进行交换。

AI模型更新的流程可以包括确定推理数据集的数据分布与训练数据集的数据分布的差异的过程、在线更新已有AI模型的过程、对推理数据集进行推理的过程、为用户提供目标数据的处理、离线更新已有AI模型的过程等。

1、确定推理数据集的数据分布与训练数据集的数据分布的差异的过程：

对于给定的输入推理数据集，AI平台可以抽取推理数据集中的视频帧，通过存储的深度神经网络提取视频帧的深度特征，和/或通过其它算法提取非深度特征。例如，非深度特征为帧差、光流等。帧差指的是相邻两帧图像相减的结果，光流指的是相邻两帧图像之间像素的位置变化关系，是像素移动的位移场。

此处需要说明的是，如果推理数据集中是视频流或者一段时间的连续视频，AI平台可以通过滑动窗口或者视频片段分割的方式，来获取合适时长的短时视频作为输入。抽取推理数据集中的视频帧所采用的方式包括但不限于抽取全部视频帧、均匀采样、非均匀采样、多尺度采样等。非均匀采样可以为基于关键帧、帧间相似度等对视频帧进行选择，具体可以是选择关键帧、帧间相似度小于一定数值的视频帧等。多尺度采样可以是采用不同的采样间隔得到多段短视频，分别提取深度特征，将提取的深度特征进行整合，获得上述深度特征。深度神经网络包括但不限于二维/三维卷积神经网络、循环神经网络、长短期记忆网络、双流卷积神经网络等及其组合和变体。

AI平台中存储有视频预测模型，该视频预测模型可以是AI平台自身建立，也可以是从其它平台获取。如图12所示，AI平台可以使用上述提取到的特征(特征包括深度特征和/或非深度特征)对未来的视频帧进行预测。然后AI平台计算预测的视频帧和推理数据集中的实际视频帧之间的预测误差，使用一次预测的预测误差或者多次预测的预测误差的平均值，表示训练数据集的数据分布与推理数据集的数据分布的差异。具体的，在对未来的视频帧进行预测时，AI平台可以预测一个帧或多个帧。上述视频预测模型包括但不限于二维/三维卷积神经网络、循环神经网络、生成对抗网络、变分自编码器等及其组合和变体。

上述建模数据分布时，也可以采用其它方式，如还可以采用视频插帧、视频重构、计算帧间相似性等方式。视频插帧指的是通过非相邻视频帧来预测中间间隔的视频帧。视频重构指的是基于当前视频帧的特征，重构出当前视频帧的重构视频帧，比较重构视频帧与当前视频帧，获得重构误差，使用一个视频帧的重构误差或者多个视频帧的重构误差的平均值，表示训练数据集的数据分布与推理数据集的数据分布的差异。计算帧间相似性指的是计算相邻两个视频帧的相似度，使用一个视频帧的相似度或者，多个相邻两个视频帧的相似度的平均值表示训练数据集的数据分布与推理数据集的数据分布的差异。

另外，在建模数据分布时，在空间维度可以采用各视频帧的整体图像进行建模，也可以采用各视频帧的局部区域进行建模，或者将二者进行结合。在时间维度上也可以采用类似的整体(考虑一整段视频)、局部(考虑一整段视频中的部分视频)或者两者相结合的建模方式。

在计算预测误差时，AI平台可以采用任何符合任务需求的度量，包括但是不限于L1距离(预测的两个视频帧的差值)、L2距离(预测的两个视频帧的差值的平方)、Wasserstein距离(也可以称为推土距离(earth mover distance))、可学习度量等及其组合和变体。

上述描述中，推理数据集的数据分布与训练数据集的数据分布的差异直接使用预测误差表示，当然，也可以采用对预测误差进行线性或非线性变换的结果表示。

上述确定数据分布的变化的流程在图12中有说明。

2、在线更新已有AI模型的过程：

在本实施例中，在推理数据集的数据分布与训练数据集的数据分布的差异小于差异值时，AI平台可以在线更新已有AI模型。具体的：如图13所示，AI平台可以将推理数据集的数据分布与训练数据集的数据分布的差异，输入至参数生成器(参数生成器建模参数变化量与数据分布差异的对应关系)，该参数生成器的输出即为前文中提到的目标部分的参数变化量。AI平台将已有AI模型中目标部分当前的参数的取值与参数变化量相加，获得更新后的AI模型中的目标部分的参数的取值。

此处使用推理数据集的数据分布与训练数据集的数据分布的差异，确定出目标部分的参数变化量，当然也可以使用推理数据集中的部分或全部数据、该差异，确定目标部分的参数变化量，本申请实施例不做限定。

3、对推理数据集进行推理的过程：

在本实施例中，已有AI模型(或者更新后的AI模型)对推理数据集中的视频帧进行推理，输出动作识别的推理结果，AI平台通过显示界面显示该推理结果。

4、为用户提供目标数据的处理：

AI平台可以根据推理数据集的数据分布与训练数据集的数据分布的差异，在推理数据集中，获取满足样例条件的目标数据。

在本实施例中，AI平台可以使用推理数据集的数据分布与训练数据集的数据分布的差异，在推理数据中，筛选出满足样例条件的目标数据，该样例条件下的目标数据适用于更新已有AI模型。

可选的，AI平台可以使用不确定性，确定目标数据，处理为：

AI平台可以使用已有AI模型对推理数据中各推理数据推理的不确定性，该不确定性可以使用动作类别概率、信息熵、互信息、方差中的任一种表示。

然后AI平台使用推理数据集的数据分布与训练数据集的数据分布的差异、各推理数据对应的不确定性，在推理数据集中，获取满足样例条件的目标数据。

具体的，在不确定性使用动作类别概率表示，推理数据集的数据分布与训练数据集的数据分布的差异使用预测误差表示，使用L1距离来度量预测误差，用动作类别概率的熵来度量不确定性，则目标数据满足的样例条件为：

在式(1)中，x表示目标数据(也可以称为是样例)，第一项I(x)表示实际视频帧，

表示预测视频帧，第二项中p_i(x)表示x对应的第i类动作的概率，λ₁和λ₂作为超参数分别为两项的权重用于权衡二者的作用，x^*表示选择出来有待标注的目标数据。式(1)的含义是：满足

取最大值时的x为x^*，这样，可以获取到推理数据集中典型的数据，更适用于更新已有AI模型，使更新后的AI模型的推理精度更好。

如图14所示，AI平台将目标数据提供给用户，用户对x^*进行标注，获得标注结果y^*。AI平台基于{x^*，y^*}更新已有AI模型。

5、离线更新已有AI模型的过程：

AI平台可以采用监督技术更新已有AI模型，可以是基于目标数据集对已有AI模型进行调优，也可以是基于目标数据集直接重新训练一个AI模型，作为更新后的AI模型。在对已有AI模型进行更新时，更新参数采用的优化算法包括但是不限于随机梯度下降算法、共轭梯度下降算法等。

评估更新后的AI模型的过程和部署更新后的AI模型的过程与前文中的描述相同，此处不再赘述。

这样，通过本申请实施例的技术方案，可以感知数据分布的变化，一方面利用AI模型本身的自适应能力进行局部参数的调整，另一方面和用户交互获取新的标注数据离线进行AI模型的整体更新，从而不断适应新的数据分布，保证AI模型推理精度。另外，AI平台可以控制AI模型持续自动进行更新，无需用户具有算法相关的专业知识。

另外，本申请实施例中，可以在有用户参与、无用户参与的情况下，对AI模型进行更新。并且在对AI模型机型更新时，不受标注数据的数目限制，并且不受任务变化或不变化的限制，并且可以适用于任何形式的推理数据集，如成批数据(连续100张图片)、流式数据(逐步产生的视频数据)等。

图15是本申请实施例提供的AI模型更新的装置的结构图。该装置可以通过软件、硬件或者两者的结合实现成为装置中的部分或者全部。在一些实施例中，AI模型更新的装置可以是前述AI平台100的部分或者全部。

本申请实施例提供的装置可以实现本申请实施例图7所述的流程，该装置包括：获取模块1510、确定模块1520和更新模块1530，其中：

获取模块1510，用于获取推理数据集，其中，所述推理数据集中的推理数据用于输入至已有AI模型执行推理，具体可以用于实现步骤701的获取功能以及执行步骤701包含的隐含步骤；

确定模块1520，用于确定所述推理数据集的数据分布与训练数据集的数据分布存在差异，其中，所述训练数据集为训练所述已有AI模型所使用的数据集，具体可以用于实现步骤702的确定功能以及执行步骤702包含的隐含步骤；

更新模块1530，用于利用所述推理数据集，对所述已有AI模型进行更新，获得更新后的AI模型，具体可以用于实现步骤703的更新功能以及执行步骤703包含的隐含步骤。

在一种可能的实现方式中，所述已有AI模型部署在推理平台，所述确定模块1520，还用于在获得更新后的AI模型之后，比较所述更新后的AI模型和所述已有AI模型的推理精度，确定所述更新后的AI模型的推理精度优于所述已有AI模型的推理精度；

所述更新模块1530，还用于将所述更新后的AI模型部署至所述推理平台，以使所述更新后的AI模型代替所述已有AI模型执行推理。

在一种可能的实现方式中，如图16所示，所述装置还包括：显示模块1540，用于将所述更新后的AI模型部署至所述推理平台，代替所述已有AI模型执行推理之前，通过显示界面显示所述已有AI模型的推理精度和所述更新后的AI模型的推理精度；

接收模块1550，用于接收用户对所述已有AI模型的更新指令。

在一种可能的实现方式中，所述更新模块1530，用于：

若所述差异达到离线更新条件，则利用所述推理数据集对所述已有AI模型进行离线更新；

若所述差异未达到所述离线更新条件，则利用所述推理数据集对所述已有AI模型进行在线更新。

在一种可能的实现方式中，所述更新模块1530，用于：

利用所述推理数据集的数据分布与所述训练数据集的数据分布的差异，确定所述已有AI模型的目标部分的参数变化量；

基于所述已有AI模型中所述目标部分当前的参数和所述参数变化量，确定更新后的AI模型中所述目标部分的参数。

在一种可能的实现方式中，所述更新模块1530，用于：

根据所述推理数据集构造目标数据集；

利用所述目标数据集对所述已有AI模型进行更新。

在一种可能的实现方式中，所述更新模块1530，用于：

在所述推理数据集中，获取满足样例条件的目标数据，通过显示界面显示所述目标数据；

获取用户对所述目标数据的标注结果；

根据所述目标数据以及所述目标数据的标注结果，构建目标数据集。

在一种可能的实现方式中，所述更新模块1530，用于：

根据所述推理数据集的数据分布与训练数据集的数据分布的差异，在所述推理数据集中，获取满足样例条件的目标数据，其中，所述目标数据适用于更新所述已有AI模型。

在一种可能的实现方式中，所述目标数据集包括适合所述推理数据集的数据分布的未标注数据和标注数据；

所述更新模块1530，用于：

利用所述目标数据集中的未标注数据，使用无监督方式对所述已有AI模型中的特征提取部分进行优化；

根据优化后的特征提取部分和所述目标数据集中的标注数据，对所述已有AI模型进行更新。

所述更新模块1530，用于：

利用所述已有AI模型，对所述目标数据集中的未标注数据进行标注，获得所述未标注数据的标注结果；

根据所述未标注数据的标注结果和所述目标数据集中的标注数据，对所述已有AI模型进行更新。

在一种可能的实现方式中，所述更新模块1530，用于：

根据所述目标数据集中数据的数据特性，获取更新所述已有AI模型的策略；

根据所述策略，对所述已有AI模型进行更新。

在一种可能的实现方式中，所述获取模块1510，还用于获取用户输入的AI模型的更新周期；

所述确定模块1520，用于：

根据所述AI模型的更新周期，确定所述推理数据集的数据分布与训练数据集的数据分布存在差异。

本申请实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时也可以有另外的划分方式，另外，在本申请各个实施例中的各功能模块可以集成在一个处理器中，也可以是单独物理存在，也可以两个或两个以上模块集成为一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

本申请还提供一种如图4所示的计算设备400，计算设备400中的处理器402读取存储器401存储的程序和图像集合以执行前述AI平台执行的方法。

由于本申请提供的AI平台100中的各个模块可以分布式地部署在同一环境或不同环境中的多个计算机上，因此，本申请还提供一种如图17所示的计算设备，该计算设备包括多个计算机1700，每个计算机1700包括存储器1701、处理器1702、通信接口1703以及总线1704。其中，存储器1701、处理器1702、通信接口1703通过总线1704实现彼此之间的通信连接。

存储器1701可以是只读存储器，静态存储设备，动态存储设备或者随机存取存储器。存储器1701可以存储程序，当存储器1701中存储的程序被处理器502执行时，处理器1702和通信接口1703用于执行AI平台为AI模型更新的部分方法。存储器还可以存储图像集合，例如：存储器1701中的一部分存储资源被划分成一个推理数据集存储模块，用于存储推理数据集，存储器1701中的一部分存储资源被划分成一个AI模型存储模块，用于存储AI模型库。

处理器1702可以采用通用的中央处理器，微处理器，应用专用集成电路，图形处理器或者一个或多个集成电路。

通信接口1703使用例如但不限于收发器一类的收发模块，来实现计算机1700与其他设备或通信网络之间的通信。例如，可以通过通信接口1703获取推理数据集。

总线504可包括在计算机1700各个部件(例如，存储器1701、处理器1702、通信接口1703)之间传送信息的通路。

上述每个计算机1700间通过通信网络建立通信通路。每个计算机1700上运行用户I/O模块101、模型训练模块102、推理模块103、AI模型存储模块104或数据存储模块105中的任意一个或多个。任一计算机1700可以为云数据中心中的计算机(如服务器)，或边缘数据中心中的计算机，或终端计算设备。

上述各个附图对应的流程的描述各有侧重，某个流程中没有详述的部分，可以参见其他流程的相关描述。

在上述实施例中，可以全部或部分地通过软件、硬件或者其组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。提供AI平台的计算机程序产品包括一个或多个进AI平台的计算机指令，在计算机上加载和执行这些计算机程序指令时，全部或部分地产生按照本申请实施例图5、图11、图14或图15所述的流程或功能。

所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、双绞线或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质存储有提供AI平台的计算机程序指令。所述计算机可读存储介质可以是计算机能够存取的任何介质或者是包含一个或多个介质集成的服务器、数据中心等数据存储设备。所述介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，光盘)、或者半导体介质(例如SSD)。

Claims

1.一种人工智能AI模型更新的方法，其特征在于，所述方法包括：

获取推理数据集，其中，所述推理数据集中的推理数据用于输入至已有AI模型执行推理；

确定所述推理数据集的数据分布与训练数据集的数据分布存在差异，其中，所述训练数据集为训练所述已有AI模型所使用的数据集；

利用所述推理数据集，对所述已有AI模型进行更新，获得更新后的AI模型。

2.根据权利要求1所述的方法，其特征在于，所述已有AI模型部署在推理平台，所述方法还包括：

比较所述更新后的AI模型和所述已有AI模型的推理精度，确定所述更新后的AI模型的推理精度优于所述已有AI模型的推理精度；

将所述更新后的AI模型部署至所述推理平台，以使所述更新后的AI模型代替所述已有AI模型执行推理。

3.根据权利要求2所述的方法，其特征在于，所述将所述更新后的AI模型部署至所述推理平台之前，还包括：

通过显示界面显示所述已有AI模型的推理精度和所述更新后的AI模型的推理精度；

接收用户对所述已有AI模型的更新指令。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述利用所述推理数据集，对所述已有AI模型进行更新，包括：

5.根据权利要求4所述的方法，其特征在于，所述利用所述推理数据集对所述已有AI模型进行在线更新，包括：

6.根据权利要求1至4任一项所述的方法，其特征在于，所述利用所述推理数据集，对所述已有AI模型进行更新，包括：

根据所述推理数据集构造目标数据集；

利用所述目标数据集对所述已有AI模型进行更新。

7.根据权利要求6所述的方法，其特征在于，所述根据所述推理数据集构造目标数据集，包括：

获取用户对所述目标数据的标注结果；

8.根据权利要求6所述的方法，其特征在于，所述目标数据集包括适合所述推理数据集的数据分布的未标注数据和标注数据；

所述利用所述目标数据集对所述已有AI模型进行更新，包括：

9.根据权利要求6所述的方法，其特征在于，所述目标数据集包括适合所述推理数据集的数据分布的未标注数据和标注数据；

10.根据权利要求6或7所述的方法，其特征在于，所述利用所述目标数据集对所述已有AI模型进行更新，包括：

根据所述策略，对所述已有AI模型进行更新。

11.根据权利要求1至10任一项所述的方法，其特征在于，所述方法还包括：

获取用户输入的AI模型的更新周期；

所述确定所述推理数据集的数据分布与训练数据集的数据分布存在差异，包括：

12.一种人工智能AI模型更新的装置，其特征在于，所述装置包括：

获取模块，用于获取推理数据集，其中，所述推理数据集中的推理数据用于输入至已有AI模型执行推理；

确定模块，用于确定所述推理数据集的数据分布与训练数据集的数据分布存在差异，其中，所述训练数据集为训练所述已有AI模型所使用的数据集；

更新模块，用于利用所述推理数据集，对所述已有AI模型进行更新，获得更新后的AI模型。

13.根据权利要求12所述的装置，其特征在于，所述已有AI模型部署在推理平台，所述确定模块，还用于比较所述更新后的AI模型和所述已有AI模型的推理精度，确定所述更新后的AI模型的推理精度优于所述已有AI模型的推理精度；

所述更新模块，还用于将所述更新后的AI模型部署至所述推理平台，以使所述更新后的AI模型代替所述已有AI模型执行推理。

14.根据权利要求13所述的装置，其特征在于，所述装置还包括：显示模块，用于将所述更新后的AI模型部署至所述推理平台之前，通过显示界面显示所述已有AI模型的推理精度和所述更新后的AI模型的推理精度；

接收模块，用于接收用户对所述已有AI模型的更新指令。

15.根据权利要求12至14任一项所述的装置，其特征在于，所述更新模块，用于：

16.根据权利要求15所述的装置，其特征在于，所述更新模块，用于：

17.根据权利要求12至16任一项所述的装置，其特征在于，所述更新模块，用于：

根据所述推理数据集构造目标数据集；

利用所述目标数据集对所述已有AI模型进行更新。

18.根据权利要求17所述的装置，其特征在于，所述更新模块，用于：

获取用户对所述目标数据的标注结果；

19.根据权利要求17所述的装置，其特征在于，所述目标数据集包括适合所述推理数据集的数据分布的未标注数据和标注数据；

所述更新模块，用于：

20.根据权利要求17所述的装置，其特征在于，所述目标数据集包括适合所述推理数据集的数据分布的未标注数据和标注数据；

所述更新模块，用于：

21.根据权利要求17或18所述的装置，其特征在于，所述更新模块，用于：

根据所述策略，对所述已有AI模型进行更新。

22.根据权利要求12至21任一项所述的装置，其特征在于，所述获取模块，还用于获取用户输入的AI模型的更新周期；

所述确定模块，用于根据所述AI模型的更新周期，确定所述推理数据集的数据分布与训练数据集的数据分布存在差异。

23.一种人工智能AI模型更新的计算设备，其特征在于，所述计算设备包括处理器和存储器，其中：

所述存储器中存储有计算机指令；

所述处理器执行所述计算机指令，以使所述计算设备执行所述权利要求1-11中任一项权利要求所述的方法。

24.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，当所述计算机可读存储介质中的计算机指令被计算设备执行时，使得所述计算设备执行所述权利要求1-11中任一项权利要求所述的方法，或者使得所述计算设备实现所述权利要求12-22中任一项所述装置的功能。