WO2019090954A1

WO2019090954A1 - 一种预测方法及终端、服务器

Info

Publication number: WO2019090954A1
Application number: PCT/CN2017/120294
Authority: WO
Inventors: 陈飞; 董振华; 李震国; 何秀强; 钱莉; 彭帅华
Original assignee: 华为技术有限公司
Priority date: 2017-11-07
Filing date: 2017-12-29
Publication date: 2019-05-16
Also published as: EP3693912A1; CN111226238B; CN109754105A; EP3693912A4; CN109754105B; US20200258006A1; US11580457B2; CN111226238A

Abstract

本发明实施例公开了一种预测方法及终端、服务器。其方法包括服务器向多个终端发送第一模型参数和第二模型参数，第一模型参数和第二模型参数适配于终端的预测模型；服务器接收多个终端中至少一个终端发送的第一预测损失，至少一个终端中每个终端发送的第一预测损失为每个终端根据采用第一模型参数和第二模型参数的预测模型计算的；服务器根据至少一个终端发送的第一预测损失对第一模型参数进行更新，以获得更新后的第一模型参数，以及根据至少一个终端发送的第一预测损失对第二模型参数进行更新，以获得更新后的第二模型参数。采用本发明实施例，可以实现通过利用大量用户数据进行训练而得到体现用户差异性的预测模型。

Description

一种预测方法及终端、服务器

技术领域

本发明涉及预测模型领域，尤其涉及一种预测方法及终端、服务器。

背景技术

基于机器学习的预测系统通常分为模型训练和预测两部分，(1)模型训练：利用训练集数据训练一个适用于该任务的预测模型；其中，训练集通常包含大量的数据；(2)预测：使用训练出的模型对测试集数据进行预测。传统机器学习在解决终端预测任务时，一种方式是在终端本地单独进行模型训练，只能利用单一终端用户的样本，无法利用其它大量用户的信息(如相似的手机使用习惯)，导致预测效果不佳；另一种方式是在云侧服务器训练一个统一的预测模型，但模型规模较大也影响到对单一用户的预测效果。

在保护用户隐私的前提下，如何利用大量用户数据训练可以体现用户差异性的预测模型是需要解决的问题。

发明内容

本发明实施例提供一种预测方法及终端、服务器，可以实现通过利用大量用户数据进行训练而得到体现用户差异性的预测模型。

第一方面，本发明实施例提供了一种预测方法，包括：

服务器向多个终端发送第一模型参数和第二模型参数，第一模型参数和第二模型参数适配于终端的预测模型；接收多个终端中至少一个终端发送的第一预测损失，至少一个终端中每个终端发送的第一预测损失为每个终端根据采用第一模型参数和第二模型参数的预测模型计算的；根据至少一个终端发送的第一预测损失对第一模型参数进行更新，以获得更新后的第一模型参数，以及根据至少一个终端发送的第一预测损失对第二模型参数进行更新，以获得更新后的第二模型参数。

在第一方面中，预测模型的训练可以在各个终端进行，这样能够起到保护各个终端的用户隐私的作用，以及终端将计算获得的预测损失反馈至服务器，以使服务器根据大量终端反馈的数据，再次进行模型参数的更新，这样可以利用大量用户的信息来准确地更新模型参数。

在一种可选的实施例中，服务器根据至少一个终端发送的第一预测损失对第一模型参数进行更新，以获得更新后的第一模型参数，以及根据至少一个终端发送的第一预测损失对第二模型参数进行更新，以获得更新后的第二模型参数具体是：服务器根据至少一个终端发送的第一预测损失，计算第二预测损失；服务器根据第二预测损失，按照参数更新规则对第一模型参数进行更新，以获得更新后的第一模型参数，以及按照参数更新规则对第二模型参数进行更新，以获得更新后的第二模型参数。

在一种可选的实施例中，服务器还可以向多个终端发送更新后的第一模型参数和更新后的第二模型参数，多个终端中的任一终端根据采用更新后的第一模型参数和更新后的第二模型参数的预测模型进行预测。

在一种可选的实施例中，多个终端属于同一群组；同一群组的终端具备共同特征。可选的，共同特征包括至少两个终端位于预设的地理区域内。由于属于同一群组的终端用户之间具有更多的共性，相应的元学习器可以更有针对性地学习一种适用于该群组的机制，这样能够训练得到更适合该群组中的终端的预测模型，以达到更好的预测效果。

第二方面，本发明实施例提供了一种预测方法，包括：

终端接收服务器发送的第一模型参数和第二模型参数，第一模型参数和第二模型参数适配于终端的预测模型；根据训练集和预测模型对第一模型参数进行更新，以获得更新后的第一模型参数，训练集包括多个第一样本数据，第一样本数据包括第一特征向量和与第一特征向量对应的第一样本标签；获取测试集，并根据采用更新后的第一模型参数和第二模型参数的预测模型计算测试集的第一预测损失，测试集包括多个第二样本数据，第二样本数据包括第二特征向量和与第二特征向量对应的第二样本标签；向服务器发送第一预测损失，以使服务器根据第一预测损失更新第一模型参数和第二模型参数。

在第二方面中，预测模型的训练可以在多个终端进行，这样终端无需将自身的数据上传至服务器，能够起到保护各个终端的用户隐私的作用，以及终端将计算获得的预测损失反馈至服务器，以使服务器根据大量终端反馈的数据，再次进行模型参数的更新，这样可以利用大量用户的信息来准确地更新模型参数。

在一种可选的实施例中，终端在执行根据训练集和预测模型对第一模型参数进行更新，以获得更新后的第一模型参数方面具体是执行：根据预测模型计算训练集的第二预测损失，预测模型采用第一模型参数和第二模型参数；根据第二预测损失和第二模型参数，按照参数更新规则对第一模型参数进行更新，以获得更新后的第一模型参数。

可选的，终端在执行根据预测模型计算训练集的第二预测损失方面具体是执行：根据预测模型计算多个第一样本数据中每个第一样本数据对应的预测损失；根据每个第一样本数据对应的预测损失，计算多个第一样本数据的第二预测损失。

可选的，终端在执行根据预测模型计算多个第一样本数据中每个第一样本数据对应的预测损失方面具体是执行：将每个第一样本数据的第一特征向量输入至预测模型中，以获取每个第一样本数据的第一特征向量与第一样本标签相对应的概率，其中，预测模型采用第一模型参数和第二模型参数；根据第一特征向量与第一样本标签相对应的概率，按照损失计算规则计算每个第一样本数据的预测损失。

可选的，终端在执行将每个第一样本数据的第一特征向量输入至预测模型中，以获取每个第一样本数据的第一特征向量与第一样本标签相对应的概率方面具体是执行：获取预测模型包括的多个参考样本标签，多个参考样本标签包括每个第一样本标签；将每个第一样本数据的第一特征向量输入至预测模型中，以获取第一特征向量与各个参考样本标签相对应的概率；将参考样本标签为第一样本标签对应的概率确定为第一特征向量与第一样本标签相对应的概率。

在一种可选的实施例中，终端在执行根据采用更新后的第一模型参数和第二模型参数的预测模型计算测试集的第一预测损失方面具体是执行：根据模型参数更新后的预测模型计算测试集包括的多个第二样本数据中每个第二样本数据对应的预测损失，模型参数更新后的预测模型采用更新后的第一模型参数和第二模型参数；根据每个第二样本数据对应的预测损失，计算测试集的第一预测损失。

可选的，终端在执行根据模型参数更新后的预测模型计算测试集包括的多个第二样本数据中每个第二样本数据对应的预测损失方面具体是执行：将每个第二样本数据的第二特征向量输入至模型参数更新后的预测模型中，以获取每个第二样本数据的第二特征向量与第二样本标签相对应的概率；根据第二特征向量与第二样本标签相对应的概率，按照损失计算规则计算每个第二样本数据的预测损失。

可选的，终端在执行将每个第二样本数据的第二特征向量输入至模型参数更新后的预测模型中，以获取每个第二样本数据的第二特征向量与第二样本标签相对应的概率方面具体是执行：获取模型参数更新后的预测模型包括的多个参考样本标签，多个参考样本标签包括每个第二样本标签；将每个第二样本数据的第二特征向量输入至模型参数更新后的预测模型中，以获取第二特征向量与各个参考样本标签相对应的概率；将参考样本标签为第二样本标签对应的概率确定为第二特征向量与第二样本标签相对应的概率。

第三方面，本发明实施例提供了一种预测方法，包括：

终端接收服务器发送的第一模型参数和第二模型参数，第一模型参数和第二模型参数适配于终端的预测模型；根据训练集和预测模型对第一模型参数进行更新，以获得更新后的第一模型参数，训练集包括多个样本数据，每个样本数据包括特征向量和与特征向量对应的样本标签；将待预测的目标特征向量输入至采用更新后的第一模型参数和第二模型参数的预测模型中，获取与目标特征向量对应的目标样本标签。

在第三方面中，在终端接收到服务器发送的第一模型参数和第二模型参数之后，首先根据训练集和预测模型对第一模型参数进行更新，以获得更新后的第一模型参数，在待预测的目标特征向量输入至采用更新后的第一模型参数的预测模型中，获取与目标特征向量对应的目标样本标签。这样终端在预测阶段也能够体现该终端与其他终端的差异性，达到更为准确的预测效果。

在一种可选的实施例中，终端在执行根据训练集和预测模型对第一模型参数进行更新，以获得更新后的第一模型参数方面具体是执行：根据预测模型计算训练集的中间预测损失，预测模型采用第一模型参数和第二模型参数；终端根据中间预测损失和第二模型参数，按照参数更新规则对第一模型参数进行更新，以获得更新后的第一模型参数。其中，中间预测损失可以体现出根据第一训练集的真实结果和预测结果之间的偏差，通过这一偏差来更新第一模型参数，提高预测模型的准确性。

可选的，终端在执行根据预测模型计算训练集的中间预测损失方面具体是执行：终端根据预测模型计算多个样本数据中每个样本数据对应的预测损失；终端根据每个样本数据对应的预测损失，计算多个样本数据的中间预测损失。

可选的，终端在执行根据预测模型计算多个样本数据中每个样本数据的预测损失方面具体是执行：终端将每个样本数据的特征向量输入至预测模型中，以获取每个样本数据的特征向量与样本标签相对应的概率；根据特征向量与样本标签相对应的概率，按照损失计算规则计算每个样本数据的预测损失。

可选的，终端在执行将每个样本数据的特征向量输入至预测模型中，以获取每个样本数据的特征向量与样本标签相对应的概率方面具体是执行：终端获取预测模型包括的多个参考样本标签，多个参考样本标签包括每个样本标签；终端将每个样本数据的特征向量输入至预测模型中，以获取特征向量与各个参考样本标签相对应的概率；终端将参考样本标签为样本标签对应的概率确定为特征向量与样本标签相对应的概率。

在一种可选的实施例中，终端在执行将待预测的目标特征向量输入至采用更新后的第一模型参数和第二模型参数的预测模型中，获取与目标特征向量对应的目标样本标签方面具体是执行：终端获取模型参数更新后的预测模型包括的多个参考样本标签，模型参数更新后的预测模型采用更新后的第一模型参数和第二模型参数；终端将待预测的目标特征向量输入至模型参数更新后的预测模型中，以获取待预测的目标特征向量与各个参考样本标签相对应的参考概率；终端将多个参考概率中参考概率的最大值对应的参考样本标签确定为目标样本标签。

第四方面，本发明实施例提供了一种服务器，包括：

发送模块，用于向多个终端发送第一模型参数和第二模型参数，第一模型参数和第二模型参数适配于终端的预测模型；

接收模块，用于接收多个终端中至少一个终端发送的第一预测损失，至少一个终端中每个终端发送的第一预测损失为每个终端根据采用第一模型参数和第二模型参数的预测模型计算的；

处理模块，用于根据至少一个终端发送的第一预测损失对第一模型参数进行更新，以获得更新后的第一模型参数，以及根据至少一个终端发送的第一预测损失对第二模型参数进行更新，以获得更新后的第二模型参数。

可选的，该服务器还可以实现第一方面的部分或全部的可选的实现方式。

第五方面，本发明实施例提供了一种服务器。该服务器包括：存储器，用于存储计算机可执行程序代码；收发器，以及处理器，处理器与存储器、收发器耦合。其中存储器所存储的程序代码包括指令，当处理器执行指令时，使服务器执行上述第一方面中服务器所执行的方法。

第五方面，本发明实施例提供了一种终端，包括：

接收模块，用于接收服务器发送的第一模型参数和第二模型参数，第一模型参数和第二模型参数适配于终端的预测模型；

处理模块，用于根据训练集和预测模型对第一模型参数进行更新，以获得更新后的第一模型参数，训练集包括多个第一样本数据，第一样本数据包括第一特征向量和与第一特征向量对应的第一样本标签；

处理模块，具体用于获取测试集，并根据采用更新后的第一模型参数的预测模型计算测试集的第一预测损失，测试集包括多个第二样本数据，第二样本数据包括第二特征向量和与第二特征向量对应的第二样本标签；

发送模块，用于向服务器发送第一预测损失，以使服务器根据第一预测损失更新第一模型参数和第二模型参数。

可选的，该终端还可以实现第二方面的部分或全部的可选的实现方式。

第六方面，本发明实施例提供了另一种终端，包括：

处理模块，用于根据训练集和预测模型对第一模型参数进行更新，以获得更新后的第一模型参数，训练集包括多个样本数据，每个样本数据包括特征向量和与特征向量对应的样本标签；

处理模块，还用于将待预测的目标特征向量输入至采用更新后的第一模型参数和第二模型参数的预测模型中，获取与目标特征向量对应的目标样本标签。

可选的，该终端还可以实现第三方面的部分或全部的可选的实现方式。

第七方面，本发明实施例提供了一种终端。该终端包括：存储器，用于存储计算机可执行程序代码；收发器，以及处理器，处理器与存储器、收发器耦合。其中存储器所存储的程序代码包括指令，当处理器执行指令时，使终端执行上述第二方面或第三方面中终端所执行的方法。

第八方面，提供了一种计算机程序产品，计算机程序产品包括：计算机程序代码，当计算机程序代码在计算机上运行时，使得计算机执行上述第一方面至第三方面及其任意可能的实现方式中的方法。

第九方面，提供了一种计算机可读介质，计算机可读介质存储有程序代码，当计算机程序代码在计算机上运行时，使得计算机执行上述第一方面至第三方面及其任意可能的实现方式中的方法。

第十方面，提供了一种训练机器学习模型方法，该方法包括：终端接收服务器发送的所述服务器上的算法模型的第一参数和第二参数，所述第一参数用于作为所述终端的机器学习模型的初始参数，所述第二参数用于指示所述终端训练机器学习模型的方式；所述终端根据所述第一参数、所述第二参数以及训练集数据训练所述终端上的机器学习模型，所述训练集数据包括多个训练样本，每一训练样本包括第一特征向量及对应的第一标签，所述第一特征向量根据所述终端的历史数据中的用户信息构建；所述终端根据测试数据以及所述机器学习模型得到测试结果，并根据所述测试结果计算损失梯度；所述终端将所述损失梯度上传给所述服务器，所述损失梯度用于所述服务器更新所述第一参数和所述第二参数。

第十方面的一种可能的实现方式，所述根据所述测试结果计算损失梯度，包括：所述终端根据所述测试结果和所述测试数据对应的标签计算预测损失；所述终端根据所述预测损失计算所述损失梯度。

第十方面的一种可能的实现方式，所述测试数据包括多个测试样本数据，每一测试样本数据包括第二特征向量以及对应的第二标签，每一测试样本数据对应一个测试结果；

其中，所述终端根据所述测试结果和所述测试数据对应的标签计算预测损失，包括：所述终端根据所述多个测试样本数据各自对应的测试结果和第二标签，计算所述多个测试样本数据各自的预测损失；

所述终端根据所述预测损失计算所述损失梯度，包括：所述终端根据所述多个测试样本数据各自的预测损失，计算所述多个测试样本数据各自的损失梯度；所述终端对所述多个测试样本数据对应的多个损失梯度进行平均处理，得到目标损失梯度；

所述终端将所述损失梯度上传给所述服务器，包括：终端将所述目标损失梯度上传给所述服务器。

其中，所述终端根据所述测试结果和所述测试数据对应的标签计算预测损失，包括：所述终端根据所述多个测试样本数据各自对应的测试结果和第二标签，计算所述多个测试样本数据各自的预测损失；所述终端对所述多个测试样本数据对应的多个预测损失进行平均，得到平均预测损失；

所述终端根据所述预测损失计算所述损失梯度，包括：所述终端根据所述平均预测损失计算目标损失梯度；

第十方面的一种可能的实现方式，在所述终端根据所述多个测试样本数据各自对应的测试结果和第二标签，计算所述多个测试样本数据各自的预测损失之后，还包括：所述终端确认所述多个测试样本数据各自的预测损失满足预设条件，所述预设条件用于指示相对上一次计算的平均预测损失波动值小于预设阈值，所述平均预测损失为所诉终端对已多个测试样本数据对应的多个预测损失进行平均得到的。进一步地，该方法还包括：若所述终端确认测试样本数据i的预测损失不满足所述预设条件，所述终端不再计算所述测试样本数据i的预测损失对应的损失梯度或不根据所述测试样本数据i的预测损失计算所述平均预测损失，所述测试样本数据i为所述多个测试样本数据中任一个。

第十方面的一种可能的实现方式，在终端接收服务器发送的所述服务器的算法模型的第一参数和第二参数之前，包括：所述终端将所述机器学习模型的结构标识发送给所述服务器，所述结构标识用于所述服务器根据所述结构标识确定所述机器学习模型对应的所述算法模型。

第十一方面，提供了一种预测方法，该方法包括：第一终端获取所述第一终端的用户信息，并根据所述用户信息生成目标特征向量；所述第一终端将所述目标特征向量输入目标预测模型，得到目标预测结果；其中，所述目标预测模型为所述第一终端根据第一参数、第二参数以及所述第一终端的历史数据训练得到的本地机器学习模型，所述第一参数和所述第二参数为服务器发送的所述服务器的算法模型的两个参数，所述第一参数用于作为所述第一终端的机器学习模型的初始参数，所述第二参数用于指示所述第一终端训练机器学习模型的方式，所述第一参数和所述第二参数为所述服务器根据多个终端反馈的多个损失梯度得到，任一损失梯度为对应终端基于本地历史数据计算得到。

第十一方面的一种可能的实现方式，在所述第一终端将所述目标特征向量输入目标预测模型，得到目标预测结果之前，包括：所述第一终端向所述服务器发送参数更新请求，所述参数更新请求用于请求所述服务器发送所述算法模型的最近一次更新的第一参数和第二参数；所述第一终端接收所述服务器发送的所述最近一次更新的第一参数和第二参数；所述第一终端根据所述最近一次更新的第一参数和第二参数以及所述第一终端的历史数据训练所述目标预测模型；

其中，所述第一终端将所述目标特征向量输入目标预测模型，得到目标预测结果，包括：所述第一终端将所述目标特征向量输入训练后的目标预测模型，得到目标预测结果。

可选的，所述参数更新请求包括：所述目标预测模型对应的机器学习模型的结构标识，所述结构标识用于所述服务器根据所述结构标识确定所述目标预测模型对应的所述算法模型。

第十一方面的一种可能的实现方式，在所述第一终端将所述目标特征向量输入目标预测模型，得到目标预测结果之后，还包括：所述第一终端向所述服务器上传预测结果打分，其中，所述预测结果打分为所述第一终端的用户对所述目标预测结果的打分，所述预测结果打分用于所述服务器确定加权系数，所述加权系数用于所述服务器处理所述多个终端上传的损失梯度得到加权损失梯度，所述加权损失梯度用于所述服务器更新所述第一参数和所述第二参数，所述多个终端包括所述第一终端。

第十二方面，提供了一种训练机器学习模型的方法，该方法包括：服务器向多个终端发送所述服务器的算法模型的第一参数和第二参数，所述第一参数用于作为所述多个终端中每一终端的机器学习模型的初始参数，所述第二参数用于指示所述多个终端中每一终端的训练机器学习模型的方式，所述多个终端的机器学习模型具有相同的结构，可选的，所述多个终端属于同一群组，所述同一群组用于指示具有相同或相似的属性特征，可选的，所述属性特征包括地理区域；在预设时间窗内，所述服务器接收所述多个终端中至少一个终端上传的损失梯度；所述服务器根据所述至少一个终端上传的损失梯度更新所述第一参数和所述第二参数。

第十二方面的一种可能的实现方式，在所述服务器向多个终端发送第一参数和第二参数之前,包括：所述服务器初始化所述算法模型的所述第一参数和所述第二参数。

第十二方面的一种可能的实现方式，该方法还包括：所述服务器根据所述多个终端上传损失梯度的概率，重置所述预设时间窗。

第十二方面的一种可能的实现方式，该方法还包括：所述服务器接收所述至少一个终端上传的预测结果打分，所述预测结果打分为终端用户对机器学习模型的预测结果的打分；所述服务器根据所述预测结果打分，确定加权系数；

其中，所述服务器根据所述至少一个终端上传的损失梯度更新所述第一参数和所述第二参数，包括：所述服务器根据所述加权系数对所述至少一个终端上传的损失梯度进行加权平均处理，得到加权损失梯度；所述服务器根据所述加权损失梯度更新所述第一参数和所述第二参数。

第十二方面的一种可能的实现方式，在服务器向多个终端发送第一参数和第二参数之前，还包括：所述服务器接收所述多个终端上传的各自机器学习模型的结构标识，所述结构标识用于所述服务器确定与所述机器学习模型的结构对应的所述算法模型。

第十二方面的一种可能的实现方式，该方法还包括：所述服务器接收到第一终端发送的参数更新请求，所述参数更新请求用于请求所述服务器发送最近一次更新的第一参数和第二参数，所述第一终端为所述多个终端中的任一个终端；所述服务器向所述第一终端发送最近一次更新的第一参数和第二参数。

第十三方面，提供了一种终端设备，该设备包括：处理器、存储介质；所述存储介质用于存储可编程指令；所述处理器用于调用所述存储介质上存储的可编程指令执行第十方面或第十方面任一可能的实现方式描述的方法。

第十四方面，提供了一种终端设备，该设备包括：处理器、存储介质；所述存储介质用于存储可编程指令；所述处理器用于调用所述存储介质上存储的可编程指令执行第十一方面或第十一方面的任一可能的实现方式描述的方法。

第十五方面，提供了一种服务器，该服务器包括：处理器、存储介质；所述存储介质用于存储可编程指令；所述处理器用于调用所述存储介质上存储的可编程指令执行第十二方面或第十二方面的任一可能的实现方式描述的方法。

第十六方面，提供了一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得所述计算机执行第十方面或第十方面任一可能的实现方式描述的方法。

第十七方面，提供了一种计算机可读存储介质，其特征在于，包括指令，当其在计算机上运行时，使得所述计算机执行第十一方面或第十一方面的任一可能的实现方式描述的方法。

第十八方面，提供了一种计算机可读存储介质，其特征在于，包括指令，当其在计算机上运行时，使得所述计算机执行第十二方面或第十二方面的任一可能的实现方式描述的方法。

采用本发明实施例提供的方法、装置，可以实现在不向服务器上传本地隐私数据的情况下，能够使得终端利用大量其他终端用户数据训练本地机器学习模型，同时实现机器学习模型的性能和个性化。

附图说明

为了更清楚地说明本发明实施例或背景技术中的技术方案，下面将对本发明实施例或背景技术中所需要使用的附图进行说明。

图1为本发明实施例提供了一种可能的预测系统架构图；

图2为本发明实施例提供了一种预测方法；

图3为本发明实施例提供了另一种预测方法；

图4提供了为用户推荐应用软件的预测系统的示例图；

图5为本发明实施例提供了一种预测方法的示例图；

图6是本发明实施例提供的一种终端的结构示意图；

图7是本发明实施例提供的一种终端的结构示意图。

图8是本发明实施例提供的一种终端的结构示意图；

图9是本发明实施例提供的一种服务器的结构示意图；

图10是本发明实施例提供的一种服务器的结构示意图；

图11是本发明实施例提供的一种训练机器学习模型方法的流程图；

图12是本发明实施例提供的一种预测方法的流程图。

具体实施方式

下面结合本发明实施例中的附图对本发明实施例进行描述。

实施例一，请参见图1，为本发明实施例提供了一种可能的预测系统架构图。如图1所示，该预测系统架构图包括服务器和终端。服务器和终端之间可以实现数据传输。需要说明的是，图1中仅仅表示了1个终端，但是这并不构成对本发明实施例的限定，本发明实施例不限定终端的数量。

基于图1的系统架构图中，服务器与终端结合起来实现预测模型的训练和使用。例如，终端可以利用各自的数据在本地进行预测模型的训练和预测，这样并不会将用户的隐私数据上传至服务器，也起到了保护用户隐私的作用。而且终端还可以将预测效果反馈至服务器，以使服务器根据多个终端反馈的预测损失更新模型参数，这样服务器也参考了多个终端的信息，起到了利用大量用户的信息来更新模型参数的作用。

在本发明实施例中，在终端接收到服务器发送的第一模型参数和第二模型参数之后，首先根据训练集和预测模型对第一模型参数进行更新，以获得更新后的第一模型参数，在待预测的目标特征向量输入至采用更新后的第一模型参数和第二模型参数的预测模型中，获取与所述目标特征向量对应的目标样本标签。这样能够体现该终端与其他终端的差异性，达到更为准确的预测效果。

在本发明实施例中的一种可选实现方案中，服务器采用元学习器来维护预测模型的模型参数，元学习是一种两层机器学习架构，会对所学习的结果进行“再学习”，试图对错误的分类进行纠正，而对正确的分类加以巩固。因此元学习器的精度较高，在本发明实施例中采用元学习器的模式来实现模型参数的更新。举例来说，在这一预测系统架构图中，服务器用于存储以及更新适配于预测模型的模型参数，而终端中存储有与该模型参数相对应的预测模型，终端的预测模型可以采用服务器中的模型参数进行预测模型的训练和预测。

需要说明的是，本发明实施例中所涉及的第一训练集或第二训练集是用于训练预测模型的标签数据集合，测试集是用来测试模型预测能力的标签数据集合。其中，标签数据是包含正确标签的数据。在本发明实施例中，样本数据的预测损失可以理解为：预测结果与真实结果之间的偏差，这里的预测结果是指特征向量通过预测模型得到的预测样本标签，真实结果是该特征向量原本应该对应的样本标签。

本发明实施例中所涉及的终端可以是具备通信功能的设备，例如可以是手持终端设备、笔记本电脑、用户单元(subscriber unit)、蜂窝电话(cellular phone)、智能电话(smart phone)、无线数据卡、个人数字助理(personal digital assistant，PDA)电脑、平板型电脑、无线调制解调器(modem)、手持设备(handheld)、膝上型电脑(laptop computer)、无绳电话(cordless phone)或者无线本地环路(wireless local loop，WLL)台、机器类型通信(machine type communication,MTC)终端等，例如，终端设备还可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置。本发明实施例中所涉及的服务器可以是具备处理和通信功能的后台服务设备。本发明实施例对终端和服务器均不做限定。

实施例二，请参见图2，为本发明实施例提供了一种预测方法。该方法是由终端执行的，如图2所示，该预测方法包括步骤201至步骤203，请参见以下具体介绍。

201，终端接收服务器发送的第一模型参数和第二模型参数。

其中，在本发明实施例中，所述第一模型参数和第二模型参数适配于所述终端的预测模型。预测模型会包含模型参数，在本发明实施例中服务器可以向终端发送模型参数，另外，在模型训练阶段或模型预测阶段均可以进行模型参数的更新，相应的预测模型也会更新为采用更新后的模型参数。

在本发明实施例中，服务器维护一个以(θ,α)为参数的元学习器，其中，θ为第一模型参数，α为第二模型参数。在这一步骤中第一模型参数用θ ₁表示，第二模型参数用α ₁表示。服务器将(θ ₁,α ₁)数值作为预测模型的模型参数分发给多个终端，这里接收模型参数的执行主体为所分发的多个终端中的任意一个终端。

举例来说，服务器中初始化元学习器参数为(θ,α)，其中θ为预测模型的初始参数，θ为向量，θ包括的每一项分量用θ _j表示，而每一项θ _j可以以如下方式随机初始化：

其中

代表期望为0，方差为

的正态分布。

α为向量，α的各分量与θ的各分量一一对应(是因为在后续举例会使用到的更新规则需要执行向量减法运算，因此这里如此设定)，α包括的每一项分量用α _j表示，以如下方式随机初始化：

α _j～U(0,0.1) for each j

其中U(0,0.1)为区间[0,0.1]上的均匀分布。

需要说明的是，这里仅仅是对服务器中初始化元学习器参数的举例说明。另外，本发明实施例对第一模型参数、第二模型参数并不做限定。

202，终端根据训练集和所述预测模型对所述第一模型参数进行更新，以获得更新后的第一模型参数。

其中，所述训练集包括多个样本数据，每个样本数据包括特征向量和与所述特征向量对应的样本标签。为了体现各个终端的差异性，各个终端可以采用自身的数据作为样本数据。步骤202具体可以通过以下步骤A11和A12来实现。

A11、所述终端根据预测模型计算所述训练集的中间预测损失。

其中，这里的训练集包括多个样本数据，所述多个样本数据中每个样本数据包括样本标签和与所述样本标签对应的特征向量。在第一模型参数更新之后，这里的预测模型所采用的模型参数与第一模型参数和第二模型参数，即(θ ₁,α ₁)。

第一种可选的方案中，终端先计算多个样本数据中每个样本数据的预测损失，再计算多个预测损失的平均值，以得到中间预测损失，例如：

其中，

表示根据预测模型确定的训练集的中间预测损失；训练集为S _train(m)，m表示训练集的第m个样本数据，训练集中样本数据的数量为M；l _m(θ ₁)表示第m个样本数据的预测损失。

或者，第二种可选的方案中，终端先计算多个样本数据中每个样本数据的预测损失，再获取每个样本数据对应的权重，计算多个预测损失的平均值，以得到中间预测损失。例如：

其中，

表示根据预测模型确定的中间预测损失；训练集为S _train(m)，m表示训练集的第m个样本数据，训练集中样本数据的数量为M；l _m(θ ₁)表示第m个样本数据的预测损失，λ _m表示第m个样本数据所对应的权重。

可选的，每个样本数据对应的权重可以是终端按照样本数据的关联信息所确定的，例如，根据样本数据的生成时刻来确定，以预测模型用于为用户推荐应用软件为例进行说明，训练集是根据用户的历史使用记录生成的，样本数据的样本标签可以为应用软件W的名称，特征向量为根据使用该应用软件W的位置、时间、手机电量、网络信号强度等特征构成的，则终端可以按照历史使用记录距离当前时刻的时长由长到短进行排序，并将时长分类以及设定各类时长所相应的权重，如越靠近当前时刻的权重值较大。在本发明实施例中，由于样本数据与预测模型有关，因此对样本数据的关联信息不做限定。

A12、所述终端根据所述中间预测损失和第二模型参数，按照参数更新规则对所述第一模型参数进行更新，以获得更新后的第一模型参数。

其中，参数更新规则为预先设定的，也可以对该参数更新规则进行变更。本发明实施例对参数更新规则不做限定。

举例来说，以小样本学习算法为例，参数更新规则可以按照以下公式来实现：

其中，θ ₂表示更新后的第一模型参数；θ ₁表示更新前的第一模型参数；α ₁表示第二模型参数；

表示由所述训练集S _train计算得到的中间预测损失；

表示梯度；

表示向量的分量乘法运算。运用

运算的举例为：

由于

包含θ ₁变量，通过

运算可以实现对

进行θ ₁求导，以获得针对θ ₁而言，

的变化率。按照以上更新公式可以获得更新后的第一模型参数θ ₂。

其中，该第二模型参数可以在服务器侧是通过学习得到的，在第二模型参数通过学习更加准确之后，进一步保证了所更新的第一模型参数的准确性。

针对步骤A11和步骤A12而言，在一种可能的方案中，终端可以按照预设的迭代次数，执行步骤202。举例来说，迭代次数为100，即步骤202需要按照步骤A11和A12循环执行100次，具体如下：

θ′ _i←θ ₁ //用θ ₁表示第一模型参数，θ′ _i表示迭代之前的第一模型参数；

for t＝1,2,…,T do//迭代T步来优化本地预测模型，例如T＝100

//for循环中执行的第一个步骤，计算中间预测损失；

表示根据θ′ _i计算的训练集的中间预测损失；

表示训练集中每个样本数据对应的预测损失。

//for循环中执行的第二个步骤，更新迭代中的第一模型参数；也就是说在下一次迭代的过程中，采用当前迭代所更新后的第一模型参数来执行。

这样通过多次迭代来使得更新后的第一模型参数更为准确。其中，这里采用预测迭代次数来实现第一模型参数多次更新，可选的方案中，可以确定相邻两次迭代中前一次中间预测损失和当前次中间预测损失之间的差距，若差距小于预设的阈值，则不再执行迭代，并采用当前次的中间预测损失计算的第一模型参数。又一可选的方案中，可以确定相邻两次迭代中前一次更新第一模型参数和当前次更新第一模型参数之间的差距，若差距小于预设的阈值，则不再执行迭代，并采用当前次的更新第一模型参数确定为更新后的第一模型参数。这里仅为举例说明，本发明实施例对步骤A11和步骤A12的迭代次数以及迭代停止的条件均不做限定。

进一步的，针对步骤A11中对每个样本数据对应的预测损失是如何计算的可以参见一下步骤B11和步骤B12的详细介绍。

B11、终端将所述每个样本数据的特征向量输入至预测模型中，以获取所述每个样本数据的所述特征向量与所述样本标签相对应的概率。

其中，由于步骤B11是在第一模型参数更新之前，因此这里的预测模型仍采用的是第一模型参数和第二模型参数。

具体实现中，预测模型包含多个参考样本标签，所述多个参考样本标签包括每个样本数据对应的样本标签。也就是说，由于训练集已经包括了与特征向量对应的样本标签，预测模型所包含的多个参考样本标签至少应该包含训练集所包含的样本标签，这样可以准确的对预测模型进行训练。

进一步的，在该预测模型中按照采用所述第一模型参数概率计算规则，可以计算得到所述特征向量与各个参考样本标签相对应的概率；并获取参考样本标签为所述样本标签所对应的概率。

举例来说，以预测模型用于为用户推荐应用软件为例进行说明，多个参考样本标签包括应用名称P1、P2、P8、P9、P10、P3、P4、P5、P6、P7；样本标签包括应用名称P1、P2、P3、P4、P5、P6；依次对应的特征向量为x1、x2、x3、x4、x5、x6；采用第一模型参数的概率计算规则为

按照这一概率计算规则，输入值x为任意一个特征向量的情况下，会得到对应到多个参考样本标签概率值。

例如，

为输入特征向量x3的结果，该结果中包含分别对应到P1、P2、P8、P9、P10、P3、P4、P5、P6、P7的概率值，由于特征向量x3与样本标签为P3，并在结果中查找到参考样本标签为P3的结果作为样本标签P3所对应的概率。

B12、终端根据所述特征向量与所述样本标签相对应的概率，按照损失计算规则计算所述每个样本数据的预测损失。

具体实现中，损失计算规则为

其中，x为特征向量，k为与特征向量中相对应的样本标签在多个参考样本标签中是第k个，

表示特征向量与所述样本标签相对应的概率；

表示样本数据对应的预测损失。

为了更好理解，概率计算规则与第一模型参数的相关性，以下通过一个简单的线性模型进行举例(这里的线性模型只是举例，也可以是更复杂的模型，如深度神经网络)。假设输入特征向量为x∈R ^m，其中m为特征向量维度，预测模型的第一模型参数为θ ₁，则该模型的输出

定义为：

其中，θ＝(ω,b)；即ω∈R ^K×m和b∈R ^K均是预测模型的第一模型参数；σ是Softmax函数，其定义为：

for z∈R ^K,k＝1,2,...,K

模型输出

是一个概率分布，其中第k个分量

代表该样本标签是第k个APP的概率。这里K是一共输出的APP数量。

203，终端将待预测的目标特征向量输入至采用所述更新后的第一模型参数和所述第二模型参数的预测模型中，获取与所述目标特征向量对应的目标样本标签。

具体实现中，在包含更新后的第一模型参数以及第二模型参数的预测模型进行预测时，终端将待预测的目标特征向量输入该更新后的预测模型中，通过上述的描述，由于预测模型包含多个参考样本标签，因此会得到目标特征向量与各个参考样本标签相对应的参考概率；终端将多个参考概率中参考概率的最大值对应的参考样本标签确定为目标样本标签。

举例来说，以预测模型用于为用户推荐应用软件为例进行说明，为了便于理解，请参见图4，为本发明实施例提供了为用户推荐应用软件的预测模型的示例图，如图4所示，训练集中包含4个应用的图标，预测集表示待预测的下一个推荐使用的应用的图标。其中，训练集中每个应用的图标还包含了每个应用对应的特征向量，特征向量为根据使用该应用软件W的位置、时间、手机电量、网络信号强度等特征构成的。当多个参考应用名称为20个时，而对目标特征向量的预测结果是这20个APP中对应

值最大所对应的一个应用名称。

实施例三，基于图1所示的系统架构图，请参见图3，为本发明实施例提供了另一种预测方法。该方法是由两个或两个以上的终端和服务器共同执行的，这里只画出其中一个终端与服务器的交互过程，对于其他终端与服务器的交互过程可以参考这一终端的详细描述。如图3所示，该预测方法包括步骤301至步骤309，请参见以下具体介绍。

301，服务器向多个终端发送第一模型参数和第二模型参数。

其中

代表期望为0，方差为

的正态分布。

α _j～U(0,0.1)for each j

其中U(0,0.1)为区间[0,0.1]上的均匀分布。

相应地，对于多个终端中的一个终端而言，各个终端中存储有基于同一类型的预测模型。例如，各个预测模型均是基于同一算法的预测模型，且用于实现用一个预测任务的预测模型。对应各个终端接收到的服务器发送的第一模型参数和第二模型参数是适配于每个终端的预测模型的。

302，终端根据第一训练集和预测模型对所述第一模型参数进行更新，以获得更新后的第一模型参数。

其中，由于在本发明实施例中还有另一个训练集，由于处于不同阶段，因此这里采用第一训练集和第二训练集进行区分。这里的第一训练集包括多个第一样本数据，所述第一样本数据包括第一特征向量和与所述第一特征向量对应的第一样本标签。

其中，步骤302具体是通过根据预测模型计算所述训练集的第二预测损失，所述预测模型采用第一模型参数和第二模型参数，即(θ ₁,α ₁)；再根据所述第二预测损失和所述第二模型参数，按照参数更新规则对所述第一模型参数进行更新，以获得更新后的第一模型参数。具体实现可以参考图2所示实施例中步骤202的详细描述，两者的区别在于：步骤302中第二训练集，对应至步骤202中是训练集，步骤302中是第二预测损失，对应至步骤202中是中间预测损失，是因为图2所示的实施例是在采用预测模型进行预测的阶段，图3所示实施例中的步骤302是在各个终端通过自身的数据对预测模型进行训练的阶段。虽然所在的阶段不同，但实现方式是相同的，在此不再赘述。

303，所述终端获取测试集，并根据采用所述更新后的第一模型参数和第二模型参数的预测模型计算所述测试集的第一预测损失。

其中，所述测试集包括多个第二样本数据，所述第二样本数据包括第二特征向量和与所述第二特征向量对应的第二样本标签。这里的预测模型已采用更新后的第一模型参数，设定更新后的第一模型参数为θ ₃，则预测模型所采用的模型参数为(θ3,α1)。

其中，测试集包括多个第二样本数据，所述多个第二样本数据中每个第二样本数据包括第二样本标签和与所述第二样本标签对应的第二特征向量。

第一种可选的方案中，终端先计算多个第二样本数据中每个第二样本数据的预测损失，再计算多个预测损失的平均值，以得到第一预测损失，例如：

其中，θ ₃表示更新后的第一模型参数；

表示终端i根据更新后的第一模型参数确定的第一预测损失；测试集为S _test(n)，n表示测试集的第n个第二样本数据，测试集中第二样本数据的数量为N；l _n(θ ₃)表示第n个第二样本数据的预测损失。

或者，第二种可选的方案中，终端先计算多个第二样本数据中每个第二样本数据的预测损失，再获取每个第二样本数据对应的权重，计算多个预测损失的平均值，以得到第一预测损失。例如

其中，θ ₃表示更新后的第一模型参数；

表示终端i根据更新后的第一模型参数确定的第一预测损失；测试集为S _test(n)，n表示测试集的第n个第二样本数据，测试集中第二样本数据的数量为N；l _n(θ ₃)表示第n个第二样本数据的预测损失，λ _n表示第n个第二样本数据所对应的权重。

可选的，每个第二样本数据对应的权重可以是终端按照第二样本数据的关联信息所确定的，例如，根据第二样本数据的生成时刻来确定，以预测模型用于为用户推荐应用软件为例进行说明，第二样本数据是根据用户的历史使用记录生成的，即，第二样本数据的第二样本标签可以为应用软件W的名称，特征向量为根据使用该应用软件W的位置、时间、手机电量、网络信号强度等特征构成的，则终端可以按照历史使用记录距离当前时刻的时长由长到短进行排序，并将时长分类以及设定各类时长所相应的权重，如越靠近当前时刻的权重值较大。在本发明实施例中，由于第二样本数据与预测模型有关，因此对第二样本数据的关联信息不做限定。

进一步的，针对步骤303中对每个第二样本数据对应的预测损失是如何计算的可以参见图2所示实施例中步骤B11和步骤B12的详细介绍，在此不再赘述。

304，所述终端向所述服务器发送所述第一预测损失。

其中，终端在通过步骤303确定第一预测损失之后，向服务器发送该第一预测损失，以使服务器根据该第一预测损失以及其他终端发送的第一预测损失进行预测模型的更新，以得到更新后的模型参数。

305，服务器接收所述多个终端中至少一个终端发送的第一预测损失。

其中，服务器接收多个终端中至少一个终端发送的第一预测损失。这里每个终端反馈的第一预测损失在数值上并一定是相同的，是因为在本发明实施例中每个终端发送的第一预测损失是每个终端根据第一模型参数和第二模型参数计算的。

306，服务器根据所述至少一个终端发送的第一预测损失对所述第一模型参数进行更新，以获得更新后的第一模型参数，以及根据所述至少一个终端发送的第一预测损失对所述第二模型参数进行更新，以获得更新后的第二模型参数。

其中，服务器根据至少一个终端反馈的第一预测损失对第一模型参数和第二模型参数进行更新，具体实现过程可以参考以下步骤C11和C12的详细描述。

C11、服务器根据至少一个终端发送的第一预测损失，计算第二预测损失。可选的方案中，服务器将多个第一预测损失的平均值确定为第二预测损失。又一可选的方案中，服务器可以获取各个终端的第一预测损失对应的权要，通过加权平均的运算方式，得到第二预测损失。

举例来说，服务器按照如下方式计算第二预测损失。值得注意的是，这里的第二预测损失与步骤302中所涉及的第二预测损失是不一样的，由于步骤302中的第二预测损失是由终端来确定的，这里是由服务器来确定的，且两者的计算方式也是不同的。

其中，Q表示至少一个终端的数量；

表示终端i根据步骤304中的θ ₃计算的第一预测损失；L ₃(θ ₃)表示第二预测损失；

C12、服务器根据所述第二预测损失，按照参数更新规则对所述第一模型参数进行更新，以获得所述更新后的第一模型参数，以及按照所述参数更新规则对所述第二模型参数进行更新，以获得更新后的第二模型参数。

又一值得注意的是，这里的参数更新规则与步骤302中所涉及的参数更新规则是不同的。可选的，这里的参数更新规则可以为预先设定的，本发明实施例对参数更新规则不做限定。

举例来说，参数更新规则可以按照以下公式来实现：

其中，θ ₁表示第一模型参数；θ ₂表示更新后的第一模型参数；β表示第一预设权重；由于L ₃(θ ₃)是根据接收的第一预测损失计算的，θ ₃也是根据θ ₁更新得到的，因此L ₃(θ ₃)也可以转换为包含θ ₁变量的项，即L ₃(θ ₁)，通过

运算可以实现对L ₃(θ ₁)进行θ ₁求导，以获得针对θ ₁而言，L ₃(θ ₁)的变化率。按照以上更新公式可以获得更新后的第一模型参数θ ₂。

第二模型参数可以按照以下方式来学习或更新。具体是：服务器根据所述第一预测损失，按照参数更新规则对所述第二模型参数进行更新，以获得更新后的第二模型参数。

举例来说，所述参数更新规则为：

其中，α ₁表示第二模型参数；α ₂表示更新后的第二模型参数；γ表示第二预设权重；L ₃(θ ₁,α ₁)表示由所述每个终端发送的第一预测损失计算得到的第二预测损失，L ₃(θ ₃)是根据接收的第一预测损失计算的，θ ₃也是根据θ ₁更新得到的，而θ ₃的更新过程也包含α ₁，因此L ₃(θ ₃)也可以转换为包含θ ₁变量和α ₁变量的项，即L ₃(θ ₁,α ₁)；

表示梯度。由于这里又增加了一个变量。

可选的，本发明实施例对β和γ不做限定，两者在数值上可以相同，也可以不同。

307，所述服务器向所述多个终端发送所述更新后的第一模型参数和所述更新后的第二模型参数。

其中，根据步骤306可以知道更新后的第一模型参数为θ ₂，更新后的第二模型参数为α ₂；因此在这一情况下，服务器所发送的适配于终端的预测模型的模型参数为(θ ₂,α ₂)。

相应地，终端接收服务器发送的更新后的第一模型参数和所述更新后的第二模型参数，以实现根据更新后的第一模型参数和所述更新后的第二模型参数进行预测。

308，所述终端根据第二训练集对所述第一模型参数进行更新，以获得更新后的第一模型参数。

309，所述终端将待预测的目标特征向量输入至采用所述更新后的第一模型参数和所述第二模型参数的预测模型中，获取与所述目标特征向量对应的目标样本标签。

其中步骤308和步骤309可以参考图2所示实施例中步骤202和步骤203的详细描述，在此不再赘述。需要说明的是，步骤308在第一模型参数更新之前，预测模型的模型参数为(θ ₂,α ₂)；更新后的第一模型参数可以用θ ₄表示，具体的更新过程在此不再赘述。

在一种可选的实施例中，本发明实施例中服务器向至少两个终端发送的预测模型的模型参数可以按一定规则进行，例如，至少两个终端为E个终端，服务器可以向E个终端定时集中分发；或者，在需要更新预测模型的元学习器的情况下向E个终端发送预测模型的模型参数；或者，将E个终端进行分为F类，分批次向这F类终端来发送预测模型的信息等。本发明实施例对服务器发送预测模型的模型参数所依照的规则不做限定。

在一种可选的实施例中，本发明实施例中，终端向服务器发送的预测损失也可以是按照一定规则进行，例如服务器向至少两个终端中的每个终端发送反馈预测损失的时间，各个终端反馈预测损失的时间可以是相同的，以实现集中获取；或者，各个终端反馈预测损失的时间也可以是不同的，也实现分批次获取。又如，终端可以根据自身的模型训练情况可以反馈预测损失，例如，在终端计算得到预测损失之后，在一定时长内向服务器反馈预测损失等。本发明实施例对终端反馈预测损失所依照的规则不做限定。

在本发明实施例中，预测模型的训练可以在各个终端进行，这样能够起到保护各个终端的用户隐私问题，以及终端将计算获得的预测损失反馈至服务器，以使服务器根据大量终端反馈的数据，再次进行模型参数的更新，这样可以利用大量用户的信息来准确地更新预测模型的参数。另外，服务器可以向终端发送适配于终端的预测模型的模型参数以使终端实现预测，而在终端接收到服务器发送的模型参数之后，首先根据训练集和预测模型对第一模型参数进行更新，以获得更新后的第一模型参数，在待预测的目标特征向量输入至更新为更新后的第一模型参数的预测模型中，获取与所述目标特征向量对应的目标样本标签。这样能够体现该终端与其他终端的差异性，达到更为准确的预测效果。

接下来，对本发明实施例可以应用的另一种场景进行介绍。请参见图5，为本发明实施例提供了一种预测方法的示例图。如图5所示，包括服务器和多个群组，其中每个群组中包含至少两个终端，例如群组1中包括终端11、终端12等等。在这一场景中，服务器可以将多个终端按照一定的规则进行分组，使得每个群组所包含的至少两个终端之间具备共同特征。举例来说，至少两个终端之间具备共同特征包括这些终端的所在位置在一定的地理区域之内、这些终端中有相似的与预测模型相关的信息。举例来说，对于为用户推荐应用软件的预测系统，与预测模型相关的信息可以包括终端中所下载的应用的类型、用户使用终端的时长、用户使用习惯和用户年龄段等。可选的，对于考虑到保护用户隐私信息的情况，可以按照终端的标识来进行分组，这里的终端标识可以包括硬件标识、网络之间互连的协议(Internet Protocol，IP)等。本发明实施例对此不做限定。

在图5所示的场景中，服务器可以每个群组进行单独管理，即一个群组对应一个预测模型，例如，对群组1中的终端11、终端12等执行图3所示实施例中的步骤，且在这一过程中并不会参考其他群组的终端所反馈的信息。由于属于同一群组的终端用户之间具有更多的共性，相应的元学习器可以更有针对性地学习一种适用于该群组的机制，这样能够训练得到更适合该群组中的终端的预测模型，以达到更好的预测效果。

实施例四，请参见图6，图6是本申请实施例提供的一种终端的结构示意图。在图6中包含终端600包括：

接收模块601，用于接收所述服务器发送的第一模型参数和第二模型参数，所述第一模型参数和所述第二模型参数适配于所述终端的预测模型；

处理模块602，用于根据训练集和所述预测模型对所述第一模型参数进行更新，以获得更新后的第一模型参数，所述训练集包括多个第一样本数据，所述第一样本数据包括第一特征向量和与所述第一特征向量对应的第一样本标签；

所述处理模块602，具体用于获取测试集，并根据采用所述更新后的第一模型参数的预测模型计算所述测试集的第一预测损失，所述测试集包括多个第二样本数据，所述第二样本数据包括第二特征向量和与所述第二特征向量对应的第二样本标签；

发送模块603，用于向所述服务器发送所述第一预测损失，以使服务器根据所述第一预测损失更新所述第一模型参数和所述第二模型参数；

其中，所述终端包括用于预测的预测模型；所述终端包括的预测模型与所述服务器的预测模型是同一类型的预测模型。

在一个可选的实施例中，所述处理模块602在执行根据训练集和所述预测模型对所述第一模型参数进行更新，以获得更新后的第一模型参数方面，具体是执行：

根据所述预测模型计算所述训练集的第二预测损失，所述预测模型采用所述第一模型参数和所述第二模型参数；

根据所述第二预测损失和所述第二模型参数，按照参数更新规则对所述第一模型参数进行更新，以获得更新后的第一模型参数。

在一个可选的实施例中，所述处理模块602在执行根据所述预测模型计算所述训练集的第二预测损失方面，具体是执行：

根据所述预测模型计算所述多个第一样本数据中每个第一样本数据对应的预测损失；

根据所述每个第一样本数据对应的预测损失，计算所述多个第一样本数据的第二预测损失。

在一个可选的实施例中，所述处理模块602在执行根据所述预测模型计算所述多个第一样本数据中每个第一样本数据的预测损失方面，具体是执行：

将所述每个第一样本数据的第一特征向量输入至预测模型中，以获取所述每个第一样本数据的所述第一特征向量与所述第一样本标签相对应的概率；

根据所述第一特征向量与所述第一样本标签相对应的概率，按照损失计算规则计算所述每个第一样本数据的预测损失。

在一个可选的实施例中，所述处理模块602在执行将所述每个第一样本数据的第一特征向量输入至预测模型中，以获取所述每个第一样本数据的所述第一特征向量与所述第一样本标签相对应的概率方面，具体是执行：

获取所述预测模型包括的多个参考样本标签，所述多个参考样本标签包括所述每个第一样本标签；

将所述每个第一样本数据的第一特征向量输入至所述预测模型中，以获取所述第一特征向量与各个参考样本标签相对应的概率；

将参考样本标签为所述第一样本标签对应的概率确定为所述第一特征向量与所述第一样本标签相对应的概率。

在一个可选的实施例中，所述处理模块602在执行根据采用所述更新后的第一模型参数和所述第二模型参数的预测模型计算所述测试集的第一预测损失方面，具体是执行：

根据模型参数更新后的预测模型计算所述测试集包括的多个第二样本数据中每个第二样本数据对应的预测损失，所述模型参数更新后的预测模型采用更新后的第一模型参数和所述第二模型参数；

根据所述每个第二样本数据对应的预测损失，计算所述测试集的第一预测损失。

在一个可选的实施例中，所述处理模块602在执行根据模型参数更新后的预测模型计算所述测试集包括的多个第二样本数据中每个第二样本数据对应的预测损失方面，具体是执行：

将所述每个第二样本数据的第二特征向量输入至所述模型参数更新后的预测模型中，以获取所述每个第二样本数据的所述第二特征向量与所述第二样本标签相对应的概率；

根据所述第二特征向量与所述第二样本标签相对应的概率，按照损失计算规则计算所述每个第二样本数据的预测损失。

在一个可选的实施例中，所述处理模块602在执行将所述每个第二样本数据的第二特征向量输入至所述模型参数更新后的预测模型中，以获取所述每个第二样本数据的所述第二特征向量与所述第二样本标签相对应的概率方面，具体是执行：

获取所述模型参数更新后的预测模型包括的多个参考样本标签，所述多个参考样本标签包括所述每个第二样本标签；

将所述每个第二样本数据的第二特征向量输入至模型参数更新后的预测模型中，以获取所述第二特征向量与各个参考样本标签相对应的概率；

将参考样本标签为所述第二样本标签对应的概率确定为所述第二特征向量与所述第二样本标签相对应的概率。

可以理解的，这一可行的方案下终端所包括的功能块的具体实现方式及相应的有益效果，可参考前述图2至图5所示实施例的具体介绍，这里不赘述。

请参见图7，图7是本申请实施例提供的一种终端的结构示意图。在图7中包含终端700包括：

接收模块701，用于接收服务器发送的第一模型参数和第二模型参数，所述第一模型参数和所述第二模型参数适配于所述终端的预测模型；

处理模块702，用于根据训练集和所述预测模型对所述第一模型参数进行更新，以获得更新后的第一模型参数，所述训练集包括多个样本数据，每个样本数据包括特征向量和与所述特征向量对应的样本标签；

所述处理模块702，还用于将待预测的目标特征向量输入至采用所述更新后的第一模型参数和所述第二模型参数的预测模型中，获取与所述目标特征向量对应的目标样本标签；

其中，所述终端包括的预测模型与所述服务器的预测模型是同一类型的预测模型。

在一个可选的实施例中，所述处理模块702在执行根据训练集和所述预测模型对所述第一模型参数进行更新，以获得更新后的第一模型参数方面，具体是执行：

根据所述预测模型计算所述训练集的中间预测损失，所述预测模型采用所述第一模型参数和所述第二模型参数；

根据所述中间预测损失和所述第二模型参数，按照参数更新规则对所述第一模型参数进行更新，以获得更新后的第一模型参数。

在一个可选的实施例中，所述处理模块702在执行根据所述预测模型计算所述训练集的中间预测损失方面，具体是执行：

根据所述预测模型计算所述多个样本数据中每个样本数据对应的预测损失；

根据所述每个样本数据对应的预测损失，计算所述多个样本数据的中间预测损失。

在一个可选的实施例中，所述处理模块702在执行根据所述预测模型计算所述多个样本数据中每个样本数据的预测损失方面，具体是执行：

将所述每个样本数据的特征向量输入至预测模型中，以获取所述每个样本数据的所述特征向量与所述样本标签相对应的概率，其中，所述预测模型采用所述第一模型参数和所述第二模型参数；

根据所述特征向量与所述样本标签相对应的概率，按照损失计算规则计算所述每个样本数据的预测损失。

在一个可选的实施例中，所述处理模块702在执行终端将所述每个样本数据的特征向量输入至所述预测模型中，以获取所述每个样本数据的所述特征向量与所述样本标签相对应的概率方面，具体是执行：

获取所述预测模型包括的多个参考样本标签，所述多个参考样本标签包括所述每个样本标签，其中，所述预测模型采用所述第一模型参数和所述第二模型参数；

将所述每个样本数据的特征向量输入至所述预测模型中，以获取所述特征向量与各个参考样本标签相对应的概率；

所述终端将参考样本标签为所述样本标签对应的概率确定为所述特征向量与所述样本标签相对应的概率。

在一个可选的实施例中，所述处理模块702在执行将待预测的目标特征向量输入至采用所述更新后的第一模型参数和所述第二模型参数的预测模型中，获取与所述目标特征向量对应的目标样本标签，具体是执行：

获取模型参数更新后的预测模型包括的多个参考样本标签，所述模型参数更新后的预测模型采用所述更新后的第一模型参数和所述第二模型参数；

将待预测的目标特征向量输入至模型参数更新后的预测模型中，以获取所述待预测的目标特征向量与各个参考样本标签相对应的参考概率；

将多个参考概率中参考概率的最大值对应的参考样本标签确定为目标样本标签。

上述图6、图7所示实施例中的终端可以以图8所示的终端800实现。如图8所示，为本发明实施例提供了另一种终端的结构示意图，图8所示的终端800包括：处理器801和收发器802，所述收发器802用于支持终端800与上述实施例中涉及的服务器之间的信息传输，例如实现图6所示实施例中接收模块601和发送模块603的功能，或者，例如实现图7所示实施例中接收模块701的功能。处理器801和收发器802通信连接，例如通过总线相连。所述终端800还可以包括存储器803。存储器803用于存储供终端800执行的程序代码和数据，处理器801用于执行存储器803中存储的应用程序代码，以实现图2或图5所示任一实施例提供的终端的动作。

需要说明的是，实际应用中终端可以包括一个或者多个处理器，该终端800的结构并不构成对本申请实施例的限定。

处理器801可以是中央处理器(central processing unit，CPU)，网络处理器(network processor，NP)，硬件芯片或者其任意组合。上述硬件芯片可以是专用集成电路(application-specific integrated circuit，ASIC)，可编程逻辑器件(programmable logic device，PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device，CPLD)，现场可编程逻辑门阵列(field-programmable gate array，FPGA)，通用阵列逻辑(generic array logic,GAL)或其任意组合。

存储器803可以包括易失性存储器(volatile memory)，例如随机存取存储器(random access memory，RAM)；存储器803也可以包括非易失性存储器(non-volatile memory)，例如只读存储器(read-only memory，ROM)，快闪存储器(flash memory)，硬盘(hard disk drive，HDD)或固态硬盘(solid-state drive，SSD)；存储器803还可以包括上述种类的存储器的组合。

在本发明实施例中还提供了一种计算机存储介质，可以用于存储图8所示实施例中所述终端所用的计算机软件指令，其包含用于执行上述实施例中为终端所设计的程序。该存储介质包括但不限于快闪存储器、硬盘、固态硬盘。

在本发明实施例中还提供了一种计算机程序产品，该计算机产品被计算设备运行时，可以执行上述图8实施例中为终端所设计的预测方法。

实施例五，请参见图9，图9是本申请实施例提供的一种服务器的结构示意图。图9所示的服务器900包括：

发送模块901，用于向多个终端发送第一模型参数和第二模型参数，所述第一模型参数和所述第二模型参数适配于所述终端的预测模型；

接收模块902，用于接收所述多个终端中至少一个终端发送的第一预测损失，所述至少一个终端中每个终端发送的第一预测损失为所述每个终端根据采用所述第一模型参数和所述第二模型参数的预测模型计算的；

处理模块903，用于根据所述至少一个终端发送的第一预测损失对所述第一模型参数进行更新，以获得更新后的第一模型参数，以及根据所述至少一个终端发送的第一预测损失对所述第二模型参数进行更新，以获得更新后的第二模型参数；

在一个可选的实施例中，所述处理模块903在执行根据所述至少一个终端发送的第一预测损失对所述第一模型参数进行更新，以获得更新后的第一模型参数，以及根据所述至少一个终端发送的第一预测损失对所述第二模型参数进行更新，以获得更新后的第二模型参数方面，具体是执行：

所述服务器根据所述至少一个终端发送的第一预测损失，计算第二预测损失；

所述服务器根据所述第二预测损失，按照参数更新规则对所述第一模型参数进行更新，以获得所述更新后的第一模型参数，以及按照所述参数更新规则对所述第二模型参数进行更新，以获得更新后的第二模型参数。

在一个可选的实施例中，所述发送模块901，还用于向所述多个终端发送所述更新后的第一模型参数和所述更新后的第二模型参数，以使所述多个终端中的任一终端根据采用所述更新后的第一模型参数和所述更新后的第二模型参数的预测模型进行预测。

在一个可选的实施例中，所述多个终端属于同一群组；同一群组的终端具备共同特征。

在一个可选的实施例中，所述共同特征包括所述至少两个终端位于预设的地理区域内。

可以理解的，关于图9的服务器包括的功能块的具体实现方式及相应的有益效果，可参考前述图3至图5的实施例的具体介绍，这里不赘述。

上述图9所示的服务器可以以图10所示的服务器1000实现。如图10所示，为本发明实施例提供了另一种服务器的结构示意图，图10所示的服务器1000包括：处理器1001和收发器1002，所述收发器1002用于支持服务器1000与上述实施例中涉及的终端之间的信息传输，例如实现图9所示实施例中发送模块901和接收模块902的功能。处理器1001和收发器1002通信连接，例如通过总线相连。所述服务器1000还可以包括存储器1003。存储器1003用于存储供服务器1000执行的程序代码和数据，处理器1001用于执行存储器1003中存储的应用程序代码，以实现图3至图5所示任一实施例提供的服务器的动作。

需要说明的是，实际应用中服务器可以包括一个或者多个处理器，该服务器1000的结构并不构成对本申请实施例的限定。

处理器1001可以是CPU，NP，硬件芯片或者其任意组合。上述硬件芯片可以是ASIC，PLD或其组合。上述PLD可以是CPLD，FPGA，GAL或其任意组合。

存储器1003可以包括易失性存储器，例如RAM；存储器1003也可以包括非易失性存储器，例如ROM，快闪存储器，硬盘或固态硬盘；存储器1003还可以包括上述种类的存储器的组合。

在本发明实施例中还提供了一种计算机存储介质，可以用于存储图9所示实施例中所述服务器所用的计算机软件指令，其包含用于执行上述实施例中为服务器所设计的程序。该存储介质包括但不限于快闪存储器、硬盘、固态硬盘。

在本发明实施例中还提供了一种计算机程序产品，该计算机产品被计算设备运行时，可以执行上述图9所示实施例中为服务器所设计的预测方法。

实施例六，与上面实施例三都在小样本联合学习框架下，两者的主要区别是：实施例三中终端向服务器上传预测损失，而本发明实施例中的终端向服务器上传损失梯度，简单来说根据预测损失计算损失梯度的步骤一个在终端执行(实施例六)，一个在服务器执行(实施例三)。本发明实施例提供了一种训练机器学习模型的方法，在该实施例中，以第一终端与服务器交互为例，第一终端是与服务器建立连接的多个终端中的任一个，如图11所示，该方法包括：

S1，服务器将其维护的算法模型的第一参数和第二参数发送给包含第一终端在内的多个终端，第一参数用于作为多个终端中每一终端的机器学习模型的初始参数，第二参数用于指示多个终端中每一终端的训练机器学习模型的方式，多个终端的机器学习模型具有相同的结构；可选的，在服务器向多个终端发送所述服务器的算法模型的第一参数和第二参数之前，服务器初始化算法模型的第一参数和第二参数，具体如何初始化可以参见实施例三中举例部分的描述。可选的，上述多个终端属于同一群组，同一群组用于指示具有相同或相似的属性特征；可选的，属性特征包括地理区域。也就说，服务器可以为某一地理范围内的终端维护一个共同的算法模型。

S2，第一终端接收服务器发送的算法模型的第一参数和第二参数，第一终端是S1中多个终端中的一个；

S3，第一终端根据接收到的第一参数、第二参数以及训练集数据训练待训练的机器学习模型，其中，训练集数据包括多个训练样本，每一训练样本包括第一特征向量及对应的第一标签，第一特征向量根据终端的历史数据中的用户信息构建；

S4，第一终端根据测试数据以及机器学习模型得到测试结果；

关于训练集数据和测试数据的确定，可以通过下面方式选取：假设终端用户共有M条历史记录，按时间顺序排列，设

和

取前M ₁条历史记录作为训练集

在后M ₂条历史记录中随机选取Q条历史记录作为测试集

其中1≤Q≤M ₂；M ₂＝0，则不参加小样本训练和预测反馈，即不执行S3-S6；M ₂≥1，当Q＝1时，计算唯一测试样本的预测损失梯度，将梯度作为预测反馈上传至服务器；当Q>1时，为减少传输数据量，将Q个测试样本的预测损失进行统计处理之后再上传至服务器，统计操作可包含多种方式，如取均值后再计算梯度，将梯度上传至服务器。需要需注意的是，最终第一终端是否上传损失梯度，还需要满足下面将描述的预设条件。

S5，第一终端根据测试结果计算损失梯度；

S6，第一终端将计算得到的损失梯度上传给服务器，损失梯度用于服务器更新算法模型的第一参数和第二参数。

本发明实施例中步骤S3-S6对应实施例三中步骤302-304，主要区别在于本发明实施例是计算损失梯度并将损失梯度发送给服务器，而实施例三是计算预测损失并将预测损失发送给服务器，本发明实施例用损失梯度代替预测损失，可以减少上传数据大小。

S7，在预设时间窗内，服务器接收第一终端和多个终端中其他至少一个终端上传的损失梯度；可选的，服务器根据多个终端上传损失梯度的概率，重置所述预设时间窗，这里，多个个终端可以包括第一终端，也可以不包括第一终端。除了以预设时间窗为服务器接收中止条件，还可以已发送预测反馈(损失梯度)的终端数已达到数量阈值N ₀为中止条件；数量阈值可以通过下面方法计算：假设服务器发送的终端为1,2,…,N，对终端i定义p _i为历史上终端i向服务器发送的预测反馈次数和服务器向终端i发送的请求次数之间的比值(即p _i是对终端i发送预测反馈的概率的估计)，数量阈值定义为发送预测反馈的终端数的期望，即

S8，服务器根据接收到的所有损失梯度更新第一参数和第二参数。

一个示例：如实施例三，以服务器维护以(θ,α)为参数的元学习器为例，可以理解的是：元学习器是算法模型的一种具体示例，假设反馈预测损失梯度的终端为1,2,…,N′，其中终端i返回的是预测损失梯度

则以如下方式更新(θ,α)：

其中

代表梯度；标量β是一个固定的超参数，代表更新元学习器时的学习率。

进一步地，S5第一终端根据测试结果计算损失梯度，具体包括：

S5.1,第一终端根据测试结果和测试数据对应的标签计算预测损失；

S5.2,第一终端根据预测损失计算损失梯度。

可选的，上述的测试数据包括多个测试样本数据，每一测试样本数据包括第二特征向量以及对应的第二标签，每一测试样本数据对应一个测试结果；

对应地，S5.1第一终端根据测试结果和测试数据对应的标签计算预测损失，具体包括：第一终端根据多个测试样本数据各自对应的测试结果和第二标签，计算该多个测试样本数据各自的预测损失；

S5.2第一终端根据预测损失计算所述损失梯度，具体包括：第一终端根据多个测试样本数据各自的预测损失，计算该多个测试样本数据各自的损失梯度；第一终端对上述计算的多个损失梯度进行平均处理，得到目标损失梯度；

S6第一终端将损失梯度上传给所述服务器，具体包括：第一终端将经过处理得到的目标损失梯度上传给服务器。

对应地，S5.1第一终端根据测试结果和测试数据对应的标签计算预测损失，具体包括：第一终端根据多个测试样本数据各自对应的测试结果和第二标签，计算该多个测试样本数据各自的预测损失；第一终端对多个测试样本数据对应的多个预测损失进行平均，得到平均预测损失；

S5.2第一终端根据预测损失计算损失梯度，具体包括：第一终端根据上述计算的平均预测损失计算目标损失梯度；

S6第一终端将所述损失梯度上传给所述服务器，具体包括：终端将根据平均预测算计算的目标损失梯度上传给服务器。

需要注意的，上面两个可选的实施例之外，本发明实施例针对测试数据包括多个测试样本数据的情况，可以计算每一测试样本的梯度损失，并均上传给服务器；或者，计算每一测试样本的预测损失，并上传给服务器，具体可以参见图2-5所对应的实施例中相关描述。

进一步地，在第一终端根据多个测试样本数据各自对应的测试结果和第二标签，计算该多个测试样本数据各自的预测损失之后，还包括：

第一终端确认多个测试样本数据各自的预测损失满足预设条件，预设条件用于指示相对上一次计算的平均预测损失波动值小于预设阈值。可选的，是否满足预设条件的判定是：假设历史上第一终端i已发送的S _i次预测反馈对应的预测损失分别为

计算它们的均值

和标准差

如果L _i∈[μ-3σ,μ+3σ]，则预测正常；否则预测异常；[μ-3σ,μ+3σ]相当于预设条件。

可选的，如果第一终端确认测试样本数据i的预测损失不满足所述预设条件，第一终端不再计算测试样本数据i的预测损失对应的损失梯度或不根据测试样本数据i的预测损失计算平均预测损失，测试样本数据i为该多个测试样本数据中任一个。

可选的，在S2第一终端接收服务器发送的算法模型的第一参数和第二参数之前，还包括：

S9，第一终端将机器学习模型的结构标识发送给服务器，结构标识用于服务器根据结构标识确定与机器学习模型对应的算法模型。尤其在多任务并行的情况下，可以通过标识确定所需要的算法模型参数。例如，第一终端上有分类机器学习模型和应用推荐机器学习模型，两个模型若是具有不同的模型结构，在需要训练分类机器学习模型时，可以上传该分类机器学习模型对应的标识，告知服务器所需要的算法模型的参数；同样，若是应用推荐机器学习模型，在需要训练应用推荐机器学习模型时，可以上传应用推荐机器学习模型对应的标识，告知服务器所需要的算法模型的参数；在第一终端计算能力允许的情况，即使第一终端需要同时训练分类机器学习模型和应用推荐机器学习模型两个模型，可以通过结构标识获取服务器上算法模型的参数，实现多任务同时进行。结构标识、机器学习模型、算法模型的关系可以是预先配置的，也可以是在获取之前通信协商的，具体对应关系部作任何限制。

对应的，在S1服务器向包含第一终端在内的多个终端发送第一参数和第二参数之前，该方法还包括：S10,所述服务器接收所述多个终端上传的各自机器学习模型的结构标识，所述结构标识用于所述服务器确定与所述机器学习模型的结构对应的所述算法模型。

可选的，该方法还包括：S11,服务器接收至少一个终端上传的预测结果打分，预测结果打分为终端用户对机器学习模型的预测结果的打分；S12服务器根据预测结果打分，确定加权系数；这里，至少一个终端可以包括第一终端，也可以不包括第一终端。

对应的，S8服务器根据至少一个终端上传的损失梯度更新第一参数和第二参数，具体包括：服务器根据加权系数对至少一个终端上传的损失梯度进行加权平均处理，得到加权损失梯度；服务器根据加权损失梯度更新第一参数和第二参数。例如，如实施例三，以服务器维护以(θ,α)为参数的元学习器为例，服务器接收到N′个终端发送的预测损失梯度

则将所有梯度计算平均值

用该平均值更新元学习器参数。

可选的，该方法还包括：S13,服务器接收到第一终端发送的参数更新请求，参数更新请求用于请求服务器发送最近一次更新的第一参数和第二参数，第一终端为所述多个终端中的任一个终端；

服务器向所述第一终端发送最近一次更新的第一参数和第二参数。

需要说明的，上面实施例中服务器所执行的方法可以由图9或图10所示服务器实现，上面实施例中第一终端所执行的方法可以由图6或图8所示终端实现，具体描述可以参见上面图所对应的实施例，此处不再赘述。

如实施例三，以推荐下一个APP为例，采用Meta-SGD作为小样本学习算法模型。为了避免冗余，前面各实施例已描述内容，可能不在本发明实施例中赘述，具体可以参见前面各实施例。

服务器：如实施例三，服务器维护(θ,α)为参数的元学习器，本发明实施例中服务器执行的步骤与实施例三中服务器执行的步骤区别是：本发明实施例中，服务器从各终端接收的损失梯度(预测损失梯度)

这里

是关于(θ,α)的函数；假设返回预测反馈的终端为1,2,…,N′，其中终端i返回的是预测损失梯度

则以如下方式更新(θ,α)：

其中

终端侧：本发明实施例中，终端执行以下步骤：

维护一个计数器S _i，记录当前终端i已发送预测反馈(损失梯度)的次数。如果是第一次进行小样本训练，则初始化S _i←0。

假设终端用户共有M条历史记录，按时间顺序排列，设

和

取前M ₁条历史记录作为训练集

在后M ₂条历史记录中随机选取Q条历史记录作为测试集

其中1≤Q≤M ₂。

终端接收服务发送的参数(θ,α)，第一参数对应θ，第二参数对应α；对参数为θ的推荐模型，定义它在样本(x,k)上(其中x为特征向量，k代表该样本标签为第k个APP)的损失函数为

以如下方式训练推荐模型(//后的内容为注释)：

θ′ _i←θ//用θ初始化本地预测模型

for t＝1,2,…,T do//迭代T步来优化本地预测模型，例如T＝100

//计算训练集损失

//更新预测模型参数，这里“

”是向量的分量乘法运算，例如

计算θ′ _i在测试集上的预测损失：

如果预测结果没有出现异常，则将预测损失

的梯度

上传至服务器，并更新计数器S _i←S _i+1；如果出现异常，则不上传预测反馈，不更新计数器。异常的判定条件：

假设历史上终端i已发送的S _i次预测反馈对应的预测损失分别为

计算它们的均值

和标准差

如果L _i∈[μ-3σ,μ+3σ]，则预测正常；否则预测异常。

实施例七，本发明实施例还提供了一种预测方法，预测是指基于机器学习模型预测某一类任务，例如：图片分类、应用推荐、图像识别都可以看作是一种预测行为，如图12所示，该方法包括：

S1010，第一终端获取第一终端的用户信息，并根据该用户信息生成目标特征向量；

S1020,第一终端将上述的目标特征向量输入目标预测模型，得到目标预测结果；

其中，目标预测模型是第一终端根据第一参数、第二参数以及终端的历史数据训练得到的机器学习模型，第一参数和第二参数为服务器发送的该服务器上与终端的机器学习模型对应的算法模型的两个参数，第一参数用于作为第一终端的机器学习模型的初始参数，第二参数用于指示第一终端训练机器学习模型的方式，所述第一参数和所述第二参数为服务器根据多个终端反馈的多个损失梯度得到，任一损失梯度为对应终端基于本地历史数据计算得到，具体怎样计算损失梯度乐意参见上面实施例相应部分描述，所述多个终端包括所该第一终端。

一般情况，终端的机器学习模型是在使用之前训练好的，具体训练的方式是上面实施例所描述的训练机器学习模型的方法；可选的，在通过机器学习模型预测之前，该方法还包括：S1030，终端向服务器发送参数更新请求，参数更新请求用于请求服务器发送算法模型的最近一次更新的第一参数和第二参数；S1040,所述服务器接收到第一终端发送的参数更新请求，所述参数更新请求用于请求所述服务器发送最近一次更新的第一参数和第二参数，所述第一终端为所述多个终端中的任一个终端；S1050,所述服务器向所述第一终端发送最近一次更新的第一参数和第二参数。S1060,终端接收所述服务器发送的最近一次更新的第一参数和第二参数；S1070，终端根据接收到的最近一次更新的第一参数和第二参数以及终端的目前的历史数据训练目标预测模型；对应的，S1020第一终端将所述目标特征向量输入目标预测模型，得到目标预测结果，具体包括：第一终端将目标特征向量输入训练后的目标预测模型，得到目标预测结果。这样可以再使用目标预测模型之前，再基于服务器新更新的第一参数和第二参数以及终端本地新产生的历史数据对该目标预测模型进行一次训练后再进行预测，能够实现更好地预测效果。

可选的，上述第一终端发送给服务器的参数更新请求包括：目标预测模型对应的机器学习模型的结构标识，结构标识用于服务器根据确定与目标预测模型对应的算法模型。

进一步地，在第一终端将所述目标特征向量输入目标预测模型，得到目标预测结果之后，还包括：第一终端获取用户对目标预测结果的预测结果打分；并向服务器上传预测结果打分，其中，预测结果打分为第一终端用户对目标预测结果的打分，该预测结果打分用于服务器确定加权系数，加权系数用于服务器处理多个终端上传的损失梯度得到加权损失梯度，加权损失梯度用于服务器更新第一参数和第二参数。第一终端可以是主动获取并向服务器发送用户对目标预测结果的预测结果打分，也可以是第一终端接收到服务器周期性向终端发送的用户反馈请求后获取并上传用户对目标预测结果的预测结果打分；下面以第二种情况为例：

服务器向终端发送用户反馈请求，可以按如下方式执行：周期性(如每个月一次)发送用户反馈请求，用户反馈请求用于要求终端用户对预测效果进行(主观)评价，在0～10之间打分，0为效果极差，10为效果极好；终端接收用户反馈请求后并通知终端用户对预测效果进行打分，在下一次上传预测反馈(即损失梯度或者预测损失)时同时上传用户对目标预测结果的预测结果的打分；服务器在更新参数时参考用户打分，如果没有接收到终端用户的打分，则使用默认值5分，终端用户的打分的使用方式可能是：(a)终端用户打分越高，说明元学习器对该终端用户的模型训练最有效，在更新元学习器参数时该终端用户对应的权重越大；(b)终端用户打分越低，说明元学习器越应该提升该终端用户的模型训练效果，在更新元学习器参数时该终端用户对应的权重越大，这里元学习器是指算法模型；例如，采用方式(a)，即终端用户打分越高对应权重越大，具体如下：

假设返回预测反馈的终端为1,2,…,N′，终端i返回的是预测损失梯度

则以如下方式更新(θ,α)：

其中，

代表梯度；标量β是一个固定的超参数，代表更新元学习器时的学习率；c _i为终端i的用户打分，λ为固定系数。

需要说明的，上面实施例中服务器所执行的方法可以由图9或图10所示服务器实现，上面实施例中第一终端所执行的方法可以由图6或图7或图8所示终端实现，具体描述可以参见上面图所对应的实施例，此处不再赘述。

针对服务器的算法模型和终端的机器学习模型(例如)预测模型，可选的，两端的模型都是小规模模型,或者服务器为小规模模型，或者终端为小规模模型，其中小规模模型是相对于传统神经网络而言的。

本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选的还包括没有列出的步骤或单元，或可选的还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

本领域普通技术人员可以理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

一种训练机器学习模型方法，其特征在于，包括：

终端接收服务器发送的所述服务器上的算法模型的第一参数和第二参数，所述第一参数用于作为所述终端的机器学习模型的初始参数，所述第二参数用于指示所述终端训练机器学习模型的方式；

所述终端根据所述第一参数、所述第二参数以及训练集数据训练所述终端上的机器学习模型，所述训练集数据包括多个训练样本，每一训练样本包括第一特征向量及对应的第一标签，所述第一特征向量根据所述终端的历史数据中的用户信息构建；

所述终端根据测试数据以及所述机器学习模型得到测试结果，并根据所述测试结果计算损失梯度；

所述终端将所述损失梯度上传给所述服务器，所述损失梯度用于所述服务器更新所述第一参数和所述第二参数。
根据权利要求1所述的方法，其特征在于，所述根据所述测试结果计算损失梯度，包括：

所述终端根据所述测试结果和所述测试数据对应的标签计算预测损失；

所述终端根据所述预测损失计算所述损失梯度。
根据权利要求2所述的方法，其特征在于，所述测试数据包括多个测试样本数据，每一测试样本数据包括第二特征向量以及对应的第二标签，每一测试样本数据对应一个测试结果；

其中，所述终端根据所述测试结果和所述测试数据对应的标签计算预测损失，包括：

所述终端根据所述多个测试样本数据各自对应的测试结果和第二标签，计算所述多个测试样本数据各自的预测损失；

所述终端根据所述预测损失计算所述损失梯度，包括：

所述终端根据所述多个测试样本数据各自的预测损失，计算所述多个测试样本数据各自的损失梯度；

所述终端对所述多个测试样本数据对应的多个损失梯度进行平均处理，得到目标损失梯度；

所述终端将所述损失梯度上传给所述服务器，包括：

终端将所述目标损失梯度上传给所述服务器。
根据权利要求2所述的方法，其特征在于，所述测试数据包括多个测试样本数据，每一测试样本数据包括第二特征向量以及对应的第二标签，每一测试样本数据对应一个测试结果；

其中，所述终端根据所述测试结果和所述测试数据对应的标签计算预测损失，包括：

所述终端根据所述多个测试样本数据各自对应的测试结果和第二标签，计算所述多个测试样本数据各自的预测损失；

所述终端对所述多个测试样本数据对应的多个预测损失进行平均，得到平均预测损失；

所述终端根据所述预测损失计算所述损失梯度，包括：

所述终端根据所述平均预测损失计算目标损失梯度；

所述终端将所述损失梯度上传给所述服务器，包括：

终端将所述目标损失梯度上传给所述服务器。
根据权利要求3或4所述的方法，其特征在于，在所述终端根据所述多个测试样本数据各自对应的测试结果和第二标签，计算所述多个测试样本数据各自的预测损失之后，还包括：

所述终端确认所述多个测试样本数据各自的预测损失满足预设条件，所述预设条件用于指示相对上一次计算的平均预测损失波动值小于预设阈值，所述平均预测损失为所诉终端对已多个测试样本数据对应的多个预测损失进行平均得到的。
根据权利要求5所述的方法，其特征在于，包括：

若所述终端确认测试样本数据i的预测损失不满足所述预设条件，所述终端不再计算所述测试样本数据i的预测损失对应的损失梯度或不根据所述测试样本数据i的预测损失计算所述平均预测损失，所述测试样本数据i为所述多个测试样本数据中任一个。
根据权利要求1-6任一项所述的方法，其特征在于，在终端接收服务器发送的所述服务器的算法模型的第一参数和第二参数之前，包括：

所述终端将所述机器学习模型的结构标识发送给所述服务器，所述结构标识用于所述服务器根据所述结构标识确定所述机器学习模型对应的所述算法模型。
一种预测方法，其特征在于，包括：

第一终端获取所述第一终端的用户信息，并根据所述用户信息生成目标特征向量；

所述第一终端将所述目标特征向量输入目标预测模型，得到目标预测结果；

其中，所述目标预测模型为所述第一终端根据第一参数、第二参数以及所述第一终端的历史数据训练得到的本地机器学习模型，所述第一参数和所述第二参数为服务器发送的所述服务器的算法模型的两个参数，所述第一参数用于作为所述第一终端的机器学习模型的初始参数，所述第二参数用于指示所述第一终端训练机器学习模型的方式，所述第一参数和所述第二参数为所述服务器根据多个终端反馈的多个损失梯度得到，任一损失梯度为对应终端基于本地历史数据计算得到。
根据权利要求2所述的方法，其特征在于，在所述第一终端将所述目标特征向量输入目标预测模型，得到目标预测结果之前，包括：

所述第一终端向所述服务器发送参数更新请求，所述参数更新请求用于请求所述服务器发送所述算法模型的最近一次更新的第一参数和第二参数；

所述第一终端接收所述服务器发送的所述最近一次更新的第一参数和第二参数；

所述第一终端根据所述最近一次更新的第一参数和第二参数以及所述第一终端的历史数据训练所述目标预测模型；

其中，所述第一终端将所述目标特征向量输入目标预测模型，得到目标预测结果，包括：

所述第一终端将所述目标特征向量输入训练后的目标预测模型，得到目标预测结果。
根据权利要求9所述的方法，其特征在于，所述参数更新请求包括：所述目标预测模型对应的机器学习模型的结构标识，所述结构标识用于所述服务器根据所述结构标识确定所述目标预测模型对应的所述算法模型。
根据权利要求8-10任一项所述的方法，其特征在于，在所述第一终端将所述目标特征向量输入目标预测模型，得到目标预测结果之后，还包括：

所述第一终端向所述服务器上传预测结果打分，其中，所述预测结果打分为所述第一终端的用户对所述目标预测结果的打分，所述预测结果打分用于所述服务器确定加权系数，所述加权系数用于所述服务器处理所述多个终端上传的损失梯度得到加权损失梯度，所述加权损失梯度用于所述服务器更新所述第一参数和所述第二参数，所述多个终端包括所述第一终端。
一种训练机器学习模型的方法，其特征在于，包括：

服务器向多个终端发送所述服务器的算法模型的第一参数和第二参数，所述第一参数用于作为所述多个终端中每一终端的机器学习模型的初始参数，所述第二参数用于指示所述多个终端中每一终端的训练机器学习模型的方式，所述多个终端的机器学习模型具有相同的结构；

在预设时间窗内，所述服务器接收所述多个终端中至少一个终端上传的损失梯度；

所述服务器根据所述至少一个终端上传的损失梯度更新所述第一参数和所述第二参数。
根据权利要求12所述的方法，其特征在于，在所述服务器向多个终端发送第一参数和第二参数之前,包括：

所述服务器初始化所述算法模型的所述第一参数和所述第二参数。
根据权利要求12或13所述的方法，其特征在于，包括：

所述服务器根据所述多个终端上传损失梯度的概率，重置所述预设时间窗。
根据权利要求12-14任选一所述的方法，其特征在于，所述多个终端属于同一群组，所述同一群组用于指示具有相同或相似的属性特征。
根据权利要求15所述的方法，其特征在于，所述属性特征包括地理区域。
根据权利要求12-16任一项所述的方法，其特征在于，还包括：

所述服务器接收所述至少一个终端上传的预测结果打分，所述预测结果打分为终端用户对机器学习模型的预测结果的打分；

所述服务器根据所述预测结果打分，确定加权系数；

其中，所述服务器根据所述至少一个终端上传的损失梯度更新所述第一参数和所述第二参数，包括：

所述服务器根据所述加权系数对所述至少一个终端上传的损失梯度进行加权平均处理，得到加权损失梯度；

所述服务器根据所述加权损失梯度更新所述第一参数和所述第二参数。
根据权利要求12-17任选一所述的方法，其特征在于，在服务器向多个终端发送第一参数和第二参数之前，还包括：

所述服务器接收所述多个终端上传的各自机器学习模型的结构标识，所述结构标识用于所述服务器确定与所述机器学习模型的结构对应的所述算法模型。
根据权利要求12-18任选一所述的方法，其特征在于，包括：

所述服务器接收到第一终端发送的参数更新请求，所述参数更新请求用于请求所述服务器发送最近一次更新的第一参数和第二参数，所述第一终端为所述多个终端中的任一个终端；

所述服务器向所述第一终端发送最近一次更新的第一参数和第二参数。
一种终端，其特征在于，包括：处理器、存储介质；

所述存储介质用于存储可编程指令；

所述处理器用于调用所述存储介质上存储的可编程指令执行权利要求1-7任一项所述的方法。
一种终端，其特征在于，包括：处理器、存储介质；

所述存储介质用于存储可编程指令；

所述处理器用于调用所述存储介质上存储的可编程指令执行权利要求8-11任一项所述的方法。
一种服务器，其特征在于，包括：处理器、存储介质；

所述存储介质用于存储可编程指令；

所述处理器用于调用所述存储介质上存储的可编程指令执行权利要求12-19任一项所述的方法。
一种计算机可读存储介质，其特征在于，包括指令，当其在计算机上运行时，使得所述计算机执行权利要求1-7任一项所述的方法。
一种计算机可读存储介质，其特征在于，包括指令，当其在计算机上运行时，使得所述计算机执行权利要求8-11任一项所述的方法。
一种计算机可读存储介质，其特征在于，包括指令，当其在计算机上运行时，使得所述计算机执行权利要求12-19任一项所述的方法。