CN111414636A

CN111414636A - 识别模型的更新方法、装置、设备及存储介质

Info

Publication number: CN111414636A
Application number: CN202010206242.1A
Authority: CN
Inventors: 彭金华; 陈潮涛; 姜迪; 李牧之; 周古月; 徐倩; 杨强
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2020-03-20
Filing date: 2020-03-20
Publication date: 2020-07-14

Abstract

本发明公开了一种识别模型的更新方法、装置、设备及存储介质，涉及金融科技领域，该方法包括步骤：当接收到各终端设备发送的用户标识后，检测各终端设备中待更新模型的类型；若检测到各终端设备中待检测模型属于第一类型，则根据用户标识进行样本对齐，得到对齐后的用户标识；根据对齐后的用户标识构造训练样本，并根据用户标识将训练样本发送给各终端设备，以供各终端设备根据所接收的训练样本计算得到样本向量；接收各终端设备发送的样本向量，根据样本向量计算得到损失值，并将损失值发送给各终端设备，以供各终端设备根据损失值更新对应的第一识别模型。本发明避免了训练数据泄露的问题出现，提高了所更新的识别模型的识别准确率。

Description

识别模型的更新方法、装置、设备及存储介质

技术领域

本发明涉及金融科技(Fintech)的数据处理技术领域，尤其涉及一种识别模型的更新方法、装置、设备及存储介质。

背景技术

随着计算机技术的发展，越来越多的技术应用在金融领域，传统金融业正在逐步向金融科技(Fintech)转变，数据处理技术也不例外，但由于金融行业的安全性、实时性要求，也对数据处理技术提出的更高的要求。

现有的声纹识别模型，都是采用各自本地的数据或者部分公开数据集进行模型训练，而声纹识别需要精确抽取声纹的特征，因此需要大量的数据进行训练，且要求同一用户要有尽可能长的有效语音的数据。然而，在现实场景中，很少有企业能够拥有大量不同用户的音频数据，也很难拥有同一用户足够长的音频数据，因此用目前所拥有的音频数据训练出来的声纹识别模型，往往有很大的局限性，对于同一用户的类内间距，以及不同用户之间的类间间距，学习得不够准确，从而使得声纹识别模型的泛化能力不好，声纹识别的准确率不够高。目前，往往是从数据层面进行解决，比如进行音频数据共享，以获取大量的音频数据进行声纹识别模型训练。但是用户音频数据属于用户隐私数据，共享音频数据有着巨大的隐私泄露的风险。还有些方案，不是直接共享用户的原始音频数据，而是将音频数据进行向量化后共享出去。这种做法在一定程度上保护了用户隐私，但依然存在两个问题，一是向量化之后的音频数据，有一定程度上的内容丢失；二是共享的向量，有可能会反向解码出原始音频数据，依然会有泄露隐私的风险。

由此可知，目前在识别模型训练过程，存在训练数据泄露，以及所得识别模型识别准确率低下的问题。

发明内容

本发明的主要目的在于提供一种识别模型的更新方法、装置、设备及存储介质，旨在解决现有的在识别模型训练过程，存在训练数据泄露，以及所得识别模型识别准确率低下的技术问题。

为实现上述目的，本发明提供一种识别模型的更新方法，所述识别模型的更新方法应用于服务端，所述识别模型的更新方法包括步骤：

当接收到各终端设备发送的用户标识后，检测各终端设备中待更新模型的类型；

若检测到各终端设备中待检测模型属于第一类型，则根据所述用户标识进行样本对齐，得到对齐后的用户标识；

根据对齐后的用户标识构造训练样本，并根据所述用户标识将所述训练样本发送给各终端设备，以供各终端设备根据所接收的训练样本计算得到样本向量；

接收各终端设备发送的样本向量，根据所述样本向量计算得到损失值，并将所述损失值发送给各终端设备，以供各终端设备根据所述损失值更新对应的第一识别模型。

可选地，所述根据对齐后的用户标识构造训练样本的步骤包括：

根据对齐后的用户标识构造训练样本中的锚定训练样本、正例训练样本和负例训练样本，以得到训练样本，其中，同一训练样本中的锚定训练样本和正例训练样本对应的用户标识相同，同一训练样本中的负例训练样本对应用户标识与正例训练样本对应用户标识不相同。

可选地，所述接收各终端设备发送的样本向量，根据所述样本向量计算得到损失值，并将所述损失值发送给各终端设备，以供各终端设备根据所述损失值更新对应的第一识别模型的步骤包括：

接收各终端设备发送的，经过同态加密后的样本向量，得到加密后的样本向量；

通过加密后的样本向量计算得到损失值，并加密所述损失值，得到加密后的损失值；

将加密后的损失值发送给各终端设备，以供各终端设备解密所接收的加密后的损失值，得到解密后的损失值，并根据解密后的损失值计算第一梯度值，根据所述第一梯度值更新对应的第一识别模型。

可选地，所述通过加密后的样本向量计算得到损失值的步骤包括：

确定加密后的样本向量中，各训练样本对应锚定训练样本的锚定向量、正例训练样本的正例向量和负例训练样本的负例向量；

通过所述锚定向量和所述正例向量计算得到第一数值，以及通过所述锚定向量和所述负例向量计算得到第二数值；

根据所述第一数值、所述第二数值和预设的常数变量计算得到损失值。

可选地，所述根据所述用户标识将所述训练样本发送给各终端设备，以供各终端设备根据所接收的训练样本计算得到样本向量的步骤包括：

根据各用户标识对应的设备标识确定各用户标识对应的终端设备；

将所述训练样本按照所述用户标识发送给各用户标识对应的终端设备，以供所述终端设备根据接收的训练样本得到样本向量。

可选地，所述当接收到各终端设备发送的用户标识后，检测各终端设备中待更新模型的类型的步骤之后，还包括：

若检测到各终端设备中待检测模型属于第二类型，则发送预设的第二识别模型给各用户标识对应的终端设备，以供各终端设备在接收到所述第二识别模型后，根据所述第二识别模型和本地训练数据得到第二梯度值，并加密所述第二梯度值；

接收各终端设备发送的加密后的第二梯度值，根据加密后的第二梯度值更新第二识别模型的模型参数，得到更新后的模型参数；

将更新后的模型参数发送给各终端设备，以供各终端设备根据更新后的模型参数更新所接收的第二识别模型。

可选地，所述当接收到各终端设备发送的用户标识后，检测各终端设备中待更新模型的类型的步骤之前，还包括：

生成公钥，并将所述公钥发送给各终端设备，以供各终端设备根据所述公钥加密用户标识，并发送加密后的用户标识。

此外，为实现上述目的，本发明还提供一种识别模型的更新装置，所述识别模型的更新方法应用于终端设备，所述识别模型的更新方法包括以下步骤：

将获取的用户标识发送给服务端，以供所述服务端在接收到用户标识，且确定各终端设备中待更新模型属于第一类型时，返回基于所述用户标识构造的训练样本；

接收服务端发送的训练样本，并根据所述训练样本计算得到样本向量；

将所述样本向量发送给所述服务端，以供所述服务端根据所述样本向量计算得到损失值；

接收所述服务端发送的损失值，根据所述损失值更新预存的第一识别模型。

可选地，所述第一识别模型为声纹识别模型，所述接收所述服务端发送的损失值，根据所述损失值更新预存的第一识别模型的步骤之后，还包括：

当侦测到声纹识别的识别请求后，获取所述识别请求对应的声纹数据；

将所述声纹数据输入至更新后的声纹识别模型中，以确定所述声纹数据对应的用户。

此外，为实现上述目的，本发明还提供一种识别模型的更新装置，所述识别模型的更新装置包括：

检测模块，用于当接收到各终端设备发送的用户标识后，检测各终端设备中待更新模型的类型；

对齐模块，用于若检测到各终端设备中待检测模型属于第一类型，则根据所述用户标识进行样本对齐，得到对齐后的用户标识；

构造模块，用于根据对齐后的用户标识构造训练样本；

发送模块，用于根据所述用户标识将所述训练样本发送给各终端设备，以供各终端设备根据所接收的训练样本计算得到样本向量；

接收模块，用于接收各终端设备发送的样本向量；

计算模块，用于根据所述样本向量计算得到损失值；

所述发送模块还用于将所述损失值发送给各终端设备，以供各终端设备根据所述损失值更新对应的第一识别模型。

此外，为实现上述目的，本发明还提供一种识别模型的更新设备，所述识别模型的更新设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的识别模型的更新程序，所述识别模型的更新程序被所述处理器执行时实现如联邦学习服务器对应的识别模型的更新方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有识别模型的更新程序，所述识别模型的更新程序被处理器执行时实现如上所述的识别模型的更新方法的步骤。

本发明通过当接收到各终端设备发送的用户标识，且检测到各终端设备中存在相同的用户标识后，则根据用户标识进行样本对齐，得到对齐后的用户标识，并根据对齐后的用户标识构造训练样本，将训练样本发送给各终端设备，接收各终端设备发送的样本向量，根据样本向量计算得到损失值，并将损失值发送给各终端设备，以供各终端设备根据损失值更新对应的第一识别模型，从而实现在训练识别模型，即更新识别模型过程中，由服务端获取各终端设备的用户标识来构建训练样本，根据训练样本来更新识别模型，不需要得到各终端设备对应的本地训练数据，避免训练数据泄露的问题出现，且由于服务端在构建训练样本过程中，是根据各个终端设备的用户标识对应的样本向量来构建，从而提高了所更新的识别模型的识别准确率。

附图说明

图1是本发明识别模型的更新方法第一实施例的流程示意图；

图2是本发明识别模型的更新方法第二实施例的流程示意图；

图3是本发明识别模型的更新装置较佳实施例的功能示意图模块图；

图4是本发明实施例方案涉及的硬件运行环境的结构示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明提供一种识别模型的更新方法，参照图1，图1为本发明识别模型的更新方法第一实施例的流程示意图。

本发明实施例提供了识别模型的更新方法的实施例，需要说明的是，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

识别模型的更新方法应用于服务器或者终端中，终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant，PDA)等移动终端，以及诸如数字TV、台式计算机等固定终端。在识别模型的更新方法的各个实施例中，为了便于描述，以服务端为执行主体进行阐述各个实施例。识别模型的更新方法包括：

步骤S10，当接收到各终端设备发送的用户标识后，检测各终端设备中待更新模型的类型。

当服务端接收到各个终端设备发送的用户标识后，服务端检测各终端设备中待更新模型的类型。在本实施例中，待更新模型对应两种类型，当待更新模型更新过程中存在三元组时，服务端可确定待更新模型属于第一类型；当待更新模型更新过程中不存在三元组时，服务端确定待更新属于第二类型。其中，三元组为锚定训练样本、正例训练样本和负例训练样本。

需要说明的是，每个终端设备发送的用户标识中，携带有对应终端设备的设备标识，用户标识可唯一表示一个用户，而设备标识可唯一表示一个终端设备，通过用户标识来区分不同用户，通过设备标识来区分不同的终端设备。在本实施例中，不限制用户标识和设备标识的表现形式。

进一步地，由于各终端设备发送给服务端的是用户标识，因此为了减少各个终端设备发送给服务端用户标识的数量，提高终端设备和服务端之间数据传输的效率，单个终端设备发送给服务端的用户标识是不相同的。

进一步地，当终端设备的用户标识含有私密信息时，如用户标识是用户的身份证号码或者电话号码等个人信息，终端设备在发送用户标识给服务端之前，会对用户标识进行加密，得到加密后的用户标识，然后将加密后的用户标识发送给服务端。具体地，终端设备可采用对称加密算法或者非对称加密算法对用户标识进行加密，如各终端设备可采用MD5或者其他加密算法加密用户标识。需要说明的是，各个终端设备在对用户标识进行加密时，所采用的加密算法相同。

步骤S20，若检测到各终端设备中待检测模型属于第一类型，则根据所述用户标识进行样本对齐，得到对齐后的用户标识。

若服务端确定各终端设备中待检测模型属于第一类型，此时各终端设备中存在相同的用户标识，服务端则根据所接收的用户标识进行样本对齐，得到对齐后的用户标识。需要说明的是，在得到对齐后的用户标识后，服务端就可以知道每一个用户标识是那几个终端设备所拥有的，即在样本对齐后，服务端可确定每一用户标识存在那几个终端设备中。

在本实施例中，用户标识是作为样本对齐的键值。需要说明的是，由于本发明实施例中，各终端设备都不希望服务端知道其真实的样本数据，因此，在各个终端设备中，每一用户标识都存在对应的样本数据，各个终端设备为了保护样本数据的安全性，避免样本数据被泄露，只将用户标识发送给服务端，而不将用户标识对应的样本数据发送给服务端。

步骤S30，根据对齐后的用户标识构造训练样本，并根据所述用户标识将所述训练样本发送给各终端设备，以供各终端设备根据所接收的训练样本计算得到样本向量。

当服务端得到对齐后的用户标识后，服务端根据对齐后的用户标识构造训练样本，得到所构造的训练样本，然后根据训练样本对应的用户标识，将训练样本发送给各终端设备。具体地，终端设备确定各个训练样本对应用户标识携带的设备标识，将训练样本发送给该设备标识对应的终端设备，即将所构造的训练样本按照用户标识的来源返回给各终端设备。如用户标识A1为终端设备A发送给服务端的，因此，服务端会将用户标识A1对应的训练样本发送给终端设备A。当各终端设备接收到服务端发送的训练样本后，各终端设备根据所接收的训练样本计算得到对应的样本向量。需要说明的是，在本实施例中，训练样本对应的用户标识为锚定训练样本或者正例训练样本的用户标识。

进一步地，所述根据对齐后的用户标识构造训练样本的步骤包括：

步骤a，根据对齐后的用户标识构造训练样本中的锚定训练样本、正例训练样本和负例训练样本，以得到训练样本，其中，同一训练样本中的锚定训练样本和正例训练样本对应的用户标识相同，同一训练样本中的负例训练样本对应用户标识与正例训练样本对应用户标识不相同。

具体地，服务端根据对齐后的用户标识构造训练样本中的锚定训练样本(anchorexample)、正例训练样本(positive example)和负例训练样本(negative example)，以得到训练样本。需要说明的是，每一训练样本都包括一个锚定训练样本、正例训练样本和负例训练样本，其中，同一训练样本中的锚定训练样本和正例训练样本对应的用户标识相同，同一训练样本中的负例训练样本对应用户标识与正例训练样本对应用户标识不相同。在同一训练样本中，锚定训练样本、正例训练样本和负例训练样本都存在对应的用户标识，这3个用户标识可能来自同一个终端设备，也可能来自不同的终端设备。

本实施例中的训练样本具体为何种训练样本，可根据需要更新的识别模型来确定，如需要更新的识别模型为声纹识别模型，则锚定训练样本对应数据为目标用户的声纹音频，目标用户为锚定训练样本对应用户标识的用户，正例训练样本对应数据为目标用户的另一段声纹音频；负例训练样本对应数据为非目标用户的声纹音频，即其他用户的声纹音频。如需要更新的识别模型为人脸识别模型，则锚定训练样本对应数据为目标用户的人脸图像，正例训练样本对应数据为目标用户的另一幅人脸图像，负例训练样本对应数据为非目标用户的人脸图像。

需要说明的是，在服务端所构造的训练样本中，只含有对应的标识，并没有相应的样本数据。如在某个训练样本中含有三个标识，分别为(ANC_ID，POS_ID，NEG_ID)，其中，ANC_ID表示锚定训练样本对应的标识，POS_ID表示正例训练样本对应的标识，NEG_ID表示负例训练样本对应的标识，ANC_ID和POS_ID对应的用户标识相同，NEG_ID对应的用户标识与ANC_ID和POS_ID对应的用户标识不同。

进一步地，服务端在根据对齐后的用户标识构造训练样本过程中，所构造的训练样本数量可根据具体需要而设置，如可每次构造一个batch(批)训练样本，或者多批训练样本，每批训练样本可为128个。

进一步地，所述根据所述用户标识将所述训练样本发送给各终端设备，以供各终端设备根据所接收的训练样本计算得到样本向量的步骤包括：

步骤b，根据各用户标识对应的设备标识确定各用户标识对应的终端设备。

步骤c，将所述训练样本按照所述用户标识发送给各用户标识对应的终端设备，以供所述终端设备根据接收的训练样本得到样本向量。

具体地，在服务端得到训练样本后，服务端获取各用户标识中携带的设备标识，根据各用户标识中携带的设备标识确定各用户标识对应的终端设备，将训练样本按照用户标识发送给各用户标识对应的终端设备，即将训练样本发送给训练样本对应用户标识所在的终端设备。当各终端设备接收到服务端发送的训练样本后，各终端设备获取所接收训练样本对应的样本数据，将该样本数据转换成样本向量，从而得到训练样本对应的样本向量。在本实施例中，各终端设备可通过神经网络模型得到训练样本对应的样本向量，样本向量可表示样本数据的具体信息，表示各个用户相关特征，如声纹特征的稠密向量(embedding)。在本实施例中，样本向量可为128维度、256维度或者512维度等。当各终端设备得到样本向量后，各终端设备将各自的样本向量发送给服务端。

步骤S40，接收各终端设备发送的样本向量，根据所述样本向量计算得到损失值，并将所述损失值发送给各终端设备，以供各终端设备根据所述损失值更新对应的第一识别模型。

当服务端接收到各终端设备发送的样本向量后，服务端根据各终端设备发送的样本向量计算得到损失值，并将所计算的损失值发送给各终端设备。当各终端设备接收到服务端发送的损失值后，各终端设备根据损失值更新对应的第一识别模型。此时，待更新模型为第一识别模型。需要说明的是，在各终端设备中，都存在对应的第一识别模型，该第一识别模型可为各终端设备从服务端中获取的，也可为各终端设备自己数据库中预先存储的。可以理解的是，若第一识别模型为各终端设备从服务端中获取的，则各终端设备中的第一识别模型是一样的；若第一识别模型为各终端设备自己预先根据各自的本地训练数据训练得到的，则各终端设备中的第一识别模型可能是相同的，也可能是不同的。

进一步地，步骤S40包括：

步骤d，接收各终端设备发送的，经过同态加密后的样本向量，得到加密后的样本向量。

进一步地，当各终端设备计算得到样本向量后，各终端设备对所得的样本向量进行同态加密，得到经过同态加密后的样本向量。当各终端设备得到经过同态加密后的样本向量后，各终端设备将所得的经过同态加密后的样本向量发送给服务端。服务端接收各终端设备发送的，经过同态加密后的样本向量，得到加密后的样本向量。需要说明的是，在各终端设备和服务端之间传输的数据都是经过处理，服务端是无法得知各终端设备中的原始数据的。

步骤f，通过加密后的样本向量计算得到损失值，并加密所述损失值，得到加密后的损失值。

当服务端得到加密后的样本向量后，服务端通过加密后的样本向量计算得到损失值，然后并加密该损失值，得到加密后的损失值，将加密后的损失值发送给各终端设备。需要说明的是，在服务端中，预先存储加密所用的私钥，与该私钥对应的公钥已经预先发送给各终端设备了，因此各终端设备在接收到加密后的损失值后，通过预先存储的公钥即可解密得到损失值。

进一步地，所述通过加密后的样本向量计算得到损失值的步骤包括：

步骤f1，确定加密后的样本向量中，各训练样本对应锚定训练样本的锚定向量、正例训练样本的正例向量和负例训练样本的负例向量。

具体地，服务端确定加密后的样本向量中，各个训练样本对应锚定训练样本的锚定向量、正例训练样本的正例向量和负例训练样本的负例向量。需要说明的是，每一训练样本中的锚定训练样本存在对应的锚定向量，正例训练样本存在对应的正例向量，负例训练样本存在对应的负例向量，即每一样本向量对应一个锚定向量，一个负例向量和一个正例向量。

步骤f2，通过所述锚定向量和所述正例向量计算得到第一数值，以及通过所述锚定向量和所述负例向量计算得到第二数值。

步骤f3，根据所述第一数值、所述第二数值和预设的常数变量计算得到损失值。

服务端通过锚定向量和正例向量计算得到第一数值，以及通过锚定向量和负例向量计算得到第二数值，其中，第一数值为锚定向量和正例向量之间的距离，第二数值为锚定向量和负例向量之间的距离，在本实施例中，可通过余弦距离算法计算得到第一数值和第二数值。需要说明的是，在计算第一数值和第二数值过程中，可计算各个终端设备发送的样本向量的平均值，然后根据对应的平均值计算第一数值和第二数值，也可计算各个终端设备发送的样本向量之和，然后计算第一数值和第二数值。当服务端计算得到第一数值和第二数值后，服务端将第一数值减去第二数值，得到第一数值和第二数值之间的差值，然后计算该差值与预设的常数变量之间的和，得到第三数值，将第三数值与零比较，将其中的较大值确定为损失值。当第三数值大于零时，服务端确定第三数值为损失值；当第三数值小于零时，服务端确定零为损失值；当差值等于零时，服务端确定零为损失值。常数变量的大小可根据具体需要而设置，本实施例对常数变量的大小不做具体限制。

如将第一数值记为d(a，p)，第二数值记为d(a，n)，常数变量记为margin，损失值记为L，则计算损失值的公式可记为：

L＝max(d(a,p)-d(a,n)+margin,0)。

如若存在两个终端设备，终端设备A和终端设备B，终端设备A得到样本向量为

终端设备B得到样本向量为

[[·]]表示同态加密，则终端设备A所得的加密后的样本向量为

终端设备B所得的加密后的样本向量为

由此可知，各终端设备发送给服务端的样本向量是该终端设备中所有样本向量之和。

若将锚定向量记为

将正例向量记为

则计算锚定向量和正例向量之间距离的公式可表示为：

由此可知，服务端在

或者

过程中，需要与各终端设备进行通信。

进一步地，若确定第一数值和第二数值之间的差值的绝对值大于预设阈值，此时，该差值为负值，服务端则确定第一识别模型已经完成了模型的更新操作，即在第一数值远远小于第二数值时，服务端确定当前已完成来了模型的更新操作；当确定绝对值小于或者等于预设阈值时，服务端继续进行模型更新操作。其中，预设阈值的大小可根据具体需要而设置，本实施例对预设阈值的大小不做具体限制。

步骤g，将加密后的损失值发送给各终端设备，以供各终端设备解密所接收的加密后的损失值，得到解密后的损失值，并根据解密后的损失值计算第一梯度值，根据所述第一梯度值更新对应的第一识别模型。

当服务端得到加密后的损失值后，服务端将加密后的损失值发送给各终端设。当各终端设备接收到加密后的损失值后，各终端设备采用预先存储的公钥解密所接收的加密后的损失值，得到解密后的损失值，并根据解密后的损失值计算的第一梯度值，根据第一梯度值更新各自第一识别模型的模型参数，从而更新对应的第一识别模型。具体地，如将第一梯度值乘以梯度系数，得到第一梯度值和梯度系数之间的乘积，然后将更新前的模型参数减去该乘积，得到更新后的模型参数，将该更新后的模型参数作为第一识别模型的模型参数，从而更新第一识别模型。在根据解密后的损失值计算第一梯度值过程中，通过解密后的损失值和对应的损失函数进行求导，得到第一梯度值。

本实施例通过当接收到各终端设备发送的用户标识，且检测到各终端设备中存在相同的用户标识后，则根据用户标识进行样本对齐，得到对齐后的用户标识，并根据对齐后的用户标识构造训练样本，将训练样本发送给各终端设备，接收各终端设备发送的样本向量，根据样本向量计算得到损失值，并将损失值发送给各终端设备，以供各终端设备根据损失值更新对应的第一识别模型，从而实现在训练识别模型，即更新识别模型过程中，由服务端获取各终端设备的用户标识来构建训练样本，根据训练样本来更新识别模型，不需要得到各终端设备对应的本地训练数据，避免训练数据泄露的问题出现，且由于服务端在构建训练样本过程中，是根据各个终端设备的用户标识对应的样本向量来构建，从而提高了所更新的识别模型的识别准确率。

进一步地，提出本发明识别模型的更新方法第二实施例。所述识别模型的更新方法第二实施例与所述识别模型的更新方法第一实施例的区别在于，参照图2，所述识别模型的更新方法还包括：

步骤S50，若检测到各终端设备中待检测模型属于第二类型，则发送预设的第二识别模型给各用户标识对应的终端设备，以供各终端设备在接收到所述第二识别模型后，根据所述第二识别模型和本地训练数据得到第二梯度值，并加密所述第二梯度值。

当服务端检测到各终端设备中待检测模型属于第二类型时，此时，各终端设备中未存在相同的用户标识，服务端则获取预先存储的第二识别模型，将第二识别模型发送给各用户标识对应的终端设备。当各终端设备接收到第二识别模型后，各终端设备根据第二识别模型和本地训练数据得到第二梯度值。当各终端设备得到第二梯度值后，各终端设备加密第二梯度值，得到加密后的第二梯度值，并将加密后的第二梯度值发送给服务端。

步骤S60，接收各终端设备发送的加密后的第二梯度值，根据各加密后的第二梯度值更新第二识别模型的模型参数，得到更新后的模型参数。

步骤S70，将更新后的模型参数发送给各终端设备，以供各终端设备根据更新后的模型参数更新所接收的第二识别模型。

当服务端接收到各终端设备发送的加密后的第二梯度值后，服务端根据各加密后的第二梯度值更新第二识别模型的模型参数，得到更新后的模型参数。具体地，服务端可计算各终端设备发送的，加密后的第二梯度值的平均值，根据该平均值更新第二识别模型的模型参数，得到更新后的模型参数；服务端也可预先设置好各终端设备对应的权重，然后将各终端设备对应加密后的第二梯度值乘以对应的权重，得到对应的乘积，将所得的乘积相加，得到第二梯度值。当服务端得到更新后的模型参数后，将更新后的模型参数发送给各终端设备。当各终端设备接收到更新后的模型参数，各终端设备根据更新后的模型参数更新所接收的第二识别模型，即将更新后的模型参数作为各自第二识别模型的模型参数，从而得到新的第二识别模型。可以理解的是，此时待更新模型为第二识别模型。

进一步地，当服务端确定各终端设备中未存在相同的用户标识时，服务端确定所接收的用户标识的数量，根据用户标识的数量确定各个用户标识的分类编号，需要说明的是，一个用户标识对应一个分类编号。在本实施例中，不限制分类编号的表现形式，如分类编号可用数字和/或字母等形式表现。当确定各个用户标识的分类编号后，服务端把各个分类编号发送给用户标识对应的终端设备中。可以理解的是，各终端设备可根据分类编号确定其在服务端中所排列的顺序。

当识别模型未指纹识别模型，且在各终端设备中未存在相同的用户标识时，此时，一个用户的声纹为一个类别，不同用户的声纹数据属于不同的类别数据，因此，一个用户标识对应一个分类编号。

本实施例通过在各终端设备中未存在相同的用户标识时，通过整合各个终端设备的第二梯度值，得到更新后的模型参数，并将所更新后的模型参数返回给各终端设备，以供各终端设备根据更新后的模型参数更新识别模型，实现了在更新识别模型过程中，不需要获取各个终端设备的训练数据，只需要获取各个终端设备加密后的第二梯度值，保证了各终端设备中训练数据的安全性，避免了各终端设备中训练数据的泄露，且由于更新后的模型参数是由各终端设备的第二梯度值整合得到的，从而提高了更新所得识别模型的识别准确率。

需要说明的是，本发明实施例提供一种联邦学习框架下的适用识别模型的训练方法。当各终端设备中存在相同的用户标识时，采用第一实施例中的识别模型更新方法，即采用基于度量学习的训练方法来更新识别模型；当各终端设备中未存在相同的用户标识时，采用第二实施例中的识别模型更新方法，即采用基于分类的训练方法来更新识别模型，使本发明实施例中识别模型的更新方法具有普遍适用性。

进一步地，提出本发明识别模型的更新方法第三实施例。所述识别模型的更新方法第三实施例与所述识别模型的更新方法第一和/或第二实施例的区别在于，所述识别模型的更新方法还包括：

步骤h，生成公钥，并将所述公钥发送给各终端设备，以供各终端设备根据所述公钥加密用户标识，并发送加密后的用户标识。

服务端采用非对称加密算法生成公钥和私钥，并将所生成的公钥发送给各终端设备。当各终端设备接收到公钥后，各终端设备存储该公钥。当各终端设备需要发送用户标识给服务端时，各终端设备采用该公钥加密用户标识，得到加密后的用户标识，并将加密后的用户标识发送给服务端。本实施例不限制非对称加密算法的种类。

进一步地，若各终端设备不想让服务端知道其原始用户标识，则各终端设备可先加密其用户标识，然后再用服务端生成的公钥加密该加密后的用户标识，得到加密后的用户标识，即各终端设备对用户标识进行双重加密。如各终端设备先用MD5加密算法加密其用户标识，得到经过MD5加密后的用户标识，然后再采用服务端发送的公钥加密经过MD5加密后的用户标识，得到经过公钥加密后的用户标识，将经过公钥加密后的用户标识发送给服务端。当服务端接收到加密后的用户标识，采用私钥解密加密后的用户标识，所得的用户标识也只是各终端设备自己先加密过的用户标识。

本实施例的服务端通过生成公钥，将公钥发送给各终端设备，以便于各终端设备采用公钥加密所需要发送给服务端的用户标识，提高了服务端和各终端设备之间所传输数据的安全性。

此外，本发明还提供一种识别模型的更新方法，应用于终端设备，所述识别模型的更新方法包括以下步骤：

步骤i，将获取的用户标识发送给服务端，以供所述服务端在接收到用户标识，且确定各终端设备中待更新模型属于第一类型时，返回基于所述用户标识构造的训练样本；

步骤j，接收服务端发送的训练样本，并根据所述训练样本计算得到样本向量；

步骤k，将所述样本向量发送给所述服务端，以供所述服务端根据所述样本向量计算得到损失值；

步骤l，接收所述服务端发送的损失值，根据所述损失值更新预存的第一识别模型。

进一步地，所述步骤l包括：

步骤l1，接收所述服务端发送的加密后的损失值，并解密所述加密后的损失值，得到解密后的损失值；

步骤l2，根据解密后的损失值计算第一梯度值，根据所述第一梯度值更新预存的第一识别模型。

需要说明的是，步骤i，步骤j，步骤k，步骤l，步骤l1和步骤l2的具体实现过程已经上述实施例中详细阐述，本实施例不再重复赘述。

进一步地，第一识别模型为声纹识别模型，所述识别模型的更新方法还包括：

步骤n，当侦测到声纹识别的识别请求后，获取所述识别请求对应的声纹数据。

步骤m，将所述声纹数据输入至更新后的声纹识别模型中，以确定所述声纹数据对应的用户。

当终端设备侦测到声纹识别的识别请求，终端设备获取识别请求对应的声纹数据，其中，识别请求可为其中终端设备发送的，也可为终端设备对应用户在终端设备中触发，或者是终端设备中的定时任务定时触发的。该声纹数据是携带在识别请求中的，当终端设备侦测到识别请求后，获取识别请求中携带的声纹数据。

当终端设备获取到声纹数据后，终端设备将声纹数据输入至更新后的声纹识别模型中，以确定声纹数据对应的用户。需要说明的是，通过声纹识别模型的输出即可确定声纹数据对应的用户。在本实施例中，声纹识别模型的输出可为唯一表示用户的用户标识，或者为其他可以确定用户身份的信息。

本实施例通过更新后的声纹识别模型识别声纹数据，提高了通过声纹数据确定用户身份的准确率。

此外，本发明还提供一种识别模型的更新装置，应用于服务端，参照图3，所述识别模型的更新装置包括：

检测模块10，用于当接收到各终端设备发送的用户标识后，检测各终端设备中待更新模型的类型；

对齐模块20，用于若检测到各终端设备中待检测模型属于第一类型，则根据所述用户标识进行样本对齐，得到对齐后的用户标识；

构造模块30，用于根据对齐后的用户标识构造训练样本；

发送模块40，用于根据所述用户标识将所述训练样本发送给各终端设备，以供各终端设备根据所接收的训练样本计算得到样本向量；

接收模块50，用于接收各终端设备发送的样本向量；

计算模块60，用于根据所述样本向量计算得到损失值；

所述发送模块40还用于将所述损失值发送给各终端设备，以供各终端设备根据所述损失值更新对应的第一识别模型。

进一步地，所述构造模块30还用于根据对齐后的用户标识构造训练样本中的锚定训练样本、正例训练样本和负例训练样本，以得到训练样本，其中，同一训练样本中的锚定训练样本和正例训练样本对应的用户标识相同，同一训练样本中的负例训练样本对应用户标识与正例训练样本对应用户标识不相同。

进一步地，所述接收模块50还用于接收各终端设备发送的，经过同态加密后的样本向量，得到加密后的样本向量；

所述计算模块60还用于通过加密后的样本向量计算得到损失值；

所述识别模型的更新装置还包括：

加密模块，用于加密所述损失值，得到加密后的损失值；

所述发送模块40还用于将加密后的损失值发送给各终端设备，以供各终端设备解密所接收的加密后的损失值，得到解密后的损失值，并根据解密后的损失值计算第一梯度值，根据所述第一梯度值更新对应的第一识别模型。

进一步地，所述计算模块60包括：

第一确定单元，用于确定加密后的样本向量中，各训练样本对应锚定训练样本的锚定向量、正例训练样本的正例向量和负例训练样本的负例向量；

计算单元，用于通过所述锚定向量和所述正例向量计算得到第一数值，以及通过所述锚定向量和所述负例向量计算得到第二数值；根据所述第一数值、所述第二数值和预设的常数变量计算得到损失值。

进一步地，所述发送模块40包括：

第二确定单元，用于根据各用户标识对应的设备标识确定各用户标识对应的终端设备；

发送单元，用于将所述训练样本按照所述用户标识发送给各用户标识对应的终端设备，以供所述终端设备根据接收的训练样本得到样本向量。

进一步地，所述发送模块40还用于若检测到各终端设备中待检测模型属于第二类型，则发送预设的第二识别模型给各用户标识对应的终端设备，以供各终端设备在接收到所述第二识别模型后，根据所述第二识别模型和本地训练数据得到第二梯度值，并加密所述第二梯度值；

所述接收模块50还用于接收各终端设备发送的加密后的第二梯度值；

所述识别模型的更新装置还包括：

更新模块，用于根据加密后的第二梯度值更新第二识别模型的模型参数，得到更新后的模型参数；

所述发送模块40还用于将更新后的模型参数发送给各终端设备，以供各终端设备根据更新后的模型参数更新所接收的第二识别模型。

进一步地，所述识别模型的更新装置还包括：

生成模块，用于生成公钥；

所述发送模块40还用于将所述公钥发送给各终端设备，以供各终端设备根据所述公钥加密用户标识，并发送加密后的用户标识。

本发明识别模型的更新装置具体实施方式与上述识别模型的更新方法各实施例基本相同，在此不再赘述。

此外，本发明还提供一种识别模型的更新装置，应用于终端设备，所述识别模型的更新装置包括：

发送模块，用于将获取的用户标识发送给服务端，以供所述服务端在接收到用户标识，且确定各终端设备中待更新模型属于第一类型时，返回基于所述用户标识构造的训练样本；

接收模块，用于接收服务端发送的训练样本；

计算模块，用于根据所述训练样本计算得到样本向量；

所述发送模块还用于将所述样本向量发送给所述服务端，以供所述服务端根据所述样本向量计算得到损失值；

所述接收模块还用于接收所述服务端发送的损失值；

更新模块，用于根据所述损失值更新预存的第一识别模型。

进一步地，所述接收模块还用于接收所述服务端发送的加密后的损失值；

所述识别模型的更新装置还包括：

解密模块，用于解密所述加密后的损失值，得到解密后的损失值；

所述计算模块还用于根据解密后的损失值计算第一梯度值；

所述更新模块还用于根据所述第一梯度值更新预存的第一识别模型。

进一步地，所述识别模型的更新装置还包括：

获取模块，用于当侦测到声纹识别的识别请求后，获取所述识别请求对应的声纹数据；

输入模块，用于将所述声纹数据输入至更新后的声纹识别模型中，以确定所述声纹数据对应的用户。

此外，本发明还提供一种识别模型的更新设备。如图4所示，图4是本发明实施例方案涉及的硬件运行环境的结构示意图。

需要说明的是，图4即可为识别模型的更新设备的硬件运行环境的结构示意图。本发明实施例识别模型的更新设备可以是PC，便携计算机等终端设备。

如图4所示，该识别模型的更新设备可以包括：处理器1001，例如CPU，存储器1005，用户接口1003，网络接口1004，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图4中示出的识别模型的更新设备结构并不构成对识别模型的更新设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图4所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及识别模型的更新程序。其中，操作系统是管理和控制识别模型的更新设备硬件和软件资源的程序，支持识别模型的更新程序以及其它软件或程序的运行。

在图4所示的识别模型的更新设备中，用户接口1003主要用于连接其它终端，与其它终端进行数据通信，如从其他终端获取训练数据集；网络接口1004主要用于后台服务器，与后台服务器进行数据通信；处理器1001可以用于调用存储器1005中存储的识别模型的更新程序，并执行如上所述的识别模型的更新方法的步骤。

本发明识别模型的更新设备具体实施方式与上述识别模型的更新方法各实施例基本相同，在此不再赘述。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有识别模型的更新程序，所述识别模型的更新程序被处理器执行时实现如上所述的识别模型的更新方法的步骤。

本发明计算机可读存储介质具体实施方式与上述识别模型的更新方法各实施例基本相同，在此不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种识别模型的更新方法，其特征在于，所述识别模型的更新方法应用于终端设备，所述识别模型的更新方法包括以下步骤：

2.如权利要求1所述的识别模型的更新方法，其特征在于，所述第一识别模型为声纹识别模型，所述接收所述服务端发送的损失值，根据所述损失值更新预存的第一识别模型的步骤之后，还包括：

3.一种识别模型的更新方法，其特征在于，所述识别模型的更新方法应用于服务端，所述识别模型的更新方法包括以下步骤：

4.如权利要求3所述的识别模型的更新方法，其特征在于，所述根据对齐后的用户标识构造训练样本的步骤包括：

5.如权利要求3所述的识别模型的更新方法，其特征在于，所述接收各终端设备发送的样本向量，根据所述样本向量计算得到损失值，并将所述损失值发送给各终端设备，以供各终端设备根据所述损失值更新对应的第一识别模型的步骤包括：

6.如权利要求5所述的识别模型的更新方法，其特征在于，所述通过加密后的样本向量计算得到损失值的步骤包括：

7.如权利要求3所述的识别模型的更新方法，其特征在于，所述根据所述用户标识将所述训练样本发送给各终端设备，以供各终端设备根据所接收的训练样本计算得到样本向量的步骤包括：

8.如权利要求3所述的识别模型的更新方法，其特征在于，所述当接收到各终端设备发送的用户标识后，检测各终端设备中待更新模型的类型的步骤之后，还包括：

9.如权利要求3至8任一项所述的识别模型的更新方法，其特征在于，所述当接收到各终端设备发送的用户标识后，检测各终端设备中待更新模型的类型的步骤之前，还包括：

10.一种识别模型的更新装置，其特征在于，所述识别模型的更新方法应用于终端设备，所述识别模型的更新装置包括：

接收模块，用于接收服务端发送的训练样本；

计算模块，用于根据所述训练样本计算得到样本向量；

所述接收模块还用于接收所述服务端发送的损失值；

更新模块，用于根据所述损失值更新预存的第一识别模型。

11.一种识别模型的更新装置，其特征在于，所述识别模型的更新方法应用于服务端，所述识别模型的更新装置包括：

构造模块，用于根据对齐后的用户标识构造训练样本；

接收模块，用于接收各终端设备发送的样本向量；

计算模块，用于根据所述样本向量计算得到损失值；

12.一种识别模型的更新设备，其特征在于，所述识别模型的更新设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的识别模型的更新程序，所述识别模型的更新程序被所述处理器执行时实现如权利要求1至2，或者3至9任一项中所述的识别模型的更新方法的步骤。

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有识别模型的更新程序，所述识别模型的更新程序被处理器执行时实现如权利要求1至2，或者3至9任一项所述的识别模型的更新方法的步骤。