CN111783996B

CN111783996B - 一种数据处理方法、装置及设备

Info

Publication number: CN111783996B
Application number: CN202010562081.XA
Authority: CN
Inventors: 林晨; 彭博; 李哲暘; 谭文明; 任烨
Original assignee: Hangzhou Hikvision Digital Technology Co Ltd
Current assignee: Hangzhou Hikvision Digital Technology Co Ltd
Priority date: 2020-06-18
Filing date: 2020-06-18
Publication date: 2023-08-25
Anticipated expiration: 2040-06-18
Also published as: CN111783996A

Abstract

本申请提供一种数据处理方法、装置及设备，该方法包括：从服务器获取初始基线模型和样本数据对应的第一特征分布信息；获取初始噪声数据，将初始噪声数据输入给初始基线模型，得到初始噪声数据对应的第二特征分布信息；基于第一特征分布信息和第二特征分布信息对初始噪声数据进行训练，得到目标噪声数据；基于目标噪声数据和终端设备的场景数据对初始基线模型进行优化，得到优化后的目标基线模型；在所述终端设备部署所述目标基线模型，以通过所述目标基线模型对所述终端设备的应用数据进行处理。通过本申请的技术方案，目标噪声数据能够反映样本数据的特性，从而基于样本数据的特性对初始基线模型进行优化，解决样本数据缺失的问题。

Description

一种数据处理方法、装置及设备

技术领域

本申请涉及人工智能技术领域，尤其是一种数据处理方法、装置及设备。

背景技术

机器学习是实现人工智能的一种途径，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习用于研究计算机如何模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习更加注重算法设计，使计算机能够自动地从数据中学习规律，并利用规律对未知数据进行预测。

机器学习已经有了十分广泛的应用，如深度学习、数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用等。

为了采用机器学习实现人工智能处理，服务器需要获取大量样本数据，并基于这些样本数据训练出机器学习模型，并将该机器学习模型部署到终端设备(如摄像机等)，以使终端设备基于该机器学习模型实现人工智能处理。

由于数据隐私性，终端设备不会将自身所处环境的数据提供给服务器，服务器无法基于终端设备所处环境的数据训练机器学习模型，导致部署到终端设备的机器学习模型无法匹配终端设备所处环境，机器学习模型的性能较低。

发明内容

本申请提供一种数据处理方法，应用于终端设备，所述方法包括：

从服务器获取初始基线模型和样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的，所述第一特征分布信息是将所述样本数据输入给所述初始基线模型后得到的；获取初始噪声数据，将所述初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息；基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据；基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型；在所述终端设备部署所述目标基线模型，以通过所述目标基线模型对所述终端设备的应用数据进行处理。

本申请提供一种据处理方法，应用于服务器，所述方法包括：

将样本数据输入给初始基线模型，得到所述样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的；获取初始噪声数据，将所述初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息；基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据；将所述初始基线模型和所述目标噪声数据发送给终端设备，以使所述终端设备基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型。

本申请提供一种数据处理装置，应用于终端设备，所述装置包括：

获取模块，用于从服务器获取初始基线模型和样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的，所述第一特征分布信息是将所述样本数据输入给所述初始基线模型后得到的；数据训练模块，用于获取初始噪声数据，将初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息；基于第一特征分布信息和第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据；模型训练模块，用于基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型；部署模块，用于在所述终端设备部署所述目标基线模型，以通过所述目标基线模型对所述终端设备的应用数据进行处理。

本申请提供一种终端设备，包括：处理器和机器可读存储介质，所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令；

所述处理器用于执行机器可执行指令，以实现如下的步骤：

本申请提供一种数据处理装置，应用于服务器，所述装置包括：获取模块，用于将样本数据输入给初始基线模型，得到所述样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的；以及，获取初始噪声数据，将所述初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息；训练模块，用于基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据；发送模块，用于将所述初始基线模型和所述目标噪声数据发送给终端设备，以使所述终端设备基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型。

本申请提供一种服务器，包括：处理器和机器可读存储介质，所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令；所述处理器用于执行机器可执行指令，以实现如下的步骤：将样本数据输入给初始基线模型，得到所述样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的；获取初始噪声数据，将所述初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息；基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据；将所述初始基线模型和所述目标噪声数据发送给终端设备，以使所述终端设备基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型。

由以上技术方案可见，本申请实施例中，终端设备根据场景数据(即自身所处环境的数据)和目标噪声数据对初始基线模型进行优化，得到目标基线模型，由于场景数据反映终端设备所处环境，因此，目标基线模型能够匹配终端设备所处环境，提升目标基线模型的性能，目标基线模型的智能分析结果的准确度较高。由于目标噪声数据对应的特征分布信息能够反映样本数据对应的特征分布信息的特性，即目标噪声数据能够反映样本数据的特性，因此，基于样本数据(服务器使用样本数据训练得到初始基线模型)的特性对初始基线模型进行优化，解决样本数据缺失的问题，将样本数据的特征分布信息调制到目标噪声数据，使用目标噪声数据对初始基线模型进行优化。

附图说明

为了更加清楚地说明本申请实施例或者现有技术中的技术方案，下面将对本申请实施例或者现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据本申请实施例的这些附图获得其他的附图。

图1是本申请一种实施方式中的数据处理方法的流程图；

图2A-图2C是本申请一种实施方式中的基线模型的示意图；

图3是本申请另一种实施方式中的数据处理方法的流程图；

图4A是本申请一种实施方式中的数据处理装置的结构图；

图4B是本申请另一种实施方式中的数据处理装置的结构图；

图5A是本申请一种实施方式中的终端设备的结构图；

图5B是本申请一种实施方式中的服务器的结构图。

具体实施方式

在本申请实施例使用的术语仅仅是出于描述特定实施例的目的，而非限制本申请。本申请和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其它含义。还应当理解，本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请实施例可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，此外，所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

在介绍本申请的技术方案之前，先介绍与本申请实施例有关的概念。

机器学习：机器学习是实现人工智能的一种途径，用于研究计算机如何模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身性能。深度学习属于机器学习的子类，是一种使用数学模型对真实世界中的特定问题进行建模，以解决该领域内相似问题的过程。神经网络是深度学习的实现方式，为了方便描述，本文以神经网络为例，介绍神经网络的结构和功能，对于机器学习的其它子类，与神经网络的结构和功能类似。

神经网络：神经网络可以包括但不限于卷积神经网络(简称CNN)、循环神经网络(简称RNN)、全连接网络等，神经网络的结构单元可以包括但不限于卷积层(Conv)、池化层(Pool)、激励层、全连接层(FC)等，对此不做限制。

在实际应用中，可以根据不同需求，将一个或多个卷积层，一个或多个池化层，一个或多个激励层，以及一个或多个全连接层进行组合构建神经网络。

在卷积层中，通过使用卷积核对输入数据特征进行卷积运算，使输入数据特征增强，该卷积核可以是m*n大小的矩阵，卷积层的输入数据特征与卷积核进行卷积，可以得到卷积层的输出数据特征，卷积运算实际是一个滤波过程。

在池化层中，通过对输入数据特征(如卷积层的输出)进行取最大值、取最小值、取平均值等操作，从而利用局部相关性的原理，对输入数据特征进行子抽样，减少处理量，并保持特征不变性，池化层运算实际是一个降采样过程。

在激励层中，可以使用激活函数(如非线性函数)对输入数据特征进行映射，从而引入非线性因素，使得神经网络通过非线性的组合增强表达能力。

该激活函数可以包括但不限于ReLU(Rectified Linear Units，整流线性单元)函数，该ReLU函数用于将小于0的特征置0，而大于0的特征保持不变。

在全连接层中，用于将输入给本全连接层的所有数据特征进行全连接处理，从而得到一个特征向量，且该特征向量中可以包括多个数据特征。

神经网络(如卷积神经网络)的基线模型：在神经网络的训练过程中，可以利用样本数据训练神经网络内各神经网络参数，如卷积层参数(如卷积核参数)、池化层参数、激励层参数、全连接层参数等，对此不做限制。通过训练神经网络内各神经网络参数，可以使神经网络拟合出输入和输出的映射关系。

在神经网络训练完成后，已经完成训练的神经网络就是神经网络的基线模型，本文简称为基线模型。可以将基线模型部署到各终端设备，以使各终端设备基于该基线模型实现人工智能处理，如人脸检测、人体检测、车辆检测等。

例如，针对人脸检测来说，可以将包括人脸的图像输入给基线模型，基线模型对该图像进行人工智能处理，而人工智能处理结果就是人脸检测结果。

基线模型的增量学习：将部署到各终端设备的基线模型称为初始基线模型，初始基线模型是增量学习前的基线模型，也可以称为基础模型。在初始基线模型的基础上，可以采用增量学习方式对初始基线模型进行训练，将训练后的基线模型称为已训练基线模型，已训练基线模型是增量学习后的基线模型，也可以称为增量模型。通过增量学习，使得已训练基线模型可以从新样本中学习新知识，并保存初始基线模型中已经学习到的知识，提升已训练基线模型的性能。

基线模型的量化：将浮点数表示的模型参数，输入特征和输出特征，使用定点值近似表示，从而提高基线模型的运算速度，对基线模型进行压缩。

基线模型可以包括大量参数(例如，数百万的参数)，这些参数是浮点数类型，浮点数类型的参数会占用大量存储空间，浮点数类型的参数的运算会消耗大量计算资源，如果在不影响基线模型准确率的情况下，可以采用定点数类型的参数进行计算，则能够提高计算速度，节约计算资源，节省存储空间，由此引入量化技术，量化即通过减少表示每个权重所需的比特数来压缩基线模型，基于量化技术，能够将浮点数类型的参数转换为定点数类型的参数。

例如，针对基线模型的同一个网络层(如卷积层，池化层，激励层，全连接层等)来说，该网络层的参数值会分布在一个较小的区间内，比如区间[-10，30]，-10表示该网络层的参数值的最小值，30表示该网络层的参数值的最大值。基于此，在采用8位数量化(可以有其它选择)的情况下，可以将该网络层的所有参数都线性映射(也可以采用非线性映射以压缩空间)到区间[-10,30]。

通过对已训练基线模型进行基线模型的量化，可以得到目标基线模型。

样本数据和场景数据：在智能监控场景中，可以部署大量终端设备(如模拟摄像机、IPC(网络摄像机)等)，这些终端设备可以对自身所处环境进行监控，即采集自身所处环境的视频数据，将这些视频数据称为场景数据。

针对某些终端设备来说，例如，监控卧室环境的终端设备，监控工厂环境的终端设备等，由于数据隐私性，终端设备在采集到场景数据后，不会将场景数据提供给服务器。针对某些终端设备来说，例如，监控高速公路环境的终端设备等，终端设备在采集到场景数据后，可以将场景数据提供给服务器。

综上所述，服务器可以从部分终端设备获取场景数据，将服务器得到的场景数据称为样本数据，当然，服务器也可以采用其它方式获取样本数据，对此不做限制。服务器在得到样本数据后，可以利用样本数据训练神经网络。

示例性的，样本数据可以是图像数据，也可以是其它类型的数据，对此不做限制。场景数据可以是图像数据，也可以是其它类型的数据，对此不做限制。

由于某些终端设备(后续称为终端设备A)不会将场景数据提供给服务器，因此，服务器无法基于终端设备A的场景数据训练基线模型，在将基线模型部署到终端设备A后，该基线模型无法匹配终端设备A所处环境，性能较低。

针对上述发现，本申请实施例中，在服务器将基线模型部署到终端设备A后，终端设备A可以利用自身所处环境的场景数据对基线模型进行训练，得到新基线模型。由于是利用终端设备A所处环境的场景数据对基线模型进行训练，因此，新基线模型能够匹配终端设备所处环境，新基线模型的性能较好。

以下结合具体实施例，对本申请实施例的技术方案进行说明。

本申请实施例中提出一种数据处理方法，参见图1所示，为数据处理方法的流程示意图，该方法可以应用于终端设备(如模拟摄像机、IPC等，对此终端设备的类型不做限制，可以是需要部署基线模型的任意设备)，该方法包括：

步骤101，从服务器获取初始基线模型和样本数据对应的第一特征分布信息。

示例性的，该初始基线模型可以是服务器基于样本数据或该样本数据的同源数据训练得到的，该第一特征分布信息可以是将该样本数据输入给该初始基线模型(即采用该样本数据或该同源数据训练得到的初始基线模型)后得到的。

参见图2A所示，为初始基线模型的训练过程示意图，在一种可能的实施方式中，服务器可以获取样本数据，针对每个样本数据来说，该样本数据具有标签信息，如实际类别和/或目标框等，对此标签信息不做限制。例如，针对人脸检测的应用场景来说，样本数据可以是样本图像，目标框可以是样本图像中某个矩形框的坐标信息(如矩形框的左上角坐标，矩形框的宽度和高度等)，实际类别可以表示矩形框区域是人脸，或者，矩形框区域不是人脸。

服务器可以将样本数据及各样本数据对应的标签信息输入给神经网络，从而利用这些样本数据及标签信息对神经网络进行训练，对此训练过程不做限制。在神经网络训练完成后，已经完成训练的神经网络可以称为初始基线模型。

在另一种可能的实施方式中，服务器还可以获取样本数据的同源数据，针对每个同源数据来说，该同源数据具有标签信息，如实际类别和/或目标框等，对此标签信息不做限制。服务器可以将同源数据及各同源数据对应的标签信息输入给神经网络，从而利用这些同源数据及标签信息对神经网络进行训练。在神经网络训练完成后，已经完成训练的神经网络可以称为初始基线模型。

综上所述，服务器可以基于样本数据训练得到初始基线模型，服务器也可以基于该样本数据的同源数据训练得到初始基线模型，对此不做限制。

示例性的，服务器可以获取样本数据，并基于样本数据训练得到初始基线模型，并存储样本数据。由于已存储样本数据，因此，在后续过程中，服务器可以获取样本数据对应的第一特征分布信息，该过程参见后续实施例。

示例性的，服务器可以获取样本数据的同源数据，并基于同源数据训练得到初始基线模型，且服务器不需要存储该同源数据。由于未存储同源数据，因此，在后续过程中，服务器不是获取同源数据对应的第一特征分布信息，而是获取样本数据对应的第一特征分布信息。而且，样本数据和同源数据具有相同或者相似的特征分布信息，即，样本数据对应的第一特征分布信息与同源数据对应的特征分布信息相同或者类似，因此，在采用同源数据训练得到初始基线模型后，也可以利用初始基线模型确定样本数据对应的第一特征分布信息。

样本数据的同源数据是指：与样本数据的特征分布信息相同或者相似的数据，即同源数据的特征分布信息与样本数据的特征分布信息相同或者相似。

比如说，针对同一个终端设备在不同时刻采集的数据，可以作为样本数据和样本数据的同源数据，例如，终端设备在时刻A采集的数据作为样本数据时，可以将终端设备在时刻B采集的数据作为该样本数据的同源数据。

比如说，针对不同终端设备在相同时刻采集的数据，可以作为样本数据和样本数据的同源数据，例如，终端设备1在时刻A采集的数据作为样本数据时，可以将终端设备2在时刻A采集的数据作为该样本数据的同源数据。

又比如，将针对同一场景的数据作为样本数据和样本数据的同源数据，例如，将终端设备1采集的目标场景的数据作为样本数据时，可以将终端设备2采集的目标场景的数据作为该样本数据的同源数据。

当然，上述只是样本数据和同源数据的示例，对此不做限制。

示例性的，在得到初始基线模型后，服务器可以将样本数据输入给初始基线模型，得到与该样本数据对应的第一特征分布信息，该第一特征分布信息可以包括但不限于：第一特征值和/或第一统计值，该第一统计值可以包括但不限于以下至少一种：最值(如最大值和/或最小值等)，均值，方差等。

示例性的，在将样本数据输入给初始基线模型之前，还可以对样本数据进行预处理，对此预处理方式不做限制。然后，可以将预处理后的样本数据输入给初始基线模型，得到与该样本数据对应的第一特征分布信息。

参见图2B所示，以初始基线模型包括M个网络层为例进行说明，各网络层可以为卷积层，池化层，激励层，全连接层等。将样本数据输入给网络层1，由网络层1对数据进行处理，得到网络层1的输出数据，并将网络层1的输出数据输入给网络层2，由网络层2对数据进行处理，得到网络层2的输出数据，并将网络层2的输出数据输入给网络层3，以此类推，一直到将数据输入给网络层M，由网络层M对数据进行处理，得到网络层M的输出数据。

示例性的，M为大于或者等于1的正整数，对此M的取值不做限制。

第一统计值可以包括至少一个网络层的统计值，如网络层1的统计值和网络层2的统计值，或，网络层1的统计值和网络层3的统计值，或，网络层1的统计值和网络层M的统计值，或，所有网络层的统计值，对此不做限制。

网络层1的统计值是指：将多个数据输入给网络层1，网络层1对每个数据进行处理，得到网络层1的输出数据，即得到网络层1的多个输出数据，统计所述多个输出数据的最值，均值和方差等，统计出的最值，均值和方差是网络层1的统计值。针对其它网络层的统计值，与网络层1的统计值类似。

综上所述，可以预先设定第一统计值包括哪些网络层的统计值，如网络层1的统计值和网络层M的统计值，因此，可以获取网络层1的统计值和网络层M的统计值，并将网络层1的统计值和网络层M的统计值作为第一统计值。

第一特征值可以包括至少一个网络层的特征值，如网络层1的特征值和网络层2的特征值，或，网络层1的特征值和网络层3的特征值，或，网络层1的特征值和网络层M的特征值，或，所有网络层的特征值，对此不做限制。

网络层1的特征值是指：将多个数据输入给网络层1，网络层1对每个数据进行处理，得到网络层1的输出数据，即得到网络层1的多个输出数据，每个输出数据可以是一个特征向量，将网络层1的多个特征向量(即输出数据)作为网络层1的特征值。针对其它网络层的特征值，与网络层1的特征值类似。

综上所述，可以预先设定第一特征值包括哪些网络层的特征值，如网络层1的特征值和网络层M的特征值，因此，可以获取网络层1的特征值(如网络层1的多个特征向量)和网络层M的特征值(如网络层M的多个特征向量)，并将网络层1的特征值和网络层M的特征值作为第一特征值。

综上所述，通过将样本数据输入给初始基线模型，就可以得到第一特征值和第一统计值，而第一特征值和第一统计值是与样本数据对应的第一特征分布信息。当然，第一特征值和第一统计值只是第一特征分布信息的两个示例，对此第一特征分布信息不做限制，可以是任意类型的特征信息。

服务器得到初始基线模型和第一特征分布信息后，将初始基线模型和第一特征分布信息发给终端设备，终端设备获得初始基线模型和第一特征分布信息。

步骤102，获取初始噪声数据，并将该初始噪声数据输入给该初始基线模型，得到该初始噪声数据对应的第二特征分布信息。基于该第一特征分布信息和该第二特征分布信息对该初始噪声数据进行训练，得到目标噪声数据。

在一种可能的实施方式中，可以采用如下步骤得到目标噪声数据，当然，如下步骤只是一个示例，对此不做限制，只要能够基于第一特征分布信息和第二特征分布信息对初始噪声数据进行训练，得到目标噪声数据即可。

步骤1021，终端设备获取初始噪声数据。

示例性的，以样本数据是样本图像，初始噪声数据是初始噪声图像为例进行说明，初始噪声图像的尺寸与样本图像的尺寸相同，且初始噪声图像的尺寸基于初始基线模型规定的输入尺寸确定。假设初始噪声图像的尺寸为a*b，则终端设备随机生成a*b个数值，对此生成方式不做限制，每个数值的数据类型为float(浮点型数据类型)，将这a*b个数值组成一个初始噪声图像。

由于像素值的取值范围是[0，255]，因此，需要对初始噪声图像中的a*b个数值进行[0，255]范围的截断操作，比如说，若初始噪声图像中的某个数值小于0，则将该数值调整为0，若初始噪声图像中的某个数值大于255，则将该数值调整为255。至此，可以得到一个初始噪声图像，即初始噪声数据。

示例性的，终端设备可以采用上述方式得到多个初始噪声数据。

步骤1022，终端设备将初始噪声数据输入给初始基线模型(固定初始基线模型的参数不变)，得到该初始噪声数据对应的第二特征分布信息。

示例性的，终端设备得到初始基线模型后，固定初始基线模型的参数不变，即初始噪声数据的训练过程中，不调整初始基线模型的参数。基于此，终端设备将初始噪声数据输入给初始基线模型，得到该初始噪声数据对应的第二特征分布信息，该第二特征分布信息可以包括但不限于：第二特征值和/或第二统计值，该第二统计值可以包括但不限于以下至少一种：最值，均值，方差等。

示例性的，在将初始噪声数据输入给初始基线模型之前，还可以对初始噪声数据进行预处理，对此预处理方式不做限制。然后，将预处理后的初始噪声数据输入给初始基线模型，得到与该初始噪声数据对应的第二特征分布信息。

参见图2B所示，以初始基线模型包括M个网络层为例，第二统计值包括至少一个网络层的统计值，可以预先设定第二统计值包括哪些网络层的特征值，第二统计值对应的网络层与第一统计值对应的网络层相同。例如，若第一统计值包括网络层1的统计值和网络层2的统计值，则第二统计值包括网络层1的统计值和网络层2的统计值。第二统计值的获取方式与第一统计值的获取方式类似，只是初始基线模型的输入数据为初始噪声数据，在此不再赘述。

第二特征值包括至少一个网络层的特征值，预先设定第二特征值包括哪些网络层的特征值，第二特征值对应的网络层与第一特征值对应的网络层相同。例如，若第一特征值包括网络层1的特征值，则第二特征值包括网络层1的特征值。第二特征值的获取方式与第一特征值的获取方式类似，在此不再赘述。

综上所述，通过将初始噪声数据输入给初始基线模型，就可以得到第二特征值和第二统计值，而第二特征值和第二统计值是与初始噪声数据对应的第二特征分布信息。当然，第二特征值和第二统计值只是第二特征分布信息的两个示例，对此第二特征分布信息不做限制，可以是任意类型的特征信息。

步骤1023，终端设备基于第一特征分布信息和第二特征分布信息，确定预配置的损失函数的目标损失值，该损失函数可以是基于经验配置的。

以下结合几个具体实施方式，对目标损失值的确定过程进行说明。

方式1、损失函数是与特征损失值有关的损失函数。若第一特征分布信息包括第一特征值，第二特征分布信息包括第二特征值，则基于第一特征值和第二特征值确定特征损失值，并根据该特征损失值确定损失函数的目标损失值。

例如，若第一特征值包括网络层1的特征值a1和网络层2的特征值a2，第二特征值包括网络层1的特征值b1和网络层2的特征值b2，则计算特征值a1与特征值b1的差值1，并计算特征值a2与特征值b2的差值2，然后，基于差值1和差值2确定特征损失值，并将该特征损失值作为目标损失值。

示例性的，由于特征值包括大量像素点的特征值，因此，计算特征值a1的第一个像素点与特征值b1的第一个像素点的差值，计算特征值a1的第二个像素点与特征值b1的第二个像素点的差值，以此类推，计算特征值a1的最后一个像素点与特征值b1的最后一个像素点的差值，将上述差值的和作为差值1。

差值2的确定方式与差值1的确定方式类似，在此不再重复赘述。

比如说，损失函数可以为：Loss＝Loss_similarity，Loss表示损失函数的目标损失值，Loss_similarity表示特征损失值，特征损失值的确定方式参见公式(1)：

在上述公式(1)中，C表示特征通道数，H表示特征值的高度，W表示特征值的宽度，i表示第i个网络层，表示第一特征值中第i个网络层的特征值，/>表示第二特征值中第i个网络层的特征值。

当然，上述公式(1)只是确定特征损失值的示例，对此不做限制。

方式2、损失函数是与统计损失值有关的损失函数。若第一特征分布信息包括第一统计值，第二特征分布信息包括第二统计值，则基于第一统计值和第二统计值确定统计损失值，并根据该统计损失值确定损失函数的目标损失值。

例如，若第一统计值包括网络层1的统计值c1和网络层2的统计值c2，第二统计值包括网络层1的统计值d1和网络层2的统计值d2，则计算统计值c1与统计值d1的差值1，并计算统计值c2与统计值d2的差值2，然后，基于差值1和差值2确定统计损失值，并将该统计损失值作为目标损失值。

比如说，损失函数可以为：Loss＝Loss_statistic，Loss表示损失函数的目标损失值，Loss_statistic表示统计损失值，统计损失值的确定方式参见公式(2)：

在上述公式(2)中，C表示特征通道数，i表示第i个网络层，表示第一特征值中第i个网络层的方差，/>表示第二特征值中第i个网络层的方差，表示第一特征值中第i个网络层的均值，/>表示第二特征值中第i个网络层的均值，/>表示第一特征值中第i个网络层的最大值(在实际应用中，最大值还可以替换为最小值)，/>表示第二特征值中第i个网络层的最大值(最大值还可以替换为最小值)。

当然，上述公式(2)只是确定统计损失值的示例，对此不做限制。比如说，在公式(2)中，可以只具有方差和均值，或者，只具有方差和最大值，或者，只具有均值和最大值，或者，只具有方差，或者，只具有均值等等。

方式3、损失函数是与特征损失值和统计损失值有关的损失函数。若第一特征分布信息包括第一特征值和第一统计值，第二特征分布信息包括第二特征值和第二统计值，则基于第一特征值和第二特征值确定特征损失值，基于第一统计值和第二统计值确定统计损失值。然后，根据该特征损失值和该统计损失值确定损失函数的目标损失值。示例性的，特征损失值的确定方式参见方式1，统计损失值的确定方式参见方式2，在此不再赘述。在得到特征损失值和统计损失值后，可以将该特征损失值与该统计损失值的和，确定为目标损失值。

比如说，损失函数为：Loss＝Loss_similarity+Loss_statistic，Loss_similarity的确定方式参见公式(1)所示，Loss_statistic的确定方式参见公式(2)所示。

方式4、损失函数是与特征损失值和范围损失值有关的损失函数。基于第一特征值和第二特征值确定特征损失值，并基于初始噪声数据中的最大噪声值和初始噪声数据中的最小噪声值，确定范围损失值。然后，根据该特征损失值和该范围损失值确定损失函数的目标损失值。例如，在得到特征损失值和范围损失值后，可以将该特征损失值与该范围损失值的和，确定为目标损失值。

示例性的，参见步骤1021，初始噪声数据中可以包括a*b个数值，从初始噪声数据的所有数值中选取出最大噪声值(即最大值)和最小噪声值(即最小值)，由于像素值的取值范围是[第一数值，第二数值]，因此，基于最大噪声值与第一数值(如255)的差，及最小噪声值与第二数值的差确定范围损失值。比如说，若最大噪声值大于255，且最大噪声值与255的差越大，则范围损失值越大。若最小噪声值小于0，且0与最小噪声值的差越大，则范围损失值越大。

损失函数可以为：Loss＝Loss_similarity+Loss_range，Loss_similarity的确定方式参见公式(1)，Loss_range表示范围损失值，其确定方式可以参见公式(3)：

Loss_range＝max(max(data)-255，0)⁴+min(min(data)，0)⁴ (3)

在上述公式(3)中，data表示初始噪声数据，max(data)表示初始噪声数据中的最大噪声值，min(data)表示初始噪声数据中的最小噪声值。

当然，上述公式(3)只是确定范围损失值的示例，对此不做限制。

方式5、损失函数是与统计损失值和范围损失值有关的损失函数。基于第一统计值和第二统计值确定统计损失值，并基于初始噪声数据中的最大噪声值和初始噪声数据中的最小噪声值，确定范围损失值。然后，根据该统计损失值和该范围损失值确定损失函数的目标损失值。例如，在得到统计损失值和范围损失值后，可以将该统计损失值与该范围损失值的和，确定为目标损失值。

比如说，损失函数为：Loss＝Loss_statistic+Loss_range，Loss_statistic的确定方式参见公式(2)所示，Loss_range的确定方式参见公式(3)所示。

方式6、损失函数可以是与特征损失值，统计损失值和范围损失值有关的损失函数。基于第一特征值和第二特征值确定特征损失值，基于第一统计值和第二统计值确定统计损失值，并基于初始噪声数据中的最大噪声值和初始噪声数据中的最小噪声值，确定范围损失值。然后，可以根据该特征损失值，该统计损失值和该范围损失值确定损失函数的目标损失值。比如说，可以将该特征损失值，该统计损失值与该范围损失值的和，确定为目标损失值。

比如说，损失函数可以为：Loss＝Loss_similarity+Loss_statistic+Loss_range，示例性的，Loss_similarity的确定方式参见公式(1)所示，Loss_statistic的确定方式参见公式(2)所示，Loss_range的确定方式参见公式(3)所示。

当然，方式1-方式6只是示例，对目标损失值的确定方式不做限制，可根据经验配置损失函数与哪些损失值有关，基于这些损失值确定目标损失值即可。

在上述实施例中，由于场景数据通常为图像数据，图像数据的数值为整数，且范围为[0，255]，因此，为了使噪声数据与场景数据的形式一致，可以对噪声数据的范围进行约束，即将噪声数据的范围约束到图像数据的取值范围[0，255]内，为此，本实施例中，可以使用上述范围损失值来约束数据范围。

在上述实施例中，初始基线模型可以包括参数固定的网络层以及参数变化的网络层，参数固定的网络层(后续记为网络层A)是指，在增量学习过程中，不需要对该网络层A的参数进行调整，参数变化的网络层(后续记为网络层B)是指，在增量学习过程中，需要对该网络层的参数进行调整。基于此，上述第一特征值和第二特征值可以是参数固定的网络层A的特征值。由于网络层A的参数不进行调整，初始基线模型的网络层A和目标基线模型的网络层A相同，某一数据在初始基线模型的网络层A的输出结果与该数据在目标基线模型的网络层A的输出结果也应该相同，因此，通过使用特征损失值对噪声数据的第二特征值和样本数据的第一特征值进行约束，使得噪声数据的第二特征值和样本数据的第一特征值相近或者相同，可以减少噪声数据与样本数据的差异。若初始基线模型不包括参数固定的网络层，也可以取消特征损失值的约束。

在上述实施例中，构造统计损失值的目的是，将样本数据的统计信息调制到噪声数据，且这个噪声数据可以预测样本数据在目标基线模型上的分布。比如说，假设定义一个基础函数为f(x)＝3x+4，对f(x)进行调优，若只改变模型参数值，不改变函数形式，则可以得到一个增量函数为g(x)＝4x+3，已知f(x)∈[3，4]，则可以推测增量函数基于同样的原理，如果已知目标噪声数据的分布情况(即样本数据的分布情况，对初始噪声数据的训练过程，就是使初始噪声数据的分布情况与样本数据的分布情况不断接近的过程，在得到目标噪声数据时，目标噪声数据的分布情况与样本数据的分布情况相似)，可以反推样本数据在目标基线模型的分布，将目标噪声数据的分布情况输入目标基线模型，就可以预测数据在目标基线模型中的范围。

步骤1024，终端设备基于目标损失值确定损失函数是否已收敛。

若是，则可以执行步骤1025；若否，则可以执行步骤1026。

例如，若目标损失值小于预设阈值，则确定损失函数已收敛，若目标损失值不小于预设阈值，则确定损失函数未收敛。当然，上述方式只是示例，对此不做限制，只要能够基于目标损失值确定损失函数是否已收敛即可。

预设阈值可以根据经验进行配置，如大于0的数值，对此不做限制。

步骤1025，终端设备将当前的初始噪声数据确定为目标噪声数据，至此，完成初始噪声数据的训练过程，得到目标噪声数据。

步骤1026，终端设备对当前的初始噪声数据进行调整，得到调整后的初始噪声数据。基于调整后的初始噪声数据，返回执行步骤1022。

示例性的，参见图2C所示，可以基于损失函数的目标损失值，按照反向传播算法，对初始噪声数据进行调整，得到调整后的初始噪声数据。比如说，终端设备可以采用ADAM(自适应矩估计)优化算法对初始噪声数据进行调整，也可以采用其它算法对初始噪声数据进行调整，对此调整方式不做限制。

综上所述，通过对初始噪声数据进行训练，就可以得到目标噪声数据，目标噪声数据对应的第二特征分布信息与样本数据的第一特征分布信息相似，从而将样本数据的统计信息调制到目标噪声数据中，目标噪声数据包含了量化需要的样本数据的统计信息。由于初始噪声数据是随机生成，且通过对初始噪声数据进行训练获得目标噪声数据，因此，目标噪声数据已经过滤样本数据的具体信息，不能从目标噪声数据中读出样本数据的语义，有效保护了样本数据的信息安全，且不需要将样本数据发送给终端设备，节省了终端设备的存储资源。

步骤103，基于目标噪声数据和终端设备的场景数据对初始基线模型进行优化，得到优化后的目标基线模型(将优化后的初始基线模型称为目标基线模型)。

在一种可能的实施方式中，可以采用如下步骤对初始基线模型进行优化：

步骤1031、基于终端设备的场景数据对初始基线模型内的各网络参数进行参数值训练，得到已训练基线模型。或者，基于终端设备的场景数据和目标噪声数据对初始基线模型内的各网络参数进行参数值训练，得到已训练基线模型。

为了方便描述，后续以基于场景数据对初始基线模型内的各网络参数进行参数值训练为例，当然，在实际应用中，除了场景数据和目标噪声数据，还可以使用其它类型的数据对初始基线模型内的各网络参数进行参数值训练。

示例性的，终端设备得到场景数据后，将场景数据输入给初始基线模型，以使初始基线模型对该场景数据进行处理，对此处理过程不做限制，得到与该场景数据对应的数据特征。基于该数据特征确定该初始基线模型是否已收敛，若初始基线模型已收敛，则将当前的初始基线模型确定为已训练基线模型。若初始基线模型未收敛，则对当前的初始基线模型内的各网络参数(如神经网络参数)进行参数值调整，对此调整过程不做限制，得到调整后的初始基线模型。

然后，将场景数据输入给调整后的初始基线模型，以通过调整后的初始基线模型对该场景数据进行处理，得到与该场景数据对应的数据特征，基于该数据特征确定初始基线模型是否已收敛，以此类推，一直到初始基线模型已收敛，将当前的初始基线模型确定为已训练基线模型，即得到已训练基线模型。

综上所述，可以基于场景数据完成初始基线模型的训练过程。

步骤1032、基于目标噪声数据和终端设备的场景数据对已训练基线模型内的各网络参数进行参数值量化，得到目标基线模型。或者，基于目标噪声数据对已训练基线模型内的各网络参数进行参数值量化，得到目标基线模型。

为了方便描述，后续以基于目标噪声数据和场景数据对已训练基线模型内的各网络参数进行参数值量化为例，当然，在实际应用中，除了场景数据和目标噪声数据，还可以使用其它类型的数据对各网络参数进行参数值量化。

示例性的，在对已训练基线模型进行量化处理时，可以将目标噪声数据和场景数据输入给已训练基线模型，以预测已训练基线模型的每一网络层的数据分布范围，基于该分布范围对已训练基线模型的各网络参数进行参数值量化。

示例性的，为了保护数据安全和节省数据存储资源，终端设备不会从服务器获取样本数据，为了解决样本数据缺失的问题，本实施例中，基于样本数据的特征分布信息对初始噪声数据进行训练，得到目标噪声数据，从而将样本数据中量化所需要的分布信息调制到目标噪声数据中。在使用目标噪声数据对已训练基线模型内的各网络参数进行参数值量化时，能够推测样本数据在已训练基线模型内分布范围，继而准确的对各网络参数进行参数值量化。

示例性的，在得到已训练基线模型后，终端设备可以将目标噪声数据(多个目标噪声数据)和场景数据(多个场景数据)输入给已训练基线模型，以已训练基线模型包括M个网络层为例，将目标噪声数据和场景数据输入给网络层1，由网络层1对数据进行处理，得到网络层1的输出数据，并将网络层1的输出数据输入给网络层2，由网络层2对数据进行处理，得到网络层2的输出数据，并将网络层2的输出数据输入给网络层3，以此类推，一直到将数据输入给网络层M，由网络层M对数据进行处理，得到网络层M的输出数据。

针对已训练基线模型的每个网络层(以网络层1为例)来说，网络层1可以对多个输入数据进行处理，得到多个输出数据。基于多个输入数据和多个输出数据，网络层1确定数据分布范围，基于该分布范围对网络层1的参数值进行量化，对此量化过程不做限制。比如说，确定分布范围是区间[-10，30]，则将网络层1的所有参数都线性映射(也可以采用非线性映射以压缩空间)到区间[-10,30]。当然，上述只是量化方式的示例，对此量化方式不做限制。

在对已训练基线模型的每个网络层的网络参数进行参数值量化后，可以得到目标基线模型，该目标基线模式就是已完成优化的基线模式。

步骤104，在终端设备部署目标基线模型，以通过目标基线模型对终端设备的应用数据进行处理，即通过目标基线模型对应用数据进行人工智能处理。

示例性的，可以在终端设备部署目标基线模型，以通过目标基线模型对应用数据进行处理。在部署目标基线模型后，还可以将目标基线模型作为初始基线模型，返回执行对初始基线模型进行增量训练的过程，参见步骤102-步骤104。

针对待处理的应用数据，可以将应用数据输入给目标基线模型，通过目标基线模型对应用数据进行处理，得到处理结果(如人工智能处理结果)。比如说，假设目标基线模型用于实现目标检测(如人脸检测、人体检测、车辆检测等)，则将应用数据提供给目标基线模型，由目标基线模型确定目标检测结果。

本申请实施例中提出一种数据处理方法，参见图3所示，为该方法的流程示意图，该方法可以应用于服务器(也可以称为模型提供设备)，该方法包括：

步骤301，将样本数据输入给初始基线模型，得到该样本数据对应的第一特征分布信息。示例性的，初始基线模型是基于该样本数据或该样本数据的同源数据训练得到的。该第一特征分布信息可以包括但不限于：第一特征值和/或第一统计值，该第一统计值可以包括但不限于以下至少一种：最值(如最大值和/或最小值等)，均值，方差等。

示例性的，步骤301的过程可以参见步骤101，在此不再赘述。

步骤302，获取初始噪声数据，并将该初始噪声数据输入给该初始基线模型，得到该初始噪声数据对应的第二特征分布信息。基于该第一特征分布信息和该第二特征分布信息对该初始噪声数据进行训练，得到目标噪声数据。

在一种可能的实施方式中，服务器可以基于该第一特征分布信息和该第二特征分布信息，确定预配置的损失函数的目标损失值，并基于该目标损失值确定该损失函数是否已收敛。若是，则服务器将当前的初始噪声数据确定为目标噪声数据；若否，则服务器对当前的初始噪声数据进行调整，得到调整后的初始噪声数据；基于调整后的初始噪声数据，返回执行将该初始噪声数据输入给该初始基线模型，得到该初始噪声数据对应的第二特征分布信息的操作。

示例性的，步骤302的过程可以参见步骤102，只是执行主体为服务器，而不是终端设备，即，由服务器得到目标噪声数据，在此不再重复赘述。

步骤303，将初始基线模型和目标噪声数据发送给终端设备，以使终端设备基于目标噪声数据和终端设备的场景数据对初始基线模型进行优化，得到优化后的目标基线模型(将优化后的初始基线模型称为目标基线模型)。

示例性的，服务器在得到目标噪声数据后，可以将初始基线模型和目标噪声数据一起发送给终端设备，即，终端设备可以直接从服务器获取到目标噪声数据。在得到目标噪声数据后，终端设备就可以基于目标噪声数据和场景数据对初始基线模型进行优化，具体优化过程可以参见步骤103，在此不再重复赘述。

基于与上述方法同样的申请构思，本申请实施例中还提出一种数据处理装置，应用于终端设备，如图4A所示，为所述装置的结构图，所述装置包括：

获取模块411，用于从服务器获取初始基线模型和样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的，所述第一特征分布信息是将所述样本数据输入给所述初始基线模型后得到的；数据训练模块412，用于获取初始噪声数据，将初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息；基于第一特征分布信息和第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据；模型训练模块413，用于基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型；部署模块414，用于在所述终端设备部署所述目标基线模型，以通过所述目标基线模型对所述终端设备的应用数据进行处理。

所述数据训练模块412，用于在基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据时，

基于所述第一特征分布信息和所述第二特征分布信息，确定预配置的损失函数的目标损失值，并基于所述目标损失值确定所述损失函数是否已收敛；

若是，则将当前的初始噪声数据确定为所述目标噪声数据；

若否，则对当前的初始噪声数据进行调整，得到调整后的初始噪声数据；

基于调整后的初始噪声数据，返回执行将所述初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息的操作。

所述数据训练模块412，用于在基于所述第一特征分布信息和所述第二特征分布信息，确定预配置的损失函数的目标损失值时，若所述第一特征分布信息包括第一特征值，所述第二特征分布信息包括第二特征值，则基于所述第一特征值和所述第二特征值确定特征损失值，并根据所述特征损失值确定所述目标损失值；或者，若所述第一特征分布信息包括第一统计值，所述第二特征分布信息包括第二统计值，则基于所述第一统计值和所述第二统计值确定统计损失值，并根据所述统计损失值确定所述目标损失值；或者，

若所述第一特征分布信息包括第一特征值和第一统计值，所述第二特征分布信息包括第二特征值和第二统计值，基于所述第一特征值和所述第二特征值确定特征损失值，基于所述第一统计值和所述第二统计值确定统计损失值，并根据所述特征损失值和所述统计损失值确定所述目标损失值。

模型训练模块413具体用于：基于所述终端设备的场景数据对所述初始基线模型内的各网络参数进行参数值训练，得到已训练基线模型；

基于所述目标噪声数据和所述终端设备的场景数据对所述已训练基线模型内的各网络参数进行参数值量化，得到所述目标基线模型。

基于与上述方法同样的申请构思，本申请实施例中还提出一种数据处理装置，应用于服务器，如图4B所示，为所述装置的结构图，所述装置包括：

获取模块421，用于将样本数据输入给初始基线模型，得到所述样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的；以及，获取初始噪声数据，将所述初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息；训练模块422，用于基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据；发送模块423，用于将所述初始基线模型和所述目标噪声数据发送给终端设备，以使所述终端设备基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型。

所述训练模块422，用于在基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据时，

若是，则将当前的初始噪声数据确定为所述目标噪声数据；

基于与上述方法同样的申请构思，本申请实施例中还提出一种终端设备，本申请实施例提供的终端设备，从硬件层面而言，终端设备的硬件架构示意图可以参见图5A所示。终端设备可以包括：处理器511和机器可读存储介质512，所述机器可读存储介质512存储有能够被所述处理器511执行的机器可执行指令；所述处理器511用于执行机器可执行指令，以实现本申请上述示例公开的方法。例如，处理器511用于执行机器可执行指令，以实现如下步骤：

从服务器获取初始基线模型和样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的，所述第一特征分布信息是将所述样本数据输入给所述初始基线模型后得到的；

获取初始噪声数据，将所述初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息；基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据；

基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型；在所述终端设备部署所述目标基线模型，以通过所述目标基线模型对所述终端设备的应用数据进行处理。

基于与上述方法同样的申请构思，本申请实施例中还提出一种服务器，本申请实施例提供的服务器，从硬件层面而言，服务器的硬件架构示意图可以参见图5B所示。服务器可以包括：处理器521和机器可读存储介质522，所述机器可读存储介质522存储有能够被所述处理器521执行的机器可执行指令；所述处理器521用于执行机器可执行指令，以实现本申请上述示例公开的方法。例如，处理器521用于执行机器可执行指令，以实现如下步骤：

基于与上述方法同样的申请构思，本申请实施例还提供一种机器可读存储介质，其中，所述机器可读存储介质上存储有若干计算机指令，所述计算机指令被处理器执行时，能够实现本申请上述示例公开的方法。

示例性的，上述机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置，可以包含或存储信息，如可执行指令、数据，等等。例如，机器可读存储介质可以是：RAM(Radom Access Memory，随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等)，或者类似的存储介质，或者它们的组合。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

而且，这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上，使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种数据处理方法，其特征在于，应用于终端设备，所述方法包括：

从服务器获取初始基线模型和样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的，所述第一特征分布信息是将所述样本数据输入给所述初始基线模型后得到的；其中，所述样本数据是终端设备采集到且提供给服务器的数据；

基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型；

在所述终端设备部署所述目标基线模型，以通过所述目标基线模型对所述终端设备的应用数据进行处理；

其中，所述基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据，包括：

若是，则将当前的初始噪声数据确定为所述目标噪声数据；

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一特征分布信息和所述第二特征分布信息，确定预配置的损失函数的目标损失值，包括：

若所述第一特征分布信息包括第一特征值，所述第二特征分布信息包括第二特征值，则基于所述第一特征值和所述第二特征值确定特征损失值，并根据所述特征损失值确定所述目标损失值；或者，

若所述第一特征分布信息包括第一统计值，所述第二特征分布信息包括第二统计值，则基于所述第一统计值和所述第二统计值确定统计损失值，并根据所述统计损失值确定所述目标损失值；或者，

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：基于所述初始噪声数据中的最大噪声值和最小噪声值，确定范围损失值；

所述根据所述特征损失值确定所述目标损失值，包括：

根据所述特征损失值和所述范围损失值确定所述目标损失值；

所述根据所述统计损失值确定所述目标损失值，包括：

根据所述统计损失值和所述范围损失值确定所述目标损失值；

所述根据所述特征损失值和所述统计损失值确定所述目标损失值，包括：

根据所述特征损失值，所述统计损失值和所述范围损失值确定目标损失值。

4.根据权利要求1所述的方法，其特征在于，

所述基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型，包括：

基于所述终端设备的场景数据对所述初始基线模型内的各网络参数进行参数值训练，得到已训练基线模型；

5.一种数据处理方法，其特征在于，应用于服务器，所述方法包括：

将样本数据输入给初始基线模型，得到所述样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的；所述样本数据是终端设备采集到且提供给服务器的数据；

将所述初始基线模型和所述目标噪声数据发送给终端设备，以使所述终端设备基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型；

若是，则将当前的初始噪声数据确定为所述目标噪声数据；

6.根据权利要求5所述的方法，其特征在于，所述基于所述第一特征分布信息和所述第二特征分布信息，确定预配置的损失函数的目标损失值，包括：

7.一种数据处理装置，其特征在于，应用于终端设备，所述装置包括：

获取模块，用于从服务器获取初始基线模型和样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的，所述第一特征分布信息是将所述样本数据输入给所述初始基线模型后得到的；所述样本数据是终端设备采集到且提供给服务器的数据；

数据训练模块，用于获取初始噪声数据，将初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息；基于第一特征分布信息和第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据；

模型训练模块，用于基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型；

部署模块，用于在所述终端设备部署所述目标基线模型，以通过所述目标基线模型对所述终端设备的应用数据进行处理；

其中，所述数据训练模块基于第一特征分布信息和第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据时具体用于：

若是，则将当前的初始噪声数据确定为所述目标噪声数据；

8.一种终端设备，其特征在于，包括：处理器和机器可读存储介质，所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令；

所述处理器用于执行机器可执行指令，以实现如下的步骤：

若是，则将当前的初始噪声数据确定为所述目标噪声数据；

9.一种数据处理装置，其特征在于，应用于服务器，所述装置包括：

获取模块，用于将样本数据输入给初始基线模型，得到所述样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的；所述样本数据是终端设备采集到且提供给服务器的数据；以及，获取初始噪声数据，将所述初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息；

训练模块，用于基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据；

发送模块，用于将所述初始基线模型和所述目标噪声数据发送给终端设备，以使所述终端设备基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型；

其中，所述训练模块基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据时具体用于：

若是，则将当前的初始噪声数据确定为所述目标噪声数据；

10.一种服务器，其特征在于，包括：处理器和机器可读存储介质，所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令；

所述处理器用于执行机器可执行指令，以实现如下的步骤：

若是，则将当前的初始噪声数据确定为所述目标噪声数据；