WO2023143080A1

WO2023143080A1 - 一种数据处理方法以及相关设备

Info

Publication number: WO2023143080A1
Application number: PCT/CN2023/071725
Authority: WO
Inventors: 王仁宇; 杨宇庭; 张胜涛; 钱莉
Original assignee: 华为技术有限公司
Priority date: 2022-01-30
Filing date: 2023-01-10
Publication date: 2023-08-03
Also published as: CN116579380A

Abstract

一种数据处理方法以及相关设备，该方法可用于人工智能领域中。方法包括：终端设备将待处理数据输入第一神经网络得到第一中间结果，将第一中间结果发送至服务器；服务器将第一中间结果输入第二神经网络得到第二中间结果，将第二中间结果发送至终端设备；终端设备将第二中间结果输入第三神经网络得到与待处理数据对应的预测结果；在第一时刻和第二时刻这两个不同的时刻，终端设备上部署的第一神经网络或者第三神经网络中的神经网络层的数量发生改变，在不同的时刻，终端设备和服务器之间发送不同的中间结果，进一步提高对用户数据的隐私性的保护程度。

Description

一种数据处理方法以及相关设备

本申请要求于2022年01月30日提交中国专利局、申请号为202210115049.6、发明名称为“一种数据处理方法以及相关设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能领域，尤其涉及一种单指令多数据SIMD指令的生成、处理方法以及相关设备。

背景技术

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

为了保证神经网络在执行目标任务时的性能，现存的基于深度神经网络的应用模型参数量往往会达到10M-100M不等，对于一些计算资源限制比较吃紧的终端设备(例如智能穿戴设备或智能传感器等)，它们的计算机资源往往很难完成整个神经网络的计算。

目前，可以在终端设备侧采集用户的待处理数据，将待处理数据发送至服务器，服务器通过神经网络对待处理数据进行处理后，得到与待处理数据对应的预测结果，并返回至终端设备。

但由于用户的待处理数据需要在网络中传输，且服务器能够获取到原始的待处理数据，对用户数据的隐私性保护程度较弱。

发明内容

本申请实施例提供了一种数据处理方法以及相关设备，由于第二神经网络的运算是由服务器完成的，因此可以减少整个神经网络的计算过程中所占用的终端设备的计算机资源；终端设备是将待处理数据输入第一神经网络中计算之后，将第一中间结果发送给服务器，避免了原始的待处理数据的泄露，提高了对用户数据的隐私性的保护程度；且整个神经网络中的第三神经网络的计算也是由终端设备侧执行，有利于进一步提高对用户数据的隐私性的保护程度。

为解决上述技术问题，本申请实施例提供以下技术方案：

第一方面，本申请实施例提供一种数据处理方法，可用于人工智能领域中。方法应用于数据处理的系统，数据处理的系统包括第一终端设备和服务器，第一终端设备上部署第一神经网络和第三神经网络，服务器上部署第二神经网络，其中，第一神经网络、第二神经网络和第三神经网络组成目标神经网络，第一神经网络位于第二神经网络之前，第三神经网络位于第二神经网络之后，第二神经网络位于第一神经网络和第三神经网络之间。

进一步地，“第一神经网络位于第二神经网络之前”指的是在将待处理数据输入目标神经网络中，并通过目标神经网络进行数据处理的过程中，待处理数据会先通过目标神经网络中的第一神经网络，之后再经过目标神经网络中的第二神经网络。“第三神经网络位于第二神经网络之后”这一概念也可以借助前述描述进行理解，此处不做赘述。

数据处理方法包括：第一终端设备将待处理数据输入第一神经网络，得到第一神经网络生成的第一中间结果，将第一中间结果发送至服务器；“第一神经网络生成的第一中间结果”也可以称为“第一神经网络生成的第一隐向量”，第一神经网络生成的第一中间结果包括第二神经网络进行数据处理时所需要的数据；进一步地，“第一神经网络生成的第一中间结果”包括第一神经网络中最后一个神经网络层生成的数据，或者，“第一神经网络生成的第一中间结果”包括第一神经网络中最后一个神经网络层生成的数据，和，第一神经网络中其他神经网络层生成的数据。服务器将第一中间结果输入第二神经网络，得到第二神经网络生成的第二中间结果，将第二中间结果发送至第一终端设备；“第二中间结果”的含义可以参阅“第一中间结果”的含义进行理解，此处不做赘述。第一终端设备将第二中间结果输入第三神经网络，得到第三神经网络生成的与待处理数据对应的预测结果，预测结果所指示的信息的类型与目标任务的类型对应。

其中，在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的神经网络存在如下变化：第一神经网络中的神经网络层的数量发生改变，或者，第三神经网络中的神经网络层的数量发生改变。

本实现方式中，由于第二神经网络的运算是由服务器完成的，因此可以减少整个目标神经网络的计算过程中所占用的第一终端设备的计算机资源；第一终端设备是将待处理数据输入前第一神经网络中计算之后，将第一中间结果发送给服务器，避免了原始的待处理数据的泄露，提高了对用户数据的隐私性的保护程度；且整个目标神经网络中的后第三神经网络的计算也是由第一终端设备侧执行，有利于进一步提高对用户数据的隐私性的保护程度。由于攻击者可能会在获取到第一终端设备和服务器之间发送的中间结果后，根据获取到的中间结果反推以得到原始的待处理数据，而对于第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的神经网络层的数量发生改变，也即在不同的时刻，第一终端设备和服务器之间发送不同的中间结果，进一步增加了攻击者获取到原始的待处理数据的难度，以进一步提高对用户数据的隐私性的保护程度。

在第一方面的一种可能实现方式中，在第一时刻，第一神经网络包括N个神经网络层，第三神经网络包括S个神经网络层，在第二时刻，第一神经网络包括n个神经网络层，第三神经网络包括s个神经网络层，其中，N和n不同和/或S和s不同，方法还包括：服务器向第一终端设备发送n个神经网络层和s个神经网络层。

本实现方式中，当第一终端设备上部署的神经网络层的数量发生变化时，则服务器可以向第一终端设备发送更新后的第一神经网络和更新后的第三神经网络，进一步提高了攻击者确定第一终端设备上部署的神经网络的难度，从而进一步提高攻击者从中间结果反推得到原始的待处理数据的难度，有利于进一步提高对用户数据的隐私性保护程度。

在第一方面的一种可能实现方式中，方法还包括：服务器从目标神经网络中确定第一神经网络和第三神经网络，其中，目标神经网络为执行目标任务的神经网络，第一神经网络和第三神经网络的确定因素包括：在尚未执行目标任务时，第一终端设备的处理器资源的占用量和/或第一终端设备的内存资源的占用量。可选地，第一神经网络和第三神经网络的确定因素还可以包括如下任一种或多种：第一终端设备上目前运行的进程的数量、第一终端设备上每个进程已经运行的时间、第一终端设备上每个进程的运行状态或其他能够因素等，此处不做穷举。进一步地，“第一终端设备的内存资源的占用量”的评价指标可以包括如下任一种或多种指标：第一终端设备的总的内存资源的大小、第一终端设备的已占用的内存资源的大小、第一终端设备的内存资源的占用率或其他评价指标等。“第一终端设备的处理器资源的占用量”的评价指标可以包括如下任一种或多种指标：第一终端设备的处理器资源的占用率、第一终端设备上用于执行目标任务的每个处理器的占用时长、第一终端设备上用于执行目标任务分配的处理器的负载量、第一终端设备上用于执行目标任务分配的处理器的性能或其他能够反映第一终端设备的上用于执行目标任务的处理器资源的占用量的评价指标等，此处不做穷举。

本实现方式中，由于第一终端设备上通常需要运行多个应用程序，则在同一终端设备的不同时刻，第一终端设备能够分配给目标任务的计算机资源可能是不同的，则第一神经网络和第三神经网络的确定因素包括第一终端设备的处理器资源的占用量和/或第一终端设备的内存资源的占用量，有利于保证第一终端设备上部署的神经网络能够与第一终端设备的算力相匹配，以避免增加第一终端设备在执行目标任务过程的运算压力。

在第一方面的一种可能实现方式中，数据处理的系统还包括第二终端设备，第一终端设备上部署的第一神经网络和第二终端设备上部署的第一神经网络中的神经网络层的数量不同，和/或，第一终端设备上部署的第三神经网络和第二终端设备上部署的第三神经网络中的神经网络层的数量不同；其中，第一终端设备和第二终端设备为不同类型的终端设备，和/或，第一终端设备和第二终端设备为同一类型中不同型号的终端设备。

本实现方式中，由于不同类型的终端设备的计算机资源的配置可能不同，同一类型中不同型号的终端设备的计算机资源的配置也可能不同，则不同类型的终端设备或同一类型中不同型号的终端设备能够分配给目标任务的计算机资源也可能不同，本方案中不同类别的终端设备或同一类型中不同型号的终端设备上部署的神经网络层的数量不同，以提高部署的神经网络层的数量与第一终端设备的计算机资源之间的匹配度。

在第一方面的一种可能实现方式中，第一神经网络和第二神经网络可以为服务器对目标神经网络拆分得到的。服务器上可以存储有第一映射关系，第一映射关系中可以存储有每种类型的终端设备上部署的神经网络层的数量，当服务器需要向新的第一终端设备上部署第一神经网络和第二神经网络时，可以根据该新的第一终端设备的目标类型和第一映射关系，确定与目标类型的第一终端设备对应的两个拆分节点。或者，服务器上可以存储有第二映射关系，第二映射关系中可以存储有与每种类型的终端设备的至少一个型号对应的神经网络层的数量，当服务器需要向新的第一终端设备上部署第一神经网络和第二神经网络时，可以根据该新的第一终端设备的目标类型、目标型号和第二映射关系，确定与目标类型的第一终端设备对应的两个拆分节点。其中，第一映射关系(或第二映射关系)中的第一神经网络和第三神经网络的确定因素可以包括如下任一种或多种因素的组合：当第一终端设备执行目标任务时，第一终端设备分配的处理器资源的预估量、第一终端设备分配的内存资源的预估量或其他类型的因素等。

在第一方面的一种可能实现方式中，第一终端设备通过第一神经网络和第三神经网络进行数据处理的过程中所占用的处理器资源小于服务器通过第二神经网络进行数据处理的过程中所占用的处理器资源，且，第一终端设备通过第一神经网络和第三神经网络进行数据处理的过程中所占用的内存资源小于服务器通过第二神经网络进行数据处理的过程中所占用的内存资源。

本实现方式中，将第二神经网络部署于服务器上，在第二神经网络进行数据处理的过程中占用处理器资源较多且占用内存资源较多，则可以进一步减少整个神经网络的计算过程中所占用的第一终端设备的计算机资源，有利于降低第一终端设备在执行目标任务过程中的计算压力；由于整个神经网络的数据处理过程中的大部分计算由服务器执行，则可以采用参数量更多的深度神经网络来生成与待处理数据定的预测结果，有利于提高整个神经网络生成的预测结果的精度。

在第一方面的一种可能实现方式中，待处理数据具体可以表现为如下任一种数据：声音数据、图像数据、指纹数据、耳部的轮廓数据、能够反映用户习惯的序列数据、文本数据、点云数据或其他类型的数据等。本实现方式中，提供了待处理数据的多种表现形式，扩展了本方案的应用场景，提高了本方案的实现灵活性。

第二方面，本申请实施例提供了一种数据处理方法，可用于人工智能领域中。方法应用于数据处理的系统，数据处理的系统包括第一终端设备和服务器，第一终端设备上部署第一神经网络，服务器上部署第二神经网络，方法包括：第一终端设备将待处理数据输入第一神经网络，得到第一神经网络生成的第一中间结果，将第一中间结果发送至服务器；服务器将第一中间结果输入第二神经网络，得到第二神经网络生成的与待处理数据对应的预测结果；其中，第一神经网络和第二神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的第一神经网络中的神经网络层的数量发生改变。

在第二方面的一种可能实现方式中，在第一时刻，第一神经网络包括N个神经网络层，在第二时刻，第一神经网络包括n个神经网络层，N和n不同，方法还包括：服务器向第一终端设备发送n个神经网络层。

在第二方面的一种可能实现方式中，数据处理的系统还包括第二终端设备，第一终端设备上部署的第一神经网络和第二终端设备上部署的第一神经网络中的神经网络层的数量不同；其中，第一终端设备和第二终端设备为不同类型的终端设备，和/或，第一终端设备和第二终端设备为同一类型中不同型号的终端设备。

本申请实施例第二方面提供的数据处理的系统还可以执行第一方面的各个可能实现方式中数据处理的系统执行的步骤，对于本申请实施例第二方面以及第二方面的各种可能实现方式的具体实现步骤、名词的含义以及每种可能实现方式所带来的有益效果，均可以参考第一方面中各种可能的实现方式中的描述，此处不再一一赘述。

第三方面，本申请实施例提供了一种数据处理方法，可用于人工智能领域中。方法应用于第一终端设备，第一终端设备包含于数据处理的系统，数据处理的系统还包括服务器，第一终端设备上部署第一神经网络和第三神经网络，服务器上部署第二神经网络，方法包括：将待处理数据输入第一神经网络，得到第一神经网络生成的第一中间结果；将第一中间结果发送至服务器，第一中间结果用于供服务器利用第二神经网络得到第二中间结果；接收服务器发送的第二中间结果，将第二中间结果输入第三神经网络，得到第三神经网络生成的与待处理数据对应的预测结果；其中，第一神经网络、第二神经网络和第三神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的神经网络存在如下变化：第一神经网络中的神经网络层的数量发生改变，或者，第三神经网络中的神经网络层的数量发生改变。

本申请实施例的第三方面提供的数据处理方法还可以执行第一方面的各个可能实现方式中第一终端设备执行的步骤，对于本申请实施例第三方面以及第三方面的各种可能实现方式的具体实现步骤，以及每种可能实现方式所带来的有益效果，均可以参考第一方面中各种可能的实现方式中的描述，此处不再一一赘述。

第四方面，本申请实施例提供了一种数据处理方法，可用于人工智能领域中。方法应用于服务器，服务器包含于数据处理的系统，数据处理的系统还包括第一终端设备，第一终端设备上部署第一神经网络和第三神经网络，服务器上部署第二神经网络，方法包括：接收第一终端设备发送的第一中间结果，第一中间结果基于待处理数据和第一神经网络得到；将第一中间结果输入第二神经网络，得到第二神经网络生成的第二中间结果；将第二中间结果发送至第一终端设备，第二中间结果用于供第一终端设备利用第三神经网络得到与待处理数据对应的预测结果；其中，第一神经网络、第二神经网络和第三神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的神经网络存在如下变化：第一神经网络中的神经网络层的数量发生改变，或者，第三神经网络中的神经网络层的数量发生改变。

本申请实施例的第四方面提供的数据处理方法还可以执行第一方面的各个可能实现方式中服务器执行的步骤，对于本申请实施例第四方面以及第四方面的各种可能实现方式的具体实现步骤，以及每种可能实现方式所带来的有益效果，均可以参考第一方面中各种可能的实现方式中的描述，此处不再一一赘述。

第五方面，本申请实施例提供了一种数据处理方法，可用于人工智能领域中。方法应用于第一终端设备，第一终端设备包含于数据处理的系统，数据处理的系统还包括服务器，第一终端设备上部署第一神经网络，服务器上部署第二神经网络，方法包括：将待处理数据输入第一神经网络，得到第一神经网络生成的第一中间结果；将第一中间结果发送至服务器，第一中间结果用于供服务器利用第二神经网络得到与待处理数据对应的预测结果；其中，第一神经网络和第二神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的第一神经网络中的神经网络层的数量发生改变。

本申请实施例的第五方面提供的数据处理方法还可以执行第二方面的各个可能实现方式中第一终端设备执行的步骤，对于本申请实施例第五方面以及第五方面的各种可能实现方式的具体实现步骤，以及每种可能实现方式所带来的有益效果，均可以参考第二方面中各种可能的实现方式中的描述，此处不再一一赘述。

第六方面，本申请实施例提供了一种数据处理方法，可用于人工智能领域中。方法应用于服务器，服务器包含于数据处理的系统，数据处理的系统还包括第一终端设备，第一终端设备上部署第一神经网络，服务器上部署第二神经网络，方法包括：接收第一终端设备发送的第一中间结果，第一中间结果基于待处理数据和N个第一中间结果得到；将第一中间结果输入第二神经网络，得到第二神经网络生成的与待处理数据对应的预测结果；其中，第一神经网络和第二神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的第一神经网络中的神经网络层的数量发生改变。

本申请实施例的第六方面提供的数据处理方法还可以执行第二方面的各个可能实现方式中服务器执行的步骤，对于本申请实施例第六方面以及第六方面的各种可能实现方式的具体实现步骤，以及每种可能实现方式所带来的有益效果，均可以参考第二方面中各种可能的实现方式中的描述，此处不再一一赘述。

第七方面，本申请实施例提供了一种数据处理装置，可用于人工智能领域中。数据处理装置部署于第一终端设备上，第一终端设备包含于数据处理的系统，数据处理的系统还包括服务器，第一终端设备上部署第一神经网络和第三神经网络，服务器上部署第二神经网络，装置包括：输入模块，用于将待处理数据输入第一神经网络，得到第一神经网络生成的第一中间结果；发送模块，用于将第一中间结果发送至服务器，第一中间结果用于供服务器利用第二神经网络得到第二中间结果；接收模块，用于接收服务器发送的第二中间结果；输入模块，还用于将第二中间结果输入第三神经网络，得到第三神经网络生成的与待处理数据对应的预测结果；其中，第一神经网络、第二神经网络和第三神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的神经网络存在如下变化：第一神经网络中的神经网络层的数量发生改变，或者，第三神经网络中的神经网络层的数量发生改变。

本申请实施例的第七方面提供的数据处理装置还可以执行第一方面的各个可能实现方式中第一终端设备执行的步骤，对于本申请实施例第七方面以及第七方面的各种可能实现方式的具体实现步骤，以及每种可能实现方式所带来的有益效果，均可以参考第一方面中各种可能的实现方式中的描述，此处不再一一赘述。

第八方面，本申请实施例提供了一种数据处理装置，可用于人工智能领域中。数据处理装置部署于服务器，服务器包含于数据处理的系统，数据处理的系统还包括第一终端设备，第一终端设备上部署第一神经网络和第三神经网络，服务器上部署第二神经网络，装置包括：接收模块，用于接收第一终端设备发送的第一中间结果，第一中间结果基于待处理数据和第一神经网络得到；输入模块，用于将第一中间结果输入第二神经网络，得到第二神经网络生成的第二中间结果；发送模块，用于将第二中间结果发送至第一终端设备，第二中间结果用于供第一终端设备利用第三神经网络得到与待处理数据对应的预测结果；其中，第一神经网络、第二神经网络和第三神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的神经网络存在如下变化：第一神经网络中的神经网络层的数量发生改变，或者，第三神经网络中的神经网络层的数量发生改变。

本申请实施例的第八方面提供的数据处理装置还可以执行第一方面的各个可能实现方式中服务器执行的步骤，对于本申请实施例第八方面以及第八方面的各种可能实现方式的具体实现步骤，以及每种可能实现方式所带来的有益效果，均可以参考第一方面中各种可能的实现方式中的描述，此处不再一一赘述。

第九方面，本申请实施例提供了一种数据处理装置，可用于人工智能领域中。数据处理装置部署于第一终端设备，第一终端设备包含于数据处理的系统，数据处理的系统还包括服务器，第一终端设备上部署第一神经网络，服务器上部署第二神经网络，装置包括：输入模块，用于将待处理数据输入第一神经网络，得到第一神经网络生成的第一中间结果；发送模块，用于将第一中间结果发送至服务器，第一中间结果用于供服务器利用第二神经网络得到与待处理数据对应的预测结果；其中，第一神经网络和第二神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的第一神经网络中的神经网络层的数量发生改变。

本申请实施例的第九方面提供的数据处理装置还可以执行第二方面的各个可能实现方式中第一终端设备执行的步骤，对于本申请实施例第九方面以及第九方面的各种可能实现方式的具体实现步骤，以及每种可能实现方式所带来的有益效果，均可以参考第二方面中各种可能的实现方式中的描述，此处不再一一赘述。

第十方面，本申请实施例提供了一种数据处理装置，可用于人工智能领域中。服务器包含于数据处理的系统，数据处理的系统还包括第一终端设备，第一终端设备上部署第一神经网络，服务器上部署第二神经网络，装置包括：接收模块，用于接收第一终端设备发送的第一中间结果，第一中间结果基于待处理数据和N个第一中间结果得到；输入模块，用于将第一中间结果输入第二神经网络，得到第二神经网络生成的与待处理数据对应的预测结果；其中，第一神经网络和第二神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的第一神经网络中的神经网络层的数量发生改变。

本申请实施例的第十方面提供的数据处理装置还可以执行第二方面的各个可能实现方式中服务器执行的步骤，对于本申请实施例第十方面以及第十方面的各种可能实现方式的具体实现步骤，以及每种可能实现方式所带来的有益效果，均可以参考第二方面中各种可能的实现方式中的描述，此处不再一一赘述。

第十一方面，本申请实施例提供了一种第一终端设备，可以包括处理器，处理器和存储器耦合，存储器存储有程序指令，当存储器存储的程序指令被处理器执行时实现上述各个方面所述的数据处理方法中第一终端设备执行的步骤。

第十二方面，本申请实施例提供了一种服务器，可以包括处理器，处理器和存储器耦合，存储器存储有程序指令，当存储器存储的程序指令被处理器执行时实现上述各个方面所述的数据处理方法中服务器执行的步骤。

第十三方面，本申请实施例提供了一种数据的处理系统，可以包括第一终端设备和服务器，第一终端设备用于执行上述第一方面所述的方法中第一终端设备执行的步骤，服务器用于执行上述第一方面所述的方法中服务器执行的步骤；或者，第一终端设备用于执行上述第二方面所述的方法中第一终端设备执行的步骤，服务器用于执行上述第二方面所述的方法中服务器执行的步骤。

第十四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，当所述程序在计算机上运行时，使得计算机执行上述各个方面所述的数据处理方法中第一终端设备执行的步骤，或者，使得计算机执行上述各个方面所述的数据处理方法中服务器执行的步骤。

第十五方面，本申请实施例提供了一种计算机程序产品，该计算机程序产品包括程序，当该程序在计算机上运行时，使得计算机执行上述各个方面所述的数据处理方法中第一终端设备执行的步骤，或者，使得计算机执行上述各个方面所述的数据处理方法中服务器执行的步骤。

第十六方面，本申请实施例提供了一种电路系统，所述电路系统包括处理电路，所述处理电路配置为执行上述各个方面所述的数据处理方法中第一终端设备执行的步骤，或者，所述处理电路配置为执行上述各个方面所述的数据处理方法中服务器执行的步骤。

第十七方面，本申请实施例提供了一种芯片系统，该芯片系统包括处理器，用于实现上述各个方面中所涉及的功能，例如，发送或处理上述方法中所涉及的数据和/或信息。在一种可能的设计中，所述芯片系统还包括存储器，所述存储器，用于保存服务器或通信设备必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包括芯片和其他分立器件。

附图说明

图1a为本申请实施例提供的人工智能主体框架的一种结构示意图；

图1b为本申请实施例提供的数据处理方法的一种应用场景图；

图2a为本申请实施例提供的数据处理系统的一种系统架构图；

图2b为本申请实施例提供的数据处理系统的一种系统架构图；

图3为本申请实施例提供的数据处理方法的一种流程示意图；

图4为本申请实施例提供的数据处理方法的一种流程示意图；

图5为本申请实施例提供的数据处理方法中目标神经网络所对应的两个拆分节点的一种示意图；

图6为本申请实施例提供的数据处理方法中第一中间结果的一种示意图；

图7为本申请实施例提供的数据处理方法中第一中间结果的另一种示意图；

图8为本申请实施例提供的数据处理方法中第二中间结果的另一种示意图；

图9为本申请实施例提供的数据处理方法的一种流程示意图；

图10为本申请实施例中更新与目标神经网络对应的拆分节点的一种流程示意图；

图11为本申请实施例提供的数据处理方法中与目标神经网络对应的拆分节点的一种示意图；

图12为本申请实施例提供的数据处理方法的一种流程示意图；

图13为本申请实施例提供的数据处理方法的一种流程示意图；

图14为本申请实施例提供的数据处理装置的一种结构示意图；

图15为本申请实施例提供的数据处理装置的一种结构示意图；

图16为本申请实施例提供的数据处理装置的一种结构示意图；

图17为本申请实施例提供的数据处理装置的一种结构示意图；

图18为本申请实施例提供的第一终端设备的一种结构示意图；

图19为本申请实施例提供的服务器的一种结构示意图；

图20为本申请实施例提供的芯片的一种结构示意图。

具体实施方式

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，这仅仅是描述本申请的实施例中对相同属性的对象在描述时所采用的区分方式。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。

下面结合附图，对本申请的实施例进行描述。本领域普通技术人员可知，随着技术的发展和新场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

首先对人工智能系统总体工作流程进行描述，请参见图1a，图1a示出的为人工智能主体框架的一种结构示意图，下面从“智能信息链”(水平轴)和“IT价值链”(垂直轴)两个维度对上述人工智能主题框架进行阐述。其中，“智能信息链”反映从数据的获取到处理的一列过程。举例来说，可以是智能信息感知、智能信息表示与形成、智能推理、智能决策、智能执行与输出的一般过程。在这个过程中，数据经历了“数据—信息—知识—智慧”的凝练过程。“IT价值链”从人智能的底层基础设施、信息(提供和处理技术实现)到系统的产业生态过程，反映人工智能为信息技术产业带来的价值。

(1)基础设施

基础设施为人工智能系统提供计算能力支持，实现与外部世界的沟通，并通过基础平台实现支撑。通过传感器与外部沟通；计算能力由智能芯片提供，该智能芯片具体可以采用中央处理器(central processing unit，CPU)、嵌入式神经网络处理器(neural-network processing unit，NPU)、图形处理器(graphics processing unit，GPU)、专用集成电路(application specific integrated circuit，ASIC)或现场可编程门阵列(field programmable gate array，FPGA)等硬件加速芯片；基础平台包括分布式计算框架及网络等相关的平台保障和支持，可以包括云存储和计算、互联互通网络等。举例来说，传感器和外部沟通获取数据，这些数据提供给基础平台提供的分布式计算系统中的智能芯片进行计算。

(2)数据

基础设施的上一层的数据用于表示人工智能领域的数据来源。数据涉及到图形、图像、语音、文本，还涉及到传统设备的物联网数据，包括已有系统的业务数据以及力、位移、液位、温度、湿度等感知数据。

(3)数据处理

数据处理通常包括数据训练，机器学习，深度学习，搜索，推理，决策等方式。

其中，机器学习和深度学习可以对数据进行符号化和形式化的智能信息建模、抽取、预处理、训练等。

推理是指在计算机或智能系统中，模拟人类的智能推理方式，依据推理控制策略，利用形式化的信息进行机器思维和求解问题的过程，典型的功能是搜索与匹配。

决策是指智能信息经过推理后进行决策的过程，通常提供分类、排序、预测等功能。

(4)通用能力

对数据经过上面提到的数据处理后，进一步基于数据处理的结果可以形成一些通用的能力，比如可以是算法或者一个通用系统，例如，翻译，文本的分析，计算机视觉的处理，语音识别，图像的识别等等。

(5)智能产品及行业应用

智能产品及行业应用指人工智能系统在各领域的产品和应用，是对人工智能整体解决方案的封装，将智能信息决策产品化、实现落地应用，其应用领域主要包括：智能终端、智能制造、智能交通、智能家居、智能医疗、智能安防、自动驾驶、智慧城市等。本申请实施例可以应用于人工智能领域的各种领域中，具体可以应用于第一终端设备利用神经网络进行数据处理的应用场景中，具体示例如下。

一、智能终端领域

作为示例，例如在智能终端领域中，前述智能终端具体可以表现为手环、手表、耳机、眼镜等智能穿戴设备，也可以表现为手机、平板等智能终端。智能终端上可以配置有用于人脸识别功能，当用户想要解锁智能终端、打开智能终端上的隐私数据或者执行其他操作时，智能终端可以获取当前用户的脸部图像，进而获取与当前用户的脸部图像对应的识别结果，在确定当前用户是已经注册的用户的情况下，才会触发执行对应的操作，智能终端上也可以配置有其他功能，此处不再一一进行列举。

二、智能家居领域

作为示例，例如在智能家居领域中，前述智能家居具体可以表现为扫地机器人、空调、灯、热水器、冰箱或其他类型的智能家居等。当用户采用声音的方式向智能家居发出控制指令时，智能家居可以获取与用户声音对应的声纹识别结果，在确定发出声音的用户是特定用户的情况下，才会触发智能家居执行与控制指令对应的操作。

为更直观地理解本方案，请参阅图1b，图1b为本申请实施例提供的数据处理方法的一种应用场景图，如图1b所示，当用户采用声音的方式向图1b中示出的空调(也即智能家居的一个示例)发出“打开空调”的指令时，空调可以获取前述控制指令对应的声纹识别结果，在确定发出“打开空调”这一声音指令的用户为具有空调的控制权限的用户的情况下，执行打开空调的操作，应理解，图1b中的举例为方便理解本方案的应用场景，不用于限定本方案。

三、自动驾驶领域

作为示例，例如在自动驾驶领域中，车辆上可以配置有人脸识别功能，车辆获取用户脸部的图像数据，并获取与用户脸部的图像数据对应的识别结果，在确定当前用户是具有车辆启动权限的用户的情况下，才会触发启动车辆。

需要说明的是，上述种种举例仅为方便理解本申请实施例的应用场景，在其他很多应用场景中，终端设备也会需要利用神经网络进行数据处理，此处举例不用于限定本申请实施例的应用场景。在上述种种场景中，为了能够在减少整个神经网络的计算过程中对第一终端设备的计算机资源的占用的同时，能够提高对用户数据的隐私性保护程度，可以采用本申请实施例提供的数据处理方法。

先结合图2a和图2b对本申请实施例提供的数据处理系统进行介绍。在一种系统架构中，请先参阅图2a，图2a为本申请实施例提供的数据处理系统的一种系统架构图。在图2a中，数据处理系统可以包括训练设备210、数据库220、终端设备230和服务器240，终端设备230中包括第一计算模块，服务器240中包括第二计算模块。

其中，在目标神经网络201的训练阶段，数据库220中存储有训练数据集合，训练设备210生成用于执行目标任务的目标神经网络201，目标神经网络201中包括多个神经网络层；训练设备210利用数据库220中的训练数据集合对目标神经网络201进行迭代训练，得到训练后的目标神经网络201。

服务器240可以获取到训练后的目标神经网络201，服务器240将训练后的目标神经网络201中的一部分神经网络层部署于终端设备230的第一计算模块中，将训练后的目标神经网络201中的另一部分神经网络层部署于服务器240的第二计算模块中。

在目标神经网络201的推理阶段，终端设备230中的第一计算模块执行目标神经网络201中的一部分数据计算，服务器240中的第二计算模块执行目标神经网络201中的另一部分数据计算，以减少整个神经网络的计算过程中对终端设备230的计算机资源的占用。

在另一种系统架构中，请参阅图2b，图2b为本申请实施例提供的数据处理系统的一种系统架构图。在图2b中，数据处理系统可以包括训练设备210、数据库220、终端设备230、第一服务器241和第二服务器242，终端设备230中包括第一计算模块，第二服务器242中包括第二计算模块。

图2b和图2a的区别在于，在图2a示出的系统架构中，服务器240既用于执行目标神经网络201的多个神经网络层的分配操作，且服务器240中的第二计算模块用于完成目标神经网络201中的一部分神经网络层的计算。在图2b示出的系统架构中，第一服务器241和第二服务器242是两个独立的设备，第一服务器241用于执行目标神经网络201的多个神经网络层的分配操作，第二服务器242中的第二计算模块用于完成目标神经网络201中的一部分神经网络层的计算。

本申请的一些实施例中，请参阅图2a和图2b，“用户”可以直接与终端设备230交互，也即终端设备230可以直接将整个目标神经网络201输出的预测结果展示给“用户”，值得注意的，图2a和图2b仅是本发明实施例提供的数据处理系统的两种架构示意图，图中所示设备、器件、模块等之间的位置关系不构成任何限制。例如，在本申请的另一些实施例中，终端设备230和客户设备也可以为分别独立的设备，客户设备用于将整个目标神经网络201输出的预测结果展示给“用户”，终端设备230配置有输入/输出(in/out，I/O)接口，终端设备230通过I/O接口与客户设备进行数据交互。

进一步地，在目标神经网络201的推理阶段，在一种实现方式中，目标神经网络201可以包括第一神经网络、第二神经网络和第三神经网络。

更进一步地，第一神经网络包括目标神经网络201的前多个神经网络层，第三神经网络包括目标神经网络201中后多个神经网络层。也即第一神经网络位于第二神经网络之前，第三神经网络位于第二神经网络之后，第二神经网络位于第一神经网络和第三神经网络之间。第一终端设备上部署第一神经网络和第三神经网络，服务器上部署第二神经网络。

在另一种实现方式中，目标神经网络201可以被拆分为两部分，该两部分分别包括第一神经网络和第二神经网络，第一神经网络为目标神经网络201的一个子神经网络，第二神经网络为目标神经网络201的另一个子神经网络，第一神经网络位于第二神经网络之前。第一终端设备上部署上述第一神经网络，服务器上部署上述第二神经网络。

当目标神经网络201采用上述两种不同的拆分方式时，第一终端设备和服务器的处理流程不同，以下分别对上述两种拆分方式的具体实现流程进行描述。

一、目标神经网络包括第一神经网络、第二神经网络和第三神经网络

本申请实施例中，为了更直观地理解本方案，请参阅图3，图3为本申请实施例提供的数据处理方法的一种流程示意图。如图3所示，目标神经网络包括第一神经网络、第二神经网络和第三神经网络，第一终端设备上部署有前述第一神经网络和前述第三神经网络，服务器上部署有前述第二神经网络。A1、第一终端设备将原始的待处理数据输入第一神经网络中，得到第一神经网络生成的第一中间结果。A2、第一终端设备将第一中间结果发送至服务器。A3、服务器将第一中间结果输入第二神经网络，得到第二神经网络生成的第二中间结果，将第二中间结果发送至第一终端设备。A4、第一终端设备将第二中间结果输入第三神经网络，得到第三神经网络生成的与待处理数据对应的预测结果；应理解，图3中的示例仅为方便理解本方案，不用于限定本方案。具体的，请参阅图4，图4为本申请实施例提供的数据处理方法的一种流程示意图，本申请实施例提供的数据处理方法可以包括：

401、服务器将第一神经网络和第三神经网络发送给第一终端设备，其中，服务器上部署有第二神经网络，在第一时刻，第一神经网络包括N个神经网络层，第二神经网络包括M个神经网络层，第三神经网络包括S个神经网络层，第一神经网络、第二神经网络和第三神经网络组成目标神经网络。

本申请的一些实施例中，服务器可以确定与第一终端设备对应的第一神经网络中的神经网络层的数量和第三神经网络层的数量，在第一时刻，第一神经网络包括N个神经网络层，第二神经网络包括M个神经网络层，第三神经网络包括S个神经网络层，第一神经网络、第二神经网络和第三神经网络组成目标神经网络，N、M和S均为大于或等于1的整数。

服务器可以将第一神经网络和第三神经网络发送给第一终端设备，第一终端设备接收并存储第一神经网络和第三神经网络，以实现在第一终端设备上部署第一神经网络和第三神经网络，服务器上部署第二神经网络。

需要说明的是，服务器还可以通过其他方式将第一神经网络和第三神经网络部署于第一终端设备上，例如利用可移动的存储设备将第一神经网络和第三神经网络部署于第一终端设备上，本申请实施例中不对部署方式进行穷举。

此外，本申请实施例中的目标神经网络可以为进行过预处理之后的神经网络，该预处理可以为剪枝、蒸馏或其他用于减少标准的神经网络的参数量的处理方式等，此处不做穷举。或者，本申请实施例中的目标神经网络也可以为标准的神经网络，目标神经网络的具体表现形式可以结合实际应用场景确定，此处不做限定。

其中，执行步骤401的服务器可以为图2a示出的数据处理系统中的服务器240，也可以为图2b示出的数据处理系统中的第一服务器241。

目标神经网络为用于执行目标任务的神经网络，目标任务可以为任意类型的任务。作为示例，例如目标任务可以为通过识别输入的用户数据以实现鉴权的功能，该鉴权类任务可以为声纹识别、人脸识别、指纹识别、耳纹识别或利用其他类型的用户以实现鉴权的任务。作为另一示例，例如目标任务可以为个性化推荐类的任务，该个性化推荐类任务可以为个性化生成充电方案、个性化推荐食谱、个性化推荐运动方案、个性化推荐影视作品、个性化推荐应用程序等等，此处不做穷举。作为另一示例，目标任务可以为特征提取类的任务，该特征提取类的任务可以为声纹特征的提取、图像特征的提取或文本特征的提取等等。作为另一示例，目标任务还可以为识别语音内容、将文本在不同语言之间翻译、对周围环境中的目标进行识别、图像风格迁移或其他第一终端设备利用神经网络执行的任务等等，本申请实施例中不对目标任务具体表现为哪些类型的任务进行穷举。

目标神经网络可以具体表现为卷积神经网络、循环神经网络、残差神经网络或其他类型的神经网络等，目标神经网络的具体形态可以结合“目标任务”具体为神经类型的任务来确定，此处不做限定。该目标神经网络包括多个神经网络层。

可选地，第一神经网络、第二神经网络和第三神经网络为对目标神经网络进行拆分得到的。在图4对应的实施例中，整个目标神经网络包括的多个神经网络层被拆分为三部分，也即与本实施例中的目标神经网络对应有两个拆分节点，该两个拆分节点包括第一拆分节点和第二拆分节点，第一拆分节点为第一神经网络和第二神经网络的拆分节点，第二拆分节点为第二神经网络和第三神经网络的拆分节点。

“第一神经网络位于第二神经网络之前”指的是在将待处理数据输入目标神经网络中，并通过目标神经网络进行数据处理的过程中，待处理数据会先通过目标神经网络的第一神经网络之后，再经过目标神经网络的第二神经网络。也即目标神经网络中的各个神经网络层的前后顺序是指数据在目标神经网络中正向传播的过程中，数据先经过的神经网络层代表位置靠前的神经网络层，数据后经过的神经网络层代表位置靠后的神经网络层。“第三神经网络位于第二神经网络之后”这一概念也可以借助前述描述进行理解，此处不做赘述。

为了更直观地理解本方案，请参阅图5，图5为本申请实施例提供的数据处理方法中目标神经网络所对应的两个拆分节点的一种示意图，图5中以目标神经网络为残差神经网络(residual networks，ResNets)，目标任务为提取声纹特征为例，如图5所示，目标神经网络包括4个残差块(residual block)，目标神经网络中位于第一拆分节点之前的神经网络层被称为第一神经网络，位于第一拆分节点和第二拆分节点之间的神经网络层被称为第二神经网络，位于第二拆分节点之后的神经网络层被称为第三神经网络，也即第一神经网络位于第二神经网络之前，第三神经网络位于第二神经网络之后，应理解，图5中的示例仅为方便理解本方案，不用于限定本方案。进一步地，如下以表格的形式公开图5中神经网络中各个部分的参数量。

神经网络层(Layer)	参数量(Parameters)
第一个卷积层	3332＝288
残差块1	(3332322)*3＝55296
残差块2	(3364642)*4＝294912
残差块3	(331281282)*6＝1769472
残差块4	(332562562)*3＝3538944
池化层	-
第一个线性连接层	2568256＝524288
第二个线性连接层	256*256＝65536

表1

参阅如上表1可知，整个目标神经网络的数据处理过程中大部分的参数计算消耗在残差块1至残差块4的计算中，第一个卷积层和最后的线性连接(Linear)层的参数量较少，通过前述分析可知，可以将整个目标神经网络中的前多个神经网络层和最后的多个神经网络层部署于第一终端设备，将中间的多个神经网络层部署于服务器，能够大大减少整个目标神经网络的数据处理过程中所消耗的第一终端设备上的计算机资源。

本申请实施例中，针对服务器第一次确定目标部署的神经网络层的数量的方式。在一种实现方式中，第一终端设备上部署的第一神经网络和第二终端设备上部署的第一神经网络中的神经网络层的数量不同，和/或，第一终端设备上部署的第三神经网络和第二终端设备上部署的第三神经网络中的神经网络层的数量不同。

其中，第一终端设备和第二终端设备可以为不同类型的终端设备。作为示例，例如第一终端设备为手表，第二终端设备为手机；作为另一示例，例如第一终端设备为灯，第二终端设备为空调；作为另一示例，例如第一终端设备为手机，第二终端设备为平板等，此处不做穷举。

或者，第一终端设备和第二终端设备为同一类型中不同型号的终端设备。需要说明的是，本方案中当两个不同的终端设备(也即第一终端设备和第二终端设备)上均配置有目标神经网络所包括的部分神经网络层时，当第一终端设备上部署的神经网络层的数量和第二终端设备上部署的神经网络层的数量不同时，第一终端设备和第二终端设备可以为不同类型的终端设备或同一类型中不同型号的终端设备，但并不代表任意两个不同类型的终端设备上部署的神经网络层的数量均不同，也不代表同一类别中任意两个不同型号的终端设备上部署的神经网络层的数量均不同。

可选地，若第一神经网络、第二神经网络和第三神经网络为对目标神经网络进行拆分得到，则在图4对应的实施例中，目标神经网络对应有两个拆分节点，“与目标神经网络对应的拆分节点不同”指的是与第一终端设备对应的两个拆分节点，和，与第二终端设备对应的两个拆分节点不完全相同。

具体的，图4对应实施例中的“与目标神经网络对应的拆分节点不同”存在如下三种情况：在一种情况下，第一终端设备所对应的第一拆分节点与第二终端设备所对应的第一拆分节点相同，第一终端设备所对应的第二拆分节点与第二终端设备所对应的第二拆分节点不同。在另一种情况下，第一终端设备所对应的第一拆分节点与第二终端设备所对应的第一拆分节点不同，第一终端设备所对应的第二拆分节点与第二终端设备所对应的第二拆分节点相同。在另一种情况下，第一终端设备所对应的第一拆分节点与第二终端设备所对应的第一拆分节点不同，第一终端设备所对应的第二拆分节点与第二终端设备所对应的第二拆分节点不同。

对应的，图4对应实施例中的“与目标神经网络对应的拆分节点相同”指的是第一终端设备所对应的第一拆分节点与第二终端设备所对应的第一拆分节点相同，且第一终端设备所对应的第二拆分节点与第二终端设备所对应的第二拆分节点相同。

本申请实施例中，由于不同类型的终端设备的计算机资源的配置可能不同，同一类型中不同型号的终端设备的计算机资源的配置也可能不同，则不同类型的终端设备或同一类型中不同型号的终端设备能够分配给目标任务的计算机资源也可能不同，本方案中不同类别的终端设备或同一类型中不同型号的终端设备上部署的神经网络层的数量不同，以提高部署的神经网络层的数量与第一终端设备的计算机资源之间的匹配度。

具体的，针对服务器确定与某一个第一终端设备对应的两个拆分节点的过程。若不同类别的终端设备上部署的神经网络层的数量可能不同，同一类型中不同型号的终端设备上部署的神经网络层的数量均相同，则服务器上可以预先配置有第一映射关系，第一映射关系中可以存储有每种类型的终端设备上部署的神经网络层的数量，当服务器需要向新的第一终端设备上部署第一神经网络和第二神经网络时，可以根据该新的第一终端设备的目标类型和第一映射关系，确定与目标类型的第一终端设备对应的两个拆分节点。

则在执行步骤401之前，当第一终端设备上需要部署目标神经网络中的部分神经网络层时，可以向服务器发送第一请求，第一请求用于请求获取目标神经网络中的部分神经网络层，第一请求中还携带有第一终端设备的目标类型。服务器根据接收到的该第一终端设备的目标类型，从第一映射关系中获取与目标类型对应的两个拆分节点；服务器根据获取到的前述两个拆分节点，从目标神经网络中拆分出该第一神经网络和第三神经网络。

其中，第一映射关系可以采用表格、数组或其他形式存储于服务器上。为更直观地理解本方案，以下以表格的形式展示第一映射关系。

表2

如上述表2所示，当第一终端设备表现为不同类型的终端设备时，目标神经网络所对应的两个拆分节点可能会相同，也可能会不同。例如当第一终端设备表现为灯和第一终端设备表现为冰箱这两个不同的情况时，目标神经网络所对应的两个拆分节点不同；再例如当第一终端设备表现为冰箱和第一终端设备表现为空调这两个不同的情况时，目标神经网络所对应的两个拆分节点相同，应理解，表2中的示例仅为方便理解第一映射关系中的内容，不用于限定本方案。

更具体的，在一种实现方式中，第一映射关系由其他设备发送给服务器。在另一种实现方式中，第一映射关系是由服务器生成的。

进一步地，第一映射关系中的第一神经网络和第三神经网络的确定因素可以包括如下任一种或多种因素的组合：当第一终端设备执行目标任务时，第一终端设备分配的处理器资源的预估量、第一终端设备分配的内存资源的预估量或其他类型的因素等。

也即在执行步骤401之前，服务器可以根据获取每种类型的终端设备的上述指标，根据每种类型的终端设备的上述指标，确定每种类型的终端设备上部署的神经网络层的数量。其中，第一终端设备分配的处理器资源的预估量越多，则第一终端设备上分配的神经网络层的数量越多，第一终端设备分配的处理器资源的预估量越少，则第一终端设备上分配的神经网络层的数量越少。第一终端设备分配的内存资源的预估量越多，则第一终端设备上分配的神经网络层的数量越多，第一终端设备分配的内存资源的预估量越少，则第一终端设备上分配的神经网络层的数量越少。

处理器具体可以表现为中央处理器(central processing unit，CPU)、图形处理器(graphics processing unit，GPU)、专用集成电路(application specific integrated circuit，ASIC)或其他类型的处理器等，具体第一终端设备上配置的为哪些类型的处理器可以结合实际产品形态确定，此处不做限定。

若第一终端设备上仅分配一个处理器来执行目标任务，则“第一终端设备分配的处理器资源的预估量”的评价指标可以包括如下任一个或多个元素：第一终端设备为执行目标任务分配的处理器的占用时长和第一终端设备为执行目标任务分配的处理器的性能。若第一终端设备上分配至少两个处理器来执行目标任务，则“第一终端设备分配的处理器资源的预估量”的评价指标可以包括如下任一个或多个元素：第一终端设备为执行目标任务分配的每个处理器的占用时长、第一终端设备为执行目标任务分配的每个处理器的性能、处理器的数量、每个处理器的类型或其他元素等。

更进一步地，处理器的性能的评价指标可以为如下任一种或多种评价指标：处理器每秒执行的浮点运算次数(floating-point operations per second，FLOPS)、处理器每秒执行的百万条指令的数量(dhrystone million instructions executed per second，DMIPS)，也即衡量处理器每秒执行了多少百万条指令或其他用于评价处理器的性能的指标，或者可以采用其他类型的处理器的性能的评价指标等，此处不做穷举。

“第一终端设备分配的内存资源的预估量”的评价指标可以为第一终端设备为执行目标任务分配的内存的存储空间的大小。

需要说明的是，“第一终端设备为执行目标任务分配的处理器的占用时长”和“第一终端设备为执行目标任务分配的内存的存储空间的大小”可以为一个预估的取值范围，也可以为一个预估的确定的值。进一步地，“第一终端设备为执行目标任务分配的处理器的占用时长”的单位可以为每秒执行的百万条指令(million instructions executed per second，MIPS)、秒或其他类型的时间单位等，此处不做穷举。

作为示例，例如，第一终端设备为执行目标任务分配的处理器的占用时长可以为0.5MIPS-1MIPS，第一终端设备为执行目标任务分配的内存的存储空间的大小可以为20M-30M；作为另一示例，例如第一终端设备为执行目标任务分配的处理器的占用时长可以为1.5MIPS，第一终端设备为执行目标任务分配的内存的存储空间的大小可以为25M，应理解，此处举例仅为方便理解本方案，不用于限定本方案。

若不同类别的终端设备上部署的神经网络层的数量可能不同，且同一类型中不同型号的终端设备上部署的神经网络层的数量也可能不同，则服务器上可以配置有第二映射关系，第二映射关系中可以存储有与每种类型的终端设备的至少一个型号对应的神经网络层的数量，当服务器需要向新的第一终端设备上部署第一神经网络和第二神经网络时，可以根据该新的第一终端设备的目标类型、目标型号和第二映射关系，确定与目标类型的第一终端设备对应的两个拆分节点。

则在执行步骤401之前，当第一终端设备上需要部署目标神经网络中的部分神经网络层时，可以向服务器发送第一请求，第一请求用于请求获取目标神经网络中的部分神经网络层，第一请求中还携带有第一终端设备的目标类型和该第一终端设备的目标型号。服务器可以接收到的该第一终端设备的目标类型和该第一终端设备的目标型号，从第二映射关系中获取与目标类型和目标型号对应的两个拆分节点；服务器根据获取到的前述两个拆分节点，从目标神经网络中拆分出该第一神经网络和第三神经网络。

其中，第二映射关系可以采用表格、数组或其他形式存储于服务器上。为更直观地理解本方案，以下以表格的形式展示第二映射关系。

表3

如上述表3所示，对于同一类型且不同型号的两个第一终端设备，目标神经网络所对应的两个拆分节点可能会相同，也可能会不同。例如当两个不同的终端设备表现为不同型号的灯时，所有型号的灯上部署的目标神经网络部署的神经网络层的数量均相同。当两个不同的终端设备分别为型号0001的手机和型号0004的手机，前述两个不同的终端设备上部署的目标神经网络部署的神经网络层的数量不同，表3中的示例仅为方便理解第二映射关系中的内容，不用于限定本方案。

更具体的，在一种实现方式中，第二映射关系由其他设备发送给服务器。在另一种实现方式中，第二映射关系是由服务器生成的。

进一步地，第二映射关系中的第一神经网络和第三神经网络的确定因素可以包括如下任一种或多种因素的组合：当第一终端设备执行目标任务时，第一终端设备分配的处理器资源的预估量、第一终端设备分配的内存资源的预估量或其他类型的因素等。

也即服务器可以获取每种类型的至少一个型号中每个型号的第一终端设备的上述指标，根据每种类型的至少一个型号中每个型号的第一终端设备的上述指标，生成一个确定的目标类型的目标型号的第一终端设备上部署的神经网络层的数量，服务器重复执行前述操作，以生成该第二映射关系。其中，第一终端设备分配的处理器资源的预估量越多，则第一终端设备上分配的神经网络层的数量越多，第一终端设备分配的处理器资源的预估量越少，则第一终端设备上分配的神经网络层的数量越少。第一终端设备分配的内存资源的预估量越多，则第一终端设备上分配的神经网络层的数量越多，第一终端设备分配的内存资源的预估量越少，则第一终端设备上分配的神经网络层的数量越少。

对于“第一终端设备分配的处理器资源的预估量”和“第一终端设备分配的内存资源的预估量”这两个概念的理解可以参阅上述描述，此处不做赘述。

在另一种实现方式中，在第一终端设备为第一终端设备和第一终端设备为第二终端设备这两种不同的情况下，与目标神经网络对应的拆分节点可以相同，也即不同的第一终端设备上部署的目标神经网络部署的神经网络层的数量也可以均相同。

402、第一终端设备将待处理数据输入第一神经网络，得到第一神经网络生成的第一中间结果。

本申请实施例中，步骤401为可选步骤，若执行步骤401，则第一终端设备可以接收到服务器发送的第一神经网络和第三神经网络，并将接收到的第一神经网络和第三神经网络存储至本地。

若不执行步骤401，在一种实现方式中，若第一神经网络、第二神经网络和第三神经网络为对目标神经网络进行拆分得到，服务器可以向第一终端设备发送目标神经网络中的前P个神经网络层和目标神经网络中的后Q个神经网络层，并向第一终端设备发送第一指示信息；其中，P为大于或等于N的整数，Q为大于或等于S的整数，第一指示信息用于告知第一终端设备与该目标神经网络对应的两个拆分节点在目标神经网络中的位置。

第一终端设备将接收到的上述前P个神经网络层和上述后Q个神经网络层存储至本地，根据接收到的第一指示信息从上述前P个神经网络层中确定第一神经网络，从上述后Q个神经网络层中确定第三神经网络，也即实现了在第一终端设备上部署第一神经网络和第三神经网络。

在另一种实现方式中，服务器还可以将训练后的整个目标神经网络发送给第一终端设备，并向第一终端设备发送第一指示信息，第一指示信息用于告知第一终端设备与该目标神经网络对应的两个拆分节点在目标神经网络中的位置。从而第一终端设备可以根据接收到的第一指示信息，对接收到的目标神经网络进行拆分，以确定第一神经网络和第三神经网络，也即实现了在第一终端设备上部署第一神经网络和第三神经网络。

第一终端设备在部署有第一神经网络和第三神经网络之后，可以将待处理数据输入第一神经网络，得到第一神经网络生成的第一中间结果。其中，待处理数据具体表现为哪种类型的数据与目标任务具体表现为哪种类型的任务相关，作为示例，例如待处理数据具体可以表现为如下任一种数据：声音数据、图像数据、指纹数据、耳部的轮廓数据、能够反映用户习惯的序列数据、文本数据、点云数据或其他类型的数据等等，应理解，待处理数据采用的为哪种类型的数据需要结合通过目标神经网络执行的目标任务是哪种类型的任务来确定，此处不做限定。本实现方式中，提供了待处理数据的多种表现形式，扩展了本方案的应用场景，提高了本方案的实现灵活性。

“第一神经网络生成的第一中间结果”也可以称为“第一神经网络生成的第一隐向量”，第一神经网络生成的第一中间结果包括第二神经网络进行数据处理时所需要的数据。

进一步地，在一种情况中，“第一神经网络生成的第一中间结果”包括第一神经网络中最后一个神经网络层生成的数据。为更直观地理解本方案，请参阅图6，图6为本申请实施例提供的数据处理方法中第一中间结果的一种示意图。如图6所示，第一中间结果包括第一神经网络中最后一个神经网络层(也即图6中的第三个卷积层)生成的数据，应理解，图6中的示例仅为方便理解本方案，不用于限定本方案。

在另一种情况中，“第一神经网络生成的第一中间结果”包括第一神经网络中最后一个神经网络层生成的数据，和，第一神经网络中其他神经网络层生成的数据。为更直观地理解本方案，请参阅图7，图7为本申请实施例提供的数据处理方法中第一中间结果的另一种示意图。图7中示出的目标神经网络所对应的两个拆分节点和图5中示出的目标神经网络所对应的两个拆分节点相同，如图7所示，第一中间结果不仅包括第一神经网络中最后一个神经网络层(也即图7中第5个卷积层)生成的数据，而且包括第一神经网络中第N-2个神经网络层(也即图7中的第3个卷积层)生成的数据，应理解，图7中的示例仅为方便理解本方案，不用于限定本方案。

403、第一终端设备将第一中间结果发送至服务器。

本申请实施例中，第一终端设备在得到第一中间结果后，可以对第一中间结果进行加密，并将加密后的第一中间结果发送给服务器。其中，采用的加密算法包括但不限于安全套接层(secure sockets layer，SSL)加密算法或其他类型的加密算法等。

404、服务器将第一中间结果输入第二神经网络，得到第二神经网络生成的第二中间结果。

本申请实施例中，服务器在接收到加密后的第一中间结果之后，可以对加密后的第一中间结果进行解密以得到第一中间结果，并将第一中间结果输入第二神经网络中，得到第二神经网络生成的第二中间结果。

“第二神经网络生成的第二中间结果”也可以称为“第二神经网络生成的第二隐向量”，第二神经网络生成的第二中间结果包括第三神经网络进行数据处理时所需要的数据。

进一步地，在一种情况中，“第二神经网络生成的第二中间结果”包括第二神经网络中最后一个神经网络层生成的数据。为更直观地理解本方案，请结合图7进行理解，如图7所示，目标神经网络所对应的第二拆分节点(也即第二神经网络和第三神经网络之间的拆分节点)位于池化层和第一个线性连接层之间，则第二中间结果包括第二神经网络中最后一个神经网络层(也即图7中的池化层)生成的数据，应理解，图7中的示例仅为方便理解本方案，不用于限定本方案。

在另一种情况下，“第二神经网络生成的第二中间结果”包括第二神经网络中由最后一个神经网络层生成的数据，和，第二神经网络中其他的神经网络层生成的数据。请参阅图8，图8为本申请实施例提供的数据处理方法中第二中间结果的另一种示意图。如图8所示，第二中间结果不仅包括第二神经网络中最后一个神经网络层(也即图8中的最后一个卷积层)生成的数据，还包括第二神经网络中第M-2个神经网络层(也即图8中的倒数第3个卷积层)生成的数据，应理解，图8中的示例仅为方便理解本方案，不用于限定本方案。

405、服务器将第二中间结果发送至第一终端设备。

本申请实施例中，服务器在得到第二中间结果后，可以对第二中间结果进行加密，并将加密后的第二中间结果发送给第一终端设备，具体采用的加密算法可以参阅步骤403中的描述，此处不做赘述。

406、第一终端设备将第二中间结果输入第三神经网络，得到第三神经网络生成的与待处理数据对应的预测结果，预测结果所指示的信息的类型与目标任务的类型对应。

本申请实施例中，第一终端设备在接收到加密后的第二中间结果后，可以将第二中间结果输入第三神经网络中，也即将第二中间结果输入目标神经网络的最后的S个神经网络层中，得到第三神经网络生成的与待处理数据对应的预测结果(也即得到整个目标神经网络输出的与待处理数据对应的预测结果)。

其中，上述与待处理数据对应的预测结果所指示的信息的类型与目标任务的类型对应。作为示例，例如目标任务是声纹识别，则待处理数据可以为声音数据，与待处理数据对应的预测结果用于指示待处理数据(也即声音数据)是否为预设用户是声音。作为另一示例，例如目标任务是声纹特征提取，则待处理数据可以为声音数据，与待处理数据对应的预测结果为从待处理数据中提取到的声纹特征。

作为另一示例，例如目标任务是人脸识别，则待处理数据可以为用户脸部的图像数据，与待处理数据对应的预测结果用于指示为该用户是否为预设用户。作为另一示例，例如目标任务是指纹识别，则待处理数据为用户的指纹数据，与待处理数据对应的预测结果用于指示该用户是否为预设用户。作为再一示例，例如目标任务是对用户的耳部的轮廓数据进行特征提取，则待处理数据为用户的耳部的轮廓数据，与待处理数据对应的预测结果为用户的耳部的轮廓数据的特征等等，此处不对与待处理数据对应的预测结果进行穷举。

第一终端设备通过第一神经网络和第三神经网络进行数据处理的过程中所占用的处理器资源小于服务器通过第二神经网络进行数据处理的过程中所占用的处理器资源，且，第一终端设备通过第一神经网络和第三神经网络进行数据处理的过程中所占用的内存资源小于服务器通过第二神经网络进行数据处理的过程中所占用的内存资源。

本申请实施例中，将第二神经网络部署于服务器上，在第二神经网络进行数据处理的过程中占用处理器资源较多且占用内存资源较多，则可以进一步减少整个神经网络的计算过程中所占用的第一终端设备的计算机资源，有利于降低第一终端设备在执行目标任务过程中的计算压力；由于整个神经网络的数据处理过程中的大部分计算由服务器执行，则可以采用参数量更多的深度神经网络来生成与待处理数据定的预测结果，有利于提高整个神经网络生成的预测结果的精度。

本申请实施例中，第一终端设备在得到与待处理数据对应的预测结果之后，可以根据与待处理数据对应的预测结果执行后续的步骤，具体执行哪些步骤可以结合实际应用场景确定，此处不做限定。

为更直观地理解本方案，请参阅图9，图9为本申请实施例提供的数据处理方法的一种流程示意图。图9中以目标神经网络所执行的目标任务为提取声纹特征，且第一神经网络、第二神经网络和第三神经网络为对目标神经网络拆分得到为例，如图9所示，B1、第一终端设备获取用户输入的待处理数据(也即图9中示出的用户输入的声音数据)。B2、第一终端设备将待处理数据输入至第一神经网络(也即图9中示出的目标神经网络的前N个神经网络层)中，得到该第一神经网络生成的第一中间结果。B3、第一终端设备将第一中间结果进行加密处理，并将加密后的第一中间结果发送给服务器，以实现对第一中间结果的加密传输。B4、服务器在对加密后的第一中间结果进行解密以得到第一中间结果，将第一中间结果输入第二神经网络(也即N个神经网络层之后的M个神经网络层)中，得到第二神经网络生成的第二中间结果。B5、服务器将第二中间结果进行加密处理，并将加密后的第二中间结果发送给第一终端设备，以实现对第二中间结果的加密传输。B6、第一终端设备对加密后的第二中间结果进行解密以得到第二中间结果，将第二中间结果输入第三神经网络(也即目标神经网络的后S个神经网络层)，得到整个目标神经网络输出的与待处理数据对应的预测结果(也即从输入的声音数据中提取出的声纹特征)。B7、第一终端设备将本地存储的至少一个声纹特征中的每个声纹特征与获取到的声纹特征进行对比，以确定获取到的声纹特征是否为预先存储的至少一个声纹特征中的任意一个，以确定前述用户是否为具有权限的用户，应理解，图9中的示例仅为方便理解本方案，不用于限定本方案。

407、服务器获取与目标神经网络对应的更新后的拆分节点，其中，更新后的拆分节点指示第一神经网络包括n个神经网络层、第二神经网络包括m个神经网络层且第三神经网络包括s个神经网络层。

本申请的一些实施例中，服务器在将第一神经网络和第三神经网络部署于一个确定的第一终端设备上之后，可以获取与目标神经网络(也即第一终端设备上部署的神经网络层所归属的神经网络)对应的更新后的拆分节点，也即在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的神经网络存在如下变化：第一神经网络中的神经网络层的数量发生改变，或者，第三神经网络中的神经网络层的数量发生改变，也即在第一时刻和第二时刻这两个不同的时刻，与目标神经网络对应的拆分节点不同。

需要说明的是，本方案中当同一第一终端设备分别处于第一时刻和第二时刻这两个不同的时刻时，与目标神经网络对应的拆分节点可以不同，但不代表对于同一第一终端设备的任意两个不同的时刻，该目标神经网络部署的神经网络层的数量均不同。

其中，“与目标神经网络对应的拆分节点不同”的含义均可以参阅上述步骤中的描述，更新后的拆分节点指示第一神经网络包括n个神经网络层、第二神经网络包括m个神经网络层且第三神经网络包括s个神经网络层，第一终端设备上部署第一神经网络和第三神经网络，服务器上部署第二神经网络，n、s和m均为大于或等于1的整数，N和n不同和/或S和s不同。

进一步地，“第一神经网络”和“第二神经网络”在目标神经网络中的位置关系，“第二神经网络”和“第三神经网络”在目标神经网络中的位置关系均可以参阅上述步骤401中的描述，此处不做赘述。

本申请实施例中，由于攻击者可能会在获取到第一终端设备和服务器之间发送的中间结果后，根据获取到的中间结果反推以得到原始的待处理数据，而对于第一时刻和第二时刻这两个不同的时刻，与该神经网络对应的拆分节点不同，也即在不同的时刻，第一终端设备和服务器之间发送不同的中间结果，进一步增加了攻击者获取到原始的待处理数据的难度，以进一步提高对用户数据的隐私性的保护程度。

针对服务器获取与目标神经网络对应的更新后的拆分节点的触发点。在一种实现方式中，服务器可以每隔固定的时长重新获取与目标神经网络对应的拆分节点；作为示例，例如该固定时长可以为一天、一星期、十天、十五天、一个月或其他长度等，此处不做穷举。

在另一种实现方式中，服务器可以在固定的时间点重新获取与目标神经网络对应的拆分节点；作为示例，例如该固定的时间点可以为每个月的1号凌晨2点、每个星期的星期一的凌晨3点或其他时间点等，此处不做穷举。

在另一种实现方式中，第一终端设备可以向服务器发送请求消息，该请求消息用于请求更新目标神经网络部署的神经网络层的数量，也即请求更新目标神经网络包括的多个神经网络层在第一终端设备和服务器上的部署情况。可选地，该请求消息可以为由用户通过第一终端设备主动触发的，也即用户可以主动触发更新目标神经网络部署的神经网络层的数量等。

进一步地，在一种情况中，第一终端设备在每次需要执行目标任务时，可以向服务器发送请求消息，该请求消息用于请求更新目标神经网络部署的神经网络层的数量；在另一种情况中，第一终端设备可以在每执行该目标任务达到目标次数时，向服务器发送请求消息，该请求消息用于请求更新目标神经网络部署的神经网络层的数量；或者还可以在其他情况中触发第一终端设备向服务器发送该请求消息，此处不做穷举。

需要说明的是，还可以存在其他方式以触发服务器获取与目标神经网络对应的更新后的拆分节点，具体实现方式可以结合具体应用场景灵活确定，此处不做限定。

针对服务器获取与目标神经网络对应的更新后的拆分节点的具体实现过程。其中，第一终端设备上部署的神经网络层的数量的确定因素可以包括：第一终端设备的处理器资源的占用量和/或第一终端设备的内存资源的占用量。可选地，第一神经网络和第三神经网络的确定因素还可以包括如下任一种或多种：第一终端设备上目前运行的进程的数量、第一终端设备上每个进程已经运行的时间、第一终端设备上每个进程的运行状态或其他能够因素等，具体可以结合实际应用场景确定，此处不一一进行列举。

进一步地，“第一终端设备的内存资源的占用量”的评价指标可以包括如下任一种或多种指标：第一终端设备的总的内存资源的大小、第一终端设备的已占用的内存资源的大小、第一终端设备的内存资源的占用率或其他评价指标等。

“第一终端设备的处理器资源的占用量”的评价指标可以包括如下任一种或多种指标：第一终端设备的处理器资源的占用率、第一终端设备上用于执行目标任务的每个处理器的占用时长、第一终端设备上用于执行目标任务分配的处理器的负载量、第一终端设备上用于执行目标任务分配的处理器的性能或其他能够反映第一终端设备的上用于执行目标任务的处理器资源的占用量的评价指标等，具体需要结合实际产品确定，此处不做穷举。

具体的，服务器可以根据第一终端设备的处理器资源的占用量，计算当第一终端设备执行目标任务时所分配的处理器资源的预估量；对应的，服务器可以根据第一终端设备的内存资源的占用量，计算第一终端设备的内存资源的可用量，进而可以获取当第一终端设备执行目标任务时所分配的内存资源的预估量。

服务器可以根据当第一终端设备执行目标任务时所分配的处理器资源的预估量和当第一终端设备执行目标任务时所分配的内存资源的预估量，生成与目标神经网络对应的更新后的拆分节点。其中，若根据前述与目标神经网络对应的更新后的拆分节点对目标神经网络进行拆分，则部署于第一终端设备上的第一神经网络和第三神经网络在数据处理过程中所占用的处理器资源小于或等于前述当第一终端设备执行目标任务时所分配的处理器资源的预估量；部署于第一终端设备上的第一神经网络和第三神经网络在数据处理过程中所占用的内存资源小于或等于前述当第一终端设备执行目标任务时所分配的内存资源的预估量。

更具体的，针对“服务器根据第一终端设备的处理器资源的占用量，获取当第一终端设备执行目标任务时所分配的处理器资源的预估量”的过程。在一种实现方式中，服务器上可以存储有执行过训练操作的回归模型，前述回归模型用于执行前述预估操作；作为示例，例如该回归模型可以采用自回归滑动平均(autoregressive integrated moving average，ARIMA)模型、递归神经网络(recursive neural network，RNN)或其他类型的模型等，此处不做穷举。其中，该回归模型的输入可以包括第一终端设备上的处理器资源的占有率、第一终端设备上的内存资源的使用率、第一终端设备上当前运行的进程的数量和终端上每个进程已经运行的时间；该回归模型的输出可以为未来一段时间内每个进程所对应的处理器资源的预估占有率和内存资源的预估占有率。

服务器可以根据未来一段时间内每个进程所对应的处理器资源的预估占有率和内存资源的预估占有率，计算未来一段时间内第一终端设备的处理器资源的预估可用量和内存资源的预估可用量。进一步地，在一种情况中，服务器可以将该未来一段时间内第一终端设备的处理器资源的预估可用量确定为第一终端设备执行目标任务时所分配的处理器资源的预估量，将该未来一段时间内第一终端设备的内存资源的预估可用量确定为第一终端设备执行目标任务时所分配的内存资源的预估量。

在另一种情况中，服务器可以将该未来一段时间内第一终端设备的处理器资源的预估可用量与第一比例相乘，并将得到的乘积确定为第一终端设备执行目标任务时所分配的处理器资源的预估量；将该未来一段时间内第一终端设备的内存资源的预估可用量与该第一比例相乘，并将得到的乘积确定为第一终端设备执行目标任务时所分配的内存资源的预估量；其中，该第一比例小于1。

在另一种实现方式中，服务器也可以根据预设规则确定第一终端设备执行目标任务时所分配的处理器资源的预估量。服务器可以将第一终端设备的处理器资源的当前占用量乘以第二比例，将得到的乘积确定为未来一段时间内第一终端设备的处理器资源的预估占用量；将第一终端设备的内存资源的当前占用量乘以该第二比例，将得到的乘积确定为未来一段时间内第一终端设备的内存资源的预估占用量；第二比例大于1。

服务器根据未来一段时间内第一终端设备的处理器资源的预估占用量，确定未来一段时间内第一终端设备的处理器资源的预估可用量；根据未来一段时间内第一终端设备的内存资源的预估占用量，确定未来一段时间内第一终端设备的内存资源的预估可用量。进而可以根据未来一段时间内第一终端设备的处理器资源的预估可用量和内存资源的预估可用量，确定第一终端设备执行目标任务时所分配的处理器资源的预估量和内存资源的预估量。

需要说明的是，此处对于“服务器根据第一终端设备的处理器资源的占用量，获取当第一终端设备执行目标任务时所分配的处理器资源的预估量”的描述仅为证明本方案的可实现性，服务器还可以采用其他方式来得到第一终端设备执行目标任务时所分配的处理器资源的预估量，此处不对每种实现方式进行一一穷举。

可选地，为了能够实现目标神经网络的更新后的拆分节点与更新前的拆分节点不同。在一种实现方式中，服务器在根据当第一终端设备执行目标任务时所分配的处理器资源的预估量和当第一终端设备执行目标任务时所分配的内存资源的预估量，生成与目标神经网络对应的更新后的拆分节点之后，可以对前述确定的拆分节点进行随机的调整，也即随机的将拆分节点在目标神经网络中的位置进行随机的前移或后移，以对与目标神经网络对应的更新后的拆分节点进行再次更新，得到与目标神经网络对应的最终的更新后拆分节点。

进一步地，由于在图4对应实施例中，与目标神经网络对应有两个拆分节点，则当对确定的拆分节点进行随机的调整时，可以仅对第一拆分节点在目标神经网络中的位置进行随机调整，也可以仅对第二拆分节点在目标神经网络中的位置进行随机调整；还可以对第一拆分节点和第二拆分节点在目标神经网络中的位置均做随机调整。

为更直观地理解本方案，请参阅图10，图10为本申请实施例中更新与目标神经网络对应的拆分节点的一种流程示意图，图10以第一神经网络、第二神经网络和第三神经网络为对目标神经网络拆分得到，如图10所示，C1、在第一终端设备尚未执行目标任务时，获取与第一终端设备上已经占用的计算机资源关联的多个参数，前述多个参数可以包括第一终端设备的处理器资源的占用量、第一终端设备的内存资源的占用量、第一终端设备上目前运行的进程的数量和第一终端设备上每个进程已经运行的时间，第一终端设备将前述多个参数发送给服务器；C2、服务器根据接收到的多个参数，确定第一终端设备在执行目标任务时所分配的处理器资源的预估量和内存资源的预估量；C3、服务器根据第一终端设备在执行目标任务时所分配的处理器资源的预估量和内存资源的预估量，获取与目标神经网络对应的更新后的拆分节点；C4、服务器对目标神经网络所对应的更新后的拆分节点进行随机的前移或后移，得到与目标神经网络对应的最终的更新后拆分节点；C5、服务器根据与目标神经网络对应的最终的更新后拆分节点，从目标神经网络中确定第一神经网络包括的n个神经网络层、第二神经网络包括的m个神经网络层和第三神经网络包括的s个神经网络层；C6、服务器将第一神经网络包括的n个神经网络层和第三神经网络包括的s个神经网络层发送给第一终端设备，以将第一神经网络和第三神经网络部署至第一终端设备，并将第二神经网络部署至服务器上，应理解，图10中的示例仅为方便理解本方案，不用于限定本方案。

在另一种实现方式中，服务器在不同的时刻可以采用不同的预估算法，根据第一终端设备的处理器资源的可用量，来获取当第一终端设备执行目标任务时所分配的处理器资源的预估量，以提高不同时刻所对应的处理器资源的预估量不同的概率；对应的，服务器在不同的时刻可以采用不同的预估算法，根据第一终端设备的内存资源的可用量，来获取当第一终端设备执行目标任务时所分配的内存资源的预估量，以提高不同时刻所对应的内存资源的预估量不同的概率。从而提高不同时刻所对应的目标部署的神经网络层的数量不同的概率。

本申请实施例中，由于第一终端设备上通常需要运行多个应用程序，则在同一终端设备的不同时刻，第一终端设备能够分配给目标任务的计算机资源可能是不同的，则第一神经网络和第三神经网络的确定因素包括第一终端设备的处理器资源的占用量和/或第一终端设备的内存资源的占用量，有利于保证第一终端设备上部署的神经网络能够与第一终端设备的算力相匹配，以避免增加第一终端设备在执行目标任务过程的运算压力。

408、服务器向第一终端设备发送第一神经网络包括的n个神经网络层和第三神经网络包括的s个神经网络层。

本申请的一些实施例中，服务器可以根据更新后的两个拆分节点将目标神经网络拆分为第一神经网络、第二神经网络和第三神经网络；服务器向第一终端设备发送第一神经网络包括的n个神经网络层和第三神经网络包括的s个神经网络层，从而将第一终端设备发送第一神经网络和第三神经网络部署于第一终端设备上，将第二神经网络包括的s个神经网络层部署于服务器上。

本申请实施例中，当第一终端设备上部署的神经网络层的数量发生变化时，则服务器可以向第一终端设备发送更新后的第一神经网络和更新后的第三神经网络，进一步提高了攻击者确定第一终端设备上部署的神经网络的难度，从而进一步提高攻击者从中间结果反推得到原始的待处理数据的难度，有利于进一步提高对用户数据的隐私性保护程度。

409、第一终端设备将待处理数据输入第一神经网络，得到第一神经网络生成的第三中间结果，在第二时刻，第一神经网络包括n个神经网络层。

本申请实施例中，步骤407至413均为可选步骤，若不执行步骤407，则也不需要执行步骤408至413，也即对于同一终端设备的不同时刻，该目标神经网络部署的神经网络层的数量可以不更新，从而不需要为第一终端设备重新部署第一神经网络和第三神经网络。

若执行步骤407，也即对于同一终端设备的不同时刻，该目标神经网络部署的神经网络层的数量会更新，若执行步骤408，则第一终端设备可以接收第一神经网络包括的n个神经网络层和第三神经网络包括的s个神经网络层，并将接收到的n个神经网络层和s个神经网络层存储至本地。

若执行步骤407、不执行步骤408且执行步骤401，若第一神经网络、第二神经网络和第三神经网络为对目标神经网络拆分得到，由于步骤401中是服务器初次将目标神经网络中的第一神经网络和第三神经网络部署于一个新的第一终端设备上，第一神经网络和第三神经网络所对应的两个拆分节点的确定依据可以是第一终端设备所分配的计算机资源的最大预估量，“第一终端设备所分配的计算机资源的最大预估量”包括“第一终端设备所分配的处理资源的最大预估量”和“第一终端设备所分配的内存资源的最大预估量”，则N的取值可以大于或等于n，且S的取值可以大于或等于s。

则服务器在获取到与目标神经网络对应的更新后的拆分节点之后，可以向第一终端设备发送第二指示信息，第二指示信息用于告知第一终端设备与目标神经网络对应的两个更新后的拆分节点。第一终端设备可以根据第二指示信息从第一神经网络中确定第一神经网络，从第三神经网络中确定第三神经网络，从而实现将第一神经网络和第三神经网络部署于第一终端设备上。

若执行步骤407、不执行步骤408且不执行步骤401，若第一神经网络、第二神经网络和第三神经网络为对目标神经网络拆分得到，在一种实现方式中，若第一终端设备上存储有目标神经网络中的前P个神经网络层和目标神经网络中的后Q个神经网络层，服务器在获取到与目标神经网络对应的更新后的拆分节点之后，可以向第一终端设备发送第二指示信息，第一终端设备可以根据接收到的第二指示信息从上述前P个神经网络层中确定第一神经网络，从上述后Q个神经网络层中确定第三神经网络，也即实现了在第一终端设备上部署第一神经网络和第三神经网络，P为大于或等于n的整数，Q为大于或等于s的整数。

在另一种实现方式中，若第一终端设备上存储有训练后的整个目标神经网络，服务器在获取到与目标神经网络对应的更新后的拆分节点之后，可以向第一终端设备发送第二指示信息，第二指示信息用于告知第一终端设备与目标神经网络对应的两个更新后的拆分节点，从而第一终端设备可以根据第二指示信息从目标神经网络中确定第一神经网络和第三神经网络，且服务器可以根据与目标神经网络对应的更新后的拆分节点，从目标神经网络中确定第二神经网络，也即分别将第一神经网络、第二神经网络和第三神经网络部署于第一终端设备和服务器上。

第一终端设备在部署有第一神经网络和第三神经网络之后，可以将待处理数据输入第一神经网络，得到第一神经网络生成的第三中间结果，前述步骤的具体实现方式可以参阅步骤402中的描述，“第三中间结果”的概念与“第一中间结果”的概念类似，此处不做赘述。

本申请实施例中不限定步骤401与步骤409之间的执行次数，可以在执行一次步骤401之后，执行步骤409多次。

410、第一终端设备将第三中间结果发送至服务器。

411、服务器将第三中间结果输入第二神经网络，得到第二神经网络生成的第四中间结果，在第二时刻，第三神经网络包括m个神经网络层。

412、服务器将第四中间结果发送至第一终端设备。

413、第一终端设备将第四中间结果输入第三神经网络，得到第三神经网络生成的与待处理数据对应的预测结果，在第二时刻，第三神经网络包括s个神经网络层。

本申请实施例中，步骤410至413的具体方式可以参阅步骤403至406中的描述，区别在于，将步骤403至406中的“第一中间结果”替换为步骤410至413中的“第三中间结果”，将步骤403至406中的“第二中间结果”替换为步骤410至413中的“第四中间结果”，“第四中间结果”的含义与“第二中间结果”的含义类似，此处均不做赘述。

为更直观地理解本方案，请参阅图11，图11为本申请实施例提供的数据处理方法中与目标神经网络对应的拆分节点的一种示意图。图11中示出了更新前的拆分节点和更新后的拆分节点，更新前的第一拆分节点为图11中的X点，更新后的第一拆分节点为图11中的Y点，更新前的第二拆分节点和更新后的第二拆分节点均为图11中的H点。如图11所示，对于目标神经网络的更新前的两个拆分节点和目标神经网络的更新后的两个拆分节点这两种不同的情况，第一终端设备上部署的第一神经网络发生了变化，服务器上部署的第二神经网络也发生了变化，且第一终端设备向服务器发送的中间结果也发生了变化，应理解，图11对应实施例仅为方便理解本方案，不用于限定本方案。

本申请实施例中，由于第二神经网络的运算是由服务器完成的，因此可以减少整个目标神经网络的计算过程中所占用的第一终端设备的计算机资源；第一终端设备是将待处理数据输入前第一神经网络中计算之后，将第一中间结果发送给服务器，避免了原始的待处理数据的泄露，提高了对用户数据的隐私性的保护程度；且整个目标神经网络中的后第三神经网络的计算也是由第一终端设备侧执行，有利于进一步提高对用户数据的隐私性的保护程度。由于攻击者可能会在获取到第一终端设备和服务器之间发送的中间结果后，根据获取到的中间结果反推以得到原始的待处理数据，而对于第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的神经网络层的数量发生改变，也即在不同的时刻，第一终端设备和服务器之间发送不同的中间结果，进一步增加了攻击者获取到原始的待处理数据的难度，以进一步提高对用户数据的隐私性的保护程度。

二、目标神经网络包括第一神经网络和第二神经网络

本申请实施例中，请参阅图12，图12为本申请实施例提供的数据处理方法的一种流程示意图，本申请实施例提供的数据处理方法可以包括：

1201、服务器将第一神经网络发送给第一终端设备，服务器上部署有第二神经网络，在第一时刻，第一神经网络包括N个神经网络层，第二神经网络包括M个神经网络层，第一神经网络和第二神经网络组成目标神经网络。

1202、第一终端设备将待处理数据输入第一神经网络，得到第一神经网络生成的第一中间结果。

1203、第一终端设备将第一中间结果发送至服务器。

本申请实施例中，步骤1201至1203的具体实现方式可以参阅图4对应实施例中步骤401至403中的描述，区别在于在步骤401至403中，目标神经网络包括第一神经网络、第二神经网络和第三神经网络；在步骤1201至1203中，目标神经网络包括第一神经网络和第二神经网络，第一神经网络位于第二神经网络之前。

可选地，若第一神经网络和第二神经网络为对目标神经网络拆分得到，则第一神经网络指的是目标神经网络中位于目标拆分节点之前的神经网络层，第二神经网络指的是目标神经网络中位于目标拆分节点之后的神经网络层；对于“第一神经网络位于第二神经网络之前”和“第一中间结果”的概念的理解可以参阅图4对应实施例中的描述，此处不做赘述。

1204、服务器将第一中间结果输入第二神经网络，得到第二神经网络生成的与待处理数据对应的预测结果，预测结果所指示的信息的类型与目标任务的类型对应。

本申请实施例中，服务器在接收到加密后的第一中间结果之后，可以对加密后的第一中间结果进行解密以得到第一中间结果，并将第一中间结果输入第二神经网络中，得到第二神经网络生成的与待处理数据对应的预测结果(也即得到整个目标神经网络输出的与待处理数据对应的预测结果)，预测结果所指示的信息的类型与目标任务的类型对应。进一步地，对于“目标任务”、“与待处理数据对应的预测结果”的概念的理解可以参阅图4对应的实施例中的描述，此处不做赘述。

为更直观地理解本方案，请参阅图13，图13为本申请实施例提供的数据处理方法的一种流程示意图。图13中以目标神经网络所执行的目标任务为提取声纹特征为例，如图13所示，D1、第一终端设备获取用户输入的待处理数据(也即图13中示出的用户输入的声音数据)。D2、第一终端设备将待处理数据输入至第一神经网络(也即图13中示出的目标神经网络的前N个神经网络层)中，得到该第一神经网络生成的第一中间结果。D3、第一终端设备将第一中间结果进行加密处理，并将加密后的第一中间结果发送给服务器，以实现对第一中间结果的加密传输。D4、服务器在对加密后的第一中间结果进行解密以得到第一中间结果，将第一中间结果输入第二神经网络(也即目标神经网络的后M个神经网络层)中，得到整个目标神经网络输出的与待处理数据对应的预测结果(也即从输入的声音数据中提取出的声纹特征)。D5、服务器将已经注册的至少一个声纹特征中的每个声纹特征与获取到的声纹特征进行对比，以确定获取到的声纹特征是否为预先注册的至少一个声纹特征中的任意一个，以确定声纹识别的结果，该声纹识别的结果用于指示该用户是否为具有权限的用户。D6、服务器将该声纹识别的结果发送给第一终端设备。应理解，图13中的示例仅为方便理解本方案，不用于限定本方案。

需要说明的是，步骤1201为可选步骤，若不执行步骤1201，服务器将第一神经网络部署至第一终端设备上的方式可以参阅图4对应实施例中步骤402中的描述，此处不做赘述。

1205、服务器获取与目标神经网络对应的更新后的拆分节点，更新后的拆分节点指示目标神经网络第一神经网络包括n个神经网络层且第二神经网络包括m个神经网络层。

本申请实施例中，步骤1205的具体方式可以参阅图4对应实施例中步骤407中的描述，区别在于，步骤407中是获取与目标神经网络对应的两个拆分节点，步骤1205中是获取与目标神经网络对应的一个拆分节点。

此外，本申请实施例不限定步骤1201和步骤1205之间的执行次数，可以在执行一次步骤1201之后，执行多次步骤1205。

1206、服务器向第一终端设备发送第一神经网络包括的n个神经网络层。

1207、第一终端设备将待处理数据输入第一神经网络，得到第一神经网络生成的第三中间结果，在第二时刻，第一神经网络包括n个神经网络层。

1208、第一终端设备将第三中间结果发送至服务器。

1209、服务器将第三中间结果输入第二神经网络包括的m个神经网络层，得到第二神经网络生成的与待处理数据对应的预测结果。

本申请实施例中，步骤1206至1209的具体方式可以参阅图4对应实施例中步骤401至404中的描述，区别在于，将步骤1206至1209中的“第一中间结果”替换为步骤401至404中的“第三中间结果”，此处均不做赘述。

需要说明的是，步骤1205至1209均为可选步骤，若不执行步骤1205，则不需要执行步骤1206至1209；若执行步骤1205，则步骤1206也是可选步骤，若执行步骤1205且不执行步骤1206，则服务器将第一神经网络部署至第一终端设备上的方式可以参阅图4对应实施例中步骤409中的描述，此处不做赘述。

本申请实施例中，由于第二神经网络的运算是由服务器完成的，因此可以减少整个神经网络的计算过程中所占用的第一终端设备的计算机资源；第一终端设备是将待处理数据输入前第一神经网络中计算之后，将第一中间结果发送给服务器，避免了原始的待处理数据的泄露，提高了对用户数据的隐私性的保护程度；且整个神经网络中的后第三神经网络的计算也是由第一终端设备侧执行，有利于进一步提高对用户数据的隐私性的保护程度。

在图1至图13所对应的实施例的基础上，为了更好的实施本申请实施例的上述方案，下面还提供用于实施上述方案的相关设备。具体参阅图14，图14为本申请实施例提供的数据处理装置的一种结构示意图，数据处理装置1400部署于第一终端设备上，第一终端设备包含于数据处理的系统，数据处理的系统还包括服务器，第一终端设备上部署第一神经网络和第三神经网络，服务器上部署第二神经网络，数据处理装置1400包括：输入模块1401，用于将待处理数据输入第一神经网络，得到第一神经网络生成的第一中间结果；发送模块1402，用于将第一中间结果发送至服务器，第一中间结果用于供服务器利用第二神经网络得到第二中间结果；接收模块1403，用于接收服务器发送的第二中间结果；输入模块1401，还用于将第二中间结果输入第三神经网络，得到第三神经网络生成的与待处理数据对应的预测结果；其中，第一神经网络、第二神经网络和第三神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的神经网络存在如下变化：第一神经网络中的神经网络层的数量发生改变，或者，第三神经网络中的神经网络层的数量发生改变。

在一种可能的设计中，在第一时刻，第一神经网络包括N个神经网络层，第三神经网络包括S个神经网络层，在第二时刻，第一神经网络包括n个神经网络层，第三神经网络包括s个神经网络层，其中，N和n不同和/或S和s不同；接收模块1403，还用于接收服务器发送的n个神经网络层和s个神经网络层。

需要说明的是，数据处理装置1400中各模块/单元之间的信息交互、执行过程等内容，与本申请中图3至图11对应的各个方法实施例基于同一构思，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

请参阅图15，图15为本申请实施例提供的数据处理装置的一种结构示意图，数据处理装置1500署于服务器，服务器包含于数据处理的系统，数据处理的系统还包括第一终端设备，第一终端设备上部署第一神经网络和第三神经网络，服务器上部署第二神经网络，数据处理装置1500包括：接收模块1501，用于接收第一终端设备发送的第一中间结果，第一中间结果基于待处理数据和第一神经网络得到；输入模块1502，用于将第一中间结果输入第二神经网络，得到第二神经网络生成的第二中间结果；发送模块1503，用于将第二中间结果发送至第一终端设备，第二中间结果用于供第一终端设备利用第三神经网络得到与待处理数据对应的预测结果；其中，第一神经网络、第二神经网络和第三神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的神经网络存在如下变化：第一神经网络中的神经网络层的数量发生改变，或者，第三神经网络中的神经网络层的数量发生改变。

在一种可能的设计中，在第一时刻，第一神经网络包括N个神经网络层，第三神经网络包括S个神经网络层，在第二时刻，第一神经网络包括n个神经网络层，第三神经网络包括s个神经网络层，其中，N和n不同和/或S和s不同；发送模块1503，还用于向第一终端设备发送n个神经网络层和s个神经网络层。

需要说明的是，数据处理装置1500中各模块/单元之间的信息交互、执行过程等内容，与本申请中图3至图11对应的各个方法实施例基于同一构思，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

请参阅图16，图16为本申请实施例提供的数据处理装置的一种结构示意图，数据处理装置1600部署于第一终端设备，第一终端设备包含于数据处理的系统，数据处理的系统还包括服务器，第一终端设备上部署第一神经网络，服务器上部署第二神经网络，数据处理装置1600包括：输入模块1601，用于将待处理数据输入第一神经网络，得到第一神经网络生成的第一中间结果；发送模块1602，用于将第一中间结果发送至服务器，第一中间结果用于供服务器利用第二神经网络得到与待处理数据对应的预测结果；其中，第一神经网络和第二神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的第一神经网络中的神经网络层的数量发生改变。

在一种可能的设计中，在第一时刻，第一神经网络包括N个神经网络层，在第二时刻，第一神经网络包括n个神经网络层，N和n不同；数据处理装置1600还包括接收模块，用于接收服务器发送的第一神经网络。

需要说明的是，数据处理装置1600中各模块/单元之间的信息交互、执行过程等内容，与本申请中图12或图13对应的各个方法实施例基于同一构思，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

请参阅图17，图17为本申请实施例提供的数据处理装置的一种结构示意图，数据处理装置1700部署于服务器，服务器包含于数据处理的系统，数据处理的系统还包括第一终端设备，第一终端设备上部署第一神经网络，服务器上部署第二神经网络，数据处理装置1700包括：接收模块1701，用于接收第一终端设备发送的第一中间结果，第一中间结果基于待处理数据和N个第一中间结果得到；输入模块1702，用于将第一中间结果输入第二神经网络，得到第二神经网络生成的与待处理数据对应的预测结果；其中，第一神经网络和第二神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，第一终端设备上部署的第一神经网络中的神经网络层的数量发生改变。

在一种可能的设计中，在第一时刻，第一神经网络包括N个神经网络层，在第二时刻，第一神经网络包括n个神经网络层，N和n不同；装置还包括：发送模块，用于向终端设备发送n个神经网络层。

需要说明的是，数据处理装置1700中各模块/单元之间的信息交互、执行过程等内容，与本申请中图12或图13对应的各个方法实施例基于同一构思，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

接下来介绍本申请实施例提供的一种第一终端设备，请参阅图18，图18为本申请实施例提供的第一终端设备的一种结构示意图。具体的，第一终端设备1800包括：接收器1801、发射器1802、处理器1803和存储器1804(其中第一终端设备1800中的处理器1803的数量可以一个或多个，图18中以一个处理器为例)，其中，处理器1803可以包括应用处理器18031和通信处理器18032。在本申请的一些实施例中，接收器1801、发射器1802、处理器1803和存储器1804可通过总线或其它方式连接。

存储器1804可以包括只读存储器和随机存取存储器，并向处理器1803提供指令和数据。存储器1804的一部分还可以包括非易失性随机存取存储器(non-volatile random access memory，NVRAM)。存储器1804存储有处理器和操作指令、可执行模块或者数据结构，或者它们的子集，或者它们的扩展集，其中，操作指令可包括各种操作指令，用于实现各种操作。

处理器1803控制第一终端设备的操作。具体的应用中，第一终端设备的各个组件通过总线系统耦合在一起，其中总线系统除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图中将各种总线都称为总线系统。

上述本申请实施例揭示的方法可以应用于处理器1803中，或者由处理器1803实现。处理器1803可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器1803中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1803可以是通用处理器、数字信号处理器(digital signal processing，DSP)、微处理器或微控制器，还可进一步包括专用集成电路(application specific integrated circuit，ASIC)、现场可编程门阵列(field-programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。该处理器1803可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1804，处理器1803读取存储器1804中的信息，结合其硬件完成上述方法的步骤。

接收器1801可用于接收输入的数字或字符信息，以及产生与第一终端设备的相关设置以及功能控制有关的信号输入。发射器1802可用于通过第一接口输出数字或字符信息；发射器1802还可用于通过第一接口向磁盘组发送指令，以修改磁盘组中的数据；发射器1802还可以包括显示屏等显示设备。

本申请实施例中，在一种情况下，处理器1803用于执行图3至图11对应的各个方法实施例中的第一终端设备执行的步骤。需要说明的是，处理器1803执行前述各个步骤的具体方式，与本申请中图3至图11对应的各个方法实施例基于同一构思，其带来的技术效果与本申请中图3至图11对应的各个方法实施例相同，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

在另一种情况下，处理器1803用于执行图12或图13对应的各个方法实施例中的第一终端设备执行的步骤。需要说明的是，处理器1803执行前述各个步骤的具体方式，与本申请中图12或图13对应的各个方法实施例基于同一构思，其带来的技术效果与本申请中图12或图13对应的各个方法实施例相同，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

本申请实施例还提供了一种服务器，请参阅图19，图19是本申请实施例提供的服务器一种结构示意图，具体的，服务器1900由一个或多个服务器实现，服务器1900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，CPU)1922(例如，一个或一个以上处理器)和存储器1932，一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中，存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1922可以设置为与存储介质1930通信，在服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926，一个或一个以上有线或无线网络接口1950，一个或一个以上输入输出接口1958，和/或，一个或一个以上操作系统1941，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

本申请实施例中，在一种情况下，中央处理器1922用于执行图3至图11对应的各个实施例中的服务器执行的步骤。需要说明的是，中央处理器1922执行前述各个步骤的具体方式，与本申请中图3至图11对应的各个方法实施例基于同一构思，其带来的技术效果与本申请中图3至图11对应的各个方法实施例相同，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

在另一种情况下，中央处理器1922用于执行图12或图13对应的各个实施例中的服务器执行的步骤。需要说明的是，中央处理器1922执行前述各个步骤的具体方式，与本申请中图12或图13对应的各个方法实施例基于同一构思，其带来的技术效果与本申请中图12或图13对应的各个方法实施例相同，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

本申请实施例中还提供一种包括计算机程序产品，当其在计算机上运行时，使得计算机执行如前述图3至图11所示实施例描述的方法中第一终端设备所执行的步骤，或者，使得计算机执行如前述图3至图11所示实施例描述的方法中服务器所执行的步骤，或者，使得计算机执行如前述图12或图13所示实施例描述的方法中第一终端设备所执行的步骤，或者，使得计算机执行如前述图12或图13所示实施例描述的方法中服务器所执行的步骤。

本申请实施例中还提供一种计算机可读存储介质，该计算机可读存储介质中存储有用于进行信号处理的程序，当其在计算机上运行时，使得计算机执行如前述图3至图11所示实施例描述的方法中第一终端设备所执行的步骤，或者，使得计算机执行如前述图3至图11所示实施例描述的方法中服务器所执行的步骤，或者，使得计算机执行如前述图12或图13所示实施例描述的方法中第一终端设备所执行的步骤，或者，使得计算机执行如前述图12或图13所示实施例描述的方法中服务器所执行的步骤。

本申请实施例中还提供一种数据处理系统，该数据处理系统可以包括第一终端设备和服务器，该第一终端设备为图18所示实施例描述的第一终端设备，该服务器为图19所示实施例描述的服务器。

本申请实施例提供的数据处理装置具体可以为芯片，芯片包括：处理单元和通信单元，所述处理单元例如可以是处理器，所述通信单元例如可以是输入/输出接口、管脚或电路等。该处理单元可执行存储单元存储的计算机执行指令，以使芯片执行上述图12或图13所示实施例描述的数据处理方法，或者，以使芯片执行上述图3至图11所示实施例描述的数据处理方法。可选地，所述存储单元为所述芯片内的存储单元，如寄存器、缓存等，所述存储单元还可以是所述无线接入设备端内的位于所述芯片外部的存储单元，如只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)等。

具体的，请参阅图20，图20为本申请实施例提供的芯片的一种结构示意图，所述芯片可以表现为神经网络处理器NPU 200，NPU 200作为协处理器挂载到主CPU(Host CPU)上，由Host CPU分配任务。NPU的核心部分为运算电路2003，通过控制器2004控制运算电路2003提取存储器中的矩阵数据并进行乘法运算。

在一些实现中，运算电路2003内部包括多个处理单元(Process Engine，PE)。在一些实现中，运算电路2003是二维脉动阵列。运算电路2003还可以是一维脉动阵列或者能够执行例如乘法和加法这样的数学运算的其它电子线路。在一些实现中，运算电路2003是通用的矩阵处理器。

举例来说，假设有输入矩阵A，权重矩阵B，输出矩阵C。运算电路从权重存储器2002中取矩阵B相应的数据，并缓存在运算电路中每一个PE上。运算电路从输入存储器2001中取矩阵A数据与矩阵B进行矩阵运算，得到的矩阵的部分结果或最终结果，保存在累加器(accumulator)2008中。

统一存储器2006用于存放输入数据以及输出数据。权重数据直接通过存储单元访问控制器(Direct Memory Access Controller，DMAC)2005，DMAC被搬运到权重存储器2002中。输入数据也通过DMAC被搬运到统一存储器2006中。

BIU为Bus Interface Unit即，总线接口单元2010，用于AXI总线与DMAC和取指存储器(Instruction Fetch Buffer，IFB)2009的交互。

总线接口单元2010(Bus Interface Unit，简称BIU)，用于取指存储器2009从外部存储器获取指令，还用于存储单元访问控制器2005从外部存储器获取输入矩阵A或者权重矩阵B的原数据。

DMAC主要用于将外部存储器DDR中的输入数据搬运到统一存储器2006或将权重数据搬运到权重存储器2002中或将输入数据数据搬运到输入存储器2001中。

向量计算单元2007包括多个运算处理单元，在需要的情况下，对运算电路的输出做进一步处理，如向量乘，向量加，指数运算，对数运算，大小比较等等。主要用于神经网络中非卷积/全连接层网络计算，如Batch Normalization(批归一化)，像素级求和，对特征平面进行上采样等。

在一些实现中，向量计算单元2007能将经处理的输出的向量存储到统一存储器2006。例如，向量计算单元2007可以将线性函数和/或非线性函数应用到运算电路2003的输出，例如对卷积层提取的特征平面进行线性插值，再例如累加值的向量，用以生成激活值。在一些实现中，向量计算单元2007生成归一化的值、像素级求和的值，或二者均有。在一些实现中，处理过的输出的向量能够用作到运算电路2003的激活输入，例如用于在神经网络中的后续层中的使用。

控制器2004连接的取指存储器(instruction fetch buffer)2009，用于存储控制器2004使用的指令；

统一存储器2006，输入存储器2001，权重存储器2002以及取指存储器2009均为On-Chip存储器。外部存储器私有于该NPU硬件架构。

其中，在图3至图13所对应的实施例中，第一终端设备和服务器上均部署有目标神经网络中的至少一个神经网络层，目标神经网络中的神经网络层的运算可以由运算电路2003或向量计算单元2007执行。

其中，上述任一处提到的处理器，可以是一个通用中央处理器，微处理器，ASIC，或一个或多个用于控制上述第一方面方法的程序执行的集成电路。

另外需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本申请提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、U盘、移动硬盘、ROM、RAM、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(Solid State Disk，SSD))等。

Claims

一种数据处理方法，其特征在于，所述方法应用于数据处理的系统，所述数据处理的系统包括第一终端设备和服务器，所述第一终端设备上部署第一神经网络和第三神经网络，所述服务器上部署第二神经网络，所述方法包括：

所述第一终端设备将待处理数据输入所述第一神经网络，得到所述第一神经网络生成的第一中间结果，将所述第一中间结果发送至所述服务器；

所述服务器将所述第一中间结果输入所述第二神经网络，得到所述第二神经网络生成的第二中间结果，将所述第二中间结果发送至所述终端设备；

所述第一终端设备将所述第二中间结果输入所述第三神经网络，得到所述第三神经网络生成的与所述待处理数据对应的预测结果；

其中，所述第一神经网络、所述第二神经网络和所述第三神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，所述第一终端设备上部署的神经网络存在如下变化：所述第一神经网络中的神经网络层的数量发生改变，或者，所述第三神经网络中的神经网络层的数量发生改变。
根据权利要求1所述的方法，其特征在于，在所述第一时刻，所述第一神经网络包括N个神经网络层，所述第三神经网络包括S个神经网络层，在所述第二时刻，所述第一神经网络包括n个神经网络层，所述第三神经网络包括s个神经网络层，其中，所述N和所述n不同和/或所述S和所述s不同，所述方法还包括：

所述服务器向所述第一终端设备发送所述n个神经网络层和所述s个神经网络层。
根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

所述服务器从所述目标神经网络中确定所述第一神经网络和所述第三神经网络，其中，所述第一神经网络和所述第三神经网络的确定因素包括：所述第一终端设备的处理器资源的占用量和/或所述第一终端设备的内存资源的占用量。
根据权利要求1或2所述的方法，其特征在于，所述数据处理的系统还包括第二终端设备，所述第一终端设备上部署的第一神经网络和所述第二终端设备上部署的第一神经网络中的神经网络层的数量不同，和/或，所述第一终端设备上部署的第三神经网络和所述第二终端设备上部署的第三神经网络中的神经网络层的数量不同；

其中，所述第一终端设备和所述第二终端设备为不同类型的终端设备，和/或，所述第一终端设备和所述第二终端设备为同一类型中不同型号的终端设备。
根据权利要求1或2所述的方法，其特征在于，

所述第一终端设备通过所述第一神经网络和所述第三神经网络进行数据处理的过程中所占用的处理器资源小于所述服务器通过所述第二神经网络进行数据处理的过程中所占用的处理器资源，且，所述第一终端设备通过所述第一神经网络和所述第三神经网络进行数据处理的过程中所占用的内存资源小于所述服务器通过所述第二神经网络进行数据处理的过程中所占用的内存资源。
根据权利要求1或2所述的方法，其特征在于，所述待处理数据为如下任一种数据：声音数据、脸部的图像数据、指纹数据或耳部的轮廓数据。
一种数据处理方法，其特征在于，所述方法应用于数据处理的系统，所述数据处理的系统包括第一终端设备和服务器，所述第一终端设备上部署第一神经网络，所述服务器上部署第二神经网络，所述方法包括：

所述第一终端设备将待处理数据输入所述第一神经网络，得到所述第一神经网络生成的第一中间结果，将所述第一中间结果发送至所述服务器；

所述服务器将所述第一中间结果输入所述第二神经网络，得到所述第二神经网络生成的与所述待处理数据对应的预测结果；

其中，所述第一神经网络和所述第二神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，所述第一终端设备上部署的第一神经网络中的神经网络层的数量发生改变。
根据权利要求7所述的方法，其特征在于，在所述第一时刻，所述第一神经网络包括N个神经网络层，在所述第二时刻，所述第一神经网络包括n个神经网络层，所述N和所述n不同，所述方法还包括：

所述服务器向所述第一终端设备发送所述n个神经网络层。
根据权利要求7或8所述的方法，其特征在于，所述数据处理的系统还包括第二终端设备，所述第一终端设备上部署的第一神经网络和所述第二终端设备上部署的第一神经网络中的神经网络层的数量不同；

其中，所述第一终端设备和所述第二终端设备为不同类型的终端设备，和/或，所述第一终端设备和所述第二终端设备为同一类型中不同型号的终端设备。
一种数据处理方法，其特征在于，所述方法应用于第一终端设备，所述第一终端设备包含于数据处理的系统，所述数据处理的系统还包括服务器，所述第一终端设备上部署第一神经网络和第三神经网络，所述服务器上部署第二神经网络，所述方法包括：

将待处理数据输入所述第一神经网络，得到所述第一神经网络生成的第一中间结果；

将所述第一中间结果发送至所述服务器，所述第一中间结果用于供所述服务器利用所述第二神经网络得到第二中间结果；

接收所述服务器发送的所述第二中间结果，将所述第二中间结果输入所述第三神经网络，得到所述第三神经网络生成的与所述待处理数据对应的预测结果；

其中，所述第一神经网络、所述第二神经网络和所述第三神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，所述第一终端设备上部署的神经网络存在如下变化：所述第一神经网络中的神经网络层的数量发生改变，或者，所述第三神经网络中的神经网络层的数量发生改变。
一种数据处理方法，其特征在于，所述方法应用于服务器，所述服务器包含于数据处理的系统，所述数据处理的系统还包括第一终端设备，所述第一终端设备上部署第一神经网络和第三神经网络，所述服务器上部署第二神经网络，所述方法包括：

接收所述第一终端设备发送的第一中间结果，所述第一中间结果基于待处理数据和所述第一神经网络得到；

将所述第一中间结果输入所述第二神经网络，得到所述第二神经网络生成的第二中间结果；

将所述第二中间结果发送至所述第一终端设备，所述第二中间结果用于供所述第一终端设备利用所述第三神经网络得到与所述待处理数据对应的预测结果；

其中，所述第一神经网络、所述第二神经网络和所述第三神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，所述第一终端设备上部署的神经网络存在如下变化：所述第一神经网络中的神经网络层的数量发生改变，或者，所述第三神经网络中的神经网络层的数量发生改变。
一种数据处理方法，其特征在于，所述方法应用于第一终端设备，所述第一终端设备包含于数据处理的系统，所述数据处理的系统还包括服务器，所述第一终端设备上部署第一神经网络，所述服务器上部署第二神经网络，所述方法包括：

将待处理数据输入所述第一神经网络，得到所述第一神经网络生成的第一中间结果；

将所述第一中间结果发送至所述服务器，所述第一中间结果用于供所述服务器利用所述第二神经网络得到与所述待处理数据对应的预测结果；

其中，所述第一神经网络和所述第二神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，所述第一终端设备上部署的第一神经网络中的神经网络层的数量发生改变。
一种数据处理方法，其特征在于，所述方法应用于服务器，所述服务器包含于数据处理的系统，所述数据处理的系统还包括第一终端设备，所述第一终端设备上部署第一神经网络，所述服务器上部署第二神经网络，所述方法包括：

接收所述第一终端设备发送的第一中间结果，所述第一中间结果基于待处理数据和所述N个第一中间结果得到；

将所述第一中间结果输入所述第二神经网络，得到所述第二神经网络生成的与所述待处理数据对应的预测结果；

其中，所述第一神经网络和所述第二神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，所述第一终端设备上部署的第一神经网络中的神经网络层的数量发生改变。
一种数据处理装置，其特征在于，所述数据处理装置部署于第一终端设备上，所述第一终端设备包含于数据处理的系统，所述数据处理的系统还包括服务器，所述第一终端设备上部署第一神经网络和第三神经网络，所述服务器上部署第二神经网络，所述装置包括：

输入模块，用于将待处理数据输入所述第一神经网络，得到所述第一神经网络生成的第一中间结果；

发送模块，用于将所述第一中间结果发送至所述服务器，所述第一中间结果用于供所述服务器利用所述第二神经网络得到第二中间结果；

接收模块，用于接收所述服务器发送的所述第二中间结果；

所述输入模块，还用于将所述第二中间结果输入所述第三神经网络，得到所述第三神经网络生成的与所述待处理数据对应的预测结果；

其中，所述第一神经网络、所述第二神经网络和所述第三神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，所述第一终端设备上部署的神经网络存在如下变化：所述第一神经网络中的神经网络层的数量发生改变，或者，所述第三神经网络中的神经网络层的数量发生改变。
根据权利要求14所述的装置，其特征在于，在所述第一时刻，所述第一神经网络包括N个神经网络层，所述第三神经网络包括S个神经网络层，在所述第二时刻，所述第一神经网络包括n个神经网络层，所述第三神经网络包括s个神经网络层，其中，所述N和所述n不同和/或所述S和所述s不同；

所述接收模块，还用于接收所述服务器发送的所述n个神经网络层和所述s个神经网络层。
一种数据处理装置，其特征在于，所述数据处理装置部署于服务器，所述服务器包含于数据处理的系统，所述数据处理的系统还包括第一终端设备，所述第一终端设备上部署第一神经网络和第三神经网络，所述服务器上部署第二神经网络，所述装置包括：

接收模块，用于接收所述第一终端设备发送的第一中间结果，所述第一中间结果基于待处理数据和所述第一神经网络得到；

输入模块，用于将所述第一中间结果输入所述第二神经网络，得到所述第二神经网络生成的第二中间结果；

发送模块，用于将所述第二中间结果发送至所述第一终端设备，所述第二中间结果用于供所述第一终端设备利用所述第三神经网络得到与所述待处理数据对应的预测结果；

其中，所述第一神经网络、所述第二神经网络和所述第三神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，所述第一终端设备上部署的神经网络存在如下变化：所述第一神经网络中的神经网络层的数量发生改变，或者，所述第三神经网络中的神经网络层的数量发生改变。
根据权利要求16所述的装置，其特征在于，在所述第一时刻，所述第一神经网络包括N个神经网络层，所述第三神经网络包括S个神经网络层，在所述第二时刻，所述第一神经网络包括n个神经网络层，所述第三神经网络包括s个神经网络层，其中，所述N和所述n不同和/或所述S和所述s不同；

所述发送模块，还用于向所述第一终端设备发送所述n个神经网络层和所述s个神经网络层。
一种数据处理装置，其特征在于，所述数据处理装置部署于第一终端设备，所述第一终端设备包含于数据处理的系统，所述数据处理的系统还包括服务器，所述第一终端设备上部署第一神经网络，所述服务器上部署第二神经网络，所述装置包括：

输入模块，用于将待处理数据输入所述第一神经网络，得到所述第一神经网络生成的第一中间结果；

发送模块，用于将所述第一中间结果发送至所述服务器，所述第一中间结果用于供所述服务器利用所述第二神经网络得到与所述待处理数据对应的预测结果；

其中，所述第一神经网络和所述第二神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，所述第一终端设备上部署的第一神经网络中的神经网络层的数量发生改变。
根据权利要求18所述的装置，其特征在于，在所述第一时刻，所述第一神经网络包括N个神经网络层，在所述第二时刻，所述第一神经网络包括n个神经网络层，所述N和所述n不同；

所述装置还包括接收模块，用于接收所述服务器发送的所述第一神经网络。
一种数据处理装置，其特征在于，所述数据处理装置部署于服务器，所述服务器包含于数据处理的系统，所述数据处理的系统还包括第一终端设备，所述第一终端设备上部署第一神经网络，所述服务器上部署第二神经网络，所述装置包括：

接收模块，用于接收所述第一终端设备发送的第一中间结果，所述第一中间结果基于待处理数据和所述N个第一中间结果得到；

输入模块，用于将所述第一中间结果输入所述第二神经网络，得到所述第二神经网络生成的与所述待处理数据对应的预测结果；

其中，所述第一神经网络和所述第二神经网络组成目标神经网络，在第一时刻和第二时刻这两个不同的时刻，所述第一终端设备上部署的第一神经网络中的神经网络层的数量发生改变。
根据权利要求20所述的装置，其特征在于，在所述第一时刻，所述第一神经网络包括N个神经网络层，在所述第二时刻，所述第一神经网络包括n个神经网络层，所述N和所述n不同；

所述装置还包括：发送模块，用于向所述终端设备发送所述n个神经网络层。
一种终端设备，其特征在于，包括处理器和存储器，所述处理器与所述存储器耦合，

所述存储器，用于存储程序；

所述处理器，用于执行所述存储器中的程序，使得所述终端设备执行如权利要求1至9、权利要求10或权利要求12任一项所述的方法中终端设备执行的步骤。
一种服务器，其特征在于，包括处理器和存储器，所述处理器与所述存储器耦合，

所述存储器，用于存储程序；

所述处理器，用于执行所述存储器中的程序，使得所述服务器执行如权利要求1至9、权利要求11或权利要求13任一项所述的方法中服务器执行的步骤。
一种数据的处理系统，其特征在于，所述数据的处理系统包括终端设备和服务器，所述终端设备用于执行如权利要求1至6任一项所述的方法中终端设备执行的步骤，所述服务器用于执行如权利要求1至6任一项所述的方法中服务器执行的步骤；或者，

所述终端设备用于执行如权利要求7至10任一项所述的方法中终端设备执行的步骤，所述服务器用于执行如权利要求7至10任一项所述的方法中服务器执行的步骤。
一种计算机程序产品，其特征在于，所述计算机程序产品包括程序，当所述程序在计算机上运行时，使得计算机执行如权利要求1至9、权利要求10或权利要求12中任意一项所述的方法中终端设备执行的步骤，或者，使得计算机执行如权利要求1至9、权利要求11或权利要求13中任意一项所述的方法中服务器执行的步骤。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有程序，当所述程序在计算机上运行时，使得计算机执行如权利要求1至9、权利要求10或权利要求12中任意一项所述的方法中终端设备执行的步骤，或者，使得计算机执行如权利要求1至9、权利要求11或权利要求13中任意一项所述的方法中服务器执行的步骤。