WO2024041117A1

WO2024041117A1 - 一种计算任务的分割方法及相关装置

Info

Publication number: WO2024041117A1
Application number: PCT/CN2023/100037
Authority: WO
Inventors: 曹佑龙; 秦熠; 陈二凯; 徐瑞
Original assignee: 华为技术有限公司
Priority date: 2022-08-24
Filing date: 2023-06-13
Publication date: 2024-02-29
Also published as: CN117632463A

Abstract

一种计算任务的分割方法及相关装置，可应用于扩展现实XR业务或其他低时延业务。该方法包括：获取终端设备与第一计算任务对应的传输数据量和计算量，该第一计算任务是基于分割点对神经网络模型的计算任务分割的；基于该传输数据量、计算量，及终端设备与无线接入网设备之间的信道状态，确定该分割点为目标分割点；向终端设备发送指示信息，该指示信息用于指示该目标分割点。该方法可以由网络设备执行，如无线接入网设备，由于该网络设备可以实时地获取终端设备与无线接入网设备之间的信道状态，故可以根据信道状态的变化，及时有效地调整目标分割点，从而可以合理地对计算任务进行分割，满足不同需求，提升用户体验。

Description

一种计算任务的分割方法及相关装置

本申请要求于2022年08月24日提交中国专利局、申请号为202211020380.6、申请名称为“一种计算任务的分割方法及相关装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及通信领域，并且更具体地，涉及一种计算任务的分割方法及相关装置。

背景技术

随着技术的发展，人工智能(artificial intelligence，AI)在诸多业务(例如扩展现实(extended reality，XR)、无人驾驶、远程医疗等业务)得到越来越广泛的应用。

以XR业务为例，XR终端可以上行传输图像或视频给服务器，服务器可以使用例如深度神经网络(deep neural network，DNN)模型等神经网络模型，对图像或视频中的内容进行目标检测和识别。为了减少XR终端上传的数据量，XR终端可以对待上传的图像或视频进行预处理，将预处理得到的数据上传服务器。而神经网络模型中包括了多个神经网络层，若由XR终端进行预处理，则需要对该神经网络模型对应的计算任务进行分割。

如何合理地对神经网络模型的计算任务进行分割，成为一项亟待解决的技术问题。

发明内容

本申请提供了一种计算任务的分割方法及相关装置，以期合理地对神经网络模型的计算任务进行分割。

第一方面，本申请提供了一种计算任务的分割方法，该方法可应用于无线接入网设备，例如基站、接入点等。该方法可以由无线接入网设备执行，或者，也可以由配置在无线接入网设备中的部件(如芯片、芯片系统、处理器等)执行，或者，还可以由能实现全部或部分网络设备功能的逻辑模块或软件实现，本申请对此不作限定。

该方法包括：获取终端设备与第一计算任务对应的传输数据量和计算量，该第一计算任务是基于分割点对神经网络模型的计算任务进行分割得到的；基于传输数据量、计算量，以及终端设备与无线接入网设备之间的信道状态，确定该分割点为目标分割点；向该终端设备发送指示信息，该指示信息指示目标分割点。

其中，计算任务可以基于业务而定义，业务不同，计算任务也不同。计算任务可以通过神经网络模型来执行。

分割点用于对神经网络模型的计算任务进行分割，一个分割点可以将神经网络模型的计算任务分割成两个计算任务。分割点对神经网络模型的计算任务进行分割可以这样理解：由于神经网络模型包括多个神经网络层，分割点可以位于在多个神经网络层中的任意两个相邻的神经网络层之间，以该分割点为节点，将该多个神经网络层分成两个部分，每个部分都包括一个或多个神经网络层。每个部分所包括的一个或多个神经网络层对应的计算任务也就是对神经网络模型的计算任务分割后得到的两个计算任务。

可以理解，该神经网络模型的计算任务也可以被分割为更多个计算任务，例如可以使用两个或两个以上的分割点来分割，具体过程如上所述，不再赘述。

在本申请中，分割点可用于将神经网络模型的计算任务分割成两个计算任务，以使得该两个计算任务被分配给不同的设备来执行。随着分割点的位置变化，被分割得到的两个计算任务也随之变化。为了找到合理的分割点，可以从神经网络模型的不同位置对其进行分割，以满足不同的需求。本文中为了便于区分和说明，将被确定来用于对某一业务的计算任务进行分割的分割点记为目标分割点，并假设第一计算任务所对应的分割点为目标分割点。

为方便区分和说明，将基于目标分割点对神经网络模型的计算任务进行分割后得到的两个计算任务分别记为第一计算任务和第二计算任务，第一计算任务是分配给终端设备的计算任务。该目标分割点可以基于第一计算任务对应的传输数据量、计算量以及该终端设备与无线接入网设备之间的信道状态来确定。

其中，传输数据量可以是指由终端设备执行某一计算任务(如第一计算任务)后得到的、需传输给另一设备(如后文所述的第一设备)的数据的大小，可通过比特、字节等量纲来描述。计算量可以是指终端设备执行某一计算任务(如第一计算任务)需要进行的浮点运算的次数，可通过浮点运算次数等参数来描述。该终端设备与无线接入网设备之间的信道状态可通过信干噪比(signal to interference and noise ratio，SINR)、参考信号接收功率(reference signal receiving power，RSRP)、信道质量指示(channel quality indicator，CQI)等参数来描述，基于终端设备与无线接入网设备之间的信道状态，可以确定使用该信道进行数据传输的传输速率。

应理解，基于第一计算任务对应的传输数据量、计算量以及该终端设备与无线接入网设备之间的信道状态来确定目标分割点，并不代表仅基于第一计算任务对应的传输数据量、计算量以及该终端设备与无线接入网设备之间的信道状态来确定目标分割点。如前所述，随着分割点的位置变化，被分割得到的两个计算任务也随之变化。因此，一种可能的实现方式是，无线接入网设备可以根据不同位置的分割点，分别获取到由不同位置分割点分割得到的、与终端设备的计算任务对应的传输数据量、计算量及信道状态来确定目标分割点。可以理解，若上述用于分割得到第一计算任务的分割点为目标分割点，那么该目标分割点的确定过程离不开该第一计算任务对应的传输数据量、计算量以及信道状态等因素。

由于无线接入网设备可以基于终端设备与第一计算任务对应的传输数据量、计算量、以及终端设备与无线接入网设备之间的信道状态，来确定目标分割点，可以从传输、计算的功耗，以及传输、计算的时延等多个角度来予以分析，从而根据不同的需求，合理地确定出目标分割点。由于无线接入网设备可以实时地获取到终端设备与无线接入网设备之间的信道状态，对信道状态的变化的感知可以达到毫秒级，因此可以更及时有效地根据信道状态的变化来调整目标分割点，使得目标分割点可以随着信道状态的变化而调整。

例如，在对时延、可靠性要求较高的业务中，使用该方案可以减少传输时延，提高传输可靠性。例如在XR业务中，可以减少卡顿，又例如在自动驾驶、远程医疗业务中可以通过减少时延、提高传输可靠性等来提高自动驾驶、远程医疗的安全性。

又例如，在对功耗较敏感的业务或使用了对功耗较敏感的终端设备的业务中，使用该方法可以节省终端设备的功耗。

此外，由于无线接入网设备可以全面地获取到其覆盖范围内终端设备的情况，比如同一小区中多个终端设备的之间的干扰，同一小区中多个终端设备同时进行传输业务所需的带宽等。无线接入网设备可控制终端设备传输数据的功耗，因此也可以通过目标分割点的合理选取，来降低功耗和干扰，满足对功耗要求较高的业务的需求；无线接入网设备还可以考虑小区内的总带宽，根据模型分割点的速率要求，调整终端设备的传输功耗，实现系统级的业务最优传输。

综上可以看到，使用本申请提供的方法，可以合理地选择目标分割点，满足不同的需求，提升用户体验。

下文示例性地提供了获取终端设备与第一计算任务对应的传输数据量和计算量的几种可能的实现方式。

在第一种可能的实现方式中，所述获取终端设备与第一计算任务对应的传输数据量和计算量，包括：接收来自所述终端设备的第一信息，所述第一信息指示所述传输数据量和所述计算量。

即，无线接入网设备可以直接从终端设备获取与第一计算任务对应的传输数据量和计算量。

在第二种可能的实现方式中，所述获取终端设备与第一计算任务对应的传输数据量和计算量，包括：接收来自第一设备的第二信息，所述第二信息指示所述传输数据量和所述计算量，所述第一设备为另一终端设备或服务器。

其中，第一设备可以是用于执行上述第二计算任务的设备。在不同的网络架构中，第一设备可以是不同的设备。例如在终端设备、网络与服务器组成的网络架构中，该第一设备可以是服务器，在终端设备、网络与终端设备组成的网络架构中，该第一设备可以是另一终端设备。

无线接入网设备也可以从第一设备获取与第一计算任务对应的传输数据量和计算量。由于第一设备用于执行第二计算任务，它可以预先配置或构建该神经网络模型，故也就可以获知第一计算任务所对应的神经网络层，因此也就可以获知与第一计算任务对应的传输数据量和计算量。

在第三种可能的实现方式中，所述获取终端设备与第一计算任务对应的传输数据量和计算量，包括：接收来自第一设备的第三信息，所述第三信息指示第一设备与第二计算任务对应的传输数据量和计算量，所述第一设备为另一终端设备或服务器；基于所述第三信息，确定与所述第一计算任务对应的传输数据量和计算量；其中，所述第一计算任务和所述第二计算任务是基于所述分割点对所述神经网络模型的计算任务分割得到的。

无线接入网设备也可以从第一设备获取与第二计算任务对应的传输数据量和计算量。由于第一设备用于执行第二计算任务，它可以预先配置或构建该神经网络模型，故也就可以获知与第二计算任务对应的传输数据量和计算量。无线接入网设备可以根据该神经网络模型，以及从第一设备接收到的与第二计算任务对应的传输数据量和计算量，推断出与第一计算任务对应的传输数据量和计算量。

如前所述，无线接入网设备可以根据不同位置的分割点，分别获取到由分割点分割得到的、与终端设备的计算任务对应的传输数据量、计算量及信道状态来确定目标分割点。在这种实现方式中，无线接入网设备可以基于上文所提供的三种可能的实现方式，来获取由不同位置的分割点分割得到的、与终端设备的计算任务分别对应的传输数据量和计算量。

结合第一方面，在第一方面的某些可能的实现方式中，所述目标分割点基于时延或功耗中的至少一项确定；其中，时延为所述终端设备执行第一计算任务所需的时间；功耗为所述终端设备执行第一计算任务所需的功耗。

其中，时延包括计算时延和传输时延。计算时延为终端设备完成第一计算任务的计算量所需的时间，传输时延为终端设备传输由第一计算任务所得到的数据所需的时间。计算时延可以根据第一计算任务的计算量以及终端设备的计算能力确定。传输时延可以根据第一计算任务的传输数据量以及终端设备与无线接入网设备之间的信道状态确定，如，可以根据第一计算任务的传输数据量以及终端设备与无线接入网设备之间的传输速率来确定。

终端设备执行第一计算任务所需的功耗包括：终端设备执行第一计算任务所需的计算功耗和传输功耗。计算功耗可以根据第一计算任务的计算量确定，如，与计算量成正比。传输功耗可以根据第一计算任务的传输数据量以及终端设备与无线接入网设备之间的信道状态确定。

无线接入网设备可以基于时延来确定目标分割点，以使得基于目标分割点分割得到的两个计算任务分别分配给终端设备和第一设备执行时所带来的时延满足某一预设条件。无线接入网设备也可以基于功耗来确定目标分割点，以使得基于目标分割点分割得到的两个计算任务分别分配给终端设备和第一设备执行时所带来的功耗满足另一预设条件。无线接入网设备也可以综合考虑时延和功耗来确定目标分割点，以使得基于目标分割点分割得到的两个计算任务分别分配给终端设备和第一设备执行时所带来的时延和功耗满足又一预设条件。无线接入网设备基于时延，还是功耗，还是时延和功耗来确定目标分割点，可以视需求而定。

可选地，所述目标分割点基于所述时延确定；所述基于所述传输数据量、所述计算量，以及所述终端设备与无线接入网设备之间的信道状态，确定所述分割点为目标分割点，包括：基于所述终端设备的算力信息、所述传输数据量、所述计算量，以及所述信道状态，确定所述时延；基于所述时延，确定所述分割点为所述目标分割点。

如前所述，时延包括计算时延和传输时延，计算时延可以根据终端设备的算力信息和计算量确定，传输时延可以根据传输数据量和信道状态确定。因此，无线接入网设备可以基于终端设备的算力信息、传输数据量、所述计算量，以及信道状态，确定时延，进而基于时延确定目标分割点。

基于时延确定目标分割点的一种可能的实现方式是，若基于某一分割点确定的计算任务(如第一计算任务)的时延低于某一预设门限(为便于区分和说明，记为第一预设门限)，则将该计算任务对应的分割点确定为目标分割点。

基于时延确定目标分割点的另一种可能的实现方式是，基于不同的分割点对神经网络模型的计算任务进行分割，得到对应于不同分割点的计算任务，将其中时延最低的计算任务(如第一计算任务)对应的分割点确定为目标分割点。

在对时延、可靠性要求较高的业务中，基于时延来确定目标分割点，可以减少传输时延，提高传输可靠性。例如在XR业务中，可以减少卡顿，又例如在自动驾驶、远程医疗业务中可以通过减少时延、提高传输可靠性等来提高自动驾驶、远程医疗的安全性。

可选地，所述目标分割点基于所述功耗确定；所述基于所述传输数据量、所述计算量，以及所述终端设备与无线接入网设备之间的信道状态，确定所述分割点为目标分割点，包括：基于所述传输数据量、所述计算量，以及所述信道状态，确定所述功耗；基于所述功耗，确定所述分割点为所述目标分割点。

如前所述，功耗包括计算功耗和传输功耗，计算功耗可以根据计算量确定，传输功耗可以根据传输数据量和信道状态确定。因此，无线接入网设备可以基于传输数据量、所述计算量，以及信道状态，确定功耗，进而基于功耗确定目标分割点。

基于功耗确定目标分割点的一种可能的实现方式是，若基于某一分割点确定的计算任务(如第一计算任务)的功耗低于某一预设门限(为便于区分和说明，记为第二预设门限)，则将该计算任务对应的分割点确定为目标分割点。

基于功耗确定目标分割点的另一种可能的实现方式是，基于不同的分割点对神经网络模型的计算任务进行分割，得到对应于不同分割点的计算任务，将其中功耗最低的计算任务(如第一计算任务)对应的分割点确定为目标分割点。

在对功耗较敏感的业务或使用了对功耗较敏感的终端设备的业务中，基于功耗来确定目标分割点可以节省终端设备的功耗。并且，无线接入网设备可以通过控制终端设备的传输功耗，减少多个终端设备之间的相互干扰，还可进一步基于小区内的总带宽，实现系统级的业务传输最优。

可选地，所述目标分割点基于所述时延和所述功耗确定；所述基于所述传输数据量、所述计算量，以及所述终端设备与无线接入网设备之间的信道状态，确定所述分割点为目标分割点，包括：基于所述终端设备的算力信息、所述传输数据量、所述计算量，以及所述信道状态，确定所述时延和所述功耗；基于所述时延和所述功耗，确定所述分割点为所述目标分割点。

一种可能的设计是，将时延和功耗分别施加不同的权重，以获得时延和功耗的加权和。无线接入网设备可以基于时延和功耗的加权和，来确定目标分割点。

基于时延和功耗的加权和，确定目标分割点的一种可能的实现方式是，若基于某一分割点确定的计算任务(如第一计算任务)的时延和功耗的加权和低于某一预设门限(为便于区分和说明，记为第三预设门限)，则将该计算任务对应的分割点确定为目标分割点。

基于时延和功耗的加权和，确定目标分割点的另一种可能的实现方式是，基于不同的分割点对神经网络模型的计算任务进行分割，得到对应于不同分割点的计算任务，将其中时延和功耗的加权和最低的计算任务(如第一计算任务)对应的分割点确定为目标分割点。

无线接入网设备可以同时兼顾时延和功耗，对时延和功耗施加不同的权重来确定目标分割点，以满足不同的需求，提升用户体验。

可以看到，计算时延与终端设备的计算能力相关，因此，在基于时延确定目标分割点，或基于时延和功耗确定目标分割点的情况下，该无线接入网设备还可以进一步获取终端设备的算力信息。该算力信息可用于表征终端设备的计算能力。

在一种可能的设计中，算力信息包括终端设备完成预定义的测试任务所需的时间或终端设备的计算能力中的至少一项。

其中，预定义的测试任务包括：基于预定义的测试神经网络模型、预定义的计算类型或预定义的输入数据中的至少一项而执行的任务。也就是说，不同的终端设备可以基于相同的测试任务进行测试，以获得不同的终端设备完成同一测试任务所需的时间，进而可以根据时间来推出不同的终端设备的计算能力。

计算能力还可以通过终端设备每秒浮点运算次数(floating-point operations per second，FLOPS)来表征。每秒浮点运算次数也就是每秒所能够执行的浮点运算次数的峰值。终端设备可以将每秒浮点运算次数上报无线接入网设备。

通过预定义测试任务，可以使得各终端设备基于同一测试任务进行测试，进而将不同终端设备的计算能力通过完成测试任务的时间予以区分，从而方便了解不同终端设备的计算能力。

终端设备上报每秒浮点运算次数的一种可能的实现方式是，直接将每秒浮点运算次数上报；终端设备上报每秒浮点运算次数的一种可能的实现方式是，将用于标识每秒浮点运算次数的信息上报。

示例性地，用于标识每秒浮点运算次数的信息可以是能力等级。不同的每秒浮点运算次数可以与不同的能力等级对应。每秒浮点运算次数与能力等级的对应关系可以是预定义的，比如协议预定义。终端设备可以根据该对应关系，将与每秒浮点运算次数对应的能力等级上报无线接入网设备。

通过定义不同的算力信息，便于无线接入网设备更全面地了解终端设备的计算能力，从而有利于合理地确定目标分割点。

可选地，该方法还包括：从终端设备接收算力信息。

通过从终端设备接收算力信息，无线接入网设备可以根据终端设备的计算能力准确地估计计算时延，进而有利于合理地确定目标分割点。

第二方面，本申请提供了一种通信装置，可以实现上述第一方面或第一方面任一种可能实现方式中的方法。该装置包括用于实现第一方面或第一方面任一种可能实现方式中的方法的模块或单元。该装置包括的单元或模块可以通过软件和/或硬件方式实现。该装置例如可以为无线接入网设备，也可以为支持无线接入网设备实现上述方法的芯片、芯片系统、或处理器等，还可以为能实现无线接入网设备的全部或部分功能的逻辑模块或软件。

第三方面，本申请提供了一种通信装置，包括处理器，可用于通过逻辑电路或执行代码指令，以实现第一方面或第一方面任一种可能实现方式中的方法。

可选地，该通信装置还包括通信接口，处理器与通信接口耦合。所述通信接口用于接收来自所述装置之外的其它通信装置的信号并传输至所述处理器，或将来自所述处理器的信号发送给所述装置之外的其它通信装置，示例性地，通信接口可以是收发器、电路、总线、模块或其它类型的通信接口。

可选地，该通信装置还包括存储器，处理器与存储器耦合。所述存储器用于保存程序指令和数据。

可选地，该通信装置为无线接入网设备，或配置在无线接入网设备中的芯片、芯片系统、或处理器。

第四方面，本申请提供了一种计算机可读存储介质，该计算机存储介质中存储有计算机程序或指令，当所述计算机程序或指令在计算机上运行时，使得上述第一方面或第一方面任一种可能实现方式中的方法被执行。

第五方面，本申请提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序(也可以称为代码，或指令)，当所述计算机程序被运行时，使得上述第一方面或第一方面任一种可能实现方式中的方法被执行。

应当理解的是，本申请的第二方面至第五方面与本申请的第一方面的技术方案相对应，各方面及对应的可行实施方式所取得的有益效果相似，不再赘述。

附图说明

图1是适用于本申请实施例提供的方法的通信系统的示意图；

图2是适用于本申请实施例提供的方法的通信系统的另一示意图；

图3是适用于本申请实施例提供的方法的通信系统的又一示意图；

图4是本申请实施例提供的神经网络模型的示意图；

图5是本申请实施例提供的计算任务的分割方法的示意性流程图；

图6和图7是本申请实施例提供的基于不同位置的分割点对神经网络模型的计算任务进行分割的示意图；

图8是本申请另一实施例提供的计算任务的分割方法的示意性流程图；

图9和图10是本申请实施例提供的通信装置的示意性框图；

图11是本申请实施例提供的基站的结构示意图。

具体实施方式

下面将结合附图，对本申请中的技术方案进行描述。

本申请提供的方法可以应用于各种通信系统，例如：长期演进(long term evolution，LTE)系统、LTE频分双工(frequency division duplex，FDD)系统、LTE时分双工(time division duplex，TDD)系统、第五代(5th generation，5G)移动通信系统或新无线接入技术(new radio access technology，NR)。其中，5G移动通信系统可以包括非独立组网(non-standalone，NSA)和/或独立组网(standalone，SA)。

本申请提供的技术方案还可以应用于机器类通信(machine type communication，MTC)、机器间通信长期演进技术(long term evolution-machine，LTE-M)、设备到设备(device-to device，D2D)网络、机器到机器(machine to machine，M2M)网络、物联网(internet of things，IoT)网络或者其他网络。其中，IoT网络例如可以包括车联网。其中，车联网系统中的通信方式统称为车到其他设备(vehicle to X，V2X，X可以代表任何事物)系统，例如，该V2X可以包括：车辆到车辆(vehicle to vehicle，V2V)通信，车辆与基础设施(vehicle to infrastructure，V2I)通信、车辆与行人之间的通信(vehicle to pedestrian，V2P)或车辆与网络(vehicle to network，V2N)通信等。

本申请提供的技术方案还可以应用于未来的通信系统，如第六代(6th Generation，6G)移动通信系统等。本申请对此不作限定。

本申请的实施例中，无线接入网(radio access network，RAN)设备可以是任意一种具有无线收发功能的设备。无线接入网设备可以是采用第三代合作伙伴计划(3^rd generation partnership project，3GPP)技术接入网络的设备，例如包括但不限于：基站 (base station)、节点B(NodeB或NB)、LTE中的演进型节点B(evolved Node B，eNB)、5G(如NR)系统中的gNB或收发点(transmission reception point，TRP)、第六代(6th generation，6G)移动通信系统中的下一代基站、未来移动通信系统中的基站等；也可以是完成基站部分功能的模块或单元，例如，可以是集中式单元(central unit，CU)，也可以是分布式单元(distributed unit，DU)。无线接入网设备还可以是宏基站、微基站、微微基站、小站、气球站、室内站、中继站、无线中继节点、无线回传节点等等。该无线接入网设备也可以是采用非3GPP技术接入网络的设备，例如包括但不限于无线保真(wireless fidelity，Wi-Fi)系统中的接入点(access point，AP)等。可以理解，本申请中的无线接入网设备的全部或部分功能也可以通过在硬件上运行的软件功能来实现，或者通过平台(例如云平台)上实例化的虚拟化功能来实现。本申请对于无线接入网设备的具体形式不作限定。

核心网设备可用于完成注册、连接、会话管理三大功能，主要包括网络开放功能(network exposure function，NEF)网元、策略控制功能(policy control function，PCF)网元、应用功能(application function，AF)网元、接入与移动性管理功能(access and mobility management function，AMF)网元、会话管理功能模块(session management function，SMF)网元以及用户平面功能(user plane function，UPF)网元等。

其中，UPF是数据网络的接口，可以完成用户面数据转发、基于会话/流级的计费统计、带宽限制等功能，用户数据可通过该网元接入到网络中。

NEF网元可用于向AF网元开放由3GPP网络功能提供的业务和能力，同时也可以让AF向3GPP网络功能提供信息。

AF网元主要传递应用侧对网络侧的需求，可视为应用服务器的代理。

SMF网元主要进行会话管理、用户设备的IP地址分配和管理、UPF选择等。

PCF网元主要进行计费策略与服务质量(quality of service，QoS)策略的策略控制等。

AMF网元主要进行移动性管理、接入鉴权/授权等功能。此外，AMF网元还可负责在终端设备与PCF间传递用户策略。

各网元之间通过接口通信。例如，NEF网元和AF网元之间的接口为N33接口。终端设备和AMF网元间的信令面接口为N1接口，由于终端设备不能直接与核心网交互，需经过接入层(access stratum，AS)透传非接入层(non-access stratum，NAS)信息。AMF向接入网(access network，AN)请求为协议数据单元(protocol data unit，PDU)会话分配资源等的信令面接口为N2接口。

上文关于核心网设备中的各个网元以及各个网元之间的接口仅为示例性说明，不应对本申请构成任何限定。

终端设备，也可以称为用户设备(user equipment，UE)、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置。

终端设备可以包括但不限于：手机(mobile phone)、平板电脑(pad)、带无线收发功能的电脑、虚拟现实(virtual reality，VR)终端设备、增强现实(augmented reality，AR)终端设备、混合现实(mixed reality，MR)终端设备、XR终端设备、工业控制 (industrial control)中的无线终端、触觉终端设备、车载终端设备、无人驾驶中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端、可穿戴终端设备、视频播放器、全系投影仪等。本申请对于终端设备的具体形式均不做限定。

数据网络(data network，DN)可以提供运营商服务、互联网接入或第三方服务，在本申请的实施例中，数据网络包括服务器，可以对视频源进行编码、渲染等。

为了便于理解，以下结合图1、图2和图3对适用于本申请实施例提供的方法的通信系统进行简单说明。

图1是适用于本申请实施例提供的方法的通信系统的示意图。图1所示的通信系统100可以包括：终端设备、无线接入网设备(如图中所示的RAN)、核心网设备(如图中所示的UPF、SMF、AMF、PCF、NEF等)、数据网络和服务器。该通信系统100可视为服务器-网络-终端设备的网络架构。

其中，终端设备可以是VR终端设备、AR终端设备、XR终端设备、视频播放器、全系投影仪等。该终端设备可以既具有应用层设备的功能，如可以采集用户操作，比如，手柄操作、语音控制等，并基于用户操作生成动作指令，又比如，采集图像或视频；又具有通信设备的功能，如与无线接入网设备进行无线通信，将来自应用层设备的动作指令、图像、视频等通过空口传输至无线接入网设备，且可以将从无线接入网设备接收到的数据传输至应用层设备。该终端设备可以采集图像或视频，并可将采集到的图像或视频上传至服务器。

示例性地，终端设备与服务器间传输数据的过程可以如图1中所示。终端设备发送的上行数据经由无线接入网设备、核心网设备(具体可以为核心网设备中的UPF)、数据网络到达服务器。服务器发送的下行数据经由数据网络、核心网设备(如UPF)、无线接入网设备到达终端设备。

应理解，图1中所示出的各个设备仅为示例。例如在一些设计中，终端设备可以是分离的，如基于不同的功能，划分为应用层设备和通信设备。又例如，应用服务器和数据网络可以是合一部署的。本申请对此不作限定。

此外，图1中示例性地示出了各个网元之间的接口。例如，终端设备与无线接入网设备之间通过Uu接口通信，无线接入网设备与AMF之间可通过N3接口通信，等等，此处不一一赘述，本申请对此也不作限定。

图2是适用于本申请实施例提供的方法的通信系统的另一示意图。图2所示的通信系统200中可以包括终端设备1和终端设备2，无线接入网设备1和无线接入网设备2(如图中所示的RAN1和RAN2)，以及核心网设备，如UPF网元。该通信系统200可视为终端设备-网络-终端设备的网络架构。

图2所示的系统可以应用于触觉互联网中，该触觉互联网中的主域例如为终端设备1，例如可以是XR终端、个人电脑等；受控域例如为终端设备2，例如可以是远程控制机器人、远程操作员等；网络域包括核心网设备、无线接入网设备1和2。其中，主域由触觉用户与人工系统接口(human system interface，HSI)组成，HSI可负责利用合适的触觉编码技术将触觉用户的输入转换为触觉数据。触觉数据通过网络域传输至受控域。主域可通过各种命令信号直接控制受控域，受控域也可以将反馈信号反馈给主域。除了触觉反馈信号之外，主域还可以从受控域接收音频/视频反馈信号。不难理解，主域与受控域的关系与前文结合图1所描述的服务器与终端设备的关系相似。

图3是适用于本申请实施例提供的方法的通信系统的另一示意图。如图3所示，该通信系统300中可以包括终端设备、无线接入网设备(如图中所示的AP)、固网和服务器。该通信系统300可视为服务器-网络-终端设备的网络架构，与图1所不同的是，该网络架构中的网络包括固网。

其中，终端设备可以是XR终端、视频播放器等，无线接入网设备可以是Wi-Fi路由器、Wi-Fi AP、机顶盒等。

示例性地，终端设备与服务器间传输数据的过程可以如图3中所示。终端设备发送的上行数据经由无线接入网设备、固网到达服务器。服务器发送的下行数据经由固网、无线接入网设备到达终端设备。终端设备与服务器之间传输的数据例如可以包括XR媒体数据、普通视频数据等。

应理解，图1至图3所示的通信系统仅为示例，本申请并不限定所适用的系统的具体架构，也不限定各通信系统内包含的各种设备的数量和形态。

目前，AI在诸多业务中得到越来越广泛的应用。例如，AI可应用于如图1至图3所示的通信系统中，通信系统中的某一个或多个设备可以通过神经网络模型来执行计算任务。

以图1所示的系统为例，服务器可以通过神经网络模型，对接收到的图像或视频进行目标检测和识别。为了减少终端设备上传的数据量，可以对该神经网络模型的计算任务进行分割，使得一部分计算任务转移至终端设备，比如，将对图像或视频进行预处理的计算任务转移到终端设备，所述预处理具体可包括提取特征信息，目标定位，图像下采样等，终端设备可以将计算所得的数据上传服务器。这相比于将原始的图像或视频上传而言，可以减少传输的数据量。

为了更好地理解本申请实施例，下面结合图4对本申请实施例涉及到的几个术语进行说明。

1、神经网络模型：由大量的、简单的处理单元(即，神经元)互相连接而成的复杂网络系统。神经网络模型可以包括多个神经网络层。基于不同的类别，神经网络模型可以分为：DNN模型、卷积神经网络(convolutional neural network，CNN)模型、循环神经网络(recurrent neural network，RNN)模型等。本申请包含但不限于此。

2、计算任务：通过神经网络模型执行的任务。若将神经网络模型中的多个神经网络层进行分割成多个部分，该神经网络模型所对应的计算任务也就随之被分割成多个计算任务，例如记为计算任务1至计算任务N。那么，与神经网络模型对应的计算任务可通过执行计算任务1至计算任务N(N为大于1的整数)来实现。

计算任务可以基于业务而定义，业务不同，计算任务也不同。计算任务例如包括但不限于，目标检测、目标识别、目标分类、行为预测、控制系统中的动作决策、图像渲染增强等等。本申请包含但不限于此。

图4为本申请实施例提供的通过神经网络模型执行计算任务的示意图。作为示例，图4所示的神经网络模型为DNN模型。该DNN模型包括多个神经网络层，图中示出了7个神经网络层，该多个神经网络层可以包括一个或多个卷积层、一个或多个池化层、一个或多个全连接层以及一个或多个激活层。不同神经网络层的计算特性有所不同。

如图所示，待处理的原始数据被输入至该DNN模型，经过计算后，DNN模型输出结果。示例性地，该待处理的原始数据例如可以是图像或视频，该输出结果例如可以是对图像或视频进行目标检测得到的结果。因此，被输入至DNN模型的原始数据可以是图像或视频，从DNN模型输出的数据可以是检测结果。该DNN模型所执行的计算任务可以是对输入的图像或视频进行卷积、池化、分类等处理，进而得到目标检测的结果。

3、分割点：用于对神经网络模型的多个神经网络层进行分割，以将多个神经网络层分为多个部分。在本申请实施例中，分割点可用于将多个神经网络层分成两个部分。图4中用虚线示出了分割点。可以理解，在神经网络模型包含两个以上神经网络层的情况下，分割点可以有多种选择，多个神经网络层中任意两个相邻的神经网络层之间的位置都可以被确定为分割点。

分割点只是为了方便描述而定义，可以视为神经网络模型中的位置，而并不代表在神经网络模型中存在这样一个点。分割也只是为便于理解而定义，并不代表对神经网络模型进行了分割。在一种可能的设计中，用于执行计算任务的两个设备(如上述图1或图3所示系统中的终端设备和服务器，或图2所示系统中的终端设备1和终端设备2)中都预先配置有该神经网络模型，或可预先建立该神经网络模型。各设备可以基于分割点，确定自身需要执行其中哪几个层的计算任务。

由于对神经网络模型进行分割，该神经网络模型对应的计算任务也被分割，因此下文中，神经网络模型分割和计算任务分割交替使用，二者所表达的含义是相同的。

4、原始数据、中间数据和结果：三者均为数据，只是为了区分不同的数据而定义，不应对本申请构成任何限定。其中，原始数据可以是被输入至神经网络模型的数据，具体可以是被输入至输入层的数据；结果是原始数据经由神经网络模型的处理后输出的数据，具体可以是从输出层输出的数据；中间数据可以是指从神经网络模型中的某个神经网络层输出的数据，具体可以是从除了输入层和输出层之外的其他层输出的数据，例如可以是从卷积层或池化层输出的数据。可以理解，中间数据在对神经网络模型进行了分割的情况下被输出。

5、传输数据量：指需要传输的数据的大小，可通过比特、字节等量纲来描述。在本申请实施例中，传输数据量具体可以指由终端设备执行某一计算任务(如第一计算任务)后得到的、需传输给另一设备(如后文所述的第一设备)的中间数据的大小。

6、计算量：指需要进行运算的次数，例如需要进行浮点运算的次数，或需要进行加法与乘法的次数等，可通过浮点运算次数、加法与乘法次数等参数来描述。在本申请实施例中，计算量具体可以指终端设备执行某一计算任务(如第一计算任务)需要进行的运算的次数。

7、信道状态：指通信链路的信道属性。在本申请实施例中，该信道状态具体可以指无线通信链路的信道属性。无线信号在传输过程中，可能受到信号散射、环境衰落、距离衰减等因素对信号的影响，因此传输速率可能会随之发生变化。因此，信道状态可通过SINR、RSRP、CQI等参数来表征，可用于确定通过该信道进行数据传输的传输速率。

由于该DNN在用于执行目标检测与识别的计算任务时，靠近输入侧的神经网络层(比如卷积层、池化层)计算量较小；靠近输出侧的神经网络层(比如全连接层、激活层)计算量较大。因此，可以将计算量较小的神经网络层的计算任务分配给终端设备来执行，而将计算量较大的神经网络层的计算任务分配给服务器来执行。如此一来，终端设备在对待处理的原始数据进行处理后，数据维度得以降低，输出的中间数据较原始数据来说，数据量减少，也即传输的数据量得以减少。

由于神经网络模型所应用的业务不同，需求也不同。有些业务对时延要求较高，有些业务对可靠性要求较高，有些业务对时延和可靠性都具有较高的要求。因此，如何对神经网络模型进行分割，来满足不同业务的需求，成为一项亟待解决的技术问题。

有鉴于此，本申请提供一种计算任务的分割方法，通过网络设备(如无线接入网设备或核心网设备)来确定计算任务的目标分割点。由于网络设备可以及时地获取到无线接入网设备与终端设备之间的信道状态，尤其是无线接入网设备，可以实时地获取到与终端设备之间的信道状态，因此，网络设备可以基于最新获取到的信道状态，及时有效地调整目标分割点，使得对计算任务的分割更为合理，更大程度地满足需求，提升用户体验。

下面将结合附图详细说明本申请提供的方法。

为方便理解，首先做出如下几点说明：

第一，为了便于清楚描述本申请实施例的技术方案，在本申请的实施例中，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。例如，第一计算任务和第二计算任务仅仅是为了区分不同的指示信息，并不对其先后顺序进行限定。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定，并且“第一”、“第二”等字样也并不限定一定不同。

第二，在本申请实施例中，各术语及英文缩略语，如信道状态、神经网络模型、计算任务、DNN、SINR、RSRP、CQI等均为方便描述而给出的示例性举例，不应对本申请构成任何限定。本申请并不排除在已有或未来的协议中定义其它能够实现相同或相似功能的术语的可能。

第三，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B的情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a、b和c中的至少一项(个)，可以表示：a，或b，或c，或a和b，或a和c，或b和c，或a、b和c，其中a，b，c可以是单个，也可以是多个。

第四，本申请实施例中的表格仅为示例，并不对本申请的保护范围构成限定。例如，表格中的信息的取值仅仅是举例，可以配置为其他值，本申请并不限定。又例如，可以基于上述文中各表做适当的变形调整，例如，拆分，合并等等。再例如，各表中标题示出的参数名称也可以采用通信装置可理解的其他名称，其参数的取值或表示方式也可以通信装置可理解的其他取值或表示方式。再例如，上述各表在实现时，也可以采用其他的数据结构，例如可以采用数组、队列、容器、栈、线性表、指针、链表、树、图、结构体、类、堆、散列表或哈希表等。

第五，“预定义”或“预配置”可以通过在设备(例如，包括终端设备和第一设备)中预先保存相应的代码、表格或其他可用于指示相关信息的方式来实现，本申请对于其具体的实现方式不做限定。其中，“保存”可以是指，保存在一个或者多个存储器中。所述一个或者多个存储器可以是单独的设置，也可以是集成在编码器或者译码器，处理器、或通信装置中。所述一个或者多个存储器也可以是一部分单独设置，一部分集成在译码器、处理器、或通信装置中。存储器的类型可以是任意形式的存储介质，本申请并不对此限定。

第六，在本申请实施例中，“当……时”、“在……的情况下”、“若”以及“如果”等描述均指在某种客观情况下设备(如，下文所述的终端设备或者接入网设备)会做出相应的处理，并非是限定时间，且也不要求设备(如，下文所述的终端设备或者接入网设备)在实现时一定要有判断的动作，也不意味着存在其它限定。

下文结合附图所示出的实施例从设备交互的角度示出了本申请提供的计算任务的分割方法。其中的各设备仅为示例，不应对本申请提供的方法的实施构成任何限定。

参看图5，图5是本申请实施例提供的计算任务的分割方法500的示意性流程图。可以理解，图5中主要以无线接入网设备、终端设备、和第一设备作为该交互示意的执行主体为例来示意该方法，但本申请并不限制交互示意的执行主体。例如，图5中的无线接入网设备也可以是支持该无线接入网设备实现该方法的芯片、芯片系统、或处理器，还可以是能实现全部或部分无线接入网设备功能的逻辑模块或软件；图5中的终端设备也可以是支持该终端设备实现该方法的芯片、芯片系统、或处理器，还可以是能实现全部或部分终端设备功能的逻辑模块或软件；图5中的第一设备也可以是支持该第一设备实现该方法的芯片、芯片系统、或处理器，还可以是能实现全部或部分第一设备功能的逻辑模块或软件。

图5所示的方法500包括步骤510至步骤540，下面对图5中的各个步骤进行详细说明。

在步骤510中，无线接入网设备获取终端设备与第一计算任务对应的传输数据量和计算量，该第一计算任务是基于分割点对神经网络模型的计算任务进行分割得到的。

该第一计算任务可以是基于某一分割点对一个完整的神经网络模型的计算任务进行分割得到的。如前所述，基于某一分割点对神经网络模型的计算任务进行分割，可以得到两个计算任务。本实施例中，为方便区分和说明，将与神经网络模型对应的计算任务记为计算任务A，对计算任务A进行分割得到的两个计算任务分别记为第一计算任务和第二计算任务。其中，第一计算任务与终端设备对应，第二计算任务与另一设备对应。将用于将计算任务A分割为第一计算任务和第二计算任务的分割点记为分割点A。

其中，所述另一设备是与终端设备通信的设备，例如可以为图1或图3中的服务器，也可以为图2中所示的不同于该终端设备的另一终端设备。为方便区分和说明，将该另一设备记为第一设备。

这里，第一计算任务与终端设备对应，第二计算任务与第一设备对应，可以理解为，假设将该第一计算任务分配给终端设备执行，将第二计算任务分配给第一设备执行。与此对应，与第一计算任务对应的传输数据量和计算量，也就是假设由该终端设备执行第一计算任务可能产生的传输数据量和计算量。

如图中的510a所示，获取终端设备与第一计算任务对应的传输数据量和计算量的一种可能的实现方式是，终端设备向无线接入网设备发送第一信息，该第一信息指示与第一计算任务对应的传输数据量和计算量。相应地，无线接入网设备接收该第一信息。

示例性地，该第一信息可以承载于无线接入控制(radio resource control，RRC)信令中，例如，该第一信息具体可以是承载于RRC信令的用户辅助信息(user assistant information，UAI)，或者为UAI中的信元。该第一信息也可以承载于介质接入控制(medium access control，MAC)-控制元素(control element，CE)中，例如，新增MAC-CE用于承载该第一信息。本申请对用于承载该第一信息的信令，以及该第一信息的具体名称不作限定。

在这种实现方式中，与该第一计算任务对应的传输数据量和计算量可以由终端设备预估得到。示例性地，终端设备可以根据第一计算任务对应的神经网络的层数、神经网络元的个数及对应的计算类型和次数，还可以估计有多少路径(path)需要计算，由此可以预估所需进行的运算次数，也即该第一计算任务对应的计算量。终端设备还可以根据第一计算任务对应的神经网络中的路径数量以及分割点处的神经网络元的类型与数量，预估可能输出的数据的大小，也即该第一计算任务对应的传输数据量。

如图中的510b所示，获取终端设备与第一计算任务对应的传输数据量和计算量的另一种可能的实现方式是，第一设备向无线接入网设备发送第二信息，该第二信息指示与第一计算任务对应的传输数据量和计算量。相应地，无线接入网设备接收来自第一设备的第二信息。

在这种实现方式中，与该第一计算任务对应的传输数据量和计算量可以由第一设备预估得到。第一设备预估传输数据量和计算量的具体方式与上文所述相似，不再赘述。

如图中的510c所示，获取终端设备与第一计算任务对应的传输数据量和计算量的又一种可能的实现方式是，第一设备向无线接入网设备发送第三信息，该第三信息指示与第二计算任务对应的传输数据量和计算量。相应地，无线接入网设备接收来自第一设备的第三信息。

在这种实现方式中，与该第二计算任务对应的传输数据量和计算量可以由第一设备预估得到。无线接入网设备在接收到该第三信息之后，可以根据神经网络模型对应的计算任务A，预估传输数据量和计算量，进而确定出与第一神经网络对应的传输数据量和计算量。第一设备和无线接入网设备预估传输数据量和计算量的具体方式与上文所述相似，不再赘述。

示例性地，上述第二信息和第三信息可以由服务器(即，第一设备的一例)通过N33接口发送给核心网设备，再由核心网设备利用通用无线分组业务(general packet radio service，GPRS)隧道协议-控制(GPRS tunneling protocol-control)信令传输给无线接入网设备。或者，上述第二信息和第三信息也可以由另一终端设备(即，第一设备的另一例)发送，并承载于RRC信令、MAC-CE等信令中。本申请对用于承载该第二信息和第三信息的信令不作限定。

由于对不同的业务，需要使用不同的神经网络模型执行不同的计算任务，故在每一个业务发起后，需要针对其所对应的神经网络模型进行计算任务的分割。故，终端设备或第一设备可以在业务发起时，可以预估通过不同位置的分割点对同一神经网络模型对应的计算任务分割得到的两个计算任务中任意一个所对应的传输数据量和计算量，并发送给无线接入网设备。

其中，对于同一设备来说，比如终端设备，通过不同位置的分割点对同一神经网络模型对应的计算任务进行分割，所得到的计算任务是不同的。参看图6，若基于分割点1对同一神经网络模型的计算任务进行分割(如图6中的a)所示)，可以得到与终端设备对应的一个计算任务和与第一设备对应的一个计算任务，如图6中的b)所示。若基于分割点2对同一神经网络模型的计算任务进行分割(如图6中的a)所示)，可以得到与终端设备对应的一个计算任务和与第一设备对应的一个计算任务，如图6中的c)所示。对比图6中的b)和c)可以看到，与终端设备对应的两个计算任务不同，与第一设备对应的两个计算任务也不同。

在一种可能的实现方式中，终端设备或第一设备可以在基于业务确定了神经网络模型之后，遍历模型中不同位置的分割点对该神经网络模型的计算任务进行分割，以得到与不同分割点对应的计算任务，进而可以得到与终端设备对应的6个计算任务，如图7中所示出的分割点1至6，以及分别与该分割点1至6对应的神经网络层，进而可以预估出对应于该6个不同计算任务的传输数据量和计算量。

终端设备或第一设备发送的对应于不同计算任务的传输数据量和计算量如表1所示：

表1

应理解，上文结合图7和表格所示的对应于不同计算任务的传输数据量和计算量仅为示例，本申请对于分割点的数量、上报的形式等均不作限定。例如，第一设备也可以基于不同位置的分割点，得到与第一设备对应的多个不同的计算任务，将各计算任务对应的传输数据量和计算量也以类似于上文表格的形式发送给无线接入网设备。

可以理解的是，对于同一个神经网络模型来说，各分割点及其的标识在终端设备和第一设备中是一致的。终端设备和第一设备可以预先配置该神经网络模型，或基于相同的配置信息构建该神经网络模型，并基于相同的规则对各个位置的分割点分配标识。例如图7中所示的神经网络，可以按照从输入层至输出层，每两个相邻层之间设置一个分割点，并按顺序依次标号为1至6；又例如，可以按照从输入层至输出层的顺序，每隔若干个神经网络层设置一个分割点，并依次标号。

其中，终端设备和第一设备基于相同的配置信息构建神经网络模型的具体实现方式可以是，终端设备和第一设备可通过神经网络数据交换标准，例如，开放式神经网络交换(open neural network exchange，ONNX)或其他预定义的神经网络数据交换标准协商配置信息。所述配置信息包括：用于构建该测试神经网络模型的结构和/或参数。其中，结构具体可以指神经网络的类型，例如CNN、RNN等，参数具体可以包括神经网络的层数、各个神经网络层中各个神经元的类型与权重等。本申请包含但不限于此。

因此，无线接入网设备在执行步骤510时，可以通过获取终端设备与多个不同的计算任务分别对应的传输数据量和计算量的方式来获取与第一计算任务对应的传输数据量和计算量，其中，所述多个不同的计算任务是基于不同位置的分割点(包括上述分割点A)对神经网络模型A的计算任务进行分割得到的，该多个不同的计算任务包括第一计算任务。

在步骤520中，无线接入网设备基于上述传输数据量、上述计算量，以及终端设备与无线接入网设备之间的信道状态，确定该分割点(即，上述分割点A)为目标分割点。

由于无线接入网设备与终端设备之间通过无线信道进行数据传输。无线信道的质量影响着数据传输的速率和质量。故，无线接入网设备可以频繁地向终端设备发送下行参考信号，以进行下行信道测量；终端设备也可以频繁地向无线接入网设备发送上行参考信号，以进行上行信道测量。

在本申请实施例中，由于终端设备需要将中间数据传输至第一设备，因此，无线接入网设备可以实时地根据上行信道测量结果，确定与终端设备之间的信道状态。

除了信道状态，与第一计算任务对应的传输数据量和计算量，也都可能影响计算任务A的完成时间和所需功耗。

在传输速率一定的情况下，传输数据量越大，所需的传输时间越多，所需的功耗也越大。在终端设备的计算能力一定的情况下，计算量越大，所需的计算时间越多，所需的功耗也越大。因此，无线接入网设备可以结合上述各项来确定是否将分割点A确定为目标分割点。

由于不同的业务存在不同的需求，有些业务对时延敏感，有些业务对传输可靠性要求较高，有些业务对功耗要求较高，有些业务的使用设备为对功耗较敏感的终端设备，因此可以基于不同的需求，从不同的维度来确定目标分割点。

在一种可能的设计中，该目标分割点基于时延确定。

若假设终端设备执行第一计算任务，该时延为终端设备执行第一计算任务所需的时间，具体可包括：终端设备执行第一计算任务的计算时延和传输时延。其中，终端设备执行第一计算任务的计算时延为终端设备完成第一计算任务的计算量所需的时间，终端设备执行第一计算任务的传输时延为终端设备传输由第一计算任务所得到的中间数据所需的时间。

第一计算任务的计算时延可以根据第一计算任务的计算量以及终端设备的计算能力确定。

其中，计算时间与终端设备的计算能力相关。因此在基于时延确定目标分割点时，可以进一步获取终端设备的计算能力。

可选地，在步骤520之前，该方法还包括：无线接入网设备接收来自终端设备的算力信息，该算力信息指示终端设备的计算能力。相应地，终端设备向无线接入网设备发送该算力信息。

与此对应，步骤520具体可以包括：无线接入网设备基于上述传输数据量、上述计算量、终端设备的计算能力，以及终端设备与无线接入网设备间的信道状态，确定该分割点为目标分割点。

接收终端设备的算力信息可以在步骤510之后执行，也可以在步骤510之前执行，或与步骤510同步执行，本申请并不限定二者的执行先后顺序。

示例性地，该算力信息可以承载于RRC信令中，例如，该算力信息具体可以是承载于RRC信令中的UAI，或者为UAI中的信元。该算力信息也可以承载于MAC-CE中，例如，新增MAC-CE用于承载该算力信息。本申请对用于承载该算力信息的信令不作限定。

其中，该算力信息可以如下至少一项：终端设备完成预定义的测试任务所需的时间或终端设备的计算能力中。

进一步地，预定义的测试任务包括：基于预定义的测试神经网络模型、预定义的计算类型或预定义的输入数据中的至少一项而执行的任务。也就是说，不同的终端设备可以基于相同的测试任务进行测试，以获得不同的终端设备完成同一测试任务所需的时间，进而可以根据时间来推出不同的终端设备的计算能力。

这里，测试神经网络模型可以预先配置在终端设备中，也可以根据预定义的配置信息而构建，或者也可以根据从其他设备(比如无线接入网设备或第一设备等)获取到的配置信息而构建。关于配置信息的相关说明可参看前文步骤510中的相关描述，此处不再赘述。

计算类型可以包括运算类型，例如矩阵运算，具体还可以包括矩阵乘法运算、矩阵求逆运算等。本申请包含但不限于此。

输入数据可以指输入至测试神经网络模型的数据，也就是待处理的数据。

测试神经网络模型、计算类型和输入数据例如可以由协议预定义。终端设备基于该其中的至少一项来执行测试任务，便可得到完成该测试任务所需的时间。

计算能力还可以通过终端设备每秒浮点运算次数来表征。每秒浮点运算次数也就是每秒所能够执行的浮点运算次数的峰值。终端设备可以将每秒浮点运算次数上报无线接入网设备。

终端设备上报每秒浮点运算次数的一种可能的实现方式是，直接将每秒浮点运算次数上报。

终端设备上报每秒浮点运算次数的另一种可能的实现方式是，将用于标识每秒浮点运算次数的信息上报。

每秒浮点运算次数或与其对应的能力等级仅为用于表征计算能力的参数之一，本申请并不限定用于表征计算能力的参数，也可将其他参数与能力等级建立对应关系。

基于终端设备的计算能力，便可确定终端设备的计算速度，进一步结合与第一计算任务对应的计算量，便可以确定终端设备完成该第一计算任务的计算时延。

示例性地，计算时延T_c满足：T_c＝Q_c/R_c。其中，Q_c表示计算量，R_c表示计算速度。将第一计算任务对应的计算量和终端设备的计算速度代入上式，便可得到终端设备执行第一计算任务的计算时延。

由于终端设备的电量可能会随着使用时间的延长而降低，用户可能会在不同的电量状态下调整终端设备的模式，例如在低电量状态调整至省电模式，其计算能力也可能随着模式而变化。因此，终端设备可以周期性地向无线接入网设备发送算力信息。如此一来，无线接入网设备便可以根据最新接收到的算力信息来确定计算时延，从而使得对计算时延的估计更为精准。

第一计算任务的传输时延可以根据第一计算任务的传输数据量以及终端设备与无线接入网设备之间的信道状态确定，如，可以根据第一计算任务的传输数据量以及终端设备与无线接入网设备之间的传输速率来确定。

其中，传输速率例如可以由无线接入网设备根据实时获取到的物理层的信道状态以及层2的调度信令来确定。根据信道状态确定传输速率为无线接入网设备的内部实现，且可通过已有技术来实现，对此不作详述。

示例性地，传输时延T_t满足：T_t＝Q_t/R_t。其中，Q_t表示传输数据量，R_t表示传输速率。

将第一计算任务对应的传输数据量和终端设备的传输速率代入上式，便可得到终端设备执行第一计算任务的传输时延。

基于计算时延和传输时延，便可得到终端设备执行第一计算任务的时延T。即，T＝T_c+T_t。

前已述及，对于一些低时延业务来说，可以基于时延来确定目标分割点。因此，无线接入网设备可以根据上述时延的计算方式来确定与第一计算任务对应的时延T，进而确定是否将该第一计算任务对应的分割点A确定为目标分割点。

一种可能的实现方式是，对与终端设备对应的计算任务预先设置时延门限，若由分割点A分割得到的第一计算任务的时延不超过该时延门限，则可认为基于分割点A分割的计算任务满足时延需求，可以将该分割点A确定为目标分割点；若有分割点A分割得到的第一计算任务的时延不超过该时延门限，则可认为基于分割点A分割的计算任务满足时延需求，可以将该分割点A确定为目标分割点。

另一种可能的实现方式是，对计算任务A预先设置时延门限，此时，不但需要预估第一计算任务的时延，还需要预估第二计算任务的时延，进而根据二者的时延总和与时延门限的大小关系，确定是否将分割点A确定为目标分割点。例如，若由分割点A分割得到的第一计算任务和第二计算任务的时延总和不超过该时延门限，则可认为基于该分给点A分割的计算任务满足时延需求，可以将该分割点A确定为目标分割点；若由分割点A分割得到的第一计算任务和第二计算任务的时延总和超过该时延门限，则可认为基于该分割点A分割的计算任务不满足时延门限，不可以将该分割点A确定为目标分割点。

又一种可能的实现方式是，采用不同位置的分割点，对神经网络模型对应的计算任务A进行分割，得到与终端设备对应的多个不同的计算任务，分别计算该多个不同的计算任务的时延，将其中时延最小的计算任务所对应的分割点确定为目标分割点。例如，第一计算任务是基于所述多个不同的计算任务中时延最小的计算任务，则分割点A便可确定为目标分割点。可以理解，终端设备执行不同计算任务的计算时延和传输时延也可以参照前文提供的方式来计算，只是传输数据量和计算量有所不同。

以图7为例，分别计算基于分割点1至6分割得到的计算任务的时延，可以得到对应于分割点1至6的时延1至时延6，若其中的分割点3对应的时延3最小，则可将分割点3确定为目标分割点。

本实施例中为方便说明，假设上述分割点A是基于上述实现方式所确定出的目标分割点。

在另一种可能的设计中，该目标分割点基于功耗确定。

若假设终端设备执行第一计算任务，该功耗为终端设备执行第一计算任务所需的功耗，具体可包括：终端设备执行第一计算任务的计算功耗和传输功耗。其中，终端设备执行第一计算任务的计算功耗为终端设备为执行第一计算任务的计算量所需的功耗，终端设备执行第一计算任务的传输功耗为终端设备为传输由第一计算任务多得到的中间数据所需的功耗。

第一计算任务的计算功耗与第一计算任务的计算量相关。计算功耗随计算量增大而增大。

如前所述，计算量与神经网络的层数相关。示例性地，计算功耗P_c满足：P_c＝∑_iP_c,i。其中，i表示第i个神经网络层，P_c,i表示第i个神经网络层的计算功耗。

将第一计算任务对应的神经网络层数，以及每个神经网络层的计算功耗代入上式，便可得到终端设备执行第一计算任务的计算功耗。其中，每个神经网络层的计算功耗可以根据每个神经元计算所需要的运算次数，以及终端芯片中每次运算所需的功耗值计算得出，例如，可以根据每个神经元计算所需要的加法器的运行次数、乘法器的运行次数，以及终端芯片中的加法器与乘法器每次运行所需的功耗值计算得出。或者，网络设备与终端设备也可以针对典型的神经网络元的运算功耗进行预规定，根据神经网络结构按照标准计算每个神经网络层的计算功耗。

第一计算任务的传输功耗与第一计算任务的传输数据量以及信道状态相关。传输数据量越大，所需的功耗也越大。又由于终端设备执行第一计算任务得到的中间数据需要通过无线信道传输至无线接入网设备，因此其传输功耗也与信道状态相关。

示例性地，传输功耗P_t与计算任务分割后所需的传输数据量以及当前的信道状态相关。无线接入网设备可以根据当前的信道状态和传输数据量进行功率分配，进而确定该传输功率。第一计算任务的传输功耗也可以由无线接入网设备基于第一计算任务对应的传输数据量和实时获取到的信道状态确定。无线接入网设备根据当前的信道状态和传输数据量进行功率分配的具体方法可参看已有技术，此处不作详述。

基于计算功耗和传输功耗，便可得到终端设备执行第一计算任务的功耗P。即，P＝P_c+P_t。

对于一些对功耗较敏感的终端设备，而对时延要求不高的业务来说，无线接入网设备可以基于功耗来确定目标分割点。例如，在终端设备电量较低的情况下，或者，在用户使用的终端设备电池容量较小的情况下，无线接入网设备可以根据上述功耗的计算方式来确定与第一计算任务对应的功耗P，进而确定是否将与第一计算任务对应的分割点A确定为目标分割点。

一种可能的实现方式是，对于终端设备对应的计算任务预先设置功耗门限，若由分割点A分割得到的第一计算任务的功耗不超过该功耗门限，则可认为基于分割点A分割的计算任务满足功耗需求，可以将该分割点A确定为目标分割点；若有分割点A分割得到的第一计算任务的功耗不超过该功耗门限，则可认为基于分割点A分割的计算任务满足功耗需求，可以将该分割点A确定为目标分割点。

另一种可能的实现方式是，采用不同位置的分割点，对神经网络模型对应的计算任务A进行分割，得到与终端设备对应的多个不同的计算任务，分别计算该多个不同的计算任务的功耗，将其中功耗最小的计算任务所对应的分割点确定为目标分割点。例如，第一计算任务是基于所述多个不同的计算任务中功耗最小的计算任务，则分割点A便可确定为目标分割点。可以理解，终端设备执行不同计算任务的计算功耗和传输功耗也可以参照前文提供的方式来计算，只是传输数据量和计算量有所不同。

在多用户场景下，无线接入网设备还可以考虑小区中多个终端设备之间的相互干扰，调整终端设备的传输功耗，从而降低干扰，以获得更优的传输质量。此外，无线接入网设备还可以考虑小区内的总带宽，根据模型分割点的速率要求，调整终端设备的传输功率，实现系统级的业务最优传输。

在又一种可能的设计中，该目标分割点基于时延和功耗确定。

关于时延和功耗的说明可参看前文，此处不再赘述。无线接入网设备可以综合时延和功耗，来确定目标分割点，以使得所确定的目标分割点对于终端设备来说，既不会带来很大的时延，又不会带来很大的功耗。

无线接入网设备基于时延和功耗来确定目标分割点时，可以根据需求，对时延和功耗施加不同的权重，以获得二者的加权和。例如，对于时延要求较高的业务，可以将时延施加更高的权重；而对于时延要求不高的业务，但对功耗较敏感的终端设备，可以将功耗施加更高的权重。

示例性地，时延和功耗的加权和可通过如下公式表示：αT+βP，其中，α为时延的权重，0＜α≤1；β为功耗的权重，0＜β≤1。

不同的业务、不同的终端设备所对应的α、β的值可以是不同的。无线接入网设备若基于时延和功耗确定目标分割点，则可以响应于每一次业务发起，为对应的计算任务确定α和β值，由此可以计算与第一计算任务对应的时延和功耗的加权和，进而确定是否将与第一计算任务对应的分割点A确定为目标分割点。

一种可能的实现方式是，对于终端设备对应的计算任务预先设置门限值，若由分割点A分割得到的第一计算任务的时延和功耗的加权和不超过该门限值，则可认为基于分割点A分割的计算任务满足需求，可以将该分割点A确定为目标分割点；若有分割点A分割得到的第一计算任务的时延和功耗的加权和不超过该门限值，则可认为基于分割点A分割的计算任务满足需求，可以将该分割点A确定为目标分割点。

另一种可能的实现方式是，采用不同位置的分割点，对神经网络模型对应的计算任务A进行分割，得到与终端设备对应的多个不同的计算任务，分别计算该多个不同的计算任务的时延和功耗的加权和，将其中加权和最小的计算任务所对应的分割点确定为目标分割点。例如，第一计算任务是基于所述多个不同的计算任务中时延和功耗的加权和最小的计算任务，则分割点A便可确定为目标分割点。可以理解，终端设备执行不同计算任务的时延和功耗可以参照前文提供的方式来计算，只是传输数据量和计算量有所不同。

应理解，上文所提供的基于时延和/或功耗确定目标分割点的具体实现方式仅为示例，基于相同的构思，本领域的技术人员还可以采用其他实现方式，来基于时延和/或功耗确定目标分割点。

在步骤530中，无线接入网设备向终端设备发送指示信息，该指示信息指示目标分割点。相应地，终端设备接收该指示信息。

无线接入网设备确定出目标分割点后，便可以将该目标分割点通知终端设备。无线接入网设备可以向终端设备发送指示信息，该指示信息具体可以包括目标分割点的标识，例如目标分割点的索引等可用于唯一标识一个分割点的信息。

示例性地，该指示信息可承载于MAC-CE或下行控制信息(downlink control information，DCI)中。本申请对用于承载该指示信息的信令不作限定。

本实施例中假设分割点A为目标分割点，则无线接入网设备可以将分割点A通过指示信息通知终端设备。

终端设备在基于该分割点A确定了第一计算任务之后，便可执行第一计算任务，并将由此得到的中间数据传输给第一设备。由于第一设备接收到该中间数据后，还需要将该中间数据作为本地第二计算任务的输入，来继续进行计算，因此，第一设备也需要根据目标分割点来确定第二计算任务。

如前所述，对于同一个神经网络模型来说，各分割点及其的标识在终端设备和第一设备中是一致的。因此，第一设备如果可以获知目标分割点，便可确定第二计算任务。

在步骤540中，终端设备向第一设备发送由第一计算任务得到的中间数据和上述指示信息。相应地，第一设备接收该中间数据和指示信息。

第一设备接收到该指示信息后，便可以确定目标分割点，进而确定第二计算任务。第一设备可以将从终端设备接收到的中间数据作为第二计算任务的输入，执行第二计算任务。

在另一种实现方式中，该目标分割点的指示信息也可以由无线接入网设备直接发送给第一设备。可选地，该方法还包括：无线接入网设备向第一设备发送该指示信息。相应地，第一设备接收该指示信息。

可以理解，如果无线接入网设备向第一设备发送目标分割点的指示信息，则终端设备在步骤540中可以不必发送指示信息，而只发送中间数据。

在本申请实施例中，由于无线接入网设备可以基于终端设备与第一计算任务对应的传输数据量、计算量、以及终端设备与无线接入网设备之间的信道状态，来确定目标分割点，可以从传输、计算的功耗，以及传输、计算的时延等多个角度来予以分析，从而根据不同的需求，合理地确定出目标分割点。由于无线接入网设备可以实时地获取到终端设备与无线接入网设备之间的信道状态，对信道状态的变化的感知可以达到毫秒级，因此可以更及时有效地根据信道状态的变化来调整目标分割点，使得目标分割点可以随着信道状态的变化而调整。此外，无线接入网设备还可以考虑小区中多个终端设备之间的相互干扰，调整终端设备的传输功耗，从而降低干扰，以获得更优的传输质量；并可以结合小区内的总带宽和速率要求，调整终端设备的传输功耗，实现系统级的业务最优传输。

以上，以无线接入网确定目标分割点为例，描述了本申请提供的方法。可以理解，除了无线接入网之外，核心网设备也可以实时地获取终端设备的传输速率，因此也可以用于确定目标分割点。下面将以核心网设备确定目标分割点为例，描述本申请提供的方法。

参考图8，图8是本申请另一实施例提供的计算任务的分割方法800的示意性流程图。可以理解，图8中主要以核心网设备、终端设备、和第一设备作为该交互示意的执行主体为例来示意该方法，但本申请并不限制交互示意的执行主体。例如，图8中的核心网设备也可以是支持该核心网设备实现该方法的芯片、芯片系统、或处理器，还可以是能实现全部或部分核心网设备功能的逻辑模块或软件；图8中的终端设备也可以是支持该终端设备实现该方法的芯片、芯片系统、或处理器，还可以是能实现全部或部分终端设备功能的逻辑模块或软件；图8中的第一设备也可以是支持该第一设备实现该方法的芯片、芯片系统、或处理器，还可以是能实现全部或部分第一设备功能的逻辑模块或软件。

图8所示的方法800包括步骤810至步骤840。下面详细说明图8中的各个步骤。

在步骤810中，核心网设备获取终端设备与第一计算任务对应的传输数据量和计算量，该第一计算任务是基于分割点对神经网络模型的计算任务进行分割得到的。

下文示例性地给出了核心网设备获取终端设备与第一计算任务对应的传输数据量和计算量的实现方式：

一种可能的实现方式是，核心网设备从终端设备接收第一信息，该第一信息指示上述传输数据量和计算量，可对应于图中的810a。

由于终端设备经由无线接入网设备与核心网设备连接，故用于承载传输数据量和计算量的第一信息例如可以是NAS信令。

另一种可能的实现方式是，核心网设备从第一设备接收第二信息，该第二信息指示上述传输数据量和计算量，可对应于图中的810b。

又一种可能的实现方式是，核心网设备从第一设备接收第三信息，该第三信息指示与第二计算任务对应的传输数据量和计算量；核心网设备根据与第二计算任务对应的传输数据量和计算量，确定与第一计算任务对应的传输数据量和计算量，可对应于图中的810c。

示例性地，上述第二信息和第三信息可以由服务器(即，第一设备的一例)通过N33接口发送给核心网设备，也可以由另一终端设备(即，第一设备的另一例)通过RRC信令、MAC-CE等信令发送给核心网设备。

步骤810的具体过程与前文方法500中的步骤510相似，可参看前文相关说明，此处不再赘述。

在步骤820中，核心网设备基于上述传输数据量、上述计算量，以及终端设备与无线接入网设备之间的传输速率，确定该分割点为目标分割点。

在本实施例中，核心网设备用于确定目标分割点。核心网设备可以通过业务流所配置的QoS流检测平均传输速率，故核心网设备也可以基于检测到的平均传输速率，结合上述传输数据量和计算量，确定目标分割点。

或者，核心网设备也可以实时地从无线接入网设备获取终端设备与无线接入网设备之间的信道状态，因此核心网设备也可以基于获取到的信道状态确定终端设备与无线接入网设备之间的传输速率，进而结合上述传输数据量和计算量，确定目标分割点。

核心网设备可以基于时延和/或功耗，确定目标分割点。

如前所述，时延包括计算时延和传输时延。其中，计算时延与终端设备的计算能力相关，若要确定计算时延，还需获取终端设备的计算能力。故可选地，该方法还包括：核心网设备接收来自终端设备的算力信息，该算力信息指示终端设备的计算能力。相应地，终端设备向核心网设备发送该算力信息。

与此对应，步骤820具体可以包括：核心网设备基于上述传输数据量、上述计算量、终端设备的算力信息，以及终端设备与无线接入网设备之间的传输速率，确定该分割点为目标分割点。

示例性地，该算力信息可以承载于NAS信令中。

步骤820的具体过程与前文方法500中的步骤520相似，可参看前文相关说明，此处不再赘述。

在步骤830中，核心网设备向终端设备发送指示信息，该指示信息指示目标分割点。相应地，终端设备接收该指示信息。

示例性地，该指示信息可以承载于NAS信令中。

在步骤840中，终端设备向第一设备发送由第一计算任务得到的中间数据和上述指示信息，相应地，第一设备接收该中间数据和指示信息。

步骤830和840的具体过程与前文方法500中的步骤530和540相似，可参看前文相关说明，此处不再赘述。

在本申请实施例中，由于核心网设备可以基于终端设备与第一计算任务对应的传输数据量、计算量、以及终端设备与无线接入网设备之间的传输速率，确定目标分割点，可以从传输、计算的功耗，以及传输、计算的时延等多个角度来予以分析，从而根据不同的需求，合理地确定出目标分割点。由于核心网设备可以基于业务流所配置的QoS流检测平均传输速率，也可以实时地从无线接入网设备获取到终端设备与无线接入网设备之间的信道状态，因此也可以及时有效地根据信道状态的变化来调整目标分割点，使得目标分割点可以随着信道状态的变化而调整。

应理解，图5和图8中的各个步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。此外，图5和图8所示流程中的各个步骤仅为示例，并不一代表每个步骤都必须执行。本领域的技术人员可以基于相同的构思，在图5或图8所示流程的基础上可以做出简单的变换，例如对部分步骤的执行顺序做出调整，或者，增加其他步骤或减少其中的步骤等，来实施本申请提供的方法。这些变换均应落入本申请的保护范围之内。

以上，结合图5至图8详细说明了本申请实施例提供的方法。以下，结合图9至图11详细说明本申请实施例提供的装置。

参看图9，图9是本申请实施例提供的通信装置的示意性框图。如图9所示，该通信装置900可以包括：获取模块910、处理模块920和接口模块930。该通信装置900可以用于执行上述计算任务的分割方法500中无线接入网设备执行的步骤，或者，也可用于执行上述计算任务的分割方法800中核心网设备执行的步骤。

示例性地，该装置900用于执行上述方法500中无线接入网设备执行的步骤时，获取模块910用于执行步骤510，获取终端设备与第一计算任务对应的传输数据量和计算量，所述第一计算任务是基于分割点对神经网络模型的计算任务分割得到的；该处理模块920用于执行步骤520，基于所述传输数据量、所述计算量，以及所述终端设备与无线接入网设备之间的信道状态，确定所述分割点为目标分割点；该接口模块930用于执行步骤530，向所述终端设备发送指示信息，所述指示信息指示所述目标分割点。

该装置900用于执行上述方法800中核心网设备执行的步骤时，获取模块910用于执行步骤810，获取终端设备与第一计算任务对应的传输数据量和计算量，所述第一计算任务是基于分割点对神经网络模型的计算任务分割得到的；该处理模块920用于执行步骤820，基于所述传输数据量、所述计算量，以及所述终端设备与无线接入网设备之间的传输速率，确定所述分割点为目标分割点；该接口模块930用于执行步骤830，向所述终端设备发送指示信息，所述指示信息指示所述目标分割点。

应理解，本申请实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。另外，在本申请各个实施例中的各功能模块可以集成在一个处理器中，也可以是单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

参看图10，图10是本申请实施例提供的通信装置的另一示意性框图。如图10所示，该通信装置1000可以包括至少一个处理器1010，用于实现本申请实施例提供的方法中无线接入网设备的功能或核心网设备的功能。

该通信装置1000还可以包括至少一个存储器1020，用于存储程序指令和/或数据。存储器1020和处理器1010耦合。本申请实施例中的耦合是装置、单元或模块之间的间接耦合或通信连接，可以是电性，机械或其它的形式，用于装置、单元或模块之间的信息交互。处理器1010可能和存储器1020协同操作。处理器1010可能执行存储器1020中存储的程序指令。所述至少一个存储器中的至少一个可以包括于处理器中。

该通信装置1000还可以包括通信接口1030，用于通过传输介质和其它设备进行通信，从而用于通信装置1000中的装置可以和其它设备进行通信。示例性地，当该通信装置1000用于实现本申请实施例提供的方法中无线接入网设备或核心网设备的功能时，该其他设备可以包括终端设备和第一设备。所述通信接口1030例如可以是收发器、接口、总线、电路或者能够实现收发功能的装置。处理器1010可利用通信接口 1030收发数据和/或信息，并用于实现图4对应的实施例中的无线接入网设备所执行的方法，或图8对应的实施例中的核心网设备所执行的方法。

例如，当该装置1000用于实现本申请实施例提供的方法中无线接入网设备的功能时，处理器1010可用于控制通信接口1030获取终端设备与第一计算任务对应的传输数据量和计算量，还用于基于所述传输数据量、所述计算量，以及所述终端设备与无线接入网设备之间的信道状态，确定所述分割点为目标分割点；并用于控制通信接口1030向所述终端设备发送指示信息，所述指示信息指示所述目标分割点。

又例如，当该装置1000用于实现本申请实施例提供的方法中核心网设备的功能时，处理器1010可用于控制通信接口1030获取终端设备与第一计算任务对应的传输数据量和计算量，还用于基于所述传输数据量、所述计算量，以及所述终端设备与无线接入网设备之间的传输速率，确定所述分割点为目标分割点；并用于控制通信接口1030向所述终端设备发送指示信息，所述指示信息指示所述目标分割点。

本申请实施例中不限定上述处理器1010、存储器1020以及通信接口1030之间的具体连接介质。本申请实施例在图10中以处理器1010、存储器1020以及通信接口1030之间通过总线1040连接。总线1040在图10中以粗线表示，其它部件之间的连接方式，仅是进行示意性说明，并不引以为限。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图10中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

参看图11，图11是本申请实施例提供的基站的结构示意图。图11所示的基站1100具有图4所示的无线接入网设备的功能，该基站1100可应用于如图1至图3所示的通信系统中。如图11所示，该基站1100可以包括一个或多个射频单元，如远端射频单元(remote radio unit，RRU)1110和一个或多个基带单元(BBU)(也可称为分布式单元(distributed unit，DU))1120。所述RRU 1110可以称为收发单元，可以与图9中的获取模块910和接口模块930对应，或与图10中的通信接口1030对应。可选地，该RRU 1110还可以称为收发机、收发电路、或者收发器等等，其可以包括至少一个天线1111和射频单元1112。可选地，RRU 1110可以包括接收单元和发送单元，接收单元可以对应于接收器(或称接收机、接收电路)，发送单元可以对应于发射器(或称发射机、发射电路)。所述RRU 1110部分主要用于射频信号的收发以及射频信号与基带信号的转换，例如，用于执行上述方法实施例中关于无线接入网设备的操作流程，如，向终端设备发送指示信息等。所述BBU 1120部分主要用于进行基带处理，对基站进行控制等。所述RRU 1110与BBU 1120可以是物理上设置在一起，也可以物理上分离设置的，即分布式基站。

所述BBU 1120为基站的控制中心，也可以称为处理单元，可以与图9中的处理模块920或图10中的处理器1010对应，主要用于完成基带处理功能，如信道编码，复用，调制，扩频等等。例如所述BBU(处理单元)可以用于控制基站执行上述方法实施例中关于无线接入网设备的操作流程，例如，确定目标分割点，生成指示信息等。或，所述BBU(处理单元)可以用于控制基站执行上述方法实施例中关于无线接入网设备的操作流程。

在一个示例中，所述BBU 1120可以由一个或多个单板构成，多个单板可以共同支持单一接入制式的无线接入网(如LTE网)，也可以分别支持不同接入制式的无线接入网(如LTE网，5G网或其他网)。所述BBU 1120还包括存储器1121和处理器1122。所述存储器1121用以存储必要的指令和数据。所述处理器1122用于控制基站进行必要的动作，例如用于控制基站执行上述方法实施例中关于无线接入网设备的操作流程。所述存储器1121和处理器1122可以服务于一个或多个单板。也就是说，可以每个单板上单独设置存储器和处理器。也可以是多个单板共用相同的存储器和处理器。此外每个单板上还可以设置有必要的电路。

应理解，图11所示的基站1100能够实现图4所示方法实施例中涉及无线接入网设备的各个过程。基站1100中的各个模块的操作和/或功能，分别为了实现上述方法实施例中的相应流程。具体可参见上述方法实施例中的描述，为避免重复，此处适当省略详细描述。

当基站1100用于执行上文方法实施例中涉及无线接入网设备的操作流程时，BBU 1120可以用于执行由无线接入网设备内部实现的动作，而RRU 1110可以用于执行无线接入网设备发送、接收及转发的动作。具体请见前面方法实施例中的描述，此处不再赘述。

应理解，图11所示出的基站1100仅为无线接入网设备的一种可能的形态，而不应对本申请构成任何限定。本申请所提供的方法可适用于其他形态的无线接入网设备。例如，包括有源天线单元(active antenna unit，AAU)，还可以包括集中单元(centralized，CU)和/或DU，或者包括BBU和自适应无线单元(adaptive radio unit，ARU)，或BBU。本申请对于无线接入网设备的具体形态不做限定。

本申请还提供了一种芯片系统，所述芯片系统包括至少一个处理器，用于实现上述图4所示实施例中无线接入网设备执行的方法中所涉及的功能，或使得计算机执行图8所示实施例中核心网设备执行的方法中所涉及的功能，例如，接收或处理上述方法中所涉及的数据和/或信息。

在一种可能的设计中，所述芯片系统还包括存储器，所述存储器用于保存程序指令和数据，存储器位于处理器之内或处理器之外。

该芯片系统可以由芯片构成，也可以包含芯片和其他分立器件。

本申请还提供了一种通信系统，包括前述的无线接入网设备、终端设备和第一设备。

本申请还提供了一种通信系统，包括前述的核心网设备、终端设备和第一设备。

本申请还提供了一种计算机可读存储介质，所述计算机存储介质上存储有计算机程序(也可以称为代码，或指令)，当所述计算机程序在被处理器运行时，使得上述图4所示实施例中无线接入网设备执行的方法被执行，或使得上述图8所示的实施例中核心网设备执行的方法被执行。

本申请还提供一种计算机程序产品，所述计算机程序产品包括：计算机程序(也可以称为代码，或指令)，当所述计算机程序被运行时，使得计算机执行图4所示实施例中无线接入网设备执行的方法，或使得计算机执行图8所示实施例中核心网设备执行的方法。

应理解，上述的方法实施例可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。

上述的处理器可以是通用处理器、数字信号处理器(digital signal processor，DSP)、专用集成电路(application specific integrated Circuit，ASIC)、现成可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件或者其任意结合。通用处理器可以是微处理器，也可以是任何常规的处理器等。

结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

本申请实施例中的存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory，ROM)、可编程只读存储器(programmable ROM，PROM)、可擦除可编程只读存储器(erasable PROM，EPROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(static RAM，SRAM)、动态随机存取存储器(dynamic RAM，DRAM)、同步动态随机存取存储器(synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM，DR RAM)。应注意，本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。

上述实施例所提供的方法，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品可以包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁盘)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘solid state disk(SSD))等。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种计算任务的分割方法，其特征在于，包括：

获取终端设备与第一计算任务对应的传输数据量和计算量，所述第一计算任务是基于分割点对神经网络模型的计算任务分割得到的；

基于所述传输数据量、所述计算量，以及所述终端设备与无线接入网设备之间的信道状态，确定所述分割点为目标分割点；

向所述终端设备发送指示信息，所述指示信息指示所述目标分割点。
如权利要求1所述的方法，其特征在于，所述获取终端设备与第一计算任务对应的传输数据量和计算量，包括：

接收来自所述终端设备的第一信息，所述第一信息指示所述传输数据量和所述计算量。
如权利要求1所述的方法，其特征在于，所述获取终端设备与第一计算任务对应的传输数据量和计算量，包括：

接收来自第一设备的第二信息，所述第二信息指示所述传输数据量和所述计算量，所述第一设备为另一终端设备或服务器。
如权利要求1所述的方法，其特征在于，所述获取终端设备与第一计算任务对应的传输数据量和计算量，包括：

接收来自第一设备的第三信息，所述第三信息指示第一设备与第二计算任务对应的传输数据量和计算量，所述第一设备为另一终端设备或服务器；

基于所述第三信息，确定与所述第一计算任务对应的传输数据量和计算量；

其中，所述第一计算任务和所述第二计算任务是基于所述分割点对所述神经网络模型的计算任务分割得到的。
如权利要求1至4中任一项所述的方法，其特征在于，所述目标分割点基于时延或功耗中的至少一项确定；

其中，所述时延为所述终端设备执行所述第一计算任务所需的时间；所述功耗为所述终端设备执行所述第一计算任务所需的功耗。
如权利要求5所述的方法，其特征在于，所述目标分割点基于所述时延确定；以及

所述基于所述传输数据量、所述计算量，以及所述终端设备与无线接入网设备之间的信道状态，确定所述分割点为目标分割点，包括：

基于所述终端设备的算力信息、所述传输数据量、所述计算量，以及所述信道状态，确定所述时延；

基于所述时延，确定所述分割点为所述目标分割点。
如权利要求5所述的方法，其特征在于，所述目标分割点基于所述功耗确定；以及

所述基于所述传输数据量、所述计算量，以及所述终端设备与无线接入网设备之间的信道状态，确定所述分割点为目标分割点，包括：

基于所述传输数据量、所述计算量，以及所述信道状态，确定所述功耗；

基于所述功耗，确定所述分割点为所述目标分割点。
如权利要求5所述的方法，其特征在于，所述目标分割点基于所述时延和所述功耗确定；以及

所述基于所述传输数据量、所述计算量，以及所述终端设备与无线接入网设备之间的信道状态，确定所述分割点为目标分割点，包括：

基于所述终端设备的算力信息、所述传输数据量、所述计算量，以及所述信道状态，确定所述时延和所述功耗；

基于所述时延和所述功耗，确定所述分割点为所述目标分割点。
如权利要求6或8所述的方法，其特征在于，所述算力信息包括所述终端设备完成预定义的测试任务所需的时间或所述终端设备的计算能力中的至少一项；

其中，所述预定义的测试任务包括：基于预定义的测试神经网络模型、预定义的计算类型或预定义的输入数据中的至少一项而执行的任务。
如权利要求1至9中任一项所述的方法，其特征在于，所述方法应用于所述无线接入网设备。
一种通信装置，其特征在于，包括：

获取模块，用于获取终端设备与第一计算任务对应的传输数据量和计算量，所述第一计算任务是基于分割点对神经网络模型的计算任务分割得到的；

处理模块，用于基于所述传输数据量、所述计算量，以及所述终端设备与无线接入网设备之间的信道状态，确定所述分割点为目标分割点；

接口模块，用于向所述终端设备发送指示信息，所述指示信息指示所述目标分割点。
如权利要求11所述的装置，其特征在于，所述获取模块具体用于接收来自所述终端设备的第一信息，所述第一信息指示所述传输数据量和所述计算量。
如权利要求11所述的装置，其特征在于，所述获取模块具体用于接收来自第一设备的第二信息，所述第二信息指示所述传输数据量和所述计算量，所述第一设备为另一终端设备或服务器。
如权利要求11所述的装置，其特征在于，所述获取模块具体用于：

接收来自第一设备的第三信息，所述第三信息指示与第二计算任务对应的传输数据量和计算量，所述第一设备为另一终端设备或服务器；

基于所述第三信息，确定与所述第一计算任务对应的传输数据量和计算量；

其中，所述第一计算任务和所述第二计算任务是基于所述分割点对所述神经网络模型的计算任务分割得到的。
如权利要求11至14任一项所述的装置，其特征在于，所述目标分割点基于时延或功耗中的至少一项确定；

其中，所述时延为所述终端设备执行所述第一计算任务所需的时间；所述功耗为所述终端设备执行所述第一计算任务所需的功耗。
如权利要求15所述的装置，其特征在于，所述目标分割点基于所述时延确定；以及

所述处理模块具体用于：

基于所述终端设备的算力信息、所述传输数据量、所述计算量，以及所述信道状态，确定所述时延；

基于所述时延，确定所述分割点为所述目标分割点。
如权利要求15所述的装置，其特征在于，所述目标分割点基于所述功耗确定；以及

所述处理模块具体用于：

基于所述传输数据量、所述计算量，以及所述信道状态，确定所述功耗；

基于所述功耗，确定所述分割点为所述目标分割点。
如权利要求15所述的装置，其特征在于，所述目标分割点基于所述时延和所述功耗确定；以及

所述处理模块具体用于：

基于所述终端设备的算力信息、所述传输数据量、所述计算量，以及所述信道状态，确定所述时延和所述功耗；

基于所述时延和所述功耗，确定所述分割点为所述目标分割点。
如权利要求16或18所述的装置，其特征在于，所述算力信息包括所述终端设备完成预定义的测试任务所需的时间或所述终端设备的计算能力中的一项或多项；

其中，所述预定义的测试任务包括：基于预定义的测试神经网络模型、预定义的计算类型或预定义的输入数据中的至少一项而执行的任务。
如权利要求11至19任一项所述的装置，其特征在于，所述装置为无线接入网设备，或，所述装置配置于所述无线接入网设备中。
一种通信装置，其特征在于，包括：处理器和通信接口；所述通信接口用于接收来自所述装置之外的其它通信装置的信号并传输至所述处理器，或将来自所述处理器的信号发送给所述装置之外的其它通信装置；所述处理器通过逻辑电路或执行程序指令用于实现如权利要求1至10中任一项所述的方法。
如权利要求21所述的装置，其特征在于，所述装置为无线接入网设备，或，配置在所述无线接入网设备中的芯片。
一种计算机可读存储介质，其特征在于，所述存储介质中存储有计算机程序或指令，当所述计算机程序或指令被计算机执行时，实现如权利要求1至10中任一项所述的方法。
一种计算机程序产品，其特征在于，包括指令，当所述指令被计算机运行时，实现如权利要求1至10中任一项所述的方法。