WO2023116259A1

WO2023116259A1 - 辅助模型切分的方法、装置及可读存储介质

Info

Publication number: WO2023116259A1
Application number: PCT/CN2022/131852
Authority: WO
Inventors: 刘莹莹; 段小嫣
Original assignee: 大唐移动通信设备有限公司
Priority date: 2021-12-23
Filing date: 2022-11-15
Publication date: 2023-06-29
Also published as: CN116341673A

Abstract

本公开提供一种辅助模型切分的方法、装置及可读存储介质，该方法包括：网络实体接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，第一消息中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者用户永久标识SUPI、待使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；网络实体根据第一消息进行分析，确定AI/ML模型切分的切分结果。本公开能够实现基于终端能力对模型切分进行分析，进而有效地实现对终端隐私的保护以及网络资源的优化本法。

Description

辅助模型切分的方法、装置及可读存储介质

本公开要求于2021年12月23日提交中国专利局、申请号为202111608193.5、申请名称为“辅助模型切分的方法、装置及可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本公开中。

技术领域

本公开涉及通信技术领域，尤其涉及一种辅助模型切分的方法、装置及可读存储介质。

背景技术

近年来，由于人工智能的技术突破，人工智能的应用越来越广泛。对于移动终端，由于其具有严格的能耗、计算和内存成本限制，无法在终端运行重量级的人工智能(英文为：Artificial Intelligence，简称为：AI)/机器学习(英文为：Machine Learning，简称为：ML)模型(以下称为AI/ML模型)，因此，目前采用的手段是将许多AI/ML模型的推理从移动终端传输到云或者其他终端，即需要把AI/ML模型传输给云或者其他终端。

此外，在SA#93e通过的SA1R18需求中，需要AI/ML模型传输的场景如下：AI/ML端点之间的AI/ML模型切分，即一个AI/ML模型可以基于当前的任务或者环境切分成多个部分。趋势是将计算复杂，能耗大的部分由网络进行推理，需要隐私保护或者时延敏感的部分在终端推理。

但是，现有技术中，无法实现基于终端能力对模型切分的分析，进而无法有效地实现对终端隐私的保护以及网络资源的优化。

发明内容

本公开提供一种辅助模型切分的方法、装置及可读存储介质，解决了现有技术中无法实现基于终端能力对模型切分的分析，进而无法有效地实现对终端隐私的保护以及网络资源的优化的技术问题。

第一方面，本公开提供一种辅助模型切分的方法，应用于网络实体，所述方法包括：

接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息；

根据所述第一消息，确定AI/ML模型切分的切分结果。

可选的，所述第一消息中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者用户永久标识SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第一消息中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。

可选地，所述根据所述第一消息，确定AI/ML模型切分的切分结果，包括：

根据所述第一消息中的待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量，确定所述待参与模型联合推理的UE(s)对应的模型切分点信息；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则根据所述第一消息中的待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，确定所述待参与模型联合推理的UE(s)对应的模型切分点信息；

将所述模型切分点信息作为所述切分结果。

可选地，所述确定所述待参与模型联合推理的UE(s)对应的模型切分点信息，包括：

将所有确定参与执行模型联合推理的UE(s)中的任一UE作为目标UE，针对每个所述目标UE执行下述步骤：

若所述目标UE可提供的算力低于第一预设算力阈值或所述目标UE可提供的内存低于第一预设内存阈值或所述目标UE剩余的电量低于第一预设电量阈值时，确定所述目标UE执行第一预设数目层的推理；

若所述目标UE可提供的算力高于第一预设算力阈值并低于第二预设算力阈值，和所述目标UE可提供的内存高于第一预设内存阈值并低于第二预设内存阈值，以及所述目标UE剩余的电量高于第一预设电量阈值并低于第二预设预设电量阈值时，确定所述目标UE执行第二预设数目的推理，第一预设数目层小于第二预设数目层；

若所述目标UE可提供的算力高于第二预设算力阈值并低于第三预设算力阈值，和所述目标UE可提供的内存高于第二预设内存阈值并低于第三预设内存阈值，以及所述目标UE剩余的电量高于第二预设电量阈值并低于第三预设电量阈值时，确定所述目标UE执行第三预设数目层的推理，第二预设数目层小于第三预设数目层；以此类推，直至确定所述目标UE执行第N+1预设数目层的推理，第N预设数目层小于第N+1预设数目层；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级低于第一预设隐私等级或模型不同层的时延需求信息低于第一预设时延，则所述目标UE执行所述第一预设数目层的推理；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级高于第一预设隐私等级并低于第二预设隐私等级，和模型不同层的时延需求信息高于第一预设时延并低于第二预设时延时，确定所述目标UE执行第二预设数目层的推理；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级高于第二预设隐私等级并低于第三预设隐私等级，和模型不同层的时延需求信息高于第二预设时延并低于第三预设时延时，确定所述目标UE执行第三预设数目层的推理；以此类推，直至确定所述目标UE执行第N+1预设数目层的推理，第N预设数目层小于第N+1预设数目层；

根据预设数目层确定AI/ML模型切分点信息，所述AI/ML模型切分点信息用于表示AI/ML模型切分比例，所述预设数目层包括第N预设数目层，N大于或等于一。

本公开实施例中，网络实体通过接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，并根据第一消息中的待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE可提供的内存、待参与模型联合推理的UE剩余的电量来确定切分AI/ML模型的模型切分点信息，如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延(其中，如果UE无法提供模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供；如果UE无法提供需要的数据集的隐私等级，基于SA3确认是否可以设定数据集的隐私等级，比如，如果SA3可以提供隐私等级设置，则可以由SA3提供数据集的隐私等级)，还可以结合推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息来确定切分AI/ML模型的模型切分点信息，作为切分结果，用以实现网络实体或待参与模型联合推理的UE基于切分结果对模型进行联合推理操作，因此，实现了基于终端(即UE)能力对模型切分的分析，进而有效地实现对终端隐私的保护以及网络资源的优化。

可选地，如果所述网络实体是网络数据分析功能NWDAF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

直接或通过网络能力开放功能NEF接收应用功能AF发送的第一请求，所述第一请求用于请求对AI/ML模型切分进行分析；其中，所述第一请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接受AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足切分条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型需要数据集的隐私等级和/或模型不同层的时延，所述第一请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第一请求中携带的参数，向5GC NF(s)发送第二消息，所述第二消息用于请求5GC NF(s)采集UE(s)对应的第一数据，所述第一数据中包括下述至少一项：待参与AI/ML模型切分的UE(s)以及SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第一请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第一数据中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收5GC NF(s)发送的所述第一数据，并将所述第一数据作为所述第一消息；所述第一数据是由待参与模型联合推理的UE(s)同意所述第二消息的请求后提供的。

可选地，所述确定AI/ML模型切分的切分结果之后，所述方法还包括：

向所述AF发送第三消息，所述第三消息中包括AI/ML模型切分点信息以及所述第一数据；所述第三消息用于为AF提供向待参与模型联合推理的UE(s)发送第二请求时携带的参数，所述第二请求用于请求与待参与模型联合推理的UE(s)执行模型联合推理操作，所述第二请求中携带的参数包括所述第三消息。

本公开实施例中，当UE(s)和AF(s)联合推理模型(s)时，AF请求NWDAF收集UE的能力进行模型切分点的判断，NWDAF收集并判断后将结果分别反馈给AF，AF发给相关的UE。

直接或通过网络能力开放功能NEF接收AF发送的第三请求；所述第三请求是由AF确定与待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力后确定的，其中，是否具备完全支持执行模型联合推理的能力是由AF根据接收到的待参与模型联合推理的UE(s)发送的第四请求中携带的参数确定的，所述第四请求用于待参与模型联合推理的UE(s)请求与AF进行模型联合推理，所述第四请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第四请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，所述第三请求中携带的参数包括所述第四请求中携带的参数；

将所述第三请求中携带的参数作为所述第一消息；

其中，若第四请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。

向所述AF发送第四消息，所述第四消息中包括所述AI/ML模型切分点信息、所述第一消息中的数据；所述第四消息用于为AF提供向待参与模型联合推理的UE(s)发送的第四请求结果，所述第四请求结果中包括所述AI/ML模型切分点信息。

本公开实施例中，当UE(s)和AF(s)联合推理(多个)模型时，UE上报自身的能力给AF，AF请求NWDAF进行模型切分点的判断，NWDAF把判断结果反馈给AF，AF发送给UE。

可选地，如果所述网络实体是网络数据分析功能NWDAF，所述接收用于请求人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

直接或通过网络能力开放功能NEF接收应用功能AF发送的第五请求，所述第五请求是由AF确定与待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力后确定的，其中，是否具备完全支持执行模型联合推理的能力是由AF根据接收到的待参与模型联合推理的UE(s)发送的第六请求确定的，所述第五请求用于请求对AI/ML模型切分进行分析以及请求查找其他可参与模型推理的UE(s)并提供其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量；其中，所述第五请求中携带的参数包括下述至少一项：与模型切分关联的分析类型标识、接受AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足切分条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第五请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；所述第六请求用于待参与模型联合推理的UE(s)请求与AF进行模型联合推理，所述第六请求中携带的参数包括所述第五请求中携带的参数；

根据所述第五请求中携带的参数，向5GC NF(s)发送第五消息，所述第五消息用于请求5GC NF(s)采集UE(s)对应的第二数据，所述第二数据中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第五请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第二数据中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收5GC NF(s)发送的所述第二数据，并将所述第二数据作为所述第一消息；所述第二数据是由待参与模型联合推理的UE(s)同意所述第五消息的请求后提供的；

其中，若第六请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。

向所述AF发送第六消息，所述第六消息中至少包括所述AI/ML模型切分点信息以及所述第二数据；所述第六消息用于为AF提供向待参与模型联合推理的UE(s)发送的第六请求结果，所述第六请求结果中包括所述待参与模型联合推理的UE(s)以及对应的所述AI/ML模型切分点信息。

本公开实施例中，当UE(s)和AF(s)联合推理模型时，UE上报自身的能力给AF，AF请求NWDAF进行模型切分点的判断并请求其他可参与模型推理的UE(s)参与本模型的推理，NWDAF把收集和判断结果反馈给AF，AF发送给UE。

接收待参与模型联合推理的UE(s)发送的第七请求，所述第七请求用于请求与NWDAF执行模型联合推理操作；所述第七请求中携带的参数包括下述至少一项：待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第七请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；根据所述第七请求中携带的参数，确定AF与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

若与所述待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第七请求中携带的参数作为所述第一消息；

若与所述待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则请求NF查找其他可参与模型推理的UE(s)并提供其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，且若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则请求提供其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NF发送的查找结果，所述查找结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则查找结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

将所述第七请求中携带的参数以及所述查找结果作为所述第一消息；

其中，若第七请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。

向所述待参与模型联合推理的UE(s)发送第七请求结果，所述第七请求结果中包括AI/ML模型切分点信息；

其中，若存在其他参与联合模型推理的UE(s)，则所述第七请求结果中还包括其他参与联合模型推理的UE(s)对应的模型切分点信息，并通过AF透传给所述UE(s)。

本公开实施例中，当UE和NWDAF联合推理模型时，UE通过AF上报自身的能力NWDAF，同时请求NWDAF进行模型切分点的判断，NWDAF把判断结果通过AF反馈给UE。

可选地，如果所述网络实体是应用功能AF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

接收待参与模型联合推理的UE(s)发送的第八请求，所述第八请求用于请求与AF执行模型联合推理操作；所述第八请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第八请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；根据所述第八请求中携带的参数，确定与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

若与所述待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第八请求中携带的参数作为所述第一消息；

若与所述待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则向网络数据分析功能NWDAF发送第九请求，所述第九请求中携带的参数包括所述第八请求中携带的参数，且所述第九请求用于请求NWDAF通过NF查找其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第九请求中携带的参数还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第九请求结果，并将所述第九请求结果以及所述第八请求中携带的参数作为所述第一消息；其中，所述第九请求结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第九请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

若第八请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。

将确定与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力的结果、所述待参与模型联合推理的UE(s)的相关信息以及所述待参与模型联合推理的UE(s)对应的模型切分点信息发送给所述UE；

其中，所述相关信息包括下述至少一项：待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述相关信息中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。

本公开实施例中，当UE和AF联合推理模型时，UE上报自身的能力给AF，AF进行联合推理和模型切分点的判断，然后把判断结果反馈给UE。

向网络数据分析功能NWDAF发送第十请求，所述第十请求用于请求NWDAF向5GC NF(s)采集UE(s)对应的用于分析AI/ML模型切分的数据，所述第十请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第十请求结果，所述第十请求结果包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第十请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第十请求结果中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

将所述第十请求结果作为所述第一消息。

向待参与模型联合推理的UE(s)发送第十一请求，所述第十一请求用于请求与所述待参与模型联合推理的UE(s)执行模型联合推理操作；其中，所述第十一请求中携带的参数包括下述至少一项：模型切分点信息、所述第一消息；

接收待参与模型联合推理的UE(s)发送的第十一请求结果，所述第十一请求结果是由待参与模型联合推理的UE(s)根据第十一请求中携带的参数确定的，所述第十一请求结果包括接受第十一请求或不接受第十一请求。

本公开实施例中，当UE和AF联合推理模型时，AF请求NWDAF收集UE的能力,AF基于收到的分析结果，进行模型切分点的判断，并向相关UE发起联合推理请求。

可选地，如果所述网络实体是新的网络实体(例如，MMF，Model Management Function)，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

直接或通过网络能力开放功能NEF接收应用功能AF发送的第十二请求，所述第十二请求用于请求AI/ML模型切分分析；所述第十二请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十二请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第十二请求中携带的参数，向NWDAF发送第十三请求，所述第十三请求中携带的参数包括所述第十二请求中携带的参数，且所述第十三请求用于请求NWDAF向5GC NF(s)采集UE(s)的用于分析AI/ML模型切分的数据；

接收NWDAF发送的第十三请求结果；其中，所述第十三请求结果包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第十三请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第十二请求结果中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

将所述第十三请求结果作为所述第一消息。

向所述AF发送第八消息，所述第八消息中包括所述AI/ML模型切分点、所述第一消息中的数据；所述第八消息用于为AF提供向待参与模型联合推理的UE(s)发送第十四请求时携带的参数，所述第十四请求用于请求与待参与模型联合推理的UE(s)执行模型联合推理操作，所述第十四请求中携带的参数包括所述第八消息。

本公开实施例中，当UE和AF联合推理模型时，AF请求新的网络实体MMF进行模型切分，MMF请求NWDAF收集UE的能力,MMF基于收到的分析结果，进行模型切分点的判断，并向AF反馈结果，AF向相关UE发起联合推理请求。

可选地，如果所述网络实体是新的网络实体MMF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

直接或通过网络能力开放功能NEF接收应用功能AF发送的第十五请求，所述第十五请求用于请求AI/ML模型切分分析，所述第十五请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十五请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第十五请求中携带的参数，确定AF与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

若与所述待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第十五请求中携带的参数作为所述第一消息；

若与所述待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则向NWDAF发送第十六请求，所述第十六请求中携带的参数包括所述第十五请求中携带的参数，且所述第十六请求用于请求NWDAF通过NF查找其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十六请求中携带的参数还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第十六请求结果，并将所述第十六请求结果以及所述第十五请求中携带的参数作为所述第一消息；其中，所述第十六请求结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十六请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。

向所述AF发送第十五请求结果，所述第十五请求结果中包括AI/ML模型切分点信息；

其中，若存在其他参与联合模型推理的UE(s)，则所述第十五请求结果中还包括其他参与联合模型推理的UE(s)对应的模型切分点信息，并通过AF透传给所述待参与模型联合推理的UE(s)。

本公开实施例中，当UE和AF联合推理模型时，UE上报自身能力给AF请求模型联合推理，AF将自身以及UE能力传给MMF，请求MMF进行模型切分，MMF判断如果需要其他UE(s)参与模型联合推理，则MMF请求NWDAF收集其他UE(s)的信息，MMF基于收集的信息进行模型切分并将结果反馈给AF。

可选地，如果所述网络实体是策略控制功能PCF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

直接或通过网络能力开放功能NEF接收应用功能AF发送的第十七请求，所述第十七请求用于请求AI/ML模型切分分析；所述第十七请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十七请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第十七请求中携带的参数，向网络数据分析功能NWDAF发送第十八请求，所述第十八请求中携带的参数包括所述第十七请求中携带的参数，且所述第十八请求用于请求NWDAF向5GC NF(s)采集UE(s)对应的第五数据；所述第五数据中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第五数据中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第十八请求结果；其中，所述第十八请求结果包括所述第五数据；

将所述第十八请求结果作为所述第一消息。

向所述AF发送第九消息，所述第九消息中包括所述AI/ML模型切分点、所述第一消息的数据；所述第九消息用于为AF提供向待参与模型联合推理的UE(s)发送第十九请求时携带的参数，所述第十九请求用于请求与待参与模型联合推理的UE(s)执行模型联合推理操作，所述第十九请求中携带的参数包括所述第九消息。

本公开实施例中，当UE和AF联合推理模型时，AF请求PCF进行模型切分的策略判断，PCF请求NWDAF收集UE的能力,PCF基于收到的分析结果，进行模型切分点的判断，并向AF反馈结果，AF向相关UE发起联合推理请求。

直接或通过网络能力开放功能NEF接收应用功能AF发送的第二十请求，所述第二十请求用于请求AI/ML模型切分分析，所述第二十请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二十请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第二十请求中携带的参数，确定所述AF以及待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

若所述AF以及待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第二十请求中携带的参数作为所述第一消息；

若所述AF以及待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则向NWDAF发送第二十一请求，所述第二十一请求中携带的参数包括所述第二十请求中携带的参数，且所述第二十一请求用于请求NWDAF通过NF查找其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二十一请求中携带的参数还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第二十一请求结果，并将所述第二十一请求结果以及所述第二十请求中携带的参数作为所述第一消息；其中，所述第二十一请求结果包括：其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二十一请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息

若第二十请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。

向所述AF发送第二十请求结果，所述第二十请求结果中包括AI/ML模型切分点信息；

其中，若存在其他参与联合模型推理的UE(s)，则所述第二十请求结果中还包括其他参与联合模型推理的UE(s)对应的模型切分点信息，并通过AF透传给所述UE(s)。

本公开实施例中，当UE和AF联合推理模型时，UE上报自身能力给AF请求模型联合推理，AF将自身以及UE能力发给PCF，请求PCF进行模型切分，PCF判断如果需要其他UE(s)参与模型联合推理，则PCF请求NWDAF收集其他UE(s)的信息，PCF基于收集的信息进行模型切分并将结果反馈给AF。

第二方面，本公开提供一种辅助模型切分的方法，所述方法应用于用户设备UE，所述方法包括：

根据自身能力信息，确定AI/ML模型切分点信息；

将所述AI/ML模型切分点信息作为AI/ML模型切分的切分结果。

可选地，所述根据自身能力信息，确定AI/ML模型切分点信息，包括：

根据自身能力信息中的可提供的算力、可提供的内存以及剩余的电量，确定模型切分点信息；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则根据所述自身能力信息中的可提供的算力、可提供的内存、剩余的电量、推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，确定模型切分点信息。

可选地，所述确定模型切分点信息，包括：

若所述目标UE可提供的算力高于第二预设算力阈值并低于第三预设算力阈值，和所述目标UE可提供的内存高于第二预设内存阈值并低于第三预设内存阈值，以及所述目标UE剩余的电量高于第二预设电量阈值并低于第三预设电量阈值时，确定所述目标UE执行第三预设数目层的推理，第二预设数目层小于第三预设数目层；以此类推，直至确定所述目标UE执行第N+1 预设数目层的推理，第N预设数目层小于第N+1预设数目层；

本公开实施例中，根据自身能力信息中的可提供的算力、可提供的内存以及剩余的电量，确定模型切分点信息；如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，还可以结合自身能力信息中的推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息来确定切分AI/ML模型的模型切分点信息，作为切分结果，用以实现网络实体或待参与模型联合推理的UE基于切分结果对模型进行联合推理操作，因此，实现了基于终端(即UE)能力对模型切分的分析，进而有效地实现对终端隐私的保护以及网络资源的优化。

向应用功能AF发送第一请求，所述第一请求用于请求与所述AF执行模型联合推理操作；其中，所述第一请求中携带的参数包括下述至少一项AI/ML模型切分点、与模型标识或模型切分标识关联的分析类型标识、接收AI/ML 模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE可提供的内存、待参与模型联合推理的UE剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第一请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收AF发送的第一请求结果，所述第一请求结果是由AF根据第一请求中携带的参数确定的，所述第一请求结果包括接受第一请求或不接受第一请求；

其中，若第一请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。

本公开实施例中，当UE和AF联合推理模型时，UE基于自身能力进行模型切分点的判断，上报模型切分点(模型切分比例)给AF，并进行联合推理交互。

通过AF向网络数据分析功能NWDAF发送第二请求，所述第二请求用于请求与所述NWDAF执行模型联合推理操作；其中，所述第二请求中携带的参数包括下述至少一项AI/ML模型切分点、与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE可提供的内存、待参与模型联合推理的UE剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第二请求结果，所述第二请求结果是由NWDAF根据第一请求中携带的参数确定的，所述第二请求结果包括接受第一请求或不接受第一请求；

其中，若第二请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。

本公开实施例中，当UE和NWDAF联合推理模型时，UE基于自身能力进行模型切分点的判断，上报NWDAF，并进行联合推理交互。

第三方面，本公开提供一种辅助模型切分的装置，所述装置应用于网络实体，所述装置包括存储器，收发机，处理器：

存储器，用于存储计算机程序；收发机，用于在所述处理器的控制下收发数据；处理器，用于读取所述存储器中的计算机程序并执行以下操作：

根据所述第一消息，确定AI/ML模型切分的切分结果。

第四方面，本公开提供一种辅助模型切分的装置，所述装置应用于用户设备UE，所述装置包括存储器，收发机，处理器：

根据自身能力信息，确定AI/ML模型切分点信息；

将所述AI/ML模型切分点信息作为AI/ML模型切分的切分结果。

第五方面，本公开提供一种辅助模型切分的装置，所述装置应用于网络实体，所述装置包括：

接收单元，用于接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息；

确定单元，用于根据所述第一消息，确定AI/ML模型切分的切分结果。

第六方面，本公开提供一种辅助模型切分的装置，所述装置应用于用户设备UE，所述装置包括：

确定单元，用于根据自身能力信息，确定AI/ML模型切分点信息；

处理单元，用于将所述AI/ML模型切分点信息作为AI/ML模型切分的切分结果。

第七方面，本公开提供一种处理器可读存储介质，所述处理器可读存储介质存储有计算机程序，所述计算机程序用于使所述处理器执行第一方面或第二方面任一项所述的方法。

本公开提供一种辅助模型切分的方法、装置及可读存储介质，通过接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，并根据第一消息中的待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE 可提供的内存、待参与模型联合推理的UE剩余的电量来确定切分AI/ML模型的模型切分点信息，如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，还可以结合推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息来确定切分AI/ML模型的模型切分点信息，作为切分结果，用以实现网络实体或待参与模型联合推理的UE基于切分结果对模型进行联合推理操作，因此，实现了基于终端(即UE)能力对模型切分的分析，进而有效地实现对终端隐私的保护以及网络资源的优化。

应当理解，上述发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征，亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。

附图说明

为了更清楚地说明本公开或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的支持网络数据分析的5GC的网络架构图；

图2为本公开实施例提供的辅助模型切分的方法的第一流程示意图；

图3为本公开实施例一提供的当网络实体是NWDAF时辅助模型切分的方法的第一信令流程示意图；

图4为本公开实施例一提供的当网络实体是NWDAF时辅助模型切分的方法的第二信令流程示意图；

图5为本公开实施例一提供的当网络实体是NWDAF时辅助模型切分的方法的第三信令流程示意图；

图6为本公开实施例一提供的当网络实体是NWDAF时辅助模型切分的方法的第四信令流程示意图；

图7为本公开实施例二提供的当网络实体是AF时辅助模型切分的方法的第一信令流程示意图；

图8为本公开实施例二提供的当网络实体是AF时辅助模型切分的方法的第二信令流程示意图；

图9为本公开实施例三提供的当网络实体是MMF时辅助模型切分的方法的第一信令流程示意图；

图10为本公开实施例三提供的当网络实体是MMF时辅助模型切分的方法的第二信令流程示意图；

图11为本公开实施例四提供的当网络实体是PCF时辅助模型切分的方法的第一信令流程示意图；

图12为本公开实施例四提供的当网络实体是PCF时辅助模型切分的方法的第二信令流程示意图；

图13为本公开实施例提供的辅助模型切分的方法的第二流程示意图；

图14为本公开实施例提供的辅助模型切分的装置的结构示意图；

图15为本公开另一实施例提供的辅助模型切分的装置的结构示意图；

图16为本公开再一实施例提供的辅助模型切分的装置的结构示意图；

图17为本公开又一实施例提供的辅助模型切分的装置的结构示意图。

具体实施方式

本公开中术语“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，并不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

为了清楚理解本公开的技术方案，首先对现有技术的方案进行详细介绍。现有技术中，在SA#93e通过的SA1R18需求中，需要AI/ML模型传输的场景如下：AI/ML端点之间的AI/ML模型切分。

一个AI/ML模型可以基于当前的任务或者环境切分成多个部分。趋势是将计算复杂，能耗大的部分由网络进行推理，需要隐私保护或者时延敏感的部分在终端推理。例如，终端下载/机载一个模型，先推理特定几层/部分，然后把中间结果发送给网络；网络再执行剩余层/部分，然后把推理结果反馈给终端。趋势是将计算复杂，能耗大的部分由网络进行推理，需要隐私保护或者时延敏感的部分在终端推理。

该场景中，需要支持和辅助AI/ML模型用户(例如，application client running on the UE，即应用程序客户端运行在UE上)对模型的应用层本地训练，并支持将应用层推理反馈给AI/ML模型提供者(例如，应用功能(英文为：Application Function，简称为：AF))。

发明人进一步研究发现，要基于终端能力对模型切分进行有效地分析，进而确定模型切分点，需要网络实体或者终端基于终端的电量、可提供的内存、可提供的算力等信息，以及关于此模型的时延需求以及关于此模型需要的推理数据集的隐私等级等，选择出模型切分点，然后网络实体或者终端将模型切分点信息发送给参与模型联合推理的网络实体或者终端实现基于终端能力对模型切分的分析，进而有效地实现对终端隐私的保护以及网络资源的优化。

所以基于上述发明人的创造性研究，提出了本公开提出的辅助模型切分的方法，本公开中，网络实体通过接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，并根据第一消息中的待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量来确定切分AI/ML模型的模型切分点信息，如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，还可以结合推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息来确定切分AI/ML模型的模型切分点信息，作为切分结果，用以实现网络实体或待参与模型联合推理的UE(s)基于切分结果对模型进行联合推理操作，因此，实现了基于终端(即UE)能力对模型切分的分析，进而有效地实现对终端隐私的保护以及网络资源的优化。结合图1所示，图1为本公开实施例提供的支持网络数据分析的5GC的网络架构图，如图1所示，本公开实施例中，网络数据分析功能(英文为：Network data analytic function，简称为：NWDAF)是运营商管理的网络分析功能，NWDAF能够向5G核心网(英文为：5G Core Network，简称为：5GC)中各个网络功能(英文为：Network Function，简称为：NF)(即NF(s))、应用功能(英文为：Application Function，简称为： AF)和操作管理维护(英文为：Operation Administration and Maintenance，简称为：OAM)提供数据分析服务。其中，分析结果可以是历史统计信息或者预测信息。NWDAF可以服务一个或多个网络切片。

其中，在5GC中还包括其他多种功能。分别为用户平面功能(英文为：User Plane Function，简称为：UPF)、会话管理功能(英文为：Session Management Function，简称为：SMF)、接入和移动性管理功能(英文为：Access and Mobility Management Function，简称为：AMF)、统一数据库(英文为：Unified Data Repository，简称为：UDR)、网络能力开放功能(英文为：Network Exposure Function，简称为：NEF)、AF、策略控制功能(英文为：Policy Control Function，简称为：PCF)及在线计费系统(英文为：Online Charging System，简称为：OCS)。其中，这些其他功能均可统称为NF。NWDAF基于服务化接口与5G核心网中其他功能实体5GC NF(s)及OAM进行通信。

5GC中可以有不同NWDAF实例提供不同类型的专用分析。为了让消费者NF能够发现合适的NWDAF实例来提供特定类型的分析，NWDAF实例需在向网络数据库功能(英文为：Network Repository Function，简称为：NRF)注册时提供其支持Analytic ID，Analytic ID代表了分析类型标识(这样消费者NF可以在向NRF查询NWDAF实例时，提供Analytic ID来指示需要何种类型的分析。5GC网络功能和OAM决定如何使用网络数据分析功能NWDAF提供的数据分析来提高网络性能。

本公开实施例中，在一种应用场景中，网络实体或者终端基于终端的电量、可提供的内存、可提供的算力等信息，以及关于此模型的时延需求以及关于此模型需要的推理数据集的隐私等级等，选择出模型切分点，网络实体或者终端将模型切分点信息发送给参与模型联合推理的网络实体或者终端。

其中，可提供的算力可以是终端的剩余运存。

因此，网络实体或终端根据终端可提供的算力、终端可提供的内存、终端剩余的电量来确定切分AI/ML模型的模型切分点信息，如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，还可以结合推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息来确定切分AI/ML模型的模型切分点信息，作为切分结果，用以实现网络实体或终端基于切分结果对模型进行联合推理操作，因此，实现了基于终端(即UE(s)) 能力对模型切分的分析，进而有效地实现对终端隐私的保护以及网络资源的优化。

需要说明的是，UE(s)可以为一个UE或多个UE(或一组UE或任意UEs)，其UE的数量可以根据具体场景确定。此外，下述实施例中针对UE上报的可提供的算力、可提供的内存、剩余的电量等场景，对于UE侧来说，是每个UE进行上报，其上报的参数为该UE自身的参数(比如该UE可提供的算力、可提供的内存、剩余的电量)；对于接收侧来说，接收每个UE上报的参数，即接收到的是各个UE上报的参数(结合来说，接收到的参数有各个UE(或UE(s))可提供的算力、可提供的内存、剩余的电量)。

以下将参照附图来描述本公开的实施例。

图2为本公开实施例提供的辅助模型切分的方法的第一流程示意图，如图2所示，本实施例提供的辅助模型切分的方法的执行主体为网络实体，该网络实体可以是NWDAF、AF、新的网络实体功能(例如，英文为：Model Management Function，简称为：MMF)功能、PCF中的任一个。本公开实施例提供的辅助模型切分的方法包括以下步骤：

步骤101、网络实体接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息。

可选地，所述第一消息中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者用户永久标识SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；

其中，接收第一消息的具体方式可以依据具体的网络实体在相应的场景下确定，在此不做具体地限定。

步骤102、网络实体根据所述第一消息，确定AI/ML模型切分的切分结果。

可选地，所述根据所述第一消息，确定AI/ML模型切分的切分结果，可以通过以下步骤实现：

步骤a1、根据所述第一消息中的待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量，确定所述待参与模型联合推理的UE(s)对应的模型切分点信息；

步骤a2、若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则根据所述第一消息中的待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，确定所述待参与模型联合推理的UE(s)对应的模型切分点信息；

步骤a3、将所述模型切分点信息作为所述切分结果。

具体地，网络实体可以基于终端的电量、可提供的内存、可提供的算力等信息，以及关于此模型的时延需求以及关于此模型需要的推理数据集的隐私等级等，选择出模型切分点(即模型切分点信息或AI/ML模型切分点信息)，然后网络实体将模型切分点信息发送给参与模型联合推理的网络实体或者终端。

可选地，所述确定所述待参与模型联合推理的UE(s)对应的模型切分点信息，可以通过以下步骤实现：

步骤b1、将所有确定参与执行模型联合推理的UE中的任一UE作为目标UE，针对每个所述目标UE执行下述步骤：

步骤b2、若所述目标UE可提供的算力低于第一预设算力阈值或所述目标UE可提供的内存低于第一预设内存阈值或所述目标UE剩余的电量低于第一预设电量阈值时，确定所述目标UE执行第一预设数目层的推理；

步骤b3、若所述目标UE可提供的算力高于第一预设算力阈值并低于第二预设算力阈值，和所述目标UE可提供的内存高于第一预设内存阈值并低于第二预设内存阈值，以及所述目标UE剩余的电量高于第一预设电量阈值并低于第二预设预设电量阈值时，确定所述目标UE执行第二预设数目的推理，第一预设数目层小于第二预设数目层；

步骤b4、若所述目标UE可提供的算力高于第二预设算力阈值并低于第三预设算力阈值，和所述目标UE可提供的内存高于第二预设内存阈值并低于第三预设内存阈值，以及所述目标UE剩余的电量高于第二预设电量阈值并低于第三预设电量阈值时，确定所述目标UE执行第三预设数目层的推理，第二预设数目层小于第三预设数目层；以此类推，直至确定所述目标UE执行第N+1预设数目层的推理，第N预设数目层小于第N+1预设数目层；

步骤b5、若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级低于第一预设隐私等级或模型不同层的时延需求信息低于第一预设时延，则所述目标UE执行所述第一预设数目层的推理；

步骤b6、若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级高于第一预设隐私等级并低于第二预设隐私等级，和模型不同层的时延需求信息高于第一预设时延并低于第二预设时延时，确定所述目标UE执行第二预设数目层的推理；

步骤b7、若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级高于第二预设隐私等级并低于第三预设隐私等级，和模型不同层的时延需求信息高于第二预设时延并低于第三预设时延时，确定所述目标UE执行第三预设数目层的推理；以此类推，直至确定所述目标UE执行第N+1预设数目层的推理，第N预设数目层小于第N+1预设数目层；

步骤b8、根据预设数目层确定AI/ML模型切分点信息，所述AI/ML模型切分点信息用于表示AI/ML模型切分比例，所述预设数目层包括第N预设数目层，N大于或等于一。

具体地，参与模型联合推理的每个UE都需要确定其推理的层数或部分，针对每个UE(即目标UE)可以通过以下过程实现切分点的确定：

目标UE的可提供的算力和内存较少、剩余的电量较低时，只能做较少层的推理，如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且隐私等级需求较高和/或模型不同层的时延需求较低时做较少层的推理；如果UE的可提供的算力和内存充足、剩余的电量较高时，可以做较多层的推理，如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且隐私等级需求较低和/或模型不同层的时延需求较高时做较多层的推理。例如，假设对于一个8层的AI/ML模型，UE1可以做两层的推理(比如，UE1做前两层的推理)、UE2可以做三层的推理(比如，UE2做中间三层的推理)，AF做最后三层的推理，即UE1对应模型切分点1，UE2对应模型切分点2。

本实施例中，网络实体通过接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，并根据第一消息中的待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量来确定切分AI/ML模型的模型切分点信息，如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，还可以结合推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息来确定切分AI/ML模型的模型切分点信息，作为切分结果，用以实现网络(AF)和待参与模型联合推理的UE(s)基于切分结果对模型进行联合推理，因此，实现了基于终端(即UE)能力对模型切分的分析，进而有效地实现对终端隐私的保护以及网络资源的优化。

示例性地，实施例一(网络实体为NWDAF，NWDAF进行模型切分点的判断)，下述以至少四种场景为例对辅助模型切分的方法进行详细说明。

场景11：当UE(s)和AF(s)联合推理模型(s)时，AF请求NWDAF收集UE的能力进行模型切分点的判断，NWDAF收集并判断后将结果分别反馈给AF，AF发给相关的UE。

可选地，如果所述网络实体是网络数据分析功能NWDAF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，可以包括以下步骤：

步骤c11、直接或通过网络能力开放功能NEF接收应用功能AF发送的第一请求，所述第一请求用于请求对AI/ML模型切分进行分析；其中，所述第一请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接受AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足切分条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第一请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤c12、根据所述第一请求中携带的参数，向5GC NF(s)发送第二消息，所述第二消息用于请求5GC NF(s)采集UE(s)对应的第一数据，所述第一数据中包括下述至少一项：待待参与AI/ML模型切分的UE(s)以及SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第一请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第一数据中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤c13、接收5GC NF(s)发送的所述第一数据，并将所述第一数据作为所述第一消息；所述第一数据是由待参与模型联合推理的UE(s)同意所述第二消息的请求后提供的。

具体地，参见图3，图3为本公开实施例一提供的当网络实体是NWDAF时辅助模型切分的方法的第一信令流程示意图。具体步骤为：(301a是AF在受信任区域，301b、301c是AF在不受信任区；步骤305a是AF在受信任区域，305b，305c是AF在不受信任区。)

步骤301a，AF向NWDAF发送Nnwdaf_MLModelSplit_Request(即机器学习模型切分请求)，请求中包含和Model ID关联的Analytics ID(即分析类型标识)＝MLModelSplit，请求NWDAF收集UE(即待参与模型联合推理的UE(s))的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及可选的包含模型不同层的时延需求等信息，如下表1：

表1

步骤301b，AF向NEF发送Nnef_MLModelSplit_Request(即机器学习模型切分请求)，请求中包含上述表1中的信息。

步骤301c，NEF授权后，向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含上述表1中的信息。

步骤302，NWDAF调用Nnf_EventExposure_Subscribe(即事件开放订阅) 向5GC NF(s)(例如，AMF/SMF)采集UE(s)的可提供的算力、可提供的内存、剩余的电量，(如果有)推理此模型需要的数据集的隐私等级，以及(如果能提供)模型不同层的时延需求；5GC NF(s)(例如，AMF/SMF)将这些请求信息发送给终端，终端收到这个请求，(如果终端通过这个请求)就准备和该Analytics ID(Model ID)对应的电量、内存、算力，(如果有)数据集的隐私等级等信息反馈(参见表2)给NF(例如，AMF/SMF)。

表2

步骤303，5GC NF(s)调用Nnf_EventExposure_Notify(即事件开放通知)向NWDAF反馈所需数据。

步骤304，NWDAF执行分析,基于UE的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及模型不同层的时延需求，选出模型切分点(或者模型切分比例)。

例如，UE的可提供的算力和内存较少、剩余的电量较低时，只能做较少层的推理，如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且隐私等级需求较高和/或模型不同层的时延需求较低时做较少层的推理；如果UE的可提供的算力和内存充足、剩余的电量较高时，可以做较多层的推理，如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且隐私等级需求较低和/或模型不同层的时延需求较高时做较多层的推理；例如，假设对于一个8层的ML模型，UE1可以做前两层的推理、UE2做中间三层的推理，AF做最后三层的推理，即UE1对应模型切分点1，UE2对应模型切分点2。

305a，通过Nnwdaf_MLModelSplit_Request Response(即机器学习模型切分请求的响应)将模型切分点(或者模型切分比例)等信息(如下表3)发送给AF。

表3

步骤305b，NWDAF向NEF发送Nnwdaf_MLModelSplit_Request Response，内容包含上述模型切分点(或者模型切分比例)等的信息。

步骤305c，NEF授权后，向NWDAF发送Nnef_MLModelSplit_Request response(即机器学习模型切分请求的响应)，内容包含上述模型切分点(或者模型切分比例)等的信息。

步骤306，AF和相关UE(s)建立连接。

步骤307，AF向相关UE(s)发送模型联合推理请求Naf_MLModelJointInference_Request(即模型联合推理请求)，请求中包含模型切分点(或者模型切分比例)信息。

步骤308，UE(s)向AF发送模型联合推理请求的响应Naf_MLModelJointInference_Request response(即模型联合推理请求的响应)，表示是否接受这个模型联合推理请求。

场景12：当UE(s)和AF(s)联合推理(多个)模型时，UE上报自身的能力给AF，AF请求NWDAF进行模型切分点的判断，NWDAF把判断结果反馈给AF，AF发送给UE。

可选的，如果所述网络实体是网络数据分析功能NWDAF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，可以通过包括以下步骤：

直接或通过网络能力开放功能NEF接收AF发送的第三请求；所述第三请求是由AF确定与待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力后确定的，其中，是否具备完全支持执行模型联合推理的能力是由AF根据接收到的待参与模型联合推理的UE(s)发送的第四请求中携带的参数确定的，所述第四请求用于待参与模型联合推理的UE(s)请求与AF进行模型联合推理，所述第四请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第四请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，所述第三请求中携带的参数包括所述第四请求中携带的参数；将所述第三请求中携带的参数作为所述第一消息；

向所述AF发送第四消息，所述第四消息中包括所述AI/ML模型切分点、所述第一消息中的数据；所述第四消息用于为AF提供向待参与模型联合推理的UE(s)发送的第四请求结果，所述第四请求结果中包括所述AI/ML模型切分点信息。

具体地，参见图4，图4为本公开实施例一提供的当网络实体是NWDAF时辅助模型切分的方法的第二信令流程示意图。具体步骤为：(404a是AF在受信任区域，404b、404c是AF在不受信任区；步骤405a是AF在受信任区域，405b、405c是AF在不受信任区。)

步骤400，AF和UE建立连接

步骤401，UE发起和AF进行模型联合推理请求Naf_MLModelJointInference_Request，请求中包含和Model ID关联的Analytics ID＝MLModelSplit、UE自身的可提供的算力、可提供的内存、剩余的电量等信息；如果有推理AI/ML模型时需要数据集的隐私等级，则请求中还包含推理AI/ML模型需要的数据集的隐私等级，如果没有，基于SA3确认是否可以设定；如果有推理AI/ML模型时需要模型不同层的时延需求信息，则请求中还包含模型不同层的时延需求信息，如果没有，由AF提供。

步骤402，AF判断这个联合推理请求。

步骤403a，AF向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含和Model ID关联的Analytics ID＝MLModelSplit，UE的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及模型不同层的时延需求等信息，并请求NWDAF进行模型切分点的判断。

步骤403b，AF向NEF发送Nnef_MLModelSplit_Request，请求中包含上述信息。

步骤403c，NEF授权后，向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含上述信息。

步骤404，NWDAF执行分析,基于UE的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及模型不同层的时延需求，选出模型切分点(或者模型切分比例)。

例如，UE的可提供的算力、可提供的内存、剩余的电量较低时，只能做较少层的推理，如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且隐私等级需求较高和/或模型不同层的时延需求较低时做较少层的推理；如果UE的可提供的算力和内存充足、剩余的电量较高时，可以做较多层的推理，如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且隐私等级需求较低和/或模型不同层的时延需求较高时做较多层的推理。例如，假设对于一个8层的ML模型，UE1可以做前两层的推理、UE2做中间三层的推理，AF做最后三层的推理，即UE1对应模型切分点1，UE2对应模型切分点2。

步骤405a，NWDAF通过Nnwdaf_MLModelSplit_Request Response将模型切分点(或者模型切分比例)等信息发送给AF。

步骤405b，NWDAF向NEF发送Nnwdaf_MLModelSplit_Request Response，内容包含上述模型切分点(或者模型切分比例)。

步骤505c，NEF授权后，向NWDAF发送Nnef_MLModelSplit_Request response，内容包含上述模型切分点(或者模型切分比例)。

步骤406，AF把模型联合推理请求的响应Naf_MLModelJointInference_Request response发送给UE，响应中包含模型切分点(或者模型切分比例)。

场景13、当UE(s)和AF(s)联合推理模型时，UE上报自身的能力给AF，AF请求NWDAF进行模型切分点的判断并请求其他可参与模型推理的UE(s)参与本模型的推理，NWDAF把收集和判断结果反馈给AF，AF发送给UE。

可选地，如果所述网络实体是网络数据分析功能NWDAF，所述接收用于请求人工智能/机器学习AI/ML模型切分分析的第一消息，可以包括以下步骤：

步骤c31、直接或通过网络能力开放功能NEF接收应用功能AF发送的第五请求，所述第五请求是由AF确定与待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力后确定的，其中，是否具备完全支持执行模型联合推理的能力是由AF根据接收到的待参与模型联合推理的UE(s)发送的第六请求确定的，所述第五请求用于请求对AI/ML模型切分进行分析以及请求查找其他可参与模型推理的UE(s)并提供其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量；其中，所述第五请求中携带的参数包括下述至少一项：与模型切分关联的分析类型标识、接受AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足切分条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第五请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；所述第六请求用于待参与模型联合推理的UE(s)请求与AF进行模型联合推理，所述第六请求中携带的参数包括所述第五请求中携带的参数；

步骤c32、根据所述第五请求中携带的参数，向5GC NF(s)发送第五消息，所述第五消息用于请求5GC NF(s)采集UE(s)对应的第二数据，所述第二数据中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第五请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第二数据中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤c33、接收5GC NF(s)发送的所述第二数据，并将所述第二数据作为所述第一消息；所述第二数据是由待参与模型联合推理的UE(s)同意所述第五消息的请求后提供的；

向所述AF发送第六消息，所述第六消息中至少包括所述AI/ML模型切分点信息以及所述第二数据；所述第六消息用于为AF提供向待参与模型联合推理的UE(s)发送的第六请求结果，所述第六请求结果中包括所述待参与模型联合推理的UE(s)对应的所述AI/ML模型切分点信息、所述其他可参与模型推理的UE(s)以及对应的所述AI/ML模型切分点信息。

具体地，参见图5，图5为本公开实施例一提供的当网络实体是NWDAF时辅助模型切分的方法的第三信令流程示意图。具体步骤为：(步骤503a是 AF在受信任区域，步骤503b、步骤503c是AF在不受信任区；步骤507a是AF在受信任区域，步骤507b、步骤507c是AF在不受信任区。)

步骤500-501同场景12的实施例中的步骤400-401所描述。(即：

步骤500，AF和UE建立连接。

步骤501，UE发起和AF进行模型联合推理请求Naf_MLModelJointInference_Request，请求中包含和Model ID关联的Analytics ID＝MLModelSplit，UE自身的可提供的算力、可提供的内存、剩余的电量等信息；如果有推理AI/ML模型时需要数据集的隐私等级，则请求中还包含推理AI/ML模型需要的数据集的隐私等级，如果没有，基于SA3确认是否可以设定；如果有推理AI/ML模型时需要模型不同层的时延需求信息，则请求中还包含模型不同层的时延需求信息，如果没有，由AF提供。步骤502，AF判断联合推理请求，如果判断UE和AF自身能力不够做联合推理，则认为需要其他UE(s)帮忙进行模型切分。

步骤503a，AF向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含和Model ID关联的Analytics ID＝MLModelSplit，UE的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及模型不同层的时延需求等信息，以及请求NWDAF帮忙发现其他可参与模型推理的UE(s)以及其相关的可提供的算力、可提供的内存、剩余的电量等并请求NWDAF进行模型切分点的判断。

步骤503b，AF向NEF发送Nnef_MLModelSplit_Request，请求中包含上述信息。

步骤503c，NEF授权后，向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含上述信息。

步骤步骤504-步骤505同场景11的实施例中的步骤302-303所描述(即：

步骤504，NWDAF调用Nnf_EventExposure_Subscribe向5GC NF(s)(例如，AMF/SMF)采集UE(s)的可提供的算力、可提供的内存、剩余的电量，(如果有)推理此模型需要的数据集的隐私等级，以及(如果能提供)模型不同层的时延需求；5GC NF(s)(例如，AMF/SMF)将这些请求信息发送给终端，终端收到这个请求，(如果通过这个请求)就准备和该Analytics ID(Model ID)对应的电量、内存、算力，(如果有)数据集的隐私等级等信息反馈给 NF(例如，AMF/SMF)。

步骤505，5GC NF(s)调用Nnf_EventExposure_Notify向NWDAF反馈所需数据)。

步骤506，NWDAF执行分析,并基于output data中的可参与模型切分的列表中的UE(s)，以及和他们对应的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及模型不同层的时延需求，选出模型切分点(或者模型切分比例)。

步骤507(即步骤507a-507c)同场景11的实施例中的步骤305(即步骤305a-305c)所描述(即：

步骤507a,通过Nnwdaf_MLModelSplit_Request Response将模型切分点(或者模型切分比例)等信息发送给AF，如表3。

步骤507b，NWDAF向NEF发送Nnwdaf_MLModelSplit_Request Response，内容包含上述模型切分点(或者模型切分比例)等的信息。

步骤507c，NEF授权后，向NWDAF发送Nnef_MLModelSplit_Request response，内容包含上述模型切分点(或者模型切分比例)等的信息)。

步骤508，AF把模型联合推理请求的响应Naf_MLModelJointInference_Request response发送给UE，响应中包含模型切分点(或者模型切分比例)以及其他可参与模型推理的UE(s)以及其相关的模型切分点(或者模型切分比例)信息。

场景14：当UE和NWDAF联合推理模型时，UE通过AF上报自身的能力NWDAF，同时请求NWDAF进行模型切分点的判断，NWDAF把判断结果通过AF反馈给UE。

步骤c41、接收待参与模型联合推理的UE(s)发送的第七请求，所述第七请求用于请求与NWDAF执行模型联合推理操作；所述第七请求中中携带的参数包括下述至少一项：待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第七请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；根据所述第七请求中携带的参数，确定AF与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

步骤c42、若与所述待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第七请求中携带的参数作为所述第一消息待参与AI/ML模型切分的UE(s)待参与模型联合推理的UE(s)待参与模型联合推理的UE(s)待参与模型联合推理的UE(s)；

步骤c43、若与所述待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则请求NF查找其他可参与模型推理的UE(s)并提供其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，且若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则请求提供其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤c44、接收NF发送的查找结果，所述查找结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则查找结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤c45、将所述第七请求中携带的参数以及所述查找结果作为所述第一消息；

其中，若存在其他参与联合模型推理的UE(s)，则所述第七请求结果中还包括其他参与联合模型推理的UE(s)对应的模型切分点信息，并通过AF透传给所述UE。

具体地，参见图6，图6为本公开实施例一提供的当网络实体是NWDAF时辅助模型切分的方法的第四信令流程示意图。具体步骤为：

步骤600，AF和UE建立连接。

步骤601，UE发起和NWDAF进行模型联合推理请求Nnwdaf_MLModelJointInference_Request(即模型联合推理请求)，请求中包含和Model ID关联的Analytics ID＝MLModelSplit，UE自身的可提供的算力、可提供的内存、剩余的电量等信息；如果有推理AI/ML模型时需要数据集的隐私等级，则请求中还包含推理AI/ML模型需要的数据集的隐私等级，如果没有，基于SA3确认是否可以设定；如果有推理AI/ML模型时需要模型不同层的时延需求信息，则请求中还包含模型不同层的时延需求信息，如果没有，由AF提供；通过AF透传给NWDAF。

步骤602，NWDAF判断联合推理请求。

可选地，步骤603-604，如果需要，通过NF发现其他可参与模型推理的UE(s)以及其相关的可提供的算力、可提供的内存、剩余的电量等。(即：

步骤603，NWDAF调用Nnf_EventExposure_Subscribe向5GC NF(s)(例如，AMF/SMF)采集UE(s)的可提供的算力、可提供的内存、剩余的电量，(如果有)推理此模型需要的数据集的隐私等级，以及(如果能提供)模型不同层的时延需求；5GC NF(s)(例如，AMF/SMF)将这些请求信息发送给终端，终端收到这个请求，(如果通过这个请求)就准备和该Analytics ID(Model ID)对应的电量、内存、算力，(如果有)数据集的隐私等级等信息反馈给NF(例如，AMF/SMF).

步骤604，5GC NF(s)调用Nnf_EventExposure_Notify向NWDAF反馈所需数据。)

步骤605，NWDAF基于收集到的信息以及自身拥有的模型执行分析，进行模型切分点(或者模型切分比例)的判断。

步骤606，NWDAF向UE反馈AI/ML模型联合推理请求的响应Nnwdaf_MLModelJointInference_Request response(即模型联合推理请求的响应)，请求中包含模型切分点(或者模型切分比例)信息，如果有其他参与联合模型推理的UE(s)，则包含相应UE(s)的模型切分点(或者模型切分比例)信息，通过AF透传给UE。

示例性地，实施例二(网络实体是AF，AF进行模型切分点的判断。)，下述以至少两种场景为例对辅助模型切分的方法进行详细说明。

场景21：当UE和AF联合推理模型时，UE上报自身的能力给AF，AF进行联合推理和模型切分点的判断，然后把判断结果反馈给UE。

可选地，如果所述网络实体是应用功能AF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，可以包括以下步骤：

步骤d11、接收待参与模型联合推理的UE(s)发送的第八请求，所述第八请求用于请求与AF执行模型联合推理操作；所述第八请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第八请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；根据所述第八请求中携带的参数，确定与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

步骤d12、若与所述待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第八请求中携带的参数作为所述第一消息；

步骤d13、若与所述待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则向网络数据分析功能NWDAF发送第九请求，所述第九请求中携带的参数包括所述第八请求中携带的参数，且所述第九请求用于请求NWDAF通过NF查找其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第九请求中携带的参数还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；(其中，所述第九请求结果是由NWDAF通过向5GC NF(s)采集UE(s)对应的第三数据确定的；所述第三数据中包括下述至少一项：参与AI/ML模型切分的UE或者SUPI、待参与模型联合推理的UE(s)(这里的待参与模型联合推理的UE(s)为上述的其他可参与模型推理的UE(s))可提供的算力、待参与模型联合推理的UE(s)(这里的待参与模型联合推理的UE(s)为上述的其他可参与模型推理的UE(s))可提供的内存、待参与模型联合推理的UE(s)(这里的待参与模型联合推理的UE(s)为上述的其他可参与模型推理的UE(s))剩余的电量、AI/ML模型的大小；若第九请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第三数据中还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；所述第九请求结果包括下述至少一项：第三数据、其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第九请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。)

步骤d14、接收NWDAF发送的第九请求结果，并将所述第九请求结果以及所述第八请求中携带的参数作为所述第一消息；其中，所述第九请求结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第九请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

可选地，在确定AI/ML模型切分的切分结果之后，所述方法还包括：

具体地，参见图7，图7为本公开实施例二提供的当网络实体是AF时辅助模型切分的方法的第一信令流程示意图。具体步骤为：(步骤703a的是AF在受信任区域，703b、703c是AF在不受信任区；步骤706a是AF在受信任区域，706b、706c是AF在不受信任区。)

步骤700-701同场景13的实施例中的步骤500-501所描述(即：

步骤700，AF和UE建立连接。

步骤701，UE发起和AF进行模型联合推理请求Naf_MLModelJointInference_Request，请求中包含和Model ID关联的Analytics ID＝MLModelSplit，UE自身的可提供的算力、可提供的内存、剩余的电量等信息；如果有推理AI/ML模型时需要数据集的隐私等级，则请求中还包含推理AI/ML模型需要的数据集的隐私等级，如果没有，基于SA3确认是否可以设定；(如果有推理AI/ML模型时需要模型不同层的时延需求信息，则请求中还包含模型不同层的时延需求信息，如果没有，由AF提供。

步骤702，AF判断联合推理请求，如果需要其他UE(s)参与联合推理模型，则执行步骤703(即步骤703a-703c)-706，否则跳过。

步骤703(即步骤703a-703c)-706(即步骤706a-706c)如场景13的实施例中的步骤503(即步骤503a-503c)-505、步骤507(即步骤507a-507c)所描述(即：703，AF向NWDAF发送Nnwdaf_AnalyticsSubscription_Subscribe(即分析订阅订阅)。实施过程：

步骤703a，AF向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含和Model ID关联的Analytics ID＝MLModelSplit，UE的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及模型不同层的时延需求等信息，以及请求NWDAF帮忙发现其他可参与模型推理的UE(s)以及其相关的可提供的算力、可提供的内存、剩余的电量等并请求NWDAF进行模型切分点的判断。

步骤703b，AF向NEF发送Nnef_MLModelSplit_Request，请求中包含上述步骤703a的信息。

步骤703c，NEF授权后，向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含上述步骤703a信息。

步骤704，NWDAF调用Nnf_EventExposure_Subscribe向5GC NF(s)(例如，AMF/SMF)采集UE(s)的可提供的算力、可提供的内存、剩余的电量，(如果有)推理此模型需要的数据集的隐私等级，以及(如果能提供)模型不同层的时延需求；5GC NF(s)(例如，AMF/SMF)将这些请求信息发送给终端，终端收到这个请求，(如果通过这个请求)就准备和该Analytics ID(Model ID)对应的电量、内存、算力，(如果有)数据集的隐私等级等信息反馈给NF(例如，AMF/SMF)。

步骤705，5GC NF(s)调用Nnf_EventExposure_Notify向NWDAF反馈所需数据)。

步骤706(即步骤706a-706c)如场景13的实施例中的步骤507(即步骤507a-507c)所描述(即：步骤706，NWDAF向AF发送Nnwdaf_AnalyticsSubscription_Notify(即分析订阅通知)。实施过程：

步骤706a，通过Nnwdaf_MLModelSplit_Response将模型切分点(或者模型切分比例)等信息发送给AF，如表3。

步骤706b，NWDAF向NEF发送Nnwdaf_MLModelSplit_Response，内容包含上述模型切分点(或者模型切分比例)等的信息。

步骤706c，NEF授权后，向NWDAF发送Nnef_MLModelSplit_Request response，内容包含上述模型切分点(或者模型切分比例)等的信息)。)

步骤707，AF基于接收到的信息以及自身的模型和能力，判断相关UE的模型切分点(模型切分比例)。

步骤708，AF通过Nnf_MLModelJointInference_Request response将判断结果和相关UE信息以及对应模型切分点(模型切分比例)信息发送给UE.该信息也可以实现UE和UE之间进行联合模型推理。

场景22、当UE和AF联合推理模型时，AF请求NWDAF收集UE的能力,AF基于收到的分析结果，进行模型切分点的判断，并向相关UE发起联合推理请求。

步骤d21、向网络数据分析功能NWDAF发送第十请求，所述第十请求用于请求NWDAF向5GC NF(s)采集UE(s)对应的用于分析AI/ML模型切分的数据，所述第十请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤d22、接收NWDAF发送的第十请求结果，所述第十请求结果包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第十请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第十请求结果中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤d23、将所述第十请求结果作为所述第一消息。

步骤d24、向待参与模型联合推理的UE(s)发送第十一请求，所述第十一请求用于请求与所述待参与模型联合推理的UE(s)执行模型联合推理操作；其中，所述第十一请求中携带的参数包括下述至少一项：模型切分点信息、所述第一消息；

步骤d25、接收待参与模型联合推理的UE(s)发送的第十一请求结果，所述第十一请求结果是由待参与模型联合推理的UE(s)根据第十一请求中携带的参数确定的，所述第十一请求结果包括接受第十一请求或不接受第十一请求。

具体地，参见图8，图8为本公开实施例二提供的当网络实体是AF时辅助模型切分的方法的第二信令流程示意图。具体步骤为：(步骤801a是AF在受信任区域，步骤801b、步骤801c是AF在不受信任区；步骤804a是AF在受信任区域，步骤804b、步骤804c是AF在不受信任区。)

步骤801(即801a-801c)-804(即804a-804c)，AF请求NWDAF收集UE的能力并获得分析结果如场景11的实施例中的步骤301(即301a-301c)～303、305(即305a-305c)所描述(即：

步骤801a，AF向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含和Model ID关联的Analytics ID(即分析类型标识)＝MLModelSplit，请求NWDAF收集UE(即待参与模型联合推理的UE(s))的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及可选的包含模型不同层的时延需求等信息，如表1。

步骤801b，AF向NEF发送Nnef_MLModelSplit_Request，请求中包含上述表1中的信息。

步骤801c，NEF授权后，向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含上述表1中的信息。

步骤802，NWDAF调用Nnf_EventExposure_Subscribe(即事件开放订阅)向5GC NF(s)(例如，AMF/SMF)采集UE(s)的可提供的算力、可提供的内存、剩余的电量，(如果有)推理此模型需要的数据集的隐私等级，以及(如果能提供)模型不同层的时延需求；5GC NF(s)(例如，AMF/SMF)将这些请求信息发送给终端，终端收到这个请求，(如果终端通过这个请求)就准备和该Analytics ID(Model ID)对应的电量、内存、算力，(如果有)数据集的隐私等级等信息反馈(参见表2)给NF(例如，AMF/SMF)。

步骤803，5GC NF(s)调用Nnf_EventExposure_Notify(即事件开放通知)向NWDAF反馈所需数据。

步骤804a，通过Nnwdaf_MLModelSplit_Request Response将模型切分点 (或者模型切分比例)等信息(如表3)发送给AF。

步骤804b，NWDAF向NEF发送Nnwdaf_MLModelSplit_Request Response，内容包含上述模型切分点(或者模型切分比例)等的信息(参见表3)。

步骤804c，NEF授权后，向NWDAF发送Nnef_MLModelSplit_Request response，内容包含上述模型切分点(或者模型切分比例)等的信息(参见表3)。)

步骤805，AF基于接收到的信息以及自身的模型和能力，进行模型切分点判断。

步骤806-808，AF和相关UE(s)建立连接并进行模型联合推理请求的响应如场景11的实施例中的步骤306-308所示(即：

步骤806，AF和相关UE(s)建立连接。

步骤807，AF向相关UE(s)发送模型联合推理请求Naf_MLModelJointInference_Request，请求中包含模型切分点(或者模型切分比例)信息。

步骤808，UE(s)向AF发送模型联合推理请求响应Naf_MLModelJointInference_Request response，表示是否接受这个模型联合推理请求。)。

示例性地，实施例三(网络实体为MMF(MMF可以进行模型的管理；也可以进行模型切分)，MMF进行模型切分点的判断)，下述以至少两种场景为例对辅助模型切分的方法进行详细说明。

场景31、当UE和AF联合推理模型时，AF请求新的网络实体MMF进行模型切分，MMF请求NWDAF收集UE的能力,MMF基于收到的分析结果，进行模型切分点的判断，并向AF反馈结果，AF向相关UE发起联合推理请求。

步骤e11、直接或通过网络能力开放功能NEF接收应用功能AF发送的第十二请求，所述第十二请求用于请求AI/ML模型切分分析；所述第十二请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十二请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤e12、根据所述第十二请求中携带的参数，向NWDAF发送第十三请求，所述第十三请求中携带的参数包括所述第十二请求中携带的参数，且所述第十三请求用于请求NWDAF向5GC NF(s)采集UE(s)的用于分析AI/ML模型切分的数据；

步骤e13、接收NWDAF发送的第十三请求结果；其中，所述第十三请求结果包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第十三请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第十二请求结果中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤e14、将所述第十三请求结果作为所述第一消息。

具体地，参见图9，图9为本公开实施例三提供的当网络实体是MMF时辅助模型切分的方法的第一信令流程示意图。具体步骤为：

步骤901，AF向MMF发送Nmmf_MLModelSplit_Request(即机器学习模型切分请求)，请求中包含的参数同场景11的实施例中的步骤301的请求包含的参数(即：请求中包含和Model ID关联的Analytics ID＝MLModelSplit，请求NWDAF收集UE的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及可选的包含模型不同层的时延需求等信息，如表1。)

步骤902-905如场景11的实施例中的步骤301c，302，303，305b所描述(即：

步骤902，NEF授权后，向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含上述表1中的信息。

步骤903，NWDAF调用Nnf_EventExposure_Subscribe(即事件开放订阅)向5GC NF(s)(例如，AMF/SMF)采集UE(s)的可提供的算力、可提供的内存、剩余的电量，(如果有)推理此模型需要的数据集的隐私等级，以及(如果能提供)模型不同层的时延需求；5GC NF(s)(例如，AMF/SMF)将这些请求信息发送给终端，终端收到这个请求，(如果终端通过这个请求)就准备和该Analytics ID(Model ID)对应的电量、内存、算力，(如果有)数据集的隐私等级等信息反馈(参见表2)给NF(例如，AMF/SMF)。

步骤904，5GC NF(s)调用Nnf_EventExposure_Notify向NWDAF反馈所需数据。

步骤905，NWDAF向NEF发送Nnwdaf_MLModelSplit_Request Response，内容包含上述模型切分点(或者模型切分比例)等的信息)

步骤906，MMF基于NWDAF的分析输出结果output data(参见表3)，即基于UE的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及模型不同层的时延需求，选出模型切分点(或者模型切分比例)。

步骤907，MMF向AF通过Nmmf_MLModelSplit_Request response(机器学习模型切分请求的响应)发送模型切分点(模型切分比例)等信息

步骤908-9010如场景11的实施例中的步骤306-308所描述(即：

步骤908，AF和相关UE(s)建立连接。

步骤909，AF向相关UE(s)发送模型联合推理请求Naf_MLModelJointInference_Request，请求中包含模型切分点(或者模型切分比例)信息。

步骤9010，UE(s)向AF发送模型联合推理请求的响应Naf_MLModelJointInference_Request response，表示是否接受这个模型联合推理请求)。

场景32、当UE和AF联合推理模型时，UE上报自身能力给AF请求模型联合推理，AF将自身以及UE能力传给MMF，请求MMF进行模型切分，MMF判断如果需要其他UE(s)参与模型联合推理，则MMF请求NWDAF收集其他UE(s)的信息，MMF基于收集的信息进行模型切分并将结果反馈给AF。

步骤e21、直接或通过网络能力开放功能NEF接收应用功能AF发送的第十五请求，所述第十五请求用于请求AI/ML模型切分分析，所述第十五请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十五请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤e22、根据所述第十五请求中携带的参数，确定AF与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

步骤e23、若与所述待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第十五请求中携带的参数作为所述第一消息；

步骤e24、若与所述待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则向NWDAF发送第十六请求，所述第十六请求中携带的参数包括所述第十五请求中携带的参数，且所述第十六请求用于请求NWDAF通过NF查找其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十六请求中携带的参数还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤e25、接收NWDAF发送的第十六请求结果，并将所述第十六请求结果以及第十五请求中携带的参数作为所述第一消息；其中，所述第十六请求结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十六请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。(其中，所述第十六请求结果是由NWDAF通过向5GC NF(s)采集UE(s)对应的第四数据确定的；所述第四数据中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、待参与模型联合推理的UE(s)(这里的待参与模型联合推理的UE(s)为上述的其他可参与模型推理的UE(s))可提供的算力、待参与模型联合推理的UE(s)(这里的待参与模型联合推理的UE(s)为上述的其他可参与模型推理的UE(s))可提供的内存、待参与模型联合推理的UE(s)(这里的待参与模型联合推理的UE(s)为上述的其他可参与模型推理的UE(s))剩余的电量、AI/ML模型的大小；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第四数据中还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；所述第十六请求结果中包括下述至少一项：第四数据、其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十六请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。)

具体地，参见图10，图10为本公开实施例三提供的当网络实体是MMF时辅助模型切分的方法的第二信令流程示意图。具体步骤为：

步骤1000-1001如场景13的实施例中的步骤500-501所描述(即：

步骤1000，AF和UE建立连接。

步骤1001，UE发起和AF进行ML模型联合推理请求Naf_MLModelJointInference_Request，请求中包含和Model ID关联的Analytics ID＝MLModelSplit，UE自身的可提供的算力、可提供的内存、剩余的电量等信息；如果有推理AI/ML模型时需要数据集的隐私等级，则请求中还包含推理AI/ML模型需要的数据集的隐私等级，如果没有，基于SA3确认是否可以设定；(如果有推理AI/ML模型时需要模型不同层的时延需求信息，则请求中还包含模型不同层的时延需求信息，如果没有，由AF提供。

步骤1002，AF向MMF发送模型切分请求Nmmf_MLModelSplit_Request，请求中包含的信息如场景13的实施例中的步骤503a所描述(即：

请求中包含和Model ID关联的Analytics ID＝MLModelSplit，UE的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及模型不同层的时延需求等信息，以及请求NWDAF帮忙发现其他可参与模型推理的UE(s)以及其相关的可提供的算力、可提供的内存、剩余的电量等。)

步骤1003，MMF判断联合推理请求，判断如果需要其他UE(s)参与模型联合推理，则执行步骤1004-1007，否则跳过。

步骤1004-1007如场景13的实施例中的步骤503c、504、505、507b所描述(即：

步骤1004，NEF授权后，向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含上述信息。

步骤1005，NWDAF调用Nnf_EventExposure_Subscribe向5GC NF(s)(例如AMF/SMF)采集UE(s)的可提供的算力、可提供的内存、剩余的电量，(如果有)推理此模型需要的数据集的隐私等级，以及(如果能提供)模型不同层的时延需求；5GC NF(s)(例如，AMF/SMF)将这些请求信息发送给终端，终端收到这个请求，(如果通过这个请求)就准备和该Analytics ID(Model ID)对应的电量、内存、算力，(如果有)数据集的隐私等级等信息反馈给NF(例如，AMF/SMF).

步骤1006，5GC NF(s)调用Nnf_EventExposure_Notify向NWDAF反馈所需数据；

步骤1007，NWDAF向NEF发送Nnwdaf_MLModelSplit_Request Response，内容包含上述模型切分点(或者模型切分比例)等的信息)

步骤1008，MMF基于收集到的信息进行模型切分的判断

步骤1009，MMF将结果通过Nmmf_MLModelSplit_Request response发送给AF，响应中包含的信息如场景11的实施例中的步骤305所描述(即：模型切分点(或者模型切分比例)等信息，如表3)

步骤1010如场景13的实施例中的步骤508所描述。(即：

步骤1010，AF把模型联合推理请求的响应Naf_MLModelJointInference_Request response发送给UE，响应中包含模型切分点(或者模型切分比例)以及其他可参与模型推理的UE(s)以及其相关的模型切分点(或者模型切分比例)信息)。

示例性地，实施例四(网络实体为PCF，PCF进行模型切分点的判断)，下述以至少两种场景为例对辅助模型切分的方法进行详细说明。

场景41、当UE和AF联合推理模型时，AF请求PCF进行模型切分的策略判断，PCF请求NWDAF收集UE的能力,PCF基于收到的分析结果，进行模型切分点的判断，并向AF反馈结果，AF向相关UE发起联合推理请求。

步骤f11、直接或通过网络能力开放功能NEF接收应用功能AF发送的第十七请求，所述第十七请求用于请求AI/ML模型切分分析；所述第十七请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十七请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤f12、根据所述第十七请求中携带的参数，向网络数据分析功能 NWDAF发送第十八请求，所述第十八请求中携带的参数包括所述第十七请求中携带的参数，且所述第十八请求用于请求NWDAF向5GC NF(s)采集UE(s)对应的第五数据；所述第五数据中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第五数据中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤f13、接收NWDAF发送的第十八请求结果；其中，所述第十八请求结果包括所述第五数据；

步骤f14、将所述第十八请求结果作为所述第一消息。

具体地，参见图11，图11为本公开实施例四提供的当网络实体是PCF时辅助模型切分的方法的第一信令流程示意图。具体步骤为：

步骤1101，AF向PCF发送Npcf_MLModelSplit_Request(即机器学习模型切分请求)，请求中包含的参数同场景11的实施例中的步骤301的请求(即：请求中包含和Model ID关联的Analytics ID＝MLModelSplit，请求NWDAF收集UE的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及可选的包含模型不同层的时延需求等信息，如表1。)

步骤1102-1105如场景11的实施例中的步骤301c，302，303，305b所描述(即：

步骤1102，NEF授权后，向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含上述表1中的信息。

步骤1103，NWDAF调用Nnf_EventExposure_Subscribe(即事件开放订阅)向5GC NF(s)(例如，AMF/SMF)采集UE(s)的可提供的算力、可提供的内存、剩余的电量，(如果有)推理此模型需要的数据集的隐私等级，以及(如果能提供)模型不同层的时延需求；5GC NF(s)(例如，AMF/SMF)将这些请求信息发送给终端，终端收到这个请求，(如果终端通过这个请求)就准备和该Analytics ID(Model ID)对应的电量、内存、算力，(如果有)数据集的隐私等级等信息反馈(参见表2)给NF(例如，AMF/SMF)。

步骤1104，5GC NF(s)调用Nnf_EventExposure_Notify向NWDAF反馈所需数据。

步骤1105，NWDAF向NEF发送Nnwdaf_MLModelSplit_Request Response，内容包含上述模型切分点(或者模型切分比例)等的信息)。

步骤1106，PCF基于NWDAF的分析输出结果output data，即基于UE的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及模型不同层的时延需求，选出模型切分点(或者模型切分比例)。

例如，UE的可提供的算力和内存较少、剩余的电量较低时，只能做较少层的推理，如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且隐私等级需求较高和/或模型不同层的时延需求较低时做较少层的推理；如果UE的可提供的算力和内存充足、剩余的电量较高时，可以做较多层的推理，如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且隐私等级需求较低和/或模型不同层的时延需求较高时做较多层的推理；例如，假设对于一个8层的AI/ML模型，UE1可以做两层的推理(比如，UE1做前两层的推理)、UE2可以做三层的推理(比如，UE2做中间三层的推理)，AF做最后三层的推理，即UE1对应模型切分点1，UE2对应模型切分点2。

步骤1107，PCF向AF通过Npcf_MLModelSplit_Request response(即机器学习模型切分请求的响应)发送模型切分点(模型切分比例)等信息。

步骤1108-1110如场景11的实施例中的步骤306-308所描述(即：

步骤1108，AF和相关UE(s)建立连接。

步骤1109，AF向相关UE(s)发送模型联合推理请求Naf_MLModelJointInference_Request，请求中包含模型切分点(或者模型切分比例)信息。

步骤1110，UE(s)向AF发送模型联合推理请求的响应Naf_MLModelJointInference_Request response，表示是否接受这个模型联合推理请求)。

场景42、当UE和AF联合推理模型时，UE上报自身能力给AF请求模型联合推理，AF将自身以及UE能力发给PCF，请求PCF进行模型切分，PCF判断如果需要其他UE(s)参与模型联合推理，则PCF请求NWDAF收集其他UE(s)的信息，PCF基于收集的信息进行模型切分并将结果反馈给AF。

可选地，如果所述网络实体是策略控制功能PCF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，可以包括以下步骤：

步骤f21、直接或通过网络能力开放功能NEF接收应用功能AF发送的第二十请求，所述第二十请求用于请求AI/ML模型切分分析，所述第二十请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二十请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤f22、根据所述第二十请求中携带的参数，确定所述AF以及待参与模型联合推理的UE是否具备完全支持执行模型联合推理的能力；

步骤f23、若所述AF以及待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第二十请求中携带的参数作为所述第一消息；

步骤f24、若所述AF以及待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则向NWDAF发送第二十一请求，所述第二十一请求中携带的参数包括所述第二十请求中携带的参数，且所述第二十一请求用于请求NWDAF通过NF查找其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二十一请求中携带的参数还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤f25、接收NWDAF发送的第二十一请求结果，并将所述第二十一请求结果以及所述第二十请求中携带的参数作为所述第一消息；其中，所述第二十一请求结果包括：其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二十一请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；(所述第二十一请求结果是由NWDAF通过向5GC NF(s)采集UE(s)对应的第六数据确定的；所述第六数据中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、待参与模型联合推理的UE(s)(这里的待参与模型联合推理的UE(s)为上述的其他可参与模型推理的UE(s))可提供的算力、待参与模型联合推理的UE(s)(这里的待参与模型联合推理的UE(s)为上述的其他可参与模型推理的UE(s))可提供的内存、待参与模型联合推理的UE(s)(这里的待参与模型联合推理的UE(s)为上述的其他可参与模型推理的UE(s))剩余的电量、AI/ML模型的大小；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第六数据中还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；所述第二十一请求结果中包括下述至少一项：第六数据、其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二十一请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。)

步骤f26、若第二十请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。

其中，若存在其他参与联合模型推理的UE(s)，则所述第二十请求结果中还包括其他参与联合模型推理的UE(s)对应的模型切分点信息，并通过AF透传给所述UE。

具体地，参见图12，图12为本公开实施例四提供的当网络实体是PCF时辅助模型切分的方法的第二信令流程示意图。具体步骤为：

步骤1200-1201如场景13的实施例中的步骤500-501所描述(即：

步骤1200，AF和UE建立连接

步骤1201，UE发起和AF进行ML模型联合推理请求Naf_MLModelJointInference_Request，请求中包含和Model ID关联的Analytics ID＝MLModelSplit，UE自身的可提供的算力、可提供的内存、剩余的电量等信息；如果有推理AI/ML模型时需要数据集的隐私等级，则请求中还包含推理AI/ML模型需要的数据集的隐私等级，如果没有，基于SA3确认是否可以设定；(如果有推理AI/ML模型时需要模型不同层的时延需求信息，则请求中还包含模型不同层的时延需求信息，如果没有，由AF提供。

步骤1202，AF向PCF发送模型切分请求Npcf_MLModelSplit_Request，请求中包含的信息如场景13的实施例中的步骤503a所描述(即请求中包含和Model ID关联的Analytics ID＝MLModelSplit，UE的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及模型不同层的时延需求等信息，以及请求NWDAF帮忙发现其他可参与模型推理的UE(s)以及其相关的可提供的算力、可提供的内存、剩余的电量等)

步骤1203，基于接收到的信息，例如，UE、AF报告的自身能力等，PCF判断联合推理请求，判断如果需要其他UE(s)参与模型联合推理，则执行步骤1204-1207，否则跳过。

步骤1204-1207如场景13的实施例中的步骤503c、504、505、507b所描述(即：

步骤1204，NEF授权后，向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含上述信息。

步骤1205，NWDAF调用Nnf_EventExposure_Subscribe向5GC NF(s)(例如，AMF/SMF)采集UE(s)的可提供的算力、可提供的内存、剩余的电量，(如果有)推理此模型需要的数据集的隐私等级，以及(如果能提供)模型不同层的时延需求；5GC NF(s)(例如，AMF/SMF)将这些请求信息发送给终端，终端收到这个请求，(如果通过这个请求)就准备和该Analytics ID(Model ID)对应的电量、内存、算力，(如果有)数据集的隐私等级等信息反馈给NF(例如，AMF/SMF)。

步骤1206，5GC NF(s)调用Nnf_EventExposure_Notify向NWDAF反馈所需数据。

步骤1207，NWDAF向NEF发送Nnwdaf_MLModelSplit_Request Response，内容包含上述模型切分点(或者模型切分比例)等的信息。)

步骤1208，PCF基于收集到的信息进行模型切分的判断。

步骤1209，PCF将结果通过Nmmf_MLModelSplit_Request response发送给AF，响应中包含的信息如场景11的实施例中的步骤305所描述(即：模型切分点(或者模型切分比例)等信息，如表3。)

步骤1210如场景13的实施例中的步骤508所描述。(即：

步骤1210，AF把模型联合推理请求的响应Naf_MLModelJointInference_Request response发送给UE，响应中包含模型切分点(或者模型切分比例)以及其他可参与模型推理的UE(s)以及其相关的模型切分点(或者模型切分比例)信息)。

本公开实施例，通过PCF接收AF发送的模型切分请求，以及请求中包含的参数；PCF进行模型切分点的判断,如果需要，从NWDAF请求分析结果。或者，通过AF接收UE发送的模型切分请求，以及请求中包含的参数；AF基于自身信息或者从NWDAF请求得到的分析结果进行模型切分点的判断；AF向UE发送分析和判断结果。或者，通过引入新的模型管理网络实体MMF，MMF接收AF发送的模型切分请求，以及请求中包含的参数MMF进行模型切分点的判断,如果需要，从NWDAF请求分析结果。或者，NWDAF接收AF/终端/PCF/新网络实体等发送的模型切分请求，以及请求中包含的参数；NWDAF从5GC NF(s)采集的输入数据，用于模型切分的分析；(如果其他不能做，NWDAF进行分析和模型切分判断)，向AF/终端/PCF/新网络实体等发送分析和判断结果。因此，网络实体基于终端的电量、可提供的内存、可提供的算力等信息，以及关于此模型的时延需求以及关于此模型需要的推理数据集的隐私等级等，选择出模型切分点，网络实体将模型切分点信息发送给参与模型联合推理的网络实体或者终端。基于终端能力实现模型切分推理，从而有益于保护终端隐私，优化网络资源。

图13为本公开实施例提供的辅助模型切分的方法的第二流程示意图，如图13所示，本实施例提供的辅助模型切分的方法的执行主体为用户设备(或终端)UE，则本公开实施例提供的辅助模型切分的方法包括以下步骤：

步骤201、UE根据自身能力信息，确定AI/ML模型切分点信息。

可选地，根据自身能力信息，确定AI/ML模型切分点信息，可以包括以下步骤：

步骤g1、根据自身能力信息中的可提供的算力、可提供的内存以及剩余的电量，确定模型切分点信息；

步骤g2、若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则根据所述自身能力信息中的可提供的算力、可提供的内存、剩余的电量、推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，确定模型切分点信息。

步骤202、UE将所述AI/ML模型切分点信息作为AI/ML模型切分的切分结果。

具体地，终端可以基于自身可提供的电量、可提供的内存、可提供的算力等信息，以及关于此模型的时延需求以及关于此模型需要的推理数据集的隐私等级等，选择出模型切分点(即模型切分点信息或AI/ML模型切分点信息)，然后终端将模型切分点信息发送给参与模型联合推理的网络实体或者终端。

可选地，确定模型切分点信息，可以包括以下步骤：

将所有确定参与执行模型联合推理的UE中的任一UE作为目标UE，针对每个所述目标UE执行下述步骤：

步骤h1、若所述目标UE可提供的算力低于第一预设算力阈值或所述目标UE可提供的内存低于第一预设内存阈值或所述目标UE剩余的电量低于第一预设电量阈值时，确定所述目标UE执行第一预设数目层的推理；

步骤h2、若所述目标UE可提供的算力高于第一预设算力阈值并低于第二预设算力阈值，和所述目标UE可提供的内存高于第一预设内存阈值并低于第二预设内存阈值，以及所述目标UE剩余的电量高于第一预设电量阈值并低于第二预设预设电量阈值时，确定所述目标UE执行第二预设数目的推理，第一预设数目层小于第二预设数目层；

步骤h3、若所述目标UE可提供的算力高于第二预设算力阈值并低于第三预设算力阈值，和所述目标UE可提供的内存高于第二预设内存阈值并低于第三预设内存阈值，以及所述目标UE剩余的电量高于第二预设电量阈值并低于第三预设电量阈值时，确定所述目标UE执行第三预设数目层的推理，第二预设数目层小于第三预设数目层；以此类推，直至确定所述目标UE执行第N+1预设数目层的推理，第N预设数目层小于第N+1预设数目层；

步骤h4、若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级低于第一预设隐私等级或模型不同层的时延需求信息低于第一预设时延，则所述目标UE执行所述第一预设数目层的推理；

步骤h5、若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级高于第一预设隐私等级并低于第二预设隐私等级，和模型不同层的时延需求信息高于第一预设时延并低于第二预设时延时，确定所述目标UE执行第二预设数目层的推理；

步骤h6、若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级高于第二预设隐私等级并低于第三预设隐私等级，和模型不同层的时延需求信息高于第二预设时延并低于第三预设时延时，确定所述目标UE执行第三预设数目层的推理；以此类推，直至确定所述目标UE执行第N+1预设数目层的推理，第N预设数目层小于第N+1预设数目层；

步骤h7、根据预设数目层确定AI/ML模型切分点信息，所述AI/ML模型切分点信息用于表示AI/ML模型切分比例，所述预设数目层包括第N预设数目层，N大于或等于一。

本实施例中，根据自身能力信息中的可提供的算力、可提供的内存以及剩余的电量，确定模型切分点信息；如果推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，还可以结合自身能力信息中的推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息来确定切分AI/ML模型的模型切分点信息，作为切分结果，用以实现网络实体或待参与模型联合推理的UE(s)基于切分结果对模型进行联合推理操作，因此，实现了基于终端(即UE)能力对模型切分的分析，进而有效地实现对终端隐私的保护以及网络资源的优化。

示例性地，实施例五(UE进行模型切分点的判断)，下述以至少两种场景为例对辅助模型切分的方法进行详细说明。

场景51、当UE和AF联合推理模型时，UE基于自身能力进行模型切分点的判断，上报模型切分点(模型切分比例)给AF，并进行联合推理交互。

可选地，所述确定AI/ML模型切分的切分结果之后，所述方法还可以包括以下步骤：

步骤i1、向应用功能AF发送第一请求，所述第一请求用于请求与所述AF执行模型联合推理操作；其中，所述第一请求中携带的参数包括下述至少一项AI/ML模型切分点、与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE可提供的内存、待参与模型联合推理的UE剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第一请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤i2、接收AF发送的第一请求结果，所述第一请求结果是由AF根据第一请求中携带的参数确定的，所述第一请求结果包括接受第一请求或不接受第一请求；

具体地，实施过程为：

步骤1401，在场景12的实施例中的步骤401(即：

UE发起和AF进行ML模型联合推理请求Naf_MLModelJointInference_Request，请求中包含和Model ID关联的Analytics ID＝MLModelSplit，UE自身的可提供的算力、可提供的内存、剩余的电量等信息；如果有推理AI/ML模型时需要数据集的隐私等级，则请求中还包含推理AI/ML模型需要的数据集的隐私等级，如果没有，基于SA3确认是否可以设定；(如果有推理AI/ML模型时需要模型不同层的时延需求信息，则请求中还包含模型不同层的时延需求信息，如果没有，由AF提供。请求中还增加模型切分点(模型切分比例)信息上报给AF。

步骤1402，如场景22的实施例中的步骤806-808所示，UE和AF建立联合模型推理。(即：

AF和相关UE(s)建立连接。

AF向相关UE(s)发送模型联合推理请求Naf_MLModelJointInference_Request，请求中包含模型切分点(或者模型切分比例)信息。

UE(s)向AF发送模型联合推理请求的响应Naf_MLModelJointInference_Request response，表示是否接受这个模型联合推理请求。)

场景52、当UE和NWDAF联合推理模型时，UE基于自身能力进行模型切分点的判断，上报NWDAF，并进行联合推理交互。

步骤j1、通过AF向网络数据分析功能NWDAF发送第二请求，所述第二请求用于请求与所述NWDAF执行模型联合推理操作；其中，所述第二请求中携带的参数包括下述至少一项AI/ML模型切分点、与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE可提供的内存、待参与模型联合推理的UE剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

步骤j2、接收NWDAF发送的第二请求结果，所述第二请求结果是由NWDAF根据第一请求中携带的参数确定的，所述第二请求结果包括接受第一请求或不接受第一请求；

具体地，实施过程为：

步骤1501，在场景12的实施例中的步骤401(即：

步骤1502，AF通过场景13的实施例中的步骤503(即：

AF向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含和Model ID关联的Analytics ID＝MLModelSplit，UE的可提供的算力、可提供的内存、剩余的电量，以及推理此模型需要的数据集的隐私等级，以及模型不同层的时延需求等信息，以及请求NWDAF帮忙发现其他可参与模型推理的UE(s)以及其相关的可提供的算力、可提供的内存、剩余的电量等(若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，还请求提供其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息)并请求NWDAF进行模型切分点的判断；

AF向NEF发送Nnef_MLModelSplit_Request，请求中包含上述信息NEF授权后，向NWDAF发送Nnwdaf_MLModelSplit_Request，请求中包含上述信息)将信息发送给NWDAF)。

步骤1503，NWDAF和UE建立联合模型推理。

本公开实施例，通过UE发送模型联合推理请求，以及请求中包含的参数；UE接收从NWDAF/AF获得模型联合推理响应，以及响应中包含的参数。因此，终端基于可提供的电量、可提供的内存、可提供的算力等信息，以及关于此模型的时延需求以及关于此模型需要的推理数据集的隐私等级等，选择出模型切分点，终端将模型切分点信息发送给参与模型联合推理的网络实体或者终端。基于终端能力实现模型切分推理，从而有益于保护终端隐私，优化网络资源。

图14为本公开实施例提供的辅助模型切分的装置的结构示意图，如图14所示，本实施例提供的辅助模型切分的装置应用于网络实体。则本实施例提供的辅助模型切分的装置包括：收发机1400，用于在处理器1410的控制下接收和发送数据。

其中，在图14中，总线架构可以包括任意数量的互联的总线和桥，具体由处理器1410代表的一个或多个处理器和存储器1420代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口提供接口。收发机1400可以是多个元件，即包括发送机和接收机，提供用于在传输介质上与各种其他装置通信的单元，这些传输介质包括无线信道、有线信道、光缆等传输介质。处理器1410负责管理总线架构和通常的处理，存储器1420可以存储处理器140在执行操作时所使用的数据。

处理器1410可以是中央处埋器(CPU)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或复杂可编程逻辑器件(Comple6Programmable Logic Device，CPLD)，处理器也可以采用多核架构。

本实施例中，存储器1420，用于存储计算机程序；收发机1400，用于在处理器1410的控制下收发数据；处理器1410，用于读取存储器中的计算机程序并执行以下操作：

根据所述第一消息，确定AI/ML模型切分的切分结果。

可选地，处理器1410，用于根据所述第一消息，确定AI/ML模型切分的切分结果时，具体包括：

将所述模型切分点信息作为所述切分结果。

可选地，处理器1410，用于确定所述待参与模型联合推理的UE(s)对应的模型切分点信息时，具体包括：

可选地，处理器1410，用于在所述网络实体是网络数据分析功能NWDAF时，且接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息时，具体包括：

直接或通过网络能力开放功能NEF接收应用功能AF发送的第一请求，所述第一请求用于请求对AI/ML模型切分进行分析；其中，所述第一请求中携带的参数包括下述至少一项：与模型切分关联的分析类型标识、接受AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足切分条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第一请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第一请求中携带的参数，向5GC NF(s)发送第二消息，所述第二消息用于请求5GC NF(s)采集UE(s)对应的第一数据，所述第一数据中包括下述至少一项：待待参与AI/ML模型切分的UE(s)以及SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第一请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第一数据中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

可选地，处理器1410，还用于：

确定AI/ML模型切分的切分结果之后，向所述AF发送第三消息，所述第三消息中包括AI/ML模型切分点信息以及所述第一数据；所述第三消息用于为AF提供向待参与模型联合推理的UE(s)发送第二请求时携带的参数，所述第二请求用于请求与待参与模型联合推理的UE(s)执行模型联合推理操作，所述第二请求中携带的参数包括所述第三消息。

可选地，处理器1410，还用于：

确定AI/ML模型切分的切分结果之后，向所述AF发送第四消息，所述第四消息中包括所述AI/ML模型切分点、所述第一消息中的数据；所述第四消息用于为AF提供向待参与模型联合推理的UE(s)发送的第四请求结果，所述第四请求结果中包括所述AI/ML模型切分点信息。

可选地，处理器1410，还用于：

确定AI/ML模型切分的切分结果之后，向所述AF发送第六消息，所述第六消息中至少包括所述AI/ML模型切分点信息以及所述第二数据；所述第六消息用于为AF提供向待参与模型联合推理的UE(s)发送的第六请求结果，所述第六请求结果中包括所述待参与模型联合推理的UE(s)对应的所述AI/ML模型切分点信息、所述其他可参与模型推理的UE(s)以及对应的所述AI/ML模型切分点信息。

可选地，处理器1410，用于在所述网络实体是网络数据分析功能NWDAF 时，且接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息时，具体包括：

接收待参与模型联合推理的UE(s)发送的第七请求，所述第七请求用于请求与NWDAF执行模型联合推理操作；所述第七请求中中携带的参数包括下述至少一项：待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第七请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；根据所述第七请求中携带的参数，确定AF与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

将所述第七请求中携带的参数以及所述查找结果作为所述第一消息

可选地，处理器1410，还用于：

确定AI/ML模型切分的切分结果之后，向所述待参与模型联合推理的UE(s)发送第七请求结果，所述第七请求结果中包括AI/ML模型切分点信息；

可选地，处理器1410，用于在所述网络实体是应用功能AF时，且接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息时，具体包括：

接收待参与模型联合推理的UE(s)发送的第八请求，所述第八请求用于请求与AF执行模型联合推理操作；所述第八请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第八请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第八请求中携带的参数，确定与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

可选地，处理器1410，还用于：

确定AI/ML模型切分的切分结果之后，将确定与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力的结果、所述待参与模型联合推理的UE(s)的相关信息以及所述待参与模型联合推理的UE(s)对应的模型切分点信息发送给所述UE；

接收NWDAF发送的第十请求结果，所述第十请求结果包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第十请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第十请求结果中还包括：推理 AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

将所述第十请求结果作为所述第一消息。

可选地，处理器1410，还用于：

确定AI/ML模型切分的切分结果之后，向待参与模型联合推理的UE(s)发送第十一请求，所述第十一请求用于请求与所述待参与模型联合推理的UE(s)执行模型联合推理操作；其中，所述第十一请求中携带的参数包括下述至少一项：模型切分点信息、所述第一消息；

可选地，处理器1410，用于在所述网络实体是新的网络实体MMF时，且接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息时，具体包括：

接收NWDAF发送的第十三请求结果；其中，所述第十三请求结果包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、 AI/ML模型的大小；若第十三请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第十二请求结果中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

将所述第十三请求结果作为所述第一消息。

可选地，处理器1410，还用于：

确定AI/ML模型切分的切分结果之后，向所述AF发送第八消息，所述第八消息中包括所述AI/ML模型切分点、所述第一消息中的数据；所述第八消息用于为AF提供向待参与模型联合推理的UE(s)发送第十四请求时携带的参数，所述第十四请求用于请求与待参与模型联合推理的UE(s)执行模型联合推理操作，所述第十四请求中携带的参数包括所述第八消息。

接收NWDAF发送的第十六请求结果，并将所述第十六请求结果以及所述第十五请求中携带的参数作为所述第一消息；其中，所述第十六请求结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十六请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息

可选地，处理器1410，还用于：

确定AI/ML模型切分的切分结果之后，向所述AF发送第十五请求结果，所述第十五请求结果中包括AI/ML模型切分点信息；

可选地，处理器1410，用于在所述网络实体是策略控制功能PCF时，且接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息时，具体包括：

将所述第十八请求结果作为所述第一消息。

可选地，处理器1410，还用于：

确定AI/ML模型切分的切分结果之后，向所述AF发送第九消息，所述第九消息中包括所述AI/ML模型切分点、所述第一消息的数据；所述第九消息用于为AF提供向待参与模型联合推理的UE(s)发送第十九请求时携带的参数，所述第十九请求用于请求与待参与模型联合推理的UE(s)执行模型联合推理操作，所述第十九请求中携带的参数包括所述第九消息。

根据所述第二十请求中携带的参数，确定所述AF以及待参与模型联合推理的UE是否具备完全支持执行模型联合推理的能力；

若所述AF以及待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则向NWDAF发送第二十一请求，所述第二十一请求中携带的参数包括所述第二十请求中携带的参数，且所述第二十一请求用于请求NWDAF查找其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二十一请求中携带的参数还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

可选地，处理器1410，还用于：

确定AI/ML模型切分的切分结果之后，向所述AF发送第二十请求结果，所述第二十请求结果中包括AI/ML模型切分点信息；

在此需要说明的是，本公开提供的辅助模型切分的装置，能够实现图2-图12所示方法实施例所实现的所有方法步骤，且能够达到相同的技术效果，在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。

图15为本公开另一实施例提供的辅助模型切分的装置的结构示意图，如图15所示，本实施例提供的辅助模型切分的装置应用于网络实体，则本实施例提供的辅助模型切分的装置1500包括：

接收单元1501，用于接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息；

确定单元1502，用于根据所述第一消息，确定AI/ML模型切分的切分结果。

可选地，确定单元，具体用于：

将所述模型切分点信息作为所述切分结果。

可选地，确定单元，具体用于：

可选地，接收单元，具体用于：

如果所述网络实体是网络数据分析功能NWDAF，直接或通过网络能力开放功能NEF接收应用功能AF发送的第一请求，所述第一请求用于请求对AI/ML模型切分进行分析；其中，所述第一请求中携带的参数包括下述至少一项：与模型切分关联的分析类型标识、接受AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足切分条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第一请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

可选地，辅助模型切分的装置，还包括：处理单元；处理单元，用于：

可选地，所述接收单元，具体用于：

如果所述网络实体是网络数据分析功能NWDAF，直接或通过网络能力开放功能NEF接收AF发送的第三请求；所述第三请求是由AF确定与待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力后确定的，其中，是否具备完全支持执行模型联合推理的能力是由AF根据接收到的待参与模型联合推理的UE(s)发送的第四请求中携带的参数确定的，所述第四请求用于待参与模型联合推理的UE(s)请求与AF进行模型联合推理，所述第四请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第四请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，所述第三请求中携带的参数包括所述第四请求中携带的参数；将所述第三请求中携带的参数作为所述第一消息；

可选地，接收单元，具体用于：

如果所述网络实体是网络数据分析功能NWDAF，直接或通过网络能力开放功能NEF接收应用功能AF发送的第五请求，所述第五请求是由AF确定与待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力后确定的，其中，是否具备完全支持执行模型联合推理的能力是由AF根据接收到的待参与模型联合推理的UE(s)发送的第六请求确定的，所述第五请求用于请求对AI/ML模型切分进行分析以及请求查找其他可参与模型推理的UE(s)并提供其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量；其中，所述第五请求中携带的参数包括下述至少一项：与模型切分关联的分析类型标识、接受AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足切分条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第五请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；所述第六请求用于待参与模型联合推理的UE(s)请求与AF进行模型联合推理，所述第六请求中携带的参数包括所述第五请求中携带的参数；

可选地，辅助模型切分的装置，还包括处理单元；处理单元，用于：

可选地，接收单元，具体用于：

如果所述网络实体是网络数据分析功能NWDAF，接收待参与模型联合推理的UE(s)发送的第七请求，所述第七请求用于请求与NWDAF执行模型联合推理操作；所述第七请求中中携带的参数包括下述至少一项：待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第七请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；根据所述第七请求中携带的参数，确定AF与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

可选地，接收单元，具体用于：

如果所述网络实体是应用功能AF，接收待参与模型联合推理的UE(s)发送的第八请求，所述第八请求用于请求与AF执行模型联合推理操作；所述第八请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第八请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；根据所述第八请求中携带的参数，确定与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

其中，所述相关信息包括下述至少一项：待参与模型联合推理的UE(s) 可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述相关信息中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。

可选地，接收单元，具体用于：

如果所述网络实体是应用功能AF，向网络数据分析功能NWDAF发送第十请求，所述第十请求用于请求NWDAF向5GC NF(s)采集UE(s)对应的用于分析AI/ML模型切分的数据，所述第十请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第十请求结果，所述第十请求结果包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第十请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第十请求结果中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

将所述第十请求结果作为所述第一消息。

可选地，接收单元，具体用于：

如果所述网络实体是新的网络实体MMF，直接或通过网络能力开放功能NEF接收应用功能AF发送的第十二请求，所述第十二请求用于请求AI/ML模型切分分析；所述第十二请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十二请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

将所述第十三请求结果作为所述第一消息。

可选地，接收单元，具体用于：

如果所述网络实体是新的网络实体MMF，直接或通过网络能力开放功能NEF接收应用功能AF发送的第十五请求，所述第十五请求用于请求AI/ML模型切分分析，所述第十五请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十五请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

可选地，接收单元，具体用于：

如果所述网络实体是策略控制功能PCF，直接或通过网络能力开放功能NEF接收应用功能AF发送的第十七请求，所述第十七请求用于请求AI/ML模型切分分析；所述第十七请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十七请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

将所述第十八请求结果作为所述第一消息。

可选地，接收单元，具体用于：如果所述网络实体是策略控制功能PCF，

在此需要说明的是，本公开提供的辅助模型切分的装置，能够实现图2-图12方法实施例所实现的所有方法步骤，且能够达到相同的技术效果，在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。

图16为本公开再一实施例提供的辅助模型切分的装置的结构示意图，如图16所示，本实施例提供的辅助模型切分的装置应用于用户设备UE。则本实施例提供的辅助模型切分的装置包括：收发机1600，用于在处理器1610的控制下接收和发送数据。

其中，在图16中，总线架构可以包括任意数量的互联的总线和桥，具体由处理器1610代表的一个或多个处理器和存储器1620代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口提供接口。收发机1600可以是多个元件，即包括发送机和接收机，提供用于在传输介质上与各种其他装置通信的单元，这些传输介质包括无线信道、有线信道、光缆等传输介质。处理器1610负责管理总线架构和通常的处理，存储器1620可以存储处理器1610在执行操作时所使用的数据。

处理器1610可以是中央处埋器(CPU)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或复杂可编程逻辑器件(Comple8Programmable Logic Device，CPLD)，处理器也可以采用多核架构。

本实施例中，存储器1620，用于存储计算机程序；收发机1600，用于在处理器的控制下收发数据；处理器1610，用于读取存储器中的计算机程序并执行以下操作：

根据自身能力信息，确定AI/ML模型切分点信息；

将所述AI/ML模型切分点信息作为AI/ML模型切分的切分结果。

可选地，处理器1610，用于根据自身能力信息，确定AI/ML模型切分点信息时，具体包括：

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则根据所述自身能力信息中的可提供的算力、可提供的内存、剩余的电量、推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，确定所述模型切分点信息。

可选地，处理器1610，用于确定模型切分点信息时，具体包括：

可选地，处理器1610，还用于：

确定AI/ML模型切分的切分结果之后，向应用功能AF发送第一请求，所述第一请求用于请求与所述AF执行模型联合推理操作；其中，所述第一请求中携带的参数包括下述至少一项AI/ML模型切分点、与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE可提供的内存、待参与模型联合推理的UE剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第一请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

可选地，处理器1610，还用于：

确定AI/ML模型切分的切分结果之后，通过AF向网络数据分析功能NWDAF发送第二请求，所述第二请求用于请求与所述NWDAF执行模型联合推理操作；其中，所述第二请求中携带的参数包括下述至少一项AI/ML模型切分点、与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE可提供的内存、待参与模型联合推理的UE剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

在此需要说明的是，本公开提供的辅助模型切分的装置，能够实现图13所示方法实施例所实现的所有方法步骤，且能够达到相同的技术效果，在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。

图17为本公开又一实施例提供的辅助模型切分的装置的结构示意图，如图17所示，本公开实施例提供的辅助模型切分的装置应用于用户设备UE，则本实施例提供的辅助模型切分的装置1700包括：

确定单元1701，用于根据自身能力信息，确定AI/ML模型切分点信息；

处理单元1702，用于将所述AI/ML模型切分点信息作为AI/ML模型切分的切分结果。

可选地，确定单元1701，具体用于：

可选地，处理单元，还用于：

确定AI/ML模型切分的切分结果之后，通过AF向网络数据分析功能NWDAF发送第二请求，所述第二请求用于请求与所述NWDAF执行模型联合推理操作；其中，所述第二请求中携带的参数包括下述至少一项AI/ML模型切分点、与模型标识或模型切分标识关联的分析类型标识、接收AI/ML 模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE可提供的内存、待参与模型联合推理的UE剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

在此需要说明的是，本公开提供的辅助模型切分的装置，能够实现图13方法实施例所实现的所有方法步骤，且能够达到相同的技术效果，在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。

需要说明的是，本公开实施例对单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本公开各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本公开实施例还提供一种处理器可读存储介质。处理器可读存储介质存储有计算机程序，计算机程序用于使处理器执行上述任一种方法实施例。

其中，处理器可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备，包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD))等。

本领域内的技术人员应明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机可执行指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机可执行指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些处理器可执行指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的处理器可读存储器中，使得存储在该处理器可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些处理器可执行指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样，倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内，则本公开也意图包含这些改动和变型在内。

Claims

一种辅助模型切分的方法，其特征在于，应用于网络实体，所述方法包括：

接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息；

根据所述第一消息，确定AI/ML模型切分的切分结果。
根据权利要求1所述的方法，其特征在于，所述第一消息中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者用户永久标识SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第一消息中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。
根据权利要求2所述的方法，其特征在于，所述根据所述第一消息，确定AI/ML模型切分的切分结果，包括：

根据所述第一消息中的待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量，确定所述待参与模型联合推理的UE(s)对应的模型切分点信息；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则根据所述第一消息中的待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，确定所述待参与模型联合推理的UE(s)对应的模型切分点信息；

将所述模型切分点信息作为所述切分结果。
根据权利要求3所述的方法，其特征在于，所述确定所述待参与模型联合推理的UE(s)对应的模型切分点信息，包括：

将所有确定参与执行模型联合推理的UE(s)中的任一UE作为目标UE，针对每个所述目标UE执行下述步骤：

若所述目标UE可提供的算力低于第一预设算力阈值或所述目标UE可提供的内存低于第一预设内存阈值或所述目标UE剩余的电量低于第一预设电量阈值时，确定所述目标UE执行第一预设数目层的推理；

若所述目标UE可提供的算力高于第一预设算力阈值并低于第二预设算力阈值，和所述目标UE可提供的内存高于第一预设内存阈值并低于第二预设内存阈值，以及所述目标UE剩余的电量高于第一预设电量阈值并低于第二预设电量阈值时，确定所述目标UE执行第二预设数目的推理，第一预设数目层小于第二预设数目层；

若所述目标UE可提供的算力高于第二预设算力阈值并低于第三预设算力阈值，和所述目标UE可提供的内存高于第二预设内存阈值并低于第三预设内存阈值，以及所述目标UE剩余的电量高于第二预设电量阈值并低于第三预设电量阈值时，确定所述目标UE执行第三预设数目层的推理，第二预设数目层小于第三预设数目层；以此类推，直至确定所述目标UE执行第N+1预设数目层的推理，第N预设数目层小于第N+1预设数目层；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级低于第一预设隐私等级或模型不同层的时延需求信息低于第一预设时延，则所述目标UE执行所述第一预设数目层的推理；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级高于第一预设隐私等级并低于第二预设隐私等级，和模型不同层的时延需求信息高于第一预设时延并低于第二预设时延时，确定所述目标UE执行第二预设数目层的推理；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级高于第二预设隐私等级并低于第三预设隐私等级，和模型不同层的时延需求信息高于第二预设时延并低于第三预设时延时，确定所述目标UE执行第三预设数目层的推理；以此类推，直至确定所述目标UE执行第N+1预设数目层的推理，第N预设数目层小于第N+1预设数目层；

根据预设数目层确定AI/ML模型切分点信息，所述AI/ML模型切分点信息用于表示AI/ML模型切分比例，所述预设数目层包括第N预设数目层，N大于或等于一。
根据权利要求1-4任一项所述的方法，其特征在于，如果所述网络实体是网络数据分析功能NWDAF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

直接或通过网络能力开放功能NEF接收应用功能AF发送的第一请求，所述第一请求用于请求对AI/ML模型切分进行分析；其中，所述第一请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接受AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足切分条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型需要数据集的隐私等级和/或模型不同层的时延，所述第一请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第一请求中携带的参数，向5GC NF(s)发送第二消息，所述第二消息用于请求5GC NF(s)采集UE(s)对应的第一数据，所述第一数据中包括下述至少一项：待参与AI/ML模型切分的UE(s)以及SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第一请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第一数据中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收5GC NF(s)发送的所述第一数据，并将所述第一数据作为所述第一消息；所述第一数据是由待参与模型联合推理的UE(s)同意所述第二消息的请求后提供的。
根据权利要求5所述的方法，其特征在于，所述确定AI/ML模型切分的切分结果之后，所述方法还包括：

向所述AF发送第三消息，所述第三消息中包括AI/ML模型切分点信息以及所述第一数据；所述第三消息用于为AF提供向待参与模型联合推理的UE(s)发送第二请求时携带的参数，所述第二请求用于请求与待参与模型联合推理的UE(s)执行模型联合推理操作，所述第二请求中携带的参数包括所述第三消息。
根据权利要求1-4任一项所述的方法，其特征在于，如果所述网络实体是网络数据分析功能NWDAF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

直接或通过网络能力开放功能NEF接收AF发送的第三请求；所述第三请求是由AF确定与待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力后确定的，其中，是否具备完全支持执行模型联合推理的能力是由AF根据接收到的待参与模型联合推理的UE(s)发送的第四请求中携带的参数确定的，所述第四请求用于待参与模型联合推理的UE(s)请求与AF进行模型联合推理，所述第四请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第四请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，所述第三请求中携带的参数包括所述第四请求中携带的参数；

将所述第三请求中携带的参数作为所述第一消息；

其中，若第四请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。
根据权利要求7所述的方法，其特征在于，所述确定AI/ML模型切分的切分结果之后，所述方法还包括：

向所述AF发送第四消息，所述第四消息中包括所述AI/ML模型切分点信息、所述第一消息中的数据；所述第四消息用于为AF提供向待参与模型联合推理的UE(s)发送的第四请求结果，所述第四请求结果中包括所述AI/ML模型切分点信息。
根据权利要求1-4任一项所述的方法，其特征在于，如果所述网络实体是网络数据分析功能NWDAF，所述接收用于请求人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

直接或通过网络能力开放功能NEF接收应用功能AF发送的第五请求，所述第五请求是由AF确定与待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力后确定的，其中，是否具备完全支持执行模型联合推理的能力是由AF根据接收到的待参与模型联合推理的UE(s)发送的第六请求确定的，所述第五请求用于请求对AI/ML模型切分进行分析以及请求查找其他可参与模型推理的UE(s)并提供其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量；其中，所述第五请求中携带的参数包括下述至少一项：与模型切分关联的分析类型标识、接受AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足切分条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第五请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；所述第六请求用于待参与模型联合推理的UE(s)请求与AF进行模型联合推理，所述第六请求中携带的参数包括所述第五请求中携带的参数；

根据所述第五请求中携带的参数，向5GC NF(s)发送第五消息，所述第五消息用于请求5GC NF(s)采集UE(s)对应的第二数据，所述第二数据中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第五请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第二数据中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收5GC NF(s)发送的所述第二数据，并将所述第二数据作为所述第一消息；所述第二数据是由待参与模型联合推理的UE(s)同意所述第五消息的请求后提供的；

其中，若第六请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。
根据权利要求9所述的方法，其特征在于，所述确定AI/ML模型切分的切分结果之后，所述方法还包括：

向所述AF发送第六消息，所述第六消息中至少包括所述AI/ML模型切分点信息以及所述第二数据；所述第六消息用于为AF提供向待参与模型联合推理的UE(s)发送的第六请求结果，所述第六请求结果中包括所述待参与模型联合推理的UE(s)以及对应的所述AI/ML模型切分点信息。
根据权利要求1-4任一项所述的方法，其特征在于，如果所述网络实体是网络数据分析功能NWDAF，所述接收用于请求人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

接收待参与模型联合推理的UE(s)发送的第七请求，所述第七请求用于请求与NWDAF执行模型联合推理操作；所述第七请求中携带的参数包括下述至少一项：待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第七请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；根据所述第七请求中携带的参数，确定AF与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

若与所述待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第七请求中携带的参数作为所述第一消息；

若与所述待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则请求NF查找其他可参与模型推理的UE(s)并提供其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，且若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则请求提供其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NF发送的查找结果，所述查找结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则查找结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

将所述第七请求中携带的参数以及所述查找结果作为所述第一消息；

其中，若第七请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。
根据权利要求11所述的方法，其特征在于，所述确定AI/ML模型切分的切分结果之后，所述方法还包括：

向所述待参与模型联合推理的UE(s)发送第七请求结果，所述第七请求结果中包括AI/ML模型切分点信息；

其中，若存在其他参与联合模型推理的UE(s)，则所述第七请求结果中还包括其他参与联合模型推理的UE(s)对应的模型切分点信息，并通过AF透传给所述UE(s)。
根据权利要求1-4任一项所述的方法，其特征在于，如果所述网络实体是应用功能AF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

接收待参与模型联合推理的UE(s)发送的第八请求，所述第八请求用于请求与AF执行模型联合推理操作；所述第八请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第八请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；根据所述第八请求中携带的参数，确定与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

若与所述待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第八请求中携带的参数作为所述第一消息；

若与所述待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则向网络数据分析功能NWDAF发送第九请求，所述第九请求中携带的参数包括所述第八请求中携带的参数，且所述第九请求用于请求NWDAF通过NF查找其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第九请求中携带的参数还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第九请求结果，并将所述第九请求结果以及所述第八请求中携带的参数作为所述第一消息；其中，所述第九请求结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第九请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

若第八请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。
根据权利要求13所述的方法，其特征在于，所述确定AI/ML模型切分的切分结果之后，所述方法还包括：

将确定与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力的结果、所述待参与模型联合推理的UE(s)的相关信息以及所述待参与模型联合推理的UE(s)对应的模型切分点信息发送给所述UE；

其中，所述相关信息包括下述至少一项：待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述相关信息中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。
根据权利要求1-4任一项所述的方法，其特征在于，如果所述网络实体是应用功能AF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

向网络数据分析功能NWDAF发送第十请求，所述第十请求用于请求NWDAF向5GC NF(s)采集UE(s)对应的用于分析AI/ML模型切分的数据，所述第十请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第十请求结果，所述第十请求结果包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第十请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第十请求结果中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

将所述第十请求结果作为所述第一消息。
根据权利要求15所述的方法，其特征在于，所述确定AI/ML模型切分的切分结果之后，所述方法还包括：

向待参与模型联合推理的UE(s)发送第十一请求，所述第十一请求用于请求与所述待参与模型联合推理的UE(s)执行模型联合推理操作；其中，所述第十一请求中携带的参数包括下述至少一项：模型切分点信息、所述第一消息；

接收待参与模型联合推理的UE(s)发送的第十一请求结果，所述第十一请求结果是由待参与模型联合推理的UE(s)根据第十一请求中携带的参数确定的，所述第十一请求结果包括接受第十一请求或不接受第十一请求。
根据权利要求1-4任一项所述的方法，其特征在于，如果所述网络实体是新的网络实体MMF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

直接或通过网络能力开放功能NEF接收应用功能AF发送的第十二请求，所述第十二请求用于请求AI/ML模型切分分析；所述第十二请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十二请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第十二请求中携带的参数，向NWDAF发送第十三请求，所述第十三请求中携带的参数包括所述第十二请求中携带的参数，且所述第十三请求用于请求NWDAF向5GC NF(s)采集UE(s)的用于分析AI/ML模型切分的数据；

接收NWDAF发送的第十三请求结果；其中，所述第十三请求结果包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第十三请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第十二请求结果中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

将所述第十三请求结果作为所述第一消息。
根据权利要求17所述的方法，其特征在于，所述确定AI/ML模型切分的切分结果之后，所述方法还包括：

向所述AF发送第八消息，所述第八消息中包括所述AI/ML模型切分点、所述第一消息中的数据；所述第八消息用于为AF提供向待参与模型联合推理的UE(s)发送第十四请求时携带的参数，所述第十四请求用于请求与待参与模型联合推理的UE(s)执行模型联合推理操作，所述第十四请求中携带的参数包括所述第八消息。
根据权利要求1-4任一项所述的方法，其特征在于，如果所述网络实体是新的网络实体MMF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

直接或通过网络能力开放功能NEF接收应用功能AF发送的第十五请求，所述第十五请求用于请求AI/ML模型切分分析，所述第十五请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十五请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第十五请求中携带的参数，确定AF与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

若与所述待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第十五请求中携带的参数作为所述第一消息；

若与所述待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则向NWDAF发送第十六请求，所述第十六请求中携带的参数包括所述第十五请求中携带的参数，且所述第十六请求用于请求NWDAF通过NF查找其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十六请求中携带的参数还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第十六请求结果，并将所述第十六请求结果以及所述第十五请求中携带的参数作为所述第一消息；其中，所述第十六请求结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十六请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。
根据权利要求19所述的方法，其特征在于，所述确定AI/ML模型切分的切分结果之后，所述方法还包括：

向所述AF发送第十五请求结果，所述第十五请求结果中包括AI/ML模型切分点信息；

其中，若存在其他参与联合模型推理的UE(s)，则所述第十五请求结果中还包括其他参与联合模型推理的UE(s)对应的模型切分点信息，并通过AF透传给所述待参与模型联合推理的UE(s)。
根据权利要求1-4任一项所述的方法，其特征在于，如果所述网络实体是策略控制功能PCF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

直接或通过网络能力开放功能NEF接收应用功能AF发送的第十七请求，所述第十七请求用于请求AI/ML模型切分分析；所述第十七请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十七请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第十七请求中携带的参数，向网络数据分析功能NWDAF发送第十八请求，所述第十八请求中携带的参数包括所述第十七请求中携带的参数，且所述第十八请求用于请求NWDAF向5GC NF(s)采集UE(s)对应的第五数据；所述第五数据中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第五数据中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第十八请求结果；其中，所述第十八请求结果包括所述第五数据；

将所述第十八请求结果作为所述第一消息。
根据权利要求21所述的方法，其特征在于，所述确定AI/ML模型切分的切分结果之后，所述方法还包括：

向所述AF发送第九消息，所述第九消息中包括所述AI/ML模型切分点、所述第一消息的数据；所述第九消息用于为AF提供向待参与模型联合推理的UE(s)发送第十九请求时携带的参数，所述第十九请求用于请求与待参与模型联合推理的UE(s)执行模型联合推理操作，所述第十九请求中携带的参数包括所述第九消息。
根据权利要求1-4任一项所述的方法，其特征在于，如果所述网络实体是策略控制功能PCF，所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息，包括：

直接或通过网络能力开放功能NEF接收应用功能AF发送的第二十请求，所述第二十请求用于请求AI/ML模型切分分析，所述第二十请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二十请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第二十请求中携带的参数，确定所述AF以及待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

若所述AF以及待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第二十请求中携带的参数作为所述第一消息；

若所述AF以及待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则向NWDAF发送第二十一请求，所述第二十一请求中携带的参数包括所述第二十请求中携带的参数，且所述第二十一请求用于请求NWDAF通过NF查找其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二十一请求中携带的参数还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第二十一请求结果，并将所述第二十一请求结果以及所述第二十请求中携带的参数作为所述第一消息；其中，所述第二十一请求结果包括：其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二十一请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

若第二十请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。
根据权利要求23所述的方法，其特征在于，所述确定AI/ML模型切分的切分结果之后，所述方法还包括：

向所述AF发送第二十请求结果，所述第二十请求结果中包括AI/ML模型切分点信息；

其中，若存在其他参与联合模型推理的UE(s)，则所述第二十请求结果中还包括其他参与联合模型推理的UE(s)对应的模型切分点信息，并通过AF透传给所述UE(s)。
一种辅助模型切分的方法，其特征在于，应用于用户设备UE，所述方法包括：

根据自身能力信息，确定AI/ML模型切分点信息；

将所述AI/ML模型切分点信息作为AI/ML模型切分的切分结果。
根据权利要求25所述的方法，其特征在于，所述根据自身能力信息，确定AI/ML模型切分点信息，包括：

根据自身能力信息中的可提供的算力、可提供的内存以及剩余的电量，确定模型切分点信息；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则根据所述自身能力信息中的可提供的算力、可提供的内存、剩余的电量、推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，确定模型切分点信息。
根据权利要求26所述的方法，其特征在于，所述确定模型切分点信息，包括：

将所有确定参与执行模型联合推理的UE(s)中的任一UE作为目标UE，针对每个所述目标UE执行下述步骤：

若所述目标UE可提供的算力低于第一预设算力阈值或所述目标UE可提供的内存低于第一预设内存阈值或所述目标UE剩余的电量低于第一预设电量阈值时，确定所述目标UE执行第一预设数目层的推理；

若所述目标UE可提供的算力高于第一预设算力阈值并低于第二预设算力阈值，和所述目标UE可提供的内存高于第一预设内存阈值并低于第二预设内存阈值，以及所述目标UE剩余的电量高于第一预设电量阈值并低于第二预设电量阈值时，确定所述目标UE执行第二预设数目的推理，第一预设数目层小于第二预设数目层；

若所述目标UE可提供的算力高于第二预设算力阈值并低于第三预设算力阈值，和所述目标UE可提供的内存高于第二预设内存阈值并低于第三预设内存阈值，以及所述目标UE剩余的电量高于第二预设电量阈值并低于第三预设电量阈值时，确定所述目标UE执行第三预设数目层的推理，第二预设数目层小于第三预设数目层；以此类推，直至确定所述目标UE执行第N+1预设数目层的推理，第N预设数目层小于第N+1预设数目层；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级低于第一预设隐私等级或模型不同层的时延需求信息低于第一预设时延，则所述目标UE执行所述第一预设数目层的推理；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级高于第一预设隐私等级并低于第二预设隐私等级，和模型不同层的时延需求信息高于第一预设时延并低于第二预设时延时，确定所述目标UE执行第二预设数目层的推理；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，且若推理AI/ML模型需要的数据集的隐私等级高于第二预设隐私等级并低于第三预设隐私等级，和模型不同层的时延需求信息高于第二预设时延并低于第三预设时延时，确定所述目标UE执行第三预设数目层的推理；以此类推，直至确定所述目标UE执行第N+1预设数目层的推理，第N预设数目层小于第N+1预设数目层；

根据预设数目层确定AI/ML模型切分点信息，所述AI/ML模型切分点信息用于表示AI/ML模型切分比例，所述预设数目层包括第N预设数目层，N大于或等于一。
根据权利要求27所述的方法，其特征在于，所述确定AI/ML模型切分的切分结果之后，所述方法还包括：

向应用功能AF发送第一请求，所述第一请求用于请求与所述AF执行模型联合推理操作；其中，所述第一请求中携带的参数包括下述至少一项AI/ML模型切分点、与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE可提供的内存、待参与模型联合推理的UE剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第一请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收AF发送的第一请求结果，所述第一请求结果是由AF根据第一请求中携带的参数确定的，所述第一请求结果包括接受第一请求或不接受第一请求；

其中，若第一请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。
根据权利要求27所述的方法，其特征在于，所述确定AI/ML模型切分的切分结果之后，所述方法还包括：

通过AF向网络数据分析功能NWDAF发送第二请求，所述第二请求用于请求与所述NWDAF执行模型联合推理操作；其中，所述第二请求中携带的参数包括下述至少一项AI/ML模型切分点、与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE可提供的内存、待参与模型联合推理的UE剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第二请求结果，所述第二请求结果是由NWDAF根据第一请求中携带的参数确定的，所述第二请求结果包括接受第一请求或不接受第一请求；

其中，若第二请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。
一种辅助模型切分的装置，其特征在于，应用于网络实体，所述装置包括存储器，收发机，处理器：

存储器，用于存储计算机程序；收发机，用于在所述处理器的控制下收发数据；处理器，用于读取所述存储器中的计算机程序并执行以下操作：

接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息；

根据所述第一消息，确定AI/ML模型切分的切分结果。
一种辅助模型切分的装置，其特征在于，应用于用户设备UE，所述装置包括存储器，收发机，处理器：

存储器，用于存储计算机程序；收发机，用于在所述处理器的控制下收发数据；处理器，用于读取所述存储器中的计算机程序并执行以下操作：

根据自身能力信息，确定AI/ML模型切分点信息；

将所述AI/ML模型切分点信息作为AI/ML模型切分的切分结果。
一种辅助模型切分的装置，其特征在于，应用于网络实体，所述装置包括：

接收单元，用于接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息；

确定单元，用于根据所述第一消息，确定AI/ML模型切分的切分结果。
根据权利要求32所述的装置，其特征在于，所述第一消息中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者用户永久标识SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第一消息中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。
根据权利要求32或33所述的装置，其特征在于，接收单元，具体用于：

如果所述网络实体是网络数据分析功能NWDAF，直接或通过网络能力开放功能NEF接收应用功能AF发送的第一请求，所述第一请求用于请求对AI/ML模型切分进行分析；其中，所述第一请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接受AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足切分条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型需要数据集的隐私等级和/或模型不同层的时延，所述第一请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第一请求中携带的参数，向5GC NF(s)发送第二消息，所述第二消息用于请求5GC NF(s)采集UE(s)对应的第一数据，所述第一数据中包括下述至少一项：待参与AI/ML模型切分的UE(s)以及SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第一请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第一数据中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收5GC NF(s)发送的所述第一数据，并将所述第一数据作为所述第一消息；所述第一数据是由待参与模型联合推理的UE(s)同意所述第二消息的请求后提供的。
根据权利要求32或33所述的装置，其特征在于，接收单元，具体用于：

如果所述网络实体是网络数据分析功能NWDAF，直接或通过网络能力开放功能NEF接收AF发送的第三请求；所述第三请求是由AF确定与待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力后确定的，其中，是否具备完全支持执行模型联合推理的能力是由AF根据接收到的待参与模型联合推理的UE(s)发送的第四请求中携带的参数确定的，所述第四请求用于待参与模型联合推理的UE(s)请求与AF进行模型联合推理，所述第四请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第四请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，所述第三请求中携带的参数包括所述第四请求中携带的参数；

将所述第三请求中携带的参数作为所述第一消息；

其中，若第四请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。
根据权利要求32或33所述的装置，其特征在于，发送单元，具体用于：

如果所述网络实体是网络数据分析功能NWDAF，直接或通过网络能力开放功能NEF接收应用功能AF发送的第五请求，所述第五请求是由AF确定与待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力后确定的，其中，是否具备完全支持执行模型联合推理的能力是由AF根据接收到的待参与模型联合推理的UE(s)发送的第六请求确定的，所述第五请求用于请求对AI/ML模型切分进行分析以及请求查找其他可参与模型推理的UE(s)并提供其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量；其中，所述第五请求中携带的参数包括下述至少一项：与模型切分关联的分析类型标识、接受AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足切分条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第五请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；所述第六请求用于待参与模型联合推理的UE(s)请求与AF进行模型联合推理，所述第六请求中携带的参数包括所述第五请求中携带的参数；

根据所述第五请求中携带的参数，向5GC NF(s)发送第五消息，所述第五消息用于请求5GC NF(s)采集UE(s)对应的第二数据，所述第二数据中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第五请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第二数据中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收5GC NF(s)发送的所述第二数据，并将所述第二数据作为所述第一消息；所述第二数据是由待参与模型联合推理的UE(s)同意所述第五消息的请求后提供的；

其中，若第六请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。
根据权利要求32或33所述的装置，其特征在于，接收单元，具体用于：

如果所述网络实体是网络数据分析功能NWDAF，接收待参与模型联合推理的UE(s)发送的第七请求，所述第七请求用于请求与NWDAF执行模型联合推理操作；所述第七请求中携带的参数包括下述至少一项：待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第七请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；根据所述第七请求中携带的参数，确定AF与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

若与所述待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第七请求中携带的参数作为所述第一消息；

若与所述待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则请求NF查找其他可参与模型推理的UE(s)并提供其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，且若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则请求提供其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NF发送的查找结果，所述查找结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则查找结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

将所述第七请求中携带的参数以及所述查找结果作为所述第一消息；

其中，若第七请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。
根据权利要求32或33所述的装置，其特征在于，接收单元，具体用于：

如果所述网络实体是应用功能AF，接收待参与模型联合推理的UE(s)发送的第八请求，所述第八请求用于请求与AF执行模型联合推理操作；所述第八请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第八请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；根据所述第八请求中携带的参数，确定与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

若与所述待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第八请求中携带的参数作为所述第一消息；

若与所述待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则向网络数据分析功能NWDAF发送第九请求，所述第九请求中携带的参数包括所述第八请求中携带的参数，且所述第九请求用于请求NWDAF通过NF查找其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第九请求中携带的参数还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第九请求结果，并将所述第九请求结果以及所述第八请求中携带的参数作为所述第一消息；其中，所述第九请求结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第九请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

若第八请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。
根据权利要求32或33所述的装置，其特征在于，接收单元，具体用于：

如果所述网络实体是应用功能AF，向网络数据分析功能NWDAF发送第十请求，所述第十请求用于请求NWDAF向5GC NF(s)采集UE(s)对应的用于分析AI/ML模型切分的数据，所述第十请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第十请求结果，所述第十请求结果包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第十请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第十请求结果中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

将所述第十请求结果作为所述第一消息。
根据权利要求32或33所述的装置，其特征在于，接收单元，具体用于：

如果所述网络实体是新的网络实体MMF，直接或通过网络能力开放功能NEF接收应用功能AF发送的第十二请求，所述第十二请求用于请求AI/ML模型切分分析；所述第十二请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十二请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第十二请求中携带的参数，向NWDAF发送第十三请求，所述第十三请求中携带的参数包括所述第十二请求中携带的参数，且所述第十三请求用于请求NWDAF向5GC NF(s)采集UE(s)的用于分析AI/ML模型切分的数据；

接收NWDAF发送的第十三请求结果；其中，所述第十三请求结果包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若第十三请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，则所述第十二请求结果中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

将所述第十三请求结果作为所述第一消息。
根据权利要求32或33所述的装置，其特征在于，接收单元，具体用于：

如果所述网络实体是新的网络实体MMF，直接或通过网络能力开放功能NEF接收应用功能AF发送的第十五请求，所述第十五请求用于请求AI/ML模型切分分析，所述第十五请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十五请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第十五请求中携带的参数，确定AF与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

若与所述待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第十五请求中携带的参数作为所述第一消息；

若与所述待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则向NWDAF发送第十六请求，所述第十六请求中携带的参数包括所述第十五请求中携带的参数，且所述第十六请求用于请求NWDAF通过NF查找其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十六请求中携带的参数还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第十六请求结果，并将所述第十六请求结果以及所述第十五请求中携带的参数作为所述第一消息；其中，所述第十六请求结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十六请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。
根据权利要求32或33所述的装置，其特征在于，接收单元，具体用于：

如果所述网络实体是策略控制功能PCF，直接或通过网络能力开放功能NEF接收应用功能AF发送的第十七请求，所述第十七请求用于请求AI/ML模型切分分析；所述第十七请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第十七请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第十七请求中携带的参数，向网络数据分析功能NWDAF发送第十八请求，所述第十八请求中携带的参数包括所述第十七请求中携带的参数，且所述第十八请求用于请求NWDAF向5GC NF(s)采集UE(s)对应的第五数据；所述第五数据中包括下述至少一项：待参与AI/ML模型切分的UE(s)或者SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第五数据中还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第十八请求结果；其中，所述第十八请求结果包括所述第五数据；

将所述第十八请求结果作为所述第一消息。
根据权利要求32或33所述的装置，其特征在于，接收单元，具体用于：

如果所述网络实体是策略控制功能PCF，直接或通过网络能力开放功能NEF接收应用功能AF发送的第二十请求，所述第二十请求用于请求AI/ML模型切分分析，所述第二十请求中携带的参数包括下述至少一项：与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量；若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二十请求中携带的参数还包括：推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

根据所述第二十请求中携带的参数，确定所述AF以及待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力；

若所述AF以及待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力，则将所述第二十请求中携带的参数作为所述第一消息；

若所述AF以及待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力，则向NWDAF发送第二十一请求，所述第二十一请求中携带的参数包括所述第二十请求中携带的参数，且所述第二十一请求用于请求NWDAF通过NF查找其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二十一请求中携带的参数还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

接收NWDAF发送的第二十一请求结果，并将所述第二十一请求结果以及所述第二十请求中携带的参数作为所述第一消息；其中，所述第二十一请求结果包括：其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量，若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，所述第二十一请求结果还包括：其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息；

若第二十请求中携带的参数中不包含模型不同层的时延需求信息，则模型不同层的时延需求信息由AF提供。
一种辅助模型切分的装置，其特征在于，应用于用户设备UE，所述装置包括：

确定单元，用于根据自身能力信息，确定AI/ML模型切分点信息；

处理单元，用于将所述AI/ML模型切分点信息作为AI/ML模型切分的切分结果。
根据权利要求44所述的装置，其特征在于，确定单元，具体用于：

根据自身能力信息中的可提供的算力、可提供的内存以及剩余的电量，确定模型切分点信息；

若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延，则根据所述自身能力信息中的可提供的算力、可提供的内存、剩余的电量、推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息，确定模型切分点信息。
一种处理器可读存储介质，其特征在于，所述处理器可读存储介质存储有计算机程序，所述计算机程序用于使所述处理器执行权利要求1至29任一项所述的方法。