WO2022236638A1

WO2022236638A1 - 一种模型推理方法、模型推理装置及存储介质

Info

Publication number: WO2022236638A1
Application number: PCT/CN2021/092900
Authority: WO
Inventors: 牟勤; 洪伟; 赵中原; 熊可欣
Original assignee: 北京小米移动软件有限公司; 北京邮电大学
Priority date: 2021-05-10
Filing date: 2021-05-10
Publication date: 2022-11-17
Also published as: US20240323099A1; CN115669030A; EP4340300A1

Abstract

本公开是关于一种模型推理方法、模型推理装置及存储介质。其中，模型推理方法，应用于操作维护管理OAM实体，所述方法包括：响应于接收到控制无线接入网设备发送的模型订阅请求信息，确定与所述模型订阅请求信息对应的第一模型；将所述第一模型进行分割，得到第一数量的模型分割块，并将所述第一数量的模型分割块分发至第一数量的控制无线接入网设备。通过本公开可以能够有效提高模型推理效率，减小推理时延，同时有助于均衡网络负载。

Description

一种模型推理方法、模型推理装置及存储介质

技术领域

本公开涉及无线通信技术领域，尤其涉及一种模型推理方法、模型推理装置及存储介质。

背景技术

在新一代通信技术中，网络智能化合自动化相关行为的决策，需要采用人工智能和机器学习获取大量可用数据，包括终端和网络侧设备采集的数据。基于所述数据利用机器学习算法进行推理、训练，提取出不同级别的相关模型。

在相关技术中，终端向通过无线接入设备向操作维护管理(Operation Administration and Maintenance，OAM)网元请求订阅模型，其模型的推理工作全部由操作维护管理(Operation Administration and Maintenance，OAM)网元来完成，模型推理工作时需要将所有模型推理数据上传至OAM，同时，OAM还需要根据模型推理数据对模型进行训练。因此，当OAM同时接收到多个订阅模型请求时，OAM无法满足多个订阅请求并提供模型推理结果，会导致模型推理结果反馈时延增大，并且降低系统工作效率。

发明内容

为克服相关技术中存在的问题，本公开提供一种模型推理方法、模型推理装置及存储介质。

根据本公开实施例的第一方面，提供一种模型推理方法，应用于操作维护管理OAM实体，所述方法包括：

响应于接收到控制无线接入网设备发送的模型订阅请求信息，确定与所述模型订阅请求信息对应的第一模型；将所述第一模型进行分割，得到第一数量的模型分割块，并将所述第一数量的模型分割块分发至第一数量的控制无线接入网设备。

一种实施方式中，所述第一数量的模型分割块中每个模型分割块对应有分配信息；

所述分配信息包括第一数量的模型分割块的推理顺序，以及与每个模型分割块对应的所述控制无线接入网设备。

一种实施方式中，所述第一数量的控制无线接入网设备包括第一控制无线接入网设备，所述第一控制无线接入网设备为终端接入的控制无线接入网设备；

所述将所述第一数量的模型分割块分发至第一数量的控制无线接入网设备，包括：

在与所述第一控制无线接入网设备相邻的控制无线接入网设备中，确定多个辅助控制无线接入网设备；

在所述多个辅助控制无线接入网设备中，基于每个所述辅助控制无线接入网设备的算力占用状态和负载，确定第二数量的控制无线接入网设备；所述第二数量的控制无线接入网设备为除第一控制无线接入设备以外第一数量中其他的控制无线接入网设备；

基于第一数量的模型分割块的推理顺序，将第一个模型分割块发送至所述第一控制无线接入网设备，并将剩余数量的模型分割块分发至所述第二数量的控制无线接入网设备。

一种实施方式中，所述模型推理方法还包括：

接收第一控制无线接入网设备发送的模型性能更新数据；基于所述模型性能更新数据更新所述第一模型，确定所述第一模型更新后的模型参数，并向所述第一控制无线接入网设备发送所述第一模型更新后的模型参数。

一种实施方式中，所述模型推理方法还包括：

响应于接收到第一模型分析订阅更新请求，更新终端接入的分布式无线接入网设备；其中，所述第一模型分析订阅更新请求指示终端切换分布式无线接入网设备，且不切换控制无线接入网设备；

或

响应于接收到第二模型分析订阅更新请求，更新终端接入的分布式无线接入网设备，并重新对所述第一模型进行分割；其中，所述第二模型分析订阅更新请求指示终端切换分布式无线接入网设备，并切换控制无线接入网设备。

根据本公开实施例的第二方面，提供一种模型推理方法，应用于控制无线接入网设备，所述方法包括：

响应于接收到分布式无线接入网设备发送的模型分析订阅请求，对所述模型分析订阅请求进行处理得到模型订阅请求信息，并向OAM发送所述模型订阅请求信息；接收OAM发送的模型分割块；所述模型分割块为分割第一模型确定的模型分割块；所述第一模型为OAM基于所述模型订阅请求信息确定的。

一种实施方式中，所述向OAM发送模型订阅请求信息之后，所述方法还包括：

向分布式无线接入网设备发送模型推理数据请求，所述模型推理数据请求用于获取模型推理数据；基于所述模型推理数据对所述模型分割块进行推理，得到模型分割块的推理中间信息。

一种实施方式中，所述模型分割块对应有分配信息；所述分配信息包括第一数量的模型分割块的推理顺序，以及与每个模型分割块对应的所述控制无线接入网设备；

所述模型推理方法还包括：

响应于所述控制无线接入网设备不是最后一个控制无线接入网设备，基于所述推理顺序，将推理中间信息发送至下一个控制无线接入网设备；响应于所述控制无线接入网设备为最后一个控制无线接入网设备，模型推理完成后，确定与第一模型对应的第一推理结果，将所述第一推理结果发送至第一控制无线接入网设备，所述第一控制无线接入网设备为终端接入的控制无线接入网设备。

一种实施方式中，所述方法还包括：

响应于所述控制无线接入网设备为第一控制无线接入网设备，接收所述第一推理结果；向第一分布式无线接入网设备发送所述第一推理结果，所述第一分布式无线接入网设备为终端接入的分布式无线接入网设备。

一种实施方式中，所述将所述第一推理结果发送至第一分布式无线接入网设备之后，所述模型推理方法还包括：

接收第一分布式无线接入网设备发送的性能数据，所述性能数据为终端基于第一模型调整执行策略后的真实性能数据；对所述性能数据进行处理，得到模型性能更新数据，并向OAM发送所述模型性能更新数据。

一种实施方式中，向OAM发送模型订阅请求信息，包括：

响应于所述控制无线接入网设备为第一控制无线接入网设备，向OAM发送模型订阅请求信息；其中，所述第一控制无线接入网设备为终端接入的第一分布式无线网络设备对应的控制无线接入网设备。

一种实施方式中，所述模型推理方法还包括：

响应于所述控制无线接入网设备为第一控制无线接入网设备，若重新接收到模型分析订阅请求，确定重新发送所述模型分析订阅请求的第二分布式无线接入网设备；所述第二分布式无线接入网设备为终端切换分布式无线接入网设备后重新接入的分布式无线接入网设备；将第一推理结果发送至第二分布式无线接入网设备，并向OAM发送模型订阅更新请求。

一种实施方式中，所述模型推理方法还包括：

响应于所述控制无线接入网设备为第二控制无线接入网设备，若重新接收到模型分析订阅请求，确定重新发送所述模型分析订阅请求的第二分布式无线接入网设备，以及重新接收到模型分析订阅请求的第二控制无线接入网设备，所述第二控制无线接入网设备为第二分布式无线接入网设备对应的控制无线接入网设备；所述第二分布式无线接入网设备为终端切换分布式无线接入网设备后重新接入的分布式无线接入网设备；将第一推理结果发送至第二控制无线接入网设备，并向OAM发送模型订阅更新请求。

根据本公开实施例的第三方面，提供一种模型推理方法，应用于分布式无线接入网设备，所述方法包括：

响应于接收到终端发送的模型分析订阅请求，向控制无线接入网设备发送所述模型分析订阅请求；其中，所述模型分析订阅请求用于向OAM获取第一模型；所述第一模型包括第一数量的模型分割块。

一种实施方式中，所述方法还包括：

接收控制无线接入网设备发送的模型推理数据请求，所述模型推理数据请求用于获取模型推理数据；向终端获取模型推理数据，并发送至控制无线接入网设备。

一种实施方式中，所述方法还包括：

响应于所述分布式无线接入网设备为第一分布式无线接入网设备，接收第一控制无线接入网设备发送的第一推理结果；将所述第一推理结果发送至终端。

一种实施方式中，所述将所述第一推理结果发送至终端之后，所述方法还包括：

响应于所述分布式无线接入网设备为第一分布式无线接入网设备，接收终端发送的性能数据；所述性能数据为终端基于第一模型调整执行策略后的真实性能数据；向第一控制无线接入网设备发送所述性能数据。

一种实施方式中，所述方法还包括：

响应于所述无线接入网设备为第二分布式无线接入网设备，若接收到终端重新发送的模型分析订阅请求，确定向与所述第二分布式无线接入网络设备对应的控制无线接入网设备发送模型分析订阅请求；其中，所述第二分布式无线接入网设备为终端切换分布式无线接入网设备后重新接入的分布式无线接入网设备。

根据本公开实施例的第四方面，提供一种模型推理装置，应用于操作维护管理OAM实体，所述装置包括：

确定模块，用于响应于接收到控制无线接入网设备发送的模型订阅请求信息，确定与所述模型订阅请求信息对应的第一模型；发送模块，用于将所述第一模型进行分割，得到第一数量的模型分割块，并将所述第一数量的模型分割块分发至第一数量的控制无线接入网设备。

发送模块，用于：

一种实施方式中，所述模型推理装置还包括：接收模块；

所示接收模块用于，接收第一控制无线接入网设备发送的模型性能更新数据；基于所述模型性能更新数据更新所述第一模型，确定所述第一模型更新后的模型参数，并向所述第一控制无线接入网设备发送所述第一模型更新后的模型参数。

一种实施方式中，所述接收模块还用于：

或

根据本公开实施例的第五方面，提供一种模型推理装置，应用于控制无线接入网设备，所述装置包括：

发送模块，用于响应于接收到分布式无线接入网设备发送的模型分析订阅请求，对所述模型分析订阅请求进行处理得到模型订阅请求信息，并向OAM发送所述模型订阅请求信息；接收模块，用于接收OAM发送的模型分割块；所述模型分割块为分割第一模型确定的模型分割块；所述第一模型为OAM基于所述模型订阅请求信息确定的。

一种实施方式中，所述发送模块还用于：

所述发送模块还用于：

响应于所述控制无线接入网设备不是最后一个控制无线接入网设备，基于所述推理顺序，将推理中间信息发送至下一个控制无线接入网设备；响应于所述控制无线接入网设备为最后一个控制无线接入网设备，模型推理完成后，确定与第一模型对应的第一推理结果，将所述第一推理结果，发送至第一控制无线接入网设备，所述第一控制无线接入网设备为终端接入的控制无线接入网设备。

一种实施方式中，所述发送模块还用于：

一种实施方式中，所述将所述第一推理结果发送至第一分布式无线接入网设备之后，所述接收模块还用于：

一种实施方式中，所述发送模块还用于：

根据本公开实施例的第六方面，提供一种模型推理装置，应用于分布式无线接入网设备，所述装置包括：

发送模块，用于响应于接收到终端发送的模型分析订阅请求，向控制无线接入网设备发送所述模型分析订阅请求；其中，所述模型分析订阅请求用于向OAM获取第一模型；所述第一模型包括第一数量的模型分割块。

一种实施方式中，所述装置还包括：接收模块；

接收模块，用于接收控制无线接入网设备发送的模型推理数据请求，所述模型推理数据请求用于获取模型推理数据；向终端获取模型推理数据，并发送至控制无线接入网设备。

一种实施方式中，所述接收模块，还用于：

根据本公开实施例的第七方面，提供一种模型推理装置，包括：

处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为：执行第一方面或第一方面任意一种实施方式中所述的模型推理方法，或执行第二方面或第二方面任意一种实施方式中所述的模型推理方法，或执行第三方面或第三方面任意一种实施方式中所述的模型推理方法。

根据本公开实施例的第八方面，提供一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行第一方面或第一方面任意一种实施方式中所述的模型推理方法，或使得移动终端能够执行第二方面或第二方面任意一种实施方式中所述的模型推理方法，或使得移动终端能够执行第三方面或第三方面任意一种实施方式中所述的模型推理方法。

本公开的实施例提供的技术方案可以包括以下有益效果：通过本公开OAM将模型分割，并将模型分割块分发至不同的控制无线接入网设备，可以更好地开发无线接入网设备的AI处理能力，解决了无线接入网设备AI处理能力不足的问题，并有利于网络负载均衡。分利用本地AI处理能力，能够有效提高模型推理效率，减小推理时延，同时有助于均衡网络负载，为用户提供高效、便捷的AI分析服务。。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1根据一示例性实施例示出的一种基本功能性框架结构示意图。

图2根据一示例性实施例示出的一种网络架构示意图。

图3是根据一示例性实施例示出的一种模型推理方法的流程图。

图4是根据一示例性实施例示出的又一种模型推理方法的流程图。

图5是根据一示例性实施例示出的又一种模型推理方法的流程图。

图6是根据一示例性实施例示出的又一种模型推理方法的流程图。

图7是根据一示例性实施例示出的又一种模型推理方法的流程图。

图8是根据一示例性实施例示出的又一种模型推理方法的流程图。

图9是根据一示例性实施例示出的又一种模型推理方法的流程图。

图10是根据一示例性实施例示出的又一种模型推理方法的流程图。

图11是根据一示例性实施例示出的又一种模型推理方法的流程图。

图12是根据一示例性实施例示出的又一种模型推理方法的流程图。

图13是根据一示例性实施例示出的又一种模型推理方法的流程图。

图14是根据一示例性实施例示出的又一种模型推理方法的流程图。

图15是根据一示例性实施例示出的又一种模型推理方法的流程图。

图16是根据一示例性实施例示出的又一种模型推理方法的流程图。

图17是根据一示例性实施例示出的又一种模型推理方法的流程图。

图18是根据一示例性实施例示出的又一种模型推理方法的流程图。

图19是根据一示例性实施例示出的又一种模型推理方法的流程图。

图20是根据一示例性实施例示出的一种模型推理方法中终端切换的流程图。

图21是根据一示例性实施例示出的一种模型推理方法中终端切换的流程图。

图22是根据一示例性实施例示出的一种模型推理方法的协议和接口原理图。

图23是根据一示例性实施例示出的一种无模型推理方法中终端在同一gNB-CU下切换时AI分析任务交付的协议和接口原理图。

图24是根据一示例性实施例示出的一种无模型推理方法中终端跨gNB-CU切换时AI分析任务交付的协议和接口原理图。

图25是根据一示例性实施例示出的一种模型推理装置框图。

图26是根据一示例性实施例示出的又一种模型推理装置框图。

图27是根据一示例性实施例示出的又一种模型推理装置框图。

图28是根据一示例性实施例示出的一种模型推理装置的框图。

图29是根据一示例性实施例示出的又一种模型推理装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在新一代智能化和自动化相关行为的决策，需要采用人工智能和机器学习获取大量可用数据，包括终端和网络侧采集的数据，并依靠机器学习算法对输入数据进行挖掘，并提取不同级别的相关模型，利用所获得的模型来驱动。为了实现大数据使能的人工智能无线网络，支持人工智能的无线网络框架，AI模块/平台的功能，输入和输出以及与无线网元的关系等关键技术是亟待研究的问题。

因此针对无线接入网设备(RAN)侧智能性优化的研究项目(Study Item)：NR和ENDC数据采集的增强研究。并对其设计准则、基本概念、适用案例、标准影响进行讨论。图1根据一示例性实施例示出的一种基本功能性框架结构示意图，如图1所示，作为初始架构，潜在的支持人工智能的无线网络架构。

其中，数据收集&准备单元(Data collection&preparation)：包含数据采集和数据预处理功能，数据采集可以在多个网元执行，提供的数据包括测量数据、反馈的性能数据和模型的性能数据等。

模型训练单元(Model Training)：通过运算和处理来迭代机器学习模型以得到更好的用于进行推理的模型，输入包括训练数据以及模型性能反馈等。

模型推理单元(Model inference)：使用训练好的机器学习模型来生成预测结果或者决策结果。

执行单元(Action)：利用模型推理结果制定并执行策略，并将执行后相关性能结果反馈给Data collection。

通过以上无线网络人工智能的架构，为提升无线网络终端业务体验注入了智能化动力。为了保持无线网络人工智能分析服务的连续性和准确性，提高无线网络人工智能的运行效率，需要对各个AI功能单元之间的交互进行进一步的规范与优化，使得无线网络人工智能架构具有更强的适应性和可扩展性。

在相关技术中，终端发起模型分析订阅请求后，均由OAM进行推理和训练。图2根据一示例性实施例示出的一种网络架构示意图。如图2所示，该系统包括终端，gNB-DU，gNB-CU和OAM，终端通过无线信道接入gNB-DU，多个gNB-DU通过F1接口接入gNB-CU，gNB-CU之间通过Xn接口连接。OAM主要负责承担支持AI的无线网络架构中模型训练功能单元的工作，负责模型训练和模型分割等工作；gNB-CU承担模型推理功能单元的工作，负责完成模型推理；gNB-DU则主要承担数据收集功能单元的工作，负责实时推理数据的收集，终端性能反馈数据收集等工作；终端承担动作执行功能单元的工作，负责依据模型推理结果做出相应的策略调整。

其中，终端负责执行(Action)功能单元的工作；基站分布式单元(next Generation Node B Distributed Unit，gNB-DU)负责转发终端的分析请求和推理结果，并执行数据收集(Data collection)功能单元的工作。基站控制单元(next Generation Node B Control Unit，gNB-CU)负责转发终端的分析请求和推理结果，并执行数据收集功能单元的工作。OAM负责执行模型训练和推理(Model training和Model inference)功能单元的工作。

其执行流程包括：终端向gNB-DU发起分析订阅请求，gNB-DU将该终端的分析订阅请求发送给gNB-CU，gNB-CU向OAM上报终端的分析订阅请求。OAM依据终端的分析订阅请求选择合适的模型，开启模型推理工作。OAM向gNB-CU发起模型推理数据请求，各级网元(gNB-CU、gNB-DU、终端)根据推理数据请求信息收集模型推理数据，进行数据处理后发送给OAM。OAM采用模型推理数据进行模型推理得到推理结果，将推理结果发送给gNB-CU，gNB-CU将推理结果发送给gNB-DU，gNB-DU将推理结果发送给终端，终端即可采用推理结果做出相应策略调整。

但是相关技术中，存在以下问题：

(1)模型推理工作全部由OAM网管来完成，需要将模型推理数据全部发送给OAM。这种方案将实时的模型推理数据从无线侧上传到网管，对数据的安全性造成了挑战，尤其是在模型推理数据包含终端业务数据的场景中，这种方案将会受到限制。

(2)完成模型推理工作时需要将所有模型推理数据上传至OAM，需要进行实时的数据传输，在无线通信资源受限的情况下，这种方案会增大网络负载。

(3)模型推理时延包括模型推理数据上传到OAM带来的传输时延、模型推理的计算时延、OAM发送推理结果给终端带来的传输时延，其中第一部分时延较大，会造成推理结果反馈不及时，影响终端业务体验。

(4)将所有模型推理任务均卸到OAM，同时OAM还需要完成模型训练工作，当终端的分析订阅请求密集时，会产生OAM算力不够的情况，将会降低系统工作效率。

基于此本公开提供一种模型推理方法，将模型推理任务分配给不同的gNB-CU(即本公开实施例中的控制无线接入网设备)。进一步地，在无线网络人工智能架构的基础上，依据各网元的AI处理能力对模型进行分割，选择多个具有AI处理能力的网元辅助终端所属的模型推理网元共同完成模型推理工作，并将推理结果反馈给终端，终端依据推理结果执行相应的策略调整，并进行性能反馈，实现模型的持续优化。

具体流程为：首先终端发起模型分析订阅请求，终端接入的gNB-CU根据自身AI处理能力和终端的分析订阅请求信息，生成模型订阅请求信息并上报至OAM。OAM根据模型订阅请求进行模型选择和模型分割、模型分割块的分配与分发，并将模型分割块分配信息发送给所有参与联合推理的gNB-CU。终端接入的gNB-CU发起模型推理数据请求，相关网元进行数据收集和处理并发送给该gNB-CU。终端接入的gNB-CU采用模型推理数据完成第一个模型分割块的推理，并依据模型分割块分配信息将推理中间结果发送给下一个模型分割块所在的gNB-CU，直至负责最后一个模型分割块推理任务的gNB-CU得到推理结果后依据模型分割块分配信息将推理结果发送给终端接入的gNB-CU。终端接入的gNB-CU将推理结果发送给终端，终端采用推理结果进行相应的策略调整。gNB-CU收集模型性能数据和终端性能反馈数据并上报给OAM，OAM对模型进行训练优化，并将更新后的模型参数发送给gNB-CU。

在终端具有高速移动性的场景下，开展无线网络AI分析任务的重新交付工作。在分析请求信息中加上终端接入位置信息，在终端接入位置发生改变后通过重新发起分析请求来全局维护分析请求信息中的接入位置信息，并加入推理结果转发、重新进行模型选择与分割等流程来实现终端切换后模型推理任务的顺利交付，保证AI分析服务的连续性和准确性。具体可分为以下两种场景：

1)当终端切换时同一gNB-CU下的另一gNB-DU(即，本公开实施例中的分布式无线接入网设备)时，终端重新发起分析订阅请求，gNB-CU、OAM更新终端的分析订阅请求信息。若终端发生切换时当前推理任务未完成，则gNB-CU继续完成推理任务，得到推理结果后依据更新分析订阅请求消息中接入位置将推理结果发送给终端当前接入的 gNB-DU，该gNB-DU将推理结果发送给终端。终端切换完成后，由新接入的gNB-DU负责完成相关数据收集和数据转发任务。

2)当终端切换至另一gNB-CU时，终端重新发送模型分析订阅请求，终端新接入的gNB-CU向OAM发送模型订阅请求。OAM更新终端的分析订阅请求，并将更新的分析订阅请求信息发送给终端的源gNB-CU。若终端切换时当前推理任务未完成，则源gNB-CU完成推理任务，得到推理结果后依据更新分析订阅请求消息中接入位置将推理结果发送给终端新接入的gNB-CU。源gNB-CU更新终端模型订阅分析请求信息，不再负责该终端的模型订阅分析请求相关任务。终端新接入的gNB-CU将推理结果发送给终端新接入的gNB-DU，该gNB-DU将推理结果发送给终端。OAM依据终端新接入的gNB-CU发送的模型订阅分析请求重新进行模型选择和分割，并将模型分割块分配信息发送给参与联合推理的gNB-CU。通过该实施方式，可以更好地开发基站的AI处理能力，解决了基站AI处理能力不足的问题，并有利于网络负载均衡。并提供了在终端高速移动性场景下无线网络AI分析任务的交付方法，解决了终端切换带来的AI分析服务不连续的问题，保障了无线网络AI分析服务的高效性和连续性，提升了终端业务体验，同时也有利于提高无线网络运行效率。

进一步可以理解的是，本公开实施例的无线通信系统，是一种提供无线通信功能的网络。无线通信系统可以采用不同的通信技术，例如码分多址(code division multiple access,CDMA)、宽带码分多址(wideband code division multiple access，WCDMA)、时分多址(time division multiple access，TDMA)、频分多址(frequency division multiple access，FDMA)、正交频分多址(orthogonal frequency-division multiple access，OFDMA)、单载波频分多址(single Carrier FDMA，SC-FDMA)、载波侦听多路访问/冲突避免(Carrier Sense Multiple Access with Collision Avoidance)。根据不同网络的容量、速率、时延等因素可以将网络分为2G(英文：generation)网络、3G网络、4G网络或者未来演进网络，如5G网络，5G网络也可称为是新无线网络(New Radio，NR)。为了方便描述，本公开有时会将无线通信网络简称为网络。

进一步的，本公开中涉及的网络设备也可以称为无线接入网设备。该无线接入网设备可以是：基站、演进型基站(evolved node B，基站)、家庭基站、无线保真(wireless fidelity，WIFI)系统中的接入点(access point，AP)、无线中继节点、无线回传节点、传输点(transmission point，TP)或者发送接收点(transmission and reception point，TRP)等，还可以为NR系统中的gNB，或者，还可以是构成基站的组件或一部分设备等。当为车联网(V2X)通信系统时，网络设备还可以是车载设备。应理解，本公开的实施例中，对网络设备所采用的具体技术和具体设备形态不做限定。

进一步的，本公开中涉及的终端，也可以称为终端设备、用户设备(User Equipment，UE)、移动台(Mobile Station，MS)、移动终端(Mobile Terminal，MT)等，是一种向用户提供语音和/或数据连通性的设备，例如，终端可以是具有无线连接功能的手持式设备、车载设备等。目前，一些终端的举例为：智能手机(Mobile Phone)、口袋计算机(Pocket Personal Computer，PPC)、掌上电脑、个人数字助理(Personal Digital Assistant，PDA)、笔记本电脑、平板电脑、可穿戴设备、或者车载设备等。此外，当为车联网(V2X)通信系统时，终端设备还可以是车载设备。应理解，本公开实施例对终端所采用的具体技术和具体设备形态不做限定。

图3是根据一示例性实施例示出的一种模型推理方法的流程图。如图3所示，模型推理方法用于OAM实体中，包括以下步骤。

在步骤S11中，响应于接收到控制无线接入网设备发送的模型订阅请求信息，确定与模型订阅请求信息对应的第一模型。

在本公开实施例中，模型订阅请求信息包括控制无线接入网设备自身AI处理能力信息，以及终端模型分析订阅请求信息。其中，AI处理能力信息包括基站服务器计算速度和当前富余算力。OAM根据模型订阅信息选择符合终端模型分析订阅请求信息的模型，进一步根据控制无线接入网设备的AI处理能力，在符合要求的模型中确定合适规模的模型，即第一模型。本公开为便描述，将符合要求且合适规模的模型称为第一模型。

在步骤S12中，将第一模型进行分割，得到第一数量的模型分割块，并将第一数量的模型分割块分发至第一数量的控制无线接入网设备。

在本公开实施例中，OAM依据控制无线接入网设备的AI处理能力信息将第一模型分割为第一数量的模型分割块，根据第一数量确定相同数量的控制无线接入网设备。将第一数量的模型分割块分发至第一数量的控制无线接入网设备。其中第一数量的控制无线接入网设备为，OAM基于与发送模型订阅请求信息的控制无线接入网设备相邻的控制无线接入网设备中确定的，确定的依据可以是控制无线接入网设备的算力占用情况和负载情况等选择较为空闲。

通过本公开实施例提供的模型推理方法，可以通过多个控制无线接入网设备协同推理的方法，将算力均衡到多个不同的控制无线接入网设备，充分利用控制无线接入网设备本地的AI处理能力，有效提高模型推理效率。

在本公开一些实施例中，第一数量的模型分割块中每个模型分割块对应有分配信息。其中分配信息包括第一数量的模型分割块的推理顺序，以及与每个模型分割块对应的控制无线接入网设备。其中，与每个模型分割块对应的控制无线接入网设备以相应标识的方式包括在分配信息中。

在本公开一些实施例中，第一数量的控制无线接入网设备包括第一控制无线接入网设备，其中，第一控制无线接入网设备为终端接入的控制无线接入网设备。

图4是根据一示例性实施例示出的一种模型推理方法的流程图。如图4所示，模型推理方法用于OAM实体中，包括以下步骤。

在步骤S21中，在与第一控制无线接入网设备相邻的控制无线接入网设备中，确定多个辅助控制无线接入网设备。

在本公开实施例中，OAM在第一控制无线接入网设备相邻的控制无线接入网设备中，选择可以辅助进行模型推理的辅助控制无线接入网设备。

在步骤S22中，在多个辅助控制无线接入网设备中，基于每个辅助控制无线接入网设备的算力空闲状态，确定第二数量的控制无线接入网设备。

在本公开实施例中，OAM根据每个控制无线接入网设备算力占用状态和负载，确定可以参该次模型推理的第二数量的控制无线接入网设备。其中第二数量的控制无线接入网设备为除第一控制无线接入设备以外第一数量中其他的控制无线接入网设备。

在步骤S23中，基于第一数量的模型分割块的推理顺序，将第一个模型分割块发送至第一控制无线接入网设备，并将剩余数量的模型分割块分发至第二数量的控制无线接入网设备。

在本公开实施例中，OAM将第一个模型分割块发送给第一控制无线接入网设备(例如，gNB-CU1)，将其余的模型分割块发送给其他参与联合推理的控制无线接入网设备，并将与模型分割块对应的分配信息发送给所有参与联合推理的控制无线接入网设备。

图5是根据一示例性实施例示出的一种模型推理方法的流程图。如图5所示，模型推理方法用于OAM实体中，包括以下步骤。

在步骤S31中，接收第一控制无线接入网设备发送的模型性能更新数据。

在本公开实施例中，第一控制无线接入网设备根据接收的性能数据，与第一模型的第一推理结果进行对比，确定模型性能更新数据，并将模型性能更新数据发送至OAM。其中模型性能更新数据可以是模型精度。OAM还可以接收第一控制无线接入设备发送的性能数据。

在步骤S32中，基于模型性能更新数据更新第一模型，确定第一模型更新后的模型参数，并向第一控制无线接入网设备发送所述第一模型更新后的模型参数。

在本公开实施例中，OAM根据性能数据和模型性能更新数据对第一模型进行训练优化，得到第一模型更新后的模型参数，并将第一模型更新后的模型参数发送至第一控制无线接入网设备。

在本公开一些实施例中，响应于OAM接收到第一模型分析订阅更新请求，且第一模型分析订阅更新请求包括的信息为终端的模型分析订阅信息，基于第一模型分析订阅更新请求更新终端的模型分析请求信息。

在本公开一些实施例中，响应于OAM接收到第一模型分析订阅更新请求，且第一模型分析订阅更新请求包括的信息为终端的模型分析订阅信息和第二控制无线接入网设备的AI处理能力信息，基于模型分析订阅信息和第二控制无线接入网设备的AI处理能力信息，重新对第一模型进行分割，将第一个模型分割块发送给第二控制无线接入网设备，剩余的模型分割块发送至参与推理的其他控制无线接入网设备。

图6是根据一示例性实施例示出的一种模型推理方法的流程图。如图6所示，模型推理方法用于控制无线接入网设备中，包括以下步骤。

在步骤S41中，响应于接收到分布式无线接入网设备发送的模型分析订阅请求，对模型分析订阅请求进行处理得到模型订阅请求信息，并向OAM发送模型订阅请求信息。

在本公开实施例中，模型分析订阅请求，包括终端的标识，分析请求类型、接入位置信息。示例性的，终端接入第一分布式无线接入网设备(例如，gNB-DU1)，gNB-DU1和gNB-DU2接入gNB-CU1。终端标识为GUTI，分析请求类型以分析ID来表示，如分析ID1：位置预测分析服务，分析ID2：负载预测分析服务。接入位置主要包含终端当前接入的控制无线接入网设备和分布式无线接入网设备信息。

响应于控制无线接入网设备接收到分布式无线接入网设备发送的模型分析订阅请求，根据自身AI处理能力和模型分析订阅请求，生成模型订阅请求信息，并向OAM发送该模型订阅请求信息。

在步骤S42中，接收OAM发送的模型分割块。

在本公开实施例中，模型分割块为分割第一模型确定的模型分割块。第一模型为OAM基于模型订阅请求信息确定的。

图7是根据一示例性实施例示出的一种模型推理方法的流程图。如图7所示，模型推理方法用于控制无线接入网设备中，包括以下步骤。

在步骤S51中，向分布式无线接入网设备发送模型推理数据请求。

在本公开实施例中，模型推理数据请求用于获取模型推理数据。控制无线接入网设备向分布式无线接入网设备发送模型推理数据请求。其中，需要说明的是，控制无线接入网设备可以向终端接入的分布式无线接入网设备发送模型推理数据请求，也可以向该控制无线接入网设备范围内其他参与推理的分布式无线接入网设备发送模型推理数据请求。

在步骤S52中，基于模型推理数据对模型分割块进行推理，得到模型分割块的推理中间信息。

在本公开实施例中，模型推理数据包括分布式无线接入网设备收集的模型推理数据和终端上报的模型推理数据。控制无线接入网设备基于接收的模型推理数据对模型分割块进行推理，确定每个模型分割块的推理中间信息。

在本公开一些实施例中，每个模型分割块对应有分配信息。控制无线接入网设备接收模型分割块，并接收分配信息。其中，分配信息包括第一数量的模型分割块的推理顺序，以及与每个模型分割块对应的所述控制无线接入网设备。其中，与每个模型分割块对应的控制无线接入网设备以相应标识的方式包括在分配信息中。

图8是根据一示例性实施例示出的一种模型推理方法的流程图。如图8所示，模型推理方法用于控制无线接入网设备中，包括以下步骤。

在步骤S61中，响应于控制无线接入网设备不是最后一个控制无线接入网设备，基于推理顺序，将推理中间信息发送至下一个控制无线接入网设备。

在本公开实施例中，响应于当前推理模型的控制无线接入网设备不是最后一个模型分割块所在的控制无线接入网设备，当前控制无线接入网设备根据分配信息中，推理模型分割块的推理顺序，将推理中间信息发送至下一个模型分割块所在的控制无线接入网设备。

在步骤S62中，响应于控制无线接入网设备为最后一个控制无线接入网设备，模型推理完成后，确定与第一模型对应的第一推理结果，将第一推理结果发送至第一控制无线接入网设备，第一控制无线接入网设备为终端接入的控制无线接入网设备。

在本公开实施例中，响应于当前推理模型的控制无线接入网设备是最后一个模型分割块所在的控制无线接入网设备，当前控制无线接入网设备根据分配信息中，推理模型分割块的推理顺序，完成第一模型的推理，并确定与第一模型相对应的第一推理结果，将第一推理结果发送至第一个模型分割块所在的控制无线接入网设备，即第一控制无线接入网设备。其中，第一控制无线接入网设备为终端接入的控制无线接入网设备。

通过本公开的模型推理方法，保证第一个模型分割块在终端当前接入的控制无线接入网设备进行推理，终端推理所需的原始推理数据只提供给当前接入的无线接入网设备。在其他参与联合推理的控制无线接入网设备间只传输推理中间信息，推理中间信息经过了特征处理，具有较小的数据量且难以反向推理出终端信息，这种机制保证了无线网络敏感数据的安全性同时也节省了数据传输开销。

图9是根据一示例性实施例示出的一种模型推理方法的流程图。如图9所示，模型推理方法用于控制无线接入网设备中，包括以下步骤。

在步骤S71中，响应于控制无线接入网设备为第一控制无线接入网设备，接收第一推理结果。

在本公开实施例中，最后一个模型分割块对应得控制无线接入网设备将推理完成确定模型推理结果，即第一推理结果。将该第一推理结果发送至第一控制无线接入网设备，第一控制无线接入网设备得到与第一模型相对应的第一模型推理结果。

在步骤S72中，向第一分布式无线接入网设备发送第一推理结果。

在本公开实施例中，第一控制无线接入网设备根据接收得推理结果确定第一模型的第一推理结果。将第一推理结果发送至终端接入的分布式无线接入网设备。

图10是根据一示例性实施例示出的一种模型推理方法的流程图。如图10所示，模型推理方法用于控制无线接入网设备中，包括以下步骤。

在步骤S81中，接收第一分布式无线接入网设备发送的性能数据。

在本公开实施例中，性能数据为终端基于第一模型调整执行策略后的真实性能数据。终端基于该第一模型调整执行策略后，将得到的真实性能数据上报至接入的分布式无线接入网络设备。该分布式无线接入网络发送至控制无线接入网设备中。示例性的，终端接入的分布式无线接入网设备为gNB-DU1，与gNB-DU1对应的控制无线接入网设备为gNB-CU1，终端确定真实性能数据后，发送给gNB-DU1，gNB-DU1上报给gNB-CU1。

其中，性能数据可以是AI分析服务带来的性能提升的量化，如终端订阅某种分析并依据分析结果执行相应的策略调整后，实现省电5％。

在步骤S82中，对性能数据进行处理，得到模型性能更新数据，并向OAM发送模型性能更新数据。

在本公开实施例中，性能数据包括模型性能数据和终端反馈的性能反馈数据。第一控制无线接入网设备根据终端反馈的模型性能数据和性能反馈数据进行处理，得到模型性能更新数据，并将模型性能更新数据发送至OAM。

图11是根据一示例性实施例示出的一种模型推理方法的流程图。如图11所示，模型推理方法用于控制无线接入网设备中，包括以下步骤。

在步骤S91中，响应于控制无线接入网设备为第一控制无线接入网设备，向OAM发送模型订阅请求信息。

在本公开实施例中，第一控制无线接入网设备为终端接入的第一分布式无线网络设备对应的控制无线接入网设备。第一控制无线接入网设备接收到分布式无线接入网设备发送的模型分析订阅请求，根据自身的AI能力和模型分析订阅请求，生成模型订阅请求信息，并将模型订阅请求信息发送至OAM。

在本公开一些实施例中，由于终端的移动性，可能会发生切换接入的分布式无线接入网设备。一种实施方式中，终端切换接入的分布式无线接入网设备，不切换控制无线接入网设备。

图12是根据一示例性实施例示出的一种模型推理方法的流程图。如图12所示，模型推理方法用于控制无线接入网设备中，包括以下步骤。

在步骤S101中，响应于控制无线接入网设备为第一控制无线接入网设备，若重新接收到模型分析订阅请求，确定重新发送模型分析订阅请求的第二分布式无线接入网设备。

在本公开实施例中，第二分布式无线接入网设备为终端切换分布式无线接入网设备后重新接入的分布式无线接入网设备。

响应于第一控制无线接入网设备重新接收到模型分析订阅请求，确定终端接入的分布式无线接入网设备发生切换，更新终端的分析订阅信息，并将分析订阅信息上报至OAM。一种方式中，第一控制无线接入网设备未完成第一模型的推理任务，第一控制无线接入网设备(例如，gNB-CU1)完成当前模型推理任务、得到第一推理结果后依据更新分析请求消息中接入位置将第一推理结果发送给第二分布式无线接入网设备(例如，gNB-DU2)，由gNB-DU2转发给终端。

在步骤S102中，将第一推理结果发送至第二分布式无线接入网设备，并向OAM发送模型订阅更新请求。

在本公开实施例中，第一控制无线接入网设备将第一推理结果发送至第二分布式无线接入网设备，并向OAM发送模型订阅更新请求，请求OAM更新终端的分析请求信息。

示例性的，以第一控制无线接入网设备为gNB-CU1，第二分布式无线接入网设备为gNB-DU2为例。gNB-CU1更新终端的分析请求信息。gNB-CU1将终端分析请求消息上报给OAM，OAM更新终端的分析请求信息。响应于终端切换时当前推理任务未完成，gNB-CU1完成当前模型推理任务、得到第一推理结果后依据更新分析请求消息中接入位置将第一推理结果发送给gNB-DU2，由gNB-DU2转发给终端。

一种实施方式中，终端切换接入的分布式无线接入网设备，并切换控制无线接入网设备。其实施方式包括：

图13是根据一示例性实施例示出的一种模型推理方法的流程图。如图13所示，模型推理方法用于控制无线接入网设备中，包括以下步骤。

在步骤S111中，响应于控制无线接入网设备为第二控制无线接入网设备，若重新接收到模型分析订阅请求，确定重新发送模型分析订阅请求的第二分布式无线接入网设备，以及重新接收到模型分析订阅请求的第二控制无线接入网设备。

在本公开实施例中，第二控制无线接入网设备为第二分布式无线接入网设备对应的控制无线接入网设备。第二分布式无线接入网设备为终端切换分布式无线接入网设备后重新接入的分布式无线接入网设备。

响应于控制无线接入网设备重新接收到分布式无线接入网设备发送的模型分析订阅请求，且重新接收的控制无线接入网设备为第二控制无线接入网设备，确定终端重新接入的第二分布式无线接入网设备。

在步骤S112中，将第一推理结果发送至第二控制无线接入网设备，并向OAM发送模型订阅更新请求。

在本公开实施例中，第一控制无线接入网设备将第一推理结果发送至第二控制无线接入网设备，不再负责该终端的分析请求。并向OAM发送模型订阅更新请求。

示例性的，以第二控制无线接入网设备为gNB-CU2，第二分布式无线接入网设备为gNB-DU3为例。gNB-CU2向OAM发送模型订阅请求，包括自身AI处理能力信息和终端分析订阅请求信息。OAM依据模型订阅请求更新当前终端的分析订阅请求信息；并将更新的分析订阅请求信息发送给源基站gNB-CU1。响应于终端切换时当前推理任务未完成，gNB-CU1完成推理任务、得到第一推理结果后依据更新分析请求消息中接入位置将第一推理结果发送给gNB-CU2。gNB-CU1更新终端分析请求信息，不再负责该终端的分析请求相关任务。gNB-CU2将第一推理结果发送给gNB-DU3，gNB-DU3转发给终端。OAM依据gNB-CU2的模型订阅请求中的AI处理能力信息对模型进行重新分割，将第一块发送给发起请求的gNB-CU2，其余块发送给其他gNB-CU，并将模型分割块分配信息发送给参与联合推理的给gNB-CU。

通过本公开提供的模型推理方法，保证源分布式无线接入网设备当前第一推理结果顺利反馈给已经发生切换的终端，新接入的分布式无线接入网设备迅速接管模型推理任务，从而避免切换过程中终端所需的AI分析服务中断，保障了移动终端AI分析服务的连续性和准确性。

图14是根据一示例性实施例示出的一种模型推理方法的流程图。如图14所示，模型推理方法用于分布式无线接入网设备中，包括以下步骤。

在步骤S121中，响应于接收到终端发送的模型分析订阅请求，向控制无线接入网设备发送模型分析订阅请求。

在本公开实施例中，模型分析订阅请求用于向OAM获取第一模型。第一模型包括第一数量的模型分割块。

终端向接入的分布式无线接入网设备发起模型分析订阅请求，其中，模型分析订阅请求包括终端标识，分析请求类型、接入位置信息。分布式无线接入网设备接收到模型分析订阅请求后，向控制无线接入网设备发送该模型分析订阅请求。

图15是根据一示例性实施例示出的一种模型推理方法的流程图。如图15所示，模型推理方法用于分布式无线接入网设备中，包括以下步骤。

在步骤S131中，接收控制无线接入网设备发送的模型推理数据请求。

在步骤S132中，向终端获取模型推理数据，并发送至控制无线接入网设备。

在本公开实施例中，模型推理数据请求用于获取模型推理数据。分布式无线接入网设备接收到模型推理数据请求后，向终端获取模型推理数据，并向控制无线接入网设备发送该模型推理数据。

图16是根据一示例性实施例示出的一种模型推理方法的流程图。如图16所示，模型推理方法用于分布式无线接入网设备中，包括以下步骤。

在步骤S141中，响应于分布式无线接入网设备为第一分布式无线接入网设备，接收第一控制无线接入网设备发送的第一推理结果。

在步骤S142中，将第一推理结果发送至终端。

在本公开实施例中，终端接入的第一分布式无线接入网设备，接收第一控制无线接入网设备发送的第一推理结果，并将第一推理结果发送至终端，以使终端调整执行策略。

图17是根据一示例性实施例示出的一种模型推理方法的流程图。如图17所示，模型推理方法用于分布式无线接入网设备中，包括以下步骤。

在步骤S151中，响应于分布式无线接入网设备为第一分布式无线接入网设备，接收终端发送的性能数据。

在本公开实施例中，性能数据为终端基于第一模型调整执行策略后的真实性能数据；

在步骤S152中，向第一控制无线接入网设备发送性能数据。

在本公开实施例中，终端向接入的第一分布式无线接入网设备，发送调整执行策略后得到真实性能数据，(也可以称为性能反馈数据)。并向与第一分布式无线接入网设备对应的第一控制无线接入网设备发送该性能数据。

图18是根据一示例性实施例示出的一种模型推理方法的流程图。如图18所示，模型推理方法用于分布式无线接入网设备中，包括以下步骤。

在步骤S161中，响应于无线接入网设备为第二分布式无线接入网设备，若接收到终端重新发送的模型分析订阅请求，确定向与第二分布式无线接入网络设备对应的控制无线接入网设备发送模型分析订阅请求。

终端切换接入的分布式无线接入网设备后，重新向接入的分布式无线接入网设备发送模型分析订阅请求。响应于接收的分布式无线接入网络为第二分布式无线接入网设备，即终端重新接入的分布式无线接入网设备，则向其对应的控制无线接入网设备发送该模型分析订阅请求。

在本公开一些实施例中，以OAM，控制无线接入网设备和分布式无线接入网设备之间的交互过程为例进一步进行说明。其中控制无线接入网设备可以是gNB-CU，分布式无线接入网设备可以是gNB-DU。图19是根据一示例性实施例示出的一种模型推理方法的流程图。如图19所示，包括以下步骤：

在步骤1中，终端发起模型分析订阅请求。

在步骤2中，gNB-CU向OAM发起模型订阅请求。

在步骤3中，OAM根据模型订阅请求信息进行模型选择和模型分割、模型分割块的分配与分发，并将模型分割块分配信息发送给参与联合推理的gNB-CU。

在步骤4中，终端接入的gNB-CU发起模型推理数据请求，相关网元进行数据收集和处理，并将数据发送给该gNB-CU。

在步骤5中，终端接入的gNB-CU采用模型推理数据完成第一个模型分割块的推理，并依据模型分割块分配信息将推理中间结果发送给下一个模型分割块所在的gNB-CU。

在步骤6中，负责最后一个模型分割块推理任务的gNB-CU得到第一推理结果之后依据模型分割块分配信息将第一推理结果发送给终端接入的gNB-CU。

在步骤7中，终端接入的gNB-CU将第一推理结果发送给终端，终端采用第一推理结果进行相应的策略调整。

在步骤8中，gNB-CU收集模型性能数据和终端性能反馈数据并上报给OAM，OAM对模型进行训练优化，并将更新后的模型发送给gNB-CU。

在本公开一些实施例中，由于终端的移动性，可能会发生切换接入的分布式无线接入网设备。一种实施方式中，终端切换接入的分布式无线接入网设备，不切换控制无线接入网设备。图20是根据一示例性实施例示出的一种模型推理方法中终端切换的流程图。如图20所示，包括以下步骤：

在步骤1中，终端重新发起分析订阅请求。

在步骤2中，gNB-CU、OAM更新终端的模型分析订阅请求信息。

在步骤3中，若终端发生切换时当前推理任务未完成，则gNB-CU完成推理任务，并将第一推理结果发送给终端当前接入的gNB-DU，该gNB-DU将第一推理结果发送给终端。

在步骤4中，终端切换完成后，由新接入的gNB-DU负责完成相关数据收集和数据转发任务。

在本公开一些实施例中，由于终端的移动性，可能会发生切换接入的分布式无线接入网设备。一种实施方式中，终端切换接入的分布式无线接入网设备，且切换控制无线接入网设备。图21是根据一示例性实施例示出的一种模型推理方法中终端切换的流程图。如图21所示，包括以下步骤：

在步骤1中，终端重新发起模型分析订阅请求。

在步骤2中，终端新接入的gNB-CU向OAM发送模型订阅请求信息。

在步骤3中，OAM更新终端的分析订阅请求，并将更新的模型分析订阅请求信息发送给终端的源gNB-CU。

在步骤4中，若终端切换时当前推理任务未完成，则源gNB-CU完成推理任务，将第一推理结果发送给终端新接入的gNB-CU。

在步骤5中，源gNB-CU更新终端分析请求信息，不再负责该终端的分析请求相关任务。

在步骤6中，终端新接入的gNB-CU将第一推理结果发送给终端新接入的gNB-DU，该gNB-DU将第一推理结果发送给终端。

在步骤7中，OAM依据终端新接入的gNB-CU发送的模型订阅请求重新进行模型选择和分割，并将模型分割块分配信息发送给参与联合推理的gNB-CU。

图22是根据一示例性实施例示出的一种模型推理方法的协议和接口原理图。如图22所示，主要涉及本发明实施例提供的终端、终端接入的gNB-DU、终端接入的gNB-CU、参与联合推理的其他gNB-CU(gNB-CU(1)～gNB-CU(N))以及OAM。具体如下：

1a.终端将模型分析订阅请求信令发送给gNB-DU，指示向接收方发起模型分析订阅请求。1b.gNB-DU将分析订阅请求信令发送给gNB-CU。2.gNB-CU根据自身AI处理能力和分析订阅请求信息，生成模型订阅请求信息。3.gNB-CU将模型订阅请求信令发送给OAM，指示向接收方发起模型订阅请求。4.OAM根据模型订阅信息选择符合分析请求的第一模型，并依据AI处理能力信息将模型分割为若干块。5a.OAM将第一个模型分割块及模型分割块分配信息发送给终端接入的gNB-CU。5b.OAM将其余模型分割块及模型分割块分配信息发送给参与联合推理的其他gNB-CU，指示发送模型分割块分配信息。6.gNB-CU将模型推理数据收集请求信令发送给gNB-DU，指示向接收方发起模型推理数据收集请求。7.gNB-DU、终端、gNB-CU依据模型推理数据收集请求分别收集数据，并发送给gNB-CU。8.gNB-CU采用收集的推理数据对第一个模型分割块进行部分模型推理，得到推理中间信息。9.gNB-CU将推理中间信息发送给下一个模型分割块所在的gNB-CU(1)。10.NB-CU(1)对模型分割块进行部分模型推理，得到推理中间信息结果。11.gNB-CU(1)将推理中间信息发送给下一个模型分割块所在的gNB-CU，直至最后一个模型分割块所在的gNB-CU(N)接收到所有的推理中间信息。12.gNB-CU(N)对最后一个模型分割块进行部分模型推理，得到第一推理结果。13a.gNB-CU(N)将第一推理结果发送给终端接入的gNB-CU。13b.gNB-CU将第一推理结果发送给终端接入的gNB-DU。13c.gNB-DU将第一推理结果发送给终端。14.终端根据第一推理结果做出相应策略调整。15a.终端将性能反馈数据发送给gNB-DU。15b.gNB-DU将性能反馈数据发送给gNB-CU。16.gNB-CU将第一推理结果与真实数据进行对比，得到模型性能数据。17.gNB-CU对模型性能数据和终端性能反馈数据进行处理。18.gNB-CU将模型性能数据和终端性能反馈数据发送给OAM。19.OAM基于模型性能数据和性能反馈数据对模型进行训练优化。20.OAM将更新后的模型参数发送给gNB-CU。

图23是根据一示例性实施例示出的一种无模型推理方法中终端在同一gNB-CU下切换时AI分析任务交付的协议和接口原理图，如图23所示，主要涉及本公开实施例提供的终端、终端的源gNB-DU(gNB-DU 1)、终端新接入的gNB-DU(gNB-DU 2)、终端接入的gNB-CU以及OAM。具体如下：

1a.终端将模型分析订阅请求信令发送给gNB-DU 2。1b.gNB-DU 2将，模型分析订阅请求信令发送给gNB-CU。2.gNB-CU更新终端的分析请求信息。3.gNB-CU将分析订阅更新请求发送给OAM。4.OAM更新终端的分析请求信息。5.若终端切换时当前推理任务未完成，则gNB-CU继续完成当前推理任务，得到第一推理结果。6a.gNB-CU依据分析订阅更新请求中接入位置将第一推理结果发送给gNB-DU 2。6b.gNB-DU 2将第一推理结果发送给终端。7.终端切换完成后，gNB-DU 2负责终端分析请求相关数据收集和数据转发任务。

图24是根据一示例性实施例示出的一种无模型推理方法中终端跨gNB-CU切换时AI分析任务交付的协议和接口原理图，如图24所示，主要涉及本公开实施例提供的终端、终端的源gNB-DU(gNB-DU 1)、终端新接入的gNB-DU(gNB-DU 3)、终端的源gNB-CU(gNB-CU 1)、终端新接入的gNB-CU(gNB-CU 2)、参与联合推理的其他gNB-CU(gNB-CU (1)～gNB-CU(N))以及OAM。具体如下：

1a.终端将模型分析订阅请求信令发送给gNB-DU 3。1b.gNB-DU 3将模型分析订阅请求信令发送给gNB-CU 2。2.gNB-CU 2根据自身AI处理能力和分析订阅请求信息，生成模型订阅请求信息。3.gNB-CU 2将模型订阅请求信令发送给OAM。4.OAM根据模型订阅请求更新当前终端的分析订阅请求信息。5.OAM将分析订阅更新请求发送给gNB-CU 1，指示向接收者发起分析订阅更新请求。6.若终端切换时当前推理任务未完成，则gNB-CU 1继续完成当前推理任务，得到第一推理结果。7.gNB-CU 1更新终端分析请求信息，不再负责该终端的分析请求相关任务。8a.gNB-CU 1依据分析订阅更新请求中接入位置将第一推理结果发送给gNB-CU 2。8b.gNB-CU 2将第一推理结果发送给gNB-DU 3。8c.gNB-DU 3将第一推理结果发送给终端。9.OAM依据模型订阅请求中的AI处理能力信息重新进行模型选择和模型分割。10a.OAM将第一个模型分割块及模型分割块分配信息发送给gNB-CU 2。10b.OAM将其余模型分割块及模型分割块分配信息发送给辅助推理的gNB-CU。

基于相同的构思，本公开实施例还提供一种模型推理装置。

可以理解的是，本公开实施例提供的模型推理装置为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。结合本公开实施例中所公开的各示例的单元及算法步骤，本公开实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能，但是这种实现不应认为超出本公开实施例的技术方案的范围。

图25是根据一示例性实施例示出的一种模型推理装置框图。参照图25，该模型推理装置100应用于操作维护管理OAM实体，包括确定模块101和发送模块102。

确定模块101，用于响应于接收到控制无线接入网设备发送的模型订阅请求信息，确定与模型订阅请求信息对应的第一模型。发送模块102，用于将第一模型进行分割，得到第一数量的模型分割块，并将第一数量的模型分割块分发至第一数量的控制无线接入网设备。

在本公开实施例中，第一数量的模型分割块中每个模型分割块对应有分配信息。

分配信息包括第一数量的模型分割块的推理顺序，以及与每个模型分割块对应的控制无线接入网设备。

在本公开实施例中，第一数量的控制无线接入网设备包括第一控制无线接入网设备，第一控制无线接入网设备为终端接入的控制无线接入网设备。

发送模块102，用于在与第一控制无线接入网设备相邻的控制无线接入网设备中，确定多个辅助控制无线接入网设备；在多个辅助控制无线接入网设备中，基于每个辅助控制无线接入网设备的算力占用状态和负载，确定第二数量的控制无线接入网设备；第二数量的控制无线接入网设备为除第一控制无线接入设备以外第一数量中其他的控制无线接入网设备；基于第一数量的模型分割块的推理顺序，将第一个模型分割块发送至第一控制无线接入网设备，并将剩余数量的模型分割块分发至第二数量的控制无线接入网设备。

在本公开实施例中，模型推理装置还包括：接收模块103。

所示接收模块103用于，接收第一控制无线接入网设备发送的模型性能更新数据。基于模型性能更新数据更新第一模型，确定第一模型更新后的模型参数，并向第一控制无线接入网设备发送第一模型更新后的模型参数。

在本公开实施例中，接收模块103还用于响应于接收到第一模型分析订阅更新请求，更新终端接入的分布式无线接入网设备。其中，第一模型分析订阅更新请求指示终端切换分布式无线接入网设备，且不切换控制无线接入网设备。或，响应于接收到第二模型分析订阅更新请求，更新终端接入的分布式无线接入网设备，并重新对第一模型进行分割。其中，第二模型分析订阅更新请求指示终端切换分布式无线接入网设备，并切换控制无线接入网设备。

图26是根据一示例性实施例示出的一种模型推理装置框图。参照图26，该模型推理装置200应用于控制无线接入网设备，包括发送模块201和接收模块202。

发送模块201，用于响应于接收到分布式无线接入网设备发送的模型分析订阅请求，对模型分析订阅请求进行处理得到模型订阅请求信息，并向OAM发送模型订阅请求信息。接收模块202，用于接收OAM发送的模型分割块。模型分割块为分割第一模型确定的模型分割块。第一模型为OAM基于模型订阅请求信息确定的。

在本公开实施例中，发送模块201还用于向分布式无线接入网设备发送模型推理数据请求，模型推理数据请求用于获取模型推理数据。基于模型推理数据对模型分割块进行推理，得到模型分割块的推理中间信息。

在本公开实施例中，模型分割块对应有分配信息。分配信息包括第一数量的模型分割块的推理顺序，以及与每个模型分割块对应的控制无线接入网设备。

发送模块201还用于响应于控制无线接入网设备不是最后一个控制无线接入网设备，基于推理顺序，将推理中间信息发送至下一个控制无线接入网设备。响应于控制无线接入网设备为最后一个控制无线接入网设备，模型推理完成后，确定与第一模型对应的第一推理结果，将所述第一推理结果发送至第一控制无线接入网设备，第一控制无线接入网设备为终端接入的控制无线接入网设备。

在本公开实施例中，发送模块201还用于响应于控制无线接入网设备为第一控制无线接入网设备，接收所述第一推理结果。向第一分布式无线接入网设备发送第一推理结果，第一分布式无线接入网设备为终端接入的分布式无线接入网设备。

在本公开实施例中，将第一推理结果发送至第一分布式无线接入网设备之后，接收模块202还用于接收第一分布式无线接入网设备发送的性能数据，性能数据为终端基于第一模型调整执行策略后的真实性能数据。对性能数据进行处理，得到模型性能更新数据，并向OAM发送模型性能更新数据。

在本公开实施例中，发送模块201还用于响应于控制无线接入网设备为第一控制无线接入网设备，向OAM发送模型订阅请求信息。其中，第一控制无线接入网设备为终端接入的第一分布式无线网络设备对应的控制无线接入网设备。

在本公开实施例中，发送模块201还用于响应于控制无线接入网设备为第一控制无线接入网设备，若重新接收到模型分析订阅请求，确定重新发送模型分析订阅请求的第二分布式无线接入网设备。第二分布式无线接入网设备为终端切换分布式无线接入网设备后重新接入的分布式无线接入网设备。将第一推理结果发送至第二分布式无线接入网设备，并向OAM发送模型订阅更新请求。

在本公开实施例中，发送模块201还用于响应于控制无线接入网设备为第二控制无线接入网设备，若重新接收到模型分析订阅请求，确定重新发送模型分析订阅请求的第二分布式无线接入网设备，以及重新接收到模型分析订阅请求的第二控制无线接入网设备，第二控制无线接入网设备为第二分布式无线接入网设备对应的控制无线接入网设备。第二分布式无线接入网设备为终端切换分布式无线接入网设备后重新接入的分布式无线接入网设备。将第一推理结果发送至第二控制无线接入网设备，并向OAM发送模型订阅更新请求。

图27是根据一示例性实施例示出的一种模型推理装置框图。参照图27，该模型推理装置300应用于分布式无线接入网设备，包括发送模块301。

发送模块301，用于响应于接收到终端发送的模型分析订阅请求，向控制无线接入网设备发送模型分析订阅请求。其中，模型分析订阅请求用于向OAM获取第一模型。第一模型包括第一数量的模型分割块。

在本公开实施例中，装置还包括：接收模块302。

接收模块302，用于接收控制无线接入网设备发送的模型推理数据请求，模型推理数据请求用于获取模型推理数据。向终端获取模型推理数据，并发送至控制无线接入网设备。

在本公开实施例中，接收模块302，还用于响应于分布式无线接入网设备为第一分布式无线接入网设备，接收第一控制无线接入网设备发送的第一推理结果。将第一推理结果发送至终端。

在本公开实施例中，接收模块302，还用于响应于分布式无线接入网设备为第一分布式无线接入网设备，接收终端发送的性能数据。性能数据为终端基于第一模型调整执行策略后的真实性能数据。向第一控制无线接入网设备发送性能数据。

在本公开实施例中，接收模块302，还用于响应于无线接入网设备为第二分布式无线接入网设备，若接收到终端重新发送的模型分析订阅请求，确定向与第二分布式无线接入网络设备对应的控制无线接入网设备发送模型分析订阅请求。其中，第二分布式无线接入网设备为终端切换分布式无线接入网设备后重新接入的分布式无线接入网设备。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图28是根据一示例性实施例示出的一种用于模型推理的装置400的框图。例如，装置400可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图28，装置400可以包括以下一个或多个组件：处理组件402，存储器404，电力组件406，多媒体组件408，音频组件410，输入/输出(I/O)接口412，传感器组件414，以及通信组件416。

处理组件402通常控制装置400的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件402可以包括一个或多个模块，便于处理组件402和其他组件之间的交互。例如，处理组件402可以包括多媒体模块，以方便多媒体组件408和处理组件402之间的交互。

存储器404被配置为存储各种类型的数据以支持在装置400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电力组件406为装置400的各种组件提供电力。电力组件406可以包括电源管理系统，一个或多个电源，及其他与为装置400生成、管理和分配电力相关联的组件。

多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件408包括一个前置摄像头和/或后置摄像头。当装置400处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件410被配置为输出和/或输入音频信号。例如，音频组件410包括一个麦克风(MIC)，当装置400处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中，音频组件410还包括一个扬声器，用于输出音频信号。

I/O接口412为处理组件402和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件414包括一个或多个传感器，用于为装置400提供各个方面的状态评估。例如，传感器组件414可以检测到装置400的打开/关闭状态，组件的相对定位，例如所述组件为装置400的显示器和小键盘，传感器组件414还可以检测装置400或装置400一个组件的位置改变，用户与装置400接触的存在或不存在，装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件414还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件416还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器404，上述指令可由装置400的处理器420执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

图29是根据一示例性实施例示出的一种用于模型推理的装置500的框图。例如，装置500可以被提供为一服务器。参照图29，装置500包括处理组件522，其进一步包括一个或多个处理器，以及由存储器532所代表的存储器资源，用于存储可由处理组件522的执行的指令，例如应用程序。存储器532中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件522被配置为执行指令，以执行上述方法。

装置500还可以包括一个电源组件526被配置为执行装置500的电源管理，一个有线或无线网络接口550被配置为将装置500连接到网络，和一个输入输出(I/O)接口558。装置500可以操作基于存储在存储器532的操作系统，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM或类似。

进一步可以理解的是，本公开中“多个”是指两个或两个以上，其它量词与之类似。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

进一步可以理解的是，术语“第一”、“第二”等用于描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开，并不表示特定的顺序或者重要程度。实际上，“第一”、“第二”等表述完全可以互换使用。例如，在不脱离本公开范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。

进一步可以理解的是，本公开实施例中尽管在附图中以特定的顺序描述操作，但是不应将其理解为要求按照所示的特定顺序或是串行顺序来执行这些操作，或是要求执行全部所示的操作以得到期望的结果。在特定环境中，多任务和并行处理可能是有利的。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

一种模型推理方法，其特征在于，应用于操作维护管理OAM实体，所述方法包括：

响应于接收到控制无线接入网设备发送的模型订阅请求信息，确定与所述模型订阅请求信息对应的第一模型；

将所述第一模型进行分割，得到第一数量的模型分割块，并将所述第一数量的模型分割块分发至第一数量的控制无线接入网设备。
根据权利要求1所述的模型推理方法，其特征在于，所述第一数量的模型分割块中每个模型分割块对应有分配信息；

所述分配信息包括第一数量的模型分割块的推理顺序，以及与每个模型分割块对应的所述控制无线接入网设备。
根据权利要求1所述的模型推理方法，其特征在于；所述第一数量的控制无线接入网设备包括第一控制无线接入网设备，所述第一控制无线接入网设备为终端接入的控制无线接入网设备；

所述将所述第一数量的模型分割块分发至第一数量的控制无线接入网设备，包括：

在与所述第一控制无线接入网设备相邻的控制无线接入网设备中，确定多个辅助控制无线接入网设备；

在所述多个辅助控制无线接入网设备中，基于每个所述辅助控制无线接入网设备的算力占用状态和负载，确定第二数量的控制无线接入网设备；所述第二数量的控制无线接入网设备为除第一控制无线接入设备以外第一数量中其他的控制无线接入网设备；

基于第一数量的模型分割块的推理顺序，将第一个模型分割块发送至所述第一控制无线接入网设备，并将剩余数量的模型分割块分发至所述第二数量的控制无线接入网设备。
根据权利要求3所述的模型推理方法，其特征在于，所述模型推理方法还包括：

接收第一控制无线接入网设备发送的模型性能更新数据；

基于所述模型性能更新数据更新所述第一模型，确定所述第一模型更新后的模型参数，并向所述第一控制无线接入网设备发送所述第一模型更新后的模型参数。
根据权利要求3所述的模型推理方法，其特征在于，所述模型推理方法还包括：

响应于接收到第一模型分析订阅更新请求，更新终端接入的分布式无线接入网设备；其中，所述第一模型分析订阅更新请求指示终端切换分布式无线接入网设备，且不切换控制无线接入网设备；

或

响应于接收到第二模型分析订阅更新请求，更新终端接入的分布式无线接入网设备，并重新对所述第一模型进行分割；其中，所述第二模型分析订阅更新请求指示终端切换分布式无线接入网设备，并切换控制无线接入网设备。
一种模型推理方法，其特征在于，应用于控制无线接入网设备，所述方法包括：

响应于接收到分布式无线接入网设备发送的模型分析订阅请求，对所述模型分析订阅请求进行处理得到模型订阅请求信息，并向OAM发送所述模型订阅请求信息；

接收OAM发送的模型分割块；所述模型分割块为分割第一模型确定的模型分割块；所述第一模型为OAM基于所述模型订阅请求信息确定的。
根据权利要求6所述的模型推理方法，其特征在于，所述向OAM发送模型订阅请求信息之后，所述方法还包括：

向分布式无线接入网设备发送模型推理数据请求，所述模型推理数据请求用于获取模型推理数据；

基于所述模型推理数据对所述模型分割块进行推理，得到模型分割块的推理中间信息。
根据权利要求7所述的模型推理方法，其特征在于，所述模型分割块对应有分配信息；所述分配信息包括第一数量的模型分割块的推理顺序，以及与每个模型分割块对应的所述控制无线接入网设备；

所述模型推理方法还包括：

响应于所述控制无线接入网设备不是最后一个控制无线接入网设备，基于所述推理顺序，将推理中间信息发送至下一个控制无线接入网设备；

响应于所述控制无线接入网设备为最后一个控制无线接入网设备，模型推理完成后，确定与第一模型对应的第一推理结果，将所述第一推理结果发送至第一控制无线接入网设备，所述第一控制无线接入网设备为终端接入的控制无线接入网设备。
根据权利要求8所述的模型推理方法，其特征在于，所述方法还包括：

响应于所述控制无线接入网设备为第一控制无线接入网设备，接收所述第一推理结果；

向第一分布式无线接入网设备发送所述第一推理结果，所述第一分布式无线接入网设备为终端接入的分布式无线接入网设备。
根据权利要求9所述的模型推理方法，其特征在于，所述将所述第一推理结果发送至第一分布式无线接入网设备之后，所述模型推理方法还包括：

接收第一分布式无线接入网设备发送的性能数据，所述性能数据为终端基于第一模型调整执行策略后的真实性能数据；

对所述性能数据进行处理，得到模型性能更新数据，并向OAM发送所述模型性能更新数据。
根据权利要求6所述的模型推理方法，其特征在于，向OAM发送模型订阅请求信息，包括：

响应于所述控制无线接入网设备为第一控制无线接入网设备，向OAM发送模型订阅请求信息；

其中，所述第一控制无线接入网设备为终端接入的第一分布式无线网络设备对应的控制无线接入网设备。
根据权利要求11所述的模型推理方法，其特征在于，所述模型推理方法还包括：

响应于所述控制无线接入网设备为第一控制无线接入网设备，若重新接收到模型分析订阅请求，确定重新发送所述模型分析订阅请求的第二分布式无线接入网设备；所述第二分布式无线接入网设备为终端切换分布式无线接入网设备后重新接入的分布式无线接入网设备；

将第一推理结果发送至第二分布式无线接入网设备，并向OAM发送模型订阅更新请求。
根据权利要求12所述的模型推理方法，其特征在于，所述模型推理方法还包括：

响应于所述控制无线接入网设备为第二控制无线接入网设备，若重新接收到模型分析订阅请求，确定重新发送所述模型分析订阅请求的第二分布式无线接入网设备，以及重新接收到模型分析订阅请求的第二控制无线接入网设备，所述第二控制无线接入网设备为第二分布式无线接入网设备对应的控制无线接入网设备；所述第二分布式无线接入网设备为终端切换分布式无线接入网设备后重新接入的分布式无线接入网设备；

将第一推理结果发送至第二控制无线接入网设备，并向OAM发送模型订阅更新请求。
一种模型推理方法，其特征在于，应用于分布式无线接入网设备，所述方法包括：

响应于接收到终端发送的模型分析订阅请求，向控制无线接入网设备发送所述模型分析订阅请求；

其中，所述模型分析订阅请求用于向OAM获取第一模型；所述第一模型包括第一数量的模型分割块。
根据权利要求14所述的模型推理方法，其特征在于，所述方法还包括：

接收控制无线接入网设备发送的模型推理数据请求，所述模型推理数据请求用于获取模型推理数据；

向终端获取模型推理数据，并发送至控制无线接入网设备。
根据权利要求14所述的模型推理方法，其特征在于，所述方法还包括：

响应于所述分布式无线接入网设备为第一分布式无线接入网设备，接收第一控制无线接入网设备发送的第一推理结果；

将所述第一推理结果发送至终端。
根据权利要求16所述的模型推理方法，其特征在于，所述将所述第一推理结果发送至终端之后，所述方法还包括：

响应于所述分布式无线接入网设备为第一分布式无线接入网设备，接收终端发送的性能数据；所述性能数据为终端基于第一模型调整执行策略后的真实性能数据；

向第一控制无线接入网设备发送所述性能数据。
根据权利要求14所述的模型推理方法，其特征在于，所述方法还包括：

响应于所述无线接入网设备为第二分布式无线接入网设备，若接收到终端重新发送的模型分析订阅请求，确定向与所述第二分布式无线接入网络设备对应的控制无线接入网设备发送模型分析订阅请求；

其中，所述第二分布式无线接入网设备为终端切换分布式无线接入网设备后重新接入的分布式无线接入网设备。
一种模型推理装置，其特征在于，应用于操作维护管理OAM实体，所述装置包括：

确定模块，用于响应于接收到控制无线接入网设备发送的模型订阅请求信息，确定与所述模型订阅请求信息对应的第一模型；

发送模块，用于将所述第一模型进行分割，得到第一数量的模型分割块，并将所述第一数量的模型分割块分发至第一数量的控制无线接入网设备。
一种模型推理装置，其特征在于，应用于控制无线接入网设备，所述装置包括：

发送模块，用于响应于接收到分布式无线接入网设备发送的模型分析订阅请求，对所述模型分析订阅请求进行处理得到模型订阅请求信息，并向OAM发送所述模型订阅请求信息；

接收模块，用于接收OAM发送的模型分割块；所述模型分割块为分割第一模型确定的模型分割块；所述第一模型为OAM基于所述模型订阅请求信息确定的。
一种模型推理装置，其特征在于，应用于分布式无线接入网设备，所述装置包括：

发送模块，用于响应于接收到终端发送的模型分析订阅请求，向控制无线接入网设备发送所述模型分析订阅请求；

其中，所述模型分析订阅请求用于向OAM获取第一模型；所述第一模型包括第一数量的模型分割块。
一种模型推理装置，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：执行权利要求1-5中任意一项所述的模型推理方法，或执行权利要求6-13中任意一项所述的模型推理方法，或执行权利要求14-18中任意一项所述的模型推理方法。
一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行权利要求1-5中任意一项所述的模型推理方法，或使得移动终端能够执行权利要求6-13中任意一项所述的模型推理方法，或使得移动终端能够执行权利要求14-18中任意一项所述的模型推理方法。