WO2022236831A1

WO2022236831A1 - 一种模型学习方法、模型学习装置及存储介质

Info

Publication number: WO2022236831A1
Application number: PCT/CN2021/093927
Authority: WO
Inventors: 牟勤; 洪伟; 赵中原; 蔡一凡
Original assignee: 北京小米移动软件有限公司; 北京邮电大学
Priority date: 2021-05-14
Filing date: 2021-05-14
Publication date: 2022-11-17
Also published as: US20240235954A1; CN115769211A

Abstract

一种模型学习方法、模型学习装置及存储介质。其中，模型学习方法，应用于宏基站，包括：响应于接收到操作维护管理OAM实体发送的模型训练请求，向第一数量的微基站发送所述模型训练请求（S11）；其中，所述第一数量的微基站通信覆盖范围在所述宏基站通信覆盖范围内。通过本方法实现宏基站与微基站之间的交互，实现训练模型的任务分配，信号质量好，数据传输速率较快，提高无线接入网络的利用率。

Description

一种模型学习方法、模型学习装置及存储介质

技术领域

本公开涉及无线通信技术领域，尤其涉及一种模型学习方法、模型学习装置及存储介质。

背景技术

在通信技术中为提高峰值速率和频谱利用率，进一步引入异构网络技术。其中，异构网络技术是指许多微基站被布放在宏基站覆盖区域内，形成同覆盖的不同节点类型相异的异构系统。由于接入点与被服务的用户设备之间的地理距离被缩小了，能够有效提升系统吞吐量和网络整体效率。

另一方面随着人工智能技术的发展，机器学习被应用到越来越多的领域，机器学习中的联邦学习是其中一种学习方法。联邦学习是指通过联合不同的参与方(例如终端)进行机器学习的方法，不同参与方协同进行学习，可以有效保障大数据交换时的信息安全、保护终端数据和个人数据隐私。将联邦学习应用到多源异构网络中，可以实现多源异构网络的机器学习建模。但是由于多源异构网络各个网络节点性能不同，存在联邦学习过程处理复杂且效率低的问题。

发明内容

为克服相关技术中存在的问题，本公开提供一种模型学习方法、模型学习装置及存储介质。

根据本公开实施例的第一方面，提供一种模型学习方法，应用于宏基站，包括：

响应于接收到操作维护管理OAM实体发送的模型训练请求，向第一数量的微基站发送所述模型训练请求；其中，所述第一数量的微基站通信覆盖范围在所述宏基站通信覆盖范围内。

一种实施方式中，所述模型训练请求用于触发微基站上报能力信息；所述向第一数量的微基站发送所述模型训练请求之后，所述方法还包括：

响应于接收到微基站发送的能力信息，基于所述能力信息确定模型结构和模型参数值，并向微基站发送所述模型结构和模型参数值；所述模型结构为指示微基站基于所述模型训练请求训练的模型结构，所述模型参数值为所述模型结构的初始参数值。

一种实施方式中，所述能力信息包括微基站的数据类型特征；所述方法还包括：

接收第一数量微基站发送的第一数量第一模型训练结果；确定所述第一数量微基站中不同微基站具有的所述数据类型特征，并确定第一模型损失函数；基于所述第一数量微基站中不同微基站具有的数据类型特征进行数据类型特征统一后，以优化所述第一模型损失函数为目标，对所述第一数量第一模型训练结果进行第一模型对齐；基于第一模型对齐的结果进行全局模型学习，确定全局模型。

一种实施方式中，所述基于第一模型对齐的结果进行全局模型学习，确定全局模型，包括：

响应于所述全局模型学习的模型学习结果不满足OAM的模型训练请求，将所述模型学习结果发送至微基站，接收微基站基于所述模型学习结果重新确定的第一数量第一模型训练结果；并基于所述全局模型学习的模型学习结果重新确定所述第一模型损失函数，并以优化重新确定的第一模型损失函数为目标，重新对接收的所述第一数量第一模型训练结果进行第一模型对齐；基于重新确定的第一模型对齐的结果，进行下一次全局模型学习，重新确定模型学习结果，直到所述模型学习结果满足所述模型训练请求，将与满足所述模型训练请求的模型学习结果对应的模型确定为全局模型。

一种实施方式中，确定第一模型损失函数，包括：

确定微基站第一数量的第一模型训练结果与所述宏基站上一次全局模型学习得到的模型学习结果之间的第一损失函数，以及第一模型对齐损失函数；基于所述第一损失函数和第一模型对齐损失函数，确定第一模型损失函数。

一种实施方式中，所述基于第一模型对齐结果进行全局模型学习，确定全局模型，包括：

响应于所述全局模型学习的模型学习结果满足OAM的模型训练请求，向微基站发送停止模型训练信息；所述停止训练信息指示微基站停止终端执行模型训练任务；将所述模型学习结果对应的模型确定为全局模型，并向所述OAM发送所述全局模型。

一种实施方式中，所述方法还包括：

响应于在训练模型过程中接收到微基站发送的终端切换信息，基于所述终端切换信息重新确定执行模型训练任务的终端，并向微基站发送所述终端的信息；所述终端切换信息包括退出模型训练的终端和所述终端重新接入的目标微基站的信息；所述终端切换信息用于宏基站重新确定执行模型训练任务的终端。

根据本公开实施例的第二方面，提供一种模型学习方法，应用于微基站，包括：

接收宏基站发送的模型训练请求；向终端发送所述模型训练请求；其中，所述接收模型训练请求的微基站的数量为第一数量；所述第一数量的微基站通信覆盖范围在所述宏基站通信覆盖范围内。

一种实施方式中，所述模型训练请求用于触发终端上报终端的通信条件和数据特征，所述向终端发送所述模型训练请求之后，所述模型学习方法还包括：

接收终端发送的通信条件和数据类型特征；对所述终端的通信条件和数据特性，以及所述微基站的通信条件和数据特性进行处理，得到能力信息，并向所述能力信息发送至宏基站；其中，所述能力信息用于宏基站确定模型结构和模型参数值。

一种实施方式中，所述方法还包括：

接收模型结构和模型参数值；所述模型结构为指示微基站基于所述模型训练请求训练的模型结构，所述模型参数值为所述模型结构的初始参数值；基于所述终端的通信条件和数据类型特征以及所述模型结构和模型参数值，确定执行模型训练的第二数量终端；向所述第二数量终端发送调度信息；所述调度信息包括模型结构和模型参数值以及指示终端进行模型训练的指示信息。

一种实施方式中，所述方法还包括：

接收第二数量终端发送的第二数量第二模型训练结果；确定所述第二数量终端中不同终端具有的数据类型特征，并确定第二模型损失函数；基于所述第二数量终端中不同终端具有的数据类型特征进行数据类型特征统一后，以优化所述第二模型损失函数为目标，对所述第二数量第二模型训练结果进行第二模型对齐；基于第二模型对齐的结果进行联邦聚合，得到第一模型训练结果。

一种实施方式中，所述基于第二模型对齐的结果进行联邦聚合，得到第一模型训练结果，包括：

响应于接收到宏基站发送的继续训练请求，并接收到宏基站发送的模型学习结果；基于所述模型学习结果更新终端的模型结构和模型参数值，并向终端发送继续训练调度信息；响应于重新接收到第二数量第二模型训练结果，基于所述第一模型训练结果重新确定第二模型损失函数，并以优化所述重新确定的第二模型损失函数为目标，对所述第二数量第二模型训练结果进行第二模型对齐；基于重新确定的第二模型对齐的结果，进行下一次联邦聚合，重新确定第一模型训练结果。

一种实施方式中，确定第二模型损失函数，包括：

确定终端第二数量第二模型训练结果与所述微基站上一次联邦聚合得到的第一模型训练结果之间的第二损失函数，以及第二模型对齐损失函数；基于所述第二损失函数和第二模型对齐损失函数，确定第二模型损失函数。

一种实施方式中，所述方法还包括：

接收宏基站发送的停止模型训练信息；所述停止训练信息指示微基站停止终端执行模型训练任务；基于所述停止模型训练信息指示终端停止执行模型训练任务。

一种实施方式中，所述方法还包括：

发送终端切换信息；所述终端切换信息包括退出模型训练的终端和终端重新接入的目标微基站的信息；所述终端切换信息用于宏基站重新确定执行模型训练任务的终端；响应于接收到宏基站发送的终端信息，重新确定执行模型训练任务的终端，并向终端发送模型训练任务。

一种实施方式中，所述向终端发送模型训练任务，包括：

响应于所述终端信息中包括上一次执行模型训练任务的终端，确定所述终端切换后的目标微基站，由所述目标微基站向终端发送所述模型训练任务；和/或

响应于所述终端信息中未包括上一次执行模型训练任务的终端，确定将所述终端不再执行所述模型训练任务，并确定新增执行模型训练任务的终端，向新增执行模型训练任务的终端发送模型训练任务。

根据本公开实施例的第三方面，提供一种模型学习装置，应用于宏基站，包括：

发送模块，用于响应于接收到操作维护管理OAM实体发送的模型训练请求，向第一数量的微基站发送所述模型训练请求；其中，所述第一数量的微基站通信覆盖范围在所述宏基站通信覆盖范围内。

一种实施方式中，所述模型训练请求用于触发微基站上报能力信息；所述装置还包括：确定模块；

所述确定模块，用于响应于接收到微基站发送的能力信息，基于所述能力信息确定模型结构和模型参数值，并向微基站发送所述模型结构和模型参数值；所述模型结构为指示微基站基于所述模型训练请求训练的模型结构，所述模型参数值为所述模型结构的初始参数值。

一种实施方式中，所述能力信息包括微基站的数据类型特征；所述装置还包括：接收模块；

所述接收模块，用于接收第一数量微基站发送的第一数量第一模型训练结果；确定所述第一数量微基站中不同微基站具有的所述数据类型特征，并确定第一模型损失函数；基于所述第一数量微基站中不同微基站具有的数据类型特征进行数据类型特征统一后，以优化所述第一模型损失函数为目标，对所述第一数量第一模型训练结果进行第一模型对齐；基于第一模型对齐的结果进行全局模型学习，确定全局模型。

一种实施方式中，所述确定模块，用于：

一种实施方式中，所述确定模块还用于：

根据本公开实施例的第四方面，提供一种模型学习装置，应用于微基站，包括：

接收模块，用于接收宏基站发送的模型训练请求；发送模块向终端发送所述模型训练请求；其中，所述接收模型训练请求的微基站的数量为第一数量；所述第一数量的微基站通信覆盖范围在所述宏基站通信覆盖范围内。

一种实施方式中，所述模型训练请求用于触发终端上报终端的通信条件和数据特征，所述接收模块还用于：

一种实施方式中，所述接收模块还用于：接收模型结构和模型参数值；所述模型结构为指示微基站基于所述模型训练请求训练的模型结构，所述模型参数值为所述模型结构的初始参数值；基于所述终端的通信条件和数据类型特征以及所述模型结构和模型参数值，确定执行模型训练的第二数量终端；向所述第二数量终端发送调度信息；所述调度信息包括模型结构和模型参数值以及指示终端进行模型训练的指示信息。

一种实施方式中，所述装置还包括：确定模块；

所述接收模块，用于接收第二数量终端发送的第二数量第二模型训练结果；所述确定模块，用于确定所述第二数量终端中不同终端具有的数据类型特征，并确定第二模型损失函数；基于所述第二数量终端中不同终端具有的数据类型特征进行数据类型特征统一后，以优化所述第二模型损失函数为目标，对所述第二数量第二模型训练结果进行第二模型对齐；基于第二模型对齐的结果进行联邦聚合，得到第一模型训练结果。

一种实施方式中，所述确定模块，用于：

一种实施方式中，所述接收模块还用于：接收宏基站发送的停止模型训练信息；所述停止训练信息指示微基站停止终端执行模型训练任务；基于所述停止模型训练信息指示终端停止执行模型训练任务。

一种实施方式中，所述发送模块还用于：发送终端切换信息；所述终端切换信息包括退出模型训练的终端和终端重新接入的目标微基站的信息；所述终端切换信息用于宏基站重新确定执行模型训练任务的终端；响应于接收到宏基站发送的终端信息，重新确定执行模型训练任务的终端，并向终端发送模型训练任务。

一种实施方式中，所述发送模块：

根据本公开实施例的第五方面，提供一种模型学习装置，包括：

处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为：执行第一方面或第一方面中任意一种实施方式所述的模型学习方法，或执行第二方面或第二方面中任意一种实施方式所述的模型学习方法。

根据本公开实施例的第六方面，提供一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行第一方面或第一方面中任意一种实施方式所述的模型学习方法，或使得移动终端能够执行第二方面或第二方面中任意一种实施方式所述的模型学习方法。

本公开的实施例提供的技术方案可以包括以下有益效果：通过宏基站向微基站发送模型训练请求，实现宏基站与微基站的交互进行模型训练任务的分配，提高了无线接入网设备的利用效率，信道质量较高，模型可靠性即精度高。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种模型学习方法的异构网络场景架构示意图。

图2是根据一示例性实施例示出的一种模型学习方法的流程图。

图3是根据一示例性实施例示出的又一种模型学习方法的流程图。

图4是根据一示例性实施例示出的又一种模型学习方法的流程图。

图5是根据一示例性实施例示出的又一种模型学习方法的流程图。

图6是根据一示例性实施例示出的又一种模型学习方法的流程图。

图7是根据一示例性实施例示出的又一种模型学习方法的流程图。

图8是根据一示例性实施例示出的又一种模型学习方法的流程图。

图9是根据一示例性实施例示出的又一种模型学习方法的流程图。

图10是根据一示例性实施例示出的又一种模型学习方法的流程图。

图11是根据一示例性实施例示出的又一种模型学习方法的流程图。

图12是根据一示例性实施例示出的又一种模型学习方法的流程图。

图13是根据一示例性实施例示出的又一种模型学习方法的流程图。

图14是根据一示例性实施例示出的又一种模型学习方法的流程图。

图15是根据一示例性实施例示出的又一种模型学习方法的流程图。

图16是根据一示例性实施例示出的又一种模型学习方法的流程图。

图17是根据一示例性实施例示出的又一种模型学习方法的流程图。

图18是根据一示例性实施例示出的又一种模型学习方法的流程图。

图19是根据一示例性实施例示出的一种模型推理方法的主流程图。

图20是根据一示例性实施例示出的一种模型学习方法中模型推理的联邦学习流程图。

图21是根据一示例性实施例示出的一种模型学习方法中终端切换处理流程图。

图22是根据一示例性实施例示出的一种模型学习方法的模型推理流程图。

图23是根据一示例性实施例示出的一种模型学习方法中微基站与宏基站进行信令与数据传输的协议和接口原理图。

图24是根据一示例性实施例示出的一种模型学习方法中微基站与终端进行信令与数据传输的协议和接口原理图。

图25是根据一示例性实施例示出的一种模型学习方法中进行终端切换的协议和接口原理图。

图26是根据一示例性实施例示出的一种模型学习装置框图。

图27是根据一示例性实施例示出的又一种模型学习装置框图。

图28是根据一示例性实施例示出的一种用于模型学习的装置的框图。

图29是根据一示例性实施例示出的又一种用于模型学习的装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在通信技术中为提高峰值速率和频谱利用率，进一步引入异构网络技术。其中，异构网络技术是指许多微基站被布放在宏基站覆盖区域内，形成同覆盖的不同节点类型相异的异构系统。由于接入点与被服务的终端之间的地理距离被缩小了，能够有效提升系统吞吐量和网络整体效率。

另一方面随着人工智能技术的发展，机器学习被应用到越来越多的领域，机器学习中的联邦学习是其中一种学习方法。联邦学习是指通过联合不同的参与方(例如终端)进行机器学习的方法，不同参与方协同进行学习，可以有效保障大数据交换时的信息安全、保护终端数据和个人数据隐私。将联邦学习应用到多源异构网络中，可以实现多源异构网络的机器学习建模，其实施方式可以参考下述实施例。

宏基站将操作维护管理(Operation Administration and Maintenance，OAM)实体的具体订阅需求转发给终端，其中OAM的订阅需求也可以称为模型训练请求。终端将通信条件及本地数据类型特性上报给宏基站。宏基站根据终端上报信息进行任务分配，并将模型结构和超参数信息下发给终端。终端依据宏基站分配任务进行本地模型训练，训练完成后，终端将本地学习模型参数发送给宏基站。宏基站根据终端本地学习结果进行联邦平均，得到全局模型。宏基站检验全局学习模型是否满足OAM的订阅需求，若满足，则宏基站将所得模型发送给OAM。若不满足，则终端根据全局学习结果更新本地模型，再与宏基站重复迭代进行训练，直至所得全局模型满足OAM订阅需求。

通过上述实施方式可知，相关技术中存在以下不足：

1)终端直接与宏基站相连进行数据与信令的传输，对于宏基站覆盖范围边缘的终端而言，终端与宏基站之间的地理距离较大，信道质量较差，数据传输速率较慢，影响了通信网络的整体效率，导致联邦学习过程效率较低。

2)宏基站直接对所有终端的本地训练结果进行联邦平均，在实际应用中，不同终端本地训练集的数据结构可能有所不同，直接进行联邦平均可行性较低，会导致模型泛化能力较差，无法保证模型可靠性及精度。

3)宏基站与终端之间的数据交互需通过核心网或数据中心进行，终端需要先将训练结果数据上传至核心网或数据中心，宏基站再请求数据，不支持基站和终端之间直接传输数据进行联邦学习，降低了联邦学习的效率及无线网络资源的利用率。

4)终端退出宏基站连接则直接退出联邦学习过程，且未考虑新终端加入连接的处理流程，导致在联邦学习过程中的可用训练数据越来越少，不利于模型的整体训练及模型精度的提高。

基于上述实施方式中的不足，相关技术中考虑将模型学习与异构网络相结合。在异构网络中，一个宏基站覆盖范围内包括多个微基站，终端与微基站相连进行数据和信令的交互。由于微基站覆盖范围较小，终端发生移动时，很容易触发切换。而在相关技术中，并未考虑终端发生切换的问题，因此无法确定终端在发生切换后是否继续支持训练。并且，在进行联邦学习中，由于不同节点采用训练数据的数据类型特征可能不同，导致不同节点训练结果的维度可能不同，而在相关技术中，也并未考虑基于异构网络进行模型学习的处理方法。

基于此，本公开提供一种模型学习方法，将模型学习与异构网络的学习结果进行模型对齐处理，确定OAM需要的训练模型。并且提出终端发生切换后的处理方法，针对不同的模型训练任务类型，终端可继续参与源微基站的训练任务或是加入目标微基站的训练任务。有效解决了在终端移动场景下可用训练数据不断减少的问题。并且在不同节点处对训练模型使用的数据进行对齐后再进行训练，可以支持使用不同类型的数据训练同一个模型。

进一步的，本公开中涉及宏基站和微基站属于网络设备，也可以称为无线接入网设备。该无线接入网设备可以是：基站、演进型基站(evolved node B，基站)、家庭基站、无线保真(wireless fidelity，WIFI)系统中的接入点(access point，AP)、无线中继节点、无线回传节点、传输点(transmission point，TP)或者发送接收点(transmission and reception point，TRP)等，还可以为NR系统中的gNB，或者，还可以是构成基站的组件或一部分设备等。当为车联网(V2X)通信系统时，网络设备还可以是车载设备。应理解，本公开的实施例中，对网络设备所采用的具体技术和具体设备形态不做限定。

进一步的，本公开中涉及的终端，也可以称为终端设备、用户设备(User Equipment，UE)、移动台(Mobile Station，MS)、移动终端(Mobile Terminal，MT)等，是一种向用户提供语音和/或数据连通性的设备，例如，终端可以是具有无线连接功能的手持式设备、车载设备等。目前，一些终端的举例为：智能手机(Mobile Phone)、口袋计算机(Pocket Personal Computer，PPC)、掌上电脑、个人数字助理(Personal Digital Assistant，PDA)、笔记本电脑、平板电脑、可穿戴设备、或者车载设备等。此外，当为车联网(V2X)通信系统时，终端设备还可以是车载设备。应理解，本公开实施例对终端所采用的具体技术和具体设备形态不做限定。

图1是根据一示例性实施例示出的一种模型学习方法的异构网络场景架构示意图。如图1所示，该系统包括一个宏基站、M个微基站及N个终端。本公开终端装置主要负责本地数据采集与本地模型训练，微基站装置主要负责终端调度与任务分配、协调终端装置进行模型训练及终端的移动性管理，宏基站装置主要负责协调微基站装置进行全局模型训练，以得到满足OAM订阅需求的全局模型。

其中，微基站的覆盖范围都在宏基站的覆盖范围内。宏基站与微基站之间进行信令/数据的交换时，可以是有线连接，例如通过光纤、同轴电缆、网线等实现；也可以是无线连接，例如通过毫米波等实现。宏基站与微基站之间的连接可以通过X2接口来实现，也可通过X3等其他接口实现，本发明实施例对连接的具体实现形式不作限制。

微基站与终端之间可以通过无线空口建立无线连接。在不同的实施方式中，该无线空口是基于第四代移动通信网络技术(4G)标准的无线空口；或者，该无线空口是基于第五代移动通信网络技术(5G)标准的无线空口，比如该无线空口是新空口；或者，该无线空口也可以是基于5G的更下一代移动通信网络技术标准的无线空口。本公开实施例对微基站范围内的终端与微基站之间连接的具体实现形式不做要求。基于该系统，提出本公开的模型学习方法。

图2是根据一示例性实施例示出的一种模型学习方法的流程图。如图2所示，模型方法用于宏基站中，包括以下步骤。

在步骤S11中，响应于接收到操作维护管理OAM实体发送的模型训练请求，向第一数量的微基站发送模型训练请求。

在本公开实施例中，OAM向宏基站发起模型训练请求，模型训练请求中包括OAM对订阅模型的训练任务类型要求和模型精度。宏基站基于接收的模型训练请求，通过图1所示的X2接口将该模型训练请求转发至微基站。其中，转发模型训练请求的数量基于宏基站下覆盖的微基站的数量确定，本公开为便于区分将一个宏基站下覆盖的微基站的数量称为第一数量。

其中，模型训练请求至少可以包括：分析ID，通知目标地址，分析报告信息。其中分析ID用于标识请求的分析类型；通知目标地址用于将被请求方接收到的通知与此订阅关联；分析报告信息包含首选分析精度级别、分析时间间隔等参数。模型训练请求还可以包括分析筛选器信息，分析筛选器信息用于指示报告分析信息要满足的条件。

通过本公开实施例提供的模型学习方法，宏基站基于接收的模型训练请求发送至微基站，可以提高数据速率，进一步提高通信网络的整体效率。

在本公开实施例中，宏基站向微基站发送模型训练请求，以使微基站上报能力信息。其中微基站上报的能力信息包括接入该微基站的终端的通信条件和本地数据类型特征，以及该微基站的通信条件和本地数据类型特征。

图3是根据一示例性实施例示出的一种模型学习方法的流程图。如图3所示，模型学习方法用于宏基站中，包括以下步骤。

在步骤S21中，响应于接收到微基站发送的能力信息，基于能力信息确定模型结构和模型参数值，并向微基站发送模型结构和模型参数值。

在本公开实施例中，模型结构为指示微基站基于模型训练请求训练的模型结构，模型参数值为模型结构的初始参数值。

宏基站基于接收的微基站发送能力信息，进行模型训练任务分配，确定第一数量的微基站中每个微基站对应的模型结构和模型参数值。其中，模型训练任务分配为分配每个微基站联邦学习的具体任务。向每个微基站发送对应的模型结构和模型参数值。

图4是根据一示例性实施例示出的一种模型学习方法的流程图。如图4所示，模型学习方法用于宏基站中，包括以下步骤。

在步骤S31中，接收第一数量微基站发送的第一数量第一模型训练结果。

在本公开实施例中，宏基站接收第一数量微基站中每个微基站发送的第一模型训练结果，得到第一数量的第一模型训练结果。

在步骤S32中，确定第一数量微基站中不同微基站具有的数据类型特征，并确定第一优化模型损失函数。

在本公开实施例中，不同微基站具有的数据类型特征不同，例如，其中一个微基站具有的数据类型特征为图像数据，另一个微基站具有的数据类型为数字数据等。当然这仅仅是举例说明，并不是对本公开的具体限定。

在步骤S33中，基于第一数量微基站中不同微基站具有的数据类型特征进行数据类型特征统一后，以优化第一模型损失函数为目标，对第一数量第一模型训练结果进行第一模型对齐。

在本公开实施例中，宏基站首先对微基站联邦学习后的第一数据第一模型训练结果进行维度统一。

在本公开一些实施例中，宏基站对宏基站覆盖范围下所有(即，第一数量)微基站联邦学习之后的数据类型特征分别做一维卷积，将所有微基站的数据类型特征映射到同一维度d′，具体公式如下：

其中，r ₁,r ₂…r _q表示宏基站下连接的q个微基站，

是微基站{r ₁,r ₂…r _q}卷积核的大小，d′是公共维度，经过一维卷积后，所有终端的特征都映射到同一维度d′上。

其次，宏基站基于所有微基站的维度统一结果，以优化第一模型损失函数为目标，基于不用微基站的数据类型特征对第一数量第一模型训练结果进行第一模型对齐。

在步骤S34中，基于第一模型对齐的结果进行全局模型学习，确定全局模型。

在本公开实施例中，宏基站基于第一模型对齐的结果进行全局模型学习，得到模型学习结果。将该模型学习结果与模型训练请求中包括的模型训练任务类型要求和模型精度进行比较，进而确定OAM请求的全局模型。

图5是根据一示例性实施例示出的一种模型学习方法的流程图。如图5所示，模型学习方法用于宏基站中，包括以下步骤。

在步骤S41中，响应于全局模型学习的模型学习结果不满足OAM的模型训练请求，将模型学习结果发送至微基站，接收微基站基于模型学习结果重新确定的第一数量第一模型训练结果。

在本公开实施例中，响应于宏基站确定本次全局模型学习的模型学习结果不满足OAM的模型训练请求，则将本次全局模型学习的模型学习结果发送至微基站，用于微基站重新确定第一模型训练结果。

在步骤S42中，基于全局模型学习的模型学习结果重新确定第一模型损失函数，并以优化重新确定的第一模型损失函数为目标，重新对接收的第一数量第一模型训练结果进行第一模型对齐。

在本公开实施例中，基于本次不满足OAM模型训练请求的全局模型学习的模型学习结果重新确定第一模型损失函数，再一次以优化重新确定的第一模型损失函数为目标，对接收的第一数量第一模型训练结果进行第一模型对齐。

在步骤S43中，基于重新确定的第一模型对齐的结果，进行下一次全局模型学习，重新确定模型学习结果，直到模型学习结果满足模型训练请求，将与满足模型训练请求的模型学习结果对应的模型确定为全局模型。

在本公开实施例中，宏基站基于重新确定的第一模型对齐结果，即重新优化第一模型损失函数的结果，再一次进行全局模型学习，再一次得到模型学习结果。将重新得到的模型学习结果与模型训练请求进行对比，确定是否满足模型训练请求中对于模型的要求。若不满足则重新确定第一模型损失函数，直到全局模型学习的模型学习结果满足模型训练请求，将与满足模型训练请求的模型学习结果对应的模型确定为全局模型。

图6是根据一示例性实施例示出的一种模型学习方法的流程图。如图6所示，模型学习方法用于宏基站中，包括以下步骤。

在步骤S51中，确定微基站第一数量的第一模型训练结果与宏基站上一次全局模型学习得到的模型学习结果之间的第一损失函数，以及第一模型对齐损失函数。

在本公开实施例中，第一模型损失函数包括两部分，一部分是微基站第一数量的第一模型训练结果与宏基站上一次全局模型学习得到的模型学习结果之间的第一损失函数；另一部分是第一模型对齐损失函数。宏基站以优化第一模型损失函数为目标，对第一数量第一模型训练结果进行第一模型对齐，换言之，宏基站以优化第一模型对齐损失函数和第一损失函数整体损失函数为目标，进行第一数量第一模型训练结果的第一模型对齐。

在步骤S52中，基于第一损失函数和第一模型对齐损失函数，确定第一模型损失函数。

在本公开实施例中，采用用于回归问题的绝对值误差函数及平方误差损失函数、用于分类问题的交叉熵损失函数，将第一损失函数和第一模型对齐损失函数确定为第一模型损失函数。

在本公开一些实施例中，第一模型损失函数可以参考下述公式。

其中，l(·,·)表示模型的损失函数，即，用于回归问题的绝对值误差函数及平方误差损失函数、用于分类问题的交叉熵损失函数等；l _M为第一模型对齐损失函数，η表示一个权重因子；Θ表示所有待学习的参数，比如权重和偏置项等；q表示参与联邦学习的微基站总数；

表示微基站k在第t次联邦学习过程中联邦聚合参数的第一模型训练结果，a _t-1表示宏基站在第t-1次全局学习过程中全局模型学习的模型学习结果。

其中，为第一模型对齐损失函数l _M的函数式，可以表示为：

其中,

代表平方希尔伯特——施米特矩阵范数，C _S和C _T分别表示模型对齐前和对齐后的协方差矩阵。

图7是根据一示例性实施例示出的一种模型学习方法的流程图。如图7所示，模型学习方法用于宏基站中，包括以下步骤。

在步骤S61中，响应于全局模型学习的模型学习结果满足OAM的模型训练请求，向微基站发送停止模型训练信息。

在本公开实施例中，停止训练信息指示微基站停止终端执行模型训练任务。宏基站确定当前全局模型学习的模型学习结果满足OAM的模型训练请求。换言之，OAM发送的模型训练请求中的订阅需求中包含有订阅的业务所需要的模型精度提出具体要求，当全局模型学习的模型学习结果，满足该OAM订阅需求时，说明当前的全局学习模型已经达到了足够的精度，确定结束训练任务，得到可供使用的全局模型。向微基站发送停止模型训练信息。其中，停止训练信息指示微基站停止终端执行模型训练任务。

在步骤S62中，将模型学习结果对应的模型确定为全局模型，并向OAM发送全局模型。

在本公开实施例中，以当前为进行第t次全局模型学习为例，将第t次全局模型学习的模型学习结果用a _t表示，则将a _t发送至OAM。

图8是根据一示例性实施例示出的一种模型学习方法的流程图。如图8所示，模型学习方法用于宏基站中，包括以下步骤。

在步骤S71中，响应于在训练模型过程中接收到微基站发送的终端切换信息，基于终端切换信息重新确定执行模型训练的终端，并向微基站发送终端的信息。

在本公开实施例中，响应于宏基站接收到微基站发送的终端切换信息，确定存在执行模型训练任务的终端发生退出，或微基站存在新接入的终端。宏基站基于接收的终端切换信息重新确定执行模型训练任务的终端，并将重新确定的执行模型训练任务的终端的终端信息发送中微基站。其中，模型切换信息包括退出模型训练的终端和终端重新接入的目标微基站的信息；终端切换信息用于宏基站重新确定执行模型训练任务的终端。宏基站根据终端发生切换的情况判断退出连接或新加入连接终端是否参与执行模型训练任务。宏基站根据OAM订阅需求中的训练任务类型判断退出连接或新加入连接终端是否继续参与源微基站的训练任务。

在本公开一些实施例中，训练任务类型可分为与上层应用相关任务及与底层网络通道相关任务。如果任务与上层应用相关，则终端可继续参与源微基站的联邦学习任务；如果任务与底层网络通道相关，则所训练的模型只适用于源微基站(即，终端切换之前接入的微基站)，终端无法继续参与源微基站的联邦学习任务。宏基站可根据OAM订阅需求中的训练任务类型及具体的切换信息决定终端是否继续参与源微基站的训练。

一种实施例中，宏基站决定终端继续参与源微基站的模型训练任务，则目标微基站(即终端切换后接入的微基站)将负责转发终端与源微基站之间的第一模型训练结果，源微基站将该终端继续保留在训练任务列表中并为其重新分配模型训练任务。目标微基站将终端的任务安排结果发送给终端，终端保留在源微基站的训练信息，继续参与源微基站的联邦学习。

一种实施例中，宏基站决定终端继续参与源微基站的训练，则目标微基站将负责转发终端与源微基站之间的第一模型训练结果。当终端完成一轮本地模型训练时，终端将本地训练结果发送给目标微基站，目标微基站将结果转发给源微基站；当宏基站完成一轮全局模型学习时，源微基站将全局学习结果及终端是否继续进行训练的信令发送给目标微基站，目标微基站将数据及信令转发给终端。

基于相同/相似的构思，本公开实施例还提供一种模型学习方法。

图9是根据一示例性实施例示出的一种模型学习方法的流程图。如图9所示，模型学习方法用于微基站中，包括以下步骤。

在步骤S81中，接收宏基站发送的模型训练请求。

在步骤S82中，向终端发送模型训练请求。

在本公开实施例中，接收模型训练请求的微基站的数量为第一数量；第一数量的微基站通信覆盖范围在宏基站通信覆盖范围内。微基站接收到宏基站发送的模型训练请求后，将该模型训练请求转发至终端。

在本公开实施例中，微基站向终端发送模型训练请求，模型训练请求可以用于触发终端发送自身的通信条件和数据特征。

图10是根据一示例性实施例示出的一种模型学习方法的流程图。如图10所示，模型学习方法用于微基站中，包括以下步骤。

在步骤S91中，接收终端发送的通信条件和数据类型特征。

在步骤S92中，对终端的通信条件和数据特性，以及微基站的通信条件和数据特性进行处理，得到能力信息，并向能力信息发送至宏基站。

在本公开实施例中，终端接收到微基站发送的模型训练请求后，确定自身的通信条件和数据特征并进行上报。微基站与终端通过无线信道进行数据和信令的交互，一种实施方式中，终端上报的通信条件是指终端的通信能力或通信信道状况。一种实施方式中，终端向微基站上报的通信条件可以包含终端检测得到的信道质量指示CQI信息。终端上报的本地数据特性可以包含收集数据的类别等。微基站通过X2接口将终端上报的通信条件和数据特征以及微基站的通信条件和数据特征发送至宏基站。本公开为便于描述将终端的通信条件和数据特征以及微基站的通信条件和数据特征称为能力信息，其中，能力信息用于宏基站确定模型结构和模型参数值。

图11是根据一示例性实施例示出的一种模型学习方法的流程图。如图11所示，模型学习方法用于微基站中，包括以下步骤。

在步骤S101中，接收模型结构和模型参数值。

在步骤S102中，基于终端的通信条件和数据类型特征以及模型结构和模型参数值，确定执行模型训练的第二数量终端。

在本公开实施例中，微基站基于接收的模型结构和模型参数值，以及接入的终端的通信条件和数据类型特征，确定执行模型训练任务的第二数量终端。

在步骤S103中，向第二数量终端发送调度信息。

在本公开实施例中，微基站确定第二数量终端后，向第二数量终端发送调度信息。其中，调度信息包括模型结构和模型参数值以及指示终端进行模型训练的指示信息。

一种方式中，微基站确定执行模型训练任务的终端包括一个终端(即，第二数量为一个)，则微基站确定终端的学习模式为单一终端训练模式。微基站直接将宏基站分配的训练任务转发给终端，终端可根据分配任务进行本地模型训练。

另一方式中，微基站确定执行模型训练任务的终端包括多个终端(即，第二数量为多个)，微基站确定终端的学习模式为多终端协作训练模式。微基站将宏基站分配的训练任务根据不同终端的通信条件及本地数据特性进行分配，辅助多终端协作完成模型训练，各终端接收到微基站分配的任务后可根据微基站分配的模型训练任务进行本地模型训练。

在本公开一些实施例中，终端接收到微基站发送的调度信息后对本地模型参数进行初始化，再根据微基站分配的模型训练任务要求进行本地模型训练，并将训练结果通过无线信道传输给微基站。

图12是根据一示例性实施例示出的一种模型学习方法的流程图。如图12所示，模型学习方法用于微基站中，包括以下步骤。

在步骤S111中，接收第二数量终端发送的第二数量第二模型训练结果。

在本公开实施例中，微基站接收第二数量终端发送的第二数量模型训练结果。以第二数量终端中的终端m为例。终端m随机初始化一组模型参数作为本地学习模型的初始化参数，初始化的本地学习模型结果记为

终端m通过对数据进行感知与收集生成本地数据集D _m，并对本地数据集随机抽取数据量为N的数据集，生成本地训练集T _m，在对本地模型参数进行初始化后，终端利用本地训练集进行本地模型训练，并将终端的训练结果(即第二模型训练结果)通过无线信道传输给微基站，以第t次联邦学习过程为例，终端m传输的本地学习模型训练更新结果可表示为

在步骤S112中，确定第二数量终端中不同终端具有的数据类型特征，并确定第二模型损失函数。

在本公开实施例中，确定第二数量终端中每个终端具有的数据类型特征，其中，不同的数据类型特征图像数据、数字数据等。

在步骤S113中，基于第二数量终端中不同终端具有的数据类型特征进行数据类型特征统一后，以优化第二模型损失函数为目标，对第二数量第二模型训练结果进行第二模型对齐。

在本公开实施例中，由于终端的本地数据集的数据类型特征可能不同，训练得到的本地模型特征维度也可能不同，因此对不同终端特征维度进行统一以便于进行模型对齐及联邦聚合。对微基站i下所有终端训练完后的特征分别做一维卷积，将所有终端的特征映射到同一维度d，具体公式如下：

其中，m ₁,m ₂…m _n表示微基站i下连接的n个终端，

是终端{m ₁,m ₂…m _n}卷积核的大小，d是公共维度，经过一维卷积后，所有终端的特征都映射到同一维度d上。微基站基于所有终端的维度统一结果，以优化第一模型损失函数为目标，基于不用终端的数据类型特征对第二数量第二模型训练结果进行第二模型对齐。

在步骤S114中，基于第二模型对齐的结果进行联邦聚合，得到第一模型训练结果。

在本公开实施例中，微基站基于第二模型对齐的结果进行联邦学习，得到第一模型训练结果。之后将第一模型训练结果发送至宏基站。

图13是根据一示例性实施例示出的一种模型学习方法的流程图。如图13所示，模型学习方法用于微基站中，包括以下步骤。

在步骤S121中，响应于接收到宏基站发送的继续训练请求，并接收到宏基站发送的模型学习结果。

在本公开实施例中，若接收到宏基站发送的继续训练请求，则进一步接收将宏基站发送的模型学习结果。

在步骤S122中，基于模型学习结果更新终端的模型结构和模型参数值，并向终端发送继续训练调度信息。

在本公开实施例中，微基站将宏基站发送的模型学习结果发送至终端，终端基于模型学习结果更新模型结构和模型参数值。微基站向终端发送继续训练调度信息，指示终端基于更新后的模型结构和模型参数值继续执行模型训练任务，将重新得到的第二模型训练结果重新发送至微基站。

在步骤S123中，响应于重新接收到第二数量第二模型训练结果，基于第一模型训练结果重新确定第二模型损失函数，并以优化重新确定的第二模型损失函数为目标，对第二数量第二模型训练结果进行第二模型对齐。

在本公开实施例中，微基站重新接收到终端发送的第二数量第二模型训练结果后，基于接收到宏基站发送的第一模型训练结果，重新确定第二损失函数，再一次以优化第二损失函数为目标，对第二数量第二模型训练结果进行第二模型对齐。

在步骤S124中，基于重新确定的第二模型对齐的结果，进行下一次联邦聚合，重新确定第一模型训练结果。

在本公开实施例中，微基站基于重新确定的第二模型对齐结果，以微基站i为例，微基站i在模型对齐的基础上进行联邦聚合。联邦聚合完成后，微基站通过X2接口将联邦聚合结果上报给宏基站，以第t次联邦学习过程为例，微基站i传输的联邦聚合结果可表示为

进行联邦聚合，重新确定第一模型训练结果。形成宏基站、微基站与终端联邦学习循环交互，直到最终宏基站确定满足OAM要求的全局模型。

图14是根据一示例性实施例示出的一种模型学习方法的流程图。如图14所示，模型学习方法用于微基站中，包括以下步骤。

在步骤S131中，确定终端第二数量第二模型训练结果与所述微基站上一次联邦聚合得到的第一模型训练结果之间的第二损失函数，以及第二模型对齐损失函数。

在步骤S132中，基于第二损失函数和第二模型对齐损失函数，确定第二模型损失函数。

在本公开实施例中，对所有终端的特征维度进行统一后，基于不同终端的特征对齐结果进行模型对齐，在模型对齐的过程中，以优化第二模型损失函数为目标，第二模型损失函数可以分为两部分确定，第一部分是由所有终端第t次联邦学习的模型训练结果与微基站第t-1次联邦学习联邦学习的更新结果计算损失函数而得；第二部分是在模型对齐前后计算损失函数而得。以优化两部分整体的损失函数为模型对齐的目标。

其中，采用用于回归问题的绝对值误差函数及平方误差损失函数、用于分类问题的交叉熵损失函数，将第一损失函数和第一模型对齐损失函数确定为第一模型损失函数。

微基站i在第t次联邦训练过程中的损失函数可表示为：

其中，l(·,·)表示模型的损失函数，即，用于回归问题的绝对值误差函数及平方误差损失函数、用于分类问题的交叉熵损失函数等；l _M为模型对齐损失函数，η表示一个权重因子；Θ表示所有待学习的参数，比如权重和偏置项等；n表示在微基站i下参与联邦学习的终端总数；

表示终端k在第t次联邦学习过程中本地学习模型训练更新结果；

表示微基站i在第t-1次联邦学习过程中联邦聚合参数的训练更新结果。

其中，模型对齐损失函数可表示为：

其中,

图15是根据一示例性实施例示出的一种模型学习方法的流程图。如图15所示，模型学习方法用于微基站中，包括以下步骤。

在步骤S141中，接收宏基站发送的停止模型训练信息。

在本公开实施例中，停止训练信息用于指示微基站停止终端执行模型训练任务。

在步骤S142中，基于停止模型训练信息指示终端停止执行模型训练任务。

在本公开实施例中，若微基站接收到停止模型训练信息，则确定不再对该模型进行训练。并向终端发送该停止模型训练信息，指示终端停止执行模型训练任务。

图16是根据一示例性实施例示出的一种模型学习方法的流程图。如图16所示，模型学习方法用于微基站中，包括以下步骤。

在步骤S151中，发送终端切换信息。

在本公开实施例中，终端切换信息包括退出模型训练的终端和终端重新接入的目标微基站的信息；终端切换信息用于宏基站重新确定执行模型训练任务的终端。

在本公开一些实施例中，源微基站表示终端切换前所连接的微基站，目标微基站表示终端切换后所连接的微基站。源微基站会定时给终端发送测量控制信号，终端根据测量控制信号对参考信号接收功率及参考信号接收质量等进行测量，并将测量报告上报给源微基站。当源微基站检测到其他基站能为该终端提供更高的服务质量时，源微基站做出终端切换的决策，通知终端准备执行切换并向目标微基站发起切换请求，同时将切换终端及目标微基站的信息上报给所连接的宏基站。源微基站向终端发送重配置RRC连接请求消息，同时向目标微基站发送终端状态信息，终端与目标微基站进行一系列参数配置，终端成功接入目标微基站，目标微基站发送切换成功消息给源微基站。

在步骤S152中，响应于接收到宏基站发送的终端信息，重新确定执行模型训练任务的终端，并向终端发送模型训练任务。

在本公开实施例中，微基站在接收到宏基站发送的终端信息后，基于重新确定的执行模型训练任务的终端，重新分配每个终端的模型训练任务，并向终端发送与之对应的模型训练任务。

图17是根据一示例性实施例示出的一种模型学习方法的流程图。如图17所示，模型学习方法用于微基站中，包括以下步骤。

在步骤S161中，响应于终端信息中包括上一次执行模型训练任务的终端，确定终端切换后的目标微基站，由目标微基站向终端发送模型训练任务。

在本公开实施例中，终端发生切换接入的微基站后，微基站基于宏基站发送的终端信息，重新确定执行模型训练任务的终端。若在终端信息中包括上一次执行模型训练任务的终端，且该终端已经切换了微基站，则由目标微基站(即终端切换后接入的微基站)将负责转发终端与源微基站(即终端切换前接入的微基站)之间的第二模型训练结果，源微基站将该终端继续保留在训练任务列表中并为其重新分配训练任务。目标微基站将终端的模型训练任务发送给终端，终端保留在源微基站的训练信息，继续参与源微基站的联邦学习。

图18是根据一示例性实施例示出的一种模型学习方法的流程图。如图18所示，模型学习方法用于微基站中，包括以下步骤。

在步骤S171中，响应于终端信息中未包括上一次执行模型训练任务的终端，确定将终端不再执行模型训练任务，并确定新增执行模型训练任务的终端，向新增执行模型训练任务的终端发送模型训练任务。

在本公开实施例中，源微基站的训练任务类型不支持终端继续参与训练，则源微基站将终端从训练中彻底移除，新终端将通信条件及本地数据特性上报给目标微基站，目标微基站根据训练任务类型及终端上报信息决定新终端是否参与目标微基站的训练。目标微基站再将终端的任务安排结果发送给终端。

进一步地，终端发生切换接入的微基站后，微基站基于宏基站发送的终端信息，重新确定执行模型训练任务的终端。若在终端信息中不包括上一次执行模型训练任务的终端，且该终端已经切换了微基站。由目标微基站将负责转发终端与源微基站之间的第二模型训练结果。当终端完成一轮本地模型训练时，终端将本地训练结果发送给目标微基站，目标微基站将结果转发给源微基站。当宏基站完成一轮全局模型学习时，源微基站将模型学习结果及终端是否继续进行训练的信令发送给目标微基站，目标微基站将数据及信令转发给终端。微基站将不再执行模型训练任务的终端移出训练的任务列表中。确定新增参与执行模型训练任务的终端，新增终端将通信条件及本地数据特性通过无限信道上报给目标微基站。目标微基站根据训练模型训练任务的类型及新增终端上报信息决定新增终端是否参与执行模型训练任务。终端是否参与源微基站的训练，目标微基站都将终端的任务安排结果通过无限信道发送给终端。

在本公开一些实施例中，对宏基站、微基站和终端之间的交互过程进行说明。

OAM向宏基站发起模型训练请求，宏基站接收到请求后，将模型训练请求转发给微基站，微基站再将请求转发给终端，终端将通信条件及本地数据特性上报给微基站，微基站再将终端信息上报给宏基站。宏基站根据微基站上报的终端信息对微基站进行任务分配，并将模型结构和超参数信息(即本公开实施例中涉及的模型参数值)下发给微基站。微基站收到宏基站下发信息后选择参与训练的终端以及终端的学习模式，并对参与模型训练任务的终端进行任务分配。终端、微基站与宏基站不断迭代进行联邦学习，直至模型满足OAM订阅需求(例如模型的精度需求)，宏基站将模型训练结果(即，全局模型学习的模型学习结果)上报给OAM。

所述OAM订阅需求包含：分析ID，用于标识请求的分析类型；通知目标地址，用于将被请求方接收到的通知与此订阅关联；分析报告信息，包含首选分析精度级别、分析时间间隔等参数；分析筛选器信息(可选)：指示报告分析信息要满足的条件。

在一些实施例中，所述具体终端、微基站与宏基站迭代进行联邦学习的方法包括：

在联邦学习的过程中，终端首先对本地模型参数进行初始化，再根据微基站分配的任务要求进行本地模型训练，并将训练结果(即第二模型训练结果)通过无线信道传输给微基站。微基站将所有参与训练终端的本地训练结果进行汇总后，先进行模型对齐，再进行联邦聚合，并将联邦聚合结果(即，第一模型训练结果)通过X2接口上报给宏基站。宏基站在汇总所有参与训练的微基站的联邦聚合结果后，先进行模型对齐，再进行全局模型学习，并将全局学习结果通过X2接口发送给微基站。微基站将全局模型训练结果通过无线信道转发给终端，终端根据全局模型训练结果对本地学习模型进行更新。宏基站根据OAM的订阅需求判断全局训练模型是否满足要求。

在一些实施例中，全局模型性能满足OAM订阅需求，则宏基站将模型训练结果上报给OAM，并通知微基站停止训练。

在一些实施例中，全局模型性能不满足OAM订阅需求，则宏基站需根据终端切换信息安排终端的训练任务，微基站再根据终端切换情况重新进行任务分配，终端再次进行本地模型学习并把结果上报给微基站，如此反复迭代直至模型性能满足OAM订阅需求。

在一些实施例中，在终端切换过程中，源微基站代表终端发生切换之前所连接的微基站，目标微基站代表终端发生切换之后连接的微基站。宏基站根据终端切换信息安排终端执行模型训练任务，包括：

当在联邦学习某次循环中，源微基站做出终端切换的决定时，源微基站通知终端准备执行切换，并将退出连接终端及目标微基站信息上报给宏基站。终端在收到源微基站命令后执行切换，并在目标微基站上完成连接。宏基站根据源微基站的训练任务类型及终端的切换信息决定终端是否继续参与源微基站的训练。

在一些实施例中，源微基站的训练任务类型支持终端继续参与训练，则目标微基站将负责转发终端与源微基站之间的训练数据，终端继续参与源微基站的训练任务，目标微基站将终端的任务安排结果发送给终端。

在一些实施例中，源微基站的训练任务类型不支持终端继续参与训练，则源微基站将终端从训练中彻底移除，新终端将通信条件及本地数据特性上报给目标微基站，目标微基站根据训练任务类型及终端上报信息决定新终端是否参与目标微基站的训练。目标微基站再将终端的任务安排结果发送给终端。

在一些实施例中，宏基站、微基站和终端完成OAM的模型训练任务，将全局模型发送至OAM之后，还可以对训练得到的模型进行推理。由OAM确定进行模型推理的任务小区，其任务小区进行任务推理的实施方式包括：

当进行任务推理时，任务小区通过所在宏基站向OAM发起推理请求并上报推理任务类型及具体需求，OAM根据推理任务类型及具体需求寻找合适的一个或多个模型。寻找到合适的模型后，OAM将模型选择结果下发给宏基站，被选择的宏基站上报具体的模型参数信息。OAM将被选择宏基站上报的模型参数信息转发给任务小区所在宏基站，任务小区所在宏基站根据模型参数信息对任务进行推理。

下面实施例将结合附图对宏基站、微基站和终端交互过程进行说明。图19是根据一示例性实施例示出的一种模型推理方法的主流程图。如图19所示，包括以下步骤：

步骤1，OAM向宏基站发起模型训练请求，宏基站将模型训练请求转发给微基站。

步骤2，微基站将模型训练请求转发给终端，终端将通信条件及本地数据类型特征上报给微基站，微基站将终端数据上报给宏基站。

步骤3，宏基站根据微基站上报信息进行任务分配，并将模型结构和模型参数值下发给微基站。

步骤4，微基站选择参与执行模型训练任务的终端以及终端的学习模式，并对参与训练的终端进行任务分配。

步骤5，终端、微基站与宏基站不断迭代进行联邦学习，直至模型满足OAM订阅需求，宏基站将模型训练结果上报给OAM。

图20是根据一示例性实施例示出的一种模型推理方法的联邦学习流程图。如图20所示，包括：终端对本地模型参数进行初始化；终端根据任务要求进行本地模型训练，并将第二模型训练结果通过无线信道传输给微基站；微基站汇总所有终端的第二模型训练结果，先进行模型对齐，再进行联邦聚合，并将结果通过X2接口上报给宏基站；宏基站汇总所有微基站联邦聚合结果，先进行模型对齐，再进行全局模型学习，并将全局模型的模型学习结果通过X2接口发送给微基站；微基站将模型学习结果通过无线信道发送给终端，终端根据模型学习结果更新本地学习模型；宏基站确定与模型训练结果对应的全局模型是否满足OAM订阅需求；若满足OAM订阅需求，则联邦学习结束，宏基站将模型学习结果上报给OAM。若不满足OAM订阅需求，则宏基站根据切换信息判断退出连接或新加入连接终端是否参与训练，微基站根据终端切换情况重新进行模型训练任务分配。

图21是根据一示例性实施例示出的一种模型推理方法的终端切换处理流程图。如图21所示，包括：源微基站通知终端准备执行切换，并将退出连接终端及目标微基站信息上报给宏基站；终端执行切换，并在目标微基站上完成连接；宏基站根据训练任务类型及切换信息决定终端是否继续参与源微基站的模型训练任务；若继续参与执行源微基站模型训练任务，则目标微基站负责转发终端与源微基站之间的训练数据，终端继续参与源微基站的训练任务；目标微基站将终端的任务安排结果发送给终端。若不继续参与执行源微基站模型训练任务，源微基站将终端移除训练；新增终端将通信条件及本地数据特性上报给目标微基站；目标微基站根据训练任务类型及终端上报信息决定新终端是否参与训练；目标微基站将终端的任务安排结果发送给终端。

在本公开一些实施例中，确定全局模型之后，还包括推理全局模型。图22是根据一示例性实施例示出的一种模型学习方法的模型推理流程图。如图22所示，包括如下步骤：

步骤1，任务小区通过宏基站向OAM发起推理请求并上报推理任务类型及具体需求。

步骤2，OAM根据推理任务类型及具体需求寻找合适的一个或多个模型。

一种实施例中，将推理任务类型分为与上层应用相关类型或与底层网络通道相关类型。在选择模型时，优先选择训练任务类型与推理任务类型相近的宏基站模型。

一种实施例中，可选择多个训练好的模型，将模型进行融合后进行推理。

步骤3，OAM将模型选择结果下发给宏基站，被选择的宏基站上报具体模型参数信息。

步骤4，OAM将模型参数信息转发给任务小区所在宏基站，任务小区所在宏基站根据模型参数信息对任务进行推理。

一种实施例中，OAM选择了多个训练好的宏基站模型，则任务小区所在宏基站将多个模型进行模型融合，然后再对任务进行推理。

图23是根据一示例性实施例示出的一种模型学习方法中微基站与宏基站进行信令与数据传输的协议和接口原理图。如图23所示，主要涉及微基站与宏基站之间的交互，具体如下：

1a.微基站将发送连接建立请求信令(X2 Setup Request)发送给宏基站，信令指示内容为，请求与目标基站建立连接。1b.宏基站根据微基站发送的连接建立请求信令进行资源分配。1c.宏基站将发送成功建立连接信令(X2 Setup Response)发送给微基站，信令指示内容为，通知对方已成功建立连接。2a.微基站将第一模型训练结果进行打包。2b.微基站将发送训练结果数据包信令发送给宏基站，信令指示内容为，发送训练数据包给接收方。3.宏基站利用AI服务模块进行全局模型训练。4.宏基站将发送打包并发送全局模型训练结果数据包信令发送给微基站，信令指示内容为对全局模型训练结果进行打包并将数据包发送给接收方。5.宏基站将通知是否继续进行训练信令发送给微基站，信令指示内容为通知对方是否继续进行训练。6.宏基站与微基站确认传输完毕。7.宏基站将资源释放信令(Release Resource)发送给微基站，信令指示内容：进行资源释放。

图24是根据一示例性实施例示出的一种模型学习方法中微基站与终端进行信令与数据传输的协议和接口原理图。如图24所示，主要涉及微基站与终端之间的交互，具体如下：

1a.终端将发送建立RRC连接请求信令(RRC Connection Request)发送给微基站，信令指示内容为请求与目标基站建立RRC连接。1b.微基站将发送确认建立RRC连接信令(RRC Connection Setup)发送给终端，信令指示内容：通知接收方同意建立RRC连接。 1c.终端根据微基站发送信令进行无线资源配置。1d.终端将发送完成建立RRC连接信令(RRC Connection Setup Complete)发送给微基站，信令指示内容为通知接收方RRC连接建立完成。2a.终端将本地训练结果(即第二模型训练结果)进行打包。2b.终端将发送本地训练结果数据包信令发送给微基站，信令指示内容为发送本地训练结果数据包给接收方。3.微基站与宏基站协同利用AI服务模块进行模型训练。4.微基站将发送全局模型训练结果信令发送给终端，信令指示内容为发送全局模型训练结果给接收方。5.微基站将通知是否继续训练信令给终端，信令指示内容：通知对方是否继续进行训练。6a.微基站将RRC连接释放请求信令(RRC Connection Release)发送给终端，信令指示内容为请求释放RRC连接。6b.终端将成功释放RRC连接信令(RRC Connection Release Complete)发送给微基站，信令指示内容为通知对方已经成功释放RRC连接。

图25是根据一示例性实施例示出的一种模型学习方法中进行终端切换的协议和接口原理图。如图25所示，主要涉及宏基站、源微基站、目标微基站与终端之间的交互，具体如下：

1.源微基站将发送测量控制信号信令(Measurement Control)发送给终端，信令指示内容：通知对方进行信号强度测量。2.终端将发送测量报告信令(Measurement Reports)发送给源微基站，信令指示内容为发送测量报告给接收方。3.源微基站做出终端切换决策(HO decision)。4a.源微基站将发送切换请求信令(Handover Request)发送给目标微基站，信令指示内容为发送切换请求给接收方。4b.目标微基站将发送切换请求应答信令(Handover Request ack)发送给源微基站，信令指示内容为发送切换请求应答给接收方。5.源微基站将发送包含移动控制信息(Mobility control information)的重配置RRC连接请求信令(RRC Connection Reconfiguration)发送给终端，信令指示内容为发送重配置RRC连接请求给接收方。6.源微基站将发送终端状态信息信令(Early status transfer)发送给目标微基站，信令指示内容为发送终端状态信息给接收方。7.终端接入目标微基站。8.终端将发送RRC重连接配置完成消息信令(RRC Connection reconfiguration complete)发送给目标微基站，信令指示内容为发送RRC重连接配置完成消息给接收方。9.目标微基站将发送切换成功消息信令(Handover success)发送给源微基站，信令指示内容为发送切换成功消息给接收方。10.源微基站将发送切换终端及目标微基站信息信令发送给宏基站，信令指示内容为发送切换终端及目标微基站信息给宏基站。11.宏基站根据源微基站训练任务类型及切换信息决定终端是否继续参与源微基站的训练任务。12.宏基站将发送决定结果信令发送给目标微基站，信令指示内容为发送决定结果给接收方。13.宏基站将发送决定结果信令发送给源微基站，信令指示内容为发送决定结果给接收方。14.目标微基站决定切换终端是否参与自己的联邦学习训练任务。15.目标微基站将发送决定结果信令发送给终端，信令指示内容为发送决定结果给接收方。

基于相同的构思，本公开实施例还提供一种模型学习装置。

可以理解的是，本公开实施例提供的模型学习装置为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。结合本公开实施例中所公开的各示例的单元及算法步骤，本公开实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能，但是这种实现不应认为超出本公开实施例的技术方案的范围。

在本公开一些实施例中，在模型学习装置中，以包括一个宏基站装置、M个微基站装置和N个用户装置，为例进行说明。

其中，用户装置为接入微基站的终端，负责本地数据收集与本地模型训练，并可根据全局模型学习结果对本地模型进行更新。微基站装置负责选择参与模型训练任务的终端及学习模式、对参与模型训练任务的终端进行训练任务分配、汇总终端的本地训练结果并利用AI服务模块进行模型对齐与联邦平均，同时负责终端切换管理及转发宏基站下发的信令给终端。宏基站装置负责与OAM进行交互、对参与训练的微基站装置进行任务分配、汇总微基站装置的训练结果并利用AI服务模块进行模型对齐与全局模型学习，同时在终端发生切换时决定终端是否继续参与训练。

图26是根据一示例性实施例示出的一种模型学习装置框图。参照图26，该模型学习装置100，应用于宏基站，包括发送模块101。

发送模块，用于响应于接收到操作维护管理OAM实体发送的模型训练请求，向第一数量的微基站发送模型训练请求。其中，第一数量的微基站通信覆盖范围在宏基站通信覆盖范围内。

在本公开实施例中，模型训练请求用于触发微基站上报能力信息。装置还包括：确定模块102。

确定模块102，用于响应于接收到微基站发送的能力信息，基于能力信息确定模型结构和模型参数值，并向微基站发送模型结构和模型参数值。模型结构为指示微基站基于模型训练请求训练的模型结构，模型参数值为模型结构的初始参数值。

在本公开实施例中，能力信息包括微基站的数据类型特征。装置还包括：接收模块103。

接收模块103，用于接收第一数量微基站发送的第一数量第一模型训练结果。确定第一数量微基站中不同微基站具有的数据类型特征，并确定第一模型损失函数。基于第一数量微基站中不同微基站具有的数据类型特征进行数据类型特征统一后，以优化第一模型损失函数为目标，对第一数量第一模型训练结果进行第一模型对齐。基于第一模型对齐的结果进行全局模型学习，确定全局模型。

在本公开实施例中，确定模块102，用于响应于全局模型学习的模型学习结果不满足OAM的模型训练请求，将模型学习结果发送至微基站，接收微基站基于模型学习结果重新确定的第一数量第一模型训练结果。并基于全局模型学习的模型学习结果重新确定第一模型损失函数，并以优化重新确定的第一模型损失函数为目标，重新对接收的第一数量第一模型训练结果进行第一模型对齐。基于重新确定的第一模型对齐的结果，进行下一次全局模型学习，重新确定模型学习结果，直到模型学习结果满足模型训练请求，将与满足模型训练请求的模型学习结果对应的模型确定为全局模型。

在本公开实施例中，确定模块102，用于确定微基站第一数量的第一模型训练结果与宏基站上一次全局模型学习得到的模型学习结果之间的第一损失函数，以及第一模型对齐损失函数。基于第一损失函数和第一模型对齐损失函数，确定第一模型损失函数。

在本公开实施例中，确定模块102，用于响应于全局模型学习的模型学习结果满足OAM的模型训练请求，向微基站发送停止模型训练信息。停止训练信息指示微基站停止终端执行模型训练任务。将模型学习结果对应的模型确定为全局模型，并向OAM发送全局模型。

在本公开实施例中，确定模块102还用于响应于在训练模型过程中接收到微基站发送的终端切换信息，基于终端切换信息重新确定执行模型训练任务的终端，并向微基站发送终端的信息。终端切换信息包括退出模型训练的终端和终端重新接入的目标微基站的信息。终端切换信息用于宏基站重新确定执行模型训练任务的终端。

图27是根据一示例性实施例示出的一种模型学习装置框图。参照图27，该模型学习装置200，应用于微基站，包括接收模块201和发送模块202。

接收模块201，用于接收宏基站发送的模型训练请求。发送模块202，用于向终端发送模型训练请求。其中，接收模型训练请求的微基站的数量为第一数量。第一数量的微基站通信覆盖范围在宏基站通信覆盖范围内。

在本公开实施例中，模型训练请求用于触发终端上报终端的通信条件和数据特征，接收模块201还用于接收终端发送的通信条件和数据类型特征。对终端的通信条件和数据特性，以及微基站的通信条件和数据特性进行处理，得到能力信息，并向能力信息发送至宏基站。其中，能力信息用于宏基站确定模型结构和模型参数值。

在本公开实施例中，接收模块201还用于：接收模型结构和模型参数值。模型结构为指示微基站基于模型训练请求训练的模型结构，模型参数值为模型结构的初始参数值。基于终端的通信条件和数据类型特征以及模型结构和模型参数值，确定执行模型训练的第二数量终端。向第二数量终端发送调度信息。调度信息包括模型结构和模型参数值以及指示终端进行模型训练的指示信息。

在本公开实施例中，装置还包括：确定模块203。

接收模块201，用于接收第二数量终端发送的第二数量第二模型训练结果。确定模块203，用于确定第二数量终端中不同终端具有的数据类型特征，并确定第二模型损失函数。基于第二数量终端中不同终端具有的数据类型特征进行数据类型特征统一后，以优化第二模型损失函数为目标，对第二数量第二模型训练结果进行第二模型对齐。基于第二模型对齐的结果进行联邦聚合，得到第一模型训练结果。

在本公开实施例中，确定模块203，用于响应于接收到宏基站发送的继续训练请求，并接收到宏基站发送的模型学习结果。基于模型学习结果更新终端的模型结构和模型参数值，并向终端发送继续训练调度信息。响应于重新接收到第二数量第二模型训练结果，基于第一模型训练结果重新确定第二模型损失函数，并以优化重新确定的第二模型损失函数为目标，对第二数量第二模型训练结果进行第二模型对齐。基于重新确定的第二模型对齐的结果，进行下一次联邦聚合，重新确定第一模型训练结果。

在本公开实施例中，确定模块203，用于确定终端第二数量第二模型训练结果与微基站上一次联邦聚合得到的第一模型训练结果之间的第二损失函数，以及第二模型对齐损失函数。基于第二损失函数和第二模型对齐损失函数，确定第二模型损失函数。

在本公开实施例中，接收模块201还用于：接收宏基站发送的停止模型训练信息。停止训练信息指示微基站停止终端执行模型训练任务。基于停止模型训练信息指示终端停止执行模型训练任务。

在本公开实施例中，发送模块202还用于：发送终端切换信息。终端切换信息包括退出模型训练的终端和终端重新接入的目标微基站的信息。终端切换信息用于宏基站重新确定执行模型训练任务的终端。响应于接收到宏基站发送的终端信息，重新确定执行模型训练任务的终端，并向终端发送模型训练任务。

在本公开实施例中，发送模块202，用于响应于终端信息中包括上一次执行模型训练任务的终端，确定终端切换后的目标微基站，由目标微基站向终端发送模型训练任务。和/或

响应于终端信息中未包括上一次执行模型训练任务的终端，确定将终端不再执行模型训练任务，并确定新增执行模型训练任务的终端，向新增执行模型训练任务的终端发送模型训练任务。关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图28是根据一示例性实施例示出的一种用于模型学习的装置300的框图。例如，装置300可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图28，装置300可以包括以下一个或多个组件：处理组件302，存储器304，电力组件306，多媒体组件308，音频组件310，输入/输出(I/O)接口312，传感器组件314，以及通信组件316。

处理组件302通常控制装置300的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件302可以包括一个或多个处理器320来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件302可以包括一个或多个模块，便于处理组件302和其他组件之间的交互。例如，处理组件302可以包括多媒体模块，以方便多媒体组件308和处理组件302之间的交互。

存储器304被配置为存储各种类型的数据以支持在装置300的操作。这些数据的示例包括用于在装置300上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电力组件306为装置300的各种组件提供电力。电力组件306可以包括电源管理系统，一个或多个电源，及其他与为装置300生成、管理和分配电力相关联的组件。

多媒体组件308包括在所述装置300和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件308包括一个前置摄像头和/或后置摄像头。当装置300处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件310被配置为输出和/或输入音频信号。例如，音频组件310包括一个麦克风(MIC)，当装置300处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器304或经由通信组件316发送。在一些实施例中，音频组件310还包括一个扬声器，用于输出音频信号。

I/O接口312为处理组件302和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件314包括一个或多个传感器，用于为装置300提供各个方面的状态评估。例如，传感器组件314可以检测到装置300的打开/关闭状态，组件的相对定位，例如所述组件为装置300的显示器和小键盘，传感器组件314还可以检测装置300或装置300一个组件的位置改变，用户与装置300接触的存在或不存在，装置300方位或加速/减速和装置300的温度变化。传感器组件314可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件314还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件314还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件316被配置为便于装置300和其他设备之间有线或无线方式的通信。装置300可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件316经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件316还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器304，上述指令可由装置300的处理器320执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

图29是根据一示例性实施例示出的一种用于模型学习的装置400的框图。例如，装置400可以被提供为一服务器。参照图29，装置400包括处理组件422，其进一步包括一个或多个处理器，以及由存储器432所代表的存储器资源，用于存储可由处理组件422的执行的指令，例如应用程序。存储器432中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件422被配置为执行指令，以执行上述方法。

装置400还可以包括一个电源组件426被配置为执行装置400的电源管理，一个有线或无线网络接口450被配置为将装置400连接到网络，和一个输入输出(I/O)接口458。装置400可以操作基于存储在存储器432的操作系统，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM或类似。

进一步可以理解的是，本公开中“多个”是指两个或两个以上，其它量词与之类似。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

进一步可以理解的是，术语“第一”、“第二”等用于描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开，并不表示特定的顺序或者重要程度。实际上，“第一”、“第二”等表述完全可以互换使用。例如，在不脱离本公开范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。

进一步可以理解的是，本公开实施例中尽管在附图中以特定的顺序描述操作，但是不应将其理解为要求按照所示的特定顺序或是串行顺序来执行这些操作，或是要求执行全部所示的操作以得到期望的结果。在特定环境中，多任务和并行处理可能是有利的。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

一种模型学习方法，其特征在于，应用于宏基站，包括：

响应于接收到操作维护管理OAM实体发送的模型训练请求，向第一数量的微基站发送所述模型训练请求；

其中，所述第一数量的微基站通信覆盖范围在所述宏基站通信覆盖范围内。
根据权利要求1所述的模型学习方法，其特征在于，所述模型训练请求用于触发微基站上报能力信息；所述向第一数量的微基站发送所述模型训练请求之后，所述方法还包括：

响应于接收到微基站发送的能力信息，基于所述能力信息确定模型结构和模型参数值，并向微基站发送所述模型结构和模型参数值；所述模型结构为指示微基站基于所述模型训练请求训练的模型结构，所述模型参数值为所述模型结构的初始参数值。
根据权利要求2所述的模型学习方法，其特征在于，所述能力信息包括微基站的数据类型特征；所述方法还包括：

接收第一数量微基站发送的第一数量第一模型训练结果；

确定所述第一数量微基站中不同微基站具有的所述数据类型特征，并确定第一模型损失函数；

基于所述第一数量微基站中不同微基站具有的数据类型特征进行数据类型特征统一后，以优化所述第一模型损失函数为目标，对所述第一数量第一模型训练结果进行第一模型对齐；

基于第一模型对齐的结果进行全局模型学习，确定全局模型。
根据权利要求3所述的模型学习方法，其特征在于，所述基于第一模型对齐的结果进行全局模型学习，确定全局模型，包括：

响应于所述全局模型学习的模型学习结果不满足OAM的模型训练请求，将所述模型学习结果发送至微基站，接收微基站基于所述模型学习结果重新确定的第一数量第一模型训练结果；并

基于所述全局模型学习的模型学习结果重新确定所述第一模型损失函数，并以优化重新确定的第一模型损失函数为目标，重新对接收的所述第一数量第一模型训练结果进行第一模型对齐；

基于重新确定的第一模型对齐的结果，进行下一次全局模型学习，重新确定模型学习结果，直到所述模型学习结果满足所述模型训练请求，将与满足所述模型训练请求的模型学习结果对应的模型确定为全局模型。
根据权利要求4所述的模型学习方法，其特征在于，确定第一模型损失函数，包括：

确定微基站第一数量的第一模型训练结果与所述宏基站上一次全局模型学习得到的模型学习结果之间的第一损失函数，以及第一模型对齐损失函数；

基于所述第一损失函数和第一模型对齐损失函数，确定第一模型损失函数。
根据权利要求3所述的模型学习方法，其特征在于，所述基于第一模型对齐结果进行全局模型学习，确定全局模型，包括：

响应于所述全局模型学习的模型学习结果满足OAM的模型训练请求，向微基站发送停止模型训练信息；所述停止训练信息指示微基站停止终端执行模型训练任务；

将所述模型学习结果对应的模型确定为全局模型，并向所述OAM发送所述全局模型。
根据权利要求1所述的模型学习方法，其特征在于，所述方法还包括：

响应于在训练模型过程中接收到微基站发送的终端切换信息，基于所述终端切换信息重新确定执行模型训练任务的终端，并向微基站发送所述终端的信息；

所述终端切换信息包括退出模型训练的终端和所述终端重新接入的目标微基站的信息；所述终端切换信息用于宏基站重新确定执行模型训练任务的终端。
一种模型学习方法，其特征在于，应用于微基站，包括：

接收宏基站发送的模型训练请求；

向终端发送所述模型训练请求；

其中，所述接收模型训练请求的微基站的数量为第一数量；所述第一数量的微基站通信覆盖范围在所述宏基站通信覆盖范围内。
根据权利要求8所述的模型学习方法，其特征在于，所述模型训练请求用于触发终端上报终端的通信条件和数据特征，所述向终端发送所述模型训练请求之后，所述模型学习方法还包括：

接收终端发送的通信条件和数据类型特征；

对所述终端的通信条件和数据特性，以及所述微基站的通信条件和数据特性进行处理，得到能力信息，并向所述能力信息发送至宏基站；

其中，所述能力信息用于宏基站确定模型结构和模型参数值。
根据权利要求9所述的模型学习方法，其特征在于，所述方法还包括：

接收模型结构和模型参数值；所述模型结构为指示微基站基于所述模型训练请求训练的模型结构，所述模型参数值为所述模型结构的初始参数值；

基于所述终端的通信条件和数据类型特征以及所述模型结构和模型参数值，确定执行模型训练的第二数量终端；

向所述第二数量终端发送调度信息；所述调度信息包括模型结构和模型参数值以及指示终端进行模型训练的指示信息。
根据权利要求10所述的模型学习方法，其特征在于，所述方法还包括：

接收第二数量终端发送的第二数量第二模型训练结果；

确定所述第二数量终端中不同终端具有的数据类型特征，并确定第二模型损失函数；

基于所述第二数量终端中不同终端具有的数据类型特征进行数据类型特征统一后，以优化所述第二模型损失函数为目标，对所述第二数量第二模型训练结果进行第二模型对齐；

基于第二模型对齐的结果进行联邦聚合，得到第一模型训练结果。
根据权利要求11所述的模型学习方法，其特征在于，所述基于第二模型对齐的结果进行联邦聚合，得到第一模型训练结果，包括：

响应于接收到宏基站发送的继续训练请求，并接收到宏基站发送的模型学习结果；

基于所述模型学习结果更新终端的模型结构和模型参数值，并向终端发送继续训练调度信息；

响应于重新接收到第二数量第二模型训练结果，基于所述第一模型训练结果重新确定第二模型损失函数，并以优化所述重新确定的第二模型损失函数为目标，对所述第二数量第二模型训练结果进行第二模型对齐；

基于重新确定的第二模型对齐的结果，进行下一次联邦聚合，重新确定第一模型训练结果。
根据权利要求12所述的模型学习方法，其特征在于，确定第二模型损失函数，包括：

确定终端第二数量第二模型训练结果与所述微基站上一次联邦聚合得到的第一模型训练结果之间的第二损失函数，以及第二模型对齐损失函数；

基于所述第二损失函数和第二模型对齐损失函数，确定第二模型损失函数。
根据权利要求12所述的模型学习方法，其特征在于，所述方法还包括：

接收宏基站发送的停止模型训练信息；所述停止训练信息指示微基站停止终端执行模型训练任务；

基于所述停止模型训练信息指示终端停止执行模型训练任务。
根据权利要求8所述的模型学习方法，其特征在于，所述方法还包括：

发送终端切换信息；所述终端切换信息包括退出模型训练的终端和终端重新接入的目标微基站的信息；所述终端切换信息用于宏基站重新确定执行模型训练任务的终端；

响应于接收到宏基站发送的终端信息，重新确定执行模型训练任务的终端，并向终端发送模型训练任务。
根据权利要求15所述的模型学习方法，其特征在于，所述向终端发送模型训练任务，包括：

响应于所述终端信息中包括上一次执行模型训练任务的终端，确定所述终端切换后的目标微基站，由所述目标微基站向终端发送所述模型训练任务；和/或

响应于所述终端信息中未包括上一次执行模型训练任务的终端，确定将所述终端不再执行所述模型训练任务，并确定新增执行模型训练任务的终端，向新增执行模型训练任务的终端发送模型训练任务。
一种模型学习装置，其特征在于，应用于宏基站，包括：

发送模块，用于响应于接收到操作维护管理OAM实体发送的模型训练请求，向第一数量的微基站发送所述模型训练请求；

其中，所述第一数量的微基站通信覆盖范围在所述宏基站通信覆盖范围内。
一种模型学习装置，其特征在于，应用于微基站，包括：

接收模块，用于接收宏基站发送的模型训练请求；

发送模块向终端发送所述模型训练请求；

其中，所述接收模型训练请求的微基站的数量为第一数量；所述第一数量的微基站通信覆盖范围在所述宏基站通信覆盖范围内。
一种模型学习装置，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：执行权利要求1-7中任意一项所述的模型学习方法，或执行权利要求8-16中任意一项所述的模型学习方法。
一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行权利要求1-7中任意一项所述的模型学习方法，或使得移动终端能够执行权利要求8-16中任意一项所述的模型学习方法。