WO2022061784A1

WO2022061784A1 - 通信方法、装置及系统

Info

Publication number: WO2022061784A1
Application number: PCT/CN2020/117940
Authority: WO
Inventors: 黄谢田; 秦东润; 王楚捷
Original assignee: 华为技术有限公司
Priority date: 2020-09-25
Filing date: 2020-09-25
Publication date: 2022-03-31
Also published as: EP4207860A1; CA3193840A1; EP4207860A4; US20230224752A1; CN115699848A; WO2022062362A1; AU2021347699A1

Abstract

本申请实施例提供通信方法、装置及系统。该方法包括：第一数据分析网元接收来自第二数据分析网元的第一信息，第一信息包括模型的性能报告；第一数据分析网元根据模型的性能报告更新模型的第一模型信息，获得模型的第二模型信息；第一数据分析网元向第二数据分析网元发送第二信息，第二信息包括第二模型信息。该方案，当第二数据分析网元无法完成模型训练时，向第一数据分析网元发送模型的性能报告，第一数据分析网元根据该模型的性能报告对模型进行更新得到模型的第二模型信息，并将第二模型信息发送给第二数据分析网元，使第二数据分析网元基于第二模型信息更新模型，从而实现在模型性能下降时及时对模型进行训练和更新，进而可以保证模型性能。

Description

通信方法、装置及系统

技术领域

本申请涉及通信技术领域，尤其涉及通信方法、装置及系统。

背景技术

机器学习模型的训练通常是通过学习某一组输入特征与输出目标之间的映射来进行的，通过优化某些损失函数来使得机器学习模型的输出结果(即预测值)与实际结果(即标签值/真实值)之间的误差最小化。当训练出最优模型后，利用该模型的输出对未来的情况进行预测。在理想情况下，假定未来将使用到的数据与模型训练期间所使用的数据类似，具体来说，可能假设训练时的输入特征和预测时的输入特征的分布保持恒定。但是实际中这种假设通常不成立，数据的特征会随着时间的推移由于网络部署变化、应用层业务要求变化、网络实际用户分布变化等而变化，因此，模型的性能(即泛化能力)会随着时间推移逐渐下降。具体的表现可能是，模型的准确率降低，即模型的预测值与真实值之间的误差变大。

以数据分析网元的训练功能和推断功能分离的场景为例，支持训练功能的数据分析网元(简称训练数据分析网元)无法感知支持推断功能的数据分析网元(简称推断数据分析网元)中的模型使用效果，且推断数据分析网元没有能力进行模型训练。因此，当模型性能下降时，若推断数据分析网元继续使用性能下降的模型进行数据分析，会导致数据分析结果不准确。

发明内容

本申请提供通信方法、装置及系统，用以实现在模型性能下降时及时对模型进行再次训练，从而保证模型性能。

第一方面，本申请实施例提供一种通信方法，包括：第一数据分析网元接收来自第二数据分析网元的第一信息，所述第一信息包括模型的性能报告，所述模型的性能报告用于指示所述模型的性能的评估结果，或者，所述模型的性能报告用于指示所述模型的性能的评估结果不满足所述模型的性能指标的要求；所述第一数据分析网元根据所述模型的性能报告更新所述模型的第一模型信息，获得所述模型的第二模型信息；所述第一数据分析网元向所述第二数据分析网元发送第二信息，所述第二信息包括所述第二模型信息。

基于上述方案，当第二数据分析网元无法完成模型训练时，则第二数据分析网元可以向第一数据分析网元发送模型的性能报告，从而第一数据分析网元可以根据该模型的性能报告对模型进行更新，得到模型的第二模型信息，并将第二模型信息发送给第二数据分析网元，使得第二数据分析网元可以基于第二模型信息更新模型，从而可以实现在模型性能下降时及时对模型进行训练，进而可以保证模型性能。

在一种可能的实现方法中，所述第一数据分析网元向所述第二数据分析网元发送第三信息，所述第三信息包括所述模型的性能指标，所述模型的性能指标用于获取所述模型的性能的评估结果。

基于上述方案，第一数据分析网元可以预先向第二数据分析网元发送模型的性能指标，从而使得第二数据分析网元基于该模型的性能指标生成模型的性能报告，有助于帮助第一数据分析网元判断是否启动模型训练，并提升模型训练后的模型性能。

在一种可能的实现方法中，所述第一数据分析网元向第三数据分析网元发送所述第二信息。

基于上述方案，第一数据分析网元不仅可以向第二数据分析网元发送第二信息，还可以向其它使用该模型的网元，如第三数据分析网元发送该第二信息，使得第三数据分析网元也可以利用第二模型信息更新模型，提升模型使用效果。

在一种可能的实现方法中，所述第一数据分析网元接收来自第二数据分析网元的第一信息，包括：所述第一数据分析网元通过网络存储网元接收来自所述第二数据分析网元的所述第一信息。所述第一数据分析网元向所述第二数据分析网元发送第二信息，包括：所述第一数据分析网元通过网络存储网元向所述第二数据分析网元发送所述第二信息。

基于上述方案，可以通过网络存储网元作为中间网元，实现第一数据分析网元与第二数据分析网元之间的模型更新交互，这可以适用于第一数据分析网元与第二数据分析网元之间没有接口的场景。

第二方面，本申请实施例提供一种通信方法，包括：第二数据分析网元向第一数据分析网元发送第一信息，所述第一信息包括模型的性能报告，所述模型的性能报告用于指示所述模型的性能的评估结果，或者，所述模型的性能报告用于指示所述模型的性能的评估结果不满足所述模型的性能指标的要求；所述第二数据分析网元接收来自所述第一数据分析网元的第二信息，所述第二信息包括所述模型的第二模型信息，所述第二模型信息是根据所述模型的性能报告更新所述模型的第一模型信息得到的；所述第二数据分析网元根据所述第二模型信息，更新所述模型。

基于上述方案，当第二数据分析网元无法完成模型训练时，则第二数据分析网元可以向第一数据分析网元发送模型的性能报告，从而第一数据分析网元可以根据该模型的性能报告对模型进行更新，得到模型的第二模型信息，并将第二模型信息发送给第二数据分析网元，使得第二数据分析网元可以基于第二模型信息更新模型，从而可以实现在模型性能下降时及时对模型进行再次训练，进而可以保证模型性能。

在一种可能的实现方法中，所述第二数据分析网元接收来自所述第一数据分析网元的第三信息，所述第三信息包括所述模型的性能指标，所述模型的性能指标用于获取所述模型的性能的评估结果。

基于上述方案，第一数据分析网元可以预先向第二数据分析网元发送模型的性能指标，从而使得第二数据分析网元基于该模型的性能指标生成模型的性能报告，有助于帮助第一数据分析网元判断是否启动模型训练，并提升模型训练的准确性。

在一种可能的实现方法中，所述第二数据分析网元向第一数据分析网元发送第一信息，包括：所述第二数据分析网元通过网络存储网元向所述第一数据分析网元发送所述第一信息；所述第二数据分析网元接收来自所述第一数据分析网元的第二信息，包括：所述第二数据分析网元通过网络存储网元接收来自所述第一数据分析网元的第二信息。

基于上述第一方面、或第一方面的任意实现方法、或第二方面、或第二方面的任意实现方法：

在一种可能的实现方法中，所述模型性能指标包括以下一项或多项：精确率、准确率、错误率、召回率、F1分数、均方误差、均方根误差、均方根对数误差、平均绝对误差、模型推理时长、模型鲁棒性、模型可扩展性、模型可解释性。

在一种可能的实现方法中，所述第三信息还包括以下一项或多项：分析类型标识、所述模型的标识、子模型的标识，所述分析类型标识用于指示所述模型的分析类型。

在一种可能的实现方法中，所述第三信息还包括以下一项或多项：上报周期、门限信息，所述上报周期用于指示上报所述模型的性能报告的时间，所述门限信息用于指示上报所述模型的性能报告的条件。

基于上述方案，第一数据分析网元可以指示第二数据分析网元上报模型的性能报告的时间和/或条件，从而实现有条件的上报，可以节约资源开销。

在一种可能的实现方法中，所述第一信息还包括所述模型的性能报告对应的以下一项或多项信息：时间、区域、切片。

基于上述方案，当第一信息还包括模型的性能报告对应的时间、区域或切片，则可以提升第一数据分析网元执行模型再次训练后的模型性能。

在一种可能的实现方法中，所述第二信息还包括以下一项或多项：所述模型的标识、子模型的标识、所述模型的性能评估结果、所述模型的性能评估结果对应的硬件能力信息、所述模型的大小、所述模型的推理时长。

基于上述方案，第一数据分析网元将模型的性能评估结果、模型的性能评估结果对应的硬件能力信息、模型的大小或模型的推理时长中的一个或多个发送给第二数据分析网元，有助于第二数据分析网元确定是否使用该模型，进而可以减少资源开销的浪费。

第三方面，本申请实施例提供一种通信方法，包括：第一数据分析网元将模型的第一信息更新为所述模型的第二信息；所述第一数据分析网元确定所述模型的第二信息的索引信息，所述第二信息的索引信息包括第一标识信息，所述第一标识信息用于指示所述模型的第二信息；所述第一数据分析网元向所述第二数据分析网元发送所述第二信息的索引信息，所述第二信息的索引信息用于所述模型的第二信息的获取。其中，模型的第二信息的索引信息，也可以称为第二信息对应的模型索引信息。

基于上述方案，第一数据分析网元对模型进行更新，得到模型的第二信息后，可以将该第二信息的索引信息发送给第二数据分析网元，从而第二数据分析网元可以根据该索引信息获取到新的模型信息，即该第二信息，进而第二数据分析网元可以根据新的模型信息更新模型，实现模型性能提升。

在一种可能的实现方法中，所述第二信息的索引信息还包括以下一项或多项：所述模型对应的分析类型标识、所述模型的标识、所述模型的第二信息的版本信息。

在一种可能的实现方法中，所述第一数据分析网元从所述第二数据分析网元接收所述模型的第一信息的索引信息，所述第一信息的索引信息包括第二标识信息，所述第二标识信息用于指示所述模型的第一信息；所述第一数据分析网元根据所述第一信息的索引信息获取所述模型的第一信息。

在一种可能的实现方法中，所述第一信息的索引信息还包括以下一项或多项：所述模型对应的分析类型标识、所述模型的标识、所述模型的第一信息的版本信息。

在一种可能的实现方法中，第一数据分析网元将模型的第一信息更新为所述模型的第二信息，包括：所述第一数据分析网元从所述第二数据分析网元获取第一请求，所述第一请求用于更新所述模型的第一信息，所述第一请求包括所述模型的第一信息的索引信息；所述第一数据分析网元根据所述第一信息的索引信息获取所述模型的第一信息；所述第一数据分析网元更新所述模型的第一信息，得到所述模型的第二信息。

在一种可能的实现方法中，第一数据分析网元从第二数据分析网元接收模型的第一信息的索引信息，包括：所述第一数据分析网元向所述第二数据分析网元发送第二请求，所述第二请求用于请求所述模型的第一信息的索引信息，所述第二请求包括所述模型对应的分析类型标识；所述第一数据分析网元从所述第二数据分析网元接收第二响应，所述第二响应包括所述模型的第一信息的索引信息。

在一种可能的实现方法中，所述第一数据分析网元通过网络存储网元从第二数据分析网元接收所述模型的第一信息的索引信息。

在一种可能的实现方法中，所述第一数据分析网元通过网络存储网元向第二数据分析网元发送所述模型的第二信息的索引信息。

在一种可能的实现方法中，所述第一数据分析网元为分布式学习中的客户端数据分析网元，所述第二数据分析网元为分布式学习中的服务端数据分析网元。

在一种可能的实现方法中，所述分布式学习为联邦学习。

在一种可能的实现方法中，所述第一数据分析网元为支持推理功能的数据分析网元，所述第二数据分析网元为支持训练功能的数据分析网元。

第四方面，本申请实施例提供一种通信装置，该装置可以是数据分析网元，还可以是用于数据分析网元的芯片。该装置具有实现上述第一方面至第三方面、或第一方面至第三方面的各可能的实现方法的功能。该功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。

第五方面，本申请实施例提供一种通信装置，包括处理器和存储器；该存储器用于存储计算机执行指令，当该装置运行时，该处理器执行该存储器存储的该计算机执行指令，以使该装置执行如上述第一方面至第三方面的方法及第一方面至第三方面的各可能的实现方法中的任意方法。

第六方面，本申请实施例提供一种通信装置，包括用于执行上述第一方面至第三方面的方法及第一方面至第三方面的各可能的实现方法中的任意方法的各个步骤的单元或手段(means)。

第七方面，本申请实施例提供一种通信装置，包括处理器和接口电路，所述处理器用于通过接口电路与其它装置通信，并执行上述第一方面至第三方面的方法及第一方面至第三方面的各可能的实现方法中的任意方法。该处理器包括一个或多个。

第八方面，本申请实施例提供一种通信装置，包括处理器，用于与存储器相连，用于调用所述存储器中存储的程序，以执行上述第一方面至第三方面的方法及第一方面至第三方面的各可能的实现方法中的任意方法。该存储器可以位于该装置之内，也可以位于该装置之外。且该处理器包括一个或多个。

第九方面，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得处理器执行上述第一方面至第三方面的方法及第一方面至第三方面的各可能的实现方法中的任意方法。

第十方面，本申请实施例还提供一种计算机程序产品，该计算机产品包括计算机程序，当计算机程序运行时，使得上述第一方面至第三方面的方法及第一方面至第三方面的各可能的实现方法中的任意方法。

第十一方面，本申请实施例还提供一种芯片系统，包括：处理器，用于执行上述第一方面至第三方面的方法及第一方面至第三方面的各可能的实现方法中的任意方法。

第十二方面，本申请实施例还提供一种通信系统，包括：用于执行上述第一方面或第一方面的任意实现方法的第一数据分析网元，和用于执行上述第二方面或第二方面的任意实现方法的第二数据分析网元。

附图说明

图1为5G网络架构示意图；

图2为5G网络中的NF注册/发现/更新流程示意图；

图3为训练和推断分离架构下的训练NWDAF和推断NWDAF的工作流程示意图；

图4为本申请实施例适用的网络架构示意图；

图5至图12为本申请实施例提供的训练-推断分离场景下保证模型有效性的八种方法示意图；

图13为本申请实施例提供的一种通信方法示意图；

图14(a)为横向联邦学习的训练过程；

图14(b)为本申请实施例提供的又一种通信方法示意图；

图15为本申请实施例提供的一种通信装置示意图；

图16为本申请实施例提供的又一种通信装置示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述。方法实施例中的具体操作方法也可以应用于装置实施例或系统实施例中。其中，在本申请的描述中，除非另有说明，“多个”的含义是两个或两个以上。

无线机器学习模型驱动网络架构(wireless Machine Learning-based Network，wMLN)主要解决机器学习模型在无线网络中的生命周期管理问题。该网络架构中的模型训练功能和模型推断功能是与机器学习模型紧密相关的两个核心功能模块。模型训练功能对计算能力要求较高，且需要较大的数据量，通常需要部署在算力和数据强大的集中网元。考虑到推断实时性等要求，模型推断功能通常部署在靠近业务功能的本地网元中，以减少传输和处理时延。因此，模型训练功能和推断功能分离是一种典型的部署场景。

使能网络自动化(enabler of Network Automation，eNA)架构是一个基于网络数据分析功能(Network Data Analytics Function，NWDAF)的智能网络架构。如图1所示，NWDAF是第三代合作伙伴计划(3rd generation partnership project，3GPP)引入的标准化网元，主要可以用于收集网络数据(包括终端数据、基站数据、传输网数据、核心网数据、网管数据以及第三方应用数据中的一种或者多种)，并提供网络数据分析服务，可以输出数据分析结果，供网络、网管及应用执行策略决策使用。NWDAF可以利用机器学习模型进行数据分析。3GPP Release 17中NWDAF的功能被分解，包括数据收集功能、模型训练功能以及模型推断功能。在训练功能和推断功能分离的场景下，同一模型的训练功能和推断功能分开部署在不同NWDAF实例中，部署训练功能的NWDAF(简称为训练NWDAF)可以提供训练后的模型，部署推断功能的NWDAF(简称为推断NWDAF)通过获取训练NWDAF提供的模型进行模型推断，提供数据分析服务。

图1所示的5G网络架构中可包括三部分，分别是终端设备部分、数据网络(data network，DN)和运营商网络部分。下面对其中的部分网元的功能进行简单介绍说明。

其中，运营商网络可包括以下网元中的一个或多个：鉴权服务器功能(Authentication Server Function，AUSF)网元、网络开放功能(network exposure function，NEF)网元、策略控制功能(Policy Control Function，PCF)网元、统一数据管理(unified data management，UDM)、统一数据库(Unified Data Repository，UDR)、网络存储功能(Network Repository Function，NRF)网元、应用功能(Application Function，AF)网元、接入与移动性管理功能(Access and Mobility Management Function，AMF)网元、会话管理功能(session management function，SMF)网元、RAN以及用户面功能(user plane function，UPF)网元、NWDAF网元等。上述运营商网络中，除无线接入网部分之外的部分可以称为核心网络部分。

在具体实现中，本申请实施例中的终端设备，可以是用于实现无线通信功能的设备。其中，终端设备可以是5G网络或者未来演进的公共陆地移动网络(public land mobile network，PLMN)中的用户设备(user equipment，UE)、接入终端、终端单元、终端站、移动站、移动台、远方站、远程终端、移动设备、无线通信设备、终端代理或终端装置等。接入终端可以是蜂窝电话、无绳电话、会话启动协议(session initiation protocol，SIP)电话、无线本地环路(wireless local loop，WLL)站、个人数字助理(personal digital assistant，PDA)、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、车载设备或可穿戴设备，虚拟现实(virtual reality，VR)终端设备、增强现实(augmented reality，AR)终端设备、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等。终端可以是移动的，也可以是固定的。

上述终端设备可通过运营商网络提供的接口(例如N1等)与运营商网络建立连接，使用运营商网络提供的数据和/或语音等服务。终端设备还可通过运营商网络访问DN，使用DN上部署的运营商业务，和/或第三方提供的业务。其中，上述第三方可为运营商网络和终端设备之外的服务方，可为终端设备提供其他数据和/或语音等服务。其中，上述第三方的具体表现形式，具体可根据实际应用场景确定，在此不做限制。

RAN作为接入网网元是运营商网络的子网络，是运营商网络中业务节点与终端设备之间的实施系统。终端设备要接入运营商网络，首先是经过RAN，进而可通过RAN与运营商网络的业务节点连接。本申请中的RAN设备，是一种为终端设备提供无线通信功能的设备，RAN设备也称为接入网设备。本申请中的RAN设备包括但不限于：5G中的下一代基站(g nodeB，gNB)、演进型节点B(evolved node B，eNB)、无线网络控制器(radio network controller，RNC)、节点B(node B，NB)、基站控制器(base station controller，BSC)、基站收发台(base transceiver station，BTS)、家庭基站(例如，home evolved nodeB，或home node B，HNB)、基带单元(baseBand unit，BBU)、传输点(transmitting and receiving point，TRP)、发射点(transmitting point，TP)、移动交换中心等。

AMF网元，主要进行移动性管理、接入鉴权/授权等功能。此外，还负责在UE与PCF间传递用户策略。

SMF网元，主要进行会话管理、PCF下发控制策略的执行、UPF的选择、UE互联网协议(internet protocol，IP)地址分配等功能。

UPF网元，作为和数据网络的接口UPF，完成用户面数据转发、基于会话/流级的计费统计，带宽限制等功能。

UDM网元，主要负责管理签约数据、用户接入授权等功能。

UDR，主要负责签约数据、策略数据、应用数据等类型数据的存取功能。

NEF网元，主要用于支持能力和事件的开放。

AF网元，主要传递应用侧对网络侧的需求，例如，服务质量(Quality of Service，QoS)需求或用户状态事件订阅等。AF可以是第三方功能实体，也可以是运营商部署的应用服务，如IP多媒体子系统(IP Multimedia Subsystem，IMS)语音呼叫业务。

PCF网元，主要负责针对会话、业务流级别进行计费、QoS带宽保障及移动性管理、UE策略决策等策略控制功能。

NRF网元，可用于提供网元发现功能，基于其他网元的请求，提供网元类型对应的网元信息。NRF还提供网元管理服务，如网元注册、更新、去注册以及网元状态订阅和推送等。

AUSF网元：主要负责对用户进行鉴权，以确定是否允许用户或设备接入网络。

DN，是位于运营商网络之外的网络，运营商网络可以接入多个DN，DN上可部署多种业务，可为终端设备提供数据和/或语音等服务。例如，DN是某智能工厂的私有网络，智能工厂安装在车间的传感器可为终端设备，DN中部署了传感器的控制服务器，控制服务器可为传感器提供服务。传感器可与控制服务器通信，获取控制服务器的指令，根据指令将采集的传感器数据传送给控制服务器等。又例如，DN是某公司的内部办公网络，该公司员工的手机或者电脑可为终端设备，员工的手机或者电脑可以访问公司内部办公网络上的信息、数据资源等。

图1中Nnwdaf、Nausf、Nnef、Npcf、Nudm、Naf、Namf、Nsmf、N1、N2、N3、N4，以及N6为接口序列号。这些接口序列号的含义可参见3GPP标准协议中定义的含义，在此不做限制。

需要说明的是，本申请实施例中，数据分析网元可以是图1所示的NWDAF网元，也可以是未来通信系统中具有上述NWDAF网元的功能的其它网元。网络存储网元可以是图1所示的NRF网元，也可以是未来通信系统中具有上述NRF网元的功能的其它网元。为便于说明，本申请实施例中，以数据分析网元为NWDAF网元，网络存储网元为NRF网元为例进行说明。并且，将NWDAF网元进一步划分为训练NWDAF网元和推断NWDAF网元。

如图2所示，为5G网络中的NF注册/发现/更新流程示意图。5G网络中的NRF主要用于网络功能(Network Function，NF)的管理，这里的网络功能比如可以是SMF、AMF、NEF、AUSF、NWDAF、PCF等等。NRF支持的功能包括：

1)NF注册/更新/去注册：可用的NF实例(NF instance)将自身可提供的服务注册在NRF中，注册信息通过NF配置文件(NF profile)描述，NF配置文件包括NF类型，NF服务名称，NF地址等信息。NRF负责维护这些NF配置文件。当NF需要更新或删除时，NRF对NF配置文件进行相应的修改和删除。

2)NF发现：NRF接收来自NF实例的NF发现请求，并将发现的NF实例信息提供给请求的NF实例。例如，AMF向NRF请求发现SMF实例。再比如，某个AMF向NRF请求发现另一个AMF实例。

3)NF状态通知：NRF向订阅的NF服务消费者通知新注册/更新/注销的NF实例和其提供的NF服务。

在图2中，NF注册过程包括步骤201至步骤203。

步骤201，NF1向NRF发送NF注册请求，携带NF配置文件。

该NF配置文件包括NF类型，NF服务名称，NF地址等信息。

步骤202，NRF存储该NF配置文件。

步骤203，NRF向NF1发送NF注册响应。

该NF注册响应用于通知NF注册成功。

NF发现过程包括步骤204至步骤205。

步骤204，NF2向NRF发送NF发现请求消息，携带需要查找的NF的条件信息，如NF类型(NF type)。

步骤205，NRF向NF2发送NF发现响应，携带符合条件的NF实例信息，如NF标识(NF ID)或NF IP地址。

NF更新过程包括步骤206a至步骤210。

步骤206a，NF2向NRF发送NF状态订阅请求，携带NF实例，用于请求订阅该NF实例的状态信息。

当NF2向NRF订阅了某个NF实例的状态信息(以下以订阅NF1的状态信息为例)之后，后续NRF发现该NF实例的状态信息发生改变，则NRF会向NF2发送该NF实例的更新的状态信息。

步骤206b，NRF向NF2发送NF状态订阅响应。

该NF状态订阅响应用于通知NF状态订阅成功。

步骤207，NF1向NRF发送NF更新请求，携带更新的NF配置文件。

步骤208，NRF更新NF配置文件。

也即，NRF根据接收到的更新的NF配置文件，对存储的NF配置文件进行更新。

步骤209，NRF向NF1发送NF更新响应。

NF更新响应用于指示NF配置文件更新成功。

步骤210，NRF向NF2发送NF状态改变通知，携带更新的NF配置文件。

也即，NRF向之前订阅过NF1的状态信息的NF2发送给NF状态改变通知。

基于上述过程，可以结合NRF，实现NF的注册，发现以及更新的功能。

需要说明的是，上述NF注册、NF发现、NF更新的过程并不一定是连续发生的，这里只是给出一个流程示例，说明通常发生的先后顺序。

如图3所示，为训练和推断分离架构下的训练NWDAF和推断NWDAF的工作流程示意图。其中，各个网元功能介绍如下：

NRF：负责NF管理，提供的接口服务包括NF注册/去注册/更新，NF状态订阅/通知等。

训练NWDAF：负责模型训练，训练好的模型可被其它NWDAF(如推断NWDAF)使用。

推断NWDAF：负责模型推断，利用推断结果进行数据分析，并输出数据分析结果。

NF：负责某个特定业务功能，可以调用推断NWDAF的服务获取数据分析结果。

该图3所示的流程包括以下步骤：

步骤301，训练NWDAF向NRF发送NF注册请求，携带NF配置文件。

该NF配置文件包括NF类型，NF服务名称(NF Service)，分析类型标识(Analytics ID)等信息。

其中，NF类型可以是NWDAF。

NF服务名称可以是提供模型服务(ModelProvision)。

分析类型标识用于指示训练NWDAF提供的某种特定分析类型，比如可以是Service Experience，Network Performance，UE Mobility等。

步骤302，NRF存储该NF配置文件。

步骤303，NRF向训练NWDAF发送NF注册响应。

该NF注册响应用于通知训练NWDAF注册成功。

步骤304，推断NWDAF向NRF发送NF发现请求，携带NF配置文件。

比如携带的NF配置文件包含NF类型(如NWDAF)，NF服务名称(如ModelProvision)，以及携带Analytics ID，则该NF发现请求用于请求从NRF获取一个对应该Analytics ID的训练NWDAF。

步骤305，NRF向推断NWDAF发送NF发现响应，其中携带NWDAF实例。

其中，携带的NWDAF实例是训练NWDAF的一个实例，可以用训练NWDAF的ID或IP地址来表示。

其中，上述步骤301-步骤305可选步骤。例如，如果推断NWDAF上配置了训练NWDAF的NF配置信息，步骤301-步骤305可以不执行。

步骤306，推断NWDAF向训练NWDAF发送模型请求，其中携带Analytics ID。

其中，推断NWDAF可以基于从NRF获取到的训练NWDAF的ID或IP地址，向训练NWDAF发送模型请求，携带的Analytics ID用于指示请求获取与该Analytics ID对应的模型。

步骤307，训练NWDAF向推断NWDAF发送模型响应，携带模型信息。

其中，模型(也称为机器学习模型，Machine Learning Model，ML Model)信息用于描述根据样本输入数据确定样本输出数据的方法，模型信息中可以包括但不限制于以下信息中的一个或者多个：输入数据对应的特征类型、输入数据对应的特征类型的特征提取方法(函数关系)、输出数据对应的类型(类别标签、连续数值等)、模型使用的算法类型、模型的类别(分类、回归、聚类等)、模型的参数。以猫-狗分类模型为例，该模型可以根据未知动物的形体样本输入数据确定该样本是猫还是狗，这其中，输入数据的特征类型可以是动物体重、毛长、叫声，输入数据对应的特征类型动物体重的提取方法可以是最大最小归一化，输出数据对应的类型为猫或者狗，模型使用的算法类型可以为深度神经网络(deep neural network，DNN)，模型的类别为分类，模型的参数包括但不限于：神经网络的层数、每一层使用的激活函数、每一层激活函数对应的一个或者多个函数参数值。值得说明的是，本发明中所有涉及模型信息(如第一模型信息、第二模型信息等)、模型的信息(如模型的第一信息、模型的第二信息等)都可以参考关于模型信息的描述，其他地方不再赘述。

上述步骤301至步骤307是训练NWDAF提供模型服务的流程。基于该流程，训练NWDAF将NF配置文件注册至NRF，后续推断NWDAF可以从NRF获取到训练NWDAF实例，进而推断NWDAF可以向训练NWDAF请求获取特定类型的模型信息。也即，训练NWDAF可以向推断NWDAF提供模型服务。

步骤308，推断NWDAF向NRF发送NF注册请求，携带NF配置文件。

其中，NF类型可以是NWDAF。

NF服务名称可以是提供分析服务(Analytics)。

步骤309，NRF存储该NF配置文件。

步骤310，NRF向推断NWDAF发送NF注册响应。

该NF注册响应用于通知推断NWDAF注册成功。

步骤311，NF向NRF发送NF发现请求，携带NF配置文件。

该NF指的是一个NF消费者(NF consumer)，比如可以是SMF、AMF或UPF等等。

比如携带的NF配置文件包含NF类型(如NWDAF)，NF服务名称(如ModelProvision)，以及携带Analytics ID，则该NF发现请求用于请求从NRF获取对应该Analytics ID的推断NWDAF。

步骤312，NRF向NF发送NF发现响应，其中携带NWDAF实例。

其中，携带的NWDAF实例是推断NWDAF的一个实例，可以用推断NWDAF的ID或IP地址来表示。

值得说明的是，上述步骤308-步骤312可选执行。例如，如果NF上配置了推断NWDAF的NF配置信息，步骤308-步骤312可以不执行。

步骤313，NF向推断NWDAF发送分析订阅，其中携带Analytics ID。

其中，NF可以基于从NRF获取到的推断NWDAF的ID或IP地址，向推断NWDAF发送分析订阅，携带的Analytics ID用于指示订阅获取与该Analytics ID对应的数据分析结果。

步骤314，推断NWDAF向NF发送分析结果通知，携带数据分析结果。

上述步骤308至步骤314是推断NWDAF提供分析服务的流程。基于该流程，推断NWDAF将NF配置文件注册至NRF，后续NF可以从NRF获取到推断NWDAF实例，进而NF可以向推断NWDAF请求获取特定类型的数据分析结果。也即，推断NWDAF可以向NF提供数据分析服务。

作为一种可替代的实现方法，上述步骤313至步骤314可以使用以下步骤313’至步骤314’替换：

步骤313’，NF向推断NWDAF发送分析请求，其中携带Analytics ID。

其中，NF可以基于从NRF获取到的推断NWDAF的ID或IP地址，向推断NWDAF发送分析订阅，携带的Analytics ID用于指示请求获取与该Analytics ID对应的数据分析结果。

步骤314’，推断NWDAF向NF发送分析结果响应，携带数据分析结果。

该步骤313’至步骤314’是每次需要主动发送分析请求，推断NWDAF才向NF发送数据分析结果，而上述步骤313至步骤314是只需要订阅一次，后续推断NWDAF在产生新的数据分析结果时主动向NF发送数据分析结果。

上述图3所示的模型训练与模型使用过程所存在的问题是：随着时间推移，推断NWDAF本地可以根据推断数据确定推断结果，然后根据推断数据的真实结果以及推断结果确定模型的使用效果(也就是模型性能评估结果)，推断NWDAF根据使用效果确定机器学习模型性能下降，但是训练-推断分离的场景下训练NWDAF无法感知推断NWDAF中的模型使用效果，且推断NWDAF没有能力进行模型训练，因此，现有技术中无法实现在模型性能下降时进行再训练和模型更新，也就无法保证模型在运行过程中性能一直良好。如果推断NWDAF继续使用性能下降的模型进行数据分析，可能导致数据分析结果不准确，影响模型性能。

为解决上述问题，本申请实施例提出建立一种模型性能监控和反馈机制，对推断NWDAF中运行的模型性能进行评估，当模型性能下降至一定程度时训练NWDAF可以感知并及时进行再训练，推断NWDAF可利用再训练得到的性能良好的新模型进行模型更新(或者替换)，保证模型的使用效果。其中，监控、反馈、再训练和更新机制可以通过NRF实现，也可以由训练NWDAF与推断NWDAF直接交互实现。

本申请实施例应用的系统架构是eNA架构，具体地，本申请实施例针对的是模型训练和推断功能分离部署的场景，即训练功能和推断功能部署在不同的NWDAF实例中。如图4所示，为本申请实施例适用的一种网络架构示意图。训练NWDAF，推断NWDAF和NF，都需要通过Nnrf接口服务在NRF中进行注册。推断NWDAF通过Nnwdaf接口服务向训练NWDAF请求模型，NF通过Nnwdaf接口服务向推断训练NWDAF请求数据分析结果。

下面对本申请实施例提供的方案进行说明。

实施例一

如图5所示，为本申请实施例提供的一种训练-推断分离场景下保证模型有效性的方法流程示意图。

该实施例一考虑通过NRF更新注册信息，实现性能监控和模型更新。主要涉及：

1、模型性能监控与反馈：推断NWDAF在NRF处的注册信息增加模型状态信息，推断NWDAF进行模型性能监控，当判断模型需要再训练时通过NRF更新模型状态信息，NRF通知训练NWDAF模型状态更新，触发训练NWDAF对模型进行再训练。

2、模型更新：训练NWDAF在NRF处的注册信息增加模型索引信息，训练NWDAF再训练得到新模型后通过NRF更新模型索引信息，NRF通知推断NWDAF有新模型可以使用，推断NWDAF主动向训练NWDAF请求新模型并完成模型更新。

该实施例包括以下步骤：

步骤501，训练NWDAF向NRF注册。

训练NWDAF向NRF发送NF注册请求，携带NF配置文件，该NF配置文件包括NF类型，NF服务名称(例如，NF Service)，分析类型标识(例如，Analytics ID)等信息，以及还包括模型索引信息。该模型索引信息可以是模型版本号(例如，version)、位置信息(例如，location)或统一资源定位符(Uniform Resource Locator，URL)等。其中，version表示模型版本，location或URL表示模型的存储位置，三者中使用任意一个都可以。可选的，当模型索引信息是位置信息或URL，该位置信息或URL中也可以包含模型版本。可选的，位置信息可以是IP地址。

相应地，NRF存储NF配置文件以及向训练NWDAF发送NF注册响应。

步骤502，推断NWDAF向NRF注册。

推断NWDAF向NRF发送NF注册请求，携带NF配置文件，该NF配置文件包括NF类型，NF服务名称(例如，NF Service)，分析类型标识(例如，Analytics ID)等信息，以及还包括模型状态信息。该模型状态信息用于指示模型使用状态。

该模型状态信息的可选取值包括但不限于：

1)空‘null’：表示没有模型可以使用。

2)允许‘ok’：表示模型性能良好，可以对外提供分析服务。

3)限定‘limited’：表示模型性能有所下降，但仍可以提供服务，需要进行再训练。

4)停止‘stopped’：表示模型关闭，已停止提供服务。

其中，在注册过程中，NF注册请求携带的模型状态信息为‘null’，即推断NWDAF上当前没有模型可以使用。

相应地，NRF存储NF配置文件以及向推断NWDAF发送NF注册响应。

步骤503，推断NWDAF发现训练NWDAF，并向训练NWDAF请求获取模型信息。

该过程可以参考图3实施例中的步骤304至步骤307，不再赘述。基于该过程，推断NWDAF可以从训练NWDAF中获取到模型信息。

步骤504，推断NWDAF向NRF订阅训练NWDAF的状态。

后续训练NWDAF在NRF中注册的NF配置文件发生更新时，NRF通知推断NWDAF。

步骤505，训练NWDAF向NRF订阅推断NWDAF的状态。

后续推断NWDAF在NRF中注册的NF配置文件发生更新时，NRF通知训练NWDAF。

上述步骤504与步骤505相互之间没有固定的先后顺序。

步骤506，推断NWDAF向NRF发送NF更新请求，携带更新的NF配置文件。

该更新的NF配置文件至少携带更新的模型状态信息，该更新的模型状态信息比如可以是“ok”。可选的，该更新的NF配置文件还携带Analytics ID，用于标识要更新的模型。可选的，该更新的NF配置文件还携带NF类型，NF服务名称(NF Service)等。

步骤507，NRF更新NF配置文件。

步骤508，NRF向推断NWDAF发送NF更新响应。

该NF更新响应用于通知推断NWDAF的NF配置文件更新成功。

步骤509，NRF向训练NWDAF发送NF状态更新通知，其中携带更新的模型状态信息。

该更新的模型状态信息比如可以是‘ok’。

可选的，该NF状态更新通知还携带指示信息，用于指示更新的类型是模型状态信息更新。

由于上述步骤505中，训练NWDAF向NRF订阅了推断NWDAF的状态，因此当NRF中存储的推断NWDAF的NF配置文件发生更新后，NRF通知训练NWDAF。

步骤510，推断NWDAF确定模型需要再训练。

判断依据可以是对模型性能的评估结果不满足模型性能要求(比如模型精度下降到80％以下，其中80％为模型精度要求)，也可以是NF上报的业务关键性能指标(Key Performance Indicator，KPI)不满足KPI要求(比如KPI下降到KPI要求以下)。本发明其他实施例中涉及判定模型是否需要再训练或者需要更新的方法都可以参考此处描述，不再赘述。

需要说明的是，该步骤510发生在推断NWDAF中的模型运行过程中，出现的时间不固定。

步骤511，推断NWDAF向NRF发送NF更新请求，携带更新的NF配置文件。

该更新的NF配置文件至少携带更新的模型状态信息，该更新的模型状态信息比如可以是‘limited’。可选的，该更新的NF配置文件还携带Analytics ID，用于标识要更新的模型。可选的，该更新的NF配置文件还携带NF类型，NF服务名称(NF Service)等。

NRF更新存储的NF配置文件，然后向推断NWDAF发送NF更新响应。

步骤512，NRF向训练NWDAF发送NF状态更新通知，其中携带更新的模型状态信息。

该更新的模型状态信息可以是‘limited’。

步骤513，训练NWDAF对模型启动再训练。

训练NWDAF对模型启动再训练，得到训练后的模型以及相应的模型索引信息，如模型版本号、位置信息或URL等。

步骤514，训练NWDAF向NRF发送NF更新请求，携带更新的NF配置文件。

该更新的NF配置文件至少携带更新的模型索引信息，该更新的模型索引信息比如可以是更新的模型版本信息、更新的模型位置信息或更新的模型URL等。可选的，该更新的NF配置文件还携带Analytics ID，用于标识要更新的模型。可选的，该更新的NF配置文件还携带NF类型，NF服务名称(NF Service)等。

NRF更新存储的NF配置文件，然后向训练NWDAF发送NF更新响应。

步骤515，NRF向推断NWDAF发送NF状态更新通知，其中携带更新的模型索引信息。

该更新的模型索引信息比如可以是更新的模型版本信息、更新的模型位置信息或更新的模型URL等。

可选的，该NF状态更新通知还携带指示信息，用于指示更新的类型是模型索引信息更新。

由于上述步骤504中，推断NWDAF向NRF订阅了训练NWDAF的状态，因此当NRF中存储的训练NWDAF的NF配置文件发生更新后，NRF通知推断NWDAF。

步骤516，推断NWDAF向训练NWDAF发送模型请求，携带Analytics ID和更新的模型索引信息。

Analytics ID用于指示与该Analytics ID对应的模型。

步骤517，训练NWDAF向推断NWDAF发送模型响应，携带模型信息。

该模型信息包括与更新的模型索引信息对应的模型信息，也即获取到新的模型对应的模型信息。

可选的，模型响应中携带的模型信息可以是新模型的参数项取值、或新的模型(如模型文件或包含模型的镜像文件)、或新的模型地址(如URL或IP地址)。

其中，模型文件是使用第三方框架保存下来的模型持久化文件，如使用人工智能框架TensorFlow保存的.pb格式的模型文件。模型镜像文件是一个包含模型的镜像软件包，其中可以包含模型文件以及与模型使用相关的其他多个文件。

需要说明的是，如果步骤516中携带的模型索引信息是新的模型地址，则推断NWDAF可以直接根据该地址信息进一步获取新的模型信息，无需执行步骤516-517。比如，推断NWDAF根据URL通过文件传输协议(File Transfer Protocol，FTP)获取包含新的模型信息的文件(如包含新模型的参数项取值的文件、或新的模型文件、或包含新模型的镜像文件)。

如果步骤516中携带的模型索引信息是模型版本号，则模型响应中携带的模型信息可以是新模型的参数项取值、或新的模型(模型文件或包含模型的镜像)，也可以是新模型的地址(如URL或IP地址)。如果模型响应中携带的模型信息是新模型的地址(如URL或IP地址)，推断NWDAF可以根据该地址信息进一步获取新的模型信息。

步骤518，推断NWDAF进行模型更新。

也即，推断NWDAF根据接收到的新的模型信息，对正在使用的旧模型进行更新或者替换。

可选的，推断NWDAF在模型更新前，对新的模型信息进行本地测试，测试通过后再进行更新或者替换。

步骤519，推断NWDAF向NRF发送NF更新请求，携带更新的NF配置文件。

该更新的NF配置文件至少携带更新的模型状态信息，该更新的模型状态信息比如可以是’ok’。可选的，该更新的NF配置文件还携带Analytics ID，用于标识要更新的模型。可选的，该更新的NF配置文件还携带NF类型，NF服务名称(NF Service)等。

NRF更新存储的NF配置文件，然后向推断NWDAF发送NF更新响应。

步骤520，NRF向训练NWDAF发送NF状态更新通知，其中携带更新的模型状态信息。

该更新的模型状态信息可以是‘ok’。

其中，上述步骤511-步骤520可选步骤。例如，如果步骤510中推断NWDAF确定模型不需要再训练或者推断NWDAF可以容忍模型性能下降到模型性能要求以下，步骤511-步骤520可以不执行。

基于上述实施例，一方面，当推断NWDAF中使用的模型的性能下降时，可以通过NRF通知训练NWDAF进行模型再训练，训练结束后推断NWDAF可利用新模型更新或者替换旧模型，保证模型的使用效果。

另一方面，当推断NWDAF为多个时，如果只是其中一个推断NWDAF X的性能下降，并且通知训练NWDAF进行再训练，训练结束后，除了推断NWDAF X可以利用新模型更新或者替换旧模型，多个推断NWDAF中的其他任何一个推断NWDAF也可以利用上述机制获取新模型，并且利用新模型更新或者替换旧模型，这样可以保证多个推断NWDAF上模型的使用效果。针对多推断NWDAF的场景，详细过程的示例参见实施例二。

实施例二

如图6所示，为本申请实施例提供的又一种训练-推断分离场景下保证模型有效性的方法流程示意图。

该实施例二，是在上述实施例一的基础上，考虑有多个推断NWDAF存在的场景，以下以有两个推断NWDAF(分别用推断NWDAF1和推断NWDAF2来表示)为例，推断NWDAF1和推断NWDAF2中使用相同的模型进行数据分析，该模型都来自同一训练NWDAF。某一时刻，NWDAF1中模型性能下降需要再训练，推断NWDAF2中模型不需要再训练。这里仅以推断NWDAF2为例表示存在除了请求再训练的推断NWDAF1外，还存在其他使用相同模型的推断NWDAF。

由于推断NWDAF2也订阅了训练NWDAF状态，因此，当训练NWDAF再训练得到新模型之后，推断NWDAF2也会收到来自NRF的通知。一方面，如果新模型比推断NWDAF2中模型效果更好，推断NWDAF2可以利用新模型进一步改善数据分析效果，另一方面，由于推断NWDAF2中模型此时并不是必须要更新，推断NWDAF2需要先获取新模型并进行本地评估后才可以确定是否需要更新。如果获取新模型后推断NWDAF2最终决定不更新，则浪费了一部分传输资源。本实施例考虑在训练NWDAF的注册信息进一步增加模型性能信息，包括精度、所需计算量等，帮助其它暂不需要更新的推断NWDAF判断是否需要请求新模型。

该实施例包括以下步骤：

步骤601，训练NWDAF向NRF注册。

训练NWDAF向NRF发送NF注册请求，携带NF配置文件，该NF配置文件包括NF类型，NF服务名称(NF Service)，分析类型标识(Analytics ID)等信息，以及还包括模型索引信息和模型性能信息。该模型索引信息可以是模型版本号(version)、位置信息(location)或URL等。其中，version表示模型版本，location或URL表示模型的存储位置，三者中使用任意一个都可以。可选的，当模型索引信息是location或URL，该location或URL中也可以包含version。该模型性能信息用于指示模型的性能，比如可以包括模型准确度、达到该准确度所需的硬件能力信息、模型推理所需计算量、模型的推理时长、模型的大小等。

可选的，NF配置文件还可以包含模型使用的算法、人工智能框架、模型的输入特征等信息。

相应地，NRF存储NF配置文件以及向训练NWDAF发送NF注册响应。

步骤602至步骤613，类似于上述实施例一中的步骤502至步骤513。

需要说明的是，该步骤602至步骤613中，涉及推断NWDAF1的相关操作以及推断NWDAF2的相关操作，均可以分别参考上述步骤502至步骤513中关于推断NWDAF的相关操作。并且，在步骤610至步骤611(参考步骤510至步骤611)中，是推断NWDAF1确定模型需要再训练，然后向NRF发送NF更新请求，从而触发训练NWDAF对模型启动再训练。

步骤614，训练NWDAF向NRF发送NF更新请求，携带更新的NF配置文件。

该更新的NF配置文件至少携带更新的模型索引信息以及更新的模型性能信息，该更新的模型索引信息比如可以是更新的模型版本信息、更新的模型位置信息或更新的模型URL等。可选的，该更新的NF配置文件还携带Analytics ID，用于标识要更新的模型。该更新的模型性能信息比如可以包括模型准确度、达到该准确度所需的硬件能力信息、模型推理所需计算量、模型的推理时长、模型的大小等。

可选的，该更新的NF配置文件还携带NF类型，NF服务名称(NF Service)等。

NRF更新存储的NF配置文件，然后向训练NWDAF发送NF更新响应。

步骤615，NRF分别向推断NWDAF1和推断NWDAF2发送NF状态更新通知，其中携带更新的模型索引信息和更新的模型性能信息。

该更新的模型性能信息比如可以包括模型准确度、达到该准确度所需的硬件能力信息、模型推理所需计算量、模型的推理时长、模型的大小等。

可选的，该NF状态更新通知还携带指示信息，用于指示更新的类型是模型索引信息更新以及模型性能信息更新。

由于上述步骤中，推断NWDAF1和推断NWDAF2分别向NRF订阅了训练NWDAF的状态，因此当NRF中存储的训练NWDAF的NF配置文件发生更新后，NRF通知推断NWDAF1和推断NWDAF2。

步骤616，推断NWDAF2判断是否需要更新模型。

由于推断NWDAF2不是模型训练的触发者，因此当推断NWDAF2收到更新的模型索引信息后，需要判断是否需要更新模型。

可选的，推断NWDAF2可以根据自身算力、模型性能要求以及接收到的更新的模型性能信息，判断是否需要更新模型。或者，推断NWDAF2还可以根据正在使用的模型性能状况以及接收到的更新的模型性能信息，判断是否需要更新模型。

步骤617，推断NWDAF1向训练NWDAF发送模型请求，携带Analytics ID和更新的模型索引信息。

Analytics ID用于指示与该Analytics ID对应的模型。

由于推断NWDAF1是模型训练的触发者，因此当推断NWDAF1收到更新的模型索引信息后，需要更新模型。

步骤618，训练NWDAF向推断NWDAF1发送模型响应，携带模型信息。

该模型信息包括与更新后的模型标识对应的模型信息，也即获取到新的模型对应的模型信息。

其中，模型信息的具体实现，可以参考前述实施例的描述。

步骤619，推断NWDAF1进行模型更新。

需要说明的是，如果上述步骤616中，推断NWDAF2确定需要更新模型，则推断NWDAF2还需要执行类似于上述步骤617至步骤619的操作过程，以向训练NWDAF请求获取到更新的模型信息，然后根据接收到的新的模型信息，对正在使用的旧模型进行更新。如果上述步骤616中，推断NWDAF2确定不需要更新模型，则无需执行该模型更新流程。

基于上述实施例，订阅相同模型的推断NWDAF可以根据模型性能信息，确定是否需要请求新模型，以避免不必要的模型传输和本地评估过程，从而可以提升模型更新流程的效率以及节约资源。

实施例三

如图7所示，为本申请实施例提供的又一种训练-推断分离场景下保证模型有效性的方法流程示意图。

该实施例三是在上述实施例一的基础上，考虑针对同一个Analytics ID，需要多个子模型共同协作完成分析的场景。该场景下任意一个子模型的性能下降都会导致Analytics ID对应的模型性能下降，如果仅根据Analytics ID进行模型监控，则无法精确定位到子模型的性能，会将Analytics ID对应的所有子模型都进行再训练和更新，而实际可能某些子模型性能良好并不需要更新，这就导致了不必要的训练和更新。

本实施例考虑进一步地增加模型标识(model ID)来表示各个子模型。

该实施例包括以下步骤：

步骤701，训练NWDAF向NRF注册。

训练NWDAF向NRF发送NF注册请求，携带NF配置文件，该NF配置文件包括NF类型，NF服务名称(NF Service)，分析类型标识(Analytics ID)等信息，以及还包括模型标识(model ID)和模型索引信息。该模型索引信息可以是模型版本号(version)、位置信息(location)或URL等。其中，version表示模型版本，location或URL表示模型的存储位置，三者中使用任意一个都可以。可选的，当模型索引信息是location或URL，该location或URL中也可以包含version。该模型标识用于唯一标识一个模型，例如，该模型标识可以由NWDAF地址、PLMN ID、在某个NWDAF范围内唯一的modelID组成。

需要说明的是，NF配置文件可以携带多个模型索引信息，每个模型标识对应一个模型索引信息。

相应地，NRF存储NF配置文件以及向训练NWDAF发送NF注册响应。

可选的，该更新的NF配置文件还可以携带多个模型标识，每个模型标识用于标识多个更新的模型中的一个模型。

步骤702，推断NWDAF向NRF注册。

推断NWDAF向NRF发送NF注册请求，携带NF配置文件，该NF配置文件包括NF类型，NF服务名称(NF Service)，分析类型标识(Analytics ID)等信息，以及还包括模型状态信息和模型标识。其中，每个模型标识对应一个模型状态信息。

模型状态信息用于指示模型标识对应的模型的使用状态。该模型状态信息的可选取值包括但不限于：

1)‘null’：表示没有模型可以使用。

2)‘ok’：表示模型性能良好，可以对外提供分析服务。

3)‘limited’：表示模型性能有所下降，但仍可以提供服务，需要进行再训练。

4)‘stopped’：表示模型关闭，已停止提供服务。

示例性地，NF配置文件携带的模型状态信息和模型标识如下：

{(model ID 1，null)，(model ID 2，null)，(model ID 3，null)}。

或者，NF配置文件携带的模型状态信息和模型标识如下：

{(model ID 1，model ID 2，model ID 3)，(null，null，null)}。

可选的，在实际应用中NF配置文件携带的模型状态信息和模型标识可以是一个列表，该列表包含多个项信息，每个项信息包含一个模型状态信息和一个模型标识。

相应地，NRF存储NF配置文件以及向推断NWDAF发送NF注册响应。

步骤703，推断NWDAF发现训练NWDAF，并向训练NWDAF请求获取模型信息。

该过程可以参考图5实施例中的步骤503，不再赘述。基于该过程，推断NWDAF可以从训练NWDAF中获取到模型信息。

步骤704，推断NWDAF向NRF订阅训练NWDAF的状态。

步骤705，训练NWDAF向NRF订阅推断NWDAF的状态。

上述步骤704与步骤705相互之间没有固定的先后顺序。

步骤706，推断NWDAF向NRF发送NF更新请求，携带更新的NF配置文件。

该更新的NF配置文件至少携带更新的模型状态信息，该更新的模型状态信息比如可以是‘ok’。其中，每个模型标识对应一个更新的模型状态信息。

可选的，该更新的NF配置文件还携带Analytics ID，用于标识要更新的模型。可选的，该更新的NF配置文件还携带NF类型，NF服务名称(NF Service)等。

可选的，该更新的NF配置文件还可以携带模型标识，用于标识更新的模型。

步骤707，NRF更新存储的NF配置文件。

步骤708，NRF向推断NWDAF发送NF更新响应。

该NF更新响应用于通知NF配置文件更新成功。

步骤709，NRF向训练NWDAF发送NF状态更新通知，其中携带更新的模型状态信息。

其中，每个模型标识对应一个更新的模型状态信息。更新的模型状态信息比如可以是‘ok’。

可选的，该NF状态更新通知还可以携带模型标识，用于标识更新的模型。

由于上述步骤705中，训练NWDAF向NRF订阅了推断NWDAF的状态，因此当NRF中存储的推断NWDAF的NF配置文件发生更新后，NRF通知训练NWDAF。

步骤710，推断NWDAF确定模型需要再训练。

判断依据可以是对模型性能的评估结果(比如模型精度下降)，也可以是NF上报的业务KPI(比如KPI下降)。

需要说明的是，该步骤710发生在推断NWDAF中的模型运行过程中，出现的时间不固定。

需要说明的是，该步骤中，判断的结果可以是：某一个或某几个子模型需要再训练。比如针对某个Analytics ID对应的模型，一共有10个子模型，分别用model ID 1至model ID10表示。该步骤710的判断结果比如是：model ID 1至model ID 3对应的子模型需要再训练，model ID 4至model ID 10对应的子模型不需要再训练。

步骤711，推断NWDAF向NRF发送NF更新请求，携带更新的NF配置文件。

该更新的NF配置文件至少携带更新的模型状态信息，其中，每个模型标识对应一个更新的模型状态信息。该更新的模型状态信息比如可以是‘limited’。可选的，该更新的NF配置文件还携带Analytics ID，用于标识要更新的模型。可选的，该更新的NF配置文件还携带NF类型，NF服务名称(NF Service)等。

NRF更新存储的NF配置文件，然后向推断NWDAF发送NF更新响应。

需要说明的是，该步骤711中的更新的NF配置文件中携带的模型标识即为上述步骤710中确定的需要再训练的子模型的标识信息，更新的模型状态信息即为需要再训练的子模型的标识信息对应的更新的模型状态信息。

步骤712，NRF向训练NWDAF发送NF状态更新通知，其中携带更新的模型状态信息。

其中，每个模型标识对应一个更新的模型状态信息。该更新的模型状态信息可以是‘limited’。

步骤713，训练NWDAF对模型启动再训练。

需要说明的是，该步骤中，仅对接收到的需要进行训练的子模型进行启动再训练。比如接收到的模型标识是model ID 1至model ID 3，则对model ID 1至model ID 3对应的子模型进行再训练。

步骤714，训练NWDAF向NRF发送NF更新请求，携带更新的NF配置文件。

该更新的NF配置文件至少携带更新的模型索引信息，每个模型标识对应一个更新的模型状态信息。该更新的模型索引信息比如可以是更新的模型版本信息、更新的模型位置信息或更新的模型URL等。可选的，该更新的NF配置文件还携带Analytics ID，用于标识要更新的模型。可选的，该更新的NF配置文件还携带NF类型，NF服务名称(NF Service)等。

NRF更新存储的NF配置文件，然后向训练NWDAF发送NF更新响应。

步骤715，NRF向推断NWDAF发送NF状态更新通知，其中携带更新的模型索引信息。

可选的，该NF状态更新通知还携带模型标识，用于标识更新的模型。

由于上述步骤704中，推断NWDAF向NRF订阅了训练NWDAF的状态，因此当NRF中存储的训练NWDAF的NF配置文件发生更新后，NRF通知推断NWDAF。

步骤716，推断NWDAF向训练NWDAF发送模型请求，携带Analytics ID和更新的模型索引信息。

Analytics ID用于指示与该Analytics ID对应的模型。

模型标识用于指示该Analytics ID对应的模型中的子模型。

步骤717，训练NWDAF向推断NWDAF发送模型响应，携带模型信息。

其中，模型信息的具体实现，可以参考前述实施例的描述。

步骤718，推断NWDAF进行模型更新。

也即，推断NWDAF根据接收到的新的模型信息，对正在使用的旧模型(具体是相应需要更新的子模型)进行更新。

步骤719，推断NWDAF向NRF发送NF更新请求，携带更新的NF配置文件。

该更新的NF配置文件至少携带更新的模型状态信息，每个模型标识对应一个更新的模型状态信息。该更新的模型状态信息比如可以是‘ok’。可选的，该更新的NF配置文件还携带Analytics ID，用于标识要更新的模型。可选的，该更新的NF配置文件还携带NF类型，NF服务名称(NF Service)等。

NRF更新存储的NF配置文件，然后向推断NWDAF发送NF更新响应。

步骤720，NRF向训练NWDAF发送NF状态更新通知，其中携带更新的模型状态信息。

其中，每个模型标识对应一个更新的模型状态信息。更新的模型状态信息可以是‘ok’。

其中，上述步骤714-步骤720可选步骤。例如，如果步骤713中训练NWDAF确定模型不需要再训练或者训练NWDAF可以容忍模型性能下降到模型性能要求以下或者训练NWDAF上当前不具备模型再训练的能力(如硬件资源有限)，步骤714-步骤720可以不执行。

基于上述实施例，增加了模型标识(也称为子模型标识)，按照子模型粒度进行性能监控，在一个Analytics ID对应多个子模型的场景下可以实现精准的执行模型再训练与更新，避免浪费训练和传输资源。

实施例四

如图8所示，为本申请实施例提供的又一种训练-推断分离场景下保证模型有效性的方法流程示意图。

上述实施例一至实施例三是考虑通过NRF实现训练NWDAF和推断NWDAF的信息交互，该实施例四考虑在训练NWDAF和推断NWDAF之间的接口上新增操作，直接交互信息。

该实施例包括以下步骤：

步骤801，训练NWDAF向NRF注册。

训练NWDAF向NRF发送NF注册请求，携带NF配置文件，该NF配置文件包括NF类型，NF服务名称(NF Service)，分析类型标识(Analytics ID)等信息。

相应地，NRF存储NF配置文件以及向训练NWDAF发送NF注册响应。

步骤802a，推断NWDAF向NRF发送NF发现请求，携带NF配置文件。

比如携带的NF配置文件包含NF类型(如NWDAF)，NF服务名称(如ModelProvision)，以及携带Analytics ID，则该NF发现请求用于请求从NRF获取对应该Analytics ID的训练NWDAF。

步骤802b，NRF向推断NWDAF发送NF发现响应，其中携带NWDAF实例。

步骤803a，推断NWDAF向训练NWDAF发送模型请求，其中携带Analytics ID。

步骤803b，训练NWDAF向推断NWDAF发送模型响应，携带模型信息。

其中，模型信息的具体实现，可以参考前述实施例的描述。

例如，上述步骤801-步骤803b可选步骤。例如，如果推断NWDAF中配置了训练NWDAF的NF配置文件，则步骤801-步骤803b可以不执行。

步骤804a，训练NWDAF向推断NWDAF发送模型性能信息订阅请求，其中携带Analytics ID，模型性能指标(如精确率(Precision)、准确率(Accuracy)、错误率(Error Rate)、召回率(Recall)、F1分数(F-Score)、均方误差(Mean Square Error,MSE)、均方根误差(Root Mean Squared Error,RMSE)、均方根对数误差(Root Mean Squared Logarithmic Error,RMSLE)、平均绝对误差(Mean Absolute Error,MAE)、模型推理时长、模型鲁棒性、模型可扩展性、模型可解释性)以及上报周期。

其中，精确率、准确率、错误率、召回率、F1分数用于指示分类类型或者标注类型的模型的性能。均方误差、均方根误差、均方根对数误差、平均绝对误差用于指示回归类模型的性能。模型推理时长用于指示模型预测需要的时间。模型鲁棒性用于指示模型处理缺失值和异常值的能力。模型可拓展性用于指示处理大数据集的能力。模型可解释性用于指示模型预测标准的可理解性，比如，决策树模型由于产生的规则或者树结构导致模型可解释性高，神经网络模型由于存在大量模型参数导致模型可解释性低。

步骤804b，推断NWDAF向训练NWDAF发送模型性能信息通知，其中携带Analytics ID，模型性能指标以及模型性能指标对应的取值。

其中，推断NWDAF是基于上报周期，周期性地向训练NWDAF发送模型性能信息通知。

基于上述步骤804a至步骤804b，推断NWDAF可以周期性地向训练NWDAF上报模型性能信息。

可选的，模型性能信息通知中还可以携带推断NWDAF对模型的模型性能要求，和/或，推断NWDAF进行模型评估使用的数据等。其中，模型性能要求可以辅助训练NWDAF判断是否需要进行再训练以及判断再训练得到的模型性能是否满足推断NWDAF要求，推断NWDAF进行模型评估使用的数据包括模型的输入数据、模型的输出数据(推断结果)、与推断结果对应的网络实际测量值(网络数据)，可供训练NWDAF对模型进行再训练时使用。

可选的，上述步骤804a至步骤804b也可以由以下步骤804a’至步骤804b’替换。

步骤804a’，训练NWDAF向推断NWDAF发送模型性能信息订阅请求，其中携带Analytics ID，模型性能指标(如精确率、准确率、错误率、召回率、F1分数、均方误差、均方根误差、均方根对数误差、平均绝对误差、模型推理时长、模型鲁棒性、模型可扩展性、模型可解释性)以及性能门限值。

步骤804b’，推断NWDAF向训练NWDAF发送模型性能再训练通知，其中携带Analytics ID。

基于上述步骤804a’至步骤804b’，推断NWDAF确定模型性能指标对应的取值达到性能门限值，则向训练NWDAF上报模型性能信息通知，该模型性能再训练通知用于触发训练NWDAF对模型再训练。可选的，上述步骤804b’可以不携带性能门限值，则可以由推断NWDAF自行确定性能门限值。该步骤804b’的模型性能再训练通知也可以称为模型性能达到门限值通知或模型性能信息通知。

可选的，模型性能信息通知中还可以携带推断NWDAF对模型的模型性能要求，和/或，推断NWDAF进行模型评估使用的数据等。其中，模型性能要求可以是推断NWDAF自行确定的门限值，用于辅助训练NWDAF判断是否需要进行再训练以及判断再训练得到的模型性能是否满足推断NWDAF要求，推断NWDAF进行模型评估使用的数据包括模型的输入数据、模型的输出数据(推断结果)、与推断结果对应的网络实际测量值(网络数据)，可供训练NWDAF对模型进行再训练时使用。

可选的，上述步骤804a至步骤804b也可以由以下步骤804a”至步骤804b”替换。

步骤804a”，训练NWDAF向推断NWDAF发送模型性能信息请求，其中携带Analytics ID，模型性能指标(如精确率、准确率、错误率、召回率、F1分数、均方误差、均方根误差、均方根对数误差、平均绝对误差、模型推理时长、模型鲁棒性、模型可扩展性、模型可解释性)。

步骤804b”，推断NWDAF向训练NWDAF发送模型性能信息响应，其中携带Analytics ID，模型性能指标以及模型性能指标对应的取值。

基于上述步骤804a”至步骤804b”，训练NWDAF可以周期性地向推断NWDAF发送模型性能信息请求，推断NWDAF每次收到模型性能信息请求，则基于模型性能指标进行模型性能评估，并向训练NWDAF发送模型性能信息响应。

可选的，模型性能信息响应中还可以携带推断NWDAF对模型的模型性能要求，和/或，推断NWDAF进行模型评估使用的数据等。其中，模型性能要求可以辅助训练NWDAF判断是否需要进行再训练以及判断再训练得到的模型性能是否满足推断NWDAF要求，推断NWDAF进行模型评估使用的数据包括模型的输入数据、模型的输出数据(推断结果)、与推断结果对应的网络实际测量值(网络数据)，可供训练NWDAF对模型进行再训练时使用。

可选的，上述步骤804a至步骤804b也可以由以下步骤804a”’至步骤804b”’替换。

步骤804a”’，训练NWDAF向推断NWDAF发送模型性能数据订阅请求，其中携带Analytics ID，以及上报周期。

步骤804b”’，推断NWDAF向训练NWDAF发送模型性能数据通知，其中携带Analytics ID和模型性能评估参考信息。

其中，模型性能评估参考信息包括模型的输入数据、模型的输出数据(推断结果)或与推断结果对应的网络实际测量值中的至少一项。

基于上述步骤804a”’至步骤804b”’，推断NWDAF基于上报周期，周期性地向训练NWDAF发送模型性能数据通知，即推断NWDAF可以周期性地向训练NWDAF上报模型性能评估参考信息。

其中，与推断结果对应的网络实际测量值(网络数据)可以由推断NWDAF从现网中采集后上报给训练NWDAF，也可以由训练NWDAF自行从现网中采集。

可选的，模型性能数据通知中还可以携带推断NWDAF对模型的模型性能要求。

训练NWDAF可以根据推断NWDAF周期性上报的模型性能评估参考信息，构建测试集并进行模型性能评估。

可选的，上述步骤804a至步骤804b也可以由以下步骤804a””至步骤804b””替换。

步骤804a””，训练NWDAF向推断NWDAF发送模型性能数据请求，其中携带Analytics ID。

可选的，模型性能数据请求中还包含时间范围，用于指示请求该时间范围内的性能数据。

步骤804b””，推断NWDAF向训练NWDAF发送模型性能数据响应，其中携带 Analytics ID和模型性能评估参考信息。

其中,模型性能评估参考信息包括模型的输入数据、模型的输出数据(推断结果)、或与推断结果对应的网络实际测量(网络数据)值中的至少一项。

基于上述步骤804a””至步骤804b””，训练NWDAF可以向推断NWDAF发送模型性能数据请求，推断NWDAF向训练NWDAF发送模型性能数据响应，即推断NWDAF向训练NWDAF发送模型性能评估参考信息，该模型性能评估参考信息可以是一定时间范围内的。

其中，与推断结果对应的网络实际测量值可以由推断NWDAF从现网中采集后上报给训练NWDAF，也可以由训练NWDAF自行从现网中采集。

可选的，模型性能数据响应中还可以携带推断NWDAF对模型的模型性能要求。

训练NWDAF可以根据推断NWDAF发送的模型性能评估参考信息构建测试集并进行模型性能评估。

步骤805，训练NWDAF确定启动模型再训练。

比如，若执行上述步骤804a至步骤804b，则训练NWDAF确定模型性能指标对应的取值达到训练NWDAF预设的性能门限值或者不满足推断NWDAF的模型性能要求，则确定启动模型再训练。

再比如，若执行上述步骤804a’至步骤804b’，则训练NWDAF收到模型性能信息通知，则确定启动模型再训练。

比如，若执行上述步骤804a”至步骤804b”，则训练NWDAF确定模型性能指标对应的取值达到训练NWDAF预设的性能门限值或者不满足推断NWDAF的模型性能要求，则确定启动模型再训练。

再比如，若执行上述步骤804a”’至步骤804b”’，或执行上述步骤804a””至步骤804b””，则训练NWDAF根据模型性能评估参考信息，确定模型性能达到训练NWDAF预设的性能门限值，或者不满足推断NWDAF的模型性能要求，则确定启动模型再训练。

步骤806，训练NWDAF向推断NWDAF发送模型更新请求，携带Analytics ID以及新的模型信息。

可选的，模型更新请求中的新模型信息可以是新模型的参数项取值、或新模型文件或包含新模型的镜像文件、或新模型的地址(如URL或IP地址)。

需要说明的是，如果步骤806中携带的是新模型的地址，则推断NWDAF可以根据该地址获取包含新模型信息的文件，该文件可以是包含新模型的参数项取值的文件、或是模型文件、或是包含新模型的镜像文件。

步骤807，推断NWDAF向训练NWDAF发送模型更新响应。

步骤808，推断NWDAF进行模型更新。

其中，上述步骤806-步骤808可选步骤。例如，如果步骤805中训练NWDAF确定模型不需要再训练或者训练NWDAF可以容忍模型性能下降到模型性能要求以下或者训练NWDAF上当前不具备模型再训练的能力(如硬件资源有限)，步骤806-步骤808可以不执行。

基于上述实施例，训练NWDAF向推断NWDAF发送模型性能订阅或模型性能请求，实现对推断NWDAF中模型性能的监控，当性能下降满足再训练条件时，训练NWDAF及时进行再训练，并将新模型发送给推断NWDAF用于更新，保证了推断NWDAF中模型的模型性能。

实施例五

如图9所示，为本申请实施例提供的又一种训练-推断分离场景下保证模型有效性的方法流程示意图。

该实施例五是在实施例四的基础上，考虑有多个推断NWDAF存在的场景，具体场景同实施例二，可参考实施例二的场景描述。类似实施例二，本实施例考虑在模型更新请求中增加指示模型性能信息的参数，包括精度、所需计算量等，帮助其它暂不需要更新的推断NWDAF判断是否需要请求新模型。

该实施例包括以下步骤：

步骤901至步骤905，类似于上述实施例四中的步骤801至步骤805。

需要说明的是，该步骤901至步骤905中，涉及推断NWDAF1的相关操作以及推断NWDAF2的相关操作，均可以分别参考上述步骤802a至步骤804b中关于推断NWDAF的相关操作。并且，步骤905中，训练NWDAF是根据推断NWDAF1发送的模型性能信息通知或模型性能信息响应，触发启动模型再训练。

接下来，训练NWDAF需要通知推断NWDAF执行模型更新。

第一种方案是：不区分推断NWDAF，即训练NWDAF始终将训练得到的新的模型信息发送给所有推断NWDAF。该方案参考以下步骤906a至步骤906b。

第二种方案是：区分不同的推断NWDAF，仅向触发训练NWDAF执行模型训练的推断NWDAF发送新的模型信息。该方案参考以下步骤907a至步骤907c。

需要说明的是，上述第一种方案与第二种方案，二者选择一种进行执行。

第一种方案：

步骤906a，训练NWDAF向推断NWDAF1发送模型更新请求，携带Analytics ID，新的模型信息以及模型性能信息。

步骤906b，推断NWDAF1判断是否需要更新模型。

推断NWDAF1收到模型更新请求后，可以基于模型性能信息，和/或，对新模型信息的本地测试结果判断是否需要更新模型。如果确定需要更新，则使用新的模型信息更新或者替换旧模型。

步骤906c，训练NWDAF向推断NWDAF2发送模型更新请求，携带Analytics ID，新的模型信息以及模型性能信息。

步骤906d，推断NWDAF2判断是否需要更新模型。

推断NWDAF2收到模型更新请求后，可以基于模型性能信息，和/或，对新模型的本地测试结果判断是否需要更新模型。如果确定需要更新，则使用新的模型信息更新或者替换旧模型。

第二种方案：

步骤907a，训练NWDAF向推断NWDAF1发送模型更新请求，携带Analytics ID以及新的模型信息。

步骤907b，推断NWDAF1更新模型。

推断NWDAF1收到模型更新请求后，使用新的模型信息更新或者替换旧模型。

步骤907c，训练NWDAF向推断NWDAF2发送模型训练完成通知，携带Analytics ID以及模型性能信息。

步骤907d，推断NWDAF2判断是否需要更新模型。

比如，推断NWDAF2可以根据自身算力、模型性能要求，以及接收到的模型性能信息，决定是否需要更新模型。

当推断NWDAF2确定需要更新模型，则执行以下步骤907e至步骤907g，否则不执行以下步骤907e至步骤907g。

步骤907e，可选的，推断NWDAF2向训练NWDAF发送模型请求，携带Analytics ID。

Analytics ID用于指示与该Analytics ID对应的模型。

步骤907f，可选的(取决于步骤907e是否执行)，训练NWDAF向推断NWDAF2发送模型响应，携带新的模型信息。

步骤907g，推断NWDAF2更新模型。

也即，推断NWDAF2根据接收到的新的模型信息，对正在使用的旧模型进行更新。

可选的，推断NWDAF2在模型更新前，对新的模型信息进行本地测试，测试通过后再进行更新或者替换。

基于上述实施例，使用相同模型的推断NWDAF可以获取新模型的信息，并根据模型性能信息确定是否需要请求新模型，避免不必要的模型传输和本地评估过程。

实施例六

如图10所示，为本申请实施例提供的又一种训练-推断分离场景下保证模型有效性的方法流程示意图。

该实施例是在实施例四的基础上，考虑针对同一个Analytics ID，需要多个子模型共同协作完成分析的场景。类似实施例三的解决方案，本实施例考虑进一步地增加model ID来标识各个子模型，训练NWDAF给子模型分配不同的model ID，通过model ID精确监控每个子模型的性能。

该实施例包括以下步骤：

步骤1001，训练NWDAF向NRF注册。

相应地，NRF存储NF配置文件以及向训练NWDAF发送NF注册响应。

步骤1002a，推断NWDAF向NRF发送NF发现请求，携带NF配置文件。

比如携带的NF配置文件包含NF类型(如NWDAF)，NF服务名称(如ModelProvision)，以及携带Analytics ID，则该NF发现请求用于请求从NRF获取对应该Analytics ID的训练 NWDAF。

步骤1002b，NRF向推断NWDAF发送NF发现响应，其中携带NWDAF实例。

步骤1003a，推断NWDAF向训练NWDAF发送模型请求，其中携带Analytics ID。

步骤1003b，训练NWDAF向推断NWDAF发送模型响应，携带模型信息和模型标识。

其中，模型信息的具体实现，可以参考前述实施例的描述。

其中，每个模型标识对应一个模型信息。

可选的，模型信息和模型标识可以以模型列表形式实现，也即模型响应携带模型列表，模型列表包含模型信息与模型标识以及模型信息与模型标识之间的对应关系。示例性地，模型列表包括：<模型信息1，模型标识1>，<模型信息2，模型标识2>，……。

其中，上述步骤1001-步骤1003b可选步骤行。例如，如果推断NWDAF中配置了训练NWDAF的NF配置文件，则步骤1001-步骤1003b可以不执行。

步骤1004a，训练NWDAF向推断NWDAF发送模型性能信息订阅请求，其中携带Analytics ID，模型性能指标(如精确率、准确率、错误率、召回率、F1分数、均方误差、均方根误差、均方根对数误差、平均绝对误差、模型推理时长、模型鲁棒性、模型可扩展性、模型可解释性)、上报周期以及模型标识。

需要说明的是，模型性能信息订阅请求可以携带多个模型标识以及每个模型标识对应的模型性能指标、上报周期。特别地，当每个模型标识对应的上报周期相同时，则可以只携带一个上报周期。

步骤1004b，推断NWDAF向训练NWDAF发送模型性能信息通知，其中携带Analytics ID，模型性能指标以及模型性能指标对应的取值。

其中，推断NWDAF是基于上报周期，周期性地向训练NWDAF发送各个子模型对应的模型性能信息通知。

基于上述步骤1004a至步骤1004b，推断NWDAF可以周期性地向训练NWDAF上报各个子模型对应的模型性能信息。

可选的，模型性能信息通知中还可以携带推断NWDAF对各子模型的模型性能要求，和/或，推断NWDAF进行各子模型评估使用的数据等。其中，模型性能要求可以辅助训练NWDAF判断是否需要进行再训练以及判断再训练得到的模型性能是否满足推断NWDAF要求，推断NWDAF进行模型评估使用的数据包括模型的输入数据、模型的输出数据(推断结果)、与推断结果对应的网络实际测量值，可供训练NWDAF对模型进行再训练时使用。

可选的，上述步骤1004a至步骤1004b也可以由以下步骤1004a’至步骤1004b’替换。

步骤1004a’，训练NWDAF向推断NWDAF发送模型性能信息订阅请求，其中携带Analytics ID，模型性能指标(如精确率、准确率、错误率、召回率、F1分数、均方误差、均方根误差、均方根对数误差、平均绝对误差、模型推理时长、模型鲁棒性、模型可扩展性、模型可解释性)、性能门限值以及模型标识。

需要说明的是，模型性能信息订阅请求可以携带多个模型标识以及每个模型标识对应的模型性能指标、性能门限值。特别地，当每个模型标识对应的性能门限值相同时，则可以只携带一个性能门限值。

步骤1004b’，推断NWDAF向训练NWDAF发送模型性能再训练通知，其中携带Analytics ID。

基于上述步骤1004a’至步骤1004b’，推断NWDAF确定子模型的模型性能指标对应的取值达到性能门限值，则向训练NWDAF上报子模型对应的模型性能信息通知，该模型性能再训练通知用于触发训练NWDAF对子模型再训练。可选的，上述步骤1004b’可以不携带性能门限值，则可以由推断NWDAF自行确定性能门限值。该步骤1004b’的模型性能再训练通知也可以称为模型性能达到门限值通知或模型性能信息通知。

可选的，模型性能信息通知中还可以携带推断NWDAF对子模型的模型性能要求，和/或，推断NWDAF进行模型评估使用的数据等。其中，模型性能要求可以是推断NWDAF自行确定的门限值，用于辅助训练NWDAF判断是否需要进行再训练以及判断再训练得到的模型性能是否满足推断NWDAF要求，推断NWDAF进行模型评估使用的数据包括模型的输入数据、模型的输出数据(推断结果)、与推断结果对应的网络实际测量值，可供训练NWDA对模型进行再训练时使用。

可选的，上述步骤1004a至步骤1004b也可以由以下步骤1004a”至步骤1004b”替换。

步骤1004a”，训练NWDAF向推断NWDAF发送模型性能信息请求，其中携带Analytics ID，模型性能指标(如精确率、准确率、错误率、召回率、F1分数、均方误差、均方根误差、均方根对数误差、平均绝对误差、模型推理时长、模型鲁棒性、模型可扩展性、模型可解释性)以及模型标识。

需要说明的是，模型性能信息请求可以携带多个模型标识以及每个模型标识对应的模型性能指标。

步骤1004b”，推断NWDAF向训练NWDAF发送模型性能信息响应，其中携带Analytics ID，模型性能指标以及模型性能指标对应的取值。

基于上述步骤1004a”至步骤1004b”，训练NWDAF可以周期性地向推断NWDAF发送模型性能信息请求，推断NWDAF每次收到模型性能信息请求，则基于模型性能指标进行模型性能评估，并向训练NWDAF发送子模型对应的模型性能信息响应。

可选的，模型性能信息响应中还可以携带推断NWDAF对各子模型的模型性能要求，和/或，推断NWDAF进行模型评估使用的数据等。其中，模型性能要求可以辅助训练NWDAF判断是否需要进行再训练以及判断再训练得到的模型性能是否满足推断NWDAF要求，推断NWDAF进行模型评估使用的数据包括模型的输入数据、模型的输出数据(推断结果)、与推断结果对应的网络实际测量值(网络数据)，可供训练NWDAF对模型进行再训练时使用。

可选的，上述步骤1004a至步骤1004b也可以由以下步骤1004a”’至步骤1004b”’替换。

步骤1004a”’，训练NWDAF向推断NWDAF发送模型性能数据订阅请求，其中携带Analytics ID，上报周期以及模型标识。

需要说明的是，模型性能数据订阅请求可以携带多个模型标识以及每个模型标识对应的上报周期。

步骤1004b”’，推断NWDAF向训练NWDAF发送模型性能数据通知，其中携带Analytics ID和模型性能评估参考信息。

其中，模型性能评估参考信息包括模型的输入数据、模型的输出数据(推断结果)或与推断结果对应的网络实际测量值(网络数据)中的至少一项。

需要说明的是，这里的模型性能评估参考信息可以是多个模型性能评估参考信息，具体的，每个模型标识对应一个模型性能评估参考信息。

基于上述步骤1004a”’至步骤1004b”’，推断NWDAF基于上报周期，周期性地向训练NWDAF发送模型性能数据通知，即推断NWDAF可以周期性地向训练NWDAF上报各个子模型分别对应的模型性能评估参考信息。

可选的，模型性能数据通知中还可以携带推断NWDAF对各个子模型的模型性能要求。

可选的，上述步骤1004a至步骤1004b也可以由以下步骤1004a””至步骤1004b””替换。

步骤1004a””，训练NWDAF向推断NWDAF发送模型性能数据请求，其中携带Analytics ID以及模型标识。

需要说明的是，模型性能数据订阅请求可以携带多个模型标识。

可选的，模型性能数据请求中还包含时间范围，用于指示请求该时间范围内的性能数据。具体的，每个模型标识可以对应一个时间范围。

步骤1004b””，推断NWDAF向训练NWDAF发送模型性能数据响应，其中携带Analytics ID和模型性能评估参考信息。

其中,，模型性能评估参考信息包括模型的输入数据、模型的输出数据(推断结果)，和/或，或与推断结果对应的网络实际测量值(网络数据)中的至少一项。

基于上述步骤1004a””至步骤1004b””，训练NWDAF可以向推断NWDAF发送模型性能数据请求，推断NWDAF向训练NWDAF发送模型性能数据响应，即推断NWDAF向训练NWDAF发送模型性能评估参考信息，该模型性能评估参考信息可以是一定时间范围内的。

步骤1005，训练NWDAF确定启动模型再训练。

比如，若执行上述步骤1004a至步骤1004b，则训练NWDAF确定模型性能指标对应的取值达到训练NWDAF预设的性能门限值或者不满足推断NWDAF的模型性能要求，则确定启动模型再训练。

再比如，若执行上述步骤1004a’至步骤1004b’，则训练NWDAF收到模型性能信息通知，则确定启动模型再训练。

比如，若执行上述步骤1004a”至步骤1004b”，则训练NWDAF确定模型性能指标对应的取值达到训练NWDAF预设的性能门限值或者不满足推断NWDAF的模型性能要求，则确定启动模型再训练。

再比如，若执行上述步骤1004a”’至步骤1004b”’，或执行上述步骤1004a””至步骤1004b””，则训练NWDAF根据模型性能评估参考信息，确定模型性能达到训练NWDAF预设的性能门限值，或者不满足推断NWDAF的模型性能要求，则确定启动模型再训练。

步骤1006，训练NWDAF向推断NWDAF发送模型更新请求，携带Analytics ID、新的模型信息以及模型标识。

需要说明的是，模型更新请求可以携带多个模型标识以及每个模型标识对应的新的模型信息。

步骤1007，推断NWDAF向训练NWDAF发送模型更新响应。

步骤1008，推断NWDAF进行模型更新。

也即，推断NWDAF根据接收到的新的模型信息，对正在使用的旧模型(具体是旧的子模型)进行更新或者替换。

其中，上述步骤1006-步骤1008可选步骤。例如，如果步骤805中训练NWDAF确定模型不需要再训练或者训练NWDAF可以容忍模型性能下降到模型性能要求以下或者训练NWDAF上当前不具备模型再训练的能力(如硬件资源有限)，步骤1006-步骤1008可以不执行。

基于上述实施例，通过增加子模型的标识，按照模型粒度进行性能监控，在一个Analytics ID对应多个子模型的场景下可以实现精准的模型再训练与更新，避免浪费训练和传输资源。

实施例七

如图11所示，为本申请实施例提供的又一种训练-推断分离场景下保证模型有效性的方法流程示意图。

该实施例考虑由训练NWDAF进行周期性再训练，并通知推断NWDAF有可用的新模型。该实施例适用于推断NWDAF不具备评估功能的场景，即无法获取推断NWDAF关于模型性能的实时反馈。为了维持模型的性能，训练NWDAF可以周期性的进行再训练。

该实施例包括以下步骤：

步骤1101，训练NWDAF向NRF注册。

训练NWDAF向NRF发送NF注册请求，携带NF配置文件，该NF配置文件包括NF类型，NF服务名称(NF Service)，分析类型标识(Analytics ID)等信息，以及还包括模型索引信息。该模型索引信息可以是模型版本号(version)、位置信息(location)或统一资源定位符(Uniform Resource Locator，URL)等。其中，version表示模型版本，location 或URL表示模型的存储位置，三者中使用任意一个都可以。可选的，当模型索引信息是location或URL，该location或URL中也可以包含version。

相应地，NRF存储NF配置文件以及向训练NWDAF发送NF注册响应。

步骤1102，推断NWDAF发现训练NWDAF，并向训练NWDAF请求获取模型信息。

步骤1103，推断NWDAF向NRF订阅训练NWDAF的状态。

步骤1104，训练NWDAF周期性地启动模型再训练。

比如，训练NWDAF可以设置定时器，每隔固定的时间再训练一次。

步骤1105，训练NWDAF向NRF发送NF更新请求，携带更新的NF配置文件。

该更新的NF配置文件至少携带更新的模型索引信息。可选的，该更新的NF配置文件还携带NF类型，NF服务名称(NF Service)等。

可选的，该更新的NF配置文件中还可以携带更新的模型性能信息，如模型准确度、达到该准确度所需的硬件能力信息、模型推理所需计算量、模型的推理时长、模型的大小等。

步骤1106，NRF更新存储的NF配置文件。

步骤1107，NRF向训练NWDAF发送NF更新响应。

该NF更新响应用于通知NF配置文件更新成功。

步骤1108，NRF向推断NWDAF发送NF状态更新通知，其中携带更新的模型索引信息。

步骤1109，推断NWDAF向训练NWDAF发送模型请求，携带Analytics ID和更新的模型索引信息。

Analytics ID用于指示与该Analytics ID对应的模型。

步骤1110，训练NWDAF向推断NWDAF发送模型响应，携带模型信息。

步骤1111，推断NWDAF进行模型更新。

也即，推断NWDAF根据接收到的新的模型信息，对正在使用的旧模型进行更新。

其中，上述步骤1109-步骤1111可选步骤。例如，如果步骤1108后中推理NWDAF可以容忍模型性能下降到模型性能要求，步骤1109-步骤1111可以不执行。

需要说明的是，上述步骤1104-步骤1108是周期性进行的，因此步骤1109-步骤1111是可选的，因为训练NWDAF只负责进行周期性再训练，是否请求新的模型进行更新由推断NWDAF自行确定。

基于该实施例，在推断NWDAF不具备评估功能的场景下，即训练NWDAF无法获取推断NWDAF关于模型性能的实时反馈时可以进行周期性再训练，以保证模型的性能。

需要说明的是，基于上述实施例七，在当有多个推断NWDAF时，上述步骤1107之后，NRF可以向多个推断NWDAF发送NF状态更新通知，从而使得多个推断NWDAF均可以向训练NWDAF发送模型请求，从而实现多个推断NWDAF的模型更新。

需要说明的是，基于上述实施例七，当一个分析类型标识对应多个子模型，每个子模型用一个模型标识进行标识，则上述步骤1105中还可以携带一个或多个模型标识，以及上述步骤1108中，还可以携带该一个或多个模型标识，进而上述步骤1109中可以携带该一个或多个模型标识，从而实现推断NWDAF中的一个或多个子模型的更新。

实施例八

如图12所示，为本申请实施例提供的又一种训练-推断分离场景下保证模型有效性的方法流程示意图。

该实施例八与实施例七场景相同，即推断NWDAF不具备评估功能时，由训练NWDAF进行周期性再训练，并给推断NWDAF发送模型更新消息。

该实施例包括以下步骤：

步骤1201，训练NWDAF向NRF注册。

相应地，NRF存储NF配置文件以及向训练NWDAF发送NF注册响应。

步骤1202，推断NWDAF发现训练NWDAF，并向训练NWDAF请求获取模型。

步骤1203，训练NWDAF周期性地启动模型再训练。

步骤1204，训练NWDAF向推断NWDAF发送模型更新请求，携带Analytics ID以及新的模型信息。

可选的，模型更新请求中还可以携带新模型的性能信息，如模型准确度、达到该准确度所需的硬件能力信息、模型推理所需计算量、模型的推理时长、模型的大小等。

步骤1205，推断NWDAF向训练NWDAF发送模型更新响应。

步骤1206，推断NWDAF进行模型更新。

其中，上述步骤1204-步骤1206可选步骤。例如，如果步骤1203中训练NWDAF确定训练更新后的模型的模型性能评估结果小于或者等于步骤1202中训练NWDAF向推断NWDAF提供的模型的性能评估结果，步骤1204-步骤1206可以不执行。

基于上述实施例，针对推断NWDAF不具备评估功能的场景，当训练NWDAF无法获取推断NWDAF关于模型性能的实时反馈时可以进行周期性再训练，以保证模型的性能。

需要说明的是，基于上述实施例八，在当有多个推断NWDAF时，上述步骤1204中，训练NWDAF可以向多个推断NWDAF发送模型更新请求，从而实现多个推断NWDAF的模型更新。

需要说明的是，基于上述实施例八，当一个分析类型标识对应多个子模型，每个子模型用一个模型标识进行标识，则上述步骤1204中还可以携带一个或多个模型标识，从而实现推断NWDAF中的一个或多个子模型的更新。

实施例九

该实施例九与上述实施例一至实施例八之间的关系是：上述实施例一至实施例八是该实施例九的各种不同的具体实现方式。如图13所示，为本申请实施例提供的一种通信方法流程示意图。需要说明的是，该实施例九中的第一NWDAF可以是上述实施例一至实施例八中的训练NWDAF，第二NWDAF可以是上述实施例一至实施例八中的推断NWDAF1，第三NWDAF可以是上述实施例一至实施例八中的推断NWDAF2。

该方法包括以下步骤：

步骤1301，第一NWDAF向第二NWDAF发送第三信息。相应地，第二NWDAF收到第三信息。

该第三信息包括模型的性能指标，该模型的性能指标用于获取模型的性能的评估结果。可选的，模型性能指标包括以下一项或多项：精确率、准确率、错误率、召回率、F1分数、均方误差、均方根误差、均方根对数误差、平均绝对误差、模型推理时长、模型鲁棒性、模型可扩展性、模型可解释性。也即，第二NWDAF根据接收到的模型的性能指标，对正在使用的模型进行性能评估，进而得到性能的评估结果，并生成模型的性能报告。

可选的，该第三信息还包括以下一项或多项：分析类型标识、模型的标识、子模型的标识。其中，分析类型标识(Analytics ID)用于指示模型的分析类型，比如可以是Service Experience，Network Performance，UE Mobility等。模型的标识用于标识模型。子模型的标识用于标识该模型的子模型。需要说明的是，当该模型没有子模型，则第三信息可以携带模型的标识，且不需要携带子模型的标识，或者第三信息既不携带模型的标识，也不携带子模型的标识。当该模型有子模型，则需要同时携带模型的标识，以及携带一个或多个子模型的标识。需要说明的是，当第三信息携带子模型的标识，则模型的性能指标用于获取该模型的子模型的性能的评估结果。

其中，关于子模型的具体示例，可以参考上述实施例三以及实施例六的描述。

可选的，该第三信息还包括以下一项或多项：上报周期、门限信息。其中，该上报周期用于指示上报模型的性能报告的时间，也即用于指示第二NWDAF基于该上报周期向第一NWDAF上报模型的性能报告。该门限信息用于指示上报模型的性能报告的条件，也即当第二NWDAF得到的模型的评估结果达到了该门限信息对应的门限值，则第二NWDAF向第一NWDAF上报模型的性能报告。

需要说明的是，该步骤1301为可选步骤。当不执行该步骤1301，则可以预先在第二NWDAF上预先配置上述第三信息，或者是由其它网元向第二NWDAF配置上述第三信息。

步骤1302，第二NWDAF向第一NWDAF发送第一信息。相应地，第一NWDAF收到第一信息。

该第一信息包括模型的性能报告，该模型的性能报告用于指示模型的性能的评估结果，或者，该模型的性能报告用于指示模型的性能的评估结果不满足模型的性能指标的要求。

可选的，第一信息还包括模型的性能报告对应的以下一项或多项信息：时间、区域、切片。该时间指的是生成该模型的性能报告的时间范围，该区域指的是该模型的性能报告对应的区域范围，该切片指的是该模型的性能报告对应的切片信息。

步骤1303，第一NWDAF根据模型的性能报告更新模型的第一模型信息，获得模型的第二模型信息。

步骤1304，第一NWDAF向第二NWDAF发送第二信息。相应地，第二NWDAF收到第二信息。

该第二信息包括第二模型信息。

可选的，第二信息还包括以下一项或多项：模型的标识、子模型的标识、模型的性能评估结果、模型的性能评估结果对应的硬件能力信息、模型的大小、模型的推理时长。其中，模型的性能评估结果对应的硬件能力信息指的是运行该模型所需要的硬件能力要求，如要求具备图形处理器(Graphic Processing Unit，GPU)加速能力，模型的推理时长指的是该模型接收输入到产生输出之间的时延。可选的，每种硬件能力信息对应一种推理时长，硬件能力越强，则推断时长越短。

步骤1305，第二NWDAF根据第二信息，更新模型。

比如，第二NWDAF基于第二信息，使用第二模型信息替换掉第一模型信息，实现模型更新。

可选的，第一NWDAF还可以向除第二NWDAF之外的其它NWDAF(如第三NWDAF)发送第二信息。也即，由第二NWDAF触发第一NWDAF更新模型，得到第二模型信息，但第一NWDAF不仅将第二信息发送给第二NWDAF，还将第二信息发送给第三NWDAF，以实现第三NWDAF对模型进行更新，从而避免第三NWDAF需要单独向第一NWDAF请求模型更新，可以节约信令开销。

其中，关于第一NWDAF向第三NWDAF发送第二信息的具体示例，可以参考上述实施例二以及实施例五的描述。

作为一种实现方法，上述步骤1301具体可以是：第一NWDAF通过NRF向第二NWDAF发送第三信息，上述步骤1302具体可以是：第一NWDAF通过NRF接收来自第二NWDAF的第一信息，上述步骤1304具体可以是：第一NWDAF通过NRF向第二NWDAF发送第二信息。也即，当第一NWDAF与第二NWDAF之间没有接口时，则可以通过NRF作为中间网元，实现第一NWDAF与第二NWDAF之间的交互。

其中，关于通过NRF作为中间网元的具体示例，可以参考上述实施例一至实施例三的描述。

基于上述方案，当第二NWDAF无法完成模型训练时，则第二NWDAF可以向第一NWDAF发送模型的性能报告，从而第一NWDAF可以根据该模型的性能报告对模型进行更新，得到模型的第二模型信息，并将第二模型信息发送给第二NWDAF，使得第二NWDAF可以基于第二模型信息更新模型，从而可以实现在模型性能下降时及时对模型进行训练，进而可以保证模型性能。

示例性的，假设模型为业务体验模型，该模型可以用于基于业务流对应的网络数据(比如业务流对应的终端在基站侧的空口质量、该业务流对应的终端的会话的服务质量流在用户面管理网元上的带宽、时延、抖动等)评估该业务流的业务体验，网络侧策略控制网元(Policy Charging Function，PCF)可以根据该模型的业务体验输出结果确定该业务流的体验要求是否满足，如果不满足，则可以调整该业务的QoS参数。这里，PCF进行QoS参数调整的前提是业务体验模型性能足够好，否则会影响业务体验。比如，以语音业务的业务体验，也就是MOS分(Mean Opinion Score，平均意见分)为例，MOS分要求为3.0分，如果业务流的实际MOS分为2.5分，但是模型的输出MOS分为3.5分，那么PCF不会对业务的QoS参数进行调整，这样就导致业务体验很差，如果模型的性能足够好，那么模型的输出MOS分应该为2.5分，这样PCF就会对业务QoS参数进行调整，使得MOS分达到3.0分以上。针对该示例，模型的性能影响业务体验。并且如果模型性能持续下降，最终可能会恶化到模型完全不可用的程度，造成极差的业务体验或者业务中断。

联邦学习作为一种新型人工智能技术，可以在原始数据不出本域的情况下实现模型跨域联合训练，既可以提高训练的效率，最重要的，可以通过联邦学习技术，避免数据汇聚到数据分析中心时带来的安全问题(比如，原始数据在传输过程中被劫持，原始数据被数据中心错误使用等)。横向联邦学习，作为一种联邦学习技术，适合“特征重复度非常高，但是数据样本之间差异较大”的训练数据场景。

如图14(a)所示，为横向联邦学习的训练过程(以线性回归为例)。可以看到，横向联邦包括一个中心服务器(server)节点以及多个边缘客户端(client)节点(例如，client节点A、client节点B以及client节点K)，这其中，原始数据都分布在各个client节点，server节点不具有原始数据，并且client节点不允许将原始数据发送给server节点。

首先，各个client节点上的数据集(假设共K个client节点，也就是存在K个数据集)分别是：

其中，x为样本数据，y为样本数据对应的标签数据。横向联邦学习中每个样本数据都包括标签，即标签和数据存放在一起。

然后，每个client节点上的数据分析模块可以根据线性回归算法各自训练自己的模型，称之为子模型，即：

h(x _i)＝Θ _Ax _i ^A，h(x _j)＝Θ _Bx _i ^B，...，h(x _K)＝Θ _KKx _k ^K。

假设线性回归所使用的损失函数是均方误差(Mean Squared Error，MSE)，那么每个

子模型训练的目标函数(整个训练的过程就是使得上述损失函数的值最小)为：

下面才真正开始训练过程，针对每一次迭代过程，

(1)每个client节点生成的子模型梯度如下：

(2)每个client上报样本个数以及本地梯度值，即：

N _I以及

其中，N _I表示样本个数，

表示本地梯度值。

(3)server节点收到上述信息后，对梯度进行聚合，如下：

其中，||K||为client节点的个数，P _I＝N _I/∑ _IN _I。

(4)server节点将聚合后的梯度下发给每一个参与训练的client节点，然后client节点本地更新模型参数，如下：

(5)client节点进行模型参数更新后，计算损失函数值L _I，转至步骤(1)。

上述训练过程，server节点可以通过迭代次数控制训练结束，比如训练10000次终止训练，或者通过设置损失函数的阈值控制训练结束，比如L _I≤0.0001时，训练结束。

训练结束后，每个client节点都会保留着同一份模型(可以来自server节点，也可以是本地进一步根据来自server节点本地个性化所得)，用于本地推理。

本申请实施例可以将横向联邦学习与NWDAF相结合，实现模型训练与更新过程。其中，第一NWDAF(也称为Server NWDAF)可以训练模型或者聚合模型，第二NWDAF(也称为Client NWDAF)可以训练模型、更新模型以及使用模型进行推断。

如图14(b)所示，为本申请实施例提供的又一种通信方法流程示意图。该方法包括以下步骤：

步骤1401，第一NWDAF向NRF注册。

第一NWDAF向NRF发送NF注册请求，携带NF配置文件，该NF配置文件包括NF类型，NF服务名称(NF Service,如ModelProvision)，分析类型标识(Analytics ID)等信息。

相应地，NRF存储NF配置文件以及向第一NWDAF发送NF注册响应。

步骤1402，第二NWDAF向NRF注册。

第二NWDAF向NRF发送NF注册请求，携带NF配置文件，该NF配置文件包括NF类型，NF服务名称(NF Service，如ModelUpdate)，分析类型标识(Analytics ID)等信息。

相应地，NRF存储NF配置文件以及向第二NWDAF发送NF注册响应。

步骤1403，第二NWDAF向NRF发送NF发现请求，携带NF配置文件。

比如携带的NF配置文件包含NF类型(如NWDAF)，NF服务名称(NF Service，如ModelProvision，以及携带Analytics ID，则该NF发现请求用于请求从NRF获取对应该Analytics ID的Server NWDAF。

步骤1404，NRF向第二NWDAF发送NF发现响应，其中携带NWDAF实例。

其中，携带的NWDAF实例是Server NWDAF的一个实例，可以用Server NWDAF的ID或IP地址来表示。步骤1405，第一NWDAF向NRF发送NF发现请求，携带NF配置文件。

比如携带的NF配置文件包含NF类型(如NWDAF)，NF服务名称(NF Service，如ModelUpdate)，以及携带Analytics ID，则该NF发现请求用于请求从NRF获取对应该Analytics ID的Client NWDAF。

步骤1406，NRF向第一NWDAF发送NF发现响应，其中携带NWDAF实例。

其中，携带的NWDAF实例是Client NWDAF的一个实例，可以用Client NWDAF的ID或IP地址来表示。

需要说明的是，NF发现响应可以包含一个或多个Client NWDAF实例。

需要说明的是，“步骤1403-步骤1404”以及“步骤1405-步骤1406”可以只执行其中一个，这样，在联邦学习中，可以是Client NWDAF主动触发到Server NWDAF的横向联邦训练，也可以是Server NWDAF主动触发到Client NWDAF横向联邦训练。

其中，上述步骤1401-步骤1406可选步骤。例如，第一NWDAF中配置了第二NWDAF的NF配置文件和/或第二NWDAF中配置了第一NWDAF的NF配置文件，步骤1401-步骤1406可以不执行。

步骤1407，第二NWDAF向第一NWDAF发送模型订阅请求，携带Analytics ID。

该模型订阅请求用于向第一NWDAF订阅该Analytics ID对应的模型索引信息。

步骤1408，第一NWDAF向第二NWDAF发送模型通知1，携带模型索引信息1。

该模型索引信息1即为与Analytics ID对应的模型的索引信息。

该模型通知为与步骤1707的模型订阅请求对应的模型通知。

进一步的，第二NWDAF可以根据该模型索引信息1，获取到相应的模型的第一信息。

步骤1409，第一NWDAF向第二NWDAF发送模型订阅请求，携带模型索引信息1。

该模型订阅请求用于向第二NWDAF请求更新模型索引信息1对应的模型的第一信息，并订阅更新的模型的信息。

步骤1410，模型更新。

具体的，第二NWDAF利用模型索引信息1对应的模型信息进行本地训练，获得的模型的第二信息，并确定的模型的第二信息对应的模型索引信息2。

步骤1411，第二NWDAF向第一NWDAF发送模型通知，携带模型索引信息2。

该模型通知为与步骤1409的模型订阅请求对应的模型通知。

步骤1412，模型更新。

具体的，第一NWDAF利用模型索引信息2对应的模型的第二信息进行本地训练，获得的模型的第三信息，并确定的模型的第三信息对应的模型索引信息3。

可选的，步骤1407-1410中的第二NWDAF可以是多个Client NWDAF的实例，则第一NWDAF在步骤1411可以接收到来自多个第二NWDAF实例的模型索引信息，第一NWDAF根据多个模型索引信息获取对应的多个模型信息，并将多个模型信息进行聚合训练得到更新的模型信息。

步骤1413，第一NWDAF向第二NWDAF发送模型通知，携带模型索引信息3。

该模型通知为与步骤1407的模型订阅请求1对应的模型通知。

后续，可以重复上述步骤1410至步骤1413，并且模型索引信息一直在发生变化，直到第一NWDAF确定停止迭代。可选的，第一NWDAF可以向第二NWDAF发送模型取消订阅消息，也即取消步骤1409对应的模型订阅请求，实现停止迭代。

需要说明的是，该实施例中，模型索引信息可以包括标识信息，该标识信息用于指示该模型索引信息对应的模型的信息。可选的，模型索引信息还包括以下一项或多项：模型对应的分析类型标识、模型的标识、模型的信息的版本信息。

基于上述方案，第一NWDAF与第二NWDAF均可以对模型进行更新得到新的模型信息，并将新的模型信息对应的模型索引信息发送给对方，如此可以实现模型反复迭代，从而可以实现模型性能的逐步提升，最终得到一个模型性能最优的模型，进而可以保证模型性能。

参考图15，为本申请实施例提供的一种通信装置示意图，该通信装置1500包括收发单元1510和处理单元1520。

在第一个实施例中，该通信装置用于实现上述各实施例中对应第一数据分析网元的各个步骤：

收发单元1510，用于接收来自第二数据分析网元的第一信息，所述第一信息包括模型的性能报告，所述模型的性能报告用于指示所述模型的性能的评估结果，或者，所述模型的性能报告用于指示所述模型的性能的评估结果不满足所述模型的性能指标的要求；以及，用于向所述第二数据分析网元发送第二信息，所述第二信息包括所述模型的第二模型信息。处理单元1520，用于根据所述模型的性能报告更新所述模型的第一模型信息，获得所述第二模型信息。

在一种可能的实现方法中，所述收发单元1510，还用于向所述第二数据分析网元发送第三信息，所述第三信息包括所述模型的性能指标，所述模型的性能指标用于获取所述模型的性能的评估结果。

在一种可能的实现方法中，所述收发单元1510，还用于向第三数据分析网元发送所述第二信息。

在一种可能的实现方法中，所述收发单元1510，用于接收来自第二数据分析网元的第一信息，具体包括：用于通过网络存储网元接收来自所述第二数据分析网元的所述第一信息。所述收发单元1510，用于向所述第二数据分析网元发送第二信息，具体包括：用于通过网络存储网元向所述第二数据分析网元发送所述第二信息。

在第二个实施例中，该通信装置用于实现上述各实施例中对应第二数据分析网元的各个步骤：

收发单元1510，用于向第一数据分析网元发送第一信息，所述第一信息包括模型的性能报告，所述模型的性能报告用于指示所述模型的性能的评估结果，或者，所述模型的性能报告用于指示所述模型的性能的评估结果不满足所述模型的性能指标的要求；以及，用于接收来自所述第一数据分析网元的第二信息，所述第二信息包括所述模型的第二模型信息，所述模型的第二信息是根据所述模型的性能报告更新所述模型的第一模型信息得到的。处理单元1520，用于根据所述第二模型信息，更新所述模型。

在一种可能的实现方法中，所述收发单元1510，还用于接收来自所述第一数据分析网元的第三信息，所述第三信息包括所述模型的性能指标，所述模型的性能指标用于获取所述模型的性能的评估结果。

在一种可能的实现方法中，所述收发单元1510，用于向第一数据分析网元发送第一信息，具体包括：用于通过网络存储网元向所述第一数据分析网元发送所述第一信息。所述收发单元1510，用于接收来自所述第一数据分析网元的第二信息，具体包括：用于通过网络存储网元接收来自所述第一数据分析网元的第二信息。

可选地，上述通信装置还可以包括存储单元，该存储单元用于存储数据或者指令(也可以称为代码或者程序)，上述各个单元可以和存储单元交互或者耦合，以实现对应的方法或者功能。例如，处理单元1520可以读取存储单元中的数据或者指令，使得通信装置实现上述实施例中的方法。

应理解以上通信装置中单元的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且通信装置中的单元可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分单元以软件通过处理元件调用的形式实现，部分单元以硬件的形式实现。例如，各个单元可以为单独设立的处理元件，也可以集成在通信装置的某一个芯片中实现，此外，也可以以程序的形式存储于存储器中，由通信装置的某一个处理元件调用并执行该单元的功能。此外这些单元全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件又可以成为处理器，可以是一种具有信号的处理能力的集成电路。在实现过程中，上述方法的各步骤或以上各个单元可以通过处理器元件中的硬件的集成逻辑电路实现或者以软件通过处理元件调用的形式实现。

在一个例子中，以上任一通信装置中的单元可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(application specific integrated circuit，ASIC)，或，一个或多个微处理器(digital singnal processor，DSP)，或，一个或者多个现场可编程门阵列(field programmable gate array，FPGA)，或这些集成电路形式中至少两种的组合。再如，当通信装置中的单元可以通过处理元件调度程序的形式实现时，该处理元件可以是通用处理器，例如中央处理器(central processing unit，CPU)或其它可以调用程序的处理器。再如，这些单元可以集成在一起，以片上系统(system-on-a-chip，SOC)的形式实现。

参考图16，为本申请实施例提供的一种通信装置示意图，用于实现以上实施例中第一数据分析网元或第二数据分析网元的操作。如图16所示，该通信装置包括：处理器1610和接口1630，可选地，该通信装置还包括存储器1620。接口1630用于实现与其他设备进行通信。

以上实施例中第一数据分析网元或第二数据分析网元执行的方法可以通过处理器1610调用存储器(可以是第一数据分析网元或第二数据分析网元中的存储器1620，也可以是外部存储器)中存储的程序来实现。即，第一数据分析网元或第二数据分析网元可以包括处理器1610，该处理器1610通过调用存储器中的程序，以执行以上方法实施例中第一数据分析网元或第二数据分析网元执行的方法。这里的处理器可以是一种具有信号的处理能力的集成电路，例如CPU。第一数据分析网元或第二数据分析网元可以通过配置成实施以上方法的一个或多个集成电路来实现。例如：一个或多个ASIC，或，一个或多个微处理器DSP，或，一个或者多个FPGA等，或这些集成电路形式中至少两种的组合。或者，可以结合以上实现方式。

具体的，图15中的收发单元1510和处理单元1520的功能/实现过程可以通过图16所示的通信装置1600中的处理器1610调用存储器1620中存储的计算机可执行指令来实现。或者，图15中的处理单元1520的功能/实现过程可以通过图16所示的通信装置1600中的处理器1610调用存储器1620中存储的计算机执行指令来实现，图15中的收发单元1510的功能/实现过程可以通过图16中所示的通信装置1600中的接口1630来实现，示例性的，收发单元1510的功能/实现过程可以通过处理器调用存储器中的程序指令以驱动接口1630来实现。

本领域普通技术人员可以理解：本申请中涉及的第一、第二等各种数字编号仅为描述方便进行的区分，并不用来限制本申请实施例的范围，也表示先后顺序。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“至少一个”是指一个或者多个。至少两个是指两个或者多个。“至少一个”、“任意一个”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a,b,或c中的至少一项(个、种)，可以表示：a,b,c,a-b,a-c,b-c,或a-b-c，其中a,b,c可以是单个，也可以是多个。“多个”是指两个或两个以上，其它量词与之类似。

应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包括一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(solid state disk，SSD))等。

本申请实施例中所描述的各种说明性的逻辑单元和电路可以通过通用处理器，数字信号处理器，专用集成电路(ASIC)，现场可编程门阵列(FPGA)或其它可编程逻辑装置，离散门或晶体管逻辑，离散硬件部件，或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器，可选地，该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现，例如数字信号处理器和微处理器，多个微处理器，一个或多个微处理器联合一个数字信号处理器核，或任何其它类似的配置来实现。

本申请实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件单元、或者这两者的结合。软件单元可以存储于随机存取存储器(Random Access Memory，RAM)、闪存、只读存储器(Read-Only Memory，ROM)、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地，存储媒介可以与处理器连接，以使得处理器可以从存储媒介中读取信息，并可以向存储媒介存写信息。可选地，存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个或多个示例性的设计中，本申请所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现，这些功能可以存储与电脑可读的媒介上，或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如，这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置，或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外，任何连接都可以被适当地定义为电脑可读媒介，例如，如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电脑、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、数字通用光盘(英文：Digital Versatile Disc，简称：DVD)、软盘和蓝光光盘，磁盘通常以磁性复制数据，而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。

尽管结合具体特征及其实施例对本申请进行了描述，显而易见的，在不脱离本申请的精神和范围的情况下，可对其进行各种修改和组合。相应地，本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明，且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包括这些改动和变型在内。

Claims

一种通信方法，其特征在于，包括：

第一数据分析网元接收来自第二数据分析网元的第一信息，所述第一信息包括模型的性能报告，所述模型的性能报告用于指示所述模型的性能的评估结果，或者，所述模型的性能报告用于指示所述模型的性能的评估结果不满足所述模型的性能指标的要求；

所述第一数据分析网元根据所述模型的性能报告更新所述模型的第一模型信息，获得所述模型的第二模型信息；

所述第一数据分析网元向所述第二数据分析网元发送第二信息，所述第二信息包括所述第二模型信息。
如权利要求1所述的方法，其特征在于，还包括：

所述第一数据分析网元向所述第二数据分析网元发送第三信息，所述第三信息包括所述模型的性能指标，所述模型的性能指标用于获取所述模型的性能的评估结果。
如权利要求2所述的方法，其特征在于，所述模型性能指标包括以下一项或多项：精确率、准确率、错误率、召回率、F1分数、均方误差、均方根误差、均方根对数误差、平均绝对误差、模型推理时长、模型鲁棒性、模型可扩展性、模型可解释性。
如权利要求2或3所述的方法，其特征在于，所述第三信息还包括以下一项或多项：分析类型标识、所述模型的标识、子模型的标识，所述分析类型标识用于指示所述模型的分析类型。
如权利要求2-4任一所述的方法，其特征在于，所述第三信息还包括以下一项或多项：上报周期、门限信息，所述上报周期用于指示上报所述模型的性能报告的时间，所述门限信息用于指示上报所述模型的性能报告的条件。
如权利要求1-5任一所述的方法，其特征在于，所述第一信息还包括所述模型的性能报告对应的以下一项或多项信息：时间、区域、切片。
如权利要求1-6任一所述的方法，其特征在于，所述第二信息还包括以下一项或多项：所述模型的标识、子模型的标识、所述模型的性能评估结果、所述模型的性能评估结果对应的硬件能力信息、所述模型的大小、所述模型的推理时长。
如权利要求1-7任一所述的方法，其特征在于，还包括：

所述第一数据分析网元向第三数据分析网元发送所述第二信息。
如权利要求1-8任一所述的方法，其特征在于，所述第一数据分析网元接收来自第二数据分析网元的第一信息，包括：

所述第一数据分析网元通过网络存储网元接收来自所述第二数据分析网元的所述第一信息；

所述第一数据分析网元向所述第二数据分析网元发送第二信息，包括：

所述第一数据分析网元通过网络存储网元向所述第二数据分析网元发送所述第二信息。
一种通信方法，其特征在于，包括：

第二数据分析网元向第一数据分析网元发送第一信息，所述第一信息包括模型的性能报告，所述模型的性能报告用于指示所述模型的性能的评估结果，或者，所述模型的性能报告用于指示所述模型的性能的评估结果不满足所述模型的性能指标的要求；

所述第二数据分析网元接收来自所述第一数据分析网元的第二信息，所述第二信息包括所述模型的第二模型信息，所述模型的第二信息是根据所述模型的性能报告更新所述模型的第一模型信息得到的；

所述第二数据分析网元根据所述第二模型信息，更新所述模型。
如权利要求10所述的方法，其特征在于，还包括：

所述第二数据分析网元接收来自所述第一数据分析网元的第三信息，所述第三信息包括所述模型的性能指标，所述模型的性能指标用于获取所述模型的性能的评估结果。
如权利要求11所述的方法，其特征在于，所述模型性能指标包括以下一项或多项：精确率、准确率、错误率、召回率、F1分数、均方误差、均方根误差、均方根对数误差、平均绝对误差、模型推理时长、模型鲁棒性、模型可扩展性、模型可解释性。
如权利要求11或12所述的方法，其特征在于，所述第三信息还包括以下一项或多项：分析类型标识、所述模型的标识、子模型的标识，所述分析类型标识用于指示所述模型的分析类型。
如权利要求11-13任一所述的方法，其特征在于，所述第三信息还包括以下一项或多项：上报周期、门限信息，所述上报周期用于指示上报所述模型的性能报告的时间，所述门限信息用于指示上报所述模型的性能报告的条件。
如权利要求10-14任一所述的方法，其特征在于，所述第一信息还包括所述模型的性能报告对应的以下一项或多项信息：时间、区域、切片。
如权利要求10-15任一所述的方法，其特征在于，所述第二信息还包括以下一项或多项：所述模型的标识、子模型的标识、所述模型的性能评估结果、所述模型的性能评估结果对应的硬件能力信息、所述模型的大小、所述模型的推理时长。
如权利要求10-16任一所述的方法，其特征在于，所述第二数据分析网元向第一数据分析网元发送第一信息，包括：

所述第二数据分析网元通过网络存储网元向所述第一数据分析网元发送所述第一信息；

所述第二数据分析网元接收来自所述第一数据分析网元的第二信息，包括：

所述第二数据分析网元通过网络存储网元接收来自所述第一数据分析网元的第二信息。
一种通信装置，其特征在于，包括：处理器，所述处理器与存储器耦合，所述存储器用于存储程序或指令，当所述程序或指令被所述处理器执行时，使得所述装置执行如权利要求1-9任一所述的方法。
一种通信装置，其特征在于，包括：处理器，所述处理器与存储器耦合，所述存储器用于存储程序或指令，当所述程序或指令被所述处理器执行时，使得所述装置执行如权利要求10-17任一所述的方法。
一种芯片系统，其特征在于，包括：所述芯片系统包括至少一个处理器，和接口电路，所述接口电路和所述至少一个处理器耦合，所述处理器通过运行指令，以执行权利要求1-9任一所述的方法。
一种芯片系统，其特征在于，包括：所述芯片系统包括至少一个处理器，和接口电路，所述接口电路和所述至少一个处理器耦合，所述处理器通过运行指令，以执行权利要求10-17任一所述的方法。
一种通信系统，其特征在于，包括用于执行权利要求1-9任一所述方法的第一数据分析网元，和用于执行权利要求10-17任一所述方法的第二数据分析网元。