WO2022061940A1

WO2022061940A1 - 一种模型数据传输方法及通信装置

Info

Publication number: WO2022061940A1
Application number: PCT/CN2020/118593
Authority: WO
Inventors: 黄谢田; 秦东润; 于益俊; 杨水根
Original assignee: 华为技术有限公司
Priority date: 2020-09-28
Filing date: 2020-09-28
Publication date: 2022-03-31

Abstract

本申请实施例公开了一种模型数据传输方法及通信装置，涉及通信领域，能够提高模型评估的准确性。包括：第一网元确定第一数据集；第一网元从第二网元接收第一信息与第二信息，第一信息用于指示第一模型，第二信息用于请求第二数据集，第二数据集用于训练第一模型或者用于测试第一模型；第一网元向第二网元发送第二数据集，第二数据集为第一数据集的子集。

Description

一种模型数据传输方法及通信装置

技术领域

本申请实施例涉通信领域，尤其涉及一种模型数据传输方法及通信装置。

背景技术

第五代(the 5th generation，5G)通信系统在网络速度、网络延迟等关键性能有了重大飞跃，能够适应多种多样的场景和差异化服务需求。人工智能(artificial intelligence，AI)技术、机器学习(machine learning，ML)技术也逐渐应用在5G通信系统中，例如，使能网络自动化(enabler of network automation，eNA)架构中，网络数据分析功能(network data analytics function，NWDAF)网元可以训练模型，从而可以利用模型进行业务预测、语音识别、人脸识别、物体检测等。

在eNA架构中，NWDAF可以通过事件标识(event ID)向数据收集协调功能(data collection coordination function，DCCF)网元请求数据用于训练模型。其中，一个event ID对应一个数据类型(data Type)。NWDAF还可以通过相同的数据类型向DCCF网元请求数据用于对训练好的模型进行评估。DCCF前后两次根据相同的数据类型向NWDAF返回的数据可能存在交集，即用于模型训练数据和模型评估的数据存在交集，可能导致评估结果不准确。

发明内容

本申请实施例提供一种模型数据传输方法及通信装置，能够提高模型评估的准确性。

第一方面，提供了一种模型数据传输方法，包括：第一网元确定第一数据集；第一网元从第二网元接收第一信息与第二信息，第一信息用于指示第一模型，第二信息用于请求第二数据集，第二数据集用于训练第一模型或者用于测试第一模型；第一网元向第二网元发送第二数据集，第二数据集为第一数据集的子集。

本申请提供的方法中，数据管理功能模块(例如，所述第一网元)可以根据第二网元(例如，模型训练功能模块或模型评估功能模型)发送的第一信息、第二信息确定第二网元请求的是训练集还是测试集，数据管理功能模块可以保证向模型训练功能模块返回的数据和向模型评估功能模块返回的数据不存在交集，从而可以避免用于模型训练的数据和用于模型评估的数据完全相同或者部分相同，提高模型评估的准确性。

结合第一方面，在第一方面的第一种可能的实现方式中，第二信息用于指示第二数据集的类型，第二数据集的类型包括训练集或者测试集，训练集用于训练第一模型，测试集用于测试第一模型；或者，第二信息用于指示第二数据集的范围。

本申请提供了第二信息的具体实现。其中，可以由第一网元划分训练集和测试集，这种方式中第一网元可以通过训练集的类型确定第二网元请求的是训练集还是测试集。或者，由模型管理功能模块(例如，第三网元)，第一网元可以通过数据集的范围确定第二网元请求的是训练集或测试集。

结合第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，第二数据集的范围包括以下一项或多项：第二数据集中数据的key值的范围、第二数据集中数据分布的时间的范围、第二数据集中数据分布的网络区域的范围。

本申请提供了训练集、测试集范围的具体实现，可以根据场景或业务特性划分数据集的范围，从而可以提高模型训练、模型评估的准确性。

结合第一方面或第一方面的第一或第二种可能的实现方式，在第一方面的第三种可能的实现方式中，所述方法还包括：第一网元根据第一信息和第二信息确定第二数据集。

本申请中，第一网元可以根据第一信息确定第一数据集，还可以根据第二信息从第一数据集中划分训练集或测试集，可以第一网元可以根据第一信息、第二信息确定第二网元请求的是训练集还是测试集，从而避免训练集、测试集存在交集，提高模型评估的准确性。

结合第一方面的第三种可能的实现方式，在第一方面的第四种可能的实现方式中，第一网元根据第一信息和第二信息确定第二数据集，包括：第一网元根据数据划分策略从第一数据集中确定第一模型的训练集和/或第一模型的测试集。

本申请提供了划分训练集、测试集的具体实现，可以根据数据划分策略更合理地划分训练集、测试集，从而可以提高模型训练、模型评估的准确性。

结合第一方面的第四种可能的实现方式，在第一方面的第五种可能的实现方式中，所述数据划分策略为以下任意一项：根据数据分布的时间划分、根据数据分布的网络区域进行划分或根据指定比例划分。

本申请还提供了数据划分策略的具体实现，不同的划分策略适用于不同的场景或业务需求，根据数据划分策略更合理地划分训练集和/或测试集。

结合第一方面的第四或第五种可能的实现方式，在第一方面的第六种可能的实现方式中，所述方法还包括：第一网元从第三网元接收数据划分策略；或者，第一网元确定数据划分策略。

本申请还提供了数据划分策略的配置方式，可以是第三网元(例如，模型管理功能模块MMF)为第一网元配置的，也可以是第一网元存储在本地的。

结合第一方面，在第一方面的第七种可能的实现方式中，所述方法还包括：第一网元向第三网元发送与第一模型对应的一个或多个数据类型、与一个或多个数据类型对应的第一数据集的范围，第一数据集的范围包括以下一项或多项：第一数据集中数据的key值的范围、第一数据集中数据分布的时间的范围、第一数据集中数据分布的网络区域的范围。

本申请中，当第三网元划分测试集、训练集，第一网元需要向第三网元上报根据第一模型的需求(例如，数据类型)收集到的数据的范围，以便第三网元根据第一网元收集到的数据的范围划分训练集的范围、测试集的范围。

结合第一方面或第一方面的第一至第七种可能的实现方式中的任意一种可能的实现方式，在第一方面的第八种可能的实现方式中，所述方法还包括：第一网元从第二网元接收第三信息，第三信息包括以下一项或多项：第一模型的一个或多个数据类型、第一模型所需数据的采集对象，采集对象包括以下至少一项：一个或多个用户设备UE、一个或多个小区cell。

本申请中，第一网元还可以从第二网元接收第二网元的数据需求(例如，第三信息所指示的需求)，以便为第二网元订阅数据，用于第二网元训练模型或评估模型。

结合第一方面的第八种可能的实现方式，在第一方面的第九种可能的实现方式中，第一网元确定第一数据集，包括：第一网元根据第三信息从第四网元获取第一数据集；或者，第一网元根据第三信息从第五网元获取第三数据集或者第三数据集的信息，第三数据集的信息用于指示第三数据集的范围，根据第三信息从第四网元获取第四数据集，根据第三数据集和第四数据集确定第一数据集。

本申请提供了第一网元确定第一数据集的具体实现，第一网元可以在第二网元发起数据订阅后，根据第二网元的数据需求向接入网设备(例如，第四网元)订阅数据，订阅的数据可以构成第一数据集。或者，存在多个数据管理功能模块的场景下，例如，存在第一网元和第五网元，第一网元可以根据第二网元的数据需求向第五网元收集数据，再将自身收集到的数据和从第五网元获取的数据进行合并、去重，在存在多个数据管理功能模块的场景下，根据本申请提供的方法，依然能够保证模型的训练集、测试集不存在交集，提高模型评估的准确性。

第二方面，提供一种模型数据传输方法，所述方法包括：第二网元向第一网元发送第一信息与第二信息，第一信息用于指示第一模型，第二信息用于请求第二数据集，第二数据集用于训练第一模型或者用于测试第一模型；第二网元从第一网元接收第二数据集，第二数据集为第一数据集的子集。

本申请提供的方法中，模型训练功能模块(例如，所述第二网元)可以向数据管理功能模块(例如，所述第一网元)请求用于模型训练的数据，模型评估功能模块(例如，所述第二网元)可以向数据管理功能模块请求用于模型评估的数据，本申请实施例提供的传输方法可以保证向模型训练功能模块返回的数据和向模型评估功能模块返回的数据不存在交集，从而可以避免用于模型训练的数据和用于模型评估的数据完全相同或者部分相同，提高模型评估的准确性。

结合第二方面，在第二方面的第一种可能的实现方式中，第二信息用于指示第二数据集的类型，第二数据集的类型包括训练集或者测试集，训练集用于训练第一模型，测试集用于测试第一模型；或者，第二信息用于指示第二数据集的范围。

结合第二方面的第一种可能的实现方式，在第二方面的第二种可能的实现方式中，第二数据集的范围包括以下一项或多项：第二数据集中数据的key值的范围、第二数据集中数据分布的时间的范围、第二数据集中数据分布的网络区域的范围。

结合第二方面或第二方面的第一或第二种可能的实现方式，方法还包括：

第二网元向第一网元发送第三信息，第三信息包括以下一项或多项：第一模型的一个或多个数据类型、第一模型所需数据的采集对象，采集对象包括以下至少一项：一个或多个用户设备UE、一个或多个小区cell。

本申请中，第二网元还可以发起数据订阅流程，向第一网元发送第三信息，指示第二网元的数据需求，以便第一网元根据第二网元的数据需求收集数据第二网元训练模型或评估模型。

第三方面，提供了一种模型数据传输方法，所述包括：第三网元确定数据划分策略，数据划分策略用于从第一数据集中确定第二数据集，第二数据集用于训练第一模型或者第二数据集用于测试第一模型；第三网元向第一网元发送数据划分策略。

本申请还提供了数据划分策略的配置方式，可以是第三网元(例如，模型管理功能模块MMF)为第一网元配置的，

本申请提供的方法中，模型管理功能模块(例如，第三网元)可以为数据管理功能模块(例如，所述第一网元)配置数据划分策略，第一网元在保证训练集、测试集不存在交集的同时，可以合理地划分训练集、测试集，进一步提高模型训练、模型评估的准确性。

结合第三方面，在第三方面的第一种可能的实现方式中，数据划分策略为以下任意一项：根据数据分布的时间划分、根据数据分布的网络区域进行划分或根据指定比例划分。

第四方面，提供了一种模型数据传输方法，所述包括：第三网元根据第一数据集的范围确定第二数据集的范围，第二数据集为第一数据集的子集，第二数据集用于训练第一模型或者用于测试第一模型；第三网元向第二网元发送第二数据集的范围，第二数据集的范围用于第二网元从第一网元请求第二数据集。

本申请提供的方法中，模型管理功能模块(例如，第三网元)可以划分训练集的范围、测试集的范围，在保证训练集、测试集不存在交集的同时，可以合理地划分训练集、测试集，进一步提高模型训练、模型评估的准确性。

结合第四方面，在第四方面的第一种可能的实现方式中，第二数据集的范围包括以下一项或多项：第二数据集中数据的key值的范围、第二数据集中数据分布的时间的范围、第二数据集中数据分布的网络区域的范围。

结合第四方面或第四方面的第一种可能的实现方式中，所述方法还包括：

从第一网元接收与第一模型对应的一个或多个数据类型、与一个或多个数据类型对应的第一数据集的范围，数据集的范围包括以下一项或多项：第一数据集中数据的key值的范围、第一数据集中数据分布的时间的范围、第一数据集中数据分布的网络区域的范围。

第五方面，提供一种通信装置，该通信装置可以是第一网元，该通信装置包括：处理单元，用于确定第一数据集；通信单元，用于从第二网元接收第一信息与第二信息，第一信息用于指示第一模型，第二信息用于请求第二数据集，第二数据集用于训练第一模型或者用于测试第一模型；通信单元还用于，向第二网元发送第二数据集，第二数据集为第一数据集的子集。

结合第五方面，在第五方面的第一种可能的实现方式中，第二信息用于指示第二数据集的类型，第二数据集的类型包括训练集或者测试集，训练集用于训练第一模型，测试集用于测试第一模型；或者，第二信息用于指示第二数据集的范围。

结合第五方面的第一种可能的实现方式，在第五方面的第二种可能的实现方式中，第二数据集的范围包括以下一项或多项：第二数据集中数据的key值的范围、第二数据集中数据分布的时间的范围、第二数据集中数据分布的网络区域的范围。

结合第五方面或第五方面的第一或第二种可能的实现方式，在第五方面的第三种可能的实现方式中，处理单元还用于，根据第一信息和第二信息确定第二数据集。

结合第五方面的第三种可能的实现方式，在第五方面的第四种可能的实现方式中，数据划分策略为以下任意一项：根据数据分布的时间划分、根据数据分布的网络区域进行划分或根据指定比例划分。

结合第五方面的第三或第四种可能的实现方式，在第五方面的第五种可能的实现方式中，通信单元还用于，从第三网元接收数据划分策略；或者，第一网元确定数据划分策略。

结合第五方面，在第五方面的第六种可能的实现方式中，通信单元还用于，向第三网元发送与第一模型对应的一个或多个数据类型、与一个或多个数据类型对应的第一数据集的范围，第一数据集的范围包括以下一项或多项：第一数据集中数据的key值的范围、第一数据集中数据分布的时间的范围、第一数据集中数据分布的网络区域的范围。

结合第五方面或第五方面的第一至第六种可能的实现方式中的任意一种可能的实现方式，在第五方面的第七种可能的实现方式中通信单元还用于，从第二网元接收第三信息，第三信息包括以下一项或多项：第一模型的一个或多个数据类型、第一模型所需数据的采集对象，采集对象包括以下至少一项：一个或多个用户设备UE、一个或多个小区cell。

结合第五方面的第七种可能的实现方式，在第五方面的第八种可能的实现方式中，处理单元具体用于，根据第三信息从第四网元获取第一数据集；或者，

根据第三信息从第五网元获取第三数据集或者第三数据集的信息，第三数据集的信息用于指示第三数据集的范围，根据第三信息从第四网元获取第四数据集，根据第三数据集和第四数据集确定第一数据集。

第六方面，提供了一种通信装置，该通信装置可以是第二网元，包括：处理单元，用于确定第一信息与第二信息，第一信息用于指示第一模型，第二信息用于请求第二数据集，第二数据集用于训练第一模型或者用于测试第一模型；通信单元，用于向第一网元发送第一信息与第二信息；通信单元，还用于从第一网元接收第二数据集，第二数据集为第一数据集的子集。

结合第六方面，在第六方面的第一种可能的实现方式中，第二信息用于指示第二数据集的类型，第二数据集的类型包括训练集或者测试集，训练集用于训练第一模型，测试集用于测试第一模型；或者，第二信息用于指示第二数据集的范围。

结合第六方面的第一种可能的实现方式，在第六方面的第二种可能的实现方式中，第二数据集的范围包括以下一项或多项：第二数据集中数据的key值的范围、第二数据集中数据分布的时间的范围、第二数据集中数据分布的网络区域的范围。

结合第六方面或第六方面的第一或第二种可能的实现方式，在第六方面的第三种可能的实现方式中，通信单元还用于，向第一网元发送第三信息，第三信息包括以下一项或多项：第一模型的一个或多个数据类型、第一模型所需数据的采集对象，采集对象包括以下至少一项：一个或多个用户设备UE、一个或多个小区cell。

第七方面，提供了一种通信装置，该装置可以是第三网元，包括：处理单元，用于确定数据划分策略，数据划分策略用于从第一数据集中确定第二数据集，第二数据集用于训练第一模型或者第二数据集用于测试第一模型；通信单元，用于向第一网元发送数据划分策略。

结合第七方面，在第七方面的第一种可能的实现方式中，数据划分策略为以下任意一项：根据数据分布的时间划分、根据数据分布的网络区域进行划分或根据指定比例划分。

第八方面，提供了一种通信装置，该装置可以是第三网元，包括：处理单元，用于根据第一数据集的范围确定第二数据集的范围，第二数据集为第一数据集的子集，第二数据集用于训练第一模型或者用于测试第一模型；通信单元，向第二网元发送第二数据集的范围，第二数据集的范围用于第二网元从第一网元请求第二数据集。

结合第八方面，在第八方面的第一种可能的实现方式中，第二数据集的范围包括以下一项或多项：第二数据集中数据的key值的范围、第二数据集中数据分布的时间的范围、第二数据集中数据分布的网络区域的范围。

结合第八方面或第八方面的第一种可能的实现方式，在第八方面的第二种可能的实现方式中，通信单元还用于，从第一网元接收与第一模型对应的一个或多个数据类型、与一个或多个数据类型对应的第一数据集的范围，数据集的范围包括以下一项或多项：第一数据集中数据的key值的范围、第一数据集中数据分布的时间的范围、第一数据集中数据分布的网络区域的范围。

第九方面，提供了一种通信装置，包括至少一个处理器和存储器，所述至少一个处理器与所述存储器耦合；所述存储器，用于存储计算机程序；

所述至少一个处理器，用于执行所述存储器中存储的计算机程序，以使得所述装置执行如上述第一方面以及第一方面任意一种实现方式所述的方法，或上述第二方面以及第二方面任意一种实现方式所述的方法，或上述第三方面以及第三方面任意一种实现方式所述的方法，或上述第四方面以及第四方面任意一种实现方式所述的方法。

第十方面，提供了一种计算机可读存储介质，包括：计算机可读存储介质中存储有指令；当计算机可读存储介质在上述第五方面以及第五方面任意一种实现方式所述的通信装置上运行时，使得通信装置执行如上述第一方面以及第一方面任意一种实现方式所述的通信方法。

第十一方面，提供了一种计算机可读存储介质，包括：计算机可读存储介质中存储有指令；当计算机可读存储介质在上述第六方面以及第六方面任意一种实现方式所述的通信装置上运行时，使得通信装置执行如上述第二方面以及第二方面任意一种实现方式所述的通信方法。

第十二方面，提供了一种计算机可读存储介质，包括：计算机可读存储介质中存储有指令；当计算机可读存储介质在上述第七方面以及第七方面任意一种实现方式所述的通信装置上运行时，使得通信装置执行如上述第三方面以及第三方面任意一种实现方式所述的通信方法。

第十三方面，提供了一种计算机可读存储介质，包括：计算机可读存储介质中存储有指令；当计算机可读存储介质在上述第八方面以及第八方面任意一种实现方式所述的通信装置上运行时，使得通信装置执行如上述第四方面以及第四方面任意一种实现方式所述的通信方法。

第十四方面，提供了一种无线通信装置，该通信装置包括处理器，例如，应用于通信装置中，用于实现上述第一方面以及第一方面任意一种实现方式所述的方法，或上述第二方面以及第二方面任意一种实现方式所述的方法，或上述第三方面以及第三方面任意一种实现方式所述的方法，或上述第四方面以及第四方面任意一种实现方式所述的方法。该通信装置例如可以是芯片系统。在一种可行的实现方式中，所述芯片系统还包括存储器，所述存储器，用于保存实现上述第一方面所述方法的功能必要的程序指令和数据。

上述方面中的芯片系统可以是片上系统(system on chip，SOC)，也可以是基带芯片等，其中基带芯片可以包括处理器、信道编码器、数字信号处理器、调制解调器和接口模块等。

第十五方面，提供了一种通信系统，所述通信系统包括上述任意一种实现方式所述的第一网元、第二网元以及第三网元。

结合第十五方面，在第十五方面的第一种可能的实现方式中，所述通信系统还包括第四网元、第五网元。第四网元可以是接入网设备，第五网元可以是数据管理功能模块。

附图说明

图1为本申请实施例提供的网络架构的示意图；

图2为本申请实施例提供的另一网络架构的示意图；

图3为本申请实施例提供的另一网络架构的示意图；

图4a为本申请实施例提供的通信装置的结构示意图；

图4b为本申请实施例提供的通信装置的另一结构示意图；

图5为本申请实施例提供的模型数据传输方法的流程示意图；

图6a为本申请实施例提供的训练集、测试集的示意图；

图6b为本申请实施例提供的训练集、测试集的另一示意图；

图7～图15为本申请实施例提供的模型数据传输方法的另一流程示意图；

图16～图17为本申请实施例提供的通信装置的另一结构框图。

具体实施方式

本申请实施例提供一种模型相关的系统架构。参考图1，该网络架构包括模型管理功能(modelmanagement function，MMF)模块10，模型训练功能(modeltraining function，MTF)模块20，数据管理功能(datamanagement function，DMF)模块30，模型评估功能(modelevaluation function，MEF)模块40以及接入网设备50。该网络架构支持在无线通信网络中应用无线人工智能(artificial intelligence，AI)技术、机器学习(machine learning，ML)技术。

其中，接入网设备是网络中用于将终端设备接入到无线网络的设备。所述接入网设备可以为无线接入网中的节点，又可以称为基站，还可以称为无线接入网(radio access network，RAN)节点(或设备)。网络设备可以包括长期演进(long term evolution， LTE)系统或演进的LTE系统(LTE-Advanced，LTE-A)中的演进型基站(NodeB或eNB或e-NodeB，evolutional Node B)，如传统的宏基站eNB和异构网络场景下的微基站eNB，或者也可以包括第五代移动通信技术(5th generation mobile networks，5G)新无线(new radio，NR)系统中的下一代节点B(next generation node B，gNB)，或者还可以包括无线网络控制器(radio network controller，RNC)、节点B(Node B，NB)、基站控制器(base station controller，BSC)、基站收发台(base transceiver station，BTS)、传输接收点(transmission reception point，TRP)、家庭基站(例如，home evolved NodeB，HeNB或home Node B，HNB)、基带单元(base band unit，BBU)、基带池BBU pool，或WiFi接入点(access point，AP)等，再或者还可以包括云接入网(cloud radio access network，CloudRAN)系统中的集中式单元(centralized unit，CU)和分布式单元(distributed unit，DU)，本申请实施例并不限定。在接入网设备包括CU和DU的分离部署场景中，CU支持无线资源控制(radio resource control，RRC)、分组数据汇聚协议(packet data convergence protocol，PDCP)、业务数据适配协议(service data adaptation protocol，SDAP)等协议；DU主要支持无线链路控制层(radio link control，RLC)、媒体接入控制层(media access control，MAC)和物理层协议。

另外，MTF负责训练模型；MEF负责评估训练好的模型的性能；MMF负责对模型进行管理，例如，生命周期管理、触发模型训练或模型评估等。DMF负责订阅和存储模型需要的数据，向MTF、MEF提供数据。例如，DMF可以从RAN收集数据；DMF可以向MTF发送数据用于MTF训练模型，DMF可以向MEF发送数据用于MEF评估或测试模型的性能。

需要说明的是，图1所示网络架构中，不同的功能模块可以分设在不同的设备上，也可以合设在同一个设备。例如，图1所示为模型训练和评估功能分离部署的场景，即MTF和MEF部署在不同的网元中。此外，图1仅示出了本申请实施例涉及的功能模块，图1所示系统还可以包括其他网元或功能模块，本申请实施例对此不做限制。

一种可能的实现方式中，图1所示的网络架构可以应用到使能网络自动化eNA(enabler of network automation，)架构中。eNA架构是基于网络数据分析功能(network data analytics function，NWDAF)的智能网络架构，如图2所示，eNA架构包括NWDAF功能模块、数据收集协调功能(datacollection coordination function，DCCF)模块以及网络功能(network function，NF)模块。其中，NWDAF可以向DCCF请求数据，DCCF可以从NF收集数据。

本申请实施例中，MTF和MEF可以由两个不同的NWDAF实现，例如，MTF和MEF分别是图2所示的NWDAF1、NWDAF2。DMF可以由DCCF实现。MMF可以由另一个NWDAF实现(NWDAF3)，也可以与MTF共部署在NWDAF1中，或与MEF共部署在NWDAF2中。

另一种可能的实现方式中，图1所示的网络架构还可以应用到图3所示的网络架构中。参考图3，该网络架构包括操作维护管理模块(operations administrationand maintenance，OAM)、第一无线控制器以及第二无线控制器。其中，第一无线控制器主要用于提供无线网络控制面的功能，第二无线控制器和OAM主要用于提供管理面的功能。第一无线控制器、第二无线控制器可以通过部署不同的业务功能模块来实现功能业务，OAM和第一无线控制器通过不同的接口从RAN收集数据。

本申请实施例，MTF和MEF可以分别由图3中不同的功能模块来实现。例如，MTF可以部署在第二无线控制器中，MEF可以部署在第一无线控制器中，MMF可以部署在OAM中或第二无线控制器中，OAM和第一无线控制器都部署有DMF。

本申请实施例提供一种模型数据的传输方法，模型训练功能模块可以向数据管理功能模块请求用于模型训练的数据，模型评估功能模块可以向数据管理功能模块请求用于模型评估的数据，本申请实施例提供的传输方法可以保证向模型训练功能模块返回的数据和向模型评估功能模块返回的数据不存在交集，从而可以避免用于模型训练的数据和用于模型评估的数据完全相同或者部分相同，提高模型评估的准确性。

首先，对本申请实施例涉及的术语进行解释说明：

(1)模型

模型可以是人工智能(artificial intelligence，AI)模型、机器学习(machine learning，ML)模型。模型可以认为是实现计算机自动“学习”的算法。本申请实施例中，网元可以利用ML/AI模型实现特定业务功能。例如，利用模型进行故障预测、业务类型/模式预测、用户轨迹/位置预测、业务感知预测、干扰预测、网络关键绩效指标(key performance indicators，KPI)预测等。基于这些预测，可实现主动式的网络管理和控制，有效提升网络运维效率和网络资源利用效率，并提供个性化、差异化的网络服务能力。

示例的，根据UE上报的参考信号接收功率(reference signal receiving power，RSRP)、参考信号接收质量(reference signal receiving quality，RSRQ)或信号与干扰加噪声比(signal to interference plus noise ratio，SINR)等指标以及小区的资源利用率预测UE在该小区的性能，例如，UE的吞吐率，根据预测结果选择接入(或切换至)性能最优的小区。或者，UE利用ML/AI模型进行人脸识别、预测车辆行驶信息等。

(2)模型对应的数据类型

数据类型可以称为data Type，通过数据类型可以识别不同的数据。数据类型可以是参考信号接收功率(reference signal receiving power，RSRP)，参考信号接收质量(reference signal receiving quality，RSRQ)、下行数据量(Data Volume in DL)等，模型对应的数据类型可以用来指示训练模型、评估模型所需的数据。示例的，模型对应的数据类型可以是RSRP，可以利用UE的RSRP数据来训练模型，模型训练好之后也可以利用UE的RSRP数据来评估模型的性能。

(3)模型的训练集

模型的训练集中的数据用于训练模型，训练集中数据的类型为模型对应的数据类型。例如，将训练集中的数据输入初始的模型，确定模型的参数。其中，模型的参数可以是网络的权重、偏置、梯度值等，本申请实施例对此不作限制。

(4)模型的测试集

模型的测试集中的数据用于评估(或测试)模型，测试集中数据的类型为模型对应的数据类型。例如，将测试集中的数据输入训练好的模型，评估模型的性能。示例的，可以根据模型的输出结果和实际结果的比较验证模型输出结果是否准确，从而可以对模型性能的高低进行评估。

(5)数据集类型

本申请实施例中，数据集类型(或数据集的类型)包括训练集、测试集。其中，数据集的类型为训练集，表明数据集为模型的训练集。数据集的类型为测试集，表明数据集为模型的测试集。

本申请实施例所述的网元，可以通过图4a中的通信装置410来实现。图4a所示为本申请实施例提供的通信装置410的硬件结构示意图。该通信装置410包括处理器4101以及至少一个通信接口(图4a中仅是示例性的以包括通信接口4103为例进行说明)，可选的，还包括存储器4102。其中，处理器4101、存储器4102以及通信接口4103之间互相连接。

处理器4101可以是一个通用中央处理器(central processing unit，CPU)，微处理器，特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制本申请方案程序执行的集成电路。

通信接口4103，使用任何收发器一类的装置，用于与其他设备或通信网络进行通信，如以太网，无线接入网(radio access network，RAN)，无线局域网(wireless local area networks，WLAN)等。

存储器4102可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory，EEPROM)、只读光盘(compact disc read-only memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，也可以与处理器相连接。存储器也可以和处理器集成在一起。

其中，存储器4102用于存储执行本申请方案的计算机执行指令，并由处理器4101来控制执行。处理器4101用于执行存储器4102中存储的计算机执行指令，从而实现本申请下述实施例提供的意图处理方法。

可选的，本申请实施例中的计算机执行指令也可以称之为应用程序代码，本申请实施例对此不作具体限定。

在具体实现中，作为一种实施例，处理器4101可以包括一个或多个CPU，例如图4a中的CPU0和CPU1。

在具体实现中，作为一种实施例，通信装置410可以包括多个处理器，例如图4a中的处理器4101和处理器4106。这些处理器中的每一个可以是一个单核(single-CPU)处理器，也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。

在具体实现中，作为一种实施例，通信装置410还可以包括输出设备4104和输入设备4105。输出设备4104和处理器4101通信，可以以多种方式来显示信息。例如，输出设备4104可以是液晶显示器(liquid crystal display，LCD)，发光二级管(light emitting diode，LED)显示设备，阴极射线管(cathode ray tube，CRT)显示设备，或投影仪(projector)等。输入设备4105和处理器4101通信，可以以多种方式接收用户的输入。例如，输入设备4105可以是鼠标、键盘、触摸屏设备或传感设备等。

上述的通信装置410可以是一个通用设备或者是一个专用设备。在具体实现中，通信装置410可以是台式机、便携式电脑、网络服务器、掌上电脑(personal digital assistant，PDA)、移动手机、平板电脑、无线终端装置、嵌入式设备或有图4a中类似结构的设备。本申请实施例不限定通信装置410的类型。

需要说明的是，通信装置410可以是终端整机，也可以是实现终端上的功能部件或组件，也可以是通信芯片，例如基带芯片等。通信装置410是终端整机时，通信接口可以是射频模块。当通信装置410为通信芯片，通信接口4103可以是该芯片的输入输出接口电路，输入输出接口电路用于读入和输出基带信号。

本申请实施例所述的网元还可以通过图4b所示的通信装置来实现。参考图4b，通信装置包括至少一个处理器4201、至少一个收发器4203、至少一个网络接口4204和一个或多个天线4205。可选的，还包括至少一个存储器4202。处理器4201、存储器4202、收发器4203和网络接口4204相连，例如通过总线相连。天线4205与收发器4203相连。网络接口4204用于通信装置通过通信链路与其它通信设备相连，例如通信装置通过S1接口与核心网网元相连。在本申请实施例中，所述连接可包括各类接口、传输线或总线等，本实施例对此不做限定。

本申请实施例中的处理器，例如处理器4201，可以包括如下至少一种类型：通用中央处理器(central processing unit，CPU)、数字信号处理器(digital signal processor，DSP)、微处理器、特定应用集成电路专用集成电路(application-specific integrated circuit，ASIC)、微控制器(microcontroller unit，MCU)、现场可编程门阵列(field programmable gate array，FPGA)、或者用于实现逻辑运算的集成电路。例如，处理器4201可以是一个单核(single-CPU)处理器或多核(multi-CPU)处理器。至少一个处理器4201可以是集成在一个芯片中或位于多个不同的芯片上。

本申请实施例中的存储器，例如存储器4202，可以包括如下至少一种类型：只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是EEPROM。在某些场景下，存储器还可以是只读光盘(compact disc read-only memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。

存储器4202可以是独立存在，与处理器4201相连。可选的，存储器4202也可以和处理器4201集成在一起，例如集成在一个芯片之内。其中，存储器4202能够存储执行本申请实施例的技术方案的程序代码，并由处理器4201来控制执行，被执行的各类计算机程序代码也可被视为是处理器4201的驱动程序。例如，处理器4201用于执行存储器4202中存储的计算机程序代码，从而实现本申请实施例中的技术方案。

收发器4203可以用于支持通信装置与其他网元之间射频信号的接收或者发送，收发器4203可以与天线4205相连。具体地，一个或多个天线4205可以接收射频信号，该收发器4203可以用于从天线接收所述射频信号，并将射频信号转换为数字基带信号或数字中频信号，并将该数字基带信号或数字中频信号提供给所述处理器4201，以便处理器4201对该数字基带信号或数字中频信号做进一步的处理，例如解调处理和译码处理。此外，收发器4203可以用于从处理器4201接收经过调制的数字基带信号或数字中频信号，并将该经过调制的数字基带信号或数字中频信号转换为射频信号，并通过一个或多个天线4205发送所述射频信号。具体地，收发器4203可以选择性地对射频信号进行一级或多级下混频处理和模数转换处理以得到数字基带信号或数字中频信号，所述下混频处理和模数转换处理的先后顺序是可调整的。收发器4203可以选择性地对经过调制的数字基带信号或数字中频信号时进行一级或多级上混频处理和数模转换处理以得到射频信号，所述上混频处理和数模转换处理的先后顺序是可调整的。数字基带信号和数字中频信号可以统称为数字信号。收发器可以称为收发电路、收发单元、收发器件、发送电路、发送单元或者发送器件等等。

需要说明的是，通信装置420可以是通信装置整机，也可以是实现通信装置功能的部件或组件，也可以是通信芯片。当通信装置420为通信芯片，收发器4203可以是该芯片的接口电路，该接口电路用于读入和输出基带信号。

本申请实施例提供一种模型数据传输方法，如图5所示，所述方法包括以下步骤：

501、第一网元确定第一数据集。

其中，第一网元还可以称为数据管理功能模块，用于收集数据、管理数据。第一网元可以是图1所示网络架构中的DMF，或者是图2所示网络架构中的DCCF，或是DCCF中用于实现数据收集、数据管理的功能模块，或者是图3所示网络架构中的OAM，或是OAM中用于实现数据收集、数据管理的功能模块。

需要说明的是，机器学习技术、人工智能技术需要依靠大量的数据进行模型训练，训练结束后对模型性能进行评估，通过测试的模型才会上线用于相关的业务。本申请实施例中，第二网元可以训练模型、对训练好的模型进行评估。

其中，第二网元可以是模型训练功能模块或模型评估功能模块，第二网元可以从第一网元获取数据。本申请实施例中，第二网元可以是图1所示网络架构中的MTF或MEF，也可以是图2所示网络架构中的NWDAF1，所述NWDAF1可以负责模型训练。或者，第二网元可以是图2所示NWDAF1中用于实现模型训练的功能模块。或者，第二网元是图2所示网络架构中的NWDAF2，所述NWDAF2可以负责模型评估。或者，第二网元可以是图2所示NWDAF2中用于实现模型评估的功能模块。或者，第二网元是图3所示网络架构中的第二无线控制器，或者是第二无线控制器中用于实现模型训练的功能模块。或者，第二网元是图3所示网络架构中的第一无线控制器，或者是第一无线控制器中用于实现模型评估的功能模块。

本申请实施例中，第一网元可以通过以下两种方式确定第一数据集：

第一种、接入网设备可以进行数据采集、数据记录，第一网元可以通过数据订阅流程从接入网设备获取模型所需的数据，其中，模型所需的数据可以用于模型训练或模型评估。

具体地，当第二网元启动某个模型(例如，本申请实施例所述的第一模型)的训练流程，第二网元可以向第一网元发送数据订阅请求，所述数据订阅请求用于指示第二网元的数据需求，所述数据需求用于表征训练所述第一模型所需的数据。例如，所述数据订阅请求包括第三信息，所述第三信息包括以下一项或多项：所述第一模型对应的一个或多个数据类型、所述第一模型所需数据的采集对象，所述采集对象包括以下至少一项：一个或多个用户设备UE、一个或多个小区cell。

第一网元接收第二网元发送的数据订阅请求，根据第二网元的数据需求向接入网设备订阅数据。例如，第一网元向接入网设备发送第三信息。接入网设备可以根据第三信息确定第二网元订阅的数据，接入网设备还可以向第一网元发送所述第二网元订阅的数据。

一种可能的实现方式中，步骤501中第一网元确定第一数据集的具体实现包括：所述第一网元从第四网元接收所述第一数据集。其中，第四网元为接入网设备。

第二种、第一网元可以对来自其他网元的数据进行合并、去重处理，确定第一数据集。

本申请实施例适用于模型训练功能、模型评估功能分离部署的场景，在此场景中，还可以部署多个负责数据管理的网元。具体地，可以在靠近模型训练功能模块的区域部署一个负责数据管理的网元，模型训练功能模块可以从该网元获取数据；可以在靠近模型评估功能模块的区域部署一个负责数据管理的网元，模型评估功能模块可以从该网元获取数据。例如，负责数据管理的网元可以是本申请实施例所述的第一网元和第五网元。其中，第一网元可以靠近模型训练功能模块部署，当第二网元为负责模型训练的功能模块，第二网元可以从第一网元获取数据。第五网元可以靠近模型评估功能模块部署，当第二网元为负责模型评估的功能模块，第二网元可以从第五网元获取数据。

需要说明的是，多个管理数据的网元中有一个网元(以下简称主管理网元)可以对其他负责数据管理的网元收集到的数据进行汇总、去重后下发给其他管理数据的网元。例如，第一网元负责对数据进行汇总、去重。

具体地，第一网元在数据订阅流程中可以根据第二网元的需求从接入网设备获取第四数据集。

第一网元还可以根据第二网元的需求从第五网元获取第三数据集或第三数据集的信息。例如，第一网元向第五网元发送第三信息，用于指示第二网元的数据需求。第五网元接收第一网元发送的第三信息后，根据第三信息确定符合第二网元需求的第三数据集，还可以向第一网元发送第三数据集。

或者，第五网元向第一网元发送第三数据集的信息，其中，第三数据集的信息可以是第三数据集的范围，第三数据集的范围可以是以下一项或多项：第三数据集中数据的键key值的取值范围、第三数据集中数据分布的时间的范围、第三数据集中数据分布的网络区域的范围。

此外，第一网元对第四数据集和第三数据集中的数据进行汇总、去重，获得最终用于模型训练、模型评估的数据集，即本申请实施例所述的第一数据集。

一种可能的实现方式中，第一网元确定第一数据集的具体实现包括：所述第一网元从第五网元接收第三数据集或者第三数据集的信息。

所述第一网元还可以从第四网元(例如，前文所述的接入网设备)接收第四数据集，根据所述第三数据集和所述第四数据集确定所述第一数据集。示例的，第一网元可以对第三数据集、第四数据集中的数据进行合并，再去除重复的数据，获得第一数据集。

需要说明的是，第一网元确定第一数据集后，还可以记录所述第一模型对应的一个或多个数据类型、所述第一数据集之间的对应关系。

或者，第一网元可以获取到第一模型的标识与所述第一模型对应的一个或多个数据类型之间的对应关系，第一网元确定第一数据集后，维护第一数据集和第一模型的标识之间的对应关系。

一种可能的实现方式中，第一网元从第二网元接收第一模型的标识与所述第一模型对应的一个或多个数据类型之间的对应关系。或者，从第三网元(例如，模型管理功能模块)接收第一模型的标识与所述第一模型对应的一个或多个数据类型之间的对应关系。

502、第二网元向第一网元发送第一信息和第二信息。所述第一信息用于指示第一模型，所述第二信息用于请求第二数据集，所述第二数据集用于训练所述第一模型或者用于测试所述第一模型。

本申请实施例中，当第二网元需要进行模型训练时，可以向第一网元请求训练集；当第二网元需要进行模型评估时，可以向第一网元请求测试集。

具体实现中，第二网元可以向第一网元发送数据请求消息(data query)，数据请求消息包括第一信息和第二信息。其中，第一信息用于指示第一网元所训练或评估的模型，第二信息用于请求模型的训练集或测试集。

具体地，第一信息可以是第一模型的标识，例如，第一信息为第一模型的model ID。区别于划分数据集的不同网元，第二信息有以下两种实现可能：

第一种、可以由第一网元划分模型的训练集、模型的测试集，在这种方式中，第二网元可以通过数据集的类型向第一网元请求模型的训练集或测试集。

示例的，第二网元发送的第二信息用于指示所述第二数据集的类型。在这种实现方式中，第二数据集的类型包括训练集(train)或者测试集(test)，所述训练集用于训练所述第一模型，所述测试集用于测试所述第一模型。

第二种、可以由第三网元(用于对模型进行管理，例如，本申请实施例所述的模型管理功能模块MMF)划分模型的训练集、测试集。

一种可能的实现方式中，第三网元还可以向第二网元通知划分的结果。具体地，第三网元可以向第二网元通知训练集的范围或测试集的范围。其中，训练集的范围可以是训练集中数据的key值的取值范围，或者是训练集中数据分布的时间的范围，或者是训练集中数据分布的网络区域的范围。测试集的范围可以是测试集中数据的key值的取值范围，或者是测试集中数据分布的时间的范围，或者是测试集中数据分布的网络区域的范围。

在这种方式中，第二网元可以通过训练集的范围向第一网元请求训练集，或者通过测试集的范围向第一网元请求测试集。示例的，第二网元向发送第一网元的第二信息用于指示所述第二数据集的范围；所述第二数据集是所述第一模型的训练集或所述第一模型的测试集。

其中，所述第二数据集的范围包括以下一项或多项：所述第二数据集中数据的key值的范围、所述第二数据集中数据分布的时间的范围、所述第二数据集中数据分布的网络区域的范围。

另一种可能的实现方式中，第三网元划分模型的训练集、测试集后，还可以向第一网元通知对第一数据集划分的结果。

第一网元从第三网元接收划分结果后，可以记录第一数据集对应的一个或多个数据类型、划分结果之间的对应关系。例如，记录第一数据集对应的一个或多个数据类型、训练集的范围、测试集的范围之间的对应关系。其中，第一数据集对应的一个或多个数据类型即第一模型对应的一个或多个数据类型。

在这种方式中，第二网元可以通过数据集类型请求向第一网元请求模型的训练集或测试集。

需要说明的是，第二网元发送的数据请求消息还可以包括数据类型(data Type)，所述数据类型为所述第一模型对应的一个或多个数据类型，所述第一模型对应的一个或多个数据类型用于表征训练、评估所述第一模型所需数据的类型。

503、所述第一网元从第二网元接收第一信息与第二信息，根据所述第一信息和第二信息向所述第二网元发送所述第二数据集，所述第二数据集为所述第一数据集的子集。

一种可能的实现方式中，由第一网元划分模型的训练集和/或模型的测试集，第二网元可以通过数据集类型(例如，训练集或测试集)向第一网元请求模型的训练集或测试集。具体地，第一网元从第二网元接收第一信息和第二信息后，根据第一信息确定第一数据集，还可以根据第二信息指示的数据集类型从第一数据集中确定第二数据集。其中，第一信息可以是第一模型的标识，第一网元可以确定第一模型的标识关联(对应)的数据类型，即用于训练、评估第一模型的数据的数据类型。第一网元还可以根据确定的数据类型确定相应的数据，这些数据构成第一数据集。

示例的，第一网元维护了第一数据集和第一模型的标识之间的对应关系，步骤503第一网元接收第一信息后，根据第一信息确定第一模型的标识，还可以根据第一模型的标识确定与其对应的第一数据集。进一步，若第二信息指示第二网元请求的是第一模型的训练集，例如，第二信息的值为“train”，则从第一数据集中划分出子集作为第一模型的训练集，并向第一网元发送该子集。

若第二信息指示第二网元请求的是第一模型的测试集，例如，第二信息的值为“test”，则从第一数据集中划分出子集作为第一模型的测试集，并向第一网元发送该子集。

需要说明的是，第一网元可以根据数据划分策略从第一数据集中划分第一模型的训练集和/或第一模型的测试集。

其中，所述数据划分策略为以下任意一项：根据数据分布的时间划分、根据数据分布的网络区域进行划分或根据指定比例划分。

具体实现中，所述第一网元从第三网元接收所述数据划分策略；或者，所述第一网元确定所述数据划分策略。

另一种可能的实现方式中，由第三网元划分模型的训练集和/或模型的测试集。第二网元可以从第三网元接收划分结果，例如，第一模型的训练集的范围或第一模型的测试集的范围。第二网元还可以根据训练集的范围向第一网元请求第一模型的训练集，还可以根据测试集的范围向第一网元请求第一模型的测试集。

具体地，第一网元接收第二网元发送的第一信息和第二信息后，根据第一信息确定第一数据集，还可以根据第二信息指示的范围从第一数据集中确定第二数据集。其中，第一信息可以是第一模型的标识，第二信息可以是测试集的范围或训练集的范围。

示例的，第一网元维护了第一数据集和第一模型的标识之间的对应关系，步骤503第一网元接收第一信息后，根据第一信息确定第一模型的标识，还可以根据第一模型的标识确定与其对应的第一数据集。第一网元还可以根据第二信息指示的范围从第一数据集中划分出一个子集，作为第二数据集。

示例的，第三网元划分的训练集的key值范围是(x～y)，测试集的key值范围是(w～z)。当第二网元向第一网元请求第一模型的训练集，第一信息可以是第一模型的标识，第二信息可以是训练集的范围“(x～y)”。第一网元可以将第一数据集中key值范围是(x～y)的数据作为第二数据集，即第二网元所请求的训练集。

当第二网元向第一网元请求第一模型的测试集，第一信息可以是第一模型的标识，第二信息可以是测试集的范围“(w～z)”。第一网元可以将第一数据集中key值范围是(w～z)的数据作为第二数据集，即第二网元所请求的测试集。

需要说明的是，当第二网元向第一网元请求数据时，第二网元还可以向第一网元发送所述第一模型对应的一个或多个数据类型。例如，第二网元发送的数据请求消息中除了第一信息、第二信息外，还包括所述第一模型对应的一个或多个数据类型。当步骤501中，第一网元维护所述第一模型对应的一个或多个数据类型、所述第一数据集的对应关系，第一网元接收所述数据请求消息后还可以根据所述第一模型对应的一个或多个数据类型索引到第一数据集。

可选的，在第三网元划分训练集、测试集，向第二网元通知划分的结果的实现方式中，第二网元通过数据集的范围和数据类型向第一网元请求训练集或测试集。

例如，第二网元向第一网元发送第一模型对应的一个或多个数据类型以及训练集的范围，第一网元根据所述第一模型对应的一个或多个数据类型、所述第一数据集的对应关系，确定第一数据集。根据训练集的范围从所述第一数据集中划分出第一模型的训练集。

或者，第二网元向第一网元发送第一模型对应的一个或多个数据类型以及测试集的范围，第一网元根据所述第一模型对应的一个或多个数据类型、所述第一数据集的对应关系，确定第一数据集。根据测试集的范围从所述第一数据集中划分出第一模型的训练集。

可选的，图5所示的方法还包括：第二网元向第一网元订阅数据，具体地，第二网元向第一网元发送第三信息，所述第三信息用于表征第一网元的数据需求。

具体地，所述第三信息包括以下一项或多项：所述第一模型对应的一个或多个数据类型、所述第一模型所需数据的采集对象，所述采集对象包括以下至少一项：一个或多个用户设备UE、一个或多个小区cell。

可选的，在第三网元划分训练集、测试集的场景中，第一网元还可以向第三网元上报第一模型所需数据的范围，以便第三网元根据数据的范围划分训练集的范围和/或测试集的范围。其中，所述第一模型所需数据可以是所述第一网元根据所述第一模型对应的一个或多个数据类型从接入网设备订阅的数据。

示例的，图5所示的方法还包括：所述第一网元向第三网元发送与所述第一模型对应的一个或多个数据类型、与所述一个或多个数据类型对应的所述第一数据集的范围，所述第一数据集的范围包括以下一项或多项：所述第一数据集中数据的key值的范围、所述第一数据集中数据分布的时间的范围、所述第一数据集中数据分布的网络区域的范围。

当存在多个负责管理数据的网元，主管理网元可以其他网元收集到的数据进行合并、去重处理，并根据处理后的数据集划分训练集和/或测试集。主管理网元还可以向其他网元发送划分的测试集或测试集，以便模型训练功能模块可以从部署较近的网元获取训练集，模型评估功能模块可以部署较近的网元获取测试集，缩短模型数据的传输时延。例如，负责数据管理的网元为本申请实施例所述的第一网元和第五网元。假设第一网元负责对数据进行合并、去重处理，且第一网元靠近模型训练功能模块部署，第五网元靠近模型评估功能模块部署。第一网元划分训练集后，模型训练功能模块可以向第一网元请求训练集。第一网元还可以向第五网元发送测试集或测试集的信息，第五网元可以从第一网元接收测试集或测试集的信息，模型评估功能模块可以向第五网元请求测试集。

或者，第一网元负责对数据进行合并、去重处理，且第五网元靠近模型训练功能模块部署，第一网元靠近模型评估功能模块部署。第一网元划分训练集和测试集后，模型评估功能模块可以向第一网元请求测试集。第一网元还可以向第五网元发送训练集或训练集的信息，第五网元可以从第一网元接收训练集或训练集的信息，模型训练功能模块可以向第五网元请求训练集。

参考图6a，第一数据集可以划分成训练集、测试集两部分，即训练集、测试集的数据不存在交集，且训练集、测试集的数据总和构成第一数据集。或者，参考图6b，测试集、训练集均为第一数据集的子集，且训练集、测试集的数据总和小于第一数据集。

以下以第一网元为DMF，第二网元为MTF或MEF，第三网元为MMF为例，详细介绍本申请实施例提供的模型数据传输方法。

图7所示的方法中，MTF、MEF可以在数据请求消息中增加两个参数：模型标识和数据集类型，使得DMF可以根据这两个参数区分所请求的是测试数据还是训练数据，DMF向MTF、MEF返回的训练集和测试集不存在交集，从而可以提高模型评估的准确性。如图7所示，所述方法包括以下步骤：

701、数据订阅和收集流程。

具体地，MTF、MEF分别进行模型训练、模型评估，MTF、MEF还可以分别向DMF订阅训练模型所需的数据、评估模型所需的数据。例如，MTF可以向DMF发送数据需求，所述数据需求用于指示训练模型(以下称为第一模型)对应的一个或多个数据类型(datatype)以及数据采集对象，所述采集对象包括以下至少一项：一个或多个用户设备UE、一个或多个小区cell。MEF向DMF发送评估该模型对应的一个或多个数据类型(datatype)以及对应数据类型的采集对象，所述采集对象包括以下至少一项：一个或多个用户设备UE、一个或多个小区cell。

DMF可以从MTF、MEF接收训练模型、评估模型所需要数据的数据类型(datatype)以及对应数据类型的采集对象。

DMF还可以根据数据类型(data type)以及数据的采集对象向RAN请求数据，完成数据收集。DMF从RAN接收数据后，还可以以数据集的形式记录从RAN收集到的数据。例如，MTF为模型1发起数据订阅，在数据订阅过程中向DMF指示模型1对应的数据类型“RSRP”以及数据采集对象“cell 1”。DMF根据“RSRP”、“cell 1”向RAN发起数据收集，DMF从RAN接收收集到的数据。

702、启动模型训练流程。

具体实现中，MTF接收启动模型训练的消息之后启动模型训练。例如，MMF向MTF发送指示消息触发MTF进行模型训练，该指示消息包括第一模型的模型标识，例如model ID。

703、MTF向DMF发送数据请求消息1，数据请求消息1包括模型标识、数据类型以及数据集类型。

其中，数据请求消息1中的模型标识用于指示MTF所训练的模型，例如，前文所述的第一模型，模型标识可以是model ID；数据请求消息1中的数据类型用于指示第一模型对应的一个或多个数据类型，数据类型可以是“data Type”；数据集类型用于指示MTF所请求的数据集，数据集类型可以是“dataset Type”。例如，数据请求消息1中的数据集类型“dataset Type”的值可以是“train”。

可选地，数据请求消息1还可以包括数据子集信息，用于指示MTF所请求的数据子集的详细信息，例如，数据子集的大小，其中，数据子集的大小用于表征数据子集中的数据量，例如，数据子集的大小为1000，即数据子集包括1000记录。

704、DMF根据数据类型确定数据集1，将该数据集1划分为训练集和测试集。

具体实现中，DMF根据数据类型确定匹配的数据集，以下将该数据集称为数据集1。

例如，步骤701中DMF从RAN接收数据，记为数据集1，并记录数据集1与数据类型“RSRP”的对应关系。在步骤704中DMF可以根据数据类型“RSRP”索引到数据集1。

或者，步骤701执行后，DMF持续从RAN收集数据，直至步骤703接收到MTF的数据请求消息，在此期间DMF根据数据类型“RSRP”收集到的数据构成数据集1，DMF还可以记录数据集1与数据类型“RSRP”的对应关系。在步骤704中DMF可以根据数据类型“RSRP”索引到数据集1。

或者，步骤703中MTF发送的数据请求消息可以指示一个时间范围，DMF根据该时间范围内收集到的数据构成数据集1，DMF还可以记录数据集1与数据类型“RSRP”的对应关系。在步骤704中DMF可以根据数据类型“RSRP”索引到数据集1。

另外，DMF可以自行确定数据集划分方法，也可以预先配置数据集划分方法。数据集划分方法可以是随机划分，或者按数据分布的时间划分等。例如，根据datatype匹配到3个月(4月1日-6月30日)的数据，DMF可以将前87天(4月1日～6月27日)的数据划分为训练集，用于训练模型；还可以将最后3天(6月28日～6月30日)的数据划分为测试集，用于模型评估。

此外，DMF划分好训练集和测试集之后，还可以根据模型标识(modelID)管理划分后的数据集。例如，用标签“modelID:train”来标记训练集数据，用标签“modelID:test”来标记测试集数据。

需要说明的是，如果DMF没有查询到MTF所请求的数据，则返回NACK消息，包含错误原因。

705、DMF向MTF返回训练集。

具体实现中，DMF根据数据请求消息1中数据子集标识(datasetType)的值为“train”，将训练集返回给MTF。

需要说明的是，如果DMF中没有查找到MTF所请求的训练集，则向MTF返回否定应答(negative acknowledgement，NACK)消息，NACK消息可以包含错误原因。

706、MTF利用训练集进行模型训练。

707、MEF启动评估流程。

具体实现中，MEF接收启动模型评估的消息之后启动模型训练。例如，MMF向MEF发送指示消息触发MEF进行模型评估，该指示消息包括模型标识，例如model ID。

708、MEF向DMF发送数据请求消息2，数据请求消息2包括模型标识以及数据集类型。

其中，模型标识用于指示MEF所评估的模型，模型标识可以是model ID；数据集类型用于指示MEF所请求的数据集，数据集类型可以是“dataset Type”。例如，数据请求消息2中的数据集类型“dataset Type”的值可以是“test”。

需要说明的是，DMF在步骤104中划分训练集以及测试集之后，可以利用模型标识以及数据集类型标记了测试集、数据集。因此，MEF请求测试集时，数据请求消息2可以不携带数据类型，携带模型标识以及数据集类型即可。

709、DMF根据数据请求消息2中的模型标识以及数据集类型确定测试集。

具体实现中，DMF可以根据model ID、dataset Type的值查找到MEF所请求的测试集。例如，数据请求消息2中dataset Type的值为“test”，数据类型为“RSRP”。DMF可以索引到从数据集1中划分的测试集。

需要说明的是，如果DMF中没有查找到MEF所请求的测试集，则向MEF返回NACK消息，NACK消息可以包含错误原因。

710、DMF向MEF发送测试集。

711、MEF利用测试集进行模型评估。

图7所示的方法中，在请求数据时通过模型标识指示使用数据的模型，通过数据集类型指示所请求的数据为训练集还是测试集，DMF在数据请求消息后，可以根据数据子集标识明确所请求的是训练集还是测试集，向MTF返回训练集，向MEF返回测试集，可以保证下发的训练集和测试集之间不存在交集，确保模型评估结果的准确性。

图8所示的方法中，MMF可以确定数据划分策略，并将确定数据划分策略发送给DMF，DMF根据MMF下发的划分策略划分训练集以及测试集。如图8所示，所述方法包括以下步骤：

801、数据订阅和收集流程。

具体实现参考前文步骤701的相关描述，在此不做赘述。

802、MMF向DMF发送数据信息查询请求。

具体地，MMF根据模型对应的数据类型(data Type)向DMF查询数据信息，数据信息查询请求包括MMF查询的一个或多个数据类型以及需要查询的数据信息。其中，查询的数据信息可以是以下一项或多项：与数据类型对应的数据集的数据量、与所述一个或多个数据类型对应的数据集的数据分布范围、与所述一个或多个数据类型对应的数据集中数据的key值的范围。其中，数据分布范围可以是数据分布的时间段或数据分布的网络区域等。

803、DMF向MMF发送数据信息。

804、MMF确定数据划分策略(split Policy)，将数据划分策略发送给DMF。

需要说明的是，步骤802、步骤803为可选步骤，MMF可以根据数据信息确定数据划分策略。

当不执行步骤802、步骤803，DMF也可以不依靠数据信息确定数据划分策略，此时，DMF数据划分策略可以是常用的划分策略，如，随机划分或按指定比例划分。

split Policy可以包括划分方式(split Method)和划分比例(split Ratio)。其中split Method可以是随机划分，split Ratio用于指示训练集和测试集的数据量比值，例如4:1，即确定模型所需的数据后，将其中80％的数据划分为训练集，剩余20％的数据划分为测试集。

Split Policy也可以是按时间固定划分，即按时间顺序取前x％的数据作为训练集，其余数据作为测试集。其中，x是根据split Ratio确定的数值。

804发送的消息中除划分策略外，还包含模型标识，和/或，数据类型，DMF维护模型标识或数据类型与划分策略的对应关系。

805、MMF给MTF发送消息触发MTF进行模型训练。

其中，MMF发送的消息包括模型标识。

806、MTF向DMF发送数据请求消息1，数据请求消息1包括模型标识、数据类型以及数据集类型。

其中，模型标识用于指示MTF所训练的模型，模型标识可以是model ID；数据类型用于指示MTF训练模型所需数据的类型，数据类型可以是“data Type”；数据集类型用于指示MTF所请求的数据集，数据集类型可以是“dataset Type”。例如，数据请求消息1中的数据集类型“dataset Type”的值可以是“train”。

807、DMF根据MMF发送的数据划分策略将数据集划分为训练集和测试集。

具体实现中，DMF首先确定与数据类型对应的数据，根据这些数据构建数据集。然后，根据804中模型标识或数据类型与划分策略的对应关系索引到数据集的划分策略，按照指定的策略完成划分。

步骤808～步骤814同前文所述的步骤705～步骤711，在此不做赘述。

需要说明的是，图8所示方法适用于模型管理功能可能与模型训练功能分离部署的场景，也适用于模型管理功能可能与模型训练功能共部署的场景。可选的，DMF在收到划分策略后就进行数据集划分，即步骤807在步骤806之前、步骤804之后执行，可以减少步骤806之后的等待时间。

图8所示方法中，MMF可以根据专家经验、数据信息、场景特性等确定更合理的数据划分策略，并将划分策略发送给DMF，为DMF划分数据集提供依据。保证测试集与训练集不存在交集的同时，通过合理的划分数据集，进一步改善模型训练和评估效果。

图9所示的方法中，由MMF直接划分训练集和测试集，将划分结果告知MTF和MEF，MTF和MEF各自向DMF请求数据。如图9所示，所述方法包括以下步骤：

901、数据订阅和收集流程。

具体实现参考前文步骤701的相关描述，在此不做赘述。

902、MMF向DMF发送数据信息查询请求。

其中，数据信息查询请求包括数据类型列表(data Type List)和数据信息。数据类型列表包括模型(例如，本申请实施例所述的第一模型)的一个或多个数据类型。数据信息是MMF期望查询的数据信息，例如，与所述一个或多个数据类型对应的数据集的数据量、与所述一个或多个数据类型对应的数据集的数据分布范围、与所述一个或多个数据类型对应的数据集中数据的key的范围。其中，数据分布范围可以是数据分布的时间段或数据分布的网络区域等。

903、DMF向MMF返回指定的数据信息。

需要说明的是，如果DMF没有MMF所查询data Type对应的数据。则向MMF返回NACK消息，包含错误原因。

904、MMF确定训练集的范围以及测试集的范围。

具体实现中，根据获取的数据信息划分训练集和测试集。

如果MMF查询到了数据的分布范围，MMF可以将数据分布范围划分成两部分，分布对应训练集和测试集。例如，MMF查询到DMF当前共收集到3个月(4月1日-6月30日)的数据，MMF确定的数据划分策略可以是：前87天(4月1日-6月27日)的数据用于模型训练，最后3天(6月28日-6月30日)的数据用于模型测试。

或者，MMF查询到了数据的key，MMF可以将数据的key划分成两部分，分布对应训练集和测试集。例如，MMF查询到DMF当前收集到的数据的key值为100～1000，MMF确定的数据划分策略可以是：key值在100～900范围的数据用于模型训练，key值在901～1000范围的数据用于模型评估。

此外，MMF可以根据场景、数据特性或经验进行划分，本申请实施例对此不做限制。

905、MMF向MTF发送消息触发模型训练，该消息包括模型标识以及训练集的范围。

示例的，MMF向MTF发送的消息包括模型的标识以及该模型的训练数据的范围，例如，“4月1日-6月27日”，即“4月1日-6月27日”的数据用于训练模型。

906、MTF向DMF发送数据请求消息，该消息包括数据类型和训练集的范围。

需要说明的是，MTF可以维护数据类型data type和模型标识model ID之间的对应关系，MTF从MMF接收模型标识以及训练集的范围后，可以确定与模型标识对应的数据类型，从而可以确定数据类型、模型标识以及训练集的范围之间的对应关系。

MTF还可以根据数据类型和训练集的范围向DMF请求训练数据。

907、DMF向MTF返回训练集。

具体实现中，DMF确定与MTF所发送的数据类型对应的数据，再根据训练集的范围从这些数据中划分出训练集。具体地，DMF可以根据数据类型确定匹配的数据集，以下将该数据集称为数据集1。

例如，步骤901中DMF从RAN接收数据，记为数据集1，并记录数据集1与数据类型“RSRP”的对应关系。在步骤907中DMF可以根据数据类型“RSRP”索引到数据集1。

或者，步骤901执行后，DMF持续从RAN收集数据，直至步骤906接收到MTF的数据请求消息，在此期间DMF根据数据类型“RSRP”收集到的数据构成数据集1，DMF还可以记录数据集1与数据类型“RSRP”的对应关系。在步骤907中DMF可以根据数据类型“RSRP”索引到数据集1。

或者，步骤906中MTF发送的数据请求消息可以指示一个时间范围，DMF根据该时间范围内收集到的数据构成数据集1，DMF还可以记录数据集1与数据类型“RSRP”的对应关系。在步骤907中DMF可以根据数据类型“RSRP”索引到数据集1。

示例的，MTF所发送的数据类型为“RSRP”，DMF根据数据类型“RSRP”所发送的数据类型确定出“4月1日-6月30日”的RSRP数据。由于训练集的范围是“4月1日-6月27日”，DMF则将“4月1日-6月27日”的RSRP数据作为训练集发送给MTF。

908、MTF利用训练集进行模型训练。

909、MMF给MEF发送消息触发评估，消息内容包括模型标识以及测试集的范围。

示例的，MMF向MTF发送的消息包括模型的标识以及该模型的测试数据的范围，例如，“6月28日-6月30日”，即“6月28日-6月30日”的数据用于评估模型。

910、MEF向DMF发送数据请求消息，该消息包括数据类型和测试集的范围。

需要说明的是，MEF可以维护数据类型data type和模型标识model ID之间的对应关系，MEF从MMF接收模型标识以及测试集的范围后，可以确定与模型标识对应的数据类型，从而可以确定数据类型、模型标识以及测试集的范围之间的对应关系。

MEF还可以根据数据类型和测试集的范围向DMF请求测试数据。

911、DMF向MEF返回测试集。

具体实现中，DMF确定与MEF所发送的数据类型对应的数据，再根据测试集的范围从这些数据中划分出训练集。具体地，DMF根据数据类型确定数据集1，再根据训练集的范围从该数据集中划分出训练集。

需要说明的是，步骤911根据MEF所发送的数据类型查找到的数据集、步骤907根据MTF所发送数据类型查找到的数据集相同，例如，本申请实施例所述的数据集1。

示例的，MEF所发送的数据类型为“RSRP”，DMF根据数据类型“RSRP”确定出RSRP数据。由于测试集的范围是“6月28日-6月30日”，DMF则将“6月28日 -6月30日”的RSRP数据作为测试集发送给MEF。

912、MEF利用测试集进行模型评估。

图9所示的方法中，MMF向DMF查询数据信息后划分训练集和测试集，将划分结果告知MTF和MEF，MTF和MEF各自向DMF请求数据。MMF进行数据集划分时可以保证训练集和测试集之间不存在交集，因此确保了模型评估结果的准确性。

此外，图9所示的方法中，DMF无需区分训练集和测试集，简化了DMF内部操作，且数据请求消息中无需增加参数。

图10所示的方法中，在下发数据划分策略的消息中增加数据类型，MTF、MEF后续请求数据时无需传输数据类型，DMF可以根据模型标识索引到模型对应的数据类型。如图10所示，所述方法包括以下步骤：

1001、数据订阅和收集流程。

具体实现参考前文步骤701的相关描述，在此不做赘述。

1002、MMF向DMF发送数据信息查询请求。

具体地，MMF可以针对某一个模型(例如，本申请实施例所述的第一模型)发起数据查询请求，以便触发后续流程划分该模型的训练集和/或测试集。

MMF可以根据该模型对应的数据类型(data Type)向DMF查询数据信息，数据信息查询请求包括MMF查询的一个或多个数据类型以及数据信息。其中，查询的数据信息可以是以下中一项或多项：与所述一个或多个数据类型对应的数据集的数据量、与所述一个或多个数据类型对应的数据集的数据分布范围、与所述一个或多个数据类型对应的数据集中数据的key的范围。其中，数据分布范围可以是数据分布的时间段或数据分布的网络区域等。

1003、DMF向MMF发送数据信息。

需要说明的是，步骤1002、步骤1003为可选步骤，MMF也可以不执行查询数据信息的步骤，直接确定数据划分策略。

1004、MMF向DMF发送模型配置消息，该消息包括模型标识(model ID)、数据类型(data Type)和数据划分策略(split Policy)。

具体地，模型配置消息中的数据类型为所述模型对应的一个或多个数据类型，模型配置消息中的数据划分策略与模型配置消息中的模型标识对应，数据划分策略用于确定模型标识指示的模型的训练集和/或测试集。

1005、MMF给MTF发送消息触发模型训练，该消息包括模型标识。

其中，消息触发模型训练中的模型标识用于指示MTF触发该模型标识所指示模型的训练流程。

1006、MTF向DMF发送数据请求消息1，该消息包括模型标识(model ID)、数据集子集类型“dataset Type＝train”。

需要说明的是，通过步骤1004的模型配置消息，DMF可以确定模型标识对应的数据类型，因此在步骤1006中MTF无需发送模型对应的数据类型，仅需要指示模型标识以及数据集类型，DMF可以根据模型标识索引到模型对应的数据类型。

步骤1007～步骤1014同前文所述的步骤704～步骤711，具体实现参考前文，在此不做赘述。

图10所示的方法中，将模型对应的数据类型提前发送给DMF，MTF或MEF请求数据时无需发送模型对应的数据类型，节省信令的传输开销。

图11所示的方法中，MMF通过不同的消息将模型对应的数据划分策略(split Policy)和数据类型(data Type)分别发送给DMF。如图11所示，所述方法包括以下步骤：

1101、数据订阅和收集流程。

具体实现参考前文步骤701的相关描述，在此不做赘述。

1102、MMF向DMF发送模型标识和数据类型。

本申请实施例中，MMF可以针对某一个模型(例如，本申请实施例所述的第一模型)发起步骤1102，以触发后续流程确定该模型对应的数据划分策略。

需要说明的是，步骤1102中MMF向DMF发送的模型标识用于指示该模型，MMF向DMF发送的数据类型是该模型对应的一个或多个数据类型。

1103～1104为可选步骤，与前文所述的802～803相同，在此不做赘述。

1105、MMF向DMF发送模型配置消息，该消息包括模型标识(model ID)、数据划分策略(split Policy)。

1106、MMF给MTF发送消息触发训练，该消息模型标识。

1107、MTF向DMF发送数据请求消息，该消息包括模型标识(model ID)、数据集类型(dataset Type＝“train”)。

1108～1115同前文所述的步骤704～步骤711，具体实现参考前文，在此不做赘述。

图11所示的方法中，模型对应的数据类型和数据集随划分策略分开下发，步骤1102在步骤1107之前执行即可。

本申请实施例还提供一种模型数据传输方法，MTF和MEF可以从不同的DMF获取数据，两个DMF之间可以先进行数据同步，数据同步之后再进行数据集的划分。其中，DMF1可以向MTF提供数据，DMF2可以向MEF提供数据。如图12所示，所述方法包括以下步骤：

1201、数据订阅和收集流程。

具体实现中，MTF和MEF分别向DMF1和DMF2发起数据订阅请求，包含模型(例如，本申请实施例所述的第一模型)需订阅的数据需求，DMF1和DMF2根据数据需求向接入网设备订阅数据，具体实现参考前文所述的步骤701，在此不做赘述。

1202、MTF启动模型训练。

一种可能的实现方式中，MMF向MTF发送模型训练触发消息，该消息模型标识(model ID)。

需要说明的是，模型训练触发消息用于触发MTF启动模型(例如，第一模型)的训练，该消息中的model ID用于指示所述模型。

1203、MTF向DMF1发送数据请求消息1，该消息内容中包括模型标识(model ID)，数据集类型(dataset Type＝“train”)和数据类型(data Type)。

其中，MTF发送的数据请求消息1中dataset Type(即本申请实施例所述的第二信息)的值为“train”，指示MTF请求的是训练集。

1204、DMF1向DMF2发送所述模型对应的一个或多个数据类型。

需要说明的是，DMF1还可以向DMF2发送MTF在数据订阅流程中的其他数据需求，例如，所述模型所需数据的采集对象，所述采集对象包括以下至少一项：一个或多个用户设备UE、一个或多个小区cell。

1205、DMF2根据所述一个或多个数据类型确定数据，向DMF1发送确定的数据。

1206、DMF1从DMF2接收数据，对数据进行合并、去重，获得数据集1。

具体实现中，DMF1在数据订阅流程中根据MTF的数据需求从接入网设备获取了一部分数据，从DMF2接收数据后，对这两部分数据进行合并、去重，获得数据集1。数据集1用于划分所述模型的训练集、测试集。

1207、DMF1将数据集1划分为训练集和测试集。

需要说明的是，DMF1还可以根据model ID管理划分的训练集、测试集，以便后续可以根据model ID查找到从数据集1划分的训练集和测试集。

示例的，给训练集和测试集数据分别打上标签model ID:train和model ID:test。

此外，数据集划分方法可以由DMF自行确定，例如，按照指定的比例随机划分，按时间固定划分等。

1208、DMF1向MTF发送训练集。

1209、DMF1向DMF2发送测试集。

需要说明的是，步骤1209在步骤1207之后，步骤1212之前执行即可。

DMF1发送的测试集和前文所述的model ID是绑定的，具体标签可以是“model ID:test”，指示测试是该model ID所指示模型对应的测试集。

1210、MEF启动模型评估

一种可能的实现方式中，MMF向MEF发送消息启动模型评估。具体地，该消息包括模型标识。

需要说明的是，步骤1210在步骤1208之后执行即可。

1211、MEF向DMF2发送数据请求消息2，该消息包括模型标识(model ID)，数据集类型(dataset Type)。

需要说明的是，MEF发送的数据请求消息中dataset Type(即本申请实施例所述的第二信息)的值为“test”，指示MEF请求的是测试集。

1212、DMF2向MEF发送测试集。

具体实现中，DMF2根据MEF在步骤1211发送的model ID和dataset Type＝“test”查询测试集，将测试集返回给MEF。

需要说明的是，若DMF2未查找到MEF所请求的数据，则向MEF回复NACK消息，包含错误原因。

可以理解的是，靠近MTF的DMF中数据更多，因此图12所示方法中可以由DMF1发起数据同步，并由DMF1完成数据合并和数据集的划分。另一种可能的实现方式中，由DMF2发起数据同步。本申请实施例还提供以下两种数据同步方案：

方案一：DMF1向DMF2发送MTF请求的数据类型(例如，第一模型对应的一个或多个数据类型)以及DMF1已收集数据的信息。其中，DMF1已收集数据即DMF1根据MTF请求的数据类型收集到的数据。数据的信息可以是数据的范围，例如，数据的key值的范围，或者数据分布的时间的范围，或者数据分布的网络区域的范围。

DMF2根据数据类型以及DMF1已收集数据的信息，确定收集到的数据中DMF1不存在的数据并发送给DMF1。

方案一中，DMF之间无需传输重复数据，节省了传输资源。

方案二：两个DMF之间可以通过传输数据信息进行数据同步，不传输数据。例如，DMF1向DMF2发送MTF请求的数据类型。

DMF2根据数据类型确定DMF2已收集数据的信息并发送给DMF1。由DMF1根据对两部分数据信息进行合并、去重。

方案二中无需传输数据，节省了传输带宽。

图12所示的方法，适用于多个DMF的场景，DMF之间进行数据同步之后再进行训练集、测试集的划分，可以保证训练集和测试集不存在交集，提高模型评估的准确性。

本申请实施例还提供一种模型数据传输方法，与图12所示方法不同的是，MMF可以提前将model ID和data Type的对应关系下发给DMF1，则步骤1203中MTF向DMF1请求训练集时可以不发送data Type，仅发送model ID和数据集类型。DMF1可以根据model ID查找到对应的data Type，从而确定与所述data Type对应的数据集，进一步根据MTF发送的数据集类型从该数据集中划分训练集。

本申请实施例还提供一种模型数据传输方法，适用于多个DMF的场景，且由MMF下发数据划分策略。如图13所示，所述方法包括以下步骤：

1301、数据订阅和收集流程。

具体实现参考前文所述的步骤1201，在此不做赘述。

1302、MMF确定数据划分策略，向DMF1发送数据划分策略(split Policy)。

具体实现中，MMF向DMF1发送配置消息，配置消息包括split Policy和model ID，split Policy适用于model ID所指示模型的训练集的划分或测试集的划分。

具体地，MMF可以利用专家经验、数据信息、场景等确定合理的数据划分策略，改善模型训练和评估效果。

可选的，步骤1302之前可以分别查询DMF1和DMF2中数据的信息，则MMF还可以参考查询到的数据信息确定split Policy。

Split Policy的具体描述参考前文步骤804相关描述，在此不做赘述。1303～1313同前文所述的步骤1202～1212，其中，DMF1按照MMF下发的数据划分策略进行数据集划分。

前文提出的数据同步方案同样适用于图13所示的方法。图13所示的方法中，MMF可以确定更合理的数据划分策略，在多个DMF的场景下，可以改善模型训练和评估效果。

本申请实施例还提供一种模型数据传输方法，与图13所示方法不同的是，MMF可以提前将model ID和data Type的对应关系下发给DMF1，则步骤1304中MTF向DMF1请求训练集时可以不发送data Type，仅发送model ID和数据集类型。DMF1可以根据model ID查找到对应的data Type，从而确定与所述data Type对应的数据集，进一步根据MTF发送的数据集类型从该数据集中划分训练集。

本申请实施例还提供一种模型数据传输方法，适用于多个DMF的场景，且不同 DMF之间通过传输数据信息进行数据同步。如图14所示，所述方法包括以下步骤：

1401、数据订阅和收集流程。

具体实现参考前文所述的步骤1201，在此不做赘述。

1402、MMF向DMF1发送数据信息查询请求，该请求包括数据所述模型对应的一个或多个数据类型(data Type)、待查询的数据信息。

其中，待查询的数据信息，可以是数据量、数据的范围，数据的范围可以是数据的key值的范围，或者数据分布的时间的范围，或者数据分布的网络区域的范围。

1403、DMF1向MMF返回数据信息。

具体地，DMF1根据MMF发送的一个或多个数据类型确定数据集1(DMF1已收集到的数据构成数据集1)，并向MMF返回数据集1的信息，例如，根据所述一个或多个数据类型已收集数据的数据量、已收集数据的范围。

如果DMF1没有查询到与所述一个或多个数据类型对应的数据信息，则向MMF返回NACK消息，包含错误原因。

1404、MMF向DMF2发送数据信息查询请求，该请求包括数据所述模型对应的一个或多个数据类型(data Type)、待查询的数据信息。

1405、DMF2向MMF返回数据信息。

具体地，DMF2根据MMF发送的一个或多个数据类型确定数据集2(DMF2已收集到的数据构成数据集2)，并向MMF返回数据集2的信息，例如，根据所述一个或多个数据类型已收集数据的数据量、已收集数据的范围。

如果DMF2没有查询到与所述一个或多个数据类型对应的数据信息，向MMF返回NACK消息，包含错误原因。

1406、MMF根据具体场景以及从DMF1、DMF2获取的数据信息进行数据集划分，确定训练集的范围和测试集的范围。

具体实现中，MMF整合从DMF1、DMF2获取的数据信息，对数据的范围进行划分，确定训练集的范围和测试集的范围。例如，查询到DMF1中收集了cell 1在6月1号～7月31号的RSRP数据，DMF2中收集了cell 1在8月1号～8月31号的RSRP数据。整合后的数据分别的时间范围是6月1号～8月31号，其中，6月1号～8月20号的数据用于训练模型，即训练集的范围是“6月1号～8月20号”；8月21号～8月31号的数据用于评估模型，即测试集的范围是“8月21号～8月31”。

1407、MMF给MTF发送模型训练触发消息，该消息包括模型标识以及训练集的范围。

其中，训练集的范围可以是训练集中数据的key值的范围，或者训练集中数据分布的时间的范围，或者训练集中数据分布的网络区域的范围。

1408、MTF向DMF1发送数据请求消息1，该消息包括所述模型对应的一个或多个数据类型和训练集的范围。

1409、DMF1向MTF发送训练集。

具体实现中，DMF1可以根据MTF发送的所述一个或多个数据类型确定已收集到的数据构成的数据集，再根据MTF发送的训练集的范围从该数据集中得到所述模型的训练集。

1410、MTF利用训练集进行模型训练。

1411、MMF给MEF发送模型评估触发消息，该消息包括模型标识以及测试集的范围。

其中，测试集的范围可以是测试集中数据的key值的范围，或者测试集中数据分布的时间的范围，或者测试集中数据分布的网络区域的范围。

1412、MEF向DMF2发送数据请求消息2，该消息包括所述模型对应的一个或多个数据类型和测试集的范围。

1413、DMF2向MEF发送测试集。

具体实现中，DMF2可以根据MEF发送的所述一个或多个数据类型确定已收集到的数据构成的数据集，再根据MEF发送的训练集的范围从该数据集中得到所述模型的测试集。

1414、MEF利用测试集进行模型评估。

图14所示的方法中，适用于多个DMF的场景，且DMF之间无需进行数据同步，简化了DMF的操作，同时保障了数据的隐私性。此外，MMF进行数据集划分时可以保证训练集和测试集之间不存在交集，确保了模型评估结果的准确性。

本申请实施例还提供一种模型数据传输方法，与图14所示方法不同的是，MMF可以提前将model ID和data Type的对应关系下发给DMF1和DMF2，则步骤1408中MTF向DMF1请求训练集时可以不发送data Type，仅发送model ID和训练集的范围，类似的，步骤1412中MEF向DMF2请求测试集时可以不发送data Type，仅发送model ID和测试集的范围。DMF1可以根据model ID查找到对应的data Type，从而确定与所述data Type对应的数据集，进一步根据MTF发送的数据集类型从该数据集中划分训练集。DMF2可以根据model ID查找到对应的data Type，从而确定与所述data Type对应的数据集，进一步根据MEF发送的数据集类型从该数据集中划分测试集。

本申请还提供一种模型数据传输方法，与图14所示方法不同的是，MMF划分训练集、测试集后向DMF1、DMF2通知划分结果。MTF、MEF可以通过数据类型和数据集类型向DMF请求数据。如图15，所述方法包括以下步骤：

1501、数据订阅和收集流程。

具体实现参考前文所述的步骤1201，在此不做赘述。

1502、MMF向DMF1发送数据信息查询请求，该请求包括数据所述模型对应的一个或多个数据类型(data Type)、待查询的数据信息。

1503、DMF1向MMF返回数据信息。

如果DMF1没有查询到与所述一个或多个数据类型对应的数据信息，则向MMF 返回NACK消息，包含错误原因。

1504、MMF向DMF2发送数据信息查询请求，该请求包括数据所述模型对应的一个或多个数据类型(data Type)、待查询的数据信息。

1505、DMF2向MMF返回数据信息。

1506、MMF根据具体场景以及从DMF1、DMF2获取的数据信息进行数据集划分，确定训练集的范围和测试集的范围。

需要说明的是，若从DMF1、DMF2获取的数据信息存在重叠，即DMF1、DMF2中与数据类型“RSRP”匹配的数据存在重叠，MMF可以对数据进行去重处理之后再进行划分。

1507、MMF向DMF1发送训练集的范围和模型标识。

DMF1接收训练集的范围和模型标识之后，还可以记录训练集的范围和模型标识之间的对应关系。

1508、MTF向DMF1发送数据请求消息1，该消息包括所述模型的模型标识和数据集类型。

其中，数据请求消息1中的数据集类型的值指示MTF请求的是训练集，例如，数据请求消息1中的数据集类型可以是“train”。

1509、DMF1向MTF发送训练集。

具体实现中，DMF1可以根据MTF发送的模型标识确定对应的训练集的范围，根据数据集类型确定MTF请求的是训练集，则根据训练集的范围确定训练集。

一种可能的实现方式中，DMF1可以根据模型标识查找到根据所述模型对应的数据类型确定的数据集，再根据训练集的范围从该数据集中划分训练集。

1510、MTF利用训练集进行模型训练。

1511、MMF向DMF2发送测试集的范围和模型标识。

DMF2接收测试集的范围和模型标识之后，还可以记录测试集的范围和模型标识之间的对应关系。

1512、MEF向DMF2发送数据请求消息2，该消息包括所述模型的模型标识和数据集类型。

其中，数据请求消息2中的数据集类型的值指示MEF请求的是测试集，例如，数据请求消息2中的数据集类型可以是“test”

1513、DMF2向MEF发送测试集。

具体实现中，DMF2可以根据MEF发送的模型标识确定对应的测试集的范围，根据数据集类型确定MEF请求的是测试集，则根据测试集的范围划分测试集。

一种可能的实现方式中，DMF2可以根据模型标识查找到根据所述模型对应的数据类型确定的数据集，再根据测试集的范围从该数据集中划分测试集。

1514、MEF利用测试集进行模型评估。

本申请实施例还提供一种模型数据传输方法，与图15所示方法不同的是，1507和1511中MMF下发训练集和测试集的范围时可以在消息中包含data Type，不发送model ID，则步骤1508中MTF可以通过data Type和训练集的范围向DMF1请求训练集，类似的，步骤1512中MEF可以通过data Type和测试集的范围向DMF2请求测试集。DMF1直接根据data Type确定与所述data Type对应的数据集，进一步根据MTF发送的数据集类型从该数据集中划分训练集。DMF2直接根据data Type确定与所述data Type对应的数据集，进一步根据MEF发送的数据集类型从该数据集中划分测试集。

在采用对应各个功能划分各个功能模块的情况下，图16示出上述实施例中所涉及的通信装置的一种可能的结构示意图。图16所示的通信装置可以是本申请实施例所述的第一网元、第二网元或第三网元，也可以是第一网元、第二网元或第三网元中实现上述方法的部件，或者，也可以是应用于第一网元、第二网元或第三网元中的芯片。所述芯片可以是片上系统(System-On-a-Chip，SOC)或者是具备通信功能的基带芯片等。如图16所示，通信装置包括处理单元1601以及通信单元1602。处理单元可以是一个或多个处理器，通信单元可以是收发器或者通信接口。

处理单元1601，可用于支持通信装置执行上述方法实施例中的处理动作，例如，可以用于支持第一网元执行步骤501，支持第二网元(例如，MTF)执行步骤702、步骤706，支持第二网元(例如，MEF)执行步骤707、步骤711，支持第三网元执行步骤1406，和/或用于本文所描述的技术的其它过程。

通信单元1602，用于支持该通信装置与其他设备(或装置)之间的通信，例如，支持第一网元执行步骤502，支持第二网元执行步骤703、步骤705、步骤708、步骤710，支持第三网元执行步骤905，和/或用于本文所描述的技术的其它过程。

需要说明的是，上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述，在此不再赘述。

如图17所示，通信装置还可以包括存储单元1603，存储单元1603用于存储通信装置的程序代码和/或数据。

处理单元1601可以包括至少一个处理器，通信单元1602可以为收发器或者通信接口，存储单元1603可以包括存储器。

需要说明的是，上述各个通信装置实施例中，各个单元也可以相应的称之为模块或者部件或者电路等。

本申请实施例提供一种计算机可读存储介质，计算机可读存储介质中存储有指令；指令用于执行如图5或图7～图15所示的方法。

本申请实施例提供一种包括指令的计算机程序产品，当其在通信装置上运行时，使得通信装置执行如图5或图7～图15所示的方法。

本申请实施例一种无线通信装置，包括：无线通信装置中存储有指令；当无线通信装置在图4a、图4b、图16、图17所示的通信装置上运行时，使得通信装置执行如图5或图7～图15所示的方法。该无线通信装置可以为芯片。

本申请实施例还提供一种通信系统，包括：终端设备以及接入网设备。示例性的，终端设备可以是图5a、图9、图10所示的通信装置，接入网设备可以是图5b、图11、图12所示的通信装置。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将通信装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

本申请实施例中的处理器，可以包括但不限于以下至少一种：中央处理单元(central processing unit，CPU)、微处理器、数字信号处理器(DSP)、微控制器(microcontroller unit，MCU)、或人工智能处理器等各类运行软件的计算设备，每种计算设备可包括一个或多个用于执行软件指令以进行运算或处理的核。该处理器可以是个单独的半导体芯片，也可以跟其他电路一起集成为一个半导体芯片，例如，可以跟其他电路(如编解码电路、硬件加速电路或各种总线和接口电路)构成一个SoC(片上系统)，或者也可以作为一个ASIC的内置处理器集成在所述ASIC当中，该集成了处理器的ASIC可以单独封装或者也可以跟其他电路封装在一起。该处理器除了包括用于执行软件指令以进行运算或处理的核外，还可进一步包括必要的硬件加速器，如现场可编程门阵列(field programmable gate array，FPGA)、PLD(可编程逻辑器件)、或者实现专用逻辑运算的逻辑电路。

本申请实施例中的存储器，可以包括如下至少一种类型：只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable programmabler-only memory，EEPROM)。在某些场景下，存储器还可以是只读光盘(compact disc read-only memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。

本申请中，“至少一个”是指一个或者多个。“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B的情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b，或c中的至少一项(个)，可以表示：a，b，c，a-b，a-c，b-c，或a-b-c，其中a，b，c可以是单个，也可以是多个。另外，为了便于清楚描述本申请实施例的技术方案，在本申请的实施例中，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定，并且“第一”、“第二”等字样也并不限定一定不同。

在本申请所提供的几个实施例中，应该理解到，所揭露的数据库访问装置和方法，可以通过其它的方式实现。例如，以上所描述的数据库访问装置实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个装置，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，数据库访问装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是一个物理单元或多个物理单元，即可以位于一个地方，或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何在本申请揭露的技术范围内的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种模型数据传输方法，其特征在于，包括：

第一网元确定第一数据集；

所述第一网元从第二网元接收第一信息与第二信息，所述第一信息用于指示第一模型，所述第二信息用于请求第二数据集，所述第二数据集用于训练所述第一模型或者用于测试所述第一模型；

所述第一网元向所述第二网元发送所述第二数据集，所述第二数据集为所述第一数据集的子集。
根据权利要求1所述的方法，其特征在于，

所述第二信息用于指示所述第二数据集的类型，所述第二数据集的类型包括训练集或者测试集，所述训练集用于训练所述第一模型，所述测试集用于测试所述第一模型；或者，

所述第二信息用于指示所述第二数据集的范围。
根据权利要求2所述的方法，其特征在于，所述第二数据集的范围包括以下一项或多项：所述第二数据集中数据的键key值的范围、所述第二数据集中数据分布的时间的范围、所述第二数据集中数据分布的网络区域的范围。
根据权利要求1-3任一项所述的方法，其特征在于，所述方法还包括：

所述第一网元根据所述第一信息和所述第二信息确定所述第二数据集。
根据权利要求4所述的方法，其特征在于，所述第一网元根据所述第一信息和所述第二信息确定所述第二数据集，包括：

所述第一网元根据数据划分策略从所述第一数据集中确定所述第一模型的训练集和/或所述第一模型的测试集。
根据权利要求5所述的方法，其特征在于，所述数据划分策略为以下任意一项：

根据数据分布的时间划分、根据数据分布的网络区域进行划分或根据指定比例划分。
根据权利要求5或6所述的方法，其特征在于，所述方法还包括：

所述第一网元从第三网元接收所述数据划分策略；或者，

所述第一网元确定所述数据划分策略。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

所述第一网元向第三网元发送与所述第一模型对应的一个或多个数据类型、与所述一个或多个数据类型对应的所述第一数据集的范围，所述第一数据集的范围包括以下一项或多项：所述第一数据集中数据的key值的范围、所述第一数据集中数据分布的时间的范围、所述第一数据集中数据分布的网络区域的范围。
根据权利要求1-8任一项所述的方法，其特征在于，所述还包括：

所述第一网元从所述第二网元接收第三信息，所述第三信息包括以下一项或多项：所述第一模型的一个或多个数据类型、所述第一模型所需数据的采集对象，所述采集对象包括以下至少一项：一个或多个用户设备UE、一个或多个小区cell。
根据权利要求9所述的方法，其特征在于，所述第一网元确定第一数据集，包括：

所述第一网元根据所述第三信息从第四网元获取所述第一数据集；或者，

所述第一网元根据所述第三信息从第五网元获取第三数据集或者第三数据集的信息，所述第三数据集的信息用于指示所述第三数据集的范围，根据所述第三信息从第四网元获取第四数据集，根据所述第三数据集和所述第四数据集确定所述第一数据集。
一种模型数据传输方法，其特征在于，所述方法包括：

第二网元向第一网元发送第一信息与第二信息，所述第一信息用于指示第一模型，所述第二信息用于请求第二数据集，所述第二数据集用于训练所述第一模型或者用于测试所述第一模型；

所述第二网元从所述第一网元接收所述第二数据集，所述第二数据集为第一数据集的子集。
根据权利要求11所述的方法，其特征在于，所述第二信息用于指示所述第二数据集的类型，所述第二数据集的类型包括训练集或者测试集，所述训练集用于训练所述第一模型，所述测试集用于测试所述第一模型；或者，

所述第二信息用于指示所述第二数据集的范围。
根据权利要求12所述的方法，其特征在于，所述第二数据集的范围包括以下一项或多项：所述第二数据集中数据的key值的范围、所述第二数据集中数据分布的时间的范围、所述第二数据集中数据分布的网络区域的范围。
根据权利要求11-13任一项所述的方法，其特征在于，所述方法还包括：

所述第二网元向所述第一网元发送第三信息，所述第三信息包括以下一项或多项：所述第一模型的一个或多个数据类型、所述第一模型所需数据的采集对象，所述采集对象包括以下至少一项：一个或多个用户设备UE、一个或多个小区cell。
一种通信装置，其特征在于，包括：

处理单元，用于确定第一数据集；

通信单元，用于从第二网元接收第一信息与第二信息，所述第一信息用于指示第一模型，所述第二信息用于请求第二数据集，所述第二数据集用于训练所述第一模型或者用于测试所述第一模型；

所述通信单元还用于，向所述第二网元发送所述第二数据集，所述第二数据集为所述第一数据集的子集。
根据权利要求15所述的装置，其特征在于，所述第二信息用于指示所述第二数据集的类型，所述第二数据集的类型包括训练集或者测试集，所述训练集用于训练所述第一模型，所述测试集用于测试所述第一模型；或者，

所述第二信息用于指示所述第二数据集的范围。
根据权利要求16所述的装置，其特征在于，所述第二数据集的范围包括以下一项或多项：所述第二数据集中数据的key值的范围、所述第二数据集中数据分布的时间的范围、所述第二数据集中数据分布的网络区域的范围。
根据权利要求15-17任一项所述的装置，其特征在于，

所述处理单元还用于，根据所述第一信息和所述第二信息确定所述第二数据集。
根据权利要求18所述的装置，其特征在于，所述数据划分策略为以下任意一项：

根据数据分布的时间划分、根据数据分布的网络区域进行划分或根据指定比例划分。
根据权利要求18或19所述的装置，其特征在于，所述通信单元还用于，从第三网元接收所述数据划分策略；或者，

所述通信装置确定所述数据划分策略。
根据权利要求15所述的装置，其特征在于，所述通信单元还用于，向第三网元发送与所述第一模型对应的一个或多个数据类型、与所述一个或多个数据类型对应的所述第一数据集的范围，所述第一数据集的范围包括以下一项或多项：所述第一数据集中数据的key值的范围、所述第一数据集中数据分布的时间的范围、所述第一数据集中数据分布的网络区域的范围。
根据权利要求15-21任一项所述的装置，其特征在于，所述通信单元还用于，从所述第二网元接收第三信息，所述第三信息包括以下一项或多项：所述第一模型的一个或多个数据类型、所述第一模型所需数据的采集对象，所述采集对象包括以下至少一项：一个或多个用户设备UE、一个或多个小区cell。
根据权利要求22所述的装置，其特征在于，所述处理单元具体用于，根据所述第三信息从第四网元获取所述第一数据集；或者，

根据所述第三信息从第五网元获取第三数据集或者第三数据集的信息，所述第三数据集的信息用于指示所述第三数据集的范围，根据所述第三信息从第四网元获取第四数据集，根据所述第三数据集和所述第四数据集确定所述第一数据集。
一种通信装置，其特征在于，包括：

处理单元，用于确定第一信息与第二信息，所述第一信息用于指示第一模型，所述第二信息用于请求第二数据集，所述第二数据集用于训练所述第一模型或者用于测试所述第一模型；

通信单元，用于向第一网元发送所述第一信息与所述第二信息；

所述通信单元，还用于从所述第一网元接收所述第二数据集，所述第二数据集为第一数据集的子集。
根据权利要求24所述的装置，其特征在于，所述第二信息用于指示所述第二数据集的类型，所述第二数据集的类型包括训练集或者测试集，所述训练集用于训练所述第一模型，所述测试集用于测试所述第一模型；或者，

所述第二信息用于指示所述第二数据集的范围。
根据权利要求25所述的装置，其特征在于，所述第二数据集的范围包括以下一项或多项：所述第二数据集中数据的key值的范围、所述第二数据集中数据分布的时间的范围、所述第二数据集中数据分布的网络区域的范围。
根据权利要求24-26任一项所述的装置，其特征在于，所述通信单元还用于，向所述第一网元发送第三信息，所述第三信息包括以下一项或多项：所述第一模型的一个或多个数据类型、所述第一模型所需数据的采集对象，所述采集对象包括以下至少一项：一个或多个用户设备UE、一个或多个小区cell。
一种通信装置，其特征在于，包括处理器，所述处理器与存储器耦合；

存储器，用于存储计算机程序；

处理器，用于执行所述存储器中存储的计算机程序，以使得所述装置执行如权利要求1至14中任一项所述的方法。
一种计算机可读存储介质，包括程序或指令，当所述程序或指令被处理器运行时，如权利要求1至14中任意一项所述的方法被执行。