WO2023109827A1

WO2023109827A1 - 客户端筛选方法及装置、客户端及中心设备

Info

Publication number: WO2023109827A1
Application number: PCT/CN2022/138755
Authority: WO
Inventors: 孙布勒; 孙鹏; 杨昂
Original assignee: 维沃移动通信有限公司
Priority date: 2021-12-15
Filing date: 2022-12-13
Publication date: 2023-06-22
Also published as: CN116266216A

Abstract

一种客户端筛选方法及装置、客户端及中心设备，属于通信技术领域，该客户端筛选方法包括：中心设备向客户端发送第一指示，指示所述客户端参与特定联邦学习或联邦元学习的模型训练（101）；所述中心设备接收所述客户端上报的训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果（102）。

Description

客户端筛选方法及装置、客户端及中心设备

相关申请的交叉引用

本申请主张在2021年12月15日在中国提交的中国专利申请No.202111537989.6的优先权，其全部内容通过引用包含于此。

技术领域

本申请属于通信技术领域，具体涉及一种客户端筛选方法及装置、客户端及中心设备。

背景技术

人工智能(Artificial Intelligence，AI)目前在各个领域获得了广泛的应用。AI模块有多种实现方式，例如神经网络、决策树、支持向量机、贝叶斯分类器等。

AI应用于无线通信系统中时，需要在终端上运行相应的神经网络。但是，终端的AI模型一般是由网络侧离线训练好，再下发到终端执行的。这是因为，单个终端的数据量有限，很难训练出一个较好的模型。终端接收到模型后一般先基于少量数据进行微调(fine-tuning)，才能获得比较好的性能。联邦学习或联邦元学习可以在不暴露终端数据的前提下进行训练，是非常有潜力的方向。在联邦学习和联邦元学习中都是终端用自己的数据更新本地模型参数或损失，终端再将参数或损失汇聚到服务器进行处理获得全局模型，服务器再将全局模型下发给终端进行新一轮的训练。联邦学习的目的是获得一个对所有参与训练的终端都可以收敛的模型，联邦元学习的目的是基于参与训练的终端数据，获得一个在新的场景中也能快速收敛的模型初始化参数。联邦元学习在终端处微调数据量少或对微调收敛时间(或迭代次数)要求较高时可以获得比联邦学习更好的性能。相关技术中，所有的候选客户端都会参与特定联邦学习或联邦元学习的模型训练，导致模型训练的收敛速度慢，中心设备与客户端之间的通信资源开销大。

发明内容

本申请实施例提供一种客户端筛选方法及装置、客户端及中心设备，能够提高模型训练的收敛速度。

第一方面，提供了一种客户端筛选方法，包括：

中心设备向客户端发送第一指示，指示所述客户端参与特定联邦学习或联邦元学习的模型训练；

所述中心设备接收所述客户端上报的训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。

第二方面，提供了一种客户端筛选装置，包括：

发送模块，用于向客户端发送第一指示，指示所述客户端参与特定联邦学习或联邦元学习的模型训练；

接收模块，用于接收所述客户端上报的训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。

第三方面，提供了一种客户端筛选方法，包括：

客户端接收中心设备的第一指示，所述第一指示用以指示所述客户端参与特定联邦学习或联邦元学习的模型训练；

所述客户端进行特定联邦学习或联邦元学习的模型训练，并向所述中心设备上报训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。

第四方面，提供了一种客户端筛选装置，包括：

接收模块，用于接收中心设备的第一指示，所述第一指示用以指示所述客户端参与特定联邦学习或联邦元学习的模型训练；

上报模块，用于进行特定联邦学习或联邦元学习的模型训练，并向所述中心设备上报训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。

第五方面，提供了一种中心设备，该中心设备包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

第六方面，提供了一种中心设备，包括处理器及通信接口，其中，所述通信接口用于向客户端发送第一指示，指示所述客户端参与特定联邦学习或联邦元学习的模型训练；接收所述客户端上报的训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。

第七方面，提供了一种客户端，该客户端包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第三方面所述的方法的步骤。

第八方面，提供了一种客户端，包括处理器及通信接口，其中，所述通信接口用于接收中心设备的第一指示，所述第一指示用以指示所述客户端参与特定联邦学习或联邦元学习的模型训练；所述处理器用于进行特定联邦学习或联邦元学习的模型训练，并向所述中心设备上报训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。

第九方面，提供了一种客户端筛选系统，包括：中心设备及客户端，所述中心设备可用于执行如第一方面所述的客户端筛选方法的步骤，所述客户端可用于执行如第三方面所述的客户端筛选方法的步骤。

第十方面，提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤，或者实现如第三方面所述的方法的步骤。

第十一方面，提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法，或实现如第三方面所述的方法。

第十二方面，提供了一种计算机程序/程序产品，所述计算机程序/程序产品被存储在存储介质中，所述计算机程序/程序产品被至少一个处理器执行以实现如第一方面所述的客户端筛选方法，或实现如第三方面所述的客户端筛选方法的步骤。

在本申请实施例中，中心设备并不是要求所有的候选客户端参与特定联邦学习或联邦元学习的模型训练，而是由中心设备先对候选客户端进行筛选，确定需要进行模型训练的客户端，然后向客户端发送第一指示，指示客户端参与特定联邦学习或联邦元学习的模型训练，并接收客户端上报的训练结果。这样可以剔除一些条件不好的候选客户端，提高训练的收敛速度，降低中心设备与客户端之间的通信资源开销。

附图说明

图1是本申请实施例可应用的一种无线通信系统的框图；

图2是信道状态信息反馈的示意图；

图3是AI训练不同迭代次数时的性能示意图；

图4是本申请实施例中心设备侧客户端筛选方法的流程示意图；

图5是本申请实施例客户端侧客户端筛选方法的流程示意图；

图6是本申请实施例通信设备的结构示意图；

图7是本申请实施例终端的结构示意图；

图8是本申请实施例网络侧设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”所区别的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”一般表示前后关联对象是一种“或”的关系。

值得指出的是，本申请实施例所描述的技术不限于长期演进型(Long Term Evolution，LTE)/LTE的演进(LTE-Advanced，LTE-A)系统，还可用于其他无线通信系统，诸如码分多址(Code Division Multiple Access，CDMA)、时分多址(Time Division Multiple Access，TDMA)、频分多址(Frequency Division Multiple Access，FDMA)、正交频分多址(Orthogonal Frequency Division Multiple Access，OFDMA)、单载波频分多址(Single-carrier Frequency Division Multiple Access，SC-FDMA)和其他系统。本申请实施例中的术语“系统”和“网络”常被可互换地使用，所描述的技术既可用于以上提及的系统和无线电技术，也可用于其他系统和无线电技术。以下描述出于示例目的描述了新空口(New Radio，NR)系统，并且在以下大部分描述中使用NR术语，但是这些技术也可应用于NR系统应用以外的应用，如第6代(6th Generation，6G)通信系统。

图1示出本申请实施例可应用的一种无线通信系统的框图。无线通信系统包括终端11和网络侧设备12。其中，终端11可以是手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)或称为笔记本电脑、个人数字助理(Personal Digital Assistant，PDA)、掌上电脑、上网本、超级移动个人计算机(ultra-mobile personal computer，UMPC)、移动上网装置(Mobile Internet Device，MID)、增强现实(augmented reality，AR)/虚拟现实(virtual reality，VR)设备、机器人、可穿戴式设备(Wearable Device)、车载设备(Vehicle User Equipment，VUE)、行人终端(Pedestrian User Equipment，PUE)、智能家居(具有无线通信功能的家居设备，如冰箱、电视、洗衣机或者家具等)、游戏机、个人计算机(personal computer，PC)、柜员机或者自助机等终端侧设备，可穿戴式设备包括：智能手表、智能手环、智能耳机、智能眼镜、智能首饰(智能手镯、智能手链、智能戒指、智能项链、智能脚镯、智能脚链等)、智能腕带、智能服装等。需要说明的是，在本申请实施例并不限定终端11的具体类型。网络侧设备12可以包括接入网设备或核心网设备，其中，接入网设备12也可以称为无线接入网设备、无线接入网(Radio Access Network,RAN)、无线接入网功能或无线接入网单元。接入网设备12可以包括基站、WLAN接入点或WiFi节点等，基站可被称为节点B、演进节点B(eNB)、接入点、基收发机站(Base Transceiver Station，BTS)、无线电基站、无线电收发机、基本服务集(Basic Service Set，BSS)、扩展服务集(Extended Service Set，ESS)、家用B节点、家用演进型B节点、发送接收点(Transmitting Receiving Point，TRP)或所述领域中其他某个合适的术语，只要达到相同的技术效果，所述基站不限于特定技术词汇，需要说明的是，在本申请实施例中仅以NR系统中的基站为例进行介绍，并不限定基站的具体类型。

借助AI提升第5代(5th Generation，5G)网络性能的主要方法是通过基于神经网络的算法和模型增强或者替代目前已有的算法或处理模块。在特定场景下，基于神经网络的算法和模型可以取得比基于确定性算法更好的性能。比较常用的神经网络包括深度神经网络、卷积神经网络和循环神经网络等。借助已有AI工具，可以实现神经网络的搭建、训练与验证工作。

通过AI方法替代现有系统中的模块能够有效提升系统性能。如图2所示的信道状态信息(Channel State Information，CSI)反馈，通过AI编码器(encoder)和AI解码器(decoder)替代常规的CSI计算，可以在相同开销的情况下大幅度提升相应的系统性能。通过基于AI的方案，系统的频谱效率可以提升30％左右。

AI训练不同迭代次数时的性能如图3所示，其中，横坐标为训练时期，纵坐标为相关性的平方。不同迭代需要不同的训练数据，可以看到需要大量的训练迭代才能达到性能收敛。

选取具有代表性的终端进行联邦式的训练不仅可以提高训练效率，还可以提高模型的泛化性能。而由于联邦学习和联邦元学习的训练目的不同，这两种训练方法所对应的终端筛选方案也应该不同。

下面结合附图，通过一些实施例及其应用场景对本申请实施例提供的客户端筛选方法进行详细地说明。

本申请实施例提供一种客户端筛选方法，如图4所示，包括：

步骤101：中心设备向客户端发送第一指示，指示所述客户端参与特定联邦学习或联邦元学习的模型训练；

步骤102：所述中心设备接收所述客户端上报的训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。

其中，上述训练结果是参与联邦学习或联邦元学习的客户端进行一轮训练后得到的结果或中间结果，训练结果或中间结果可以是梯度结果、损失函数结果、特定任务的性能结果或上述结果的加密结果等。

在本申请实施例中，中心设备并不是要求所有的候选客户端参与特定联邦学习或联邦元学习的模型训练，而是由中心设备先对候选客户端进行筛选，确定需要进行模型训练的客户端，然后向客户端发送第一指示，指示客户端参与特定联邦学习或联邦元学习的模型训练，并接收客户端上报的训练结果。这样可以剔除一些条件不好的候选客户端，提高训练的收敛速度，降低中心设备与客户端之间的通信资源开销。并且，通过选取具有代表性的客户端进行联邦式的训练不仅可以提高训练效率，还可以提高模型的泛化性能。

一些实施例中，所述中心设备向所述客户端发送第一指示包括：

所述中心设备按照预设的第一筛选条件从M个候选客户端中筛选出N个客户端，向所述N个客户端单播所述第一指示，M，N为正整数，N小于或等于M；或

所述中心设备向所述M个候选客户端广播所述第一指示，所述第一指示携带有第二筛选条件，所述第二筛选条件用于筛选上报训练结果的客户端，所述客户端满足所述第二筛选条件。

本实施例中，在中心设备通信范围内的为候选客户端，上报训练结果的客户端选自候选客户端，可以将所有的候选客户端作为客户端，也可以筛选出部分候选客户端作为客户端。广播是向所有的候选客户端发送第一指示，而单播只是向筛选出的客户端发送第一指示，收到单播的第一指示的候选客户端均需要执行模型训练并上报训练结果。收到广播的第一指示的候选客户端需要判断自身是否满足第二筛选条件，满足第二筛选条件的候选客户端才执行模型训练并上报训练结果。

一些实施例中，所述中心设备通过以下至少一项向所述客户端发送第一指示：

媒体介入控制(Medium Access Control，MAC)控制单元(Control Element，CE)；

无线资源控制(Radio Resource Control，RRC)消息；

非接入层(Non-access stratum，NAS)消息；

管理编排消息；

用户面数据；

下行控制信息；

系统信息块(System Information Block，SIB)；

物理下行控制信道(Physical Downlink Control Channel，PDCCH)的层1信令；

物理下行共享信道(Physical Downlink Shared Channel，PDSCH)的信息；

物理随机接入信道(Physical Random Access Channel，PRACH)的(Message，MSG)2信息；

物理随机接入信道PRACH的MSG 4信息；

物理随机接入信道PRACH的MSG B信息；

广播信道信息或信令；

Xn接口(一种接口)信令；

PC5接口(一种接口)信令；

物理侧边链路控制信道(Physical Sidelink Control Channel，PSCCH)的信息或信令；

物理侧边链路共享信道(Physical Sidelink Shared Channel，PSSCH)的信息；

物理侧边链路广播信道(Physical Sidelink Broadcast Channel，PSBCH)的信息；

物理直通链路发现信道(Physical Sidelink Discovery Channel，PSDCH)的信息；

物理直通链路反馈信道(Physical Sidelink Feedback Channel，PSFCH)的信息。

一些实施例中，所述中心设备向客户端发送第一指示之前，所述方法还包括：

所述中心设备接收所述候选客户端上报的第一训练数据和/或第一参数，所述第一参数可以是所述第一筛选条件的判断参数。

本实施例中，候选客户端可以先上报少量的训练数据(即第一训练数据)和/或第一参数，由中心设备根据少量的训练数据和/或第一参数确定参与训练的客户端，筛选出参与模型训练并上报训练结果的客户端，避免所有的客户端都参与训练。

一些实施例中，所述中心设备仅接收所述候选客户端上报的第一训练数据，根据所述第一训练数据确定所述第一参数。中心设备可以根据第一训练数据推测、感知、检测或推理出第一参数。中心设备可以依据第一参数进行候选客户端的筛选，确定客户端。

一些实施例中，所述第一参数包括以下至少一项：

所述候选客户端的数据类型；

所述候选客户端的数据分布参数；

所述候选客户端的业务类型，比如增强移动宽带(Enhanced Mobile Broadband，eMBB)，超可靠低延迟通信(Ultra-Reliable Low-Latency Communications，URLLC)，大规模机器类型通信(Massive Machine Type Communication，mMTC)，其他6G新场景等；

所述候选客户端的工作场景，包括但不限于：高速、低速、视距传播(Line of Sight，LOS)、非视距传播(Non Line of Sight，NLOS)、高信噪比、低信噪比等工作场景；

所述候选客户端的通信网络接入方式，包括移动网络、WiFi和固网，其中移动网络包括第2代(2th Generation，2G)，第3代(3th Generation，3G)，第4代(4th Generation，4G)，5G和6G；

所述候选客户端的信道质量；

所述候选客户端收集数据的难易程度；

所述候选客户端的电量状态，比如可用剩余电量的具体值，或分级描述结果，充电或不充电等；

所述候选客户端的存储状态，比如可用内存的具体值，或分级描述结果；

所述候选客户端的算力，比如图形处理器(Graphics Processing Unit，GPU)数、中央处理器(Central Processing Unit，CPU)数、核数等，或者，算力可以用每秒的运算次数(Floating-Point Operations Per Second，FLOPS)或处理器运算单元能力(每秒可进行一万亿次计算(Tera Operations Per Second，TOPS)、每秒可进行十亿次计算(Giga Operations Per Second，GOPS)和/或每秒可进行一百万次计算(Million Operation Per Second，MOPS)) 等进行表示；

所述候选客户端参与特定联邦学习或联邦元学习的模型训练的次数；

所述候选客户端参与特定联邦学习或联邦元学习的模型训练的意愿程度。

本实施例中，候选客户端可以先向中心设备上报少量的训练数据(即第一训练数据)和/或第一参数，其中，第一参数可以是第一筛选条件的判断参数，中心设备根据第一筛选条件和/或第二筛选条件确定需要参与模型训练和上报训练结果的客户端，该客户端是选自候选客户端，具体地，可以有M个候选客户端，从其中确定N个客户端需要进行训练客户端筛选和上报，N可以小于M，也可以等于M。

一具体示例中，可以根据候选客户端的数据类型确定需要参与模型训练和上报训练结果的客户端，按照候选客户端的数据类型对候选客户端进行分组，每组内的候选客户端的数据类型相同或相近。在筛选客户端时，从每一组候选客户端中选取K1个候选客户端作为需要参与模型训练和上报训练结果的客户端，K1为正整数，这样可以保证参与训练的客户端的多样性，保证每一组候选客户端都有客户端参与模型训练，泛化性能更好，顾及每一组的客户端。

一具体示例中，可以根据候选客户端的业务类型确定需要参与模型训练和上报训练结果的客户端，按照候选客户端的业务类型对候选客户端进行分组，每组内的候选客户端的业务类型相同或相近。在筛选客户端时，从每一组候选客户端中选取K2个候选客户端作为需要参与模型训练和上报训练结果的客户端，K2为正整数，这样可以保证参与训练的客户端的多样性，保证每一组候选客户端都有客户端参与模型训练，泛化性能更好，顾及每一组的客户端。

一具体示例中，可以根据候选客户端的数据分布参数确定需要参与模型训练和上报训练结果的客户端，按照候选客户端的数据分布参数对候选客户端进行分组，每组内的候选客户端的数据分布参数相同或相近。在筛选客户端时，从每一组候选客户端中选取K3个候选客户端作为需要参与模型训练和上报训练结果的客户端，K3为正整数，这样可以保证参与训练的客户端的多样性，保证每一组候选客户端都有客户端参与模型训练，泛化性能更好，顾及每一组的客户端。

一具体示例中，可以根据候选客户端的工作场景确定需要参与模型训练和上报训练结果的客户端，按照候选客户端的工作场景对候选客户端进行分组，每组内的候选客户端的工作场景相同或相近。在筛选客户端时，从每一组候选客户端中选取A个候选客户端作为需要参与模型训练和上报训练结果的客户端，A为正整数，这样可以保证参与训练的客户端的多样性，保证每一组候选客户端都有客户端参与模型训练，泛化性能更好，顾及每一组的客户端。

一具体示例中，可以根据候选客户端收集数据的难易程度确定需要参与模型训练和上报训练结果的客户端，按照候选客户端收集数据的难易程度对候选客户端进行优先级排序，收集数据难度越小的候选客户端，被筛选到的优先级越高，按照优先级的从高到低从候选客户端中选取D个候选客户端作为需要参与模型训练和上报训练结果的客户端，D为正整数，这样可以降低数据采集的难度。

一具体示例中，可以根据候选客户端参与特定联邦学习或联邦元学习的模型训练的意愿程度确定需要参与模型训练和上报训练结果的客户端，按照意愿程度对候选客户端进行优先级排序，意愿程度越高的候选客户端，被筛选到的优先级越高，按照优先级的从高到低从候选客户端中选取G个候选客户端作为需要参与模型训练和上报训练结果的客户端，G为正整数，这样可以保证意愿程度高的候选客户端参与模型训练。

一具体示例中，可以根据候选客户端参与特定联邦学习或联邦元学习的模型训练的次数确定需要参与模型训练和上报训练结果的客户端，按照参与模型训练的次数对候选客户端进行优先级排序，已参与模型训练的次数越少的候选客户端，被筛选到的优先级越高，按照优先级的从高到低从候选客户端中选取K4个候选客户端作为需要参与模型训练和上报训练结果的客户端，K4为正整数，这样可以均衡候选客户端参与模型训练的次数。

一具体示例中，可以根据候选客户端的通信网络接入方式确定需要参与模型训练和上报训练结果的客户端，按照候选客户端的通信网络接入方式对候选客户端进行优先级排序，通信网络接入方式包括固网、WiFi和移动网络，移动网络包括2G，3G，4G，5G，6G等。其中，固网被筛选到的优先级大于等于WiFi被筛选到的优先级，WiFi被筛选到的优先级大于等于移动网络被筛选到的优先级。移动网络中代数越高，被筛选到的优先级越高，比如5G候选客户端被筛选到的优先级高于4G候选客户端被筛选到的优先级，按照优先级的从高到低从候选客户端中选取B个候选客户端作为需要参与模型训练和上报训练结果的客户端，B为正整数。

一具体示例中，可以根据候选客户端的信道质量确定需要参与模型训练和上报训练结果的客户端，按照候选客户端的信道质量对候选客户端进行优先级排序，信道质量越高的候选客户端，被筛选到的优先级越高，按照优先级的从高到低从候选客户端中选取C个候选客户端作为需要参与模型训练和上报训练结果的客户端，C为正整数，这样可以保证信道质量好的客户端参与模型训练和上报训练结果，保证模型的训练质量。

一具体示例中，可以根据候选客户端的电量状态确定需要参与模型训练和上报训练结果的客户端，按照候选客户端的电量状态对候选客户端进行优先级排序，候选客户端的电量越高，被筛选到的优先级越高，另外，处于充电状态的候选客户端被筛选到的优先级最高，按照优先级的从高到低从候选客户端中选取E个候选客户端作为需要参与模型训练和上报训练结果的客户端，E为正整数，这样可以保证参与模型训练和上报训练结果的客户端有足够的电量。

一具体示例中，可以根据候选客户端的存储状态确定需要参与模型训练和上报训练结果的客户端，按照候选客户端的存储状态对候选客户端进行优先级排序，候选客户端的可用存储空间越大，被筛选到的优先级越高，按照优先级的从高到低从候选客户端中选取F个候选客户端作为需要参与模型训练和上报训练结果的客户端，F为正整数，这样可以保证参与模型训练和上报训练结果的客户端有足够的可用存储空间来进行训练数据和训练结果的存储。

一具体示例中，可以根据候选客户端的算力确定需要参与模型训练和上报训练结果的客户端，按照候选客户端的算力对候选客户端进行优先级排序，候选客户端的算力越大，被筛选到的优先级越高，按照优先级的从高到低从候选客户端中选取P个候选客户端作为需要参与模型训练和上报训练结果的客户端，P为正整数，这样可以保证参与模型训练和上报训练结果的客户端有足够的算力来进行训练。

一些实施例中，单播的所述第一指示包括以下至少一项：

模型的结构；

模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。

上述模型指特定联邦学习或联邦元学习的模型。

一些实施例中，广播的所述第一指示包括以下至少一项：

参与训练的候选客户端的标识；

不参与训练的候选客户端的标识；

所述第一筛选条件；

模型文件；

模型的结构；

模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。

上述模型指特定联邦学习或联邦元学习的模型。

其中，进行客户端筛选的候选客户端的标识和不进行客户端筛选的候选客户端的标识组成所述第二筛选条件，候选客户端可以根据自身的标识判断自身是否满足第二筛选条件。

一些实施例中，所述中心设备接收所述客户端上报的训练结果之后，所述方法还包括：

根据所述训练结果判断模型达到收敛，所述中心设备将收敛的模型和超参数发送给L个推理客户端，所述L大于M，等于M或小于M。

本实施例中，中心设备基于接收到的训练结果判断模型是否收敛，如果模型不收敛，则重复筛选客户端，向客户端发送第一指示，接收客户端上报的训练结果的过程；如果模型收敛，则将收敛的模型和超参数发送给L个推理客户端，推理客户端可以选自候选客户端，还可以是候选客户端之外的其他客户端。

本实施例中，在经过至少一轮训练后需要做一次客户端筛选。在所有轮训练中，至少在进行客户端筛选的轮触发客户端上报第一训练数据和/或第一参数。经过多轮训练(包括多次的客户端筛选)后模型达到收敛时，中心设备将收敛的模型和超参数下发给推理客户端，推理客户端对模型进行性能验证和推理。

一些实施例中，所述中心设备通过以下至少一项向推理客户端发送收敛的模型和超参数：

媒体介入控制MAC控制单元CE；

无线资源控制RRC消息；

非接入层NAS消息；

管理编排消息；

用户面数据；

下行控制信息；

系统信息块SIB；

物理下行控制信道PDCCH的层1信令；

物理下行共享信道PDSCH的信息；

物理随机接入信道PRACH的MSG 2信息；

物理随机接入信道PRACH的MSG 4信息；

物理随机接入信道PRACH的MSG B信息；

广播信道信息或信令；

Xn接口信令；

PC5接口信令；

物理侧边链路控制信道PSCCH的信息或信令；

物理侧边链路共享信道PSSCH的信息；

物理侧边链路广播信道PSBCH的信息；

物理直通链路发现信道PSDCH的信息；

物理直通链路反馈信道PSFCH的信息。

一些实施例中，所述模型为联邦元学习模型，所述超参数由所述第一参数决定。

一些实施例中，所述超参数包括以下至少一项：

学习率，外迭代学习率，内迭代学习率，元学习率，迭代次数，内迭代次数，外迭代次数，训练所需要的数据量，批(batch)的大小，小批(mini batch)的大小，正则化参数，神经网络的层数，每一个隐藏层中神经元的个数，学习的回合(epoch)数，代价函数的选择，神经元激活函数。

相比于传统的联邦学习，联邦元学习通过多任务训练获得一个泛化性能最好的初始化参数，在新的任务下使用该初始化参数可以快速地收敛。联邦元学习的训练中有一些特殊的内容：训练过程分为内迭代和外迭代。因此由中心设备通知给客户端的超参数中会有联邦学习中不涉及的超参数，比如外迭代学习率，内迭代学习率，元学习率，内迭代次数，外迭代次数。

联邦元学习对客户端筛选的需求更大，因为联邦元学习的优势在于泛化性能更好。因此，参与训练的时候尽量做到对所有数据都公平。

对于联邦元学习，下发给不同客户端的一部分超参数可以不同。可以根据每个客户端对应的第一参数(主要是根据第一参数中的数据采集难易程度、客户端的电量状态、客户端的存储状态等)来决定每个客户端的上述一部分超参数。具体的原则包括以下至少一项：

数据采集难度大的客户端建议使用较少的内迭代次数和较大的内迭代步长，数据采集难度小的客户端建议使用较多的内迭代次数和较小的内迭代步长；

电量少的客户端建议使用较少的内迭代次数和较大的内迭代步长，电量多的客户端建议使用较多的内迭代次数和较小的内迭代步长；

可用存储空间少的客户端建议使用较少的内迭代次数和较大的内迭代步长，可用存储空间多的客户端建议使用较多的内迭代次数和较小的内迭代步长；

数据采集难度大的客户端数较多时，建议使用较少的外迭代次数和较大的外迭代学习率；数据采集难度大的客户端数较少时，建议使用较多的外迭代次数和较小的外迭代学习率；

电量少的客户端数较多时，建议使用较少的外迭代次数和较大的外迭代学习率；电量少的客户端数较少时，建议使用较多的外迭代次数和较小的外迭代学习率；

可用存储空间少的客户端数较多时，建议使用较少的外迭代次数和较大的外迭代学习率；可用存储空间少的客户端数较少时，建议使用较多的外迭代次数和较小的外迭代学习率。

本实施例中，所述中心设备为网络侧设备或终端；所述客户端为网络侧设备或终端。如多个网络侧设备联合做联邦学习或联邦元学习的场景，以及多个终端联合做联邦学习或联邦元学习的场景。其中，中心设备与客户端之间的信息交互(包括第一参数、第一指示等)可以通过一次通信完成，也可以通过多次通信完成。

另外，候选客户端可以为网络侧设备，也可以为终端；推理客户端可以为网络侧设备，也可以为终端。

本申请实施例还提供了一种客户端筛选方法，如图5所示，包括：

步骤201：客户端接收中心设备的第一指示，所述第一指示用以指示所述客户端参与特定联邦学习或联邦元学习的模型训练；

步骤202：所述客户端进行特定联邦学习或联邦元学习的模型训练，并向所述中心设备上报训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。

一些实施例中，所述客户端通过以下至少一项向所述中心设备上报训练结果：

媒体介入控制MAC控制单元CE；

无线资源控制RRC消息；

非接入层NAS消息；

物理上行控制信道PUCCH的层1信令；

物理随机接入信道PRACH的MSG 1信息；

物理随机接入信道PRACH的MSG 3信息；

物理随机接入信道PRACH的MSG A信息；

物理上行共享信道PUSCH的信息；

Xn接口信令；

PC5接口信令；

物理侧边链路控制信道PSCCH；

物理侧边链路共享信道PSSCH；

物理侧边链路广播信道PSBCH；

物理直通链路发现信道PSDCH；

物理直通链路反馈信道PSFCH。

一些实施例中，所述客户端接收中心设备的第一指示包括：

所述客户端接收所述中心设备单播的所述第一指示，所述客户端为所述中心设备按照预设的第一筛选条件从候选客户端中筛选出的客户端；或

所述客户端接收所述中心设备广播的所述第一指示，所述第一指示携带有第二筛选条件，所述第二筛选条件用于筛选上报训练结果的客户端，所述客户端满足所述第二筛选条件。

一些实施例中，所述客户端进行特定联邦学习或联邦元学习的模型训练，并向所述中心设备上报训练结果包括：

若所述客户端接收所述中心设备单播的所述第一指示，所述客户端进行模型训练并上报训练结果；或

若所述客户端接收所述中心设备广播的所述第一指示，所述客户端进行模型训练并上报训练结果。

一些实施例中，所述客户端接收中心设备的第一指示之前，所述方法还包括：

候选客户端向所述中心设备上报第一训练数据和/或第一参数，所述第一参数可以是所述第一筛选条件的判断参数，所述第一训练数据用于确定所述第一参数。

一些实施例中，所述客户端通过以下至少一项向所述中心设备上报第一训练数据和/或第一参数：

媒体介入控制MAC控制单元CE；

无线资源控制RRC消息；

非接入层NAS消息；

物理上行控制信道PUCCH的层1信令；

物理随机接入信道PRACH的MSG 1信息；

物理随机接入信道PRACH的MSG 3信息；

物理随机接入信道PRACH的MSG A信息；

物理上行共享信道PUSCH的信息；

Xn接口信令；

PC5接口信令；

物理侧边链路控制信道PSCCH；

物理侧边链路共享信道PSSCH；

物理侧边链路广播信道PSBCH；

物理直通链路发现信道PSDCH；

物理直通链路反馈信道PSFCH。

一些实施例中，所述候选客户端向所述中心设备仅上报所述第一训练数据，所述第一训练数据用于确定所述第一参数。

一些实施例中，所述第一参数包括以下至少一项：

所述候选客户端的数据类型；

所述候选客户端的数据分布参数；

所述候选客户端的业务类型，比如增强移动宽带(eMBB)，超可靠低延迟通信(URLLC)，大规模机器类型通信(mMTC)，其他6G新场景等；

所述候选客户端的工作场景，包括但不限于：高速、低速、视距传播LOS、非视距传播NLOS、高信噪比、低信噪比等工作场景；

所述候选客户端的通信网络接入方式，包括移动网络、WiFi和固网，其中移动网络包括2G，3G，4G，5G和6G；

所述候选客户端的信道质量；

所述候选客户端收集数据的难易程度；

所述候选客户端的算力，比如GPU数、CPU数、核数等，或者，算力可以用每秒的运算次数FLOPS或处理器运算单元能力(TOPS、GOPS和/或MOPS)等进行表示；

一些实施例中，单播的所述第一指示包括以下至少一项：

模型文件；

模型的结构；

模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。

上述模型指特定联邦学习或联邦元学习的模型。

一些实施例中，广播的所述第一指示包括以下至少一项：

参与训练的候选客户端的标识；

不参与训练的候选客户端的标识；

所述第一筛选条件；

模型文件；

模型的结构；模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。

上述模型指特定联邦学习或联邦元学习的模型。

一些实施例中，向所述中心设备上报训练结果之后，所述方法还包括：

推理客户端接收所述中心设备发送的收敛的模型和超参数。

一些实施例中，所述超参数包括以下至少一项：

学习率，外迭代学习率，内迭代学习率，元学习率，迭代次数，内迭代次数，外迭代次数，训练所需要的数据量，批的大小，小批的大小，正则化参数，神经网络的层数，每一个隐藏层中神经元的个数，学习的回合数，代价函数的选择，神经元激活函数。

一些实施例中，所述推理客户端接收所述中心设备发送的收敛的模型和超参数之后，所述方法还包括：

所述推理客户端对所述模型进行性能验证；

若性能验证结果满足预设的第一条件，所述推理客户端将所述模型用于推理。

其中，第一条件可以是中心设备配置或预配置或协议约定的，推理客户端对模型进行性能验证后，还可以将是否进行推理的结果上报给中心设备。

一些实施例中，进行性能验证的模型为所述中心设备下发的模型，或，所述中心设备下发的模型经过微调后的模型。

本实施例中，推理客户端可以直接利用中心设备下发的模型进行性能验证，也可以是将中心设备下发的模型进行微调(fine-tuning)后再进行性能验证。对于元学习的微调，每个推理客户端对应的元学习相关的特殊超参数可以不同。可以根据每个推理客户端对应的第一参数(主要是根据第一参数中的客户端筛选难易程度、电量状态、存储状态等)来决定每个推理客户端的元学习相关的特殊超参数。

上述实施例中，模型可以为信道估计模型、移动性预测模型等。本申请实施例的技术方案可以应用于6G网络中，还可以应用于5G和5.5G网络中。

本申请实施例提供的客户端筛选方法，执行主体可以为客户端筛选装置。本申请实施例中以客户端筛选装置执行客户端筛选方法为例，说明本申请实施例提供的客户端筛选装置。

本申请实施例提供一种客户端筛选装置，包括：

一些实施例中，所述发送模块具体用于按照预设的第一筛选条件从M个候选客户端中筛选出N个客户端，向所述N个客户端单播所述第一指示，M，N为正整数，N小于或等于M；或

向所述M个候选客户端广播所述第一指示，所述第一指示携带有第二筛选条件，所述第二筛选条件用于筛选上报训练结果的客户端，所述客户端满足所述第二筛选条件。

一些实施例中，所述接收模块还用于接收所述候选客户端上报的第一训练数据和/或第一参数，所述第一参数可以是所述第一筛选条件的判断参数。

一些实施例中，所述接收模块用于仅接收所述候选客户端上报的第一训练数据，根据所述第一训练数据确定所述第一参数。

一些实施例中，所述第一参数包括以下至少一项：

所述候选客户端的数据类型；

所述候选客户端的数据分布参数；

所述候选客户端的信道质量；

所述候选客户端收集数据的难易程度；

所述候选客户端的算力，比如GPU(图形处理器)数、CPU(中央处理器)数、核数等，或者，算力可以用每秒的运算次数FLOPS或处理器运算单元能力(TOPS、GOPS和/或MOPS)等进行表示；

一些实施例中，单播的所述第一指示包括以下至少一项：

模型文件；

模型的结构；

模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。

一些实施例中，广播的所述第一指示包括以下至少一项：

参与训练的候选客户端的标识；

不参与训练的候选客户端的标识；

所述第一筛选条件；

模型文件；

模型的结构；

模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。

一些实施例中，所述发送模块还用于根据所述训练结果判断模型达到收敛，将收敛的模型和超参数发送给L个推理客户端，所述L大于M，等于M或小于M。

一些实施例中，所述超参数包括以下至少一项：

一些实施例中，所述中心设备为网络侧设备或终端；

所述客户端为网络侧设备或终端。

本申请实施例提供一种客户端筛选装置，包括：

一些实施例中，所述接收模块用于接收所述中心设备单播的所述第一指示，所述客户端为所述中心设备按照预设的第一筛选条件从候选客户端中筛选出的客户端；或

接收所述中心设备广播的所述第一指示，所述第一指示携带有第二筛选条件，所述第二筛选条件用于筛选上报训练结果的客户端，所述客户端满足所述第二筛选条件。

一些实施例中，所述上报模块用于若所述客户端接收所述中心设备单播的所述第一指示，进行模型训练并上报训练结果；或

若所述客户端接收所述中心设备广播的所述第一指示，进行模型训练并上报训练结果。

一些实施例中，所述上报模块还用于向所述中心设备上报第一训练数据和/或第一参数，所述第一参数可以是所述第一筛选条件的判断参数，所述第一训练数据用于确定所述第一参数。

一些实施例中，所述第一参数包括以下至少一项：

所述候选客户端的数据类型；

所述候选客户端的数据分布参数；

所述候选客户端的信道质量；

所述候选客户端收集数据的难易程度；

一些实施例中，单播的所述第一指示包括以下至少一项：

模型文件；

模型的结构；

模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。

一些实施例中，广播的所述第一指示包括以下至少一项：

参与训练的候选客户端的标识；

不参与训练的候选客户端的标识；

所述第一筛选条件；

模型文件；

模型的结构；模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。

一些实施例中，所述接收模块还用于接收所述中心设备发送的收敛的模型和超参数。

一些实施例中，所述超参数包括以下至少一项：

一些实施例中，所述超参数的第一部分由所述推理客户端对应的第一参数决定，所述第一部分包括以下至少一项：

外迭代学习率，内迭代学习率，元学习率，内迭代次数，外迭代次数。

一些实施例中，所述装置还包括：

处理模块，用于对所述模型进行性能验证；若性能验证结果满足预设的第一条件，将所述模型用于推理。

一些实施例中，进行性能验证的模型为所述中心设备下发的模型，或，所述中心设备下发的模型经过微调后得到的模型。

一些实施例中，所述中心设备为网络侧设备或终端；

所述客户端为网络侧设备或终端。

本申请实施例中的客户端筛选装置可以是电子设备，例如具有操作系统的电子设备，也可以是电子设备中的部件，例如集成电路或芯片。该电子设备可以是终端，也可以为除终端之外的其他设备。示例性的，终端可以包括但不限于上述所列举的终端11的类型，其他设备可以为服务器、网络附属存储器(Network Attached Storage，NAS)等，本申请实施例不作具体限定。

本申请实施例提供的客户端筛选装置能够实现图4至图5的方法实施例实现的各个过程，并达到相同的技术效果，为避免重复，这里不再赘述。

可选的，如图6所示，本申请实施例还提供一种通信设备600，包括处理器601和存储器602，存储器602上存储有可在所述处理器601上运行的程序或指令，例如，该通信设备600为中心设备时，该程序或指令被处理器601执行时实现上述客户端筛选方法实施例的各个步骤，且能达到相同的技术效果。该通信设备600为客户端时，该程序或指令被处理器601执行时实现上述客户端筛选方法实施例的各个步骤，且能达到相同的技术效果，为避免重复，这里不再赘述。

本申请实施例还提供了一种中心设备，该中心设备包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如上所述的客户端筛选方法的步骤。

本申请实施例还提供了一种中心设备，包括处理器及通信接口，其中，所述通信接口用于向客户端发送第一指示，指示所述客户端参与特定联邦学习或联邦元学习的模型训练；接收所述客户端上报的训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。

本申请实施例还提供了一种客户端，该客户端包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如上所述的客户端筛选方法的步骤。

本申请实施例还提供了一种客户端，包括处理器及通信接口，其中，所述通信接口用于接收中心设备的第一指示，所述第一指示用以指示所述客户端参与特定联邦学习或联邦元学习的模型训练；所述处理器用于进行特定联邦学习或联邦元学习的模型训练，并向所述中心设备上报训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。

上述中心设备可以为网络侧设备或终端，客户端可以为网络侧设备或终端。

当中心设备和/或客户端为终端时，本申请实施例还提供一种终端，包括处理器和通信接口，该终端实施例与上述终端侧方法实施例对应，上述方法实施例的各个实施过程和实现方式均可适用于该终端实施例中，且能达到相同的技术效果。具体地，图7为实现本申请实施例的一种终端的硬件结构示意图。

该终端700包括但不限于：射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709以及处理器710等中的至少部分部件。

本领域技术人员可以理解，终端700还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器7 10逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图7中示出的终端结构并不构成对终端的限定，终端可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

应理解的是，本申请实施例中，输入单元704可以包括图形处理单元(Graphics Processing Unit，GPU)7041和麦克风7042，图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元706可包括显示面板7061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板7061。用户输入单元707包括触控面板7071以及其他输入设备7072中的至少一种。触控面板7071，也称为触摸屏。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

本申请实施例中，射频单元701接收来自网络侧设备的下行数据后，可以传输给处理器710进行处理；另外，射频单元701可以向网络侧设备发送上行数据。通常，射频单元701包括但不限于天线、放大器、收发信机、耦合器、低噪声放大器、双工器等。

存储器709可用于存储软件程序或指令以及各种数据。存储器709可主要包括存储程序或指令的第一存储区和存储数据的第二存储区，其中，第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外，存储器709可以包括易失性存储器或非易失性存储器，或者，存储器709可以包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DRRAM)。本申请实施例中的存储器709包括但不限于这些和任意其它适合类型的存储器。

处理器710可包括一个或多个处理单元；可选的，处理器710集成应用处理器和调制解调处理器，其中，应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作，调制解调处理器主要处理无线通信信号，如基带处理器。可以理解的是，上述调制解调处理器也可以不集成到处理器710中。

一些实施例中，中心设备为终端，处理器710用于向客户端发送第一指示，指示所述客户端参与特定联邦学习或联邦元学习的模型训练；接收所述客户端上报的训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。

一些实施例中，处理器710用于按照预设的第一筛选条件从M个候选客户端中筛选出N个客户端，向所述N个客户端单播所述第一指示，M，N为正整数，N小于或等于M；或

一些实施例中，处理器710用于接收所述候选客户端上报的第一训练数据和/或第一参数，所述第一参数可以是所述第一筛选条件的判断参数。

一些实施例中，处理器710用于仅接收所述候选客户端上报的第一训练数据，根据所述第一训练数据确定所述第一参数。

一些实施例中，所述第一参数包括以下至少一项：

所述候选客户端的数据类型；

所述候选客户端的数据分布参数；

所述候选客户端的信道质量；

所述候选客户端收集数据的难易程度；

一些实施例中，单播的所述第一指示包括以下至少一项：

模型文件；

模型的结构；

模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。

一些实施例中，广播的所述第一指示包括以下至少一项：

参与训练的候选客户端的标识；

不参与训练的候选客户端的标识；

所述第一筛选条件；

模型文件；

模型的结构；

模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。

一些实施例中，处理器710用于根据所述训练结果判断模型达到收敛，将收敛的模型和超参数发送给L个推理客户端，所述L大于M，等于M或小于M。

一些实施例中，所述超参数包括以下至少一项：

一些实施例中，所述中心设备为网络侧设备或终端；

所述客户端为网络侧设备或终端。

一些实施例中，客户端为终端，处理器710用于接收中心设备的第一指示，所述第一指示用以指示所述客户端参与特定联邦学习或联邦元学习的模型训练；进行特定联邦学习或联邦元学习的模型训练，并向所述中心设备上报训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。

一些实施例中，处理器710用于接收所述中心设备单播的所述第一指示，所述客户端为所述中心设备按照预设的第一筛选条件从候选客户端中筛选出的客户端；或

一些实施例中，处理器710用于若所述客户端接收所述中心设备单播的所述第一指示，进行模型训练并上报训练结果；或

一些实施例中，处理器710用于向所述中心设备上报第一训练数据和/或第一参数，所述第一参数可以是所述第一筛选条件的判断参数，所述第一训练数据用于确定所述第一参数。

一些实施例中，所述第一参数包括以下至少一项：

所述候选客户端的数据类型；

所述候选客户端的数据分布参数；

所述候选客户端的信道质量；

所述候选客户端收集数据的难易程度；

一些实施例中，单播的所述第一指示包括以下至少一项：

模型文件；

模型的结构；

模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。

一些实施例中，广播的所述第一指示包括以下至少一项：

参与训练的候选客户端的标识；

不参与训练的候选客户端的标识；

所述第一筛选条件；

模型文件；

模型的结构；模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。

一些实施例中，处理器710用于接收所述中心设备发送的收敛的模型和超参数。

一些实施例中，所述超参数包括以下至少一项：

一些实施例中，处理器710用于对所述模型进行性能验证；若性能验证结果满足预设的第一条件，将所述模型用于推理。

一些实施例中，所述中心设备为网络侧设备或终端；

所述客户端为网络侧设备或终端。

当中心设备和/或客户端为网络侧设备时，本申请实施例还提供一种网络侧设备，包括处理器和通信接口。该网络侧设备实施例与上述网络侧设备方法实施例对应，上述方法实施例的各个实施过程和实现方式均可适用于该网络侧设备实施例中，且能达到相同的技术效果。

具体地，本申请实施例还提供了一种网络侧设备。如图8所示，该网络侧设备800包括：天线81、射频装置82、基带装置83、处理器84和存储器85。天线81与射频装置82连接。在上行方向上，射频装置82通过天线81接收信息，将接收的信息发送给基带装置83进行处理。在下行方向上，基带装置83对要发送的信息进行处理，并发送给射频装置82，射频装置82对收到的信息进行处理后经过天线81发送出去。

以上实施例中网络侧设备执行的方法可以在基带装置83中实现，该基带装置83包括基带处理器。

基带装置83例如可以包括至少一个基带板，该基带板上设置有多个芯片，如图8所示，其中一个芯片例如为基带处理器，通过总线接口与存储器85连接，以调用存储器85中的程序，执行以上方法实施例中所示的网络设备操作。

该网络侧设备还可以包括网络接口86，该接口例如为通用公共无线接口(common public radio interface，CPRI)。

具体地，本发明实施例的网络侧设备800还包括：存储在存储器85上并可在处理器84上运行的指令或程序，处理器84调用存储器85中的指令或程序执行如上所述的客户端筛选方法，并达到相同的技术效果，为避免重复，故不在此赘述。

本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述客户端筛选方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的终端中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。

本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述客户端筛选方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片，系统芯片，芯片系统或片上系统芯片等。

本申请实施例另提供了一种计算机程序/程序产品，所述计算机程序/程序产品被存储在存储介质中，所述计算机程序/程序产品被至少一个处理器执行以实现上述客户端筛选方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本申请实施例还提供了一种客户端筛选系统，包括：中心设备及客户端，所述中心设备可用于执行如上所述的客户端筛选方法的步骤，所述客户端可用于执行如上所述的客户端筛选方法的步骤。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

一种客户端筛选方法，包括：

中心设备向客户端发送第一指示，指示所述客户端参与特定联邦学习或联邦元学习的模型训练；

所述中心设备接收所述客户端上报的训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。
根据权利要求1所述的客户端筛选方法，其中，所述中心设备向所述客户端发送第一指示包括：

所述中心设备按照预设的第一筛选条件从M个候选客户端中筛选出N个客户端，向所述N个客户端单播所述第一指示，M，N为正整数，N小于或等于M；或

所述中心设备向所述M个候选客户端广播所述第一指示，所述第一指示携带有第二筛选条件，所述第二筛选条件用于筛选上报训练结果的客户端，所述客户端满足所述第二筛选条件。
根据权利要求2所述的客户端筛选方法，其中，所述中心设备向客户端发送第一指示之前，所述方法还包括：

所述中心设备接收所述候选客户端上报的第一训练数据和/或第一参数，所述第一参数是所述第一筛选条件的判断参数。
根据权利要求3所述的客户端筛选方法，其中，

所述中心设备仅接收所述候选客户端上报的第一训练数据，根据所述第一训练数据确定所述第一参数。
根据权利要求3或4所述的客户端筛选方法，其中，所述第一参数包括以下至少一项：

所述候选客户端的数据类型；

所述候选客户端的数据分布参数；

所述候选客户端的业务类型；

所述候选客户端的工作场景；

所述候选客户端的通信网络接入方式；

所述候选客户端的信道质量；

所述候选客户端收集数据的难易程度；

所述候选客户端的电量状态；

所述候选客户端的存储状态；

所述候选客户端的算力；

所述候选客户端参与特定联邦学习或联邦元学习的模型训练的次数；

所述候选客户端参与特定联邦学习或联邦元学习的模型训练的意愿程度。
根据权利要求2所述的客户端筛选方法，其中，单播的所述第一指示包括以下至少一项：

模型文件；

模型的结构；

模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。
根据权利要求2所述的客户端筛选方法，其中，广播的所述第一指示包括以下至少一项：

参与训练的候选客户端的标识；

不参与训练的候选客户端的标识；

所述第一筛选条件；

模型文件；

模型的结构；

模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。
根据权利要求3所述的客户端筛选方法，其中，所述中心设备接收所述客户端上报的训练结果之后，所述方法还包括：

根据所述训练结果判断模型达到收敛，所述中心设备将收敛的模型和超参数发送给L个推理客户端，所述L大于M，等于M或小于M。
根据权利要求8所述的客户端筛选方法，其中，所述模型为联邦元学习模型，所述超参数由所述第一参数决定。
根据权利要求8所述的客户端筛选方法，其中，所述超参数包括以下至少一项：

学习率，外迭代学习率，内迭代学习率，元学习率，迭代次数，内迭代次数，外迭代次数，训练所需要的数据量，批的大小，小批的大小，正则化参数，神经网络的层数，每一个隐藏层中神经元的个数，学习的回合数，代价函数的选择，神经元激活函数。
根据权利要求1所述的客户端筛选方法，其中，

所述中心设备为网络侧设备或终端；

所述客户端为网络侧设备或终端。
一种客户端筛选方法，包括：

客户端接收中心设备的第一指示，所述第一指示用以指示所述客户端参与特定联邦学习或联邦元学习的模型训练；

所述客户端进行特定联邦学习或联邦元学习的模型训练，并向所述中心设备上报训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。
根据权利要求12所述的客户端筛选方法，其中，所述客户端接收中心设备的第一指示包括：

所述客户端接收所述中心设备单播的所述第一指示，所述客户端为所述中心设备按照预设的第一筛选条件从候选客户端中筛选出的客户端；或

所述客户端接收所述中心设备广播的所述第一指示，所述第一指示携带有第二筛选条件，所述第二筛选条件用于筛选上报训练结果的客户端，所述客户端满足所述第二筛选条件。
根据权利要求13所述的客户端筛选方法，其中，所述客户端进行特定联邦学习或联邦元学习的模型训练，并向所述中心设备上报训练结果包括：

若所述客户端接收所述中心设备单播的所述第一指示，所述客户端进行模型训练并上报训练结果；或

若所述客户端接收所述中心设备广播的所述第一指示，所述客户端进行模型训练并上报训练结果。
根据权利要求13所述的客户端筛选方法，其中，所述客户端接收中心设备的第一指示之前，所述方法还包括：

候选客户端向所述中心设备上报第一训练数据和/或第一参数，所述第一参数是所述第一筛选条件的判断参数，所述第一训练数据用于确定所述第一参数。
根据权利要求15所述的客户端筛选方法，其中，所述第一参数包括以下至少一项：

所述候选客户端的数据类型；

所述候选客户端的数据分布参数；

所述候选客户端的业务类型；

所述候选客户端的工作场景；

所述候选客户端的通信网络接入方式；

所述候选客户端的信道质量；

所述候选客户端收集数据的难易程度；

所述候选客户端的电量状态；

所述候选客户端的存储状态；

所述候选客户端的算力；

所述候选客户端参与特定联邦学习或联邦元学习的模型训练的次数；

所述候选客户端参与特定联邦学习或联邦元学习的模型训练的意愿程度。
根据权利要求13所述的客户端筛选方法，其中，单播的所述第一指示包括以下至少一项：

模型文件；

模型的结构；

模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。
根据权利要求13所述的客户端筛选方法，其中，广播的所述第一指示包括以下至少一项：

参与训练的候选客户端的标识；

不参与训练的候选客户端的标识；

所述第一筛选条件；

模型文件；

模型的结构；模型初始化参数；

模型的输入物理量；

模型的输出物理量；

模型对应的参考点；

模型的超参数；

通信信息。
根据权利要求15所述的客户端筛选方法，其中，向所述中心设备上报训练结果之后，所述方法还包括：

推理客户端接收所述中心设备发送的收敛的模型和超参数。
根据权利要求19所述的客户端筛选方法，其中，所述模型为联邦元学习模型，所述超参数由所述第一参数决定。
根据权利要求19所述的客户端筛选方法，其中，所述超参数包括以下至少一项：

学习率，外迭代学习率，内迭代学习率，元学习率，迭代次数，内迭代次数，外迭代次数，训练所需要的数据量，批的大小，小批的大小，正则化参数，神经网络的层数，每一个隐藏层中神经元的个数，学习的回合数，代价函数的选择，神经元激活函数。
根据权利要求21所述的客户端筛选方法，其中，所述超参数的第一部分由所述推理客户端对应的第一参数决定，所述第一部分包括以下至少一项：

外迭代学习率，内迭代学习率，元学习率，内迭代次数，外迭代次数。
根据权利要求19所述的客户端筛选方法，其中，所述推理客户端接收所述中心设备发送的收敛的模型和超参数之后，所述方法还包括：

所述推理客户端对所述模型进行性能验证；

若性能验证结果满足预设的第一条件，所述推理客户端将所述模型用于推理。
根据权利要求23所述的客户端筛选方法，其中，进行性能验证的模型为所述中心设备下发的模型，或，所述中心设备下发的模型经过微调后得到的模型。
根据权利要求12所述的客户端筛选方法，其中，

所述中心设备为网络侧设备或终端；

所述客户端为网络侧设备或终端。
一种客户端筛选装置，包括：

发送模块，用于向客户端发送第一指示，指示所述客户端参与特定联邦学习或联邦元学习的模型训练；

接收模块，用于接收所述客户端上报的训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。
根据权利要求26所述的客户端筛选装置，其中，

所述发送模块具体用于按照预设的第一筛选条件从M个候选客户端中筛选出N个客户端，向所述N个客户端单播所述第一指示，M，N为正整数，N小于或等于M；或

向所述M个候选客户端广播所述第一指示，所述第一指示携带有第二筛选条件，所述第二筛选条件用于筛选上报训练结果的客户端，所述客户端满足所述第二筛选条件。
一种客户端筛选装置，包括：

接收模块，用于接收中心设备的第一指示，所述第一指示用以指示所述客户端参与特定联邦学习或联邦元学习的模型训练；

上报模块，用于进行特定联邦学习或联邦元学习的模型训练，并向所述中心设备上报训练结果，所述训练结果为所述客户端执行一轮模型训练后的结果或中间结果。
一种客户端，包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求12至25任一项所述的客户端筛选方法的步骤。
一种中心设备，包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1至11任一项所述的客户端筛选方法的步骤。
一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1-11任一项所述的客户端筛选方法，或者实现如权利要求12至25任一项所述的客户端筛选方法的步骤。