WO2024067193A1

WO2024067193A1 - Ai模型训练中用于获取训练数据的方法以及通信装置

Info

Publication number: WO2024067193A1
Application number: PCT/CN2023/119343
Authority: WO
Inventors: 田洋; 柴晓萌; 孙琰
Original assignee: 华为技术有限公司
Priority date: 2022-09-29
Filing date: 2023-09-18
Publication date: 2024-04-04
Also published as: CN117793767A

Abstract

本申请提供一种AI模型训练中用于获取训练数据的方法，可应用于AI模型的训练网元(第二网元)和训练数据的收集网元(第一网元)在逻辑上分离部署的场景。第一网元接收来自于第二网元的第一信息，第一信息用于第一网元所收集的候选训练数据的有效性的判定。第一网元收集AI模型的候选训练数据，并根据第一信息判定候选训练数据的有效性。在判定候选训练数据有效的情况下，第一网元向第二网元发送有效的候选训练数据，而不发送无效的候选训练数据；在收集的候选训练数据中不包含有效的候选训练数据的情况下，第一网元向第二网元指示此次收集的训练数据无效，不向第二网元发送此次收集的候选训练数据，可以减少空口资源浪费。

Description

AI模型训练中用于获取训练数据的方法以及通信装置

本申请要求于2022年09月29日提交中国国家知识产权局、申请号为“202211203052.X”、申请名称为“AI模型训练中用于获取训练数据的方法以及通信装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及机器学习领域，更具体地，涉及一种AI模型训练中用于获取训练数据的方法以及通信装置。

背景技术

在AI模型应用于空口技术的一些应用场景中时，AI模型的训练和AI模型的训练数据的收集可能部署在不同的网元。在此现状之下，AI模型的训练或更新需要AI模型的训练网元和训练数据的收集网元之间进行训练数据(例如，参考信号的测量结果和/或标签)的交互。

在现有的方案中，AI模型的训练网元和训练数据的收集网元之间的训练数据的交互通常是固定周期发送或持续存在的。而这种信息交互方式容易造成空口资源的浪费。

发明内容

本申请提供一种AI模型训练中用于获取训练数据的方法和通信装置，以期减少空口资源的浪费。

第一方面，提供了一种AI模型训练中用于获取训练数据的方法，可以应用于训练数据的收集网元，例如终端设备或接入网设备，该方法包括：

第一网元接收来自于第二网元的第一信息，所述第一信息用于所述第一网元收集的候选训练数据的有效性的判定，所述有效性的判定结果包括有效或无效；

所述第一网元收集所述AI模型的候选训练数据；

所述第一网元根据所述候选训练数据和所述第一信息，向第二网元发送第二信息，所述第二信息指示所述有效性的判定结果。

在本申请的技术方案中，第一网元为收集AI模型的训练数据的网元，第二网元为训练AI模型的网元。第二网元需要第一网元收集AI模型的训练数据时，向第一网元发送第一信息，第一信息用于指示第一网元收集AI模型的训练数据，同时也用于第一网元所收集的候选训练数据的有效性的判定(也简称为有效性判定)。第一网元收集AI模型的候选训练数据，并根据第一信息判定所收集的候选训练数据的有效性。之后，第一网元向第二网元发送第二信息，以指示该有效性的判定结果。基于该技术方案，第一网元在完成一次候选训练数据的收集之后，会对收集到的候选训练数据会进行有效性的判定。只有有效的候选训练数据才作为训练数据由第一网元提供给第二网元使用，而不是将收集的数据不作任何筛选地提供给第二网元。可以减少收集到的无效的候选训练数据的传输，从而降低空口资源的浪费。

结合第一方面，在第一方面的某些实现方式中，第一信息用于所述有效性判定所使用的约束条件的确定。可选的，所述约束条件可以包括如下一项或多项：

质量指标的门限和所述质量指标的判定准则；或，

符合质量指标的判定准则的训练数据的数量门限和所述训练数据的数量的判定准则；或，

单次有效性判定对应的候选训练数据收集的最大时长。

结合第一方面，在第一方面的某些实现方式中，所述第一信息指示如下一项或多项：

质量指标的门限；

质量指标的判定准则；

符合质量指标的判定准则的训练数据的数量门限；

符合质量指标的判定准则的训练数据的数量的判定准则；或，

单次有效性判定对应的候选训练数据收集的最大时长。

可以理解的是，如上信息中未被第一信息指示的部分，可以由协议预定义。

可选的，第一信息指示如上信息中的部分，可以包括显式指示如上信息中的部分中的一项或多项，或者，隐式指示如上信息中的部分中的一项或多项。显式指示可以包括：第一信息包括如上信息中其所显式指示的部分中的一项或多项。隐式指示可以包括：第一信息包括和如上信息中其所隐式指示的部分中的一项或多项对应的其他信息。可选的，该其他信息可以包括与如上信息中其所隐式指示的部分中的一项或多项具有对应关系的索引。其中，该其他信息可以包括一个或多个信息，其中，多个信息各自指示如上信息中被隐式指示的部分中各项信息的部分。

可选的，如上对应关系可以是协议预定义的，或是，预存储，预先配置的。其中，预先配置，可以采用无线资源控制(radio resource control，RRC)信令，配置多个索引与如上信息中一项或多项的组合的多个值的对应关系。

可选的，如上第一信息可以携带在控制信息，如下行控制信息(downlink control information，DCI)中。

可选的，如上质量指标可以包括一个或多个质量指标，其各自具有对应的门限及判定准则。比如，质量指标可以包括对参考信号的测量结果的质量指标，或，标签的质量指标中的一项或多项。其中，标签用于作为AI模型训练的比较真值。比如，标签可以包括位置信息，波束图样(pattern)，信道测量结果等中的一项或多项。

可选的，所述质量指标的门限可以包括如上符合质量指标的判定准则的训练数据的数量门限，所述质量指标的判定准则可以包括符合质量指标的判定准则的训练数据的数量的判定准则。

在本申请中，第一信息可以用于约束条件的确定，具体可以有多种实现方式，下面举几个例子进行说明。

在一个示例中，第一信息指示一个或多个质量指标的门限，该一个或多个质量指标的判定准则是由协议预定义的。例如，质量指标包括训练数据的信干噪比(signal to interference plus noise ratio,SINR)和训练数据的数量，SINR的判定准则为：SINR大于或等于门限Q；所述训练数据的数量的判定准则为：所述训练数据的数量大于或等于门限N。示例性地，第一信息指示Q和N，SINR的判定准则和所述训练数据的数量的判定准则均是由协议预定义的。

在该示例中，通过协议预定义质量指标的判定准则，可以节省指示开销。

在另一个示例中，第一信息指示一个或多个质量指标的门限，以及该一个或多个质量指标的判定准则。例如，质量指标包括训练数据的SINR和训练数据的数量，SINR的判定准则为：SINR大于或等于门限Q，所述训练数据的数量的判定准则为：所述训练数据的数量大于或等于门限N。示例性地，第一信息指示Q和N，此外，第一信息包含信息域，该信息域用于指示SINR的判定准则和所述训练数据的数量的判定准则。例如，若信息域的取值为1，表示“SINR大于或等于Q，且所述训练数据的数量大于或等于N”；若信息域的取值为0，表示“SINR大于Q，且所述训练数据的数量大于N”。

在该示例中，第一信息指示约束条件质量指标的门限以及该质量指标的判定准则，使得第二网元可以根据对训练数据的需求的变化，适应性更新约束条件，适用于约束条件变化较为频繁的场景，可以提升AI模型对于不同应用场景的适应性，并且提升了在不同应用场景下收集到符合要求的训练数据的概率。

在再一个示例中，第一信息指示部分质量指标的门限，另一部分质量指标的门限以及这些质量指标的判定准则由协议预定义。例如，质量指标包括训练数据的SINR和训练数据的数量，SINR的判定准则为：训练数据的SINR大于或等于门限Q，所述训练数据的数量的判定准则为：所述训练数据的数量大于或等于门限N。示例性地，第一信息指示Q，而所述训练数据的数量的门限N，以及SINR的判定准则和所述训练数据的数量的判定准则可以由协议预定义。

在该示例中，可以将应用场景中变化周期较长的质量指标的门限及其判定准则通过协议预定义，以节省信令开销；而将变化较为频繁的质量指标的门限及其判定准则通过第一信息来指示，可以保证对于所需训练数据的要求的灵活调整。该示例可以兼顾信令开销和约束条件更新的灵活性。

在再一个示例中，第一信息指示部分质量指标的门限和一个索引信息，该索引信息用于确定所述部分质量指标的判定准则，以及约束条件中其它质量指标的门限以及所述其它质量指标的判定准则。示例性地，第一信息指示SINR的门限Q和index 0,其中，index 0表示：训练数据的数量的门限为N，SINR的判定准则为：训练数据的SINR大于或等于Q，且，训练数据的数量的判定准则为：训练数据的数量至少为N个。可选地，index 0为的多个应用场景中的一个应用场景下的索引值，例如，该多个应用场景包括但不限于CSI预测、上行定位、下行定位或波束管理，index 0为波束管理场景对应的一个或多个index中的一个index。可选地，index 0为某个应用场景下的索引值，例如，上行定位场景下对应多个index，index 0为该多个index中的一个。

在再一个示例中，第一信息指示一个索引信息，该索引信息用于确定一个或多个质量指标的门限，以及所述一个或多个质量指标的判定准则。示例性地，第一信息指示index 0,其中，index 0表示：训练数据SINR的门限为Q，训练数据的数量的门限为N，SINR的判定准则为：训练数据的SINR大于或等于Q，且，训练数据的数量的判定准则为：训练数据的数量至少为N个。可选地，index 0为的多个应用场景中的一个应用场景下的索引值，例如，该多个应用场景包括但不限于CSI预测、上行定位、下行定位或波束管理，index 0为波束管理场景对应的一个或多个index中的一个index。可选地，index0为某个应用场景下的索引值，例如，上行定位场景下对应多个index，index 0为该多个index中的一个。

在上述后两个示例中，索引信息和质量指标的门限和/或质量指标的判定准则的对应关系由协议预定义也仅是作为示例，也可以为其它可实现的方式，包括但不限于为预存储或预先配置等。

以上是关于第一信息用于确定约束条件的示例说明，本申请不限定于上述示例。

可选地，结合第一方面，在第一方面的某些实现方式中，所述第一信息所指示的质量指标包括AI模型的标签的质量指标。

可选地，AI模型的训练数据还包括标签。作为一个示例，在上行定位或下行定位的应用场景下，该标签为位置信息。可选地，约束条件中的质量指标还可以包括标签的质量指标，例如，标签的质量指标可以包括不同样本的位置之间距离的门限等。可选地，上述第一信息所指示的质量指标还包括AI模型的标签的质量指标。

结合第一方面，在第一方面的某些实现方式中，所述第二信息包括第一训练数据且所述第二信息指示所述第一网元收集的所述候选训练数据有效，所述第一训练数据为所述候选训练数据中的有效数据。

在该实现方式中，第一网元根据第一信息对收集到的候选训练数据进行有效性判定之后，若确定此次收集是有效的，则第一网元向第二网元发送第二信息，该第二信息可以为有效的候选训练数据(即，第一训练数据)，而不发送无效的候选训练数据，由此可以降低空口资源的浪费。

在本申请中，有效的候选训练数据会被提供给第二网元用于AI模型的训练或更新，也即有效的候选训练数据实际上即成为训练数据。而无效的候选训练数据也即不符合约束条件的候选训练数据。

此外，由于第一网元不会向第二网元发送无效的候选训练数据，因而第二网元不会接收到无效或不合格的训练数据，由此避免了对整个训练数据集造成污染。同时，也避免了对第二网元训练AI模型带来不利影响，例如，利用无效的候选训练数据进行AI模型训练导致的AI性能增益评估不准、AI模型过拟合、泛化能力弱以及场景适应能力差等问题。

结合第一方面，在第一方面的某些实现方式中，所述第二信息指示所述第一网元收集的所述候选训练数据无效。

在该实现方式中，第一网元根据第一信息对收集到的候选训练数据进行有效性判定之后，若确定此次收集是无效的，则第一网元向第二网元发送第二信息，该第二信息仅指示此次收集的候选训练数据无效，而不向第二网元提供收集到的候选训练数据，由此可以降低空口资源的浪费。此外，由于第二网元不会接收到无效或不合格的候选训练数据，因此避免了对整个训练数据集造成污染；同时，也避免了对第二网元训练AI模型带来不利影响，例如，利用无效的候选训练数据进行AI模型训练导致的AI性能增益评估不准、AI模型过拟合、泛化能力弱以及场景适应能力差等问题。

结合第一方面，在第一方面的某些实现方式中，所述第一信息用于所述第一网元收集的候选训练数据的有效性的判定的约束条件的确定。

在该实现方式中，第二网元在通过第一信息指示第一网元收集AI模型的训练数据的情况下，同时第一信息也用于第一网元确定待收集的训练数据应满足的约束条件，以便第一网元在收集到候选训练数据之后进行筛选(即有效性判定)，为第一网元判定所收集到的候选训练数据是否有效提供了的依据。

结合第一方面，在第一方面的某些实现方式中，该方法还包括：

若所述第一网元确定所述候选训练数据中包含满足所述约束条件的第一训练数据，所述第一网元确定所述候选训练数据有效；或者，

若所述第一网元确定所述候选训练数据中不包含满足所述约束条件的第一训练数据，所述第一网元确定所述候选训练数据无效。

在该实现方式中，收集到的候选训练数据中满足约束条件的候选训练数据的集合称为第一训练数据；而在不存在满足约束条件的候选训练数据的情况下，代表此次收集无效。

结合第一方面，在第一方面的某些实现方式中，在所述第一网元收集的所述候选训练数据无效的情况下，所述方法还包括：

所述第一网元接收来自于所述第二网元的第三信息，所述第三信息指示所述第一网元重新收集所述AI模型的候选训练数据。

在该实现方式中，在一次收集无效之后进行重新收集，可以将之前收集的无效的候选训练数据与重新采集的候选训练数据一起进行有效性判定，以提高获取到符合要求的候选训练数据(也即获取到训练数据)的概率。此外，还因为可以在重新收集时更新参考信号的空口传输配置，提高了获取到高质量候选训练数据的可能性，使得收集到合格训练数据的概率提高。

结合第一方面，在第一方面的某些实现方式中，所述方法还包括：

所述第一网元确定空口传输配置信息，所述空口传输配置信息对应更新的空口传输配置，所述空口传输配置信息指示所述第一网元基于所述更新的空口传输配置收集所述AI模型的候选训练数据；

其中，所述更新的空口传输配置信息包括如下一项或多项的更新：

参考信号的发送功率；

参考信号使用的天线端口数；

参考信号的频带宽度；

参考信号的频域密度；或，

参考信号的周期。

在该实现方式中，在需要重新收集AI模型的训练数据的情况下，与训练数据收集相关的参考信号的空口传输配置是可以更新的，从而可以改善或保障该参考信号的质量，以便于收集到有效的候选训练数据，从而为AI模型的训练，比如，初始训练/或更新过程的训练，提供保障。另外，由于参考信号的空口传输配置的更新有助于收集到有效的候选训练数据，因此还可以加快AI模型训练的效率。

此外，通过对AI模型的训练数据的收集状况的了解，可以获知是否有足够多的有效候选训练数据进行AI模型的训练/更新，为了保障可靠的基于AI模型的空口性能，有必要对AI模型进行及时的维护，或者切换到非AI的模式，或者自适应作出训练数据收集的配置更新。

结合第一方面，在第一方面的某些实现方式中，所述第三信息还指示所述有效性的判定的最大次数k，k为正整数。

在该实现方式中，通过第三信息指示有效性判定的最大次数k，也即只有在确定需要重新收集的情况下，第二网元才向第一网元指示该有效性判定的最大次数，可以避免在收集结果未知的情况下，就对重新收集的过程进行约束带来的信令浪费。例如，第一网元可能通过一次收集就获得了有效的候选训练数据，此时不需要进行重新收集，此时第二网元就不需要向第一网元指示重新收集的相关信息，以节省信令开销。

结合第一方面，在第一方面的某些实现方式中，所述第一信息还指示所述有效性的判定的最大次数k，k为正整数。

在该实现方式中，通过第一信息指示有效性判定的最大次数k，也即在开始收集训练数据的时候，第二网元就是指示了有效性判定的最大次数，以便于第一网元在一次收集失败之后，可以快速进入重新收集过程，可以节省第一网元和第二网元的交互时间，提高收集训练数据的效率。

在上述两种实现方式中，第二网元通过向第一网元指示有效性的判定的最大次数k，使得第一网元可以在第一次收集的候选训练数据无效的情况下，快速进行下一次候选训练数据的收集，并且在不超过有效性判定的最大次数k的情况下，可以重复进行候选训练数据的收集，可以节省重新收集的指示信令的开销，同时也提高了AI模型训练/更新的效率。

所述第一网元基于所述更新的空口传输配置，收集所述AI模型的候选训练数据；

若达到所述有效性的判定的最大次数k，且所述第一网元根据所述第一信息确定第k次有效性的判定结果为无效，所述第一网元停止收集所述AI模型的候选训练数据。

在该实现方式中，基于有效性判定的最大次数k的约束，可以避免第一网元的收集过程不陷入死循环，避免资源占用和浪费。

在超过所述有效性的最大判定次数k之前，若所述第一网元根据所述第一信息确定第j次有效性的判定结果为有效，所述第一网元向所述第二网元发送第四信息，所述第四信息包括第二训练数据，且所述第四信息指示所述第j次有效性的判定结果为有效，所述第二训练数据包括所述第j次有效性的判定所针对的候选训练数据中的有效数据，j小于或等于k，j为正整数。

结合第一方面，在第一方面的某些实现方式中，所述第一网元收集所述AI模型的候选训练数据，包括：

所述第一网元测量来自于所述第二网元的参考信号，获得一个或多个测量结果，所述AI模型的候选训练数据包括所述一个或多个测量结果；或者，

所述第一网元测量来自于第三网元的参考信号，获得一个或多个测量结果，所述AI模型的候选训练数据包括所述一个或多个测量结果。

在该实现方式中，基于不同的应用场景，第一网元收集AI模型的候选训练数据，可以是通过测量第二网元发送的参考信号，或者第三网元发送的参考信号，获得的测量结果。可选地，该测量结果可以是一个或多个。示例性地，第一网元通过一次参考信号的测量，获得一个测量结果；或者，第一网元通过多次参考信号的测量，获得多个测量结果；或者，第一网元通过一次参考信号的测量，获得多个测量结果，不作限定。在这些实现中，候选训练数据包括该一个测量结果或该多个测量结果。

结合第一方面，在第一方面的某些实现方式中，第一网元为终端设备，第二网元为接入网设备；所述第一网元测量来自于所述第二网元的参考信号，获得所述一个或多个测量结果。

可选地，来自于第二网元的信号包括如下一项或多项：信道状态信息-参考信号(chanel state information-reference signal,CSI-RS)、定位参考信号(positioning reference signal,PRS)、同步信号和物理广播信道块(synchronizing signal and physical broadcast channel block,SSB)中的同步信号和/或物理广播信道上的信号。

在该实现方式中，AI模型的应用可以适用于基于AI模型的CSI反馈或CSI预测、基于AI模型的波束管理等应用场景，可以解决CSI反馈或预测、波束管理等问题，提高这些应用场景中的空口性能。

结合第一方面，在第一方面的某些实现方式中，所述第一训练数据还包括所述一个或多个测量结果中的K个最优的测量结果对应的参考信号的信息，K为大于或等于1的整数。应理解，当测量结果为1个时，K即等于1；当测量结果为V个，K小于或等于V，且K大于或等于1，其中，V为大于或等于2的整数。

在该实现方式中，AI模型适用于波束管理的场景下，此时，第一训练数据还包括K个最优的测量结果对应的参考信号的信息，用于作为AI模型的标签。

结合第一方面，在第一方面的某些实现方式中，所述第一网元为接入网设备，所述第二网元为定位设备；

所述第一网元测量来自于所述第三网元的探测参考信号，获得所述一个或多个测量结果；

以及，所述第一训练数据还包括所述第三网元的位置信息。

在该实现方式中，AI模型适用于上行定位的场景下，此时，第一网元测量第三网元的探测参考信号，获得候选训练数据，该候选训练数据包括第三网元的位置信息。在候选训练数据有效的情况下，第一网元将有效的候选训练数据(即第一训练数据)和对应的第三网元的位置信息提供给定位设备，以用于AI模型的训练或更新，其中，第三网元的位置信息作为AI模型的标签。

结合第一方面，在第一方面的某些实现方式中，所述第一网元为终端设备，所述第二网元为定位设备；

所述第一网元测量来自于第三网元的定位参考信号，获得所述一个或多个测量结果，所述第三网元为接入网设备；

以及，所述第一训练数据还包括所述第一网元的位置信息。

在该实现方式中，AI模型适用于下行定位的场景下，如果第一网元(例如位置参考设备)收集的候选训练数据有效，第一网元向第二网元(即定位设备)提供的第一训练数据还包括第一网元的位置信息，第一网元的位置信息用于作为AI模型的标签。

第二方面，提供了一种AI模型训练中用于获取训练数据的方法，可以应用于AI模型的训练网元，例如接入网设备或定位设备，该方法包括：

第二网元向第一网元发送第一信息，所述第一信息用于所述第一网元收集的所述AI模型的候选训练数据的有效性的判定，所述有效性的判定结果包括有效或无效；

所述第二网元接收来自于所述第一网元的第二信息，所述第二信息指示所述有效性的判定结果。

其中，针对第一信息的描述，可以参考第一方面中的描述，在此不予赘述。

结合第二方面，在第二方面的某些实现方式中，所述第二信息包括第一训练数据且所述第二信息指示所述第一网元收集的所述候选训练数据有效，所述第一训练数据为所述候选训练数据中的有效数据。

结合第二方面，在第二方面的某些实现方式中，所述第二信息指示所述第一网元收集的所述候选训练数据无效。

结合第二方面，在第二方面的某些实现方式中，所述第一信息用于所述第一网元收集的所述候选训练数据的有效性的判定的约束条件的确定。

结合第二方面，在第二方面的某些实现方式中，若所述候选训练数据中包含满足所述约束条件的第一训练数据，所述候选训练数据有效；或者，

若所述候选训练数据中不包含满足所述约束条件的第一训练数据，所述候选训练数据无效。

结合第二方面，在第二方面的某些实现方式中，在所述第二信息指示所述第一网元收集的所述候选训练数据无效的情况下，所述方法还包括：

所述第二网元向所述第一网元发送第三信息，所述第三信息指示所述第一网元重新收集所述AI模型的候选训练数据。

结合第二方面，在第二方面的某些实现方式中，所述方法还包括：

所述第二网元确定空口传输配置信息，所述空口传输配置信息对应更新的空口传输配置，所述空口传输配置信息指示所述第一网元基于所述更新的空口传输配置收集所述AI模型的候选训练数据；

参考信号的发送功率；

参考信号使用的天线端口数；

参考信号的频带宽度；

参考信号的频域密度；或，

参考信号的周期。

结合第二方面，在第二方面的某些实现方式中，所述第三信息还指示所述有效性的判定的最大次数k，k为正整数。

结合第二方面，在第二方面的某些实现方式中，所述第一信息还指示所述有效性的判定的最大次数k，k为正整数。

所述第二网元接收来自于所述第一网元的第四信息，所述第四信息包括第二训练数据，且所述第四信息指示所述第一网元的第j次有效性判定的判定结果为有效，所述第二训练数据为所述第j次有效性的判定所针对的候选训练数据中的有效数据，j小于或等于k，j为正整数。

结合第二方面，在第二方面的某些实现方式中，所述第二网元为接入网设备，所述第一网元为终端设备，所述方法还包括：

所述第二网元向所述第一网元发送参考信号，所述参考信号用于所述第一网元获取对应于所述参考信号的一个或多个测量结果，所述AI模型的候选训练数据包括所述一个或多个测量结果。

结合第二方面，在第二方面的某些实现方式中，所述第一训练数据还包括所述一个或多个测量结果中的K个最优的测量结果对应的参考信号，K为大于或等于1的整数。

结合第二方面，在第二方面的某些实现方式中，所述第二网元为定位设备，所述第一网元为接入网设备，所述AI模型的候选训练数据包括一个或多个测量结果和第三网元的位置信息，所述一个或多个测量结果是由所述第一网元测量所述第三网元发送的探测参考信号获得的。

结合第二方面，在第二方面的某些实现方式中，所述第二网元为定位设备，所述第一网元为终端设备，所述AI模型的候选训练数据包括一个或多个测量结果和所述第一网元的位置信息，所述一个或多个测量结果基于对所述第三网元发送的定位参考信号的测量，所述第三网元为接入网设备。可选的，该测量由第一网元执行。

结合第二方面，在第二方面的某些实现方式中，所述约束条件包括如下一项或多项：

质量指标的门限和所述质量指标的判定准则；或，

单次有效性判定对应的候选训练数据收集的最大时长。

结合第二方面，在第二方面的某些实现方式中，所述第一信息指示如下一项或多项：

质量指标的门限；

质量指标的判定准则；

符合质量指标的判定准则的训练数据的数量门限；

符合质量指标的判定准则的训练数据的数量的判定准则；或

单次有效性判定对应的候选训练数据收集的最大时长。

可选地，上述实现方式中的质量指标包括一项或多项质量指标，比如，包括AI模型的标签的质量指标，或，对参考信号的测量结果的质量指标等中的一项或多项。

在第一方面或第二方面的某些实现方式中，所述约束条件基于所述AI模型的应用场景，所述AI模型的应用场景包括如下一项或多项：

基于所述AI模型的CSI反馈或CSI预测、基于所述AI模型的定位，或，基于所述AI模型的波束管理。

第三方面，本申请提供一种通信装置，该通信装置可以是终端设备，也可以是设置于终端设备中的装置、模块或芯片等，或者是能够和终端设备匹配使用的装置。一种设计中，该通信装置可以包括用于执行第一方面所述的方法/操作/步骤/动作所一一对应的模块，该模块可以是硬件电路，也可是软件，也可以是硬件电路结合软件实现。一种设计中，该通信装置可以包括处理模块和通信模块。

第四方面，本申请提供一种通信装置，一种设计中，该通信装置可以包括用于执行第二方面所述的方法/操作/步骤/动作所一一对应的模块，该模块可以是硬件电路，也可是软件，也可以是硬件电路结合软件实现。一种设计中，该通信装置可以包括处理模块和通信模块。在一个示例中，该通信装置为接入网设备或定位设备，定位设备例如可以为LMF网元。

第五方面，本申请提供一种通信装置，所述通信装置包括处理器，用于实现上述第一方面或第一方面的任一实现方式中所述的方法。处理器与存储器耦合，存储器用于存储指令和数据，所述处理器执行所述存储器中存储的指令时，可以实现上述第一方面或第一方面的任一实现方式中所述的方法。可选的，所述通信装置还可以包括存储器。可选的，所述通信装置还可以包括通信接口，所述通信接口用于该装置与其它设备进行通信，示例性的，通信接口可以是收发器、硬件电路、总线、模块、管脚或其它类型的通信接口。在一个示例中，该通信装置可以是终端设备，也可以是用于设置于终端设备中的装置、模块或芯片等，或者是能够和终端设备匹配使用的装置。

第六方面，本申请提供一种通信装置，所述通信装置包括处理器，用于实现上述第二方面或第二方面的任一实现方式中所述的方法。处理器与存储器耦合，存储器用于存储指令和数据，所述处理器执行所述存储器中存储的指令时，可以实现上述第二方面或第二方面的任一实现方式中所述的方法。可选的，所述通信装置还可以包括存储器。可选的，所述通信装置还可以包括通信接口，所述通信接口用于该装置与其它设备进行通信，示例性的，通信接口可以是收发器、硬件电路、总线、模块、管脚或其它类型的通信接口。在一个示例中，该通信装置可以为接入网设备，也可以是用于设置于接入网设备中的装置、模块或芯片等，或者是能够和接入网设备匹配使用的装置。在另一个示例中，该通信装置可以为定位设备，也可以是用于设置于定位设备中的装置、模块或芯片等，或者是能够和定位设备匹配使用的装置。

第七方面，本申请提供一种通信系统，包括第一网元和第二网元。示例性地，第一网元和第二网元之间的交互如下：

第二网元向第一网元发送第一信息，所述第一信息用于所述第一网元收集的候选训练数据的有效性的判定，所述有效性的判定结果包括有效或无效；

所述第一网元接收来自于所述第二网元的所述第一信息；

所述第一网元收集AI模型的候选训练数据；

所述第一网元根据所述候选训练数据和所述第一信息，向所述第二网元发送第二信息，所述第二信息指示有效性的判定结果；

所述第二网元接收来自于所述第一网元的所述第二信息。

具体地，第一网元侧的方案可以参考第一方面中实现进行理解，第二网元侧的方案可以参考第二方面的实现进行理解，这里不再赘述。示例性地，该通信系统包括终端设备和接入网设备。可选地，该通信系统包括终端设备、接入网设备和定位设备。可选地，终端设备为位置参考设备，定位设备为LMF网元。

第八方面，本申请提供一种通信系统，包括如第三方面或第五方面所述的通信装置，以及如第四方面或第六方面所述的通信装置。

第九方面，本申请还提供了一种计算机程序，当所述计算机程序在计算机上运行时，使得所述计算机执行上述第一方面、第二方面，或者，如第一方面或第二方面的任一实现方式中提供的方法。

第十方面，本申请还提供了一种计算机程序产品，包括指令，当所述指令在计算机上运行时，使得计算机执行上述第一方面、第二方面，或者，如第一方面或第二方面的任一实现方式中提供的方法。

第十一方面，本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序或指令，当所述计算机程序或者指令在计算机上运行时，使得所述计算机执行上述第一方面、第二方面，或者，如第一方面或第二方面的任一实现方式中提供的方法。

第十二方面，本申请还提供了一种芯片，所述芯片用于读取存储器中存储的计算机程序，执行上述第一方面、第二方面，或者，如第一方面或第二方面的任一方面提供的方法；或者，所述芯片包括用于执行上述第一方面、第二方面，或者，如第一方面或第二方面的任一方面提供的方法的电路。

第十三方面，本申请还提供了一种芯片系统，该芯片系统包括处理器，用于支持装置实现上述第一方面、第二方面，或者如所述第一方面或第二方面中任一方面提供的方法。在一种可能的设计中，所述芯片系统还包括存储器，所述存储器用于保存该装置必要的程序和数据。该芯片系统可以由芯片构成，也可以包含芯片和其他分立器件。

如上第二方面至第十三方面的任一方面或其任一实现方式所提供的方案的技术效果，可参考第一方面中的相应描述，不再赘述。

附图说明

图1为神经网络迭代过程示意图。

图2为适用于本申请实施例的通信系统的架构示意图。

图3为本申请提供的AI模型训练中用于获取训练数据的方法的示意性流程图。

图4为一种基于AI模型的CSI反馈机制的示意图。

图5为本申请提供的基于AI模型的CSI反馈中获取训练数据的示例。

图6为本申请提供的技术方案在基于AI模型的上行定位场景的示意图。

图7为本申请提供的基于AI模型的上行定位中获取训练数据的示例。

图8为本申请提供的技术方案在基于AI模型的下行定位场景的示意图。

图9为本申请提供的基于AI模型的下行定位中获取训练数据的示例。

图10为基于AI辅助的稀疏波束扫描过程示意图。

图11为本申请提供的基于AI模型的波束管理中获取训练数据的示例。

图12为本申请提供的通信装置的示意性结构图。

图13为本申请提供的通信装置的示意性结构图。

具体实施方式

下面将结合附图，对本申请中的技术方案进行描述。

首先对本申请实施例中涉及到的相关概念和技术作简单介绍。

AI模型：指将一定维度的输入映射到一定维度的输出的函数模型，其模型参数通过机器学习训练得到。例如，f(x)＝ax²+b是一个二次函数模型，它可以视作一个AI模型，a和b为该AI模型的参数，可以通过机器学习训练得到。示例性地，本申请下文实施例中提及的AI模型不限于为神经网络、线性回归模型、决策树模型、支持向量机(support vector machine,SVM)、贝叶斯网络、Q学习模型或者其他机器学习(machine learning,ML)模型。

训练数据集：机器学习中用于模型训练、验证和测试的数据，数据的数量和质量将影响到机器学习的效果。训练数据即可以包括AI模型的输入，或者包括AI模型的输入和目标输出。其中，目标输出即为AI模型的输出的目标值，也可以称为输出真值、输出真值、标签或者标签样本。

模型训练：通过选择合适的损失函数，利用优化算法对模型参数进行训练，使得损失函数的取值小于门限，或者使得损失函数的取值满足目标需求的过程。

AI模型设计：主要包括数据收集环节(例如，收集训练数据和/或推理数据)、模型训练环节以及模型推理环节。进一步地还可以包括推理结果应用环节。在前述数据收集环节中，数据源(data source)用于提供训练数据集和推理数据。在模型训练环节中，通过对数据源提供的训练数据(training data)进行分析或训练，得到AI模型。其中，AI模型表征了模型的输入和输出之间的映射关系。通过模型训练节点学习得到AI模型，相当于利用训练数据学习得到模型的输入和输出之间的映射关系。在模型推理环节中，使用经由模型训练环节训练后的AI模型，基于数据源提供的推理数据进行推理，得到推理结果。该环节还可以理解为：将推理数据输入到AI模型，通过AI模型得到输出，该输出即为推理结果。该推理结果可以指示：由执行对象使用(执行)的配置参数、和/或由执行对象执行的操作。在推理结果应用环节中进行推理结果的发布，例如推理结果可以由执行(actor)实体统一规划，例如执行实体可以发送推理结果给一个或多个执行对象(例如，核心网设备、接入网设备、或终端设备等)去执行。又如执行实体还可以反馈模型的性能给数据源，便于后续实施模型的更新训练。

损失函数：用于衡量模型的预测值和真实值之间的差异或差距。

模型应用：利用训练好的模型去解决实际问题。

机器学习(machine learning,ML)是实现人工智能(artificial intelligence,AI)的一种重要技术途径。机器学习可以分为监督学习、非监督学习、强化学习。

作为一个示例，监督学习依据已采集到的样本值和样本标签，利用机器学习算法学习样本值到样本标签的映射关系，并用机器学习模型来表达学到的映射关系。训练机器学习模型的过程就是学习这种映射关系的过程。例如信号检测中，含噪声的接收信号即为样本，该信号对应的真实星座点即为标签。机器学习期望通过训练学习到样本与标签之间的映射关系，即，使机器学习模型学到一种信号检测器。在训练时，通过计算模型的预测值与真实标签的误差来优化模型参数。一旦映射关系学习完成，就可以利用学到的映射关系来预测每一个新样本的样本标签。监督学习学到的映射关系可以包括线性映射、非线性映射。根据标签的类型可将学习的任务分为分类任务和回归任务。

参见图1，图1为神经网络迭代过程示意图。如图1所示，选择n个样本组成一个batch，然后将batch丢进神经网络，得到输出结果。再将输出结果与样本标签丢给loss函数，计算出本轮的loss。最后将每个参数的导数配合步长参数来进行参数更新。这就是训练过程的一次迭代。batch是“批”的意思，即是说神经网络处理数据是分批处理的。batch size就是每批处理的样本的个数。所以一般找一个合适大小的样本量，可以并行计算加快训练速度，而一次处理的数据量又不会过大。

训练数据集是训练样本的集合，每个训练样本为神经网络的一次输入，训练数据集用于模型训练。训练数据集是机器学习最重要的部分之一，机器学习的训练过程本质上就是从训练数据集中学习它的某些特征，从而使得在该训练数据集下，神经网络的输出与理想目标值(也即标签或输出真值)之间的差异最小。通常情况下，即使采用相同的网络结构，使用不同训练数据集训练出来的神经网络的权重以及输出都不相同。因此，训练数据集的构成与选取，在某种程度上决定了训练出来的神经网络的性能。

当AI模型应用于空口技术中，无论是离线的模型更新/训练，还是在线的模型更新/训练，都需要对真实部署网络中的数据进行收集，以构成模型更新/训练所需的训练数据集。优良的训练数据集有助于无线通信AI算法设计获得更大的性能增益，且提升最终设计算法在多种场景下的泛化能力和鲁棒性。

在AI模型应用于空口技术的一些应用场景下时，若AI模型的训练网元和训练数据的收集网元不在一个网元，AI模型训练网元和训练数据收集网元之间需要进行训练数据的交互。基于当前的技术现状，训练数据的交互通常是周期或持续存在的，容易造成空口资源的浪费。

另外，训练数据收集网元收集训练数据的过程，也未受到AI模型训练网元的需求的约束，经常出现无效收集的情况出现，例如，训练数据收集网元所收集的训练数据不是AI模型训练网元所真正需求的训练数据，导致一些无效交互，带来空口资源的浪费。此外，如果AI模型训练网元使用这些训练数据进行AI模型训练，容易对AI模型的训练数据集造成污染，导致增益评估不准、出现模型过拟合、泛化能力弱、场景适应性差等多种问题。

针对上述问题，本申请提供一种AI模型训练中用于获取训练数据的方法，有益于上述问题的解决或改善。

本申请提供的技术方案可以应用于各种通信系统，例如，该通信系统可以是第四代(4th generation，4G)通信系统(例如长期演进(long term evolution，LTE)系统)、第五代(5th generation，5G)通信系统、全球互联微波接入(worldwide interoperability for microwave access，WiMAX)或者无线局域网(wireless local area network，WLAN)系统、卫星通信系统，或者是未来的通信系统，例如6G通信系统，或者多种系统的融合系统等。其中，5G通信系统还可以称为新无线(new radio,NR)系统。

通信系统中的一个网元可以向另一个网元发送信号，或者从另一个网元接收信号。其中信号可以包括信息、信令或者数据等。其中，网元也可以被替换为实体、网络实体、设备、通信设备、通信模块、节点、通信节点等等，本申请中以网元为例进行描述。

适用于本申请的通信系统，可以包括第一网元和第二网元，可选地，还包括第三网元。其中，关于第一网元、第二网元以及第三网元的数量不作限定。

参见图2，图2为适用于本申请实施例的通信系统的架构示意图。图2的(a)为适用于本申请实施例的一种通信系统的架构示意图。示例性地，该通信系统中包括网络设备110，终端设备120和终端设备130。终端设备120和130可以接入网络设备110，并和网络设备110进行通信。可选地，网络设备110可以为接入网设备。在一种实现中，该通信系统中还可以包括AI实体，网络设备可已将终端设备上报的与AI模型相关的数据转发给AI实体，由AI实体执行训练数据集构建、模型训练等AI相关的操作，并将训练好的AI模型、模型评估、测试结果等AI相关操作的输出提供给网络设备。在另一种实现中，AI实体也可以位于网络设备110内部，即为网络设备110的一个模块。图2的(b)为适用于本申请实施例的另一种通信系统的架构示意图。该通信系统中包括网络设备110，终端设备120，终端设备130和定位设备140。其中，定位设备140和网络设备110之间可以通过接口消息进行通信。示例性地，定位设备140为定位管理功能(location management function,LMF)，网络设备110可以为接入网设备，例如gNB或eNB等，不作限定。示例性地，若接入网设备110为gNB，则gNB和LMF之间可以通过NR定位协议A(NR positioning protocol A,NRPPa)消息交互信息；若接入网设备110为eNB，则eNB和LMF之间可以通过LTE定位协议(LTE positioning protocol,LPP)消息交互信息。可选地，终端设备与定位设备140之间也可以直接进行通信，如图2的(b)中所示的终端设备130与定位设备140之间的交互。在图2中，AI实体可以配置在定位设备140内部，或者和定位设备140分离配置，不作限定。可选的，定位设备可以与网络设备为同一个设备的不同模块，也可以是分离的不同设备。

在实际应用中，一个网络设备可以同时服务于一个或多个终端设备。一个终端设备也可以同时接入一个或多个网络设备。本申请实施例对该无线通信系统中包括的终端设备和网络设备的数量不做限定。此外，对于图2的(b)的定位设备140，也不限于为LMF网元，还可以为其它具有定位功能的网元，对其数量也不作限定。

示例性地，网络设备可以是具有无线收发功能的设备，该网络设备可以是提供无线通信功能服务的设备，通常位于网络侧，包括但不限于第五代(5th generation，5G)通信系统中的下一代基站(gNodeB,gNB)、第六代(6th generation,6G)移动通信系统中的基站、未来移动通信系统中的基站，或无线保真(wireless fidelity,WiFi)系统中的接入节点(access point,AP)，长期演进(long term evolution,LTE)系统中的演进型节点B(evolved node B,eNB)、无线网络控制器(radio network controller,RNC)、节点B(node B,NB)、基站控制器(base station controller,BSC)、家庭基站(例如,home evolved NodeB,或home Node B,HNB)、基带单元(base band unit,BBU)，传输接收点(transmission reception point,TRP)、发射点(transmitting point,TP)、基站收发台(base transceiver station,BTS)、卫星、无人机等。在一种网络结构中，网络设备可以包括集中单元(centralized unit,CU)节点，或包括分布单元(distributed unit,DU)节点，或者为包括CU节点和DU节点的RAN设备，或者为包括控制面CU节点和用户面CU节点，以及DU节点的RAN设备，或者，网络设备还可以为云无线接入网络(cloud radio access network,CRAN)场景下的无线控制器、中继站、车载设备以及可穿戴设备等。此外，基站可以是宏基站、微基站、中继节点、施主节点，或其组合。基站还可以指用于设置于前述设备或装置内的通信模块、调制解调器或芯片。基站还可以是移动交换中心以及设备到设备(device to device,D2D)、车辆外联(vehicle-to-everything,V2X)、机器到机器(machine to machine,M2M)通信中承担基站功能的设备、6G网络中的网络侧设备、未来的通信系统中承担基站功能的设备等。基站可以支持相同或不同接入技术的网络，不作限定。

网络设备可以是固定的，也可以是移动的。例如，接入网设备110可以是静止的，并负责来自终端设备120和130的一个或多个小区中的无线传输和接收。接入网设备110也可以是移动的，例如，直升机或无人机可以被配置成充当移动基站，并且一个或多个小区可以根据移动基站的位置移动。应理解，在其它示例中，直升机或无人机可以被配置成用作与基站110通信的设备。

本申请中，用于实现如上接入网络功能的通信装置可以是接入网设备，也可以是具有接入网络的部分功能的网络设备，也可以是能够支持实现接入网络功能的装置，例如芯片系统，硬件电路、软件模块、或硬件电路加软件模块，该装置可以被安装在接入网设备中或者和接入网设备匹配使用。本申请的方法中，以用于实现接入网设备功能的通信装置是接入网设备为例进行描述。

终端设备可以是用户侧的一种用于接收或发射信号的实体，如手机。终端设备包括具有无线连接功能的手持式设备、连接到无线调制解调器的其他处理设备或车载设备等。终端设备可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置。终端设备120可以广泛应用于各种场景，例如蜂窝通信、WiFi系统、D2D、V2X、端到端(peer to peer,P2P)、M2M、机器类型通信(machine type communication,MTC)、物联网(internet of things,IoT)、虚拟现实(virtual reality,VR)、增强现实(augmented reality,AR)、工业控制、自动驾驶、远程医疗、智能电网、智能家具、智能办公、智能穿戴、智能交通、智慧城市、无人机、机器人、遥感、被动传感、定位、导航与跟踪、自主交付与移动等。通信设备120的一些举例为：3GPP标准的用户设备(user equipment,UE)、WiFi系统中的站点(station,STA)、固定设备、移动设备、手持设备、可穿戴设备、蜂窝电话、智能电话、会话发起协议(session initialization protocol,SIP)电话、笔记本电脑、个人计算机、智能书、车辆、卫星、全球定位系统(global positioning system,GPS)设备、目标跟踪设备、无人机、直升机、飞行器、船只、遥控设备、智能家居设备、工业设备、个人通信业务(personal communication service，PCS)电话、无线本地环路(wireless local loop，WLL)站、个人数字助理(personal digital assistant，PDA)、无线网络摄像头、平板电脑、掌上电脑、移动互联网设备(mobile internet device，MID)、可穿戴设备如智能手表、虚拟现实(virtual reality，VR)设备、增强现实(augmented reality，AR)设备、工业控制(industrial control)中的无线终端、车联网系统中的终端、无人驾驶(self driving)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端如智能加油器，高铁上的终端设备以及智慧家庭(smart home)中的无线终端，如智能音响、智能咖啡机、智能打印机等。终端设备120可以为以上各种场景中的无线设备或用于设置于无线设备的装置，例如，上述设备中的通信模块、调制解调器或芯片等。终端设备也可以称为终端、用户设备(user equipment,UE)、移动台(mobile station，MS)、移动终端(mobile terminal，MT)等。终端设备还可以是未来的无线通信系统中的终端设备。此外，终端设备还可以包括位置参考设备，例如，自动导航小车(automated guided vehicle,AGV)或具有类似功能的设备。本申请的实施例对终端设备所采用的具体技术和具体设备形态不做限定。

本申请中，用于实现终端设备功能的通信装置可以是终端设备，也可以是具有以上通信设备的部分功能的终端设备，也可以是能够支持实现以上终端设备的功能的装置，例如芯片系统，该装置可以被安装在终端设备中或者和终端设备匹配使用。本申请中，芯片系统可以由芯片构成，也可以包括芯片和其他分立器件。

应理解，图2所示的通信系统中各个设备的数量、类型仅作为示意，本申请并不限于此，实际应用中在通信系统中还可以包括更多的终端设备、更多的接入网设备、更多的定位设备，还可以包括其它网元，例如可以包括核心网设备，和/或用于实现人工智能功能的网元。

下面介绍本申请提供的技术方案。

参见图3，图3为本申请提供的AI模型训练中用于获取训练数据的方法的示意性流程图。在图3的方法中，第一网元可以为收集AI模型的训练数据的网元，第二网元为AI模型的训练网元。可选地，第二网元可以是AI模型的训练网元，同时还是AI推理发生的网元。第一网元和第二网元可以是逻辑上分离部署的，作为不同的实现方式，第一网元和第二网元可能在物理上部署于同一个网元或不同的网元，不作限定。

310、第一网元接收来自于第二网元的第一信息，第一信息指示用于第一网元收集的候选训练数据的有效性的判定，其中，有效性的判定结果包括有效或无效。

第一网元根据第一信息，可以对收集的候选训练数据的有效性进行判定，也或者说，根据第一信息，第一网元可以判断所收集的候选训练数据是否有效。

具体地，第一网元在根据第一信息判定所收集的候选训练数据包含有效的训练数据的情况下，第一网元则确定所收集的候选训练数据有效；若第一网元根据第一信息判定所收集的候选训练数据中不包含有效的候选训练数据，第一网元则判定所收集的候选训练数据无效。换句话说，若第一网元所收集的候选训练数据中部分候选训练数据有效，即判定结果为有效。在判定结果为有效的情况下，有效的候选训练数据即成为第一网元此次收集的训练数据。示例性地，有效的候选训练数据(以下可简称为“有效数据”)可以是所收集的候选训练数据中的部分或全部，不作限定，在本文中统称为第一训练数据。若第一网元所收集的候选训练数据中不包含有效的候选训练数据，则判定结果为无效。

可以发现，在本申请实施例中，第一网元在收集到候选训练数据之后，会在第一网元侧进行一次有效性的判定。

作为一个示例，第一信息指示约束条件，该约束条件用于第一网元判定所收集的候选训练数据的有效性。

示例性地，约束条件包括如下一项或多项：

质量指标的门限和所述质量指标的判定准则；或，

符合质量指标的判定准则的训练数据的数量门限和所述训练数据的数量的判定准则，或，

单次有效性判定对应的候选训练数据收集的最大时长。

可选地，第一信息用于约束条件的确定。

示例性地，第一信息指示如下一项或多项信息：

质量指标的门限；

质量指标的判定准则；

符合质量指标的判定准则的训练数据的数量的门限；

符合质量指标的判定准则的训练数据的数量的判定准则；或者，

单次有效性判定对应的候选训练数据收集的最大时长。

假设约束条件包括一个或多个质量指标，第一信息用于约束条件的确定时，可以有多种实现方式。

可选地，在一个示例中，第一信息指示该一个或多个质量指标的门限，该一个或多个质量指标的判定准则是由协议预定义的。在该示例中，第一网元根据第一信息和协议预定义，确定该约束条件。

可选地，在另一个示例中，第一信息指示该一个或多个质量指标的门限，以及该一个或多个质量指标的判定准则。在该示例中，第一网元根据第一信息，确定该约束条件。

可选地，在再一个示例中，约束条件包括多个质量指标，第一信息指示该多个质量指标中部分质量指标的门限，另一部分质量指标的门限以及该多个质量指标的判定准则由协议预定义。在该示例中，第一网元根据第一信息和协议预定义，确定约束条件。

可选地，在再一个示例中，第一信息指示部分质量指标的门限和一个索引信息，该索引信息用于确定所述部分质量指标的判定准则，以及约束条件中其它质量指标的门限以及所述其它质量指标的判定准则。在该示例中，第一网元根据第一信息和该索引信息，确定约束条件。

可选地，在再一个示例中，第一信息指示一个索引信息，该索引信息用于确定一个或多个质量指标的门限，以及所述一个或多个质量指标的判定准则。在该示例中，第一网元根据该索引信息，确定约束条件。

此外可选地，上述示例中的“协议预定义”也可以为预先配置或预先存储等其它实现方式，不作限定。

此外，关于第一信息用于确定约束条件的具体实现还可以参考发明内容部分的相应实现，这里不再重复说明。

在一个示例中，第一信息还指示有效性判定的最大次数k，k为正整数。

可以理解的是，第一信息包括如上信息中的多项时，该多项信息可以携带在一条消息或分别携带在多条消息中，也即，第一信息可以携带在一条消息或携带在多条消息中。

其中，单次有效性判定对应的候选训练数据收集的最大时长，在下文记作Z，Z为大于0的数。该候选训练数据收集的最大时长，也即，候选训练数据可用于有效性判定的最大时长，候选训练数据的保留时长超过该最大时长Z，候选训练数据失效，不再用于有效性判定。可选的，该最大时长Z可以与两次相邻的有效性判定的间隔时间相同，或者，可以大于或小于两次相邻的有效性判定的间隔时间。在该最大时长大于两次相邻的有效性判定的间隔时间的情况下，一次有效性判定对应的候选训练数据可以包括该次有效性判定的前一次或多次有效性判定所对应的候选训练数据中的全部或部分。所述两次相邻的有效性判定的间隔时间可以是固定的，也即，有效性判定在一定时间内周期进行，也可以是变化的，也即，有效性判定时间不固定，比如，有效性判定是对满足门限要求的候选训练数据进行计数，当满足门限要求的候选训练数据的数量满足要求时，该次有效性判定完成，判定结果为有效；当满足门限要求的候选训练数据的数量不满足要求且超过了有效性判定的最大间隔时间T(即预设的间隔时间的门限)或者所收集的候选训练数据的数量超过预设门限(即所收集的候选训练数据的最大数量)，该次有效性判定也完成，判定结果为无效。具体的有效性判定的时间相关的信息，比如判定时间，周期性判定的起始时间，或，周期，最大间隔时间T，所收集的候选训练数据的最大数量等中的一项或多项，可以全部或部分由协议预定义，或者，基于配置。

根据上文的说明已知，在本申请中，第二网元向第一网元发送第一信息，第一信息用于第一网元收集的候选训练数据的有效性判定，实际上，第二网元通过第一信息向第二网元指示了训练数据的要求。或者说，符合该要求的候选训练数据才能作为训练数据用于AI模型的训练或更新，可见，第一网元所收集的候选训练数据需要经过“筛选”之后，符合要求的候选训练数据才会作为训练数据，由第一网元提供给第二网元使用。因此，第一网元收集到候选训练数据之后，会根据第一信息对收集到的候选训练数据进行有效性的判定。如果判定结果为无效，代表此次收集的候选训练数据不是第二网元所需求的，也即此次收集的候选训练数据中不包含符合要求的候选训练数据。在此情况下，第一网元可能会涉及到训练数据的重新收集。因此，第一网元在收集AI模型的训练数据的过程中，训练数据可能并不是一次收集就能获得的。在具体的实现中，单次有效性判定发生的最大时间间隔T相当于指定了第一网元多久执行一次有效性判定。

举例来说，若第i次有效性判定的判定结果为无效，第一网元重新收集候选训练数据。经过一段时间间隔，第一网元对所收集的候选训练数据进行第i+1次有效性的判定，i为正整数。因此，在本申请实施例中，第一网元收集AI模型的候选训练数据的次数和第一网元执行判定有效性判定的次数是对应的，或者说，是相等的。换句话说，第一网元每执行一次有效性的判定，代表着在此次判定之前有一次候选训练数据的收集。为了技术方案描述上的清楚，文中将第i个判定之前的一次候选训练数据的收集称为第i次收集。考虑到不同的实现方式，在该示例中，第i+1次的有效性判定可以是针对第i+1次收集获得的候选训练数据的，也可以是针对第i+1次收集以及第i+1次收集之前的一次或多次收集获得的候选训练数据的，不作限定。在此实现下，可能涉及到在一次有效性判定之后，第一网元如何处理该次判定之前所收集的候选训练数据的问题。

作为一个示例，第一网元开始候选训练数据的第i次收集之后，经过时间间隔T0(小于或等于最大时间间隔T)，对第i次收集的候选训练数据进行有效性判定，也即第i次有效性判定。假设第i次有效性判定的判定结果为无效，第一网元可以丢弃第i次收集的候选训练数据，在未超过有效性判定的最大次数k的情况下，再进行第i+1次收集。在该示例中，每一次有效性判定只针对时间间隔T0内收集到的候选训练数据，当该次收集无效，则丢弃该次收集的候选训练数据。作为另一个示例，一次有效性判定可以针对多个时间间隔T0内收集到的候选训练数据。或者说，一个有效性判定所针对的候选训练数据可能来自于多次收集。假设第i次有效性判定的判定结果为无效，在未超过有效性判定的最大次数k的情况下，第一网元可以保留第i次收集的部分候选训练数据。例如，第一网元保留第i次收集的候选训练数据中满足约束条件中的部分质量指标的判定准则的这部分候选训练数据。之后，再进行第i+1次收集。经过时间间隔T0，第一网元针对第i+1次收集的候选训练数据以及所保留时长未超过最大时长Z的第i次收集的部分候选训练数据进行有效性判定，即第i+1次有效性判定。可选地，在未超过有效性判定的最大次数k之前，若有效性的判定结果一直为无效，则第一网元可以将每次采集的候选训练数据中符合部分质量指标的判定准则的候选训练数据保留下来，并在完成一次新的收集之后，将保留的符合部分质量指标的判定准则的历史候选训练数据和新收集的候选训练数据一起进行有效性的判定。由此可见，在一次有效性判定中，被确定为无效的候选训练数据是针对该次有效性判定而言的，不代表此次有效性判定中被确定为无效的候选训练数据永远不能作为训练数据。本申请对这些具体的实现方式不作限定。

作为一个示例，约束条件基于AI模型的应用场景。例如，AI模型的应用场景包括但不限于为如下场景：

基于AI模型的CSI反馈或CSI预测、基于AI模型的定位，或者基于AI模型的波束管理。

在不同的应用场景下，约束条件中涉及的质量指标、质量指标的门限、质量指标的判定准则、符合质量指标的判定准则的训练数据的数量的门限，以及所述训练数据的数量的判定准则中的一项或多项可以不同，下文会针对不同的应用场景分别作举例说明。

320、第一网元收集AI模型的候选训练数据。

第一网元收集AI模型的候选训练数据。可选地，第一网元可以在接收到第一信息之后，也即，基于第一信息的触发，开始收集AI模型的候选训练数据。可选的，第一网元也可以在接收第一信息之前或同时，开始收集该AI模型的候选训练数据。也即，步骤310和步骤320的发生先后可以不予限定。

可选地，考虑到第二网元所需求的训练数据的要求可能是变化的，当第二网元对训练数据的要求发生变化，第二网元可以向第一网元发送更新的第一信息。其中，第一信息的更新主要是指根据第一信息所确定的约束条件的更新。当第一网元接收到更新的第一信息，则基于更新的第一信息所确定的约束条件，对收集到的候选训练数据进行有效性的判定。下文各实施例中仅以第一网元某一次接收到的第一信息作为示例，对有效性判定以及后续的流程进行说明。

330、第一网元向第二网元发送第二信息，第二信息指示第一网元收集的候选训练数据的有效性的判定结果。

若第一网元根据第一信息确定所收集的候选训练数据有效，第一网元向第二网元发送第二信息，第二信息指示第一网元收集的候选训练数据有效。

可选地，在一个示例中，第一网元向第二网元发送第一训练数据，第一训练数据本身隐含指示第一网元收集的候选训练数据有效。可选地，在另一个示例中，第一网元向第二网元发送第一训练数据，此时，第一网元还向第二网元发送用于指示第一网元收集的候选训练数据有效的信息，例如，信息a。在该示例中，第一网元向第二网元发送第一训练数据和信息a，信息a指示此次收集有效。

若第一网元根据第一信息确定所收集的候选训练数据无效，第一网元向第二网元发送第二信息，第二信息指示第一网元收集的候选训练数据无效。应理解，在第一网元收集的候选训练数据无效的情况下，第一网元仅向第二网元发送所收集的候选训练数据无效的指示，而不发送所收集的无效的候选训练数据，由此可以降低空口资源的浪费。

作为一个示例，在第一网元确定收集的候选训练数据无效的情况下，第一网元丢弃本次所收集的候选训练数据；或者，在上文描述的一些实现中，一次有效性判定中，无效的候选训练数据也可以被保留，用于后续的有效性判定。进一步地，若第二网元指示第一网元重新收集AI模型的训练数据，第一网元重新收集AI模型的候选训练数据。

可选地，在步骤320中，第一网元收集AI模型的候选训练数据，具体可以是第一网元测量来自于第二网元或第三网元的参考信号，获得AI模型的候选训练数据，也或者说，该候选训练数据包括第一网元测量参考信号获得的测量结果。在本申请中，参考信号泛指用于信道测量的信号。该信道测量可以用于信道状态信息反馈，波束管理，或定位等功能中的一项或多项。所述参考信号可以包括信道状态信息参考信号，同步信号，如主同步信号和/或辅同步信号，物理广播信号，同步信号和物理广播信号块(SSB)，解调参考信号，相位跟踪参考信号，或，定位参考信号中的一项或多项。当AI模型应用于不同的场景中时，参考信号可能是不同的，下文的实施例会针对不同的应用场景分别举例说明。此外，上述第三网元是指不同于第二网元的一个网元。

可以理解的是，在一个示例中，第一网元测量来自于第二网元的参考信号，获得测量结果。可选地，该测量结果可以是一个或多个。第一网元收集的AI模型的候选训练数据包括该一个或多个测量结果。在该示例中，第二网元在向第一网元发送参考信号之前，第二网元向第一网元发送空口传输配置信息，该空口传输配置信息对应空口传输配置，该空口传输配置信息指示第一网元基于该空口传输配置收集AI模型的候选训练数据。换句话说，第二网元是根据该空口传输配置发送参考信号的，第一网元测量来自于第二网元的参考信号，获得测量结果，从而收集到基于该空口传输配置的候选训练数据。可选地，第一网元为UE，第二网元为接入网设备，例如基站。

在另一个示例中，第一网元测量来自于第三网元的信号，获得测量结果。可选地，该测量结果可以是一个或多个。第一网元收集的AI模型的候选训练数据包括该一个或多个测量结果。可选地，第一网元为接入网设备，例如基站，第三网元为UE。在该示例中，第一网元在测量来自于第三网元的参考信号之前，第一网元配置第三网元发送参考信号，具体地，第一网元向第三网元发送空口传输配置信息，该空口传输配置信息对应空口传输配置。与上一个示例类似，第三网元基于该空口传输配置发送参考信号，第一网元测量来自于第三网元的参考信号，获得测量结果，从而获得基于该空口传输配置的候选训练数据。

在上述示例中，可选地，该空口传输配置可以包括如下一项或多项：

参考信号的发送功率；

参考信号所使用的天线端口数；

参考信号的频带宽度；

参考信号的频域密度；或者，

参考信号的周期。

根据图3所示的流程可知，第一网元收集AI模型的候选训练数据，并根据第一信息对候选训练数据进行有效性的判定，可以理解为对所收集的候选训练数据进行筛选。在所收集的候选训练数据有效的情况下，第一网元将有效的候选训练数据发送给第二网元，用于第二网元进行AI模型的训练或更新，此时，该有效的候选训练数据即为训练数据。在第一网元收集的候选训练数据无效的情况下，第一网元向第二网元指示本次候选训练数据的收集无效。

可以理解的是，一次收集的候选训练数据无效，也代表此次未收集到训练数据。一次收集的候选训练数据有效，也代表此次收集到训练数据，此时，该有效的候选训练数据即成为训练数据，在本文中称为第一训练数据，由第一网元提供给第二网元。

应理解，在本申请各实施例中，“第一网元重新收集AI模型的训练数据”，也表示“第一网元重新收集AI模型的候选训练数据”。因为如果第一网元未收集到训练数据，才会尝试重新收集，而重新收集的目的在于期望收集到AI模型的训练数据，但是收集到AI模型的训练数据的过程是先收集候选训练数据，再从候选训练数据中筛选训练数据。

第二网元在接收到第一网元的第二信息之后，若根据第二信息确定第一网元的本次收集无效，在一种可能的情况下，第二网元确定需要重新收集AI模型的训练数据。

作为一个示例，第二网元向第一网元发送第三信息，第三信息指示第一网元重新收集AI模型的训练数据。可选地，在一个示例中，第三信息指示有效性判定的最大次数k。可选的，每次有效性判定都包括一批新的训练数据，即，一个新的训练数据集的收集，因而有效性判定的最大次数，也可称为执行训练数据集收集的最大次数。

在此示例中，第二网元在接收到第一网元指示第一网元收集的候选训练数据无效的情况下，第二网元向第一网元发送第三信息，以指示第一网元重新收集AI模型的训练数据，同时，第三信息指示有效性判定的最大次数k，k为正整数。在第一次有效性判定所对应的候选训练数据无效的情况下，第一网元根据第三信息重新收集或继续收集候选训练数据。重新或继续收集可能涉及到多次，在每完成一次重新或继续收集之后，则进行一次有效性判定。如果判定结果为无效，则第一网元可以继续进行下一次重新收集，以及下一次的有效性判定，直至达到有效性判定的最大次数k。如果第1次有效性判定到第k-1次有效性判定的判定结果都为无效，且第k次有效性判定的判定结果依然为无效，第一网元将停止训练数据的收集。

在该示例中，第二网元在通过第三信息指示第一网元重新收集训练数据时，还可以向第一网元指示有效性判定的最大次数k。也即，该有效性判定的最大次数k的发送在第二网元确定需重新收集训练数据之后。该有效性判定的最大次数k可以包括在第三信息中，或者，通过除第三信息之外的其他信息携带。可选地，作为另一个示例，如步骤501中的描述，第二网元在向第一网元发送的第一信息中指示有效性判定的最大次数k。第二网元通过向第一网元指示有效性判定的最大次数k，对第一网元重新收集候选训练数据的过程进行了约束，使得第一网元在未收集到训练数据(也即有效的候选训练数据)的情况下，不会陷入无时间限制的重新收集的循环，而是在达到有效性判定的最大次数k之后，无论是否收集到训练数据，均停止收集。

在超过有效性判定的最大次数k之前，若第一网元根据第一信息确定第j次有效性判定的判定结果为有效，也即第j次有效性判定所针对的候选训练数据中包含有效的候选训练数据，则第一网元向第二网元发送第四信息，第四信息包括第二训练数据，且第四信息指示第j次有效性判定的判定结果为有效，第二训练数据具体可以包括第j次有效性判定所针对的候选训练数据中的有效的候选训练数据，j小于或等于k，j为正整数。

应注意，第j次有效性判定可以认为是针对一个候选训练数据的集合进行有效性判定的，而该集合中所包含的所有候选训练数据即为第j次有效性判定所针对的训练数据。其中，第j次有效性判定所针对的训练数据不限于为第j次收集到的候选训练数据，也可以包含第j次收集之前的一次或多次收集获得的候选训练数据，不作限定。

可选地，若第j次有效性判定的判定结果为有效，第一网元向第二网元发送第二训练数据以及信息a，信息a指示此次收集有效。

此外，在本申请各实施例中，有效性判定的最大次数k对应一个起始时刻，该起始时刻应理解为该有效性判定的最大次数k对应的训练数据的收集过程的起始时刻。示例性地，该起始时刻可以为第一网元接收第一信息或第三信息的时刻。相当于，第一网元从接收到第一信息或第三信息的时刻开始收集AI模型的训练数据。可选地，该收集过程的结束时刻是不确定的，例如，在超过有效性判定的最大次数k之前，若第j次有效性判定的判定结果为有效，则该收集过程结束，第一网元向第二网元发送有效的候选训练数据(也即第一训练数据)，j小于或等于k，j为正整数。但是，如果从第一次有效性判定直至第k次有效性判定，判定结果均为无效，则确定第k次有效性判定的判定结果为无效的时刻，为该收集过程的结束时刻。

本申请提供的获取训练数据的方法，训练数据的收集网元通过对收集到的候选训练数据进行有效性判定，并向AI模型的训练网元提供有效的候选训练数据，可以保证收集网元只向训练网元提供符合要求的训练数据，由于不符合要求的训练数据在收集网元侧被过滤掉，省去了无效的训练数据的交互，不仅节省了空口资源，也避免了对训练网元侧的训练数据集的污染，以及避免由此带来的其它不利影响。

以上对AI模型中获取训练数据的方法的主要流程进行了详细说明，下面针对AI模型应用于不同的场景中时，该获取训练数据的方法进行示例说明。

应用场景1

基于AI模型的信道状态信息(channel state information,CSI)反馈或CSI预测。

示例性地，应用场景1中的AI模型的训练或更新部署在接入网设备侧。接入网设备向UE发送下行参考信号，以便于UE通过测量下行参考信号获得测量结果，该测量结果即为候选训练数据。UE对获得的候选训练数据进行有效性判定，并将有效的候选训练数据提供给接入网设备侧，用于AI模型的训练或更新。示例性地，在该应用场景下，下行参考信号具体可以为CSI-RS。UE向接入网设备提供的有效的候选训练数据为AI模型的标签，具体为CSI。

在很多应用场景下，接入网侧需要获取下行CSI，用于决定调度UE的下行数据信道的资源、调制编码方案(modulation and coding scheme,MCS)和预编码等配置中的一项或多项。在时分双工(time division duplex,TDD)系统中，由于上行信道和下行信道的互易性，接入网设备可以通过测量上行参考信号获得上行CSI，进而推测出下行CSI，例如，将上行CSI作为下行CSI。在频分双工(frequency division duplex,FDD)系统中，上行信道和上行信道的互易性无法保证，下行CSI是UE测量下行参考信号获得的，例如，UE测量CSI-RS或者同步信号和物理广播信道块(synchronizing signal and physical broadcast channel block,SSB)等信号获得下行CSI。UE按照协议预定义或者接入网设备预配置的方式生成CSI报告，并通过CSI报告将下行CSI反馈给接入网设备，使得接入网设备获得下行CSI。

参见图4，图4为一种基于AI模型的CSI反馈机制的示意图。如图4所示，自适应编码(auto encoder,AE)模型由编码器(encoder)和解码器(decoder)两个子模型构成，AE泛指由两个子模型构成的网络结构。AE模型也可以称为双边模型，或者双端模型或协作模型。AE的编码器和解码器通常是共同训练的，可以互相匹配使用。CSI反馈可以基于AE的AI模型实现。例如，UE侧测量基站发送的下行参考信号，获得测量的CSI。UE通过对编码器对测量获得的CSI进行压缩和量化，并向基站反馈经过压缩和量化后的信息，如图3中所示的“反馈的CSI的信息”。基站通过解码器对该“反馈的CSI的信息”进行恢复，获得恢复得到的CSI。对于基站而言，解码器的输入是UE反馈的CSI的信息，而解码器的训练获得需要UE测量获得的CSI作为恢复出的CSI的真值(也或者说标签)。

在应用场景1中，接入网设备侧部署的AI模型，可以如图4所示的解码器。

参见图5，图5为本申请提供的基于AI模型的CSI反馈中获取训练数据的示例。

501、可选地，接入网设备确定需要收集AI模型的训练数据。

502、接入网设备向UE发送第一信息，第一信息用于UE收集的候选训练数据的有效性的判定。可选地，有效性的判定结果可以为有效或无效。

示例性地，第一信息指示用于UE收集的候选训练数据的有效性的判定的约束条件。

关于第一信息以及约束条件等可以参考步骤310中的相关说明，这里不予赘述。

在应用场景1中，作为一个示例，测量结果的质量指标可以为训练数据的SINR和训练数据的数量。第一信息指示SINR的门限Q和训练数据的数量的门限N，而SINR的判定准则和训练数据的数量的判定准则(例如，SINR大于或等于Q，且训练数据的数量大于或等于N)可以是协议预定义的。作为另一个示例，第一信息指示SINR的门限Q和训练数据的数量的门限N，以及SINR的判定准则和训练数据的数量的判定准则。例如，第一信息指示门限Q和门限N，且第一信息包含用于指示判定准则的信息域。示例性地，该信息域包括1个比特，该1个比特对应SINR的判定准则和训练数据的数量的判定准则，例如，该1个比特的取值为“1”表示“训练数据的SINR大于或等于Q，并且，训练数据的数量大于或等于N”，该1个比特的取值为“0”表示“训练数据的SINR大于Q且训练数据的数量大于N”。示例性地，该信息域包括2个比特b₁b₀，其中b₁对应SINR的判定准则，b₀对应训练数据的数量的判定准则。例如，当b₁的取值为1，表示“训练数据的SINR大于或等于Q”，当b₁的取值为0，表示“训练数据的SINR小于Q”；b₀指示训练数据的数量的判定准则也是类似的，不再赘述。作为再一个示例，第一信息指示训练数据的SINR的门限Q和训练数据的数量的门限N，此外，第一信息部分质量指标的判定准则，另一部分质量指标的判定准则是由协议预定义的。例如，第一信息指示门限Q和门限N，此外，第一信息还包括1个比特的信息域，当该1比特的取值为1时，表示“SINR大于或等于Q”，当该1比特的取值为0时，表示“SINR小于Q”；其中，训练数据的数量的判定准则由协议预定义，例如为“训练数据的数量至少为N个”。应理解，以上实现仅为第一信息用于确定约束条件的示例，不作限定。

示例性地，N可以为AI模型训练时batch的整数倍或者AI模型收敛所需的训练数据的数量。

503、接入网设备向UE发送参考信号。

UE通过对接入网设备的参考信号进行测量，获得一个或多个测量结果。在本申请中，测量结果也可以替换表达为参考信号的测量结果，或者信道测量结果。该替换表达也适用于其它应用场景下的实施例中，下文不作重复说明。

可选地，测量结果包括信道响应，比如信道响应矩阵。

此外，可选地，UE可以通过一次测量，获得一个测量结果，此时，候选训练数据包括该一个测量结果；可选地，UE通过多次测量，获得多个测量结果，此时，候选训练数据包括该多个测量结果。

示例性地，测量结果的质量指标可以包括但不限于如下一项或多项：首径功率、首径到达时延、定时误差组(timing error group,TEG)、时域采样点的平均功率、天线端口之间的相位差、全带或子带的等效SINR、全带或子带的干扰水平、视距(line of light,LOS)概率、站间同步误差、或，测量结果置信度等中的一项或多项，不作限定。该指标质量适用于应用场景1或者下文介绍的其它应用场景中，不作限定。应理解，这些质量指标可以对参考信号的测量结果进行相应的处理来获得。具体处理的过程在此不予限定，比如，可以为已知的或未来的一些处理。

应理解，接入网设备向UE发送参考信号之前，接入网设备还会向UE发送参考信号对应的空口传输配置信息。空口传输配置信息指示接入网设备发送参考信号的相关空口配置，示例性地，该空口传输配置信息可以包括但不限于为参考信号的发送功率、接入网设备发送参考信号时所使用的天线端口数量、参考信号的频带宽度、参考信号的频域密度以及参考信号的周期等信息中的一项或多项。本领域技术人员可以理解，空口传输配置信息还可能包括其它的相关信息，这里不作一一罗列。

在该场景下，UE收集的候选训练数据为测量来自于接入网设备的参考信号获得的一个或多个测量结果，或者说一个或多个信道测量结果。

示例性地，以5G系统为例，该参考信号可以为信道状态信息-参考信号(channel state information,CSI-RS)。

504、UE根据第一信息对所收集的候选训练数据进行有效性的判定。

示例性地，假设候选训练数据为UE通过测量参考信号获得的多个测量结果，该多个测量结果即为候选训练数据。UE根据约束条件判定该多个测量结果中是否包含有效的候选训练数据(或者说有效的测量结果)。如上文的示例，若约束条件为“质量指标(例如SINR)大于或等于门限Q，且符合质量指标大于或等于门限Q的候选训练数据的数量至少为N个”，则UE判定收集到的多个测量结果中是否包含质量等于或大于门限Q的测量结果。为了描述上的简洁，以下将质量指标等于或大于门限Q的测量结果记作测量结果1。若UE确定收集的多个测量结果中包含测量结果1，还需要判断测量结果1的数量是否达到N个。若根据约束条件确定收集到有效的测量结果，则UE判定此次收集的候选训练数据有效，其中，有效的候选训练数据(即第一训练数据，下文有时也称为有效数据)即为满足约束条件的这部分测量结果。例如，如果测量结果1的数量为P个，P为大于或等于N的整数，则该P个测量结果1即为此次收集的有效数据，也即第一训练数据。

反之，如果UE判定收集到的多个测量结果中不包含满足约束条件的测量结果，例如，收集到的多个测量结果中包含SINR等于或大于门限Q的测量结果1，但是测量结果1的数量不足N个；或者，收集到的多个测量结果的SINR均小于门限Q，在此情况下，UE确定此次收集的候选训练数据无效。

505、UE根据所收集的候选训练数据的有效性的判定，向接入网设备发送第二信息，第二信息指示有效性的判定结果。

在一种可能的情况下，第二信息指示UE所收集的候选训练数据有效。在一个示例中，第二信息可以为所收集的有效候选训练数据本身，例如上文示例中的P个测量结果1。在该示例中，该P个测量结果1既是有效候选训练数据，同时该P个测量结果1也隐含指示UE所收集的候选训练数据有效。在另一个示例中，UE发送第二信息和有效的候选训练数据。在该示例中，第二信息指示UE所收集的候选训练数据有效，例如，第二信息可以包含1个比特，当该1比特的取值为“1”时，表示UE收集的候选训练数据有效。此外，UE向接入网设备发送有效的候选训练数据。相比之下，前一个示例在能够指示UE所收集的候选训练数据有效的前提下，能进一步节省信令开销。

在另一种可能的情况下，第二信息指示UE所收集的候选训练数据无效。作为一个示例，第二信息可以包含1个比特，当该1比特的取值为“0”时，表示UE收集的候选训练数据无效。

示例性地，第二信息可以通过上行控制信息(uplink control information,UCI)信令携带，例如，UCI中包含1比特的信息，该1比特用于指示UE收集的候选训练数据为有效或无效。可选地，如上文的一个示例，若UE通过有效的候选训练数据隐含指示所收集的候选训练数据有效，该有效的候选训练数据也可以在UCI中发送，不作限定。

506、接入网设备根据第二信息确定UE的候选训练数据的收集是否有效。

和步骤505中的判定结果相对应，在一种可能的情况下，第二信息指示UE所收集的候选训练数据有效，在此情况下，接入网设备还从UE获取UE收集的有效的候选训练数据。进一步地，接入网设备根据有效的候选训练数据进行AI模型的训练或更新，如步骤507。

507、接入网设备进行AI模型的训练，以获得该AI模型或对该AI模型进行更新。

在另一种可能的情况下，第二信息指示UE所收集的候选训练数据无效。在此情况下的一种可能的实现中，接入网设备保持原有的AI模型的CSI反馈，或者切换到非AI模型的CSI反馈。作为一个示例，保持原有的AI模型可以是针对接入网设备上已经部署有训练好的AI模型，而此次训练数据的收集是基于更新AI模型的目的场景；切换到非AI模型可以是针对接入网设备上还没有训练好的AI模型，而此次训练数据的收集是为了训练获得AI模型的场景，在此场景下，若此次收集没有获得有效的候选训练数据，接入网设备可以切换到非AI模式的CSI反馈。这两种可能的情况如步骤508。

508、接入网设备基于原有的AI模型或切换到非AI模型进行CSI反馈。

在接入网设备执行步骤507或步骤508的情况下，一次训练数据的收集流程结束。

可选地，在另一种可能的情况下，第二信息指示UE所收集的候选训练数据无效，接入网设备获取到第二信息后，确定重新收集训练数据，如步骤509-510。

509、接入网设备确定重新收集AI模型的训练数据。

510、接入网设备向UE发送第三信息，第三信息指示UE重新收集AI模型的训练数据。

可选地，在一种可能的实现中，第三信息还指示有有效性判定的最大次数k，k为正整数。可选地，在另一种可能的实现中，有效性判定的最大次数k也可以由第一信息指示，不作限定。这两种实现在图3流程中已经详细说明，这里不再赘述。

可选地，在重新收集AI模型的训练数据的情况下，接入网设备可以更新空口传输配置。相应地，UE基于更新后的空口传输配置，重新收集AI模型的候选训练数据。

511、可选地，接入网设备向UE发送空口传输配置信息，该空口传输配置信息指示更新后的空口传输配置。

上文已经介绍过空口传输配置信息，如果空口传输配置有更新，步骤511中的空口传输配置信息指示更新后的空口传输配置。示例性地，空口传输配置的更新可以包括参考信号的发送功率、接入网设备发送参考信号时所使用的天线端口数量、参考信号的频带宽度、参考信号的频域密度、参考信号的周期等的更新等，不作限定。例如，空口传输配置的更新包括参考信号的发送功率增大、参考信号的频域密度增大，则接入网设备以更大的发送功率以及更大的频域密度向UE发送参考信号，以尝试让UE获得符合满足约束条件的候选训练数据。通过对空口传输配置的更新，可以保障空口基于AI模型的CSI反馈的精度性能。

当然，也可能在重新收集AI模型的训练数据时，不对原有的空口传输配置作更新。在此情况下，UE在原有的空口传输配置下重新收集候选训练数据，并基于约束条件对重新收集到的候选训练数据进行有效性的判定，并向接入网设备指示有效性的判定结果。

512、可选地，UE重新收集AI模型的训练数据。

应理解，在重新收集训练数据的流程中，重新收集的候选训练数据的有效性的判定，以及判定结果的指示与图5中的上述流程是类似的，不再赘述。需要理解的是，在重新收集训练数据的过程中，UE受到有效性判定的最大次数k的约束。

可选地，有效性判定的最大次数k可以是接入网设备根据训练数据收集的紧迫性确定的，示例性地，紧迫性可以是指AI模型的上一次更新至今的时间。例如，若AI模型的上一次更新至今的时间间隔较大，超过了某一个阈值，则认为AI模型的更新需求比较紧迫，因为时间间隔越大，意味着信道环境发生变化的可能性越大，代表AI模型对当前信道环境的匹配程度可能降低，因此更新需求则越紧迫。此时，有效性判定的最大次数k可以相应设置大一些，以便在一次无效收集之后，期望通过多次重新收集获得有效的候选训练数据。若AI模型的上一次更新至今的时间间隔很小，例如低于某个阈值，则认为紧迫性相对不足，有效性判定的最大次数k可以设置的小一些。可选地，紧迫性的判定准则也可以有其它实现，不作限定。

可见，将本申请提供的AI模型训练中用于获取训练数据的方法应用于基于AI模型的CSI反馈或CSI预测的场景下，可以减少AI模型训练流程中空口资源的浪费。此外，也避免了UE将无效的训练数据发送给接入网设备，对AI模型的训练数据集造成污染，从而影响AI模型的训练或更新，导致增益评估不准。

应用场景2

基于AI模型的定位场景。

由于上行定位和下行定位的不同，下面将对本申请的技术方案在上行定位和下行定位中的应用分别进行说明。

1、在上行定位中的应用。

参见图6，图6为本申请提供的技术方案在基于AI模型的上行定位场景的示意图。如图6，在上行定位中，AI模型的训练或更新部署在网络侧执行，以5G系统为例，AI模型可以部署在核心网的定位设备，例如LMF网元。其中，对于上行定位而言，AI模型的输入为一个或多个探测参考信号对应的一个或多个信道响应(或者说信道测量结果)，AI模型的输出为UE的位置。该一个或多个探测参考信号的发射端，如UE，可以为一个或多个，接收端，如接入网设备，也可以为一个或多个。

如图6所示，在上行定位中，定位设备对用于定位的AI模型进行训练时，从接入网侧获取一个接入网设备通过测量多个探测参考信号或多个接入网设备中的每个接入网设备分别通过测量一个或多个探测参考信号获得的多个测量结果，以及，第三网元的位置信息。其中，前述多个探测参考信号可以包括来自一个第三网元的多个探测参考信号，或，包括来自多个第三网元中每个第三网元的一个或多个探测参考信号。该一个第三网元的发送多个探测参考信号的不同时刻的位置信息，或，该多个第三网元在一个或多个时刻各自发送一个或多个探测参考信号时的位置信息，用于作为AI模型输出的位置信息的真值(即，标签)。

参见图7，图7为本申请提供的基于AI模型的上行定位中获取训练数据的示例。

701、可选地，定位设备确定需要收集AI模型的训练数据。

702、定位设备向接入网发送第一信息，第一信息用于接入网设备收集的候选训练数据的有效性的判定。可选地，判定结果可以为有效或无效。

示例性地，第一信息可以由定位设备和接入网设备之间的接口消息承载。以5G系统作为示例，若定位设备为LMF，接入网设备为gNB，则LMF和gNB之间的第一信息可以包含在NRPPa消息中。

703、接入网设备向第三网元发送空口传输配置信息(如空口传输配置信息#1)，空口传输配置信息指示第三网元发送探测参考信号时的空口传输配置。

在该实施例中，第三网元为可以提供自身位置信息的网元。在一个示例中，第三网元可以为位置参考设备。其中，位置参考设备可以视作一种特殊的网元，一般可以由网络厂商对其进行配置，例如网络厂商可以配置该位置参考设备的位置、发送能力、接收能力以及处理能力等中的一项或多项。位置参考设备可以向接入网设备提供其位置信息。示例性地，第三网元可以为参考UE，或者自动导航小车(automated guided vehicle,AGV)。在另一个示例中，第三网元也可以为普通UE。这里，普通UE是相对于位置参考设备而言的。普通UE可以通过一些定位方法获得自身的位置信息之后，将该位置信息提供该接入网设备。

704、接入网设备测量来自于第三网元的探测参考信号，获得一个或多个测量结果。

以5G系统为例，第三网元发送的探测参考信号可以为SRS(sounding reference signal)。

在步骤704中，接入网设备测量第三网元发送的探测参考信号，获得一个或多个测量结果，该一个或多个测量结果与第三网元的位置信息具有对应关系。在一个示例中，第三网元在位置1发送探测参考信号，接入网设备通过测量探测参考信号获得测量结果1，测量结果1对应位置1。第三网元在位置2发送探测参考信号，接入网设备通过测量探测参考信号获得测量结果2，测量结果2对应位置2。可选地，在另一个实例中，第三网元的绝对位置没有发生变化，但是第三网元的周围环境在不同的时间发生变化，接入网设备测量第三网元在不同的时间发送的探测参考信号，获得的测量结果也可能发生了变化。例如，接入网设备在时间1获得的测量结果1对应第三网元的位置1，在时间2获得的测量结果2对应第三网元的位置1。可选地，在再一个示例中，该实施例中的第三网元可以是多个。接入网设备分别测量来自于多个第三网元的探测参考信号，获得多个测量结果。也即，该多个测量结果中的每个测量结果对应该多个第三网元中的一个第三网元的位置。相应地，在步骤705中，该多个第三网元分别向接入网设备或定位设备提供各自的位置信息。

705、第三网元提供自身的位置信息。

在该实施例中，以一个第三网元作为示例进行说明。一个位置信息对应一个或多个接入网设备对该第三网元在该位置信息所对应的位置所发送的一个或多个探测参考信号测量获得的一个或多个测量结果。在上行定位场景中，AI模型的候选训练数据为该一个或多个测量结果以及该一个或多个测量结果对应的第三网元的位置信息。在一个或多个接入网设备判定所收集的候选训练数据(即该一个或多个测量结果)有效的情况下，该一个或多个接入网设备将有效的候选训练数据分别提供给定位设备。

可选的，该有效的候选训练数据对应的第三网元的位置信息可以由第三网元通过该一个或多个接入网设备中的至少一个提供给定位设备，如步骤705a所示。应理解，705a为步骤705的一种实现方式。其中，该第三网元的位置信息可以对该至少一个接入网设备可见，或者，不可见。

可选地，在一种实现中，第三网元直接向定位设备提供子帧的位置信息(未图示)。定位设备获取到来自于一个或多个接入网设备的有效的候选训练数据，以及与该有效的候选训练数据对应的位置信息。应理解，有效的候选训练数据为多个，第三网元的位置信息也为多个。定位设备确定有效的候选训练数据和位置信息之间的对应关系。定位设备将位置信息作为AI模型的标签，对AI模型进行训练或更新，也即新建过程的训练或更新过程的训练。应理解，在该实施例中，定位设备获得的AI模型的有效的候选训练数据(也即，第一训练数据)包括：接入网设备测量第三网元发送的探测参考信号获得的测量结果中符合约束条件的一个或多个测量结果，以及和每个测量测量结果对应的第三网元的位置信息。其中，第三网元的位置信息为AI模型的输出真值，即标签。

706、接入网设备根据第一信息对所收集的候选训练数据进行有效性的判定。

需要说明的是，在步骤706中，接入网设备具体是对候选训练数据中的测量结果进行有效性的判定。

示例性地，在应用场景2中，测量结果的质量指标可以包括但不限于为首径功率、首径到达时延、定时误差组(timing error group,TEG)、时域采样点的平均功率、天线端口之间的相位差、全带或子带的等效SINR、全带或子带的干扰水平信息、视距(line of light,LOS)概率、站间同步误差指示信息、测量结果置信度指示信息中的一项或多项。此外，在定位的应用场景下，标签的质量指标可以为不同样本的位置之间的距离。

示例性地，约束条件中的质量指标可以为SINR和训练数据的数量。作为一个示例，所述训练数据的数量的门限为N，N可以为batch的整数倍或AI模型收敛所需训练数据的最少数量。可选地，在上行定位场景下，接入网设备收集的AI模型的候选训练数据还包括标签，该标签为位置信息，示例性地，约束条件中的质量指标还可以包括标签的质量指标，例如，标签的质量指标可以为不同样本的位置之间距离等，对此不作限定。

关于有效性判定可以参考步骤504的说明，这里不再赘述。

707、接入网设备根据候选训练数据的有效性的判定结果，向定位设备发送第二信息，其中，第二信息指示有效性的判定结果。

示例性地，第二信息可以包含在接入网设备和定位设备之间的接口消息中。或者说，接入网设备向定位设备发送接口消息，接口消息中包含第二信息。

708、定位设备根据第二信息确定接入网设备收集的候选训练数据是否有效。

在一种可能的情况下，第二信息指示接入网设备收集的候选训练数据有效，在此情况下，定位设备获取接入网设备收集的有效的候选训练数据(即，第一训练数据)。这里，第一训练数据具体包括符合约束条件的一个或多个测量结果以及该一个或多个测量结果各自对应的第三网元的位置信息。进一步地，定位设备根据有效的候选训练数据进行AI模型的训练或更新，如步骤709。

709、定位设备进行AI模型的训练，以获得该AI模型或对该AI模型进行更新。

在另一种可能的情况下，第二信息指示接入网设备所收集的候选训练数据无效。在此情况下的一种可能的实现中，定位设备保持原有的AI模型，或者切换到非AI模型，如步骤710。

710、定位设备基于原有的AI模型或切换到非AI模型进行上行定位。

可选地，在另一种可能的情况下，第二信息指示接入网设备所收集的候选训练数据无效。在另一种可能的实现中，定位设备确定重新收集AI模型的训练数据，在此情况下，还包括步骤711以及712。

711、定位设备确定重新收集训练数据。

712、定位设备向接入网设备发送第三信息，第三信息指示接入网设备重新收集AI模型的训练数据。

可选地，第三信息还指示有效性判定的最大次数k，k为正整数。可选地，有效性判定的最大次数k也可以由第一信息指示，可以参考图3所示流程中的相关说明，不再赘述。

在该应用场景下，作为一个示例，有效性判定的最大次数k可以由定位设备根据AI模型的训练数据需求的紧迫性来配置，这与应用场景1中是类似的。作为一个示例，紧迫性的判断准则可以是根据当前AI模型对第三网元的位置的估计结果误差或者AI模型的上次更新时间至今的时间间隔确定的。例如，若定位设备根据当前的AI模型对第三网元的位置的估计结果误差较大，例如，大于或等于某个设定的阈值，则可以判定为紧迫。此情况下，有效性判定的最大次数k可以设置的大一些；反之，如果基于当前的AI模型对第三网元的位置的估计结果误差较小，例如小于该设定的阈值，则可以判定为不紧迫。此情况下，有效性判定的最大次数k可以设置的小一些。其中，AI模型的估计结果误差的判断是通过将上一次AI模型训练所收集到的训练数据拆分为训练集和验证集实现的。由于训练集的误差已经很低，因此将验证集的估计结果误差作为AI模型是否严重失效的判断准则。此外，也可以根据AI模型的上次更新时间至今的时间间隔设定，可以参考应用场景1中的解释说明，不予赘述。

可选地，定位设备在确定重新收集AI模型的训练数据的情况下，可以指示接入网设备更新接入网设备收集训练数据时的空口传输配置，如步骤713。

713、接入网设备向第三网元发送空口传输配置信息(如空口传输配置信息#2)，空口传输配置信息指示更新的空口传输配置。

应理解，步骤713中空口传输配置的更新，是相对于步骤703中的空口传输配置而言的更新。示例性地，该更新包括但不限于：增大探测参考信号的发送功率、增大探测参考信号的频域密度等。应理解，更新空口传输配置的目的在于，接入网设备尝试收集到符合约束条件的候选训练数据，并提供给定位设备。

714、接入网设备重新收集AI模型的训练数据。

可见，将本申请提供的AI模型训练中获取训练数据的方法应用于基于AI模型的上行定位的场景下，可以减少AI模型训练流程中空口资源的浪费。此外，也避免了接入网设备将无效的训练数据发送给定位设备，对AI模型的训练数据集造成污染，从而影响AI模型的训练或更新，导致增益评估不准。

应理解，在上行定位场景中，接入网设备为训练数据的收集网元的一个示例，定位设备为AI模型的训练网元的一个示例。

2、在下行定位中的应用。

参见图8，图8为本申请提供的技术方案在基于AI模型的下行定位场景的示意图。如图8，在下行定位中，AI模型推理部署在UE侧，但AI模型的训练部署在网络侧的定位设备，例如LMF网元。定位设备上部署的AI模型以UE测量参考信号得到的对应的信道响应为输入，UE的位置为输出。以5G系统为例，该参考信号可以为定位参考信号，可以由一个或多个基站(base station,BS)发送给UE。

参见图9，图9为本申请提供的基于AI模型的上行定位中获取训练数据的示例。

801、可选地，定位设备确定需要收集AI模型的训练数据。

该AI模型的训练数据可以来自一个UE对多个参考信号的测量，或，多个UE中每个UE分别对一个或多个参考信号的测量。其中，该多个参考信号可以来自一个或多个接入网设备。本实施例从定位设备和该一个UE或多个UE中的某一个UE之间的通信的视角进行描述。

802、定位设备向UE发送第一信息，第一信息用于UE收集的候选训练数据的有效性的判定。可选地，有效性的判定结果可以为有效或无效。

可选地，作为一个示例，定位设备通过接入网设备向UE发送第一信息，如图9中所示的步骤802a和步骤802b。作为另一个示例，定位设备也可以通过和UE之间的接口，直接向UE发送第一信息。定位设备向接入网设备发送信息#1，信息#1指示接入网设备向UE发送定位参考信号。可选地，信息#1也可以为第一信息。接入网设备基于信息#1的触发，向UE发送定位参考信号。图9中所示实现仅作为示例。

803、接入网设备向UE发送定位参考信号。

UE测量来自于接入网设备，或者，UE测量该接入网设备以及其他接入网设备，的定位参考信号，获得候选训练数据，具体为定位参考信号的一个或多个测量结果，以及该一个或多个测量结果对应的UE的位置信息。

应理解，接入网设备向UE发送PRS之前，还向UE发送PRS的空口传输配置信息，以指示PRS的空口传输配置。

以5G系统为例，接入网设备向UE发送的定位参考信号可以为PRS。候选训练数据为UE测量PRS获得的一个或多个测量结果以及该一个或多个测量结果对应的UE的位置信息。

804、UE根据第一信息判定所收集的候选训练数据的有效性。

示例性地，UE根据第一信息指示的约束条件，判定所收集的候选训练数据的有效性，这里具体是判定所述该一个或多个测量结果的有效性。与步骤504类似，可以参考步骤504理解，这里省略详细说明。另外，关于下行定位场景下，约束条件包含的质量指标的示例可以参考上行定位场景下的说明，这里不再赘述。

805、UE向定位设备发送第二信息，第二信息指示有效性的判定结果。

在一种可能的情况下，第二信息指示UE所收集的候选训练数据有效。在一个示例中，第二信息可以为UE所收集的候选训练数据中的第一训练数据。其中，第一训练数据包括UE的位置信息。或者说，第一训练数据具体为符合约束条件的测量结果及其对应的UE的位置信息。在另一种可能的情况下，第二信息指示UE所收集的候选训练数据无效。

可选地，步骤805中，UE可以通过UE和定位设备之间的接口，直接向定位设备发送第二信息，如图9中所示。或者，UE也可以向接入网设备发送第二信息，再由接入网设备将第二信息发送给定位设备。或者，在UE所收集的候选训练数据有效的情况下，UE向接入网设备发送第二信息包含的部分信息，例如第一训练数据所包含的符合约束条件的测量结果(也即有效的测量结果)，并向定位设备发送自身的位置信息。接入网设备再将符合约束条件的测量结果发送给定位设备。由此定位设备获取到第一训练数据，其中，第一训练数据包括有效的测量结果及其对应的UE的位置信息，不作限定。

806、定位设备根据第二信息确定UE收集的候选训练数据的收集是否有效。

在一种可能的情况下，第二信息指示UE所收集的候选训练数据有效，在此情况下，第二信息可以包含第一训练数据，其中，第一训练数据包括UE的位置信息。进一步地，定位设备根据第一训练数据进行AI模型的训练或更新，如步骤807。

807、定位设备进行AI模型的训练，以获得该AI模型或对该AI模型进行更新。

在另一种可能的情况下，若第二信息指示UE所收集的候选训练数据无效。在此情况下的一种可能的实现中，接入网设备保持原有的AI模型的波束管理或者切换到非AI模型进行下行定位，如步骤808。

808、定位设备保持原有AI模型或切换到非AI模型进行定位。

可选地，在另一种可能的情况下，第二信息指示UE所收集的候选训练数据无效。在一种可能的实现中，定位设备确定重新收集训练数据，如步骤809。

809、定位设备确定重新收集训练数据。

810、定位设备向UE发送第三信息，第三信息指示UE重新收集AI模型的训练数据。

可选地，第三信息指示还可以指示有效性判定的最大次数k。或者第一信息指示有效性判定的最大次数k。

可选地，在重新收集AI模型的训练数据的情况下，定位设备可以指示接入网设备更新空口传输配置。例如，定位设备向接入网设备发送信息#2，信息#2用于指示接入网设备重新收集训练数据。相应地，接入网设备向UE发送更新后的空口传输配置对应的空口传输配置信息，如步骤811。

811、接入网设备向UE发送空口传输配置信息，该空口传输配置信息指示更新后的空口传输配置。

UE基于更新后的空口传输配置，测量接入网设备发送的定位参考信号，以重新收集AI模型的训练数据。

812、UE重新收集AI模型的训练数据。

可选地，该实施例中的UE可以为位置参考设备，也可以普通UE，不作限定。位置参考设备或普通UE可以参考步骤703中的说明，不再赘述。

此外，应理解，该实施例中的UE为训练数据的收集网元的一个示例，定位设备为AI模型的训练网元的一个示例。

可见，将本申请提供的AI模型训练中获取训练数据的方法应用于基于AI模型的下行定位的场景下，可以减少AI模型训练流程中空口资源的浪费。此外，也避免了终端设备(如位置参考设备)将无效的训练数据发送给定位设备，对AI模型的训练数据集造成污染，从而影响AI模型的训练或更新，导致增益评估不准。

应用场景3

基于AI模型的波束管理。

示例性地，应用场景3中的AI模型的训练部署在接入网设备侧。接入网设备需要获取UE侧通过测量参考信号获得的训练数据(例如，参考信号的一个或多个测量结果)，并将从UE侧获取的训练数据用于AI模型的训练或更新。在该应用场景下，AI模型的标签为最优的K个测量结果对应的参考信号的信息。可替换地，应用场景3中，最优的K个测量结果对应的参考信号的信息，也可以替换为该最优的K个测量结果对应K个波束的信息，示例性地，为K个波束ID。

可知，5G系统引入6GHz以上的高频段用于数据通信，相对于6GHz以下的中低频段，高频段频谱的连续可用带宽较大，中心频率较高，因而可以获得更大的传输速率和系统容量。但是由于高频信号(例如毫米波)穿透能力弱、路径衰落效应强，导致高频信号的传播距离受限，覆盖能力堪忧。得益于大规模天线技术，高频通信系统通常采用数量众多的天线做波束赋型，从而可以获取可观的波束增益来补偿高频传播特性导致的传播距离受限。但是，设计精准的波束赋型时，基站需要从终端获取准确的信道信息，获取如此大规模的天线阵列上的信道信息需要消耗庞大的空口开销，在实际系统中不可接受。人们在实验中发现，高频无线信道具有明显的稀疏性，即信道的主要能量集中在有限个数的径上，例如，信号的发射端和接收端之间存在无遮挡直射视距(line of sight,LoS)路径时，接收端和发射端之间的主要能量集中在直射视距路径上。当发射端和接收端之间存在非视距(non-line of sight,NLOS)的遮挡时，其主要能量多集中在反射一次即可到达的路径上。通常每条径有着不同的入射和出射角度，故高频通信系统的发射端和接收端只需将自己的波束方向对准信道主要径的入射角度和出射角度，即可获取大部分的信道传输能量完成通信。

对于一个高频通信系统，假设发射端总共有S根天线，接收端有R根天线，其形态可以包括线天线或者面阵天线。收发两端在自己的天线上乘以不同的预编码权值，对发送信号进行预编码，就可使得发出的信号具有波束赋型的效果。例如，对于下行信号传输模型：
Y＝VHWX+N

接收端的接收预编码矩阵为V，信道响应为H。发射端的发射预编码矩阵为W，发射信号为X，噪声为N。接收端接收到的信号为Y。发射端发射预编码矩阵的形式为W＝[W₁,W₂,…W_M]，其中，W_i为发射端第i根天线上的预编码权值。类似地，接收端的接收预编码矩阵的形式为V＝[V₁,V₂,…V_R]，其中，V_i为接收端第i根天线上的预编码权值。发射信号X经过W的预编码后得到的信号为WX,WX是发射端最终的发射信号。WX在空间中具有波束赋形的效果。根据X上所承载信息的差异性，可将WX分为参考信号和数据信号。波束管理过程中发送的一般为参考信号，可能的参考信号的种类包括SSB、CSI-RS、SRS、相位跟踪参考信号(phase-tracking reference signal,PTRS)、解调参考信号(demodulation reference signal,DMRS)等。

由于信道主径的角度可以分布在一个很宽的范围内，如0～360度，而每个预编码矩阵W在空间中只能覆盖一定的角度范围，对应一个赋型波束，故需要设计多个预编码矩阵W才能保证较好的信号覆盖效果。多个指向角度不同的预编码矩阵W构成一个码本。发射端和接收端都会维护一套自己的码本。在波束管理过程中，发射端和接收端通过遍历扫描自己的码本实现收发双端的角度对准。例如，发射端的码本中有64个预编码矩阵，分别对应64个赋型波束。接收端码本有4个预编码矩阵，分别对应4个赋型波束，则总共需要扫描256(64*4)次才能确定一对最优的收、发端赋型波束，扫描开销和时延非常大。

在一种基于AI模型的波束管理技术中，可以实现稀疏的波束扫描，大幅降低波束扫描的开销和时延。对于一个高频通信系统，假设发射端总共有S根天线，接收端有R根天线，发射端的码本中有S个预编码矩阵(S个赋型波束)，接收端的码本中有R个预编码矩阵(R个赋型波束)。对于每个接收赋型波束来说，任何一个发射赋型波束都可能是与之构成一个收发波束对，故确定最优收发波束对的过程可以拆解成对于某个接收波束，进行发射端波束扫描确定匹配的最优发射波束，然后将此过程对剩下R-1个接收波束分别重复一遍即可确定全局最优的收发波束对。同样的，对于每个发射波束来说，任何一个接收波束都可能是与之构成一个收发波束对，故确定最优收发波束对的过程可以拆解成对于某个发射波束，进行接收端波束扫描确定匹配的最优发射波束，然后将此过程对剩下S-1个发射波束分别重复一遍即可确定全局最优的收发波束对。故下文以发射端波束扫描为例进行阐述。

参见图10，图10为基于AI辅助的稀疏波束扫描过程示意图。

假设发射端码本中的预编码矩阵对应第一值，如64，个赋型波束，传统方案需扫描全部的64个波束以确定最优波束，但AI辅助(也即，基于AI模型的)的稀疏波束扫描方案只需扫描码本中的部分波束，例如图10中填充标记的第二值，如16，个波束。从码本选择部分波束用于扫描可以有很多种选法，每一种被选出的波束组合称为一种稀疏波束图样。发射端用稀疏波束图样中的预编码矩阵进行预编码，发送参考信号。接收端将参考信号的测量结果输入用于AI波束预测的神经网络，神经网络输出K个波束的索引，也称为Top-K波束的索引。应注意，该K个波束是码本中所有64个赋型波束中的K个，而并非局限于稀疏波束图样包含的赋型波束中的K个。接收端将Top-K波束的索引反馈给发射端。可选的，当K＞1时，发射端仅扫描此K个赋型波束，发射经过波束赋型的参考信号，接收端采用能量检测的方法，测量此K个参考信号的能量并选择能量最强的作为最优波束。

下面介绍本申请提供的AI模型训练中获取训练数据的方法在基于稀疏波束扫描技术中的波束管理中的应用。在该应用中，发射端为接入网设备，例如基站。接收端为UE。UE测量来自于接入网设备的参考信号，获得多个测量结果，并确定出TOP-K波束索引，并将该多个测量结果和TOP-K波束索引反馈给接入网设备。

参见图11，图11为本申请提供的基于AI模型的波束管理中获取训练数据的示例。

901、可选地，接入网设备确定需要收集AI模型的训练数据。

902、接入网设备向UE发送第一信息，第一信息用于UE收集的候选训练数据的有效性的判定。可选地，有效性的判定结果可以为有效或无效。

903、接入网设备向UE发送多个参考信号。

UE测量来自于接入网设备的多个参考信号，获得多个测量结果，即候选训练数据。可选的，该多个参考信号对应前述第一值，如64，个赋型波束。

可选地，在应用场景3中，参考信号可以为CSI-RS和/或SSB。在该示例中，CSI-RS和/或SSB用于UE进行信道测量。

904、UE根据第一信息判定所收集的候选训练数据的有效性。

905、UE向接入网设备发送第二信息，第二信息指示有效性的判定结果。

在一种可能的情况下，第二信息指示UE所收集的候选训练数据有效。在一个示例中，第二信息可以为第一训练数据，其中，第一训练数据包括所述一个或多个测量结果中的K个最优的测量结果对应的参考信号的信息，K为大于或等于1的整数。示例性地，该K个最优的测量结果对应的参考信号的信息，可以理解为图10中的TOP-K波束的索引。另一个示例中，第二信息可以为第一训练数据，其中，第一训练数据包括所述多个测量结果中的L个测量结果，以及该L个测量结果对应的L个参考信号的信息。其中，该L个测量结果为有效的测量结果，也即符合约束条件的测量结果。在另一种可能的情况下，第二信息指示UE所收集的候选训练数据无效。

在该应用场景中，参考信号也可以替换为“波束”，不作限定。

906、接入网设备根据第二信息确定UE收集的候选训练数据是否有效。

在一种可能的情况下，第二信息指示UE所收集的候选训练数据有效，在此情况下，接入网设备从UE获取第一训练数据。进一步地，接入网设备根据第一训练数据进行AI模型的训练或更新，如步骤907。

907、接入网设备根据第一训练数据进行AI模型的训练，以获得该AI模型或对该AI模型进行更新。

在另一种可能的情况下，第二信息指示UE所收集的候选训练数据无效。在此情况下的一种可能的实现中，接入网设备保持原有的AI模型的波束管理或者切换到非AI模型进行波束管理，如步骤908。

908、接入网设备保持原有的AI模型不变，或者切换到非AI模型进行波束管理。

可选地，在另一种可能的情况下，第二信息指示UE所收集的候选训练数据无效。在一种可能的实现中，接入网设备确定重新收集训练数据，如步骤909。

909、接入网设备确定重新收集训练数据。

910、接入网设备向UE发送第三信息，第三信息指示UE重新收集AI模型的训练数据。

可选地，第三信息还指示有效性判定的最大次数k。或者，有效性判定的最大次数k也可以由第一信息指示，不作限定。

911、接入网设备向UE发送空口传输配置信息，该空口传输配置信息指示更新后的空口传输配置。

912、UE重新收集AI模型的训练数据。

与上述两个应用场景类似，在重新收集候选训练数据的过程中，UE受到有效性判定的最大次数k的限定。可选地，有效性判定的最大次数k可以是接入网设备根据训练数据收集的紧迫性确定的，示例性地，紧迫性的判断准则可以是指AI模型的上一次更新至今的时间，或者是接入网设备根据当前的AI模型对最优测量结果(或者说，最优波束)的估计结果误差设定的。其中，AI模型的估计结果误差的判断是通过将上一次AI模型训练所收集到的训练数据拆分为训练集和验证集实现的。由于训练集的误差已经很低，因此将验证集的估计结果误差作为AI模型是否失效严重的判断准则。例如，若接入网设备根据当前的AI模型对UE接收参考信号时的最优测量结果对应的参考信号的信息的预测结果误差较大，例如，大于或等于某个设定的阈值，则可以判定为紧迫。此情况下，有效性判定的最大次数k可以设置的大一些；反之，如果基于当前的AI模型对UE接收参考信号时的最优测量结果对应的参考信号的信息的预测结果误差较小，例如小于该设定的阈值，则可以判定为不紧迫。此情况下，有效性判定的最大次数k可以设置的小一些。此外，也可以根据AI模型的上次更新时间至今的时间间隔设定，可以参考应用场景1中的解释说明，不予赘述。

可见，将本申请提供的AI模型训练中用于获取训练数据的方法应用于基于AI模型的波束管理的场景下，可以减少AI模型训练流程中空口资源的浪费。此外，也避免了UE将无效的训练数据发送给接入网设备，而对AI模型的训练数据集造成污染。

以上图3至图11中涉及到方法流程的示意图中，各步骤的编号仅仅是为了清楚地描述本申请的技术方案，不应该对方法的具体实现构成限定。这些步骤可以扩展为更多的步骤，或者也可以合并为更少的步骤，取决于不同的具体实现，不作限定。此外，图3至图11中的虚线所示的步骤表示为可选步骤。

以上对本申请提供的AI模型训练中获取训练数据的方法进行了详细说明。基于相同的技术构思，参见图12，本申请提供了一种通信装置1000。

如图12，通信装置1000包括处理模块1001和通信模块1002。该通信装置1000可以是终端设备，也可以是应用于终端设备或者和终端设备匹配使用，能够实现终端设备侧执行的通信方法的通信装置，例如，芯片或电路；或者，该通信装置1000可以是网络设备，也可以是应用于网络设备侧或者和网络设备侧匹配使用，能够实现网络设备侧执行的通信方法的通信装置，例如芯片或电路。示例性地，该网络设备侧例如可以为本申请方法实施例中的接入网设备或定位设备。

其中，通信模块也可以称为收发模块、收发器、收发机、或收发装置等。处理模块也可以称为处理器，处理单板，处理单元、或处理装置等。可选的，通信模块用于执行上述方法中终端设备侧或网络设备侧的发送操作和接收操作，可以将通信模块中用于实现接收功能的器件视为接收单元，将通信模块中用于实现发送功能的器件视为发送单元，即通信模块包括接收单元和发送单元。

该通信装置1000应用于终端设备时，处理模块1001可用于实现图3～图11所述各实施例中所述终端设备的处理功能，通信模块1002可用于实现图3～图11所述各实施例中所述终端设备的收发功能。或者也可以参照发明内容中第三方面以及第三方面中可能的设计理解该通信装置。

该通信装置1000应用于网络设备时，处理模块1001可用于实现图3～图11所述各实施例中网络设备(例如，接入网设备或定位设备)的处理功能，通信模块1002可用于实现图3～图11所述各实施例中网络设备的收发功能。或者也可以参照发明内容中第四方面以及第四方面中可能的设计理解该通信装置。

需要说明的是，图3中所示的第一网元或第二网元具体为终端设备或网络设备(例如接入网设备或定位设备)已经在前述方法实施例中，针对各种不同的应用场景作了详细说明，可以参考具体的实施例来理解第一网元为终端设备或网络设备，这里不再赘述。

此外需要说明的是，前述通信模块和/或处理模块可通过虚拟模块实现，例如处理模块可通过软件功能单元或虚拟装置实现，通信模块可以通过软件功能或虚拟装置实现。或者，处理模块或通信模块也可以通过实体装置实现，例如若该装置采用芯片/芯片电路实现，所述通信模块可以是输入输出电路和/或通信接口，执行输入操作(对应前述接收操作)、输出操作(对应前述发送操作)；处理模块为集成的处理器或者微处理器或者集成电路。

本申请中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，另外，在本申请各个示例中的各功能模块可以集成在一个处理器中，也可以是单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

基于相同的技术构思，参见图13，本申请还提供了一种通信装置1100。可选地，该通信装置1100可以是芯片或者芯片系统。可选的，在本申请中芯片系统可以由芯片构成，也可以包含芯片和其他分立器件。

通信装置1100可用于实现前述示例描述的通信系统中任一网元的功能。通信装置1100可以包括至少一个处理器1110。可选的，该处理器1110与存储器耦合，存储器可以位于该装置之内，或，存储器可以和处理器集成在一起，或，存储器也可以位于该装置之外。例如，通信装置1100还可以包括至少一个存储器1120。存储器1120保存实施上述任一示例中必要计算机程序、计算机程序或指令和/或数据；处理器1110可能执行存储器1120中存储的计算机程序，完成上述任一示例中的方法。

通信装置1100中还可以包括通信接口1130，通信装置1100可以通过通信接口1130和其它设备进行信息交互。示例性的，所述通信接口1130可以是收发器、电路、总线、模块、管脚或其它类型的通信接口。当该通信装置1100为芯片类的装置或者电路时，该装置1100中的通信接口1130也可以是输入输出电路，可以输入信息(或称，接收信息)和输出信息(或称，发送信息)，处理器为集成的处理器或者微处理器或者集成电路或则逻辑电路，处理器可以根据输入信息确定输出信息。

本申请中的耦合是装置、单元或模块之间的间接耦合或通信连接，可以是电性，机械或其它的形式，用于装置、单元或模块之间的信息交互。处理器1110可能和存储器1120、通信接口1130协同操作。本申请中不限定上述处理器1110、存储器1120以及通信接口1130之间的具体连接介质。

可选的，如图13中所示，所述处理器1110、所述存储器1120以及所述通信接口1130之间通过总线1140相互连接。所述总线1140可以是外设部件互连标准(peripheral component interconnect,PCI)总线或扩展工业标准结构(extended industry standard architecture,EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图13中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

在本申请中，处理器可以是通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，可以实现或者执行本申请中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

在本申请中，存储器可以是非易失性存储器，比如硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)等，还可以是易失性存储器(volatile memory)，例如随机存取存储器(random-access memory,RAM)。存储器是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。本申请中的存储器还可以是电路或者其它任意能够实现存储功能的装置，用于存储程序指令和/或数据。

在一种可能的实施方式中，该通信装置1100可以应用于网络设备侧，例如本申请实施例中的接入网设备或定位设备。具体地，通信装置1100可以是网络设备，也可以是能够支持网络设备实现上述涉及的任一示例中网络设备侧相应的功能的装置。存储器1120保存实现上述任一示例中的网络设备侧的功能的计算机程序(或指令)和/或数据。处理器1110可执行存储器1120存储的计算机程序，完成上述任一示例中网络设备侧执行的方法。应用于接入网设备时，该通信装置1100中的通信接口可用于与终端设备进行交互，向终端设备发送信息或者接收来自终端设备的信息；此外，可选地，该通信装置1000中的通信接口还可用于与核心网设备进行交互，例如与定位设备(例如LMF网元)进行交互，向定位设备发送信息或接收来自于定位设备的信息。

在另一种可能的实施方式中，该通信装置1100可以应用于终端设备，具体地，通信装置1100可以是终端设备，也可以是能够支持终端设备，实现上述涉及的任一示例中终端设备的功能的装置。存储器1120保存实现上述任一示例中的终端设备的功能的计算机程序(或指令)和/或数据。处理器1110可执行存储器1120存储的计算机程序，完成上述任一示例中终端设备执行的方法。应用于终端设备，该通信装置1100中的通信接口可用于与网络设备侧(例如，接入网设备)进行交互，向网络设备侧发送信息或者接收来自接入网设备的信息。

由于本示例提供的通信装置1100可应用于网络设备侧(例如接入网设备或定位设备)，完成上述网络设备侧执行的方法，或者应用于终端设备，完成终端设备执行的方法。因此其所能获得的技术效果可参考上述方法实施例中的说明，在此不再赘述。

基于以上示例，本申请提供了一种通信系统，包括网络设备和终端设备。在一个示例中，该通信系统包括接入网设备和终端设备。在另一个示例中，该通信系统包括定位设备、接入网设备和终端设备。其中，所述接入网设备和终端设备，或者所述定位设备、所述接入网设备和终端设备，可以实现图3～图11所示的示例中所提供的通信方法。

本申请提供的技术方案可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、终端设备、接入网设备或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机可以存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，数字视频光盘(digital video disc，DVD))、或者半导体介质等。

在本申请中，在无逻辑矛盾的前提下，各示例之间可以相互引用，例如方法实施例之间的方法和/或术语可以相互引用，例如装置实施例之间的功能和/或术语可以相互引用，例如装置示例和方法示例之间的功能和/或术语可以相互引用。

在本说明书中使用的术语“部件”、“模块”、“系统”等用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。例如，部件可以是但不限于，在处理器上运行的进程、处理器、对象、可执行文件、执行线程、程序和/或计算机。通过图示，在计算设备上运行的应用和计算设备都可以是部件。一个或多个部件可驻留在进程和/或执行线程中，部件可位于一个计算机上和/或分布在2个或更多个计算机之间。此外，这些部件可从在上面存储有各种数据结构的各种计算机可读介质执行。部件可例如根据具有一个或多个数据分组(例如来自与本地系统、分布式系统和/或网络间的另一部件交互的二个部件的数据，例如通过信号与其它系统交互的互联网)的信号通过本地和/或远程进程来通信。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种人工智能AI模型训练中用于获取训练数据的方法，其特征在于，所述方法由第一网元或用于第一网元的芯片执行，所述方法包括：

接收来自于第二网元的第一信息，所述第一信息用于收集的候选训练数据的有效性的判定，所述有效性的判定结果包括有效或无效；

收集所述AI模型的候选训练数据；

根据所述候选训练数据和所述第一信息，向第二网元发送第二信息，所述第二信息指示所述有效性的判定结果。
根据权利要求1所述的方法，其特征在于，所述第二信息包括第一训练数据且所述第二信息指示所述收集的所述候选训练数据有效，所述第一训练数据为所述候选训练数据中的有效数据。
根据权利要求1所述的方法，其特征在于，所述第二信息指示所述收集的所述候选训练数据无效。
根据权利要求1至3中任一项所述的方法，其特征在于，所述第一信息用于所述收集的所述候选训练数据的有效性的判定的约束条件的确定。
根据权利要求4所述的方法，其特征在于，所述方法还包括：

若确定所述候选训练数据中包含满足所述约束条件的第一训练数据，确定所述候选训练数据有效；或者，

若确定所述候选训练数据中不包含满足所述约束条件的第一训练数据，确定所述候选训练数据无效。
根据权利要求3至5中任一项所述的方法，其特征在于，在所述收集的所述候选训练数据无效的情况下，所述方法还包括：

接收来自于所述第二网元的第三信息，所述第三信息指示重新收集所述AI模型的候选训练数据。
根据权利要求6所述的方法，其特征在于，所述方法还包括：

确定空口传输配置信息，所述空口传输配置信息对应更新的空口传输配置，所述空口传输配置信息指示基于所述更新的空口传输配置收集所述AI模型的候选训练数据；

其中，所述更新的空口传输配置信息包括如下一项或多项的更新：

参考信号的发送功率；

参考信号使用的天线端口数；

参考信号的频带宽度；

参考信号的频域密度；或，

参考信号的周期。
根据权利要求6或7所述的方法，其特征在于，所述第三信息还指示所述有效性的判定的最大次数k，k为正整数。
根据权利要求6或7所述的方法，其特征在于，所述第一信息还指示所述有效性的判定的最大次数k，k为正整数。
根据权利要求8或9所述的方法，其特征在于，所述方法还包括：

基于所述更新的空口传输配置，收集所述AI模型的候选训练数据；

若达到所述有效性的判定的最大次数k，且根据所述第一信息确定第k次有效性的判定结果为无效，停止收集所述AI模型的候选训练数据。
根据权利要求10所述的方法，其特征在于，所述方法还包括：

在超过所述有效性的最大判定次数k之前，若根据所述第一信息确定第j次有效性的判定结果为有效，向所述第二网元发送第四信息，所述第四信息包括第二训练数据，且所述第四信息指示所述第j次有效性的判定结果为有效，所述第二训练数据包括所述第j次有效性的判定所针对的候选训练数据中的有效数据，j小于或等于k，j为正整数。
根据权利要求1至11中任一项所述的方法，其特征在于，所述收集所述AI模型的候选训练数据，包括：

测量来自于所述第二网元的参考信号，获得一个或多个测量结果，所述AI模型的候选训练数据包括所述一个或多个测量结果；或者，

测量来自于第三网元的参考信号，获得一个或多个测量结果，所述AI模型的候选训练数据包括所述一个或多个测量结果。
根据权利要求12所述的方法，其特征在于，所述第一网元为终端设备或用于所述终端设备的芯片，所述第二网元为接入网设备或用于所述接入网设备的芯片；

所述第一网元测量来自于所述第二网元的参考信号，获得所述一个或多个测量结果。
根据权利要求13所述的方法，其特征在于，所述第一训练数据还包括所述一个或多个测量结果中的K个最优的测量结果对应的参考信号的信息或波束信息，K为大于或等于1的整数。
根据权利要求12所述的方法，其特征在于，所述第一网元为接入网设备或用于所述接入网设备的芯片，所述第二网元为定位设备或用于所述定位设备的芯片；

所述第一网元测量来自于所述第三网元的探测参考信号，获得所述一个或多个测量结果；

以及，所述第一训练数据还包括所述第三网元的一个或多个位置信息。
根据权利要求12所述的方法，其特征在于，所述第一网元为终端设备或用于所述终端设备的芯片，所述第二网元为定位设备或用于所述定位设备的芯片；

所述第一网元测量来自于第三网元的定位参考信号，获得所述一个或多个测量结果，所述第三网元为接入网设备；

以及，所述第一训练数据还包括所述第一网元的一个或多个位置信息。
根据权利要求4至16中任一项所述的方法，其特征在于，所述约束条件包括如下一项或多项：

质量指标的门限和所述质量指标的判定准则；或，

符合质量指标的判定准则的训练数据的数量门限和所述训练数据的数量的判定准则；或，

单次有效性判定对应的训练数据收集的最大时长指示信息。
根据权利要求4至17中任一项所述的方法，所述第一信息指示如下一项或多项：

质量指标的门限；

质量指标的判定准则；

符合质量指标的判定准则的训练数据的数量门限；

符合质量指标的判定准则的训练数据的数量的判定准则；或

单次有效性判定对应的候选训练数据收集的最大时长。
根据权利要求4至18中任一项所述的方法，所述约束条件基于所述AI模型的应用场景，所述AI模型的应用场景包括如下一项或多项：

基于所述AI模型的CSI反馈或CSI预测、基于所述AI模型的定位，或，基于所述AI模型的波束管理。
一种AI模型训练中用于获取训练数据的方法，其特征在于，所述方法由第二网元或用于第二网元的芯片执行，所述方法包括：

向第一网元发送第一信息，所述第一信息用于所述第一网元收集的所述AI模型的候选训练数据的有效性的判定，所述有效性的判定结果包括有效或无效；

接收来自于所述第一网元的第二信息，所述第二信息指示所述有效性的判定结果。
根据权利要求20所述的方法，其特征在于，所述第二信息包括第一训练数据且所述第二信息指示所述第一网元收集的所述候选训练数据有效，所述第一训练数据为所述候选训练数据中的有效数据。
根据权利要求20所述的方法，其特征在于，所述第二信息指示所述第一网元收集的所述候选训练数据无效。
根据权利要求20至22中任一项所述的方法，其特征在于，所述第一信息用于所述第一网元收集的所述候选训练数据的有效性的判定的约束条件的确定。
根据权利要求23所述的方法，其特征在于，若所述候选训练数据中包含满足所述约束条件的第一训练数据，所述候选训练数据有效；或者，

若所述候选训练数据中不包含满足所述约束条件的第一训练数据，所述候选训练数据无效。
根据权利要求22至24中任一项所述的方法，其特征在于，在所述第二信息指示所述第一网元收集的所述候选训练数据无效的情况下，所述方法还包括：

向所述第一网元发送第三信息，所述第三信息指示所述第一网元重新收集所述AI模型的候选训练数据。
根据权利要求25所述的方法，其特征在于，所述方法还包括：

确定空口传输配置信息，所述空口传输配置信息对应更新的空口传输配置，所述空口传输配置信息指示所述第一网元基于所述更新的空口传输配置收集所述AI模型的候选训练数据；

其中，所述更新的空口传输配置信息包括如下一项或多项的更新：

参考信号的发送功率；

参考信号使用的天线端口数；

参考信号的频带宽度；

参考信号的频域密度；或，

参考信号的周期。
根据权利要求25或26所述的方法，其特征在于，所述第三信息还指示所述有效性的判定的最大次数k，k为正整数。
根据权利要求25或26所述的方法，其特征在于，所述第一信息还指示所述有效性的判定的最大次数k，k为正整数。
根据权利要求27或28所述的方法，其特征在于，所述方法还包括：

接收来自于所述第一网元的第四信息，所述第四信息包括第二训练数据，且所述第四信息指示所述第一网元的第j次有效性判定的判定结果为有效，所述第二训练数据为所述第j次有效性的判定所针对的候选训练数据中的有效数据，j小于或等于k，j为正整数。
根据权利要求20至29中任一项所述的方法，其特征在于，所述第二网元为接入网设备或用于所述接入网设备的芯片，所述第一网元为终端设备或用于所述终端设备的芯片，所述方法还包括：

向所述第一网元发送参考信号，所述参考信号用于所述第一网元获取对应于所述参考信号的一个或多个测量结果，所述AI模型的候选训练数据包括所述一个或多个测量结果。
根据权利要求30所述的方法，其特征在于，所述第一训练数据还包括所述一个或多个测量结果中的K个最优的测量结果对应的参考信号，K为大于或等于1的整数。
根据权利要求20至29中任一项所述的方法，其特征在于，所述第二网元为定位设备或用于所述定位设备的芯片，所述第一网元为接入网设备或用于所述接入网设备的芯片，所述AI模型的候选训练数据包括一个或多个测量结果和第三网元的位置信息，所述一个或多个测量结果是由所述第一网元测量所述第三网元发送的探测参考信号获得的。
根据权利要求20至29中任一项所述的方法，其特征在于，所述第二网元为定位设备或用于所述定位设备的芯片，所述第一网元为终端设备或用于所述终端设备的芯片，所述AI模型的候选训练数据包括一个或多个测量结果和所述第一网元的位置信息，所述一个或多个测量结果基于对所述第三网元发送的定位参考信号的测量，所述第三网元为接入网设备。
根据权利要求23-33中任一项所述的方法，其特征在于，所述约束条件包括如下一项或多项：

质量指标的门限和所述质量指标的判定准则；或，

符合质量指标的判定准则的训练数据的数量门限和所述训练数据的数量的判定准则；或，

单次有效性判定对应的候选训练数据收集的最大时长。
根据权利要求20至34中任一项所述的方法，其特征在于，所述第一信息指示如下一项或多项：

质量指标的门限；

质量指标的判定准则；

符合质量指标的判定准则的训练数据的数量门限；

符合质量指标的判定准则的训练数据的数量的判定准则；或

单次有效性判定对应的候选训练数据收集的最大时长。
根据权利要求23至35中任一项所述的方法，其特征在于，所述约束条件基于所述AI模型的应用场景，所述AI模型的应用场景包括如下一项或多项：

基于所述AI模型的CSI反馈或CSI预测、基于所述AI模型的定位，或，基于所述AI模型的波束管理。
一种通信装置，其特征在于，包括用于实现如权利要求1-19中任一项所述的方法的模块，或者用于实现如权利要求20-36中任一项所述的方法的模块。
一种通信装置，其特征在于，包括：

处理器，所述处理器和存储器耦合，所述处理器用于调用所述存储器存储的计算机程序指令，以执行如权利要求1-19任一项所述的方法，或者执行如权利要求20-36中任一项所述的方法。
一种通信装置，其特征在于，包括：处理器和通信接口，所述通信接口用于接收数据和/或信息，并将接收到的数据和/或信息传输至所述处理器；所述处理器处理所述数据和/或信息；以及，所述通信接口还用于输出经所述处理器处理之后的数据和/或信息，以使得所述通信装置执行如权利要求1-19中任一项所述的方法，或者，执行如权利要求20-36中任一项所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有指令，当所述指令在计算机上运行时，使得计算机执行如权利要求1-19任一项所述的方法，或者执行如权利要求20-36中任一项所述的方法。
一种计算机程序产品，其特征在于，所述计算机可读存储介质上存储有指令，当所述指令在计算机上运行时，使得计算机执行如权利要求1-19任一项所述的方法，或者执行如权利要求20-36中任一项所述的方法。
一种通信系统，其特征在于，包括如权利要求37-39中任一项所述的通信装置。