WO2023040700A1

WO2023040700A1 - 一种人工智能ai通信方法及装置

Info

Publication number: WO2023040700A1
Application number: PCT/CN2022/117147
Authority: WO
Inventors: 王四海; 秦城; 杨锐; 李雪茹
Original assignee: 华为技术有限公司
Priority date: 2021-09-16
Filing date: 2022-09-06
Publication date: 2023-03-23
Also published as: CN115835182A

Abstract

本申请提供一种人工智能AI通信方法，应用于通信系统中进行通信的任意两个设备，该方法包括：第一设备获取AI能力信息，其中，该AI能力信息包括第一设备执行至少一个参考AI单元中每个参考AI单元的时间和/或能耗；第一设备向第二设备发送该AI能力信息。进一步地，该方法还包括：第一设备接收第二设备发送的配置信息，其中，该配置信息指示第一设备启动AI通信模式，或，该配置信息指示至少一个AI模型，或，该配置信息指示至少一个AI模型的配置参数，或，该配置信息指示至少一个AI模型的获取方法。这样，第二设备能够通过第一设备上报的AI能力信息评估第一设备的AI能力和AI模型的匹配情况，可以提高第二设备评估结果的简便性、高效性和准确度。

Description

一种人工智能AI通信方法及装置

本申请要求在2021年9月16日提交中国国家知识产权局、申请号为202111085791.9的中国专利申请的优先权，发明名称为“一种AI能力表示方法和装置”的中国专利申请的优先权，在2021年10月26日提交中国国家知识产权局、申请号为202111250477.1的中国专利申请的优先权，发明名称为“一种人工智能AI通信方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及通信技术领域，尤其涉及一种人工智能AI通信方法及装置。

背景技术

人工智能(artificial intelligence，AI)技术是计算机科学的一个分支，贯穿在计算机发展的历史过程中，是信息科技业界的一个重要的发展方向。随着通信技术的发展，越来越多的应用将通过AI实现智能化。目前，无线通信系统引入AI技术，可能会逐步使用AI模块代替无线通信系统中的功能模块。无线通信系统引入AI技术后，一种可能的工作模式是，网络设备将AI模型发送给终端设备，终端设备从网络设备接收AI模型并应用AI模型进行无线通信。

不同的终端设备的AI能力存在差异，因此，网络设备下发的AI模型可能无法被终端设备执行，这样就会导致无法应用AI模型进行无线通信。

发明内容

本申请提供一种人工智能AI通信方法及装置，以期更好地在无线通信系统中应用AI技术。

第一方面，本申请提供了一种AI通信方法，该方法可以由第一设备执行，其中，第一设备可以是终端设备，或者通信系统中AI模型的接收方。该方法可以通过以下步骤实现：第一设备获取AI能力信息，该AI能力信息包括第一设备执行至少一个参考AI单元中每个参考AI单元的时间和/或能耗；第一设备向第二设备发送该AI能力信息。

本实现方式中，通过第一设备向第二设备发送其AI能力信息，第二设备能够对AI模型和第一设备的AI能力的匹配情况进行评估，保证第一设备和第二设备使用AI模型进行通信的可行性。

在一个可能的设计中，第一设备向第二设备发送AI能力信息之后，该方法还包括：第一设备接收第二设备发送的配置信息，其中，该配置信息指示第一设备启动AI通信模式，或，该配置信息指示至少一个AI模型，或，该配置信息指示至少一个AI模型的配置参数，或，该配置信息指示至少一个AI模型的获取方法。

在一个可能的设计中，至少一个AI模型是根据AI能力信息确定的。

在一个可能的设计中，配置信息是AI能力信息的响应信息。

在一个可能的设计中，第一设备执行至少一个参考AI单元中第一AI参考单元的时间为第一时间数值、第一时间等级或第一时间范围，第一设备执行至少一个参考AI单元中第一AI参考单元的能耗为第一能耗数值、第一能耗等级或第一能耗范围。

在一个可能的设计中，AI能力信息包括第一设备执行至少一个参考AI单元中每个参考AI单元使用的输入数据的数量。

在一个可能的设计中，AI能力信息包括以下一种或多种：第一设备执行至少一个参考AI单元中每个参考AI单元使用的输入数据的数值精度；至少一个参考AI单元中每个参考AI单元的权值的数值精度；第一设备执行至少一个参考AI单元中每个参考AI单元时的运算精度。

在一个可能的设计中，第一设备执行至少一个参考AI单元中每个参考AI单元使用的资源为所述第一设备所有可用的计算资源。基于上述AI能力信息，第二设备能够更简便、高效和准确地评估第一设备的AI能力和AI模型复杂度的匹配情况，进而更好地进行AI通信。

在一个可能的设计中，AI能力信息包括第一设备用于执行AI模型的时间上限值，能耗上限值，和资源使用情况中的至少一种。这样，第一设备可以向第二设备发送其用于执行AI模型的时间上限值信息、能耗上限值信息、和资源使用情况信息中的至少一种，以告知第二设备其执行AI模型的时间预算要求、能量消耗限制、或资源使用情况。

在一个可能的设计中，第一设备向第二设备发送AI能力信息之前，该方法还包括：第一设备接收来自第二设备的请求信息，该请求信息用于请求第一设备向第二设备发送上述AI能力信息。

在一个可能的设计中，第一设备向第二设备发送AI能力信息，包括：第一设备周期性向第二设备发送AI能力信息；或第一设备接入第二设备所在的网络时，第一设备向第二设备发送AI能力信息；或第一设备与第二设备建立通信连接时，第一设备向第二设备发送AI能力信息；或第一设备用于执行AI模型的计算资源改变时，第一设备向第二设备发送AI能力信息。

第二方面，本申请提供了一种AI通信方法，该方法可以由第二设备执行，其中，第二设备可以是网络设备，或者通信系统中AI模型的发送方。该方法可以通过以下步骤实现：第二设备接收第一设备发送的AI能力信息，该AI能力信息包括第一设备执行至少一个参考AI单元的时间和/或能耗。

在一个可能的设计中，第二设备接收第一设备发送的AI能力信息之后，该方法还包括：第二设备向第一设备发送配置信息，其中，该配置信息指示第一设备启动AI通信模式，或，该配置信息指示至少一个AI模型，或，该配置信息指示至少一个AI模型的配置参数，或，该配置信息指示至少一个AI模型的获取方法，其中，该至少一个AI模型是根据上述AI能力信息确定的。

在一个可能的设计中，配置信息是AI能力信息的响应信息。

在一个可能的设计中，AI能力信息包括第一设备用于执行AI模型的时间上限值，能耗上限值，和资源使用情况中的至少一种。

在一个可能的设计中，第二设备接收第一设备发送的AI能力信息之前，该方法还包括：第二设备向第一设备发送请求信息，该请求信息用于请求第一设备向第二设备发送上述AI能力信息。

在一个可能的设计中，配置信息指示至少一个AI模型，或配置指示至少一个AI模型的配置参数，或配置信息指示至少一个AI模型的获取方法时，第二设备向第一设备发送配置信息之前，该方法还包括：第二设备根据上述AI能力信息确定至少一个AI模型。

在一个可能的设计中，第二设备根据AI能力信息确定至少一个AI模型包括：，第二设备根据AI能力信息和M个AI模型对应的M组相似度信息确定至少一个AI模型，其中，M组相似度信息中的每组相似度信息为M个AI模型中的一个AI模型与K个参考AI单元的相似度信息。其中，M和K为正整数。

在一个可能的设计中，M个AI模型为第二设备或其他设备中预先存储的；或M个AI模型为第二设备从其他设备获取的；或M个AI模型为第二设备生成的。

在一个可能的设计中，M组相似度信息中的第一组相似度信息为第一AI模型和K个参考AI单元的相似度信息，第一组相似度信息包括第一相似度信息，第一相似度信息与第一比例和/或第二比例相关联，其中，第一比例为第一AI模型中与第一参考AI单元相同的层的总数量占第一AI模型总层数的比例，第二比例为第一AI模型中与第一参考AI单元相同的层的总计算量占第一AI模型总计算量的比例，M个AI模型包括第一AI模型，K个参考AI单元包括第一参考AI单元。

在另一个可能的设计中，M组相似度信息中的第一组相似度信息为第一AI模型和K个参考AI单元的相似度信息，第一组相似度信息包括第一相似度信息，第一相似度信息与第一比例和/或第二比例相关联，其中，第一比例为第一AI模型中与第一参考AI单元相同的单元的总层数占第一AI模型总层数的比例，第二比例为第一AI模型中与第一参考AI单元相同的单元的总计算量占第一AI模型总计算量的比例，M个AI模型包括第一AI模型，K个参考AI单元包括第一参考AI单元。

第二方面及各个可能的设计的有益效果可以参考第一方面相关的描述，在此不予赘述。

第三方面，本申请提供了一种AI通信方法，该方法可以由第一设备执行，其中，第一设备可以是终端设备，或者通信系统中AI模型的接收方。该方法可以通过以下步骤实现：第一设备接收第二设备发送的AI模型信息，该AI模型信息包括M个AI模型对应的M组相似度信息，M组相似度信息中的每组相似度信息为M个AI模型中的一个AI模型与K个参考AI单元的相似度信息，其中，M和K为正整数；第一设备根据该AI模型信息向第二设备发送反馈信息。

本实现方式中，第二设备向第一设备发送AI模型信息，第一设备能够对AI模型和第一设备的AI能力的匹配情况进行评估，保证第一设备和第二设备使用AI模型进行通信的可行性。

在一个可能的设计中，AI模型信息包括以下一种或多种：执行M个AI模型中每个AI模型时使用的输入数据的数值精度；M个AI模型中每个AI模型的权值的数值精度；执行M个AI模型中每个AI模型时的运算精度。

在一个可能的设计中，AI模型信息包括M个AI模型中每个AI模型的总层数和/或总计算量。

基于上述AI模型信息，第一设备能够更简便、高效和准确地评估的第一设备的AI能力和AI模型复杂度的匹配情况，进而更好地进行AI通信。

在一个可能的设计中，AI模型信息包括执行AI模型的时间上限值。这样，第一设备能够获取第二设备对第一设备执行待下发AI模型的时间预算要求，以便更好地确定是否启动AI通信模式或选择合适的AI模型。

在一个可能的设计中，上述反馈信息指示第一设备请求启动AI模式，或，反馈信息指示M个AI模型中至少一个AI模型的评估结果，或，反馈信息请求第二设备向第一设备发送至少一个AI模型，其中，M个AI模型包括至少一个AI模型。

在一个可能的设计中，第一设备根据AI模型信息向第二设备发送反馈信息之后，该方法还包括：第一设备接收第二设备发送的配置信息，该配置信息指示第一设备启动AI模式，或，该配置信息指示至少一个AI模型，或，该配置信息指示至少一个AI模型的配置参数，或，该配置信息指示至少一个模型的获取方法，其中，上述M个AI模型包括该至少一个AI模型。

在一个可能的设计中，第一设备接收第二设备发送的AI模型信息之前，该方法还包括：第一设备向第二设备发送请求信息，该请求信息用于请求第二设备向第一设备发送上述AI模型信息。

在一个可能的设计中，第一设备基于AI模型信息向第二设备发送反馈信息之前，该方法还包括：第一设备根据AI模型信息和第一设备的AI能力信息确定反馈信息。

在一个可能的设计中，第一设备的AI能力信息指示所述第一设备执行至少一个参考AI单元的时间和/或能耗。关于AI能力信息的可能的设计可以参考第一方面相关的描述，在此不予赘述。

第四方面，本申请提供了一种AI通信方法，该方法可以由第二设备执行，其中，第二设备可以是网络设备，或者通信系统中AI模型的发送方。该方法可以通过以下步骤实现：第二设备向第一设备发送AI模型信息，该AI模型信息包括M个AI模型对应的M组相似度信息，M组相似度信息为M个AI模型中的一个AI模型与K个参考AI单元的相似度信息，其中，所述M和K为正整数；第二设备接收第一设备发送的反馈信息，该反馈信息是根据AI模型信息确定的。

在一个可能的设计中，AI模型信息包括执行AI模型的时间上限值。

在一个可能的设计中，第二设备接收第一设备发送的反馈信息之后，该方法还包括：第二设备向第一设备发送配置信息，该配置信息指示第一设备启动AI模式，或，该配置信息指示至少一个AI模型，或，该配置信息指示至少一个AI模型的配置参数，或，该配置信息指示至少一个AI模型的获取方法，其中，M个AI模型包括该至少一个AI模型。

在一个可能的设计中，第二设备向第一设备发送AI模型信息之前，该方法还包括：第二设备接收第一设备发送的请求信息，该请求信息用于请求第二设备向第一设备发送AI模型信息。

在一个可能的设计，上述M个AI模型为第二设备或其他设备中预先存储的，或，上述M个AI模型为第二设备从其他设备获取的，或，上述M个AI模型为所述第二设备生成的。

第四方面及各个可能的设计的有益效果可以参考第三方面相关的描述，在此不予赘述。

第五方面，本申请还提供了一种通信装置，所述通信装置可以是终端设备，或者所述通信装置可以是通信系统中的接收端设备，该通信装置具有实现上述第一方面或第三方面中任一方面的第一设备的功能。所述功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中，所述通信装置的结构中包括收发单元和处理单元，这些单元可以执行上述第一方面或第三方面中任一方面的第一设备的相应功能，具体参见方法示例中的详细描述，此处不做赘述。

在一个可能的设计中，所述通信装置的结构中包括收发器和处理器，可选的还包括存储器，所述收发器用于收发数据，以及用于与通信系统中的其他设备进行通信交互，所述处理器被配置为支持所述通信装置执行上述第一方面或第三方面中任一方面的第一设备的相应的功能。所述存储器与所述处理器耦合，其保存所述通信装置必要的程序指令和数据。

第六方面，本申请还提供了一种通信装置，所述通信装置可以是网络设备，或者所述通信装置可以是通信系统中的发送端设备，该通信装置具有实现上述第二方面或第四方面中任一方面的第二设备的功能。所述功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中，所述通信装置的结构中包括收发单元和处理单元，这些单元可以执行上述第二方面或第四方面中任一方面的第二设备的相应功能，具体参见方法示例中的详细描述，此处不做赘述。

在一个可能的设计中，所述通信装置的结构中包括收发器和处理器，可选的还包括存储器，所述收发器用于收发数据，以及用于与通信系统中的其他设备进行通信交互，所述处理器被配置为支持所述通信装置执行上述第二方面或第四方面中任一方面的第二设备的相应的功能。所述存储器与所述处理器耦合，其保存所述通信装置必要的程序指令和数据。

第七方面，本申请实施例提供了一种通信系统，可以包括上述提及的第一设备和第二设备。

第八方面，本申请实施例提供的一种计算机可读存储介质，该计算机可读存储介质存储有程序指令，当程序指令在计算机上运行时，使得计算机执行上述第一方面至第四方面中任一方面及其任一可能的设计中的方法。示例性的，计算机可读存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于：计算机可读介质可以包括非瞬态计算机可读介质、随机存取存储器(random-access memory，RAM)、只读存储器(read-only memory，ROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)、CD-ROM或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。

第九方面，本申请实施例提供一种包括计算机程序代码或指令的计算机程序产品，当其在计算机上运行时，使得计算机实现上述第一方面至第四方面中任一方面及其任一可能的设计中的方法。

第十方面，本申请还提供了一种芯片，包括处理器，所述处理器与存储器耦合，用于读取并执行所述存储器中存储的程序指令，以使所述芯片实现上述第一方面至第四方面中任一方面及其任一可能的设计中的方法。

上述第五方面至第十方面中的各个方面以及各个方面可能达到的技术效果请参照上述针对第一方面至第四方面中的各种可能方案可以达到的技术效果说明，这里不再重复赘述。

附图说明

图1为本申请提供的一种通信系统的架构示意图；

图2为本申请实施例中网络设备与终端设备利用AI模型进行无线通信的过程示意图；

图3为本申请实施例中AI通信方法流程示意图之一；

图4为本申请实施例中网络设备进行AI能力和AI模型匹配度评估的流程示意图；

图5为本申请实施例中AI通信方法流程示意图之二；

图6为本申请实施例中终端设备进行AI能力和AI模型匹配度评估的流程示意图；

图7为本申请实施例中通信装置结构示意图之一；

图8为本申请实施例中通信装置结构示意图之二。

具体实施方式

下面将结合附图，对本申请中的技术方案作进一步地详细描述。

本申请提供的技术方案可以应用于各种通信系统，例如：第五代(5th generation，5G)或新无线(new radio，NR)系统、长期演进(long term evolution，LTE)系统、LTE频分双工(frequency division duplex，FDD)系统、LTE时分双工(time division duplex，TDD)系统等。本申请提供的技术方案还可以应用于未来的通信系统，如第六代移动通信系统。本申请提供的技术方案还可以应用于设备到设备(device to device，D2D)通信，车到万物(vehicle-to-everything，V2X)通信，机器到机器(machine to machine，M2M)通信，机器类型通信(machine type communication，MTC)，以及物联网(internet of things，IoT)通信系统或者其他通信系统。

本申请实施例提供一种人工智能AI通信方法及装置。其中，本申请所述方法和装置基于同一技术构思，由于方法及装置解决问题的原理相似，因此装置与方法的实施可以相互参见，重复之处不再赘述。

在本申请的描述中，“第一”、“第二”等词汇，仅用于区分描述的目的，而不能理解为指示或暗示相对重要性，也不能理解为指示或暗示顺序。

在本申请的描述中，“至少一个(种)”是指一个(种)或者多个(种)，多个(种)是指两个(种)或者两个(种)以上。

在本申请的描述中，除非另有说明，“/”表示或的意思，例如，A/B可以表示A或B；本文中的“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，在本申请实施例的描述中，“多个”是指两个或多于两个。为了更加清晰地描述本申请实施例的技术方案，下面结合附图，对本申请实施例提供的下行调度方法及装置进行详细说明。

图1示出了适用于本申请实施例的无线通信系统的示意图。如图1所示，该无线通信系统可以包括至少一个网络设备，例如图1所示的网络设备111、网络设备112，该无线通信系统还可以包括至少一个终端设备，例如图1所示的终端设备121、终端设备122、终端设备123、终端设备124、终端设备125、终端设备126、终端设备127。网络设备和终端设备均可配置多个天线，网络设备与终端设备可使用多天线技术通信。

其中，网络设备和终端设备通信时，网络设备可以管理一个或多个小区，一个小区中可以有整数个终端设备。需要说明的是，小区可以理解为网络设备的无线信号覆盖范围内的区域。

本申请可以用于网络设备和终端设备之间通信的场景，如网络设备111与终端设备121、终端设备122、终端设备123之间可以通信；又如网络设备111和网络设备112可以与终端设备124通信。本申请还可以用于终端设备和终端设备之间通信的场景，如终端设备122可以与终端设备125通信。本申请还可以用于网络设备与网络设备之间通信的场景，如网络设备111可以与网络设备112通信。

应理解，图1仅为便于理解而示例的简化示意图，本申请并未限定于此。本申请实施例可以适用于发送端设备和接收端设备通信的任何通信场景。

本申请实施例中的终端设备也可以称为用户设备(user equipment，UE)、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置。

终端设备可以是一种向用户提供语音/数据的设备，例如，具有无线连接功能的手持式设备、车载设备等。目前，一些终端的举例为：手机(mobile phone)、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internet device，MID)、可穿戴设备，虚拟现实(virtual reality，VR)设备、增强现实(augmented reality，AR)设备、工业控制(industrial control)中的无线终端、无人驾驶(self-driving)中的无线终端、远程手术(remote medical surgery)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端、蜂窝电话、无绳电话、会话启动协议(session initiation protocol，SIP)电话、无线本地环路(wireless local loop，WLL)站、个人数字助理(personal digital assistant，PDA)、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、可穿戴设备，5G网络中的终端设备或者未来演进的公用陆地移动通信网络(public land mobile network，PLMN)中的终端设备等，本申请实施例对此并不限定。

作为示例而非限定，在本申请实施例中，该终端设备还可以是可穿戴设备。可穿戴设备也可以称为穿戴式智能设备，是应用穿戴式技术对日常穿戴进行智能化设计、开发出可以穿戴的设备的总称，如眼镜、手套、手表、服饰及鞋等。可穿戴设备即直接穿在身上，或是整合到用户的衣服或配件的一种便携式设备。可穿戴设备不仅仅是一种硬件设备，更是通过软件支持以及数据交互、云端交互来实现强大的功能。广义穿戴式智能设备包括功能全、尺寸大、可不依赖智能手机实现完整或者部分的功能，例如：智能手表或智能眼镜等，以及只专注于某一类应用功能，需要和其它设备如智能手机配合使用，如各类进行体征监测的智能手环、智能首饰等。

本申请实施例中，用于实现终端设备的功能的装置可以是终端设备，也可以是能够支持终端设备实现该功能的装置，例如芯片系统或芯片，该装置可以被安装在终端设备中。本申请实施例中，芯片系统可以由芯片构成，也可以包括芯片和其他分立器件。

本申请实施例中的网络设备可以是用于与终端设备通信的设备，该网络设备也可以称为接入网设备或无线接入网设备，如网络设备可以是基站。本申请实施例中的网络设备可以是指将终端设备接入到无线网络的无线接入网(radio access network，RAN)节点(或设备)。基站可以广义的覆盖如下中的各种名称，或与如下名称进行替换，比如：节点B(NodeB)、演进型基站(evolved NodeB，eNB)、下一代基站(next generation NodeB，gNB)、中继站、接入点、传输点(transmitting and receiving point，TRP)、发射点(transmitting point，TP)、主站、辅站、多制式无线(motor slide retainer，MSR)节点、家庭基站、网络控制器、接入节点、无线节点、接入点(AP)、传输节点、收发节点、基带单元(BBU)、射频拉远单元(remote radio unit，RRU)、有源天线单元(active antenna unit，AAU)、射频头(remote radio head，RRH)、中心单元(central unit，CU)、分布式单元(distributed unit，DU)、定位节点等。基站可以是宏基站、微基站、中继节点、施主节点或类似物，或其组合。基站还可以指用于设置于前述设备或装置内的通信模块、调制解调器或芯片。基站还可以是移动交换中心以及D2D、V2X、M2M通信中承担基站功能的设备、6G网络中的网络侧设备、未来的通信系统中承担基站功能的设备等。基站可以支持相同或不同接入技术的网络。本申请的实施例对网络设备所采用的具体技术和具体设备形态不做限定。

基站可以是固定的，也可以是移动的。例如，直升机或无人机可以被配置成充当移动基站，一个或多个小区可以根据该移动基站的位置移动。在其他示例中，直升机或无人机可以被配置成用作与另一基站通信的设备。

在一些部署中，本申请实施例所提及的网络设备可以为包括CU、或DU、或包括CU和DU的设备、或者控制面CU节点(控制面的中央单元(central unit-control plane，CU-CP))和用户面CU节点(用户面的中央单元(central unit-user plane，CU-UP))以及DU节点的设备。

网络设备和终端设备可以部署在陆地上，包括室内或室外、手持或车载；也可以部署在水面上；还可以部署在空中的飞机、气球和卫星上。本申请实施例中对网络设备和终端设备所处的场景不做限定。

人工智能AI技术可以与无线空口相结合以提升无线网络性能。例如，基于AI的信道估计和信号检测。其中，信号检测可以是从无线信道中把所接收到的含干扰噪声的信号提取出来的过程；信道估计是从接收到的信号中将假定的某个信道模型的模型参数估计出来的过程。又例如，基于AI的端到端的通信链路设计。再例如，基于AI的信道状态信息(channel state information，CSI)反馈方案，即通过神经网络对CSI进行编码并反馈给网络设备。

以基于AI的信道状态信息(channel state information，CSI)反馈方案为例，介绍网络设备与终端设备利用AI模型进行无线通信的过程。如图2中(a)所示，网络设备中可以部署有AI编码器和对应的AI解码器。网络设备可以向终端设备发送或下发AI编码器，或指示终端设备获取AI编码器，以便后续终端设备使用AI编码器进行CSI编码。如图2中(b)所示，终端设备可以使用该AI编码器对CSI进行编码，并将编码后的信息发送给网络设备。然后，网络设备可以使用AI解码器对终端设备编码后的信息进行解码，以得到恢复后的信息。需要说明的是，AI编码器也可以理解为用于信息编码的AI模型，AI解码器也可以理解为用于信息解码的AI模型。

AI模型多种多样，不同的应用场景中，可以采用不同的AI模型。常见的，AI模型可以基于神经网络(neural network)模型实现。神经网络模型是一种模仿人脑神经网络的行为特征，进行分布式并行信息处理的数学计算模型。一些复杂的神经网络模型可能包含的参数量或计算量很大，而终端设备的能力(例如计算能力、存储能力或能量)可能受限。因此，网络设备和终端设备之间进行AI通信之前，需要确保终端设备的AI能力能够支持执行(或称：运行、处理)网络设备发送的AI模型，例如，终端设备的存储能力能够容纳该AI模型、终端设备的计算能力能够支持该AI模型在要求的时间内完成计算、终端设备执行该AI模型的运行功耗(或称，能量功耗)在预期的可接受范围内。

通常，AI模型计算时延上限t _i(即AI模型推理完成时间上限)是已知的，因此，一种方案中，可以通过比较终端设备的计算能力C _UE和AI模型的计算复杂度C _M来评估AI模型和终端设备AI能力的匹配情况，当C _M/C _UE+t _th≤t _i时，表示AI模型可以在要求的时延内完成计算，即AI模型复杂度和终端设备的计算能力相匹配，否则认为AI模型复杂度和终端设备的计算能力不匹配。其中，终端设备的计算能力C _UE可以以每秒浮点运算次数(floating-point operations per second，FLOPS)为单位，AI模型的计算复杂度C _M可以以浮点运算数(floating-point operations，FLOP)为单位，t _th为可以提前配置的裕量。

然而，相同用途的AI模型的内部结构可能差异较大，在实际计算时，因为硬件计算率、数据调度时延等不同，不同结构的AI模型的计算效率可能大相径庭。另外，由于AI模型到硬件计算资源之间，需要大量的软件转换和优化，不同的软件转换和优化方法同样带来了不同的计算效率。除此之外，终端设备不同的AI计算硬件实现也可能会带来不同的AI模型计算效率。因此，上述AI模型结构设计、软件环境、硬件实现等因素均可能导致上百倍的计算效率偏差，仅通过配置裕量t _th可能难以评估AI模型和终端设备AI能力的实际匹配情况。例如，t _th过大可能浪费算力资源，t _th过小则可能导致无法在时延上限内完成AI模型的执行；而且AI模型结构、软件环境、硬件实现等不同时，t _th取值可能也是不同的。

另一种方案中，可以在匹配服务器上配置终端硬件信息，例如终端设备的模拟器。在获取到AI模型的详细信息和计算时延之后，匹配服务器可以获得精准的AI模型复杂度和终端设备AI能力的匹配情况的评估结果。然而，该方案需要引入匹配服务器和相应的交互协议，使得网络结构和交互流程复杂，同时增加了成本和评估时延。

基于此，本申请提出了一种AI通信方法及装置，可以实现AI模型复杂度和设备AI的匹配情况的评估，保证使用AI模型进行通信业务的可行性。

需要说明的是，本申请可以应用于通信系统中任意两个设备(第一设备和第二设备)进行通信的场景。其中，第一设备中可以有执行AI模型的计算硬件、并准备从第二设备中获取AI模型并使用，第二设备中可以有AI模型、并准备发送给第二设备使用。例如，第一设备为图1中的终端设备121、终端设备122、或终端设备123，第二设备为图1中的网络设备111；又例如，第一设备为图1中的终端设备122，第二设备为图1中的终端设备125；再例如，第一设备为图1中的网络设备111，第二设备为图1中的网络设备112。

下文示出的实施例中，仅为便于理解和说明，以网络设备与终端设备之间的交互为例，详细说明本申请实施例提供的方法。

下面结合附图详细介绍本申请实施例提供的方法及相关装置。需要说明的是，本申请实施例的展示顺序仅代表实施例的先后顺序，并不代表实施例所提供的技术方案的优劣。

基于以上描述，本申请实施例提供了一种AI通信方法，适用于图1所示的通信系统。如图3所示，该方法可以包括但不限于以下步骤：

S301：终端设备获取AI能力信息，该AI能力信息包括终端设备执行至少一个参考AI单元中每个参考AI单元的时间和/或能耗。

例如，当至少一个参考AI单元的数量为3(参考AI单元P1、参考AI单元P2、参考AI单元P3)时，该AI能力信息包括：终端设备执行参考AI单元P1的时间和/或能耗，终端设备执行参考AI单元P2的时间和/或能耗，以及终端设备执行参考AI单元P3的时间和/或能耗。

具体地，该参考AI单元信息可以是提前标准化的或者离线指定的，并向终端设备公开。

其中，终端设备执行参考AI单元，也可以理解为终端设备对参考AI单元执行推理或训练操作。示例性地，参考AI单元可以是参考AI模型、参考AI模块、和参考AI算子中的至少一种。例如，AI模型可以为神经网络模型，AI模块可以为神经网络模块，AI算子可以为神经网络算子。其中，常见的神经网络模型例如ResNet系列、MobileNet系列、Transformer系列等，神经网络模型包括一层层算子(神经网络算子)，而当前的神经网络模型(典型的如ResNet系列模型)常常是模块化设计，即神经网络模型包括一系列模块(神经网络模块)及神经网络算子。可以认为，AI模块包括AI算子，而AI模型包括AI模块和/或AI算子。

可选地，终端设备执行每个参考单元的时间和/或能耗可以使用实际数值、近似数值、等级(例如：低/中/高、或1/2/3/4)、或者范围表示。具体地，上述至少一个参考AI单元可以包括第一AI参考单元，终端设备执行该第一AI参考单元的时间可以为第一时间数值、第一时间等级或第一时间范围，终端设备执行该第一AI参考单元的能耗可以为第一能耗数值、第一能耗等级或第一能耗范围。

一种实现方式中，终端设备可以自己执行上述至少一个参考AI单元，并获取其AI能力信息。另一种实现方式中，上述执行至少一个AI参考单元的过程可以在与该终端设备AI能力相同或相近的设备、或能够真实体现该终端设备AI能力的模拟器中完成。具体地，在与终端设备AI能力相同或相近的设备或模拟器中得到的计算结果的误差可以不超过预期值。此时，终端设备可以从其他设备或模拟器中获取该AI能力信息。又一种实现方式中，终端设备执行至少一个AI参考单元的时间和/或能耗信息可以是出厂设置的。

S302：终端设备向网络设备发送AI能力信息。相应地，网络设备接收终端设备发送的AI能力信息。

可选地，终端设备发送的AI能力信息可以包括终端设备执行至少一个参考AI单元使用的输入数据的数量。其中，输入数据的数量也可以称为样本数量。通常，终端设备进行模型训练时，一次执行一批(batch)样本，样本批量大小决定一次训练的样本数目。使用不同的数量的输入数据时，终端设备会得到不同的计算效率。

可选地，终端设备发送的AI能力信息还可以包括以下至少一种：终端设备(或与终端设备AI能力相同的其他设备、或模拟器)执行至少一个参考AI单元中每个参考AI单元使用的输入数据的数值精度；该至少一个参考AI单元中每个参考AI单元的权值(或称权重、系数)的数值精度；终端设备(或与终端设备AI能力相同的其他设备、或模拟器)执行至少一个参考AI单元中每个参考AI单元时的运算精度。

神经网络可以是由神经单元组成的，神经单元可以是指以x _s和截距1为输入数据的运算单元，该运算单元的输出可以为：

其中，s＝1、2、……n，n为自然数，W _s即为x _s的权重，b为神经单元的偏置(也可以看作是一种权重)。输入数据和权值的数值精度会影响终端设备的计算效率。其中，数值精度例如可以是int(整型)8、int16、float(浮点型)16等。数值精度也可以等效地表示为其中的乘法和加法运算精度，运算精度同样会影响终端设备的计算效率，运算精度例如可以是int8、int16、float16等

一种可能的实现方式中，终端设备执行上述至少一个参考AI单元中每个参考AI单元使用的资源为该终端设备所有可用的计算资源。终端设备的运行硬件可能有多种类型，例如，中央控制单元(central processing unit，CPU)、微型处理器(graphics processing unit，GPU)、嵌入式神经网络处理器(neural-network processing unit，NPU)、或现场可编程门阵列(field programmable gate array，FPGA)等，如果终端设备支持异构计算，运行硬件还可能是上述多种类型的组合，其中，异构计算指的是AI模型分布在多种类型的计算单元上执行。例如，AI模型分布在CPU、GPU和FPGA三种的计算单元上执行，进而，终端设备可用的计算资源可以包括CPU资源、GPU资源和FPGA资源中的一种或多种。

另一种可能的实现方式中，终端设备执行上述至少一个参考AI单元中每个参考AI单元使用的资源为该终端设备所有可用的计算资源的一部分。可以理解，终端设备执行参考AI单元使用的计算资源的比例会影响其AI能力信息(即终端设备执行至少一个AI参考单元的时间和/或能耗信息)。

本实现方式中，方式1：终端设备可以根据使用的计算资源占所有可用的计算资源的比例，对计算出的执行上述至少一个参考AI单元中每个参考AI单元的完成时间或消耗的能量进行换算，得到最终上报的AI能力信息。方式2：终端设备可以将使用的计算资源占所有可用的计算资源的比例信息上报给网络设备，进而，网络设备可以根据该资源比例信息对终端设备上报的AI能力信息进行换算。可选地，终端设备发送的AI能力信息可以包括(或指示)该终端设备执行至少一个参考AI单元中每个参考AI单元使用的计算资源占该终端设备所有可用的计算资源的比例，或者，终端设备可以在其他信令中单独向网络设备发送该资源比例信息。

可选地，终端设备执行上述至少一个参考AI单元的过程可以在终端设备出厂时完成。

需要说明的是，上述AI能力信息中包括的信息可以在同一信令中，也可以包括在不同信令中，其可以称为终端设备的专有能力信息。

当上述AI能力信息中包括的信息在同一信令中时，终端设备可以一次性将上述AI能力信息上报给网络设备，例如，终端设备向网络设备发送第一信息，该第一信息可以包括或指示上述AI能力信息，或该第一信息为上述AI能力信息。

当上述AI能力信息中包括的信息在不同信令中时，终端设备可以一次或多次将AI能力信息上报给网络设备。示例一：终端设备一次或多次将执行AI单元的时间和/或能耗、输入数据的数量、输入数据的精度等不同能力上报给网络设备。例如，终端设备向网络设备发送第一信息，该第一信息包括或指示终端设备执行至少一个参考AI单元中每个参考AI单元的时间和/或能耗，终端设备向网络设备发送第二信息，该第二信息包括或指示执行至少一个参考AI单元中每个参考AI单元使用的输入数据的数量，上述AI能力信息可以包括该第一信息和第二信息。示例二：终端设备一次或多次将上述AI能力信息上报给网络设备。例如，终端设备向网络设备发送第一信息，该第一信息包括或指示执行AI单元的时间和/或能耗、输入数据的数量、输入数据的精度等能力信息，终端设备向网络设备发送第二信息，该第二信息包括或指示更新后的能力信息，上述AI能力信息可以包括该第一信息和第二信息。

在一种实施方式中，如图3所示，在前述的步骤S302之后，也就是终端设备向网络设备发送AI能力信息之后，该方法还包括：

S303：网络设备向终端设备发送配置信息。相应地，终端设备接收网络设备发送的配置信息。在一实施例中，该配置信息是上述AI能力信息的响应信息。

具体地，该配置信息可以满足以下一项或多项：该配置信息可以指示终端设备启动AI模式，进一步地，终端设备和网络设备之间可以进行AI通信。或者，该配置信息可以指示至少一个AI模型，进一步地，终端设备和网络设备之间可以使用该至少一个AI模型进行AI通信。又或者，该配置信息可以指示至少一个AI模型的配置参数。再或者，该配置信息可以指示至少一个AI模型的获取方法，例如，该配置信息可以指示至少一个AI模型的下载地址或获取地址。其中，该至少一个AI模型可以是根据上述AI能力信息确定的。

可以理解，网络设备接收终端设备发送的上述AI能力信息后，也可以不做响应。

在一种实施方式中，终端设备向网络设备发送上述AI能力信息，具体触发方法可以包括：

方式1：网络设备向终端设备发送请求信息。相应地，终端设备接收网络设备发送的请求信息。其中，该请求信息用于请求终端设备向网络设备发送(或称：上报)上述AI能力信息。

方式2：终端设备周期性地向网络设备发送上述AI能力信息。或者，终端设备按照预定义的时间间隔或者预定义的特定时间向网络设备发送上述AI能力信息。

方式3：当终端设备接入网络设备所在的网络时，终端设备向网络设备发送AI能力信息。其中，终端设备接入网络设备所在的网络时，也可以描述为终端设备接入网络设备所在的网络后、或终端设备接入网络设备所在的网络一定时间内。此外，终端设备接入网络设备所在的网络，也可以理解为，终端设备与网络设备建立通信连接。

方式4：当终端设备可以用于执行AI模型的计算资源发生变化(例如：增加或减少)时，或者终端设备可以用于执行AI模型的计算资源的比例发生变化时，终端设备向网络设备发送AI能力信息。同上，终端设备可以用于执行AI模型的计算资源发生变化时，也可以描述为终端设备可以用于执行AI模型的计算资源发送变化后、或终端设备可以用于执行AI模型的计算资源发送变化一定时间内，此处不再赘述。

当终端设备处于不同的应用场景时，需要完成的操作的复杂度不同，终端设备对执行AI模型所能接受(或称容忍)的功耗/能量要求、时间要求、使用的资源要求等也是不同的。也就是说，在不同的应用场景下，终端设备用于执行AI模型的最大时间要求、最大能耗要求、或资源使用情况要求不同，其中，最大时间要求可以是终端设备应该在多长时间内执行完AI模型，最大能耗要求可以是终端设备执行完AI模型允许消耗的最大能耗，资源使用情况要求可以是终端设备执行AI模型允许使用的资源占终端设备可用资源的最大比例、或者终端设备执行AI模型可以使用的硬件资源配置。需要说明的是，上述所称终端设备执行AI模型，指的是终端设备在AI通信模式下执行AI模型的过程，并不限定终端设备所执行的AI模型的种类。

进一步地，终端设备处于不同的应用场景时，可以向网络设备发送AI能力信息，其中，AI能力信息可以包括用于终端设备用于执行AI模型的时间上限值、能耗上限值、和资源使用情况中的至少一种。可以理解地，时间上限值或称为时间上限、最大时间、或最大时间要求，能耗上限值或称为能耗上限、最大能耗、或最大能耗要求，资源使用情况例如可以为终端设备可以使用的硬件资源配置、资源比例上限值等。其中，资源比例上限值或称为资源比例上限、最大资源比例、或最大资源比例要求。可选地，上述终端设备向网络设备发送AI能力之前，网络设备还可以向终端设备发送查询信息，其中，该查询信息指示终端设备上报上述用于执行AI模型的时间上限值、能耗上限值、和资源使用情况中的一个或多个。

应理解，当终端设备的应用场景改变时，终端设备可以向网络设备上报其用于执行AI模型的时间上限值、能耗上限值、和资源使用情况信息中的至少一种，以告知网络设备其执行AI模型的时间预算要求、能量消耗限制、和资源比例消耗限制中的至少一种。此时，该时间上限值信息、能耗上限值信息、或资源使用情况信息与步骤S302中上报的信息可以携带在不同信令中。

通过上述的实施方式，终端设备通过上报其AI能力信息，使网络设备能够通过该AI能力信息评估终端设备的AI能力和AI模型(例如：AI模型的复杂度)的匹配情况，进而决定是否启动AI通信模式或者下发合适的AI模型，可以提高网络设备评估结果的简便性、高效性和准确度，进而更好地进行AI通信。

上述实施例中，终端设备向网络设备发送其AI能力信息后，网络设备可以对终端设备的AI能力和AI模型的复杂度进行评估，并确定配置信息。

图4示例性给出一种网络设备进行AI能力和AI模型匹配度评估的方法流程图。如图4所示，终端设备获取AI能力信息之前，步骤S401中，终端设备和网络设备可以获取参考AI单元信息。

如前文所述，该参考AI单元信息可以是提前标准化的或者离线指定的，并向网络设备和终端设备公开。

示例性地，可以事先标准化或离线制定AI参考表格，其中，该AI参考表格可以包括N个参考AI单元(例如：AI模型、AI模块或AI算子)的名称或编号或索引，以及该N个参考AI单元的结构描述参数，其中，该N个参考AI单元的结构描述参数也可以通过引用参考文献或链接的方式提供。通过AI参考表格，网络设备和终端设备可以统一理解N个参考AI单元的网络结构。可选地，每个AI单元的具体权重系数值(权值)可以不定义、或者预定义、或者为随机数。该AI参考表格提前向终端设备和网络设备公开。具体地，步骤S301中，终端设备执行的至少一个参考AI单元，可以是该N个参考AI单元中的K个参考AI单元，其中，N为正整数，K为不大于N的正整数。

S402：网络设备获取M个AI模型的相似度信息。其中，M为正整数。

可选地，该M个AI模型可以是网络设备或其他设备中预先存储的，或者，该M个AI模型是网络设备从其他设备获取的，或者，该M个AI模型是网络设备通过已有的AI模型转化或生成的。

具体地，网络设备获取该M个AI模型与上述K个参考AI单元的M组相似度信息。

一种实现方式中，该M个AI模型包括第一AI模型，该K个参考AI单元包括第一参考AI单元。该第一AI模型对应的相似度信息为上述M组相似度信息中的第一组相似度信息，该第一组相似度信息包括第一相似度信息，第一相似度信息与第一比例和/或第二比例相关联，其中，第一比例为第一AI模型中与第一参考AI单元相同的层的总数量占第一AI模型总层数的比例，第二比例为第一AI模型中与第一参考AI单元相同的层的总计算量占第一AI模型总计算量的比例。

也就是说，该M组相似度信息包括：M个AI模型对应的M组相似度信息。该第一AI模型对应的第一组相似度信息包括：第一AI模型与K个AI参考单元对应的K个相似度信息。

表1示意出了一种常见的神经网络模型，残差神经网络(residual neural network，ResNet)模型。AI模型可以包括AI模块，例如，表1所示ResNet-34模型包括AI模块

进一步地，AI模块又可以包括AI算子，例如，AI模块

包括AI算子[3×3,64](一种卷积操作算子)。

表1：ResNet神经网络模型

例如，以第一AI模型为ResNet-50模型(即50层的ResNet模型)为例，当第一参考AI单元为模型，例如表1所示的ResNet-34模型时，由于ResNet-50模型和ResNet-34模型中相同的层为三层[3×3,64]、四层[3×3,128]、六层[3×3,256]、三层[3×3,512]以及[7×7,64,stride2]、[3×3max pool,stride 2]，一共18层，相同的层数占ResNet-50模型总层数的比例为18/50＝9/25，即第一比例为9/25。当第一参考AI单元为模块，例如为模块

时，ResNet-50模型中包含6个该模块，一共18层，占ResNet-50模型总层数的比例为18/50＝9/25，即第一比例为9/25。当第一参考AI单元为算子，例如为算子[3×3,256]时，ResNet-50模型和该算子相同的层为[3×3,256]，一共6层，相同的层所占的比例为6/50＝3/25，即第一比例为3/25。同理，以这些相同层的总计算量(以FLOP为单位)除以ResNet-50模型的总计算量3.8×10 ⁹FLOPs即可得到第二比例。

另一种实现方式中，该M个AI模型包括第一AI模型，该K个参考AI单元包括第一参考AI单元。该第一AI模型对应的相似度信息为上述M组相似度信息中的第一组相似度信息，该第一组相似度信息包括第一相似度信息，第一相似度信息与第一比例和/或第二比例相关联，其中，第一比例为第一AI模型中与第一参考AI单元相同的单元的总层数占第一AI模型总层数的比例，第二比例为第一AI模型中与第一参考AI单元相同的单元的总计算量占第一AI模型总计算量的比例。

例如，同样以第一AI模型为表1所示ResNet-50模型为例，当第一参考AI单元为模型，例如表1所示的ResNet-34模型时，由于ResNet-50模型与ResNet-34模型不一样，即第一AI模型中没有与第一参考AI单元相同的单元，此时，第一比例为0。当第一参考AI单元为模块，例如为模块

时，ResNet-50模型中包括的该模块的数量为3，此时，第一比例为3×3/50＝9/50。当第一参考AI单元为模块，例如为模块

时，ResNet-50模型中包括的该模块的数量为0，此时，第一比例为0。当第一参考AI单元为算子，例如为算子[3×3,64]，ResNet-50模型中包括的该算子的数量为3，此时，第一比例为3/50。

可选地，网络设备可以进行本地计算，进而获取M个AI模型的相似度信息。或者，该计算过程也可以在其他设备中完成，进而，网络设备可以其他设备获取该计算结果。

S403：网络设备进行AI能力与AI模型匹配度评估。

在前述的步骤S302之后，即网络设备接收终端设备发送的AI能力信息之后，网络设备可以基于步骤S302中收到的AI能力信息，评估终端设备的AI能力和M个AI模型的匹配情况。

一些实施例中，网络设备可以通过类比评估获得M个模型在该终端设备中执行的预期完成时间、预期功耗、或预期使用的资源比例中的一种或多种。例如，当相似度用前述第一比例表示时，假设第一AI模型的总层数为L0，在步骤S402中，假设网络设备得到的第一AI模型与参考AI模型K1的相似度为S1，第一AI模型与参考AI模块K2的相似度为S2，第一AI模型与参考AI算子K3的相似度为S3。步骤S401中，终端设备和网络设备可以获知：K1、K2、K3的总层数分别为L1、L2、L3(L3＝1，算子的层数为1)。步骤S302中，终端设备给网络设备的AI能力信息中，包括终端设备执行上述参考AI模型、参考AI模块、参考AI算子的完成时间分别为t ₁、t ₂和t ₃。则网络设备可以评估终端设备执行该第一AI模型的预期完成时间为

当相似度用前述第二比例表示时，L0、L1、L2、L3可以表示总计算量，网络设备同样可以采用类似方案获得上述结果，此处不再赘述。网络设备评估终端设备执行该第一AI模型所消耗的预期能量和预期使用的资源比例的方法同样可以采用类比评估获得，此处不再赘述。

应理解，上述描述是网络设备进行终端设备AI能力与AI模型匹配度评估的一种示例性方法，另一些实施例中，网络设备可以通过M个模型以及参考AI单元的详细结构，进行更精细的分析，获取更为准确的评估结果，本申请对此不予限定。

基于上述评估获得的预期完成时间、预期功耗、或预期使用的资源比例中的一种或多种，以及前述终端设备发送的用于执行AI模型的时间上限值信息、能耗上限值信息、或资源使用情况信息中的一种或多种，网络设备可以判断该M个模型与终端设备的AI能力是否匹配。例如，如果M个模型中的第一AI模型的预期完成时间不超过终端设备的时间预算要求，且预期消耗能量不超过终端设备的能量消耗限制，且预期消耗的资源比例不超过终端设备的资源比例限制，即可确定该第一AI模型与终端设备的AI能力相匹配。

进一步地，如前文步骤S303所述，网络设备可以向终端设备发送配置信息。

步骤S303中，当配置信息指示至少一个AI模型，或配置信息指示至少一个AI模型的配置参数，或配置信息指示至少一个AI模型的获取方法时，网络设备向终端设备发送配置信息之前，网络设备根据AI能力信息确定至少一个AI模型。具体地，一种情况是，网络设备只有一个面向当前应用的AI模型，如果该AI模型与终端设备AI能力相匹配，则该AI模型即为网络设备确定的AI模型；另一种情况是，网络设备有多于一个面向当前应用的AI模型，网络设备可以从与终端设备AI能力相匹配的AI模型中选择至少一个AI模型发送或配置给该终端设备，其中，网络设备的选取原则可以为预期完成时间最短、预期消耗能量最少、预期使用的资源比例最小、或者随机原则。可以理解地，网络设备如果能够确定至少一个AI模型，则认为网络设备可以启动AI模式。

步骤S303中，当配置信息指示至少一个AI模型的获取方法时，具体地，网络设备可以指示至少一个AI模型的下载地址或获取地址。如前所述，该M个AI模型可以是其他设备(例如：第三设备)中预先存储的，此时，网络设备可以指示终端设备从第三设备中获取该至少一个AI模型。

需要说明的是，图4所示实施例中，步骤S301、S302及S303的具体实现过程可以参见图3所示实施例中的相关表述，在此不予赘述。上述实施例中，终端设备将执行参考AI模型、AI模块或AI算子获取的数据作为AI能力信息发送给网络设备，可以准确地表示终端设备的AI能力，使网络设备获得更准确的评估结果，进而决定是否开启AI通信或者下发AI模型。

下面以基于AI的CSI反馈方案为例，对本申请实施例进行简要说明。

网络设备和终端设备可以先获取参考AI单元，基于该参考AI单元，终端设备可以获取如步骤S301所述的AI能力信息，网络设备可以获取如步骤S402所述的AI模型相似度信息，接着，终端设备可以将其获取的AI能力信息发送给网络设备，以便网络设备根据进行AI能力与AI模型匹配度评估，评估完成后，网络设备可以向终端设备发送合适的AI编码器。终端设备接收该AI编码器后，可以使用该AI编码器对CSI进行编码，并将编码后的信息发送给网络设备。然后，网络设备可以使用AI编码器对应的AI解码器对终端设备编码后的信息进行解码，以得到恢复后的信息。

本申请实施例还提供了一种AI通信方法，适用于图1所示的通信系统。如图5所示，该方法可以包括但不限于以下步骤：

S501：网络设备向终端设备发送AI模型信息，相应地，终端设备接收网络设备发送的AI模型信息。其中，该AI模型信息可以指示M个AI模型中每个AI模型的复杂度信息。

示例性地，M个AI模型中每个AI模型的复杂度信息可以用相似度数据来表示。例如，该AI模型信息指示M个AI模型对应的M组相似度信息(或称相似度数据)，该M组相似度信息中的每组相似度信息为M个AI模型中的一个AI模型与K个参考AI单元的相似度信息，其中，该K个参考AI单元属于N个参考AI单元，M和N为正整数，K为小于等于N的正整数。

例如，当M＝3、K＝5时，该AI模型信息包括3个AI模型(Q1、Q2和Q3)对应的3组相似度信息(第1组相似度信息、第2组相似度信息、第3组相似度信息)，其中，第1组相似度信息为AI模型Q1与5个参考AI单元的相似度信息，第2组相似度信息为AI模型Q2与5个参考AI单元的相似度信息，第3组相似度信息为AI模型Q3与5个参考AI单元的相似度信息。

示例性地，该N个参考AI单元可以是提前标准化的或者离线指定的，并向网络设备和终端设备公开。例如，该N个参考AI单元可以是AI参考表格中的，AI参考表格的具体内容可以参见上文表述。

另一种实现方式中，该M个AI模型包括第一AI模型，该K个参考AI单元包括第一参考AI单元。该第一AI模型对应的相似度信息为上述M组相似度信息中的第一组相似度信息，该第一组相似度信息包括第一相似度信息，第一相似度信息与第一比例和/或第二比例相关联，其中，第一比例为第一AI模型中与第一参考AI单元相同的单元的总层数占第一AI模型总层数的比例，第二比例为第一AI模型中与第一参考AI单元相同的层的总计算量占第一AI模型总计算量的比例。关于相似度信息的具体示例可以参见上文相关表述，此处不再赘述。

可选地，该M个AI模型对应的M组相似度信息可以使用实际数值、近似数值、等级、或者范围表示。例如，上述第一相似度信息可以为第一相似度数值、第一相似度等级、或第一相似度范围。

一种实现方式中，网络设备可以在本地计算得到上述M组相似度信息。另一种实现方式中，计算M组相似度信息的过程可以在第三设备(例如：其他网络设备或第三方服务器)完成，网络设备可以从第三设备中获取该M组相似度信息。

可选地，网络设备发送的AI模型信息可以包括以下至少一种：网络设备或第三设备执行上述M个AI模型中每个AI模型时使用的输入数据的数值精度；该M个AI模型中每个AI模型的权值(或称权重、系数)的数值精度；网络设备或第三设备执行M个AI模型中每个AI模型时的运算精度。

可选地，网络设备发送的AI模型信息还可以包括该M个AI模型中每个AI模型各自的总层数、总计算量。可以理解，通过获取该M个AI模型更详细的信息，终端设备可以更准确地评估该M个AI模型的复杂度。

不同的应用场景下，执行AI模型的时间预算信息有所差别。进一步地，上述AI模型信息还可以包括执行AI模型的时间上限值，也即，执行待下发AI模型的时间预算信息，即需要在多长时间内执行完AI模型。可以理解地，时间上限值或称为时间上限、最大时间、或最大时间要求。

需要说明的是，上述AI模型信息中包括的信息可以在同一信令中，可以包括在不同信息中。当上述AI模型信息中包括的信息在同一信令中时，网络设备可以一次性将上述AI模型信息发送给终端设备。当上述AI模型信息中包括的信息在不同信令中时，网络设备可以一次或多次将上述AI模型信息发送给终端设备。

S502：终端设备向网络设备发送反馈信息。相应地，网络设备接收终端设备发送的反馈信息。

示例性地，该反馈信息可以满足以下一项或多项：该反馈信息可以用于请求启动AI通信模式。或者，该反馈信息可以包括或指示上述M个AI模型中至少一个AI模型的评估结果。或者，该反馈信息可以请求网络设备向终端设备发送至少一个AI模型，其中，该至少一个AI模型属于上述M个AI模型。

在一种实施方式中，如图5所示，在前述的步骤S501之前，也就是网络设备向终端设备发送AI模型信息之前，该方法还包括：

S500：网络设备获取该AI模型信息。

如上所述，网络设备可以在本地计算得到上述M组相似度信息，从而获取该AI模型信息。或者，网络设备可以从第三设备中获取该M组相似度信息。

在一种实施方式中，如图5所示，在前述的步骤S502之后，也就是终端设备向网络设备发送反馈信息之后，该方法还包括：

S503：网络设备向终端设备发送配置信息。相应地，终端设备接收网络设备发送的配置信息。其中，该配置信息是上述反馈信息的响应信息。

具体地，该配置信息可以满足以下一项或多项：该配置信息可以指示终端设备启动AI模式，进一步地，终端设备和网络设备之间可以进行AI通信。或者，该配置信息可以指示至少一个AI模型，进一步地，终端设备和网络设备之间可以使用该至少一个AI模型进行AI通信。又或者，该配置信息可以指示至少一个AI模型的获取方法，例如，该配置信息可以指示至少一个AI模型的下载地址或获取地址。其中，该至少一个AI模型是根据上述反馈信息确定的。

当配置信息指示至少一个AI模型的获取方法时，如前所述，该M个AI模型可以是其他设备(例如：第三设备)中预先存储的，此时，网络设备可以指示终端设备从第三设备中获取该至少一个AI模型。

可以理解，网络设备接收终端设备发送的上述反馈信息后，也可以不做响应。

在一种实施方式中，在前述的步骤S501之前，也就是网络设备向终端设备发送AI模型信息之前，该方法还包括：终端设备向网络设备发送请求信息，该请求信息用于请求网络设备向终端设备发送上述AI模型信息。

上述实施例中，网络设备向终端设备发送M个AI模型的M组相似度信息后，终端设备可以对该M个AI模型进行复杂度评估，进而确定该M个AI模型与终端设备的AI能力的匹配情况。

上述实施例中，在前述的步骤S502之前，也就是终端设备向网络设备发送反馈信息之前，该方法还包括：终端设备根据步骤S501中收到的AI模型信息和该终端设备的AI能力信息确定反馈信息。下面通过具体实施例示例性介绍详细介绍一种终端设备确定反馈信息的方法。

图6示例性给出一种终端设备进行AI能力和AI模型匹配度评估的方法流程图。如图6所示，网络设备在获取AI模型信息之前，步骤S601中，网络设备和终端设备可以获取参考AI单元信息。

S602：终端设备获取参考AI单元信息后，获取AI能力信息。

其中，步骤S601中网络设备和终端设备获取参考AI单元信息的具体实现可以参考前述实施例步骤S401中的表述，步骤S602中终端设备获取AI能力信息的具体实现可以参考前述实施例步骤S301中的表述，在此不再赘述。

S603：终端设备进行AI能力与模型匹配度评估。

在前述的步骤S501之后，即终端设备接收到网络设备发送的AI模型信息之后，终端设备可以基于步骤S501中收到的AI模型信息，评估终端设备的AI能力和M个AI模型的匹配情况。

与前述实施例类似，终端设备同样可以通过类比评估获得M个模型在该终端设备中执行的预期完成时间、预期功耗、或预期使用的资源比例中的一种或多种。例如，当相似度用前述第一比例表示时，在步骤S501中，网络设备发送给终端设备的AI模型信息中包括第一AI模型的总层数为L0，及相似度信息：第一AI模型与参考AI模型K1的相似度为S1，第一AI模型与参考AI模块K2的相似度为S2，第一AI模型与参考AI算子K3的相似度为S3。步骤S601中，终端设备和网络设备可以获知：K1、K2、K3的总层数分别为L1、L2、L3(L3＝1，算子的层数为1)。步骤S602中，终端设备得到执行上述参考AI模型、参考AI模块、参考AI算子的完成时间分别为t ₁、t ₂和t ₃。则终端设备可以评估其执行该第一AI模型的预期完成时间为

当相似度用前述第二比例表示时，L0、L1、L2、L3可以表示总计算量，网络设备同样可以采用类似方案获得上述结果，此处不再赘述。终端设备评估其执行该第一AI模型所消耗的预期能量和预期使用的资源比例的方法同样可以采用类比评估获得，此处不再赘述。

基于上述评估的预期完成时间、预期功耗、或预期使用的资源比例中的一种或多种，以及前述网络设备发送的用于执行AI模型的时间上限值(即时间预算信息)，终端设备可以判断该M个模型与其AI能力是否匹配。例如，如果M个模型中的第一AI模型的预期完成时间不超过终端设备的时间预算要求，且预期消耗能量不超过终端设备的能量消耗限制，且预期消耗的资源比例不超过终端设备的资源比例限制，终端设备即可确定该第一AI模型与终端设备的AI能力相匹配。其中，终端设备的时间预算要求可以是前述网络设备发送的终端设备用于执行AI模型的时间预算信息，也可以是终端设备本地的时间预算要求；终端设备的能量消耗限制可以是终端设备本地的能量消耗限制；终端设备的资源比例限制可以是终端设备本地的资源比例限制。

进一步地，终端设备可以向网络设备发送反馈信息。例如，步骤S502中，该反馈信息可以指示至少一个AI模型，具体地，终端设备可以从与其AI能力相匹配的模型中选择至少一个AI模型，并通过反馈信息申请网络设备发送该模型，终端设备的选取原则可以为预期完成时间最短、预期消耗能量最少、预期使用的资源比例最小、或者随机原则。

需要说明的是，图6所示实施例中，步骤S500、S501、S502及S503的具体实现过程可以参见图5所示实施例中的相关表述，在此不予赘述。

上述实施例中，网络设备将待下发的AI模型的复杂度传递给终端设备后，终端设备可以更加简便、高效、准确地评估待下发的AI模型与终端设备的AI能力的匹配情况，进而确定是否请求启动AI模型或请求下发的AI模型，可以提高终端设备对AI能力和AI模型匹配度评估的准确度和效率。

通过本申请实施例提供的方法，终端设备可以向网络设备发送其AI能力信息，以便网络设备准确高效地评估AI模型与终端设备的AI能力的匹配情况，或者，网络设备可以向终端设备发送AI模型信息，以便终端设备准确高效地评估AI模型与其AI能力的匹配情况。此外，本申请实施例提供的方法无需引入额外的服务器设备和交互协议，即可实现终端设备和网络设备之间的AI能力和AI模型匹配度评估。

可以理解的是，为了实现上述实施例中功能，网络设备和终端设备包括了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本申请中所公开的实施例描述的各示例的单元及方法步骤，本申请能够以硬件或硬件和计算机软件相结合的形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用场景和设计约束条件。

图7和图8为本申请的实施例提供的可能的通信装置的结构示意图。这些通信装置可以用于实现上述方法实施例中终端设备或网络设备的功能，因此也能实现上述方法实施例所具备的有益效果。在本申请的实施例中，该通信装置可以是终端设备或网络设备，还可以是应用于终端设备或网络设备的模块(如芯片)。

如图7所示，通信装置700包括收发单元701和处理单元702。处理单元702用于调用收发单元701接收其他通信装置的信息或者向其他通信装置发送信息。收发单元701还可以进一步包括接收单元和发送单元，接收单元用于接收其他通信装置的信息，发送单元用于向其他通信装置发送信息。通信装置700用于实现上述图3、图4、图5、图6所示的方法实施例中终端设备或网络设备的功能。其中图4实施例是基于图3实施例的，图6实施例是基于图5实施例的。以下以图3实施例和图5实施例进行举例，说明收发单元701和处理单元702分别执行的操作，其它实施例中两个单元执行的操作可以参考方法实施例得到。

当通信装置700用于实现图3所示的方法实施例中终端设备的功能时：收发单元701，用于向网络设备发送AI能力信息，该AI能力信息包括终端设备执行至少一个参考AI单元中每个参考AI单元的时间和/或能耗；处理单元702，用于获取该AI能力信息。当通信装置700用于实现图3所示的方法实施例中网络设备的功能时：收发单元701，用于接收终端设备发送的AI能力信息，该AI能力信息包括终端设备执行至少一个参考AI单元中每个参考AI单元的时间和/或能耗；收发单元701，还用于向终端设备发送配置信息，其中，该配置信息指示终端设备启动AI模式，或，该配置信息指示至少一个AI模型，或，该配置信息指示至少一个AI模型的配置参数，或，该配置信息指示至少一个AI模型的获取方法，其中，至少一个AI模型是根据AI能力信息确定的。

当通信装置700用于实现图5所示的方法实施例中终端设备的功能时：收发单元701，用于接收网络设备发送的AI模型信息，该AI模型信息包括M个AI模型对应的M组相似度信息，M组相似度信息中的每组相似度信息为M个AI模型中的一个AI模型与K个参考AI单元的相似度信息，其中，M和K为正整数；收发单元701，还用于根据AI模型信息向网络设备发送反馈信息。当通信装置700用于实现图5所示的方法实施例中网络设备的功能时：收发单元701，用于向终端设备发送AI模型信息，该AI模型信息包括M个AI模型对应的M组相似度信息，M组相似度信息中的每组相似度信息为M个AI模型中的一个AI模型与K个参考AI单元的相似度信息，其中，M和K为正整数；收发单元701，还用于接收终端设备发送的反馈信息，其中，该反馈信息是根据AI模型信息确定的。

有关上述收发单元701和处理单元702更详细的描述可以直接参考图3、图5所示的方法实施例中相关描述直接得到，这里不加赘述。

基于同一技术构思，如图8所示，本申请实施例还提供一种通信装置800。通信装置800包括接口电路801和处理器802。接口电路801和处理器802之间相互耦合。可以理解的是，接口电路801可以为收发器或输入输出接口。可选的，通信装置800还可以包括存储器803，用于存储处理器802执行的指令、或存储处理器802运行指令所需要的输入数据、或存储处理器802运行指令后产生的数据。

当通信装置800用于实现图3、图4、图5、图6所示的方法时，处理器802用于实现上述处理单元702的功能，接口电路801用于实现上述收发单元701的功能。

当上述通信装置为应用于终端设备的芯片时，该终端设备芯片实现上述方法实施例中终端设备的功能。该终端设备芯片从终端设备中的其它模块(如射频模块或天线)接收信息，该信息是网络设备发送给终端设备的；或者，该终端设备芯片向终端设备中的其它模块(如射频模块或天线)发送信息，该信息是终端设备发送给网络设备的。

可以理解的是，本申请的实施例中的处理器可以是中央处理单元(central processing unit，CPU)，还可以是其它通用处理器、数字信号处理器(digital signal processor，DSP)、专用集成电路(application specific integrated circuit，ASIC)、现场可编程门阵列(field programmable gate array，FPGA)或者其它可编程逻辑器件、晶体管逻辑器件，硬件部件或者其任意组合。通用处理器可以是微处理器，也可以是任何常规的处理器。

基于以上实施例，本申请实施例提供了一种通信系统，该通信系统可以包括上述实施例涉及的终端设备和网络设备等。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机程序，该计算机程序被计算机执行时，所述计算机可以实现上述方法实施例提供的下行调度方法。

本申请实施例还提供一种计算机程序产品，所述计算机程序产品用于存储计算机程序，该计算机程序被计算机执行时，所述计算机可以实现上述方法实施例提供的下行调度方法。

本申请实施例还提供一种芯片，包括处理器，所述处理器与存储器耦合，用于调用所述存储器中的程序使得所述芯片实现上述方法实施例提供的下行调度方法。

本申请实施例还提供一种芯片，所述芯片与存储器耦合，所述芯片用于实现上述方法实施例提供的下行调度方法。

本申请的实施例中的方法步骤可以通过硬件的方式来实现，也可以由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成，软件模块可以被存放于随机存取存储器(random access memory，RAM)、闪存、只读存储器(read-only memory，ROM)、可编程只读存储器(programmable ROM，PROM)、可擦除可编程只读存储器(erasable PROM， EPROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)、寄存器、硬盘、移动硬盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外，该ASIC可以位于网络设备或终端设备中。当然，处理器和存储介质也可以作为分立组件存在于网络设备或终端设备中。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机程序或指令。在计算机上加载和执行所述计算机程序或指令时，全部或部分地执行本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、网络设备、用户设备或者其它可编程装置。所述计算机程序或指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机程序或指令可以从一个网站站点、计算机、第一设备或数据中心通过有线或无线方式向另一个网站站点、计算机、第一设备或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是集成一个或多个可用介质的第一设备、数据中心等数据存储设备。所述可用介质可以是磁性介质，例如，软盘、硬盘、磁带；也可以是光介质，例如，数字视频光盘(digital video disc，DVD)；还可以是半导体介质，例如，固态硬盘(solid state drive，SSD)。

显然，本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请实施例的范围。这样，倘若本申请实施例的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

一种人工智能AI通信方法，其特征在于，包括：

第一设备获取AI能力信息，所述AI能力信息包括所述第一设备执行至少一个参考AI单元中每个参考AI单元的时间和/或能耗；

所述第一设备向第二设备发送所述AI能力信息。
根据权利要求1所述的方法，其特征在于，所述第一设备向第二设备发送AI能力信息之后，所述方法还包括：

所述第一设备接收所述第二设备发送的配置信息，其中，所述配置信息指示所述第一设备启动AI通信模式，或，所述配置信息指示至少一个AI模型，或，所述配置信息指示至少一个AI模型的配置参数，或，所述配置信息指示至少一个AI模型的获取方法。
根据权利要求1或2所述的方法，其特征在于，所述第一设备向第二设备发送AI能力信息之前，所述方法还包括：

所述第一设备接收来自所述第二设备的请求信息，所述请求信息用于请求所述第一设备向所述第二设备发送所述AI能力信息。
根据权利要求1至3中任一项所述的方法，其特征在于，所述第一设备向第二设备发送AI能力信息，包括：

所述第一设备周期性向所述第二设备发送所述AI能力信息；或

所述第一设备接入所述第二设备所在的网络时，所述第一设备向所述第二设备发送所述AI能力信息；或

所述第一设备与所述第二设备建立通信连接时，所述第一设备向所述第二设备发送所述AI能力信息；或

所述第一设备用于执行AI模型的计算资源改变时，所述第一设备向所述第二设备发送所述AI能力信息。
一种人工智能AI通信方法，其特征在于，包括：

第二设备接收第一设备发送的AI能力信息，所述AI能力信息包括所述第一设备执行至少一个参考AI单元中每个参考AI单元的时间和/或能耗。
根据权利要求5所述的方法，其特征在于，所述第二设备接收第一设备发送的AI能力信息之后，所述方法还包括：

所述第二设备向所述第一设备发送配置信息，其中，所述配置信息指示所述第一设备启动AI通信模式，或，所述配置信息指示至少一个AI模型，或，所述配置信息指示至少一个AI模型的配置参数，或，所述配置信息指示至少一个AI模型的获取方法。
根据权利要求6所述的方法，其特征在于，所述配置信息指示至少一个AI模型，或所述配置信息指示至少一个AI模型的配置参数，或所述配置信息指示至少一个AI模型的获取方法时，所述第二设备向所述第一设备发送配置信息之前，所述方法还包括：

所述第二设备根据所述AI能力信息确定所述至少一个AI模型。
根据权利要求5至7中任一项所述的方法，其特征在于，所述第二设备接收第一设备发送的AI能力信息之前，所述方法还包括：

所述第二设备向所述第一设备发送请求信息，所述请求信息用于请求所述第一设备向所述第二设备发送所述AI能力信息。
根据权利要求2或6所述的方法，其特征在于，所述配置信息是所述AI能力信息的响应信息。
根据权利要求1至9中任一项所述的方法，其特征在于，所述第一设备执行所述至少一个参考AI单元中第一AI参考单元的时间为第一时间数值、第一时间等级或第一时间范围，所述第一设备执行所述第一AI参考单元的能耗为第一能耗数值、第一能耗等级或第一能耗范围。
根据权利要求1至10中任一项所述的方法，其特征在于，所述AI能力信息包括以下一种或多种：

所述第一设备执行所述至少一个参考AI单元中每个参考AI单元使用的输入数据的数量；

所述第一设备执行所述至少一个参考AI单元中每个参考AI单元使用的输入数据的数值精度；

所述至少一个参考AI单元中每个参考AI单元的权值的数值精度；

所述第一设备执行所述至少一个参考AI单元中每个参考AI单元时的运算精度；

所述第一设备用于执行AI模型的时间上限值；

所述第一设备用于执行AI模型的能耗上限值；

所述第一设备用于执行AI模型的资源使用情况。
根据权利要求1至11中任一项所述的方法，其特征在于，所述第一设备执行所述至少一个参考AI单元中每个参考AI单元使用的资源为所述第一设备所有可用的计算资源。
一种第一设备，其特征在于，包括：一个或多个处理器和一个或多个存储器；

所述一个或多个存储器与所述一个或多个处理器耦合，所述一个或多个存储器用于存储计算机程序代码，所述计算机程序代码包括计算机指令，当所述一个或多个处理器执行所述计算机指令时，使得所述第一设备执行如权利要求1-4或权利要求9-12任一项所述的方法。
一种第二设备，其特征在于，包括：一个或多个处理器和一个或多个存储器；

所述一个或多个存储器与所述一个或多个处理器耦合，所述一个或多个存储器用于存储计算机程序代码，所述计算机程序代码包括计算机指令，当所述一个或多个处理器执行所述计算机指令时，使得所述第二设备执行如权利要求5-12任一项所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机可执行指令，所述计算机可执行指令在被所述计算机调用时用于使所述计算机执行上述权利要求1-12中任一项所述的方法。
一种包含指令的计算机程序产品，其特征在于，当所述计算机程序产品在计算机上运行时，使得所述计算机如执行权利要求1-12中任一项所述的方法。
一种芯片，其特征在于，所述芯片与存储器耦合，用于读取并执行所述存储器中存储的程序指令，以实现如权利要求1-12中任一项所述的方法。