WO2022184009A1

WO2022184009A1 - 量化的方法、装置、设备及可读存储介质

Info

Publication number: WO2022184009A1
Application number: PCT/CN2022/078241
Authority: WO
Inventors: 杨昂
Original assignee: 维沃移动通信有限公司
Priority date: 2021-03-04
Filing date: 2022-02-28
Publication date: 2022-09-09
Also published as: CN115037608A

Abstract

一种量化的方法、装置、设备及可读存储介质，该方法包括：确定第一通信设备的第一模块的量化策略、量化等级和/或量化配置参数，第一模块为AI模块；根据量化策略、量化等级和/或量化配置参数对第一模块的参数进行量化处理。

Description

量化的方法、装置、设备及可读存储介质

相关申请的交叉引用

本申请主张在2021年03月04日在中国提交的中国专利申请No.202110240917.9的优先权，其全部内容通过引用包含于此。

技术领域

本申请属于通信技术领域，具体涉及一种人工智能(Artificial Intelligence，AI)模块量化的方法、装置、设备及可读存储介质。

背景技术

人工智能目前在各个领域获得了广泛的应用。在通信网络中，可以通过AI模块实现人工智能。然而，目前尚无对AI模块量化的流程，造成AI模块的复杂度提升。

发明内容

本申请实施例提供一种量化的方法、装置、设备及可读存储介质，解决如何降低AI模块的复杂度的问题。

第一方面，提供一种量化的方法，由第一通信设备执行，包括：

确定所述第一通信设备的第一模块的量化策略、量化等级和/或量化配置参数，所述第一模块为人工智能AI模块；

根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。

第二方面，提供一种量化的装置，应用于第一通信设备，包括：

第一确定模块，用于确定所述第一通信设备的第一模块的量化策略、量化等级和/或量化配置参数，所述第一模块为AI模块；

量化模块，用于根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。

第三方面，提供一种通信设备，包括：处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序，所述程序被所述处理器执行时实现如第一方面所述的方法的步骤。

第四方面，提供一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。

第五方面，提供一种计算机程序产品，所述计算机程序产品被存储在非易失的存储介质中，所述程序产品被至少一个处理器执行以实现如第一方面所述的方法的步骤。

第六方面，提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法。

在本申请实施例中，通过量化策略、量化等级和/或量化配置参数对AI模块进行量化处理，从而可以降低AI模块的复杂度，提升系统性能。

附图说明

图1是本申请实施例可应用的一种无线通信系统的示意图；

图2是本申请实施例提供的量化的方法的流程图；

图3是本申请实施例提供的量化的装置的示意图；

图4为本申请实施例的终端的示意图；

图5为本申请实施例的网络侧设备的示意图。

具体实施方式

为了便于理解本申请实施例，下面先介绍以下技术点：人工智能。

人工智能目前在各个领域获得了广泛的应用。实现人工智能的AI模块有多种实现方式，例如神经网络、决策树、支持向量机、贝叶斯分类器等。

以神经网络为例，神经网络的参数通过优化算法进行优化。优化算法就是一种能够最小化或者最大化目标函数(有时候也叫损失函数)的一类算法。而目标函数往往是模型参数和数据的数学组合。例如给定数据X和其对应的标签Y，构建一个神经网络模型f(.)，有了模型后，根据输入x就可以得到预测输出f(x)，并且可以计算出预测值和真实值之间的差距(f(x)-Y)，这个就是损失函数。目的是找到合适的W,b使上述的损失函数的值达到最小，损失值越小，则说明模型越接近于真实情况。

目前常见的优化算法，基本都是基于误差反向传播(error Back Propagation，BP)算法。BP算法的基本思想是，学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时，输入样本从输入层传入，经各隐层逐层处理后，传向输出层。若输出层的实际输出与期望的输出不符，则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传，并将误差分摊给各层的所有单元，从而获得各层单元的误差信号，此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程，是周而复始地进行的。权值不断调整的过程，也就是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可接受的程度，或进行到预先设定的学习次数为止。

常见的优化算法有梯度下降(Gradient Descent)、随机梯度下降(Stochastic Gradient Descent，SGD)、小批量梯度下降(mini-batch gradient descent)、动量法(Momentum)、Nesterov(发明者的名字，具体为带动量的随机梯度下降)、自适应梯度下降(ADAptive GRADient descent，Adagrad)、自适应delta(ADAptive delta，Adadelta)、均方根误差降速(Root Mean Square prop，RMSprop)、自适应动量估计(Adaptive Moment Estimation，Adam)等。

这些优化算法在误差反向传播时，都是根据损失函数得到的误差/损失，对当前神经元求导数/偏导，加上学习速率、之前的梯度/导数/偏导等影响，得到梯度，将梯度传给上一层。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述指定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”所区别的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和”表示所连接对象的至少其中之一，字符“/”一般表示前后关联对象是一种“或”的关系。

值得指出的是，本申请实施例所描述的技术不限于长期演进型(Long Term Evolution，LTE)/LTE的演进(LTE-Advanced，LTE-A)系统，还可用于其他无线通信系统，诸如码分多址(Code Division Multiple Access，CDMA)、时分多址(Time Division Multiple Access，TDMA)、频分多址(Frequency Division Multiple Access，FDMA)、正交频分多址(Orthogonal Frequency Division Multiple Access，OFDMA)、单载波频分多址(Single-carrier Frequency-Division Multiple Access，SC-FDMA)和其他系统。本申请实施例中的术语“系统”和“网络”常被可互换地使用，所描述的技术既可用于以上提及的系统和无线电技术，也可用于其他系统和无线电技术。然而，以下描述出于示例目的描述了新空口(New Radio，NR)系统，并且在以下大部分描述中使用NR术语，这些技术也可应用于NR系统应用以外的应用，如第6代(6 ^th Generation，6G)通信系统。

图1示出本申请实施例可应用的一种无线通信系统的框图。无线通信系统包括终端11和网络侧设备12。其中，终端11也可以称作终端设备或者用户终端(User Equipment，UE)，终端11可以是手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)或称为笔记本电脑、个人数字助理(Personal Digital Assistant，PDA)、掌上电脑、上网本、超级移动个人计算机(Ultra-Mobile Personal Computer，UMPC)、移动上网装置(Mobile Internet Device，MID)、可穿戴式设备(Wearable Device)或车载设备(VUE)、行人终端(PUE)等终端侧设备，可穿戴式设备包括：手环、耳机、眼镜等。需要说明的是，在本申请实施例并不限定终端11的具体类型。网络侧设备12可以是基站或核心网侧设备，其中，基站可被称为节点B、演进节点B、接入点、基收发机站(Base TransceiverStation，BTS)、无线电基站、无线电收发机、基本服务集(BasicServiceSet，BSS)、扩展服务集(ExtendedServiceSet，ESS)、B节点、演进型B节点(eNB)、家用B节点、家用演进型B节点、WLAN接入点、WiFi节点、发送接收点(Transmitting Receiving Point，TRP) 或所述领域中其他某个合适的术语，只要达到相同的技术效果，所述基站不限于指定技术词汇，需要说明的是，在本申请实施例中仅以NR系统中的基站为例，但是并不限定基站的具体类型。

下面结合附图，通过一些实施例及其应用场景对本申请实施例提供的一种量化的方法、装置、设备及可读存储介质进行详细地说明。

参见图2，本申请实施例提供一种量化方法，该方法的执行主体可以是第一通信设备，包括：

步骤201：确定所述第一通信设备的第一模块的量化策略、量化等级和/或量化配置参数，所述第一模块为AI模块；

步骤202：根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。

上述量化策略也可以称为量化方法，是指采用哪种方式对AI模块的参数进行量化处理。

上述量化等级可以表示AI模块的参数量化的精确度，比如，量化等级越高，AI模块的参数越精确，越接近原始参数；量化等级越低，AI模块的参数越粗糙，越远离原始参数。例如，量化等级按比特划分，量化等级X比特代表AI模块的参数量化为X比特，那么当X的值越大，则AI模块的参数占据的比特数越多，其中X为正整数。目前计算机中常见的单精度类型(float型)占据32比特，双精度型(double型)占据64比特，实际也是一种很高精度的量化。

上述量化配置参数用于表示对AI模块进行量化的配置，比如量化配置参数包括以下一项或多项：该AI模块采用何种量化策略以及该量化策略的细节如何配置、该AI模块的所有参数是否采用统一的量化等级、该AI模块的乘性系数的量化等级与加性系数的量化等级是否相同、该AI模块的量化等级是多少、该AI模块的参数量化采用多少比特等等。

例如，量化等级配置为8比特，量化策略为直接量化法，则AI模块的所有参数从浮点数均量化为8比特，假设AI模块为神经网络，则所有神经元的乘性系数与加性系数均量化为8比特。

在本申请的一种实施方式中，所述量化策略可以包括以下一项或多项：

(1)直接量化法；

上述直接量化法是指直接根据量化等级和/或量化配置参数，对AI模块的各项参数进行量化。

(2)均匀量化(Uniform quantization)法；

上述均匀量化法是指把AI模块的参数(例如输入参数的取值域)等间隔分割的量化法。

(3)非均匀量化法；

上述非均匀量化法是AI模块的参数(例如输入参数)的动态范围内量化间隔不相等的量化法。

比如，根据输入的概率密度、概率分布、累积概率分布等，确定输入的不同区间的量化间隔/量化等级。例如，对于输入取值小的区间，其量化间隔也小；反之，对于输入取值大的区间，量化间隔就大。

(4)权值共享量化法；

(5)分组量化法；

在权值共享量化法和分组量化法中，可以将AI模块的参数划分到多个集合，每个集合中的元素共享一个值。

(6)变换域量化法；

变换域量化法是指将AI模块的参数(比如权值、偏置、卷积核等)变换到另一个域，例如频域、S域、Z域等，在另一个域进行量化操作，然后再反变换回来。

示例性地，首先将网络卷积核变换到频率域，然后在频率域进行随机哈希，并且对不太重要的高频部分使用更低的哈希位数，以实现更高的压缩。

(7)参数编码量化法；

参数编码量化法是指对AI模块的参数进行编码，编码的方式包括但不限于：有损编码、无损编码(例如霍夫曼编码)等。

(8)乘积量化(Product Quantization)法。

乘积量化法是指把网络权值划分成多个子空间，并在每个子空间上进行量化操作，比如在每个子空间上进行权值共享量化法。

可选地，上述多种量化策略可以进行级联或组合。示例性地，所述量化策略包括：均匀量化法、权值共享量化法和参数编码量化法，首先通过所述均匀量化法对网络进行均匀量化，然后对均匀量化后的权值使用权值共享量化法再进行量化，再对权值进行根据参数编码量化法进行量化处理。

在本申请的一种实施方式中，所述对所述第一模块的参数进行量化处理的步骤包括：

在网络训练阶段，根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。

比如，使用普通的梯度计算方法得到每个权重所对应的梯度，根据之前的权重分组，将同一组的权重梯度值进行累加，得到聚类中心这一轮网络训练中的更新量，聚类中心值减去更新量与学习率的乘积，就得到本轮训练更新后的聚类中心。

在本申请的一种实施方式中，所述分组量化法中的参数划分方式包括：

(1)随机划分方式；

在随机划分方式中，可以按照随机的方式对AI模块的参数进行分组。

(2)根据所述参数的标识确定所述参数所在的集合标识；

上述方式(2)也可以称为直接定址法。比如，将AI模块的参数排序，定好各自的参数的ID，然后将参数ID输入线性函数或N次函数或其它常见函数，得到新的值X，通过X得到该网络参数所在的集合ID。其中，线性函数包括输出等于输入的函数。

在本申请的一种实施方式中，所述根据所述参数的标识确定所述参数所在的集合标识，包括：

根据所述参数的标识，得到第一数值；

根据所述第一数值，确定所述参数所在的集合标识；

其中，根据所述第一数值，确定所述参数所在的集合标识包括以下一项或多项：

(a)将所述第一数值取整，得到所述参数所在的集合标识；

(b)从所述第一数值中取其中至少一位，组合为所述参数所在的集合标识；

(c)将所述第一数值除以预设值，将得到的余数作为所述参数所在的集合标识。

可选地，将所述参数的标识参数输入线性函数或其它常见数学函数，得到第一数值(X)。常见数学函数包括加减乘数、N次方、N次开根号、对数、求导、求偏导等各种常见数学操作的组合。N为任意数，例如，N可以为正数或负数或0，实数或复数。

可选地，通过X得到该网络参数所在的集合ID的方式包括：

a)X取整，即为集合ID。取整包括向上取整，向下取整或四舍五入等方式。例如，X为3.23，则集合ID可以为3或4，其中3代表向下取整或四舍五入，4代表向上取整。

b)X取其中至少一位，组合为集合ID。

例如，X为3215217，取从前面数第2位和第4位，集合ID为25，或从后面数第1位和第3位，集合ID为72或27。

又例如，X为872351.1237，取小数点后第1位和第2位，集合ID为12或21，或取小数点前第1位和第2位，集合ID为51或15，或取小数点前第2位和小数点后第3位，集合ID为53或35。

示例性地：

(i)取至少二位，则这些位上的数值按一定规律排列，成为集合ID。

例如，按位数从前往后，或位数从后往前，或按数值从大到小，或数值从小到大。比如，X为67429815，取从前往后数第1位、第3位、第5位，则这些位上的数值为5、8、2，按位数从前往后，则集合ID为285；按位数从后往前，则集合ID为582；若按数值从大到小，则集合ID为852；若按数值从小到大，则集合ID为258。

(ii)若某一位没有，则该位的数值为0，或其它默认值。

例如X为52，取从前往后数第1位、第3位、第5位，则相应位上的数值为5、0、0。

c)X除某个数，取余。

例如，X为752，某个数为11，则集合ID为4＝752mod(11)。

d)根据X，随机划分集合ID。

(3)聚类划分方式。

聚类划分方式中按照聚类中心对AI模块的参数进行分组。

比如，预先将数据分为K组，则随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类，没有(或最小数目)聚类中心再发生变化，误差平方和局部最小。

在本申请的一种实施方式中，所述量化策略和/或量化配置参数根据以下一项或多项确定：

(1)终端上报；

也就是，网络侧可以根据终端上报的方式获取量化策略和/或量化配置参数。

(2)终端的能力；

也就是，可以将量化策略和/或量化配置参数作为终端的能力。

(3)网络侧配置。

也就是，终端侧可以根据网络侧的配置获取量化策略和/或量化配置参数。

比如，网络侧通过无线资源控制(Radio Resource Control，RRC)、媒体接入控制控制单元(Media Access Control Control Element，MAC CE)或者下行控制信息(Downlink Control Information，DCI)来进行配置、激活或触发。

在本申请的一种实施方式中，所述量化策略为直接量化法，所述根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理的步骤包括：

根据所述第一模块的量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。

在本申请的一种实施方式中，所述量化等级根据以下一项或多项确定：

(1)所述第一模块的参数的相关信息；

可选地，所述第一模块的参数的相关信息包括：所述参数的大小；

比如，所述参数越大，所述量化等级越高；或者，所述参数越大，所述量化等级越低。

又比如，所述参数越小，所述量化等级越低，或者，所述参数越小，所述量化等级越高。

也就是，可以根据AI模块的参数的大小，确定不同的量化等级。比如，AI模块的参数越大，量化地越精细；AI模块的参数越小，量化地越粗糙。或者，AI模块的参数越大，量化地越粗糙；AI模块的参数越小，量化地越精细。

(2)终端上报；

也就是，网络侧可以根据终端上报的方式获取量化等级。

(3)终端的能力；

也就是，量化等级可以作为终端的能力。

(4)网络侧配置；

(5)所述第一模块的输出精度要求；

比如，AI模块的输出精度的要求越高，则量化等级越高。

(6)所述第一模块的性能要求。

比如，AI模块的性能要求分为多个等级，不同等级的性能要求对应不同的量化等级。

在本申请的一种实施方式中，所述量化等级越高，所述第一模块的参数量化的精确度越精确，或者，所述量化等级越低，所述第一模块的参数量化的精确度越粗糙。

在本申请的一种实施方式中，所述第一模块的类型为神经网络；

其中，所述神经网络中的不同层的神经元的量化等级相同；

和/或，

所述神经网络中的同一层的神经元的量化等级相同；

和/或，

所述神经网络中的乘性系数的量化等级与加性系数的量化等级相同。

其中，所述神经网络中的不同层的神经元的量化等级不相同；

和/或，

所述神经网络中的同一层的神经元的量化等级不相同；

和/或，

所述神经网络中的乘性系数的量化等级与加性系数的量化等级不相同。

在本申请的一种实施方式中，所述第一模块的类型为循环神经网络(Recurrent Neural Network，RNN)；

其中，所述循环神经网络中的记忆单元的参数(比如，乘性系数、加性系数)的量化等级，与所述循环神经网络中的非记忆神经元(包括神经元、非神经元的单位)的参数的量化等级相同、或与所述循环神经网络的神经元的非记忆参数的量化等级相同，

或者，

所述循环神经网络中的记忆单元的参数的量化等级，与所述循环神经网络中的非记忆神经元的参数的量化等级不相同、或与所述循环神经网络中的神经元的非记忆参数的量化等级不相同。

在本申请的一种实施方式中，所述第一模块的类型为卷积神经网络(Convolutional Neural Networks，CNN)；

其中，

所述卷积神经网络的卷积核的参数的量化等级，与所述卷积神经网络中的非卷积核的参数的量化等级相同或不相同，

或者，

所述卷积神经网络的池化的参数(乘性系数、加性系数)的量化等级，与所述卷积神经网络中的非池化的参数的量化等级相同或不相同。

在本申请的一种实施方式中，所述第一模块的输入或输出为第一信息；

其中，所述第一信息包括以下一项或多项：

(1)参考信号；

该参考信号用于信号处理，包括信号检测、滤波、均衡等，比如包括解调参考信号(Demodulation Reference Signal，DMRS)、探测参考信号(Sounding Reference Signal，SRS)、同步信号块(Synchronization Signal and PBCH block，SSB)、跟踪参考信号(Tracking Reference Signal，TRS)、相位跟踪参考信号(Phase-Tracking Reference Signal，PTRS)、信道状态信息参考信号(Channel State Information Reference Signal，CSI-RS)等。

(2)信道承载的信号；

该信道可以包括以下一项或多项：物理下行控制信道(Physical Downlink Control Channel，PDCCH)、物理下行共享信道(Physical Downlink Shared Channel，PDSCH)、物理上行链路控制信道(Physical Uplink Control Channel，PUCCH)、物理上行共享信道(Physical Uplink Shared Channel，PUSCH)、物理随机接入信道(Physical Random Access Channel，PRACH)、物理广播信道(Physical Broadcast Channel，PBCH)等。

(3)信道状态信息；

可选地，信道状态信息包括信道状态信息反馈信息和/或频分复用(Frequency Division Duplex，FDD)系统中的上下行部分互易性的信道状态信息。

其中，信道状态信息反馈信息包括以下一项或多项：信道相关信息、信道矩阵相关信息、信道特征信息、信道矩阵特征信息、预编码矩阵指示(Precoding matrix indicator，PMI)、秩指示(Rank Indicator，RI)、CSI-RS资源指示(CSI-RS Resource Indicator，CRI)、信道质量指示(Channel Quality Indicator，CQI)、层指示(Layer Indicator，LI)等。

对于FDD系统，根据部分互异性，基站根据上行信道获取角度和时延信息，可以通过CSI-RS预编码或者直接指示的方法，将角度信息和时延信息通知UE，UE根据基站的指示上报或者在基站的指示范围内选择并上报，从而减少UE的计算量和CSI上报的开销。

(4)波束信息；

波束信息包括以下一项或多项：波束质量、波束的指示信息(参考信号ID)、波束失败指示信息、波束失败恢复中的新波束指示信息。用于波束管理，包括波束测量、波束上报、波束预测、波束失败检测、波束失败恢复、波束失败恢复中的新波束指示。

(5)信道预测信息；

信道预测信息包括：信道状态信息的预测、波束预测。

(6)干扰信息；

干扰信息包括以下一项或多项：小区内干扰信息、小区间干扰信息、带外干扰信息、交调干扰信息等。

(7)定位信息(或者称为轨迹信息)；

通过参考信号(例如探测参考信号(Sounding Reference Signal，SRS)，估计出的UE的具体位置(包括水平位置和或垂直位置)或未来可能的轨迹，或辅助位置估计或轨迹估计的信息。

(8)高层业务和/或参数的预测信息；

(9)高层业务和/或参数的管理信息；

比如，预测信息或管理信息可以包括吞吐量、所需数据包大小、业务需求、移动速度、和/或噪声信息等

(10)控制信令。

比如，功率控制的相关信令，波束管理的相关信令。

在本申请的一种实施方式中，在所述第一模块的输出为第一信息的情况下，所述方法还包括：

发送所述第一信息至第二通信设备，或者发送所述第一信息至所述第一通信设备的第二模块。

其中，所述第一信息包括以下所述第一通信设备为终端，所述第二通信设备为网络侧设备，或者，所述第一通信设备为网络侧设备，所述第二通信设备为终端；或者，所述第一通信设备为第一终端和所述第二通信设备为第二终端；或者，所述第一通信设备为第一网络侧设备和所述第二通信设备为第二网络侧设备。

参见图3，本申请实施例提供一种量化的装置，应用于第一通信设备，该装置300包括：

第一确定模块301，用于确定所述第一通信设备的第一模块的量化策略、量化等级和/或量化配置参数，所述第一模块为AI模块；

量化模块302，用于根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。

在本申请的一种实施方式中，所述量化策略包括以下一项或多项：

(1)直接量化法；

(2)均匀量化法；

(3)非均匀量化法；

(4)权值共享量化法；

(5)分组量化法；

(6)变换域量化法；

(7)参数编码量化法；

(8)乘积量化法。

在本申请的一种实施方式中，所述量化策略包括：均匀量化法、权值共享量化法和参数编码量化法，其中，通过所述均匀量化法对网络进行均匀量化，然后对均匀量化后的权值使用所述权值共享量化法再进行量化，再对权值进行所述参数编码量化法。

在本申请的一种实施方式中，量化模块302进一步用于：在网络训练阶段，根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。

(1)随机划分方式；

(2)根据所述参数的标识确定所述参数所在的集合标识；

(3)聚类划分方式。

根据所述参数的标识，得到第一数值；

根据所述第一数值，确定所述参数所在的集合标识；

(1)将所述第一数值取整，得到所述参数所在的集合标识；

(2)从所述第一数值中取其中至少一位，组合为所述参数所在的集合标识；

(3)将所述第一数值除以预设值，将得到的余数作为所述参数所在的集合标识。

(1)终端上报；

(2)终端的能力；

(3)网络侧配置。

在本申请的一种实施方式中，所述量化策略为直接量化法，量化模块302进一步用于：根据所述第一模块的量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。

(1)所述第一模块的参数的相关信息；

(2)终端上报；

(3)终端的能力；

(4)网络侧配置；

(5)所述第一模块的输出精度要求；

(6)所述第一模块的性能要求。

在本申请的一种实施方式中，所述第一模块的参数的相关信息包括：所述参数的大小；其中，所述参数越大，所述量化等级越高，所述参数越小，所述量化等级越低；或者，所述参数越大，所述量化等级越低，所述参数越小，所述量化等级越高。

其中，所述神经网络中的不同层的神经元的量化等级相同；

和/或，

所述神经网络中的同一层的神经元的量化等级相同；

和/或，

所述神经网络中的同一层的神经元的量化等级不相同；

和/或，

在本申请的一种实施方式中，所述第一模块的类型为循环神经网络；

其中，所述循环神经网络中的记忆单元的参数的量化等级，与所述循环神经网络中的非记忆神经元的参数的量化等级相同、或与所述循环神经网络的神经元的非记忆参数的量化等级相同，

或者，

在本申请的一种实施方式中，所述第一模块的类型为卷积神经网络；

其中，

或者，

所述卷积神经网络的池化的参数的量化等级，与所述卷积神经网络中的非池化的参数的量化等级相同或不相同。

其中，所述第一信息包括以下一项或多项：

(1)参考信号；

(2)信道承载的信号；

(3)信道状态信息；

(4)波束信息；

(5)信道预测信息；

(6)干扰信息；

(7)定位信息；

(8)高层业务和/或参数的预测信息；

(9)高层业务和/或参数的管理信息；

(10)控制信令。

在本申请的一种实施方式中，在所述第一模块的输出为第一信息的情况下，所述装置还包括：

发送模块，用于发送所述第一信息至第二通信设备，或者发送所述第一信息至所述第一通信设备的第二模块。

在本申请的一种实施方式中，所述第一通信设备为终端，所述第二通信设备为网络侧设备，或者，所述第一通信设备为网络侧设备，所述第二通信设备为终端；或者，所述第一通信设备为第一终端，第二通信设备为第二终端；或者，所述第一通信设备为第一网络侧设备，所述第二通信设备为第二网络侧设备。

本申请实施例提供的装置能够实现图2所示的方法实施例实现的各个过程，并达到相同的技术效果，为避免重复，这里不再赘述。

图4为实现本申请实施例的一种终端的硬件结构示意图，该终端400包括但不限于：射频单元401、网络模块402、音频输出单元403、输入单元404、传感器405、显示单元406、用户输入单元407、接口单元408、存储器409、以及处理器410等部件。

本领域技术人员可以理解，终端400还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器410逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图4中示出的终端结构并不构成对终端的限定，终端可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

应理解的是，本申请实施例中，输入单元404可以包括图形处理器(Graphics Processing Unit，GPU)4041和麦克风4042，图形处理器4041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元406可包括显示面板4061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板4061。用户输入单元407包括触控面板4071以及其他输入设备4072。触控面板4071，也称为触摸屏。触控面板4071可包括触摸检测装置和触摸控制器两个部分。其他输入设备4072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

本申请实施例中，射频单元401将来自网络侧设备的下行数据接收后，给处理器410处理；另外，将上行的数据发送给网络侧设备。通常，射频单元401包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。

存储器409可用于存储软件程序或指令以及各种数据。存储器409可主要包括存储程序或指令区和存储数据区，其中，存储程序或指令区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外，存储器409可以包括高速随机存取存储器，还可以包括非易失性存储器，其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。

处理器410可包括一个或多个处理单元；可选的，处理器410可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序或指令等，调制解调处理器主要处理无线通信，如基带处理器。可以理解的是，上述调制解调处理器也可以不集成到处理器410中。

本申请实施例提供的终端能够实现图2所示的方法实施例实现的各个过程，并达到相同的技术效果，为避免重复，这里不再赘述。

本申请实施例还提供了一种网络侧设备。如图5所示，该网络侧设备500包括：天线501、射频装置502、基带装置503。天线501与射频装置502连接。在上行方向上，射频装置502通过天线501接收信息，将接收的信息发送给基带装置503进行处理。在下行方向上，基带装置503对要发送的信息进行处理，并发送给射频装置502，射频装置502对收到的信息进行处理后经过天线501发送出去。

上述频带处理装置可以位于基带装置503中，以上实施例中网络侧设备执行的方法可以在基带装置503中实现，该基带装置503包括处理器504和存储器505。

基带装置503例如可以包括至少一个基带板，该基带板上设置有多个芯片，如图5所示，其中一个芯片例如为处理器504，与存储器505连接，以调用存储器505中的程序，执行以上方法实施例中所示的网络设备操作。

该基带装置503还可以包括网络接口506，用于与射频装置502交互信息，该接口例如为通用公共无线接口(Common Public Radio Interface，CPRI)。

具体地，本申请实施例的网络侧设备还包括：存储在存储器505上并可在处理器504上运行的指令或程序，处理器504调用存储器505中的指令或程序执行图3所示各模块执行的方法，并达到相同的技术效果，为避免重复，故不在此赘述。

本申请实施例还提供一种计算机程序产品，所述计算机程序产品被存储在非易失的存储介质中，所述程序产品被至少一个处理器执行以实现如图2所述的处理的方法的步骤，且能达到相同的技术效果，为避免重复，这里不再赘述。

本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述图2所示方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的终端中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行网络侧设备程序或指令，实现上述图2所示方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片，系统芯片，芯片系统或片上系统芯片等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器或者网络设备等)执行本申请各个实施例所述的方法。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来控制相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、ROM或RAM等。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

一种量化的方法，由第一通信设备执行，其中，所述方法包括：

确定所述第一通信设备的第一模块的量化策略、量化等级和/或量化配置参数，所述第一模块为人工智能AI模块；

根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。
根据权利要求1所述的方法，其中，所述量化策略包括以下一项或多项：

直接量化法；

均匀量化法；

非均匀量化法；

权值共享量化法；

分组量化法；

变换域量化法；

参数编码量化法；

乘积量化法。
根据权利要求1所述的方法，其中，所述根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理的步骤包括：

在网络训练阶段，根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。
根据权利要求2所述的方法，其中，所述分组量化法中的参数划分方式包括：

随机划分方式；

根据所述参数的标识确定所述参数所在的集合标识；

聚类划分方式。
根据权利要求4所述的方法，其中，所述根据所述参数的标识确定所述参数所在的集合标识，包括：

根据所述参数的标识，得到第一数值；

根据所述第一数值，确定所述参数所在的集合标识；

其中，根据所述第一数值，确定所述参数所在的集合标识包括以下一项或多项：

将所述第一数值取整，得到所述参数所在的集合标识；

从所述第一数值中取其中至少一位，组合为所述参数所在的集合标识；

将所述第一数值除以预设值，将得到的余数作为所述参数所在的集合标识。
根据权利要求1所述的方法，其中，所述量化策略和/或量化配置参数根据以下一项或多项确定：

终端上报；

终端的能力；

网络侧配置。
根据权利要求2所述的方法，其中，所述量化策略为直接量化法，所述根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理的步骤包括：

根据所述第一模块的量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。
根据权利要求1所述的方法，其中，所述量化等级根据以下一项或多项确定：

所述第一模块的参数的相关信息；

终端上报；

终端的能力；

网络侧配置；

所述第一模块的输出精度要求；

所述第一模块的性能要求。
根据权利要求8所述的方法，其中，所述第一模块的参数的相关信息包括：所述参数的大小；

其中，所述参数越大，所述量化等级越高；或者，所述参数越大，所述量化等级越低。
根据权利要求1所述的方法，其中，所述量化等级越高，所述第一模块的参数量化的精确度越精确，或者，所述量化等级越低，所述第一模块的参数量化的精确度越粗糙。
根据权利要求1所述的方法，其中，所述第一模块的类型为神经网络；

其中，所述神经网络中的不同层的神经元的量化等级相同；

和/或，

所述神经网络中的同一层的神经元的量化等级相同；

和/或，

所述神经网络中的乘性系数的量化等级与加性系数的量化等级相同。
根据权利要求1所述的方法，其中，所述第一模块的类型为神经网络；

其中，所述神经网络中的不同层的神经元的量化等级不相同；

和/或，

所述神经网络中的同一层的神经元的量化等级不相同；

和/或，

所述神经网络中的乘性系数的量化等级与加性系数的量化等级不相同。
根据权利要求1所述的方法，其中，所述第一模块的类型为循环神经网络；

其中，所述循环神经网络中的记忆单元的参数的量化等级，与所述循环神经网络中的非记忆神经元的参数的量化等级相同、或与所述循环神经网络的神经元的非记忆参数的量化等级相同，

或者，

所述循环神经网络中的记忆单元的参数的量化等级，与所述循环神经网络中的非记忆神经元的参数的量化等级不相同、或与所述循环神经网络中的神经元的非记忆参数的量化等级不相同。
根据权利要求1所述的方法，其中，所述第一模块的类型为卷积神经网络；

其中，

所述卷积神经网络的卷积核的参数的量化等级，与所述卷积神经网络中的非卷积核的参数的量化等级相同或不相同，

或者，

所述卷积神经网络的池化的参数的量化等级，与所述卷积神经网络中的非池化的参数的量化等级相同或不相同。
根据权利要求1所述的方法，其中，所述第一模块的输入或输出为第一信息；

其中，所述第一信息包括以下一项或多项：

参考信号；

信道承载的信号；

信道状态信息；

波束信息；

信道预测信息；

干扰信息；

定位信息；

高层业务和/或参数的预测信息；

高层业务和/或参数的管理信息；

控制信令。
根据权利要求15所述的方法，其中，在所述第一模块的输出为第一信息的情况下，所述方法还包括：

发送所述第一信息至第二通信设备，或者发送所述第一信息至所述第一通信设备的第二模块。
根据权利要求16所述的方法，其中，所述第一通信设备为终端，所述第二通信设备为网络侧设备；

或者，

所述第一通信设备为网络侧设备，所述第二通信设备为终端；

或者，

所述第一通信设备为第一终端，所述第二通信设备为第二终端；

或者，

所述第一通信设备为第一网络侧设备，所述第二通信设备为第二网络侧设备。
一种量化的装置，应用于第一通信设备，其中，所述装置包括：

第一确定模块，用于确定所述第一通信设备的第一模块的量化策略、量化等级和/或量化配置参数，所述第一模块为AI模块；

量化模块，用于根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。
一种通信设备，包括：处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序，其中，所述程序被所述处理器执行时实现如权利要求1至17中任一项所述的方法的步骤。
一种可读存储介质，所述可读存储介质上存储程序或指令，其中，所述程序或指令被处理器执行时实现如权利要求1至17中任一项所述的方法的步骤。
一种芯片，包括处理器和通信接口，其中，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如权利要求1至17中任一项所述的方法的步骤。
一种计算机程序产品，其中，所述计算机程序产品被存储在非易失的存储介质中，所述计算机程序产品被至少一个处理器执行以实现如权利要求1至17中任一项所述的方法的步骤。
一种通信设备，被配置为执行如权利要求1至17中任一项所述的方法的步骤。