CN115730676A

CN115730676A - 自适应编码调制方法、装置、电子设备和存储介质

Info

Publication number: CN115730676A
Application number: CN202111014423.5A
Authority: CN
Inventors: 林志远; 林伟; 刘向凤; 芮华; 黄河
Original assignee: ZTE Corp
Current assignee: ZTE Corp
Priority date: 2021-08-31
Filing date: 2021-08-31
Publication date: 2023-03-03
Also published as: WO2023029751A1

Abstract

本发明实施例涉及通信领域，公开了一种自适应编码调制方法、装置、电子设备和存储介质。本发明实施例的自适应编码调制方法包括获取特征参数，其中，所述特征参数中包括表征用户的传输能力的数据；将所述特征参数输入内环机器学习模型中，得到MCS初值；将所述MCS初值和所述特征参数输入外环机器学习模型中，得到所述MCS初值对应的MCS调整值；根据所述MCS初值对应的调整值和所述MCS初值得到调整后的MCS值。该方法旨在提高MCS选择的准确率，特别是在多用户空分传输等复杂情况下。

Description

自适应编码调制方法、装置、电子设备和存储介质

技术领域

本申请实施例涉及通信领域，特别涉及一种自适应编码调制方法、装置、电子设备和存储介质。

背景技术

AMC(Adaptive Modulation and Coding，自适应调制编码)是无线信道上采用的一种自适应的编码调制技术，通过调整无线链路传输的调制方式与编码速率，来确保链路的传输质量。AMC的实现原理可以简单描述为：使用信道相关的特征参数来自适应地调整调制编码方式(Modulation and Coding Scheme，MCS)。

传统的AMC是面向用户的，在传统的获取MCS值的方法中，会使用特定的公式描述MCS值和特征参数的对应关系，在计算MCS值时，将该特征参数，如信道质量指示(ChannelQuality Indicator，CQI)和流数，代入特定的公式以计算出MCS值。

而在不同的传输场景下MCS值和特征参数的关系是不同的，仍使用该特定的公式计算MCS值，无法贴合于不同传输场景，会导致计算出的MCS准确率低。

发明内容

本申请实施例的主要目的在于提出一种自适应编码调制方法、装置、电子设备和存储介质，能够提高MCS选择的准确率。

为实现上述目的，本申请实施例提供了一种自适应编码调制方法，包括：获取特征参数，其中，所述特征参数中包括表征用户的传输能力的数据；将所述特征参数输入内环机器学习模型中，得到MCS初值；将所述MCS初值和所述特征参数输入外环机器学习模型中，得到所述MCS初值对应的MCS调整值；根据所述MCS初值对应的调整值和所述MCS初值得到调整后的MCS值。

为实现上述目的，本申请实施例还提供了一种自适应编码调制装置，包括：参数获取模块，用于获取特征参数，其中，所述特征参数中包括表征用户的传输能力的数据；初值获取模块，将所述特征参数输入内环机器学习模型中，得到MCS初值；调整值获取模块，用于将所述MCS初值和所述特征参数输入外环机器学习模型中，得到所述MCS初值对应的MCS调整值；调整模块，用于根据所述MCS初值对应的调整值和所述MCS初值得到调整后的MCS值。

为实现上述目的，本申请实施例还提供了一种电子设备，至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述的自适应编码调制方法。

为实现上述目的，本申请实施例还提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现上述的自适应编码调制方法。

相较于使用特定公式计算MCS值，本实施例中的基于内环机器学习模型和外环机器学习模型得到MCS值，无需特定的MCS值的计算公式，使得输入内环机器学习模型和外环机器学习模型的特征参数可以根据传输场景确定，能是用于不同的传输场景，进而有利于提高MCS的准确率。

附图说明

一个或多个实施例通过与之对应的附图中的图片进行示例性说明，这些示例性说明并不构成对实施例的限定。

图1是根据本发明一实施例提供的自适应编码调制方法的流程图；

图2是根据本发明一实施例提供的自适应编码调制方法中各功能模块交互的示意图；

图3是根据本发明一实施例提供的自适应编码调制方法中内环机器学习模型的示意图；

图4是根据本发明一实施例提供的自适应编码调制方法中外环机器学习模型的示意图；

图5是根据本发明一实施例提供的根据传输类型获取特征参数的自适应编码调制方法的流程图；

图6是根据本发明一实施例提供的自适应编码调制装置的示意图；

图7是根据本发明一实施例提供的电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合附图对本申请的各实施例进行详细的阐述。然而，本领域的普通技术人员可以理解，在本申请各实施例中，为了使读者更好地理解本申请而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施例的种种变化和修改，也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便，不应对本申请的具体实现方式构成任何限定，各个实施例在不矛盾的前提下可以相互结合相互引用。

在传统的获取MCS值的方法中，会使用特定的公式描述MCS值和特征参数的对应关系，在计算MCS值时，将该特征参数，如信道质量指示(Channel Quality Indicator，CQI)和流数，代入特定的公式以计算出MCS值。

而在不同的传输场景下，MCS值和特征参数的关系是不同的，该公式没有普适性，若仍使用该特定的公式计算MCS值，无法贴合于不同传输场景，会导致计算出的MCS准确率低。

在一些传统的方案中，也可以将特征参数作为状态(state)，将MCS值作为行为(action)，将基于MCS进行传输而带来的频谱效率或吞吐量作为收益(reward)，进行强化学习，得到不同状态和行为下的Q值，并基于Q值来选择MCS值。Q值会随每次反馈的收益进行实时更新。

然而，强化学习虽然能够根据反馈实时在线调整MCS值，但是MCS值的取值范围大，MCS值作为行为进行训练会致使MCS行为空间维度高，从而导致计算复杂度高，进而降低了自适应编码调制的效率。

因此，本实施例提供一种自适应编码调制方法，可应用于基站等设备，但不限于此，本实施例的自适应编码调制方法包括：获取特征参数，其中，所述特征参数中包括表征用户的传输能力的数据；将所述特征参数输入内环机器学习模型中，得到MCS初值；将所述MCS初值和所述特征参数输入外环机器学习模型中，得到所述MCS初值对应的MCS调整值；根据所述MCS初值对应的调整值和所述MCS初值得到调整后的MCS值。

另外，相较于强化学习得到MCS值，本实施例将包括表征用户传输能力的数据的特征参数输入内环机器学习模型，得到MCS初值，将MCS初值和所述特征参数输入外环机器学习模型，得到MCS的调整值，由于MCS调整值的取值范围相较于MCS初值的取值范围较小，因此，MCS调整值的作为行为(action)进行训练时，外环机器学习模型的行为空间维度低，神经网络的规模小，得到MCS调整值的计算复杂度低，从而提高了自适应编码调制的效率，即本实施例在保证MCS值准确率的情况下，还尽量降低了MCS值的计算复杂度。

下面对本实施例的自适应编码调制方法的实现细节进行具体的说明，以下内容仅为方便理解提供的实现细节，并非实施本方案的必须。

步骤101，获取特征参数，其中，所述特征参数中包括表征用户的传输能力的数据。

在一些实施例中，特征参数可以包括：用户的传输流数(LayerNum)、信道质量指示(Channel Quality Indicator，CQI)、CQI链路计算的SINR(CQI SINR)、预编码矩阵指示(Precoding Matrix Indicator，PMI)、秩指示(rank indication，RI)、SRS链路计算的SINR(SRS SINR)等表征用户的传输能力强弱的数据，本实施例不对此进行限定。

步骤102，将特征参数输入内环机器学习模型中，得到MCS初值。

内环是指基站根据终端的信道条件确定该终端上下行信号的MCS(ModulationAnd Coding Scheme，调制编码方式)。

在一些实施例中，内环机器学习模型具有分类、回归功能，内环机器学习模型可以为：分类神经网络、回归神经网络、决策树等，本实施例不限于此。

示例性的，参照图2所示，将特征参数输入图2中的基于AI的AMC内环模块，即内环机器学习模型，该模块中使用多层感知机(MLP，Multilayer Perceptron)来起到分类作用。

MLP神经网络示意图如图3所示，包含一个输入层，多个隐藏层，以及一个输出层。输入层节点数等于输入的特征参数的个数，如输入的特征参数包括：传输流数(LayerNum)、CQI链路计算的SINR(CQI SINR)、PMI、RI、SRS链路计算的SINR(SRS SINR)等，本实施例中MLP神经网络的隐藏层数和每层节点数可配置，输出层节点数等于不同MCS值的个数，例如可配置0～27。

在该实施例中，MLP神经网络主要用于分类任务：MLP网络输出0～27不同MCS值对应的预测值，可以将预测值最大的MCS值作为MCS初值。

步骤103，将MCS初值和特征参数、以及MCS调整值的取值范围输入外环机器学习模型中，得到MCS初值对应的MCS调整值。外环是指确定MCS调整值的过程。

在一些实施例中，外环机器学习模型可以基于输入的一系列参数进行决策，如外环机器学习模型为：强化学习神经网络。图2中基于AI的AMC外环模块中的神经网络即为外环机器学习模型，可将特征参数输入基于AI的AMC外环模块得到MCS调整值。

示例性的，外环机器学习模型为深度Q网络(Deep Q network，DQN)。DQN网络可包含多个卷积神经网络、全连接网络等，具体网络种类、个数和规模可配置。DQN网络输出在该状态(state)下，不同行为(action)对应的Q函数值Q(state,action)。DQN网络示意图可参照图4所示。

参照图4所示，将表征状态的特征参数，如LayerNum、CQI SINR、PMI、RI、SRS SINR和MCS初值，以及表征行为的MCS调整值，输入代表AMC外环的强化Q网络(Deep Q Learning，DQN)网络中。其中，MCS调整值可取值0，+1，-1，+2，-2等，代表在原有MCS初值基础上进行调整的调整值。输入的MCS调整值可能的取值个数小于MCS初值可能的取值个数。

在DQN网络输出不同行为，即MCS调整值0，-1，+1，-2，+2等，对应的不同Q函数值后，可以采用ε-greedy的方法，即以概率ε随机选择一个行为作为MCS调整值输出；概率1-ε选择Q函数值最大的行为作为MCS调整值输出。通过ε-greedy方法可避免选择的MCS调整值陷入局部最优的情况。

在一些实施例中，当基于AI的AMC外环，即外环机器学习模型中得到MCS调整值后，可将MCS调整值和MCS初值均输入外环模块学习模块，以便后续外环模型学习模块根据MCS调整值和MCS初值得到外环模型样本数据，基于外环模型数据训练外环机器学习模型中的外环模型参数。

步骤104，根据所述MCS初值对应的调整值和所述MCS初值得到调整后的MCS值。

在一些实施例中，将MLP网络输出的MCS初值加上DQN网络输出的MCS调整值，具体公式为MCS＝min{max{MCS初值+MCS调整值,MCSmin},MCSmax}；其中，MCSmax为最大MCS值，MCSmin为最小MCS值，以保证输出的MCS值不会大于MCSmax或小于MCSmin。

在得到调整后的MCS值后，图2中的传输模块按照调整后的MCS值进行信号传输后，将传输结果的反馈值，如Ack/Nack反馈给内环模型学习模块，即内环机器学习模型的训练模块和外环模型学习模块，即外环机器学习模型的训练模块。

在一些实施例中，内环模型学习模块根据所内环模型样本数据训练所述内环机器学习模型中的内环模型参数；其中，所述内环模型样本数据包括：调整后的MCS值、使用所述调整后的MCS值进行信号传输的传输结果、所述特征参数。

在一些实施例中，内环机器学习模型中的内环模型参数通过离线学习方式进行训练，采用离线学习方式相较于在线学习的计算复杂度低，因此，本实施例可以进一步降低学习复杂度。

示例性的，若采用离线方式更新，图2中的内环模型学习模块收到一定数量的内环模型样本数据或达到一定周期后，需要根据收集的样本更新内环模型，即更新MLP网络参数，在训练过程中，采用传输结果的反馈值为Ack的数据生成样本，一个内环模型样本数据包括LayerNum、CQI SINR、PMI、RI、SRS SINR等特征参数、这些特征参数对应的调整后的MCS值，以及传输结果Ack，该样本的标签为调整后的MCS值。

在获取内环模型样本数据后，可以定义损失函数，基于采集的内环模型样本数据，采用梯度下降法更新内环模型参数。

在一些实施例中，根据外环模型样本数据训练所述外环机器学习模型中的外环模型参数；其中，所述外环模型样本数据包括：所述特征参数、所述MCS初值、所述MCS调整值，所述传输结果的反馈值。

在一些实施例中，通过在线学习方式训练外环模型参数，通过在线学习，实时更新外环模型参数，得到MCS调整值，以使得MCS能够更快收敛。

示例性的，在收到传输结果反馈后，需要根据传输结果的反馈值实时更新外环模型参数，即更新DQN网络参数。传输反馈值代表了DQN网络在采取某种行为后的回报(Reward)。当传输结果为Ack时，传输结果的反馈，即回报等于MCS值对应的频谱效率(SE)；当传输结果反馈为Nack时，回报为0。

在训练外环模型参数的过程中，根据外环模型样本数据得到{采取行为前的状态，行为，回报，采取行为后的状态}，将其加入一个经验回放缓存器(Experience ReplayMemory)中；随机从缓存器中抽样部分样本，形成小规模训练集，并基于这些样本对DQN网络参数进行更新，更新方式为计算损失函数，并采用梯度下降法。

本实施例的内环机器学习模型中的内环模型参数通过离线学习方式进行训练；外环机器学习模型中的外环模型参数通过在线学习方式进行训练。本实施例中，将人工智能方法同时应用于内环和外环，既能保障AMC外环的在线调整能力，又通过AMC内环的准确计算，降低AMC外环模型的复杂度。

在另一些实施例中，外环模型学习模块和内环模型学习模块也可以采用不同的学习方式，例如，外环模型学习模块在外环模型参数收敛稳定后，可采用离线学习方法以降低外环模型参数更新复杂度，又例如，外环模型学习模块可直接配置为离线学习方式，周期性更新外环模型参数，或者触发性的更新外环模型参数，即，内环模型参数和外环模型参数的学习方式可根据实际需求设置。

本实施例将包括表征用户传输能力的数据的特征参数输入内环机器学习模型，得到MCS初值，将MCS初值和所述特征参数输入外环机器学习模型，得到MCS的调整值，由于MCS调整值的取值范围相较于MCS初值的取值范围较小，因此，MCS调整值的取值范围作为状态进行训练时，外环机器学习模型的行为空间维度低，神经网络的规模小，得到MCS调整值的计算复杂度低，从而提高了自适应编码调制的效率，另外，本实施例通过离线学习方式训练AMC内环模型参数，通过在线学习方式训练外环模型参数，既能保障AMC外环的在线调整能力，又通过AMC内环的准确计算，进一步降低AMC外环模型的复杂度，而且，相较于使用特征公式计算AMC值，本实施例通过机器学习模型计算得出的值更加精确。

本发明的实施例还提供一种自适应编码调制方法，本实施例的自适应编码调制方法可应用于多用户空分场景，本实施例获取的特征参数还包括：干扰能力参数。本实施例的流程图可参见图5所示，包括以下步骤：

步骤501，检测传输类型。

步骤502，若传输类型为单用户传输，则获取表征用户的传输能力的数据。

步骤503，若传输类型为多用户空分传输，则获取表征用户的传输能力的数据和干扰能力参数。

在一些实施例中，所述干扰能力参数包括：所述用户所在的空分用户配对组合中的各干扰用户与所述用户的端口间相关性参数，和所述空分用户配对组合中的各干扰用户的传输流数。干扰能力参数是能够表征空分配对组合中用户间干扰的数据。用户的端口间相关性参数可以为端口间相关性的均值或最大值。

在传统的技术方案中往往基于特定公式计算MCS，即，使用CQI链路反馈值和干扰用户流数、相关性等参数带入特定的计算公式得到MCS值，并且面向单个用户进行AMC外环维护。

然而，在多用户传输的场景下，通过计算公式难以准确表示出用户间干扰，导致计算出的MCS值不准确。此外，当用户配对组合变化导致干扰变化时，AMC外环可能不收敛。

鉴于此，本实施例还能综合考虑用户自身传输能力和用户间的干扰能力，不仅能够面向单用户传输场景，还能够面向多空分用户传输，让MCS值和MCS调整值的输出更为准确，另外，本实施例无需使用特定公式计算用户间干扰值，本实施例将用户的端口间相关性参数，和空分用户配对组合中的各干扰用户的传输流数作为特征参数的输入，实现方式更加简单，而且使用机器学习模型能够更好的捕捉用户间干扰和MCS之间的关系，使得计算出的值更加精确，避免了因AMC外环是面向用户的，不对干扰进行区分，导致的MCS调整值不收敛的情况发生。

示例性的，考虑到多用户空分传输，存在空分用户之间的干扰，因此选择主用户传输能力相关参数和干扰用户干扰能力相关参数。具体地，按照以下方式构造输入特征组合：

对于给定的空分用户配对组合，逐一将组合内的某个用户作为主用户，其他用户作为干扰用户，构造主用户对应的特征组合。例如，空分组合为用户1，用户2，用户3，先将用户1作为主用户，其他用户作为干扰用户，来构造用户1对应的特征组合。

选择主用户1的传输流数、SRS SINR、CQI SINR、PMI、RI、端口间相关性的均值或最大值等作为表征用户传输能力的数据，即上述数据作为主用户自身传输能力的度量。然后，选择干扰用户2的传输流数、用户2与用户1端口间相关性的均值或最大值；最后，选择干扰用户3的传输流数、用户3与用户1端口间相关性的均值或最大值。上述干扰用户参数作为干扰用户干扰能力的数据。上述所有参数按固定顺序排列，作为用户1的特征。

采用同样的方法，分别构造用户2和用户3的特征，并逐一将不同用户对应的特征输入后续AMC内环和外环模块。

步骤504，将所述特征参数输入内环机器学习模型中，得到MCS初值。

示例性的，若为多用户空分传输，将某个主用户对应的特征参数输入代表AMC内环的多层感知机(MLP，Multilayer Perceptron)神经网络中，MLP神经网络结构与单用户传输的MLP神经网络结构，即图3类似，不同之处在于输入的特征参数，包含主用户传输能力参数和干扰用户干扰能力参数。

在该实施例中，MLP神经网络主要用于分类任务，MLP网络输出不同MCS值的预测值，并可以将预测值最大的MCS值作为主用户的MCS初值。

步骤505，将MCS初值和特征参数输入外环机器学习模型中，得到MCS初值对应的MCS调整值。

示例性的，若为多用户空分传输，将表征状态的输入特征和MCS初值，以及表征行为的MCS调整值，输入代表AMC外环的强化Q网络(Deep Q Learning，DQN)网络中。其中，MCS调整值可取值0，+1，-1，+2，-2等，代表了在原有MCS初值基础上进行调整的调整值。

DQN网络结构与单用户传输的DQN网络类似，不同之处在于环境参数变成了多用户场景下的环境参数，包含主用户传输能力参数和干扰用户干扰能力参数。

在DQN网络输出不同行为(即MCS调整值0，-1，+1，-2，+2等)对应的不同Q函数值后，我们采用ε-greedy的方法：以概率ε随机选择一个行为作为MCS调整值输出；概率1-ε选择Q函数值最大的行为作为MCS调整值输出。

MCS初值和MCS调整值需要传输到图2中的外环模型学习模块。

步骤506，根据MCS初值对应的调整值和所述MCS初值得到调整后的MCS值。

本实施例中，步骤505与步骤103大致相同，为避免表达上的重复，本实施例不再赘述。

在一些实施例中，根据所述用户所在的空分用户配对组合中各用户的内环模型样本数据，训练所述内环机器学习模型中的内环模型参数；根据所述用户所在的空分用户配对组合中各用户的外环模型样本数据训练所述外环机器学习模型中的外环模型参数。

本实施例内环模型参数的训练方法与上述实施例大致相同，值得一提的是，由于本实施例支持多用户空分场景，在每次调度后会收到多个空分用户的反馈结果，因此会生成空分用户配对组合中不同主用户对应的多个内环样本数据，这些内环样本数据将被内环模型学习模块存储，等待后续MLP网络参数更新算法调用。

本实施例外环模型参数的训练方式大致相同，由于本实施例支持多用户空分场景，本实施例会得到多个空分用户的反馈结果，因此会得到不同主用户对应的多个外环模型样本数据，这些样本将同时放入经验回放缓存器中，等待后续DQN网络参数更新算法调用。

通过同一空分用户配对组合中各用户的样本数据训练得到模型数据，更有利于考虑各用户之间的干扰因素，使得在空分情况下，MCS值也能逐渐收敛至最优，且进一步加快收敛速度。

值得一提的是，本实施例中检测传输类型，针对不同的传输类型获取不同的特征参数，进行训练，得到调整后的MCS值，在实际应用过程中，也可仅针对单用户传输场景或者仅针对多用户空分场景。

本实施例通过学习历史上成功传输经验得到内环模型参数，通过内环模型参数和特征参数计算MCS初值，可以更准确的估计出当前环境参数下的MCS初值，避免单用户或多用户空分传输情况下内环折算不准确的问题；而且，本实施例的综合考虑多方面因素对外环的影响，例如多用户场景下干扰用户的干扰能力相关参数等得到外环模型参数，并通过外环模型参数和包括干扰能力参数的用户特征参数计算调整值，能够更准确的估计出当前环境下MCS调整值，可以避免外环只关注单用户而忽略其他维度，例如用户间干扰所造成的不收敛现象；另外，本实施例的AMC外环可进行在线调整，AMC内环可进行实时调整，既能保障AMC外环的在线调整能力，又通过AMC内环的准确计算降低AMC外环模型的复杂度，让AMC内外环输出更为准确。

上面各种方法的步骤划分，只是为了描述清楚，实现时可以合并为一个步骤或者对某些步骤进行拆分，分解为多个步骤，只要包括相同的逻辑关系，都在本专利的保护范围内；对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计，但不改变其算法和流程的核心设计都在该专利的保护范围内。

本发明的实施例还提供一种自适应编码调制装置，如图6所示，包括：参数获取模块601，用于获取特征参数，其中，所述特征参数中包括表征用户的传输能力的数据；初值获取模块602，将所述特征参数输入内环机器学习模型中，得到MCS初值；调整值获取模块603，用于将所述MCS初值和所述特征参数输入外环机器学习模型中，得到所述MCS初值对应的MCS调整值；调整模块604，用于根据所述MCS初值对应的调整值和所述MCS初值得到调整后的MCS值。

在一些实施例中，参数获取模块601进一步用于检测传输类型；其中，所述传输类型包括：单用户传输和/或多用户空分传输；若所述传输类型为多用户空分传输，则所述特征参数还包括：干扰能力参数；其中，所述干扰能力参数表征干扰用户的干扰能力的数据。

在一些实施例中，参数获取模块601获取的干扰能力参数包括：所述用户所在的空分用户配对组合中的各干扰用户与所述用户的端口间相关性参数，和所述空分用户配对组合中的各干扰用户的传输流数。

在一些实施例中，自适应编码调制装置还进一步包括模型训练模块，模型训练模块进一步用于根据所内环模型样本数据训练所述内环机器学习模型中的内环模型参数；其中，所述内环模型样本数据包括：调整后的MCS初值、使用所述调整后的MCS值进行信号传输的传输结果的反馈值、所述特征参数；根据外环模型样本数据训练所述外环机器学习模型中的外环模型参数；其中，所述外环模型样本数据包括：所述特征参数、所述MCS初值、所述MCS调整值，所述传输结果的反馈值。

在一些实施例中，在传输类型为多用户空分传输时，模型训练模块进一步用于根据所述用户所在的空分用户配对组合中各用户的内环模型样本数据，训练所述内环机器学习模型中的内环模型参数；根据所述用户所在的空分用户配对组合中各用户的外环模型样本数据训练所述外环机器学习模型中的外环模型参数。

在一些实施例中，初值获取模块602中的内环机器学习模型为以下任一项分类神经网络、回归神经网络、决策树；调整值获取模块603中的外环机器学习模型为强化学习神经网络。

在一些实施例中，初值获取模块602中的内环机器学习模型中的内环模型参数通过离线学习方式进行训练；调整值获取模块603中的所述外环机器学习模型中的外环模型参数通过在线学习方式进行训练。

不难发现，本实施例为与上述方法的实施例相对应的系统实施例，本实施例可与上述方法实施例互相配合实施。上述方法实施例中提到的相关技术细节在本实施例中依然有效，为了减少重复，这里不再赘述。相应地，本实施例中提到的相关技术细节也可应用在第一实施例中。

值得一提的是，本实施例中所涉及到的各模块均为逻辑模块，在实际应用中，一个逻辑单元可以是一个物理单元，也可以是一个物理单元的一部分，还可以以多个物理单元的组合实现。此外，为了突出本发明的创新部分，本实施例中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入，但这并不表明本实施例中不存在其它的单元。

本发明的实施例还提供一种电子设备，如图7所示，包括至少一个处理器701；以及，与所述至少一个处理器701通信连接的存储器702；其中，所述存储器702存储有可被所述至少一个处理器701执行的指令，所述指令被所述至少一个处理器701执行，以使所述至少一个处理器701能够执行上述的自适应编码调制方法。

其中，存储器和处理器采用总线方式连接，总线可以包括任意数量的互联的总线和桥，总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件，也可以是多个元件，比如多个接收器和发送器，提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输，进一步，天线还接收数据并将数据传送给处理器。

处理器负责管理总线和通常的处理，还可以提供各种功能，包括定时，外围接口，电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。

本发明的实施例还提供一种计算机可读存储介质，存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。

即，本领域技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域的普通技术人员可以理解，上述各实施例是实现本发明的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本发明的精神和范围。

Claims

1.一种自适应编码调制方法，其特征在于，包括：

获取特征参数，其中，所述特征参数中包括表征用户的传输能力的数据；

将所述特征参数输入第内环机器学习模型中，得到MCS初值；

将所述MCS初值和所述特征参数输入外环机器学习模型中，得到所述MCS初值对应的MCS调整值；

根据所述MCS初值对应的调整值和所述MCS初值得到调整后的MCS值。

2.根据权利要求1所述的自适应编码调制方法，其特征在于，所述获取特征参数之前，包括：

检测传输类型；其中，所述传输类型包括：单用户传输和/或多用户空分传输；

若所述传输类型为多用户空分传输，则所述获取的特征参数还包括：干扰能力参数；其中，所述干扰能力参数表征干扰用户的干扰能力的数据。

3.根据权利要求2中所述的自适应编码调制方法，其特征在于，所述干扰能力参数包括：所述用户所在的空分用户配对组合中的各干扰用户与所述用户的端口间相关性参数，和所述空分用户配对组合中的各干扰用户的传输流数。

4.根据权利要求2所述的自适应编码调制方法，其特征在于，所述根据所述MCS初值对应的调整值和所述MCS初值得到调整后的MCS值之后，还包括：

根据内环模型样本数据训练所述内环机器学习模型中的内环模型参数；其中，所述内环模型样本数据包括：调整后的MCS值、使用所述调整后的MCS值进行信号传输的传输结果的反馈值和所述特征参数；

根据外环模型样本数据训练所述外环机器学习模型中的外环模型参数；其中，所述外环模型样本数据包括：所述特征参数、所述MCS初值、所述MCS调整值和所述传输结果的反馈值。

5.根据权利要求4所述的自适应编码调制方法，其特征在于，若所述传输类型为多用户空分传输，则所述根据内环模型样本数据训练所述内环机器学习模型中的内环模型参数，包括：

根据所述用户所在的空分用户配对组合中各用户的内环模型样本数据，训练所述内环机器学习模型中的内环模型参数；

所述根据外环模型样本数据训练所述外环机器学习模型中的外环模型参数，包括：

根据所述用户所在的空分用户配对组合中各用户的外环模型样本数据训练所述外环机器学习模型中的外环模型参数。

6.根据权利要求1至5中任一项所述的自适应编码调制方法，其特征在于，所述内环机器学习模型包括以下任一项：分类神经网络、回归神经网络、决策树；

所述外环机器学习模型包括强化学习神经网络。

7.根据权利要求1至5中任一项所述的自适应编码调制方法，其特征在于，所述内环机器学习模型中的内环模型参数通过离线学习方式进行训练；所述外环机器学习模型中的外环模型参数通过在线学习方式进行训练。

8.一种自适应编码调制装置，其特征在于，包括：

参数获取模块，用于获取特征参数，其中，所述特征参数中包括表征用户的传输能力的数据；

初值获取模块，将所述特征参数输入内环机器学习模型中，得到MCS初值；

调整值获取模块，用于将所述MCS初值和所述特征参数输入外环机器学习模型中，得到所述MCS初值对应的MCS调整值；

调整模块，用于根据所述MCS初值对应的调整值和所述MCS初值得到调整后的MCS值。

9.一种电子设备，其特征在于，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1至7中任一所述的自适应编码调制方法。

10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的自适应编码调制方法。