CN110472280B

CN110472280B - 一种基于生成对抗神经网络的功率放大器行为建模方法

Info

Publication number: CN110472280B
Application number: CN201910620052.1A
Authority: CN
Inventors: 马伙财; 王美林; 刘太君; 王杨帅; 黄钧
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2019-07-10
Filing date: 2019-07-10
Publication date: 2024-01-12
Anticipated expiration: 2039-07-10
Also published as: CN110472280A

Abstract

本发明公开了一种基于生成对抗神经网络的功率放大器行为建模方法，包括如下步骤：采集功率放大器的输入信号X_in和输出信号y_out，并归一化处理，分别得到和构建包括生成器、判别器的生成对抗神经网络模型，并初始化；设置生成对抗神经网络模型的权系数矩阵、最大迭代次数num_epochs、学习率η、误差阈值；将输入生成器并生成数据y_t，将y_t和功输入判别器提取特征信息；分别计算生成器模块和判别器模块的目标误差损失函数；用Adam优化算法训练生成对抗神经网络；迭代次数加1；判断是否满足：目标误差损失函数不大于误差阀值或迭代次数大于迭代次数num_epochs，否，则根据权值矩阵的变化量更新权值系数，返回上述步骤；是，则停止迭代，保存权值系数，得到功率放大器行为模型。

Description

一种基于生成对抗神经网络的功率放大器行为建模方法

技术领域

本发明涉及无线通信技术领域，更具体的，涉及一种基于生成对抗神经网络的功率放大器行为建模方法。

背景技术

目前功率放大器非线性行为模型主要有两种：无记忆射频功放行为模型和有记忆射频功放行为模型。无记忆模型主要有查找表(look up table,LUT)模型、Saleh模型、复数单输入单输出前馈神经网络和双输入双输出实数神经网络等，这些模型对无记忆功放模型的拟合精度较高，且线性化效果比较明显，但是无法精确的刻画有记忆效应的功放非线性特性。目前广泛使用的是有记忆的非线性模型，如：径向基函数神经网络模型和不同拓扑结构的BP神经网路模型。记忆多项式模型是简化版的Volterra模型，其大大简化了Volterra模型饿系数。Wiener、Hammerstein模型以及其改进型模型在对功放建模的时候，功放的记忆效应部分忽略了高阶分量，因此这些模型的建模能力对于大功率带宽的功放建模精度不高。

在当今的4G、5G通信系统中，移动通信的带宽和传输速率都将有极大的提升，由于目前AD采集速率的限制，AD只能采集到通信系统中带内或者带内的一部分信号，造成一定数据丢失的问题。

发明内容

本发明为了解决由于目前AD采集速率的限制，AD只能采集到通信系统中带内或者带内的一部分信号，造成一定数据丢失的问题，提出一种基于生成对抗神经网络模型的功率放大器行为建模方法，其能防止数据丢失问题，同时具有记忆功能的特点，能用来描述功率放大器的记忆效应和非线性。

为实现上述本发明目的，采用的技术方案如下：一种基于生成对抗神经网络的功率放大器行为建模方法，所述该方法包括如下步骤：

S1：采集功率放大器的输入信号数据向量X_in＝[x_in(1),x_in(2),…,x_in(N)]和输出信号数据向量y_out＝[y_out(1),y_out(2),…,y_out(N)]，其中，N为数据长度；

S2：对输入信号数据向量X_in和输出信号数据向量y_out进行归一化处理：得到归一化输入信号数据向量和输出信号数据向量/>

S3：构建生成对抗神经网络模型，并初始化生成对抗神经网络模型，其中生成对抗神经网路模型包括生成器、判别器；

S4：设置生成对抗神经网络模型中的权系数矩阵、训练最大迭代次数num_epochs、学习率η、误差阈值；

S5：将归一化输入信号数据向量输入生成器并生成数据y_t，将数据y_t和功率放大器的归一化输出信号数据向量/>输入到判别器中提取特征信息；

S6：分别计算生成器模块和判别器模块的目标误差损失函数；

S7：用Adam优化算法训练生成对抗神经网络；将学习率η上传Adam优化算法，完成训练生成对抗神经网络；

S8：迭代次数加1，即t＝t+1；

S9：判断是否满足：目标误差损失函数不大于误差阀值或者迭代次数大于迭代次数num_epochs，

S10：若不满足，则根据权值矩阵的变化量更新权系数矩阵，返回步骤S5；

S11：若满足，则停止迭代，保存权系数矩阵，得到功率放大器行为模型。

优选地，步骤S2，所述归一化的计算公式如下：

式中，i＝1,2,3···,N；max(·)表示求向量中最大值的运算。

进一步地，所述生成器包括第一输入层、循环神经隐含层、全连接隐含层、第一输出层；所述判别器包括第二输入层、三个卷积层、两个全连接层、第二输出层。

再进一步地，构建生成对抗神经网络模型的具体如下：

设置生成器的第一输入层有P个神经元，用于接收输入数据，并将其传递到循环神经网络隐含层；

所述循环神经网络隐含层有s个长短时记忆单元且神经元个数为Hidden，每个长短时记忆单元有遗忘门传递函数f_t＝σ(W_f·[h_t-1,x_int]+b_f)，其中W_f表示遗忘门传递函数的权系数矩阵，b_f表示遗忘门传递函数的偏置，x_int表示t时刻输入数据；

所述循环神经网络隐含层的输入分为两部分，一部分是传递函数i_t＝σ(W_i·[h_t-1，x_int]+b_i)，其中W_i为输入门传递函数的权系数矩阵，b_i为输入门传递函数的偏置；另一部分是细胞单元状态传递函数作为存放在细胞单元的候选值，其中W_c为细胞单元状态传递函数的权系数矩阵，b_c为细胞单元状态传递函数的偏置；

所述循环神经网络隐含层设有输出门传递函数o_t＝σ(W_o·[h_t-1,x_int]+b_o)，其中W_o为输出门传递函数的权系数矩阵，b_o为输出门传递函数的偏置；h_t-1为上一时刻即t-1时刻的输出值；

所述循环神经隐含层后面接一个全连接隐含层，所述全连接隐含层的神经元个数设置为Hidden个；

所述生成器的第一输出层有M个神经元，该层神经元的输出数据为y_t，即生成器生成的数据；

设置判别器的第二输入层有K个神经元；第一个卷积层包括32个一维的卷积核，其输出结果经过LeakyRelu非线性函数处理；第二个卷积层包括64个一维的卷积核，先将第一卷积层的输出结果经过归一化处理后输入此层，输出结果经过LeakyRelu非线性函数处理；同样的，第三个卷积层包括128个一维的卷积核，先将第二卷积层的输出结果经过归一化处理后输入此层，输出结果经过LeakyRelu非线性函数处理；

所述第一全连接层的神经元个数设置为L₁个，其输出结果经过LeakyRelu非线性处理；第二全连接层的神经元个数同样为L₂，结果经过Relu非线性激活函数；所述判别器的第二输出层为单个神经元的全连接层。

再进一步地，步骤S4，在生成对抗神经网络模型中，设置如下权系数矩阵：

在生成器中，从输入层到循环神经隐含层设有包括以下权系数矩阵，分别是第一输入层到循环神经隐含层的输入门hidden×(hidden+P)维的权系数矩阵W_i，第一输入层到循环神经隐含层的遗忘门hidden×(hidden+P)维的权系数矩阵W_f，第一输入层到循环神经隐含层的输出门hidden×(hidden+P)维的权系数矩阵W_o；所述循环神经隐含层到第一输出层的1×hidden维的权系数矩阵；

在判别器中，先通过三层卷积神经网络对输入的数据进行特征提取，三层的卷积核filter_num的个数分别为32、64、128，卷积核的大小filter_size＝5，strides＝1，三个卷积层后接两个全连接层，最后一个卷积层到第一个全连接层的权系数矩阵W₁₁，维度为L₂×filter-num*S，其中S为输入序列的长度；第一个全连接层到第二个全连接层权系数矩阵W₁₂，维度为L₂×L₁；第二个全连接层到输出层的权系数矩阵W₁₃，维度为1×L₂，其中，L₂表示第二个全连接层的神经元个数；L₁表示第一个全连接层的神经元个数。

再进一步地，所述生成器的初始权值W_f、W_i、W_c、W_o和判别器中的初始权值W₁₁、W₁₂、W₁₃均采用Glorot分布。

再进一步地，步骤S5，将归一化输入信号数据向量通过生成器的输入层输入循环神经隐含层，进行以下计算：

第t迭代时遗忘门传递函数输出f_t：

第t迭代时输入门传递函数输出i_t、输入门细胞单元状态传递函数细胞单元状态输出C_t：

其中，其中C_t-1为上一个时刻即t-1的细胞单元状态输出；

第t迭代时输出门传递函数输入o_t、该层的输出h_t：

o_t＝σ(W_o·[h_t-1,x_t]+b_o)、h_t＝o_t*tanh(C_t)；

生成器的全连接隐含层输出数据：y_t＝g(h_t·w_d+b_d)，其中y_t表示全连接隐含层的输出向量，w_d表示全连接层的权值向量，运算符号“·”表示元素相乘，b_d为偏移向量，g(x)是神经元激励函数。

再进一步地，所述步骤S5，判别器分别对生成器生成的数据y_t和功率放大器真实的输出数据进行提取特征信息处理，并通过不同卷积核提取数据中的不同特征H_i；

其中，H_i表示第i层的特征图，W_i表示第i层卷积核的权值向量，运算符号表示卷积核与第i－1层图像或特征图进行卷积操作，b_i为偏移向量，f(x)是非线性激励函数；

全连接层输出：Y_i＝g(H_i·w_i+b_i),其中Y_i表示第二全连接层的输出向量，w_i表示全连接层的权系数矩阵，运算符号“·”表示元素相乘，b_i为偏移向量，g(x)是神经元激励函数。

再进一步地，步骤S6，所述计算生成器模块和判别器模块的目标误差损失函数的计算公式如下：

其中：式(1)为判别器的目标误差损失函数，其中P_r为功率放大器的输出经过归一化处理的真实数据的概率分布，x_r为在P_r的概率分布中的随机抽样的样本；P_g为生成器生成的假数据分布，即为y_t，x_g为在P_g的概率分布中的随机抽样的样本；为/>满足在x_r和x_g之间随机插值取样的数据分布，/>为在/>的概率分布中的随机抽样的样本；/>是将功率放大器真实的输出数据输入到判别器中求其期望值，/>是将生成器生成的假数据输入到判别器求其期望值，/>为梯度惩罚，λ为梯度惩罚参数；式(2)为生成器的目标误差损失函数，/>为生成器生成的假数据输入到判别器求其期望值。

再进一步地，步骤S，所述训练生成对抗神经网络时，设置判别器每训练Y次，生成器优化1次，其中Y≥2。

本发明的有益效果如下：

1.本发明提出一种基于生成对抗神经网络的功率放大器行为建模方法，训练一个生成器，从功率放大器输入数据中生成逼真的样本数据，同时训练一个判别器，并通过目标误差损失函数来判别真实数据和生成数据，解决了由于目前AD采集速率的限制，AD只能采集到通信系统中带内或者带内的一部分信号，造成一定数据丢失的问题。

2.在生成器内部使用了循环神经网络，利用了循环神经网络的输出不仅与即时的输入有关、也与历史输入有关的特点，用来描述功率放大器的记忆效应，解决了传统的神经网路模型只在描述短期记忆效应表现良好，对长期记忆效应描述表现很差的问题，因此它很好的描述功率放大器的非线性特性和记忆效应，且具有较快的模型收敛速度和较高的精度。

3.本发明提出一种基于生成对抗神经网络模型的功率放大器行为建模方法，此方法通过生成器和判别器对抗的训练机制，使生成的样本数据概率分布去逼近功率放大器输出真实样本数据的概率分布，隐形的从训练数据进行网络学习并且提取出其特征，能够有效的避免人工选择特征的困难。

附图说明

图1是本实施例所述生成对抗神经网路模型的结构图。

图2是本实施例所述功率放大器结构模型图。

图3是本实施例所述生成器的结构示意图。

图4是本实施例所述判别器的结构示意图。

具体实施方式

下面结合附图和具体实施方式对本发明做详细描述。

实施例1

如图1所示，一种基于生成对抗神经网络的功率放大器行为建模方法，所述该方法包括如下步骤：

S1：采集功率放大器的输入信号数据向量X_in＝[x_in(1),x_in(2),…,x_in(N)]和输出信号数据向量y_out＝[y_out(1),y_out(2),…,y_out(N)]，其中，N为数据长度，如图2所示，为功率放大器的输入信号数据向量X_in与输出信号数据向量y_out的示意图；

其中，所述归一化的计算公式如下：

式中，i＝1,2,3···,N；max(·)表示求向量中最大值的运算。

如图3所示，本实施例所述的生成器包括第一输入层、循环神经隐含层、全连接隐含层、第一输出层；所述判别器包括第二输入层、三个卷积层、两个全连接层、第二输出层，如图4所示。

本实施例所述构建生成对抗神经网络模型的具体如下：

设置生成器的第一输入层有P个神经元，用于接收输入数据，并将其传递到循环神经网络隐含层；其中P≥1；

所述循环神经网络隐含层有s个长短时记忆单元且神经元个数为Hidden，每个长短时记忆单元有遗忘门传递函数f_t＝σ(W_f·[h_t-1,x_int]+b_f)，其中，S≥1，Hidden≥1；W_f表示遗忘门传递函数的权系数矩阵，b_f表示遗忘门传递函数的偏置，x_int表示t时刻输入数据；

所述循环神经网络隐含层设有输出门传递函数o_t＝o(W_o·[h_t-1，x_int]+b_o)，其中W_o为输出门传递函数的权系数矩阵，b_o为输出门传递函数的偏置；h_t-1为上一时刻即t-1时刻的输出值；

所述生成器的第一输出层有M个神经元，该层神经元的输出数据为y_t，即生成器生成的数据。

设置判别器的第二输入层有K个神经元，其中K≥1；第一个卷积层包括32个一维的卷积核，其输出结果经过LeakyRelu非线性函数处理；第二个卷积层包括64个一维的卷积核，先将第一卷积层的输出结果经过归一化处理后输入此层，输出结果经过LeakyRelu非线性函数处理；同样的，第三个卷积层包括128个一维的卷积核，先将第二卷积层的输出结果经过归一化处理后输入此层，输出结果经过LeakyRelu非线性函数处理；

第一全连接层的神经元个数设置为L₁个，其输出结果经过LeakyRelu非线性处理；第二全连接层的神经元个数同样为L₂，结果经过Relu非线性激活函数；所述判别器的第二输出层为单个神经元的全连接层，其中L₁≥1、L₂≥1。

本实施例在生成对抗神经网络模型中，设置如下权系数矩阵：

在判别器中，先通过三层卷积神经网络对输入的数据进行特征提取，三层的卷积核filter_num的个数分别为32、64、128，卷积核的大小filter_size＝5，strides＝1，三个卷积层后接两个全连接层，最后一个卷积层到第一个全连接层的权系数矩阵W₁₁，维度为L₂×filter_num*S，其中S为输入序列的长度；第一个全连接层到第二个全连接层权系数矩阵W₁₂，维度为L₂×L₁；第二个全连接层到输出层的权系数矩阵W₁₃，维度为1×L₂，其中，L₂表示第二个全连接层的神经元个数；L₁表示第一个全连接层的神经元个数。

S5：将归一化输入信号数据向量通过生成器的输入层输入循环神经隐含层，进行以下计算：

第t迭代时遗忘门传递函数输出f_t：

其中，其中C_t-1为上一个时刻即t-1的细胞单元状态输出；

第t迭代时输出门传递函数输入o_t、该层的输出h_t：

o_t＝σ(W_o·[h_t-1,x_t]+b_o)、h_t＝o_t*tanh(C_t)；

生成器的全连接隐含层输出数据：y_t＝g(h_t·w_d+b_d)，其中y_t表示全连接隐含层的输出向量，w_d表示全连接层的权系数矩阵，运算符号“·”表示元素相乘，b_d为偏移向量，g(x)是神经元激励函数；生成器最终生成数据y_t并从第一输出层输出。

本实施例所述的判别器分别对生成器生成的数据y_t和功率放大器真实的输出数据向量进行提取特征信息处理，并通过不同卷积核提取数据中的不同特征H_i；

其中，H_i表示第i层的特征图，W_i表示第i层卷积核的权系数矩阵，运算符号表示卷积核与第i－1层图像或特征图进行卷积操作，b_i为偏移向量，f(x)是非线性激励函数；

全连接层输出：Y_i＝g(H_i·w_i+b_i)，其中Y_i表示第二全连接层的输出向量，w_i表示全连接层的权系数矩阵，运算符号“·”表示元素相乘，b_i为偏移向量，g(x)是神经元激励函数。

S6：分别计算生成器模块和判别器模块的目标误差损失函数，具体计算公式如下：

在训练中优先让判别器学习次数多一点，设置判别器每训练5次，生成器优化一次，以此得到模型的权值矩阵变化量；

S8：迭代次数加1，即t＝t+1；

本实施例所述的一种基于生成对抗神经网络模型的功率放大器行为建模方法，该方法中使用循环神经网路作为生成器，卷积神经网络作为判别器，其对序列具有良好的描述能力且能生成丢失的一部分信号的同时，生成器利用循环神经网络具有记忆功能的特点，很好用来描述功率放大器的记忆效应和非线性。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种基于生成对抗神经网络的功率放大器行为建模方法，其特征在于：该方法包括如下步骤：

S2：对输入信号数据向量X_in和输出信号数据向量y_out进行归一化处理：得到归一化输入信号数据向量和归一化输出信号数据向量/>

S7：用Adam优化算法训练生成对抗神经网络；

S8：迭代次数加1，即n＝n+1；

S11：若满足，则停止迭代，保存权系数矩阵，得到功率放大器行为模型；

所述生成器包括第一输入层、循环神经隐含层、全连接隐含层、第一输出层；所述判别器包括第二输入层、三个卷积层、两个全连接层、第二输出层；

构建生成对抗神经网络模型的具体如下：

所述循环神经网络隐含层有s个长短时记忆单元且神经元个数为Hidden，每个长短时记忆单元有遗忘门传递函数f_t＝σ(W_f·[h_t-1,x_int]+b_f)，W_f表示遗忘门传递函数的权系数矩阵，b_f表示遗忘门传递函数的偏置，x_int表示t时刻输入数据；运算符号“·”表示元素相乘；

所述循环神经网络隐含层设有输出门传递函数o_t＝σ(W_o·[h_t-1,x_int]+b_o)，其中W_o为输出门传递函数的权系数矩阵，b_o为输出门传递函数的偏置；h_t-1为上一时刻即t-1时刻的LSTM网络输出值；

第一全连接层的神经元个数设置为L₁个，其输出结果经过LeakyRelu非线性处理；第二全连接层的神经元个数同样为L₂，结果经过Relu非线性激活函数；所述判别器的第二输出层为单个神经元的全连接层。

2.根据权利要求1所述的基于生成对抗神经网络的功率放大器行为建模方法，其特征在于：步骤S2，所述归一化的计算公式如下：

式中，i＝1,2,3···,N；max(·)表示求向量中最大值的运算。

3.根据权利要求1所述的基于生成对抗神经网络的功率放大器行为建模方法，其特征在于：步骤S4，在生成对抗神经网络模型中，设置如下权系数矩阵：

4.根据权利要求3所述的基于生成对抗神经网络的功率放大器行为建模方法，其特征在于：所述生成器的初始权值W_f、W_i、W_c、W_o和判别器中的初始权值W₁₁、W₁₂、W₁₃均采用Glorot分布。

5.根据权利要求3所述的基于生成对抗神经网络的功率放大器行为建模方法，其特征在于：步骤S5，将归一化输入信号数据向量通过生成器的输入层输入循环神经隐含层，进行以下计算：

第t次迭代时遗忘门传递函数输出f_t：

第t次迭代时输入门传递函数输出i_t、输入门细胞单元状态传递函数细胞单元状态输出C_t：

其中，其中C_t-1为上一个时刻即t-1的细胞单元状态输出；

第t次迭代时输出门传递函数输入o_t、该层的输出h_t：

h_t＝o_t*tanh(C_t)；

生成器的全连接隐含层输出数据：y_t＝g(h_t·w_d+b_d)，其中y_t表示全连接隐含层的输出向量，w_d表示全连接层的权值向量，b_d为偏移向量，g(x)是神经元激励函数。

6.根据权利要求5所述的基于生成对抗神经网络的功率放大器行为建模方法，其特征在于：所述步骤S5，判别器分别对生成器生成的数据y_t和功率放大器真实的归一化输出信号数据向量进行提取特征信息处理，并通过不同卷积核提取数据中的不同特征H_i；

其中，H_i表示第i层的特征图，WT_i表示第i层卷积核的权值向量，运算符号表示卷积核与第i－1层图像或特征图进行卷积操作，b_k为判别器第一个全连接层的偏置，f(x)是非线性激励函数；

全连接层输出：Y_i＝g(H_i·w_i+b_k)，其中Y_i表示第二全连接层的输出向量，w_i表示全连接层的权值向量，g(x)是神经元激励函数。

7.根据权利要求6所述的基于生成对抗神经网络的功率放大器行为建模方法，其特征在于：步骤S6，所述计算生成器模块和判别器模块的目标误差损失函数的计算公式如下：

其中：式(1)为判别器的目标误差损失函数，其中P_r为功率放大器的输出经过归一化处理的真实数据的概率分布，x_r为在P_r的概率分布中的随机抽样的样本；P_g为生成器生成的假数据分布，x_g为在P_g的概率分布中的随机抽样的样本；为/>满足在x_r和x_g之间随机插值取样的数据分布，/>为在/>的概率分布中的随机抽样的样本；/>是将功率放大器真实的输出数据输入到判别器中求其期望值，/>是将生成器生成的假数据输入到判别器求其期望值，/>为梯度惩罚，λ为梯度惩罚参数；式(2)为生成器的目标误差损失函数，/>为生成器生成的假数据输入到判别器求其期望值。

8.根据权利要求7所述的基于生成对抗神经网络的功率放大器行为建模方法，其特征在于：步骤S7，所述训练生成对抗神经网络时，设置判别器每训练Y次，生成器优化1次，其中Y≥2。