CN108256257B

CN108256257B - 一种基于编码-解码神经网络模型的功率放大器行为建模方法

Info

Publication number: CN108256257B
Application number: CN201810095930.8A
Authority: CN
Inventors: 邵杰; 赵一鹤; 张善章; 张颐婷; 刘姝
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2018-01-31
Filing date: 2018-01-31
Publication date: 2021-04-06
Anticipated expiration: 2038-01-31
Also published as: CN108256257A

Abstract

本发明公开了一种基于编码‑解码神经网络模型的功率放大器行为建模方法，该方法利用的编码‑解码神经网络模型对于序列具有良好的描述能力且模型收敛速度快，同时在模型内部使用长短时记忆单元，利用长短时记忆单元的输出不仅与即时输入有关、也与历史输入有关的特点，用来描述功率放大器的记忆效应；该方法能够很好地描述功率放大器的非线性特性和记忆效应，具有较快的模型收敛速度和较高的精度。

Description

一种基于编码-解码神经网络模型的功率放大器行为建模方法

技术领域

本发明涉及非线性系统建模与分析应用技术领域，尤其是一种基于编码-解码神经网络模型的功率放大器行为建模方法。

背景技术

功率放大器是发射机的重要模块，是一个复杂的非线性系统，功率放大器经常会产生严重的非线性失真，并且随着系统带宽的增加，功率放大器也会产生记忆效应。

发射机的内部结构大多比较复杂，对发射机的行为建模可以在不知道发射机内部组成的情况下，只依据系统的输入、输出测试数据就可以模拟出它的非线性和记忆效应。行为模型可以用来分析不同发射机所对应的模型参数差异，通过修改模型参数获取不同的发射机发射信号。在系统级仿真中，这种方法被广泛使用，并且经大量实验证明，这种方法能够精确地对功放进行建模。

一般来说，功率放大器行为建模可以分为无记忆模型和记忆模型两种。无记忆功放模型的种类很多，例如Saleh模型、无记忆多项式模型等。无记忆功放模型相对简单，对于窄带系统建模有很好的效果。然而随着系统带宽的增加，功率放大器的记忆效应明显，无记忆模型无法很好地描述记忆效应，所以现在大多采用有记忆功放模型。有记忆模型一般采用Volterra级数模型和神经网络模型等。Volterra级数是对泰勒级数的扩展，该模型适用于弱非线性系统，而且系统的参数会随着阶次和记忆深度的增加而迅速增加，故计算量和收敛性受到了影响。而神经网络能够逼近任意非线性的函数，并且具有灵活有效的自组织学习能力，因而被广泛用于功率放大器系统的行为建模。普通的神经网络模型收敛速度较慢，建模的精度也一般。随着循环神经网络的提出，由于其将时序的概念引入到神经元结构设计中，使其在时序数据分析中表现出更强的适应性。循环神经网络的输出不仅与当前时刻的输入有关，也与前一个时刻的输入有关，模型带有很强的记忆效应。但是，传统的循环神经网络虽然可以利用上下文信息对当前时刻的输入进行建模得到相应的输出，然而在实际实验中发现，普通循环神经网络难以学到长时间跨度的依赖关系，也就是说，能够利用的上下文信息是有限的，因此普通循环神经网络在描述功放的长期记忆效应上表现一般。

发明内容

本发明所要解决的技术问题在于，提供一种基于编码-解码神经网络模型的功率放大器行为建模方法，收敛速度较快，在相同的迭代次数下具有更高的精度。

为解决上述技术问题，本发明提供一种基于编码-解码神经网络模型的功率放大器行为建模方法，包括如下步骤：

(1)采集功率放大器的输入信号数据向量x_in＝[x_in(1),x_in(2),…,x_in(N)]和输出信号数据向量y_out＝[y_out(1),y_out(2),…,y_out(N)]，其中，N为数据长度；

(2)将输入和输出数据进行归一化；得到归一化输入信号数据向量

和归一化输出信号数据向量

(3)初始化编码-解码神经网络模型；编码-解码神经网络模型的模型结构有四层：输入层、编码层、解码层和输出层；

(4)利用编码-解码神经网络模型对行为模型进行建模；

(5)通过步骤D得到的权系数，计算编码-解码神经网络模型最终的输出y_m。

优选的，步骤(2)中，输入和输出数据进行归一化具体为：

其中max(·)表示求向量中最大值的运算。

优选的，步骤(3)中，初始化编码-解码神经网络模型具体包括如下步骤：

(31)设置编码-解码神经网络模型输入层有P个神经元，接收归一化输入信号数据向量并将其传递到编码层；编码层有L₁个长短时记忆单元，每个编码层的长短时记忆单元有遗忘门传递函数f_ef(u)、输入门传递函数f_ei(u)、单元状态传递函数f_ec(u)、输出门传递函数f_eo(u)；解码层有L₂个长短时记忆单元，每个解码层的长短时记忆单元有遗忘门传递函数f_df(u)、输入门传递函数f_di(u)、单元状态传递函数f_dc(u)、输出门传递函数f_do(u)；其中u为函数的输入变量；输出层有M个神经元，该层神经元的输出y_m(m＝1,2…M)是解码层神经元输出的线性组合；

(32)在编码-解码神经网络模型中，有18种权系数矩阵：从输入层到编码层的N×1维权系数矩阵W^x；编码层前一时刻的输出到遗忘门的L₁×L₁维权系数矩阵W^efh；编码层的输入到遗忘门的L₁×N维权系数矩阵W^efx；编码层前一时刻的输出到输入门的L₁×L₁维权系数矩阵W^eih；编码层的输入到输入门的L₁×N维权系数矩阵W^eix；编码层前一时刻的输出到长短时记忆单元的L₁×L₁维权系数矩阵W^ech；编码层的输入到长短时记忆单元的L₁×N维权系数矩阵W^ecx；编码层前一时刻的输出到输出门的L₁×L₁维权系数矩阵W^eoh；编码层的输入到输出门的L₁×N维权系数矩阵W^efx；解码层前一时刻的输出到遗忘门的L₂×L₂维权系数矩阵W^dfh；解码层语义向量到遗忘门的L₂×L₁维权系数矩阵W^dfx；解码层前一时刻的输出到输入门的L₂×L₂维权系数矩阵W^dih；解码层语义向量到输入门的L₂×L₁维权系数矩阵W^dix；解码层前一时刻的输出到长短时记忆单元的L₂×L₂维权系数矩阵W^dch；解码层语义向量到长短时记忆单元的L₂×L₁维权系数矩阵W^dcx；解码层前一时刻的输出到输出门的L₂×L₂维权系数矩阵W^doh；解码层语义向量到输出门的L₂×L₁维权系数矩阵W^dox；从解码层到输出层的L₂×M维权系数矩阵W^y。所有权系数矩阵均采用Lecun均匀分布进行初始化；

(33)设置编码-解码神经网络模型训练最大迭代次为N_max；学习速率为η；误差函数阈值为ε。

优选的，步骤(4)中，利用编码-解码神经网络模型对行为模型进行建模具体包括如下步骤：

(41)根据编码-解码神经网络模型结构，计算编码-解码神经网络模型各层的输出：

y_m(t)＝W^y(t)D(t)

D(t)＝D_o(t)f_dh[c_d(t)]

D_o(t)＝f_do[W^doh(t)D(t-1)+W^dox(t)c(t)]

c_d(t)＝c_d(t-1)D_f(t)+D_i(t)D_c(t)

D_c(t)＝f_dc[W^dch(t)D(t-1)+W^dcx(t)c(t)]

D_i(t)＝f_di[W^dih(t)D(t-1)+W^dix(t)c(t)]

D_f(t)＝f_df[W^dfh(t)D(t-1)+W^dfx(t)c(t)]

c(t)＝E(t)

E(t)＝E_o(t)f_eh[c_e(t)]

E_o(t)＝f_eo[W^eoh(t)E(t-1)+W^eox(t)x_de(t)]

c_e(t)＝c_e(t-1)E_f(t)+E_i(t)E_c(t)

E_c(t)＝f_ec[W^ech(t)E(t-1)+W^ecx(t)x_de(t)]

E_i(t)＝f_ei[W^eih(t)E(t-1)+W^eix(t)x_de(t)]

E_f(t)＝f_ef[W^efh(t)E(t-1)+W^efx(t)x_de(t)]

其中，

表示第t次迭代时的归一化输入；x_de(t)表示第t次迭代时输入层的输出；E_f(t)表示第t次迭代时编码层遗忘门的输出；E_i(t)表示第t次迭代时编码层输入门的输出；E_c(t)表示第t次迭代时编码层的输入单元状态；c_e(t)表示第t次迭代时编码层的单元状态；E_o(t)表示第t次迭代时编码层输出门的输出；E(t)表示第t次迭代时编码层的输出；c(t)表示第t次迭代时的语义向量；D_f(t)表示第t次迭代时解码层遗忘门的输出；D_i(t)表示第t次迭代时解码层输入门的输出；D_c(t)表示第t次迭代时解码层的输入单元状态；c_d(t)表示第t次迭代时解码层的单元状态；D_o(t)表示第t次迭代时解码层输出门的输出；D(t)表示第t次迭代时解码层的输出；y_m(t)表示第t次迭代时编码-解码神经网络模型的最终输出；W^x(t)表示第t次迭代时从输入层到编码层的权系数矩阵，W^efh(t)表示第t次迭代时编码层前一时刻的输出到遗忘门的权系数矩阵；W^efx(t)表示第t次迭代时编码层的输入到遗忘门的权系数矩阵；W^eih(t)表示第t次迭代时编码层前一时刻的输出到输入门的权系数矩阵；W^eix(t)表示第t次迭代时编码层的输入到输入门的权系数矩阵；W^ech(t)表示第t次迭代时编码层前一时刻的输出到长短时记忆单元的权系数矩阵；W^ecx(t)表示第t次迭代时编码层的输入到长短时记忆单元的权系数矩阵；W^eoh(t)表示第t次迭代时编码层前一时刻的输出到输出门的权系数矩阵；W^eox(t)表示第t次迭代时编码层的输入到输出门的权系数矩阵；W^dfh(t)表示第t次迭代时解码层前一时刻的输出到遗忘门的权系数矩阵；W^dfx(t)表示第t次迭代时解码层语义向量到遗忘门的权系数矩阵；W^dih(t)表示第t次迭代时解码层前一时刻的输出到输入门的权系数矩阵；W^dix(t)表示第t次迭代时解码层语义向量到输入门的权系数矩阵；W^dch(t)表示第t次迭代时解码层前一时刻的输出到长短时记忆单元的权系数矩阵；W^dcx(t)表示第t次迭代时解码层语义向量到长短时记忆单元的权系数矩阵；W^doh(t)表示第t次迭代时解码层前一时刻的输出到输出门的权系数矩阵；W^dox(t)表示第t次迭代时解码层语义向量到遗忘输出门的权系数矩阵；W^y(t)表示第t次迭代时从解码层到输出层的权系数矩阵；传递函数

初始值E(0)＝1，D(0)＝1；

(42)计算目标误差函数，其定义为：

其中y_m(t)为第t次迭代时编码-解码神经网络模型的最终输出，

为归一化的系统的实际输出，上标T为矩阵的转置运算；

(43)用自适应矩估计算法训练编码-解码神经网络模型，得到模型的权值矩阵的变化量：

其中，

a_t＝β₁a_t-1+(1-β₁)g_t，b_t＝β₂b_t-1+(1-β₂)(g_t)²，β₁＝0.9，β₂＝0.999，μ＝10^-8，a₀＝1，b₀＝1，g_t表示第t次迭代时的梯度；

δ_dec＝[δ_df(t)]^TW^dfx(t)+[δ_di(t)]^TW^dix(t)+[δ_dc(t)]^TW^dcx(t)+[δ_do(t)]^TW^dox(t)

初始值c_e(0)＝1，c_d(0)＝1，ΔW^y(t)表示第t次迭代时解码层到输出层的权值矩阵的变化量，ΔW^x(t)表示第t次迭代时从输入层到编码层的权值矩阵的变化量，ΔW^dfh(t)表示第t次迭代时解码层前一时刻的输出到遗忘门的权值矩阵的变化量，ΔW^dfx(t)表示第t次迭代时解码层语义向量到遗忘门的权值矩阵的变化量，ΔW^dih(t)表示第t次迭代时解码层前一时刻的输出到输入门的权值矩阵的变化量，ΔW^dix(t)表示第t次迭代时解码层语义向量到输入门的权值矩阵的变化量，ΔW^dch(t)表示第t次迭代时解码层前一时刻的输出到长短时记忆单元的权值矩阵的变化量，ΔW^dcx(t)表示第t次迭代时解码层语义向量到长短时记忆单元门的权值矩阵的变化量，ΔW^doh(t)表示第t次迭代时解码层前一时刻的输出到输出门的权值矩阵的变化量，ΔW^dox(t)表示第t次迭代时解码层语义向量到输出门的权值矩阵的变化量，ΔW^efh(t)表示第t次迭代时编码层前一时刻的输出到遗忘门的权值矩阵的变化量，ΔW^efx(t)表示第t次迭代时编码层输入到遗忘门的权值矩阵的变化量，ΔW^eih(t)表示第t次迭代时编码层前一时刻的输出到输入门的权值矩阵的变化量，ΔW^eix(t)表示第t次迭代时编码层输入到遗忘门的权值矩阵的变化量，ΔW^ech(t)表示第t次迭代时编码层前一时刻的输出到长短时记忆单元的权值矩阵的变化量，ΔW^ecx(t)表示第t次迭代时编码层输入到长短时记忆单元的权值矩阵的变化量，ΔW^eoh(t)表示第t次迭代时编码层前一时刻的输出到输出门的权值矩阵的变化量，ΔW^eox(t)表示第t次迭代时编码层输入到输出门的权值矩阵的变化量；

(44)迭代次数加1，即t＝t+1；当目标误差函数大于误差阈值或者迭代次数小于最大迭代次数N_max时，继续步骤D-5；当目标误差函数小于误差阈值或者迭代次数大于最大迭代次数N_max时，停止迭代，执行步骤(5)；

(45)根据ΔW^y(t)，ΔW^dfh(t)，ΔW^dfx(t)，ΔW^dih(t)，ΔW^dix(t)，ΔW^dch(t)，ΔW^dcx(t)，ΔW^doh(t)，ΔW^dox(t)，ΔW^efh(t)，ΔW^efx(t)，ΔW^eih(t)，ΔW^eix(t)，ΔW^ech(t)，ΔW^ecx(t)，ΔW^eoh(t)，ΔW^eox(t)，ΔW^x(t)更新权值系数；

(46)返回步骤(41)。

本发明的有益效果为：本发明利用长短时记忆单元的输出除了与即时输入有关，也与历史输入有关的特点，用来描述功率放大器的记忆效应，同时在单元内部加入遗忘门、输入门、输出门等结构，加强了长短时记忆单元对长期记忆效应的描述能力；在此基础上又使用编码层将输入向量编码为语义向量，该语义向量包含大部分输入向量的特征，使用解码层解码语义向量得到输出，这种网络结构可以利用输入向量的大部分信息，在加快了模型收敛速度的同时又保证了模型的精度，非常有利于功放的行为建模；模型收敛速度较快，在相同的误差阈值下，编码-解码神经网络模型需要的迭代次数远小于普通的神经网络模型；在相同的迭代次数下，编码-解码神经网络模型比普通的神经网络模型具有更高的精度。

附图说明

图1为本发明的D类功率放大器黑盒模型示意图。

图2为本发明的编码-解码神经网络模型结构示意图。

图3为本发明的第t次迭代时单个编码层长短时记忆单元结构示意图。

图4为本发明的第t次迭代时单个解码层长短时记忆单元结构示意图。

图5为本发明的编码-解码神经网络模型输出的时域波形及误差结果示意图。

图6为本发明的编码-解码神经网络模型输出的频谱及误差结果示意图。

具体实施方式

以下以D类功率放大器为例，结合附图，详细说明本发明的实施方式。

D类功率放大器工作在开关状态，功率转换效率较高，是一种典型的非线性系统。如图1所示为D类功率放大器电路的黑盒模型。其中，输入的线性调频信号x_in幅度为8.5V，线性调频起始频率为2800Hz，调频带宽为400Hz。经过D类功率放大器后输出信号为y_out，并带有失真。利用PSpice仿真软件对功率放大器电路进行仿真后，采集2000个输入信号和输出信号作为实验数据进行行为建模，采样频率为100kHz。

本发明是一种基于编码-解码神经网络模型的功率放大器的行为建模方法，包括如下步骤：

步骤A：采集功率放大器的输入信号数据向量x_in＝[x_in(1),x_in(2),…,x_in(N)]和输出信号数据向量y_out＝[y_out(1),y_out(2),…,y_out(N)]，其中，N为数据长度。

步骤B：将输入和输出数据进行归一化；

其中max(·)表示求向量中最大值的运算。

得到归一化输入信号数据向量

和归一化输出信号数据向量

步骤C：初始化编码-解码神经网络模型。编码-解码神经网络模型的模型结构有四层：输入层、编码层、解码层和输出层，如图2所示。其过程如下：

步骤C-1：设置编码-解码神经网络模型输入层有P＝2000个神经元，接收归一化输入信号数据向量并将其传递到编码层；编码层有L₁＝30个长短时记忆单元，每个编码层的长短时记忆单元有遗忘门传递函数f_ef(u)、输入门传递函数f_ei(u)、单元状态传递函数f_ec(u)、输出门传递函数f_eo(u)，如图3所示；解码层有L₂＝30个长短时记忆单元，每个解码层的长短时记忆单元有遗忘门传递函数f_df(u)、输入门传递函数f_di(u)、单元状态传递函数f_dc(u)、输出门传递函数f_do(u)，如图4所示；其中u为函数的输入变量。输出层有M＝2000个神经元，该层神经元的输出y_m(m＝1,2…M)是解码层神经元输出的线性组合。

步骤C-2：在编码-解码神经网络模型中，有18种权系数矩阵：从输入层到编码层的N×1维权系数矩阵W^x；编码层前一时刻的输出到遗忘门的L₁×L₁维权系数矩阵W^efh；编码层的输入到遗忘门的L₁×N维权系数矩阵W^efx；编码层前一时刻的输出到输入门的L₁×L₁维权系数矩阵W^eih；编码层的输入到输入门的L₁×N维权系数矩阵W^eix；编码层前一时刻的输出到长短时记忆单元的L₁×L₁维权系数矩阵W^ech；编码层的输入到长短时记忆单元的L₁×N维权系数矩阵W^ecx；编码层前一时刻的输出到输出门的L₁×L₁维权系数矩阵W^eoh；编码层的输入到输出门的L₁×N维权系数矩阵W^efx；解码层前一时刻的输出到遗忘门的L₂×L₂维权系数矩阵W^dfh；解码层语义向量到遗忘门的L₂×L₁维权系数矩阵W^dfx；解码层前一时刻的输出到输入门的L₂×L₂维权系数矩阵W^dih；解码层语义向量到输入门的L₂×L₁维权系数矩阵W^dix；解码层前一时刻的输出到长短时记忆单元的L₂×L₂维权系数矩阵W^dch；解码层语义向量到长短时记忆单元的L₂×L₁维权系数矩阵W^dcx；解码层前一时刻的输出到输出门的L₂×L₂维权系数矩阵W^doh；解码层语义向量到输出门的L₂×L₁维权系数矩阵W^dox；从解码层到输出层的L₂×M维权系数矩阵W^y。所有权系数矩阵均采用Lecun均匀分布进行初始化。

步骤C-3：设置编码-解码神经网络模型训练最大迭代次为N_max＝30；学习速率为η＝0.04；误差函数阈值为ε＝0.01。

步骤D：利用编码-解码神经网络模型对行为模型进行建模，其过程如下：

步骤D-1：根据编码-解码神经网络模型结构，计算编码-解码神经网络模型各层的输出：

y_m(t)＝W^y(t)D(t)

D(t)＝D_o(t)f_dh[c_d(t)]

D_o(t)＝f_do[W^doh(t)D(t-1)+W^dox(t)c(t)]

c_d(t)＝c_d(t-1)D_f(t)+D_i(t)D_c(t)

D_c(t)＝f_dc[W^dch(t)D(t-1)+W^dcx(t)c(t)]

D_i(t)＝f_di[W^dih(t)D(t-1)+W^dix(t)c(t)]

D_f(t)＝f_df[W^dfh(t)D(t-1)+W^dfx(t)c(t)]

c(t)＝E(t)

E(t)＝E_o(t)f_eh[c_e(t)]

E_o(t)＝f_eo[W^eoh(t)E(t-1)+W^eox(t)x_de(t)]

c_e(t)＝c_e(t-1)E_f(t)+E_i(t)E_c(t)

E_c(t)＝f_ec[W^ech(t)E(t-1)+W^ecx(t)x_de(t)]

E_i(t)＝f_ei[W^eih(t)E(t-1)+W^eix(t)x_de(t)]

E_f(t)＝f_ef[W^efh(t)E(t-1)+W^efx(t)x_de(t)]

其中，

表示第t次迭代时的归一化输入；x_de(t)表示第t次迭代时输入层的输出；E_f(t)表示第t次迭代时编码层遗忘门的输出；E_i(t)表示第t次迭代时编码层输入门的输出；E_c(t)表示第t次迭代时编码层的输入单元状态；c_e(t)表示第t次迭代时编码层的单元状态；E_o(t)表示第t次迭代时编码层输出门的输出；E(t)表示第t次迭代时编码层的输出；c(t)表示第t次迭代时的语义向量；D_f(t)表示第t次迭代时解码层遗忘门的输出；D_i(t)表示第t次迭代时解码层输入门的输出；D_c(t)表示第t次迭代时解码层的输入单元状态；c_d(t)表示第t次迭代时解码层的单元状态；D_o(t)表示第t次迭代时解码层输出门的输出；D(t)表示第t次迭代时解码层的输出；y_m(t)表示第t次迭代时编码-解码神经网络模型的最终输出；W^x(t)表示第t次迭代时从输入层到编码层的权系数矩阵，W^efh(t)表示第t次迭代时编码层前一时刻的输出到遗忘门的权系数矩阵；W^efx(t)表示第t次迭代时编码层的输入到遗忘门的权系数矩阵；W^eih(t)表示第t次迭代时编码层前一时刻的输出到输入门的权系数矩阵；W^eix(t)表示第t次迭代时编码层的输入到输入门的权系数矩阵；W^ech(t)表示第t次迭代时编码层前一时刻的输出到长短时记忆单元的权系数矩阵；W^ecx(t)表示第t次迭代时编码层的输入到长短时记忆单元的权系数矩阵；W^eoh(t)表示第t次迭代时编码层前一时刻的输出到输出门的权系数矩阵；W^eox(t)表示第t次迭代时编码层的输入到输出门的权系数矩阵；W^dfh(t)表示第t次迭代时解码层前一时刻的输出到遗忘门的权系数矩阵；W^dfx(t)表示第t次迭代时解码层语义向量到遗忘门的权系数矩阵；W^dih(t)表示第t次迭代时解码层前一时刻的输出到输入门的权系数矩阵；W^dix(t)表示第t次迭代时解码层语义向量到输入门的权系数矩阵；W^dch(t)表示第t次迭代时解码层前一时刻的输出到长短时记忆单元的权系数矩阵；W^dcx(t)表示第t次迭代时解码层语义向量到长短时记忆单元的权系数矩阵；W^doh(t)表示第t次迭代时解码层前一时刻的输出到输出门的权系数矩阵；W^dox(t)表示第t次迭代时解码层语义向量到遗忘输出门的权系数矩阵；W^y(t)表示第t次迭代时从解码层到输出层的权系数矩阵；

传递函数

初始值E(0)＝1，D(0)＝1。

步骤D-2：计算目标误差函数，其定义为：

为归一化的系统的实际输出，上标T为矩阵的转置运算。

步骤D-3：用自适应矩估计算法训练编码-解码神经网络模型，得到模型的权值矩阵的变化量：

其中，

a_t＝β₁a_t-1+(1-β₁)g_t，b_t＝β₂b_t-1+(1-β₂)(g_t)²，β₁＝0.9，β₂＝0.999，μ＝10^-8，a₀＝1，b₀＝1，g_t表示第t次迭代时的梯度。

初始值c_e(0)＝1，c_d(0)＝1，ΔW^y(t)表示第t次迭代时解码层到输出层的权值矩阵的变化量，ΔW^x(t)表示第t次迭代时从输入层到编码层的权值矩阵的变化量，ΔW^dfh(t)表示第t次迭代时解码层前一时刻的输出到遗忘门的权值矩阵的变化量，ΔW^dfx(t)表示第t次迭代时解码层语义向量到遗忘门的权值矩阵的变化量，ΔW^dih(t)表示第t次迭代时解码层前一时刻的输出到输入门的权值矩阵的变化量，ΔW^dix(t)表示第t次迭代时解码层语义向量到输入门的权值矩阵的变化量，ΔW^dch(t)表示第t次迭代时解码层前一时刻的输出到长短时记忆单元的权值矩阵的变化量，ΔW^dcx(t)表示第t次迭代时解码层语义向量到长短时记忆单元门的权值矩阵的变化量，ΔW^doh(t)表示第t次迭代时解码层前一时刻的输出到输出门的权值矩阵的变化量，ΔW^dox(t)表示第t次迭代时解码层语义向量到输出门的权值矩阵的变化量，ΔW^efh(t)表示第t次迭代时编码层前一时刻的输出到遗忘门的权值矩阵的变化量，ΔW^efx(t)表示第t次迭代时编码层输入到遗忘门的权值矩阵的变化量，ΔW^eih(t)表示第t次迭代时编码层前一时刻的输出到输入门的权值矩阵的变化量，ΔW^eix(t)表示第t次迭代时编码层输入到遗忘门的权值矩阵的变化量，ΔW^ech(t)表示第t次迭代时编码层前一时刻的输出到长短时记忆单元的权值矩阵的变化量，ΔW^ecx(t)表示第t次迭代时编码层输入到长短时记忆单元的权值矩阵的变化量，ΔW^eoh(t)表示第t次迭代时编码层前一时刻的输出到输出门的权值矩阵的变化量，ΔW^eox(t)表示第t次迭代时编码层输入到输出门的权值矩阵的变化量。

步骤D-4：迭代次数加1，即t＝t+1。当目标误差函数大于误差阈值或者迭代次数小于最大迭代次数N_max时，继续步骤D-5；当目标误差函数小于误差阈值或者迭代次数大于最大迭代次数N_max时，停止迭代，执行步骤E。

步骤D-5：根据ΔW^y(t)，ΔW^dfh(t)，ΔW^dfx(t)，ΔW^dih(t)，ΔW^dix(t)，ΔW^dch(t)，ΔW^dcx(t)，ΔW^doh(t)，ΔW^dox(t)，ΔW^efh(t)，ΔW^efx(t)，ΔW^eih(t)，ΔW^eix(t)，ΔW^ech(t)，ΔW^ecx(t)，ΔW^eoh(t)，ΔW^eox(t)，ΔW^x(t)更新权值系数。

步骤D-6：返回步骤D-1。

步骤E：通过步骤D得到的权系数，计算编码-解码神经网络模型最终的输出y_m。

在隐含层神经元L₁＝L₂＝25，迭代次数为20的情况下，得到仿真电路输出信号时域波形、编码-解码神经网络模型输出信号时域波形以及时域误差曲线如图5所示，编码-解码神经网络模型的时域平均误差为0.0128V，时域最大瞬时误差为-0.1154V。仿真电路输出信号输出频谱、编码-解码神经网络模型输出信号频谱以及频谱误差曲线如图6所示，频域平均误差为4.0869dB。可以看到编码-解码神经网络模型很好地描述了功率放大器的记忆效应与非线性特性，具有较高的精度。

Claims

1.一种基于编码-解码神经网络模型的功率放大器行为建模方法，其特征在于，包括如下步骤：

(1)采集功率放大器的输入信号数据向量x_in＝[x_in(1)，x_in(2)，…，x_in(N)]和输出信号数据向量y_out＝[y_out(1)，y_out(2)，…，y_out(N)]，其中，N为数据长度；

和归一化输出信号数据向量

(4)利用编码-解码神经网络模型对行为模型进行建模；具体包括如下步骤：

y_m(t)＝W^y(t)D(t)

D(t)＝D_o(t)f_dh[c_d(t)]

D_o(t)＝f_do[W^doh(t)D(t-1)+W^dox(t)c(t)]

c_d(t)＝c_d(t-1)D_f(t)+D_i(t)D_c(t)

D_c(t)＝f_dc[W^dch(t)D(t-1)+W^dcx(t)c(t)]

D_i(t)＝f_di[W^dih(t)D(t-1)+W^dix(t)c(t)]

D_f(t)＝f_df[W^dfh(t)D(t-1)+W^dfx(t)c(t)]

c(t)＝E(t)

E(t)＝E_o(t)f_eh[c_e(t)]

E_o(t)＝f_eo[W^eoh(t)E(t-1)+W^eox(t)x_de(t)]

c_e(t)＝c_e(t-1)E_f(t)+E_i(t)E_c(t)

E_c(t)＝f_ec[W^ech(t)E(t-1)+W^ecx(t)x_de(t)]

E_i(t)＝f_ei[W^eih(t)E(t-1)+W^eix(t)x_de(t)]

E_f(t)＝f_ef[W^efh(t)E(t-1)+W^efx(t)x_de(t)]

其中，

表示第t次迭代时的归一化输入；x_de(t)表示第t次迭代时输入层的输出；E_f(t)表示第t次迭代时编码层遗忘门的输出；E_i(t)表示第t次迭代时编码层输入门的输出；E_c(t)表示第t次迭代时编码层的输入单元状态；c_e(t)表示第t次迭代时编码层的单元状态；E_o(t)表示第t次迭代时编码层输出门的输出；E(t)表示第t次迭代时编码层的输出；c(t)表示第t次迭代时的语义向量；D_f(t)表示第t次迭代时解码层遗忘门的输出；D_i(t)表示第t次迭代时解码层输入门的输出；D_c(t)表示第t次迭代时解码层的输入单元状态；c_d(t)表示第t次迭代时解码层的单元状态；D_o(t)表示第t次迭代时解码层输出门的输出；D(t)表示第t次迭代时解码层的输出；y_m(t)表示第t次迭代时编码-解码神经网络模型的最终输出；W^x(t)表示第t次迭代时从输入层到编码层的权系数矩阵，W^efh(t)表示第t次迭代时编码层前一时刻的输出到遗忘门的权系数矩阵；W_efx(t)表示第t次迭代时编码层的输入到遗忘门的权系数矩阵；W^eih(t)表示第t次迭代时编码层前一时刻的输出到输入门的权系数矩阵；W^eix(t)表示第t次迭代时编码层的输入到输入门的权系数矩阵；W^ech(t)表示第t次迭代时编码层前一时刻的输出到长短时记忆单元的权系数矩阵；W^ecx(t)表示第t次迭代时编码层的输入到长短时记忆单元的权系数矩阵；W^eoh(t)表示第t次迭代时编码层前一时刻的输出到输出门的权系数矩阵；W^eox(t)表示第t次迭代时编码层的输入到输出门的权系数矩阵；W^dfh(t)表示第t次迭代时解码层前一时刻的输出到遗忘门的权系数矩阵；W^dfx(t)表示第t次迭代时解码层语义向量到遗忘门的权系数矩阵；W^dih(t)表示第t次迭代时解码层前一时刻的输出到输入门的权系数矩阵；W^dix(t)表示第t次迭代时解码层语义向量到输入门的权系数矩阵；W^dch(t)表示第t次迭代时解码层前一时刻的输出到长短时记忆单元的权系数矩阵；W^dcx(t)表示第t次迭代时解码层语义向量到长短时记忆单元的权系数矩阵；W^doh(t)表示第t次迭代时解码层前一时刻的输出到输出门的权系数矩阵；W^dox(t)表示第t次迭代时解码层语义向量到遗忘输出门的权系数矩阵；W^y(t)表示第t次迭代时从解码层到输出层的权系数矩阵；传递函数

初始值E(0)＝1，D(0)＝1；

(42)计算目标误差函数，其定义为：

为归一化的系统的实际输出，上标T为矩阵的转置运算；

其中，

初始值c_e(0)＝1，c_d(0)＝1，ΔW^y(t)表示第t次迭代时解码层到输出层的权值矩阵的变化量，ΔW_x(t)表示第t次迭代时从输入层到编码层的权值矩阵的变化量，ΔW^dfh(t)表示第t次迭代时解码层前一时刻的输出到遗忘门的权值矩阵的变化量，ΔW^dfx(t)表示第t次迭代时解码层语义向量到遗忘门的权值矩阵的变化量，ΔW^dih(t)表示第t次迭代时解码层前一时刻的输出到输入门的权值矩阵的变化量，ΔW^dix(t)表示第t次迭代时解码层语义向量到输入门的权值矩阵的变化量，ΔW^dch(t)表示第t次迭代时解码层前一时刻的输出到长短时记忆单元的权值矩阵的变化量，ΔW^dcx(t)表示第t次迭代时解码层语义向量到长短时记忆单元门的权值矩阵的变化量，ΔW^doh(t)表示第t次迭代时解码层前一时刻的输出到输出门的权值矩阵的变化量，ΔW^dox(t)表示第t次迭代时解码层语义向量到输出门的权值矩阵的变化量，ΔW^efh(t)表示第t次迭代时编码层前一时刻的输出到遗忘门的权值矩阵的变化量，ΔW^efx(t)表示第t次迭代时编码层输入到遗忘门的权值矩阵的变化量，ΔW^eih(t)表示第t次迭代时编码层前一时刻的输出到输入门的权值矩阵的变化量，ΔW^eix(t)表示第t次迭代时编码层输入到遗忘门的权值矩阵的变化量，ΔW^ech(t)表示第t次迭代时编码层前一时刻的输出到长短时记忆单元的权值矩阵的变化量，ΔW^ecx(t)表示第t次迭代时编码层输入到长短时记忆单元的权值矩阵的变化量，ΔW^eoh(t)表示第t次迭代时编码层前一时刻的输出到输出门的权值矩阵的变化量，ΔW^eox(t)表示第t次迭代时编码层输入到输出门的权值矩阵的变化量；

(44)迭代次数加1，即t＝t+1；当目标误差函数大于误差阈值或者迭代次数小于最大迭代次数N_max时，继续步骤(45)；当目标误差函数小于误差阈值或者迭代次数大于最大迭代次数N_max时，停止迭代，执行步骤(5)；

(46)返回步骤(41)；

(5)通过步骤(4)得到的权系数，计算编码-解码神经网络模型最终的输出y_m。

2.如权利要求1所述的基于编码-解码神经网络模型的功率放大器行为建模方法，其特征在于，步骤(2)中，输入和输出数据进行归一化具体为：

其中max(·)表示求向量中最大值的运算。

3.如权利要求1所述的基于编码-解码神经网络模型的功率放大器行为建模方法，其特征在于，步骤(3)中，初始化编码-解码神经网络模型具体包括如下步骤：

(31)设置编码-解码神经网络模型输入层有P个神经元，接收归一化输入信号数据向量并将其传递到编码层；编码层有L₁个长短时记忆单元，每个编码层的长短时记忆单元有遗忘门传递函数f_ef(u)、输入门传递函数f_ei(u)、单元状态传递函数f_ec(u)、输出门传递函数f_eo(u)；解码层有L₂个长短时记忆单元，每个解码层的长短时记忆单元有遗忘门传递函数f_df(u)、输入门传递函数f_di(u)、单元状态传递函数f_dc(u)、输出门传递函数f_do(u)；其中u为函数的输入变量；输出层有M个神经元，该层神经元的输出y_m是解码层神经元输出的线性组合，m＝1，2...M；

(32)在编码-解码神经网络模型中，有18种权系数矩阵：从输入层到编码层的N×1维权系数矩阵W^x；编码层前一时刻的输出到遗忘门的L₁×L₁维权系数矩阵W^efh；编码层的输入到遗忘门的L₁×N维权系数矩阵W^efx；编码层前一时刻的输出到输入门的L₁×L₁维权系数矩阵W^eih；编码层的输入到输入门的L₁×N维权系数矩阵W^eix；编码层前一时刻的输出到长短时记忆单元的L₁×L₁维权系数矩阵W^ech；编码层的输入到长短时记忆单元的L₁×N维权系数矩阵W^ecx；编码层前一时刻的输出到输出门的L₁×L₁维权系数矩阵W^eoh；编码层的输入到输出门的L₁×N维权系数矩阵W^efx；解码层前一时刻的输出到遗忘门的L₂×L₂维权系数矩阵W^dfh；解码层语义向量到遗忘门的L₂×L₁维权系数矩阵W^dfx；解码层前一时刻的输出到输入门的L₂×L₂维权系数矩阵W^dih；解码层语义向量到输入门的L₂×L₁维权系数矩阵W^dix；解码层前一时刻的输出到长短时记忆单元的L₂×L₂维权系数矩阵W^dch；解码层语义向量到长短时记忆单元的L₂×L₁维权系数矩阵W^dcx；解码层前一时刻的输出到输出门的L₂×L₂维权系数矩阵W^doh；解码层语义向量到输出门的L₂×L₁维权系数矩阵W^dox；从解码层到输出层的L₂×M维权系数矩阵W^y，所有权系数矩阵均采用Lecun均匀分布进行初始化；