CN115238748B

CN115238748B - 一种基于Transformer和决策融合的调制识别方法

Info

Publication number: CN115238748B
Application number: CN202210933054.8A
Authority: CN
Inventors: 焦逊; 岳秀清; 孔维思; 廖东升; 陈亮; 李喜朋
Original assignee: Institute of Systems Engineering of PLA Academy of Military Sciences
Current assignee: Institute of Systems Engineering of PLA Academy of Military Sciences
Priority date: 2022-08-04
Filing date: 2022-08-04
Publication date: 2024-04-23
Anticipated expiration: 2042-08-04
Also published as: CN115238748A

Abstract

本发明涉及一种基于Transformer和决策融合的调制识别方法，属于信号识别领域。本发明对获取到的离散复信号进行预处理，转换成I/Q和A/P序列；对于I/Q序列和A/P序列，经过卷积嵌入提取序列的空间特征，获得高维的嵌入向量序列；经过改进的Transformer模型，提取不同位置特征向量之间的依赖关系，输出包含全局相关性的编码向量序列；所有位置的编码向量经过注意力池化、线性变换和Softmax操作后输出决策特征向量和决策概率分布；I/Q和A/P两路的决策特征向量和决策概率分布经过自适应加权机制，获得决策融合后的联合决策向量和联合决策概率分布，输出联合识别结果；设置联合损失函数，利用训练样本集对网络模型的参数更新。本发明有效提高调制识别的准确性。

Description

一种基于Transformer和决策融合的调制识别方法

技术领域

本发明属于信号识别领域，具体涉及一种基于Transformer和决策融合的调制识别方法。

背景技术

目前，各种无线电子设备的广泛适用和密集部署，使得电磁环境呈现出高度复杂、高实时响应、信息不完整和边界不确定的特点。在无线通信系统中，为保证有限频谱资源的高效化利用，需要对用户所占用的频谱资源进行监测和管理，如何从复杂的电磁数据中提取出信号调制样式、空闲频谱、未知干扰源等有效信息具有重要意义。此外，在DZDK中需要利用各种探测技术对非合作的辐射源信号进行截获、定位、分析和识别，以获取辐射源的位置、类型和技术参数等关键信息。

传统的信号识别方法主要基于循环平稳特征检测、高阶矩特征提取等信号处理工具，以及结合支持向量机、决策树、k邻近等机器学习技术。这些信号识别技术通常依赖于人工专家特征的提取，需要大量的领域知识和工程知识，识别过程较为复杂且较为费时。深度学习技术和硬件计算能力的快速发展，为高效准确的信号识别提供了新的解决途径。

多种基于深度学习的自动调制识别网络模型被提出:O'Shea T J直接以同相正交(I/Q)序列作为网络输入，通过卷积层与全连接层串联而成的CNN模型，证明了深度神经网络在调制识别上的可行性；S.Rajendran对IQ数据进行预处理，获得信号的幅度相位(A/P)序列，通过两层LSTM模型建模信号序列的时间依赖关系，进一步提高了识别精度；XiaoyuLiu则利用CNN和LSTM提出CLDNN模型，实现对I/Q序列的空间和时间特征的联合提取。为进一步提高自动调制识别的准确性，部分学者通过对信号进行预处理，获得信号的不同表现形式，分别利用深度神经网络获得对应的判别结果，再通过决策融合方法实现多路信号的联合调制样式识别。Tuo Wang将离散信号预处理成I/Q、A/P序列和星座图的形式，I/Q和A/P序列经过卷积层、注意力模块和循环神经网络层输出判别结果，星座图则通过对ResNet-50模型迁移学习输出判别结果，两路判别结果经相乘运算后获得最终的识别结果。ShilianZheng将I/Q序列等间隔划分为多个短的子序列，每个子序列经过基于残差结构的CNN模型输出相应判别结果，再将所有决策概率向量进行相加实现基于信任的决策融合。相比之下，Shuo Chang通过实验分析发现I/Q序列在低信噪比(SNR<0)时具有更高的识别准确率，而A/P序列则在高信噪比(SNR>0)时具有更高的识别准确率，根据此发现，利用神经网络模型判断信号是否处于高信噪比状态，实现基于信号状态加权的决策融合识别。

综上所述，现有技术存在的问题是：

(1)用于自动调制识别的网络架构主要采用CNN模型、RNN模型，以及两者结合的形式，通过多个卷积层、循环神经网络层和全连接层叠加，最终输出信号类别的概率分布。然而，CNN模型中的卷积层只能提取局部特征，其感受野有限，通常需要堆叠一个深度网络才能拥有全局感受野；RNN模型需要按时间节点依次输入和处理来建模信号的时间依赖关系，并行处理能力较差且容易出现长序列的记忆遗忘问题；全连接模型可以建模全局依赖关系，而每个神经元的权重固定，且输入输出维度固定。

(2)为提高识别精度，部分论文将信号预处理成多种表示形式，实现基于决策融合的多路联合调制识别。决策融合方法常采用相加、相乘、置信权重相加的形式，而不同调制信号在同一网络模型下判别结果的可信性难以量化，上述决策融合方法没有充分挖掘每类信号、每种表现形式、每个网络的判别结果的可信性，使得基于决策融合的调制识别精度没有得到充分提升。

解决上述技术问题的难度：如何改进现有的深度学习模型，在可行的计算复杂度下提高调制识别的准确率；在基于决策融合的联合调制识别中，如何考虑决策结果的可信度，进一步提高自动调制识别的准确性。本发明的研究意义在于：通过将原始信号进行的简单处理，获得信号的不同表示形式，通过改进现有的深度学习模型，在计算复杂度变化不大的情况下有效提高单路信号的识别准确率；考虑信号不同表示形式经过深度神经网络输出的判别结果的不确定性，利用自适应加权的决策融合方法，进一步提高识别精度，增强用于调制识别的网络模型的稳定性和可行性。

发明内容

(一)要解决的技术问题

本发明要解决的技术问题是如何提供一种基于Transformer和决策融合的调制识别方法，以解决如何改进现有的深度学习模型，在可行的计算复杂度下提高调制识别的准确率；在基于决策融合的联合调制识别中，如何考虑决策结果的可信度，进一步提高自动调制识别的准确性的问题。

(二)技术方案

为了解决上述技术问题，本发明提出一种基于Transformer和决策融合的调制识别方法，该方法包括如下步骤：

S1:对获取到的离散复信号进行预处理，转换成I/Q和A/P序列；

S2：对于I/Q序列，首先经过卷积嵌入提取序列的空间特征，获得高维的嵌入向量序列；经过改进的Transformer模型，提取不同位置特征向量之间的依赖关系，输出包含全局相关性的编码向量；

S3：I/Q序列所有位置的编码向量经过注意力池化、线性变换和Softmax操作后输出决策特征向量和决策概率分布；

S4：A/P序列经过与S2、S3中相同的网络架构获得相对应的决策特征向量和决策概率分布；

S5：I/Q和A/P两路的决策特征向量和决策概率分布经过自适应加权机制，获得决策融合后的联合决策向量和联合决策概率分布，输出联合识别结果；

S6：设置联合损失函数，利用训练样本集对网络模型的参数更新。

(三)有益效果

本发明提出一种基于Transformer和决策融合的调制识别方法，本发明的优点及积极效果为：相较于现有技术，本发明利用改进的Transformer模型，分别提取I/Q和A/P序列不同位置特征向量之间的依赖关系，分别获得两路模型的调制类型判别结果，在可行的计算复杂度下有效提高调制识别的准确性；相较于现有技术，利用自适应加权的决策融合技术和联合交叉熵损失函数，进一步提高调制识别的准确率。

附图说明

图1是本发明提供的一种基于Transformer和决策融合的调制识别方法流程图；

图2是本发明实施例提供的卷积嵌入模型示意图；

图3是本发明实施例提供的Transformer编码器示意图；

图4是本发明实施例提供的带有注意力偏置的自注意力模块示意图；

图5是本发明实施例提供的注意力池化模块和分类器模型示意图；

图6是测试集上SNR＝-20时的调制识别混淆矩阵；

图7是测试集上SNR＝0时的调制识别混淆矩阵；

图8是测试集上SNR＝18时的调制识别混淆矩阵；

图9是不同方法在测试集上的准确率对比图。

具体实施方式

为使本发明的目的、内容和优点更加清楚，下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。

为了解决上述问题，本发明提供一种基于Transformer和决策融合的调制识别方法，将原始信号预处理成I/Q序列和A/P序列的表示形式，通过改进的Transformer模型分别获得两序列对应的调制样式判别结果，利用自适应加权的决策融合方法获得联合调制识别结果，有效提高识别精度。

一种基于Transformer和决策融合的调制识别方法，包括以下步骤：

S1:对获取到的离散复信号进行预处理，转换成I/Q和A/P序列；

S2：对于I/Q序列，首先经过卷积嵌入提取序列的空间特征，获得高维的嵌入向量序列；经过改进的Transformer模型，提取不同位置特征向量之间的依赖关系，输出包含全局相关性的编码向量序列；

进一步，所述的步骤S1具体为：

假设获取到长度为N的离散信号表示为：

s[n]＝s_I[n]+js_Q[n],n＝0,1,…N-1

其中，s_I[n]、s_Q[n]分别为离散信号的同相和正交分量。

I/Q序列表示为：

A/P序列表示为：

其中，幅度分量相位分量此外，由于信号的幅度分量和相位分量通常不在同一量级，为便于网络模型训练优化，对幅度分量进行L2归一化处理，相位分量则归一化至[-1,1]。

进一步，所述的步骤S2具体为：

(S2.1)I/Q序列经过多个卷积层，提取数据的空间特征，将数据从低维空间映射到高维空间，获得Transformer模型输入所需要的高维嵌入向量。经过卷积嵌入后得到d维的嵌入向量组成的嵌入向量序列M为嵌入后的序列长度。

(S2.2)嵌入向量序列x_IQ经过L层相同结构的Transformer编码器，计算不同位置特征向量之间的相关性。假设每层编码器输出的编码向量为z″_IQ，对应的数学表达式为：

z'_IQ＝LN(Drop(MSA(x_IQ))+x_IQ)

z″_IQ＝LN(Drop(MLP(z'_IQ))+z'_IQ)

其中，LN表示层归一化处理，Drop表示神经单元随机丢失的Dropout操作，MSA表示多头自注意力模块，MLP则表示全连接前馈网络。Transformer编码器主要利用MSA模块捕获不同位置的特征向量之间的相关性，得到考虑不同位置相关性的编码向量；然后利用MLP模块筛选特征向量中的有用信息。Dropout、残差结构(上述公式中的“+”)和层归一化都是为了避免梯度消失和梯度爆炸，使网络更加稳定。

进一步，所述的步骤S2.2中的MSA具体为：

对于MSA模块公式表示为：

MSA(x_IQ)＝Concat(head₁,…,head_h)w^O

其中，Concat表示h个子头head的特征维度拼接，w^O为线性变换权重。第i个子头head_i具体表示为：

其中，为线性变换权重，Attention计算具体表示为：

其中，B为向特征向量添加位置信息的注意力偏置矩阵，d_k为保证Softmax操作后权值一致的常数因子。矩阵B中(x,y)坐标处的元素b_x,y＝BD_x-y表示q_x与k_y之间的位置偏置值，其中q_x为矩阵Q的第x行，k_y为矩阵K的第y行，BD则表示嵌入生成的位置编码字典，|x-y|表示其中的索引值。

进一步，所述的步骤S2.2中的MLP具体为：

对于MLP模块，包含两个线性变换层和ReLU激活函数，公式表示为：

MLP(z'_IQ)＝max(0,z'_IQw₁+b₁)w₂+b₂

其中，w₁和w₂表示线性权重，b₁和b₂则为偏置项。

进一步，所述的步骤S3具体为：

(S3.1)假设I/Q序列经过步骤S2后输出编码向量序列从向量的空间维度进行线性池化，得到不同位置向量对应的权重系数，利用Softmax操作将权重进行归一化，然后再加权求和，得到注意力池化输出的特征向量/> 公式表示为：

e_IQ＝(Softmax(o_IQw_e+b_e))^To_IQ

其中，为线性权重，/>为偏置项。

(S3.2)维度为d的特征向量e_IQ经过全连接层转化为维度为R的决策特征向量R表示调制样式的总类别数，公式表示为：

r_IQ＝e_IQw_p+b_p

其中，和/>为全连接层的权重和偏置。

(S3.3)决策特征向量r_IQ经过Softmax操作得到归一化的决策概率分布具体公式为：

p_IQ＝Softmax(r_IQ),

进一步，所述的步骤S4具体为：

A/P序列经过与S2、S3中相同的网络架构，获得相同维度的决策特征向量r_AP和决策概率分布p_AP。

进一步，所述的步骤S5具体为：

(S5.1)决策特征向量r_IQ和r_AP合并，经过全连接层和Softmax层，获得归一化的权重值，公式表示为：

其中，分别为线性权重和偏置项。

(S5.2)根据I/Q和A/P两路的决策权重，通过加权求和操作，获得联合决策向量，公式表示为：

f＝β₁p_IQ+β₂p_AP

(S5.2)通过Softmax层进一步获得基于决策融合的联合决策概率分布p_fusion，公式表示为：

p_fusion＝Softmax(f)

(S5.2)由此获得信号调制样式的联合识别结果：Max(p_fusion)。

进一步，所述的步骤S6具体为：

利用已有的样本训练集，将第i个原始信号sⁱ经S1预处理后，送入S2～S5所描述的调制识别网络模型，获得I/Q和A/P两路以及融合后的联合决策概率分布，设置联合交叉熵损失函数，对整个网络进行参数更新。损失函数表示为：

其中，N为样本数目，y_i为第i个样本对应的调制类别标签，分别为第i个样本对应的联合决策概率分布、I/Q决策概率分布和A/P决策概率分布。

为了使本发明的目的、技术方案更加清楚明白，一下结合实施例，对本发明进行进一步地详细说明。应当理解，此处所描述的具体实例仅仅用以解释本发明，并不用于限定本发明。

本发明通过将接收到的离散复信号预处理为I/Q和A/P序列，利用改进的Transformer模型分别获得I/Q和A/P序列的编码向量和识别结果，采用自适应加权的决策融合策略，结合联合交叉熵损失函数，有效提高自动调制识别的准确性和鲁棒性。

下面结合附图对本发明的网络模型和方法作详细描述。

如图1所示，本发明实施例提供的一种基于Transformer和决策融合的调制识别方法，包括以下步骤：

S1:对获取到的离散复信号进行预处理，转换成I/Q和A/P序列；

S5：I/Q和A/P两路的决策特征向量和决策概率分布经过自适应加权机制，获得决策融合后的联合决策概率分布，进而输出联合识别结果；

下面结合附图对本发明的应用原理作进一步的描述。

本发明实施例提供的一种基于Transformer和决策融合的调制识别方法，包括以下步骤：

S1：假设获取到长度为N的离散信号表示为：

s[n]＝s_I[n]+js_Q[n],n＝0,1,…N-1

其中，s_I[n]、s_Q[n]分别为离散信号的同相和正交分量。则I/Q序列表示形式为：

对于A/P序列可以表示为：

其中，此外，由于信号的幅度分量和相位分量通常不在同一量级，为便于网络模型训练优化，对幅度分量进行L2归一化处理，相位分量则归一化至[-1,1]。

本实施例中采用包含CPFSK、GFSK、PAM4、QAM16、QAM64、QPSK and WBFM共11类调制样式的无线通信数据集。数据集的SNR从-20dB以2dB等间隔增加到18dB，共20个SNR。每类信号每个SNR有1000个样本，每个样本的长度N＝128，故I/Q向量和A/P向量的维度为2×128。数据集的主要参数设置如下表1所示：

表1无线通信数据集的参数设置

参数	取值
		采样频率	200KHz
采样频率偏移标准差	0.01Hz
		最大采样频谱偏移	50Hz
子载波频率偏移标准差	0.01Hz
		最大子载波频率偏移	500Hz
最大多普勒频移	1
		衰落信道模型	Rician
莱斯K-系数	4
		信道时延	[0.0,0.9,1.7]
信道时延幅度	[1,0.8,0.3]
		插值滤波器长度	8

S2：I/Q序列经过卷积嵌入和Transformer编码器提取序列不同位置特征向量之间的依赖关系，获得包含全局特征关系的编码向量，具体为：

(S2.1)I/Q序列经过如图2所示的卷积嵌入模块，提取数据的空间特征，将数据从低维空间映射到高维空间，获得Transformer模型输入所需要的高维嵌入向量。实施例中，经过卷积嵌入得到维度d＝80的特征向量序列128为嵌入后的序列长度。

(S2.2)嵌入向量序列x_IQ经过如图3所示的Transformer编码器，计算不同位置特征向量之间的相关性。实施例中设置Transformer编码器的层数为2，假设每层编码器输出的编码向量为z″_IQ，对应的数学表达式为：

z'_IQ＝LN(Drop(MSA(x_IQ))+x_IQ)

z″_IQ＝LN(Drop(MLP(z'_IQ))+z'_IQ)

其中，LN表示层归一化处理，Drop表示神经单元随机丢失的Dropout操作，MSA表示多头自注意力模块，MLP则表示全连接前馈网络。Transformer编码器主要利用MSA模块捕获不同位置的特征向量之间的相关性，得到考虑不同位置相关性的编码向量；然后利用MLP模块筛选特征向量中的有用信息。Dropout、残差结构和层归一化都是为了避免梯度消失和梯度爆炸，使网络更加稳定。

进一步，所述的步骤S2.2中的MSA具体为：

对于MSA模块公式表示为：

MSA(x_IQ)＝Concat(head₁,...,head_h)w^O

其中，Concat表示h个子头head的特征维度拼接，w^O为线性变换权重，实施例中设置h＝4。第i个子头head_i具体表示为：

其中，为线性变换权重，实施例中设置每个子头变换后的Q、K、V的维度分别是10,10,20，降低注意力模块的计算复杂度。正如图4所示，Attention计算可以表示为：

其中，B为向特征向量添加位置信息的注意力偏置矩阵，d_k为保证Softmax操作后权值一致的常数因子。矩阵B中(x,y)坐标处的元素b_x,y＝BD_x-y表示q_x与k_y之间的位置偏置值，其中q_x为矩阵Q的第x行，k_y为矩阵K的第y行，BD则表示嵌入生成的位置编码字典，|x-y|表示其中的索引值。实施例中BD的维度为128×4，4表示多头数，即每个注意力头都有对应的位置编码字典。

进一步，所述的步骤S2.2中的MLP具体为：

MLP(z'_IQ)＝max(0,z'_IQw₁+b₁)w₂+b₂

其中，w₁和w₂表示线性权重，b₁和b₂则为偏置项，实施例中设置dim_mlp＝160。

S3：I/Q序列的全部编码向量经过如图5所示的注意力池化层、线性变换层和Softmax层，获得调制样式识别的决策特征向量和决策概率分布，具体为：

(S3.1)I/Q序列经过步骤S2后输出编码向量序列从向量的空间维度进行线性池化，得到不同位置向量对应的权重系数，利用Softmax操作将权重归一化，然后对所有位置的特征向量加权求和，得到注意力池化层输出的特征向量/>公式表示为：

e_IQ＝(Softmax(o_IQw_e+b_e))^To_IQ

其中，为线性权重，/>为偏置项。

(S3.2)维度为d的特征向量e_IQ经过全连接层转化为维度为11的决策特征向量公式表示为：

r_IQ＝e_IQw_p+b_p

其中，和/>为全连接层的权重和偏置。

p_IQ＝Softmax(r_IQ),

S4：A/P序列经过与S2、S3中相同的网络架构，获得相同维度的决策特征向量r_AP和决策概率分布p_AP。

S5：利用自适应加权的决策融合机制，得到最终的联合识别结果，具体为：

其中，分别为线性权重和偏置项。

f＝β₁p_IQ+β₂p_AP

p_fusion＝Softmax(f)

(S5.2)由此获得信号调制样式的联合识别结果：Max(p_fusion)。

S6：利用S1所述的数据集，将第i个原始信号sⁱ经预处理后，送入如图1所示的调制识别网络，获得I/Q和A/P两路以及融合后的决策概率分布，设置联合交叉熵损失函数，对整个网络进行反向更新。损失函数表示为：

其中，N为样本数目，y_i为第i个样本对应的调制类别标签，分别为第i个样本对应的融合决策概率分布、I/Q决策概率分布和A/P决策概率分布。

为验证模型的可行性，利用S1中描述的无线通信数据集进行仿真实验，对分类结果进行分析，并与现有方法进行对比。仿真实验中，随机从每个类别每个SNR中按7:3的比例分成训练集和验证集，训练回合数为50，学习率设置为10^-3，采用Adam优化器，批尺寸为1024。

从图6至图8可以发现，随着SNR的增加，该专利提出的调制识别方法的准确率不断增加。当SNR＝18时，大多数调制样式的识别率接近于1，只有WBFM和AM-DSB这两种调制样式容易发生混淆，原因在于这两种调制样式都是模拟调制，具有相似的幅度包络，以及随机噪声的干扰。

为了体现该专利所提出的方法的可行性，仿真实验中与CNN、LSTM_AP、CLDNN_IQ、CLDNN_AP、DSCLDNN模型进行了对比，这几种方法都是基于CNN和LSTM模型实现特征提取和分类。DSCLDNN模型则是将I/Q和A/P序列分别经过CNN和LSTM模型获得深度特征，再利用外积运算实现特征融合。正如图9所示，本专利提出的基于Transformer和决策融合的调制识别方法，在整个测试集的所有SNR情况下都取得了最高的识别率，最高识别率达到93.18％，由此证明该模型具有很好的稳定性。

仿真实验中还对各方法的浮点运算量、参数量、准确率进行了对比，正如表2所示。Transformer-IQ模型是指直接采用原始的Transformer模型，采用sin-cos位置编码和最大池化的方法实现I/Q序列的调制识别。通过仿真实验分析，采用注意力偏置和注意力池化方法，能够保证浮点运算量和模型参数量变动不大的情况下，模型在测试集上的平均准确率迅速提升。此外，对于A/P序列，采用包含注意力偏置和注意力池化的Transformer模型，使得相比于CLDNN模型，平均准确率也有了大幅提升。当采用改进的Transformer模型时，结合决策融合、联合损失函数方法，平均准确率进一步提升。但值得注意的是，在当前实施例中，本专利方法的计算复杂度和识别率不构成正比，效率偏低。

表2各自动调制识别方法的计算复杂度与准确率对比情况

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所做的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

综上所述，本发明的优点及积极效果为：相较于现有技术，本发明利用改进的Transformer模型，分别提取I/Q和A/P序列不同位置特征向量之间的依赖关系，分别获得两路模型的调制类型判别结果，在可行的计算复杂度下有效提高调制识别的准确性；相较于现有技术，利用自适应加权的决策融合技术和联合交叉熵损失函数，进一步提高调制识别的准确率。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种基于Transformer和决策融合的调制识别方法，其特征在于，该方法包括如下步骤：

S1:对获取到的离散复信号进行预处理，转换成I/Q和A/P序列；

S6：设置联合损失函数，利用训练样本集对网络模型的参数更新；

其中，

所述步骤S1具体包括：

假设获取到长度为N的离散信号表示为：

s[n]＝s_I[n]+js_Q[n],n＝0,1,…N-1

其中，s_I[n]、s_Q[n]分别为离散信号的同相和正交分量；

I/Q序列表示为：

A/P序列表示为：

其中，幅度分量相位分量

所述步骤S2具体包括：

(S2.1)I/Q序列经过多个卷积层，提取数据的空间特征，将数据从低维空间映射到高维空间，获得Transformer模型输入所需要的高维嵌入向量序列；经过卷积嵌入后得到M个d维的嵌入向量组成的嵌入向量序列M为嵌入后的序列长度；

(S2.2)嵌入向量序列x_IQ经过L层相同结构的Transformer编码器，计算不同位置特征向量之间的相关性；假设每层编码器输出的编码向量为z”_IQ，对应的数学表达式为：

z'_IQ＝LN(Drop(MSA(x_IQ))+x_IQ)

z”_IQ＝LN(Drop(MLP(z'_IQ))+z'_IQ)

其中，LN表示层归一化处理，Drop表示神经单元随机丢失的Dropout操作，MSA表示多头自注意力模块，MLP则表示全连接前馈网络。

2.如权利要求1所述的基于Transformer和决策融合的调制识别方法，其特征在于，对幅度分量进行L2归一化处理，相位分量则归一化至[-1,1]。

3.如权利要求1所述的基于Transformer和决策融合的调制识别方法，其特征在于，所述步骤S2.2中：

MSA模块公式表示为：

MSA(x_IQ)＝Concat(head₁,…,head_h)w^O

其中，Concat表示h个子头head的特征维度的拼接，w^O为线性变换权重；第i个子头head_i具体表示为：

其中，为线性变换权重，Attention计算具体表示为：

其中，B为向特征向量添加位置信息的注意力偏置矩阵，d_k为保证Softmax操作后权值一致的常数因子；矩阵B中(x,y)坐标处的元素b_x,y＝BD_|x-y|表示q_x与k_y之间的位置偏置值，其中q_x为矩阵Q的第x行，k_y为矩阵K的第y行，BD则表示嵌入生成的位置编码字典，|x-y|表示其中的索引值。

4.如权利要求1所述的基于Transformer和决策融合的调制识别方法，其特征在于，所述步骤S2.2中的MLP具体为：

MLP模块包含两个线性变换层和ReLU激活函数，公式表示为：

MLP(z'_IQ)＝max(0,z'_IQw₁+b₁)w₂+b₂

其中，w₁和w₂表示线性权重，b₁和b₂则为偏置项。

5.如权利要求3或4所述的基于Transformer和决策融合的调制识别方法，其特征在于，所述步骤S3具体包括：

(S3.1)假设I/Q序列经过步骤S2后输出编码向量序列从向量的空间维度进行线性池化，得到不同位置向量对应的权重系数，利用Softmax操作将权重进行归一化，然后再加权求和，得到注意力池化输出的特征向量/>公式表示为：

e_IQ＝(Softmax(o_IQw_e+b_e))^To_IQ

其中，为线性权重，/>为偏置项；

r_IQ＝e_IQw_p+b_p

其中，和/>为全连接层的权重和偏置；

p_IQ＝Softmax(r_IQ)。

6.如权利要求5所述的基于Transformer和决策融合的调制识别方法，其特征在于，所述步骤S4具体包括：A/P序列经过与S2、S3中相同的网络架构，获得相同维度的决策特征向量r_AP和决策概率分布p_AP。

7.如权利要求6所述的基于Transformer和决策融合的调制识别方法，其特征在于，所述步骤S5具体包括：

其中，分别为线性权重和偏置项；

f＝β₁p_IQ+β₂p_AP

p_fusion＝Softmax(f)

(S5.2)由此获得信号调制样式的联合识别结果：Max(p_fusion)。

8.如权利要求7所述的基于Transformer和决策融合的调制识别方法，其特征在于，所述步骤S6具体包括：利用已有的样本训练集，将第i个原始信号sⁱ经S1预处理后，送入S2～S5所描述的调制识别网络模型，获得I/Q和A/P两路以及融合后的联合决策概率分布，设置联合交叉熵损失函数，对整个网络进行参数更新；损失函数表示为：