CN116488974A

CN116488974A - 一种结合注意力机制的轻量化调制识别方法和系统

Info

Publication number: CN116488974A
Application number: CN202310280791.7A
Authority: CN
Inventors: 马昭; 方胜良; 范有臣; 马淑丽; 李石磊; 胡豪杰; 董芳; 董尧尧; 温晓敏
Original assignee: Peoples Liberation Army Strategic Support Force Aerospace Engineering University
Current assignee: Peoples Liberation Army Strategic Support Force Aerospace Engineering University
Priority date: 2023-03-20
Filing date: 2023-03-20
Publication date: 2023-07-25
Anticipated expiration: 2043-03-20
Also published as: CN116488974B

Abstract

本发明涉及一种结合注意力机制的轻量化调制识别方法和系统，其中，该方法包括：设计一种混合特征提取骨干网络，在该骨干网络中，设计不同形式的卷积分支，通过不同形式的卷积核，从各“视角”学习I/Q信号的时空特征；将各卷积分支所输出的特征图进行通道融合；使用多个小卷积核提取深层时域特征，在每个卷积核后采用最大池化层降低数据维度；在每一个特征提取部分，引入通道注意力机制；采用自适应池化层将每个通道的特征图压缩成一个新的特征值，并只采用一个全连接层进行分类。本发明基于卷积神经网络设计了一种轻量化的混合特征提取骨干网络，并在骨干网络中附加通道注意力模块，在几乎不增加模型参数和体积的情况下使模型性能更好。

Description

一种结合注意力机制的轻量化调制识别方法和系统

技术领域

本发明属于认知无线通信领域，具体涉及一种结合注意力机制的轻量化调制识别方法和系统。

背景技术

信号调制识别即根据接收到的无线电信号来判别信号的调制体制，是对接收信号进行进一步处理的基础。随着通信技术的发展，现代通信系统中的信号调制体制愈发复杂，因此调制识别任务也更加的困难。快速准确的识别出信号的调制方式是非合作通信场景下实现高效频谱感知和频谱利用的重要前提，更是近年来无线通信领域研究的重点课题之一。

传统的信号调制识别方法可分为基于最大似然理论的方法和基于专家特征的方法。基于似然理论的方法是在得到每种调制信号的统计特性的基础上，构建判决准则，建立最大似然分类器。但由于其计算复杂度较高、适用范围很窄，故在实际场景中应用较少。基于专家特征的方法是将接收信号通过特定分析和处理，变换到某种特征空间，然后再设计分类器进行分类。该类方法的识别精度依赖于所提取的统计特征，且受限于传统分类器的较弱学习能力，因此其最终识别精度普遍较低。

近年来，为了解决传统方法在信号调制识别领域的局限性，研究人员开始将具有强大特征提取能力和自学习能力的深度学习方法应用自动调制识别问题。O’SHEA等在2016年首先提出了一种采用卷积神经网络(CNN)直接处理原始同相正交(In-phase andQuadrature，IQ)信号的调制识别方法，并开源了数据集(RML2016.10a)，吸引了大量研究人员参与其中，促进了该领域的发展。Dehua Hong等注意到RNN在时序特征提取上的优势，将RNN引入到了自动调制识别问题的研究中，并取得了不错的效果。Nathan E.West等则将CNN和LSTM在空间特征和时序特征上的优势结合起来，提出了识别精度更高的CLDNN网络。Jialang Xu等则同时从调制数据的单个和组合的同相/正交(I/Q)符号中提取特征，提出了一种MCLDNN框架，进一步证明了混合网络的可行性。随着研究的深入，基于深度学习的AMC模型的识别精度也在逐步提高，但代价是更大的模型体量和更高的计算复杂度。而在如今的5G通信、卫星通信和物联网等实际应用场景中，无法部署过大的网络模型，并且对模型快速响应有着极高的要求，因此研究高精度且轻量化的调制识别模型至关重要。

因此，如何以较小的计算代价实现更高的调制识别精度，是本领域技术人员亟待解决的技术问题。

发明内容

为实现本发明目的提供的一种结合注意力机制的轻量化调制识别方法，包括：

步骤S101：设计三种不同形式的卷积分支，分别提取原始I/Q信号的特征，每个卷积分支输出特征图的通道数分别记为C₁、C₂、C₃；

步骤S102：将步骤S101中各个卷积分支输出的特征图进行通道融合，得到混合特征图；

步骤S103：使用多个小卷积核对所述混合特征图进行深层时域特征提取，并在每个卷积核后采用最大池化层降低数据维度；

步骤S104：在每一个特征提取部分，引入通道注意力机制，用于提升模型特征表达的能力；

步骤S105：采用自适应平均池化层将每个通道的特征图压缩成一个新的特征值，并只采用一个全连接层进行分类。

在其中一些具体实施例中，所述步骤S101包括：设计三种形式的卷积核，从三个卷积分支分别提取信号特征，其中，第一个卷积分支采用3×2的卷积核，用于提取所述I/Q信号的通用特征；第二个卷积分支采用3×1的卷积核，分别提取I、Q两路的时域特征，再通过一个1×2的卷积核用于提取深层I/Q信号的相关特征；第三个卷积分支采用一个1×2的卷积核，提取I/Q信号的相关特征。

在其中一些具体实施例中，所述步骤S103中，采用多个3×1的小卷积核来提取所述特征图的深层时域特征，在保证感受野的条件下减少卷积核参数数量；并且在每个卷积核后再采用最大池化层降低数据维度，进一步降低时域方向计算量。

在其中一些具体实施例中，所述步骤S104中，所述注意力机制通过自学习的方式获取特征图的每个通道的重要程度，根据所述重要程度赋予每个特征一个权重值，并和其对应的通道特征图相乘，得到矫正后的特征图。

在其中一些具体实施例中，所述注意力机制包括压缩操作(Squeeze)、激励操作(Excitation)操作和通道相乘(Scale)操作，所述压缩操作通过全局平均池化将每个通道的二维特征映射U(H×W)压缩为1个通道描述符z，z的第c个元素计算公式如下：

其中，F_sq(u_c)代表对第c个通道的特征映射u_c进行压缩操作，H、W分别代表特征图的高度和宽度；

所述激励操作用于完全捕获通道依赖关系，通过采用两个1×1大小的卷积层对所述压缩操作得到的特征权重向量进行激活操作，并通过Sigmoid激活函数将通道权重控制在0～1之间。

所述通道相乘操作是将上述得到的归一化通道权重加权到每个通道的特征上，即将特征权重和原始特征图相乘，得到校准后的特征映射。

为实现上述目的，本发明还提供一种结合注意力机制的轻量化调制识别系统，包括：

混合特征提取单元，用于设计三种不同形式的卷积分支，分别提取原始I/Q信号的特征，每个卷积分支输出特征图的通道数分别记为C₁、C₂、C₃；

特征融合单元，用于将步骤S101中各个卷积分支输出的特征图进行通道融合，得到混合特征图；

时域特征提取单元，用于使用多个小卷积核对所述混合特征图进行深层时域特征提取，并在每个卷积核后采用最大池化层降低数据维度；

注意力机制单元，用于在每一个特征提取部分，引入通道注意力机制，以提升模型特征表达的能力；

分类单元，用于根据自适应平均池化层将每个通道的特征图压缩成一个新的特征值，并只采用一个全连接层进行分类。

在其中一些具体实施例中，所述混合特征提取单元包括：设计三种形式的卷积核，从三个卷积分支分别提取信号特征，其中，第一个卷积分支采用3×2的卷积核，用于提取所述I/Q信号的通用特征；第二个卷积分支采用3×1的卷积核，分别提取I、Q两路的时域特征，再通过一个1×2的卷积核用于提取深层I/Q信号的相关特征；第三个卷积分支采用一个1×2的卷积核，提取I/Q信号的相关特征。

在其中一些具体实施例中，所述时域特征提取单元中，采用多个3×1的小卷积核来提取所述特征图的深层时域特征，在保证感受野的条件下减少卷积核参数数量；并且在每个卷积核后再采用最大池化层降低数据维度，进一步降低时域方向计算量。

在其中一些具体实施例中，所述注意力机制单元中，注意力机制通过自学习的方式获取特征图的每个通道的重要程度，根据所述重要程度赋予每个特征一个权重值，并和其对应的通道特征图相乘，得到矫正后的特征图。

在其中一些具体实施例中，所述注意力机制单元包括压缩模块、激励模块和通道相乘模块，所述压缩模块通过全局平均池化将每个通道的二维特征映射U(H×W)压缩为1个通道描述符z，z的第c个元素计算公式如下：

所述激励模块用于完全捕获通道依赖关系，通过采用两个1×1大小的卷积层对经过压缩操作得到的特征权重向量进行激活操作，并通过Sigmoid激活函数将通道权重控制在0～1之间；

所述通道相乘模块是将上述得到的归一化通道权重加权到每个通道的特征上，即将特征权重和原始特征图相乘，得到校准后的特征映射。

本发明的有益效果：

(1)本发明的一种结合注意力机制的轻量化调制识别方法和系统基于卷积神经网络设计混合特征提取骨干网络，设计了3种不同形式的卷积核，从不同的“视角”提取原始IQ序列中的特征，并进行通道融合，得到混合特征图，能够更加有效的提取信号特征。还设计了时域卷积模块对混合特征图进行深层时域特征提取，采用了较小的卷积核，减少计算量。一方面，这种方式减小单一形式卷积特征提取带来的特征混淆，从而提高了信号识别的精度；另一方面，相比有些研究中为了提升识别精度利用信号不同形式的数据(IQ序列，图像，AP数据)，本发明提供的方法仅仅需要利用原始的IQ序列，数据利用率更高，模型更加轻量，并且性能更好。

(2)本发明还在混合特征提取骨干网络中附加了轻量的通道注意力模块，进一步提升模型特征表达的能力，通道注意力机制的引入能够在基本不增加模型参数的情况下，提升模型性能。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一种结合注意力机制的轻量化调制识别方法一些具体实施例的流程示意图；

图2是本发明一种结合注意力机制的轻量化调制识别方法结合注意力机制的混合特征提取网络的结构示意图；

图3是本发明一种结合注意力机制的轻量化调制识别方法中注意力机制的结构示意图；

图4是本发明一种结合注意力机制的轻量化调制识别系统一些具体实施例的结构示意图；

图5是本发明一种结合注意力机制的轻量化调制识别方法和系统一些具体实施例的实验数据对比图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。

所述实施例的示例在附图中示出，其中自始至终相同或类似的符号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

现有技术中，在调制识别领域过深的网络并不能够带来网络性能的提升，反而会增加网络参数和计算量，造成过拟合现象。因此，本发明通过增加网络的宽度来提高网络特征提取的能力和对原始数据的信息利用率。针对原始I/Q信号，重新设计了网络的特征提取部分，来减少计算量，提高数据处理效率。

参照图1、图2所示，本发明提出了一种结合注意力机制的轻量化调制识别方法，包括：

步骤S101：设计三种不同形式的卷积分支，分别提取原始I/Q信号的特征，每个卷积分支输出特征图的通道数分别记为C₁、C₂、C₃。

具体的，设计三种形式的卷积核，从三个卷积分支分别提取信号特征：第一个卷积分支采用3×2的卷积核(Conv1)，用于提取I/Q信号的通用特征；第二个卷积分支采用3×1的卷积核(Conv2)，分别提取I、Q两路的时域特征，再通过一个1×2的卷积核(Conv4)用于提取深层I/Q信号的相关特征；第三个卷积分支采用一个1×2的卷积核(Conv3)，提取I/Q信号的相关特征。通过以上三个卷积分支，可以充分利用复信号I、Q之间幅度及相位信息，提取不同层次不同角度的特征。经过相应的卷积运算，每个卷积分支的输出特征图的水平维度也由2缩减为1，后续计算量减小了50％。同时，在每一个卷积分支末尾，添加一个步幅为(2，1)最大池化层用于减小时域方向的特征图维度，进一步减小了输出特征图的大小，减小了后续的计算代价。

步骤S102：将步骤S101中各个卷积分支输出的特征图进行通道融合，得到混合特征图。

具体的，对三个卷积分支输出的特征图进行通道融合(Channel Concat)，得到原始信号的混合特征图。每个卷积分支的输出特征图的通道数为C₁、C₂、C₃，则该模块的最终输出特征图的尺寸为(C，N/2，1)，其中C＝C₁+C₂+C₃。

步骤S103：使用多个小卷积核对所述混合特征图进行深层时域特征提取，并在每个卷积核后采用最大池化层降低数据维度。

具体的，借鉴VGG网络中的经验，采用多个3×1的小卷积核来提取深层时域特征，在保证感受野的条件下减少卷积核参数数量；并且在每个卷积核后再采用最大池化层降低数据维度，进一步降低时域方向计算量。

步骤S104：根据注意力机制(SE block)根据特征图所在的通道的重要程度赋予每个特征一个权重值，并和其对应的通道特征图相乘，得到矫正后的特征图。

在本发明一些具体实施例中，注意力机制通过自学习的方式获取特征图的每个通道的重要程度，根据其重要程度赋予每个特征一个权重值。所谓注意力机制，也就是将关注焦点放在对当前任务更为关键的信息上，对这一区域投入更多注意力资源，以获取更多所需要关注目标的细节信息，而抑制其他无用信息，从而提高任务处理的效率和准确性。

在本发明一些具体实施例中，参照图3所示，注意力机制(SE block)的实现过程包括压缩(Squeeze)操作和激励(Excitation)操作和通道相乘(Scale)操作，压缩操作通过全局平均池化将每个通道的二维特征映射U(H×W)压缩为1个通道描述符z，z的第c个元素计算公式如下：

激励操作用于完全捕获通道依赖关系，通过采用两个1×1大小的卷积层对压缩操作得到的特征权重向量进行激活操作，并通过Sigmoid激活函数将通道权重控制在0～1之间；

通道相乘操作是将上述得到的归一化通道权重加权到每个通道的特征上，即将特征权重和原始特征图相乘，得到校准后的特征映射。

具体的，用自适应池化层(Adaptive Pooling)替代通常的Flatten操作，将每个通道的特征图压缩成一个新的特征值，提升网络的泛化性能；最后在分类时仅采用一个全连接层，避免采用多个全连接层带来大量的训练参数和计算量。

在本发明一些具体实施例中，在卷积层与其激活函数之间，增加了批归一化操作(Batch Normalization,BN)来增加模型的鲁棒性和训练速度，防止网络过拟合；其中，网络采用ReLU作为激活函数，在分类层采用Sigmoid作为分类函数。

参照图4所示，为实现上述目的，本发明还提供了一种结合注意力机制的轻量化调制识别系统，包括：

混合特征提取单元10：设计三种不同形式的卷积分支，分别提取原始I/Q信号的特征，每个卷积分支输出特征图的通道数分别记为C₁、C₂、C₃；

在本发明一些具体实施例中，混合特征提取单元10包括：设计三种形式的卷积核，从三个卷积分支分别提取信号特征：第一个卷积分支采用3×2的卷积核，用于提取I/Q信号的通用特征；第二个卷积分支采用3×1的卷积核，分别提取I、Q两路的时域特征，再通过一个1×2的卷积核用于提取深层I/Q信号的相关特征；第三个卷积分支采用一个1×2的卷积核，提取I/Q信号的相关特征。

特征融合单元20：用于将步骤S101中各个卷积分支输出的特征图进行通道融合，得到混合特征图。

具体的，对三个卷积分支输出的特征图进行通道融合，得到原始I/Q信号的混合特征图。每个卷积分支的输出特征图的通道数为C₁、C₂、C₃，则该模块的最终输出特征图的尺寸为(C，N/2，1)，其中C＝C₁+C₂+C₃。

时域特征提取单元30：用于使用多个小卷积核对所述混合特征图进行深层时域特征提取，并在每个卷积核后采用最大池化层降低数据维度。

具体的，采用多个3×1的小卷积核来提取深层时域特征，在保证感受野的条件下减少卷积核参数数量；并且在每个卷积核后再采用最大池化层降低数据维度，进一步降低时域方向计算量。

注意力机制单元40：用于在每一个特征提取部分，引入通道注意力机制，以提升模型特征表达的能力。

具体的，注意力机制单元40中，注意力机制通过自学习的方式获取特征图的每个通道的重要程度，根据重要程度赋予每个特征一个权重值，并和其对应的通道特征图相乘，得到矫正后的特征图。

具体的，注意力机制单元40包括压缩模块和激励模块，压缩模块通过全局平均池化将每个通道的二维特征映射U(H×W)压缩为1个通道描述符z，z的第c个元素计算公式如下：

激励模块用于完全捕获通道依赖关系，通过采用两个1×1大小的卷积层对经过压缩操作得到的特征权重向量进行激活操作，并通过Sigmoid激活函数将通道权重控制在0～1之间；

将上述得到的归一化通道权重加权到每个通道的特征上，即将特征权重和原始特征图相乘，得到校准后的特征映射U。

分类单元50：用于根据自适应平均池化层将每个通道的特征图压缩成一个新的特征值，并只采用一个全连接层进行分类。

在本发明一些具体实施例中，骨干网络模型，即，HFECNET-CA(C₁,C₂,C₃,H)模型的结构参数是可以灵活配置的。HFECNET-CA由1个混合特征提取层和H个时域特征提取层组成，其中混合特征提取层总共包含C个特征通道。为表示不同的结构参数的HFECNET-CA网络，用HFECNET-CA(C₁,C₂,C₃,H)表示具体的结构参数。C₁,C₂,C₃分别表示混合特征提取部分三个卷积分支的通道数，H表示时域特征提取层的层数。同时，当不使用附加的通道注意力模块时，HFECNET-CA(C₁,C₂,C₃,H)退化为HFECNET(C₁,C₂,C₃,H)。

参照图5所示，为验证本发明提出信号调制识别模型HFECNET-CA(C₁,C₂,C₃,H)性能的优越性，将HFECNET-CA(32,32,32,4)与IC-AMCNET、GRU2、CLDNN、MCLDNN、MCNet、PET-CGDNN这六种当下最新的自动调制识别模型进行了比较。实验对比的性能指标包括：模型参数量，单个epoch的训练时间，单个样本的测试响应时间，最高识别精度以及20个信噪比下的平均识别精度。

实验结果如表1所示，HFECNET-CA(32,32,32,4)模型的参数量为47979，远低于其他基准模型，而其最高识别精度达到了94.90％，比其他基准模型高出了约2％～10％；在所有信噪比下的平均识别精度更是达到了64.4％，高出其他基准模型约2％～9％。总的来说，与其他基础模型相比，HFECNET-CA(32,32,32,4)具有最小的参数量，但实现了最优的识别性能。

所有模型在20个信噪比下的识别精度对比曲线，从图中可以看出HFECNET-CA(32,32,32,4)在所有信噪比下都具有最优的识别性能。

表1各模型在RML2016.10A数据集上的比较

本发明中的方法和系统通过设计混合特征提取骨干网络结构，与当下已有的信号自动调制识别模型相比，具有使用最小的网络参数量，达到了最高的识别精度的优点。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、“一个具体实施例”或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种结合注意力机制的轻量化调制识别方法，其特征在于，包括：

2.根据权利要求1所述的结合注意力机制的轻量化调制识别方法，其特征在于，所述步骤S101包括：设计三种形式的卷积核，从三个卷积分支分别提取信号特征，其中，第一个卷积分支采用3×2的卷积核，用于提取所述I/Q信号的通用特征；第二个卷积分支采用3×1的卷积核，分别提取I、Q两路的时域特征，再通过一个1×2的卷积核用于提取深层I/Q信号的相关特征；第三个卷积分支采用一个1×2的卷积核，提取I/Q信号的相关特征。

3.根据权利要求1所述的结合注意力机制的轻量化调制识别方法，其特征在于，所述步骤S103中，采用多个3×1的小卷积核来提取所述特征图的深层时域特征，在保证感受野的条件下减少卷积核参数数量；并且在每个卷积核后再采用最大池化层降低数据维度，进一步降低时域方向计算量。

4.根据权利要求1所述的结合注意力机制的轻量化调制识别方法，其特征在于，所述步骤S104中，所述注意力机制通过自学习的方式获取特征图的每个通道的重要程度，根据所述重要程度赋予每个特征一个权重值，并和其对应的通道特征图相乘，得到矫正后的特征图。

5.根据权利要求4所述的结合注意力机制的轻量化调制识别方法，其特征在于，所述注意力机制包括压缩操作、激励操作和通道相乘操作，所述压缩操作通过全局平均池化将每个通道的二维特征映射U(H×W)压缩为1个通道描述符z，z的第c个元素计算公式如下：

6.一种结合注意力机制的轻量化调制识别系统，其特征在于，包括：

7.根据权利要求6所述的结合注意力机制的轻量化调制识别系统，其特征在于，所述混合特征提取单元用于设计三种形式的卷积核，从三个卷积分支分别提取信号特征，其中，

第一个卷积分支采用3×2的卷积核，用于提取所述I/Q信号的通用特征；

第二个卷积分支采用3×1的卷积核，分别提取I、Q两路的时域特征，再通过一个1×2的卷积核用于提取深层I/Q信号的相关特征；

第三个卷积分支采用一个1×2的卷积核，提取I/Q信号的相关特征。

8.根据权利要求6所述的结合注意力机制的轻量化调制识别系统，其特征在于，所述时域特征提取单元用于采用多个3×1的小卷积核来提取所述特征图的深层时域特征，在保证感受野的条件下减少卷积核参数数量；并且在每个卷积核后再采用最大池化层降低数据维度，进一步降低时域方向计算量。

9.根据权利要求8所述的结合注意力机制的轻量化调制识别系统，其特征在于，所述注意力机制单元中，采用注意力机制通过自学习的方式获取特征图的每个通道的重要程度，根据所述重要程度赋予每个特征一个权重值，并和其对应的通道特征图相乘，得到矫正后的特征图。

10.根据权利要求8所述的结合注意力机制的轻量化调制识别系统，其特征在于，所述注意力机制单元包括压缩模块、激励模块和通道相乘模块，所述压缩模块通过全局平均池化将每个通道的二维特征映射U(H×W)压缩为1个通道描述符z，z的第c个元素计算公式如下：