CN116778969A

CN116778969A - 一种基于双通道交叉注意力的域适应的心音分类方法

Info

Publication number: CN116778969A
Application number: CN202310744420.XA
Authority: CN
Inventors: 舒明雷; 李金萌; 王英龙; 周书旺; 徐鹏摇
Original assignee: Qilu University of Technology; Shandong Institute of Artificial Intelligence
Current assignee: Qilu University of Technology; Shandong Institute of Artificial Intelligence
Priority date: 2023-06-25
Filing date: 2023-06-25
Publication date: 2023-09-19
Anticipated expiration: 2043-06-25
Also published as: CN116778969B

Abstract

一种基于双通道交叉注意力的域适应的心音分类方法，涉及心音信号分类技术领域，提取心音信号的梅尔倒谱系数作为特征，之后搭建双通道交叉注意力的域自适应分类模型，通过双向交叉注意力实现特征的域自适应学习，既实现了源域心音信号的学习，又能实现目标域心音信号的学习，减少域差异对分类结果的影响。

Description

一种基于双通道交叉注意力的域适应的心音分类方法

技术领域

本发明涉及心音信号分类技术领域，具体涉及一种基于双通道交叉注意力的域适应的心音分类方法。

背景技术

心音信号是一种能够很好的检测心脏机械运动的声音信号，心脏的不同的状态会反映出不同的心音信号特征，通过深度学习可以实现心音信号的分类。但是，当前心音信号的采集设备的质量和标准不一样，导致了心音信号的特征分布显著不同，目前常用的深度学习模型往往会偏向于大多数训练数据的来源，所以，在不同的听诊器和不同的环境下，采集的心音数据会显著影响网络模型对心音信号的分类性能，域差异会很大程度上影响最终心音的分类结果。

发明内容

本发明为了克服以上技术的不足，提供了一种减少域差异对分类结果的影响的心音分类方法。

本发明克服其技术问题所采用的技术方案是：

一种基于双通道交叉注意力的域适应的心音分类方法，包括如下步骤：

a)获取心音信号数据构成源域数据及获取心音信号数据构成目标域数据；

b)提取源域数据中的心音信号的梅尔倒谱系数，得到源域数据特征矩阵X^s，提取目标域数据中的心音信号的梅尔倒谱系数，得目标域数据特征矩阵X^t；

c)建立双通道交叉注意力的域自适应分类模型，双通道交叉注意力的域自适应分类模型由卷积层、Relu激活函数层、Batch Normalization层、第一DIDA模块、第二DIDA模块、第三DIDA模块、全局平均池化层、Droupout层、Dense层、Softmax函数层构成，第一DIDA模块、第二DIDA模块、第三DIDA模块均由上层通道和下层通道构成；

d)将源域数据特征矩阵X^s输入到双通道交叉注意力的域自适应分类模型的卷积层中，输出得到特征将特征依次输入到双通道交叉注意力的域自适应分类模型的Relu激活函数层及Batch Normalization层中，输出得到特征

e)将特征输入到第一DIDA模块的上层通道中，输出得到特征将特征输入到第二DIDA模块的上层通道中，输出得到特征将特征输入到第三DIDA模块的上层通道中，输出得到特征

f)将特征依次输入到双通道交叉注意力的域自适应分类模型的全局平均池化层、Droupout层、Dense层中，输出得到特征将特征输入到双通道交叉注意力的域自适应分类模型的Softmax函数层映射得到0到1区间概率分布的标签y，标签y为0时表示心音信号为正常信号，标签y为1时表示心音信号为异常信号；

g)将目标域数据特征矩阵X^t输入到双通道交叉注意力的域自适应分类模型的卷积层中，输出得到特征将特征依次输入到双通道交叉注意力的域自适应分类模型的Relu激活函数层及Batch Normalization层中，输出得到特征

h)将特征输入到第一DIDA模块的下层通道中，输出得到特征将特征输入到第二DIDA模块的上层通道中，输出得到特征将特征输入到第三DIDA模块的上层通道中，输出得到特征i)将特征依次输入到双通道交叉注意力的域自适应分类模型的全局平均池化层、Droupout层、Dense层中，输出得到特征将特征输入到双通道交叉注意力的域自适应分类模型的Softmax函数层映射得到0到1区间概率分布的标签y′，标签y′为0时表示心音信号为正常信号，标签y为1时表示心音信号为异常信号。

优选的，步骤a)中将Physionet2016心音数据库作为源域数据，将Khan心音数据库作为目标域数据，源域数据中的心音信号和目标域数据中的心音信号的时长均设置为5秒，采样率均为16000Hz。

优选的，步骤b)中梅尔倒谱系数的维度设置为40。

优选的，双通道交叉注意力的域自适应分类模型的卷积层的卷积核大小为3×3，步长为2。

进一步的，步骤e)包括如下步骤：

e-1)第一DIDA模块的上层通道由第一Layer Normalization层、多头注意力机制、第一Linear线性层、第二Linear线性层、第二Layer Normalization层构成，将特征输入到上层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到上层通道的多头注意力机制中通过公式计算得到特征式中Concat(·)为拼接操作，W^O为随机产生的参数矩阵，head_i为多头注意力机制第i个头，i∈{1,2,...,n}，n为多头注意力机制的头的总数，softmax(·)为Softmax函数，W_i ^Q、W_i ^K、W_i ^V均为随机产生的参数矩阵，T为转置，Q_s为多头注意力机制的查询向量，K_s为多头注意力机制的键向量，V_s为多头注意力机制的值向量，d为查询向量Q_s的矩阵维度，均为随机产生的参数矩阵，将特征与特征进行特征融合后依次输入到上层通道的第一Linear线性层、第二Linear线性层、第二LayerNormalization层中，输出得到特征e-2)第二DIDA模块的上层通道由第一LayerNormalization层、多头注意力机制、第一Linear线性层、第二Linear线性层、第二LayerNormalization层构成，将特征输入到上层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到上层通道的多头注意力机制中通过公式计算得到特征式中，head_i′为多头注意力机制第i个头，Q_s′为多头注意力机制的查询向量，K_s′为多头注意力机制的键向量，V_s′为多头注意力机制的值向量，d′为查询向量Q_s′的矩阵维度，将特征与特征进行特征融合后依次输入到上层通道的第一Linear线性层、第二Linear线性层、第二LayerNormalization层中，输出得到特征e-3)第三DIDA模块的上层通道由第一LayerNormalization层、多头注意力机制、第一Linear线性层、第二Linear线性层、第二LayerNormalization层构成，将特征输入到上层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到上层通道的多头注意力机制中通过公式计算得到特征式中，head_i″为多头注意力机制第i个头，Q_s″为多头注意力机制的查询向量，K_s″为多头注意力机制的键向量，V_s″为多头注意力机制的值向量，d″为查询向量Q_s″的矩阵维度，将特征与特征进行特征融合后依次输入到上层通道的第一Linear线性层、第二Linear线性层、第二LayerNormalization层中，输出得到特征

优选的，n取值为8，d、d′、d″取值均为40。

进一步的，步骤h)包括如下步骤：

h-1)第一DIDA模块的下层通道由第一Layer Normalization层、第一多头注意力机制、第一Linear线性层、第二多头注意力机制、第二Layer Normalization层、第二Linear线性层、第三线性层、第三Layer Normalization层构成，将特征输入到下层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到下层通道的第一多头注意力机制中通过公式计算得到特征式中W_t ^O为随机产生的参数矩阵，为多头注意力机制第i个头，i∈{1,2,...,n}，W_i ^K,t、W_i ^V,t均为随机产生的参数矩阵，K_t为多头注意力机制的键向量，V_t为多头注意力机制的值向量，均为随机产生的参数矩阵，将特征输入到下层通道的第一Linear线性层，输出得到特征将特征输入到下层通道的第二多头注意力机制中通过公式计算得到特征式中为随机产生的参数矩阵，为多头注意力机制第i个头，i∈{1,2,...,n}，W_i ^st、W_i ^t,s,k、W_i ^t,s,v均为随机产生的参数矩阵，Q_st为多头注意力机制的查询向量，K_ts为多头注意力机制的键向量，V_ts为多头注意力机制的值向量，均为随机产生的参数矩阵，为随机产生的参数矩阵，为多头注意力机制第i个头，i∈{1,2,...,n}，Q_t为多头注意力机制的查询向量，均为随机产生的参数矩阵，将特征输入到下层通道的第二Layer Normalization层中，输出得到特征将特征依次输入到下层通道的第二Linear线性层、第三线性层、第三Layer Normalization层中，输出得到特征将特征与特征进行特征融合，得到特征h-2)第二DIDA模块的下层通道由第一Layer Normalization层、第一多头注意力机制、第一Linear线性层、第二多头注意力机制、第二Layer Normalization层、第二Linear线性层、第三线性层、第三Layer Normalization层构成，将特征输入到下层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到下层通道的第一多头注意力机制中通过公式计算得到特征式中为多头注意力机制第i个头，i∈{1,2,...,n}，K_t′为多头注意力机制的键向量，V_t′为多头注意力机制的值向量，将特征输入到下层通道的第一Linear线性层，输出得到特征将特征输入到下层通道的第二多头注意力机制中通过公式计算得到特征式中为多头注意力机制第i个头，i∈{1,2,...,n}，Q_st′为多头注意力机制的查询向量，K_ts′为多头注意力机制的键向量，V_ts′为多头注意力机制的值向量，为多头注意力机制第i个头，i∈{1,2,...,n}，Q_t′为多头注意力机制的查询向量，将特征输入到下层通道的第二Layer Normalization层中，输出得到特征将特征依次输入到下层通道的第二Linear线性层、第三线性层、第三Layer Normalization层中，输出得到特征将特征与特征进行特征融合，得到特征h-3)第三DIDA模块的下层通道由第一Layer Normalization层、第一多头注意力机制、第一Linear线性层、第二多头注意力机制、第二Layer Normalization层、第二Linear线性层、第三线性层、第三Layer Normalization层构成，将特征输入到下层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到下层通道的第一多头注意力机制中通过公式计算得到特征式中为多头注意力机制第i个头，i∈{1,2,...,n}，K_t″为多头注意力机制的键向量，V_t″为多头注意力机制的值向量，将特征输入到下层通道的第一Linear线性层，输出得到特征将特征输入到下层通道的第二多头注意力机制中通过公式计算得到特征式中为多头注意力机制第i个头，i∈{1,2,...,n}，Q_st″为多头注意力机制的查询向量，K_ts″为多头注意力机制的键向量，V_ts″为多头注意力机制的值向量，为多头注意力机制第i个头，i∈{1,2,...,n}，Q_t″为多头注意力机制的查询向量，将特征输入到下层通道的第二Layer Normalization层中，输出得到特征将特征依次输入到下层通道的第二Linear线性层、第三线性层、第三Layer Normalization层中，输出得到特征将特征与特征进行特征融合，得到特征本发明的有益效果是：提取心音信号的梅尔倒谱系数作为特征，之后搭建双通道交叉注意力的域自适应分类模型，通过双向交叉注意力实现特征的域自适应学习，既实现了源域心音信号的学习，又能实现目标域心音信号的学习，减少域差异对分类结果的影响。

附图说明

图1为本发明的双通道交叉注意力的域自适应模型结构图；

图2为本发明的DIDA模块结构图。

具体实施方式

下面结合附图1、附图2对本发明做进一步说明。

a)获取心音信号数据构成源域数据及获取心音信号数据构成目标域数据。

b)提取源域数据中的心音信号的梅尔倒谱系数，得到源域数据特征矩阵X^s，提取目标域数据中的心音信号的梅尔倒谱系数，得目标域数据特征矩阵X^t。

c)建立双通道交叉注意力的域自适应分类模型，双通道交叉注意力的域自适应分类模型由卷积层、Relu激活函数层、Batch Normalization层、第一DIDA模块、第二DIDA模块、第三DIDA模块、全局平均池化层、Droupout层、Dense层、Softmax函数层构成，第一DIDA模块、第二DIDA模块、第三DIDA模块均由上层通道和下层通道构成。

f)将特征依次输入到双通道交叉注意力的域自适应分类模型的全局平均池化层、Droupout层、Dense层中，输出得到特征将特征输入到双通道交叉注意力的域自适应分类模型的Softmax函数层映射得到0到1区间概率分布的标签y，标签y为0时表示心音信号为正常信号，标签y为1时表示心音信号为异常信号。

搭建双通道交叉注意力的域自适应分类模型，通过双向交叉注意力实现特征的域自适应学习，既实现了源域心音信号的学习，又能实现目标域心音信号的学习，减少域差异对分类结果的影响。

在本发明的一个实施例中，优选的，步骤a)中将Physionet2016心音数据库作为源域数据，将Khan心音数据库作为目标域数据，源域数据中的心音信号和目标域数据中的心音信号的时长均设置为5秒，采样率均为16000Hz。步骤b)中梅尔倒谱系数的维度设置为40。双通道交叉注意力的域自适应分类模型的卷积层的卷积核大小为3×3，步长为2。

在本发明的一个实施例中，步骤e)包括如下步骤：

e-1)第一DIDA模块的上层通道由第一Layer Normalization层、多头注意力机制、第一Linear线性层、第二Linear线性层、第二Layer Normalization层构成，将特征输入到上层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到上层通道的多头注意力机制中通过公式计算得到特征式中Concat(·)为拼接操作，W^O为随机产生的参数矩阵，head_i为多头注意力机制第i个头，i∈{1,2,...,n}，n为多头注意力机制的头的总数，softmax(·)为Softmax函数，W_i ^Q、W_i ^K、W_i ^V均为随机产生的参数矩阵，T为转置，Q_s为多头注意力机制的查询向量，K_s为多头注意力机制的键向量，V_s为多头注意力机制的值向量，d为查询向量Q_s的矩阵维度，均为随机产生的参数矩阵，将特征与特征进行特征融合后依次输入到上层通道的第一Linear线性层、第二Linear线性层、第二LayerNormalization层中，输出得到特征e-2)第二DIDA模块的上层通道由第一LayerNormalization层、多头注意力机制、第一Linear线性层、第二Linear线性层、第二LayerNormalization层构成，将特征输入到上层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到上层通道的多头注意力机制中通过公式计算得到特征式中，head_i′为多头注意力机制第i个头，Q_s′为多头注意力机制的查询向量，K_s′为多头注意力机制的键向量，V_s′为多头注意力机制的值向量，d′为查询向量Q_s′的矩阵维度，将特征与特征进行特征融合后依次输入到上层通道的第一Linear线性层、第二Linear线性层、第二LayerNormalization层中，输出得到特征e-3)第三DIDA模块的上层通道由第一LayerNormalization层、多头注意力机制、第一Linear线性层、第二Linear线性层、第二LayerNormalization层构成，将特征输入到上层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到上层通道的多头注意力机制中通过公式计算得到特征式中，head_i″为多头注意力机制第i个头，Q_s″为多头注意力机制的查询向量，K_s″为多头注意力机制的键向量，V_s″为多头注意力机制的值向量，d″为查询向量Q_s″的矩阵维度，将特征与特征进行特征融合后依次输入到上层通道的第一Linear线性层、第二Linear线性层、第二LayerNormalization层中，输出得到特征在该实施例中，优选的n取值为8，d、d′、d″取值均为40。

在本发明的一个实施例中，步骤h)包括如下步骤：

h-1)第一DIDA模块的下层通道由第一Layer Normalization层、第一多头注意力机制、第一Linear线性层、第二多头注意力机制、第二Layer Normalization层、第二Linear线性层、第三线性层、第三Layer Normalization层构成，将特征输入到下层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到下层通道的第一多头注意力机制中通过公式计算得到特征式中W_t ^O为随机产生的参数矩阵，为多头注意力机制第i个头，i∈{1,2,...,n}，W_i ^K,t、W_i ^V,t均为随机产生的参数矩阵，K_t为多头注意力机制的键向量，V_t为多头注意力机制的值向量，均为随机产生的参数矩阵，将特征输入到下层通道的第一Linear线性层，输出得到特征将特征输入到下层通道的第二多头注意力机制中通过公式计算得到特征式中为随机产生的参数矩阵，为多头注意力机制第i个头，i∈{1,2,…,n}，W_i ^st、W_i ^t,s,k、W_i ^t,s,v均为随机产生的参数矩阵，Q_st为多头注意力机制的查询向量，K_ts为多头注意力机制的键向量，V_ts为多头注意力机制的值向量，均为随机产生的参数矩阵，为随机产生的参数矩阵，为多头注意力机制第i个头，i∈{1,2,...,n}，Q_t为多头注意力机制的查询向量，均为随机产生的参数矩阵，将特征输入到下层通道的第二Layer Normalization层中，输出得到特征将特征依次输入到下层通道的第二Linear线性层、第三线性层、第三Layer Normalization层中，输出得到特征将特征与特征进行特征融合，得到特征

h-2)第二DIDA模块的下层通道由第一Layer Normalization层、第一多头注意力机制、第一Linear线性层、第二多头注意力机制、第二Layer Normalization层、第二Linear线性层、第三线性层、第三Layer Normalization层构成，将特征输入到下层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到下层通道的第一多头注意力机制中通过公式计算得到特征式中为多头注意力机制第i个头，i∈{1,2,...,n}，K_t′为多头注意力机制的键向量，V_t′为多头注意力机制的值向量，将特征输入到下层通道的第一Linear线性层，输出得到特征将特征输入到下层通道的第二多头注意力机制中通过公式计算得到特征式中为多头注意力机制第i个头，i∈{1,2,...,n}，Q_st′为多头注意力机制的查询向量，K_ts′为多头注意力机制的键向量，V_ts′为多头注意力机制的值向量，为多头注意力机制第i个头，i∈{1,2,...,n}，Q_t′为多头注意力机制的查询向量，将特征输入到下层通道的第二Layer Normalization层中，输出得到特征将特征依次输入到下层通道的第二Linear线性层、第三线性层、第三Layer Normalization层中，输出得到特征将特征与特征进行特征融合，得到特征h-3)第三DIDA模块的下层通道由第一Layer Normalization层、第一多头注意力机制、第一Linear线性层、第二多头注意力机制、第二Layer Normalization层、第二Linear线性层、第三线性层、第三Layer Normalization层构成，将特征输入到下层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到下层通道的第一多头注意力机制中通过公式计算得到特征式中为多头注意力机制第i个头，i∈{1,2,...,n}，K_t″为多头注意力机制的键向量，V_t″为多头注意力机制的值向量，将特征输入到下层通道的第一Linear线性层，输出得到特征将特征输入到下层通道的第二多头注意力机制中通过公式计算得到特征式中为多头注意力机制第i个头，i∈{1,2,...,n}，Q_st″为多头注意力机制的查询向量，K_ts″为多头注意力机制的键向量，V_ts″为多头注意力机制的值向量，为多头注意力机制第i个头，i∈{1,2,...,n}，Q_t″为多头注意力机制的查询向量，将特征输入到下层通道的第二Layer Normalization层中，输出得到特征将特征依次输入到下层通道的第二Linear线性层、第三线性层、第三Layer Normalization层中，输出得到特征将特征与特征进行特征融合，得到特征最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于双通道交叉注意力的域适应的心音分类方法，其特征在于，包括如下步骤：

h)将特征输入到第一DIDA模块的下层通道中，输出得到特征将特征输入到第二DIDA模块的上层通道中，输出得到特征将特征输入到第三DIDA模块的上层通道中，输出得到特征

i)将特征依次输入到双通道交叉注意力的域自适应分类模型的全局平均池化层、Droupout层、Dense层中，输出得到特征将特征输入到双通道交叉注意力的域自适应分类模型的Softmax函数层映射得到0到1区间概率分布的标签y′，标签y′为0时表示心音信号为正常信号，标签y为1时表示心音信号为异常信号。

2.根据权利要求1所述的基于双通道交叉注意力的域适应的心音分类方法，其特征在于：步骤a)中将Physionet2016心音数据库作为源域数据，将Khan心音数据库作为目标域数据，源域数据中的心音信号和目标域数据中的心音信号的时长均设置为5秒，采样率均为16000Hz。

3.根据权利要求1所述的基于双通道交叉注意力的域适应的心音分类方法，其特征在于：步骤b)中梅尔倒谱系数的维度设置为40。

4.根据权利要求1所述的基于双通道交叉注意力的域适应的心音分类方法，其特征在于：双通道交叉注意力的域自适应分类模型的卷积层的卷积核大小为3×3，步长为2。

5.根据权利要求1所述的基于双通道交叉注意力的域适应的心音分类方法，其特征在于，步骤e)包括如下步骤：

e-1)第一DIDA模块的上层通道由第一Layer Normalization层、多头注意力机制、第一Linear线性层、第二Linear线性层、第二Layer Normalization层构成，将特征输入到上层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到上层通道的多头注意力机制中通过公式计算得到特征式中Concat(·)为拼接操作，W^O为随机产生的参数矩阵，head_i为多头注意力机制第i个头，i∈{1,2,...,n}，n为多头注意力机制的头的总数，softmax(·)为Softmax函数，均为随机产生的参数矩阵，T为转置，Q_s为多头注意力机制的查询向量，K_s为多头注意力机制的键向量，V_s为多头注意力机制的值向量，d为查询向量Q_s的矩阵维度，均为随机产生的参数矩阵，将特征与特征进行特征融合后依次输入到上层通道的第一Linear线性层、第二Linear线性层、第二Layer Normalization层中，输出得到特征

e-2)第二DIDA模块的上层通道由第一Layer Normalization层、多头注意力机制、第一Linear线性层、第二Linear线性层、第二Layer Normalization层构成，将特征输入到上层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到上层通道的多头注意力机制中通过公式计算得到特征式中，head_i′为多头注意力机制第i个头，Q_s′为多头注意力机制的查询向量，K_s′为多头注意力机制的键向量，V_s′为多头注意力机制的值向量，d′为查询向量Q_s′的矩阵维度，将特征与特征进行特征融合后依次输入到上层通道的第一Linear线性层、第二Linear线性层、第二Layer Normalization层中，输出得到特征

e-3)第三DIDA模块的上层通道由第一Layer Normalization层、多头注意力机制、第一Linear线性层、第二Linear线性层、第二Layer Normalization层构成，将特征输入到上层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到上层通道的多头注意力机制中通过公式计算得到特征式中，head_i″为多头注意力机制第i个头，Q_s″为多头注意力机制的查询向量，K_s″为多头注意力机制的键向量，V_s″为多头注意力机制的值向量，d″为查询向量Q_s″的矩阵维度将特征与特征进行特征融合后依次输入到上层通道的第一Linear线性层、第二Linear线性层、第二Layer Normalization层中，输出得到特征

6.根据权利要求5所述的基于双通道交叉注意力的域适应的心音分类方法，其特征在于：n取值为8，d、d′、d″取值均为40。

7.根据权利要求5所述的基于双通道交叉注意力的域适应的心音分类方法，其特征在于，步骤h)包括如下步骤：

h-1)第一DIDA模块的下层通道由第一Layer Normalization层、第一多头注意力机制、第一Linear线性层、第二多头注意力机制、第二Layer Normalization层、第二Linear线性层、第三线性层、第三Layer Normalization层构成，将特征输入到下层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到下层通道的第一多头注意力机制中通过公式计算得到特征式中W_t ^O为随机产生的参数矩阵，为多头注意力机制第i个头，i∈{1,2,...,n}，W_i ^K,t、W_i ^V,t均为随机产生的参数矩阵，K_t为多头注意力机制的键向量，V_t为多头注意力机制的值向量，均为随机产生的参数矩阵，将特征输入到下层通道的第一Linear线性层，输出得到特征将特征输入到下层通道的第二多头注意力机制中通过公式计算得到特征式中为随机产生的参数矩阵，为多头注意力机制第i个头，W_i ^st、W_i ^t,s,k、W_i ^t,s,v均为随机产生的参数矩阵，Q_st为多头注意力机制的查询向量，K_ts为多头注意力机制的键向量，V_ts为多头注意力机制的值向量，均为随机产生的参数矩阵，为随机产生的参数矩阵，为多头注意力机制第i个头，i∈{1,2,...,n}，Q_t为多头注意力机制的查询向量，均为随机产生的参数矩阵，将特征输入到下层通道的第二Layer Normalization层中，输出得到特征将特征依次输入到下层通道的第二Linear线性层、第三线性层、第三Layer Normalization层中，输出得到特征将特征与特征进行特征融合，得到特征

h-2)第二DIDA模块的下层通道由第一Layer Normalization层、第一多头注意力机制、第一Linear线性层、第二多头注意力机制、第二Layer Normalization层、第二Linear线性层、第三线性层、第三Layer Normalization层构成，将特征输入到下层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到下层通道的第一多头注意力机制中通过公式计算得到特征式中为多头注意力机制第i个头，i∈{1,2,...,n}，K_t′为多头注意力机制的键向量，V_t′为多头注意力机制的值向量，将特征输入到下层通道的第一Linear线性层，输出得到特征将特征输入到下层通道的第二多头注意力机制中通过公式计算得到特征式中为多头注意力机制第i个头，i∈{1,2,...,n}，Q_st′为多头注意力机制的查询向量，K_ts′为多头注意力机制的键向量，V_ts′为多头注意力机制的值向量，为多头注意力机制第i个头，i∈{1,2,...,n}，Q_t′为多头注意力机制的查询向量，将特征输入到下层通道的第二Layer Normalization层中，输出得到特征将特征依次输入到下层通道的第二Linear线性层、第三线性层、第三Layer Normalization层中，输出得到特征将特征与特征进行特征融合，得到特征h-3)第三DIDA模块的下层通道由第一Layer Normalization层、第一多头注意力机制、第一Linear线性层、第二多头注意力机制、第二Layer Normalization层、第二Linear线性层、第三线性层、第三Layer Normalization层构成，将特征输入到下层通道的第一Layer Normalization层中归一化处理得到特征将特征输入到下层通道的第一多头注意力机制中通过公式计算得到特征式中为多头注意力机制第i个头，i∈{1,2,...,n}，K_t″为多头注意力机制的键向量，V_t″为多头注意力机制的值向量，将特征输入到下层通道的第一Linear线性层，输出得到特征将特征输入到下层通道的第二多头注意力机制中通过公式计算得到特征式中为多头注意力机制第i个头，i∈{1,2,...,n}，Q_st″为多头注意力机制的查询向量，K_ts″为多头注意力机制的键向量，V_ts″为多头注意力机制的值向量，为多头注意力机制第i个头，i∈{1,2,...,n}，Q_t″为多头注意力机制的查询向量，将特征输入到下层通道的第二Layer Normalization层中，输出得到特征将特征依次输入到下层通道的第二Linear线性层、第三线性层、第三Layer Normalization层中，输出得到特征将特征与特征进行特征融合，得到特征