CN113947680A - 一种基于级联多尺度视觉Transformer的图像语义分割方法 - Google Patents
一种基于级联多尺度视觉Transformer的图像语义分割方法 Download PDFInfo
- Publication number
- CN113947680A CN113947680A CN202111186956.1A CN202111186956A CN113947680A CN 113947680 A CN113947680 A CN 113947680A CN 202111186956 A CN202111186956 A CN 202111186956A CN 113947680 A CN113947680 A CN 113947680A
- Authority
- CN
- China
- Prior art keywords
- image
- transformer
- module
- size
- semantic segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 230000011218 segmentation Effects 0.000 title claims abstract description 21
- 239000013598 vector Substances 0.000 claims abstract description 34
- 238000004364 calculation method Methods 0.000 claims abstract description 18
- 238000013528 artificial neural network Methods 0.000 claims abstract description 17
- 238000010606 normalization Methods 0.000 claims abstract description 15
- 238000005070 sampling Methods 0.000 claims abstract description 15
- 238000010586 diagram Methods 0.000 claims description 26
- 230000000007 visual effect Effects 0.000 claims description 7
- 230000001131 transforming effect Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 230000002776 aggregation Effects 0.000 claims description 4
- 238000004220 aggregation Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000002238 attenuated effect Effects 0.000 claims description 2
- 238000011176 pooling Methods 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 7
- 238000003709 image segmentation Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种基于级联多尺度视觉Transformer架构的语义分割方法,包括:将图像切分为多个Patch,将Patch拉伸为一维向量N*C;步骤二、利用重叠Padding块编码对Patch进行位置编码;步骤三、将token输入Transformer模块,依次经过层归一化、多头注意力层以及前馈神经网络,重复步骤三至网络收敛;步骤四、利用块编码将token还原至二维,利用池化层将图像下采样至1/2;步骤五将编码阶段和当前阶段的特征图采用像素点信息聚合;步骤六将特征图上采样至1/4时采用卷积层输出为类别数,最后采用双线性插值算法将图像上采样至原图大小。本发明可以解决计算量大,分割边界不均匀问题。
Description
技术领域
本发明涉及一种基于级联多尺度视觉Transformer的图像语义分割方法,属于图像处理领域。
背景技术
最近几年,以卷积神经网络为代表的深度学习在图像领域大量展开了应用,但是由于卷积操作带来的感受野受限问题一直没有得到很好的解决,每个像素点无法捕获更远处像素点的上下文信息,视觉Transformer的出现让长距离依赖成为了可能。目前图像分割领域应用空洞卷积来实现感受野扩大,首先将骨干网络形成的特征图进行通道压缩,然后利用含有不同膨胀率的空洞卷积对特征图进行处理,最后在通道维度上合并来自不同膨胀率的特征图。但是,目前大多研究的图像语义分割模型直接影响分割效果,计算量大,实时性和分割边缘处理还不甚理想。
发明内容
本发明的目的是提出一种基于级联多尺度视觉Transformer的图像语义分割方法,其为了解决计算量大,图像分割边缘表现差和分割精度问题。
一种基于级联多尺度视觉Transformer的图像语义分割方法,所述识别方法包含以下步骤。
步骤一、将维度为H*W*3的原始图像切分为一系列的Patch块,起始的Patch尺寸为原图H和W的1/4,并将每个Patch块拉伸为一维向量N*C,其中N=H*W。
步骤二、利用带Padding的位置编码操作对每个向量进行位置编码,利用卷积核为K,步长S和填充P的卷积操作将特征图进行编码。
步骤三、将每个维度为N*C的一维向量作为token输入到Transformer模块中,该模块包含了层归一化、多头自注意力模块以及前馈神经网络,在进行层归一化后会划分为三个子tocken,分别为query、key和value。三个向量在矩阵操作之后会重新得到N*C的一维向量并输入到前馈神经网络中,前馈神经网络包含两个多层感知机,多次重复步骤三直到网络收敛,可以学习到更多的上下文语义信息。
步骤四、利用带有重叠padding的编码模块将N*C的向量变换至图像的三维尺寸Hi*Wi*C,基于池化的特征提取,将图像下采样至1/2大小作为下一阶段的输入,图像尺寸变换为Hi/2*Wi/2*C。
步骤五、采用Transformer的上采样模块作为解码部分,将编码阶段的输出特征图上采样后和前一阶段的特征图利用像素点位置相加实现信息聚合,将新的特征图输入到Transformer模块中。
步骤六、当特征图上采样至原图的1/4大小时,采用卷积操作将通道数变换为类别数,最后采用双线性插值算法将图像上采样至原图大小。
进一步的,所述步骤二中,K=7,S=4,P=3。
进一步的,所述步骤三中包含以下步骤。
步骤三一、首先将待提取特征的特征图进行层归一化,对于前向传播的序列化网络而言,深度不是固定的,不同的时间片需要保存不同的静态特征,可能存在一个特殊序列比其他序列长很多,利用层归一化可以实现很好的训练效果,层归一化的计算方法为:
其中H为待统计的节点信息,即隐含层的节点个数,l表示前馈神经网络的层数,i表示待处理的阶段。
步骤三二、在多头自注意力模块中,三个输入的初始一维向量分别为key、query、value,三个向量的计算方法为:
其中Wj为权重参数,用于控制学习自注意力的上下文信息能力,dhead是压缩乡里向量前的通道维度。
步骤三三、用于前馈神经网络的特征计算,该计算方法为:
其中k为输入特征图,t为衰减的权重参数,h为带有全连接层的多层感知机;
其中x为输入特征图,Gelu和tanh分别为激活函数。
进一步的,所述步骤三中,四个阶段的重复次数分别为3,8,27,3次。
进一步的,所述步骤四中,计算图像下采样尺寸,该计算方法为:
其中Q、R为在x轴待插值像素点的坐标,x为横向像素点的坐标值;
其中P、R为在y轴待插值像素点的坐标,y为纵向像素点的坐标值。
本发明的主要优点是:本发明首先将原始图像切分为一系列的Patch块,尺寸为原图的1/4,并将每个Patch块拉伸为一维向量N*C,然后利用带Padding的位置编码操作对每个向量进行位置编码,将每个维度为N*C的一维向量作为token输入到Transformer模块中,该模块包含了层归一化、多头注意力模块以及前馈神经网络,在进行层归一化后会划分为三个子tocken,分别为query、key和value。三个向量在矩阵操作之后会重新得到N*C的一维向量并输入到前馈神经网络中;多次重复步骤三直到网络收敛,可以学习到更多的上下文语义信息,然后利用带有重叠padding的编码模块将N*C的向量拉伸至图像的三维尺寸,基于池化的特征提取,将图像下采样至1/2大小作为下一阶段的输入。在解码部分采用Transformer的上采样模块,将编码阶段的输出特征图上采样后和前一阶段的特征图利用像素点位置相加实现信息聚合,将新的特征图输入到Transformer模块中,然后将特征图上采样至原图的1/4大小时,采用卷积操作将通道数变换为类别数,最后采用双线性插值算法将图像上采样至原图大小。本发明可以有效解决计算量大,图像分割边缘表现差和分割精度问题。
附图说明
图1为本发明所述的一种基于级联多尺度视觉Transformer的图像语义分割方法的流程图。
图2为室内场景处理效果图,其中,图2(a)为原始室内场景图,图2(b)为经过步骤六处理后的图片。
图3为室外场景处理效果图,其中,图3(a)为原始室外场景图,图3(b)为经过步骤六处理后的图片。
图4为人像处理效果图,其中,图4(a)为原始人像图,图4(b)为经过步骤六处理后的图片。
具体实施方式
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1-图4所示,本实施方式所述的一种基于级联多尺度视觉Transformer的图像语义分割方法的一实施例,包括以下步骤。
步骤一、读取原始图像,维度为H*W*C。将图像切分为一系列h*w*C维度的Patch块(本发明中h和w设置为原图的1/4),该阶段采用的切分方法为带有重叠填充的块编码对每个Patch进行编码,然后将每一个Patch块拉伸为一维向量N*C,其中N=h*w。经过此方法之后原图就被压缩为原图比例的1/16。对后续阶段提取特征在计算量上非常友好,大大缩短了图像处理的时间。
步骤二、利用带Padding的位置编码操作对每个向量进行编码,利用卷积核为K,步长S和填充P的卷积操作将特征图进行编码,为平衡分割效果和分割速度,K的优选值为7、S的优选值为4、P的优选值为3。
步骤三、将每个维度为N*C的一维向量作为token输入到Transformer模块中,该模块包含了层归一化、多头自注意力模块以及前馈神经网络,在进行层归一化后会划分为三个子tocken,分别为query、key和value。三个向量在矩阵操作之后会重新得到N*C的一维向量并输入到前馈神经网络中,前馈神经网络是包含两个全连接层实现特征映射,然后采用跳跃连接将输入前的特征图和输入后的特征图进行像素点度对应位置相加,具体包括。
步骤三一、首先将待提取特征的特征图进行层归一化,对于前向传播的序列化网络而言,深度不是固定的,不同的时间片需要保存不同的静态特征,可能存在一个特殊序列比其他序列长很多,利用层归一化可以实现很好的训练效果,层归一化的计算方法为:
其中H为待统计的节点信息,即隐含层的节点个数,l表示前馈神经网络的层数,i表示待处理的阶段。
步骤三二、在多头自注意力模块中,三个输入的初始一维向量分别为key、query、value,三个向量的计算方法为:
其中Wj为权重参数,用于控制学习自注意力的上下文信息能力,dhead是压缩乡里向量前的通道维度。
步骤三三、用于前馈神经网络的特征计算,前馈神经网络包含两个全连接层用于特征映射,该计算方法为:
其中xin为输入特征图,GULU为激活函数,MLP为带有全连接层的多层感知机。
进一步的,所述步骤三中,四个阶段的重复次数分别为3,8,27,3次。
进一步的,所述步骤四中,计算图像下采样尺寸,该计算方法为:
其中K0为输入的特征图,Linear操作为线性的全连接层映射,Reshape操作是将二维向量拉伸为三维特征图尺寸,K3是得到最终变换尺寸后的特征图。
步骤四、利用带有重叠padding的编码模块将N*C的向量变换至图像的三维尺寸Hi*Wi*C,基于池化的特征提取,将图像下采样至1/2大小作为下一阶段的输入,图像尺寸变换为Hi/2*Wi/2*C。
步骤五、在解码部分,采用Transformer的上采样模块,将编码阶段的输出特征图上采样后和前一阶段的特征图利用像素点位置相加实现信息聚合,将新的特征图输入到Transformer模块中,该模块和编码部分的模块结构相似,采用级联的Transformer模块获取不同解码阶段的语义信息,然后与上一阶段的特征图进行信息聚合,最后采用前馈神经网络的两层全连接层进行特征映射得到新的特征图,期间采用跳跃连接,再变换回一维token,重复此操作可以更新每个节点的权值大小,直到训练过程收敛。
步骤六、当特征图上采样至原图的1/4大小时,采用卷积操作将通道数变换为类别数,最后采用双线性插值算法将图像上采样至原图大小。主要思路:将图片首先切分为patch进行序列化处理,分别产生三个子token后利用Transformer模块捕获长距离的上下文语义信息,进一步再利用解码器的上采样操作逐步还原至原图大小,实现像素点级别的分类,产生分割特征图。
Claims (5)
1.一种基于级联多尺度视觉Transformer的图像语义分割方法,其特征在于所述图像分割方法包括以下步骤:
步骤一、将维度为H*W*3的原始图像切分为一系列的Patch块,起始的Patch尺寸为原图H和W的1/4,并将每个Patch块拉伸为一维向量N*C,其中N=H*W;
步骤二、利用带Padding的位置编码操作对每个向量进行位置编码,利用卷积核为K,步长S和填充P的卷积操作将特征图进行编码;
步骤三、将每个维度为N*C的一维向量作为token输入到Transformer模块中,该模块包含了层归一化、多头自注意力模块以及前馈神经网络,在进行层归一化后会划分为三个子tocken,分别为query、key和value;三个向量在矩阵操作之后会重新得到N*C的一维向量并输入到前馈神经网络中,前馈神经网络包含两个多层感知机,多次重复步骤三直到网络收敛,可以学习到更多的上下文语义信息;
步骤四、利用带有重叠padding的编码模块将N*C的向量变换至图像的三维尺寸Hi*Wi*C,基于池化的特征提取,将图像下采样至1/2大小作为下一阶段的输入,图像尺寸变换为Hi/2*Wi/2*C;
步骤五、采用Transformer的上采样模块作为解码部分,将编码阶段的输出特征图上采样后和前一阶段的特征图利用像素点位置相加实现信息聚合,将新的特征图输入到Transformer模块中;
步骤六、当特征图上采样至原图的1/4大小时,采用卷积操作将通道数变换为类别数,最后采用双线性插值算法将图像上采样至原图大小。
2.根据权利要求1所述的一种基于级联多尺度视觉Transformer的图像语义分割方法,其特征在于,在步骤二中,K=7,S=4,P=3。
4.根据权利要求1所述的一种基于级联多尺度视觉Transformer的图像语义分割方法,其特征在于,在步骤三中,四个阶段的重复次数分别为3,8,27,3次。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111186956.1A CN113947680A (zh) | 2021-10-12 | 2021-10-12 | 一种基于级联多尺度视觉Transformer的图像语义分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111186956.1A CN113947680A (zh) | 2021-10-12 | 2021-10-12 | 一种基于级联多尺度视觉Transformer的图像语义分割方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113947680A true CN113947680A (zh) | 2022-01-18 |
Family
ID=79330085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111186956.1A Pending CN113947680A (zh) | 2021-10-12 | 2021-10-12 | 一种基于级联多尺度视觉Transformer的图像语义分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113947680A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114359283A (zh) * | 2022-03-18 | 2022-04-15 | 华东交通大学 | 基于Transformer的缺陷检测方法和电子设备 |
CN114676776A (zh) * | 2022-03-25 | 2022-06-28 | 中国科学院软件研究所 | 一种基于Transformer的细粒度图像分类方法 |
CN114708295A (zh) * | 2022-04-02 | 2022-07-05 | 华南理工大学 | 一种基于Transformer的物流包裹分离方法 |
CN114723951A (zh) * | 2022-06-08 | 2022-07-08 | 成都信息工程大学 | 一种用于rgb-d图像分割的方法 |
CN114993677A (zh) * | 2022-05-11 | 2022-09-02 | 山东大学 | 不平衡小样本数据的滚动轴承故障诊断方法及系统 |
CN115562490A (zh) * | 2022-10-12 | 2023-01-03 | 西北工业大学太仓长三角研究院 | 一种基于深度学习的飞机驾驶舱跨屏眼动交互方法及系统 |
CN116030259A (zh) * | 2023-03-24 | 2023-04-28 | 长春理工大学 | 一种腹部ct图像多器官分割方法、装置及终端设备 |
CN116385725A (zh) * | 2023-06-02 | 2023-07-04 | 杭州聚秀科技有限公司 | 眼底图像视盘视杯分割方法及装置、电子设备 |
CN117036714A (zh) * | 2023-10-09 | 2023-11-10 | 安徽大学 | 融合混合注意力机制的肠息肉分割方法、系统及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112287940A (zh) * | 2020-10-30 | 2021-01-29 | 西安工程大学 | 一种基于深度学习的注意力机制的语义分割的方法 |
CN112634276A (zh) * | 2020-12-08 | 2021-04-09 | 西安理工大学 | 一种基于多尺度视觉特征提取的轻量级语义分割方法 |
CN113065578A (zh) * | 2021-03-10 | 2021-07-02 | 合肥市正茂科技有限公司 | 一种基于双路区域注意力编解码的图像视觉语义分割方法 |
CN113421269A (zh) * | 2021-06-09 | 2021-09-21 | 南京瑞易智能科技有限公司 | 一种基于双分支深度卷积神经网络的实时语义分割方法 |
-
2021
- 2021-10-12 CN CN202111186956.1A patent/CN113947680A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112287940A (zh) * | 2020-10-30 | 2021-01-29 | 西安工程大学 | 一种基于深度学习的注意力机制的语义分割的方法 |
CN112634276A (zh) * | 2020-12-08 | 2021-04-09 | 西安理工大学 | 一种基于多尺度视觉特征提取的轻量级语义分割方法 |
CN113065578A (zh) * | 2021-03-10 | 2021-07-02 | 合肥市正茂科技有限公司 | 一种基于双路区域注意力编解码的图像视觉语义分割方法 |
CN113421269A (zh) * | 2021-06-09 | 2021-09-21 | 南京瑞易智能科技有限公司 | 一种基于双分支深度卷积神经网络的实时语义分割方法 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114359283A (zh) * | 2022-03-18 | 2022-04-15 | 华东交通大学 | 基于Transformer的缺陷检测方法和电子设备 |
CN114676776A (zh) * | 2022-03-25 | 2022-06-28 | 中国科学院软件研究所 | 一种基于Transformer的细粒度图像分类方法 |
CN114708295B (zh) * | 2022-04-02 | 2024-04-16 | 华南理工大学 | 一种基于Transformer的物流包裹分离方法 |
CN114708295A (zh) * | 2022-04-02 | 2022-07-05 | 华南理工大学 | 一种基于Transformer的物流包裹分离方法 |
CN114993677A (zh) * | 2022-05-11 | 2022-09-02 | 山东大学 | 不平衡小样本数据的滚动轴承故障诊断方法及系统 |
CN114723951A (zh) * | 2022-06-08 | 2022-07-08 | 成都信息工程大学 | 一种用于rgb-d图像分割的方法 |
CN114723951B (zh) * | 2022-06-08 | 2022-11-04 | 成都信息工程大学 | 一种用于rgb-d图像分割的方法 |
CN115562490A (zh) * | 2022-10-12 | 2023-01-03 | 西北工业大学太仓长三角研究院 | 一种基于深度学习的飞机驾驶舱跨屏眼动交互方法及系统 |
CN115562490B (zh) * | 2022-10-12 | 2024-01-09 | 西北工业大学太仓长三角研究院 | 一种基于深度学习的飞机驾驶舱跨屏眼动交互方法及系统 |
CN116030259B (zh) * | 2023-03-24 | 2024-01-12 | 长春理工大学 | 一种腹部ct图像多器官分割方法、装置及终端设备 |
CN116030259A (zh) * | 2023-03-24 | 2023-04-28 | 长春理工大学 | 一种腹部ct图像多器官分割方法、装置及终端设备 |
CN116385725A (zh) * | 2023-06-02 | 2023-07-04 | 杭州聚秀科技有限公司 | 眼底图像视盘视杯分割方法及装置、电子设备 |
CN116385725B (zh) * | 2023-06-02 | 2023-09-08 | 杭州聚秀科技有限公司 | 眼底图像视盘视杯分割方法及装置、电子设备 |
CN117036714A (zh) * | 2023-10-09 | 2023-11-10 | 安徽大学 | 融合混合注意力机制的肠息肉分割方法、系统及介质 |
CN117036714B (zh) * | 2023-10-09 | 2024-02-09 | 安徽大学 | 融合混合注意力机制的肠息肉分割方法、系统及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113947680A (zh) | 一种基于级联多尺度视觉Transformer的图像语义分割方法 | |
CN111798400B (zh) | 基于生成对抗网络的无参考低光照图像增强方法及系统 | |
CN113139907B (zh) | 视觉分辨率增强的生成方法、系统、装置及存储介质 | |
CN108765296B (zh) | 一种基于递归残差注意力网络的图像超分辨率重建方法 | |
CN110599409B (zh) | 基于多尺度卷积组与并行的卷积神经网络图像去噪方法 | |
CN111259983B (zh) | 基于深度学习的图像语义分割方法及存储介质 | |
CN111862294B (zh) | 基于ArcGAN网络的手绘3D建筑自动上色网络装置及方法 | |
CN111340814A (zh) | 一种基于多模态自适应卷积的rgb-d图像语义分割方法 | |
CN111292265A (zh) | 一种基于生成式对抗神经网络的图像修复方法 | |
CN115115523B (zh) | 一种融合CNN和Transformer的医学图像深度信息提取方法 | |
CN111861886B (zh) | 一种基于多尺度反馈网络的图像超分辨率重建方法 | |
CN117576402B (zh) | 一种基于深度学习的多尺度聚合Transformer遥感图像语义分割方法 | |
CN111787187A (zh) | 利用深度卷积神经网络进行视频修复的方法、系统、终端 | |
CN116469100A (zh) | 一种基于Transformer的双波段图像语义分割方法 | |
CN114331831A (zh) | 一种轻量化的单张图像超分辨率重建方法 | |
Hui et al. | Two-stage convolutional network for image super-resolution | |
CN112365422A (zh) | 基于深层聚合网络的不规则缺失图像修复方法及其系统 | |
CN114529982A (zh) | 基于流式注意力的轻量级人体姿态估计方法及系统 | |
CN116863194A (zh) | 一种足溃疡图像分类方法、系统、设备及介质 | |
CN114022356A (zh) | 基于小波域的河道流量水位遥感图像超分辨率方法与系统 | |
CN113362239A (zh) | 一种基于特征交互的深度学习图像修复方法 | |
CN116434039B (zh) | 一种基于多尺度拆分注意力机制的目标检测方法 | |
CN111311698A (zh) | 一种用于多尺度目标的图像压缩方法及系统 | |
CN114283064B (zh) | 基于真实世界双焦距图像的超分辨率自监督学习系统 | |
CN114155560B (zh) | 基于空间降维的高分辨率人体姿态估计模型的轻量化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |