CN116309278A - 基于多尺度上下文感知的医学图像分割模型及方法 - Google Patents
基于多尺度上下文感知的医学图像分割模型及方法 Download PDFInfo
- Publication number
- CN116309278A CN116309278A CN202211622225.1A CN202211622225A CN116309278A CN 116309278 A CN116309278 A CN 116309278A CN 202211622225 A CN202211622225 A CN 202211622225A CN 116309278 A CN116309278 A CN 116309278A
- Authority
- CN
- China
- Prior art keywords
- features
- convolution
- feature
- global
- medical image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003709 image segmentation Methods 0.000 title claims abstract description 26
- 238000000034 method Methods 0.000 title claims abstract description 22
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 42
- 230000011218 segmentation Effects 0.000 claims abstract description 12
- 230000002708 enhancing effect Effects 0.000 claims abstract description 5
- 238000005070 sampling Methods 0.000 claims description 12
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 230000002401 inhibitory effect Effects 0.000 claims description 2
- 230000006872 improvement Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000008447 perception Effects 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Quality & Reliability (AREA)
- Radiology & Medical Imaging (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明提出基于多尺度上下文感知的医学图像分割模型及方法,包括编码器和解码器构成的分割网络框架,编码器为经过预训练的ResNet50,且预训练的ResNet50使用五层卷积层,解码器包括用于增强特征全局信息的全局循环卷积transformer模块和注意力导向模块,发明采用预训练的ResNet50作为编码器以获取更有代表性的特征图,再引入了全局循环卷积transformer模块,对特征进行全局信息建模,从而加强特征的全局性和长程依赖性,再利用注意力导向模块将经过特征加强的不同尺度特征进行融合,使深层特征引导浅层特征进行空间和通道信息的选择,从而在恢复细节信息的同时有效抑制浅层特征的噪声信息。
Description
技术领域
本发明涉及医学图像分割技术领域,尤其涉及基于多尺度上下文感知的医学图像分割模型及方法。
背景技术
医学图像分割是辅助诊断和临床手术的一项重要技术,它可以减少一些不必要的检查,降低患者的生理痛苦。随着深度学习的发展,计算机视觉技术在医学图像分割领域得到了广泛的应用,并取得了不错的效果;
现有的医学图像分割方法大多是基于卷积神经网络(CNN)的编码器-解码器结构,这些U形网络通过重复地使用局部卷积算子对图像进行卷积来提取不同尺度的特征图,其中浅层特征包含细节信息,深层特征具有丰富的语义信息,然后对深层特征进行渐进式的反卷积运算实现上采样,并通过跳转连接将浅层特征重新引入到深层特征中以弥补上采样产生的空间细节损失;
但上述方法存在一些缺点,首先,卷积层利用共享权值矩阵在图像中不同的空间位置依次进行卷积运算,导致特征图中缺乏长程空间信息交互。其次,传统的U形网络对于浅层特征的使用仅仅局限于粗暴的使用跳转连接来恢复下采样过程中丢失的细节信息,因此本发明提出基于多尺度上下文感知的医学图像分割模型以解决现有技术中存在的问题。
发明内容
针对上述问题,本发明的目的在于提出基于多尺度上下文感知的医学图像分割模型及方法,该种基于多尺度上下文感知的医学图像分割模型及方法具有更精确的分割性能和良好的泛化能力,解决现有技术中的问题。
为实现本发明的目的,本发明通过以下技术方案实现:基于多尺度上下文感知的医学图像分割模型,包括编码器和解码器构成的分割网络框架,所述编码器为经过预训练的ResNet50,且预训练的ResN et50使用五层卷积层,所述解码器包括用于增强特征全局信息的全局循环卷积transformer模块和注意力导向模块,所述全局循环卷积tra nsformer模块内设有用于抑制无用通道信息的通道注意力结构。
进一步改进在于:所述五层卷积层分别为第一层卷积层、第二卷积层、第三卷积层、第四卷积层及第五卷积层,所述第一层卷积层不包含残差块,所述第二、第三、第四和第五卷积层均包含残差块。
进一步改进在于:所述编码器提取多组特征图,且多组特征图中的后三层作为解码器的输入。
进一步改进在于:所述全局循环卷积transformer模块的全局循环卷积包括水平方向上的长程循环卷积和垂直方向上的长程循环卷积。
基于多尺度上下文感知的医学图像分割模型的分割方法,包括以下步骤:
步骤一:输入需要分割的医学图像数据,通过编码器对输入的医学图像数据进行特征提取;
步骤二:由编码器提取的特征数据输入解码器内,由全局循环卷积transformer模块获取全局上下文信息,得到经过全局信息加强的特征;
步骤三:利用注意力导向模块对步骤二中经过全局信息加强的特征进行改进,得到新的特征;
步骤四:对步骤四中新的特征进行卷积以及上采样后,进行拼接,拼接结果作为输出结果。
进一步改进在于:所述步骤一中,编码器对医学图像数据的特征提取过程中,产生分辨率为1/2、1/4、1/8和1/16原图大小的特征图,其中1/4、1/8和1/16的特征图用作解码器的三个输入。
进一步改进在于:所述步骤四中,第三个特征对第二个特征进行上采样,然后进行特征拼接,得到第一特征数据,再将第一特征数据对第一个特征进行上采样,再进行特征拼接,得到第二特征数据,第二特征数据即为输出结果。
进一步改进在于:所述全局循环卷积的步骤为:
将特征在通道方向上等分成两个子特征,分别对它们进行垂直方向上的循环卷积和水平方向上的循环卷积,然后重新拼接成一个特征,在通道方向上的打乱顺序之后重新分成两个子特征,再次分别进行水平方向上的全局循环卷积和垂直方向上的全局循环卷积,最后将两个子特征重新拼接。
本发明的有益效果为:该种基于多尺度上下文感知的医学图像分割模型及方法采用预训练的ResNet50作为编码器以获取更有代表性的特征图,其次为了实现长程依赖性的建模设计一个上下文感知网络,引入了全局循环卷积transformer模块,对编码器提取出来的特征进行全局信息建模,从而加强特征的全局性和长程依赖性,再利用注意力导向模块将经过特征加强的不同尺度特征进行融合,该模块通过在不同尺度之间的特征之间引入空间和通道注意力,使深层特征引导浅层特征进行空间和通道信息的选择,从而在恢复细节信息的同时有效抑制浅层特征的噪声信息,从而解决现有技术中分割时细节信息丢失问题的同时减少浅层特征噪声信息的引入。
附图说明
图1是本发明的结构示意图。
图2是本发明的具体结构示意图。
图3是本发明的全局循环卷积transformer模块结构示意图。
图4是本发明的通道注意力结构示意图。
图5是本发明的注意力导向模块结构示意图。
具体实施方式
为了加深对本发明的理解,下面将结合实施例对本发明做进一步详述,本实施例仅用于解释本发明,并不构成对本发明保护范围的限定。
根据图1-图5所示,本实施例提出了基于多尺度上下文感知的医学图像分割模型,包括编码器和解码器构成的分割网络框架,编码器为经过预训练的ResNet50,使用预训练过的ResNet50作为骨干网络用于获取更加具有代表性的特征,其中,在本实施了中,预训练的ResNet50使用五层卷积层,五层卷积层分别为第一层卷积层、第二卷积层、第三卷积层、第四卷积层及第五卷积层,第一层卷积层不包含残差块,主要对输入进行卷积、正则化、激活函数、最大池化的计算,第二、第三、第四和第五卷积层均包含残差块,残差块的使用可以在保证网络学习能力的情况下解决梯度消失的问题;
编码器提取多组特征图,且多组特征图中的后三层作为解码器的输入,具体的,由编码器对输入的医学图像进行特征提取时,会产生为1/2、1/4、1/8和1/16原图大小的特征图,其中1/4、1/8和1/16的特征图用作解码器的三个输入,解码器包括用于增强特征全局信息的全局循环卷积transformer模块和注意力导向模块,由于使用ResNet50提取的特征缺乏上下文信息,因此本实施例中添加用于捕获长程依赖性的全局卷积transformer模块,其具体结构如图3所示,由于深层特征的通道数较多,信息比较冗余,为了提炼有用通道信息,全局循环卷积transformer模块内设有用于抑制无用通道信息的通道注意力结构,该通道注意力结构图如图4所示,用于抑制无用的通道信息,其通道注意力的实现步骤为:
α=σ(L(AvgPool(f))+L(MaxPool(f)))
其中σ代表sigmoid归一化函数,α代表通道注意力系数,L代表线性变换,AvgPool(·)和Maxpool(·)分别表示平均池化和最大池化。
为了实现卷积代替自注意力的全局信息建模功能,本实施例引入了全局循环卷积(GCC)全局循环卷积transformer模块的全局循环卷积包括水平方向上的长程循环卷积和垂直方向上的长程循环卷积,分别负责对特征在水平方向上和垂直方向上进行长程像素点之间的建模;
具体的假设输入特征为首先产生一个可学习的位置嵌入张量通过空间拓展得到与输入特征大小相同的位置嵌入再通过输入特征与位置嵌入信息进行相加操作将位置信息引入特征图中,然后将引入位置信息的特征图进行与自身进行首尾拼接,用卷积核/>对其进行卷积,卷积核/>在垂直方向上的尺度与输入特征相同,来实现垂直方向上长程像素之间依赖性的建立,因此在垂直方向上的全局循环卷积实现过程如下公式:
O=concat(Ip,Ip)*k
依赖性其中concat代表在垂直方向上的特征拼接,*代表卷积运算,同理可实现水平方向上的全局循环卷积,将垂直方向上和水平方向上的循环卷积结合即可实现对整个特征图长程信息关系的建立。
而在进行多尺度特征融合恢复细节信息时,使用浅层特征的时候会将浅层特征的噪声信息引入,由此本实施例中通过设置的注意力导向模块,将深层特征的空间和通道信息引入浅层特征中,重新加权浅层特征的空间和通道信息,降低浅层特征对预测结果的影响。
基于多尺度上下文感知的医学图像分割模型的分割方法,包括以下步骤:
步骤一:输入需要分割的医学图像数据,通过编码器对输入的医学图像数据进行特征提取,编码器对医学图像数据的特征提取过程中,产生分辨率为1/2、1/4、1/8和1/16原图大小的特征图,其中1/4、1/8和1/16的特征图用作解码器的三个输入,该三个输入的特征图分别为f3、f4和f5;
步骤二:由编码器提取的特征数据分别输入解码器内,由全局循环卷积transformer模块获取全局上下文信息,得到经过全局信息加强的特征fe3、fe4和fe5;
步骤三:为了降低浅层特征的噪声信息对预测结果的影响,利用注意力导向模块对步骤二中经过全局信息加强的特征进行改进,得到新的特征fc3、fc4和fc5;
步骤四:对步骤四中新的特征进行卷积以及上采样后,进行拼接,拼接结果作为输出结果。
步骤四中,第三个特征对第二个特征进行上采样,然后进行特征拼接,得到第一特征数据,再将第一特征数据对第一个特征进行上采样,再进行特征拼接,得到第二特征数据,第二特征数据即为输出结果。
全局循环卷积的步骤为:
f′=GCC(f)+f
fe=FFN(LN(f′))+f′
f和fe分别表示全局循环transformer的输入和输出,FFN代表前馈网络,LN代表层归一化,GCC为全局循环卷积,这里用于代替标准transformer中的自注意力;
具体的将特征在通道方向上等分成两个子特征,分别对它们进行垂直方向上的循环卷积和水平方向上的循环卷积,然后重新拼接成一个特征,在通道方向上的打乱顺序之后重新分成两个子特征,再次分别进行水平方向上的全局循环卷积和垂直方向上的全局循环卷积,最后将两个子特征重新拼接。
进一步的以改进特征fe3为例,具体实现过程如图5所示,输入特征为上述经过全局信息加强的不同尺度特征 首先三个不同尺度的特征经过上采样变换成尺度大小一样的特征和/> 再利用空间注意力和通道注意力机制产生对应尺度特征的信息权重α1、α2和α3;
具体公式如下:
最终的注意力导向系数α是将上述三个系数相加并归一化,如下述公式所示:
α=σ(α1+α2+α3)
再将三个输入特征在通道方向上进行拼接并使用3×3的卷积来调整通道数以得到特征f,最终经过深层特征指导后的特征fe3可通过注意力导向系数α与f相乘得到,如下公式所示:
同理fc4和fc5通过上述类似方式得出。
综上所示,本发明针对基于U形网络的医学图像分割方法存在的无法捕获长程依赖性和细节信息丢失的问题,提出了一个基于多尺度上下文感知的医学图像分割模型。该模型对编码器的后三层特征进行提取,引入一个全局循环卷积transformer模块,通过对提取的特征进行全局上下文信息建模来解决长程依赖性无法捕获的问题。然后引入一个注意力导向模块,对不同尺度的特征进行融合,从而解决分割时细节信息丢失问题的同时减少浅层特征噪声信息的引入。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (8)
1.基于多尺度上下文感知的医学图像分割模型,其特征在于:包括编码器和解码器构成的分割网络框架,所述编码器为经过预训练的ResNet50,且预训练的ResNet50使用五层卷积层,所述解码器包括用于增强特征全局信息的全局循环卷积transformer模块和注意力导向模块,所述全局循环卷积transformer模块内设有用于抑制无用通道信息的通道注意力结构。
2.根据权利要求1所述的基于多尺度上下文感知的医学图像分割模型,其特征在于:所述五层卷积层分别为第一层卷积层、第二卷积层、第三卷积层、第四卷积层及第五卷积层,所述第一层卷积层不包含残差块,所述第二、第三、第四和第五卷积层均包含残差块。
3.根据权利要求1所述的基于多尺度上下文感知的医学图像分割模型,其特征在于:所述编码器提取多组特征图,且多组特征图中的后三层作为解码器的输入。
4.根据权利要求1所述的基于多尺度上下文感知的医学图像分割模型,其特征在于:所述全局循环卷积transformer模块的全局循环卷积包括水平方向上的长程循环卷积和垂直方向上的长程循环卷积。
5.应用于权利要求1所述的基于多尺度上下文感知的医学图像分割模型的分割方法,其特征在于:包括以下步骤:
步骤一:输入需要分割的医学图像数据,通过编码器对输入的医学图像数据进行特征提取;
步骤二:由编码器提取的特征数据输入解码器内,由全局循环卷积transformer模块获取全局上下文信息,得到经过全局信息加强的特征;
步骤三:利用注意力导向模块对步骤二中经过全局信息加强的特征进行改进,得到新的特征;
步骤四:对步骤四中新的特征进行卷积以及上采样后,进行拼接,拼接结果作为输出结果。
6.根据权利要求5所述的基于多尺度上下文感知的医学图像分割模型的分割方法,其特征在于:所述步骤一中,编码器对医学图像数据的特征提取过程中,产生分辨率为1/2、1/4、1/8和1/16原图大小的特征图,其中1/4、1/8和1/16的特征图用作解码器的三个输入。
7.根据权利要求5所述的基于多尺度上下文感知的医学图像分割模型的分割方法,其特征在于:所述步骤四中,第三个特征对第二个特征进行上采样,然后进行特征拼接,得到第一特征数据,再将第一特征数据对第一个特征进行上采样,再进行特征拼接,得到第二特征数据,第二特征数据即为输出结果。
8.根据权利要求5所述的基于多尺度上下文感知的医学图像分割模型的分割方法,其特征在于:所述全局循环卷积的步骤为:
将特征在通道方向上等分成两个子特征,分别对它们进行垂直方向上的循环卷积和水平方向上的循环卷积,然后重新拼接成一个特征,在通道方向上的打乱顺序之后重新分成两个子特征,再次分别进行水平方向上的全局循环卷积和垂直方向上的全局循环卷积,最后将两个子特征重新拼接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211622225.1A CN116309278A (zh) | 2022-12-16 | 2022-12-16 | 基于多尺度上下文感知的医学图像分割模型及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211622225.1A CN116309278A (zh) | 2022-12-16 | 2022-12-16 | 基于多尺度上下文感知的医学图像分割模型及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116309278A true CN116309278A (zh) | 2023-06-23 |
Family
ID=86778567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211622225.1A Pending CN116309278A (zh) | 2022-12-16 | 2022-12-16 | 基于多尺度上下文感知的医学图像分割模型及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116309278A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117746045A (zh) * | 2024-02-08 | 2024-03-22 | 江西师范大学 | 一种Transformer和卷积融合的医学图像分割方法及系统 |
CN118229981A (zh) * | 2024-05-23 | 2024-06-21 | 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) | 一种结合卷积网络和Transformer的CT图像肿瘤分割方法、装置和介质 |
-
2022
- 2022-12-16 CN CN202211622225.1A patent/CN116309278A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117746045A (zh) * | 2024-02-08 | 2024-03-22 | 江西师范大学 | 一种Transformer和卷积融合的医学图像分割方法及系统 |
CN117746045B (zh) * | 2024-02-08 | 2024-05-28 | 江西师范大学 | 一种Transformer和卷积融合的医学图像分割方法及系统 |
CN118229981A (zh) * | 2024-05-23 | 2024-06-21 | 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) | 一种结合卷积网络和Transformer的CT图像肿瘤分割方法、装置和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020989B (zh) | 一种基于深度学习的深度图像超分辨率重建方法 | |
CN116309278A (zh) | 基于多尺度上下文感知的医学图像分割模型及方法 | |
Ma et al. | A crossmodal multiscale fusion network for semantic segmentation of remote sensing data | |
CN116258652B (zh) | 基于结构注意和文本感知的文本图像修复模型及方法 | |
CN112132959A (zh) | 数字岩心图像处理方法、装置、计算机设备及存储介质 | |
CN116309648A (zh) | 一种基于多注意力融合的医学图像分割模型构建方法 | |
CN114972231B (zh) | 一种基于先验-后验概率编码器的多模态mr图像分割方法 | |
CN115511767B (zh) | 一种自监督学习的多模态图像融合方法及其应用 | |
CN114119975A (zh) | 一种语言引导的跨模态实例分割方法 | |
CN116228785A (zh) | 一种基于改进的Unet网络的肺炎CT影像分割方法 | |
CN115170622A (zh) | 基于transformer的医学图像配准方法及系统 | |
CN116433654A (zh) | 一种改进的U-Net网络实现脊柱整体分割方法 | |
CN116664619A (zh) | 医学图像分割方法、装置及设备 | |
CN116797541A (zh) | 一种基于Transformer的肺部CT图像超分辨率重建方法 | |
CN118397458A (zh) | 一种红外弱小目标检测方法及装置 | |
Gao | A method for face image inpainting based on generative adversarial networks | |
CN117974693A (zh) | 图像分割方法、装置、计算机设备和存储介质 | |
CN113379606A (zh) | 一种基于预训练生成模型的人脸超分辨方法 | |
CN117058392A (zh) | 一种基于卷积局部增强的多尺度Transformer图像语义分割方法 | |
CN116934593A (zh) | 基于语义推理和交叉卷积的图像超分辨率方法及系统 | |
CN104123707B (zh) | 一种基于局部秩先验的单幅图像超分辨率重建方法 | |
CN116523985A (zh) | 一种结构和纹理特征引导的双编码器图像修复方法 | |
Ni et al. | Natural Image Reconstruction from fMRI Based on Self-supervised Representation Learning and Latent Diffusion Model | |
CN115100107A (zh) | 一种皮肤镜图像分割方法及系统 | |
CN112967295A (zh) | 一种基于残差网络和注意力机制的图像处理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |