CN116612087A - 一种基于YOLOv5-LA的冠脉CTA狭窄检测方法 - Google Patents
一种基于YOLOv5-LA的冠脉CTA狭窄检测方法 Download PDFInfo
- Publication number
- CN116612087A CN116612087A CN202310577137.2A CN202310577137A CN116612087A CN 116612087 A CN116612087 A CN 116612087A CN 202310577137 A CN202310577137 A CN 202310577137A CN 116612087 A CN116612087 A CN 116612087A
- Authority
- CN
- China
- Prior art keywords
- feature map
- convolution layer
- network
- tensor
- inputting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 16
- 208000031481 Pathologic Constriction Diseases 0.000 title claims abstract description 14
- 230000036262 stenosis Effects 0.000 title claims abstract description 14
- 208000037804 stenosis Diseases 0.000 title claims abstract description 14
- 210000004351 coronary vessel Anatomy 0.000 title claims abstract description 11
- 108091006146 Channels Proteins 0.000 claims description 61
- 230000004927 fusion Effects 0.000 claims description 18
- 238000010586 diagram Methods 0.000 claims description 16
- 238000011176 pooling Methods 0.000 claims description 7
- 201000000057 Coronary Stenosis Diseases 0.000 claims description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 206010011089 Coronary artery stenosis Diseases 0.000 claims description 4
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 claims description 3
- YTAHJIFKAKIKAV-XNMGPUDCSA-N [(1R)-3-morpholin-4-yl-1-phenylpropyl] N-[(3S)-2-oxo-5-phenyl-1,3-dihydro-1,4-benzodiazepin-3-yl]carbamate Chemical compound O=C1[C@H](N=C(C2=C(N1)C=CC=C2)C1=CC=CC=C1)NC(O[C@H](CCN1CCOCC1)C1=CC=CC=C1)=O YTAHJIFKAKIKAV-XNMGPUDCSA-N 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 7
- 238000000605 extraction Methods 0.000 abstract description 5
- 230000002708 enhancing effect Effects 0.000 abstract description 2
- 230000003902 lesion Effects 0.000 abstract description 2
- 230000007246 mechanism Effects 0.000 abstract description 2
- 230000001965 increasing effect Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010057469 Vascular stenosis Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30101—Blood vessel; Artery; Vein; Vascular
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Biodiversity & Conservation Biology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Quality & Reliability (AREA)
- Radiology & Medical Imaging (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Processing (AREA)
Abstract
一种基于YOLOv5‑LA的冠脉CTA狭窄检测方法,通过设计更轻量的LA网络来替代YOLOv5的主干特征提取网络。该方法分为两个阶段。第一阶段,通过分离可卷积和残差连接以降低计算复杂度,同时增强模型的感受野。第二阶段,引入轻量级注意力机制ECA,以建模通道之间的关系。然后,通过1×1的卷积进行通道重排,以增加特征之间的交互性,提高网络的表达能力,并减少模型对某些特定通道的依赖,从而防止过拟合。该改进方法可避免由于冠脉CTA图像分辨率较高和YOLOv5参数量较大而导致的低效率问题,在检测医学图像病变部位时更为准确和高效。
Description
技术领域
本发明涉及医学图片目标检测技术领域,具体涉及一种基于YOLOv5-LA的冠脉CTA狭窄检测方法。
背景技术
CTA是一种无创技术,可以准确诊断冠状动脉狭窄。在实际应用中,由于图片的复杂性、诊断者的经验差异和大量阅片工作量,人工检测血管狭窄非常耗时且效率低下。因此,使用人工智能辅助筛查可以提高工作效率。YOLOv5是一种人工智能算法,通过对医学图片数据进行训练,可以自动识别冠状动脉狭窄部位。然而,在实际应用中,其精度和效率仍有提高的空间。由于医学图像分辨率较高且YOLOv5模型较为复杂,运行效率不高,因此需要特定的算法进行处理和优化。
发明内容
本发明为了克服以上技术的不足,提供了一种使用更轻量的LA网络替换YOLOv5主干特征提取网络C3,实现网络模型的轻量化的冠脉CTA狭窄检测方法。
本发明克服其技术问题所采用的技术方案是:
一种基于YOLOv5-LA的冠脉CTA狭窄检测方法,包括如下步骤:
a)将冠状动脉CTA图片灰度化处理后进行缩放处理,得到图片D,D∈RC×H×W,R为实数空间,C为图片的通道数,H为图片的高度,W为图片的宽度;
b)将图片D依次输入到卷积层、BN层中,输出得到特征图D1;
c)建立轻量级的LA网络,将特征图D1输入到轻量级的LA网络中,输出得到张量D1_LA1;
d)将张量D1_LA1输入到卷积层中,输出得到特征图D2,将特征图D2替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA2;
e)将张量D1_LA2输入到卷积层中,输出得到特征图D3,将特征图D3替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA3;
f)将张量D1_LA3入到卷积层中,输出得到特征图D4;
g)将特征图D4输入到YOLOv5网络中的SPP模块中,得到特征图D4_SPP;
h)将特征图D4_SPP替代步骤c)中的特征图D1后重复执行步骤c),得到张量D4_LA1,将张量D4_LA1输入到卷积层中,输出得到特征图D5;
i)将特征图D5输入到上采样层中,输出得到特征图D5′,将特征图D5′与张量D1_LA3通过concat()函数进行融合操作,得到融合的特征图D1_Concat1;j)将特征图D1_Concat1替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA5,得到张量D1_LA5输入到卷积层中,输出得到特征图D6;k)将特征图D6输入到上采样层中,输出得到特征图D6′,将特征图D6′与张量D1_LA2通过concat()函数进行融合操作,得到融合的特征图D1_Concat2;
l)将特征图D1_Concat2替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA6,将张量D1_LA6输入到Yolov5网络的头部网络Head中,输出得到预测结果Head1;
m)将张量D1_LA6输入到卷积层中,输出得到特征图D1_LA6′,将特征图D1_LA6′与特征图D6通过concat()函数进行融合操作,得到融合的特征图D1_Concat3,将融合的特征图D1_Concat3替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA7,将将张量D1_LA7输入到Yolov5网络的头部网络Head中,输出得到预测结果Head2;
n)将张量D1_LA7输入到卷积层中,输出得到特征图D1_LA7′,将特征图D1_LA7′与特征图D5通过concat()函数进行融合操作,得到融合的特征图D1_Concat4,将融合的特征图D1_Concat4替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA8,将将张量D1_LA8输入到Yolov5网络的头部网络Head中,输出得到预测结果Head3;
o)将预测结果Head1、预测结果Head2、预测结果Head3通过concat()函数进行融合操作后输入到全连接层中,输出得到预测结果Result,预测结果Result为0-1之间分布,当预测结果Result大于等于0.5时定义为冠脉狭窄。
优选的,步骤a)中将灰度化后的冠状动脉CTA图片尺寸缩放为640×640。
优选的,步骤b)中卷积层的卷积核大小为3×3。
进一步的,步骤c)包括如下步骤:
c-1)轻量级的LA网络由第一卷积层、W-Mish函数、第一深度可分离卷积层、第二深度可分离卷积层、第二卷积层、ECA模块、第三卷积层构成;
c-2)将特征图D1输入到轻量级的LA网络的第一卷积层中,输出得到特征图D1′;
c-3)将特征图D1′通过W-Mish函数利用公式D1_1=D1′*tanh(ln(1+eD1′))计算得到特征图D1_1,式中e为自然常数;
c-4)将特征图D1_1输入到轻量级的LA网络的第一深度可分离卷积层中,输出得到H×W个大小为1×1的矩阵D1_1_slice1;
c-5)将各个矩阵D1_1_slice1输入到轻量级的LA网络的第二深度可分离卷积层中,输出得到H×W个大小为1×1的矩阵D1_1_slicel2;
c-6)将各个矩阵D1_1_slicel2输入到轻量级的LA网络的第二卷积层中,输出得到特征图D1_2;
c-7)将特征图D1进行残差连接操作后得到特征图D1_residual,将特征图D1_residual与特征图D1_2进行相加操作,得到特征图D1_out1;
c-8)轻量级的LA网络的ECA模块由全局平均池化层、全连接层、Sigmoid函数层、一维卷积层构成,将特征图D1_out1输入到ECA模块的全局平均池化层中,输出得到特征图D1_out1_gap,将特征图D1_out1_gap依次输入到全连接层、Sigmoid函数层中,输出得到注意力向量Q,将注意力向量Q与特征图D1_out1相乘操作,得到新特征图D1_out1_1,将新特征图D1_out1_1输入到ECA模块的一维卷积层中,输出得到新特征图D1_out2;
c-9)将新特征图D1_out2输入到轻量级的LA网络的第三卷积层中进行分组卷积,对通道分组,得到通道X和通道Y;
c-10)将通道X和通道Y分别进行shuffle操作,得到打乱特征通道顺序的通道X和打乱特征通道顺序的通道Y;
c-11)将打乱特征通道顺序的通道X和打乱特征通道顺序的通道Y沿着通道方向交错连接起来,得到张量D1_LA1。
优选的,步骤c-2)中轻量级的LA网络的第一卷积层的卷积核大小为1×1,步骤c-4)中轻量级的LA网络的第一深度可分离卷积层的卷积核大小为1×3,步骤c-5)中轻量级的LA网络的第二深度可分离卷积层的卷积核大小为1×3,步骤c-6)中轻量级的LA网络的第二卷积层的卷积核大小为1×1,步骤c-9)中轻量级的LA网络的第三卷积层的卷积核大小为1×1。
优选的,步骤d)中卷积层的卷积核大小为3×3,步骤e)中卷积层的卷积核大小为3×3,步骤f)中卷积层的卷积核大小为3×3。
优选的,步骤h)中卷积层的卷积核大小为3×3,步骤j)中卷积层的卷积核大小为3×3,步骤k)中卷积层的卷积核大小为3×3,步骤m)中卷积层的卷积核大小为3×3,步骤n)中卷积层的卷积核大小为3×3。
本发明的有益效果是:通过设计更轻量的LA网络来替代YOLOv5的主干特征提取网络。该方法分为两个阶段。第一阶段,通过分离可卷积和残差连接以降低计算复杂度,同时增强模型的感受野。第二阶段,引入轻量级注意力机制ECA,以建模通道之间的关系。然后,通过1×1的卷积进行通道重排,以增加特征之间的交互性,提高网络的表达能力,并减少模型对某些特定通道的依赖,从而防止过拟合。该改进方法可避免由于冠脉CTA图像分辨率较高和YOLOv5参数量较大而导致的低效率问题,在检测医学图像病变部位时更为准确和高效。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面结合附图1对本发明做进一步说明。
一种基于YOLOv5-LA的冠脉CTA狭窄检测方法,包括如下步骤:
a)将冠状动脉CTA图片灰度化处理后进行缩放处理,得到图片D,D∈RC×H×W,R为实数空间,C为图片的通道数,H为图片的高度,W为图片的宽度。
b)将图片D依次输入到卷积层、BN层中,输出得到特征图D1。
c)建立轻量级的LA网络,将特征图D1输入到轻量级的LA网络中,输出得到张量D1_LA1。
d)将张量D1_LA1输入到卷积层中,输出得到特征图D2,将特征图D2替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA2。
e)将张量D1_LA2输入到卷积层中,输出得到特征图D3,将特征图D3替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA3。
f)将张量D1_LA3入到卷积层中,输出得到特征图D4。
g)将特征图D4输入到YOLOv5网络中的SPP模块中,得到特征图D4_SPP。
h)将特征图D4_SPP替代步骤c)中的特征图D1后重复执行步骤c),得到张量D4_LA1,将张量D4_LA1输入到卷积层中,输出得到特征图D5。
i)将特征图D5输入到上采样层中,输出得到特征图D5′,将特征图D5′与张量D1_LA3通过concat()函数进行融合操作,得到融合的特征图D1_Concat1。
j)将特征图D1_Concat1替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA5,得到张量D1_LA5输入到卷积层中,输出得到特征图D6。
k)将特征图D6输入到上采样层中,输出得到特征图D6′,将特征图D6′与张量D1_LA2通过concat()函数进行融合操作,得到融合的特征图D1_Concat2。
l)将特征图D1_Concat2替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA6,将张量D1_LA6输入到Yolov5网络的头部网络Head中,输出得到预测结果Head1。
m)将张量D1_LA6输入到卷积层中,输出得到特征图D1_LA6′,将特征图D1_LA6′与特征图D6通过concat()函数进行融合操作,得到融合的特征图D1_Concat3,将融合的特征图D1_Concat3替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA7,将将张量D1_LA7输入到Yolov5网络的头部网络Head中,输出得到预测结果Head2。
n)将张量D1_LA7输入到卷积层中,输出得到特征图D1_LA7′,将特征图D1_LA7′与特征图D5通过concat()函数进行融合操作,得到融合的特征图D1_Concat4,将融合的特征图D1_Concat4替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA8,将将张量D1_LA8输入到Yolov5网络的头部网络Head中,输出得到预测结果Head3。
o)将预测结果Head1、预测结果Head2、预测结果Head3通过concat()函数进行融合操作后输入到全连接层中,输出得到预测结果Result,预测结果Result为0-1之间分布,当预测结果Result大于等于0.5时定义为冠脉狭窄。
本发明设计了轻量级的LA网络用于替换YOLOv5主干特征提取网络C3。该网络分两个阶段实现。第一阶段:首先通过1x1卷积层将输入特征的通道数降低,减少模型的参数数量和计算量。然后经过Wmish函数和两个连续的1x3深度可分离卷积层,后跟一个1x1卷积,降低计算复杂度。接着通过1x1卷积层将输入特征的通道数增加,增加模型的表达能力。与此同时,对原始输入特征使用残差连接,与升维后的特征图进行加和。第二阶段,在残差连接之后,使用ECA模块增强特征表达能力。该模块通过对特征进行全局平均池化、全连接和sigmoid激活,得到重要性权重,进而将权重与特征相乘以加强其表达能力。然后通过1x1卷积层对输入特征进行通道分组,得到特征图组。对每个特征图组内的特征进行Shuffle操作。最后将通道分组后的特征进行Concat操作,得到新的特征图。改进的YOLOv5在特征提取、生成预测结果时计算量减少,提高了检测冠脉狭窄的效率。
实施例1:
步骤a)中将灰度化后的冠状动脉CTA图片尺寸缩放为640×640。步骤b)中卷积层的卷积核大小为3×3。
实施例2:
步骤c)包括如下步骤:
c-1)轻量级的LA网络由第一卷积层、W-Mish函数、第一深度可分离卷积层、第二深度可分离卷积层、第二卷积层、ECA模块、第三卷积层构成。
c-2)将特征图D1输入到轻量级的LA网络的第一卷积层中,输出得到特征图D1′。通过1×1卷积使得通道为原来的1/4,降维的目的是减少模型的参数数量和计算量。
c-3)将特征图D1′通过W-Mish函数利用公式D1_1=D1′*tanh(ln(1+eD1′))计算得到特征图D1_1,式中e为自然常数。W-Mish函数可以提高神经网络的非线性表达能力。
c-4)将特征图D1_1输入到轻量级的LA网络的第一深度可分离卷积层中,输出得到H×W个大小为1×1的矩阵D1_1_slice1。
c-5)将各个矩阵D1_1_slice1输入到轻量级的LA网络的第二深度可分离卷积层中,输出得到H×W个大小为1×1的矩阵D1_1_slicel2。连续的两个深度可卷积分离层可以降低计算复杂度的同时,增强模型的感受野(3x3深度可分离卷积的卷积核大小比1x1卷积要大,因此它能够更好地捕捉图像中的空间信息,增强模型的感受野)。
c-6)将各个矩阵D1_1_slicel2输入到轻量级的LA网络的第二卷积层中进行逐点卷积操作,升维得到特征图D1_2,通道扩充4倍,保证特征通道数和特征图D1一样。
c-7)将特征图D1进行残差连接操作后得到特征图D1_residual,将特征图D1_residual与特征图D1_2进行相加操作,得到特征图D1_out1。
c-8)轻量级的LA网络的ECA模块由全局平均池化层、全连接层、Sigmoid函数层、一维卷积层构成,将特征图D1_out1输入到ECA模块的全局平均池化层中,输出得到特征图D1_out1_gap,将特征图D1_out1_gap依次输入到全连接层、Sigmoid函数层中,输出得到注意力向量Q,这个向量中的每个元素都在[0,1]的范围内,可以用来表示每个通道的注意力权重。将注意力向量Q与特征图D1_out1相乘操作,得到新特征图D1_out1_1,将新特征图D1_out1_1输入到ECA模块的一维卷积层中,输出得到新特征图D1_out2。这个特征图可以用来增强特征图的表达能力,提高模型的性能。
c-9)将新特征图D1_out2输入到轻量级的LA网络的第三卷积层中进行分组卷积,对通道分组,得到通道X和通道Y。这个卷积层的输出通道数是原始特征的一半,因为后面的操作需要将通道分成两组进行shuffle操作。
c-10)将通道X和通道Y分别进行shuffle操作,得到打乱特征通道顺序的通道X和打乱特征通道顺序的通道Y。shuffle操作的目的是打乱特征通道的顺序,增加模型的随机性和非线性能力。
c-11)将打乱特征通道顺序的通道X和打乱特征通道顺序的通道Y沿着通道方向交错连接起来,得到张量D1_LA1。张量D1_LA1通道内的特征已经被打乱了顺序。
实施例3:
步骤c-2)中轻量级的LA网络的第一卷积层的卷积核大小为1×1,步骤c-4)中轻量级的LA网络的第一深度可分离卷积层的卷积核大小为1×3,步骤c-5)中轻量级的LA网络的第二深度可分离卷积层的卷积核大小为1×3,步骤c-6)中轻量级的LA网络的第二卷积层的卷积核大小为1×1,步骤c-9)中轻量级的LA网络的第三卷积层的卷积核大小为1×1。步骤d)中卷积层的卷积核大小为3×3,步骤e)中卷积层的卷积核大小为3×3,步骤f)中卷积层的卷积核大小为3×3。步骤h)中卷积层的卷积核大小为3×3,步骤j)中卷积层的卷积核大小为3×3,步骤k)中卷积层的卷积核大小为3×3,步骤m)中卷积层的卷积核大小为3×3,步骤n)中卷积层的卷积核大小为3×3。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于YOLOv5-LA的冠脉CTA狭窄检测方法,其特征在于,包括如下步骤:
a)将冠状动脉CTA图片灰度化处理后进行缩放处理,得到图片D,D∈RC×H×W,R为实数空间,C为图片的通道数,H为图片的高度,W为图片的宽度;
b)将图片D依次输入到卷积层、BN层中,输出得到特征图D1;
c)建立轻量级的LA网络,将特征图D1输入到轻量级的LA网络中,输出得到张量D1_LA1;
d)将张量D1_LA1输入到卷积层中,输出得到特征图D2,将特征图D2替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA2;
e)将张量D1_LA2输入到卷积层中,输出得到特征图D3,将特征图D3替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA3;
f)将张量D1_LA3入到卷积层中,输出得到特征图D4;
g)将特征图D4输入到YOLOv5网络中的SPP模块中,得到特征图D4_SPP;
h)将特征图D4_SPP替代步骤c)中的特征图D1后重复执行步骤c),得到张量D4_LA1,将张量D4_LA1输入到卷积层中,输出得到特征图D5;
i)将特征图D5输入到上采样层中,输出得到特征图D5′,将特征图D5′与张量D1_LA3通过concat()函数进行融合操作,得到融合的特征图D1_Concat1;
j)将特征图D1_Concat1替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA5,得到张量D1_LA5输入到卷积层中,输出得到特征图D6;
k)将特征图D6输入到上采样层中,输出得到特征图D6′,将特征图D6′与张量D1_LA2通过concat()函数进行融合操作,得到融合的特征图D1_Concat2;
l)将特征图D1_Concat2替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA6,将张量D1_LA6输入到Yolov5网络的头部网络Head中,输出得到预测结果Head1;
m)将张量D1_LA6输入到卷积层中,输出得到特征图D1_LA6′,将特征图D1_LA6′与特征图D6通过concat()函数进行融合操作,得到融合的特征图D1_Concat3,将融合的特征图D1_Concat3替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA7,将将张量D1_LA7输入到Yolov5网络的头部网络Head中,输出得到预测结果Head2;
n)将张量D1_LA7输入到卷积层中,输出得到特征图D1_LA7′,将特征图D1_LA7′与特征图D5通过concat()函数进行融合操作,得到融合的特征图D1_Concat4,将融合的特征图D1_Concat4替代步骤c)中的特征图D1后重复执行步骤c),得到张量D1_LA8,将将张量D1_LA8输入到Yolov5网络的头部网络Head中,输出得到预测结果Head3;
o)将预测结果Head1、预测结果Head2、预测结果Head3通过concat()函数进行融合操作后输入到全连接层中,输出得到预测结果Result,预测结果Result为0-1之间分布,当预测结果Result大于等于0.5时定义为冠脉狭窄。
2.根据权利要求1所述的基于YOLOv5-LA的冠脉CTA狭窄检测方法,其特征在于:步骤a)中将灰度化后的冠状动脉CTA图片尺寸缩放为640×640。
3.根据权利要求1所述的基于YOLOv5-LA的冠脉CTA狭窄检测方法,其特征在于:步骤b)中卷积层的卷积核大小为3×3。
4.根据权利要求1所述的基于YOLOv5-LA的冠脉CTA狭窄检测方法,其特征在于,步骤c)包括如下步骤:
c-1)轻量级的LA网络由第一卷积层、W-Mish函数、第一深度可分离卷积层、第二深度可分离卷积层、第二卷积层、ECA模块、第三卷积层构成;
c-2)将特征图D1输入到轻量级的LA网络的第一卷积层中,输出得到特征图D1′;c-3)将特征图D1′通过W-Mish函数利用公式D1_1=D1′*tanh(ln(1+eD1′))计算得到特征图D1_1,式中e为自然常数;
c-4)将特征图D1_1输入到轻量级的LA网络的第一深度可分离卷积层中,输出得到H×W个大小为1×1的矩阵D1_1_slice1;
c-5)将各个矩阵D1_1_slice1输入到轻量级的LA网络的第二深度可分离卷积层中,输出得到H×W个大小为1×1的矩阵D1_1_slicel2;
c-6)将各个矩阵D1_1_slicel2输入到轻量级的LA网络的第二卷积层中,输出得到特征图D1_2;
c-7)将特征图D1进行残差连接操作后得到特征图D1_residual,将特征图D1_residual与特征图D1_2进行相加操作,得到特征图D1_out1;
c-8)轻量级的LA网络的ECA模块由全局平均池化层、全连接层、Sigmoid函数层、一维卷积层构成,将特征图D1_out1输入到ECA模块的全局平均池化层中,输出得到特征图D1_out1_gap,将特征图D1_out1_gap依次输入到全连接层、Sigmoid函数层中,输出得到注意力向量Q,将注意力向量Q与特征图D1_out1相乘操作,得到新特征图D1_out1_1,将新特征图D1_out1_1输入到ECA模块的一维卷积层中,输出得到新特征图D1_out2;
c-9)将新特征图D1_out2输入到轻量级的LA网络的第三卷积层中进行分组卷积,对通道分组,得到通道X和通道Y;
c-10)将通道X和通道Y分别进行shuffle操作,得到打乱特征通道顺序的通道X和打乱特征通道顺序的通道Y;
c-11)将打乱特征通道顺序的通道X和打乱特征通道顺序的通道Y沿着通道方向交错连接起来,得到张量D1_LA1。
5.根据权利要求1所述的基于YOLOv5-LA的冠脉CTA狭窄检测方法,其特征在于:步骤c-2)中轻量级的LA网络的第一卷积层的卷积核大小为1×1,步骤c-4)中轻量级的LA网络的第一深度可分离卷积层的卷积核大小为1×3,步骤c-5)中轻量级的LA网络的第二深度可分离卷积层的卷积核大小为1×3,步骤c-6)中轻量级的LA网络的第二卷积层的卷积核大小为1×1,步骤c-9)中轻量级的LA网络的第三卷积层的卷积核大小为1×1。
6.根据权利要求1所述的基于YOLOv5-LA的冠脉CTA狭窄检测方法,其特征在于:步骤d)中卷积层的卷积核大小为3×3,步骤e)中卷积层的卷积核大小为3×3,步骤f)中卷积层的卷积核大小为3×3。
7.根据权利要求1所述的基于YOLOv5-LA的冠脉CTA狭窄检测方法,其特征在于:步骤h)中卷积层的卷积核大小为3×3,步骤j)中卷积层的卷积核大小为3×3,步骤k)中卷积层的卷积核大小为3×3,步骤m)中卷积层的卷积核大小为3×3,步骤n)中卷积层的卷积核大小为3×3。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310577137.2A CN116612087B (zh) | 2023-05-22 | 2023-05-22 | 一种基于YOLOv5-LA的冠脉CTA狭窄检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310577137.2A CN116612087B (zh) | 2023-05-22 | 2023-05-22 | 一种基于YOLOv5-LA的冠脉CTA狭窄检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116612087A true CN116612087A (zh) | 2023-08-18 |
CN116612087B CN116612087B (zh) | 2024-02-23 |
Family
ID=87674171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310577137.2A Active CN116612087B (zh) | 2023-05-22 | 2023-05-22 | 一种基于YOLOv5-LA的冠脉CTA狭窄检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116612087B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117934651A (zh) * | 2024-01-26 | 2024-04-26 | 南通大学 | 一种用于病变冠脉检测的冠脉cta投影变换方法 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190286930A1 (en) * | 2018-03-16 | 2019-09-19 | Boe Technology Group Co., Ltd. | Method for recognizing image, computer product and readable storage medium |
CN113344188A (zh) * | 2021-06-18 | 2021-09-03 | 东南大学 | 基于通道注意力模块的轻量级神经网络模型 |
CN113838021A (zh) * | 2021-09-18 | 2021-12-24 | 长春理工大学 | 基于改进的YOLOv5网络的肺结节检测系统 |
CN113902744A (zh) * | 2021-12-10 | 2022-01-07 | 湖南师范大学 | 基于轻量级网络的图像检测方法、系统、设备和存储介质 |
CN114764788A (zh) * | 2022-03-29 | 2022-07-19 | 首都医科大学附属北京天坛医院 | 一种颅内动脉狭窄检测方法及系统 |
CN114821246A (zh) * | 2022-06-28 | 2022-07-29 | 山东省人工智能研究院 | 基于多层次残差网络感知和注意力机制的小目标检测方法 |
CN114972780A (zh) * | 2022-04-11 | 2022-08-30 | 西北大学 | 一种基于改进YOLOv5的轻量化目标检测网络 |
CN115100549A (zh) * | 2022-06-24 | 2022-09-23 | 国网山西省电力公司超高压输电分公司 | 一种基于改进YOLOv5的输电线路金具检测方法 |
CN115496951A (zh) * | 2022-10-09 | 2022-12-20 | 淮阴工学院 | 一种基于改进YOLOv5s的安全设备检测方法 |
CN115546614A (zh) * | 2022-12-02 | 2022-12-30 | 天津城建大学 | 一种基于改进yolov5模型的安全帽佩戴检测方法 |
CN115829970A (zh) * | 2022-12-02 | 2023-03-21 | 天津师范大学 | 一种基于改进yolov5的冠状动脉支架检测方法 |
CN115965827A (zh) * | 2023-01-17 | 2023-04-14 | 淮阴工学院 | 一种融合多尺度特征的轻量级小目标检测方法及装置 |
CN116051953A (zh) * | 2022-11-23 | 2023-05-02 | 中国铁塔股份有限公司重庆市分公司 | 基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法 |
CN116071701A (zh) * | 2023-01-13 | 2023-05-05 | 昆明理工大学 | 基于注意力机制和GSConv的YOLOv5行人检测方法 |
-
2023
- 2023-05-22 CN CN202310577137.2A patent/CN116612087B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190286930A1 (en) * | 2018-03-16 | 2019-09-19 | Boe Technology Group Co., Ltd. | Method for recognizing image, computer product and readable storage medium |
CN113344188A (zh) * | 2021-06-18 | 2021-09-03 | 东南大学 | 基于通道注意力模块的轻量级神经网络模型 |
CN113838021A (zh) * | 2021-09-18 | 2021-12-24 | 长春理工大学 | 基于改进的YOLOv5网络的肺结节检测系统 |
CN113902744A (zh) * | 2021-12-10 | 2022-01-07 | 湖南师范大学 | 基于轻量级网络的图像检测方法、系统、设备和存储介质 |
CN114764788A (zh) * | 2022-03-29 | 2022-07-19 | 首都医科大学附属北京天坛医院 | 一种颅内动脉狭窄检测方法及系统 |
CN114972780A (zh) * | 2022-04-11 | 2022-08-30 | 西北大学 | 一种基于改进YOLOv5的轻量化目标检测网络 |
CN115100549A (zh) * | 2022-06-24 | 2022-09-23 | 国网山西省电力公司超高压输电分公司 | 一种基于改进YOLOv5的输电线路金具检测方法 |
CN114821246A (zh) * | 2022-06-28 | 2022-07-29 | 山东省人工智能研究院 | 基于多层次残差网络感知和注意力机制的小目标检测方法 |
CN115496951A (zh) * | 2022-10-09 | 2022-12-20 | 淮阴工学院 | 一种基于改进YOLOv5s的安全设备检测方法 |
CN116051953A (zh) * | 2022-11-23 | 2023-05-02 | 中国铁塔股份有限公司重庆市分公司 | 基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法 |
CN115546614A (zh) * | 2022-12-02 | 2022-12-30 | 天津城建大学 | 一种基于改进yolov5模型的安全帽佩戴检测方法 |
CN115829970A (zh) * | 2022-12-02 | 2023-03-21 | 天津师范大学 | 一种基于改进yolov5的冠状动脉支架检测方法 |
CN116071701A (zh) * | 2023-01-13 | 2023-05-05 | 昆明理工大学 | 基于注意力机制和GSConv的YOLOv5行人检测方法 |
CN115965827A (zh) * | 2023-01-17 | 2023-04-14 | 淮阴工学院 | 一种融合多尺度特征的轻量级小目标检测方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117934651A (zh) * | 2024-01-26 | 2024-04-26 | 南通大学 | 一种用于病变冠脉检测的冠脉cta投影变换方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116612087B (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hui et al. | Fast and accurate single image super-resolution via information distillation network | |
CN112818764B (zh) | 一种基于特征重建模型的低分辨率图像人脸表情识别方法 | |
CN112183637A (zh) | 一种基于神经网络的单光源场景光照重渲染方法及系统 | |
CN113658057B (zh) | 一种Swin Transformer微光图像增强方法 | |
CN112288632B (zh) | 基于精简esrgan的单图像超分辨率方法及系统 | |
CN116612087B (zh) | 一种基于YOLOv5-LA的冠脉CTA狭窄检测方法 | |
CN111062329B (zh) | 基于增广网络的无监督行人重识别方法 | |
CN111861886B (zh) | 一种基于多尺度反馈网络的图像超分辨率重建方法 | |
CN115171052B (zh) | 基于高分辨率上下文网络的拥挤人群姿态估计方法 | |
CN112017116A (zh) | 基于非对称卷积的图像超分辨率重建网络及其构建方法 | |
Muqeet et al. | Ultra lightweight image super-resolution with multi-attention layers | |
CN111489305B (zh) | 基于强化学习的图像增强方法 | |
CN115410087A (zh) | 一种基于改进YOLOv4的输电线路异物检测方法 | |
CN114463176B (zh) | 基于改进esrgan的图像超分辨重建方法 | |
Jang et al. | Dual path denoising network for real photographic noise | |
CN117934447A (zh) | 基于gan及空间反向注意力机制的划痕缺陷数据扩充方法及系统 | |
CN112634168A (zh) | 一种结合边缘信息的图像修复方法 | |
CN116757953A (zh) | 基于深度学习多阶局部注意力和混合注意力的图像去噪方法 | |
CN114119428B (zh) | 一种图像去模糊方法和装置 | |
CN115439849B (zh) | 基于动态多策略gan网络的仪表数字识别方法及系统 | |
CN110889811A (zh) | 一种照片修复系统构建方法、照片修复方法及系统 | |
CN114862670A (zh) | 大鼠踝骨骨折Micro-CT图像的超分辨率重建装置 | |
CN117557857B (zh) | 结合渐进式引导蒸馏和结构重构的检测网络轻量化方法 | |
CN114820324B (zh) | 一种基于三并行残差网络的图像超分辨率重建系统 | |
Borglund et al. | Spatio-Temporal Noise Filtering using Convolutional Neural Networks with a Realistic Noise Model under Low-Light Conditions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |