CN117350992A - 基于自导向注意机制多任务分割网络金属植入物识别方法 - Google Patents
基于自导向注意机制多任务分割网络金属植入物识别方法 Download PDFInfo
- Publication number
- CN117350992A CN117350992A CN202311451174.5A CN202311451174A CN117350992A CN 117350992 A CN117350992 A CN 117350992A CN 202311451174 A CN202311451174 A CN 202311451174A CN 117350992 A CN117350992 A CN 117350992A
- Authority
- CN
- China
- Prior art keywords
- attention mechanism
- self
- metal implant
- medical image
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007246 mechanism Effects 0.000 title claims abstract description 83
- 239000002184 metal Substances 0.000 title claims abstract description 70
- 229910052751 metal Inorganic materials 0.000 title claims abstract description 70
- 239000007943 implant Substances 0.000 title claims abstract description 68
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000011218 segmentation Effects 0.000 title claims abstract description 42
- 210000000988 bone and bone Anatomy 0.000 claims abstract description 22
- 230000006870 function Effects 0.000 claims description 30
- 238000012549 training Methods 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012795 verification Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 11
- 206010065687 Bone loss Diseases 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 4
- 230000004931 aggregating effect Effects 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 14
- 239000000284 extract Substances 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 150000002739 metals Chemical class 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000000689 upper leg Anatomy 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 210000004197 pelvis Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Databases & Information Systems (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本申请提供了一种基于自导向注意机制多任务分割网络金属植入物识别方法、装置、设备及计算机可读存储介质。该基于自导向注意机制多任务分割网络金属植入物识别方法,包括:获取CT医学图像;将CT医学图像的DICOM格式转换为PNG格式,得到目标医学图像;将目标医学图像输入预设的自导向注意机制多任务分割网络模型中,确定骨骼区域和金属植入物区域。根据本申请实施例,能够提高金属植入物识别结果的准确性。
Description
技术领域
本申请属于深度学习智能识别技术领域,尤其涉及一种基于自导向注意机制多任务分割网络金属植入物识别方法、装置、设备及计算机可读存储介质。
背景技术
目前,相关技术中识别金属植入物的方法是阈值分割的方式,但是该方法中预先设定的阈值并不准确,导致金属植入物识别结果不准确。
因此,如何提高金属植入物识别结果的准确性是本领域技术人员亟需解决的技术问题。
发明内容
本申请实施例提供一种基于自导向注意机制多任务分割网络金属植入物识别方法、装置、设备及计算机可读存储介质,能够提高金属植入物识别结果的准确性。
第一方面,本申请实施例提供一种基于自导向注意机制多任务分割网络金属植入物识别方法,包括:
获取CT医学图像;
将CT医学图像的DICOM格式转换为PNG格式,得到目标医学图像;
将目标医学图像输入预设的自导向注意机制多任务分割网络模型中,确定骨骼区域和金属植入物区域。
可选的,将目标医学图像输入预设的自导向注意机制多任务分割网络模型中,确定骨骼区域和金属植入物区域,包括:
将CT医学图像输入预先训练好的ResNet34中,提取4个不同层次的特征图;
通过线性插值将所有的特征图上采样到最大的一个特征尺度,使得4个特征图具有相同的特征尺度;
将4个特征图进行融合,经过一个卷积处理,再分别与每一个特征进行融合输出;
将每个融合输出结果分别经过自导向注意机制多任务网络,输出的4个结果进行融合并经过一个卷积处理,确定骨骼区域和金属植入物区域。
可选的,自导向注意机制多任务分割网络模型中的自导向注意机制网络,包括:
利用两个注意机制网络分别提取特征图;
将两个特征图进行聚合,得到注意力特征图。
可选的,注意机制网络,包括:
位置注意力机制,用于捕获长距离依赖,解决局部感受野;
通道注意力机制,用于捕获通道间存在的依赖关系,增强特定的语义特征表示。
可选的,还包括:
计算金属植入物损失函数;
计算骨骼损失函数;
基于金属植入物损失函数、骨骼损失函数,确定最终损失函数。
可选的,还包括:
获取CT医学图像数据集;
标注CT医学图像数据集中骨骼区域和金属植入物区域,并将骨骼区域和金属植入物区域确定为分割mask;
将每个CT医学图像及其对应的分割mask的图像格式均转换为PNG格式;
将所有转换为PNG格式的CT医学图像及其对应的分割mask,按照预设比例划分为训练集、验证集和测试集。
可选的,自导向注意机制多任务分割网络模型的模型训练过程,包括:
在模型训练过程中,设置训练的batch_size为64;
设置初始化学习率为1e-4,附加学习率衰减策略,每迭代5000次,学习率衰减为上一次学习率的0.9;
设置优化器为Adam优化器;
设置损失函数为DICE loss;
设置每迭代1000次,对训练集和验证集做一次验证,通过早停法来判断网络训练停止时间,并得到自导向注意机制多任务分割网络模型。
第二方面,本申请实施例提供了一种基于自导向注意机制多任务分割网络金属植入物识别装置,所述装置包括:
图像获取模块,用于获取CT医学图像;
格式转换模块,用于将CT医学图像的DICOM格式转换为PNG格式,得到目标医学图像;
植入物识别模块,用于将目标医学图像输入预设的自导向注意机制多任务分割网络模型中,确定骨骼区域和金属植入物区域。
第三方面,本申请实施例提供了一种电子设备,其特征在于,所述电子设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如第一方面所示的基于自导向注意机制多任务分割网络金属植入物识别方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如第一方面所示的基于自导向注意机制多任务分割网络金属植入物识别方法。
本申请实施例的基于自导向注意机制多任务分割网络金属植入物识别方法、装置、设备及计算机可读存储介质,能够提高金属植入物识别结果的准确性。
该基于自导向注意机制多任务分割网络金属植入物识别方法,包括:获取CT医学图像;将CT医学图像的DICOM格式转换为PNG格式,得到目标医学图像;将目标医学图像输入预设的自导向注意机制多任务分割网络模型中,确定骨骼区域和金属植入物区域。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的基于自导向注意机制多任务分割网络金属植入物识别方法的流程示意图;
图2是本申请一个实施例提供的自导向注意机制多任务分割网络模型的结构示意图;
图3是本申请一个实施例提供的自导向注意机制网络的结构示意图;
图4是本申请一个实施例提供的注意机制网络的结构示意图;
图5是本申请一个实施例提供的基于自导向注意机制多任务分割网络金属植入物识别装置的结构示意图;
图6是本申请一个实施例提供的电子设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了解决现有技术问题,本申请实施例提供了一种基于自导向注意机制多任务分割网络金属植入物识别方法、装置、设备及计算机可读存储介质。下面首先对本申请实施例所提供的基于自导向注意机制多任务分割网络金属植入物识别方法进行介绍。
图1示出了本申请一个实施例提供的基于自导向注意机制多任务分割网络金属植入物识别方法的流程示意图。如图1所示,该基于自导向注意机制多任务分割网络金属植入物识别方法,包括:
S101、获取CT医学图像;
S102、将CT医学图像的DICOM格式转换为PNG格式,得到目标医学图像;
S103、将目标医学图像输入预设的自导向注意机制多任务分割网络模型中,确定骨骼区域和金属植入物区域。
在一个实施例中,将目标医学图像输入预设的自导向注意机制多任务分割网络模型中,确定骨骼区域和金属植入物区域,包括:
将CT医学图像输入预先训练好的ResNet34中,提取4个不同层次的特征图;
通过线性插值将所有的特征图上采样到最大的一个特征尺度,使得4个特征图具有相同的特征尺度;
将4个特征图进行融合,经过一个卷积处理,再分别与每一个特征进行融合输出;
将每个融合输出结果分别经过自导向注意机制多任务网络,输出的4个结果进行融合并经过一个卷积处理,确定骨骼区域和金属植入物区域。
具体的,如图2所示,将多尺度、多层级的特征信息进行整合,可以让浅层局部细节与深层抽象特征互补增强,得到更好的分割效果。
该网络第一部分是从图像中提取特征,将输入图像输入到一个预先训练好的ResNet34中,提取4个不同层次的特征图,网络开始阶段提取低层级特征,结束阶段提取高层级特征,因此可以提取到多种尺度的特征。之后,使用线性插值将所有的特征图上采样到最大的一个特征尺度,使得四个特征图具有相同的特征尺度,并将这四个特征进行融合,经过一个卷积处理,再分别与每一个特征进行融合输出。然后每一个分支分别经过自导向注意机制多任务网络,输出的四个结果进行融合并经过一个卷积处理,该卷积层输出三个结果,分别用于提取骨盆、左侧股骨和右侧股骨三个部位的特征。而单任务分割只输出一个结果,即只能分割一个部位。多任务可以同时分割多个部位,极大缩短分割时间。多任务网络可以设置不同任务损失函数权重,本文加强对金属的识别,因此设置金属的损失函数权重要相对骨骼的大,可以加强对金属的学习。
在一个实施例中,自导向注意机制多任务分割网络模型中的自导向注意机制网络,包括:
利用两个注意机制网络分别提取特征图;
将两个特征图进行聚合,得到注意力特征图。
具体的,如图3所示,该自导向注意机制网络,由位置注意模块和通道注意模块组成。除了这两个注意力机制外,还添加下采样和上采样特征提取模块,进一步提取特征。最终将两个注意力模块的结果进行聚合得到一个更好的表征结果,输出注意力特征。
在一个实施例中,注意机制网络,包括:
位置注意力机制,用于捕获长距离依赖,解决局部感受野;
通道注意力机制,用于捕获通道间存在的依赖关系,增强特定的语义特征表示。
具体的,如图4所示,该注意机制网络,由位置注意模块和通道注意模块组成。位置注意模块捕获长距离依赖,解决局部感受野的问题。通道注意模块捕获通道间存在的依赖关系,增强特定的语义特征表示。
在一个实施例中,还包括:
计算金属植入物损失函数;
计算骨骼损失函数;
基于金属植入物损失函数、骨骼损失函数,确定最终损失函数。
本文使用的损失函数Loss计算公式为:
CELoss=-[ylogy'+(1-y)log(1-y')]
Loss=α·CELoss+(1-α)·DiceLoss
Loss_out=0.6·Loss_M+0.4·Loss_G
其中,CELoss为交叉熵损失函数,DiceLoss为Dice损失函数,y为标签值,y'为预测值,α为Loss权重系数。Loss_out表示最终损失函数计算,Loss_M表示金属损失函数计算,Loss_G表示骨骼损失函数计算,Loss_M和Loss_G的由Loss计算得出,这里设置Loss_M的权重为0.6比Loss_M的权重大,表示增强对金属的学习。
在一个实施例中,其特征在于,还包括:
获取CT医学图像数据集;
标注CT医学图像数据集中骨骼区域和金属植入物区域,并将骨骼区域和金属植入物区域确定为分割mask;
将每个CT医学图像及其对应的分割mask的图像格式均转换为PNG格式;
将所有转换为PNG格式的CT医学图像及其对应的分割mask,按照预设比例划分为训练集、验证集和测试集。
具体的,获取CT医学图像数据集,将其进行手动标注骨骼区域和金属植入物区域,将这两部分标签作为我们的分割mask;。将二维横断面DICOM数据转换成PNG格式的图片,标注分割mask转换成PNG格式的图片,将其进行打乱顺序后按照6:2:2的比例划分为训练集、验证集、测试集。
在一个实施例中,自导向注意机制多任务分割网络模型的模型训练过程,包括:
在模型训练过程中,设置训练的batch_size为64;
设置初始化学习率为1e-4,附加学习率衰减策略,每迭代5000次,学习率衰减为上一次学习率的0.9;
设置优化器为Adam优化器;
设置损失函数为DICE loss;
设置每迭代1000次,对训练集和验证集做一次验证,通过早停法来判断网络训练停止时间,并得到自导向注意机制多任务分割网络模型。
具体的,模型训练过程中,训练的batch_size为64,初始化学习率设置为1e-4,附加学习率衰减策略,每迭代5000次,学习率衰减为原来的0.9,优化器使用Adam优化器,使用损失函数为DICE loss,设置每迭代1000次,对训练集和验证集做一次验证,通过早停法来判断网络训练停止时间,并得到最终模型。
本发明在自导向注意机制网络的基础上,引入一个注意力优化机制和多尺度特征融合模块,将浅层细节特征与通过多尺度特征融合模块得到的深层抽象特征进行融合,得到增强后的内容特征,提高对CT数据金属植入物识别的精度。
将自导向注意机制网络设计成多任务机制,可同时对CT数据中多个部位进行分割,相对于单任务机制,可减少分割时间;同时在上采样过程中采用特征共享机制,共享两个分支网络的上采样特征,提高识别精度。
自导向注意机制:用来计算空间和通道维度中的全局特征依赖关系,使用位置注意力模块来学习特征的空间相互依赖性,并设计通道注意力模块来模拟通道相互依赖性,有助于更精确的识别结果。除了这两个注意力机制外,还添加下采样和上采样特征提取模块,进一步提取特征。
图5是本申请一个实施例提供的基于自导向注意机制多任务分割网络金属植入物识别装置的结构示意图,该基于自导向注意机制多任务分割网络金属植入物识别装置,装置包括:
图像获取模块501,用于获取CT医学图像;
格式转换模块502,用于将CT医学图像的DICOM格式转换为PNG格式,得到目标医学图像;
植入物识别模块503,用于将目标医学图像输入预设的自导向注意机制多任务分割网络模型中,确定骨骼区域和金属植入物区域。
图6示出了本申请实施例提供的电子设备的结构示意图。
电子设备可以包括处理器601以及存储有计算机程序指令的存储器602。
具体地,上述处理器601可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器602可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器602可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器602可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器602可在电子设备的内部或外部。在特定实施例中,存储器602可以是非易失性固态存储器。
在一个实施例中,存储器602可以是只读存储器(Read Only Memory,ROM)。在一个实施例中,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器601通过读取并执行存储器602中存储的计算机程序指令,以实现上述实施例中的任意一种基于自导向注意机制多任务分割网络金属植入物识别方法。
在一个示例中,电子设备还可包括通信接口603和总线610。其中,如图6所示,处理器601、存储器602、通信接口603通过总线610连接并完成相互间的通信。
通信接口603,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线610包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线610可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
另外,结合上述实施例中的基于自导向注意机制多任务分割网络金属植入物识别方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种基于自导向注意机制多任务分割网络金属植入物识别方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能模块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本申请的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。
Claims (10)
1.一种基于自导向注意机制多任务分割网络金属植入物识别方法,其特征在于,包括:
获取CT医学图像;
将CT医学图像的DICOM格式转换为PNG格式,得到目标医学图像;
将目标医学图像输入预设的自导向注意机制多任务分割网络模型中,确定骨骼区域和金属植入物区域。
2.根据权利要求1所述的基于自导向注意机制多任务分割网络金属植入物识别方法,其特征在于,将目标医学图像输入预设的自导向注意机制多任务分割网络模型中,确定骨骼区域和金属植入物区域,包括:
将CT医学图像输入预先训练好的ResNet34中,提取4个不同层次的特征图;
通过线性插值将所有的特征图上采样到最大的一个特征尺度,使得4个特征图具有相同的特征尺度;
将4个特征图进行融合,经过一个卷积处理,再分别与每一个特征进行融合输出;
将每个融合输出结果分别经过自导向注意机制多任务网络,输出的4个结果进行融合并经过一个卷积处理,确定骨骼区域和金属植入物区域。
3.根据权利要求2所述的基于自导向注意机制多任务分割网络金属植入物识别方法,其特征在于,自导向注意机制多任务分割网络模型中的自导向注意机制网络,包括:
利用两个注意机制网络分别提取特征图;
将两个特征图进行聚合,得到注意力特征图。
4.根据权利要求3所述的基于自导向注意机制多任务分割网络金属植入物识别方法,其特征在于,注意机制网络,包括:
位置注意力机制,用于捕获长距离依赖,解决局部感受野;
通道注意力机制,用于捕获通道间存在的依赖关系,增强特定的语义特征表示。
5.根据权利要求4所述的基于自导向注意机制多任务分割网络金属植入物识别方法,其特征在于,还包括:
计算金属植入物损失函数;
计算骨骼损失函数;
基于金属植入物损失函数、骨骼损失函数,确定最终损失函数。
6.根据权利要求1所述的基于自导向注意机制多任务分割网络金属植入物识别方法,其特征在于,还包括:
获取CT医学图像数据集;
标注CT医学图像数据集中骨骼区域和金属植入物区域,并将骨骼区域和金属植入物区域确定为分割mask;
将每个CT医学图像及其对应的分割mask的图像格式均转换为PNG格式;
将所有转换为PNG格式的CT医学图像及其对应的分割mask,按照预设比例划分为训练集、验证集和测试集。
7.根据权利要求6所述的基于自导向注意机制多任务分割网络金属植入物识别方法,其特征在于,自导向注意机制多任务分割网络模型的模型训练过程,包括:
在模型训练过程中,设置训练的batch_size为64;
设置初始化学习率为1e-4,附加学习率衰减策略,每迭代5000次,学习率衰减为上一次学习率的0.9;
设置优化器为Adam优化器;
设置损失函数为DICE loss;
设置每迭代1000次,对训练集和验证集做一次验证,通过早停法来判断网络训练停止时间,并得到自导向注意机制多任务分割网络模型。
8.一种基于自导向注意机制多任务分割网络金属植入物识别装置,其特征在于,所述装置包括:
图像获取模块,用于获取CT医学图像;
格式转换模块,用于将CT医学图像的DICOM格式转换为PNG格式,得到目标医学图像;
植入物识别模块,用于将目标医学图像输入预设的自导向注意机制多任务分割网络模型中,确定骨骼区域和金属植入物区域。
9.一种电子设备,其特征在于,所述电子设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-7任意一项所述的基于自导向注意机制多任务分割网络金属植入物识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的基于自导向注意机制多任务分割网络金属植入物识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311451174.5A CN117350992A (zh) | 2023-11-02 | 2023-11-02 | 基于自导向注意机制多任务分割网络金属植入物识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311451174.5A CN117350992A (zh) | 2023-11-02 | 2023-11-02 | 基于自导向注意机制多任务分割网络金属植入物识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117350992A true CN117350992A (zh) | 2024-01-05 |
Family
ID=89355811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311451174.5A Pending CN117350992A (zh) | 2023-11-02 | 2023-11-02 | 基于自导向注意机制多任务分割网络金属植入物识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117350992A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117853458A (zh) * | 2024-01-10 | 2024-04-09 | 北京长木谷医疗科技股份有限公司 | 翻修手术机器人植入物智能识别评估方法、装置及设备 |
-
2023
- 2023-11-02 CN CN202311451174.5A patent/CN117350992A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117853458A (zh) * | 2024-01-10 | 2024-04-09 | 北京长木谷医疗科技股份有限公司 | 翻修手术机器人植入物智能识别评估方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860573B (zh) | 模型训练方法、图像类别检测方法、装置和电子设备 | |
CN110188765B (zh) | 图像语义分割模型生成方法、装置、设备及存储介质 | |
CN113470031B (zh) | 息肉分型方法、模型训练方法及相关装置 | |
CN117350992A (zh) | 基于自导向注意机制多任务分割网络金属植入物识别方法 | |
CN116543221B (zh) | 关节病变智能检测方法、装置、设备及可读存储介质 | |
CN101715097A (zh) | 图像处理设备和系数学习设备 | |
CN116363150A (zh) | 髋关节分割方法、装置、电子设备及计算机可读存储介质 | |
CN113780492A (zh) | 一种二维码二值化方法、装置、设备及可读存储介质 | |
CN116704549A (zh) | 三维空间关键点的位置检测方法、装置、设备及存储介质 | |
CN116650110B (zh) | 基于深度强化学习的膝关节假体自动放置方法及装置 | |
CN116309636A (zh) | 基于多任务神经网络模型的膝关节分割方法、装置及设备 | |
CN116597002B (zh) | 基于深度强化学习的股骨柄自动放置方法、装置及设备 | |
CN116959307A (zh) | 一种基于虚拟现实的髋关节镜手术辅助教学系统 | |
CN116310713A (zh) | 红外图像识别方法、装置、电子设备及存储介质 | |
CN116051813A (zh) | 全自动智能腰椎定位与识别方法及应用 | |
CN112950652B (zh) | 机器人及其手部图像分割方法和装置 | |
CN116188492B (zh) | 髋关节分割方法、装置、电子设备及计算机可读存储介质 | |
CN114298054A (zh) | 一种文本识别方法、装置、电子设备及可读存储介质 | |
CN116152197B (zh) | 膝关节分割方法、装置、电子设备及计算机可读存储介质 | |
CN116563314A (zh) | 腰椎分割方法、装置、电子设备及计算机可读存储介质 | |
CN117679160B (zh) | 创伤骨折复位方法、装置、设备及可读存储介质 | |
CN116523841B (zh) | 基于多尺度信息融合的深度学习脊柱分割方法及装置 | |
CN116152197A (zh) | 膝关节分割方法、装置、电子设备及计算机可读存储介质 | |
CN116883326A (zh) | 膝关节解剖位点识别方法、装置、设备及可读存储介质 | |
CN117635546A (zh) | 基于对比学习及弱监督的股骨头坏死区域识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |