CN117197091A - 一种用于医学影像目标检测的分割数据集治理方法及系统 - Google Patents

一种用于医学影像目标检测的分割数据集治理方法及系统 Download PDF

Info

Publication number
CN117197091A
CN117197091A CN202311175543.2A CN202311175543A CN117197091A CN 117197091 A CN117197091 A CN 117197091A CN 202311175543 A CN202311175543 A CN 202311175543A CN 117197091 A CN117197091 A CN 117197091A
Authority
CN
China
Prior art keywords
data
medical image
segmentation
target
focus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311175543.2A
Other languages
English (en)
Inventor
邱甲军
殷晋
王俊人
蒋静文
王亮
戴映雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
West China Hospital of Sichuan University
Original Assignee
West China Hospital of Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by West China Hospital of Sichuan University filed Critical West China Hospital of Sichuan University
Priority to CN202311175543.2A priority Critical patent/CN117197091A/zh
Publication of CN117197091A publication Critical patent/CN117197091A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)

Abstract

本发明公开了一种用于医学影像目标检测的分割数据集治理方法及系统,涉及医学影像处理技术领域。该方法包括:获取医学图像像素分割数据中的标注数据Mask;对标注数据Mask进行预过滤,以得到对应的分割目标标注数据Mask;获取分割目标标注数据Mask的边界坐标信息;将分割目标标注数据Mask和对应的边界坐标信息转换为用于病灶检测格式的边界框,以得到病灶检测标注数据;对病灶检测标注数据进行清洗,将紧邻的边界框进行合并,以得到最终的病灶目标信息。本发明可将医学图像分割数据治理为针对病灶检测的边界框数据;能够排除在病灶检测任务中不具有诊断意义的分割目标。

Description

一种用于医学影像目标检测的分割数据集治理方法及系统
技术领域
本发明涉及医学影像处理技术领域,具体而言,涉及一种用于医学影像目标检测的分割数据集治理方法及系统。
背景技术
医学影像检查是医师诊断疾病的必要一环。在目前的临床实践中,关键的病灶通常是通过医学图像人工目视检查获得的,主观且耗时。这不仅给卫生系统带来沉重负担,还可能导致患者的治疗延误。为此,一种自动、精确的医学图像病灶检测方法是非常必要和迫切需要的。其中,基于高质量大数据驱动是自动AI方法的核心。现阶段,为了帮助医师基于医学图像进行快速诊断,已有许多研究聚焦于基于深度学习的病灶分割。然而这需要大量的、高质量的、精准的病灶标注,这种劳动密集型的且耗时的标注任务即使是具有丰富经验的医生也无法在一定时间内完成大量的数据标注,这些问题给AI分割任务带来了挑战。另一方面,目标检测用于医学图像分析,被称为病灶检测,以帮助医师快速诊断病灶的类别和位置,也是诊断报告中的重要内容。与分割任务相比,用于目标检测的标注更容易,因此能够在一定时间内以较低人力成本快速开发出计算机辅助诊断系统。此外,病灶检测也可以用作病灶分割的前置任务、以促使通过多任务学习来提高分割性能。由此,病灶检测也极具研究和应用价值。
但是,目前基于医学图像病灶检测方法的开源数据极少,无法直接利用分割数据集。现有技术中,将病灶分割数据转换成病灶检测数据的方法一般是基于分割数据集掩码(Mask)标注的目标边界,通过Mask边界点构建包围Mask区域的病灶检测矩形边界框(Bounding Box,BBox)作为病灶检测标注目标。然而现有的这种方式忽略了病灶的形态学信息,例如,任意的像素点信息都将产生BBox,这对Mask的精确标注有一定的要求;此外,病灶检测的临床标注一般要求紧邻的多个分割区域通常视为一个目标。因此,直接利用Mask转换为BBox标注格式对病灶检测任务而言会产生不具备临床意义的标注。因此,将分割数据集治理为符合病灶检测任务的数据集具有广泛研究应用需求。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明提供一种用于医学影像目标检测的分割数据集治理方法及系统,可基于医学图像分割数据标注,将紧邻的分割区域合并为一个具有临床意义的病灶检测区域标注;能够排除在病灶检测任务中不具有临床诊断意义的数据。
为解决上述技术问题,本发明采用的技术方案为:
第一方面,本发明提供一种用于医学影像目标检测的分割数据集治理方法,包括以下步骤:
获取医学图像像素分割数据中的标注数据Mask;
对标注数据Mask进行预过滤,以得到对应的分割目标标注数据Mask;
获取分割目标标注数据Mask的边界坐标信息;
将分割目标标注数据Mask和对应的边界坐标信息转换为用于病灶检测格式的边界框,以得到病灶检测标注数据;
对病灶检测标注数据进行清洗,将紧邻的边界框进行合并,以得到最终的病灶目标信息。
本发明基于医学图像像素分割数据进行标注数据获取,并对获取的数据进行初步过滤筛选,以得到包含有病灶的分割目标标注数据Mask及其对应的原始医学图像,然后,获取筛选得到的Mask图像的边界坐标信息,并将分割目标标注数据Mask和对应的边界坐标信息联合转换为用于病灶检测格式的边界框,最后对病灶检测标注数据进行清洗,将紧邻的边界框进行合并,并删除一些不符合要求的边界边框,以得到最终的病灶目标信息。本发明解决了现有的医学图像病灶分割数据集以Mask格式标注,这对于医学图像病灶检测任务的数据标注而言,缺乏明确的边界框信息的问题。本发明基于上述方法对医学图像病灶分割数据集进行有效治理,可基于医学图像分割数据标注,将紧邻的分割区域合并为一个具有临床诊断意义的病灶检测区域标注;能够排除在病灶检测任务中不具有临床诊断意义的数据。
基于第一方面,进一步地,上述获取医学图像像素分割数据中的标注数据Mask的方法包括以下步骤:
基于医学图像像素分割数据的DICOM文件,读取对应的标注矩阵信息;
将标注矩阵信息转换为取值范围为[0,N]的Mask图像,其中,N∈R+,0为背景像素点,非0正整数为病灶类别。
基于第一方面,进一步地,上述对标注数据Mask进行预过滤的方法包括以下步骤:
遍历获取的标注数据Mask,记录并将像素点全为0的Mask所对应的原始医学图像剔除,以得到最终包含有病灶的分割目标标注数据Mask及对应的医学图像像素分割数据。
基于第一方面,进一步地,上述获取分割目标标注数据Mask的边界坐标信息的方法包括以下步骤:
获取每个分割目标标注数据Mask中所有病灶区域像素的八连通域信息,并将对应八连通域信息转换为边界坐标信息。
基于第一方面,进一步地,上述对病灶检测标注数据进行清洗,将紧邻的边界框进行合并的方法包括以下步骤:
采用Mask2BBox算法将紧邻的边界框进行合并,以更新病灶目标信息,并删除面积小于预设像素的孤立边界框,以得到最终的病灶目标信息。
基于第一方面,进一步地,上述边界坐标信息包括左上角横坐标、左上角纵坐标、右下角横坐标及右下角纵坐标。
基于第一方面,进一步地,上述病灶检测格式包括文件路径、左上角横坐标、左上角纵坐标、右下角横坐标、右下角纵坐标及病灶类别。
第二方面,本发明提供一种用于医学影像目标检测的分割数据集治理系统,包括标注数据获取模块、数据预过滤模块、边界坐标获取模块、病灶格式转换模块以及数据清洗模块,其中:
标注数据获取模块,用于获取医学图像像素分割数据中的标注数据Mask;
数据预过滤模块,用于对标注数据Mask进行预过滤,以得到对应的分割目标标注数据Mask;
边界坐标获取模块,用于获取分割目标标注数据Mask的边界坐标信息;
病灶格式转换模块,用于将分割目标标注数据Mask和对应的边界坐标信息转换为用于病灶检测格式的边界框,以得到病灶检测标注数据;
数据清洗模块,用于对病灶检测标注数据进行清洗,将紧邻的边界框进行合并,以得到最终的病灶目标信息。
本系统通过标注数据获取模块、数据预过滤模块、边界坐标获取模块、病灶格式转换模块以及数据清洗模块等多个模块的配合,基于医学图像像素分割数据进行标注数据获取,并对获取的数据进行初步过滤筛选,以得到包含有病灶的分割目标标注数据Mask及其对应的原始医学图像,然后,获取筛选得到的Mask图像的边界坐标信息,并将分割目标标注数据Mask和对应的边界坐标信息联合转换为用于病灶检测格式的边界框,最后对病灶检测标注数据进行清洗,将紧邻的边界框进行合并,并删除一些不符合要求的边界边框,以得到最终的病灶目标信息。本发明解决了现有的医学图像病灶分割数据集以Mask格式标注,这对于医学图像病灶检测任务的数据标注而言,缺乏明确的边界框信息的问题。本发明基于上述方法对医学图像病灶分割数据集进行有效治理,可基于医学图像分割数据标注,将紧邻的分割区域合并为一个具有临床诊断意义的病灶检测区域标注;能够排除在病灶检测任务中不具有临床诊断意义的数据。
第三方面,本申请提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器;当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
本发明至少具有如下优点或有益效果:
本发明提供一种用于医学影像目标检测的分割数据集治理方法及系统,基于医学图像分割数据标注,将分割目标转换为病灶检测目标、并且将紧邻的分割区域合并为一个具有临床诊断意义的病灶检测区域标注;能够排除在病灶检测任务中不具有临床诊断意义的数据。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例一种用于医学影像目标检测的分割数据集治理方法的流程图;
图2为本发明实施例一种用于医学影像目标检测的分割数据集治理系统的原理框图;
图3为本发明实施例提供的一种电子设备的结构框图。
附图标记说明:100、标注数据获取模块;200、数据预过滤模块;300、边界坐标获取模块;400、病灶格式转换模块;500、数据清洗模块;101、存储器;102、处理器;103、通信接口。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本发明实施例的描述中,“多个”代表至少2个。
实施例:
如图1所示,第一方面,本发明实施例提供一种用于医学影像目标检测的分割数据集治理方法,包括以下步骤:
S1、获取医学图像像素分割数据中的标注数据Mask;
进一步地,包括:基于医学图像像素分割数据的DICOM文件,读取对应的标注矩阵信息;将标注矩阵信息转换为取值范围为[0,N]的Mask图像,其中,N∈R+,0为背景像素点,非0正整数为病灶类别。
在本发明的一些实施例中,获取标注数据Mask:基于医学图像像素分割数据(如:CT,X-ray,MRI等)的dicom文件,读取其标注矩阵信息,转换为取值范围为{0,1,2,…,N},N∈R+的Mask图像;其中,0为背景像素点,非0正整数为病灶类别。
S2、对标注数据Mask进行预过滤,以得到对应的分割目标标注数据Mask;
进一步地,包括:遍历获取的标注数据Mask,记录并将像素点全为0的Mask所对应的原始医学图像剔除,以得到最终包含有病灶的分割目标标注数据Mask及对应的医学图像像素分割数据。
在本发明的一些实施例中,遍历步骤S1所获取的Mask图像,记录像素点全为0的Mask图像所对应的原始医学图像并舍去,即是将不包含有病灶的医学图像舍去;最后记录包含有病灶的Mask及其对应的医学图像像素分割数据。
S3、获取分割目标标注数据Mask的边界坐标信息;上述边界坐标信息包括左上角横坐标、左上角纵坐标、右下角横坐标及右下角纵坐标。
进一步地,包括:获取每个分割目标标注数据Mask中所有病灶区域像素的八连通域信息,并将对应八连通域信息转换为边界坐标信息。
在本发明的一些实施例中,基于开源计算机视觉工具箱OpenCV获得每个Mask中所有病灶区域像素的八连通域信息,并转换为边界坐标信息。
将分割数据集中的掩码序列对应的文件加工为边界框BBOX。基本原理为获取掩码二值图的八连通域,然后计算其左上角坐标点和边界框的宽高。具体步骤如下:
步骤1:读取掩码二值图。基于开源OpenCV包函数、遵循掩码PNG文件名规则读取,也可通过DICOM等医学源文件直接读取掩码矩阵(一个二维矩阵即一个掩码文件/二值图)。
步骤2:获取八连通边界区域信息并加工为候选的边界框。定义八连通区域为一个有效区域的基本单元,考虑具有八连通区域的所有像素点为一个候选的边界框。
步骤3:计算IoU并递归删除与合并候选边界框。虽然两个候选边界框内的八连通区域无交集,因此被划分成了两个边界框,但八连通区域加工为候选矩形框之后因长宽边为连通区域外边界,因此两个候选边界框可能有重合且重合区内像素较多,应该作为一个病灶区处理;如果交叉区少,应该作为两个病灶区处理。例如,A与B分别表示两个候选边界框,根据交并比IoU的大小决定是否应该将两个区域合并。显然交并比越大表示越应该合并,反之越不需要合并。
S4、将分割目标标注数据Mask和对应的边界坐标信息转换为用于病灶检测格式的边界框,以得到病灶检测标注数据;上述病灶检测格式包括文件路径、左上角横坐标、左上角纵坐标、右下角横坐标、右下角纵坐标及病灶类别。初始化病灶检测标注数据:将步骤S2中过滤后的标注数据和步骤S3中将获取的边界坐标信息联合转换为用于病灶检测格式的边界框,以便后续进行精准高效的数据清洗。
S5、对病灶检测标注数据进行清洗,将紧邻的边界框进行合并,以得到最终的病灶目标信息。
进一步地,包括:采用Mask2BBox算法将紧邻的边界框进行合并,以更新病灶目标信息,并删除面积小于预设像素的孤立边界框,以得到最终的病灶目标信息。
在本发明的一些实施例中,使用自主研发的Mask2BBox算法来合并紧邻的边界以更新病灶目标信息,并且删除病灶检测任务中临床意义不显著的区域,即删除面积小于25像素的孤立边界框(5×5区域)。
Mask2BBox算法如下:
Algorithm 1:The process of merging proximity bounding boxes
Data:All initialized bounding boxes with lesions in one image
Result:All updated bounding boxes with lesions in one image B
1 repeat
2 foreachin B do
3 Calcauting width of b(i):
4 Calcauting high of b(i):
5 foreachj=i+1,i+2,...,n in do
6 Calcauting width of b(j):
7 Calcauting high of b(j):
8 Calcauting maximum border distance
if dmax(b(i),b(j))<5then
9 Update b(i)in bounding boxes B,which is
10 Remove b(j)in bounding boxes B;
11 end
12 end
13 end
14 untilmax(b(p),b(q))≥5;
15 return updated B;
针对上述Mask2BBox算法的说明:
第1行:判断边界框集B中是否存在任意两个边界框b_i(即b(i)),b_j(即b(j))的距离是否大于等于5,若存在有距离小于5的,则执行2-14行。
第2行:遍历一张影像中的标注的边界框集b_i,执行3-14行。
第3行:计算b_i的宽。
第4行:计算b_j的高。
第5行:遍历除去之前遍历过的b_i框的余下未跟b_i进行计算的b_j,执行6-13行。
第6行:计算b_j的宽。
第7行:计算b_j的高。
第8行:计算b_i和b_j之间的最大边界距离d_max(b_i,b_j)。
第9行:判断b_i和b_j之间的最大边界距离d_max(b_i,b_j)是否小于5,若是,则执行10-12行。
第10行:从边界框集B中更新b_i的边界框坐标点。
第11行:从边界框集B中移除b_j边界框。
第16行:返回更新后的边界框集B
其中,B是一个影象中所有病灶区域边界框的集合;一个边界框b(i)的标记;/>依次分别为左上角的x坐标,左上角的y坐标,右下角的x坐标,右下角的y坐标;/>一个边界框b(i)中右下角的x坐标减去左上角的x坐标的绝对值。
max{A,B}:表示取A,B中最大的值。
min{A,B}:表示取A,B中最小的值。
本发明基于医学图像像素分割数据进行标注数据获取,并对获取的数据进行初步过滤筛选,以得到包含有病灶的分割目标标注数据Mask及其对应的原始医学图像,然后,获取筛选得到的Mask图像的边界坐标信息,并将分割目标标注数据Mask和对应的边界坐标信息联合转换为用于病灶检测格式的边界框,最后对病灶检测标注数据进行清洗,将紧邻的边界框进行合并,并删除一些不符合要求的边界边框,以得到最终的病灶目标信息。本发明解决了现有的医学图像病灶分割数据集以Mask格式标注,这对于医学图像病灶检测任务的数据标注而言,缺乏明确的边界框信息的问题。本发明基于上述方法对医学图像病灶分割数据集进行有效治理,可基于医学图像分割数据标注,将紧邻的分割区域合并为一个具有临床诊断意义的病灶检测区域标注;能够排除在病灶检测任务中不具有临床诊断意义的数据。
如图2所示,第二方面,本发明实施例提供一种用于医学影像目标检测的分割数据集治理系统,包括标注数据获取模块100、数据预过滤模块200、边界坐标获取模块300、病灶格式转换模块400以及数据清洗模块500,其中:
标注数据获取模块100,用于获取医学图像像素分割数据中的标注数据Mask;
数据预过滤模块200,用于对标注数据Mask进行预过滤,以得到对应的分割目标标注数据Mask;
边界坐标获取模块300,用于获取分割目标标注数据Mask的边界坐标信息;
病灶格式转换模块400,用于将分割目标标注数据Mask和对应的边界坐标信息转换为用于病灶检测格式的边界框,以得到病灶检测标注数据;
数据清洗模块500,用于对病灶检测标注数据进行清洗,将紧邻的边界框进行合并,以得到最终的病灶目标信息。
本系统通过标注数据获取模块100、数据预过滤模块200、边界坐标获取模块300、病灶格式转换模块400以及数据清洗模块500等多个模块的配合,基于医学图像像素分割数据进行标注数据获取,并对获取的数据进行初步过滤筛选,以得到包含有病灶的分割目标标注数据Mask及其对应的原始医学图像,然后,获取筛选得到的Mask图像的边界坐标信息,并将分割目标标注数据Mask和对应的边界坐标信息联合转换为用于病灶检测格式的边界框,最后对病灶检测标注数据进行清洗,将紧邻的边界框进行合并,并删除一些不符合要求的边界边框,以得到最终的病灶目标信息。本发明解决了现有的医学图像病灶分割数据集以Mask格式标注,这对于医学图像病灶检测任务的数据标注而言,缺乏明确的边界框信息的问题。本发明基于上述方法对医学图像病灶分割数据集进行有效治理,可基于医学图像分割数据标注,将紧邻的分割区域合并为一个具有临床诊断意义的病灶检测区域标注;能够排除在病灶检测任务中不具有临床诊断意义的数据。
如图3所示,第三方面,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。
还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(RandomAccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(CentralProcessingUnit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请所提供的实施例中,应该理解到,所揭露的方法及系统,也可以通过其它的方式实现。以上所描述的方法及系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (10)

1.一种用于医学影像目标检测的分割数据集治理方法,其特征在于,包括以下步骤:
获取医学图像像素分割数据中的标注数据Mask;
对标注数据Mask进行预过滤,以得到对应的分割目标标注数据Mask;
获取分割目标标注数据Mask的边界坐标信息;
将分割目标标注数据Mask和对应的边界坐标信息转换为用于病灶检测格式的边界框,以得到病灶检测标注数据;
对病灶检测标注数据进行清洗,将紧邻的边界框进行合并,以得到最终的病灶目标信息。
2.根据权利要求1所述的一种用于医学影像目标检测的分割数据集治理方法,其特征在于,所述获取医学图像像素分割数据中的标注数据Mask的方法包括以下步骤:
基于医学图像像素分割数据的DICOM文件,读取对应的标注矩阵信息;
将标注矩阵信息转换为取值范围为[0,N]的Mask图像,其中,N∈R+,0为背景像素点,非0正整数为病灶类别。
3.根据权利要求2所述的一种用于医学影像目标检测的分割数据集治理方法,其特征在于,所述对标注数据Mask进行预过滤的方法包括以下步骤:
遍历获取的标注数据Mask,记录并将像素点全为0的Mask所对应的原始医学图像剔除,以得到最终包含有病灶的分割目标标注数据Mask及对应的医学图像像素分割数据。
4.根据权利要求1所述的一种用于医学影像目标检测的分割数据集治理方法,其特征在于,所述获取分割目标标注数据Mask的边界坐标信息的方法包括以下步骤:
获取每个分割目标标注数据Mask中所有病灶区域像素的八连通域信息,并将对应八连通域信息转换为边界坐标信息。
5.根据权利要求1所述的一种用于医学影像目标检测的分割数据集治理方法,其特征在于,所述对病灶检测标注数据进行清洗,将紧邻的边界框进行合并的方法包括以下步骤:
采用Mask2BBox算法将紧邻的边界框进行合并,以更新病灶目标信息,并删除面积小于预设像素的孤立边界框,以得到最终的病灶目标信息。
6.根据权利要求1所述的一种用于医学影像目标检测的分割数据集治理方法,其特征在于,所述边界坐标信息包括左上角横坐标、左上角纵坐标、右下角横坐标及右下角纵坐标。
7.根据权利要求1所述的一种用于医学影像目标检测的分割数据集治理方法,其特征在于,所述病灶检测格式包括文件路径、左上角横坐标、左上角纵坐标、右下角横坐标、右下角纵坐标及病灶类别。
8.一种用于医学影像目标检测的分割数据集治理系统,其特征在于,包括标注数据获取模块、数据预过滤模块、边界坐标获取模块、病灶格式转换模块以及数据清洗模块,其中:
标注数据获取模块,用于获取医学图像像素分割数据中的标注数据Mask;
数据预过滤模块,用于对标注数据Mask进行预过滤,以得到对应的分割目标标注数据Mask;
边界坐标获取模块,用于获取分割目标标注数据Mask的边界坐标信息;
病灶格式转换模块,用于将分割目标标注数据Mask和对应的边界坐标信息转换为用于病灶检测格式的边界框,以得到病灶检测标注数据;
数据清洗模块,用于对病灶检测标注数据进行清洗,将紧邻的边界框进行合并,以得到最终的病灶目标信息。
9.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
CN202311175543.2A 2023-09-12 2023-09-12 一种用于医学影像目标检测的分割数据集治理方法及系统 Pending CN117197091A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311175543.2A CN117197091A (zh) 2023-09-12 2023-09-12 一种用于医学影像目标检测的分割数据集治理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311175543.2A CN117197091A (zh) 2023-09-12 2023-09-12 一种用于医学影像目标检测的分割数据集治理方法及系统

Publications (1)

Publication Number Publication Date
CN117197091A true CN117197091A (zh) 2023-12-08

Family

ID=89001228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311175543.2A Pending CN117197091A (zh) 2023-09-12 2023-09-12 一种用于医学影像目标检测的分割数据集治理方法及系统

Country Status (1)

Country Link
CN (1) CN117197091A (zh)

Similar Documents

Publication Publication Date Title
Jalali et al. ResBCDU-Net: a deep learning framework for lung CT image segmentation
Chan et al. Effective pneumothorax detection for chest X‐ray images using local binary pattern and support vector machine
US7065235B2 (en) Radiographic scoring method
Saad et al. Image segmentation for lung region in chest X-ray images using edge detection and morphology
CN111062955A (zh) 一种肺部ct影像数据分割方法及系统
Yi et al. Automatic catheter and tube detection in pediatric x-ray images using a scale-recurrent network and synthetic data
Cheng et al. Automatic vertebrae localization and segmentation in CT with a two-stage Dense-U-Net
CN111462071B (zh) 一种图像处理方法和系统
WO2007117506A2 (en) System and method for automatic detection of internal structures in medical images
CN109003269A (zh) 一种能提高医生效率的医学影像病灶的标注提取方法
EP3722996A2 (en) Systems and methods for processing 3d anatomical volumes based on localization of 2d slices thereof
Kónya et al. Convolutional neural network-based automated segmentation and labeling of the lumbar spine X-ray
Bosdelekidis et al. Lung field segmentation in chest X-rays: A deformation-tolerant procedure based on the approximation of rib cage seed points
Piętka et al. Role of radiologists in CAD life-cycle
Kempers et al. Positional assessment of lower third molar and mandibular canal using explainable artificial intelligence
CN111401102A (zh) 深度学习模型训练方法及装置、电子设备及存储介质
Koh et al. Automatic spinal canal detection in lumbar MR images in the sagittal view using dynamic programming
Mullan et al. Visual attribution for deep learning segmentation in medical imaging
CN117197091A (zh) 一种用于医学影像目标检测的分割数据集治理方法及系统
CN115393314A (zh) 一种基于深度学习的口腔医疗图像识别方法及系统
CN114663443A (zh) 12导联纸质心电图数字化方法与装置
US11301720B2 (en) Training set enrichment with insignificantly-abnormal medical images
Ogul et al. Unsupervised rib delineation in chest radiographs by an integrative approach
Kodym et al. Segmentation of Defective Skulls from CT Data for Tissue Modelling
Yi et al. Automatic catheter detection in pediatric X-ray images using a scale-recurrent network and synthetic data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination