CN110148115A - 一种癌转移预测影像特征的筛选方法、装置和存储介质 - Google Patents

一种癌转移预测影像特征的筛选方法、装置和存储介质 Download PDF

Info

Publication number
CN110148115A
CN110148115A CN201910272005.2A CN201910272005A CN110148115A CN 110148115 A CN110148115 A CN 110148115A CN 201910272005 A CN201910272005 A CN 201910272005A CN 110148115 A CN110148115 A CN 110148115A
Authority
CN
China
Prior art keywords
images
image feature
random forest
metastasis
sample set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910272005.2A
Other languages
English (en)
Inventor
赵源深
李志成
梁栋
骆荣辉
刘磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201910272005.2A priority Critical patent/CN110148115A/zh
Publication of CN110148115A publication Critical patent/CN110148115A/zh
Priority to PCT/CN2019/130831 priority patent/WO2020199692A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30084Kidney; Renal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Abstract

一种癌转移预测影像特征的筛选方法、装置和存储介质,对获取的第一CT影像特征集合进行预设处理得到第二CT影像特征集合,从第二CT影像特征集合中获取影像特征样本集合;利用随机森林分类器对该样本集合中的各类CT影像特征进行评分;判断随机森林分类器是否满足迭代结束条件,是,则将该样本集合中表现优秀的CT影像特征作为癌转移预测影像特征,否,则对影像特征样本集合删除其中表现不佳的CT影像特征,并将其重新输入随机森林分类器。本发明为影像特征集合增加随机性,再利用随机森林分类器删除每次迭代过程中表现不佳的CT影像特征,很大程度上减少了分类器的误差,从繁杂的影像学特征中提取了对预测癌转移有效的影像特征。

Description

一种癌转移预测影像特征的筛选方法、装置和存储介质
技术领域
本申请涉及医学图像处理技术领域,尤其涉及一种癌转移预测影像特征的筛选方法、装置和存储介质。
背景技术
目前,很多癌症患者都存在癌转移风险,这种风险对医生的治疗方案有重要影响。
以肾透明细胞癌转移为例,肾透明细胞癌转移是导致患者预后极差的重要原因。由于无法在术前对肾透明细胞癌患者的转移风险进行有效诊断,从而影响医生制定针对性的治疗方案。
临床研究发现,有超过17%的肾透明细胞癌患者会发生远端转移,而传统的手术根除无法有效应对转移性肾透明细胞癌,只能采取免疫或靶向药物的治疗方案。如果只采取手术切除来应对转移性肾透明细胞癌,其中位生存期只有12个月。因此,对肾透明细胞癌患者发生远端转移进行有效预测是制定个性化治疗方案的前置条件。
采用影像组学的方法利用患者的影像信息来构建预测模型是目前最常用的技术方案,然后在影像组学提取高通量的影像特征之后,如何从这些繁杂的影像特征中筛选出有效特征是构建预测模型的重要方面。它不仅有助于降低系统建模的难度,而且还能够排除相关特征噪声对模型预测性能的影响,提高模型精度。
发明内容
本申请实施例提供一种癌转移预测影像特征的筛选方法、装置和存储介质,可以为癌转移预测模型,提供高效的影像学特征,有利于患者的癌转移诊断和治疗。
本申请实施例第一方面提供一种癌转移预测影像特征的筛选方法,该方法包括:
步骤1、获取肿瘤患者的第一CT影像特征集合,其中,所述第一CT影像特征集合中包含若干肿瘤患者的CT影像特征信息,所述CT影像特征信息中包含若干CT影像特征;
步骤2、对所述第一CT影像特征集合中的CT影像特征信息进行预设处理,以增加肿瘤患者的CT影像特征信息的随机性,得到第二CT影像特征集合;
步骤3、从所述第二CT影像特征集合中获取影像特征样本集合;
步骤4、将所述影像特征样本集合输入预设的随机森林分类器,利用所述随机森林分类器对所述影像特征样本集合中的各类CT影像特征进行评分,评分的分值用于指示各类CT影像特征对准确预测癌转移的贡献度;
步骤5、判断所述随机森林分类器是否满足迭代结束条件,若是,则将所述影像特征样本集合中满足预设条件的CT影像特征作为癌转移预测影像特征;若否,则将所述分值低于分数阈值的CT影像特征从所述影像特征样本集合中删除得到新的影像特征样本集合,返回所述步骤4将所述新的影像特征样本集合输入预设的随机森林分类器。
本申请实施例第二方面提供一种癌转移预测影像特征的筛选装置,该装置包括:
第一获取模块,用于获取肿瘤患者的第一CT影像特征集合,其中,所述第一CT影像特征集合中包含若干肿瘤患者的CT影像特征信息,所述CT影像特征信息中包含若干CT影像特征;
预处理模块,用于对所述第一CT影像特征集合中的CT影像特征信息进行预设处理,以增加肿瘤患者的CT影像特征信息的随机性,得到第二CT影像特征集合;
第二获取模块,用于从所述第二CT影像特征集合中获取影像特征样本集合;
分类模块,用于将所述影像特征样本集合输入预设的随机森林分类器,利用所述随机森林分类器对所述影像特征样本集合中的各类CT影像特征进行评分,评分的分值用于指示各类CT影像特征对准确预测癌转移的贡献度;
循环模块,用于在所述分类模块每次评分结束后,判断所述随机森林分类器是否满足迭代结束条件,若是,则将所述影像特征样本集合中满足预设条件的CT影像特征作为癌转移预测影像特征;若否,则将所述分值低于分数阈值的CT影像特征从所述影像特征样本集合中删除得到新的影像特征样本集合,控制所述分类模块将新的影像特征样本集合输入预设的随机森林分类器,利用所述随机森林分类器对所述影像特征样本集合中的各类CT影像特征进行评分。
本申请实施例第三方面提供一种癌转移预测影像特征的筛选装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现本申请实施例第一方面提供的方法中的步骤。
本申请实施例第四方面提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现本申请实施例第一方面提供的方法中的步骤。
本发明实施例提供了一种癌转移预测影像特征的筛选方法、装置和存储介质,获取肿瘤患者的第一CT影像特征集合;对第一CT影像特征集合中的CT影像特征信息进行预设处理,得到第二CT影像特征集合;从第二CT影像特征集合中获取影像特征样本集合;利用预设的随机森林分类器对影像特征样本集合中的各类CT影像特征进行评分;判断随机森林分类器是否满足迭代结束条件,若是,则将影像特征样本集合中满足预设条件的CT影像特征作为癌转移预测影像特征;若否,则将分值低于分数阈值的CT影像特征从影像特征样本集合中删除得到新的影像特征样本集合,将新的影像特征样本集合输入预设的随机森林分类器重新评分。本实施例为给定的影像特征集合增加随机性,再利用随机森林分类器删除每次迭代过程中表现不佳的CT影像特征,这最大限度地减少了分类器的误差,从繁杂的影像学特征中提取了对预测癌转移有效的影像特征。
附图说明
图1为本申请第一实施例提供的一种癌转移预测影像特征的筛选方法的流程示意图;
图2为本申请第二实施例提供的一种癌转移预测影像特征的筛选装置的结构示意图;
图3为本申请第二实施例提供的另一种癌转移预测影像特征的筛选装置的结构示意图。
具体实施方式
为使得本申请的发明目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
第一实施例:
为了实现对肿瘤患者的癌转移风险进行精准判断,本发明提供了一种癌转移预测影像特征的筛选方法,通过对肿瘤患者的CT影像特征矩阵的随机顺序调整为给定的CT影像特征集合增加随机性,再利用随机森林分类器优化参数,从繁杂的影像学特征中提取了对预测癌转移有效的影像学特征。
参见图1,本发明实施例提出一种癌转移预测影像特征的筛选方法,该筛选方法包括:
步骤101、获取肿瘤患者的第一CT影像特征集合,其中,第一CT影像特征集合中包含若干肿瘤患者的CT影像特征信息,CT影像特征信息中包含若干CT影像特征;
本实施例中,肿瘤患者包括但不限于肾透明细胞癌患者,本实施例的癌转移预测影像特征的筛选方法可用于肾透明细胞癌转移预测影像特征的筛选。
可选的,步骤101中的每个患者的CT影像特征信息中包含若干个CT影像特征,这些CT影像特征可来自于任意时序的CT图像,包括但不限于平扫、动脉期、静脉期以及实质期等时序的CT图像。进一步的,一个CT影像特征信息中的CT影像特征包括但不限于从CT图像中提取的形态学、一阶统计学、纹理、灰度特征以及小波等类型的影像特征。可选的,本实施例中,为了尽可能地筛选出更优质的CT影像特征,可以将尽可能多地获取肿瘤患者的不同CT影像特征,例如在一个示例中,对各个肿瘤患者,获取2336种CT影像特征,通过后续步骤从这2336种CT影像特征中选择出适量的表现优秀的CT影像特征。
进一步的,考虑到不同时序的CT图像之间,存在一致性不足的问题,本实施例中,在从CT图像中提取CT影像特征前,还可以对CT图像进行图像配准。实现对CT图像的统一尺度上的匹配,确保同一患者的不同时序的CT图像在层数和分辨率上保持一致。
可选的,在一个示例中,CT影像特征信息可以是CT影像特征矩阵,即同一肿瘤患者的多个CT影像特征组成的矩阵。
步骤102、对第一CT影像特征集合中的CT影像特征信息进行预设处理,以增加肿瘤患者的CT影像特征信息的随机性,得到第二CT影像特征集合;
本实施例中,当CT影像特征信息为CT影像特征矩阵,增加该CT影像特征矩阵的随机性的方式很多,现有技术中任意增加矩阵随机性的方案都可以用于本实施例中。
可选的,对第一CT影像特征集合中的CT影像特征信息进行预设处理,以增加肿瘤患者的CT影像特征信息的随机性,得到第二CT影像特征集合包括:对第一CT影像特征集合中各肿瘤患者的CT影像特征矩阵分别进行随机顺序调整得到随机矩阵,将同一肿瘤患者的随机矩阵与CT影像特征矩阵组合作为所述肿瘤患者的新的CT影像特征矩阵,得到第二CT影像特征集合。
在另一个实施例中,对第一CT影像特征集合中的CT影像特征信息进行预设处理,以增加肿瘤患者的CT影像特征信息的随机性,得到第二CT影像特征集合包括:对第一CT影像特征集合中各肿瘤患者的CT影像特征矩阵分别进行随机顺序调整得到随机矩阵,将各肿瘤患者的随机矩阵作为该肿瘤患者的新的CT影像特征矩阵,得到第二CT影像特征集合。
上述处理后,肿瘤患者的CT影像特征信息的随机性得以增加。
步骤103、从第二CT影像特征集合中获取影像特征样本集合;
可选的,从第二CT影像特征集合中获取影像特征样本集合包括:从第二CT影像特征集合中确定预设数量的肿瘤患者,利用这些肿瘤患者的CT影像特征信息组成影像特征样本集合。
步骤104、将影像特征样本集合输入预设的随机森林分类器,利用随机森林分类器对影像特征样本集合中的各类CT影像特征进行评分,评分的分值用于指示各类CT影像特征对准确预测癌转移的贡献度;
可以理解的是,步骤104中分值越高,则对准确预测癌转移的贡献度越高,分值越低,则对准确预测癌转移的贡献度越低。
步骤105、判断随机森林分类器是否满足迭代结束条件,若是,则进入步骤106,否则,进入步骤107;
步骤106、将影像特征样本集合中满足预设条件的CT影像特征作为癌转移预测影像特征;
步骤107、将分值低于分数阈值的CT影像特征从影像特征样本集合中删除得到新的影像特征样本集合,返回步骤104将新的影像特征样本集合输入预设的随机森林分类器。
可选的,本实施例中的随机森林分类器的参数包括但不限于:Ntree设置为615、featurenum设置为11、mtry设置为4以及迭代次数设置为10000。在一些其他的实施例中,还可以对上述的参数进行修改以符合用户要求。
可选的,一个示例中,第一CT影像特征集合和第二CT影像特征集合中不但包括各个肿瘤患者的CT影像特征信息,还包括其病历数据;进一步的,肿瘤患者的病历数据包括肿瘤患者的年龄和性别数据。
在上述将影像特征样本集合输入预设的随机森林分类器,利用随机森林分类器对影像特征样本集合中的各类CT影像特征进行评分前,还包括:
从第二CT影像特征集合中获取影像特征验证集合;
分析影像特征验证集合与影像特征样本集合中,相同年龄段的肿瘤患者的CT影像特征信息的差异性以及相同性别的肿瘤患者的CT影像特征信息的差异性,若两种差异性中的任意一种不满足预设条件,则调整随机森林分类器的参数;其中,影像特征验证集合与影像特征样本集合的肿瘤患者的数量比在预设比例范围内。可选的,一个示例中,预设比例范围为1:3到1:5。
上述差异性比较的步骤有利于消除不同患者之间CT影像特征的相关性。
进一步的,分析影像特征验证集合与影像特征样本集合中,相同年龄段的肿瘤患者的CT影像特征信息的差异性以及相同性别的肿瘤患者的CT影像特征信息的差异性,若两种差异性中的任意一种不满足预设条件,则调整随机森林分类器的参数包括:
对影像特征验证集合与影像特征样本集合中,相同年龄段的肿瘤患者的CT影像特征信息,进行假设验证,其中,假设验证的问题为相同年龄段的肿瘤患者的CT影像特征信息存在差异,假设验证的P值设置为sex_p.value>=0.5;
以及,对影像特征验证集合与影像特征样本集合中,相同性别的肿瘤患者的CT影像特征信息进行假设验证,其中,假设验证的问题为相同性别的肿瘤患者的CT影像特征信息存在差异,假设验证的P值设置为age_p.value>=0.5;
若两个假设验证中的至少一个不成立,则调整随机森林分类器的参数。
可选的,在另一个实施例中,对上述两个假设验证的P值可以降低标准,例如sex_p.value>=0.3(或0.2),age_p.value>=0.3(或0.2)等等,以增加假设验证通过的概率。
可选的,本实施例中的分数阈值可以通过上述的随机森林分类器得到,在步骤104前,还包括:通过随机森林分类器对影像特征样本集合中的各类CT影像特征进行评分,获取各类CT影像特征的评分结果中的最高分值,将最高分值作为分数阈值,再继续执行步骤104。
在一个示例中,判断随机森林分类器是否满足迭代结束条件包括:
判断随机森林分类器基于影像样本特征集合迭代的次数是否超过预设次数阈值,若是,则判断随机森林分类器满足迭代结束条件,否则,判断随机森林分类器不满足迭代结束条件。
其中,预设次数阈值可以是大于1的任意整数,例如10000次。可选的,在一个示例中,上述得到分数阈值的过程可以不算在迭代过程之内。
在另一个示例中,判断随机森林分类器是否满足迭代结束条件包括:
确定随机森林分类器的评分结果中,分数高于分数阈值的CT影像特征的类型,判断类型的数量是否满足预设数量要求,若是,则判断随机森林分类器满足迭代结束条件,否则,判断随机森林分类器不满足迭代结束条件。
在该示例中,可以根据癌转移预测影像特征需要的数量来设置预设数量要求,例如,癌转移预测影像特征的数量为11,则可以将预设数量要求设置为11-20的范围。若某一次随机森林分类器的评分后,分数高于分数阈值的CT影像特征的类型的数量在11-20的范围,则确定类型的数量满足预设数量要求,判断随机森林分类器满足迭代结束条件,结束迭代过程。
上述两个示例中,结束迭代之后,将影像特征样本集合中满足预设条件的CT影像特征作为癌转移预测影像特征包括:
选择评分排列在前的预设数量的CT影像特征作为癌转移预测影像特征。
例如,选择评分排列在前的11个CT影像特征作为癌转移预测影像特征。
或者,在另一个示例中,结束迭代之后,将影像特征样本集合中满足预设条件的CT影像特征作为癌转移预测影像特征包括:
将迭代结束后,影像特征样本集合中的CT影像特征作为癌转移预测影像特征。
可选的,本实施例中,还包括:在随机森林分类器基于影像样本特征集合迭代过程中,若影像特征样本集合中的CT影像特征连续全部被保留的次数超过预设最大次数,或者影像特征样本集合中的CT影像特征全部被删除,则确定随机森林分类器参数设置错误,停止本次对癌转移预测影像特征的筛选。其中,预设最大次数可以是100次或者150次等整数,本实施例对此没有限制。
本实施例中,采用上述的癌转移预测影像特征的筛选方法,对肾透明细胞癌患者的2336种CT影像特征进行癌转移预测影像特征的筛选,选出了11种CT影像特征作为癌转移预测影像特征,经过预测模型构建,对由45例肾透明细胞癌患者所构成的验证集进行测试,得到转移预测结果见表1。
表1、转移预测结果
从表1中可以看出本例中所提取的11种CT影像特征所构成的预测模型的精度为0.8261,auc值为0.8516,由此表明这种CT影像特征筛选方法所筛选的影像特征具有非常高的预测效果。
本发明实施例提供了一种癌转移预测影像特征的筛选方法,获取肿瘤患者的第一CT影像特征集合;对第一CT影像特征集合中的CT影像特征信息进行预设处理,以增加肿瘤患者的CT影像特征信息的随机性,得到第二CT影像特征集合;从第二CT影像特征集合中获取影像特征样本集合;利用预设的随机森林分类器对影像特征样本集合中的各类CT影像特征进行评分;判断随机森林分类器是否满足迭代结束条件,若是,则将影像特征样本集合中满足预设条件的CT影像特征作为癌转移预测影像特征;若否,则将分值低于分数阈值的CT影像特征从影像特征样本集合中删除得到新的影像特征样本集合,返回步骤4将新的影像特征样本集合输入预设的随机森林分类器。本实施例为给定的影像特征集合增加随机性,再利用随机森林分类器删除每次迭代过程中表现不佳的CT影像特征,这最大限度地减少了分类器的误差,从繁杂的影像学特征中筛选出了对预测癌转移有效的影像特征。
第二实施例:
本实施提供一种癌转移预测影像特征的筛选装置,参见图2,该装置包括:
第一获取模块201,用于获取肿瘤患者的第一CT影像特征集合,其中,第一CT影像特征集合中包含若干肿瘤患者的CT影像特征信息,CT影像特征信息中包含若干CT影像特征;
预处理模块202,用于对第一CT影像特征集合中的CT影像特征信息进行预设处理,以增加肿瘤患者的CT影像特征信息的随机性,得到第二CT影像特征集合;
第二获取模块203,用于从第二CT影像特征集合中获取影像特征样本集合;
分类模块204,用于将所述影像特征样本集合输入预设的随机森林分类器,利用所述随机森林分类器对所述影像特征样本集合中的各类CT影像特征进行评分,评分的分值用于指示各类CT影像特征对准确预测癌转移的贡献度;
循环模块205,用于在分类模块204每次评分结束后,判断所述随机森林分类器是否满足迭代结束条件,若是,则将所述影像特征样本集合中满足预设条件的CT影像特征作为癌转移预测影像特征;若否,则将所述分值低于分数阈值的CT影像特征从所述影像特征样本集合中删除得到新的影像特征样本集合,控制分类模块204将所述新的影像特征样本集合输入预设的随机森林分类器,利用所述随机森林分类器对所述影像特征样本集合中的各类CT影像特征进行评分。
可选的,本实施例中的随机森林分类器的优化参数包括:Ntree设置为615、featurenum设置为11、mtry设置为4、迭代次数设置为10000。
进一步的,预处理模块202,用于对所述第一CT影像特征集合中各肿瘤患者的CT影像特征矩阵分别进行随机顺序调整得到随机矩阵,将同一肿瘤患者的随机矩阵与CT影像特征矩阵组合作为所述肿瘤患者的新的CT影像特征矩阵,得到第二CT影像特征集合。
进一步的,筛选装置还包括相关性控制模块,用于在分类模块204将所述影像特征样本集合输入预设的随机森林分类器,利用所述随机森林分类器对所述影像特征样本集合中的各类CT影像特征进行评分前,从所述第二CT影像特征集合中获取影像特征验证集合;分析影像特征验证集合与影像特征样本集合中,相同年龄段的肿瘤患者的CT影像特征信息的差异性以及相同性别的肿瘤患者的CT影像特征信息的差异性,若两种差异性中的任意一种不满足预设条件,则调整随机森林分类器的参数;其中,影像特征验证集合与影像特征样本集合的肿瘤患者的数量比在预设比例范围内。
进一步的,该相关性控制模块,具体用于对影像特征验证集合与影像特征样本集合中,相同年龄段的肿瘤患者的CT影像特征信息,进行假设验证,其中,假设验证的问题为相同年龄段的肿瘤患者的CT影像特征信息存在差异,假设验证的P值设置为sex_p.value>=0.5;以及,对影像特征验证集合与影像特征样本集合中,相同性别的肿瘤患者的CT影像特征信息进行假设验证,其中,假设验证的问题为相同性别的肿瘤患者的CT影像特征信息存在差异,假设验证的P值设置为age_p.value>=0.5;在两个假设验证中的至少一个不成立时,调整随机森林分类器的参数。
进一步的,筛选装置还包括分数阈值获取模块,用于在分类模块204将影像特征样本集合输入预设的随机森林分类器,利用随机森林分类器对影像特征样本集合中的各类CT影像特征进行评分前,通过随机森林分类器对影像特征样本集合中的各类CT影像特征进行评分,获取各类CT影像特征的评分结果中的最高分值,将最高分值作为分数阈值,之后,控制分类模块204继续执行将影像特征样本集合输入预设的随机森林分类器,利用随机森林分类器对影像特征样本集合中的各类CT影像特征进行评分的步骤。
在一个示例中,循环模块205,用于判断随机森林分类器基于影像样本特征集合迭代的次数是否超过预设次数阈值,若是,则判断随机森林分类器满足迭代结束条件,否则,判断随机森林分类器不满足迭代结束条件;
在另一个示例中,循环模块205,用于确定随机森林分类器的评分结果中,分数高于分数阈值的CT影像特征的类型,判断类型的数量是否满足预设数量要求,若是,则判断随机森林分类器满足迭代结束条件,否则,判断随机森林分类器不满足迭代结束条件。
进一步的,上述筛选装置还包括停止控制模块,用于在随机森林分类器基于影像样本特征集合迭代的过程中,若影像特征样本集合中的CT影像特征全部被保留的连续次数超过预设最大次数,或者影像特征样本集合中的CT影像特征全部被删除,则确定随机森林分类器参数设置错误,停止本次对癌转移预测影像特征的筛选。
进一步的,本实施例还提供一种癌转移预测影像特征的筛选装置,参见图3,该筛选装置包括:存储器301、处理器及302存储在存储器301上并可在处理器302上运行的计算机程序,处理器302执行计算机程序时,实现第一实施例方法中的步骤。
进一步的,本申请实施例还提供了一种存储介质,该存储介质可以是设置于上述各实施例中的癌转移预测影像特征的筛选装置中,该存储介质可以是前述图3所示实施例中的存储器。该存储介质上存储有计算机程序,该程序被处理器执行时实现如第一实施例描述的方法中的步骤。进一步的,该储介质还可以是U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例的筛选装置,可以从每位肿瘤患者所提取的CT影像特征中筛选出若干最优效的影像特征,可用于构建肾透明细胞癌转移的预测模型。由于采用了随机森林分类器的优化参数,删除每次迭代过程中表现不佳的影像特征,这最大限度地减少了分类器的误差,从而保证所筛选的影像特征是一个最小最优的特征子集。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的可读存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上为对本申请所提供的癌转移预测影像特征的筛选方法、装置及存储介质的描述,对于本领域的技术人员,依据本申请实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种癌转移预测影像特征的筛选方法,其特征在于,包括:
步骤1、获取肿瘤患者的第一CT影像特征集合,其中,所述第一CT影像特征集合中包含若干肿瘤患者的CT影像特征信息,所述CT影像特征信息中包含若干CT影像特征;
步骤2、对所述第一CT影像特征集合中的CT影像特征信息进行预设处理,以增加肿瘤患者的CT影像特征信息的随机性,得到第二CT影像特征集合;
步骤3、从所述第二CT影像特征集合中获取影像特征样本集合;
步骤4、将所述影像特征样本集合输入预设的随机森林分类器,利用所述随机森林分类器对所述影像特征样本集合中的各类CT影像特征进行评分,评分的分值用于指示各类CT影像特征对准确预测癌转移的贡献度;
步骤5、判断所述随机森林分类器是否满足迭代结束条件,若是,则将所述影像特征样本集合中满足预设条件的CT影像特征作为癌转移预测影像特征;若否,则将所述分值低于分数阈值的CT影像特征从所述影像特征样本集合中删除得到新的影像特征样本集合,返回所述步骤4将所述新的影像特征样本集合输入预设的随机森林分类器。
2.根据权利要求1所述的癌转移预测影像特征的筛选方法,其特征在于,所述CT影像特征信息为CT影像特征矩阵,所述对所述第一CT影像特征集合中的CT影像特征信息进行预设处理,以增加肿瘤患者的CT影像特征信息的随机性,得到第二CT影像特征集合包括:
对所述第一CT影像特征集合中各肿瘤患者的CT影像特征矩阵分别进行随机顺序调整得到随机矩阵,将同一肿瘤患者的随机矩阵与CT影像特征矩阵组合作为所述肿瘤患者的新的CT影像特征矩阵,得到第二CT影像特征集合。
3.根据权利要求1所述的癌转移预测影像特征的筛选方法,其特征在于,所述将所述影像特征样本集合输入预设的随机森林分类器,利用所述随机森林分类器对所述影像特征样本集合中的各类CT影像特征进行评分前,还包括:
从所述第二CT影像特征集合中获取影像特征验证集合;
分析所述影像特征验证集合与所述影像特征样本集合中,相同年龄段的肿瘤患者的CT影像特征信息的差异性以及相同性别的肿瘤患者的CT影像特征信息的差异性,若两种差异性中的任意一种不满足预设条件,则调整所述随机森林分类器的参数;其中,所述影像特征验证集合与所述影像特征样本集合的肿瘤患者的数量比在预设比例范围内。
4.根据权利要求3所述的癌转移预测影像特征的筛选方法,其特征在于,所述分析所述影像特征验证集合与所述影像特征样本集合中,相同年龄段的肿瘤患者的CT影像特征信息的差异性以及相同性别的肿瘤患者的CT影像特征信息的差异性,若两种差异性中的任意一种不满足预设条件,则调整所述随机森林分类器的参数包括:
对所述影像特征验证集合与所述影像特征样本集合中,相同年龄段的肿瘤患者的CT影像特征信息,进行假设验证,其中,假设验证的问题为相同年龄段的肿瘤患者的CT影像特征信息存在差异,假设验证的P值设置为sex_p.value>=0.5;
以及,对所述影像特征验证集合与所述影像特征样本集合中,相同性别的肿瘤患者的CT影像特征信息进行假设验证,其中,假设验证的问题为相同性别的肿瘤患者的CT影像特征信息存在差异,假设验证的P值设置为age_p.value>=0.5;
在两个假设验证中的至少一个不成立时,调整所述随机森林分类器的参数。
5.根据权利要求1-4任一项所述的癌转移预测影像特征的筛选方法,其特征在于,在所述步骤4前,还包括:
通过所述随机森林分类器对所述影像特征样本集合中的各类CT影像特征进行评分,获取各类CT影像特征的评分结果中的最高分值,将所述最高分值作为所述分数阈值,继续执行所述步骤4。
6.根据权利要求1-4任一项所述的癌转移预测影像特征的筛选方法,其特征在于,所述判断所述随机森林分类器是否满足迭代结束条件包括:
判断所述随机森林分类器基于影像样本特征集合迭代的次数是否超过预设次数阈值,若是,则判断所述随机森林分类器满足所述迭代结束条件,否则,判断所述随机森林分类器不满足所述迭代结束条件;
或者,确定所述随机森林分类器的评分结果中,分数高于所述分数阈值的CT影像特征的类型,判断所述类型的数量是否满足预设数量要求,若是,则判断所述随机森林分类器满足所述迭代结束条件,否则,判断所述随机森林分类器不满足所述迭代结束条件。
7.根据权利要求1-4任一项所述的癌转移预测影像特征的筛选方法,其特征在于,在所述随机森林分类器基于影像样本特征集合迭代过程中,若所述影像特征样本集合中的CT影像特征连续全部被保留的次数超过预设最大次数,或者所述影像特征样本集合中的CT影像特征全部被删除,则确定所述随机森林分类器参数设置错误,停止本次对癌转移预测影像特征的筛选。
8.一种癌转移预测影像特征的筛选装置,其特征在于,包括:
第一获取模块,用于获取肿瘤患者的第一CT影像特征集合,其中,所述第一CT影像特征集合中包含若干肿瘤患者的CT影像特征信息,所述CT影像特征信息中包含若干CT影像特征;
预处理模块,用于对所述第一CT影像特征集合中的CT影像特征信息进行预设处理,以增加肿瘤患者的CT影像特征信息的随机性,得到第二CT影像特征集合;
第二获取模块,用于从所述第二CT影像特征集合中获取影像特征样本集合;
分类模块,用于将所述影像特征样本集合输入预设的随机森林分类器,利用所述随机森林分类器对所述影像特征样本集合中的各类CT影像特征进行评分,评分的分值用于指示各类CT影像特征对准确预测癌转移的贡献度;
循环模块,用于在所述分类模块每次评分结束后,判断所述随机森林分类器是否满足迭代结束条件,若是,则将所述影像特征样本集合中满足预设条件的CT影像特征作为癌转移预测影像特征;若否,则将所述分值低于分数阈值的CT影像特征从所述影像特征样本集合中删除得到新的影像特征样本集合,控制所述分类模块将新的影像特征样本集合输入预设的随机森林分类器,利用所述随机森林分类器对所述影像特征样本集合中的各类CT影像特征进行评分。
9.一种癌转移预测影像特征的筛选装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现权利要求1-7中任意一项所述方法中的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1-7中的任意一项所述方法中的步骤。
CN201910272005.2A 2019-04-04 2019-04-04 一种癌转移预测影像特征的筛选方法、装置和存储介质 Pending CN110148115A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910272005.2A CN110148115A (zh) 2019-04-04 2019-04-04 一种癌转移预测影像特征的筛选方法、装置和存储介质
PCT/CN2019/130831 WO2020199692A1 (zh) 2019-04-04 2019-12-31 一种癌转移预测影像特征的筛选方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910272005.2A CN110148115A (zh) 2019-04-04 2019-04-04 一种癌转移预测影像特征的筛选方法、装置和存储介质

Publications (1)

Publication Number Publication Date
CN110148115A true CN110148115A (zh) 2019-08-20

Family

ID=67588576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910272005.2A Pending CN110148115A (zh) 2019-04-04 2019-04-04 一种癌转移预测影像特征的筛选方法、装置和存储介质

Country Status (2)

Country Link
CN (1) CN110148115A (zh)
WO (1) WO2020199692A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020199692A1 (zh) * 2019-04-04 2020-10-08 中国科学院深圳先进技术研究院 一种癌转移预测影像特征的筛选方法、装置和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106197424A (zh) * 2016-06-28 2016-12-07 哈尔滨工业大学 遥测数据驱动的无人机飞行状态识别方法
CN106815481A (zh) * 2017-01-19 2017-06-09 中国科学院深圳先进技术研究院 一种基于影像组学的生存期预测方法及装置
CN107220966A (zh) * 2017-05-05 2017-09-29 郑州大学 一种基于影像组学的脑胶质瘤分级预测方法
CN108509982A (zh) * 2018-03-12 2018-09-07 昆明理工大学 一种处理二分类不平衡医学数据的方法
CN109543747A (zh) * 2018-11-20 2019-03-29 厦门大学 一种基于分层随机森林的数据特征选择方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105931224A (zh) * 2016-04-14 2016-09-07 浙江大学 基于随机森林算法的肝脏平扫ct图像病变识别方法
CN108269012A (zh) * 2018-01-12 2018-07-10 中国平安人寿保险股份有限公司 风险评分模型的构建方法、装置、存储介质及终端
CN109166564B (zh) * 2018-07-19 2023-06-06 平安科技(深圳)有限公司 为歌词文本生成乐曲的方法、装置及计算机可读存储介质
CN110148115A (zh) * 2019-04-04 2019-08-20 中国科学院深圳先进技术研究院 一种癌转移预测影像特征的筛选方法、装置和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106197424A (zh) * 2016-06-28 2016-12-07 哈尔滨工业大学 遥测数据驱动的无人机飞行状态识别方法
CN106815481A (zh) * 2017-01-19 2017-06-09 中国科学院深圳先进技术研究院 一种基于影像组学的生存期预测方法及装置
CN107220966A (zh) * 2017-05-05 2017-09-29 郑州大学 一种基于影像组学的脑胶质瘤分级预测方法
CN108509982A (zh) * 2018-03-12 2018-09-07 昆明理工大学 一种处理二分类不平衡医学数据的方法
CN109543747A (zh) * 2018-11-20 2019-03-29 厦门大学 一种基于分层随机森林的数据特征选择方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
X_CDA6: ""Boruta特征选择"", 《简书HTTPS://WWW.JIANSHU.COM/P/FDC8F6A94816》 *
ZHICHENG LI等: ""Multiregional radiomics profiling from multiparametric MRI: Identifying an imaging predictor of IDH1 mutation status in glioblastoma"", 《CANCER MEDICINE》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020199692A1 (zh) * 2019-04-04 2020-10-08 中国科学院深圳先进技术研究院 一种癌转移预测影像特征的筛选方法、装置和存储介质

Also Published As

Publication number Publication date
WO2020199692A1 (zh) 2020-10-08

Similar Documents

Publication Publication Date Title
US10769788B2 (en) Few-shot learning based image recognition of whole slide image at tissue level
Nithya et al. Kidney disease detection and segmentation using artificial neural network and multi-kernel k-means clustering for ultrasound images
CN110163180A (zh) 运动想象脑电数据分类方法及系统
Wu et al. Residual attention based network for hand bone age assessment
Albalawi et al. Classification of breast cancer mammogram images using convolution neural network
CN109544517A (zh) 基于深度学习的多模态超声组学分析方法及系统
CN108694390A (zh) 一种布谷鸟搜索改进灰狼优化支持向量机的调制信号分类方法
CN111785366B (zh) 患者治疗方案的确定方法、装置及计算机设备
CN107066836A (zh) 基因检测管理方法及系统
CN107705305A (zh) 一种医学图像处理的方法及装置
JP7061671B2 (ja) デジタル画像の対象領域の少なくとも1つの形状を生成する方法および装置ならびに機械学習システムを訓練するための訓練データを生成する方法
CN109785959A (zh) 一种疾病编码方法和装置
CN110136147A (zh) 一种基于U-Net模型的分割医学图像的方法、装置及存储介质
Kavur et al. Basic ensembles of vanilla-style deep learning models improve liver segmentation from ct images
Hesamian et al. Atrous convolution for binary semantic segmentation of lung nodule
CN110175978A (zh) 一种肝癌影像组学数据处理方法、系统、装置和存储介质
CN109003651A (zh) 病灶报告生成装置和方法
Qu et al. An experimental study of data heterogeneity in federated learning methods for medical imaging
CN106548213A (zh) 血管识别方法和装置
CN110148115A (zh) 一种癌转移预测影像特征的筛选方法、装置和存储介质
WO2022247573A1 (zh) 模型训练方法、图像处理方法、装置、设备及存储介质
Sambyal et al. Aggregated residual transformation network for multistage classification in diabetic retinopathy
CN113571194B (zh) 肝细胞癌远期预后预测的建模方法及装置
Hassan et al. A dilated residual hierarchically fashioned segmentation framework for extracting gleason tissues and grading prostate cancer from whole slide images
CN107256344A (zh) 数据处理方法、装置以及放疗管理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190820