CN110916666B - 一种预测手术切除肝细胞癌复发的影像组学特征处理方法 - Google Patents

一种预测手术切除肝细胞癌复发的影像组学特征处理方法 Download PDF

Info

Publication number
CN110916666B
CN110916666B CN201911269280.5A CN201911269280A CN110916666B CN 110916666 B CN110916666 B CN 110916666B CN 201911269280 A CN201911269280 A CN 201911269280A CN 110916666 B CN110916666 B CN 110916666B
Authority
CN
China
Prior art keywords
hepatocellular carcinoma
feature
multimodal
image
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911269280.5A
Other languages
English (en)
Other versions
CN110916666A (zh
Inventor
刘爱连
郭妍
赵莹
王楠
李昕
武敬君
吴艇帆
张钦和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Affiliated Hospital of Dalian Medical University
Original Assignee
First Affiliated Hospital of Dalian Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of Dalian Medical University filed Critical First Affiliated Hospital of Dalian Medical University
Priority to CN201911269280.5A priority Critical patent/CN110916666B/zh
Publication of CN110916666A publication Critical patent/CN110916666A/zh
Application granted granted Critical
Publication of CN110916666B publication Critical patent/CN110916666B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/05Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves 
    • A61B5/055Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves  involving electronic [EMR] or nuclear [NMR] magnetic resonance, e.g. magnetic resonance imaging
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • High Energy & Nuclear Physics (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Radiology & Medical Imaging (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于多模态MRI图像预测手术切除肝细胞癌复发的影像组学特征处理方法,包括:收集多模态肝细胞癌的MR样本图像并对其进行感兴趣区域勾画,提取感兴趣区域的图像特征;对提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;计算Spearman相关系数以0.95为阈值去除高相关性特征,再采用支持向量机递归特征消除方法进行特征选择;将选择后的特征输入模型构建L1正则化Logistic回归模型,通过5折交叉验证技术进行参数调整,得出特征降维结果;基于机器学习方法的最优化理论,引入5折交叉验证技术,通过L2正则化模型构建思想,最优化得到L2正则化Logistic回归模型,采用ROC方法对L2正则化Logistic回归模型进行评价。

Description

一种预测手术切除肝细胞癌复发的影像组学特征处理方法
技术领域
本发明涉及影像医学与核医学、影像组学技术领域,具体而言,尤其涉及一种基于多模态MRI图像预测手术切除肝细胞癌复发的影像组学特征处理方法。
背景技术
肝细胞癌是全球第六位常见癌症和第四位癌症相关死亡原因,肝切除手术是早期肝癌患者最重要的治疗策略之一。然而,高达70%的肝切除术后肝癌患者5年内复发。复发时间是独立预后因素之一,肝癌早期复发(2年)比晚期复发(>2年)预后更差,因此需要对肝癌患者进行危险分层。先前研究证明一些病理因素可以进行肝癌危险分层,如微血管侵犯、瘤栓、病理分级和肿瘤大小等。病理特征只能通过术前活检获得,但考虑到其侵袭性、潜在出血风险性及评估异质性难,术前寻找无创的危险分层方法是十分必要的。较少学者已尝试基于MRI图像的影像组学方法预测肝细胞癌早期复发,但这些研究并未基于多模态MRI图像进行特征提取,更多定量的影像特征尚未被充分挖掘。MRI已成为肝细胞癌检出和诊断的重要手段,比CT更能准确描述软组织特征并且避免了电离辐射。影像组学通过不同的算法将医学图像转换成高维特征,定量描述了组织异质性,一定程度上可作为肿瘤分子状态的潜在影像学标记物,这些标记物有助于癌症的检测、诊断、治疗反应评估以及预后预测。
肝细胞癌手术切除与复发的时间间隔是独立预后因素之一,病理特征是肝切除术后早期复发最重要的相关危险因素。但病理特征的获取依赖于侵入性手术或活组织检查所获取的组织样本,而肿瘤异质性限制了该样本的有效性,因为小组织样本不可能表征整个肿瘤。此外,活检具有侵袭性、潜在出血、感染和扩散的风险性,使其不能广泛应用于临床。影像学检查能够直观地涵盖整个肿块的信息,避免了因肿瘤异质性造成的差异。它还可以观察肿瘤外周区域,而这些区域通常不能通过外科手术切除,很难获取其病理信息。
发明内容
根据上述提出的技术问题,而提供一种基于多模态MRI图像预测手术切除肝细胞癌复发的影像组学特征处理方法。本发明将高通量的影像组学特征与复发信息相关联,为肝细胞癌肝切除术后早期复发提供一种基于影像组学特征的非侵袭性的可视化方法。
本发明采用的技术手段如下:
一种基于多模态MRI图像预测手术切除肝细胞癌复发的影像组学特征处理方法,包括如下步骤:
S1、收集多模态肝细胞癌的MR样本图像,包括早期复发型多模态肝细胞癌的MR图像和晚期复发型多模态肝细胞癌的MR图像;
S2、对所述多模态肝细胞癌的MR样本图像进行感兴趣区域勾画,提取区域内的图像特征;
S3、对所述步骤S2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;
S4、计算Spearman相关系数以0.95为阈值去除高相关性特征,再采用支持向量机递归特征消除方法进行特征选择;
S5、采用Logistics Regression分类器对所述步骤S4中的组学特征选择的方式进行组合,将选择后的特征输入模型构建L1正则化Logistic回归模型,通过5折交叉验证技术进行参数调整,得到L1正则化Logistic回归模型的损失函数,当所述损失函数最小时,由于是L1正则化,则部分过滤后的组学特征的权重将降至0值,将其剔除得出特征降维结果;
S6、基于机器学习方法的最优化理论,引入5折交叉验证技术,通过最小化模型损失函数原则,最优化得到L2正则化Logistic回归模型,并采用ROC方法对L2正则化Logistic回归模型进行评价。
进一步地,所述步骤S3中的哑变量处理过程具体为:
S31、假设所述多模态肝细胞癌的MR样本图像的数量为n,所述早期复发型多模态肝细胞癌的MR图像的数量为n1,晚期复发型多模态肝细胞癌的MR图像的数量为n2,提取的图像特征为p;
S32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn
S33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;
S34、将所述多模态肝细胞癌的MR样本图像的类别与新特征相匹配,得到混淆矩阵Ti;其中,早期复发型多模态肝细胞癌的MR图像的类别为1类,晚期复发型多模态肝细胞癌的MR图像的类别为0类;
S35、根据混淆矩阵Ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;
S36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵Tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk
进一步地,所述步骤S4的具体过程如下:
S41、采用相关性分析方法降低特征之间的冗余性,引用Spearman相关性分析,计算相关性系数corxy,当|corxy|≥0.95时,剔除卡方检验p值较大的特征;所述计算相关性系数corxy的公式如下:
Figure SMS_1
其中,number of concordant pairs表示在混淆矩阵Tk中主对角线的和;numberof disconcordant pairs表示在混淆矩阵Tk中副对角线的和;
S42、采用支持向量机递归特征消除方法进行特征选择,具体如下:
S421、假设多模态肝细胞癌的MR样本图像数据集为:
T={(x1,y1),(x1,y1),...,(xi,yi),...,(xn,yn)}
其中,xi∈RD,yi∈{-1,+1},n为样本量,xi为第i个样本,D为影像组学特征数,S={1,2,...,D}为原始特征集合,SVM模型的切分面为:
ω·x+b=0
其中,ω为法向量,b为截距;
S422、优化SVM模型:
Figure SMS_2
s.t.yi(ω·xi+b)≥1-ξi,i=1,2,...,n
ξi≥0,i=1,2,...,n
其中,C为惩罚参数,b为截距,ξi为松弛变量;
S423、将原始问题转化为对偶问题:
Figure SMS_3
Figure SMS_4
0≤αi≤C,i=1,2,...,n
其中,αi为拉格朗日乘子,解出:
Figure SMS_5
第i个影像组学特征的排序准则得分的定义为:
Figure SMS_6
S424、循环执行ci过程直到S为空集,再找出排序最小的组学特征p=argminkck后,更新特征集R={p,R},在原始特征集合中删去该特征p,剩下的S`=S/p即为新的特征集合。
进一步地,所述L1正则化Logistic回归模型的损失函数具体为:
Figure SMS_7
其中,n为多模态肝细胞癌的MR样本图像的个数,β为具有统计学意义的组学特征的权重,||β||1为其L1范数,即||β||1=|β1|+|β2|+...+|βp|,lnl为对数似然函数,x(i)为第i个多模态肝细胞癌的MR样本图像的特征组,y(i)为第i个多模态肝细胞癌的MR样本图像的肝癌类别,λ为联系惩罚项与损失数的权重参数,λ的不同取值将产生不同的损失值。
进一步地,所述采用ROC方法对L2正则化Logistic回归模型进行评价的具体过程如下:
S61、假设所述多模态肝细胞癌的MR样本图像的数量为n,所述早期复发型多模态肝细胞癌的MR图像的数量为n1,晚期复发型多模态肝细胞癌的MR图像的数量为n2,降维处理后的组学特征数量为m;
S62、根据m个降维处理后的组学特征,构建L2正则化Logistic回归模型并对其进行内部验证,得到每个多模态肝细胞癌的MR样本图像中属于早期复发型多模态肝细胞癌的MR图像的概率P;
S63、对P中的n个取值p1’,...,pn’进行由小至大排序,得到q1’,...,qn’;
S64、设置普通阈值cutoffi’,且令cutoffi'=q'i;令大于cutoffi’的取值为1;小于cutoffi’的取值为0,得到新特征p”;
S65、将所述多模态肝细胞癌的MR样本图像的类别与新特征p”相匹配,得到混淆矩阵Ti’;其中,早期复发型多模态肝细胞癌的MR图像的类别为1类,晚期复发型多模态肝细胞癌的MR图像的类别为0类;
S66、根据混淆矩阵Ti’,计算出与其对应的敏感度sensitivitiy'、特异度specificitiy’以及和值senspei’,且令:和值=敏感度+特异度,同时得到n个敏感度与特异度的组合点(sensitivityi’,specificityi’);
S67、根据所述的n个敏感度与特异度的组合点,以1-specificityi’为横坐标,sensitivityi’为纵坐标,勾画散点图;
S68、将n个敏感度与特异度的组合点与端点(0,0)、(1,1)依次连接,得到ROC曲线,进而得出ROC曲线下面积AUC值;
S69、计算所有和值中的最大值,即senspek'=maxsenspei',得出对应的k值、混合矩阵Tk'、cutoffk'、sensitivityk'、specificityk'以及取值为0或1的哑变量特征qk'。
较现有技术相比,本发明具有以下优点:
1、本发明提供的基于多模态MRI图像预测手术切除肝细胞癌复发的影像组学特征处理方法,将高通量的影像组学特征与复发信息相关联,为肝细胞癌肝切除术后早期复发提供一种基于影像组学特征的非侵袭性的可视化方法。
2、本发明提供的基于多模态MRI图像预测手术切除肝细胞癌复发的影像组学特征处理方法,对影像组学特征进行哑变量处理后模型的效果较优,具有较高的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法流程图。
图2为本发明实施例提供的ROC曲线图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例
如图1所示,本发明提供了一种基于多模态MRI图像预测手术切除肝细胞癌复发的影像组学特征处理方法,包括如下步骤:
S1、收集多模态肝细胞癌的MR样本图像,包括早期复发型多模态肝细胞癌的MR图像和晚期复发型多模态肝细胞癌的MR图像;
S2、对所述多模态肝细胞癌的MR样本图像进行感兴趣区域勾画,提取区域内的图像特征;
S3、对所述步骤S2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;
进一步地,作为本发明优选的实施方式
所述步骤S3中的哑变量处理过程具体为:
S31、假设所述多模态肝细胞癌的MR样本图像的数量为n,所述早期复发型多模态肝细胞癌的MR图像的数量为n1,晚期复发型多模态肝细胞癌的MR图像的数量为n2,提取的图像特征为p;
S32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn
S33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;
S34、将所述多模态肝细胞癌的MR样本图像的类别与新特征相匹配,得到混淆矩阵Ti;其中,早期复发型多模态肝细胞癌的MR图像的类别为1类,晚期复发型多模态肝细胞癌的MR图像的类别为0类;
S35、根据混淆矩阵Ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;
S36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵Tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk
S4、计算Spearman相关系数以0.95为阈值去除高相关性特征,再采用支持向量机递归特征消除方法进行特征选择;
进一步地,作为本发明优选的实施方式
所述步骤S4的具体过程如下:
S41、采用相关性分析方法降低特征之间的冗余性,引用Spearman相关性分析,计算相关性系数corxy,当|corxy|≥0.95时,剔除卡方检验p值较大的特征;所述计算相关性系数corxy的公式如下:
Figure SMS_8
其中,number of concordant pairs表示在混淆矩阵Tk中主对角线的和;numberofdisconcordant pairs表示在混淆矩阵Tk中副对角线的和;
S42、采用支持向量机递归特征消除方法进行特征选择,具体如下:
S421、假设多模态肝细胞癌的MR样本图像数据集为:
T={(x1,y1),(x1,y1),...,(xi,yi),...,(xn,yn)}
其中,xi∈RD,yi∈{-1,+1},n为样本量,xi为第i个样本,D为影像组学特征数,S={1,2,...,D}为原始特征集合,SVM模型的切分面为:
ω·x+b=0
其中,ω为法向量,b为截距;
S422、优化SVM模型:
Figure SMS_9
s.t.yi(ω·xi+b)≥1-ξi,i=1,2,...,n
ξi≥0,i=1,2,...,n
其中,C为惩罚参数,b为截距,ξi为松弛变量;
S423、将原始问题转化为对偶问题:
Figure SMS_10
Figure SMS_11
0≤αi≤C,i=1,2,...,n
其中,αi为拉格朗日乘子,解出:
Figure SMS_12
第i个影像组学特征的排序准则得分的定义为:
Figure SMS_13
S424、循环执行ci过程直到S为空集,再找出排序最小的组学特征p=argminkck后,更新特征集R={p,R},在原始特征集合中删去该特征p,剩下的S`=S/p即为新的特征集合。
S5、采用Logistics Regression分类器对所述步骤S4中的组学特征选择的方式进行组合,将选择后的特征输入模型构建L1正则化Logistic回归模型,通过5折交叉验证技术进行参数调整,得到L1正则化Logistic回归模型的损失函数,当所述损失函数最小时,由于是L1正则化,则部分过滤后的组学特征的权重将降至0值,将其剔除得出特征降维结果;
进一步地,作为本发明优选的实施方式
所述L1正则化Logistic回归模型的损失函数具体为:
Figure SMS_14
其中,n为多模态肝细胞癌的MR样本图像的个数,β为具有统计学意义的组学特征的权重,||β||1为其L1范数,即||β||1=|β1|+|β2|+...+|βp|,lnl为对数似然函数,x(i)为第i个多模态肝细胞癌的MR样本图像的特征组,y(i)为第i个多模态肝细胞癌的MR样本图像的肝癌类别,λ为联系惩罚项与损失数的权重参数,λ的不同取值将产生不同的损失值。
S6、基于机器学习方法的最优化理论,引入5折交叉验证技术,通过最小化模型损失函数原则,最优化得到L2正则化Logistic回归模型,并采用ROC方法对L2正则化Logistic回归模型进行评价。
进一步地,作为本发明优选的实施方式
所述采用ROC方法对L2正则化Logistic回归模型进行评价的具体过程如下:
S61、假设所述多模态肝细胞癌的MR样本图像的数量为n,所述早期复发型多模态肝细胞癌的MR图像的数量为n1,晚期复发型多模态肝细胞癌的MR图像的数量为n2,降维处理后的组学特征数量为m;
S62、根据m个降维处理后的组学特征,构建L2正则化Logistic回归模型并对其进行内部验证,得到每个多模态肝细胞癌的MR样本图像中属于早期复发型多模态肝细胞癌的MR图像的概率P;
S63、对P中的n个取值p1’,...,pn’进行由小至大排序,得到q1’,...,qn’;
S64、设置普通阈值cutoffi’,且令cutoffi'=q'i;令大于cutoffi’的取值为1;小于cutoffi’的取值为0,得到新特征p”;
S65、将所述多模态肝细胞癌的MR样本图像的类别与新特征p”相匹配,得到混淆矩阵Ti’;其中,早期复发型多模态肝细胞癌的MR图像的类别为1类,晚期复发型多模态肝细胞癌的MR图像的类别为0类;
S66、根据混淆矩阵Ti’,计算出与其对应的敏感度sensitivity'i、特异度specificityi’以及和值senspei’,且令:和值=敏感度+特异度,同时得到n个敏感度与特异度的组合点(sensitivityi’,specificityi’);
S67、根据所述的n个敏感度与特异度的组合点,以1-specificityi’为横坐标,sensitivityi’为纵坐标,勾画散点图;
S68、将n个敏感度与特异度的组合点与端点(0,0)、(1,1)依次连接,得到ROC曲线,如图2所示,为本实施例提供的ROC曲线图,进而得出ROC曲线下面积AUC值;与表1ROC曲线下AUC值及其诊断效果做对比。
S69、计算所有和值中的最大值,即senspek'=maxsenspei',得出对应的k值、混合矩阵Tk'、cutoffk'、sensitivityk'、specificityk'以及取值为0或1的哑变量特征qk'。
本实施例中,分别对训练数据集、验证集、HD750数据集进行模型构建、内部验证、外部测试。采用ROC方法对上述模型进行评价,得出AUC值,随后采用DeLong’s test对ROC进行显著性检验以评价AUC统计学意义。
表1 ROC曲线下AUC值及其诊断效果
Figure SMS_15
研究的结论为对影像组学特征进行哑变量化后模型的效果较优,具有较高的准确性。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

Claims (5)

1.一种基于多模态MRI图像预测手术切除肝细胞癌复发的影像组学特征处理方法,其特征在于,包括如下步骤:
S1、收集多模态肝细胞癌的MR样本图像,包括早期复发型多模态肝细胞癌的MR图像和晚期复发型多模态肝细胞癌的MR图像;
S2、对所述多模态肝细胞癌的MR样本图像进行感兴趣区域勾画,提取区域内的图像特征;
S3、对所述步骤S2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;
S4、计算Spearman相关系数以0.95为阈值去除高相关性特征,再采用支持向量机递归特征消除方法进行特征选择;
S5、采用Logistics Regression分类器对所述步骤S4中的组学特征选择的方式进行组合,将选择后的特征输入模型构建L1正则化Logistic回归模型,通过5折交叉验证技术进行参数调整,得到L1正则化Logistic回归模型的损失函数,当所述损失函数最小时,由于是L1正则化,则部分过滤后的组学特征的权重将降至0值,将其剔除得出特征降维结果;
S6、基于机器学习方法的最优化理论,引入5折交叉验证技术,通过最小化模型损失函数原则,最优化得到L2正则化Logistic回归模型,并采用ROC方法对L2正则化Logistic回归模型进行评价。
2.根据权利要求1所述的基于多模态MRI图像预测手术切除肝细胞癌复发的影像组学特征处理方法,其特征在于,所述步骤S3中的哑变量处理过程具体为:
S31、假设所述多模态肝细胞癌的MR样本图像的数量为n,所述早期复发型多模态肝细胞癌的MR图像的数量为n1,晚期复发型多模态肝细胞癌的MR图像的数量为n2,提取的图像特征为p;
S32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn
S33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;
S34、将所述多模态肝细胞癌的MR样本图像的类别与新特征相匹配,得到混淆矩阵Ti;其中,早期复发型多模态肝细胞癌的MR图像的类别为1类,晚期复发型多模态肝细胞癌的MR图像的类别为0类;
S35、根据混淆矩阵Ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;
S36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵Tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk
3.根据权利要求1或2所述的基于多模态MRI图像预测手术切除肝细胞癌复发的影像组学特征处理方法,其特征在于,所述步骤S4的具体过程如下:
S41、采用相关性分析方法降低特征之间的冗余性,引用Spearman相关性分析,计算相关性系数corxy,当|corxy|≥0.95时,剔除卡方检验p值较大的特征;所述计算相关性系数corxy的公式如下:
Figure FDA0002313714980000021
其中,number of concordant pairs表示在混淆矩阵Tk中主对角线的和;number ofdisconcordant pairs表示在混淆矩阵Tk中副对角线的和;
S42、采用支持向量机递归特征消除方法进行特征选择,具体如下:
S421、假设多模态肝细胞癌的MR样本图像数据集为:
T={(x1,y1),(x1,y1),...,(xi,yi),...,(xn,yn)}
其中,xi∈RD,yi∈{-1,+1},n为样本量,xi为第i个样本,D为影像组学特征数,S={1,2,...,D}为原始特征集合,SVM模型的切分面为:
ω·x+b=0
其中,ω为法向量,b为截距;
S422、优化SVM模型:
Figure FDA0002313714980000022
s.t.yi(ω·xi+b)≥1-ξi,i=1,2,...,n
ξi≥0,i=1,2,...,n
其中,C为惩罚参数,b为截距,ξi为松弛变量;
S423、将原始问题转化为对偶问题:
Figure FDA0002313714980000031
Figure FDA0002313714980000032
0≤αi≤C,i=L2,...,n
其中,αi为拉格朗日乘子,解出:
Figure FDA0002313714980000033
第i个影像组学特征的排序准则得分的定义为:
Figure FDA0002313714980000034
S424、循环执行ci过程直到S为空集,再找出排序最小的组学特征p=argminkck后,更新特征集R={p,R},在原始特征集合中删去该特征p,剩下的S`=S/p即为新的特征集合。
4.根据权利要求1所述的基于多模态MRI图像预测手术切除肝细胞癌复发的影像组学特征处理方法,其特征在于,所述L1正则化Logistic回归模型的损失函数具体为:
Figure FDA0002313714980000035
其中,n为多模态肝细胞癌的MR样本图像的个数,β为具有统计学意义的组学特征的权重,||β||1为其L1范数,即||β||1=|β1|+|β2|+...+|βp|,lnl为对数似然函数,x(i)为第i个多模态肝细胞癌的MR样本图像的特征组,y(i)为第i个多模态肝细胞癌的MR样本图像的肝癌类别,λ为联系惩罚项与损失数的权重参数,λ的不同取值将产生不同的损失值。
5.根据权利要求1所述的基于多模态MRI图像预测手术切除肝细胞癌复发的影像组学特征处理方法,其特征在于,所述采用ROC方法对L2正则化Logistic回归模型进行评价的具体过程如下:
S61、假设所述多模态肝细胞癌的MR样本图像的数量为n,所述早期复发型多模态肝细胞癌的MR图像的数量为n1,晚期复发型多模态肝细胞癌的MR图像的数量为n2,降维处理后的组学特征数量为m;
S62、根据m个降维处理后的组学特征,构建L2正则化Logistic回归模型并对其进行内部验证,得到每个多模态肝细胞癌的MR样本图像中属于早期复发型多模态肝细胞癌的MR图像的概率P;
S63、对P中的n个取值p1’,...,pn’进行由小至大排序,得到q1’,...,qn’;
S64、设置普通阈值cutoffi’,且令cutoffi'=q'i;令大于cutoffi’的取值为1;小于cutoffi’的取值为0,得到新特征p”;
S65、将所述多模态肝细胞癌的MR样本图像的类别与新特征p”相匹配,得到混淆矩阵Ti’;其中,早期复发型多模态肝细胞癌的MR图像的类别为1类,晚期复发型多模态肝细胞癌的MR图像的类别为0类;
S66、根据混淆矩阵Ti’,计算出与其对应的敏感度
Figure FDA0002313714980000041
特异度specificityi’以及和值senspei’,且令:和值=敏感度+特异度,同时得到n个敏感度与特异度的组合点(sensitivityi’,specificityi’);
S67、根据所述的n个敏感度与特异度的组合点,以1-specificityi’为横坐标,sensitivityi’为纵坐标,勾画散点图;
S68、将n个敏感度与特异度的组合点与端点(0,0)、(1,1)依次连接,得到ROC曲线,进而得出ROC曲线下面积AUC值;
S69、计算所有和值中的最大值,即senspek'=maxsenspei',得出对应的k值、混合矩阵Tk'、cutoffk'、sensitivityk'、specificityk'以及取值为0或1的哑变量特征qk'。
CN201911269280.5A 2019-12-11 2019-12-11 一种预测手术切除肝细胞癌复发的影像组学特征处理方法 Active CN110916666B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911269280.5A CN110916666B (zh) 2019-12-11 2019-12-11 一种预测手术切除肝细胞癌复发的影像组学特征处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911269280.5A CN110916666B (zh) 2019-12-11 2019-12-11 一种预测手术切除肝细胞癌复发的影像组学特征处理方法

Publications (2)

Publication Number Publication Date
CN110916666A CN110916666A (zh) 2020-03-27
CN110916666B true CN110916666B (zh) 2023-03-21

Family

ID=69860059

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911269280.5A Active CN110916666B (zh) 2019-12-11 2019-12-11 一种预测手术切除肝细胞癌复发的影像组学特征处理方法

Country Status (1)

Country Link
CN (1) CN110916666B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112768072B (zh) * 2021-01-12 2023-03-24 哈尔滨医科大学 基于影像组学定性算法构建癌症临床指标评估系统
CN113539493A (zh) * 2021-06-23 2021-10-22 吾征智能技术(北京)有限公司 一种利用多模态风险因素推断癌症风险概率的系统
TWI783907B (zh) * 2022-05-24 2022-11-11 華碩電腦股份有限公司 輔助診斷系統及其方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1973778A (zh) * 2006-12-08 2007-06-06 南京大学 胃癌术后严重并发症风险度的预测方法
CN106248945A (zh) * 2016-08-02 2016-12-21 冯骥良 对肝细胞癌患者进行肝细胞癌根治切除术预后情况分组的方法、系统以及试剂盒
CN109658411A (zh) * 2019-01-21 2019-04-19 杭州英库医疗科技有限公司 一种基于ct影像学特征与非小细胞肺癌患者预后情况的相关性分析方法
CN109949268A (zh) * 2019-01-24 2019-06-28 郑州大学第一附属医院 一种基于机器学习的肝细胞癌分化水平分级方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI668666B (zh) * 2018-02-14 2019-08-11 China Medical University Hospital 肝癌分群預測模型、其預測系統以及肝癌分群判斷方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1973778A (zh) * 2006-12-08 2007-06-06 南京大学 胃癌术后严重并发症风险度的预测方法
CN106248945A (zh) * 2016-08-02 2016-12-21 冯骥良 对肝细胞癌患者进行肝细胞癌根治切除术预后情况分组的方法、系统以及试剂盒
CN109658411A (zh) * 2019-01-21 2019-04-19 杭州英库医疗科技有限公司 一种基于ct影像学特征与非小细胞肺癌患者预后情况的相关性分析方法
CN109949268A (zh) * 2019-01-24 2019-06-28 郑州大学第一附属医院 一种基于机器学习的肝细胞癌分化水平分级方法

Also Published As

Publication number Publication date
CN110916666A (zh) 2020-03-27

Similar Documents

Publication Publication Date Title
Kalpathy-Cramer et al. Radiomics of lung nodules: a multi-institutional study of robustness and agreement of quantitative imaging features
CN110916666B (zh) 一种预测手术切除肝细胞癌复发的影像组学特征处理方法
CN111028223B (zh) 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法
US20220207730A1 (en) Systems and Methods for Automated Image Analysis
CN110930402B (zh) 一种基于子宫内膜癌的dki序列mk图的影像组学特征处理方法
Lu et al. Uncontrolled confounders may lead to false or overvalued radiomics signature: a proof of concept using survival analysis in a multicenter cohort of kidney cancer
Iuga et al. Automated mapping and N-Staging of thoracic lymph nodes in contrast-enhanced CT scans of the chest using a fully convolutional neural network
Nidhin Raju et al. Identification of interstitial lung diseases using deep learning
US10898149B2 (en) Standardizing breast density assessments
yahia Ibrahim et al. An enhancement technique to diagnose colon and lung cancer by using double CLAHE and deep learning
Bove et al. A CT-based transfer learning approach to predict NSCLC recurrence: The added-value of peritumoral region
CN110992312B (zh) 医学图像处理方法、装置、存储介质及计算机设备
Mudeng et al. Domain and histopathology adaptations–based classification for malignancy grading system
UÇA et al. Comparison of Deep Learning Models for Body Cavity Fluid Cytology Images Classification
EP4348678A1 (en) A radiomic-based machine learning algorithm to reliably differentiate benign renal masses from renal cell carcinoma
CN114445374A (zh) 一种基于扩散峰度成像mk图的图像特征处理方法及系统
Roy Medhi Lung Cancer Classification from Histologic Images using Capsule Networks
Abdalla et al. A computer-aided diagnosis system for classification of lung tumors
CN110916665B (zh) 一种磁共振扩散加权图像影像组学特征处理方法
EP4349266A1 (en) Feature extraction device, feature extraction method, program, and information recording medium
Yao et al. Radiomics Boosts Deep Learning Model for IPMN Classification
Kumar et al. MRI Image Based Classification Model for Lung Tumor Detection Using Convolutional Neural Networks.
Alrowais et al. Manta Ray Foraging Optimization Transfer Learning based Gastric Cancer Diagnosis and Classification on Endoscopic Images. Cancers 2022, 14, 5661
Sangeetha et al. Deep Residual Learning for Lung Cancer Nodules Detection and Classification
Oner et al. An AI-assisted Tool For Efficient Prostate Cancer Diagnosis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant