CN111028223B - 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 - Google Patents

一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 Download PDF

Info

Publication number
CN111028223B
CN111028223B CN201911269293.2A CN201911269293A CN111028223B CN 111028223 B CN111028223 B CN 111028223B CN 201911269293 A CN201911269293 A CN 201911269293A CN 111028223 B CN111028223 B CN 111028223B
Authority
CN
China
Prior art keywords
intestinal cancer
image
value
energy spectrum
sensitivity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911269293.2A
Other languages
English (en)
Other versions
CN111028223A (zh
Inventor
刘爱连
李昕
武敬君
郭妍
赵莹
张钦和
吴艇帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Affiliated Hospital of Dalian Medical University
Original Assignee
First Affiliated Hospital of Dalian Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of Dalian Medical University filed Critical First Affiliated Hospital of Dalian Medical University
Priority to CN201911269293.2A priority Critical patent/CN111028223B/zh
Publication of CN111028223A publication Critical patent/CN111028223A/zh
Application granted granted Critical
Publication of CN111028223B publication Critical patent/CN111028223B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30028Colon; Small intestine
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明提供一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,包括:收集肠癌样本图像;对肠癌样本图像进行感兴趣区域勾画,提取感兴趣区域的图像特征;对提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;引用卡方检验,对经过哑变量处理后的图像特征采用假设检验法过滤出具有统计学意义的组学特征;采用相关性分析方法对组学特征之间的冗余性进行过滤,引用Kendall相关性分析,计算相关性系数,得到过滤后的组学特征;基于模型层面,引入LASSO算法,对组学特征进行降维处理;基于机器学习方法的最优化理论,引入5折交叉验证技术,通过L2正则化模型构建思想,最优化得到L2正则化Logistic回归模型,采用ROC方法对L2正则化Logistic回归模型进行评价。

Description

一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法
技术领域
本发明涉及影像医学与核医学、影像组学技术领域,具体而言,尤其涉及一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法。
背景技术
肠癌是全球第三大常见的恶性肿瘤,其微卫星不稳定(microsatelliteinstability,MSI)状态与预后和治疗密切相关。2017年NCCN指南指出,MSI结直肠癌患者往往预后更好,更易获益于免疫治疗,并对氟尿嘧啶药物不敏感。目前对MSI的判断依赖于术后病理组织检测,但考虑到医疗设备的限制以及手术对患者造成的创伤,术前寻找无创方法获取MSI状态是十分必要的。已经有学者尝试基于影像特征评估子宫内膜癌、肠癌及胃癌MSI状态,但这些研究的诊断价值尚不明确,且更多定量的影像特征尚未被充分挖掘。
能谱CT作为临床常用的影像检查手段,能够通过碘水浓度图反映组织的血供状态。本团队前期研究发现,与微卫星稳定(microsatellite stability,MSS)结直肠癌组织相比,MSI结直肠癌的血供更少,平均碘浓度更低,但该研究忽略了碘浓度分布的空间异质性。影像组学分析是基于像素强度和空间分布特点,定量描述了组织异质性,一定程度上可作为肿瘤分子状态的潜在影像学标记物。
肠癌的MSI状态与其疗效及预后密切相关,目前,MSI已经成为肠癌组织标本的常规检测手段。但MSI的检测依赖于侵入性手术或活组织检查所获取的组织样本,而肿瘤异质性限制了该样本的有效性,因为小组织样本不可能代表整个肿瘤。此外,虽然MSI的检测已经被纳入临床实践中,但受到其成本、检测周期和技术复杂性的限制,大规模肿瘤分子检测难以在临床得到推广。影像检查能够直观地涵盖整个肿块的信息,避免了因肿瘤异质性造成的差异。它还可以观察肿瘤外周区域,而这些区域通常不能通过外科手术切除,很难获取其病理信息。
发明内容
根据上述提出的技术问题,而提供一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法。本发明将高通量的影像组学特征与MSI信息相关联,为MSI肠癌提供一种基于放射影像组学特征的非侵袭性的可视化方法。
本发明采用的技术手段如下:
一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,包括如下步骤:
S1、收集肠癌样本图像,所述样本图像为MSI肠癌能谱CT碘水图像和MSS肠癌能谱CT碘水图像;
S2、对所述肠癌样本图像进行感兴趣区域勾画,提取感兴趣区域的图像特征;
S3、对所述步骤S2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;
S4、引用卡方检验,对经过哑变量处理后的图像特征采用假设检验法过滤出具有统计学意义的组学特征;
S5、采用相关性分析方法对所述组学特征之间的冗余性进行过滤,引用Kendall相关性分析,计算相关性系数corxy,得到过滤后的组学特征;
S6、基于模型层面,引入LASSO算法,对所述步骤S5中过滤后的组学特征进行降维处理;通过5折交叉验证技术,构建L1正则化Logistic回归模型,得到L1正则化Logistic回归模型的损失函数,当所述损失函数最小时,由于是L1正则化,则部分过滤后的组学特征的权重将降至0值,将其剔除得出特征降维结果;
S7、基于机器学习方法的最优化理论,引入5折交叉验证技术,通过L2正则化模型构建思想,最优化得到L2正则化Logistic回归模型,并采用ROC方法对L2正则化Logistic回归模型进行评价。
进一步地,所述步骤S3中的哑变量处理过程具体为:
S31、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,提取的图像特征为p;
S32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn
S33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;
S34、将所述肠癌样本图像的类别与新特征相匹配,得到混淆矩阵Ti;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S35、根据混淆矩阵Ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;
S36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵Tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk
进一步地,所述步骤S4的具体过程如下:
S41、设置Q为离散化后的新特性,分别对步骤S3中经过哑变量处理后的图像特征,寻找出与所述步骤S36中对应的混合矩阵Tk,通过四个表卡方检验得出卡方值x2
S42、将所述卡方值x2与卡方界值表匹配,得到卡方检验p值;
S43、将p值大于0.05的图像特征剔除,保留p值小于0.05的图像特征,即为所述具有统计学意义的组学特征。
进一步地,所述步骤S5中还包括当|corxy|≥0.9时,剔除卡方检验p值较大特征的步骤;所述计算相关性系数corxy的公式如下:
其中,number of concordant pairs表示在混淆矩阵Tk中主对角线的和;numberof disconcordant pairs表示在混淆矩阵Tk中副对角线的和。
进一步地,所述L1正则化Logistic回归模型的损失函数具体为:
其中,n为肠癌样本图像的个数,β为具有统计学意义的组学特征的权重,||β||1为其L1范数,即||β||1=|β1|+|β2|+...+|βp|,lnl为对数似然函数,|β1|为第i个肠癌样本图像的特征组,y(i)为第i个肠癌样本图像的肠癌类别,λ为联系惩罚项与损失数的权重参数,λ的不同取值将产生不同的损失值。
进一步地,所述采用ROC方法对L2正则化Logistic回归模型进行评价的具体过程如下:
S71、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,降维处理后的组学特征数量为m;
S72、根据m个降维处理后的组学特征,构建L2正则化Logistic回归模型并对其进行内部验证,得到每个肠癌样本图像中属于MSI肠癌能谱CT碘水图像的概率P;
S73、对P中的n个取值p1’,...,pn’进行由小至大排序,得到q1’,...,qn’;
S74、设置普通阈值cutoffi’,且令cutoffi'=q'i;令大于cutoffi’的取值为1;小于cutoffi’的取值为0,得到新特征p”;
S75、将所述肠癌样本图像的类别与新特征p”相匹配,得到混淆矩阵Ti’;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S76、根据混淆矩阵Ti’,计算出与其对应的敏感度特异度以及和值senspei’,且令:和值=敏感度+特异度,同时得到n个敏感度与特异度的组合点(sensitivityi’,specificityi’);
S77、根据所述的n个敏感度与特异度的组合点,以1-specificityi’为横坐标,sensitivityi’为纵坐标,勾画散点图;
S78、将n个敏感度与特异度的组合点与端点(0,0)、(1,1)依次连接,得到ROC曲线,进而得出ROC曲线下面积AUC值;
S79、计算所有和值中的最大值,即senspek'=maxsenspei',得出对应的k值、混合矩阵Tk'、cutoffk'、sensitivityk'、specificityk'以及取值为0或1的哑变量特征qk'。
较现有技术相比,本发明具有以下优点:
1、本发明提供的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,将高通量的影像组学特征与MSI信息相关联,为MSI肠癌提供一种基于放射影像组学特征的非侵袭性的可视化方法。
2、本发明提供的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,对影像组学特征进行哑变量处理后模型的效果较优,具有较高的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法流程图。
图2为本发明实施例提供的ROC曲线图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例
如图1所示,本发明提供了一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,
包括如下步骤:
S1、收集肠癌样本图像,所述样本图像为MSI肠癌能谱CT碘水图像和MSS肠癌能谱CT碘水图像;
S2、对所述肠癌样本图像进行感兴趣区域勾画,提取感兴趣区域的图像特征;
S3、对所述步骤S2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;
步骤S3中的哑变量处理过程具体为:
S31、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,提取的图像特征为p;
S32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn
S33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;
S34、将所述肠癌样本图像的类别与新特征相匹配,得到混淆矩阵Ti;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S35、根据混淆矩阵Ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;
S36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵Tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk
S4、引用卡方检验,对经过哑变量处理后的图像特征采用假设检验法过滤出具有统计学意义的组学特征;
步骤S4的具体过程如下:
S41、设置Q为离散化后的新特性,分别对步骤S3中经过哑变量处理后的图像特征,寻找出与所述步骤S36中对应的混合矩阵Tk,通过四个表卡方检验得出卡方值x2
S42、将所述卡方值x2与卡方界值表匹配,得到卡方检验p值;
S43、将p值大于0.05的图像特征剔除,保留p值小于0.05的图像特征,即为所述具有统计学意义的组学特征。
S5、采用相关性分析方法对所述组学特征之间的冗余性进行过滤,引用Kendall相关性分析,计算相关性系数corxy,得到过滤后的组学特征;具体的,当|corxy|≥0.9时,剔除卡方检验p值较大特征,相关性系数corxy的计算公式如下:
其中,number of concordant pairs表示在混淆矩阵Tk中主对角线的和;numberof disconcordant pairs表示在混淆矩阵Tk中副对角线的和。
S6、基于模型层面,引入LASSO算法,对所述步骤S5中过滤后的组学特征进行降维处理;通过5折交叉验证技术,构建L1正则化Logistic回归模型,得到L1正则化Logistic回归模型的损失函数,当所述损失函数最小时,由于是L1正则化,则部分过滤后的组学特征的权重将降至0值,将其剔除得出特征降维结果;具体的,Logistic回归模型的损失函数为:
其中,n为肠癌样本图像的个数,β为具有统计学意义的组学特征的权重,||β||1为其L1范数,即||β||1=|β1|+|β2|+...+|βp|,lnl为对数似然函数,|β1|为第i个肠癌样本图像的特征组,y(i)为第i个肠癌样本图像的肠癌类别,λ为联系惩罚项与损失数的权重参数,λ的不同取值将产生不同的损失值。
S7、基于机器学习方法的最优化理论,引入5折交叉验证技术,通过L1、L2正则化模型构建思想,最优化得到L2正则化Logistic回归模型,并采用ROC方法对L2正则化Logistic回归模型进行评价。
所述采用ROC方法对L2正则化Logistic回归模型进行评价的具体过程如下:
S71、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,降维处理后的组学特征数量为m;
S72、根据m个降维处理后的组学特征,构建L2正则化Logistic回归模型并对其进行内部验证,得到每个肠癌样本图像中属于MSI肠癌能谱CT碘水图像的概率P;
S73、对P中的n个取值p1’,...,pn’进行由小至大排序,得到q1’,...,qn’;
S74、设置普通阈值cutoffi’,且令cutoffi'=q'i;令大于cutoffi’的取值为1;小于cutoffi’的取值为0,得到新特征p”;
S75、将所述肠癌样本图像的类别与新特征p”相匹配,得到混淆矩阵Ti’;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S76、根据混淆矩阵Ti’,计算出与其对应的敏感度特异度以及和值senspei’,且令:和值=敏感度+特异度,同时得到n个敏感度与特异度的组合点(sensitivityi’,specificityi’);
S77、根据所述的n个敏感度与特异度的组合点,以1-specificityi’为横坐标,sensitivityi’为纵坐标,勾画散点图;
S78、将n个敏感度与特异度的组合点与端点(0,0)、(1,1)依次连接,得到ROC曲线,如图2所示,为本实施例提供的ROC曲线图,进而得出ROC曲线下面积AUC值;与表1ROC曲线下AUC值及其诊断效果做对比。
S79、计算所有和值中的最大值,即senspek'=maxsenspei',得出对应的k值、混合矩阵Tk'、cutoffk'、sensitivityk'、specificityk'以及取值为0或1的哑变量特征qk'。
本实施例中,分别对训练数据集、验证集、HD750数据集进行模型构建、内部验证、外部测试。采用ROC方法对上述模型进行评价,得出AUC值,随后采用DeLong’s test对ROC进行显著性检验以评价AUC统计学意义。
表1 ROC曲线下AUC值及其诊断效果
研究的结论为对影像组学特征进行哑变量化后模型的效果较优,具有较高的准确性。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

Claims (6)

1.一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,包括如下步骤:
S1、收集肠癌样本图像,所述样本图像为MSI肠癌能谱CT碘水图像和MSS肠癌能谱CT碘水图像;
S2、对所述肠癌样本图像进行感兴趣区域勾画,提取感兴趣区域的图像特征;
S3、对所述步骤S2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;
S4、引用卡方检验,对经过哑变量处理后的图像特征采用假设检验法过滤出具有统计学意义的组学特征;
S5、采用相关性分析方法对所述组学特征之间的冗余性进行过滤,引用Kendall相关性分析,计算相关性系数corxy,得到过滤后的组学特征;
S6、基于模型层面,引入LASSO算法,对所述步骤S5中过滤后的组学特征进行降维处理;通过5折交叉验证技术,构建L1正则化Logistic回归模型,得到L1正则化Logistic回归模型的损失函数,当所述损失函数最小时,由于是L1正则化,则部分过滤后的组学特征的权重将降至0值,将其剔除得出特征降维结果;
S7、基于机器学习方法的最优化理论,引入5折交叉验证技术,通过L2正则化模型构建思想,最优化得到L2正则化Logistic回归模型,并采用ROC方法对L2正则化Logistic回归模型进行评价。
2.根据权利要求1所述的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,所述步骤S3中的哑变量处理过程具体为:
S31、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,提取的图像特征为p;
S32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn
S33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;
S34、将所述肠癌样本图像的类别与新特征相匹配,得到混淆矩阵Ti;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S35、根据混淆矩阵Ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;
S36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵Tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk
3.根据权利要求2所述的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,所述步骤S4的具体过程如下:
S41、设置Q为离散化后的新特性,分别对步骤S3中经过哑变量处理后的图像特征,寻找出与所述步骤S36中对应的混合矩阵Tk,通过四个表卡方检验得出卡方值x2
S42、将所述卡方值x2与卡方界值表匹配,得到卡方检验p值;
S43、将p值大于0.05的图像特征剔除,保留p值小于0.05的图像特征,即为所述具有统计学意义的组学特征。
4.根据权利要求3所述的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,所述步骤S5中还包括当|corxy|≥0.9时,剔除卡方检验p值较大特征的步骤;所述计算相关性系数corxy的公式如下:
其中,number of concordant pairs表示在混淆矩阵Tk中主对角线的和;number ofdisconcordant pairs表示在混淆矩阵Tk中副对角线的和。
5.根据权利要求1所述的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,所述L1正则化Logistic回归模型的损失函数具体为:
其中,n为肠癌样本图像的个数,β为具有统计学意义的组学特征的权重,PβP1为其L1范数,即PβP1=|β1|+|β2|+...+|βp|,lnl为对数似然函数,x(i)为第i个肠癌样本图像的特征组,y(i)为第i个肠癌样本图像的肠癌类别,λ为联系惩罚项与损失数的权重参数,λ的不同取值将产生不同的损失值。
6.根据权利要求1所述的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,所述采用ROC方法对L2正则化Logistic回归模型进行评价的具体过程如下:
S71、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,降维处理后的组学特征数量为m;
S72、根据m个降维处理后的组学特征,构建L2正则化Logistic回归模型并对其进行内部验证,得到每个肠癌样本图像中属于MSI肠癌能谱CT碘水图像的概率P;
S73、对P中的n个取值p1’,...,pn’进行由小至大排序,得到q1’,...,qn’;
S74、设置普通阈值cutoffi’,且令cutoffi'=q'i;令大于cutoffi’的取值为1;小于cutoffi’的取值为0,得到新特征p”;
S75、将所述肠癌样本图像的类别与新特征p”相匹配,得到混淆矩阵Ti’;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S76、根据混淆矩阵Ti’,计算出与其对应的敏感度sensitivityi'、特异度specificityi’以及和值senspei’,且令:和值=敏感度+特异度,同时得到n个敏感度与特异度的组合点(sensitivityi’,specificityi’);
S77、根据所述的n个敏感度与特异度的组合点,以1-specificityi’为横坐标,sensitivityi’为纵坐标,勾画散点图;
S78、将n个敏感度与特异度的组合点与端点(0,0)、(1,1)依次连接,得到ROC曲线,进而得出ROC曲线下面积AUC值;
S79、计算所有和值中的最大值,即senspek'=maxsenspei',得出对应的k值、混合矩阵Tk'、cutoffk'、sensitivityk'、specificityk'以及取值为0或1的哑变量特征qk'。
CN201911269293.2A 2019-12-11 2019-12-11 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 Active CN111028223B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911269293.2A CN111028223B (zh) 2019-12-11 2019-12-11 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911269293.2A CN111028223B (zh) 2019-12-11 2019-12-11 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法

Publications (2)

Publication Number Publication Date
CN111028223A CN111028223A (zh) 2020-04-17
CN111028223B true CN111028223B (zh) 2023-11-07

Family

ID=70206052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911269293.2A Active CN111028223B (zh) 2019-12-11 2019-12-11 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法

Country Status (1)

Country Link
CN (1) CN111028223B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183557A (zh) * 2020-09-29 2021-01-05 山西医科大学 基于胃癌组织病理图像纹理特征的msi预测模型构建方法
CN112651955A (zh) * 2020-12-30 2021-04-13 深圳大学 一种肠道图像的识别方法及终端设备
CN113362932B (zh) * 2021-06-24 2023-02-17 河北大学 一种基于cc-注意力机制的影像组学特征筛选方法
CN113921079B (zh) * 2021-12-06 2022-03-18 四川省肿瘤医院 基于免疫相关基因的msi预测模型构建方法
CN115132327B (zh) * 2022-05-25 2023-03-24 中国医学科学院肿瘤医院 微卫星不稳定预测系统及其构建方法、终端设备及介质
CN117540346B (zh) * 2024-01-09 2024-03-19 四川国蓝中天环境科技集团有限公司 大气污染数据高维回归建模的秩序类别变量冗余去除方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220966A (zh) * 2017-05-05 2017-09-29 郑州大学 一种基于影像组学的脑胶质瘤分级预测方法
CN108460809A (zh) * 2017-02-22 2018-08-28 西门子保健有限责任公司 用于前列腺癌检测和分类的深度卷积编码器-解码器
WO2019172621A1 (ko) * 2018-03-09 2019-09-12 연세대학교 산학협력단 질환 예측 방법 및 이를 이용한 질환 예측 디바이스
CN110472629A (zh) * 2019-08-14 2019-11-19 青岛大学附属医院 一种基于深度学习的病理图像自动识别系统及其训练方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10438699B2 (en) * 2016-05-10 2019-10-08 Macau University Of Science And Technology Method and system for determining an association of biological features with a medical condition
US10441225B2 (en) * 2018-02-21 2019-10-15 Case Western Reserve University Predicting disease recurrence following trimodality therapy in non-small cell lung cancer using computed tomography derived radiomic features and clinico-pathologic features

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108460809A (zh) * 2017-02-22 2018-08-28 西门子保健有限责任公司 用于前列腺癌检测和分类的深度卷积编码器-解码器
CN107220966A (zh) * 2017-05-05 2017-09-29 郑州大学 一种基于影像组学的脑胶质瘤分级预测方法
WO2019172621A1 (ko) * 2018-03-09 2019-09-12 연세대학교 산학협력단 질환 예측 방법 및 이를 이용한 질환 예측 디바이스
CN110472629A (zh) * 2019-08-14 2019-11-19 青岛大学附属医院 一种基于深度学习的病理图像自动识别系统及其训练方法

Also Published As

Publication number Publication date
CN111028223A (zh) 2020-04-17

Similar Documents

Publication Publication Date Title
CN111028223B (zh) 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法
Yildirim et al. Deep learning model for automated kidney stone detection using coronal CT images
Liang et al. Accurate diagnosis of pulmonary nodules using a noninvasive DNA methylation test
CN110916666B (zh) 一种预测手术切除肝细胞癌复发的影像组学特征处理方法
CN110055331A (zh) 一种用于膀胱癌辅助诊断或筛查的试剂盒及其应用
Li et al. A novel radiogenomics framework for genomic and image feature correlation using deep learning
CN113345576A (zh) 一种基于深度学习多模态ct的直肠癌淋巴结转移诊断方法
Yang et al. Learning COVID-19 pneumonia lesion segmentation from imperfect annotations via divergence-aware selective training
Li et al. Deep learning for locally advanced nasopharyngeal carcinoma prognostication based on pre-and post-treatment MRI
Sun et al. Five-year prognosis model of esophageal cancer based on genetic algorithm improved deep neural network
US20230038185A1 (en) Radiomics-based treatment decision support for lung cancer
Jin et al. Machine learning based gray-level co-occurrence matrix early warning system enables accurate detection of colorectal cancer pelvic bone metastases on MRI
Kumar et al. Improved UNet deep learning model for automatic detection of lung cancer nodules
Kang et al. Texture analysis of f-18 fluciclovine PET/CT to predict biochemically recurrent prostate cancer: initial results
CN115440383B (zh) 用于预测晚期癌症患者pd-1/pd-l1单抗治疗疗效的系统
US20140107936A1 (en) Cross-modal application of combination signatures indicative of a phenotype
Sachan et al. Artificial intelligence for discrimination of Crohn's disease and gastrointestinal tuberculosis: A systematic review
Al-Utaibi et al. Neural networks to understand the physics of oncological medical imaging
CN110930401B (zh) 一种能谱ct增强碘水图影像组学术前预测肾透明细胞癌who/isup分级方法
Sangeetha et al. A Novel Method to Detect Lung Cancer using Deep Learning
Liebgott et al. Feature-based response prediction to immunotherapy of late-stage melanoma patients using pet/mr imaging
Kukreja et al. A Survey of Machine learning algorithms for Lung cancer detection
Damanik et al. THE EFFECT OF EPOCH ON THE ACCURACY OF DETECTION OF LUNG CANCER
CN110916665B (zh) 一种磁共振扩散加权图像影像组学特征处理方法
Zargar et al. Using VGG16 Algorithms for classification of lung cancer in CT scans Image

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant