CN115482923A - 一种用于判断covid-19分期的基于人工智能的ct图像动态3d影像组学系统 - Google Patents

一种用于判断covid-19分期的基于人工智能的ct图像动态3d影像组学系统 Download PDF

Info

Publication number
CN115482923A
CN115482923A CN202210968551.1A CN202210968551A CN115482923A CN 115482923 A CN115482923 A CN 115482923A CN 202210968551 A CN202210968551 A CN 202210968551A CN 115482923 A CN115482923 A CN 115482923A
Authority
CN
China
Prior art keywords
texture
view
intensity
stage
covid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210968551.1A
Other languages
English (en)
Inventor
陈杨
赵世轩
何得淮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
West China Hospital of Sichuan University
Original Assignee
West China Hospital of Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by West China Hospital of Sichuan University filed Critical West China Hospital of Sichuan University
Publication of CN115482923A publication Critical patent/CN115482923A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Primary Health Care (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本发明提供了一种用于判断COVID‑19分期的基于人工智能的CT图像动态3D影像组学系统,属于人工智能领域。实验结果表明,利用本发明基于人工智能的CT图像动态3D影像组学系统对66例COVID‑19患者进行COVID‑19分期判断,准确率达90%。对于每个阶段的预测,阶段1(即早期)的AUC为0.965(95%CI:0.934,0.997),阶段2(即进展期)的AUC为0.958(95%CI:0.931,0.984),阶段3(即峰值期)的AUC为0.998(95%CI:0.994,1.000),阶段4(即吸收期)的AUC为0.975(95%CI:0.956,0.994)。因此,本发明提供的基于人工智能的CT图像动态3D影像组学系统能够有效对COVID‑19患者进行分期判断,可作为一种潜在的工具,帮助医院进行合理的资源配置并制定合适的治疗计划,应用前景广阔。

Description

一种用于判断COVID-19分期的基于人工智能的CT图像动态3D 影像组学系统
技术领域
本发明属于人工智能领域,具体涉及一种用于判断COVID-19分期的基于人工智能的CT图像动态3D影像组学系统。
背景技术
由严重急性呼吸综合征冠状病毒2型(SARS-CoV-2,又称新型冠状病毒) 引起的2019年冠状病毒肺炎(COVID-19,又称新型冠状病毒肺炎)是一种传播力极强的肺炎。其诊断方法包括呼吸样本转录聚合酶链反应(RT-PCR)和胸部显像。其中,RT-PCR特异性高,但敏感性低,有报道低至60-70%。《中国新型冠状病毒肺炎诊疗方案(修订版第七版)》表明,临床疑似肺炎的影像学特征可以诊断为新型冠状病毒肺炎患者。胸部显像中,胸部X线在早期诊断中价值不大,而CT图像可以在症状出现之前发现异常。因此,对于疑似 COVID-19病例,建议在初次评估、随访时进行胸部CT检查。
根据CT图像可以将COVID-19分为早期、进展期、峰值期和吸收期四个阶段。①早期胸部表现往往不典型,病变呈淡薄斑片状磨玻璃密度影 (groundglassopacity,GGO),多局限性、散在分布于两中下肺野,主要见于胸膜下。②进展期病灶多发,表现为GGO渗出、融合或伴有实变,以双肺野中外带分布多见,可伴少量胸腔积液。③峰值期(危重症)相当于疾病晚期,双肺密度弥漫性、广泛性进一步增高,称为“白肺”。此期病灶发展迅速, 48h可增加50%以上,治疗困难,患者死亡率较高。④吸收期,病灶缩小或吸收,部分病例可见肺间质纤维化改变。
但是,在临床工作中,阅读成千上万的CT图像让医生倍感压力。随着大量确诊患者继续住院,新冠肺炎疫情正成为对医疗资源的重大挑战。计算机辅助诊断(CAD)系统是实现自动化、快速诊断的有效工具,开发出用于判断COVID-19分期的人工智能系统对临床上对入院COVID-19患者进行分流以及分期治疗具有重要意义。
发明内容
本发明的目的在于提供一种用于判断COVID-19分期的基于人工智能的 CT图像动态3D影像组学系统及其构建方法和用途。
本发明提供了一种用于判断COVID-19分期的人工智能系统,所述人工智能系统包括以下模块:
(一)输入模块
在输入模块输入COVID-19患者的影像组学特征和临床特征;
(二)分期判断模型建立模块
以训练集COVID-19患者的影像组学特征和临床特征作为输入,利用 matlab自带的机器学习分类器训练模型,得到训练后的分期判断模型;
(三)分期判断及结果输出模块
以测试集COVID-19患者的影像组学特征和临床特征作为输入,利用训练后的分期判断模型进行分期判断,输出判断结果。
进一步地,所述影像组学特征是通过以下方法提取的:利用训练集 COVID-19患者的CT图像对肺分割网络SCOAT-Net进行训练和测试,对病变分割网络SCOAT-Net进行训练和测试,建立肺与病变分割模型;利用肺与病变分割模型对测试集COVID-19患者的CT图像进行肺与病变分割,并基于肺与病变分割结果重建三维肺病变;在重建的三维肺病变的基础上提取影像组学特征;
所述临床特征包括年龄、性别、发病时间、进展时间中的一种或多种。
进一步地,所述建立肺与病变分割模型时的参数设置如下:基于Pytorch 框架,使用随机梯度下降法优化骰子系数损失函数;网络参数初始化使用何恺明方法;模型训练的迭代次数设为100,初始学习率为0.01,每10次迭代乘以0.1;最终选择经过100个训练周期的模型作为分割模型。
进一步地,所述影像组学特征和临床特征是通过以下方法获得的:将提取的影像组学特征和临床特征利用特征选择方法选择后,按照权重由高到底依次排序,选取权重排序靠前的特征;所述特征选择方法选自RF-FS、Relief-F 或LLCFS,优选为RF-FS。
进一步地,所述权重排序靠前的特征为第1~30个特征中的一个或多个,优选为第1~30个特征或第1~17个特征。
进一步地,所述影像组学特征和临床特征包括以下30个特征中的一个或多个:发病时间、病灶与肺体积之比、纹理第八视角(自相关系数)、进展时间、纹理第五视角(行程百分比)、年龄、纹理第七视角(行程百分比)、强度(中值)、强度(交叉熵)、强度(偏度)、强度(均匀性)、纹理第八视角 (相关性的信息测量2)、肺区域面积、纹理第四视角(聚类突出系数)、纹理第四视角(最大概率)、强度(标准差)、纹理第七视角(归一化逆差分矩)、强度(平均绝对偏差)、纹理第四视角(能量)、强度(方差)、纹理第三视角 (聚类突出系数)、纹理第四视角(方差)、纹理第四视角(差分熵)、纹理第四视角(对比度)、纹理第五视角(行程长度不均匀性)、纹理第九视角(行程长度不均匀性)、纹理第八视角(行程长度不均匀性)、纹理第九视角(聚类突出系数)、纹理第七视角(行程长度不均匀性)、纹理第八视角(对比度);
和/或,所述matlab自带的机器学习分类器选自RF分类器、SVM分类器、或KNN分类器;
和/或,所述COVID-19分期为早期、进展期、峰值期或吸收期。
进一步地,所述matlab自带的机器学习分类器为RF分类器,所述影像组学特征和临床特征为以下30个特征:发病时间、病灶与肺体积之比、纹理第八视角(自相关系数)、进展时间、纹理第五视角(行程百分比)、年龄、纹理第七视角(行程百分比)、强度(中值)、强度(交叉熵)、强度(偏度)、强度(均匀性)、纹理第八视角(相关性的信息测量2)、肺区域面积、纹理第四视角(聚类突出系数)、纹理第四视角(最大概率)、强度(标准差)、纹理第七视角(归一化逆差分矩)、强度(平均绝对偏差)、纹理第四视角(能量)、强度(方差)、纹理第三视角(聚类突出系数)、纹理第四视角(方差)、纹理第四视角(差分熵)、纹理第四视角(对比度)、纹理第五视角(行程长度不均匀性)、纹理第九视角(行程长度不均匀性)、纹理第八视角(行程长度不均匀性)、纹理第九视角(聚类突出系数)、纹理第七视角(行程长度不均匀性)、纹理第八视角(对比度)。
进一步地,所述matlab自带的机器学习分类器为SVM分类器,所述影像组学特征和临床特征为以下17个特征:发病时间、病灶与肺体积之比、纹理第八视角(自相关系数)、进展时间、纹理第五视角(行程百分比)、年龄、纹理第七视角(行程百分比)、强度(中值)、强度(交叉熵)、强度(偏度)、强度(均匀性)、纹理第八视角(相关性的信息测量2)、肺区域面积、纹理第四视角(聚类突出系数)、纹理第四视角(最大概率)、强度(标准差)、纹理第七视角(归一化逆差分矩)。
本发明还提供了上述的人工智能系统在制备用于判断COVID-19分期的设备中的用途。
本发明还提供了一种用于判断COVID-19分期的计算机设备,所述计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序为上述的用于判断COVID-19分期的人工智能系统。
实验结果表明,利用本发明基于人工智能的CT图像动态3D影像组学系统对66例COVID-19患者(平均年龄57±15岁;其中35名女性)进行 COVID-19分期判断,准确率达90%。对于每个阶段的预测,阶段1(即早期)的AUC为0.965(95% CI:0.934,0.997),阶段2(即进展期)的AUC为0.958(95% CI:0.931,0.984),阶段3(即峰值期)的AUC为0.998(95%CI: 0.994,1.000),阶段4(即吸收期)的AUC为0.975(95% CI:0.956,0.994)。因此,本发明提供的基于人工智能的CT图像动态3D影像组学系统能够有效对COVID-19患者进行分期判断,可作为一种潜在的工具,帮助医院进行合理的资源配置并制定合适的治疗计划,应用前景广阔。
显然,根据本发明的上述内容,按照本领域的普通技术知识和惯用手段,在不脱离本发明上述基本技术思想前提下,还可以做出其它多种形式的修改、替换或变更。
以下通过实施例形式的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。凡基于本发明上述内容所实现的技术均属于本发明的范围。
附图说明
图1:基于人工智能的动态三维影像组学分析方法流程图。(A)使用人工智能模型分割COVID-19患者的肺和病变;(B)提取三维肺病变的3D-动态影像组学特征,并结合临床数据评估COVID-19患者的分期。
图2:在4名患者的CT图像中显示COVID-19的四个阶段。(A)横断面未增强图像;(B)冠状重建图像。第一行表示早期阶段,第二行表示进展期阶段,第三行表示峰值期阶段,最后一行表示吸收期阶段。
图3:提出的人工智能模型对肺病变的分割结果和相应的3D肺病变重建结果。
图4:三种特征选择方法中各特征的权重。动态3D-影像组学特征包括结构、形状、强度特征,临床特征包括年龄、性别、发病时间、进展时间。(A)RF-FS 选择方法;(B)Relief-F特征选择方法;(C)LLCFS特征选择方法。
图5:(A)COVID-19分期与发病时间的关系(以天为单位);(B)COVID-19分期与病变/肺体积比值的关系。
图6:归一化混淆矩阵和四分类的ROC曲线,在ROC曲线中,红点曲线表示整体平均曲线下面积(AUC)。(A)RF分类器;(B)SVM分类器。
图7:第(3)部分数据中研究人群的纳入和排除标准流程图。
图8:三种AI算法所使用的三个部分的数据,并且与图1相关的患者中,每个部分的数据按4:1的比例划分患者个数。
图9:SCOAT-Net结构用于COVID-19患者CT图像的肺和病变分割。
SCOAT-Net对Unet++的结构进行了重新设计,引入了由通道注意模块和空间注意模块组成的注意学习机制。
图10:使用9个不同视角(从每个视图提取纹理特征)对COVID-19患者的三维病变进行分解。
图11:三种特征选择方法分别对应训练集中的每个机器学习分类器。(A)RF 分类器,(B)SVM分类器,(C)KNN分类器。
具体实施方式
本发明所用原料与设备均为已知产品,通过购买市售产品所得。
1、COVID-19患者数据来源与预处理
本发明实施例采用的COVID-19患者数据分为3个部分,分别来自于:
第(1)部分数据:收集170例COVID-19患者的5750张CT片,来自两个公共数据集的、医生已经标注肺边界的CT图像;
第(2)部分数据:收集来自湘雅第二医院的共19例患者,共1117张 CT图像;
第(3)部分数据:收集来自某医院,共331例患者(包含1023例CT扫描及临床数据),于2020年1月1日至2020年3月9日在整个治疗过程中连续行胸部CT检查的图像。
上述3个部分的数据分别按照4:1的比例随机划分为训练集和测试集。
根据2019年《新型冠状病毒肺炎影像学辅助诊断指南》,上述3个部分数据中的CT图像均由两名分别有14年及31年工作经验的放射科医生进行标记,这两名医生对临床数据一无所知。
数据预处理:使用固定肺窗[-1200,0]对所有原始CT图像进行调整,并将其归一化到范围[0,255]。没有使用任何的缩放技术,所有的CT图像都是相同大小的512×512像素。
2、第(3)部分中的331例患者的基本信息
331例COVID-19患者的1023次CT扫描被纳入分期数据集。如表1所示,就诊时最常见的症状是咳嗽(331例中225例[70%])和发烧(331例中220 例[67%])。表2显示多数实验室结果正常,少数升高。c-反应蛋白水平、d- 二聚体水平和红细胞沉降率在所有四个阶段均升高,并在第三阶段达到峰值。此外,乳酸脱氢酶水平和血清肌酐水平仅在第三阶段增加。四个阶段的发病时间差异明显,分别为4.4±6.1、11.0±7.1、15.4±8.3和26.3±12.0天。
3、四个阶段的CT图像判断标准
根据CT图像可以将COVID-19分为早期、进展期、峰值期和吸收期四个阶段(图2)。①早期胸部表现往往不典型,病变呈淡薄斑片状磨玻璃密度影 (groundglassopacity,GGO),多局限性、散在分布于两中下肺野,主要见于胸膜下。②进展期病灶多发,表现为GGO渗出、融合或伴有实变,以双肺野中外带分布多见,可伴少量胸腔积液。③峰值期(危重症)相当于疾病晚期,双肺密度弥漫性、广泛性进一步增高,称为“白肺”。此期病灶发展迅速,48h可增加50%以上,治疗困难,患者死亡率较高。④吸收期,病灶缩小或吸收,部分病例可见肺间质纤维化改变。
实施例1、构建用于判断COVID-19分期的基于人工智能的CT图像动态3D 影像组学系统的方法
I、构建方法
本实施例构建用于判断COVID-19分期的基于人工智能的CT图像动态3D影像组学系统的方法包括以下步骤:
(一)、建立肺与病变分割模型
使用第(1)和第(2)部分数据训练基于空间和通道的粗-细注意网络 (SCOAT-Net)的两个分割模型。SCOAT-Net是一种新颖的U-Net++架构,具有面向通道的注意模块和面向空间的注意模块,用于吸引网络的自注意学习,用于在通道级和像素级成功分割目标区域(图9)。
肺与病变分割模型建立参数设置:本发明的肺和病变分割模型基于 Pytorch框架,使用随机梯度下降法(SGD)优化骰子系数损失函数(DICE);网络参数初始化使用何恺明方法;模型训练的迭代次数设为100,初始学习率为0.01,每10次迭代乘以0.1。最终选择经过100个训练周期的模型作为分割模型。
首先,利用第(1)部分数据在上述参数设置下对肺分割网络SCOAT-Net 进行训练和测试,利用第(2)部分数据在上述参数设置下对病变分割网络 SCOAT-Net进行训练和测试。然后,用训练好的肺分割网络和病变分割网络对第(3)部分数据的肺和病灶进行分割。接下来,基于肺和病变分割结果重建三维肺病变。关于分割的代码可以在https://github.com/Phanzsx/SCOAT-Net 上找到。
肺分割网络和病变分割网络对第(1)部分和第(2)部分数据的分割性能如表7所示。分割和重构结果如图3所示。
(二)、特征提取与特征选择
1、特征提取
影像组学特征提取:首先在重建的三维肺病变的基础上提取常见的影像组学(强度特征);然后将三维肺病变分解为9个固定视图切片(图10),在每个切片上提取共同的影像组学(纹理特征);同时加入肺体积、病变体积、病变肺体积比作为形状特征。总之,先提取了314个常规三维影像组学特征,包括3个形状特征、14个强度特征、297个纹理特征。此外,考虑到放射科医师在评估分期时会考虑肺的变化,本发明还将两个相邻CT扫描的常规3D特征的变化值作为动态3D影像组学特征。
临床特征提取:除了影像组学特征外,本发明还结合了4个临床特征,包括年龄、性别、发病时间、进展时间。其中,发病时间(以天为单位)表示症状出现后的时间,进展时间(以天为单位)为两次相邻CT扫描之间的时间间隔。患者第一次CT扫描时,将动态3D特征和进展时间设置为0。
此处总共提取了632个特征,包括628个影像组学特征和4个临床特征 (表6,第1栏)。
2、特征选择
在特征选择方面,本发明首先基于训练集使用了三种特征选择方法,即随机森林(RF-FS),Relief-F,基于局部学习的聚类特征选择(LLCFS)。这三种特征选择方法的代码可以从FEATURE SELECTION TOOLBOX v6.2中调用。
(三)、建立分期判断模型及分类器选择
在matlab软件上实现分期过程:特征选择后,以选择后的影像组学特征和临床特征作为输入,基于训练集使用matlab自带的机器学习分类器来训练分期模型。此处matlab自带的机器学习分类器分别为随机森林分类器(RF 分类器)、支持向量机分类器(SVM分类器)、K近邻分类器(KNN分类器) 中的一种。关于分期的代码可以在 https://github.com/Phanzsx/Assess-the-COVID-19上找到。
基于测试集评估训练后的分期模型对COVID-19分期的判断效果。
本发明应用了六个指标来评估分割和分期性能。利用骰子相似系数(DSC) 和交并比(IOU)对分割性能进行评价。使用准确度、灵敏度、特异性和接受者工作特征曲线下面积(AUC)来评价分类器的性能。此外,采用t检验对独立组间的差异进行检验,采用双侧p值<0.05认为有统计学意义。
II、结果分析
1、分割结果和选择的特征
肺分割网络和病变分割网络对第(1)部分和第(2)部分数据的分割性能如表7所示。本发明利用训练好的分割模型对第(3)部分数据的肺和病变进行分割,然后重建三维肺病变,提取影像组学特征,分割和重构结果如图 3所示。
在使用不同的特征选择方法时,632个特征的权重分配如表6,然后对这些特征进行降序排序。每个分类器选择最高准确率时的n,n为特征数,准确率为训练集上十折交叉验证结果(图11)。最后,对于每个分类器进行四个时期单独分类时,根据最大的准确率获得最优特征数量的最优特征选择方法。这部分关于特征排序和特征选择的过程只在训练集上实现。
表6结果表明,三种特征选择方法中,每种方法都可以对这些特征进行不同的排序。此外,本发明计算了不同类型特征的权重之和(图4),发现动态 3D影像组学特征和临床特征都是训练集阶段评估的重要因素。本发明还根据权重列出了每种特征选择方法的前30个特征项,发现一些特征(发病时间、年龄、强度特征)同样显著(表3、8-9)。比较三种特征选择方法后,决定采用随机森林(RF-FS)这一特征选择方法。
在对这些特征排序后,每个分类器选择最前面的n(1≤n≤632)个特征,在训练集上使用十倍交叉验证计算准确率。最后,如表10所示,对于每个分类器获得了具有最优特征数量的最优特征选择方法。RF-FS特征选择方法的前 30个特征项列于表3。我们发现,排在前两位的特征项是发病时间(表3)、病灶体积与肺体积之比(图5)。四个阶段病灶体积与肺体积之比为2.2%±3.6%、 14.8%±14.1%、46.0%±16.5%和7.8%±9.5%。
2、COVID-19分期判断结果
以两个相邻CT扫描的选择后的影像组学特征和临床特征作为输入,在训练集上训练分期模型,然后使用训练后的分期模型在测试集上评估分期性能。结果如表4所示。此外,考虑到KNN分类器在准确率上表现不佳,本发明仅使用RF和SVM分类器进行详细分析。更具体地说,本发明计算了四种两分类(第1阶段/阶段2-3-4,第2阶段/阶段1-3-4,第3阶段/阶段1-2-4,第4阶段/阶段1-2-3)在测试集上的准确性、敏感性和特异性,还计算了测试集上的混淆矩阵和ROC曲线。结果如表5、图6所示。
从表5和图6可以看出,这RF和SVM分类器在准确性、特异性和AUC 指标方面取得了相当的性能。然而,RF和SVM分类器在灵敏度方面表现不同。具体来说,吸收阶段RF分类器优于SVM分类器,早期SVM分类器优于RF分类器。此外,本发明发现这两个分类器对峰值阶段都能达到100%的灵敏度。基于上述结果,所有分类器的诊断效率都是相当可观的。更具体地说,RF分类器在总准确率方面最有效(90%)。与RF分类器相比,SVM分类器在早期诊断时灵敏度最高。
实施例2、用于判断COVID-19分期的基于人工智能的CT图像动态3D影像组学系统(以RF分类器建立分期判断模型)
本实施例用于判断COVID-19分期的系统包括以下三个模块:
(一)输入模块
在输入模块输入训练集COVID-19患者的影像组学特征和临床特征,所述影像组学特征和临床特征为表3所示的30个特征。
特征的提取方法同实施例1。
(二)分期判断模型建立模块
以模块(一)中的影像组学特征和临床特征作为输入,利用matlab自带的机器学习分类器——RF分类器训练模型,得到训练后的分期判断模型。
(三)分期判断及结果输出模块
以测试集COVID-19患者的影像组学特征和临床特征(表3所示的30个特征)作为输入,利用模块(二)得到的训练后的分期判断模型进行分期判断,输出判断结果。
实施例3、用于判断COVID-19分期的基于人工智能的CT图像动态3D影像组学系统(以SVM分类器建立分期判断模型)
本实施例用于判断COVID-19分期的系统包括以下三个模块:
(一)输入模块
在输入模块输入测试集COVID-19患者的影像组学特征和临床特征,所述影像组学特征和临床特征为表3所示的第1~17个特征。
特征的提取方法同实施例1。
(二)分期判断模型建立模块
以模块(一)中的影像组学特征和临床特征作为输入,利用matlab自带的机器学习分类器——SVM分类器训练模型,得到训练后的分期判断模型。
(三)分期判断及结果输出模块
以测试集COVID-19患者的影像组学特征和临床特征(表3所示的第1~17 个特征)作为输入,利用模块(二)得到的训练后的分期判断模型进行分期判断,输出判断结果。
表1~表10如下所示:
表1:患者的临床特征
Figure RE-GDA0003934830330000081
表2:患者的实验室结果
Figure RE-GDA0003934830330000082
Figure RE-GDA0003934830330000091
注:白细胞、嗜中性粒细胞、淋巴细胞的单位是G/L;C反应蛋白、D-二聚体的单位是mg/L;丙氨酸氨基转氨酶、门冬氨酸氨基转氨酶、乳酸脱氢酶的单位是U/L;血尿素氮的单位是mmol/L;血肌酐、血尿酸的单位是μmol/L;血沉的单位是mm/h;发病时间以天为单位。
表3:使用随机森林特征选择方法(RF-FS),权重排序位于前30个的特征
Figure RE-GDA0003934830330000092
Figure RE-GDA0003934830330000101
表4:用训练集和测试集上的三个机器学习分类器的准确率决定最优特征选择方法和特征数量
Figure RE-GDA0003934830330000102
表5:RF、SVM分类器在测试集上的性能指标
Figure RE-GDA0003934830330000103
表6:三种特征选择方法中详细的动态3D影像组学特征和4种临床特征的权重
Figure RE-GDA0003934830330000111
Figure RE-GDA0003934830330000121
Figure RE-GDA0003934830330000131
Figure RE-GDA0003934830330000141
Figure RE-GDA0003934830330000151
Figure RE-GDA0003934830330000161
Figure RE-GDA0003934830330000171
Figure RE-GDA0003934830330000181
Figure RE-GDA0003934830330000191
Figure RE-GDA0003934830330000201
Figure RE-GDA0003934830330000211
Figure RE-GDA0003934830330000221
Figure RE-GDA0003934830330000231
Figure RE-GDA0003934830330000241
Figure RE-GDA0003934830330000251
Figure RE-GDA0003934830330000261
Figure RE-GDA0003934830330000271
表7:肺和病变分割数据集的分割性能
Figure RE-GDA0003934830330000272
注:DSC表示骰子相似系数,IOU表示交并比。
表8:使用Relief-F特征选择方法,权重排序位于前30个的特征
Figure RE-GDA0003934830330000281
表9:使用LLCFS特征选择方法,权重排序位于前30个的特征
Figure RE-GDA0003934830330000282
Figure RE-GDA0003934830330000291
表10:在训练集上使用十倍交叉验证的三个分类器准确率决定了最优特征选择方法和特征数量
分类器 特征选择方法 特征数量 十倍交叉验证的准确率
RF RF-FS 30 0.8916
SVM RF-FS 17 0.8592
KNN RF-FS 176 0.8153
综上,本发明提供了一种用于判断COVID-19分期的人工智能系统,属于人工智能领域。实验结果表明,利用本发明基于人工智能的CT图像动态3D影像组学系统对66例COVID-19患者进行COVID-19分期判断,准确率达90%。对于每个阶段的预测,阶段1(即早期)的AUC为0.965(95% CI:0.934, 0.997),阶段2(即进展期)的AUC为0.958(95% CI:0.931,0.984),阶段3 (即峰值期)的AUC为0.998(95% CI:0.994,1.000),阶段4(即吸收期)的 AUC为0.975(95% CI:0.956,0.994)。因此,本发明提供的基于人工智能的 CT图像动态3D影像组学系统能够有效对COVID-19患者进行分期判断,可作为一种潜在的工具,帮助医院进行合理的资源配置并制定合适的治疗计划,应用前景广阔。

Claims (10)

1.一种用于判断COVID-19分期的人工智能系统,其特征在于:所述人工智能系统包括以下模块:
(一)输入模块
在输入模块输入COVID-19患者的影像组学特征和临床特征;
(二)分期判断模型建立模块
以训练集COVID-19患者的影像组学特征和临床特征作为输入,利用matlab自带的机器学习分类器训练模型,得到训练后的分期判断模型;
(三)分期判断及结果输出模块
以测试集COVID-19患者的影像组学特征和临床特征作为输入,利用训练后的分期判断模型进行分期判断,输出判断结果。
2.根据权利要求1所述的人工智能系统,其特征在于:所述影像组学特征是通过以下方法提取的:利用训练集COVID-19患者的CT图像对肺分割网络SCOAT-Net进行训练和测试,对病变分割网络SCOAT-Net进行训练和测试,建立肺与病变分割模型;利用肺与病变分割模型对测试集COVID-19患者的CT图像进行肺与病变分割,并基于肺与病变分割结果重建三维肺病变;在重建的三维肺病变的基础上提取影像组学特征;
所述临床特征包括年龄、性别、发病时间、进展时间中的一种或多种。
3.根据权利要求2所述的人工智能系统,其特征在于:所述建立肺与病变分割模型时的参数设置如下:基于Pytorch框架,使用随机梯度下降法优化骰子系数损失函数;网络参数初始化使用何恺明方法;模型训练的迭代次数设为100,初始学习率为0.01,每10次迭代乘以0.1;最终选择经过100个训练周期的模型作为分割模型。
4.根据权利要求2所述的人工智能系统,其特征在于:所述影像组学特征和临床特征是通过以下方法获得的:将提取的影像组学特征和临床特征利用特征选择方法选择后,按照权重由高到底依次排序,选取权重排序靠前的特征;所述特征选择方法选自RF-FS、Relief-F或LLCFS,优选为RF-FS。
5.根据权利要求4所述的人工智能系统,其特征在于:所述权重排序靠前的特征为第1~30个特征中的一个或多个,优选为第1~30个特征或第1~17个特征。
6.根据权利要求1~5任一项所述的人工智能系统,其特征在于:所述影像组学特征和临床特征包括以下30个特征中的一个或多个:发病时间、病灶与肺体积之比、纹理第八视角-自相关系数、进展时间、纹理第五视角-行程百分比、年龄、纹理第七视角-行程百分比、强度-中值、强度-交叉熵、强度-偏度、强度-均匀性、纹理第八视角-相关性的信息测量2、肺区域面积、纹理第四视角-聚类突出系数、纹理第四视角-最大概率、强度-标准差、纹理第七视角-归一化逆差分矩、强度-平均绝对偏差、纹理第四视角-能量、强度-方差、纹理第三视角-聚类突出系数、纹理第四视角-方差、纹理第四视角-差分熵、纹理第四视角-对比度、纹理第五视角-行程长度不均匀性、纹理第九视角-行程长度不均匀性、纹理第八视角-行程长度不均匀性、纹理第九视角-聚类突出系数、纹理第七视角-行程长度不均匀性、纹理第八视角-对比度;
和/或,所述matlab自带的机器学习分类器选自RF分类器、SVM分类器、或KNN分类器;
和/或,所述COVID-19分期为早期、进展期、峰值期或吸收期。
7.根据权利要求6所述的人工智能系统,其特征在于:所述matlab自带的机器学习分类器为RF分类器,所述影像组学特征和临床特征为以下30个特征:发病时间、病灶与肺体积之比、纹理第八视角-自相关系数、进展时间、纹理第五视角-行程百分比、年龄、纹理第七视角-行程百分比、强度-中值、强度-交叉熵、强度-偏度、强度-均匀性、纹理第八视角-相关性的信息测量2、肺区域面积、纹理第四视角-聚类突出系数、纹理第四视角-最大概率、强度-标准差、纹理第七视角-归一化逆差分矩、强度-平均绝对偏差、纹理第四视角-能量、强度-方差、纹理第三视角-聚类突出系数、纹理第四视角-方差、纹理第四视角-差分熵、纹理第四视角-对比度、纹理第五视角-行程长度不均匀性、纹理第九视角-行程长度不均匀性、纹理第八视角-行程长度不均匀性、纹理第九视角-聚类突出系数、纹理第七视角-行程长度不均匀性、纹理第八视角-对比度。
8.根据权利要求6所述的人工智能系统,其特征在于:所述matlab自带的机器学习分类器为SVM分类器,所述影像组学特征和临床特征为以下17个特征:发病时间、病灶与肺体积之比、纹理第八视角-自相关系数、进展时间、纹理第五视角-行程百分比、年龄、纹理第七视角-行程百分比、强度-中值、强度-交叉熵、强度-偏度、强度-均匀性、纹理第八视角-相关性的信息测量2、肺区域面积、纹理第四视角-聚类突出系数、纹理第四视角-最大概率、强度-标准差、纹理第七视角-归一化逆差分矩。
9.权利要求1~8任一项所述的人工智能系统在制备用于判断COVID-19分期的设备中的用途。
10.一种用于判断COVID-19分期的计算机设备,其特征在于:所述计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序为权利要求1~8任一项所述的用于判断COVID-19分期的人工智能系统。
CN202210968551.1A 2021-08-13 2022-08-12 一种用于判断covid-19分期的基于人工智能的ct图像动态3d影像组学系统 Pending CN115482923A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2021109325460 2021-08-13
CN202110932546 2021-08-13

Publications (1)

Publication Number Publication Date
CN115482923A true CN115482923A (zh) 2022-12-16

Family

ID=84421213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210968551.1A Pending CN115482923A (zh) 2021-08-13 2022-08-12 一种用于判断covid-19分期的基于人工智能的ct图像动态3d影像组学系统

Country Status (1)

Country Link
CN (1) CN115482923A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116434960A (zh) * 2023-06-13 2023-07-14 中国人民解放军总医院 一种心源性休克临床决策支持系统、设备及可存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116434960A (zh) * 2023-06-13 2023-07-14 中国人民解放军总医院 一种心源性休克临床决策支持系统、设备及可存储介质
CN116434960B (zh) * 2023-06-13 2023-10-13 中国人民解放军总医院 一种心源性休克临床决策支持系统、设备及可存储介质

Similar Documents

Publication Publication Date Title
Fang et al. CT radiomics can help screen the coronavirus disease 2019 (COVID-19): a preliminary study
Chen et al. Performance comparison of artificial neural network and logistic regression model for differentiating lung nodules on CT scans
Bouchareb et al. Artificial intelligence-driven assessment of radiological images for COVID-19
Sahiner et al. Effect of CAD on radiologists' detection of lung nodules on thoracic CT scans: analysis of an observer performance study by nodule size
Wang et al. Multilevel binomial logistic prediction model for malignant pulmonary nodules based on texture features of CT image
Ferreira et al. Characterization of pulmonary nodules based on features of margin sharpness and texture
Zokaeinikoo et al. AIDCOV: an interpretable artificial intelligence model for detection of COVID-19 from chest radiography images
US20230368515A1 (en) Similarity determination apparatus, similarity determination method, and similarity determination program
JP6914233B2 (ja) 類似度決定装置、方法およびプログラム
Zhou et al. Radiomics from primary tumor on dual-energy CT derived iodine maps can predict cervical lymph node metastasis in papillary thyroid cancer
Nurmaini et al. Automated Detection of COVID-19 Infected Lesion on Computed Tomography Images Using Faster-RCNNs.
Hoang-Thi et al. Deep learning for lung disease segmentation on CT: Which reconstruction kernel should be used?
CN115482923A (zh) 一种用于判断covid-19分期的基于人工智能的ct图像动态3d影像组学系统
Sahu et al. DCNN-SVM: A new approach for lung cancer detection
Canario et al. Using artificial intelligence to risk stratify COVID-19 patients based on chest X-ray findings
Junior et al. A general fully automated deep-learning method to detect cardiomegaly in chest x-rays
Rehman Khan et al. Cloud‐Based Framework for COVID‐19 Detection through Feature Fusion with Bootstrap Aggregated Extreme Learning Machine
Jiang et al. Classification of benign and malignant breast cancer based on DWI texture features
Zhu et al. Adoption of computerized tomography images in detection of lung nodules and analysis of neuropeptide correlative substances under deep learning algorithm
Allioui et al. Strong semantic segmentation for Covid-19 detection: Evaluating the use of deep learning models as a performant tool in radiography
Li et al. Tree-structured subgroup analysis of receiver operating characteristic curves for diagnostic tests
CN111436215A (zh) 用于医学成像评估的深度学习的应用
CN114141360A (zh) 基于惩罚cox回归的乳腺癌预测方法
Hernández et al. Algorithms and methods for computerized analysis of mammography images in breast cancer risk assessment
Cherezov et al. Rank acquisition impact on radiomics estimation (AсquIRE) in chest CT imaging: A retrospective multi-site, multi-use-case study

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination