CN117766123A - 基于ct影像组学特征序列的辅助诊断方法 - Google Patents
基于ct影像组学特征序列的辅助诊断方法 Download PDFInfo
- Publication number
- CN117766123A CN117766123A CN202310502018.0A CN202310502018A CN117766123A CN 117766123 A CN117766123 A CN 117766123A CN 202310502018 A CN202310502018 A CN 202310502018A CN 117766123 A CN117766123 A CN 117766123A
- Authority
- CN
- China
- Prior art keywords
- image
- features
- histology
- radiological
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000003745 diagnosis Methods 0.000 title claims abstract description 31
- 238000013145 classification model Methods 0.000 claims abstract description 21
- 238000004458 analytical method Methods 0.000 claims abstract description 6
- 210000002569 neuron Anatomy 0.000 claims description 6
- 238000003384 imaging method Methods 0.000 claims description 3
- 238000002591 computed tomography Methods 0.000 description 43
- 239000010410 layer Substances 0.000 description 38
- 230000003902 lesion Effects 0.000 description 11
- 238000012360 testing method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000000052 comparative effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 201000005249 lung adenocarcinoma Diseases 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000005251 gamma ray Effects 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000003325 tomography Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Image Processing (AREA)
Abstract
本发明属于医学影像辅助诊断模型技术领域,具体涉及一种基于CT影像组学特征序列的辅助诊断方法。一种基于CT影像组学特征序列的辅助诊断方法,包括:获取CT影像,对CT影像中的每张CT图像计算对应病灶区域的影像组学特征和放射组学特征,合并影像组学特征和放射组学特征并提取关键特征;按照病灶在CT影像中涉及的对应CT图像在序列中的排列顺序,将关键特征逐层连接构建成特征序列,形成序列数据集;将序列数据集输入预设的分类模型中进行分析,得到辅助诊断结果。本发明与放射科医生的常规胶片读取和诊断程序一致,本发明有效地降低模型的复杂性,提高模型和结果的可解释性。
Description
技术领域
本发明属于医学影像辅助诊断模型技术领域,具体涉及一种基于CT影像组学特征序列的辅助诊断方法。
背景技术
CT(Computed Tomography)影像,即电子计算机断层扫描,它是利用精确准直的X线束、γ射线、超声波等,与灵敏度极高的探测器一同围绕人体的某一部位作一个接一个的断面扫描,具有扫描时间快,图像清晰等特点,可用于多种疾病的检查。
放射科医生通常通过对CT影像图层连续滑动变换,通过经验知识分析图像纹理变化和层间聚焦区域的特征变化来寻找诊断证据,定位病灶区域和诊断的阅片过程。
另外,影像组学是一种具有发展前景且非常热门的诊断方法,通过借助数学和统计学的方法,高通量的从感兴趣区的影像数据中提取有特征性的空间数据,捕获可能被肉眼忽略的有价值的病灶信息,来提高疾病诊断的准确性,具有实时、客观、无创等优势。
但是,目前,基于CT影像的辅助诊断相关方法,大多是针对单张图像或者3D整体进行的分析决策。较难实现进一步发掘规则,且与放射科医生正确阅片逻辑有差异。
发明内容
本发明针对现有的CT影像的辅助诊断相关方法与放射科医生正确阅片逻辑有差异的技术问题,目的在于提供一种基于CT影像组学特征序列的辅助诊断方法。
一种基于CT影像组学特征序列的辅助诊断方法,包括:
获取CT影像,对所述CT影像中的每张CT图像计算对应病灶区域的影像组学特征和放射组学特征,合并所述影像组学特征和所述放射组学特征并提取关键特征;
按照病灶在所述CT影像中涉及的对应CT图像在序列中的排列顺序,将所述关键特征逐层连接构建成特征序列,形成序列数据集;
将所述序列数据集输入预设的分类模型中进行分析,得到辅助诊断结果。
作为优选方案,所述CT图像为已对病灶标注的CT图像。
作为优选方案,所述合并所述影像组学特征和所述放射组学特征并提取关键特征,包括:
将所述影像组学特征和所述放射组学特征的分类数据转换为数字数据;
通过最小冗余最大相关性方法选择前若干个特征作为所述关键特征。
作为优选方案,选择前50个特征作为所述关键特征。
作为优选方案,所述合并所述影像组学特征和所述放射组学特征并提取关键特征之前,包括:
计算所有所述放射组学特征的方差,删除方差结果小于第一预设值的所述放射组学特征。
作为优选方案,所述计算所有所述放射组学特征的方差,删除方差结果小于第一预设值的所述放射组学特征之后,还包括:
计算剩余所述放射组学特征的相关性强度,删除绝对值大于第二预设值的所述放射组学特征;
将剩余的所述放射组学特征与所述影像组学特征进行合并。
作为优选方案,所述分类模型包括依次连接的:
一Bi-LSTM层;
一多头注意力模型。
作为优选方案,所述分类模型还包括连接在所述多头注意力模型之后的:
一展平网络;
一分类器。
作为优选方案,所述展平网络包括:
一展平层;
若干层全连接层。
作为优选方案,所述全连接层为三层,三层所述全连接层的神经元依次为128、64和32。
本发明的积极进步效果在于:本发明采用基于CT影像组学特征序列的辅助诊断方法,具有如下优点:
1、本发明的方法与放射科医生的常规胶片读取和诊断程序一致,本发明有效地降低模型的复杂性,提高模型和结果的可解释性。同时,本发明的结果也可能为诊断决策规则的挖掘和可解释性提供便利。
2、本发明将影像组学特征和放射组学特征进行合并,通过分析病变CT图像中放射学和放射组学特征的变化规律,结合分类模型,对基于CT影像的疾病诊断有积极作用。
3、本发明的分类模型采用基于Bi-LSTM层和多头注意力的模型,基于Bi-LSTM层可以准确地学习病变连续层CT图像中所选放射组学特征的变化规律,利用多头注意力增强了变化规则序列的学习能力,使模型参数具有更好的泛化能力,可以减少过拟合。
附图说明
图1为本发明的一种方法流程图;
图2为本发明的分类模型结构示意图;
图3(a)为本发明在训练集中的ROC图;
图3(b)为本发明在测试集中的ROC图;
图3(c)为本发明在验证集中的ROC图;
图3(d)为对比例1在测试集中的ROC图;
图3(e)为对比例2在测试集中的ROC图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示进一步阐述本发明。
参照图1,本发明提供一种基于CT影像组学特征序列的辅助诊断方法,包括如下步骤:
S100,关键特征的提取:获取CT影像,对CT影像中的每张CT图像计算对应病灶区域的影像组学特征和放射组学特征,合并影像组学特征和放射组学特征并提取关键特征。
通常,疾病CT影像是连续图层组合的CT图像序列组,因此其具有若干张CT图像,且这些CT图形具有排列顺序。在计算影像组学特征和放射组学特征时,可以按CT图形在序列中的排列顺序依次进行计算。
在一些实施例中,本步骤中的CT图像为已对病灶标注的CT图像。
在对病灶进行标注时,可以采用自动标注方式。例如采用现有的开源分割代码实现在CT图形中对病灶的自动标注。
在对病灶进行标注时,也可也采用手动标注方式。例如病灶为肺腺癌病灶区域,通过放射科医生在三个正交平面(轴向、冠状面和矢状面)上逐片人工手动标注而成。
在一些实施例中,在对CT图像计算对应病灶区域的影像组学特征时,可以采用“PyRadiomics”开源Python函数包计算对应病灶区域的影像组学特征。
在一些实施例中,在对CT图像计算对应病灶区域的放射组学特征时,可以采用“SlicerRadiomics”开源Python函数包计算对应病灶区域的放射组学特征。
在一些实施例中,步骤S100中合并影像组学特征和放射组学特征并提取关键特征,包括:
将影像组学特征和放射组学特征的分类数据转换为数字数据。通过最小冗余最大相关性(mRMR)方法选择前若干个特征作为关键特征。
由于影像组学特征和放射组学特征是两种类型的特征,同时,放射学特征属于分类特征。如果用一个热代码表示,这些特征数据的结构过于稀疏,为了实现两者的合并,减少成像特征对整体特征集的影响,本实施例将影像组学特征和放射组学特征的分类数据均转换为数字数据后再进行两者的合并,并在合并之后还进行了特征筛选。
在进行数据转换时优选采用在“category_encoders”包内的“leaveeoneoutencoder”方法。category_encoders是一个用于类别数据编码(转换为数值数据)的python包。该包是各种编码方法的集合,使用者可以根据需要将其应用于各种分类数据。
由于合并后的数字数据较为庞大繁杂且稀疏,因此本实施例还通过mRMR方法,按照重要性排序选择前若干个特征作为关键特征。
在一些实施例中,通过mRMR方法,按照重要性排序选择前50个特征作为关键特征。
在一些实施例中,前50个特征可以为如下表中的关键特征:
在一些实施例中,步骤S100中合并影像组学特征和放射组学特征并提取关键特征之前,包括:
计算所有放射组学特征的方差,删除方差结果小于第一预设值的放射组学特征,将剩余的放射组学特征与影像组学特征进行合并。
本实施例中的第一预设值优选为1,即计算所有放射组学特征的方差,删除方差结果小于1的放射组学特征,将剩余的放射组学特征与影像组学特征进行合并。
在一些实施例中,在计算所有放射组学特征的方差,删除方差结果小于1的放射组学特征之后,将剩余的放射组学特征与影像组学特征进行合并之前还包括:
计算剩余放射组学特征的相关性强度,删除绝对值大于第二预设值的所放射组学特征,将剩余的放射组学特征与影像组学特征进行合并。
本实施例中的第二预设值优选为0.9,即计算剩余放射组学特征的相关性强度,删除绝对值大于0.9的所放射组学特征,将剩余的放射组学特征与影像组学特征进行合并。
在一些实施例中,步骤S100具体包括:
S101,获取CT影像,该CT影像中包含对病灶标注的若干CT图像,对每张CT图像计算对应病灶区域的影像组学特征和放射组学特征;
S102,计算所有放射组学特征的方差,删除方差结果小于1的放射组学特征;
S103,计算剩余放射组学特征的相关性强度,删除绝对值大于0.9的所放射组学特征,将剩余的放射组学特征与影像组学特征进行合并;
S104,将影像组学特征和放射组学特征的分类数据转换为数字数据,通过mRMR方法选择前50个特征作为关键特征。
S200,根据图层顺序构建特征序列:按照病灶在CT影像中涉及的对应CT图像在序列中的排列顺序,将关键特征逐层连接构建成特征序列,形成序列数据集。
本步骤的方式是与放射科医生的常规胶片读取和诊断程序一致,这种方式有效地降低后续步骤S300中模型的复杂性,提高模型和结果的可解释性。
S300,模型分析:将序列数据集输入预设的分类模型中进行分析,得到辅助诊断结果。
本步骤中的分类模型是预先训练好的模型。
在一些实施例中,分类模型包括依次连接的Bi-LSTM层(Bi-directional long-short term memory,双向长短期记忆网络)和多头注意力模型(multi-head attention)。
本实施例通过Bi-LSTM层来尽可能多地提取连续CT图像层中特征的变化状态。Bi-LSTM层优选具有sigmoid激活函数,且隐藏层的大小为32,即:
units=32,activation=’sigmoid’
本实施例通过多头注意力模型来增强输出状态序列,利用多头注意力增强变化规则序列的学习能力,使模型参数具有更好的泛化能力,降低关注特定特征变化的风险,且可以减少过拟合。多头注意力模型优选设置8个头数(head),且可以调用现有的开源码,例如“keras_multi_head”开源Python函数包。
在一些实施例中,分类模型还包括连接在多头注意力模型之后的展平网络和分类器。
通过展平网络来展平序列,最后使用分类器输出辅助诊断结果。
在一些实施例中,展平网络包括展平层(flatten层)和若干层全连接层(DENSE层)。
本实施例通过flatten层拉伸后,经过多层DENSE层后连接分类器。
在一些实施例中,DENSE层优选为三层,三层DENSE层的神经元依次为128、64和32。
在一些实施例中,分类器为采用DENSE层代替,优选采用神经元为3的DENSE层代替。
在一些实施例中,参照图2,S300中的分类模型优选包括:
1)Bi-LSTM层,其中激活函数优选为sigmoid,隐藏层的大小优选为32;
2)多头注意力模型,其中头数优选设置为8;
3)flatten层;
4)三层DENSE层,神经元依次优选为128、64和32;
5)DENSE层,神经元为3。
在一些实施例中,获取肺腺癌CT影像,通过本发明的步骤S100和步骤S200之后获得序列数据集,将该序列数据集随机分成训练集、测试集和验证集。
本发明:基于Bi-LSTM层+多头注意力模型的分类模型;
对比例1:基于CNN网络+LSTM层的分类模型;
对比例2:基于LSTM层+多头注意力模型的分类模型;
采用上述不同的分类模型在训练集、测试集和验证集中的表现,表现结果如下表所示:
采用上述不同的分类模型在训练集、测试集和验证集中的ROC图参照图3(a)至图3(e)。
可见,本发明通过分析病变CT图像中放射学和放射组学特征的变化规律,开发了一个基于Bi-LSTM和多头注意力的模型来对CT图像进行辅助诊断。结果表明,本发明的分类模型在基于肺腺癌CT影像的辅助诊断中,表现出的较好的结果。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (10)
1.一种基于CT影像组学特征序列的辅助诊断方法,其特征在于,包括:
获取CT影像,对所述CT影像中的每张CT图像计算对应病灶区域的影像组学特征和放射组学特征,合并所述影像组学特征和所述放射组学特征并提取关键特征;
按照病灶在所述CT影像中涉及的对应CT图像在序列中的排列顺序,将所述关键特征逐层连接构建成特征序列,形成序列数据集;
将所述序列数据集输入预设的分类模型中进行分析,得到辅助诊断结果。
2.如权利要求1所述的基于CT影像组学特征序列的辅助诊断方法,其特征在于,所述CT图像为已对病灶标注的CT图像。
3.如权利要求1所述的基于CT影像组学特征序列的辅助诊断方法,其特征在于,所述合并所述影像组学特征和所述放射组学特征并提取关键特征,包括:
将所述影像组学特征和所述放射组学特征的分类数据转换为数字数据;
通过最小冗余最大相关性方法选择前若干个特征作为所述关键特征。
4.如权利要求3所述的基于CT影像组学特征序列的辅助诊断方法,其特征在于,通过最小冗余最大相关性方法选择前50个特征作为所述关键特征。
5.如权利要求3所述的基于CT影像组学特征序列的辅助诊断方法,其特征在于,所述合并所述影像组学特征和所述放射组学特征并提取关键特征之前,包括:
计算所有所述放射组学特征的方差,删除方差结果小于第一预设值的所述放射组学特征。
6.如权利要求5所述的基于CT影像组学特征序列的辅助诊断方法,其特征在于,所述计算所有所述放射组学特征的方差,删除方差结果小于第一预设值的所述放射组学特征之后,还包括:
计算剩余所述放射组学特征的相关性强度,删除绝对值大于第二预设值的所述放射组学特征;
将剩余的所述放射组学特征与所述影像组学特征进行合并。
7.如权利要求1至6中任意一项所述的基于CT影像组学特征序列的辅助诊断方法,其特征在于,所述分类模型包括依次连接的:
一Bi-LSTM层;
一多头注意力模型。
8.如权利要求7所述的基于CT影像组学特征序列的辅助诊断方法,其特征在于,所述分类模型还包括连接在所述多头注意力模型之后的:
一展平网络;
一分类器。
9.如权利要求8所述的基于CT影像组学特征序列的辅助诊断方法,其特征在于,所述展平网络包括:
一展平层;
若干层全连接层。
10.如权利要求9所述的基于CT影像组学特征序列的辅助诊断方法,其特征在于,所述全连接层为三层,三层所述全连接层的神经元依次为128、64和32。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310502018.0A CN117766123A (zh) | 2023-05-06 | 2023-05-06 | 基于ct影像组学特征序列的辅助诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310502018.0A CN117766123A (zh) | 2023-05-06 | 2023-05-06 | 基于ct影像组学特征序列的辅助诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117766123A true CN117766123A (zh) | 2024-03-26 |
Family
ID=90324270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310502018.0A Pending CN117766123A (zh) | 2023-05-06 | 2023-05-06 | 基于ct影像组学特征序列的辅助诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117766123A (zh) |
-
2023
- 2023-05-06 CN CN202310502018.0A patent/CN117766123A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111563523B (zh) | 利用机器训练的异常检测的copd分类 | |
EP4102455A1 (en) | Multi-modal medical image processing | |
Li et al. | Investigation of new psychophysical measures for evaluation of similar images on thoracic computed tomography for distinction between benign and malignant nodules | |
EP3654343A1 (en) | Application of deep learning for medical imaging evaluation | |
CN109791804B (zh) | 对cad系统个性化以提供cad系统推荐的置信水平指示的方法和部件 | |
US20030103663A1 (en) | Computerized scheme for distinguishing between benign and malignant nodules in thoracic computed tomography scans by use of similar images | |
US20220076829A1 (en) | Method and apparatus for analyzing medical image data in a latent space representation | |
Xu et al. | Pulmonary textures classification via a multi-scale attention network | |
US20070223807A1 (en) | Medical imaging visibility index system and method for cancer lesions | |
Ren et al. | Controllable medical image generation via GAN | |
CN115206478A (zh) | 医学报告生成方法以及装置、电子设备、可读存储介质 | |
Rajasenbagam et al. | Semantic content-based image retrieval system using deep learning model for lung cancer CT images | |
Dai et al. | More reliable AI solution: Breast ultrasound diagnosis using multi-AI combination | |
CN117523350A (zh) | 基于多模态特征的口腔影像识别方法、系统及电子设备 | |
Haritha et al. | Multi-modal Medical Data Fusion using Deep Learning | |
Bhavya et al. | Cervical spine fracture detection using pytorch | |
CN117766123A (zh) | 基于ct影像组学特征序列的辅助诊断方法 | |
CN115131279A (zh) | 通过深度学习模型的疾病分类 | |
Zahari et al. | Quantifying the Uncertainty in 3D CT Lung Cancer Images Classification | |
Sharma et al. | Image Classification of Various Lung Diseases Using Transfer Learning and Machine Learning Techniques | |
Lalitha et al. | Segmentation and Classification of 3D Lung Tumor Diagnoses Using Convolutional Neural Networks | |
Behnia et al. | Detection of COVID-19 Using a Pre-trained CNN Model Over Chest X-ray Images | |
US20240331872A1 (en) | System and method for detection of a heart failure risk | |
KR102208358B1 (ko) | 인공지능을 이용한 폐암진단 시스템, 폐암검진 ct 판독서버 및 폐암진단방법 | |
US20230334665A1 (en) | Learning device, learning method, learning program, and medical use image processing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |