CN116823818A - 基于三维影像组学特征的肺结节识别系统和方法 - Google Patents
基于三维影像组学特征的肺结节识别系统和方法 Download PDFInfo
- Publication number
- CN116823818A CN116823818A CN202311084858.6A CN202311084858A CN116823818A CN 116823818 A CN116823818 A CN 116823818A CN 202311084858 A CN202311084858 A CN 202311084858A CN 116823818 A CN116823818 A CN 116823818A
- Authority
- CN
- China
- Prior art keywords
- histology
- image
- dimensional image
- nodule
- dose
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000002685 pulmonary effect Effects 0.000 title claims abstract description 16
- 206010056342 Pulmonary mass Diseases 0.000 claims abstract description 64
- 230000011218 segmentation Effects 0.000 claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000012502 risk assessment Methods 0.000 claims abstract description 17
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 238000013135 deep learning Methods 0.000 claims abstract description 12
- 239000011159 matrix material Substances 0.000 claims description 26
- 208000009956 adenocarcinoma Diseases 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 17
- 239000005337 ground glass Substances 0.000 claims description 15
- 230000003211 malignant effect Effects 0.000 claims description 13
- 239000007787 solid Substances 0.000 claims description 12
- 239000000126 substance Substances 0.000 claims description 11
- 238000007477 logistic regression Methods 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 230000000877 morphologic effect Effects 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 5
- 238000010219 correlation analysis Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims description 3
- 238000010827 pathological analysis Methods 0.000 claims description 3
- 238000013178 mathematical model Methods 0.000 claims description 2
- 238000005457 optimization Methods 0.000 abstract description 7
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 11
- 201000005202 lung cancer Diseases 0.000 description 11
- 208000020816 lung neoplasm Diseases 0.000 description 11
- 238000012216 screening Methods 0.000 description 6
- 210000004072 lung Anatomy 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000004907 gland Anatomy 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 230000004791 biological behavior Effects 0.000 description 1
- 239000002872 contrast media Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000003748 differential diagnosis Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
- G06T7/41—Analysis of texture based on statistical description of texture
- G06T7/44—Analysis of texture based on statistical description of texture using image operators, e.g. filters, edge density metrics or local histograms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
- G06T7/41—Analysis of texture based on statistical description of texture
- G06T7/45—Analysis of texture based on statistical description of texture using co-occurrence matrix computation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/766—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/771—Feature selection, e.g. selecting representative features from a multi-dimensional feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
- G06V10/7753—Incorporation of unlabelled data, e.g. multiple instance learning [MIL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30061—Lung
- G06T2207/30064—Lung nodule
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
- G06V2201/031—Recognition of patterns in medical or anatomical images of internal organs
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Geometry (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Radiology & Medical Imaging (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Image Analysis (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本发明涉及基于三维影像组学特征的肺结节识别系统和方法,包括步骤:对获取的低剂量CT图像进行预处理;基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割,得到目标分割结果;基于目标分割结果对三维影像组学特征进行提取,将三维影像组学特征作为训练数据构建影像组学模型;将实时获取的低剂量CT图像输入影像组学模型,得到对应的三维影像组学特征,从而进行肺结节风险评估。本发明利用剂量优化和图像优化方案标准化处理的低剂量CT图像,针对不同密度类型的肺结节构建影像组学模型,实现肺结节识别和风险评估,有利于为患者制定分级管理策略。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种基于三维影像组学特征的肺结节识别系统和方法。
背景技术
目前,低剂量计算机断层扫描(computed tomography,CT)是肺癌筛查的首要手段,随着低剂量CT肺癌筛查技术的推广与普及,肺结节及早起肺癌的检出率越来越高。虽然低剂量CT对肺结节的检出具有高敏感性,但是大量结节的检出和过度、重复检查给肺癌筛查受检者带来了不必要的辐射剂量暴露、经济负担和焦虑情绪。
传统的肺结节影像学诊断和恶性概率评估主要依靠形态学特征(如形状、边缘、结节-肺界面、分叶、毛刺等)和测量学特征(如经线、体积、密度等)。形态学特征的判定主要依靠放射科医生的经验,由于不同地区、不同年资、不同亚专业的放射科医生对形态学特征的认识和解读存在差异,导致报告结果缺乏一致性。在测量学特征方面,国内外指南目前根据肺结节的密度和大小制定了相应的随访原则和分级管理策略,首先将肺结节分为实性结节和磨玻璃结节,然后根据结节直径阈值确定随访间隔和干预措施。但在根据结节大小确定分级管理方案时,各指南采用的结节直径阈值不尽相同,尤其是针对磨玻璃结节,缺乏统一的鉴别诊断和风险预测标准。原因在于前驱腺体病变、微浸润腺癌和浸润性腺癌都可以表现为磨玻璃结节,虽然密度特征相似,但是非浸润性腺癌(前驱腺体病变、微浸润腺癌)表现出惰性生物学行为、预后良好,而浸润性腺癌风险相对较高、预后较差。因此,依靠传统的形态学特征和测量学特征难以在临床实践中精准鉴别和预测具有相同特征但风险度不同的肺结节。
近年来医学图像处理技术和方法快速发展,其中影像组学方法可以从医学影像图像中高通量的提取大量的定量特征,目前已经广泛引用于肿瘤领域研究,在肿瘤良恶性鉴别、病理亚型、基因及分子分型、治疗方案选择、预后预测等方面。但在低剂量CT肺癌筛查领域尚存在以下问题:
(1)既往基于低剂量CT影像数据的肺结节影像组学研究主要集中于良恶性鉴别,未针对不同密度类型的肺结节分别建立影像组学预测模型,对肺结节和早起肺癌风险评估不够精准;
(2)所采用的影像数据多来源公共、多中心数据库,受试者的扫描参数和重建方法存在较大异质性,不仅会影响影像组学特征定量的鲁棒性,也会影响影像组学模型的泛化能力;
(3)上述低剂量CT图像采集方案设计历时已久,部分样本的扫描剂量高于目前国内外肺癌筛查指南的推荐值,由于剂量降低亦会影响影像组学特征定量的鲁棒性,既往的影像组学模型并不适用当前临床实践中采集的低剂量CT肺癌筛查数据。
因此,如何基于低剂量CT图像实现肺结节的精准识别是对肺癌风险预测的重要手段。
发明内容
本发明的目的在于实现自动精准的肺结节识别和风险评估,提供一种基于三维影像组学特征的肺结节识别系统和方法。
为了实现上述发明目的,本发明实施例提供了以下技术方案:
基于三维影像组学特征的肺结节识别系统,包括:
临床信息知识库模块,用于存储受检者胸部的低剂量CT图像以及临床信息;
图像预处理模块,用于对低剂量CT图像进行预处理;
肺结节自动识别和分割模块,用于基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割,得到目标分割结果;
影像组学特征提取模块,用于基于目标分割结果对三维影像组学特征进行提取,并将三维影像组学特征作为训练数据构建影像组学模型;
肺结节风险评估模块,用于通过影像组学模型对受检者的低剂量CT图像进行肺结节风险评估。
基于三维影像组学特征的肺结节识别方法,包括以下步骤:
步骤1,对获取的低剂量CT图像进行预处理;
步骤2,基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割,得到目标分割结果;
步骤3,基于目标分割结果对三维影像组学特征进行提取,将三维影像组学特征作为训练数据构建影像组学模型;
步骤4,将实时获取的低剂量CT图像输入影像组学模型,得到对应的三维影像组学特征,从而进行肺结节风险评估。
所述步骤1中,预处理包括依次进行的分辨率重建、灰度均值校正、灰度图像增强,或其中一种。
在上述方案中,由于低剂量CT图像获取时,因仪器或患者的呼吸状态等影像,可能会存在低剂量CT图像的图像质量不高,因此在识别和分割肺结节之前,对低剂量CT图像进行预处理,其中分辨率重建是建立高、低质量图像之间的数学关系来模拟图像降质过程,分辨率重建可以显著增强图像的画面质量;灰度均值校正可以减少或消除成像过程中产生的条纹现象;灰度图像增强能够改善图像的质量以及增强感兴趣部分。解决了所采用的影像数据多来源公共、多中心数据库,受试者的扫描参数和重建方法存在较大异质性的问题,如此提升了影像组学特征定量的鲁棒性,也提升了影像组学模型的泛化能力。
所述步骤2中,基于深度学习的全自动肺结节识别和分割软件为uAI Discover-Lung,基于深度学习的全自动肺结节识别和分割软件输出的信息包括每个肺结节的所在层号、位置、密度类型、大小、平均密度信息,其中密度类型为实性结节或磨玻璃结节,大小为最大长径、最大短径、体积。
所述步骤3中,三维影像组学特征包括形态特征、一阶特征、纹理特征,所述纹理特征包括灰度共生矩阵特征、灰度游程矩阵特征、灰度连通区域矩阵特征、灰度相关矩阵特征、局部灰度差分矩阵特征;
采用Z-score转换对提取的所有三维影像组学特征进行数据标准化处理:
其中,xs为标准化处理后的三维影像组学特征值,x为标准化处理前的三维影像组学特征值,为样本三维影像组学特征的平均值,/>为样本三维影像组学特征的标准差。
在上述方案中,既往基于低剂量CT影像数据的肺结节影像组学研究主要集中于良恶性鉴别,而本方案针对不同密度类型的肺结节建立影像组学预测模型,对肺结节和早起肺癌风险评估精准。
所述步骤3中,将三维影像组学特征作为训练数据构建影像组学模型的步骤,包括:
所有受试者的三维影像组学特征构成训练数据,按照7:3的比例划分为训练数据集、测试数据集,利用训练数据集构建影像组学模型;
首先进行三维影像组学特征的选择,采用无监督算法和有监督算法序贯串联运行的方式学习特征,再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型。
所述无监督算法包括斯皮尔曼系数相关分析、基于互信息的最大相关最小冗余算法;
斯皮尔曼系数相关分析计算秩统计参数Rs,计算方法为:
其中,x、y分别表示待分析相关性的变量序列对,n表示变量序列x和y的元素个数,i表示第i个元素;Oi表示变量序列x中第i个元素的秩次,Qi表示变量序列y中第i个元素的秩次;Rs表示秩统计参数;
基于互信息的最大相关最小冗余算法求取三维影像组学特征和目标类别之间的互信息以及三维影像组学特征之间的互信息:
其中,Sn表示具有n个三维影像组学特征的训练数据集,fi,fj∈Sn,c为目标类别集合;p(fi,c)为fi和c之间的联合概率密度,p(fi)为fi的概率密度,p(c)为c的概率密度;p(fi,fj)为fi和fj之间的联合概率密度,p(fj)为fj的概率密度;I为互信息函数,为邻域精度。
所述再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型的步骤,包括:
影像组学模型建立过程中将病理诊断的金标准结果作为二分类真实标签,其中实性结节分为良性和恶性,磨玻璃结节分为非浸润性腺癌和浸润性腺癌;影像组学模型输入的特征为三维影像组学特征,多因素逻辑回归方法的分类器为:
其中,P表示实性结节为恶性或磨玻璃结节为浸润性腺癌的概率值;为常数项;为标准化处理后的三维影像组学特征的系数,i∈n,xsi为标准化处理后的三维影像组学特征的值。
在上述方案中,针对不同密度类型的肺结节,三维影像组学特征的值xsi也不同,因此可以分别构建针对不同密度类型的肺结节的影像组学模型,对肺结节和早起肺癌风险评估精准。
与现有技术相比,本发明的有益效果:
本发明利用剂量优化和图像优化方案标准化处理的低剂量CT图像,针对不同密度类型的肺结节构建影像组学模型,实现肺结节识别和风险评估,有利于为患者制定分级管理策略,减少过度诊断和重复检查带来的不必要辐射剂量暴露、经济成本和心理负担。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明系统模块框图;
图2为本发明方法流程图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性,或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。另外,术语“相连”、“连接”等可以是元件之间直接相连,也可以是经由其他元件的间接相连。
实施例1:
本发明通过下述技术方案实现,如图1所示,一种基于三维影像组学特征的肺结节识别系统,包括:
临床信息知识库模块,用于存储受检者胸部的低剂量CT图像以及临床信息;
图像预处理模块,用于对低剂量CT图像进行预处理;
肺结节自动识别和分割模块,用于基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割,得到目标分割结果;
影像组学特征提取模块,用于基于目标分割结果对三维影像组学特征进行提取,并将三维影像组学特征作为训练数据构建影像组学模型;
肺结节风险评估模块,用于通过影像组学模型对受检者的低剂量CT图像进行肺结节风险评估。
基于上述系统,请参见图2,本发明还提出一种基于三维影像组学特征的肺结节识别方法,包括以下步骤:
步骤1,对获取的低剂量CT图像进行预处理。
从影像图片存档及通信系统(picture archiving and communication system,PACS)调用受检者年龄、性别信息,并存储在临床信息知识库模块中。从影像图片存档及通信系统中调取受检者胸部的低剂量CT图像,对低剂量CT图像进行预处理。
低剂量CT图像来自于飞利浦128排256层CT扫描仪(Brilliance iCT, PhillipsHealthcare),扫描参数具体如下:管电压为100kV,管电流为10mAs~30mAs,螺距为0.915,机架旋转时间为0.4s,探测器准直径为0.625mm,层厚为0.625mm,间距为0.625mm,视野为350mm×350mm,矩阵为512×512。扫描范围从肺尖到肋隔角(包括全部肺),不注射对比剂。
预处理包括依次进行的分辨率重建、灰度均值校正、灰度图像增强,或其中的一种或两种。
分辨率重建是建立高、低质量图像之间的数学关系来模拟图像降质过程,分辨率重建可以显著增强图像的画面质量,重建的算法为:
其中,E(x)表示重建误差,y表示低分辨率图像,x表示高分辨率图像,k表示模糊核,表示双三次下采样的倍数,/>表示固定参数,/>表示平衡参数,/>表示先验知识噪声强度。
灰度均值校正可以减少或消除成像过程中产生的条纹现象,校正的算法为:
获取投影权重系数矩阵A=(aij)M×M,M表示图像的大小,i、j表示图像的像素坐标。利用误差模型计算相对投影误差:
其中,为相对投影误差,eij为投影系数,aij为权重系数,oij为像素坐标i、j处的灰度值。
基于相对投影误差计算校正的灰度均值:
其中,o为图像中所有像素点的灰度均值,为校正后的灰度均值。
灰度图像增强能够改善图像的质量以及增强感兴趣部分,增强的算法为:
使用细节显著模型增强第k个像素点的细节:
其中,M表示图像的大小,k∈M×M,Maskk表示基于离散模糊的亮度掩码M中的第k个像素点的值;表示1×Mp维的向量,包含了Mp个lkm,m∈k,lkm表示第一反射系数;/>表示1×M×M维的向量,包含了M×M个/>,/>表示第二反射系数;/>表示所有包含了所有/>的1×Mp维向量,xk为像素点k的横坐标,yk为像素点k的纵坐标;/>表示包含了所有/>的1×M×M维向量;T表示矩阵转置。
将图像和基于离散模糊的亮度掩码输入目标函数,利用梯度下降优化对目标函数进行优化,得到最优的细节显著模型参数:
其中,为目标函数;Ck为像素点k为原始像素值;/>为范围系数;/>为调节常数;/>表示二范数。
步骤2,基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割,得到目标分割结果。
调用深度学习的全自动肺结节识别和分割软件uAI Discover-Lung(version6.8.1.0,United Imaging Intelligence)对预处理后的低剂量CT图像进行肺结节的识别和分割,该过程将识别和分割双侧全肺的所有肺结节,并输出每个肺结节的所在层号、位置(肺叶及肺段)、密度类型(实性结节/磨玻璃结节)、大小(最大长径、最大短径、体积)、平均密度信息。uAI Discover-Lung能够辅助医生高效阅片,提供全自动化、智能化的随访评估分析,自动定位匹配结节,实现多维度联动阅片。
放射科医生根据uAI Discover-Lung输出的信息审查每个被自动识别出的肺结节,排除假阳性结节,得到感兴趣的目标分割结果,并对目标分割结果进行评估,若对分割结果不满意,可由手工交互工具进行修正。
步骤3,基于目标分割结果对三维影像组学特征进行提取,将三维影像组学特征作为训练数据构建影像组学模型。
调用基于Python的开源的PyRadiomics软件包(version 3.0.1)提取目标分割结果的三维影像组学特征,共计104个,包括形态特征14个、一阶特征/直方图特征18个、纹理特征72个。其中,纹理特征又包括灰度共生矩阵特征(gray level co-occurrence matrix,GLCM)21个、灰度游程矩阵特征(gray level run length matrix,GLRLM)16个、灰度连通区域矩阵特征(gray level size zone matrix,GLSZM)16个、灰度相关矩阵特征(gray leveldependence matrix,GLDM)14个、局部灰度差分矩阵特征(neighborhood gray tonedifference matrix,NGTDM)5个。
采用Z-score转换对提取的所有三维影像组学特征进行数据标准化处理:
其中,xs为标准化处理后的三维影像组学特征值,x为标准化处理前的三维影像组学特征值,为样本三维影像组学特征的平均值,/>为样本三维影像组学特征的标准差。
所有受试者的三维影像组学特征构成训练数据,按照7:3的比例划分为训练数据集、测试数据集,利用训练数据集构建影像组学模型。首先进行三维影像组学特征的选择,采用无监督算法和有监督算法序贯串联运行的方式学习特征,再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型。
无监督算法包括斯皮尔曼系数(Spearman)相关分析、基于互信息的最大相关最小冗余算法(minimal redundancy maximal relevance,mRMR)。
斯皮尔曼系数相关分析是计算一个非参数性质(与分布无关)的秩统计参数Rs,因此适合用来度量非正态变量之间联系的强弱,计算方法为:
其中,x、y分别表示待分析相关性的变量序列对,n表示变量序列x和y的元素个数,i表示第i个元素;Oi表示变量序列x中第i个元素的秩次,Qi表示变量序列y中第i个元素的秩次;Rs表示秩统计参数。
定义相关性为:
基于互信息的最大相关最小冗余算法求取三维影像组学特征和目标类别之间的互信息以及三维影像组学特征之间的互信息:
其中,Sn表示具有n个三维影像组学特征的训练数据集,fi,fj∈Sn,c为目标类别集合;p(fi,c)为fi和c之间的联合概率密度,p(fi)为fi的概率密度,p(c)为c的概率密度;p(fi,fj)为fi和fj之间的联合概率密度,p(fj)为fj的概率密度;I为互信息函数,为邻域精度。
有监督算法包括曼-惠特尼U检验(Mann-Whitney U)、基于L1正则化的最小绝对值收敛和选择算子(least absolute shrinkage and selection operator, LASSO),均采用公开方法即可。
影像组学模型建立过程中将病理诊断的金标准结果作为二分类真实标签,其中实性结节分为良性和恶性,磨玻璃结节分为非浸润性腺癌和浸润性腺癌。影像组学模型输入的特征为三维影像组学特征,多因素逻辑回归方法的分类器为:
其中,P表示实性结节为恶性或磨玻璃结节为浸润性腺癌的概率值;为常数项;为标准化处理后的三维影像组学特征的系数,i∈n,xsi为标准化处理后的三维影像组学特征的值。
计算所有样本的概率值,绘制受试者工作特征曲线(receiver operatingcharacteristic, ROC)并计算曲线下面积(area under curve, AUC)。在训练数据集中利用约登指数求解最佳截断值,并在测试数据集中进行验证,计算影像组学模型在最佳截断值下的敏感性、特异性和准确性。
步骤4,将实时获取的低剂量CT图像输入影像组学模型,得到对应的三维影像组学特征,从而进行肺结节风险评估。
实施例2:
本实施例在上述实施例1的基础上作实验验证。
在288例低剂量CT图像中,有实性结节141例,其中训练数据集98例(包括良性48例,恶性50例),测试数据集43例(包括良性21例,恶性22例)。实性结节的良恶性影像组学模型为:
其中,,/>,/>,,GLCM_DifferenceVariance为灰度共生矩阵特征,GLRLM_RunEntropy为灰度游程矩阵特征,NGTDM_Strength为局部灰度差分矩阵特征。
以上3个三维影像组学特征为标准化处理后的值,Z-score转换所需参数如表1所示。
表1 Z-score转换所需参数
求出影像组学模型中的P,P为实性结节为恶性的概率,取值范围0-1,在训练数据集中利用约登指数求解出最佳截断值为0.495680。在测试数据集中对影像组学模型和最佳截断值的效能进行验证,得到AUC为0.976,敏感性为0.909,特异性为0.905,准确性为0.907。
在288例低剂量CT图像中,有磨玻璃结节147例,其中训练数据集103例(包括非浸润性腺癌60例,浸润性腺癌43例),测试数据集44例(包括非浸润性腺癌25例,浸润性腺癌19例)。磨玻璃结节的良恶性影像组学模型为:
其中,,/>,/>,/>,Shape_Flatness表示形态特征-扁平度,First order_Interquartile range表示直方图特征-四分位间距,NGTDM_Busyness表示局部灰度差分矩阵特征。
以上3个三维影像组学特征为标准化处理后的值,Z-score转换所需参数如表2所示。
表2 Z-score转换所需参数
求出影像组学模型中的P,P为磨玻璃结节为浸润性腺癌的概率,取值范围0-1,在训练数据集中利用约登指数求解出最佳截断值为0.404114。在测试数据集中对影像组学模型和最佳截断值的效能进行验证,得到AUC为0.933,敏感性为0.842,特异性为0.800,准确性为0.818。
通过上述实验验证可以看出,本发明利用剂量优化和图像优化方案标准化处理的低剂量CT图像,针对不同密度类型的肺结节构建影像组学模型,实现肺结节识别和风险评估,有利于为患者制定分级管理策略,减少过度诊断和重复检查带来的不必要辐射剂量暴露、经济成本和心理负担。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (8)
1.基于三维影像组学特征的肺结节识别系统,其特征在于:包括:
临床信息知识库模块,用于存储受检者胸部的低剂量CT图像以及临床信息;
图像预处理模块,用于对低剂量CT图像进行预处理;
肺结节自动识别和分割模块,用于基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割,得到目标分割结果;
影像组学特征提取模块,用于基于目标分割结果对三维影像组学特征进行提取,并将三维影像组学特征作为训练数据构建影像组学模型;
肺结节风险评估模块,用于通过影像组学模型对受检者的低剂量CT图像进行肺结节风险评估。
2.基于三维影像组学特征的肺结节识别方法,其特征在于:包括以下步骤:
步骤1,对获取的低剂量CT图像进行预处理;
步骤2,基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割,得到目标分割结果;
步骤3,基于目标分割结果对三维影像组学特征进行提取,将三维影像组学特征作为训练数据构建影像组学模型;
步骤4,将实时获取的低剂量CT图像输入影像组学模型,得到对应的三维影像组学特征,从而进行肺结节风险评估。
3.根据权利要求2所述的基于三维影像组学特征的肺结节识别方法,其特征在于:所述步骤1中,预处理包括依次进行的分辨率重建、灰度均值校正、灰度图像增强,或其中一种。
4.根据权利要求2所述的基于三维影像组学特征的肺结节识别方法,其特征在于:所述步骤2中,基于深度学习的全自动肺结节识别和分割软件为uAI Discover-Lung,基于深度学习的全自动肺结节识别和分割软件输出的信息包括每个肺结节的所在层号、位置、密度类型、大小、平均密度信息,其中密度类型为实性结节或磨玻璃结节,大小为最大长径、最大短径、体积。
5.根据权利要求2所述的基于三维影像组学特征的肺结节识别方法,其特征在于:所述步骤3中,三维影像组学特征包括形态特征、一阶特征、纹理特征,所述纹理特征包括灰度共生矩阵特征、灰度游程矩阵特征、灰度连通区域矩阵特征、灰度相关矩阵特征、局部灰度差分矩阵特征;
采用Z-score转换对提取的所有三维影像组学特征进行数据标准化处理:
其中,xs为标准化处理后的三维影像组学特征值,x为标准化处理前的三维影像组学特征值,为样本三维影像组学特征的平均值,/>为样本三维影像组学特征的标准差。
6.根据权利要求2所述的基于三维影像组学特征的肺结节识别方法,其特征在于:所述步骤3中,将三维影像组学特征作为训练数据构建影像组学模型的步骤,包括:
所有受试者的三维影像组学特征构成训练数据,按照7:3的比例划分为训练数据集、测试数据集,利用训练数据集构建影像组学模型;
首先进行三维影像组学特征的选择,采用无监督算法和有监督算法序贯串联运行的方式学习特征,再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型。
7.根据权利要求6所述的基于三维影像组学特征的肺结节识别方法,其特征在于:所述无监督算法包括斯皮尔曼系数相关分析、基于互信息的最大相关最小冗余算法;
斯皮尔曼系数相关分析计算秩统计参数Rs,计算方法为:
其中,x、y分别表示待分析相关性的变量序列对,n表示变量序列x和y的元素个数,i表示第i个元素;Oi表示变量序列x中第i个元素的秩次,Qi表示变量序列y中第i个元素的秩次;Rs表示秩统计参数;
基于互信息的最大相关最小冗余算法求取三维影像组学特征和目标类别之间的互信息以及三维影像组学特征之间的互信息:
其中,Sn表示具有n个三维影像组学特征的训练数据集,fi,fj∈Sn,c为目标类别集合;p(fi,c)为fi和c之间的联合概率密度,p(fi)为fi的概率密度,p(c)为c的概率密度;p(fi,fj)为fi和fj之间的联合概率密度,p(fj)为fj的概率密度;I为互信息函数,为邻域精度。
8.根据权利要求6所述的基于三维影像组学特征的肺结节识别方法,其特征在于:所述再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型的步骤,包括:
影像组学模型建立过程中将病理诊断的金标准结果作为二分类真实标签,其中实性结节分为良性和恶性,磨玻璃结节分为非浸润性腺癌和浸润性腺癌;影像组学模型输入的特征为三维影像组学特征,多因素逻辑回归方法的分类器为:
其中,P表示实性结节为恶性或磨玻璃结节为浸润性腺癌的概率值;为常数项;/>为标准化处理后的三维影像组学特征的系数,i∈n,xsi为标准化处理后的三维影像组学特征的值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311084858.6A CN116823818B (zh) | 2023-08-28 | 2023-08-28 | 基于三维影像组学特征的肺结节识别系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311084858.6A CN116823818B (zh) | 2023-08-28 | 2023-08-28 | 基于三维影像组学特征的肺结节识别系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116823818A true CN116823818A (zh) | 2023-09-29 |
CN116823818B CN116823818B (zh) | 2023-11-07 |
Family
ID=88120571
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311084858.6A Active CN116823818B (zh) | 2023-08-28 | 2023-08-28 | 基于三维影像组学特征的肺结节识别系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116823818B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180142303A1 (en) * | 2015-05-19 | 2018-05-24 | The Wistar Institute Of Anatomy And Biology | Methods and compositions for diagnosing or detecting lung cancers |
CN115393280A (zh) * | 2022-07-27 | 2022-11-25 | 四川大学华西医院 | 多个ct重建序列影像组学特征预测肺结节风险的系统 |
CN116563624A (zh) * | 2023-05-08 | 2023-08-08 | 山东大学 | 一种基于多任务学习的肺结节分类方法 |
-
2023
- 2023-08-28 CN CN202311084858.6A patent/CN116823818B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180142303A1 (en) * | 2015-05-19 | 2018-05-24 | The Wistar Institute Of Anatomy And Biology | Methods and compositions for diagnosing or detecting lung cancers |
CN115393280A (zh) * | 2022-07-27 | 2022-11-25 | 四川大学华西医院 | 多个ct重建序列影像组学特征预测肺结节风险的系统 |
CN116563624A (zh) * | 2023-05-08 | 2023-08-08 | 山东大学 | 一种基于多任务学习的肺结节分类方法 |
Non-Patent Citations (5)
Title |
---|
AMAL FARAG: "Evaluation of geometric feature descriptors for detection and classification of lung nodules in low dose CT scans of the chest", 《IEEE》, pages 1 - 11 * |
JIEKE LIU: "Comparison of Radiomic models based on low-dose and sandard-dose CT for prediction of Adenocarcinomas and Benign lesions in solid pulmonary nodules", 《FRONTIERS》, pages 1 - 15 * |
刘昶: "基于三维混合特征和机器学习的肺结节影像智能诊断方法", 《中国优秀硕士学位论文全文数据库》, pages 072 - 151 * |
田博: "基于影像学特征构建风险评估模型预测肺结节良恶性的研究", 《肿瘤预防与治疗》, pages 691 - 696 * |
青浩渺: "肺癌高危人群低剂量螺旋CT筛查的临床分析", 《放射学实践》, pages 71 - 75 * |
Also Published As
Publication number | Publication date |
---|---|
CN116823818B (zh) | 2023-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yun et al. | Improvement of fully automated airway segmentation on volumetric computed tomographic images using a 2.5 dimensional convolutional neural net | |
Udeshani et al. | Statistical feature-based neural network approach for the detection of lung cancer in chest x-ray images | |
CN111598871B (zh) | 多特征融合辅助检测肺部磨玻璃影结节系统及介质 | |
CN112508884B (zh) | 一种癌变区域综合检测装置及方法 | |
CN112365973B (zh) | 基于对抗网络和Faster R-CNN的肺结节辅助诊断系统 | |
CN116703901B (zh) | 肺部医学ct影像分割及分类装置及设备 | |
Zhao et al. | Cascade and Fusion of Multitask Convolutional Neural Networks for Detection of Thyroid Nodules in Contrast‐Enhanced CT | |
EP4046061A1 (en) | Weakly supervised multi-task learning for cell detection and segmentation | |
CN118172614B (zh) | 一种基于监督对比学习的有序强直性脊柱炎评级方法 | |
Liu et al. | Extracting lungs from CT images via deep convolutional neural network based segmentation and two-pass contour refinement | |
CN113139928A (zh) | 肺结节检测模型的训练方法和肺结节检测方法 | |
CN118136237A (zh) | 一种基于图像处理的食管癌筛查系统及方法 | |
US12027255B2 (en) | System for predicting microsatellite instability and construction method thereof, terminal device and medium | |
CN117522862A (zh) | 一种基于ct影像肺炎识别的图像处理方法及处理系统 | |
Rezaie et al. | Detection of lung nodules on medical images by the use of fractal segmentation | |
CN117727441A (zh) | 基于临床-融合影像计算机模型预测肺癌免疫疗效方法 | |
CN116823818B (zh) | 基于三维影像组学特征的肺结节识别系统和方法 | |
CN116935182A (zh) | 基于RepCSC-Net的乳腺肿瘤良恶性识别方法 | |
Sun et al. | Liver tumor segmentation and subsequent risk prediction based on Deeplabv3+ | |
CN115880245A (zh) | 一种基于自监督的乳腺癌疾病分类方法 | |
Mousavi Moghaddam et al. | Lung parenchyma segmentation from CT images with a fully automatic method | |
CN113870194A (zh) | 深层特征和浅层lbp特征融合的乳腺肿瘤超声图像处理装置 | |
CN113889235A (zh) | 一种三维医学影像无监督特征抽取系统 | |
Sonavane et al. | Classification of MRI brain tumor and mammogram images using adaboost and learning vector quantization neural network | |
Burada et al. | Early detection of melanoma skin cancer: A hybrid approach using fuzzy C-means clustering and differential evolution-based convolutional neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |