CN116823818A

CN116823818A - 基于三维影像组学特征的肺结节识别系统和方法

Info

Publication number: CN116823818A
Application number: CN202311084858.6A
Authority: CN
Inventors: 刘杰克; 李勇; 胥豪; 林礼波; 何长久; 青浩渺; 周鹏; 周红艳
Original assignee: Sichuan Cancer Hospital
Current assignee: Sichuan Cancer Hospital
Priority date: 2023-08-28
Filing date: 2023-08-28
Publication date: 2023-09-29
Anticipated expiration: 2043-08-28
Also published as: CN116823818B

Abstract

本发明涉及基于三维影像组学特征的肺结节识别系统和方法，包括步骤：对获取的低剂量CT图像进行预处理；基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割，得到目标分割结果；基于目标分割结果对三维影像组学特征进行提取，将三维影像组学特征作为训练数据构建影像组学模型；将实时获取的低剂量CT图像输入影像组学模型，得到对应的三维影像组学特征，从而进行肺结节风险评估。本发明利用剂量优化和图像优化方案标准化处理的低剂量CT图像，针对不同密度类型的肺结节构建影像组学模型，实现肺结节识别和风险评估，有利于为患者制定分级管理策略。

Description

基于三维影像组学特征的肺结节识别系统和方法

技术领域

本发明涉及图像处理技术领域，特别涉及一种基于三维影像组学特征的肺结节识别系统和方法。

背景技术

目前，低剂量计算机断层扫描（computed tomography,CT）是肺癌筛查的首要手段，随着低剂量CT肺癌筛查技术的推广与普及，肺结节及早起肺癌的检出率越来越高。虽然低剂量CT对肺结节的检出具有高敏感性，但是大量结节的检出和过度、重复检查给肺癌筛查受检者带来了不必要的辐射剂量暴露、经济负担和焦虑情绪。

传统的肺结节影像学诊断和恶性概率评估主要依靠形态学特征（如形状、边缘、结节-肺界面、分叶、毛刺等）和测量学特征（如经线、体积、密度等）。形态学特征的判定主要依靠放射科医生的经验，由于不同地区、不同年资、不同亚专业的放射科医生对形态学特征的认识和解读存在差异，导致报告结果缺乏一致性。在测量学特征方面，国内外指南目前根据肺结节的密度和大小制定了相应的随访原则和分级管理策略，首先将肺结节分为实性结节和磨玻璃结节，然后根据结节直径阈值确定随访间隔和干预措施。但在根据结节大小确定分级管理方案时，各指南采用的结节直径阈值不尽相同，尤其是针对磨玻璃结节，缺乏统一的鉴别诊断和风险预测标准。原因在于前驱腺体病变、微浸润腺癌和浸润性腺癌都可以表现为磨玻璃结节，虽然密度特征相似，但是非浸润性腺癌（前驱腺体病变、微浸润腺癌）表现出惰性生物学行为、预后良好，而浸润性腺癌风险相对较高、预后较差。因此，依靠传统的形态学特征和测量学特征难以在临床实践中精准鉴别和预测具有相同特征但风险度不同的肺结节。

近年来医学图像处理技术和方法快速发展，其中影像组学方法可以从医学影像图像中高通量的提取大量的定量特征，目前已经广泛引用于肿瘤领域研究，在肿瘤良恶性鉴别、病理亚型、基因及分子分型、治疗方案选择、预后预测等方面。但在低剂量CT肺癌筛查领域尚存在以下问题：

（1）既往基于低剂量CT影像数据的肺结节影像组学研究主要集中于良恶性鉴别，未针对不同密度类型的肺结节分别建立影像组学预测模型，对肺结节和早起肺癌风险评估不够精准；

（2）所采用的影像数据多来源公共、多中心数据库，受试者的扫描参数和重建方法存在较大异质性，不仅会影响影像组学特征定量的鲁棒性，也会影响影像组学模型的泛化能力；

（3）上述低剂量CT图像采集方案设计历时已久，部分样本的扫描剂量高于目前国内外肺癌筛查指南的推荐值，由于剂量降低亦会影响影像组学特征定量的鲁棒性，既往的影像组学模型并不适用当前临床实践中采集的低剂量CT肺癌筛查数据。

因此，如何基于低剂量CT图像实现肺结节的精准识别是对肺癌风险预测的重要手段。

发明内容

本发明的目的在于实现自动精准的肺结节识别和风险评估，提供一种基于三维影像组学特征的肺结节识别系统和方法。

为了实现上述发明目的，本发明实施例提供了以下技术方案：

基于三维影像组学特征的肺结节识别系统，包括：

临床信息知识库模块，用于存储受检者胸部的低剂量CT图像以及临床信息；

图像预处理模块，用于对低剂量CT图像进行预处理；

肺结节自动识别和分割模块，用于基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割，得到目标分割结果；

影像组学特征提取模块，用于基于目标分割结果对三维影像组学特征进行提取，并将三维影像组学特征作为训练数据构建影像组学模型；

肺结节风险评估模块，用于通过影像组学模型对受检者的低剂量CT图像进行肺结节风险评估。

基于三维影像组学特征的肺结节识别方法，包括以下步骤：

步骤1，对获取的低剂量CT图像进行预处理；

步骤2，基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割，得到目标分割结果；

步骤3，基于目标分割结果对三维影像组学特征进行提取，将三维影像组学特征作为训练数据构建影像组学模型；

步骤4，将实时获取的低剂量CT图像输入影像组学模型，得到对应的三维影像组学特征，从而进行肺结节风险评估。

所述步骤1中，预处理包括依次进行的分辨率重建、灰度均值校正、灰度图像增强，或其中一种。

在上述方案中，由于低剂量CT图像获取时，因仪器或患者的呼吸状态等影像，可能会存在低剂量CT图像的图像质量不高，因此在识别和分割肺结节之前，对低剂量CT图像进行预处理，其中分辨率重建是建立高、低质量图像之间的数学关系来模拟图像降质过程，分辨率重建可以显著增强图像的画面质量；灰度均值校正可以减少或消除成像过程中产生的条纹现象；灰度图像增强能够改善图像的质量以及增强感兴趣部分。解决了所采用的影像数据多来源公共、多中心数据库，受试者的扫描参数和重建方法存在较大异质性的问题，如此提升了影像组学特征定量的鲁棒性，也提升了影像组学模型的泛化能力。

所述步骤2中，基于深度学习的全自动肺结节识别和分割软件为uAI Discover-Lung，基于深度学习的全自动肺结节识别和分割软件输出的信息包括每个肺结节的所在层号、位置、密度类型、大小、平均密度信息，其中密度类型为实性结节或磨玻璃结节，大小为最大长径、最大短径、体积。

所述步骤3中，三维影像组学特征包括形态特征、一阶特征、纹理特征，所述纹理特征包括灰度共生矩阵特征、灰度游程矩阵特征、灰度连通区域矩阵特征、灰度相关矩阵特征、局部灰度差分矩阵特征；

采用Z-score转换对提取的所有三维影像组学特征进行数据标准化处理：

其中，x_s为标准化处理后的三维影像组学特征值，x为标准化处理前的三维影像组学特征值，为样本三维影像组学特征的平均值，/>为样本三维影像组学特征的标准差。

在上述方案中，既往基于低剂量CT影像数据的肺结节影像组学研究主要集中于良恶性鉴别，而本方案针对不同密度类型的肺结节建立影像组学预测模型，对肺结节和早起肺癌风险评估精准。

所述步骤3中，将三维影像组学特征作为训练数据构建影像组学模型的步骤，包括：

所有受试者的三维影像组学特征构成训练数据，按照7:3的比例划分为训练数据集、测试数据集，利用训练数据集构建影像组学模型；

首先进行三维影像组学特征的选择，采用无监督算法和有监督算法序贯串联运行的方式学习特征，再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型。

所述无监督算法包括斯皮尔曼系数相关分析、基于互信息的最大相关最小冗余算法；

斯皮尔曼系数相关分析计算秩统计参数R_s，计算方法为：

其中，x、y分别表示待分析相关性的变量序列对，n表示变量序列x和y的元素个数，i表示第i个元素；O_i表示变量序列x中第i个元素的秩次，Q_i表示变量序列y中第i个元素的秩次；R_s表示秩统计参数；

基于互信息的最大相关最小冗余算法求取三维影像组学特征和目标类别之间的互信息以及三维影像组学特征之间的互信息：

其中，S_n表示具有n个三维影像组学特征的训练数据集，f_i,f_j∈S_n，c为目标类别集合；p(f_i,c)为f_i和c之间的联合概率密度，p(f_i)为f_i的概率密度，p(c)为c的概率密度；p(f_i,f_j)为f_i和f_j之间的联合概率密度，p(f_j)为f_j的概率密度；I为互信息函数，为邻域精度。

所述再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型的步骤，包括：

影像组学模型建立过程中将病理诊断的金标准结果作为二分类真实标签，其中实性结节分为良性和恶性，磨玻璃结节分为非浸润性腺癌和浸润性腺癌；影像组学模型输入的特征为三维影像组学特征，多因素逻辑回归方法的分类器为：

其中，P表示实性结节为恶性或磨玻璃结节为浸润性腺癌的概率值；为常数项；为标准化处理后的三维影像组学特征的系数，i∈n，x_si为标准化处理后的三维影像组学特征的值。

在上述方案中，针对不同密度类型的肺结节，三维影像组学特征的值x_si也不同，因此可以分别构建针对不同密度类型的肺结节的影像组学模型，对肺结节和早起肺癌风险评估精准。

与现有技术相比，本发明的有益效果：

本发明利用剂量优化和图像优化方案标准化处理的低剂量CT图像，针对不同密度类型的肺结节构建影像组学模型，实现肺结节识别和风险评估，有利于为患者制定分级管理策略，减少过度诊断和重复检查带来的不必要辐射剂量暴露、经济成本和心理负担。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明系统模块框图；

图2为本发明方法流程图。

具体实施方式

下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本发明的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性，或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。另外，术语“相连”、“连接”等可以是元件之间直接相连，也可以是经由其他元件的间接相连。

实施例1：

本发明通过下述技术方案实现，如图1所示，一种基于三维影像组学特征的肺结节识别系统，包括：

图像预处理模块，用于对低剂量CT图像进行预处理；

基于上述系统，请参见图2，本发明还提出一种基于三维影像组学特征的肺结节识别方法，包括以下步骤：

步骤1，对获取的低剂量CT图像进行预处理。

从影像图片存档及通信系统（picture archiving and communication system,PACS）调用受检者年龄、性别信息，并存储在临床信息知识库模块中。从影像图片存档及通信系统中调取受检者胸部的低剂量CT图像，对低剂量CT图像进行预处理。

低剂量CT图像来自于飞利浦128排256层CT扫描仪（Brilliance iCT, PhillipsHealthcare），扫描参数具体如下：管电压为100kV，管电流为10mAs~30mAs，螺距为0.915，机架旋转时间为0.4s，探测器准直径为0.625mm，层厚为0.625mm，间距为0.625mm，视野为350mm×350mm，矩阵为512×512。扫描范围从肺尖到肋隔角（包括全部肺），不注射对比剂。

预处理包括依次进行的分辨率重建、灰度均值校正、灰度图像增强，或其中的一种或两种。

分辨率重建是建立高、低质量图像之间的数学关系来模拟图像降质过程，分辨率重建可以显著增强图像的画面质量，重建的算法为：

其中，E(x)表示重建误差，y表示低分辨率图像，x表示高分辨率图像，k表示模糊核，表示双三次下采样的倍数，/>表示固定参数，/>表示平衡参数，/>表示先验知识噪声强度。

灰度均值校正可以减少或消除成像过程中产生的条纹现象，校正的算法为：

获取投影权重系数矩阵A=(a_ij)_M×M，M表示图像的大小，i、j表示图像的像素坐标。利用误差模型计算相对投影误差：

其中，为相对投影误差，e_ij为投影系数，a_ij为权重系数，o_ij为像素坐标i、j处的灰度值。

基于相对投影误差计算校正的灰度均值：

其中，o为图像中所有像素点的灰度均值，为校正后的灰度均值。

灰度图像增强能够改善图像的质量以及增强感兴趣部分，增强的算法为：

使用细节显著模型增强第k个像素点的细节：

其中，M表示图像的大小，k∈M×M，Mask_k表示基于离散模糊的亮度掩码M中的第k个像素点的值；表示1×M_p维的向量，包含了M_p个l_km，m∈k，l_km表示第一反射系数；/>表示1×M×M维的向量，包含了M×M个/>，/>表示第二反射系数；/>表示所有包含了所有/>的1×M_p维向量，x_k为像素点k的横坐标，y_k为像素点k的纵坐标；/>表示包含了所有/>的1×M×M维向量；T表示矩阵转置。

将图像和基于离散模糊的亮度掩码输入目标函数，利用梯度下降优化对目标函数进行优化，得到最优的细节显著模型参数：

其中，为目标函数；C_k为像素点k为原始像素值；/>为范围系数；/>为调节常数；/>表示二范数。

步骤2，基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割，得到目标分割结果。

调用深度学习的全自动肺结节识别和分割软件uAI Discover-Lung（version6.8.1.0,United Imaging Intelligence）对预处理后的低剂量CT图像进行肺结节的识别和分割，该过程将识别和分割双侧全肺的所有肺结节，并输出每个肺结节的所在层号、位置（肺叶及肺段）、密度类型（实性结节/磨玻璃结节）、大小（最大长径、最大短径、体积）、平均密度信息。uAI Discover-Lung能够辅助医生高效阅片，提供全自动化、智能化的随访评估分析，自动定位匹配结节，实现多维度联动阅片。

放射科医生根据uAI Discover-Lung输出的信息审查每个被自动识别出的肺结节，排除假阳性结节，得到感兴趣的目标分割结果，并对目标分割结果进行评估，若对分割结果不满意，可由手工交互工具进行修正。

步骤3，基于目标分割结果对三维影像组学特征进行提取，将三维影像组学特征作为训练数据构建影像组学模型。

调用基于Python的开源的PyRadiomics软件包（version 3.0.1）提取目标分割结果的三维影像组学特征，共计104个，包括形态特征14个、一阶特征/直方图特征18个、纹理特征72个。其中，纹理特征又包括灰度共生矩阵特征（gray level co-occurrence matrix,GLCM）21个、灰度游程矩阵特征（gray level run length matrix,GLRLM）16个、灰度连通区域矩阵特征（gray level size zone matrix,GLSZM）16个、灰度相关矩阵特征（gray leveldependence matrix,GLDM）14个、局部灰度差分矩阵特征（neighborhood gray tonedifference matrix,NGTDM）5个。

所有受试者的三维影像组学特征构成训练数据，按照7:3的比例划分为训练数据集、测试数据集，利用训练数据集构建影像组学模型。首先进行三维影像组学特征的选择，采用无监督算法和有监督算法序贯串联运行的方式学习特征，再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型。

无监督算法包括斯皮尔曼系数（Spearman）相关分析、基于互信息的最大相关最小冗余算法（minimal redundancy maximal relevance,mRMR）。

斯皮尔曼系数相关分析是计算一个非参数性质（与分布无关）的秩统计参数R_s，因此适合用来度量非正态变量之间联系的强弱，计算方法为：

其中，x、y分别表示待分析相关性的变量序列对，n表示变量序列x和y的元素个数，i表示第i个元素；O_i表示变量序列x中第i个元素的秩次，Q_i表示变量序列y中第i个元素的秩次；R_s表示秩统计参数。

定义相关性为：

有监督算法包括曼-惠特尼U检验（Mann-Whitney U）、基于L1正则化的最小绝对值收敛和选择算子（least absolute shrinkage and selection operator, LASSO），均采用公开方法即可。

影像组学模型建立过程中将病理诊断的金标准结果作为二分类真实标签，其中实性结节分为良性和恶性，磨玻璃结节分为非浸润性腺癌和浸润性腺癌。影像组学模型输入的特征为三维影像组学特征，多因素逻辑回归方法的分类器为：

计算所有样本的概率值，绘制受试者工作特征曲线（receiver operatingcharacteristic, ROC）并计算曲线下面积（area under curve, AUC）。在训练数据集中利用约登指数求解最佳截断值，并在测试数据集中进行验证，计算影像组学模型在最佳截断值下的敏感性、特异性和准确性。

实施例2：

本实施例在上述实施例1的基础上作实验验证。

在288例低剂量CT图像中，有实性结节141例，其中训练数据集98例（包括良性48例，恶性50例），测试数据集43例（包括良性21例，恶性22例）。实性结节的良恶性影像组学模型为：

其中，，/>，/>，，GLCM_DifferenceVariance为灰度共生矩阵特征，GLRLM_RunEntropy为灰度游程矩阵特征，NGTDM_Strength为局部灰度差分矩阵特征。

以上3个三维影像组学特征为标准化处理后的值，Z-score转换所需参数如表1所示。

表1 Z-score转换所需参数

求出影像组学模型中的P，P为实性结节为恶性的概率，取值范围0-1，在训练数据集中利用约登指数求解出最佳截断值为0.495680。在测试数据集中对影像组学模型和最佳截断值的效能进行验证，得到AUC为0.976，敏感性为0.909，特异性为0.905，准确性为0.907。

在288例低剂量CT图像中，有磨玻璃结节147例，其中训练数据集103例（包括非浸润性腺癌60例，浸润性腺癌43例），测试数据集44例（包括非浸润性腺癌25例，浸润性腺癌19例）。磨玻璃结节的良恶性影像组学模型为：

其中，，/>，/>，/>，Shape_Flatness表示形态特征-扁平度，First order_Interquartile range表示直方图特征-四分位间距，NGTDM_Busyness表示局部灰度差分矩阵特征。

以上3个三维影像组学特征为标准化处理后的值，Z-score转换所需参数如表2所示。

表2 Z-score转换所需参数

求出影像组学模型中的P，P为磨玻璃结节为浸润性腺癌的概率，取值范围0-1，在训练数据集中利用约登指数求解出最佳截断值为0.404114。在测试数据集中对影像组学模型和最佳截断值的效能进行验证，得到AUC为0.933，敏感性为0.842，特异性为0.800，准确性为0.818。

通过上述实验验证可以看出，本发明利用剂量优化和图像优化方案标准化处理的低剂量CT图像，针对不同密度类型的肺结节构建影像组学模型，实现肺结节识别和风险评估，有利于为患者制定分级管理策略，减少过度诊断和重复检查带来的不必要辐射剂量暴露、经济成本和心理负担。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.基于三维影像组学特征的肺结节识别系统，其特征在于：包括：

图像预处理模块，用于对低剂量CT图像进行预处理；

2.基于三维影像组学特征的肺结节识别方法，其特征在于：包括以下步骤：

步骤1，对获取的低剂量CT图像进行预处理；

3.根据权利要求2所述的基于三维影像组学特征的肺结节识别方法，其特征在于：所述步骤1中，预处理包括依次进行的分辨率重建、灰度均值校正、灰度图像增强，或其中一种。

4.根据权利要求2所述的基于三维影像组学特征的肺结节识别方法，其特征在于：所述步骤2中，基于深度学习的全自动肺结节识别和分割软件为uAI Discover-Lung，基于深度学习的全自动肺结节识别和分割软件输出的信息包括每个肺结节的所在层号、位置、密度类型、大小、平均密度信息，其中密度类型为实性结节或磨玻璃结节，大小为最大长径、最大短径、体积。

5.根据权利要求2所述的基于三维影像组学特征的肺结节识别方法，其特征在于：所述步骤3中，三维影像组学特征包括形态特征、一阶特征、纹理特征，所述纹理特征包括灰度共生矩阵特征、灰度游程矩阵特征、灰度连通区域矩阵特征、灰度相关矩阵特征、局部灰度差分矩阵特征；

6.根据权利要求2所述的基于三维影像组学特征的肺结节识别方法，其特征在于：所述步骤3中，将三维影像组学特征作为训练数据构建影像组学模型的步骤，包括：

7.根据权利要求6所述的基于三维影像组学特征的肺结节识别方法，其特征在于：所述无监督算法包括斯皮尔曼系数相关分析、基于互信息的最大相关最小冗余算法；

斯皮尔曼系数相关分析计算秩统计参数R_s，计算方法为：

8.根据权利要求6所述的基于三维影像组学特征的肺结节识别方法，其特征在于：所述再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型的步骤，包括：

其中，P表示实性结节为恶性或磨玻璃结节为浸润性腺癌的概率值；为常数项；/>为标准化处理后的三维影像组学特征的系数，i∈n，x_si为标准化处理后的三维影像组学特征的值。