CN116823818B - 基于三维影像组学特征的肺结节识别系统和方法 - Google Patents

基于三维影像组学特征的肺结节识别系统和方法 Download PDF

Info

Publication number
CN116823818B
CN116823818B CN202311084858.6A CN202311084858A CN116823818B CN 116823818 B CN116823818 B CN 116823818B CN 202311084858 A CN202311084858 A CN 202311084858A CN 116823818 B CN116823818 B CN 116823818B
Authority
CN
China
Prior art keywords
histology
image
dimensional image
dose
nodule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311084858.6A
Other languages
English (en)
Other versions
CN116823818A (zh
Inventor
刘杰克
李勇
胥豪
林礼波
何长久
青浩渺
周鹏
周红艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Cancer Hospital
Original Assignee
Sichuan Cancer Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Cancer Hospital filed Critical Sichuan Cancer Hospital
Priority to CN202311084858.6A priority Critical patent/CN116823818B/zh
Publication of CN116823818A publication Critical patent/CN116823818A/zh
Application granted granted Critical
Publication of CN116823818B publication Critical patent/CN116823818B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/44Analysis of texture based on statistical description of texture using image operators, e.g. filters, edge density metrics or local histograms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/45Analysis of texture based on statistical description of texture using co-occurrence matrix computation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/766Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/771Feature selection, e.g. selecting representative features from a multi-dimensional feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06V10/7753Incorporation of unlabelled data, e.g. multiple instance learning [MIL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung
    • G06T2207/30064Lung nodule
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images
    • G06V2201/031Recognition of patterns in medical or anatomical images of internal organs
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Geometry (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Image Analysis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本发明涉及基于三维影像组学特征的肺结节识别系统和方法,包括步骤:对获取的低剂量CT图像进行预处理;基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割,得到目标分割结果;基于目标分割结果对三维影像组学特征进行提取,将三维影像组学特征作为训练数据构建影像组学模型;将实时获取的低剂量CT图像输入影像组学模型,得到对应的三维影像组学特征,从而进行肺结节风险评估。本发明利用剂量优化和图像优化方案标准化处理的低剂量CT图像,针对不同密度类型的肺结节构建影像组学模型,实现肺结节识别和风险评估,有利于为患者制定分级管理策略。

Description

基于三维影像组学特征的肺结节识别系统和方法
技术领域
本发明涉及图像处理技术领域,特别涉及一种基于三维影像组学特征的肺结节识别系统和方法。
背景技术
目前,低剂量计算机断层扫描(computed tomography,CT)是肺癌筛查的首要手段,随着低剂量CT肺癌筛查技术的推广与普及,肺结节及早起肺癌的检出率越来越高。虽然低剂量CT对肺结节的检出具有高敏感性,但是大量结节的检出和过度、重复检查给肺癌筛查受检者带来了不必要的辐射剂量暴露、经济负担和焦虑情绪。
传统的肺结节影像学诊断和恶性概率评估主要依靠形态学特征(如形状、边缘、结节-肺界面、分叶、毛刺等)和测量学特征(如经线、体积、密度等)。形态学特征的判定主要依靠放射科医生的经验,由于不同地区、不同年资、不同亚专业的放射科医生对形态学特征的认识和解读存在差异,导致报告结果缺乏一致性。在测量学特征方面,国内外指南目前根据肺结节的密度和大小制定了相应的随访原则和分级管理策略,首先将肺结节分为实性结节和磨玻璃结节,然后根据结节直径阈值确定随访间隔和干预措施。但在根据结节大小确定分级管理方案时,各指南采用的结节直径阈值不尽相同,尤其是针对磨玻璃结节,缺乏统一的鉴别诊断和风险预测标准。原因在于前驱腺体病变、微浸润腺癌和浸润性腺癌都可以表现为磨玻璃结节,虽然密度特征相似,但是非浸润性腺癌(前驱腺体病变、微浸润腺癌)表现出惰性生物学行为、预后良好,而浸润性腺癌风险相对较高、预后较差。因此,依靠传统的形态学特征和测量学特征难以在临床实践中精准鉴别和预测具有相同特征但风险度不同的肺结节。
近年来医学图像处理技术和方法快速发展,其中影像组学方法可以从医学影像图像中高通量的提取大量的定量特征,目前已经广泛引用于肿瘤领域研究,在肿瘤良恶性鉴别、病理亚型、基因及分子分型、治疗方案选择、预后预测等方面。但在低剂量CT肺癌筛查领域尚存在以下问题:
(1)既往基于低剂量CT影像数据的肺结节影像组学研究主要集中于良恶性鉴别,未针对不同密度类型的肺结节分别建立影像组学预测模型,对肺结节和早起肺癌风险评估不够精准;
(2)所采用的影像数据多来源公共、多中心数据库,受试者的扫描参数和重建方法存在较大异质性,不仅会影响影像组学特征定量的鲁棒性,也会影响影像组学模型的泛化能力;
(3)上述低剂量CT图像采集方案设计历时已久,部分样本的扫描剂量高于目前国内外肺癌筛查指南的推荐值,由于剂量降低亦会影响影像组学特征定量的鲁棒性,既往的影像组学模型并不适用当前临床实践中采集的低剂量CT肺癌筛查数据。
因此,如何基于低剂量CT图像实现肺结节的精准识别是对肺癌风险预测的重要手段。
发明内容
本发明的目的在于实现自动精准的肺结节识别和风险评估,提供一种基于三维影像组学特征的肺结节识别系统和方法。
为了实现上述发明目的,本发明实施例提供了以下技术方案:
基于三维影像组学特征的肺结节识别系统,包括:
临床信息知识库模块,用于存储受检者胸部的低剂量CT图像以及临床信息;
图像预处理模块,用于对低剂量CT图像进行预处理;
肺结节自动识别和分割模块,用于基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割,得到目标分割结果;
影像组学特征提取模块,用于基于目标分割结果对三维影像组学特征进行提取,并将三维影像组学特征作为训练数据构建影像组学模型;
肺结节风险评估模块,用于通过影像组学模型对受检者的低剂量CT图像进行肺结节风险评估。
基于三维影像组学特征的肺结节识别方法,包括以下步骤:
步骤1,对获取的低剂量CT图像进行预处理;
步骤2,基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割,得到目标分割结果;
步骤3,基于目标分割结果对三维影像组学特征进行提取,将三维影像组学特征作为训练数据构建影像组学模型;
步骤4,将实时获取的低剂量CT图像输入影像组学模型,得到对应的三维影像组学特征,从而进行肺结节风险评估。
所述步骤1中,预处理包括依次进行的分辨率重建、灰度均值校正、灰度图像增强,或其中一种。
在上述方案中,由于低剂量CT图像获取时,因仪器或患者的呼吸状态等影像,可能会存在低剂量CT图像的图像质量不高,因此在识别和分割肺结节之前,对低剂量CT图像进行预处理,其中分辨率重建是建立高、低质量图像之间的数学关系来模拟图像降质过程,分辨率重建可以显著增强图像的画面质量;灰度均值校正可以减少或消除成像过程中产生的条纹现象;灰度图像增强能够改善图像的质量以及增强感兴趣部分。解决了所采用的影像数据多来源公共、多中心数据库,受试者的扫描参数和重建方法存在较大异质性的问题,如此提升了影像组学特征定量的鲁棒性,也提升了影像组学模型的泛化能力。
所述步骤2中,基于深度学习的全自动肺结节识别和分割软件为uAI Discover-Lung,基于深度学习的全自动肺结节识别和分割软件输出的信息包括每个肺结节的所在层号、位置、密度类型、大小、平均密度信息,其中密度类型为实性结节或磨玻璃结节,大小为最大长径、最大短径、体积。
所述步骤3中,三维影像组学特征包括形态特征、一阶特征、纹理特征,所述纹理特征包括灰度共生矩阵特征、灰度游程矩阵特征、灰度连通区域矩阵特征、灰度相关矩阵特征、局部灰度差分矩阵特征;
采用Z-score转换对提取的所有三维影像组学特征进行数据标准化处理:
其中,xs为标准化处理后的三维影像组学特征值,x为标准化处理前的三维影像组学特征值,为样本三维影像组学特征的平均值,/>为样本三维影像组学特征的标准差。
在上述方案中,既往基于低剂量CT影像数据的肺结节影像组学研究主要集中于良恶性鉴别,而本方案针对不同密度类型的肺结节建立影像组学预测模型,对肺结节和早起肺癌风险评估精准。
所述步骤3中,将三维影像组学特征作为训练数据构建影像组学模型的步骤,包括:
所有受试者的三维影像组学特征构成训练数据,按照7:3的比例划分为训练数据集、测试数据集,利用训练数据集构建影像组学模型;
首先进行三维影像组学特征的选择,采用无监督算法和有监督算法序贯串联运行的方式学习特征,再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型。
所述无监督算法包括斯皮尔曼系数相关分析、基于互信息的最大相关最小冗余算法;
斯皮尔曼系数相关分析计算秩统计参数Rs,计算方法为:
其中,x、y分别表示待分析相关性的变量序列对,n表示变量序列x和y的元素个数,i表示第i个元素;Oi表示变量序列x中第i个元素的秩次,Qi表示变量序列y中第i个元素的秩次;Rs表示秩统计参数;
基于互信息的最大相关最小冗余算法求取三维影像组学特征和目标类别之间的互信息以及三维影像组学特征之间的互信息:
其中,Sn表示具有n个三维影像组学特征的训练数据集,fi,fj∈Sn,c为目标类别集合;p(fi,c)为fi和c之间的联合概率密度,p(fi)为fi的概率密度,p(c)为c的概率密度;p(fi,fj)为fi和fj之间的联合概率密度,p(fj)为fj的概率密度;I为互信息函数,为邻域精度。
所述再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型的步骤,包括:
影像组学模型建立过程中将病理诊断的金标准结果作为二分类真实标签,其中实性结节分为良性和恶性,磨玻璃结节分为非浸润性腺癌和浸润性腺癌;影像组学模型输入的特征为三维影像组学特征,多因素逻辑回归方法的分类器为:
其中,P表示实性结节为恶性或磨玻璃结节为浸润性腺癌的概率值;为常数项;为标准化处理后的三维影像组学特征的系数,i∈n,xsi为标准化处理后的三维影像组学特征的值。
在上述方案中,针对不同密度类型的肺结节,三维影像组学特征的值xsi也不同,因此可以分别构建针对不同密度类型的肺结节的影像组学模型,对肺结节和早起肺癌风险评估精准。
与现有技术相比,本发明的有益效果:
本发明利用剂量优化和图像优化方案标准化处理的低剂量CT图像,针对不同密度类型的肺结节构建影像组学模型,实现肺结节识别和风险评估,有利于为患者制定分级管理策略,减少过度诊断和重复检查带来的不必要辐射剂量暴露、经济成本和心理负担。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明系统模块框图;
图2为本发明方法流程图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性,或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。另外,术语“相连”、“连接”等可以是元件之间直接相连,也可以是经由其他元件的间接相连。
实施例1:
本发明通过下述技术方案实现,如图1所示,一种基于三维影像组学特征的肺结节识别系统,包括:
临床信息知识库模块,用于存储受检者胸部的低剂量CT图像以及临床信息;
图像预处理模块,用于对低剂量CT图像进行预处理;
肺结节自动识别和分割模块,用于基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割,得到目标分割结果;
影像组学特征提取模块,用于基于目标分割结果对三维影像组学特征进行提取,并将三维影像组学特征作为训练数据构建影像组学模型;
肺结节风险评估模块,用于通过影像组学模型对受检者的低剂量CT图像进行肺结节风险评估。
基于上述系统,请参见图2,本发明还提出一种基于三维影像组学特征的肺结节识别方法,包括以下步骤:
步骤1,对获取的低剂量CT图像进行预处理。
从影像图片存档及通信系统(picture archiving and communication system,PACS)调用受检者年龄、性别信息,并存储在临床信息知识库模块中。从影像图片存档及通信系统中调取受检者胸部的低剂量CT图像,对低剂量CT图像进行预处理。
低剂量CT图像来自于飞利浦128排256层CT扫描仪(Brilliance iCT, PhillipsHealthcare),扫描参数具体如下:管电压为100kV,管电流为10mAs~30mAs,螺距为0.915,机架旋转时间为0.4s,探测器准直径为0.625mm,层厚为0.625mm,间距为0.625mm,视野为350mm×350mm,矩阵为512×512。扫描范围从肺尖到肋隔角(包括全部肺),不注射对比剂。
预处理包括依次进行的分辨率重建、灰度均值校正、灰度图像增强,或其中的一种或两种。
分辨率重建是建立高、低质量图像之间的数学关系来模拟图像降质过程,分辨率重建可以显著增强图像的画面质量,重建的算法为:
其中,E(x)表示重建误差,y表示低分辨率图像,x表示高分辨率图像,k表示模糊核,表示双三次下采样的倍数,/>表示固定参数,/>表示平衡参数,/>表示先验知识噪声强度。
灰度均值校正可以减少或消除成像过程中产生的条纹现象,校正的算法为:
获取投影权重系数矩阵A=(aij)M×M,M表示图像的大小,i、j表示图像的像素坐标。利用误差模型计算相对投影误差:
其中,为相对投影误差,eij为投影系数,aij为权重系数,oij为像素坐标i、j处的灰度值。
基于相对投影误差计算校正的灰度均值:
其中,o为图像中所有像素点的灰度均值,为校正后的灰度均值。
灰度图像增强能够改善图像的质量以及增强感兴趣部分,增强的算法为:
使用细节显著模型增强第k个像素点的细节:
其中,M表示图像的大小,k∈M×M,Maskk表示基于离散模糊的亮度掩码M中的第k个像素点的值;表示1×Mp维的向量,包含了Mp个lkm,m∈k,lkm表示第一反射系数;/>表示1×M×M维的向量,包含了M×M个/>,/>表示第二反射系数;/>表示所有包含了所有/>的1×Mp维向量,xk为像素点k的横坐标,yk为像素点k的纵坐标;/>表示包含了所有/>的1×M×M维向量;T表示矩阵转置。
将图像和基于离散模糊的亮度掩码输入目标函数,利用梯度下降优化对目标函数进行优化,得到最优的细节显著模型参数:
其中,为目标函数;Ck为像素点k为原始像素值;/>为范围系数;/>为调节常数;/>表示二范数。
步骤2,基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割,得到目标分割结果。
调用深度学习的全自动肺结节识别和分割软件uAI Discover-Lung(version6.8.1.0,United Imaging Intelligence)对预处理后的低剂量CT图像进行肺结节的识别和分割,该过程将识别和分割双侧全肺的所有肺结节,并输出每个肺结节的所在层号、位置(肺叶及肺段)、密度类型(实性结节/磨玻璃结节)、大小(最大长径、最大短径、体积)、平均密度信息。uAI Discover-Lung能够辅助医生高效阅片,提供全自动化、智能化的随访评估分析,自动定位匹配结节,实现多维度联动阅片。
放射科医生根据uAI Discover-Lung输出的信息审查每个被自动识别出的肺结节,排除假阳性结节,得到感兴趣的目标分割结果,并对目标分割结果进行评估,若对分割结果不满意,可由手工交互工具进行修正。
步骤3,基于目标分割结果对三维影像组学特征进行提取,将三维影像组学特征作为训练数据构建影像组学模型。
调用基于Python的开源的PyRadiomics软件包(version 3.0.1)提取目标分割结果的三维影像组学特征,共计104个,包括形态特征14个、一阶特征/直方图特征18个、纹理特征72个。其中,纹理特征又包括灰度共生矩阵特征(gray level co-occurrence matrix,GLCM)21个、灰度游程矩阵特征(gray level run length matrix,GLRLM)16个、灰度连通区域矩阵特征(gray level size zone matrix,GLSZM)16个、灰度相关矩阵特征(gray leveldependence matrix,GLDM)14个、局部灰度差分矩阵特征(neighborhood gray tonedifference matrix,NGTDM)5个。
采用Z-score转换对提取的所有三维影像组学特征进行数据标准化处理:
其中,xs为标准化处理后的三维影像组学特征值,x为标准化处理前的三维影像组学特征值,为样本三维影像组学特征的平均值,/>为样本三维影像组学特征的标准差。
所有受试者的三维影像组学特征构成训练数据,按照7:3的比例划分为训练数据集、测试数据集,利用训练数据集构建影像组学模型。首先进行三维影像组学特征的选择,采用无监督算法和有监督算法序贯串联运行的方式学习特征,再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型。
无监督算法包括斯皮尔曼系数(Spearman)相关分析、基于互信息的最大相关最小冗余算法(minimal redundancy maximal relevance,mRMR)。
斯皮尔曼系数相关分析是计算一个非参数性质(与分布无关)的秩统计参数Rs,因此适合用来度量非正态变量之间联系的强弱,计算方法为:
其中,x、y分别表示待分析相关性的变量序列对,n表示变量序列x和y的元素个数,i表示第i个元素;Oi表示变量序列x中第i个元素的秩次,Qi表示变量序列y中第i个元素的秩次;Rs表示秩统计参数。
定义相关性为:
基于互信息的最大相关最小冗余算法求取三维影像组学特征和目标类别之间的互信息以及三维影像组学特征之间的互信息:
其中,Sn表示具有n个三维影像组学特征的训练数据集,fi,fj∈Sn,c为目标类别集合;p(fi,c)为fi和c之间的联合概率密度,p(fi)为fi的概率密度,p(c)为c的概率密度;p(fi,fj)为fi和fj之间的联合概率密度,p(fj)为fj的概率密度;I为互信息函数,为邻域精度。
有监督算法包括曼-惠特尼U检验(Mann-Whitney U)、基于L1正则化的最小绝对值收敛和选择算子(least absolute shrinkage and selection operator, LASSO),均采用公开方法即可。
影像组学模型建立过程中将病理诊断的金标准结果作为二分类真实标签,其中实性结节分为良性和恶性,磨玻璃结节分为非浸润性腺癌和浸润性腺癌。影像组学模型输入的特征为三维影像组学特征,多因素逻辑回归方法的分类器为:
其中,P表示实性结节为恶性或磨玻璃结节为浸润性腺癌的概率值;为常数项;为标准化处理后的三维影像组学特征的系数,i∈n,xsi为标准化处理后的三维影像组学特征的值。
计算所有样本的概率值,绘制受试者工作特征曲线(receiver operatingcharacteristic, ROC)并计算曲线下面积(area under curve, AUC)。在训练数据集中利用约登指数求解最佳截断值,并在测试数据集中进行验证,计算影像组学模型在最佳截断值下的敏感性、特异性和准确性。
步骤4,将实时获取的低剂量CT图像输入影像组学模型,得到对应的三维影像组学特征,从而进行肺结节风险评估。
实施例2:
本实施例在上述实施例1的基础上作实验验证。
在288例低剂量CT图像中,有实性结节141例,其中训练数据集98例(包括良性48例,恶性50例),测试数据集43例(包括良性21例,恶性22例)。实性结节的良恶性影像组学模型为:
其中,,/>,/>,GLCM_DifferenceVariance为灰度共生矩阵特征,GLRLM_RunEntropy为灰度游程矩阵特征,NGTDM_Strength为局部灰度差分矩阵特征。
以上3个三维影像组学特征为标准化处理后的值,Z-score转换所需参数如表1所示。
表1 Z-score转换所需参数
求出影像组学模型中的P,P为实性结节为恶性的概率,取值范围0-1,在训练数据集中利用约登指数求解出最佳截断值为0.495680。在测试数据集中对影像组学模型和最佳截断值的效能进行验证,得到AUC为0.976,敏感性为0.909,特异性为0.905,准确性为0.907。
在288例低剂量CT图像中,有磨玻璃结节147例,其中训练数据集103例(包括非浸润性腺癌60例,浸润性腺癌43例),测试数据集44例(包括非浸润性腺癌25例,浸润性腺癌19例)。磨玻璃结节的良恶性影像组学模型为:
其中,,/>,/>,/>,Shape_Flatness表示形态特征-扁平度,First order_Interquartile range表示直方图特征-四分位间距,NGTDM_Busyness表示局部灰度差分矩阵特征。
以上3个三维影像组学特征为标准化处理后的值,Z-score转换所需参数如表2所示。
表2 Z-score转换所需参数
求出影像组学模型中的P,P为磨玻璃结节为浸润性腺癌的概率,取值范围0-1,在训练数据集中利用约登指数求解出最佳截断值为0.404114。在测试数据集中对影像组学模型和最佳截断值的效能进行验证,得到AUC为0.933,敏感性为0.842,特异性为0.800,准确性为0.818。
通过上述实验验证可以看出,本发明利用剂量优化和图像优化方案标准化处理的低剂量CT图像,针对不同密度类型的肺结节构建影像组学模型,实现肺结节识别和风险评估,有利于为患者制定分级管理策略,减少过度诊断和重复检查带来的不必要辐射剂量暴露、经济成本和心理负担。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (6)

1.基于三维影像组学特征的肺结节识别系统,其特征在于:包括:
临床信息知识库模块,用于存储受检者胸部的低剂量CT图像以及临床信息;
图像预处理模块,用于对低剂量CT图像进行预处理;
肺结节自动识别和分割模块,用于基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割,得到目标分割结果;
影像组学特征提取模块,用于基于目标分割结果对三维影像组学特征进行提取,并将三维影像组学特征作为训练数据构建影像组学模型;
所述影像组学特征提取模块具体用于将所有受试者的三维影像组学特征构成训练数据,按照7:3的比例划分为训练数据集、测试数据集,利用训练数据集构建影像组学模型;
首先进行三维影像组学特征的选择,采用无监督算法和有监督算法序贯串联运行的方式学习特征,再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型;
所述无监督算法包括斯皮尔曼系数相关分析、基于互信息的最大相关最小冗余算法;
斯皮尔曼系数相关分析计算秩统计参数Rs,计算方法为:
其中,x、y分别表示待分析相关性的变量序列对,n表示变量序列x和y的元素个数,i表示第i个元素;Oi表示变量序列x中第i个元素的秩次,Qi表示变量序列y中第i个元素的秩次;Rs表示秩统计参数;
基于互信息的最大相关最小冗余算法求取三维影像组学特征和目标类别之间的互信息以及三维影像组学特征之间的互信息:
其中,Sn表示具有n个三维影像组学特征的训练数据集,fi,fj∈Sn,c为目标类别集合;p(fi,c)为fi和c之间的联合概率密度,p(fi)为fi的概率密度,p(c)为c的概率密度;p(fi,fj)为fi和fj之间的联合概率密度,p(fj)为fj的概率密度;I为互信息函数,为邻域精度;
肺结节风险评估模块,用于通过影像组学模型对受检者的低剂量CT图像进行肺结节风险评估。
2.基于三维影像组学特征的肺结节识别方法,其特征在于:包括以下步骤:
步骤1,对获取的低剂量CT图像进行预处理;
步骤2,基于深度学习的全自动肺结节识别和分割软件对预处理后的低剂量CT图像进行肺结节的识别和分割,得到目标分割结果;
步骤3,基于目标分割结果对三维影像组学特征进行提取,将三维影像组学特征作为训练数据构建影像组学模型;
所述步骤3中,将三维影像组学特征作为训练数据构建影像组学模型的步骤,包括:
所有受试者的三维影像组学特征构成训练数据,按照7:3的比例划分为训练数据集、测试数据集,利用训练数据集构建影像组学模型;
首先进行三维影像组学特征的选择,采用无监督算法和有监督算法序贯串联运行的方式学习特征,再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型;
所述无监督算法包括斯皮尔曼系数相关分析、基于互信息的最大相关最小冗余算法;
斯皮尔曼系数相关分析计算秩统计参数Rs,计算方法为:
其中,x、y分别表示待分析相关性的变量序列对,n表示变量序列x和y的元素个数,i表示第i个元素;Oi表示变量序列x中第i个元素的秩次,Qi表示变量序列y中第i个元素的秩次;Rs表示秩统计参数;
基于互信息的最大相关最小冗余算法求取三维影像组学特征和目标类别之间的互信息以及三维影像组学特征之间的互信息:
其中,Sn表示具有n个三维影像组学特征的训练数据集,fi,fj∈Sn,c为目标类别集合;p(fi,c)为fi和c之间的联合概率密度,p(fi)为fi的概率密度,p(c)为c的概率密度;p(fi,fj)为fi和fj之间的联合概率密度,p(fj)为fj的概率密度;I为互信息函数,为邻域精度;
步骤4,将实时获取的低剂量CT图像输入影像组学模型,得到对应的三维影像组学特征,从而进行肺结节风险评估。
3.根据权利要求2所述的基于三维影像组学特征的肺结节识别方法,其特征在于:所述步骤1中,预处理包括依次进行的分辨率重建、灰度均值校正、灰度图像增强,或其中一种。
4.根据权利要求2所述的基于三维影像组学特征的肺结节识别方法,其特征在于:所述步骤2中,基于深度学习的全自动肺结节识别和分割软件为uAI Discover-Lung,基于深度学习的全自动肺结节识别和分割软件输出的信息包括每个肺结节的所在层号、位置、密度类型、大小、平均密度信息,其中密度类型为实性结节或磨玻璃结节,大小为最大长径、最大短径、体积。
5.根据权利要求2所述的基于三维影像组学特征的肺结节识别方法,其特征在于:所述步骤3中,三维影像组学特征包括形态特征、一阶特征、纹理特征,所述纹理特征包括灰度共生矩阵特征、灰度游程矩阵特征、灰度连通区域矩阵特征、灰度相关矩阵特征、局部灰度差分矩阵特征;
采用Z-score转换对提取的所有三维影像组学特征进行数据标准化处理:
其中,xs为标准化处理后的三维影像组学特征值,x为标准化处理前的三维影像组学特征值,为样本三维影像组学特征的平均值,/>为样本三维影像组学特征的标准差。
6.根据权利要求2所述的基于三维影像组学特征的肺结节识别方法,其特征在于:所述再采用基于反向逐步选择的多因素逻辑回归方法建立影像组学模型的步骤,包括:
影像组学模型建立过程中将病理诊断的金标准结果作为二分类真实标签,其中实性结节分为良性和恶性,磨玻璃结节分为非浸润性腺癌和浸润性腺癌;影像组学模型输入的特征为三维影像组学特征,多因素逻辑回归方法的分类器为:
其中,P表示实性结节为恶性或磨玻璃结节为浸润性腺癌的概率值;为常数项;/>为标准化处理后的三维影像组学特征的系数,i∈n,xsi为标准化处理后的三维影像组学特征的值。
CN202311084858.6A 2023-08-28 2023-08-28 基于三维影像组学特征的肺结节识别系统和方法 Active CN116823818B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311084858.6A CN116823818B (zh) 2023-08-28 2023-08-28 基于三维影像组学特征的肺结节识别系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311084858.6A CN116823818B (zh) 2023-08-28 2023-08-28 基于三维影像组学特征的肺结节识别系统和方法

Publications (2)

Publication Number Publication Date
CN116823818A CN116823818A (zh) 2023-09-29
CN116823818B true CN116823818B (zh) 2023-11-07

Family

ID=88120571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311084858.6A Active CN116823818B (zh) 2023-08-28 2023-08-28 基于三维影像组学特征的肺结节识别系统和方法

Country Status (1)

Country Link
CN (1) CN116823818B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115393280A (zh) * 2022-07-27 2022-11-25 四川大学华西医院 多个ct重建序列影像组学特征预测肺结节风险的系统
CN116563624A (zh) * 2023-05-08 2023-08-08 山东大学 一种基于多任务学习的肺结节分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107709636A (zh) * 2015-05-19 2018-02-16 威斯塔解剖学和生物学研究所 用于诊断或检测肺癌的方法和组合物

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115393280A (zh) * 2022-07-27 2022-11-25 四川大学华西医院 多个ct重建序列影像组学特征预测肺结节风险的系统
CN116563624A (zh) * 2023-05-08 2023-08-08 山东大学 一种基于多任务学习的肺结节分类方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Comparison of Radiomic models based on low-dose and sandard-dose CT for prediction of Adenocarcinomas and Benign lesions in solid pulmonary nodules;Jieke Liu;《frontiers》;第1-15页 *
Evaluation of geometric feature descriptors for detection and classification of lung nodules in low dose CT scans of the chest;Amal Farag;《IEEE》;第1-11页 *
基于三维混合特征和机器学习的肺结节影像智能诊断方法;刘昶;《中国优秀硕士学位论文全文数据库》;E072-151 *
基于影像学特征构建风险评估模型预测肺结节良恶性的研究;田博;《肿瘤预防与治疗》;691-696 *
肺癌高危人群低剂量螺旋CT筛查的临床分析;青浩渺;《放射学实践》;71-75 *

Also Published As

Publication number Publication date
CN116823818A (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
Yun et al. Improvement of fully automated airway segmentation on volumetric computed tomographic images using a 2.5 dimensional convolutional neural net
CN111784671B (zh) 基于多尺度深度学习的病理图像病灶区域检测方法
CN111488921B (zh) 一种全景数字病理图像智能分析系统及方法
Udeshani et al. Statistical feature-based neural network approach for the detection of lung cancer in chest x-ray images
CN111598871B (zh) 多特征融合辅助检测肺部磨玻璃影结节系统及介质
CN112365973B (zh) 基于对抗网络和Faster R-CNN的肺结节辅助诊断系统
Xu et al. Using transfer learning on whole slide images to predict tumor mutational burden in bladder cancer patients
CN110766670A (zh) 一种基于深度卷积神经网络的乳腺钼靶图像肿瘤定位算法
CN116703901B (zh) 肺部医学ct影像分割及分类装置及设备
WO2003046808A2 (en) Method for distinguishing benign and malignant nodules
EP4046061A1 (en) Weakly supervised multi-task learning for cell detection and segmentation
Shen et al. Multiclassifier fusion based on radiomics features for the prediction of benign and malignant primary pulmonary solid nodules
Pandit et al. Deep learning neural network for lung cancer classification: enhanced optimization function
Liu et al. Extracting lungs from CT images via deep convolutional neural network based segmentation and two-pass contour refinement
Tian et al. Radiomics and Its Clinical Application: Artificial Intelligence and Medical Big Data
Rezaie et al. Detection of lung nodules on medical images by the use of fractal segmentation
CN116823818B (zh) 基于三维影像组学特征的肺结节识别系统和方法
Sun et al. Liver tumor segmentation and subsequent risk prediction based on Deeplabv3+
CN115880245A (zh) 一种基于自监督的乳腺癌疾病分类方法
Mousavi Moghaddam et al. Lung parenchyma segmentation from CT images with a fully automatic method
Liu et al. Novel superpixel‐based algorithm for segmenting lung images via convolutional neural network and random forest
CN113889235A (zh) 一种三维医学影像无监督特征抽取系统
CN113870194A (zh) 深层特征和浅层lbp特征融合的乳腺肿瘤超声图像处理装置
CN113139928A (zh) 肺结节检测模型的训练方法和肺结节检测方法
Uribe et al. Part 1: introduction to machine learning in the nuclear medicine context

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant