CN116825372A - 一种乳癌患者淋巴结转移预测模型及其构建方法 - Google Patents
一种乳癌患者淋巴结转移预测模型及其构建方法 Download PDFInfo
- Publication number
- CN116825372A CN116825372A CN202310776890.4A CN202310776890A CN116825372A CN 116825372 A CN116825372 A CN 116825372A CN 202310776890 A CN202310776890 A CN 202310776890A CN 116825372 A CN116825372 A CN 116825372A
- Authority
- CN
- China
- Prior art keywords
- lymph node
- breast cancer
- model
- image
- axillary lymph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000026310 Breast neoplasm Diseases 0.000 title claims abstract description 74
- 206010006187 Breast cancer Diseases 0.000 title claims abstract description 70
- 208000007433 Lymphatic Metastasis Diseases 0.000 title claims abstract description 46
- 238000010276 construction Methods 0.000 title description 6
- 210000001165 lymph node Anatomy 0.000 claims abstract description 90
- 238000002591 computed tomography Methods 0.000 claims abstract description 43
- 238000010801 machine learning Methods 0.000 claims abstract description 19
- 210000004072 lung Anatomy 0.000 claims abstract description 15
- 230000001575 pathological effect Effects 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 26
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 230000007170 pathology Effects 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 9
- 230000035945 sensitivity Effects 0.000 claims description 6
- 238000000556 factor analysis Methods 0.000 claims description 4
- 238000010219 correlation analysis Methods 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 2
- 238000009826 distribution Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000011282 treatment Methods 0.000 abstract description 13
- 238000011161 development Methods 0.000 abstract description 5
- 238000005520 cutting process Methods 0.000 abstract description 4
- 238000004458 analytical method Methods 0.000 description 12
- 238000012549 training Methods 0.000 description 10
- 206010027476 Metastases Diseases 0.000 description 9
- 238000003745 diagnosis Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 230000009401 metastasis Effects 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 7
- 210000000481 breast Anatomy 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 238000011160 research Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 230000001394 metastastic effect Effects 0.000 description 5
- 206010061289 metastatic neoplasm Diseases 0.000 description 5
- 238000001356 surgical procedure Methods 0.000 description 5
- 238000011270 sentinel node biopsy Methods 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000003902 lesion Effects 0.000 description 3
- 230000002980 postoperative effect Effects 0.000 description 3
- 238000002604 ultrasonography Methods 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 102000015694 estrogen receptors Human genes 0.000 description 2
- 108010038795 estrogen receptors Proteins 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 208000030776 invasive breast carcinoma Diseases 0.000 description 2
- 238000009607 mammography Methods 0.000 description 2
- 238000009099 neoadjuvant therapy Methods 0.000 description 2
- 230000000683 nonmetastatic effect Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 101100314454 Caenorhabditis elegans tra-1 gene Proteins 0.000 description 1
- 101000851181 Homo sapiens Epidermal growth factor receptor Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 206010030124 Oedema peripheral Diseases 0.000 description 1
- 238000012879 PET imaging Methods 0.000 description 1
- -1 PR) Proteins 0.000 description 1
- 102100025803 Progesterone receptor Human genes 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 206010048038 Wound infection Diseases 0.000 description 1
- 201000000967 bilateral breast cancer Diseases 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002055 immunohistochemical effect Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000011227 neoadjuvant chemotherapy Methods 0.000 description 1
- 238000002559 palpation Methods 0.000 description 1
- 238000012636 positron electron tomography Methods 0.000 description 1
- 239000000583 progesterone congener Substances 0.000 description 1
- 108090000468 progesterone receptors Proteins 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 210000005005 sentinel lymph node Anatomy 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20092—Interactive image processing based on input by user
- G06T2207/20104—Interactive definition of region of interest [ROI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30068—Mammography; Breast
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/41—Medical
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Pathology (AREA)
- Radiology & Medical Imaging (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Computer Graphics (AREA)
- Quality & Reliability (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明提供一种乳癌患者淋巴结转移预测模型,所述模型包括对二维的肺部增强CT片进行三维重建后,建立腋窝淋巴结图谱,选取其中所有的腋窝淋巴结为ROI区域,且选取每个腋窝淋巴结的全部影像组学特征中的5个以上联用以区分乳腺癌是否有腋窝淋巴结转移;且使用K最近邻机器学习预测模型构建所述乳腺癌患者腋窝淋巴结转移预测模型。本发明建立的模型可以无创地预测乳腺癌是否有腋窝淋巴结转移,该模型中未纳入患者的临床病理特征,且该模型中的图像切割并不基于乳腺肿瘤,而是基于腋窝淋巴结;本发明所述模型用于确定合适的腋窝治疗方案,从而避免不必要的腋窝手术和并发症,有助于乳腺癌更精准的手术和辅助治疗模式的开展。
Description
技术领域
本发明涉及乳腺癌预测模型领域,具体涉及一种乳癌患者淋巴结转移预测模型及其构建方法。
背景技术
乳腺癌也称为乳癌。乳腺癌腋窝淋巴结转移是乳腺癌独立的预后因子,同时决定着患者的治疗方式,临床腋窝淋巴结评估是乳腺癌诊断和治疗的重要组成部分。
目前腋窝淋巴结的临床评估主要依靠临床触诊、B超、CT等二维影像学检查方法,敏感性和特异性较低,诊断效能低下,且淋巴结不同于其他病灶,定位困难,检出率低,前哨淋巴结活检术虽然评估腋窝淋巴结准确,但属于有创操作,会增加上肢水肿、手术部位疼痛和伤口感染等一系列并发症的风险,当前临床上所采用的无创评估方法都不尽如意。
影像组学的出现给医学诊治带来便利,当前关于乳腺癌的影像组学研究越来越多,但是当前的研究都是基于乳腺病灶去预测腋窝淋巴结转移,由于影像淋巴结定位难和检出率低,当前还没有研究基于淋巴结本身去预测腋窝淋巴结转移。
例如,中国专利申请CN202010957962提供一种乳腺癌患者腋窝淋巴结转移预测模型及其构建方法,该发明利用人工智能机器学习算法,基于乳腺癌患者的磁共振影像数据及临床特征数据基础,建立乳腺癌患者腋窝淋巴结转移的人工智能预测模型;所述预测模型具有精准、简便、无创等优点,能够有效对乳腺癌患者术前腋窝淋巴结转移进行有效评价,有助于辅助乳腺癌临床诊疗决策,减少患者不必要的腋窝淋巴结清扫手术,减少手术并发症的发生,提高患者的生活质量,有更高预测效能和临床收益,对指导临床治疗策略、加强临床治疗干预及后续的个体化随访具有重要的指导意义。但因该专利申请使用的是磁共振图像(MRI)数据,且该专利的模型中纳入了临床病理特征,以及该专利的图像切割基于乳腺肿瘤,因而该模型和方法具有诸多缺陷;例如其中的MRI检测范围有限,不能检测到所有腋窝淋巴结。
中国专利申请CN202110463515公开了一种基于乳腺专用PET影像组学预测腋窝淋巴结转移的方法,其通过提取乳腺癌原发灶的MAMMIPET影像组学特征,并融合原发灶免疫组化病理及相关临床因素,构建预测乳腺癌淋巴结转移风险的模型,实现对乳腺癌患者治疗前淋巴结分期的精准无创预测,补充了常规影像技术特异性低的弊端,同时为医生对乳腺癌患者精准临床分期以及治疗方案提供更加具体的参考依据,提高治疗的成功率。但因该专利申请使用的是PET图像数据,以及该专利的图像切割同样基于乳腺肿瘤,因而该方法同样具有诸多缺陷。
中国专利申请CN202110271312提供一种乳腺癌腋窝淋巴结转移状态的检测方法及相关装置,其公开了一种乳腺癌腋窝淋巴结转移状态的检测方法及相关装置,方法包括:获取病人的腋窝淋巴结部位的B型超声图像和剪切波弹性超声图像;将B型超声图像和剪切波弹性超声图像输入到深度学习模型中进行特征提取、特征融合和分类预测,得到病人的乳腺癌腋窝淋巴结转移状态检测结果。该申请解决了现有技术通过机器学习方法进行乳腺癌腋窝淋巴结转移状态的检测,由于数据样本较少,导致机器学习模型的预测性能不佳的技术问题。但该专利申请使用的是超声图像数据,而超声图像的判读依赖于放射科医生的主观评价,这导致了不同观察者之间存在差异。因而该检测方法及相关装置同样存在明显的弊端。
中国专利申请CN202110712181提供一种基于影像组学构建乳腺癌患者淋巴结转移预测模型的方法,包括:采集患者的磁共振图像数据和临床特征数据;基于磁共振图像数据提取影像特征;采用随机森林算法对影像特征进行筛选得到若干个关键影像特征,基于该关键影像特征利用支持向量机算法建立影像特征预测模型;通过对临床特征数据进行单因素分析筛选得到关键临床特征,采用支持向量机算法根据关键临床特征建立临床特征预测模型;采用支持向量机算法根据关键影像特征和关键临床特征建立淋巴结转移综合预测模型。其实施例采用随机森林算法和支持向量机算法建立模型,能够基于结构风险化最小原则建立预测模型,且能够避免过学习的问题,使得构建得到的预测模型更稳定以及准确。但该专利申请使用的是磁共振图像数据,且该专利的图像切割同样基于乳腺肿瘤。因此,该模型和方法依然有多个缺陷。
中国专利申请CN201810557069提供一种基于LASSO回归的乳腺癌腋窝淋巴结转移状态的判别方法,该方法包括:步骤1、对采集到的病人的乳腺癌X射线图像进行分割,确定肿瘤所在处的多个病灶部位图像;步骤2、将所述多个病灶部位图像分为训练集和测试集,并对所有的病灶部位图像提取高维特征,构建乳腺病灶图像特征数据库;步骤3、根据训练集里的乳腺病灶图像特征数据和病人的病理信息,采用LASSO回归算法,构建乳腺癌腋窝淋巴结转移识别模型;步骤4、根据所述乳腺癌腋窝淋巴结转移识别模型,对测试集里的病灶部位图像进行识别,确定病人的乳腺癌腋窝淋巴结转移状态。该发明能够进一步挖掘图像中对识别有意义的数据,提升基于X射线图像的自动识别水平。但该专利申请使用的是X射线图像数据,且图像切割基于乳腺肿瘤,数字乳腺X线摄影对于腋窝淋巴结的可视化是有限的,通常只有50%的患者在常规行乳腺X线检查中可以看到腋窝I级淋巴结,深I级或II级淋巴结一般很难看到。因此,该乳腺癌腋窝淋巴结转移状态的判别方法的准确度大幅受限。
因此,本领域仍然需要一种新的乳癌患者淋巴结转移预测模型及其构建方法。
发明内容
因此,本发明提供一种乳癌患者淋巴结转移预测模型,所述模型用于实现无创预测乳腺癌是否有腋窝淋巴结转移,所述模型包括对二维的肺部增强CT片进行三维重建后,建立腋窝淋巴结图谱,选取其中所有的腋窝淋巴结为ROI区域,且选取每个腋窝淋巴结的全部影像组学特征中的5个以上影像组学特征联用进行区分所述乳腺癌是否有腋窝淋巴结转移;且使用K最近邻机器学习预测模型构建所述乳腺癌患者腋窝淋巴结转移预测模型。
本发明中,每个腋窝淋巴结都有107个影像组学特征。
本发明采用三维重建技术,对于二维CT影像上微小的腋窝淋巴结病灶进行识别重建,并进行空间定位,提取腋窝淋巴结的影像组学特征,建立机器学习模型,预测乳腺癌患者腋窝淋巴结的转移状态。
在一种具体的实施方式中,所述模型中使用腋窝淋巴结的如下22个影像组学特征中的9个以上影像组学特征联用;所述22个影像组学特征包括:伸长率、平整度、最小轴长度、最大2D直径、球形度、特征值的百分之十的值、四分位距离、峰度、均值、最小特征值、灰度值范围、均方根误差、偏度、集群显著性、集群阴影、相关性、差分熵、相关性信息度量2、联合能量、测量具有较高灰度值的大相关性的联合分布、灰度非均匀归一化、强度。
在一种具体的实施方式中,所述22个影像组学特征全部联用。
本发明中,对这22个影像组学特征中的9个以上影像组学特征联用,则辨别是否有腋窝淋巴结转移时已经比较准确,而若这22个影像组学特征联用,则效果最佳,具体是其曲线下面积(AUC)能达到0.93以上。
在一种具体的实施方式中,所述三维重建使用Vitaworks软件。
在一种具体的实施方式中,所述模型的特征全部基于影像组学特征,而不包含临床病理特征。
本发明还提供一种如上所述乳癌患者淋巴结转移预测模型的构建方法,包括如下步骤:
1)、数据收集:收集和处理患者的二维肺部高分辨率薄层增强CT图像数据及其临床病理特征数据;
2)、构建乳腺癌腋窝淋巴结三维图谱:利用算法自动识别、分割和提取二维CT图像中的腋窝淋巴结信息,构建出三维的腋窝淋巴结图谱;
3)、建立影像组学预测模型:通过单因素方差分析、相关性分析、Lasso回归筛选乳腺癌患者CT腋窝淋巴结图像数据中与乳腺癌腋窝淋巴结状态相关的关键影像组学特征,并根据K最近邻算法建立相应的机器学习预测模型。
在一种具体的实施方式中,在步骤2)和步骤3)之间,还包括使用3D-Slicer软件中的Segmentation模块,进行入组患者的淋巴结多个层面的ROI勾画;且使用3D-Slicer软件中的Radiomics影像组学模块,对CT原始图像中的ROI掩模进行特征提取。
在一种具体的实施方式中,在步骤3)中,在建立预测模型后,还包括利用嵌套交叉验证的方法评估预测模型的性能,且表征预测效能的指标包括曲线下面积、特异性、敏感性、假阳性率和假阴性率。
相比于现有技术,本发明的有益效果至少包括如下几个方面:
1、本发明基于肺部高分辨率薄层增强CT图像数据,该检查精细,检查范围囊括了所有腋窝淋巴结所在位置,且该检查是患者术前常规要完成的,经济且方便。且本发明勾画的病灶全部为淋巴结,更能反映转移淋巴结的形态特征,诊断效能更高。此外,肺部高分辨率薄层增强CT与彩超相比,一方面分辨率更高,检查更加精细,能够捕捉更微小的结构变化,从而能够更好地判断淋巴结是否受到肿瘤的侵犯,另一方面在影像上可以同时对比双侧腋窝淋巴结的大小、形态、数量等,减少主观判断误差,检查更具客观性和全面性。
2、本发明一共建立多种机器学习模型,并通过诊断效能对比选出最优越的预测模型,其诊断效能高。本发明建立的多种机器学习模型分别是K最近邻(k-NearestNeighbour,k-NN)、线性判别分析(LDA)、二次判别分析(Quadratic DiscriminantAnalysis,QDA)、朴素贝叶斯(Naive Bayes,NB)和分类树(Classification Trees,CART)。
3、本研究的预测模型只包含CT影像组学特征,不包含临床病理特征,这意味着该预测模型不需要考量临床病理因素,使得该预测模型具有更加广泛的临床适用范围,更易于实现临床应用。
4、在既往的影像组学研究中,淋巴结的定位几乎完全依赖于放射科医师的主观判断,往往难以准确地找到每个腋窝淋巴结的具体位置,因此大多数研究都是基于乳腺癌病灶去预测腋窝淋巴结转移,忽略了淋巴结本身的病灶改变,降低了淋巴结预测的精准度,本发明基于三维可视化技术,实现了腋窝淋巴结在影像学上准确定位,使定位过程不再受放射科医师主观阅片水平的影响,从而大大减少了人工误差,提高了定位的客观性和准确性,总的来说,本发明基于淋巴结本身预测淋巴结,而不是通过乳腺病灶,结果将更加准确。
附图说明
图1为预测模型的开发流程示意图。且依次包括CT三维重建、勾画ROI区域、特征提取和筛选、构建模型示意图。
图2为本发明中K最近邻预测模型的ROC曲线。
图3为本发明中K最近邻预测模型的PR曲线。
具体实施方式
本发明中的淋巴结均特指腋窝淋巴结。本领域技术人员可知,乳腺病灶比较大,一般为2~5cm左右,医生易于肉眼识别;但淋巴结比较小,一般只有0.5~1cm左右,医生肉眼也能看到一些淋巴结,但一般很难肉眼找全该CT片上的所有淋巴结,因而本发明通过肺部CT片三维重建定位后便清楚地知道病人到底有多少个淋巴结,其每个淋巴结跟病人的CT图像对应。有的病人肺部CT片上有几个淋巴结,有的病人肺部CT片上有几十个淋巴结。
本发明采用三维重建技术,对于二维CT影像上微小病灶进行识别重建,并进行空间定位,提取淋巴结的影像组学特征,建立机器学习模型,预测乳腺癌腋窝淋巴结的转移状态。
本发明回顾性收集了在中南大学湘雅二医院乳腺外科完成了术前肺部高分辨率薄层增强CT检查和后续手术的乳腺癌患者资料。
病例入组标准如下:(1)在中南大学湘雅二医院接受乳腺癌手术且术后病理证实为浸润性乳腺癌;(2)在中南大学湘雅二医院接受患侧腋窝淋巴结清扫术;(3)在手术前的1个月内在中南大学湘雅二医院放射科完成了肺部高分辨率薄层增强CT检查;(4)具有完整的临床病理资料。
病例排除标准如下:(1)确诊为双侧乳腺癌;(2)手术前接受过新辅助化疗;(3)CT扫描序列不齐全,成像质量差,仅完成平扫,或在外院进行的CT检查;(4)腋窝手术方式为SLNB(前哨淋巴结活检)或SLNB+ALND(前哨淋巴结活检+腋窝淋巴结清扫);(5)有远处转移病灶或合并其他恶性肿瘤。
表1
本发明回顾性地收集了156例在中南大学湘雅二医院乳腺外科完成了术前肺部高分辨率薄层增强CT检查和ALND手术的单侧浸润性乳腺癌患者,其中125例ALND术后病理提示腋窝淋巴结未转移,31例ALND术后病理提示腋窝淋巴结全部转移,所有患者均具有完整的临床病理资料,未发生远处转移,且未接受过NAT(新辅助治疗)。入组患者基线特征如表1,表1为按乳腺癌腋窝淋巴结转移状态分组的患者基线特征。表1中,序号1的数据是括号前为年龄的平均值,括号内为标准差;序号2~10的数据都是括号前为人数,括号内为人数所占的百分比,因而序号2~10每个数据同列百分比之和为100%。
利用三维可视化技术,将入组患者的肺部高分辨率薄层增强CT进行三维重建,构建腋窝淋巴结三维图谱。
以图谱定位腋窝淋巴结所在位置,在CT图像上勾画转移淋巴结感兴趣区域(ROI),从ROI中提取影像组学特征。并采用单因素方差分析、相关性分析、Lasso回归进行影像组学特征筛选。
基于最优特征,采用多种机器学习方法构建评估腋窝淋巴结有无转移的预测模型。
利用嵌套交叉验证的方法评估预测模型的性能,表征预测效能的指标包括曲线下面积(AUC)、特异性、敏感性、假阳性率、假阴性率。其中,AUC被定义为ROC曲线下与坐标轴围成的面积,显然这个面积的数值不会大于1。又由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值范围在0.5和1之间。AUC越接近1.0,检测方法真实性越高;等于0.5时,则真实性最低,无应用价值。
所述预测模型的开发流程如图1所示,其中依次包括CT三维重建示意图、勾画ROI区域示意图、特征提取和筛选示意图、构建模型示意图。
研究结果:共有156名患者符合入组标准并完成了三维重建,其中转移组31人,未转移组125人。利用三维重建技术建立了腋窝淋巴结图谱。
总计勾画了936个未转移淋巴结和336个转移淋巴结的ROI区域,从ROI中一共提取了107个特征,经过筛选后,总计22个特征纳入模型。如下表2为纳入模型的22个影像组学特征类别及具体名称。
表2
对于入组人群的临床病理因素进行单因素和多因素分析发现,转移组和未转移组的年龄、肿瘤大小、临床淋巴结分期、分子分型无明显统计学差异(P>0.05)。
利用22个影像组学特征分别建立K最近邻、线性判别分析、二次判别分析、贝叶斯学习、和决策树(分类树)机器学习预测模型,发现K最近邻模型在预测腋窝淋巴结转移方面具有最佳诊断性能。
表3为各个模型的AUC值比较,表3中括号内的数据为95%的置信区间。表4为各个模型的预测效能的指标,表4中括号内的数据std即标准差。
表3
机器学习方法 | 训练集 | 验证集 |
K最近邻 | 0.955(0.942-0.968) | 0.927(0.914-0.948) |
线性判别分析 | 0.942(0.927-0.957) | 0.937(0.923-0.954) |
二次判别分析 | 0.944(0.932-0.956) | 0.924(0.912-0.942) |
贝叶斯学习 | 0.925(0.910-0.940) | 0.923(0.908-0.936) |
决策树 | 0.916(0.891-0.941) | 0.860(0.834-0.878) |
表4
机器学习方法 | 敏感性(std) | 特异性(std) | 假阴性率(std) | 假阳性率(std) |
K最近邻 | 0.667(0.04) | 0.990(0.03) | 0.333(0.04) | 0.010(0.03) |
线性判别分析 | 0.729(0.05) | 0.973(0.05) | 0.271(0.05) | 0.027(0.05) |
二次判别分析 | 0.723(0.05) | 0.957(0.03) | 0.277(0.05) | 0.043(0.03) |
贝叶斯学习 | 0.771(0.05) | 0.930(0.04) | 0.229(0.05) | 0.071(0.04) |
决策树 | 0.738(0.06) | 0.943(0.05) | 0.262(0.06) | 0.057(0.05) |
本发明中,使用k-NN机器学习算法,所得的预测模型在训练集中具有极高的预测性能(AUC=0.955),且其特异性在所有预测模型中最高,高达0.990,这表明该预测模型具有极低的误诊率。图2和图3分别为本发明中k-NN预测模型的ROC曲线和PR曲线。
本发明还提供一种基于影像组学预测乳腺癌腋窝淋巴结转移的方法,其包括如下具体步骤:
S1、收集乳腺癌患者的临床病理信息和CT信息;患者的临床病理因素包括年龄、绝经状态、肿瘤的病理TNM分期、病检报告时间、肿瘤类型、病理分级、雌激素受体状态(Estrogen Receptor,ER)、孕激素受体状态(Progesterone Receptor,PR)、人表皮生长因子受体-2状态(Human Epidermal Growth Factor Receptor 2,HER2)、肿瘤增殖指数Ki-67、肿瘤分子分型、腋窝淋巴结转移数量、腋窝淋巴结总数量;患者的CT信息包括住院号、CT号、CT检查时间;
S2、采集入组患者的肺部高分辨率薄层增强CT图像,利用算法自动识别、分割和提取二维CT图像中的腋窝淋巴结信息,构建腋窝淋巴结三维图谱;
S3、在患者的腋窝淋巴结三维图谱上,可使用三维可视化技术的定位导航功能找到所要定位的目标淋巴结,并确定其在CT图像上的位置;
S4、使用3D-Slicer软件中的Segmentation模块,进行入组患者的淋巴结多个层面的ROI勾画;
S5、利用3D-Slicer软件中的Radiomics影像组学模块,对CT原始图像中的ROI掩模进行特征提取;
S6、把患者按比例随机分为训练集和测试集,所述训练集用于训练预测模型,所述测试集用于测试预测模型的性能;
S7、对训练集中的影像组学特征运用机器学习的方法筛选出与乳腺癌腋窝淋巴结转移相关的影像组学特征,训练预测模型,生成与腋窝淋巴结转移相关的影像组学预测模型,并在测试集中验证模型,具体步骤为:使用线性判别分析、二次判别分析、朴素贝叶斯、K最近邻和分类树算法分别训练预测模型,生成与乳腺癌腋窝淋巴结转移相关的影像组学预测模型,在测试集上计算模型的敏感性、特异性、假阳性率、假阴性率、曲线下面积,画出AUC曲线和精度-召回率曲线,度量模型的性能。
本发明利用三维重建技术进行腋窝淋巴结空间定位,对于ROI区域(感兴趣区域)的勾画不需要影像学医师,减免了人力,此外,勾画的感兴趣区域是病灶本身,即腋窝淋巴结。而既往研究都是勾画的乳腺病灶,基于淋巴结感兴趣区域的勾画能够更加准确的提取有意义的影像组学特征,利用机器学习方法,发明人建立了一种模型,可以高效预测腋窝淋巴结的转移,为下一步腋窝的诊治提供参考。值得注意的是,本发明的模型特征全部基于影像组学特征,没有包含临床特征,这意味着患者只需要完善一个CT检查即可实现淋巴结的预测,经济方便,适合推广。
本发明所述基于影像组学预测乳腺癌腋窝淋巴结转移的方法中,在步骤S1中一般会收集乳腺癌患者的临床病理信息,但经分析发现这些临床病理信息对乳腺癌腋窝淋巴结转移与否都没有统计学意义。也就是说,使用本发明所述模型预测乳腺癌腋窝淋巴结转移时,不需要考虑任何的患者临床病理特征,而是完全基于影像组学特征。总的来说,本发明建立了基于三维重建技术的影像组学模型,可以无创地预测乳腺癌患者的腋窝淋巴结受累情况,该模型中未纳入患者的临床病理特征,且该模型中的图像切割并不基于乳腺肿瘤,而是基于腋窝淋巴结;本发明所述模型用于确定合适的腋窝治疗方案,从而避免不必要的腋窝手术和并发症,有助于乳腺癌更精准的手术和辅助治疗模式的开展。
以上内容是结合具体的优选实施方式对本发明作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演和替换,都应当视为属于本发明的保护范围。
Claims (8)
1.一种乳癌患者淋巴结转移预测模型,所述模型用于实现无创预测乳腺癌是否有腋窝淋巴结转移,所述模型包括对二维的肺部增强CT片进行三维重建后,建立腋窝淋巴结图谱,选取其中所有的腋窝淋巴结为ROI区域,且选取每个腋窝淋巴结的全部影像组学特征中的5个以上影像组学特征联用进行区分所述乳腺癌是否有腋窝淋巴结转移;且使用K最近邻机器学习预测模型构建所述乳腺癌患者腋窝淋巴结转移预测模型。
2.根据权利要求1所述的模型,其特征在于,所述模型中使用腋窝淋巴结的如下22个影像组学特征中的9个以上影像组学特征联用;所述22个影像组学特征包括:伸长率、平整度、最小轴长度、最大2D直径、球形度、特征值的百分之十的值、四分位距离、峰度、均值、最小特征值、灰度值范围、均方根误差、偏度、集群显著性、集群阴影、相关性、差分熵、相关性信息度量2、联合能量、测量具有较高灰度值的大相关性的联合分布、灰度非均匀归一化、强度。
3.根据权利要求2所述的模型,其特征在于,所述22个影像组学特征全部联用。
4.根据权利要求1所述的模型,其特征在于,所述三维重建使用Vitaworks软件。
5.根据权利要求1所述的模型,其特征在于,所述模型的特征全部基于影像组学特征,而不包含临床病理特征。
6.一种如权利要求1~5中任意一项所述乳癌患者淋巴结转移预测模型的构建方法,包括如下步骤:
1)、数据收集:收集和处理患者的二维肺部高分辨率薄层增强CT图像数据及其临床病理特征数据;
2)、构建乳腺癌腋窝淋巴结三维图谱:利用算法自动识别、分割和提取二维CT图像中的腋窝淋巴结信息,构建出三维的腋窝淋巴结图谱;
3)、建立影像组学预测模型:通过单因素方差分析、相关性分析、Lasso回归筛选乳腺癌患者CT腋窝淋巴结图像数据中与乳腺癌腋窝淋巴结状态相关的关键影像组学特征,并根据K最近邻算法建立相应的机器学习预测模型。
7.根据权利要求6所述的方法,其特征在于,在步骤2)和步骤3)之间,还包括使用3D-Slicer软件中的Segmentation模块,进行入组患者的淋巴结多个层面的ROI勾画;且使用3D-Slicer软件中的Radiomics影像组学模块,对CT原始图像中的ROI掩模进行特征提取。
8.根据权利要求6或7所述的方法,其特征在于,在步骤3)中,在建立预测模型后,还包括利用嵌套交叉验证的方法评估预测模型的性能,且表征预测效能的指标包括曲线下面积、特异性、敏感性、假阳性率和假阴性率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310776890.4A CN116825372A (zh) | 2023-06-29 | 2023-06-29 | 一种乳癌患者淋巴结转移预测模型及其构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310776890.4A CN116825372A (zh) | 2023-06-29 | 2023-06-29 | 一种乳癌患者淋巴结转移预测模型及其构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116825372A true CN116825372A (zh) | 2023-09-29 |
Family
ID=88125396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310776890.4A Pending CN116825372A (zh) | 2023-06-29 | 2023-06-29 | 一种乳癌患者淋巴结转移预测模型及其构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116825372A (zh) |
-
2023
- 2023-06-29 CN CN202310776890.4A patent/CN116825372A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sechopoulos et al. | Artificial intelligence for breast cancer detection in mammography and digital breast tomosynthesis: State of the art | |
Ikedo et al. | Development of a fully automatic scheme for detection of masses in whole breast ultrasound images | |
KR102209382B1 (ko) | 병변 진단에 대한 정보 제공 방법 및 이를 이용한 병변 진단에 대한 정보 제공용 디바이스 | |
CN111243042A (zh) | 基于深度学习的超声甲状腺结节良恶性特征可视化的方法 | |
Ayer et al. | Computer-aided diagnostic models in breast cancer screening | |
CN101517614A (zh) | 肺结节的高级计算机辅助诊断 | |
CN113208640B (zh) | 一种基于乳腺专用pet影像组学预测腋窝淋巴结转移的方法 | |
CN110728239B (zh) | 一种利用深度学习的胃癌增强ct图像自动识别系统 | |
CN111553892A (zh) | 基于深度学习的肺结节分割计算方法、装置及系统 | |
US20150065868A1 (en) | System, method, and computer accessible medium for volumetric texture analysis for computer aided detection and diagnosis of polyps | |
CN113345576A (zh) | 一种基于深度学习多模态ct的直肠癌淋巴结转移诊断方法 | |
CN114066882A (zh) | 一种基于深度影像组学的肺腺癌Ki67表达水平无创检测方法及装置 | |
Gunasekaran | Leveraging object detection for the identification of lung cancer | |
Al-Tam et al. | Breast cancer detection and diagnosis using machine learning: a survey | |
CN115953781B (zh) | 基于热层析影像的乳腺人工智能分析系统及方法 | |
CN110738649A (zh) | 一种用于胃癌增强CT图像自动识别的Faster RCNN网络的训练方法 | |
CN116825372A (zh) | 一种乳癌患者淋巴结转移预测模型及其构建方法 | |
EP4348678A1 (en) | A radiomic-based machine learning algorithm to reliably differentiate benign renal masses from renal cell carcinoma | |
CN115409812A (zh) | 一种基于融合时间注意机制的ct图像自动分类方法 | |
CN117152054A (zh) | 一种无需纳入临床病理特征的乳癌患者淋巴结转移预测模型 | |
CN116741390A (zh) | 一种乳腺癌患者腋窝淋巴结转移预测模型及其构建方法 | |
Thakur et al. | A systematic review of machine and deep learning techniques for the identification and classification of breast cancer through medical image modalities | |
CN115131279A (zh) | 通过深度学习模型的疾病分类 | |
Lo et al. | Feasibility testing: Three-dimensional tumor mapping in different orientations of automated breast ultrasound | |
Subramaniam et al. | Breast cancer diagnosis systems: A review |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |