CN113393938B - 一种融合影像和临床特征信息的乳腺癌风险预测系统 - Google Patents

一种融合影像和临床特征信息的乳腺癌风险预测系统 Download PDF

Info

Publication number
CN113393938B
CN113393938B CN202110788291.5A CN202110788291A CN113393938B CN 113393938 B CN113393938 B CN 113393938B CN 202110788291 A CN202110788291 A CN 202110788291A CN 113393938 B CN113393938 B CN 113393938B
Authority
CN
China
Prior art keywords
module
unit
breast cancer
risk
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110788291.5A
Other languages
English (en)
Other versions
CN113393938A (zh
Inventor
马乐
金连文
李宏行
秦耿耿
蔡裕兴
陈卫国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202110788291.5A priority Critical patent/CN113393938B/zh
Publication of CN113393938A publication Critical patent/CN113393938A/zh
Application granted granted Critical
Publication of CN113393938B publication Critical patent/CN113393938B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本发明公开一种融合影像和临床特征信息的乳腺癌风险预测系统,采集模块、预处理模块、提取模块、因子筛选模块、预测模块;采集模块、预处理模块、提取模块、因子筛选模块、预测模块依次连接;采集模块与因子筛选模块连接;采集模块用于采集患者数据,预处理模块用于对患者数据中的影像数据进行预处理;提取模块基于预处理后的影像数据通过提取网络提取风险信息;因子筛选模块基于风险信息及临床特征数据,获取危险因子数据;预测模块基于危险因子数据对患者进行乳腺癌风险预测。本发明所提供的乳腺癌风险预测系统具有精准、简便、无创等优点,旨在早期确定乳腺癌高危人群,对于制定个性化乳腺筛查有重要意义。

Description

一种融合影像和临床特征信息的乳腺癌风险预测系统
技术领域
本发明涉及生物医药技术领域,特别涉及一种融合影像和临床特征信息的乳腺癌风险预测系统。
背景技术
美国癌症协会在国际权威期刊CA上最新发布的肿瘤相关数据,显示乳腺癌仍然是女性致死率最高的疾病之一。在我国,根据国家癌症中心公开发表的数据,乳腺疾病继续占据女性疾病的首位,而且发病率和死亡率都呈逐年递增的态势,当前我国新增女性恶性肿瘤病例中约有15%是乳腺癌病例,成为女性因恶性肿瘤死亡的首要病因。不同于其他癌症,乳腺癌具有特殊性,早期发现、早期诊断、早期治疗的患者,生存率显著提高,因此,乳腺癌防治关键在于通过早期筛查,提示乳腺癌风险,提早临床干预,提高病人生存率。
全视野乳腺X线摄影(Full-field digital mammography,FFDM)是目前主要的乳腺影像学筛查方法,也是常规诊断方法之一。通过头尾位(Craniocaudal view,CC)及内外侧斜位(Mediolateral oblique,MLO)可清楚显示病变的位置、大小、内部有无钙化以及病变周围细小的毛刺征。但是FFDM具有一定的局限性,病灶与正常腺体组织间结构重叠,导致腺体肿块假象增多,使假阳性率高,对肿块型病灶的性质及位置有所误判。
数字化乳腺断层摄影(Digital breast tomosynthesis,DBT),是结合传统乳腺X线摄影与数字影像处理技术所开发的全新体层成像技术,通过不同角度对乳腺组织进行快速采集,获得一系列不同投影角度下的投影信息,重建出与探测器平面平行的乳腺任意深度层面影像。相比于FFDM,这种成像技术主要减少了组织重叠,增加了乳腺病灶及其主要征象检测的敏感性和特异性,有助于区分病变,特别是致密型乳腺。
对比增强能谱乳腺摄影(Contrast-enhanced spectral mammography,CESM)是在数字化乳腺X线摄影的基础上,使用碘造影剂的K缘效应进行高低能量曝光的一种新成像技术。CESM对乳腺病灶诊断有很高的敏感性,主要是依靠病变组织周围及细胞内大量的新生血管吸收对比剂,经过后处理获得低能图和减影图,可在一定程度上反映乳腺病灶摄取碘对比剂的能力,间接反映其血供情况。
在临床工作中,无论是FFDM、DBT,还是CESM图像,在病灶征象的发现与诊断上,都会受到医生专业水平和阅片经验的影响,而且临床医生无法根据患者当前正常的影像信息来预测其未来的乳腺癌风险。因此,急需一种乳腺癌预测模型来克服当前影像方法的局限性,能结合临床资料、影像表现以及可挖掘的深度信息。
深度学习(Deep Learning,DL)是机器学习研究中的新领域,Hinton和他的学生于2006年首次提出这一理论。在FFDM影像上,Li等人应用深度学习的方法来区分456例患者中的乳腺癌高风险人群与低风险人群,并与传统的纹理分析(Radiographic textureanalysis,RTA)方法作对比。对于含有乳腺癌易感基因BRCA1/2的高风险人群与低风险人群的区分上,深度学习模型的AUC值稍高于传统的RTA模型,但无显著性差异;而在确诊乳腺癌的患者与低风险人群上,深度学习模型的AUC值则显著高于传统的RTA模型。结果显示,深度学习能从FFDM影像中学习并提取乳腺实质特征,在区分乳腺癌高风险人群上,要优于传统的RTA方法。
目前,基于乳腺影像所建立的模型,多为通过提出不同的算法,目的在于提高鉴别乳腺病灶良恶性的准确性,而并非乳腺癌的预测系统。乳腺癌预测系统能在患者早期为正常乳腺时,根据患者的临床特征信息、基因数据或者各种影像数据所建立的模型,能预测患者未来得乳腺癌的风险,旨在确定高危人群范围,以便采取更为积极的筛查及预防措施。因此,若能够基于乳腺癌预测相关模型构建一种精准、简便的乳腺癌预测系统,将具有十分重大的临床价值及深远的社会效益。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种融合影像数据和临床特征信息的乳腺癌风险预测系统,能通过建立乳腺癌风险预测相关模型,对患者早期为正常乳腺时,预测其未来的乳腺癌风险、乳腺癌的病理分子分型及有无淋巴结转移。本发明所提供的乳腺癌风险预测系统具有精准、简便、无创等优点,旨在早期确定乳腺癌高危人群,这对于制定个性化乳腺筛查有重要意义。本发明所提供的一种融合影像数据和临床特征信息的乳腺癌风险预测系统,包括:
采集模块、预处理模块、提取模块、因子筛选模块、预测模块;
所述采集模块、所述预处理模块、所述提取模块、所述因子筛选模块依次连接;
所述采集模块与所述因子筛选模块连接;
所述因子筛选模块与所述预测模块连接;
所述采集模块用于采集患者数据,其中,患者数据包括但不限于影像数据及临床特征数据;
所述预处理模块用于对所述患者数据中的影像数据进行预处理,得到预处理后的影像数据;
所述提取模块基于所述预处理后的影像数据提取风险信息;
所述因子筛选模块基于所述风险信息及所述临床特征数据通过Logistic回归分析进行因子筛选,得到危险因子数据;
所述预测模块基于所述危险因子数据进行乳腺癌风险预测。
优选的,所述采集模块中,所述影像数据包括但不限于:超声影像、二维FFDM影像及CESM影像、三维DBT影像。
优选的,所述预处理模块包括:影像增强单元、乳腺区域检测单元、图像分割单元;
所述影像增强单元、乳腺区域检测单元、图像分割单元依次连接;
所述影像增强单元用于对影像数据进行影像增强;
所述乳腺区域检测单元用于对影像增强后的影像数据进行乳腺区域检测;
所述图像分割单元基于乳腺区域检测结果进行图像分割,得到预处理后的影像数据。
优选的,所述提取模块中,所述风险信息包括但不限于:是否患乳腺癌、乳腺癌分子分型、乳腺癌是否出现淋巴结转移。
优选的,所述提取模块包括提取单元;
所述提取单元为残差卷积神经网络模型,
所述残差卷积神经网络模型中包含有映射函数;
所述映射函数为:
y=F(Θ,x)=fi(Wifi-1(…(f2(W2f1(W1x+b1)+b2)…)+bi),
其中,y∈R表示对应患病概率,x∈Rm×n×l表示稀疏角度投影重建的带噪声和伪影的低分辨率图像,m×n×l表示低分辨率图像格式,Θ表示神经网络F中全部的参数,Wi为第i个卷积层的参数矩阵,bi是第i个卷积层对应的偏置项,fi第i个卷积层的非线性激活函数,R为患者未来患乳腺癌的概率范围,所述患者未来患乳腺癌的概率范围为0-1。
优选的,所述提取模块还包括,训练单元;
所述训练单元与所述提取单元连接;
所述训练单元用于采集病例影像数据及病例类型作为训练样本,通过所述训练样本对所述提取单元进行训练。
优选的,还包括评估模块,所述评估模块分别与所述采集模块、因子筛选模块连接;
所述评估模块中包含有Gail单元,所述Gail单元用于通过Gail模型对所述患者数据进行发病评估,将所述发病评估结果添加到所述临床特征数据之中。
优选的,所述因子筛选模块中,包括影响因子单元、危险因子单元,
所述影响因子单元与所述危险因子单元连接;
所述影响因子单元用于根据所述临床特征信息及所述风险信息,获取所述影响因子;
所述危险因子单元用于通过Logistic回归分析对影响因子进行筛选,获取所述危险因子数据。
优选的,所述预测模块包括预测单元;
所述预测单元与所述因子筛选模块连接;
所述预测单元基于危险因子数据,通过预测模型进行乳腺癌风险预测;
所述预测模型包括但不限于:Logistic回归模型、随机森林模型、决策树模型和XGboost模型。
优选的,所述预测模块还包括测试单元及最优预测模型筛选单元:
所述测试单元、所述预测单元与所述最优预测模型筛选单元依次连接;
所述测试单元用于采集测试集;
所述最优预测模型筛选单元基于测试集,通过所述预测模型进行预测,基于预测结果通过ROC曲线分析方法获取最优预测结果,筛选所述最优预测结果对应的模型作为最优预测模型,并通过最优预测模型进行乳腺癌风险预测。
本发明具有如下技术效果:
针对临床医生无法根据患者当前正常影像,预测其未来患乳腺癌的问题,本发明融合影像数据和临床特征信息,通过使用多种乳腺癌预测模型,构建了一种对于乳腺癌进行风险预测的系统,所述预测系统能够预测其未来的乳腺癌风险、乳腺癌的病理分子分型及乳腺癌有无淋巴结转移等多种患病类型,同时针对多种患病类型进行风险预测,本申请所述的提取模型及预测模型都是通过训练及测试后使用,其模型预测结果准确,保证了预测系统其输出的预测结果准确,且系统操作简单,只需将患者数据输入到本发明所提供的系统中即可获取准确的患者未来患乳腺癌预测结果,具有很强的实用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的系统结构示意图;
图2为本发明实施例提供的系统的工作流程示意图;
图3为本发明实施例提供的预处理模块中影像数据示意图;
图4为本发明实施例提供的提取模型结构示意图;
图5为本发明实施例提供的提取模型中模型残差块连接结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1、图2所示,本发明提供了一种融合影像和临床特征信息的乳腺癌风险预测系统,包括:
采集模块、预处理模块、提取模块、因子筛选模块、预测模块;
采集模块、预处理模块、提取模块、因子筛选模块依次连接;
采集模块与因子筛选模块连接;
因子筛选模块与预测模块连接;
采集模块用于采集患者数据,其中,患者数据包括但不限于影像数据及临床特征数据;
采集模块中采集的患者数据中的影像数据为从医院工作站中收集DICOM格式的影像数据。影像数据包括但不限于:二维FFDM影像及CESM影像、三维DBT影像。临床特征数据包括:既往乳腺活检次数、活检证实非典型增生病史、女性的生育史、月经初潮年龄、初产年龄、哺乳史、是否绝经、是否服用激素,以及一级亲属母亲、姐妹等的乳腺癌家族史,二级亲属外婆、奶奶等的乳腺癌家族史等信息,上述临床特征数据采集为了评估女性在未来一定时间范围内罹患浸润性乳腺癌的风险,同时还包括临床触诊信息,如是否触诊到病灶、病灶是否可以移动、所触诊病灶最大径是否大于2cm等,以及从乳腺影像提取出来的曝光参数(球管电压、球管电流、乳腺压迫厚度、乳腺腺体剂量)等信息数据,探讨以上特征作为高危险因子的可能性,优化乳腺癌预测模型。
如图3所示,预处理模块用于对患者数据中的影像数据进行预处理,得到预处理后的病例影像数据及预处理后的患者影像数据;预处理模块包括:影像增强单元、乳腺区域检测单元、图像分割单元;影像增强单元、乳腺区域检测单元、图像分割单元依次连接;影像增强单元用于对影像数据进行影像增强;乳腺区域检测单元用于对影像增强后的影像数据进行乳腺区域检测;图像分割单元基于乳腺区域检测结果进行图像分割,得到预处理后的影像数据。
在预处理模块中,为保证在将影像数据输入提取模型之后对于乳腺特征提取的效率及准确,需要对乳腺二维FFDM影像、三维DBT影像及CESM影像进行影像增强、乳腺区域检测、图像分割等预处理,以得到高质量的乳腺影像。
提取模块基于预处理后的患者数据中的影像数据通过提取网络提取风险信息;
提取模块中,风险信息包括但不限于:是否患乳腺癌、乳腺癌分子分型、乳腺癌是否出现淋巴结转移。提取模块包括提取单元;提取单元为残差卷积神经网络模型,如图4所示,残差卷积神经网络模型结构中包含若干卷积层CONV及池化层POOL,其中若干卷积层中部分卷积层之间相互连接,部分卷积层与池化层连接,若干卷积层用于对影像数据进行卷积处理,池化层用于进行采样处理,如图5所示,残差卷积神经网络模型中残差块连接结构中包括残差块、两个池化层、Flatten层、两个Dense层,上述残差块连接结构中的各层之间按上述顺序依次连接。残差块用于通过残差函数进行残差映射处理,池化层用于进行下采样处理,Flatten层用于将多维的输入数据一维化,Dense层用于经过非线性变化,提取这些特征之间的关联,最后映射到输出空间上。残差卷积神经网络模型中包含有映射函数;映射函数为:
y=F(Θ,x)=fi(Wifi-1(…(f2(W2f1(W1x+b1)+b2)…)+bi),
其中,y∈R表示对应患病概率,x∈Rm×n×l表示稀疏角度投影重建的带噪声和伪影的低分辨率图像,m×n×l表示低分辨率图像格式,Θ表示神经网络F中全部的参数,Wi为第i个卷积层的参数矩阵,bi是第i个卷积层对应的偏置项,fi第i个卷积层的非线性激活函数。
提取模块还包括,训练单元;
训练单元与提取单元连接;
训练单元用于采集病例影像数据及病例类型作为训练样本,通过训练样本对提取单元进行训练。
在提取模块中,首先在残差卷积神经网络模型中基于残差卷积神经网络多参数的非线性构建一个由影像数据(DBT图像)转换到患病概率的映射函数,使残差卷积神经网络模型能够输出病例类型的患病概率,在构建完成映射函数之后,通过训练单元采集已有的病例影像数据及病例类型,对残差卷积神经网络模型进行训练,保证提取单元对于病例类型及患病概率的准确输出,深度学习模型在二维FFDM影像及CESM影像、三维DBT影像上进行特征提取后,与患者未来是否患乳腺癌、乳腺癌分子分型、乳腺癌是否出现淋巴结转移相对应,分别输出风险评分即患病概率,将提取特征、患病类型及风险评分作为风险信息输入到因子筛选模块中。
从训练单元中所获得的数据,利用深度学习技术构建深层次的卷积神经网络结构,对输入的影像进行学习和训练,逐步得到能精确描述感兴趣区域的特征。
对于乳腺二维的FFDM影像及CESM影像,采用二维卷积神经网络处理,提取特征。而针对三维DBT影像,其包含空间三维信息,在三维空间信息中,所构建的三维卷积神经网络的深度学习模型能提取更具有代表性的特征,构建多尺度特征检测模型,提升网络特征的表达能力。模型不仅需要提取层内信息特征,同时获取层间信息特征,以能达到更准确的预测提取效果。
在采集训练样本时,针对病例数据进行如下采集:①病例组:纳入65个早期乳腺正常(BI-RADS分类为I类或II类),后期患乳腺癌(病理证实)的病例;②对照组:按1:3的比例纳入至少三次随访乳腺均为正常(BI-RADS分类为I类或II类)的病例;③收集上述所有病例的临床特征数据。同时针对基于排除标准对上述病例进行排除,排除标准:①早期患乳腺癌病史;②假体植入史。
在使用训练单元进行数据训练时,使用十折交叉验证对模型和参数进行筛选。在交叉验证的过程中,随机选择其中一折数据作为验证集,剩下的九折数据作为训练集。以训练集输出结果的中位数作为阈值。在验证集中,将概率高于中位数的影像归入“未来出现乳腺癌”区域,将概率低于中位数的为“未来为正常乳腺”区域,并以病例的实际情况相匹配。为验证基于神经网络的提取模型相对于传统Tyrer-Cuzick模型的优越性,实验将两者进行对比。实验结果显示,基于神经网络模型的ROC显著高于Tyrer-Cuzick模型(0.66±0.03vs.0.54±0.02)。
由实验结果可知,基于深度神经网络的提取模型,其提取结果比传统Tyrer-Cuzick模型预测的结果要更精确,有助于构建更精准的预测系统。
本发明所提供的系统还包括评估模块,评估模块分别与采集模块、因子筛选模块连接;评估模块中包含有Gail单元,Gail单元用于通过Gail模型对患者数据进行发病评估,将发病评估结果添加到病例数据之中。
本发明系统在采集模块与因子筛选模块之间,还可以添加一个评估模块,评估模块收集Gail模型中的评估因子,通过Gail模型,对如既往乳腺活检次数、活检证实非典型增生病史、女性的生育史、月经初潮年龄、初产年龄、哺乳史、是否绝经、是否服用激素,以及一级亲属母亲、姐妹等的乳腺癌家族史,二级亲属外婆、奶奶等的乳腺癌家族史等信息进行评估,评估出女性在未来一定时间范围内罹患浸润性乳腺癌的风险,并将其评估结果添加到临床特征数据中,作为临床特征数据中的一部分输入到因子筛选模块中。
因子筛选模块基于风险信息及患者数据,得到影响因子,并基于影响因子通过Logistic回归分析进行因子筛选进行处理,得到危险因子数据;
因子筛选模块中,包括影响因子单元、危险因子单元,
影响因子单元与危险因子单元连接;
影响因子单元用于获取患者临床信息及提取模块中所提取的风险信息,获取影响因子;
危险因子单元用于通过Logistic回归分析对影响因子进行筛选,获取危险因子数据。
在影响因子单元中获取采集模块中的患者临床信息及风险信息中的影像特征,对上述数据进行整合排序,获取影响因子;
在危险因子单元中,基于影响因子获取训练集,在基于影响因子的训练集中采用单因素Logistic回归分析,以P<0.05为纳入多因素分析的标准,将影响因子作为输入变量,以预测乳腺癌是否发生为结局变量,进行因子筛选,筛选出危险因子,P值是用来判定假设检验结果的一个参数。危险因子为与乳腺癌发生显著相关的变量。基于危险因子,选取危险因子数据。
预测模块基于危险因子数据进行乳腺癌风险预测。
预测模块包括预测单元;预测单元与因子筛选模块连接;预测单元基于危险因子数据,通过预测模型进行乳腺癌风险预测;预测模型包括但不限于:Logistic回归模型、随机森林模型、决策树模型和XGboost模型。
预测模块还包括测试单元及最优预测模型筛选单元:测试单元、预测单元与最优预测模型筛选单元依次连接;测试单元用于采集测试集;最优预测模型筛选单元基于测试集,通过预测模型进行预测,基于预测结果通过ROC曲线分析方法获取最优预测结果,筛选最优预测结果对应的模型作为最优预测模型,并通过最优预测模型进行乳腺癌风险预测。在预测模型进行测试之前,测试单元可以采集预测模型的训练集进行训练,保证各预测模型的准确性。
将本发明所提出的模型与传统的乳腺癌预测模型相比较,如Gait模型、Tyrer-Cuzick模型;与单纯加入影像特征的模型相比较,如基于二维FFDM影像的深度学习模型、基于三维DBT影像的深度学习模型、联合二维FFDM与三维DBT影像的深度学习模型。通过验证集数据来评估患者未来出现乳腺癌的可能性,筛选出预测准确性最高的乳腺癌模型。
本发明的一种融合影像数据和临床特征信息的乳腺癌风险预测系统,对二维FFDM影像、三维DBT影像、CESM影像进行深度学习,提取特征;结合患者临床特征数据,筛选出乳腺癌高风险因子,建立乳腺癌预测模型,能够针对患者早期为正常乳腺时,预测其未来的乳腺癌风险、乳腺癌的病理分子分型及有无淋巴结转移。
本发明具有如下技术效果:针对临床医生无法根据患者当前正常影像,预测其未来患乳腺癌的问题,本发明融合影像数据和临床特征信息,通过使用多种乳腺癌预测模型,构建了一种对于乳腺癌风险预测系统,预测系统能够预测其未来的乳腺癌风险、乳腺癌的病理分子分型及乳腺癌有无淋巴结转移等多种患病类型,同时针对多种患病类型进行风险预测,本申请的提取模型及预测模型都是通过训练及测试后使用,其模型预测结果准确,保证了预测系统其输出的预测结果准确,且系统操作简单,只需在系统中输入患者数据,即可获取患者未来患乳腺癌的预测结果,具有很强的实用性。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (5)

1.一种融合影像和临床特征信息的乳腺癌风险预测系统,其特征在于,包括:
采集模块、预处理模块、提取模块、因子筛选模块、预测模块;
所述采集模块、所述预处理模块、所述提取模块、所述因子筛选模块依次连接;
所述采集模块与所述因子筛选模块连接;
所述因子筛选模块与所述预测模块连接;
所述采集模块用于采集患者早期为正常乳腺状态下的数据,其中,患者数据包括影像数据及临床特征数据;
所述预处理模块用于对所述患者数据中的影像数据进行预处理,得到预处理后的影像数据;
所述提取模块基于所述预处理后的影像数据提取风险信息;
所述因子筛选模块基于所述风险信息及所述临床特征数据通过Logistic回归分析进行因子筛选,得到危险因子数据;
所述预测模块基于所述危险因子数据进行乳腺癌风险预测;
所述因子筛选模块中,包括影响因子单元、危险因子单元,
所述影响因子单元与所述危险因子单元连接;
所述影响因子单元用于根据所述临床特征信息及所述风险信息,获取所述影响因子;
所述危险因子单元用于通过Logistic回归分析对影响因子进行筛选,获取所述危险因子数据;
所述预测模块包括预测单元;
所述预测单元与所述因子筛选模块连接;
所述预测单元基于危险因子数据,通过预测模型进行乳腺癌风险预测;
所述预测模型包括:Logistic回归模型、随机森林模型、决策树模型和XGboost模型;
所述预测模块还包括测试单元及最优预测模型筛选单元:
所述测试单元、所述预测单元与所述最优预测模型筛选单元依次连接;
所述测试单元用于采集测试集;
所述最优预测模型筛选单元基于测试集,通过所述预测模型进行预测,基于预测结果通过ROC曲线分析方法获取最优预测结果,筛选所述最优预测结果对应的模型作为最优预测模型,并通过最优预测模型进行乳腺癌风险预测;
所述提取模块中,所述风险信息包括:是否患乳腺癌、乳腺癌分子分型、乳腺癌是否出现淋巴结转移;
所述提取模块包括提取单元;
所述提取单元为残差卷积神经网络模型,残差卷积神经网络模型结构中包含若干卷积层CONV及池化层POOL,其中若干卷积层中部分卷积层之间相互连接,部分卷积层与池化层连接,若干卷积层用于对影像数据进行卷积处理,池化层用于进行采样处理,残差卷积神经网络模型中残差块连接结构中包括残差块、两个池化层、Flatten层、两个Dense层,上述残差块连接结构中的各层之间按上述顺序依次连接; 残差块用于通过残差函数进行残差映射处理,池化层用于进行下采样处理,Flatten层用于将多维的输入数据一维化,Dense层用于经过非线性变化,提取这些特征之间的关联,最后映射到输出空间上;
所述残差卷积神经网络模型中包含有映射函数;
所述映射函数为:
y=F(Θ,x)=fi(Wifi-1(…(f2(W2f1(W1x+b1)+b2)…)+bi),
其中,y∈R表示对应患病概率,x∈Rm×n×l表示稀疏角度投影重建的带噪声和伪影的低分辨率图像,m×n×l表示低分辨率图像格式,Θ表示神经网络F中全部的参数,Wi为第i个卷积层的参数矩阵,bi是第i个卷积层对应的偏置项,fi第i个卷积层的非线性激活函数,R为患者未来患乳腺癌的概率范围,所述患者未来患乳腺癌的概率范围为0-1。
2.根据权利要求1所述融合影像和临床特征信息的乳腺癌风险预测系统,其特征在于:
所述采集模块中,所述影像数据包括:超声影像、二维FFDM影像及CESM影像、三维DBT影像。
3.根据权利要求1所述融合影像和临床特征信息的乳腺癌风险预测系统,其特征在于:
所述预处理模块包括:影像增强单元、乳腺区域检测单元、图像分割单元;
所述影像增强单元、乳腺区域检测单元、图像分割单元依次连接;
所述影像增强单元用于对影像数据进行影像增强;
所述乳腺区域检测单元用于对影像增强后的影像数据进行乳腺区域检测;
所述图像分割单元基于乳腺区域检测结果进行图像分割,得到预处理后的影像数据。
4.根据权利要求1所述融合影像和临床特征信息的乳腺癌风险预测系统,其特征在于:
所述提取模块还包括,训练单元;
所述训练单元与所述提取单元连接;
所述训练单元用于采集病例影像数据及病例类型作为训练样本,通过所述训练样本对所述提取单元进行训练。
5.根据权利要求1所述融合影像和临床特征信息的乳腺癌风险预测系统,其特征在于:
还包括评估模块,所述评估模块分别与所述采集模块、因子筛选模块连接;
所述评估模块中包含有Gail单元,所述Gail单元用于通过Gail模型对所述患者数据进行发病评估,将所述发病评估结果添加到所述临床特征数据之中。
CN202110788291.5A 2021-07-13 2021-07-13 一种融合影像和临床特征信息的乳腺癌风险预测系统 Active CN113393938B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110788291.5A CN113393938B (zh) 2021-07-13 2021-07-13 一种融合影像和临床特征信息的乳腺癌风险预测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110788291.5A CN113393938B (zh) 2021-07-13 2021-07-13 一种融合影像和临床特征信息的乳腺癌风险预测系统

Publications (2)

Publication Number Publication Date
CN113393938A CN113393938A (zh) 2021-09-14
CN113393938B true CN113393938B (zh) 2022-09-13

Family

ID=77626035

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110788291.5A Active CN113393938B (zh) 2021-07-13 2021-07-13 一种融合影像和临床特征信息的乳腺癌风险预测系统

Country Status (1)

Country Link
CN (1) CN113393938B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114091671A (zh) * 2021-12-01 2022-02-25 西南石油大学 一种改进随机森林相似性度量的患病风险预测方法
CN115619641B (zh) * 2022-10-24 2023-06-02 中山大学附属第五医院 基于ffdm的乳腺影像处理方法、系统、终端和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108734138A (zh) * 2018-05-24 2018-11-02 浙江工业大学 一种基于集成学习的黑色素瘤皮肤病图像分类方法
CN111657945A (zh) * 2020-06-16 2020-09-15 中南大学湘雅医院 一种基于增强mri影像组学的鼻咽癌预后辅助评估方法
CN112185569A (zh) * 2020-09-11 2021-01-05 中山大学孙逸仙纪念医院 一种乳腺癌患者无病生存期预测模型及其构建方法
CN112530592A (zh) * 2020-12-14 2021-03-19 青岛大学 一种基于机器学习的非小细胞肺癌风险预测方法
CN113034436A (zh) * 2021-02-26 2021-06-25 中山大学孙逸仙纪念医院 基于乳腺mr影像组学的乳腺癌分子分型变化预测装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110097974A (zh) * 2019-05-15 2019-08-06 天津医科大学肿瘤医院 一种基于深度学习算法的鼻咽癌远端转移预测系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108734138A (zh) * 2018-05-24 2018-11-02 浙江工业大学 一种基于集成学习的黑色素瘤皮肤病图像分类方法
CN111657945A (zh) * 2020-06-16 2020-09-15 中南大学湘雅医院 一种基于增强mri影像组学的鼻咽癌预后辅助评估方法
CN112185569A (zh) * 2020-09-11 2021-01-05 中山大学孙逸仙纪念医院 一种乳腺癌患者无病生存期预测模型及其构建方法
CN112530592A (zh) * 2020-12-14 2021-03-19 青岛大学 一种基于机器学习的非小细胞肺癌风险预测方法
CN113034436A (zh) * 2021-02-26 2021-06-25 中山大学孙逸仙纪念医院 基于乳腺mr影像组学的乳腺癌分子分型变化预测装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于深度残差网络的皮肤癌黑色素瘤识别;管秋等;《浙江工业大学学报》;20190614(第04期);第430-434页 *
病证结合构建慢病风险预测模型的思路与方法;魏戌等;《中国中医基础医学杂志》;20170628(第06期);第85-90页 *

Also Published As

Publication number Publication date
CN113393938A (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
Gozes et al. Coronavirus detection and analysis on chest ct with deep learning
CN106372390A (zh) 一种基于深度卷积神经网络的预防肺癌自助健康云服务系统
CN113393938B (zh) 一种融合影像和临床特征信息的乳腺癌风险预测系统
US20180053297A1 (en) Methods and Apparatuses for Detection of Abnormalities in Low-Contrast Images
CN110021022A (zh) 一种基于深度学习的甲状腺核医学图像诊断方法
CN115620912A (zh) 一种基于深度学习的软组织肿瘤良恶性预测模型构建方法
Li et al. Lesion-aware convolutional neural network for chest radiograph classification
Liao et al. Classification of asymmetry in mammography via the DenseNet convolutional neural network
Chhatlani et al. DermaGenics-Early Detection of Melanoma using YOLOv5 Deep Convolutional Neural Networks
CN116630680B (zh) 一种x线摄影联合超声的双模态影像分类方法及系统
CN115953781B (zh) 基于热层析影像的乳腺人工智能分析系统及方法
Vocaturo et al. Artificial intelligence approaches on ultrasound for breast cancer diagnosis
Lashkari et al. Developing a toolbox for clinical preliminary breast cancer detection in different views of thermogram images using a set of optimal supervised classifiers
CN115424722A (zh) 利用血清蛋白标志物的肺癌筛查和诊治系统及方法
Ibrahim et al. Liver Multi-class Tumour Segmentation and Detection Based on Hyperion Pre-trained Models.
Nalla et al. Influence of Convolutional Neural Network Depth on the Efficacy of Automated Breast Cancer Screening Systems
Sangeetha et al. A Novel Method to Detect Lung Cancer using Deep Learning
CN117636064B (zh) 一种基于儿童病理切片的神经母细胞瘤智能分类系统
Priyadharshini et al. Artificial Intelligence Assisted Improved Design to Predict Brain Tumor on Earlier Stages using Deep Learning Principle
Gozdzialski et al. The simultaneous detection and classification of mass and calcification leading to breast cancer in mammograms
Maslan Mammogram Breast Mass Classification Using Deep Convolutional Neural Network
Tamrakar et al. Brain Tumor Detection Based on Watershed Segmentation and Classification Using Deep Learning
Andika et al. Analysis of Brain Tumor Meningioma Detection System Development Using Convolutional Neural Network Method Mobilenet Architecture
Velayuthapandian et al. Mammogram data analysis: Trends, challenges, and future directions
Archana et al. Effective Methods to Detect Liver Cancer Using CNN and Deep Learning Algorithms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant