CN114974552A - 一种建立乳腺癌早期筛查模型的方法 - Google Patents

一种建立乳腺癌早期筛查模型的方法 Download PDF

Info

Publication number
CN114974552A
CN114974552A CN202110188905.6A CN202110188905A CN114974552A CN 114974552 A CN114974552 A CN 114974552A CN 202110188905 A CN202110188905 A CN 202110188905A CN 114974552 A CN114974552 A CN 114974552A
Authority
CN
China
Prior art keywords
breast cancer
establishing
data
gene
screening
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110188905.6A
Other languages
English (en)
Inventor
胡哲煜
欧阳取长
何英
阳剑波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Cancer Hospital
Original Assignee
Hunan Cancer Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Cancer Hospital filed Critical Hunan Cancer Hospital
Priority to CN202110188905.6A priority Critical patent/CN114974552A/zh
Publication of CN114974552A publication Critical patent/CN114974552A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu

Abstract

本发明提供的一种建立乳腺癌早期筛查模型的方法,包括以下步骤:第一步:收集目标医院的乳腺内科临床和生物特征数据,建立乳腺癌大数据库;第二步:通过整合性多模块分析乳腺癌易感基因;第三步:确定乳腺癌易感基因突变导致乳腺癌发生的机制;第四步:建立基于乳腺癌易感基因突变的乳腺癌早期筛查模型;利用本发明提供的一种建立乳腺癌早期筛查模型,为可能的乳腺癌患者提供精准可靠的信息,并为临床决策提供分子证据。为疾病预防和治疗提供分子基础。

Description

一种建立乳腺癌早期筛查模型的方法
技术领域
本发明涉及医学技术领域,尤其是涉及一种建立乳腺癌早期筛查模型的方法。
背景技术
目前,国内外的机构开始关注通过血液检测肿瘤相关基因突变、基因表达、甲基化水平、单核苷酸多态性等预测早期肿瘤的发生发展的研究,并有许多最新的重大进展。2017年,美国FDA批准Memorial Sloan Kettering癌症中心基于二代测序技术的468个癌症基因监测分析平台(MSK-IMPACTTM),用于肿瘤早期诊断。大panel的基因检测,涵盖来自于肿瘤不同克隆的DNA片段,反映不同时间节点肿瘤突变克隆(Tumormutation clone,TMC)组成的动态变化,在研究肿瘤克隆进化和耐药克隆发生发展方面具有独特的优势8-9。2018年12月,澳大利亚的一项研究表明,依据肿瘤细胞DNA的结构特点,通过含有纳米金溶液的显色可发现肿瘤细胞,敏感性达到90%,是一种非常有潜力的癌症早期筛查手段10。液态活检通过非侵入性的取样方式获得肿瘤信息,是“精准医疗”代表性的诊断技术。液态活检技术包括血液循环肿瘤细胞(CTC),血浆游离肿瘤DNA(ctDNA)和外泌体。临床上采用液态活检技术,可以实时跟踪肿瘤细胞,在研究肿瘤克隆进化和耐药克隆发生发展方面具有独特的优势11。
2018年欧洲肿瘤内科学会(ESMO)年会上发布了“循环游离基因组图谱 研究”(Circulating Cell-free Genome Atlas,CCGA)的最新研究数据,发现利用 血液进行癌症早期筛查不仅可行,而且在不同类型肿瘤中还具有高度特异性12。 CCGA是迄今为止规模最大的临床项目之一,旨在在尚未出现症状的癌症患者 血液肿寻找肿瘤DNA的蛛丝马迹,进而对癌症进行早期筛查和诊断。该前瞻性 纵向队列研究已纳入约15,000例受试者(70%癌症患者,30%肺癌症患者),并 将追踪5年。CCGA使用靶向panel和超深度测序策略对受试者血液样本进行分 析,探索血液游离DNA表达模式和变化水平,探索开发癌症早筛产品13-14。
国内相关研究较少,我们课题组的最新研究发现血液游离DNA的基因突变和变化水平与乳腺癌进展和耐药密切相关15。PIK3CA、ESR1、GATA3基因突变与激素受体阳性乳腺癌的发生发展和内分泌治疗耐药密切相关16;TP53和 PI3K/Akt/mTOR信号通路调控细胞能量代谢、氧化应激和细胞凋亡,相关基因突变与肿瘤治疗耐药密切相关17-18。目前国内的研究主要集中在乳腺癌复发转移和治疗疗效监测方面。在早期筛查方面,国内并没有开展相关的研究。
发明内容
针对现有技术存在的上述问题,本发明提供一种建立乳腺癌早期筛查模型的方法,拟收集近十年在目标医院就诊的乳腺癌患者和非乳腺癌患者的临床病例,通过特征匹配,最终筛选200例乳腺癌病例和100例非乳腺癌(其他乳腺疾病)病例,通过液体活检技术对比分析和鉴定乳腺癌肿瘤相关基因(包括胚系突变的遗传易感基因和其他体系突变基因);在随访过程中对比监测肿瘤基因突变谱的变化;建立与乳腺癌密切相关基因突变的模型,为乳腺癌早期筛查提供分子基础。
为实现上述发明目的,本发明采用的技术方案如下:
一种建立乳腺癌早期筛查模型的方法,包括以下步骤:
第一步:收集目标医院的乳腺内科临床和生物特征数据,建立乳腺癌大数据库;
第二步:通过整合性多模块分析乳腺癌易感基因;
第三步:确定乳腺癌易感基因突变导致乳腺癌发生的机制;
第四步:建立基于乳腺癌易感基因突变的乳腺癌早期筛查模型。
具体的,所述第一步具体为:
通过HIS系统,收集近十年在目标医院的内科门诊和病房就诊的患者有关采集影像学、临床疾病特征、诊断和治疗相关数据,建立乳腺癌的临床大数据库;
收集乳腺疾病患者的检验、分子病理以及组织病理数据,建立乳腺癌的疾病生物分子特征数据库;
将上述的乳腺癌的临床大数据库和乳腺癌的疾病生物分子特征数据库融合形成所述乳腺癌大数据库。
具体的,所述第二步具体为:
建立整合性多模块分析的数据模型,通过分析乳腺癌的临床大数据和乳腺癌的疾病生物分子特征大数据,筛选出导致乳腺癌发生的易感基因;
收集家族性乳腺癌患者的家系,明确候选易感基因在家系中的传递,进一步明确候选基因与乳腺癌发生的相关性;
通过整合性多模块分析出乳腺癌易感基因。
具体的,所述第三步具体为:
在乳腺正常组织和癌组织中,分析候选易感基因的基因突变、基因表达和蛋白表达情况,明确乳腺癌组织细胞中易感基因的基因突变和蛋白水平;
对比正常乳腺组织,在乳腺癌组织中分析基因突变导致同源重组修复功能的机制,明确乳腺癌细胞和组织中DNA同源重组修复功能受损;
确定乳腺癌易感基因突变导致乳腺癌发生的机制。
具体的,所述第四步具体为:
通过家系数据和基因大数据的分析,分析导致DNA同源重组修复功能障碍的重点基因,建立乳腺癌早期诊断的基因筛查数据模型;
通过收集上述基因筛查数据模型建立后的患者就诊产生的乳腺癌的临床大数据和乳腺癌的疾病生物分子特征大数据,建立基因筛查数据模型的验证数据集,通过验证数据集以分析验证基因筛查数据模型的准确性、特异性和敏感性;
确定建立基于乳腺癌易感基因突变的乳腺癌早期筛查模型。
与现有技术相比,本发明提供的一种建立乳腺癌早期筛查模型的方法,首次发现TP53、PIK3CA、ERBB2、FAT1、CDK12、DDR2、AKT1等基因在乳腺癌中存在高频突变15,FGFR基因突变与乳腺癌转移相关,TP53、ESR1、GATA3、 PIK3CA、RB1等基因的异常与乳腺癌耐药相关16;该项研究发现乳腺癌患者中, PALB2胚系杂合性突变频率远远高于体系突变,且均为高危的LOF突变,导致 DNA同源重组修复缺陷(HRD)。PALB2编码蛋白通过与BRCA1/2结合参与DNA同源重组修复过程,PALB2胚系杂合性突变可导致严重的HRD。此外,首次关注乳腺癌易感基因筛查和DNA重组修复功能缺陷检测,扩大了以往只针对BRCA1/2基因进行检测的方案,将目标基因扩大到DNA重组修复相关基因的胚系和体系检测,以及杂合性缺失(LOH)分析、端粒等位基因失衡(NtAl)分数、大片段转移(LSTs)等,为可能的乳腺癌患者提供精准可靠的信息,并为临床决策提供分子证据。为疾病预防和治疗提供分子基础。
具体实施方式
一种建立乳腺癌早期筛查模型的方法,包括以下步骤:
第一步:收集目标医院的乳腺内科临床和生物特征数据,建立乳腺癌大数据库;
第二步:通过整合性多模块分析乳腺癌易感基因;
第三步:确定乳腺癌易感基因突变导致乳腺癌发生的机制;
第四步:建立基于乳腺癌易感基因突变的乳腺癌早期筛查模型。
具体的,所述第一步具体为:
通过HIS系统,收集近十年在目标医院的内科门诊和病房就诊的患者有关采集影像学、临床疾病特征、诊断和治疗相关数据,建立乳腺癌的临床大数据库;
收集乳腺疾病患者的检验、分子病理以及组织病理数据,建立乳腺癌的疾病生物分子特征数据库;
将上述的乳腺癌的临床大数据库和乳腺癌的疾病生物分子特征数据库融合形成所述乳腺癌大数据库。
具体的,所述第二步具体为:
建立整合性多模块分析的数据模型,通过分析乳腺癌的临床大数据和乳腺癌的疾病生物分子特征大数据,筛选出导致乳腺癌发生的易感基因;
收集家族性乳腺癌患者的家系,明确候选易感基因在家系中的传递,进一步明确候选基因与乳腺癌发生的相关性;
通过整合性多模块分析出乳腺癌易感基因。
具体的,所述第三步具体为:
在乳腺正常组织和癌组织中,分析候选易感基因的基因突变、基因表达和蛋白表达情况,明确乳腺癌组织细胞中易感基因的基因突变和蛋白水平;
对比正常乳腺组织,在乳腺癌组织中分析基因突变导致同源重组修复功能的机制,明确乳腺癌细胞和组织中DNA同源重组修复功能受损;
确定乳腺癌易感基因突变导致乳腺癌发生的机制。
具体的,所述第四步具体为:
通过家系数据和基因大数据的分析,分析导致DNA同源重组修复功能障碍的重点基因,建立乳腺癌早期诊断的基因筛查数据模型;
通过收集上述基因筛查数据模型建立后的患者就诊产生的乳腺癌的临床大数据和乳腺癌的疾病生物分子特征大数据,建立基因筛查数据模型的验证数据集,通过验证数据集以分析验证基因筛查数据模型的准确性、特异性和敏感性;
确定建立基于乳腺癌易感基因突变的乳腺癌早期筛查模型。
接下来详细描述本发明提供的一种建立乳腺癌早期筛查模型的方法的具体过程:
第一部分
1.乳腺癌患病风险预测因素研究
招募乳腺专科门诊病人,从就诊之日起直至随访半年,测量并收集人口学、社会心理学和乳腺专科3个维度的数据(影响因素)。以此3个维度的影响因素为框架,结合疾病诊断流程,对入组的乳腺专科门诊病人完善检验检查并收集数据。粗针穿刺病理学确诊为乳腺癌即可视为随访终点,否则继续随访至第一次门诊后半年,以获取完整的原始数据。原始研究数据包括3个维度的因素线,因素线则包括多个变量,由此构成一个高维空间,可能出现多重共线性问题。先对原始研究数据分别采用统计学方法如方差分析、列联分析和主成分分析等对包含3个维度的数据进行降维处理,最终获得罹患乳腺癌的重要预测因素。
2.基于Logistic回归、LVQ神经网络、决策树分类器和基于随机森林思想的组合分类器方法的乳腺癌罹患风险预测模型的构建与评价
基于降维处理后的结果,获得所有研究对象包含3个维度的乳腺癌罹患风险重要预测因素数据库,采用Logistic回归、LVQ神经网络、决策树分类器和基于随机森林思想的组合分类器方法对包含3个维度影响因素的数据建立4个乳腺癌罹患风险预测模型。通过ROC曲线下面积、特异度、灵敏度、分类准确性和真阳性预测值对不同方法建立的乳腺癌罹患风险预测模型进行评价,通过比较模型预测精度,确定最优乳腺癌患病风险预测模型。
将研究中的全部病例分为两个部分,其中2/3作为训练样本,1/3作为模型的测试样本;利用训练样本建立Logistic回归、LVQ神经网络、决策树分类器和基于随机森林思想的组合分类器4种乳腺癌罹患风险预测模型。
LVQ神经网络
学习向量量化(Learning Vector Quantization,LVQ)神经网络是一种用于训练竞争层的有监督学习方法的输入前向神经网络,其算法是从Kohonen竞争算法演化而来的。LVQ神经网络在模式识别和优化领域有这着广泛的应用。将降维处理后的重要预测因素(量化特征)作为网络的输入,良性乳腺肿瘤和恶性乳腺肿瘤作为网络的输出,用顺练集数据对设计的LVQ神经网络进行训练,然后对测试集数据进行测试并对测试结果进行分析。
决策树分类器
决策树学习是以实例为基础的归纳学习算法。算法从一组无序、无规则的事例中推理出决策树表示形式的分类规则。一般在决策树中采用“自顶向下、分而治之”的递归方式,将搜索空间分为若干个互不相欠的子集,在决策树的内部节点进行属性值的比较,并根据不同的属性值判断从该节点向下的分支,在树的叶节点得到结论。数据采集完成后,利用MATLAB自带的统计工具箱函数,即可基于训练集数据创建一个决策树分类器。再利用MATLAB自带的统计工具箱函数,即可对测试集数据进行仿真预测。
基于随机森林思想的组合分类器
随机森林算法实质是一个包含多个决策树的分类器,这些决策树的形成采用了随机的方法,因此也叫做随机决策树,随机森林中的树之间是没有关联的。当测试数据进入随机森林时,其实就是让每一棵决策树进行分类,最后取所有决策树中分类结果最多的那类为最终的结果。数据采集完成后,利用MATLAB 自带的统计工具箱函数,即可基于训练集数据创建一个随机森林分类器。再利用MATLAB自带的统计工具箱函数,即可对测试集数据进行仿真预测。
3.关键预测因素的筛选
不同模型中关键预测因素的确定方法有所不同,Logistic回归模型比较模型标准化系数的绝对值,标准化系数的绝对值越大说明相应的变量比较重要,反之则次要。神经网络是通过平均影响值对结局变量作用效果显著的变量进行筛选;随机森林是根据变量重要性评分对各预测因素进行排序,评分越高则说明变量对结局变量的影响越大,反则越小。上述四种模型通过比较模型预测精度可获知最优预测模型,再在最优模型中根据以上原则筛选关键预测因素。
第二部分
1.乳腺癌复发转移风险预测因素研究
采用自然语言处理技术,基于病案信息系统抓取数据,收集近五年在目标医院住院的乳腺癌病人资料,并通过电话、通信等方式完善随访工作。测量并收集人口学、社会心理学和乳腺专科3个维度的数据(影响因素)。剔除入组条件:初诊即发生远处转移的病人;不能正常完成随访的病人;病理资料不完整的病人。先对原始研究数据分别采用统计学方法如方差分析、列联分析和主成分分析等对包含3个维度的数据进行降维处理,最终获得乳腺癌复发转移风险的重要预测因素。
2.基于COX回归、自组织竞争网络、LIBSVM、概率神经网络分类方法的乳腺癌复发转移风险预测模型的构建与评价
基于降维处理后的结果,获得所有研究对象包含3个维度的乳腺癌复发转移风险重要预测因素数据库,采用COX回归、自组织竞争网络、LIBSVM、概率神经网络分类方法对包含3个维度影响因素的数据建立4个乳腺癌复发转移风险预测模型。通过ROC曲线下面积、特异度、灵敏度、分类准确性和真阳性预测值对不同方法建立的乳腺癌复发转移风险预测模型进行评价,通过比较模型预测精度,确定最优乳腺癌复发转移风险预测模型。
(1)将研究中的全部病例分为两个部分,其中2/3作为训练集,1/3作为模型的测试集。
(2)利用训练集建立COX回归、自组织竞争网络、LIBSVM、概率神经网络分类方法4种乳腺癌复发转移风险预测模型。
自组织竞争网络
自组织神经网络可以通过对客观事件的反复观察、分析与比较,自行提示其内在规律,并对具有共同特征的事物进行正确的分类。与人脑相似,可通过自动寻找样本中的内在规律和本质属性,自组织、自适应地改变网络参数与结构。将降维处理后的重要预测因素(量化特征)作为网络的输入,五年内出现复发转移和五年内未出现复发转移作为网络的输出,利用newc()函数创建一个自竞争网络,竞争层神经元的数目为2,学习速率设置为0.1。通过MATLAB 实现。用顺练集数据对设计的LVQ神经网络进行训练,然后对测试集数据进行测试并对测试结果进行分析。
LIBSVM
支持向量机(Support Vector Machine,SVM)是结构风险最小化的近似实现。可用于模式分类和非线性回归。LIBSVM是中国台湾大学林智仁教授等开发设计的一个简单、易于使用和快速有效的SVM模式识别和回归的软件包。根据降维后数据建立属性矩阵,五年内出现复发转移和五年内未出现复发转移作为标签,利用MATLAB中的LIBSVM工具箱进行分类预测。全部数据同样分训练集和测试集进行。
概率神经网络
概率神经网络是由径向基函数网络发展而来的一种前馈型神经网络,具有结果简单、训练简洁和应用广泛的特点。其优势在于用线性学习算法来完成非线性学习算法所做的工作,同时保持非线性算法的高精度等特性。该网络对应的权值就是模式样本的分布。网络输出分为五年内无复发转移、仅局部复发、仅骨或软组织转移、仅内脏转移、多发复发转移五种复发转移类型。数据采集完成后,利用MATLAB创建概率神经网络,根据复发转移类型进行数据训练,进行网络效果测试。
3.关键预测因素的筛选
不同模型中关键预测因素的确定方法有所不同。上述四种模型通过比较模型预测精度可获知最优预测模型,再在最优模型中根据不同模型的原则筛选关键预测因素。
4.临床决策
根据概率神经网络的不同复发转移类型决定,五年内无复发转移或仅局部复发可不考虑化疗,五年内仅局部复发考虑局部放疗,其他类型则需要考虑化疗联合放疗,内分泌治疗和靶向治疗则根据免疫组织化学结果进行。手术治疗方案根据NCCN指南结合CSCO乳腺癌指南综合而定。综上所述,给出病人综合治疗方案。
第三部分:
收集近十年患者生物特征数据,建立乳腺癌大数据库:收集乳腺疾病患者的检验、分子病理、组织病理等数据,建立乳腺癌的疾病生物分子特征数据库。
通过整合性多模块分析乳腺癌易感基因:
建立整合性多模块分析的数据模型,通过分析乳腺临床和生物大数据,筛选导致乳腺癌发生的易感基因;
收集家族性乳腺癌患者的家系,明确候选易感基因在家系中的传递,进一步证实候选基因与乳腺癌发生的相关性。
阐明乳腺癌易感基因突变导致乳腺癌发生的机制:在筛选导致乳腺癌发生的易感基因,发现多个基因的功能与DNA同源重组修复机制相关,因此这些基因突变可能导致DNA同源重组修复功能障碍,进而导致基因组不稳定。因此,将研究易感基因突变与DNA同源重组修复功能的关系;
在乳腺正常细胞(组织)和癌细胞(组织)中分析候选易感基因的基因突变、基因表达和蛋白表达情况;
在乳腺癌细胞(组织)中分析基因突变导致DNA同源重组修复功能的机制;
建立基于乳腺癌易感基因突变的乳腺癌早期筛查模型:
通过家系数据和基因大数据的分析,分析导致DNA同源重组修复功能障碍的重点基因,建立乳腺癌早期诊断的数据模型;
通过上述数据模型指导乳腺癌患者的早期筛查和诊断。
第四部分:创建可同时面向医师和病人的乳腺癌全程管理应用软件,实现以微信小程序或手机应用软件来使用,从而方便手机应用。整合医院乳腺外科、乳腺内科、乳腺整形、放疗科、病理科、放诊科、骨科等相关科室骨干力量,并联合医疗体各家医院共同参与。力争患者在医院不同科室之间或院内、外治疗能很好地衔接。以便在合理的时机采取有效、温和的方法,可能的情况下患者可以在家里口服药物,减少患者来院时间,同时在保持较高生活质量的情况下,延长治疗期,延年益寿。主管医生可以从该应用软件便捷地获取患者各种信息,患者可以从该应用获得人工智能答疑解惑,包括肿瘤或非肿瘤相关健康问题(包括心血管问题、心理问题、营养问题、骨安全问题等);或者获得分诊信息,方便下一步选择医院对应科室门诊就诊;临近复诊时间时,病人可得到需门诊复查的提醒。乳腺核磁共振成像,显示软组织阴影,并且无辐射,此外还可以发现除原发灶外的额外病灶及周边淋巴转移灶;在目前已知的乳腺三种检测方法中——磁共振成像(MRI)、乳腺钼靶(MAM)与乳腺超声检查(BUS) ——准确度最高。计算机辅助系统(CAD)可通过影像学、医学图像处理技术等,辅助影像科医生分析病灶。由于主观经验及知识水平导致的判断局限,CAD 的辅助可以提高诊断的精确度。搭载在全程管理软件中的乳腺磁共振计算机辅助诊断系统可进一步协助医生准确诊断,方便乳腺癌患者各方数据的整合。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (5)

1.一种建立乳腺癌早期筛查模型的方法,其特征在于,包括以下步骤:
第一步:收集目标医院的乳腺内科临床和生物特征数据,建立乳腺癌大数据库;
第二步:通过整合性多模块分析乳腺癌易感基因;
第三步:确定乳腺癌易感基因突变导致乳腺癌发生的机制;
第四步:建立基于乳腺癌易感基因突变的乳腺癌早期筛查模型。
2.根据权利要求1所述的一种建立乳腺癌早期筛查模型的方法,其特征在于,所述第一步具体为:
1)通过HIS系统,收集近十年在目标医院的内科门诊和病房就诊的患者有关采集影像学、临床疾病特征、诊断和治疗相关数据,建立乳腺癌的临床大数据库;
2)收集乳腺疾病患者的检验、分子病理以及组织病理数据,建立乳腺癌的疾病生物分子特征数据库;
3)将上述的乳腺癌的临床大数据库和乳腺癌的疾病生物分子特征数据库融合形成所述乳腺癌大数据库。
3.根据权利要求2所述的一种建立乳腺癌早期筛查模型的方法,其特征在于,所述第二步具体为:
1)建立整合性多模块分析的数据模型,通过分析乳腺癌的临床大数据和乳腺癌的疾病生物分子特征大数据,筛选出导致乳腺癌发生的易感基因;
2)收集家族性乳腺癌患者的家系,明确候选易感基因在家系中的传递,进一步明确候选基因与乳腺癌发生的相关性;
3)通过整合性多模块分析出乳腺癌易感基因。
4.根据权利要求3所述的一种建立乳腺癌早期筛查模型的方法,其特征在于,所述第三步具体为:
1)在乳腺正常组织和癌组织中,分析候选易感基因的基因突变、基因表达和蛋白表达情况,明确乳腺癌组织细胞中易感基因的基因突变和蛋白水平;
2)对比正常乳腺组织,在乳腺癌组织中分析基因突变导致同源重组修复功能的机制,明确乳腺癌细胞和组织中DNA同源重组修复功能受损;
3)确定乳腺癌易感基因突变导致乳腺癌发生的机制。
5.根据权利要求4所述的一种建立乳腺癌早期筛查模型的方法,其特征在于,所述第四步具体为:
1)通过家系数据和基因大数据的分析,分析导致DNA同源重组修复功能障碍的重点基因,建立乳腺癌早期诊断的基因筛查数据模型;
2)通过收集上述基因筛查数据模型建立后的患者就诊产生的乳腺癌的临床大数据和乳腺癌的疾病生物分子特征大数据,建立基因筛查数据模型的验证数据集,通过验证数据集以分析验证基因筛查数据模型的准确性、特异性和敏感性;
3)确定建立基于乳腺癌易感基因突变的乳腺癌早期筛查模型。
CN202110188905.6A 2021-02-19 2021-02-19 一种建立乳腺癌早期筛查模型的方法 Withdrawn CN114974552A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110188905.6A CN114974552A (zh) 2021-02-19 2021-02-19 一种建立乳腺癌早期筛查模型的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110188905.6A CN114974552A (zh) 2021-02-19 2021-02-19 一种建立乳腺癌早期筛查模型的方法

Publications (1)

Publication Number Publication Date
CN114974552A true CN114974552A (zh) 2022-08-30

Family

ID=82954520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110188905.6A Withdrawn CN114974552A (zh) 2021-02-19 2021-02-19 一种建立乳腺癌早期筛查模型的方法

Country Status (1)

Country Link
CN (1) CN114974552A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115376706A (zh) * 2022-10-26 2022-11-22 杭州艾名医学科技有限公司 一种基于预测模型的乳腺癌药物方案的预测方法及装置
CN116030261A (zh) * 2023-03-29 2023-04-28 浙江省肿瘤医院 Mri影像多组学评估乳腺癌同源重组修复缺陷的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115376706A (zh) * 2022-10-26 2022-11-22 杭州艾名医学科技有限公司 一种基于预测模型的乳腺癌药物方案的预测方法及装置
CN115376706B (zh) * 2022-10-26 2023-04-07 杭州艾名医学科技有限公司 一种基于预测模型的乳腺癌药物方案的预测方法及装置
CN116030261A (zh) * 2023-03-29 2023-04-28 浙江省肿瘤医院 Mri影像多组学评估乳腺癌同源重组修复缺陷的方法

Similar Documents

Publication Publication Date Title
WO2022110278A1 (zh) 一种用于肺结节风险性评估的系统
Wang et al. Correlation between CT based radiomics features and gene expression data in non-small cell lung cancer
CN114974552A (zh) 一种建立乳腺癌早期筛查模型的方法
CN111508603A (zh) 一种基于机器学习的出生缺陷预测及风险评估方法、系统及电子设备
Luo et al. Emerging role of artificial intelligence in diagnosis, classification and clinical management of glioma
Ying et al. Multi-modal data analysis for alzheimer’s disease diagnosis: An ensemble model using imagery and genetic features
Sivanagireddy et al. Early Lung Cancer Prediction using Correlation and Regression
Poly et al. Artificial intelligence in diabetic retinopathy: Insights from a meta-analysis of deep learning
Xin et al. A pathway analysis based on genome-wide DNA methylation of Chinese patients with graves’ orbitopathy
Gauthier et al. Breast cancer risk score: a data mining approach to improve readability
Jing et al. A comprehensive survey of intestine histopathological image analysis using machine vision approaches
Uysal et al. Using Machine Learning Methods for Detecting Alzheimer's Disease through Hippocampal Volume Analysis
Kosvyra et al. Towards data integration for AI in cancer research
Liu et al. A joint multi-modal learning method for early-stage knee osteoarthritis disease classification
Bi et al. Explainable and programmable hypergraph convolutional network for imaging genetics data fusion
CN115206532A (zh) 一种基于决策树的乳腺肿瘤预测方法及系统
US20210313064A1 (en) Tau protein accumulation prediction apparatus using machine learning and tau protein accumulation prediction method using the same
Muis et al. CNN-based Approach for Enhancing Brain Tumor Image Classification Accuracy
WO2022130006A1 (en) A prognosis and early diagnosis method and system and choosing the best treatment based on data fusion and information analysis by artificial intelligence, with the ability to modify and improve information and results according to machine learning
CN112382341A (zh) 一种用于鉴定食管鳞癌预后相关的生物标志物的方法
US11535896B2 (en) Method for analysing cell-free nucleic acids
Javeed et al. Breaking barriers: a statistical and machine learning-based hybrid system for predicting dementia
Wang et al. Prospect of the objectification of pulse diagnosis in traditional chinese medicine in the age of big data
Mo et al. Texture Feature-Based Machine Learning Classification on MRI Image for Sepsis-Associated Encephalopathy Detection: A Pilot Study
US20240105333A1 (en) Method and apparatus for assessing patient's response to therapy

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20220830