CN113707327A - 一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型 - Google Patents

一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型 Download PDF

Info

Publication number
CN113707327A
CN113707327A CN202110984269.8A CN202110984269A CN113707327A CN 113707327 A CN113707327 A CN 113707327A CN 202110984269 A CN202110984269 A CN 202110984269A CN 113707327 A CN113707327 A CN 113707327A
Authority
CN
China
Prior art keywords
tumor
model
judgment
module
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110984269.8A
Other languages
English (en)
Inventor
景元明
张�林
陈艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110984269.8A priority Critical patent/CN113707327A/zh
Publication of CN113707327A publication Critical patent/CN113707327A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Abstract

本发明公开了一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型,其特征在于,包括以下模块,模块S1:数据挖掘、模块S2:模型构建、模块S3:判断分析、模块S4:系统开发,本发明层次合理,通过建立高效的数据管理系统,发展数据安全使用技术,提供高效的有效使用工具,“唤醒”睡眠医学数据,给患者带来实实在在的里利益,也节约了医生的看病时间,有利于在目标人群中进行大规模小成本的筛查,给出科学的判断,也可以为目标人群和医生给出早期的辅助诊断和判断,更可以提醒尚未患肿瘤的人群,及时发现异常,对于健康中国的推进,对于降低治疗成本,节约医疗资源,增加无形的社会效益等方面都具有极其重要的现实意义。

Description

一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型
技术领域
本发明涉及医学大数据利用技术领域,特别涉及一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型。
背景技术
癌症是一个复杂的疾病,而其发病率在逐年增多,各国对于癌症的治疗也是一笔天文数字的支出,如何对癌症进行早期诊断从而及时治疗,这是各国科学家一直在不懈研究的课题,而如何扩大筛选规模并降低医疗成本亦是一个巨大的挑战,每个肿瘤往往拥有多个驱动基因和复杂的信号传导通路异常,但是对于癌症的早期诊断一直是个棘手的问题,如何通过简单的手段来预测早期肿瘤或者通过对患者的血液检验指标并通过算法进行判断是一个重要和紧迫的问题。对以上问题,以下提出一种解决方案。
发明内容
本发明的目的是提供一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型,具有提高临床肿瘤早期诊断成功率的优点。
本发明的上述技术目的是通过以下技术方案得以实现的:
一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型,包括以下模块,模块S1:数据挖掘、模块S2:模型构建、模块S3:判断分析、模块S4:系统开发,所述数据挖掘包括大数据清理、大数据整理和大数据分类,所述模型构建包括logistics回归模型、拉索lasso回归模型、岭回归ridge回归模型、Boosting和AdaBoost增强学习、决策树模型、支持向量模型、弹性网络回归模型、朴素贝叶斯、K近邻算法、随机森林算法和神经网络模型,所述判断分析包括最大似然比判断、Fisher判别、Bayes判别、逐步判别、ROC曲线判别和交叉验证模型优化,所述系统开发包括甲状腺癌预测模型开发、肺癌预测模型开发、肝癌预测模型开发、胃癌预测模型开发、前列腺癌预测模型开发、脑肿瘤预测模型开发、肾肿瘤预测模型开发和其他肿瘤预测模型开发。
作为优选,所述模块S1中,数据挖掘通过收集某三甲医院各种良恶性肿瘤患者十几种常见肿瘤标志物为基础进行统计分析,利用收集该医院近4年肿瘤标志物大数据,以甲状腺、肺和肝前列腺脑和肾等几个重要器官中的良恶性肿瘤进行区分和判别,然后进行数据清洗、整理和汇总,以备后续分析之用。
作为优选,所述模块S2中,模型构建通过构建数种机器学习模型包括逻辑回归、拉索回归、岭回归、弹性网络回归模型以及随机森林模型、支持向量机、增强学习和人工神经网络模型等,并通过各种方法包括模型交叉验证优化等进行拟合优度检查,对各模型的预测效果进行判别分析比较,优化和验证最佳模型,筛选出最可靠、最优和最简洁模型。
作为优选,所述模块S3中,判断分析通过对模型的准确度通过最大似然比判别、Fisher判别、逐步判别、Bayes判别分析等方法进行比较。
作为优选,所述模块S4中,系统开发通过开发几种肿瘤模型的交互式手机电脑版系统,并推向市场,提高临床肿瘤早期诊断的成功率,获取疾病的早期信息。
作为优选,所述模块S1至S4中,评价各模型的优劣以诊断试验的指标为准:灵敏度、特异度、阳性预测值、阴性预测值、预测准确度和ROC曲线下面积(AUC),通过进行受试者工作曲线(ROC)分析不同指标预测相关肿瘤诊断价值的大小,当ROC曲线下面积为<0.5时表示评价指标无价值,当ROC曲线下面积在0.5-0.7之间时表示该评价值指标有较低准确性,当ROC曲线下面积0.7-0.9之间时表示评价指标有一定准确性,当ROC曲线下面积>0.9表示评价指标有较高准确性,理想状况下完善的指标为1,并通过Youden指数(约登指数)表示筛检方法发现真正患者与非患者的总能力,可测定有价值的肿瘤标志物的最佳界值及在相应最佳界值下肿瘤标志物对预测肿瘤的治疗价值有无改善;对预测价值较高的肿瘤标志物分析其联合检测对评价恶性肿瘤预测价值,对有危险度较高的因素进行提醒。
本发明的有益效果是:通过建立高效的数据管理系统,发展数据安全使用技术,提供高效的有效使用工具,“唤醒”睡眠医学数据,给患者带来实实在在的里利益,也节约了医生的看病时间,有利于在目标人群中进行大规模小成本的筛查,给出科学的判断,也可以为目标人群和医生给出早期的辅助诊断和判断,更可以提醒尚未患肿瘤的人群,及时发现异常,改善生活方式和饮食习惯,加强锻炼,提高身体素质,延长寿命,这对于健康中国的推进,对于降低治疗成本,节约医疗资源,增加无形的社会效益等方面都具有极其重要的现实意义。
附图说明
图1为实施例的技术路线图。
具体实施方式
以下所述仅是本发明的优选实施方式,保护范围并不仅局限于该实施例,凡属于本发明思路下的技术方案应当属于本发明的保护范围。同时应当指出,对于本技术领域的普通技术人员而言,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
如图1所示,一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型,其特征在于,包括以下模块:
模块S1:数据挖掘;数据挖掘包括大数据清理、大数据整理和大数据分类。通过收集某三甲医院各种良恶性肿瘤患者十几种常见肿瘤标志物为基础进行统计分析,利用收集该医院近4年肿瘤标志物大数据,以甲状腺、肺和肝前列腺脑和肾等几个重要器官中的良恶性肿瘤进行区分和判别,然后进行数据清洗、整理和汇总,以备后续分析之用。
模块S2:模型构建;模型构建包括logistics回归模型、拉索lasso回归模型、岭回归ridge回归模型、Boosting和AdaBoost增强学习、决策树模型、支持向量模型、弹性网络回归模型、朴素贝叶斯、K近邻算法、随机森林算法和神经网络模型。通过构建数种机器学习模型包括逻辑回归、拉索回归、岭回归、弹性网络回归模型以及随机森林模型、支持向量机、增强学习和人工神经网络模型等,并通过各种方法包括模型交叉验证优化等进行拟合优度检查,对各模型的预测效果进行判别分析比较,优化和验证最佳模型,筛选出最可靠、最优和最简洁模型。
模块S3:判断分析;判断分析包括最大似然比判断、Fisher判别、Bayes判别、逐步判别、ROC曲线判别和交叉验证模型优化。通过对模型的准确度通过最大似然比判别、Fisher判别、逐步判别、Bayes判别分析等方法进行比较。
模块S4:系统开发;系统开发包括甲状腺癌预测模型开发、肺癌预测模型开发、肝癌预测模型开发、胃癌预测模型开发、前列腺癌预测模型开发、脑肿瘤预测模型开发、肾肿瘤预测模型开发和其他肿瘤预测模型开发。通过开发几种肿瘤模型的交互式手机电脑版系统,并推向市场,提高临床肿瘤早期诊断的成功率,获取疾病的早期信息。
模块S1至S4中,评价各模型的优劣以诊断试验的指标为准:灵敏度、特异度、阳性预测值、阴性预测值、预测准确度和ROC曲线下面积(AUC),通过进行受试者工作曲线(ROC)分析不同指标预测相关肿瘤诊断价值的大小,当ROC曲线下面积为<0.5时表示评价指标无价值,当ROC曲线下面积在0.5-0.7之间时表示该评价值指标有较低准确性,当ROC曲线下面积0.7-0.9之间时表示评价指标有一定准确性,当ROC曲线下面积>0.9表示评价指标有较高准确性,理想状况下完善的指标为1,并通过Youden指数(约登指数)表示筛检方法发现真正患者与非患者的总能力,可测定有价值的肿瘤标志物的最佳界值及在相应最佳界值下肿瘤标志物对预测肿瘤的治疗价值有无改善;对预测价值较高的肿瘤标志物分析其联合检测对评价恶性肿瘤预测价值,对有危险度较高的因素进行提醒。
通过建立高效的数据管理系统,发展数据安全使用技术,提供高效的有效使用工具,“唤醒”睡眠医学数据,给患者带来实实在在的里利益,也节约了医生的看病时间,有利于在目标人群中进行大规模小成本的筛查,给出科学的判断,也可以为目标人群和医生给出早期的辅助诊断和判断,更可以提醒尚未患肿瘤的人群,及时发现异常,改善生活方式和饮食习惯,加强锻炼,提高身体素质,延长寿命,这对于健康中国的推进,对于降低治疗成本,节约医疗资源,增加无形的社会效益等方面都具有极其重要的现实意义。

Claims (6)

1.一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型,其特征在于,包括以下模块,模块S1:数据挖掘、模块S2:模型构建、模块S3:判断分析、模块S4:系统开发,所述数据挖掘包括大数据清理、大数据整理和大数据分类,所述模型构建包括logistics回归模型、拉索lasso回归模型、岭回归ridge回归模型、Boosting和AdaBoost增强学习、决策树模型、支持向量模型、弹性网络回归模型、朴素贝叶斯、K近邻算法、随机森林算法和神经网络模型,所述判断分析包括最大似然比判断、Fisher判别、Bayes判别、逐步判别、ROC曲线判别和交叉验证模型优化,所述系统开发包括甲状腺癌预测模型开发、肺癌预测模型开发、肝癌预测模型开发、胃癌预测模型开发、前列腺癌预测模型开发、脑肿瘤预测模型开发、肾肿瘤预测模型开发和其他肿瘤预测模型开发。
2.根据权利要求1所述的一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型,其特征在于,所述模块S1中,数据挖掘通过收集某三甲医院各种良恶性肿瘤患者十几种常见肿瘤标志物为基础进行统计分析,利用收集该医院近4年肿瘤标志物大数据,以甲状腺、肺和肝前列腺脑和肾等几个重要器官中的良恶性肿瘤进行区分和判别,然后进行数据清洗、整理和汇总,以备后续分析之用。
3.根据权利要求2所述的一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型,其特征在于,所述模块S2中,模型构建通过构建数种机器学习模型包括逻辑回归、拉索回归、岭回归、弹性网络回归模型以及随机森林模型、支持向量机、增强学习和人工神经网络模型等,并通过各种方法包括模型交叉验证优化等进行拟合优度检查,对各模型的预测效果进行判别分析比较,优化和验证最佳模型,筛选出最可靠、最优和最简洁模型。
4.根据权利要求3所述的一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型,其特征在于,所述模块S3中,判断分析通过对模型的准确度通过最大似然比判别、Fisher判别、逐步判别、Bayes判别分析等方法进行比较。
5.根据权利要求4所述的一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型,其特征在于,所述模块S4中,系统开发通过开发几种肿瘤模型的交互式手机电脑版系统,并推向市场,提高临床肿瘤早期诊断的成功率,获取疾病的早期信息。
6.根据权利要求5所述的一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型,其特征在于,所述模块S1至S4中,评价各模型的优劣以诊断试验的指标为准:灵敏度、特异度、阳性预测值、阴性预测值、预测准确度和ROC曲线下面积(AUC),通过进行受试者工作曲线(ROC)分析不同指标预测相关肿瘤诊断价值的大小,当ROC曲线下面积为<0.5时表示评价指标无价值,当ROC曲线下面积在0.5-0.7之间时表示该评价值指标有较低准确性,当ROC曲线下面积0.7-0.9之间时表示评价指标有一定准确性,当ROC曲线下面积>0.9表示评价指标有较高准确性,理想状况下完善的指标为1,并通过Youden指数(约登指数)表示筛检方法发现真正患者与非患者的总能力,可测定有价值的肿瘤标志物的最佳界值及在相应最佳界值下肿瘤标志物对预测肿瘤的治疗价值有无改善;对预测价值较高的肿瘤标志物分析其联合检测对评价恶性肿瘤预测价值,对有危险度较高的因素进行提醒。
CN202110984269.8A 2021-08-25 2021-08-25 一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型 Withdrawn CN113707327A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110984269.8A CN113707327A (zh) 2021-08-25 2021-08-25 一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110984269.8A CN113707327A (zh) 2021-08-25 2021-08-25 一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型

Publications (1)

Publication Number Publication Date
CN113707327A true CN113707327A (zh) 2021-11-26

Family

ID=78654876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110984269.8A Withdrawn CN113707327A (zh) 2021-08-25 2021-08-25 一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型

Country Status (1)

Country Link
CN (1) CN113707327A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115762764A (zh) * 2022-11-25 2023-03-07 中山大学附属第三医院 一种hiv阴性隐球菌脑膜炎治疗结局预测模型及其构建方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111276252A (zh) * 2020-01-15 2020-06-12 北京吉因加科技有限公司 一种肿瘤良恶性鉴别模型的构建方法及装置
CN113113130A (zh) * 2021-03-15 2021-07-13 湖南医云智享医疗科技有限公司 一种肿瘤个体化诊疗方案推荐方法
CN113642673A (zh) * 2021-08-31 2021-11-12 北京字跳网络技术有限公司 图像生成方法、装置、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111276252A (zh) * 2020-01-15 2020-06-12 北京吉因加科技有限公司 一种肿瘤良恶性鉴别模型的构建方法及装置
CN113113130A (zh) * 2021-03-15 2021-07-13 湖南医云智享医疗科技有限公司 一种肿瘤个体化诊疗方案推荐方法
CN113642673A (zh) * 2021-08-31 2021-11-12 北京字跳网络技术有限公司 图像生成方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115762764A (zh) * 2022-11-25 2023-03-07 中山大学附属第三医院 一种hiv阴性隐球菌脑膜炎治疗结局预测模型及其构建方法

Similar Documents

Publication Publication Date Title
Wang et al. A tree ensemble-based two-stage model for advanced-stage colorectal cancer survival prediction
He et al. Multi-label ocular disease classification with a dense correlation deep neural network
Tang et al. CapSurv: Capsule network for survival analysis with whole slide pathological images
CN107358014B (zh) 一种生理数据的临床前处理方法及系统
CN104424386A (zh) 基于多参数磁共振影像的前列腺癌计算机辅助识别系统
CN110991536B (zh) 原发性肝癌的早期预警模型的训练方法
CN113077434B (zh) 基于多模态信息的肺癌识别方法、装置及存储介质
CN113113130A (zh) 一种肿瘤个体化诊疗方案推荐方法
Aksakallı et al. Kidney x-ray images classification using machine learning and deep learning methods
CN110363090A (zh) 智能心脏疾病检测方法、装置及计算机可读存储介质
Zhou et al. A correlation analysis between SNPs and ROIs of Alzheimer’s disease based on deep learning
Lv et al. Development and validation of a clinically applicable deep learning strategy (HONORS) for pulmonary nodule classification at CT: a retrospective multicentre study
Yuan et al. Pulmonary nodule detection using 3-d residual u-net oriented context-guided attention and multi-branch classification network
CN113707327A (zh) 一种基于医疗大数据的多肿瘤标志物肿瘤诊断模型
Chen et al. Decision-making model based on ensemble method in auxiliary medical system for non-small cell lung cancer
CN113707317B (zh) 一种基于混合模型的疾病危险因素重要性分析方法
Tian et al. Radiomics and Its Clinical Application: Artificial Intelligence and Medical Big Data
CN111180009A (zh) 一种基于基因组分析的癌症分期预测系统
Gugulothu et al. An automatic classification of pulmonary nodules for lung cancer diagnosis using novel LLXcepNN classifier
CN111582370B (zh) 一种基于粗糙集优化的脑转移瘤预后指标约简及分类方法
Kolli et al. Efficient development of supervised learning algorithm for kidney stone prediction
Zhang et al. An intelligent decision-making support system for the detection and staging of prostate cancer in developing countries
CN116228759A (zh) 肾细胞癌类型的计算机辅助诊断系统及设备
CN108805178B (zh) 跨粒度智能化疾病筛查系统
Manikandan et al. Hybrid computational intelligence for healthcare and disease diagnosis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20211126

WW01 Invention patent application withdrawn after publication