CN108538390A - 一种面向医学数据的增量式处理方法 - Google Patents

一种面向医学数据的增量式处理方法 Download PDF

Info

Publication number
CN108538390A
CN108538390A CN201810399299.0A CN201810399299A CN108538390A CN 108538390 A CN108538390 A CN 108538390A CN 201810399299 A CN201810399299 A CN 201810399299A CN 108538390 A CN108538390 A CN 108538390A
Authority
CN
China
Prior art keywords
model
data
probability
multiplied
processing method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810399299.0A
Other languages
English (en)
Inventor
许涛
郭克华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201810399299.0A priority Critical patent/CN108538390A/zh
Publication of CN108538390A publication Critical patent/CN108538390A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种面向医学数据的增量式处理方法,针对当前医疗数据无法被充分的利用的问题。因进行数据共享涉及用户隐私问题还有各医院平台的差异、数据格式的差异等原因难以实现。所以在医院内部使用自己少量的数据,依托人工智能,训练出一个能用于辅助诊断的系统,辅助医生对于一些疑难病症的诊断,提高诊断的准确率,使得医生能更好的治疗病人。本发明能不断从新数据中进行增量式学习,不断提高系统的准确度,而且每次的增量式学习不需要消耗大量的时间重新计算。

Description

一种面向医学数据的增量式处理方法
技术领域
本发明涉及一种面向医学数据的增量式处理方法。
背景技术
深度学习是一种用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。至今已有数种深度学习框架,如深度神经网络、卷积神经网络等,这些框架被应用于多个领域并取得了极好的效果。深度学习也能帮助医生用于疾病的诊断方面,目前医疗领域融入了越来越多的人工智慧、传感技术等,使医疗服务逐渐走向智能化。
现代医学是建立在实验基础上的循证医学,医生的诊疗结论必须建立在相应的诊断数据上,影像是重要的诊断依据,医疗行业80%~90%的数据都来源于医学影像。所以临床医生有极强的影像需求,他们需要对医学影像进行各种各样的定量分析、历史图像的比较,从而能够完成一次诊断。人工智能+医学影像便是通过深度学习,完成对影像的分类、目标检测、图像分割和检索工作,协助医生完成诊断、治疗工作的一种辅助工具。
目前,国内公共医疗管理系统不完善,因为医疗数据涉及公民个人隐私,这样的数据一旦开放共享,必然伴随着个人身份和隐私信息泄漏的风险。因此每个医院必须要保证自己的数据的安全,会谨慎选择共享自己的医疗数据。再者,部分医院没有实现对数据的有效分析和利用,导致了资源的浪费。而且每个医院都有自己独立的管理系统,而这些独立的、结构不同的系统使得系统之间的信息共享难以进行。这种种原因导致了数据孤岛的问题,这更导致大量的资源不能被充分的发挥应有的作用。
目前,很多研究机构都在使用深度学习进行疾病方面的诊断。例如:微软亚洲研究院智慧医疗项目是以人工智能与大数据为基础,基于计算机视觉与机器学习技术实现医学影像识别。
已有的方法要想达到一个较高的准确度需要大量的数据支撑,目前由于孤岛问题,大部分医院的数据还是有限的。而且医院的数据每天都在发生变化,每天都有新的数据加入,这些方法没有达到充分利用新增加的数据。
发明内容
本发明所要解决的技术问题是,针对现有技术不足,提供一种面向医学数据的增量式处理方法。
为解决上述技术问题,本发明所采用的技术方案是:一种面向医学数据的增量式处理方法,包括以下步骤:
1)采集医疗影像数据,对所述医疗影像数据进行迁移学习,将迁移学习得到的模型存入模型库内;
2)对新增的医疗影像数据进行迁移学习,将迁移学习得到的模型加入到所述模型库内;
3)采集需要诊断的影像,调用所述模型库中的相关模型;
4)获取到所述模型库内不同的模型给出的关于某张需要诊断的影像图片有症状和无症状的概率值,将不同模型给出的有症状的概率值相乘,再将不同模型给出的无症状的概率值相乘,最后将两个相乘的结果相加,得到一个系数;
5)计算有症状的概率,将模型库内所有模型给出的有症状的概率相乘,再乘以步骤4)中系数的倒数;计算无症状的概率,将模型库内模型给出的无症状的概率相乘,再乘以步骤4)中系数的倒数;
6)返回最终结果。
步骤1)中,采用Google的深度学习框架tensorflow和InceptionV3模型对所述医疗影像数据进行迁移学习。
步骤2)中,采用Google的深度学习框架tensorflow和InceptionV3模型对新增的医疗影像数据进行迁移学习。
与现有技术相比,本发明所具有的有益效果为:本发明能不断从新数据中进行增量式学习,不断提高系统的准确度,而且每次的增量式学习不需要消耗大量的时间重新计算。
附图说明
图1为本发明方法流程图。
具体实施方式
本发明针对当前医疗数据无法被充分的利用的问题。因进行数据共享涉及用户隐私问题还有各医院平台的差异、数据格式的差异等原因难以实现。所以在医院内部使用自己少量的数据,依托人工智能,训练出一个能用于辅助诊断的系统,辅助医生对于一些疑难病症的诊断,提高诊断的准确率,使得医生能更好的治疗病人。
本技术方案可以实现在数据量较小的时候对数据充分利用,实现相应的医疗辅助诊断的功能。而且可以随着医院数据量的增加,增量式的学习新数据中的信息,不需要使用全部数据重新训练,只需用新增的数据训练。随着数据量的增加,准确率也将不断提升。在辅助诊断过程中,将不同的模型的结果用整合规则综合起来,得到最终的结果。该方案不需要一次需要大量的数据,而是在使用的过程中不断的获取新的数据加入。具体流程见图1。
模型训练过程为:
步骤1、数据的采集,医院医生再平常诊断中,就是一个数据收集的过程,医生为每个病人诊断,每个病人的医疗影像便是影像数据,医生诊断结果就是对应的便签。
步骤2、数据的整理,将上述采集到的数据,结合医生的诊断意见,分为有症状和无症状,分别放入到对应的不同的文件夹中存储。
步骤3、将收集到的数据输入到模型中进行训练,训练采用Google的深度学习框架tensorflow和InceptionV3模型进行迁移学习。迁移学习能保留原来Inception模型的优点,又能学习到我们提供的数据中信息。将训练得到的模型放到模型库中存储,方便以后的调用。
增量式学习过程:
步骤1、将新增的数据按照模型训练过程中的步骤2的格式整理,放入不同的文件夹中。
步骤2、仅使用新增的数据进行模型的训练,将训练得到的模型加入到现有的模型库中,以便日后使用。
DST整合准则计算过程:
步骤1、获取到不同的模型给出的关于某张图片有症状和无症状的概率值,将不同模型给出的有症状的概率相乘,再将不同模型给出的无症状的概率相乘,最后将这两结果相加,得到一个系数。
步骤2、计算有症状的概率,将所有模型给出的有症状的概率相乘,再乘上步骤1计算得到的系数的倒数。
步骤3、计算无症状的概率,同样地,将所有模型给出的无症状的概率相乘,再乘上步骤1中的系数的倒数。
辅助诊断过程:
步骤1、医生采集到需要诊断的影像,上传到系统中。
步骤2、系统调用模型库中的相关的模型,即通过模型训练和增量式学习得到的模型,并分别加载模型对影像进行计算,将不同模型得出的结果分别保存下来。
步骤3、采用DST准则将不同的模型结果进行综合,并将结果返回给医生,返回具体信息包括:最终结果,具体概率为多少。医生再结合自身经验给出最终的诊断。

Claims (3)

1.一种面向医学数据的增量式处理方法,其特征在于,包括以下步骤:
1)采集医疗影像数据,对所述医疗影像数据进行迁移学习,将迁移学习得到的模型存入模型库内;
2)对新增的医疗影像数据进行迁移学习,将迁移学习得到的模型加入到所述模型库内;
3)采集需要诊断的影像,调用所述模型库中的相关模型;
4)获取到所述模型库内不同的模型给出的关于某张需要诊断的影像图片有症状和无症状的概率值,将不同模型给出的有症状的概率值相乘,再将不同模型给出的无症状的概率值相乘,最后将两个相乘的结果相加,得到一个系数;
5)计算有症状的概率,将模型库内所有模型给出的有症状的概率相乘,再乘以步骤4)中系数的倒数;计算无症状的概率,将模型库内模型给出的无症状的概率相乘,再乘以步骤4)中系数的倒数;
6)返回最终结果。
2.根据权利要求1所述的面向医学数据的增量式处理方法,其特征在于,步骤1)中,采用Google的深度学习框架tensorflow和InceptionV3模型对所述医疗影像数据进行迁移学习。
3.根据权利要求1所述的面向医学数据的增量式处理方法,其特征在于,步骤2)中,采用Google的深度学习框架tensorflow和InceptionV3模型对新增的医疗影像数据进行迁移学习。
CN201810399299.0A 2018-04-28 2018-04-28 一种面向医学数据的增量式处理方法 Pending CN108538390A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810399299.0A CN108538390A (zh) 2018-04-28 2018-04-28 一种面向医学数据的增量式处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810399299.0A CN108538390A (zh) 2018-04-28 2018-04-28 一种面向医学数据的增量式处理方法

Publications (1)

Publication Number Publication Date
CN108538390A true CN108538390A (zh) 2018-09-14

Family

ID=63476232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810399299.0A Pending CN108538390A (zh) 2018-04-28 2018-04-28 一种面向医学数据的增量式处理方法

Country Status (1)

Country Link
CN (1) CN108538390A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111477336A (zh) * 2020-04-07 2020-07-31 中南大学 传染病诊断数据的融合方法、系统及存储介质
TWI743837B (zh) * 2020-06-16 2021-10-21 緯創資通股份有限公司 訓練資料增量方法、電子裝置與電腦可讀取記錄媒體

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103493054A (zh) * 2010-10-12 2014-01-01 美国西门子医疗解决公司 用于预测心血管病发展的医疗信息技术系统
CN104866727A (zh) * 2015-06-02 2015-08-26 陈宽 基于深度学习对医疗数据进行分析的方法及其智能分析仪
CN106295124A (zh) * 2016-07-27 2017-01-04 广州麦仑信息科技有限公司 利用多种图像检测技术综合分析基因子图相似概率量的方法
CN106682435A (zh) * 2016-12-31 2017-05-17 西安百利信息科技有限公司 一种多模型融合自动检测医学图像中病变的系统及方法
CN107133942A (zh) * 2017-04-24 2017-09-05 南京天数信息科技有限公司 一种基于深度学习的医疗图像处理方法
CN107910061A (zh) * 2017-12-01 2018-04-13 中南大学 一种医疗数据处理方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103493054A (zh) * 2010-10-12 2014-01-01 美国西门子医疗解决公司 用于预测心血管病发展的医疗信息技术系统
CN104866727A (zh) * 2015-06-02 2015-08-26 陈宽 基于深度学习对医疗数据进行分析的方法及其智能分析仪
CN106295124A (zh) * 2016-07-27 2017-01-04 广州麦仑信息科技有限公司 利用多种图像检测技术综合分析基因子图相似概率量的方法
CN106682435A (zh) * 2016-12-31 2017-05-17 西安百利信息科技有限公司 一种多模型融合自动检测医学图像中病变的系统及方法
CN107133942A (zh) * 2017-04-24 2017-09-05 南京天数信息科技有限公司 一种基于深度学习的医疗图像处理方法
CN107910061A (zh) * 2017-12-01 2018-04-13 中南大学 一种医疗数据处理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KEHUA GUO等: "transparent learning:an incremental machine learning framework based on transparent computing", 《IEEE NETWORK》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111477336A (zh) * 2020-04-07 2020-07-31 中南大学 传染病诊断数据的融合方法、系统及存储介质
TWI743837B (zh) * 2020-06-16 2021-10-21 緯創資通股份有限公司 訓練資料增量方法、電子裝置與電腦可讀取記錄媒體
CN113807378A (zh) * 2020-06-16 2021-12-17 纬创资通股份有限公司 训练数据增量方法、电子装置与计算机可读记录介质
US11348349B2 (en) 2020-06-16 2022-05-31 Wistron Corporation Training data increment method, electronic apparatus and computer-readable medium
CN113807378B (zh) * 2020-06-16 2024-05-31 纬创资通股份有限公司 训练数据增量方法、电子装置与计算机可读记录介质

Similar Documents

Publication Publication Date Title
Ambekar et al. Disease risk prediction by using convolutional neural network
WO2020151536A1 (zh) 一种脑部图像分割方法、装置、网络设备和存储介质
CN107066814A (zh) 一种基于望闻问切协同的中医智能辅助诊断系统
CN113921141B (zh) 一种个体慢病演进风险可视化评估方法及系统
Bozkurt et al. Using automatically extracted information from mammography reports for decision-support
CN109920547A (zh) 一种基于电子病历数据挖掘的糖尿病预测模型构建方法
CN108461151A (zh) 一种知识图谱的逻辑增强方法及装置
WO2003040964A2 (en) Patient data mining for diagnosis and projections of patient states
Chen et al. MSLPNet: multi-scale location perception network for dental panoramic X-ray image segmentation
CN101647696A (zh) 健康诊疗智能系统
JP2024043567A (ja) 特徴分離に基づく病理画像特徴抽出器の訓練方法、訓練装置、電子機器、記憶媒体及び病理画像分類システム
Kirubakaran et al. Echo state learned compositional pattern neural networks for the early diagnosis of cancer on the internet of medical things platform
CN108538390A (zh) 一种面向医学数据的增量式处理方法
Hysenllari et al. Validation of human activity recognition using a convolutional neural network on accelerometer and gyroscope data
Chou et al. Extracting drug utilization knowledge using self-organizing map and rough set theory
Jaiswal et al. An intelligent deep network for dental medical image processing system
Yadav et al. Machine learning in expert systems for disease diagnostics in human healthcare
Lakho et al. Decision support system for hepatitis disease diagnosis using bayesian network
CN112309519A (zh) 基于多模型的电子病历用药结构化处理系统
CN115607113B (zh) 基于深度学习模型的冠心病患者手诊数据处理方法及其系统
CN115019924A (zh) 应用人工智能健康机器人的健康数据采集和分析方法
Nour Artificial intelligence (AI) for improving performance at the cutting edge of medical imaging
Shaikh et al. Automated classification of pneumonia from chest x-ray images using deep transfer learning efficientnet-b0 model
CN115330748A (zh) 脑图像处理方法、计算机设备和存储介质
CN112967246A (zh) 用于临床决策支持系统的x射线影像辅助装置及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180914