CN108538390A

CN108538390A - 一种面向医学数据的增量式处理方法

Info

Publication number: CN108538390A
Application number: CN201810399299.0A
Authority: CN
Inventors: 许涛; 郭克华
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2018-04-28
Filing date: 2018-04-28
Publication date: 2018-09-14

Abstract

本发明公开了一种面向医学数据的增量式处理方法，针对当前医疗数据无法被充分的利用的问题。因进行数据共享涉及用户隐私问题还有各医院平台的差异、数据格式的差异等原因难以实现。所以在医院内部使用自己少量的数据，依托人工智能，训练出一个能用于辅助诊断的系统，辅助医生对于一些疑难病症的诊断，提高诊断的准确率，使得医生能更好的治疗病人。本发明能不断从新数据中进行增量式学习，不断提高系统的准确度，而且每次的增量式学习不需要消耗大量的时间重新计算。

Description

一种面向医学数据的增量式处理方法

技术领域

本发明涉及一种面向医学数据的增量式处理方法。

背景技术

深度学习是一种用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。至今已有数种深度学习框架，如深度神经网络、卷积神经网络等，这些框架被应用于多个领域并取得了极好的效果。深度学习也能帮助医生用于疾病的诊断方面，目前医疗领域融入了越来越多的人工智慧、传感技术等，使医疗服务逐渐走向智能化。

现代医学是建立在实验基础上的循证医学，医生的诊疗结论必须建立在相应的诊断数据上，影像是重要的诊断依据，医疗行业80％～90％的数据都来源于医学影像。所以临床医生有极强的影像需求，他们需要对医学影像进行各种各样的定量分析、历史图像的比较，从而能够完成一次诊断。人工智能+医学影像便是通过深度学习，完成对影像的分类、目标检测、图像分割和检索工作，协助医生完成诊断、治疗工作的一种辅助工具。

目前，国内公共医疗管理系统不完善，因为医疗数据涉及公民个人隐私，这样的数据一旦开放共享，必然伴随着个人身份和隐私信息泄漏的风险。因此每个医院必须要保证自己的数据的安全，会谨慎选择共享自己的医疗数据。再者，部分医院没有实现对数据的有效分析和利用，导致了资源的浪费。而且每个医院都有自己独立的管理系统，而这些独立的、结构不同的系统使得系统之间的信息共享难以进行。这种种原因导致了数据孤岛的问题，这更导致大量的资源不能被充分的发挥应有的作用。

目前，很多研究机构都在使用深度学习进行疾病方面的诊断。例如：微软亚洲研究院智慧医疗项目是以人工智能与大数据为基础，基于计算机视觉与机器学习技术实现医学影像识别。

已有的方法要想达到一个较高的准确度需要大量的数据支撑，目前由于孤岛问题，大部分医院的数据还是有限的。而且医院的数据每天都在发生变化，每天都有新的数据加入，这些方法没有达到充分利用新增加的数据。

发明内容

本发明所要解决的技术问题是，针对现有技术不足，提供一种面向医学数据的增量式处理方法。

为解决上述技术问题，本发明所采用的技术方案是：一种面向医学数据的增量式处理方法，包括以下步骤：

1)采集医疗影像数据，对所述医疗影像数据进行迁移学习，将迁移学习得到的模型存入模型库内；

2)对新增的医疗影像数据进行迁移学习，将迁移学习得到的模型加入到所述模型库内；

3)采集需要诊断的影像，调用所述模型库中的相关模型；

4)获取到所述模型库内不同的模型给出的关于某张需要诊断的影像图片有症状和无症状的概率值，将不同模型给出的有症状的概率值相乘，再将不同模型给出的无症状的概率值相乘，最后将两个相乘的结果相加，得到一个系数；

5)计算有症状的概率，将模型库内所有模型给出的有症状的概率相乘，再乘以步骤4)中系数的倒数；计算无症状的概率，将模型库内模型给出的无症状的概率相乘，再乘以步骤4)中系数的倒数；

6)返回最终结果。

步骤1)中，采用Google的深度学习框架tensorflow和InceptionV3模型对所述医疗影像数据进行迁移学习。

步骤2)中，采用Google的深度学习框架tensorflow和InceptionV3模型对新增的医疗影像数据进行迁移学习。

与现有技术相比，本发明所具有的有益效果为：本发明能不断从新数据中进行增量式学习，不断提高系统的准确度，而且每次的增量式学习不需要消耗大量的时间重新计算。

附图说明

图1为本发明方法流程图。

具体实施方式

本发明针对当前医疗数据无法被充分的利用的问题。因进行数据共享涉及用户隐私问题还有各医院平台的差异、数据格式的差异等原因难以实现。所以在医院内部使用自己少量的数据，依托人工智能，训练出一个能用于辅助诊断的系统，辅助医生对于一些疑难病症的诊断，提高诊断的准确率，使得医生能更好的治疗病人。

本技术方案可以实现在数据量较小的时候对数据充分利用，实现相应的医疗辅助诊断的功能。而且可以随着医院数据量的增加，增量式的学习新数据中的信息，不需要使用全部数据重新训练，只需用新增的数据训练。随着数据量的增加，准确率也将不断提升。在辅助诊断过程中，将不同的模型的结果用整合规则综合起来，得到最终的结果。该方案不需要一次需要大量的数据，而是在使用的过程中不断的获取新的数据加入。具体流程见图1。

模型训练过程为：

步骤1、数据的采集，医院医生再平常诊断中，就是一个数据收集的过程，医生为每个病人诊断，每个病人的医疗影像便是影像数据，医生诊断结果就是对应的便签。

步骤2、数据的整理，将上述采集到的数据，结合医生的诊断意见，分为有症状和无症状，分别放入到对应的不同的文件夹中存储。

步骤3、将收集到的数据输入到模型中进行训练，训练采用Google的深度学习框架tensorflow和InceptionV3模型进行迁移学习。迁移学习能保留原来Inception模型的优点，又能学习到我们提供的数据中信息。将训练得到的模型放到模型库中存储，方便以后的调用。

增量式学习过程：

步骤1、将新增的数据按照模型训练过程中的步骤2的格式整理，放入不同的文件夹中。

步骤2、仅使用新增的数据进行模型的训练，将训练得到的模型加入到现有的模型库中，以便日后使用。

DST整合准则计算过程：

步骤1、获取到不同的模型给出的关于某张图片有症状和无症状的概率值，将不同模型给出的有症状的概率相乘，再将不同模型给出的无症状的概率相乘，最后将这两结果相加，得到一个系数。

步骤2、计算有症状的概率，将所有模型给出的有症状的概率相乘，再乘上步骤1计算得到的系数的倒数。

步骤3、计算无症状的概率，同样地，将所有模型给出的无症状的概率相乘，再乘上步骤1中的系数的倒数。

辅助诊断过程：

步骤1、医生采集到需要诊断的影像，上传到系统中。

步骤2、系统调用模型库中的相关的模型，即通过模型训练和增量式学习得到的模型，并分别加载模型对影像进行计算，将不同模型得出的结果分别保存下来。

步骤3、采用DST准则将不同的模型结果进行综合，并将结果返回给医生，返回具体信息包括：最终结果，具体概率为多少。医生再结合自身经验给出最终的诊断。

Claims

1.一种面向医学数据的增量式处理方法，其特征在于，包括以下步骤：

3)采集需要诊断的影像，调用所述模型库中的相关模型；

6)返回最终结果。

2.根据权利要求1所述的面向医学数据的增量式处理方法，其特征在于，步骤1)中，采用Google的深度学习框架tensorflow和InceptionV3模型对所述医疗影像数据进行迁移学习。

3.根据权利要求1所述的面向医学数据的增量式处理方法，其特征在于，步骤2)中，采用Google的深度学习框架tensorflow和InceptionV3模型对新增的医疗影像数据进行迁移学习。