CN113421652A

CN113421652A - 对医疗数据进行分析的方法、训练模型的方法及分析仪

Info

Publication number: CN113421652A
Application number: CN202110688013.2A
Authority: CN
Inventors: 陈宽
Original assignee: Infervision Medical Technology Co Ltd
Current assignee: Infervision Medical Technology Co Ltd
Priority date: 2015-06-02
Filing date: 2015-06-02
Publication date: 2021-09-21
Anticipated expiration: 2035-06-02
Also published as: JP2018529134A; EP3306500A4; US20220059229A1; IL255856B; CN104866727A; IL255856A; EP3306500A1; US20180137941A1; WO2016192612A1; US11200982B2; JP6522161B2

Abstract

一种对医疗数据进行分析的方法、训练模型的方法及分析仪，其核心内容是应用深度学习中的深度卷积神经元算法在计算机内建立模型。该模型利用海量医疗数据选择及优化模型参数，通过“训练”模型自动学习医生或医学研究人员的病理分析过程，继而帮助其处理大量的医疗或医学数据，最终辅助医生做出针对大量医疗数据的正确判断和有效决策。本发明可大大降低医生或医学研究人员的工作压力，提高其工作效率，本发明可使医生或医学研究人员从繁重的对医疗或医学数据的分析工作中解脱出来，从而将更多的精力用于其它更重要的工作中。

Description

对医疗数据进行分析的方法、训练模型的方法及分析仪

本申请是申请日为2015年6月2日、申请号为201510294286.3、发明名称为“基于深度学习对医疗数据进行分析的方法及其智能分析仪”的分案申请。

技术领域

本发明涉及对医疗或医学数据进行分析的智能设备，特别涉及将大型医院或医学研究机构获取的大量医疗或医学数据自动汇总并给出与之匹配的分析结论的智能分析仪。

背景技术

通常，大医院或医学研究机构的医生或研究人员每天需要完成大量的工作。例如医院临床科室的医生，每天需要对采集而来的医疗数据进行研究、分析和决策，以下为在北京一家大型三甲医院随意抽取一天所产生的医疗数据：

CT 1162份、X射线1461份、核磁共振325份，其中，X射线平均一份含2张二维图片，CT平均一份含50张二维图片，核磁共振平均一份含100张二维图片。这些检查数据全部都要放射科医生撰写报告，而该大型三甲医院也只有20多个放射科医生，其中还包括打字缓慢的老医生和经验不足的年轻医生。因此，每天持续处理大量的工作极易导致相关联的医生或研究人员工作压力大、体能下降快、工作效率低甚至分析结论错误率高等问题。

公开内容

本发明要解决的技术问题是提供一种能有效减轻医院医生或医学研究人员工作压力且可对大量的医疗或医学数据进行科学分析并获得与之匹配的分析结果的基于深度学习对医疗数据进行分析的方法及其智能分析仪。

第一方面，本发明提供一种训练模型的方法，该方法包括：采集同类型的医疗素材数据及与医疗素材数据匹配的医疗诊断数据，并将医疗素材数据和医疗诊断数据作为医疗训练数据通过输入装置存储于计算机中；将医疗训练数据中不小于二维的影像数据和文本数据中随时间和空间的变化值与对应的数据相关联；在采集的医疗训练数据中，将与每一个个体对应的医疗训练数据和变化值汇总为一条单元数据；将医疗训练数据整合或格式化为计算机能够理解的结构化数据矩阵并从每个单元数据中提取数据特征，其中，数据特征包括医疗训练数据在时间上的变化值和在空间上的变化值；将已形成结构化数据矩阵的医疗训练数据导入设置于计算机内对应深度学习模型的存储模块中；通过计算机对深度学习模型进行优化运算，其中，深度学习模型的输入层包括多个具有所述数据特征的节点，深度学习模型的输出层包括多个具有医疗诊断数据特征的节点。

结合第一方面，在一些实施例中，医疗训练数据包括模拟形成的模拟数据，模拟数据为基于原有医疗数据通过变形、扭曲和噪音叠加而构建出的新数据。

结合第一方面，在一些实施例中，在医技阶段，医疗素材数据包括：原始图像数据，空间上的变化值包括一个图像从其中的一个像素到下一个像素之间的关系，深度学习模型包括多个卷积方块，每个卷积方块为一个三维的矩阵，卷积方块的x与y轴涵盖一个图像在空间变化的方程，卷积方块的z轴涵盖图像在空间变化的方程。

结合第一方面，在一些实施例中，通过计算机对深度学习模型进行优化运算，包括：设定深度学习基本框架，将医疗训练数据按照数据特征建立包括输入层、至少一层隐层和输出层的数据模型，每个隐层包含若干个与上一层输出值具有映射对应关系的节点；每个节点采用数学方程建立节点的数据模型，采用人工或随机方法预设数学方程中的相关参数值，输入层中各节点的输入值为所述的数据特征，各隐层及输出层中各节点的输入值为上层的输出值，每层中各节点的输出值为本节点经数学方程运算后所得的值；初始化参数值，将输出层中各节点的输出值与对应节点的医疗诊断数据特征比对，反复修正各节点的参数值，依次循环，最终获得使输出层中各节点的输出值生成与医疗诊断数据特征相似度为局部最大时的输出值对应的各节点中的参数值。

结合第一方面，在一些实施例中，通过计算机对深度学习模型进行优化运算，包括：通过计算机利用有监督学习方法对深度学习模型进行优化运算，其中，方法还包括：利用无监督学习方法对深度学习模型进行训练，得到的参数作为有监督学习方法的初步参数起始值，其中，无监督学习方法包括降噪自动编码生成器和/或限制伯尔曼机。

结合第一方面，在一些实施例中，该方法还包括：将医学待分析数据和与之匹配的分析结果涉及的结构化数据反馈到所述深度学习模型中形成新的训练数据。

结合第一方面，在一些实施例中，医疗素材数据包括临床和医技阶段医生对患者诊断、检查和治疗过程进行的相关信息记录，诊断数据包括临床和医技阶段医生对患者初诊判断、出院结果、疾病治疗效果进行的相关信息记录以及医生撰写的文本出诊数据和跟踪随访数据。

第二方面，本发明提供一种基于深度学习对医疗数据进行分析的方法，该方法包括：将获取的已形成结构化矩阵数据的医学待分析数据导入深度学习模型中进行与之匹配的医学病理分析，其中，深度学习模型是通过第一方面所提及的方法训练得到的；由深度学习模型通过输出装置输出与医学待分析数据相匹配的医学病理分析结果。

第三方面，本发明提供一种分析仪，该分析仪包括：处理器；用于存储处理器可执行指令的存储器；处理器用于执行上述第一方面和/或第二方面所提及的方法。

第四方面，本发明提供一种分析仪，该分析仪包括：输入装置，用于将医疗训练数据和医学待分析数据导入计算机中，其中，医疗训练数据包括医疗素材数据及与医疗素材数据匹配的医疗诊断数据；存储模块，用于分别或集中保存医疗训练数据和医学待分析数据；深度学习模型模块，用于调用存储模块中的医疗训练数据执行训练模型的方法以进行自学习，其中，训练模型的方法包括：采集同类型的医疗素材数据及与医疗素材数据匹配的医疗诊断数据，并将医疗素材数据和医疗诊断数据作为医疗训练数据通过输入装置存储于计算机中；将医疗训练数据中不小于二维的影像数据和文本数据中随时间和空间的变化值与对应的数据相关联；在采集的医疗训练数据中，将与每一个个体对应的医疗训练数据和变化值汇总为一条单元数据；将医疗训练数据整合或格式化为计算机能够理解的结构化数据矩阵并从每个单元数据中提取数据特征，其中，数据特征包括医疗训练数据在时间上的变化值和在空间上的变化值；将已形成结构化数据矩阵的医疗训练数据导入设置于计算机内对应深度学习模型的存储模块中；通过计算机对深度学习模型进行优化运算，其中，深度学习模型的输入层包括多个具有所述数据特征的节点，深度学习模型的输出层包括多个具有医疗诊断数据特征的节点；输出装置，用于将与医学待分析数据匹配的医学病理分析结果导出。

结合第四方面，在一些实施例中，深度学习模型模块还用于将医学待分析数据和与之匹配的分析结果涉及的结构化数据反馈到深度学习模型中形成新的训练数据对深度学习模型进一步优化。

结合第四方面，在一些实施例中，输入装置包括设置在医院、医学机构的计算机装置、与该计算机联网的各种医疗检查装置和病理分析装置；输出装置包括设置在医院、医学机构中并与输入装置联网的固定式计算机输出终端或移动式智能终端。

为了解决上述技术问题，本发明采用的技术方案为：

本发明的基于深度学习对医疗数据进行分析的方法，其包括如下步骤：

1)采集海量已备案的同类型的医疗素材数据及与该医疗素材数据匹配的医疗诊断数据作为医疗训练数据通过输入装置存储于计算机中；

2)将所述医疗训练数据中不小于二维的影像数据与文本数据中随时间和空间的变化值与对应的数据相关联；

3)在采集的海量医疗训练数据中，将与每一个个体对应的医疗训练数据和所述变化值汇总为一条单元数据；

4)将所述医疗训练数据采用分割、关联或文本数据挖掘方法整合或格式化为计算机可以理解的结构化数据矩阵并从每个单元数据中提取数据特征；

5)将已形成结构化数据矩阵的医疗训练数据导入设置于计算机内对应深度学习模型的存储模块中；

6)通过计算机对所述深度学习模型进行优化运算，优化方法如下：

a.设定深度学习基本框架，将所述医疗训练数据按照数据特征建立包括输入层、至少一层隐层和输出层的数据模型，输入层包含若干个具有数据特征的节点，输出层包含若干个具有医疗诊断数据特征的节点，每个隐层包含若干个与上一层输出值具有映射对应关系的节点；

b.每个节点采用数学方程建立该节点的数据模型，采用人工或随机方法预设所述数学方程中的相关参数值，输入层中各节点的输入值为所述的数据特征，各隐层及输出层中各节点的输入值为上层的输出值，每层中各节点的输出值为本节点经所述数学方程运算后所得的值；

c.初始化所述参数值A_i，将所述输出层中各节点的输出值与对应节点的医疗诊断数据特征比对，反复修正各节点的所述参数值A_i，依次循环，最终获得使所述输出层中各节点的输出值生成与所述医疗诊断数据特征相似度为局部最大时的输出值对应的各节点中的参数值A_i；

7)将获取的已形成结构化矩阵数据的医学待分析数据导入该深度学习模型中进行与之匹配的医学病理分析；

8)由该深度学习模型通过输出装置输出与所述医学待分析数据相匹配的医学病理分析结果。

对所述参数值A_i进行优化的方法为无监督学习方法。

所述无监督学习方法采用降噪自动编码生成器或限制伯尔曼机进行自学习。

对所述参数值A_i进行优化的方法为有监督学习方法。

所述数学方程为参数数学方程或非参数数学方程，其中，参数数学方程可为线性模型、神经元模型或卷积运算，非参数数学方程可为极值运算方程，数学模型设定方式如下：

y＝g(x)＝f_nΟf_n-1Οf_n-2Ο…Οf₁(x)

其中y是所述输出层中的医疗诊断数据特征，维度为M_n，X是训练素材数据，维度为M₀，f₁到f_n为设定的每一层运算方程，而每一层方程f_i的维度为M_i－1→M_i，如第一层f₁就是将维度为M₀的X转换成维度为M₁的输出Z₁，而Z₁则成为第二层方程f₂的输入，以此类推，其中，每一层模型f_i有与之相匹配的参数组A_i。

所述医疗素材数据包括临床和医技阶段医生对患者诊断、检查和治疗过程进行的相关信息记录；所述诊断数据包括临床和医技阶段医生对患者初诊判断、出院结果、疾病治疗效果进行的相关信息记录以及医生撰写的文本出诊数据和跟踪随访数据。

所述数据特征包括医疗训练数据在时空上的变化值、数据本身的各种数理统计值。比如说随着时间的改变，数据上升或下降的趋势。

将所述医学待分析数据和与之匹配的分析结果涉及的结构化数据反馈到所述深度学习模型中形成新的训练数据。

本发明的基于深度学习对医疗数据进行分析的智能分析仪，其包括可将医疗训练数据和医学待分析数据导入计算机中的输入装置、分别或集中保存所述医疗训练数据和医学待分析数据的存储模块、调用存储模块中的医疗训练数据进行自学习的深度学习模型模块、将与所述医学待分析数据匹配的医学病理分析结果导出的输出装置和包括CPU和/或GPU的处理器，其中，

所述医疗训练数据包括医疗素材数据和与之匹配的医疗诊断数据；

所述医疗训练数据和医学待分析数据为计算机可以理解的结构化数据矩阵；

所述自学习采用包括线性模型、神经元模型、卷积运算和/或寻求最大值运算的参数数学方程；

所述输入装置包括设置在医院、医学机构的计算机装置、与该计算机联网的各种医疗检查装置和病理分析装置；

所述输出装置包括设置在医院、医学机构中并与所述输入装置联网的固定式计算机输出终端和移动式智能终端。

本发明的智能分析仪还设有可与互联网、以太网连接的包括光纤连接、WIFI连接或GPRS模块连接的网络连接模块。

本发明的方法及其智能分析仪的核心内容是应用深度学习中的深度卷积神经元算法(英文全称：Deep Convolution Neural Network，简称DCNN)在计算机内建立模型。该模型利用海量医疗数据选择及优化模型参数，通过“训练”模型自动学习医生或医学研究人员的病理分析过程，继而帮助其处理大量的医疗或医学数据，最终辅助医生做出针对大量医疗数据的正确判断和有效决策。本发明可大大降低医生或医学研究人员的工作压力，提高其工作效率，本发明可使医生或医学研究人员从繁重的对医疗或医学数据的分析工作中解脱出来，从而将更多的精力用于其它更重要的工作中。

附图说明

图1为本发明智能分析仪工作方框图。

图2为脑部核磁共振所生成的图像数据。

图3为删除图像数据中目标体之外后的图像数据。

图4为以图形数据为基础的DNN基本数学构造示意图。

图5为卷积方块运算示意图。

图6为互联多层感知器逻辑运算示意图。

图7为自动编码生成器的工作流程示意图。

具体实施方式

如图1所示，本发明的基于深度学习对医疗数据进行分析的方法是利用海量医疗数据选择及优化模型参数，通过“训练”模型自动学习医生或医学研究人员的病理分析过程，继而帮助其处理大量的医疗或医学数据，最终辅助医生做出针对大量医疗数据的正确判断和有效决策。

通常，医疗数据智能分析系统是医疗科技非常重要的领域。比如医疗影像数据方面，较多人研究的领域是肺部CT结节的分析，主要分成两大技术模块：图像分割(segmentation)与智能分析(detection)。图像分割的主要目的在于将肺部的关键部位如气管、肺叶、血管等关键部位进行智能分割，并通过3D图像的方式进行建模展示，以帮助临床医生和影像科医生更好地分析肺部结构和做术前准备。图像分割目前已经有非常成熟的技术与算法。不过主要都是使用在非常传统的如cascade模型算法，并不能充分发挥智能分析仪的用途。其次针对图形分割的分析系统只是针对医疗数据处理当中很小的部分，对于医生的价值也有限。

Deep Learning深度学习是目前人工智能领域公认的革命性技术，在图像识别、语音识别等领域都颠覆了传统的应用方法，并成功带来了很多突破性的技术应用：谷歌图片内容分析，谷歌无人驾驶车、Google Book、Google Brain等。

但如今，在医疗数据分析领域，绝大部分的方法都还是使用非常传统的SupportVector Machine等分类方法，并不能代表目前人工智能领域最先进的技术。比如同类功能专利CN201110376737.X当中所使用的就是Gradient Boosting方法，是机器学习领域过去1995到2005年间最为广泛应用的方法，其现已不能代表人工智能领域最先进的方法。

2D和3D影像识别算法当中目前最先进的公认为Deep Neural Network(DNN)深度神经网络算法(详见论文Bengio-2009，引用：Yoshua Bengio，“Learning DeepArchitectures for AI”，Foundations and

in Machine Learning 2(1),1-127)，在某些拥有海量训练数据的领域如手写数字识别、红绿灯识别甚至可以达到和超过人为识别的准确率。

本发明将最先进的深度学习算法应用到医疗数据分析当中，配合海量数据进行建模，构建医疗数据分析系统。其可大大降低医生工作压力，增加医生工作效率。

其主要包括模型训练模块(pre-training)和模型改进模块(fine-tuning)。

模型训练模块主要使用医疗训练数据寻找最能够代表医疗分析过程的数学表达方式。模型应用模块是智能分析仪系统中的主要应用模块，其将医学待分析数据输入到模型训练模块中并由该模块自动输出与所述医学待分析数据相匹配的医学病理分析结果。

以下对本发明进行详细说明。

本发明的方法包括如下步骤：

一、采集海量已备案的同类型的医疗素材数据及与该医疗素材数据匹配的医疗诊断数据作为医疗训练数据通过输入装置存储于计算机中。

医疗训练的目的是让计算机能够从医疗素材数据中自动推算出相对应的医疗诊断分析数据。

例如在临床方面(外科、内科等)：

所述医疗素材数据包括：医生撰写输入的患者信息，如现病史、既往病史、体格检查、实验室及器械检查、入院后的治疗过程等记录。

所述医疗诊断数据(又称目标数据)包括：医生对患者的入院初诊及出院结果、疾病治疗效果等记录。

临床举例：

接诊患者，输入患者的相关信息，如年龄、性别、体重、现病史、既往病史、体格检查信息等，整合分析数据，提供该患者疾病种类分析、接诊建议及拟治疗方案。例如输入一名患者的相关信息，65岁男性患者，咳嗽、胸闷、近期消瘦、长期吸烟史、既往未做过检查等。

医技方面(病理科、检验科、放射科、核医学科等)

所述医疗素材数据包括：原始图像数据、病理种类、疾病相关检验数据、病灶具体位置、有无转移或多发等。

所述医疗诊断数据：医生撰写的文本出诊数据，跟踪随访数据。

医技举例：

放射科：通过对不同身体部位、不同影像检查手段的原始图像数据的分析训练，使智能分析仪对于病变具有识别、分析功能，并给出下一步诊疗建议。如肺部单发结节的CT智能诊断，智能分析仪可在极短时间内检索所有原始图像，判断病变所在位置、大小、内部密度、边缘形态、图像内其它部位是否正常等数据。

二、将所述医疗训练数据中不小于二维的影像数据与文本数据中随时间和空间的变化值与对应的数据相关联。或者说，将同一案例的医疗素材数据和医疗诊断数据互相关联。

三、在采集的海量医疗训练数据中，将与每一个个体对应的医疗训练数据和所述变化值汇总为一条单元数据。

即将与某个人或某系列病例相关联的医疗训练数据和所述变化值汇总为一条单元数据。

四、将所述医疗训练数据采用图像分割、关联或文本分析方法整合或格式化为计算机可以理解的结构化数据矩阵并从每个单元数据中提取数据特征。

所述数据特征包括医疗训练数据在时空上的变化值、数据本身的各种数理统计值。

数据特征包括医疗训练数据随时间的改变，如数据上升或下降的趋势；空间的变化，如一个图像数据从其中的一个像素到下一个像素之间的关系。数据特征还包括数据本身的各种数理统计值，如个体数据与其他个体数据对比值。这些数据特征将会以矢量、矩阵或数列的形式格式化为计算机理解的结构。数据特征的采集也包括图像处理或初期数据统计处理。在图像处理当中，分割出与医疗诊治数据有关的图像内容是寻找图像数据特征的第一步。在文档文件处理当中，TF-IDF(term frequency–inverse document frequency)，即一种量化资料检索和文本挖掘的方式，也可被应用。以上初期图像文本处理会大大方便计算机对数据特征的采集。

五、将已形成结构化数据矩阵的医疗训练数据导入设置于计算机内对应深度学习模型的存储模块中；

六、通过计算机对所述深度学习模型进行优化运算，优化方法如下：

1、设定深度学习基本框架，将所述医疗训练数据按照数据特征建立包括输入层、至少一层隐层和输出层的数据模型，输入层包含若干个具有数据特征的节点，输出层包含若干个具有医疗诊断数据特征的节点，每个隐层包含若干个与上一层输出值具有映射对应关系的节点；

2、每个节点采用数学方程建立该节点的数据模型，采用人工或随机方法预设所述数学方程中的相关参数值，输入层中各节点的输入值为所述的数据特征，各隐层及输出层中各节点的输入值为上层的输出值，每层中各节点的输出值为本节点经所述数学方程运算后所得的值；

3、初始化所述参数值A_i，将所述输出层中各节点的输出值与对应节点的医疗诊断数据特征比对，反复修正各节点的所述参数值A_i，依次循环，最终获得使所述输出层中各节点的输出值生成与所述医疗诊断数据特征相似度为局部最大时的输出值对应的各节点中的参数值A_i；

对所述参数值A_i进行优化的方法为无监督学习方法和有监督学习方法。

y＝g(x)＝f_nΟf_n-1Οf_n-2Ο…Οf₁(x)

其中y是所述输出层中的医疗诊断数据特征，维度为M_n，X是训练素材数据，维度为M₀，f₁到f_n为设定的每一层运算方程，而每一层方程f_i的维度为M_i－1→M_i,如第一层f₁就是将维度为M₀的X转换成维度为M₁的输出Z₁，而Z₁则成为第二层方程f₂的输入，以此类推，其中，每一层模型f_i有与之相匹配的参数组A_i。

如逻辑方程的表现形式如下：

又如线性方程的表现形式如下：

其中，x_m是方程的输入值，y则是方程的输出值，a_m则是方程的基础参数。

初始化深度学习模型参数A₁至A_n，可随意设定模型参数，模型深度等，亦可以某种方式选择初始化参数模型。

运算方法解释如下

运算的核心为有监督学习算法深度学习，其是过去五到十年人工智能和机器学习领域革命性的技术。本发明的在DNN算法的基础上独创性地加入病变扫描时的空间时序变化，充分考虑到病变体在三维空间当中的成像规律，提高识别概率；同时模型可引入医生人为判断因素，融合纯智能判断因素与医生的专业判断进行综合建模计算病变概率。

本发明隶属于人工智能技术，数据运算的最终目的是要“训练”模型能够自动在医疗影像当中识别病变，给出概率并进行标示，辅助医生的诊疗工作。因此在模型构建的过程当中，海量数据相当于教学素材，而模型框架则是算法将具体信息进行抽象化总结的具体流程，因此在智能运算的过程当中，海量数据和智能算法必不可少。

下文将分别介绍：

1.医疗训练数据

a)客观存在的自然数据：即医院在实际业务当中所形成的自然诊疗数据，训练数据与实际运用场景所产生的医疗诊断数据越接近则训练效果越好。而数据作为教材也有相应要求。两种数据源(即医疗素材数据和医疗诊断数据)对于本专利的实现都是必不可少的：首先需原始医疗数据，比如一般从医疗器械成像之后的数据格式有很多，如.nii.gz，.dcm等格式，所有格式在进入训练模型之前都可被表示为多维矩阵数据信息。比如MRI(英文全称：Magnetic Resonance Imaging，中文名为核磁共振成像)图形可为三维矩阵(灰阶)，即二维灰阶指数与一维横切面；或者四维矩阵(rgb)，即二维颜色指数外加三种颜色指数，最后加一维横切面。任何医疗数据均可以被抽象地简化成为此类矩阵。而此类矩阵构成模型读取的原始数据源。如图2、3所示，显示的是脑部MRI所生成的图像数据，假设系统将一张MRI切片生成为像素512×512的图，而一次脑部扫描为200张切面，则一次灰阶脑部扫描的数据源可被总结为512×512×200＝52,428,800维度的数据行。对于模型来说，52,428,800个数字当中涵盖了所有该脑部扫描的所有被理解和概括的信息。

对于无监督学习部分来说，此类医疗原始矩阵即建模的基础数据。对于有监督学习部分来说，还需要与图形相匹配的分析目标。最简单的二元分析信息如：测量病变体(稍复杂一些的信息可以是病变的概率)。之后可融入更为复杂的医学信息如：病变种类、治疗效果、病变的具体位置等信息。对于更为复杂的病变发展预测系统，可匹配病人过往体检的纵向时间序列数据，让算法学会预测医学现象的发展规律。

b)模拟形成的模拟数据：此类数据通过电脑自行加工或模拟而成，以模拟数据作为建模的训练数据。

此类模型最典型的例子即微软的Xbox Kinect系统，开发阶段手部姿势识别模型的基础数据全部有3D建模完成。

在本发明当中，模拟数据可被理解为基于原有医疗数据通过变形、扭曲和噪音叠加而构建出的新数据。使用模拟数据的原因有两层：第一，加入变形后数据有利于教会算法更加稳定地识别医疗数据当中的核心变化规律；第二，一般的DNN模型需要求导几百万以上的参数，在数据量有限的情况下，很容易导致过拟合现象，即模型过度学习已有历史数据，而无法很好地对于核心变化规律进行归纳和抽象总结，加入模拟的变形数据相当于在训练过程当中加入了噪音，逼迫算法能够更好地区分噪音和有效信息，有助于解决过拟合问题。

2.机器学习算法模型

机器学习算法模型为本发明用以归纳和对信息进行抽象总结的基本数学框架，主要目的是将模式识别的过程以电脑可以被理解的数学结构表达出来。训练的过程则是估算模型当中的参数，参数估算完毕以后模型将成为本发明方法的核心部分。根据不同目的机器学习算法可以被归为有监督学习和无监督学习两种类别，本发明涵盖两种类别的算法。

a)有监督学习：有监督学习算法强调人为设立模型所寻找的目标规律。正如前篇所描述，除去原始图形矩阵数据以外，有监督学习算法还需要相匹配的分析结论数据(如所述的医疗诊断数据)。

本专利主要包括以下有监督学习算法

i.深度神经元算法(Deep Neural Network)

此算法的基本原理模仿人脑辨别过程。DNN算法的输入为原始的医疗数据和医生的历史分析结果，最终能自动完成分析过程。而DNN的抽象概括即为

f(x)＝y

x为原始医疗矩阵数据，y为智能系统分析结果，而DNN即是方程f，x至y的数学映射表达方式。

不同的有监督学习对于f有不同的假设，DNN算法模拟人脑的神经元结构进行建模，以图形数据为基础的DNN基本数学构造如图4所示。

【注：这只是我们上述DNN模型的其中一种做法而已，第一层为卷积层、第二层为最大池层以此循环】DNN的结构从左边的图形原始数据到最右边的分析结果可以被分为多层，每一层完成不同的数学运算。模型总共有多层神经元结构。第一层对于医疗数据完成多个并行内积运算。在第一层中最常用的算法是卷积，卷积算法通过在输入的一系列的值上滑动一个新的方程，从而输出这个新的方程与原系列数据的内积。如在3D医疗图形当中，算法构建多个卷积方块，每个卷积方块是一个三维的矩阵。卷积方块x与y轴涵盖了一个图像在空间变化的方程，而卷积方块的z轴则涵盖了图像在空间变化的方程。每个卷积方块矩阵随着数据维度本身滑动，计算3D图形各个维度的值与卷积方块的内积，内积运算所得数值可被理解为数据维度与卷积方块之间的相似度，而数据当中每一个部分输出的内积值将会成为下一层神经元的输入值。从直观形象的角度来说，并行的卷积矩阵相当于特定形状，而卷积矩阵外内计算相当于在数据当中判断不同区域是否与特定形态相近。

见图5所示，DNN模型第二个常用层是进行池化运算(英文名为Max Pooling，简称MP运算)的层次。MP运算过程将维度信息合成为更大范围的方块，每一个方块内进行Max(寻求最大值)运算。MP运算主要模仿视觉神经网络当中的神经元活跃经济特性。在一定范围内的信息框架内，只保留最活跃的信息单元进入下一层。从图形的角度来说，MP运算使运算结果不再因为数据本身的旋转而改变。从运算的角度来说，MP运算相当于降维处理，结合第一层神经元运算，MP运算去掉了与第一层卷积方块相似度比较低的区域信息，降低每个区域内无效信息的含量。

DNN的结构往往由卷积层和池化层两层结合并不断重复来提取与医疗诊断相关的数据特征。直观说来，比如说在图4中，中间层算法使用了第一层与第二层所构成的非线性元素，以此类推。以此构建更加抽象的框架元素。通过本专利的方法，可以构建无数层神经元。

理论上来说，在模型能够得到大量的数据来进行训练的前提下，卷积层与池化层的组合重复越多越好，虽然人脑的运作机制还未被完全理解，但是已知道人脑属于非常深层次的神经元结构。因此越深层次的神经元模型功率越强。可是越深层次的神经元结构参数越多，也越难训练和估参，很容易出现导数消亡以及过拟合问题。

DNN在多次卷积运算和MP层运算之后，剩下的信息进入最后的完全互联多层感知器(Multi-Layer-Perceptron MLP)当中。该感知器的基本结构即为两层的逻辑回归运算，相当于为不同抽象图形元素对于最终评判结果的贡献进行附值，而MLP运算最终的输出值即为模型的医疗分析结果。如图6所示，感知器一般为一层隐性感知层，每单元的变量与上层所有变量完全互联，每一层进行逻辑运算，以求导下一层数值。

b)无监督学习：神经网络的概念很多年前就已经存在，可是受限于可以使用的数据量、处理器的运算能力，使得导数消亡问题非常严重，无法用来解决实际问题。在完整的模型训练过程当中，模型的输出预测值与实际值之间的误差构成了模型参数优化的基础，而过分深层的神经网络结构无法将参数优化信息反推到底层的网络当中，即表层信息无法一层层传递到深层网络结构当中，给模型训练带来了很大的困难。特别是在医疗数据分析领域当中，医疗数据体量往往非常大，要进行完整优化搜寻不现实，运算难度高的问题比起别的领域更加严重。本发明通过无监督学习对于模型中的参数进行初步优化，使得模型优化的过程当中参数的初始条件变得非常有利，让模型优化过程更快能寻找到局部极小值。

其中效果最好的两种无监督学习方法为降噪自动编码生成器(DenoisingAutoencoders，dAE)以及限制伯尔曼机(Restricted Boltzmann Machine，RBM)

i.降噪自动编码生成器(以下简称dAE)

自动编码生成器的原理为寻找某一数据变量的有效隐性变量。如图7所示，完整地呈现了自动编码生成器的工作原理，根据原始医疗数据输入x，自动编码生成器寻找隐性要素代表y与参数W来映射出新的数据z，而自动编码生成器最终的目的是要找到参数W来最小化z与x之间的差别，换句话说就是要找到在有限信息之内最能够完整代表数据变量信息的参数。而这些参数可被视为涵盖了模型范围内最大量的原始数据信息。而降噪自动编码生成器则在简单编码生成器的工作原理上人为引入大量噪音，直观来说是通过大量噪音来强迫模型寻找更有价值的潜在规律，而不受噪音当中无效规律的影响。最终训练出来的参数将会成为有监督学习的初步参数起始值，相当于为模型第一步寻找一个良好的起点，大大加快受训模型参数优化的速度。

ii.限制伯尔曼机(以下简称RBM)

限制伯尔曼机起到的作用与dAE非常类似，都为无监督学习当中的参数优化步骤做准备。与dAE非常类似，RBM亦是想要寻找最能体现原有数据变量的因素方向，来作为后期有监督学习的起始参数。但是与dAE不同，RBM使用的是能量概率生成式模型，并非如dAE一样使用确定性数学表达式。从运算求解的角度来说叫dAE稍更复杂。但因其概率生成模型的本质对于某些偏重事件概率性的建模场景更加适用。对于我们的建模过程来说，为进一步降低过拟合现象的产生，我们RBM和dAE两种无监督学习都将在我们集成学习过程当中使用。

优化数据的进一步改进是建立损失方程或目标方程，根据损失方程进行有监督学习数据模型参数优化。如损失方程可以设定为训练数据当中深度学习模型输出的分析结果和实际目标变量之间的区别，运算中根据损失方程的变化、通过优化方法来调整模型内参数值。比如在医疗影像心血管横截面积测量这一应用案例当中，损失方程可以被设定为模型生成测量值和实际值之间的区别(如方差区别)，通过梯度降低(gradient descent)的参数优化方法在每一个循环当中移动参数值，在参数优化循环符合特定条件之后停止参数优化的过程(如设定循环与循环之前损失方程的值小于特定阀值、或循环数超过某数则停止优化运算)，保留最佳值。

目标方程的优化过程可以通过如下方式表达:

其中g(X,A)是基本深度学习的分析输出，Y是分析目标的实际值，L[Y；g(X；A)]主要用以计算深度学习的分析输出和实际值之间的差别所造成的成本。

较常见的L[Y,g(X,A)]＝∑_i|y_i-g_i(x_i,A)|或者

L[Y,g(X,A)]＝∑_i[y_i-g_i(x_i,A)]²

R(A)主要为正则化表达式,主要功能用以避免模型的过度拟合。

最常见的正则化表达式有L1正则化：R(A)＝∑_a∈A|a|和L2正则化：

R(A)＝∑_a∈Aa²，但使用者也可以使用任意挑选的正则化表达式。

参数优化的方法可以任意选择，最常见的为梯度降低法，步骤数学表达式如下：

在j轮将参数往目标方程的微分反方向移动。反复多轮移动之后，在满足特定停止条件的情况下停止移动。

优化数据的又一步的改进是数据增噪方法，可以人为地为模型和数据增加噪音，来起到稳定模型和抗击数据模型的过度拟合问题。比如在医疗影像智能分析仪当中，可以对原始数据进行变形和扭曲，强迫模型识别噪音以外的有效信息。

优化数据的再一改进是测试样本分割，可以将训练数据进一步分割出测试样本，利用剩余的训练数据建立模型，通过测试样本来测试模型的有效性，可以根据结果自动或者手动调整深度学习模型的核心框架。

七、将获取的已形成结构化矩阵数据的医学待分析数据导入该深度学习模型中进行与之匹配的医学病理分析；

八、由该深度学习模型通过输出装置输出与所述医学待分析数据相匹配的医学病理分析结果。

九、将所述医学待分析数据和与之匹配的分析结果涉及的结构化数据反馈到所述深度学习模型中形成新的训练数据对该深度学习模型进一步优化。

本发明的基于深度学习对医疗数据进行分析的智能分析仪，其包括可将医疗训练数据和医学待分析数据导入计算机中的输入装置、分别或集中保存所述医疗训练数据和医学待分析数据的存储模块、调用存储模块中的医疗训练数据进行自学习的本发明方法中的深度学习模型模块、将与所述医学待分析数据匹配的医学病理分析结果导出的输出装置和包括CPU和/或GPU的处理器，其中，

所述输入装置包括设置在医院、医学机构的计算机装置、与该计算机联网的各种医疗检查装置和病理分析装置；如电脑、彩超仪器、X光、同步心电仪、生化分析仪、免疫分析仪、纤维内窥镜、核磁共振、CT多普勒诊断仪、血压计、体重计等等。

所述输出装置包括设置在医院、医学机构中并与所述输入装置联网的固定式计算机输出终端和移动式智能终端。如电脑、医疗器械终端、手机终端等等。

为了实现医院或医学机构共享资源，可在本发明的智能分析仪上安装可与互联网、以太网连接的包括光纤连接、WIFI连接或GPRS模块连接的网络连接模块。

本发明的智能分析仪将训练所得深度学习模型应用到实际当中，为完整集成系统。新的医疗数据(即所述的待分析医疗数据)产生之后与模型参数相结合，将得出分析预测值。实际应用过程当中，智能分析仪在分析流程当中成为一个额外插件。根据应用场景的不同，可以成为医疗器械当中的额外插件，也可以成为常用PACS(中文名为影像归档和通信系统)系统或者HIS(中文名为医院信息)系统当中的插入界面，也可以通过互联网接口将其生成的分析报告导入其它系统中。

Claims

1.一种训练模型的方法，其特征在于，包括：

采集同类型的医疗素材数据及与所述医疗素材数据匹配的医疗诊断数据，并将所述医疗素材数据和所述医疗诊断数据作为医疗训练数据通过输入装置存储于计算机中；

将所述医疗训练数据中不小于二维的影像数据和文本数据中随时间和空间的变化值与对应的数据相关联；

在采集的医疗训练数据中，将与每一个个体对应的医疗训练数据和所述变化值汇总为一条单元数据；

将所述医疗训练数据整合或格式化为计算机能够理解的结构化数据矩阵并从每个单元数据中提取数据特征，其中，所述数据特征包括所述医疗训练数据在时间上的变化值和在空间上的变化值；

将已形成结构化数据矩阵的医疗训练数据导入设置于计算机内对应深度学习模型的存储模块中；

通过计算机对所述深度学习模型进行优化运算，其中，所述深度学习模型的输入层包括多个具有所述数据特征的节点，所述深度学习模型的输出层包括多个具有医疗诊断数据特征的节点。

2.根据权利要求1所述的方法，其特征在于，所述医疗训练数据包括模拟形成的模拟数据，所述模拟数据为基于原有医疗数据通过变形、扭曲和噪音叠加而构建出的新数据。

3.根据权利要求1或2所述的方法，其特征在于，在医技阶段，所述医疗素材数据包括：原始图像数据，所述空间上的变化值包括一个图像从其中的一个像素到下一个像素之间的关系，所述深度学习模型包括多个卷积方块，每个所述卷积方块为一个三维的矩阵，所述卷积方块的x与y轴涵盖一个图像在空间变化的方程，所述卷积方块的z轴涵盖所述图像在空间变化的方程。

4.根据权利要求1或2所述的方法，其特征在于，所述通过计算机对所述深度学习模型进行优化运算，包括：

设定深度学习基本框架，将所述医疗训练数据按照所述数据特征建立包括输入层、至少一层隐层和输出层的数据模型，每个隐层包含若干个与上一层输出值具有映射对应关系的节点；

每个节点采用数学方程建立所述节点的数据模型，采用人工或随机方法预设所述数学方程中的相关参数值，所述输入层中各节点的输入值为所述的数据特征，各隐层及输出层中各节点的输入值为上层的输出值，每层中各节点的输出值为本节点经所述数学方程运算后所得的值；

初始化所述参数值A_i，将所述输出层中各节点的输出值与对应节点的医疗诊断数据特征比对，反复修正各节点的所述参数值A_i，依次循环，最终获得使所述输出层中各节点的输出值生成与所述医疗诊断数据特征相似度为局部最大时的输出值对应的各节点中的参数值A_i。

5.根据权利要求1或2所述的方法，其特征在于，所述通过计算机对所述深度学习模型进行优化运算，包括：

通过计算机利用有监督学习方法对所述深度学习模型进行优化运算，

其中，所述方法还包括：

利用无监督学习方法对所述深度学习模型进行训练，得到的参数作为所述有监督学习方法的初步参数起始值，其中，所述无监督学习方法包括降噪自动编码生成器和/或限制伯尔曼机。

6.根据权利要求1或2所述的方法，其特征在于，还包括：

将医学待分析数据和与之匹配的分析结果涉及的结构化数据反馈到所述深度学习模型中形成新的训练数据。

7.根据权利要求1或2所述的方法，其特征在于，所述医疗素材数据包括临床和医技阶段医生对患者诊断、检查和治疗过程进行的相关信息记录，所述诊断数据包括临床和医技阶段医生对患者初诊判断、出院结果、疾病治疗效果进行的相关信息记录以及医生撰写的文本出诊数据和跟踪随访数据。

8.一种基于深度学习对医疗数据进行分析的方法，其特征在于，包括：

将获取的已形成结构化矩阵数据的医学待分析数据导入深度学习模型中进行与之匹配的医学病理分析，其中，所述深度学习模型是通过如权利要求1至7任一项所述的方法训练得到的；

由所述深度学习模型通过输出装置输出与所述医学待分析数据相匹配的医学病理分析结果。

9.一种分析仪，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

所述处理器，用于执行上述权利要求1至8任一项所述的方法。

10.一种分析仪，其特征在于，包括：

输入装置，用于将医疗训练数据和医学待分析数据导入计算机中，其中，所述医疗训练数据包括医疗素材数据及与所述医疗素材数据匹配的医疗诊断数据；

存储模块，用于分别或集中保存所述医疗训练数据和医学待分析数据；

深度学习模型模块，用于调用所述存储模块中的医疗训练数据执行训练模型的方法以进行自学习，其中，所述训练模型的方法包括：

采集同类型的医疗素材数据及与所述医疗素材数据匹配的医疗诊断数据，并将所述医疗素材数据和所述医疗诊断数据作为医疗训练数据通过输入装置存储于计算机中；将所述医疗训练数据中不小于二维的影像数据和文本数据中随时间和空间的变化值与对应的数据相关联；在采集的医疗训练数据中，将与每一个个体对应的医疗训练数据和所述变化值汇总为一条单元数据；将所述医疗训练数据整合或格式化为计算机能够理解的结构化数据矩阵并从每个单元数据中提取数据特征，其中，所述数据特征包括所述医疗训练数据在时间上的变化值和在空间上的变化值；将已形成结构化数据矩阵的医疗训练数据导入设置于计算机内对应深度学习模型的存储模块中；通过计算机对所述深度学习模型进行优化运算，其中，所述深度学习模型的输入层包括多个具有所述数据特征的节点，所述深度学习模型的输出层包括多个具有医疗诊断数据特征的节点；

输出装置，用于将与所述医学待分析数据匹配的医学病理分析结果导出。

11.根据权利要求10所述的智能分析仪，其特征在于，所述深度学习模型模块还用于将所述医学待分析数据和与之匹配的分析结果涉及的结构化数据反馈到深度学习模型中形成新的训练数据对所述深度学习模型进一步优化。

12.根据权利要求10或11所述的分析仪，其特征在于，所述输入装置包括设置在医院、医学机构的计算机装置、与该计算机联网的各种医疗检查装置和病理分析装置；

所述输出装置包括设置在医院、医学机构中并与所述输入装置联网的固定式计算机输出终端或移动式智能终端。