CN108197706A

CN108197706A - 残缺数据深度学习神经网络方法、装置、计算机设备及存储介质

Info

Publication number: CN108197706A
Application number: CN201711205193.4A
Authority: CN
Inventors: 朱定局
Original assignee: South China Normal University
Current assignee: South China Normal University
Priority date: 2017-11-27
Filing date: 2017-11-27
Publication date: 2018-06-22
Anticipated expiration: 2037-11-27
Also published as: CN108197706B

Abstract

本发明涉及一种残缺数据深度学习神经网络方法、装置、计算机设备及存储介质，方法包括：获取预先训练好的深度学习神经网络；从待预测数据中获取输入数据；根据所述输入数据和所述预先训练好的深度学习神经网络的输入变量确定至少一个缺少数据的输入变量；将对所述缺少数据的输入变量进行赋值获得的数据，与从所述待预测数据中获取的输入数据进行组合，生成多组完整输入数据；将所述多组完整输入数据输入到所述预先训练好的深度学习神经网络中，计算得到多组输出数据。通过这种方式，能够在输入数据缺少数据的情况，仍然能够通过神经网络输出预测的输出变量，为研究工作提供数据支持，减少了输入数据检测和采集的成本。

Description

残缺数据深度学习神经网络方法、装置、计算机设备及存储介质

技术领域

本发明涉及机器学习领域，特别是涉及一种残缺数据深度学习神经网络方法、装置、计算机设备及存储介质。

背景技术

人工神经网络(Artificial Neural Networks，简写为ANNs)也简称为神经网络(NNs)或称作连接模型(Connection Model)，它是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的。人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。在工程与学术界也常直接简称为“神经网络”或类神经网络。

传统技术中，神经网络包括用于深度学习的深度神经网络都是通过输入数据和输出数据对神经网络进行训练，然后在使用阶段将输入数据输入已经训练好的神经网络，从而得到输出数据。但是，在实际使用过程中，输入数据往往都不完整，因此传统技术的神经网络无法根据不完整的输入数据得到输出数据。

发明内容

基于此，有必要针对上述输入数据不完整无法获取输出数据的技术问题，提供一种残缺数据深度学习神经网络方法。

一种深度学习神经网络方法，包括：

获取预先训练好的深度学习神经网络；

从待预测数据中获取输入数据；

根据所述输入数据和所述预先训练好的深度学习神经网络的输入变量确定至少一个缺少数据的输入变量；

将对所述缺少数据的输入变量进行赋值获得的数据，与从所述待预测数据中获取的输入数据进行组合，生成多组完整输入数据；

将所述多组完整输入数据输入到所述预先训练好的深度学习神经网络中，计算得到多组输出数据。

在其中一个实施例中，将对所述缺少数据的输入变量进行赋值获得的数据，与从所述待预测数据中获取的输入数据进行组合，生成多组完整输入数据，包括：

从输入变量范围知识库中检索出缺少数据输入变量对应的预设取值范围；其中，输入变量范围知识库预先存有所有输入变量对应的预设取值范围；或从所有训练输入数据中的每一训练输入数据中获取缺少数据输入变量的值，统计获取到的缺少数据输入变量的最大值和最小值，将从最小值到最大值之间的值范围作为缺少数据输入变量的预设取值范围；或提示并接受用户输入缺少数据输入变量的预设取值范围；

对缺少数据输入变量在对应的预设取值范围内随机地生成预定数量个值对缺少数据的输入变量进行预定数量次赋值；

其中，预定数量由用户输入或预先设置。

在其中一个实施例中，所述将对所述缺少数据的输入变量进行赋值获得的数据，与从所述待预测数据中获取的输入数据进行组合，生成多组完整输入数据，包括：

从样本数据库中随机选取预定数量个训练输入数据，然后提取这预定数量个训练输入数据中该输入变量对应的数据对缺少数据输入变量进行预定数量次赋值；

其中，预定数量由用户输入或将小于或等于样本数据库中输入数据的数量的P％作为预定数量，P小于或等于100，样本数据库中的输入数据都是完整的输入数据。

在其中一个实施例中，在所述将所述多组完整输入数据输入到所述预先训练好的深度学习神经网络中，计算得到多组输出数据之后，还包括：

统计所述多组输出数据中各类输出数据所占的比例；将比例最高的一类输出数据作为预测结果；将预测结果及各类输出数据及其相应比例输出给用户。

在其中一个实施例中，在所述获取预先训练好的深度学习神经网络之前，还包括：

对深度学习神经网络进行初始化；

获取训练数据；

通过训练数据对初始化后的深度学习神经网络进行训练得到预先训练好的深度学习神经网络。

在其中一个实施例中，对深度学习神经网络进行初始化，包括：

根据样本数据库中的训练数据的字段名确定样本输入变量与样本输出变量；

从深度学习神经网络库中选取输入变量和输出变量与样本输入变量和样本输出变量匹配的深度学习神经网络；

对选取的深度学习神经网络进行初始化。

在其中一个实施例中，从深度学习神经网络库中选取输入变量和输出变量与样本输入变量和样本输出变量匹配的深度学习神经网络，包括：

采用如下公式计算深度学习神经网络库中输入变量和输出变量分别与所述样本输入变量和所述样本输出变量之间的匹配度：

匹配度＝深度学习神经网络库中输入变量与样本输入变量的匹配度×u％+深度学习神经网络库中输出变量与样本输出变量的匹配度×(1-u％)；其中，u为预设权重；

从匹配度中选取匹配度最大的深度学习神经网络返回给用户；

将用户确认或修改后的深度学习神经网络作为预置深度学习神经网络。

一种深度学习神经网络装置，包括：

数据获取模块，用于获取预先训练好的深度学习神经网络，从待预测数据中获取输入数据；

缺少数据的输入变量确认模块，用于根据所述输入数据和所述预先训练好的深度学习神经网络的输入变量确定至少一个缺少数据的输入变量；

取值范围获取模块，用于将对所述缺少数据的输入变量进行赋值获得的数据，与从所述待预测数据中获取的输入数据进行组合，生成多组完整输入数据；

数据输入模块，用于将所述多组完整输入数据输入到所述预先训练好的深度学习神经网络中，计算得到多组输出数据。

一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现以下步骤：

获取预先训练好的深度学习神经网络；

从待预测数据中获取输入数据；

一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现以下步骤：

获取预先训练好的深度学习神经网络；

从待预测数据中获取输入数据；

上述残缺数据深度学习方法和神经网络系统，通过获取预先训练好的深度学习神经网络，将待预测数据作为深度学习神经网络的输入变量，根据输入数据和预先训练好的深度学习神经网络的输入变量确定至少一个缺少数据的输入变量；将对缺少数据的输入变量进行赋值获得的数据，与从待预测数据中获取的输入数据进行组合，生成多组完整输入数据；将多组完整输入数据输入到预先训练好的深度学习神经网络中，计算得到多组输出数据。通过这种方式，能够在输入数据缺少数据的情况，仍然能够通过神经网络输出预测的输出变量，为研究工作提供数据支持，减少了输入数据检测和采集的成本。

附图说明

图1为一个实施例中深度学习神经网络方法的应用环境图；

图2为一个实施例中计算机设备的内部结构示意图；

图3为一个实施例中深度学习神经网络方法的流程示意图；

图4为另一个实施例中深度学习神经网络方法的流程示意图；

图5为一个实施例中深度学习神经网络方法的装置结构框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

图1示出了一个实施例中深度学习神经网络方法的应用环境图。参照图1，该深度学习神经网络方法可应用于深度学习神经网络的系统中，该系统包括终端110和服务器120，终端110通过网络与服务器120连接。终端110可以是但不限于各种能运行游戏应用的个人计算机、笔记本电脑、个人数字助理、智能手机、平板电脑等。服务器120可以是实现单一功能的服务器，也可以是实现多种功能的服务器，具体可以是独立的物理服务器，也可以是物理服务器集群。终端110上可通过特定的应用显示数据输入界面，服务器120可大量接收由终端110上传的用户资料，服务器120从用户资料中提取样本数据，并根据用户资料统计多组字段数据等。具体的，当服务器120获取到终端110发起的预测输出变量的请求时，服务器120从终端110上传的待预测数据中获取深度学习神经网络的输入数据，再根据深度学习神经网络确定一个或多个缺少数据的输入变量，通过服务器120中的知识库或本地知识库中存储的数据确定缺少数据的输入变量的取值范围，并在每个缺少数据的输入变量的对应取值范围内选取预定数量个数据作为缺少数据的输入变量的数据，因此获得了多组输入数据。再将多组输入数据输入至服务器120上的预先训练好的深度学习神经网络模型中，则能获得多组输出数据。

图2为一个实施例中计算机设备的内部结构示意图。该计算机设备具体可以是如图1中的服务器120。如图2所示，计算机设备包括通过系统总线连接的处理器、存储介质、内存储器、网络接口、显示屏和输入装置。其中，该处理器用于提供计算和控制能力，支撑整个终端的运行。计算机设备的存储介质存储有操作系统以及计算机程序，该计算机程序被处理器执行时，使得处理器实现一种深度学习神经网络方法。计算机设备中的内存储器也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行一种深度学习神经网络方法。计算机设备的网络接口用于与服务器120通信。计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是外接的键盘、触控板或鼠标等，输入装置可获取用户使用手指对显示屏显示的操作界面产生的指令，例如获取通过点击输入选项将输入变量的数据输入到深度学习神经网络模型中。显示屏可用于显示数据输入界面。

本领域技术人员可以理解，图2中示出的结构，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的终端的限定，具体的终端可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

如图3所示，在一个实施例中，提供了一种深度学习神经网络方法，该方法以应用于如图1所示的服务器中进行举例说明。包括：

步骤302，获取预先训练好的深度学习神经网络。

步骤304，从待预测数据中获取输入数据。

步骤306，根据输入数据和预先训练好的深度学习神经网络的输入变量确定至少一个缺少数据的输入变量。

预先训练好的深度学习神经网络有N个输入变量。待预测数据中有其中M个输入变量对应的数据，其余N-M个输入变量没有对应的数据，则这N-M个输入变量是缺少数据的输入变量；其中，M、N是自然数。

例如，深度学习神经网络输入变量为：身高、体重、血压、血液检查结果、尿液检查结果；深度学习神经网络输出是糖尿病类型(例如，用0、1、2、3来表示不同类型的糖尿病)。

例如，待测试的不完整输入数据包括血压数据、血液检查结果数据、尿液检查结果数据，缺少数据输入变量为身高、体重。

步骤308，将对缺少数据的输入变量进行赋值获得的数据，与从待预测数据中获取的输入数据进行组合，生成多组完整输入数据。

通过知识库获取缺少数据的输入变量中每一缺少数据的输入变量的取值范围。具体包括3种方式：

第一种方式：从输入变量范围知识库中检索出缺少数据输入变量对应的预设取值范围；其中，输入变量范围知识库预先存有所有输入变量对应的预设取值范围；

第二种方式：提示并接受用户输入缺少数据输入变量的预设取值范围；

第三种方式：从所有训练输入数据中的每一训练输入数据中获取缺少数据输入变量的值，统计获取到的缺少数据输入变量的最大值和最小值，将从最小值到最大值之间的值范围作为缺少数据输入变量的预设取值范围；

例如，身高的取值范围是0.1至2米，体重的取值范围是2至100公斤。

知识库中存储有多组数据，其中包括有多组与预先训练好的深度学习神经网络输入数据。可通过知识库中存储的数据获取到缺数据输入数据的取值范围。

对缺少数据输入变量在对应的预设取值范围内由进行N次赋值，具体包括2种实现方法：

第1种实现方法：

对缺少数据输入变量在对应的预设取值范围内随机地取N个值对缺少数据输入变量进行N次赋值。

第2种实现方法：

从所有训练输入数据中随机抽取N个训练输入数据，然后提取这N个训练输入数据中该输入变量对应的数据对缺少数据输入变量进行N次随机赋值。

其中，预设次数N的确定方法包括：

接受用户输入预设次数N的值，如果用户没有输入，则将训练输入数据的数量作为N的值。

例如，

对缺少数据输入变量身高、体重在对应的预设取值范围0.1至2米、2至100公斤内复制其他样本中该输入变量数据进行100次随机赋值，因为有很多样本中是具备身高、体重数据的，所以通过获取已有其他样本中这些输入变量的数据是可行的：

身高0.5米，体重10公斤；

身高1.5米，体重50公斤；

……

身高1.7米，体重55公斤；

将该缺少数据输入变量身高、体重对应的100份输入数据与待测试的不完整输入数据“血压数据C、血液检查结果数据D、尿液检查结果数据E”组合得到100份完整的输入数据：

身高0.5米，体重10公斤、血压数据C、血液检查结果数据D、尿液检查结果数据E；

身高1.5米，体重50公斤、血压数据C、血液检查结果数据D、尿液检查结果数据E；

……

身高1.7米，体重55公斤、血压数据C、血液检查结果数据D、尿液检查结果数据E；

通过知识库中存储的数据获取到缺少输入数据的取值范围后，在此取值范围内取预定数量的数据，将选取的数据赋值给缺数据的输入变量。预定数量是预先设置的数量值，可根据不同的输入变量设定不同的预定数量。选择M个数量的数据对缺少数据的输入变量进行赋值，就能得到M个缺少数据的输入变量的输入数据，再将填入了数据的缺少数据的输入变量与从待预测数据中获取的输入数据进行组合，生成多组完整的输入数据。

步骤310，将多组完整输入数据输入到预先训练好的深度学习神经网络中，计算得到多组输出数据。

将缺少数据的输入变量缺少数据的输入数据补充完整后，与从待预测数据中获取的输入数据进行组合，生成多组完整的输入数据。再将多组完整的输入数据输入到预先训练好的深度学习神经网络中，则能够获得多个输出数据。

例如，

将100份完整的输入数据输入已训练的深度学习神经网络，得到多份输出：

身高0.5米，体重10公斤、血压C、血液检查结果D、尿液检查结果E，该份完整的输入数据输入已训练的深度学习神经网络得到输出Y1；

身高1.5米，体重50公斤、血压C、血液检查结果D、尿液检查结果E该份完整的输入数据输入已训练的深度学习神经网络得到输出Y2；

……

身高1.7米，体重55公斤、血压C、血液检查结果D、尿液检查结果E，该份完整的输入数据输入已训练的深度学习神经网络得到输出Y100；通过这种方式，能够在输入数据缺少数据的情况，仍然能够通过神经网络输出预测的输出变量，为研究工作提供数据支持。

在一个实施例中，将对缺少数据的输入变量进行赋值获得的数据，与从待预测数据中获取的输入数据进行组合，生成多组完整输入数据，包括：

从输入变量范围知识库中检索出缺少数据输入变量对应的预设取值范围；其中，输入变量范围知识库预先存有所有输入变量对应的预设取值范围；或从所有训练输入数据中的每一训练输入数据中获取缺少数据输入变量的值，统计获取到的缺少数据输入变量的最大值和最小值，将从最小值到最大值之间的值范围作为缺少数据输入变量的预设取值范围；或提示并接受用户输入缺少数据输入变量的预设取值范围；对缺少数据输入变量在对应的预设取值范围内随机地生成预定数量个值对缺少数据的输入变量进行预定数量次赋值；其中，预定数量由用户输入或预先设置。

当待预测数据中缺少一个或多个输入变量的数据时，则需要从知识库存储的对应数据中选取预定数量的数据对缺少数据的输入变量进行赋值。预定数量，可以是用户通过输入设备输入的，当用户未输入时，预定数量的确定办法可以是根据预设比例计算的。具体的，先根据缺数据的输入变量从知识库中查找缺数据输入数据数量，比如缺少数据的输入变量为体重，那么就从知识库中查找体重这一项的数据，当体重这一项的数据有120项时，那么知识库中缺少数据的输入变量为体重的对应数据数量则为120。再获取到预设比例为2/3，那么预定数量则等于120乘以2/3，即预定数量为80。当计算出来的预定数量不是整数时，则可以通过四舍五入或取整的方式取整数值。预设比例的设定可由研究人员或设计人员根据研究需求而定。预设比例的设定较灵活，可根据实际项目需求进行调整，根据预设比例与总体数据数量进行预设数量的确定，也能保证选取数据的数量，提高输出数据的总体准确性。

在一个实施例中，在将多组完整输入数据输入到预先训练好的深度学习神经网络中，计算得到多组输出数据之后，还包括：统计多组输出数据中各类输出数据所占的比例；将比例最高的一类输出数据作为预测结果；将预测结果及各类输出数据及其相应比例输出给用户。

在得到多个输出数据之后，需要对输出数据进行统计。分别统计各类输出数据所占的比例，再将比例最高的输出数据作为预测结果。

比如，输入变量为体重、身高、血压、血液检查结果，输出变量为糖尿病严重程度等，当输入多组体重、身高、血压、血液检查结果的数据后，能获得多组输出的糖尿病严重程度的数据。当输出的糖尿病严重程度数据为0的有10个，为1的有30个，为2的有15个时，则将占比例最高的为1的数据作为预测结果。其中，数据为0代表没有糖尿病，数据为1代表有轻微糖尿病，数据为2代表有严重糖尿病。具体的数据输出可由研究人员进行自定义设置。

例如，根据Y1、Y2、…、Y100的值进行统计，例如，其中输出为0的有10个，1的有30个，2的有60个。其中0代表没有糖尿病，1代表有轻微糖尿病，2代表有严重糖尿病，则输出为0(代表没有糖尿病)的比例是10％，输出为1(代表轻微糖尿病)的比例是30％，输出为2(代表严重糖尿病)的比例是60％。

将多个输出数据及其对应比例输出给用户，作为不完整输入数据的输出数据；将最高比例对应的输出数据输出给用户，作为不完整输入数据的最大概率输出数据。

例如，将输出为0(代表没有糖尿病)的比例是10％，输出为1(代表轻微糖尿病)的比例是30％，输出为2(代表严重糖尿病)的比例是60％输出给用户，作为不完整输入数据血压C、血液检查结果D、尿液检查结果E的输出

意义：例如，在医疗行业，虽然有诊疗神经网络模型，但输入变量很多，例如糖尿病神经网络模型，输出是无糖尿病、X类糖尿病、Y类糖尿病、等(实际中X、Y有具体名称)，输入为：血压、身高、体重、血液检查结果(实际中包括多项具体指标)、尿液检查结果(实际中包括多项具体指标)。但患者刚开始来的时候，可能其中血液没有检查，那么在现有技术中就无法使用该模型了，而采用本发明可以通过已有的患者输入数据，进行大概地叛别各种病的可能性，进行预诊和分诊，假如通过现有残缺的数据，就足以判断出想要的结果，例如，现有数据输入进去后，发现出来的结果只有无糖尿病这一类，那么就无需再多做检查，反而节省了输入数据检测和采集的成本；或者看到输出为2(代表严重糖尿病)的比例是60％，说明患严重糖尿病的可能性最大，则需要进一步做完整的检查甚至更深入的检查。

当输出的输出数据有多个时，则需要对输出结果进行筛选，将比例较高的数据作为预测输出数据也更能确保预测数据的准确性。

在一个实施例中，将对缺少数据的输入变量进行赋值获得的数据，与从待预测数据中获取的输入数据进行组合，生成多组完整输入数据，包括：从样本数据库中随机选取预定数量个训练输入数据，然后提取这预定数量个训练输入数据中该输入变量对应的数据对缺少数据输入变量进行预定数量次赋值；其中，预定数量由用户输入或将小于或等于样本数据库中输入数据的数量的P％作为预定数量，P小于或等于100，样本数据库中的输入数据都是完整的输入数据。

在一个实施例中，在从待预测数据中获取输入变量之前，还包括：对深度学习神经网络进行初始化；获取训练数据；通过训练数据对初始化后的深度学习神经网络进行训练得到预先训练好的深度学习神经网络。

深度学习神经网络在根据输入数据预测输出数据之前，需要先获取到深度学习神经网络模型并对其进行初始化，再获取训练数据，通过训练数据对初始化后的深度学习神经网络模型进行训练，训练后则能获得训练好的深度学习神经网络。训练好的深度学习神经网络模型才能用于对输出数据的预测操作。深度学习神经网络模型可以自行创建，也可以为了节约创建时间，直接从深度学习神经网络库中获取匹配度较高的深度学习神经网络模型，再对获取到深度学习神经网络进行初始化，初始化后的深度学习神经网络模型才能与当前研究项目需要的输入变量与输出变量更契合，而对深度学习神经网络模型训练后才能使得深度学习神经网络模型更准确的预测输出数据。

在一个实施例中，对深度学习神经网络进行初始化，包括：根据样本数据库中的训练数据的字段名确定样本输入变量与样本输出变量；从深度学习神经网络库中选取输入变量和输出变量与样本输入变量和样本输出变量匹配的深度学习神经网络；对选取的深度学习神经网络进行初始化。

在知识库中存储有多种类型的数据，每个类型的数据有对应的字段。比如存储的数据中包括有体重，身高，血压这三种类型的数据，那么对应的字段可设为体重，身高，血压。再根据研究项目需求，从知识库中选择需要用到的字段，将选取的字段确认为样本输入变量与样本输出变量。比如，当项目需要研究根据身高，体重，血压，血液检测结果等数据预测该用户是否患有糖尿病和患病严重程度时，可从知识库中选择体重，血压，血液检测结果的字段作为样本输入变量，并选择糖尿病类型作为样本输出变量，则项目研究需要的深度学习神经网络的输入变量为体重，血压，血液检测结果，而输出变量则为糖尿病类型。

当确定了样本输入变量与样本输出变量后，可根据样本输入变量与样本输出变量从深度学习神经网络库中选取相匹配的深度学习神经网络。由于深度学习神经网络库中的神经网络模型数量较多，在选取与实际需求对应的神经网络模型时，应该先根据研究需求从知识库中选择对应的字段将项目需要的神经网络模型的输入变量与输出变量设定，设定后，再根据设定的输入变量与输出变量从深度学习神经网络库中查找与实际项目需求需要相匹配的神经网络模型。这样能减轻选择神经网络模型的操作步骤，节约时间成本。

在一个实施例中，从深度学习神经网络库中选取输入变量和输出变量与样本输入变量和样本输出变量匹配的深度学习神经网络，包括：采用如下公式计算深度学习神经网络库中输入变量和输出变量分别与样本输入变量和样本输出变量之间的匹配度：

匹配度＝深度学习神经网络库中输入变量与样本输入变量的匹配度×u％+深度学习神经网络库中输出变量与样本输出变量的匹配度×(1-u％)；其中，u为预设权重；从匹配度中选取匹配度最大的深度学习神经网络返回给用户；将用户确认或修改后的深度学习神经网络作为预置深度学习神经网络。

当根据样本输入变量和样本输出变量从深度学习神经网络库中选择匹配的深度学习神经网络时，可将深度学习神经网络库中的多个深度学习神经网络的输入变量和输出变量分别与样本输入变量和样本输出变量进行对比匹配，再将两者的匹配度综合，选择综合匹配度最高的。具体的，可以设置一个预定权重，比如设定权重为50时，则说明研究人员认为输入变量与输出变量的重要性是一致的。将深度学习神经网络库中的多个深度学习神经网络的输入变量与样本输入变量一一对比，获取输入变量与样本输入变量的匹配度。再将深度学习神经网络库中的多个深度学习神经网络的输出变量与样本输出变量一一对比，获取输出变量与样本输出变量的匹配度。

比如，神经网络A的输入变量与样本输入变量的匹配度为4/5，神经网络A的输出变量与样本输出变量的匹配度为3/4，那么神经网络A的综合匹配度为4/5*50％+3/4*(1-50％)＝0.775。当将深度学习神经网络库中的多个深度学习神经网络都一一匹配完毕后，统计每个深度学习神经网络与样本输入变量和样本输出变量的综合匹配度，并将匹配度最高的神经网络作为预置深度学习神经网络。因此，若是其他的神经网络的综合匹配度低于0.775时，则选择匹配度最高的神经网络A作为预置深度学习神经网络。

将样本输入变量与样本输出变量均作为“挑选”标准，能在更大程度上保证“挑选”出的深度学习神经网络与实际项目需求的契合性，更能节约研究的时间成本。

在一个实施例中，对初始化后的深度学习神经网络进行训练得到预先训练好的深度学习神经网络，包括：获取初始化后的深度学习神经网络中的输入变量与输出变量；从知识库中获取输入数据，将输入数据输入到深度学习神经网络中进行无监督训练；从知识库中获取输入数据及输出数据，将输入数据作为初始化后的深度学习神经网络的输入，将输出数据作为初始化后的深度学习神经网络的预期输出，对初始化后的深度学习神经网络进行有监督训练。其中，训练输入数据有多个，例如千万个，将其中每个训练输入数据作为深度学习神经网络的输入，对深度学习神经网络进行无监督训练。其中，带标签的训练输入数据及其对应的预期标签有多个，例如十万个，将其中每个带标签的训练输入数据及其对应的预期标签作为深度学习神经网络的输入和预期输出，对深度学习神经网络进行有监督训练。

当从深度学习神经网络库中选择了某一个深度学习神经网络后，会先对该深度学习神经网络进行初始化，得到初始化后的深度学习神经网络，对应地，初始化后的深度学习神经网络有输入变量与输出变量。然后对初始化后的深度学习神经网络进行训练，训练分为无监督训练和有监督训练，一般情况下，是先进行无监督训练，再进行有监督训练。无监督训练是指从知识库中获取输入数据，将输入数据输入到初始化后的深度学习神经网络中进行无监督训练，无监督训练不需要预期输出。而有监督训练则需要预期输出。

比如，当输入变量为体重、身高、血压、血液检测结果、尿液检测结果时，从知识库中获取多组体重、身高、血压、血液检测结果、尿液检测结果字段对应的数据作为输入变量对应的数据，可以对初始化后的深度学习神经网络进行无监督训练。

在无监督训练后，再对深度学习神经网络进行有监督训练。进行有监督训练时，会将深度学习神经网络的输入数据与预期输出均提供。比如，当体重、身高、血压、血液检测结果、尿液检测结果为输入变量，糖尿病类型为输出变量时，从知识库中获取体重、身高、血压、血液检测结果、尿液检测结果字段对应的多组数据作为输入变量对应的数据，将糖尿病类型字段对应的数据作为输出变量对应的数据，对始化后的深度学习神经网络进行有监督训练。

用户样本数据中存储有多组数据，也就是用户样本数据中存储有多组用户数据。比如，每组用户数据中的数据类型包括有每个用户的体重、身高、血压、血液检测结果、尿液检测结果以及糖尿病类型数据。但是，并不是每组用户数据都是完整的，可能存在有的用户数据中缺少糖尿病类型数据，这部分缺少糖尿病类型数据的用户数据可以用于对深度学习神经网络进行无监督训练，避免了数据的浪费。由于无监督训练先训练了深度学习神经网络的特征提取能力，在进行了无监督训练后再进行有监督训练也能提升深度学习神经网络的训练效果，提升了训练后的深度学习神经网络预测输出数据的准确度。

在一个实施例中，如图4所示，提供了一种深度学习神经网络方法，该方法以应用于如图1所示的服务器中进行举例说明。包括：

步骤402，确定样本输入变量与样本输出变量。

样本输入变量与样本输出变量，是指根据知识库中已存储的样本数据提取的字段确定的输入变量与输出变量。具体确定过程包括，确定实际项目需求，再根据实际项目需求从知识库中获取根据用户样本数据提取的字段，再选择与项目需求符合的字段并设置为样本输入变量和样本输出变量。比如，当研究项目为预测用户患糖尿病的类型时，则需要用到的输入数据有体重，血压，血液检测结果，那么则可以从知识库中选择体重，血压，血液检测结果这三样数据对应的字段作为样本输入变量。当研究人员认为需要将尿液检测结果加入到输入变量中时，则可从知识库中选择体重，血压，血液检测结果，尿液检测结果这四样数据对应的字段作为样本输入变量。

步骤404，根据样本输入变量与样本输出变量选取深度学习神经网络。

当确定了样本输入变量与样本输出变量后，相当于“我已知道我要的是什么”，那么就已经有明确的目标，可以根据这个目标建立相符合的深度学习神经网络。但实际操作中，建立新的深度学习神经网络耗时长，且难度较大，因此为了节约研究时间成本，可以根据样本输入变量与样本输出变量从深度学习网络库中选择匹配的一个深度学习神经网络。

选择深度学习神经网络时，实际上是选择输入变量与样本输入变量匹配，输出变量与样本输出变量匹配的深度学习神经网络。但大多数情况下，都不太可能找到一个完全匹配的，因此可根据各个深度学习神经网络的输入变量和输出变量与样本输入变量和样本输出变量的匹配度最高的。比如样本输入变量为姓名，身高，体重，学历，年龄，深度学习神经网络库中存在深度学习神经网络A的输入变量为姓名，性别，居住地，婚姻状况，月收入情况。那么深度学习神经网络A的输入变量与样本输入变量匹配成功的只有姓名这一项，可以将深度学习神经网络A的输入变量与样本输入变量的匹配度记为1/5。同理，将深度学习神经网络A的输出变量与样本输出变量进行匹配，假设深度学习神经网络A的输出变量与样本输出变量的匹配度为1/4，那么则计算深度学习神经网络A的综合匹配度＝1/5*u％+1/4*(1-u％)，u％是研究人员设定的一个权重值，当将u设置为50时，那么深度学习神经网络A的综合匹配度则为0.225。以同样的方法计算其他深度学习神经网络的综合匹配度，并从中选择综合匹配度最高的深度学习神经网络作为即将运用于实际项目的深度学习神经网络。

步骤406，对深度学习神经网络进行初始化。

步骤408，对初始化后的深度学习神经网络进行训练。

根据实际项目需求对获取到的深度学习神经网络进行初始化配置，配置信息包括预设层数、每层预设节点数、各网络连接的预设权值。初始化后的深度学习神经网络还需要进行训练，训练包括无监督训练与有监督训练。

无监督训练，采用的是自下而上的训练方式，即输入层在下方，输出层在上方，逐层构建单层神经元。每层的神经元均采用wake-sleep算法进行调优。每次仅调整一层，逐层调整。这个过程可以看作是feature learning(特征学习)的过程。

wake-sleep算法分为wake阶段和sleep阶段。wake阶段即认知过程，通过下层的输入特征(Input)和向上的认知(Encoder)权重产生每一层的抽象表示(Code)，再通过当前的生成(Decoder)权重产生一个重建信息(Reconstruction)，计算输入特征和重建信息残差，使用梯度下降修改层间的下行生成(Decoder)权重。也就是“如果现实跟我想象的不一样，改变我的生成权重使得我想象的东西变得与现实一样”。sleep阶段即生成过程，通过上层概念(Code)和向下的生成(Decoder)权重，生成下层的状态，再利用认知(Encoder)权重产生一个抽象景象。利用初始上层概念和新建抽象景象的残差，利用梯度下降修改层间向上的认知(Encoder)权重。也就是“如果梦中的景象不是我脑中的相应概念，改变我的认知权重使得这种景象在我看来就是这个概念”。

无监督训练时，不需要预期输出，无监督训练的目的并不是为了预测输出，而是为了感知输入。因此在进行无监督训练时，并不需要输出预设输出数据，对于那些缺少输出数据的用户样本数据，可用来对深度学习神经网络进行无监督训练。

对深度学习神经网络进行了无监督训练后再进行有监督训练，在深度学习神经网络已经学习了特征提取，实现了特征学习的过程后再进行有监督训练，也能提高深度学习神经网络预测输出数据的准确度。将多组输入数据输入到已经进行了无监督训练的深度学习神经网络中，再将对应的输出数据作为已经进行了无监督训练的深度学习神经网络的输出数据，对深度学习神经网络进行有监督训练。比如，当输入变量为姓名，身高，体重，学历，年龄，输出变量为婚姻状态时，则可将姓名，身高，体重，学历，年龄的数据作为深度学习神经网络的输入数据，同时将婚姻状态数据作为深度学习神经网络的输出数据，以此方式对深度学习神经网络进行有监督训练。当有监督训练进行完毕后，则可以获得训练好的深度学习神经网络。

步骤410，将待预测数据输入到训练好的深度学习神经网络中。

步骤412，确定缺少数据的输入变量，根据知识库获取每一缺少数据的输入变量的取值范围。

将待预测数据输入到训练好的深度学习神经网络时，若待预测数据中缺少一个或多个输入变量的数据，即有一个或多个缺少数据的输入变量，则需要通过知识库中存储的与缺数据输入数据确定每一个缺少数据的输入变量的取值范围。比如缺少数据的输入变量为体重，那么就需要从知识库中查找存储的体重数据的取值范围，当知识库中存储的体重数值范围是40kg至100kg时，那么缺少数据的输入变量的取值范围则为40kg至100kg。

步骤414，从取值范围内选取预定数量的数据赋值给缺少数据的输入变量，与待预测数据中的输入数据共同输入到训练好的深度学习神经网络中。

步骤416，输出多组输出数据。

当确定了缺少数据的输入变量的取值范围后，会在此取值范围内选取预定数量的数据对缺少数据的输入变量赋值，则得到预定数量的缺数据输入数据。比如预定数量为N，那么就会从缺少数据的输入变量的取值范围内选择N个数据对缺少数据的输入变量进行赋值，则会得到N个缺少数据的输入变量的数据，故将此N个缺少数据的输入变量的数据与待预测数据共同输入到训练好的深度学习神经网络后，则能得到N个对应的输出数据。

对获取到的深度学习神经网络进行初始化后再进行无监督训练与有监督训练，则获取到的训练好的深度学习神经网络则能够用来预测输出数据。当输入数据并不完整时，可通过训练后的深度学习神经网络结合知识库对输出数据进行预测。由于实际操作过程中，缺少输入数据是很常见的事，故在输入数据缺少数据情况下，还是能够对输出数据进行合理预测，提高了深度学习神经网络的应用范围，也减少了输入数据检测和采集的成本。

在一个实施例中，如图5所示，提供了一种深度学习神经网络装置，装置包括：

数据获取模块502，用于获取预先训练好的深度学习神经网络，从待预测数据中获取输入数据；

缺少数据的输入变量确认模块504，用于根据输入数据和预先训练好的深度学习神经网络的输入变量确定至少一个缺少数据的输入变量；

取值范围获取模块506，用于将对缺少数据的输入变量进行赋值获得的数据，与从待预测数据中获取的输入数据进行组合，生成多组完整输入数据；

数据输入模块508，用于将多组完整输入数据输入到预先训练好的深度学习神经网络中，计算得到多组输出数据。

在一个实施例中，取值范围获取模块506还用于，从输入变量范围知识库中检索出缺少数据输入变量对应的预设取值范围；其中，输入变量范围知识库预先存有所有输入变量对应的预设取值范围；或从所有训练输入数据中的每一训练输入数据中获取缺少数据输入变量的值，统计获取到的缺少数据输入变量的最大值和最小值，将从最小值到最大值之间的值范围作为缺少数据输入变量的预设取值范围；或提示并接受用户输入缺少数据输入变量的预设取值范围；

对缺少数据输入变量在对应的预设取值范围内随机地生成预定数量个值对缺少数据的输入变量进行预定数量次赋值；其中，预定数量由用户输入或预先设置。

在一个实施例中，取值范围获取模块506还用于，从样本数据库中随机选取预定数量个训练输入数据，然后提取这预定数量个训练输入数据中该输入变量对应的数据对缺少数据输入变量进行预定数量次赋值；其中，预定数量由用户输入或将小于或等于样本数据库中输入数据的数量的P％作为预定数量，P小于或等于100，样本数据库中的输入数据都是完整的输入数据。

在一个实施例中，数据输入模块508，还用于统计多组输出数据中各类输出数据所占的比例；将比例最高的一类输出数据作为预测结果；将预测结果及各类输出数据及其相应比例输出给用户。

在一个实施例中，上述深度学习神经网络装置还包括训练模块，用于对深度学习神经网络进行初始化；获取训练数据；通过训练数据对初始化后的深度学习神经网络进行训练得到预先训练好的深度学习神经网络。

在一个实施例中，训练模块还用于，根据样本数据库中的训练数据的字段名确定样本输入变量与样本输出变量；从深度学习神经网络库中选取输入变量和输出变量与样本输入变量和样本输出变量匹配的深度学习神经网络；对选取的深度学习神经网络进行初始化。

在一个实施例中，训练模块还用于，采用如下公式计算深度学习神经网络库中输入变量和输出变量分别与样本输入变量和样本输出变量之间的匹配度：匹配度＝深度学习神经网络库中输入变量与样本输入变量的匹配度×u％+深度学习神经网络库中输出变量与样本输出变量的匹配度×(1-u％)；其中，u为预设权重；从匹配度中选取匹配度最大的深度学习神经网络返回给用户；将用户确认或修改后的深度学习神经网络作为预置深度学习神经网络。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取预先训练好的深度学习神经网络；从待预测数据中获取输入数据；根据输入数据和预先训练好的深度学习神经网络的输入变量确定至少一个缺少数据的输入变量；将对缺少数据的输入变量进行赋值获得的数据，与从待预测数据中获取的输入数据进行组合，生成多组完整输入数据；将多组完整输入数据输入到预先训练好的深度学习神经网络中，计算得到多组输出数据。

在一个实施例中，计算机程序被处理器执行将对缺少数据的输入变量进行赋值获得的数据，与从待预测数据中获取的输入数据进行组合，生成多组完整输入数据的步骤时，包括：

在一个实施例中，计算机程序被处理器执行将对缺少数据的输入变量进行赋值获得的数据，与从待预测数据中获取的输入数据进行组合，生成多组完整输入数据的步骤时，包括：从样本数据库中随机选取预定数量个训练输入数据，然后提取这预定数量个训练输入数据中该输入变量对应的数据对缺少数据输入变量进行预定数量次赋值；其中，预定数量由用户输入或将小于或等于样本数据库中输入数据的数量的P％作为预定数量，P小于或等于100，样本数据库中的输入数据都是完整的输入数据。

在一个实施例中，计算机程序被处理器执行将多组完整输入数据输入到预先训练好的深度学习神经网络中，计算得到多组输出数据的步骤之后，还包括：统计多组输出数据中各类输出数据所占的比例；将比例最高的一类输出数据作为预测结果；将预测结果及各类输出数据及其相应比例输出给用户。

在一个实施例中，计算机程序被处理器执行获取预先训练好的深度学习神经网络的步骤之前，还包括：对深度学习神经网络进行初始化；获取训练数据；通过训练数据对初始化后的深度学习神经网络进行训练得到预先训练好的深度学习神经网络。

在一个实施例中，计算机程序被处理器执行对深度学习神经网络进行初始化的步骤时，包括：根据样本数据库中的训练数据的字段名确定样本输入变量与样本输出变量；从深度学习神经网络库中选取输入变量和输出变量与样本输入变量和样本输出变量匹配的深度学习神经网络；对选取的深度学习神经网络进行初始化。

在一个实施例中，计算机程序被处理器执行从深度学习神经网络库中选取输入变量和输出变量与样本输入变量和样本输出变量匹配的深度学习神经网络的步骤时，包括：采用如下公式计算深度学习神经网络库中输入变量和输出变量分别与样本输入变量和样本输出变量之间的匹配度：

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性的计算机可读取存储介质中，如本发明实施例中，该程序可存储于计算机系统的非易失性存储介质中，并被该计算机系统中的至少一个处理器执行，以实现包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种深度学习神经网络方法，所述方法包括：

获取预先训练好的深度学习神经网络；

从待预测数据中获取输入数据；

2.根据权利要求1所述的方法，其特征在于，所述将对所述缺少数据的输入变量进行赋值获得的数据，与从所述待预测数据中获取的输入数据进行组合，生成多组完整输入数据，包括：

其中，预定数量由用户输入或预先设置。

3.根据权利要求1所述的方法，其特征在于，所述将对所述缺少数据的输入变量进行赋值获得的数据，与从所述待预测数据中获取的输入数据进行组合，生成多组完整输入数据，包括：

4.根据权利要求1所述的方法，其特征在于，在所述将所述多组完整输入数据输入到所述预先训练好的深度学习神经网络中，计算得到多组输出数据之后，还包括：

统计所述多组输出数据中各类输出数据所占的比例；

将比例最高的一类输出数据作为预测结果；

将预测结果及各类输出数据及其相应比例输出给用户。

5.根据权利要求1所述的方法，其特征在于，在所述获取预先训练好的深度学习神经网络之前，还包括：

对深度学习神经网络进行初始化；

获取训练数据；

6.根据权利要求5所述的方法，其特征在于，所述对深度学习神经网络进行初始化，包括：

对选取的深度学习神经网络进行初始化。

7.根据权利要求6所述的方法，其特征在于，所述从深度学习神经网络库中选取输入变量和输出变量与样本输入变量和样本输出变量匹配的深度学习神经网络，包括：

8.一种深度学习神经网络装置，其特征在于，所述装置包括：

9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1-7任意一项所述深度学习神经网络方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现权利要求1-7任意一项所述深度学习神经网络方法的步骤。