CN109635918A

CN109635918A - 基于云平台和预设模型的神经网络自动训练方法和装置

Info

Publication number: CN109635918A
Application number: CN201811278833.9A
Authority: CN
Inventors: 黄永祯; 于仕琪
Original assignee: Zhongke Water Drop Technology (shenzhen) Co Ltd; Watrix Technology Beijing Co Ltd
Current assignee: Zhongke Water Drop Technology (shenzhen) Co Ltd; Watrix Technology Beijing Co Ltd
Priority date: 2018-10-30
Filing date: 2018-10-30
Publication date: 2019-04-16

Abstract

本发明实施例提供的基于云平台和预设模型的神经网络自动训练方法和装置，通过在云计算平台下以云的形式存在的大量计算机组成的各种机器学习云，是云计算平台默认自带了各种神经网络训练算法，通过根据用户输入的样本数据数据类型选择神经网络训练算法，并基于预设的用户需解决问题与神经网络模型的对应关系，调用相应的神经网络模型，以对所述样本数据进行自动训练，解决了机器学习建模不便的问题，提供了一种结合云计算技和机器学习技术处理现实问题提供了方便快捷的方法。从而使用户无需为繁琐的细节而烦恼，能够更加专注于自己的业务，有利于创新和降低成本。

Description

基于云平台和预设模型的神经网络自动训练方法和装置

技术领域

本发明实施例涉及人工智能技术领域，更具体地，涉及基于云平台和预设模型的神经网络自动训练方法和装置。

背景技术

机器学习是人工智能的一个分支。人工智能的研究是从以“推理”为重点到以“知识”为重点，再到以“学习”为重点，一条自然、清晰的脉络。显然，机器学习是实现人工智能的一个途径，即以机器学习为手段解决人工智能中的问题。机器学习在近30多年已发展为一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与推断统计学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法。

深度学习是机器学习中一种基于对数据进行表征学习的方法，深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，模仿人脑的机制来解释数据，例如图像，声音和文本等。

但是现有技术中都是拘泥于其使用者自身的需求所设计的，例如某电商平台的用户喜好分析，电力系统数据分析平台，医学上的基因分析等等。这些方案所构建的系统都是只能针对特定目来设计的，如果分析需求有变化，难免需要对其进行修改，需要耗费极大的人力进行不断修改。由于机器学习技术纷繁负责，开发工具与框架甚广，许多算法难度较大，涉及数学与计算机科学，要求具有较高素质的专业人员进行开发设计。

发明内容

本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的一种基于云平台和预设模型的神经网络自动训练方法和装置。

第一方面，本发明实施例提供了一种基于云平台和预设模型的神经网络自动训练方法，包括：

获取用户输入的样本数据及辅助信息，基于所述样本数据的数据类型从预设算法中选择一种神经网络训练算法；

基于所述辅助信息确定用户需解决问题，并基于预设的用户需解决问题与神经网络模型的对应关系，调用相应的神经网络模型；

基于所述样本数据和所述神经网络训练算法，对所述神经网络模型进行自动训练，得到目标神经网络模型。

第二方面，本发明实施例提供了一种基于云平台和预设模型的神经网络自动训练装置，包括：

算法选择云平台，用于获取用户输入的样本数据及辅助信息，基于所述样本数据的数据类型从预设算法中选择一种神经网络训练算法；

模型选择云平台，基于所述辅助信息确定用户需解决问题，并基于预设的用户需解决问题与神经网络模型的对应关系，调用相应的神经网络模型；

模型训练云平台，用于基于所述样本数据和所述神经网络训练算法，对所述神经网络模型进行自动训练，得到目标神经网络模型。

第三方面，本发明实施例提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。

第四方面，本发明实施例提供一种非暂态计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。

本发明实施例提出了一种基于云平台和预设模型的神经网络自动训练方法和装置，通过在云计算平台下以云的形式存在的大量计算机组成的各种机器学习云，是云计算平台默认自带了各种神经网络训练算法，通过根据用户输入的样本数据数据类型选择神经网络训练算法，并基于预设的用户需解决问题与神经网络模型的对应关系，调用相应的神经网络模型，以对所述样本数据进行自动训练，解决了机器学习建模不便的问题，提供了一种结合云计算技和机器学习技术处理现实问题提供了方便快捷的方法。从而使用户无需为繁琐的细节而烦恼，能够更加专注于自己的业务，有利于创新和降低成本。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为根据本发明实施例的基于云平台和预设模型的神经网络自动训练方法示意图；

图2为根据本发明实施例的基于云平台和预设模型的神经网络自动训练装置示意图；

图3为根据本发明实施例的电子设备的实体结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

现有技术中关于神经网络训练的技术方案都是拘泥于其使用者自身的需求所设计的，例如某电商平台的用户喜好分析，电力系统数据分析平台，医学上的基因分析等等。从应用层面来说，这些方案所构建的系统都是只能针对特定目来设计的，如果数据类型有变化，或者分析需求有变化，难免需要对其进行修改，需要耗费极大的人力进行不断修改。从系统层面来说，这种针对特定目的的分析系统，程序接口不统一，不同系统之间无法相互通信。而且由于高度定制化，导致缺乏泛用性，可移植性与复用能力，是资源的一种浪费。从开发层面来说，由于机器学习技术纷繁负责，开发工具与框架甚广，许多算法难度较大，涉及数学与计算机科学，要求具有较高素质的专业人员进行开发设计。

由于现有技术中都是拘泥于其使用者自身的需求所设计的，技术纷繁负责，开发工具与框架甚广，许多算法难度较大，涉及数学与计算机科学，要求具有较高素质的专业人员进行开发设计，对于普通用户使用难度大，因此本发明各实施例针对在普通用户使用神经网络训练给出解决方案，具体为结合云计算技术和机器学习技术处理现实问题提供了方便快捷的方法，从而使用户无需为繁琐的细节而烦恼，能够更加专注于自己的业务，有利于创新和降低成本。以下将通过多个实施例进行展开说明和介绍。

图1为本发明实施例提供的一种基于云平台和预设模型的神经网络自动训练方法，包括：

S1、获取用户输入的样本数据及辅助信息，基于所述样本数据的数据类型从预设算法中选择一种神经网络训练算法；

S2、基于所述辅助信息确定用户需解决问题，并基于预设的用户需解决问题与神经网络模型的对应关系，调用相应的神经网络模型；

S3、基于所述样本数据和所述神经网络训练算法，对所述神经网络模型进行自动训练，得到目标神经网络模型。

在本实施例中，需要先为样本数据的数据类型预设的神经网络训练算法，每种数据类型对应有一个神经网络训练算法，在接收到某一数据类型的样本数据时，首先需要判断样本数据的数据类型，再根据数据类型选择神经网络训练算法，并基于预设的用户需解决问题与神经网络模型的对应关系，调用相应的神经网络模型，以对上述样本数据进行自动训练，解决了机器学习建模不便的问题，从而使用户无需为繁琐的细节而烦恼，能够更加专注于自己的业务，有利于创新和降低成本。最终，可得到一个或多个神经网络算法对应的神经网络模型，若存在多个神经网络模型，则可再进行验证，选取最优的神经网络模型。

在本实施例中，辅助信息是用户在上传样本数据时添加的，表明了用户需要解决的问题，及期望等。

在本实施例中，样本数据中还设有标注信息，以方便进行训练。

在本实施例中，每种数据类型预设有多个可选的神经网络算法，在识别用户输入的样本数据的数据类型后，从预设神经网络算法中选择一个或多个即可，选择算法的数目可以设定。

在本实施例中，上述方法步骤都是通过云计算完成的，通过在云计算平台下以云的形式存在的大量计算机组成的各种机器学习云，是云计算平台默认自带了各种机器学习算法，另一方面，可以由计算机群组成的初始建模云、搜索空间概估云、方法发现云、EM(Expectation Maximization Algorithm，最大期望算法)算法支撑云、评估函数云、计算云、机器学习算法扩充云，从而体现出云的优势，由大量的计算资源计算出普通用户难以或需要长时间计算出的机器学习使用的合适的参数，同时又包括与用户进行交互的Web交互界面，机器学习输入输出模块及云管理模块，用以支撑云计算平台的运行。使机器学习的使用摆脱了环境的束缚，充分发挥了云计算平台高效的计算能力和透明性，最大程度的降低了机器学习的使用门槛，使得用户无需从众多机器学习方法中通过反复实验寻找合适的机器学习方法，解决了在实际应用机器学习时，建模选择的难以预测性、参数调整的人工经验性、普通用户学习困难等缺点。

在上述实施例的基础上，上述样本数据的数据类型包括文本、文档、图像、声音、时间序列。

在本实施例中，为了满足用户的不同需求，支持不同数据类型样本数据的训练，共支持五种数据类型的样本数据，具体为文本、文档、图像、声音和时间序列，其中文本输入为词向量，需要进行高斯修正变换，文档的输入为词频概率或TF-IDF(term frequency–inverse document frequency，信息检索数据挖掘的常用加权技术)，可转为二进制输入模型，图像输入为二进制或N/A，为N/A时需要进行高斯修正变换，声音、时间序列都为N/A，需要进行高斯修正变换。

在上述各实施例的基础上，基于所述样本数据的数据类型从预设算法中选择一种神经网络训练算法，具体包括：

若所述样本数据的数据类型为文本，则选择拟牛顿算法；

若所述样本数据的数据类型为文档，则选择牛顿算法；

若所述样本数据的数据类型为图像，则选择Levenberg-Marquardt算法；

若所述样本数据的数据类型为声音，则共轭梯度算法；

若所述样本数据的数据类型为时间序列，则选择梯度下降算法。

在上述各实施例的基础上，并基于所述用户需解决问题选择一种神经网络模型，具体包括：

若上述样本数据的数据类型为文本，则选择递归神经张量网络(RecursiveNeural Tensor Network，RNTN)、深度信念网络(Deep Belief Network，DBN)、堆叠式降噪自动编码器和/或深度自动编码器；其中，若用户需解决问题为情感分析则选择递归神经张量网络RNTN模型，若用户需解决问题为命名实体识别则选择深度信念网络DBN模型，若用户需解决问题为词性标注则选择堆叠式降噪自动编码器，若用户需解决问题为语义角色标记则选择深度自动编码器；

若上述样本数据的数据类型为文档，则选择深度自动编码器、深度信念网络和/或堆叠式降噪自动编码器；具体的，上述深度自动编码器包括一个DBN或堆叠式降噪自动编码器(Stacked Denoising Autoencoders，SDA)；在本实施例中，若用户需解决问题为主题建模则选择深度自动编码器，若用户需解决问题为文档分类则选择深度信念网络模型或堆叠式降噪自动编码器，择一即可；

若上述样本数据的数据类型为图像，则选择深度信念网络、卷积神经网络(Convolutional Neural Network，CNN)、递归神经张量网络RNTN和/或深度自动编码器；在本实施例中，若用户需解决问题为图像识别则选择深度信念网络模型，若用户需解决问题为多对象识别则选择卷积神经网络CNN模型或递归神经张量网络RNTN模型，若用户需解决问题为图像搜索则选择深度自动编码器；

若上述样本数据的数据类型为声音，则选择卷积神经网络CNN、深度信念网络DBN和/或循环神经网络(Recurrent Neural Network，RNN)；语音识别则随机选取一个，选择深度信念网络DBN模型或循环神经网络RNN模型。

若上述样本数据的数据类型为时间序列，则选择卷积神经网络CNN、深度信念网络DBN和/或循环神经网络RNN。时间序列则随机选取一个，随机选择卷积神经网络CNN模型、深度信念网络DBN模型或循环神经网络RNN模型。

具体的，深度信念网络本质上是一种具有生成能力的图形表示网络，即它生成当前示例的所有可能值，由诸如波尔兹曼机(Restricted Boltzmann Machine，RBM)堆叠而成，每个子网络的不可见层是下一层的可见层，隐藏层或不可见的层并不是相互连接，而是有条件互相独立的，其在文字检测、文本建模分类、图像、语音、时间序列分析等方面有非常重要的应用。

在上述各实施例的基础上，对所述神经网络模型进行自动训练前，还包括：

基于所述神经网络模型的输入格式，对所述样本数据进行格式转换，使样本数据的格式与所述神经网络模型的输入格式统一，并依次进行缺失值处理、噪声数据处理、数据清理、数据集成、数据变换和数据归约处理。

在上述各实施例的基础上，获取用户输入的样本数据和标注信息后，还包括：

将上述样本数据和标注信息进行加密并存储至云端。

在本实施例中，若用户需要对其训练样本进行保密，则可在输入样本数据及标注信息时，选择对样本数据、标注信息进行保密操作，则云端将样本数据和标注信息加密后，再存储至云端。

在上述各实施例的基础上，基于所述神经网络算法对所述样本数据进行自动训练，得到目标神经网络模型后，还包括：

从所述样本数据中随机抽取部分数据作为测试集，将所述测试集分别输入到所述目标神经网络模型中，对所述目标神经网络模型进行验证。

在本实施例中，由于在训练、测试过程中，需要将样本数据转换为与神经网络模型的输入数据相同的数据类型，因为本实施例中，将每个数据类型下的各神经网络模型的输入格式统一，在接收样本数据后，将样本数据的格式统一化、数据化后，在依次进行缺失值处理、噪声数据处理、数据清理、数据集成、数据变换和数据归约处理。

本实施例还提供了一种基于云平台和预设模型的神经网络自动训练装置，基于上述各实施例的方法，如图2所示，包括算法选择云平台30、模型选择云平台40和模型训练云平台50，其中：

算法选择云平台30获取用户输入的样本数据及辅助信息，基于所述样本数据的数据类型从预设算法中选择一种神经网络训练算法；

模型选择云平台40所述辅助信息确定用户需解决问题，并基于预设的用户需解决问题与神经网络模型的对应关系，调用相应的神经网络模型；

模型训练云平台50基于所述样本数据和所述神经网络训练算法，对所述神经网络模型进行自动训练，得到目标神经网络模型。

图3为本发明实施例提供的电子设备的实体结构示意图，如图3所示，该电子设备可以包括：处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840，其中，处理器810，通信接口820，存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储在存储器830上并可在处理器810上运行的计算机程序，以执行上述各实施例提供的基于云平台和预设模型的神经网络自动训练方法，例如包括：

此外，上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各实施例提供的基于云平台和预设模型的神经网络自动训练方法，例如包括：

本发明实施例还提供本实施例公开一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行如上述的基于云平台和预设模型的神经网络自动训练方法，例如包括：

综上所述，本发明实施例提供的一种基于云平台和预设模型的神经网络自动训练方法和装置，通过在云计算平台下以云的形式存在的大量计算机组成的各种机器学习云，是云计算平台默认自带了各种神经网络训练算法，通过根据用户输入的样本数据数据类型选择神经网络训练算法，并基于预设的用户需解决问题与神经网络模型的对应关系，调用相应的神经网络模型，以对所述样本数据进行自动训练，解决了机器学习建模不便的问题，提供了一种结合云计算技和机器学习技术处理现实问题提供了方便快捷的方法。从而使用户无需为繁琐的细节而烦恼，能够更加专注于自己的业务，有利于创新和降低成本。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于云平台和预设模型的神经网络自动训练方法，其特征在于，包括：

2.根据权利要求1所述的基于云平台和预设模型的神经网络自动训练方法，其特征在于，所述样本数据的数据类型包括文本、文档、图像、声音、时间序列。

3.根据权利要求2所述的基于云平台和预设模型的神经网络自动训练方法，其特征在于，基于所述样本数据的数据类型从预设算法中选择一种神经网络训练算法，具体包括：

若所述样本数据的数据类型为文本，则选择拟牛顿算法；

若所述样本数据的数据类型为文档，则选择牛顿算法；

若所述样本数据的数据类型为声音，则共轭梯度算法；

4.根据权利要求2所述的基于云平台和预设模型的神经网络自动训练方法，其特征在于，并基于所述用户需解决问题选择一种神经网络模型，具体包括：

当所述样本数据的数据类型为文本时，若用户需解决问题为情感分析则选择递归神经张量网络RNTN模型，若用户需解决问题为命名实体识别则选择深度信念网络DBN模型，若用户需解决问题为词性标注则选择堆叠式降噪自动编码器，若用户需解决问题为语义角色标记则选择深度自动编码器；

当所述样本数据的数据类型为文档时，若用户需解决问题为主题建模则选择深度自动编码器，若用户需解决问题为文档分类则选择深度信念网络模型或堆叠式降噪自动编码器；

当所述样本数据的数据类型为图像时，若用户需解决问题为图像识别则选择深度信念网络模型，若用户需解决问题为多对象识别则选择卷积神经网络CNN模型或递归神经张量网络RNTN模型，若用户需解决问题为图像搜索则选择深度自动编码器；

当所述样本数据的数据类型为声音时，则随机选择深度信念网络DBN模型或循环神经网络RNN模型；

当所述样本数据的数据类型为时间序列时，则随机选择卷积神经网络CNN模型、深度信念网络DBN模型或循环神经网络RNN模型。

5.根据权利要求1所述的基于云平台和预设模型的神经网络自动训练方法，其特征在于，对所述神经网络模型进行自动训练前，还包括：

6.根据权利要求1所述的基于云平台和预设模型的神经网络自动训练方法，其特征在于，获取用户输入的样本数据和标注信息后，还包括：

将所述样本数据和标注信息进行加密并存储至云端。

7.根据权利要求1所述的基于云平台和预设模型的神经网络自动训练方法，其特征在于，基于所述神经网络算法对所述样本数据进行自动训练，得到目标神经网络模型后，还包括：

8.一种基于云平台和预设模型的神经网络自动训练装置，其特征在于，包括：

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任一项所述的方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法的步骤。