WO2017206936A1

WO2017206936A1 - 基于机器学习的网络模型构造方法及装置

Info

Publication number: WO2017206936A1
Application number: PCT/CN2017/086917
Authority: WO
Inventors: 郑博; 刘志斌; 刘日佳; 陈谦
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2016-06-02
Filing date: 2017-06-02
Publication date: 2017-12-07
Also published as: CN106096727A; KR102173555B1; EP3467723A1; US11741361B2; JP6549332B2; EP3467723B1; US20180268296A1; KR20180069877A; EP3467723A4; JP2018533153A; CN106096727B

Abstract

一种基于机器学习的网络模型构造方法及装置，其中的方法包括：获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集（S101）；按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络（S102）；采用所述参考数据集对所述至少一个子网络进行优化训练（S103）；将优化训练后的至少一个子网络进行合并处理，形成目标网络模型（S104）。上述技术方案能够简化网络模型的构造过程，提升模型构造效率。

Description

基于机器学习的网络模型构造方法及装置

本申请要求于2016年6月2日提交中国专利局、申请号为201610389530.9、发明名称为“一种基于机器学习的网络模型构造方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及互联网技术领域，尤其涉及一种基于机器学习的网络模型构造方法及装置。

背景技术

随着机器学习技术的快速发展，越来越多的领域开始使用机器学习的方法构建网络模型，并将构建的网络模型作为分析、控制、决策的工具。网络模型包括：非神经网络模型和神经网络模型。其中，神经网络(Neural Networks，NN)是由大量的处理单元(称为神经元)互相连接而形成的复杂网络系统，是一个高度复杂的非线性动力学习系统。神经网络的基础在于神经元，神经网络模型由神经元的网络拓扑、节点特点和学习规则来表示。

发明内容

本申请实施例提供一种基于机器学习的网络模型构造方法及装置，简化网络模型的构造过程，提升模型构造效率。

本申请实施例第一方面提供一种基于机器学习的网络模型构造方法，可包括：

获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集；

按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络；

采用所述参考数据集对所述至少一个子网络进行优化训练；

将优化训练后的至少一个子网络进行合并处理，形成目标网络模型。

所述获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集，包括：

获取原网络模型在数据处理流程中所执行的至少一个数据处理步骤；

获取所述原网络模型在执行各数据处理步骤时产生的运行数据；

分别从所述原网络模型在执行各数据处理步骤时产生的运行数据中提取部分或全部数据，组成所述参考数据集；

其中，所述参考数据集包含各数据处理步骤对应的至少一组输入/输出数据。

所述按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络，包括：

从预设的等价对应表中分别查询与各数据处理步骤相等价的子网络的网络主结构；

按照各数据处理步骤对应的至少一组输入/输出数据，确定与各数据处理步骤相等价的子网络的输入层结构和输出层结构；

根据与各数据处理步骤相等价的子网络的网络主结构、输入层结构和输出层结构构造与各数据处理步骤相等价的子网络，其中，一个子网络与一个数据处理步骤相等价。

所述采用所述参考数据集对所述至少一个子网络进行优化训练，包括：

依次从所述参考数据集中读取各数据处理步骤对应的至少一组输入/输出数据；

以各数据处理步骤对应的至少一组输入/输出数据为参考，按照神经网络训练优化算法对与各数据处理步骤相等价的子网络的参数进行优化调整，所述参数包括：网络节点、权值、训练速率中的至少一种。

所述将优化训练后的至少一个子网络进行合并，形成目标网络模型，包括：

从所述至少一个子网络中选择任一个子网络作为种子网络；

获取根据所述各数据处理步骤设置合并顺序，根据所述合并顺序从所述至少一个子网络中选取除种子网络之外的一个子网络作为合并对象网络；

将所述种子网络与所述合并对象网络之间采用全连接的方式进行合并连接；

若合并连接成功，以与所述种子网络相等价的数据处理步骤对应的至少一组输入/输出数据以及与所述合并对象网络相等价的数据处理步骤对应的至少一组输入/输出数据为参考，对合并连接的网络的参数进行优化调整；

再以合并连接得到的网络作为种子网络，迭代上述过程直至将所述至少一个子网络全部合并连接形成所述目标网络模型。

该方法还包括：

若合并连接失败，在所述种子网络与所述合并对象网络之间添加中间隐含层，通过所述中间隐含层将所述种子网络与所述合并对象网络采用全连接方式进行合并连接。

本申请实施例第二方面提供一种基于机器学习的网络模型构造装置，可包括：

获取模块，用于获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集；

分层构造模块，用于按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络；

优化训练模块，用于采用所述参考数据集对所述至少一个子网络进行优化训练；

合并模块，用于将优化训练后的至少一个子网络进行合并处理，形成目标网络模型。

所述获取模块包括：

步骤获取单元，用于获取原网络模型在数据处理流程中所执行的至少一个数据处理步骤；

数据获取单元，用于获取所述原网络模型在执行各数据处理步骤时产生的运行数据；

抽样提取单元，用于分别从所述原网络模型在执行各数据处理步骤时产生的运行数据中提取部分或全部数据，组成参考数据集；

所述分层构造模块包括：

查询单元，用于从预设的等价对应表中分别查询与各数据处理步骤相等价的子网络的网络主结构；

确定单元，用于按照各数据处理步骤对应的至少一组输入/输出数据，确定与各数据处理步骤相等价的子网络的输入层结构和输出层结构；

构造单元，用于根据与各数据处理步骤相等价的子网络的网络主结构、输入层结构和输出层结构构造与各数据处理步骤相等价的子网络，其中，一个子网络与一个数据处理步骤相等价。

所述优化训练模块包括：

读取单元，用于依次从所述参考数据集中读取各数据处理步骤对应的至少一组输入/输出数据；

调整单元，用于以各数据处理步骤对应的至少一组输入/输出数据为参考，按照神经网络训练优化算法对与各数据处理步骤相等价的子网络的参数进行优化调整，所述参数包括：网络节点、权值、训练速率中的至少一种。

所述合并模块包括：

种子选择单元，用于从所述至少一个子网络中选择任一个子网络作为种子网络；

合并对象选取单元，用于获取根据所述各数据处理步骤设置合并顺序，根据所述合并顺序从所述至少一个子网络中选取除种子网络之外的一个子网络作为合并对象网络；

拆除单元，用于拆除所述种子网络与所述合并对象网络之间的输入层和输出层；

合并连接单元，用于将所述种子网络与所述合并对象网络之间采用全连接的方式进行合并连接；

优化调整单元，用于若合并连接成功，以与所述种子网络相等价的数据处理步骤对应的至少一组输入/输出数据以及与所述合并对象网络相等价的数据处理步骤对应的至少一组输入/输出数据为参考，对合并连接的网络的参数进行优化调整；

所述种子选择单元还用于将合并连接的网络作为种子网络，迭代由所述合并对象选取单元、所述拆除单元、所述合并连接单元和所述优化调整单元执行相应处理直到将所述至少一个子网络全部合并连接形成目标网络模型。

所述合并模块还包括：

添加单元，用于若合并连接失败，在所述种子网络与所述合并对象网络之间添加中间隐含层，以使得所述合并连接单元通过所述中间隐含层将所述种子网络与所述合并对象网络采用全连接方式进行合并连接。

本申请实施例中，通过分析原网络模型的数据处理流程，以原网络模型在所述数据处理流程中产生的实际运行数据为参考数据集，分层构造至少一个等价的子网络，并且对至少一个子网络进行优化训练，最后合并形成目标网络模型；由于采用原网络模型的实际运行数据灵活快速地构造目标网络模型的各个层次，再将各个层次进行合并即可形成目标网络模型，而不再需要从零开始构想目标网络模型的整体结构，简化了模型构造过程，有效地提升了模型构造效率；对于目标网络模型的优化调整采用分而治之的方式，分别对各个子网络进行优化调整再合并，这使得目标网络模型的优化调整过程更为灵活，进一步提升模型构造效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种基于机器学习的网络模型构造方法的流程图；

图2为本申请实施例提供的另一种基于机器学习的网络模型构造方法的流程图；

图2A为本申请实施例中原网络模型的示意图；

图3a为本申请实施例提供的与原网络模型中的数据处理步骤a1相等价的子网络b1的构造过程和优化训练过程的示意图；

图3b为本申请实施例提供的子网络b1和b2的合并过程和对合并连接的网络的优化训练过程的一个示意图；

图3c为本申请实施例提供的子网络b1和b2的合并过程和对合并连接的网络的优化训练过程的另一个示意图；

图4为本申请实施例提供的一种基于机器学习的网络模型构造装置的结构示意图；

图5为本发明实施提供的一种基于机器学习的网络模型构造装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在本申请一实施例中，在对一网络模型进行机器学习以构建神经网络模型的过程中，需要对现有网络模型的数据进行标注形成训练集，再从零开始构建神经网络模型。由于训练神经网络的过程需要大量地手动标注数据以生成作为训练集的标注数据，此过程需要大量人机交互，需要消耗大量设备资源。此外，从零开始构造神经网络模型需要对所构造的网络模型整体进行复杂的参数调整，因此工作量大，模型构造效率低。

网络模型包括：非神经网络模型和神经网络模型。其中，神经网络是由大量的处理单元(在神经网络中被称为神经元)互相连接而形成的复杂网络系统，是一个高度复杂的非线性动力学习系统。神经元是构成神经网络的基本单元。神经网络模型由神经元的网络拓扑、节点特点和学习规则来表示。与非神经网络模型相比，神经网络模型具有更强的深度学习能力以及更好的环境适应能力。

本申请实施例提供了一种基于机器学习的网络模型构造方法及装置，能够通过分析原网络模型的数据处理流程，以原网络模型在所述数据处理流程中产生的实际运行数据为参考数据集，分层构造至少一个等价的子网络，并且对至少一个子网络进行优化训练，最后合并形成目标网络模型。通过此机器学习过程构建目标网络模型，可以获得如下有益效果：

(1)性能可靠性高。由于目标网络模型是经过对与原网络模型的数据处理流程相等价的至少一个子网络联合优化调整得到的，与原网络模型相比，目标网络模型不再需要考虑各个数据处理步骤之间的磨合与适应问题；并且联合优化过程是以原网络模型的实际运行数据为基准，从而可以保证目标网络模型的处理性能的可靠性。

(2)调整灵活度高。由于目标网络模型是通过训练原网络模型的实际运行数据驱动改变的，因此若需要调整目标网络模型，仅需调整训练过程涉及的参数，而不需要考虑目标网络模型各个层级结构之间的参数适配问题，调整灵活度较高；并且若原网络模型出现或产生新的运行数据，可以直接利用新的运行数据对目标网络模型进行调整，不需要过多的人工干预，从而节省了人力成本，减轻模型构造的工作量。

(3)构造过程简单。由于不需要从零开始构建目标网络模型，这就避免复杂的网络结构调整过程，并且不需要人工冗杂的经验作为参考，大大节省了模型构造时间，提升构造效率。

(4)对数据的利用更加充分。目标网络模型是由至少一个子网络联合优化而形成的深度网络，性能可靠性高，相对于原网络模型，其能够对参数不断迭代以最大程度地利用数据的价值，实现更好的性能优化。

(5)具有可解释性。目标网络模型是通过机器学习的方法将原网络模型进行等价替换而成，在此过程利用了原网络模型在数据处理流程中产生的实际运行数据，而并未添加人工理解或认知的标注数据，这能够在一定程度上将原网络模型的解释性要素继承下来，更适用于对于解释性要求较高的场景。

需要说明的是，原网络模型可以是非神经网络模型或神经网络模型，目标网络模型可以是神经网络模型。除特别说明外，本申请后续实施例中，原网络模型以非神经网络模型为例进行说明，而目标网络模型以神经网络模型进行说明。

基于上述描述，本申请实施例公开了一种基于机器学习的网络模型构造方法，请参见图1，该方法可包括以下步骤S101-步骤S104：

S101，获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集。

原网络模型作为一种分析、控制、决策的工具，在运行过程中会执行一系列的数据处理步骤而形成一套完整的数据处理流程。此处的数据处理步骤可以包括但不限于以下至少一种：

①单一机器学习的步骤。此步骤基于分类算法、聚类算法、成分分析算法、降维映射算法、编码器方法而实现，其中，分类算法可包括但不限于：支持向量机(Support Vector Machine，SVM)、决策树、阈值分类器、逻辑回归、浅层神经网络、迭代决策树(Gradient Boost Decision Tree，GBDT)、一种提高弱分类算法准确度的方法(Boosting)方法、最邻近结点算法(k-Nearest Neighbor，KNN)、贝叶斯分类器、随机森林方法及其可能的变种方法。聚类算法可包括但不限于：基于划分的聚类方法(Kmeans)、K中心、MeanShift、谱聚类、基于密度的聚类算法(Density-Based Spatial Clustering of Applications with Noise，DBSCAN)、相似传播方法。成分分析算法可包括但不限于：主成分分析(Principal Component Analysis，PCA)、典范对应分析(Canonical Correspondence Analysis，CCA)、因子分析、傅里叶变换、小波分析。降维映射算法可包括但不限于：混合判别分析(Mixture Discriminant Analysis， MDA)、Fisher投影、lsoMap(一种全局优化算法)。编码器方法可包括但不限于：线性判别式分析(Linear Discriminant Analysis，LDA)、概率潜在语义分析(Probability Latent Semantic Analysis，PLSA)、隐含语义分析(Latent Semantic Analysis，LSA)、稀疏编码(Sparse Coding)。

②数据统计的步骤。此步骤可基于数据统计算法实现，该数据统计算法可包括但不限于：求和、求平均、求分位数、求最值、求中心统计矩、求卡方统计量等。

③序列分析的步骤。此步骤可基于序列分析算法实现，该序列分析算法可包括但不限于：自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model，ARIMA)回归、Karman滤波等。

④函数处理的步骤。此处的函数可包括但不限于：线性映射函数、包含信息熵的变换函数、解析函数、超越函数等。

⑤对数据的编辑处理步骤。此步骤可以包括但不限于：数据合并、对数据的筛选、数据分离、数据变换等。

本步骤S101中，可以分析记录原网络模型运行的数据处理流程所涉及的至少一个数据处理步骤。并且，原网络模型在执行上述的各数据处理步骤时会产生运行数据，此处的运行数据可以包括但不限于：原网络模型在实际运行过程中使用的输入数据、中间数据和获得的输出数据；或者，原网络模型在训练或测试过程中所使用的带标注的输入数据、中间数据和输出数据；或者，由人工针对原网络模型注入的模拟输入数据、中间数据及获得的输出数据。那么，本步骤从各数据处理步骤的运行数据中提炼部分或全部的运行数据作为参考数据集。

S102，按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络。

所述数据处理流程记载了原网络模型所执行的至少一个数据处理步骤，所述参考数据集包含各数据处理步骤对应的至少一组输入/输出数据。分层构造的思想在于：原网络模型的每一个数据处理步骤可以由一个具备等价功能的子网络来执行，那么，一个数据处理步骤可对应一个子网络的网络主结构；与此同时，该子网络的输入/输出层则可以由该数据处理步骤的输入/输出数据来确定。因此，本步骤中，按照原网络模型的数据处理流程以及提炼到的参考数据集，可以分层构造至少一个子网络，例如：假设原网络模型的数据处理流程表示为“步骤a1-步骤a2-步骤a3-步骤a4”共四个数据处理步骤，那么，步骤a1与第一层次的子网络b1相等价，该子网络b1的主网络结构由步骤a1确定，该子网络b1的输入层和输出层由从步骤a1提炼出输入/输出数据确定；同理，步骤a2与第二层次的子网络b2相等价，该子网络b2的主网络结构由步骤a2确定，该子网络b2的输入层和输出层由从步骤a2提炼出输入/输出数据确定；以此类推，步骤a4与第四层次的子网络b4相等价，该子网络b4的主网络结构由步骤a4确定，该子网络b4的输入层和输出层由从步骤a4提炼出输入/输出数据确定。按照此实例进一步可知，目标网络模型是由子网络b1、子网络b2、子网络b3和子网络b4按层次联接而成。

S103，采用所述参考数据集对所述至少一个子网络进行优化训练。

优化训练的目的在于：以所述参考数据集中的数据作为参考基准，不断调整至少一个子网络的参数，使得子网络的性能指标达到与原网络模型中对应的数据处理步骤的性能指标相同或更高水平。此处，子网络的参数可包括：网络节点、权值、训练速率中的至少一种。具体实现中，从每个数据处理步骤提炼的至少一组输入/输出数据被用来对该数据处理步骤相等价的子网络进行优化训练，按照步骤S102中的例子，参考数据集中步骤a1对应的至少一组输入/输出数据用于对子网络b1进行优化训练，步骤a2对应的至少一组输入/输出数据用于对子网络b2进行优化训练，以此类推，步骤a4对应的至少一组输入/输出数据用于对子网络b4进行优化训练。

S104，将优化训练后的至少一个子网络进行合并，形成目标网络模型。

本步骤需要迭代将优化训练后的至少一个子网络不断合并，在合并过程中，还需要对不断合并形成的网络进行联合优化，最终形成完整的目标网络模型；通过迭代合并和联合优化的过程形成的目标网络模型是一个深度网络，性能可靠性较高。

本申请实施例的基于机器学习的网络模型构造方法，通过分析原网络模型的数据处理流程，以原网络模型在所述数据处理流程中产生的实际运行数据为参考数据集，分层构造至少一个等价的子网络，并且对至少一个子网络进行优化训练，最后合并形成目标网络模型；由于采用原网络模型的实际运行数据灵活快速地构造目标网络模型的各个层次，再将各个层次进行合并即可形成目标网络模型，而不再需要从零开始构想目标网络模型的整体结构，简化了模型构造过程，有效地提升了模型构造效率；对于目标网络模型的优化调整采用分而治之的方式，分别对各个子网络进行优化调整再合并，这使得目标网络模型的优化调整过程更为灵活，进一步提升模型构造效率。

本申请实施例公开了另一种基于机器学习的网络模型构造方法，请参见图2，该方法可包括以下步骤S201-步骤S204：

S201，获取原网络模型在数据处理流程中所执行的至少一个数据处理步骤。

原网络模型作为一种分析、控制、决策的工具，在运行过程中会执行一系列的数据处理步骤而形成一套完整的数据处理流程。本步骤中，可以分析记录原网络模型运行的数据处理流程所执行的至少一个数据处理步骤；例如：假设获取到原网络模型的数据处理流程所执行的“步骤a1-步骤a2-步骤a3-步骤a4”共四个数据处理步骤。

在本申请一实施例中，将待处理的数据称为原始数据，将原始数据经过一系列数据处理步骤的处理，即经过该原网络模型中各数据处理步骤的处理，最终得到输出结果，每一数据处理步骤用于完成一特定处理功能，例如，对数据进行分类、或统计等。各数据处理步骤构成上述数据处理流程。其中，该数据处理流程可以包括：一条或多条由数据处理步骤构成的子数据处理流程。将经过各子数据处理流程得到的结果称为子输出结果。在得到各子输出结果后，对该各子数据结果进行合并处理得到上述输出结果。在上述原网络模型中，将上述每一数据处理步骤称为一网络节点，将上述每一子数据处理流程称为所述原网络模型中的一子路径，每一子路径是将上述各网络节点按照上述数据处理步骤的执行顺序依次串联起来组成的单向路径。上述原网络模型是将上述各子路径进行组合处理得到的网络模型。

例如，在一构成原网络模型的数据处理流程中包含三条子数据处理流程。在第一子数据处理流程中，包括：数据的分类处理步骤对应的节点11，数据的统计处理步骤对应的节点12，数据的回归处理步骤对应的节点13。在第二子数据处理流程中，包括：数据的聚类处理步骤对应的节点21，数据的函数映射处理步骤对应的节点22。第三子数据处理流程包括：数据的成分分析处理步骤对应的节点31，数据的统计处理步骤对应的节点32，也即上述节点12，数据的回归处理步骤对应的节点33，也即上述节点13，以及数据的序列分析处理步骤对应的节点34。将原始数据经过所述第一子数据处理流程中各数据处理步骤的处理得到第一子输出结果，将原始数据经过所述第二子数据处理流程中各数据处理步骤的处理得到第二子输出结果，将原始数据经过所述第三子数据处理流程中各数据处理步骤的处理得到第三子输出结果。将得到的第一子输出结果，第二子输出结果和第三子输出结果进行数据的合并处理步骤(对应原网络模型中的节点00)的处理得到输出结果。如图2A所示，图2A为本申请实施例中原网络模型的示意图。

在本步骤S201中，可以获取构成该原网络模型的数据处理流程中的至少一个数据处理步骤，例如图2A中节点11对应的数据的分类处理步骤。

S202，获取所述原网络模型在执行各数据处理步骤时产生的运行数据。

原网络模型在各数据处理步骤时会产生运行数据，此处的运行数据可以包括但不限于：原网络模型在实际运行过程中使用的输入数据、中间数据和获得的输出数据；或者，原网络模型在训练或测试过程中所使用的带标注的输入数据、中间数据和输出数据；或者，由人工针对原网络模型注入的模拟输入数据、中间数据及获得的输出数据。本步骤则分别获取原网络模型在执行各数据处理步骤时产生的运行数据，按照S201所示例子，需要分别获取原网络模型执行步骤a1时产生的运行数据，执行步骤a2时产生的运行数据，执行步骤a3时产生的运行数据以及执行步骤a4时产生的运行数据。

例如，在本步骤中，可以获取上述各数据处理步骤被执行时产生的运行数据，例如上述节点11对应的数据的分类处理步骤被执行时产生的运行数据。

S203，分别从所述原网络模型在执行各数据处理步骤时产生的运行数据中抽样提取参考数据集。

具体实现中，按照本实施例所示例子，假设原网络模型执行步骤a1的过程中产生两组输入/输出数据，那么，本步骤可以抽样提取其中一组输入/输出数据添加至参考数据集，也可以全部提取两组输入/输出数据添加至参考数据集。以此类推，所述参考数据集包含各数据处理步骤对应的至少一组输入/输出数据。

本实施例的步骤S201-S203可以为图1所示的步骤S101的具体细化步骤。

S204，从预设的等价对应表中分别查询与各数据处理步骤相等价的子网络的网络主结构。

如前述，数据处理步骤可以包括但不限于以下至少一种：①单一机器学习的步骤；②数据统计的步骤；③序列分析的步骤；④函数处理的步骤；⑤对数据的编辑处理步骤。每一种类型的数据处理步骤均存在相等价的子网络的网络主结构，等价关系可以参见下述表一：

表一：预设的等价对应表

上述表一的右侧列中，如果存在多种网络主结构，表示任意一种网络主结构或任意组合的网络主结构对应左侧例中的数据处理步骤，例如：上述数据统计的步骤，等价的网络主结构包括汇总(pooling)层、卷积层、全连接层，那么，汇总(pooling)层、卷积层、全连接层中的任一种结构或多种结构的组合与数据统计的步骤相等价，那么，实际应用中如果一个数据处理步骤存在多个相等价的子网络的网络主结构时，可以通过实际训练效果反馈决定子网络最终的网络主结构，例如选择误差率最小的网络主结构。可以理解的是，上述表一并非穷举，如果存在其他数据处理步骤以及相等价的网络主结构，可添加至上述表一中。

在上述表一中预存了各数据处理步骤对应的等价网络主结构。例如，数据的分类处理步骤可以由全连接层和/或Maxout层的网络主结构来完成等价的处理。在本申请一实施例中，每一网络主结构可以是由至少一个神经元组成的神经子网络。在本申请一实施例中，所述神经元可以为侠义或广义的神经元。在本步骤中，按照上述等价对应表为原网络模型中的每一数据处理步骤确定一等价的子网络的网络主结构。

S205，按照各数据处理步骤对应的至少一组输入/输出数据，确定与各数据处理步骤相等价的子网络的输入层结构和输出层结构。

本步骤中，需要根据各数据处理步骤对应的输入数据，确定等价的子网络的输入层的维度；根据各数据处理步骤对应的输出数据，来确定等价的子网络的输出层的维度；也就是说，与某数据处理步骤相等价的子网络的输入层与该数据处理步骤对应的输入数据的维度相同，而与该数据处理步骤相等价的子网络的输出层与该数据处理步骤对应的输出数据的维度相同。此处的维度可以包括：数据的来源、数据的数量等。

S206，根据与各数据处理步骤相等价的子网络的网络主结构、输入层结构和输出层结构构造与各数据处理步骤相等价的子网络，其中，一个子网络与一个数据处理步骤相等价。

在本申请一实施例中，一个子网络与一个数据处理步骤相等价，是指在相同的输入下，经该子网络处理得到的处理结果和经该数据处理步骤进行处理得到的处理结果相同或相似。相似是指两个处理结果的差值小于预定阈值。

本步骤中，在子网络的网络主结构的基础上添加输入层结构和输出层结构，即可形成子网络的网络结构。本实施例的步骤S204-S206可以为图1所示的步骤S102的具体细化步骤。

S207，依次从所述参考数据集中读取各数据处理步骤对应的至少一组输入/输出数据。

S208，以各数据处理步骤对应的至少一组输入/输出数据为参考，按照神经网络训练优化算法对与各数据处理步骤相等价的子网络的参数进行优化调整，所述参数包括：网络节点、权值、训练速率中的至少一种。

所述神经网络训练优化算法可以包括但不限于以下至少一种：随机梯度下降算法、RMSProp(一种优化算法)、动量法、AdaGrad(为各个参数分配不同学习率的算法)、AdaDelta(一种优化算法)。步骤S207-S208中，从每个数据处理步骤提炼的至少一组输入/输出数据被用来对该数据处理步骤相等价的子网络进行优化训练，按照本实施例所示例子，从参考数据集中读取步骤a1对应的至少一组输入/输出数据用于对与步骤a1相等价的子网络b1进行优化训练；从参考数据集中读取步骤a2对应的至少一组输入/输出数据用于对与步骤a2相等价的子网络b2进行优化训练，以此类推，从参考数据集中读取步骤a4对应的至少一组输入/输出数据用于对步骤a4相等价的子网络b4进行优化训练。本实施例的步骤S207-S208可以为图1所示的步骤S103的具体细化步骤。

上述步骤S204-S208可请一并参见图3a，图3a示出了与原网络模型中的数据处理步骤a1相等价的子网络b1的构造过程和优化训练过程的示意图。

S209，从所述至少一个子网络中选择任一个子网络作为种子网络。

S210，按照预置的合并顺序从所述至少一个子网络中选取除种子网络之外的一个子网络作为合并对象网络。该合并顺序可以是根据各数据处理步骤设置的。所述预置的合并顺序包括以下任一种：所述至少一个数据处理步骤的先后执行顺序，所述至少一个数据处理步骤的后先执行顺序，所述至少一个子网络之间的结构相似度的高低顺序。

步骤S209-S210中，按照本实施例所示例子，原网络模型执行“步骤a1-步骤a2-步骤a3-步骤a4”四个数据处理步骤，相等价的子网络分别为：子网络b1、子网络b2、子网络b3和子网络b4。假设选择子网络b2为种子网络，那么：1)按照所述至少一个数据处理步骤的先后执行顺序，应当选取与步骤a3相等价的子网络b3作为合并对象网络；2)如果按照至少一个数据处理步骤的先后执行顺序相反的顺序进行选择，应当选取与步骤a1相等价的子网络b1作为合并对象网络；3)如果按照至少一个子网络之间的结构相似度的高低顺序，应当选择与子网络b2的结构相似度最高的子网络作为合并对象网络，假设子网络b2与子网络b4的网络主结构均为全连接层结构，那么，选择子网络b4作为合并对象网络。

S211，拆除所述种子网络与所述合并对象网络之间的输入层和输出层。

按照图3a所示的子网络的网络结构，本步骤需要拆除子网络的输入层，同时拆除子网络的输出层。如果种子网络作为上层子网络，合并对象网络作为下层子网络，那么需要拆除种子网络的输入层，同时拆除合并对象网络的输出层；如果种子网络作为下层子网络，合并对象网络作为上层子网络，那么需要拆除种子网络的输出层，同时拆除合并对象网络的输入层。

S212，将所述种子网络与所述合并对象网络之间采用全连接的方式进行合并连接。若合并连接成功，转入步骤S214；若合并失败，转入步骤S213。

全连接的方式是指对于前置数据A和目标数据B，令B＝W×A，其中W为权值矩阵，×表示矩阵乘法。在本步骤中，令种子网络为A，合并对象网络为B，通过设置的权值矩阵W的映射，将种子网络中作为输出的每一个神经元映射到合并对象网络中作为输入的一个神经元，即建立种子网络中每一个作为输出的神经元和合并对象网络中作为输入的一个神经元之间的映射关系。例如在图3b中，通过全连接方式，利用一个权值矩阵建立子网络b1的每一神经元和子网络b2的各神经元之间的映射关系，以建立其连接。

S213，在所述种子网络与所述合并对象网络之间添加中间隐含层，通过所述中间隐含层将所述种子网络与所述合并对象网络采用全连接方式进行合并连接。

S214，以与所述种子网络相等价的数据处理步骤对应的至少一组输入/输出数据以及与所述合并对象网络相等价的数据处理步骤对应的至少一组输入/输出数据为参考，对合并连接得到的网络的参数进行优化调整。

在本申请一实施例中，该种子网络和合并对象网络均可以为子神经网络，可以利用本步骤中确定出的输入/输出数据对该子神经网络进行优化调整。

由于合并连接的网络的输入层为下层子网络的输入层，合并连接的网络的输出层为上层子网络的输出层，那么，本步骤需要以上层子网络相等价的数据处理步骤对应的输出数据为参考，同时以下层子网络相等价的数据处理步骤对应的输入数据为参考，对合并连接的网络的参数进行优化调整。

S215，以合并连接的网络作为种子网络，迭代上述步骤S210-S214的过程直至将所述至少一个子网络全部合并连接形成目标网络模型。

在本申请一实施例中，可以重复执行上述步骤S210-S214，按照预定的合并顺序，例如按照每一子数据处理流程中各数据处理步骤的执行顺序，对每一子数据处理流程中各数据处理步骤对应的子网络依次进行合并处理得到合并后的子网络。例如，对上述第一子数据处理流程中的各数据处理步骤对应的子网络进行合并处理得到合并后的第一子神经网络。同理，对上述第二子数据处理流程中的各数据处理步骤对应的子网络进行合并处理得到合并后的第二子神经网络，对上述第三子数据处理流程中的各数据处理步骤对应的子网络进行合并处理得到合并后的第三子神经网络。对该合并后的第一子神经网络、合并后的第二子神经网络和合并后的第三子神经网络按照预定的合并顺序执行上述节点00对应的合并处理，得到目标网络模型，例如神经网络模型。

本实施例的步骤S209-S215可以为图1所示的步骤S104的具体细化步骤。上述步骤S209-S215可请一并参见图3b和图3c，图3b和图3c分别示出了子网络b1和b2的合并过程和对合并连接的网络的优化训练过程的示意图。

在本申请一实施例中，该中间隐含层的作用是将前一子网络的输出适配到后一子网络的输入。例如，在图3b中，如果子网络b1的输出的格式与子网络b2的输入的格式不匹配，通过该中间隐含层的处理，可以对子网络b1的输出进行调整，使调整后的子网络b1的输出的形式符合子网络b2的输入的形式。

本申请实施例还公开了一种基于机器学习的网络模型构造装置，请参见图4，该装置可运行如下单元：

获取模块101，用于获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集。

分层构造模块102，用于按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络。

优化训练模块103，用于采用所述参考数据集对所述至少一个子网络进行优化训练。

合并模块104，用于将优化训练后的至少一个子网络进行合并，形成目标网络模型。

具体实现中，该装置在运行所述获取模块101的过程中，具体运行如下单元：

步骤获取单元1001，用于获取原网络模型在数据处理流程中所执行的至少一个数据处理步骤。

数据获取单元1002，用于获取所述原网络模型在执行各数据处理步骤时产生的运行数据。

抽样提取单元1003，用于分别从所述原网络模型在执行各数据处理步骤时产生的运行数据中抽样提取参考数据集；其中，所述参考数据集包含各数据处理步骤对应的至少一组输入/输出数据。

具体实现中，该装置在运行所述分层构造模块102的过程中，具体运行如下单元：

查询单元2001，用于从预设的等价对应表中分别查询与各数据处理步骤相等价的子网络的网络主结构。

确定单元2002，用于按照各数据处理步骤对应的至少一组输入/输出数据，确定与各数据处理步骤相等价的子网络的输入层结构和输出层结构。

构造单元2003，用于根据与各数据处理步骤相等价的子网络的网络主结构、输入层结构和输出层结构构造与各数据处理步骤相等价的子网络，其中，一个子网络与一个数据处理步骤相等价。

具体实现中，该装置在运行所述优化训练模块103的过程中，具体运行如下单元：

读取单元3001，用于依次从所述参考数据集中读取各数据处理步骤对应的至少一组输入/输出数据。

调整单元3002，用于以各数据处理步骤对应的至少一组输入/输出数据为参考，按照神经网络训练优化算法对与各数据处理步骤相等价的子网络的参数进行优化调整，所述参数包括：网络节点、权值、训练速率中的至少一种。

具体实现中，该装置在运行所述合并模块104的过程中，具体运行如下单元：

种子选择单元4001，用于从所述至少一个子网络中选择任一个子网络作为种子网络。

合并对象选取单元4002，用于按照预置的合并顺序从所述至少一个子网络中选取除种子网络之外的一个子网络作为合并对象网络，所述预置的合并顺序包括以下任一种：所述至少一个数据处理步骤的先后执行顺序，所述至少一个数据处理步骤的后先执行顺序，所述至少一个子网络之间的结构相似度的高低顺序。

拆除单元4003，用于拆除所述种子网络与所述合并对象网络之间的输入层和输出层。

合并连接单元4004，用于将所述种子网络与所述合并对象网络之间采用全连接的方式进行合并连接。

优化调整单元4005，用于若合并连接成功，以与所述种子网络相等价的数据处理步骤对应的至少一组输入/输出数据以及与所述合并对象网络相等价的数据处理步骤对应的至少一组输入/输出数据为参考，对合并连接的网络的参数进行优化调整。

所述种子选择单元4001还用于将合并连接的网络作为种子网络，迭代由所述合并对象选取单元4002、所述拆除单元4003、所述合并连接单元4004和所述优化调整单元4005执行相应处理直到将所述至少一个子网络全部合并连接形成目标网络模型。

该装置在运行所述合并模块104的过程中，还运行如下单元：

添加单元4006，用于若合并连接失败，在所述种子网络与所述合并对象网络之间添加中间隐含层，以使得所述合并连接单元4004通过所述中间隐含层将所述种子网络与所述合并对象网络采用全连接方式进行合并连接。

由于图4所示的装置可用于执行图1-图3实施例所示方法的各步骤，因此，图4所示装置的各单元的功能可参见图1-图3所示各步骤的描述，在此不赘述。

与方法同理，本申请实施例的基于机器学习的网络模型构造装置，通过分析原网络模型的数据处理流程，以原网络模型在所述数据处理流程中产生的实际运行数据为参考数据集，分层构造至少一个等价的子网络，并且对至少一个子网络进行优化训练，最后合并形成目标网络模型；由于采用原网络模型的实际运行数据灵活快速地构造目标网络模型的各个层次，再将各个层次进行合并即可形成目标网络模型，而不再需要从零开始构想目标网络模型的整体结构，简化了模型构造过程，有效地提升了模型构造效率；对于目标网络模型的优化调整采用分而治之的方式，分别对各个子网络进行优化调整再合并，这使得目标网络模型的优化调整过程更为灵活，进一步提升模型构造效率。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

图5为本申请实施提供的一种基于机器学习的网络模型构造装置的结构示意图。如图5所示，该网络模型构造装置50可包括：处理器501、非易失性计算机可读存储器502、显示单元503、网络通信接口504。这些组件通过总线505进行通信。

本实施例中，存储器502中存储有多个程序模块，包括：应用程序506、网络通信模块507和操作系统508。

处理器501可以读取存储器502中的应用程序所包括的各种模块(图中未示出)来执行网络模型构造装置的各种功能应用以及数据处理。本实施例中的处理器501可以为一个，也可以为多个，其可以为CPU，处理单元/模块，ASIC，逻辑模块或可编程门阵列等。

其中，操作系统508可以为：Windows操作系统、Linux操作系统或Android操作系统。该操作系统508可以包括网络模型构造模块509。该网络模型构造模块509可包括图4所示装置中的各个功能模块形成的计算机可执行指令集509-1及对应的元数据及启发式算法509-2。这些计算机可执行指令集可以由所述处理器501执行并完成图1或图2所示方法或图4所示装置的功能。

应用程序506可包括：安装和运行在终端设备上的应用程序。

在本实施例中，网络通信接口504与网络通信模块507相配合完成网络模型构造装置50的各种网络信号的收发。

显示单元503具有一显示面板，用于完成相关信息的输入及显示。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。所述各实施例的功能模块可以位于一个终端或网络节点，或者也可以分布到多个终端或网络节点上。

因此本申请还提供了一种存储介质，其中存储有计算机可读指令，被至少一个处理器执行用于执行本申请上述方法的任何一种实施例。

以上所揭露的仅为本申请较佳实施例而已，当然不能以此来限定本申请之权利范围，因此依本申请权利要求所作的等同变化，仍属本申请所涵盖的范围。

Claims

一种基于机器学习的网络模型构造方法，其特征在于，包括：

获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集；

按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络；

采用所述参考数据集对所述至少一个子网络进行优化训练；

将优化训练后的至少一个子网络进行合并处理，形成目标网络模型。
如权利要求1所述的方法，其特征在于，所述获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集，包括：

获取原网络模型在数据处理流程中所执行的至少一个数据处理步骤；

获取所述原网络模型在执行各数据处理步骤时产生的运行数据；

分别从所述原网络模型在执行各数据处理步骤时产生的运行数据中提取部分或全部数据，组成所述参考数据集；

其中，所述参考数据集包含各数据处理步骤对应的至少一组输入/输出数据。
如权利要求2所述的方法，其特征在于，所述按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络，包括：

从预设的等价对应表中分别查询与各数据处理步骤相等价的子网络的网络主结构；

按照各数据处理步骤对应的至少一组输入/输出数据，确定与各数据处理步骤相等价的子网络的输入层结构和输出层结构；

根据与各数据处理步骤相等价的子网络的网络主结构、输入层结构和输出层结构构造与各数据处理步骤相等价的子网络，其中，一个子网络与一个数据处理步骤相等价。
如权利要求2或3所述的方法，其特征在于，所述采用所述参考数据集对所述至少一个子网络进行优化训练，包括：

依次从所述参考数据集中读取各数据处理步骤对应的至少一组输入/输出数据；

以各数据处理步骤对应的至少一组输入/输出数据为参考，按照神经网络训练优化算法对与各数据处理步骤相等价的子网络的参数进行优化调整，所述参数包括：网络节点、权值、训练速率中的至少一种。
如权利要求4所述的方法，其特征在于，所述将优化训练后的至少一个子网络进行合并，形成目标网络模型，包括：

从所述至少一个子网络中选择任一个子网络作为种子网络；

获取根据所述各数据处理步骤设置合并顺序，根据所述合并顺序从所述至少一个子网络中选取除种子网络之外的一个子网络作为合并对象网络；

拆除所述种子网络与所述合并对象网络之间的输入层和输出层；

将所述种子网络与所述合并对象网络之间采用全连接的方式进行合并连接；

若合并连接成功，以与所述种子网络相等价的数据处理步骤对应的至少一组输入/输出数据以及与所述合并对象网络相等价的数据处理步骤对应的至少一组输入/输出数据为参考，对合并连接的网络的参数进行优化调整；

再以合并连接得到的网络作为种子网络，迭代上述过程直至将所述至少一个子网络全部合并连接形成所述目标网络模型。
如权利要求5所述的方法，进一步包括：

若所述合并连接失败，在所述种子网络与所述合并对象网络之间添加中间隐含层，通过所述中间隐含层将所述种子网络与所述合并对象网络采用全连接方式进行合并连接。
一种基于机器学习的网络模型构造装置，其特征在于，包括：

获取模块，用于获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集；

分层构造模块，用于按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络；

优化训练模块，用于采用所述参考数据集对所述至少一个子网络进行优化训练；

合并模块，用于将优化训练后的至少一个子网络进行合并处理，形成目标网络模型。
如权利要求7所述的装置，其特征在于，所述获取模块包括：

步骤获取单元，用于获取原网络模型在数据处理流程中所执行的至少一个数据处理步骤；

数据获取单元，用于获取所述原网络模型在执行各数据处理步骤时产生的运行数据；

抽样提取单元，用于分别从所述原网络模型在执行各数据处理步骤时产生的运行数据中提取部分或全部数据，组成参考数据集；

其中，所述参考数据集包含各数据处理步骤对应的至少一组输入/输出数据。
如权利要求8所述的装置，其特征在于，所述分层构造模块包括：

查询单元，用于从预设的等价对应表中分别查询与各数据处理步骤相等价的子网络的网络主结构；

确定单元，用于按照各数据处理步骤对应的至少一组输入/输出数据，确定与各数据处理步骤相等价的子网络的输入层结构和输出层结构；

构造单元，用于根据与各数据处理步骤相等价的子网络的网络主结构、输入层结构和输出层结构构造与各数据处理步骤相等价的子网络，其中，一个子网络与一个数据处理步骤相等价。
如权利要求8或9所述的装置，其特征在于，所述优化训练模块包括：

读取单元，用于依次从所述参考数据集中读取各数据处理步骤对应的至少一组输入/输出数据；

调整单元，用于以各数据处理步骤对应的至少一组输入/输出数据为参考，按照神经网络训练优化算法对与各数据处理步骤相等价的子网络的参数进行优化调整，所述参数包括：网络节点、权值、训练速率中的至少一种。
如权利要求10所述的装置，其特征在于，所述合并模块包括：

种子选择单元，用于从所述至少一个子网络中选择任一个子网络作为种子网络；

合并对象选取单元，用于获取根据所述各数据处理步骤设置合并顺序，根据所述合并顺序从所述至少一个子网络中选取除种子网络之外的一个子网络作为合并对象网络；

拆除单元，用于拆除所述种子网络与所述合并对象网络之间的输入层和输出层；

合并连接单元，用于将所述种子网络与所述合并对象网络之间采用全连接的方式进行合并连接；

优化调整单元，用于若合并连接成功，以与所述种子网络相等价的数据处理步骤对应的至少一组输入/输出数据以及与所述合并对象网络相等价的数据处理步骤对应的至少一组输入/输出数据为参考，对合并连接的网络的参数进行优化调整；

所述种子选择单元还用于将合并连接的网络作为种子网络，迭代由所述合并对象选取单元、所述拆除单元、所述合并连接单元和所述优化调整单元执行相应处理直到将所述至少一个子网络全部合并连接形成所述目标网络模型。
如权利要求11所述的装置，其特征在于，所述合并模块还包括：

添加单元，用于若所述合并连接失败，在所述种子网络与所述合并对象网络之间添加中间隐含层，以使得所述合并连接单元通过所述中间隐含层将所述种子网络与所述合并对象网络采用全连接方式进行合并连接。
一种计算机可读存储介质，存储有计算机可读指令，被至少一个处理器执行以

执行权利要求1至6任一项所述的基于机器学习的网络模型构造方法。