CN106096727A

CN106096727A - 一种基于机器学习的网络模型构造方法及装置

Info

Publication number: CN106096727A
Application number: CN201610389530.9A
Authority: CN
Inventors: 郑博; 刘志斌; 刘日佳; 陈谦
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd; Tencent Cloud Computing Beijing Co Ltd
Priority date: 2016-06-02
Filing date: 2016-06-02
Publication date: 2016-11-09
Anticipated expiration: 2036-06-02
Also published as: EP3467723A1; US11741361B2; KR20180069877A; EP3467723A4; EP3467723B1; WO2017206936A1; CN106096727B; KR102173555B1; JP2018533153A; JP6549332B2; US20180268296A1

Abstract

本发明实施例提供一种基于机器学习的网络模型构造方法及装置，其中的方法可包括：获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集；按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络；采用所述参考数据集对所述至少一个子网络进行优化训练；将优化训练后的至少一个子网络进行合并，形成目标网络模型。本发明能够简化网络模型的构造过程，提升模型构造效率。

Description

一种基于机器学习的网络模型构造方法及装置

技术领域

本发明涉及互联网技术领域，具体涉及机器学习技术领域，尤其涉及一种基于机器学习的网络模型构造方法及装置。

背景技术

随着机器学习技术的快速发展，越来越多的领域开始使用机器学习的方法构建网络模型，以作为分析、控制、决策的工具。网络模型包括非神经网络模型和神经网络模型。其中，神经网络(Neural Networks，NN)是由大量的处理单元(称为神经元)广泛地互相连接而形成的复杂网络系统，是一个高度复杂的非线性动力学习系统；神经网络的基础在于神经元，神经网络模型由神经元的网络拓扑、节点特点和学习规则来表示。神经网络模型相对于非神经网络模型而言，通常具备更强的深度学习能力及更好的环境适应能力的优点，但同时，神经网络模型的构造过程相较于非神经网络模型的构造过程复杂许多。目前，基于对现有网络模型进行机器学习以构建神经网络模型的过程中，需要人工干预，即由人工在对现有网络模型进行认知和理解的基础上，对现有网络模型的数据进行标注形成训练集，再从零开始构建神经网络模型。由于训练神经网络的过程需要大量的标注数据作为训练集，否则会导致严重的过拟合现象，这需要耗费大量的人力、物力以及时间资源成本，并且从零开始构造神经网络模型需要对所构造的网络模型整体进行复杂的参数调整，模型构造效率较低实用性较低。

发明内容

本发明实施例提供一种基于机器学习的网络模型构造方法及装置，简化网络模型的构造过程，提升模型构造效率。

本发明实施例第一方面提供一种基于机器学习的网络模型构造方法，可包括：

获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集；

按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络；

采用所述参考数据集对所述至少一个子网络进行优化训练；

将优化训练后的至少一个子网络进行合并，形成目标网络模型。

优选地，所述获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集，包括：

获取原网络模型在数据处理流程中所执行的至少一个数据处理步骤；

获取所述原网络模型在执行各数据处理步骤时产生的运行数据；

分别从所述原网络模型在执行各数据处理步骤时产生的运行数据中抽样提取参考数据集；

其中，所述参考数据集包含各数据处理步骤对应的至少一组输入/输出数据。

优选地，所述按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络，包括：

从预设的等价对应表中分别查询与各数据处理步骤相等价的子网络的网络主结构；

按照各数据处理步骤对应的至少一组输入/输出数据，确定与各数据处理步骤相等价的子网络的输入层结构和输出层结构；

根据与各数据处理步骤相等价的子网络的网络主结构、输入层结构和输出层结构构造与各数据处理步骤相等价的子网络，其中，一个子网络与一个数据处理步骤相等价。

优选地，所述采用所述参考数据集对所述至少一个子网络进行优化训练，包括：

依次从所述参考数据集中读取各数据处理步骤对应的至少一组输入/输出数据；

以各数据处理步骤对应的至少一组输入/输出数据为参考，按照神经网络训练优化算法对与各数据处理步骤相等价的子网络的参数进行优化调整，所述参数包括：网络节点、权值、训练速率中的至少一种。

优选地，所述将优化训练后的至少一个子网络进行合并，形成目标网络模型，包括：

从所述至少一个子网络中选择任一个子网络作为种子网络；

按照预置的合并顺序从所述至少一个子网络中选取除种子网络之外的一个子网络作为合并对象网络，所述预置的合并顺序包括以下任一种：所述至少一个数据处理步骤的先后执行顺序，所述至少一个数据处理步骤的后先执行顺序，所述至少一个子网络之间的结构相似度的高低顺序；

拆除所述种子网络与所述合并对象网络之间的输入层和输出层；

将所述种子网络与所述合并对象网络之间采用全连接的方式进行合并连接；

若合并连接成功，以与所述种子网络相等价的数据处理步骤对应的至少一组输入/输出数据以及与所述合并对象网络相等价的数据处理步骤对应的至少一组输入/输出数据为参考，对合并连接的网络的参数进行优化调整；

再以合并连接的网络作为种子网络，迭代上述过程直至将所述至少一个子网络全部合并连接形成目标网络模型。

优选地，所述将所述种子网络与所述合并对象网络之间采用全连接权值的方式进行合并连接之后，还包括：

若合并连接失败，在所述种子网络与所述合并对象网络之间添加中间隐含层，通过所述中间隐含层将所述种子网络与所述合并对象网络采用全连接方式进行合并连接。

本发明实施例第二方面提供一种基于机器学习的网络模型构造装置，可包括：

获取单元，用于获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集；

分层构造单元，用于按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络；

优化训练单元，用于采用所述参考数据集对所述至少一个子网络进行优化训练；

合并单元，用于将优化训练后的至少一个子网络进行合并，形成目标网络模型。

优选地，所述获取单元包括：

步骤获取单元，用于获取原网络模型在数据处理流程中所执行的至少一个数据处理步骤；

数据获取单元，用于获取所述原网络模型在执行各数据处理步骤时产生的运行数据；

抽样提取单元，用于分别从所述原网络模型在执行各数据处理步骤时产生的运行数据中抽样提取参考数据集；

优选地，所述分层构造单元包括：

查询单元，用于从预设的等价对应表中分别查询与各数据处理步骤相等价的子网络的网络主结构；

确定单元，用于按照各数据处理步骤对应的至少一组输入/输出数据，确定与各数据处理步骤相等价的子网络的输入层结构和输出层结构；

构造单元，用于根据与各数据处理步骤相等价的子网络的网络主结构、输入层结构和输出层结构构造与各数据处理步骤相等价的子网络，其中，一个子网络与一个数据处理步骤相等价。

优选地，所述优化训练单元包括：

读取单元，用于依次从所述参考数据集中读取各数据处理步骤对应的至少一组输入/输出数据；

调整单元，用于以各数据处理步骤对应的至少一组输入/输出数据为参考，按照神经网络训练优化算法对与各数据处理步骤相等价的子网络的参数进行优化调整，所述参数包括：网络节点、权值、训练速率中的至少一种。

优选地，所述合并单元包括：

种子选择单元，用于从所述至少一个子网络中选择任一个子网络作为种子网络；

合并对象选取单元，用于按照预置的合并顺序从所述至少一个子网络中选取除种子网络之外的一个子网络作为合并对象网络，所述预置的合并顺序包括以下任一种：所述至少一个数据处理步骤的先后执行顺序，所述至少一个数据处理步骤的后先执行顺序，所述至少一个子网络之间的结构相似度的高低顺序；

拆除单元，用于拆除所述种子网络与所述合并对象网络之间的输入层和输出层；

合并连接单元，用于将所述种子网络与所述合并对象网络之间采用全连接的方式进行合并连接；

优化调整单元，用于若合并连接成功，以与所述种子网络相等价的数据处理步骤对应的至少一组输入/输出数据以及与所述合并对象网络相等价的数据处理步骤对应的至少一组输入/输出数据为参考，对合并连接的网络的参数进行优化调整；

所述种子选择单元还用于将合并连接的网络作为种子网络，迭代由所述合并对象选取单元、所述拆除单元、所述合并连接单元和所述优化调整单元执行相应处理直到将所述至少一个子网络全部合并连接形成目标网络模型。

优选地，所述合并单元还包括：

添加单元，用于若合并连接失败，在所述种子网络与所述合并对象网络之间添加中间隐含层，以使得所述合并连接单元通过所述中间隐含层将所述种子网络与所述合并对象网络采用全连接方式进行合并连接。

本发明实施例中，通过分析原网络模型的数据处理流程，以原网络模型在所述数据处理流程中产生的实际运行数据为参考数据集，分层构造至少一个等价的子网络，并且对至少一个子网络进行优化训练，最后合并形成目标网络模型；由于采用原网络模型的实际运行数据灵活快速地构造目标网络模型的各个层次，再将各个层次进行合并即可形成目标网络模型，而不再需要从零开始构想目标网络模型的整体结构，简化了模型构造过程，有效地提升了模型构造效率；对于目标网络模型的优化调整采用分而治之的方式，分别对各个子网络进行优化调整再合并，这使得目标网络模型的优化调整过程更为灵活，进一步提升模型构造效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于机器学习的网络模型构造方法的流程图；

图2为本发明实施例提供的另一种基于机器学习的网络模型构造方法的流程图；

图3a为本发明实施例提供的与原网络模型中的数据处理步骤a1相等价的子网络b1的构造过程和优化训练过程的示意图；

图3b为本发明实施例提供的子网络b1和b2的合并过程和对合并连接的网络的优化训练过程的一个示意图；

图3c为本发明实施例提供的子网络b1和b2的合并过程和对合并连接的网络的优化训练过程的另一个示意图；

图4为本发明实施例提供的一种基于机器学习的网络模型构造装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

网络模型包括非神经网络模型和神经网络模型。其中，神经网络是由大量的处理单元(称为神经元)广泛地互相连接而形成的复杂网络系统，是一个高度复杂的非线性动力学习系统；神经网络的基础在于神经元，神经网络模型由神经元的网络拓扑、节点特点和学习规则来表示。神经网络模型相对于非神经网络模型而言，通常具备更强的深度学习能力及更好的环境适应能力的优点，但同时，神经网络模型的构造过程相较于非神经网络模型的构造过程复杂许多。

本发明实施例提供了一种基于机器学习的网络模型构造方法及装置，能够通过分析原网络模型的数据处理流程，以原网络模型在所述数据处理流程中产生的实际运行数据为参考数据集，分层构造至少一个等价的子网络，并且对至少一个子网络进行优化训练，最后合并形成目标网络模型。通过此机器学习过程构建目标网络模型，可以获得如下有益效果：

(1)性能可靠性高。由于目标网络模型是经过对与原网络模型的数据处理流程相等价的至少一个子网络联合优化调整得到的，与原网络模型相比，目标网络模型不再需要考虑各个数据处理步骤之间的磨合与适应问题；并且联合优化过程是以原网络模型的实际运行数据为基准，从而可以保证目标网络模型的处理性能的可靠性。

(2)调整灵活度高。由于目标网络模型是通过训练原网络模型的实际运行数据驱动改变的，因此若需要调整目标网络模型，仅需调整训练过程涉及的参数，而不需要考虑目标网络模型各个层级结构之间的参数适配问题，调整灵活度较高；并且若原网络模型出现或产生新的运行数据，可以直接利用新的运行数据对目标网络模型进行调整，不需要过多的人工干预，从而节省了人力成本，减轻模型构造的工作量。

(3)构造过程简单。由于不需要从零开始构建目标网络模型，这就避免复杂的网络结构调整过程，并且不需要人工冗杂的经验作为参考，大大节省了模型构造时间，提升构造效率。

(4)对数据的利用更加充分。目标网络模型是由至少一个子网络联合优化而形成的深度网络，性能可靠性高，相对于原网络模型，其能够对参数不断迭代以最大程度地利用数据的价值，实现更好的性能优化。

(5)具有可解释性。目标网络模型是通过机器学习的方法将原网络模型进行等价替换而成，在此过程利用了原网络模型在数据处理流程中产生的实际运行数据，而并未添加人工理解或认知的标注数据，这能够在一定程度上将原网络模型的解释性要素继承下来，更适用于对于解释性要求较高的场景。

需要说明的是，原网络模型可以是非神经网络模型或神经网络模型，目标网络模型优选是神经网络模型。除特别说明外，本发明后续实施例中，原网络模型以非神经网络模型为例进行说明，而目标网络模型以神经网络模型进行说明。

基于上述描述，本发明实施例公开了一种基于机器学习的网络模型构造方法，请参见图1，该方法可包括以下步骤S101-步骤S104：

S101，获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集。

原网络模型作为一种分析、控制、决策的工具，在运行过程中会执行一系列的数据处理步骤而形成一套完整的数据处理流程。此处的数据处理步骤可以包括但不限于以下至少一种：

①单一机器学习的步骤。此步骤基于分类算法、聚类算法、成分分析算法、降维映射算法、编码器方法而实现，其中，分类算法可包括但不限于：支持向量机(Support VectorMachine，SVM)、决策树、阈值分类器、逻辑回归、浅层神经网络、迭代决策树(GradientBoost Decision Tree，GBDT)、Boosting(一种提高弱分类算法准确度的方法)方法、最邻近结点算法(k-NearestNeighbor，KNN)、贝叶斯分类器、随机森林方法及其可能的变种方法。聚类算法可包括但不限于：Kmeans(基于划分的聚类方法)、K中心、MeanShift、谱聚类、基于密度的聚类算法(Density-Based Spatial Clustering of Applications with Noise，DBSCAN)、相似传播方法。成分分析算法可包括但不限于：主成分分析(PrincipalComponent Analysis，PCA)、典范对应分析(canonical correspondence analusis，CCA)、因子分析、傅里叶变换、小波分析。降维映射算法可包括但不限于：混合判别分析(MixtureDiscriminant Analysis，MDA)、Fisher投影、lsoMap(一种全局优化算法)。编码器方法可包括但不限于：线性判别式分析(Linear Discriminant Analysis，LDA)、概率潜在语义分析(Probability Latent Semantic Analysis，pLSA)、隐含语义分析(Latent SemanticAnalysis，LSA)、SparseCoding(稀疏编码)。

②数据统计的步骤。此步骤可基于数据统计算法实现，该数据统计算法可包括但不限于：求和、求平均、求分位数、求最值、求中心统计矩、求卡方统计量等。

③序列分析的步骤。此步骤可基于序列分析算法实现，该序列分析算法可包括但不限于：自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model，ARIMA)回归、Karman滤波等。

④函数处理的步骤。此处的函数可包括但不限于：线性映射函数、包含信息熵的变换函数、解析函数、超越函数等。

⑤对数据的编辑处理步骤。此步骤可以包括但不限于：数据合并、对数据的筛选、数据分离、数据变换等。

本步骤S101中，可以分析记录原网络模型运行的数据处理流程所涉及的至少一个数据处理步骤。并且，原网络模型在执行上述的各数据处理步骤时会产生运行数据，此处的运行数据可以包括但不限于：原网络模型在实际运行过程中使用的输入数据、中间数据和获得的输出数据；或者，原网络模型在训练或测试过程中所使用的带标注的输入数据、中间数据和输出数据；或者，由人工针对原网络模型注入的模拟输入数据、中间数据及获得的输出数据。那么，本步骤从各数据处理步骤的运行数据中提炼部分或全部的运行数据作为参考数据集。

S102，按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络。

所述数据处理流程记载了原网络模型所执行的至少一个数据处理步骤，所述参考数据集包含各数据处理步骤对应的至少一组输入/输出数据。分层构造的思想在于：原网络模型的每一个数据处理步骤可以由一个具备等价功能的子网络来执行，那么，一个数据处理步骤可对应一个子网络的网络主结构；与此同时，该子网络的输入/输出层则可以由该数据处理步骤的输入/输出数据来确定。因此，本步骤中，按照原网络模型的数据处理流程以及提炼到的参考数据集，可以分层构造至少一个子网络，例如：假设原网络模型的数据处理流程表示为“步骤a1-步骤a2-步骤a3-步骤a4”共四个数据处理步骤，那么，步骤a1与第一层次的子网络b1相等价，该子网络b1的主网络结构由步骤a1确定，该子网络b1的输入层和输出层由从步骤a1提炼出输入/输出数据确定；同理，步骤a2与第二层次的子网络b2相等价，该子网络b2的主网络结构由步骤a2确定，该子网络b2的输入层和输出层由从步骤a2提炼出输入/输出数据确定；以此类推，步骤a4与第四层次的子网络b4相等价，该子网络b4的主网络结构由步骤a4确定，该子网络b4的输入层和输出层由从步骤a4提炼出输入/输出数据确定。按照此实例进一步可知，目标网络模型是由子网络b1、子网络b2、子网络b3和子网络b4按层次联接而成。

S103，采用所述参考数据集对所述至少一个子网络进行优化训练。

优化训练的目的在于：以所述参考数据集中的数据作为参考基准，不断调整至少一个子网络的参数，使得子网络的性能指标达到与原网络模型中对应的数据处理步骤的性能指标相同或更高水平。此处，子网络的参数可包括：网络节点、权值、训练速率中的至少一种。具体实现中，从每个数据处理步骤提炼的至少一组输入/输出数据被用来对该数据处理步骤相等价的子网络进行优化训练，按照步骤S102中的例子，参考数据集中步骤a1对应的至少一组输入/输出数据用于对子网络b1进行优化训练，步骤a2对应的至少一组输入/输出数据用于对子网络b2进行优化训练，以此类推，步骤a4对应的至少一组输入/输出数据用于对子网络b4进行优化训练。

S104，将优化训练后的至少一个子网络进行合并，形成目标网络模型。

本步骤需要迭代将优化训练后的至少一个子网络不断合并，在合并过程中，还需要对不断合并形成的网络进行联合优化，最终形成完整的目标网络模型；通过迭代合并和联合优化的过程形成的目标网络模型是一个深度网络，性能可靠性较高。

本发明实施例的基于机器学习的网络模型构造方法，通过分析原网络模型的数据处理流程，以原网络模型在所述数据处理流程中产生的实际运行数据为参考数据集，分层构造至少一个等价的子网络，并且对至少一个子网络进行优化训练，最后合并形成目标网络模型；由于采用原网络模型的实际运行数据灵活快速地构造目标网络模型的各个层次，再将各个层次进行合并即可形成目标网络模型，而不再需要从零开始构想目标网络模型的整体结构，简化了模型构造过程，有效地提升了模型构造效率；对于目标网络模型的优化调整采用分而治之的方式，分别对各个子网络进行优化调整再合并，这使得目标网络模型的优化调整过程更为灵活，进一步提升模型构造效率。

本发明实施例公开了另一种基于机器学习的网络模型构造方法，请参见图2，该方法可包括以下步骤S201-步骤S204：

S201，获取原网络模型在数据处理流程中所执行的至少一个数据处理步骤。

原网络模型作为一种分析、控制、决策的工具，在运行过程中会执行一系列的数据处理步骤而形成一套完整的数据处理流程。本步骤中，可以分析记录原网络模型运行的数据处理流程所执行的至少一个数据处理步骤；例如：假设获取到原网络模型的数据处理流程所执行的“步骤a1-步骤a2-步骤a3-步骤a4”共四个数据处理步骤。

S202，获取所述原网络模型在执行各数据处理步骤时产生的运行数据。

原网络模型在各数据处理步骤时会产生运行数据，此处的运行数据可以包括但不限于：原网络模型在实际运行过程中使用的输入数据、中间数据和获得的输出数据；或者，原网络模型在训练或测试过程中所使用的带标注的输入数据、中间数据和输出数据；或者，由人工针对原网络模型注入的模拟输入数据、中间数据及获得的输出数据。本步骤则分别获取原网络模型在执行各数据处理步骤时产生的运行数据，按照S201所示例子，需要分别获取原网络模型执行步骤a1时产生的运行数据，执行步骤a2时产生的运行数据，执行步骤a3时产生的运行数据以及执行步骤a4时产生的运行数据。

S203，分别从所述原网络模型在执行各数据处理步骤时产生的运行数据中抽样提取参考数据集。

具体实现中，按照本实施例所示例子，假设原网络模型执行步骤a1的过程中产生两组输入/输出数据，那么，本步骤可以抽样提取其中一组输入/输出数据添加至参考数据集，也可以全部提取两组输入/输出数据添加至参考数据集。以此类推，所述参考数据集包含各数据处理步骤对应的至少一组输入/输出数据。

本实施例的步骤S201-S203可以为图1所示的步骤S101的具体细化步骤。

S204，从预设的等价对应表中分别查询与各数据处理步骤相等价的子网络的网络主结构。

如前述，数据处理步骤可以包括但不限于以下至少一种：①单一机器学习的步骤；②数据统计的步骤；③序列分析的步骤；④函数处理的步骤；⑤对数据的编辑处理步骤。每一种类型的数据处理步骤均存在相等价的子网络的网络主结构，等价关系可以参见下述表一：

表一：预设的等价对应表

上述表一的右侧列中，如果存在多种网络主结构，表示任意一种网络主结构或任意组合的网络主结构对应左侧例中的数据处理步骤，例如：上述数据统计的步骤，等价的网络主结构包括汇总(pooling)层、卷积层、全连接层，那么，汇总(pooling)层、卷积层、全连接层中的任一种结构或多种结构的组合与数据统计的步骤相等价，那么，实际应用中如果一个数据处理步骤存在多个相等价的子网络的网络主结构时，可以通过实际训练效果反馈决定子网络最终的网络主结构，例如选择误差率最小的网络主结构。可以理解的是，上述表一并非穷举，如果存在其他数据处理步骤以及相等价的网络主结构，可添加至上述表一中。

S205，按照各数据处理步骤对应的至少一组输入/输出数据，确定与各数据处理步骤相等价的子网络的输入层结构和输出层结构。

本步骤中，需要根据各数据处理步骤对应的输入数据，确定等价的子网络的输入层的维度；根据各数据处理步骤对应的输出数据，来确定等价的子网络的输出层的维度；也就是说，与某数据处理步骤相等价的子网络的输入层与该数据处理步骤对应的输入数据的维度相同，而与该数据处理步骤相等价的子网络的输出层与该数据处理步骤对应的输出数据的维度相同。此处的维度可以包括：数据的来源、数据的数量等。

S206，根据与各数据处理步骤相等价的子网络的网络主结构、输入层结构和输出层结构构造与各数据处理步骤相等价的子网络，其中，一个子网络与一个数据处理步骤相等价。

本步骤中，在子网络的网络主结构的基础上添加输入层结构和输出层结构，即可形成子网络的网络结构。本实施例的步骤S204-S206可以为图1所示的步骤S102的具体细化步骤。

S207，依次从所述参考数据集中读取各数据处理步骤对应的至少一组输入/输出数据。

S208，以各数据处理步骤对应的至少一组输入/输出数据为参考，按照神经网络训练优化算法对与各数据处理步骤相等价的子网络的参数进行优化调整，所述参数包括：网络节点、权值、训练速率中的至少一种。

所述神经网络训练优化算法可以包括但不限于以下至少一种：随机梯度下降算法、RMSProp(一种优化算法)、动量法、AdaGrad(为各个参数分配不同学习率的算法)、AdaDelta(一种优化算法)。步骤S207-S208中，从每个数据处理步骤提炼的至少一组输入/输出数据被用来对该数据处理步骤相等价的子网络进行优化训练，按照本实施例所示例子，从参考数据集中读取步骤a1对应的至少一组输入/输出数据用于对与步骤a1相等价的子网络b1进行优化训练；从参考数据集中读取步骤a2对应的至少一组输入/输出数据用于对与步骤a2相等价的子网络b2进行优化训练，以此类推，从参考数据集中读取步骤a4对应的至少一组输入/输出数据用于对步骤a4相等价的子网络b4进行优化训练。本实施例的步骤S207-S208可以为图1所示的步骤S103的具体细化步骤。

上述步骤S204-S208可请一并参见图3a，图3a示出了与原网络模型中的数据处理步骤a1相等价的子网络b1的构造过程和优化训练过程的示意图。

S209，从所述至少一个子网络中选择任一个子网络作为种子网络。

S210，按照预置的合并顺序从所述至少一个子网络中选取除种子网络之外的一个子网络作为合并对象网络，所述预置的合并顺序包括以下任一种：所述至少一个数据处理步骤的先后执行顺序，所述至少一个数据处理步骤的后先执行顺序，所述至少一个子网络之间的结构相似度的高低顺序。

步骤S209-S210中，按照本实施例所示例子，原网络模型执行“步骤a1-步骤a2-步骤a3-步骤a4”四个数据处理步骤，相等价的子网络分别为：子网络b1、子网络b2、子网络b3和子网络b4。假设选择子网络b2为种子网络，那么：1)按照所述至少一个数据处理步骤的先后执行顺序，应当选取与步骤a3相等价的子网络b3作为合并对象网络；2)如果按照至少一个数据处理步骤的后先执行顺序，应当选取与步骤a1相等价的子网络b1作为合并对象网络；3)如果按照至少一个子网络之间的结构相似度的高低顺序，应当选择与子网络b2的结构相似度最高的子网络作为合并对象网络，假设子网络b2与子网络b4的网络主结构均为全连接层结构，那么，选择子网络b4作为合并对象网络。

S211，拆除所述种子网络与所述合并对象网络之间的输入层和输出层。

按照图3a所示的子网络的网络结构，本步骤需要拆除上层子网络的输入层，同时拆除下层子网络的输出层。如果种子网络作为上层子网络，合并对象网络作为下层子网络，那么需要拆除种子网络的输入层，同时拆除合并对象网络的输出层；如果种子网络作为下层子网络，合并对象网络作为上层子网络，那么需要拆除种子网络的输出层，同时拆除合并对象网络的输入层。

S212，将所述种子网络与所述合并对象网络之间采用全连接的方式进行合并连接。若合并连接成功，转入步骤S214；若合并失败，转入步骤S213。

S213，在所述种子网络与所述合并对象网络之间添加中间隐含层，通过所述中间隐含层将所述种子网络与所述合并对象网络采用全连接方式进行合并连接。

S214，以与所述种子网络相等价的数据处理步骤对应的至少一组输入/输出数据以及与所述合并对象网络相等价的数据处理步骤对应的至少一组输入/输出数据为参考，对合并连接的网络的参数进行优化调整。

由于合并连接的网络的输入层为下层子网络的输入层，合并连接的网络的输出层为上层子网络的输出层，那么，本步骤需要以上层子网络相等价的数据处理步骤对应的输出数据为参考，同时以下层子网络相等价的数据处理步骤对应的输入数据为参考，对合并连接的网络的参数进行优化调整。

S215，以合并连接的网络作为种子网络，迭代上述步骤S210-S214的过程直至将所述至少一个子网络全部合并连接形成目标网络模型。

本实施例的步骤S209-S215可以为图1所示的步骤S104的具体细化步骤。上述步骤S209-S215可请一并参见图3b和图3c，图3b和图3c分别示出了子网络b1和b2的合并过程和对合并连接的网络的优化训练过程的示意图。

本发明实施例还公开了一种基于机器学习的网络模型构造装置，请参见图4，该装置可运行如下单元：

获取单元101，用于获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集。

分层构造单元102，用于按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络。

优化训练单元103，用于采用所述参考数据集对所述至少一个子网络进行优化训练。

合并单元104，用于将优化训练后的至少一个子网络进行合并，形成目标网络模型。

具体实现中，该装置在运行所述获取单元101的过程中，具体运行如下单元：

步骤获取单元1001，用于获取原网络模型在数据处理流程中所执行的至少一个数据处理步骤。

数据获取单元1002，用于获取所述原网络模型在执行各数据处理步骤时产生的运行数据。

抽样提取单元1003，用于分别从所述原网络模型在执行各数据处理步骤时产生的运行数据中抽样提取参考数据集；其中，所述参考数据集包含各数据处理步骤对应的至少一组输入/输出数据。

具体实现中，该装置在运行所述分层构造单元102的过程中，具体运行如下单元：

查询单元2001，用于从预设的等价对应表中分别查询与各数据处理步骤相等价的子网络的网络主结构。

确定单元2002，用于按照各数据处理步骤对应的至少一组输入/输出数据，确定与各数据处理步骤相等价的子网络的输入层结构和输出层结构。

构造单元2003，用于根据与各数据处理步骤相等价的子网络的网络主结构、输入层结构和输出层结构构造与各数据处理步骤相等价的子网络，其中，一个子网络与一个数据处理步骤相等价。

具体实现中，该装置在运行所述优化训练单元103的过程中，具体运行如下单元：

读取单元3001，用于依次从所述参考数据集中读取各数据处理步骤对应的至少一组输入/输出数据。

调整单元3002，用于以各数据处理步骤对应的至少一组输入/输出数据为参考，按照神经网络训练优化算法对与各数据处理步骤相等价的子网络的参数进行优化调整，所述参数包括：网络节点、权值、训练速率中的至少一种。

具体实现中，该装置在运行所述合并单元104的过程中，具体运行如下单元：

种子选择单元4001，用于从所述至少一个子网络中选择任一个子网络作为种子网络。

合并对象选取单元4002，用于按照预置的合并顺序从所述至少一个子网络中选取除种子网络之外的一个子网络作为合并对象网络，所述预置的合并顺序包括以下任一种：所述至少一个数据处理步骤的先后执行顺序，所述至少一个数据处理步骤的后先执行顺序，所述至少一个子网络之间的结构相似度的高低顺序。

拆除单元4003，用于拆除所述种子网络与所述合并对象网络之间的输入层和输出层。

合并连接单元4004，用于将所述种子网络与所述合并对象网络之间采用全连接的方式进行合并连接。

优化调整单元4005，用于若合并连接成功，以与所述种子网络相等价的数据处理步骤对应的至少一组输入/输出数据以及与所述合并对象网络相等价的数据处理步骤对应的至少一组输入/输出数据为参考，对合并连接的网络的参数进行优化调整。

所述种子选择单元4001还用于将合并连接的网络作为种子网络，迭代由所述合并对象选取单元4002、所述拆除单元4003、所述合并连接单元4004和所述优化调整单元4005执行相应处理直到将所述至少一个子网络全部合并连接形成目标网络模型。

可选地，该装置在运行所述合并单元104的过程中，还运行如下单元：

添加单元4006，用于若合并连接失败，在所述种子网络与所述合并对象网络之间添加中间隐含层，以使得所述合并连接单元4004通过所述中间隐含层将所述种子网络与所述合并对象网络采用全连接方式进行合并连接。

由于图4所示的装置可用于执行图1-图3实施例所示方法的各步骤，因此，图4所示装置的各单元的功能可参见图1-图3所示各步骤的描述，在此不赘述。

与方法同理，本发明实施例的基于机器学习的网络模型构造装置，通过分析原网络模型的数据处理流程，以原网络模型在所述数据处理流程中产生的实际运行数据为参考数据集，分层构造至少一个等价的子网络，并且对至少一个子网络进行优化训练，最后合并形成目标网络模型；由于采用原网络模型的实际运行数据灵活快速地构造目标网络模型的各个层次，再将各个层次进行合并即可形成目标网络模型，而不再需要从零开始构想目标网络模型的整体结构，简化了模型构造过程，有效地提升了模型构造效率；对于目标网络模型的优化调整采用分而治之的方式，分别对各个子网络进行优化调整再合并，这使得目标网络模型的优化调整过程更为灵活，进一步提升模型构造效率。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种基于机器学习的网络模型构造方法，其特征在于，包括：

采用所述参考数据集对所述至少一个子网络进行优化训练；

2.如权利要求1所述的方法，其特征在于，所述获取原网络模型的数据处理流程及所述原网络模型在所述数据处理流程中产生的参考数据集，包括：

3.如权利要求2所述的方法，其特征在于，所述按照所述数据处理流程以及所述参考数据集分层构造至少一个子网络，包括：

4.如权利要求2或3所述的方法，其特征在于，所述采用所述参考数据集对所述至少一个子网络进行优化训练，包括：

5.如权利要求4所述的方法，其特征在于，所述将优化训练后的至少一个子网络进行合并，形成目标网络模型，包括：

从所述至少一个子网络中选择任一个子网络作为种子网络；

6.如权利要求5所述的方法，其特征在于，所述将所述种子网络与所述合并对象网络之间采用全连接权值的方式进行合并连接之后，还包括：

7.一种基于机器学习的网络模型构造装置，其特征在于，包括：

8.如权利要求7所述的装置，其特征在于，所述获取单元包括：

9.如权利要求8所述的装置，其特征在于，所述分层构造单元包括：

10.如权利要求8或9所述的装置，其特征在于，所述优化训练单元包括：

11.如权利要求10所述的装置，其特征在于，所述合并单元包括：

12.如权利要求11所述的装置，其特征在于，所述合并单元还包括：