CN111507499A

CN111507499A - 预测用模型的构建方法、测试方法、装置及系统

Info

Publication number: CN111507499A
Application number: CN201911235129.XA
Authority: CN
Inventors: 贾建超
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2019-12-05
Filing date: 2019-12-05
Publication date: 2020-08-07
Anticipated expiration: 2039-12-05
Also published as: CN111507499B

Abstract

本发明公开一种预测用模型的构建方法、测试方法、装置及系统，其中的构建方法包括：根据预先采集的样本数据构建包含输入节点和输出节点的神经网络模型；基于所述样本数据确定非输出节点的输出值与所述输出节点的理论输出值之间的相关系数；基于所述相关系数在所述神经网络模型中增加中间节点和/或节点间连接，得到进化后的神经网络模型；基于所述进化后的神经网络模型生成所述预测用模型。本发明以一个最小的模型结构同时达到了较佳的拟合效果和泛化效果。

Description

预测用模型的构建方法、测试方法、装置及系统

技术领域

本发明涉及一种预测用模型的构建方法、测试方法、装置及系统。

背景技术

在日常业务中，常常会遇到关于对未来某时段内的特征量进行预测的问题，如预测未来一段时间的道路流量，预测机场或港口未来一段时间的车流量与人流量，预测未来一段时间内城市各个区域间相互迁移的车流量与人流量等等。

以预测未来一段时间的某条道路流量为例，影响未来流量的因子会特别多，比如，与当前该道路的之前一段时间的流量有关，和前一天同时时间段前后的流量有关，和相邻道路当前流量有关，还可能在周末与工作日表现出完全不同的特点，或者可能与天气、大型事件、是否是特殊节假日等有关。在进行预测时，要综合充分考虑这些特征，选择或搭建适合业务场景的模型。

解决这一类的物理量的预测问题，传统回归机器学习模型虽然可以拿来使用，但它们自身存在如下问题：

对于逻辑回归(LR)一类的线型模型，若是数据规律出现相对较大的非线性关系，则容易欠拟合；

对于树形结构、一般神经网络结构等模型可以拟合可能出现的非线性关系，但若是模型控制或参数不当，抑或是参数过多，则又容易过拟合。

发明内容

鉴于现有技术中存在的技术缺陷和技术弊端，本发明实施例提供克服上述问题或者至少部分地解决上述问题的预测用模型的构建方法、测试方法、装置及系统。

本发明的一实施例提供一种预测用模型的构建方法，其中包括：

根据预先采集的样本数据构建包含输入节点和输出节点的神经网络模型；

基于所述样本数据确定非输出节点的输出值与所述输出节点的理论输出值之间的相关系数；

基于所述相关系数在所述神经网络模型中增加中间节点和/或节点间连接，得到进化后的神经网络模型；

基于所述进化后的神经网络模型生成所述预测用模型。

本发明的另一实施例提供一种预测方法，其中包括：

将待预测对象的各个特征值分别输入到根据上述方法所构建的预测用模型的各个输入节点中；

将所述预测用模型的输出节点的输出值作为所述待预测对象的预测结果。

本发明的又一实施例提供一种预测用模型的构建装置，其中包括：

构建模块，用于根据预先采集的样本数据构建包含输入节点和输出节点的神经网络模型；

相关模块，用于基于所述样本数据确定非输出节点的输出值与所述输出节点的理论输出值之间的相关系数；

进化模块，用于基于所述相关系数在所述神经网络模型中增加中间节点和/或节点间连接，得到进化后的神经网络模型；以及

生成模块，用于基于所述进化后的神经网络模型生成所述预测用模型。

本发明的又一实施例提供一种预测装置，其中包括：

特征输入模块，用于将待预测对象的各个特征值分别输入到根据上述方法所构建的预测用模型的各个输入节点中；以及

结果获取模块，用于将所述预测用模型的输出节点的输出值作为所述待预测对象的预测结果。

本发明的又一实施例一种预测系统，其中包括：上述预测用模型的构建装置和上述预测装置。

本发明的又一实施例提供一种根据上述方法、装置和系统在交通领域、电子商务领域、物流领域、导航领域、大数据营销领域、通信领域、语音合成领域、新能源领域，金融领域、人工智能领域、云数据领域、影音娱乐领域中的应用。

本发明的又一实施例提供一种交通状况预测用模型的构建方法，其中包括：

根据预先采集的交通状况的样本数据构建包含输入节点和输出节点的神经网络模型；

基于所述进化后的神经网络模型生成所述交通状况预测用模型。

本发明的又一实施例提供一种交通状况预测方法，其中包括：

将待预测交通状况的各个特征值分别输入到根据上述方法所构建的交通状况预测用模型的各个输入节点中；

将所述交通状况预测用模型的输出节点的输出值作为所述待预测交通状况的预测结果。

本发明的又一实施例提供一种交通状况预测用模型的构建装置，其中包括：

构建模块，用于根据预先采集的交通状况的样本数据构建包含输入节点和输出节点的神经网络模型；

生成模块，用于基于所述进化后的神经网络模型生成所述交通状况预测用模型。

本发明的又一实施例提供一种交通状况预测装置，其中包括：

特征输入模块，用于将待预测交通状况的各个特征值分别输入到上述方法所构建的交通状况预测用模型的各个输入节点中；以及

结果获取模块，用于将所述交通状况预测用模型的输出节点的输出值作为所述待预测交通状况的预测结果。

本发明的又一实施例提供一种交通状况预测系统，其中包括：上述交通状况预测用模型的构建装置和上述交通状况预测装置。

本发明的又一实施例提供一种计算机可读存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现上述方法。

本发明的又一实施例提供一种计算机设备，包括存储器，处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现上述方法。

本发明通过基于非输出节点的输出值与输出节点的理论输出值之间的相关系数对神经网络模型进行进化，增加中间节点和/或节点间连接，能够更准确地体现节点间的相关程度，与现有技术中不改变节点数量及节点间连接的模型相比，避免了欠拟合和过拟合的问题，从而能够以一个最小的模型结构同时达到较佳的拟合效果和泛化效果。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所记载的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例提供的预测用模型的构建方法的流程图；

图2为三种增加操作的示意图；

图3为本发明实施例提供的带变异过程的预测用模型的构建方法的流程图；

图4为三种删除操作的示意图；

图5交通流量预测应用例的流程图；

图6为时间片划分示意图；

图7为图5所示步骤220中进行模型构建时的原理举例示意图；

图8为迭代次数与损失偏差的关系曲线示意图；

图9为在进行两轮迭代过程中模型结构的变化状态示意图；

图10为可选的模型变异过程的流程图；

图11为本发明实施例提供的预测用模型的构建装置的结构示意图；

图12为本发明应用例提供的交通状况预测用模型的构建装置的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

<本发明中的名词解释>

节点：神经网络模型中的神经元；

非输出节点：神经网络模型中除了输出节点以外的节点，包括：输入节点和中间节点；

中间节点：神经网络模型中除了输入节点和输出节点以外的节点，且中间节点与至少两个上游节点相连；

上游节点：沿着从输入节点到输出节点的数据流方法，位于某个节点的输入侧与该节点相连的节点；

理论输出值：与相应样本数据中的实际值对应的值。

<预测用模型的构建方法的实施例1>

如图1所示，本实施例的方法可以包括如下步骤：

步骤110，根据预先采集的样本数据构建包含输入节点和输出节点的神经网络模型。

其中，所采集的样本数据通常为多个，每个样本数据中可以包含特征值和实际值。具体地，可以根据各个样本数据中特征值的数量设置相应数量的输入节点，并设置一个输出节点。

步骤120，基于所述样本数据确定非输出节点的输出值与所述输出节点的理论输出值之间的相关系数。

具体地，可以根据所述样本数据中的特征值确定所述输入节点的输出值，根据所述样本数据中的实际值确定所述输出节点的理论输出值。当神经网络模型中包含中间节点时，根据该中间节点的各个上游节点的输出值和权值确定中间节点的输出值。其中，所述权值将在后述内容中进行说明。

在确定出输入节点的输出值、输出节点的理论输出值和中间节点的输出值后，便可以根据预选的相关系数的类型分别确定各个所述输出值与所述理论输出值之间的相关系数。

其中，所述相关系数表示各个节点与输出节点之间的相关程度，相关系数的类型可以有多种，例如可以采用采用皮尔逊相关系数(Pearson correlation coefficient)，又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient，简称PPMCC或PCCs)，是用于度量两个变量之间的线性相关性，其值介于-1与1之间，两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商。

步骤130，基于所述相关系数在所述神经网络模型中增加中间节点和/或节点间连接，得到进化后的神经网络模型。

具体地，如图2所示，上述的增加操作可以分为如下几种情形：

操作1：所述相关系数的绝对值相对较大的非输出节点与所述输出节点之间建立连接；

其中，所述“相对较大”是指在全部算出的相关系数中，一部分相关系数的绝对值相比于另一部分相关系数的绝对值较大。具体地，可以为最大值，也可以为大于预定阈值的相对较大值。

例如，如图2所示，假设输入节点4的相关系数的绝对值最大，则在输入节点4与输出节点之间建立连接。如果已经存在连接，则无需再建立新的连接，保持当前的连接状态即可。

操作2：在所述相关系数的绝对值相对较小的至少两个非输出节点到所述输出节点之间增加中间节点。

其中，所述“相对较小”是指在全部算出的相关系数中，一部分相关系数的绝对值相比于另一部分相关系数的绝对值较小。具体地，可以为最小值，也可以为小于预定阈值的相对较小值。

例如，如图2所示，假设输入节点2和3的相关系数的绝对值排在各个节点中的最后两位，则在输入节点2和3与输出节点之间增加中间节点5，并将他们依次连接。

操作3：在所述相关系数的绝对值相对较小的中间节点与上游节点之间增加新的中间节点。

具体地，可以在与所述相关系数的绝对值相对较小的中间节点所连接的至少两个上游节点中确定所述相关系数的绝对值相对较小的上游节点；在所述相关系数的绝对值相对较小的中间节点与所述相关系数的绝对值相对较小的上游节点之间增加新的中间节点；在所述相关系数的绝对值相对较小的输入节点与所述新的中间节点之间建立连接。本操作也可以理解为对中间节点进行分裂。

例如，如图2所示，假设中间节点5的相关系数的绝对值相对较小，两个输入节点2和3为中间节点5的上游节点，其中，输入节点2比输入节点3的相关系数的绝对值小，因此在输入节点2与中间节点5之间增加新的中间节点6，该中间节点6的一个上游节点为输入节点2，另外，还选择相关系数的绝对值相对较小的输入节点1与中间节点6相连，作为中间节点6的另一个上游节点。

相关系数的绝对值越大，表明该节点的与输出节点之间的线性相关性越大，因此通过与输入节点直接建立连接的方式来传递这种线性相关性；相反，相关系数的绝对值越小，表明该节点的与输出节点之间的线性相关性越小而非性相关性越大，因此，通过增加新的中间节点和/或节点间连接的方式来体现这种非线性相关性，从而使模型能够更加准确地模拟出真实情况。

此处需要说明的是，如果一个中间节点只有一条输入线与相连，则该中间节点只是起到了将输入值进行线性传递的作用，而无法起到非线性运算的作用，因此在经过上述操作后要使各个中间节点至少有两条输入线，如果不能满足该要求则不执行该操作。

步骤140，基于所述进化后的神经网络模型生成所述预测用模型。

具体地，可以包括如下步骤：

步骤141，基于所述样本数据对所述进化后的神经网络模型进行训练和验证。

具体地，可以先基于所述样本数据对所述进化后的神经网络模型进行训练，确定各节点之间的权值，得到训练后的神经网络模型。其中，所述权值是指在将前一个节点的输出值传递给后一个节点时在该输出值上附加的系数。

然后，基于样本数据对所述训练后的神经网络模型进行验证，确定损失偏差；当所述损失偏差大于预定值时，再次基于所述样本数据对所述进化后的神经网络模型进行训练，确定各节点之间的权值，得到训练后的神经网络模型；基于所述样本数据对所述训练后的神经网络模型进行验证，确定损失偏差；当所述损失偏差大于预定值时，重复执行本步骤；直到当所述损失偏差小于预定值时，得到所述验证后的神经网络模型。

步骤142，判断验证结果是否满足预定的收敛条件。

其中，所述收敛条件例如可以为判断本次验证后得到的损失偏差与前次验证后得到的损失偏差之间的差异是否小于预定值。

当不满足所述收敛条件时，返回执行步骤120和步骤130，直到当满足所述收敛条件时，得到收敛后的神经网络模型作为预测用模型。

在使用预测用模型进行预测时，可以将待预测对象的各个特征值分别输入到所构建的预测用模型的各个输入节点中；然后将该预测用模型的输出节点的输出值作为所述待预测对象的预测结果，从而完成预测。

本实施例所述方法通过基于非输出节点的输出值与输出节点的理论输出值之间的相关系数对神经网络模型进行进化，增加中间节点和/或节点间连接，能够更准确地体现节点间的相关程度，与现有技术中不改变节点数量及节点间连接的模型相比，避免了欠拟合和过拟合的问题，从而能够以一个最小的模型结构同时达到较佳的拟合效果和泛化效果。

<预测用模型的构建方法的实施例2>

在以上的实施例1中，尽管通过进化后得到了预测用模型，然而，由于一些偶然因素的存在，例如，所使用的采样数据不具有代表性，因此不能保证所得到的模型是最优模型。

因此，为了进一步搜索更优的模型，可选地，可以进一步增加变异的过程，如图3所示，可以包括如下步骤：

步骤144，在所述收敛后的神经网络模型中至少一次随机增删中间节点和/或节点间连接，得到变异后的神经网络模型。

其中，增加中间节点和/或节点间连接的增加操作可参见上述图2及其相关内容的介绍，此处不再赘述。而删除中间节点和/或节点间连接的删除操作，如图4所示，可以分为如下几种情形：

操作4：删除两个节点间的连接。例如，在图4中，通过执行操作4将输入节点4与输出节点之间的连接删除。

其中，为了保证一个中间节点至少有两个上游节点与之相连，若删掉节点间连接后，该中间节点只剩下一个上游节点，则也删掉该中间节点。

操作5：删除节点及与该节点相关的连接。例如，在图4中，通过执行操作5将节点5以及该节点5与节点2、3和输出节点之间的连接删除。

操作6：删除节点而不删除连接。例如，在图4中删除了节点6，而将原本与节点6连接的输入节点1和2直接连接到节点5。

上述的增加操作和删除操作可以单独使用也可以组合使用。并且，本步骤可以只执行一次从而得到一个变异后模型，或者也可以执行多次从而得到多个变异后模型。

步骤145，基于所述样本数据对各个所述变异后的神经网络模型进行训练和验证。

具体的训练和验证过程与上述步骤141的内容类似，此处不再赘述。

步骤146，比较变异前与变异后的神经网络模型的验证结果，将验证结果更优的神经网络模型作为预测用模型。

通过增设上述变异的过程，能够对收敛后的模型做进一步的有向纠正，防止所得到的模型仅仅是一个局部范围内的最优解而不是整个范围内的最优解，从而进一步提高模型的拟合效果和泛化效果，相应地也能进一步提高预测的准确性。

本发明提供的预测用模型的构建方法和预测方法、装置和系统可以应用在各种技术领域中，例如但不限于：交通领域、电子商务领域、物流领域、导航领域、大数据营销领域、通信领域、语音合成领域、新能源领域，金融领域、人工智能领域、云数据领域、影音娱乐领域。

其中，当应用在交通领域中时，可以用于对交通状况进行预测，使用预测结果控制相应道路上的交通信号灯。交通状况可以为交通流量或平均速度等，可以通过摄像头通过图像处理的方式采集、也可以通过设置在道路上的感应线圈采集，还可以从导航数据获取。其中，被预测的交通状况可以是指航空航天场景中的各种飞行器的交通状况；也可以是指水运港口码头等场景中的各种船只的交通状况；还可以是城市或乡镇中各个区域之间的车辆的交通状况，其中的车辆可以包括机动车，也可以包括如自行车、电动车等非机动车等。另外，除了上述的飞行器、船只和车辆以外，还可以针对人流、物流等其他场景的预测。

以下，以预测在未来某时段内在某条道路上的交通流量的场景为例，具体说明本发明一种可能的应用例。

<在交通流量预测场景中的应用例>

如图5所示，预测交通流量的过程可以包括如下步骤：

步骤210，收集待预测道路的交通流量的历史数据生成样本。

其中，所述道路是指两个路口之间的道路单元，每条道路都是有方向的，双侧对向道路算两条道路。相应地，所述交通流量是指沿该条道路单侧行驶的全部车辆的数量。所述历史数据是指在待预测时段之前在该道路上的与交通流量相关的数量。所述样本是指分别包含不同时段的历史数据的数据单元。

例如，假设待预测时段为从当前时刻开始的未来15min内，则以每15分钟作为一个时间片将全天划分成96个时间片。如图6所示，为时间片的划分示意图，由于篇幅所限，图中仅示出三天内的有限个时间片进行示例性说明。如图所示，当前日的时间片包括T₀₁～T₀₆，当前日的前一日的时间片包括T₁₁～T₁₆，当前日的前二日的时间片包括T₂₁～T₂₆，其中，待预测时间片T₀₆为待预测时段。

针对待预测时间片T₀₆之前的各个时间片收集交通流量的历史数据生成样本，每个样本包含实际交通流量值和特征值。其中，实际交通流量值是指该样本在相应时间片内的实际检测到的交通流量；特征值包括该时间片对应的属性值以及上游流量值。其中，属性值例如包括：日期属性值(如：是否为节假日等)、天气属性值(如：下雨或晴天等)、交通事件属性值(如：交通事故、交通管制、道路施工等)等；上游流量值就指上游道路的交通流量，上游道路是指在该时间片内在待预测道路上行驶的车辆在驶入该待预测道路之前所在的道路，上游道路可能有很多条；上游道路的交通流量是指在该样本对应时间片之前的预定时段(如：八个时间片)内在上游道路上行驶车辆的数量。

假设，在图6中，某个样本对应于时间片T₁₂，该样本的实际交通流量值为在时间片T₁₂内行驶在待预测道路上的车辆数量；该样本的特征值中的日期属性值为时间片T₁₂所在的第一日是否为周末或节假日，天气属性值为在时间片T₁₂内是下雨还是晴天，交通事件属性值为在时间片T₁₂内就否有交通事件等；上游流量值为在时间片T₁₂之前的例如包含T₁₂等的八个时间片内行驶在待预测道路的上游道路的上的车辆数量。如此，针对除待预测时间T₀₆以外的各个时间片分别生成相应的样本数据。

步骤211，将所有的样本分组。

例如，将所有的样本划分成三个数据集合：训练集、验证集、测试集。划分比例可以随机设定，例如为：6:2:2，即60％的样本组成训练集，20％的样本组成验证集，20％的样本组成测试集。

其中，训练集用于对神经网络模型进行进化和训练；验证集用于对训练后得到的神经网络模型进行验证；测试集用于对最终得到的神经网络模型的情形进行评估。具体过程将在后续步骤进行详细说明。

步骤220，构建神经网络模型，包含输入节点和输出节点，每个输入节点对应样本中的一个特征。

例如，如图7所示，所构建的神经网络模型包括四个输入节点1～4，分别对应于样本中的日期属性值、天气属性值、交通事件属性值和上游流量值；图中的黑色圆圈表示输出节点，此时尚未有任何节点与该输出节点相连，因此输出节点的输出为0。

步骤230，基于训练集中的样本数据，计算除输出节点以外的各个节点的输出值与输出节点的理论输出值的相关系数。

如图4所示，将训练集中的全部样本的特征值分别传送给神经网络模型中的各个输入节点1～4，各个输入节点1～4的输出值即为相应特征值的值，即，输入节点1的输出值为各个样本的日期属性值的值构成的单行矩阵，输入节点2的输出值为各个样本的天气属性值的值构成的单行矩阵，输入节点3的输出值为各个样本的交通事件属性值的值构成的单行矩阵，输入节点4的输出值为各个样本的上游流量值的值构成的单行矩阵。各个输入节点1～4的实际值为各个样本的实际交通流量值的值构成的单行矩阵。

基于所选择的相关系数(如：皮尔逊相关系数)的运算方法进行矩阵运算，从而针对每个特征分别得到一个相关系数。

步骤240，根据各个节点的相关系数对当前的神经网络模型进行进化，以增加中间节点和/或变更节点间连接。

其中，增加操作的具体方式可参见上述图2及其相关说明，具体地，在本应用例中为：

操作1：在相关系数的绝对值最大的节点(包括输入节点和中间节点)与输出节点之间建立连接。

假设在上例中，由上游流量值对应的输入节点4经上述计算后得到的相关系数的绝对值最大，则在输入节点4与输出节点之间建立连接。如果绝对值最大的节点与输出节点之间已经有连接了，则无需再建立新的连接，保持当前的连接状态即可。

操作2：在相关系数的绝对值最低的两个节点到输出节点之间增加中间节点并建立连接。

假设在上例中，由天气属性值对应的输入节点2和交通事件属性值对应的输入节点3经上述计算后得到的相关系数的绝对值排在各个节点中的最后两位，则在输入节点2和3与输出节点之间增加中间节点5，并将他们依次连接。

操作3：从相关系数的绝对值最低的中间节点分裂出新的中间节点。

具体地，在所述绝对值最低的中间节点与所连接的至少两个上游节点中所述绝对值最低的输入节点之间的连接上增加一个中间节点，在所增加的该中间节点与未连接该中间节点的输入节点中所述绝对值最低的输入节点之间建立连接。如果该中间节点的输入线在此前的迭代中已经进行过一次分裂，则无需再进行分裂。

例如，在上述例中，假设中间节点5经计算后发现是相关系数的绝对值最低的中间节点，且输入节点2的相关系数的绝对值小于输入节点3，则对输入节点2到节点5的输入连接线进行分裂。具体地，在该输入连接线上增加一个中间节点6，该中间节点6在输入方向上除了连接输入节点2以外，还连接全部输入节点中相关系数的绝对值最低的输入节点，例如节点1。

步骤250，基于训练集中的样本数据，对进化后的神经网络模型进行训练，以确定各节点之间的权值。

具体的训练过程例如，先随机选取一组可能的权值赋予待训练的神经网络模型，将训练集中的各个样本数据输入到该神经网络模型中在输出节点得到输出值，根据该输出值及各个样本对应的实际值确定损失偏差，不断调整上述权值直到损失偏差小于预定值则完成训练，将此时的权值作为训练后的神经网络模型的各节点之间的权值。

步骤260，基于验证集中的样本数据，对训练后的神经网络模型进行验证，以确定损失偏差。

具体地，将验证集中的各个样本数据输入到训练后的神经网络模型中在输出节点得到输出值，根据该输出值及各个样本对应的实际值确定损失偏差。如果该损失偏差不满足预定条件，则返回步骤250重新进行训练；如果该损失偏差满足预定条件，则继续执行步骤261。

其中，所述预定条件是用于评价损失偏差优劣的判断标准，可以根据需要有多种形式，如：各个样本对应的损失偏差的平均值低于预定值，或者各个样本对应的损失偏差中低于预定值的损失偏差的数量所占比例低于预定值，等等。

步骤261，判断是否满足收敛条件。

其中，所述收敛条件例如为，判断本次迭代中在验证后得到的损失偏差与前次迭代中在经验证后得到的损失偏差与之间的差异是否小于预定值。

若是，则表明经过多次进化、训练和验证的迭代过程之后，神经网络模型的输出结果趋于稳定，则跳出迭代过程，将当前的神经网络模型作为最终的交通流量预测用模型；若否，则表明当前的神经网络模型尚不稳定，需要继续迭代，则返回再次执行步骤230～261的过程。

如图8所示，实验表明，采用训练集对进化后的模型进行训练时，随着迭代次数的增加，损失偏差的值单调减小；而当采用验证集对训练后的模型进行验证时，随着迭代次数的增加，起初损失偏差的值逐渐减小，且损失偏差的变化率(即曲线斜率)也逐渐减小，但当达到虚线所示的拐点位置时，损失偏差的值和变化率反而会逐渐增大。因此，将收敛条件设定为在迭代次数达到拐点位置之前损失偏差的变化率小于预定值，从而保证验证过程在一般情况下都能达到收敛。

例如，如图9所示，假设在第一轮迭代中，在执行步骤240的模型进化过程中，增加了中间节点5并在输入节点4与输出节点之间建立连接；此后，在步骤250的模型训练和步骤260的模型验证后确定了权值W₁₁～W₁₄；假设此时不满足收敛条件，因此返回开始第二轮迭代；

在第二轮迭代中，在步骤230中，针对当前的模型结构计算相关系数，具体地，各个输出节点1～4的输出值为样本的各个特征所对应的值，中间节点5的输出值根据公式A₅＝g(A₂×W₁₁，A₃×W₁₂)进行运算而得到，其中，A₅表示中间节点5的输出值，A₂表示输入节点2的输出值，A₃输入节点3的输出值，W₁₁表示节点2到节点5的权值，W₁₂表示节点3到节点5的权值，函数g为激活函数(active function)，可以根据需要选用相应的函数，如：符号函数sgn、平滑函数sigmoid等。

在执行步骤240的模型进化过程中，在节点2与节点5之间的连接线分裂出了节点6，并在输入节点1与节点6之间建立连接；此后，在步骤250的模型训练和步骤260的模型验证后确定了权值W₂₂～W₂₇；如果此时满足收敛条件，则结束迭代，如果不满足收敛条件，则继续进行迭代，直到满足收敛条件。

步骤270，基于测试集中的样本数据，对迭代后得到的交通流量预测用模型的预测性能进行评价。

具体地，将测试集中的样本数据输入到交通流量预测用模型中在输出节点得到输出，将该输出值与各样本对应的实际值进行比较得出该模型的预测误差作为针对该模型的评价指标，如：平均标准误差率为5％。

此处需要说明的是，本步骤对于预测交通流量不是必需的，即使不得到评价指标也同样可以完成交通流量的预测。

步骤280，使用最终得到的上述交通流量预测用模型进行交通流量预测。

具体地，将图6中所示的待预测时间片T₀₆所对应的各个特征值(包括：日期属性值、天气属性值、交通事件属性值、上游流量值等)输入到上述交通流量预测用模型的各个输入节点中，从输出节点得到在时间片T₀₆的交通流量的预测值。该预测值的准确性可以由在步骤270中得到的评价指标来表示。

实践中，可以使用预测出的交通流量预测结果来控制相应道路上的交通信号灯，例如当预测出某个路口在某段时间内的某个方向上的交通流量会激增时，适当延长该方向的绿灯的点亮时间，从而尽快将车辆疏导出该路口，及时避免交通拥堵。

<带变异过程的应用例>

为了进一步搜索更优的模型，可选地，在上述步骤261与步骤270之间可以进一步包括模型变异的过程，具体地，如图10所示，包括如下步骤：

步骤310，对验证后的神经网络模型进行变异，以随机增删中间节点和/或节点间连接。

具体地，增加操作可参见图4所示的操作1～3；删除操作可以分为如下几种情形：

步骤320，基于训练集和验证集中的样本数据，对变异后的神经网络模型进行训练和验证。

其中，所述训练和验证的具体过程与上述步骤250和步骤260的过程相同，通过训练确定变异后模型的权值，再通过验证得到变异后模型的损失偏差。

步骤330，比较变异前和变异后的神经网络模型的验证结果。

具体地，比较变异前模型的损失偏差与变异后模型的损失偏差之间的大小，损失偏差越小，表明模型性能更优。

步骤331，经比较后发现变异后模型更优，则选择变异后模型作为最终得到的交通流量预测用模型。

其中，该变异后模型也包含在步骤320中训练出的权值。

步骤332，经比较后发现变异前模型更优，则选择变异前模型作为最终得到的交通流量预测用模型。

其中，该变异前模型是在步骤261中因满足收敛条件而跳出迭代时的神经网络模型。

<预测系统的实施例>

本实施例提供一种预测系统，如图11所示，该预测系统包括测试用模型的构建装置10和测试装置20，其工作原理如下：

测试用模型的构建装置10中的构建模块11根据预先采集的样本数据构建包含输入节点和输出节点的神经网络模型；相关模块12基于所述样本数据确定非输出节点的输出值与所述输出节点的理论输出值之间的相关系数；进化模块13基于所述相关系数在所述神经网络模型中增加中间节点和/或节点间连接，得到进化后的神经网络模型；以及生成模块14基于所述进化后的神经网络模型生成所述预测用模型。

测试装置20得到测试用模型的装置10构建出的预测用模型，由特征输入模块21将待预测对象的各个特征值分别输入到该预测用模型的各个输入节点中；然后由结果获取模块22将所述预测用模型的输出节点的输出值作为所述待预测对象的预测结果。

以上的测试用模型的构建装置10可以实现上述测试用模型的构建方法，测试装置20可以实现上述测试方法。因此，各模块的功能和技术效果还可参见上述方法实施例和应用例的介绍，此处不再赘述。

<交通状况预测系统的应用例>

本应用例提供一种交通状况预测系统，如图12所示，该交通状况预测系统包括交通状况测试用模型的构建装置30和交通状况测试装置40，其工作原理如下：

交通状况测试用模型的装置30中的构建模块31根据预先采集的交通状况的样本数据构建包含输入节点和输出节点的神经网络模型，其中，交通状况可以为交通流量或平均速度等；相关模块32基于所述样本数据确定非输出节点的输出值与所述输出节点的理论输出值之间的相关系数；进化模块33基于所述相关系数在所述神经网络模型中增加中间节点和/或节点间连接，得到进化后的神经网络模型；以及生成模块34基于所述进化后的神经网络模型生成所述交通状况预测用模型。

交通状况测试装置40得到交通状况测试用模型的装置30构建出的交通状况预测用模型，由特征输入模块41将待预测交通状况的各个特征值分别输入到该交通状况预测用模型的各个输入节点中；然后由结果获取模块42将所述交通状况预测用模型的输出节点的输出值作为所述待预测交通状况的预测结果。

以上的交通状况测试用模型的构建装置30可以实现上述交通状况测试用模型的构建方法，交通状况测试装置40可以实现上述交通状况测试方法。因此，各模块的功能和技术效果还可参见上述方法实施例和应用例的介绍，此处不再赘述。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种预测用模型的构建方法，其特征在于，包括：

基于所述进化后的神经网络模型生成所述预测用模型。

2.根据权利要求1所述的方法，其特征在于，所述基于所述相关系数在所述神经网络模型中增加中间节点和/或节点间连接包括：

在所述相关系数的绝对值相对较大的非输出节点与所述输出节点之间建立连接；

在所述相关系数的绝对值相对较小的至少两个非输出节点到所述输出节点之间增加中间节点；

在所述相关系数的绝对值相对较小的中间节点与上游节点之间增加新的中间节点。

3.根据权利要求2所述的方法，其特征在于，所述在所述相关系数的绝对值相对较小的中间节点与上游节点之间增加新的中间节点包括：

在与所述相关系数的绝对值相对较小的中间节点所连接的至少两个上游节点中确定所述相关系数的绝对值相对较小的上游节点；

在所述相关系数的绝对值相对较小的中间节点与所述相关系数的绝对值相对较小的上游节点之间增加新的中间节点；

在所述相关系数的绝对值相对较小的输入节点与所述新的中间节点之间建立连接。

4.根据权利要求1～3中任一项所述的方法，其特征在于，所述基于所述进化后的神经网络模型生成所述预测用模型包括：

基于所述样本数据对所述进化后的神经网络模型进行训练和验证；

判断验证结果是否满足预定的收敛条件；

当不满足所述收敛条件时，针对验证后的神经网络模型再次基于所述样本数据确定非输出节点的输出值与所述输出节点的理论输出值之间的相关系数；基于所述相关系数在所述验证后的神经网络模型中增加中间节点和/或节点间连接，再次得到进化后的神经网络模型；基于所述样本数据对所述进化后的神经网络模型进行训练和验证；判断验证结果是否满足预定的收敛条件；当不满足所述收敛条件时，重复执行本步骤；

当满足所述收敛条件时，得到收敛后的神经网络模型作为所述预测用模型。

5.根据权利要求4所述的方法，其特征在于，所述基于所述样本数据对所述进化后的神经网络模型进行训练和验证包括：

基于所述样本数据对所述进化后的神经网络模型进行训练，确定各节点之间的权值，得到训练后的神经网络模型；

基于所述样本数据对所述训练后的神经网络模型进行验证，确定损失偏差；

当所述损失偏差大于预定值时，再次基于所述样本数据对所述进化后的神经网络模型进行训练，确定各节点之间的权值，得到训练后的神经网络模型；基于所述样本数据对所述训练后的神经网络模型进行验证，确定损失偏差；当所述损失偏差大于预定值时，重复执行本步骤；

当所述损失偏差小于预定值时，得到所述验证后的神经网络模型。

6.根据权利要求5所述的方法，其特征在于，所述基于所述样本数据确定非输出节点的输出值与所述输出节点的理论输出值之间的相关系数包括：

根据所述样本数据中的特征值确定所述输入节点的输出值；

根据所述样本数据中的实际值确定所述输出节点的理论输出值；

根据所述中间节点的各个上游节点的输出值和所述权值确定所述中间节点的输出值；

根据预选的相关系数的类型分别确定各个所述输出值与所述理论输出值之间的相关系数。

7.根据权利要求4所述的方法，其特征在于，所述判断验证结果是否满足预定的收敛条件包括：判断本次验证后得到的损失偏差与前次验证后得到的损失偏差之间的差异是否小于预定值。

8.根据权利要求4所述的方法，其特征在于，所述得到收敛后的神经网络模型作为所述预测用模型包括：

在所述收敛后的神经网络模型中至少一次随机增删中间节点和/或节点间连接，得到变异后的神经网络模型；

基于所述样本数据对各个所述变异后的神经网络模型进行训练和验证；

比较变异前与变异后的神经网络模型的验证结果；

将所述验证结果更优的神经网络模型作为所述预测用模型。

9.根据权利要求1所述的方法，其特征在于，所述预测用模型为用于预测道路的交通状况的模型，所述样本数据为待预测道路的交通状况的历史数据。

10.根据权利要求9所述的方法，其特征在于，所述交通状况为交通流量或平均速度。

11.一种预测方法，其特征在于，包括：

将待预测对象的各个特征值分别输入到根据权利要求1～10中任一项所述方法所构建的预测用模型的各个输入节点中；

12.一种交通信息号灯的控制方法，其特征在于，包括：根据由权利要求11所述预测方法得到的预测结果，控制相应道路上的交通信号灯。

13.一种预测用模型的构建装置，其特征在于，包括：

14.一种预测装置，其特征在于，包括：

特征输入模块，用于将待预测对象的各个特征值分别输入到根据权利要求1～10中任一项所述方法所构建的预测用模型的各个输入节点中；以及

15.一种预测系统，其特征在于，包括：权利要求13所述的预测用模型的构建装置和权利要求14所述的预测装置。

16.一种根据权利要求1～12中任一项所述的方法、根据权利要求13或14所述的装置、以及根据权利要求15所述的系统在交通领域、电子商务领域、物流领域、导航领域、大数据营销领域、通信领域、语音合成领域、新能源领域，金融领域、人工智能领域、云数据领域、影音娱乐领域中的应用。

17.一种交通状况预测用模型的构建方法，其特征在于，包括：

18.根据权利要求17所述的方法，其特征在于，所述基于所述相关系数在所述神经网络模型中增加中间节点和/或节点间连接包括：

19.根据权利要求18所述的方法，其特征在于，所述在所述相关系数的绝对值相对较小的中间节点与上游节点之间增加新的中间节点包括：

20.根据权利要求14～19中任一项所述的方法，其特征在于，所述基于所述进化后的神经网络模型生成所述交通状况预测用模型包括：

判断验证结果是否满足预定的收敛条件；

当满足所述收敛条件时，得到收敛后的神经网络模型作为所述交通状况预测用模型。

21.根据权利要求20所述的方法，其特征在于，所述基于所述样本数据对所述进化后的神经网络模型进行训练和验证包括：

22.根据权利要求21所述的方法，其特征在于，所述基于所述样本数据确定非输出节点的输出值与所述输出节点的理论输出值之间的相关系数包括：

根据所述样本数据中的交通状况的特征值确定所述输入节点的输出值；

根据所述样本数据中的交通状况的实际值确定所述输出节点的理论输出值；

23.根据权利要求20所述的方法，其特征在于，所述判断验证结果是否满足预定的收敛条件包括：判断本次验证后得到的损失偏差与前次验证后得到的损失偏差之间的差异是否小于预定值。

24.根据权利要求20所述的方法，其特征在于，所述得到收敛后的神经网络模型作为所述交通状况预测用模型包括：

比较变异前与变异后的神经网络模型的验证结果；

将所述验证结果更优的神经网络模型作为所述交通状况预测用模型。

25.根据权利要求17所述的方法，其特征在于，所述交通状况的样本数据为待预测道路的交通流量或平均速度的历史数据。

26.一种交通状况预测方法，其特征在于，包括：

将待预测交通状况的各个特征值分别输入到根据权利要求17～25中任一项所述方法所构建的交通状况预测用模型的各个输入节点中；

27.一种交通信息号灯的控制方法，其特征在于，包括：根据由权利要求25所述交通状况预测方法得到的预测结果，控制相应道路上的交通信号灯。

28.一种交通状况预测用模型的构建装置，其特征在于，包括：

29.一种交通状况预测装置，其特征在于，包括：

特征输入模块，用于将待预测交通状况的各个特征值分别输入到根据权利要求17～25中任一项所述方法所构建的交通状况预测用模型的各个输入节点中；以及

30.一种交通状况预测系统，其特征在于，包括：权利要求28所述的交通状况预测用模型的构建装置和权利要求29所述的交通状况预测装置。

31.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1～12和17～27中任一项所述的方法。

32.一种计算机设备，包括存储器，处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1～12和17～27中任一项所述的方法。