CN109919387A

CN109919387A - 一种采用重采样递归神经网络的地铁乘客拥挤度预测方法

Info

Publication number: CN109919387A
Application number: CN201910198026.4A
Authority: CN
Inventors: 胡蓉; 许伟辉; 邹复民; 廖律超; 方卫东; 徐翔; 薛醒思; 张美润
Original assignee: Fujian University of Technology
Current assignee: Fujian University of Technology
Priority date: 2019-03-15
Filing date: 2019-03-15
Publication date: 2019-06-21

Abstract

本发明涉及交通数据分析领域，尤其涉及一种采用重采样递归神经网络的地铁乘客拥挤度预测方法。包括以下步骤：依据原始数据设定训练样本数据，设定拥挤度标签，依据拥挤度标签将样本数据分为n个子样本集，对子样本集进行重采样，获取重采样数列，将重采样数列输入递归神经网络模型，以训练递归神经网络模型，对递归神经网络模型测评，依据测评结果调节重采样权值，直至测评结果为及格。现有技术中，往往从训练样本数据中进行随机采样，但是不同类别的样本分布不均，从而造成递归神经网络模型对多数样本过拟合对少数样本欠拟合，从而造成预测不准确。本发明通过重采样对样本进行二次采样，使得模型充分训练，从而有效提高预测精度。

Description

一种采用重采样递归神经网络的地铁乘客拥挤度预测方法

技术领域

本发明涉及交通数据分析领域，尤其涉及一种采用重采样递归神经网络的地铁乘客拥挤度预测方法。

背景技术

随着技术的发展，地铁因其具备良好的便利性同时拥有快速的运输速度逐渐成为人们主要的出行方式之一，随着越来越多的乘客选择地铁作为他们的主要交通工具，也加剧了地铁高峰期的拥堵程度，甚至高峰期时乘客数量超过了地铁的运用能力造成乘客拥挤，乘客拥挤已经严重影响到了人们的日常生活和城市交通的发展。因此有效及时地向公众发布地铁乘客拥挤度显得无比重要，也是解决拥挤的重要手段之一。

人工智能技术中的深度学习方法可以有效的应用在交通数据分析领域中，而递归神经网络作为深度学习的算法之一被广泛应用。但是在训练过程中若按照常规的方法直接从样本数据中随机采样训练递归神经网络模型，模型很容易对多数样本过拟合，从而造成模型难以对地铁拥挤度进行准确预测。由此可见，提供一种采用重采样递归神经网络的地铁拥挤度预测方法是十分有必要的。

发明内容

针对现有技术的技术问题，本发明提供了一种采用重采样递归神经网络的地铁拥挤度预测方法。

为解决上述技术问题，本发明提供了以下的技术方案：

一种采用重采样递归神经网络的地铁拥挤度预测方法，包括以下步骤：

第1步：依据原始数据设定训练样本数据；

第2步：设定拥挤度标签，将第1步所得的训练样本数据依据拥挤度标签分为n个子样本集；

第3步：对第2步所得的子样本集进行重采样，重采样权值为随机选取，依据重采样结果设定重采样数列；

第4步：将第3步所得的重采样数列输入递归神经网络模型，以训练递归神经网络模型，直至递归神经网络模型训练完成；

第5步：对第4步所得的递归神经网络模型测评；

第6步：依据测评结果调节第3步中的重采样权值，重复执行第3步至第5步，直至测评结果为及格。

采用地铁公司乘客运用数据作为原始数据。依据乘客人数占车厢载重的百分比设定n个拥挤度标签，依据拥挤度标签将训练样本数据氛围n个子样本集，对子样本集进行重采样，重采样权值的初始值为随机生成，例如：0.25、0.25、0.25、0.25，将随机生成的重采样权值与各个子样本集的样本数相乘以对子样本集进行重采样，依据重采样的结果生成重采样数列，将重采样数列输入递归神经网络模型以对递归神经网络模型进行训练，对训练完成的递归神经网络模型进行测评，调节重采样的权值重复对递归神经网络模型进行训练直至测评结果为及格。通过对训练样本进行重采样，有效避免了因样本分布不均使得递归神经网络对多数样本过拟合对少数样本欠拟合，从而造成递归神经网络模型对地铁拥挤度预测不准确。

进一步的，所述n等于4；4个拥挤度标签分别为不拥挤、轻度拥挤、中度拥挤、重度拥挤。

进一步的，所述不拥挤为乘客人数小于车厢载重的30%；所述轻度拥挤为乘客人数大于车厢载重的30%小于车厢载重的60%；所述中度拥挤为乘客人数大于车厢载重的60%小于车厢载重的100%；所述重度拥挤为乘客人数大于车厢载重的100%。

进一步的，通过交叉熵、查准率、查全率、F1-score对所述第4步所得的递归神经网络模型测评，若F1-score大于0.6则测评结果为及格。

进一步的，所述重采样计算公式为：

其中minibatch为采样总数，Wi为第i个子样本集的重采样权值，B（xi）为第i个子样本集的样本数，n为子样本集数。

进一步的，所述第4步包括以下步骤：

第4-1步：正向传播过程计算；

第4-2步：反向传播过程计算；

第4-3步：将所述第4-2步所得的Wout1、bout1、Win1、bin1、Wh1分别替换所述第4-1步中的Wout、bout、Win、bin、Wh。

进一步的，所述第4-1步包括以下步骤：

第4-11步：计算隐含层状态序列，所述隐含层状态序列计算公式为：

其中Z(t)为隐含层状态序列，为激活函数的一种，Win为输入层的权值，X（t）为输入时间序列，Wh为隐含层神经元之间的权值，bin为输入层的偏差值；

第4-12步：计算输出时间序列，所述输出时间序列计算公式为：

其中 O(t)为输出时间序列，Wout为输出层的权值，bout为输出层的偏差值；

第4-13步：计算预测输出值，所述预测输出值计算公式为：

其中，为第t步预测输出值，为激活函数的一种。

进一步的，若首次执行所述第4-1步，则所述Wh、所述Wout、所述Win、所述bin、所述bout随机产生。

进一步的，所述为tanh函数，所述为Softmax函数。

进一步的，所述第4-2步包括以下步骤：

第4-21步：设定时间损失值为L（t），计算Wout1、bout1，所述Wout1计算公式为：

所述bout1 计算公式为：

其中y（t）为第t步实际值；

第4-22步：设定时间t下隐含层状态梯度△（t）,计算Win1、bin1、Wh1，所述Win1计算公式为：

所述bin1的计算公式为：

所述Wh1的计算公式为：

相较于现有技术，本发明具有以下优点：

依据拥挤度标签将样本数据分为多个子样本集，利用重采样对子样本集进行二次采样，使得采样更加均匀，处于不同状态的样本均能选取的到。

利用重采样，有效的防止了递归神经网络模型对多数样本过拟合对少数样本欠拟合，从而导致预测不准确。

通过对递归神经网络模型测评，依据测评结果可以选择出最优的重采样权值。

附图说明

图1：训练流程图。

图2：递归神经网络运算流程图。

具体实施方式

以下是本发明的具体实施例并结合附图，对本发明的技术方案作进一步的描述，但本发明并不限于这些实施例。

第1步：依据原始数据设定训练样本数据；

第2步：设定4个拥挤度标签，分别为不拥挤、轻度拥挤、中度拥挤、重度拥挤。将第1步所得的训练样本数据依据拥挤度标签分为4个子样本集；

第5步：通过交叉熵、查准率、查全率、F1-score对第4步所得的递归神经网络模型测评；

第6步：依据测评结果调节第3步中的重采样权值，重复执行第3步至第5步，直至F1-score大于0.6。

通过地铁公司获得的乘客运用数据即为原始数据，依据获得的原始数据设定训练样本数据，依据乘客人数占车厢载重的百分比设定4个拥挤度标签，分别为不拥挤、轻度拥挤、中度拥挤、重度拥挤，其中不拥挤为乘客人数小于车厢载重的30%，轻度拥挤为乘客人数大于车厢载重的30%小于车厢载重的60%，中度拥挤为乘客人数大于车厢载重的60%小于车厢载重的100%，重度拥挤为乘客人数大于车厢载重的100%。例如：一节车厢共有40个座位，车厢载重为120人，当前车厢人数为110人，则当前本车厢为重度拥挤。依据拥挤度标签将样本数据分为4个子样本集。

对4个子样本集进行重采样，重采样权值的初始值为随机选取，例如：0.25、0.25、0.25、0.25。重采样权值之和等于1。重采样公式为：

其中minibatch为采样总数，Wi为第i个子样本集的重采样权值，B（xi）为第i个子样本集的样本数，n为子样本集数。Wi与B（xi）的乘积即为从第i个子样本集中采样的采样个数，各个子样本集中采样的采样个数之和即为minibatch。例如：第一至第四个子样本集的样本个数分别为100、80、60、20，重采样权值分别为0.25、0.25、0.25、0.25，则每个子样本集重采样的样本个数分别为25、20、15、5，采样总数为65，依据重采样结果设定重采样数列，则重采样数列的首项至末项依次为25、20、15、5。由此，即可根据权值比例从子样本集随机采样获取每次训练批量样本。

将重采样数列输入递归神经网络模型，以训练递归神经网络模型。先进行正向传播过程计算，其中隐含层状态序列计算公式为：

其中Z(t)为隐含层状态序列，为tanh函数，Win为输入层的权值，X（t）为输入时间序列，Wh为隐含层神经元之间的权值，bin为输入层的偏差值。

输出时间序列计算公式为：

其中 O(t)为输出时间序列，Wout为输出层的权值，bout为输出层的偏差值。

预测输出值计算公式为：

其中，为第t步预测输出值，为Softmax函数。

其中Wout、bout、Win、bin、Wh的初始值通过随机函数随机生成。

利用正向传播过程计算所得的结果计算反向传播过程，通过反向传播过程即可推导出Wout1、bout1、Win1、bin1、Wh1。计算过程如下：

由于每次时间槽中都会有损失，则设定损失值为L，L的计算公式为：

则 Wout1计算公式为：

bout1计算公式为：

其中y（t）为第 t步实际值。

定义时间t下隐含层状态的梯度为△（t），△（t）的计算公式为：

Win1计算公式为：

所述bin1的计算公式为：

所述Wh1的计算公式为：

将获得的Wout1、bout1、Win1、bin1、Wh1分别替换正向传播过程中的Wout、bout、Win、bin、Wh，再次进行正向传播过程计算，通过这种方法训练递归神经网络模型，直至递归神经网络模型训练完成。

依据原始数据设定测试样本数据，通过交叉熵、查准率、查全率、F1-score对训练好的递归神经网络模型测评，其中交叉熵的公式为：

查准率、查全率公式分别为：

其中查准率可以有效的表明预测为拥挤的车厢中实际为拥挤的有多少，例如：重度拥挤的查准率为90%，则表明预测为重度拥挤的车厢共有100个，其中90个为重度拥挤，剩余的10个不是重度拥挤的车厢被递归神经网络模型误判为重度拥挤。查全率可以有效表明实际为拥挤的车厢中有多少个被准确预测为拥挤，例如：重度拥挤的查全率为80%，则表明实际为重度拥挤的车厢共有100个，其中80个被递归神经网络模型准确预测为重度拥挤。

通过实验，当重采样权值分别为0.15、0.15、0.2、0.5时，即每次采样时从重度拥挤子样本集中采样15%，从中度拥挤子样本集中采样15%，从轻度拥挤子样本集中采样20%，从不拥挤子样本集中采样50%，由此所得的递归神经网络模型为最优，重度拥挤的查准率、查全率分别为91%、81%，F1-score为86%。若采用常规方法在训练样本数据中随机抽取样本对递归神经网络模型训练虽然预测不拥挤的查准率、查全率分别为97%、96%，但重度拥挤的预测性能很差，重度拥挤的查准率、查全率分别为 69%、45%，并不能达到实际需求。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims

1.一种采用重采样递归神经网络的地铁拥挤度预测方法，其特征在于：包括以下步骤：

第1步：依据原始数据设定训练样本数据；

第5步：对第4步所得的递归神经网络模型测评；

2.根据权利要求1所述的一种采用重采样递归神经网络的地铁拥挤度预测方法，其特征在于：所述n等于4；

4个拥挤度标签分别为不拥挤、轻度拥挤、中度拥挤、重度拥挤。

3.根据权利要求2所述的一种采用重采样递归神经网络的地铁拥挤度预测方法，其特征在于：所述不拥挤为乘客人数小于车厢载重的30%；

所述轻度拥挤为乘客人数大于车厢载重的30%小于车厢载重的60%；

所述中度拥挤为乘客人数大于车厢载重的60%小于车厢载重的100%；

所述重度拥挤为乘客人数大于车厢载重的100%。

4.根据权利要求1所述的一种采用重采样递归神经网络的地铁拥挤度预测方法，其特征在于：通过交叉熵、查准率、查全率、F1-score对所述第4步所得的递归神经网络模型测评，若F1-score大于0.6则测评结果为及格。

5.根据权利要求1所述的一种采用重采样递归神经网络的地铁拥挤度预测方法，其特征在于：所述重采样计算公式为：

6.根据权利要求1所述的一种采用重采样递归神经网络的地铁拥挤度预测方法，其特征在于：所述第4步包括以下步骤：

第4-1步：正向传播过程计算；

第4-2步：反向传播过程计算；

7.根据权利要求6所述的一种采用重采样递归神经网络的地铁拥挤度预测方法，其特征在于：所述第4-1步包括以下步骤：

第4-13步：计算预测输出值，所述预测输出值计算公式为：

其中，为第t步预测输出值，为激活函数的一种。

8.根据权利要求6所述的一种采用重采样递归神经网络的地铁拥挤度预测方法，其特征在于：若首次执行所述第4-1步，则所述Wh、所述Wout、所述Win、所述bin、所述bout随机产生。

9.根据权利要求6所述的一种采用重采样递归神经网络的地铁拥挤度预测方法，其特征在于：所述为tanh函数，所述为Softmax函数。

10.根据权利要求6所述的一种采用重采样递归神经网络的地铁拥挤度预测方法，其特征在于：所述第4-2步包括以下步骤：

所述bout1计算公式为：

其中y（t）为第t步实际值；

所述bin1的计算公式为：

所述Wh1的计算公式为：

。