CN111310833B

CN111310833B - 一种基于贝叶斯神经网络的出行方式识别方法

Info

Publication number: CN111310833B
Application number: CN202010101845.5A
Authority: CN
Inventors: 裴欣; 胡坚明; 贾邵程; 岳云; 李力; 江逸楠
Original assignee: Tsinghua University; China Academy of Electronic and Information Technology of CETC
Current assignee: Tsinghua University; China Academy of Electronic and Information Technology of CETC
Priority date: 2020-02-19
Filing date: 2020-02-19
Publication date: 2022-11-15
Anticipated expiration: 2040-02-19
Also published as: CN111310833A

Abstract

本发明涉及一种基于贝叶斯神经网络的出行方式识别方法，其特征在于包括以下步骤：1)对原始交通出行数据进行预处理，得到预处理后的数据集；2)对预处理后的数据集进行速度统计直方图特征抽取，从得到的速度统计直方图特征中随机抽取若干组作为训练数据集，其他数据作为测试数据集；3)根据步骤2)中得到的训练数据集和测试数据集的维度大小，构建贝叶斯神经网络；4)利用步骤2)中的训练数据集对步骤3)中构建的贝叶斯神经网络进行训练，得到训练好的贝叶斯神经网络；5)利用步骤4)中训练好的贝叶斯神经网络对测试数据集进行测试，得到测试数据集的出行方式识别结果。本发明可以广泛应用于智能交通和模式识别领域。

Description

一种基于贝叶斯神经网络的出行方式识别方法

技术领域

本发明属于交通数据分析领域，特别是涉及一种基于贝叶斯神经网络的出行方式识别方法。

背景技术

随着现代计算机技术和智能交通研究的蓬勃发展，模式识别技术得到了极大的扩充，衍生出了很多适应现代数据种类和量级变化的新方法。近年来，神经网络技术成为主流，并成功的被用于各种场景和行业中，取得了前所未有的成功。但是，尽管如此，神经网络技术也逐渐凸显出一些不足。首先，目前所使用的传统神经网络技术非常容易陷入过拟合的困境，尤其是对于小数据集。其次，传统神经网络的泛化能力不强。用某个数据集训练的模型，在相同或者相似数据集上表现尚可，如果换做同一个任务下的不同场景，其表现极差。最后，目前的传统神经网络无法对网络的输出进行评估，即无法对输出进行不确定性评估，而对于实际应用来说，是非常重要的。

出行方式识别是交通领域的一个基础性问题，对于居民出行调查、交通规划、交通管理等方面具有十分重要的意义。随着大数据时代的到来，海量的交通数据分析代替了传统的问卷调查，多源异构交通数据对出行方式识别带来了新的问题，第一，多源异构交通数据质量参差不齐，而传统神经网络对大噪声数据处理能力有限，适用性较低；第二、传统神经网络算法的特征提取方法在处理海量交通数据方面效率低；第三、传统神经网络对出行方式的识别精度有限，且识别方法极易陷入过拟合。

发明内容

针对上述问题，本发明的目的是提供一种基于贝叶斯神经网络的出行方式识别方法，该方法利用基于变分推断的贝叶斯神经网络和反向传播算法，以速度统计直方图特征为输入，得到出行方式的识别结果。有效提高了出行方式识别的稳定性和质量。

为实现上述目的，本发明采取以下技术方案：一种基于贝叶斯神经网络的出行方式识别方法，其包括以下步骤：1)对原始交通出行数据进行预处理，得到预处理后的数据集；2)对预处理后的数据集进行速度统计直方图特征抽取，从得到的速度统计直方图特征中随机抽取若干组作为训练数据集，其他数据作为测试数据集；3)根据步骤2)中得到的训练数据集和测试数据集的维度大小，构建贝叶斯神经网络；4)利用步骤2)中的训练数据集对步骤3)中构建的贝叶斯神经网络进行训练，得到训练好的贝叶斯神经网络；5)利用步骤4)中训练好的贝叶斯神经网络对测试数据集进行测试，得到测试数据集的出行方式识别结果。

进一步的，所述步骤1)中，对原始交通出行数据进行预处理，得到预处理后的数据集的方法，包括以下步骤：1.1)获取原始交通出行数据，所获取的数据字段包含时间、经纬度、出行方式；1.2)按照出行方式对所有原始交通出行数据进行轨迹划分，得到多个出行子轨迹段，并计算各条出行子轨迹段的近似速度向量s；1.3)对步骤1.2)中得到的所有出行子轨迹段的近似速度向量s进行处理，得到预处理后的数据集。

进一步的，所述步骤1.1)中，原始数据中每两个轨迹点之间的时间间隔不超过10秒。

进一步的，所述步骤1.2)中，计算各条出行子轨迹段的近似速度向量s的方法为：1.2.1)计算每条出行子轨迹段中所有出行轨迹点之间的时间间隔，得到每条出行子轨迹段的时间间隔向量t；1.2.2)计算每条出行子轨迹段中所有轨迹点之间的曼哈顿距离值，得到每条出行子轨迹段的距离间隔向量d；1.2.3)用每条出行子轨迹段的距离间隔向量d除以时间间隔向量t，得到每条出行子轨迹段的近似速度向量s。

进一步的，所述步骤1.3)中，对步骤1.2)中得到的所有出行子轨迹段的近似速度向量s进行处理，得到预处理后的数据集的方法，包括以下步骤：1.3.1)计算每个近似速度向量s的平均速度v；1.3.2)计算每个近似速度向量s的标准差δ；1.3.3)对于每个近似速度向量s，遍历其每个元素s_i，如|s_i-v|>3δ，则元素s_i将被视为漂移速度从s中删除，进而得到预处理后的数据集。

进一步的，所述步骤2)中，对步骤1)中得到的预处理后的数据集提取速度统计直方图特征的方法，包括以下步骤：2.1)根据预设速度间隔对每条出行子轨迹段的近似速度向量进行特征向量提取，得到每条出行子轨迹段的特征向量；2.2)对所有出行子轨迹段的特征向量进行归一化，得到归一化后的特征向量；2.3)根据预设长度阈值对所有归一化后的特征向量长度进行处理，去除长度小于最小长度阈值的特征向量；对于长度超过最大长度阈值的特征向量进行切割，使切割后特征向量的长度在最小长度阈值和最大长度阈值构成的有效长度之间；2.4)从得到的特征向量中随机抽取若干组作为训练数据集，其他数据作为测试数据集。

进一步的，所述步骤2.1)中，根据预设速度间隔对每条出行子轨迹段的近似速度向量进行特征向量提取，得到每条出行子轨迹段的特征向量的方法为：

对于处于0到100之间的速度，按照预设速度间隔k进行统计，得到长度为

的特征向量；

对于超过100的速度进行统一统计，最终形成

维的特征向量；

进一步的，所述步骤3)中，根据步骤2)中得到的训练数据集和测试数据集的维度大小，构建贝叶斯神经网络的方法，包括以下步骤：3.1)根据步骤2)中得到的训练数据集和测试数据集的维度大小，确定贝叶斯神经网络的设定输入尺寸和隐藏层数目，进而构建贝叶斯神经网络，并记贝叶斯神经网络中的所有参数为W，训练数据为D，并构成未知分布P(W|D)；3.2)采用变分估计法对贝叶斯神经网络的未知分布P(W|D)进行近似，得到其近似分布q(W|θ)，其中，θ为近似分布q的参数；3.3)根据贝叶斯公式对步骤3.2)中的近似分布q(W|θ)进行转换，并采用蒙特卡洛采样方法得到贝叶斯神经网络结构的损失函数；3.4)基于步骤3.3)得到的损失函数，利用反向传播算法对贝叶斯神经网络进行训练。

进一步的，所述步骤3.2)中，近似分布q(W|θ)的计算公式为：

式中，θ^*为贝叶斯神经网络中所有参数W的近似解；KL为一种距离度量。

进一步的，所述步骤3.3)中，贝叶斯神经网络的损失函数为：

其中，W⁽ⁱ⁾为W的采样。

本发明由于采取以上技术方案，其具有以下优点：(1)本发明对原始交通出行数据进行预处理时，采用速度统计直方图特征提取，提取方法简单有效。(2)本发明根据由原始交通出行数据提取得到的特征向量的维度确定贝叶斯神经网络输入尺寸和隐藏层数目，通过调整特征向量的预设速度阈值和预设长度阈值大小，对贝叶斯神经网络模型进行调整，进而使得模型识别结果更精确。(3)本发明利用贝叶斯神经网络对出行方式进行识别，具有高抗噪性，可利用少量数据进行较好的预测，具有较强的泛化能力，提高预测精度，并防止训练的过拟合。因此，本发明可以广泛应用于出行方式识别领域。

附图说明

图1是本发明贝叶斯全连接神经网络结构示意图；

图2是本发明实例中的贝叶斯神经网络结构图。

具体实施方式

下面结合附图和实施例对本发明进行详细的描述。

本发明提出的一种基于贝叶斯神经网络的出行方式识别方法，其包括以下步骤：

1)对原始交通出行数据进行预处理，得到预处理后的数据集；

2)根据预设速度间隔对预处理后的数据集进行速度统计直方图特征抽取，从得到的速度统计直方图特征中随机抽取若干组作为训练数据集，其他的作为测试数据集；

3)根据步骤2)确定的训练数据集和测试数据集的维度大小，构建贝叶斯神经网络；

4)利用步骤2)中的训练数据集对步骤3)中构建的贝叶斯神经网络进行训练，得到训练好的贝叶斯神经网络；

5)利用步骤4)中训练好的贝叶斯神经网络对测试数据集进行测试，得到测试数据集的出行方式识别结果。

进一步的，上述步骤1)中，对原始交通出行数据进行预处理，得到预处理后的数据集的方法，包括以下步骤：

1.1)获取原始交通出行数据，所获取的数据字段应当至少包含时间、经纬度、出行方式，为保证方法的有效性，所获取的数据应当保证每两个轨迹点尽可能稠密，本发明中认为每两个轨迹点之间的时间间隔最好不超过10秒；

1.2)按照出行方式对所有原始交通出行数据进行轨迹划分，得到多个出行子轨迹段，并计算各出行子轨迹段的近似速度向量s。

其中，进行轨迹划分时，每个出行子轨迹段只含有一种出行方式，计算各条出行子轨迹段的近似速度向量s的方法，包括以下步骤：

1.2.1)计算每条出行子轨迹段中所有出行轨迹点之间的时间间隔，得到每条出行子轨迹段的时间间隔向量t；

1.2.2)计算每条出行子轨迹段中所有轨迹点之间的曼哈顿距离值，得到每条出行子轨迹段的距离间隔向量d；

1.2.3)用每条出行子轨迹段的距离间隔向量d除以时间间隔向量t，得到每条出行子轨迹段的近似速度向量s。需注意的是，如果某出行子轨迹段的长度为n，则其对应的距离间隔向量d、时间间隔向量t和近似速度向量s的长度均为n-1。

1.3)对步骤1.2)中得到的所有出行子轨迹段的近似速度向量s进行处理，去除漂移速度点，得到的数据即为预处理后的数据集。具体步骤如下：

1.3.1)计算每个近似速度向量s的平均速度v；

1.3.2)计算每个近似速度向量s的标准差δ；

1.3.3)对于每个近似速度向量s，遍历其每个元素s_i，如|s_i-v|>3δ，则元素s_i将被视为漂移速度从近似速度向量s中删除；至此，得到了预处理后的数据集。

进一步的，上述步骤2)中，根据预设速度间隔对步骤1)中得到的预处理后的数据集提取速度统计直方图特征，也即对每个预处理后的近似速度向量s进行速度直方图统计，具体包括以下步骤：

2.1)对每条出行子轨迹段的近似速度向量进行特征向量提取，提取方法为：对于处于0到100之间的速度，按照预设的速度间隔k进行统计，得到长度为

(

为向上取整符号)的特征向量，对于超过100的速度进行统一统计，最终形成

维的特征向量。

2.2)对得到的所有特征向量进行归一化，即令所得的特征向量除以特征向量中所有元素的和，得到归一化的特征向量；

2.3)根据预设长度阈值对所有归一化后的特征向量长度进行处理，方法为：去除长度小于最小长度阈值的特征向量；对于长度超过最大长度阈值的特征向量进行切割，使切割后特征向量的长度在最小长度阈值和最大长度阈值构成的有效长度之间。

对于不同的数据，需根据具体的数据质量确定最小长度阈值和最大长度阈值。具体确定方法为：对所有长度的特征向量进行训练，并在测试集上进行测试。对所有长度的特征向量按向量长度进行划分统计其测试准确率(如长度为0至120，120至240，以此类推分别统计其测试准确率，此处的间隔可自由确定，根据实验推荐60-180)。为保障方法的准确率，发现过短或者过长的向量都会导致准确率低。本发明实施例中，以测试准确率0.8为界限，得到最小长度阈值为190，最大长度阈值为1650。

2.4)从得到的特征向量中随机抽取若干组作为训练数据集，其他数据作为测试数据集。

进一步的，上述步骤3)中，利用步骤2)中得到的训练数据集和测试数据集中特征向量维度大小设计贝叶斯神经网络。具体步骤为：

3.1)构建贝叶斯神经网络，并记贝叶斯神经网络中的所有参数为W，训练数据为D。

如图1所示，为贝叶斯全连接神经网络结构。该贝叶斯权连接神经网络结构包括输入层、隐藏层和输出层。本发明中采用贝叶斯全连接神经网络，根据步骤2)中确定的训练数据集和测试数据集的维度大小为贝叶斯神经网络设定输入尺寸和隐藏层数目。

对贝叶斯神经网络进行训练，即是对贝叶斯神经网络的网络参数W进行最大后验估计，如下：

W^MAP＝arg max_Wlog P(W|D) (1)

其与传统神经网络的最大似然估计完全不同。但是通常情况下P(W|D)对任何实际的神经网络都是无法直接获得的。即使是非常简单的任务，也无法得知其对应的神经网络的参数分布是如何的。

3.2)采用变分估计法对贝叶斯神经网络中的未知分布P(W|D)进行近似，得到其近似分布q(W|θ)，其中，θ为近似分布q的参数。

因为公式(1)中实际的分布的形式无法得知，于是本发明采用一种形式可表达的已知分布作为未知分布P(W|D)的近似分布，记为q(W|θ)，θ为近似分布q的参数。于是，问题转化为：

式中，θ^*为优化问题arg min_θKL[q(W|θ)||P(W|D)]的解，即近似得到的网络参数；KL为一种距离度量。Kullback-Leibler Divergence，即K-L散度，是一种量化两种概率分布P和Q之间差异的方式，又叫相对熵；arg为求解优化问题的基本符号表达。

3.3)根据贝叶斯公式对步骤3.2)中的近似分布q(W|θ)进行转换，并采用蒙特卡洛采样方法得到贝叶斯神经网络结构的损失函数。

根据贝叶斯公式，可以将上式(2)转换为：

记损失函数为Loss，则：

Loss＝KL[q(W|θ)||P(W)]–E_q(W|θ)[log P(D|W)]

上式(4)中q(W|θ),P(W)和P(D|W)同样无法直接得到，因此，本发明采用蒙特卡洛采样解决如上问题，得到贝叶斯神经网络的损失函数为：

其中，W⁽ⁱ⁾为W的采样。

3.4)基于步骤3.3)得到的损失函数，利用反向传播算法对贝叶斯神经网络进行训练。

记贝叶斯神经网络中每个权重分布均由高斯分布近似，记高斯分布参数为μ和σ，由反向传播算法包括以下计算公式：

ξ～N(0,1) (6)

θ＝(μ,σ) (7)

W＝μ+log(1+e^σ)*ξ (8)

l＝log q(W|θ)–log P(W)·P(D|W) (9)

式中，N为高斯分布；ξ为高斯分布的采样；θ代表参数(μ,σ)，μ为平均数，σ为方差；W为贝叶斯神经网络中用于前向传播的实际参数值；log代表底数为e的对数运算；*代表按位乘法运算；q(W|θ)为近似的高斯分布；P(W)为先验分布；P(D|W)为实际的分布；l为损失函数；

为梯度算子；

为对μ的梯度；e为常数；←表示用后面的式子的值更新前面的变量。

采用反向传播算法对贝叶斯神经网络进行训练为本领域技术人员公知技术，本发明在此不再赘述。

进一步的，上述步骤4)中，利用步骤3)中的反向传播算法和损失函数对所设计的贝叶斯神经网络进行训练时，具体包含设置优化器类型、并设置动量、权重衰减、初始学习率、学习率衰减策略、迭代次数和批次大小。具体训练方法为本领域技术人员公知技术，本发明在此不再赘述。

进一步的，上述步骤5)中，利用步骤4)中训练好的贝叶斯神经网络模型对测试集进行精度测试和应用于实际的预测当中。

实施例一：

本实施例是对由微软亚洲研究院搜集的Geolife数据集进行出行方式识别，步骤如下：

1)对原始交通出行数据进行预处理，得到预处理后的数据集：

Geolife数据集包含182个用户的轨迹数据，其中91.5％的数据为稠密数据，即每两个估计之间的时间间隔在1到5秒之间，距离间隔在5到10米。

按照步骤1.2)对所有数据按照出行方式进行轨迹划分。计算所有出行轨迹点之间的时间间隔，得到每条出行轨迹的时间间隔向量t。同样计算出行轨迹点之间的曼哈顿距离值，得到距离间隔向量d。然后用每条轨迹的距离间隔向量d除以时间间隔向量t，得到每条轨迹的近似速度向量s。注意，如果某轨迹的长度为n，则向量d、t和s的长度均为n-1；

按照步骤1.3)对步骤1.2)中得到的近似速度向量s进行预处理，去除漂移速度点。具体步骤如下：

1.3.1)计算每个近似速度向量s的平均速度v；

1.3.2)计算每个近似速度向量s的标准差δ；

1.3.3)对于每个近似速度向量s，遍历其每个元素s_i，如|s_i-v|>3δ，s_i将被视为漂移速度从s中删除；

至此，得到了预处理后的数据集。

2)对步骤1)中得到预处理后数据提取速度统计直方图特征。对每个预处理后的近似速度向量进行速度直方图统计。具体来说，设置速度间隔k为0.1，从速度0到速度100按照速度间隔k进行统计，得到长度为

为1001(

为向上取整符号)的特征向量，对于超过100的速度进行统计，最终形成

为1002维的特征向量。最后对所得的特征向量除以向量中所有元素的和，得到归一化的特征向量。对所有归一化后的特征向量长度进行统计，去除长度小于190的特征向量。对于长度超过1650的特征向量进行切割，使切割后的长度在有效长度190到1650之间。至此，完成数据的准备工作。如表1所示，为处理完成后的数据集情况。本实例中训练和预测的出行方式包含步行、公交、自行车、汽车和地铁5种。各种方式的数据量如表中所示。其中按比例30％用于测试，70％用于训练。

表1处理后数据集

3)利用步骤2)中得到的特征向量维度1002维设计贝叶斯神经网络。具体步骤为：

3.1)贝叶斯神经网络理论设计。

如图2所示，为本实施例中搭建的贝叶斯神经网络模型。

3.2)采用变分估计法对贝叶斯神经网络中的位置分布P(W|D)进行近似，得到其近似分布q(W|θ)，其中，W为贝叶斯神经网络的所有参数，D为训练数据，θ为近似分布q的参数。

记贝叶斯神经网络所有参数为W，训练数据为D。对于贝叶斯神经网络即对参数进行最大后验估计：

W^MAP＝arg max_Wlog P(W|D)

为了解决上述问题，本发明采用变分估计去近似P(W|D)。因为实际的分布的形式无法得知，于是采用一种形式可表达的已知分布作为位置分布P(W|D)的近似分布，记为q(W|θ)，θ为近似分布q的参数。于是，问题转化为：

3.3)根据贝叶斯公式对步骤3.2)中的近似分布进行转换，并采用蒙特卡洛采样方法得到贝叶斯神经网络结构的损失函数。

根据贝叶斯公式有：

记损失函数为Loss：

Loss＝KL[q(W|θ)||P(W)]–E_q(W|θ)[log P(D|W)]

上式中q(W|θ)，P(W)和P(D|W)同样无法直接得到，这里，采用蒙特卡洛采样解决如上问题，得到：

其中W⁽ⁱ⁾为W的采样。

得到损失函数后，利用反向传播算法对网络进行训练。记贝叶斯神经网络中每个权重分布均由高斯分布近似，记高斯分布参数为μ和σ。

以上便完成了贝叶斯神经网络的理论设计。

如图2所示，本实施例中采用贝叶斯全连接神经网络，根据2)中设定的参数设定贝叶斯神经网络设定输入尺寸为1002维向量。贝叶斯全连接神经网络结构包含一个输入层、一个输出层和中间三层隐藏层。输出层尺寸为5，隐藏层尺寸均为400。

4)利用步骤3)中的反向传播算法和损失函数对所设计的贝叶斯神经网络进行训练。设置优化器类型为Adam优化器，动量、权重衰减、初始学习率和学习率衰减策略均采用默认值。批次大小为128，迭代次数为60个周期。

5)利用步骤4)中训练好的模型对测试集进行精度测试。结果如表2所示。

表2贝叶斯神经网络测试性能

以上给出一种具体的实施方式，但本发明不局限于所描述的实施方式。本发明的基本思路在于上述方案，对本领域普通技术人员而言，根据本发明的教导，设计出各种变形的模型、公式、参数并不需要花费创造性劳动。在不脱离本发明的原理和精神的情况下对实施方式进行的变化、修改、替换和变形仍落入本发明的保护范围内。

Claims

1.一种基于贝叶斯神经网络的出行方式识别方法，其特征在于包括以下步骤：

包括以下步骤：

1.1)获取原始交通出行数据，所获取的数据字段包含时间、经纬度、出行方式；

1.2)按照出行方式对所有原始交通出行数据进行轨迹划分，得到多个出行子轨迹段，并计算各条出行子轨迹段的近似速度向量s；

1.3)对步骤1.2)中得到的所有出行子轨迹段的近似速度向量s进行处理，得到预处理后的数据集；

2)对预处理后的数据集进行速度统计直方图特征抽取，从得到的速度统计直方图特征中随机抽取若干组作为训练数据集，其他数据作为测试数据集；

包括以下步骤：

2.1)根据预设速度间隔对每条出行子轨迹段的近似速度向量进行特征向量提取，得到每条出行子轨迹段的特征向量；

2.2)对所有出行子轨迹段的特征向量进行归一化，得到归一化后的特征向量；

2.3)根据预设长度阈值对所有归一化后的特征向量长度进行处理，去除长度小于最小长度阈值的特征向量；对于长度超过最大长度阈值的特征向量进行切割，使切割后特征向量的长度在最小长度阈值和最大长度阈值构成的有效长度之间；

2.4)从得到的特征向量中随机抽取若干组作为训练数据集，其他数据作为测试数据集；

3)根据步骤2)中得到的训练数据集和测试数据集的维度大小，构建贝叶斯神经网络；

包括以下步骤：

3.1)根据步骤2)中得到的训练数据集和测试数据集的维度大小，确定贝叶斯神经网络的设定输入尺寸和隐藏层数目，进而构建贝叶斯神经网络，并记贝叶斯神经网络中的所有参数为W，训练数据为D，并构成未知分布P(W|D)；

3.2)采用变分估计法对贝叶斯神经网络的未知分布P(W|D)进行近似，得到其近似分布q(W|θ)，其中，θ为近似分布q的参数；

3.3)根据贝叶斯公式对步骤3.2)中的近似分布q(W|θ)进行转换，并采用蒙特卡洛采样方法得到贝叶斯神经网络结构的损失函数；

3.4)基于步骤3.3)得到的损失函数，利用反向传播算法对贝叶斯神经网络进行训练；

2.如权利要求1所述的一种基于贝叶斯神经网络的出行方式识别方法，其特征在于：所述步骤1.1)中，原始数据中每两个轨迹点之间的时间间隔不超过10秒。

3.如权利要求1所述的一种基于贝叶斯神经网络的出行方式识别方法，其特征在于：所述步骤1.2)中，计算各条出行子轨迹段的近似速度向量s的方法为：

1.2.3)用每条出行子轨迹段的距离间隔向量d除以时间间隔向量t，得到每条出行子轨迹段的近似速度向量s。

4.如权利要求1所述的一种基于贝叶斯神经网络的出行方式识别方法，其特征在于：所述步骤1.3)中，对步骤1.2)中得到的所有出行子轨迹段的近似速度向量s进行处理，得到预处理后的数据集的方法，包括以下步骤：

1.3.1)计算每个近似速度向量s的平均速度v；

1.3.2)计算每个近似速度向量s的标准差δ；

1.3.3)对于每个近似速度向量s，遍历其每个元素s_i，如|s_i-v|>3δ，则元素s_i将被视为漂移速度从s中删除，进而得到预处理后的数据集。

5.如权利要求1所述的一种基于贝叶斯神经网络的出行方式识别方法，其特征在于：所述步骤2.1)中，根据预设速度间隔对每条出行子轨迹段的近似速度向量进行特征向量提取，得到每条出行子轨迹段的特征向量的方法为：

的特征向量；

对于超过100的速度进行统一统计，最终形成

维的特征向量。

6.如权利要求1所述的一种基于贝叶斯神经网络的出行方式识别方法，其特征在于：所述步骤3.2)中，近似分布q(W|θ)的计算公式为：

式中，θ^*为优化问题arg min_θKL[q(W|θ)||P(W|D)]的解，即贝叶斯神经网络中所有参数W的近似解；KL为一种距离度量。

7.如权利要求1所述的一种基于贝叶斯神经网络的出行方式识别方法，其特征在于：所述步骤3.3)中，贝叶斯神经网络的损失函数为：

其中，W⁽ⁱ⁾为W的采样。