CN111310833A - 一种基于贝叶斯神经网络的出行方式识别方法 - Google Patents
一种基于贝叶斯神经网络的出行方式识别方法 Download PDFInfo
- Publication number
- CN111310833A CN111310833A CN202010101845.5A CN202010101845A CN111310833A CN 111310833 A CN111310833 A CN 111310833A CN 202010101845 A CN202010101845 A CN 202010101845A CN 111310833 A CN111310833 A CN 111310833A
- Authority
- CN
- China
- Prior art keywords
- neural network
- data set
- travel
- vector
- bayesian neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013531 bayesian neural network Methods 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 42
- 238000012360 testing method Methods 0.000 claims abstract description 40
- 238000013528 artificial neural network Methods 0.000 claims abstract description 32
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 110
- 238000009826 distribution Methods 0.000 claims description 42
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 10
- 238000012614 Monte-Carlo sampling Methods 0.000 claims description 6
- 238000005520 cutting process Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Strategic Management (AREA)
- Probability & Statistics with Applications (AREA)
- Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Algebra (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Computational Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Pure & Applied Mathematics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
Abstract
本发明涉及一种基于贝叶斯神经网络的出行方式识别方法,其特征在于包括以下步骤:1)对原始交通出行数据进行预处理,得到预处理后的数据集;2)对预处理后的数据集进行速度统计直方图特征抽取,从得到的速度统计直方图特征中随机抽取若干组作为训练数据集,其他数据作为测试数据集;3)根据步骤2)中得到的训练数据集和测试数据集的维度大小,构建贝叶斯神经网络;4)利用步骤2)中的训练数据集对步骤3)中构建的贝叶斯神经网络进行训练,得到训练好的贝叶斯神经网络;5)利用步骤4)中训练好的贝叶斯神经网络对测试数据集进行测试,得到测试数据集的出行方式识别结果。本发明可以广泛应用于智能交通和模式识别领域。
Description
技术领域
本发明属于交通数据分析领域,特别是涉及一种基于贝叶斯神经网络的出行方式识别方法。
背景技术
随着现代计算机技术和智能交通研究的蓬勃发展,模式识别技术得到了极大的扩充,衍生出了很多适应现代数据种类和量级变化的新方法。近年来,神经网络技术成为主流,并成功的被用于各种场景和行业中,取得了前所未有的成功。但是,尽管如此,神经网络技术也逐渐凸显出一些不足。首先,目前所使用的传统神经网络技术非常容易陷入过拟合的困境,尤其是对于小数据集。其次,传统神经网络的泛化能力不强。用某个数据集训练的模型,在相同或者相似数据集上表现尚可,如果换做同一个任务下的不同场景,其表现极差。最后,目前的传统神经网络无法对网络的输出进行评估,即无法对输出进行不确定性评估,而对于实际应用来说,是非常重要的。
出行方式识别是交通领域的一个基础性问题,对于居民出行调查、交通规划、交通管理等方面具有十分重要的意义。随着大数据时代的到来,海量的交通数据分析代替了传统的问卷调查,多源异构交通数据对出行方式识别带来了新的问题,第一,多源异构交通数据质量参差不齐,而传统神经网络对大噪声数据处理能力有限,适用性较低;第二、传统神经网络算法的特征提取方法在处理海量交通数据方面效率低;第三、传统神经网络对出行方式的识别精度有限,且识别方法极易陷入过拟合。
发明内容
针对上述问题,本发明的目的是提供一种基于贝叶斯神经网络的出行方式识别方法,该方法利用基于变分推断的贝叶斯神经网络和反向传播算法,以速度统计直方图特征为输入,得到出行方式的识别结果。有效提高了出行方式识别的稳定性和质量。
为实现上述目的,本发明采取以下技术方案:一种基于贝叶斯神经网络的出行方式识别方法,其包括以下步骤:1)对原始交通出行数据进行预处理,得到预处理后的数据集;2)对预处理后的数据集进行速度统计直方图特征抽取,从得到的速度统计直方图特征中随机抽取若干组作为训练数据集,其他数据作为测试数据集;3)根据步骤2)中得到的训练数据集和测试数据集的维度大小,构建贝叶斯神经网络;4)利用步骤2)中的训练数据集对步骤3)中构建的贝叶斯神经网络进行训练,得到训练好的贝叶斯神经网络;5)利用步骤4)中训练好的贝叶斯神经网络对测试数据集进行测试,得到测试数据集的出行方式识别结果。
进一步的,所述步骤1)中,对原始交通出行数据进行预处理,得到预处理后的数据集的方法,包括以下步骤:1.1)获取原始交通出行数据,所获取的数据字段包含时间、经纬度、出行方式;1.2)按照出行方式对所有原始交通出行数据进行轨迹划分,得到多个出行子轨迹段,并计算各条出行子轨迹段的近似速度向量s;1.3)对步骤1.2)中得到的所有出行子轨迹段的近似速度向量s进行处理,得到预处理后的数据集。
进一步的,所述步骤1.1)中,原始数据中每两个轨迹点之间的时间间隔不超过10秒。
进一步的,所述步骤1.2)中,计算各条出行子轨迹段的近似速度向量s的方法为:1.2.1)计算每条出行子轨迹段中所有出行轨迹点之间的时间间隔,得到每条出行子轨迹段的时间间隔向量t;1.2.2)计算每条出行子轨迹段中所有轨迹点之间的曼哈顿距离值,得到每条出行子轨迹段的距离间隔向量d;1.2.3)用每条出行子轨迹段的距离间隔向量d除以时间间隔向量t,得到每条出行子轨迹段的近似速度向量s。
进一步的,所述步骤1.3)中,对步骤1.2)中得到的所有出行子轨迹段的近似速度向量s进行处理,得到预处理后的数据集的方法,包括以下步骤:1.3.1)计算每个近似速度向量s的平均速度v;1.3.2)计算每个近似速度向量s的标准差δ;1.3.3)对于每个近似速度向量s,遍历其每个元素si,如|si-v|>3δ,则元素si将被视为漂移速度从s中删除,进而得到预处理后的数据集。
进一步的,所述步骤2)中,对步骤1)中得到的预处理后的数据集提取速度统计直方图特征的方法,包括以下步骤:2.1)根据预设速度间隔对每条出行子轨迹段的近似速度向量进行特征向量提取,得到每条出行子轨迹段的特征向量;2.2)对所有出行子轨迹段的特征向量进行归一化,得到归一化后的特征向量;2.3)根据预设长度阈值对所有归一化后的特征向量长度进行处理,去除长度小于最小长度阈值的特征向量;对于长度超过最大长度阈值的特征向量进行切割,使切割后特征向量的长度在最小长度阈值和最大长度阈值构成的有效长度之间;2.4)从得到的特征向量中随机抽取若干组作为训练数据集,其他数据作为测试数据集。
进一步的,所述步骤2.1)中,根据预设速度间隔对每条出行子轨迹段的近似速度向量进行特征向量提取,得到每条出行子轨迹段的特征向量的方法为:
进一步的,所述步骤3)中,根据步骤2)中得到的训练数据集和测试数据集的维度大小,构建贝叶斯神经网络的方法,包括以下步骤:3.1)根据步骤2)中得到的训练数据集和测试数据集的维度大小,确定贝叶斯神经网络的设定输入尺寸和隐藏层数目,进而构建贝叶斯神经网络,并记贝叶斯神经网络中的所有参数为W,训练数据为D,并构成未知分布P(W|D);3.2)采用变分估计法对贝叶斯神经网络的未知分布P(W|D)进行近似,得到其近似分布q(W|θ),其中,θ为近似分布q的参数;3.3)根据贝叶斯公式对步骤3.2)中的近似分布q(W|θ)进行转换,并采用蒙特卡洛采样方法得到贝叶斯神经网络结构的损失函数;3.4)基于步骤3.3)得到的损失函数,利用反向传播算法对贝叶斯神经网络进行训练。
进一步的,所述步骤3.2)中,近似分布q(W|θ)的计算公式为:
式中,θ*为贝叶斯神经网络中所有参数W的近似解;KL为一种距离度量。
进一步的,所述步骤3.3)中,贝叶斯神经网络的损失函数为:
其中,W(i)为W的采样。
本发明由于采取以上技术方案,其具有以下优点:(1)本发明对原始交通出行数据进行预处理时,采用速度统计直方图特征提取,提取方法简单有效。(2)本发明根据由原始交通出行数据提取得到的特征向量的维度确定贝叶斯神经网络输入尺寸和隐藏层数目,通过调整特征向量的预设速度阈值和预设长度阈值大小,对贝叶斯神经网络模型进行调整,进而使得模型识别结果更精确。(3)本发明利用贝叶斯神经网络对出行方式进行识别,具有高抗噪性,可利用少量数据进行较好的预测,具有较强的泛化能力,提高预测精度,并防止训练的过拟合。因此,本发明可以广泛应用于出行方式识别领域。
附图说明
图1是本发明贝叶斯全连接神经网络结构示意图;
图2是本发明实例中的贝叶斯神经网络结构图。
具体实施方式
下面结合附图和实施例对本发明进行详细的描述。
本发明提出的一种基于贝叶斯神经网络的出行方式识别方法,其包括以下步骤:
1)对原始交通出行数据进行预处理,得到预处理后的数据集;
2)根据预设速度间隔对预处理后的数据集进行速度统计直方图特征抽取,从得到的速度统计直方图特征中随机抽取若干组作为训练数据集,其他的作为测试数据集;
3)根据步骤2)确定的训练数据集和测试数据集的维度大小,构建贝叶斯神经网络;
4)利用步骤2)中的训练数据集对步骤3)中构建的贝叶斯神经网络进行训练,得到训练好的贝叶斯神经网络;
5)利用步骤4)中训练好的贝叶斯神经网络对测试数据集进行测试,得到测试数据集的出行方式识别结果。
进一步的,上述步骤1)中,对原始交通出行数据进行预处理,得到预处理后的数据集的方法,包括以下步骤:
1.1)获取原始交通出行数据,所获取的数据字段应当至少包含时间、经纬度、出行方式,为保证方法的有效性,所获取的数据应当保证每两个轨迹点尽可能稠密,本发明中认为每两个轨迹点之间的时间间隔最好不超过10秒;
1.2)按照出行方式对所有原始交通出行数据进行轨迹划分,得到多个出行子轨迹段,并计算各出行子轨迹段的近似速度向量s。
其中,进行轨迹划分时,每个出行子轨迹段只含有一种出行方式,计算各条出行子轨迹段的近似速度向量s的方法,包括以下步骤:
1.2.1)计算每条出行子轨迹段中所有出行轨迹点之间的时间间隔,得到每条出行子轨迹段的时间间隔向量t;
1.2.2)计算每条出行子轨迹段中所有轨迹点之间的曼哈顿距离值,得到每条出行子轨迹段的距离间隔向量d;
1.2.3)用每条出行子轨迹段的距离间隔向量d除以时间间隔向量t,得到每条出行子轨迹段的近似速度向量s。需注意的是,如果某出行子轨迹段的长度为n,则其对应的距离间隔向量d、时间间隔向量t和近似速度向量s的长度均为n-1。
1.3)对步骤1.2)中得到的所有出行子轨迹段的近似速度向量s进行处理,去除漂移速度点,得到的数据即为预处理后的数据集。具体步骤如下:
1.3.1)计算每个近似速度向量s的平均速度v;
1.3.2)计算每个近似速度向量s的标准差δ;
1.3.3)对于每个近似速度向量s,遍历其每个元素si,如|si-v|>3δ,则元素si将被视为漂移速度从近似速度向量s中删除;至此,得到了预处理后的数据集。
进一步的,上述步骤2)中,根据预设速度间隔对步骤1)中得到的预处理后的数据集提取速度统计直方图特征,也即对每个预处理后的近似速度向量s进行速度直方图统计,具体包括以下步骤:
2.1)对每条出行子轨迹段的近似速度向量进行特征向量提取,提取方法为:对于处于0到100之间的速度,按照预设的速度间隔k进行统计,得到长度为(为向上取整符号)的特征向量,对于超过100的速度进行统一统计,最终形成维的特征向量。
2.2)对得到的所有特征向量进行归一化,即令所得的特征向量除以特征向量中所有元素的和,得到归一化的特征向量;
2.3)根据预设长度阈值对所有归一化后的特征向量长度进行处理,方法为:去除长度小于最小长度阈值的特征向量;对于长度超过最大长度阈值的特征向量进行切割,使切割后特征向量的长度在最小长度阈值和最大长度阈值构成的有效长度之间。
对于不同的数据,需根据具体的数据质量确定最小长度阈值和最大长度阈值。具体确定方法为:对所有长度的特征向量进行训练,并在测试集上进行测试。对所有长度的特征向量按向量长度进行划分统计其测试准确率(如长度为0至120,120至240,以此类推分别统计其测试准确率,此处的间隔可自由确定,根据实验推荐60-180)。为保障方法的准确率,发现过短或者过长的向量都会导致准确率低。本发明实施例中,以测试准确率0.8为界限,得到最小长度阈值为190,最大长度阈值为1650。
2.4)从得到的特征向量中随机抽取若干组作为训练数据集,其他数据作为测试数据集。
进一步的,上述步骤3)中,利用步骤2)中得到的训练数据集和测试数据集中特征向量维度大小设计贝叶斯神经网络。具体步骤为:
3.1)构建贝叶斯神经网络,并记贝叶斯神经网络中的所有参数为W,训练数据为D。
如图1所示,为贝叶斯全连接神经网络结构。该贝叶斯权连接神经网络结构包括输入层、隐藏层和输出层。本发明中采用贝叶斯全连接神经网络,根据步骤2)中确定的训练数据集和测试数据集的维度大小为贝叶斯神经网络设定输入尺寸和隐藏层数目。
对贝叶斯神经网络进行训练,即是对贝叶斯神经网络的网络参数W进行最大后验估计,如下:
WMAP=arg maxWlog P(W|D) (1)
其与传统神经网络的最大似然估计完全不同。但是通常情况下P(W|D)对任何实际的神经网络都是无法直接获得的。即使是非常简单的任务,也无法得知其对应的神经网络的参数分布是如何的。
3.2)采用变分估计法对贝叶斯神经网络中的未知分布P(W|D)进行近似,得到其近似分布q(W|θ),其中,θ为近似分布q的参数。
因为公式(1)中实际的分布的形式无法得知,于是本发明采用一种形式可表达的已知分布作为未知分布P(W|D)的近似分布,记为q(W|θ),θ为近似分布q的参数。于是,问题转化为:
式中,θ*为优化问题arg minθKL[q(W|θ)||P(W|D)]的解,即近似得到的网络参数;KL为一种距离度量。Kullback-Leibler Divergence,即K-L散度,是一种量化两种概率分布P和Q之间差异的方式,又叫相对熵;arg为求解优化问题的基本符号表达。
3.3)根据贝叶斯公式对步骤3.2)中的近似分布q(W|θ)进行转换,并采用蒙特卡洛采样方法得到贝叶斯神经网络结构的损失函数。
根据贝叶斯公式,可以将上式(2)转换为:
记损失函数为Loss,则:
Loss=KL[q(W|θ)||P(W)]–Eq(W|θ)[log P(D|W)]
=∫q(W|θ)log q(W|θ)dW–∫q(W|θ)log P(W)dW-∫q(W|θ)log P(D|W)dW (4)
上式(4)中q(W|θ),P(W)和P(D|W)同样无法直接得到,因此,本发明采用蒙特卡洛采样解决如上问题,得到贝叶斯神经网络的损失函数为:
其中,W(i)为W的采样。
3.4)基于步骤3.3)得到的损失函数,利用反向传播算法对贝叶斯神经网络进行训练。
记贝叶斯神经网络中每个权重分布均由高斯分布近似,记高斯分布参数为μ和σ,由反向传播算法包括以下计算公式:
ξ~N(0,1) (6)
θ=(μ,σ) (7)
W=μ+log(1+eσ)*ξ (8)
l=log q(W|θ)–log P(W)·P(D|W) (9)
式中,N为高斯分布;ξ为高斯分布的采样;θ代表参数(μ,σ),μ为平均数,σ为方差;W为贝叶斯神经网络中用于前向传播的实际参数值;log代表底数为e的对数运算;*代表按位乘法运算;q(W|θ)为近似的高斯分布;P(W)为先验分布;P(D|W)为实际的分布;l为损失函数;为梯度算子;为对μ的梯度;e为常数;←表示用后面的式子的值更新前面的变量。
采用反向传播算法对贝叶斯神经网络进行训练为本领域技术人员公知技术,本发明在此不再赘述。
进一步的,上述步骤4)中,利用步骤3)中的反向传播算法和损失函数对所设计的贝叶斯神经网络进行训练时,具体包含设置优化器类型、并设置动量、权重衰减、初始学习率、学习率衰减策略、迭代次数和批次大小。具体训练方法为本领域技术人员公知技术,本发明在此不再赘述。
进一步的,上述步骤5)中,利用步骤4)中训练好的贝叶斯神经网络模型对测试集进行精度测试和应用于实际的预测当中。
实施例一:
本实施例是对由微软亚洲研究院搜集的Geolife数据集进行出行方式识别,步骤如下:
1)对原始交通出行数据进行预处理,得到预处理后的数据集:
Geolife数据集包含182个用户的轨迹数据,其中91.5%的数据为稠密数据,即每两个估计之间的时间间隔在1到5秒之间,距离间隔在5到10米。
按照步骤1.2)对所有数据按照出行方式进行轨迹划分。计算所有出行轨迹点之间的时间间隔,得到每条出行轨迹的时间间隔向量t。同样计算出行轨迹点之间的曼哈顿距离值,得到距离间隔向量d。然后用每条轨迹的距离间隔向量d除以时间间隔向量t,得到每条轨迹的近似速度向量s。注意,如果某轨迹的长度为n,则向量d、t和s的长度均为n-1;
按照步骤1.3)对步骤1.2)中得到的近似速度向量s进行预处理,去除漂移速度点。具体步骤如下:
1.3.1)计算每个近似速度向量s的平均速度v;
1.3.2)计算每个近似速度向量s的标准差δ;
1.3.3)对于每个近似速度向量s,遍历其每个元素si,如|si-v|>3δ,si将被视为漂移速度从s中删除;
至此,得到了预处理后的数据集。
2)对步骤1)中得到预处理后数据提取速度统计直方图特征。对每个预处理后的近似速度向量进行速度直方图统计。具体来说,设置速度间隔k为0.1,从速度0到速度100按照速度间隔k进行统计,得到长度为为1001(为向上取整符号)的特征向量,对于超过100的速度进行统计,最终形成为1002维的特征向量。最后对所得的特征向量除以向量中所有元素的和,得到归一化的特征向量。对所有归一化后的特征向量长度进行统计,去除长度小于190的特征向量。对于长度超过1650的特征向量进行切割,使切割后的长度在有效长度190到1650之间。至此,完成数据的准备工作。如表1所示,为处理完成后的数据集情况。本实例中训练和预测的出行方式包含步行、公交、自行车、汽车和地铁5种。各种方式的数据量如表中所示。其中按比例30%用于测试,70%用于训练。
表1处理后数据集
3)利用步骤2)中得到的特征向量维度1002维设计贝叶斯神经网络。具体步骤为:
3.1)贝叶斯神经网络理论设计。
如图2所示,为本实施例中搭建的贝叶斯神经网络模型。
3.2)采用变分估计法对贝叶斯神经网络中的位置分布P(W|D)进行近似,得到其近似分布q(W|θ),其中,W为贝叶斯神经网络的所有参数,D为训练数据,θ为近似分布q的参数。
记贝叶斯神经网络所有参数为W,训练数据为D。对于贝叶斯神经网络即对参数进行最大后验估计:
WMAP=arg maxWlog P(W|D)
其与传统神经网络的最大似然估计完全不同。但是通常情况下P(W|D)对任何实际的神经网络都是无法直接获得的。即使是非常简单的任务,也无法得知其对应的神经网络的参数分布是如何的。
为了解决上述问题,本发明采用变分估计去近似P(W|D)。因为实际的分布的形式无法得知,于是采用一种形式可表达的已知分布作为位置分布P(W|D)的近似分布,记为q(W|θ),θ为近似分布q的参数。于是,问题转化为:
3.3)根据贝叶斯公式对步骤3.2)中的近似分布进行转换,并采用蒙特卡洛采样方法得到贝叶斯神经网络结构的损失函数。
根据贝叶斯公式有:
记损失函数为Loss:
Loss=KL[q(W|θ)||P(W)]–Eq(W|θ)[log P(D|W)]
=∫q(W|θ)log q(W|θ)dW–∫q(W|θ)log P(W)dW-∫q(W|θ)log P(D|W)dW
上式中q(W|θ),P(W)和P(D|W)同样无法直接得到,这里,采用蒙特卡洛采样解决如上问题,得到:
其中W(i)为W的采样。
3.4)基于步骤3.3)得到的损失函数,利用反向传播算法对贝叶斯神经网络进行训练。
得到损失函数后,利用反向传播算法对网络进行训练。记贝叶斯神经网络中每个权重分布均由高斯分布近似,记高斯分布参数为μ和σ。
以上便完成了贝叶斯神经网络的理论设计。
如图2所示,本实施例中采用贝叶斯全连接神经网络,根据2)中设定的参数设定贝叶斯神经网络设定输入尺寸为1002维向量。贝叶斯全连接神经网络结构包含一个输入层、一个输出层和中间三层隐藏层。输出层尺寸为5,隐藏层尺寸均为400。
4)利用步骤3)中的反向传播算法和损失函数对所设计的贝叶斯神经网络进行训练。设置优化器类型为Adam优化器,动量、权重衰减、初始学习率和学习率衰减策略均采用默认值。批次大小为128,迭代次数为60个周期。
5)利用步骤4)中训练好的模型对测试集进行精度测试。结果如表2所示。
表2贝叶斯神经网络测试性能
以上给出一种具体的实施方式,但本发明不局限于所描述的实施方式。本发明的基本思路在于上述方案,对本领域普通技术人员而言,根据本发明的教导,设计出各种变形的模型、公式、参数并不需要花费创造性劳动。在不脱离本发明的原理和精神的情况下对实施方式进行的变化、修改、替换和变形仍落入本发明的保护范围内。
Claims (10)
1.一种基于贝叶斯神经网络的出行方式识别方法,其特征在于包括以下步骤:
1)对原始交通出行数据进行预处理,得到预处理后的数据集;
2)对预处理后的数据集进行速度统计直方图特征抽取,从得到的速度统计直方图特征中随机抽取若干组作为训练数据集,其他数据作为测试数据集;
3)根据步骤2)中得到的训练数据集和测试数据集的维度大小,构建贝叶斯神经网络;
4)利用步骤2)中的训练数据集对步骤3)中构建的贝叶斯神经网络进行训练,得到训练好的贝叶斯神经网络;
5)利用步骤4)中训练好的贝叶斯神经网络对测试数据集进行测试,得到测试数据集的出行方式识别结果。
2.如权利要求1所述的一种基于贝叶斯神经网络的出行方式识别方法,其特征在于:所述步骤1)中,对原始交通出行数据进行预处理,得到预处理后的数据集的方法,包括以下步骤:
1.1)获取原始交通出行数据,所获取的数据字段包含时间、经纬度、出行方式;
1.2)按照出行方式对所有原始交通出行数据进行轨迹划分,得到多个出行子轨迹段,并计算各条出行子轨迹段的近似速度向量s;
1.3)对步骤1.2)中得到的所有出行子轨迹段的近似速度向量s进行处理,得到预处理后的数据集。
3.如权利要求2所述的一种基于贝叶斯神经网络的出行方式识别方法,其特征在于:所述步骤1.1)中,原始数据中每两个轨迹点之间的时间间隔不超过10秒。
4.如权利要求2所述的一种基于贝叶斯神经网络的出行方式识别方法,其特征在于:所述步骤1.2)中,计算各条出行子轨迹段的近似速度向量s的方法为:
1.2.1)计算每条出行子轨迹段中所有出行轨迹点之间的时间间隔,得到每条出行子轨迹段的时间间隔向量t;
1.2.2)计算每条出行子轨迹段中所有轨迹点之间的曼哈顿距离值,得到每条出行子轨迹段的距离间隔向量d;
1.2.3)用每条出行子轨迹段的距离间隔向量d除以时间间隔向量t,得到每条出行子轨迹段的近似速度向量s。
5.如权利要求2所述的一种基于贝叶斯神经网络的出行方式识别方法,其特征在于:所述步骤1.3)中,对步骤1.2)中得到的所有出行子轨迹段的近似速度向量s进行处理,得到预处理后的数据集的方法,包括以下步骤:
1.3.1)计算每个近似速度向量s的平均速度v;
1.3.2)计算每个近似速度向量s的标准差δ;
1.3.3)对于每个近似速度向量s,遍历其每个元素si,如|si-v|>3δ,则元素si将被视为漂移速度从s中删除,进而得到预处理后的数据集。
6.如权利要求2所述的一种基于贝叶斯神经网络的出行方式识别方法,其特征在于:所述步骤2)中,对步骤1)中得到的预处理后的数据集提取速度统计直方图特征的方法,包括以下步骤:
2.1)根据预设速度间隔对每条出行子轨迹段的近似速度向量进行特征向量提取,得到每条出行子轨迹段的特征向量;
2.2)对所有出行子轨迹段的特征向量进行归一化,得到归一化后的特征向量;
2.3)根据预设长度阈值对所有归一化后的特征向量长度进行处理,去除长度小于最小长度阈值的特征向量;对于长度超过最大长度阈值的特征向量进行切割,使切割后特征向量的长度在最小长度阈值和最大长度阈值构成的有效长度之间;
2.4)从得到的特征向量中随机抽取若干组作为训练数据集,其他数据作为测试数据集。
8.如权利要求1所述的一种基于贝叶斯神经网络的出行方式识别方法,其特征在于:所述步骤3)中,根据步骤2)中得到的训练数据集和测试数据集的维度大小,构建贝叶斯神经网络的方法,包括以下步骤:
3.1)根据步骤2)中得到的训练数据集和测试数据集的维度大小,确定贝叶斯神经网络的设定输入尺寸和隐藏层数目,进而构建贝叶斯神经网络,并记贝叶斯神经网络中的所有参数为W,训练数据为D,并构成未知分布P(W|D);
3.2)采用变分估计法对贝叶斯神经网络的未知分布P(W|D)进行近似,得到其近似分布q(W|θ),其中,θ为近似分布q的参数;
3.3)根据贝叶斯公式对步骤3.2)中的近似分布q(W|θ)进行转换,并采用蒙特卡洛采样方法得到贝叶斯神经网络结构的损失函数;
3.4)基于步骤3.3)得到的损失函数,利用反向传播算法对贝叶斯神经网络进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010101845.5A CN111310833B (zh) | 2020-02-19 | 2020-02-19 | 一种基于贝叶斯神经网络的出行方式识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010101845.5A CN111310833B (zh) | 2020-02-19 | 2020-02-19 | 一种基于贝叶斯神经网络的出行方式识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111310833A true CN111310833A (zh) | 2020-06-19 |
CN111310833B CN111310833B (zh) | 2022-11-15 |
Family
ID=71149194
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010101845.5A Active CN111310833B (zh) | 2020-02-19 | 2020-02-19 | 一种基于贝叶斯神经网络的出行方式识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111310833B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112650770A (zh) * | 2020-12-31 | 2021-04-13 | 东北大学 | 基于query workload分析的MySQL参数推荐方法 |
CN112884215A (zh) * | 2021-02-02 | 2021-06-01 | 国网甘肃省电力公司信息通信公司 | 一种基于梯度增强树人口预测模型的参数优化方法 |
CN112966193A (zh) * | 2021-03-05 | 2021-06-15 | 北京百度网讯科技有限公司 | 出行意图推断方法、模型训练方法、相关装置及电子设备 |
CN113063412A (zh) * | 2021-03-25 | 2021-07-02 | 北京理工大学 | 一种基于可靠性分析的多机器人协同定位与建图方法 |
CN113221934A (zh) * | 2021-01-25 | 2021-08-06 | 上海海事大学 | 一种基于规则和高斯过程分类器检测出行方式的方法 |
CN115022810A (zh) * | 2021-03-05 | 2022-09-06 | 中国移动通信集团江苏有限公司 | 基于手机信令数据识别出行方式的方法、装置及电子设备 |
JP7468681B2 (ja) | 2020-10-05 | 2024-04-16 | 日本電信電話株式会社 | 学習方法、学習装置、及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106339608A (zh) * | 2016-11-09 | 2017-01-18 | 中国科学院软件研究所 | 一种基于在线变分贝叶斯支持向量回归的交通事故率预测系统 |
WO2018122585A1 (zh) * | 2016-12-30 | 2018-07-05 | 同济大学 | 一种基于浮动车数据的城市道路交通异常检测方法 |
CN109522432A (zh) * | 2018-09-21 | 2019-03-26 | 重庆大学 | 一种融合自适应相似度和贝叶斯框架的图像检索方法 |
-
2020
- 2020-02-19 CN CN202010101845.5A patent/CN111310833B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106339608A (zh) * | 2016-11-09 | 2017-01-18 | 中国科学院软件研究所 | 一种基于在线变分贝叶斯支持向量回归的交通事故率预测系统 |
WO2018122585A1 (zh) * | 2016-12-30 | 2018-07-05 | 同济大学 | 一种基于浮动车数据的城市道路交通异常检测方法 |
CN109522432A (zh) * | 2018-09-21 | 2019-03-26 | 重庆大学 | 一种融合自适应相似度和贝叶斯框架的图像检索方法 |
Non-Patent Citations (3)
Title |
---|
NICHOLAS JING YUAN, ETC.: "Discovering Urban Functional Zones Using Latent Activity Trajectories", 《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》 * |
徐广根: "轨迹数据挖掘的方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
马超等: "UGES反向传导算法:一种新的小样本深度机器学习模型", 《黑龙江大学自然科学学报》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7468681B2 (ja) | 2020-10-05 | 2024-04-16 | 日本電信電話株式会社 | 学習方法、学習装置、及びプログラム |
CN112650770A (zh) * | 2020-12-31 | 2021-04-13 | 东北大学 | 基于query workload分析的MySQL参数推荐方法 |
CN112650770B (zh) * | 2020-12-31 | 2023-08-01 | 东北大学 | 基于query workload分析的MySQL参数推荐方法 |
CN113221934A (zh) * | 2021-01-25 | 2021-08-06 | 上海海事大学 | 一种基于规则和高斯过程分类器检测出行方式的方法 |
CN112884215A (zh) * | 2021-02-02 | 2021-06-01 | 国网甘肃省电力公司信息通信公司 | 一种基于梯度增强树人口预测模型的参数优化方法 |
CN112966193A (zh) * | 2021-03-05 | 2021-06-15 | 北京百度网讯科技有限公司 | 出行意图推断方法、模型训练方法、相关装置及电子设备 |
CN115022810A (zh) * | 2021-03-05 | 2022-09-06 | 中国移动通信集团江苏有限公司 | 基于手机信令数据识别出行方式的方法、装置及电子设备 |
CN112966193B (zh) * | 2021-03-05 | 2023-07-25 | 北京百度网讯科技有限公司 | 出行意图推断方法、模型训练方法、相关装置及电子设备 |
CN113063412A (zh) * | 2021-03-25 | 2021-07-02 | 北京理工大学 | 一种基于可靠性分析的多机器人协同定位与建图方法 |
CN113063412B (zh) * | 2021-03-25 | 2022-12-02 | 北京理工大学 | 一种基于可靠性分析的多机器人协同定位与建图方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111310833B (zh) | 2022-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111310833B (zh) | 一种基于贝叶斯神经网络的出行方式识别方法 | |
CN110213003B (zh) | 一种无线信道大尺度衰落建模方法及装置 | |
CN110444011B (zh) | 交通流高峰识别方法、装置、电子设备及存储介质 | |
CN114449452B (zh) | 一种基于CNN-RNN的Wi-Fi室内定位方法 | |
CN111355675B (zh) | 一种基于生成对抗网络的信道估计增强方法、装置和系统 | |
Tian et al. | A network traffic prediction method based on IFS algorithm optimised LSSVM | |
CN109359135B (zh) | 一种基于分段权重的时间序列相似性搜索方法 | |
CN102243641A (zh) | 大规模数据的高效聚类方法 | |
CN105046714A (zh) | 一种非监督的基于超像素和目标发现机制的图像分割方法 | |
CN111985383A (zh) | 基于改进变分模态分解的瞬变电磁信号噪声分离识别方法 | |
CN103854661A (zh) | 一种提取音乐特征的方法及装置 | |
CN110879927A (zh) | 一种用于海目标检测的海杂波幅度统计分布现场建模方法 | |
CN114114166A (zh) | 一种基于dtm算法的雷达脉冲去交错方法 | |
US20220051075A1 (en) | Methods and apparatuses for tracking weak signal traces | |
CN105260748A (zh) | 一种不确定数据的聚类方法 | |
CN109034179B (zh) | 一种基于马氏距离idtw的岩层分类方法 | |
Kaiser et al. | Multiple hypotheses at multiple scales for audio novelty computation within music | |
CN114048792A (zh) | 一种基于低精度随机采样数据的轨迹相似度匹配方法 | |
CN106056150A (zh) | 基于人工智能随机森林方法建立不同车型分零件远程定损系统及方法 | |
Purnawansyah et al. | K-Means clustering implementation in network traffic activities | |
WO2022188574A1 (zh) | 一种回归任务的深度学习方法和装置 | |
CN112738724B (zh) | 一种区域目标人群的精准识别方法、装置、设备和介质 | |
CN113127696A (zh) | 一种提高基于行为的影响力度量准确性方法 | |
CN111083632A (zh) | 一种基于支持向量机的超宽带室内定位方法 | |
CN113722374B (zh) | 基于后缀树的时间序列变长模体挖掘方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |