CN104834977A - 基于距离度量学习的交通警情等级预测方法 - Google Patents

基于距离度量学习的交通警情等级预测方法 Download PDF

Info

Publication number
CN104834977A
CN104834977A CN201510250180.3A CN201510250180A CN104834977A CN 104834977 A CN104834977 A CN 104834977A CN 201510250180 A CN201510250180 A CN 201510250180A CN 104834977 A CN104834977 A CN 104834977A
Authority
CN
China
Prior art keywords
sample
traffic alert
traffic
distance
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510250180.3A
Other languages
English (en)
Other versions
CN104834977B (zh
Inventor
王浩
李建元
陈涛
顾超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZHEJIANG ENJOYOR INSTITUTE Co Ltd
Original Assignee
ZHEJIANG ENJOYOR INSTITUTE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZHEJIANG ENJOYOR INSTITUTE Co Ltd filed Critical ZHEJIANG ENJOYOR INSTITUTE Co Ltd
Priority to CN201510250180.3A priority Critical patent/CN104834977B/zh
Publication of CN104834977A publication Critical patent/CN104834977A/zh
Application granted granted Critical
Publication of CN104834977B publication Critical patent/CN104834977B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于距离度量学习的交通警情等级预测方法,对已知天气数据、时间数据、环境数据等情况下的城市交通警情等级进行预测,将整理好的多维历史数据根据交警指挥部门要求进行分类,利用广义马氏距离度量方法对分类标记后的多维历史数据进行学习,则距离度量学习矩阵获得了各个特征属性对交通警情等级的权值,权值大的特征属性对分类贡献度大,根据带权值的欧氏距离计算当前的多维数据与历史数据的相似度,选择与当前数据最相似的K个历史数据进行警情等级投票,得票高的警情等级作为当前交通警情等级的预测结果。本发明有效实现预测、准确性较好。

Description

基于距离度量学习的交通警情等级预测方法
技术领域
本发明属于智能交通领域,具体涉及一种城市交通警情等级预测方法。
背景技术
随着经济的迅速发展,城市交通系统中机动车保有量的快速增长导致发生交通事故、交通拥堵的概率大大增加,当前城市交通状态发布和诱导都是针对单个路段、局部区域,主要面对道路上的机动车驾驶者,对于交通管理人员更希望获得宏观区域的交通警情等级,对未来某个时间段内的区域警情等级进行有效的预测有助于交通管理部门优化警力部署、制定相应的预案,缓解重点地区的交通压力。
专利201410610003.7采集包含工作日、非工作日且包含重大节假日交通流数据,将相同连续时间段交通流数据重组为自然数,建立短时交通流数据库,将当前交通流重组数据与短时交通流数据库中历史数据进行大小比对,截取相似样本空间,利用偏差最小的两个样本进行预测,该方法仅侧重于考虑时间因素对交通流数据的影响,没有引入天气因素且未揭示各个特征属性之间的内在联系;专利200510113396.1通过观测交通流量和动态,以及诸如一天中的时间和一周中的日子、假期、学校状况、诸如体育比赛等大型集会的时间安排和性质、天气预报、交通事件报告、和建设与封路等其它环境数据,预测拥塞地点并用于离线和实时的自动路线推荐和计划,该方法将交通系统抽象成一组随机变量来进行关于交通流量和拥塞的预报,仅对交通参与者有效,不能对交通管理者提供决策支持。本专利与上述专利有本质不同,数据来源方面综合考虑天气因素、时间因素、环境因素等对城市交通警情等级的影响,并通过广义马氏度量学习方法提取各个特征属性的权值,充分揭示各个属性对交通警情等级影响的重要程度,根据学习的特征属性权值对交通警情等级进行预测。
发明内容
为了克服已有交通警情判别方式的无预测功能、准确性较差的不足,本发明提供了一种有效实现预测、准确性较好的基于距离度量学习的交通警情等级预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于距离度量学习的交通警情等级预测方法,包括以下步骤:
步骤1:多维数据整理和交通警情等级分类
采集历史天气数据、历史重大活动数据、建设和封路环境数据与工作日、节假日和历史交通警情数共同构成关于交通警情的多维历史数据库,当前时刻的交通流量和上一时刻的流量密切相关,将连续的历史交通警情数据按照等时间段切分为n个片段作为训练样本,每个训练样本片段包括天气属性、重大活动属性、环境因素属性、工作日和节假日属性,根据交通管理部门提供的交通警情阈值对n个训练样本进行交通警情等级分类;
步骤2:距离度量学习提取分类后的交通警情样本所对应的多维特征属性权值
根据步骤1得出n个已标记训练样本构成的一个样本空间,该样本空间中各个元素之间的距离称为度量,其中距离是定义在向量空间中的一种函数,指两个元素在空间中相隔的长度,也就是说可以将某个空间中的所有对象投影到一个新的度量空间中;选取n个训练样本构成包含多维特征属性的样本空间X,其中X=(x1,x2,x3,…,xn),xi对应第i个样本代表的多维特征属性,式(1)是样本空间X中xi和xj样本点间的马氏距离,其中矩阵A是我们需要学习的距离度量矩阵,矩阵A中的每一行代表一个历史样本,每一列对应样本中的一维特征属性
d m ( x i , x j ) = d A ( x i , x j ) = | | x i - x j | | A = ( x i - x j ) T A ( x i - x j ) - - - ( 1 )
式(1)中的A是样本空间X的协方差矩阵,样本空间X中的每个样本均带有交通警情等级标签,故在最小化相同警情等级S(S∈X)中样本之间的马氏距离平方和的同时,约束不同警情等级D(D∈X)中样本之间的马氏距离和,马氏距离和大于预设阈值,目标函数模型如式(2),式(3)所示:
s . t . Σ ( x i , x j ) ∈ D d A ( x i , x j ) ≥ 1 - - - ( 3 )
其中,表示A为半正定矩阵,由目标函数模型求取距离度量学习矩阵A的过程是一个凸优化问题,采用牛顿法对上述凸优化问题进行求解,最终学习到的距离度量矩阵为一个稀疏的对角阵;
步骤3:带权值的欧氏距离寻找与当前特征属性最相似的K个历史交通警情
使用欧氏距离计算K近邻需首先对各个特征属性进行归一化,假定样本空间X中的样本点x包含k维特征属性,样本点之间的近邻一般由欧氏距离来度量,设第i个样本点为其中表示第i个样本第l个特征属性值,两个样本xi和xj之间的欧氏距离定义为公式(4):
d o ( x i , x j ) = Σ l = 1 k ( x l i - x l j ) 2 - - - ( 4 )
给定一个待预测的交通警情样本xq,由标准欧氏距离可计算出样本xq与历史样本空间中最近邻的K个样本x1,x2,…,xK,样本之间的距离是根据样本的所有特征计算的,步骤2中距离度量学习矩阵得出的权值对特征属性与交通警情等级之间的权重关系进行了量化,定义含多维特征属性权值的交通警情相似度如公式(5),式中xq为待预测的交通警情样本,xh属于X=(x1,x2,x3,…,xn)为n个历史交通警情数据中的一个样本,每个样本包含k维特征属性,分母加上0.01是为了避免当相等时出现分母为0的情况,
s ( x q , x h ) = 1 d ( x q , x h ) = 1 Σ l = 1 k w l ( x l q - x l h ) 2 + 0.01 - - - ( 5 )
其中wl是第l个特征的权重,由步骤2中距离度量学习得到对角矩阵A,对角线上的值即为特征属性权值,训练得到的权值根据特征属性一一对应,由公式(5)计算当前特征属性与历史交通警情数据库中各个样本的相似度,相似度最大的前K个历史交通警情数据x1,x2,…,xK作为当前交通警情等级预测的参考;
步骤4:K近邻相似交通警情等级投票
x1,x2,…,xK为步骤3得出的K个最相似历史交通警情样本,其中每一个样本xi所属的类别均已知,统计K个最相似历史交通警情等级,将出现频率最高的类别作为交通警情等级预测结果,K值是一个自定义的常数。
进一步,随机将历史交通警情数据分为两部分,一部分作为训练样本,一部分作为测试样本,训练样本中含有交通警情等级类别标签,测试样本中去除交通警情等级类别标签,经步骤3计算出前K个最相似的交通警情等级,取出现频率最高的警情等级与测试样本原有的警情等级进行对比,交叉验证本方法的准确率,通过选取不同的K值,对每个K值做100次交叉验证计算出平均准确率,选择准确率最大的K值作为交通警情等级预测的投票数。
本发明的技术构思为:对已知天气数据、时间数据、环境数据等情况下的城市交通警情等级进行预测,将整理好的多维历史数据根据交警指挥部门要求进行分类,利用广义马氏距离度量方法对分类标记后的多维历史数据进行学习,则距离度量学习矩阵获得了各个特征属性对交通警情等级的权值,权值大的特征属性对分类贡献度大,根据带权值的欧氏距离计算当前的多维数据与历史数据的相似度,选择与当前数据最相似的K个历史数据进行警情等级投票,得票高的警情等级作为当前交通警情等级的预测结果。
本发明的有益效果主要表现在:(1)全面系统地考虑天气因素、时间因素、环境因素对交通警情等级的影响,采用距离学习矩阵将特征属性与交通警情等级之间的关系进行量化描述,这一度量方法综合考虑到了多维数据集的特征和各个样本之间的关系,使对交通警情等级影响大的特征属性权值变大,对交通警情等级贡献度小的特征属性权值变小,更多的权重加在关键的因素上,通过历史数据片段加上权重系数预测未来的交通警情等级。
(2)采用的基于广义马氏距离的度量学习矩阵能够根据历史数据自动获取各个样本的特征属性加权值,再根据该权值对交通警情等级进行预测,基于历史数据动态更新权值能使经由它预测出来的交通警情等级符合交通管理者所期望的要求。
(3)由历史交通警情数据提取的特征属性权值对影响交通警情等级的各种因素进行重要性重新排序,减小噪声特征对交通警情等级的影响,特征属性权值包含交通警情数据特性,使各项因素对交通警情等级的影响更加符合规律,最大程度地改善交通警情等级的预测精度。
附图说明
图1是基于距离度量学习的交通警情等级预测方法的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1.一种基于距离度量学习的交通警情等级预测方法,包括以下步骤:
步骤1:多维数据整理和交通警情等级分类
采集历史天气数据、历史重大活动数据、建设和封路等其它环境数据与工作日、节假日和历史交通警情数共同构成关于交通警情的多维历史数据库,真实的城市交通网络中,当前时刻的交通流量和上一时刻的流量密切相关,将连续的历史交通警情数据按照等时间段切分为n个片段作为训练样本,每个训练样本片段包括天气属性、重大活动属性、环境因素属性、工作日和节假日属性,根据交通管理部门提供的交通警情阈值对n个训练样本进行交通警情等级分类。
步骤2:距离度量学习提取分类后的交通警情样本所对应的多维特征属性权值
根据步骤1得出n个已标记训练样本构成的一个样本空间,该样本空间中各个元素之间的距离称为度量,其中距离是定义在向量空间中的一种函数,指两个元素在空间中相隔的长度,也就是说可以将某个空间中的所有对象投影到一个新的度量空间中,新的度量空间中,同类的或相似的元素之间的距离很小,而不同类的或不相似的元素之间的距离较大,本方法选取n个训练样本构成包含多维特征属性的样本空间X,其中X=(x1,x2,x3,…,xn),xi对应第i个样本代表的多维特征属性,式(1)是样本空间X中xi和xj样本点间的马氏距离,其中矩阵A是我们需要学习的距离度量矩阵,矩阵A中的每一行代表一个历史样本,每一列对应样本中的一维特征属性
d m ( x i , x j ) = d A ( x i , x j ) = | | x i - x j | | A = ( x i - x j ) T A ( x i - x j ) - - - ( 1 )
这一度量考虑到了数据集的特征和各个样本之间的关系,能使经由它计算出来的距离值符合我们所期望的要求,在理想的情况下,同类点之间的距离比不同类点之间的距离小得多。式(1)中的A是样本空间X的协方差矩阵,样本空间X中的每个样本均带有交通警情等级标签,故在最小化相同警情等级S(S∈X)中样本之间的马氏距离平方和的同时,约束不同警情等级D(D∈X)中样本之间的马氏距离和(令其大于某个阈值),利用这种方式构建的目标优化函数,使得在新的度量空间中相同警情等级样本更加紧凑,而不同警情等级样本更加分离,目标函数模型如式(2),式(3)所示:
s . t . Σ ( x i , x j ) ∈ D d A ( x i , x j ) ≥ 1 - - - ( 3 )
其中,表示A为半正定矩阵。由目标函数模型求取距离度量学习矩阵A的过程是一个凸优化问题,本方法采用牛顿法对上述凸优化问题进行求解,最终学习到的距离度量矩阵为一个稀疏的对角阵,当A为单位阵时马氏距离褪化为欧氏距离,而本方法训练得出A矩阵为对角矩阵,属于广义马氏距离。距离度量学习矩阵对角线上的元素即为多维特征属性的权值,该方法可以使更多的权重加在对交通警情等级影响关键的特征属性上,当某个特征属性对交通警情等级贡献度更大时,意味着同类样本间距较近,相应的权值经过大量样本计算变大,如果某个特征属性对交通警情等级贡献度较小时,相应的权值经过大量样本计算应较小甚至趋于零,训练得到的特征属性权值具有交通警情数据的特性,并反映出各种因素对交通警情等级的不同影响,能够代表交通警情数据的特点。
步骤3:带权值的欧氏距离寻找与当前特征属性最相似的K个历史交通警情
使用欧氏距离计算K近邻需首先对各个特征属性进行归一化,传统的K近邻算法选择的相似性度量通常是欧氏距离的倒数,也就是说两者的距离越小表示两者的相似性越大,反之则相似性越小,假定样本空间X中的样本点x包含k维特征属性,样本点之间的近邻一般由欧氏距离来度量,设第i个样本点为其中表示第i个样本第l个特征属性值,两个样本xi和xj之间的欧氏距离定义为公式(4):
d o ( x i , x j ) = Σ l = 1 k ( x l i - x l j ) 2 - - - ( 4 )
给定一个待预测的交通警情样本xq,由标准欧氏距离可计算出样本xq与历史样本空间中最近邻的K个样本x1,x2,…,xK,但每个特征属性的作用都是相同的,样本之间的距离是根据样本的所有特征计算的,在这些特征属性中,有些特征属性与交通警情等级是强相关的,有些特征属性与交通警情等级是弱相关的,还有一些特征属性与交通警情等级不相关,寻找与当前特征属性相似的交通警情历史数据时,按所有特征属性作用相同来计算样本相似度会导致较大的计算误差,针对这一缺陷,在交通警情相似度的距离公式中给特征属性赋予不同的权重,步骤2中距离度量学习矩阵得出的权值对特征属性与交通警情等级之间的权重关系进行了量化,从而使欧氏空间中相同交通警情等级的样本欧氏距离更接近,不同交通警情等级的样本欧氏距离更远,定义含多维特征属性权值的交通警情相似度如公式(5),式中xq为待预测的交通警情样本,xh属于X=(x1,x2,x3,…,xn)为n个历史交通警情数据中的一个样本,每个样本包含k维特征属性,分母加上0.01是为了避免当相等时出现分母为0的情况,
s ( x q , x h ) = 1 d ( x q , x h ) = 1 Σ l = 1 k w l ( x l q - x l h ) 2 + 0.01 - - - ( 5 )
其中wl是第l个特征的权重,由步骤2中距离度量学习得到对角矩阵A,对角线上的值即为特征属性权值,训练得到的权值根据特征属性一一对应,由公式(5)计算当前特征属性与历史交通警情数据库中各个样本的相似度,相似度最大的前K个历史交通警情数据x1,x2,…,xK作为当前交通警情等级预测的参考。
步骤4:K近邻相似交通警情等级投票
x1,x2,…,xK为步骤3得出的K个最相似历史交通警情样本,其中每一个样本xi所属的类别均已知,统计K个最相似历史交通警情等级,将出现频率最高的类别作为交通警情等级预测结果,K值是一个自定义的常数(一般为奇数),本方法中随机将历史交通警情数据分为两部分,一部分作为训练样本,一部分作为测试样本,训练样本中含有交通警情等级类别标签,测试样本中去除交通警情等级类别标签,经步骤3计算出前K个最相似的交通警情等级,取出现频率最高的警情等级与测试样本原有的警情等级进行对比,交叉验证本方法的准确率,通过选取不同的K值,如选择K=1,2,3,…,9,对每个K值做100次交叉验证计算出平均准确率,选择准确率最大的K值作为交通警情等级预测的投票数。
以杭州为例,基于距离度量学习的交通警情等级预测方法的实施过程如下:
步骤1:多维数据整理和交通警情等级分类
从相关气象部门获取历史天气数据,从大型活动场馆主页或中超联赛赛程表获取重大活动日数据,从城市道路交通建设相关单位获取道路维修、建设与封路等环境数据,与交通警情发生数共同构成多维历史数据库,当由特征属性预测交通警情等级时,数据库的多样性能够保证提取到足够多的相似样本,从而在相应的特征属性出现时进行精确预测。将整理好的多维历史数据按照等时间段切分为n个片段,构成包含n个样本的历史数据空间X,其中X=(x1,x2,x3,…,xn),样本空间X中的每个样本点x包含k维特征属性,本实施例中该样本数据的特征属性具体是指与交通警情有关的温度等级、可见度等级、降雨量等级、是否工作日、是否节假日、星期几、第几个三小时段、月份等数据,本实施例中,根据交通警情发生次数划分的警情等级是交通管理部门根据经验预先设置的,该交通警情等级的划分可以对交通指挥者提前进行警力部署和勤务优化提供有效的数据支撑。整理好的多维特征属性表如表1所示,数据库中存储形式如图1所示,表1与图1中特征属性维度从左至右均一一对应。
表1
步骤2:距离度量学习提取分类后的交通警情样本所对应的多维特征属性权值样本空间X=(x1,x2,x3,…,xn)中包含n个已标记警情等级的样本,本实施例中每个样本包含9个特征属性,即xi∈X为包含9维特征属性的一个样本,假设xi和xj为样本空间X中两个相同等级的交通警情,通过公式(1)可以计算出两个样本点间的马氏距离,其中A是我们需要学习的距离度量矩阵,
d m ( x i , x j ) = d A ( x i , x j ) = | | x i - x j | | A = ( x i - x j ) T A ( x i - x j ) - - - ( 1 )
故最小化相同警情等级S(S∈X)中样本之间的马氏距离平方和的同时,约束不同警情等级D(D∈X)中样本之间的马氏距离和(令其大于某个阈值),利用这种方式构建的目标优化函数,构建的目标函数模型如式(2)、式(3)所示:
s . t . Σ ( x i , x j ) ∈ D d A ( x i , x j ) ≥ 1 - - - ( 3 )
求取目标函数模型的距离度量学习矩阵A的过程是一个凸优化问题,本方法采用牛顿法对上述凸优化问题进行求解,将上述目标函数模型优化问题变形为求式(7)的最小值问题:
g ( A ) = g ( A 11 , . . . , A nn ) = Σ ( x i , x j ) ∈ S | | x i - x j | | A 2 - log ( Σ ( x i , x j ) ∈ D | | x i - x j | | A ) - - - ( 7 )
式(9)中A=diag(A11,A22,…,Ann)为希望求得的距离度量学习矩阵,即我们希望找到一个矩阵A使函数g(A)最小,在函数g(A)取最值的地方导数g'(A)=0,则牛顿法的迭代规则如式(8),迭代的终止条件如式(9),其中A为距离度量学习矩阵:
A : = A - ▿ g ( A ) ▿ 2 g ( A ) - - - ( 8 )
| ▿ g ( A ) | ≤ ϵ - - - ( 9 )
最终学习到的距离度量矩阵为一个稀疏的对角阵,本实施例中根据多维特征属性学习到的距离度量矩阵如下所示:
距离度量矩阵中,分别对应活动日、工作日、节假日、星期几、第几个三小时、温度等级、降雨量等级共7个特征属性权值。
步骤3:带权值的欧氏距离寻找与当前特征属性最相似的K个历史交通警情
首先对各个特征属性进行归一化处理,运用公式(10):
x l i = x l i - min ( x l 1 , x l 2 , . . . , x l n ) max ( x l 1 , x l 2 , . . . , x l n ) - min ( x l 1 , x l 2 , . . . , x l n ) - - - ( 10 )
式(10)中i=1,2,…,n,l=1,2,…,7,n是数据集中样本个数,l是特征属性个数,即本方法中的每个样本包含7个特征属性,对应的原始数据都将划归为[0,1]区间的数。然后利用交通警情相似度公式(5)计算当前特征属性与历史交通警情数据库中各个样本的相似度,
s ( x q , x h ) = 1 d ( x q , x h ) = 1 Σ l = 1 k w l ( x l q - x l h ) 2 + 0.01 - - - ( 5 )
式(13)中wl是样本第l个特征的权重,步骤2中计算出的距离度量学习矩阵包括7个特征属性权值,权值大小代表特征属性对于交通警情等级影响的重要程度,权值大说明当前特征属性对交通警情等级分类的贡献度更大,权值较小甚至趋于零说明当前特征属性对交通警情等级分类的贡献度小,将7个特征属性权值代入公式(12)中计算当前待预测交通警情等级样本与历史数据库中每个样本的相似度,按照相似度从大到小的顺序排列输出前K个最相似的历史交通警情。
步骤4:K近邻相似交通警情等级投票
统计步骤3中计算出的K个最相似历史交通警情等级,将出现频率最高的类别作为当前特征属性的交通警情等级预测结果,本方法中K值是一个自定义的奇数,如果K太小,则交通警情等级预测容易受到训练数据中的噪声影响,相反如果K太大,可能会误分类测试样本,因为K个最近邻列表中可能会包含远离其近邻的数据点,本方法中随机将历史交通警情数据分为两部分,一部分作为训练样本,一部分作为测试样本,训练样本中含有交通警情等级类别标签,测试样本中去除交通警情等级类别标签,经本方法预测后的交通警情等级与测试样本原有的交通警情等级进行对比,等级标签不同即为错误,设acci是第i次迭代的模型准确率,总准确率是通过选取不同的K值,计算本方法的分类准确率,本实施例中分别计算K=1,3,5,7时的交通警情等级预测准确率,见表2.由预测准确率可知当K=5时预测准确率最高,故预测交通警情等级时应选择前5个最相似的历史交通警情。表2为K与交通警情等级预测准确率:
表2。

Claims (2)

1.一种基于距离度量学习的交通警情等级预测方法,其特征在于:所述预测方法包括以下步骤:
步骤1:多维数据整理和交通警情等级分类
采集历史天气数据、历史重大活动数据、建设和封路环境数据与工作日、节假日和历史交通警情数共同构成关于交通警情的多维历史数据库,当前时刻的交通流量和上一时刻的流量密切相关,将连续的历史交通警情数据按照等时间段切分为n个片段作为训练样本,每个训练样本片段包括天气属性、重大活动属性、环境因素属性、工作日和节假日属性,根据交通管理部门提供的交通警情阈值对n个训练样本进行交通警情等级分类;
步骤2:距离度量学习提取分类后的交通警情样本所对应的多维特征属性权值
根据步骤1得出n个已标记训练样本构成的一个样本空间,该样本空间中各个元素之间的距离称为度量,其中距离是定义在向量空间中的一种函数,指两个元素在空间中相隔的长度,也就是说可以将某个空间中的所有对象投影到一个新的度量空间中;选取n个训练样本构成包含多维特征属性的样本空间X,其中X=(x1,x2,x3,…,xn),xi对应第i个样本代表的多维特征属性,式(1)是样本空间X中xi和xj样本点间的马氏距离,其中矩阵A是我们需要学习的距离度量矩阵,矩阵A中的每一行代表一个历史样本,每一列对应样本中的一维特征属性
d m ( x i , x j ) = d A ( x i , x j ) = | | x i - x j | | A = ( x i - x j ) T A ( x i - x j ) - - - ( 1 )
式(1)中的A是样本空间X的协方差矩阵,样本空间X中的每个样本均带有交通警情等级标签,故在最小化相同警情等级S(S∈X)中样本之间的马氏距离平方和的同时,约束不同警情等级D(D∈X)中样本之间的马氏距离和,马氏距离和大于预设阈值,目标函数模型如式(2),式(3)所示:
min A ≥ 0 Σ ( x i , x j ) ∈ S d A 2 ( x i , x j ) - - - ( 2 )
s . t . Σ ( x i , x j ) ∈ D d A ( x i , x j ) ≥ 1 - - - ( 3 )
其中,A≥0表示A为半正定矩阵,由目标函数模型求取距离度量学习矩阵A的过程是一个凸优化问题,采用牛顿法对上述凸优化问题进行求解,最终学习到的距离度量矩阵为一个稀疏的对角阵;
步骤3:带权值的欧氏距离寻找与当前特征属性最相似的K个历史交通警情
使用欧氏距离计算K近邻需首先对各个特征属性进行归一化,假定样本空间X中的样本点x包含k维特征属性,样本点之间的近邻一般由欧氏距离来度量,设第i个样本点为其中表示第i个样本第l个特征属性值,两个样本xi和xj之间的欧氏距离定义为公式(4):
d o ( x i , x j ) = Σ l = 1 k ( x l i - x l j ) 2 - - - ( 4 )
给定一个待预测的交通警情样本xq,由标准欧氏距离可计算出样本xq与历史样本空间中最近邻的K个样本x1,x2,…,xK,样本之间的距离是根据样本的所有特征计算的,步骤2中距离度量学习矩阵得出的权值对特征属性与交通警情等级之间的权重关系进行了量化,定义含多维特征属性权值的交通警情相似度如公式(5),式中xq为待预测的交通警情样本,xh属于X=(x1,x2,x3,…,xn)为n个历史交通警情数据中的一个样本,每个样本包含k维特征属性,分母加上0.01是为了避免当相等时出现分母为0的情况,
s ( x q , x h ) = 1 d ( x q , x h ) = 1 Σ l = 1 k w l ( x l q - x l h ) 2 + 0.01 - - - ( 5 )
其中wl是第l个特征的权重,由步骤2中距离度量学习得到对角矩阵A,对角线上的值即为特征属性权值,训练得到的权值根据特征属性一一对应,由公式(5)计算当前特征属性与历史交通警情数据库中各个样本的相似度,相似度最大的前K个历史交通警情数据x1,x2,…,xK作为当前交通警情等级预测的参考;
步骤4:K近邻相似交通警情等级投票
x1,x2,…,xK为步骤3得出的K个最相似历史交通警情样本,其中每一个样本xi所属的类别均已知,统计K个最相似历史交通警情等级,将出现频率最高的类别作为交通警情等级预测结果,K值是一个自定义的常数。
2.如权利要求1所述的一种基于距离度量学习的交通警情等级预测方法,其特征在于:随机将历史交通警情数据分为两部分,一部分作为训练样本,一部分作为测试样本,训练样本中含有交通警情等级类别标签,测试样本中去除交通警情等级类别标签,经步骤3计算出前K个最相似的交通警情等级,取出现频率最高的警情等级与测试样本原有的警情等级进行对比,交叉验证本方法的准确率,通过选取不同的K值,对每个K值做100次交叉验证计算出平均准确率,选择准确率最大的K值作为交通警情等级预测的投票数。
CN201510250180.3A 2015-05-15 2015-05-15 基于距离度量学习的交通警情等级预测方法 Active CN104834977B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510250180.3A CN104834977B (zh) 2015-05-15 2015-05-15 基于距离度量学习的交通警情等级预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510250180.3A CN104834977B (zh) 2015-05-15 2015-05-15 基于距离度量学习的交通警情等级预测方法

Publications (2)

Publication Number Publication Date
CN104834977A true CN104834977A (zh) 2015-08-12
CN104834977B CN104834977B (zh) 2018-02-27

Family

ID=53812851

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510250180.3A Active CN104834977B (zh) 2015-05-15 2015-05-15 基于距离度量学习的交通警情等级预测方法

Country Status (1)

Country Link
CN (1) CN104834977B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022374A (zh) * 2016-05-18 2016-10-12 中国农业银行股份有限公司 一种对历史流程数据进行分类的方法及装置
CN106817248A (zh) * 2016-12-19 2017-06-09 西安电子科技大学 一种apt攻击检测方法
CN108090241A (zh) * 2016-11-23 2018-05-29 财团法人工业技术研究院 连续性工艺的趋势变量鉴定方法与系统
CN108304756A (zh) * 2017-01-12 2018-07-20 南亚科技股份有限公司 晶圆识别方法及设备
CN108595658A (zh) * 2018-04-28 2018-09-28 尚谷科技(天津)有限公司 一种基于多媒体内容的气候知识库检测方法
CN108760266A (zh) * 2018-05-31 2018-11-06 西安交通大学 基于距离度量学习的机械关键部件虚拟退化指标构造方法
CN109063591A (zh) * 2018-07-12 2018-12-21 杭州电子科技大学 一种基于距离分布度量学习的行人再识别方法
CN109360421A (zh) * 2018-11-28 2019-02-19 平安科技(深圳)有限公司 一种基于机器学习的交通信息预测方法及装置、电子终端
CN109816211A (zh) * 2018-12-29 2019-05-28 北京英视睿达科技有限公司 判断污染区域相似性及提高治理污染效率的方法及装置
CN110046229A (zh) * 2019-04-18 2019-07-23 北京百度网讯科技有限公司 用于获取信息的方法及装置
CN110333554A (zh) * 2019-07-10 2019-10-15 南京恩瑞特实业有限公司 Nriet暴雨智能相似分析方法
CN110439513A (zh) * 2019-07-30 2019-11-12 北京雅丹石油技术开发有限公司 一种柱塞气举排液采气生产制度的优化方法
CN110750911A (zh) * 2019-10-25 2020-02-04 中冶赛迪重庆信息技术有限公司 一种高炉渣物理性能分析方法及分析系统
CN112101132A (zh) * 2020-08-24 2020-12-18 西北工业大学 一种基于图嵌入模型和度量学习的交通状况预测方法
CN114220268A (zh) * 2021-12-16 2022-03-22 济南市公安局交通警察支队 一种基于道路安全指数进行最优派警的方法及系统
CN114743379A (zh) * 2022-06-13 2022-07-12 广东邦盛北斗科技股份公司 基于北斗的城市大面积路网交通感知方法、系统及云平台

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009146960A2 (de) * 2008-06-03 2009-12-10 Siemens Aktiengesellschaft Verfahren und vorrichtung zur bestimmung von brückenlasten
CN102169631A (zh) * 2011-04-21 2011-08-31 福州大学 基于流形学习的交通拥堵事件协同检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009146960A2 (de) * 2008-06-03 2009-12-10 Siemens Aktiengesellschaft Verfahren und vorrichtung zur bestimmung von brückenlasten
CN102169631A (zh) * 2011-04-21 2011-08-31 福州大学 基于流形学习的交通拥堵事件协同检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田晶等: "短时交通流量两种预测方法的研究", 《公路交通科技》 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022374B (zh) * 2016-05-18 2019-07-09 中国农业银行股份有限公司 一种对历史流程数据进行分类的方法及装置
CN106022374A (zh) * 2016-05-18 2016-10-12 中国农业银行股份有限公司 一种对历史流程数据进行分类的方法及装置
CN108090241A (zh) * 2016-11-23 2018-05-29 财团法人工业技术研究院 连续性工艺的趋势变量鉴定方法与系统
CN106817248A (zh) * 2016-12-19 2017-06-09 西安电子科技大学 一种apt攻击检测方法
CN106817248B (zh) * 2016-12-19 2020-10-16 西安电子科技大学 一种apt攻击检测方法
CN108304756A (zh) * 2017-01-12 2018-07-20 南亚科技股份有限公司 晶圆识别方法及设备
CN108595658A (zh) * 2018-04-28 2018-09-28 尚谷科技(天津)有限公司 一种基于多媒体内容的气候知识库检测方法
CN108760266A (zh) * 2018-05-31 2018-11-06 西安交通大学 基于距离度量学习的机械关键部件虚拟退化指标构造方法
CN108760266B (zh) * 2018-05-31 2019-11-26 西安交通大学 基于距离度量学习的机械关键部件虚拟退化指标构造方法
CN109063591A (zh) * 2018-07-12 2018-12-21 杭州电子科技大学 一种基于距离分布度量学习的行人再识别方法
CN109063591B (zh) * 2018-07-12 2021-10-15 杭州电子科技大学 一种基于距离分布度量学习的行人再识别方法
CN109360421A (zh) * 2018-11-28 2019-02-19 平安科技(深圳)有限公司 一种基于机器学习的交通信息预测方法及装置、电子终端
CN109816211A (zh) * 2018-12-29 2019-05-28 北京英视睿达科技有限公司 判断污染区域相似性及提高治理污染效率的方法及装置
CN109816211B (zh) * 2018-12-29 2023-11-24 北京英视睿达科技股份有限公司 判断污染区域相似性及提高治理污染效率的方法及装置
CN110046229A (zh) * 2019-04-18 2019-07-23 北京百度网讯科技有限公司 用于获取信息的方法及装置
CN110333554A (zh) * 2019-07-10 2019-10-15 南京恩瑞特实业有限公司 Nriet暴雨智能相似分析方法
CN110333554B (zh) * 2019-07-10 2021-10-22 南京恩瑞特实业有限公司 Nriet暴雨智能相似分析方法
CN110439513A (zh) * 2019-07-30 2019-11-12 北京雅丹石油技术开发有限公司 一种柱塞气举排液采气生产制度的优化方法
CN110439513B (zh) * 2019-07-30 2021-08-31 北京雅丹石油技术开发有限公司 一种柱塞气举排液采气生产制度的优化方法
CN110750911B (zh) * 2019-10-25 2020-12-22 中冶赛迪重庆信息技术有限公司 一种高炉渣物理性能分析方法及分析系统
CN110750911A (zh) * 2019-10-25 2020-02-04 中冶赛迪重庆信息技术有限公司 一种高炉渣物理性能分析方法及分析系统
CN112101132A (zh) * 2020-08-24 2020-12-18 西北工业大学 一种基于图嵌入模型和度量学习的交通状况预测方法
CN114220268A (zh) * 2021-12-16 2022-03-22 济南市公安局交通警察支队 一种基于道路安全指数进行最优派警的方法及系统
CN114743379A (zh) * 2022-06-13 2022-07-12 广东邦盛北斗科技股份公司 基于北斗的城市大面积路网交通感知方法、系统及云平台

Also Published As

Publication number Publication date
CN104834977B (zh) 2018-02-27

Similar Documents

Publication Publication Date Title
CN104834977A (zh) 基于距离度量学习的交通警情等级预测方法
CN110570651B (zh) 一种基于深度学习的路网交通态势预测方法及系统
WO2022135265A1 (zh) 气候变化影响下水库调度规则的失效预警分析方法
CN111929748B (zh) 一种气象要素预报方法和系统
CN104835103B (zh) 基于神经网络和模糊综合评价的移动网络健康评价方法
CN115270965B (zh) 一种配电网线路故障预测方法和装置
CN109063911A (zh) 一种基于门控循环单元网络的负荷聚合体分组预测方法
CN102663264B (zh) 桥梁结构健康监测静态参数的半监督协同评估方法
CN103530704A (zh) 一种终端空域空中交通动态容量预测系统及其方法
JP7157620B2 (ja) 予測システムおよび予測方法
CN108549960A (zh) 一种24小时电力负荷预测方法
CN109143408B (zh) 基于mlp的动态区域联合短时降水预报方法
CN105279691A (zh) 基于随机森林模型的金融交易检测方法和设备
CN106503867A (zh) 一种遗传算法最小二乘风电功率预测方法
CN107067076A (zh) 一种基于时滞narx神经网络的客流预测方法
CN106776884A (zh) 一种基于多标签组合多分类器的恐怖行为预测方法
CN113361202A (zh) 一种基于特征负荷预测的配变重过载快速预警方法
CN113344408A (zh) 民航交通管制运行多尺度态势感知流程的处理方法
CN116050547A (zh) 一种基于自注意力集成学习的起落架性能预测方法
CN109299208A (zh) 一种台风灾害下输电杆塔智能可视化风险评估方法
CN113537569B (zh) 一种基于权重堆叠决策树的短时公交客流预测方法及系统
CN108334957A (zh) 电网一次设备运维检修成本预测方法及系统
CN116663404A (zh) 一种耦合人工智能和贝叶斯理论的洪水预报方法及系统
Dong et al. Research on academic early warning model based on improved SVM algorithm
Mao et al. Naive Bayesian algorithm classification model with local attribute weighted based on KNN

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant