CN108346287B - 基于影响因素分析的交通流量序列模式匹配方法 - Google Patents

基于影响因素分析的交通流量序列模式匹配方法 Download PDF

Info

Publication number
CN108346287B
CN108346287B CN201810087650.2A CN201810087650A CN108346287B CN 108346287 B CN108346287 B CN 108346287B CN 201810087650 A CN201810087650 A CN 201810087650A CN 108346287 B CN108346287 B CN 108346287B
Authority
CN
China
Prior art keywords
attribute
traffic flow
class
flow sequence
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810087650.2A
Other languages
English (en)
Other versions
CN108346287A (zh
Inventor
马东方
李文婧
盛博文
金盛
王殿海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201810087650.2A priority Critical patent/CN108346287B/zh
Publication of CN108346287A publication Critical patent/CN108346287A/zh
Application granted granted Critical
Publication of CN108346287B publication Critical patent/CN108346287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于影响因素分析的交通流量序列模式匹配方法。本发明首先在对已有交通流量序列通过聚类得到结果的前提下,确定每一类当中每一条交通流量序列的属性向量。其次针对每个类,统计其每个属性中每个值的出现次数,计算其出现频率,并得到每个类的重要性系数矩阵。然后确定待匹配交通流量序列的属性向量,计算待匹配交通流量序列与每一类的相似度向量。最后由待匹配交通流量序列的相似度向量,计算每条属性的相似度与该属性可能的取值数量相乘再累加,得到待匹配交通流量序列与每一类的相似度,选取相似度最大的一类作为最终匹配结果。本发明在保证精确性的前提下,还有计算复杂度小等优点。

Description

基于影响因素分析的交通流量序列模式匹配方法
技术领域
本发明涉及一种对交通流量序列进行模型匹配的方法,具体是一种基于影响因素分析的交通流量序列模式匹配方法,属于交通控制领域。
背景技术
近年来,随着经济的快速发展,机动车持有量迅速增加,交通管理现状和需求的矛盾进一步加剧。在此情况下,如何利用先进的科技手段提高交通管理水平是当前交通管理部门亟待解决的问题。
模型匹配,或者说模式识别,就是通过计算机用数学技术方法来研究模式的自动处理和判读。随着计算机技术的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是计算机对模式的识别。现有的一些模式识别的方法主要有:判别函数法,k近邻分类法,非线性映射法,特征分析法,主因子分析法等。
将模型匹配技术应用于交通领域,利用大数据技术和智能分析技术,整合城市管理的其他数据,将真正推动智慧交通建设,为交通管理奠定良好的基础。因此,本发明提出一种基于影响因素分析的交通流量序列模式匹配方法,能为交通流量序列做出更精准的预测提供条件,进而可以做出进一步的交通管理调度。
发明内容
本发明的目的在于实现对交通流量序列做快速的模型匹配,为交通流量序列做出更精准的预测提供条件。
本发明的基本思想为:具有相同属性的不同流量序列,其形状或者说数值也有较大概率相同或者类似。以某一类样本序列内某一属性出现次数与此类内样本总数的比值作为影响因素,影响因素与属性取值个数的累积和作为相似度。以此相似度作为评判依据,能够很好的判断待匹配数据能与此类样本序列匹配程度,最终输出使得相似度最大的类作为匹配结果。
本发明的基本步骤如下:
基于影响因素匹配的交通流量序列模式预测方法包括以下步骤:
c1、在对已有交通流量序列通过聚类得到结果的前提下,确定每一类当中每一条交通流量序列的属性向量。
c2、针对每个类,统计其每个属性中每个值的出现次数,计算其出现频率,并得到每个类的重要性系数矩阵。
c3、确定待匹配交通流量序列的属性向量,计算待匹配交通流量序列与每一类的相似度向量。
c4、由待匹配交通流量序列的相似度向量,计算每条属性的相似度与该属性可能的取值数量相乘再累加,得到待匹配交通流量序列与每一类的相似度,选取相似度最大的一类作为最终匹配结果。
步骤c1的过程包括:
c11、假设原交通流量序列分为J类。原始数据可能有多个属性,从其中选出对交通流量序列有影响的m个属性构成交通流量序列的属性向量V。即:
V=[v1,v2,…,vi,…,vm] (1-a)
该向量的每一个元素均为事先设定的能够影响交通序列的因素,包括但不限于星期,天气,季节等。第i个属性元素有pi个不同取值,且pi的最大值为n。
步骤c2的过程包括:
c21、针对交通流量序列J个类中的某个类j(1<j<J)内的所有交通流量序列,统计其每个属性i中每个值的出现次数,以vj i,q表示在类j内所有交通流量序列中第i个属性的第q个取值出现的次数与类j内总样本数的比值。
c22、由上述知,针对类j,其属性向量V共有m个元素。对于其任意一个属性i,vj i,q中所有非0元素个数为pi,即属性i最多有pi个取值,且pi的最大值为n。于是可以构造一个大小为m*n矩阵Wj。该矩阵为类j的重要性系数矩阵。
Figure BDA0001562836870000031
Wj内的元素即vj i,q,当类j内不存在符合属性i的第q个取值的流量序列时,根据vj i,q的定义,其值为0。属性i有pi个取值,当pi小于n时,在Wj的第i列的pi+1行及以下补0以保证矩阵的完整性。
步骤c3的过程包括:
c31、确定待匹配交通流量序列的属性向量取值为
V*=[v*1,v*2,…,v*i,…,v*m] (1-c)
其中v*i表示第i个属性取值编号。例如,当属性i表示星期时,若待匹配交通流量序列的属性是星期一,且星期一的编号为1,则v*i=1。
c32、确定待匹配交通流量序列的每一个属性i与类j流量序列相应属性的相似度。
对于属性i,设待匹配交通流量序列的该属性值在j类中所占的比重为
Figure BDA0001562836870000041
即待匹配交通流量序列与类j的相似度为
Figure BDA0001562836870000042
由于待匹配交通流量序列有多个属性,同理,对任意一个属性,也均有一个相似度。因此,待匹配交通流量序列的m个属性构成的与类j的相似度向量为:
Figure BDA0001562836870000043
特别的,针对某属性i,若类j所有流量序列的属性值均与待匹配交通流量序列的属性值相同,则其相似度为1.0,若j类所有流量序列属性值与待匹配交通流量序列属性值均不同,则其相似度为0.0。
步骤c4的过程包括:
c41、考虑待匹配交通流量序列属性与类j属性的相似度矩阵,若存在类j满足所有属性与待匹配流量序列对应属性的相似度在所有类中均是最大者,则待匹配交通流量序列应属于类j,类j的交通流量序列样本应作为预测的背景数据。然而,多数情况下,很难保证待匹配交通流量序列所有属性与类j的相似性均最大,需要综合评估各个相似性系数以确定预测交通流量序列的最佳类编号。评估方法如下:
针对待匹配交通流量序列的属性i1和i2,其属性编号分别为
Figure BDA0001562836870000044
Figure BDA0001562836870000045
假设二者与类j有相同的相似性系数,即
Figure BDA0001562836870000046
但若属性i1和属性i2的所有可能的取值的个数
Figure BDA0001562836870000047
Figure BDA0001562836870000048
不同
Figure BDA0001562836870000049
则待匹配流量序列的属性i1较i2更加近似于类j。即,以某一属性i与类j的相似度
Figure BDA00015628368700000410
乘以该属性的所有取值个数pi的积作为该属性与类j的相似度。
以所有属性为对象,待匹配流量序列与类j的相似性可定义为:
Figure BDA00015628368700000411
式中,Υj为待匹配流量序列与类j的相似度;m为属性取值向量元素个数。
若j*是时间序列分类之后的其中一类,且满足
Figure BDA0001562836870000051
j=1,2,…,J,则待匹配流量序列应属于类j*,类j*的交通流量序列样本应作为预测的背景数据。
本发明的有益效果:本发明提出了一种基于影响因素匹配的交通流量序列模式预测方法,提出了具有相同属性的不同流量序列,其形状或数据分布也有较大概率相同或者类似的思想。以样本序列内某一属性出现频率作为影响因素,影响因素与属性取值个数的累积和作为相似度,选择相似度最大的类作为预测序列的背景数据。在保证了精确性的前提下,还有计算复杂度小等优点。本发明属于时间序列预测前的数据模式匹配工作,为交通流量序列做出更精准的预测提供条件。
附图说明
图1算法实现过程流程图。
图2待匹配序列与各个类的最终相似度。
具体实施方式
以某城市周期为一年共352天的流量序列数据为例,对6个待匹配数据做模型匹配,见图1。
1、在对已有交通流量序列通过聚类得到结果的前提下,确定每一类当中每一条交通流量序列的属性向量。
(1)原交通流量序列数据共分为3个类。该交通流量序列共有M个属性,从其中选出对交通流量序列有影响的m个属性构成交通流量序列的属性向量V。即
V=[v1,v2,…,vi,…,vm] (1-1)
在此例中,选出四个能够影响时间序列的因素,包括星期,是否假期,是否下雨,季节。显然,第一个元素星期共有7种取值,以1到7对其编号。类似的,假期、是否下雨、季节分别有2种、2种、4种取值,分别对其编号。
2、针对3个类,分别统计其每个属性i中每个值的出现次数,计算得到重要性系数矩阵Wj
(1)针对其中某个类j(1<j<J)内的所有交通流量序列,统计其每个属性i中每个值的出现次数,以vj i,q表示在类j内所有交通流量序列中第i个属性的第q个取值出现的次数与类j内总样本数的比值。
(2)构造大小为m×n的类j的全部取值重要性系数矩阵矩阵Wj
Figure BDA0001562836870000061
计算结果如下
Figure BDA0001562836870000062
Figure BDA0001562836870000071
Figure BDA0001562836870000072
3、确定待匹配交通流量序列的属性向量V*,并根据重要性系数矩阵Wj确定每个属性i在类j中所占的比重,即该属性与类j的相似度
Figure BDA0001562836870000073
进而构成相似性向量H。
(1)确定待匹配交通流量序列的属性取值向量为
V*=[v*1,v*2,…v*i,…,v*m] (3-1)
(2)对每一个属性i确定其与j类流量序列的相似度。
仅考虑第i个属性时,若待匹配交通流量序列的该属性值在j类中所占的比重为
Figure BDA0001562836870000074
即待匹配交通流量序列与j类流量序列的相似度为
Figure BDA0001562836870000075
其数值就是重要性系数矩阵Wj内的元素vj i,q。因此,m个属性构成的相似性向量为:
Figure BDA0001562836870000076
4、将每条属性i的相似度与属性i可能的取值数量相乘再累加,得到待匹配数据与类j的最终相似度Υj,如图2所示。
Figure BDA0001562836870000077
若j*是时间序列分类之后的其中一类,且满足
Figure BDA0001562836870000081
j=1,2,…,J,则待匹配对象应属于类j*,类j*的交通流量序列样本应作为预测的背景数据。
最终得到最后序列的匹配结果,如下表所示。
数据编号 1 2 3 4 5 6
所属分类 类3 类3 类2 类2 类1 类1
匹配结果 类3 类3 类2 类2 类1 类1
匹配结果相当精准。
综上,本发明涉及一种对待匹配交通流量序列进行模型匹配的方法,具体是一种基于影响因素分析的交通流量序列模式匹配方法,具备结果较精准、计算复杂度较低的特点。本发明基本思想为:具有相同属性的不同流量序列,其形状或者说数据也有较大概率相同或者类似。在对原数据做聚类之后,本发明能够对一个未知类型的流量序列做出判断其所属类,进而为后续预测提供技术支持。

Claims (1)

1.基于影响因素分析的交通流量序列模式匹配方法,其特征在于该方法包括如下步骤:
c1、在对已有交通流量序列通过聚类得到结果的前提下,确定每一类当中每一条交通流量序列的属性向量;
c2、针对每个类,统计其每个属性中每个值的出现次数,计算其出现频率,并得到每个类的重要性系数矩阵;
c3、确定待匹配交通流量序列的属性向量,计算待匹配交通流量序列与每一类的相似度向量;
c4、由待匹配交通流量序列的相似度向量,计算每条属性的相似度与该属性可能的取值数量相乘再累加,得到待匹配交通流量序列与每一类的相似度,选取相似度最大的一类作为最终匹配结果;
步骤c1的过程包括:
c11、假设原交通流量序列分为J类;原始数据可能有多个属性,从其中选出对交通流量序列有影响的m个属性构成交通流量序列的属性向量V;即:
V=[v1,v2,…,vi,…,vm] (1-a)
该向量的每一个元素均为事先设定的能够影响交通序列的因素,包括星期,天气,季节;第i个属性元素有pi个不同取值,且pi的最大值为n;
步骤c2的过程包括:
c21、针对交通流量序列J个类中的某个类j内的所有交通流量序列,统计其每个属性i中每个值的出现次数,以vj i,q表示在类j内所有交通流量序列中第i个属性的第q个取值出现的次数与类j内总样本数的比值;
c22、由上述知,针对类j,其属性向量V共有m个元素;对于其任意一个属性i,vj i,q中所有非0元素个数为pi,即属性i最多有pi个取值,且pi的最大值为n;构造一个大小为m*n矩阵Wj;该矩阵为类j的重要性系数矩阵;
Figure FDA0002503106270000021
Wj内的元素即vj i,q,当类j内不存在符合属性i的第q个取值的流量序列时,根据vj i,q的定义,其值为0;属性i有pi个取值,当pi小于n时,在Wj的第i列的pi+1行及以下补0以保证矩阵的完整性;
步骤c3的过程包括:
c31、确定待匹配交通流量序列的属性向量取值为
V*=[v*1,v*2,…,v*i,…,v*m] (1-c)
其中v*i表示第i个属性取值编号;
c32、确定待匹配交通流量序列的每一个属性i与类j流量序列相应属性的相似度;
对于属性i,设待匹配交通流量序列的该属性值在j类中所占的比重为
Figure FDA0002503106270000022
即待匹配交通流量序列与类j的相似度为
Figure FDA0002503106270000023
由于待匹配交通流量序列有多个属性,同理,对任意一个属性,也均有一个相似度;因此,待匹配交通流量序列的m个属性构成的与类j的相似度向量为:
Figure FDA0002503106270000031
步骤c4的过程包括:
c41、针对待匹配交通流量序列的属性i1和i2,其属性编号分别为
Figure FDA0002503106270000037
Figure FDA0002503106270000038
假设二者与类j有相同的相似性系数,即
Figure FDA0002503106270000035
但若属性i1和属性i2的所有可能的取值的个数
Figure FDA0002503106270000033
Figure FDA0002503106270000034
不同,则待匹配流量序列的属性i1较i2更加近似于类j;即,以某一属性i与类j的相似度
Figure FDA0002503106270000036
乘以该属性的所有取值个数pi的积作为该属性与类j的相似度;
以所有属性为对象,待匹配流量序列与类j的相似性定义为:
Figure FDA0002503106270000032
式中,Υj为待匹配流量序列与类j的相似度;m为属性向量元素个数;
若j*是时间序列分类之后的其中一类,且满足
Υj*=max{Υj} (1-f)
j=1,2,…,J,则待匹配流量序列应属于类j*,类j*的交通流量序列样本应作为预测的背景数据。
CN201810087650.2A 2018-01-30 2018-01-30 基于影响因素分析的交通流量序列模式匹配方法 Active CN108346287B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810087650.2A CN108346287B (zh) 2018-01-30 2018-01-30 基于影响因素分析的交通流量序列模式匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810087650.2A CN108346287B (zh) 2018-01-30 2018-01-30 基于影响因素分析的交通流量序列模式匹配方法

Publications (2)

Publication Number Publication Date
CN108346287A CN108346287A (zh) 2018-07-31
CN108346287B true CN108346287B (zh) 2020-08-04

Family

ID=62961427

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810087650.2A Active CN108346287B (zh) 2018-01-30 2018-01-30 基于影响因素分析的交通流量序列模式匹配方法

Country Status (1)

Country Link
CN (1) CN108346287B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111627209A (zh) * 2020-05-29 2020-09-04 青岛大学 交通流量数据聚类、补偿方法及设备
CN117992741B (zh) * 2024-04-07 2024-06-21 国网山东省电力公司营销服务中心(计量中心) 基于广域相量测量数据的cvt误差状态评估方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777188A (zh) * 2010-03-12 2010-07-14 华中科技大学 一种实时公交车客流量统计方法
WO2015100993A1 (zh) * 2013-12-30 2015-07-09 复旦大学 一种基于时空关联数据挖掘的交通流预测方法
EP3078014A1 (en) * 2014-06-04 2016-10-12 Cuende Infometrics S.A. System and method for measuring the real traffic flow of an area
CN106408939A (zh) * 2016-10-29 2017-02-15 浙江大学 基于密度峰值聚类的交通流量序列划分方法
CN106951976A (zh) * 2016-10-12 2017-07-14 华南理工大学 一种基于模式分类的公交客流预测方法
CN107464419A (zh) * 2017-08-28 2017-12-12 北京工业大学 一种考虑时空特性的短时交通流预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777188A (zh) * 2010-03-12 2010-07-14 华中科技大学 一种实时公交车客流量统计方法
WO2015100993A1 (zh) * 2013-12-30 2015-07-09 复旦大学 一种基于时空关联数据挖掘的交通流预测方法
EP3078014A1 (en) * 2014-06-04 2016-10-12 Cuende Infometrics S.A. System and method for measuring the real traffic flow of an area
CN106951976A (zh) * 2016-10-12 2017-07-14 华南理工大学 一种基于模式分类的公交客流预测方法
CN106408939A (zh) * 2016-10-29 2017-02-15 浙江大学 基于密度峰值聚类的交通流量序列划分方法
CN107464419A (zh) * 2017-08-28 2017-12-12 北京工业大学 一种考虑时空特性的短时交通流预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"A weighted pattern recognition algorithm for short-term traffic flow forecasting";Shuangshuang Li;《Proceedings of 2012 9th IEEE International Conference on Networking, Sensing and Control》;20120530;全文 *
"时间序列挖掘在城市道路安全中的研究与应用";吴子珺;《中国优秀硕士学位论文全文数据库·基础科学辑》;20150731;全文 *

Also Published As

Publication number Publication date
CN108346287A (zh) 2018-07-31

Similar Documents

Publication Publication Date Title
CN109800801B (zh) 基于高斯回归算法的K-Means聚类分析车道流量方法
CN110503245B (zh) 一种机场航班大面积延误风险的预测方法
CN106485262A (zh) 一种母线负荷预测方法
CN107292417B (zh) 基于重污染序列案例库的区域重污染判别预报方法及装置
CN110245692B (zh) 一种用于集合数值天气预报成员的层次聚类方法
CN101808339A (zh) 一种应用k-means和先验知识的话务小区自适应分类方法
CN114548586B (zh) 一种基于混合模型的短期电力负荷预测方法及系统
CN108346287B (zh) 基于影响因素分析的交通流量序列模式匹配方法
CN116013084B (zh) 交通管控场景确定方法、装置、电子设备及存储介质
CN108596204B (zh) 一种基于改进型scdae的半监督调制方式分类模型的方法
CN102184412B (zh) 基于最小错误率贝叶斯分类器的车牌数字及字母识别方法
CN113886587A (zh) 一种基于深度学习的数据分类方法以及图谱的建立方法
CN114817575B (zh) 基于扩展模型的大规模电力事理图谱处理方法
CN115081515A (zh) 能效评价模型构建方法、装置、终端及存储介质
CN117556339B (zh) 一种网络违法行为风险危险等级评估方法
CN116860977B (zh) 一种面向矛盾纠纷调解的异常检测系统及方法
CN111340645A (zh) 一种针对电力负荷的改进关联分析方法
CN116561327B (zh) 基于聚类算法的政务数据管理方法
CN1472634A (zh) 高光谱遥感图像联合加权随机分类方法
CN115935154B (zh) 基于稀疏表示与近端算法的射频信号特征遴选与识别方法
CN113505863B (zh) 基于级联均值向量综合评分的图片多级分类方法及系统
CN115496948A (zh) 一种基于深度学习的网络监督细粒度图像识别方法和系统
CN112738724B (zh) 一种区域目标人群的精准识别方法、装置、设备和介质
CN110097126B (zh) 基于dbscan聚类算法的核查重点人员、房屋漏登记的方法
CN109800384B (zh) 一种基于粗糙集信息决策表的基本概率赋值计算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant