CN108121791A - 一种交通大数据路径可搜索系统 - Google Patents

一种交通大数据路径可搜索系统 Download PDF

Info

Publication number
CN108121791A
CN108121791A CN201711379613.0A CN201711379613A CN108121791A CN 108121791 A CN108121791 A CN 108121791A CN 201711379613 A CN201711379613 A CN 201711379613A CN 108121791 A CN108121791 A CN 108121791A
Authority
CN
China
Prior art keywords
node
path
mark
search
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711379613.0A
Other languages
English (en)
Inventor
张留学
张焕中
朱小姣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Muda Software Technology Co Ltd
Original Assignee
Suzhou Muda Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Muda Software Technology Co Ltd filed Critical Suzhou Muda Software Technology Co Ltd
Priority to CN201711379613.0A priority Critical patent/CN108121791A/zh
Publication of CN108121791A publication Critical patent/CN108121791A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Abstract

本发明涉及大数据和智慧交通领域,通过对交通大数据的整理,得出路径,在路径的基础上通过特征标识和链式存储的方法,构建路径的可索引系统,提供一种路径可计算的算法和系统。本发明定义路径的构成,给出了路径名称和路径的搜索方法。通过将交通大数据的整理形成路径表示,在路径基础上实现交通信息的可搜索和计算,为智慧交通提供可计算的方法和系统。

Description

一种交通大数据路径可搜索系统
技术领域
本发明涉及大数据和智慧交通领域,主要针对交通大数据中人、车和物品的活动路径进行分析计算,从而为交通信息的查询,城市交通信息的统计分析,出行路径和站点的规划提供科学的依据。本发明定义了路径,给出了特征标识计算和链式存储方法,并提供了地名和路径的两种搜索方法:前缀最大匹配和中间最大匹配算法,在此基础上实现交通大数据路径可搜索系统。
背景技术
智慧城市是一种全新的城市形态:绿色、低碳、环保,更适合于人们的居住生活。
智慧交通是智慧城市必备的功能。智慧交通是基于现代电子信息技术面向交通运行的服务系统,它的主要功能是交通信息的收集、处理、发布、交换、分析和利用,为交通参与者提供多样性的服务。交通是城市的血脉,智慧交通有助于提高城市血脉的顺畅。如果说道路相当人的血脉一样,那么互联网、移动通信和物联网技术就相当于人的神经系统;智慧交通就是管理人、交通工具、物品活动路径的大脑,海量的信息汇集于智慧交通系统,系统经过运算、整理,为交通出行提供优化的方案。
智慧交通的关键是人的出行、商品运输的智能化,社会各功能设施的布局,公交布局的智能规划,围绕于交通信息大数据的融合与采集,为智慧交通提供决策的依据和方法,给交通出行提供便捷的服务。
出行路径主要是指人、物品和交通工具的活动路径。人的活动在城市交通中主要是依靠交通工具来实现的,路径的搜索主要是指人、物品和交通工具的路径搜索。
以交通工具和人运行的一段路径为基本信息单元,采用链式存储的技术,形成交通信息树,基于信息树实现信息的查找;围绕人出行的基本路径,展开分析,优化人的出行路径,优化包含道路、公交规划、热点商圈等的规划。
人和交通工具的移动通过什么方式来记录?又通过什么方式来查找?路径的搜索问题是个NP问题,实现出行路径的可搜索对于智慧交通有着很强的现实和社会意义。
怎样采集路径是我们要解决的问题之一?
怎么样存储路径,提供路径的搜索服务是我们要解决的另一个问题?
利用交通大数据路径可搜索系统,优化我们的交通,为智慧城市的发展服务是我们最终的目的。
本发明通过对交通出行的数据记录清洗整理,计算结果表示为本发明定义的路径表示,实现在路径基础之上交通信息可计算分析,从而为交通信息的查询,城市交通信息的分析,出行路径和站点的规划提供科学的依据。
发明内容
本发明主要解决基于人、交通工具和货物出行路径的可搜索。本发明采用的路径的定义:依次相联系的地点的文字串,地点之间有分隔符号;多路径之间有分隔符号。以地名或者站点名称构建的路线;地名或者站点名称为路径的节点。本发明提到的地名、站点名称和路径节点统一称为地名。hash即消息摘要散列算法。
路径由地名组成的具有顺序关联的集合。
实现路径的可搜索主要解决的问题:实现地名和路径的标识算法,结合信息存储实现地名和路径的搜索。
假定地名由n个词汇组成,表示为S={si|i=0,...,n-1},则地名标识计算为Wi=hash(Wi-1+si),其中W0=hash(s0),i=0,...,n-1,hash为消息摘要算法。
假定路径Rn={ri|i=0,...,n-1},则路径标识计算为Ri=hash(Ri-1+ri),其中R0=hash(r0), i=0,...,n-1,hash为消息摘要算法。
综上所述。编码技术采用统一的算法:Wi=hash(Wi1+si),其中W0=hash(s0);i=0,...,n-1。
信息存储单元U为:{Wi,si,Wi-1},当i=0时,{W0,s0}或者{W0,s0,0}。
存储集合为存储单元U的集合。
地名由n个词汇组成S={si|i=0,...,n-1},地名按词汇序列采用增量hash,形成节点名称单一词汇的标识Wi=hash(Wi-1+si),其中W0=hash(s0);i=0,...,n-1。存储集合为:{Wi,si,Wi1},当 i=0时,{W0,s0}或者{W0,s0,0}。
利用数据库为地名和路径建立表,三个字段:标识,词汇和前标识。
地名查询。给定查询条件查找最佳匹配的地名。
路径查询。根据地名,查询该节点关联的活动路径。
多路径查询。以换乘为路径分割的方式,或者其它分割方式,确定多路径的路径分割,然后进行查询。
基于路径的统计分析算法。通过数据整理,得到的记录导入到本系统,在此系统上展开统计分析,主要包括:起点地名的交通情况分析;终点地名的交通情况分析;路过的地名交通情况分析。
本发明主要解决了交通数据中有关路径的可计算问题,通过对交通大数据的整理分析,实现了人、交通工具和货物出行路径的可计算。
具体实施
本发明主要围绕交通大数据来展开,解决交通大数据中有关路径的可计算问题。具体来说,通过对交通大数据的整理,实现出行路径提取,在出行路径的基础上,通过特定的标识计算,结合链式存储等技术实现路径的可搜索。本发明所涉及的路径搜索问题主要指的是:基于人、交通工具和物品的交通活动路径的可搜索,和一般的最优路径的搜索问题完全不同,是在已经发生的交通出行的基础上搜索。
本发明定义的路径:由节点(站点或者地名)构成的从起点到终点的道路形式。多路径的定义是由多条路径组成,包括起始节点、中间节点、终止节点和换乘节点(前路径终止节点同时为后一路径起始节点)组成。
本发明主要提供两类的基本功能:地名的查询,路径的搜索和计算。采用的技术思路一致,均采用增量散列的计算实现,通过前后节点的链式存储来满足信息的上下文关联查询。
本发明关键的技术是增量散列和链式存储的技术。通过增量散列实现信息上下文标识的可计算,实现多维信息的查询转变为一维信息查询,实现信息的先计算后查询。
采用增量散列技术生成标识,定义如下:序列S为{si|i=0,...,n-1},节点si的标识Wi计算如下:Wi=hash(Wi-1+si),其中W0=hash(s0),i=0,...,n-1。
链式存储技术,存储单元U为:{Wi,si,Wi-1,F},当i=0时,{W0,s0,0,0},对应解释为:{标识,节点,前标识,节点类型}。对于地名而言,节点类型F有三类:起始节点、中间节点和终止节点,分别对应0,1,2,起始结点的前标识为0。对于路径而言,节点类型F有四类:起始节点、中间节点、换乘节点和终止节点,分别对应0,1,2,3,起始结点的前标识为0。
检索技术。主要提供两大类型的基本检索技术:地名的检索,路径的检索。
地名的存储形式和索引方案。参照链式存储单元的定义,针对该单元选择建立数据表,数据表包括四个字段:{标识,节点,前标识,节点类型},分别在标识、节点和前标识三个字段建立索引。
路径存储形式和索引方案。参照链式存储单元的定义,针对该单元选择建立数据表,数据表包括四个字段:{标识,节点,前标识,节点类型},分别在标识、节点和前标识三个字段建立索引。
上述方式一致。索引的解决方法基本相同,数据表中的信息表示形式为{W0,s0,0,F}对应 {标识,节点,前标识,节点类型}。
信息的查找方法如下:主要分为最大前缀匹配算法和中间最大匹配算法两类。
地名和路径搜索最大前缀匹配算法相同。数据表中的信息表示形式为{标识,节点,前标识,节点类型},信息的查找方法如下:
查找序列S={si|i=0,...,n-1},具体计算如下:
节点si的标识Ni计算如下:Ni=hash(Ni-1+si),其中N0=hash(s0);i=0,...,n-1。
先查找Nn-1,结果不为空则找到,否则查找序列Nn-2,递归直到找到或者直到N0为止。
如果找到结果,则结果对应查询的标识。
找到节点的标识后,下一步在该节点的后续节点中,查找有终止节点标识的节点。递归的方法查找,以该节点为前置节点的节点是否有终止节点标识,有则找到;否者递归直到找到,结束查询。
中间最大匹配算法,先根据地名或者路径序列中的首个节点,在节点序列中查找。查找的序列S={si|i=0,...,n-1},先在节点中查找s0,得到该节点的标识结果集。如果结果集为空,则说明没有匹配的结果。
如果有,假定结果集合R为{rj|j=0,...,k-1},把结果集合中rj作为初始标识,和序列S中的si(i=1,...,n-1)作为增量hash计算。
新的序列M如下{rj,s1,s2,...,sn-1},序列的值mi=si,m0=rj;对应M,j=0,...,k-1;i=1,...,n-1。不同的j对应不同的增量散列值,具体计算如下:Wi=hash(Wi-1+m1),其中W0=rj,j=0,...,k-1;计算mn-1的标识码作为查询的标识。
如果查询的结果不为空,则找到,否则计算{rj.s1,s2,...,sn-2}的标识,查找该标识,递归直到找到为止。
找到节点标识后,下一步在该节点的后续节点中,查找有终止节点标识的节点。递归的方法查找,以该节点为前置节点的节点是否有终止节点标识,有则找到;否者递归直到找到,结束查询。
以上实现了查询条件的最大化匹配,找到标识后,系统就可以针对该标识实现计算。
系统的主要存储包括:地名标识链式存储表;路径标识链式存储表;路径标识对应的交通信息的存储表。
交通大数据路径可搜索系统主要实现地名的可搜索,地名相关路径的可搜索,解决交通数据中的路径可计算问题。
有了上述的存储和索引的设计,大量的交通数据导入整理后,路径的可搜索和计算系统就具备了相应的功能。
基于地名、路径的统计算法,主要计算经过某地名或者某段路径,满足其它查询条件的所有路径。参考中间最大匹配算法。先根据地名或者路径序列中的首个节点,在节点序列中查找。查找的序列S={si|i=0,...,n-1},先在节点中查找s0,得到该节点的标识结果集。如果结果集为空,则说明没有匹配的结果。
如果有,假定结果集合R为{rj|j=0,...,k-1},把结果集合中rj作为初始标识,和序列S中的si(i=1,...,n-1)作为增量hash计算。
新的序列M如下{rj.s1,s2,...,sn-1},序列的值mi=si,m0=rj;对应M,j=0,...,k-1;i=1,...,n-1。不同的j对应不同的增量散列值,具体计算如下:Wi=hash(Wi-1+mi),其中W0=rj,j=0,...,k-1;计算mn-1的标识码作为查询的标识。
如果查询的结果不为空,则找到,否则计算{rj,s1,s2,...,sn-2}的标识,查找该标识,递归直到找到为止。
找到节点标识后,下一步在该节点的后续节点中,查找有终止节点标识的节点。递归的方法查找,查找所有以该节点为前置节点的节点并有终止节点路径标识。
同样,找到节点标识后,下一步在该节点的前置节点中,查找有起始节点标识的节点。递归的方法查找,查找所有以该节点的前置节点的节点并有起始节点标识路径。
以上实现了基于地点和路径的统计算法。
给定地点的交通信息分析系统。主要分析和计算包括:给定时间段(或者不设置时间段)的,给定地点出行分析,分析出行的习惯,出行交通所需的时间。采用地点统计算法实现。
给定出行主体的交通信息分析系统。通过出行关联的路径分析,主要包括:主体的特征分析,例如:人出行的分析,得出居住地、工作地和其它地点的;出行时间推断人的职业习惯等。通过人的出行标识(假定交通卡ID)在路径标识和交通信息关系表中查找,查询人的出行习惯,出发地,目的地分析,时间段分析等。
公共交通的路径分析。分析交通线路关联站点的人出行情况,评估站点的设置。通过路径标识和交通信息关系表,查找相关路径,结合其它条件统计。
公共交通换乘分析。通过路径中的换乘节点,统计换乘的人、时间。通过路径标识表找到换乘节点,查找相关路径,结合其它条件统计。
站点和线路的综合分析。通过地点和线路来分析站点和线路布局的效率和合理性。
常规出行路径的查询。给定出行的地名后,在现有的路径中查找,选择线路。
一种交通大数据中路径可搜索系统,主要为交通信息的大数据计算提供了实现的方法和手段,在此基础上可以实现有关交通分析系统。

Claims (8)

1.一种交通大数据路径可搜索系统,其特征在于:
路径可搜索系统,路径计算分析系统。
2.根据权利1所述路径的可搜索,具体特征在于:
地名和路径的搜索算法,相关的算法由增量散列结合链式存储实现。相应的搜索算法包括前缀最大匹配算法和中间序列最大匹配算法。
3.根据权利2描述的地名和路径增量散列方法,其特征如下:
定义如下,序列S={si|i=0,...,n-1},节点si的标识Wi,计算如下:Wi=hash(Wi-1+si),其中W0=hash(s0);i=0,...,n-1。
4.根据权利2描述的地名和路径链式存储方法,其特征如下:
链式存储技术,存储单元U为:{Wi,si,Wi-1,F},当i=0时,{W0,s0,0,0},对应解释为:{标识,节点,前标识,节点类型}。
5.根据权力1,路径可搜索系统主要特征包括:
存储特征在于:地名标识链式存储表;路径标识链式存储表;路径标识对应的交通信息的存储表。
地名和路径的存储形式和索引方案。参照权力4描述的链式存储单元的定义,建立数据表,数据表包括四个字段:{标识,节点,前标识,节点类型}。
6.根据权利2描述的方法,地名和路径搜索最大前缀匹配算法,其特征如下:
地名和路径搜索最大前缀匹配算法相同。按照权力4,数据表中的信息表示形式为{标识,节点,前标识,节点类型},查找序列S={si|i=0,...,n-1},具体计算如下:
节点si的标识Ni计算如下:Ni=hash(Ni-1+si),其中N0=hash(s0);i=0,...,n-1。
先查找Nn-1,结果不为空则找到,否则查找序列Nn-2,递归直到找到或者直到N0为止。
如果找到结果,则结果对应查询的标识。
找到节点的标识后,下一步在该节点的后续节点中查找有终止节点标识的节点。递归的方法查找,以该节点为前置节点的节点是否有终止节点标识,有则找到;否者递归直到找到,结束查询。
7.根据权利2描述的方法,地名和路径的中间最大匹配搜索算法,其特征如下:
地名和路径的中间最大匹配搜索算法相同,先根据序列首个节点查找该节点对应的标识,然后增量散列计算标识,继续查找。具体特征如下:
参照权力4,数据表形式为:{标识,节点,前标识,节点类型},查找方法特征如下:
先根据地名或者路径序列中的首个节点,在节点序列中查找。查找的序列S为{si|i=0,...,n-1},先在节点中查找s0,得到该节点的标识结果集。如果结果集为空,则说明没有匹配的结果。
如果有,假定结果集合R为{rj|j=0,...,k-1},把结果集合中rj作为初始标识,和序列S中的si(i=1,...,n-1)作为增量hash计算。
新的序列M如下{rj,s1,s2,...,sn-1},序列的值mi=si,i=1,...,n-1;m0=rj,j=0,...,k-1。不同的j对应不同的增量散列值,具体计算如下:Wi=hash(Wi-1+mi),其中W0=rj,j=0,...,k-1;计算mn-1的标识码作为查询的标识。
如果查询的结果不为空,则找到,否则计算{rj,s1,s2,...,sn-2}的标识,查找该标识,递归直到找到为止。
找到节点的标识后,下一步在该节点的后续节点中,查找有终止节点标识的节点。递归的方法查找,以该节点为前置节点的节点是否有终止节点标识,有则找到;否者递归直到找到,结束查询。
8.根据权利1路径计算分析系统,通过路径标识方法查找路径,根据该标识关联的信息实现交通路径、地点和目标个体的查询,统计分析等计算。具体特征在于:
给定地名或者路径的查询统计。先根据地名或者路径序列中的首个节点,在节点序列中查找。查找的序列S={si|i=0,...,n-1},先在节点中查找s0,得到该节点的标识结果集。如果结果集为空,则说明没有匹配的结果。
如果有,假定结果集合R为{rj|j=0,...,k-1},把结果集合中rj作为初始标识,和序列S={si|i=1,...,n-1}中的si作增量hash计算。
新的序列M如下{rj,s1,s2,...,sn-1},序列的值mi=si,i=1,...,n-1;m0=rj,j=0,...,k-1。不同的j对应不同的增量散列值,具体计算如下:Wi=hash(Wi-1+mi),其中W0=rj,j=0,...,k-1;计算mn-1的标识码作为查询的标识。
对不同的j而言,如果查询的结果不为空,则找到,否则计算{rj,s1,s2,...,sn-2}的标识,查找该标识,递归直到找到为止。
找到节点的标识后,下一步在该节点的后续节点中,查找所有有终止节点标识的节点。
同上,在该节点的前置节点中查找有起始节点的节点,递归找到所用的作为路径起始点的集合。
CN201711379613.0A 2017-12-14 2017-12-14 一种交通大数据路径可搜索系统 Pending CN108121791A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711379613.0A CN108121791A (zh) 2017-12-14 2017-12-14 一种交通大数据路径可搜索系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711379613.0A CN108121791A (zh) 2017-12-14 2017-12-14 一种交通大数据路径可搜索系统

Publications (1)

Publication Number Publication Date
CN108121791A true CN108121791A (zh) 2018-06-05

Family

ID=62229602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711379613.0A Pending CN108121791A (zh) 2017-12-14 2017-12-14 一种交通大数据路径可搜索系统

Country Status (1)

Country Link
CN (1) CN108121791A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110430133A (zh) * 2019-05-23 2019-11-08 北京航空航天大学 一种基于置信区间的域间路径标识前缀获取方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101308555A (zh) * 2008-06-27 2008-11-19 北京工业大学 多模式公交出行路径寻优方法
CN104008205A (zh) * 2014-06-18 2014-08-27 中国人民解放军信息工程大学 一种内容路由的查询方法及系统
CN105955982A (zh) * 2016-04-18 2016-09-21 上海泥娃通信科技有限公司 信息序列特征编码和检索的方法和系统
CN106052701A (zh) * 2016-05-23 2016-10-26 山东大学 一种交通溢流状态下车辆路径选择的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101308555A (zh) * 2008-06-27 2008-11-19 北京工业大学 多模式公交出行路径寻优方法
CN104008205A (zh) * 2014-06-18 2014-08-27 中国人民解放军信息工程大学 一种内容路由的查询方法及系统
CN105955982A (zh) * 2016-04-18 2016-09-21 上海泥娃通信科技有限公司 信息序列特征编码和检索的方法和系统
CN106052701A (zh) * 2016-05-23 2016-10-26 山东大学 一种交通溢流状态下车辆路径选择的方法
CN106052701B (zh) * 2016-05-23 2018-08-14 山东大学 一种交通溢流状态下车辆路径选择的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110430133A (zh) * 2019-05-23 2019-11-08 北京航空航天大学 一种基于置信区间的域间路径标识前缀获取方法

Similar Documents

Publication Publication Date Title
CN106407352B (zh) 基于深度学习的交通图像检索方法
CN110008413B (zh) 一种交通出行问题查询方法和装置
CN104346444B (zh) 一种基于路网反空间关键字查询的最佳选址方法
CN107167136A (zh) 一种面向电子地图的位置推荐方法及系统
CN104035954A (zh) 一种基于Hadoop的套牌车识别方法
CN107832631A (zh) 一种数据发布的隐私保护方法和系统
CN102521364B (zh) 一种图上两点间最短路径查询方法
CN106844407A (zh) 基于数据集相关性的标签网络产生方法和系统
CN104268629A (zh) 一种基于先验信息和网络固有信息的复杂网络社区检测方法
CN105574541A (zh) 一种基于紧密度排序的网络社区发现方法
Jiang et al. Identifying K Primary Corridors from urban bicycle GPS trajectories on a road network
Shang et al. Prediction-based unobstructed route planning
CN110232133A (zh) 一种基于特征融合和款式分类的服装图像检索方法和系统
Lee et al. Crowd-sourced carpool recommendation based on simple and efficient trajectory grouping
Akram et al. Menger’s theorem for m-polar fuzzy graphs and application of m-polar fuzzy edges to road network
CN108121791A (zh) 一种交通大数据路径可搜索系统
Dai et al. Cluster-based destination prediction in bike sharing system
CN106547764A (zh) 网页数据去重的方法及装置
CN113569977B (zh) 一种基于手机信令数据的出行目的识别方法
CN113889284B (zh) 一种基于公共交通知识图谱的传染病接触目标追踪方法
CN103164406B (zh) 移动目标信息处理方法及系统
CN112667925B (zh) 一种路线推荐方法、装置、计算机设备以及存储介质
CN106709011A (zh) 一种基于空间定位簇的位置概念层次消解计算方法
Brisaboa et al. New structures to solve aggregated queries for trips over public transportation networks
Ghosh et al. Computing Skyline Using Taxicab Geometry

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180605

WD01 Invention patent application deemed withdrawn after publication