CN108121791A - 一种交通大数据路径可搜索系统 - Google Patents
一种交通大数据路径可搜索系统 Download PDFInfo
- Publication number
- CN108121791A CN108121791A CN201711379613.0A CN201711379613A CN108121791A CN 108121791 A CN108121791 A CN 108121791A CN 201711379613 A CN201711379613 A CN 201711379613A CN 108121791 A CN108121791 A CN 108121791A
- Authority
- CN
- China
- Prior art keywords
- node
- path
- mark
- search
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Abstract
本发明涉及大数据和智慧交通领域,通过对交通大数据的整理,得出路径,在路径的基础上通过特征标识和链式存储的方法,构建路径的可索引系统,提供一种路径可计算的算法和系统。本发明定义路径的构成,给出了路径名称和路径的搜索方法。通过将交通大数据的整理形成路径表示,在路径基础上实现交通信息的可搜索和计算,为智慧交通提供可计算的方法和系统。
Description
技术领域
本发明涉及大数据和智慧交通领域,主要针对交通大数据中人、车和物品的活动路径进行分析计算,从而为交通信息的查询,城市交通信息的统计分析,出行路径和站点的规划提供科学的依据。本发明定义了路径,给出了特征标识计算和链式存储方法,并提供了地名和路径的两种搜索方法:前缀最大匹配和中间最大匹配算法,在此基础上实现交通大数据路径可搜索系统。
背景技术
智慧城市是一种全新的城市形态:绿色、低碳、环保,更适合于人们的居住生活。
智慧交通是智慧城市必备的功能。智慧交通是基于现代电子信息技术面向交通运行的服务系统,它的主要功能是交通信息的收集、处理、发布、交换、分析和利用,为交通参与者提供多样性的服务。交通是城市的血脉,智慧交通有助于提高城市血脉的顺畅。如果说道路相当人的血脉一样,那么互联网、移动通信和物联网技术就相当于人的神经系统;智慧交通就是管理人、交通工具、物品活动路径的大脑,海量的信息汇集于智慧交通系统,系统经过运算、整理,为交通出行提供优化的方案。
智慧交通的关键是人的出行、商品运输的智能化,社会各功能设施的布局,公交布局的智能规划,围绕于交通信息大数据的融合与采集,为智慧交通提供决策的依据和方法,给交通出行提供便捷的服务。
出行路径主要是指人、物品和交通工具的活动路径。人的活动在城市交通中主要是依靠交通工具来实现的,路径的搜索主要是指人、物品和交通工具的路径搜索。
以交通工具和人运行的一段路径为基本信息单元,采用链式存储的技术,形成交通信息树,基于信息树实现信息的查找;围绕人出行的基本路径,展开分析,优化人的出行路径,优化包含道路、公交规划、热点商圈等的规划。
人和交通工具的移动通过什么方式来记录?又通过什么方式来查找?路径的搜索问题是个NP问题,实现出行路径的可搜索对于智慧交通有着很强的现实和社会意义。
怎样采集路径是我们要解决的问题之一?
怎么样存储路径,提供路径的搜索服务是我们要解决的另一个问题?
利用交通大数据路径可搜索系统,优化我们的交通,为智慧城市的发展服务是我们最终的目的。
本发明通过对交通出行的数据记录清洗整理,计算结果表示为本发明定义的路径表示,实现在路径基础之上交通信息可计算分析,从而为交通信息的查询,城市交通信息的分析,出行路径和站点的规划提供科学的依据。
发明内容
本发明主要解决基于人、交通工具和货物出行路径的可搜索。本发明采用的路径的定义:依次相联系的地点的文字串,地点之间有分隔符号;多路径之间有分隔符号。以地名或者站点名称构建的路线;地名或者站点名称为路径的节点。本发明提到的地名、站点名称和路径节点统一称为地名。hash即消息摘要散列算法。
路径由地名组成的具有顺序关联的集合。
实现路径的可搜索主要解决的问题:实现地名和路径的标识算法,结合信息存储实现地名和路径的搜索。
假定地名由n个词汇组成,表示为S={si|i=0,...,n-1},则地名标识计算为Wi=hash(Wi-1+si),其中W0=hash(s0),i=0,...,n-1,hash为消息摘要算法。
假定路径Rn={ri|i=0,...,n-1},则路径标识计算为Ri=hash(Ri-1+ri),其中R0=hash(r0), i=0,...,n-1,hash为消息摘要算法。
综上所述。编码技术采用统一的算法:Wi=hash(Wi1+si),其中W0=hash(s0);i=0,...,n-1。
信息存储单元U为:{Wi,si,Wi-1},当i=0时,{W0,s0}或者{W0,s0,0}。
存储集合为存储单元U的集合。
地名由n个词汇组成S={si|i=0,...,n-1},地名按词汇序列采用增量hash,形成节点名称单一词汇的标识Wi=hash(Wi-1+si),其中W0=hash(s0);i=0,...,n-1。存储集合为:{Wi,si,Wi1},当 i=0时,{W0,s0}或者{W0,s0,0}。
利用数据库为地名和路径建立表,三个字段:标识,词汇和前标识。
地名查询。给定查询条件查找最佳匹配的地名。
路径查询。根据地名,查询该节点关联的活动路径。
多路径查询。以换乘为路径分割的方式,或者其它分割方式,确定多路径的路径分割,然后进行查询。
基于路径的统计分析算法。通过数据整理,得到的记录导入到本系统,在此系统上展开统计分析,主要包括:起点地名的交通情况分析;终点地名的交通情况分析;路过的地名交通情况分析。
本发明主要解决了交通数据中有关路径的可计算问题,通过对交通大数据的整理分析,实现了人、交通工具和货物出行路径的可计算。
具体实施
本发明主要围绕交通大数据来展开,解决交通大数据中有关路径的可计算问题。具体来说,通过对交通大数据的整理,实现出行路径提取,在出行路径的基础上,通过特定的标识计算,结合链式存储等技术实现路径的可搜索。本发明所涉及的路径搜索问题主要指的是:基于人、交通工具和物品的交通活动路径的可搜索,和一般的最优路径的搜索问题完全不同,是在已经发生的交通出行的基础上搜索。
本发明定义的路径:由节点(站点或者地名)构成的从起点到终点的道路形式。多路径的定义是由多条路径组成,包括起始节点、中间节点、终止节点和换乘节点(前路径终止节点同时为后一路径起始节点)组成。
本发明主要提供两类的基本功能:地名的查询,路径的搜索和计算。采用的技术思路一致,均采用增量散列的计算实现,通过前后节点的链式存储来满足信息的上下文关联查询。
本发明关键的技术是增量散列和链式存储的技术。通过增量散列实现信息上下文标识的可计算,实现多维信息的查询转变为一维信息查询,实现信息的先计算后查询。
采用增量散列技术生成标识,定义如下:序列S为{si|i=0,...,n-1},节点si的标识Wi计算如下:Wi=hash(Wi-1+si),其中W0=hash(s0),i=0,...,n-1。
链式存储技术,存储单元U为:{Wi,si,Wi-1,F},当i=0时,{W0,s0,0,0},对应解释为:{标识,节点,前标识,节点类型}。对于地名而言,节点类型F有三类:起始节点、中间节点和终止节点,分别对应0,1,2,起始结点的前标识为0。对于路径而言,节点类型F有四类:起始节点、中间节点、换乘节点和终止节点,分别对应0,1,2,3,起始结点的前标识为0。
检索技术。主要提供两大类型的基本检索技术:地名的检索,路径的检索。
地名的存储形式和索引方案。参照链式存储单元的定义,针对该单元选择建立数据表,数据表包括四个字段:{标识,节点,前标识,节点类型},分别在标识、节点和前标识三个字段建立索引。
路径存储形式和索引方案。参照链式存储单元的定义,针对该单元选择建立数据表,数据表包括四个字段:{标识,节点,前标识,节点类型},分别在标识、节点和前标识三个字段建立索引。
上述方式一致。索引的解决方法基本相同,数据表中的信息表示形式为{W0,s0,0,F}对应 {标识,节点,前标识,节点类型}。
信息的查找方法如下:主要分为最大前缀匹配算法和中间最大匹配算法两类。
地名和路径搜索最大前缀匹配算法相同。数据表中的信息表示形式为{标识,节点,前标识,节点类型},信息的查找方法如下:
查找序列S={si|i=0,...,n-1},具体计算如下:
节点si的标识Ni计算如下:Ni=hash(Ni-1+si),其中N0=hash(s0);i=0,...,n-1。
先查找Nn-1,结果不为空则找到,否则查找序列Nn-2,递归直到找到或者直到N0为止。
如果找到结果,则结果对应查询的标识。
找到节点的标识后,下一步在该节点的后续节点中,查找有终止节点标识的节点。递归的方法查找,以该节点为前置节点的节点是否有终止节点标识,有则找到;否者递归直到找到,结束查询。
中间最大匹配算法,先根据地名或者路径序列中的首个节点,在节点序列中查找。查找的序列S={si|i=0,...,n-1},先在节点中查找s0,得到该节点的标识结果集。如果结果集为空,则说明没有匹配的结果。
如果有,假定结果集合R为{rj|j=0,...,k-1},把结果集合中rj作为初始标识,和序列S中的si(i=1,...,n-1)作为增量hash计算。
新的序列M如下{rj,s1,s2,...,sn-1},序列的值mi=si,m0=rj;对应M,j=0,...,k-1;i=1,...,n-1。不同的j对应不同的增量散列值,具体计算如下:Wi=hash(Wi-1+m1),其中W0=rj,j=0,...,k-1;计算mn-1的标识码作为查询的标识。
如果查询的结果不为空,则找到,否则计算{rj.s1,s2,...,sn-2}的标识,查找该标识,递归直到找到为止。
找到节点标识后,下一步在该节点的后续节点中,查找有终止节点标识的节点。递归的方法查找,以该节点为前置节点的节点是否有终止节点标识,有则找到;否者递归直到找到,结束查询。
以上实现了查询条件的最大化匹配,找到标识后,系统就可以针对该标识实现计算。
系统的主要存储包括:地名标识链式存储表;路径标识链式存储表;路径标识对应的交通信息的存储表。
交通大数据路径可搜索系统主要实现地名的可搜索,地名相关路径的可搜索,解决交通数据中的路径可计算问题。
有了上述的存储和索引的设计,大量的交通数据导入整理后,路径的可搜索和计算系统就具备了相应的功能。
基于地名、路径的统计算法,主要计算经过某地名或者某段路径,满足其它查询条件的所有路径。参考中间最大匹配算法。先根据地名或者路径序列中的首个节点,在节点序列中查找。查找的序列S={si|i=0,...,n-1},先在节点中查找s0,得到该节点的标识结果集。如果结果集为空,则说明没有匹配的结果。
如果有,假定结果集合R为{rj|j=0,...,k-1},把结果集合中rj作为初始标识,和序列S中的si(i=1,...,n-1)作为增量hash计算。
新的序列M如下{rj.s1,s2,...,sn-1},序列的值mi=si,m0=rj;对应M,j=0,...,k-1;i=1,...,n-1。不同的j对应不同的增量散列值,具体计算如下:Wi=hash(Wi-1+mi),其中W0=rj,j=0,...,k-1;计算mn-1的标识码作为查询的标识。
如果查询的结果不为空,则找到,否则计算{rj,s1,s2,...,sn-2}的标识,查找该标识,递归直到找到为止。
找到节点标识后,下一步在该节点的后续节点中,查找有终止节点标识的节点。递归的方法查找,查找所有以该节点为前置节点的节点并有终止节点路径标识。
同样,找到节点标识后,下一步在该节点的前置节点中,查找有起始节点标识的节点。递归的方法查找,查找所有以该节点的前置节点的节点并有起始节点标识路径。
以上实现了基于地点和路径的统计算法。
给定地点的交通信息分析系统。主要分析和计算包括:给定时间段(或者不设置时间段)的,给定地点出行分析,分析出行的习惯,出行交通所需的时间。采用地点统计算法实现。
给定出行主体的交通信息分析系统。通过出行关联的路径分析,主要包括:主体的特征分析,例如:人出行的分析,得出居住地、工作地和其它地点的;出行时间推断人的职业习惯等。通过人的出行标识(假定交通卡ID)在路径标识和交通信息关系表中查找,查询人的出行习惯,出发地,目的地分析,时间段分析等。
公共交通的路径分析。分析交通线路关联站点的人出行情况,评估站点的设置。通过路径标识和交通信息关系表,查找相关路径,结合其它条件统计。
公共交通换乘分析。通过路径中的换乘节点,统计换乘的人、时间。通过路径标识表找到换乘节点,查找相关路径,结合其它条件统计。
站点和线路的综合分析。通过地点和线路来分析站点和线路布局的效率和合理性。
常规出行路径的查询。给定出行的地名后,在现有的路径中查找,选择线路。
一种交通大数据中路径可搜索系统,主要为交通信息的大数据计算提供了实现的方法和手段,在此基础上可以实现有关交通分析系统。
Claims (8)
1.一种交通大数据路径可搜索系统,其特征在于:
路径可搜索系统,路径计算分析系统。
2.根据权利1所述路径的可搜索,具体特征在于:
地名和路径的搜索算法,相关的算法由增量散列结合链式存储实现。相应的搜索算法包括前缀最大匹配算法和中间序列最大匹配算法。
3.根据权利2描述的地名和路径增量散列方法,其特征如下:
定义如下,序列S={si|i=0,...,n-1},节点si的标识Wi,计算如下:Wi=hash(Wi-1+si),其中W0=hash(s0);i=0,...,n-1。
4.根据权利2描述的地名和路径链式存储方法,其特征如下:
链式存储技术,存储单元U为:{Wi,si,Wi-1,F},当i=0时,{W0,s0,0,0},对应解释为:{标识,节点,前标识,节点类型}。
5.根据权力1,路径可搜索系统主要特征包括:
存储特征在于:地名标识链式存储表;路径标识链式存储表;路径标识对应的交通信息的存储表。
地名和路径的存储形式和索引方案。参照权力4描述的链式存储单元的定义,建立数据表,数据表包括四个字段:{标识,节点,前标识,节点类型}。
6.根据权利2描述的方法,地名和路径搜索最大前缀匹配算法,其特征如下:
地名和路径搜索最大前缀匹配算法相同。按照权力4,数据表中的信息表示形式为{标识,节点,前标识,节点类型},查找序列S={si|i=0,...,n-1},具体计算如下:
节点si的标识Ni计算如下:Ni=hash(Ni-1+si),其中N0=hash(s0);i=0,...,n-1。
先查找Nn-1,结果不为空则找到,否则查找序列Nn-2,递归直到找到或者直到N0为止。
如果找到结果,则结果对应查询的标识。
找到节点的标识后,下一步在该节点的后续节点中查找有终止节点标识的节点。递归的方法查找,以该节点为前置节点的节点是否有终止节点标识,有则找到;否者递归直到找到,结束查询。
7.根据权利2描述的方法,地名和路径的中间最大匹配搜索算法,其特征如下:
地名和路径的中间最大匹配搜索算法相同,先根据序列首个节点查找该节点对应的标识,然后增量散列计算标识,继续查找。具体特征如下:
参照权力4,数据表形式为:{标识,节点,前标识,节点类型},查找方法特征如下:
先根据地名或者路径序列中的首个节点,在节点序列中查找。查找的序列S为{si|i=0,...,n-1},先在节点中查找s0,得到该节点的标识结果集。如果结果集为空,则说明没有匹配的结果。
如果有,假定结果集合R为{rj|j=0,...,k-1},把结果集合中rj作为初始标识,和序列S中的si(i=1,...,n-1)作为增量hash计算。
新的序列M如下{rj,s1,s2,...,sn-1},序列的值mi=si,i=1,...,n-1;m0=rj,j=0,...,k-1。不同的j对应不同的增量散列值,具体计算如下:Wi=hash(Wi-1+mi),其中W0=rj,j=0,...,k-1;计算mn-1的标识码作为查询的标识。
如果查询的结果不为空,则找到,否则计算{rj,s1,s2,...,sn-2}的标识,查找该标识,递归直到找到为止。
找到节点的标识后,下一步在该节点的后续节点中,查找有终止节点标识的节点。递归的方法查找,以该节点为前置节点的节点是否有终止节点标识,有则找到;否者递归直到找到,结束查询。
8.根据权利1路径计算分析系统,通过路径标识方法查找路径,根据该标识关联的信息实现交通路径、地点和目标个体的查询,统计分析等计算。具体特征在于:
给定地名或者路径的查询统计。先根据地名或者路径序列中的首个节点,在节点序列中查找。查找的序列S={si|i=0,...,n-1},先在节点中查找s0,得到该节点的标识结果集。如果结果集为空,则说明没有匹配的结果。
如果有,假定结果集合R为{rj|j=0,...,k-1},把结果集合中rj作为初始标识,和序列S={si|i=1,...,n-1}中的si作增量hash计算。
新的序列M如下{rj,s1,s2,...,sn-1},序列的值mi=si,i=1,...,n-1;m0=rj,j=0,...,k-1。不同的j对应不同的增量散列值,具体计算如下:Wi=hash(Wi-1+mi),其中W0=rj,j=0,...,k-1;计算mn-1的标识码作为查询的标识。
对不同的j而言,如果查询的结果不为空,则找到,否则计算{rj,s1,s2,...,sn-2}的标识,查找该标识,递归直到找到为止。
找到节点的标识后,下一步在该节点的后续节点中,查找所有有终止节点标识的节点。
同上,在该节点的前置节点中查找有起始节点的节点,递归找到所用的作为路径起始点的集合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711379613.0A CN108121791A (zh) | 2017-12-14 | 2017-12-14 | 一种交通大数据路径可搜索系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711379613.0A CN108121791A (zh) | 2017-12-14 | 2017-12-14 | 一种交通大数据路径可搜索系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108121791A true CN108121791A (zh) | 2018-06-05 |
Family
ID=62229602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711379613.0A Pending CN108121791A (zh) | 2017-12-14 | 2017-12-14 | 一种交通大数据路径可搜索系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108121791A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110430133A (zh) * | 2019-05-23 | 2019-11-08 | 北京航空航天大学 | 一种基于置信区间的域间路径标识前缀获取方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101308555A (zh) * | 2008-06-27 | 2008-11-19 | 北京工业大学 | 多模式公交出行路径寻优方法 |
CN104008205A (zh) * | 2014-06-18 | 2014-08-27 | 中国人民解放军信息工程大学 | 一种内容路由的查询方法及系统 |
CN105955982A (zh) * | 2016-04-18 | 2016-09-21 | 上海泥娃通信科技有限公司 | 信息序列特征编码和检索的方法和系统 |
CN106052701A (zh) * | 2016-05-23 | 2016-10-26 | 山东大学 | 一种交通溢流状态下车辆路径选择的方法 |
-
2017
- 2017-12-14 CN CN201711379613.0A patent/CN108121791A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101308555A (zh) * | 2008-06-27 | 2008-11-19 | 北京工业大学 | 多模式公交出行路径寻优方法 |
CN104008205A (zh) * | 2014-06-18 | 2014-08-27 | 中国人民解放军信息工程大学 | 一种内容路由的查询方法及系统 |
CN105955982A (zh) * | 2016-04-18 | 2016-09-21 | 上海泥娃通信科技有限公司 | 信息序列特征编码和检索的方法和系统 |
CN106052701A (zh) * | 2016-05-23 | 2016-10-26 | 山东大学 | 一种交通溢流状态下车辆路径选择的方法 |
CN106052701B (zh) * | 2016-05-23 | 2018-08-14 | 山东大学 | 一种交通溢流状态下车辆路径选择的方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110430133A (zh) * | 2019-05-23 | 2019-11-08 | 北京航空航天大学 | 一种基于置信区间的域间路径标识前缀获取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106407352B (zh) | 基于深度学习的交通图像检索方法 | |
CN110008413B (zh) | 一种交通出行问题查询方法和装置 | |
CN104346444B (zh) | 一种基于路网反空间关键字查询的最佳选址方法 | |
CN107167136A (zh) | 一种面向电子地图的位置推荐方法及系统 | |
CN104035954A (zh) | 一种基于Hadoop的套牌车识别方法 | |
CN107832631A (zh) | 一种数据发布的隐私保护方法和系统 | |
CN102521364B (zh) | 一种图上两点间最短路径查询方法 | |
CN106844407A (zh) | 基于数据集相关性的标签网络产生方法和系统 | |
CN104268629A (zh) | 一种基于先验信息和网络固有信息的复杂网络社区检测方法 | |
CN105574541A (zh) | 一种基于紧密度排序的网络社区发现方法 | |
Jiang et al. | Identifying K Primary Corridors from urban bicycle GPS trajectories on a road network | |
Shang et al. | Prediction-based unobstructed route planning | |
CN110232133A (zh) | 一种基于特征融合和款式分类的服装图像检索方法和系统 | |
Lee et al. | Crowd-sourced carpool recommendation based on simple and efficient trajectory grouping | |
Akram et al. | Menger’s theorem for m-polar fuzzy graphs and application of m-polar fuzzy edges to road network | |
CN108121791A (zh) | 一种交通大数据路径可搜索系统 | |
Dai et al. | Cluster-based destination prediction in bike sharing system | |
CN106547764A (zh) | 网页数据去重的方法及装置 | |
CN113569977B (zh) | 一种基于手机信令数据的出行目的识别方法 | |
CN113889284B (zh) | 一种基于公共交通知识图谱的传染病接触目标追踪方法 | |
CN103164406B (zh) | 移动目标信息处理方法及系统 | |
CN112667925B (zh) | 一种路线推荐方法、装置、计算机设备以及存储介质 | |
CN106709011A (zh) | 一种基于空间定位簇的位置概念层次消解计算方法 | |
Brisaboa et al. | New structures to solve aggregated queries for trips over public transportation networks | |
Ghosh et al. | Computing Skyline Using Taxicab Geometry |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180605 |
|
WD01 | Invention patent application deemed withdrawn after publication |