CN103198151A - 区域性城市公交车辆运行信息的索引查询系统及方法 - Google Patents
区域性城市公交车辆运行信息的索引查询系统及方法 Download PDFInfo
- Publication number
- CN103198151A CN103198151A CN2013101461091A CN201310146109A CN103198151A CN 103198151 A CN103198151 A CN 103198151A CN 2013101461091 A CN2013101461091 A CN 2013101461091A CN 201310146109 A CN201310146109 A CN 201310146109A CN 103198151 A CN103198151 A CN 103198151A
- Authority
- CN
- China
- Prior art keywords
- data
- index
- query
- bus
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000005259 measurement Methods 0.000 claims description 13
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 4
- 238000002360 preparation method Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 230000006698 induction Effects 0.000 claims description 3
- 238000005215 recombination Methods 0.000 claims 1
- 230000006798 recombination Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000000605 extraction Methods 0.000 abstract 1
- 230000001965 increasing effect Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 235000019580 granularity Nutrition 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 201000004569 Blindness Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012554 master batch record Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000007261 regionalization Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Landscapes
- Traffic Control Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种区域性城市公交车辆运行信息的索引查询方法,属于智能交通技术,包括:获取城市公交站点数据及公交车GPS数据,去除公交车GPS数据中的无效数据;对城市公交站点进行逻辑上的层级划分得到包含所有站点的索引树,并对每个站点生成相应索引序列;根据索引序列信息对城市公交GPS数据按其所在的区域添加索引字段;向用户提供查询接口界面,根据用户在查询接口界面输入的查询条件以及索引序列搜索数据,并将查询得到的车辆信息以文件的形式返回给用户。本发明还公开了一种区域性城市公交车辆运行信息的索引查询系统。本发明考虑了公共交通车辆数据的时间、空间特征,特别适用于区域性公交数据的提取。
Description
技术领域
本发明属于智能交通技术领域,特别涉及一种区域性城市公共交通车辆运行信息的索引查询系统及方法。
背景技术
智能交通(ITS)技术的飞速发展,使得伴随产生的公交数据量巨大且增长速度很快,并且在时间上不能保证连续性、在空间方面数据散乱分布,如果使用传统的数据存储和管理方法,必然会导致数据处理的效率降低,影响数据的应用性能。公交GPS数据本身具有显著的时、空特征,而对区域性公交路况的分析和区域性公交分布信息的发布,都是以区域性数据检索为前提,但传统的数据检索方法并没有以数据的特征作为存储的依据,更没有将其与数据检索的需求相结合。所以,需要一种能够对区域性公交信息进行索引的空间数据索引技术。
目前对路网空间数据的索引技术主要有:
(1)FNR树,该技术由一个二维R树与一维R树组成。二维R树索引道路网络的每一个路段,每一个叶节点中包含指向一维R树的指针;一维R树索引在某个时间间隔内与路段对应的动态移动对象。这种方法的缺点在于选用了道路每个交叉点之间的路段作为索引基本元素,这样R树中就产生了庞大的叶节点以及对应的巨大更新。
(2)改进的FNR树,该技术把道路网络与轨迹从复杂的三维空间转换为两个低维子空间,在低维子空间索引移动对象轨迹,移动对象与道路网络分别用两棵二维R树索引,道路网络索引的基本元素也是路段。与FNR树相比,它们对移动对象的索引方式不同。由于移动对象的索引也采用了二维R树,所以在查询处理时,相比FNR树对移动对象的索引更复杂些。但这种方法对移动对象的运动表达较为合理,移动对象在路段中的表达可以任意改变运动方向与速度,而FNR树不能做到这点。
(3)MON树,该技术存储了道路网络中移动对象的整个历史轨迹,并可对过去时态进行查询。使用路径作为索引的基本元素,路径由同名道路构成,将道路网络的道路表示为多段线。由于道路表达上的区别,MON树对移动对象轨迹的表达比FNR树更为简洁,同时索引效率有所提高,但由于路径过长,容易产生较大的死空间,影响查询效率。
以上技术应用上的不足在于,对移动对象信息的查询是以路段或者线路为单位,而不能很好的支持对区域的查询,所以在移动对象分布区域化、分布密度不均的场景中,会索引大量的空闲区域和密度差异较大的区域,造成存储空间的浪费和查询性能的下降。
因此需要找到一种将数据的时、空特征充分融合到数据存储和检索模型的设计当中的策略。这就需要在数据的空间特征基础上,进一步引申出区域特征,对空间数据按照区域特征进行重构,以解决移动对象分布区域化造成的数据索引时I/O过于频繁、数据命中率低等问题。
发明内容
有鉴于此,本发明的目的在于提供一种特征区域粒度可控的区域性城市公共交通车辆运行信息的索引查询系统及方法,用于克服现有技术不能按特征区域检索公交信息的技术问题。
本发明提供了一种区域性城市公交车辆运行信息的索引查询方法,包括:
获取城市公交站点数据及公交车GPS数据,去除所述公交车GPS数据中的无效数据;
对城市公交站点进行逻辑上的层级划分得到包含所有站点的索引树,并对每个站点生成相应索引序列;
根据所述索引序列信息对城市公交GPS数据按其所在的区域添加索引字段;
向用户提供查询接口界面,根据用户在查询接口界面输入的查询条件以及索引序列搜索数据,并将查询得到的车辆信息以文件的形式返回给用户。
本发明还提供了一种区域性城市公交车辆运行信息的索引查询系统,包括:
预处理模块,用于去除城市公交GPS数据中的无效数据;
索引模块,用于将城市公交站点进行逻辑上的层级划分得到包含所有站点的索引树,进而对每个站点生成相应索引序列;
查询模块,用于先根据所述索引序列信息将城市公交GPS数据按其所在的区域添加索引字段,再依据查询条件搜索数据;
显示模块,用于给用户提供查询接口界面,并将查询得到的搜索数据以文件的形式返回给用户。
本发明针对用户的区域性公交数据需求,结合了公交数据的时间、空间特征,提出了基于特征区域的空间数据检索模型,基于此模型得到一种对公交数据建立索引的方法及系统,有利于对特征区域内移动对象数据的检索。与现有技术对移动对象信息的索引查询以路段或者线路为单位或者是以均分网格为单位所针对的业务需求不同,考虑了公共交通车辆数据的时间、空间特征,特别适用于区域性公交数据的提取。
附图说明
图1为本发明实施例提供的区域性城市公共交通车辆运行信息的索引查询系统结构图;
图2为本发明实施例提供的区域性城市公共交通车辆运行信息的索引查询方法流程图;
图3为本发明实施例中数据查询的方法流程图;
图4为本发明实施例提供的索引查询系统与MySQL在单位时间检索记录数变化趋势图;
图5为本发明实施例提供的索引查询系统与MySQL在单位时间检索数据量变化趋势图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
本发明实施例是针对用户的区域性公交数据需求,结合了公交数据的时间、空间特征,提出了基于特征区域的空间数据检索模型,基于此模型得到一种对公交数据建立索引的方法,该索引方法有利于对特征区域内移动对象数据的检索。与现有技术对移动对象信息的索引查询以路段或者线路为单位或者是以均分网格为单位所针对的业务需求不同。
针对本实施例中的相关概念解释如下:
基础点对象:将全市市内公交站点所在的位置点作为基础点对象,其由四个部分组成:站点id属性、所属簇节点属性、名称属性、位置属性。其形式化描述如下:P={p|p=(id,p_parent,name,longitude,latitude)},其中id是站点的编号,用于唯一标识一个站点,p_parent是簇中心点对象的编号,name是站点名称,longitude是站点的经度,latitude是站点的纬度。
簇中心点对象:簇中心点对象是形成了特征区域之后,簇的中心点对象,由三个部分组成:簇id属性、所属簇节点属性和位置属性,其形式化描述如下:P={p|p=(id,p_parent,longitude,latitude)},其中id是簇的编号,用于唯一标识一个簇,p_parent是簇中心点对象的编号,longitude是簇中心点的经度,latitude是簇中心点的纬度。
最小边界矩形(MBR):包含一个站点对象的最小边界矩形。其描述如下:MBR={mbr|mbr=(Rangex,Rangey)},其中Rangex和Rangey表示MBR在x和y维上的跨度。
特征区域:将基础点对象按照空间位置进行聚类得到簇,再将簇中每一个基础点对象进行最小外接边框扩展之后的簇区域。
覆盖窗口:从查询的角度来看,索引树中每一个非叶子节点所覆盖的所有其子节点所表示的区域的并集。
本实施例提供了一种区域性城市公共交通车辆运行信息的索引查询系统,如图1所示,包括:预处理模块、索引模块、查找模块和显示模块。其中,
预处理模块11,用于获取城市公交站点数据及公交车GPS数据,去除城市公交GPS数据中的无效数据;
索引模块12,用于将城市公交站点进行逻辑上的层级划分得到包含所有站点的索引树,进而对每个站点生成相应索引序列;
查询模块13,用于先根据索引信息将城市公交GPS数据按其所在的区域添加索引字段,再依据查询条件搜索数据;其中,各个站点的索引序列的集合就是索引表,索引表所展现的就是索引信息;
显示模块14,用于给用户提供查询接口界面,并将查询得到的搜索数据(车辆信息)以文件的形式返回给用户。
索引模块12包括:数据集准备单元121、空间位置聚类单元122、索引树构建单元123、索引对照表生成单元124。
数据集准备单元121,用于提供基础站点数据和每次聚类之后生成的结果数据(中心点对象),为建立索引树和生成索引对照表提供数据支持。
空间位置聚类单元122,用于使用数据集准备单元提供的基础站点对象和中心点对象,设置点对象间的邻近性度量方式,调整临近性度量参数阈值,进行多次聚类迭代,直到聚类结果的簇中心点对象的数量收敛于一个预设常量或者缩小到指定的程度,则无需再进行聚类。
索引树构建单元123,用于将所有公交站点作为基础点对象集合,全部的基础点对象作为叶子节点层,记为Tn层。按照基础点对象之间的邻近性度量参数进行聚类形成簇,簇的中心就称为中心点对象,聚类之后得到的所有簇的中心点对象作为Tn-1层的节点;将第一次聚类得到的Tn-1层的中心点对象按照对象之间的邻近性度量参数进行二次聚类,得到的全部簇中心点对象成为Tn-2层的所有节点;将第二次聚类得到的Tn-2层的中心点对象按照对象之间的邻近性度量参数进行第三次聚类,所得的簇中心点对象作为上一层即Tn-3层的节点,逐次生成索引树的每层节点。该索引树将子节点层层聚拢,最终全部归并到根节点,根节点代表了对城市区域的整体索引,实现了区域的层层覆盖。
索引对照表生成单元124,用于遍历所述基础点对象集合中的每一个基础点对象,对树的每一个叶子节点自底向上依次遍历其父节点直至索引树的根节点,自底向上提取每一个父节点的节点编号,形成基础点对象的索引序列,所有基础点对象的索引序列构成索引对照表。
查询模块13包括:数据重组单元131,索引序列查询单元132,快表机制单元133。
数据重组单元131,用于针对公交GPS数据,查找GPS数据的经纬度所在的经过MBR扩展的基础点对象的特征区域,根据该基础点对象对应的索引序列,标记公交GPS数据,之后插入到分布式数据库中。这里的MBR扩展定义为以基础点对象的位置属性为中心,以点的平均距离为扩展距离,分别向上下左右四个方向扩展,得到以基础点对象的位置为中心、以点的平均距离的2倍为边的正方形区域,作为MBR。
索引序列查询单元132,用于在公交GPS数据重组完成之后,用户查询时,由用户首先在系统操作界面的地图中指定查询位置或者查询窗口大小,或者查询时间范围,系统在获取该位置的经纬度信息后与索引对照表进行匹配,得到索引序列,作为在分布式数据库中索引数据的依据,之后根据窗口大小或者时间范围取出数据。
快表机制单元133,用于为了减少扫描索引对照表的次数,对历次查询历史数据进行归纳分析,得到查询的频繁项表,其数据格式为{频率,基础点,查询窗口,索引值}。
显示模块14包括:接收单元141、处理单元142,显示数据单元143。
接收单元141,用于接收用户的查询需求。
处理单元142,用于将查询需求提交给分布式数据库,分布式提取满足查询需求的记录。
显示数据单元143,用于将查询得到的车辆运行信息以表格的形式返回给用户。
以上实施例与现有技术相比的优点在于:
本实施例结合了公交数据的时间、空间特征,提出了基于特征区域的海量空间数据检索模型,可以对公交数据基于特征区域进行检索,不同于现有技术对移动对象信息的索引查询是以路段或者线路为单位或者是以均分的网格为单位。
此外,本实施例利用检索模型,对于地图上的定位点,能够快速检索出以该点为中心的区域可伸缩的查询窗口内的公交GPS数据,为公交区域性规律分析提供了数据支持。
本发明实施例还提供了一种区域性城市公共交通车辆运行信息的索引查询方法,如图2所示,包括如下步骤:
步骤201:获取城市公交站点数据及公交车运行的GPS数据,去除所述公交车GPS数据中的无效数据。对于原始的公交GPS数据,会有各种异常数据,预处理过程去除各种异常数据,以防对之后的处理过程干扰。
其中,城市公交GPS数据中的无效数据包括无效单条数据、无效车辆数据和无效线路数据。
去除无效单条数据:删除公交GPS数据中字段不全或异常的数据,如线路号或车辆号为0的数据、时间戳无效的数据等;
去除无效车辆数据:对于某一车辆,如果GPS数据的数量小于20条,则认为是车辆号异常,删除该车辆号对应的所有GPS数据;
去除无效线路数据:对于某一线路统计,如果GPS数据的数据量小于100条,则认为线路号异常,删除该线路下对应的所有GPS数据。
步骤202:对城市公交站点进行逻辑上的层级划分得到包含所有站点的索引树,进而对每个站点生成相应索引序列。建立索引树和生成索引序列的步骤具体包括:
步骤2021:建立高度等于6的树,使用canopy+K-means的聚类算法对点对象进行处理形成簇。
将所有公交站点作为基础点对象集合,全部的基础点对象作为叶子节点层,记为T6层;按照基础点对象之间的欧式距离大小,为避免K-means聚类算法k值选取的盲目和随机性,先使用canopy算法对点对象作前期的聚类处理,将canopy的输出组个数作为K-means算法的输入。最终第一次聚类将基础点对象3219个,收缩到639个簇内,收缩率约为20%。
聚类之后得到的所有簇的中心点对象作为T5层的节点,被聚为同一簇的基础点对象所属的父节点就是这个簇的中心点对象;将第一次聚类得到的T5层的中心点对象按照对象之间的欧式距离大小进行二次聚类,得到的全部簇中心点对象成为T4层的所有节点,T5层节点的父节点为其所属的T4层的簇中心点对象。最终第二次聚类将中心点对象639个,收缩到128个簇内,收缩率约为20%。
将第二次聚类得到的T4层的中心点对象按照对象之间的欧式距离大小进行第三次聚类,所得的簇中心点对象作为上一层即T3层的节点,并将T4层节点的父节点按照上述规则全部指向相应的T3层节点。最终第三次聚类将中心点对象128个,收缩到43个,收缩率为33%。
继续进行迭代聚类,将参数值调大,簇的个数趋于10以内变化甚小,将参数值回调一些,则在原来的簇个数附近浮动。由此看出满足迭代聚类的终止条件,聚类阶段完成。
步骤2022:将城市划分为R1(西北)、R2(东北)、R3(西南)、R4(东南)四个子区域,并把每一个子区域分别用中心点对象封装,作为T2层节点,将第三次聚类得到的全部T3层节点按照节点所在的经纬度位置划分到四个子区域内,并将T3层节点的父节点指向相应的T2层节点,新建一个root节点,作为T1节点,将T2层节点全部指向root节点。
步骤2023:为基础点对象集合中每个基础点对象赋予一个编号,遍历所创建索引树中的每个叶子节点,对树中每一个叶子节点按照其数据结构中指向其父节点指针的自底向上依次获取其父节点的编号直至索引树的根节点,根节点编号设置为0;拼接叶子节点到根节点路径上所访问节点的编号,以根节点的编号为索引头形成基础点对象的索引序列,所有基础点对象的索引序列构成索引对照表。
步骤203:根据索引序列信息对城市公交GPS数据按其所在的区域添加索引字段,再依据查询条件搜索数据。参见图3,数据查询的步骤具体包括:
步骤2031:用公交GPS数据进行特征区域填充,即将公交GPS数据归于已经划分好的特征区域中,实现公交数据区域性检索。针对于每一条公交GPS数据,查找数据的经纬度在哪一个经过MBR扩展的基础点对象的特征区域中,读出该基础点对象对应的索引序列,然后将该条数据的时间戳+该数据对应索引序列作为该条GPS数据的rowkey,插入到分布式数据库中。这样数据库中的数据先按照时间进行聚集,在相同时间区间内,按照空间的相近原则聚集。
这里MBR扩展定义为以基础点对象的位置属性为中心,以点的平均距离为扩展距离,分别向上下左右四个方向扩展,得到以基础点对象的位置为中心、以点的平均距离的2倍为边的正方形区域,作为MBR。
步骤2032:根据查询位置、查询时间段、查询窗口等级提取查询位置的经纬度信息后与索引对照表进行匹配,得到索引序列,作为在分布式数据库中索引数据的依据。用户先点击需要查询的位置,再选择查询时间段(若是不选时间,默认是查询该位置的所有公交数据),选择查询窗口等级(若是不选等级,则默认是扩展最小的窗口等级)。由于索引序列是从索引树的根节点到基础点对象的编号的有序数字序列,每一个非叶子节点所代表的区域是该节点所拥有的所有孩子节点的MBR的并集区域,因此,节点越靠近根节点,表示的覆盖区域越大,根节点表示覆盖整个地区。查询窗口级别直接对应着索引序列的长度,如果查询窗口级别是i,那么索引序列就取前i+1位数。由此得到,在查询的过程中,可以随着需求的变化,在一定范围内缩小或扩大查询窗口级别,满足数据检索不同粒度的需要。
步骤2033:经过用户多次查询,积累了一定的查询历史数据。GPS数据具有空间特征,那么在对数据进行操作和分析时,也伴随着不同区域的数据使用的不平均性,即相对于其他区域,某一区域的数据经常被使用,因此将查询历史数据进行归纳分析,得到查询的频繁项表即快表,其数据格式为{频率,基础点,查询窗口,索引值}。
步骤204:向用户提供查询接口界面,并将查询得到的车辆信息以文件的形式返回给用户。首先,接收用户的查询需求;其次,将查询需求提交给分布式数据库,分布式提取满足查询需求的记录;最后,将查询得到的车辆运行信息以表格的形式返回给用户。
本实施例利用站点间的位置关系形成特征区域,将公交GPS信息对应到特征区域中,从而达到快速检索特征区域的车辆运行信息的目的,为公交区域性规律分析提供了数据支持。
应用本实施例的查询系统随机选取北京市城区范围内的经纬度点,对不同查询窗口的查询操作分别记录其数据提取,得到数据文件所需的时间,然后在MySQL数据库中针对相同规模的数据进行检索和输出,得到检索时间,将结果进行对比,描绘效率对比曲线。
MySQL与本系统在单位时间内检索的记录数随着记录不断增多的变化趋势如图4所示:图中横坐标是进行索引操作的记录总数(单位是row),纵坐标是每秒的索引记录数。由图中可知,当索引的数据量持续增大时,本系统的检索效率高于MySQL的效率并有逐渐增大的趋势;但是当索引的数据量增大到某一个点的时候,出现了每秒检索的记录数下降的情况,由于数据寻址增加,内存换入换出增多,导致MySQL数据库性能降低,后又因为数据缓存的机制,效率略有提升。而本系统效率的临时下降是因为本系统使用的是分布式数据库,数据存储在不同的节点上,集群的寻址和通信开销会使效率稍稍降低。
MySQL与本系统在单位时间内检索的数据量随着总数据量变化的趋势图如图5所示:图中横坐标是索引的数据总量(单位是GB),纵坐标是每秒检索的数据量(单位是GB/s)。由结果对比图可以看出,当检索的数据量持续增大,二者单位时间内检索的数据量都在增长,但数据量越大,本系统的检索效率优势就愈加明显。
总之,以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (12)
1.一种区域性城市公交车辆运行信息的索引查询方法,其特征在于,包括:
获取城市公交站点数据及公交车GPS数据,去除所述公交车GPS数据中的无效数据;
对城市公交站点进行逻辑上的层级划分得到包含所有站点的索引树,并对每个站点生成相应索引序列;
根据所述索引序列信息对城市公交GPS数据按其所在的区域添加索引字段;
向用户提供查询接口界面,根据用户在查询接口界面输入的查询条件以及索引序列搜索数据,并将查询得到的车辆运行信息以文件的形式返回给用户。
2.根据权利要求1所述的区域性城市公交车辆运行信息的索引查询方法,其特征在于,所述去除无效数据的步骤具体包括:
去除无效单条数据:删除公交GPS数据中字段不全或异常的数据;
去除无效车辆数据:如果某一车辆的GPS数据的数量小于20条,则认为是车辆号异常,删除该车辆号对应的所有GPS数据;
去除无效线路数据:如果某一线路的GPS数据的数量小于100条,则认为线路号异常,删除该线路下对应的所有GPS数据。
3.根据权利要求1或2所述的区域性城市公交车辆运行信息的索引查询方法,其特征在于,所述得到包含所有站点的索引树的步骤具体包括:
将所有公交站点作为基础点对象集合,全部的基础点对象作为叶子节点层,记为Tn层;按照基础点对象之间的邻近性度量参数进行聚类形成簇,簇的中心称为中心点对象,聚类之后得到的所有簇的中心点对象作为Tn-1层的节点;
将第一次聚类得到的Tn-1层的中心点对象按照对象之间的邻近性度量参数进行二次聚类,得到的全部簇中心点对象成为Tn-2层的所有节点;
将第二次聚类得到的Tn-2层的中心点对象按照对象之间的邻近性度量参数进行第三次聚类,所得的簇中心点对象作为Tn-3层的节点,逐次生成索引树的每层节点。
4.根据权利要求3所述的区域性城市公交车辆运行信息的索引查询方法,其特征在于,所述对每个站点生成相应索引序列的步骤具体包括:
遍历所述基础点对象集合中的每一个基础点对象,对索引树的每一个叶子节点自底向上依次遍历其父节点直至索引树的根节点,自底向上提取每一个父节点的节点编号,形成基础点对象的索引序列,所有基础点对象的索引序列构成索引对照表。
5.根据权利要求4所述的区域性城市公交车辆运行信息的索引查询方法,其特征在于,所述对城市公交GPS数据按其所在的区域添加索引字段的步骤具体包括:
针对于公交GPS数据,查找数据的经纬度在哪一个经过MBR扩展的基础点对象的特征区域中,根据该基础点对象对应的索引序列,标记公交GPS数据,并插入到分布式数据库中。
6.根据权利要求5所述的区域性城市公交车辆运行信息的索引查询方法,其特征在于,所述依据查询条件及索引序列搜索数据的步骤具体包括:
由用户指定查询位置、查询窗口大小或者查询时间范围,在获取该位置的经纬度信息后与索引对照表进行匹配,得到索引序列,作为在分布式数据库中索引数据的依据,并根据窗口大小或者时间范围取出数据。
7.根据权利要求6所述的区域性城市公交车辆运行信息的索引查询方法,其特征在于,所述依据查询条件搜索数据的步骤还包括:
对历次查询历史数据进行归纳分析,得到查询的频繁项表,其数据格式为{频率,基础点,查询窗口,索引值}。
8.根据权利要求7所述的区域性城市公交车辆运行信息的索引查询方法,其特征在于,所述将查询得到的车辆信息以文件的形式返回给用户的步骤具体包括:
接收用户的查询需求,将查询需求提交给分布式数据库,分布式提取满足所述查询需求的记录,将查询得到的车辆运行信息以表格的形式返回给用户。
9.一种区域性城市公交车辆运行信息的索引查询系统,其特征在于,包括:
预处理模块,用于获取城市公交站点数据及公交车GPS数据,去除所述公交车GPS数据中的无效数据;
索引模块,用于对城市公交站点进行逻辑上的层级划分得到包含所有站点的索引树,并对每个站点生成相应索引序列;
查询模块,用于根据所述索引序列信息将城市公交GPS数据按其所在的区域添加索引字段,并依据查询条件搜索数据;
显示模块,用于给用户提供查询接口界面,并将查询得到的车辆运行信息以文件的形式返回给用户。
10.根据权利要求9所述的区域性城市公交车辆运行信息的索引查询系统,其特征在于,所述索引模块具体包括:
数据集准备单元,用于提供基础站点数据和每次聚类之后生成的结果数据;
空间位置聚类单元,用于使用所述基础站点数据和结果数据,设置点对象间的邻近性度量方式,调整临近性度量参数阈值,进行多次聚类迭代,直到聚类结果的簇中心点对象的数量收敛于一个预设常量或者缩小到指定的程度;
索引树构建单元,用于将所有公交站点作为基础点对象集合,全部的基础点对象作为叶子节点层,记为Tn层;按照基础点对象之间的邻近性度量参数进行聚类形成簇,聚类之后得到的所有簇的中心点对象作为Tn-1层的节点;将第一次聚类得到的Tn-1层的中心点对象按照对象之间的邻近性度量参数进行二次聚类,得到的全部簇中心点对象成为Tn-2层的所有节点;将第二次聚类得到的Tn-2层的中心点对象按照对象之间的邻近性度量参数进行第三次聚类,所得的簇中心点对象作为Tn-3层的节点,逐次生成索引树的每层节点;
索引对照表生成单元,用于遍历所述基础点对象集合中的每一个基础点对象,对树的每一个叶子节点自底向上依次遍历其父节点直至索引树的根节点,自底向上提取每一个父节点的节点编号,形成基础点对象的索引序列,所有基础点对象的索引序列构成索引对照表。
11.根据权利要求10所述的区域性城市公交车辆运行信息的索引查询系统,其特征在于,所述查询模块具体包括:
数据重组单元,用于针对公交GPS数据,查找数据的经纬度在哪一个经过MBR扩展的基础点对象的特征区域中,根据该基础点对象对应的索引序列,标记公交GPS数据,并插入到分布式数据库中;
索引序列查询单元,用于在用户查询时,由用户指定查询位置、查询窗口大小或者查询时间范围,在获取该位置的经纬度信息后与索引对照表进行匹配,得到索引序列,并根据窗口大小或者时间范围取出数据;
快表机制单元,用于对历次查询历史数据进行归纳分析,得到查询的频繁项表,其数据格式为{频率,基础点,查询窗口,索引值}。
12.根据权利要求11所述的区域性城市公交车辆运行信息的索引查询系统,其特征在于,所述显示模块具体包括:
接收单元,用于接收用户的查询需求;
处理单元,用于将查询需求提交给分布式数据库,分布式提取满足所述查询需求的记录;
显示数据单元,用于将查询得到的车辆运行信息以表格的形式返回给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310146109.1A CN103198151B (zh) | 2013-04-24 | 2013-04-24 | 区域性城市公交车辆运行信息的索引查询系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310146109.1A CN103198151B (zh) | 2013-04-24 | 2013-04-24 | 区域性城市公交车辆运行信息的索引查询系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103198151A true CN103198151A (zh) | 2013-07-10 |
CN103198151B CN103198151B (zh) | 2016-05-11 |
Family
ID=48720708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310146109.1A Expired - Fee Related CN103198151B (zh) | 2013-04-24 | 2013-04-24 | 区域性城市公交车辆运行信息的索引查询系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103198151B (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104066057A (zh) * | 2014-06-25 | 2014-09-24 | 北京交通大学 | 一种利用智能手机进行主动式乘客信息获取及服务的方法 |
CN104134349A (zh) * | 2014-08-07 | 2014-11-05 | 北京航空航天大学 | 一种基于交通多源数据融合的公交路况处理系统及方法 |
CN105679028A (zh) * | 2016-02-25 | 2016-06-15 | 北京市市政工程设计研究总院有限公司 | 公交线路设置合理性和站台效率数据分析方法 |
CN106162529A (zh) * | 2016-07-08 | 2016-11-23 | 北京邮电大学 | 室内定位方法与装置 |
CN106202113A (zh) * | 2015-05-07 | 2016-12-07 | 骑记(厦门)科技有限公司 | 应用于组队运动的信息提供方法和装置 |
CN107526787A (zh) * | 2017-08-04 | 2017-12-29 | 深圳大学 | 基于兴趣区域的轨迹查询的启发式扩张搜索算法 |
CN107729389A (zh) * | 2017-09-19 | 2018-02-23 | 小草数语(北京)科技有限公司 | 地图显示方法及其装置 |
CN107784314A (zh) * | 2016-08-26 | 2018-03-09 | 北京协同创新智能电网技术有限公司 | 一种多变量报警系统的正常异常数据划分方法及系统 |
CN108446397A (zh) * | 2018-03-27 | 2018-08-24 | 四川师范大学 | 一种百万级Spatialite空间数据库的快速查询方法 |
WO2019062338A1 (zh) * | 2017-09-30 | 2019-04-04 | 杭州海康威视系统技术有限公司 | 一种过车查询方法、装置、电子设备及可读存储介质 |
CN111221937A (zh) * | 2020-01-10 | 2020-06-02 | 江苏大学 | 一种动态k值聚类构建主题r树方法 |
CN111767355A (zh) * | 2020-06-24 | 2020-10-13 | 中电科华云信息技术有限公司 | 一种基于活动中心点圈层扩散组织监控感知区的方法 |
CN112991722A (zh) * | 2021-02-03 | 2021-06-18 | 浙江浙大中控信息技术有限公司 | 高频gps点的公交车辆实时路口预测方法和系统 |
CN113407542A (zh) * | 2021-06-28 | 2021-09-17 | 长春理工大学 | 一种城市路网车辆出行轨迹的检索方法及系统 |
CN115098616A (zh) * | 2022-07-25 | 2022-09-23 | 北京国科恒通科技股份有限公司 | 多时态空间数据的存储、查询方法、装置及存储介质 |
CN117972008A (zh) * | 2024-03-29 | 2024-05-03 | 亿海蓝(北京)数据技术股份公司 | 基于空间索引的ais数据提取方法、系统和可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050107993A1 (en) * | 2002-01-23 | 2005-05-19 | Adrian Cuthbert | Schematic generation |
CN201355253Y (zh) * | 2009-01-21 | 2009-12-02 | 上海遥薇实业有限公司 | 基于公交gps定位的智能公交换乘导乘系统 |
CN101944096A (zh) * | 2009-07-08 | 2011-01-12 | 广东融讯信息科技有限公司 | 用于提供公交线路的方法和系统 |
CN102306194A (zh) * | 2011-09-08 | 2012-01-04 | 北京掌城科技有限公司 | Gps数据的存储和查询方法 |
-
2013
- 2013-04-24 CN CN201310146109.1A patent/CN103198151B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050107993A1 (en) * | 2002-01-23 | 2005-05-19 | Adrian Cuthbert | Schematic generation |
CN201355253Y (zh) * | 2009-01-21 | 2009-12-02 | 上海遥薇实业有限公司 | 基于公交gps定位的智能公交换乘导乘系统 |
CN101944096A (zh) * | 2009-07-08 | 2011-01-12 | 广东融讯信息科技有限公司 | 用于提供公交线路的方法和系统 |
CN102306194A (zh) * | 2011-09-08 | 2012-01-04 | 北京掌城科技有限公司 | Gps数据的存储和查询方法 |
Non-Patent Citations (2)
Title |
---|
王植: "基于R树索引的智能交通系统的算法研究", 《计算机与数字工程》, vol. 40, no. 9, 31 December 2012 (2012-12-31), pages 24 - 26 * |
邱太荣: "基于Canopy的K-means多核算法", 《微计算机信息》, vol. 28, no. 9, 31 December 2012 (2012-12-31) * |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104066057A (zh) * | 2014-06-25 | 2014-09-24 | 北京交通大学 | 一种利用智能手机进行主动式乘客信息获取及服务的方法 |
CN104066057B (zh) * | 2014-06-25 | 2018-04-20 | 北京交通大学 | 一种利用智能手机进行主动式乘客信息获取及服务的方法 |
CN104134349A (zh) * | 2014-08-07 | 2014-11-05 | 北京航空航天大学 | 一种基于交通多源数据融合的公交路况处理系统及方法 |
CN106202113A (zh) * | 2015-05-07 | 2016-12-07 | 骑记(厦门)科技有限公司 | 应用于组队运动的信息提供方法和装置 |
CN106202113B (zh) * | 2015-05-07 | 2019-11-08 | 骑记(厦门)科技有限公司 | 应用于组队运动的信息提供方法和装置 |
CN105679028A (zh) * | 2016-02-25 | 2016-06-15 | 北京市市政工程设计研究总院有限公司 | 公交线路设置合理性和站台效率数据分析方法 |
CN106162529A (zh) * | 2016-07-08 | 2016-11-23 | 北京邮电大学 | 室内定位方法与装置 |
CN107784314A (zh) * | 2016-08-26 | 2018-03-09 | 北京协同创新智能电网技术有限公司 | 一种多变量报警系统的正常异常数据划分方法及系统 |
CN107526787A (zh) * | 2017-08-04 | 2017-12-29 | 深圳大学 | 基于兴趣区域的轨迹查询的启发式扩张搜索算法 |
WO2019024347A1 (zh) * | 2017-08-04 | 2019-02-07 | 深圳大学 | 基于兴趣区域的轨迹查询的启发式扩张搜索算法 |
CN107729389A (zh) * | 2017-09-19 | 2018-02-23 | 小草数语(北京)科技有限公司 | 地图显示方法及其装置 |
CN109598963A (zh) * | 2017-09-30 | 2019-04-09 | 杭州海康威视系统技术有限公司 | 一种过车查询方法、装置、电子设备及可读存储介质 |
WO2019062338A1 (zh) * | 2017-09-30 | 2019-04-04 | 杭州海康威视系统技术有限公司 | 一种过车查询方法、装置、电子设备及可读存储介质 |
CN108446397B (zh) * | 2018-03-27 | 2022-05-20 | 四川师范大学 | 一种百万级Spatialite空间数据库的快速查询方法 |
CN108446397A (zh) * | 2018-03-27 | 2018-08-24 | 四川师范大学 | 一种百万级Spatialite空间数据库的快速查询方法 |
CN111221937A (zh) * | 2020-01-10 | 2020-06-02 | 江苏大学 | 一种动态k值聚类构建主题r树方法 |
CN111767355A (zh) * | 2020-06-24 | 2020-10-13 | 中电科华云信息技术有限公司 | 一种基于活动中心点圈层扩散组织监控感知区的方法 |
CN111767355B (zh) * | 2020-06-24 | 2024-02-27 | 中电科华云信息技术有限公司 | 一种基于活动中心点圈层扩散组织监控感知区的方法 |
CN112991722A (zh) * | 2021-02-03 | 2021-06-18 | 浙江浙大中控信息技术有限公司 | 高频gps点的公交车辆实时路口预测方法和系统 |
CN112991722B (zh) * | 2021-02-03 | 2022-07-19 | 浙江中控信息产业股份有限公司 | 高频gps点的公交车辆实时路口预测方法和系统 |
CN113407542A (zh) * | 2021-06-28 | 2021-09-17 | 长春理工大学 | 一种城市路网车辆出行轨迹的检索方法及系统 |
CN113407542B (zh) * | 2021-06-28 | 2023-11-14 | 长春理工大学 | 一种城市路网车辆出行轨迹的检索方法及系统 |
CN115098616A (zh) * | 2022-07-25 | 2022-09-23 | 北京国科恒通科技股份有限公司 | 多时态空间数据的存储、查询方法、装置及存储介质 |
CN115098616B (zh) * | 2022-07-25 | 2022-12-02 | 北京国科恒通科技股份有限公司 | 多时态空间数据的存储、查询方法、装置及存储介质 |
CN117972008A (zh) * | 2024-03-29 | 2024-05-03 | 亿海蓝(北京)数据技术股份公司 | 基于空间索引的ais数据提取方法、系统和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103198151B (zh) | 2016-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103198151B (zh) | 区域性城市公交车辆运行信息的索引查询系统及方法 | |
US11720606B1 (en) | Automated geospatial data analysis | |
Deng et al. | Trajectory indexing and retrieval | |
CN104462258B (zh) | 一种多版本的非结构化模型的组织管理方法 | |
CN106528793B (zh) | 一种分布式空间数据库的时空分片存储方法 | |
CN110765331B (zh) | 一种时空数据的检索方法及系统 | |
Xuan et al. | Continuous range search query processing in mobile navigation | |
CN104346444B (zh) | 一种基于路网反空间关键字查询的最佳选址方法 | |
CN114820975B (zh) | 基于全要素参数符号化的三维场景仿真重构系统及方法 | |
CN112579921B (zh) | 基于倒排序索引及前缀树的轨迹索引和查询方法及系统 | |
Gao et al. | Continuous visible nearest neighbor queries | |
CN111813778A (zh) | 一种面向大规模路网数据的近似关键字存储和查询方法 | |
CN114661744B (zh) | 一种基于深度学习的地形数据库更新方法及系统 | |
Xu et al. | TripCube: A Trip-oriented vehicle trajectory data indexing structure | |
Wu et al. | A spatiotemporal trajectory data index based on the Hilbert curve code | |
CN106294540B (zh) | 基于p-stable局部敏感哈希检索数据样式的多点地质统计建模方法 | |
CN112052405A (zh) | 一种基于司机经验的寻客区域推荐方法 | |
CN115329221A (zh) | 一种针对多源地理实体的查询方法及查询系统 | |
CN113407669A (zh) | 一种基于活动影响力的语义轨迹查询方法 | |
KR102358877B1 (ko) | 통합 인덱스 관리장치 및 통합 인덱스 관리방법 | |
CN111222059B (zh) | 一种城市可达区域搜索系统及方法 | |
CN110928968B (zh) | 一种二维地理空间大数据的存储与查询计算机介质 | |
Feng et al. | Index and query methods in road networks | |
WO2019024345A1 (zh) | 基于带序兴趣区域的轨迹查询的匀速搜索扩展算法 | |
US12099907B2 (en) | Automated geospatial data analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160511 |
|
CF01 | Termination of patent right due to non-payment of annual fee |