CN106203467A - 一种多源位置数据的一致性检验与融合方法及系统 - Google Patents

一种多源位置数据的一致性检验与融合方法及系统 Download PDF

Info

Publication number
CN106203467A
CN106203467A CN201610477175.0A CN201610477175A CN106203467A CN 106203467 A CN106203467 A CN 106203467A CN 201610477175 A CN201610477175 A CN 201610477175A CN 106203467 A CN106203467 A CN 106203467A
Authority
CN
China
Prior art keywords
position data
source position
distribution
spatial
data collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610477175.0A
Other languages
English (en)
Other versions
CN106203467B (zh
Inventor
涂伟
李清泉
曹瑞
乐阳
曹劲舟
朱家松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN201610477175.0A priority Critical patent/CN106203467B/zh
Publication of CN106203467A publication Critical patent/CN106203467A/zh
Application granted granted Critical
Publication of CN106203467B publication Critical patent/CN106203467B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种多源位置数据的一致性检验与融合方法及系统,其中,所述方法从时间分布规律、空间分布规律检验多源位置数据的分布一致性,对于时空分布不一致的多源位置数据,利用时空扭曲操作,进行多源位置数据的时空融合,生成覆盖空间范围更广、渗透率更高的位置数据,并提高所述多源位置数据的可用性和可靠性。

Description

一种多源位置数据的一致性检验与融合方法及系统
技术领域
本发明涉及多源位置数据分析领域,尤其涉及一种基于多源位置数据的一致性检验与融合方法及系统。
背景技术
近年来,互联网、信息与通信技术和定位技术(包括移动通信定位和卫星定位技术等)的融合发展产生了时空位置大数据,包括时间、位置和行为语义(如运动速度、出行工具、)三方面内容,所述时空位置大数据被广泛应用于城市相关领域:(1) 智能交通,提取动态交通状态,提供交通信息发布、出行路线规划、动态拼车、智能公交等信息服务;2)城市规划,利用时空位置大数据获得城市人群的空间分布,优化城市空间结构;(3) 城市计算,建立智能计算模型,为环境污染、设施规划、互联网服务提供智能决策支持。然而,现有的位置大数据多来源于车载卫星定位装置、基于移动通信的基站定位或互联网APP等,其存在着采样时间间隔差异大、空间覆盖区域范围不同等问题。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种基于多源位置数据的一致性检验与融合方法及系统,旨在解决现有的多源位置数据空间覆盖范围窄、渗透率、可用性及可靠性较低的问题。
本发明的技术方案如下:
一种基于多源位置数据的一致性检验与融合方法,其中,包括步骤:
A、获取多源位置数据集Di,统计所述多源位置数据集Di的空间覆盖范围,对所述空间覆盖范围进行分区处理得到每个空间单元内与所述多源位置数据集Di所对应的空间格网数据Cpq
B、对所述多源位置数据集Di和空间格网数据Cpq进行统计处理,获取所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数;
C、根据所述述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数对所述多源位置数据集Di进行时空分布一致性检验;
D、当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;当所述多源位置数据集Di不符合时空分布一致性检验时,则先将所述多源位置数据集Di对应地空间格网数据Cpq进行时空扭曲操作,然后进行融合。
较佳地,所述的基于多源位置数据的一致性检验与融合方法,其中,所述步骤A具体包括:
A1、遍历每个多源位置数据集Di,获取各个多源位置数据集的最小外包矩形(mbri)[xmin, ymin, xmax, ymax];
A2、对每个时空数据集的外包矩形进行并集操作,获得时空位置数据的最小外部矩形集MBR=mbr1 ∪ mbr2 ∪…∪ mbrn,其中,n为多源位置数据集的数量,mbri为第i个多源位置数据集的最小外包矩形;
A3、将所述最小外包矩形集MBR进行分区处理,划分为边长为e的空间单元,所述空间单元内对应的多源位置数据Di即为空间格网数据Cpq
较佳地,所述的基于多源位置数据的一致性检验与融合方法,其中,所述步骤B具体包括:
B1、根据多源数据集Di获取对应的时间分布采样数据集DTi,同时获取每个空间格网数据Cpq对应的局部时间分布样本DTi(p,q);
B2、重复大量抽样,模拟时间分布样本的实际分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,求取样本均值,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
B3、重复大量抽样和组合,构造参考时间分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,合并m个样本为;重复该过程,获取n个样本Yt1, Yt2, …, Ytn;令l, m, n足够大,,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
B4、根据多源位置数据集Di获取对应的空间分布采样数据集DSi,同时获取每个空间格网数据Cpq对应的局部空间分布样本DSi(p,q),然后按照时间分布同样的算法,得到空间分布样本的模拟实际分布及相应的全局特征参数和局部特征参数。
较佳地,所述的基于多源位置数据的一致性检验与融合方法,其中,所述步骤C具体包括:
C1、根据所述述多源位置数据集Di的时间分布特征和空间分布特征以及空间格网数据Cpq的时间分布特征和空间分布特征,采用Kolmogorov-Smirnov检验方法对所述多源位置数据集Di进行全局时间分布一致性检验、局部时间一致性检验、全局空间分布一致性检验和局部空间分布一致性检验。
较佳地,所述的基于多源位置数据的一致性检验与融合方法,其中,所述步骤D具体包括:
D1、当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;
D2、当所述多源位置数据集Di不符合时空分布一致性检验时,对于超采样的空间格网数据Cpq,根据时空抽稀参数确定删减的位置数据数量,进行随机减少采样点;对于采样不足的空间格网数据Cpq,根据时空加密参数确定随机添加的位置数据数量,进行随机增加采样点;
D3、将处理后的所有空间格网数据进行融合,生成新的多源位置数据集。
一种基于多源位置数据的一致性检验与融合系统,其中,包括:
分区模块,用于获取多源位置数据集Di,统计所述多源位置数据集Di的空间覆盖范围MBR,对所述空间覆盖范围MBR进行分区处理得到每个空间单元内与所述多源位置数据集Di所对应的空间格网数据Cpq
数据统计处理模块,用于对所述多源位置数据集Di和空间格网数据Cpq进行统计处理,获取所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数;
一致性检验模块,用于根据所述述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数对所述多源位置数据集Di进行时空分布一致性检验;
融合模块,用于当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;当所述多源位置数据集Di不符合时空分布一致性检验时,则先将所述多源位置数据集Di对应地空间格网数据Cpq进行时空扭曲操作,然后进行融合。
较佳地,所述的基于多源位置数据的一致性检验与融合系统,其中,所述分区模块具体包括:
最小外包矩形获取单元,用于遍历每个多源位置数据集Di,获取各个多源位置数据集的最小外包矩形(mbri)[xmin, ymin, xmax, ymax];
合并单元,用于对每个时空数据集的外包矩形进行并集操作,获得时空位置数据的最小外部矩形集MBR=mbr1 ∪ mbr2 ∪…∪ mbrn,其中,n为多源位置数据集的数量,mbri为第i个多源位置数据集的最小外包矩形;
分区单元,用于将所述最小外包矩形集MBR进行分区处理,划分为边长为e的空间单元,所述空间单元内对应的多源位置数据Di即为空间格网数据Cpq
较佳地,所述的基于多源位置数据的一致性检验与融合系统,其中,所述数据统计处理模块具体包括:
时间分布样本获取单元,用于根据多源数据集Di获取对应的时间分布采样数据集DTi,同时获取每个空间格网数据Cpq对应的局部时间分布样本DTi(p,q);
时间分布模拟单元,用于通过重复大量抽样,模拟时间分布样本的实际分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,求取样本均值,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
构造单元,用于通过重复大量抽样和组合,构造参考时间分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,合并m个样本为;重复该过程,获取n个样本Yt1, Yt2, …, Ytn;令l, m, n足够大,,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
空间分布模拟单元,用于根据多源位置数据集Di获取对应的空间分布采样数据集DSi,同时获取每个空间格网数据Cpq对应的局部空间分布样本DSi(p,q),然后按照时间分布同样的算法,得到空间分布样本的模拟实际分布及相应的全局特征参数和局部特征参数。
较佳地,所述的基于多源位置数据的一致性检验与融合系统,其中,所述一致性检验模块具体包括:
Kolmogorov-Smirnov检验单元,用于根据所述述多源位置数据集Di的时间分布特征和空间分布特征以及空间格网数据Cpq的时间分布特征和空间分布特征,采用Kolmogorov-Smirnov检验方法对所述多源位置数据集Di进行全局时间分布一致性检验、局部时间一致性检验、全局空间分布一致性检验和局部空间分布一致性检验。
较佳地,所述的基于多源位置数据的一致性检验与融合系统,其中,所述融合模块具体包括:
第一融合单元,用于当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;
时空扭曲操作单元,用于当所述多源位置数据集Di不符合时空分布一致性检验时,对于超采样的空间格网数据Cpq,根据时空抽稀参数确定删减的位置数据数量,进行随机减少采样点;对于采样不足的空间格网数据Cpq,根据时空加密参数确定随机添加的位置数据数量,进行随机增加采样点;
第二融合单元,用于将处理后的所有空间格网数据进行融合,生成新的多源位置数据集。
有益效果:本发明提供一种多源位置数据的一致性检验与融合方法及系统,所述方法从时间分布规律、空间分布规律检验多源位置数据的分布一致性,对于时空分布不一致的多源位置数据,利用时空扭曲操作,进行多源位置数据的时空融合,生成覆盖空间范围更广、渗透率更高的位置数据,并显著提高了多源位置数据的可用性和可靠性。
附图说明
图1为本发明一种多源位置数据的一致性检验与融合方法较佳实施例的流程图。
图2为本发明一种多源位置数据的一致性检验与融合系统较佳实施例的结构框图。
具体实施方式
本发明提供一种多源位置数据的一致性检验与融合方法及系统,为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,图1为本发明一种多源位置数据的一致性检验与融合方法较佳实施例的流程图,如图所示,其包括步骤:
S10、获取多源位置数据集Di,统计所述多源位置数据集Di的空间覆盖范围,对所述空间覆盖范围进行分区处理得到每个空间单元内与所述多源位置数据集Di所对应的空间格网数据Cpq
S20、对所述多源位置数据集Di和空间格网数据Cpq进行统计处理,获取所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数;
S30、根据所述述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数对所述多源位置数据集Di进行时空分布一致性检验;
S40、当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;当所述多源位置数据集Di不符合时空分布一致性检验时,则先将所述多源位置数据集Di对应地空间格网数据Cpq进行时空扭曲操作,然后进行融合。
进一步,所述步骤S10具体包括:
S11、遍历每个多源位置数据集Di,获取各个多源位置数据集的最小外包矩形(mbri)[xmin, ymin, xmax, ymax];所述多源位置数据集Di可以为车辆GPS轨迹数据、移动通信定位数据、社交网络数据、社交媒体数据,签到数据、室内定位数据等各种时空位置数据;
S12、对每个时空数据集的外包矩形进行并集操作,获得时空位置数据的最小外部矩形集MBR=mbr1 ∪ mbr2 ∪…∪ mbrn,其中,n为多源位置数据集的数量,mbri为第i个多源位置数据集的最小外包矩形;
S13、将所述最小外包矩形集MBR进行分区处理,划分为边长为e的空间单元,所述空间单元内对应的多源位置数据Di即为空间格网数据Cpq:所述空间单元无缝且不重叠的覆盖所有时空数据,空间单元数量为个,其中为最小外包矩形MBR的宽度,为最小外包矩形的高度,所述空间单元大小根据最终的边长e确定。
进一步,所述步骤S20具体包括:
S21、根据多源数据集Di获取对应的时间分布采样数据集DTi,同时获取每个空间格网数据Cpq对应的局部时间分布样本DTi(p,q);
S22、重复大量抽样,模拟时间分布样本的实际分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,求取样本均值,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
D23、重复大量抽样和组合,构造参考时间分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,合并m个样本为;重复该过程,获取n个样本Yt1, Yt2, …, Ytn;令l, m, n足够大,,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
D24、根据多源位置数据集Di获取对应的空间分布采样数据集DSi,同理获取每个空间格网数据Cpq对应的局部空间分布样本DSi(p,q)。
S25、重复大量抽样,模拟空间分布样本的实际分布。逐个从空间分布样本DSi中以独立有放回的方式抽取m个样本量为L的样本Xs1, Xs2, …, Xsm,求取样本均值,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
S26、重复大量抽样和组合,构造参考空间分布,逐个从空间分布样本DSi中以独立有放回的方式抽取m个样本量为L的样本Xs1, Xs2, …, Xsm,合并m个样本为;重复该过程,获取n个样本Ys1, Ys2, …, Ysn;令l, m, n足够大,,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
进一步,所述步骤S30具体包括:
S31、根据所述述多源位置数据集Di的时间分布特征和空间分布特征以及空间格网数据Cpq的时间分布特征和空间分布特征,采用Kolmogorov-Smirnov检验方法对所述多源位置数据集Di进行全局时间分布一致性检验、局部时间一致性检验、全局空间分布一致性检验和局部空间分布一致性检验。
具体地,当对所述述多源位置数据集Di进行全局时间分布一致性检验时,即采用Kolmogorov-Smirnov检验方法检验任一数据集Di对应的时间分布样本DTi与参考时间分布是否具有一致性。根据的样本生成经验分布,将其与样本生成的经验分布,计算两个分布之间的差异,进行K-S检验。其中,为指示函数,当时等于1,K-S统计量,其中sup为上确界函数,零假设为两者满足同一分布,当时,拒绝原假设,即在水平下,两个样本分布不一致;
当对所述多源位置数据集Di进行局部时间分布一致性检验时,即针对每个格网数据Cpq进行局部时间分布的一致性检验,其方法和步骤与所述全局时间分布一致性检验相同,在此,不做重复解释;
当对所述多源位置数据集Di进行空间分布一致性检验时,即针对全局空间分布样本DSi和各格网数据Cpq对应的局部空间分布样本DSi(p,q),分别进行全局和局部的空间分布一致性检验,其检验方法和步骤与所述全局时间分布一致性检验相同,在此,不做重复解释。
进一步,所述步骤S40具体包括:
S41、当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;具体地,当所述多源位置数据集Di同时符合全局时间分布一致性检验、局部时间一致性检验、全局空间分布一致性检验和局部空间分布一致性检验时,说明所述多源位置数据集Di符合时空分布一致性检验,即可直接将所述多源位置数据集Di进行融合。
S42、当所述多源位置数据集Di不符合时空分布一致性检验时,对于超采样的空间格网数据Cpq,根据时空抽稀参数,确定删减的位置数据数量N=,进行随机减少采样点,所述时空抽稀参数
对于采样不足的空间格网数据Cpq,根据时空加密参数确定随机添加的位置数据数量M=×m,进行随机增加采样点,所述时空加密系数
S43、将进行时空扭曲操作处理后的所有空间格网数据进行融合,生成新的多源位置数据集。
基于上述方法,本发明还提供一种多源位置数据的一致性检验与融合系统较佳实施例,如图2所示,包括:
分区模块100,用于获取多源位置数据集Di,统计所述多源位置数据集Di的空间覆盖范围MBR,对所述空间覆盖范围MBR进行分区处理得到每个空间单元内与所述多源位置数据集Di所对应的空间格网数据Cpq
数据统计处理模块200,用于对所述多源位置数据集Di和空间格网数据Cpq进行统计处理,获取所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数;
一致性检验模块300,用于根据所述述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数对所述多源位置数据集Di进行时空分布一致性检验;
融合模块400,用于当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;当所述多源位置数据集Di不符合时空分布一致性检验时,则先将所述多源位置数据集Di对应地空间格网数据Cpq进行时空扭曲操作,然后进行融合。
较佳地,所述的基于多源位置数据的一致性检验与融合系统,其中,所述分区模块100具体包括:
最小外包矩形获取单元,用于遍历每个多源位置数据集Di,获取各个多源位置数据集的最小外包矩形(mbri)[xmin, ymin, xmax, ymax];
合并单元,用于对每个时空数据集的外包矩形进行并集操作,获得时空位置数据的最小外部矩形集MBR=mbr1 ∪ mbr2 ∪…∪ mbrn,其中,n为多源位置数据集的数量,mbri为第i个多源位置数据集的最小外包矩形;
分区单元,用于将所述最小外包矩形集MBR进行分区处理,划分为边长为e的空间单元,所述空间单元内对应的多源位置数据Di即为空间格网数据Cpq
较佳地,所述的基于多源位置数据的一致性检验与融合系统,其中,所述数据统计处理模块200具体包括:
时间分布样本获取单元,用于根据多源数据集Di获取对应的时间分布采样数据集DTi,同时获取每个空间格网数据Cpq对应的局部时间分布样本DTi(p,q);
时间分布模拟单元,用于通过重复大量抽样,模拟时间分布样本的实际分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,求取样本均值,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
构造单元,用于通过重复大量抽样和组合,构造参考时间分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,合并m个样本为;重复该过程,获取n个样本Yt1, Yt2, …, Ytn;令l, m, n足够大,,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
空间分布模拟单元,用于根据多源位置数据集Di获取对应的空间分布采样数据集DSi,同时获取每个空间格网数据Cpq对应的局部空间分布样本DSi(p,q),然后按照时间分布同样的算法,得到空间分布样本的模拟实际分布及相应的全局特征参数和局部特征参数。
较佳地,所述的基于多源位置数据的一致性检验与融合系统,其中,所述一致性检验模块300具体包括:
Kolmogorov-Smirnov检验单元,用于根据所述述多源位置数据集Di的时间分布特征和空间分布特征以及空间格网数据Cpq的时间分布特征和空间分布特征,采用Kolmogorov-Smirnov检验方法对所述多源位置数据集Di进行全局时间分布一致性检验、局部时间一致性检验、全局空间分布一致性检验和局部空间分布一致性检验。
较佳地,所述的基于多源位置数据的一致性检验及融合系统,其中,所述融合模块400具体包括:
第一融合单元,用于当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;
时空扭曲操作单元,用于当所述多源位置数据集Di不符合时空分布一致性检验时,对于超采样的空间格网数据Cpq,根据时空抽稀参数确定删减的位置数据数量,进行随机减少采样点;对于采样不足的空间格网数据Cpq,根据时空加密参数确定随机添加的位置数据数量,进行随机增加采样点;
第二融合单元,用于将处理后的所有空间格网数据进行融合,生成新的多源位置数据集。
关于上述模块单元的技术细节在前面的方法中已有详述,故不再赘述。
综上所述:本发明提供一种多源位置数据的一致性检验与融合方法及系统,所述方法从时间分布规律、空间分布规律检验多源位置数据的分布一致性,对于时空分布不一致的多源位置数据,利用时空扭曲操作,进行多源位置数据的时空融合,生成覆盖空间范围更广、渗透率更高的位置数据,并显著提高了多源位置数据的可用性和可靠性。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (10)

1.一种基于多源位置数据的一致性检验与融合的方法,其特征在于,包括步骤:
A、获取多源位置数据集Di,统计所述多源位置数据集Di的空间覆盖范围,对所述空间覆盖范围进行分区处理得到每个空间单元内与所述多源位置数据集Di所对应的空间格网数据Cpq
B、对所述多源位置数据集Di和空间格网数据Cpq进行统计处理,获取所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数;
C、根据所述述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数对所述多源位置数据集Di进行时空分布一致性检验;
D、当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;当所述多源位置数据集Di不符合时空分布一致性检验时,则先将所述多源位置数据集Di对应地空间格网数据Cpq进行时空扭曲操作,然后进行融合。
2.根据权利要求1所述的基于多源位置数据的一致性检验与融合的方法,其特征在于,所述步骤A具体包括:
A1、遍历每个多源位置数据集Di,获取各个多源位置数据集的最小外包矩形(mbri)[xmin, ymin, xmax, ymax];
A2、对每个时空数据集的外包矩形进行并集操作,获得时空位置数据的最小外部矩形集MBR=mbr1 ∪ mbr2 ∪…∪ mbrn,其中,n为多源位置数据集的数量,mbri为第i个多源位置数据集的最小外包矩形;
A3、将所述最小外包矩形集MBR进行分区处理,划分为边长为e的空间单元,所述空间单元内对应的多源位置数据Di即为空间格网数据Cpq
3.根据权利要求1所述的基于多源位置数据的一致性检验与融合方法,其特征在于,所述步骤B具体包括:
B1、根据多源数据集Di获取对应的时间分布采样数据集DTi,同时获取每个空间格网数据Cpq对应的局部时间分布样本DTi(p,q);
B2、重复大量抽样,模拟时间分布样本的实际分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,求取样本均值,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
B3、重复大量抽样和组合,构造参考时间分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,合并m个样本为;重复该过程,获取n个样本Yt1, Yt2, …, Ytn;令l, m, n足够大,,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
B4、根据多源位置数据集Di获取对应的空间分布采样数据集DSi,同时获取每个空间格网数据Cpq对应的局部空间分布样本DSi(p,q),然后按照时间分布同样的算法,得到空间分布样本的模拟实际分布及相应的全局特征参数和局部特征参数。
4.根据权利要求1所述的基于多源位置数据的一致性检验与融合方法,其特征在于,所述步骤C具体包括:
C1、根据所述述多源位置数据集Di的时间分布特征和空间分布特征以及空间格网数据Cpq的时间分布特征和空间分布特征,采用Kolmogorov-Smirnov检验方法对所述多源位置数据集Di进行全局时间分布一致性检验、局部时间一致性检验、全局空间分布一致性检验和局部空间分布一致性检验。
5.根据权利要求1所述的基于多源位置数据的一致性检验与融合方法,其特征在于,所述步骤D具体包括:
D1、当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;
D2、当所述多源位置数据集Di不符合时空分布一致性检验时,对于超采样的空间格网数据Cpq,根据时空抽稀参数确定删减的位置数据数量,进行随机减少采样点;对于采样不足的空间格网数据Cpq,根据时空加密参数确定随机添加的位置数据数量,进行随机增加采样点;
D3、将处理后的所有空间格网数据进行融合,生成新的多源位置数据集。
6.一种基于多源位置数据的一致性检验与融合系统,其特征在于,包括:
分区模块,用于获取多源位置数据集Di,统计所述多源位置数据集Di的空间覆盖范围,对所述空间覆盖范围进行分区处理得到每个空间单元内与所述多源位置数据集Di所对应的空间格网数据Cpq
数据统计处理模块,用于对所述多源位置数据集Di和空间格网数据Cpq进行统计处理,获取所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数;
一致性检验模块,用于根据所述述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数对所述多源位置数据集Di进行时空分布一致性检验;
融合模块,用于当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;当所述多源位置数据集Di不符合时空分布一致性检验时,则先将所述多源位置数据集Di对应地空间格网数据Cpq进行时空扭曲操作,然后进行融合。
7.根据权利要求6所述的基于多源位置数据的一致性检验与融合系统,其特征在于,所述分区模块具体包括:
最小外包矩形获取单元,用于遍历每个多源位置数据集Di,获取各个多源位置数据集的最小外包矩形(mbri)[xmin, ymin, xmax, ymax];
合并单元,用于对每个时空数据集的外包矩形进行并集操作,获得时空位置数据的最小外部矩形集MBR=mbr1 ∪ mbr2 ∪…∪ mbrn,其中,n为多源位置数据集的数量,mbri为第i个多源位置数据集的最小外包矩形;
分区单元,用于将所述最小外包矩形集MBR进行分区处理,划分为边长为e的空间单元,所述空间单元内对应的多源位置数据Di即为空间格网数据Cpq
8.根据权利要求6所述的基于多源位置数据的一致性检验与融合系统,其特征在于,所述数据统计处理模块具体包括:
时间分布样本获取单元,用于根据多源数据集Di获取对应的时间分布采样数据集DTi,同时获取每个空间格网数据Cpq对应的局部时间分布样本DTi(p,q);
时间分布模拟单元,用于通过重复大量抽样,模拟时间分布样本的实际分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,求取样本均值,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
构造单元,用于通过重复大量抽样和组合,构造参考时间分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,合并m个样本为;重复该过程,获取n个样本Yt1, Yt2, …, Ytn;令l, m, n足够大,,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
空间分布模拟单元,用于根据多源位置数据集Di获取对应的空间分布采样数据集DSi,同时获取每个空间格网数据Cpq对应的局部空间分布样本DSi(p,q),然后按照时间分布同样的算法,得到空间分布样本的模拟实际分布及相应的全局特征参数和局部特征参数。
9.根据权利要求6所述的基于多源位置数据的一致性检验与融合系统,其特征在于,所述一致性检验模块具体包括:
Kolmogorov-Smirnov检验单元,用于根据所述述多源位置数据集Di的时间分布特征和空间分布特征以及空间格网数据Cpq的时间分布特征和空间分布特征,采用Kolmogorov-Smirnov检验方法对所述多源位置数据集Di进行全局时间分布一致性检验、局部时间一致性检验、全局空间分布一致性检验和局部空间分布一致性检验。
10.根据权利要求6所述的基于多源位置数据的一致性检验与融合系统,其特征在于,所述融合模块具体包括:
第一融合单元,用于当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;
时空扭曲操作单元,用于当所述多源位置数据集Di不符合时空分布一致性检验时,对于超采样的空间格网数据Cpq,根据时空抽稀参数确定删减的位置数据数量,进行随机减少采样点;对于采样不足的空间格网数据Cpq,根据时空加密参数确定随机添加的位置数据数量,进行随机增加采样点;
第二融合单元,用于将处理后的所有空间格网数据进行融合,生成新的多源位置数据集。
CN201610477175.0A 2016-06-27 2016-06-27 一种多源位置数据的一致性检验与融合方法及系统 Active CN106203467B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610477175.0A CN106203467B (zh) 2016-06-27 2016-06-27 一种多源位置数据的一致性检验与融合方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610477175.0A CN106203467B (zh) 2016-06-27 2016-06-27 一种多源位置数据的一致性检验与融合方法及系统

Publications (2)

Publication Number Publication Date
CN106203467A true CN106203467A (zh) 2016-12-07
CN106203467B CN106203467B (zh) 2019-08-13

Family

ID=57461498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610477175.0A Active CN106203467B (zh) 2016-06-27 2016-06-27 一种多源位置数据的一致性检验与融合方法及系统

Country Status (1)

Country Link
CN (1) CN106203467B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113160571A (zh) * 2021-06-28 2021-07-23 智道网联科技(北京)有限公司 基于车路协同的多数据源的数据融合处理方法和装置
CN113256984A (zh) * 2021-06-25 2021-08-13 智道网联科技(北京)有限公司 基于车路协同的多数据源的数据融合处理方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080100473A1 (en) * 2006-10-25 2008-05-01 Siemens Corporate Research, Inc. Spatial-temporal Image Analysis in Vehicle Detection Systems
US20080270332A1 (en) * 2003-08-26 2008-10-30 Paul Rudolf Associative Memory Device and Method Based on Wave Propagation
CN102609986A (zh) * 2012-03-14 2012-07-25 中国矿业大学(北京) 数字矿山中矿体建模系统及其建模和检测方法
CN103714185A (zh) * 2014-01-17 2014-04-09 武汉大学 主题事件更新方法库及城市多源时空信息并行更新方法
CN105279260A (zh) * 2015-10-21 2016-01-27 武汉大学 一种基于空间网格划分的政务大数据挖掘方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080270332A1 (en) * 2003-08-26 2008-10-30 Paul Rudolf Associative Memory Device and Method Based on Wave Propagation
US20080100473A1 (en) * 2006-10-25 2008-05-01 Siemens Corporate Research, Inc. Spatial-temporal Image Analysis in Vehicle Detection Systems
CN102609986A (zh) * 2012-03-14 2012-07-25 中国矿业大学(北京) 数字矿山中矿体建模系统及其建模和检测方法
CN103714185A (zh) * 2014-01-17 2014-04-09 武汉大学 主题事件更新方法库及城市多源时空信息并行更新方法
CN105279260A (zh) * 2015-10-21 2016-01-27 武汉大学 一种基于空间网格划分的政务大数据挖掘方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113256984A (zh) * 2021-06-25 2021-08-13 智道网联科技(北京)有限公司 基于车路协同的多数据源的数据融合处理方法和装置
CN113256984B (zh) * 2021-06-25 2021-11-05 智道网联科技(北京)有限公司 基于车路协同的多数据源的数据融合处理方法和装置
CN113160571A (zh) * 2021-06-28 2021-07-23 智道网联科技(北京)有限公司 基于车路协同的多数据源的数据融合处理方法和装置

Also Published As

Publication number Publication date
CN106203467B (zh) 2019-08-13

Similar Documents

Publication Publication Date Title
CN105825242B (zh) 基于混合网格分层聚类的集群通信终端轨迹实时异常检测方法与系统
CN103337133B (zh) 基于识别预报技术的电网雷暴灾害预警系统及方法
KR101307232B1 (ko) 하천홍수 상황인지시스템 및 컴퓨터로 판독 가능한 기록매체
Higgins A 4D spatio-temporal approach to modelling land value uplift from rapid transit in high density and topographically-rich cities
CN105975721A (zh) 事故重现碰撞仿真建立方法及基于车辆实时运动状态的事故重现碰撞仿真方法
CN103903105A (zh) 核事故后果评价与辅助决策一体化平台及方法
CN103336894B (zh) 一种城市容积率自动分区方法
CN103699775A (zh) 城市道路交通诱导策略自动生成方法与系统
CN104217384A (zh) 一种核事故应急处理及辅助决策支持系统
CN115063978B (zh) 一种基于数字孪生的公交到站时间预测方法
CN107766401A (zh) 基于大数据的人行道违停分析方法及系统
CN105512741A (zh) 一种公交客流组合预测方法
CN105844339A (zh) 一种实时态势模型与可视化融合的决策方法和系统
US11095377B2 (en) Methods and systems for determining morphology data
CN106919987A (zh) 虚拟现实环境下高速铁路客运专线设备运维信息模型的制作与管理方法
CN104916127B (zh) 一种车联网分布式实时分析交通路况的方法及系统
Ahn et al. Multimodal intelligent traffic signal system simulation model development and assessment
CN106203467A (zh) 一种多源位置数据的一致性检验与融合方法及系统
CN105844031A (zh) 一种基于手机定位数据的城市交通廊道识别方法
CN107169080A (zh) 一种基于gis和空间数据库相结合的地理空间分析系统
Li et al. A physically based spatiotemporal method of analyzing flood impacts on urban road networks
CN107395757A (zh) 基于acp方法和社会物理信息系统的平行车联网系统
Chen et al. Ambulance service area considering disaster-induced disturbance on the transportation infrastructure
Dawidowicz et al. The evolving role of the cadastre in the land administration system in Poland
CN111489039B (zh) 共享单车总量预测方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant