CN106203467B - 一种多源位置数据的一致性检验与融合方法及系统 - Google Patents

一种多源位置数据的一致性检验与融合方法及系统 Download PDF

Info

Publication number
CN106203467B
CN106203467B CN201610477175.0A CN201610477175A CN106203467B CN 106203467 B CN106203467 B CN 106203467B CN 201610477175 A CN201610477175 A CN 201610477175A CN 106203467 B CN106203467 B CN 106203467B
Authority
CN
China
Prior art keywords
position data
source position
spatial
distribution
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610477175.0A
Other languages
English (en)
Other versions
CN106203467A (zh
Inventor
涂伟
李清泉
曹瑞
乐阳
曹劲舟
朱家松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN201610477175.0A priority Critical patent/CN106203467B/zh
Publication of CN106203467A publication Critical patent/CN106203467A/zh
Application granted granted Critical
Publication of CN106203467B publication Critical patent/CN106203467B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种多源位置数据的一致性检验与融合方法及系统,其中,所述方法从时间分布规律、空间分布规律检验多源位置数据的分布一致性,对于时空分布不一致的多源位置数据,利用时空扭曲操作,进行多源位置数据的时空融合,生成覆盖空间范围更广、渗透率更高的位置数据,并提高所述多源位置数据的可用性和可靠性。

Description

一种多源位置数据的一致性检验与融合方法及系统
技术领域
本发明涉及多源位置数据分析领域,尤其涉及一种基于多源位置数据的一致性检验与融合方法及系统。
背景技术
近年来,互联网、信息与通信技术和定位技术(包括移动通信定位和卫星定位技术等)的融合发展产生了时空位置大数据,包括时间、位置和行为语义(如运动速度、出行工具)三方面内容,所述时空位置大数据被广泛应用于城市相关领域:(1) 智能交通,提取动态交通状态,提供交通信息发布、出行路线规划、动态拼车、智能公交等信息服务;2)城市规划,利用时空位置大数据获得城市人群的空间分布,优化城市空间结构;(3) 城市计算,建立智能计算模型,为环境污染、设施规划、互联网服务提供智能决策支持。然而,现有的位置大数据多来源于车载卫星定位装置、基于移动通信的基站定位或互联网APP等,其存在着采样时间间隔差异大、空间覆盖区域范围不同等问题。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种基于多源位置数据的一致性检验与融合方法及系统,旨在解决现有的多源位置数据空间覆盖范围窄、渗透率、可用性及可靠性较低的问题。
本发明的技术方案如下:
一种基于多源位置数据的一致性检验与融合方法,其中,包括步骤:
A、获取多源位置数据集Di,统计所述多源位置数据集Di的空间覆盖范围,对所述空间覆盖范围进行分区处理得到每个空间单元内与所述多源位置数据集Di所对应的空间格网数据Cpq
B、对所述多源位置数据集Di和空间格网数据Cpq进行统计处理,获取所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数;
C、根据所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数对所述多源位置数据集Di进行时空分布一致性检验;
D、当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;当所述多源位置数据集Di不符合时空分布一致性检验时,则先将所述多源位置数据集Di对应的空间格网数据Cpq进行时空扭曲操作,然后进行融合。
较佳地,所述的基于多源位置数据的一致性检验与融合方法,其中,所述步骤A具体包括:
A1、遍历每个多源位置数据集Di,获取各个多源位置数据集的最小外包矩形(mbri)[xmin, ymin, xmax, ymax];
A2、对每个时空数据集的外包矩形进行并集操作,获得时空位置数据的最小外部矩形集MBR=mbr1 ∪ mbr2 ∪…∪ mbrn,其中,n为多源位置数据集的数量,mbri为第i个多源位置数据集的最小外包矩形;
A3、将所述最小外包矩形集MBR进行分区处理,划分为边长为e的空间单元,所述空间单元内对应的多源位置数据Di即为空间格网数据Cpq
较佳地,所述的基于多源位置数据的一致性检验与融合方法,其中,所述步骤B具体包括:
B1、根据多源数据集Di获取对应的时间分布采样数据集DTi,同时获取每个空间格网数据Cpq对应的局部时间分布样本DTi(p,q);
B2、重复大量抽样,模拟时间分布样本的实际分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1,Xt2,…,Xtm,求取样本均值,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
B3、重复大量抽样和组合,构造参考时间分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,合并m个样本为Y=Xt1∪Xt2∪…∪Xtm;重复该过程,获取n个样本Yt1, Yt2, …, Ytn;令L, m, n足够大,,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
B4、根据多源位置数据集Di获取对应的空间分布采样数据集DSi,同时获取每个空间格网数据Cpq对应的局部空间分布样本DSi(p,q),然后按照时间分布同样的算法,得到空间分布样本的模拟实际分布及相应的全局特征参数和局部特征参数。
较佳地,所述的基于多源位置数据的一致性检验与融合方法,其中,所述步骤C具体包括:
C1、根据所述多源位置数据集Di的时间分布特征和空间分布特征以及空间格网数据Cpq的时间分布特征和空间分布特征,采用Kolmogorov-Smirnov检验方法对所述多源位置数据集Di进行全局时间分布一致性检验、局部时间一致性检验、全局空间分布一致性检验和局部空间分布一致性检验。
较佳地,所述的基于多源位置数据的一致性检验与融合方法,其中,所述步骤D具体包括:
D1、当所述多源位置数据集Di不符合时空分布一致性检验时,对于超采样的空间格网数据Cpq,根据时空抽稀参数确定删减的位置数据数量,进行随机减少采样点;对于采样不足的空间格网数据Cpq,根据时空加密参数确定随机添加的位置数据数量,进行随机增加采样点;
D2、将处理后的所有空间格网数据进行融合,生成新的多源位置数据集。
一种基于多源位置数据的一致性检验与融合系统,其中,包括:
分区模块,用于获取多源位置数据集Di,统计所述多源位置数据集Di的空间覆盖范围MBR,对所述空间覆盖范围MBR进行分区处理得到每个空间单元内与所述多源位置数据集Di所对应的空间格网数据Cpq
数据统计处理模块,用于对所述多源位置数据集Di和空间格网数据Cpq进行统计处理,获取所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数;
一致性检验模块,用于根据所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数对所述多源位置数据集Di进行时空分布一致性检验;
融合模块,用于当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;当所述多源位置数据集Di不符合时空分布一致性检验时,则先将所述多源位置数据集Di对应的空间格网数据Cpq进行时空扭曲操作,然后进行融合。
较佳地,所述的基于多源位置数据的一致性检验与融合系统,其中,所述分区模块具体包括:
最小外包矩形获取单元,用于遍历每个多源位置数据集Di,获取各个多源位置数据集的最小外包矩形(mbri)[xmin, ymin, xmax, ymax];
合并单元,用于对每个时空数据集的外包矩形进行并集操作,获得时空位置数据的最小外包矩形集MBR=mbr1 ∪ mbr2 ∪…∪ mbrn,其中,n为多源位置数据集的数量,mbri为第i个多源位置数据集的最小外包矩形;
分区单元,用于将所述最小外包矩形集MBR进行分区处理,划分为边长为e的空间单元,所述空间单元内对应的多源位置数据Di即为空间格网数据Cpq
较佳地,所述的基于多源位置数据的一致性检验与融合系统,其中,所述数据统计处理模块具体包括:
时间分布样本获取单元,用于根据多源数据集Di获取对应的时间分布采样数据集DTi,同时获取每个空间格网数据Cpq对应的局部时间分布样本DTi(p,q);
时间分布模拟单元,用于通过重复大量抽样,模拟时间分布样本的实际分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,求取样本均值,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
构造单元,用于通过重复大量抽样和组合,构造参考时间分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,合并m个样本为Y=Xt1∪Xt2∪…∪Xtm;重复该过程,获取n个样本Yt1, Yt2, …, Ytn;令l, m, n足够大,,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
空间分布模拟单元,用于根据多源位置数据集Di获取对应的空间分布采样数据集DSi,同时获取每个空间格网数据Cpq对应的局部空间分布样本DSi(p,q),然后按照时间分布同样的算法,得到空间分布样本的模拟实际分布及相应的全局特征参数和局部特征参数。
较佳地,所述的基于多源位置数据的一致性检验与融合系统,其中,所述一致性检验模块具体包括:
Kolmogorov-Smirnov检验单元,用于根据所述多源位置数据集Di的时间分布特征和空间分布特征以及空间格网数据Cpq的时间分布特征和空间分布特征,采用Kolmogorov-Smirnov检验方法对所述多源位置数据集Di进行全局时间分布一致性检验、局部时间一致性检验、全局空间分布一致性检验和局部空间分布一致性检验。
较佳地,所述的基于多源位置数据的一致性检验与融合系统,其中,所述融合模块具体包括:
时空扭曲操作单元,用于当所述多源位置数据集Di不符合时空分布一致性检验时,对于超采样的空间格网数据Cpq,根据时空抽稀参数确定删减的位置数据数量,进行随机减少采样点;对于采样不足的空间格网数据Cpq,根据时空加密参数确定随机添加的位置数据数量,进行随机增加采样点;
第一融合单元,用于将处理后的所有空间格网数据进行融合,生成新的多源位置数据集。
有益效果:本发明提供一种多源位置数据的一致性检验与融合方法及系统,所述方法从时间分布规律、空间分布规律检验多源位置数据的分布一致性,对于时空分布不一致的多源位置数据,利用时空扭曲操作,进行多源位置数据的时空融合,生成覆盖空间范围更广、渗透率更高的位置数据,并显著提高了多源位置数据的可用性和可靠性。
附图说明
图1为本发明一种多源位置数据的一致性检验与融合方法较佳实施例的流程图。
图2为本发明一种多源位置数据的一致性检验与融合系统较佳实施例的结构框图。
具体实施方式
本发明提供一种多源位置数据的一致性检验与融合方法及系统,为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,图1为本发明一种多源位置数据的一致性检验与融合方法较佳实施例的流程图,如图所示,其包括步骤:
S10、获取多源位置数据集Di,统计所述多源位置数据集Di的空间覆盖范围,对所述空间覆盖范围进行分区处理得到每个空间单元内与所述多源位置数据集Di所对应的空间格网数据Cpq
S20、对所述多源位置数据集Di和空间格网数据Cpq进行统计处理,获取所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数;
S30、根据所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数对所述多源位置数据集Di进行时空分布一致性检验;
S40、当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;当所述多源位置数据集Di不符合时空分布一致性检验时,则先将所述多源位置数据集Di对应的空间格网数据Cpq进行时空扭曲操作,然后进行融合。
进一步,所述步骤S10具体包括:
S11、遍历每个多源位置数据集Di,获取各个多源位置数据集的最小外包矩形(mbri)[xmin, ymin, xmax, ymax];所述多源位置数据集Di可以为车辆GPS轨迹数据、移动通信定位数据、社交网络数据、社交媒体数据,签到数据、室内定位数据等各种时空位置数据;
S12、对每个时空数据集的外包矩形进行并集操作,获得时空位置数据的最小外包矩形集MBR=mbr1 ∪ mbr2 ∪…∪ mbrn,其中,n为多源位置数据集的数量,mbri为第i个多源位置数据集的最小外包矩形;
S13、将所述最小外包矩形集MBR进行分区处理,划分为边长为e的空间单元,所述空间单元内对应的多源位置数据Di即为空间格网数据Cpq:所述空间单元无缝且不重叠的覆盖所有时空数据,空间单元数量为个,其中为最小外包矩形MBR的宽度,为最小外包矩形的高度,所述空间单元大小根据最终的边长e确定。
进一步,所述步骤S20具体包括:
S21、根据多源数据集Di获取对应的时间分布采样数据集DTi,同时获取每个空间格网数据Cpq对应的局部时间分布样本DTi(p,q);
S22、重复大量抽样,模拟时间分布样本的实际分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,求取样本均值,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
D23、重复大量抽样和组合,构造参考时间分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,合并m个样本为Y=Xt1∪Xt2∪…∪Xtm;重复该过程,获取n个样本Yt1, Yt2, …, Ytn;令L m, n足够大,,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
D24、根据多源位置数据集Di获取对应的空间分布采样数据集DSi,同理获取每个空间格网数据Cpq对应的局部空间分布样本DSi(p,q)。
S25、重复大量抽样,模拟空间分布样本的实际分布。逐个从空间分布样本DSi中以独立有放回的方式抽取m个样本量为L的样本Xs1, Xs2, …, Xsm,求取样本均值,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值 ;相应的,获取每个格网Cpq对应的局部特征参数的估计值
S26、重复大量抽样和组合,构造参考空间分布,逐个从空间分布样本DSi中以独立有放回的方式抽取m个样本量为L的样本Xs1, Xs2, …, Xsm,合并m个样本为;重复该过程,获取n个样本Ys1, Ys2, …, Ysn;令L, m, n足够大,,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
进一步,所述步骤S30具体包括:
S31、根据所述多源位置数据集Di的时间分布特征和空间分布特征以及空间格网数据Cpq的时间分布特征和空间分布特征,采用Kolmogorov-Smirnov检验方法对所述多源位置数据集Di进行全局时间分布一致性检验、局部时间一致性检验、全局空间分布一致性检验和局部空间分布一致性检验。
具体地,当对所述述多源位置数据集Di进行全局时间分布一致性检验时,即采用Kolmogorov-Smirnov检验方法检验任一数据集Di对应的时间分布样本DTi与参考时间分布是否具有一致性。根据的样本生成经验分布,将其与样本生成的经验分布,计算两个分布之间的差异,进行K-S检验。其中,为指示函数,当时等于1,K-S统计量,其中sup为上确界函数,零假设为两者满足同一分布,当时,拒绝原假设,即在水平下,两个样本分布不一致;
当对所述多源位置数据集Di进行局部时间分布一致性检验时,即针对每个格网数据Cpq进行局部时间分布的一致性检验,其方法和步骤与所述全局时间分布一致性检验相同,在此,不做重复解释;
当对所述多源位置数据集Di进行空间分布一致性检验时,即针对全局空间分布样本DSi和各格网数据Cpq对应的局部空间分布样本DSi(p,q),分别进行全局和局部的空间分布一致性检验,其检验方法和步骤与所述全局时间分布一致性检验相同,在此,不做重复解释。
进一步,所述步骤S40具体包括:
S41、当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;具体地,当所述多源位置数据集Di同时符合全局时间分布一致性检验、局部时间一致性检验、全局空间分布一致性检验和局部空间分布一致性检验时,说明所述多源位置数据集Di符合时空分布一致性检验,即可直接将所述多源位置数据集Di进行融合。
S42、当所述多源位置数据集Di不符合时空分布一致性检验时,对于超采样的空间格网数据Cpq,根据时空抽稀参数,确定删减的位置数据数量N=,进行随机减少采样点,所述时空抽稀参数
对于采样不足的空间格网数据Cpq,根据时空加密参数确定随机添加的位置数据数量M=×m,进行随机增加采样点,所述时空加密系数;
S43、将进行时空扭曲操作处理后的所有空间格网数据进行融合,生成新的多源位置数据集。
基于上述方法,本发明还提供一种多源位置数据的一致性检验与融合系统较佳实施例,如图2所示,包括:
分区模块100,用于获取多源位置数据集Di,统计所述多源位置数据集Di的空间覆盖范围MBR,对所述空间覆盖范围MBR进行分区处理得到每个空间单元内与所述多源位置数据集Di所对应的空间格网数据Cpq
数据统计处理模块200,用于对所述多源位置数据集Di和空间格网数据Cpq进行统计处理,获取所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数;
一致性检验模块300,用于根据所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数对所述多源位置数据集Di进行时空分布一致性检验;
融合模块400,用于当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;当所述多源位置数据集Di不符合时空分布一致性检验时,则先将所述多源位置数据集Di对应的空间格网数据Cpq进行时空扭曲操作,然后进行融合。
较佳地,所述的基于多源位置数据的一致性检验与融合系统,其中,所述分区模块100具体包括:
最小外包矩形获取单元,用于遍历每个多源位置数据集Di,获取各个多源位置数据集的最小外包矩形(mbri)[xmin, ymin, xmax, ymax];
合并单元,用于对每个时空数据集的外包矩形进行并集操作,获得时空位置数据的最小外包矩形集MBR=mbr1 ∪ mbr2 ∪…∪ mbrn,其中,n为多源位置数据集的数量,mbri为第i个多源位置数据集的最小外包矩形;
分区单元,用于将所述最小外包矩形集MBR进行分区处理,划分为边长为e的空间单元,所述空间单元内对应的多源位置数据Di即为空间格网数据Cpq
较佳地,所述的基于多源位置数据的一致性检验与融合系统,其中,所述数据统计处理模块200具体包括:
时间分布样本获取单元,用于根据多源数据集Di获取对应的时间分布采样数据集DTi,同时获取每个空间格网数据Cpq对应的局部时间分布样本DTi(p,q);
时间分布模拟单元,用于通过重复大量抽样,模拟时间分布样本的实际分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,求取样本均值,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
构造单元,用于通过重复大量抽样和组合,构造参考时间分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,合并m个样本为Y=Xt1∪Xt2∪…∪Xtm;重复该过程,获取n个样本Yt1, Yt2, …, Ytn;令L, m, n足够大,,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
空间分布模拟单元,用于根据多源位置数据集Di获取对应的空间分布采样数据集DSi,同时获取每个空间格网数据Cpq对应的局部空间分布样本DSi(p,q),然后按照时间分布同样的算法,得到空间分布样本的模拟实际分布及相应的全局特征参数和局部特征参数。
较佳地,所述的基于多源位置数据的一致性检验与融合系统,其中,所述一致性检验模块300具体包括:
Kolmogorov-Smirnov检验单元,用于根据所述述多源位置数据集Di的时间分布特征和空间分布特征以及空间格网数据Cpq的时间分布特征和空间分布特征,采用Kolmogorov-Smirnov检验方法对所述多源位置数据集Di进行全局时间分布一致性检验、局部时间一致性检验、全局空间分布一致性检验和局部空间分布一致性检验。
较佳地,所述的基于多源位置数据的一致性检验及融合系统,其中,所述融合模块400具体包括:
时空扭曲操作单元,用于当所述多源位置数据集Di不符合时空分布一致性检验时,对于超采样的空间格网数据Cpq,根据时空抽稀参数确定删减的位置数据数量,进行随机减少采样点;对于采样不足的空间格网数据Cpq,根据时空加密参数确定随机添加的位置数据数量,进行随机增加采样点;
第一融合单元,用于将处理后的所有空间格网数据进行融合,生成新的多源位置数据集。
关于上述模块单元的技术细节在前面的方法中已有详述,故不再赘述。
综上所述:本发明提供一种多源位置数据的一致性检验与融合方法及系统,所述方法从时间分布规律、空间分布规律检验多源位置数据的分布一致性,对于时空分布不一致的多源位置数据,利用时空扭曲操作,进行多源位置数据的时空融合,生成覆盖空间范围更广、渗透率更高的位置数据,并显著提高了多源位置数据的可用性和可靠性。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (10)

1.一种基于多源位置数据的一致性检验与融合方法,其特征在于,包括步骤:
A、获取多源位置数据集Di,统计所述多源位置数据集Di的空间覆盖范围,对所述空间覆盖范围进行分区处理得到每个空间单元内与所述多源位置数据集Di所对应的空间格网数据Cpq
B、对所述多源位置数据集Di和空间格网数据Cpq进行统计处理,获取所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数;
C、根据所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数对所述多源位置数据集Di进行时空分布一致性检验;
D、当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;当所述多源位置数据集Di不符合时空分布一致性检验时,则先将所述多源位置数据集Di对应的空间格网数据Cpq进行时空扭曲操作,然后进行融合。
2.根据权利要求1所述的基于多源位置数据的一致性检验与融合方法,其特征在于,所述步骤A具体包括:
A1、遍历每个多源位置数据集Di,获取各个多源位置数据集的最小外包矩形(mbri)[xmin, ymin, xmax, ymax];
A2、对每个时空数据集的外包矩形进行并集操作,获得时空位置数据的最小外包矩形集MBR=mbr1 ∪ mbr2 ∪…∪ mbrn,其中,n为多源位置数据集的数量,mbri为第i个多源位置数据集的最小外包矩形;
A3、将所述最小外包矩形集MBR进行分区处理,划分为边长为e的空间单元,所述空间单元内对应的多源位置数据Di即为空间格网数据Cpq
3.根据权利要求1所述的基于多源位置数据的一致性检验与融合方法,其特征在于,所述步骤B具体包括:
B1、根据多源数据集Di获取对应的时间分布采样数据集DTi,同时获取每个空间格网数据Cpq对应的局部时间分布样本DTi(p,q);
B2、重复大量抽样,模拟时间分布样本的实际分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …,Xtm,求取样本均值,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
B3、重复大量抽样和组合,构造参考时间分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,合并m个样本为Y=Xt1∪Xt2∪…∪Xtm;重复该过程,获取n个样本Yt1, Yt2, …, Ytn;令L, m, n足够大,,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
B4、根据多源位置数据集Di获取对应的空间分布采样数据集DSi,同时获取每个空间格网数据Cpq对应的局部空间分布样本DSi(p,q),然后按照与时间分布同样的算法,得到空间分布样本的模拟实际分布及相应的全局特征参数和局部特征参数。
4.根据权利要求1所述的基于多源位置数据的一致性检验与融合方法,其特征在于,所述步骤C具体包括:
C1、根据所述多源位置数据集Di的时间分布特征和空间分布特征以及空间格网数据Cpq的时间分布特征和空间分布特征,采用Kolmogorov-Smirnov检验方法对所述多源位置数据集Di进行全局时间分布一致性检验、局部时间一致性检验、全局空间分布一致性检验和局部空间分布一致性检验。
5.根据权利要求1所述的基于多源位置数据的一致性检验与融合方法,其特征在于,所述步骤D具体包括:
D1、当所述多源位置数据集Di不符合时空分布一致性检验时,对于超采样的空间格网数据Cpq,根据时空抽稀参数确定删减的位置数据数量,进行随机减少采样点;对于采样不足的空间格网数据Cpq,根据时空加密参数确定随机添加的位置数据数量,进行随机增加采样点;
D2、将处理后的所有空间格网数据进行融合,生成新的多源位置数据集。
6.一种基于多源位置数据的一致性检验与融合系统,其特征在于,包括:
分区模块,用于获取多源位置数据集Di,统计所述多源位置数据集Di的空间覆盖范围,对所述空间覆盖范围进行分区处理得到每个空间单元内与所述多源位置数据集Di所对应的空间格网数据Cpq
数据统计处理模块,用于对所述多源位置数据集Di和空间格网数据Cpq进行统计处理,获取所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数;
一致性检验模块,用于根据所述多源位置数据集Di的时间分布特征参数和空间分布特征参数以及空间格网数据Cpq的时间分布特征参数和空间分布特征参数对所述多源位置数据集Di进行时空分布一致性检验;
融合模块,用于当所述多源位置数据集Di符合时空分布一致性检验时,直接进行融合;当所述多源位置数据集Di不符合时空分布一致性检验时,则先将所述多源位置数据集Di对应的空间格网数据Cpq进行时空扭曲操作,然后进行融合。
7.根据权利要求6所述的基于多源位置数据的一致性检验与融合系统,其特征在于,所述分区模块具体包括:
最小外包矩形获取单元,用于遍历每个多源位置数据集Di,获取各个多源位置数据集的最小外包矩形(mbri)[xmin, ymin, xmax, ymax];
合并单元,用于对每个时空数据集的外包矩形进行并集操作,获得时空位置数据的最小外包矩形集MBR=mbr1 ∪ mbr2 ∪…∪ mbrn,其中,n为多源位置数据集的数量,mbri为第i个多源位置数据集的最小外包矩形;
分区单元,用于将所述最小外包矩形集MBR进行分区处理,划分为边长为e的空间单元,所述空间单元内对应的多源位置数据Di即为空间格网数据Cpq
8.根据权利要求6所述的基于多源位置数据的一致性检验与融合系统,其特征在于,所述数据统计处理模块具体包括:
时间分布样本获取单元,用于根据多源数据集Di获取对应的时间分布采样数据集DTi,同时获取每个空间格网数据Cpq对应的局部时间分布样本DTi(p,q);
时间分布模拟单元,用于通过重复大量抽样,模拟时间分布样本的实际分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,求取样本均值,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
构造单元,用于通过重复大量抽样和组合,构造参考时间分布,逐个从时间分布样本DTi中以独立有放回的方式抽取m个样本量为L的样本Xt1, Xt2, …, Xtm,合并m个样本为Y=Xt1∪Xt2∪…∪Xtm;重复该过程,获取n个样本Yt1, Yt2, …, Ytn;令L, m, n足够大,,则;用样本拟合最优的正态曲线,计算得到全局特征参数的估计值;相应的,获取每个格网Cpq对应的局部特征参数的估计值
空间分布模拟单元,用于根据多源位置数据集Di获取对应的空间分布采样数据集DSi,同时获取每个空间格网数据Cpq对应的局部空间分布样本DSi(p,q),然后按照与时间分布同样的算法,得到空间分布样本的模拟实际分布及相应的全局特征参数和局部特征参数。
9.根据权利要求6所述的基于多源位置数据的一致性检验与融合系统,其特征在于,所述一致性检验模块具体包括:
Kolmogorov-Smirnov检验单元,用于根据所述多源位置数据集Di的时间分布特征和空间分布特征以及空间格网数据Cpq的时间分布特征和空间分布特征,采用Kolmogorov-Smirnov检验方法对所述多源位置数据集Di进行全局时间分布一致性检验、局部时间一致性检验、全局空间分布一致性检验和局部空间分布一致性检验。
10.根据权利要求6所述的基于多源位置数据的一致性检验与融合系统,其特征在于,所述融合模块具体包括:
时空扭曲操作单元,用于当所述多源位置数据集Di不符合时空分布一致性检验时,对于超采样的空间格网数据Cpq,根据时空抽稀参数确定删减的位置数据数量,进行随机减少采样点;对于采样不足的空间格网数据Cpq,根据时空加密参数确定随机添加的位置数据数量,进行随机增加采样点;
第一融合单元,用于将处理后的所有空间格网数据进行融合,生成新的多源位置数据集。
CN201610477175.0A 2016-06-27 2016-06-27 一种多源位置数据的一致性检验与融合方法及系统 Active CN106203467B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610477175.0A CN106203467B (zh) 2016-06-27 2016-06-27 一种多源位置数据的一致性检验与融合方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610477175.0A CN106203467B (zh) 2016-06-27 2016-06-27 一种多源位置数据的一致性检验与融合方法及系统

Publications (2)

Publication Number Publication Date
CN106203467A CN106203467A (zh) 2016-12-07
CN106203467B true CN106203467B (zh) 2019-08-13

Family

ID=57461498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610477175.0A Active CN106203467B (zh) 2016-06-27 2016-06-27 一种多源位置数据的一致性检验与融合方法及系统

Country Status (1)

Country Link
CN (1) CN106203467B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113256984B (zh) * 2021-06-25 2021-11-05 智道网联科技(北京)有限公司 基于车路协同的多数据源的数据融合处理方法和装置
CN113160571B (zh) * 2021-06-28 2021-10-01 智道网联科技(北京)有限公司 基于车路协同的多数据源的数据融合处理方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609986A (zh) * 2012-03-14 2012-07-25 中国矿业大学(北京) 数字矿山中矿体建模系统及其建模和检测方法
CN103714185A (zh) * 2014-01-17 2014-04-09 武汉大学 主题事件更新方法库及城市多源时空信息并行更新方法
CN105279260A (zh) * 2015-10-21 2016-01-27 武汉大学 一种基于空间网格划分的政务大数据挖掘方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080270332A1 (en) * 2003-08-26 2008-10-30 Paul Rudolf Associative Memory Device and Method Based on Wave Propagation
US20080100473A1 (en) * 2006-10-25 2008-05-01 Siemens Corporate Research, Inc. Spatial-temporal Image Analysis in Vehicle Detection Systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609986A (zh) * 2012-03-14 2012-07-25 中国矿业大学(北京) 数字矿山中矿体建模系统及其建模和检测方法
CN103714185A (zh) * 2014-01-17 2014-04-09 武汉大学 主题事件更新方法库及城市多源时空信息并行更新方法
CN105279260A (zh) * 2015-10-21 2016-01-27 武汉大学 一种基于空间网格划分的政务大数据挖掘方法

Also Published As

Publication number Publication date
CN106203467A (zh) 2016-12-07

Similar Documents

Publication Publication Date Title
Yu et al. View-based greenery: A three-dimensional assessment of city buildings’ green visibility using Floor Green View Index
Theobald Landscape patterns of exurban growth in the USA from 1980 to 2020
CN102595323B (zh) 基于手机定位数据的居民出行特征参数的获取方法
US20170091350A1 (en) Near real-time modeling of pollution dispersion
Higgins A 4D spatio-temporal approach to modelling land value uplift from rapid transit in high density and topographically-rich cities
CN103234883B (zh) 一种基于道路交通流量实时估算中心城区pm2.5浓度的方法
KR101307232B1 (ko) 하천홍수 상황인지시스템 및 컴퓨터로 판독 가능한 기록매체
CN104850913B (zh) 一种空气质量pm2.5预测方法及系统
CN106503843A (zh) 一种基于手机信令数据的常规公交线网优化与调整方法
CN103336894B (zh) 一种城市容积率自动分区方法
CN106205114A (zh) 一种基于数据融合的高速公路路况信息实时获取方法
CN103903105A (zh) 核事故后果评价与辅助决策一体化平台及方法
CN111880210A (zh) 输电线路的地灾监测处理方法和装置、预警系统和设备
Fallah-Shorshani et al. Evaluation of regional and local atmospheric dispersion models for the analysis of traffic-related air pollution in urban areas
CN104320789A (zh) 一种基于博弈论的车联网rsu最优配置方法
CN110174106A (zh) 一种基于pm2.5的健康步行路径规划方法及终端设备
CN105844031B (zh) 一种基于手机定位数据的城市交通廊道识别方法
CN106203467B (zh) 一种多源位置数据的一致性检验与融合方法及系统
Pamanikabud et al. 3D analysis and investigation of traffic noise impact from a new motorway on building and surrounding area
Xu et al. Building height calculation for an urban area based on street view images and deep learning
CN107169080A (zh) 一种基于gis和空间数据库相结合的地理空间分析系统
Li et al. A physically based spatiotemporal method of analyzing flood impacts on urban road networks
CN105069299A (zh) 一种事故时放射性核素大气扩散轨迹集合预测计算方法
Zhang et al. Distribution patterns and influencing factors of population exposure risk to particulate matters based on cell phone signaling data
CN115953556A (zh) 暴雨内涝道路风险ar预警方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant