CN109714712A

CN109714712A - 一种基于属性匹配的数据落点到栅格的方法及装置

Info

Publication number: CN109714712A
Application number: CN201811628273.5A
Authority: CN
Inventors: 李宝玉; 金俊峰; 方健; 张海永; 穆健翔; 朱中亚
Original assignee: Section Big Country Wound Software Inc Co
Current assignee: Section Big Country Wound Software Inc Co
Priority date: 2018-12-28
Filing date: 2018-12-28
Publication date: 2019-05-03
Anticipated expiration: 2038-12-28
Also published as: CN109714712B

Abstract

本发明公开了一种基于属性匹配的数据落点到栅格的方法及装置，将道路用户识别出来并进行分类；将室内用户识别出来；基于GIS数据进行栅格子区域的划分，并把栅格进行划分为室内属性的子栅格和道路属性的子栅格；将带有属性的数据点和栅格进行匹配，根据经纬度进行落点的匹配。本发明基于运营商的数据，利用信号变化稳定性、移到速度、使用基站小区等特征，综合判断用户是否在道路或室内，为后续的道路拥堵、公交线路规划、城市交通规划、城市人流OD流向统计、室内人员特征分析、室内监控预警等工作提供核心数据支撑，让原来很多无法实现的工作变成可能。

Description

一种基于属性匹配的数据落点到栅格的方法及装置

技术领域

本发明涉及一种运营商数据落点技术，尤其涉及的是一种基于属性匹配的数据落点到栅格的方法及装置。

背景技术

随着电信运营商通信技术的日趋成熟和快速发展，以及大数据技术的不断进步，数据价值越来越重要，挖掘、使用数据能力，充分发挥数据价值已经成为运营商的业务拓展、服务提升的下一个关键点，其中位置能力作为运营商的核心数据能力之一，在对内运维优化、精准营销，对外数据变现、行业应用支撑等方面起着至关重要的作用。

当前运营商最新主流的，能够提供较为准确位置能力的技术是基于MR的指纹定位技术；MR是指移动终端通过控制信道，在业务信道上以一定时间间隔，以MR的方式向基站周期性上报所在小区的下行信号强度、质量等信息，基站将终端上报的下行信息和自身收集的上行物理信息上传给基站控制器，并由其收集与统计。以TD-SCDMA网络为例，每个MR主要包括上下行接收信号码功率、上下行信噪比、时间提前量、上下行路径损耗、UE发射功率及NodeB发射功率等。上报的MR可用于系统中无线资源控制子层完成诸如切换等事件的触发，也可用于系统维护，观察系统的运行状态；位置指纹是指用户所处位置的场景特征。

基于MR的指纹定位技术的原理是：将实际地图根据一定距离，划分在连续的正方形栅格，然后将海量MR数据点落入栅格中，提取每个栅格中的信息特征，建设成MR指纹库；对某条MR记录定位的过程为，提取这条MR数据的特征，然后与现有库中每个栅格的特征进行比较，计算欧式距离，以距离最小的栅格作为此条MR数据定位到的栅格，以栅格中心点作为定位经纬度；但是目前对于定位到栅格后，只能提供经纬度信息，在实际应用的过程中，有很大的局限性，还是存在不理想的地方，需要进一步对建库过程进行进一步改行，为数据和栅格加上属性的信息，精准建库，精准匹配并实现定位结果的灵活使用。

当前的建库及定位结果应用方面存在以下缺陷：

(1)传统建设指纹库时，数据落点的方法只是根据经纬度直接落入对应栅格，然而实际运营商数据中上报的经纬度数据是不够精确的，甚至很大一部分是误差很大，而直接根据有误差的经纬度落入对应栅格，会导致实际的数据点落入到了错误的栅格内，导致后续建库的提取特征、定位等过程形成严重干扰，非常影响指纹库的定位准确性。

(2)当实际应用需要知道用户所在位置是属于道路上或建筑物内等时，一个栅格可能包含道路、建筑物及其他各类型区域，代表用户实际位置也可能归属这几种区域任何一个，而目前只能根据返回的中心点作为判断依据，明显存在错误，导致很多应用无法开展。

发明内容

本发明所要解决的技术问题在于：如何通过属性匹配把数据落入栅格中，提供了一种基于属性匹配的数据落点到栅格的方法及装置。

本发明是通过以下技术方案解决上述技术问题的，本发明的一种基于属性匹配的数据落点到栅格的方法，包括以下步骤：

(1)将道路用户识别出来并进行分类；

(2)将室内用户识别出来；

(3)基于GIS数据进行栅格子区域的划分，并把栅格进行划分为室内属性的子栅格和道路属性的子栅格；

(4)将带有属性的数据点和栅格进行匹配，根据经纬度进行落点的匹配。

所述步骤(1)中，具体过程如下：

(11)采集带有经纬度、用户标识的数据源，根据经纬度进行计算并排序；

(12)根据合理值，剔除经纬度不合理的异常数据；

(13)根据连续的两条记录中的经纬度计算出直线距离，同时根据连续的两条记录中的时间计算出时间差，获得用户直线速度；

(14)根据用户直线速度判断用户在某时间段内在道路上乘坐交通工具行驶。

所述步骤(1)还包括：

(15)根据用户直线速度，筛选速度变化特征为由正常速度到零，再由零到正常速度的用户；

(16)找出上述用户中速度为零的时间段内的相关信息；

(17)剔除使用室内小区的记录，然后计算信号稳定度；

(18)根据信号稳定度判断用户在某时间段在道路上行驶过程中出现等待红绿灯的情况。

所述步骤(1)还包括：

(19)找出已知的道路上的用户，以及在道路上对应时间段和轨迹；

(110)提取全量用户与已知道路用户相同时间段的切换轨迹特征，将提取的此批用户此时间段的切换轨迹特征与已知道路用户相同时间段的切换轨迹特征相比；

(111)如果提取的用户中相似的轨迹相关指标大于设定值的，认定提取的此批用户为已知的道路用户状态相同的道路用户。

所述步骤(2)具体如下：

(21)用户使用室分小区信号时，认定用户在室内；

(22)当用户使用室外小区为主小区信号时，同一小区，相同TaDv值时，如果电平值分布有明显差异，则可根据差异数据分界线，选取电平值较差的部分用户为室内用户。

所述差异数据分界线具体划分方法如下：

当电平值分布存在明显差异时，首先剔除前N条，后N条数据，然后再根据剔除后的数据取前M个条数据，后M条数据，各计算出平均值；差异数据分界线＝(前M条数据平均值+后M条数据平均值)/2。

所述步骤(3)具体过程如下：

(31)设定待划分地图区域的栅格尺寸；

(32)利用GIS道路数据扩展，将道路数据的首尾相连，处理成封闭空间数据，从而实现GIS道路数据与GIS建筑物数据形式相同；

(33)计算道路或建筑物的封闭区域与栅格的交叉点，并把交叉点插入原始的封闭区间数据集中，得到新的封闭区域边界数据；

(34)根据新的封闭区域边界数据，计算出交叉子区域；

(35)然后计算出其他栅格内GIS数据点集合的关系，输出子区域集合，其中，道路数据与栅格数据的交集子区域为道路子区域，建筑物数据与栅格数据的交集子区域为室内子区域；

(36)如果整个栅格都在封闭区域内，则该栅格为对应封闭区域的子区域；

(37)汇总可得所有室内属性的子区域和道路属性的子区域。

所述步骤(4)中，根据经纬度落点进行匹配的规则如下：

对于位置和属性的完全匹配：

某属性的数据，如果根据经纬度落点，也落入到相同属性的子栅格内，则将此数据点落入到此子栅格，落点匹配成功，其他情况都认为落点匹配失败；

对于属性匹配、栅格位置拓展后匹配：

某属性的数据点，如果根据经纬度落点到同属性的栅格扩展后的范围内，也认为落点匹配成功；

对于属性匹配、位置就近匹配：

某属性的数据点，根据设定的合理范围，将此数据点落点到同属性的最近栅格的范围内，也认为落点匹配成功。

所述步骤(4)中，选择落点匹配失败数据的处理规则：

直接抛弃：数据量较多时，只选择精准数据落点建库，其他数据直接抛弃；

不考虑属性，只用位置匹配：对数据点与栅格的属性不做要求，直接根据数据点的位置落点匹配对应的子栅格；

就近落点同栅格内固定属性子区域：在落点时指定落点到位置所在栅格的某类子区域。

一种基于属性匹配的数据落点到栅格的装置，包括：

道路用户识别分类模块，用于将道路用户识别出来并进行分类；

室内用户识别分类模块，用于将室内用户识别出来；

栅格划分模块，基于GIS数据进行栅格子区域的划分，并把栅格进行划分为室内属性的子栅格和道路属性的子栅格；

匹配模块，用于将带有属性的数据点和栅格进行匹配，根据经纬度进行落点的匹配。

本发明相比现有技术具有以下优点：本发明基于运营商的数据，利用信号变化稳定性、移到速度、使用基站小区等特征，综合判断用户是否在道路或室内，为后续的道路拥堵、公交线路规划、城市交通规划、城市人流OD流向统计、室内人员特征分析、室内监控预警等工作提供核心数据支撑，让原来很多无法实现的工作变成可能。

在栅格划分时，与实际地理信息结合起来，将正常栅格区域与实际道路、建设物的区域进行交叉，找出重叠区域作为子栅格，将道路重叠的子栅格标记道路属性、将建设物重叠的子栅格标记室内属性、将栅格剩余的区域作为一个子栅格(可标记为其他)，然后建库过程可对每个子栅格提取特征值，建成MR指纹库；此时，再进行定位时，可将用户直接定位到这些子栅格内，返回子栅格中心点，即可确定了用户所在位置的属性，为后续的位置应用分析提供了带有属性的位置数据，让很多需要类似道路相关分析、室内相关分析等以属性的位置数为基础的应用分析的实现变成可能。

在数据落点时，根据用户的行为特征、服务小区特征等信息，将用户的数据点标明属性、栅格亦根据GIS信息标明其属性。然后制订一条包含属性匹配、区域扩展等方法的落点方案，可实现以下几个功能：可从用户行为特征的角度，效剔除错误位置数据；可从用户行为特征的角度有效调整、修正错误数据；可灵活调整建库时的数据源，根据实际情况选择建库所有数据源的数量，保证在限定数据源数量的前提下，建设的指纹库更准确。

附图说明

图1是本发明的道路用户识别分类流程图；

图2是本发明的室内用户识别流程图；

图3是本发明的栅格子区域划分的流程图；

图4是交叉点插入后形成的心的区域边界示意图；

图5是封闭子区域确定的示意图；

图6是本发明的落点匹配流程图；。

具体实施方式

下面对本发明的实施例作详细说明，本实施例在以本发明技术方案为前提下进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

本实施例的数据源为电信运营商数据，主要包括：

1、S1-U信令数据：含有用户发生业务时的具体的经纬度位置信息(现在用户日常行为中会使用APP中，例如在使用地图定位、导航软件等APP时，这些APP会采集、上报用户的经纬度信息，运营商采集信令数据时可从中获取用户经纬度信息)。

2、MR数据：包含用户信息、用户上下行接收信号码功率、上下行信噪比、时间提前量、上下行路径损耗、UE发射功率及NodeB发射功率、MR.Tadv(时间提前量，可以粗略认为是手机终端到小区之间信号传输的时长)等数据。

3、小区切换数据：包含用户应用各小区之间切换的记录：当某一用户手机正在使用A小区作为主服务小区，当人员移动到A/B小区服务的边界线时，手机实时判断比较A/B的信号差异，当B小区信号更好时，手机后台会自动切换到B小区；此过程即完成了一次小区切换，此时信令会记录此切换过程。

4、小区配置数据：各小区的唯一标识、所在位置经纬度等信息。

5、GIS建筑物数据：包含建筑物的边界点测绘数据，单个建筑物的测绘数据是按顺序排列的一系列闭合数据点集合。

6、GIS道路数据：包含每条道路的测绘数据，单条道路路测数据是按顺序排列的一系列非闭合数据点集合。

7、栅格尺寸：用户设定。

一、本实施例用于道路用户识别分类的过程如下：

如图1所示，道路用户主要分为三类：

1、速度较快的用户

当速度大于某个值时，认为正常人类在步行/骑行无法达到时，再排除定位错误数据，持续一段时间的稳定的高速移动，认为是乘车(火车、地铁等亦算在内)在道路上行驶。

2、等红绿灯的用户

道路上的用户除了高速行驶，还存在等红绿灯等情况；此时用户有以下三个特征：速度特征，此时用户直线速度会呈现由正常速度快速变为零、一定时间内,又变回正常速度的过程(特殊情况暂不考虑)；使用的主服务小区特征，此过程中用户一直在车内(道路上)使用小区亦是道路附近且不可能是室内小区；小区信号变化特征，当停止不动时，信号变化应趋于稳定；所以通过以上各种行为特征，综合识别在道路上的用户。

3、确定在道路上用户的相似轨迹用户

除了以上速度较快的用户、等红绿灯的用户，还有大量轨迹相似的用户。

实际数据中包含经纬度的用户量占比较少，导致识别的用户量有限，此时考虑已经识别到的道路用户与同车(公交车、大巴车、拼车)、同驾驶路线等用户的部分特征应呈现相似性，车辆在行驶过程中快速移动，为保证手机信号稳定可用，必然会产生小区的频繁切换，所以以多用户同大巴车为例，此过程应该呈现相似性，当识别出用户A在道路上，则用户A的在T1时由小区C1切换到C2，则大巴上其他用户亦会在T1时刻前后几秒内切换；根据此规律可根据海量的道路用户，识别出更多道路用户，达到可应用的目的。

对于道路上速度较快的用户，本实施例的具体实现过程如下：

(11)找出S1-U中，包含经纬度的记录，按用户、时间排序；

(12)根据合理值，剔除经纬度不合理的异常数据，合理值计算方法如下：

(121)计算当前经纬度与小区位置之间的距离，设为D；

(122)根据MR.Tadv值计算当前MR数据距离小区的距离，计算如表1所示：

表1 Tadv值与最大和最小采样时间的关系表

Tadv值	Iin_Ts	Iax_Ts
			0	0	16
1	16	32
			…	…	…
11	176	192
			12	192	224
…	…	…
			37	992	1024
38	1024	1280
			…	…	…
41	1792	2048
			42	2048	3072
43	3072	4096
			44	4096	-

如表1所示，从0到192Ts每16Ts为一个区间，对应MR.Tadv.0到MR.Tadv.11；从192Ts到1024Ts每32Ts为一个区间，对应MR.Tadv.12到MR.Tadv.37；从1024Ts到2048Ts每256Ts为一个区间，对应MR.Tadv.38到MR.Tadv.41；从2048Ts到4096Ts每1048Ts为一个区间，对应MR.Tadv.42和MR.Tadv.43；大于4096Ts为一个区间，对应MR.Tadv.44。

Ts的定义：TS，Ts＝1/(15000 x 2048)s。Ts是LTE中OFDM符号FFT大小为2048点的采样时间(分辨率)，即OFDM时域符号持续时间为2048Ts＝1/15kHz。

Ts的距离换算：1Ts＝(1/(15000 x 2048)s)*3*108m/s/2≈4.89m

所以，根据表格中的规律，可以找出Tadv值对应的最大最小Ts值，然后距离计算公式如下：

最小距离＝Min_Ts值*4.89m

最小距离＝Max_Ts值*4.89m

备注：当MR.Tadv≥44时，信号已经非常偏远，可人为设定一个合理的最大范围。

(123)合理值计算方式如下：

当Dmin≤D≤Dmax时，合理值＝1

当D＞Dmax时，合理值＝Dmax/D

当D＜Dmin时，合理值＝Dmin/D

(124)合理值＝1代表实际上报经纬度与小区的距离和与小区信号TA值测试的距离一致，为合理数据，所以|合理值-1|的值越大，此值越不合理。但因无线信号会受建筑物折射影响，造成曲线传播，所以距离Dmax及Dmin可能是曲线距离，理论上距离应该略大于等于D，所以实际应用过程中，可根据实际场景自定义合理值取值范围；

(13)根据连续的两条记录中的经纬度,计算出直线距离；

(14)根据连续的两条记录中的时间，计算出时间差；

(15)最小移动速度＝直线距离/时间差

(16)设定速度最大值、最小值(用户自定义)，得出某用户在某时间段内在道路上；

对于等红绿灯的用户，具体实施过程如下：

(21)找出速度由正常速度变为零、一定时间内，又变回正常速度的记录；

(22)找出上述用户中速度为零的时间段内的相关信息；

(23)剔除使用室内小区的记录；

(24)将此过程中相邻两条MR数据进行比较，得出信号稳定度；

(241)在两条MR数据中，设前一条MR记录为A记录，设后一条MR为B记录，将A记录中出现的所有小区根据电平值大小按降序排序，然后截取前N(自定义)个小区进行计算，对应的计算方法如下：

a1+a2+…an＝1；

如B记录中未找到对应的小区则此小区的电平值设为零；

A记录是小区电平值越高，对应的影响因子应该越大(因电平值较小，代表信号的传输距离较远，传输过程中受漂移、折射、阻挡等环节较多，对应的可信度越低，故电平值越大，可信度越高，对应的影响因子应该越大)；

(243)稳定度为0可认为无变化，稳定度越大则越不稳定；

(25)根据实际场景，设定信号稳定度阀值，得出用户在某时间段内在道路上。

对于相似轨迹用户：

(31)找出已知的道路上的用户，以及在道路上对应时间段和轨迹，包括速度较快的和等红绿灯的；

(32)找出道路上用户、对应在道路上的时间段内的小区切换记录，按用户、时间排序；结果设为道路轨迹数据集；

(33)将全量用户的小区切换记录按用户、时间排序；结果设为所有轨迹数据集；

(34)设定相似用户匹配参数：冗余时长、最小相似切换次数、最短相似时长

冗余时长：两个时间点相比，当第二个时间点-冗余时长<第一个时间点<第二个时间点+冗余时长时，则认为两个时间点相同；

最小相似切换次数：两条相比较的轨迹，连续切换相似的次数；

最短相似时长：两条相比较的轨迹，最短的相似时长；

(35)根据上一步的参数，比对道路轨迹数据集与所有轨迹数据集中用户切换轨迹，找出相似的轨迹，满足以下三个条件则认为两个用户轨迹相似：

(351)至少有连续的N次切换记录相似，N≥最小相似切换次数；

(352)连续相似的切换记录最大时间-连续相似切换记录最小时间≥最短相似时长；

(353)相似的切换判读规则如下：从道路轨迹数据集中，选取A用户的轨迹记录，可按时间顺序拆分为N个连续的切换记录；从所有轨迹数据集中，选取B用户的轨迹记录，可按时间顺序拆分为N个连续的切换记录，

A用户的某条切换记录的切换前小区、切换后小区与B用户某条记录的切换前小区、切换后一致；

A用户的此条切换记录的切换时间-冗余时长<B用户此条切换记录的切换时间<A用户的此条切换记录的切换时间+冗余时长

同时满足以上两个条件，则认为此次切换记录相似；

(354)如果两段轨迹相似，则认为从所有轨迹数据集中的抽取的这段轨迹中的用户为道路用户。

二、将室内用户识别出来

如图2所示：

室内用户的识别流程如下：

1、使用室分小区用户识别：根据现在电信网络覆盖的现状，很多大型楼宇建筑，都有专门的室内分布小区，而在室外时，这部分室分小区的信号很弱(用户在室外时，会使用信号更好的室外小区作为主小区)，所以当用户使用室分小区时，可认为此时用户在室内。

2、使用室外小区用户识别：因现有电信网络信号，受建筑物阻挡时，损耗非常严重，所以室外小区在相近距离的位置，室内外电平值会有明显差距；所以当用户使用室外小区为主小区时，同一小区，相同TaDv(此值相同则与距离接近)时，如果电平值分布有明显差异(差异水平自定义)，则可根据差异数据分界线，选取电平值较差的部分用户(选取占比自定义)为室内用户；差异数据分界线可参加如下方法：

当电平值分布存在明显差异时，首先剔除前N条，后N条数据(屏蔽异常数据差异)，然后再根据剔除后的数据取前M个条数据，后M条数据，各计算出平均值；则差异数据分界线＝(前M条数据平均值+后M条数据平均值)/2。

三、基于GIS数据进行栅格子区域的划分，并把栅格进行划分为室内属性的子栅格和道路属性的子栅格

如图3所示，本实施例的划分过程如下：

(1)用户设定待划分地图区域栅格的长和宽，默认划分栅格的长和宽相等。

(2)GIS道路数据扩展，将道路数据的首尾相连，处理成封闭空间数据，如果道路数据只是道路中心点连线，则是由多个点组成的一条线，并非道路的实际情况，就需要对道路数据向双边扩展N米，近似还原道路实际情况，然后依次连接扩展后的一系列点形成一个密闭的区域；处理后的道路数据即为密闭的区域，与建筑物的数据形式相同，所以后续把道路和建筑物看成同一类型数据进行相同方法操作。

(3)为计算出道路或者建筑物与栅格的交叉区域，先计算出道路或者建筑物的封闭区域与栅格的交叉点，并把这些交叉点插入到原始的封闭区间数据集中，即可得出新的区域边界数据，如图4所示：

原始的封闭区域Area1的点顺序为A-B-C-D-A，由线段AB、BC、CD、DA可以分别计算出它们与栅格的交点，依次把交叉点插入到A-B-C-D-A中，则可以得到A-P1-P2-P3-P4-P5-P6-B-P8-P9-P10-P11-C-P12-P13-P14-P15-D-P16-A这样一个新的封闭区域。

(4)根据新的封闭区域边界数据，计算出交叉子区域；以图4中的栅格为例，A点作为起始点，确定A点所属于的栅格id及在栅格边上的点P1、P16，如图5所示：

如何确定一个封闭子区域的步骤如下：

(41)由于A、P1、P16存在顺序关系，从A点出发，A的下一个点是P1，连接AP1，AP1即为封闭子区域的一条边；

(42)从P1点出发，由于栅格顶点V1在Area1所属的封闭区域内而V4不在Area1所属的封闭区域内，P1->V1是可以连通，P1->V4无法连通,所以连接P1V1，P1V1为封闭子区域的一条边；

(43)从V1出发，V1P1虽可以连通，但是P1V1已添加到子区域中，V1只能连接V1V2这条边上的点，由于V1V2这条边上只有V2且V2点在Area1内，所以连接V1V2，P1V1为封闭子区域的一条边；

(44)从V2出发，由于V2V1这条路已遍历过，所以只能连接V2P16这个点；

(45)从P16点出发，V4不在Area1所属的封闭区域内，P16->V4无法连通，所以连接P16A；

(46)栅格内所有点遍历结束，形成A-P1-V1-V2-P16-A子区域。

(5)按以上步骤，计算其它栅格内GIS数据点集合的关系，输出子区域集合，其中道路数据与栅格数据的交集子区域为道路子区域，建筑物数据与栅格数据的交集子区域为建筑物子区域又称为室内子区域；

(6)计算出整个栅格都在封闭区域内的情况，则这个栅格即为对应封闭区域的子区域，计算过程如下：

(61)找出这个封闭区域周边一定范围内的栅格；

(62)计算是否有某个栅格四个顶点全部属于这个封闭区域内，如果满足此条件，则此栅格为这个封闭区域的子区域；

(63)重复上一步，找出这个封闭区域的所有这种子区域。

(7)将以上两步的结果汇总，即得出所有室内属性的子区域和道路属性的子区域。

四、基于属性匹配落点

如图6所示，本实施例的落点匹配如下：

将带有属性的数据点及栅格进行匹配，匹配过程中根据属性标识、位置等信息可制订多种落点匹配规则，然后对匹配失败的数据亦可选择处理规则，保持灵活性；实际生产过程中，因不同属性的数据标识，信号特征特性不同，数据量亦有差异等，所以可根据每类属性数据的情况，选择不同的规则进行落点匹配规则和剩余数据处理规则，可充分发挥每类数据的价值，灵活适配每类数据，让指纹库更完善，更符合实际情况；详细说明如下：

(1)选择落点匹配规则

(11)位置、属性完全匹配

某属性的数据，如果根据经纬度落点，也落入到相同属性的子栅格内，则将此数据点落入到此子栅格，落点匹配成功，其他情况都认为落点匹配失败；此选项对数据要求严格，适合数据量较多的情况。

实施步骤：

(111)计算数据点归属栅格

根据栅格的长、宽，计算得出相同距离对应的经度值；X1、纬度值Y1；

计算数据点经度与某个栅格顶点的经度差值,X2；

计算数据点纬度与某个栅格顶点的纬度差值,Y2；

根据X2/X1的值、X1的值，可推导出数据点所在栅格的几个顶点经度；

根据Y2/Y1的值、Y1的值，可推导出数据点所以栅格的几个顶点的纬度；

根据以上步骤，可计算出数据点归属的栅格(此计算方法，无需逐个经纬度点匹配，大大减少了计算量，如果栅格ID以几个顶点经纬度组合命名，可直接推导出栅格ID)。

(112)定位是否属于某个相同属性的子栅格

找出此栅格内所有相同属性的子栅格

逐个计算该数据点是否在此子栅格区域内(网上很多方法计算某个点是否在一个封闭区域内，可参加使用)，最终找出所属子栅格。

(12)属性匹配、栅格位置拓展后匹配

某属性的数据点，如果根据经纬度落点到同属性的栅格扩展后的范围内，也可认为落点匹配成功，此选项可适当增加建库数据量。

具体实施步骤：

(121)计算数据点归属栅格

(122)定位是否某个属于相同属性的子栅格

(123)找出归属的拓展后子栅格

计算数据点与所有同属性子栅格所有边界点的距离，设为A，找出A<设定的拓展距离的所有边界点，选择最小的A，找出对应的边界点归属的子栅格，模糊认为A数据点属于此子栅格的拓展范围；

如没有A<设定的拓展距离的所有边界点，可认为此数据点匹配失败。

(13)属性匹配、位置就近匹配(一定范围内)

某属性的数据点，根据设定的合理范围，将此数据点落点到同属性的最近栅格的范围内，也可认为落点匹配成功，此选项可进一步增加建库数据量。

实施步骤：

(131)计算数据点归属栅格

(132)找出此栅格一定范围内的周边所有栅格

因栅格的长、宽固定，可根据此栅格的几个顶点推测出来周边的栅格；

(133)定位是否某个属于相同属性的子栅格

(134)上一步如果未匹配成功，则找出以上两步所有栅格的相同属性子栅格

(135)找出最近位置的子栅格

计算数据点与上一步找出的子栅格的每个边界点的距离，找出最近的边界点，即认为此数据点归属此子栅格。

(2)选择落点匹配失败数据的处理规则

(21)直接抛弃

适用于数据量较多时，只选择精准数据落点建库，其他数据直接抛弃，尽量避免错误信息干扰。

具体处理为：直接将未匹配的数据抛弃。

(22)不考虑属性，只用位置匹配

对数据点与栅格的属性不做要求，直接根据数据点的位置落点匹配对应的子栅格。

具体实施步骤：

(221)计算数据点归属栅格；

(222)定位数据点是否属于某个子栅格；

(23)就近落点同栅格内固定属性子区域

在落点时指定落点到位置所在栅格的某类子区域。

具体实施步骤：

(231)计算数据点归属栅格

(232)找出此栅格中的指定属性子栅格

如果指定属性子栅格只有一个，将数据直接归属此子栅格；

如果指定属性子栅格有多个，选择就近原则落入，相关方法上文已经提过，不在赘述。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于属性匹配的数据落点到栅格的方法，其特征在于，包括以下步骤：

(1)将道路用户识别出来并进行分类；

(2)将室内用户识别出来；

2.根据权利要求1所述的一种基于属性匹配的数据落点到栅格的方法，其特征在于，所述步骤(1)中，具体过程如下：

(12)根据合理值，剔除经纬度不合理的异常数据；

3.根据权利要求2所述的一种基于属性匹配的数据落点到栅格的方法，其特征在于，所述步骤(1)还包括：

(16)找出上述用户中速度为零的时间段内的相关信息；

(17)剔除使用室内小区的记录，然后计算信号稳定度；

4.根据权利要求3所述的一种基于属性匹配的数据落点到栅格的方法，其特征在于，所述步骤(1)还包括：

5.根据权利要求1所述的一种基于属性匹配的数据落点到栅格的方法，其特征在于，所述步骤(2)具体如下：

(21)用户使用室分小区信号时，认定用户在室内；

6.根据权利要求5所述的一种基于属性匹配的数据落点到栅格的方法，其特征在于，所述差异数据分界线具体划分方法如下：

7.根据权利要求1所述的一种基于属性匹配的数据落点到栅格的方法，其特征在于，所述步骤(3)具体过程如下：

(31)设定待划分地图区域的栅格尺寸；

(34)根据新的封闭区域边界数据，计算出交叉子区域；

(37)汇总可得所有室内属性的子区域和道路属性的子区域。

8.根据权利要求1所述的一种基于属性匹配的数据落点到栅格的方法，其特征在于，所述步骤(4)中，根据经纬度落点进行匹配的规则如下：

对于位置和属性的完全匹配：

对于属性匹配、栅格位置拓展后匹配：

对于属性匹配、位置就近匹配：

9.根据权利要求8所述的一种基于属性匹配的数据落点到栅格的方法，其特征在于，所述步骤(4)中，选择落点匹配失败数据的处理规则：

10.一种基于属性匹配的数据落点到栅格的装置，其特征在于，包括：

室内用户识别分类模块，用于将室内用户识别出来；