CN112380311B - 一种基于行程轨迹的poi识别方法 - Google Patents
一种基于行程轨迹的poi识别方法 Download PDFInfo
- Publication number
- CN112380311B CN112380311B CN202011364377.7A CN202011364377A CN112380311B CN 112380311 B CN112380311 B CN 112380311B CN 202011364377 A CN202011364377 A CN 202011364377A CN 112380311 B CN112380311 B CN 112380311B
- Authority
- CN
- China
- Prior art keywords
- data
- travel
- journey
- longitude
- latitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 230000002159 abnormal effect Effects 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 230000002093 peripheral effect Effects 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Navigation (AREA)
Abstract
本发明公开了一种基于行程轨迹的POI识别方法,包括行程数据的获取;行程数据的预处理;根据行程轨迹对行程定位数据进行时变加权平均;根据时变加权计算得到的经纬度信息进行POI识别。本发明的有益效果是:本发明通过对用户行程的整个轨迹数据综合考虑,通过对定位数据进行时变的加权平均,可有效识别行程开始和行程结束时用户所处的位置,进而实现用户所处位置周边范围内POI信息的准确获取。
Description
技术领域
本发明涉及一种POI识别方法,具体为一种基于行程轨迹的POI识别方法,属于用户识别技术领域。
背景技术
POI(point of information)信息点是指人们感兴趣的地理实体,如停车场、加油站、咖啡厅、餐馆、商场、游乐园等,包括名称、类别、经度和纬度等四类信息。随着移动业务的广泛普及,基于POI信息的业务层出不穷且几乎存在于人们日常生活的方方面面,而POI的高质量识别依赖于业务主体位置的精准定位,但是卫星定位数据的单点漂移问题仍然严重,基于此,本申请提出一种基于行程轨迹的POI识别方法。
发明内容
本发明的目的就在于为了解决问题而提供一种基于行程轨迹的POI识别方法,通过对手机用户行程开始和行程结束的数据进行滑窗处理,结合行程轨迹的时效性做位置信息的衰减加权,可显著降低卫星定位数据的单点漂移问题,有效提高行程开始和行程结束时的经度和纬度信息这些实时位置信息的精准度,从而为准确识别相应位置周边的POI信息提供坚实的支撑。
本发明通过以下技术方案来实现上述目的:一种基于行程轨迹的POI识别方法,包括以下步骤:
步骤一、行程数据的获取;
步骤二、行程数据的预处理;
步骤三、行程数据中定位数据的时变加权平均;
步骤四、根据加权计算后的经纬度信息进行POI识别。
作为本发明再进一步的方案:所述步骤一中,获取的行程数据包括:基于智能手机获取的用户的卫星定位数据,包括卫星定位纬度、卫星定位经度、卫星定位时间、卫星定位精度、卫星数等。
作为本发明再进一步的方案:所述步骤二中,行程数据的预处理包括:
A.获取行程数据中行程开始后的N条数据的数据集DB,和行程数据中行程结束前的N条数据的数据集DE;
B.去除数据集DB和数据集DE中经度和纬度信息为空的数据;
C.根据分位数异常值检测方法,分别对数据集DB和数据集DE进行异常值监测。异常值通过IQR(Inter Quartile Range)计算得到,清除DB和DE中的异常值后得到数据集DBR和数据集DER。
作为本发明再进一步的方案:所述步骤三中,根据行程轨迹对行程定位数据进行时变加权平均包括:
假定样本集D={x1,x2,...,xm}包含m个行程点样本,每个样本xi=(xi1;xi2;...;xin)是一个n维向量。每个样本为包括xi1经度和xi2纬度这两个位置信息的位置向量。这里设置时间衰减系数为r(r<=1)。
D.行程数据中的行程开始时的轨迹数据,进一步包括:
按照行程轨迹,取行程开始位置的前N个行程点,当计算行程开始处的位置时,越靠前的位置数据越重要。则开始位置经纬度计算的加权公式为:
E.行程数据中的行程结束时的轨迹数据。进一步包括:
按照行程轨迹,取行程结束位置的后N个行程点,当计算行程结束处的位置时,越靠后的位置数据越重要。则结束位置经纬度计算的加权公式为:
作为本发明再进一步的方案:所述步骤四中,根据时变加权计算后得到的经纬度信息进行POI识别包括:
根据计算获得行程开始位置和行程结束位置的经纬度信息,调用高德地图或者百度地图或者数据库存储的其他商户和企业信息,分析得到行程开始位置和行程结束位置周边的POI信息,基于准确的经纬度数据获取的该位置周边的POI统计和分类信息。
本发明的有益效果是:该基于行程轨迹的POI识别方法设计合理,基于行程滑动窗口的机制,在行程异常点数据清除后,使用某时点附近位置的多个经纬度数据,综合获得该时点处的位置信息,降低了卫星数据单点飘移产生的影响。进一步地,本发明充分考虑了行程的轨迹,采用时间衰减加权的方式进行时点位置的计算,较之于传统的滑窗平均加权处理方式,对位置信息的定位更加精准和更加符合业务定义。进一步地,基于行程轨迹计算得到的经纬度信息获取的该位置周边的POI信息也就更加准确,既提高了基于位置的商户推荐的质量,又大大提升了用户体验和满意度,增强了用户对基于POI信息类产品的粘性。
附图说明
图1为本发明整体流程示意图;
图2为本发明针对行程数据预处理的流程示意图;
图3为本发明针对行程数据根据行程轨迹进行时间衰减的加权计算过程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1~3,一种基于行程轨迹的POI识别方法,包括以下步骤:
步骤S10,行程数据的获取。
在本实施例中,所述行程数据指:基于智能手机获得的卫星定位数据,包括卫星定位纬度、卫星定位经度、卫星定位时间、卫星定位精度、卫星数等。这些数据可以通过手机APP在系统后端进行获取。
步骤S20,行程数据预处理。
在本实例中步骤S2001-S2004为行程数据的清洗过程,所述方法包含如下步骤:
S2001:根据滑动窗口的大小抽取行程起始位置和行程结束位置各N个时间点的经纬度等位置信息。
S2002:判断位置信息中的经纬度数据是否有空值,如果有则删除该条位置信息。
S2003:根据分位数异常值检测方法IQR判断位置信息中是否存在异常值,如果有则删除该条位置信息。
S2004:判断经过清洗后的数据量是否大于某一个设定的阈值,如果不满足则将N值增加,转到步骤S2001,否则,则继续向下执行步骤S30。最终得到符合统计需求的行程开始点和行程结束点最相邻的位置信息。
步骤S30,行程数据中定位数据的时变加权平均。
经过步骤S20处理后的行程开始时和行程结束时的位置信息进入步骤S30。在本实施例中步骤S3001-S3002为行程位置信息按照行程轨迹进行的时变加权步骤。
S3001:根据公式1对行程开始时经过清理后的经度和纬度数据进行加权,越接近行程开始时的时点数据权重越大,最终获得行程开始时的经度和纬度的综合计算值。具体的权重可以采用根据车速和道路的状况进行测试计算后获得的经验值。
S3002:根据公式2对行程开始时经过清理后的经度和纬度数据进行加权,越接近行程结束时的时点数据权重越大,最终获得行程结束时的经度和纬度的综合计算值。具体的权重可以采用根据车速和道路的状况进行测试计算后获得的经验值。
步骤S40,根据加权计算后的经纬度信息进行POI识别。
经过步骤S30计算后获得的行程开始时和行程结束时的经度和纬度信息进入步骤S40。在本实施例中,所述方法包含如下步骤:
S4001:根据计算获得的经度和纬度信息,获取此位置半径为R(可设置)的周边的POI信息。
S4002:对获取的POI信息进行排序归类,展示给用户,或者提供给汽车4S店、商场、修理厂、加油站、餐饮等业务提供方进行业务的精准推荐。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (3)
1.一种基于行程轨迹的POI识别方法,其特征在于:包括以下步骤:
步骤一、行程数据的获取;
步骤二、行程数据的预处理;
所述步骤二中,行程数据的预处理包括:
A.获取行程数据中行程开始后的N条数据的数据集DB,和行程数据中行程结束前的N条数据的数据集DE;
B.去除数据集DB和数据集DE中经度和纬度信息为空的数据;
C.根据分位数异常值检测方法,分别对数据集DB和数据集DE进行异常值监测,异常值通过IQR计算得到,清除DB和DE中的异常值后得到数据集DBR和数据集DER;
步骤三、行程数据中定位数据的时变加权平均;
所述步骤三中,根据行程轨迹对行程定位数据进行时变加权平均包括:
假定样本集D={x1,x2,...,xm}包含m个行程点样本,每个样本xi=(xi1;xi2;...;xin)是一个n维向量;
每个样本为包括xi1经度和xi2纬度这两个位置信息的位置向量,这里设置时间衰减系数为r,r≤1;
D.行程数据中的行程开始时的轨迹数据,进一步包括:
按照行程轨迹,取行程开始位置的前N个行程点,当计算行程开始处的位置时,越靠前的位置数据越重要,则开始位置经纬度计算的加权公式为:
E.行程数据中的行程结束时的轨迹数据,进一步包括:
按照行程轨迹,取行程结束位置的后N个行程点,当计算行程结束处的位置时,越靠后的位置数据越重要,则结束位置经纬度计算的加权公式为:
步骤四、根据加权计算后的经纬度信息进行POI识别。
2.根据权利要求1所述的一种基于行程轨迹的POI识别方法,其特征在于:所述步骤一中,获取的行程数据包括:基于智能手机获取的用户的卫星定位数据,包括卫星定位纬度、卫星定位经度、卫星定位时间、卫星定位精度、卫星数。
3.根据权利要求1所述的一种基于行程轨迹的POI识别方法,其特征在于:所述步骤四中,根据时变加权计算后得到的经纬度信息进行POI识别包括:
根据计算获得行程开始位置和行程结束位置的经纬度信息,调用高德地图或者百度地图或者数据库存储的其他商户和企业信息,分析得到行程开始位置和行程结束位置周边的POI信息,基于准确的经纬度数据获取的该位置周边的POI统计和分类信息,便于业务的精准推荐,既提高了商户推荐的质量,又大大提升了用户体验,增强了用户对基于位置的业务产品的粘性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011364377.7A CN112380311B (zh) | 2020-11-27 | 2020-11-27 | 一种基于行程轨迹的poi识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011364377.7A CN112380311B (zh) | 2020-11-27 | 2020-11-27 | 一种基于行程轨迹的poi识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112380311A CN112380311A (zh) | 2021-02-19 |
CN112380311B true CN112380311B (zh) | 2024-04-02 |
Family
ID=74588638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011364377.7A Active CN112380311B (zh) | 2020-11-27 | 2020-11-27 | 一种基于行程轨迹的poi识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112380311B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113761398B (zh) * | 2021-09-17 | 2022-09-06 | 北京百度网讯科技有限公司 | 信息推荐方法、装置、电子设备以及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102332210A (zh) * | 2011-08-04 | 2012-01-25 | 东南大学 | 基于手机定位数据的实时城市道路交通流数据提取方法 |
CN102722541A (zh) * | 2012-05-23 | 2012-10-10 | 中国科学院计算技术研究所 | 一种时空轨迹相似度计算方法及系统 |
CN107730115A (zh) * | 2017-10-17 | 2018-02-23 | 云南大学 | 一种基于ahp的多源位置轨迹数据的质量评估方法 |
CN109815993A (zh) * | 2019-01-03 | 2019-05-28 | 西北大学 | 基于gps轨迹的区域特征提取、数据库建立及路口识别方法 |
CN110100155A (zh) * | 2016-10-24 | 2019-08-06 | 应美盛股份有限公司 | 用于全局形状匹配轨迹的方法和系统 |
CN110516708A (zh) * | 2019-07-23 | 2019-11-29 | 江苏大学 | 一种基于轨迹与路网匹配的路径预测方法 |
CN111078805A (zh) * | 2019-09-26 | 2020-04-28 | 深圳市东深电子股份有限公司 | 一种河长巡查轨迹有效性判断方法 |
CN111461200A (zh) * | 2020-03-30 | 2020-07-28 | 科大讯飞股份有限公司 | 一种事件的提醒方法、装置、电子设备及计算机可读存储介质 |
CN111474565A (zh) * | 2020-05-20 | 2020-07-31 | 上海评驾科技有限公司 | 道路运输车辆卫星定位系统终端违规插拔情况的判断方法 |
CN111598347A (zh) * | 2020-05-20 | 2020-08-28 | 上海评驾科技有限公司 | 一种道路运输车辆超长行程切分优化方法 |
-
2020
- 2020-11-27 CN CN202011364377.7A patent/CN112380311B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102332210A (zh) * | 2011-08-04 | 2012-01-25 | 东南大学 | 基于手机定位数据的实时城市道路交通流数据提取方法 |
CN102722541A (zh) * | 2012-05-23 | 2012-10-10 | 中国科学院计算技术研究所 | 一种时空轨迹相似度计算方法及系统 |
CN110100155A (zh) * | 2016-10-24 | 2019-08-06 | 应美盛股份有限公司 | 用于全局形状匹配轨迹的方法和系统 |
CN107730115A (zh) * | 2017-10-17 | 2018-02-23 | 云南大学 | 一种基于ahp的多源位置轨迹数据的质量评估方法 |
CN109815993A (zh) * | 2019-01-03 | 2019-05-28 | 西北大学 | 基于gps轨迹的区域特征提取、数据库建立及路口识别方法 |
CN110516708A (zh) * | 2019-07-23 | 2019-11-29 | 江苏大学 | 一种基于轨迹与路网匹配的路径预测方法 |
CN111078805A (zh) * | 2019-09-26 | 2020-04-28 | 深圳市东深电子股份有限公司 | 一种河长巡查轨迹有效性判断方法 |
CN111461200A (zh) * | 2020-03-30 | 2020-07-28 | 科大讯飞股份有限公司 | 一种事件的提醒方法、装置、电子设备及计算机可读存储介质 |
CN111474565A (zh) * | 2020-05-20 | 2020-07-31 | 上海评驾科技有限公司 | 道路运输车辆卫星定位系统终端违规插拔情况的判断方法 |
CN111598347A (zh) * | 2020-05-20 | 2020-08-28 | 上海评驾科技有限公司 | 一种道路运输车辆超长行程切分优化方法 |
Non-Patent Citations (2)
Title |
---|
Spatial-Temporal Distance Metric Embedding for Time-Specific POI Recommendation;Ruifeng Ding et al.;《IEEE Access》;2169-3536 * |
基于车辆GPS轨迹和手机信令的地图匹配方法研究;陈继晓;《中国优秀硕士学位论文全文数据库 基础科学辑》;A008-34 * |
Also Published As
Publication number | Publication date |
---|---|
CN112380311A (zh) | 2021-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111144452B (zh) | 一种基于信令数据和聚类算法的移动用户出行链提取方法 | |
CN102682041A (zh) | 用户行为识别设备及方法 | |
CN106203505B (zh) | 一种利用手机定位数据判断用户移动与停留状态的方法 | |
CN112598438A (zh) | 一种基于大规模用户画像的户外广告推荐系统及方法 | |
CN111931998B (zh) | 一种基于移动定位数据的个体出行模式预测方法及系统 | |
CN110889092A (zh) | 一种基于轨道交易数据的短时大型活动周边轨道站点客流量预测方法 | |
CN108415885A (zh) | 基于近邻回归的实时公交客流预测方法 | |
CN112380311B (zh) | 一种基于行程轨迹的poi识别方法 | |
CN111046937A (zh) | 一种融合公交数据和poi数据的两段式乘客人群出行目的分析方法 | |
CN115967950A (zh) | 基于手机信令数据的特征与时序的城际出行模式辨识方法 | |
CN110969861A (zh) | 一种车辆识别方法、装置、设备及计算机存储介质 | |
CN110135216B (zh) | 电子地图中车道数变化区域检测方法、装置及存储设备 | |
Ghorpade et al. | An integrated stop-mode detection algorithm for real world smartphone-based travel survey | |
CN110647929A (zh) | 用于预测出行目的地的方法、及用于训练分类器的方法 | |
CN114501336B (zh) | 一种公路出行量测算方法、装置、电子设备及存储介质 | |
CN114998744A (zh) | 基于运动与视觉双特征融合的农机轨迹田路分割方法 | |
CN110876112B (zh) | 高速用户的识别方法、装置和计算机可读存储介质 | |
CN115988422A (zh) | 基于出行链解析的多层次轨道交通换乘客流提取方法 | |
CN111523614B (zh) | 小区相似判断方法及装置 | |
CN114007186A (zh) | 定位方法及相关产品 | |
CN108874749B (zh) | 一种高考志愿录取概率模型的建立方法 | |
CN110555733A (zh) | 一种基于智能手机的用户行程驾乘识别的方法 | |
CN117851809B (zh) | 一种基于手机信令历史数据强化学习的特征提取方法 | |
CN113674122B (zh) | 一种适用高并发出行数据的城市居民出行规律快速提取方法 | |
CN116233751A (zh) | 一种基于智能手机行程的加权平均自动识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |