CN110851547A - 一种多数据源地图数据融合方法 - Google Patents
一种多数据源地图数据融合方法 Download PDFInfo
- Publication number
- CN110851547A CN110851547A CN201910961470.7A CN201910961470A CN110851547A CN 110851547 A CN110851547 A CN 110851547A CN 201910961470 A CN201910961470 A CN 201910961470A CN 110851547 A CN110851547 A CN 110851547A
- Authority
- CN
- China
- Prior art keywords
- data
- name
- distance
- key point
- data source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Computational Linguistics (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明提供了一种多数据源地图数据融合方法,包括转换坐标系:将数据源A和数据源B的关键点集合的坐标转换为相同坐标系;计算距离:计算数据源A和数据源B中任意两个关键点的距离D;计算名称相似度;合并数据:首先判断名称相似度γ的范围和距离D的范围;当名称相似度γ和距离D在范围内,确认新生关键点的坐标和名称;否则保留关键点的原始坐标和名称;最后得到融合后的关键点数据库。可批量进行多个地图数据源的关键点数据融合,使得融合后的地图数据更加全面,取各家地图数据之所长,提升地图数据的覆盖范围,有助于与地图相关的服务类应用和数据分析产品的质量提升。
Description
技术领域
本发明涉及数据融合领域,具体提供一种多数据源地图数据融合方法。
背景技术
随着基于位置的服务LBS(Location Based Service)等业务的发展,美团、滴滴等移动生活服务巨头崛起,它们的业务都离不开精准的地图数据,地图数据的全面性越来越重要。
当前市场上地图数据有多个来源,如高德、百度、腾讯等大的地图公司,它们的数据各有长处和短处,如业内认知百度在城市区域数据优于高德,而高德在偏远地区优于百度,两者都具有开放平台,可以使用坐标采用逆地理API接口从开放平台请求周边关键点(Point of Interest,POI)数据,但如何通过采各家所长,融合生成更加完成全面的地图数据,是现阶段研究的核心问题。
现有专利CN109059948A公开了高德地图与交通行业数据融合的方法,包括:步骤一:获取高德及行业数据;步骤二:对行业异常数据进行处理;步骤三:将行业桩号转换为经纬度;步骤四:对设施进行分类,包括桥梁、隧道、收费站、互通立交、服务区;步骤五:依次选取高德每个设施;步骤六:查找同一条路线上最近的行业设施;步骤七:判断同一条路线最近设施是否超过500米,超过执行步骤八,未超过执行步骤九;步骤八:通知行业单位补充基础数据;步骤九:将查询的结果与高德选中设施进行关联。该发明主要实现提升行业管理水平。现有专利CN102446188A公开了一种业务信息关联方法,包括:调用包括电子地图、坐标数据、地理信息数据地理信息系统GIS,电子地图上的每一个地图单元对应一个坐标数据和一组地理信息数据;在该GIS的电子地图上标注交通关键点,建立相连通的交通关键点之间的关联;将交通关键点保存到一关键点数据库中,交通关键点在该关键点数据库中的保存位置映射到地理信息数据中;将相连通的交通关键点之间的关联保存在关联数据库中,每一关联包括通过该关联而连通的两个交通关键点以及该两个交通关键点之间的关联方式,每一个关联在关联数据库中的保存位置分别映射到该关联的两个交通关键点对应的地图单元的地理信息数据中。
发明内容
基于现有各家地图数据的缺陷,本发明提出了一种多数据源地图数据融合方法,旨在通过将多地图数据进行融合,得到更加全面的地图关键点数据。具体采用如下技术方案:
一种多数据源地图数据融合的方法,具体包括以下步骤:
S1、转换坐标系:将数据源A和数据源B的关键点集合的坐标转换为相同坐标系;
S2、计算距离:计算数据源A和数据源B中任意两个关键点的距离D;
S3、计算名称相似度:包括以下步骤
S31、计算步骤S2中所述任意两个关键点的字符数,得到字符数a和字符数b;
S32、计算字符数a和字符数b中的相同字符数c;
S33、取字符数a和字符数b中较小的字符数,用c除以较小的字符数,便得到任意两个关键点的名称相似度γ;
S4、合并数据:首先判断所述步骤S3中名称相似度γ的范围和距离D的范围;当名称相似度γ和距离D在范围内,确认新生关键点的坐标和名称;否则保留关键点的原始坐标和名称;最后得到融合后的关键点数据库。
具体地,所述数据源A和数据源B分别包含若干个关键点的数据,该数据包含名称和坐标。
具体地,所述步骤S1中相同坐标系包括WGS84、GCJ-02、BD09中的任一种。
具体地,所述步骤S2中距离D采用欧式距离计算方法:
其中,x1和y1为数据源A中任一点的坐标,x2和y2为数据源B中任一点的坐标,λ为经纬度和距离转换常数,取111.1千米/度。
具体地,所述步骤S3中任意两个关键点的距离D小于300m。
具体地,当所述步骤S4中名称相似度γ=100%时,取任意两个关键点坐标位置的平均值作为新生关键点的坐标;取任意两个关键点中某一个关键点的名称作为新生关键点的名称。
具体地,当所述步骤S4中名称相似度80%≤γ<100%时,且距离D小于10m,取任意两个关键点坐标位置的平均值作为新生关键点的坐标;将字符数a和字符数b中较大的字符数对应的名称作为新生关键点的名称。
具体地,当所述步骤S4中名称相似度50%≤γ<80%时,且距离D小于5m,取任意两个关键点坐标位置的平均值作为新生关键点的坐标;将字符数a和字符数b中较大的字符数对应的名称作为新生关键点的名称。
具体地,当所述步骤S4中距离D小于2m时,取任意两个关键点坐标位置的平均值作为新生关键点的坐标;将字符数a和字符数b中较大的字符数对应的名称作为新生关键点的名称。
本发明具有以下有益效果:
本发明提供的多数据源地图数据融合方法,可批量进行多个地图数据源的关键点数据融合,使得融合后的地图数据更加全面,取各家地图数据之所长,提升地图数据的覆盖范围,有助于与地图相关的服务类应用和数据分析产品的质量提升。
具体实施方式
实施例1
一种多数据源地图数据融合的方法,具体包括以下步骤:
S1、转换坐标系:将数据源A和数据源B的关键点集合的坐标转换为相同坐标系,如WGS84、GCJ-02、BD09中的任一种;数据源A和数据源B分别包含若干个关键点的数据,该数据包含名称和坐标;
S2、计算距离:计算数据源A和数据源B中任意两个关键点的距离D;采用欧式距离计算方法:
其中,x1和y1为数据源A中任一点的坐标,x2和y2为数据源B中任一点的坐标,λ为经纬度和距离转换常数,取111.1千米/度。
S3、计算名称相似度:包括以下步骤
S31、计算步骤S2中距离D小于300m的任意两个关键点POI-A和POI-B的字符数,分别得到字符数a和字符数b;
S32、计算字符数a和字符数b中的相同字符数c;
S33、取字符数a和字符数b中较小的字符数,用c除以较小的字符数,便得到任意两个关键点的名称相似度γ;
S4、合并数据:包括以下情况:
当名称相似度γ=100%时,取POI-A和POI-B坐标位置的平均值作为新生关键点POI-NEW的坐标;取POI-A或POI-B的名称作为新生关键点POI-NEW的名称。
当名称相似度80%≤γ<100%时,且距离D小于10m,取POI-A和POI-B坐标位置的平均值作为新生关键点POI-NEW的坐标;将字符数a和字符数b中较大的字符数对应的名称作为新生关键点POI-NEW的名称。
当名称相似度50%≤γ<80%时,且距离D小于5m,取POI-A和POI-B坐标位置的平均值作为新生关键点POI-NEW的坐标;将字符数a和字符数b中较大的字符数对应的名称作为新生关键点POI-NEW的名称。
当距离D小于2m时,取POI-A和POI-B坐标位置的平均值作为新生关键点POI-NEW的坐标;将字符数a和字符数b中较大的字符数对应的名称作为新生关键点POI-NEW的名称。
剩余数据源A和数据源B的关键点数据都进行保留,最终得到融合后的关键点数据库。
上述详细说明是针对本发明其中之一可行实施例的具体说明,该实施例并非用以限制本发明的专利范围,凡未脱离本发明所为的等效实施或变更,均应包含于本发明技术方案的范围内。
Claims (10)
1.一种多数据源地图数据融合方法,包括以下步骤:
S1、转换坐标系:将数据源A和数据源B的关键点集合的坐标转换为相同坐标系;
S2、计算距离:计算数据源A和数据源B中任意两个关键点的距离D;
S3、计算名称相似度:包括以下步骤
S31、计算步骤S2中所述任意两个关键点的字符数,得到字符数a和字符数b;
S32、计算字符数a和字符数b中的相同字符数c;
S33、取字符数a和字符数b中较小的字符数,用c除以较小的字符数,便得到任意两个关键点的名称相似度γ;
S4、合并数据:首先判断所述步骤S3中名称相似度γ的范围和距离D的范围;当名称相似度γ和距离D在范围内,确认新生关键点的坐标和名称;否则保留关键点的原始坐标和名称;最后得到融合后的关键点数据库。
2.根据权利要求1所述的一种多数据源地图数据融合方法,其特征在于,所述数据源A和数据源B分别包含若干个关键点的数据,该数据包含名称和坐标。
3.根据权利要求1所述的一种多数据源地图数据融合方法,其特征在于,所述步骤S1中相同坐标系包括WGS84、GCJ-02、BD09中的任一种。
5.根据权利要求4所述的一种多数据源地图数据融合方法,其特征在于,,所述λ取111.1千米/度。
6.根据权利要求1所述的一种多数据源地图数据融合方法,其特征在于,所述步骤S3中任意两个关键点的距离D小于300m。
7.根据权利要求1所述的一种多数据源地图数据融合方法,其特征在于,当所述步骤S4中名称相似度γ=100%时,取任意两个关键点坐标位置的平均值作为新生关键点的坐标;取任意两个关键点中某一个关键点的名称作为新生关键点的名称。
8.根据权利要求1所述的一种多数据源地图数据融合方法,其特征在于,当所述步骤S4中名称相似度80%≤γ<100%时,且距离D小于10m,取任意两个关键点坐标位置的平均值作为新生关键点的坐标;将字符数a和字符数b中较大的字符数对应的名称作为新生关键点的名称。
9.根据权利要求1所述的一种多数据源地图数据融合方法,其特征在于,当所述步骤S4中名称相似度50%≤γ<80%时,且距离D小于5m,取任意两个关键点坐标位置的平均值作为新生关键点的坐标;将字符数a和字符数b中较大的字符数对应的名称作为新生关键点的名称。
10.根据权利要求1所述的一种多数据源地图数据融合方法,其特征在于,当所述步骤S4中距离D小于2m时,取任意两个关键点坐标位置的平均值作为新生关键点的坐标;将字符数a和字符数b中较大的字符数对应的名称作为新生关键点的名称。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910961470.7A CN110851547A (zh) | 2019-10-11 | 2019-10-11 | 一种多数据源地图数据融合方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910961470.7A CN110851547A (zh) | 2019-10-11 | 2019-10-11 | 一种多数据源地图数据融合方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110851547A true CN110851547A (zh) | 2020-02-28 |
Family
ID=69597182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910961470.7A Pending CN110851547A (zh) | 2019-10-11 | 2019-10-11 | 一种多数据源地图数据融合方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110851547A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111503524A (zh) * | 2020-04-28 | 2020-08-07 | 深圳市爱路恩济能源技术有限公司 | 一种匹配城市燃气用户和调压箱的方法 |
CN113901168A (zh) * | 2021-12-10 | 2022-01-07 | 中冶智诚(武汉)工程技术有限公司 | 一种基于互联网地图平台的自有数据扩展融合方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102789467A (zh) * | 2011-05-20 | 2012-11-21 | 腾讯科技(深圳)有限公司 | 一种数据融合的方法、装置及数据处理系统 |
CN104699818A (zh) * | 2015-03-25 | 2015-06-10 | 武汉大学 | 一种多源异构的多属性poi融合方法 |
US20180014161A1 (en) * | 2016-06-10 | 2018-01-11 | Apple Inc. | Harvesting labels for significant locations |
CN108345609A (zh) * | 2017-01-24 | 2018-07-31 | 腾讯科技(深圳)有限公司 | 一种处理poi信息的方法和装置 |
CN109284446A (zh) * | 2018-08-01 | 2019-01-29 | 昆明理工大学 | 一种poi信息融合方法 |
CN110020224A (zh) * | 2017-12-28 | 2019-07-16 | 中国移动通信集团辽宁有限公司 | 地图兴趣点数据的关联方法、装置、设备及介质 |
CN110110017A (zh) * | 2018-01-25 | 2019-08-09 | 阿里巴巴集团控股有限公司 | 一种兴趣点数据关联方法、装置及服务器 |
-
2019
- 2019-10-11 CN CN201910961470.7A patent/CN110851547A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102789467A (zh) * | 2011-05-20 | 2012-11-21 | 腾讯科技(深圳)有限公司 | 一种数据融合的方法、装置及数据处理系统 |
CN104699818A (zh) * | 2015-03-25 | 2015-06-10 | 武汉大学 | 一种多源异构的多属性poi融合方法 |
US20180014161A1 (en) * | 2016-06-10 | 2018-01-11 | Apple Inc. | Harvesting labels for significant locations |
CN108345609A (zh) * | 2017-01-24 | 2018-07-31 | 腾讯科技(深圳)有限公司 | 一种处理poi信息的方法和装置 |
CN110020224A (zh) * | 2017-12-28 | 2019-07-16 | 中国移动通信集团辽宁有限公司 | 地图兴趣点数据的关联方法、装置、设备及介质 |
CN110110017A (zh) * | 2018-01-25 | 2019-08-09 | 阿里巴巴集团控股有限公司 | 一种兴趣点数据关联方法、装置及服务器 |
CN109284446A (zh) * | 2018-08-01 | 2019-01-29 | 昆明理工大学 | 一种poi信息融合方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111503524A (zh) * | 2020-04-28 | 2020-08-07 | 深圳市爱路恩济能源技术有限公司 | 一种匹配城市燃气用户和调压箱的方法 |
CN113901168A (zh) * | 2021-12-10 | 2022-01-07 | 中冶智诚(武汉)工程技术有限公司 | 一种基于互联网地图平台的自有数据扩展融合方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112133090A (zh) | 一种基于手机信令数据的多方式交通分布模型构建方法 | |
CN108181607B (zh) | 基于指纹库的定位方法、装置及计算机可读存储介质 | |
CN102097004B (zh) | 一种基于手机定位数据的出行od矩阵获取方法 | |
CN107316098B (zh) | 一种基于用户行为分析的汽车租赁点选址方法 | |
CN109688532B (zh) | 一种划分城市功能区域的方法及装置 | |
CN107421555B (zh) | 确定导航路径的方法和装置 | |
CN110880238B (zh) | 一种基于手机通信大数据的道路拥堵监测方法 | |
EP2325606A2 (en) | Method for identifying a candidate part of a map to be updated | |
CN104951865A (zh) | 一种基于电网gis的物资调拨追踪方法及系统 | |
CN110851547A (zh) | 一种多数据源地图数据融合方法 | |
CN104573014A (zh) | 社区网格信息处理方法和系统 | |
CN112118548A (zh) | 一种大数据识别常住人口与流动人口的方法和存储设备 | |
Shi | Research on accessibility and equity of urban transport based on multisource big data | |
CN115714957A (zh) | 基于手机信令的地铁出行识别方法、装置、设备及介质 | |
CN110689180A (zh) | 一种基于地理位置的智能路线规划方法及系统 | |
CN102869021B (zh) | 利用地理信息系统搜索覆盖区基站的方法及装置 | |
CN104715050B (zh) | 路线推荐方法及系统 | |
CN116975785B (zh) | 一种基于cim模型的多源异构数据融合分析方法及系统 | |
Zhou et al. | Village-town system in suburban areas based on cellphone signaling mining and network hierarchy structure analysis | |
CN108900978B (zh) | 一种基于移动终端信令数据的城市主干道路连接方法 | |
CN108021638A (zh) | 一种离线地理编码非结构化地址解析系统 | |
CN108712719B (zh) | 基于终端信令大数据的交通等时线获取方法和系统 | |
CN114141008B (zh) | 一种基于手机信令数据的共享公共交通服务区域选取方法 | |
CN114885369A (zh) | 网络覆盖质量检测处理方法、装置、电子设备和存储介质 | |
CN110442660B (zh) | 一种用于智能公交系统的公交线网长度计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220715 Address after: 201204 room 1801b, No. 1155, Fangdian Road, Pudong New Area, Shanghai Applicant after: Zhonghaifu Information Technology Co.,Ltd. Address before: 200131 room 8-26, floor 8, building 2, No. 115, futexi 1st Road, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai Applicant before: Shanghai Zhonghuan Energy Technology Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200228 |