CN103838825A - 一种全球地名数据整合与代码编制方法 - Google Patents

一种全球地名数据整合与代码编制方法 Download PDF

Info

Publication number
CN103838825A
CN103838825A CN201410030715.1A CN201410030715A CN103838825A CN 103838825 A CN103838825 A CN 103838825A CN 201410030715 A CN201410030715 A CN 201410030715A CN 103838825 A CN103838825 A CN 103838825A
Authority
CN
China
Prior art keywords
data
name
geographical
geographical name
name data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410030715.1A
Other languages
English (en)
Inventor
倪金生
刘翔
樊军伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING ORIENTAL TITAN TECHNOLOGY CO LTD
Original Assignee
BEIJING ORIENTAL TITAN TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING ORIENTAL TITAN TECHNOLOGY CO LTD filed Critical BEIJING ORIENTAL TITAN TECHNOLOGY CO LTD
Priority to CN201410030715.1A priority Critical patent/CN103838825A/zh
Publication of CN103838825A publication Critical patent/CN103838825A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公布一种全球地名数据整合与代码编制方法,是通过对多渠道获取的GIS地名数据信息整合和统一编码,构建一套全球地名库,国内具体到镇级,国外具体到县市级。针对地名结构的时间特性和空间特性进行设计,提出了一种与传统技术相结合的全球地名数据整合与代码编制方法,该方法的地名数据整合流程包括对多源数据的组织分类,建立层级映射关系,投影变换,数据去重等,不仅能够更全面的完善地名数据信息,还能保证地名数据唯一性、定位准确性、搜索处理快速性。同时,在遵循和继承现有国家地名代码标准的基础上,对搜集的地名数据进行扩充编码,设计合理的数据表结构。本发明具有“数据量大、覆盖范围广、准确度高、编码规范”的特点。

Description

一种全球地名数据整合与代码编制方法
技术领域
本发明通过对不同格式和类型的地名数据分析、搜集来进行全球地名数据的规范整合与统一编码,属于GIS地名服务应用技术领域(属于地图学与地理信息系统领域分支),具体内容涉及到全球地名数据整合制作流程与代码编制方法。 
背景技术
地名是人们赋予客观世界中特定地理实体的代号,是区别某一特定地理实体与其它地理实体的一种标志。地名作为最常用的社会公共信息之一,不仅与人们的日常生活息息相关,而且是国家行政管理、经济建设、国际交往不可或缺的基础信息资源。 
随着社会信息化的快速发展,全球地名信息库的建立已成为大势所趋。当前应迅速建立以计算机为主,结合地图矢量化、扫描等现代化技术的地名信息库,快速实现地名信息数据库系统的地名查询、动态管理、图表文字结合可视化、数字化等高新功能。目前,世界上多数发达国家已经建立了国家级地名数据库,已有100多个大型地名数据库投入使用。美、俄等国不仅重视本国地名数据库的建设与完善,还建立了庞大的世界地名数据库。加拿大、英国等西方国家还建立了互连网上可供查询的地名词典。 
我国的地名档案工作起步较晚,始于1982年。但经过几十年的努力,我国地名管理工作发生巨大改变,从以前的收工管理到现在的电子化管理,有了质的飞跃。特别是从2003年民政部颁发《关于建立地名数据库有关问题的通知》(民办函【2003】53号)以来,全国各省市都加快了当地地名数据库建设的步伐。目前地名数据库建设取得了很大进展,一些地方已经初步建成了本地的地名数据库。据了解,全国已有10个省(区、市)初步完成了省级地名数据库建设,占省级行政单位总数的32%;其它21个省(区、市)已经启动省内各级地名数据库建设,占省级行政单位总数的68%。在全国335个地级行政单位中,已有121个建立了本级地名数据库,占地级行政单位的36%。在全国2862个县级行政单位中,已有913个建立了县级地名数据库,占县级行政单位总数的31%。在此基础上许多地方积极探索,开展了多种形式的地名信息服务。比如:沈阳、南京、长沙、重庆、朝阳等城市开通了地名查询和电话问路热线;全国已建立地方性地名网站48个;设置地名信息触摸屏上百个;制作地名电子地图数十种。各地在地名信息化建设和服务工作中知难而进开拓进取,付出了艰辛的努力,积累了宝贵的经验。数字地名服务的开展得到了人民群众的欢迎和拥护,受到社会各界的肯定和赞誉。 
2005年至2006年,民政部规划地名司、民政部地名研究所和解放军总参测绘信息技术总站联合开发《国家地名数据库管理系统》。该系统是我国首个国家级区划、地名、边界信息综合管理软件平台,用于建立内容完备、现势性强的国家地名数据库。 
目前已经建设完成的各类GIS地名服务系统中有很多是人工定位,查询速度慢、建设成本高,建立全球地名数据库后可以极大提高定位速度,降低人力成本。同时,建立标准的、规范的全球地名库,为后续数据接入、协同标绘、内容整合与热点图文生成提供全球地名数据基础,也能为今后主动服务项目提供地名数据基础,填补国内全球地名数据空白,极大地推动了我国地名数据应用发展。针对以上介绍的工作内容,提出了一种全球地名数据整合与代码编制方法,通过对多渠道获取的GIS地名数据信息整合和统一编码,构建一套全球地名库,国内具体到镇级,国外具体到县市级。 
发明内容
针对现有技术存在的缺陷和国内全球地名数据管理系统空白,本发明提出了一种与传统技术相结合的全球地名数据整合制作流程与代码编制方法;它不仅能够更全面的完善地名数据信息,还能保证地名数据唯一性、定位准确性、搜索处理快速性能。同时,在遵循和继承现有国家标准的基础上,还能够对搜集的全球地名数据进行统一规范、编码,设计合理的数据表结构。最后,该发明能够填补了国内全球地名数据空白,很好地推动了我国地名数据应用发展和主动服务的全面性、高效性。 
本发明采用的技术方案路线如下: 
技术方案实施路线共包含两个部分,分别为数据整合、数据编码。具体的情况如下: 
一、全球地名数据整合 
1.数据源信息搜集,包括互联网站、GIS平台、调研资料、已有基础数据库 
2.搜集服务器存储的基础图层数据和地名数据 
3.数据分类组织 
4.数据转换 
1)投影变换 
2)层级转换 
3)数据结构变换 
4)数据去重 
5.对全球地名数据进行筛选 
6.设计地名层级数据表文件,根据层级数据表文件中Country、Region、City、latitude、longitude等关键属性字段信息,进行必要信息的补充和修订、整合地名数据信息 
二、全球地名数据编码 
1.对整理好的各层级地名数据信息,按照Country、Region、City等区划等级划分,设计相应的层级数据库表,和合理的数据字段结构进行地名库的管理、存储、组织 
2.参考相关国家标准对Country、Region、City等层级地名数据文件,进行分区、分级、分层规范编码 
3.设计全球地名层级数据索引链表,构建地名库 
4.将整合好的全球地名库数据导出,并将数据转换为矢量,进行还原显示在全球行政区划基础图层上 
5.通过快速定位检索验证数据整合与编码质量 
技术方案路线示意图如图1所示。 
全球地名数据整合与代码编制是全球地名库建设的主要工作,本发明关于此项工作的技术突破点主要针对从网络搜索引擎截取、GIS服务平台获取、基础地理图层数据库搜集、以及服务器存储的地名数据进行整合。由于其获取的地名数据形式多样,格式不统一,属性定义不一致,其空间信息表达不同,通过对搜集上来的全球地名数据进行分类及数据转换、代码编制处理,构建比较完整的全球地名词典和地名库,能够为后续的空间数据定位、标绘数据的内容整合以及面向主题和区域的数据挖掘与热点图文生成提供地名基础。 
全球地名库的技术难点主要是全球地名词典的构建,这将是一件十分庞大的工作。针对地名结构的时间特性和空间特性,地名词典的时间特性表现为需要对同一地区在不同时期的地名进行调查,不同地区的相同地名进行区分,即所包含的历史名和重名;地名词典的空间特性则是对地名词典构建的详细程度,而这些均需要实地调查或者是政府部门公示的可信数据。 
因此,本发明提出了一种与传统技术相结合的全球地名数据整合与代码编制方法,基于多数据源的地名数据整合方案,不仅能够更全面的完善地名数据信息,还能保证地名数据唯一性、定位准确性、搜索处理快速性能。同时,在遵循和继承现有国家标准的基础上,还能够对搜集的地名数据进行统一规范、编码,设计合理的数据表结构。最后,该发明能够填补了国内全球地名数据空白,很好地推动了我国地名数据应用发展和主动服务的全面性、高效性。 
依据考核指标的要求,建立一套相对完备的全球地名库,国内具体到乡镇级,国外具体到县市级别。通过建立全球范围内地名分类编码体系,构建全球地名库,对地名进行预处理(标准化、规范化处理),在对检校后的数据入库,最后建立统一的管理系统对全球地名数据进行管理。 
全球地名库的建立不仅为后续主动服务工作提供数据基础,也为今后类似的空间基础地理项目提供关键的基础地名数据索引库,保障基础工作的顺利执行。结合行业需求和应用要求,全球地名库旨在设计一个通用型地名数据库,为相关工作人员提供一个便捷高效的地名入库及其管理系统。该系统提供地名数据和海量空间数据的组织、建库、维护、更新、安全管理、数据发布服务和元数据发布服务等一系列地名及空间数据服务功能,并提供一种更好的地名信息查询和地图定位服务。 
附图说明
图1是全球地名数据整合与编码技术方案路线图; 
图2是中国与美国行政区划映射关系; 
图3是中国与日本行政区划映射关系; 
图4是中国与绝大多数国家行政区划映射关系; 
图5是全球地名编码结构图。 
具体实施方式
一、全球地名数据整合 
1.数据收集 
数据收集方式主要包括来自互联网站的地名文本数据、GIS平台的矢量数据和影像数据、调研资料的历史数据、已有的累积成果基础数据库。其中,通过互联网截取的文本数据信息,不具有空间属性信息,收集的形式以文本记录下来和存储;通过GIS服务平台可获取地名数据的矢量和影像信息,根据平台服务定位功能,进行定位点位置信息收集,其数据收集的主要内容还是指矢量和遥感影像信息,空间属性信息及其他兴趣信息包含在其属性数据表中;调研资料获取的历史数据信息,可能是文本信息,也可能是矢量信息,或者是出版的地图信息等;已有的累积成果基础数据库,是指在现有的历史工作积累中已经存储的地名数据成果。 
2.数据分类组织 
对搜集上来的数据进行分类组织,便于整合,分类的原则按照数据格式进行大类组织,按照几何类型进行小类列举。即:文本、矢量、栅格、数据库表作为一级组织目录,点、线、面描述作为二级目录。 
3.数据转换 
由于搜集上来的地名数据多样、复杂,需要进行转换,将数据规范化、标准化,数据转换主要包括:投影变换,层级转换、数据结构变换、数据去重等四个方面的处理。具体要求和实施情况如下: 
(1)投影变换 
规定投影坐标转为WGS84下的经纬度坐标,不论哪种数据格式或者数据类型,最终整合的地名数据成果都应统一成WGS84下的经纬度表示的坐标点。同时,将地名数据提取为点类型描述信息。 
(2)层级转换 
通过调研大量的行政区划分级标准参考和国内外资料汇集查询可知,国内外行政区划代码分级不一致,且层级名不统一,现在需要建立规范的行政区划层级映射表,将他们统一起来,并一一对应,便于数据的整合分级。国内的行政区划分五级:省、市、县、乡、村;国外行政区划分级差别较大,有的是按照,联邦区和自治州State、郡/县County、市City、镇Town、村Village划分的,有的是按照行政都道府县、市、郡、町、村划分,有的是按照大区Region、省Department、区Arrondissement、县Canton、市镇Commune划分等。综合众多考虑因素和实际取舍情况,大致分了三类层级映射表,分别以美国、日本和绝大多数国家的行政区划分级为例构建的一一对应的层级表。详细情况如下图2、3、4所示,图2、3、4描述的是世界各国的行政区划分级与我国制定的标准行政区划分级的映射关系,根据以上映射关系表信息,可以将搜集的全球地名数据进行规整、归类,建立准确的地名数据层级关系。 
(3)数据结构转换(关键字段信息的保留和扩充) 
搜集上来的地名数据信息,由于其类型各不相同,数据结构可能也不一致。因此,按照设定的数据结构参考标准,通过相应的变换和结构完善修改,将不同类型数据的结构信息补充一致,方便建立完善、统一的数据结构表。 
参考数据表结构信息应该具有以下几个基本字段:地名中文名称、英文名称、经度、纬度、上一级行政区划代码、地名代码、描述信息。 
(4)地名数据质量检查和去重 
1)语义差异性消除 
地理系统的研究对象的多种类特点决定了地理信息的多语义性,对同一地名信息的语义也可有不同的理解,因而会造成语义分歧问题(譬如“同名异物、同物异名”问题)。建立语义本题库,从空间位置和名称上去重,语义性差异的解决更多的要依赖于人工干预,通过建立地名数据的语义映射表来实现。 
2)时空尺度差异性消除 
空间数据的多尺度包括时间多尺度和空间多尺度。在时间尺度上,不同时间的地名数据在地物实体数量、实体内容上是不同的。在空间尺度上,不同比例尺,不同用途的地名其内容对地物实体描述的详细程度也是不 同的。对于这两种尺度差异的消除,采用的原则是:用来整合的空间数据应该具有相同的空间尺度,时间尺度的差异则根据语义定义进行选择、过滤。 
3)坐标体系差异的消除 
不同的部门的地名数据根据各自的要求采用的坐标系不同,因此数据叠加时,会带来偏差。坐标系由于采用的椭球基准不同或者投影方式不同而无法整合到一起,甚至在相同投影方式下,坐标基准不同、中央子午线不同、分带方式不同等,也是造成坐标系之间存在很大的偏差的原因。如果要把数据整合到一起,必须将不同坐标系的坐标通过坐标转换模型转换到同一椭球基准、同一投影方式和分带方式的坐标系中。 
4)数据精度差异的消除 
不同的部门采集的地名数据由于各自的要求不同,在坐标精度、边长精度和面积精度等方面存在差异。数据精度主要取决于地名采集人员的经验水平和坐标数据的精确度,包括坐标点后的小数位数等。以WGS84坐标系为例,地球长半径为6378137米,则仅在纬度方向上,1秒对应的弧长就有几十米,所以,对于大地经纬度坐标,至少精确至秒后的小数1位,保留小数2位。数据精度与坐标体系和空间尺度进行匹配,通过坐标体系和空间尺度的差异性消除进行数据精度差异性的控制。 
5)同名实体表达方式差异的消除 
表现在对同一种地物要素(例如房屋)使用不同的实体类型(线或面)来表达。整合前用不同一实体表示同一地物,通过空间拓扑关系检查进行差异性消除。 
4.创建数据链表 
为将地名信息按照其结构进行设计整合组织处理,并能够有效地管理、检索。整合的地名库表中主要表结构设计如下:建立分区信息、分区索引信息、行政区划信息、地名信息、地名索引信息、分区与政区、地名与行政区划关系7个表。表与表之间都有直接或间接的关联项,为满足查询需要,方便使用,还应建立视图和索引,以及相关字段的数据字典。 
表1 地名信息总表 
表2 地名信息索引表 
中文 英文 字段含义类型长度 描述
地名名称 Place Name 地名名称信息字符50  
 
地名代码 AddCode 用来唯一性标识一条地址记录 字符 18  
地址名称 AddName 标准地址的完整文字信息 字符 200  
地名地址分类码 ClasID 地名类别 字符 6  
X坐标 X 用来表示X坐标 数值型 20  
Y坐标 Y 用来表示y坐标 数值型 20  
表3 行政区划信息表 
中文 英文 字段含义 类型 长度 描述
地名名称 Place Name 地名名称信息 字符 50  
地名代码 AddCode 用来唯一性标识一条地址记录 字符 18  
行政编码 AdmCode 标准地址的完整文字信息 字符 200  
标识编码 IDCode 地名类别 字符 6  
分类编码 ClasID 用来表示X坐标 数值型 20  
流水号码 PID 用来表示y坐标 数值型 20  
表4 地名与行政区划对应关系表 
中文 英文 字段含义 类型 长度 描述
地名名称 Place Name 地名名称信息 字符 50  
地名代码 AddCode 用来唯一性标识一条地址记录 字符 18  
行政编码 AdmCode 标准地址的完整文字信息 字符 200  
X坐标 X 用来表示X坐标 数值型 20  
Y坐标 Y 用来表示y坐标 数值型 20  
表5 分区信息表 
中文 英文 字段含义 类型 长度 描述
分区名称 Cell Name 分区号名称信息 字符 50  
分区编号 CellCode 分区号信息 数值型 20  
行政编码 AdmCode 标准地址的完整文字信息 字符 200  
地名代码 AddCode 用来唯一性标识一条地址记录 字符 18  
X最小坐标 MinX 用来表示区范围X最小坐标 数值型 20  
Y最小坐标 MinY 用来表示区范围y最小坐标 数值型 20  
X最大坐标 MaxX 用来表示区范围X最大坐标 数值型 20  
Y最大坐标 MaxY 用来表示区范围y最大坐标 数值型 20  
表6 分区索引信息表 
中文 英文 字段含义 类型 长度 描述
分区名称 Cell Name 分区号名称信息 字符 50  
分区编号 CellCode 分区号信息 数值型 20  
地名代码 AddCode 用来唯一性标识一条地址记录 字符 18  
X最小坐标 MinX 用来表示区范围X最小坐标 数值型 20  
Y最小坐标 MinY 用来表示区范围y最小坐标 数值型 20  
X最大坐标 MaxX 用来表示区范围X最大坐标 数值型 20  
Y最大坐标 MaxY 用来表示区范围y最大坐标 数值型 20  
表7 分区与政区对应关系表 
中文 英文 字段含义 类型 长度 描述
分区编号 CellCode 分区号信息 数值型 20  
地名代码 AddCode 用来唯一性标识一条地址记录 字符 18  
行政编码 AdmCode 标准地址的完整文字信息 字符 200  
为了提高查询速度和进行特殊处理,在建立数据文件的同时,还需要建立其他一系列的索引链表文件。如:通过主关键字建立属性数据与空间数据的联系;地名主关键字与经纬度对应关系文件;建立部首字库、笔画字库索引文件以实现地名按部首或笔画进行排序等等。 
二、全球地名代码编制 
全球地名代码编制是一个代码重新编排组合的过程,本标准是参考行政区划代码和标志点代码两类大的体系分类共同完成全球地名分类设计编码的,既是对原有国家标准的继承,又是对原有标准的扩充和扩展,拥有完全的自主知识产权。 
全球地名数据库中对于搜集的地名需要进行统一编码,保存到“实体码”属性中,具体实体码编码方法采用30位十进制数字码进行编码,编码的具体内容分别为按数字顺序排列的行政区划码、标识码、分类码和流水号码组合,编码结构见图5: 
1.左起第一至第十六位为行政区划码,可分为三段; 
第一段为左起第一至第四,是大洲或国际公有领域与国家的行政区划代码,具体代码编号见GB/T2659-2000;第五至第十,是县级及县级以上行政区划码,国内地名库部分具体代码见GB/T2260-2007; 
国内部分行政区划数字代码(简称数字码)采用三层六位层次码结构,按层次分别表示我国各省(自治区、直辖市、特别行政区)、市(地区、自治州、盟)、县(自治县、县级市、旗、自治旗、市辖区、林区、特区)。 
第一层即前两位代码表示省、自治区、直辖市、特别行政区。 
第二层即中间两位代码表示市、地区、自治州、盟、直辖市所辖市辖区/县汇总码、省(自治区)直辖县级行政区划汇总码,其中 
(1)01~20、51~70表示市,01、02还用于表示直辖市所辖市辖区、县汇总码; 
(2)21~50表示地区、自治州、盟; 
(3)90表示省(自治区)直辖县级行政区划汇总码。 
第三层即后两位表示县、自治县、县级市、旗、自治旗、市辖区、林区、特区,其中: 
(1)01~20表示市辖区、地区(自治州、盟)辖县级市、市辖特区以及省(自治区)直辖县级行政区划中的县级市,01通常表示市辖区汇总码; 
(2)21~80表示县、自治县、旗、自治旗、林区、地区辖特区 
(3)81~99表示省(自治区)辖县级市。 
为保证数字码的唯一性,因行政区划发生变更而撤销的数字码不再赋予其他行政区划。凡是未经批准,不是国家标准的行政区划单列区、县级单位,代码的第三层即后两位必须设置为以91开始按顺序往下编制。 
第二段为左起第十一位至第十三位,是乡级行政区划码,国内地名库部分的具体编码规则见GB/T10114-2003,其中的第十一位数字为类别标识,以“0”表示街道,“1”表示镇,“2和3”表示乡,“4和5”表示政企合一的单位;其中的第十二位、第十三位数字为该代码段中各行政区划的顺序号。具体划分如下: 
(1)001-099表示街道的代码,应在本地区的范围内由小到大顺序编写; 
(2)100-199表示镇(民族镇)的代码,应在本地区的范围内由小到大顺序编写; 
(3)200-399表示乡(民族乡)的代码,应在本地区的范围内由小到大顺序编写; 
(4)400-599表示政企合一单位的代码,应在本地区的范围内由小到大顺序编写; 
(5)600-699表示开发区等非法定单位代码,应在本地区的范围内由小到大顺序编写; 
(6)999表示省、地、区(县)本级的代码,应在本地区的范围内编写。 
第三段为左起第十四至第十六位,是行政村级行政区划码,其中国内地名库001~199表示社区,200~399表示行政村。 
2.左起第十七位为标识码,“0”为地址,“1”为兴趣点; 
3.左起第十八至第二十三位为分类码,地址的分类码统一用000000标识,兴趣点的分类码见表A.1; 
4.左起第二十四至三十位为流水号码,按照顺序从0000001开始排列,用以区分同一类别并且是同一行政区的地名并进行排序,如果前面编码可以确定此地名的唯一性,则第段代码用0000000表示。 
同时,上述编码方法也参考了DB33/T《浙江省地名地址数据库建库技术规程》。 
列举两类具体代码的编制内容作为概要介绍,具体的的代码编制详见设计。 
1.世界各国和地区名称与行政区划代码 
参照《GB/T2659-2000世界各国和地区名称代码》编制规则,世界各国和地区名称代码编码如下: 
表8 世界各国和地区名称代码 
Figure DEST_PATH_GSB0000124511940000071
2.兴趣点分类代码 
参照《GB/T18521-2001地名分类与类别代码编制规则》,兴趣点地址分类代码用6位阿拉伯数字表示主类、中类、子类3层,前2位阿拉伯数字表示主类,中间2位阿拉伯数字表示中类,后2位阿拉伯数字表示子类,如果中类不细分,则后2位用“0”补齐。 
XX      XX      XX
主类      中类      子类 
参考国内外相关地名库建设标准和设计需求,规定了兴趣点分类与编码,兴趣点分类与编码表如下: 
表9 兴趣点分类与编码表 
Figure DEST_PATH_GSB0000124511940000072
Figure DEST_PATH_GSB0000124511940000081
Figure DEST_PATH_GSB0000124511940000091
综上所述,本发明提供一种全球地名数据整合与代码编制方法,地名数据的内容整合技术根据不同数据来源情况(互联网站、GIS服务平台、调研资料、成果基础数据库)、不同地名数据类型(文本数据、矢量数据和影像数据、历史资料、基础数据库表)进行全球地名数据的自动/半自动整合。分析不同应用类型地名数据的自身特点,进行源数据信息分析、提取、转换工作,建立数据整合流程标准和质量控制体系(容错率和正确率),突破数据源之间标准的差异以及异常数据控制,实现面向实际应用的多尺度空间数据整合。发明的技术难点和突破主要是全球地名数据内容的差异性消除和内容整合,以及代码编码编制流程的确立。地名数据内容的差异性消除主要是通过语义差异性消除、时空尺度差异消除、坐标体系差异消除、数据精度差异消除以及同名实体表达方式差异消除来解决,从而保证数据的正确性;数据内容整合流程的确立首先是通过数据组织分类,将多源数据规整,然后进行统一的数据投影变换,建立层级映射关系库,声明地名数据库内数据映射规则,通过数据校验进行过滤,再对数据项进行逻辑整合,生成准确的层级目录,并对数据结构进行统一的规范,生成派生数据项,依据类别、数据来源以及接近数据的真实性等的原则进行数据的容错管理,最终对空间地名数据的拓扑关系进行整合,并对其进行编码,完善和补充地名数据信息,为后续主动服务项目的空间知识服务以及标绘数据的唯一性和正确性做保证。 
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应该是本发明的保护范围。 

Claims (2)

1.全球地名数据整合制作流程:全球地名数据具体包括文本数据,空间栅格数据、矢量数据,以及调研资料和数据库表数据;其中,文本数据是不具有空间属性和具有空间属性的两类文本数据;空间矢量数据为具有颜色、形状、轮廓和空间位置属性的点、线、面实体;栅格影像数据为按照格网单元的行与列排列、具有不同灰度以及空间位置的阵列数据;调研资料为空间属性信息的图片数据,包括JPG、PNG以及BMP格式,即出图的地图资料等;数据库表数据为已经建立的dbf地名文件数据。地名数据的空间定位中心是几何中心点,整合的空间属性信息应保持表达方式一致。由于搜集上来的地名数据多样、复杂,地名数据整合需要进行转换,将数据规范化、标准化,数据转换主要包括:投影变换,层级转换、数据结构变换、数据去重等四个方面的处理。 
2.全球地名数据编码:对全球地名数据进行整合后,设计地名层级数据表文件,并将相应等级数据保存到正确目录下面,对整理好的各层级地名数据库链表信息,按照Country、Region、City等区划等级划分设计,关键字段信息应包含Country、Region、City、latitude、longitude、Code等等空间定位和逻辑关系信息;参考相关国家标准对Country、Region、City等层级地名数据文件,进行分区、分级、分类规范编码。全球地名代码的编码是一个重新编排组合过程,它是参考了现行国标对于行政区划和标志点代码两类大的分类体系,编制而成的,将原有的国家地名数据库的20位代码扩充到30位,这既是对原有国家标准的继承,又是对原有标准的扩充和扩展,拥有完全的自主知识产权。 
CN201410030715.1A 2014-01-23 2014-01-23 一种全球地名数据整合与代码编制方法 Pending CN103838825A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410030715.1A CN103838825A (zh) 2014-01-23 2014-01-23 一种全球地名数据整合与代码编制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410030715.1A CN103838825A (zh) 2014-01-23 2014-01-23 一种全球地名数据整合与代码编制方法

Publications (1)

Publication Number Publication Date
CN103838825A true CN103838825A (zh) 2014-06-04

Family

ID=50802322

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410030715.1A Pending CN103838825A (zh) 2014-01-23 2014-01-23 一种全球地名数据整合与代码编制方法

Country Status (1)

Country Link
CN (1) CN103838825A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930355A (zh) * 2016-04-02 2016-09-07 中国人民解放军空军航空大学 一种新型的多源图像数据库设计方法
CN106446293A (zh) * 2016-11-22 2017-02-22 江苏速度信息科技股份有限公司 一种快速化地名普查数据的建库方法
CN107133311A (zh) * 2017-04-28 2017-09-05 安徽博约信息科技股份有限公司 基于区域编码的网络信息归属地索引标记方法
CN107193995A (zh) * 2017-06-08 2017-09-22 网帅科技(北京)有限公司 一种位置分类规则库管理系统及其编码方法
CN108827474A (zh) * 2018-05-02 2018-11-16 郑州佳诺实业有限公司 一种基于坐标的涂料样板的颜色识别方法
CN109165195A (zh) * 2018-08-01 2019-01-08 山东省国土测绘院 一种测绘成果目录多元转换系统及方法
CN109241375A (zh) * 2018-07-20 2019-01-18 国家基础地理信息中心 一种测绘档案的管理方法和装置
CN109522377A (zh) * 2018-09-30 2019-03-26 广州市西美信息科技有限公司 一种中国农业生产分布和水平地图可视化呈现方法及装置
CN110263201A (zh) * 2019-06-25 2019-09-20 吴昶炜 一种电子产品品类识别、缺损识别方法及其应用
CN110287344A (zh) * 2019-02-26 2019-09-27 北京悦图遥感科技发展有限公司 影像产品数据获取方法和装置
CN110413600A (zh) * 2019-06-29 2019-11-05 万翼科技有限公司 数据管理方法及装置
CN112115221A (zh) * 2020-09-08 2020-12-22 浙江嘉兴数字城市实验室有限公司 一种块数据多因子匹配融合方法
CN113762847A (zh) * 2020-10-22 2021-12-07 北京京东振世信息技术有限公司 物流配送信息的处理方法、装置、服务器和存储介质
CN114066284A (zh) * 2021-11-23 2022-02-18 上海歆广数据科技有限公司 一种标准地址体系服务管理系统及方法
WO2022048299A1 (zh) * 2020-09-01 2022-03-10 张洪淼 一种货运快递数字收货门牌号的编制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宁方美: "基于GIS的地名数据库系统", 《中国优秀硕士学位论文全文数据库 基础科学辑》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930355B (zh) * 2016-04-02 2019-05-28 中国人民解放军空军航空大学 一种多源图像数据库设计方法
CN105930355A (zh) * 2016-04-02 2016-09-07 中国人民解放军空军航空大学 一种新型的多源图像数据库设计方法
CN106446293A (zh) * 2016-11-22 2017-02-22 江苏速度信息科技股份有限公司 一种快速化地名普查数据的建库方法
CN107133311A (zh) * 2017-04-28 2017-09-05 安徽博约信息科技股份有限公司 基于区域编码的网络信息归属地索引标记方法
CN107193995A (zh) * 2017-06-08 2017-09-22 网帅科技(北京)有限公司 一种位置分类规则库管理系统及其编码方法
CN108827474A (zh) * 2018-05-02 2018-11-16 郑州佳诺实业有限公司 一种基于坐标的涂料样板的颜色识别方法
CN109241375B (zh) * 2018-07-20 2020-07-24 国家基础地理信息中心 一种测绘档案的管理方法和装置
CN109241375A (zh) * 2018-07-20 2019-01-18 国家基础地理信息中心 一种测绘档案的管理方法和装置
CN109165195A (zh) * 2018-08-01 2019-01-08 山东省国土测绘院 一种测绘成果目录多元转换系统及方法
CN109165195B (zh) * 2018-08-01 2020-12-04 山东省国土测绘院 一种测绘成果目录多元转换系统及方法
CN109522377A (zh) * 2018-09-30 2019-03-26 广州市西美信息科技有限公司 一种中国农业生产分布和水平地图可视化呈现方法及装置
CN109522377B (zh) * 2018-09-30 2023-10-31 广州市西美信息科技有限公司 一种中国农业生产分布和水平地图可视化呈现方法及装置
CN110287344A (zh) * 2019-02-26 2019-09-27 北京悦图遥感科技发展有限公司 影像产品数据获取方法和装置
CN110287344B (zh) * 2019-02-26 2022-04-29 北京悦图遥感科技发展有限公司 影像产品数据获取方法和装置
CN110263201B (zh) * 2019-06-25 2022-03-11 吴昶炜 一种电子产品品类识别、缺损识别方法及其应用
CN110263201A (zh) * 2019-06-25 2019-09-20 吴昶炜 一种电子产品品类识别、缺损识别方法及其应用
CN110413600A (zh) * 2019-06-29 2019-11-05 万翼科技有限公司 数据管理方法及装置
WO2022048299A1 (zh) * 2020-09-01 2022-03-10 张洪淼 一种货运快递数字收货门牌号的编制方法
CN112115221A (zh) * 2020-09-08 2020-12-22 浙江嘉兴数字城市实验室有限公司 一种块数据多因子匹配融合方法
CN113762847A (zh) * 2020-10-22 2021-12-07 北京京东振世信息技术有限公司 物流配送信息的处理方法、装置、服务器和存储介质
CN114066284A (zh) * 2021-11-23 2022-02-18 上海歆广数据科技有限公司 一种标准地址体系服务管理系统及方法
CN114066284B (zh) * 2021-11-23 2024-03-29 上海歆广数据科技有限公司 一种标准地址体系服务管理系统及方法

Similar Documents

Publication Publication Date Title
CN103838825A (zh) 一种全球地名数据整合与代码编制方法
CN107092680B (zh) 一种基于地理网格的政务信息资源整合方法
Jiang et al. Identifying shrinking cities with NPP-VIIRS nightlight data in China
Lei et al. Does Urban planning affect urban growth pattern? A case study of Shenzhen, China
CN102508871B (zh) 一种面向灾害事件的地理对象本体构建方法
CN103514235B (zh) 一种增量码库的建立方法和装置
Tucci et al. Using spatial analysis and geovisualization to reveal urban changes: Milan, Italy, 1737–2005
CN112988715B (zh) 一种基于开源方式的全球网络地名数据库的构建方法
Zhang et al. Using street view images to identify road noise barriers with ensemble classification model and geospatial analysis
Yang et al. A constraint-based approach for identifying the urban–rural fringe of polycentric cities using multi-sourced data
CN107609242A (zh) 一种基于智能手机和数字地形图的公路勘察选线方法
He et al. What is the developmental level of outlying expansion patches? A study of 275 Chinese cities using geographical big data
Yutian et al. An approach to urban landscape character assessment: Linking urban big data and machine learning
CN107169893A (zh) 一种基于垂直方向上空间剖分细化的地籍产权体编码方法
Zuo et al. RETRACTED ARTICLE: Construction of community life circle database based on high-resolution remote sensing technology and multi-source data fusion
Chen Delineating the spatial boundaries of megaregions in China: A city network perspective
CN115292507A (zh) 基于知识图谱的交通出行分析方法、装置、设备及介质
CN114595302A (zh) 空间要素的多层级空间关系构建方法、装置、介质及设备
Hua et al. Geographic information systems
Droj GIS and remote sensing in environmental management
CN114722276A (zh) 一种用于智慧城市服务的数据管理及分析方法
Du et al. A novel semantic recognition framework of urban functional zones supporting urban land structure analytics based on open‐source data
Wu et al. Study on the spatial variability of thermal landscape in Xi’an based on OSM road network and POI data
Bin et al. Decision oriented intelligent transport information platform design research–case study of Hangzhou City
Li et al. An accurate fringe extraction model of small-and medium-sized urban areas using multi-source data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140604