CN102169498A - 一种地址模型的构建方法,以及地址匹配的方法和系统 - Google Patents

一种地址模型的构建方法,以及地址匹配的方法和系统 Download PDF

Info

Publication number
CN102169498A
CN102169498A CN 201110093821 CN201110093821A CN102169498A CN 102169498 A CN102169498 A CN 102169498A CN 201110093821 CN201110093821 CN 201110093821 CN 201110093821 A CN201110093821 A CN 201110093821A CN 102169498 A CN102169498 A CN 102169498A
Authority
CN
China
Prior art keywords
address
address element
name
standard mark
mark title
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110093821
Other languages
English (en)
Inventor
李成名
马照亭
王继周
印洁
赵占杰
方驰宇
张成成
孙隆祥
赵园春
殷勇
焦孟凯
路文娟
金志国
刘勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese Academy of Surveying and Mapping
Original Assignee
Chinese Academy of Surveying and Mapping
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese Academy of Surveying and Mapping filed Critical Chinese Academy of Surveying and Mapping
Priority to CN 201110093821 priority Critical patent/CN102169498A/zh
Publication of CN102169498A publication Critical patent/CN102169498A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种地址模型构建方法,包括步骤:A、定义地址的具有不同层次的描述粒度;B、根据所述不同层次描述粒度进行组合构建地址模型。一种所述地址模型的地址匹配方法,根据所述地址模型建立地址元素库;还包括步骤:M、获取待匹配地址;N、对所述待匹配地址进行分词处理,生成不同的地址元素;O、将所述不同的地址元素通过逻辑运算到所述地址元素库进行匹配。以及一种地址匹配系统,包括:终端,地址元素库,对照表数据库和运行服务器。从而实现各种表达方式中地址信息的有效匹配和空间定位。

Description

一种地址模型的构建方法,以及地址匹配的方法和系统
技术领域
本发明涉及一种地理信息表述领域,特别是指一种地址模型的构建方法,以及地址匹配的方法和系统。
背景技术
地址信息在社会活动中无处不在,如同人类生活不可缺少的空气和水一样。据统计,80%的信息与空间有关系,而关系的主要纽带就是地址信息。这些信息几乎涉及到了所有政府部门、企事业单位和社会公众,如公安户籍、民政地名、国土地籍、工商税务法人单位、综合部门统计信息等等,无不包含着地址信息。
目前,尽管这些地址描述信息已经实现了数字化,但由于缺少空间定位,故而影响了管理的效率,制约了专题信息之间的沟通和集成使用。只有将这些地址信息转换成空间坐标,专题信息才能与地理信息叠加,才能利用GIS软件的可视化和空间分析功能辅助用户应用。
目前已有一些实现地址匹配的方法,如中国专利申请号为200710119220.6的“一种地址匹配的方法和系统”就公开了这样一种技术:针对符合标准描述的地址信息,例如“北京市海淀区北太平路16号”采用城市名+区名+道路名+门牌号码的表述方式。
而实际情况是,在地址描述中存在着各种各样的表达方式,例如“北京市五棵松中国人民解放军总医院”、“北京市石景山区国际雕塑公园”、“北京市石景山区永乐小区”、“北京市丰台区总部基地11区19号楼”等,在很多的地址信息中人们更习惯于采用单位名、标志地物名称等来进行描述。同时在国内大多数城市的实际情况中,存在大量的地址没有标准门牌号码的情况。由此,对于表述不规范、一致性差的地址信息,采用上述发明的方法很难对地址信息进行有效地匹配和空间定位。
发明内容
有鉴于此,本发明的主要目的在于提供一种地址模型的构建方法,以及地址匹配的方法和系统,以实现各种表达方式中地址信息的有效匹配和空间定位。
本发明提供了一种地址模型构建方法,包括以下步骤:
A、定义地址的具有不同层次的描述粒度;
B、根据所述不同层次描述粒度进行组合构建地址模型。
由上可以看出,通过所述方法构建出的地址模型是可伸缩的,并以此实现了地址的分段描述。
在上述方法中,步骤A所述不同层次的描述粒度包括行政区域地名、街巷名/小区名/标志地名和门楼址/单位名;
步骤B所述组合包括利用所述描述粒度层次地名的非必选的有序组合。
由上可以看出,可以动态组合描述粒度层次地名,从而实现灵活、有效地匹配及空间定位。
本发明提供了一种所述的地址模型的地址匹配方法,根据所述地址模型建立地址元素库;还包括以下步骤:
M、获取待匹配地址;
N、对所述待匹配地址进行分词处理,生成不同的地址元素;
O、将所述不同的地址元素通过逻辑运算到所述地址元素库进行匹配。
由上可以看出,利用根据上述可伸缩的地址模型建立的地址元素库,可以对地址进行分段描述和动态组合,由此可以实现快速、有效地地址匹配。
在上述方法中,所述步骤N包括子步骤:
N1、将所述待匹配地址切分为不同的地址元素和非规范标志物名称;
N2、对所述非规范标志物名称标准化处理为地址元素。
由上可以看出,所述地址匹配方法通过对非规范标志物名称标准化处理,实现了对于具有不规范名称的地址的准确匹配。
在上述方法中,所述步骤N2包括子步骤:
N21、预先建立存储有非规范标志物名称与对应的地址元素的对照表数据库;
N22、根据查询所述对照表数据库将所述非规范标志物名称标准化处理为地址元素。
由上可以看出,通过容易操作的对照表数据库查询,即可以实现便捷的非规范标志物名称标准化处理。
在上述方法中,所述步骤N21所述的对照表数据库包括:
公共数据库,存储有使用频率高于设定值的非规范标志物名称与对应的地址元素的对应关系;
补充数据库,存储有使用频率不高于所述设定值的非规范标志物名称与对应的地址元素的对应关系。
由上可以看出,根据使用频率将非规范标志物名称分别存储,只需检索相应非规范标志物名称,而不必检索所有的非规范标志物名称,从而有利于减少冗余检索,提高数据库的检索速度。
在上述方法中,还包括:
判断补充数据库中的非规范标志物名称被查询频率高于所述设定值时,对应转移存储至公共数据库。
由上可以看出,对照表数据库的如上设置可以实现对照表数据库的自学习功能,即可以自动补充经常出现的、已可被当作是标准名称的非规范标志物名称,从而节省了手动录入该部分数据的劳动强度。
本发明还提供了一种地址匹配系统,包括:
终端,用于获取待匹配地址;
地址元素库,存储有地址元素;
对照表数据库,存储有非规范标志物名称与对应的地址元素;
运行服务器,用于对所述待匹配地址进行分词处理,生成不同的地址元素和非规范标志物名称;根据查询所述对照表数据库将所述非规范标志物名称标准化处理为地址元素;将所述不同的地址元素通过逻辑运算到所述地址元素库进行匹配。
由上可以看出,上述系统利用根据上述可伸缩的地址模型建立的地址元素库,可以对地址进行分段描述和动态组合,由此可以实现快速、有效地地址匹配。
在上述系统中,所述对照表数据库包括:
公共数据库,存储有使用频率高于设定值的非规范标志物名称与对应的地址元素的对应关系;
补充数据库,存储有使用频率不高于所述设定值的非规范标志物名称与对应的地址元素的对应关系。
由上可以看出,通过设置的两种数据库分别存储使用频率在设定值上下的非规范标志物名称,可以实现在检索时只需检索相应非规范标志物名称,而不必检索所有的非规范标志物名称,从而有利于减少冗余检索,提高数据库的检索速度。
附图说明
图1为本发明提供的一种地址模型构建方法的流程图;
图2为本发明提供的一种地址模型构建方法中城市行政区划组合的示意图;
图3为本发明提供的一种地址模型构建方法中地址表达方式与地址元素的对照图;
图4为本发明提供的一种地址模型匹配方法的流程图;
图5为利用本发明提供的一种地址模型匹配方法进行地址匹配的操作界面示意图:其中,(A)为操作界面上待匹配地址数据的示意图,(B)为操作界面上地址数据的匹配结果示意图;
图6为利用本发明提供的一种地址模型匹配方法进行地址匹配的结果统计图。
具体实施方式
下面结合附图,详细介绍本发明提供的一种地址模型的构建方法,以及地址匹配的方法和系统。
如图1所示,本发明提供的一种地址模型的构建方法包括以下步骤:
步骤101:定义地址的描述粒度。
在本实施例中,可将地址的描述粒度分为三个层次,即行政区域地名、街巷名/小区名/标志地名、门楼址(门楼牌号码)/单位名。
通常,所述的行政区域地名是指行政区域(行政管辖范围,对于一个城市而言,包括城市级、县区级、乡镇街道级行政区划范围)规范名称的文字描述。例如“北京市”、“海淀区”、“万寿路街道”等等。
所述的街巷名是指街巷(街是明确划分出车道和人行便道的通行区域;巷是较窄的街道,如胡同、条、弄等)规范名称的文字描述。例如“复兴路”、“校场三条”等。
所述小区名是指小区(居住相对集中在一起的生活聚集地,如自然村落、居民小区等)规范名称的文字描述。例如“永乐小区”、“五芳园小区”等。
所述标志地名是指有地理指示意义的标志性称呼或名称。例如“公主坟”、“五棵松”等。
所述单位名是指单位的规范名称。例如“中国测绘科学研究院”等。
所述门楼址是指门牌号码和楼牌号码。例如“16号院”、“8号楼”等。
步骤102:根据所述描述粒度构建地址模型。
地址模型(地址组合)以地址的描述粒度为核心,通过定义不同描述粒度层次地址的描述规则(地名),实现地址表达的自动伸缩。利用上述三个描述粒度层次地名的非必选的有序组合,构成所述地址模型以精确定位地址。例如,在一个城市内,如果道路名/小区名是唯一的,则利用道路名/小区名+门楼址便可精确定位一个地址。按照上述三种地址描述粒度层次的划分,结合我国通常的地址表达习惯,可能存在的地址表达伸缩组合共有以下9种:
1)行政区域地名|街巷名,如“北京市海淀区北太平路”;
2)行政区域地名|小区名,如“北京市石景山区永乐小区”;
3)行政区域地名|标志地名,如“北京市丰台区总部基地”;
4)行政区域地名|单位名,如“北京市海淀区中国测绘科学研究院”;
5)行政区域地名|街巷名|门楼址,如“北京市海淀区北太平路16号”;
6)行政区域地名|街巷名|单位名,如“北京市海淀区北太平路中国测绘科学研究院”;
7)行政区域地名|小区名|门楼址,如“北京市石景山区永乐小区6号楼”;
8)行政区域地名|小区名|单位名,如“北京市石景山区永乐小区社区服务中心”;
9)行政区域地名|标志地名|单位名,如“北京市五棵松名仕医院”。
其中,在行政区域地名的表达中,对于城市而言,又分为三个描述粒度层次,即城市级、县区级、乡镇街道级。如图2所示,这三级行政区划的组合具有唯一性。
如图4所示,本发明提供的地址匹配方法包括以下步骤:
步骤201:构建地址元素库。
在本实施例中,如图3所示,按照上述三个描述粒度层次(行政区域地名、街巷名/小区名/标志地名、门楼址/单位名)划分,共有8种地址元素,包括城市级行政区划地名(包括城市名、城市别名)、县区级行政区划地名(包括区县名、区县别名)、乡镇街道级行政区划地名(乡、镇、街道办名)、街巷名(包括道路名)、小区名(包括小区名、小区别名)、标志地名、门楼址以及单位名。根据所述地址模型对地名/地址描述的规则,采用三个数据表(各数据表的结构和样例详见下列表1、表2和表3)进行关联表达。
表1
Figure BDA0000055391860000071
表2
Figure BDA0000055391860000081
表3
Figure BDA0000055391860000082
按照上述结构一次录入某座城市所有县区、街道、道路、小区、标志地名、门楼址、单位名(简称/别名)和地理坐标,便可构建该城市的地址元素库。
步骤202:获取待匹配地址。
在本实施实例中,可以通过中间服务器获取用户终端输入的待匹配地址。所述待匹配地址通常为文字描述形式,便于用户直观输入。
步骤203:对所述待匹配地址进行分词处理。
借助地址词典和中文自动分词算法,将所述待匹配地址切分、转化为计算机能够理解的、结构化的多个地址元素或非规范标志物名称(标志物的通用名,如酒店、大厦等),这一过程即为地址分词。本实施例可以采用目前较常见的基于特征标志、基于统计、基于理解等多种方式的分词方法。对于这些分词方法,在此不再赘述。
在本实施例中,如表5所示,每个所述地址模型中的地址元素都对应一个不同的地址级别,这样当地址分词切分出“北京市”(地址级别为1)、“西城区”(地址级别为2)、“华联商厦”(地址级别为3)三个地址元素时,便可以根据这三个地址元素对应的地址级别准确地定位到北京市西城区华联商厦,而不是辽宁省沈阳市铁西区的华联商厦。
表5
Figure BDA0000055391860000091
另外,需要对地址分词切分出来的地址元素进行标准化处理,也就是将城市、区县、小区、标志物等的别名(或非规范名称)标准化为规范的名称。例如,将切分出的地址元素“京”(北京的简称)标准化为“北京市”。这一过程可以通过设置地址元素的别名/简称与规范名称的对照表来实现。具体为:在所述中间服务器上建立存储有所述对照表的数据库;通过查询所述数据库,将由所述待匹配地址中切分出的地址元素与对照表中地址元素的规范名称进行比对,从而规范化待匹配地址中的地址元素。之后,再由中间服务器将规范的匹配地址发送至终端服务器进行相应的地址匹配操作。关于地址匹配的过程,将在下文详细介绍。
其中,由于各地名称的称谓习惯不同,因此针对不同的地区在所述中间服务器上建立不同的数据库与其对应。由此只需要根据用户终端所在地区,读取对应地区的数据库即可。
此外,还可以将所述中间服务器的数据库划分为公共数据库和补充数据库,其中公共数据库为各地的中间服务器共享,甚至可以再独立设置一公共数据库服务器来存储该数据库。将名称不规范但使用频率很高已经通用的地址元素存储在所述公共数据库中,将使用频率低的地址元素存储至补充数据库。补充数据库可以针对各地分别设置,这是因为对该地域的非正式非规范的低频率使用的名称一般仅出现在该地域;公共数据库则可以设置一台为各个地区共享。并定期判断补充数据库中的每个地址元素的被查询次数或频率。当判断查询次数超过设定数量或频率时,表示该地址元素的非规范称谓使用比较频繁,将与其对应的地址元素转移存储至公共数据库,实现对公共数据库补充和完善,这样便于公共数据库的维护,避免了使用较少的非规范称谓占据公共数据库而导致的公共数据库数据量太大,便于提高地址查询的效率。
步骤204:对经过分词处理的待匹配地址,即各个切分出的地址元素进行匹配。
在本实施例中,将通过地址分词切分出的地址元素按照所述地址模型生成计算机可以识别的地址,然后在所述地址元素库中比对出该地址元素的地理坐标,即为地址匹配的过程。具体匹配过程,可参照如下流程处理:
(1)当切分出来的一组地址元素中包含门楼址时,可以在门楼址数据表中精确匹配该组地址元素对应的地理坐标。例如,待匹配地址“北京市海淀区莲花池西路28号中国测绘”,经过地址分词后得到地址元素“北京市|海淀区|莲花池西路|28号|中国测绘”,相应的地址匹配SQL查询语句为“select*from doorplate where road=‘莲花池西路’and doorplate=‘28号’”。
(2)当切分出来的一组地址元素中不包含门楼址,但包含单位名时,为了避免同名标志物的出现,延伸至所述地址模型中的行政区划数据表进行地址匹配。例如,待匹配地址“北京市海淀区莲花池西路中国测绘”,经过地址分词后得到地址元素“北京市|海淀区|莲花池西路|中国测绘”,由此形成的地址匹配SQL查询语句应为“select*from landmark where landmark=‘中国测绘’and road=‘莲花池西路’and county=‘海淀区’and city=‘北京市’”,最后准确定位“中国测绘”的地理坐标。
(3)当切分出来的一组地址元素中不包含门楼址和单位名,但包含单位的通用名时,可以按照单位的通用名进行模糊查询后,将满足条件的一条或多条记录返回给用户,供用户甄别。例如,当地址词典中未收录“中国测绘”这个单位名,而是收录了“测绘”这个单位的通用名时,待匹配地址“北京市海淀区莲花池西路中国测绘”,经过地址分词后得到地址元素“北京市|海淀区|莲花池西路|中国|测绘”,由此形成的地址匹配SQL查询语句应为“select*from landmark where landmark like‘中国’and landmark like‘测绘’and road=‘莲花池西路’and county=‘海淀区’and city=‘北京市’,即在单位名数据表中搜索位于北京市海淀区莲花池西路上的,同时包含“中国”和“测绘”关键词的标志物。这样,地址元素库中收录的、凡是带有上述关键词的相关地名/地址(例如“中国测绘创新基地”、“中国测绘科学研究院”等)及其坐标将被作为候选结果显示给用户,以供用户确认。
(4)当切分出来的地址元素中不包含任何门楼址、单位名、单位的通用名时,则对其他地址元素进行匹配,返回道路、小区或行政区划的地理坐标。
在本实施例中,为了验证地址匹配结果的确定性,引入了置信度(可信度)作为地址匹配结果确定性验证的量化指标。当一个地名/地址经过步骤204可以转换为精确的地理坐标时,此时的置信度为100%;当使用步骤204完全不能定位时,此时的置信度为0%。由此可见,所述置信度与地址分词的准确度以及匹配准确度成正相关。在采用统一的分词方法的前提下,所述置信度只取决于匹配准确度。根据上述地址模型定义出匹配准确度的计算公式如下:
M=∑(Wi×Mi)×100%,(0.0≤Wi≤1.0,Mi=〔0失败,1成功〕);
其中,Mi为地址元素在地址元素库中的匹配准确度,匹配成功时为1,匹配失败时为0;Wi为各地址元素在所述地址模型中所占的权重,取值介于0.0和1.0之间。所述地址模型中各地址元素在本算法中量化计算时的权重如表6所示:
Figure BDA0000055391860000121
表6
按照上述计算公式得出不同情况下匹配结果的置信度如表7所示。其中,“√”代表正确匹配的地址元素,“×”代表未发现或不能正确匹配的地址元素,“--”代表匹配时忽略的地址元素。
Figure BDA0000055391860000122
Figure BDA0000055391860000131
表7
在本实施例中,如图5所示,可采用根据上述地址匹配方法进行地址匹配的软件,为用户返回Access或Excel格式的地址匹配结果。其中图5(A)显示出待匹配地址数据;图5(B)显示出地址数据匹配结果。在此之后,经过对所述匹配结果的统计,如图6所示,使用所述地址匹配方法的匹配成功率(置信度为100%的记录)在90%以上。
此外,将所述待匹配地址的分词处理以及在此之后进行的地址匹配、匹配结果评价等步骤是分别放置在中间服务器和终端服务器上进行,由此可以大大提升地址查询的效率和准确度。
本发明还提供了一种实现上述地址匹配的系统,包括:
终端,用于获取待匹配地址;
地址元素库,存储有地址元素;
对照表数据库,存储有非规范标志物名称与对应的地址元素,包括:公共数据库,存储有使用频率高于设定值的非规范标志物名称与对应的地址元素的对应关系;
补充数据库,存储有使用频率不高于所述设定值的非规范标志物名称与对应的地址元素的对应关系。;
运行服务器,用于对所述待匹配地址进行分词处理,生成不同的地址元素和非规范标志物名称;根据查询所述对照表数据库将所述非规范标志物名称标准化处理为地址元素;将所述不同的地址元素通过逻辑运算到所述地址元素库进行匹配。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种地址模型构建方法,其特征在于,包括以下步骤:
A、定义地址的具有不同层次的描述粒度;
B、根据所述不同层次描述粒度进行组合构建地址模型。
2.根据权利要求1所述的方法,其特征在于,
步骤A所述不同层次的描述粒度包括行政区域地名、街巷名/小区名/标志地名和门楼址/单位名;
步骤B所述组合包括利用所述描述粒度层次地名的非必选的有序组合。
3.一种如权利要求1所述的地址模型的地址匹配方法,其特征在于,根据所述地址模型建立地址元素库;还包括以下步骤:
M、获取待匹配地址;
N、对所述待匹配地址进行分词处理,生成不同的地址元素;
O、将所述不同的地址元素通过逻辑运算到所述地址元素库进行匹配。
4.根据权利要求3所述的方法,其特征在于,所述步骤N包括子步骤:
N1、将所述待匹配地址切分为不同的地址元素和非规范标志物名称;
N2、对所述非规范标志物名称标准化处理为地址元素。
5.根据权利要求4所述的方法,其特征在于,所述步骤N2包括子步骤:
N21、预先建立存储有非规范标志物名称与对应的地址元素的对照表数据库;
N22、根据查询所述对照表数据库将所述非规范标志物名称标准化处理为地址元素。
6.根据权利要求5所述的方法,其特征在于,所述步骤N21所述的对照表数据库包括:
公共数据库,存储有使用频率高于设定值的非规范标志物名称与对应的地址元素的对应关系;
补充数据库,存储有使用频率不高于所述设定值的非规范标志物名称与对应的地址元素的对应关系。
7.根据权利要求6所述的方法,其特征在于,还包括:
判断补充数据库中的非规范标志物名称被查询频率高于所述设定值时,对应转移存储至公共数据库。
8.一种地址匹配系统,其特征在于,包括:
终端,用于获取待匹配地址;
地址元素库,存储有地址元素;
对照表数据库,存储有非规范标志物名称与对应的地址元素;
运行服务器,用于对所述待匹配地址进行分词处理,生成不同的地址元素和非规范标志物名称;根据查询所述对照表数据库将所述非规范标志物名称标准化处理为地址元素;将所述不同的地址元素通过逻辑运算到所述地址元素库进行匹配。
9.根据权利要求8所述的方法,其特征在于,所述对照表数据库包括:
公共数据库,存储有使用频率高于设定值的非规范标志物名称与对应的地址元素的对应关系;
补充数据库,存储有使用频率不高于所述设定值的非规范标志物名称与对应的地址元素的对应关系。
CN 201110093821 2011-04-14 2011-04-14 一种地址模型的构建方法,以及地址匹配的方法和系统 Pending CN102169498A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110093821 CN102169498A (zh) 2011-04-14 2011-04-14 一种地址模型的构建方法,以及地址匹配的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110093821 CN102169498A (zh) 2011-04-14 2011-04-14 一种地址模型的构建方法,以及地址匹配的方法和系统

Publications (1)

Publication Number Publication Date
CN102169498A true CN102169498A (zh) 2011-08-31

Family

ID=44490660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110093821 Pending CN102169498A (zh) 2011-04-14 2011-04-14 一种地址模型的构建方法,以及地址匹配的方法和系统

Country Status (1)

Country Link
CN (1) CN102169498A (zh)

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102393937A (zh) * 2011-10-12 2012-03-28 深圳市络道科技有限公司 一种基于反向生成的地址树的地址匹配方法及匹配系统
CN103558926A (zh) * 2013-11-12 2014-02-05 金蝶软件(中国)有限公司 一种地名录入方法及装置
CN103605752A (zh) * 2013-11-21 2014-02-26 武大吉奥信息技术有限公司 一种基于语义识别的地址匹配方法
CN104021184A (zh) * 2014-06-10 2014-09-03 广州品唯软件有限公司 一种定位方法与系统
CN104462059A (zh) * 2014-12-01 2015-03-25 银联智惠信息服务(上海)有限公司 商户地址信息识别方法和装置
CN104657361A (zh) * 2013-11-18 2015-05-27 阿里巴巴集团控股有限公司 一种数据处理方法及装置
CN105068989A (zh) * 2015-07-23 2015-11-18 中国测绘科学研究院 地名地址提取方法及装置
CN105426351A (zh) * 2015-11-11 2016-03-23 中国建设银行股份有限公司 一种客户地址信息的分词处理方法和系统
CN105468632A (zh) * 2014-09-05 2016-04-06 高德软件有限公司 一种地理编码方法及装置
CN105512121A (zh) * 2014-09-23 2016-04-20 北京汇通天下物联科技有限公司 基于关键词的地址查询方法
CN105630807A (zh) * 2014-10-31 2016-06-01 高德软件有限公司 一种未知道路与已知道路关联关系的分析方法和装置
CN105740257A (zh) * 2014-12-09 2016-07-06 朗新科技股份有限公司 标准地名地址库建立方法及系统
CN105760360A (zh) * 2014-12-16 2016-07-13 高德软件有限公司 一种地址纠正方法和装置
CN106021336A (zh) * 2016-05-09 2016-10-12 厦门四方中信科技有限公司 一种对批量地址信息进行自动行政区划划分的方法
CN106033460A (zh) * 2015-03-19 2016-10-19 阿里巴巴集团控股有限公司 地址数据处理方法及装置
CN106407221A (zh) * 2015-07-31 2017-02-15 阿里巴巴集团控股有限公司 地址数据检索方法及装置
CN106599303A (zh) * 2016-12-29 2017-04-26 苏碧云 一种地址匹配方法及系统
CN106611060A (zh) * 2016-12-29 2017-05-03 苏碧云 一种用于gis的数据处理方法
CN106649802A (zh) * 2016-12-29 2017-05-10 广东精规划信息科技股份有限公司 一种地址云服务平台
CN106649803A (zh) * 2016-12-29 2017-05-10 华南师范大学 一种地址匹配方法及系统
CN106682175A (zh) * 2016-12-29 2017-05-17 华南师范大学 一种地址匹配方法及系统
CN106874384A (zh) * 2017-01-10 2017-06-20 广东精规划信息科技股份有限公司 一种异构地址标准转换及匹配方法
CN108062365A (zh) * 2017-12-06 2018-05-22 吉旗(成都)科技有限公司 一种提高地址解析准确度的方法
CN108090221A (zh) * 2018-01-02 2018-05-29 北京市燃气集团有限责任公司 一种燃气卡数据与用户管理数据的关联方法
CN108204816A (zh) * 2016-12-20 2018-06-26 北京四维图新科技股份有限公司 定位导航的地址精细化处理方法及装置、物流导航系统及终端
CN109190997A (zh) * 2018-09-18 2019-01-11 广东电网有限责任公司 中文地址层级化解析与规范处理方法和系统
CN109299402A (zh) * 2018-07-23 2019-02-01 广州都市圈网络科技有限公司 基于要素预分段的地址匹配方法
CN109614396A (zh) * 2018-12-17 2019-04-12 广东电网有限责任公司 一种地址数据结构化与规范化的清理方法
CN109614472A (zh) * 2018-06-13 2019-04-12 安徽省泰岳祥升软件有限公司 文本中地址信息的提取方法及装置
CN109635056A (zh) * 2018-11-16 2019-04-16 海南电网有限责任公司信息通信分公司 用电地址数据处理方法、装置、计算机设备和存储介质
CN109635807A (zh) * 2018-10-16 2019-04-16 深圳壹账通智能科技有限公司 信息录入方法、装置、设备及计算机可读存储介质
CN109800280A (zh) * 2019-01-16 2019-05-24 北京神州泰岳软件股份有限公司 地址匹配方法及装置
CN110032718A (zh) * 2019-04-12 2019-07-19 广州广燃设计有限公司 一种表格转换方法、系统和存储介质
CN110765280A (zh) * 2019-10-22 2020-02-07 京东数字科技控股有限公司 地址识别方法和装置
CN110895651A (zh) * 2018-08-23 2020-03-20 北京京东金融科技控股有限公司 地址标准化处理方法、装置、设备及计算机可读存储介质
CN111159973A (zh) * 2019-12-13 2020-05-15 中关村科技软件股份有限公司 一种中文地址的行政区划补齐及标准化方法
CN111274802A (zh) * 2018-11-19 2020-06-12 阿里巴巴集团控股有限公司 一种地址数据的有效性判断方法及其装置
CN111427977A (zh) * 2019-01-10 2020-07-17 阿里巴巴集团控股有限公司 电子眼数据的处理方法及装置
WO2020168750A1 (zh) * 2019-02-18 2020-08-27 平安科技(深圳)有限公司 一种地址信息标准化方法、装置、计算机设备及存储介质
CN111611290A (zh) * 2020-05-14 2020-09-01 深圳中科慧据科技有限公司 地址快速定位方法、装置、计算机设备及存储介质
CN113515677A (zh) * 2021-07-22 2021-10-19 中移(杭州)信息技术有限公司 地址匹配方法、装置及计算机可读存储介质
CN115809315A (zh) * 2022-11-24 2023-03-17 中科星图智慧科技安徽有限公司 一种地名地址标准化匹配算法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006072802A (ja) * 2004-09-03 2006-03-16 Hitachi Software Eng Co Ltd 住所データの検索方法及び住所データベース
CN101719128A (zh) * 2009-12-31 2010-06-02 浙江工业大学 一种基于模糊匹配的中文地理编码确定方法
CN101882163A (zh) * 2010-06-30 2010-11-10 中国科学院地理科学与资源研究所 一种基于匹配规则的模糊中文地址地理赋值方法
CN101980208A (zh) * 2010-11-10 2011-02-23 百度在线网络技术(北京)有限公司 地址查询方法及系统
CN101984432A (zh) * 2010-11-10 2011-03-09 百度在线网络技术(北京)有限公司 地址数据库建构方法及装置
CN101996247A (zh) * 2010-11-10 2011-03-30 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN101996248A (zh) * 2010-11-10 2011-03-30 百度在线网络技术(北京)有限公司 地址查询方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006072802A (ja) * 2004-09-03 2006-03-16 Hitachi Software Eng Co Ltd 住所データの検索方法及び住所データベース
CN101719128A (zh) * 2009-12-31 2010-06-02 浙江工业大学 一种基于模糊匹配的中文地理编码确定方法
CN101882163A (zh) * 2010-06-30 2010-11-10 中国科学院地理科学与资源研究所 一种基于匹配规则的模糊中文地址地理赋值方法
CN101980208A (zh) * 2010-11-10 2011-02-23 百度在线网络技术(北京)有限公司 地址查询方法及系统
CN101984432A (zh) * 2010-11-10 2011-03-09 百度在线网络技术(北京)有限公司 地址数据库建构方法及装置
CN101996247A (zh) * 2010-11-10 2011-03-30 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN101996248A (zh) * 2010-11-10 2011-03-30 百度在线网络技术(北京)有限公司 地址查询方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集》 20071231 孙亚夫等 基于分词的地址匹配技术 114-125 1-9 , *
《测绘通报》 20110228 马照亭等 一种基于地址分词的自动地理编码算法 59-62 1,8-9 , 第2期 *

Cited By (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102393937A (zh) * 2011-10-12 2012-03-28 深圳市络道科技有限公司 一种基于反向生成的地址树的地址匹配方法及匹配系统
CN103558926A (zh) * 2013-11-12 2014-02-05 金蝶软件(中国)有限公司 一种地名录入方法及装置
CN104657361A (zh) * 2013-11-18 2015-05-27 阿里巴巴集团控股有限公司 一种数据处理方法及装置
CN103605752A (zh) * 2013-11-21 2014-02-26 武大吉奥信息技术有限公司 一种基于语义识别的地址匹配方法
CN104021184B (zh) * 2014-06-10 2017-07-11 广州品唯软件有限公司 一种定位方法与系统
CN104021184A (zh) * 2014-06-10 2014-09-03 广州品唯软件有限公司 一种定位方法与系统
CN105468632A (zh) * 2014-09-05 2016-04-06 高德软件有限公司 一种地理编码方法及装置
CN105468632B (zh) * 2014-09-05 2019-08-09 高德软件有限公司 一种地理编码方法及装置
CN105512121A (zh) * 2014-09-23 2016-04-20 北京汇通天下物联科技有限公司 基于关键词的地址查询方法
CN105630807B (zh) * 2014-10-31 2020-02-07 高德软件有限公司 一种未知道路与已知道路关联关系的分析方法和装置
CN105630807A (zh) * 2014-10-31 2016-06-01 高德软件有限公司 一种未知道路与已知道路关联关系的分析方法和装置
CN104462059A (zh) * 2014-12-01 2015-03-25 银联智惠信息服务(上海)有限公司 商户地址信息识别方法和装置
CN104462059B (zh) * 2014-12-01 2017-06-30 银联智惠信息服务(上海)有限公司 商户地址信息识别方法和装置
CN105740257A (zh) * 2014-12-09 2016-07-06 朗新科技股份有限公司 标准地名地址库建立方法及系统
CN105760360A (zh) * 2014-12-16 2016-07-13 高德软件有限公司 一种地址纠正方法和装置
CN105760360B (zh) * 2014-12-16 2018-09-11 高德软件有限公司 一种地址纠正方法和装置
CN106033460A (zh) * 2015-03-19 2016-10-19 阿里巴巴集团控股有限公司 地址数据处理方法及装置
CN105068989B (zh) * 2015-07-23 2018-05-04 中国测绘科学研究院 地名地址提取方法及装置
CN105068989A (zh) * 2015-07-23 2015-11-18 中国测绘科学研究院 地名地址提取方法及装置
CN106407221A (zh) * 2015-07-31 2017-02-15 阿里巴巴集团控股有限公司 地址数据检索方法及装置
CN106407221B (zh) * 2015-07-31 2020-02-07 菜鸟智能物流控股有限公司 地址数据检索方法及装置
CN105426351B (zh) * 2015-11-11 2019-01-25 中国建设银行股份有限公司 一种客户地址信息的分词处理方法和系统
CN105426351A (zh) * 2015-11-11 2016-03-23 中国建设银行股份有限公司 一种客户地址信息的分词处理方法和系统
CN106021336A (zh) * 2016-05-09 2016-10-12 厦门四方中信科技有限公司 一种对批量地址信息进行自动行政区划划分的方法
CN108204816A (zh) * 2016-12-20 2018-06-26 北京四维图新科技股份有限公司 定位导航的地址精细化处理方法及装置、物流导航系统及终端
CN108204816B (zh) * 2016-12-20 2020-06-02 北京四维图新科技股份有限公司 定位导航的地址精细化处理方法及装置、物流导航系统及终端
CN106682175A (zh) * 2016-12-29 2017-05-17 华南师范大学 一种地址匹配方法及系统
CN106649803A (zh) * 2016-12-29 2017-05-10 华南师范大学 一种地址匹配方法及系统
CN106649802A (zh) * 2016-12-29 2017-05-10 广东精规划信息科技股份有限公司 一种地址云服务平台
CN106611060A (zh) * 2016-12-29 2017-05-03 苏碧云 一种用于gis的数据处理方法
CN106599303A (zh) * 2016-12-29 2017-04-26 苏碧云 一种地址匹配方法及系统
CN106874384A (zh) * 2017-01-10 2017-06-20 广东精规划信息科技股份有限公司 一种异构地址标准转换及匹配方法
CN106874384B (zh) * 2017-01-10 2020-12-04 航天精一(广东)信息科技有限公司 一种异构地址标准转换及匹配方法
CN108062365A (zh) * 2017-12-06 2018-05-22 吉旗(成都)科技有限公司 一种提高地址解析准确度的方法
CN108062365B (zh) * 2017-12-06 2021-01-26 吉旗(成都)科技有限公司 一种提高地址解析准确度的方法
CN108090221A (zh) * 2018-01-02 2018-05-29 北京市燃气集团有限责任公司 一种燃气卡数据与用户管理数据的关联方法
CN108090221B (zh) * 2018-01-02 2019-05-10 北京市燃气集团有限责任公司 一种燃气卡数据与用户管理数据的关联方法
CN109614472A (zh) * 2018-06-13 2019-04-12 安徽省泰岳祥升软件有限公司 文本中地址信息的提取方法及装置
CN109299402A (zh) * 2018-07-23 2019-02-01 广州都市圈网络科技有限公司 基于要素预分段的地址匹配方法
CN110895651B (zh) * 2018-08-23 2024-02-02 京东科技控股股份有限公司 地址标准化处理方法、装置、设备及计算机可读存储介质
CN110895651A (zh) * 2018-08-23 2020-03-20 北京京东金融科技控股有限公司 地址标准化处理方法、装置、设备及计算机可读存储介质
CN109190997A (zh) * 2018-09-18 2019-01-11 广东电网有限责任公司 中文地址层级化解析与规范处理方法和系统
CN109190997B (zh) * 2018-09-18 2021-03-12 广东电网有限责任公司 中文地址层级化解析与规范处理方法和系统
CN109635807A (zh) * 2018-10-16 2019-04-16 深圳壹账通智能科技有限公司 信息录入方法、装置、设备及计算机可读存储介质
CN109635056A (zh) * 2018-11-16 2019-04-16 海南电网有限责任公司信息通信分公司 用电地址数据处理方法、装置、计算机设备和存储介质
CN111274802B (zh) * 2018-11-19 2023-04-18 阿里巴巴集团控股有限公司 一种地址数据的有效性判断方法及其装置
CN111274802A (zh) * 2018-11-19 2020-06-12 阿里巴巴集团控股有限公司 一种地址数据的有效性判断方法及其装置
CN109614396A (zh) * 2018-12-17 2019-04-12 广东电网有限责任公司 一种地址数据结构化与规范化的清理方法
CN111427977A (zh) * 2019-01-10 2020-07-17 阿里巴巴集团控股有限公司 电子眼数据的处理方法及装置
CN111427977B (zh) * 2019-01-10 2023-12-19 阿里巴巴集团控股有限公司 电子眼数据的处理方法及装置
CN109800280A (zh) * 2019-01-16 2019-05-24 北京神州泰岳软件股份有限公司 地址匹配方法及装置
CN109800280B (zh) * 2019-01-16 2021-07-02 鼎富智能科技有限公司 地址匹配方法及装置
WO2020168750A1 (zh) * 2019-02-18 2020-08-27 平安科技(深圳)有限公司 一种地址信息标准化方法、装置、计算机设备及存储介质
CN110032718B (zh) * 2019-04-12 2023-04-18 广州广燃设计有限公司 一种表格转换方法、系统和存储介质
CN110032718A (zh) * 2019-04-12 2019-07-19 广州广燃设计有限公司 一种表格转换方法、系统和存储介质
CN110765280B (zh) * 2019-10-22 2021-05-25 京东数字科技控股有限公司 地址识别方法和装置
CN110765280A (zh) * 2019-10-22 2020-02-07 京东数字科技控股有限公司 地址识别方法和装置
CN111159973B (zh) * 2019-12-13 2023-06-02 中关村科技软件股份有限公司 一种中文地址的行政区划补齐及标准化方法
CN111159973A (zh) * 2019-12-13 2020-05-15 中关村科技软件股份有限公司 一种中文地址的行政区划补齐及标准化方法
CN111611290B (zh) * 2020-05-14 2023-08-15 广东中科慧据科技有限公司 地址快速定位方法、装置、计算机设备及存储介质
CN111611290A (zh) * 2020-05-14 2020-09-01 深圳中科慧据科技有限公司 地址快速定位方法、装置、计算机设备及存储介质
CN113515677A (zh) * 2021-07-22 2021-10-19 中移(杭州)信息技术有限公司 地址匹配方法、装置及计算机可读存储介质
CN113515677B (zh) * 2021-07-22 2023-10-27 中移(杭州)信息技术有限公司 地址匹配方法、装置及计算机可读存储介质
CN115809315A (zh) * 2022-11-24 2023-03-17 中科星图智慧科技安徽有限公司 一种地名地址标准化匹配算法

Similar Documents

Publication Publication Date Title
CN102169498A (zh) 一种地址模型的构建方法,以及地址匹配的方法和系统
CN101350012B (zh) 一种地址匹配的方法和系统
CN107092680A (zh) 一种基于地理网格的政务信息资源整合方法
CN103605752A (zh) 一种基于语义识别的地址匹配方法
CN102880721B (zh) 垂直搜索引擎的实现方法
Zandbergen Influence of street reference data on geocoding quality
CN106611053A (zh) 一种数据清理、索引方法
CN111159973B (zh) 一种中文地址的行政区划补齐及标准化方法
Valkanas et al. Location extraction from social networks with commodity software and online data
Malinowski et al. Logical representation of a conceptual model for spatial data warehouses
Zhai et al. Geo-spatial query based on extended SPARQL
Chatterjee et al. SAGEL: smart address geocoding engine for supply-chain logistics
US9990374B2 (en) Spatial analytics extensions
US20160027020A1 (en) Method and apparatus for determining parcel build size
CN103699542A (zh) 天然气与管道技术标准本体库构建方法
CN115374198A (zh) 城市全域数据的处理方法及装置
CN114547322A (zh) 一种用于识别水环境污染的知识图谱方法
Schuurman et al. Spatial/temporal mismatch: a conflation protocol for Canada Census spatial files
KR100367050B1 (ko) 지아이에스에 기반한 수변구역 토지정보관리 방법
Ponjavic et al. Spatial data integration in heterogeneous information systems’ environment
CN111444299A (zh) 基于地址树模型的中文地址提取方法
KR100298197B1 (ko) 지리정보 객체의 레이어 생성 방법
Zhang et al. A brief analysis of geocoding
Tran et al. Exploiting WebGis technology to build an environmental database to support the environmental management of Ho Chi Minh city
Gao et al. Research of key technology in the construction of geocoding engine

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110831