CN109359200A - 地名地址数据智能解析系统 - Google Patents
地名地址数据智能解析系统 Download PDFInfo
- Publication number
- CN109359200A CN109359200A CN201811185582.XA CN201811185582A CN109359200A CN 109359200 A CN109359200 A CN 109359200A CN 201811185582 A CN201811185582 A CN 201811185582A CN 109359200 A CN109359200 A CN 109359200A
- Authority
- CN
- China
- Prior art keywords
- address
- matching
- alias
- matched
- participle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种地名地址数据智能解析系统,能够对大批量非结构化地址进行解析,通过制定地名地址的层级标准(省‑市‑区‑街道‑门牌号/小区‑楼栋‑单元‑层‑户),积累一个丰富的别名体系与别名库,研发出一套针对各城市特性差异的地址拆分与匹配算法,能够高效且准确的进行地址解析,同时可以进行多坐标系的坐标输出。
Description
技术领域
本发明涉及地名地址的规范标准、数据的拆分标准化、地址层级的智能匹配算法的相关的地址数据处理与解析检索领域,尤其是涉及一种地名地址数据智能解析系统。
背景技术
地名地址,地名是具体位置的名称说明,地址是描述一个位置的从省市开始到详细门牌或房号信息,然而中国的地址都是一长串没有任何分隔的文本串,需要进行分段解析后进行具体定位。地址根据其描述的范围是由不同的层级界定,不同的城市对于地址的与命名有所不同,城市特征比较明显。省、市、区、街道办、乡镇、楼栋号、单元号和房号,相对规则比较统一和明确,地址级别中的小区级名称由开发商自命名,命名无规律,需要收集其命名或别名集合进行界定,配合一套智慧的地址拆分算法,先将地址标准化拆分定级后,再进行逐级匹配。
地址是跨行业数据进行不同业务数据关联的唯一标识。例如,现在各行业数据中,在用户注册开通业务时,都会登记其地址信息,或是在投建用户关联设施或是服务时,登记所处地址和位置地址信息。在进行多维度数据分析时,需要将不同业务数据进行关联处理,就必须要使用地址解析系统。在跨行业对接地址时,存在以下问题:
(1)地址层级划分或地址分类不同。
(2)同一位置地址或地名描述不同。
(3)地址的编写方式或表述差异很大。
(4)实际地址名称或门牌号命名各城市差异很大。
发明内容
本发明提供了一种地名地址数据智能解析系统,其目的是解决目前地名地址规范不够标准与体系不够完善,以及地址解析不够精准和匹配地址主要是兴趣点(POI-Pointof Interest)或地名上匹配的问题。特拟定一套完整的地名地址标准体系,依据地址标准,通过人工收集、机器学习与知识积累,构建地址拆分的分词库,并研发新型地址拆分算法,同时根据拆分结果进行地址逐级的智能匹配,最后输出地址解析后的结果。另外,在地址解析性能与并发性上针对于大数量的访问,提供高性能与稳定性的支持。其技术方案如下所述:
一种地名地址数据智能解析系统,采用基础匹配的地址解析,包括下列步骤:
(1)预先建立储存有专利名址数据状态属性与别名属性对应关系的关联数据库,形成专利数据库;
(2)提供知识积累的分词库和别名库;
(3)用户输入地址后,通过地址拆分模块进行地址层级分类归属处理,将非结构化的地址标准化,形成标准化的地址数据;
(4)采用地址解析匹配模块将标准化的地址数据进行与专利数据库的数据逐级匹配操作,根据匹配结果和匹配的准确度进行数据返回。
进一步的,步骤(3)中,所述分词库和别名库含盖每个层级地址的尽可能丰富的关键字、名字和别名,拆分模块调用分词库和别名库,通过分词与别名作为拆分关键字,将非结构化的地址标准化。
进一步的,步骤(3)中,所述拆分模块包括分词管理子模块,所述分词管理子模块对分词所用的关键字进行筛选与维护;拆分模块还包括别名维护子模块,所述别名维护子模块对地址每个级别进行筛选与别名、常用名、归属上级别名维护。
所述分词管理子模块包括分词调整的维护管理子模块、分词词典程序加载子模块、分词查询检索子模块。
所述别名维护子模块包括别名新增、别名修改、别名删除、别名检索、使用状态维护各模块,用于别名级别的管理。
所述拆分模块将非结构化的地址标准化的步骤包括提取城市的拆分、提取行政区的拆分、提取街道办事处的拆分、提取小区的拆分、提取楼栋的拆分、提取单元的拆分、提取层和户拆分,按照拟定的地址规范进行标准化地址,通过分词和别名等关键字,逐级抽取地址的各层级形成标准化后的地址信息。
进一步的,步骤(4)中,地址解析匹配模块的匹配方法步骤如下所述:
将标准化的地址,逐级匹配,先进行城市和行政区的匹配,将地址归属在某个行政区划范围内;
再通过道路号或街道办名称或小区与楼栋位置,通过空间点面计算判断其归属街道办事处进行匹配;
根据区域范围内的小区名或小区别名或路道号等,与专利地址库的小区进行匹配;
根据匹配上的小区,找其下级楼栋信息,进行匹配,同理进行单元和户的匹配。
针对个别城市地址直接到单元的,需要针对此类做匹配顺序调整,先匹配单元级别,再往上查找楼栋或小区。
进一步的,匹配方法中还包括:
地址空间匹配使用坐标进行邻近、包含等关系进行空间的点面包含计算和道路相邻计算匹配;
中文解析为拼音进行拼音匹配,以及拼音首字母匹配;
匹配歧义处理,根据拆分词元所在文字地址的位置以及相邻词元的级别进行歧义分析,获取拼接后结果进行对应的分级匹配处理;
匹配同义词处理,根据中文词典同义词进行同义词识别,进行同义词与对应级别地址互等;
匹配繁体字处理,根据繁体字和简体字对应关系进行转化,使用转化后简体字进行对应级别地址互等;
匹配字符全角半角以及特殊字符符号处理,全角半角根据计算机字符类型进行统一转换为半角,使用统一字符符号字典将同类字符符号归类转换为归类后字符展现,最后使用转换后字符进行对应级别地址互等;
文本相似度匹配,使用文本相似度分析进行相关对比,获取不相似部分进行规则分析进行匹配;
文本拆分规则,根据不同城市地址规则模型,进行不同级别地址拼接进行匹配。
此外,除了采用基础匹配的地址解析,还能够采用积累匹配、外围接口、空间匹配、POI匹配的地址解析,积累匹配、外围接口、空间匹配、POI匹配的数据补入到专利数据库,所述积累匹配返回是指通过积累的历史匹配结果读取返回,所述外围接口返回是指通过外接平台外的记录数据获取结果后读取返回,所述空间匹配返回是指通过空间坐标进来匹配返回,所述POI匹配返回是指通过兴趣点识别进行匹配后读取返回;
所述空间匹配中会涉及到坐标所属的坐标系不同,解析系统中的坐标转换模块将地址的空间位置信息,进行常用坐标系转换
本发明通过制定地名地址的层级标准(省-市-区-街道-门牌号/小区-楼栋-单元-层-户),积累一个丰富的别名体系与别名库,研发出一套针对各城市特性差异的地址拆分与匹配算法,能够高效且准确的进行地址解析,同时可以进行多坐标系的坐标输出。
附图说明
图1是地址解析总流程图;
图2是地址拆分流程示意图;
图3是地址匹配流程示意图。
具体实施方式
为了实现上述目的,本发明提供一种地名地址数据智能解析系统,是一种地名地址可自动解析的智能系统,能够对大批量非结构化地址进行解析,如图1所示,在数据处理平台上,用户输入地址后,返回的解析地址可以采用积累匹配返回、基础匹配返回、外围接口返回、空间匹配返回、POI(兴趣点)匹配返回。所述积累匹配返回是指通过积累的历史匹配结果读取返回,所述外围接口返回是指通过外接平台外的记录数据获取结果后读取返回,所述空间匹配返回是指通过空间坐标进来匹配返回,所述POI匹配返回是指通过兴趣点识别进行匹配后读取返回,所述基础匹配返回是指通过对用户输入的地址进行拆分解析等操作后读取返回。
所述积累匹配可以根据街道办接口,小区、楼栋、单元、户接口,逆地址解析,城市识别接口,楼盘地址接口完成历史匹配,并读取返回。
其中,逆地址解析是指地址从小到大的顺序,整合成地域范围从大到小的顺序。
不管哪种匹配方式,最终都要实现楼栋单元层户匹配。
在实际使用时,除了积累匹配是根据历史数据进行实现,其他的匹配方式都会留下对应的操作历史数据,进而为积累匹配完成数据基础。
其中的基础匹配的地址解析操作,包括:全量地址存储的专利地址库、将非结构化的地址标准化的分词库和别名库、地址拆分分段处理模块(简称拆分模块)、地址解析匹配模块。
操作时,在数据处理平台通过拆分模块调用分词库和别名库,将非结构化的地址标准化,传送给地址解析匹配模块与专利地址库进行匹配,获取最终的地址解析结果。
所述专利地址库是地名地址解析的目标数据的全国地名地址数据库,所述分词库与别名库都为拆分的知识学习与积累数据库,所述拆分模块预先将待解析地址即非结构化的地址进行标准化处理,为地址解析匹配模块做好数据预处理,所述地址解析匹配模块与专利地址库相连。
以下是各部分的介绍:
专利地址库是建立核心有专利地名地址数据的数据库,含盖全量地址数据,并做好地址标准化处理,以及空间处理数据。
建立各层级地址数据的分词库和别名库,含盖每个层级地址的尽可能丰富的关键字、名字和别名。
拆分模块,通过分词与别名作为拆分关键字,进行将非结构化的地址进行标准化和结构化处理,得到地址的层级化数据。
匹配模块,将标准化后的地址,通过连接专利地址库进行匹配算法进行检索地址库,将最终匹配后的结果进行返回。所述匹配算法是实现表述一致或者尽量达到最接近表述。
优选地,拆分模块包括有分词管理子模块,所述分词管理子模块可以对分词所用的关键字进行筛选与维护。
优选地,拆分模块还包括别名维护子模块,所述别名维护子模块可以对地址每个级别进行筛选与别名、常用名、归属上级别名维护。
优选地,所述数据处理平台为地址处理与地址匹配,以及数据知识积累的人工作业平台。
优选地,在空间匹配中会涉及到坐标所属的坐标系不同,坐标转换模块,将地址的空间位置信息,进行常用坐标系(墨卡托、百度、高德、WGS84等坐标系之前互相转换)转换。
本发明首先预先建立储存有专利名址数据状态属性与别名属性对应关系的关联数据库,再提供知识积累的分词库和别名库,通过地址拆分模块进行地址层级分类归属处理,结合智能匹配技术将标准化的地址数据进行与专利名址库数据逐级匹配,根据匹配结果和匹配的准确度进行数据返回。
优选的,所述拆分模块的分词管理子模块包括分词调整的维护管理子模块、分词词典程序加载子模块、分词查询检索子模块。
优选的,所述别名维护子模块包括别名新增、别名修改、别名删除、别名检索、使用状态维护,别名级别的管理。
优选的,所述拆分模块包括提取城市的拆分、提取行政区的拆分、提取街道办事处的拆分、提取小区的拆分、提取楼栋的拆分、提取单元的拆分、提取层和户拆分,按照拟定的地址规范进行标准化地址。见图2。通过分词和别名等关键字,逐级抽取地址的各层级标准化后的地址信息。
优选的,所述匹配模块包括城市匹配、行政区匹配、街道办事处匹配、小区匹配、路牌号匹配、楼栋匹配、单元匹配、层和户匹配。见图3。
将标准化的地址,逐级匹配,先进行城市和行政区的匹配,将地址归属在某个行政区划范围内;
再通过道路号或街道办名称或小区与楼栋位置,通过空间点面计算判断其归属街道办事处进行匹配;
根据区域范围内的小区名或小区别名或路道号等,与专利地址库的小区进行匹配;
根据匹配上的小区,找其下级楼栋信息,进行匹配,同理进行单元和户的匹配。
其中,针对个别城市(如上海)地址直接到单元的,需要针对此类做匹配顺序调整,先匹配单元级别,再往上查找楼栋或小区。
优选的,所述与匹配方法相关的匹配,地址空间匹配使用坐标(点、线、面)进行邻近、包含等关系进行空间的点面包含计算和道路相邻计算匹配。
优选的,所述与匹配方法相关的匹配,中文解析为拼音进行拼音匹配,以及拼音首字母匹配。
优选的,所述与匹配方法相关的匹配歧义处理,根据拆分词元所在文字地址的位置以及相邻词元的级别进行歧义分析,获取拼接后结果进行对应的分级匹配处理。
优选的,所述与匹配方法相关的匹配同义词处理,根据中文词典同义词进行同义词识别,进行同义词与对应级别地址互等。
优选的,所述与匹配方法相关的匹配繁体字处理,根据繁体字和简体字对应关系进行转化,使用转化后简体字进行对应级别地址互等。
优选的,所述与匹配方法相关的匹配字符全角半角以及特殊字符符号处理,全角半角根据计算机字符类型进行统一转换为半角,使用统一字符符号字典将同类字符符号归类转换为归类后字符展现,最后使用转换后字符进行对应级别地址互等。
优选的,所述与匹配方法相关的文本相似度匹配,使用文本相似度分析进行相关对比,获取不相似部分进行规则分析进行匹配。
优选的,所述与匹配方法相关的文本拆分规则,根据不同城市地址规则模型,进行不同级别地址拼接进行匹配。
Claims (10)
1.一种地名地址数据智能解析系统,采用基础匹配的地址解析,包括下列步骤:
(1)预先建立储存有专利名址数据状态属性与别名属性对应关系的关联数据库,形成专利数据库;
(2)提供知识积累的分词库和别名库;
(3)用户输入地址后,通过地址拆分模块进行地址层级分类归属处理,将非结构化的地址标准化,形成标准化的地址数据;
(4)采用地址解析匹配模块将标准化的地址数据进行与专利数据库的数据逐级匹配操作,根据匹配结果和匹配的准确度进行数据返回。
2.根据权利要求1所述的地名地址数据智能解析系统,其特征在于:步骤(3)中,所述分词库和别名库含盖每个层级地址的尽可能丰富的关键字、名字和别名,拆分模块调用分词库和别名库,通过分词与别名作为拆分关键字,将非结构化的地址标准化。
3.根据权利要求1所述的地名地址数据智能解析系统,其特征在于:步骤(3)中,所述拆分模块包括分词管理子模块,所述分词管理子模块对分词所用的关键字进行筛选与维护;拆分模块还包括别名维护子模块,所述别名维护子模块对地址每个级别进行筛选与别名、常用名、归属上级别名维护。
4.根据权利要求3所述的地名地址数据智能解析系统,其特征在于:所述分词管理子模块包括分词调整的维护管理子模块、分词词典程序加载子模块、分词查询检索子模块。
5.根据权利要求3所述的地名地址数据智能解析系统,其特征在于:所述别名维护子模块包括别名新增、别名修改、别名删除、别名检索、使用状态维护各模块,用于别名级别的管理。
6.根据权利要求1所述的地名地址数据智能解析系统,其特征在于:所述拆分模块将非结构化的地址标准化的步骤包括提取城市的拆分、提取行政区的拆分、提取街道办事处的拆分、提取小区的拆分、提取楼栋的拆分、提取单元的拆分、提取层和户拆分,按照拟定的地址规范进行标准化地址,通过分词和别名等关键字,逐级抽取地址的各层级形成标准化后的地址信息。
7.根据权利要求1所述的地名地址数据智能解析系统,其特征在于:步骤(4)中,地址解析匹配模块的匹配方法步骤如下所述:
将标准化的地址,逐级匹配,先进行城市和行政区的匹配,将地址归属在某个行政区划范围内;
再通过道路号或街道办名称或小区与楼栋位置,通过空间点面计算判断其归属街道办事处进行匹配;
根据区域范围内的小区名或小区别名或路道号等,与专利地址库的小区进行匹配;
根据匹配上的小区,找其下级楼栋信息,进行匹配,同理进行单元和户的匹配。
8.根据权利要求7所述的地名地址数据智能解析系统,其特征在于:针对个别城市地址直接到单元的,需要针对此类做匹配顺序调整,先匹配单元级别,再往上查找楼栋或小区。
9.根据权利要求7所述的地名地址数据智能解析系统,其特征在于:匹配方法中还包括:
地址空间匹配使用坐标进行邻近、包含等关系进行空间的点面包含计算和道路相邻计算匹配;
中文解析为拼音进行拼音匹配,以及拼音首字母匹配;
匹配歧义处理,根据拆分词元所在文字地址的位置以及相邻词元的级别进行歧义分析,获取拼接后结果进行对应的分级匹配处理;
匹配同义词处理,根据中文词典同义词进行同义词识别,进行同义词与对应级别地址互等;
匹配繁体字处理,根据繁体字和简体字对应关系进行转化,使用转化后简体字进行对应级别地址互等;
匹配字符全角半角以及特殊字符符号处理,全角半角根据计算机字符类型进行统一转换为半角,使用统一字符符号字典将同类字符符号归类转换为归类后字符展现,最后使用转换后字符进行对应级别地址互等;
文本相似度匹配,使用文本相似度分析进行相关对比,获取不相似部分进行规则分析进行匹配;
文本拆分规则,根据不同城市地址规则模型,进行不同级别地址拼接进行匹配。
10.根据权利要求1所述的地名地址数据智能解析系统,其特征在于:除了采用基础匹配的地址解析,还能够采用积累匹配、外围接口、空间匹配、POI匹配的地址解析,积累匹配、外围接口、空间匹配、POI匹配的数据补入到专利数据库,所述积累匹配返回是指通过积累的历史匹配结果读取返回,所述外围接口返回是指通过外接平台外的记录数据获取结果后读取返回,所述空间匹配返回是指通过空间坐标进来匹配返回,所述POI匹配返回是指通过兴趣点识别进行匹配后读取返回;
所述空间匹配中会涉及到坐标所属的坐标系不同,解析系统中的坐标转换模块将地址的空间位置信息,进行常用坐标系转换。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811185582.XA CN109359200A (zh) | 2018-10-11 | 2018-10-11 | 地名地址数据智能解析系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811185582.XA CN109359200A (zh) | 2018-10-11 | 2018-10-11 | 地名地址数据智能解析系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109359200A true CN109359200A (zh) | 2019-02-19 |
Family
ID=65348830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811185582.XA Pending CN109359200A (zh) | 2018-10-11 | 2018-10-11 | 地名地址数据智能解析系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109359200A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109933797A (zh) * | 2019-03-21 | 2019-06-25 | 东南大学 | 基于Jieba分词及地址词库的地理编码方法和系统 |
CN110210020A (zh) * | 2019-05-22 | 2019-09-06 | 武汉虹信通信技术有限责任公司 | 通讯地址标准化的系统及其方法 |
CN110334172A (zh) * | 2019-07-05 | 2019-10-15 | 湖南润图科技有限公司 | 一种基于数据字典的地名地址管理方法及系统 |
CN110851638A (zh) * | 2019-11-06 | 2020-02-28 | 杭州睿琪软件有限公司 | 获取物种识别名称的方法及装置 |
CN111191084A (zh) * | 2020-04-09 | 2020-05-22 | 速度时空信息科技股份有限公司 | 一种基于图结构的地名地址的解析方法 |
CN111639493A (zh) * | 2020-05-22 | 2020-09-08 | 上海微盟企业发展有限公司 | 一种地址信息标准化方法、装置、设备及可读存储介质 |
CN111984748A (zh) * | 2019-05-22 | 2020-11-24 | 深圳中兴飞贷金融科技有限公司 | 地址信息处理方法和装置、存储介质及电子设备 |
CN112052672A (zh) * | 2020-08-28 | 2020-12-08 | 丰图科技(深圳)有限公司 | 基于地址文本的单元区域识别方法、装置和计算机设备 |
CN112289167A (zh) * | 2020-09-14 | 2021-01-29 | 北京京东振世信息技术有限公司 | 定位方法及装置、计算机可读存储介质、电子设备 |
CN112732779A (zh) * | 2020-12-29 | 2021-04-30 | 合肥市智享亿云信息科技有限公司 | 一种基于地点poi的大数据解析地址文本的方法 |
CN117131867A (zh) * | 2022-05-17 | 2023-11-28 | 贝壳找房(北京)科技有限公司 | 房本地址拆分方法、装置、计算机程序产品和存储介质 |
CN117251554A (zh) * | 2023-11-16 | 2023-12-19 | 中科星图智慧科技安徽有限公司 | 一种非标准地址转标准地址的方法 |
CN117349451A (zh) * | 2023-12-01 | 2024-01-05 | 广东中思拓大数据研究院有限公司 | 数据处理方法、数据处理装置、计算机设备和存储介质 |
CN117708262A (zh) * | 2024-02-02 | 2024-03-15 | 北京友友天宇系统技术有限公司 | 一种多维多源数据进行数据关联的方法、装置及电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101887462A (zh) * | 2010-07-14 | 2010-11-17 | 厦门精图信息技术有限公司 | 一种可持续优化地名数据库快速分级配准方法 |
CN103605752A (zh) * | 2013-11-21 | 2014-02-26 | 武大吉奥信息技术有限公司 | 一种基于语义识别的地址匹配方法 |
US20150213380A1 (en) * | 2014-01-30 | 2015-07-30 | EnergyIQ | System and Method for Dynamically Creating a Multi-Level Well Hierarchy by Integrating Data From Multiple Sources |
CN105022748A (zh) * | 2014-04-28 | 2015-11-04 | 北京图盟科技有限公司 | 一种运单地址分级方法及装置 |
CN105224622A (zh) * | 2015-09-22 | 2016-01-06 | 中国搜索信息科技股份有限公司 | 面向互联网的地名地址提取与标准化方法 |
CN105224610A (zh) * | 2015-09-08 | 2016-01-06 | 方正国际软件有限公司 | 一种地址比较的方法及设备 |
CN105630765A (zh) * | 2015-12-21 | 2016-06-01 | 浙江万里学院 | 地名地址识别方法 |
CN107016084A (zh) * | 2017-03-31 | 2017-08-04 | 江苏速度信息科技股份有限公司 | 一种地名地址快速定位与查询的方法 |
CN107066112A (zh) * | 2016-12-16 | 2017-08-18 | 中国科学院遥感与数字地球研究所 | 一种地址信息的拼音输入法及装置 |
CN107145577A (zh) * | 2017-05-08 | 2017-09-08 | 上海东方网络金融服务有限公司 | 地址标准化方法、装置、存储介质及计算机 |
-
2018
- 2018-10-11 CN CN201811185582.XA patent/CN109359200A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101887462A (zh) * | 2010-07-14 | 2010-11-17 | 厦门精图信息技术有限公司 | 一种可持续优化地名数据库快速分级配准方法 |
CN103605752A (zh) * | 2013-11-21 | 2014-02-26 | 武大吉奥信息技术有限公司 | 一种基于语义识别的地址匹配方法 |
US20150213380A1 (en) * | 2014-01-30 | 2015-07-30 | EnergyIQ | System and Method for Dynamically Creating a Multi-Level Well Hierarchy by Integrating Data From Multiple Sources |
CN105022748A (zh) * | 2014-04-28 | 2015-11-04 | 北京图盟科技有限公司 | 一种运单地址分级方法及装置 |
CN105224610A (zh) * | 2015-09-08 | 2016-01-06 | 方正国际软件有限公司 | 一种地址比较的方法及设备 |
CN105224622A (zh) * | 2015-09-22 | 2016-01-06 | 中国搜索信息科技股份有限公司 | 面向互联网的地名地址提取与标准化方法 |
CN105630765A (zh) * | 2015-12-21 | 2016-06-01 | 浙江万里学院 | 地名地址识别方法 |
CN107066112A (zh) * | 2016-12-16 | 2017-08-18 | 中国科学院遥感与数字地球研究所 | 一种地址信息的拼音输入法及装置 |
CN107016084A (zh) * | 2017-03-31 | 2017-08-04 | 江苏速度信息科技股份有限公司 | 一种地名地址快速定位与查询的方法 |
CN107145577A (zh) * | 2017-05-08 | 2017-09-08 | 上海东方网络金融服务有限公司 | 地址标准化方法、装置、存储介质及计算机 |
Non-Patent Citations (2)
Title |
---|
洪莹: ""城市地名地址匹配方法研究与实验"", 《中国优秀硕士学位论文全文数据库 基础科学辑》 * |
程琦 等: ""基于复合字典的地名地址匹配技术"", 《城市勘测》 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109933797A (zh) * | 2019-03-21 | 2019-06-25 | 东南大学 | 基于Jieba分词及地址词库的地理编码方法和系统 |
CN110210020B (zh) * | 2019-05-22 | 2023-06-20 | 武汉虹旭信息技术有限责任公司 | 通讯地址标准化的系统及其方法 |
CN110210020A (zh) * | 2019-05-22 | 2019-09-06 | 武汉虹信通信技术有限责任公司 | 通讯地址标准化的系统及其方法 |
CN111984748A (zh) * | 2019-05-22 | 2020-11-24 | 深圳中兴飞贷金融科技有限公司 | 地址信息处理方法和装置、存储介质及电子设备 |
CN110334172A (zh) * | 2019-07-05 | 2019-10-15 | 湖南润图科技有限公司 | 一种基于数据字典的地名地址管理方法及系统 |
CN110851638A (zh) * | 2019-11-06 | 2020-02-28 | 杭州睿琪软件有限公司 | 获取物种识别名称的方法及装置 |
CN111191084A (zh) * | 2020-04-09 | 2020-05-22 | 速度时空信息科技股份有限公司 | 一种基于图结构的地名地址的解析方法 |
CN111639493A (zh) * | 2020-05-22 | 2020-09-08 | 上海微盟企业发展有限公司 | 一种地址信息标准化方法、装置、设备及可读存储介质 |
CN112052672A (zh) * | 2020-08-28 | 2020-12-08 | 丰图科技(深圳)有限公司 | 基于地址文本的单元区域识别方法、装置和计算机设备 |
CN112289167A (zh) * | 2020-09-14 | 2021-01-29 | 北京京东振世信息技术有限公司 | 定位方法及装置、计算机可读存储介质、电子设备 |
CN112732779A (zh) * | 2020-12-29 | 2021-04-30 | 合肥市智享亿云信息科技有限公司 | 一种基于地点poi的大数据解析地址文本的方法 |
CN117131867A (zh) * | 2022-05-17 | 2023-11-28 | 贝壳找房(北京)科技有限公司 | 房本地址拆分方法、装置、计算机程序产品和存储介质 |
CN117131867B (zh) * | 2022-05-17 | 2024-05-14 | 贝壳找房(北京)科技有限公司 | 房本地址拆分方法、装置、计算机程序产品和存储介质 |
CN117251554A (zh) * | 2023-11-16 | 2023-12-19 | 中科星图智慧科技安徽有限公司 | 一种非标准地址转标准地址的方法 |
CN117251554B (zh) * | 2023-11-16 | 2024-02-20 | 中科星图智慧科技安徽有限公司 | 一种非标准地址转标准地址的方法 |
CN117349451A (zh) * | 2023-12-01 | 2024-01-05 | 广东中思拓大数据研究院有限公司 | 数据处理方法、数据处理装置、计算机设备和存储介质 |
CN117708262A (zh) * | 2024-02-02 | 2024-03-15 | 北京友友天宇系统技术有限公司 | 一种多维多源数据进行数据关联的方法、装置及电子设备 |
CN117708262B (zh) * | 2024-02-02 | 2024-05-31 | 北京友友天宇系统技术有限公司 | 一种多维多源数据进行数据关联的方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109359200A (zh) | 地名地址数据智能解析系统 | |
CN107330125B (zh) | 基于知识图谱技术的海量非结构化配网数据集成方法 | |
Lieberman et al. | STEWARD: architecture of a spatio-textual search engine | |
CN102395965B (zh) | 用于在数据库中搜索对象的方法 | |
CN111353030A (zh) | 基于旅游领域知识图谱的知识问答检索方法及装置 | |
CN102279894B (zh) | 基于语义的查找、集成和提供评论信息的方法及搜索系统 | |
CN104035917A (zh) | 一种基于语义空间映射的知识图谱管理方法和系统 | |
CN101882163A (zh) | 一种基于匹配规则的模糊中文地址地理赋值方法 | |
WO2021093308A1 (zh) | 提取poi名称的方法、装置、设备和计算机存储介质 | |
CN109101474B (zh) | 一种地址聚合的方法、包裹聚合的方法以及设备 | |
CN105224622A (zh) | 面向互联网的地名地址提取与标准化方法 | |
CN104375992A (zh) | 一种地址匹配的方法和装置 | |
CN103605752A (zh) | 一种基于语义识别的地址匹配方法 | |
Fileto et al. | Baquara: A holistic ontological framework for movement analysis using linked data | |
CN103514234A (zh) | 一种页面信息提取方法和装置 | |
CN104391908B (zh) | 一种图上基于局部敏感哈希的多关键字索引方法 | |
CN109165273A (zh) | 一种面向大数据环境的通用中文地址匹配方法 | |
CN107203526A (zh) | 一种查询串语义需求分析方法及装置 | |
CN107368471A (zh) | 一种网页文本中地名地址的提取方法 | |
Christen et al. | A probabilistic geocoding system based on a national address file | |
CN102880721A (zh) | 垂直搜索引擎的实现方法 | |
CN107577744A (zh) | 非标地址自动匹配模型、匹配方法以及模型建立方法 | |
CN107908627A (zh) | 一种多语言的地图poi 搜索系统 | |
CN107463711A (zh) | 一种数据的标签匹配方法及装置 | |
CN109359186A (zh) | 一种确定地址信息的方法、装置和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190219 |