CN113190596A - 一种地名地址混合匹配的方法和装置 - Google Patents

一种地名地址混合匹配的方法和装置 Download PDF

Info

Publication number
CN113190596A
CN113190596A CN202110436864.8A CN202110436864A CN113190596A CN 113190596 A CN113190596 A CN 113190596A CN 202110436864 A CN202110436864 A CN 202110436864A CN 113190596 A CN113190596 A CN 113190596A
Authority
CN
China
Prior art keywords
place name
name address
standard
matching
address data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110436864.8A
Other languages
English (en)
Other versions
CN113190596B (zh
Inventor
李俊峰
吴驰
郑競力
熊鹰
刘晓兰
严帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN202110436864.8A priority Critical patent/CN113190596B/zh
Publication of CN113190596A publication Critical patent/CN113190596A/zh
Application granted granted Critical
Publication of CN113190596B publication Critical patent/CN113190596B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Automation & Control Theory (AREA)
  • Probability & Statistics with Applications (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种地名地址混合匹配的方法和装置,属于地理信息数据处理领域,所述方法包括:对原始地名地址数据进行规范性检测,以获得规范地名地址数据;将规范地名地址数据与标准数据库进行精准匹配;当标准数据库中存在与规范地名地址数据精准匹配的地名地址时,将精确匹配所得标准地名地址作为结果输出;当标准数据库中不存在与规范地名地址数据精准匹配的地名地址时,将规范地名地址数据与标准数据库进行混合模糊匹配得到对应的标准地名地址,将所得标准地名地址作为结果输出。本发明通过将规范化后地名地址数据与标准数据库进行精准匹配及混合模糊匹配,得到的目标匹配结果丰富且准确,由此解决反馈数据单一、重复建设、资源浪费的问题。

Description

一种地名地址混合匹配的方法和装置
技术领域
本发明属于地理信息数据处理领域,更具体地,涉及一种地名地址混合匹配的方法和装置。
背景技术
在地址匹配引擎系统的不断建设下,大量的地名地址数据融合汇聚在一起。如何从复杂的地名地址数据当中寻找并定位到精准匹配信息是当前地址匹配引擎系统建设当中的重点与难点。目前的地址匹配引擎大都停留在单一匹配的模式进行检索,即通过用户输入关键字进行精确查询或模糊查询,并且返回结果也都是单一的。在实际过程中,比如同一地址因为地址名称的不一样或者存在别名、俗称的情况下,用户往往需要多次查询才能得到想要的结果甚至可能无法查询到目标地址。因此如何快速的将用户输入的地名地址变成标准的地名地址进行输出是当前的一个重要工作。
目前地址匹配引擎的数据基本都是条数据,在用户使用地址匹配引擎的时候,只能返回单一的数据,无法很好的满足用户的需求。在目标地址存在别名、俗称的情况下,当前的地址匹配引擎无法完成匹配,致使用户无法查询到目标地址,从而导致地址匹配引擎的使用和推广受到了限制。用户在使用地址匹配引擎时,无法得到想要的结果,只能建设自身专属的地址匹配引擎,存在重复建设、资源浪费的现象。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种地名地址混合匹配的方法和装置,其目的在于通过将标准化地名地址数据与标准数据库进行精准匹配及模糊匹配得到目标匹配结果,由此解决地址匹配反馈数据单一,存在重复建设、资源浪费的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种地名地址混合匹配的方法,包括:
步骤1:对原始地名地址数据进行规范性检测,以获得规范地名地址数据;
步骤2:将所述规范地名地址数据与所述标准数据库进行精准匹配;
步骤3:当所述标准数据库中存在与所述规范地名地址数据精准匹配的目标地名地址时,将所述目标地名地址作为标准地名地址输出;
步骤4:当所述标准数据库中不存在与所述规范地名地址数据精准匹配的目标地名地址时,将所述规范地名地址数据与所述标准数据库进行模糊匹配得到模糊地名地址,将所述模糊地名地址作为所述标准地名地址输出。
在其中一个实施例中,所述步骤1包括:
步骤11:对所述原始地名地址数据进行规范性检测;
步骤12:当符合规范时,将所述原始地名地址数据作为所述规范地名地址数据;
步骤13:当不符合规范时,将所述原始地名地址数据中的字母和/或数字转化为汉字,得到所述规范地名地址数据。
在其中一个实施例中,所述步骤13包括:
当所述原始地名地址数据不符合规范且携带字母时,获取所述原始地名地址数据中的字母及前后位置标示;将所述字母与标准字母地名库进行精准匹配,并根据所述字母的前后环境确定匹配结果;
当所述标准字母地名库存在与所述字母匹配的字母地址时,将所述字母修改为所述字母地址;通过拼音库对所述字母地址进行精准匹配,并根据所述字母地址前后环境将所述字母地址转换成汉字,得到所述规范地名地址数据;
当所述标准字母地名库不存在与所述字母匹配的字母地址时,通过所述拼音库对所述字母进行精准匹配,并根据所述字母前后环境将所述字母转换成汉字,得到所述规范地名地址数据。
在其中一个实施例中,所述步骤13包括:
当所述原始地名地址数据不符合规范且携带数字时,获取所述原始地名地址数据中的数字及前后位置标示;
依据所述数字的位数判断所述数字是否为楼栋号,当所述数字为楼栋号时,将所述数字转化为汉字得到所述规范地名地址数据。
在其中一个实施例中,所述步骤2包括:
步骤21:将所述规范地名地址数据与所述标准数据库中标准地名地址数据进行匹配;
步骤22:当所述标准数据库中存在与所述规范地名地址数据匹配的标准地名地址时,将匹配到的标准地名地址作为所述目标地名地址;
步骤23:当所述标准数据库中不存在与所述规范地名地址数据匹配的标准地名地址时,将所述规范地名地址数据与所述标准数据库中别名地名地址数据进行匹配,将匹配到的别名地名地址作为所述目标地名地址。
在其中一个实施例中,所述步骤4中,所述将所述规范地名地址数据与所述标准数据库进行模糊匹配得到模糊地名地址,包括:
利用Edit Distance算法进行匹配得到第一匹配结果,利用Jaro Winkler算法进行匹配得到第二匹配结果,利用N-Gram算法进行匹配得到第三匹配结果;
从所述第一匹配结果、所述第二匹配结果和所述第三匹配结果中选择最高权重的匹配结果作为所述模糊地名地址。
按照本发明的另一方面,提供了一种地名地址混合匹配的装置,包括:
标准化模块,用于对原始地名地址数据进行规范性检测,以获得规范地名地址数据;
精准匹配模块,用于将所述规范地名地址数据与所述标准数据库进行精准匹配;
第一匹配模块,用于当所述标准数据库中存在与所述规范地名地址数据匹配的目标地名地址时,将所述目标地名地址作为标准地名地址输出;
第二匹配模块,用于当所述标准数据库中不存在与所述规范地名地址数据匹配的目标地名地址时,将所述规范地名地址数据与所述标准数据库进行模糊匹配得到模糊地名地址,将所述模糊地名地址作为所述标准地名地址输出。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:
(1)本发明提供一种地名地址混合匹配的方法,包括:对原始地名地址数据进行规范性检测,以获得规范地名地址数据;将所述规范地名地址数据与所述标准数据库进行精准匹配;当所述标准数据库中不存在与所述规范地名地址数据精准匹配的目标地名地址时,将所述规范地名地址数据与所述标准数据库进行模糊匹配得到模糊地名地址,将所述模糊地名地址作为所述标准地名地址输出。通过将规范化后的规范地名地址数据与标准数据库进行精准匹配及模糊匹配得到目标匹配结果,目标匹配结果一次输入多次检测的结果、准确率高,由此解决地址匹配反馈数据单一、重复建设、资源浪费的问题。
(2)本发明方法将所述字母与标准字母地名库进行精准匹配,再将通过拼音库对所述字母地址进行精准匹配得到所述规范地名地址数据,还依据所述数字的位数判断所述数字是否为楼栋号,当所述数字为楼栋号时将所述数字转化为汉字得到所述规范地名地址数据。本发明通过使用标准字母地名库和拼音库以及解析楼栋数字对输入的地名地址进行匹配进而进行规范化处理和算法处理,最后输出标准的地名地址;输出结果准确、匹配效率高。
附图说明
图1为本发明一实施例中地名地址混合匹配方法的流程图;
图2为本发明一实施例中数据标准化过程的流程图;
图3为本发明一实施例中数据精准匹配的流程图;
图4a为本发明一实施例中数据标准化过程中拼音转汉字的流程图;
图4b为本发明一实施例中数据标准化过程中数字转汉字的流程图;
图5为本发明一实施例中数据模糊匹配的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明提供了一种地名地址混合匹配的方法,包括:
步骤1:对原始地名地址数据进行规范性检测,以获得规范地名地址数据;
步骤2:将规范地名地址数据与标准数据库进行精准匹配;
步骤3:当标准数据库中存在与规范地名地址数据精准匹配的目标地名地址时,将目标地名地址作为标准地名地址输出;
步骤4:当标准数据库中不存在与规范地名地址数据精准匹配的目标地名地址时,将规范地名地址数据与标准数据库进行模糊匹配得到模糊地名地址,将模糊地名地址作为标准地名地址输出。
如图1所示,本发明提出的基于别名的地名地址混合匹配方法及系统采取的技术方案如下:
S1:输入地名地址数据;
S2:对地名地址数据进行标准化处理;
S3:对于S2的处理结果与标准数据库进行精准匹配;若匹配成功,则跳到S5,输出标准的地名地址;若匹配失败,则进行S4;
S4:对S3的处理结果与标准数据库进行模糊匹配;
S5:最后输出标准地名地址。
进一步地,如图2所示,对S2数据标准化通过如下方式实现:
S21:获取S1的地名地址;
S22:将地名地址进行规范性检测;若符合规范,则跳到S25,输出规范的地名地址;若不符合规范,则进行S23;
S23:将地名地址数据里面的拼音转化为汉字;
S24:将经S23处理的地名地址数据里面的数字转化为汉字;
S25:输出规范地名地址。
进一步地,如图3所示,对S3中数据精准匹配通过如下方式实现:
S31:获取经S2规范化的地名地址;
S32:将规范化的地名地址与标准地名地址数据进行匹配,若符合,则跳到S34,输出标准地名地址;若不符合,则进行S33;
S33:将规范化的地名地址与别名地名地址数据进行匹配,若符合,则跳到S34,输出标准地名地址;若不符合,则直接结束;
S34:输出标准地名地址。
在其中一个实施例中,步骤1包括:
步骤11:对原始地名地址数据进行规范性检测;
步骤12:当符合规范时,将原始地名地址数据作为规范地名地址数据;
步骤13:当不符合规范时,将原始地名地址数据中的字母和/或数字转化为汉字,得到规范地名地址数据。
在其中一个实施例中,步骤13包括:
当原始地名地址数据不符合规范且携带字母时,获取原始地名地址数据中的字母及前后位置标示;将字母与标准字母地名库进行精准匹配,并根据字母的前后环境确定匹配结果;
当标准字母地名库存在与字母匹配的字母地址时,将字母修改为字母地址;通过拼音库对字母地址进行精准匹配,并根据字母地址前后环境将字母地址转换成汉字,得到规范地名地址数据;
当标准字母地名库不存在与字母匹配的字母地址时,通过拼音库对字母进行精准匹配,并根据字母前后环境将字母转换成汉字,得到规范地名地址数据。
进一步地,如图4a所示,对S23中拼音转化为汉字,过程如下:
S231:获取S22中不规范的地名地址;
S232:获取不规范地名地址中的拼音及前后位置标示;举例来说,用户输入的地名地址为“同济BF小区”,我们就得到拼音“BF”,前缀为“同济”,后缀为“小区”。
S233:将拼音与标准字母地名库进行匹配,并根据前后环境确定,匹配到结果后就修改,否则就不修改;举例来说,将上例得到的“BF”与标准字母地名库进行匹配,看是否为简写,若“BF”为某个地名的简写,我们就匹配到了地名“宝丰”并进行替换,直接输出结果;若不是简写,就不修改。
S234:通过拼音库将拼音精确匹配并根据拼音前后环境转换成标准的汉字,匹配到修改,否则就不修改;经S233判断“BF”不是简写后,将其与拼音库进行匹配,若匹配成功,则修改为“宝丰”;若匹配不到,就不修改。
S235:输出结果。
在其中一个实施例中,步骤13包括:当原始地名地址数据不符合规范且携带数字时,获取原始地名地址数据中的数字及前后位置标示;依据数字的位数判断数字是否为楼栋号,当数字为楼栋号时,将数字转化为汉字得到规范地名地址数据。
进一步地,如图4b所示,对S24中数字转化为汉字通过如下方式实现:
S241:获取S23中经过拼音匹配后的地名地址;
S242:获取地名地址中的数字及前后为位置标示;举例来说,用户输入“WS233”,则获取到的数字为“233”,前缀为“WS”,无后缀。
S243:解析获取到的数字是否是楼栋数字,楼栋数字最多含有两位数字;如不是,则跳到S245,输出结果;如是,则进行S244;;举例来说,对“233”进行解析,发现其为三位数,则不是楼栋数字。
S244:将数字转化为汉字;
S245:输出校准后的规范的地名地址。
在其中一个实施例中,步骤2包括:
步骤21:将规范地名地址数据与标准数据库中标准地名地址数据进行匹配;
步骤22:当标准数据库中存在与规范地名地址数据匹配的标准地名地址时,将匹配到的标准地名地址作为目标地名地址;
步骤23:当标准数据库中不存在与规范地名地址数据匹配的标准地名地址时,将规范地名地址数据与标准数据库中别名地名地址数据进行匹配,将匹配到的别名地名地址作为目标地名地址。
在其中一个实施例中,步骤4中,将规范地名地址数据与标准数据库进行模糊匹配得到模糊地名地址,包括:
利用Edit Distance算法进行匹配得到第一匹配结果,利用Jaro Winkler算法进行匹配得到第二匹配结果,利用N-Gram算法进行匹配得到第三匹配结果;
从第一匹配结果、第二匹配结果和第三匹配结果中选择最高权重的匹配结果作为模糊地名地址。
进一步地,如图5所示,对S4中数据模糊匹配通过如下方式实现:
S41:获取经S2规范化的地名地址;
S42:利用Edit Distance算法得到匹配结果M1;
S421:原理:是针对二个字符串的差异程度的量化量测,量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。利用递归及动态规划实现。
S422:公式:
Figure BDA0003033492220000091
X和Y是两个比较的字符串,长度分别为n、m,D(i,j)为X的前i个字符X[1...i]与Y的前j个字符Y[1...j]之间的距离,0<i<n,0<j<m,X与Y的距离用D(n,m)来表示;字符间进行比较时,基本操作有插入、替换、删除,上述公式中采用的是Levenshtein Distance,即替换的成本为2。
S43:利用Jaro Winkler算法得到匹配结果M2;
S431:原理:该算法是Jaro distance算法的变种,适合于串(如名字)这样较短的字符之间计算相似度,最后得分越高说明相似度越大,0分表示没有任何相似度,1分则代表完全匹配。
S432:Jaro distance算法得分公式:
Figure BDA0003033492220000092
其中S1、S2是要比对的两个字符,dj是最后得分,m是匹配的字符数,t是换位的数目;
Jaro–Winkler distance算法公式:dw=dj+L×P×(1-dj);其中,dw是Jarodistance最后得分,L是前缀部分匹配的长度,P是一个范围因子常量,用来调整前缀匹配的权值,Winkler的标准默认值为0.1。
S44:利用N-Gram算法得到匹配结果M3;
S441:原理:N-Gram模型是基于(n-1)阶马尔可夫链的一种概率语言模型,通过n个语词出现的概率来推断语句的结构广泛应用于文本挖掘和自然语言处理任务。
S442:公式:|GN(s)|+|GN(t)|-2×|GN(s)|∩|GN(t)|;
其中s和t是要比对的两个字符串,N值一般取2或3,GN(s)|为字符串s进行N分词后长度,|GN(t)|为字符串t进行N分词后长度,|GN(s)|∩|GN(t)|代表字符串s与t进行N分词后,其公共分词的长度;
需要说明的是,上述三个算法同时进行。
S45:将得到的结果赋以不同的权重值,M1计3分、M2计4分、M3计3分。举例来说,用户输入的“北203机房”,经过标准化后仍为“北203机房”,在精准匹配的失败的情况下,我们用混合模糊匹配,在Edit Distance、Jaro Winkle、N-Gram三个算法下得到的结果M1为南203机房、M2为北综203机房、M3为北一楼203机房,根据权重值M1计3分、M2计4分、M3计3分,我们就选取M2为最终结果。
S46:输出最高得分的匹配结果。
本发明还提供了一种地名地址混合匹配的装置,包括:
标准化模块,用于对原始地名地址数据进行规范性检测,以获得规范地名地址数据;
精准匹配模块,用于将规范地名地址数据与标准数据库进行精准匹配;
第一匹配模块,用于当标准数据库中存在与规范地名地址数据匹配的目标地名地址时,将目标地名地址作为标准地名地址输出;
第二匹配模块,用于当标准数据库中不存在与规范地名地址数据匹配的目标地名地址时,将规范地名地址数据与标准数据库进行模糊匹配得到模糊地名地址,将模糊地名地址作为标准地名地址输出。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种地名地址混合匹配的方法,其特征在于,包括:
步骤1:对原始地名地址数据进行规范性检测,以获得规范地名地址数据;
步骤2:将所述规范地名地址数据与所述标准数据库进行精准匹配;
步骤3:当所述标准数据库中存在与所述规范地名地址数据精准匹配的目标地名地址时,将所述目标地名地址作为标准地名地址输出;
步骤4:当所述标准数据库中不存在与所述规范地名地址数据精准匹配的目标地名地址时,将所述规范地名地址数据与所述标准数据库进行模糊匹配得到模糊地名地址,将所述模糊地名地址作为所述标准地名地址输出。
2.如权利要求1所述的地名地址混合匹配的方法,其特征在于,所述步骤1包括:
步骤11:对所述原始地名地址数据进行规范性检测;
步骤12:当符合规范时,将所述原始地名地址数据作为所述规范地名地址数据;
步骤13:当不符合规范时,将所述原始地名地址数据中的字母和/或数字转化为汉字,得到所述规范地名地址数据。
3.如权利要求2所述的地名地址混合匹配的方法,其特征在于,所述步骤13包括:
当所述原始地名地址数据不符合规范且携带字母时,获取所述原始地名地址数据中的字母及前后位置标示;将所述字母与标准字母地名库进行精准匹配,并根据所述字母的前后环境确定匹配结果;
当所述标准字母地名库存在与所述字母匹配的字母地址时,将所述字母修改为所述字母地址;通过拼音库对所述字母地址进行精准匹配,并根据所述字母地址前后环境将所述字母地址转换成汉字,得到所述规范地名地址数据;
当所述标准字母地名库不存在与所述字母匹配的字母地址时,通过所述拼音库对所述字母进行精准匹配,并根据所述字母前后环境将所述字母转换成汉字,得到所述规范地名地址数据。
4.如权利要求2或3所述的地名地址混合匹配的方法,其特征在于,所述步骤13包括:
当所述原始地名地址数据不符合规范且携带数字时,获取所述原始地名地址数据中的数字及前后位置标示;
依据所述数字的位数判断所述数字是否为楼栋号,当所述数字为楼栋号时,将所述数字转化为汉字得到所述规范地名地址数据。
5.如权利要求1所述的地名地址混合匹配的方法,其特征在于,所述步骤2包括:
步骤21:将所述规范地名地址数据与所述标准数据库中标准地名地址数据进行精准匹配;
步骤22:当所述标准数据库中存在与所述规范地名地址数据匹配的标准地名地址时,将匹配到的标准地名地址作为所述目标地名地址;
步骤23:当所述标准数据库中不存在与所述规范地名地址数据匹配的标准地名地址时,将所述规范地名地址数据与所述标准数据库中别名地名地址标准进行匹配,将匹配到的别名地名地址所对应的标准地名地址作为所述目标地名地址。
6.如权利要求1所述的地名地址混合匹配的方法,其特征在于,所述步骤4中,将所述规范地名地址数据与所述标准数据库进行模糊匹配得到模糊地名地址,包括:
利用Edit Distance算法进行匹配得到第一匹配结果,利用Jaro Winkler算法进行匹配得到第二匹配结果,利用N-Gram算法进行匹配得到第三匹配结果;
从所述第一匹配结果、所述第二匹配结果和所述第三匹配结果中选择最高权重的匹配结果作为所述模糊地名地址。
7.一种地名地址混合匹配的装置,其特征在于,
标准化模块,用于对原始地名地址数据进行规范性检测,以获得规范地名地址数据;
精准匹配模块,用于将所述规范地名地址数据与所述标准数据库进行精准匹配;
第一匹配模块,用于当所述标准数据库中存在与所述规范地名地址数据匹配的目标地名地址时,将所述目标地名地址作为标准地名地址输出;
第二匹配模块,用于当所述标准数据库中不存在与所述规范地名地址数据匹配的目标地名地址时,将所述规范地名地址数据与所述标准数据库进行模糊匹配得到模糊地名地址,将所述模糊地名地址作为所述标准地名地址输出。
CN202110436864.8A 2021-04-22 2021-04-22 一种地名地址混合匹配的方法和装置 Active CN113190596B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110436864.8A CN113190596B (zh) 2021-04-22 2021-04-22 一种地名地址混合匹配的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110436864.8A CN113190596B (zh) 2021-04-22 2021-04-22 一种地名地址混合匹配的方法和装置

Publications (2)

Publication Number Publication Date
CN113190596A true CN113190596A (zh) 2021-07-30
CN113190596B CN113190596B (zh) 2023-02-10

Family

ID=76978659

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110436864.8A Active CN113190596B (zh) 2021-04-22 2021-04-22 一种地名地址混合匹配的方法和装置

Country Status (1)

Country Link
CN (1) CN113190596B (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130311448A1 (en) * 2012-05-16 2013-11-21 Trans Union Llc. System and method for contextual and free format matching of addresses
CN105630765A (zh) * 2015-12-21 2016-06-01 浙江万里学院 地名地址识别方法
CN105701133A (zh) * 2014-11-28 2016-06-22 方正国际软件(北京)有限公司 一种地址输入的方法和设备
CN106445918A (zh) * 2016-09-26 2017-02-22 深圳市数字城市工程研究中心 一种中文地址处理方法及系统
CN107066112A (zh) * 2016-12-16 2017-08-18 中国科学院遥感与数字地球研究所 一种地址信息的拼音输入法及装置
US20180246906A1 (en) * 2017-02-28 2018-08-30 International Business Machines Corporation Generating a ranked list of best fitting place names
CN109165273A (zh) * 2018-08-24 2019-01-08 安徽讯飞智能科技有限公司 一种面向大数据环境的通用中文地址匹配方法
CN109271625A (zh) * 2018-08-28 2019-01-25 江苏省基础地理信息中心 一种汉语地名的拼音拼写规范化方法
CN110895651A (zh) * 2018-08-23 2020-03-20 北京京东金融科技控股有限公司 地址标准化处理方法、装置、设备及计算机可读存储介质
CN111291277A (zh) * 2020-01-14 2020-06-16 浙江邦盛科技有限公司 一种基于语义识别和高级语言搜索的地址标准化方法
CN111538796A (zh) * 2020-03-26 2020-08-14 中国平安人寿保险股份有限公司 地址规范化处理方法、装置、设备及存储介质
CN111737315A (zh) * 2020-06-15 2020-10-02 中国工商银行股份有限公司 地址模糊匹配方法及装置
CN111797182A (zh) * 2020-05-29 2020-10-20 深圳市跨越新科技有限公司 一种地址编码解析方法及系统
CN112328910A (zh) * 2020-10-10 2021-02-05 深圳航天智慧城市系统技术研究院有限公司 一种涵盖aoi和poi标准地址匹配引擎的方法及系统
US20210049326A1 (en) * 2016-06-03 2021-02-18 Bottomline Technologies (De) Inc. Identifying Non-Exactly Matching Text
CN112581252A (zh) * 2020-12-03 2021-03-30 信用生活(广州)智能科技有限公司 融合多维相似度与规则集合的地址模糊匹配方法及系统

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130311448A1 (en) * 2012-05-16 2013-11-21 Trans Union Llc. System and method for contextual and free format matching of addresses
CN105701133A (zh) * 2014-11-28 2016-06-22 方正国际软件(北京)有限公司 一种地址输入的方法和设备
CN105630765A (zh) * 2015-12-21 2016-06-01 浙江万里学院 地名地址识别方法
US20210049326A1 (en) * 2016-06-03 2021-02-18 Bottomline Technologies (De) Inc. Identifying Non-Exactly Matching Text
CN106445918A (zh) * 2016-09-26 2017-02-22 深圳市数字城市工程研究中心 一种中文地址处理方法及系统
CN107066112A (zh) * 2016-12-16 2017-08-18 中国科学院遥感与数字地球研究所 一种地址信息的拼音输入法及装置
US20180246906A1 (en) * 2017-02-28 2018-08-30 International Business Machines Corporation Generating a ranked list of best fitting place names
CN110895651A (zh) * 2018-08-23 2020-03-20 北京京东金融科技控股有限公司 地址标准化处理方法、装置、设备及计算机可读存储介质
CN109165273A (zh) * 2018-08-24 2019-01-08 安徽讯飞智能科技有限公司 一种面向大数据环境的通用中文地址匹配方法
CN109271625A (zh) * 2018-08-28 2019-01-25 江苏省基础地理信息中心 一种汉语地名的拼音拼写规范化方法
CN111291277A (zh) * 2020-01-14 2020-06-16 浙江邦盛科技有限公司 一种基于语义识别和高级语言搜索的地址标准化方法
CN111538796A (zh) * 2020-03-26 2020-08-14 中国平安人寿保险股份有限公司 地址规范化处理方法、装置、设备及存储介质
CN111797182A (zh) * 2020-05-29 2020-10-20 深圳市跨越新科技有限公司 一种地址编码解析方法及系统
CN111737315A (zh) * 2020-06-15 2020-10-02 中国工商银行股份有限公司 地址模糊匹配方法及装置
CN112328910A (zh) * 2020-10-10 2021-02-05 深圳航天智慧城市系统技术研究院有限公司 一种涵盖aoi和poi标准地址匹配引擎的方法及系统
CN112581252A (zh) * 2020-12-03 2021-03-30 信用生活(广州)智能科技有限公司 融合多维相似度与规则集合的地址模糊匹配方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一个奋斗的小白: "elasticsearch使用中文拼音混合搜索的痛点解决", 《HTTPS://BLOG.CSDN.NET/WEIXIN_40334693/ARTICLE/DETAILS/103438471》 *
线传福: "多源异构POI数据清洗及融合方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Also Published As

Publication number Publication date
CN113190596B (zh) 2023-02-10

Similar Documents

Publication Publication Date Title
CN111783419B (zh) 地址相似度计算方法、装置、设备和存储介质
WO2022134592A1 (zh) 地址信息解析方法、装置、设备及存储介质
CN111291161A (zh) 法律案件知识图谱查询方法、装置、设备及存储介质
CN110717034A (zh) 一种本体构建方法及装置
US8180628B2 (en) Apparatus and method for expanding natural language query requirement
Matci et al. Address standardization using the natural language process for improving geocoding results
CN106909611B (zh) 一种基于文本信息抽取的酒店自动匹配方法
WO2015027835A1 (zh) 一种通信地址查询邮政编码的系统及终端
CN105589936A (zh) 一种数据查询方法及系统
CN112650858B (zh) 应急协助信息的获取方法、装置、计算机设备及介质
CN113282689A (zh) 基于领域知识图谱的检索方法、装置和搜索引擎
CN110888946A (zh) 一种基于知识驱动的查询的实体链接方法
CN116414823A (zh) 一种基于分词模型的地址定位方法和装置
CN116414824A (zh) 行政区划信息识别和标准化处理的方法、装置及存储介质
CN113190596B (zh) 一种地名地址混合匹配的方法和装置
CN110309258B (zh) 一种输入检查方法、服务器和计算机可读存储介质
CN112417812B (zh) 地址标准化方法、系统及电子设备
US20220327403A1 (en) Method, apparatus, and computer-readable medium for postal address indentification
CN115831117A (zh) 实体识别方法、装置、计算机设备和存储介质
CN111680122B (zh) 空间数据主动推荐方法、装置、存储介质及计算机设备
CN116431625A (zh) 一种地理实体的定位分析方法、装置及计算机设备
CN111261165B (zh) 车站名称识别方法、装置、设备及存储介质
CN116414808A (zh) 详细地址规范化的方法、装置、计算机设备和存储介质
CN114417008A (zh) 一种面向建设工程领域的知识图谱构建方法及系统
CN114003812A (zh) 地址匹配方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant