CN111914557A - 地址解析方法、装置、设备及计算机可读存储介质 - Google Patents
地址解析方法、装置、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111914557A CN111914557A CN202010757356.5A CN202010757356A CN111914557A CN 111914557 A CN111914557 A CN 111914557A CN 202010757356 A CN202010757356 A CN 202010757356A CN 111914557 A CN111914557 A CN 111914557A
- Authority
- CN
- China
- Prior art keywords
- address
- administrative division
- result
- word segmentation
- level information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Remote Sensing (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种地址解析方法、装置、设备及计算机可读存储介质,属于地址数据处理技术领域。所述方法包括:对地址进行中文分词初步切词,获取切词结果;对所述切词结果拆开地址关键字词语,并进行关键字重组,获取重组结果;从所述重组结果中提取有效行政区划级别信息,根据预设行政区划树对所述有效行政区划级别信息进行推算及有效性验证,获取行政区划级别信息结果;根据预设解析规则对所述行政区划级别信息结果进行地址解析,获取地址解析结果。本发明提高了地址解析准确率,且成本较低。
Description
技术领域
本发明涉及地址数据处理技术领域,特别涉及一种地址解析方法、装置、设备及计算机可读存储介质。
背景技术
目前主流的地址解析算法主要依赖切词算法,大体有两种:
关键字文本切词:即根据地址层级关键词标识,如:路关键词【路,大街,大道】,方位关键词【东,南,西,北】等,因为中国地址复杂多样性,该算法解析成本比较高,准确率低;
词库切词:即收集大量层级地址数据,根据词库基础进行分词,去除客户地址多余文字,如“上海上海市青浦区明珠路1018号快递周某某收,货物玻璃,轻拿轻放”,词库元素【上海/上海市/青浦区/徐泾镇/明珠路/1018/某某快递】,最终,进行分词,这种算法解析命中率差,数据维护成本高。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种地址解析方法、装置、设备及计算机可读存储介质,提高了地址解析准确率,且成本较低。所述技术方案如下:
一方面,提供了一种地址解析方法,所述方法包括:
对地址进行中文分词初步切词,获取切词结果;
对所述切词结果拆开地址关键字词语,并进行关键字重组,获取重组结果;
从所述重组结果中提取有效行政区划级别信息,根据预设行政区划树对所述有效行政区划级别信息进行推算及有效性验证,获取行政区划级别信息结果;
根据预设解析规则对所述行政区划级别信息结果进行地址解析,获取地址解析结果。
优选地,对地址进行中文分词初步切词,获取切词结果,包括:
利用apache Lucene中文分词器对地址进行中文分词初步切词,切成至少一个中文文字片段或词组,获取切词结果。
优选地,对所述切词结果拆开地址关键字词语,并进行关键字重组,获取重组结果,包括:
对所述切词结果进行关键字拼接重组和词语重组,获取行政区划级别信息。
优选地,从所述重组结果中提取有效行政区划级别信息,根据预设行政区划树对所述有效行政区划级别信息进行推算及有效性验证,获取行政区划级别信息结果,包括:
从所述重组结果中提取有效行政区划级别信息,根据预设行政区划树判断所述有效行政区划级别信息是否正确,在不正确的情况下推算出相应正确行政区划级别信息。
优选地,根据预设解析规则对所述行政区划级别信息结果进行地址解析,获取地址解析结果,包括:
根据预设区全镜地址映射关系、预设镇全境地址映射关系、预设路全境地址映射关系、预设号全境地址映射关系、预设单双号地址映射关系、预设路+地标地址映射关系、预设关键字地址映射关系中的至少一种对所述行政区划级别信息结果进行地址解析,获取地址解析结果。
优选地,所述方法还包括:
获取国标行政区划录入行政区划库,构建所述预设行政区划树,并将营业部地理基础资料写入索引库。
优选地,所述索引库采用elasticSearch Oracle数据库,前端使用vue框架,后端采用java开发。
另一方面,提供了一种地址解析装置,包括:
切词模块,用于:对地址进行中文分词初步切词,获取切词结果;
关键字重组模块,用于:对所述切词结果拆开地址关键字词语,并进行关键字重组,获取重组结果;
行政区划级别信息获取模块,用于:从所述重组结果中提取有效行政区划级别信息,根据预设行政区划树对所述有效行政区划级别信息进行推算及有效性验证,获取行政区划级别信息结果;
地址解析模块,用于:根据预设解析规则对所述行政区划级别信息结果进行地址解析,获取地址解析结果。
优选地,所述切词模块,用于:利用apache Lucene中文分词器对地址进行中文分词初步切词,切成至少一个中文文字片段或词组,获取切词结果。
优选地,所述关键字重组模块,用于:
对所述切词结果进行关键字拼接重组和词语重组,获取行政区划级别信息。
优选地,所述行政区划级别信息获取模块,用于:
从所述重组结果中提取有效行政区划级别信息,根据预设行政区划树判断所述有效行政区划级别信息是否正确,在不正确的情况下推算出相应正确行政区划级别信息。
优选地,所述地址解析模块,用于::
根据预设区全镜地址映射关系、预设镇全境地址映射关系、预设路全境地址映射关系、预设号全境地址映射关系、预设单双号地址映射关系、预设路+地标地址映射关系、预设关键字地址映射关系中的至少一种对所述行政区划级别信息结果进行地址解析,获取地址解析结果。
优选地,所述装置还包括数据库创建模块,用于:
获取国标行政区划录入行政区划库,构建所述预设行政区划树,并将营业部地理基础资料写入索引库。
优选地,所述索引库采用elasticSearch Oracle数据库,前端使用vue框架,后端采用java开发。
又一方面,提供了一种地址解析设备,包括:
处理器;
存储器,用于存储有所述处理器的可执行指令;
其中,所述处理器配置为经由所述可执行指令来执行上述方案任一项所述的销售信息数据处理方法的步骤。
又一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一方案所述的地址解析方法。
本发明实施例提供的技术方案带来的有益效果是:
考虑到地址分级级别越多准确率越低,分词代价越大,所以本着尽量减少分词级别来解析,通过设置符合快递业务形式的逐级解析方式,跳过复杂分词的方式,针对特定地理分级级别进行快速解析,解析准确率、匹配率高,零担命中率高,且解析成本低,维护成本低。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例1提供的地址解析方法流程图;
图2是数据模型框图;
图3是地址解析过程示例;
图4是地址解析过程示例;
图5是本发明实施例2提供的地址解析装置结构示意图;
图6是本发明实施例3提供的地址解析设备结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在本发明的描述中,“多个”的含义是两个以上,除非另有明确具体的限定。
本发明实施例提供的地址解析方法、装置、设备及计算机可读存储介质,考虑到地址分级级别越多准确率越低,分词代价越大,所以本着尽量减少分词级别来解析,通过设置符合快递业务形式的逐级解析方式,跳过复杂分词的方式,针对特定地理分级级别进行快速解析,解析准确率、匹配率高,零担命中率高,且解析成本低,维护成本低。因此,该地址解析方案适用于涉及地址解析的物流、快递、运输配送等领域多种应用场景。
下面结合具体实施例及附图,对本发明实施例提供的地址解析方法、装置、设备及计算机可读存储介质详细说明。
实施例1
图1是本发明实施例1提供的地址解析方法流程图,如图1所示,该地址解析方法,包括以下步骤:
101、对地址进行中文分词初步切词,获取切词结果。
优选地,利用apache Lucene中文分词器对地址进行中文分词初步切词,切成至少一个中文文字片段或词组,获取切词结果。示例性地,上海上海市徐泾镇明珠路1018号,切成上/海/上/海/市/徐/泾镇/明珠/路1018/号。
另外,优选地,在上述101步骤之前,获取国标行政区划录入行政区划库,构建预设行政区划树,并将营业部地理基础资料写入索引库。进一步优选地,索引库采用elasticSearch Oracle数据库,前端使用vue框架,后端采用java开发。
即进行前期的数据准备,示例性地,由于零担(大件快递产品,如木材,家具)营业部通常派送范围特别广,通常是区,乡镇层级;快递营业部派送量大,相对范围比较小,通常是以路来做营业部的界限,因此可以设计省/市/区/乡镇/路/号/地标/营业部编码这样7层地理层级作为基础资料库,正如图2所示。具体地,获取国标四级行政区划(省,市,区,乡镇)录入四级行政区划库,并写入jvm内存,构建四级行政区划树结构(Map)形式,一线同事维护营业部地理基础资料库写入elasticSearch索引库,主要根据解析方式中的预设区全境地址映射关系、预设镇全境地址映射关系预设路全境地址映射关系、预设号全境地址映射关系、预设单双号地址映射关系、预设路+地标地址映射关系、预设关键字地址映射关系,维护基础资料数据(地址和营业部文本映射关系)。其中,区全境:全区派送;镇全境:全镇派送;路全境:全路段派送;号全境:路段+全路号派送(例如:明珠路1-999号:派送范围:明珠路1号--明珠路999号都是该营业部派送范围)单双号:路段+单号派送(例如:明珠路1-999号:派送范围:明珠路1号,明珠路3号,明珠路5号等是该营业部派送范围);路段+双号派送(例如:明珠路1-999号:派送范围:明珠路2号,明珠路4号,明珠路6号等是该营业部派送范围);路+地标:路段下某类地标性地理位置是该营业部派送范围;地址分级(地址分词分级):由低到高;省份:1级,城市:2级,区县:3级,乡镇:4级,开发区:5级,乡村:6级,主路:7级,主路号:8级,支路:9级,支路号:10级,地标、楼栋:11级;楼号、单元号:12级。
值得注意的是,步骤101的过程,除了上述步骤所述的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
102、对切词结果拆开地址关键字词语,并进行关键字重组,获取重组结果。
优选地,对切词结果进行关键字拼接重组和词语重组,获取行政区划级别信息。示例性地,拆开地址关键字词语:市、区、镇,上面地址切分完上/海/上/海/市/徐/泾/镇/明珠/路1018/号;关键字重组,token为词语重组的开始文字,后字为token往前组合,前字为token往后组合,当地标关键字为token,重组前词,上/海/上海/市/徐泾/镇/明珠/路1018/号。
值得注意的是,步骤102的过程,除了上述步骤所述的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
103、从重组结果中提取有效行政区划级别信息,根据预设行政区划树对有效行政区划级别信息进行推算及有效性验证,获取行政区划级别信息结果。优选地,从重组结果中提取有效行政区划级别信息,根据预设行政区划树判断所述有效行政区划级别信息是否正确,在不正确的情况下推算出相应正确行政区划级别信息。示例性地,提取有效省市区镇:前字为token去查找,上-上海,上/海组合有效词组,上海-上海/上海市,由于后关键字为市,组合为上海市有效词组,徐泾镇同理,五级地址不再做分词处理降低成本,组合后上海/上海市/徐泾镇/明珠路1018号;推算及有效性验证,根据行政区划树验证省市区乡镇分词是否正确,同时推算出区县为青浦区,即上海/上海市/青浦区/徐泾镇/珠路1018号,行政区划分词结束。
值得注意的是,步骤103的过程,除了上述步骤所述的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
104、根据预设解析规则对行政区划级别信息结果进行地址解析,获取地址解析结果。
优选地,根据预设区全镜地址映射关系、预设镇全境地址映射关系、预设路全境地址映射关系、预设号全境地址映射关系、预设单双号地址映射关系、预设路+地标地址映射关系、预设关键字地址映射关系中的至少一种对行政区划级别信息结果进行地址解析,获取地址解析结果。示例性地,进行地址解析功能开发,地址分词省市区乡镇四级,根据luncece中文分词,切成一个或者两个文字的中文文字片段或者词组,然后通过关键字重组的方式,精准区分出省、市、区、乡镇四级地址,镇全境场景,直接映射解析,路全境,号全境,单双号,关键字等同理。因为地址分级越高准确率越低,分词代价越大,所以本着尽量减少分词级别来解析快递营业部,依赖相应的级别对营业部划分业务片区,解析对应营业部,具体解析过程如图3和图4所示。鼓励一线营业区划分尽量全镇派送,沿路分区域等,并积极维护基础数据保证系统高利用率。
值得注意的是,步骤104的过程,除了上述步骤所述的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
实施例2
图5是本发明实施例2提供的地址解析装置结构示意图,如图5所示,该地址解析装置包括切词模块21、关键字重组模块22、行政区划级别信息获取模块23、地址解析模块24。
其中,切词模块21,用于:对地址进行中文分词初步切词,获取切词结果。优选地,切词模块21,用于:利用apache Lucene中文分词器对地址进行中文分词初步切词,切成至少一个中文文字片段或词组,获取切词结果。
关键字重组模块22,用于:对切词结果拆开地址关键字词语,并进行关键字重组。优选地,关键字重组模块22,用于:进行关键字拼接重组和词语重组,获取行政区划级别信息。
行政区划级别信息获取模块23,用于:提取有效行政区划级别信息,根据预设行政区划树对有效行政区划级别信息进行推算及有效性验证。优选地,行政区划级别信息获取模块23,用于:从重组结果中提取有效行政区划级别信息,根据预设行政区划树判断所述有效行政区划级别信息是否正确,在不正确的情况下推算出相应正确行政区划级别信息。
地址解析模块24,用于:根据预设解析规则对行政区划级别信息结果进行地址解析,获取地址解析结果。优选地,地址解析模块24,用于:根据预设区全镜地址映射关系、预设镇全境地址映射关系、预设路全境地址映射关系、预设号全境地址映射关系、预设单双号地址映射关系、预设路+地标地址映射关系、预设关键字地址映射关系中的至少一种对行政区划级别信息结果进行地址解析,获取地址解析结果。
实施例3
图6是本发明实施例3提供的地址解析设备结构示意图。如图6所示,本发明实施例提供的地址解析设备3包括:处理器31;存储器32,用于存储有处理器31的可执行指令,即程序;其中,处理器31配置为经由可执行指令来执行实施例1中任一方案所述的地址解析方法的步骤。
实施例4
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如实施例1任一方案所述的地址解析方法。
需要说明的是:上述实施例提供的地址解析装置、设备在触发地址解析业务时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置或设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的地址解析装置、设备与地址解析方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
综上所述,本发明实施例提供的地址解析方法、装置、设备及计算机可读存储介质,相比现有技术,具有以下有益效果:
考虑到地址分级级别越多准确率越低,分词代价越大,所以本着尽量减少分词级别来解析,通过设置符合快递业务形式的逐级解析方式,跳过复杂分词的方式,针对特定地理分级级别进行快速解析,解析准确率、匹配率高,零担命中率高,且解析成本低,维护成本低。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
本申请实施例中是参照根据本申请实施例中实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种地址解析方法,其特征在于,所述方法包括:
对地址进行中文分词初步切词,获取切词结果;
对所述切词结果拆开地址关键字词语,并进行关键字重组,获取重组结果;
从所述重组结果中提取有效行政区划级别信息,根据预设行政区划树对所述有效行政区划级别信息进行推算及有效性验证,获取行政区划级别信息结果;
根据预设解析规则对所述行政区划级别信息结果进行地址解析,获取地址解析结果。
2.根据权利要求1所述的方法,其特征在于,对地址进行中文分词初步切词,获取切词结果,包括:
利用apache Lucene中文分词器对地址进行中文分词初步切词,切成至少一个中文文字片段或词组,获取切词结果。
3.根据权利要求1所述的方法,其特征在于,对所述切词结果拆开地址关键字词语,并进行关键字重组,获取重组结果,包括:
对所述切词结果进行关键字拼接重组和词语重组,获取行政区划级别信息。
4.根据权利要求1所述的方法,其特征在于,从所述重组结果中提取有效行政区划级别信息,根据预设行政区划树对所述有效行政区划级别信息进行推算及有效性验证,获取行政区划级别信息结果,包括:
从所述重组结果中提取有效行政区划级别信息,根据预设行政区划树判断所述有效行政区划级别信息是否正确,在不正确的情况下推算出相应正确行政区划级别信息。
5.根据权利要求1所述的方法,其特征在于,根据预设解析规则对所述行政区划级别信息结果进行地址解析,获取地址解析结果,包括:
根据预设区全镜地址映射关系、预设镇全境地址映射关系、预设路全境地址映射关系、预设号全境地址映射关系、预设单双号地址映射关系、预设路+地标地址映射关系、预设关键字地址映射关系中的至少一种对所述行政区划级别信息结果进行地址解析,获取地址解析结果。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
获取国标行政区划录入行政区划库,构建所述预设行政区划树,并将营业部地理基础资料写入索引库。
7.根据权利要求6所述的方法,其特征在于,所述索引库采用elasticSearch Oracle数据库,前端使用vue框架,后端采用java开发。
8.一种地址解析装置,其特征在于,包括:
切词模块,用于:对地址进行中文分词初步切词,获取切词结果;
关键字重组模块,用于:对所述切词结果拆开地址关键字词语,并进行关键字重组,获取重组结果;
行政区划级别信息获取模块,用于:从所述重组结果中提取有效行政区划级别信息,根据预设行政区划树对所述有效行政区划级别信息进行推算及有效性验证,获取行政区划级别信息结果;
地址解析模块,用于:根据预设解析规则对所述行政区划级别信息结果进行地址解析,获取地址解析结果。
9.一种地址解析设备,其特征在于,包括:
处理器;
存储器,用于存储有所述处理器的可执行指令;
其中,所述处理器配置为经由所述可执行指令来执行权利要求1至7中任一项所述的销售信息数据处理方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一所述的地址解析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010757356.5A CN111914557A (zh) | 2020-07-31 | 2020-07-31 | 地址解析方法、装置、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010757356.5A CN111914557A (zh) | 2020-07-31 | 2020-07-31 | 地址解析方法、装置、设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111914557A true CN111914557A (zh) | 2020-11-10 |
Family
ID=73287302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010757356.5A Pending CN111914557A (zh) | 2020-07-31 | 2020-07-31 | 地址解析方法、装置、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111914557A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112559661A (zh) * | 2020-12-09 | 2021-03-26 | 北京百度网讯科技有限公司 | 检索地址类型的方法、装置和电子设备 |
CN114510935A (zh) * | 2020-11-17 | 2022-05-17 | 顺丰科技有限公司 | 双地址文本识别方法、装置、计算机设备和存储介质 |
WO2022100154A1 (zh) * | 2020-11-16 | 2022-05-19 | 深圳壹账通智能科技有限公司 | 基于人工智能的地址标准化方法、装置、设备和存储介质 |
CN117131867A (zh) * | 2022-05-17 | 2023-11-28 | 贝壳找房(北京)科技有限公司 | 房本地址拆分方法、装置、计算机程序产品和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537062A (zh) * | 2014-12-29 | 2015-04-22 | 北京牡丹电子集团有限责任公司数字电视技术中心 | 一种地址信息抽取方法及系统 |
CN106445918A (zh) * | 2016-09-26 | 2017-02-22 | 深圳市数字城市工程研究中心 | 一种中文地址处理方法及系统 |
CN109033086A (zh) * | 2018-08-03 | 2018-12-18 | 银联数据服务有限公司 | 一种地址解析、匹配的方法及装置 |
CN109815498A (zh) * | 2019-01-25 | 2019-05-28 | 深圳市小赢信息技术有限责任公司 | 一种中文地址标准化方法、装置及电子设备 |
CN110633345A (zh) * | 2019-08-16 | 2019-12-31 | 阿里巴巴集团控股有限公司 | 一种企业注册地址的识别方法及系统 |
CN110765773A (zh) * | 2019-10-31 | 2020-02-07 | 北京金堤科技有限公司 | 地址数据获取方法以及装置 |
CN111353309A (zh) * | 2019-12-25 | 2020-06-30 | 北京合力亿捷科技股份有限公司 | 基于文本分析处理通信质量投诉地址的方法及系统 |
-
2020
- 2020-07-31 CN CN202010757356.5A patent/CN111914557A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537062A (zh) * | 2014-12-29 | 2015-04-22 | 北京牡丹电子集团有限责任公司数字电视技术中心 | 一种地址信息抽取方法及系统 |
CN106445918A (zh) * | 2016-09-26 | 2017-02-22 | 深圳市数字城市工程研究中心 | 一种中文地址处理方法及系统 |
CN109033086A (zh) * | 2018-08-03 | 2018-12-18 | 银联数据服务有限公司 | 一种地址解析、匹配的方法及装置 |
CN109815498A (zh) * | 2019-01-25 | 2019-05-28 | 深圳市小赢信息技术有限责任公司 | 一种中文地址标准化方法、装置及电子设备 |
CN110633345A (zh) * | 2019-08-16 | 2019-12-31 | 阿里巴巴集团控股有限公司 | 一种企业注册地址的识别方法及系统 |
CN110765773A (zh) * | 2019-10-31 | 2020-02-07 | 北京金堤科技有限公司 | 地址数据获取方法以及装置 |
CN111353309A (zh) * | 2019-12-25 | 2020-06-30 | 北京合力亿捷科技股份有限公司 | 基于文本分析处理通信质量投诉地址的方法及系统 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022100154A1 (zh) * | 2020-11-16 | 2022-05-19 | 深圳壹账通智能科技有限公司 | 基于人工智能的地址标准化方法、装置、设备和存储介质 |
CN114510935A (zh) * | 2020-11-17 | 2022-05-17 | 顺丰科技有限公司 | 双地址文本识别方法、装置、计算机设备和存储介质 |
CN112559661A (zh) * | 2020-12-09 | 2021-03-26 | 北京百度网讯科技有限公司 | 检索地址类型的方法、装置和电子设备 |
CN112559661B (zh) * | 2020-12-09 | 2024-03-01 | 北京百度网讯科技有限公司 | 检索地址类型的方法、装置和电子设备 |
CN117131867A (zh) * | 2022-05-17 | 2023-11-28 | 贝壳找房(北京)科技有限公司 | 房本地址拆分方法、装置、计算机程序产品和存储介质 |
CN117131867B (zh) * | 2022-05-17 | 2024-05-14 | 贝壳找房(北京)科技有限公司 | 房本地址拆分方法、装置、计算机程序产品和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111914557A (zh) | 地址解析方法、装置、设备及计算机可读存储介质 | |
CN108628811B (zh) | 地址文本的匹配方法和装置 | |
CN101350012B (zh) | 一种地址匹配的方法和系统 | |
Zhang et al. | Quality evaluation of volunteered geographic information: The case of OpenStreetMap | |
CN111625732B (zh) | 地址匹配方法及装置 | |
CN112069276A (zh) | 地址编码方法、装置、计算机设备及计算机可读存储介质 | |
CN103514235B (zh) | 一种增量码库的建立方法和装置 | |
CN110309432B (zh) | 基于兴趣点的同义词确定方法、地图兴趣点处理方法 | |
CN112988715B (zh) | 一种基于开源方式的全球网络地名数据库的构建方法 | |
CN110060472B (zh) | 道路交通事件定位方法、系统、可读存储介质和设备 | |
CN110990520A (zh) | 一种地址编码方法、装置、电子设备和存储介质 | |
CN111931077A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN110990651B (zh) | 地址数据处理方法、装置、电子设备及计算机可读介质 | |
CN111581496A (zh) | 一种基于搜索引擎关键词数据的行业数据分析方法及数据分析平台 | |
CN107247716B (zh) | 一种增加电子眼信息的方法及装置、导航芯片及服务器 | |
CN101567150A (zh) | 一种数字地图精确定位的方法 | |
Loai Ali et al. | Towards rule-guided classification for volunteered geographic information | |
David et al. | Smart geocoding of objects | |
CN114003812A (zh) | 地址匹配方法、系统、设备及存储介质 | |
Aksoy et al. | Comparison of the data matching performances of string similarity algorithms in big data | |
CN111143492A (zh) | 地图信息创建装置、方法以及存储介质 | |
CN105786922B (zh) | 一种缺失电子地图数据的确定方法和设备 | |
CN111198912A (zh) | 一种地址数据处理方法及其装置 | |
CN114707805B (zh) | 基于aoi数据的交通小区各类型用地面积获取方法及设备 | |
JP2007257080A (ja) | 地点情報検索装置、地点情報検索方法及び地点情報検索用プログラム並びに地点情報更新用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |