CN106326233A - 地址提示方法及装置 - Google Patents

地址提示方法及装置 Download PDF

Info

Publication number
CN106326233A
CN106326233A CN201510340982.3A CN201510340982A CN106326233A CN 106326233 A CN106326233 A CN 106326233A CN 201510340982 A CN201510340982 A CN 201510340982A CN 106326233 A CN106326233 A CN 106326233A
Authority
CN
China
Prior art keywords
address
data
prompting
database
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510340982.3A
Other languages
English (en)
Other versions
CN106326233B (zh
Inventor
王艳华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cainiao Smart Logistics Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510340982.3A priority Critical patent/CN106326233B/zh
Publication of CN106326233A publication Critical patent/CN106326233A/zh
Application granted granted Critical
Publication of CN106326233B publication Critical patent/CN106326233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Abstract

本申请实施例提供地址提示方法及装置,其中一种方法包括:根据预设地址格式规则,对待处理地址执行分词操作,生成分词信息;依据分词信息确定搜索数据;其中,所述搜索数据中至少包括所述分词信息中最小等级的地址信息;由地址数据库中与搜索数据匹配的地址,构建提示地址集合;所述提示地址集合为旨在推送至终端的数据。本申请将最小等级的地址信息(最小级别行政区划和/或兴趣点信息)作为搜索数据,从而避免过多的对待处理地址中其他信息含量较小的数据进行处理,从而可以提升搜索效率。因此,本申请能够在大量地址数据中,准确高效地提示与用户地址相关的地址。

Description

地址提示方法及装置
技术领域
本申请涉及计算机技术领域,尤其涉及地址提示方法及装置。
背景技术
随着网络技术的迅速发展,为了更好地实现数据交互,许多终端应用均需要输入地址。例如,在用户由电商平台中购物后,需要输入所购物品的派送地址;当用户在导航应用中指定目的地时,需要输入目的地址;或,当用户在地图应用中搜索某个地点时,需要输入该地点的地址。
为了简化用户在输入地址时的操作,当用户输入地址的起始几个字符时,地址处理系统会向用户提示与起始几个字符相关的多个地址,将多个地址作为提示地址,以供用户在多个提示地址中选择所需的地址。
目前,地址处理系统中已存储有大量地址数据。因此如何在大量地址数据中,向用户准确高效地输出与输入地址相关的提示地址,是现在需要解决的问题。
发明内容
本申请提供地址提示方法及装置,能够在大量地址数据中,准确高效地输出与用户地址相关的地址。
与现有技术相比,本申请又提供了以下技术手段:
一种地址提示方法,包括:
根据预设地址格式规则,对待处理地址执行分词操作,生成分词信息;
依据分词信息确定搜索数据;其中,所述搜索数据中至少包括所述分词信息中最小等级的地址信息;
由地址数据库中与搜索数据匹配的地址,构建提示地址集合;所述提示地址集合为旨在推送至终端的数据。
优选的,依据分词信息确定搜索数据,包括:
在所述分词信息不包含兴趣点信息的情况下,则将所述分词信息中最低级别的行政区划信息,确定为所述搜索数据;
在所述分词信息包含的兴趣点信息的字符数量小于预设字符数量的情况下,将所述分词信息中最低级别的行政区划信息和所述兴趣点信息,一并确定为所述搜索数据;
在所述分词信息包含的兴趣点信息的字符数量不小于所述预设字符数量的情况下,将所述兴趣点信息确定为所述搜索数据。
优选的,由地址数据库中与搜索数据匹配的地址,构建提示地址集合,包括:
若在地址数据库中查找到与所述搜索数据完全一致的地址,则将与所述搜索数据完全一致的地址,添加至所述提示地址集合中。
优选的,在地址数据库中查找与所述搜索数据完全一致的地址,包括:
识别所述搜索数据的字符数量;
若所述字符数量在第一字符数量范围内,则对所述搜索数据进行标准分词操作生成多个单字符;在所述地址数据库中,查找与多个单字符均一致的地址;其中,所述地址数据库中存储有与单字符对应的地址;
若所述字符数量在第二字符数量范围内,则对所述搜索数据执行二元分词操作生成多个双字符;在所述地址数据库中,查找与所述多个双字符均一致的地址;其中,所述地址数据库中存储有与双字符对应的地址。
优选的,由地址数据库中与搜索数据匹配的地址,构建提示地址集合,包括:
若在地址数据库中未查找到与所述搜索数据完全一致的地址,则将所述搜索数据中每个字符转换为第一拼音数据;
若在地址数据库中查找到与所述第一拼音数据完全一致的地址,则将与所述第一拼音数据完全一致的地址,添加至所述提示地址集合中;其中,所述地址数据库中存储有与行政区划信息的拼音对应的地址,与兴趣点信息的拼音对应的地址,以及,与行政区划信息的拼音和兴趣点信息的拼音均对应地址。
优选的,所述由地址数据库中与搜索数据匹配的地址,构建提示地址集合,包括:
若在地址数据库中未查找到与所述第一拼音数据完全一致的地址,则在地址数据库中查找与所述搜索数据部分一致的地址;
若在地址数据库中查找到与所述搜索数据部分一致的地址,则将与所述搜索数据部分一致的地址,添加至所述提示地址集合中。
优选的,所述在地址数据库中查找与所述搜索数据部分一致的地址,包括:
对所述搜索数据执行二元分词操作生成多个双字符;
在所述地址数据库中,查找与所述多个双字符中至少一个双字符一致的地址;其中,所述地址数据库中存储有与双字符对应的地址。
优选的,还包括:
若在地址数据库中查找到与所述搜索数据完全一致的地址,则对与所述搜索数据完全一致的地址,赋予第一优先级;
若在地址数据库中查找到与所述第一拼音数据完全一致的地址,则对与所述第一拼音数据完全一致的地址,赋予第二优先级;
若在地址数据库中查找到与所述搜索数据部分一致的地址,则对与所述搜索数据部分一致的地址,赋予第三优先级;
其中,所述第一优先级高于所述第二优先级,所述第二优先级高于所述第三优先级。
优选的,推送所述提示地址集合,包括:
在所述提示地址集合中,按优先级由高到低的顺序,确定预设地址数量的提示地址;
推送预设地址数量的提示地址,及,与每一提示地址对应的优先级。
优选的,在所述获取待处理地址之后,还包括:
在确定所述待处理地址完全为汉字的情况下,在所述地址数据库中查找与所述待处理地址匹配的地址;
若未查找到与所述待处理地址匹配的地址,则执行根据预设地址格式规则对所述待处理地址执行分词操作并生成分词信息的步骤。
优选的,在所述地址数据库中查找到与所述待处理地址匹配的地址之后,还包括:
若查找到与所述待处理地址匹配的地址,则将与所述待处理地址匹配的地址,确定为所述提示地址集合。
优选的,在获取待处理地址之后,还包括:
在确定所述待处理地址不完全为汉字的情况下,将所述待处理地址中每个字符转换为拼音,生成与所述待处理地址对应的第二拼音数据;
若在地址数据库中查找到与所述第二拼音数据完全一致地址,则将与所述第二拼音数据完全一致地址,确定为所述提示地址集合;
其中,所述地址数据库中包含有若干个地址以及与每个地址一一对应的拼音。
优选的,还包括:
按预设统一地址格式,对所述待处理地址进行归一化处理。
一种地址提示方法,包括:
响应于地址输入操作,生成待处理地址;
将所述待处理地址发送至服务器;
接收由所述服务器推送的提示地址集合;其中,所述提示地址集合通过以下步骤确定:根据预设地址格式规则,对待处理地址执行分词操作,生成分词信息;依据分词信息确定搜索数据;其中,所述搜索数据中至少包括所述分词信息中最小等级的地址信息;由地址数据库中与搜索数据匹配的地址,构建提示地址集合;所述提示地址集合为旨在推送至终端的数据。
优选的,接收由所述服务器推送的提示地址集合,包括:
接收预设地址数量的提示地址及与每一提示地址对应的优先级。
优选的,还包括:
按优先级由高到低的顺序,依次显示所述预设地址数量的提示地址。
一种地址提示装置,包括:
分词单元,用于根据预设地址格式规则,对待处理地址执行分词操作,生成分词信息;
第一确定单元,用于依据分词信息确定搜索数据;其中,所述搜索数据中至少包括所述分词信息中最小等级的地址信息;
构建单元,用于由地址数据库中与搜索数据匹配的地址,构建提示地址集合;所述提示地址集合为旨在推送至终端的数据。
优选的,所述第一确定单元,包括:
第二确定单元,用于在所述分词信息不包含所述兴趣点信息的情况下,则将所述分词信息中最低级别的行政区划信息,确定为所述搜索数据;
第三确定单元,用于在所述分词信息包含的兴趣点信息的字符数量小于预设字符数量的情况下,将所述分词信息中最低级别的行政区划信息和所述兴趣点信息,一并确定为所述搜索数据;
第四确定单元,用于在所述分词信息包含的兴趣点信息的字符数量不小于所述预设字符数量的情况下,将所述兴趣点信息确定为所述搜索数据。
优选的,所述构建单元,包括:
第一查找单元,用于在地址数据库中查找与所述搜索数据完全一致的地址;
第一添加单元,用于若在地址数据库中查找到与所述搜索数据完全一致的地址,则将与所述搜索数据完全一致的地址,添加至所述提示地址集合中;
第一转换单元,用于若在地址数据库中未查找到与所述搜索数据完全一致的地址,则将所述搜索数据中每个字符转换为第一拼音数据;
第二添加单元,用于若在地址数据库中查找到与所述第一拼音数据完全一致的地址,则将与所述第一拼音数据完全一致的地址,添加至所述提示地址集合中;其中,所述地址数据库中存储有与行政区划信息的拼音对应的地址,与兴趣点信息的拼音对应的地址,以及,与行政区划信息和兴趣点信息两者的拼音对应地址;
第二查找单元,用于若在地址数据库中未查找到与所述第一拼音数据完全一致的地址,则在地址数据库中查找与所述搜索数据部分一致的地址;
第三添加单元,用于若在地址数据库中查找到与所述搜索数据部分一致的地址,则将与所述搜索数据部分一致的地址,添加至所述提示地址集合中。
优选的,所述第一查找单元,包括:
识别单元,用于识别所述搜索数据的字符数量;
标准查找单元,用于若所述字符数量在第一字符数量范围内,则对所述搜索数据进行标准分词操作生成多个单字符;在所述地址数据库中,查找与多个单字符均一致的地址;其中,所述地址数据库中存储有与单字符对应的地址;
二元查找单元,用于若所述字符数量在第二字符数量范围内,则对所述搜索数据执行二元分词操作生成多个双字符,在所述地址数据库中,查找与所述多个双字符均一致的地址;其中,所述地址数据库中存储有与双字符对应的地址。
优选的,所述第二查找单元,包括:
二元分词单元,用于对所述搜索数据执行二元分词操作生成多个双字符;
二元部分查找单元,用于在所述地址数据库中,查找与所述多个双字符中至少一个双字符一致的地址;其中,所述地址数据库中存储有与双字符对应的地址。
优选的,还包括:
第一赋予单元,用于若在地址数据库中查找到与所述搜索数据完全一致的地址,则对与所述搜索数据完全一致的地址,赋予第一优先级;
第二赋予单元,用于若在地址数据库中查找到与所述第一拼音数据完全一致的地址,则对与所述第一拼音数据完全一致的地址,赋予第二优先级;
第三赋予单元,用于若在地址数据库中查找到与所述搜索数据部分一致的地址,则对与所述搜索数据部分一致的地址,赋予第三优先级;
其中,所述第一优先级高于所述第二优先级,所述第二优先级高于所述第三优先级。
优选的,所述装置还包括:推送单元;
所述推送单元,包括:
第五确定单元,用于在所述提示地址集合中,按优先级由高到低的顺序确定预设地址数量的提示地址;
推送地址单元,用于推送预设地址数量的提示地址,及,与每一提示地址对应的优先级。
优选的,还包括:
第三查找单元,在确定所述待处理地址完全为汉字的情况下,在所述地址数据库中查找与所述待处理地址匹配的地址;若未查找到,则进入分词单元;
所述构建单元,具体用于若查找到与所述待处理地址匹配的地址,则将与所述待处理地址匹配的地址,构建为所述提示地址集合。
优选的,还包括:
第二转换单元,用于在确定所述待处理地址不完全为汉字的情况下,将所述待处理地址中每个字符转换为拼音,生成与所述待处理地址对应的第二拼音数据;
第六确定单元,用于若在地址数据库中查找到与所述第二拼音数据完全一致地址,则将与所述第二拼音数据完全一致地址,确定为所述提示地址集合;
其中,所述地址数据库中包含有若干个地址以及与每个地址一一对应的拼音。
优选的,还包括:
归一化单元,用于按预设统一地址格式,对所述待处理地址进行归一化处理。
一种地址提示装置,包括:
生成单元,用于响应于地址输入操作,生成待处理地址;
发送单元,用于将所述待处理地址发送至服务器;
接收单元,用于接收由所述服务器推送的提示地址集合;其中,所述提示地址集合通过以下步骤确定:根据预设地址格式规则,对待处理地址执行分词操作,生成分词信息;依据分词信息确定搜索数据;其中,所述搜索数据中至少包括所述分词信息中最小等级的地址信息;由地址数据库中与搜索数据匹配的地址,构建提示地址集合;所述提示地址集合为旨在推送至终端的数据。
优选的,所述接收单元具体用于,接收预设地址数量的提示地址及与每一提示地址对应的优先级。
优选的,还包括:
显示单元,用于按优先级由高到低的顺序,依次显示所述预设地址数量的提示地址。
与现有技术相比,本申请具有以下有益效果:
本申请实施例中,将待处理地址中最小等级的地址信息(最小级别行政区划和/或兴趣点信息),作为搜索待处理地址时所使用的搜索数据。由于最小等级的地址信息是待处理地址中最能够表示待处理地址的数据,即信息含量最大的数据,所以依据最小等级的地址信息进行搜索,能够准确获得与待处理地址相关的地址。
并且,本申请仅仅将最小级别行政区划和/或兴趣点信息作为搜索数据,从而避免过多的对待处理地址中其他信息含量较小的数据进行处理,从而可以提升搜索效率。因此,本申请能够在大量地址数据中,准确高效地提示与用户地址相关的地址。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的地址提示方法实施例一的流程图;
图2为本申请实施例公开的地址提示方法实施例一中判断是否满足预设条件的流程图;
图3为本申请实施例公开的地址提示方法实施例一中构建提示地址集合的流程图;
图4为本申请实施例公开的地址提示方法实施例一中查找与搜索数据完全一致的流程图;
图5为本申请实施例公开的地址提示方法实施例一中查找与搜索数据部分一致的流程图;
图6为本申请实施例公开的地址提示方法实施例一中确定提示地址集合的流程图;
图7为本申请实施例公开的地址提示方法实施例二的流程图;
图8为本申请实施例公开的地址提示装置实施例一的结构示意图;
图9为本申请实施例公开的地址提示装置实施例一中第一确定单元的结构示意图;
图10为本申请实施例公开的地址提示装置实施例一中构建单元的结构示意图;
图11为本申请实施例公开的地址提示装置实施例一中第一查找单元的结构示意图;
图12为本申请实施例公开的地址提示装置实施例一中第二查找单元的结构示意图;
图13为本申请实施例公开的又一地址提示装置实施例一的结构示意图;
图14为本申请实施例公开的地址提示装置实施例一中推送单元的结构示意图;
图15为本申请实施例公开的又一地址提示装置实施例一的结构示意图;
图16为本申请实施例公开的地址提示装置实施例二的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在执行本申请采用的实施例之前,首先需要获得待处理地址。下面具体介绍获得待处理地址的过程:
在电子设备的地址输入界面上设有用于输入地址的地址文本框,服务器在地址文本框中可以获取用户输入的待处理地址。具体过程为:用户将光标放入地址文本框中,在用户输入内容的过程中,服务器持续获取用户输入的内容,并将输入的内容作为待处理地址。为了规范用户输入,在地址文本框获得待处理地址数据之后,首先按预设统一地址格式,对所述待处理地址进行归一化处理,以使待处理地址变为统一地址格式。
例如:如果待处理地址中包括特殊符号(括号、点号、双引号和括号等),则删除待处理地址中所有的特殊符号。如果待处理地址包括繁体字,则将待处理地址统一转换为简体字。如果待处理地址中包含大小写字母,则将待处理地址统一转换为小写字母。如果待处理地址具有全角和半角形式,则将待处理地址统一转换为半角形式。
可以理解的是,对待处理地址进行归一化处理的过程还可以包括其他格式的处理,在此不再一一列举。
随着用户的不断在地址文本框中输入内容,待处理地址具体可以分为两种形式:
第一种形式:完全为汉字的形式。
当用户使用拼音输入法输入汉字的过程中,当用户选择具体汉字之后,地址文本框中便出现汉字。此时,服务器将地址文本框中的汉字,作为待处理地址。
第二种形式:不完全为汉字的形式。
当用户使用拼音输入法输入汉字的过程中,在用户未选择具体汉字之前,用户输入的内容的均为字母。所以,此时待处理地址数据均为字母。
在地址文本框中出现汉字之后,用户再次使用拼音输入法输入汉字的过程中,在用户未选择具体汉字之前,地址文本框中既有汉字又字母。此时,待处理地址数据为字母和汉字的组合。
所以,在第二种形式下待处理地址可以为:纯字母,或者,字母和汉字的组合。
在获得待处理地址数据之后,便可以开始执行本申请实施例的过程。
本申请提供一种地址提示方法的实例一,应用于地址处理系统的服务器。如图1所示,所述方法具体包括步骤S101~S103:
步骤S101:根据预设地址格式规则,对待处理地址执行分词操作,生成分词信息。
在本实施例可以预先构建预设地址格式规则。预设地址格式规则可以根据用户需求设定不同级别的行政区划。例如,预设地址格式规则可以包含四级行政区划名称,分别为省行政区划、市行政区划、县区行政区划,以及,街道或乡镇行政区划。其中,预设地址规则中各个行政区划级别各不相同且具有高低之分。
在待处理地址的内容过多的情况下,直接利用待处理地址查询,可能不到与待处理地址匹配的提示地址。在此情况下,本申请利用预设地址格式规则对待处理地址执行分词操作,从而实现将待处理地址拆分为多个分词的目的,多个分词组成分词信息。
对待处理地址执行分词操作的结果为:将待处理地址拆分为至少一个行政区划信息和兴趣点信息;其中,兴趣点信息为待处理地址中除行政区划信息之外的其余内容。兴趣点信息可以为建筑物名称或多栋建筑物的总称,例如,天安门、故宫或圆明园等。
下面对本步骤进行实例说明,例如,待处理地址为“北京市东城区天安门”,则对待处理地址执行分词操作后,可以得到市行政区划为“北京市”,区行政区划为“东城区”,兴趣点信息为“天安门”。
步骤S102:依据分词信息确定搜索数据;其中,所述搜索数据中至少包括所述分词信息中最小等级的地址信息。
由于待处理地址的内容过多,所以直接利用待处理地址查询,可能不到与待处理地址匹配的提示地址。因此,将分词信息中包含信息量较大的数据,作为在地址数据库中搜索时所使用的搜索数据。所以,本申请确定搜索数据的标准为:既能准确表示待处理地址又具有较少的内容。
由于行政区划信息中级别越高的行政区划的对应的地址范围越宽,级别越低的行政区划对应的地址范围越窄。例如:市行政区划“北京市”的地址范围,大于区行政区划“东城区”的地址范围。所以级别越低的行政区划信息越能准确表示待处理地址。
由于,兴趣点信息可以为建筑物名称或多栋建筑物的总称,所以,兴趣点信息相对于行政区划信息而言,更能准确表示待处理地址。
所以,在本申请实施例中,将待处理地址中最低级别的行政区划信息和/或兴趣点信息,确定为搜索数据。可见,搜索数据可以具有以下三种形式:
第一种:将最低级别的行政区划信息作为搜索数据。即:在所述分词信息不包含所述兴趣点信息的情况下,则将分词信息中最低级别的行政区划信息,确定为所述搜索数据。
待处理地址中兴趣点信息是最能够表达待处理地址的数据。但是,并不是所有的待处理地址中均包含兴趣点信息。所以,在待处理地址中不包含兴趣点信息的情况下,将待处理地址中最低级别的行政区划信息,作为准确表示待处理地址的搜索数据。
第二种:将最低级别的行政区划信息和兴趣点信息作为搜索数据。即:在所述分词信息中包含所述兴趣点信息,且,所述兴趣点信息的字符数量小于预设字符数量的情况下,将所述至少一个行政区划信息中最低级别的行政区划信息和所述兴趣点信息,一并确定为所述搜索数据。
待处理地址中兴趣点信息是最能够表达待处理地址的数据,所以一般将兴趣点信息作为准确表示待处理地址的搜索数据。但是,在某些情况下,兴趣点信息的字符数量较少,导致兴趣点信息包含的信息含量太少,不足以准确表示待处理地址。
例如:兴趣点信息为“政府”或“公安”等内容,则由于全国各地均有与“政府”和“公安”相关的地址,所以,在地址数据库中无法查询到准确与待处理地址匹配的提示地址。
所以,在待处理地址中包含兴趣点信息的情况下,还需要进一步判断兴趣点信息的字符数量是否小于预设字符数量;当兴趣点信息的数量小于预设字符数量,则说明兴趣点信息中包含内容过少。此时单独使用兴趣点信息无法准确表示待处理地址。所以,此时将最低级别的行政区划信息和兴趣点信息一并作为代表待处理地址的搜索数据。
第三种:将兴趣点信息作为搜索数据。即:在所述分词信息中包含所述兴趣点信息,且,所述兴趣点信息的字符数量不小于所述预设字符数量的情况下,将所述兴趣点信息确定为所述搜索数据。
在待处理地址中包含兴趣点信息,且,兴趣点信息的字符数量不小于预设字符数量时,则说明兴趣点信息能够准确表示待处理地址,直接使用兴趣点信息作为搜索数据。
在确定搜索数据之后,便可以在地址数据库中查找与所述搜索数据匹配的地址。其中,所述地址数据库中存储有与行政区划信息对应的地址,与兴趣点信息对应的地址,以及,与行政区划信息和兴趣点信息均对应地址。
步骤S103:由地址数据库中与搜索数据匹配的地址,构建提示地址集合;所述提示地址集合为旨在推送至终端的数据。
在确定搜索数据之后,便可以将搜索数据在地址数据库中进行查询。从而在地址数据库中获得与搜索数据匹配的一个或多个地址,将该一个或多个地址构建提示地址集合。构建提示地址集合的详细过程,将在图2所示的过程中进行详细说明。
经过步骤S102之后得到的与搜索数据匹配多个地址。每个地址均可以有不同的优先级。优先级越高代表提示地址与待处理地址的匹配程度越高。一般情况下,碍于显示界面的大小,终端的显示界面上最多能够提示的地址数量为预设地址数量。其中,预设地址数量可以依据具体情况而定,在此不做限定。
所以,可以在与搜索数据匹配多个地址,按优先级由高到低的顺序,确定预设地址数量的提示地址。然后,可以推送预设地址数量的提示地址,及,与每一提示地址对应的优先级。终端可以接收预设地址数量的提示地址和每一提示地址对应的优先级,从而在执行后续过程。
本申请实施例中,将待处理地址中最小等级的地址信息(最小级别行政区划和/或兴趣点信息),作为搜索待处理地址时所使用的搜索数据。由于最小等级的地址信息是待处理地址中最能够表示待处理地址的数据,即信息含量最大的数据,所以依据最小等级的地址信息进行搜索,能够准确获得与待处理地址相关的地址。
并且,本申请仅仅将最小级别行政区划和/或兴趣点信息作为搜索数据,从而避免过多的对待处理地址中其他信息含量较小的数据进行处理,从而可以提升搜索效率。因此,本申请能够在大量地址数据中,准确高效地提示与用户地址相关的地址。
下面介绍图1中步骤S103的详细执行过程。如图2所示,具体包括:
步骤S201:在地址数据库中查找与所述搜索数据完全一致的地址;若查找到,则进入S202;若未查找,则进入步骤S203。
步骤S202:若在地址数据库中查找到与所述搜索数据完全一致的地址,则将与所述搜索数据完全一致的地址,添加至所述提示地址集合中。
为了提高与待处理地址匹配的准确度,首先在地址数据库中查找与搜索数据完全一致的地址。如图3所示,查找与搜索数据完全一致的地址的方式,具体可以包括:
步骤S301:识别所述搜索数据的字符数量。若所述字符数量在第一字符数量范围内则进入步骤S302,若所述字符数量在第二字符数量范围内则进入步骤S303。
为了提高搜索的准确度和效率,本申请针对不同字符数量的搜索数据,提供不同的搜索方式。比如,对字符数量较少的搜索数据采用标准分词查询方式,对字符数量较多的搜索数据采用二元分词查询方式。所以,在确定搜索数据之后,首先需要识别搜索数据的字符数量。
步骤S302:若所述字符数量在第一字符数量范围内,则对所述搜索数据进行标准分词操作生成多个单字符;在所述地址数据库中,查找与多个单字符均一致的地址;其中,所述地址数据库中存储有与单字符对应的地址。
第一字符数量范围用于表示搜索数据的字符较少的情况,例如:第一字符数量范围可以为1~3个。在此情况下,采用标准分词查询方式。在标准分词查询方式中,首先需要采用标准分词操作,将搜索数据分为多个单字符。然后,再利用多个单字符的组合作为查询条件,在地址数据库中搜索与多个单字符均一致的地址,从而获得与搜索数据相关的地址。
例如:搜索数据为“天安门”,则在标准分词操作之后变为“天”“安”和“门”三个单字符;并将“天”“安”和“门”三个单字符的组合,作为查询条件。在地址数据库中进行查询包含“天”“安”和“门”的地址,将包含“天”“安”和“门”的地址,作为与搜索数据“天安门”相关的提示地址。
步骤S303:若所述字符数量在第二字符数量范围内,则对所述搜索数据执行二元分词操作生成多个双字符,在所述地址数据库中,查找与所述多个双字符均一致的地址;其中,所述地址数据库中存储有与双字符对应的地址。
第二字符数量范围用于表示搜索数据的字符较多的情况,例如:第二字符数量范围为搜索数据的字符数量可以为3个以上。在此情况下,采用二元分词查询。在二元分词查询中,首先需要采用二元分词操作,将搜索数据分为多个双字符。然后,再利用多个双字符的组合作为查询条件,在地址数据库中搜索与多个双字符均一致的地址。
例如:搜索数据为“阿里巴巴”,则在标准分词操作之后变为“阿里”“里巴”和“巴巴”三个双字符。将“阿里”“里巴”和“巴巴”三个双字符的组合作为查询条件。在地址数据库中进行查询包含“阿里”“里巴”和“巴巴”三个双字符的地址,并将包含“阿里”“里巴”和“巴巴”三个双字符的地址,作为与搜索数据“阿里巴巴”相关的提示地址。
当搜索数据的字符数量较少时,采用标准分词查询能够查询到与多个单字符一致的地址,所以能够提高搜索的覆盖范围,从而提高搜索的全面性。当搜索数据的字符数量较多时,采用标准分词查询则会由于单字符数量过多,而降低搜索效率。所以,在搜索数据的字符数量较多时采用二元分词查询方式。由于采用双字符的搜索比单字符搜索时输入条件增多,所以可以较快的查找到匹配的提示地址,所以能够提高搜索效率。
接着返回图2,进入步骤S203:若在地址数据库中未查找到与所述搜索数据完全一致的地址,则将所述搜索数据中每个字符转换为第一拼音数据。其中,所述地址数据库中存储有与所有行政区划信息的拼音对应的地址,与所有兴趣点信息的拼音对应的地址,以及,与最小行政区划信息拼音和兴趣点信息拼音均对应的地址。
由于汉字匹配时非常严格,只要有一个汉字不同,也导致匹配不成功。所以,若在地址数据库中查找不到与搜索数据完全一致的地址,则说明地址数据库中未存储有与待处理地址完全一致的地址;或者,可能由于待处理地址中有错别字所导致的,即:地址数据库中存储有与搜索数据发音一致但是具体汉字的体现形式略有不同的地址。所以,将搜索数据的每个字符转换为拼音,生成与搜索数据对应的第一拼音数据。
步骤S204:在地址数据库中查找与所述第一拼音数据完全一致的地址,若查找到,则进入步骤S205;若未查找到则进入步骤S206。
在地址数据库中查找与第一拼音数据完全一致的地址,若查找到,则说明确实为由于搜索数据中存在错别字,导致步骤S203中无法查找到与搜索数据完全匹配的地址。
若在地址数据库中未查找到与搜索数据完全一致的地址,则说明待处理地址数据库中不存在与待处理地址完全一致的地址;此时进入步骤S206。
步骤S205:若在地址数据库中查找到与所述第一拼音数据完全一致的地址,则将与所述第一拼音数据完全一致的地址,添加至所述提示地址集合中;其中,所述地址数据库中包含有若干个地址,以及,与每个地址一一对应的拼音。
在将搜索数据的每个字符转换为拼音之后,可以消除搜索数据中发音一致但文字不一致的错别字。若地址数据库中存储有搜索数据发音一致的地址的拼音,则可以在地址数据库中查询第一拼音数据之后,得到与第一拼音数据对应的提示地址。
例如:用户输入待处理地址时出现错别字,例如:将“天安门”写为“田安门”。此时搜索数据为“田安门”,由于地址数据库中未存储有与“田安门”对应地址,则无法在地址数据库中查找到与搜索数据一致的地址。
然后,将搜索数据“田安门”转换为第一拼音数据“tiananmen”。由于地址数据库中存储的“天安门”的拼音同样为“tiananmen”。所以便可以在地址数据库中查找与第一拼音数据“tiananmen”对应的“天安门”,并将“天安门”作为提示地址。
步骤S206:若在地址数据库中未查找到与所述第一拼音数据完全一致的地址,则在地址数据库中查找与所述搜索数据部分一致的地址。
通过上述步骤还是无法在地址数据库中查找与搜索数据一致的地址,则说明地址数据库中未存储有与搜索数据完全一致的地址。所以在地址数据库中查找与搜索数据部分一致的地址。如图4所示,具体包括步骤S401~S402:
步骤S401:对所述搜索数据执行二元分词操作生成多个双字符。
详细执行过程参见步骤S303,在在此不再赘述。
步骤S402:在所述地址数据库中,查找与所述多个双字符中至少一个双字符一致的地址;其中,所述地址数据库中存储有与若干个双字符对应的地址。
在地址数据库中查询与多个双字符中至少一个一致的地址,即:在地址数据库中查找与每个双字符完全匹配的地址,只要地址中有与双字符匹配的地址,则将该地址作为提示地址。可以理解的是,服务器优先选择与所有双字符匹配成功数量最多的地址,作为提示地址。
例如:用户输入待处理地址时出现简称,将“XX科技有限公司”写成“XX技术有限公司”。由于地址数据库中未存储有与“XX技术有限公司”对应的地址。所以,无法在地址数据库中查询到与搜索数据完全一致的地址。
此时将“XX技术有限公司”进行二元分词操作,得到“XX”、“X技”、“技术”、“术有”、“有限”、“限公”和“公司”七个双字符;正确地址的二元分词操作后的结果为:“XX”、“X科”、“科技”、“技有”、“有限”、“限公”和“公司”;对比两者的双子符号发现两者有四个以上双字符是一致的,所以判定两者是部分一致的。
接着返回图2,进入步骤S207:若在地址数据库中查找到与所述搜索数据部分一致的地址,则将与所述搜索数据部分一致的地址,添加至所述提示地址集合中。
在地址数据库中查找到与搜索数据部分一致的地址,则优先选择匹配程度最高的地址作为与搜索数据部分一致的地址,然后将与搜索数据一致的地址添加至提示地址集合中。
步骤S208:结束程序。
经过图2所示的步骤,若在地址数据库中既未查询到与地址数据库完全一致的数据,又未在地址数据库中查找到与搜索数据部分一致的地址,则说明地址数据库中未存储有与待处理地址相关的任何地址,此时结束程序。
在图2执行过程中,还包括对于与搜索数据匹配的地址添加优先级的步骤:
若在地址数据库中查找到与所述搜索数据完全一致的地址,则对与所述搜索数据完全一致的地址,赋予第一优先级。若在地址数据库中查找到与所述第一拼音数据完全一致的地址,则对与所述第一拼音数据完全一致的地址,赋予第二优先级。若在地址数据库中查找到与所述搜索数据部分一致的地址,则对与所述搜索数据部分一致的地址,赋予第三优先级。
由于本申请的目的在于,为用户提供与待处理地址最接近的地址,所以,将与待处理地址的搜索数据完全一致的地址设置为第一优先级,即最高优先级;其次,与搜索数据通过拼音比对的方式完全一致的地址,设置为第二优先级;第二优先级次于第一优先级。将搜索数据部分一致的数据设置为第三优先级,优先级次于第二优先级,即最低优先级。
地址的优先级表示与待处理地址的匹配程度,匹配程度越高则优先级越高。按优先级由高到低的顺序,确定预设地址数量的提示地址。然后,可以推送预设地址数量的提示地址,及,与每一提示地址对应的优先级。终端可以接收预设地址数量的提示地址和每一提示地址对应的优先级,从而在执行后续过程。
在执行图1所示的实施例之前,还可以执行判断待处理地址是否满足预设条件的过程。如图5所示,具体包括步骤S501~S504:
步骤S501:判断所述待处理地址是否完全为汉字;若是,则进入步骤S503,若否,则进入步骤S502。
由于本申请图1实施例的主要目的为:对纯汉字且信息含量过多的待处理地址进行处理。所以服务器判断待处理地址是否完全为汉字;若待处理地址的内容完全是汉字,则进入步骤S503;若待处理地址的内容不完全是汉字,则判定不满足预设条件。
步骤S502:判定不满足预设条件。即在所述待处理地址不完全为汉字的情况下,则判定不满足预设条件。
在待处理地址不完全为汉字情况下,可以不执行本申请实施例的过程,所以判定不满足预设条件。在判定不满足预设条件之后,服务器对非纯汉字形式的待处理地址,执行其他流程。
步骤S503:在所述待处理地址完全为汉字的情况下,则在所述地址数据库中查找与所述待处理地址匹配的地址;若查找到,则进入步骤S502,若未查找到,则进入步骤S504。
在待处理地址完全为汉字的情况下,为了快速查找与待处理地址匹配的提示地址,服务器可以直接将待处理地址作为查找条件。在地址数据库中查询与待处理地址匹配的提示地址,即:在地址数据库中查找与待处理地址全部一致或者部分一致的地址;若查找到,则进入步骤S502;若未查找到,则进入步骤S504。
若查找到与所述待处理地址匹配的地址,则判定不满足预设条件。
若在地址数据库中查找到与待处理地址全部一致或者部分一致的地址,则说明查找到与待处理地址匹配的提示地址,从而向用户显示与待处理地址匹配的提示地址即可。在显示提示地址之后,可结束本实施例的程序。
若服务器直接利用待处理地址可以查找到提示地址,则无需执行本申请实施例来对待处理地址进行进一步的处理,从而来查找与待处理地址匹配的提示地址,因此判定不满足预设条件。
步骤S504:若未查找到与所述待处理地址匹配的地址,则判定满足预设条件。
若服务器直接利用待处理地址未查找到提示地址,则说明此时待处理地址的内容过多,直接利用待处理地址已经无法准确查找到提示地址,所以此时判定满足预设条件。
服务器在检测到待处理地址满足预设条件的情况下,则可以执行本申请图1实施例的过程。
在获得待处理地址之后,若直接对待处理地址按图1所示的过程处理,则会消耗服务器过多的资源,查询效率较低。所以,在获得待处理地址数据之后,首先确定待处理地址是否满足适用于本申请图1实施例的条件,若不满足本申请图1实施例的条件,则按现有普通的查询方式进行查询;若满足本申请图1实施例的条件,则按图1实施例的方式进行查询。从而既能提高效率,又能提高准确率。
上述内容为待处理地址为纯汉字时的执行过程,在步骤S502中确定待处理地址不是纯汉字的情况下,则执行其它过程。如图6所示,具体包括步骤S601~S604:
步骤S601:将所述待处理地址中每个字符转换为拼音,生成与所述待处理地址对应的第二拼音数据。
若待处理地址不是纯汉字,则可能是纯字母,或者,字母和汉字的组合。所以将待处理地址中每个字符均转换为拼音,生成第二拼音数据,以便进行统一处理。
步骤S602:判断地址数据库中是否有与所述第二拼音数据完全一致地址;若是,则进入步骤S603;若否,则进入步骤S604。
步骤S603:若在地址数据库中查找到与所述第二拼音数据完全一致地址,则将与所述第二拼音数据完全一致地址,确定为所述提示地址集合;其中,所述地址数据库中包含有若干个地址以及与每个地址一一对应的拼音。
在地址数据库中,查找与待处理地址完全匹配地址。若查找到的话,则说明地址数据库中存储有与待处理地址相关的地址;直接将与所述第二拼音数据完全一致地址作为提示地址,从而将提示地址组成提示地址集合。
步骤S604:若在地址数据库中未查找到与所述第二拼音数据完全一致地址,则结束程序。
如图7所示,本申请提供了一种地址提示方法的实例二,应用于终端,所述方法包括:
步骤S701:响应于地址输入操作,生成待处理地址。
终端响应于用于在地址输入框的输入操作,随着用户的输入,便可以得到待处理地址。
步骤S702:将所述待处理地址发送至服务器。
并将待处理地址实时发送至服务器,由服务器对待处理地址进行实时处理。
步骤S703:接收由所述服务器推送的提示地址集合;其中,其中,所述提示地址集合通过以下步骤确定:根据预设地址格式规则,对待处理地址执行分词操作,生成分词信息;依据分词信息确定搜索数据;其中,所述搜索数据中至少包括所述分词信息中最小等级的地址信息;由地址数据库中与搜索数据匹配的地址,构建提示地址集合;所述提示地址集合为旨在推送至终端的数据。
具体的,终端可以接收预设地址数量的提示地址及与每一提示地址对应的优先级。然后,按优先级由高到低的顺序,依次显示所述预设地址数量的提示地址。
即,在显示提示地址集合时,首先在所述提示地址集合中,按优先级由高到低的顺序确定预设地址数量的提示地址;然后再按优先级由高到低的顺序,依次显示所述提示预设地址数量的提示地址。
用户可以在当前界面显示的预设地址数量的提示地址中,选择所需一个提示地址。终端在获知用户选择一个提示地址之后,便将提示地址显示在地址文本框中,从而方便用户输入地址。
与图1所示的地址提示方法的实施例一对应,本申请提供了一种地址提示装置的实施例一。如图8所示,包括:
分词单元81,用于根据预设地址格式规则,对待处理地址执行分词操作,生成分词信息;
第一确定单元82,用于依据分词信息确定搜索数据;其中,所述搜索数据中至少包括所述分词信息中最小等级的地址信息;
构建单元83,用于由地址数据库中与搜索数据匹配的地址,构建提示地址集合;所述提示地址集合为旨在推送至终端的数据。
本申请提供的地址提示装置还包括:推送单元84,用于推送所述提示地址集合。
此外,本申请提供的地址提示装置实施例一,还包括:
归一化单元85,用于按预设统一地址格式,对所述待处理地址进行归一化处理。
优选的,如图9所示,所述第一确定单元82,包括:
第二确定单元91,用于在所述分词信息不包含所述兴趣点信息的情况下,则将所述分词信息中最低级别的行政区划信息,确定为所述搜索数据。
第三确定单元92,用于在所述分词信息包含的兴趣点信息的字符数量小于预设字符数量的情况下,将所述分词信息中最低级别的行政区划信息和所述兴趣点信息,一并确定为所述搜索数据。
第四确定单元93,用于在所述分词信息包含的兴趣点信息的字符数量不小于所述预设字符数量的情况下,将所述兴趣点信息确定为所述搜索数据。
如图10所示,所述构建单元83,包括:
第一查找单元1001,用于在地址数据库中查找与所述搜索数据完全一致的地址。
第一添加单元1002,用于若在地址数据库中查找到与所述搜索数据完全一致的地址,则将与所述搜索数据完全一致的地址,添加至所述提示地址集合中。
第一转换单元1003,用于若在地址数据库中未查找到与所述搜索数据完全一致的地址,则将所述搜索数据中每个字符转换为第一拼音数据。
第二添加单元1004,用于若在地址数据库中查找到与所述第一拼音数据完全一致的地址,则将与所述第一拼音数据完全一致的地址,添加至所述提示地址集合中;其中,所述地址数据库中存储有与行政区划信息的拼音对应的地址,与兴趣点信息的拼音对应的地址,以及,与行政区划信息和兴趣点信息两者的拼音对应地址。
第二查找单元1005,用于若在地址数据库中未查找到与所述第一拼音数据完全一致的地址,则在地址数据库中查找与所述搜索数据部分一致的地址。
第三添加单元1006,用于若在地址数据库中查找到与所述搜索数据部分一致的地址,则将与所述搜索数据部分一致的地址,添加至所述提示地址集合中。
如图11所示,所述第一查找单元1001,包括:
识别单元1101,用于识别所述搜索数据的字符数量。
标准查找单元1102,用于若所述字符数量在第一字符数量范围内,则对所述搜索数据进行标准分词操作生成多个单字符;在所述地址数据库中,查找与多个单字符均一致的地址;其中,所述地址数据库中存储有与单字符对应的地址。
二元查找单元1103,用于若所述字符数量在第二字符数量范围内,则对所述搜索数据执行二元分词操作生成多个双字符,在所述地址数据库中,查找与所述多个双字符均一致的地址;其中,所述地址数据库中存储有与双字符对应的地址。
如图12所示,所述第二查找单元1005,包括:
二元分词单元1201,用于对所述搜索数据执行二元分词操作生成多个双字符;
二元部分查找单元1202,用于在所述地址数据库中,查找与所述多个双字符中至少一个双字符一致的地址;其中,所述地址数据库中存储有与双字符对应的地址。
如图13所示,本申请提供的地址提示装置实施例一,还包括:
与第一添加单元1002相连的第一赋予单元1301,用于若在地址数据库中查找到与所述搜索数据完全一致的地址,则对与所述搜索数据完全一致的地址,赋予第一优先级。
与第二添加单元1004相连的第二赋予单元1302,用于若在地址数据库中查找到与所述第一拼音数据完全一致的地址,则对与所述第一拼音数据完全一致的地址,赋予第二优先级。
与第三添加单元1006相连的第三赋予单元1303,用于若在地址数据库中查找到与所述搜索数据部分一致的地址,则对与所述搜索数据部分一致的地址,赋予第三优先级;其中,所述第一优先级高于所述第二优先级,所述第二优先级高于所述第三优先级。
如图14所示,所述推送单元84,包括:
第五确定单元1401,用于在所述提示地址集合中,按优先级由高到低的顺序确定预设地址数量的提示地址。
推送地址单元1402,用于推送预设地址数量的提示地址,及,与每一提示地址对应的优先级。
如图15所示,本申请提供的地址提示装置实施例一,还包括:
判断单元1501,用于待处理地址是否完全为汉字;
第三查找单元1502,在确定所述待处理地址完全为汉字的情况下,在所述地址数据库中查找与所述待处理地址匹配的地址;若未查找到,则进入分词单元81;
所述构建单元83,具体用于若查找到与所述待处理地址匹配的地址,则将与所述待处理地址匹配的地址,构建为所述提示地址集合。
第二转换单元1503,用于在确定所述待处理地址不完全为汉字的情况下,将所述待处理地址中每个字符转换为拼音,生成与所述待处理地址对应的第二拼音数据。
第六确定单元1504,用于若在地址数据库中查找到与所述第二拼音数据完全一致地址,则将与所述第二拼音数据完全一致地址,确定为所述提示地址集合。
其中,所述地址数据库中包含有若干个地址以及与每个地址一一对应的拼音。
本申请实施例中,将待处理地址中最小级别行政区划和/或兴趣点信息,作为搜索待处理地址时所使用的搜索数据。由于最小级别行政区划和/或兴趣点信息是待处理地址中最能够表示待处理地址的数据,即信息含量最大的数据。所以依据最小级别行政区划和/或兴趣点信息进行搜索,能够准确获得与待处理地址相关的地址。
并且,本申请仅仅将最小级别行政区划和/或兴趣点信息作为搜索数据,从而避免过多的对待处理地址中其他信息含量较小的数据进行处理,从而可以提升搜索效率。因此,本申请能够在大量地址数据中,准确高效地提示与用户地址相关的地址。
与一种地址提示方法的实施例二相对应,如图16所示,本申请还提供了一种地址提示装置实施例二,包括:
生成单元1601,用于响应于地址输入操作,生成待处理地址;
发送单元1602,用于将所述待处理地址发送至服务器;
接收单元1603,用于接收由所述服务器推送的提示地址集合;其中,所述提示地址集合通过以下步骤确定:
根据预设地址格式规则,对待处理地址执行分词操作,生成分词信息;
依据分词信息确定搜索数据;其中,所述搜索数据中至少包括所述分词信息中最小等级的地址信息;
由地址数据库中与搜索数据匹配的地址,构建提示地址集合;所述提示地址集合为旨在推送至终端的数据。
显示单元1604,用于按优先级由高到低的顺序,依次显示所述预设地址数量的提示地址。
其中,所述接收单元1603具体用于,接收预设地址数量的提示地址及与每一提示地址对应的优先级。
本实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (29)

1.一种地址提示方法,其特征在于,包括:
根据预设地址格式规则,对待处理地址执行分词操作,生成分词信息;
依据分词信息确定搜索数据;其中,所述搜索数据中至少包括所述分词信息中最小等级的地址信息;
由地址数据库中与搜索数据匹配的地址,构建提示地址集合;所述提示地址集合为旨在推送至终端的数据。
2.如权利要求1所述的方法,其特征在于,依据分词信息确定搜索数据,包括:
在所述分词信息不包含兴趣点信息的情况下,则将所述分词信息中最低级别的行政区划信息,确定为所述搜索数据;
在所述分词信息包含的兴趣点信息的字符数量小于预设字符数量的情况下,将所述分词信息中最低级别的行政区划信息和所述兴趣点信息,一并确定为所述搜索数据;
在所述分词信息包含的兴趣点信息的字符数量不小于所述预设字符数量的情况下,将所述兴趣点信息确定为所述搜索数据。
3.如权利要求1所述的方法,其特征在于,由地址数据库中与搜索数据匹配的地址,构建提示地址集合,包括:
若在地址数据库中查找到与所述搜索数据完全一致的地址,则将与所述搜索数据完全一致的地址,添加至所述提示地址集合中。
4.如权利要求3所述的方法,其特征在于,在地址数据库中查找与所述搜索数据完全一致的地址,包括:
识别所述搜索数据的字符数量;
若所述字符数量在第一字符数量范围内,则对所述搜索数据进行标准分词操作生成多个单字符;在所述地址数据库中,查找与多个单字符均一致的地址;其中,所述地址数据库中存储有与单字符对应的地址;
若所述字符数量在第二字符数量范围内,则对所述搜索数据执行二元分词操作生成多个双字符;在所述地址数据库中,查找与所述多个双字符均一致的地址;其中,所述地址数据库中存储有与双字符对应的地址。
5.如权利要求3所述的方法,其特征在于,由地址数据库中与搜索数据匹配的地址,构建提示地址集合,包括:
若在地址数据库中未查找到与所述搜索数据完全一致的地址,则将所述搜索数据中每个字符转换为第一拼音数据;
若在地址数据库中查找到与所述第一拼音数据完全一致的地址,则将与所述第一拼音数据完全一致的地址,添加至所述提示地址集合中;其中,所述地址数据库中存储有与行政区划信息的拼音对应的地址,与兴趣点信息的拼音对应的地址,以及,与行政区划信息的拼音和兴趣点信息的拼音均对应地址。
6.如权利要求5所述的方法,其特征在于,所述由地址数据库中与搜索数据匹配的地址,构建提示地址集合,包括:
若在地址数据库中未查找到与所述第一拼音数据完全一致的地址,则在地址数据库中查找与所述搜索数据部分一致的地址;
若在地址数据库中查找到与所述搜索数据部分一致的地址,则将与所述搜索数据部分一致的地址,添加至所述提示地址集合中。
7.如权利要求6所述的方法,其特征在于,所述在地址数据库中查找与所述搜索数据部分一致的地址,包括:
对所述搜索数据执行二元分词操作生成多个双字符;
在所述地址数据库中,查找与所述多个双字符中至少一个双字符一致的地址;其中,所述地址数据库中存储有与双字符对应的地址。
8.如权利要求7所述的方法,其特征在于,还包括:
若在地址数据库中查找到与所述搜索数据完全一致的地址,则对与所述搜索数据完全一致的地址,赋予第一优先级;
若在地址数据库中查找到与所述第一拼音数据完全一致的地址,则对与所述第一拼音数据完全一致的地址,赋予第二优先级;
若在地址数据库中查找到与所述搜索数据部分一致的地址,则对与所述搜索数据部分一致的地址,赋予第三优先级;
其中,所述第一优先级高于所述第二优先级,所述第二优先级高于所述第三优先级。
9.如权利要求8所述的方法,其特征在于,推送所述提示地址集合,包括:
在所述提示地址集合中,按优先级由高到低的顺序,确定预设地址数量的提示地址;
推送预设地址数量的提示地址,及,与每一提示地址对应的优先级。
10.如权利要求1所述的方法,其特征在于,在所述获取待处理地址之后,还包括:
在确定所述待处理地址完全为汉字的情况下,在所述地址数据库中查找与所述待处理地址匹配的地址;
若未查找到与所述待处理地址匹配的地址,则执行根据预设地址格式规则对所述待处理地址执行分词操作并生成分词信息的步骤。
11.如权利要求10所述的方法,其特征在于,在所述地址数据库中查找到与所述待处理地址匹配的地址之后,还包括:
若查找到与所述待处理地址匹配的地址,则将与所述待处理地址匹配的地址,确定为所述提示地址集合。
12.如权利要求10所述的方法,其特征在于,在获取待处理地址之后,还包括:
在确定所述待处理地址不完全为汉字的情况下,将所述待处理地址中每个字符转换为拼音,生成与所述待处理地址对应的第二拼音数据;
若在地址数据库中查找到与所述第二拼音数据完全一致地址,则将与所述第二拼音数据完全一致地址,确定为所述提示地址集合;
其中,所述地址数据库中包含有若干个地址以及与每个地址一一对应的拼音。
13.如权利要求1所述的方法,其特征在于,还包括:
按预设统一地址格式,对所述待处理地址进行归一化处理。
14.一种地址提示方法,其特征在于,包括:
响应于地址输入操作,生成待处理地址;
将所述待处理地址发送至服务器;
接收由所述服务器推送的提示地址集合;其中,所述提示地址集合通过以下步骤确定:根据预设地址格式规则,对待处理地址执行分词操作,生成分词信息;依据分词信息确定搜索数据;其中,所述搜索数据中至少包括所述分词信息中最小等级的地址信息;由地址数据库中与搜索数据匹配的地址,构建提示地址集合;所述提示地址集合为旨在推送至终端的数据。
15.如权利要求14所述的方法,其特征在于,接收由所述服务器推送的提示地址集合,包括:
接收预设地址数量的提示地址及与每一提示地址对应的优先级。
16.如权利要求15所述的方法,其特征在于,还包括:
按优先级由高到低的顺序,依次显示所述预设地址数量的提示地址。
17.一种地址提示装置,其特征在于,包括:
分词单元,用于根据预设地址格式规则,对待处理地址执行分词操作,生成分词信息;
第一确定单元,用于依据分词信息确定搜索数据;其中,所述搜索数据中至少包括所述分词信息中最小等级的地址信息;
构建单元,用于由地址数据库中与搜索数据匹配的地址,构建提示地址集合;所述提示地址集合为旨在推送至终端的数据。
18.如权利要求17所述的装置,其特征在于,所述第一确定单元,包括:
第二确定单元,用于在所述分词信息不包含所述兴趣点信息的情况下,则将所述分词信息中最低级别的行政区划信息,确定为所述搜索数据;
第三确定单元,用于在所述分词信息包含的兴趣点信息的字符数量小于预设字符数量的情况下,将所述分词信息中最低级别的行政区划信息和所述兴趣点信息,一并确定为所述搜索数据;
第四确定单元,用于在所述分词信息包含的兴趣点信息的字符数量不小于所述预设字符数量的情况下,将所述兴趣点信息确定为所述搜索数据。
19.如权利要求17所述的装置,其特征在于,所述构建单元,包括:
第一查找单元,用于在地址数据库中查找与所述搜索数据完全一致的地址;
第一添加单元,用于若在地址数据库中查找到与所述搜索数据完全一致的地址,则将与所述搜索数据完全一致的地址,添加至所述提示地址集合中;
第一转换单元,用于若在地址数据库中未查找到与所述搜索数据完全一致的地址,则将所述搜索数据中每个字符转换为第一拼音数据;
第二添加单元,用于若在地址数据库中查找到与所述第一拼音数据完全一致的地址,则将与所述第一拼音数据完全一致的地址,添加至所述提示地址集合中;其中,所述地址数据库中存储有与行政区划信息的拼音对应的地址,与兴趣点信息的拼音对应的地址,以及,与行政区划信息和兴趣点信息两者的拼音对应地址;
第二查找单元,用于若在地址数据库中未查找到与所述第一拼音数据完全一致的地址,则在地址数据库中查找与所述搜索数据部分一致的地址;
第三添加单元,用于若在地址数据库中查找到与所述搜索数据部分一致的地址,则将与所述搜索数据部分一致的地址,添加至所述提示地址集合中。
20.如权利要求19所述的装置,其特征在于,所述第一查找单元,包括:
识别单元,用于识别所述搜索数据的字符数量;
标准查找单元,用于若所述字符数量在第一字符数量范围内,则对所述搜索数据进行标准分词操作生成多个单字符;在所述地址数据库中,查找与多个单字符均一致的地址;其中,所述地址数据库中存储有与单字符对应的地址;
二元查找单元,用于若所述字符数量在第二字符数量范围内,则对所述搜索数据执行二元分词操作生成多个双字符,在所述地址数据库中,查找与所述多个双字符均一致的地址;其中,所述地址数据库中存储有与双字符对应的地址。
21.如权利要求19所述的装置,其特征在于,所述第二查找单元,包括:
二元分词单元,用于对所述搜索数据执行二元分词操作生成多个双字符;
二元部分查找单元,用于在所述地址数据库中,查找与所述多个双字符中至少一个双字符一致的地址;其中,所述地址数据库中存储有与双字符对应的地址。
22.如权利要求19所述的装置,其特征在于,还包括:
第一赋予单元,用于若在地址数据库中查找到与所述搜索数据完全一致的地址,则对与所述搜索数据完全一致的地址,赋予第一优先级;
第二赋予单元,用于若在地址数据库中查找到与所述第一拼音数据完全一致的地址,则对与所述第一拼音数据完全一致的地址,赋予第二优先级;
第三赋予单元,用于若在地址数据库中查找到与所述搜索数据部分一致的地址,则对与所述搜索数据部分一致的地址,赋予第三优先级;
其中,所述第一优先级高于所述第二优先级,所述第二优先级高于所述第三优先级。
23.如权利要求22所述的装置,其特征在于,还包括:推送单元;
所述推送单元,包括:
第五确定单元,用于在所述提示地址集合中,按优先级由高到低的顺序确定预设地址数量的提示地址;
推送地址单元,用于推送预设地址数量的提示地址,及,与每一提示地址对应的优先级。
24.如权利要求17所述的装置,其特征在于,还包括:
第三查找单元,在确定所述待处理地址完全为汉字的情况下,在所述地址数据库中查找与所述待处理地址匹配的地址;若未查找到,则进入分词单元;
所述构建单元,具体用于若查找到与所述待处理地址匹配的地址,则将与所述待处理地址匹配的地址,构建为所述提示地址集合。
25.如权利要求22所述的装置,其特征在于,还包括:
第二转换单元,用于在确定所述待处理地址不完全为汉字的情况下,将所述待处理地址中每个字符转换为拼音,生成与所述待处理地址对应的第二拼音数据;
第六确定单元,用于若在地址数据库中查找到与所述第二拼音数据完全一致地址,则将与所述第二拼音数据完全一致地址,确定为所述提示地址集合;
其中,所述地址数据库中包含有若干个地址以及与每个地址一一对应的拼音。
26.如权利要求17所述的装置,其特征在于,还包括:
归一化单元,用于按预设统一地址格式,对所述待处理地址进行归一化处理。
27.一种地址提示装置,其特征在于,包括:
生成单元,用于响应于地址输入操作,生成待处理地址;
发送单元,用于将所述待处理地址发送至服务器;
接收单元,用于接收由所述服务器推送的提示地址集合;其中,所述提示地址集合通过以下步骤确定:根据预设地址格式规则,对待处理地址执行分词操作,生成分词信息;依据分词信息确定搜索数据;其中,所述搜索数据中至少包括所述分词信息中最小等级的地址信息;由地址数据库中与搜索数据匹配的地址,构建提示地址集合;所述提示地址集合为旨在推送至终端的数据。
28.如权利要求27所述的装置,其特征在于,所述接收单元具体用于,接收预设地址数量的提示地址及与每一提示地址对应的优先级。
29.如权利要求28所述的装置,其特征在于,还包括:
显示单元,用于按优先级由高到低的顺序,依次显示所述预设地址数量的提示地址。
CN201510340982.3A 2015-06-18 2015-06-18 地址提示方法及装置 Active CN106326233B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510340982.3A CN106326233B (zh) 2015-06-18 2015-06-18 地址提示方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510340982.3A CN106326233B (zh) 2015-06-18 2015-06-18 地址提示方法及装置

Publications (2)

Publication Number Publication Date
CN106326233A true CN106326233A (zh) 2017-01-11
CN106326233B CN106326233B (zh) 2019-10-11

Family

ID=57733543

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510340982.3A Active CN106326233B (zh) 2015-06-18 2015-06-18 地址提示方法及装置

Country Status (1)

Country Link
CN (1) CN106326233B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528846A (zh) * 2016-11-21 2017-03-22 广州华多网络科技有限公司 一种检索方法及装置
CN109255565A (zh) * 2017-07-14 2019-01-22 菜鸟智能物流控股有限公司 地址的归属识别和物流任务的分发方法及其装置
CN109784308A (zh) * 2019-02-01 2019-05-21 腾讯科技(深圳)有限公司 一种地址纠错方法、装置及存储介质
CN110765262A (zh) * 2019-09-24 2020-02-07 北京嘀嘀无限科技发展有限公司 Poi文本的检索方法、装置及电子设备
CN112231429A (zh) * 2020-11-09 2021-01-15 山东健康医疗大数据有限公司 一种基于机器学习分类算法的地址匹配方法
CN112861532A (zh) * 2019-11-12 2021-05-28 北京四维图新科技股份有限公司 地址标准化处理方法、装置、设备及在线搜索系统
CN114461540A (zh) * 2022-04-12 2022-05-10 湖南三湘银行股份有限公司 一种地址归一化的处理系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350012A (zh) * 2007-07-18 2009-01-21 北京灵图软件技术有限公司 一种地址匹配的方法和系统
CN101840406A (zh) * 2009-03-20 2010-09-22 富士通株式会社 地名搜索装置和系统
CN101980208A (zh) * 2010-11-10 2011-02-23 百度在线网络技术(北京)有限公司 地址查询方法及系统
CN103440312A (zh) * 2013-08-27 2013-12-11 深圳市华傲数据技术有限公司 一种通信地址查询邮政编码的系统及终端
CN103559177A (zh) * 2013-11-12 2014-02-05 金蝶软件(中国)有限公司 一种地名识别方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350012A (zh) * 2007-07-18 2009-01-21 北京灵图软件技术有限公司 一种地址匹配的方法和系统
CN101840406A (zh) * 2009-03-20 2010-09-22 富士通株式会社 地名搜索装置和系统
CN101980208A (zh) * 2010-11-10 2011-02-23 百度在线网络技术(北京)有限公司 地址查询方法及系统
CN103440312A (zh) * 2013-08-27 2013-12-11 深圳市华傲数据技术有限公司 一种通信地址查询邮政编码的系统及终端
CN103559177A (zh) * 2013-11-12 2014-02-05 金蝶软件(中国)有限公司 一种地名识别方法及装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528846A (zh) * 2016-11-21 2017-03-22 广州华多网络科技有限公司 一种检索方法及装置
CN106528846B (zh) * 2016-11-21 2019-09-17 广州华多网络科技有限公司 一种检索方法及装置
CN109255565A (zh) * 2017-07-14 2019-01-22 菜鸟智能物流控股有限公司 地址的归属识别和物流任务的分发方法及其装置
CN109784308A (zh) * 2019-02-01 2019-05-21 腾讯科技(深圳)有限公司 一种地址纠错方法、装置及存储介质
CN110765262A (zh) * 2019-09-24 2020-02-07 北京嘀嘀无限科技发展有限公司 Poi文本的检索方法、装置及电子设备
CN112861532A (zh) * 2019-11-12 2021-05-28 北京四维图新科技股份有限公司 地址标准化处理方法、装置、设备及在线搜索系统
CN112861532B (zh) * 2019-11-12 2024-04-02 北京四维图新科技股份有限公司 地址标准化处理方法、装置、设备及在线搜索系统
CN112231429A (zh) * 2020-11-09 2021-01-15 山东健康医疗大数据有限公司 一种基于机器学习分类算法的地址匹配方法
CN114461540A (zh) * 2022-04-12 2022-05-10 湖南三湘银行股份有限公司 一种地址归一化的处理系统
CN114461540B (zh) * 2022-04-12 2022-07-12 湖南三湘银行股份有限公司 一种地址归一化的处理系统

Also Published As

Publication number Publication date
CN106326233B (zh) 2019-10-11

Similar Documents

Publication Publication Date Title
CN106326233A (zh) 地址提示方法及装置
CN110008300B (zh) Poi别名的确定方法、装置、计算机设备和存储介质
CN101256462B (zh) 基于全混合联想库的手写输入方法和装置
CN102262641B (zh) 网络查询中的在线手写识别系统和方法
CN103425704B (zh) 应用界面提供方法及装置
JP2006527870A (ja) 設定可能な情報特定システム及び方法
CN101876878A (zh) 单词预测输入系统及方法
CN104951456A (zh) 一种用于获得答案信息的方法、装置和设备
CN103415850A (zh) 结构化文档管理装置、结构化文档检索方法
CN110399448B (zh) 中文地名地址搜索匹配方法、终端、计算机可读存储介质
CN105760522A (zh) 基于应用程序的信息搜索方法及装置
CN110381115B (zh) 信息推送方法、装置、计算机可读存储介质和计算机设备
CN109543154B (zh) 表格数据的类型转换方法、装置、存储介质及电子设备
CN112966081A (zh) 处理问答信息的方法、装置、设备和存储介质
CN101369209B (zh) 用于全混合输入的手写输入装置及其方法
CN101751290B (zh) 一种调用功能模块的方法、装置及erp系统
CN103870501A (zh) 一种自动匹配方法及装置
CN112988784B (zh) 数据查询方法、查询语句生成方法及其装置
CN103810204A (zh) 一种信息查找的方法及装置
CN107729457B (zh) 一种信息智能检索的方法、装置及存储介质
CN105740374A (zh) 基于分布式内存的三维平台数据模糊查询方法
CN112989011B (zh) 数据查询方法、数据查询装置和电子设备
CN104424300A (zh) 个性化搜索提示方法及装置
CN113138677A (zh) 输入法候选词的确定方法、装置、电子设备和存储介质
CN111324820B (zh) 邀请方法、装置、终端设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20180404

Address after: Four story 847 mailbox of the capital mansion of Cayman Islands, Cayman Islands, Cayman

Applicant after: CAINIAO SMART LOGISTICS HOLDING Ltd.

Address before: Cayman Islands Grand Cayman capital building a four storey No. 847 mailbox

Applicant before: ALIBABA GROUP HOLDING Ltd.

GR01 Patent grant
GR01 Patent grant