CN103559177A - 一种地名识别方法及装置 - Google Patents

一种地名识别方法及装置 Download PDF

Info

Publication number
CN103559177A
CN103559177A CN201310559720.7A CN201310559720A CN103559177A CN 103559177 A CN103559177 A CN 103559177A CN 201310559720 A CN201310559720 A CN 201310559720A CN 103559177 A CN103559177 A CN 103559177A
Authority
CN
China
Prior art keywords
place name
candidate word
standard
name
concentrated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310559720.7A
Other languages
English (en)
Inventor
雷中南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN QIANHAI BAIDI NETWORK CO., LTD.
Original Assignee
Kingdee Software China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kingdee Software China Co Ltd filed Critical Kingdee Software China Co Ltd
Priority to CN201310559720.7A priority Critical patent/CN103559177A/zh
Publication of CN103559177A publication Critical patent/CN103559177A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明实施例公开了一种地名识别方法及装置。本发明实施例方法包括:对待识别地名中的字符串进行分词得到候选词集;以候选词集中的候选词为关键字,在标准地名数据库中查找与上述关键字匹配的标准地名,该标准地名即为待识别地名的目标地名。本发明实施例能够准确识别地名。

Description

一种地名识别方法及装置
技术领域
本发明实施例涉及文字信息处理领域,尤其涉及一种地名识别方法及装置。
背景技术
随着网络技术的发展,各行各业之间的数据交互变得越来越频繁。例如:物流、电子商务、统计汇总等行业,他们的计算机系统一般会需要接收来自外部的行政区划数据,而通常外部发送的行政区划数据并没有一个统一的标准和规范。例如对于同一地名,A的系统发送过来的数据为:广东省深圳市南山区粤海街道,而B的系统发送过来的数据为:广东,深圳,南山,粤海,很明显二者的表示方法有区别。
通过人工识别,我们可以识别出上面两种表示方法表示的其实是同一地名,而对于计算机系统,由于自身的行政区划标准可能与上面两种方式不同,所以计算机系统将很难准确识别出用其他行政区划标准表示的地名,而错误的识别结果将会给用户带来极大的困扰。
因此,有必要提供一种新的方法解决上述问题。
发明内容
本发明实施例提供了一种地名识别方法及装置,能够准确识别地名。
本发明实施例提供的地名识别方法包括:对待识别地名中的字符串进行分词得到候选词集;以所述候选词集中的候选词为关键字,在标准地名数据库中查找与所述关键字匹配的标准地名,所述标准地名即为所述待识别地名的目标地名。
本发明实施例提供的地名识别装置包括:分词单元,用于对待识别地名中的字符串进行分词得到候选词集;处理单元,用于以所述候选词集中的候选词为关键字,在标准地名数据库中查找与所述关键字匹配的标准地名,所述标准地名即为所述待识别地名的目标地名。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例中,首先会对待识别地名中的字符串进行分词得到候选词集,然后以候选词集中的候选词为关键字,在标准地名数据库中查找与上述关键字匹配的标准地名,标准地名即为待识别地名的目标地名。本发明实施例中,以标准地名数据库中的地名为标准地名,在对待识别地名进行分词匹配处理后,最终在标准地名数据库中找出与待识别地名对应的标准地名,将标准地名作为待识别地名的目标地名,从而实现准确识别地名。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明地名识别方法一个实施例示意图;
图2为本发明地名识别方法另一实施例示意图;
图3为本发明地名识别方法另一实施例示意图;
图4为本发明地名识别装置一个实施例示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种地名识别方法及装置,能够准确识别地名。
请参阅图1,本发明地名识别方法一个实施例包括:
101、对待识别地名中的字符串进行分词得到候选词集;
本实施例中用户可以按照中文地名书写习惯输入待识别地名,即将大地名输入在前,小地名输入在后,通常一个地名会有多个字符串组成。
待地名输入完成后,地名识别装置对待识别地名中的字符串进行分词,分词之后会形成一个候选词集,候选词集中的每一个候选词就是待识别地名中的一个子地名。
102、以候选词集中的候选词为关键字,在标准地名数据库中查找与上述关键字匹配的标准地名,标准地名即为待识别地名的目标地名。
地名识别装置以候选词集中的候选词为关键字,在标准地名数据库中查找与这些关键字匹配的标准地名,将这个标准地名作为待识别地名的目标地名。
本实施例中的标准地名数据库可以根据国家统计局或其他权威机构提供的数据整理得到,当然也可以由用户自行创建,此处不做具体限定。标准地名数据库中包含标准地名,每个标准地名由一个或多个按级划分的标准子地名组成。例如,每个标准地名可以包含省、地、县、乡、村的详细名称。另外,标准地名数据库中还可以包含行政区划编码,行政区划编码可以使用固定长度、按位切分的数字结构表示;且行政区划编码与标准地名一一对应。这样每一个正确输入的待识别地名,地名识别装置都将能从标准地名数据库找到与之对应的标准地名。
本实施例中,以标准地名数据库中的地名为标准地名,在对待识别地名进行分词匹配处理后,最终在标准地名数据库中找出与待识别地名对应的标准地名,将标准地名作为待识别地名的目标地名,从而实现准确识别地名。
为便于理解,下面以一具体实施例对本发明实施例中地名识别方法进行描述,请参阅图2,本实施例方法包括:
201、对待识别地名中的字符串进行分词得到候选词集;
本实施例中用户可以按照中文地名书写习惯输入待识别地名,即将大地名输入在前,小地名输入在后,通常一个地名会有多个字符串组成。
本实施例中,可以采用MMSEG分词工具对待识别地名中的字符串进行分词,当然也可以采用其他分词中文工具对待识别地名中的字符串进行分词,分词之后会形成一个候选词集,候选词集中的每一个候选词就是待识别地名中的一个子地名。例如,待识别地名为“北京市东城区东华门”,分词之后得到的候选词集为{北京市,东城区,东华门}。
202、在标准地名数据库中查找与候选词集中的第一个候选词匹配的第一标准地名集;
本实施例中的标准地名数据库可以根据国家统计局或其他权威机构提供的数据整理得到,当然也可以由用户自行创建,此处不做具体限定。标准地名数据库中包含标准地名,每个标准地名由一个或多个按级划分的标准子地名组成。例如,每个标准地名可以包含省、地、县、乡、村的详细名称。另外,标准地名数据库中还可以包含行政区划编码,行政区划编码可以使用固定长度、按位切分的数字结构表示;且行政区划编码与标准地名一一对应。下面举例说明本实施例提供的标准地名数据库,假如从国家统计局获取的地名数据如表1所示:
表1
行政区划编码 级次
110000000000 北京 1
110100000000 北京 东城区 2
110101000000 北京 东城区 东城区 3
110101001000 北京 东城区 东城区 东华门 4
110101002000 北京 东城区 东城区 景山 4
110101003000 北京 东城区 东城区 交道口 4
110101004000 北京 东城区 东城区 安定门 4
110101005000 北京 东城区 东城区 北新桥 4
110101006000 北京 东城区 东城区 东四 4
对表1中的数据进行整理之后得到本实施例的标准地名数据库,本实施例的标准地名数据库中的数据如表2所示:
表2
行政区划编码 标准地名
110000000000 {北京}
110100000000 {北京,东城区}
110101000000 {北京,东城区,东城区}
110101001000 {北京,东城区,东城区,东华门}
110101002000 {北京,东城区,东城区,景山}
110101003000 {北京,东城区,东城区,交道口}
110101004000 {北京,东城区,东城区,安定门}
110101005000 {北京,东城区,东城区,北新桥}
110101006000 {北京,东城区,东城区,东四}
为了进一步提高后续对地名识别的准确性,本实施例中,还可以对表2中的数据做去冗余处理,以使每个标准地名最简化。例如,对于行政区划编码为110101001000的标准地名,去冗余之后的标准地名就可以表示为{北京,东城,东城,东华门}。
同样,还可以对经过步骤201进行分词之后得到的候选词集中的每个候选词进行去冗余处理,上面的例子中,待识别地名对应的候选词集为{北京市,东城区,东华门},去冗余处理后得到的候选词集为{北京,东城,东华门}。
在标准地名数据库中查找与候选词集中的第一个候选词匹配的标准地名集。本实施例中所指的匹配可以是二者的完全相同,也可以是二者主要的部分相同。假如标准地名数据库中的标准地名是无冗余,最简化的,且对待识别地名形成的候选词集中的候选词也做了去冗余处理,那么这里的匹配即指的是二者完全相同,否则,二者的主要部分相同就认为是匹配的,例如,对于“北京”与“北京市”,地名识别装置将会认为二者是相互匹配的。
上面的例子中,假设与候选词集中的第一个候选词“北京市”匹配的标准地名有9个,如表2所示,那么第一标准地名集里就包括9个标准地名。
203、在第一标准地名集里查找与候选词集中的第二个候选词匹配的第二标准地名集;
上面的例子中,在第一标准地名集里与第二候选词“东城区”匹配的标准地名有8个,这8个标准地名组成第二标准地名集,第二标准地名集中标准地名的数量小于第一标准地名集中标准地名的数量。
204、依次遍历候选词集中的每一个候选词,最终找出与候选词集中的最后一个候选词匹配的标准地名,标准地名即为待识别地名的目标地名。
接下来在第二标准地名集里寻找与候选词集中的第三个候选词匹配的标准地名,找到的匹配的标准地名只有一个,即行政区划编码为110101001000对应的标准地名。
从上面的例子可以看出,如果用户输入的每个待识别地名是正确的,则按照上述递进式逐级缩小范围的匹配方法一定会在标准地名数据库中找到与待识别地名对应的目标地名。对于本实施例中所提到的例子,识别出的待识别地名为“北京市东城区东华门”的目标地名为“北京东城区东城区东华门”(没做去冗余处理的)或“北京东城东城东华门”(做过去冗余处理的)。
需要说明的是,按照本实施例提供的方法,还可以识别输入的不完整的地名,例如:输入的地名为“广东省,南山区”,按照上述递进式搜索匹配方法最终可以识别出目标地名为“广东省,深圳市,南山区”。另外,因本实施例中对候选词的匹配采用的是采用递进式搜索匹配的方法,所以可以有效避免逻辑误判。例如:输入的是“广东省,南山区”,最终识别出的目标地址只会是“广东省,深圳市,南山区”,而不会是“黑龙江,鹤岗市,南山区”。
本实施例中,以标准地名数据库中的地名为标准地名,在对待识别地名进行分词处理后,在标准地名数据库中以递进式搜索方式找出与待识别地名对应的标准地名,将标准地名作为待识别地名的目标地名,从而实现准确识别地名。
下面将描述本发明实施例提供的另一种地名识别方法,请参阅图3,本实施例与上述实施例的主要区别在于查找与每个候选词匹配的标准地名的方法不同,本实施例方法包括:
301、对待识别地名中的字符串进行分词得到候选词集;
本实施例中用户可以按照中文地名书写习惯输入待识别地名,即将大地名输入在前,小地名输入在后,通常一个地名会有多个字符串组成。
本实施例中,可以采用MMSEG分词工具对待识别地名中的字符串进行分词,当然也可以采用其他分词中文工具对待识别地名中的字符串进行分词,分词之后会形成一个候选词集,候选词集中的每一个候选词就是待识别地名中的一个子地名。例如,待识别地名为“北京市东城区东华门”,分词之后得到的候选词集为{北京市,东城区,东华门}。同样,还可以按照前述实施例的方法对候选词集中的候选词做去冗余处理。
302、直接在标准地名数据库中查找与候选词集中的所有候选词同时匹配的标准地名,标准地名即为待识别地名的目标地名。
本实施例中,直接将候选词集中的所有候选词放入标准地名数据库中查找,然后将同时命中所有候选词的标准地名作为目标地名。标准地名数据库中的每个标准地名也可以由一个或多个按级划分的标准子地名组成,且每个标准地名也可以是无冗余的最简的标准地名。
本实施例中,以标准地名数据库中的地名为标准地名,在对待识别地名进行分词匹配处理后,在标准地名数据库中找出与所有候选词同时匹配的标准地名,将与候选词同时匹配的标准地名作为待识别地名的目标地名,从而实现准确识别地名。
下面对本发明实施例中的地名识别装置进行描述,请参阅图4,本发明中地名识别装置一个实施例包括:
分词单元401,用于对待识别地名中的字符串进行分词得到候选词集;
处理单元402,用于以候选词集中的候选词为关键字,在标准地名数据库中查找与上述关键字匹配的标准地名,标准地名即为待识别地名的目标地名。
为便于理解,下面以一个实际应用场景对本实施例中的地名识别装置的各个单元之间的交互方式进行描述:
首先,用户可以按照中文地名书写习惯输入待识别地名,即将大地名输入在前,小地名输入在后,通常一个地名会有多个字符串组成。然后分词单元401对待识别地名中的字符串进行分词得到候选词集。本实施例中,分词单元401可以采用MMSEG分词工具对待识别地名中的字符串进行分词,当然也可以采用其他分词中文工具对待识别地名中的字符串进行分词,分词之后会形成一个候选词集,候选词集中的每一个候选词就是待识别地名中的一个子地名。例如,待识别地名为“北京市东城区东华门”,分词之后得到的候选词集为{北京市,东城区,东华门}。
在经过分词单元401的处理得到候选词集后,处理单元402以候选词集中的候选词为关键字,在标准地名数据库中查找与上述关键字匹配的标准地名,标准地名即为待识别地名的目标地名。具体地,处理单元402可以采用以下两种方式在标准地名数据库中查找与关键字匹配的标准地名:
第一种方式:递进式查找匹配法;
首先处理单元402在标准地名数据库中查找与候选词集中的第一个候选词匹配的第一标准地名集;
本实施例中的标准地名数据库可以根据国家统计局或其他权威机构提供的数据整理得到,当然也可以由用户自行创建,此处不做具体限定。标准地名数据库中包含标准地名,每个标准地名由一个或多个按级划分的标准子地名组成。例如,每个标准地名可以包含省、地、县、乡、村的详细名称。另外,标准地名数据库中还可以包含行政区划编码,行政区划编码可以使用固定长度、按位切分的数字结构表示;且行政区划编码与标准地名一一对应。标准地名数据库中的标准地名可以是无冗余的最简的标准地名,对应地,处理单元402在为候选词集中的每个候选词寻找匹配的标准地名之前,也可以对候选词集中的每个候选词做去冗余处理。
当某个标准地名里的标准子地名与候选词集中的第一个候选词完全相同,或者主要的部分相同时,认为该标准地名与第一个候选词匹配,与第一个候选词匹配的所有标准地名形成第一标准地名集。
然后处理单元402在第一标准地名集里查找与候选词集中的第二个候选词匹配的第二标准地名集,第二标准地名集里标准地名的数量小于第一标准地名集里标准地名的数量。
处理单元402依次遍历候选词集中的每一个候选词,最终找出与候选词集中的最后一个候选词匹配的标准地名,标准地名即为待识别地名的目标地名。
如果用户输入的每个待识别地名是正确的,则按照上述递进式逐级缩小范围的匹配方法一定会在标准地名数据库中找到与待识别地名对应的目标地名。
按照递进式查找匹配的方法,地名识别装置还可以识别输入的不完整的地名,例如:输入的地名为“广东省,南山区”,按照上述方法最终可以识别出目标地名为“广东省,深圳市,南山区”。另外,采用递进式查找匹配的方法,还可以有效避免逻辑误判。例如:输入的是“广东省,南山区”,最终识别出的目标地址只会是“广东省,深圳市,南山区”,而不会是“黑龙江,鹤岗市,南山区”。
第二种方式:权重积分式查找匹配法;
处理单元402直接将候选词集中的所有候选词放入标准地名数据库中查找,然后将同时命中所有候选词的标准地名(权重积分最高)作为目标地名。
本实施例中,地名识别装置以标准地名数据库中的地名为标准地名,处理单元在分词单元在对待识别地名进行分词处理后,在标准地名数据库中以递进式查找方式或者权重积分式查找方式找出与待识别地名对应的标准地名,将标准地名作为待识别地名的目标地名,从而实现准确识别地名。
另外需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本发明而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上对本发明实施例所提供的一种地名识别方法及装置进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,因此,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种地名识别方法,其特征在于,包括:
对待识别地名中的字符串进行分词得到候选词集;
以所述候选词集中的候选词为关键字,在标准地名数据库中查找与所述关键字匹配的标准地名,所述标准地名即为所述待识别地名的目标地名。
2.如权利要求1所述的地名识别方法,其特征在于,所述候选词集中的候选词为所述待识别地名中的待识别子地名,所述标准地名数据库中的每个标准地名由一个或多个按级划分的标准子地名组成。
3.如权利要求2所述的地名识别方法,其特征在于,所述以所述候选词集中的候选词为关键字,在标准地名数据库中查找与所述关键字匹配的标准地名的方法具体为:
在所述标准地名数据库中查找与所述候选词集中的第一个候选词匹配的第一标准地名集;
在所述第一标准地名集里查找与所述候选词集中的第二个候选词匹配的第二标准地名集;
依次遍历所述候选词集中的每一个候选词,最终找出与所述候选词集中的最后一个候选词匹配的标准地名。
4.如权利要求3所述的地名识别方法,其特征在于,所述第二标准地名集中的标准地名的数量小于所述第一标准地名集中的标准地名的数量。
5.如权利要求1所述的地名识别方法,其特征在于,所述以所述候选词集中的候选词为关键字,在标准地名数据库中查找与所述关键字匹配的标准地名的方法具体为:
直接在所述标准地名数据库中查找与所述候选词集中的所有候选词同时匹配的标准地名。
6.一种地名识别装置,其特征在于,包括:
分词单元,用于对待识别地名中的字符串进行分词得到候选词集;
处理单元,用于以所述候选词集中的候选词为关键字,在标准地名数据库中查找与所述关键字匹配的标准地名,所述标准地名即为所述待识别地名的目标地名。
7.如权利要求6所述的地名识别装置,其特征在于,所述候选词集中的候选词为所述待识别地名中的待识别子地名,所述标准地名数据库中的每个标准地名由一个或多个按级划分的标准子地名组成。
8.如权利要求7所述的地名识别装置,其特征在于,所述处理单元以所述候选词集中的候选词为关键字,在标准地名数据库中查找与所述关键字匹配的标准地名的方法具体为:
所述处理单元在所述标准地名数据库中查找与所述候选词集中的第一个候选词匹配的第一标准地名集;
所述处理单元在所述第一标准地名集里查找与所述候选词集中的第二个候选词匹配的第二标准地名集;
所述处理单元依次遍历所述候选词集中的每一个候选词,最终找出与所述候选词集中的最后一个候选词匹配的标准地名。
9.如权利要求8所述的地名识别装置,其特征在于,所述第二标准地名集中的标准地名的数量小于所述第一标准地名集中的标准地名的数量。
10.如权利要求6所述的地名识别装置,其特征在于,所述处理单元以所述候选词集中的候选词为关键字,在标准地名数据库中查找与所述关键字匹配的标准地名的方法具体为:
所述处理单元直接在所述标准地名数据库中查找与所述候选词集中的所有候选词同时匹配的标准地名。
CN201310559720.7A 2013-11-12 2013-11-12 一种地名识别方法及装置 Pending CN103559177A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310559720.7A CN103559177A (zh) 2013-11-12 2013-11-12 一种地名识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310559720.7A CN103559177A (zh) 2013-11-12 2013-11-12 一种地名识别方法及装置

Publications (1)

Publication Number Publication Date
CN103559177A true CN103559177A (zh) 2014-02-05

Family

ID=50013426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310559720.7A Pending CN103559177A (zh) 2013-11-12 2013-11-12 一种地名识别方法及装置

Country Status (1)

Country Link
CN (1) CN103559177A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106269528A (zh) * 2015-05-20 2017-01-04 阿里巴巴集团控股有限公司 提供地址分拣信息的方法及装置
CN106326233A (zh) * 2015-06-18 2017-01-11 阿里巴巴集团控股有限公司 地址提示方法及装置
CN106959961A (zh) * 2016-01-11 2017-07-18 阿里巴巴集团控股有限公司 一种地址识别方法及装置
CN108038090A (zh) * 2017-12-26 2018-05-15 北京明朝万达科技股份有限公司 一种文本地址的处理方法和装置
CN108073564A (zh) * 2016-11-09 2018-05-25 北京国双科技有限公司 法院名称的统计方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350012A (zh) * 2007-07-18 2009-01-21 北京灵图软件技术有限公司 一种地址匹配的方法和系统
CN101685502A (zh) * 2008-09-24 2010-03-31 华为技术有限公司 模式匹配方法及装置
CN102289467A (zh) * 2011-07-22 2011-12-21 浙江百世技术有限公司 确定目标网点的方法和装置
US8131539B2 (en) * 2007-03-07 2012-03-06 International Business Machines Corporation Search-based word segmentation method and device for language without word boundary tag
CN103186524A (zh) * 2011-12-30 2013-07-03 高德软件有限公司 一种地名识别方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8131539B2 (en) * 2007-03-07 2012-03-06 International Business Machines Corporation Search-based word segmentation method and device for language without word boundary tag
CN101350012A (zh) * 2007-07-18 2009-01-21 北京灵图软件技术有限公司 一种地址匹配的方法和系统
CN101685502A (zh) * 2008-09-24 2010-03-31 华为技术有限公司 模式匹配方法及装置
CN102289467A (zh) * 2011-07-22 2011-12-21 浙江百世技术有限公司 确定目标网点的方法和装置
CN103186524A (zh) * 2011-12-30 2013-07-03 高德软件有限公司 一种地名识别方法和装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106269528A (zh) * 2015-05-20 2017-01-04 阿里巴巴集团控股有限公司 提供地址分拣信息的方法及装置
CN106269528B (zh) * 2015-05-20 2018-12-21 菜鸟智能物流控股有限公司 提供地址分拣信息的方法及装置
CN106326233A (zh) * 2015-06-18 2017-01-11 阿里巴巴集团控股有限公司 地址提示方法及装置
CN106326233B (zh) * 2015-06-18 2019-10-11 菜鸟智能物流控股有限公司 地址提示方法及装置
CN106959961A (zh) * 2016-01-11 2017-07-18 阿里巴巴集团控股有限公司 一种地址识别方法及装置
CN108073564A (zh) * 2016-11-09 2018-05-25 北京国双科技有限公司 法院名称的统计方法及装置
CN108038090A (zh) * 2017-12-26 2018-05-15 北京明朝万达科技股份有限公司 一种文本地址的处理方法和装置

Similar Documents

Publication Publication Date Title
US20200349175A1 (en) Address Search Method and Device
CN103678708B (zh) 一种识别预设地址的方法及装置
CN107220300B (zh) 信息挖掘方法、电子装置及可读存储介质
US9767183B2 (en) Method and system for enhanced query term suggestion
US20090164890A1 (en) Self learning contextual spell corrector
CN106202028B (zh) 一种地址信息识别方法及装置
CN103559177A (zh) 一种地名识别方法及装置
CN103902535A (zh) 获取联想词的方法、装置及系统
CN103914533A (zh) 推广搜索结果的展现方法和装置
CN110688434B (zh) 一种兴趣点处理方法、装置、设备和介质
CN105653547A (zh) 一种提取文本关键词的方法和装置
WO2022100154A1 (zh) 基于人工智能的地址标准化方法、装置、设备和存储介质
CN109284763A (zh) 一种生成分词训练数据的方法和服务器
CN111309872B (zh) 搜索处理方法、装置及设备
CN112380847A (zh) 兴趣点处理方法、装置、电子设备及存储介质
CN111753029A (zh) 实体关系抽取方法、装置
CN106980639B (zh) 短文本数据聚合系统及方法
CN105159885A (zh) 一种兴趣点名称的识别方法和装置
CN106155998A (zh) 一种数据处理方法及装置
US8688688B1 (en) Automatic derivation of synonym entity names
CN112069824B (zh) 基于上下文概率和引证的地域识别方法、装置及介质
CN107577667B (zh) 一种实体词处理方法和装置
CN105608183A (zh) 一种提供聚合类型回答的方法和装置
CN112579713B (zh) 地址识别方法、装置、计算设备及计算机存储介质
CN106651408B (zh) 一种数据分析方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: SHENZHEN QIANHAI BAIDI NETWORK CO., LTD.

Free format text: FORMER OWNER: KINGDEE SOFTWARE (CHINA) COMPANY LTD.

Effective date: 20150629

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150629

Address after: 518052 Guangdong city of Shenzhen province Nanshan District Qianhai Shenzhen Hong Kong cooperation zone before the Bay Road No. 1 building 201 room A (located in Shenzhen Qianhai business secretary Co. Ltd.)

Applicant after: SHENZHEN QIANHAI BAIDI NETWORK CO., LTD.

Address before: 518057 Guangdong city of Shenzhen province science and technology science and Technology Park of Nanshan District twelve South Road No. 2, Kingdee Software Park A block 1-8

Applicant before: Kingdee Software (China) Co., Ltd.

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140205