CN103605752A - 一种基于语义识别的地址匹配方法 - Google Patents
一种基于语义识别的地址匹配方法 Download PDFInfo
- Publication number
- CN103605752A CN103605752A CN201310596806.7A CN201310596806A CN103605752A CN 103605752 A CN103605752 A CN 103605752A CN 201310596806 A CN201310596806 A CN 201310596806A CN 103605752 A CN103605752 A CN 103605752A
- Authority
- CN
- China
- Prior art keywords
- semantic
- address
- administrative division
- lemma
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Abstract
本发明公开了一种基于语义识别的地址匹配方法,所述方法包括地址匹配引擎和日志分析引擎,地址匹配引擎包括行政区划语义模块、地名类别语义模块、标准地址模块、语义规则模块、中文分词模块、语义识别模块、查询模块。所述方法根据用户输入的待检索地址通过基于语义识别的地址匹配引擎快速、准确地查找到匹配的地址,并以在线服务的形式返回用户检索结果,日志分析引擎记录并分析查询日志,根据日志分析结果优化地址匹配引擎。
Description
技术领域
本发明属于对地观测与导航技术领域,具体涉及一种基于语义识别的地址匹配方法。
背景技术
地址检索、查询服务是网络地图在线服务的重要功能。地址匹配是将文字性的描述地址与其空间的地理位置坐标建立起对应关系的过程,其目的是要根据用户输入的待检索地址快速查找到匹配的地址,并以在线服务的形式返回用户检索结果。传统的方法通常采用基于关键词的精确或模糊匹配方法,这对于大规模或大范围的地名地址数据,不仅查找的速度慢,很难满足网络地图在线快速服务的需要,也没有顾及地址的语义信息,导致查找的准确性比较低,查找结果多样且往往不是用户所需要的结果。例如,当用户在互联网上查找“上海南京路”时,期望的返回结果应该是位于上海,名称为南京路的道路,但普通的查找方法可能会将南京的上海路和上海的南京路都作为结果返回。因此,针对上述两个问题,发明了一种基于语义识别的地址匹配方法,可以有效地提高地址数据查找的速度和准确性,从而提高网络地图在线服务质量,为用户提供良好的服务检验。
发明内容
针对上述现有技术中的不足,本发明的目的在于提供一种基于语义识别的地址匹配方法。对于以自然语言形式表示的地址信息,通过中文分词技术,并顾及地址的语义建立用于地址匹配的语义库或知识库,然后根据地址数据表达的语义特点,建立地址匹配的规则,通过适当的匹配算法提高地址检索的速度和准确性。
为了实现上述发明目的,本申请提供了以下技术方案:
一种基于语义识别的地址匹配方法,所述方法包括地址匹配引擎和日志分析引擎,所述地址匹配引擎根据用户输入的待检索地址基于语义识别快速、准确地查找到匹配的地址,并以在线服务的形式返回用户检索结果,所述日志分析引擎记录并分析查询日志,根据日志分析结果优化地址匹配引擎。地址匹配引擎包括行政区划语义模块、地名类别语义模块、语义规则模块、标准地址模块、语义规则模块、中文分词模块、语义识别模块、查询模块。所述方法步骤如下:
(1)利用行政区划语义模块建立行政区划语义库;
(2)利用地名类别语义模块建立地名类别语义库;
(3)利用标准地址模块建立规范化的具体地址库;
(4)利用语义规则模块建立基于语义的地址检索规则;
(5)利用中文分词模块对待查地址进入中文分词;
(6)利用语义识别模块对分词得到的词元进行语义识别;
(7)利用查询模块对识别后的词元基于语义规则进行查询;
(8)利用日志分析引擎记录地址匹配日志,分析日志,将分析结果反馈给地址匹配引擎,优化地址匹配引擎。
在步骤(1)中,所述行政区划语义模块中,行政区划以其国家标准编码为基本信息,建立相应的行政区划语义库,用于地址匹配后续过程的行政区划语义匹配,行政区划是界定地址行政范围的主要属性之一,也是地址的基本语义之一,在进行地址匹配时,行政区划语义是优先考虑的语义匹配。
在步骤(2)中,所述地名类别语义模块,描述了地名地址所归属的分类,是地址的基本语义之一,其中,地名类别编码是多级编码的方式。
步骤(3)中,所述标准地址模块对不同区域的地址数据进行规范化设计,准确地进行地址匹配。
在步骤(4)中,所述语义规则模块,建立基于语义的地址检索规则和规则间的关系,形成地址检索的知识库,具体方法为
a、当词元有且仅有一个,并且该词元类型为“行政区划”时,进行行政区划查询,返回行政区划的信息;
b、当词元有多个且所有词元都是“行政区划”时,进行行政区划查询,返回地区级别最小的那个行政区划信息;
c、当词元有多个且所有词元都是“行政区划”时,并且行政区划不是上下级关系,应取第一个行政区划做范围,其他行政区划做关键字进行普通地名查询,返回位置在行政区划内,且名称包含指定关键字的地名;
d、当词元有且仅有一个,并且该词元类型为“类别”时,按照类别进行查询;
e、当词元中既有“类别”,也有“行政区划”的时候,按照规则c得到行政区划和关键字,在指定类别中查找地名;
f、当词元既不包含“行政区划”类的词,也不包含“类别”类的词,将这些词当做关键字查找地名;
g、当词元既包含“行政区划”类的词,同时包含关键字,则在行政区划内按指定关键字进行查询;
h、当词元既包含多个“行政区划”类的词,并且行政区划不是同一区域,或者是第二个行政区划大于第一行政区划,包含关键字,第一个当行政区划,后面当做关键字处理;
i、当词元有多个且所有词元都是“地名类型”时,按照排列的先后顺序,排在最后的为“地名类型”,其他词作为关键字进行查询
g、当包含“门牌”类型词元时,按以上规则构建查询条件,并进行地址查询。
在步骤(5)中,对待查地址进入中文分词模块,对于用户输入的以自然语言形式表示的待查地址采用成熟的中文分词算法,并将行政区划语义库、地名类别语义库中的数据纳入到用于中文分词的字典中,以改进中文分词算法的查准性、查全性,适当减少中文分词算法中存在的语义歧义问题,分词过程中支持同义词典,分词后得到地址词元。
步骤(6)中,对分词得到的词元进入语义识别模块,对于分词后得到的地址词元,根据行政区划语义库、地名类别语义库以及专家知识对词元进行语义识别,确定每个词元匹配的数据库表范围,避免大范围地检索无关联的地址数据,以减少数据库检索的时间。
所述步骤(7)中,对识别后的词元基于语义规则进入查询模块,在具体地址库中采用数据库查询语言对识别后的词元基于语义规则进行查询,返回查询结果给用户。
所述步骤(8)中,日志分析引擎记录地址匹配日志,并分析日志,将分析结果反馈给地址匹配引擎,优化地址匹配引擎,也能够导入其他外部系统的日志库或知识库,并利用其优化地址匹配引擎。
优选方案为:
首先,为了保证地址查找服务能够匹配到所需要的结果,保证检索的查全性,需要建立符合标准的完整地址库。为了达到良好的地址匹配效果,本发明对地址库进行了以下优化设计:
1)对于以自然语言形式表示的地址进行语义分析,将语义信息分为行政区划语义、地名类别语义和具体地址三类;行政区划语义表示了地址所归属的行政区划范围,如湖北省。地名类别语义表示了地址所属的类别,如行业性质类别,比如快餐、超市、大学。具体地址为地址信息中不能归于行政区划语义、地名类别语义的地址语义部分,如测绘大厦。
2)依据上述语义信息类别,分别建立多层级的语义数据库表,包括行政区划语义库、地名类别语义库、和根据行政区划与地名类别分类的多个具体地址库。
3)对上述语义库进行了规范化设计,例如,行政区划采用国家标准编码,可支持到街道、村级的编码。地名类别和具体地址参考测绘行业标准《地理信息公共服务平台地理实体与地名地址数据规范》(CH/Z9010-2011)及相关的国内、国标标准进行规范化设计,给出了设计原则和数据库表结构,具体设计在系统实现时完成,可以满足不同系统的地址检索需求。
其次,在传统的地址检索方法的基础上,根据地址检索的经验,通过访问专家和典型用户建立了基于语义的地址检索规则和规则间的关系,形成地址检索的知识库。
然后,对用户输入的需要查找的地址进行中文分词和语义识别。中文分词采用较成熟的分词算法,但需要顾及上面描述的语义信息分类,也就是基于行政区划语义、地名类别语义和具体地址对用户描述的地址进行分词,划分成为基本的地址词元或关键词。然后对地址词元进行语义识别,判断地址词元属于行政区划语义、地名类别语义还是具体地址。语义识别依据地址词元的性质、词元的关系等知识,通过语义匹配算法实现。
最后,通过建立地址匹配规则,分别对语义识别后的地址词元进行匹配,返回查找结果,记录地址匹配日志,并分析日志,将分析结果反馈给地址匹配引擎,优化地址匹配引擎。
有益效果
1、先通过对地址进行语义分析与识别,对识别后的地址词元快速定位于相应的语义库,并在该语义库中进行关键词匹配。由于分类后的语义库规模较没有进行分别的地址规模小,提高了关键词匹配的速度,而定位语义库的时间很短,从而整体上可以获得较高的地址查找速度。同时,由于在进行中文分词时顾及了地址的语义,使得查找的结果更能体现用户的意思,有利于提高查找的准确性。
2、本发明通过建立基于语义的匹配规则,充分采用地址匹配的经验知识,提高了地址匹配算法的效率。
附图说明
图1是基于语义识别的地址匹配方法示意图。
具体实施方式
具体实施方式如下:
<一>建立行政区划语义库
行政区划是界定地址行政范围的主要属性之一,也是地址的基本语义之一。在进行地址匹配时,行政区划语义是优先考虑的语义匹配。
行政区划以其国家标准编码为基本信息,建立相应的行政区划语义库,用于地址匹配后续过程的行政区划语义匹配。行政区划语义库的表结构如表1所示。
表1行政区划语义库的表结构
字段名称 | 数据类型 | 允许为空 | 描述 |
GBCODE | VARchar2(11) | × | 行政区划国标码 |
GBNAME | VARchar2(255) | × | 行政区名称 |
GB_LI_NAME | VARchar2(255) | √ | 行政区划简称 |
ZIP | VARchar2(6) | √ | 邮政编码 |
X | NUMBER(38,8) | √ | 地名位置X坐标 |
Y | NUMBER(38,8) | √ | 地名位置Y坐标 |
<二>建立地名类别语义库
地名类别描述了地名地址所归属的分类,也是地址的基本语义之一。本发明设计了地名类别语义库的数据表结构如表2所示。其中,地名类别编码可以是多级编码的方式。不同用户在系统实施时可根据设计的规则自定义具体的地名类别库,以满足不同的系统要求。
表2地名类别语义库的数据表结构
字段名称 | 数据类型 | 允许为空 | 描述 |
ID | NUMBER(38) | × | 主键 |
CODE | NUMBER(16) | × | 编码 |
NAME | VARchar2(128) | × | 分类名称 |
<三>建立规范化的具体地址库
参考测绘行业标准《地理信息公共服务平台地理实体与地名地址数据规范》(CH/Z9010-2011)和其它相关国内、国际标准,对不同区域的地址数据进行规范化设计,以有利于准确地进行地址匹配。规范化的具体地址库表结构如表3所示。
表3规范化的具体地址库表结构
<四>建立基于语义的地址检索规则
根据地址检索的经验,通过访问专家和典型用户建立了基于语义的地址检索规则和规则间的关系,形成地址检索的知识库。部分规则如下:
(1)当词元有且仅有一个,并且该词元类型为“行政区划”时,进行行政区划查询,返回行政区划的信息;
例如:湖北省,湖北。
(2)当词元有多个且所有词元都是“行政区划”时,进行行政区划查询,返回地区级别最小的那个行政区划信息;
例如:湖北省武汉市,湖北武汉。
(3)当词元有多个且所有词元都是“行政区划”时,并且行政区划不是上下级关系,应取第一个行政区划做范围,其他行政区划做关键字进行普通地名查询,返回位置在行政区划内,且名称包含指定关键字的地名;
(4)当词元有且仅有一个,并且该词元类型为“类别”时,按照类别进行查询;
例如:快餐,超市。
(5)当词元中既有“类别”,也有“行政区划”的时候,按照规则3得到行政区划和关键字,在指定类别中查找地名;
例如:武汉超市。
(6)当词元既不包含“行政区划”类的词,也不包含“类别”类的词,将这些词当做关键字查找地名;
例如:眼镜。
(7)当词元既包含“行政区划”类的词,同时包含关键字,则在行政区划内按指定关键字进行查询;
例如:武汉眼镜。
(8)当词元既包含多个“行政区划”类的词,并且行政区划不是同一区域,或者是第二个行政区划大于第一行政区划,包含关键字,第一个当行政区划,后面当做关键字处理;
例如:武汉湖南眼镜,武汉湖北眼镜。
(9)当词元有多个且所有词元都是“地名类型”时,按照排列的先后顺序,排在最后的最为“地名类型”,其他词作为关键字进行查询。
例如:酒店停车场。
(10)当包含“门牌”类型词元时(门牌前缀、门牌、门牌后缀、楼牌),按以上规则构建查询条件,并进行地址查询。
<五>对待查地址进行中文分词
对于用户输入的以自然语言形式表示的待查地址采用成熟的中文分词算法,并将行政区划语义库、地名类别语义库中的数据纳入到用于中文分词的字典中,以改进中文分词算法的查准性、查全性,适当减少中文分词算法中存在的语义歧义问题。分词过程中支持同义词典。分词后得到地址词元。
<六>对分词得到的词元进行语义识别
对于分词后得到的地址词元,根据行政区划语义库、地名类别语义库以及专家知识对词元进行语义识别,确定每个词元匹配的数据库表范围,避免大范围地检索无关联的地址数据,以减少数据库检索的时间。
<七>对识别后的词元基于语义规则进行查询
在具体地址库中采用数据库查询语言对识别后的词元基于语义规则进行查询,返回查询结果给用户。
<八>根据日志分析结果优化地址匹配引擎
根据查询结果和用户反馈信息,记录地址匹配日志,并分析日志,将分析结果反馈给地址匹配引擎,优化地址匹配引擎。也能够导入其他外部系统的日志或知识库,并利用其优化地址匹配引擎。
最后应说明的是:显然,上述实施例仅仅是为清楚地说明本申请所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本申请型的保护范围之中。
Claims (10)
1.一种基于语义识别的地址匹配方法,其特征在于,所述方法包括地址匹配引擎和日志分析引擎,所述地址匹配引擎根据用户输入的待检索地址基于语义识别快速、准确地查找到匹配的地址,并以在线服务的形式返回用户检索结果,所述日志分析引擎记录并分析查询日志,根据日志分析结果优化地址匹配引擎。
2.根据权利要求1所述的方法,其特征在于:所述地址匹配引擎包括行政区划语义模块、地名类别语义模块、语义规则模块、标准地址模块、语义规则模块、中文分词模块、语义识别模块、查询模块,所述地址匹配引擎的运行步骤如下,
(1)利用行政区划语义模块建立行政区划语义库;
(2)利用地名类别语义模块建立地名类别语义库;
(3)利用标准地址模块建立规范化的具体地址库;
(4)利用语义规则模块建立基于语义的地址检索方法;
(5)利用中文分词模块对待查地址进入中文分词;
(6)利用语义识别模块对分词得到的词元进行语义识别;
(7)利用查询模块对识别后的词元基于语义方法进行查询。
3.根据权利要求2所述的方法,其特征在于:在步骤(1)中,所述行政区划语义库模块中,行政区划以其国家标准编码为基本信息,建立相应的行政区划语义库,用于地址匹配后续过程的行政区划语义匹配,行政区划是界定地址行政范围的主要属性之一,也是地址的基本语义之一,在进行地址匹配时,行政区划语义是优先考虑的语义匹配。
4.根据权利要求2所述的方法,其特征在于:在步骤(2)中,所述地名类别语义库模块,描述了地名地址所归属的分类,是地址的基本语义之一,其中,地名类别编码是多级编码的方式。
5.根据权利要求2所述的方法,其特征在于:步骤(3)中,所述具体地址库模块对不同区域的地址数据进行规范化设计,准确地进行地址匹配。
6.根据权利要求2所述的方法,其特征在于:在步骤(4)中,所述基于语义的地址检索方法模块,建立基于语义的地址检索规则和规则间的关系,形成地址检索的知识库,具体方法为
a、当词元有且仅有一个,并且该词元类型为“行政区划”时,进行行政区划查询,返回行政区划的信息;
b、当词元有多个且所有词元都是“行政区划”时,进行行政区划查询,返回地区级别最小的那个行政区划信息;
c、当词元有多个且所有词元都是“行政区划”时,并且行政区划不是上下级关系,应取第一个行政区划做范围,其他行政区划做关键字进行普通地名查询,返回位置在行政区划内,且名称包含指定关键字的地名;
d、当词元有且仅有一个,并且该词元类型为“类别”时,按照类别进行查询;
e、当词元中既有“类别”,也有“行政区划”的时候,按照规则c得到行政区划和关键字,在指定类别中查找地名;
f、当词元既不包含“行政区划”类的词,也不包含“类别”类的词,将这些词当做关键字查找地名;
g、当词元既包含“行政区划”类的词,同时包含关键字,则在行政区划内按指定关键字进行查询;
h、当词元既包含多个“行政区划”类的词,并且行政区划不是同一区域,或者是第二个行政区划大于第一行政区划,包含关键字,第一个当行政区划,后面当做关键字处理;
i、当词元有多个且所有词元都是“地名类型”时,按照排列的先后顺序,排在最后的为“地名类型”,其他词作为关键字进行查询
g、当包含“门牌”类型词元时,按以上规则构建查询条件,并进行地址查询。
7.根据权利要求2所述的方法,其特征在于:步骤(5)中对待查地址进入中文分词模块,对于用户输入的以自然语言形式表示的待查地址采用成熟的中文分词算法,并将行政区划语义库、地名类别语义库中的数据纳入到用于中文分词的字典中,以改进中文分词算法的查准性、查全性,适当减少中文分词算法中存在的语义歧义问题,分词过程中支持同义词典,分词后得到地址词元。
8.根据权利要求2所述的方法,其特征在于:步骤(6)中,对分词得到的词元进入语义识别模块,对于分词后得到的地址词元,根据行政区划语义库、地名类别语义库以及专家知识对词元进行语义识别,确定每个词元匹配的数据库表范围,避免大范围地检索无关联的地址数据,以减少数据库检索的时间。
9.根据权利要求2所述的方法,其特征在于:所述步骤(7)中,对识别后的词元基于语义规则进入查询模块,在具体地址库中采用数据库查询语言对识别后的词元基于语义规则进行查询,返回查询结果给用户。
10.根据权利要求1所述的方法,其特征在于:所述日志分析引擎记录地址匹配日志,并分析日志,将分析结果反馈给地址匹配引擎,优化地址匹配引擎,也能够导入其他外部系统的日志库或知识库,并利用其优化地址匹配引擎。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310596806.7A CN103605752A (zh) | 2013-11-21 | 2013-11-21 | 一种基于语义识别的地址匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310596806.7A CN103605752A (zh) | 2013-11-21 | 2013-11-21 | 一种基于语义识别的地址匹配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103605752A true CN103605752A (zh) | 2014-02-26 |
Family
ID=50123974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310596806.7A Pending CN103605752A (zh) | 2013-11-21 | 2013-11-21 | 一种基于语义识别的地址匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103605752A (zh) |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103984735A (zh) * | 2014-05-21 | 2014-08-13 | 北京京东尚科信息技术有限公司 | 一种用于生成推荐配送地点名称的方法和装置 |
CN104391881A (zh) * | 2014-10-30 | 2015-03-04 | 杭州安恒信息技术有限公司 | 一种基于分词算法的日志解析方法及系统 |
CN104536957A (zh) * | 2014-09-26 | 2015-04-22 | 北京师范大学 | 农用土地流转信息检索方法和系统 |
CN104657486A (zh) * | 2015-03-02 | 2015-05-27 | 武汉工程大学 | 一种基于多因子的行政区划的可信度计算的方法 |
CN105426351A (zh) * | 2015-11-11 | 2016-03-23 | 中国建设银行股份有限公司 | 一种客户地址信息的分词处理方法和系统 |
CN105574019A (zh) * | 2014-10-14 | 2016-05-11 | 高德软件有限公司 | 一种查询参数处理方法及装置 |
CN105786800A (zh) * | 2016-03-23 | 2016-07-20 | 苏州数字地图信息科技股份有限公司 | 一种警用标准地址获取方法及系统 |
CN106503150A (zh) * | 2016-10-21 | 2017-03-15 | 天津海量信息技术股份有限公司 | 中文地名行政区划归属识别方法 |
CN106709065A (zh) * | 2017-01-19 | 2017-05-24 | 国家电网公司 | 一种地址信息标准化处理方法及装置 |
CN106970903A (zh) * | 2016-01-13 | 2017-07-21 | 阿里巴巴集团控股有限公司 | 物流系统中地址信息的处理方法及装置 |
CN107016084A (zh) * | 2017-03-31 | 2017-08-04 | 江苏速度信息科技股份有限公司 | 一种地名地址快速定位与查询的方法 |
CN108062365A (zh) * | 2017-12-06 | 2018-05-22 | 吉旗(成都)科技有限公司 | 一种提高地址解析准确度的方法 |
CN108563631A (zh) * | 2018-03-23 | 2018-09-21 | 江苏速度信息科技股份有限公司 | 一种自然语言地址描述的自动识别方法 |
CN109033222A (zh) * | 2018-06-29 | 2018-12-18 | 北京奇虎科技有限公司 | 兴趣点poi与检索关键字的相关性分析方法和装置 |
CN109145095A (zh) * | 2017-06-16 | 2019-01-04 | 贵州小爱机器人科技有限公司 | 地名信息匹配方法、信息匹配方法、装置及计算机设备 |
CN109344263A (zh) * | 2018-08-01 | 2019-02-15 | 昆明理工大学 | 一种地址匹配方法 |
CN109359200A (zh) * | 2018-10-11 | 2019-02-19 | 北京国信达数据技术有限公司 | 地名地址数据智能解析系统 |
CN109815268A (zh) * | 2018-12-21 | 2019-05-28 | 上海诺悦智能科技有限公司 | 一种交易制裁名单匹配系统 |
US10373103B2 (en) | 2015-11-11 | 2019-08-06 | International Business Machines Corporation | Decision-tree based address-station matching |
CN110275940A (zh) * | 2019-06-11 | 2019-09-24 | 北京贝壳时代网络科技有限公司 | 一种中文地址识别方法及设备 |
CN110399448A (zh) * | 2019-07-31 | 2019-11-01 | 浪潮软件集团有限公司 | 中文地名地址搜索匹配方法、终端、计算机可读存储介质 |
CN110609880A (zh) * | 2018-06-15 | 2019-12-24 | 北京搜狗科技发展有限公司 | 一种信息查询方法、装置及电子设备 |
CN111325235A (zh) * | 2020-01-19 | 2020-06-23 | 南京师范大学 | 面向多语种的通用地名语义相似度计算方法及其应用 |
CN111950280A (zh) * | 2020-05-27 | 2020-11-17 | 西交利物浦大学 | 地址匹配方法及装置 |
CN112529484A (zh) * | 2019-09-17 | 2021-03-19 | 北京京东振世信息技术有限公司 | 站点匹配方法及系统 |
CN113518132A (zh) * | 2021-05-18 | 2021-10-19 | 北京天融信网络安全技术有限公司 | 网络地址的类别识别方法、装置、设备及存储介质 |
CN115146187A (zh) * | 2022-09-01 | 2022-10-04 | 闪捷信息科技有限公司 | 接口信息处理方法、存储介质和电子设备 |
CN117251554A (zh) * | 2023-11-16 | 2023-12-19 | 中科星图智慧科技安徽有限公司 | 一种非标准地址转标准地址的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101136028A (zh) * | 2006-07-10 | 2008-03-05 | 日电(中国)有限公司 | 基于自然语言的位置查询系统以及基于关键词的位置查询系统 |
CN101350012A (zh) * | 2007-07-18 | 2009-01-21 | 北京灵图软件技术有限公司 | 一种地址匹配的方法和系统 |
CN101882163A (zh) * | 2010-06-30 | 2010-11-10 | 中国科学院地理科学与资源研究所 | 一种基于匹配规则的模糊中文地址地理赋值方法 |
CN102169498A (zh) * | 2011-04-14 | 2011-08-31 | 中国测绘科学研究院 | 一种地址模型的构建方法,以及地址匹配的方法和系统 |
-
2013
- 2013-11-21 CN CN201310596806.7A patent/CN103605752A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101136028A (zh) * | 2006-07-10 | 2008-03-05 | 日电(中国)有限公司 | 基于自然语言的位置查询系统以及基于关键词的位置查询系统 |
CN101350012A (zh) * | 2007-07-18 | 2009-01-21 | 北京灵图软件技术有限公司 | 一种地址匹配的方法和系统 |
CN101882163A (zh) * | 2010-06-30 | 2010-11-10 | 中国科学院地理科学与资源研究所 | 一种基于匹配规则的模糊中文地址地理赋值方法 |
CN102169498A (zh) * | 2011-04-14 | 2011-08-31 | 中国测绘科学研究院 | 一种地址模型的构建方法,以及地址匹配的方法和系统 |
Cited By (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103984735B (zh) * | 2014-05-21 | 2017-02-15 | 北京京东尚科信息技术有限公司 | 一种用于生成推荐配送地点名称的方法和装置 |
CN103984735A (zh) * | 2014-05-21 | 2014-08-13 | 北京京东尚科信息技术有限公司 | 一种用于生成推荐配送地点名称的方法和装置 |
CN104536957A (zh) * | 2014-09-26 | 2015-04-22 | 北京师范大学 | 农用土地流转信息检索方法和系统 |
CN104536957B (zh) * | 2014-09-26 | 2017-11-24 | 北京师范大学 | 农用土地流转信息检索方法和系统 |
CN105574019A (zh) * | 2014-10-14 | 2016-05-11 | 高德软件有限公司 | 一种查询参数处理方法及装置 |
CN104391881A (zh) * | 2014-10-30 | 2015-03-04 | 杭州安恒信息技术有限公司 | 一种基于分词算法的日志解析方法及系统 |
CN104391881B (zh) * | 2014-10-30 | 2017-06-27 | 杭州安恒信息技术有限公司 | 一种基于分词算法的日志解析方法及系统 |
CN104657486A (zh) * | 2015-03-02 | 2015-05-27 | 武汉工程大学 | 一种基于多因子的行政区划的可信度计算的方法 |
CN104657486B (zh) * | 2015-03-02 | 2018-01-19 | 武汉工程大学 | 一种基于多因子的行政区划的可信度计算的方法 |
CN105426351B (zh) * | 2015-11-11 | 2019-01-25 | 中国建设银行股份有限公司 | 一种客户地址信息的分词处理方法和系统 |
CN105426351A (zh) * | 2015-11-11 | 2016-03-23 | 中国建设银行股份有限公司 | 一种客户地址信息的分词处理方法和系统 |
US10373103B2 (en) | 2015-11-11 | 2019-08-06 | International Business Machines Corporation | Decision-tree based address-station matching |
CN106970903A (zh) * | 2016-01-13 | 2017-07-21 | 阿里巴巴集团控股有限公司 | 物流系统中地址信息的处理方法及装置 |
CN106970903B (zh) * | 2016-01-13 | 2020-08-04 | 菜鸟智能物流控股有限公司 | 物流系统中地址信息的处理方法及装置 |
CN105786800A (zh) * | 2016-03-23 | 2016-07-20 | 苏州数字地图信息科技股份有限公司 | 一种警用标准地址获取方法及系统 |
CN106503150A (zh) * | 2016-10-21 | 2017-03-15 | 天津海量信息技术股份有限公司 | 中文地名行政区划归属识别方法 |
CN106709065B (zh) * | 2017-01-19 | 2020-08-04 | 国家电网公司 | 一种地址信息标准化处理方法及装置 |
CN106709065A (zh) * | 2017-01-19 | 2017-05-24 | 国家电网公司 | 一种地址信息标准化处理方法及装置 |
CN107016084A (zh) * | 2017-03-31 | 2017-08-04 | 江苏速度信息科技股份有限公司 | 一种地名地址快速定位与查询的方法 |
CN109145095A (zh) * | 2017-06-16 | 2019-01-04 | 贵州小爱机器人科技有限公司 | 地名信息匹配方法、信息匹配方法、装置及计算机设备 |
CN109145095B (zh) * | 2017-06-16 | 2024-03-29 | 贵州小爱机器人科技有限公司 | 地名信息匹配方法、信息匹配方法、装置及计算机设备 |
CN108062365B (zh) * | 2017-12-06 | 2021-01-26 | 吉旗(成都)科技有限公司 | 一种提高地址解析准确度的方法 |
CN108062365A (zh) * | 2017-12-06 | 2018-05-22 | 吉旗(成都)科技有限公司 | 一种提高地址解析准确度的方法 |
CN108563631A (zh) * | 2018-03-23 | 2018-09-21 | 江苏速度信息科技股份有限公司 | 一种自然语言地址描述的自动识别方法 |
CN110609880A (zh) * | 2018-06-15 | 2019-12-24 | 北京搜狗科技发展有限公司 | 一种信息查询方法、装置及电子设备 |
CN109033222A (zh) * | 2018-06-29 | 2018-12-18 | 北京奇虎科技有限公司 | 兴趣点poi与检索关键字的相关性分析方法和装置 |
CN109344263A (zh) * | 2018-08-01 | 2019-02-15 | 昆明理工大学 | 一种地址匹配方法 |
CN109344263B (zh) * | 2018-08-01 | 2022-07-19 | 昆明理工大学 | 一种地址匹配方法 |
CN109359200A (zh) * | 2018-10-11 | 2019-02-19 | 北京国信达数据技术有限公司 | 地名地址数据智能解析系统 |
CN109815268A (zh) * | 2018-12-21 | 2019-05-28 | 上海诺悦智能科技有限公司 | 一种交易制裁名单匹配系统 |
CN110275940A (zh) * | 2019-06-11 | 2019-09-24 | 北京贝壳时代网络科技有限公司 | 一种中文地址识别方法及设备 |
CN110399448B (zh) * | 2019-07-31 | 2023-06-09 | 浪潮软件集团有限公司 | 中文地名地址搜索匹配方法、终端、计算机可读存储介质 |
CN110399448A (zh) * | 2019-07-31 | 2019-11-01 | 浪潮软件集团有限公司 | 中文地名地址搜索匹配方法、终端、计算机可读存储介质 |
CN112529484A (zh) * | 2019-09-17 | 2021-03-19 | 北京京东振世信息技术有限公司 | 站点匹配方法及系统 |
CN111325235B (zh) * | 2020-01-19 | 2023-04-25 | 南京师范大学 | 面向多语种的通用地名语义相似度计算方法及其应用 |
CN111325235A (zh) * | 2020-01-19 | 2020-06-23 | 南京师范大学 | 面向多语种的通用地名语义相似度计算方法及其应用 |
CN111950280A (zh) * | 2020-05-27 | 2020-11-17 | 西交利物浦大学 | 地址匹配方法及装置 |
CN113518132A (zh) * | 2021-05-18 | 2021-10-19 | 北京天融信网络安全技术有限公司 | 网络地址的类别识别方法、装置、设备及存储介质 |
CN113518132B (zh) * | 2021-05-18 | 2023-03-24 | 北京天融信网络安全技术有限公司 | 网络地址的类别识别方法、装置、设备及存储介质 |
CN115146187A (zh) * | 2022-09-01 | 2022-10-04 | 闪捷信息科技有限公司 | 接口信息处理方法、存储介质和电子设备 |
CN115146187B (zh) * | 2022-09-01 | 2022-11-18 | 闪捷信息科技有限公司 | 接口信息处理方法、存储介质和电子设备 |
CN117251554A (zh) * | 2023-11-16 | 2023-12-19 | 中科星图智慧科技安徽有限公司 | 一种非标准地址转标准地址的方法 |
CN117251554B (zh) * | 2023-11-16 | 2024-02-20 | 中科星图智慧科技安徽有限公司 | 一种非标准地址转标准地址的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103605752A (zh) | 一种基于语义识别的地址匹配方法 | |
CN109145169B (zh) | 一种基于统计分词的地址匹配方法 | |
CN102395965B (zh) | 用于在数据库中搜索对象的方法 | |
CN109800284A (zh) | 一种面向任务的非结构化信息智能问答系统构建方法 | |
Sarawagi et al. | Open-domain quantity queries on web tables: annotation, response, and consensus models | |
US20090037403A1 (en) | Generalized location identification | |
CN102456016B (zh) | 一种对搜索结果进行排序的方法及装置 | |
CN107203526B (zh) | 一种查询串语义需求分析方法及装置 | |
CN109359200A (zh) | 地名地址数据智能解析系统 | |
CN104375992A (zh) | 一种地址匹配的方法和装置 | |
CN101350013A (zh) | 一种地理信息的搜索方法和系统 | |
CN105209858B (zh) | 企业场所数据的非确定性消岐和匹配 | |
CN112612863B (zh) | 一种基于中文分词器的地址匹配方法及系统 | |
CN103714092A (zh) | 一种地理位置的搜索方法和装置 | |
CN109933797A (zh) | 基于Jieba分词及地址词库的地理编码方法和系统 | |
CN102693266A (zh) | 搜索数据库的方法、生成索引结构的导航设备和方法 | |
CN103412925A (zh) | 一种结构化数据和非结构化数据综合检索的系统及方法 | |
CN107766433A (zh) | 一种基于Geo‑BTree的范围查询方法及装置 | |
CN106611053A (zh) | 一种数据清理、索引方法 | |
CN107908627A (zh) | 一种多语言的地图poi 搜索系统 | |
WO2009132155A2 (en) | Discovering co-located queries in geographic search logs | |
CN116414823A (zh) | 一种基于分词模型的地址定位方法和装置 | |
CN102385597B (zh) | 一种poi的容错搜索方法 | |
CN106155998A (zh) | 一种数据处理方法及装置 | |
CN107577744A (zh) | 非标地址自动匹配模型、匹配方法以及模型建立方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140226 |