CN104657486A - 一种基于多因子的行政区划的可信度计算的方法 - Google Patents

一种基于多因子的行政区划的可信度计算的方法 Download PDF

Info

Publication number
CN104657486A
CN104657486A CN201510093347.XA CN201510093347A CN104657486A CN 104657486 A CN104657486 A CN 104657486A CN 201510093347 A CN201510093347 A CN 201510093347A CN 104657486 A CN104657486 A CN 104657486A
Authority
CN
China
Prior art keywords
administrative division
character string
factor
zoning
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510093347.XA
Other languages
English (en)
Other versions
CN104657486B (zh
Inventor
李晓林
魏运运
张彦铎
卢涛
段艳会
张玉敏
黄爽
万永静
杨威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Institute of Technology
Original Assignee
Wuhan Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Institute of Technology filed Critical Wuhan Institute of Technology
Priority to CN201510093347.XA priority Critical patent/CN104657486B/zh
Publication of CN104657486A publication Critical patent/CN104657486A/zh
Application granted granted Critical
Publication of CN104657486B publication Critical patent/CN104657486B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于多因子的行政区划的可信度计算的方法,对一个待查询地址字符串,计算位置查询因子;根据该待查询地址字符串所有可能的行政区划结果集,计算区划位置级差因子、区划相关因子和区划级差相关因子;根据区划级差相关因子,获得某行政区划字符串与所有其它行政区划字符串之间的区划级差相关因子的和,乘以该行政区划字符串的位置查询因子,即为该行政区划字符串的可信度,取最大可信度对应的行政区划字符串所在的行政区划结果。利用对待查询地址字符串的分词结果及所有可能的行政区划结果集,根据地址数据表达的语义特点,通过适当的匹配算法提高地址检索的速度和准确性,从而提高网络地图在线服务质量,从而为用户更好的定位。

Description

一种基于多因子的行政区划的可信度计算的方法
技术领域
本发明涉及中文地址的规范化,具体涉及一种基于多因子的行政区划的可信度计算的方法。
背景技术
科技的不断发展,人们对生活中各个方面的需求不断提升,服务化社会成为未来发展的趋势。作为服务化中的一种形式,当今地理信息位置服务是通过国家地理信息普查、实地勘察等方式获取数据建立一个标准的中文地址库,然后通过匹配进行信息返回。然而,这种形式存在随着社会的不断发展居民区、道路等因素的不断变化,为标准参考数据集的建立带来障碍。面对这个问题,将互联网看成信息量大,并且不断更新的大型数据库。
互联网的不断发展,网络上正误交织的地理文本信息与日俱增,如何从这些纷繁复杂的信息中,辨别出相对于用户需要的信任度比较高的信息,构建一个正确性相对比较高的地理信息库,在当今地理信息位置服务方面变得十分必要,一个基于多因子计算区划的可信度的方法随着用户的需要而产生。
传统的方法通常采用基于关键词的精确或模糊匹配方法,这对于大规模或大范围的地名地址数据,不仅查找的速度慢,很难满足网络地图在线快速服务的需要,也没有顾及地址的语义信息,导致查找的准确性较低,查找结果多样且往往不是用户所需要的结果。例如,当用户在互联网上查找“湖北武汉洪山江苏省鼓楼区”时,期望的结果应该是返回“湖北省武汉市洪山区”,但是普通的方法可能会返回“江苏省鼓楼区”、“福建省鼓楼区”。
发明内容
针对上述现有技术中的不足,本发明的目的在于提供一种基于多因子的行政区划的可信度计算的方法,通过移动窗口最大匹配算法,并顾及地址的语义建立用于地址匹配的语义库或知识库,然后根据地址数据表达的语义特点,通过适当的匹配算法提高地址检索的速度和准确性。
本发明为达到上述目的所采取的技术方案为:一种基于多因子计算行政区划的可信度的方法,其特征在于:它包括以下步骤:
S1、对一个待查询地址字符串,计算位置查询因子:
根据行政区划表,对待查询地址字符串进行分词,得到若干个行政区划字符串,每个行政区划字符串根据其获得方式预设一个系数;计算每个行政区划字符串在待查询地址字符串中的位置,从左到右依次按数字从小到大排序,该数字即为该行政区划字符串对应的位置值,计算所有行政区划字符串的位置值的和;
将位置值除以所有行政区划字符串的位置值的和,得到的结果反序排列,依次作为各行政区划字符串的位置因子;
各行政区划字符串的位置因子乘以其预设的系数,即为位置查询因子;
S2、根据该待查询地址字符串所有可能的行政区划结果集,计算区划位置级差因子、区划相关因子和区划级差相关因子:
行政区划结果集包含若干个行政区划结果,每个行政区划结果由S1中得到的行政区划字符串,以及其父行政区划字符串构成,其中父行政区划字符串包括该行政区划字符串的上一级、直至最高级行政区划字符串;每个行政区划字符串及其父行政区划字符串都有相应的行政区划级别;
以每个行政区划结果中S1中得到的行政区划字符串为待计算对象,两两之间的级别差加1,乘以两两之间的位置值差加1,得到两两之间的区划位置级差因子;
以每个行政区划结果中S1中得到的行政区划字符串为待计算对象,判断两两之间是否有包含关系,若有则区划相关因子为1,若无则区划相关因子为0;
对应的两两之间的区划位置级差因子与区划相关因子的乘积,即为两两之间的区划级差相关因子;
S3、根据两两之间的区划级差相关因子,获得某行政区划字符串与所有其它行政区划字符串之间的区划级差相关因子的和,乘以该行政区划字符串的位置查询因子,即为该行政区划字符串的可信度,取最大可信度对应的行政区划字符串所在的行政区划结果。
本发明的有益效果为:利用已知的或由其它方法获得的对待查询地址字符串的分词结果及所有可能的行政区划结果集,顾及地址的语义建立用于地址匹配的语义库或知识库,然后根据地址数据表达的语义特点,通过适当的匹配算法提高地址检索的速度和准确性;该方法能够有效提高地址数据查找的准确性,从而提高网络地图在线服务质量,从而为用户更好的定位。
具体实施方式
下面结合具体实例对本发明作进一步说明。
本发明提供一种基于多因子的行政区划的可信度计算的方法,包括以下步骤:
S1、对一个待查询地址字符串,计算位置查询因子:
根据行政区划表,对待查询地址字符串进行分词,得到若干个行政区划字符串,每个行政区划字符串根据其获得方式预设一个系数;计算每个行政区划字符串在待查询地址字符串中的位置,从左到右依次按数字从小到大排序,该数字即为该行政区划字符串对应的位置值,计算所有行政区划字符串的位置值的和;
将位置值除以所有行政区划字符串的位置值的和,得到的结果反序排列,依次作为各行政区划字符串的位置因子;
各行政区划字符串的位置因子乘以其预设的系数,即为位置查询因子。
设总行政区划字符串个数为n,第i个行政区划字符串对应的位置值为pos(i),所有行政区划字符串的位置值的和第i个行政区划字符串的位置因子FP(i)=pos(n-i+1)/sum,第i个行政区划字符串的位置查询因子FPM(i)=mode(i)pos(n-i+1)/sum,其中mode(i)为第i个行政区划字符串的系数,为浮点型数据。
S2、根据该待查询地址字符串所有可能的行政区划结果集,计算区划位置级差因子、区划相关因子和区划级差相关因子:
行政区划结果集包含若干个行政区划结果,每个行政区划结果由S1中得到的行政区划字符串,以及其父行政区划字符串构成,其中父行政区划字符串包括该行政区划字符串的上一级、直至最高级行政区划字符串;每个行政区划字符串及其父行政区划字符串都有相应的行政区划级别;
以每个行政区划结果中S1中得到的行政区划字符串为待计算对象,两两之间的级别差加1,乘以两两之间的位置值差加1,得到两两之间的区划位置级差因子;
以每个行政区划结果中S1中得到的行政区划字符串为待计算对象,判断两两之间是否有包含关系,若有则区划相关因子为1,若无则区划相关因子为0;
对应的两两之间的区划位置级差因子与区划相关因子的乘积,即为两两之间的区划级差相关因子。
设行政区划结果集中一共有m个行政区划结果,那么必然有m≥n,level(k)为第k个行政区划结果中的S1中得到的行政区划字符串的级别,level(j)为第j个行政区划结果中的S1中得到的行政区划字符串的级别,pos(k)为第k个行政区划结果中的S1中得到的行政区划字符串的位置值,pos(j)为第j个行政区划结果中的S1中得到的行政区划字符串的位置值。
那么,第k个行政区划结果中的S1中得到的行政区划字符串与第j个行政区划结果中的S1中得到的行政区划字符串之间的区划位置级差因子FPL(k,j)=(1+level(k)-level(j))×(1+pos(k)-pos(j))。
第k个行政区划结果中的S1中得到的行政区划字符串与第j个行政区划结果中的S1中得到的行政区划字符串之间的区划级差相关因子FPLR(k,j)=FPL(k,j)×FR(k,j),其中FR(k,j)为区划相关因子。
S3、根据两两之间的区划级差相关因子,获得某行政区划字符串与所有其它行政区划字符串之间的区划级差相关因子的和,乘以该行政区划字符串的位置查询因子,即为该行政区划字符串的可信度,取最大可信度对应的行政区划字符串所在的行政区划结果。
若第k个行政区划结果中的S1中得到的行政区划字符串为第i个行政区划字符串,那么该行政区划字符串的可信度 reliability ( i ) = FPM ( i ) × Σ j = 1 m FPLR ( k , j ) .
上述对待查询地址字符串进行分词,以及该待查询地址字符串所有可能的行政区划结果集,为已知的或由其它方法获得。本实施例采用一种基于滑动窗口最大匹配算法的地址匹配方法获得。一种基于滑动窗口最大匹配算法的地址匹配方法,对于以自然语言形式表示的地址信息,建立用于地址匹配的语义库或知识库,然后根据地址数据表达的语义特点,建立地址的匹配规则,通过适当的匹配算法计算出所有可能的行政区划。具体包括以下步骤:
S1、建立行政区划表:
行政区划表中包含行政区划信息,每个行政区划信息包含以下字段:序号、行政区划名称、行政区划级别,三者一一对应;
S2、对行政区划表建立匹配查询关系:
根据行政区划级别之间的隶属关系对行政区划信息建立关联性;
匹配查询:在给定一个查询字符串时,根据上述关联性输出对应的行政区划结果集,行政区划结果集包含与该行政区划匹配父行政区划,直到最高行政区划级别;
S3、设置滑动窗口,进行匹配查询:
3.1、读入待匹配地址字符串,设置滑动窗口的起始位置为待匹配地址字符串的第一位,截止位置为待匹配地址字符串的最后一位,取滑动窗口中的字符组成查询字符串,进行匹配查询;若匹配成功,则输出对应的行政区划结果集;若匹配不成功,则进行下一步;
3.2、滑动窗口的起始位置不变,将滑动窗口的截止位置向前移一位,取滑动窗口中的字符组成查询字符串,进行匹配查询;若匹配成功,则输出对应的行政区划结果集,将滑动窗口的起始位置设置为剩余字符串的开始,截止位置设置为剩余字符串的最后一位,继续进行匹配查询,直至截止位置减去起始位置的值小于2,进行下一步;若匹配不成功,则返回本步骤开始,继续进行匹配查询;
3.3、将滑动窗口的起始位置向后移一位,截止位置为待匹配地址字符串的最后一位,取滑动窗口中的字符组成查询字符串,进行匹配查询;若匹配成功,则输出对应的行政区划结果集;若匹配不成功,则返回本步骤开始,继续进行匹配查询,直至截止位置减去起始位置的值小于2,结束匹配查询。
输入的待匹配地址字符串有可能缺少行政区划特征词(例如省、地区、县、市、区、自治州等),为了更好的进行匹配查询,优选的,所述的匹配查询包括完全匹配查询和部分匹配查询,若查询字符串包含行政区划特征词则进行完全匹配查询,否则进行部分匹配查询;
完全匹配查询:在给定一个包含行政区划特征词的查询字符串时,根据上述关联性输出对应的行政区划结果集,行政区划结果集包含与该行政区划匹配父行政区划,直到最高行政区划级别;
部分匹配查询:在给定一个不含行政区划特征词的查询字符串时,根据上述关联性输出对应的行政区划结果集,行政区划结果集包含与该行政区划匹配的父行政区划,直到最高行政区划级别;
其中行政区划隶属于与该行政区划匹配的父行政区划;行政区划结果集包含所有可能的行政区划的集合。
这里选取中文地址“中山东港新区金广东海岸滨城国际俱乐部”对本发明的具体实施过程进行说明。
首先对该地址进行分析,其中该地址存在一下几方面的问题:1)该地址的行政区划部分是不完整的,并且行政区划是没有规律的;2)该地址不是按照省、地市、县的规则形成的,无法按照一般的分词算法匹配出正确的行政区划;3)地址中存在要素残缺,没有邮政编码和电话区号,无法推测出完整的地址。由此可见,该地址存在语义残缺与地址要素残缺等地址中常见的模糊问题,很具有代表性。下面就以上述地址为例,详细说明本发明的具体实施过程。
取整个待匹配地址字符串“中山东港新区金广东海岸滨城国际俱乐部”,设置滑动窗口的起始位置为“中”,截止位置为“部”,对行政区划表进行匹配,此时匹配失败,则修改窗口的截止位置,截止位置向前移动一位字符,即“乐”;然后取窗口中的字符串组成查询字符串去匹配行政区划,此时仍然匹配失败,继续修改窗口的截止位置,直到截止位置减去起始位置的值小于2,此时字符串“中山”可以进行部分查询匹配,返回的行政区划结果为“广东省,中山市”。
把剩余字符串“东港新区金广东海岸滨城国际俱乐部”按照上述步骤继续进行匹配,能够进行匹配的字符串为“东港”,此时返回的行政区划结果为“辽宁省,丹东市,东港市”、“山东省,日照市,东港区”。
继续将剩余字符串进行匹配,最后得到所有可能的行政区划结果集为“广东省,中山市”、“辽宁省,大连市,中山区”、“广东省”、“山东省,滨州市,滨城区”。
根据最终匹配的结果,用移动窗口最大匹配算法对中文地址“中山东港新区金广东海岸滨城国际俱乐部”进行匹配,得出所有可能的行政区划结果集为:a)广东省,中山市;b)辽宁省,大连市,中山区;c)辽宁省,丹东市,东港市;d)山东省,日照市,东港区;e)广东省;f)山东省,滨州市,滨城区。
利用上述方法,能够在将待匹配地址字符串分词的同时,获得所有可能的行政区划结果集,有效减少数据库的查询访问次数,加快匹配速度。
本发明方法正是基于上述方法得到的所有可能的行政区划结果集,判断出哪个更可信。
S1,根据对待查询地址字符串“中山东港新区金广东海岸滨城国际俱乐部”进行分词,得到行政区划字符串“中山”、“东港”、“广东”、“滨城”,计算每个行政区划字符串在待查询地址字符串中的位置、位置值的和、位置因子和位置查询因子。得到的结果如表1所示。
表1匹配字符串位置
字符串 中山 东港 广东 滨城
位置值 1 2 4 6
位置因子 0.4615 0.3077 0.1538 0.0769
系数 0.8000 0.8000 0.8000 0.8000
位置查询因子 0.2667 0.2133 0.1600 0.1333
其中,系数根据滑动窗口算法获得该分词的方式设定,例如完全匹配得到的系数为1,部分匹配得到的系数为0.8。
S2、根据该待查询地址字符串所有可能的行政区划结果集,计算区划相关因子(FactorRelation,FR),区划位置级差因子(FactorPositionLevel,FPL),区划级差相关因子(FactorPositionLevelRelation,FPLR)。
其中,“a)广东省,中山市”是以“中山”为待计算对象,级别为2,位置值为1,“广东省”为父行政区划字符串;“b)辽宁省,大连市,中山区”是以“中山”为待计算对象,级别为3,位置值为1,“辽宁省”、“大连市”均为父行政区划字符串;“c)辽宁省,丹东市,东港市”是以“东港”为待计算对象,级别为3,位置值为2,“辽宁省”、“丹东市”均为父行政区划字符串;“d)山东省,日照市,东港区”是以“东港”为待计算对象,级别为3,位置值为2,“山东省”、“日照市”均为父行政区划字符串;“e)广东省”是以“广东”为待计算对象,级别为1,位置值为4,无父行政区划字符串;“f)山东省,滨州市,滨城区”以“滨城”为待计算对象,级别为3,位置值为6,“山东省”、“滨州市”均为父行政区划字符串。得到的结果如表2、表3、表4所示。
表2区划相关因子
行政区划 D1 D2 D3 D4 D5 D6
广东省,中山市 D1 1 0 0 0 1 0
辽宁省,大连市,中山区 D2 0 1 0 0 0 0
辽宁省,丹东市,东港市 D3 0 0 1 0 0 0
山东省,日照市,东港区 D4 0 0 0 1 0 0
广东省 D5 1 0 0 0 1 0
山东省,滨州市,滨城区 D6 0 0 0 0 0 1
表3区划位置级差因子
行政区划 D1 D2 D3 D4 D5 D6
广东省,中山市 D1 1 0 0 0 -4 0
辽宁省,大连市,中山区 D2 2 1 0 0 -6 -4
辽宁省,丹东市,东港市 D3 4 2 1 1 -3 -3
山东省,日照市,东港区 D4 4 2 1 1 -3 -3
广东省 D5 0 -4 -3 -3 1 1
山东省,滨州市,滨城区 D6 12 6 5 5 9 1
表4区划级差相关因子
行政区划 D1 D2 D3 D4 D5 D6
广东省,中山市 D1 1 0 0 0 -4 0
辽宁省,大连市,中山区 D2 0 1 0 0 0 0
辽宁省,丹东市,东港市 D3 0 0 1 0 0 0
山东省,日照市,东港区 D4 0 0 0 1 0 0
广东省 D5 0 0 0 0 1 0
山东省,滨州市,滨城区 D6 0 0 0 0 0 1
S3、根据两两之间的区划级差相关因子,获得某行政区划字符串与所有其它行政区划字符串之间的区划级差相关因子的和,乘以该行政区划字符串的位置查询因子,即为该行政区划字符串的可信度,取最大可信度对应的行政区划字符串所在的行政区划结果。得到的结果如表5所示。
表5可信度
行政区划 归一化 可信度
广东省,中山市 D1 -0.5143 -1.1077
辽宁省,大连市,中山区 D2 0.1714 0.3692
辽宁省,丹东市,东港市 D3 0.1143 0.2462
山东省,日照市,东港区 D4 0.1143 0.2462
广东省 D5 0.0571 0.1231
山东省,滨州市,滨城区 D6 0.0286 0.0615
其中归一化的值=可信度/可信度的绝对值求和值。
根据最终计算的结果,采用本发明方法,取可信度最大所对应的行政区划为“辽宁省,大连市,中山区”,此时则可以更好的进行定位。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。所以,凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。

Claims (1)

1.一种基于多因子的行政区划的可信度计算的方法,其特征在于:它包括以下步骤:
S1、对一个待查询地址字符串,计算位置查询因子:
根据行政区划表,对待查询地址字符串进行分词,得到若干个行政区划字符串,每个行政区划字符串根据其获得方式预设一个系数;计算每个行政区划字符串在待查询地址字符串中的位置,从左到右依次按数字从小到大排序,该数字即为该行政区划字符串对应的位置值,计算所有行政区划字符串的位置值的和;
将位置值除以所有行政区划字符串的位置值的和,得到的结果反序排列,依次作为各行政区划字符串的位置因子;
各行政区划字符串的位置因子乘以其预设的系数,即为位置查询因子;
S2、根据该待查询地址字符串所有可能的行政区划结果集,计算区划位置级差因子、区划相关因子和区划级差相关因子:
行政区划结果集包含若干个行政区划结果,每个行政区划结果由S1中得到的行政区划字符串,以及其父行政区划字符串构成,其中父行政区划字符串包括该行政区划字符串的上一级、直至最高级行政区划字符串;每个行政区划字符串及其父行政区划字符串都有相应的行政区划级别;
以每个行政区划结果中S1中得到的行政区划字符串为待计算对象,两两之间的级别差加1,乘以两两之间的位置值差加1,得到两两之间的区划位置级差因子;
以每个行政区划结果中S1中得到的行政区划字符串为待计算对象,判断两两之间是否有包含关系,若有则区划相关因子为1,若无则区划相关因子为0;
对应的两两之间的区划位置级差因子与区划相关因子的乘积,即为两两之间的区划级差相关因子;
S3、根据两两之间的区划级差相关因子,获得某行政区划字符串与所有其它行政区划字符串之间的区划级差相关因子的和,乘以该行政区划字符串的位置查询因子,即为该行政区划字符串的可信度,取最大可信度对应的行政区划字符串所在的行政区划结果。
CN201510093347.XA 2015-03-02 2015-03-02 一种基于多因子的行政区划的可信度计算的方法 Expired - Fee Related CN104657486B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510093347.XA CN104657486B (zh) 2015-03-02 2015-03-02 一种基于多因子的行政区划的可信度计算的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510093347.XA CN104657486B (zh) 2015-03-02 2015-03-02 一种基于多因子的行政区划的可信度计算的方法

Publications (2)

Publication Number Publication Date
CN104657486A true CN104657486A (zh) 2015-05-27
CN104657486B CN104657486B (zh) 2018-01-19

Family

ID=53248613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510093347.XA Expired - Fee Related CN104657486B (zh) 2015-03-02 2015-03-02 一种基于多因子的行政区划的可信度计算的方法

Country Status (1)

Country Link
CN (1) CN104657486B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677700A (zh) * 2015-12-23 2016-06-15 武汉工程大学 一种基于集合运算的中文地址行政区划解析方法
CN108038090A (zh) * 2017-12-26 2018-05-15 北京明朝万达科技股份有限公司 一种文本地址的处理方法和装置
CN109359174A (zh) * 2018-09-03 2019-02-19 杭州数梦工场科技有限公司 行政区划归属识别方法、装置、存储介质及计算机设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127050A (zh) * 2007-07-03 2008-02-20 北京大学 一种从网页中自动提取网站拥有者行政属地信息的方法
US7376636B1 (en) * 2002-06-07 2008-05-20 Oracle International Corporation Geocoding using a relational database
CN101882163A (zh) * 2010-06-30 2010-11-10 中国科学院地理科学与资源研究所 一种基于匹配规则的模糊中文地址地理赋值方法
CN102314645A (zh) * 2011-09-26 2012-01-11 深圳市络道科技有限公司 一种地址匹配方法及匹配系统
CN103605752A (zh) * 2013-11-21 2014-02-26 武大吉奥信息技术有限公司 一种基于语义识别的地址匹配方法
CN103914544A (zh) * 2014-04-03 2014-07-09 浙江大学 一种基于地址特征词的多层次快速中文地址匹配方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7376636B1 (en) * 2002-06-07 2008-05-20 Oracle International Corporation Geocoding using a relational database
CN101127050A (zh) * 2007-07-03 2008-02-20 北京大学 一种从网页中自动提取网站拥有者行政属地信息的方法
CN101882163A (zh) * 2010-06-30 2010-11-10 中国科学院地理科学与资源研究所 一种基于匹配规则的模糊中文地址地理赋值方法
CN102314645A (zh) * 2011-09-26 2012-01-11 深圳市络道科技有限公司 一种地址匹配方法及匹配系统
CN103605752A (zh) * 2013-11-21 2014-02-26 武大吉奥信息技术有限公司 一种基于语义识别的地址匹配方法
CN103914544A (zh) * 2014-04-03 2014-07-09 浙江大学 一种基于地址特征词的多层次快速中文地址匹配方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677700A (zh) * 2015-12-23 2016-06-15 武汉工程大学 一种基于集合运算的中文地址行政区划解析方法
CN105677700B (zh) * 2015-12-23 2018-12-14 武汉工程大学 一种基于集合运算的中文地址行政区划解析方法
CN108038090A (zh) * 2017-12-26 2018-05-15 北京明朝万达科技股份有限公司 一种文本地址的处理方法和装置
CN109359174A (zh) * 2018-09-03 2019-02-19 杭州数梦工场科技有限公司 行政区划归属识别方法、装置、存储介质及计算机设备
CN109359174B (zh) * 2018-09-03 2019-08-20 杭州数梦工场科技有限公司 行政区划归属识别方法、装置、存储介质及计算机设备

Also Published As

Publication number Publication date
CN104657486B (zh) 2018-01-19

Similar Documents

Publication Publication Date Title
CN104572645B (zh) 兴趣点数据关联方法及装置
CN103605752A (zh) 一种基于语义识别的地址匹配方法
Zhou et al. Resolving surface forms to wikipedia topics
CN104598611B (zh) 对搜索条目进行排序的方法及系统
CN103778227A (zh) 从检索图像中筛选有用图像的方法
CN103164539B (zh) 一种结合用户评价与标注的交互式图像检索方法
CN106202294B (zh) 基于关键词和主题模型融合的相关新闻计算方法及装置
CN110955806B (zh) 一种针对中文文本的字符串匹配方法
CN103885937A (zh) 基于核心词相似度判断企业中文名称重复的方法
CN104199965A (zh) 一种语义信息检索方法
CN103714092A (zh) 一种地理位置的搜索方法和装置
CN109344263A (zh) 一种地址匹配方法
CN101751455A (zh) 采用人工智能技术自动产生标题的方法
CN109408578A (zh) 一种针对异构环境监测数据融合方法
CN104657486A (zh) 一种基于多因子的行政区划的可信度计算的方法
CN104102667A (zh) 一种poi信息差分方法和装置
CN106021556A (zh) 地址信息处理方法及装置
CN104615782B (zh) 基于滑动窗口最大匹配算法的地址匹配方法
CN106021430A (zh) 基于Lucence自定义词库的全文检索匹配方法及系统
Cheng et al. Quickly locating POIs in large datasets from descriptions based on improved address matching and compact qualitative representations
CN108536825A (zh) 一种识别房源数据是否重复的方法
CN109284362B (zh) 一种内容检索方法及系统
CN101299218A (zh) 三维模型的检索方法和装置
CN116414823A (zh) 一种基于分词模型的地址定位方法和装置
CN101458714A (zh) 一种基于精确测地线的三维模型检索方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Li Xiaolin

Inventor after: Xia Tian

Inventor after: Wei Yunyun

Inventor after: Zhang Yanduo

Inventor after: Lu Tao

Inventor after: Duan Yanhui

Inventor after: Zhang Yumin

Inventor after: Huang Shuang

Inventor after: Wan Yongjing

Inventor after: Yang Wei

Inventor before: Li Xiaolin

Inventor before: Wei Yunyun

Inventor before: Zhang Yanduo

Inventor before: Lu Tao

Inventor before: Duan Yanhui

Inventor before: Zhang Yumin

Inventor before: Huang Shuang

Inventor before: Wan Yongjing

Inventor before: Yang Wei

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180119

Termination date: 20210302

CF01 Termination of patent right due to non-payment of annual fee