CN101206121B - 地名检索装置 - Google Patents
地名检索装置 Download PDFInfo
- Publication number
- CN101206121B CN101206121B CN2007101452491A CN200710145249A CN101206121B CN 101206121 B CN101206121 B CN 101206121B CN 2007101452491 A CN2007101452491 A CN 2007101452491A CN 200710145249 A CN200710145249 A CN 200710145249A CN 101206121 B CN101206121 B CN 101206121B
- Authority
- CN
- China
- Prior art keywords
- unit
- place name
- information
- place
- lemma
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种地名检索装置包括输入单元,用于接收地名名称;地名信息配置单元,用于将与地名有关的信息存入导航电子地图数据库中;分词单元,用于将所述输入单元地名名称进行分词处理以获得若干词元;匹配单元,用于在导航电子地图数据库中找出与所述词元匹配的字段;显示单元,用于显示与所述匹配单元找出的字段相关的信息。由于采用地名信息配置单元,将地名信息存入导航电子地图数据库中,从而能够根据地名进行检索,使得所检索的信息更加丰富。
Description
技术领域
本发明涉及车载导航系统的信息检索领域,尤指一种地名检索装置。
背景技术
现有的车载卫星导航系统普遍都提供了信息的检索查询功能,利用该功能,用户可以方便的在查询界面输入自己想要查询的信息内容,系统会自动查询输出查询结果,以满足用户的需求。现有的一些检索装置主要都是根据兴趣点名称、兴趣点地址等这些指示单一一个地点来进行的,所述兴趣点(Point Of Interest,POI)指用户希望了解或准备到达的地方,也可以称为目的地名称。
对于通常意义上的地名,指国家、省、市、区、县、乡镇、村、街道等具有行政区域范围的地名,还有一些具有代表性的地名(通常也有一定的区域范围),如:西单、王府井等,现有技术却不能够进行检索。然而,通常情况下,用户只知道目的地大概的地理位置,也就是本文中所说的地名,却不能准确说出具体的某个地点名称。对于在不知道具体某个地点名称的情况下,采用现有技术是无法检索出结果的,从而使得现有技术检索的信息有限。
发明内容
本发明要解决的问题是提供一种检索信息丰富的地名检索装置。
为了解决上述问题,本发明地名检索装置包括:
输入单元,用于接收地名名称;
地名信息配置单元,用于将与地名有关的信息存入导航电子地图数据库中;
分词单元,用于将所述输入单元地名名称进行分词处理以获得若干词元;
匹配单元,用于在导航电子地图数据库中找出与所述词元匹配的字段;
显示单元,用于显示与所述匹配单元找出的字段相关的信息。
所述分词单元进一步包括:
查找单元,用于在词库中查找地名名称,所述词库指词元的集合;
第一判断单元,用于判断所述查找单元是否找到所述地名名称;
地名名称处理单元,若从所述第一判断单元接收的信息为“否”,则减小所述地名名称的长度,并将减小长度后地名名称送给所述查找单元;
存放单元,用于存放所述地名名称处理单元截取掉的字符和将查找到的地名名称作为一个词元存储;
第二判断单元,判断所述存放单元中是否还有未分词的部分,若还有则将未分词的部分送给所述查找单元,否则将词元输出。
所述显示单元进一步包括:
排序单元,用于按照匹配度的高低对所述匹配单元检索出的字段进行排序;
相关显示单元,用于按照排序单元所排的顺序显示与所述字段相关的信息。
与现有技术相比,本发明地名检索装置的有益效果为:
由于本发明地名检索装置采用地名信息配置单元,将地名信息存入导航电子地图数据库中,从而能够根据地名进行检索,使得所检索的信息更加丰富。
附图说明
图1是本发明地名检索装置的结构图;
图2是图1中的分词单元的结构图。
具体实施方式
在导航电子地图数据库中存放道路、兴趣点及各种各样的信息。
如图1所示,本发明地名检索装置包括:
输入单元100,用于接收地名名称;
地名信息配置单元104,用于将与地名有关的信息存入导航电子地图数据库中;
分词单元101,用于将所述地名计算单元104得到的地名名称进行分词处理以获得若干词元;
匹配单元102,用于在数据库中找出与所述词元匹配的字段;
显示单元103,用于显示与所述匹配单元102找出的字段相关的信息。
由上述可知地名信息配置单元104从电子地图中将与地名有关的信息都检索出来并存入导航电子地图数据库中,地名信息数据表Placename的结构如表1所示,举例如表2所示:
Index | Name | Description |
1 | ID | 索引号 |
2 | Name | 地名的名称 |
3 | NameSpell | 地名的简拼 |
4 | Pn_type | 地点范围的分类 |
5 | XCoord | POI地图显示坐标-X坐标 |
6 | YCoord | POI地图显示坐标-Y坐标 |
7 | District | 所在的区 |
表1
Index | Name | Content |
1 | ID | 10203200 |
2 | Name | 北京科技大学 |
3 | NameSpell | BJKJDX |
4 | Pn_type | 21 |
5 | XCoord | 418884.363350 |
6 | YCoord | 143965.545002 |
7 | District | 海淀区 |
表2
对于地名信息,统一制成为Placename表的记录,其中Pn_type字段为此地点的分类,各级行政地名有其对应的整备编码,地名信息的分类依据行政区划的级别以及日常生活的习惯制定。如下表3所示:
表3
其中,“整备编码”为Pn_type字段的取值;
“备注”表示整备编码代表的地区范围说明。
由于本文中的地名都具有一定的区域范围,所以所有的地名信息都要有对应的中心点,地名信息的中心点确定原则如下:
一、整备编码为“11”的中心点定位在天安门广场。
二、整备编码为“12、13、14、15”的中心点定位在该行政区划政府所在位置。
三、整备编码为“16”的中心点定位在村委会的位置。
四、整备编码为“21”的中心点定位在该地名区域范围的几何中心位置。
例如,用户进入导航系统的地名信息检索单元,输入“北京”作为查找内容,由于北京在Placename表中的Pn_type字段的值为12,则导航系统会把“北京市人民政府”的地理坐标作为此次地名检索的结果,并将“北京市人民政府”这个poi显示在地图的中心。
如图2所示,所述分词单元101进一步包括:
查找单元1010,用于在词库中查找地名名称,所述词库指词元的集合;
第一判断单元1011,用于判断所述查找单元1010是否找到所述地名名称;
地名名称处理单元1012,若从所述第一判断单元1011接收的信息为“否”则减小所述地名名称的长度并将减小长度后的地名名称送给所述查找单元1010;
存放单元1013,用于存放所述地名名称处理单元1012截取掉的字符和将查找到的地名名称作为一个词元存储;
第二判断单元1014,判断所述存放单元1013中是否还有未分词的部分,若还有则将未分词的部分送给所述查找单元1010,否则将词元输出。
所述显示单元103进一步包括:
排序单元1030,用于按照匹配度的高低对所述匹配单元102检索出的字段进行排序;
相关显示单元1031,用于按照排序单元所排的顺序显示与所述字段相关的信息。
上述中的分词指将连续的字序列按照一定的规范重新组合成词序列的过程。例如:“北京市海淀区学院路33号”,这个中文字符串经过分词处理可获得“北京市”、“海淀区”、“学院路”、“33号”四个分词单元,也称为四个词元,也就是说,将地名名称“北京市海淀区学院路33号”分解成具有四个词元的词序列。在数据库中找出与所述地名名称或者所述词元匹配的字段并将与字段相关的信息(记录)显示出来。这样不仅将与地名名称相匹配的信息检索出来,还将与所述词元相匹配的信息也检索出来了,从而即使用户将地名名称输入不完整,也能够检索出用户所需的信息。
对于词库,传统的词库都是按照词元的汉语拼音字母的顺序进行排序,本系统的词库采用类别和字母顺序相结合的方式进行词元的排序。对于可分类词汇,每个类别内部以及各个类别之间的词元采用汉语拼音字母的顺序进行排序,并且分布在词库中词元列表的前面,减少可分类词汇的检索时间;对于一般词汇,则只按照词元的汉语拼音字母的顺序进行排序,并且分布在可分类词汇的后面。
词库中内容的片断截取如下:
银行14_1 (可分类词汇)
中国工商14_1_1
中国建设14_1_2
中国农业14_1_3
癌23_1 (一般词汇)
癌细胞23_2
癌症23_3
癌肿23_4
矮23_5
矮矮23_6
矮秆作物23_7
类别表主要负责记录各种类别及其索引编号,以供查找。类别表的结构大体与词库相似,但内容要少很多,所以查询类别表花费的时间很少,基本可以忽略。
类别表内容的片断截取如下:
商场10_1
超市10_2
专卖店10_3
如表2所示,词汇分类时采用从大类到小类的方式进行分类,也方便进行词库的管理。根据日常生活的特点,首先确定几个大的类别,为每一个大类确定一个索引前缀,目的是唯一标识此大类,以便添加更小的类别(如:娱乐休闲,索引前缀为11);然后对此大类进行进一步细分,划分出更加详细的小类别,并且在大类索引前缀的后面添加类别编号,完成此小类的索引前缀(如:酒吧,索引前缀为11_2)。
下面为词库内容的举例说明,以“银行”为例,它属于一个小类别,对应的大类为“金融机构”,其索引前缀为“14”,“银行”在大类中的编号是“1”,这样,就可以确定“银行”这一小类别的索引前缀为“14_1”。然后为“银行”这一类别中添加具体内容和索引指针,
例如:
(名称)(指针/指针集合)
银行14_1,14_1_1,14_1_2,14_1_3...
中国工商14_1_1
中国建设14_1_2
中国农业14_1_3
类别名称 | 索引前缀 | 包含内容 | 索引前缀 |
商业机构 | 10 | 商场 超市 专卖店 ...... | 10_1 10_2 10_3 ...... |
娱乐休闲 | 11 | 宾馆 酒吧 KTV ...... | 11_1 11_2 11_3 ...... |
...... | ...... | ...... | ...... |
一般词汇 | 23 | 23 |
表2
表3
现以某公司研制的地名检索装置为例来详述本发明的技术方案。
在本例中,实现查找单元1010的伪代码为:
String key=“地名名称”;
while(词库中的词元内容不为空){
判断词元内容是否等于key,
如果相等则退出循环,否则进行分词处理;
}
实现地名名称处理单元1012的伪代码为:
String key=“地名名称”;
If(没有找到地名名称){
key=原地名名称长度减小1后的结果;
执行1010单元;
}
实现排序单元1030的伪代码为:
int num=用户输入的地名名称经过分词后得到的词元个数;
int[]length=每个词元的字符串长度;
int len=搜索出的每个记录的名字长度;
if(num==1){//分词结果为该词本身
len与length比较。len越大,结果越靠后;
}
else{
num越大,表示该记录包含的词元数量越多,结果应靠前显示。
当num一样时,则比较记录的长度,长度小的靠前显示;
}
实现地名信息配置单元104的伪代码为:
public void addPlaceName(String name,String namespell,String pn_type,String
xcoord,String ycoord,String district)
{
String sql=″insert into Placename(Name,NameSpell,Pn_type,XCoord,
YCoord,District)
values(″′+name+″′,″′+namespell+″′,″′+pn_type+″′,″′+
xcoord+″′,″′+ycoord+″′,″′+district+″′)″;
stmt.executeUpdate(sql);
}
输入单元100接收用户输入的检索词,并将检索词传递到分词单元101;分词单元101对检索词进行分词处理,得到分词结果,并将分词结果传递到匹配单元102;匹配单元102在导航电子地图数据库中的地名数据库表中查找出与此检索词相关的记录,得到结果集合,并将结果集合传递到显示单元1030,而后相关排序单元1031将所检索出的信息显示出来。
例如,用户检索的是“北京昌平区”,输入单元100接收这个检索词,经过分词单元101处理后得到的结果为“北京”,“昌平区”,匹配单元102在地名数据库表中查找与分词结果匹配的记录,得到结果集合,显示单元对结果集合进行排序处理,用户看到的地图界面的中心点为“昌平区人民政府”这个poi点。
综上所述,由于本发明地名检索装置采用地名信息配置单元,将地名信息存入导航电子地图数据库中,从而能够根据地名进行检索,使得所检索的信息更加丰富。
Claims (2)
1.一种地名检索装置,其特征在于,包括:
输入单元,用于接收地名名称;
地名信息配置单元,用于将与地名有关的信息存入导航电子地图数据库中;
分词单元,用于将所述输入单元地名名称进行分词处理以获得若干词元;
匹配单元,用于在导航电子地图数据库中找出与所述词元匹配的字段;
显示单元,用于显示与所述匹配单元找出的字段相关的信息;
所述分词单元进一步包括:
查找单元,用于在词库中查找地名名称,所述词库指词元的集合;
第一判断单元,用于判断所述查找单元是否找到所述地名名称;
地名名称处理单元,若从所述第一判断单元接收的信息为“否”,则减小所述地名名称的长度,并将减小长度后地名名称送给所述查找单元;
存放单元,用于存放所述地名名称处理单元截取掉的字符和将查找到的地名名称作为一个词元存储;
第二判断单元,判断所述存放单元中是否还有未分词的部分,若还有则将未分词的部分送给所述查找单元,否则将词元输出。
2.如权利要求1所述的地名检索装置,其特征在于,所述显示单元进一步包括:
排序单元,用于按照匹配度的高低对所述匹配单元检索出的字段进行排序;
相关显示单元,用于按照排序单元所排的顺序显示与所述字段相关的信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007101452491A CN101206121B (zh) | 2006-09-20 | 2007-08-17 | 地名检索装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200620120954.7 | 2006-09-20 | ||
CN200620120954 | 2006-09-20 | ||
CN2007101452491A CN101206121B (zh) | 2006-09-20 | 2007-08-17 | 地名检索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101206121A CN101206121A (zh) | 2008-06-25 |
CN101206121B true CN101206121B (zh) | 2011-02-09 |
Family
ID=39566496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007101452491A Active CN101206121B (zh) | 2006-09-20 | 2007-08-17 | 地名检索装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101206121B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101957819B (zh) * | 2009-07-21 | 2012-07-18 | 北京大学 | 基于语境的地名检索方法及系统 |
US10001384B2 (en) | 2009-11-12 | 2018-06-19 | Here Global B.V. | Method and apparatus for the retrieval of similar places |
CN102253972B (zh) * | 2011-06-14 | 2013-05-22 | 南京师范大学 | 基于网络爬虫的地名数据库维护方法 |
CN102651013B (zh) * | 2012-03-23 | 2014-04-16 | 上海安捷力信息系统有限公司 | 一种从企业名称数据中提取区域信息的方法及系统 |
CN103970911A (zh) * | 2014-05-28 | 2014-08-06 | 苏州数字地图网络科技有限公司 | 一种基于地名库的智能分词查询方法及系统 |
JP6506004B2 (ja) * | 2014-10-10 | 2019-04-24 | クラリオン株式会社 | 検索システム |
CN104915395B (zh) * | 2015-05-28 | 2018-11-09 | 百度在线网络技术(北京)有限公司 | 一种用于查询主体的关联信息的方法和装置 |
CN106919601B (zh) * | 2015-12-25 | 2021-01-12 | 北京奇虎科技有限公司 | 从查询词中提取兴趣点的方法和装置 |
CN106502995B (zh) * | 2016-11-30 | 2019-10-15 | 福建榕基软件股份有限公司 | 一种层级信息智能识别方法及装置 |
CN108234285A (zh) * | 2017-11-29 | 2018-06-29 | 江苏速度信息科技股份有限公司 | 一种基于微信的地名信息服务系统及方法 |
CN109815307B (zh) * | 2019-02-13 | 2021-07-09 | 北京百度网讯科技有限公司 | 位置确定方法、装置、设备和介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1335574A (zh) * | 2001-09-05 | 2002-02-13 | 罗笑南 | 智能语义搜索方法 |
CN1471024A (zh) * | 2002-07-25 | 2004-01-28 | 摩托罗拉公司 | 中文分词方法 |
-
2007
- 2007-08-17 CN CN2007101452491A patent/CN101206121B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1335574A (zh) * | 2001-09-05 | 2002-02-13 | 罗笑南 | 智能语义搜索方法 |
CN1471024A (zh) * | 2002-07-25 | 2004-01-28 | 摩托罗拉公司 | 中文分词方法 |
Non-Patent Citations (2)
Title |
---|
JP特开2004-279189A 2004.10.07 |
JP特开平11-85763A 1999.03.30 |
Also Published As
Publication number | Publication date |
---|---|
CN101206121A (zh) | 2008-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101206121B (zh) | 地名检索装置 | |
CN100562713C (zh) | 电子导航系统的信息检索方法及装置 | |
CN101169327B (zh) | 信息检索装置 | |
US9235598B2 (en) | Location based full text search | |
CN103605752A (zh) | 一种基于语义识别的地址匹配方法 | |
EP2836928B1 (en) | Full text search using r-trees | |
CN103440311A (zh) | 一种地名实体识别的方法及系统 | |
CN102456055A (zh) | 兴趣点检索的方法及装置 | |
CN102262670A (zh) | 一种基于移动可视设备的跨媒体信息检索系统及方法 | |
CN107908627A (zh) | 一种多语言的地图poi 搜索系统 | |
CN102591984A (zh) | 导航数据中兴趣点数据查询速度的优化方法 | |
CN101493340B (zh) | 一种车辆导航系统中兴趣点信息的快速检索方法 | |
CN101149271B (zh) | 交叉点路口检索装置 | |
CN114780680A (zh) | 基于地名地址数据库的检索与补全方法及系统 | |
CN108984711A (zh) | 一种基于分层嵌入的个性化app推荐方法 | |
EP2783308B1 (en) | Full text search based on interwoven string tokens | |
CN102385597B (zh) | 一种poi的容错搜索方法 | |
CN111325235B (zh) | 面向多语种的通用地名语义相似度计算方法及其应用 | |
CN101206120B (zh) | 广场检索装置 | |
CN101169328B (zh) | 立交桥检索装置 | |
CN114513550A (zh) | 一种地理位置信息的处理方法、装置及电子设备 | |
CN101206122B (zh) | 环岛检索装置 | |
CN113177106A (zh) | 一种基于要素提取的相似判决书检索方法 | |
CN101131326A (zh) | 电子导航系统的信息检索装置 | |
Chuang et al. | Improving the effectiveness of POI search by associated information summarization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200513 Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province Patentee after: Alibaba (China) Co.,Ltd. Address before: 102200, No. 18, Changsheng Road, Changping District science and Technology Park, Beijing, B1 Patentee before: AUTONAVI SOFTWARE Co.,Ltd. |
|
TR01 | Transfer of patent right |