CN101685021B - 一种兴趣点信息获取方法及装置 - Google Patents
一种兴趣点信息获取方法及装置 Download PDFInfo
- Publication number
- CN101685021B CN101685021B CN 200810222961 CN200810222961A CN101685021B CN 101685021 B CN101685021 B CN 101685021B CN 200810222961 CN200810222961 CN 200810222961 CN 200810222961 A CN200810222961 A CN 200810222961A CN 101685021 B CN101685021 B CN 101685021B
- Authority
- CN
- China
- Prior art keywords
- interest
- point
- information
- keyword
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
本发明的实施例提供了一种兴趣点信息获取方法及装置,可解决现有技术中存在无法获取兴趣点信息的问题。所述方法包括:获得兴趣点输入信息;根据所述兴趣点输入信息和词库利用第一模糊查询方法获取兴趣点信息,所述词库包括模糊词库。所述装置包括获得单元和确定单元。这样,输入要检索的中文名称信息时,用户可能出现输入错误,如名称中的某个字错误输入为其同音字或相似字,或者名称中的关键词输入了其别名,但由于使用了模糊词库,也可能能检索到想要的兴趣点信息。从而增加了查询的容错机制,提高了查询POI名称的成功率。
Description
技术领域
本发明涉及地理信息系统领域,尤其涉及一种兴趣点信息获取方法及装置。
背景技术
在导航过程中,首先需要确定POI(point ofinterest,电子地图数据中的兴趣点)数据,然后根据POI数据进行导航。
POI数据是电子地图数据的重要组成部分,提供了包括小区、学校、医院、商场、超市、写字楼、餐厅、宾馆酒店、停车场等众多与人们生活息息相关的设施的属性信息。
由于电子地图数据库中保存的POI数据的数量十分庞大,为实现POI数据的快速查询,现有技术采用了如下技术手段:
判断用户输入的POI名称或POI拼音首字母是否与POI数据记录中的POI名称或POI拼音首字母匹配,若用户输入的POI名称与数据记录中的POI名称匹配,即用户输入的POI名称与POI数据记录中的POI名称相同,则将该POI名称对应的POI数据记录输出。
然而,本申请的发明人发现,由于用户输入错误,比如将中文名称的某个字错误地输入了该字的同音字或者相似字,将会导致在进行名称检索时,在POI数据库中找不到相匹配的记录,无法获得相应的POI名称,进而无法获得相应的兴趣点信息。所述兴趣点信息包括:兴趣点经纬度坐标、兴趣点的详细地址、兴趣点电话和邮编等信息。当兴趣点信息用于导航时,会进而导致无法导航。
发明内容
本发明的实施例提供了一种兴趣点信息获取方法及装置,可解决现有技术中存在无法获取兴趣点信息的问题。
本发明实施例提供了一种兴趣点信息获取方法,包括:
建立包括模糊词库的词库,建立词库具体包括:将兴趣点名称进行切分,以作为查询关键词;将兴趣点名称分割为单字,并找出该单字的同音字和相似字;根据所述查询关键词将所述单字的同音字和相似字组合成模糊关键词;将所述查询关键词及与该关键词对应的模糊关键词与所述兴趣点名称对应起来;
获得兴趣点输入信息;
根据所述兴趣点输入信息和词库利用第一模糊查询方法获取兴趣点信息,所述词库包括模糊词库。
本发明实施例还提供了一种兴趣点信息获取装置,包括:
词库建立单元,用于建立包括模糊词库的词库,具体为:将兴趣点名称进行切分,以作为查询关键词;将兴趣点名称分割为单字,并找出该单字的同音字和相似字;根据所述查询关键词将所述单字的同音字和相似字组合成模糊关键词;将所述查询关键词及与该关键词对应的模糊关键词与所述兴趣点名称对应起来;
获得单元,用于获得兴趣点输入信息;
确定单元,用于根据所述兴趣点输入信息和词库利用第一模糊查询方法获取兴趣点信息,所述词库包括模糊词库。
这样,根据本发明实施例,当输入要检索的兴趣点输入信息时,用户可能出现输入错误,如信息中的某个字错误输入为其同音字或相似字,或者信息中的关键词输入了其别名,但由于使用了模糊词库,也可能能检索到想要的兴趣点名称,进而得到其对应的兴趣点信息。从而增加了查询的容错机制,提高了查询兴趣点信息的成功率。
附图说明
图1示出了本发明实施例一的兴趣点信息获取方法;
图2示出了本发明实施例一的确定词库的方法;
图3示出了本发明实施例二的兴趣点信息获取装置。
具体实施方式
为了便于本领域一般技术人员理解和实现本发明,现结合附图描绘本发明的实施例。
实施例一
本实施例提供了一种兴趣点信息获取方法,如图1所示,包括如下步骤:
兴趣点输入信息可通过输入设备获得。该兴趣点输入信息可以是正确的兴趣点名称,或者部分正确的兴趣点名称,也可以是其它与兴趣点相关的信息,本申请以兴趣点名称为例进行说明。
步骤12、根据兴趣点输入信息和词库利用第一模糊查询方法确定兴趣点信息,所述词库包括模糊词库。
所述第一模糊查询方法具体包括:将兴趣点输入信息进行切分;根据每个切分结果查询模糊词库;根据查询结果确定兴趣点信息,如,根据查询结果的交集获取兴趣点信息。切分方法和模糊词库的内容可参见后面的模糊词库生成过程中相关内容。
为了与传统方法相结合,本步骤可替换为:利用兴趣点输入信息进行查询,当查询失败时,根据所述兴趣点输入信息和词库利用第一模糊查询方法确定兴趣点信息,否则,直接返回结果,并执行步骤13:根据兴趣点信息进行导航。
根据查询结果确定兴趣点信息方法是,先根据查询结果获得兴趣点名称,再根据兴趣点名称获取兴趣点信息。
步骤13、根据兴趣点信息进行导航。所述导航是指,根据兴趣点信息和电子地图进行路线匹配,找到一条最佳路线,然后,根据该最佳路线显示相关信息,以向用户提示预行路线。
在执行步骤12之前,需要首先确定词库。在确定词库之前,首先获得POI中文名称,如表1所示,现假设有如下POI中文名称列表(为了便于描述,只选取了3条记录)。
表1
ID | POI中文名称 |
A00001 | 钟声图书大厦 |
A00002 | 梁新百货大楼 |
A00003 | 西单商场 |
[0031] 可将POI中文名称采用列表方式存储,每条记录表示一个POI中文名称,为了方便存储,采用唯一的POI标识(A标识号)来标识POI中文名称。如图2所示,下面描述建立词库的方法,以便根据词库可查询兴趣点名称,然后根据再根据兴趣点名称获得其它兴趣点信息。
步骤21、将POI中文名称进行中文名称切分,将每个中文名称切分成若干有意义的关键词。
如,对表1中的POI中文名称进行切分,可得到如下关键词:
钟声、图书、大厦、梁新、百货、大楼、西单、商场。
步骤22、建立关键词库,即,将步骤21中的关键词加入关键词库中(关键词库中的关键词不重复),为了方便存储,采用唯一的关键词标识(Key标识号)来标识关键词。关键词库中包括每个关键词的关键词标识,及该关键词对应的POI中文名称的POI标识;
步骤23、制作模糊词库,步骤如下:
(1)制作POI中文名称字库,将POI中文名称列表中的每个汉字放入字库中,字库中的汉字不重复;
如针对表1中POI中文名称制作POI中文名称字库,字库中含有如下汉字:钟、声、图、书、大、厦、梁、新、百、货、楼、西、单、商、场。
(2)查找POI中文名称字库中每个汉字的同音字(声调不同但拼音相同也认作同音字),以建立多音字库,将同音字按照声调进行一级排序,跟该字声调相同的排在前面,然后按照同音字的使用频率进行二次排序,常用字排在前面。如果字数太多,只取常用字。针对表1的例子,多音字库的内容如下:
钟、中、忠、终、衷、种、肿、众、重、仲
声、生、升、省、胜、盛、圣、剩
图、途、涂、屠、突、凸、土、兔
……
场、厂、昌、长、常、尝、唱、畅
(3)制作相似词库,查找POI中文名称字库中每个汉字的相似字,按照相似度进行排序,与该字相似度高的汉字排在前面。如果字数太多,只取常用字。
钟、中、仲
声、卢、户
图、囚、囫、囵、国
……
梁、粱、柒、染
新、斩、靳
场、杨、扬、畅
(4)依次提取关键词库中的每一个关键词,将组成该关键词的每个汉字的同音字、相似字进行组合,得到该关键词的同音词、相似词,如果词条过多,则选取可能性较大的数个(如3~5个)词条加入关键词序列。另外,将该关键词的别名也加入关键词序列。关键词的同音词、相似词、别名即为该关键词的模糊词。
如,以表1为例,可生成如下同音词与相似词,对关键词“钟声”,将“钟”的同音字与“声”的同音字进行组合(本字也参与组合),得到钟声的同音词,如同音词太多,则只取常用的词,如终生、中生、众生。将关键词“梁新”中的“梁”的相似字“粱”、“柒”与“新”的相似字“斩”“靳”分别进行组合(本字也参与组合),得到相似词:粱新、梁斩、粱斩。有些关键词有别名,如“大厦”的别名为“大楼”,“商场”的别名为“购物中心”。每个关键词,加上该关键词的同音词、相似词、别名,就构成一个关键词序列。如关键词“钟声”的关键词序列为:钟声/终生/中生/钟卢,梁新的关键词序列为:梁新/粱新/良心,大厦的关键词序列为:大厦/大夏/大楼。将每个关键词的关键词序列加入模糊词库。
(5)将关键词库中的每一个关键词的关键词序列,加入到模糊词库,并 在该模糊词库中加入与该关键词对应的POI中文名称,以便根据该模糊词查找到POI中文名称。
步骤24、为加快检索速度,在本实施例中,还为模糊词库中的每个关键词序列建立索引,分为两级索引,第一级为以关键字作为主键,第二级以包含该关键词的POI中文名称的ID组成的序列。如关键词序列“钟声/终生/中生/钟卢”其索引为k0001_A00001,其中k0001为以钟声为主键的索引,A00001为POI中文列表中第一条记录的ID。大厦/大夏/大楼的索引为k0005_A00001_A00002,其中k0005为以大厦为主键的索引,A00001和A00002为该关键词序列的ID序列,表示在POI中文列表中,ID为A00001和A00002的记录包含该关键词序列中的模糊词,如“大厦”和“大楼”。
根据上述的模糊词库,假设用户想检索“钟声图书大厦”,但在输入中文名称时错误地输入了“终生图书大楼”。那么在检索时首先对输入的中文名称进行切分,得到“终生”、“图书”、“大楼”,所搜模糊词库,得到这三个关键词的索引为k0001_A00001、k0002_A00001、k0005_A00001_A00002,三个关键词的ID序列分别为A00001、A00001、A00001/A00002,在这三个ID序列中,其公共ID为ID为A00001,在POI中文列表中提取ID为A00001对应的中文名称“钟声图书大厦”,即为用户想检索的POI中文名称。由此可以看出,用户虽然将“钟声”错误地输入为“终生”,将“大厦”输入为“大楼”,但依然能检索到正确的结果。同理,用户输入“粱新百货大楼”也能检索到正确的结果“梁新百货大楼”。从而增加了查询的容错机制,提高了查询兴趣点信息的成功率。当兴趣点信息用于导航时,可减少因查询失败而不能导航的问题。
实施例二
如图3所示,本实施例提供了一种兴趣点信息获取装置30,包括:获得单元31,用于获得兴趣点输入信息;确定单元33,用于根据所述兴趣点输入信息和词库利用第一模糊查询方法确定兴趣点信息,所述词库包括模糊词库;导航单元34,用于根据兴趣点信息进行导航;判断单元32,用于判断利用兴趣点输 入信息查询是否失败,当查询失败时,启动确定单元33,否则,直接返回结果,并启动导航单元34;词库建立单元35,用于建立词库。所述确定单元33具体包括:切分单元331,用于将兴趣点输入信息进行切分;查询单元332,用于根据每个切分结果对词库进行查询;兴趣点信息确定单元333,用于根据查询结果确定兴趣点信息。各个单元的工作原理和方法,可参见实施例一中的描述。
这样,根据本发明实施例,当输入要检索的兴趣点信息(如兴趣点信息)时,通过对中文名称进行切分,得到若干有意义的关键词。在模糊词库中搜索这些关键词,得到每个关键词的ID序列。查找这些ID序列中的公共ID,在POI中文名称列表中公共ID对应的中文名称即为要检索的POI中文名称。在输入要检索的中文名称时,用户可能出现输入错误,如名称中的某个字错误输入为其同音字或相似字,或者名称中的关键词输入了其别名,但由于使用了模糊词库,也可能能检索到想要的中文名称。
值得注意的是,在上面的实施例中,将关键词库和模糊词库是分开的,也可将其合并为一个词库。
本申请的兴趣点信息可推广到一般的位置信息。
虽然通过实施例描绘了本发明,但本领域普通技术人员知道,在不脱离本发明的精神和实质的情况下,就可使本发明有许多变形和变化,本发明的范围由所附的权利要求来限定。
Claims (9)
1.一种兴趣点信息获取方法,其特征在于,包括:
建立包括模糊词库的词库,建立词库具体包括:将兴趣点名称进行切分,以作为查询关键词;将兴趣点名称分割为单字,并找出该单字的同音字和相似字;根据所述查询关键词将所述单字的同音字和相似字组合成模糊关键词;将所述查询关键词及与该关键词对应的模糊关键词与所述兴趣点名称对应起来;
获得兴趣点输入信息;
根据所述兴趣点输入信息和词库利用第一模糊查询方法获取兴趣点信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述兴趣点输入信息和词库利用第一模糊查询方法获取兴趣点信息具体包括:
将兴趣点输入信息进行切分;
根据每个切分结果对词库进行查询;
根据查询结果获取兴趣点信息。
3.根据权利要求2所述的方法,其特征在于,所述根据查询结果获取兴趣点信息具体包括:根据查询结果的交集获取兴趣点信息。
4.根据权利要求1所述的方法,其特征在于,在执行所述根据所述兴趣点输入信息和词库利用第一模糊查询方法获取兴趣点信息步骤之前,还执行利用兴趣点输入信息进行查询,当查询失败时,根据所述兴趣点输入信息和词库利用第一模糊查询方法获取兴趣点信息,否则,直接返回结果。
5.根据权利要求1至4其中之一所述的方法,其特征在于,所述方法进一步包括:
根据所述兴趣点信息进行导航。
6.一种兴趣点信息获取装置,其特征在于,包括:
词库建立单元,用于建立包括模糊词库的词库,具体为:将兴趣点名称进行切分,以作为查询关键词;将兴趣点名称分割为单字,并找出该单字的同音字和相似字;根据所述查询关键词将所述单字的同音字和相似字组合成模糊关键词;将所述查询关键词及与该关键词对应的模糊关键词与所述兴趣点名称对应起来;
获得单元,用于获得兴趣点输入信息;
确定单元,用于根据所述兴趣点输入信息和词库利用第一模糊查询方法获取兴趣点信息。
7.根据权利要求6所述的装置,其特征在于,所述确定单元具体包括:
切分单元,用于将兴趣点输入信息进行切分;
查询单元,用于根据每个切分结果对词库进行查询;
兴趣点信息确定单元,用于根据查询结果确定兴趣点信息。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
判断单元,用于判断利用兴趣点输入信息查询是否失败,当查询失败时,启动确定单元,否则,直接返回结果。
9.根据权利要求6至8其中之一所述的装置,其特征在于,所述装置还包括:
导航单元,用于根据兴趣点信息进行导航。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810222961 CN101685021B (zh) | 2008-09-24 | 2008-09-24 | 一种兴趣点信息获取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810222961 CN101685021B (zh) | 2008-09-24 | 2008-09-24 | 一种兴趣点信息获取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101685021A CN101685021A (zh) | 2010-03-31 |
CN101685021B true CN101685021B (zh) | 2012-12-26 |
Family
ID=42048295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200810222961 Active CN101685021B (zh) | 2008-09-24 | 2008-09-24 | 一种兴趣点信息获取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101685021B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102385597B (zh) * | 2010-08-31 | 2016-04-27 | 厦门雅迅网络股份有限公司 | 一种poi的容错搜索方法 |
CN102779141B (zh) * | 2011-05-12 | 2017-03-01 | 阿尔派株式会社 | 设施数据检索装置以及导航系统 |
CN102841903A (zh) * | 2011-06-23 | 2012-12-26 | 北京畅联万方科技有限公司 | 一种基于智能模糊检索的网络地图poi检索方法和装置 |
CN103914455B (zh) * | 2012-12-30 | 2017-10-24 | 高德软件有限公司 | 一种兴趣点检索方法和装置 |
CN104050196B (zh) * | 2013-03-15 | 2017-09-15 | 阿里巴巴集团控股有限公司 | 一种兴趣点数据冗余检测方法及装置 |
CN106919601B (zh) * | 2015-12-25 | 2021-01-12 | 北京奇虎科技有限公司 | 从查询词中提取兴趣点的方法和装置 |
CN108287843B (zh) * | 2017-01-09 | 2021-12-21 | 北京四维图新科技股份有限公司 | 一种兴趣点信息检索的方法和装置、及导航设备 |
CN108458705A (zh) * | 2017-11-16 | 2018-08-28 | 平安科技(深圳)有限公司 | 目标地点的导航方法、装置、存储介质及终端 |
CN111191148A (zh) * | 2018-11-14 | 2020-05-22 | 北京嘀嘀无限科技发展有限公司 | 一种兴趣点列表确定方法和系统 |
JP2021026188A (ja) * | 2019-08-08 | 2021-02-22 | 本田技研工業株式会社 | 通信制御システム、通知制御方法、及び通信制御プログラム |
CN111046144A (zh) * | 2019-12-17 | 2020-04-21 | 深圳前海环融联易信息科技服务有限公司 | 一种智能匹配方法、装置、计算机设备及存储介质 |
CN113255398B (zh) * | 2020-02-10 | 2023-08-18 | 百度在线网络技术(北京)有限公司 | 兴趣点判重方法、装置、设备和存储介质 |
CN114329244A (zh) * | 2021-12-28 | 2022-04-12 | 北京百度网讯科技有限公司 | 地图兴趣点查询方法、装置、设备、存储介质及程序产品 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1428596A (zh) * | 2001-12-24 | 2003-07-09 | 菱科电子技术(中国)有限公司 | 多功能车载卫星导航系统 |
CN101162146A (zh) * | 2007-02-01 | 2008-04-16 | 厦门雅迅网络股份有限公司 | 一种联网车载导航设备中兴趣点按拼音首字母检索的方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100507451C (zh) * | 2006-09-27 | 2009-07-01 | 江苏华科导航科技有限公司 | 用于卫星导航的电子地图关键词检索方法及其装置 |
CN101082936A (zh) * | 2007-06-29 | 2007-12-05 | 中兴通讯股份有限公司 | 数据查询系统及方法 |
-
2008
- 2008-09-24 CN CN 200810222961 patent/CN101685021B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1428596A (zh) * | 2001-12-24 | 2003-07-09 | 菱科电子技术(中国)有限公司 | 多功能车载卫星导航系统 |
CN101162146A (zh) * | 2007-02-01 | 2008-04-16 | 厦门雅迅网络股份有限公司 | 一种联网车载导航设备中兴趣点按拼音首字母检索的方法 |
Non-Patent Citations (1)
Title |
---|
JP特开2007-213380A 2007.08.23 |
Also Published As
Publication number | Publication date |
---|---|
CN101685021A (zh) | 2010-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101685021B (zh) | 一种兴趣点信息获取方法及装置 | |
US7257574B2 (en) | Navigational learning in a structured transaction processing system | |
CN100437585C (zh) | 基于倒排表进行检索提示的方法 | |
US20120166414A1 (en) | Systems and methods for relevance scoring | |
CN101464896B (zh) | 语音模糊检索方法及装置 | |
Alex et al. | Adapting the Edinburgh geoparser for historical georeferencing | |
CN101206670B (zh) | 用于将非结构化信息转换成内容的系统和方法 | |
Diekema | Multilinguality in the digital library: a review | |
US8150979B1 (en) | Supporting multiple landing pages | |
CN101162146A (zh) | 一种联网车载导航设备中兴趣点按拼音首字母检索的方法 | |
CN103823799A (zh) | 新一代行业知识全文检索方法 | |
CN102314461B (zh) | 一种导航提示方法及系统 | |
EP1353280B1 (en) | A method of processing multi-lingual queries | |
US8484582B2 (en) | Entry selection from long entry lists | |
CN102193983B (zh) | 图形数据库基于关系路径的节点数据过滤方法 | |
CN102456055A (zh) | 兴趣点检索的方法及装置 | |
CN106095771A (zh) | 写作辅助方法及装置 | |
US6691103B1 (en) | Method for searching a database, search engine system for searching a database, and method of providing a key table for use by a search engine for a database | |
US20140177966A1 (en) | Discovering authoritative images of people entities | |
Brown et al. | Librarian's guide to online searching: Cultivating database skills for research and instruction | |
CN101676901A (zh) | 搜索调度方法及搜索服务器 | |
CN102819384A (zh) | 一种输入栏处进行提示显示的方法和装置 | |
CN101178738B (zh) | 一种音乐信息搜索方法、系统、服务端及客户端 | |
CN102385597B (zh) | 一种poi的容错搜索方法 | |
US20020129026A1 (en) | Process for accessing information via a communications network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200511 Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province Patentee after: Alibaba (China) Co.,Ltd. Address before: 102200, No. 18, Changsheng Road, Changping District science and Technology Park, Beijing, B1 Patentee before: AUTONAVI SOFTWARE Co.,Ltd. |
|
TR01 | Transfer of patent right |