CN101169327A - 信息检索装置 - Google Patents

信息检索装置 Download PDF

Info

Publication number
CN101169327A
CN101169327A CNA2007101515683A CN200710151568A CN101169327A CN 101169327 A CN101169327 A CN 101169327A CN A2007101515683 A CNA2007101515683 A CN A2007101515683A CN 200710151568 A CN200710151568 A CN 200710151568A CN 101169327 A CN101169327 A CN 101169327A
Authority
CN
China
Prior art keywords
unit
term
information
vocabulary
participle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007101515683A
Other languages
English (en)
Other versions
CN101169327B (zh
Inventor
姜德荣
孙竹平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Autonavi Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Autonavi Software Co Ltd filed Critical Autonavi Software Co Ltd
Priority to CN2007101515683A priority Critical patent/CN101169327B/zh
Publication of CN101169327A publication Critical patent/CN101169327A/zh
Application granted granted Critical
Publication of CN101169327B publication Critical patent/CN101169327B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Navigation (AREA)

Abstract

本发明公开一种信息检索装置包括输入单元,用于接收检索词;分词单元,用于对所述输入单元接收的检索词进行分词处理以获得若干词元;匹配单元,用于在导航电子地图数据库中找出所述检索词或者所述词元匹配的字段;主照片配置单元,用于将兴趣点的主照片存入导航电子地图数据库中;显示单元,用于显示与所述匹配单元找出的字段相关的信息和其主照片。由于本发明采用了主照片配置单元将兴趣点的主照片存入导航电子地图数据库中,在将查询结果显示出来的时候同时也将其相应的主照片显示出来,从而能够展示兴趣点等待查询信息的实际形象。

Description

信息检索装置
技术领域
本发明涉及电子导航领域,尤指一种信息检索装置。
背景技术
现有的车载卫星导航系统的信息检索装置普遍都提供了兴趣点信息的查询检索功能,利用该功能,用户可以方便的在查询界面输入自己想要查询的信息内容,系统会自动查询输出查询结果,以满足用户的需求。目前提供的兴趣点的详细信息主要有名称、地址、电话、传真、邮编等属性信息,用户查询检索到后,可以看到这些信息的详细文字记录即都是文字性抽象的记录,但用户并不能了解该兴趣点的实际外观形象。
发明内容
本发明要解决的问题是提供一种展示实际外观形象的信息检索装置。
为了解决上述问题,本发明信息检索装置包括:
输入单元,用于接收检索词;
分词单元,用于对所述输入单元接收的检索词进行分词处理以获得若干词元;
匹配单元,用于在导航电子地图数据库中找出所述检索词或者所述词元匹配的字段;
主照片配置单元,用于将兴趣点的主照片存入导航电子地图数据库中;
显示单元,用于显示与所述匹配单元找出的字段相关的信息和其主照片。
所述分词单元进一步包括:
词汇判断单元,判断检索词是否为可分类词汇;
查找单元,若检索词为可分类词汇,则在指针集合中查找检索词,若为一般词汇,则在词库集合中查找检索词;
第一判断单元,用于判断所述查找单元是否找到所述检索词;
检索词处理单元,若从所述第一判断单元接收的信息为“否”则减小所述检索词的长度并将减小长度后的检索词送给所述查找单元;
存放单元,用于存放所述检索词处理单元截取掉的字符和将查找到的检索词作为一个词元存储;
第二判断单元,判断所述存放单元中是否还有未分词的部分,若还有则将未分词的部分送给所述查找单元,否则将词元输出。
所述显示单元进一步包括:
排序单元,用于按照匹配度的高低对所述匹配单元检索出的字段进行排序;
相关显示单元,用于按照排序单元所排的顺序显示与所述字段相关的信息。
与现有技术相比,本发明信息检索装置的有益效果为:
由于本发明采用了主照片配置单元104将兴趣点的主照片存入导航电子地图数据库中,在将查询结果显示出来的时候同时也将其相应的主照片显示出来,从而能够展示兴趣点等待查询信息的实际形象。
附图说明
图1是本发明电子导航系统的信息检索装置的结构图;
图2是图1中的分词单元的结构示意图;
图3是词库结构示意图;
图4是词库的举例示意图。
具体实施方式
如图1所示,本发明电子导航系统的信息检索装置包括:
输入单元100,用于接收检索词;
分词单元101,用于对所述检索词进行分类并进行分词处理以获得若干词元;匹配单元102,用于在数据库中找出与所述词元匹配的字段;
主照片配置单元104,用于将兴趣点的主照片存入导航电子地图数据库中;
显示单元103,用于显示与所述匹配单元102找出的字段相关的信息和其主照片。
由上述可知,主照片配置单元104将兴趣点的主照片存入导航电子地图数据库中,输入单元100将接收到的检索词送给分词单元101,分词单元101将检索词处理后得到若干词元,匹配单元102在导航电子地图数据库中查找与这些词元匹配的信息,显示单元103在将这些匹配的信息的时候同时也将其主照片从导航电子地图数据库中取出并显示出来,从而能够展示兴趣点的实际形象。
POI主照片数据表Poiphoto结构如表1所示:
    Index     Name     Description
    1     ID     索引号
    2     NAME     POI名称
    3     ADDRESS     POI地址
    4     PHONE     POI联系电话
    5     PHOTO_CODE     POI主照片编号
表1
POI主照片数据表Poiphoto内容举例如表2:
  ID     NAME     ADDRESS   PHONE  PHOTO_CODE
13660 万寿宾馆 万寿路甲12号 68132266    63224
13661 宜宾市人民政府北京联络处 和平门内西中胡同28号 66069934    63225
13662 北京马哥孛罗酒店 宣武门内大街6号 66036688    63226
13663 中国科技大学研究生院 玉泉路甲19号 68592148    63227
13664 中国自然科学博物馆 天桥南街126号 67024431    63228
13665 石景山体育馆 石景山路32号 68875464    63229
表2
所述分词单元101进一步包括:
词汇判断单元1015,判断检索词是否为可分类词汇;
查找单元1010,对于可分类词汇,在指针集合中查找检索词;对于一般词汇,在整个词库集合中查找检索词;
第一判断单元1011,用于判断所述查找单元1010是否找到所述检索词;
检索词处理单元1012,若从所述第一判断单元1011接收的信息为“否”则减小所述检索词的长度并将减小长度后的检索词送给所述查找单元1010;
存放单元1013,用于存放所述检索词处理单元1012截取掉的字符和将查找到的检索词作为一个词元存储;
第二判断单元1014,判断所述存放单元1013中是否还有未分词的部分,若还有则将未分词的部分送给所述查找单元1010,否则将词元输出。
所述显示单元103进一步包括:
排序单元1030,用于按照匹配度的高低对所述匹配单元102检索出的字段进行排序;
相关显示单元1031,用于按照排序单元所排的顺序显示与所述字段相关的信息。
其中,实现词汇判断单元1015的伪代码为:
String key=“检索词”;
Int length=key.length();                    //得到检索词的字符串长度
String type=key.subString(length-2);        //取得检索词的最后两个字
Dictionary dic=new Dictionary(″SDIC.txt″);//加载类别表
HashMap hm=new HashMap()
while((s=in.readLine())!=null)
{
  words=s.split(″\t″);
  Integer freq=new Integer(words[1]);
   hm.put(words[0],freq);                   //存入类别名称
 }
boolean bfind=hm.containsKey(type);         //是否找到类别名称
实现查找单元1010的伪代码为:
String key=“检索词”;
Set resultset=“得到的检索集合”;           //若为可分类词汇,则此集合为该类别的指针集合,若为一般词汇,则此集合指整个词库中的内容
boolean bool=resultset.containsKey(key);    //判断检索词是否在检索集合中
实现检索词处理单元1012的伪代码为:
String key=“检索词”;
If(没有找到检索词){
   key=原检索词长度减小1后的结果;
   执行1010单元;
}
现假设用户输入的检索词是“中国人民银行”实现排序单元1030的伪代码为:
int num=用户输入的检索词经过分词后得到的词元个数;
int[]length=每个词元的字符串长度;
int len=搜索出的每个记录的名字长度;
if(num=1){//分词结果为该词本身
   len与length比较。len越大,结果越靠后;
   //实现:“中国人民银行”排在“中国人民银行昌平分行”前面的功能
 }
 else{
   num越大,表示该记录包含的词元数量越多,结果应靠前显示。
   当num一样时,则比较记录的长度,长度小的靠前显示;
   //实现“中国人民银行昌平分行”排在“中国人民银行建设路分行”前面的功能
 }
其中,所述可分类词汇指可划分到某个行业种类里面的词汇。例如:检索词为“王府饭店”,则这个检索词就为可分类词汇,其类型名称为:饭店。
导航信息检索的特点之一为,用户检索的内容95%以上为各种地点的名称,而中文短句的中心词通常是最后两个字,例如:××饭店,××宾馆,利用这个特点,首先在词库中建立一个类别表,里面存放“饭店”,“宾馆”,“超市”等类型名称。进行类型判断时首先取出检索词的最后两个字,在类别表中查找,如果找到,则该检索词属于可分类词汇,类型名称为检索词的最后两个字。
传统的词库都是按照词元的汉语拼音字母的顺序进行排序,本系统的词库采用类别和字母顺序相结合的方式进行词元的排序。对于可分类词汇,每个类别内部以及各个类别之间的词元采用汉语拼音字母的顺序进行排序,并且分布在词库中词元列表的前面,减少可分类词汇的检索时间;对于一般词汇,则只按照词元的汉语拼音字母的顺序进行排序,并且分布在可分类词汇的后面。
词库中内容的片断截取如下:
银行  14_1                                (可分类词汇)
中国工商  14_1_1
中国建设  14_1_2
中国农业  14_1_3
……..
癌23_1                                  (一般词汇)
癌细胞  23_2
癌症 23_3
癌肿 23_4
矮  23_5
矮矮  23_6
矮秆作物  23_7
类别表主要负责记录各种类别及其索引编号,以供查找。类别表的结构大体与词库相似,但内容要少很多,所以查询类别表花费的时间很少,基本可以忽略。
类别表内容的片断截取如下:
商场  10_1
超市  10_2
专卖店  10_3
如图3所示,词汇分类时采用从大类到小类的方式进行分类,也方便进行词库的管理。根据日常生活的特点,首先确定几个大的类别,为每一个大类确定一个索引前缀,目的是唯一标识此大类,以便添加更小的类别(如:娱乐休闲,索引前缀为11);然后对此大类进行进一步细分,划分出更加详细的小类别,并且在大类索引前缀的后面添加类别编号,完成此小类的索引前缀(如:酒吧,索引前缀为11_2)。
对于词库,以“银行”为例,它属于一个小类别,对应的大类为“金融机构”,其索引前缀为“14”,“银行”在大类中的编号是“1”,这样,就可以确定“银行”这一小类别的索引前缀为“14_1”。然后为“银行”这一类别中添加具体内容和索引指针,
例如:
(名称)  (指针/指针集合)
银行  14_1,14_1_1,14_1_2,14_1_3...
中国工商  14_1_1
中国建设  14_1_2
中国农业  14_1_3
........
例如:用户开始输入的检索词为“北京威帝科技大厦”,进入分词单元,首先进行检索词的类型判定,经过分析判定为建筑物(索引前缀20,如图3和4所示)-大厦(索引前缀20_13,如图3和4所示),在词库中查找数据区域为“大厦”的词元,得到该索引区域的指针集合。在指针集合中查找“北京威帝科技”,集合中如果没有找到这个词,则字符串长度减小一个字,变成“北京威帝科”,再去集合中查找,如果没有,再减小一个,变成“北京威帝”,这次如果在词库中找到了这个词,则“北京威帝”是分词结果的一部分;现在用户输入的检索词经过分词只剩下了“科技”,将“科技”这个词继续在指针集合中查找,如找到,则最终将用户输入的检索词分词为:“北京威帝”,“科技”,“大厦”,若在指针集合中无法找到与“北京威帝科技”相关的内容,则将“北京威帝科技大厦”作为一般词汇,进行词库查找。分词成功后,在导航电子地图数据库中查找出所有包含“北京威帝”,“科技”,“大厦”三个关键字的记录,并按照与用户输入的检索词“北京威帝科技大厦”的匹配度高低进行排序,然后把结果显示给用户。
例如在导航电子地图数据库中检索有关“中国人民银行”的信息,输入单元100接收检索词“中国人民银行”后,首先对检索词进行分类,分类结果为:金融场所(索引前缀15)-银行(索引前缀15_14),将分类结果送给查找单元1010,查找单元1010取得“银行”的索引区域的指针集合,并在指针集合中查找是否存在该词,如果某个指针对应的数据区域内容刚好是“中国人民”则分词结束;如果所有指针对应的数据区域内容都不满足“中国人民”,则逐个减小“中国人民”字符串的长度,在指针集合中查找,如仍然没有找到,则将“中国人民银行”作为一般词汇进行检索,得到最终的分词结果。
主照片配置单元104的实现如下:
//在导航电子地图数据库中取得POI名称及其相关属性
public getResultSet(String poiname){
   String sqlStr=“select*from iis“+
                    “where NAME=poiname”;
   ResultSet rs=stmt.executeQuerty(sqlStr);
   return rs;
}
//将poi的各种属性信息包括主照片信息导入到POI主照片数据表Poiphoto中
public void addpoi(ResuleSet rs){
   String sql=″insert into Poiphoto(NAME,ADDRESS,PHONE,PHOTO_CODE)
  values(+rs.getString(1)+re.getString(2)++rs.getString(3)++
  rs.getString(4))″;
  stmt.executeUpdate(sql);
}
例如,用户检索的是万寿宾馆,输入单元100接收到这个词,经过分词单元101处理后得到与万寿宾馆相匹配的结果集合,显示单元对结果集合进行排序处理,用户看到的地图界面的中心点为“万寿宾馆”这个poi点以及它的主照片信息。
综上所述,由于本发明采用了主照片配置单元104将兴趣点的主照片存入导航电子地图数据库中,在将查询结果显示出来的时候同时也将其相应的主照片显示出来,从而能够展示兴趣点等待查询信息的实际形象。

Claims (3)

1.一种电子导航系统的信息检索装置,其特征在于,包括:
输入单元,用于接收检索词;
分词单元,用于对所述输入单元接收的检索词进行分词处理以获得若干词元;
匹配单元,用于在导航电子地图数据库中找出所述检索词或者所述词元匹配的字段;
主照片配置单元,用于将兴趣点的主照片存入导航电子地图数据库中;
显示单元,用于显示与所述匹配单元找出的字段相关的信息和其主照片。
2.如权利要求1所述的信息检索装置,其特征在于,所述分词单元进一步包括:
词汇判断单元,判断检索词是否为可分类词汇;
查找单元,若检索词为可分类词汇,则在指针集合中查找检索词,若为一般词汇,则在词库集合中查找检索词;
第一判断单元,用于判断所述查找单元是否找到所述检索词;
检索词处理单元,若从所述第一判断单元接收的信息为“否”则减小所述检索词的长度并将减小长度后的检索词送给所述查找单元;
存放单元,用于存放所述检索词处理单元截取掉的字符和将查找到的检索词作为一个词元存储;
第二判断单元,判断所述存放单元中是否还有未分词的部分,若还有则将未分词的部分送给所述查找单元,否则将词元输出。
3.如权利要求2所述的信息检索装置,其特征在于,所述显示单元进一步包括:
排序单元,用于按照匹配度的高低对所述匹配单元检索出的字段进行排序;
相关显示单元,用于按照排序单元所排的顺序显示与所述字段相关的信息。
CN2007101515683A 2006-10-25 2007-09-28 信息检索装置 Active CN101169327B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101515683A CN101169327B (zh) 2006-10-25 2007-09-28 信息检索装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200620137470.3 2006-10-25
CN200620137470 2006-10-25
CN2007101515683A CN101169327B (zh) 2006-10-25 2007-09-28 信息检索装置

Publications (2)

Publication Number Publication Date
CN101169327A true CN101169327A (zh) 2008-04-30
CN101169327B CN101169327B (zh) 2011-02-09

Family

ID=39390023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101515683A Active CN101169327B (zh) 2006-10-25 2007-09-28 信息检索装置

Country Status (1)

Country Link
CN (1) CN101169327B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102495893A (zh) * 2011-12-09 2012-06-13 北京北方烽火科技有限公司 一种在无线路测软件中使用地图的方法及设备
CN101995258B (zh) * 2009-08-17 2012-12-05 宏达国际电子股份有限公司 邻近兴趣点的浏览方法、系统及所使用的计算机程序产品
CN102998686A (zh) * 2011-09-19 2013-03-27 深圳市赛格导航科技股份有限公司 一种显示车辆当前参考位置的方法和系统
CN103164484A (zh) * 2011-12-16 2013-06-19 上海博泰悦臻电子设备制造有限公司 目标点的名称的索引的建立方法及装置
CN103514199A (zh) * 2012-06-25 2014-01-15 高德软件有限公司 Poi数据处理方法及其装置、poi检索方法及其装置
CN110399566A (zh) * 2018-04-20 2019-11-01 北京搜狗科技发展有限公司 一种位置搜索方法、装置和电子设备
CN110399436A (zh) * 2018-04-20 2019-11-01 北京搜狗科技发展有限公司 一种基于同义词根进行地图离线搜索的方法及装置
WO2021051874A1 (zh) * 2019-09-16 2021-03-25 平安科技(深圳)有限公司 一种信息推送方法和相关装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1335574A (zh) * 2001-09-05 2002-02-13 罗笑南 智能语义搜索方法
CN1256688C (zh) * 2002-07-25 2006-05-17 摩托罗拉公司 用于中文文本处理系统的中文分词方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101995258B (zh) * 2009-08-17 2012-12-05 宏达国际电子股份有限公司 邻近兴趣点的浏览方法、系统及所使用的计算机程序产品
CN102998686A (zh) * 2011-09-19 2013-03-27 深圳市赛格导航科技股份有限公司 一种显示车辆当前参考位置的方法和系统
CN102495893A (zh) * 2011-12-09 2012-06-13 北京北方烽火科技有限公司 一种在无线路测软件中使用地图的方法及设备
CN103164484A (zh) * 2011-12-16 2013-06-19 上海博泰悦臻电子设备制造有限公司 目标点的名称的索引的建立方法及装置
CN103514199A (zh) * 2012-06-25 2014-01-15 高德软件有限公司 Poi数据处理方法及其装置、poi检索方法及其装置
CN110399566A (zh) * 2018-04-20 2019-11-01 北京搜狗科技发展有限公司 一种位置搜索方法、装置和电子设备
CN110399436A (zh) * 2018-04-20 2019-11-01 北京搜狗科技发展有限公司 一种基于同义词根进行地图离线搜索的方法及装置
WO2021051874A1 (zh) * 2019-09-16 2021-03-25 平安科技(深圳)有限公司 一种信息推送方法和相关装置

Also Published As

Publication number Publication date
CN101169327B (zh) 2011-02-09

Similar Documents

Publication Publication Date Title
CN100562713C (zh) 电子导航系统的信息检索方法及装置
CN101169327B (zh) 信息检索装置
CN101206121B (zh) 地名检索装置
US8078601B1 (en) Determining unambiguous geographic references
US8271495B1 (en) System and method for automating categorization and aggregation of content from network sites
CN106970991B (zh) 相似应用的识别方法、装置和应用搜索推荐方法、服务器
US20120166414A1 (en) Systems and methods for relevance scoring
US20030123721A1 (en) System and method for gathering, indexing, and supplying publicly available data charts
US8700661B2 (en) Full text search using R-trees
CN103678576A (zh) 基于动态语义分析的全文检索系统
CN103605752A (zh) 一种基于语义识别的地址匹配方法
CN102262670A (zh) 一种基于移动可视设备的跨媒体信息检索系统及方法
CN101685021A (zh) 一种兴趣点信息获取方法及装置
CN102880721A (zh) 垂直搜索引擎的实现方法
CN108984521A (zh) 一种新闻事件中人物观点抽取方法
CN102591984A (zh) 导航数据中兴趣点数据查询速度的优化方法
CN114780680A (zh) 基于地名地址数据库的检索与补全方法及系统
CN101149271B (zh) 交叉点路口检索装置
EP2783308B1 (en) Full text search based on interwoven string tokens
JP2002041573A (ja) 情報検索システム
CN112989811B (zh) 一种基于BiLSTM-CRF的历史典籍阅读辅助系统及其控制方法
CN110245215B (zh) 一种文本检索方法和装置
CN111325235A (zh) 面向多语种的通用地名语义相似度计算方法及其应用
CN101206120B (zh) 广场检索装置
CN101169328B (zh) 立交桥检索装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200528

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 102200, No. 18, Changsheng Road, Changping District science and Technology Park, Beijing, B1

Patentee before: AUTONAVI SOFTWARE Co.,Ltd.

TR01 Transfer of patent right