CN101840406A - 地名搜索装置和系统 - Google Patents

地名搜索装置和系统 Download PDF

Info

Publication number
CN101840406A
CN101840406A CN200910129465A CN200910129465A CN101840406A CN 101840406 A CN101840406 A CN 101840406A CN 200910129465 A CN200910129465 A CN 200910129465A CN 200910129465 A CN200910129465 A CN 200910129465A CN 101840406 A CN101840406 A CN 101840406A
Authority
CN
China
Prior art keywords
place name
item
searched
search
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910129465A
Other languages
English (en)
Other versions
CN101840406B (zh
Inventor
张洁
孟遥
于浩
直井聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to CN200910129465.6A priority Critical patent/CN101840406B/zh
Publication of CN101840406A publication Critical patent/CN101840406A/zh
Application granted granted Critical
Publication of CN101840406B publication Critical patent/CN101840406B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供一种地名搜索装置包括:地名关系信息库生成单元,用于生成作为搜索目的地的地名的地名关系信息库,所述地名关系信息库包括地名、与所述地名相关联的信息项、以及与所述地名相关联的目标项;预处理单元,用于对输入的待搜索关键字进行预处理,以使得所述待搜索关键字的属性与所述信息项中至少一部分信息项的属性相同;和搜索单元,用于利用经所述预处理单元预处理后的待搜索关键字在所述地名关系信息库中进行搜索,以便通过所述预处理后的待搜索关键字的属性与所述至少一部分信息项的属性之间的匹配,获得与所述输入的待搜索关键字相对应的地名及其目标项。这种地名搜索装置可提高地名搜索处理的效率和准确性。还提供一种地名搜索方法。

Description

地名搜索装置和系统
技术领域
本发明总体上说涉及地理位置的搜索和定位的技术领域,更具体而言,涉及进行地名搜索的装置和系统。
背景技术
在现有的进行地名搜索的技术中,一般是预先准备有关地理位置信息的数据库,然后把要检索的地理位置(或地名)作为关键字、通过各种特定的搜索方法在数据库中进行搜索,从而获得地名搜索的结果。例如,在由廖一兰等所著的《基于BPM-BM算法的地名数据匹配》(《测绘通报》2008年6月)中,给出了进行地名搜索处理的一种实现方式。
可以看出,在进行地名搜索的现有技术中,包括地名的地址数据的地理位置信息数据库容量庞大且内容极大丰富,然而大部分的地址数据都作为独立的记录存储在数据库中,地名和地址之间的关系、地名内部各个组成部分的关系尚未被有效地利用。因此面对各种各样的用户输入,需要使用各种复杂的搜索方法(算法)进行地名搜索,虽有强大的数据库后台支持,但搜索结果准确性不高,经常出现返回错误的搜索结果甚至得不到有效的搜索结果的情况,这进一步也影响了地名搜索的效率。
发明内容
鉴于现有技术的上述现状,需要改善地名搜索处理的准确性并提高地名搜索的效率。
根据本发明的实施例,提供一种地名搜索装置,包括:地名关系信息库生成单元,用于生成作为搜索目的地的地名的地名关系信息库,所述地名关系信息库包括地名、与所述地名相关联的信息项、以及与所述地名相关联的目标项;预处理单元,用于对输入的待搜索关键字进行预处理,以使得所述待搜索关键字的属性与所述信息项中至少一部分信息项的属性相同;和搜索单元,用于利用经所述预处理单元预处理后的待搜索关键字在所述地名关系信息库中进行搜索,以便通过所述预处理后的待搜索关键字的属性与所述至少一部分信息项的属性之间的匹配,获得与所述输入的待搜索关键字相对应的地名及其目标项。
根据本发明的实施例,还提供一种地名搜索方法,包括:地名关系信息库生成步骤,用于生成作为搜索目的地的地名的地名关系信息库,所述地名关系信息库包括地名、与所述地名相关联的信息项、以及与所述地名相关联的目标项;预处理步骤,用于对输入的待搜索关键字进行预处理,以使得所述待搜索关键字的属性与所述信息项中至少一部分信息项的属性相同;和搜索步骤,用于利用经所述预处理步骤预处理后的待搜索关键字在所述地名关系信息库中进行搜索,以便通过所述预处理后的待搜索关键字的属性与所述至少一部分信息项的属性之间的匹配,获得与所述输入的待搜索关键字相对应的地名及其目标项。
根据本发明的实施例的地名搜索装置和地名搜索方法,以作为搜索目的地的地名为中心构建地名关系信息库,该地名关系信息库中包括地名、与所述地名相关联的信息项、以及与所述地名相关联的目标项。对进行地名搜索时输入的待搜索关键字进行预处理,并以预处理后的待搜索关键字作为索引在所述地名关系信息库中找到相匹配的信息项,然后根据该匹配的信息项获得与待搜索关键字对应的地名及其地址等相关信息。由于对包括地名的地址数据的地理位置数据库进行了适当的整合,并根据这种整合对待搜索关键字进行预处理,因此根据本发明的实施例的地名搜索装置和方法可以提高地名搜索这种数据处理过程的准确性,并提高地名搜索效率。此外,能够有效地应对各种形式的地名搜索输入,并且能够通过近邻以及相关信息来准确定位,给用户全方位的定位信息支持。
附图说明
参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件不是成比例绘制的,而只是为了示出本发明的原理。为了便于示出和描述本发明的一些部分,附图中对应部分可能被放大,即,使其相对于在依据本发明实际制造的示例性装置中的其它部件变得更大。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。
图1是示意性地示出了根据本发明的实施例的进行地名搜索的装置的主要构成部分的简化框图;
图2A是示意性地示出了在根据本发明的实施例的地名搜索装置中所构建的地名关系信息库中一条信息的内容构成的简图;
图2B是示意性地示出了在如图2A所示的地名关系信息库的该条信息中地名“ID1=人民大学”的情况下所构建的地名关系信息的内容的简图;
图2C是示意性地示出了在如图2A所示的地名关系信息库的该条信息中地名“ID4=全国人民代表大会”的情况下所构建的地名关系信息的内容的简图;
图2D是示意性地示出了在如图2A所示的地名关系信息库的该条信息中地名“ID7=北京七中”的情况下所构建的地名关系信息的内容的简图;以及
图3是示意性地示出了根据本发明的实施例的进行地名搜索的方法的主要步骤的简化流程图。
具体实施方式
下面参照附图来说明本发明的实施例。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。
图1是示出了根据本发明的实施例的进行地名搜索的装置100的主要构成部分的简化框图。如图1所示,根据本发明该实施例的地名搜索装置100主要包括:地名关系信息库生成单元110,预处理单元120和搜索单元130。其中,地名关系信息库生成单元110用于生成作为搜索目的地的地名的地名关系信息库,这种地名关系信息库包括地名、与该地名相关联的信息项、以及与该地名相关联的目标项。预处理单元120用于对输入的待搜索关键字进行预处理,以使得待搜索关键字的属性与地名关系信息库所包含的信息项中至少一部分信息项的属性相同。搜索单元130,用于利用经预处理单元120预处理后的待搜索关键字在由地名关系信息库生成单元110所生成的地名关系信息库中进行搜索,以便通过预处理后的待搜索关键字的属性与所述至少一部分信息项的属性之间的匹配,获得与所输入的待搜索关键字相对应的地名及其目标项,即,输出地名搜索的结果。
根据本发明的地名搜索装置100与现有技术中的地名搜索装置共有的构成部件,例如用于输入待搜索关键字的输入单元,用于输出地名搜索结果的输出单元等等,由于不涉及本发明的主旨,对此不再详细。
下面将结合图2A对地名关系信息库生成单元110所生成的地名关系信息库的实例进行详细说明。
图2A是示意性地示出了如图1中所示的地名搜索装置100所包括的地名关系信息库生成单元110生成的地名关系信息库的一条信息的内容构成的简图。如图所示,在该条信息中,“IDx”(x是自然数)是作为搜索目的地的地名的标识符,与该地名相关联的信息数据具有三个分支项,即“语音”,“词形”和“词义”。“词形”包括表示地名的字符串的全称、简称、繁体、异体和对等体;“语音”包括表示地名的字符串的全拼和简拼;“词义”包括与地名相关联的地址、类型和邻近地名,其中邻近地名是指与当前地名IDx具有预定的位置和距离关系的其他地名,例如,标识符为IDm,IDn(m,n是自然数)的地名等。其中,分支项“语音”和“词形”是与地名相关联的信息项,表示地名的字符串的全称、简称、繁体、异体和对等体指明信息项“词形”的属性,表示地名的字符串的全拼和简拼指明信息项“语音”的属性;而分支项“词义”是与地名相关联的目标项,即,地名搜索过程最终需要得到的是有关该地名的地址的数据,其中,与地名相关联的地址、类型和邻近地名指明了目标项“词义”的属性。
在图2A所示出的地名关系信息库的该条信息中,以标识符为“IDx”的、作为搜索目的地的地名为中心构建了该地名、与该地名相关联的信息项以及与该地名相关联的目标项之间的对应关系。因而,只要确定了与该地名相关联的任何信息项,即可通过如此构建的地名关系信息简单快速地搜索得到地名以及与该地名相关联的目标项,例如该地名的地址等(以下将会对这种地名搜索过程进行详细描述)。
虽然在图2A中没有示出,但是容易理解,在如图2A的地名关系信息库的该条信息中,还可以包括与标识符为“IDx”的地名相关联的其他任何合适的信息项,例如,与该地名相关联的图像表示、话音表示等。这样,如果所输入的待搜索关键字是与地名相关的图像表示(例如某个建筑的LOGO),或者是地名的话音表示(例如通过话音输入待搜索地名的名称),也可以通过如图2A的地名关系信息库的该条信息的内容搜索得到相应的地名以及与该地名相关联的目标项,例如该地名的地址等。
虽然在图2A所述的地名关系信息库的该条信息中,包括了“语音”和“词形”作为与地名相关联的信息项,但是容易理解,可以根据实际需要设置与地名相关联的信息项的数量和种类,例如,可使得如图2A所示的地名关系信息库的该条信息中包括信息项“语音”和“词形”中至少一种。例如,在预见到地名搜索过程中将基本上采用拼音方式输入待搜索关键字的情况下,则图2A中的信息项“词形”可省略。而且,作为信息项“词形”的属性的、表示地名的字符串的全称、简称、繁体、异体和对等体,以及作为信息项“语音”的属性的、表示地名的字符串的全拼和简拼,也可以不必全部包括在地名关系信息库中,而是可以根据实际情况来选择性地设置,例如,信息项“词形”和“语音”中可以分别只包括上述的属性中的至少一种。类似地,作为目标项“词义”的属性的、与地名相关联的地址、类型和邻近地名,也可以根据实际地名搜索的要求,只包括其中至少一种。其中,属性“类型”可包括学校、医院、餐饮、酒店宾馆、政府机关、公交站点、停车场、加油站、金融机构、写字楼大厦、体育场馆、居民小区等中的至少一种。此外,属性“邻近地名”既可以只包括标识符为IDm,IDn的地名,以可以还包括与这些邻近地名相关联的其他信息,例如地名关系信息库中以这些邻近地名为中心构建的信息中所涉及的其他数据,诸如与这些邻近地名相关联的信息项和/或目标项等。通过提供属性“邻近地名”的相关信息,可为用户提供周边信息提示,即:根据用户输入,获得地名搜索的地址结果后,给出与该地名相邻的其他地名,以便向用户提供一个相对地理概念。而且,这种提供周边信息提示的功能,也可以根据邻近地名的类型属性,向用户提供若干兴趣点。例如,如果邻近地名中包括类型属性为“加油站”的、用户感兴趣的地名,则用户可以直接选取该加油站的地名,从而获得以该加油站为中心构建的地名关系信息中所涉及的其他数据,诸如与该加油站相关联的信息项和/或目标项等。
可见,如图1所示的地名搜索装置100中包括的地名关系信息库生成单元110所生成的地名关系信息库实际上是一种数据库,该数据库包含地名以及与地名相关的任何适当信息。这种数据库当然也可以是各种构成形式的数据库,并且地名关系信息库生成单元110可以根据实际地名搜索的需要来确定该数据库的形式和内容,而不必限于图2A所示的实例。
下面将结合图2B-2D对根据本发明实施例的如图1所示的地名搜索装置100所执行的地名搜索过程的若干实例进行详细说明。
图2B示意性地示出了在如图2A所示的地名关系信息库的信息中地名“ID1=人民大学”的情况下所构建的地名关系信息的内容的简图。如图所示,以作为搜索目的地的地名“ID1=人民大学”为中心建立地名关系信息,其中,与地名“人民大学”相关联的信息项“语音”包括如下属性:字符串“人民大学”的“全拼(QP)=renmindaxue”和“简拼(JP)=rd”;与地名“人民大学”相关联的信息项“词形”中包括如下属性:“繁体(TF,Traditional Chinese)=人民大學”,“异体(YT,variant forms)=无(NULL)”,“缩略语或简称(SF,Simplified Chinese)=人大”,“对等体(EF,equivalent form)=中国人民大学”;与地名“人民大学”相关联的目标项“词义”包括如下属性:“类型(Attribute)=学校”,“地址(Address)=北京海淀区中关村大街59号”(图中未示出),以及“邻近地名(ID2,ID3,西,50米)”。
假设所输入的待搜索关键字为字符串“人大”。地名搜索装置100中的预处理单元120对该待搜索关键字进行预处理,具体而言,通过分词和词性标注处理将“人大”识别为简称(或缩略语),标记为“人大/j”,并可通过简拼全拼识别处理将“人大”拼音“rd”标记为其简拼,例如“JP:rd/”。可以看到,通过预处理单元120的预处理,使得待搜索关键字“人大”的属性与如图2B中构建的地名关系信息中的至少一部分信息项的属性相同,以便为搜索单元130的处理做准备。在此实例中,所述的至少一部分属性是指与地名“人民大学”相关联的信息项“语音”的属性“简拼”和信息项“词形”的属性“简称”。
然后,地名搜索装置100中的搜索单元130根据预处理单元120所进行的上述预处理的结果,通过利用经预处理后的待搜索关键字的属性——简称(或缩略语)“人大/j”或者简拼“JP:rd”作为索引,在如图2B所示的地名关系信息中进行搜索,以获得相匹配的属性“简称=人大”或者“简拼=rd”,由此很容易就得到地名搜索目的地“ID1=人民大学”,并获得与该地名相关联的目标项的属性,即,“人民大学”的“地址(Address)”——“北京海淀区中关村大街59号”(图中未示出)。此外,如果需要,还可获知其类型为“学校”,并且与地名“人民大学”相关的邻近地名是从人民大学向西50米的、标识符为“ID2”、“ID3”的地名。容易理解,如果由地名关系信息库生成单元110所构建的地名关系信息库中包含有与标识符为“ID2”、“ID3”的地名相关联的信息(例如与这些地名相关联的信息项、目标项等),则也可以获得这些信息。
如上所述,搜索单元130在利用经预处理后的待搜索关键字的属性——简称(或缩略语)“人大/j”或者简拼“JP:rd”与如图2B示出的地名关系信息中的“简称(SF)=人大”或者“简拼(JP)=rd”进行匹配时,例如可以通过预先设置的映射关系“j=SF”来实现简称“人大/j”与“简称(SF)=人大”的匹配过程。当然,预处理单120也可使得待搜索关键字经预处理后得到简称“人大/SF”,从而直接获得经预处理后的待搜索关键字的属性“人大/SF”与地名关系信息中的信息项属性“简称(SF)=人大”之间的匹配。例如,待搜索关键字被预处理后得到的简拼“JP:rd”与地名关系信息库中的“简拼(JP)=rd”之间可实现直接的匹配。容易理解,搜索单元130还可以利用现有的各种其他的匹配方法来实现上述的数据匹配处理过程,因为这不涉及本发明的实质,在此不再赘述。
从图2B中可以看到,与地名“人民大学”相关联的信息项“词形”的属性中还包括属性——“繁体=人民大學”、“对等体=中国人民大学”。因此,如果输入的待搜索关键字是“人民大學”或者“中国人民大学”时,预处理单元120例如也可通过相应的预处理将它们分别标记为“繁体:人民大學”或“对等体:中国人民大学”,从而搜索单元130通过类似的属性匹配过程分别找到图2B所示出的地名关系信息中相匹配的信息项属性“繁体”或者“对等体”,进而获得搜索目的地“人民大学”以及与其相关联的目标项的属性,即,“人民大学”的地址、类型以及与地名“人民大学”相关的邻近地名中的至少之一。具体处理过程与上述通过属性“简称”或者“简拼”进行的搜索处理的过程类似,在此不再赘述。而且,虽然图2B中将“中国人民大学”作为是属性“对等体”的值,但是,当然也可以将其作为是属性“全称”的值,只要将预处理单元120配置成使得输入的待搜索关键字“中国人民大学”经预处理后被标识为属性“全称”而不是“对等体”即可。
此外,如上所述,由于图2B的地名关系信息中还可能包括与地名“人民大学”相关的其他信息项,例如,人民大学的图像表示(LOGO)或话音表示(用于通过输入话音进行地名搜索)等,在这种情况下,如图1所示的根据本发明的实施例的地名搜索装置100中的地名关系信息库生成单元110、预处理单元120和搜索单元130利用输入的图像或者话音作为待搜索关键字,执行与上述的通过属性“简称”或者“简拼”进行的搜索处理的过程类似的处理,在此不再赘述。
图2C示意性地示出了在如图2A所示的地名关系信息库的信息中地名“ID4=全国人民代表大会”的情况下所构建的地名关系信息库的内容的简图。如图2C中示出的地名关系信息的构建形式以及其中各项内容的含义、根据本发明的实施例的地名搜索装置100根据如此构建的地名关系信息所进行的地名搜索处理过程等,都与上述参照图2B所描述的内容和过程相类似,在此不再赘述。
需要注意,比较图2B与图2C可知,标识符为ID4的地名“全国人民代表大会”的信息项“词形”的属性——“简称=人大”与图2B中标识符为ID1的地名“人民大学”的信息项“词形”的属性——“简称=人大”是相同的。因此,在搜索单元130通过属性“简称”进行匹配处理时,将返回两个地名搜索结果,即,地名“人名大学”及其相关信息以及地名“全国人民代表大会”及其相关信息,例如,其地址为“西城区人民大会堂”(图中未示出)。在这种情况下,从中选择一个所需的地名搜索结果即可。
此外,虽然为了描述简明起见,图2C中地名“全国人民代表大会”的信息项“词形”的属性仅包括“简称=人大”,“繁体=NULL”,“对等体=NULL”,但是根据上述描述可知,可以根据各种不同的具体需要来生成和构建与地名“全国人民代表大会”相关的地名关系信息,而不受限于图2C所示出的形式。
在上述预处理单元120所进行的预处理中,涉及对所输入的待搜索关键字进行分词和词性标注处理或者简拼全拼识别处理。下面对这些处理进行简要介绍。
中文的分词和词性标注处理是自然语言处理的第一个阶段,该技术已经被广泛地应用到数据检索、机器翻译、自动问答等自然语言处理的多种技术领域。其具体处理过程是:通过学习人工切分、标注的语料库,可以获得统计规则,进而对待分析的字符串(生语料)做出词语切分和词性标注的判断。例如,在上面结合图2B描述的地名搜索过程中,通过分词和词性标注处理将输入的待搜索关键字“人大”识别为简称,标记为“人大/j”,这是因为根据预先对语料库的学习可知,字符串“人大”在极高的概率上表示的是一种简称。关于中文分词的基本介绍,例如可参见,Richard Sproat,The FirstInternational Chinese Word Segmentation Bakeoff,2nd SIGHANworkshop(2003)。有关中文词性标记的基本介绍,例如可参见Hua-PingZhang等所著Chinese Lexical Analysis Using HHMM-ACL2003\\HHMM-basedChinese Lexical Analyzer ICTCLAS,2nd SIGHAN workshop affiliatedwith 41th ACL;Sapporo Japan,July,2003,pp.184-187。
在中文输入法中,全拼输入法是指依照汉语拼音方案,省略了声调用声母和韵母输入中文的方法。简拼输入法一般指将词语中所有单字的拼音都省略为声母(或音节的首字母)来输入该词语的方法。例如:“红楼梦hónglóumèng”,在全拼输入法里可用“hongloumeng”来输入,在简拼输入法里可以用“hlm”这三个声母输入。现代汉语中的声母21个,韵母35个,辨别所输入的字符串是全拼还是简拼可以简单地通过输入的字符串是声母组合还是声韵母组合来判断。简拼全拼识别处理已经被普遍地运用到大部分拼音输入法中。例如,在上面结合图2B描述的地名搜索过程中,通过简拼全拼识别处理将“人大”的拼音“rd”标记为其简拼,例如“JP:rd/”。关于简拼全拼识别处理的基本介绍,例如可参见沈爱所著《全拼,简拼,双拼全兼容汉字输入方法的实现》,计算机世界月刊,1994年6期。
在搜索单元130进行地名搜索处理之前,预处理单元120通过分词和词性标记处理对待搜索关键字进行预处理可获得如下的技术益处。例如,当输入“名人大厦”、“馋人大食府”等字符串作为待搜索关键字时,预处理单元120通过分词和词性标记处理将这些字符串自动地切分为“名人/n大厦/n”、“馋人/n大/a食府/n”,其中,“n”表示“名词”,“a”表示“形容词”,但是,显然不会得到预处理结果:简称(或缩略语)“人大/j”,如上面结合图2B所描述的。因此,不会盲目地对“人大”这样一个字符片段进行强行匹配,到如图2B中所示的与地名“人名大学”相关的地名关系信息中进行匹配处理,从而增加地名搜索工作量且返回无效的搜索结果。对于所输入的待搜索字符串“名人大厦”、“馋人大食府”,可以根据地名关系信息库中与这些地名相关的地名关系信息来进行搜索,具体处理方式可参见上面的相关描述,不再赘述。如果不存在与这些地名相关的地名关系信息,则可通过例如全字匹配等常用的地名搜索方法来执行地名搜索,由于这不是本发明所关注的内容,在此省略其具体描述。
当然,本领域技术人员容易理解,上述的预处理单元120进行的预处理只是一种示例,而并不构成对本发明的限制。根据实际情况,只要能使得经过预处理后的待搜索关键字的属性与地名关系信息库中至少一部分信息项的属性相同,预处理单元120可以采用各种适当的预处理方式对待搜索关键字进行预处理。
图2D示意性地示出了在如图2A所示的地名关系信息库的信息中地名“ID7=北京七中”的情况下所构建的地名关系信息库的内容的简图。如图2D中示出的地名关系信息的构建形式以及其中各项内容的含义、根据本发明的实施例的地名搜索装置100根据如此构建的地名关系信息所进行的地名搜索处理等,都可与上述参照图2B所描述的内容及过程相类似,在此不再赘述。但是注意到,与地名“北京七中”相关联的信息项“词形”的属性中包括“对等体1=北京7中”和“对等体2=北京中”,其中,数字“7”具有各种不同的数字表示方式“7”(阿拉伯数字),“七”(中文简写)和“柒”(中文繁体)。这样,就可以确保输入的待搜索关键字中存在针对同样的数字的不同的表示方式时,都可以通过搜索单元130的搜索处理找到搜索目的地“ID7=北京七中”及其相关的目标项的属性等信息。
作为可替选实施方式,在待搜索的关键字和地名关系信息库中包括不同的数字表示方式的情况下,也可以通过预处理单元120将待搜索的关键字中所包含的阿拉伯数字、汉语数字、希腊数字等统一为一种数字表示方式,例如,可以统一为地名关系信息库中所包括的某种数字表示方式。这种处理可称为“数字归一化处理”。经过这种数字归一化处理后,在上述图2D所示的例子中,如果输入“北京柒中”或“北京7中”作为待搜索关键字,则预处理单元120将其中的数字“7”和“柒”归一化为地名关系信息中的一种数字表示方式“七”。则对于输入“北京柒中”或“北京7中”,搜索装置100最终将给出相同的搜索结果。注意,正如上述,将所输入的待搜索关键字中不同的数字表示视为地名关系信息中不同的对等体来处理也是可以的。
在现实中还存在一种情况,即,输入的待搜索关键字中包含错别字,则通过基于“词形”的预处理可能会得到不正确的属性作为索引,因而获得不正确的地名搜索结果。为此,可以将预处理单元120配置成获取表示输入的待搜索关键字的字符串的拼音,通过基于“语音”的预处理得到正确属性作为索引,且搜索单元130通过该索引进行匹配处理,以找到相对应的地名及具体地址等目标项信息。例如,对于音译词“希尔顿酒店”,如果输入了“西尔盾”作为待搜索关键字,则通过基于“词形”的预处理无法找到正确的检索项并因此无法得到正确的地名搜索结果。在这种能够情况下,可以执行“错别字纠错”功能,即,预处理单元120通过汉语文本自动标注拼音的处理获得输入字符串“西尔盾”的“拼音”属性——全拼“xierdun”。则搜索单元130依然能够通过以该拼音属性作为索引,在与“希尔顿”相关的地名关系信息中找到与之匹配的全拼属性“全拼=xierdun”,并由此得到正确的地名“希尔顿”及其地址等目标项信息。需要注意,在这种错别字智能纠错功能中,需要所输入的错别字的拼音与正确的本字的拼音相同。
在上述的错别字智能纠错功能中,预处理单元120使用了汉语文本自动标注拼音的处理。这种处理是对汉语文本中的汉字进行自动的拼音标注。汉语文本自动标注拼音模型输入是汉语文本,通过调用外部分词器对句子进行分词,将分词后的汉语句子输入给拼音标注模块,再通过查找多音字词表和单字词规则文档对分好的词作拼音标注,输出是标注拼音的句子。文本拼音自动标注技术已广泛用于汉语教学、文字识别、文章阅读等技术领域。关于汉语文本自动标注拼音的处理的基本介绍,例如请参见代晓东所著的《中文文本文件的自动拼音标注》,软件世界,1996年8期。
上面描述了根据本发明的实施例的地名搜索装置100中所使用的地名关系信息库的结构和内容,并且描述了地名搜索装置100利用该地名关系信息库的相关数据以及所输入的待搜索关键字进行各种处理,通过在预处理后的待搜索关键字的属性与地名关系信息库中包含的与地名相关联的信息项的属性(例如语音的属性或词形的属性等)进行匹配,从而获得与待搜索关键字对应的、作为搜索目的地的地名及其目标项属性(例如与地名相应的地址,地名的类型以及与该地名邻近的地名等)。容易理解,地名搜索装置100所执行的上述各种处理实际上都是数据处理过程,并且,可根据实际情况来确定需要执行其中的哪些数据处理过程。在一种具体实施方式中,可以根据输入的待搜索关键字的特性而选择性地执行这些数据处理过程。例如,如果所输入的待搜索关键字是拼音(全拼或者简拼),则无需进行与词形的属性相对应的数据处理,而只执行与语音的属性相对应的数据处理即可。如果所输入的待搜索关键字是字符串(具有简称,全称,繁体等属性),则可以选择进行与词形的属性相对应的数据处理或者与语音的属性相对应的数据处理。如果选择进行与语音的属性相对应的数据处理,则预处理单元120需要预先对输入的字符串进行简拼全拼识别处理。作为可替选的实施方式,地名搜索装置100可执行的各种数据处理过程还与地名关系信息库的内容有关。例如,如果地名关系信息库不包含信息项“词形”,则不进行上述的与词形的属性相对应的数据处理。此外,地名搜索装置100还可以执行常规的地名搜索处理,例如对输入的待搜索关键字进行全字匹配等处理。这种全字匹配的处理在现有的地名搜索中是常用的技术,在此不再赘述。
根据本发明的实施例的地名搜索装置100在实际进行地名搜索时,上述的全字匹配处理、与词形的属性相对应的数据处理和与语音的属性相对应的数据处理之间的优先级可以任意选择,不必做特别的限定。类似地,在上述的错别字智能纠错功能中,对于相关数据处理的优先级也不做特别的限定。例如,可以先进行全字匹配,如果无法得到有效的搜索结果则进行错别字智能纠错功能。当然,也可以直接进行错别字智能纠错功能。而且,由于这种错别字智能纠错功能本质上类似上述的与语音的属性相对应的数据处理,因此,在预见到所输入的待搜索关键字可能存在错别字的情况下,也可将根据本发明的实施例的地名搜索装置100配置成直接使用与语音的属性相对应的数据处理,从而可避免使用全字匹配处理或与词形的属性相对应的数据处理而获得无效的搜索结果的情形。事实上,在上述各种类型的数据处理过程给系统所带来的数据处理负荷非常小的条件下,根据本发明实施例的地名搜索装置100所进行的数据处理的类型及其优先级可以根据实际需要进行任意地设置,而不必做特定的限制。
此外,根据本发明的实施例的地名搜索装置100还可以包括存储单元,用于将在前地名搜索的结果进行存储,以便在后续的地名搜索中输入与在前的地名搜索中相同的待搜索关键字的情况下,可从该存储单元中直接调取搜索结果而不必重新进行地名搜索,从而有助于进一步提高地名搜索的数据处理效率。容易理解,在此种情况下,该存储单元在功能上实际上相当于一个缓存单元。
本领域技术人员理解,可以通过各种方式来构建地名搜索装置100中所使用的地名关系信息库。作为一个示例,可以通过知识本体(Ontology)的形式来构建地名关系信息库。知识本体是形而上学的一个基本分支,现在除了在哲学,在图书馆学、人工智能、信息工程和语言学等的研究中也都广泛地运用本体论的知识。知识本体指的是在一个领域内,对一个范围内的概念和概念之间的关系用形式化的方法进行表示,是一种知识的组织、表现形式。这种表现形式是规范的、明确的、形式化的,可共享的。例如,在文献《本体论研究综述》(计算机研究与发展2004年第41卷第07期)中对其有详细的描述。如果用知识本体的形式来构建上述图2A所示出的地名关系信息库,则其中的地名、与所述地名相关联的信息项(例如语音及其属性,词形及其属性)、以及与所述地名相关联的目标项(例如与地名相应的地址、类型、邻近地名等)就是所述知识本体的各种概念。
此外,作为一个示例,所述地名关系信息库生成单元110可以根据地名关系信息库中包含的各种信息构建一种“倒排索引表(Inverted index)”,以供搜索单元130在进行地名搜索处理时使用。倒排索引表也常被称为反向索引,是一种索引方法,用来存储在全文搜索情况下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。以下给出一个具体例子:
以英文为例,下面是要被索引的文本:
ID4{人民代表大会}=ren min dai biao da hui
ID1{人民大学}=ren min da xue
ID10{北京大学}=bei jing da xue
就能得到下面的倒排索引:
“ren”:{ID4,ID1}
“min”:{ID4,ID1}
“dai”:    {ID4}
“biao”     {ID4}
“da”       {ID4,ID1,ID10}
“hui”      {ID4}
“xue”      {ID1,ID10}
“bei”      {ID10}
“jing”     {ID10}
如果输入“ren da”进行检索,则检索结果将对应以下这个集合:
{ID4,ID1}∩{ID4,ID1,ID10}={ID4,ID1}.
需要强调,上述这种利用倒排索引表实现的检索只是搜索单元130在进行地名搜索处理时使用的检索方法的一个具体例子,本领域技术人员理解,只要使得搜索单元130可以实现经过预处理的待搜索关键字的属性与地名关系信息库中相应属性之间的匹配,还可以使用各种适当的检索方法来执行搜索单元130的这种属性匹配处理,包括各种现有的搜索匹配方法,具体细节在此不再逐一描述。
本领域技术人员理解,上述地名搜索装置100中各个组成部件、单元和子单元可通过软件、硬件或其组合的方式进行配置。
下面结合图3描述根据本发明的另外的实施例的地名搜索方法。图3是示意性地示出了该地名搜索的方法的主要步骤的简化流程图。如图3所示,本实施例的地名搜索方法开始于步骤S300。在地名关系信息库生成步骤S310,生成作为搜索目的地的地名的地名关系信息库,该地名关系信息库包括地名、与所述地名相关联的信息项、以及与所述地名相关联的目标项。在预处理步骤S320,对输入的待搜索关键字进行预处理,以使得所述待搜索关键字的属性与所述信息项中至少一部分信息项的属性相同。在搜索步骤S330,利用经所述预处理步骤S320预处理后的待搜索关键字在所述地名关系信息库中进行搜索,以便通过预处理后的待搜索关键字的属性与所述至少一部分信息项的属性之间的匹配,获得与所输入的待搜索关键字相对应的地名及其目标项。
根据本发明该实施例的地名搜索方法可在上述的根据本发明的实施例的如图1示出的地名搜索装置100中执行,并可以根据上面针对地名搜索装置100所描述的各种数据处理过程中的方式来实现。具体细节不再逐一描述。
应当注意,根据本发明该实施例的地名搜索方法的各个操作和处理步骤的执行顺序不必限于图3中所示出的顺序。例如,虽然图3中示出地名关系信息库生成步骤S310在预处理步骤S320之前执行,但是,这两个步骤也可以并行地执行。如果预先了解到将要生成的地名关系信息库的形式和内容,则预处理步骤S320在地名关系信息库生成步骤S310实际执行之前进行亦无不可。此外,地名关系信息库生成步骤S310可以预先执行,也可以在实际进行地名搜索处理时实时地执行。简言之,只要能够完成根据本发明该实施例的地名搜索方法的各项处理以实现高效和准确的地名搜索,则对上述各个步骤的执行顺序不必做特别的限定。
在如图3所示的根据本发明的该实施例的地名搜索方法的一个实例中,在地名关系信息库生成步骤S310中生成的地名关系信息库中与地名相关联的信息项包括表示地名的字符串的语音,该语音的属性包括表示所述地名的字符串的全拼和/或简拼,表示所述地名的字符串的词义包括所述地名的地址、类型和邻近地名中的至少一种。在预处理步骤320中,对待搜索关键字标注拼音并将具有拼音形式的待搜索关键字的属性识别为全拼或简拼。然后,在搜索步骤330中,以经过拼音标注和识别的待搜索关键字作为索引,在所生成的地名关系信息库中具有与所述经过拼音标注和识别的待搜索关键字的属性相同属性的信息项中进行搜索以获得匹配的信息项,从而获得与该匹配的信息项相关联的地名,以及获得所述地名的地址、类型和邻近地名中的至少一种。
在如图3所示的根据本发明的该实施例的地名搜索方法的另一个实例中,在地名关系信息库生成步骤S310中生成的地名关系信息库中与地名相关联的信息项包括表示地名的字符串的词形,所述词形的属性包括所述地名的全称、简称、繁体、异体和对等体中的至少一种,表示所述地名的字符串的词义包括所述地名的地址、类型和邻近地名中的至少一种。在预处理步骤320中,对所输入的待搜索关键字进行分词和词性标注处理,以将待搜索关键字的属性识别为全称、简称、繁体、异体和对等体中的一种。然后,在搜索步骤330中,把经过分词和词性标注处理的待搜索关键字作为索引,在地名关系信息库中具有与所述经过分词和词性标注处理的待搜索字符串的属性相同属性的信息项中进行搜索以获得匹配的信息项,从而获得与所述匹配的信息项相关联的地名,以及获得所述地名的地址和类型中的至少一种。
在如图3所示的根据本发明的该实施例的地名搜索方法的又一个实例中,可以进行错别字纠错处理。具体而言,预处理步骤310在所输入的待搜索关键字表示希望搜索的地名的字符串的错误的字形、并且所输入的待搜索关键字与所述希望搜索的地名的字符串的语音相同的情况下,对该待搜索关键字进行拼音标注和识别处理。然后,在搜索步骤330中,把经过拼音标注和识别的待搜索关键字作为索引,在地名关系信息库中进行搜索以获得匹配的信息项,从而获得与所述匹配的信息项相关联的地名,以及获得所述地名的地址、类型和邻近地名中的至少一种。
在如图3所示的根据本发明的该实施例的地名搜索方法的其他实例中,预处理步骤310可以执行数字归一化处理,以便将所输入的待搜索关键字中的数字书写表示形式转换为与地名关系信息库的数字书写表示形式相一致,从而进一步提高地名搜索处理的效率,改善地名搜索的准确性。
此外,如图3所示的根据本发明的该实施例的地名搜索方法还可以包括输出步骤,用于输出搜索步骤S330的地名搜索结果。其中,该输出步骤可以缓存在前的地名搜索的结果,以便在后续的地名搜索中输入与在前的地名搜索中相同的待搜索关键字的情况下,直接从所缓存的地名搜索结果中获得相应的搜索结果而不再进行重复搜索。有助于提高地名搜索处理的效率。
不言而喻,在如图3所示的根据本发明的该实施例的地名搜索方法中,由地名关系信息库生成步骤S310生成的地名关系信息库的组织形式、内容等,都可以与上面结合图1描述的根据发明的实施例的地名搜索装置100中由地名关系信息库生成单元S110所生成的地名关系信息库相同或者类似,因此关于此的具体细节不再赘述。例如,也可以以知识本体的形式生成地名关系信息库,并根据地名关系信息库中的数据,构建以地名为索引项的倒排检索表以供检索。
根据本发明上述实施例的如图1所示的地名搜索装置100可配备于各种地理位置搜索和定位系统中,例如车用的GPS导航仪系统,或者地理位置测绘系统等。相应地,这些地理位置搜索和定位系统就可以执行根据本发明上述实施例的如图3所示的地名搜索方法。因此,这种地理位置搜索和定位系统也应该被认为包括在本发明的保护范围内。
例如,在利用上述这种车用GPS导航仪系统进行路线导航的情况下,可以利用导航仪系统本身具有的庞大数据库来生成地名关系信息库。在具体进行地名搜索的过程中,可将GPS导航仪系统的所有功能部件集成在本地,由此可在本地实现待搜索关键字的输入、地名搜索处理以及搜索结果的输出等。当然也可以只将GPS导航仪系统的输入输出功能部件等设置在本地,在本地实现待搜索关键字的输入以及搜索结果的输出,而在GPS导航仪系统的远程中心控制系统中实现地名搜索处理,并通过与本地输入输出设备进行的通信将地名搜索结果传送回本地,以指导车辆行驶。
此外,根据本发明上述实施例的地名搜索方法可以通过存储有机器可读取的指令代码的程序产品进来实现。这些指令代码由机器例如计算机读取并执行时,可执行根据本发明上述实施例的地名搜索方法的各个操作过程和步骤。该程序产品可以具有任意的表现形式,例如,目标程序、解释器执行的程序或者提供给操作系统的脚本程序等。
相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。所述存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒,以及其他适用于存储信息的介质等。
在上面对本发明具体实施例的描述中,针对一个附图或者一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
此外,本发明的方法不限于按照说明书中描述的时间顺序来执行,也可以按照其他的时间顺序地、并行地或独立地执行。因此,本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。
尽管上面已经通过对本发明的具体实施例的描述对本发明进行了披露,但是,应该理解,本领域的技术人员可在所附权利要求的精神和范围内设计对本发明的各种修改、改进或者等同物。这些修改、改进或者等同物也应当被认为包括在本发明的保护范围内。

Claims (20)

1.一种地名搜索装置,包括:
地名关系信息库生成单元,用于生成作为搜索目的地的地名的地名关系信息库,所述地名关系信息库包括地名、与所述地名相关联的信息项、以及与所述地名相关联的目标项;
预处理单元,用于对输入的待搜索关键字进行预处理,以使得所述待搜索关键字的属性与所述信息项中至少一部分信息项的属性相同;和
搜索单元,用于利用经所述预处理单元预处理后的待搜索关键字在所述地名关系信息库中进行搜索,以便通过所述预处理后的待搜索关键字的属性与所述至少一部分信息项的属性之间的匹配,获得与所述输入的待搜索关键字相对应的地名及其目标项。
2.如权利要求1所述的地名搜索装置,其中,与地名相关联的信息项包括表示所述地名的字符串的语音、词形、图像表示和话音表示中的至少一种,以及,与地名相关联的目标项包括表示所述地名的字符串的词义。
3.如权利要求2所述的地名搜索装置,其中,与地名相关联的信息项包括表示所述地名的字符串的语音,所述语音的属性包括表示所述地名的字符串的全拼和/或简拼,表示所述地名的字符串的词义包括所述地名的地址、类型和邻近地名中的至少一种,以及其中:
所述预处理单元被配置成对所述待搜索关键字标注拼音并将具有拼音形式的待搜索关键字的属性识别为全拼或简拼;以及
所述搜索单元被配置成以经过拼音标注和识别处理的待搜索关键字作为索引,在所述地名关系信息库中具有与所述经过拼音标注和识别处理的待搜索关键字的属性相同属性的信息项中进行搜索以获得匹配的信息项,从而获得与所述匹配的信息项相关联的地名,以及获得所述地名的地址、类型和邻近地名中的至少一种。
4.如权利要求2或3所述的地名搜索装置,其中,与地名相关联的信息项包括表示所述地名的字符串的词形,所述词形的属性包括所述地名的全称、简称、繁体、异体和对等体中的至少一种,表示所述地名的字符串的词义包括所述地名的地址、类型和邻近地名中的至少一种,以及其中:
所述预处理单元被配置成对所述待搜索关键字进行分词和词性标注处理,以将待搜索关键字的属性识别为全称、简称、繁体、异体和对等体中的一种;以及
所述搜索单元被配置成把经过分词和词性标注处理的待搜索关键字作为索引,在所述地名关系信息库中具有与所述经过分词和词性标注处理的待搜索字符串的属性相同属性的信息项中进行搜索以获得匹配的信息项,从而获得与所述匹配的信息项相关联的地名,以及获得所述地名的地址和类型中的至少一种。
5.如权利要求3或4所述的地名搜索装置,其中:
所述预处理单元被配置成在所述输入的待搜索关键字表示希望搜索的地名的字符串的错误的字形的情况下,对所述待搜索关键字进行拼音标注和识别处理,其中,所述输入的待搜索关键字与所述希望搜索的地名的字符串的语音相同;以及
所述搜索单元被配置成把经过拼音标注和识别的待搜索关键字作为索引,在所述地名关系信息库中进行搜索以获得匹配的信息项,从而获得与所述匹配的信息项相关联的地名以及所述地名的地址、类型和邻近地名中的至少一种。
6.如权利要求1-5中任一项所述的地名搜索装置,其中,所述预处理单元被配置成将所述输入的待搜索关键字中的数字书写表示形式转换为与所述地名关系信息库的数字书写表示形式相一致,以便实现数字归一化处理。
7.如权利要求1-6中任一项所述的地名搜索装置,其中,所述与地名相关联的信息项中的临近地名包括与所述地名相距特定距离的范围内的至少一个其他地名以及与所述至少一个其他地名相关联的信息项和/或目标项,以便从中选择与所述地名不同的其他感兴趣的地名及其信息项和/或目标项。
8.如权利要求1-7中任一项所述的地名搜索装置,还包括输出单元,用于输出所述搜索单元的搜索结果,其中,所述输出单元被配置成缓存在前的地名搜索的结果,以便在后续的地名搜索中输入与所述在前的地名搜索中相同的待搜索关键字的情况下,直接从所缓存的地名搜索结果中获得相应的搜索结果而不再进行重复搜索。
9.如权利要求1-8中任一项所述的地名搜索装置,其中,所述地名关系信息库生成单元以知识本体的形式产生所述地名关系信息库,其中所述地名、与所述地名相关联的信息项、以及与所述地名相关联的目标项作为所述知识本体的各种概念,以及,所述地名关系信息库包括以所述地名为索引项构建的倒排检索表。
10.一种地名搜索方法,包括:
地名关系信息库生成步骤,用于生成作为搜索目的地的地名的地名关系信息库,所述地名关系信息库包括地名、与所述地名相关联的信息项、以及与所述地名相关联的目标项;
预处理步骤,用于对输入的待搜索关键字进行预处理,以使得所述待搜索关键字的属性与所述信息项中至少一部分信息项的属性相同;和
搜索步骤,用于利用经所述预处理步骤预处理后的待搜索关键字在所述地名关系信息库中进行搜索,以便通过所述预处理后的待搜索关键字的属性与所述至少一部分信息项的属性之间的匹配,获得与所述输入的待搜索关键字相对应的地名及其目标项。
11.如权利要求10所述的地名搜索方法,其中,与地名相关联的信息项包括表示所述地名的字符串的语音、词形、图像表示和话音表示中的至少一种,以及,与地名相关联的目标项包括表示所述地名的字符串的词义。
12.如权利要求11所述的地名搜索方法,其中,与地名相关联的信息项包括表示所述地名的字符串的语音,所述语音的属性包括表示所述地名的字符串的全拼和/或简拼,表示所述地名的字符串的词义包括所述地名的地址、类型和邻近地名中的至少一种,以及其中:
所述预处理步骤包括对所述待搜索关键字标注拼音并将具有拼音形式的待搜索关键字的属性识别为全拼或简拼;以及
所述搜索步骤包括以经过拼音标注和识别的待搜索关键字作为索引,在所述地名关系信息库中具有与所述经过拼音标注和识别的待搜索关键字的属性相同属性的信息项中进行搜索以获得匹配的信息项,从而获得与所述匹配的信息项相关联的地名,以及获得所述地名的地址、类型和邻近地名中的至少一种。
13.如权利要求11或12所述的地名搜索方法,其中,与地名相关联的信息项包括表示所述地名的字符串的词形,所述词形的属性包括所述地名的全称、简称、繁体、异体和对等体中的至少一种,表示所述地名的字符串的词义包括所述地名的地址、类型和邻近地名中的至少一种,以及其中:
所述预处理步骤包括对所述待搜索关键字进行分词和词性标注处理,以将待搜索关键字的属性识别为全称、简称、繁体、异体和对等体中的一种;以及
所述搜索步骤包括把经过分词和词性标注处理的待搜索关键字作为索引,在所述地名关系信息库中具有与所述经过分词和词性标注处理的待搜索字符串的属性相同属性的信息项中进行搜索以获得匹配的信息项,从而获得与所述匹配的信息项相关联的地名,以及获得所述地名的地址和类型中的至少一种。
14.如权利要求12或13所述的地名搜索方法,其中:
所述预处理步骤包括在所述输入的待搜索关键字表示希望搜索的地名的字符串的错误的字形的情况下,对所述待搜索关键字进行拼音标注和识别处理,其中,所述输入的待搜索关键字与所述希望搜索的地名的字符串的语音相同;以及
所述搜索步骤包括把经过拼音标注和识别的待搜索关键字作为索引,在所述地名关系信息库中进行搜索以获得匹配的信息项,从而获得与所述匹配的信息项相关联的地名,以及获得所述地名的地址、类型和邻近地名中的至少一种。
15.如权利要求10-14中任一项所述的地名搜索方法,其中,所述预处理步骤包括将所述输入的待搜索关键字中的数字书写表示形式转换为与所述地名关系信息库的数字书写表示形式相一致,以便实现数字归一化处理。
16.如权利要求10-15中任一项所述的地名搜索方法,其中,所述与地名相关联的信息项中的临近地名包括与所述地名相距特定距离的范围内的至少一个其他地名以及与所述至少一个其他地名相关联的信息项和/或目标项,以便从中选择与所述地名不同的其他感兴趣的地名及其信息项和/或目标项。
17.如权利要求10-16中任一项所述的地名搜索方法,还包括输出步骤,用于输出所述搜索步骤的搜索结果,其中,所述输出步骤包括缓存在前的地名搜索的结果,以便在后续的地名搜索中输入与所述在前的地名搜索中相同的待搜索关键字的情况下,直接从所缓存的地名搜索结果中获得相应的搜索结果而不再进行重复搜索。
18.如权利要求10-17中任一项所述的地名搜索方法,其中,所述地名关系信息库生成步骤以知识本体的形式产生所述地名关系信息库,其中所述地名、与所述地名相关联的信息项、以及与所述地名相关联的目标项作为所述知识本体的各种概念,以及,所述地名关系信息库包括以所述地名为索引项构建的倒排检索表。
19.一种具有如上述权利要求1-9中任一项所述的地名搜索装置的车用GPS导航仪或者地理位置测绘系统。
20.一种存储有机器可读取的指令代码的程序产品,所述指令代码由机器读取并执行时,可执行如权利要求10-18中任何一项所述的地名搜索方法。
CN200910129465.6A 2009-03-20 2009-03-20 地名搜索装置和系统 Expired - Fee Related CN101840406B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910129465.6A CN101840406B (zh) 2009-03-20 2009-03-20 地名搜索装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910129465.6A CN101840406B (zh) 2009-03-20 2009-03-20 地名搜索装置和系统

Publications (2)

Publication Number Publication Date
CN101840406A true CN101840406A (zh) 2010-09-22
CN101840406B CN101840406B (zh) 2015-10-14

Family

ID=42743782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910129465.6A Expired - Fee Related CN101840406B (zh) 2009-03-20 2009-03-20 地名搜索装置和系统

Country Status (1)

Country Link
CN (1) CN101840406B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102456055A (zh) * 2010-10-28 2012-05-16 腾讯科技(深圳)有限公司 兴趣点检索的方法及装置
CN103020084A (zh) * 2011-09-23 2013-04-03 联想(北京)有限公司 一种数据显示方法、装置及电子设备
CN103473238A (zh) * 2012-06-08 2013-12-25 纽海信息技术(上海)有限公司 配送地址定位系统及方法
CN103714081A (zh) * 2012-09-29 2014-04-09 北京百度网讯科技有限公司 一种专有地名的识别方法和装置
CN103970911A (zh) * 2014-05-28 2014-08-06 苏州数字地图网络科技有限公司 一种基于地名库的智能分词查询方法及系统
CN104537044A (zh) * 2014-12-23 2015-04-22 北京奇虎科技有限公司 一种基于分词确定是否显示电子地图的方法与系统
CN105701133A (zh) * 2014-11-28 2016-06-22 方正国际软件(北京)有限公司 一种地址输入的方法和设备
CN105718596A (zh) * 2016-02-24 2016-06-29 杨晟志 一种基于名人搜索的商业地图
CN105868359A (zh) * 2016-03-29 2016-08-17 重庆中陆承大科技有限公司 一种地址信息管控方法及系统
CN105975099A (zh) * 2016-04-28 2016-09-28 百度在线网络技术(北京)有限公司 输入法的实现方法和装置
CN106326233A (zh) * 2015-06-18 2017-01-11 阿里巴巴集团控股有限公司 地址提示方法及装置
CN106503033A (zh) * 2016-09-14 2017-03-15 国网山东省电力公司青岛供电公司 一种配电网工单地址的检索方法和装置
CN107273533A (zh) * 2017-06-29 2017-10-20 武汉楚鼎信息技术有限公司 一种全码表多维数组交叉搜索方法及装置
CN107566980A (zh) * 2017-10-27 2018-01-09 努比亚技术有限公司 一种移动终端的定位方法和移动终端
CN108292204A (zh) * 2015-11-24 2018-07-17 环联公司 用于自动地址验证的系统及方法
CN109213777A (zh) * 2017-06-29 2019-01-15 杭州九阳小家电有限公司 一种基于语音的食谱处理方法及系统
WO2020037794A1 (zh) * 2018-08-20 2020-02-27 南京师范大学 一种英文地名的索引建立方法及其查询方法和装置
CN111324679A (zh) * 2018-12-14 2020-06-23 阿里巴巴集团控股有限公司 地址信息的处理方法、装置和系统
CN111723164A (zh) * 2019-03-18 2020-09-29 阿里巴巴集团控股有限公司 地址信息的处理方法和装置
CN112015865A (zh) * 2020-08-26 2020-12-01 京北方信息技术股份有限公司 基于分词的全称匹配搜索方法、装置、设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100562713C (zh) * 2006-08-25 2009-11-25 高德软件有限公司 电子导航系统的信息检索方法及装置
CN100478960C (zh) * 2007-08-21 2009-04-15 北京大学 一种网络地图服务中未登录地名的定位方法

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102456055A (zh) * 2010-10-28 2012-05-16 腾讯科技(深圳)有限公司 兴趣点检索的方法及装置
CN103020084A (zh) * 2011-09-23 2013-04-03 联想(北京)有限公司 一种数据显示方法、装置及电子设备
CN103473238A (zh) * 2012-06-08 2013-12-25 纽海信息技术(上海)有限公司 配送地址定位系统及方法
CN103714081A (zh) * 2012-09-29 2014-04-09 北京百度网讯科技有限公司 一种专有地名的识别方法和装置
CN103970911A (zh) * 2014-05-28 2014-08-06 苏州数字地图网络科技有限公司 一种基于地名库的智能分词查询方法及系统
CN105701133A (zh) * 2014-11-28 2016-06-22 方正国际软件(北京)有限公司 一种地址输入的方法和设备
CN105701133B (zh) * 2014-11-28 2021-03-30 方正国际软件(北京)有限公司 一种地址输入的方法和设备
CN104537044A (zh) * 2014-12-23 2015-04-22 北京奇虎科技有限公司 一种基于分词确定是否显示电子地图的方法与系统
CN106326233A (zh) * 2015-06-18 2017-01-11 阿里巴巴集团控股有限公司 地址提示方法及装置
CN106326233B (zh) * 2015-06-18 2019-10-11 菜鸟智能物流控股有限公司 地址提示方法及装置
CN108292204B (zh) * 2015-11-24 2023-05-23 环联公司 用于自动地址验证的系统及方法
CN108292204A (zh) * 2015-11-24 2018-07-17 环联公司 用于自动地址验证的系统及方法
CN105718596A (zh) * 2016-02-24 2016-06-29 杨晟志 一种基于名人搜索的商业地图
CN105868359A (zh) * 2016-03-29 2016-08-17 重庆中陆承大科技有限公司 一种地址信息管控方法及系统
CN105975099A (zh) * 2016-04-28 2016-09-28 百度在线网络技术(北京)有限公司 输入法的实现方法和装置
CN106503033A (zh) * 2016-09-14 2017-03-15 国网山东省电力公司青岛供电公司 一种配电网工单地址的检索方法和装置
CN107273533A (zh) * 2017-06-29 2017-10-20 武汉楚鼎信息技术有限公司 一种全码表多维数组交叉搜索方法及装置
CN109213777A (zh) * 2017-06-29 2019-01-15 杭州九阳小家电有限公司 一种基于语音的食谱处理方法及系统
CN107566980A (zh) * 2017-10-27 2018-01-09 努比亚技术有限公司 一种移动终端的定位方法和移动终端
WO2020037794A1 (zh) * 2018-08-20 2020-02-27 南京师范大学 一种英文地名的索引建立方法及其查询方法和装置
CN111324679A (zh) * 2018-12-14 2020-06-23 阿里巴巴集团控股有限公司 地址信息的处理方法、装置和系统
CN111324679B (zh) * 2018-12-14 2023-04-11 阿里巴巴集团控股有限公司 地址信息的处理方法、装置和系统
CN111723164A (zh) * 2019-03-18 2020-09-29 阿里巴巴集团控股有限公司 地址信息的处理方法和装置
CN111723164B (zh) * 2019-03-18 2023-12-12 阿里巴巴集团控股有限公司 地址信息的处理方法和装置
CN112015865A (zh) * 2020-08-26 2020-12-01 京北方信息技术股份有限公司 基于分词的全称匹配搜索方法、装置、设备及存储介质
CN112015865B (zh) * 2020-08-26 2023-09-26 京北方信息技术股份有限公司 基于分词的全称匹配搜索方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN101840406B (zh) 2015-10-14

Similar Documents

Publication Publication Date Title
CN101840406B (zh) 地名搜索装置和系统
US7979268B2 (en) String matching method and system and computer-readable recording medium storing the string matching method
US9519643B1 (en) Machine map label translation
US20100185670A1 (en) Mining transliterations for out-of-vocabulary query terms
Zhang et al. Rule-based extraction of spatial relations in natural language text
CN111259262A (zh) 一种信息检索方法、装置、设备及介质
CN114091454A (zh) 一种互联网文本中地名信息提取及空间定位方法
Misu et al. Speech-based interactive information guidance system using question-answering technique
CN116662583B (zh) 一种文本生成方法、地点检索方法及相关装置
CN103164398A (zh) 汉维电子辞典及其自动转译汉维语的方法
Lahbari et al. A rule-based method for Arabic question classification
Feng Evolution and present situation of corpus research in China
US10614065B2 (en) Controlling search execution time for voice input facility searching
Singh Bidirectional bengali script and meetei mayek transliteration of web based manipuri news corpus
Joshi et al. Crosslingual location search
KR20070104084A (ko) 한국한자음을 이용하여 일본어 사전을 검색하는 방법 및 그시스템
Liu Automatic identification of locative expressions from informal text
Kaufman et al. Evaluation of Digital Nautical Chart data for confirmation and expansion of GeoNames data
CN101539428A (zh) 导航系统中拼音加声调检索的方法及装置
Doll Korean Rŏmaniz’atiŏn: Is It Finally Time for The Library Of Congress to Stop Promoting Mccune-Reischauer and Adopt the Revised Romanization Scheme?
Tarish et al. Text correction algorithms for correct grammar and lex-ical errors in the English language
Nugumanova et al. Developing a Kazakh question-answering model: standing on the shoulders of multilingual giants
Prosser Digital Philology in the Ras Shamra Tablet Inventory Project: Text Curation through Computational Intelligence
Yamashita et al. A Comparison of Entity Matching Methods between English and Japanese Katakana
Popovych et al. Ukrainian Redaction of Church Slavonic (URCS): Needs for Digitalization and Text Corpora Platform Generation. Part I.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20151014

Termination date: 20180320