CN106959958B - 地图兴趣点简称获取方法和装置 - Google Patents

地图兴趣点简称获取方法和装置 Download PDF

Info

Publication number
CN106959958B
CN106959958B CN201610015852.7A CN201610015852A CN106959958B CN 106959958 B CN106959958 B CN 106959958B CN 201610015852 A CN201610015852 A CN 201610015852A CN 106959958 B CN106959958 B CN 106959958B
Authority
CN
China
Prior art keywords
interest point
name
word
evaluated
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610015852.7A
Other languages
English (en)
Other versions
CN106959958A (zh
Inventor
钟观海
李辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610015852.7A priority Critical patent/CN106959958B/zh
Priority to TW105142522A priority patent/TWI661317B/zh
Priority to EP17738076.3A priority patent/EP3404559A4/en
Priority to KR1020187022277A priority patent/KR102157428B1/ko
Priority to SG11201805938XA priority patent/SG11201805938XA/en
Priority to PCT/CN2017/000018 priority patent/WO2017121262A1/zh
Priority to MYPI2018702412A priority patent/MY192478A/en
Priority to JP2018554614A priority patent/JP6877464B2/ja
Publication of CN106959958A publication Critical patent/CN106959958A/zh
Priority to US16/031,507 priority patent/US10816355B2/en
Priority to PH12018501475A priority patent/PH12018501475A1/en
Application granted granted Critical
Publication of CN106959958B publication Critical patent/CN106959958B/zh
Priority to US17/080,357 priority patent/US11255690B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3679Retrieval, searching and output of POI information, e.g. hotels, restaurants, shops, filling stations, parking facilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Radar, Positioning & Navigation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Instructional Devices (AREA)
  • Navigation (AREA)

Abstract

本公开是关于一种地图兴趣点简称获取方法和装置,其中方法包括:根据地图兴趣点的兴趣点全称,生成多个待评估简称;在距离所述兴趣点的预设范围内,获取含有所述兴趣点全称或者任一待评估简称的多个地址名称;根据所述地址名称,计算目标词的词状态向量,所述词状态向量用于表示所述目标词在所述地址名称中的位置状态,所述目标词是所述兴趣点全称或者任一所述待评估简称;分别计算所述兴趣点全称的词状态向量与任一待评估简称的词状态向量之间的相似度;将高于预设阈值的相似度对应的待评估简称,确定为所述兴趣点全称对应的兴趣点简称。本公开提高了地图兴趣点简称的获取效率。

Description

地图兴趣点简称获取方法和装置
技术领域
本公开涉及计算机技术,尤其涉及一种地图兴趣点简称获取方法和装置。
背景技术
地图兴趣点即POI(Point of Interest),例如,一个POI可以是一栋房子、一个商铺、一座学校、一个公交站等。当在地图中搜索某个POI时,利用该POI的简称进行搜索也是一种常用的搜索方式,例如,当在地图中搜索查找“北京师范大学”时,也可以输入该北京师范大学的简称“北师大”进行搜索,也可以找到该大学在地图中所处的位置。因此,为了支持这种利用POI简称进行搜索的方式,需要获取一些POI全称对应的简称,建立全称与简称的对应关系,这样才能根据地图用户输入的简称准确确定对应的全称,并反馈用户搜索的目标地址给用户。相关技术中,兴趣点的简称通常是由人工标注得到,但是这种方式的人工工作量较大,效率也较低,当地图数据量逐渐增大时,人工标注方式的低效率问题将更加显著。
发明内容
为克服相关技术中存在的问题,本公开提供一种地图兴趣点简称获取方法和装置,以提高地图兴趣点简称的获取效率。
根据本公开实施例的第一方面,提供一种地图兴趣点简称获取方法,包括:
根据地图兴趣点的兴趣点全称,生成多个待评估简称;
在距离所述兴趣点的预设范围内,获取含有所述兴趣点全称或者任一待评估简称的多个地址名称;
根据所述地址名称,计算目标词的词状态向量,所述词状态向量用于表示所述目标词在所述地址名称中的位置状态,所述目标词是所述兴趣点全称或者任一所述待评估简称;
分别计算所述兴趣点全称的词状态向量与任一待评估简称的词状态向量之间的相似度;
将高于预设阈值的相似度对应的待评估简称,确定为所述兴趣点全称对应的兴趣点简称。
根据本公开实施例的第二方面,提供一种地图兴趣点简称获取装置,包括:
评估简称生成模块,用于根据地图兴趣点的兴趣点全称,生成多个待评估简称;
相关地址获取模块,用于在距离所述兴趣点的预设范围内,获取含有所述兴趣点全称或者任一待评估简称的多个地址名称;
词状态计算模块,用于根据所述地址名称,分别计算目标词的词状态向量,所述词状态向量用于表示所述目标词在所述地址名称中的位置状态,所述目标词是所述兴趣点全称或者任一所述待评估简称;
相似度计算模块,用于分别计算所述兴趣点全称的词状态向量与任一待评估简称的词状态向量之间的相似度;
简称确定模块,用于将高于预设阈值的相似度对应的待评估简称,确定为所述兴趣点全称对应的兴趣点简称。
本公开的实施例提供的技术方案可以包括以下有益效果:通过在给出一个兴趣点的兴趣点全称时,利用该方法,可以自动从地图地址库中获取该兴趣点附近的相关地址名称,并根据该地址名称计算出所有可能的待评估简称中,哪一个简称有可能是全称的简称,从而自动完成简称的确定,使得简称获取的效率提高,提高了地图兴趣点简称的获取效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的兴趣点简称获取方法的流程图;
图2是根据一示例性实施例示出的二维空间余弦相似度的计算原理图;
图3是根据一示例性实施例示出的一种地图兴趣点简称获取装置。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
本申请实施例提供了一种地图兴趣点简称获取方法,该方法是一种根据兴趣点全称自动获取对应简称的方案,不再需要借助人工标注,以提高简称获取的效率。
该简称获取方法是基于如下原理:兴趣点POI在用于地址名称的命名时,不论全称还是简称,在地址名称中的位置状态应该一致,并且全称和简称通常在同一地点或相近地理位置附近使用。
例如,以兴趣点是一个学校为例,假设该学校的全称是北京师范大学,那么,通常在大学内部或者大学的周边会有很多使用学校名称的地址名称,比如,北京师范大学食堂、北师大书店、北京师范宿舍楼A区、北师教研室等(需要说明的是,以上名称只是为了举例说明本申请的方案,实际中可能不存在)。可以看到,有的地址名称中使用了全称,例如,北京师范大学食堂中的“北京师范大学”;有的地址名称中使用了简称,例如,北师大书店中的“北师大”,北师教研室中的“北师”。
上述的例子即是将兴趣点POI的全称或者简称,应用于某个地址名称中,并且,全称和简称在应用时满足上面提到的两个方面的一致性:
第一、在同一地点或相近地理位置附近使用。例如,北京师范大学食堂、北师大书店、北京师范宿舍楼A区等,这些地址都是在北京师范大学的学校内部或者学校周边。
第二、全称和简称在详细地址字符串中的位置状态基本一致。例如,以“北京师范大学”为例,对于其简称“北师大”,如果存在某一详细地址字符串是这样描述的:“北京市新街口外大街19号北京师范大学图书馆”,则地址库中也会存在较大的可能出现这样描述的地址字符串“北京市新街口外大街19号北师大图书馆”,或者是类似的“北京新街口外大街北师大图书馆”这样的字符串,这表明POI的全称和简称对在地址库中出现的位置状态是基本一致的,也可称为上下文环境基本一致。
例如,对于大规模的地址文本库,一对全称和简称,有可能出现相同的前后词,比如,在上面的例子的地址库中,全称“北京师范大学”和对应的简称“北师大”,前后词都出现了“新街口外大街”和“图书馆”。以一对全称和简称的前后词包括“食堂”、“图书馆”和“教学楼”为例,这些词可以组成一个向量{食堂、图书馆、教学楼},每个词是该向量的一个维度。
表1全简称对应的向量维度
Figure BDA0000904479750000041
如上表1的示例,在包含全称的详细地址字符串中,“食堂”出现了117次,在包含简称的详细地址字符串中,“食堂”出现了32次;同样对于全称和简称,“图书馆”分别出现267次、71次,“教学楼”分别出现422次、112次,可以看到,这三个维度的出现次数基本上是等比例的。即对于全称“北京师范大学”,其对应的向量是{117、267、422},对于简称“北师大”,其对应的向量是{32、71、112},如果计算这两个向量的余弦相似度,可以得知该余弦值是一个非常接近于1的值。
基于以上原理,本申请兴趣点简称获取方法的流程可以参见图1,包括:
在步骤101中,根据地图兴趣点的兴趣点全称,生成多个待评估简称。
本步骤可以将兴趣点全称中包括的各个单字,按照单字排列顺序进行任意单字数量的组合,每一组合为一个简称,得到多个简称。
例如,仍以“北京师范大学”为例,该全称中包括六个单字,分别为“北”、“京”、“师”、“范”、“大”、“学”;然后将这些单字进行任意单字数量的组合,当单字数量为2时,即两个单字进行组合,例如,“北京”、“京师”、“师范”、“范大”、“大学”、“北师”、“北范”等,并且可以看到,在组合时按照各个单字在全称中的排列顺序进行组合,即组合中的各个单字的前后顺序与在全称中的前后顺序一致。当单字数量为3时,即三个单字进行组合,例如,“北京师”、“京师范”、“北师范”等。
再进行任意组合得到多个简称后,还可以从多个简称中剔除单字和确认非兴趣点简称的噪声词,剩余的简称即待评估简称,这样使得参与后续处理步骤的待评估简称的数量得到减少,有助于提高该流程的处理效率。单字即上述的“北”、“京”、“师”等,噪声词例如包括:“北京”、“师范”、“大学”等,这些常用词通常不可能被用户作为北京师范大学的简称输入。
在步骤102中,在距离兴趣点的预设范围内,获取含有兴趣点全称或者任一待评估简称的多个地址名称。
例如,预设范围可以是兴趣点附近500米内,比如上面列举的北京师范大学食堂、北师大书店、北京师范宿舍楼A区、北师教研室等,这些地址名称中要么含有兴趣点全称“北京师范大学”,要么含有待评估简称,例如“北师大”,该待评估简称即为在步骤101中确定的地图兴趣点的待评估简称。
在步骤103中,根据地址名称,计算目标词的词状态向量,词状态向量用于表示目标词在地址名称中的位置状态,目标词是兴趣点全称或者任一待评估简称。
本步骤中计算的词状态向量,可以是一个高维向量,比如,可以是n维向量(A1,A2,…..An);并且,兴趣点全称或者任一待评估简称中的每一个都可以计算得到一个对应的词状态向量,比如,全称“北京师范大学”对应的词状态向量是(A1,A2,…..An),其中一个待评估简称“北师大”对应的词状态向量是(B1,B2,…..Bn)。
词状态向量的计算,可以结合在步骤102中获取的多个地址名称来进行,并且,兴趣点全称和待评估简称的词状态向量的计算方法是相同的。如果将兴趣点全称或任一待评估简称称为目标词,那么其中一个目标词的词状态向量可以按照如下方式计算:
在步骤102获取的地址名称可以有多个,例如,北师大书店、北师教研室等,对于某个目标词,比如,该目标词是“北师大”,查找哪些地址名称中包含了“北师大”,例如“北师大书店”,可能有多个地址名称中都包含该目标词。对于每一个包含目标词的地址名称,获取目标词的相邻词,该相邻词包括前一个词和后一个词。
例如,在包含目标词“北师大”的地址名称“北师大书店”中,目标词的前一个词是“空”(即前面没有词),后一个词是“书店”。又例如,在包含目标词“北师大”的地址名称“博文北师大书房”中,目标词的前一个词是“博文”,后一个词是“书房”。经过统计后,所有包含目标词的地址名称中,目标词的相邻词可以有多个,例如上述列举的“空”、“书店”、“博文”、“书房”,假设只有这四个相邻词(实际可能更多),那么该四个词可以分别对应目标词的词状态向量的一个向量维度,该向量(空、书店、博文、书房)是一个四维向量。
每一个向量维度的维度数值,可以是对应该维度的词在所有地址名称中的出现频率,例如,以“书店”为例,假设在步骤102中获取的地址名称共有10个,而“书店”出现了2次,那么“书店”的出现频率是2。其他维度的维度数值计算同理,不再描述。
在步骤104中,分别计算兴趣点全称的词状态向量与任一待评估简称的词状态向量之间的相似度。
例如,在步骤103中计算出兴趣点全称的词状态向量、以及任一个待评估简称的词状态向量后,将兴趣点全称的词状态向量分别与各个待评估简称的词状态向量计算相似度,本例子计算的相似度可以是余弦相似度。
参见图2所示,示例了二维空间的余弦相似度的计算,a、b是两个二维向量,并假设a的坐标是(x1,y1),b的坐标是(x2,y2)。将这两个向量根据坐标值绘制到向量空间中即图2。然后计算a、b这两个二维向量的夹角对应的余弦值,此余弦值就可以用来表征这两个向量的相似性,如果两个向量越相似,它们的夹角越小,余弦值越接近1,它们的方向更加吻合。
根据向量点积公式,夹角余弦值计算如下:
Figure BDA0000904479750000071
将上述公式扩展到多维向量的余弦相似度的计算,如果兴趣点全称的词状态向量A=(A1,A2,...,An),其中一个待评估简称的词状态向量B=(B1,B2,...,Bn),那么这两个向量的余弦相似度计算如下:
Figure BDA0000904479750000072
在步骤105中,将高于预设阈值的相似度对应的待评估简称,确定为兴趣点全称对应的兴趣点简称。
例如,如果将预设阈值设为0.42,那么经过计算的余弦相似度的数值大于或等于该0.42时,就可以将相似度对应的待评估简称确定为兴趣点全称对应的兴趣点简称。比如,如果兴趣点全称“北京师范大学”的词状态向量A与其中一个待评估简称“北师大”的词状态向量B的余弦相似度是0.7,那么可以确定将待评估简称“北师大”作为全称“北京师范大学”的简称。
本例子中,高于预设阈值的待评估简称的数量为至少一个,比如,全称“北京师范大学”的简称可以包括“北师大”、“北师”、“北京师范”等多个简称。
上述的地图兴趣点简称获取方法,当给出一个兴趣点的兴趣点全称时,利用该方法,可以自动从地图地址库中获取该兴趣点附近的相关地址名称,并根据该地址名称计算出所有可能的待评估简称中,哪一个简称有可能是全称的简称,从而自动完成简称的确定,使得简称获取的效率提高。此外,可以将该方法的执行布置到分布式计算平台处理,以进一步提高处理速度。
在确定兴趣点的全称与简称的对应关系后,可以将该对应关系应用到地图兴趣点的搜索中,或者应用到其他涉及到地址输入的场景。例如,用户输入“东外大街”时,通过全简称对比可知,“东外大街”的全称为“东直门外大街”,则可提醒用户“您要输入的是否是东直门大街?”,而且在地址自动联想填充中,把相关的全称东直门外大街的后续可能的详细地址提供给用户选择,比如位于东直门外大街附近的餐馆、酒店等地址。
本申请实施例还提供了一种地图兴趣点简称获取装置,如图3所示,该装置可以包括:评估简称生成模块31、相关地址获取模块32、词状态计算模块33、相似度计算模块34和简称确定模块35。其中,
评估简称生成模块31,用于根据地图兴趣点的兴趣点全称,生成多个待评估简称;
相关地址获取模块32,用于在距离所述兴趣点的预设范围内,获取含有所述兴趣点全称或者任一待评估简称的多个地址名称;
词状态计算模块33,用于根据所述地址名称,分别计算目标词的词状态向量,所述词状态向量用于表示所述目标词在所述地址名称中的位置状态,所述目标词是所述兴趣点全称或者任一所述待评估简称;
相似度计算模块34,用于分别计算所述兴趣点全称的词状态向量与任一待评估简称的词状态向量之间的相似度;
简称确定模块35,用于将高于预设阈值的相似度对应的待评估简称,确定为所述兴趣点全称对应的兴趣点简称。
一个例子中,评估简称生成模块31,在用于根据地图兴趣点的兴趣点全称生成多个待评估简称时,包括:将所述兴趣点全称中包括的各个单字,按照单字排列顺序进行任意单字数量的组合,每一组合为一个简称,得到多个所述简称;从多个简称中剔除单字和确定是非兴趣点简称的噪声词,剩余的简称即所述待评估简称。
一个例子中,词状态计算模块33,在用于根据地址名称计算目标词的词状态向量时,包括:在所述多个地址名称中,获取目标词在任一地址名称中的相邻词;每个所述相邻词在所述多个地址名称中的出现频率,作为所述目标词的词状态向量中的其中一个向量维度的维度数值。
一个例子中,相似度计算模块34,用于计算所述兴趣点全称的词状态向量与任一待评估简称的词状态向量之间的余弦相似度。
一个例子中,高于预设阈值的相似度对应的待评估简称数量为至少一个。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (8)

1.一种地图兴趣点简称获取方法,其特征在于,包括:
根据地图兴趣点的兴趣点全称,生成多个待评估简称;
在距离所述兴趣点的预设范围内,获取含有所述兴趣点全称或者任一待评估简称的多个地址名称;
根据所述地址名称,计算目标词的词状态向量,所述词状态向量用于表示所述目标词在所述地址名称中的位置状态,所述目标词是所述兴趣点全称或者任一所述待评估简称;
分别计算所述兴趣点全称的词状态向量与任一待评估简称的词状态向量之间的相似度;
将高于预设阈值的相似度对应的待评估简称,确定为所述兴趣点全称对应的兴趣点简称;
所述根据地图兴趣点的兴趣点全称,生成多个待评估简称,包括:
将所述兴趣点全称中包括的各个单字,按照单字排列顺序进行任意单字数量的组合,每一组合为一个简称,得到多个所述简称;
从多个简称中剔除单字和确定是非兴趣点简称的噪声词,剩余的简称即所述待评估简称。
2.根据权利要求1所述的方法,其特征在于,所述根据地址名称,计算目标词的词状态向量,所述词状态向量用于表示所述目标词在所述地址名称中的位置状态,包括:
在所述多个地址名称中,获取目标词在任一地址名称中的相邻词;
每个所述相邻词在所述多个地址名称中的出现频率,作为所述目标词的词状态向量中的其中一个向量维度的维度数值。
3.根据权利要求1所述的方法,其特征在于,所述计算兴趣点全称的词状态向量与任一待评估简称的词状态向量之间的相似度,包括:
计算所述兴趣点全称的词状态向量与任一待评估简称的词状态向量之间的余弦相似度。
4.根据权利要求1所述的方法,其特征在于,所述高于预设阈值的相似度对应的待评估简称的数量为至少一个。
5.一种地图兴趣点简称获取装置,其特征在于,包括:
评估简称生成模块,用于根据地图兴趣点的兴趣点全称,生成多个待评估简称;
相关地址获取模块,用于在距离所述兴趣点的预设范围内,获取含有所述兴趣点全称或者任一待评估简称的多个地址名称;
词状态计算模块,用于根据所述地址名称,分别计算目标词的词状态向量,所述词状态向量用于表示所述目标词在所述地址名称中的位置状态,所述目标词是所述兴趣点全称或者任一所述待评估简称;
相似度计算模块,用于分别计算所述兴趣点全称的词状态向量与任一待评估简称的词状态向量之间的相似度;
简称确定模块,用于将高于预设阈值的相似度对应的待评估简称,确定为所述兴趣点全称对应的兴趣点简称;
所述评估简称生成模块,在用于根据地图兴趣点的兴趣点全称生成多个待评估简称时,包括:将所述兴趣点全称中包括的各个单字,按照单字排列顺序进行任意单字数量的组合,每一组合为一个简称,得到多个所述简称;从多个简称中剔除单字和确定是非兴趣点简称的噪声词,剩余的简称即所述待评估简称。
6.根据权利要求5所述的装置,其特征在于,
所述词状态计算模块,在用于根据地址名称计算目标词的词状态向量时,包括:在所述多个地址名称中,获取目标词在任一地址名称中的相邻词;每个所述相邻词在所述多个地址名称中的出现频率,作为所述目标词的词状态向量中的其中一个向量维度的维度数值。
7.根据权利要求5所述的装置,其特征在于,
所述相似度计算模块,用于计算所述兴趣点全称的词状态向量与任一待评估简称的词状态向量之间的余弦相似度。
8.根据权利要求5所述的装置,其特征在于,所述高于预设阈值的相似度对应的待评估简称的数量为至少一个。
CN201610015852.7A 2016-01-11 2016-01-11 地图兴趣点简称获取方法和装置 Active CN106959958B (zh)

Priority Applications (11)

Application Number Priority Date Filing Date Title
CN201610015852.7A CN106959958B (zh) 2016-01-11 2016-01-11 地图兴趣点简称获取方法和装置
TW105142522A TWI661317B (zh) 2016-01-11 2016-12-21 地圖興趣點簡稱獲取方法和裝置
JP2018554614A JP6877464B2 (ja) 2016-01-11 2017-01-03 地図上の関心地点の略称を得る方法及び装置
SG11201805938XA SG11201805938XA (en) 2016-01-11 2017-01-03 Method and apparatus for obtaining abbreviated name of point of interest on map
PCT/CN2017/000018 WO2017121262A1 (zh) 2016-01-11 2017-01-03 地图兴趣点简称获取方法和装置
MYPI2018702412A MY192478A (en) 2016-01-11 2017-01-03 Method and apparatus for obtaining abbreviated name of point of interest on map
EP17738076.3A EP3404559A4 (en) 2016-01-11 2017-01-03 METHOD AND DEVICE FOR DETECTING THE ABSTRACT NAME OF A POINT OF INTEREST ON A CARD
KR1020187022277A KR102157428B1 (ko) 2016-01-11 2017-01-03 맵 상에서 관심 지점의 축약 명칭을 취득하는 방법 및 장치
US16/031,507 US10816355B2 (en) 2016-01-11 2018-07-10 Method and apparatus for obtaining abbreviated name of point of interest on map
PH12018501475A PH12018501475A1 (en) 2016-01-11 2018-07-11 Method and device for aquiring abbreviated name of point of interest on map
US17/080,357 US11255690B2 (en) 2016-01-11 2020-10-26 Method and apparatus for obtaining abbreviated name of point of interest on map

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610015852.7A CN106959958B (zh) 2016-01-11 2016-01-11 地图兴趣点简称获取方法和装置

Publications (2)

Publication Number Publication Date
CN106959958A CN106959958A (zh) 2017-07-18
CN106959958B true CN106959958B (zh) 2020-04-07

Family

ID=59310764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610015852.7A Active CN106959958B (zh) 2016-01-11 2016-01-11 地图兴趣点简称获取方法和装置

Country Status (10)

Country Link
US (2) US10816355B2 (zh)
EP (1) EP3404559A4 (zh)
JP (1) JP6877464B2 (zh)
KR (1) KR102157428B1 (zh)
CN (1) CN106959958B (zh)
MY (1) MY192478A (zh)
PH (1) PH12018501475A1 (zh)
SG (1) SG11201805938XA (zh)
TW (1) TWI661317B (zh)
WO (1) WO2017121262A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106959958B (zh) * 2016-01-11 2020-04-07 阿里巴巴集团控股有限公司 地图兴趣点简称获取方法和装置
CN107491537A (zh) * 2017-08-23 2017-12-19 北京百度网讯科技有限公司 Poi数据挖掘、信息检索方法、装置、设备及介质
CN108171529B (zh) * 2017-12-04 2021-09-14 昆明理工大学 一种地址相似度评估方法
CN110008300B (zh) * 2019-04-11 2021-07-09 北京百度网讯科技有限公司 Poi别名的确定方法、装置、计算机设备和存储介质
CN110543593B (zh) * 2019-08-01 2021-04-09 北京三快在线科技有限公司 数据处理方法、装置、电子设备及可读存储介质
CN111026937B (zh) 2019-11-13 2021-02-19 百度在线网络技术(北京)有限公司 提取poi名称的方法、装置、设备和计算机存储介质
CN113495997A (zh) * 2020-04-01 2021-10-12 北京四维图新科技股份有限公司 Poi别名的探索方法、装置和车辆
CN112001172A (zh) * 2020-08-25 2020-11-27 杭州橙鹰数据技术有限公司 识别方法及装置
WO2022131740A1 (en) * 2020-12-14 2022-06-23 Samsung Electronics Co., Ltd. Methods and systems for generating abbreviations for a target word
CN113688628B (zh) * 2021-07-28 2023-09-22 上海携宁计算机科技股份有限公司 文本识别方法、电子设备和计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8521539B1 (en) * 2012-03-26 2013-08-27 Nuance Communications, Inc. Method for chinese point-of-interest search
CN103390004A (zh) * 2012-05-11 2013-11-13 北京百度网讯科技有限公司 一种语义冗余的确定方法和装置、对应的搜索方法和装置
CN103885950A (zh) * 2012-12-19 2014-06-25 高德软件有限公司 一种获取缩略词与poi间对应关系的方法和装置
CN105224660A (zh) * 2015-09-30 2016-01-06 北京奇虎科技有限公司 一种地图兴趣点poi数据的处理方法和装置
CN105808609A (zh) * 2014-12-31 2016-07-27 高德软件有限公司 一种信息点数据冗余的判别方法和设备

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS513051B1 (zh) 1969-04-04 1976-01-30
JP3724649B2 (ja) * 2002-11-11 2005-12-07 松下電器産業株式会社 音声認識用辞書作成装置および音声認識装置
US20070185650A1 (en) * 2006-02-04 2007-08-09 Tatsuo Yokota Method and apparatus for searching point of interest by name or phone number
US20070220037A1 (en) * 2006-03-20 2007-09-20 Microsoft Corporation Expansion phrase database for abbreviated terms
KR100849497B1 (ko) * 2006-09-29 2008-07-31 한국전자통신연구원 온톨로지 매핑을 이용한 단백질 이름 정규화 방법
JP5103051B2 (ja) * 2007-04-17 2012-12-19 株式会社日立製作所 情報処理システム及び情報処理方法
US8738422B2 (en) * 2007-09-28 2014-05-27 Walk Score Management, LLC Systems, techniques, and methods for providing location assessments
JP4953459B2 (ja) * 2008-03-11 2012-06-13 ヤフー株式会社 文字ベクトルを用いた略語生成装置、方法及びプログラム
US8401771B2 (en) * 2008-07-22 2013-03-19 Microsoft Corporation Discovering points of interest from users map annotations
KR101590624B1 (ko) * 2009-02-20 2016-02-03 팅크웨어(주) 관심지점 시설물의 대표화 장치 및 그 방법
WO2010124424A1 (en) * 2009-04-29 2010-11-04 Google Inc. Short point-of-interest title generation
US8583638B2 (en) * 2009-08-27 2013-11-12 Apple Inc. Adaptive mapping of search results
US8510348B2 (en) * 2010-03-03 2013-08-13 Wgrs Licensing Company, Llc Systems and methods for creating and using imbedded shortcodes and shortened physical and internet addresses
CN102789473A (zh) * 2011-05-18 2012-11-21 国际商业机器公司 标识符检索方法和设备
CN103514199A (zh) * 2012-06-25 2014-01-15 高德软件有限公司 Poi数据处理方法及其装置、poi检索方法及其装置
US9123259B2 (en) * 2013-03-14 2015-09-01 Microsoft Technology Licensing, Llc Discovering functional groups of an area
JP6044422B2 (ja) * 2013-03-29 2016-12-14 富士通株式会社 略称生成方法および略称生成装置
CN104216895B (zh) * 2013-05-31 2018-01-30 高德软件有限公司 一种生成poi数据的方法及装置
CN104035948B (zh) * 2013-09-29 2016-04-06 腾讯科技(深圳)有限公司 地理位置显示方法及装置
CN104933171B (zh) * 2015-06-30 2019-06-18 百度在线网络技术(北京)有限公司 兴趣点数据关联方法和装置
CN106959958B (zh) 2016-01-11 2020-04-07 阿里巴巴集团控股有限公司 地图兴趣点简称获取方法和装置
CN106909600A (zh) * 2016-07-07 2017-06-30 阿里巴巴集团控股有限公司 用户背景信息的收集方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8521539B1 (en) * 2012-03-26 2013-08-27 Nuance Communications, Inc. Method for chinese point-of-interest search
CN103390004A (zh) * 2012-05-11 2013-11-13 北京百度网讯科技有限公司 一种语义冗余的确定方法和装置、对应的搜索方法和装置
CN103885950A (zh) * 2012-12-19 2014-06-25 高德软件有限公司 一种获取缩略词与poi间对应关系的方法和装置
CN105808609A (zh) * 2014-12-31 2016-07-27 高德软件有限公司 一种信息点数据冗余的判别方法和设备
CN105224660A (zh) * 2015-09-30 2016-01-06 北京奇虎科技有限公司 一种地图兴趣点poi数据的处理方法和装置

Also Published As

Publication number Publication date
JP2019503025A (ja) 2019-01-31
TWI661317B (zh) 2019-06-01
US10816355B2 (en) 2020-10-27
JP6877464B2 (ja) 2021-05-26
SG11201805938XA (en) 2018-08-30
KR102157428B1 (ko) 2020-09-18
MY192478A (en) 2022-08-23
WO2017121262A1 (zh) 2017-07-20
US11255690B2 (en) 2022-02-22
US20180335313A1 (en) 2018-11-22
EP3404559A1 (en) 2018-11-21
US20210055124A1 (en) 2021-02-25
KR20180101443A (ko) 2018-09-12
TW201740289A (zh) 2017-11-16
CN106959958A (zh) 2017-07-18
PH12018501475A1 (en) 2019-03-11
EP3404559A4 (en) 2019-08-21

Similar Documents

Publication Publication Date Title
CN106959958B (zh) 地图兴趣点简称获取方法和装置
CN110110020B (zh) 用于标识和传送位置的方法和装置
US7562289B2 (en) Methods and systems for encoding geographic coordinates and features in a portable document format file
EP2991037B1 (en) Method of generating three-dimensional scene model
KR101623860B1 (ko) 문서 요소에 대한 유사도를 산출하는 방법
JP2007172523A (ja) 情報処理装置、情報処理方法、およびプログラム
CN102930048A (zh) 使用参考和视觉数据的语义自动发现的数据丰富
CN109857873A (zh) 推荐实体的方法和装置、电子设备、计算机可读介质
CN113868351A (zh) 一种地址聚类方法、装置、电子设备及存储介质
CN108268504A (zh) 一种划分兴趣点的搜索区域的方法及设备
Amirkhanyan et al. Real-time clustering of massive geodata for online maps to improve visual analysis
US11755573B2 (en) Methods and systems for determining search parameters from a search query
CN114490926A (zh) 一种相似问题的确定方法、装置、存储介质及终端
CN104615620A (zh) 地图搜索类型识别方法及装置、地图搜索方法及系统
Toman et al. Algorithm for graph building based on Google Maps and Google Earth
Huck et al. Visualizing patterns in spatially ambiguous point data
CN114461812A (zh) 一种面向大规模知识图谱的多通道实体对齐方法及装置
CN113806627A (zh) 兴趣点的类型识别方法、装置、计算机设备及存储介质
KR20190000061A (ko) 키워드 속성을 기준으로 관련 있는 키워드를 제공하는 방법 및 시스템
CN111737374A (zh) 位置坐标确定方法、装置、电子设备及存储介质
CN114329236A (zh) 一种数据处理方法及装置
Feng et al. A system for region search and exploration
Safra et al. Integrating data from maps on the world-wide web
CN113779197B (zh) 一种数据集搜索方法、装置、存储介质及终端
Hare et al. Placing photos with a multimodal probability density function

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1238751

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200924

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200924

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: Alibaba Group Holding Ltd.