CN113495997A - Poi别名的探索方法、装置和车辆 - Google Patents

Poi别名的探索方法、装置和车辆 Download PDF

Info

Publication number
CN113495997A
CN113495997A CN202010250125.5A CN202010250125A CN113495997A CN 113495997 A CN113495997 A CN 113495997A CN 202010250125 A CN202010250125 A CN 202010250125A CN 113495997 A CN113495997 A CN 113495997A
Authority
CN
China
Prior art keywords
poi
preset
target
alias
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010250125.5A
Other languages
English (en)
Inventor
温亚东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Navinfo Co Ltd
Original Assignee
Navinfo Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Navinfo Co Ltd filed Critical Navinfo Co Ltd
Priority to CN202010250125.5A priority Critical patent/CN113495997A/zh
Publication of CN113495997A publication Critical patent/CN113495997A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供一种POI别名的探索方法、装置和车辆。该方法包括:接收对象发送的携带待探索的POI名称的探索请求,从预设的POI索引库中提取与POI名称对应的POI相关名称,对POI名称进行分词处理,以便确定与对POI相关名称对应的目标分词,从预设的POI关键字模型中选取与目标分词的相似度大于预设第一阈值的目标关键字,从预设的POI别名模型中选取与目标关键字的相似度大于预设第二阈值的POI别名。通过将分词处理与POI关键字模型和POI模型相结合,即通过由分词结合匹配模型的方式实现对POI别名的探索,避免了现有技术中通过人工探索造成的效率低和准确率低等问题,进而实现提高POI别名的探索效率,并提高探索结果的可靠性的技术效果。

Description

POI别名的探索方法、装置和车辆
技术领域
本公开涉及计算机技术领域,具体涉及数据处理技术领域,尤其涉及一种POI别名的探索方法、装置和车辆。
背景技术
随着科技的发展和互联网技术的不断进步,移动终端提供的服务不断升级。目前基于位置的服务(Location Based Services,LBS)是当前移动终端服务中的热点,在LBS中,兴趣点(Point of Interest,POI)已成为衡量LBS价值的标准,实际上不同的POI具备不同的名称,名称用于标识POI。
在现有技术中,POI别名的探索方法主要通过人工的方式从官方公文发布的正式改名信息,百科网站中记载的别名内容,以及资讯等消息提取出来。
然而发明人在实现本公开的过程中,发现至少存在如下问题:通过人工的方式探索POI别名导致的可靠性较低。
发明内容
本公开提供一种POI别名的探索方法、装置和车辆,用以解决现有技术中通过人工的方式探索POI别名导致的可靠性较低的问题。
一方面,本公开实施例提供一种POI别名的探索方法,所述方法包括:
接收对象发送的携带待探索的POI名称的探索请求;
从预设的POI索引库中提取与所述POI名称对应的POI相关名称;
对所述POI相关名称进行分词处理,以便确定与对所述POI相关名称对应的目标分词;
从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字;
从预设的POI别名模型中选取与所述目标关键字的相似度大于预设第二阈值的POI别名。
在本公开实施例中,通过将分词处理与POI关键字模型和POI模型相结合,即通过由分词结合匹配模型的方式实现对POI别名的探索,避免了现有技术中通过人工探索造成的效率低和准确率低等问题,进而实现提高POI别名的探索效率,并提高探索结果的可靠性的技术效果。
在一可选实施例中,在所述从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字之前,所述方法还包括:
分别对预存的POI资讯信息的文档和所述POI索引库中的文档进行分词,得到第一分词;
计算所述第一分词的词频和逆文档频率;
根据所述词频和所述逆文档频率构建所述POI关键字模型。
在本公开实施例中,通过基于POI资讯信息的文档和POI索引库中的文档确定第一分词,以便实现第一分词的多样性和全面性,并通过基于第一分词的词频和逆文档频率构建POI关键字模型,以便实现精确确定各第一分词之间的关联关系,进而实现POI关键字模型的可靠性。
在一可选实施例中,所述根据所述词频和所述逆文档频率构建所述POI关键字模型包括:
根据所述词频和逆文档频率对每个文档对应的第一分词进行排序处理,得到分词序列;
针对所述每个文档的分词序列,基于词频与逆文档频率的乘积由高至低地选取预设第一数量的第一分词;
计算选取出的第一分词之间的第一相似度;
基于所述第一相似度生成所述POI关键字模型。
在本公开实施例中,根据词频和逆文档频率对每个文档的第一分词进行排序,并基于词频与逆文档频率的乘积对每个文档的第一分词进行选取,以对每个文档的第一分词进行过滤,以便在后续计算过程中节约计算资源,且通过计算出的第一相似度构建POI关键字模型,以便实现基于各第一分词之间的关联关系构建出高可靠性的POI关键字的技术效果。
在一可选实施例中,所述从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字包括:
将所述目标分词作为键值输入至所述POI关键字模型,得到与所述目标分词的相似度大于所述第一阈值的初始关键字;
根据与所述目标分词的相似度的从大到小的顺序,从所述初始关键字中选取预设第二数量的初始关键字确定为候选关键字;
对所述候选关键字进行去重处理,得到所述目标关键字。
在本公开实施例中,通过基于相似度、第一阈值和去重,从POI关键字模型中选取与目标分词对应的目标关键字,可以实现去除部分干扰关键字,并选取出与目标分词匹配度高的关键字的技术效果。
在一可选实施例中,在所述从预设的POI别名模型中选取与所述关键字的相似度大于预设第二阈值的POI别名之前,所述方法还包括:
对所述POI索引库中的文档进行分词,得到第二分词;
基于所述第二分词的词频为所述第二分词配权重;
基于所述第二分词的顺序和所述权重形成多元组;
对所述多元组进行去重处理;
计算所述多元组的词频,以便基于多元组的词频的由高至低进行排序,得到多元组列表,并将所述多元组列表确定为所述POI别名模型。
在本公开实施例中,通过基于POI索引库中的文档生成多元组,并根据多元组的词频确定POI别名模型,可以实现各多元组之间的准确性高的关联关系,从而实现POI别名模型的可靠性。
在一可选实施例中,所述从预设的POI别名模型中选取与所述目标关键字的相似度大于预设第二阈值的POI别名包括:
将所述目标关键字组合成多元组;
计算所述多元组与所述多元组列表中的每个多元组的第二相似度;
将第二相似度大于所述第二阈值的多元组列表中的多元组进行组合,得到所述POI别名。
在本公开实施例中,通过对目标关键字进行组合得到多元组,以便通过结合第二相似度和第二阈值确定POI别名,可以实现确定出与POI相关名称的匹配度高的POI别名,即实现确定出的POI别名的可靠性的技术效果。
另一方面,本公开实施例还提供了一种POI别名的探索装置,所述装置包括:
接收器,用于接收对象发送的携带待探索的POI名称的探索请求;
处理器,用于从预设的POI索引库中提取与所述POI名称对应的POI相关名称,对所述POI相关名称进行分词处理,以便确定与对所述POI相关名称对应的目标分词,从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字,从预设的POI别名模型中选取与所述目标关键字的相似度大于预设第二阈值的POI别名。
在一可选实施例中,所述装置还包括所述POI关键字模型,其中,所述POI关键字模型是所述处理器分别对预存的POI资讯信息的文档和所述POI索引库中的文档进行分词,得到第一分词,并计算所述第一分词的词频和逆文档频率,并根据所述词频和所述逆文档频率构建的。
在一可选实施例中,所述处理器还用于,根据所述词频和逆文档频率对每个文档对应的第一分词进行排序处理,得到分词序列,针对所述每个文档的分词序列,基于词频与逆文档频率的乘积由高至低地选取预设第一数量的第一分词,计算选取出的第一分词之间的第一相似度,基于所述第一相似度生成所述POI关键字模型。
在一可选实施例中,所述处理器还用于,将所述目标分词作为键值输入至所述POI关键字模型,得到与所述目标分词的相似度大于所述第一阈值的初始关键字,根据与所述目标分词的相似度的从大到小的顺序,从所述初始关键字中选取预设第二数量的初始关键字确定为候选关键字,对所述候选关键字进行去重处理,得到所述目标关键字。
在一可选实施例中,所述装置还包括所述POI别名模型,其中,所述POI别名模型是所述处理器对所述POI索引库中的文档进行分词,得到第二分词,并基于所述第二分词的词频为所述第二分词配权重,并基于所述第二分词的顺序和所述权重形成多元组,并对所述多元组进行去重处理,并计算所述多元组的词频,并基于多元组的词频的由高至低进行排序,得到的多元组列表。
在一可选实施例中,所述处理器还用于,将所述目标关键字组合成多元组,计算所述多元组与所述多元组列表中的每个多元组的第二相似度,将第二相似度大于所述第二阈值的多元组列表中的多元组进行组合,得到所述POI别名。
另一个方面,本公开实施例还提供了一种车辆,所述车辆包括如上任一实施例所述的装置。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本公开实施例的POI别名的探索方法的应用场景示意图;
图2为本公开实施例的POI别名的探索方法的流程示意图;
图3为本公开实施例的构建POI关键字模型的方法的流程示意图;
图4为本公开实施例的根据词频和逆文档频率构建POI关键字模型的方法的示意图;
图5为本公开实施例的从预设的POI关键字模型中选取与目标分词的相似度大于预设第一阈值的目标关键字的方法的流程示意图;
图6为本公开实施例的构建POI识别模型的方法的流程示意图;
图7为本公开实施例的从预设的POI别名模型中选取与目标关键字的相似度大于预设第二阈值的POI别名的方法的流程示意图;
图8为本公开实施例的POI别名的探索装置的示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在现有技术中,POI别名的探索方法主要通过人工的方式实现,如通过人工的方式从官方公文发布的正式改名信息和百科网站中记载的别名内容等中进行提取并分析,一方面,由于是通过人工的方式实现,所以容易造成POI别名的探索结果受主观因素的影响,从而导致准确度不高的问题;另一方面,随着互联网技术的发展和文化多元素的发展,POI对应的资讯等信息更新较快,且信息量大,而通过人工的方式实现容易导致处理效率低,更新速度慢,且消耗人力成本较高的问题。为了解决现有技术中因人工的方式导致的上述问题,发明人经过创造性的劳动得到本公开实施例的技术方案。在本公开实施例中,通过由分词结合模型匹配的方式实现对POI别名的探索。体现为基于POI索引库确定与接收到探索请求中携带的POI名称对应的POI相关名称,并对POI相关名称对应的目标分词进行确定,并根据关键字模型确定目标分词的目标关键字,以便根据POI别名模型确定与目标关键字对应的POI别名,从而避免人工探索造成的效率低等问题,进而实现提高POI别名的探索效率,并提高探索结果的可靠性的技术效果。
其中,本公开实施例提供的POI别名的探索方法可以应用于不同的电子产品中。如,本公开实施例提供的POI别名的探索方法可以应用于电子地图产品中,还可以应用于导航电子产品中,还可以用于交互应用电子产品中。
值得说明的是,上述列举的电子产品只是示范性地说明,而不能理解为对本公开实施例的POI别名的探索方法的应用的电子产品的限定。
本公开实施例提供的POI别名的探索方法,可以适用于如图1所示的应用场景。
在如图1所示的应用场景中,车辆100设置有车载终端(图1中未示出),车载终端包括处理器和显示器,用户200可在显示器上进行输入操作(其中,输入操作可包括两种模式,一种模式为触屏操作,另一种模式为音频操作),显示器基于用户200的输入操作生成与输入操作对应的操作指令,并将操作指令传输至处理器,处理器基于操作指令执行与操作指令对应的方法。
在本公开实施例中,用户200可在显示器上选中并进入导航界面,并可在导航界面的目的地处输入POI名称,并启动导航指令,以便触发探索请求。处理器从POI索引库中查找与POI名称对应的POI相关名称,并对POI相关名称进行分词处理,得到与POI相关名称对应的目标分词,并调用预设的POI关键字模型,将目标分词输入至POI关键字模型,输出与目标分词对应的目标关键字,并调用POI别名模型,将目标关键字输入至POI别名模型,输出与目标关键字对应的POI别名,处理器以该POI别名作为目的地进行搜索,并生成相应的导航路线,并将导航路线发送至显示器,由显示器对导航路线进行显示。
例如,用户200输入的POI名称“XX医院”,通过POI索引库可以得到与“XX医院”对应的POI相关名称“XX地名”、“XX街”和“医院”,则基于POI关键字模型确定出与关键信息“XX地名”、“XX街”和“医院”存在关联关系(关联关系可以是基于相似度确定的,可参见后续结合示例的阐述)的目标关键字“总医院”和“第X医学中心”,等等。将确定出的目标关键字输入至POI关键字模型,由POI关键字模型对确定出的目标关键字进行预测,得到POI别名“XXX第X医学中心”、“XX总医院”和“XX总医院(XX地名店)”,等等。
下面以具体地实施例对本公开的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例进行描述。
一个方面,本公开实施例提供了一种适用于上述应用场景的POI别名的探索方法。
请参阅图2,图2为本公开实施例的POI别名的探索方法的流程示意图。
如图2所示,该方法包括:
S101:接收对象发送的携带待探索的POI名称的探索请求。
其中,POI可以是指电子地图上的某个点,用于表示该点代表的职能,例如,可以标识出该点代表的政府部门、商业机构(加油站、百货公司、超市、餐厅、酒店或便利商店等)、旅游景点、基础设施(公园、公共厕所或医院等)、交通设施(车站、停车场或速限标示牌)等处所。通常,POI包括下述至少一项:名称、类别、经度、纬度和海拔等信息。
其中,通过命名的方式对不同的POI进行区分,即不同的POI一般具有不同的名称,且同一POI可能对应多个名称,即一个POI可能具有不同的名称。可将POI的完整且通用的名称作为标准名称,其他可用于标识该POI的名称为别名。例如,某街道上的小学的标准名称为第六小学,别名可以为六小学和某街道小学等。
在本公开实施例中,探索请求中携带的待探索的POI名称可能为POI标准名称,也可能为POI别名。即通过本公开实施例提供的方法,可以实现对POI标准名称的别名进行探索,也可以实现对POI别名的其他别名进行探索。
S102:从预设的POI索引库中提取与POI名称对应的POI相关名称。
其中,POI索引库中包括文档,且POI索引库中的文档是基于预先采集的POI信息构建的,POI信息包括POI的名称、POI名称对应的扩展名称、地址、区域面、热点商圈、高频词、经纬度、距离、POI类型、POI点击量和POI权重等。
在该步骤中,通过从构建的POI索引库中提取与POI名称对应的POI相关名称,可以实现对POI名称的扩展,从而实现后续探索的全面性的技术效果。
S103:对POI相关名称进行分词处理,以便确定与对POI相关名称对应的目标分词。
在本公开实施例中,可对POI相关名称进行分词处理,通过分词处理确定出与POI相关名称对应的目标分词。
例如,POI相关名称中包括“A街道七中”,通过正向最大匹配法(从左到右的方向)将“A街道七中”与字典进行匹配,得到A街道七中的分词“A街道、七中”;也可以通过逆向最大匹配法(从右到左的方向)将“A街道七中”与字典进行匹配,得到A街道七中的分词“七中、街道、A”;还可以通过最短路径分词法(即切出的词数是最少的);还可以通过双向最大匹配法(进行由左到右、由右到左两次扫描),等等。
S104:从预设的POI关键字模型中选取与目标分词的相似度大于预设第一阈值的目标关键字。
其中,第一阈值可基于需求进行设定。
其中,POI关键字模型是预先基于从网络上获取的大量关于POI的资讯信息,以及预先构建的POI索引库构建的。
在一可选实施例中,POI关键字模型可以是由大量POI关键字组成的树形结构,一个枝节点对应一个关键字,若两个关键字之间存在关联关系,则在两个枝节点之间形成连接线。其中,关联关系可以为两个关键字之间的相似度大于预设的阈值。
通过预先构建POI关键字模型,以便基于POI关键字模型对与目标分词对应的目标关键字进行确定,可以实现快速便捷的确定目标关键字,进而实现提高确定POI别名的效率的技术效果。
S105:从预设的POI别名模型中选取与目标关键字的相似度大于预设第二阈值的POI别名。
其中,第二阈值也可基于需求进行设定。
其中,POI别名模型可以是预先基于POI索引库构建的。
在一可选实施例中,POI别名模型可以是由大量POI别名组成的多元组列表。
通过预先构建POI别名模型,以便基于POI别名模型对目标关键字对应的POI别名,从而实现快速的确定POI别名的技术效果,且避免了现有技术中因通过人工方式探索POI别名造成的准确率偏低的问题,从而实现了在提高效率的同时还提高了探索结果的可靠性的技术效果。
结合上述应用场景可知,在一可选实施例中,在S105之后,该方法还可包括:
S106:根据POI别名生成导航路线,并将导航路线发送至对象。以便满足对象的导航需求。
当然,在另一可选实施例中,若探索请求是对象查询POI名称对应的查询请求,则在S105之后,该方法还可包括:
S106’:调取电子地图,并基于预设标识在电子地图上将与POI别名对应的位置进行标记,并将标记后的电子点图在显示界面上进行显示。
其中,预设标识可以为预先设置的字符串,也可以为填充预设颜色的图形,如红色的圆圈,等等。
基于上述示例可知,在本公开实施例中,是基于预设的POI关键字模型对目标分词对应的目标关键字进行确定,从POI关键字模型中选取与目标分词对应的目标关键字。因此,下面结合图3对构建POI关键字模型进行详细阐述。
如图3所示,构建POI关键字模型的方法包括:
S011:分别对预存的POI资讯信息的文档和POI索引库中的文档进行分词,得到第一分词。
其中,POI资讯信息的文档是预先从网络上获取POI的资讯信息并存储的。
在本公开实施例中,对POI资讯信息的文档进行分词,且对POI索引库中的文档进行分词。例如,对POI资讯信息的文档进行分词,得到m个分词,对POI索引库中的文档进行分词,得到n个分词,则(m+n)个分词中的任意分词均为第一分词。
S012:计算第一分词的词频和逆文档频率。
其中,词频和逆文件频率(TF-IDF)用以评估一个第一分词对于语料库(包括POI资讯信息和POI索引库)中的其中一个文档的重要程度。一个第一分词的重要性随着它在文档中出现的次数成正比增加,但同时会随着它在语料库(包括POI资讯信息和POI索引库)中出现的频率成反比下降。即一个第一分词在一个文档中出现次数越多,同时在语料库(包括POI资讯信息和POI索引库)中的所有文档中出现次数越少,越能够代表该文档。
其中,词频
Figure BDA0002435181930000091
其中,逆文件频率
Figure BDA0002435181930000092
S013:根据词频和逆文档频率构建POI关键字模型。
在本公开实施中,通过计算第一分词的词频和逆文档频率,以便基于词频和逆文档频率构建POI关键字模型,可以实现类别区分能力强的POI关键字模型的技术效果。
在一可选实施例中,结合图4(图4为本公开实施例的根据词频和逆文档频率构建POI关键字模型的方法的示意图)可知,S013包括:
S131:根据词频和逆文档频率对每个文档对应的第一分词进行排序处理,得到分词序列。
基于上述示例,一个文档对应多个第一分词,根据词频和逆文档频率对每个文档中的第一分词进行排序,得到相应的分词序列。
S132:针对每个文档的分词序列,基于词频与逆文档频率的乘积由高至低地选取预设第一数量的第一分词。
其中,第一数量可基于需求进行设定。若某文档中的第一分词的数量小于第一数量,则选取该文档中的全部第一分词。
通过对第一分词进行选取,可以实现对部分生僻的第一分词进行过滤,并对部分虚假第一分词(可能因分词错误造成的错误的第一分词)进行过滤,以便减少后续的计算量,从而实现节约计算资源,且构建得到可靠性高的POI关键字模型的技术效果。
S133:计算选取出的第一分词之间的第一相似度。
其中,分别计算任意两个第一分词之间的第一相似度。
S134:基于第一相似度生成POI关键字模型。
其中,基于第一相似度确定两个第一分词之间的关联关系,以便形成每个第一分词与各自的关联分词之间的对应关系,进而生成关键字模型。
基于上述示例可知,在构建得到POI关键字模型后,可从POI关键字模型中选取与目标分词对应的目标关键字,而POI关键字模型是由第一分词组成的,因此,实际是从第一分词中至少选取与目标分词对应的第一分词。
例如,将目标分词作为键值输入至POI关键字模型,输出与目标分词对应的第一分词,输出的第一分词即为目标关键字。
但是,基于上述示例中,POI关键字模型中的第一分词较多,因此输出的第一分词也较多,因此需要对第一分词进行过滤等处理,以便得到准确性高的目标关键字。因此,结合图5(图5为本公开实施例的从预设的POI关键字模型中选取与目标分词的相似度大于预设第一阈值的目标关键字的方法的流程示意图)可知,在一可选实施例中,该方法中的S104包括:
S41:将目标分词作为键值输入至POI关键字模型,得到与目标分词的相似度大于第一阈值的初始关键字。
其中,若POI关键字模型包括a个第一分词,则分别计算目标分词与每个第一分词之间的相似度,将相似度大于第一阈值的第一分词确定为初始关键字。
S42:根据与目标分词的相似度的从大到小的顺序,从初始关键字中选取预设第二数量的初始关键字确定为候选关键字。
为了减少后续计算量,并使得确定出的POI别名的可靠性较高,因此,对初始关键字进行排序,可以为基于初始关键字与目标分词的相似度从大到小进行排序,并从序列中选取前N个初始关键字作为候选关键字。
S43:对候选关键字进行去重处理,得到目标关键字。
基于上述示例可知,在本公开实施例中,是基于预先构建的POI别名模型对POI相关名称的POI别名进行确定的,因此,下面结合图6对构建POI别名模型进行详细阐述。
如图6所示,构建POI别名模型的方法包括:
S021:对POI索引库中的文档进行分词,得到第二分词。
S022:基于第二分词的词频为第二分词配权重。
其中,关于POI索引库、分词处理和词频的描述可参见上述示例,此处不再赘述。
其中,可基于第二分词的词频的大小对第二分词的权重进行分配。例如,第二分词的词频越大,则分配的权重也越大。
S023:基于第二分词的顺序和权重形成多元组。
其中,多元组包括顺序关系的第二分词,以及第二分词的权重。
例如,文档为“金融街购物中心”,对该文档进行分词得到第二分词“金融、街、购物和中心”,则多元组为“<金融,街><街,购物><购物,中心>”,以及各第二分词的权重,如“金融”的权重,“街”的权重,“购物”的权重和“中心”的权重。
S024:对多元组进行去重处理。
S025:计算多元组的词频,以便基于多元组的词频的由高至低进行排序,得到多元组列表,并将多元组列表确定为POI别名模型。
其中,计算多元组的词频是指计算多元组中的第一个第二分词的词频。基于上述示例,是计算“金融”的词频。
基于上述示例可知,POI识别模型可以为包括多元组的多元组列表,则结合图7(图7为本公开实施例的从预设的POI别名模型中选取与目标关键字的相似度大于预设第二阈值的POI别名的方法的流程示意图)可知,S105包括:
S51:将目标关键字组合成多元组。
其中,以将目标关键字组成二元组为例进行阐述如下:
将每个目标关键字分别进行两两组合得到二元组。值得说明的是,若将目标关键字组合成二元组,则在上述示例中,POI识别模型中的多元组亦为二元组。
S52:计算多元组与多元组列表中的每个多元组的第二相似度。
在一可选实施例中,可基于目标关键字组成的二元组的词频从大到小的顺序依次与多元组列表中的每个二元组进行计算,得到相应的第二相似度;也可基于二元组列表中的每个二元组的词频从大到小的顺序依次与二元组进行计算,得到相应的第二相似度。
其中,可基于式1计算第二相似度
Figure BDA0002435181930000121
其中,S1和S2分别为二元组,WS1为S1的权重,WS2为S2的权重。
S53:将第二相似度大于第二阈值的多元组列表中的多元组进行组合,得到POI别名。
根据本公开实施例的另一个方面,本公开实施例还提供了一种POI别名的探索装置。
请参阅图8,图8为本公开实施例的POI别名的探索装置的示意图。
如图8所示,所述装置包括:
接收器10,用于接收对象发送的携带待探索的POI名称的探索请求;
处理器20,用于从预设的POI索引库中提取与所述POI名称对应的POI相关名称,对所述POI相关名称进行分词处理,以便确定与对所述POI相关名称对应的目标分词,从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字,从预设的POI别名模型中选取与所述目标关键字的相似度大于预设第二阈值的POI别名。
在一可选实施例中,所述装置还包括所述POI关键字模型(图中未示出),其中,所述POI关键字模型是所述处理器20分别对预存的POI资讯信息的文档和所述POI索引库中的文档进行分词,得到第一分词,并计算所述第一分词的词频和逆文档频率,并根据所述词频和所述逆文档频率构建的。
在一可选实施例中,所述处理器20还用于,根据所述词频和逆文档频率对每个文档对应的第一分词进行排序处理,得到分词序列,针对所述每个文档的分词序列,基于词频与逆文档频率的乘积由高至低地选取预设第一数量的第一分词,计算选取出的第一分词之间的第一相似度,基于所述第一相似度生成所述POI关键字模型。
在一可选实施例中,所述处理器20还用于,将所述目标分词作为键值输入至所述POI关键字模型,得到与所述目标分词的相似度大于所述第一阈值的初始关键字,根据与所述目标分词的相似度的从大到小的顺序,从所述初始关键字中选取预设第二数量的初始关键字确定为候选关键字,对所述候选关键字进行去重处理,得到所述目标关键字。
在一可选实施例中,所述装置还包括所述POI别名模型(图中未示出),其中,所述POI别名模型是所述处理器20对所述POI索引库中的文档进行分词,得到第二分词,并基于所述第二分词的词频为所述第二分词配权重,并基于所述第二分词的顺序和所述权重形成多元组,并对所述多元组进行去重处理,并计算所述多元组的词频,并基于多元组的词频的由高至低进行排序,得到的多元组列表。
在一可选实施例中,所述处理器20还用于,将所述目标关键字组合成多元组,计算所述多元组与所述多元组列表中的每个多元组的第二相似度,将第二相似度大于所述第二阈值的多元组列表中的多元组进行组合,得到所述POI别名。
结合图8可知,在一可选实施例中,POI别名的探索装置还包括:发送器30,其中,处理器20用于根据POI别名生成导航路线,发送器30用于将导航路线发送至对象,以便满足对象的导航需求。
结合图8可知,在一可选实施例中,POI别名的探索装置还包括:显示器40,其中,处理器20用于调取电子地图,并基于预设标识在电子地图上将与POI别名对应的位置进行标记,显示器40用于并将标记后的电子点图在显示界面上进行显示。
另一个方面,本公开实施例还提供了一种车辆,所述车辆包括如上任一实施例所述的装置。
读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本公开实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
还应理解,在本公开各实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本公开实施例的实施过程构成任何限定。
以上,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种POI别名的探索方法,其特征在于,所述方法包括:
接收对象发送的携带待探索的POI名称的探索请求;
从预设的POI索引库中提取与所述POI名称对应的POI相关名称;
对所述POI相关名称进行分词处理,以便确定与对所述POI相关名称对应的目标分词;
从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字;
从预设的POI别名模型中选取与所述目标关键字的相似度大于预设第二阈值的POI别名。
2.根据权利要求1所述的方法,其特征在于,在所述从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字之前,所述方法还包括:
分别对预存的POI资讯信息的文档和所述POI索引库中的文档进行分词,得到第一分词;
计算所述第一分词的词频和逆文档频率;
根据所述词频和所述逆文档频率构建所述POI关键字模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述词频和所述逆文档频率构建所述POI关键字模型包括:
根据所述词频和逆文档频率对每个文档对应的第一分词进行排序处理,得到分词序列;
针对所述每个文档的分词序列,基于词频与逆文档频率的乘积由高至低地选取预设第一数量的第一分词;
计算选取出的第一分词之间的第一相似度;
基于所述第一相似度生成所述POI关键字模型。
4.根据权利要求1所述的方法,其特征在于,所述从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字包括:
将所述目标分词作为键值输入至所述POI关键字模型,得到与所述目标分词的相似度大于所述第一阈值的初始关键字;
根据与所述目标分词的相似度的从大到小的顺序,从所述初始关键字中选取预设第二数量的初始关键字确定为候选关键字;
对所述候选关键字进行去重处理,得到所述目标关键字。
5.根据权利要求1至4中任一项所述的方法,其特征在于,在所述从预设的POI别名模型中选取与所述关键字的相似度大于预设第二阈值的POI别名之前,所述方法还包括:
对所述POI索引库中的文档进行分词,得到第二分词;
基于所述第二分词的词频为所述第二分词配权重;
基于所述第二分词的顺序和所述权重形成多元组;
对所述多元组进行去重处理;
计算所述多元组的词频,以便基于多元组的词频的由高至低进行排序,得到多元组列表,并将所述多元组列表确定为所述POI别名模型。
6.根据权利要求5所述的方法,其特征在于,所述从预设的POI别名模型中选取与所述目标关键字的相似度大于预设第二阈值的POI别名包括:
将所述目标关键字组合成多元组;
计算所述多元组与所述多元组列表中的每个多元组的第二相似度;
将第二相似度大于所述第二阈值的多元组列表中的多元组进行组合,得到所述POI别名。
7.一种POI别名的探索装置,其特征在于,所述装置包括:
接收器,用于接收对象发送的携带待探索的POI名称的探索请求;
处理器,用于从预设的POI索引库中提取与所述POI名称对应的POI相关名称,对所述POI相关名称进行分词处理,以便确定与对所述POI相关名称对应的目标分词,从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字,从预设的POI别名模型中选取与所述目标关键字的相似度大于预设第二阈值的POI别名。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括所述POI关键字模型,其中,所述POI关键字模型是所述处理器分别对预存的POI资讯信息的文档和所述POI索引库中的文档进行分词,得到第一分词,并计算所述第一分词的词频和逆文档频率,并根据所述词频和所述逆文档频率构建的。
9.根据权利要求7或8所述的装置,其特征在于,所述装置还包括所述POI别名模型,其中,所述POI别名模型是所述处理器对所述POI索引库中的文档进行分词,得到第二分词,并基于所述第二分词的词频为所述第二分词配权重,并基于所述第二分词的顺序和所述权重形成多元组,并对所述多元组进行去重处理,并计算所述多元组的词频,并基于多元组的词频的由高至低进行排序,得到的多元组列表。
10.一种车辆,其特征在于,所述车辆包括如权利要求7至9中任一项所述的装置。
CN202010250125.5A 2020-04-01 2020-04-01 Poi别名的探索方法、装置和车辆 Pending CN113495997A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010250125.5A CN113495997A (zh) 2020-04-01 2020-04-01 Poi别名的探索方法、装置和车辆

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010250125.5A CN113495997A (zh) 2020-04-01 2020-04-01 Poi别名的探索方法、装置和车辆

Publications (1)

Publication Number Publication Date
CN113495997A true CN113495997A (zh) 2021-10-12

Family

ID=77993959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010250125.5A Pending CN113495997A (zh) 2020-04-01 2020-04-01 Poi别名的探索方法、装置和车辆

Country Status (1)

Country Link
CN (1) CN113495997A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090281716A1 (en) * 2008-05-09 2009-11-12 Samsung Electronics Co., Ltd. Method and apparatus for map-updating of navigation system
US20120047175A1 (en) * 2009-04-29 2012-02-23 Google Inc. Short Point-Of-Interest Title Generation
CN106959958A (zh) * 2016-01-11 2017-07-18 阿里巴巴集团控股有限公司 地图兴趣点简称获取方法和装置
US20180181988A1 (en) * 2016-12-26 2018-06-28 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for pushing information
CN108287843A (zh) * 2017-01-09 2018-07-17 北京四维图新科技股份有限公司 一种兴趣点信息检索的方法和装置、及导航设备
CN110008300A (zh) * 2019-04-11 2019-07-12 北京百度网讯科技有限公司 Poi别名的确定方法、装置、计算机设备和存储介质
CN110399385A (zh) * 2019-06-24 2019-11-01 厦门市美亚柏科信息股份有限公司 一种用于小数据集的语义分析方法和系统
CN110543593A (zh) * 2019-08-01 2019-12-06 北京三快在线科技有限公司 数据处理方法、装置、电子设备及可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090281716A1 (en) * 2008-05-09 2009-11-12 Samsung Electronics Co., Ltd. Method and apparatus for map-updating of navigation system
US20120047175A1 (en) * 2009-04-29 2012-02-23 Google Inc. Short Point-Of-Interest Title Generation
CN106959958A (zh) * 2016-01-11 2017-07-18 阿里巴巴集团控股有限公司 地图兴趣点简称获取方法和装置
US20180181988A1 (en) * 2016-12-26 2018-06-28 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for pushing information
CN108287843A (zh) * 2017-01-09 2018-07-17 北京四维图新科技股份有限公司 一种兴趣点信息检索的方法和装置、及导航设备
CN110008300A (zh) * 2019-04-11 2019-07-12 北京百度网讯科技有限公司 Poi别名的确定方法、装置、计算机设备和存储介质
CN110399385A (zh) * 2019-06-24 2019-11-01 厦门市美亚柏科信息股份有限公司 一种用于小数据集的语义分析方法和系统
CN110543593A (zh) * 2019-08-01 2019-12-06 北京三快在线科技有限公司 数据处理方法、装置、电子设备及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
毛姝洁等: "基于兴趣点简称的检索方法研究", 太原理工大学学报, vol. 39, pages 52 - 55 *
田晨睿等: "结合多层感知器与KM算法的POI匹配方法", 地理与地理信息科学, no. 2, pages 20 - 25 *

Similar Documents

Publication Publication Date Title
WO2020228706A1 (zh) 基于围栏地址的坐标数据处理方法、装置和计算机设备
Duckham et al. Including landmarks in routing instructions
CN110008300B (zh) Poi别名的确定方法、装置、计算机设备和存储介质
US8688366B2 (en) Method of operating a navigation system to provide geographic location information
CN103793403B (zh) 推送与搜索结果相关联信息的方法与装置
KR20080035089A (ko) 위치 기반 지역 정보 제공 장치 및 방법
JP2009531773A (ja) ウェブリソースのサービスエリアの検出
RU2598165C1 (ru) Недетерминированное разрешение неоднозначности и сопоставление данных места коммерческого предприятия
CN107203526B (zh) 一种查询串语义需求分析方法及装置
CN110309433B (zh) 一种数据处理方法、装置及服务器
US20200058042A1 (en) Method and system for smart address classification
JP3903712B2 (ja) 地域検索装置
JP2009134463A (ja) 地理的情報を含む文書群の検索装置、検索方法、検索プログラムおよびそのプログラムを記録した記録媒体
US11893073B2 (en) Method and apparatus for displaying map points of interest, and electronic device
WO2019241822A1 (en) Computer implemented system and method for geographic subject extraction for short text
CN111460327A (zh) 兴趣地搜索方法及装置、存储介质、计算机设备
CN111931077A (zh) 数据处理方法、装置、电子设备及存储介质
Borges et al. Ontology-driven discovery of geospatial evidence in web pages
JP3307843B2 (ja) ハイパーテキスト構造における地図表示装置
CN112711645A (zh) 一种位置点信息扩展方法、装置、存储介质和电子设备
KR20220130633A (ko) 지도 정보의 처리 방법, 장치, 전자 설비 및 저장 매체
CN113495997A (zh) Poi别名的探索方法、装置和车辆
CN112966192B (zh) 区域地址命名方法、装置、电子设备及可读存储介质
TW202146850A (zh) 確定路名之處理裝置及方法
Jones et al. GIR'05 2005 ACM workshop on geographical information retrieval

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination