CN113515944A - 兴趣点的别名挖掘方法、装置、设备及存储介质 - Google Patents
兴趣点的别名挖掘方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113515944A CN113515944A CN202110309877.9A CN202110309877A CN113515944A CN 113515944 A CN113515944 A CN 113515944A CN 202110309877 A CN202110309877 A CN 202110309877A CN 113515944 A CN113515944 A CN 113515944A
- Authority
- CN
- China
- Prior art keywords
- target
- alias
- mining
- text
- interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005065 mining Methods 0.000 title claims abstract description 105
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000009412 basement excavation Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 230000011218 segmentation Effects 0.000 claims description 4
- 240000002853 Nelumbo nucifera Species 0.000 description 14
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 14
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 14
- 238000000605 extraction Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 241000256837 Apidae Species 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003796 beauty Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Remote Sensing (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种兴趣点的别名挖掘方法、装置、设备及存储介质,该方法包括:获取目标兴趣点的招牌图像;基于招牌图像,挖掘目标兴趣点的别名并保存。由于招牌图像中通常会包含兴趣点的别名,且别名的类型多样,本方案中,将目标兴趣点的招牌图像作为挖掘对象,自动进行别名挖掘,可以更加快速、准确、全面的挖掘出兴趣点的别名,后续如果用户使用基于招牌挖掘出的别名搜索兴趣点的信息,可以基于挖掘保存的该兴趣点的别名,为用户召回准确的兴趣点的信息。
Description
技术领域
本申请涉及数据处理领域,尤其涉及一种兴趣点的别名挖掘方法、装置、设备及存储介质。
背景技术
兴趣点是地理信息系统中的地理实体,例如超市、餐馆等。兴趣点的信息包括地名、地址等。基于地图搜索推荐系统,可以为用户召回用户关注的兴趣点的信息。地图搜索推荐系统,是通过制定的通用地名地址数据规范和构建好的兴趣点的数据库,该兴趣点的数据库中包括兴趣点的信息,该兴趣点的信息包括兴趣点的标准地名地址,在通用标准地名地址模型与地名地址检索算法基础上构建的地图搜索推荐系统,提供面向行业的地图搜索服务和调用接口。
实际应用中,用户在搜索自己的兴趣点(例如超市、餐馆)时,输入搜索关键字后,可以通过上述系统为用户召回关注的兴趣点的信息。但是,用户输入的搜索关键字各种可能不同于兴趣点的标准地名地址,即输入的是兴趣点的别名,此时,可能无法为用户召回关注的兴趣点的信息。
发明内容
本申请的目的是提供一种兴趣点的别名挖掘方法、装置、设备及存储介质,以解决相关技术中用户输入兴趣点的别名,可能无法为用户准确召回兴趣点的信息的问题。
本申请的目的是通过以下技术方案实现的:
第一方面,本申请实施例提供一种兴趣点的别名挖掘方法,包括:
获取目标兴趣点的招牌图像;
基于招牌图像,挖掘目标兴趣点的别名并保存。
在一种实施方式中,基于招牌图像,挖掘目标兴趣点的别名,包括:
对招牌图像进行图像识别,以得到目标文本;
基于目标文本,挖掘目标兴趣点的别名。
在一种实施方式中,基于目标文本,挖掘目标兴趣点的别名,包括:
基于目标文本以及目标兴趣点的标准地名地址,挖掘目标兴趣点的别名。
在一种实施方式中,基于目标文本以及目标兴趣点的标准地名地址,挖掘目标兴趣点的别名,包括:
确定目标文本与标准地名地址的语义相似度;
若语义相似度满足预设阈值,将目标文本确定为目标兴趣点的别名。
在一种实施方式中,确定目标文本与标准地名地址的语义相似度,包括:
生成目标文本对应的第一特征向量;
生成标准地名地址对应的第二特征向量;
计算第一特征向量与第二特征向量的相似度,以得到语义相似度。
在一种实施方式中,基于目标文本以及目标兴趣点的标准地名地址,挖掘目标兴趣点的别名,包括:
确定目标文本与标准地名地址之间的相同文本;
基于相同文本,挖掘目标兴趣点的别名。
在一种实施方式中,确定目标文本与标准地名地址之间的相同文本,包括:
将目标文本分词,得到第一分词集合;
将标准地名地址分词,得到第二分词集合;
确定第一分词集合和第二分词集合的交集,以得到相同文本。
在一种实施方式中,基于相同文本,挖掘目标兴趣点的别名,包括:
将交集中的分词排列组合,以得到至少一个排列组合词;
将排列组合词确定为目标兴趣点的别名。
在一种实施方式中,基于目标文本,挖掘目标兴趣点的别名,包括:
将目标文本直接确定为目标兴趣点的别名。
在一种实施方式中,还包括:
在客户端通过目标兴趣点的别名搜索目标兴趣点的情况下,将目标兴趣点的别名与目标兴趣点的标准地名地址一同携带在搜索结果中发送至客户端,以使客户端基于搜索结果,将目标兴趣点的别名与目标兴趣点的标准地名地址一同展示。
第二方面,本申请实施例提供一种兴趣点的别名挖掘装置,包括:
获取模块,用于获取目标兴趣点的招牌图像;
挖掘模块,用于基于招牌图像,挖掘目标兴趣点的别名并保存。
在一种实施方式中,挖掘模块,具体用于:
对招牌图像进行图像识别,以得到目标文本;
基于目标文本,挖掘目标兴趣点的别名。
在一种实施方式中,挖掘模块,具体用于:
基于目标文本以及目标兴趣点的标准地名地址,挖掘目标兴趣点的别名。
在一种实施方式中,挖掘模块,具体用于:
确定目标文本与标准地名地址的语义相似度;
若语义相似度满足预设阈值,将目标文本确定为目标兴趣点的别名。
在一种实施方式中,挖掘模块,具体用于:
生成目标文本对应的第一特征向量;
生成标准地名地址对应的第二特征向量;
计算第一特征向量与第二特征向量的相似度,以得到语义相似度。
在一种实施方式中,挖掘模块,具体用于:
确定目标文本与标准地名地址之间的相同文本;
基于相同文本,挖掘目标兴趣点的别名。
在一种实施方式中,挖掘模块,具体用于:
将目标文本分词,得到第一分词集合;
将标准地名地址分词,得到第二分词集合;
确定第一分词集合和第二分词集合的交集,以得到相同文本。
在一种实施方式中,挖掘模块,具体用于:
将交集中的分词排列组合,以得到至少一个排列组合词;
将排列组合词确定为目标兴趣点的别名。
在一种实施方式中,挖掘模块,具体用于:
将目标文本直接确定为目标兴趣点的别名。
在一种实施方式中,还包括:
发送模块,用于在客户端通过目标兴趣点的别名搜索目标兴趣点的情况下,将目标兴趣点的别名与目标兴趣点的标准地名地址一同携带在搜索结果中发送至客户端,以使客户端基于搜索结果,将目标兴趣点的别名与目标兴趣点的标准地名地址一同展示。
第三方面,本申请实施例提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,该处理器执行所述计算机程序时实现如第一方面任一的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面任一的方法。
上述技术方案中的优点或有益效果至少包括:
由于招牌图像中通常会包含兴趣点的别名,且别名的类型多样,本方案中,将目标兴趣点的招牌图像作为挖掘对象,自动进行别名挖掘,可以更加快速、准确、全面的挖掘出兴趣点的别名,后续如果用户使用基于招牌图像挖掘出的别名搜索兴趣点的信息,可以基于挖掘保存的该兴趣点的别名,为用户准确召回兴趣点的信息。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本申请进一步的方面、实施方式和特征将会是容易明白的。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种示例性的兴趣点的别名挖掘方法的流程图;
图2是本申请实施例提供的一种示例性的兴趣点的别名挖掘方法的流程图;
图3是本申请实施例提供的一种示例性的兴趣点的别名挖掘方法的流程图;
图4是本申请实施例提供的一种示例性的兴趣点的搜索方法的流程图;
图5是本申请实施例提供的一种示例性的兴趣点的搜索结果的展示示意图;
图6是本申请实施例提供的一种示例性的兴趣点的搜索结果的展示示意图;
图7是本申请实施例提供的一种示例性的兴趣点的别名挖掘装置的结构示意图;
图8是本申请实施例提供的一种示例性的兴趣点的别名挖掘装置的结构示意图;
图9是本申请实施例提供的一种示例性的用来实现兴趣点的别名挖掘方法的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
兴趣点是地理信息系统中的地理实体,例如超市、餐馆等。兴趣点的信息包括地名、地址等。基于地图搜索推荐系统,可以为用户召回用户关注的兴趣点的信息。地图搜索推荐系统,是通过制定的通用地名地址数据规范和构建好的兴趣点的数据库,该兴趣点的数据库中包括兴趣点的信息,该兴趣点的信息包括兴趣点的标准地名地址,在通用标准地名地址模型与地名地址检索算法基础上构建的地图搜索推荐系统,提供面向行业的地图搜索服务和调用接口。
实际应用中,用户在搜索自己的兴趣点(例如超市、餐馆)时,输入搜索关键字后,可以通过上述系统为用户召回关注的兴趣点的信息。但是,用户输入的搜索关键字各种可能不同于兴趣点的标准地名地址,即输入的是兴趣点的别名,此时,可能无法为用户召回关注的兴趣点的信息。
相关技术中,传统的兴趣点的别名挖掘主要包括如下几种:
一、通过人工标注方式,即对兴趣点的标准地名地址数据库的别名字段进行人工标注。虽然精准度得到了保证,但面对海量的兴趣点效率过低。
二、基于用户点击日志训练语言模型,即将用户的搜索日志作为训练样本,训练语言模型,以挖掘兴趣点的别名。该方式过度依赖训练样本,对于未产生日志的别名信息无法挖掘,同时模型精准度也很难得到保证。
三、基于现有兴趣点的信息转化,删减修饰部分生成别名,是一种别名简称的形式。但是,该方式无法解决别名与原有名称存在差异的问题,如易初莲花与卜蜂莲花,原有名称叫易初莲花,后来叫卜蜂莲花,可能用户还沿用以前的易初莲花。
为解决以上技术问题,本申请实施例提供一种兴趣点的别名挖掘方法,能够对兴趣点的别名进行快速、准确、全面的挖掘。下面通过实施例进行详细说明。
图1是本申请实施例提供的一种示例性的兴趣点的别名挖掘方法的流程图。如图1所示,该兴趣点的别名挖掘方法至少包括如下步骤:
步骤101、获取目标兴趣点的招牌图像。
实际应用中,针对兴趣点的数据库中的兴趣点,可以预先收集各个兴趣点的招牌图像并保存至兴趣点的数据库。例如,可以从各种电子商务应用中获取兴趣点的招牌图像,因为,商家一般会在电子商务应用中上传门店挂有招牌的图像,即招牌图像。目标兴趣点是指当前需要进行别名挖掘的兴趣点。针对目标兴趣点,可以从兴趣点的数据库中获取预先收集的目标兴趣点的招牌图像。
步骤102、基于招牌图像,挖掘目标兴趣点的别名并保存。
招牌中的信息一般会包括文本,例如招牌名称,这些招牌名称在使用过程中通常会衍生出一些别名,因此,通常,招牌图像中会包含兴趣点的别名。
由于招牌图像中通常会包含兴趣点的别名,且别名的类型多样,本方案中,将目标兴趣点的招牌图像作为挖掘对象,自动进行别名挖掘,可以更加快速、准确、全面的挖掘出兴趣点的别名,后续如果用户使用基于招牌图像挖掘出的别名搜索兴趣点的信息,可以基于挖掘保存的该兴趣点的别名,为用户准确召回兴趣点的信息。
另外,与上述相关技术中人工标注方式相比,本方案中,由于是自动进行别名挖掘,即使面对海量的兴趣点,也可以保证效率。
与上述相关技术中基于用户点击日志训练语言模型的方式相比,本方案中,即使用户没有搜索过的兴趣点,也可以基于招牌图像进行别名的准确挖掘。
与上述相关技术中基于现有兴趣点的信息转化的方式相比,本方案中,由于别名的类型多样,如果招牌中包含的是与原有名称存在差异的名称,那么,也可以通过招牌图像挖掘出来,因此,别名挖掘的更准确、全面。
在一种实施方式中,上述步骤102中,基于招牌图像,挖掘目标兴趣点的别名,其具体实现方式可以包括:对招牌图像进行图像识别,以得到目标文本;基于目标文本,挖掘目标兴趣点的别名。
其中,目标文本是指用来挖掘目标兴趣点的别名的文本。由于目标兴趣点的别名通常是源自招牌名称,所以本实施例中将招牌名称作为目标文本,通过对招牌图像进行图像识别,得到该目标文本,之后,可以基于该目标文本快速挖掘出目标兴趣点的别名。
实际应用中,招牌图像中的文本除了目标文本以外,还可能会包含其它文本,例如,某超市的招牌上的文本包括招牌名称:××超市,广告语:最贴心的超市,所以,需要从招牌图像的许多文本中识别出目标文本。
进行图像识别时,可以将目标兴趣点的招牌图像输入预先训练的图像识别模型中,得到识别结果,该识别结果中至少包括目标文本。
预先训练图像识别模型时,可以预先收集一定数量的兴趣点样本的招牌图像样本,将招牌图像样本输入图像识别模型中,进行训练,直至图像识别模型收敛。
以上得到识别结果的具体实现方式可以包括:先定位至少一个文本行的位置,然后再对已经定位的至少一个文本行的内容进行文本内容识别,得到至少一个初始文本,基于至少一个初始文本,确定目标文本。确定目标文本时,可以将定位的文本行所占面积最大的初始文本作为目标文本。
上述基于目标文本,挖掘目标兴趣点的别名,其具体实现方式有多种,下面举例说明。
方式一、基于目标文本以及目标兴趣点的标准地名地址,挖掘目标兴趣点的别名。如此,将目标文本与标准地名地址结合,挖掘目标兴趣点的别名,参考的信息更多,挖掘的更准确。
具体的,基于目标文本以及目标兴趣点的标准地名地址,挖掘目标兴趣点的别名,其中一种实现方式可以包括:确定目标文本与标准地名地址的语义相似度;若语义相似度满足预设阈值,将目标文本确定为目标兴趣点的别名。
实际应用中,预设阈值可以根据实际情况设置。若语义相似度大于或者等于预设阈值,则可以认为语义相似度满足预设阈值。
如果目标文本与目标兴趣点的标准地名地址的语义相似,可能是直接源自标准地名地址的简称,也可能是与标准地名地址有差异的原有名称,例如易初莲花和卜蜂莲花,这时,目标文本中包含标准地名地址中没有的文本,这些情况下,目标文本都可能成为用户所使用的别名。
本实施例中,通过确定目标文本与标准地名地址的语义相似度,将与标准地名地址更相似的目标文本作为别名,别名挖掘的更准确、更全面。
其中,确定目标文本与标准地名地址的语义相似度,其具体实现方式可以包括:生成目标文本对应的第一特征向量;生成标准地名地址对应的第二特征向量;计算第一特征向量与第二特征向量的相似度,以得到语义相似度。
实际应用中,可以基于前述的图像识别模型,生成目标文本对应的第一特征向量。相应的,上述得到识别结果包括目标文本对应的第一特征向量,以上得到识别结果的具体实现方式中,确定目标文本之后,还生成目标文本对应的第一特征向量。具体的,生成目标文本对应的第一特征向量,可以包括:将目标文本输入第一上下文特征层,得到第一上下文特征,将第一上下文特征输入第一特征提取层,得到第一提取特征,将第一提取特征输入第一向量表征层,得到第一特征向量。
具体的,可以基于预先训练的兴趣点模型生成标准地名地址对应的第二特征向量。示例性地,可以包括:将标准地名输入第二上下文特征层,得到第二上下文特征,将第二上下文特征输入第二特征提取层,得到第二提取特征,将第二提取特征输入第二向量表征层,得到标准地名对应的特征向量。以及将标准地址输入第三上下文特征层,得到第三上下文特征,将第三上下文特征输入第三特征提取层,得到第三提取特征,将第三提取特征输入第三向量表征层,得到标准地址对应的特征向量。基于标准地名对应的特征向量和标准地址对应的特征向量,得到第二特征向量。
相应的,计算第一特征向量与第二特征向量的相似度,具体可以通过计算第一特征向量与第二特征向量之间的余弦相似度,以得到语义相似度。当然,也可以通过其它方式计算语义相似度。
另外,还可以将语义相似度的结果进行归一化处理,得到0~1之间的数值,基于处理后的语义相似度,判断是否满足预设阈值。例如,可以通过softmax对语义相似度的结果进行处理。如此,处理更加方便。
具体的,基于目标文本以及目标兴趣点的标准地名地址,挖掘目标兴趣点的别名,另一种实现方式可以包括:确定目标文本与标准地名地址之间的相同文本;基于相同文本,挖掘目标兴趣点的别名。
如果目标文本与目标兴趣点的标准地名地址之间有相同文本,该相同文本有可能衍生出用户所使用的别名,例如,一些简称,因此,本实施例中,也可以将与标准地名地址相同的文本部分,作为目标兴趣点的别名的挖掘对象,别名挖掘更全面。
确定目标文本与标准地名地址之间的相同文本时,具体可以包括:将目标文本分词,得到第一分词集合;将标准地名地址分词,得到第二分词集合;确定第一分词集合和第二分词集合的交集,以得到相同文本。
得到的相同文本是分词的集合。将文本进行分词的方式可以参考相关技术,此处不做赘述。
本实施例中,通过分词的方式,快速得到目标文本与标准地名地址之间的一些相同的分词,从而快速得到了上述相同文本。
相应的,基于相同文本,挖掘目标兴趣点的别名,具体实现方式可以包括:将交集中的分词排列组合,以得到至少一个排列组合词;将排列组合词确定为目标兴趣点的别名。
例如,目标文本为“美容美发主流造型”,其中,与标准地名地址相同的分词包括“主流”和“造型”,则可以对“主流”和“造型”进行排列组合,得到“主流”、“造型”和“主流造型”三个排列组合词,都可以作为挖掘出的目标兴趣点的别名。
本实施例中,通过对相同文本进行排行组合的方式,得到了各种可能的别名,挖掘出的别名更多,更全面。
需要说明的是,上述基于目标文本以及目标兴趣点的标准地名地址,挖掘目标兴趣点的别名的两种实现方式,可以择一实施,也可以配合实施,最后取两种方式挖掘出的别名的合集。
方式二、将目标文本直接确定为目标兴趣点的别名。如此,直接将招牌图像中的目标文本作为别名,简化了挖掘过程,挖掘速度更快。
需要说明的是,除了通过识别目标文本,基于目标文本挖掘目标兴趣点的别名,也可以通过其它方式挖掘目标兴趣点的别名。例如,可以提取招牌图像的目标区域的图像特征,该目标区域是招牌图像中面积最大的文本区域,以及生成已有别名的向量特征,计算该向量特征与图像特征的相似度。如果该相似度满足一定条件,对该目标区域进行文本识别,将识别的文本作为目标兴趣点的别名。
还需要说明的是,识别出目标文本之后,可以先判断目标文本是否为泛指词。
泛指词是泛指一类事物的词。例如美发店。一个兴趣点如果使用泛指词作为招牌名称,则不能明显区别于其它兴趣点,不具有代表意义,不容易成为别名。如果目标文本为泛指词,则认为是低质量信息。此时,可以不进行后续目标兴趣点的挖掘步骤。如此,对泛指词这样的低质量信息进行了过滤,从而提高了处理效率。
如果目标文本不是泛指词,则可以基于目标文本,挖掘目标兴趣点的别名。
判断目标文本是否为泛指词时,具体的,可以预先收集各种泛指词,得到泛指词集合。判断目标文本是否存在于泛指词集合中,如果是,则确定目标文本是泛指词,否则,确定目标文本不是泛指词。
对兴趣点的数据库中的各个兴趣点按照以上相关实施例的方案完成别名的挖掘之后,将挖掘出的别名保存在兴趣点的数据库中。例如,可以将挖掘出的别名添加至该兴趣点的别名字段。之后,该兴趣点的数据库的数据可以上线。具体的,将该兴趣点的数据库的数据同步至地图搜索推荐系统的线上数据库,具体可以为es数据库,es是Elasticsearch的简写,es是一个基于Lucene的搜索服务器。
实际应用中,服务端设置地图搜索推荐系统。用户可以通过客户端搜索自己的兴趣点,输入搜索关键字后,如果输入的是目标兴趣点的别名,且该目标兴趣点的别名已经通过以上别名挖掘方案挖掘出来并保存,那么,地图搜索推荐系统从es数据库中召回兴趣点时,召回的兴趣点的信息中就会包含该目标兴趣点的信息。
在一些实施方式中,上述方法还可以包括:在客户端通过目标兴趣点的别名搜索目标兴趣点的情况下,将目标兴趣点的别名与目标兴趣点的标准地名地址一同携带在搜索结果中发送至客户端,以使客户端基于搜索结果,将目标兴趣点的别名与目标兴趣点的标准地名地址一同展示。
实际应用中,有时候用户可能不知道兴趣点的标准地名地址,只知道别名,且该别名还是原有名称,此时,可以将目标兴趣点的别名与标准地名地址一同展示,避免用户误以为未召回目标兴趣点的信息。
下面以具体应用场景为例,对本申请实施例提供的一种兴趣点的别名挖掘方法进行更加详细地说明
本实施例,涉及地图搜索业务,支撑配送、打车、用户(C,Consumer)端出行业务。服务端提供地图搜索推荐系统,应用过程中,用户可以通过客户端搜索具体的兴趣点。数据库中的兴趣点的别名字段(例如sub name字段)直接影响搜索结果,用户在搜索具体的兴趣点时,由于用户输入的搜索关键字(query)如果是当前兴趣点的别名,现有的兴趣点的别名字段不存在或者精准度不够很难召回相应的兴趣点。
例如,用户输入的易初莲花,但真实搜索目的是卜蜂莲花。由于卜蜂莲花的别名是易初莲花,导致缺失别名字段而未召回。
综上,需要从两方面优化:
一方面、挖掘兴趣点的别名并提升挖掘兴趣点的别名的准确性。
另一方面、建立更完善的兴趣点的数据,同时提取别名,完善地图数据,提供更优质的地图服务。
针对用户搜索兴趣点的别名信息无法实现召回的问题,结合上述相关技术的缺点,本方案提出一种基于图片识别与语义相似度结合的兴趣点别名挖掘方法,其核心思想依托已有的兴趣点的信息与兴趣点的招牌图像,利用图像识别模型,识别出主体信息(即目标文本),从而与现有兴趣点的信息所包括的标准地名地址进行语义相似度匹配,从而完成搜索召回任务。
在线上使用过程中,通过挖掘出来的兴趣点的别名,映射到sub name字段上,建立一对多的关系,从而在原有结构基础之上,针对用户输入的query,结合兴趣点的sub name结果,基于es检索实现增强排序和召回层面兴趣点的限定或提权,从而提升召回效果。在排序过程中推荐给用户,提升用户搜索体验。
参见图2、图3和图4,下面对本方案进行详细说明:
步骤一、利用兴趣点的数据库中已有的兴趣点的招牌图像样本和兴趣点的标准地名地址样本,训练深度图像语义相似度模型。该深度图像语义相似度模型的网络架构包括图像识别模型和兴趣点模型。图像识别模型的网络架构至少包括第一上下文特征层、第一特征提取层和第一向量表征层。兴趣点模型至少包括第二上下文特征层和第三上下文特征层,第二特征提取层和第三特征提取层,第二向量表征层和第三向量表征层。模型训练的具体方式可以参考相关技术,此处不做赘述。
其中,预先收集保存的招牌图像包含标注信息以区别于其它图像。招牌图像输入深度图像语义相似度模型之后,首先,由图像识别模型识别出目标文本,之后,将目标文本输入第一上下文特征层。图像识别模型识别目标文本的主要思路是先定位文本行位置,然后再对已经定位的文本行内容进行识别。
步骤二、从数据库中获取目标兴趣点的标准地名地址和招牌图像,输入深度图像语义相似度模型,得到语义相似度。
本步骤中,得到语义相似度的具体过程包括:将招牌图像输入图像识别模型,以对招牌图像进行识别,得到包含目标文本和目标文本对应的第一特征向量的识别结果。将目标兴趣点的标准地名地址所包括的标准地名和标准地址分别输入兴趣点模型,得到标准地名地址对应的第二特征向量。计算并判断第一特征向量和第二特征向量的语义相似度。
另外,可以先对数据库的数据进行预处理,去除不符合要求的数据。
步骤三、判断语义相似度是否满足预设阈值。
语义相似度结果是通过softmax处理后的结果,如果满足预设阈值,则将目标文本作为别名保存,否则,将目标文本写入数据库中,暂判定为非别名。
步骤四、将挖掘出的目标兴趣点的别名进行写入地图搜索推荐系统的线上数据,即同步es,针对用户输入的query,结合目标兴趣点的sub name结果,基于es召回兴趣点。此时,可以召回第一预设数量(例如100个)的兴趣点,之后,对召回的兴趣点排序,推荐第二预设数量(例如10个)的排序靠前的兴趣点,例如兴趣点1、兴趣点2、兴趣点3……。
基于es检索实现增强排序和召回层面兴趣点的限定或提权,从而提升召回效果。在对es召回的兴趣点排序过程中,将通过目标兴趣点的别名召回的结果推荐给用户,提升用户搜索体验。如此,由于召回的结果中包含了利用挖掘出的目标兴趣点的别名召回的兴趣点,在原有基础之上实现了扩召回。
另外,可以根据用户的搜索关键字、推荐的兴趣点、用户操作等日志,训练排序模型,利用该排序模型对召回的兴趣点排序。
本方案的前端(即客户端)展示:
选取高置信度别名进行前端展示。如图5和图6所示,对于打车搜索,当用户搜索易初莲花时,可以展示相应的搜索结果。但是,由于用户搜索的是易初莲花这个别名,搜索结果中是卜蜂莲花,很容易给用户造成未召回相关兴趣点的情况,此时,如图6所示,在搜索结果中将卜蜂莲花与易初莲花一同对应展示,如此,通过前端交互展示,提高了用户体验,实现有效打车任务。
本方案创新性的采用招牌图像、兴趣点的标准地名与兴趣点的标准地址的,实现兴趣点的别名挖掘,在用户输入query之后,实现扩召回,提升地图搜索业务服务质量。
与相关技术的方案相比,本方案的提升效果包括:
第一、基于深度图像语义相似度模型这一深度学习模型,对招牌图像进行别名挖掘,解决人工标注的周期长问题,实现自动化挖掘,即使面对海量的兴趣点,也可以保证效率。
第二、对比用户点击日志训练语言模型的方式,对于未产生日志的别名数据实现挖掘,同时模型精准度得到保证。
第三、对比基于现有兴趣点的信息转化,删减修饰部分生成别名,如果招牌中包含的是与原有名称存在差异的名称,那么,也可以通过招牌图像挖掘出来,因此,别名挖掘的更准确、全面。
另外,该方式属于仅进行了缩略词挖掘,并未对在字符上有区别的真正的别名实现挖掘,本方案实现对各种类型的别名进行挖掘,模型覆盖度更广。又另外,本方案采用的是用户店铺的招牌图像,实效性优于对比方案,对于整个搜索业务来说,其贡献的价值更大。并且,本方案挖掘方案是采用深度学习模型挖掘真是存在的别名,并非通过删减字实现生产新的别名,在搜索检索过程中,可有效避免杂质的产生,精准度更好,同时对性能不会产生过大压力,投资回报率(ROI,Return on Investment,)更优。
本方案可以大幅度提升地图搜索业务服务质量,有广阔的应用空间。本方案可应用在地图搜索项目中,应用于集团配送、打车、公交等场景。
图7是本申请实施例的一种示例性的兴趣点的别名挖掘装置的结构示意图。如图7所示,该兴趣点的别名挖掘装置700包括:
获取模块701,用于获取目标兴趣点的招牌图像;
挖掘模块702,用于基于招牌图像,挖掘目标兴趣点的别名并保存。
在一种实施方式中,挖掘模块702,具体用于:
对招牌图像进行图像识别,以得到目标文本;
基于目标文本,挖掘目标兴趣点的别名。
在一种实施方式中,挖掘模块702,具体用于:
基于目标文本以及目标兴趣点的标准地名地址,挖掘目标兴趣点的别名。
在一种实施方式中,挖掘模块702,具体用于:
确定目标文本与标准地名地址的语义相似度;
若语义相似度满足预设阈值,将目标文本确定为目标兴趣点的别名。
在一种实施方式中,挖掘模块702,具体用于:
生成目标文本对应的第一特征向量;
生成标准地名地址对应的第二特征向量;
计算第一特征向量与第二特征向量的相似度,以得到语义相似度。
在一种实施方式中,挖掘模块702,具体用于:
确定目标文本与标准地名地址之间的相同文本;
基于相同文本,挖掘目标兴趣点的别名。
在一种实施方式中,挖掘模块702,具体用于:
将目标文本分词,得到第一分词集合;
将标准地名地址分词,得到第二分词集合;
确定第一分词集合和第二分词集合的交集,以得到相同文本。
在一种实施方式中,挖掘模块702,具体用于:
将交集中的分词排列组合,以得到至少一个排列组合词;
将排列组合词确定为目标兴趣点的别名。
在一种实施方式中,挖掘模块702,具体用于:
将目标文本直接确定为目标兴趣点的别名。
在一种实施方式中,如图8所示,还包括:
发送模块703,用于在客户端通过目标兴趣点的别名搜索目标兴趣点的情况下,将目标兴趣点的别名与目标兴趣点的标准地名地址一同携带在搜索结果中发送至客户端,以使客户端基于搜索结果,将目标兴趣点的别名与目标兴趣点的标准地名地址一同展示。
本申请实施例各装置中的各模块的功能可以参见上述兴趣点的别名挖掘方法实施例中的对应描述,在此不再赘述。
本申请实施例还提供一种电子设备,该电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行计算机程序时实现如以上任一实施例中的兴趣点的别名挖掘方法。
图9是本申请实施例提供的一种电子设备的结构示意图。如图9所示,该电子设备可以包括:处理器901、通信接口902、存储器903和通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信。处理器901可以调用存储器903中的计算机程序,以执行以上任一实施例中的兴趣点的别名挖掘方法。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如以上任一实施例中的兴趣点的别名挖掘方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
应理解的是,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (22)
1.一种兴趣点的别名挖掘方法,其特征在于,包括:
获取目标兴趣点的招牌图像;
基于所述招牌图像,挖掘所述目标兴趣点的别名并保存。
2.根据权利要求1所述的方法,其特征在于,所述基于所述招牌图像,挖掘所述目标兴趣点的别名,包括:
对所述招牌图像进行图像识别,以得到目标文本;
基于所述目标文本,挖掘所述目标兴趣点的别名。
3.根据权利要求2所述的方法,其特征在于,所述基于所述目标文本,挖掘所述目标兴趣点的别名,包括:
基于所述目标文本以及所述目标兴趣点的标准地名地址,挖掘所述目标兴趣点的别名。
4.根据权利要求3所述的方法,其特征在于,所述基于所述目标文本以及所述目标兴趣点的标准地名地址,挖掘所述目标兴趣点的别名,包括:
确定所述目标文本与所述标准地名地址的语义相似度;
若所述语义相似度满足预设阈值,将所述目标文本确定为所述目标兴趣点的别名。
5.根据权利要求4所述的方法,其特征在于,所述确定所述目标文本与所述标准地名地址的语义相似度,包括:
生成所述目标文本对应的第一特征向量;
生成所述标准地名地址对应的第二特征向量;
计算所述第一特征向量与所述第二特征向量的相似度,以得到所述语义相似度。
6.根据权利要求3所述的方法,其特征在于,所述基于所述目标文本以及所述目标兴趣点的标准地名地址,挖掘所述目标兴趣点的别名,包括:
确定所述目标文本与所述标准地名地址之间的相同文本;
基于所述相同文本,挖掘所述目标兴趣点的别名。
7.根据权利要求6所述的方法,其特征在于,所述确定所述目标文本与所述标准地名地址之间的相同文本,包括:
将所述目标文本分词,得到第一分词集合;
将所述标准地名地址分词,得到第二分词集合;
确定所述第一分词集合和所述第二分词集合的交集,以得到所述相同文本。
8.根据权利要求7所述的方法,其特征在于,所述基于所述相同文本,挖掘所述目标兴趣点的别名,包括:
将所述交集中的分词排列组合,以得到至少一个排列组合词;
将所述排列组合词确定为所述目标兴趣点的别名。
9.根据权利要求2所述的方法,其特征在于,所述基于所述目标文本,挖掘所述目标兴趣点的别名,包括:
将所述目标文本直接确定为所述目标兴趣点的别名。
10.根据权利要求1-9任一项所述的方法,其特征在于,还包括:
在客户端通过所述目标兴趣点的别名搜索所述目标兴趣点的情况下,将所述目标兴趣点的别名与所述目标兴趣点的标准地名地址一同携带在搜索结果中发送至所述客户端,以使所述客户端基于所述搜索结果,将所述目标兴趣点的别名与所述目标兴趣点的标准地名地址一同展示。
11.一种兴趣点的别名挖掘装置,其特征在于,包括:
获取模块,用于获取目标兴趣点的招牌图像;
挖掘模块,用于基于所述招牌图像,挖掘所述目标兴趣点的别名并保存。
12.根据权利要求11所述的装置,其特征在于,所述挖掘模块,具体用于:
对所述招牌图像进行图像识别,以得到目标文本;
基于所述目标文本,挖掘所述目标兴趣点的别名。
13.根据权利要求12所述的装置,其特征在于,所述挖掘模块,具体用于:
基于所述目标文本以及所述目标兴趣点的标准地名地址,挖掘所述目标兴趣点的别名。
14.根据权利要求13所述的装置,其特征在于,所述挖掘模块,具体用于:
确定所述目标文本与所述标准地名地址的语义相似度;
若所述语义相似度满足预设阈值,将所述目标文本确定为所述目标兴趣点的别名。
15.根据权利要求14所述的装置,其特征在于,所述挖掘模块,具体用于:
生成所述目标文本对应的第一特征向量;
生成所述标准地名地址对应的第二特征向量;
计算所述第一特征向量与所述第二特征向量的相似度,以得到所述语义相似度。
16.根据权利要求13所述的装置,其特征在于,所述挖掘模块,具体用于:
确定所述目标文本与所述标准地名地址之间的相同文本;
基于所述相同文本,挖掘所述目标兴趣点的别名。
17.根据权利要求16所述的装置,其特征在于,所述挖掘模块,具体用于:
将所述目标文本分词,得到第一分词集合;
将所述标准地名地址分词,得到第二分词集合;
确定所述第一分词集合和所述第二分词集合的交集,以得到所述相同文本。
18.根据权利要求17所述的装置,其特征在于,所述挖掘模块,具体用于:
将所述交集中的分词排列组合,以得到至少一个排列组合词;
将所述排列组合词确定为所述目标兴趣点的别名。
19.根据权利要求12所述的装置,其特征在于,所述挖掘模块,具体用于:
将所述目标文本直接确定为所述目标兴趣点的别名。
20.根据权利要求11-19任一项所述的装置,其特征在于,还包括:
发送模块,用于在客户端通过所述目标兴趣点的别名搜索所述目标兴趣点的情况下,将所述目标兴趣点的别名与所述目标兴趣点的标准地名地址一同携带在搜索结果中发送至所述客户端,以使所述客户端基于所述搜索结果,将所述目标兴趣点的别名与所述目标兴趣点的标准地名地址一同展示。
21.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-10任一项所述的方法。
22.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-10任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110309877.9A CN113515944A (zh) | 2021-03-23 | 2021-03-23 | 兴趣点的别名挖掘方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110309877.9A CN113515944A (zh) | 2021-03-23 | 2021-03-23 | 兴趣点的别名挖掘方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113515944A true CN113515944A (zh) | 2021-10-19 |
Family
ID=78061951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110309877.9A Pending CN113515944A (zh) | 2021-03-23 | 2021-03-23 | 兴趣点的别名挖掘方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113515944A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103914546A (zh) * | 2014-04-09 | 2014-07-09 | 百度在线网络技术(北京)有限公司 | 数据更新方法及其装置 |
CN106959958A (zh) * | 2016-01-11 | 2017-07-18 | 阿里巴巴集团控股有限公司 | 地图兴趣点简称获取方法和装置 |
CN109145219A (zh) * | 2018-09-10 | 2019-01-04 | 百度在线网络技术(北京)有限公司 | 基于互联网文本挖掘的兴趣点有效性判断方法和装置 |
CN110609879A (zh) * | 2018-06-14 | 2019-12-24 | 百度在线网络技术(北京)有限公司 | 兴趣点判重方法、装置、计算机设备及存储介质 |
CN111026937A (zh) * | 2019-11-13 | 2020-04-17 | 百度在线网络技术(北京)有限公司 | 提取poi名称的方法、装置、设备和计算机存储介质 |
CN111859002A (zh) * | 2020-07-20 | 2020-10-30 | 北京百度网讯科技有限公司 | 兴趣点名称生成方法及装置、电子设备和介质 |
-
2021
- 2021-03-23 CN CN202110309877.9A patent/CN113515944A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103914546A (zh) * | 2014-04-09 | 2014-07-09 | 百度在线网络技术(北京)有限公司 | 数据更新方法及其装置 |
CN106959958A (zh) * | 2016-01-11 | 2017-07-18 | 阿里巴巴集团控股有限公司 | 地图兴趣点简称获取方法和装置 |
CN110609879A (zh) * | 2018-06-14 | 2019-12-24 | 百度在线网络技术(北京)有限公司 | 兴趣点判重方法、装置、计算机设备及存储介质 |
CN109145219A (zh) * | 2018-09-10 | 2019-01-04 | 百度在线网络技术(北京)有限公司 | 基于互联网文本挖掘的兴趣点有效性判断方法和装置 |
CN111026937A (zh) * | 2019-11-13 | 2020-04-17 | 百度在线网络技术(北京)有限公司 | 提取poi名称的方法、装置、设备和计算机存储介质 |
CN111859002A (zh) * | 2020-07-20 | 2020-10-30 | 北京百度网讯科技有限公司 | 兴趣点名称生成方法及装置、电子设备和介质 |
Non-Patent Citations (1)
Title |
---|
成保梅;韩景灵;: "融合情境因素的电子商务用户兴趣挖掘仿真", 《计算机仿真》, no. 04, 15 April 2020 (2020-04-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108460014B (zh) | 企业实体的识别方法、装置、计算机设备及存储介质 | |
CN108052577B (zh) | 一种通用文本内容挖掘方法、装置、服务器及存储介质 | |
CN109858555B (zh) | 基于图像的数据处理方法、装置、设备及可读存储介质 | |
CN107862027B (zh) | 检索意图识别方法、装置、电子设备及可读存储介质 | |
CN110008300B (zh) | Poi别名的确定方法、装置、计算机设备和存储介质 | |
CN107656913B (zh) | 地图兴趣点地址提取方法、装置、服务器和存储介质 | |
CN109299320B (zh) | 一种信息交互方法、装置、计算机设备和存储介质 | |
US11403766B2 (en) | Method and device for labeling point of interest | |
WO2020233269A1 (zh) | 由2d图像重建3d模型的方法、装置、设备及存储介质 | |
CN107657048A (zh) | 用户识别方法及装置 | |
US11106933B2 (en) | Method, device and system for processing image tagging information | |
CN110019703B (zh) | 数据标记方法及装置、智能问答方法及系统 | |
CN110609879B (zh) | 兴趣点判重方法、装置、计算机设备及存储介质 | |
CN108829661B (zh) | 一种基于模糊匹配的新闻主体名称提取方法 | |
CN110727816A (zh) | 兴趣点类别确定方法和装置 | |
JP2018537760A (ja) | アドレス情報に基づいたアカウントマッピングの方法及び装置 | |
CN113609892A (zh) | 深度学习与景区知识图谱融合的手写诗词识别方法 | |
CN113343012A (zh) | 一种新闻配图方法、装置、设备及存储介质 | |
CN111831929A (zh) | 一种获取poi信息的方法及装置 | |
CN116662583B (zh) | 一种文本生成方法、地点检索方法及相关装置 | |
CN107688600B (zh) | 知识点挖掘方法及装置 | |
CN110647595B (zh) | 一种新增兴趣点的确定方法、装置、设备和介质 | |
CN113515944A (zh) | 兴趣点的别名挖掘方法、装置、设备及存储介质 | |
CN107169065B (zh) | 一种特定内容的去除方法和装置 | |
CN113421172B (zh) | 一种政策信息推送方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |