CN112800160A - 基于地图场景的搜索排序优化方法、系统、装置及可读存储介质 - Google Patents
基于地图场景的搜索排序优化方法、系统、装置及可读存储介质 Download PDFInfo
- Publication number
- CN112800160A CN112800160A CN202110125744.6A CN202110125744A CN112800160A CN 112800160 A CN112800160 A CN 112800160A CN 202110125744 A CN202110125744 A CN 202110125744A CN 112800160 A CN112800160 A CN 112800160A
- Authority
- CN
- China
- Prior art keywords
- interest point
- optimization
- search
- geographic
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Remote Sensing (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供基于地图场景的搜索排序优化方法、系统及装置,基于排序优化的搜索方法、装置及可读存储介质。本发明对位置定位服务的召回结果中加入了自有用户属性,结合文本相似度属性及POI热度值来确定各POI的重要程度,并进而产生相应的优化调整因子,使用户的搜索结果能够按照优化调整因子从大到小的顺序进行排序,由此实现一种基于地图场景下的融合了用户习惯的搜索排序方法,并使得用户搜索字数减少0.5%‑1.3%;点击排位提升3%‑5%。
Description
技术领域
本发明涉及搜索引擎和排序技术领域,尤其涉及基于地图场景的搜索排序优化方法、系统及装置,基于排序优化的搜索方法、装置及可读存储介质。
背景技术
顺风车选址搜索场景下,输入的是,地理相关的检索query及用户位置,输出的是用户想要的POI。如何能够更加精准地找到用户想要的POI,提高满意度,是评价搜索效果的最关键指标。地图场景下的query分析,只需要处理地理相关的文本,多样性不如网页搜索,看起来会简单一些。但是,地理文本通常比较短,并且用户大部分的需求是唯一少量结果,要求精准度非常高,如何能够做好地图场景下的文本分析,并提升搜索结果的质量,是充满挑战的。
发明内容
有鉴于现有技术的上述缺陷,本发明提供基于地图场景的搜索排序优化方法、方法、装置、系统及介质,用于解决现有技术中不能很好地做到地图场景下的文本分析,并提升搜索结果的质量等技术问题。
为实现上述目的,本发明的第一方面提供了一种基于地图场景的搜索排序优化方法,包括:接收请求方基于地图场景下的搜索请求;所述搜索请求包括用户信息及当前输入的关键词;根据所述用户信息获取用户在预设时间段内的多个地理兴趣点的日志数据,据以生成地理兴趣点集合并计算该集合中各地理兴趣点的热度值;计算该关键词与各地理兴趣点名称之间的文本相似度值;生成正相关于所述热度值及文本相似度值的排序结果优化因子;按照所述排序结果优化因子从大到小的顺序调整所述地理兴趣点集合中各地理兴趣点的顺序,并将调整后的地理兴趣点集合传送至请求方的地图场景中。
在本发明的较佳实施方式中,所述地理兴趣点的热度值的计算方式包括:根据预设时间段内的各地理兴趣点的日志数据,计算各地理兴趣点的平均点击次数和最大点击次数;计算所述平均点击次数的对数计算值与所述最大点击次数的对数计算值的比值;令所述比值为该地理兴趣点的热度值。
在本发明的另一较佳实施方式中,所述计算该关键词与各地理兴趣点名称之间的文本相似度值,包括:利用余弦相似度算法计算该关键词与各地理兴趣点名称之间的中文文本相似度值。
在本发明的另一较佳实施方式中,所述排序结果优化因子的生成方式包括:若关键词与地理兴趣点名称一致且该地理兴趣点的热度值大于第一预设热度阈值,则生成使该地理兴趣点排序靠前的较高的排序结果优化因子;若地理兴趣点名称的字符长度大于关键词的字符长度,且二者之间的文本相似度值大于预设相似度阈值,且该地理兴趣点的热度值大于第二预设热度阈值,并且该地理兴趣点的点击次数大于1,则令排序结果优化因子的取值为该地理兴趣点的热度值;其中,所述第一预设热度阈值大于第二预设热度阈值;否则,令排序结果优化因子的取值为0。
为实现上述目的,本发明的第二方面提供一种基于排序优化的搜索方法,包括:发送基于地图场景下的搜索请求;所述搜索请求包括用户信息及当前输入的关键词;接收关联于所述关键词的地理兴趣点结合;所述地理兴趣点集合中的各地理兴趣点按照排序结果优化因子从大到小的顺序排列。
在本发明的另一较佳实施方式中,所述排序结果优化因子的计算方式包括:根据所述用户信息获取该用户在预设时间段内的多个地理兴趣点的日志数据,据以生成地理兴趣点集合并计算该集合中各地理兴趣点的热度值;计算该关键词与各地理兴趣点名称之间的文本相似度值;生成正相关于所述热度值及文本相似度值的所述排序结果优化因子。
为实现上述目的,本发明的第三方面提供一种基于地图场景的搜索排序优化系统,包括:发送终端,发送基于地图场景下的搜索请求;所述搜索请求包括用户信息及当前输入的关键词;接收终端,与所述发送终端通信连接;所述接收终端接收所述搜索请求;根据所述用户信息获取该用户在预设时间段内的多个地理兴趣点的日志数据,据以生成地理兴趣点集合并计算该集合中各地理兴趣点的热度值;计算该关键词与各地理兴趣点名称之间的文本相似度值;生成正相关于所述热度值及文本相似度值的排序结果优化因子;按照所述排序结果优化因子从大到小的顺序调整所述地理兴趣点集合中各地理兴趣点的顺序,并将调整后的地理兴趣点集合传送至所述发送端。
为实现上述目的,本发明的第四方面提供一种基于地图场景的搜索排序优化装置,包括接收模块,用于接收请求方基于地图场景下的搜索请求;所述搜索请求包括用户信息及当前输入的关键词;热度计算模块,用于根据所述用户信息获取该用户在预设时间段内的多个地理兴趣点的日志数据,据以生成地理兴趣点集合并计算该集合中各地理兴趣点的热度值;相似度计算模块,用于计算该关键词与各地理兴趣点名称之间的文本相似度值;优化因子计算模块,用于生成正相关于所述热度值及文本相似度值的排序结果优化因子;发送模块,用于按照所述排序结果优化因子从大到小的顺序调整所述地理兴趣点集合中各地理兴趣点的顺序,并将调整后的地理兴趣点集合传送至请求方的地图场景中。
为实现上述目的,本发明的第五方面提供一种基于排序优化的搜索装置,包括:发送模块,用于发送基于地图场景下的搜索请求;所述搜索请求包括用户信息及当前输入的关键词;接收模块,用于接收关联于所述关键词的地理兴趣点结合;所述地理兴趣点集合中的各地理兴趣点按照排序结果优化因子从大到小的顺序排列。
为实现上述目的,本发明的第六方面提供一种计算机可读存储介质,其上存储有第一计算机程序和/或第二计算机程序,所述第一计算机程序被处理器执行时实现所述基于地图场景的搜索排序优化方法;所述第二计算机程序被处理器执行时实现所述基于排序优化的搜索方法。
本发明提供基于地图场景的搜索排序优化方法、方法、装置、系统及介质,具有以下技术效果:本发明对位置定位服务的召回结果中加入了自有用户属性,结合文本相似度属性及POI热度值来确定各POI的重要程度,并进而产生相应的优化调整因子,使用户的搜索结果能够按照优化调整因子从大到小的顺序进行排序,由此实现一种基于地图场景下的融合了用户习惯的搜索排序方法,并使得用户搜索字数减少0.5%-1.3%;点击排位提升3%-5%。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明一实施例中基于地图场景的搜索排序优化方法的流程示意图。
图2是本发明一实施例中基于排序优化的搜索方法的流程示意图。
图3是本发明一实施例中基于地图场景的搜索排序优化系统的结构示意图。
图4是本发明一实施例中基于地图场景的搜索排序优化装置的结构示意图。
图5是本发明一实施例中基于排序优化的搜索装置的结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图示中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
本发明旨在乘客发单选址时下方出现POI名称排序是原始的高德接口顺序,通过大数据分析算法融合用户实时点击数据,重新排列POI信息的顺序,让更有可能被用户点击的数据排位升高、减少用户输入字数、提升发单转化率。为了阐释的目的而描述了本发明的一些示例性实施例,需要理解的是,本发明可通过附图中没有具体示出的其他方式来实现。
如图1所示,展示了本发明一实施例中基于地图场景的搜索排序优化方法的流程示意图,主要包括如下步骤S11~S15。
需说明的是,所述基于地图场景的搜索排序优化方法应用于服务器,所述服务器可以根据功能、负载等多种因素布置在一个或多个实体服务器上,也可以由分布的或集中的服务器集群构成,本实施例不作限定。
步骤S11:接收请求方基于地图场景下的搜索请求;所述搜索请求至少包括用户信息及当前输入的关键词等。应理解,本实施例所涉及的地图是电子地图,是由电子计算机控制所生成的地图,基于数字制图技术的可视化的屏幕地图,包括但不限于高德地图、谷歌地图、百度地图等。
应理解的是,本实施例所指的基于地图场景下的搜索请求,主要是指在地图软件中发出搜索请求,例如在谷歌地图、百度地图、搜狗地图、高德地图等软件中搜索目的地位置。另外,所述用户信息包括但不限于如用户ID、用户名称、用户在地图软件中的历史行程轨迹等信息;其中,用户信息可直接从地图软件中获取,也可在用户登录与该地图软件相关联的其他app后获取,例如在用户登陆微信、支付宝、美团等关联app后获取该用户信息。
步骤S12:根据所述用户信息获取用户在预设时间段内的多个地理兴趣点的日志数据,据以生成地理兴趣点集合并计算所述集合中各地理兴趣点的热度值。
在本实施例中,所述地理兴趣点是指POI兴趣点,POI是Point of Interest(兴趣点)的缩写,在地理信息系统中,一个POI可以是一栋房子、一个商铺、一个邮筒或一个公交站等。每个POI包含至少四方面信息,名称、类别、坐标、分类。全面的POI讯息是导航地图的必备资讯,及时的POI信息点能提醒用户路况的分支及周边建筑的详尽信息,也能方便导航中查到你所需要的各个地方,选择最为便捷和通畅的道路来进行路径规划,因此,导航地图POI多少状况直接影响到导航的好用程度。
在一些示例中,可通过大数据挖掘顺风车大盘用户在历史3个月中的POI点击日志数据,获取每天每个POI的点击次数(poi_click)。计算每个POI在这段时间内点击次数的平均值;由于需要进行对数计算,因此当计算得到的平均值为1时则需加一个使该平均值大于1的数值,例如加0.5,从而避免出现取对数后热度为0的情况。计算每个POI在这段时间内点击次数的最大值。计算每个POI 在这段时间内点击次数平均值的对数计算值与点击次数最大值的对数计算值的比值,令计算所得的比值为该POI的热度值。为便于理解,现将结合公式1来展示热度值:
其中,poi_hot是指POI的热度值;poi_click是指该POI在特定时间段内点击次数的平均值;click_max是指该POI在特定时间段内点击次数的最大值。
步骤S13:计算所述关键词与各地理兴趣点名称之间的文本相似度值。需说明的是,由于不同语言的构造并不相同,因此需在相同语言下才会有相似度比较的意义。另外,本实施例中用以计算文本相似度的算法包括但不限于余弦相似度算法、皮尔森相关系数算法、Jaccard相似系数算法、对数似然相似度算法等。
为便于理解,下文以余弦相似度计算中文文本之间的相似度为例来进行相应说明。所述余弦相似度通过一个向量空间中两个向量之间的夹角余弦值作为衡量两个个体之间的差异大小,具体计算步骤如下:
步骤a)通过中文分词算法将完整的句子分割为独立的词的集合,分割得到两个词集合。中分分词算法包括但不限于入Jieba分词算法、SnowNLP分词算法、 PkuSeg分词算法、THULAC分词算法或者HanLP算法等,本实施例不作限定。
步骤b)计算两个词集合的并集。
步骤c)计算各所述词集合的词频率并将词频向量化。举例来说,使用分词工具将A句分割后得到x1个A1、x2个A2、x3个A3、x4个A4、x5个A5,因此可得到相应的向量a(x1,x2,x3,x4,x5);使用分词工具将B句分割后得到 y1个B1、y2个B2、y3个B3、y4个B4、y5个B5,因此可得到相应的向量b(y1, y2,y3,y4,y5)。
步骤d)利用向量a和向量b,根据余弦相似度计算公式求出文本相似度。余弦相似度计算公式如下:
其中,公式中的a代表向量a;b代表向量b;x代表向量a中各元素的出现次数;y代表向量b中各元素的出现次数。
步骤S14:生成正相关于所述热度值及所述文本相似度值的排序结果优化因子。具体而言,可按下述三种情况分别生成排序结果优化因子:
情况1)若关键词与地理兴趣点名称一致且该地理兴趣点的热度值大于第一预设热度阈值,则可确定该地理兴趣点较为重要,因此生成较高的排序结果优化因子,以确保其排序靠前。例如,关键词与地理兴趣点名称一致(即name=query) 且该地理兴趣点的热度值(poi_hot)>0.2,则调整参数为1。
情况2)若地理兴趣点名称的字符长度大于关键词的字符长度且二者之间的文本相似度值大于预设相似度阈值,并且该地理兴趣点的热度值大于第二预设热度阈值,并且热点次数至少大于1,则可确定相应的搜索结果为一般重要,令排序结果优化因子等于该地理兴趣点的热度值;其中,第一预设热度阈值大于第二预设热度阈值。例如,若length(name)>length(query),且1>similarity>0.2,且 poi_hot>0.15,且cnt>1(cnt表示热点次数),则排序结果优化因子=poi_hot。
情况3)若为上述两种情况之外的其他情况,则可确定相应的搜索结果为不重要,可令排序结果优化因子为0。
步骤S15:按照所述排序结果优化因子从大到小的顺序调整所述地理兴趣点集合中各地理兴趣点的顺序,并将调整后的地理兴趣点集合传送至请求方的地图场景中。也即,按照排序结果优化因子对地理兴趣点集合重新排序后,发送给用户端,从而实现一种基于地图场景下的融合了用户习惯的搜索排序方法。
如图2所示,展示了本发明一实施例中基于排序优化的搜索方法的流程示意图,主要包括步骤S21和S22。
需说明的是,本实施例中基于排序优化的搜索方法可应用于如智能手机、平板电脑、智能手环、智能手表、智能头盔、台式电脑、笔记本电脑等个人电脑,本实施例不作限定。
步骤S21:发送基于地图场景下的搜索请求;所述搜索请求包括用户信息及当前输入的关键词。
步骤S22:接收关联于所述关键词的地理兴趣点结合;所述地理兴趣点集合中的各地理兴趣点按照排序结果优化因子从大到小的顺序排列。
在本实施例中,所述排序结果优化因子的计算方式包括:根据所述用户信息获取该用户在预设时间段内的多个地理兴趣点的日志数据,据以生成地理兴趣点集合并计算该集合中各地理兴趣点的热度值;根据所述关键词计算该关键词与各地理兴趣点名称之间的文本相似度值;根据计算所得的各地理兴趣点的热度值以及该关键词与各地理兴趣点名称之间的文本相似度值,生成正相关于所述热度值及文本相似度值的所述排序结果优化因子。
在本实施例中,可通过大数据挖掘顺风车大盘用户在历史3个月中的POI点击日志数据,获取每天每个POI的点击次数(poi_click)。计算每个POI在这段时间内点击次数的平均值;由于需要进行对数计算,因此当计算得到的平均值为 1时则需加一个使该平均值大于1的数值,例如加0.5,从而避免出现取对数后热度为0的情况。计算每个POI在这段时间内点击次数的最大值。计算每个POI 在这段时间内点击次数平均值的对数计算值与点击次数最大值的对数计算值的比值,令计算所得的比值为该POI的热度值。为便于理解,现将结合公式1来展示热度值:
其中,poi_hot是指POI的热度值;poi_click是指该POI在特定时间段内点击次数的平均值;click_max是指该POI在特定时间段内点击次数的最大值。
在本实施例中,可按下述三种情况分别生成排序结果优化因子:
情况1)若关键词与地理兴趣点名称一致且该地理兴趣点的热度值大于第一预设热度阈值,则可确定该地理兴趣点较为重要,因此生成较高的排序结果优化因子,以确保其排序靠前。例如,关键词与地理兴趣点名称一致(即name=query) 且该地理兴趣点的热度值(poi_hot)>0.2,则调整参数为1。
情况2)若地理兴趣点名称的字符长度大于关键词的字符长度且二者之间的文本相似度值大于预设相似度阈值,并且该地理兴趣点的热度值大于第二预设热度阈值,并且热点次数至少大于1,则可确定相应的搜索结果为一般重要,令排序结果优化因子等于该地理兴趣点的热度值;其中,第一预设热度阈值大于第二预设热度阈值。例如,若length(name)>length(query),且1>similarity>0.2,且 poi_hot>0.15,且cnt>1,则排序结果优化因子=poi_hot。
情况3)若为上述两种情况之外的其他情况,则可确定相应的搜索结果为不重要,可令排序结果优化因子为0。
需说明的是,本实施例中基于排序优化的搜索方法,其实施方式与上文中基于地图场景的搜索排序优化方法类似,因此不再赘述。
如图3所示,展示了本发明一实施例中基于地图场景的搜索排序优化系统的结构示意图。本实施例的搜索排序优化系统包括发送终端31和接收终端32。
发送终端31发送基于地图场景下的搜索请求;所述搜索请求包括用户信息及当前输入的关键词。接收终端32与所述发送终31端建立通信连接;所述接收终端接收所述搜索请求;根据所述用户信息获取该用户在预设时间段内的多个地理兴趣点的日志数据,据以生成地理兴趣点集合并计算该集合中各地理兴趣点的热度值;根据所述关键词计算该关键词与各地理兴趣点名称之间的文本相似度值;根据计算所得的各地理兴趣点的热度值以及该关键词与各地理兴趣点名称之间的文本相似度值,生成正相关于所述热度值及文本相似度值的排序结果优化因子;按照所述排序结果优化因子从大到小的顺序调整所述地理兴趣点集合中各地理兴趣点的顺序,并将调整后的地理兴趣点集合传送至所述发送端31。
本实施例中发送终端31可以是智能手机、平板电脑、智能手环、智能手表、智能头盔、台式电脑、笔记本电脑等个人电脑;接收终端32可以是服务器,所述服务器可以根据功能、负载等多种因素布置在一个或多个实体服务器上,也可以由分布的或集中的服务器集群构成。
需说明的是,本实施例中基于地图场景的搜索排序优化系统,其实施方式与上文中基于地图场景的搜索排序优化方法类似,因此不再赘述。
如图4所示,展示了本发一实施例中基于地图场景的搜索排序优化装置的结构示意图。本实施例中的搜索排序优化装置400包括接收模块401、热度计算模块402、相似度计算模块403、优化因子计算模块404、发送模块405。
具体而言,接收模块401用于接收请求方基于地图场景下的搜索请求;所述搜索请求包括用户信息及当前输入的关键词;热度计算模块402用于根据所述用户信息获取该用户在预设时间段内的多个地理兴趣点的日志数据,据以生成地理兴趣点集合并计算该集合中各地理兴趣点的热度值;相似度计算模块403用于根据所述关键词计算该关键词与各地理兴趣点名称之间的文本相似度值;优化因子计算模块404用于根据计算所得的各地理兴趣点的热度值以及该关键词与各地理兴趣点名称之间的文本相似度值,生成正相关于所述热度值及文本相似度值的排序结果优化因子;发送模块405用于按照所述排序结果优化因子从大到小的顺序调整所述地理兴趣点集合中各地理兴趣点的顺序,并将调整后的地理兴趣点集合传送至请求方的地图场景中。
应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,相似度计算模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上相似度计算模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称 ASIC),或,一个或多个微处理器(digital signal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统 (system-on-a-chip,简称SOC)的形式实现。
需说明的是,本实施例中基于地图场景的搜索排序优化装置,其实施方式与上文中基于地图场景的搜索排序优化方法类似,因此不再赘述。
如图5所示,展示了本发明一实施例中基于排序优化的搜索装置的结构示意图。本实施例的搜索装置500包括发送模块501和接收模块502。发送模块501 用于发送基于地图场景下的搜索请求;所述搜索请求包括用户信息及当前输入的关键词;接收模块502用于接收关联于所述关键词的地理兴趣点结合;所述地理兴趣点集合中的各地理兴趣点按照排序结果优化因子从大到小的顺序排列。
应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,相似度计算模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上相似度计算模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称 ASIC),或,一个或多个微处理器(digital signal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统 (system-on-a-chip,简称SOC)的形式实现。
需说明的是,本实施例中基于排序优化的搜索装置,其实施方式与上文中基于地图场景的搜索排序优化方法类似,因此不再赘述。
本发明还提供一种计算机可读存储介质,其上存储有第一计算机程序和/ 或第二计算机程序,所述第一计算机程序被处理器执行时实现所述基于地图场景的搜索排序优化方法;所述第二计算机程序被处理器执行时实现所述基于排序优化的搜索方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
于本申请提供的实施例中,所述计算机可读写存储介质可以包括只读存储器、随机存取存储器、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁存储设备、闪存、U盘、移动硬盘、或者能够用于存储具有指令或数据结构形式的期望的程序代码并能够由计算机进行存取的任何其它介质。另外,任何连接都可以适当地称为计算机可读介质。例如,如果指令是使用同轴电缆、光纤光缆、双绞线、数字订户线(DSL)或者诸如红外线、无线电和微波之类的无线技术,从网站、服务器或其它远程源发送的,则所述同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线电和微波之类的无线技术包括在所述介质的定义中。然而,应当理解的是,计算机可读写存储介质和数据存储介质不包括连接、载波、信号或者其它暂时性介质,而是旨在针对于非暂时性、有形的存储介质。如申请中所使用的磁盘和光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能光盘(DVD)、软盘和蓝光光盘,其中,磁盘通常磁性地复制数据,而光盘则用激光来光学地复制数据。
综上所述,本发明提供基于地图场景的搜索排序优化方法、方法、装置、系统及介质,本发明对位置定位服务的召回结果中加入了自有用户属性,结合文本相似度属性及POI热度值来确定各POI的重要程度,并进而产生相应的优化调整因子,使用户的搜索结果能够按照优化调整因子从大到小的顺序进行排序,由此实现一种基于地图场景下的融合了用户习惯的搜索排序方法,并使得用户搜索字数减少0.5%-1.3%;点击排位提升3%-5%。所以,本申请有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (10)
1.一种基于地图场景的搜索排序优化方法,其特征在于,包括:
接收请求方基于地图场景下的搜索请求;所述搜索请求包括用户信息及当前输入的关键词;
根据所述用户信息获取用户在预设时间段内的多个地理兴趣点的日志数据,据以生成地理兴趣点集合并计算所述集合中各地理兴趣点的热度值;
计算所述关键词与各地理兴趣点名称之间的文本相似度值;
生成正相关于所述热度值及所述文本相似度值的排序结果优化因子;
按照所述排序结果优化因子从大到小的顺序调整所述地理兴趣点集合中各地理兴趣点的顺序,并将调整后的地理兴趣点集合传送至请求方的地图场景中。
2.如权利要求1所述基于地图场景的搜索排序优化方法,其特征在于,所述地理兴趣点的热度值的计算方式包括:
根据预设时间段内的地理兴趣点的日志数据,计算所述地理兴趣点的平均点击次数和最大点击次数;
计算所述平均点击次数的对数计算值与所述最大点击次数的对数计算值的比值;令所述比值为所述地理兴趣点的热度值。
3.如权利要求1所述基于地图场景的搜索排序优化方法,其特征在于,所述计算所述关键词与各地理兴趣点名称之间的文本相似度值,包括:利用余弦相似度算法计算所述关键词与各地理兴趣点名称之间的中文文本相似度值。
4.如权利要求1所述基于地图场景的搜索排序优化方法,其特征在于,所述排序结果优化因子的生成方式包括:
若所述关键词与所述地理兴趣点名称一致且所述地理兴趣点的热度值大于第一预设热度阈值,则生成使所述地理兴趣点排序靠前的较高的排序结果优化因子;
若所述地理兴趣点名称的字符长度大于所述关键词的字符长度,且二者之间的文本相似度值大于预设相似度阈值,且所述地理兴趣点的热度值大于第二预设热度阈值,并且所述地理兴趣点的点击次数大于1,则令所述排序结果优化因子的取值为所述地理兴趣点的热度值;其中,所述第一预设热度阈值大于所述第二预设热度阈值;
否则,令所述排序结果优化因子的取值为0。
5.一种基于排序优化的搜索方法,其特征在于,包括:
发送基于地图场景下的搜索请求;所述搜索请求包括用户信息及当前输入的关键词;
接收关联于所述关键词的地理兴趣点结合;所述地理兴趣点集合中的各地理兴趣点按照排序结果优化因子从大到小的顺序排列。
6.如权利要求5所述基于排序优化的搜索方法,其特征在于,所述排序结果优化因子的计算方式包括:
根据所述用户信息获取用户在预设时间段内的多个地理兴趣点的日志数据,据以生成地理兴趣点集合并计算所述集合中各地理兴趣点的热度值;
计算所述关键词与各地理兴趣点名称之间的文本相似度值;
生成正相关于所述热度值及所述文本相似度值的所述排序结果优化因子。
7.一种基于地图场景的搜索排序优化系统,其特征在于,包括:
发送终端,发送基于地图场景下的搜索请求;所述搜索请求包括用户信息及当前输入的关键词;
接收终端,与所述发送终端通信连接;所述接收终端接收所述搜索请求;根据所述用户信息获取用户在预设时间段内的多个地理兴趣点的日志数据,据以生成地理兴趣点集合并计算所述集合中各地理兴趣点的热度值;计算所述关键词与各地理兴趣点名称之间的文本相似度值;生成正相关于所述热度值及所述文本相似度值的排序结果优化因子;按照所述排序结果优化因子从大到小的顺序调整所述地理兴趣点集合中各地理兴趣点的顺序,并将调整后的地理兴趣点集合传送至所述发送终端。
8.一种基于地图场景的搜索排序优化装置,其特征在于,包括:
接收模块,用于接收请求方基于地图场景下的搜索请求;所述搜索请求包括用户信息及当前输入的关键词;
热度计算模块,用于根据所述用户信息获取用户在预设时间段内的多个地理兴趣点的日志数据,据以生成地理兴趣点集合并计算所述集合中各地理兴趣点的热度值;
相似度计算模块,用于计算所述关键词与各地理兴趣点名称之间的文本相似度值;
优化因子计算模块,用于生成正相关于所述热度值及所述文本相似度值的排序结果优化因子;
发送模块,用于按照所述排序结果优化因子从大到小的顺序调整所述地理兴趣点集合中各地理兴趣点的顺序,并将调整后的地理兴趣点集合传送至请求方的地图场景中。
9.一种基于排序优化的搜索装置,其特征在于,包括:
发送模块,用于发送基于地图场景下的搜索请求;所述搜索请求包括用户信息及当前输入的关键词;
接收模块,用于接收关联于所述关键词的地理兴趣点结合;所述地理兴趣点集合中的各地理兴趣点按照排序结果优化因子从大到小的顺序排列。
10.一种计算机可读存储介质,其上存储有第一计算机程序和/或第二计算机程序,其特征在于,所述第一计算机程序被处理器执行时实现权利要求1至4中任一项所述基于地图场景的搜索排序优化方法;所述第二计算机程序被处理器执行时实现权利要求5或6所述基于排序优化的搜索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110125744.6A CN112800160A (zh) | 2021-01-29 | 2021-01-29 | 基于地图场景的搜索排序优化方法、系统、装置及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110125744.6A CN112800160A (zh) | 2021-01-29 | 2021-01-29 | 基于地图场景的搜索排序优化方法、系统、装置及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112800160A true CN112800160A (zh) | 2021-05-14 |
Family
ID=75812827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110125744.6A Pending CN112800160A (zh) | 2021-01-29 | 2021-01-29 | 基于地图场景的搜索排序优化方法、系统、装置及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112800160A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113407856A (zh) * | 2021-08-19 | 2021-09-17 | 北京金堤征信服务有限公司 | 搜索结果排序方法、装置及电子设备 |
CN113449145A (zh) * | 2021-06-29 | 2021-09-28 | 乐视云计算有限公司 | 视频搜索结果排序调整方法、装置、电子设备和计算机可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120197714A1 (en) * | 2011-02-02 | 2012-08-02 | Mapquest, Inc. | Systems and methods for generating electronic map displays with points-of-interest information based on reference locations |
CN109086394A (zh) * | 2018-07-27 | 2018-12-25 | 天津字节跳动科技有限公司 | 搜索排序方法、装置、计算机设备和存储介质 |
CN111782699A (zh) * | 2020-07-16 | 2020-10-16 | 山东瑞智飞控科技有限公司 | 一种基于用户历史瓦片浏览记录的兴趣点智能搜索方法 |
CN111897894A (zh) * | 2019-05-06 | 2020-11-06 | 北京四维图新科技股份有限公司 | Poi检索热度确定方法、装置、设备及存储介质 |
CN111984749A (zh) * | 2019-05-23 | 2020-11-24 | 北京搜狗科技发展有限公司 | 一种兴趣点排序方法和装置 |
-
2021
- 2021-01-29 CN CN202110125744.6A patent/CN112800160A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120197714A1 (en) * | 2011-02-02 | 2012-08-02 | Mapquest, Inc. | Systems and methods for generating electronic map displays with points-of-interest information based on reference locations |
CN109086394A (zh) * | 2018-07-27 | 2018-12-25 | 天津字节跳动科技有限公司 | 搜索排序方法、装置、计算机设备和存储介质 |
CN111897894A (zh) * | 2019-05-06 | 2020-11-06 | 北京四维图新科技股份有限公司 | Poi检索热度确定方法、装置、设备及存储介质 |
CN111984749A (zh) * | 2019-05-23 | 2020-11-24 | 北京搜狗科技发展有限公司 | 一种兴趣点排序方法和装置 |
CN111782699A (zh) * | 2020-07-16 | 2020-10-16 | 山东瑞智飞控科技有限公司 | 一种基于用户历史瓦片浏览记录的兴趣点智能搜索方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113449145A (zh) * | 2021-06-29 | 2021-09-28 | 乐视云计算有限公司 | 视频搜索结果排序调整方法、装置、电子设备和计算机可读存储介质 |
CN113449145B (zh) * | 2021-06-29 | 2023-11-10 | 乐视云网络技术(北京)有限公司 | 视频搜索结果排序调整方法、装置、电子设备和计算机可读存储介质 |
CN113407856A (zh) * | 2021-08-19 | 2021-09-17 | 北京金堤征信服务有限公司 | 搜索结果排序方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108885624B (zh) | 信息推荐系统及方法 | |
WO2020007138A1 (zh) | 一种事件识别的方法、模型训练的方法、设备及存储介质 | |
US20220365939A1 (en) | Methods and systems for client side search ranking improvements | |
CN110362727B (zh) | 用于搜索系统的第三方搜索应用 | |
US10467229B2 (en) | Query-time analytics on graph queries spanning subgraphs | |
US9286357B1 (en) | Blending content in an output | |
CN103455507B (zh) | 搜索引擎推荐方法及装置 | |
US9674128B1 (en) | Analyzing distributed group discussions | |
CN105637511A (zh) | 基于距离的搜索排名降级 | |
CN111125269B (zh) | 一种数据管理方法、血缘关系显示方法和相关装置 | |
US9485306B2 (en) | Methods, apparatuses, and computer program products for facilitating a data interchange protocol | |
US9116940B1 (en) | Searching for join candidates | |
TW201337608A (zh) | 實體屬性及關係的排序 | |
CN112800160A (zh) | 基于地图场景的搜索排序优化方法、系统、装置及可读存储介质 | |
US20150127641A1 (en) | Method and system for searching on mobile terminal | |
US20190205475A1 (en) | Search engine for identifying analogies | |
JP2015106347A (ja) | レコメンド装置およびレコメンド方法 | |
US11481454B2 (en) | Search engine results for low-frequency queries | |
WO2018020495A1 (en) | Computerized environment for human expert analysts | |
CN109375910A (zh) | 类文件生成方法、装置、电子设备及存储介质 | |
JP2020004217A (ja) | 情報表示方法、情報表示プログラムおよび情報表示装置 | |
US20220284060A1 (en) | Question Answering Method and Apparatus Based on Knowledge Graph | |
CN116070028A (zh) | 基于页面的内容信息推送方法、装置、设备及存储介质 | |
CN113918801A (zh) | 信息推荐方法及设备 | |
US20170004134A1 (en) | Asynchronous search query |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210514 |