CN110472158A - 一种搜索条目的排序方法和装置 - Google Patents
一种搜索条目的排序方法和装置 Download PDFInfo
- Publication number
- CN110472158A CN110472158A CN201810451157.4A CN201810451157A CN110472158A CN 110472158 A CN110472158 A CN 110472158A CN 201810451157 A CN201810451157 A CN 201810451157A CN 110472158 A CN110472158 A CN 110472158A
- Authority
- CN
- China
- Prior art keywords
- search
- keyword
- search entry
- entry
- position feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 87
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 87
- 238000004919 topotaxy Methods 0.000 claims description 22
- 238000012163 sequencing technique Methods 0.000 claims description 15
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Abstract
本申请实施例公开了一种搜索条目排序方法,该方法包括:根据用于搜索的关键词确定包括多个搜索条目的搜索结果;根据该关键词中的位置特征,确定搜索条目与该关键词之间的空间相关性;根据搜索条目与该关键词的文本相关性以及空间相关性,确定搜索条目与该关键词的综合相关性;其中,综合相关性为根据搜索条目与该关键词的空间相关性和文本相关性确定得出的;根据搜索条目的综合相关性对该搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果。以实现在一些搜索场景例如在电子地图中进行关键词搜索的场景中,能够实现展示搜索结果中的搜索条目能够更加符合搜索目的,从而使得所展示搜索结果中的搜索条目能够更好的满足用户需求。
Description
技术领域
本申请涉及数据处理领域,特别是涉及一种搜索条目的排序方法和装置。
背景技术
用户可以通过在搜索引擎中输入关键词(query)进行对关键词的搜索,搜索引擎可以将搜索结果展示给用户,搜索结果中包括了符合该关键词需求的搜索条目。
为了能够让用户可以更快的从搜索结果中查看到符合搜索目的的搜索条目,在展示搜索结果前,搜索引擎需要对搜索结果中的搜索条目进行排序。
传统的排序方式主要是依据关键词与搜索条目间语义相关性进行的,但是这种排序方式并不适用于所有搜索场景,例如在电子地图中进行关键词搜索的场景中,仅凭借语义相关性并不能准确的确定出哪个或哪些搜索条目更符合搜索目的,从而导致在一些搜索场景下所展示的搜索结果不能满足用户需求。
发明内容
为了解决上述技术问题,本申请提供了一种搜索条目排序方法,以希望在一些搜索场景例如在电子地图中进行关键词搜索的场景中,能够实现展示搜索结果中的搜索条目能够更加符合搜索目的,从而使得所展示搜索结果中的搜索条目能够更好的满足用户需求。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供了一种搜索条目排序方法,所述方法包括:
根据用于搜索的关键词确定包括多个搜索条目的搜索结果;
根据所述关键词中的位置特征,确定搜索条目与所述关键词之间的空间相关性;
根据搜索条目与所述关键词的文本相关性以及空间相关性,确定搜索条目与所述关键词的综合相关性;其中,综合相关性为根据搜索条目与所述关键词的空间相关性和文本相关性确定得出的;
根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果。
可选的,所述关键词包括多个位置特征,所述根据所述关键词中的位置特征,确定搜索条目与所述关键词之间的空间相关性,包括:
确定所述多个位置特征的空间拓扑关系;
若所述多个位置特征的空间拓扑关系为高相关,从所述多个位置特征中确定出用于体现所述关键词的搜索目的的目标位置特征;所述高相关包括所述多个位置特征的地理范围重叠;
将搜索条目与所述目标位置特征之间的空间相关性作为搜索条目与所述关键词之间的空间相关性。
可选的,所述从所述多个位置特征中确定出用于体现所述关键词的搜索目的的目标位置特征,包括:
根据所述多个位置特征各自对应的地理范围,确定所述目标位置特征,所述目标位置特征为所述多个位置特征中地理范围最小的位置特征。
可选的,搜索条目与所述关键词的文本相关性为搜索条目与所述目标位置特征的文本相关性。
可选的,在所述根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果之前,所述方法还包括:
确定所述多个搜索条目各自对应的实体类型;
将对应同一实体类型的搜索条目基于地理位置进行聚类;
若所述对应同一实体类型的搜索条目通过聚类得到多个类,确定类与所述关键词的综合相关性;其中,一个类至少包括两个搜索条目;
其中,所述多个类包括第一类和第二类,且所述第一类与所述关键词的综合相关性大于所述第二类与所述关键词的综合相关性;
所述根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果,包括:
在根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序的过程中,优先展示所述第一类的搜索条目。
可选的,所述优先展示所述第一类的搜索条目的方式,包括:
将所述搜索条目排序结果中所述第一类的搜索条目排序在所述第二类的搜索条目之前;
或者,
将所述搜索条目排序结果中所述第二类的搜索条目删除。
第二方面,本申请实施例提供了一种搜索条目排序装置,所述装置包括:第一确定单元、第二确定单元、第三确定单元和排序单元;
所述第一确定单元,用于根据用于搜索的关键词确定包括多个搜索条目的搜索结果;
所述第二确定单元,用于根据所述关键词中的位置特征,确定搜索条目与所述关键词之间的空间相关性;
所述第三确定单元,用于根据搜索条目与所述关键词的文本相关性以及空间相关性,确定搜索条目与所述关键词的综合相关性;其中,综合相关性为根据搜索条目与所述关键词的空间相关性和文本相关性确定得出的;
所述排序单元,用于根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果。
可选的,所述关键词包括多个位置特征,所述第二确定单元,还用于:
确定所述多个位置特征的空间拓扑关系;
若所述多个位置特征的空间拓扑关系为高相关,从所述多个位置特征中确定出用于体现所述关键词的搜索目的的目标位置特征;所述高相关包括所述多个位置特征的地理范围重叠;
将搜索条目与所述目标位置特征之间的空间相关性作为搜索条目与所述关键词之间的空间相关性。
可选的,所述第二确定单元,还用于:
根据所述多个位置特征各自对应的地理范围,确定所述目标位置特征,所述目标位置特征为所述多个位置特征中地理范围最小的位置特征。
可选的,搜索条目与所述关键词的文本相关性为搜索条目与所述目标位置特征的文本相关性。
可选的,所述装置还包括:第四确定单元、聚类单元和第五确定单元;
所述第四确定单元,用于确定所述多个搜索条目各自对应的实体类型;
所述聚类单元,用于将对应同一实体类型的搜索条目基于地理位置进行聚类;
所述第五确定单元,用于若所述对应同一实体类型的搜索条目通过聚类得到多个类,确定类与所述关键词的综合相关性;其中,一个类至少包括两个搜索条目;
其中,所述多个类包括第一类和第二类,且所述第一类与所述关键词的综合相关性大于所述第二类与所述关键词的综合相关性;
所述排序单元,还用于:
在根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序的过程中,优先展示所述第一类的搜索条目。
可选的,所述排序单元,还用于:
将所述搜索条目排序结果中所述第一类的搜索条目排序在所述第二类的搜索条目之前;
或者,
将所述搜索条目排序结果中所述第二类的搜索条目删除。
第三方面,本申请实施例提供了一种搜索条目排序设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如第一方面中任意一项所述搜索条目排序方法。
第四方面,本申请实施例提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面中任意一项所述搜索条目排序方法。
由上述技术方案可以看出,在根据关键词搜索得到包括多个搜索条目的搜索结果时,为了对这些搜索条目进行更好的排序,除了计算各搜索条目与该关键词之间的文本相关性外,还可以通过该关键词中能够体现位置信息的位置特征确定出与各搜索条目与该关键词之间的空间相关性,并根据文本相关性和空间相关性确定出各搜索条目对应该关键词的综合相关性。由于一个搜索条目与关键词的空间相关性可以体现该搜索条目与关键词中位置特征之间在空间上的远近关系,故在一些搜索场景例如在电子地图中进行关键词搜索的场景中,通过空间相关性得到的综合相关性可以更好的体现出搜索条目与关键词所基于的搜索目的之间的符合程度,依据综合相关性排序并展示搜索结果中的搜索条目能够更好的满足用户需求。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种搜索条目排序系统的架构示意图;
图2为本申请实施例提供的一种搜索条目排序方法的方法流程图;
图3为本申请实施例提供的一种搜索条目排序装置的结构示意图;
图4为本申请实施例提供的一种搜索条目排序设备的结构示意图;
图5为本申请实施例提供的一种服务器的结构示意图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
经发明人研究发现,在搜索引擎需要对搜索结果中的搜索条目进行排序的过程中,传统的排序方式主要是依据关键词与搜索条目间语义相关性进行的,但是这种排序方式并不适用于所有搜索场景。例如,在电子地图中进行关键词搜索的场景中,由于搜索结果中的搜索条目与关键词之间存在着固定的空间关系(例如方位关系、拓扑关系、距离关系等),若仅凭借搜索条目与关键词之间的语义相关性,则并不足以描述和衡量搜索条目与关键词之间的相关性,因此,会导致所展示的搜索结果与搜索目的之间出现歧义和偏差,即仅凭借语义相关性并不能准确的确定出哪个或哪些搜索条目更符合搜索目的,从而导致在一些搜索场景下所展示的搜索结果不能满足用户需求。
为此,本申请实施例提供了一种搜索条目排序方法,以希望在一些搜索场景例如在电子地图中进行关键词搜索的场景中,能够实现展示搜索结果中的搜索条目能够更加符合搜索目的,从而使得所展示搜索结果中的搜索条目能够更好的满足用户需求。
作为一种示例,图1示出了本实施例提供的一种搜索条目排序系统的架构示意图,本申请实施例提供的搜索条目排序方法可以应用于如图1所示的搜索条目排序系统中,该搜索条目排序系统可以包括终端设备101、服务器102。
具体地,该终端设备101可以为能够提供搜索关键词功能的设备,比如可以为智能手机、平板电脑、笔记本电脑、台式电脑等设备。例如,终端设备101可以提供一个能够输入搜索关键词的搜索界面,当用户需要搜索关键词时,用户可以通过终端设备101的搜索界面输入关键词;终端设备101获取到用户输入的关键词后,该终端设备101可以将该关键词向服务器102发送。其中,关键词可以包括一个或多个位置特征,位置特征可以为能够体现该关键词的搜索目的的标识特征,例如,关键词为“朝阳区”,则该关键词所包括的位置特征为“朝阳区”,且该位置特征“朝阳区”能够体现该关键词的搜索目的为朝阳区对应的行政区域。
服务器102接收到该关键词后,服务器102可以先根据该关键词确定搜索结果,其中,搜索结果可以包括多个搜索条目,搜索条目可以为与关键词相关的兴趣点(Point ofinterest,POI),比如,搜索条目包含了关键词中的位置特征。
然后,服务器102可以确定该关键词中的位置特征与搜索条目之间的空间相关性,并且,可以根据该关键词中的位置特征与搜索条目之间的空间相关性,确定搜索条目与该关键词的空间相关性;需要说明的是,一个搜索条目与关键词的空间相关性可以为能够体现该搜索条目与该关键词中位置特征之间在空间上的远近关系的性质,具体地,空间相关性的值域范围可以为(0,1),且一个搜索条目与关键词的空间相关性越大,说明该搜索条目与该关键词中位置特征之间在空间上越近,反之,说明该搜索条目与该关键词中位置特征之间在空间上越远。
接着,服务器102可以根据搜索条目与该关键词的文本相关性以及空间相关性,确定搜索条目与该关键词的综合相关性。其中,一个搜索条目与关键词的文本相关性可以为能够体现该搜索条目与该关键词中位置特征之间在文本上的相似程度的性质,具体地,文本相关性的值域范围可以为(0,1),且一个搜索条目与关键词的文本相关性越大,说明该搜索条目与该关键词中位置特征之间在文本上越相似,反之,说明该搜索条目与该关键词中位置特征之间在文本上越不相似。
另外,由于一个搜索条目的综合相关性可以是根据该搜索条目与关键词的空间相关性和文本相关性确定出来的,因此,在一些搜索场景(例如在电子地图中进行关键词搜索的场景)中,通过空间相关性得到的综合相关性可以更好的体现出搜索条目与关键词所基于的搜索目的之间的符合程度。其中,综合相关性的值域范围可以为(0,1)。可以理解的是,一个搜索条目与关键词的综合相关性越高,说明该搜索条目与该关键词所基于的搜索目的之间的符合程度越高,反之,说明该搜索条目与该关键词所基于的搜索目的之间的符合程度越低。
紧接着,服务器102可以根据搜索条目的综合相关性对搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果,并且可以将该排序结果向终端设备101发送,以便终端设备101可以展示该排序结果。这样,便可以实现依据搜索条目的综合相关性对搜索条目进行排序,并展示排序结果中的搜索条目,使得所展示的搜索条目能够更好的满足用户需求。
可以理解的是,在上述应用场景中,虽然本申请实施方式的动作描述为部分由终端设备101执行、部分由服务器102执行,但是,这些动作也可以完全由终端设备101执行。本申请在执行主体方面不受限制,只要执行了本申请实施方式所公开的动作即可。
需要注意的是,上述应用场景仅是为了便于理解本申请而示出,本申请的实时方式在此方面不受任何限制。相反,本申请的实施方式可以应用于适用的任何场景。
下面结合附图,详细说明本申请的各种非限制性实施方式。
接下来,将从服务器角度对本申请所提供的搜索条目排序方法进行介绍。参见图2,为本申请实施例提供的一种搜索条目排序方法的方法流程图。如图2所示,可以包括如下步骤:
S201:根据用于搜索的关键词确定包括多个搜索条目的搜索结果。
在本实施例中,服务器获取到用于搜索的关键词,可以根据该关键词,确定与该关键词对应的搜索结果。其中,搜索结果可以包括多个搜索条目,例如在电子地图中进行关键词搜索的场景中,搜索结果可以包括多个POI,该搜索结果中的POI可以作为搜索条目。
需要说明的是,本实施例提供了多种根据关键词确定搜索结果的方式,下面将针对其中一种方式进行介绍:
在本方式中,可以将包含关键词中位置特征的POI作为搜索结果中的搜索条目。
举例来说,假设关键词为“学院路”,那么,由于POI“学院路”、“海淀学院路20号院”、“学院南路”和“锐思特(海淀学院路店)”均包括了“学院路”这三个字,所以,可以将POI“学院路”、“海淀学院路20号院”、“学院南路”和“锐思特(海淀学院路店)”均作为该关键词“学院路”对应的搜索结果中的搜索条目。
S202:根据所述关键词中的位置特征,确定搜索条目与所述关键词之间的空间相关性。
在确定关键词对应的搜索结果后,可以先根据关键词中的位置特征以及搜索结果中的搜索条目,确定该关键词中的位置特征与搜索条目之间的空间相关性。接着,可以根据该关键词中的位置特征与搜索条目之间的空间相关性,确定搜索条目与该关键词的空间相关性。
具体地,当关键词仅包括一个位置特征时,可以将该位置特征与搜索条目之间的空间相关性作为搜索条目与该关键词的空间相关性。当关键词包括多个位置特征时,可以根据该多个位置特征与搜索条目之间的空间相关性,确定搜索条目与该关键词之间的空间相关性,需要强调的是,根据关键词中的多个位置特征确定搜索条目与该关键词之间的空间相关性的方式将在后面进行详细介绍。
在本实施例中,由于关键词中的位置特征可以一定程度上体现该关键词的搜索目的,故可以计算该关键词中的位置特征与搜索条目之间的空间相关性,并可以结合位置特征与搜索条目之间的空间相关性对搜索条目进行排序。
需要说明的是,关键词中的位置特征与搜索条目之间的空间相关性可以体现该关键词中位置特征与搜索条目之间在空间上的远近关系,并且当位置特征与搜索条目各自对应的实体类型不同时,计算位置特征与搜索条目之间在空间上的距离的方式也不同。其中,实体类型可以包括:点状实体(简称“点”)、线状实体(简称“线”)和面状实体(简称“面”);“点”可以理解为电子地图中所标识区块范围比较小的POI,一般来说,若电子地图中若一个POI标识的区块范围内不再包括更小区块范围的其他POI,那么这个POI可以定义为“点”,例如POI“清华大学东门”的区块范围内没有包括更小区块范围的其他POI,因此,可以确定POI“清华大学东门”的实体类型为“点”;“线”可以理解为电子地图中所标识区块范围为条状的POI,比如道路(如学院路、京藏高速公路等)或者水系(温榆河等);“面”可以理解为电子地图中所标识区块范围比较大的POI,一般来说,若电子地图中若一个POI标识的区块范围内还包括更小区块范围的其他POI,那么这个POI可以定义为“面”,例如POI“泰福苑小区”的区块范围内包括了更小区块范围的POI“一号楼”和POI“二号楼”,因此,可以确定POI“泰福苑小区”的实体类型为“面”。
因此,在本实施例的一种实现方式中,可以先确定关键词中的位置特征对应的实体类型以及搜索条目对应的实体类型,接着,可以根据位置特征和搜索条目分别对应的实体类型,确定计算位置特征与搜索条目之间的空间相关性的方式。
在本方式中,提供了多种计算位置特征与搜索条目之间的空间相关性的方式,例如计算点与点之间的空间相关性的方式、计算点与线之间的空间相关性的方式、计算线与线之间的空间相关性的方式、计算线与面之间的空间相关性的方式。下面将针对这四种方式进行介绍:
第一种方式:计算点与点之间的空间相关性。
当确定关键词中的位置特征和搜索条目分别对应的实体类型均为点时,即该位置特征与该搜索条目之间的实体类型关系为点与点,可以利用位置特征的坐标信息和搜索条目的坐标信息(比如经纬度位置),计算该位置特征和该搜索条目的之间的空间相关性。例如,可以将位置特征的坐标值(包括横坐标值和纵坐标值)和搜索条目的坐标值(包括横坐标值和纵坐标值),通过如下公式(1)和(2)计算该位置特征和该搜索条目之间的空间相关性:
其中,q表示关键词中的位置特征对应的点;p表示搜索条目对应的点;SimA(q,p)表示q与p之间的空间相关性;dis(q,p)表示q与p之间的空间距离;x1表示q的横坐标值;y1表示q的纵坐标值;x2表示p的横坐标值;y2表示p的纵坐标值。
第二种方式:计算点与线之间的空间相关性。
当确定关键词中的位置特征对应的实体类型为点,搜索条目对应的实体类型均为线时,即该位置特征与该搜索条目之间的实体类型关系为点与线,可以利用位置特征的坐标信息和搜索条目的坐标信息,计算该位置特征和该搜索条目的之间的空间相关性。例如,可以将位置特征的坐标值(包括横坐标值和纵坐标值)和搜索条目中一特定的坐标值(包括横坐标值和纵坐标值),通过如下公式(3)和(4)计算该位置特征和该搜索条目之间的空间相关性:
其中,q表示关键词中的位置特征对应的点;p表示搜索条目对应的线;pl表示q到p的垂直线交点;SimA(q,pl)表示q与pl之间的空间相关性;dis(q,pl)表示q与pl之间的空间距离;x表示q的横坐标值;y表示q的纵坐标值;xl表示pl的横坐标值;yl表示pl的纵坐标值。需要说明的是,当q在p上时,SimA(q,pl)为1。
第三种方式:计算线与线之间的空间相关性。
当确定关键词中的位置特征和搜索条目分别对应的实体类型均为线时,即该位置特征与该搜索条目之间的实体类型关系为线与线,可以利用位置特征的坐标信息和搜索条目的坐标信息,计算该位置特征和该搜索条目的之间的空间相关性。例如,可以将位置特征中一特定的坐标值(包括横坐标值和纵坐标值)和搜索条目中一特定的坐标值(包括横坐标值和纵坐标值),通过如下公式(5)和(6)计算该位置特征和该搜索条目之间的空间相关性:
其中,q表示关键词中的位置特征对应的线;p表示搜索条目对应的线;qx表示q中能够体现q与p之间平均距离的点;py表示p中能够体现q与p之间的平均距离的点;SimA(qx,py)表示qx与py之间的空间相关性;dis(qx,py)表示qx与py之间的空间距离;xx表示qx的横坐标值;yx表示qx的纵坐标值;xy表示py的横坐标值;yy表示py的纵坐标值。需要说明的是,当q与p相交时,SimA(qx,py)为1。
第四种方式:计算线与面之间的空间相关性。
当确定关键词中的位置特征对应的实体类型为面,搜索条目对应的实体类型均为线时,即该位置特征与该搜索条目之间的实体类型关系为面与线,可以利用位置特征的坐标信息和搜索条目的坐标信息,计算该位置特征和该搜索条目的之间的空间相关性。例如,可以将位置特征中一特定的坐标值(包括横坐标值和纵坐标值)和搜索条目中一特定的坐标值(包括横坐标值和纵坐标值),通过如下公式(7)和(8)计算该位置特征和该搜索条目之间的空间相关性:
其中,q表示关键词中的位置特征对应的面;p表示搜索条目对应的线;qm表示q的外接矩形的中心点;pn表示qm到p的垂直线的交点;SimA(qm,pn)表示qm与pn之间的空间相关性;dis(qm,pn)表示qm与pn之间的空间距离;xm表示qn的横坐标值;ym表示qm的纵坐标值;xn表示pn的横坐标值;yn表示pn的纵坐标值。
S203:根据搜索条目与所述关键词的文本相关性以及空间相关性,确定搜索条目与所述关键词的综合相关性。
在本实施例中,搜索条目与关键词的文本相关性可以根据该关键词中的位置特征与搜索条目之间的文本相关性进行确定。具体地,当关键词仅包括一个位置特征时,可以将该位置特征与搜索条目之间的文本相关性作为搜索条目与该关键词的文本相关性。当关键词包括多个位置特征时,可以根据关键词中的多个位置特征确定搜索条目与该关键词之间的文本相关性,并且根据关键词中的多个位置特征确定搜索条目与该关键词之间的文本相关性的方式,与根据关键词中的多个位置特征确定搜索条目与该关键词之间的空间相关性的方式相同。
本实施例提供了多种确定关键词与搜索条目之间的文本相关性的方式,接下来,将针对其中一种方式进行介绍。
在本方式中,可以利用关键词的空间向量与搜索条目的空间向量进行余弦相似度计算,从而得到关键词与搜索条目之间的文本相关性。具体地,可以利用如下公式(9)、(10)、(11)和(12)计算关键词与搜索条目之间的文本相关性,
其中,q表示关键词;p表示搜索条目;SimB(q,p)表示q与p之间的文本相关性;t(term)代表关键词q中的位置特征;coord(q,p)表示文档中位置特征出现的次数,其中,位置特征出现的次数越高,则coord(q,p)的数值越大;queryNorm(q)表示每个搜索条目的方差和;tf(t in z)表示位置特征t在文档z中出现的词频;idf(t)表示出现过位置特征的文档数量;norm(t,z)表示标准化因子;Num of term in filed f表示在文档的一个域中,所出现的位置特征的数量,其中,一个域中出现的位置特征的数量越多,则lengthNorm(field)的数值越小,反之,则lengthNorm(field)的数值越大;field f in z表示字段f在文档z中出现的次数;d.getBoost()表示文档权重;f.getBoost()表示域的权重;q.getBoost()表示文档和域的加权;t.getBoost()表示关键词的权重。
在确定搜索条目与关键词的文本相关性以及空间相关性之后,可以根据搜索条目与关键词的文本相关性,确定搜索条目与关键词的综合相关性。具体地,可以针对搜索结果中的每一个搜索条目,根据搜索条目与关键词的空间相关性和文本相关性,确定该搜索条目的综合相关性;也就是说,一个搜索条目的综合相关性可以为根据该搜索条目与关键词的空间相关性和文本相关性确定得出的。
本实施例提供了多种确定搜索条目的综合相关性的方式,接下来,将针对其中一种方式进行介绍。
在本方式中,可以将一定比例的搜索条目与关键词的文本相关性,与一定比例的该搜索条目与该关键词的空间相关性之和作为该搜索条目的综合相关性,具体地,可以通过以下公式(13)计算搜索条目的综合相关性,
Sim(q,p)=SimA*x+SimB*y (13)
其中,q表示关键词;p表示搜索条目;Sim(q,p)表示搜索条目的综合相关性;SimA表示q与p之间的空间相关性;SimB表示q与p之间的文本相关性;x为调节参数,表示空间相关性的参数值;y为调节参数,表示文本相关性的参数值。
S204:根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果。
在确定搜索结果中的多个搜索条目各自的综合相关性后,可以根据搜索条目的综合相关性对搜索结果中的多个搜索条目进行排序,例如,可以将搜索结果中的多个搜索条目按照综合相关性由高到低进行排序,使得当多个搜索条目中的第一搜索条目的综合相关性高于该多个搜索条目中的第二搜索条目的综合相关性时,可以将该第一搜索条目排序在该第二搜索条目之前。这样,便可以得到需要向用户展示的排序结果。
由上述技术方案可以看出,在根据关键词搜索得到包括多个搜索条目的搜索结果时,为了对这些搜索条目进行更好的排序,除了计算各搜索条目与该关键词之间的文本相关性外,还可以通过该关键词中能够体现位置信息的位置特征确定出与各搜索条目与该关键词之间的空间相关性,并根据文本相关性和空间相关性确定出各搜索条目对应该关键词的综合相关性。由于一个搜索条目与关键词的空间相关性可以体现该搜索条目与关键词中位置特征之间在空间上的远近关系,故在一些搜索场景例如在电子地图中进行关键词搜索的场景中,通过空间相关性得到的综合相关性可以更好的体现出搜索条目与关键词所基于的搜索目的之间的符合程度,依据综合相关性排序并展示搜索结果中的搜索条目能够更好的满足用户需求。
接下来,将介绍在关键词包括多个位置特征时,如何根据关键词中的多个位置特征确定搜索条目与该关键词之间的空间相关性。在本申请实施例中,提供了多种根据关键词中的多个位置特征确定搜索条目与该关键词之间的空间相关性的方式,例如可以从关键词中的多个位置特征确定出可以体现该关键词的搜索目的的目标位置特征,并根据该目标位置特征确定搜索条目与该关键词之间的空间相关性,或者,可以确定该关键词中各个位置特征与搜索条目之间的空间相关性的平均值,并将所确定的平均值作为该关键词与搜索条目之间的空间相关性。下面将针对上述两种方式进行介绍:
第一种方式:可以确定关键词中各个位置特征与搜索条目之间的空间相关性的平均值,并将所确定的平均值作为关键词与搜索条目之间的空间相关性。
具体地,针对搜索结果中的每一个搜索条目,可以先确定搜索条目与关键词中各个位置特征之间的空间相关性,然后,计算该搜索条目与各个位置特征之间的空间相关性的平均值,接着,可以将该搜索条目与各个位置特征之间的空间相关性的平均值作为该搜索条目与该关键词之间的空间相关性。
例如,假设关键词为“海淀区学院路”,搜索条目为“学院南路”,且搜索条目“学院南路”与位置特征“海淀区”之间的空间相关性为1,搜索条目“学院南路”与位置特征“学院路”之间的空间相关性为0.8;那么,可以计算搜索条目“学院南路”与该关键词“海淀区学院路”中各个位置特征之间的空间相关性的平均值为0.9,从而可以确定搜索条件“学院南路”与该关键词“海淀区学院路”之间的空间相关性为0.9。
第二种方式:可以从关键词中的多个位置特征确定能够体现该关键词的搜索目的的目标位置特征,并根据该目标位置特征确定搜索条目与该关键词之间的空间相关性。
在本方式中,可以先确定关键词中多个位置特征的空间拓扑关系,然后,判断该多个位置特征的空间拓扑关系是否为高相关。
其中,高相关可以包括关键词中多个位置特征的地理范围重叠,需要说明的是,多个位置特征的地理范围重叠可以理解为该多个位置特征中,存在至少一个位置特征的地理范围全部为该多个位置特征的地理范围重叠部分,或者,也可以理解为针对每个位置特征而言,该多个位置特征的地理范围重叠部分仅为位置特征的地理范围中的某一部分。例如,假设关键词为“清华大学丁香园食堂”,由于该关键词中的位置特征“清华大学”的地理范围包括了位置特征“丁香园食堂”的地理范围,即位置特征“清华大学”和位置特征“丁香园食堂”的地理范围重叠部分为“丁香园食堂”的全部地理范围,所以,可以认为位置特征“清华大学”与位置特征“丁香园食堂”的空间拓扑关系为高相关;又例如,假设关键词为“成府路和王庄路东北口”,由于“成府路”和“王庄路”存在交叉口,即位置特征“成府路”和位置特征“王庄路”的地理范围重叠部分均为位置特征“成府路”和位置特征“王庄路”各自的地理范围中的一部分,所以,可以认为位置特征“成府路”与位置特征“王庄路”的空间拓扑关系为高相关。
若确定关键词中多个位置特征的空间拓扑关系为高相关,说明该多个位置特征的地理范围重叠,即该多个位置特征的地理范围均聚焦于一个地理范围内,故该多个位置特征中可以存在一个能够最大程度地体现该关键词的搜索目的的位置特征;为便于描述,可以将关键词的多个位置特征中能够最大程度地体现该关键词的搜索目的的位置特征称之为目标位置特征。接着,可以将目标位置特征与搜索条目之间的空间相关性作为搜索条目与关键词的空间相关性。
需要说明的是,在本申请实施例的一种可能实现方式中,在确定关键词中的多个位置特征的空间拓扑关系为高相关的情况下,从该多个位置特征中确定出目的位置特征的方式可以为:根据关键词中的多个位置特征各自对应的地理范围,将该多个位置特征中地理范围最小的位置特征作为目标位置特征。其中,位置特征的地理范围可以通过位置特征的实际范围或者实体类型来体现。
在本方式中,由于关键词的多个位置特征的地理范围是重叠的,且目标位置特征的地理范围在该关键词的多个位置特征中是最小的,故可以表明该目标位置特征所标识的地理范围比该关键词中的其它位置特征更加精确。因此,该目标位置特征比该关键词中的其他位置特征能够更大程度地体现该关键词的搜索目的。
接下来,将举例说明如何根据关键词中的多个位置特征各自对应的地理范围,确定目标位置特征。
例如,可以根据关键词中的多个位置特征各自对应的实际范围,将该多个位置特征中实际范围最小的位置特征作为目标位置特征。举例来说,假设关键词为“西单商场某某火锅店”,由于“西单商场”中除了包括“某某火锅店”,还可以包括其它商铺,因此,位置特征“西单商场”对应的实际范围大于位置特征“某某火锅店”对应的实际范围,说明位置特征“某某火锅店”比位置特征“西单商城”更加能够体现该关键词“西单商场某某火锅店”的搜索目的;为了可以减少对搜索条目进行排序的计算量,且可以最大程度地体现关键词“西单商场某某火锅店”的搜索目的,可以将关键词“西单商场某某火锅店”中实际范围最小的位置特征“西单商城”作为该关键词“西单商城某某火锅店”的目的位置特征。
又例如,可以根据关键词中的多个位置特征各自对应的实体类型,将该多个位置特征中地理范围最小的位置特征作为目标位置特征。举例来说,假设关键词为“昌平区京藏高速沙河出口”,其中,位置特征“昌平区”对应的实体类型为面,位置特征“京藏高速”对应的实体类型为线,位置特征“沙河出口”对应的实体类型为点,且这三个位置特征的空间拓扑关系为线在面中且点在线上(即位置特征“昌平区”、位置特征“京藏高速”和位置特征“沙河出口”的空间拓扑关系为高相关),由于在点、线和面这三类实体类型中,点对应的地理范围比线对应的地理范围小,线对应的地理范围比面对应的地理范围小,因此,可以确定在这三个位置特征中,位置特征“沙河出口”的地理范围最小,说明位置特征“沙河出口”比位置特征“昌平区”和位置特征“京藏高速”更加能够体现该关键词“昌平区京藏高速沙河出口”的搜索目的;为了可以减少对搜索条目进行排序的计算量,且可以最大程度地体现关键词“昌平区京藏高速沙河出口”的搜索目的,可以将关键词“昌平区京藏高速沙河出口”中地理范围最小的位置特征“沙河出口”作为该关键词“昌平区京藏高速沙河出口”的目的位置特征。
需要强调的是,在将目标位置特征与搜索条目之间的空间相关性作为搜索条目与关键词的空间相关性的情况下,根据搜索条目与关键词的文本相关性以及空间相关性确定搜索条目的综合相关性的过程中,可以将搜索条目与目标位置特征之间的文本相关性作为搜索条目与关键词的文本相关性。也就是说,在利用本方式确定搜索条目与关键词之间的空间相关性的情况下,可以根据搜索条目与目标位置特征之间的文本相关性以及空间相关性,确定搜索条目与该目标位置特征的综合相关性,并可以将搜索条目与该目标位置特征的综合相关性作为搜索条目与关键词的综合相关性。
由上述技术方案可以看出,当关键词包括多个位置特征,且该多个位置特征的空间拓扑关系为高相关时,可以从该多个位置特征中确定出目标位置特征。由于目标位置特征能够最大程度地体现关键词的搜索目的,因此,可以将搜索条目与目标位置特征之间的文本相关性以及空间相关性作为搜索条目与关键词的文本相关性以及空间相关性。可见,在本实施例中,当关键词包括多个位置特征,且该多个位置特征的空间拓扑关系为高相关时,可以仅需要计算搜索条目与目标位置特征之间的文本相关性以及空间相关性即可,而不需要计算搜索条目与各个位置特征之间的文本相关性以及空间相关系,这样,可以减少在确定搜索条目与关键词的综合相关性过程中的计算量,提高了确定搜索条目的综合相关性的效率。
需要说明的是,在确定搜索条目的综合相关性后,会存在综合相关性较高、但却与关键词的搜索目的无关的搜索条目,这类搜索条目有可能会因为较高的综合相关性而排在较前的位置,导致用户会优先看到该搜索条目。为了避免这些综合相关性较高、但却与关键词的搜索目的无关的搜索条目会影响用户体验,在本申请实施例的一种实现方式中,在S204之前,还可以包括以下步骤:
步骤301:确定搜索结果中的多个搜索条目各自对应的实体类型。
步骤302:将对应同一实体类型的搜索条目基于地理位置进行聚类。
在本实施例中,确定多个搜索条目各自对应的实体类型后,可以先根据实体类型将该多个搜索条目进行分类。然后,可以将对应同一实体类型的搜索条目基于地理位置(例如经纬度位置)进行聚类,若对应同一实体类型的多个搜索条目聚集到一起时,说明该多个搜索条目之间具有空间聚类特性,即该多个搜索条目各自的地理位置是相似的。为了便于描述,可以将对应同一实体类型、且具有空间聚类特性的多个搜索条目聚类到一起的结果称之为类。
在本实施例的一种可能实现方式中,可以利用K-means聚类方法,将对应同一实体类型的搜索条目基于地理位置进行聚类。接下来,将以对应实体类型为点的搜索条目为例进行说明:
首先,可以先选取K(K为正整数)个实体类型均为点的搜索条目。然后,可以确定该K个搜索条目各自的质心点,并可以将该K个质心点中的任意一个质心点作为一个类的样本中心点,以及利用如下公式(14)和(15)对该K个质心点进行聚类,直至收敛,
C(i)=argminj||x(i)-μj||2---(14)
其中,C(i)代表与质心点i距离最近的一个类;μj代表属于同一个类的样本中心点;argmin表示计算最小值;m表示需要聚类的质心点的个数;x表示m个质心点中的任意一个。
步骤303:若所述对应同一实体类型的搜索条目通过聚类得到多个类,确定类与所述关键词的综合相关性。
当对应同一实体类型的搜索条目通过聚类得到多个类时,可以针对每一个类,确定类与关键词的综合相关性。其中,一个类至少包括两个搜索条目。
具体地,可以根据类中的搜索条目与关键词的综合相关性,确定类与关键词的综合相关性。例如,可以确定类中各个搜索条目与关键词的综合相关性的平均值,并将所确定的平均值作为类与该关键词的综合相关性。
需要说明的是,在本实施例中,类中各个搜索条目与关键词的综合相关性可以根据以下方式进行确定:将一定比例的搜索条目与关键词的文本相关性,与一定比例的该搜索条目与该关键词的空间相关性之和作为该搜索条目的综合相关性。具体地,可以通过以下公式(16)计算搜索条目的综合相关性,
Sim(q,p)=(α×Cnum)SimA×x+SimB×y (16)
其中,q表示关键词;p表示类中的搜索条目;Sim(q,p)表示类中的搜索条目的综合相关性;SimA表示q与p之间的空间相关性;SimB表示q与p之间的文本相关性;x为调节参数,表示空间相关性的参数值;y为调节参数,表示文本相关性的参数值;α表示类中的搜索条目的聚类因子;Cnum表示聚类结果中一个类的搜索条目的数量。
需要说明的是,在本实施例中,对应同一实体类型的搜索条目通过聚类所得到的多个类可以包括第一类和第二类,且该第一类与关键词的综合相关性大于该第二类与该关键词的综合相关性。那么,S204可以包括以下步骤:在根据搜索条目的综合相关性对搜索结果中的多个搜索条目进行排序的过程中,优先展示第一类的搜索条目;例如,可以将搜索条目排序结果中第一类的搜索条目排序在第二类的搜索条目之前,或者,可以将搜索条目排序结果中第二类的搜索条目删除。
由上述技术方案可以看出,在根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果之前,可以将对应同一实体类型的搜索条目基于地理位置进行聚类,得到多个类;由于一个类与关键词的的综合相关性可以更好的体现出一个类与关键词所基于的搜索目的之间的符合程度,因此,在根据搜索条目的综合相关性对搜索结果中的多个搜索条目进行排序的过程中,可以优先展示综合相关性高的类的搜索条目。这样,在对搜索结果中的多个搜索条目进行排序的过程中,不仅可以减少需要排序的搜索条目,还可以将综合相关性较高、但却与关键词的搜索目的无关的搜索条目从用于展示的排序结果中舍弃,从而使得依据综合相关性排序并展示搜索结果中的搜索条目能够更好的满足用户需求。
参见图3,示出了本申请实施例中一种搜索条目排序装置,所述装置包括:第一确定单元301、第二确定单元302、第三确定单元303和排序单元304;
所述第一确定单元301,用于根据用于搜索的关键词确定包括多个搜索条目的搜索结果;
所述第二确定单元302,用于根据所述关键词中的位置特征,确定搜索条目与所述关键词之间的空间相关性;
所述第三确定单元303,用于根据搜索条目与所述关键词的文本相关性以及空间相关性,确定搜索条目与所述关键词的综合相关性;其中,综合相关性为根据搜索条目与所述关键词的空间相关性和文本相关性确定得出的;
所述排序单元304,用于根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果。
可选的,所述关键词包括多个位置特征,所述第二确定单元302,还用于:
确定所述多个位置特征的空间拓扑关系;
若所述多个位置特征的空间拓扑关系为高相关,从所述多个位置特征中确定出用于体现所述关键词的搜索目的的目标位置特征;所述高相关包括所述多个位置特征的地理范围重叠;
将搜索条目与所述目标位置特征之间的空间相关性作为搜索条目与所述关键词之间的空间相关性。
可选的,所述第二确定单元302,还用于:
根据所述多个位置特征各自对应的地理范围,确定所述目标位置特征,所述目标位置特征为所述多个位置特征中地理范围最小的位置特征。
可选的,搜索条目与所述关键词的文本相关性为搜索条目与所述目标位置特征的文本相关性。
可选的,所述装置还包括:第四确定单元、聚类单元和第五确定单元;
所述第四确定单元,用于确定所述多个搜索条目各自对应的实体类型;
所述聚类单元,用于将对应同一实体类型的搜索条目基于地理位置进行聚类;
所述第五确定单元,用于若所述对应同一实体类型的搜索条目通过聚类得到多个类,确定类与所述关键词的综合相关性;其中,一个类至少包括两个搜索条目;
其中,所述多个类包括第一类和第二类,且所述第一类与所述关键词的综合相关性大于所述第二类与所述关键词的综合相关性;
所述排序单元304,还用于:
在根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序的过程中,优先展示所述第一类的搜索条目。
可选的,所述排序单元304,还用于:
将所述搜索条目排序结果中所述第一类的搜索条目排序在所述第二类的搜索条目之前;
或者,
将所述搜索条目排序结果中所述第二类的搜索条目删除。
参照图4,搜索条目排序设备400可以包括以下一个或多个组件:处理组件402,存储器404,电源组件406,多媒体组件406,音频组件410,输入/输出(I/O)的接口412,传感器组件414,以及通信组件416。
处理组件402通常控制设备400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理部件402可以包括多媒体模块,以方便多媒体组件406和处理组件402之间的交互。
存储器404被配置为存储各种类型的数据以支持在设备400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理系统,一个或多个电源,及其他与为装置400生成、管理和分配电力相关联的组件。
多媒体组件406包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件406包括一个前置摄像头和/或后置摄像头。当设备400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(MIC),当装置400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
I/O接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件414包括一个或多个传感器,用于为装置400提供各个方面的状态评估。例如传感器组件414可以检测到设备400的打开/关闭状态,组件的相对定位,例如所述组件为装置400的显示器和小键盘,传感器组件414还可以检测装置400或装置400一个组件的位置改变,用户与装置400接触的存在或不存在,装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
本申请实施例提供了一种搜索条目排序设备。该设备包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
根据用于搜索的关键词确定包括多个搜索条目的搜索结果;
根据所述关键词中的位置特征,确定搜索条目与所述关键词之间的空间相关性;
根据搜索条目与所述关键词的文本相关性以及空间相关性,确定搜索条目与所述关键词的综合相关性;其中,综合相关性为根据搜索条目与所述关键词的空间相关性和文本相关性确定得出的;
根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果。
可选的,所述关键词包括多个位置特征,所述根据所述关键词中的位置特征,确定搜索条目与所述关键词之间的空间相关性,包括:
确定所述多个位置特征的空间拓扑关系;
若所述多个位置特征的空间拓扑关系为高相关,从所述多个位置特征中确定出用于体现所述关键词的搜索目的的目标位置特征;所述高相关包括所述多个位置特征的地理范围重叠;
将搜索条目与所述目标位置特征之间的空间相关性作为搜索条目与所述关键词之间的空间相关性。
可选的,所述从所述多个位置特征中确定出用于体现所述关键词的搜索目的的目标位置特征,包括:
根据所述多个位置特征各自对应的地理范围,确定所述目标位置特征,所述目标位置特征为所述多个位置特征中地理范围最小的位置特征。
可选的,搜索条目与所述关键词的文本相关性为搜索条目与所述目标位置特征的文本相关性。
可选的,在所述根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果之前,所述方法还包括:
确定所述多个搜索条目各自对应的实体类型;
将对应同一实体类型的搜索条目基于地理位置进行聚类;
若所述对应同一实体类型的搜索条目通过聚类得到多个类,确定类与所述关键词的综合相关性;其中,一个类至少包括两个搜索条目;
其中,所述多个类包括第一类和第二类,且所述第一类与所述关键词的综合相关性大于所述第二类与所述关键词的综合相关性;
所述根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果,包括:
在根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序的过程中,优先展示所述第一类的搜索条目。
可选的,所述优先展示所述第一类的搜索条目的方式,包括:
将所述搜索条目排序结果中所述第一类的搜索条目排序在所述第二类的搜索条目之前;
或者,
将所述搜索条目排序结果中所述第二类的搜索条目删除。
本申请实施例还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由装置400的处理器420执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种搜索条目排序方法,所述方法包括:
根据用于搜索的关键词确定包括多个搜索条目的搜索结果;
根据所述关键词中的位置特征,确定搜索条目与所述关键词之间的空间相关性;
根据搜索条目与所述关键词的文本相关性以及空间相关性,确定搜索条目与所述关键词的综合相关性;其中,综合相关性为根据搜索条目与所述关键词的空间相关性和文本相关性确定得出的;
根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果。
可选的,所述关键词包括多个位置特征,所述根据所述关键词中的位置特征,确定搜索条目与所述关键词之间的空间相关性,包括:
确定所述多个位置特征的空间拓扑关系;
若所述多个位置特征的空间拓扑关系为高相关,从所述多个位置特征中确定出用于体现所述关键词的搜索目的的目标位置特征;所述高相关包括所述多个位置特征的地理范围重叠;
将搜索条目与所述目标位置特征之间的空间相关性作为搜索条目与所述关键词之间的空间相关性。
可选的,所述从所述多个位置特征中确定出用于体现所述关键词的搜索目的的目标位置特征,包括:
根据所述多个位置特征各自对应的地理范围,确定所述目标位置特征,所述目标位置特征为所述多个位置特征中地理范围最小的位置特征。
可选的,搜索条目与所述关键词的文本相关性为搜索条目与所述目标位置特征的文本相关性。
可选的,在所述根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果之前,所述方法还包括:
确定所述多个搜索条目各自对应的实体类型;
将对应同一实体类型的搜索条目基于地理位置进行聚类;
若所述对应同一实体类型的搜索条目通过聚类得到多个类,确定类与所述关键词的综合相关性;其中,一个类至少包括两个搜索条目;
其中,所述多个类包括第一类和第二类,且所述第一类与所述关键词的综合相关性大于所述第二类与所述关键词的综合相关性;
所述根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果,包括:
在根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序的过程中,优先展示所述第一类的搜索条目。
可选的,所述优先展示所述第一类的搜索条目的方式,包括:
将所述搜索条目排序结果中所述第一类的搜索条目排序在所述第二类的搜索条目之前;
或者,
将所述搜索条目排序结果中所述第二类的搜索条目删除。
图5是本申请实施例中服务器的结构示意图。该服务器500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)522(例如,一个或一个以上处理器)和存储器532,一个或一个以上存储应用程序542或数据544的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器532和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器522可以设置为与存储介质530通信,在服务器500上执行存储介质530中的一系列指令操作。
服务器500还可以包括一个或一个以上电源526,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口558,一个或一个以上键盘556,和/或,一个或一个以上操作系统541,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:read-only memory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (10)
1.一种搜索条目排序方法,其特征在于,所述方法包括:
根据用于搜索的关键词确定包括多个搜索条目的搜索结果;
根据所述关键词中的位置特征,确定搜索条目与所述关键词之间的空间相关性;
根据搜索条目与所述关键词的文本相关性以及空间相关性,确定搜索条目与所述关键词的综合相关性;其中,综合相关性为根据搜索条目与所述关键词的空间相关性和文本相关性确定得出的;
根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果。
2.根据权利要求1所述的方法,其特征在于,所述关键词包括多个位置特征,所述根据所述关键词中的位置特征,确定搜索条目与所述关键词之间的空间相关性,包括:
确定所述多个位置特征的空间拓扑关系;
若所述多个位置特征的空间拓扑关系为高相关,从所述多个位置特征中确定出用于体现所述关键词的搜索目的的目标位置特征;所述高相关包括所述多个位置特征的地理范围重叠;
将搜索条目与所述目标位置特征之间的空间相关性作为搜索条目与所述关键词之间的空间相关性。
3.根据权利要求2所述的方法,其特征在于,所述从所述多个位置特征中确定出用于体现所述关键词的搜索目的的目标位置特征,包括:
根据所述多个位置特征各自对应的地理范围,确定所述目标位置特征,所述目标位置特征为所述多个位置特征中地理范围最小的位置特征。
4.根据权利要求2所述的方法,其特征在于,搜索条目与所述关键词的文本相关性为搜索条目与所述目标位置特征的文本相关性。
5.根据权利要求1至3任一所述的方法,其特征在于,在所述根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果之前,所述方法还包括:
确定所述多个搜索条目各自对应的实体类型;
将对应同一实体类型的搜索条目基于地理位置进行聚类;
若所述对应同一实体类型的搜索条目通过聚类得到多个类,确定类与所述关键词的综合相关性;其中,一个类至少包括两个搜索条目;
其中,所述多个类包括第一类和第二类,且所述第一类与所述关键词的综合相关性大于所述第二类与所述关键词的综合相关性;
所述根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果,包括:
在根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序的过程中,优先展示所述第一类的搜索条目。
6.根据权利要求5所述的方法,其特征在于,所述优先展示所述第一类的搜索条目的方式,包括:
将所述搜索条目排序结果中所述第一类的搜索条目排序在所述第二类的搜索条目之前;
或者,
将所述搜索条目排序结果中所述第二类的搜索条目删除。
7.一种搜索条目排序装置,其特征在于,所述装置包括:第一确定单元、第二确定单元、第三确定单元和排序单元;
所述第一确定单元,用于根据用于搜索的关键词确定包括多个搜索条目的搜索结果;
所述第二确定单元,用于根据所述关键词中的位置特征,确定搜索条目与所述关键词之间的空间相关性;
所述第三确定单元,用于根据搜索条目与所述关键词的文本相关性以及空间相关性,确定搜索条目与所述关键词的综合相关性;其中,综合相关性为根据搜索条目与所述关键词的空间相关性和文本相关性确定得出的;
所述排序单元,用于根据搜索条目的综合相关性对所述搜索结果中的多个搜索条目进行排序,得到用于展示的排序结果。
8.根据权利要求7所述的装置,其特征在于,所述关键词包括多个位置特征,所述第二确定单元,还用于:
确定所述多个位置特征的空间拓扑关系;
若所述多个位置特征的空间拓扑关系为高相关,从所述多个位置特征中确定出用于体现所述关键词的搜索目的的目标位置特征;所述高相关包括所述多个位置特征的地理范围重叠;
将搜索条目与所述目标位置特征之间的空间相关性作为搜索条目与所述关键词之间的空间相关性。
9.一种搜索条目排序设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如权利要求1至6中任意一项所述搜索条目排序方法。
10.一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至6中任意一项所述搜索条目排序方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810451157.4A CN110472158B (zh) | 2018-05-11 | 2018-05-11 | 一种搜索条目的排序方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810451157.4A CN110472158B (zh) | 2018-05-11 | 2018-05-11 | 一种搜索条目的排序方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110472158A true CN110472158A (zh) | 2019-11-19 |
CN110472158B CN110472158B (zh) | 2024-01-30 |
Family
ID=68504389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810451157.4A Active CN110472158B (zh) | 2018-05-11 | 2018-05-11 | 一种搜索条目的排序方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110472158B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111310072A (zh) * | 2020-01-17 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 关键词提取方法、装置和计算机可读存储介质 |
CN112559926A (zh) * | 2020-12-22 | 2021-03-26 | 北京百度网讯科技有限公司 | 搜索展示条目的上线处理方法、装置、设备、介质及产品 |
CN113761227A (zh) * | 2020-08-12 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 文本数据的搜索方法和装置 |
WO2023173821A1 (zh) * | 2022-03-15 | 2023-09-21 | 华为云计算技术有限公司 | 一种集成开发环境搜索数据的方法和相关设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853270A (zh) * | 2010-04-29 | 2010-10-06 | 北京艾德思奇科技有限公司 | 一种获得信息位置的方法及装置 |
CN103914498A (zh) * | 2013-03-18 | 2014-07-09 | 百度在线网络技术(北京)有限公司 | 一种地图搜索的搜索建议方法和装置 |
CN103927310A (zh) * | 2013-01-14 | 2014-07-16 | 百度在线网络技术(北京)有限公司 | 一种地图数据搜索建议生成方法及装置 |
CN104933100A (zh) * | 2015-05-28 | 2015-09-23 | 北京奇艺世纪科技有限公司 | 关键词推荐方法和装置 |
CN105302810A (zh) * | 2014-06-12 | 2016-02-03 | 北京搜狗科技发展有限公司 | 一种信息搜索方法和装置 |
CN106776763A (zh) * | 2016-11-22 | 2017-05-31 | 北京云知声信息技术有限公司 | 目的地搜索方法及装置 |
CN106933883A (zh) * | 2015-12-31 | 2017-07-07 | 中移(苏州)软件技术有限公司 | 基于检索日志的兴趣点常用检索词分类方法、装置 |
WO2017181613A1 (zh) * | 2016-04-18 | 2017-10-26 | 乐视控股(北京)有限公司 | 搜索响应方法、装置及系统 |
-
2018
- 2018-05-11 CN CN201810451157.4A patent/CN110472158B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853270A (zh) * | 2010-04-29 | 2010-10-06 | 北京艾德思奇科技有限公司 | 一种获得信息位置的方法及装置 |
CN103927310A (zh) * | 2013-01-14 | 2014-07-16 | 百度在线网络技术(北京)有限公司 | 一种地图数据搜索建议生成方法及装置 |
CN103914498A (zh) * | 2013-03-18 | 2014-07-09 | 百度在线网络技术(北京)有限公司 | 一种地图搜索的搜索建议方法和装置 |
CN105302810A (zh) * | 2014-06-12 | 2016-02-03 | 北京搜狗科技发展有限公司 | 一种信息搜索方法和装置 |
CN104933100A (zh) * | 2015-05-28 | 2015-09-23 | 北京奇艺世纪科技有限公司 | 关键词推荐方法和装置 |
CN106933883A (zh) * | 2015-12-31 | 2017-07-07 | 中移(苏州)软件技术有限公司 | 基于检索日志的兴趣点常用检索词分类方法、装置 |
WO2017181613A1 (zh) * | 2016-04-18 | 2017-10-26 | 乐视控股(北京)有限公司 | 搜索响应方法、装置及系统 |
CN106776763A (zh) * | 2016-11-22 | 2017-05-31 | 北京云知声信息技术有限公司 | 目的地搜索方法及装置 |
Non-Patent Citations (1)
Title |
---|
周惠;柳劲华;: "面向搜索引擎的企业网站优化技术", 软件导刊, no. 10, pages 150 - 152 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111310072A (zh) * | 2020-01-17 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 关键词提取方法、装置和计算机可读存储介质 |
CN113761227A (zh) * | 2020-08-12 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 文本数据的搜索方法和装置 |
CN112559926A (zh) * | 2020-12-22 | 2021-03-26 | 北京百度网讯科技有限公司 | 搜索展示条目的上线处理方法、装置、设备、介质及产品 |
CN112559926B (zh) * | 2020-12-22 | 2023-10-03 | 北京百度网讯科技有限公司 | 搜索展示条目的上线处理方法、装置、设备、介质及产品 |
WO2023173821A1 (zh) * | 2022-03-15 | 2023-09-21 | 华为云计算技术有限公司 | 一种集成开发环境搜索数据的方法和相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110472158B (zh) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210117726A1 (en) | Method for training image classifying model, server and storage medium | |
CN102467574B (zh) | 移动终端及其元数据设置方法 | |
CN110472158A (zh) | 一种搜索条目的排序方法和装置 | |
CN109800325A (zh) | 视频推荐方法、装置和计算机可读存储介质 | |
CN105787102B (zh) | 搜索方法、装置以及用于搜索的装置 | |
CN104850238B (zh) | 对输入法所产生的候选项进行排序的方法和装置 | |
CN106354758B (zh) | 处理房屋信息的方法及装置 | |
CN103077050A (zh) | 一种显示应用程序信息的方法、装置及设备 | |
CN103460238A (zh) | 从照片中进行事件确定 | |
CN110020148A (zh) | 一种信息推荐方法、装置和用于信息推荐的装置 | |
CN110019645A (zh) | 索引库构建方法、搜索方法及装置 | |
CN107560619A (zh) | 路径推荐方法和装置 | |
CN111611490A (zh) | 资源搜索方法、装置、设备及存储介质 | |
CN108874827A (zh) | 一种搜索方法及相关装置 | |
CN111984749A (zh) | 一种兴趣点排序方法和装置 | |
CN112784142A (zh) | 一种信息推荐方法及装置 | |
CN108572979A (zh) | 一种位置服务方法和装置、一种用于位置服务的装置 | |
CN112328911A (zh) | 地点推荐方法、装置、设备及存储介质 | |
Hui et al. | Mobile augmented reality of tourism-Yilan hot spring | |
CN114117206B (zh) | 推荐模型处理方法、装置、电子设备及存储介质 | |
CN103678441A (zh) | 设备及使用该设备的内容搜索方法 | |
CN110110207A (zh) | 一种信息推荐方法、装置及电子设备 | |
CN112307281A (zh) | 一种实体推荐方法及装置 | |
CN109521888A (zh) | 一种输入方法、装置和介质 | |
CN105843865B (zh) | 媒体文件播放方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |