CN104598583A - 查询语句推荐列表的生成方法和装置 - Google Patents

查询语句推荐列表的生成方法和装置 Download PDF

Info

Publication number
CN104598583A
CN104598583A CN201510018916.4A CN201510018916A CN104598583A CN 104598583 A CN104598583 A CN 104598583A CN 201510018916 A CN201510018916 A CN 201510018916A CN 104598583 A CN104598583 A CN 104598583A
Authority
CN
China
Prior art keywords
time
query statement
recommended keywords
attenuation model
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510018916.4A
Other languages
English (en)
Other versions
CN104598583B (zh
Inventor
吴先超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510018916.4A priority Critical patent/CN104598583B/zh
Publication of CN104598583A publication Critical patent/CN104598583A/zh
Application granted granted Critical
Publication of CN104598583B publication Critical patent/CN104598583B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种查询语句推荐列表的生成方法和装置,该查询语句推荐列表的生成方法包括:接收用户输入的查询语句;对所述查询语句相关联的推荐关键词进行排序,获得所述查询语句的推荐列表。本发明可以更好地基于时间和空间的相关性信息来连接人和服务,以及连接人和人的习惯,提高搜索结果页面中右侧推荐内容对用户下一步决策的协助能力,从而提高满足用户需求的精度,进而可以提高搜索引擎的整体点击率。

Description

查询语句推荐列表的生成方法和装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种查询语句推荐列表的生成方法和装置。
背景技术
基于本地化服务的搜索引擎的右侧推荐,是提高搜索产品流量和点击率的重要方法。图1为现有技术查询语句推荐列表一个示例的示意图,如图1所示,当在搜索引擎中输入“谷歌创始人大跃进”这个查询语句的时候,在屏幕的右侧推荐部分,出现了“周围人都在搜”的提示和列表。
但是,需要注意的一个问题是,这种“身边热词”在相关性上,和用户输入的查询语句的关系不大。除非用户非常闲,否则这些推荐列表上的不相关的推荐内容,不容易被用户点击,至多是看一眼,就直接忽略了,从而导致右侧推荐列表的点击率较低,用户体验较差。
发明内容
本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种查询语句推荐列表的生成方法。通过该方法,对查询语句相关联的推荐关键词进行排序,获得上述查询语句的推荐列表,从而可以更好地基于时间和空间的相关性信息来连接人和服务,以及连接人和人的习惯,为用户的选择提供辅助,进而可以提高用户体验度。
本发明的第二个目的在于提出一种查询语句推荐列表的生成装置。
为了实现上述实施例,本发明第一方面实施例的查询语句推荐列表的生成方法,包括:接收用户输入的查询语句;对所述查询语句相关联的推荐关键词进行排序,获得所述查询语句的推荐列表。
本发明实施例的查询语句推荐列表的生成方法,接收用户输入的查询语句之后,对上述查询语句相关联的推荐关键词进行排序,获得上述查询语句的推荐列表,从而可以更好地基于时间和空间的相关性信息来连接人和服务,以及连接人和人的习惯,提高搜索结果页面中右侧推荐内容对用户下一步决策的协助能力,从而提高满足用户需求的精度,进而可以提高搜索引擎的整体点击率。
为了实现上述实施例,本发明第二方面实施例的查询语句推荐列表的生成装置,包括:接收模块,用于接收用户输入的查询语句;排序模块,用于对所述接收模块接收的查询语句相关联的推荐关键词进行排序,获得所述查询语句的推荐列表。
本发明实施例的查询语句推荐列表的生成装置,接收模块接收用户输入的查询语句之后,排序模块对上述查询语句相关联的推荐关键词进行排序,获得上述查询语句的推荐列表,从而可以更好地基于时间和空间的相关性信息来连接人和服务,以及连接人和人的习惯,提高搜索结果页面中右侧推荐内容对用户下一步决策的协助能力,从而提高满足用户需求的精度,进而可以提高搜索引擎的整体点击率。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为现有技术查询语句推荐列表一个示例的示意图;
图2为本发明查询语句推荐列表的生成方法一个实施例的流程图;
图3为本发明查询语句推荐列表的生成方法一个应用场景的示意图;
图4为本发明查询语句推荐列表的生成装置一个实施例的结构示意图;
图5为本发明查询语句推荐列表的生成装置另一个实施例的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图2为本发明查询语句推荐列表的生成方法一个实施例的流程图,如图1所示,该查询语句推荐列表的生成方法可以包括:
步骤201,接收用户输入的查询语句。
步骤202,对上述查询语句相关联的推荐关键词进行排序,获得上述查询语句的推荐列表。
进一步地,获得上述查询语句的推荐列表之后,还可以展示上述查询语句的推荐列表。
具体地,本实施例的一种实现方式中,对上述查询语句相关联的推荐关键词进行排序可以为:获得上述查询语句的检索时间;根据上述查询语句的检索时间调用下一时间点的时间衰减模型计算上述查询语句相关联的推荐关键词的预估频次;然后,根据上述预估频次对上述查询语句相关联的推荐关键词进行排序。
本实施例的另一种实现方式中,对上述查询语句相关联的推荐关键词进行排序可以为:获得上述查询语句的检索时间和检索地点;根据上述查询语句的检索时间调用下一时间点的时间衰减模型计算上述查询语句相关联的推荐关键词的预估频次,然后计算上述查询语句的检索地点与推荐地点之间的距离,上述推荐地点为上述查询语句相关联的推荐关键词所指示的地点;最后根据上述预估频次和上述距离对上述查询语句相关联的推荐关键词进行排序。
本实施例的上述两种实现方式中,根据上述查询语句的检索时间调用下一时间点的时间衰减模型计算上述查询语句相关联的推荐关键词的预估频次之前,还可以先根据上述查询语句相关联的推荐关键词的历史点击频次和当前时间点对应的指数消减函数确定当前时间点的时间衰减模型;然后根据当前时间点的时间衰减模型和下一时间点对应的指数消减函数,以及上述查询语句相关联的推荐关键词在当前时间点与下一时间点的时间间隔内出现的频次确定下一时间点的时间衰减模型。
其中,根据上述查询语句相关联的推荐关键词的历史点击频次和当前时间点对应的指数消减函数确定当前时间点的时间衰减模型可以为:
确定当前时间点的时间衰减模型为:其中,C(w,t)为当前时间点的时间衰减模型;numi.w为上述查询语句相关联的推荐关键词的历史点击频次;k(t,ti)为上述当前时间点对应的指数消减函数。
其中,根据当前时间点的时间衰减模型和下一时间点对应的指数消减函数,以及上述查询语句相关联的推荐关键词在当前时间点与下一时间点的时间间隔内出现的频次确定下一时间点的时间衰减模型可以为:
确定下一时间点的时间衰减模型为:C(w,t+1)=exp(-λ)C(w,t)+numn+1.w×k(t+1,tn+1),其中,C(w,t+1)为下一时间点的时间衰减模型,C(w,t)为当前时间点的时间衰减模型,k(t+1,tn+1)为下一时间点对应的指数消减函数,numn+1.w为上述查询语句相关联的推荐关键词在当前时间点与下一时间点的时间间隔内出现的频次。
上述实施例中,接收用户输入的查询语句之后,对上述查询语句相关联的推荐关键词进行排序,获得上述查询语句的推荐列表,从而可以更好地基于时间和空间的相关性信息来连接人和服务,以及连接人和人的习惯,提高搜索结果页面中右侧推荐内容对用户下一步决策的协助能力,从而提高满足用户需求的精度,进而可以提高搜索引擎的整体点击率。
本发明图2所示实施例提供的方法可以更好地通过搜索引擎来连接人和服务,例如连接人和饭店、租房信息、住房信息和医疗信息中的至少一个信息等的推荐(基于地理位置的距离远近,基于季节、月份、日期和或星期几等的时间性信息),举例来说,对于查询语句“晚上吃什么”,如果是春天查询,则优先推荐春天的食谱,以及在春天这个季节,大家对于“晚上吃什么”的高频点击结果。再如,对于查询语句“吃点什么呢”,则搜索引擎主动判断当前查询的时间点,如果是早餐时间,则推荐附近的早餐铺子,简单的早餐食谱等;如果是中午时间,则推荐午餐菜单和附近的饭店等信息。
本发明图2所示实施例提供的方法还可以更好地通过搜索引擎来连接人和大众,前述连接人和服务的时候,是参考了大众用户的输入查询语句的趋势和点击的趋势的。这样的话,其实体现了人的选择的社会性。从而让这种选择,体现在右侧推荐上,进而允许用户去顺从或逆反大众的多数人的选择。例如,当用户输入查询语句“中午吃什么”的时候,假设在正常网页上,前两个最高的点击下:有100个人点击了“xx火锅饭店”,有50个人点击了“午餐食谱”,则这两个点击链接可以移动到右侧推荐直接展示给用户,从而可以满足通过一次搜索,向用户展示出基于时间和地点的相关搜索上面的用户点击结果。基于上述考虑,可以更好地提高右侧推荐内容对用户下一步决策的协助能力,从而提高满足用户需求的精度,进而可以提高搜索引擎的整体点击率。
本发明图2所示实施例提供的方法的一个典型的应用场景可以如图3所示,图3为本发明查询语句推荐列表的生成方法一个应用场景的示意图,图3中,将“周围人都在搜”,增加为“周围/时间段”都在搜,即增加基于时间段时效性的内容;例如,午饭前,用户输入“外卖”这一查询语句,搜索引擎可以给出“本时间段周围人都在搜”这一推荐列表,该推荐列表中给出与“外卖”相关联的推荐关键词。这个时候,用户找的是午饭相关的,而早饭和晚饭这两个时间段相关的,权重应该调低。因此,本发明图2所示实施例提供的方法中引入时间衰减模型来衡量一个关键词的基于时间的热度。
图3中列出了三个维度,即时间、空间和综合。其中,“时间”这个维度,侧重于从当前时间段的角度刻画相关搜索;“空间”这个维度,则侧重于从地理位置的远近的角度刻画相关搜索;“综合”这个维度,则是优先按照时间最近以及距离最近的双重维度下的用户实际点击搜索结果页的数据来对相关搜索进行排序。需要注意的是,本发明图2所示实施例中提到的推荐列表的展现方式,不限于图3中从左到右的排版方式,也可以是从上到下的排版方式,本实施例对推荐列表的展现方式不作限定。
本发明图2所示实施例中,决定查询语句相关联的推荐关键词是否被展示在推荐列表中,以及展示的具体位置(即推荐关键词在推荐列表中的排序)的有如下几个参数:
(1)查询语句相关联的推荐关键词与用户输入的查询语句的相关度;
(2)查询语句相关联的推荐关键词的基于时间衰减模型的预估权重;
(3)查询语句相关联的推荐关键词所指示的地点与当前用户执行检索请求的地点之间的距离。
其中,第(1)点是基于搜索引擎已有的“用户检索的查询语句和查询语句相关联的推荐关键词之间的相似度计算方法”来确定的,而第(3)点是简单的基于地理位置信息的计算,其相对来说容易计算,只需要知道两个地点的坐标位置,就可以计算出来实际的地理距离,在此不再冗述。
下面着重介绍第(2)点查询语句相关联的推荐关键词的基于时间衰减模型的预估权重。
本发明图2所示实施例提供的方法的一个核心创新点在于引入时间衰减模型,来刻画基于时间衰减的查询语句的相关联的推荐关键词的重要性。举例来说,查询语句为“中午吃什么”时,该查询语句中的“中午”和“吃”都是关键词语,然后该查询语句相关联的推荐关键词可以包括“午餐食谱”和“xx午餐外卖”等相关性高的推荐关键词。
该时间衰减模型的数学建模过程介绍如下:
考虑一个n-gram的(wi,ti)流,其中wi是一个n-gram,这里的n-gram体现在搜索引擎中,是一个用户输入的查询语句中的词或者短语,而ti是wi对应的时间戳,该时间戳可以从搜索日志中获取。时间衰减模型的目的是预测在下一个时间点,当用户输入一个查询语句的时候,该用户所想要的基于时间衰减的最优右侧推荐列表。映射到时间衰减模型上,需要根据(w1,t1),(w2,t2),…,(wi,ti)这些历史信息来预测ti+1时刻,用户心中所期望的wi+1确切地是什么n-gram,通过这样的预测,就可以根据时间敏感度,实时动态地生成一个查询语句的右侧推荐列表。这种时间衰减模型可以应用到“搜索推荐候选自动挖掘和排序”上,更进一步地,可以通过这种时间衰减模型识别新词和热词并从“右侧推荐列表”对用户推送搜索到的相关链接。
本发明中,时间衰减模型的基本思想是,一个n-gram在当前时间点的出现,将为该n-gram在将来时间点的重现贡献力量,即对n-gram的概率增值。但是,这种增值的比重会随着时间的推移而慢慢变弱。这里,可以采用“指数消减函数”作为kernel函数计算增值量,其中,指数消减函数如式(1)所示,
这里的λ被称为“消减常数”。特别地,当λ的取值为0的时候,有k(t,t0)=1。在当前时间点t,如果当前的历史是H={(w1,t1),…,(wn,tn)},则n-gram w的积累权值可以按照式(2)计算:
C ( w , t ) = Σ i = 1 n δ ( w , w i ) k ( t , t i ) - - - ( 2 )
这里的δ(w,wi)是delta函数:若w=wi,则δ(w,wi)=1,否则δ(w,wi)=0。从而,在给定历史H的前提下,n-gram w在当前时间点t出现的概率为:
P ^ ( w n + 1 = w | H , t n + 1 = t ) = P ^ ( w | C ( w , t ) ) = C ( w , t ) + μ Σ w ′ [ C ( w ′ , t ) + μ ] - - - ( 3 )
式(3)中,0≤μ≤1是Lidston平滑的参数,当μ取值为0的时候,式(3)对应合并了频次和崭新度的极大似然估计。特别地,当w从来没有出现过的时候,即w是一个新词的时候,也可以通过μ来实现平滑,这时μ的取值大于0。
下面对该时间衰减模型进行扩展,即不再考虑一个n-gram w在某个时间点ti是否出现,而是n-gram w出现的次数(对应于搜索引擎右侧推荐列表的被点击的次数)是多少,于是可以重新定义历史H为
H={(<w,num1.w>+,t1),…,(<w,numn.w>+,tn)}   (4)
这里,(<w,num1.w>+,t1)表示的是t1时间段下的时间衰减模型,“<w,num1.w>+”表示时间段t1内时间衰减模型下的所有的n-gram w,以及其频次信息num1.w,符号“+”表示这样的w有1个到多个。其中,时间段t1是指t1的上一个时间点到t1这个时间点之间的时间段。
因为引入了num1.w,即n-gram w的出现频次,于是C(w,t)可以表示为:
C ( w , t ) = &Sigma; i = 1 n num i , w &times; k ( t , t i ) - - - ( 5 )
下面使用C(w,t)来描述C(w,t+1),这样的目的是实现在线学习,即在构造出了“当前时间点t”的时间衰减模型之后,可以快速地构造出“下一个时间点t+1”的时间衰减模型。C(w,t+1)可以如式(6)所示:
C ( w , t + 1 ) = &Sigma; i = 1 n + 1 num i . w &times; k ( t + 1 , t i ) = &Sigma; i = 1 n num i . w &times; k ( t + 1 , t i ) + num n + 1 . w &times; k ( t + 1 , t n + 1 ) = &Sigma; i = 1 n num i . w &times; exp ( - &lambda; ) &times; k ( t , t i ) + num n + 1 . w &times; k ( t + 1 , t n + 1 ) = exp ( - &lambda; ) C ( w , t ) + num n + 1 . w &times; k ( t + 1 , t n + 1 ) - - - ( 6 )
下面以用户的查询语句为“晚饭吃什么”为例,介绍使用本发明图2所示实施例提供的方法的一个具体执行的示例。
这里以“晚饭吃什么”这一查询语句相关联的推荐关键词为“胜利涮羊肉”为例进行说明。也就是说,以下举例中n-gram是“胜利涮羊肉”。下面着重介绍这个n-gram的基于时间衰减模型的权重。这里进一步限定,以一周(7天)为单位,并只考虑每天下午16:00-18:00的检索时间,该n-gram的历史点击频次为H={(<“胜利涮羊肉”,55>+,2014.11.02-08),
(<“胜利涮羊肉”,78>+,2014.11.09-15),
(<“胜利涮羊肉”,121>+,2014.11.16-22),
(<“胜利涮羊肉”,187>+,2014.11.23-29)}
其中,2014.11.02-08表示2014年11月2日至2014年11月8日,2014.11.09-15表示2014年11月9日至2014年11月15日,2014.11.16-22表示2014年11月16日至2014年11月22日,2014.11.23-29表示2014年11月23日至2014年11月29日。
现在根据如上四周的历史点击频次,来预测之后的一周,即2014年11月30日(2014.11.30)至2014年12月6日(2014.12.06)的“胜利涮羊肉”的预估权重。
根据式(1)和式(6),可以得出:
C(“胜利涮羊肉”,2014.11.30-2014.12.06)
=55×k(2014.11.30-2014.12.06,2014.11.02-08)+
78×k(2014.11.30-2014.12.06,2014.11.09-15)+
121×k(2014.11.30-2014.12.06,2014.11.16-22)+
187×k(2014.11.30-2014.12.06,2014.11.23-29)
=55×exp(-4λ)+78×exp(-3λ)+121×exp(-2λ)+187×exp(-λ)
因为是按一周为一个时间单位,而且2014.11.30-2014.12.06和2014.11.23-29相差一周,从而k(2014.11.30-2014.12.06,2014.11.23-29)的取值是exp(-λ×1)=exp(-λ)。同理,可以计算出来其他时间间隔上的次数衰减到当前周之后的一个权重。上述基于四周历史数据的叠加,就是当前关注的这一周,“胜利涮羊肉”的预估权重:55×exp(-4λ)+78×exp(-3λ)+121×exp(-2λ)+187×exp(-λ)。
特别地,当λ取值为0的时候,则“胜利涮羊肉”的预估权重为:55+78+121+178,即频次和时间无关,即使是四周前的频次,其重要度和一周前是一样的。如果简单设置λ为1,则“胜利涮羊肉”的预估权重为:55×exp(-4)+78×exp(-3)+121×exp(-2)+187×exp(-1)=55/54.5981+78/20.0855+121/7.3891+187/2.7183=1.0074+3.8834+16.3755+68.7930=90.0593。
在实际使用过程中,λ一般取0到1之间的一个小数,例如0.5。
最终,在计算出来根据时间衰减模型的“胜利涮羊肉”的当前关注时间上的预估频次之后,就可以根据这个预估频次,对其进行排名了。同样参与排名的还有其他的一些n-gram,例如“麻辣火锅”等与“晚饭吃什么”相关的一些推荐关键词。当这些相关的n-gram都被收集出来,并且每个n-gram的预估频次都被按照上面的方法计算出来之后,就可以简单地按照预估频次对这些n-gram进行排序了。例如最终展示8个相关的推荐n-gram,则可以按照排序结果,保留前8个n-gram,并把其他的n-gram舍弃掉(不在搜索引擎的右侧推荐列表中展示给用户)。而剩下的8个n-gram的展示的先后顺序,就是根据预估频次的大小排列的。
图4为本发明查询语句推荐列表的生成装置一个实施例的结构示意图,本实施例的查询语句推荐列表的生成装置可以作为搜索引擎,或者作为搜索引擎的一部分实现本发明图2所示实施例的流程。如图4所示,该查询语句推荐列表的生成装置可以包括:接收模块41和排序模块42;
其中,接收模块41,用于接收用户输入的查询语句;
排序模块42,用于对接收模块41接收的查询语句相关联的推荐关键词进行排序,获得上述查询语句的推荐列表。
上述查询语句推荐列表的生成装置中,接收模块41接收用户输入的查询语句之后,排序模块42对上述查询语句相关联的推荐关键词进行排序,获得上述查询语句的推荐列表,从而可以更好地基于时间和空间的相关性信息来连接人和服务,以及连接人和人的习惯,提高搜索结果页面中右侧推荐内容对用户下一步决策的协助能力,从而提高满足用户需求的精度,进而可以提高搜索引擎的整体点击率。
图5为本发明查询语句推荐列表的生成装置另一个实施例的结构示意图,与图4所示的查询语句推荐列表的生成装置相比,不同之处在于,图5所示的查询语句推荐列表的生成装置中,排序模块42可以包括:获得子模块421、计算子模块422和关键词排序子模块423;
本实施例的一种实现方式中,获得子模块421,用于获得上述查询语句的检索时间;
计算子模块422,用于根据获得子模块421获得的查询语句的检索时间调用下一时间点的时间衰减模型计算上述查询语句相关联的推荐关键词的预估频次;
关键词排序子模块423,用于根据计算子模块422计算的预估频次对上述查询语句相关联的推荐关键词进行排序。
本实施例的另一种实现方式中,获得子模块421,用于获得上述查询语句的检索时间和检索地点;
计算子模块422,用于根据获得子模块421获得的查询语句的检索时间调用下一时间点的时间衰减模型计算上述查询语句相关联的推荐关键词的预估频次;以及计算获得子模块421获得的查询语句的检索地点与推荐地点之间的距离,上述推荐地点为上述查询语句相关联的推荐关键词所指示的地点;
关键词排序子模块423,用于根据计算子模块422计算的预估频次和计算子模块422计算的距离对上述查询语句相关联的推荐关键词进行排序。
进一步地,上述查询语句推荐列表的生成装置还可以包括:
展示模块43,用于在获得上述查询语句的推荐列表之后,展示上述查询语句的推荐列表。
进一步地,本实施例中,排序模块42还可以包括:
确定子模块424,用于在计算子模块422计算上述查询语句相关联的推荐关键词的预估频次之前,根据上述查询语句相关联的推荐关键词的历史点击频次和当前时间点对应的指数消减函数确定当前时间点的时间衰减模型;以及根据当前时间点的时间衰减模型和下一时间点对应的指数消减函数,以及上述查询语句相关联的推荐关键词在当前时间点与下一时间点的时间间隔内出现的频次确定下一时间点的时间衰减模型。
其中,确定子模块424,具体用于确定当前时间点的时间衰减模型为:其中,C(w,t)为当前时间点的时间衰减模型;numi.w为所述查询语句相关联的推荐关键词的历史点击频次;k(t,ti)为所述当前时间点对应的指数消减函数。
确定子模块424,具体用于确定下一时间点的时间衰减模型为:C(w,t+1)=exp(-λ)C(w,t)+numn+1.w×k(t+1,tn+1),其中,C(w,t+1)为下一时间点的时间衰减模型,C(w,t)为当前时间点的时间衰减模型,k(t+1,tn+1)为下一时间点对应的指数消减函数,numn+1.w为上述查询语句相关联的推荐关键词在当前时间点与下一时间点的时间间隔内出现的频次。
上述查询语句推荐列表的生成装置可以更好地基于时间和空间的相关性信息来连接人和服务,以及连接人和人的习惯,提高搜索结果页面中右侧推荐内容对用户下一步决策的协助能力,从而提高满足用户需求的精度,进而可以提高搜索引擎的整体点击率。
需要说明的是,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(Programmable Gate Array;以下简称:PGA),现场可编程门阵列(Field ProgrammableGate Array;以下简称:FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (14)

1.一种查询语句推荐列表的生成方法,其特征在于,包括:
接收用户输入的查询语句;
对所述查询语句相关联的推荐关键词进行排序,获得所述查询语句的推荐列表。
2.根据权利要求1所述的方法,其特征在于,所述对所述查询语句相关联的推荐关键词进行排序包括:
获得所述查询语句的检索时间;
根据所述查询语句的检索时间调用下一时间点的时间衰减模型计算所述查询语句相关联的推荐关键词的预估频次;
根据所述预估频次对所述查询语句相关联的推荐关键词进行排序。
3.根据权利要求1所述的方法,其特征在于,所述对所述查询语句相关联的推荐关键词进行排序包括:
获得所述查询语句的检索时间和检索地点;
根据所述查询语句的检索时间调用下一时间点的时间衰减模型计算所述查询语句相关联的推荐关键词的预估频次;
计算所述查询语句的检索地点与推荐地点之间的距离,所述推荐地点为所述查询语句相关联的推荐关键词所指示的地点;
根据所述预估频次和所述距离对所述查询语句相关联的推荐关键词进行排序。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述获得所述查询语句的推荐列表之后,还包括:
展示所述查询语句的推荐列表。
5.根据权利要求2或3所述的方法,其特征在于,所述根据所述查询语句的检索时间调用下一时间点的时间衰减模型计算所述查询语句相关联的推荐关键词的预估频次之前,还包括:
根据所述查询语句相关联的推荐关键词的历史点击频次和当前时间点对应的指数消减函数确定当前时间点的时间衰减模型;
根据所述当前时间点的时间衰减模型和下一时间点对应的指数消减函数,以及所述查询语句相关联的推荐关键词在当前时间点与下一时间点的时间间隔内出现的频次确定下一时间点的时间衰减模型。
6.根据权利要求5所述的方法,其特征在于,所述根据所述查询语句相关联的推荐关键词的历史点击频次和当前时间点对应的指数消减函数确定当前时间点的时间衰减模型包括:
确定当前时间点的时间衰减模型为:其中,C(w,t)为当前时间点的时间衰减模型;numi.w为所述查询语句相关联的推荐关键词的历史点击频次;k(t,ti)为所述当前时间点对应的指数消减函数。
7.根据权利要求5所述的方法,其特征在于,所述根据所述当前时间点的时间衰减模型和下一时间点对应的指数消减函数,以及所述查询语句相关联的推荐关键词在当前时间点与下一时间点的时间间隔内出现的频次确定下一时间点的时间衰减模型包括:
确定下一时间点的时间衰减模型为:C(w,t+1)=exp(-λ)C(w,t)+numn+1.w×k(t+1,tn+1),其中,C(w,t+1)为下一时间点的时间衰减模型,C(w,t)为当前时间点的时间衰减模型,k(t+1,tn+1)为所述下一时间点对应的指数消减函数,numn+1.w为所述查询语句相关联的推荐关键词在当前时间点与下一时间点的时间间隔内出现的频次。
8.一种查询语句推荐列表的生成装置,其特征在于,包括:
接收模块,用于接收用户输入的查询语句;
排序模块,用于对所述接收模块接收的查询语句相关联的推荐关键词进行排序,获得所述查询语句的推荐列表。
9.根据权利要求8所述的装置,其特征在于,所述排序模块包括:
获得子模块,用于获得所述查询语句的检索时间;
计算子模块,用于根据所述获得子模块获得的查询语句的检索时间调用下一时间点的时间衰减模型计算所述查询语句相关联的推荐关键词的预估频次;
关键词排序子模块,用于根据所述计算子模块计算的预估频次对所述查询语句相关联的推荐关键词进行排序。
10.根据权利要求8所述的装置,其特征在于,所述排序模块包括:
获得子模块,用于获得所述查询语句的检索时间和检索地点;
计算子模块,用于根据所述获得子模块获得的查询语句的检索时间调用下一时间点的时间衰减模型计算所述查询语句相关联的推荐关键词的预估频次;以及计算所述获得子模块获得的查询语句的检索地点与推荐地点之间的距离,所述推荐地点为所述查询语句相关联的推荐关键词所指示的地点;
关键词排序子模块,用于根据所述计算子模块计算的预估频次和所述计算子模块计算的距离对所述查询语句相关联的推荐关键词进行排序。
11.根据权利要求8-10任意一项所述的装置,其特征在于,还包括:
展示模块,用于在获得所述查询语句的推荐列表之后,展示所述查询语句的推荐列表。
12.根据权利要求9或10所述的装置,其特征在于,所述排序模块还包括:
确定子模块,用于在所述计算子模块计算所述查询语句相关联的推荐关键词的预估频次之前,根据所述查询语句相关联的推荐关键词的历史点击频次和当前时间点对应的指数消减函数确定当前时间点的时间衰减模型;以及根据所述当前时间点的时间衰减模型和下一时间点对应的指数消减函数,以及所述查询语句相关联的推荐关键词在当前时间点与下一时间点的时间间隔内出现的频次确定下一时间点的时间衰减模型。
13.根据权利要求12所述的装置,其特征在于,
所述确定子模块,具体用于确定当前时间点的时间衰减模型为:其中,C(w,t)为当前时间点的时间衰减模型;numi.w为所述查询语句相关联的推荐关键词的历史点击频次;k(t,ti)为所述当前时间点对应的指数消减函数。
14.根据权利要求12所述的装置,其特征在于,
所述确定子模块,具体用于确定下一时间点的时间衰减模型为:C(w,t+1)=exp(-λ)C(w,t)+numn+1.w×k(t+1,tn+1),其中,C(w,t+1)为下一时间点的时间衰减模型,C(w,t)为当前时间点的时间衰减模型,k(t+1,tn+1)为所述下一时间点对应的指数消减函数,numn+1.w为所述查询语句相关联的推荐关键词在当前时间点与下一时间点的时间间隔内出现的频次。
CN201510018916.4A 2015-01-14 2015-01-14 查询语句推荐列表的生成方法和装置 Active CN104598583B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510018916.4A CN104598583B (zh) 2015-01-14 2015-01-14 查询语句推荐列表的生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510018916.4A CN104598583B (zh) 2015-01-14 2015-01-14 查询语句推荐列表的生成方法和装置

Publications (2)

Publication Number Publication Date
CN104598583A true CN104598583A (zh) 2015-05-06
CN104598583B CN104598583B (zh) 2018-01-09

Family

ID=53124368

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510018916.4A Active CN104598583B (zh) 2015-01-14 2015-01-14 查询语句推荐列表的生成方法和装置

Country Status (1)

Country Link
CN (1) CN104598583B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045901A (zh) * 2015-08-05 2015-11-11 百度在线网络技术(北京)有限公司 搜索关键词的推送方法和装置
CN105138512A (zh) * 2015-08-12 2015-12-09 小米科技有限责任公司 词组推荐方法及装置
CN105912634A (zh) * 2016-04-05 2016-08-31 扬州大学 一种面向软件代码检索的查询语句重新生成方法
CN106469163A (zh) * 2015-08-18 2017-03-01 中兴通讯股份有限公司 一种公众号推荐方法及系统
CN107015973A (zh) * 2016-01-27 2017-08-04 腾讯科技(深圳)有限公司 一种应用排序方法、装置及服务器
CN107862002A (zh) * 2017-10-20 2018-03-30 四川朗骏文化传播有限公司 一种个性化推荐系统
CN108076105A (zh) * 2016-11-18 2018-05-25 腾讯科技(北京)有限公司 信息推荐方法、应用服务器和应用客户端
CN108920596A (zh) * 2018-06-27 2018-11-30 广东亿迅科技有限公司 一种个性化推荐算法及终端
CN110222271A (zh) * 2019-06-19 2019-09-10 北京百度网讯科技有限公司 用于生成网页的方法和装置
CN110457343A (zh) * 2018-05-04 2019-11-15 拉萨经济技术开发区凯航科技开发有限公司 一种个性化优化方法
CN110765239A (zh) * 2019-10-29 2020-02-07 腾讯科技(深圳)有限公司 热词识别方法、装置及存储介质
CN110795628A (zh) * 2017-06-29 2020-02-14 北京拉勾科技有限公司 一种基于相关性的搜索词处理方法、装置及计算设备
CN113221004A (zh) * 2021-05-21 2021-08-06 珠海金山网络游戏科技有限公司 一种关键词展示方法及装置
CN114595394A (zh) * 2022-03-22 2022-06-07 平安证券股份有限公司 基于用户行为的检索排序方法、装置、终端设备及介质
CN115016873A (zh) * 2022-05-05 2022-09-06 上海乾臻信息科技有限公司 前端数据交互方法、系统、电子设备及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110246465A1 (en) * 2010-03-31 2011-10-06 Salesforce.Com, Inc. Methods and sysems for performing real-time recommendation processing
CN102521335A (zh) * 2010-11-29 2012-06-27 微软公司 知晓时间-位置的移动查询建议
CN103198079A (zh) * 2012-01-06 2013-07-10 北大方正集团有限公司 相关搜索的实现方法和装置
CN103870453A (zh) * 2012-12-07 2014-06-18 盛乐信息技术(上海)有限公司 数据推荐方法及系统
CN103870001A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 一种生成输入法候选项的方法及电子装置
CN104090963A (zh) * 2014-07-14 2014-10-08 百度在线网络技术(北京)有限公司 查询信息推荐方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110246465A1 (en) * 2010-03-31 2011-10-06 Salesforce.Com, Inc. Methods and sysems for performing real-time recommendation processing
CN102521335A (zh) * 2010-11-29 2012-06-27 微软公司 知晓时间-位置的移动查询建议
CN103198079A (zh) * 2012-01-06 2013-07-10 北大方正集团有限公司 相关搜索的实现方法和装置
CN103870453A (zh) * 2012-12-07 2014-06-18 盛乐信息技术(上海)有限公司 数据推荐方法及系统
CN103870001A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 一种生成输入法候选项的方法及电子装置
CN104090963A (zh) * 2014-07-14 2014-10-08 百度在线网络技术(北京)有限公司 查询信息推荐方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
R. UMAGANDHI.ETC: "Time independent query recommendations from search engine query logs", 《INTERNATIONAL CONFERENCE ON SOFTWARE ENGINEERING AND MOBILE APPLICATION MODELLING AND DEVELOPMENT》 *
李亚楠等: "给互联网建立索引:基于词关系网络的智能查询推荐", 《软件学报》 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045901A (zh) * 2015-08-05 2015-11-11 百度在线网络技术(北京)有限公司 搜索关键词的推送方法和装置
CN105045901B (zh) * 2015-08-05 2019-04-30 百度在线网络技术(北京)有限公司 搜索关键词的推送方法和装置
CN105138512A (zh) * 2015-08-12 2015-12-09 小米科技有限责任公司 词组推荐方法及装置
CN106469163A (zh) * 2015-08-18 2017-03-01 中兴通讯股份有限公司 一种公众号推荐方法及系统
CN107015973A (zh) * 2016-01-27 2017-08-04 腾讯科技(深圳)有限公司 一种应用排序方法、装置及服务器
CN107015973B (zh) * 2016-01-27 2020-12-29 腾讯科技(深圳)有限公司 一种应用排序方法、装置及服务器
CN105912634A (zh) * 2016-04-05 2016-08-31 扬州大学 一种面向软件代码检索的查询语句重新生成方法
CN105912634B (zh) * 2016-04-05 2019-03-12 扬州大学 一种面向软件代码检索的查询语句重新生成方法
CN108076105A (zh) * 2016-11-18 2018-05-25 腾讯科技(北京)有限公司 信息推荐方法、应用服务器和应用客户端
CN108076105B (zh) * 2016-11-18 2020-12-18 腾讯科技(北京)有限公司 信息推荐方法、应用服务器和应用客户端
CN110795628A (zh) * 2017-06-29 2020-02-14 北京拉勾科技有限公司 一种基于相关性的搜索词处理方法、装置及计算设备
CN110795628B (zh) * 2017-06-29 2023-04-11 北京拉勾科技有限公司 一种基于相关性的搜索词处理方法、装置及计算设备
CN107862002A (zh) * 2017-10-20 2018-03-30 四川朗骏文化传播有限公司 一种个性化推荐系统
CN110457343A (zh) * 2018-05-04 2019-11-15 拉萨经济技术开发区凯航科技开发有限公司 一种个性化优化方法
CN108920596B (zh) * 2018-06-27 2021-10-29 广东亿迅科技有限公司 一种个性化推荐算法及终端
CN108920596A (zh) * 2018-06-27 2018-11-30 广东亿迅科技有限公司 一种个性化推荐算法及终端
CN110222271A (zh) * 2019-06-19 2019-09-10 北京百度网讯科技有限公司 用于生成网页的方法和装置
CN110765239A (zh) * 2019-10-29 2020-02-07 腾讯科技(深圳)有限公司 热词识别方法、装置及存储介质
CN110765239B (zh) * 2019-10-29 2023-03-28 腾讯科技(深圳)有限公司 热词识别方法、装置及存储介质
CN113221004A (zh) * 2021-05-21 2021-08-06 珠海金山网络游戏科技有限公司 一种关键词展示方法及装置
CN114595394A (zh) * 2022-03-22 2022-06-07 平安证券股份有限公司 基于用户行为的检索排序方法、装置、终端设备及介质
CN114595394B (zh) * 2022-03-22 2024-08-16 平安证券股份有限公司 基于用户行为的检索排序方法、装置、终端设备及介质
CN115016873A (zh) * 2022-05-05 2022-09-06 上海乾臻信息科技有限公司 前端数据交互方法、系统、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN104598583B (zh) 2018-01-09

Similar Documents

Publication Publication Date Title
CN104598583A (zh) 查询语句推荐列表的生成方法和装置
US10482521B2 (en) Intent prediction based recommendation system using data combined from multiple channels
US11321759B2 (en) Method, computer program product and system for enabling personalized recommendations using intelligent dialog
US8751472B2 (en) User behavior model for contextual personalized recommendation
KR101634773B1 (ko) 캘린더를 이용한 스케쥴 관리시스템 및 스케쥴 관리방법
US20190266133A1 (en) Apparatus, systems, and methods for analyzing characteristics of entities of interest
US9171078B2 (en) Automatic recommendation of vertical search engines
RU2670494C2 (ru) Способ обработки поискового запроса, сервер и машиночитаемый носитель для его осуществления
US10997184B2 (en) System and method for ranking search results
US20090106681A1 (en) Method and apparatus for geographic specific search results including a map-based display
US20120130969A1 (en) Generating context information for a search session
CN110741367A (zh) 用于实时交互式推荐的方法和装置
US20100191740A1 (en) System and method for ranking web searches with quantified semantic features
US20110173130A1 (en) Method and system for informing a user by utilizing time based reviews
CN103020049A (zh) 搜索方法及搜索系统
WO2013025874A2 (en) Page reporting
US20110184940A1 (en) System and method for detecting changes in the relevance of past search results
US20160379270A1 (en) Systems and methods for customized internet searching and advertising
CN112328889A (zh) 推荐搜索词确定方法、装置、可读介质及电子设备
CN117573973A (zh) 资源推荐方法、装置、电子设备以及存储介质
US20170351763A1 (en) Keyword based data crawling
Kamoun et al. Evaluating the performance and neutrality/bias of search engines
US20190050930A1 (en) Recommending applications based on search histories
CN113987333A (zh) 一种目的地区域的推荐方法和装置
Wang et al. A dynamic recommender system with fused time and location factors

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant