CN111639255B - 搜索关键词的推荐方法、装置、存储介质及电子设备 - Google Patents

搜索关键词的推荐方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN111639255B
CN111639255B CN201910156709.3A CN201910156709A CN111639255B CN 111639255 B CN111639255 B CN 111639255B CN 201910156709 A CN201910156709 A CN 201910156709A CN 111639255 B CN111639255 B CN 111639255B
Authority
CN
China
Prior art keywords
search
search keywords
keywords
sequence
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910156709.3A
Other languages
English (en)
Other versions
CN111639255A (zh
Inventor
彭睿棋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN201910156709.3A priority Critical patent/CN111639255B/zh
Publication of CN111639255A publication Critical patent/CN111639255A/zh
Application granted granted Critical
Publication of CN111639255B publication Critical patent/CN111639255B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开实施例提供了一种搜索关键词的推荐方法、装置、存储介质及电子设备。该方法包括:基于历史数据,确定搜索关键词的价值分数;响应搜索词的输入,根据关联性原则获取搜索关键词的集合;基于搜索关键词的集合中搜索关键词的价值分数获取第一顺序,将第一顺序与第二顺序结合形成第三顺序,按照第三顺序展示搜索关键词,其中,第二顺序为基于预定推荐逻辑形成。通过上述方案使得针对搜索词的联想词推荐的参考因素更加科学合理,使得搜索的结果进一步符合用户的期待,减少用户获得理想的搜索结果的时间成本。

Description

搜索关键词的推荐方法、装置、存储介质及电子设备
技术领域
本公开实施例属于互联网技术领域,尤其涉及一种搜索关键词的推荐方法、装置、存储介质及电子设备。
背景技术
在输入一个搜索词甚至搜索字符的时候,浏览器往往会根据用户输入的搜索词或者搜索字符推荐一些词频或者热度较高的联想词供用户选择,这些联想词的推荐策略以及排序方式都是依照每个推荐词在历史搜索数据中出现的频率或者热度而实现的。
在实现本发明的过程中,发明人发现现有技术至少存在以下缺陷:这些推荐的联想词可能会关联到一些落地页信息,但是这些落地页信息往往缺乏更多的潜在价值,这样,由于联想词推荐的参考因素过于单一,使得搜索的结果不符合用户的期待,从而导致用户为了更为理想的搜索结果而再一次进行手动搜索,直接增加用户获得理想的搜索结果的时间成本。
发明内容
本公开实施例目的在于提供一种搜索关键词的推荐方法、装置及电子设备,可以实现对搜索关键词进行匹配搜索,用以解决现有技术的如下问题:针对搜索词的联想词推荐的参考因素过于单一,使得搜索的结果不符合用户的期待,从而导致增加用户获得理想的搜索结果的时间成本。
第一方面,本公开实施例提供一种搜索关键词的推荐方法,包括:
基于历史数据,确定所述搜索关键词的价值分数;
响应搜索词的输入,根据关联性原则获取搜索关键词的集合;
基于所述搜索关键词的集合中所述搜索关键词的价值分数获取第一顺序,将所述第一顺序与第二顺序结合形成第三顺序,按照所述第三顺序展示搜索关键词,其中,所述第二顺序为基于预定推荐逻辑形成。
在一个实施方式中,所述基于历史数据,确定所述搜索关键词的价值分数,可以包括:
提取与所述搜索关键词相关联的搜索结果以及用户对所述搜索结果的行为,确定所述搜索关键词的价值分数。
在一个实施方式中,所述与所述搜索关键词相关联的搜索结果以及用户对所述搜索结果的行为通过满意度特征表示。
在一个实施方式中,所述根据关联性原则获取所述搜索关键词的集合,可以包括:
通过词频-逆文本频率指数策略和/或随机游走策略计算获取与所述搜索词相关联的搜索关键词。
第二方面,本公开实施例提供一种搜索关键词的推荐装置,包括:
确定模块,用于基于历史数据,确定所述搜索关键词的价值分数;
获取模块,用于响应搜索词的输入,根据关联性原则获取搜索关键词的集合;
排序模块,用于基于所述搜索关键词的集合中所述搜索关键词的价值分数获取第一顺序,将所述第一顺序与第二顺序结合形成第三顺序,按照所述第三顺序展示搜索关键词,其中,所述第二顺序为基于预定推荐逻辑形成。
在一个实施方式中,所述确定模块包括:
提取单元,用于提取与所述搜索关键词相关联的搜索结果以及用户对所述搜索结果的行为,确定所述搜索关键词的价值分数。
在一个实施方式中,所述与所述搜索关键词相关联的搜索结果以及用户对所述搜索结果的行为通过满意度特征表示。
在一个实施方式中,所述获取模块包括:
确定单元,用于通过词频-逆文本频率指数策略和/或随机游走策略计算确定与所述搜索词相关联的搜索关键词。
第三方面,本公开实施例提供一种存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现本公开任意实施例提供的搜索关键词的过滤方法的步骤。
第四方面,本公开实施例提供一种电子设备,至少包括存储器、处理器,所述存储器上存储有计算机程序,所述处理器在执行所述存储器上的计算机程序时实现本公开任意实施例提供的搜索关键词的过滤方法的步骤。
本公开实施例提供的搜索关键词的推荐方法、装置、存储介质及电子设备,通过将基于搜索关键词的价值分数的第一顺序和基于预定推荐逻辑的第二顺序相结合形成第三顺序,按照第三顺序向用户展示搜索关键词,能够使得针对搜索词的联想词推荐的参考因素更加科学合理,使得搜索的结果进一步符合用户的期待,减少用户获得理想的搜索结果的时间成本。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本公开提供的搜索关键词的推荐方法一种实施例的方法流程图;
图2是本公开提供的搜索关键词的推荐装置一种实施例的模块结构示意图;
图3为本公开提供的用于实现搜索关键词的推荐方法的电子设备示意图。
具体实施方式
为了使本技术领域的人员更好地理解本公开中的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
考虑到现有技术中,用户在输入一个搜索词甚至搜索字符的时候,浏览器往往会根据用户输入的搜索词或者搜索字符推荐一些词频或者热度较高的联想词供用户选择,这些联想词的推荐策略以及排序方式都是依照每个推荐词在历史搜索数据中出现的频率或者热度而实现的。这些推荐的联想词可能会关联到一些落地页信息,但是这些落地页信息往往缺乏更多的潜在价值,这样,由于联想词推荐的参考因素过于单一,使得搜索的结果不符合用户的期待,从而导致用户为了更为理想的搜索结果而再一次进行手动搜索,直接增加用户获得理想的搜索结果的时间成本;从另一方面来说,也无法根据用户的搜索行为使得落地页信息提供者等获得更多的价值或者利益。
基于此,在本实施例中提供了一种搜索关键词的推荐方法,图1是本公开的一种搜索关键词的推荐方法的一个实施例的方法流程图。虽然本公开提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本公开实施例描述及附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构连接进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至分布式处理环境)。
如图1所示,本公开一种实施例提供的一种搜索关键词的推荐方法可以包括如下步骤:
步骤101:基于历史数据,确定搜索关键词的价值分数。
本实施例中提到的搜索关键词一般是指用户在进行搜索操作时,能够通过搜索行为关联到用户较为期待的搜索信息或者搜索结果的词。搜索关键词不同于用户手动输入的搜索词,例如,用户在搜索框中输入“鲜”这个搜索词,实际上用户可能想搜索的是“鲜花”、“鲜肉”或者“新鲜”,“鲜花”、“鲜肉”或者“新鲜”这些能够关联到明确的搜索信息或者搜索结果的词即是搜索关键词。
这里提到的历史数据是围绕每个搜索关键词的相关历史搜索数据,一般包括不同用户点击或者搜索每个搜索关键词的相关行为以及点击或者输入后的关联到的有关搜索结果的各种落地页信息等,例如,用户可能会直接输入“鲜花”、“鲜肉”或者“新鲜”这些词并获得相关搜索结果,或者通过输入“鲜”而点击弹出的基于“鲜”的相关联想词,从而获得相关搜索结果。这些搜索行为和关联到的搜索结果都属于历史数据,这些历史数据一般提前保存在服务器等设备中。
每一个搜索关键词都可能潜在具有其价值,用户往往搜索的目的是发现通过该搜索关键词查找其带来的技术或者经济或者其他价值。以经济价值为例,例如,搜索关键词的价值很多情况下通过宣传页面、广告等形式和内容进行体现,用户可能通过搜索关键词找到相关的带有经济价值的落地页信息,也就是说,如果用户能够快速找到与搜索关键词相关的带有价值的落地页信息,就能提升用户寻找相关落地页信息的速度,当然也会给相关落地页信息的提供者带来潜在的客户,增加落地页信息的价值。例如,“鲜花”、“鲜肉”或者“新鲜”等这些搜索关键词都具有相应的价值,相对来说,通过搜索“鲜花”这个搜索关键词得到的带有价值的落地页信息可能比搜索“新鲜”这个搜索关键词得到的带有价值的落地页信息要多,更加符合用户的搜索期待,也可以认为“鲜花”的价值要大于“新鲜”。
如果认为“鲜花”的价值要大于“新鲜”,则需要对不同的搜索关键词的价值进行判断,可以通过预先存储的历史数据确定每一个搜索关键词的价值分数。其中,在通过历史数据确定每一个搜索关键词的价值分数的过程中,可以通过考虑多种维度实现:
例如,提取与搜索关键词相关联的落地页信息中的广告内容,其中,广告内容包括但不限于广告标题、广告对应的网页信息、广告中产品的报价信息,当然,还可以提取用户对广告内容的浏览、点击或者关闭等行为,上述这些信息都可以作为搜索关键词的历史数据。
考虑到用户对于每个搜索关键词落地页信息的行为更能表现出用户对某些搜索结果的偏好,可以在通过建立满意度特征的方式将用户的各种行为与搜索关键词的价值分数进行关联。
具体地,对搜索关键词确定其价值分数时,可以提取用户对通过搜索获得的落地页信息,例如广告内容的满意度特征,从而确定获取搜索关键词的价值分数。
进一步地,满意度特征是表征用户对落地页信息,例如搜索广告的意愿的数据表现,一般通过一系列有明显导向,例如正/负相关的特征表示用户对于搜索关键词的广告内容评价,也就是将满意度特征进行量化,以分数的形式表现。
例如,满意度特征可以是广告发布者的报价,或者用户每次点击的报价或者总报价,如果广告发布者的报价,或者用户每次点击的报价或者总报价越高,则满意度特征越强,从而价值分数越高。
还例如,满意度特征可以是用户看到广告内容的点击率,如果用户的点击率越高,则满意度特征越强,从而价值分数越高。
再例如,满意度特征可以是用户在广告对应的网页信息上停留时间,如果停留时间越长,说明用户体验越好,并且不反感,则满意度特征越强,从而价值分数越高。
以上都是价值分数与满意度特征之间正相关的例子。相反地,也可以采用一些价值分数与满意度特征之间负相关的例子确定搜索关键词的价值分数。
例如,满意度特征可以是用户在浏览广告内容后出现关闭行为,如果越多用户在浏览完广告内容后关闭该广告,则说明用户体验不好,出现反感情绪,则满意度特征越弱,从而价值分数越低。
还例如,满意度特征可以是用户在搜索中改写搜索词的频率,如果用户频繁改写搜索词,也就是改写搜索词的频率很高,则说明用户体验不好,对当前搜索结果感到反感,则满意度特征越弱,从而价值分数越低。
根据以上的满意度特征,其中,某些特征具备明显的正向效果,即价值分数与满意度特征呈正相关关系,某些特征具备明显的负向效果,即价值分数与满意度特征呈负相关关系。
在选取了一个或多个上述满意度特征的情况下,可以通过函数的方式进行价值分数的表示,例如选取了3个满意度特征,则通过以下方式确定价值分数:
基于每个满意度特征的具体数值建立函数,建立公式F(x)=f(特征1)*f(特征2)*f(特征3),其中F(x)为基于这个搜索关键词的搜索结果相关性的得分函数,通过不断计算直到和实际效果的准确率接近,最终获得该搜索关键词的价值分数。
步骤102:响应搜索词的输入,根据关联性原则获取搜索关键词的集合。
在步骤102中,一般用户首先输入一个搜索词,这个搜索词不一定是能够准确关联到相关搜索结果的符合用户期待的搜索词,也可能这个搜索词不会直接带来任何有益或者有价值的搜索结果。
基于用户输入的搜索词,确定围绕搜索词的关联性原则,基于关联性原则寻找与用户输入的搜索词相关联的搜索关键词,并将这些搜索关键词取合集,从而建立有关搜索关键词的集合,集合中的这些搜索关键词一般是能够直接关联到搜索结果的词。这样,通过关联性原则获取更多的搜索关键词,可以通过推荐词模块实现。例如,用户输入的是“鲜”,通过该搜索词建立了包含“鲜花”、“鲜肉”、“新鲜”等在内的搜索关键词的集合。
在具体实现通过搜索词获取搜索关键词的集合时,基于确定的搜索词;结合搜索词的词频和其在相关文本中的权重,通过词频-逆文本频率指数TF-IDF(Term Frequency-Inverse Document Frequency)策略和/或随机游走策略(walk Random)计算与搜索词相关的词与搜索词之间的相似度,也就是通过关联性原则获取搜索关键词并建立集合,这两种策略可以选择一种或者同时采用。
其中,这里对词频-逆文本频率指数的核心策略进行简要描述,其中,该策略主要包括对基于用户使用搜索词的切词处理等步骤。例如:比如对于搜索词“刘德华的电影”,首先切为“刘德华|的|热门|电影”,其中,因为“的、热门”出现在大量的文章中,它的重要性相对较低;而“刘德华”、“电影”则出现在较少的文章中,并且在当前这篇文章中出现的概率较高。那么刘德华、电影对这些搜索词的重要性则较高,能够描述这个搜索词的核心内容。简言之:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,即IDF,则认为此词或者短语具有很好的类别区分能力,适合用来分类,即确定核心内容。最后,将搜索词与搜索关键词之间的关联关系建立数据库。
下面,对随机游走的核心策略进行简要描述:如上建立检索数据库之后,第一种随机游走策略是:大量用户输入某一个搜索词后,然后又去搜索另一个词,例如鲜—>鲜花、三国演义—>刘备、三体—>刘慈欣,那么这前后两个词之前就有一定的关联性;第二种随机游走策略是,同一个网页或者文章被不同的搜索词检索查到,例如,搜索词1:鲜—>ABC鲜花网站的落地页,搜索词2:鲜花—>ABC鲜花网站的落地页;再例如,搜索词1:刘德华—>文章A《刘德华好听的歌曲大全》,搜索词2:四大天王好听歌曲—>文章A《刘德华好听的歌曲大全》,那么这两个搜索词之间就有一定关联性。
在本步骤中,还可以进一步包括数据清洗处理步骤,其中,在获取搜索关键词的集合之前进行包含去重、过滤等逻辑的操作,最终获得线上推荐词模块。其中,需要说明的是,用户的搜索词会有错别词,以及表述不明的关键词、两者具有相同语义的词,都需要进行数据清洗。
步骤103:基于搜索关键词的集合中搜索关键词的价值分数获取第一顺序,将第一顺序与第二顺序进行结合形成第三顺序,按照第三顺序展示搜索关键词,其中,第二顺序为按照预定推荐逻辑形成。
如上所述,在步骤102中获取了搜索关键词的集合中每一个搜索关键词以及其价值分数,在本步骤中,首先,通过将每个搜索关键词的价值分数按照大小顺序进行排序,也就是按照第一顺序将搜索关键词进行排序,其中,第一顺序代表了搜索关键词的集合中各搜索关键词的价值高低,也就是,价值分数高的排在前面,意味着相对应的搜索关键词带来的潜在价值越高,作为用户最期待搜索到的关键词的可能性越强,相反,价值分数低的排在前面,意味着相对应的搜索关键词带来的潜在价值越低,作为用户最期待搜索到的关键词的可能性越弱。
第二顺序是指通过针对搜索关键词的预定推荐逻辑形成的,预定推荐逻辑例如可以是通过搜索关键词的词频或者热度的大小进行推荐,也就是可以基于与搜索词相关联的搜索关键词的热度或者出现概率而产生的针对搜索关键词的自有排序,这种排序的规则属于现有技术,在这里就不赘述。例如,当用户输入“鲜”时,基于词频的预定推荐逻辑推荐的词的顺序会是“鲜艳”、“鲜花”、“鲜肉”。
将第一顺序和第二顺序相结合形成第三顺序,是指将第一顺序的排序规则与第二顺序的排序规则相融合,由于第一顺序是基于每个搜索关键词的价值分数,而第二顺序是基于每个搜索关键词的词频或者热度,因此,将两个顺序进行融合重新排序,既能考虑到每个搜索关键词的出现频率,还能考虑到每个搜索关键词的价值分数,使得用户能够尽可能地快速找到符合期待的,并且能够带来更多潜在价值的词,不但缩短了用户的搜索时间,还能提升了用户的搜索效率、成功率和满意度。
优选地,在基于搜索关键词的集合中搜索关键词的价值分数获取第一顺序之前,为了便于对每个搜索关键词的价值分数进行统计和管理,进行归一化处理。在一个具体实施方式中,为了便于对搜索关键词的价值分数进行排序,将每个搜索关键词的价值分数映射到(0,1)这个区间内,形成获取第一顺序的排序模型,并最终获取第一顺序。
根据预定推荐逻辑的排序形成的例如基于每个搜索关键词词频或者热度的第二顺序,然后,将关于搜索关键词的价值分数的形成第一顺序的排序模型与形成第二顺序的已有模型进行融合,形成新的推荐模型,通过这个新的推荐模型用于形成第三顺序,在具体实施时,可以通过以下方式实现:
CF(x)’=CF(x)*F(x)’
其中,F(x)’是针对搜索关键词的经过清洗的第一顺序的推荐排序模型,CF(x)是针对搜索关键词的按照预定推荐逻辑形成的第二顺序的排序模型,CF(x)’是第一顺序和第二顺序融合后,形成第三顺序的排序模型。例如,当用户输入“鲜”之后,基于第一顺序的排序模型得到的顺序是:鲜花(价值分数+0.8)、鲜肉(价值分数+0.3)、鲜花(价值分数-1);基于第二顺序的排序模型得到的顺序是,新鲜、鲜花、鲜肉,两个顺序融合后的得到的最终排序为:鲜花、新鲜、鲜肉。显然,鲜花可能是最有可能符合用户期待并且可能会带来最多潜在价值的搜索关键词。
最后,按照形成的第三顺序展示或者显示搜索关键词,例如可以在浏览器的搜索框中显示,也可以在搜索框的下方显示。
基于同一发明构思,本发明实施例中还提供了一种搜索关键词的推荐装置,如下面的实施例所述。由于搜索关键词的推荐装置解决问题的原理与搜索关键词的推荐方法相似,因此搜索关键词的推荐装置的实施可以参见搜索关键词的推荐方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图2是本发明实施例的搜索关键词的推荐装置的一种结构框图,如图2所示,可以包括:获取模块201、匹配模块202和确定模块203,下面对该结构进行说明。
确定模块201,用于基于历史数据,确定搜索关键词的价值分数;
获取模块202,用于响应搜索词的输入,根据关联性原则获取搜索关键词的集合;
排序模块203,基于搜索关键词的集合中搜索关键词的价值分数获取第一顺序,将第一顺序与第二顺序进行结合形成第三顺序,按照第三顺序展示搜索关键词,其中,第二顺序为基于预定推荐逻辑形成。
在一个实施方式中,所述确定模块201包括:提取单元,用于提取与搜索关键词相关联的搜索结果,例如落地页信息以及用户对搜索结果的行为,确定搜索关键词的价值分数。
在一个实施方式中,与搜索关键词相关联搜索结果以及用户对搜索结果的行为通过满意度特征表示。
在一个实施方式中,获取模块202包括:确定单元,用于通过词频-逆文本频率指数策略和/或随机游走策略计算确定与搜索词相关联的搜索关键词。
本公开的实施例还提供能够实现上述实施例中的搜索关键词的推荐方法中全部步骤的一种电子设备的具体实施方式,如图3所示,所述电子设备具体包括如下内容:处理器902(processor)、存储器901(memory)、通信接口(Communications Interface)和总线;其中,所述处理器902、存储器901、通信接口通过所述总线完成相互间的通信;所述处理器902用于调用所述存储器901中的计算机程序,所述处理器902执行所述计算机程序时实现上述实施例中的搜索关键词的推荐方法中的全部步骤,例如,所述处理器902执行所述计算机程序时实现下述步骤:
步骤1,基于历史数据,确定所述搜索关键词的价值分数;
步骤2,响应搜索词的输入,根据关联性原则获取搜索关键词的集合;
步骤3,基于所述搜索关键词的集合中所述搜索关键词的价值分数获取第一顺序,将所述第一顺序与第二顺序进行结合形成第三顺序,按照所述第三顺序展示搜索关键词,其中,所述第二顺序为基于预定推荐策略形成。
从上述描述可知,本公开实施例通过确定搜索关键词的价值分数,在用户进行输入搜索词的时候,能够进行更为科学的联想词推荐,既考虑到搜索关键词的词频或者热度,还能考虑到搜索关键词关联落地页信息所具备的潜在价值,这样,使得联想词推荐的参考因素更加科学合理,使得搜索的结果进一步符合用户的期待,减少用户获得理想的搜索结果的时间成本;从另一方面来说,也可以根据用户的搜索行为使得落地页信息提供者等获得更多的价值或者利益。
本公开的实施例还提供能够实现上述实施例中的搜索关键词的推荐方法中全部步骤的一种存储介质,所述存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的搜搜关键词的推荐方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤1,基于历史数据,确定所述搜索关键词的价值分数;
步骤2,响应搜索词的输入,根据关联性原则获取搜索关键词的集合;
步骤3,基于搜索关键词的集合中搜索关键词的价值分数获取第一顺序,将第一顺序与第二顺序进行结合形成第三顺序,按照第三顺序展示搜索关键词,其中,第二顺序为基于预定推荐策略形成。
从上述描述可知,本公开实施例通过确定搜索关键词的价值分数,在用户进行输入搜索词的时候,能够进行更为科学的联想词推荐,既考虑到搜索关键词的词频或者热度,还能考虑到搜索关键词的关联落地页信息所具备的潜在价值,这样,使得联想词推荐的参考因素更加科学合理,使得搜索的结果进一步符合用户的期待,减少用户获得理想的搜索结果的时间成本;从另一方面来说,也可以根据用户的搜索行为使得落地页信息提供者等获得更多的价值或者利益。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于硬件+程序类实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
虽然本公开提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上所述仅为本说明书实施例的实施例而已,并不用于限制本说明书实施例。对于本领域技术人员来说,本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书实施例的权利要求范围之内。

Claims (6)

1.一种搜索关键词的推荐方法,其特征在于,包括:
基于历史数据,通过满意度特征确定所述搜索关键词的价值分数;
响应搜索词的输入,根据关联性原则获取搜索关键词的集合;
基于所述搜索关键词的集合中所述搜索关键词的价值分数获取第一顺序,将所述第一顺序与第二顺序结合形成第三顺序,按照所述第三顺序展示搜索关键词,其中,所述第二顺序为基于预定推荐逻辑形成,所述预定推荐逻辑包括通过所述搜索关键词的热度的大小进行推荐;
所述确定所述搜索关键词的价值分数包括:
提取与所述搜索关键词相关联的搜索结果以及用户对所述搜索结果的行为,确定所述搜索关键词的价值分数,所述与所述搜索关键词相关联的搜索结果以及用户对所述搜索结果的行为通过满意度特征表示。
2.根据权利要求1所述的推荐方法,其特征在于,所述根据关联性原则获取搜索关键词的集合包括:通过词频-逆文本频率指数策略和/或随机游走策略计算获取与所述搜索词相关联的搜索关键词。
3.一种搜索关键词的推荐装置,其特征在于,包括:
确定模块,用于基于历史数据,通过满意度特征确定所述搜索关键词的价值分数;
获取模块,用于响应搜索词的输入,根据关联性原则获取搜索关键词的集合;
排序模块,用于基于所述搜索关键词的集合中所述搜索关键词的价值分数获取第一顺序,将所述第一顺序与第二顺序结合形成第三顺序,按照所述第三顺序展示搜索关键词,其中,所述第二顺序为基于预定推荐逻辑形成,所述预定推荐逻辑包括通过所述搜索关键词的热度的大小进行推荐;
所述确定模块包括:
提取单元,用于提取与所述搜索关键词相关联的搜索结果以及用户对所述搜索结果的行为,确定所述搜索关键词的价值分数,所述与所述搜索关键词相关联的搜索结果以及用户对所述搜索结果的行为通过满意度特征表示。
4.根据权利要求3所述的推荐装置,其特征在于,所述获取模块包括:
确定单元,用于通过词频-逆文本频率指数策略和/或随机游走策略计算确定与所述搜索词相关联的搜索关键词。
5.一种存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1或2所述方法的步骤。
6.一种电子设备,至少包括存储器、处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器在执行所述存储器上的计算机程序时实现权利要求1或2所述方法的步骤。
CN201910156709.3A 2019-03-01 2019-03-01 搜索关键词的推荐方法、装置、存储介质及电子设备 Active CN111639255B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910156709.3A CN111639255B (zh) 2019-03-01 2019-03-01 搜索关键词的推荐方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910156709.3A CN111639255B (zh) 2019-03-01 2019-03-01 搜索关键词的推荐方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN111639255A CN111639255A (zh) 2020-09-08
CN111639255B true CN111639255B (zh) 2023-12-29

Family

ID=72328452

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910156709.3A Active CN111639255B (zh) 2019-03-01 2019-03-01 搜索关键词的推荐方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN111639255B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112328889A (zh) * 2020-11-23 2021-02-05 北京字节跳动网络技术有限公司 推荐搜索词确定方法、装置、可读介质及电子设备
CN112631752B (zh) * 2020-12-28 2024-04-19 中金数据(武汉)超算技术有限公司 一种基于操作优先度的列表操作方法及装置
CN112765452B (zh) * 2020-12-31 2024-02-27 北京百度网讯科技有限公司 搜索推荐方法、装置及电子设备
CN113626715A (zh) * 2021-08-26 2021-11-09 北京字跳网络技术有限公司 查询结果显示方法、装置、介质和电子设备
CN117688243A (zh) * 2023-12-19 2024-03-12 广州无限可能数字科技有限公司 一种基于大数据的关键词筛选推荐的方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729359A (zh) * 2012-10-12 2014-04-16 阿里巴巴集团控股有限公司 一种推荐搜索词的方法及系统
CN104636334A (zh) * 2013-11-06 2015-05-20 阿里巴巴集团控股有限公司 一种关键词推荐方法和装置
CN107209897A (zh) * 2015-01-20 2017-09-26 电子湾有限公司 处理和分析用户数据以便确定关键词质量
CN107341181A (zh) * 2017-05-27 2017-11-10 武汉斗鱼网络科技有限公司 搜索推荐方法、装置、计算机可读存储介质及计算机设备
CN108763332A (zh) * 2018-05-10 2018-11-06 北京奇艺世纪科技有限公司 一种搜索提示词的生成方法和装置
CN109299383A (zh) * 2018-11-02 2019-02-01 北京字节跳动网络技术有限公司 生成推荐词的方法、装置、电子设备及存储介质
CN110009437A (zh) * 2018-01-05 2019-07-12 北京搜狗科技发展有限公司 推荐方法和装置、用于推荐的装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100169316A1 (en) * 2008-12-30 2010-07-01 Yahoo! Inc. Search query concept based recommendations
CN103955465A (zh) * 2014-03-28 2014-07-30 百度在线网络技术(北京)有限公司 一种用于生成推荐页面的方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729359A (zh) * 2012-10-12 2014-04-16 阿里巴巴集团控股有限公司 一种推荐搜索词的方法及系统
CN104636334A (zh) * 2013-11-06 2015-05-20 阿里巴巴集团控股有限公司 一种关键词推荐方法和装置
CN107209897A (zh) * 2015-01-20 2017-09-26 电子湾有限公司 处理和分析用户数据以便确定关键词质量
CN107341181A (zh) * 2017-05-27 2017-11-10 武汉斗鱼网络科技有限公司 搜索推荐方法、装置、计算机可读存储介质及计算机设备
CN110009437A (zh) * 2018-01-05 2019-07-12 北京搜狗科技发展有限公司 推荐方法和装置、用于推荐的装置
CN108763332A (zh) * 2018-05-10 2018-11-06 北京奇艺世纪科技有限公司 一种搜索提示词的生成方法和装置
CN109299383A (zh) * 2018-11-02 2019-02-01 北京字节跳动网络技术有限公司 生成推荐词的方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111639255A (zh) 2020-09-08

Similar Documents

Publication Publication Date Title
CN111639255B (zh) 搜索关键词的推荐方法、装置、存储介质及电子设备
CN103914492B (zh) 查询词融合方法、商品信息发布方法和搜索方法及系统
US20170083965A1 (en) Item Recommendation Method and Apparatus
US10204121B1 (en) System and method for providing query recommendations based on search activity of a user base
US20190018900A1 (en) Method and Apparatus for Displaying Search Results
US10585927B1 (en) Determining a set of steps responsive to a how-to query
JP6022056B2 (ja) 検索結果の生成
CN104111941B (zh) 信息展示的方法及设备
CN107679217B (zh) 基于数据挖掘的关联内容提取方法和装置
US20150339759A1 (en) Detecting product attributes associated with product upgrades based on behaviors of users
WO2013163062A1 (en) Recommending keywords
EP2805223A2 (en) Intelligent navigation of a category system
US11443003B2 (en) Retrieval of content using link-based search
CN111159341B (zh) 基于用户投资理财偏好的资讯推荐方法及装置
US20140379719A1 (en) System and method for tagging and searching documents
CN108572971B (zh) 一种用于挖掘与检索词相关的关键词的方法和装置
US20180089325A1 (en) Method, Apparatus and Client of Processing Information Recommendation
CN109299383A (zh) 生成推荐词的方法、装置、电子设备及存储介质
CN111522886B (zh) 一种信息推荐方法、终端及存储介质
CN105468790B (zh) 一种评论信息检索方法和装置
WO2015179556A1 (en) Method, apparatus and system for processing promotion information
CN110309410B (zh) 一种资讯推荐方法、平台及计算机可读存储介质
CN104050183A (zh) 浏览器输入框的内容匹配结果提示方法及装置
CN112328889A (zh) 推荐搜索词确定方法、装置、可读介质及电子设备
CN110008396B (zh) 对象信息推送方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant