CN114265981A - 推荐词确定方法、装置、设备及存储介质 - Google Patents
推荐词确定方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114265981A CN114265981A CN202111582843.3A CN202111582843A CN114265981A CN 114265981 A CN114265981 A CN 114265981A CN 202111582843 A CN202111582843 A CN 202111582843A CN 114265981 A CN114265981 A CN 114265981A
- Authority
- CN
- China
- Prior art keywords
- search
- target
- recommended
- keywords
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例提供一种推荐词确定方法、装置、设备及存储介质,该方法包括:获取终端的位置信息,并基于终端的位置信息,获取所述位置信息对应的目标历史搜索行为数据;对所述目标历史搜索行为数据进行处理分析,提取具有本地特征的目标关键词;其中,所述本地特征用于表示与所述位置信息相关联的特征;将所述位置信息和所述目标关键词融合,生成多个推荐词。本公开实施例能够解决现有技术中推荐词候选集确定需要人工审核的,并且推荐词候选集里的推荐词有限,无法及时满足用户的搜索需求,提高用户的搜索效率的问题。
Description
技术领域
本公开实施例涉及计算机技术领域,尤其涉及一种推荐词确定方法、装置、设备及存储介质。
背景技术
随着互联网或移动终端的发展,在各类应用程序或网页中使用搜索功能对用户来说越来越方便。
目前,针对搜索功能,预先经过过滤和人工审核为用户提供了一个具有安全性的推荐词候选集。用户在搜索框发起搜索时,为了降低用户搜索成本,往往从推荐词候选集中选择一些推荐词在搜索框内展示。
但是,现有技术推荐词候选集确定是需要人工审核的,并且推荐词候选集里的推荐词有限,无法及时满足用户的搜索需求,提高用户的搜索效率。
发明内容
本公开实施例提供一种推荐词确定方法、装置、设备及存储介质,以解决现有技术中推荐词候选集确定需要人工审核的,并且推荐词候选集里的推荐词有限,无法及时满足用户的搜索需求,提高用户的搜索效率的问题。
第一方面,本公开实施例提供一种推荐词确定方法,包括:
获取终端的位置信息,并基于终端的位置信息,获取所述位置信息对应的目标历史搜索行为数据;
对所述目标历史搜索行为数据进行处理分析,提取具有本地特征的目标关键词;其中,所述本地特征用于表示与所述位置信息相关联的特征;
将所述位置信息和所述目标关键词融合,生成多个推荐词。
第二方面,本公开实施例提供一种推荐词确定装置,包括:
第一获取模块,用于获取终端的位置信息,并基于终端的位置信息,获取所述位置信息对应的目标历史搜索行为数据;
第二获取模块,用于对所述目标历史搜索行为数据进行处理分析,提取具有本地特征的目标关键词;其中,所述本地特征用于表示与所述位置信息相关联的特征;
推荐词生成模块,用于将所述位置信息和所述目标关键词融合,生成多个推荐词。
第三方面,本公开实施例提供一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上述第一方面以及第一方面各种可能的设计所述的推荐词确定方法。
第四方面,本公开实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的推荐词确定方法。
本公开实施例提供的推荐词确定方法、装置、设备及存储介质,首先获取终端的位置信息,并基于终端的位置信息,获取所述位置信息对应的目标历史搜索行为数据;然后对所述目标历史搜索行为数据进行处理分析,提取具有本地特征的目标关键词;其中,所述本地特征用于表示与所述位置信息相关联的特征;将所述位置信息和所述目标关键词融合,生成多个推荐词。因此,通过终端的位置信息与安全筛选的目标历史搜索行为数据中具有本地特征的目标关键词进行自由组合,生成多个推荐词,既保证了搜索安全性,也及时满足了用户的搜索需求,提高用户的搜索效率,进而提高了用户的搜索体验。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的推荐词确定方法的场景示意图;
图2为本公开实施例提供的推荐词确定方法的流程示意图;
图3为本公开另一实施例提供的推荐词确定方法的流程示意图;
图4为本公开实施例提供的推荐词确定装置的结构框图;
图5为本公开实施例提供的电子设备的硬件结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置或模块之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
用户在搜索框发起搜索时,用户可能无法输入准确的搜索词,从而无法获得期望的结果,为了降低用户检索成本,往往在搜索框内推荐一些搜索词,但是现有技术中,为保证基本用户的搜索体验和搜索安全要求,经过层层过滤和人工审核为用户提供了一个限定的推荐候选集,大大地限制了搜索词的推荐,且由于推荐的搜索词的规模和推荐效果是紧密相关的,因此,针对现有技术中有限的推荐候选集,导致在保证搜索安全要求的同时,无法为用户精准地推荐搜索词,进而无法及时满足用户的搜索需求,提高用户的搜索效率。
为了解决上述问题,本公开的技术构思为:对经过用户授权获取到的搜索行为进行本地需求的特征挖掘,利用提取的本地需求特征结合用户的地理位置生成多个推荐词,实现了基于用户的位置信息、本地需求特征的结合,解决了现有技术推荐的搜索词准确率低,进而无法及时满足用户的搜索需求,提高用户的搜索效率的问题,能够向用户精准地推送个性化的本地词,更好的满足用户个性化搜索需求,同时保证了个性化推荐的安全和质量。
下面以具体地实施例对本公开的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
需要说明的是,用户的搜索信息、行为数据、地理位置等信息是经过用户授权后获取的,下述实施例不再赘述。
参见图1所示,图1为本公开实施例提供的推荐词确定方法的场景示意图。在实际应用中,实现推荐词确定方法的执行主体可以是推荐词确定装置,该推荐词确定装置可以实现为软件,可以实现为硬件,还可以实现为软件和硬件的组合,例如包括计算机设备,从而通过该计算机设备来执行本公开实施例提供的该推荐词确定方法,其中,计算机设备可以包括服务器,作为示例,可以通过一个服务器执行本公开实施例提供的该推荐词确定方法,还可以通过多个服务器协作实现本公开实施例提供的该推荐词确定方法。
示例性的,以应用程序为例,用户可以通过终端10打开应用程序或在应用程序提供的搜索输入框输入待搜索词或点击搜索,触发用于生成指示推荐搜索词的指令操作,将生成的指令发送至服务器20,服务器接收到指令后,获取该发生触发操作的目标用户所在的位置信息,以及与该位置信息相关联的目标历史搜索行为数据,然后对目标历史搜索行为数据进行本地化特征挖掘,得到具有本地特征的目标关键词,并结合位置信息,组合出含有海量待推荐词的推荐词集合,将推荐词集合融合到推荐召回集合中,参与推荐模型排序,实现了基于用户的位置信息,推送个性化的本地词,更好的满足用户个性化搜索需求,同时保证了个性化推荐的安全和质量。
具体地,推荐词确定方法可以用过以下方式实现:
参见图2,图2为本公开实施例提供的推荐词确定方法的流程示意图。本公开实施例的方法的执行主体可以是服务器,该方法可以应用在网页或APP中,可以通过终端与服务器的交互实现。这里的终端可以包括电脑端或移动终端,该终端上可以安装有浏览器或其它各类APP等客户端,可以为用户提供搜索功能。
结合图2所示,该推荐词确定方法可以包括:
步骤S101、获取终端的位置信息,并基于终端的位置信息,获取所述位置信息对应的目标历史搜索行为数据。
本公开实施例中,用户通过终端进行搜索行为时,首先响应于用于指示推荐搜索词的指令,获取目标用户使用的终端的位置信息,所述目标用户为触发用于生成所述指令的操作的用户。
本公开实施例中,比如用户在终端上打开应用程序(比如浏览器或是某款APP)或在应用程序提供的搜索输入框输入待搜索词或点击搜索都为触发操作(这里的用户为目标用户,即为推荐搜索词的对象),终端根据用户的触发操作生成用于指示推荐搜索词的指令,并将该用于指示推荐搜索词的指令发送至服务器,服务器接收到该用于指示推荐搜索词的指令后,可以获取目标用户当前所在的地理位置即位置信息。其中,该位置信息可以用于满足用户个性化需求的本地特征信息的挖掘。
步骤S102、对所述目标历史搜索行为数据进行处理分析,提取具有本地特征的目标关键词。
其中,所述本地特征用于表示与所述位置信息相关联的特征,
本公开实施例中,所述目标历史搜索行为数据是通过对各个历史用户的历史搜索行为数据进行安全筛查得到的。这里的历史用户可以包括目标用户也可以不包括目标用户,可以根据具体地应用场景来确定。目标历史搜索行为数据的挖掘是为了猜测用户的搜索意图,进而节约用户的搜索成本。
具体地,这里的位置信息可以包括地理位置。根据获取的位置信息,来获取各个历史用户所在该地理位置的具有安全性的搜索行为即通过对各个历史用户的历史搜索行为数据进行安全筛查得到的目标历史搜索行为数据。因此,通过地理位置来锁定各个历史用户的历史搜索行为数据,为目标用户提供了具有本地化的搜索行为数据,为满足用户个性化需求提供了基础。
在本公开的一个实施例中,所述目标历史搜索行为数据包括多个搜索行为会话对应的搜索行为数据,各所述搜索行为会话对应的搜索行为数据包括多个搜索词、各所述搜索词对应的交互数据、各所述搜索词对应的搜索顺序,所述搜索词对应的交互数据及搜索顺序用于表征所述搜索词满足搜索需求的程度。
这里的交互数据包括交互的搜索结果,这里的搜索行为数据中包括位置信息。
其中,获取所述位置信息对应的目标历史搜索行为数据,可以通过以下步骤实现:
步骤a1、从数据库中查找与所述位置信息对应的各个所述历史用户的历史搜索行为数据,所述历史搜索行为数据包括搜索的关键词、访问的网页信息、点击的搜索结果、所述搜索的关键词的搜索顺序。
步骤a2、对各个所述历史用户对应的搜索的关键词、访问的网页信息、点击的搜索结果、所述搜索的关键词的搜索顺序分别进行聚类。
步骤a3、对聚类的结果中的敏感词进行过滤,得到目标历史搜索行为数据。
本公开实施例中,为了向用户提供符合本地化的推荐词,可以从数据库中首先查找出与具有相同位置信息的各个历史用户的历史搜索行为数据,但是为了保证目标用户的搜索安全,需要过滤敏感词。
具体地,这里的历史搜索行为数据可以包括搜索的关键词、访问的网页信息、点击的搜索结果、所述搜索的关键词的搜索顺序等,为了避免由于历史搜索行为数据中每条数据过滤一遍而导致资源浪费或是耗费时间,可以先对各个历史用户的历史搜索行为数据进行聚类,比如,将搜索的关键词访问的网页信息、点击的搜索结果、所述搜索的关键词的搜索顺序分别聚类。
其中,聚类分析可以是通过先从历史搜索行为数据中提取有效的行为操作(这里有效的可以指浏览、点击、查看、搜索等行为操作),组成一个特征项集,将所有用户的特征项集转换为向量空间模型数据,根据聚类分析算法对向量空间模型数据中的特征项进行聚类操作,得到聚类的结果。然后将聚类的结果中每个聚类类别作为一个整体筛查,对含有敏感词即为不具有安全性的词汇进行过滤删除,保留安全性的词汇作为目标历史搜索行为数据,为目标用户提供安全地本地化需求的搜索行为数据。
步骤S103、将所述位置信息和所述目标关键词融合,生成多个推荐词。
在本公开的一个实施例中,所述目标关键词为多个,所述位置信息包括历史位置信息以及当前位置信息;所述将所述位置信息和所述目标关键词融合,生成多个推荐词,可以通过以下步骤实现:
步骤b1、对所述位置信息和所述目标关键词进行去重;
步骤b2、将去重后的结果进行关键词拼接,生成所述多个推荐词。
本公开实施例中,由于位置信息中可能包含了目标关键词,目标关键词中也可能包含了位置信息,因此,需要对位置信息和目标关键词进行去重,比如目标关键词有A地区、天气、油价等,位置信息中包含A地区,将A地区进行去重,最后将去重后的结果进行关键词拼接,比如A地区天气、A地区油价等作为推荐词。示例性的,目标关键词可能携带有地理位置,比如地理位置A天气,因此,可以将位置信息和所述目标关键词进行预处理,即将组合的每对位置信息和目标关键词进行去重,比如地理位置为地理位置A,目标关键词为地理位置A天气,则将地理位置A去重,然后进行关键词拼接或是连句得到地理位置A天气,即为推荐词。
具体地,为了能够精准地向用户推荐搜索词,使得能够满足用户的个性化需求,可以对现有的推荐候选集进行扩充,不仅仅是通过机器审核-人工审核-线上审核等过程来层层过滤筛选导致推荐候选集有限,而是将位置信息结合所有本地需求特征进行两两组合,生成海量的推荐词集合。
比如,位置信息为地理位置A、地理位置B、…、地理位置N,本地需求特征目标关键词为目标关键词1、目标关键词2、…目标关键词M。组合为地理位置A目标关键词1、地理位置A目标关键词2、…、地理位置A目标关键词M、地理位置B目标关键词1、地理位置B目标关键词2、…、地理位置B目标关键词M、…、地理位置N目标关键词1、地理位置N目标关键词2、…、地理位置N目标关键词等两两组合,生成多个待推荐词,形成推荐词集合,区别于现有的有限的推荐候选集,该推荐词集合中包含了具有本地化需求的海量的待推荐词,能够充分准确地为用户提供推荐搜索词的资源,进而满足用户个性化需求。
本公开实施例提供的推荐词确定方法,通过获取终端的位置信息,并基于终端的位置信息,获取所述位置信息对应的目标历史搜索行为数据;然后对所述目标历史搜索行为数据进行处理分析,提取具有本地特征的目标关键词;其中,所述本地特征用于表示与所述位置信息相关联的特征;将所述位置信息和所述目标关键词融合,生成多个推荐词。因此,通过终端的位置信息与安全筛选的目标历史搜索行为数据中具有本地特征的目标关键词进行自由组合,生成多个推荐词,既保证了搜索安全性,也及时满足了用户的搜索需求,提高用户的搜索效率,进而提高了用户的搜索体验。
在本公开的一个实施例中,参见图3所示,图3为本公开另一实施例提供的推荐词确定方法的流程示意图,本公开实施例在上述实施例的基础上,例如,在图2所述的实施例的基础上,对如何提取具有本地特征的目标关键词进行了详细说明。可以通过以下步骤实现:
S201、根据所述搜索行为会话对应的多个搜索词,对各所述搜索行为会话进行聚合,得到多个搜索行为会话集合;
S202、针对每个所述搜索行为会话集合,对该搜索行为会话集合中搜索词进行去重,得到多个目标搜索词;
S203、基于各所述搜索词对应的交互数据和搜索顺序,确定各所述目标搜索词对应的交互数据和搜索顺序;
S204、针对各所述目标搜索词对应的交互数据和搜索顺序,从多个搜索行为会话集合中确定候选搜索词;
S205、基于所述候选搜索词,确定所述目标关键词,所述目标关键词包括本地性的关键词。
本公开实施例中,首先可以利用本地化需求来构建本地化的推荐候选词即候选搜索词,在生成候选搜索词的过程中,可以从目标历史搜索行为数据中提取符合本地化的本地需求特征,比如大量用户带着地理位置信息检索相同关键词(如地理位置A天气、地理位置B天气、地理位置C天气等)这些地理位置关键词信息所对应的“天气”就是一个本地化需求。
具体地,由于目标历史搜索行为数据是基于位置信息筛选出的,因此该目标历史搜索行为数据具有本地性,然后再从具有本地性的目标历史搜索行为数据中提取具有本地特征的关键词,比如天气、油价、房价等可以代表或具有本地特征的关键词作为本地需求特征即目标关键词。目标关键词的确定能够为用户推送本地化需求的本地词,避免了将本地的一些其他不具有代表性的词推送给用户,进而能够激发用户的搜索需求、提升整个客户端的搜索性能。
在本公开的一个实施例中,基于所述候选搜索词,确定所述目标关键词,可以通过以下步骤实现:
步骤c1、从所述候选搜索词中查找与本地内容信息相关的搜索词;
步骤c2、将与本地内容信息相关的搜索词作为所述目标关键词。
本公开实施例中,直接从候选搜索词中查找与本地内容信息相关的搜索词,比如天气、油价等,将其作为目标关键词。
其中,还可以通过获取推荐召回集合,并根据候选搜索词和推荐召回集合,确定目标关键词,可以将该目标关键词作为待推荐词。
本公开实施例中,采用推荐候选词召回方法,通过本地化需求和用户位置信息构建的候选词即待推荐词融入推荐召回集合,参与推荐模型排序,取排名前预设次数的搜索词作为目标推荐词,向用户推送该目标推荐词即个性化的本地词。
具体地,推荐召回集合的确定可以通过以下步骤实现:
步骤d1、若所述目标用户为新用户,则获取所述目标用户对应的属性,所述属性是通过冷启动向所述目标用户推送信息生成的。
步骤d2、通过个性化召回,从所述目标关键词中获取与所述属性匹配的第一关键词,并获取与所述第一关键词相关联的第一搜索结果。
步骤d3、若所述目标用户为所述历史用户,则基于搜索行为趋势统计,在经过用户授权后获取用户行为、地理位置等信息。
步骤d4、通过个性化召回,从所述目标关键词中获取与用户行为、地理位置等信息匹配的第二关键词,并获取与所述第二关键词相关联的第二搜索结果。
步骤d5、若监控到所述目标用户使用的终端存在用于执行输入事件的触发操作时,则经过目标用户授权后获取所述目标用户当前的行为数据,所述当前的行为数据包括上下文信息。
步骤d6、获取与所述上下文信息相关联的目标关联信息。
步骤d7、将所述第一关键词、所述第一搜索结果、所述第二关键词、所述第二搜索结果以及所述目标关联信息,生成推荐召回集合。
本公开实施例中,针对搜索相关信息的召回,可以通过个性化召回也可以通过用户当前搜索的上下文召回。
示例性的,如果该目标用户为新用户,由于该目标用户还没有历史搜索行为数据,无法对该目标用户本身进行行为分析,但是可以通过对该目标用户具有的属性,与历史用户进行聚类,找到符合该目标用户属性的历史用户,对符合条件的历史用户的历史行为数据分析得到的本地化信息进行召回或是对当前时间段的热搜词召回,作为个性化召回,将召回的信息存储在推荐召回集合中。
在实际应用中,若目标用户为新用户,当用户首次注册APP或是首次打开浏览器时,可以向用户推送个性化信息,用以供目标用户选择。比如性别、年龄、职业、喜好等,待目标用户确定后,生成该目标用户的属性。
具体地,根据该目标用户的属性,通过个性化召回方法,从目标关键词中查找到与该属性匹配的关键词即第一关键词,并获取该第一关键词相关联的第一搜索结果,然后将第一关键词和第一关键词相关联的第一搜索结果作为推荐召回集合中的元素。
其中,本公开对具体场景不做限定,还可以通过监控目标用户使用的终端是否有用于执行输入事件的触发操作,实现上下文召回。其中,这里的输入事件可以指在输入框中输入搜索词,触发操作可以为搜索或查询等操作。
具体地,若监控到终端存在用于执行输入事件的触发操作时,可以获取搜索的上下文信息。这里上下文信息可以指当前搜索的内容,说明该行为有效,可以作为召回信息。根据上下文信息,从数据库中获取与该上下文信息相关联的目标关联信息或全网搜索与该上下文信息相关联的目标关联信息,并将该目标关联信息作为推荐召回集合中的元素。因此,通过第一关键词、所述第一搜索结果、所述第二关键词、所述第二搜索结果以及所述目标关联信息,生成了推荐召回集合,这里的推荐召回集合中的推荐信息均为有效推荐信息,可以作为待推荐的搜索词,即为用户推荐的搜索词需要从推荐召回集合中获取,从推荐召回集合中获取的推荐词具有较高地准确性。
其中,确定目标关键词,还可以通过以下步骤实现:
步骤e1、若终端生成的指令是目标用户通过输入搜索信息操作触发的或通过点击搜索按钮触发的,则获取所述搜索信息。
步骤e2、识别所述搜索信息中是否存在地理位置和/或本地性的关键词。
步骤e3、若存在所述地理位置和/或所述本地性的关键词,则从所述目标历史搜索行为数据中查找与所述地理位置和/或所述本地性的关键词相关联的目标关键词。
步骤e4、若所述指令是由所述目标用户通过开启应用程序操作触发的,则从所述搜索的关键词、所述访问的网页信息、所述点击的搜索结果、所述搜索顺序中查找具有本地特征的目标关键词。
步骤e5、将所述目标关键词作为所述本地需求特征。
在实际应用中,用户可以在网页或APP中实现搜索,以APP为例,用户可以通过终端开启APP,开启应用程序的触发操作时即可生成用于指示推荐搜索词的指令即该指令是由用户通过开启应用程序操作触发的,由于该触发操作并未涉及搜索词的输入或搜索等行为,因此,可以从目标历史搜索行为数据中查找具有本地特征的目标关键词。用户还可以输入搜索信息或点击搜索按钮等操作触发用于指示推荐搜索词的指令即该指令是由用户通过输入搜索信息操作触发的或通过点击搜索按钮触发的,在该场景下,输入框中有搜索信息,服务器即可获取该搜索信息,作为提取具有本地特征的目标关键词的依据。
具体地,首先识别搜索信息中是否存在地理位置和/或本地性的关键词,比如天气、油价、地理位置A天气等等关键词,若存在,则从所述目标历史搜索行为数据中查找与所述地理位置和/或所述本地性的关键词相关联的关键词作为目标关键词。上述目标关键词均依据本地化需求提起的特征,具体本地特征,则上述目标关键词均可以为本地需求特征,能够为用户提供精准地推荐。因此,该目标用户是新用户或是目标用户可以不输入任何搜索词可以实现对该目标用户进行个性化推荐,还可以根据目标用户输入的搜索词进行个性化推荐。
本公开实施例中,为了能够精准地为用户推荐搜索词,满足用户的个性化需求,可以通过本地化需求基础数据的挖掘、利用本地化需求构建本地化推荐词候选以及参与推荐召回集合的排序,能够向用户推送个性化的本地词。
具体地,本地化需求基础数据的挖掘:对于搜索行为(提取或获取用户搜索的关键词、访问的网页、点击的结果、搜索词的搜索顺序等)结合这些信息提取用户对搜索结果本地需求的特征,进行本地需求的挖掘;利用本地化需求构建本地化推荐词候选:利用以上挖掘方法来映射对应的全网的本地化需求,首先根据以上的挖掘方法抽离出本地需求的pattern词根,比如天气、邮件、房价、招聘等,进而根据用户地理位置进行组合,生成海量的推荐词集合;将以上通过本地化需求和用户地理信息构建的候选词融入推荐候选召回集合即推荐召回集合中,参与推荐模型排序,基于用户地理信息,推送个性化的本地词。
在实际应用中,针对搜索本地化需求的挖掘,抽取搜索关键词对应的结果内容,包含结果的标题,网页信息以及浏览、点击等行为,提取出用户本地化需求的特征:如大量用户带着地理位置信息检索相同关键词(如某地区1天气、某地区2天气、某地区3天气)这些地理位置关键词信息对应的“天气”就是一个本地化需求。另外通过一些本地内容信息召回(搜索结果)的query进行反推,如油价信息(柴油、92号汽油)、生鲜养殖(猪价、鸡价、鸡蛋)、工作招聘(xx职位应聘);搜索时效性推荐词组合:基于大量的检索行为,即上述挖掘本地化需求特征和全网已有的地理位置信息,进行时效候选词的构建,如上述“天气”类查询就是一个特征,如上述本地内容信息结果,逆推出的关键词也是一类特征,进一步清洗数据、包含去重、过滤等逻辑,结合用户地理位置产出线上海量的本地化推荐候选,如一个用户地理信息,这个用户构造的本地化需求,就生成地区1天气、地区2油价、地区3二手房信息等候选。推荐融合(根据以上产生的时效关键词和推荐排序融合):利用上述步骤产出的本地化关键词,融入推荐召回集合,同时根据用户的地理位置信息,赋予上述候选指定的本地化特征,个性化推送给用户。
在本公开的一个实施例中,在上述实施例的基础上,对如何确定目标关键词进行了详细说明,可以通过下述方式实现:
步骤f1、获取媒体资源信息;
步骤f2、从所述媒体资源信息中提取包括地理位置的关键词和/或本地性的关键词。
步骤f3、将所述地理位置的关键词和/或本地性的关键词作为所述目标关键词,所述目标关键词具有本地特征。
本公开实施例中,媒体资源信息中可能包括地理位置的关键词和/或本地性的关键词,因此,可以获取媒体资源信息,并从媒体资源信息中提取包括地理位置的关键词和/或本地性的关键词作为具有本地特征的目标关键词。
在本公开的一个实施例中,还方法还可以包括以下步骤:
获取预设时间段内的推荐词集合,并根据所述多个推荐词和所述推荐词集合,确定向所述终端推荐的目标推荐词,所述目标推荐词用于表示具有个性化的本地词。
其中,获取推荐词集合,可以包括以下步骤:
步骤g1、根据所述终端对应的历史行为数据,确定与所述历史行为数据对应的多个第一搜索关键词;
步骤g2、响应于执行输入事件的触发操作,获取所述终端对应当前行为数据,确定所述当前行为数据对应的多个第二搜索关键词;
步骤g3、基于所述第一搜索关键词、所述第二搜索关键词生成所述推荐词集合。
本公开实施例中,首先从该终端历史行为数据中查找与所述历史行为数据对应的多个第一搜索关键词,当检测到该终端有输入事件发生时,获取该终端对应当前行为数据,并从当前行为数据对应的多个第二搜索关键词,然后将第一搜索关键词以及第二搜索关键词放入推荐词集合中。
在本公开的一个实施例中,根据所述多个推荐词和所述推荐词集合,确定向所述终端推荐的目标推荐词,可以通过以下步骤实现:
步骤m1、从所述多个推荐词中确定与位置信息匹配的多个具有本地特征的推荐词;
步骤m2、将所述多个具有本地特征的推荐词添加至所述推荐词集合中,并通过去重,得到目标推荐词集合;
步骤m3、通过预设推荐模型对所述目标推荐词集合中的各待推荐词进行排序,得到排序后的待推荐词;所述预设推荐模型为至少与时间和位置相关联的推荐词推荐模型;
步骤m4、将预设排名名次的待推荐词作为所述目标推荐词。
本公开实施例中,将从多个推荐词中确定与位置信息匹配的多个具有本地特征的推荐词添加至推荐词集合中,并通过去重,得到目标推荐词集合,然后对该集合中各个待推荐词进行排序,得到向用户推荐的目标推荐词。
具体地,将多个推荐词形成的推荐词集合作为推荐召回集合的子集融合在推荐召回集合中,使得多个待推荐词可以参与推荐模型的排序。具体地,将多个待推荐词添加至推荐召回集合中并执行去重操作,得到目标推荐召回集合,这里目标推荐召回集合中包含有海量的候选词,为了保证搜索词推荐的准确性,满足用户本地的个性化需求,可以将目标推荐召回集合中的候选词输入到预设推荐模型进行排序,然后可以取预设排名名次的搜索词最为目标推荐词,并通过终端在输入框中显示该目标推荐词,这里目标推荐词可以为多个,进而通过猜测用户搜索意图,降低用户检索成本,同时激发用户的搜索需求,提升整个客户端的搜索性能。
其中,为了不断地向用户推送精准地搜索词,可以实时更新推荐词集合,本实施例在上述实施例的基础上,对如何实时更新推荐词集合进行了详细说明。可以通过下述步骤实现:
步骤h1、若接收到目标用户输入的搜索目标推荐词的指令,则获取目标推荐词对应的目标搜索结果。
步骤h2、根据所述目标搜索结果更新至所述推荐词集合。
本公开实施例中,若将目标推荐词推送给用户使用的终端后,实时监控终端上客户端的触发事件,若监控到用户在客户端上点击搜索操作时,客户端即可生成输入指令,用于指示服务器搜索该目标推荐词,则服务器根据该目标推荐词进行搜索,获取目标推荐词对应的目标搜索结果,该目标搜索结果为有效推荐词的搜索结果,可以将该目标搜索结果添加至所述推荐召回集合中,实现推荐词集合的更新。
因此,本公开在个性化的有限候选推荐业务基础上,结合搜索用户本地需求,利用全网已有的生活本地服务信息大幅提升本地需求候选的规模,更好的满足用户个性化搜索需求,同时保证了个性化推荐的安全和质量,能够精准地向用户推荐搜索词,进而激发用户的搜索需求,提升整个客户端的搜索性能,提高了用户的搜索体验。
对应于上文公开实施例的推荐词确定方法,图4为本公开实施例提供的推荐词确定装置的结构框图。其中推荐词确定装置可以是函数计算平台。为了便于说明,仅示出了与本公开实施例相关的部分。参照图4,推荐词确定装置包括:
第一获取模块401,用于获取终端的位置信息,并基于终端的位置信息,获取所述位置信息对应的目标历史搜索行为数据;
第二获取模块402,用于对所述目标历史搜索行为数据进行处理分析,提取具有本地特征的目标关键词;其中,所述本地特征用于表示与所述位置信息相关联的特征;
推荐词生成模块403,用于将所述位置信息和所述目标关键词融合,生成多个推荐词。
本公开实施例提供的第一获取模块401、第二获取模块402、推荐词生成模块403,用于获取终端的位置信息,并基于终端的位置信息,获取所述位置信息对应的目标历史搜索行为数据;然后对所述目标历史搜索行为数据进行处理分析,提取具有本地特征的目标关键词;其中,所述本地特征用于表示与所述位置信息相关联的特征;将所述位置信息和所述目标关键词融合,生成多个推荐词。因此,通过终端的位置信息与安全筛选的目标历史搜索行为数据中具有本地特征的目标关键词进行自由组合,生成多个推荐词,既保证了搜索安全性,也及时满足了用户的搜索需求,提高用户的搜索效率,进而提高了用户的搜索体验。
本公开实施例提供的装置,可用于执行上文第一方面及第一方面各种可能的设计对应的方法实施例的技术方案,其实现原理和技术效果类似,本公开实施例此处不再赘述。
在本公开的一个实施例中,所述目标历史搜索行为数据包括多个搜索行为会话对应的搜索行为数据,各所述搜索行为会话对应的搜索行为数据包括多个搜索词、各所述搜索词对应的交互数据、各所述搜索词对应的搜索顺序,所述搜索词对应的交互数据及搜索顺序用于表征所述搜索词满足搜索需求的程度。
在本公开的一个实施例中,对第二获取模块402进行了详细说明。第二获取模块402,具体用于:
根据所述搜索行为会话对应的多个搜索词,对各所述搜索行为会话进行聚合,得到多个搜索行为会话集合;
针对每个所述搜索行为会话集合,对该搜索行为会话集合中搜索词进行去重,得到多个目标搜索词;
基于各所述搜索词对应的交互数据和搜索顺序,确定各所述目标搜索词对应的交互数据和搜索顺序;
针对各所述目标搜索词对应的交互数据和搜索顺序,从多个搜索行为会话集合中确定候选搜索词;
基于所述候选搜索词,确定所述目标关键词,所述目标关键词包括本地性的关键词。
在本公开的一个实施例中,本公开实施例在上述公开实施例的基础上,本公开实施例对第二获取模块402进行了详细说明。第二获取模块402,具体用于:
从所述候选搜索词中查找与本地内容信息相关的搜索词;
将与本地内容信息相关的搜索词作为所述目标关键词。
在本公开的一个实施例中,本公开实施例在上述公开实施例的基础上,本公开实施例对推荐词确定装置进行了详细说明。推荐词确定装置还包括:第一处理模块;第一处理模块,用于:
获取媒体资源信息;
从所述媒体资源信息中提取包括地理位置的关键词和/或本地性的关键词;
将所述地理位置的关键词和/或本地性的关键词作为所述目标关键词,所述目标关键词具有本地特征。
在本公开的一个实施例中,本公开实施例在上述公开实施例的基础上,本公开实施例对推荐词生成模块403进行了详细说明。其中,所述目标关键词为多个,所述位置信息包括历史位置信息以及当前位置信息;推荐词生成模块403,具体用于:
对所述位置信息和所述目标关键词进行去重;
将去重后的结果进行关键词拼接,生成所述多个推荐词。
在本公开的一个实施例中,推荐词确定模块还包括第二处理模块;第二处理模块,用于:
获取预设时间段内的推荐词集合,并根据所述多个推荐词和所述推荐词集合,确定向所述终端推荐的目标推荐词,所述目标推荐词用于表示具有个性化的本地词。
在本公开的一个实施例中,第二处理模块,具体用于:
根据所述终端对应的历史行为数据,确定与所述历史行为数据对应的多个第一搜索关键词;
响应于执行输入事件的触发操作,获取所述终端对应当前行为数据,确定所述当前行为数据对应的多个第二搜索关键词;
基于所述第一搜索关键词、所述第二搜索关键词生成所述推荐词集合。
在本公开的一个实施例中,第二处理模块,具体用于:
从所述多个推荐词中确定与位置信息匹配的多个具有本地特征的推荐词;
将所述多个具有本地特征的推荐词添加至所述推荐词集合中,并通过去重,得到目标推荐词集合;
通过预设推荐模型对所述目标推荐词集合中的各待推荐词进行排序,得到排序后的待推荐词;所述预设推荐模型为至少与时间和位置相关联的推荐词推荐模型;
将预设排名名次的待推荐词作为所述目标推荐词。
参考图5,其示出了适于用来实现本公开实施例的电子设备的硬件结构示意图,该电子设备可以为终端设备或服务器。其中,终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、个人数字助理(Personal Digital Assistant,简称PDA)、平板电脑(Portable Android Device,简称PAD)、便携式多媒体播放器(Portable Media Player,简称PMP)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(Read Only Memory,简称ROM)502中的程序或者从存储装置505加载到随机访问存储器(Random Access Memory,简称RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(Liquid CrystalDisplay,简称LCD)、扬声器、振动器等的输出装置505;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述公开实施例所示的方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LocalArea Network,简称LAN)或广域网(Wide Area Network,简称WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
第一方面,本公开实施例提供一种推荐词确定方法,所述方法包括:
获取终端的位置信息,并基于终端的位置信息,获取所述位置信息对应的目标历史搜索行为数据;
对所述目标历史搜索行为数据进行处理分析,提取具有本地特征的目标关键词;其中,所述本地特征用于表示与所述位置信息相关联的特征;
将所述位置信息和所述目标关键词融合,生成多个推荐词。
根据本公开的一个或多个实施例,所述目标历史搜索行为数据包括多个搜索行为会话对应的搜索行为数据,各所述搜索行为会话对应的搜索行为数据包括多个搜索词、各所述搜索词对应的交互数据、各所述搜索词对应的搜索顺序,所述搜索词对应的交互数据及搜索顺序用于表征所述搜索词满足搜索需求的程度。
根据本公开的一个或多个实施例,所述对所述目标历史搜索行为数据进行处理分析,提取具有本地特征的目标关键词,包括:
根据所述搜索行为会话对应的多个搜索词,对各所述搜索行为会话进行聚合,得到多个搜索行为会话集合;
针对每个所述搜索行为会话集合,对该搜索行为会话集合中搜索词进行去重,得到多个目标搜索词;
基于各所述搜索词对应的交互数据和搜索顺序,确定各所述目标搜索词对应的交互数据和搜索顺序;
针对各所述目标搜索词对应的交互数据和搜索顺序,从多个搜索行为会话集合中确定候选搜索词;
基于所述候选搜索词,确定所述目标关键词,所述目标关键词包括本地性的关键词。
根据本公开的一个或多个实施例,所述基于所述候选搜索词,确定所述目标关键词,包括:
从所述候选搜索词中查找与本地内容信息相关的搜索词;
将与本地内容信息相关的搜索词作为所述目标关键词。
根据本公开的一个或多个实施例,所述方法还包括:
获取媒体资源信息;
从所述媒体资源信息中提取包括地理位置的关键词和/或本地性的关键词;
将所述地理位置的关键词和/或本地性的关键词作为所述目标关键词,所述目标关键词具有本地特征。
根据本公开的一个或多个实施例,
所述目标关键词为多个,所述位置信息包括历史位置信息以及当前位置信息;所述将所述位置信息和所述目标关键词融合,生成多个推荐词,包括:
对所述位置信息和所述目标关键词进行去重;
将去重后的结果进行关键词拼接,生成所述多个推荐词。
根据本公开的一个或多个实施例,所述方法还包括:
获取预设时间段内的推荐词集合,并根据所述多个推荐词和所述推荐词集合,确定向所述终端推荐的目标推荐词,所述目标推荐词用于表示具有个性化的本地词。
根据本公开的一个或多个实施例,所述获取推荐词集合,包括:
根据所述终端对应的历史行为数据,确定与所述历史行为数据对应的多个第一搜索关键词;
响应于执行输入事件的触发操作,获取所述终端对应当前行为数据,确定所述当前行为数据对应的多个第二搜索关键词;
基于所述第一搜索关键词、所述第二搜索关键词生成所述推荐词集合。
根据本公开的一个或多个实施例,所述根据所述多个推荐词和所述推荐词集合,确定向所述终端推荐的目标推荐词,包括:
从所述多个推荐词中确定与位置信息匹配的多个具有本地特征的推荐词;
将所述多个具有本地特征的推荐词添加至所述推荐词集合中,并通过去重,得到目标推荐词集合;
通过预设推荐模型对所述目标推荐词集合中的各待推荐词进行排序,得到排序后的待推荐词;所述预设推荐模型为至少与时间和位置相关联的推荐词推荐模型;
将预设排名名次的待推荐词作为所述目标推荐词。
第二方面,本公开实施例提供一种推荐词确定装置,包括:
第一获取模块,用于获取终端的位置信息,并基于终端的位置信息,获取所述位置信息对应的目标历史搜索行为数据;
第二获取模块,用于对所述目标历史搜索行为数据进行处理分析,提取具有本地特征的目标关键词;其中,所述本地特征用于表示与所述位置信息相关联的特征;
推荐词生成模块,用于将所述位置信息和所述目标关键词融合,生成多个推荐词。
根据本公开的一个或多个实施例,所述目标历史搜索行为数据包括多个搜索行为会话对应的搜索行为数据,各所述搜索行为会话对应的搜索行为数据包括多个搜索词、各所述搜索词对应的交互数据、各所述搜索词对应的搜索顺序,所述搜索词对应的交互数据及搜索顺序用于表征所述搜索词满足搜索需求的程度。
根据本公开的一个或多个实施例,第二获取模块402,具体用于:
根据所述搜索行为会话对应的多个搜索词,对各所述搜索行为会话进行聚合,得到多个搜索行为会话集合;
针对每个所述搜索行为会话集合,对该搜索行为会话集合中搜索词进行去重,得到多个目标搜索词;
基于各所述搜索词对应的交互数据和搜索顺序,确定各所述目标搜索词对应的交互数据和搜索顺序;
针对各所述目标搜索词对应的交互数据和搜索顺序,从多个搜索行为会话集合中确定候选搜索词;
基于所述候选搜索词,确定所述目标关键词,所述目标关键词包括本地性的关键词。
根据本公开的一个或多个实施例,
第二获取模块402,具体用于:
从所述候选搜索词中查找与本地内容信息相关的搜索词;
将与本地内容信息相关的搜索词作为所述目标关键词。
根据本公开的一个或多个实施例,推荐词确定装置还包括:第一处理模块;第一处理模块,用于:
获取媒体资源信息;
从所述媒体资源信息中提取包括地理位置的关键词和/或本地性的关键词;
将所述地理位置的关键词和/或本地性的关键词作为所述目标关键词,所述目标关键词具有本地特征。
根据本公开的一个或多个实施例,所述目标关键词为多个,所述位置信息包括历史位置信息以及当前位置信息;推荐词生成模块403,具体用于:
对所述位置信息和所述目标关键词进行去重;
将去重后的结果进行关键词拼接,生成所述多个推荐词。
根据本公开的一个或多个实施例,推荐词确定模块还包括第二处理模块;第二处理模块,用于:
获取预设时间段内的推荐词集合,并根据所述多个推荐词和所述推荐词集合,确定向所述终端推荐的目标推荐词,所述目标推荐词用于表示具有个性化的本地词。
根据本公开的一个或多个实施例,第二处理模块,具体用于:
根据所述终端对应的历史行为数据,确定与所述历史行为数据对应的多个第一搜索关键词;
响应于执行输入事件的触发操作,获取所述终端对应当前行为数据,确定所述当前行为数据对应的多个第二搜索关键词;
基于所述第一搜索关键词、所述第二搜索关键词生成所述推荐词集合。
根据本公开的一个或多个实施例,第二处理模块,具体用于:
从所述多个推荐词中确定与位置信息匹配的多个具有本地特征的推荐词;
将所述多个具有本地特征的推荐词添加至所述推荐词集合中,并通过去重,得到目标推荐词集合;
通过预设推荐模型对所述目标推荐词集合中的各待推荐词进行排序,得到排序后的待推荐词;所述预设推荐模型为至少与时间和位置相关联的推荐词推荐模型;
将预设排名名次的待推荐词作为所述目标推荐词。
第三方面,本公开实施例提供一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上述第一方面以及第一方面各种可能的设计所述的推荐词确定方法。
第四方面,本公开实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的推荐词确定方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
Claims (12)
1.一种推荐词确定方法,其特征在于,包括:
获取终端的位置信息,并基于终端的位置信息,获取所述位置信息对应的目标历史搜索行为数据;
对所述目标历史搜索行为数据进行处理分析,提取具有本地特征的目标关键词;其中,所述本地特征用于表示与所述位置信息相关联的特征;
将所述位置信息和所述目标关键词融合,生成多个推荐词。
2.根据权利要求1所述的方法,其特征在于,所述目标历史搜索行为数据包括多个搜索行为会话对应的搜索行为数据,各所述搜索行为会话对应的搜索行为数据包括多个搜索词、各所述搜索词对应的交互数据、各所述搜索词对应的搜索顺序,所述搜索词对应的交互数据及搜索顺序用于表征所述搜索词满足搜索需求的程度。
3.根据权利要求2所述的方法,其特征在于,所述对所述目标历史搜索行为数据进行处理分析,提取具有本地特征的目标关键词,包括:
根据所述搜索行为会话对应的多个搜索词,对各所述搜索行为会话进行聚合,得到多个搜索行为会话集合;
针对每个所述搜索行为会话集合,对该搜索行为会话集合中搜索词进行去重,得到多个目标搜索词;
基于各所述搜索词对应的交互数据和搜索顺序,确定各所述目标搜索词对应的交互数据和搜索顺序;
针对各所述目标搜索词对应的交互数据和搜索顺序,从多个搜索行为会话集合中确定候选搜索词;
基于所述候选搜索词,确定所述目标关键词,所述目标关键词包括本地性的关键词。
4.根据权利要求3所述的方法,其特征在于,所述基于所述候选搜索词,确定所述目标关键词,包括:
从所述候选搜索词中查找与本地内容信息相关的搜索词;
将与本地内容信息相关的搜索词作为所述目标关键词。
5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
获取媒体资源信息;
从所述媒体资源信息中提取包括地理位置的关键词和/或本地性的关键词;
将所述地理位置的关键词和/或本地性的关键词作为所述目标关键词,所述目标关键词具有本地特征。
6.根据权利要求1所述的方法,其特征在于,所述目标关键词为多个,所述位置信息包括历史位置信息以及当前位置信息;所述将所述位置信息和所述目标关键词融合,生成多个推荐词,包括:
对所述位置信息和所述目标关键词进行去重;
将去重后的结果进行关键词拼接,生成所述多个推荐词。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取预设时间段内的推荐词集合,并根据所述多个推荐词和所述推荐词集合,确定向所述终端推荐的目标推荐词,所述目标推荐词用于表示具有个性化的本地词。
8.根据权利要求7所述的方法,其特征在于,所述获取推荐词集合,包括:
根据所述终端对应的历史行为数据,确定与所述历史行为数据对应的多个第一搜索关键词;
响应于执行输入事件的触发操作,获取所述终端对应当前行为数据,确定所述当前行为数据对应的多个第二搜索关键词;
基于所述第一搜索关键词、所述第二搜索关键词生成所述推荐词集合。
9.根据权利要求8所述的方法,其特征在于,所述根据所述多个推荐词和所述推荐词集合,确定向所述终端推荐的目标推荐词,包括:
从所述多个推荐词中确定与位置信息匹配的多个具有本地特征的推荐词;
将所述多个具有本地特征的推荐词添加至所述推荐词集合中,并通过去重,得到目标推荐词集合;
通过预设推荐模型对所述目标推荐词集合中的各待推荐词进行排序,得到排序后的待推荐词;所述预设推荐模型为至少与时间和位置相关联的推荐词推荐模型;
将预设排名名次的待推荐词作为所述目标推荐词。
10.一种推荐词确定装置,其特征在于,包括:
第一获取模块,用于获取终端的位置信息,并基于终端的位置信息,获取所述位置信息对应的目标历史搜索行为数据;
第二获取模块,用于对所述目标历史搜索行为数据进行处理分析,提取具有本地特征的目标关键词;其中,所述本地特征用于表示与所述位置信息相关联的特征;
推荐词生成模块,用于将所述位置信息和所述目标关键词融合,生成多个推荐词。
11.一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至9任一项所述的推荐词确定方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至9任一项所述的推荐词确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111582843.3A CN114265981A (zh) | 2021-12-22 | 2021-12-22 | 推荐词确定方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111582843.3A CN114265981A (zh) | 2021-12-22 | 2021-12-22 | 推荐词确定方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114265981A true CN114265981A (zh) | 2022-04-01 |
Family
ID=80829229
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111582843.3A Pending CN114265981A (zh) | 2021-12-22 | 2021-12-22 | 推荐词确定方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114265981A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114756751A (zh) * | 2022-04-18 | 2022-07-15 | 北京字节跳动网络技术有限公司 | 推荐词确定方法、装置、电子设备和存储介质 |
CN114969486A (zh) * | 2022-08-02 | 2022-08-30 | 平安科技(深圳)有限公司 | 语料推荐方法、装置、设备及存储介质 |
CN117540057A (zh) * | 2024-01-10 | 2024-02-09 | 广东省电信规划设计院有限公司 | 基于aigc的检索引导方法及装置 |
CN117688243A (zh) * | 2023-12-19 | 2024-03-12 | 广州无限可能数字科技有限公司 | 一种基于大数据的关键词筛选推荐的方法及系统 |
-
2021
- 2021-12-22 CN CN202111582843.3A patent/CN114265981A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114756751A (zh) * | 2022-04-18 | 2022-07-15 | 北京字节跳动网络技术有限公司 | 推荐词确定方法、装置、电子设备和存储介质 |
CN114969486A (zh) * | 2022-08-02 | 2022-08-30 | 平安科技(深圳)有限公司 | 语料推荐方法、装置、设备及存储介质 |
CN117688243A (zh) * | 2023-12-19 | 2024-03-12 | 广州无限可能数字科技有限公司 | 一种基于大数据的关键词筛选推荐的方法及系统 |
CN117540057A (zh) * | 2024-01-10 | 2024-02-09 | 广东省电信规划设计院有限公司 | 基于aigc的检索引导方法及装置 |
CN117540057B (zh) * | 2024-01-10 | 2024-04-30 | 广东省电信规划设计院有限公司 | 基于aigc的检索引导方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111782965B (zh) | 意图推荐方法、装置、设备及存储介质 | |
US11216509B2 (en) | Dynamic faceting for personalized search and discovery | |
CN114265981A (zh) | 推荐词确定方法、装置、设备及存储介质 | |
CN110619076B (zh) | 一种搜索词推荐方法、装置、计算机及存储介质 | |
CN108885624B (zh) | 信息推荐系统及方法 | |
CN111597449B (zh) | 用于搜索的候选词构建方法、装置、电子设备及可读介质 | |
CN111368185A (zh) | 数据展示方法、装置、存储介质及电子设备 | |
CN110634047A (zh) | 一种推荐房源的方法、装置、电子设备及存储介质 | |
CN110968801A (zh) | 地产产品搜索方法、存储介质及电子设备 | |
US10332161B2 (en) | Retrieving reviews based on user profile information | |
CN112328889A (zh) | 推荐搜索词确定方法、装置、可读介质及电子设备 | |
US11651013B2 (en) | Context-based text searching | |
CN111488510B (zh) | 小程序相关词的确定方法、装置、处理设备及搜索系统 | |
US10296624B2 (en) | Document curation | |
CN113961811B (zh) | 基于事件图谱的话术推荐方法、装置、设备及介质 | |
CN113221572B (zh) | 一种信息处理方法、装置、设备及介质 | |
CN111382365B (zh) | 用于输出信息的方法和装置 | |
CN113868481A (zh) | 组件获取方法、装置及电子设备和存储介质 | |
CN113918801A (zh) | 信息推荐方法及设备 | |
CN111310016B (zh) | 标签挖掘方法、装置、服务器和存储介质 | |
CN109408725B (zh) | 用于确定用户兴趣的方法和装置 | |
CN112948681A (zh) | 一种融合多维度特征的时间序列数据推荐方法 | |
CN112231444A (zh) | 结合rpa和ai的语料数据的处理方法、装置和电子设备 | |
CN110598133A (zh) | 确定搜索项目的顺序的方法、装置、电子设备和计算机可读存储介质 | |
US11709844B2 (en) | Computerized smart inventory search methods and systems using classification and tagging |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |